Mathematik Für Physiker Band 2 Gewöhnliche Und Partielle Differentialgleichungen, Mathematische Grundlagen Der Quantenmechanik by Helmut Fischer, Helmut Kaul (Auth.)

Mathematik für Physiker Band 2
Helmut Fischer • Helmut Kaul
Mathematik für Physiker

Band 2
Gewöhnliche und partielle
Differentialgleichungen, mathematische
Grundlagen der Quantenmechanik
4., aktualisierte Auflage

Helmut Fischer
Helmut Kaul
Univ. Tübingen
Tübingen, Deutschland
ISBN 978-3-658-00476-7 ISBN 978-3-658-00477-4 (eBook)

DOI 10.1007/978-3-658-00477-4
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Natio-

nalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de
abrufbar.
Springer Spektrum
© Springer Fachmedien Wiesbaden 1998, 2004, 2008, 2014
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung,
die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen
Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen,
Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektro-
nischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in

diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass
solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu
betrachten wären und daher von jedermann benutzt werden dürften.
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer Spektrum ist eine Marke von Springer DE.

Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media.
www.springer-spektrum.de
Vorwort
In diesem Band behandeln wir die Theorie und elementare Lösungsmethoden für
wichtige Grundtypen von Differentialgleichungen der Physik und stellen mathe-
matische Grundlagen für die Quantenmechanik bereit. Zielgruppe sind Studie-
rende und Absolventen der Physik und der Mathematik, die sich mit Methoden
und Ergebnissen der mathematischen Physik vertraut machen wollen.
Für die zahlreichen hier behandelten Problemstellungen und Methoden gibt es
über die Literatur verstreut gute und detaillierte Darstellungen, deren gezielte
Nutzung für Studierende aber oft einen großen Aufwand bedeutet. Wir wollen
mit diesem Werk eine Übersicht geben und eine Orientierungshilfe bieten, indem
wir wichtige Methoden vorstellen und die leitenden Grundgedanken herausar-
beiten, die Theorie aber nicht bis in die letzten Details verfolgen.
Bei der Organisation dieses Bandes ließen wir uns von folgenden Gesichtspunk-
ten leiten: Es sollte ein Leserkreis unterschiedlicher mathematischer Vorbildung
angesprochen werden. Die Möglichkeit von Quereinstiegen sollte so gut es geht
geboten und erleichtert werden. Daher verbot es sich, die benötigten umfang-
reichen Hilfsmittel aus der Analysis an den Anfang zu stellen, was zur Folge
gehabt hätte, dass die Leser erst nach mehr als 120 Seiten bei den Kernthemen
angekommen wären.
Dementsprechend sind wir stufenweise vorgegangen. Die ersten drei Kapitel set-
zen nur Kenntnisse aus Band 1 voraus. Sie führen in die Theorie gewöhnlicher
Differentialgleichungen ein und enthalten partielle Differentialgleichungen, die
sich mit elementaren Methoden behandeln lassen. Hierbei geht es um die schwin-
gende Saite, die Wärmeleitung in einem Draht, die stationäre Wärmeverteilung
in der Kreisscheibe und nichtlineare partielle Differentialgleichungen erster Ord-
nung. Erst danach wird der für mehrdimensionale Differentialgleichungsproble-
me benötigte mathematische Apparat in einem eigenen Kapitel bereitgestellt:
Übersicht über die Lebesgue–Integration, Hilberträume, Glättung von Funktio-
nen, Integralsätze, Fouriertransformation, schwache Lösungen und Distributio-
nen. Da die dort entwickelten Hilfsmittel in den folgenden Kapiteln nicht gleich
von Anfang an und auch nicht alle zugleich verwendet werden, empfehlen wir
den Lesern, sich diese erst bei Bedarf anzueignen; die benötigten Vorkenntnisse
werden jeweils zu Beginn eines Paragraphen genannt. Der Wegweiser auf der
folgenden Seite kann der groben Orientierung dienen.
Bei diesem Aufbau waren Brüche nicht zu vermeiden. So werden z.B. die das
Lebesgue–Integral betreffenden Beweise erst später im Rahmen einer allgemei-
nen Integrationstheorie nachgeholt, und für die Entwicklung nach Eigenfunk-
tionen des Laplace–Operators in § 15 wird auf den Spektralsatz für kompakte
Operatoren aus § 22 vorgegriffen.
Die meisten Beweise sind ausgeführt, um den logischen Zusammenhang der
jeweiligen Theorie erkennbar zu machen und um dem Leser die Möglichkeit zu
6 Vorwort
geben, sich einschlägige Argumentations- und Arbeitsweisen anzueignen. Wo

Beweise weggelassen werden, haben wir uns bemüht, den Zugang zur Literatur
gezielt zu erleichtern.
Nachdem in der dritten, überarbeitenden Auflage noch die alte Rechtsschrei-
bung der ersten Auflage von 1998 beibehalten wurde, haben wir die vorliegende
Auflage auf die neue Rechtschreibung umgestellt. Inhaltlich hat sich gegenüber
der dritten Auflage nichts Wesentliches gendert.
Wir danken den Herren J. Hellmich, J. Hertle, R. Honegger und B. Kümme-
rer dafür, dass sie uns in vielen Diskussionen zu Fragen der Quantenmechanik
beraten haben. Unser ganz besonderer Dank gilt Ralph Hungerbühler für die
drucktechnische Ausgestaltung der ersten drei Auflagen und die Anfertigung der
Figuren. Ohne seine Unterstützung wäre dieser Band nicht zustande gekommen.
Tübingen, Mai 2014 H. Fischer, H. Kaul
Zum Gebrauch. Ein Querverweis wie z.B. § 2 : 6.7 (b) bezieht sich auf § 2,
Abschnitt 6, Unterabschnitt 6.7, Teil (b). Innerhalb von § 2 wird die betreffende
Stelle lediglich in der Form 6.7 (b) zitiert.
Literaturverweise wie z.B. auf [130] Reed, M., Simon, B.: Methods of Modern
Physics I–IV, Band II, Theorem X.14 erfolgen nach dem Muster
[130, II] X.14 oder [Reed–Simon II] X.14.
Durch das Symbol ÜA (Übungsaufgabe) wird dazu aufgefordert, Rechnungen,
Beweisschritte oder Übungsbeispiele selbst auszuführen.
Wegweiser. Mit den Grundkenntnissen aus Band 1 direkt zugänglich sind § 6

(Fourierreihen, Separationsansätze), §§ 8, 9 (Lebesgue–Integral, Hilberträume),
§ 12 (Fouriertransformation), jeweils die ersten drei Abschnitte von § 16 (Wär-
meleitungsgleichung) und von § 17 (Wellengleichung) sowie §§ 19, 20 (Wahr-
scheinlichkeit, Maß und Integral). Die Charakteristikenmethode für partielle
Differentialgleichungen erster Ordnung in § 7 setzt die Theorie gewöhnlicher
Differentialgleichungen (§ 2) voraus. Für das Schlusskapitel über mathemati-
sche Grundlagen der Quantenmechanik sind elementare Kenntnisse über das
Lebesgue–Integral nützlich und die Theorie der Hilberträume (§ 9) unerlässlich;
darüber hinaus sind nur wenige, zu Beginn jedes Paragraphen benannte Vor-
kenntnisse aus dem vorangehenden Text erforderlich.
Fehlermeldungen und Verbesserungsvorschläge von unseren Lesern neh-

men wir dankbar entgegen unter helmut.kaul@uni-tuebingen.de.
Inhalt
Kapitel I Übersicht
§ 1 Beispiele für Differentialgleichungsprobleme
1 Gewöhnliche Differentialgleichungen . . . . . . . . . . . . . . . . . . 13
2 Partielle Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 15
3 Was bedeutet Lösung einer Differentialgleichung“? . . . . . . . . . 23
”
4 Die Schrödinger–Gleichung . . . . . . . . . . . . . . . . . . . . . . . 24
Kapitel II Gewöhnliche Differentialgleichungen

§ 2 Grundlegende Theorie
1 Das allgemeine Anfangswertproblem . . . . . . . . . . . . . . . . . . 27
2 Das Anfangswertproblem als Integralgleichung . . . . . . . . . . . . 29
3 Die Standardvoraussetzung für DG–Systeme . . . . . . . . . . . . . 30
4 Kontrolle und Eindeutigkeit von Lösungen . . . . . . . . . . . . . . 32
5 Existenz von Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . 34
6 Zum Definitionsintervall maximaler Lösungen . . . . . . . . . . . . 38
7 Differenzierbarkeitseigenschaften von Lösungen . . . . . . . . . . . . 44
§ 3 Allgemeine lineare Theorie
1 Lineare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2 Zur algebraischen Bestimmung von etA . . . . . . . . . . . . . . . . 59
3 Die lineare Differentialgleichungen n–ter Ordnung . . . . . . . . . . 67
§ 4 Lineare Differentialgleichungen zweiter Ordnung
1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2 Sturm–Liouville–Form und Fundamentalsysteme . . . . . . . . . . . 71
3 Potenzreihenentwicklungen von Lösungen . . . . . . . . . . . . . . . 74
4 Reihendarstellung von Lösungen in singulären Randpunkten . . . . 80
§ 5 Einführung in die qualitative Theorie
1 Autonome Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2 Phasenportraits linearer Systeme in der Ebene . . . . . . . . . . . . 105
3 Die Differentialgleichung ẍ = F (x) . . . . . . . . . . . . . . . . . . 109
4 Stabilität von Gleichgewichtspunkten . . . . . . . . . . . . . . . . . 117
5 Die direkte Methode von Ljapunow . . . . . . . . . . . . . . . . . . 120
6 Die Sätze von Liouville und Poincaré–Bendixson . . . . . . . . . . . 128
8 Inhalt
Kapitel III Partielle Differentialgleichungen, elementare

Losungsmethoden
¨
§6 Separationsansätze und Fourierreihen

1 Die schwingende Saite I . . . . . . . . . . . . . . . . . . . . . . . . . 133
2 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3 Die schwingende Saite II . . . . . . . . . . . . . . . . . . . . . . . . 148
4 Wärmeleitung im Draht . . . . . . . . . . . . . . . . . . . . . . . . . 156
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe . . . . . 164
§7 Die Charakteristikenmethode für DG 1. Ordnung
1 Die quasilineare Differentialgleichung . . . . . . . . . . . . . . . . . 172
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 . . . . . . . . . . 183
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung . . . . . . . . . . 191
4 Systeme von Differentialgleichungen erster Ordnung . . . . . . . . . 199
Kapitel IV Hilfsmittel aus der Analysis

§ 8 Lebesgue–Theorie und Lp –Räume
1 Eigenschaften des Lebesgue–Integrals . . . . . . . . . . . . . . . . . 201
2 Die Räume Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
3* Der Hauptsatz der Differential– und Integralrechnung . . . . . . . . 219
§9 Hilberträume
1 Beispiele für Hilberträume . . . . . . . . . . . . . . . . . . . . . . . 221
2 Abgeschlossene Teilräume und orthogonale Projektionen . . . . . . 225
3 Dichte Teilräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
4 Vollständige Orthonormalsysteme . . . . . . . . . . . . . . . . . . . 233
§ 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen
1 Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
2 Faltung mit Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . 244
3 Glättung von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 246
4 Das Fundamentallemma der Variationsrechnung . . . . . . . . . . . 252
5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω) . . . . . . . . . 254
§ 11 Gaußscher Integralsatz und Greensche Formeln
1 Ê
Untermannigfaltigkeiten des n . . . . . . . . . . . . . . . . . . . . 257
2 Integration auf Untermannigfaltigkeiten . . . . . . . . . . . . . . . . 266
3 Der Gaußsche Integralsatz . . . . . . . . . . . . . . . . . . . . . . . 272
4 Die Greenschen Identitäten . . . . . . . . . . . . . . . . . . . . . . . 275
5 Der Laplace–Operator in krummlinigen Koordinaten . . . . . . . . 279
Inhalt 9
§ 12 Die Fouriertransformation
1 Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
2 Ê
Die Fouriertransformation auf L1 ( n ) . . . . . . . . . . . . . . . . 286
3 Ê
Die Fouriertransformation auf S ( n ) . . . . . . . . . . . . . . . . 292
4 Ê
Die Fouriertransformation auf L2 ( n ) . . . . . . . . . . . . . . . . 298
5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
§ 13 Schwache Lösungen und Distributionen
1 Schwache Lösungen von Differentialgleichungen . . . . . . . . . . . 303
2 Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
3 Konvergenz von Distributionenfolgen . . . . . . . . . . . . . . . . . 309
4 Differentiation von Distributionen . . . . . . . . . . . . . . . . . . . 311
5 Grundlösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
6 Die Fouriertransformation für temperierte Distributionen . . . . . . 318
Kapitel V Die drei Grundtypen linearer Differentialgleichungen

2. Ordnung
§ 14 Randwertprobleme für den Laplace–Operator
1 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
2 Eigenschaften des Laplace–Operators . . . . . . . . . . . . . . . . . 326
3 Eindeutigkeit von Lösungen . . . . . . . . . . . . . . . . . . . . . . 346
4 Existenz von Lösungen: Perron–Methode . . . . . . . . . . . . . . . 349
5 Existenz von Lösungen: Integralgleichungsmethode . . . . . . . . . 352
6 Existenz von Lösungen: Variationsmethode . . . . . . . . . . . . . . 359
§ 15 Eigenwertprobleme für den Laplace–Operator
1 Entwicklung nach Eigenfunktionen des Laplace–Operators . . . . . 372
2 Geometrische Eigenschaften von Eigenwerten und -funktionen . . . 381
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel . . . . 383
§ 16 Die Wärmeleitungsgleichung
1 Bezeichnungen, Problemstellungen . . . . . . . . . . . . . . . . . . . 401
2 Eigenschaften des Wärmeleitungsoperators . . . . . . . . . . . . . . 402
3 Das Anfangswertproblem . . . . . . . . . . . . . . . . . . . . . . . . 407
4 Das Anfangs–Randwertproblem . . . . . . . . . . . . . . . . . . . . 414
§ 17 Die Wellengleichung
1 Bezeichnungen, Problemstellungen . . . . . . . . . . . . . . . . . . . 429
2 Eigenschaften des d’Alembert–Operators . . . . . . . . . . . . . . . 430
3 Das Anfangswertproblem . . . . . . . . . . . . . . . . . . . . . . . . 442
4 Das Anfangs–Randwertproblem . . . . . . . . . . . . . . . . . . . . 453
10 Inhalt
Kapitel VI Mathematische Grundlagen der Quantenmechanik

§ 18 Mathematische Probleme der Quantenmechanik
1 Ausgangspunkt, Zielsetzung, Wegweiser . . . . . . . . . . . . . . . . 463
2 Beugung und Interferenz von Elektronen . . . . . . . . . . . . . . . 465
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials . . . . 467
4 Das mathematische Modell der Pionier–Quantenmechanik . . . . . 471
§ 19 Maß und Wahrscheinlichkeit
1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . 477
2 Erwartungswert und Streuung einer diskreten Verteilung . . . . . . 483
3 Varianz und Streuung einer diskreten Verteilung . . . . . . . . . . . 486
4 Verteilungen mit Dichten . . . . . . . . . . . . . . . . . . . . . . . . 490
5 σ–Algebren und Borelmengen . . . . . . . . . . . . . . . . . . . . . 493
6 Eigenschaften von Maßen . . . . . . . . . . . . . . . . . . . . . . . . 496
7 Konstruktion von Maßen durch Fortsetzung . . . . . . . . . . . . . 499
8 Das Lebesgue–Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . 502
9 Wahrscheinlichkeitsmaße auf Ê . . . . . . . . . . . . . . . . . . . . 504
§ 20 Integration bezüglich eines Maßes μ
1 Das Konzept des μ–Integrals . . . . . . . . . . . . . . . . . . . . . . 508
2 Das μ–Integral für Elementarfunktionen . . . . . . . . . . . . . . . 509
3 Messbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 514
4 Das μ–Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
5 Vertauschbarkeit von Limes und Integral . . . . . . . . . . . . . . . 525
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf . Ê . . . . . . . . . 530
p
7 L –Räume und ihre Eigenschaften . . . . . . . . . . . . . . . . . . . 538
8 Dichte Teilräume und Separabilität . . . . . . . . . . . . . . . . . . 542
§ 21 Spektrum und Funktionalkalkül symmetrischer Operatoren
1 Beschränkte Operatoren und Operatornorm . . . . . . . . . . . . . 547
2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550
3 Die C*–Algebra L (H ) . . . . . . . . . . . . . . . . . . . . . . . . . 556
4 Konvergenz von Operatoren . . . . . . . . . . . . . . . . . . . . . . 562
5 Das Spektrum beschränkter Operatoren . . . . . . . . . . . . . . . . 568
6 Analytizität der Resolvente, Folgerungen für das Spektrum . . . . . 575
7 Der Funktionalkalkül für symmetrische Operatoren . . . . . . . . . 580
8 Positive Operatoren und Zerlegung von Operatoren . . . . . . . . . 589
9 Erweiterung des Funktionalkalküls . . . . . . . . . . . . . . . . . . . 591
Inhalt 11
§ 22 Der Spektralsatz für beschränkte symmetrische Operatoren

1 Spektralzerlegung und Spektralsatz . . . . . . . . . . . . . . . . . . 596
2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603
3 Diagonalisierung beschränkter symmetrischer Operatoren . . . . . . 605
4 Spektralzerlegung kompakter symmetrischer Operatoren . . . . . . 617
5 Anwendung auf Rand–Eigenwertprobleme . . . . . . . . . . . . . . 627
6 Der allgemeine Zustandsbegriff . . . . . . . . . . . . . . . . . . . . . 633
§ 23 Unbeschränkte Operatoren
1 Definitionen und Beispiele . . . . . . . . . . . . . . . . . . . . . . . 642
2 Abgeschlossene Operatoren . . . . . . . . . . . . . . . . . . . . . . . 647
3 Der Abschluss gewöhnlicher Differentialoperatoren . . . . . . . . . . 651
4 Der adjungierte Operator . . . . . . . . . . . . . . . . . . . . . . . . 659
5 Spektrum und Resolvente . . . . . . . . . . . . . . . . . . . . . . . . 664
6 Zur praktischen Bestimmung des Spektrums . . . . . . . . . . . . . 671
§ 24 Selbstadjungierte Operatoren
1 Charakterisierung selbstadjungierter Operatoren . . . . . . . . . . . 676
2 Wesentlich selbstadjungierte Operatoren . . . . . . . . . . . . . . . 680
3 Symmetrische Operatoren mit diskretem Spektrum . . . . . . . . . 682
4 Störung wesentlich selbstadjungierter Operatoren . . . . . . . . . . 691
§ 25 Der Spektralsatz und der Satz von Stone
1 Spektralzerlegung und Funktionalkalkül . . . . . . . . . . . . . . . . 699
2 Ausführung der Beweise für 1.3 – 1.7 . . . . . . . . . . . . . . . . . 708
3 Selbstadjungierte Operatoren und unitäre Gruppen . . . . . . . . . 715
4 Hilbertraumtheorie und Quantenmechanik . . . . . . . . . . . . . . 722
Namen und Lebensdaten . . . . . . . . . . . . . . . . . . . . . . . . . 732
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734
Symbole und Abkürzungen . . . . . . . . . . . . . . . . . . . . . . . . 744
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746
Kapitel I Übersicht
§ 1 Beispiele für Differentialgleichungsprobleme

1 Gewöhnliche Differentialgleichungen
1.1 Mechanische Systeme
Die Hamiltonschen kanonischen Gleichungen
∂H
q̇k (t) = (t, q1 (t), . . . , qN (t), p1 (t), . . . , pN (t)) (k = 1, . . . , N ) ,
∂pk
∂H
ṗk (t) = − (t, q1 (t), . . . , qN (t), p1 (t), . . . , pN (t)) (k = 1, . . . , N )
∂qk
stellen ein gekoppeltes System von gewöhnlichen Differentialgleichungen dar.
Durch Zusammenfassung der Orts– und Impulsvariablen zu einem Vektor y(t) =
(q(t), p(t)) erhält dieses die Gestalt
ẏ(t) = f (t, y(t)) , kurz ẏ = f (t, y).
Von solchen Systemen erwarten wir deterministisches Verhalten: Durch Kennt-

nis des Zustandsvektors y0 = (q0 , p0 ) zu irgend einem Zeitpunkt t0 ist die
Lösung y(t) = (q(t), p(t)) in Vergangenheit und Zukunft eindeutig bestimmt.
Das bedeutet, dass das Anfangswertproblem
(∗) ẏ = f (t, y) , y(t0 ) = y0 .
eine eindeutig bestimmte Lösung haben soll. Deren explizite Bestimmung ist
in der Regel nicht möglich und steht auch nicht in jedem Fall im Vordergrund
des Interesses. Die statistische Mechanik will beispielsweise Aussagen über Ei-
genschaften des Flusses im Phasenraum machen (Volumentreue, Raummittel,
Zeitmittel). Eine andere Frage richtet sich auf das qualitative Verhalten der
Lösungen in der Nähe von Gleichgewichtslagen von Systemen ẏ = f (y), z.B.
bei zeitunabhängiger Hamilton–Funktion oder bei gedämpften mechanischen
Systemem
q̇ = M (q) p , ṗ = −∇U (q) − D(q) p
mit positiv definiten Massematrizen M (q) und Dämpfungsmatrizen D(q).

Um über diese und andere Fragen nach dem qualitativen Verhalten ohne expli-
zite Kenntnis der Lösungen entscheiden zu können, bedarf es einer allgemeinen
Theorie des Anfangswertproblems (∗): Existenz und Eindeutigkeit von Lösun-
gen, Existenz der Lösungen für alle Zeiten, differenzierbare Abhängigkeit der
Lösungen vom Anfangswert (§ 2) und Stabilitätsverhalten (§ 5).
H. Fischer, H. Kaul, Mathematik für Physiker Band 2,

DOI 10.1007/978-3-658-00477-4_1, © Springer Fachmedien Wiesbaden 2014
14 § 1 Beispiele für Differentialgleichungsprobleme
1.2 Singuläre Differentialgleichungen zweiter Ordnung

Produktansätze für lineare partielle Differentialgleichungen zweiter Ordnung
führen auf gewöhnliche Differentialgleichungen zweiter Ordnung. Zum Beispiel
wird das stationäre Wärmeleitungsproblem in der Einheitskreisscheibe durch
die Laplace–Gleichung für die Temperaturverteilung (2.5) beschrieben, welche
in Polarkoordinaten folgende Gestalt besitzt (vgl. § 6 : 5.2):

1 ∂ ∂u(r, ϕ) 1 ∂ 2 u(r, ϕ)
r + = 0.
r ∂r ∂r r2 ∂ϕ2
Der Produktansatz u(r, ϕ) = v(r) w(ϕ) führt auf zwei gewöhnliche Differential-
gleichungen 2. Ordnung
1 λ
(a) v (r) + v (r) − 2 v(r) = 0 ,
r r
(b) w (ϕ) + λ w(ϕ) = 0
mit einer geeigneten Konstanten λ. Da w 2π–periodisch sein muss, kommen nur
die Werte λ = k2 mit k = 0, 1, . . . in Betracht (§ 6 : 5.3). In ähnlicher Weise
führt der Produktansatz bei der Behandlung der kreisförmigen schwingenden
Membran oder von Schwingungen der Kugel auf die Besselsche Differentialglei-
chung
1

ν2

(c) v (r) + v (r) + λ − 2 v(r) = 0
r r
für r > 0 mit Parametern λ und ν.
Die Differentialgleichungen (a) und (c) werden singulär genannt, weil die Koeffi-
zienten vor v und v an der Stelle r = 0 Pole besitzen. Für die Lösungen solcher
Differentialgleichungen lassen sich nicht die Werte im Randpunkt r = 0 vor-
schreiben; hier besteht nur die Möglichkeit, Lösungen durch ihre Beschränktheit
oder Unbeschränktheit nahe r = 0 zu unterscheiden.
Die Darstellung von Lösungen singulärer Differentialgleichungen durch verall-
gemeinerte Potenzreihen wird in § 4 behandelt.
1.3 Die Charakteristikenmethode

Partielle Differentialgleichungen 1. Ordnung für eine gesuchte Funktion u,
F (x, u(x), ∇u(x)) = 0 ,
beschreiben Phänomene der Wellenausbreitung. Hierzu gehört z.B. die Eikonal-
gleichung (Hamilton–Jacobi–Gleichung) der geometrischen Optik,
H(x, ∇u(x)) = 1 .
Die Charakteristikenmethode zur Lösung dieser Differentialgleichungen besteht
darin, den Graphen der Lösung u aus einer Kurvenschar (den Charakteristiken)
2 Partielle Differentialgleichungen 15
aufzubauen, die durch ein System gewöhnlicher Differentialgleichungen gegeben

ist. Hierbei ist es entscheidend, dass die Charakteristikenschar auf differenzier-
bare Weise von den Anfangswerten abhängt, was in § 2 bewiesen wird. Bei der
Eikonalgleichung beschreiben die Charakteristiken die Lichtstrahlen und die Ni-
veauflächen {u = const} die zugehörigen Wellenfronten.
Die Charakteristikenmethode wird in § 7 behandelt.
2 Partielle Differentialgleichungen
2.1 Die Gleichung der schwingenden Saite
Wir betrachten eine an den Enden fest
eingespannte elastische Saite, die ebene
y
Transversalschwingungen ausführt. In 6
der Schwingungsebene wählen wir kar-
u(x, t)
tesische Koordinaten so, dass die Saite -
x x
in der Ruhelage die Strecke
{(x, y) | 0 ≤ x ≤ L , y = 0}
einnimmt. Die vertikale Auslenkung der Saite an der Stelle x zum Zeitpunkt t
bezeichnen wir mit u(x, t).
Wir machen folgende Annahmen:
– Die Saite ist homogen und von vernachlässigbarer Biegesteifigkeit.

– Die Auslenkungen der Saite sind klein, ∂u
∂x
1.
– Es wirken keine Schwerkraft und keine Anregungen durch Zupfen oder Strei-
chen der Seite.
Dann lautet die Bewegungsgleichung
∂2u 2
2 ∂ u
= c mit einer Konstanten c > 0
∂t2 ∂x2
(eindimensionale Wellengleichung, d’Alembert 1746). In geometrischer Inter-
pretation bedeutet diese Gleichung, dass die Transversalbeschleunigung propor-
tional zur Krümmung der Saite ist.
Ein spezieller Schwingungsablauf wird durch geeignete Zusatzbedigungen fest-
gelegt; diese bestehen aus der Randbedingung (Einspannbedingung)
u(0, t) = u(L, t) = 0 für alle t ∈ Ê,
und den Anfangsbedingungen zu einem Zeitpunkt, etwa zur Zeit t = 0,
∂u
u(x, 0) = f (x), (x, 0) = g(x),
∂t
wobei f und g vorgegebene, an den Endpunkten verschwindende Funktionen
auf [0, L] sind.
In § 6 wird gezeigt, dass das hiermit formulierte Anfangs–Randwertproblem un-

ter geeigneten Voraussetzungen über f und g eine eindeutig bestimmte Lösung
u besitzt, die sich explizit angeben läßt.
2.2 Herleitung der Wellengleichung aus dem Hamiltonschen Prinzip

der stationären Wirkung
Wie für viele Differentialgleichungen der Mathematischen Physik ergibt sich
auch die Bewegungsgleichung der schwingende Saite aus einem Variationsprin-
zip, dem Hamiltonschen Prinzip der stationären Wirkung, das wir wie folgt
formulieren: Zur Zeit t seien u(x, t) die vertikale Auslenkung der Saite an der
Stelle x, T (u, t) die kinetische und U (u, t) die potentielle Energie.
Das Wirkungsintegral für ein Zeitintervall [t1 , t2 ] ist definiert durch
t2

W (u) = T (u, t) − U (u, t) dt .
t1
Das Hamiltonsche Prinzip der stationären Wirkung besagt, dass die Bewegungs-
gleichung der Saite gegeben ist durch
d
(∗) δW (u)ϕ := W (u + sϕ) s=0 = 0
ds
für jedes Zeitintervall [t1 , t2 ] und für jede C1 –Funktion ϕ, die auf dem Rand ∂R
des Rechtecks R := [0, L] × [t1 , t2 ] verschwindet.
Im Fall einer homogenen Saite der Masse pro Längeneinheit ist die kinetische
Energie zur Zeit t
L
1 ∂u
T (u, t) = (x, t)2 dx ,
2 ∂t
0
die durch Verlängerung der Saite bedingte potentielle Energie zur Zeit t ist
L L
∂u 1 ∂u
U (u, t) = σ 1+ (x, t)2 − 1 dx ≈ σ (x, t)2 dx ,
∂x 2 ∂x
0 0
hierbei ist die Konstante σ > 0 der Spannungskoeffizient der Saite.

Für das Wirkungsintegral
t2L
1 ∂u ∂u
W (u) = (x, t)2 − σ (x, t)2 dx dt
2 ∂t ∂x
t1 0
ist W (u + sϕ) ein Polynom zweiten Grades in s, also muss gelten

t2 L
d ∂u ∂ϕ ∂u ∂ϕ
0 = W (u + sϕ) s=0 = −σ dx dt
ds ∂t ∂t ∂x ∂x
t1 0
(∗∗)
L t2 t2 L
∂u ∂ϕ ∂u ∂ϕ
= dt dx − σ dx dt .
∂t ∂t ∂x ∂x
0 t1 t1 0
Durch partielle Integration folgt wegen ϕ = 0 auf dem Rand ∂R des Rechtecks
L t2 t2 L
∂2u ∂2u
0 = − ϕ dt dx + σ ϕ dx dt
∂t2 ∂x2
0 t1 t1 0
t2 L 2 2
∂ u ∂ u
= − + σ ϕ dx dt .
∂t2 ∂x2
t1 0
Das letzte Integral kann nur dann für alle oben zugelassenen Variationen“ ϕ
”
Null sein, wenn die eckige Klammer im Innern von R verschwindet, d.h. wenn
∂2u ∂2u
2
(x, t) = c2 (x, t) mit c = σ/
∂t ∂x2
in jedem Zeitintervall und für alle x ∈ ]0, L[. Denn wäre die eckige Klammer
in einer Kreisscheibe Kr (x0 , t0 ) um einen Punkt (x0 , t0 ) beispielsweise positiv,
so ergäbe sich mit ϕ(x, t) = (r 2 − (x − x0 )2 − (t − t0 )2 )2 (außerhalb Kr (x0 , t0 )
gleich Null gesetzt) ein Widerspruch.
2.3 Die schwingende Membran

Eine elastische Membran sei in einen
ebenen Rahmen eingespannt und führe
kleine Schwingungen senkrecht zu der
Ebene des Rahmens aus. Wir wählen
ein räumliches Koordinatensystem so,
dass die Membran in der Ruhelage ein
Gebiet Ω der x1 ,x2 –Ebene bedeckt.
Unter entsprechenden Annahmen wie
bei der schwingenden Saite ergibt sich
für die senkrechte Auslenkung u(x, t)
des Membranpunkts x = (x1 , x2 ) ∈ Ω
aus der Ruhelage zur Zeit t die Bewe-
gungsgleichung
∂2u
= c2 Δu mit einer Konstanten c > 0 ,
∂t2
die zweidimensionale Wellengleichung
Der Laplace–Operator wirkt dabei nur auf die Ortsvariablen,

∂2u ∂2u
Δu = 2
+ .
∂x1 ∂x22
Die Randbedingung für die eingespannte Membran lautet
u(x, t) = 0 für x ∈ ∂Ω , t ∈ Ê,
die Anfangsbedingungen stellen wir wie bei der Saite:
∂u
u(x, 0) = f (x) , (x, t) = g(x) für x ∈ Ω
∂t
mit gegebenen, auf dem Rand verschwindenden Funktionen f und g auf Ω.
Die Ableitung der Schwingungsgleichung ∂ 2 u/∂t2 = c2 Δu aus dem Hamilton-
schen Prinzip der stationären Wirkung erfolgt ganz analog zu der für die schwin-
gende Saite. Als potentielle Energie im Wirkungsintegral wird das Integral über
die Verzerrung des Flächeninhalts bei der Auslenkung der Membran zugrunde-
gelegt:

1
U (t) = σ 1 + ∇u2 − 1 d2 x ≈ σ ∇u2 d2 x .
2
Ω Ω
Der Gradient ∇u = (∂1 u, ∂2 u) bezieht sich dabei auf die Raumvariablen, und
es werden kleine Auslenkungen ∇u 1 angenommen.
ÜA Leiten Sie nach dem Vorbild von 2.2 die Schwingungsgleichung für die
Membran aus dem Hamiltonschen Prinzip her unter Verwendung des Gaußschen
Integralsatzes und geeigneter Buckelfunktionen ϕ.
2.4 Die Wellengleichung im Ê n
Hierunter verstehen wir die Differentialgleichung

∂2u
= c2 Δu mit einer Konstanten c > 0
∂t2
Ê
für eine Funktion u(x, t) von x ∈ Ω und t ∈ , wobei Ω ein Gebiet des n ist. Ê
Hier – wie auch im Folgenden – verabreden wir, dass der Laplace–Operator nur
auf die räumlichen Variablen x = (x1 , . . . , xn ) wirken soll.
Das Anfangs–Randwertproblem für die Wellengleichung auf beschränkten Ge-
bieten wird in § 17 behandelt.
Ê
Die Wellengleichung im 3 beschreibt in der Gasdynamik die Schallausbreitung
und in der Maxwellschen Theorie die Ausbreitung elektromagnetischer Wellen,
vgl. 2.6 (b) und 2.7 (c). Die Behandlung der Wellengleichung in der Ebene und
im Raum erfolgt in § 17.
Dass die Konstante c als Ausbreitungsgeschwindigkeit von Wellenfronten ge-
deutet werden kann, machen wir an den Beispielen der ebenen Welle und der
Kugelwelle plausibel:
Für jede C2 –Funktion U : Ê → Ê und jeden Vektor k ∈ Ên

ist durch
u(x, t) = U ( k , x − ct)
eine Lösung der Wellengleichung gegeben, ÜA . Die Wellenfronten, d.h. die
Ê
Flächen konstanter Phase {x ∈ 3 | k , x − ct = const} sind Ebenen, die
sich mit der Geschwindigkeit c bewegen.
Durch
1
u(x, t) = U (r − ct) mit r := x > 0
r
ist eine weitere Lösung der Wellengleichung gegeben ( ÜA , berechnen Sie zu-
Ê
nächst ∂i ∂k r). Deren Wellenfronten { x ∈ 3 | x−ct = const } sind Sphären,
die sich mit der Geschwindigkeit c ausbreiten.
2.5 Die Wärmeleitungsgleichung

(a) Die Wärmeleitungsgleichung für die Temperaturverteilung u(x, t) in einem
das Gebiet Ω ausfüllenden, wärmeleitenden homogenen Medium lautet nach
Fourier (1807)
∂u
cp (x, t) − κ Δu(x, t) = Q(x)
∂t
(Landau–Lifschitz [155] (50,7)). Dabei ist die Dichte, cp die spezifische
Wärme bei konstantem Druck, κ das Wärmeleitvermögen und Q die pro Volu-
men– und Zeiteinheit durch eine Wärmequelle abgegebene Wärmemenge.
Diese Gleichung ergibt sich aus der Annahme, dass der Wärmefluß q(x, t) pro-
portional zum negativen Temperaturgradienten ist,
q = − κ ∇u .
Aus dem Erhaltungssatz für die Wärmemenge folgt die Bilanzgleichung

∂
∂t
cp u d3 x + ·
q do = Q d3 x
K ∂K K
für jedes Gaußsche Gebiet K, und daraus mit dem Gaußschen Integralsatz

∂u
cp − κ div ∇u d3 x = Q d3 x .
∂t
K K
Wie in Bd. 1, § 26 : 6.1 erhalten wir hieraus die Wärmeleitungsgleichung.

(b) Zur Bestimmung eines konkreten Wärmeleitungsprozesses sind neben der
Wärmeleitungsgleichung, die wir in der Form
∂u
− k Δu = f
∂t
schreiben, Anfangs– und Randbedingungen zu stellen. Durch
u(x, 0) = u0 (x) für x ∈ Ω
wird eine Anfangstemperaturverteilung u0 ∈ C(Ω) vorgeschrieben. Hinzu kom-

men wahlweise weitere Bedingungen. Ist Ω ein beschränktes Gebiet (Innen-
raumaufgabe), so werden alternativ folgende Randbedingungen betrachtet:
(1) Vorgeschriebene Temperatur am Gebietsrand (etwa durch ein Wärmebad)
u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0
(Dirichletsches oder erstes Randwertproblem).

(2) Vorgeschriebener Wärmefluß durch den Rand
k ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0
(Neumannsches oder Zweites Randwertproblem). Dabei ist n das äußere

Normalenfeld des als hinreichend glatt berandet vorausgesetzten Gebietes Ω.
(3) Gemischte (Robinsche) Randbedingung (drittes Randwertpro-
blem)
a(x, t) u(x, t) + k b(x, t) ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0
mit |a| + |b| > 0.

Ê
Ist n \ Ω beschränkt und nicht leer (Außenraumaufgabe), so kommt zu (1),
(2) oder (3) noch die Randbedingung im Unendlichen“ hinzu:
”
lim u(x, t) = 0 für t ≥ 0.
x→∞
(c) Bei zeitunabhängigen Randwerten stellt sich nach längerer Zeit ein Gleich-
gewicht ein, und die Lösungen werden stationär , d.h. unabhängig von der Zeit-
koordinate. Diese genügen dann der Poisson–Gleichung
−k Δu = f in Ω ,
bzw. bei nichtvorhandenen Wärmequellen ( f = 0 ) der Laplace–Gleichung
Δu = 0 in Ω .
Bei dieser Gleichung entfällt die Anfangsbedingung.
2.6 Die Maxwellschen Gleichungen

Diese lauten für ein isotropes (d.h. nicht kristallines) Medium im cgs–System
1 ∂(μH) 1 ∂(εE) 4π
(1) + rot E = 0 , − + rot H = j,
c ∂t c ∂t c
(2) div (μH) = 0 , div (εE) = 4π .

(Maxwell 1856, gestützt auf Vorarbeiten von Ampère, Faraday u.a.).

Hierbei bezeichnen E die elektrische, H die magnetische Feldstärke, die La-
dungsdichte, j die elektrische Stromdichte, ε die Dielektrizitätskonstante, μ die
Permeabilität und c die Lichtgeschwindigkeit im Vakuum.
Die Maxwellschen Gleichungen stellen ein System partieller Differentialgleichun-
gen dar. Eine Diskussion nur der wichtigsten damit verbundenen Aufgabenstel-
lungen würde den Rahmen dieses Buches sprengen; wir beschränken uns daher
auf einige spezielle Aspekte.
(a) Strom– und Ladungsdichte hängen über die Kontinuitätsgleichung
∂
+ div j = 0
∂t
miteinander zusammen. Das ergibt sich wie in Bd. 1, § 26 : 6.1 bzw. wie in Ab-
schnitt 2 mit Hilfe des Gaußschen Integralsatzes.
Seien , j, E0 , H0 mit div (μH0 ) = 0, div (εE0 ) = 4π 0 vorgegeben, wobei
0 (x) = (x, 0) gesetzt wird. Für Lösungen E(x, t), H(x, t) der Maxwell–Glei-
chungen (1) mit den Anfangswerten
E(x, 0) = E0 (x) , H(x, 0) = H0 (x) für alle x ∈ Ê 3
gelten dann automatisch die Gleichungen (2). Denn aus (1) folgt ÜA
∂ ∂
div (μH) = 0 , (div (εE) − 4π ) = 0 ,
∂t ∂t
also gelten die Gleichungen (2) für alle Zeiten.
(b) Im Vakuum (ε = μ = 1, = 0, j = 0) gilt für Lösungen von (1)
∂2E ∂2H
= c2 ΔE , = c2 ΔH ,
∂t2 ∂t2
d.h. die Komponenten von E und H erfüllen jede für sich die Wellengleichung
∂2u
= c2 Δu
∂t2
Ê
im 3 . Das ergibt sich mit Hilfe der Identität rot rot u = ∇div u − Δu von
Bd. 1, § 24 : 7.2 (d) ÜA .
(c) Sind E, H, , ε, μ und j zeitunabhängig, so ergibt sich in sternförmigen
Gebieten aus rot E = 0, div (μH) = 0 die Existenz eines Potentials U und
eines Vektorpotentials A mit
E = − ∇U , μH = rot A
(vgl. Bd. 1, § 24 : 5.5 und 7.3). Dabei dürfen wir div A = 0 annehmen, denn
ist A0 irgend ein Vektorpotential für μH und ist ϕ eine Lösung der Poisson–
Gleichung Δϕ = div A0 , so ist A = A0 − ∇ϕ ebenfalls ein Vektorpotential
für μH mit div A = 0. Wegen ΔU = div ∇U = div E und der schon in (b)
verwendeten Beziehung rot rot A = ∇div A − ΔA = −ΔA reduzieren sich die
Maxwell–Gleichungen auf die Gleichungen der Elektro– und Magnetostatik
4π 4π
− ΔU = , − ΔA = j.
ε c
Wir stellen fest, dass sich aus den Maxwell–Gleichungen in Spezialfällen die
Wellengleichung und Poisson–Gleichung ergeben.
2.7 Die Gleichungen der Strömungsmechanik

Die Differentialgleichungen für Gase und Flüssigkeiten beruhen auf den Erhal-
tungssätzen für Impuls und Masse sowie auf der Annahme, dass die Verformun-
gen des Mediums linear von den inneren Spannungen abhängen. Die auftre-
tenden Zustandsgrößen sind das Geschwindigkeitsfeld v(x, t), die Massendichte
(x, t) und der Druck p(x, t) an der Stelle x zum Zeitpunkt t.
(a) Für Gase und ideale (nicht zähe) Flüssigkeiten gelten nach Bd. 1, § 26 : 6
die Eulerschen Gleichungen
∂v
3
∂v 1 ∂
+ vi + ∇p = f , + div ( v) = 0 .
∂t ∂xi ∂t
i=1
Dabei ist f die Kraftdichte der äußeren Kräfte pro Masseneinheit (z.B. der
Gravitationskräfte). Hinzu kommt noch eine Zustandsgleichung F ( , p) = 0,
mit deren Hilfe wir p oder in den Eulerschen Gleichungen eliminieren können.
Beispiele von Zustandsgleichungen sind p = K γ (K > 0, γ > 1 Konstanten)
für polytrope Gase und = const für inkompressible Flüssigkeiten.
(b) Die Gleichungen von Navier–Stokes für zähe, inkompressible Flüssig-
keiten lauten
∂v
3
∂v 1 μ
+ vi + ∇p − Δv = f , div v = 0 ;
∂t ∂xi
i=1
hierbei ist die konstante Massendichte und μ ≥ 0 die Zähigkeitskonstante

(Navier 1822, Poisson 1831, Saint–Venant 1834, Stokes 1845).
(c) Wir leiten die Gleichungen der Schallausbreitung aus den Eulerschen Glei-
chungen unter den folgenden Annahmen (i)–(iv) ab:
(i) Kompressibles Gas mit kleinen Abweichungen der Dichte von einem kon-
stanten Wert 0 > 0,
| − 0| 1, p ( 0 ) > 0 für die Zustandsgleichung p = p( ),

3 Was bedeutet Lösung einer Differentialgleichung“? 23
”
(ii) Vernachlässigung der Konvektionsterme in den Eulerschen Gleichungen,

3
∂v
3
∂
vi ≈ 0, vi ≈ 0,
∂xi ∂xi
i=1 i=1
(iii) rotationsfreies Geschwindigkeitsfeld, rot v = 0,

(iv) Abwesenheit von äußeren Kräften, f = 0.
Dann folgt aus der Zustandsgleichung p = p( ), dass ∇p = p ( )∇ ≈ p ( 0 )∇
gilt. Die Eulerschen Gleichungen gehen damit über in
∂v p ( 0 ) ∂
+ ∇ = 0, + 0 div v = 0 ,
∂t 0 ∂t
und durch Ableitung beider Gleichungen nach der Zeit ergibt sich ÜA
∂2v ∂2
= c2 Δv , = c2 Δ mit c = p ( 0 ) .
∂t2 ∂t2
Die Zustandsgrößen v, erfüllen also die Wellengleichung mit c = p ( 0 ) als

Schallgeschwindigkeit. Die Interpretation der Konstanten c in der Wellenglei-
chung als Ausbreitungsgeschwindigkeit von Wellenfronten wurde in 1.3 plausibel
gemacht.
Zum Beispiel ergibt sich für die polytrope Zustandsgleichung p( ) = p0 ( / 0 )γ
als Schallgeschwindigkeit c = γ p0 / 0 .
Die Behandlung der Gleichungen von Euler und Navier–Stokes würde den Rah-
men dieses Buches bei weitem sprengen. Auch hier müssen wir uns mit der
Diskussion der Wärmeleitungsgleichung und der Wellengleichung begnügen.
3 Was bedeutet Lösung einer Differentialgleichung“?

”
In einfach gelagerten Fällen kann die Lösung eines Differentialgleichungsprob-
lems durch eine explizite Lösungsdarstellung, d.h. durch einen Funktionsaus-
druck, ein Integral oder eine Reihe angegeben werden. Bei partiellen Differen-
tialgleichungen setzt dies in der Regel eine Symmetrieeigenschaft der physika-
lischen Konfiguration voraus; Beispiele sind die Laplace–Gleichung, Wärmelei-
tungsgleichung und Wellengleichung auf der Kreisscheibe und der Kugel; diese
nehmen in § 14, § 16, § 17 den ihnen gebührenden Raum ein.
Für die meisten Probleme ist es aber unumgänglich, eine Lösungstheorie zu
entwickeln. Diese umfasst einerseits den Beweis der Existenz und der eindeutigen
Bestimmtheit einer Lösung und andererseits die Untersuchung deren qualitati-
ver Eigenschaften. Letztere sind nicht nur für die physikalische Theorie von
Interesse, sondern auch für numerische Rechnungen. Die Entwicklung effizienter
Näherungsverfahren gelingt umso besser, je mehr über die Eigentümlichkeiten

der Lösung theoretisch bekannt ist.
Ein Differentialgleichungsproblem ist stets verbunden mit weiteren Forderun-
gen wie Anfangs- und Randbedingungen. Diese ergeben sich meistens aus der
zugrunde liegenden physikalischen Fragestellung und sollten so beschaffen sein,
dass nur eine Lösung in Frage kommt. Für die Untersuchung der Existenz ei-
ner Lösung müssen wir zunächst klären, welche Differenzierbarkeitsstufe und
welche Anfangs- und Randbedingungen wir verlangen, m.a.W. welchem Funk-
tionenraum sie angehören soll. Nicht immer ist es sinnvoll, nach Lösungen
zu fragen, die so glatt sind, wie es der Bauart der Differentialgleichung ent-
spricht. Beim Anfangs–Randwertproblem 2.1 für die schwingende Saite ist es
z.B. natürlich, von den Lösungen C2 –Differenzierbarkeit in ]0, L[ × Ê zu ver-
langen. Dies schließt aber den durchaus interessanten Fall aus, dass die Anfangs-
gestalt der Saite einen Knick hat, dessen Fortpflanzung untersucht werden soll.
Mehr noch: Selbst wenn die Anfangsdaten f, g beliebig glatt sind, gibt es nur
dann eine C2 –Lösung, wenn f (0) = f (L) = 0 gilt. In jedem Fall gibt es eine
schwache Lösung von 2.1, das ist grob gesagt eine Funktion u, für welche das
Wirkungsintegral W (u) von 2.2 erklärt ist und sich die Bedingung δW (u) = 0
in der Form 2.2 Gl. (∗),(∗∗) ausdrückt. Ähnliches gilt für die Gleichungen der
Strömungsmechanik, wo Schockwellen und Turbulenzen als Singularitäten von
schwachen Lösungen beschrieben werden müssen.
In den Lösungstheorien in § 14, § 16, § 17 gehen wir in zwei Schritten vor. Zu-
nächst wählen wir einen Funktionenraum, der bezüglich einer dem Problem an-
gepassten Norm vollständig ist. In diesem konstruieren wir eine Cauchy-Folge
von Näherungslösungen, von deren Grenzwert gezeigt wird, dass er eine schwa-
che Lösung darstellt. In einem zweiten Schritt geht es um die Untersuchung der
Regularität dieser schwachen Lösung, d.h. um deren Stetigkeits- und Differen-
zierbarkeitseigenschaften.
4 Die Schrödinger–Gleichung
(a) Der Bewegung eines Teilchens der Masse m unter dem Einfluß eines Poten-
tials V in der klassischen Mechanik entspricht in der Quantenmechanik folgen-
de Grundaufgabe.
Ê
Gegeben ist eine hinreichend glatte Funktion ψ0 : 3 →
mit | ψ0 (x) |2 d3 x = 1 . Gesucht ist eine komplexwertige Lösung ψ(x, t) der
Ê3
Schrödinger–Gleichung
∂ψ h̄2
(∗) ih̄ (x, t) = − Δψ(x, t) + V (x) ψ(x, t)
∂t 2m
mit ψ(x, 0) = ψ0 (x) . Durch Umskalierung der Orts– und Zeitkoordinate können
wir h̄ = m = 1 erreichen.
4 Die Schrödinger–Gleichung 25
(b) Die mit (∗) und mit ähnlichen Gleichungen der Quantenmechanik verbun-
denen Fragestellungen führen uns in die Theorie der linearen Operatoren im
Hilbertraum. Für (∗) legen wir den Raum

L2 = L2 ( Ê ) = {u : Ê
3 3
→ | | u(x) |2 d3 x < ∞}
Ê3
zugrunde, versehen mit dem Skalarprodukt

u, v = u(x) v(x) d3 x .
Ê3
Der Raum L2 ist vollständig, d.h. ist ein Hilbertraum, wenn wir den Lebesgue-
schen Integralbegriff verwenden. Das Lebesgue–Integral und seine Eigenschaften
werden in § 8 kurz vorgestellt; die Beweise und die Konstruktion weiterer Hil-
berträume der Quantenmechanik sind in § 20 zu finden.
Mit den Abkürzungen
∂ψ
ψt : x → ψ(x, t) , ψ̇t : x → (x, t)
∂t
erhält die auf h̄ = m = 1 skalierte Schrödinger–Gleichung (∗) die Form
(∗∗) ψ̇t = −iHψt ;
dabei ist H der durch

1
Hu := − 2 Δu + V u
gegebene Hamilton–Operator. Da Hu nicht für alle u ∈ L2 Sinn macht, ist eine

Teilmenge des Hilbertraums L2 als Definitionsbereich D für H festzulegen,
z.B. die Menge aller C∞ –Funktionen u, für die u , Δu , V u für x → ∞
rasch abfallen und zu L2 gehören. H erfüllt dann die Symmetriebedingung
u , Hv = Hu , v für u, v ∈ D.
(c) Das Anfangswertproblem für (∗∗) lautet: Gegeben sei eine Funktion ψ0 ∈ D
mit ψ0 2 = ψ0 , ψ0 = 1. Gesucht sind Funktionen ψt ∈ D mit

ψt+h − ψt
lim − (−iHψt ) = 0 für alle t ∈
h→0 h
(Lösungen von (∗∗) im Hilbertraumsinn). Besitzt dieses Problem eine eindeu-
tig bestimmte stetige Lösung t → ψt , → D für alle t ∈ , so heißt H ein
Schrödinger–Operator oder wesentlich selbstadjungiert. Dies trifft z.B. für das
Coulomb–Potential V (x) = x−1 und für V (x) = 12 x2 zu. Eine Grund-
aufgabe der mathematischen Quantenmechanik besteht darin, Kriterien für we-
sentliche Selbstadjungiertheit des Energieoperators“ H und anderer Hilber-
”
traumoperatoren anzugeben.
(d) Zu jedem Schrödinger–Operator H gehört eine Schar von unitären Abbil-

dungen U (t) : D → D , die definiert ist durch ψt = U (t)ψ0 , wobei ψt die
Lösung zum Anfangswert ψ0 ist. Für diese Schar läßt sich zeigen, dass
U (s + t) = U (s)U (t) , U (0) = ½, U (t)−1 = U (−t) .
Wir sprechen von einer unitären Zeitentwicklungsgruppe.

(e) Die Wellenfunktion ψt beschreibt den Zustand eines spinlosen Teilchens“
”
der Masse m unter dem Einfluß des Potentials V zur Zeit t. Dies ist so zu
verstehen: Über das zeitliche Verhalten eines einzelnen Elementarteilchens sind
prinzipiell keine Voraussagen möglich, wohl aber über das statistische Verhalten
eines Teilchenstrahls bzw. der Messergebnisse bei hohen Versuchszahlen unter
identischen Versuchsbedingungen. Die Gruppeneigenschaft (d) besagt gerade,
dass die Kenntnis des Zustandes ψs zu irgend einem Zeitpunkt s das zeit-
liche Verhalten der Zustände für alle Zeiten festlegt (Determinismus für die
Zustände).
(f) Wie schon der Name sagt, können mit Hilfe der Funktionen ψt Wellen-
eigenschaften einer Gesamtheit von Elementarteilchen wie Interferenz und Beu-
gung beschrieben werden; dies wird
durch2die3 Komplexwertigkeit von ψt ermög-
licht. Im Korpuskelbild kann |ψt (x)| d x als Wahrscheinlichkeit gedeutet
Ω
werden, ein Teilchen bei einer Ortsmessung im Raumgebiet Ω vorzufinden.
In Kap. VI wird sich zeigen, dass ψt , Hψt zeitunabhängig ist und als stati-
stischer Mittelwert (Erwartungswert) der Energie über die Teilchengesamtheit
zu deuten ist. Den mathematischen Hintergrund für solche Aussagen liefert die
Wahrscheinlichkeitstheorie, mit der wir uns in § 19 befassen.
(g) Neben der Energie werden auch weiteren Observablen wie Ort, Impuls
und Drehimpuls in der Quantenmechanik (wesentlich) selbstadjungierte Hil-
bertraumoperatoren zugeordnet. Die Theorie solcher Operatoren wird in den
Paragraphen § 18 – § 22 entwickelt. Im Mittelpunkt steht dabei der Begriff Spek-
trum und dessen physikalische Deutung als Menge der möglichen Messwerte der
betreffenden Observablen.
Kapitel II
Gewöhnliche Differentialgleichungen
§ 2 Grundlegende Theorie
1 Das allgemeine Anfangswertproblem
1.1 Zielsetzung
Im ersten Band wurde eine Reihe von Differentialgleichungsproblemen behan-
delt, u.a. die Schwingungsgleichung ÿ + aẏ + by = f , die separierte Differen-
tialgleichung y = a(x) b(y) und lineare Systeme ÿ = By mit symmetrischer
Matrix B, jeweils mit geeigneten Anfangsbedingungen.
In allen Fällen ergab sich die eindeutige Lösbarkeit des Anfangswertproblems
aus dem Lösungsverfahren: Das Differentialgleichungsproblem konnte auf ein-
fachere Aufgaben zurückgeführt werden wie Aufsuchen einer Stammfunktion,
Auflösung einer Gleichung F (x, y) = 0, Bestimmung von Polynomnullstellen,
oder Diagonalisierung einer Matrix.
Nicht für jeden Differentialgleichungstyp gibt es solche Lösungsverfahren. Au-
ßerdem wollen wir Aussagen über qualitatives Verhalten und Gesetzmäßigkeiten
der Lösungen machen, ohne diese explizit bestimmen zu müssen. Aus beiden
Gründen bedarf es einer Theorie, welche für geeignet formulierte Anfangswert-
probleme die Existenz und Eindeutigkeit der Lösung sicherstellt und ihr Ver-
halten beschreibt.
1.2 Die allgemeine Form des Anfangswertproblems

Ê
(a) Es sei f : Ω → n eine stetige Funktion auf einem Gebiet Ω des Ên+1
,
dessen Punkte wir mit
(x, y) = (x, y1 , . . . , yn ) oder (ξ, η) = (ξ, η1 , . . . , ηn )
bezeichnen.
Unter einer Lösung der Differentialgleichung (DG) y = f (x, y) verstehen
Ê
wir eine C1 –Kurve u : I → n auf einem nicht einpunktigen Intervall I mit
(x, u(x)) ∈ Ω und u (x) = f (x, u(x)) für alle x ∈ I ,
in Komponentenschreibweise
u1 (x) = f1 (x, u1 (x), . . . , un (x)) ,
..
.
un (x) = fn (x, u1 (x), . . . , un (x)) .

28 § 2 Grundlegende Theorie
Wenngleich es sich im Fall n ≥ 2 um ein System von Differentialgleichun-

gen 1. Ordnung handelt, werden wir doch meist von einer Differentialglei-
chung (DG) sprechen. Die Funktion f heißt traditionsgemäß die rechte Seite
der Differentialgleichungen. Differentialgleichungen der betrachteten Art wer-
den explizit genannt im Gegensatz zu impliziten Differentialgleichungen
der Form F(x, y, y ) = 0.
Wie wir gleich zeigen, lässt sich jede explizite DG höherer Ordnung in ein äqui-
valentes System 1. Ordnung überführen. Bei den folgenden grundlegenden Aus-
sagen über Lösungen betrachten wir daher durchweg Systeme 1. Ordnung.
(b) Das Anfangswertproblem (AWP) besteht darin, für einen gegebenen
Anfangspunkt (ξ, η) ∈ Ω eine Lösung u auf einem ξ umfassenden Intervall I
mit u(ξ) = η zu finden.
Für diese Aufgabe schreiben wir kurz
y = f (x, y) , y(ξ) = η .
Das Anfangswertproblem heißt eindeutig lösbar, wenn Folgendes gilt:

Ist (ξ, η) ein beliebiger Punkt aus Ω und sind
u 1 : I1 → Ê n
, u2 : I2 → Ê n
Lösungen des AWP y = f (x, y), y(ξ) = η, so ist
u1 (x) = u2 (x) für x ∈ I1 ∩ I2 .
Wir interessieren uns hier nur für eindeutig lösbare Anfangswertprobleme und
fassen die Voraussetzungen über die rechte Seite entsprechend.
1.3 Differentialgleichungen n–ter Ordnung als Systeme erster Ord-

nung
Eine explizite DG n–ter Ordnung hat die Form
y (n) = f (x, y, y , . . . , y (n−1) ) .
Ê
Dabei sei f eine auf einem Gebiet Ω ⊂ n+1 stetige Funktion. Von einer Lösung
u in einem nicht einpunktigem Intervall I verlangen wir:
(a) u ∈ Cn (I),
(b) (x, u(x), u (x), . . . , u(n−1) (x)) ∈ Ω für x ∈ I,
(c) u(n) (x) = f (x, u(x), u (x), . . . , u(n−1) (x)) für x ∈ I.
Satz. Für jede Lösung u ∈ Cn (I) der DG y (n) = f (x, y, y , . . . , y (n−1) ) liefert
y := (y1 , . . . , yn ) mit y1 := u, y2 := u , . . . , yn := u(n−1)

2 Das Anfangswertproblem als Integralgleichung 29
eine C1 –differenzierbare Lösung y : I → Ê n

des Systems
⎧
⎪
⎪ y1 = y2
⎪
⎨ ..
(S) .
⎪
⎪

yn−1 = yn
⎪
⎩
yn = f (x, y1 , . . . , yn ) .
Ê
Ist umgekehrt u = (u1 , . . . , un ) : I → n eine C1 –differenzierbare Lösung von
(S), so ist u := u1 eine Cn –differenzierbare Lösung der Differentialgleichung
y (n) = f (x, y, y , . . . , y (n−1) ) ÜA .
Daraus ergibt sich die adäquate Form des Anfangswertproblems für eine
DG n–ter Ordnung:
y (n) = f (x, y, y , . . . , y (n−1) ) , y(ξ) = η1 , . . . , y (n−1) (ξ) = ηn
für einen gegebenen Punkt (ξ, η1 , . . . , ηn ) = (ξ, η) ∈ Ω.
Satz. Dieses AWP ist eindeutig lösbar genau dann, wenn das AWP (S) mit
der Anfangsbedingung y(ξ) = η eindeutig lösbar ist. Es handelt sich also um
äquivalente Problemstellungen.
Denn für u, v ∈ Cn (I) gilt u = v ⇐⇒ (u, u , . . . , u(n−1) ) = (v, v , . . . , v (n−1) ).
1.4 Systeme von Differentialgleichungen n–ter Ordnung lassen sich auf

diesem Wege ebenfalls in Systeme erster Ordnung umwandeln.
ÜA Führen Sie dies für ein System ÿ = By mit einer 2 × 2–Matrix B aus.
2 Das Anfangswertproblem als Integralgleichung

2.1 Integrale von vektorwertigen Funktionen
Für eine vektorwertige Funktion a(t) = (a1 (t), . . . , an (t)) mit reell– oder kom-
plexwertigen Funktionen ak ∈ C(I) definieren wir das Integral komponenten-
weise:
β β β
a(t) dt := a1 (t) dt , . . . , an (t) dt
α α α
(α, β ∈ I, auch für β < α). Bezüglich des kanonischen Skalarproduktes gilt
β β
(∗) b, a(t) dt = b , a(t) dt ,
α α
wobei t → b , a(t) stetig ist. Auch a(t) ist stetig in t, und es gilt die
Integralabschätzung
β β

a(t) dt ≤ a(t) dt .
α α
(Die Betragsstriche auf der rechten Seite tragen der Möglichkeit β < α Rech-
nung.)
Dies ergibt sich für α < β aus (∗) mit der Cauchy–Schwarzschen Ungleichung
β
und anschließendem Einsetzen von a(t) dt für b ÜA . Diese Integralabschät-
α
zung gilt auch bezüglich der Norm a∞ = max{|a1 |, . . . , |an |} ÜA .
2.2 Das Anfangswertproblem in Fixpunktform

Genau dann ist u : I → Ên
eine Lösung des AWP
y = f (x, y) , y(ξ) = η ,
wenn u : I → Ê n
stetig ist und die Integralgleichung
x
u(x) = η + f (t, u(t)) dt
ξ
für alle x ∈ I erfüllt.
Schreiben wir für die rechte Seite dieser Gleichung T (u)(x), so haben wir das
AWP auf eine einzige Fixpunktgleichung der Gestalt
u = T (u)
zurückgeführt, wobei nur nach stetigen Lösungen zu suchen ist.

Das folgt sofort aus dem Hauptsatz der Differential– und Integralrechnung für
die Komponenten des Integrals ÜA .
3 Die Standardvoraussetzung für DG–Systeme

3.1 Die Standardvoraussetzung für die rechte Seite ist in diesem Para-
Ê
graphen: f : n+1 ⊃ Ω → n
Ê ∂fi
ist stetig, die partiellen Ableitungen ∂y
k
existieren in Ω und sind dort stetige Funktionen, kurz

∂fi
f und Dy f sind stetig auf Ω, wobei Dy f (x, y) := (x, y) .
∂yk
Der Sinn dieser scheinbar unnötig komplizierten Voraussetzung ergibt sich dar-
aus, dass die allgemeine Theorie zwei wichtigen Spezialfällen Rechnung tragen
soll:
3 Die Standardvoraussetzung für DG–Systeme 31
(a) Lineare Systeme y = A(x)y + b(x) . Hier muss zugelassen werden, dass
die Komponenten aik (x) der n × n–Matrix A(x) und die Komponenten bj (x)
von b(x) auf einem offenen Intervall I stetig sind. Dann erfüllt die rechte Seite
Ê
f (x, y) = A(x)y + b(x) auf Ω = I × n die Standardvoraussetzung.

(b) Autonome Systeme y = g(y) , bei denen die rechte Seite nicht explizit
Ê Ê
von x abhängt. Ist g : n ⊃ Ω → n eine C1 –Abbildung, so erfüllt die
Funktion f (x, y) := g(y) auf Ω := Ê
× Ω die Standardvoraussetzung. Auf
autonome Systeme gehen wir in § 5 näher ein.
3.2 Die Lipschitz–Bedingung

(a) Die rechte Seite f erfüllt auf einer Teilmenge K von Ω eine Lipschitz–
Bedingung mit der Lipschitz–Konstanten L, in Zeichen
f ∈ Lip (K, L),
wenn für alle (x, y), (x, z) ∈ K die Ungleichung
f (x, y) − f (x, z) ≤ L y − z
erfüllt ist.
(b) Die Lipschitz–Bedingung für lineare Systeme y = A(x)y + b(x) .
Sind die Komponenten aik von A und bi von b stetig auf einem Intervall I
und setzen wir

n
n
1/2
A(x)2 := aik (x)2 ,
i=1k=1
so gilt für f (x, y) = A(x)y + b(x)
f (x, y) − f (x, z) ≤ A(x)2 y − z ,
vgl. Bd.1, § 21 : 7.2. Ist also J ein kompaktes Teilintervall von I und K = J × Ê n
,
so gilt f ∈ Lip (K, L) mit L = max{A(x)2 | x ∈ J}.
(c) Satz. Unter der Standardvoraussetzung 3.1 erfüllt f eine Lipschitz–Be-

dingung in jeder kompakten Menge K ⊂ Ω, die mit je zwei Punkten (x, y),
(x, z) auch die Verbindungsstrecke enthält.
Beweis. Wir setzen (vgl. (b))

∂fi
A(x, y) = (x, y) , L = max A(x, y)2 | (x, y) ∈ K .
∂yk
Für (x, y), (x, z) ∈ K und b ∈ Ê n

setzen wir ϕ(t) := b , f (x, z + t(y − z)) .
Nach dem Mittelwertsatz gilt mit geeignetem ϑ ∈ ]0, 1[
b , f (x, y) − f (x, z) = ϕ(1) − ϕ(0)

= b , A(x, z + ϑ(y − z))(y − z)
≤ b A(x, z + ϑ(y − z))(y − z)
≤ b L y − z .
Die Behauptung folgt jetzt mit b = f (x, y) − f (x, z). 2
(d) Eine Lipschitz–Bedingung für Graphenumgebungen.

Ê
Sei u : [α, β] → n eine stetige Kurve, deren Graph

Gu := (x, u(x)) | α ≤ x ≤ β
in Ω liegt. Dann gibt es ein δ > 0, so dass der δ–Schlauch

Sδ (u) := (x, y) | α ≤ x ≤ β, y − u(x) ≤ δ
eine kompakte Teilmenge von Ω der in (c) genannten Art ist.

Denn Gu ist als Bildmenge des kompakten Intervalls [α, β] unter der stetigen
Ê
Abbildung x → (x, u(x)) kompakt. Im Fall Ω = n+1 ist nichts zu beweisen,
andernfalls setzen wir δ := 12 dist (Gu , ∂Ω) .
4 Kontrolle und Eindeutigkeit von Lösungen

4.1 Abstandskontrolle von Lösungen
Seien u0 , u : I → Ê
n
Lösungen der Anfangswertprobleme
u0 = f 0 (x, u0 ) , u0 (ξ0 ) = η 0 und u = f (x, u) , u(ξ) = η .
Gesucht ist eine Abschätzung für den Abstand (x) := u0 (x) − u(x) der bei-
den Lösungen in Abhängigkeit von den Abweichungen der Ausgangsdaten
f 0 − f , | ξ0 − ξ | , η 0 − η .
Wir setzen voraus, dass beide Lösungsgraphen in einer kompakten Teilmenge

K von Ω verlaufen und dass f 0 ∈ Lip (K, L) gilt. Ferner setzen wir
M := max {f 0 (x, y) | (x, y) ∈ K} ,
ε1 := max {f 0 (x, y) − f (x, y) | (x, y) ∈ K} .
Dann ergibt sich aus der Fixpunktform 2.2 der beiden Anfangswertprobleme
4 Kontrolle und Eindeutigkeit von Lösungen 33
x x
(x) = u0 (x) − u(x) = η 0 + f 0 (t, u0 (t)) dt − η − f (t, u(t)) dt
ξ0 ξ
x
= η0 − η + f 0 (t, u0 (t)) − f 0 (t, u(t)) + f 0 (t, u(t)) − f (t, u(t)) dt
ξ
ξ
+ f 0 (t, u0 (t)) dt
ξ0
x

≤ η 0 − η + L u0 (t) − u(t) + ε1 dt + | ξ0 − ξ |M .
ξ
Daher gilt mit ε0 := η 0 − η + | ξ0 − ξ |M

x

(∗) (x) ≤ ε0 + L (t) + ε1 dt .
ξ
Um daraus eine Abschätzung für (x) zu gewinnen, dient uns
4.2 Das Lemma von Gronwall

Ê
Genügt eine stetige Funktion : I → + der Integralungleichung (∗) mit Kon-
stanten ε0 , ε1 ≥ 0 und L > 0, so gilt für x ∈ I
ε1 L|x−ξ|
(x) ≤ ε0 eL|x−ξ| + e −1 .
L
Beweis.
x

Wir setzen h(x) := ε0 + (L (t) + ε1 ) dt .
ξ
Die Funktion h ist stetig und es gilt (x) ≤ h(x). Zwar existiert h (ξ) nicht,
aber die Einschränkungen von h auf {x ∈ I | x < ξ} und {x ∈ I | x > ξ} sind
C1 –differenzierbar. Für x < ξ gilt
h (x) = −L (x) − ε1 ≥ − L h(x) − ε1 ,
d Lt
e h(t) = L eLt h(t) + eLt h (t) ≥ − ε1 eLt .
dt
Integration von x bis ξ ergibt
ε1 Lx
eLξ ε0 − eLx h(x) = eLξ h(ξ) − eLx h(x) ≥ e − eLξ .
L
Daraus folgt
ε1 L(x−ξ)
(x) ≤ h(x) ≤ ε0 eL(x−ξ) + e −1 .
L
Der Fall x > ξ ergibt sich analog (Integration von d
dt
(e−Lt h(t)) von ξ bis x). 2
4.3 Der Eindeutigkeitssatz

Unter der Standardvoraussetzung 3.1 hat das Anfangswertproblem
y = f (x, y) , y(ξ) = η
höchstens eine Lösung.
Beweis.
Ê
Angenommen, für zwei Lösungen u0 : I → n, u : J → n dieses AWP gibt Ê
es ein s ∈ I ∩ J mit u0 (s) = u(s), o.B.d.A. s > ξ. Dann existiert

x0 := inf x > ξ u0 (x) = u(x) ,
und es gilt u0 (x0 ) = u(x0 ) =: y0 . Wir wählen eine Graphenumgebung

K = (x, y) |x − x0 | ≤ r , y − u0 (x) ≤ δ ⊂ Ω
für u0 , wobei wir r > 0 so wählen, dass
(x) := u0 (x) − u(x) ≤ δ , d.h. (x, u(x)) ⊂ K für |x − x0 | ≤ r .
Nach 3.2 (d) gibt es eine Lipschitzkonstante L für f in K. Aus 4.1 folgt mit
ξ = ξ0 := x0 , η = η 0 := y0 und f 0 := f (also ε1 = ε0 = 0)
x
(x) ≤ L (t) dt für x0 ≤ x < x0 + r .
x0
Nach dem Gronwallschen Lemma ergibt sich hieraus (x) = 0, d.h. u(x) =
u0 (x) für x0 ≤ x ≤ x0 + r, was im Widerspruch zur Wahl von x0 steht. 2
5 Existenz von Lösungen

5.1 Das Iterationsverfahren von Picard–Lindelöf
Unter der Standardvoraussetzung 3.1 gibt es zu jedem Punkt (ξ, η) ∈ Ω eine
lokale Lösung des Anfangswertproblems
y = f (x, y) , y(ξ) = η,
Ê
d.h. es gibt eine eindeutig bestimmte Lösung u : I → n auf einem Intervall
I = [ξ − δ, ξ + δ] mit δ > 0 . Diese ist gleichmäßiger Limes der Picard–
Iterierten uk , gegeben durch die Iterationsvorschrift
u0 (x) = η ,
x
uk+1 (x) = η + f (t, uk (t)) dt für k = 0, 1, . . . .
ξ
5 Existenz von Lösungen 35
Beweis.
(a) Wahl von δ. Wir bestimmen zunächst r > 0, R > 0 so, dass der Zylinder

Z = (x, y) | x − ξ | ≤ r, y − η ≤ R
ganz in Ω liegt. Ist M = max{f (x, y) | (x, y) ∈ Z}, so wählen wir δ > 0 so,
dass δ ≤ r und δ M ≤ R.
Nun setzen wir

K := (x, y) | x − ξ | ≤ δ , y − η ≤ R
und wählen eine Lipschitzkonstante L für f auf K gemäß 3.2 (c).

(b) Durchführbarkeit des Iterationsverfahrens. Wir zeigen per Induktion, dass
der Graph der Iterierten uk in K liegt. Für u0 ist das richtig. Liegt (x, uk (x))
für | x − ξ | ≤ δ in K, so folgt
x

uk+1 (x) − η ≤ f (t, uk (t)) dt ≤ M | x − ξ | ≤ M δ ≤ R .
ξ
(c) Die gleichmäßige Konvergenz der Picard–Iterierten uk .

Zunächst ist nach (b) u1 (x) − u0 (x) = u1 (x) − η ≤ R. Allgemein gilt
x

uk+1 (x) − uk (x) = [f (t, uk (t)) − f (t, uk−1 (t))] dt
ξ
x

≤ f (t, uk (t)) − f (t, uk−1 (t)) dt
ξ
x

≤ L uk (t) − uk−1 (t) dt .
ξ
Daraus ergibt sich sukzessive

x

u2 (x) − u1 (x) ≤ L u1 (t) − u0 (t) dt ≤ R L | x − ξ | ,
ξ
x
| x − ξ |2
u3 (x) − u2 (x) ≤ L R L | t − ξ | dt = R L2 .
ξ
2
Durch Induktion erhalten wir für k = 0, 1, . . . ÜA
(L | x − ξ |)k (Lδ)k
(∗) uk+1 − uk ≤ R ≤ R .
k! k!
Also konvergiert jede Komponente von
k

uk+1 (x) = η + uj+1 (x) − uj (x)
j=0
gleichmäßig auf I = [ξ − δ, ξ + δ], denn die Komponenten der Reihe

∞

∞
(δL)j
uj+1 (x) − uj (x) haben nach (∗) die Majorante R .
j=0 j=0 j!
(d) u := lim uk löst das Anfangswertproblem auf I. Denn die Komponenten

k→∞
von u sind stetig als gleichmäßige Limites stetiger Funktionen. Da K abgeschlos-
sen ist, liegt der Graph von u in K. Aus
f (t, u(t)) − f (t, uk (t)) ≤ L u(t) − uk (t)
folgt die gleichmäßige Konvergenz f (t, uk (t)) → f (t, u(t)) , somit

x
u(x) = lim uk+1 (x) = lim η+ f (t, uk (t)) dt
k→∞ k→∞
ξ
x x
= η+ lim f (t, uk (t)) dt = η + f (t, u(t)) dt .
k→∞
ξ ξ
Damit ist u : I → Ê n
eine Lösung des AWP nach 2.2. 2
5.2 Aufgaben
(a) Sei n = 1 und f (x, y) = x |y| in Ê × Ê. Warum kann f in [−1, 1] × [−1, 1]
keine Lipschitz–Bedingung erfüllen?
(b) Das Anwachsen der Lösung. Mit den Bezeichnungen des Beweises 5.1
gilt u(x) − η ≤ R eL |x−ξ| . Begründung?
(c) Führen Sie die Picard–Iteration für das AWP
2 1
y1 = y2 , y2 = y1 , y1 (1) = 2 , y2 (1) = 1
x 2x
in Ê>0 × Ê durch. Es ergibt sich ein einfaches Resultat.
(d) Fehlerabschätzung für das Iterationsverfahren. Zeigen Sie mit Hilfe
der Fixpunktgleichung für die Lösung u und mittels Induktion, dass für die
Picard–Iterierte uk unter den Voraussetzungen 5.1 (a) Folgendes gilt:
|x − ξ|k+1
u(x) − uk (x) ≤ M Lk für |x − ξ| ≤ δ .
(k + 1)!
2 1 2
Lösung des AWP y = 1 + 3x + 4 y , y(0) = 0 auf dem Intervall
(e) Sei u die
I = − 2 , 2 . Geben Sie ein Polynom p an mit | u(x) − p(x) | ≤ 0.02 für x ∈ I.
1 1
Anleitung: Um die Fehlerabschätzung

(d) anwenden zu können, ist zunächst
ein Rechteck KR = − 12 , 12 × [−R, R] so zu bestimmen, dass die Graphen
5 Existenz von Lösungen 37
aller Picard–Iterierten dort verbleiben. Nach 5.1 (a) lautet die Bedingung dafür
1
2
M (R) ≤ R, wobei

M (R) = max 1 + 3x2 + 14 y 2 | | x | ≤ 12 , | y | ≤ R .
Wählen Sie R passend und bestimmen Sie die Lipschitz–Konstante für KR .

(f) Führen Sie das Iterationsverfahren für das Anfangswertproblem
y1 = 3
y
2 1
− 1
y
2 2
, y1 (0) = 2 ,
y2 = 1
y
2 1
+ 1
y
2 2
, y2 (0) = 0
durch. Nach wenigen Schritten erkennen Sie das Bildungsgesetz der Reihe für
y2 ; es ergibt sich eine einfache Formel für y2 . Aus der zweiten DG erhalten Sie
dann y1 . Vergleichen Sie den realen Fehler mit der Fehlerabschätzung (d).

Bemerkung. Die dem System zugrundeliegende Matrix A = 21 31 −11 ist
nicht diagonalähnlich; der Entkopplungsansatz von Bd. 1, § 18 : 5 führt hier nicht
zum Ziel. Weiteres zu linearen Systemen siehe § 3 Abschnitte 1 und 2.
5.3 Der globale Existenz– und Eindeutigkeitssatz

Unter der Standardvoraussetzung 3.1 hat das Anfangswertproblem
y = f (x, y) , y(ξ) = η
für jeden Startpunkt (ξ, η) ∈ Ω genau eine Lösung x → ϕ(x, ξ, η) auf einem
maximalen Intervall J(ξ, η). Dieses Existenzintervall J(ξ, η) ist offen.
Ê
Für jede andere Lösung u : I → n des Anfangswertproblems gilt also
I ⊂ J(ξ, η) und u(x) = ϕ(x, ξ, η) für alle x ∈ I .
Wir nennen
x → ϕ(x, ξ, η), J(ξ, η) → Ê n
die maximal definierte (maximale) Lösung des AWP.
Beweis.
Wir definieren J(ξ, η) als Vereinigung aller Lösungsintervalle, d.h. aller Inter-
valle I, für die ξ innerer Punkt ist und die Definitionsintervall einer Lösung
des AWP y = f (x, y), y(ξ) = η sind. Nach dem lokalen Existenzsatz gibt
es solche, und nach dem Eindeutigkeitssatz bestimmt jedes Lösungsintervall I
eindeutig eine dort definierte Lösung uI . Der Durchschnitt und die Vereinigung
zweier Lösungsintervalle I, J ist wieder eines, Letzteres wegen ξ ∈ I ∪ J. Daher
ist J(ξ, η) ein Intervall, d.h. für α, β ∈ J(ξ, η) mit α < β ist [α, β] ⊂ J(ξ, η)
(Bd. 1, § 8 : 4.7). Sind nämlich I, J Lösungsintervalle mit α ∈ I, β ∈ J, so gilt

[α, β] ⊂ I ∪ J ⊂ J(ξ, η). Wegen des Eindeutigkeitssatzes dürfen wir definieren
ϕ(x, ξ, η) := uI (x), falls x im Lösungsintervall I liegt.
Dann ist x → ϕ(x, ξ, η) eine nach Konstruktion maximal definierte Lösung.

Das Existenzintervall J(ξ, η) ist offen. Denn zu jedem x0 ∈ J(ξ, η) gibt es
nach 5.1 ein mit δ > 0 und eine lokale Lösung z : [x0 − δ, x0 + δ] → n des Ê
AWP
y = f (x, y) , y(x0 ) = ϕ(x0 , ξ, η).
Als maximale Lösung muss ϕ eine Fortsetzung der lokalen Lösung z sein, somit
ist [x0 − δ, x0 + δ] in J(ξ, η) enthalten. 2
5.4 Beispiele und Aufgaben

(a) Bestimmen Sie die maximalen Lösungen und deren Definitionsintervall für
das AWP y = f (x, y), y(0) = y0 mit den rechten Seiten
f (x, y) =
y
1 − x2
bzw. f (x, y) =
y2
1 − x2
in Ω = ] − 1, 1[ × Ê.
(b) Zeigen Sie: Die Lösung y(x) = y0 exp((x − 1) sin log(1 − x)) des AWP
y = y (sin log(1 − x) + cos log(1 − x)) , y(0) = y0 > 0
in Ω = ]− ∞, 1[ × Ê
existiert für x < 1 und besitzt für x → 1− einen Grenz-
wert, während lim y (x) nicht existiert.
x→1−
6 Zum Definitionsintervall maximaler Lösungen

6.1 Der Fortsetzungssatz
Ê
Für die DG y = f (x, y) auf Ω ⊂ n+1 sei die Standardvoraussetzung 3.1
erfüllt, und u sei eine Lösung. Dann gilt
(a) Liegen alle Punkte (x, u(x)) für x ∈ ]a, b[ in einer kompakten Teilmenge
von Ω, so kann u zu einer Lösung auf einem größeren Intervall ]a − ε, b + ε[
(ε > 0) fortgesetzt werden.
(b) Ist u maximal definiert, so verlassen die Punkte (x, u(x)) sowohl für wach-
sendes als auch für fallendes x schließlich jede kompakte Teilmenge von Ω.
Da sich Ω durch kompakte Mengen ausschöpfen lässt (Bd. 1, § 23 : 4.7), können
wir für (b) auch sagen: Der Graph von u läuft in Ω von Rand zu Rand.“
”
6 Zum Definitionsintervall maximaler Lösungen 39
Beweis.
(a) folgt unmittelbar aus (b).
(b) Sei u eine maximale Lösung auf dem nach 5.3 offenen Intervall I, deren
Graph die kompakte Menge K ⊂ Ω trifft.
Dann ist A := {x ∈ I | (x, u(x)) ∈ K} nicht leer und beschränkt, da K
beschränkt ist. Also existiert β := sup A. Haben wir β ∈ I gezeigt, so gibt es
Zahlen x ∈ I mit x > β, und für alle diese x gilt (x, u(x)) ∈ K.
Zum Nachweis von β ∈ I geben wir anschließend ein δ > 0 an mit
(∗) [ξ − δ, ξ + δ] ⊂ J(ξ, η) für jeden Punkt (ξ, η) ∈ K;
dabei ist J(ξ, η) gemäß 5.3 definiert. Da es nach Definition von β ein ξ ∈ A gibt
mit β − δ < ξ ≤ β, also β ∈ [ξ, ξ + δ[ , folgt dann β ∈ J(ξ, u(ξ)) = I.
Nachweis von (∗) : Für := 1
dist (K, ∂Ω) bzw. := 1 im Fall Ω = Ê n+1
ist

2
K := z ∈

Ê n+1
| dist (z, K) ≤
eine kompakte Teilmenge von Ω. Wir√setzen M := max{f (x, y) | (x, y) ∈ K }
und wählen δ > 0 so, dass M δ ≤ / 2. Für (ξ, η) ∈ K gilt
√ √
Z (ξ, η) := (x, y) | |x − ξ| ≤ / 2 , y − η ≤ / 2 ⊂ K (ξ, η) ⊂ K .
Dem Teil (a) des Existenzbeweises 5.1 entnehmen wir die Aussage (∗).
Entsprechend schließen wir, dass α := inf A ∈ I. 2
6.2 Zur Anwendung

Sei u : I = [α, β] → Ê n
stetig, und
der δ–Schlauch
K := {(x, y) | x ∈ I, y − u(x) ≤ δ}
6' $
y
liege ganz in Ω. Läßt sich für die in
(ξ, η) ∈ K startende Lösung ϕ(x, ξ, η) K
zeigen, dass sie den Schlauchmantel u
nicht trifft, d.h.
η0 •
ϕ(x, ξ, η) − u(x) < δ •
für x ∈ I ∩ J(ξ, η), so folgt [α, β] ⊂

J(ξ, η). Denn nach 6.1 (c) verlassen die Ω
Punkte (x, ϕ(x, ξ, η)) für wachsendes & %
bzw. fallendes x ∈ J(ξ, η) die kom-
pakte Menge K. Da dies nicht durch -
den Schlauchmantel geschehen kann α ξ0 β x
( (x) := ϕ(x, ξ, η) − u(x) ist stetig),
müssen sie die Schlauchenden x = β,
x = α durchstoßen.
6.3 Anwendung auf autonome Systeme

Autonome Systeme haben nach 3.1 (c) die Form ẏ = g(y), wobei g in einem
Ê
Gebiet Ω ⊂ n stetig differenzierbar ist. Wir deuten hier im Hinblick auf die
Anwendungen die unabhängige Variable als Zeit und bezeichnen sie mit t.
Als Startzeitpunkt dürfen wir immer ξ = 0 wählen. Denn gilt
u̇(t) = g(u(t)) für t ∈ I und u(ξ) = η ,
so löst v(t) = u(t + ξ) im verschobenen Intervall I − ξ das AWP
v̇(t) = g(v(t)) , v(0) = η ,
und für jede Lösung v des letzteren AWP löst u(t) = v(t−ξ) das ursprüngliche.
Wir bezeichnen die maximale Lösung des AWP
ẏ(t) = g(y) , y(0) = η
mit t → ϕ(t, η), ihr Definitionsintervall mit J(η).
Der Fortsetzungssatz für autonome Systeme

(a) Bleibt ϕ(t, η), soweit definiert, für wachsendes t ≥ 0 in einer kompakten
Teilmenge K von Ω , so existiert ϕ(t, η) in aller Zukunft, das heißt, es gilt
Ê + ⊂ J(η).
(b) Bleibt ϕ(t, η) für fallendes t ≤ 0 in einer kompakten Teilmenge K von Ω ,

Ê
so existiert ϕ(t, η) in der vollen Vergangenheit, d.h. ≤0 ⊂ J(η).
(c) Sind beide Voraussetzungen erfüllt, so existiert ϕ(t, η) für alle Zeiten.
Beweis.
(a) Sei Ω = Ê×Ω
und f : Ω → Ê n
, (t, y) → g(y) .
Ê
Angenommen, ϕ(t, η) sei nicht für alle t ≥ 0 definiert, also J(η) ∩ + = [0, T [.
Dann bleiben die Punkte (t, ϕ(t, η)) für 0 ≤ t < T in der kompakten Teilmenge
K = [0, T ] × K von Ω, und nach 6.1 (a) ließe sich ϕ(x, η) auf ein Intervall
[0, T + δ[ fortsetzen im Widerspruch zur Wahl von T .
(b) ergibt sich analog; (c) folgt aus (a) und (b). 2
6.4 Die logistische Differentialgleichung

Vermehrt sich eine Population mit konstanter Wachstumsrate α > 0, d.h. gilt
für den Populationsstand u(t) zur Zeit t die DG
u̇(t) = α u(t) ,
so wächst die Population nach dem Exponentialgesetz u(t) = u(0) eαt . Ein sol-
ches Wachstum ist unrealistisch, denn mit wachsender Populationszahl gehen
irgendwann die Ressourcen zu Ende.
Das einfachste Modell einer von der

Population abhängigen Wachstumsrate y
liefert die DG 6
u̇ = β (K − u) u
mit Konstanten β, K > 0 (gedämpftes
Wachstum mit Sättigungsgrenze K).
Die Umskalierung

y(t) = 1
u t -
K βK t
führt auf die logistische DG
ẏ = y (1 − y)
Diese hat die konstanten Lösungen 0
und 1.
Startet eine Lösung mit einem von 0 oder 1 verschiedenen Anfangswert, so kann
diese wegen des Eindeutigkeitssatzes keinen dieser beiden Werte annehmen.
Für η ∈ ]0, 1[ bleibt also ϕ(t, η), soweit definiert, immer in [0, 1] (sogar in ]0, 1[).
Nach 6.3 existiert also ϕ(t, η) für alle Zeiten.
Für η > 1 bleibt aus den obengenannten Gründen ϕ(t, η) > 1, soweit definiert.
Also gilt ϕ̇(t, η) = ϕ(t, η)(1 − ϕ(t, η)) < 0, d.h. ϕ(t, η) fällt monoton und
bleibt für wachsendes t im Intervall ]1, η]. Somit existiert ϕ(t, η) nach 6.3 für
alle t ≥ 0. Entsprechend ergibt sich, dass ϕ(t, η) im Fall η < 0 für alle t ≤ 0
existiert.
Für 0 < η < 1 folgt aus der DG, dass ϕ(t, η) monoton wächst. Also existiert
c := limt→∞ ϕ(t, η).
Daraus folgt lim ϕ̇(t, η) = c(1 − c), andererseits muss dieser Limes Null sein.
t→∞
Damit ergibt sich lim ϕ(t, η) = 1 für alle η > 0.
t→∞
Betrachtungen dieser Art sind typisch für die qualitative Behandlung von Dif-
ferentialgleichungen, vgl. § 5
Aufgabe. Bestimmen Sie ϕ(t, η) und J(η) nach dem Verfahren Bd. 1, § 13 : 3.
Es ergibt sich für η > 1, dass ϕ(t, η) nicht in der vollen Vergangenheit existiert.
Für η < 0 existiert ϕ(t, η) nicht für alle t ≥ 0.
6.5 Beispiel
Wir betrachten für r = x2 + y 2 > 0 das System
x y
ẋ = − y + r (1 − r 2 ) , ẏ = x + r (1 − r 2 ) .
Eine leichte Rechung ÜA zeigt
1
ṙ = r (xẋ + y ẏ) = 1 − r 2 längs jeder Lösung t → (x(t), y(t)) .
Die DG ṙ = 1 − r 2 besitzt die konstante Lösung r = 1, und tatsächlich ist
t → u(t) := (cos t, sin t) eine Lösung des Ausgangssystems.
Jede mit 0 < r(0) < 1 startende Lösung v kann die Einheitskreislinie nicht
treffen: Aus v(t2 ) = u(t1 ) würde folgen v(t + t2 ) = u(t + t1 ) für alle t, vgl. 6.3.
Wegen ṙ > 0 existiert sie daher nach dem Fortsetzungssatz 6.3 mindestens für
t∈ + Ê
Aufgabe. (a) Zeigen Sie, dass auch die außerhalb des Einheitskreises star-
tenden Lösungen für alle t ≥ 0 existieren. (Beachten Sie: ṙ(t) < 0.)
(b) Zeigen Sie analog zu 6.4, dass lim r(t) = 1.
t→∞
6.6 Linear beschränkte Systeme

Ê Ê
Die rechte Seite f : I × n → n heißt linear beschränkt (von linearem
Wachstum), wenn I ein offenes Intervall ist und wenn es stetige Funktionen
Ê
a, b : I → + gibt mit

f (x, y) ≤ a(x)y + b(x)
für alle x ∈ I, y ∈ Ê.n
Für linear beschränkte Systeme gilt immer J(ξ, η) = I, d.h. die Lösung ist so
weit definiert, wie es die rechte Seite überhaupt zulässt.
Beweis.
Für u(x) = ϕ(x, ξ, η) gilt
x x

u(x) = η + f (t, u(t)) dt ≤ η + f (t, u(t)) dt
xξ
ξ

≤ η + (a(t)u(t) + b(t)) dt
ξ
x

≤ B(x) + A(x) u(t) dt
ξ
mit
x

B(x) = η + b(t) dt , A(x) = max a(t) | | t − ξ | ≤ | x − ξ | .
ξ
Sei [ξ, β] ein kompaktes Teilintervall von I. Wir zeigen [ξ, β] ⊂ J(ξ, η). Offenbar
ist
A(x) ≤ A(β) , B(x) ≤ B(β) für ξ ≤ x ≤ β .


Wir setzen C(β) := B(β) exp A(β) (β − ξ) . Aus
x

u(x) ≤ B(β) + A(β) u(t) dt für x ∈ [ξ, β] ∩ J(ξ, η)
ξ
folgt nach dem Gronwallschen Lemma mit ε0 = B(β), L = A(β), dass

u(x) ≤ C(β) für x ∈ [ξ, β] ∩ J(ξ, η) .
Angenommen, β ∈ J(ξ, η). Dann bleiben die Punkte (x, u(x)) für alle x ∈
J(ξ, η) mit x ≥ ξ in der kompakten Menge
K := {(x, y) | ξ ≤ x ≤ β , y ≤ C(β)} .
Nach dem Fortsetzungssatz 6.1 (a) ließe sich dann die Lösung über das rechte
Intervallende von J(ξ, η) hinaus fortsetzen, ein Widerspruch. Somit liegt jedes
kompakte Teilintervall [ξ, β] von I in J(ξ, η). Es folgt I = J(ξ, η). Entspre-
chend ergibt sich, dass jedes kompakte Teilintervall [α, ξ] von I zu J(ξ, η) gehört
ÜA . 2
Beispiel. Jede maximale Lösung der inhomogenen Pendelgleichung

ÿ(t) + sin y(t) = f (t)
Ê
mit f ∈ C( ) existiert für alle Zeiten ÜA .
6.7 Lineare Systeme y = A(x)y + b(x)

(a) Nach 3.2 (b) ist die rechte Seite linear beschränkt. Sind also die Kompo-
nentenfunktionen von A, b auf einem Intervall I stetig, so sind die maximalen
Lösungen jeweils auf ganz I erklärt. Dies gilt auch für abgeschlossene Intervalle
I, die wir bei linearen Systemen zulassen. Um diese in die bisher entwickelte
Theorie einzuordnen, brauchen wir die Koeffizientenfunktionen nur stetig auf
ein I umfassendes offenes Intervall fortzusetzen.
(b) Die Lösungsvektoren y : I → Ê n
der homogenen Gleichung bilden einen
Vektorraum der Dimension n über Ê.
Beweis.
Ê Ê
Für y ∈ C1 (I, n ) sei Ly = y − Ay. Dann ist L : C1 (I, n ) → C(I, n ) eine Ê
lineare Abbildung, also ist L0 = Kern L ein Vektorraum. Für festes ξ ∈ I ist
die Abbildung
T : L0 → Ê n
, u → u(ξ)
ebenfalls linear. Nach dem Existenz– und Eindeutigkeitssatz und nach (a) gibt
Ê
es zu jedem η ∈ n genau ein u ∈ L0 mit u(ξ) = η. Also ist T : L0 → n Ê
bijektiv und damit dim L0 = n. 2
(c) Ein System von n linear unabhängigen Lösungen y1 , . . . , yn ∈ L0 heißt

Fundamentalsystem oder Lösungsbasis für die DG y = A(x)y.
Ein spezielles Fundamentalsystem ist gegeben durch
yk (x) = ϕ(x, ξ, ek ) (k = 1, . . . , n) ,
wo ξ ein fester Punkt in I ist, ek die kanonischen Basisvektoren des Ên

und
x → ϕ(x, ξ, ek ) die maximale Lösung des AWP
y = A(x)y , y(ξ) = ek .
Die Matrix Y (x, ξ) mit den Spalten y1 (x), . . . , yn (x) wird die kanonische Fun-
damentalmatrix an der Stelle ξ genannt. Offenbar gilt

n
ϕ(x, ξ, η) = Y (x, ξ)η = ηk yk (x) .
k=1
(d) Weiteres zu linearen Systemen finden Sie in § 3 : 1.
7 Differenzierbarkeitseigenschaften von Lösungen

7.1 Differenzierbarkeit der Lösung nach den Anfangswerten
Wir betrachten das Anfangswertproblem
y = f (x, y) , y(ξ) = η
unter der Standardvoraussetzung, dass f und Dy f stetig im Gebiet Ω ⊂ n+1 Ê

sind. Die maximale Lösung bezeichnen wir wieder mit x → ϕ(x, ξ, η), ihr Defi-
nitionsintervall mit J(ξ, η). Als Funktion sämtlicher Variabler besitzt ϕ(x, ξ, η)
den Definitionsbereich

Ωf := (x, ξ, η) | (ξ, η) ∈ Ω , x ∈ J(ξ, η) ⊂ Ê n+2
.
Satz. (a) Ωf ist ein Gebiet.

(b) ϕ ist dort C1 –differenzierbar nach allen Variablen x, ξ, η.
(c) Die partiellen Ableitungen von ϕ nach den Anfangsdaten
∂ϕ ∂ϕ
v(x) := (x, ξ, η) , wk (x) := (x, ξ, η) für k = 1, . . . , n
∂ξ ∂ηk
erfüllen die lineare homogene Differentialgleichung
(L) y = A(x) y mit A(x) := Dy f (x, ϕ(x, ξ, η))
und besitzen die Anfangswerte
v(ξ) = − f (ξ, η) , wk (ξ) = ek für k = 1, . . . , n .

7 Differenzierbarkeitseigenschaften von Lösungen 45
(d) Sind f und Dy f nach allen Variablen Ck –differenzierbar, so ist ϕ nach

allen Variablen Ck+1 –differenzierbar. Ist insbesondere f nach allen Variablen
C∞ –differenzierbar, so auch ϕ.
Bemerkungen. (i) Der langwierige Beweis wird im Anschluß an die Formu-

lierung der Sätze 7.2 und 7.3 in drei Schritten geführt:
– In 7.4 : Gebietseigenschaft von Ωf und Stetigkeit von ϕ. Der hierbei anfallende
Satz über die Kontrolle der Lösungen ist von eigenem Interesse.
– In 7.6 : C1 –Differenzierbarkeit von ϕ und Bestehen der Variationsgleichung
(L).
– In 7.7 : Beweis von (d).
(ii) Die lokale Existenz von Lösungen einschließlich ihrer differenzierbaren bzw.
analytischen Abhängigkeit lässt sich auch mit Hilfe des Satzes über impliziten
Funktionen auf Banachräumen zeigen, siehe Chow–Hale [27] III, § 1, Zeidler
[73] Vol.1, Thm.4.D.
7.2 Differenzierbare Abhängigkeit der Lösung von Parametern

Wir nehmen an, dass die rechte Seite der DG von Parametern λ1 , . . . , λm ab-
hängt, die wir zu einem Vektor λ = (λ1 , . . . , λm ) zusammenfassen. f (x, y, λ) sei
Ê
stetig in einem Gebiet Ω ⊂ n+m+1 und besitze dort stetige partielle Ableitun-
gen ∂f /∂yk , ∂f /∂λj . Die maximale Lösung des AWP
y = f (x, y, λ) , y(ξ) = η
bezeichnen wir mit x → ϕ(x, ξ, η, λ), ihr Definitionsintervall mit J(x, η, λ).

Satz. (a) Ωf := (x, ξ, η, λ) ∈ Ên+m+2 (x, η, λ) ∈ Ω , x ∈ J(x, η, λ) ist
ein Gebiet, und
(b) ϕ(x, ξ, η, λ) ist dort C1 –differenzierbar nach allen Variablen.
(c) Hängen f , Dy f und Dλ f in Ck –differenzierbarer Weise von allen Variablen
ab, so ist ϕ(x, ξ, η, λ) sogar Ck+1 –differenzierbar.
Das ergibt sich unmittelbar aus 7.1, wenn wir das erweiterte AWP

y = f (x, y, z) , y(ξ) = η ,

z = 0, z(ξ) = λ
betrachten. (u(x), v(x)) ist genau dann Lösung dieses Problems, wenn u das
Originalproblem löst und v(x) der konstante Vektor λ ist.
7.3 Analytische Lösungen linearer Differentialgleichungen

Lineare Differentialgleichungen
u + f (x) u + g(x) u = h(x)
mit analytischen Koeffizienten f, g, h treten bei Separationsansätzen für partielle

Differentialgleichungen auf; diese werden in § 3 : 3 ausführlich behandelt. Der
Beweis des folgenden Satzes wird in 7.8 geführt.
Satz. Besitzen die Funktionen f, g, h für | x − x0 | < r konvergente Potenzrei-

henentwicklungen, so lässt sich jede Lösung u der obengenannten Gleichung in
eine für | x − x0 | < r konvergente Potenzreihe entwickeln.
7.4 Zur stetigen Abhängigkeit der Lösung von den Anfangswerten

Als ersten Beweisschritt für 7.1 zeigen wir unter den Standardvoraussetzungen:
(a) Ωf ist ein Gebiet.
(b) ϕ ist stetig in Ωf .
Kernstück des Beweises ist die Kontrollierbarkeit im Kleinen:
(c) Gegeben seien ein Anfangspunkt (ξ0 , η 0 ) ∈ Ω und ein kompaktes Teilintervall
I von J(ξ0 , η 0 ) mit ξ0 ∈ I. Dann gibt es Zahlen r, R, κ > 0, so dass für alle
Anfangspunkte (ξ, η) mit | ξ − ξ0 | < r, η − η 0 < R Folgendes gilt:
I ⊂ J(ξ, η) ,

ϕ(x, ξ, η) − ϕ(x, ξ0 , η 0 ) ≤ κ | ξ − ξ0 | + η − η 0 für x ∈ I .
Bemerkung. Dass auf nicht kompak-

ten Intervallen i.A. keine Kontrollier-
barkeit der Lösung gegeben ist, zeigt y
das Beispiel der DG y = y . Hier ist 6' $
ϕ(x, ξ, η) = η ex−ξ . K
Die beiden Lösungen ϕ(x, 0, 0) = 0 u

und ϕ(x, ξ, η) mit η = 0 entfernen sich η0 •
•
für x → ∞ beliebig weit voneinander,
ganz gleich, wie nahe (ξ, η) bei (0, 0)
liegt. Ω
Beweis. & %
Wir beginnen mit (c). Sei I = [α, β]
und u(x) = ϕ(x, ξ0 , η 0 ). Da J(ξ0 , η 0 ) -
α ξ0 β x
offen ist, gibt es ein δ > 0 mit
J := [α − δ, β + δ] ⊂ J(ξ0 , η 0 ) .
(1) Nach 3.2 (d) gibt es ein 0 > 0, so dass der 0 –Schlauch um u über dem
Intervall J ganz in Ω liegt:

K := (x, y) | x ∈ J , y − u(x) ≤ 0 ⊂ Ω,
und es gibt Zahlen L, M > 0 mit
f ∈ Lip (K, L) , f (x, y) ≤ M für (x, y) ∈ K .

R
(2) Wir setzen γ := β − α + 2δ, R := 1
2 0 e−L γ und r := min M
, δ . Sei
◦
jetzt | ξ − ξ0 | < r und η − η 0 < R. Dann ist ξ ∈ J , η − η 0 < 1
2 0 und
ε0 := η − η 0 + M | ξ − ξ0 | < 0 .
(3) Für (x) := ϕ(x, ξ, η) − u(x) folgt aus der Fixpunktgleichung für u
(ξ) = η − u(ξ) ≤ η − η 0 + M | ξ − ξ0 | = ε0 < 0 ,

◦
also (ξ, η) = (ξ, ϕ(x, ξ, η)) ∈ K .
(4) Solange die Punkte (x, ϕ(x, ξ, η)) in K verbleiben, ergibt das Prinzip der
Fehlerkontrolle 4.1 (mit ε1 = 0, ε0 wie oben)
x
(x) ≤ ε0 + L (x) dt ,
ξ
also nach dem Gronwall–Lemma 4.2 wegen | x − ξ | < γ für x ∈ J
(x) ≤ ε0 eL |x−ξ| < ε0 eL γ < (R + M r) eL γ < 2R eL γ < 0 .
Das heißt aber: Entfernt sich x von ξ, so können die Punkte (x, ϕ(x, ξ, η))
die Mantelfläche von K nicht treffen. Nach dem Fortsetzungsprinzip 6.2 folgt
J(ξ, η) ⊃ J ⊃ I.
Der Rest von (c) folgt aus (x) < ε0 eL γ mit ε0 = η − η 0 + M | ξ − ξ0 |.
(5) Ωf ist offen, und ϕ ist dort stetig. Sei (x0 , ξ0 , η 0 ) ∈ Ωf . Wir wählen ein
kompaktes Intervall I = [α, β] ⊂ J(ξ0 , η 0 ) mit x0 , ξ0 ∈ I und dazu δ, r, R, κ
wie oben. Für | x − x0 | < r, | ξ − ξ0 | < r und η − η 0 < R ist zunächst
◦
(ξ, η) ∈ K ⊂ Ω nach (3) und x ∈ J ⊂ J(ξ, η) nach (4); somit ist (x, ξ, η) ∈ Ωf .
Ferner gilt
ϕ(x, ξ, η) − ϕ(x0 , ξ0 , η 0 ) ≤ ϕ(x, ξ, η) − u(x) + u(x) − u(x0 )

≤ ε0 eL γ + M | x − x0 | = M | x − x0 | + eL γ M | ξ − ξ0 | + η − η 0 .
(6) Ωf ist wegzusammenhängend . Für (x, ξ, η) ∈ Ωf gilt x, ξ ∈ J(ξ, η) , also

liegt die Verbindungsstrecke zwischen (x, ξ, η) und (ξ, ξ, η) in Ωf .

Ist t → u(t), v(t) ein Weg, der die Punkte (ξ, η), (ξ1 , η 1 ) in Ω verbindet,

so liefert t → u(t), u(t), v(t) einen Verbindungsweg in Ωf von (ξ, ξ, η) nach
(ξ1 , ξ1 , η 1 ). 2
(d) Zusatz. (Bezeichnungen wie in (c)). Für alle (ξ, η) mit | ξ − ξ0 | ≤ r

2
,
η − η 0 ≤ R
2
und alle (k, h) mit | k | ≤ r2 und h ≤ R
2
gilt
J(ξ + k, η + h) ⊃ J ⊃ I
und

ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η) ≤ κ | k | + h für x ∈ J.
Ersteres folgt aus (c) wegen η + h − η 0 < R, | ξ + k − ξ0 | < r. Für die zwei-
te Behauptung betrachten wir w(x) = ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η). Dann
ergibt sich wie in (3)
w(ξ) = ϕ(ξ, ξ + k, η + h) − η = ϕ(ξ, ξ + k, η + h) − (η + h) + h
= ϕ(ξ, ξ + k, η + h) − ϕ(ξ + k, ξ + k, η + h) + h
≤ M |k| + h < 1

2 0
und nach 4.1 und 4.2 ( ÜA )
w(x) ≤ (h + M | k |) eL |x−ξ| ≤ (h + M | k |) eL δ .
7.5 Die Variationsgleichung

(a) Zu gegebener Lösung x → u(x) von y = f (x, y) heißt die homogene
lineare DG
y = A(x) y mit der Matrix A(x) := Dy f (x, u(x))
die linearisierte Differentialgleichung (Linearisierung, Variationsglei-

chung) der gegebenen Differentialgleichung längs der Lösung u.
Diese kommt in natürlicher Weise ins Spiel, wenn sich zwei Lösungen u und v
von y = f (x, y) nur wenig unterscheiden. Denn dann gilt nach dem Mittel-
wertsatz für y := v − u

n
yi (x) = fi (x, v(x)) − fi (x, u(x)) ≈ aik (x) yk (x).
k=1
(b) Existieren die partiellen Ableitungen
∂ϕ ∂ϕ
v(x) := (x, ξ, η) , wk (x) := (x, ξ, η) (k = 1, . . . , n)
∂ξ ∂ηk
in Ωf und sind diese dort stetig, so erfüllen sie die Variationsgleichung längs
x → ϕ(x, ξ, η) mit den Anfangsbedingungen
v(ξ) = − f (ξ, η) ,
wk (ξ) = ek (k = 1, . . . , n) .
Denn aus der Fixpunktgleichung

x
ϕ(x, ξ, η) = η + f (t, ϕ(t, ξ, η)) dt
ξ
folgt nach dem Satz über Parameterintegrale und der Kettenregel ÜA
∂ϕ x ∂ϕ
(x, ξ, η) = ek + Dy f (t, ϕ(t, ξ, η)) (t, ξ, η) dt
∂ηk ξ
∂ηk
und
∂ϕ x ∂ϕ
(x, ξ, η) = − f (x, ϕ(x, ξ, η)) + Dy f (t, ϕ(t, ξ, η) (t, ξ, η) dt .
∂ξ ξ
∂ξ
7.6 Beweis der C1 –Differenzierbarkeit von ϕ

(a) Zum Vorgehen. Falls die partiellen Ableitungen ∂ϕ/∂ξ, ∂ϕ/∂η k existieren
und stetig sind, genügen sie nach 7.5 der linearisierten DG
y = Dy f (x, ξ, η) y .
Bezeichnen wir die zugehörige kanonische Fundamentalmatrix mit Y (x, ξ, η)

(vgl. 6.7), so muss nach 7.5 gelten
∂ϕ ∂ϕ
(x, ξ, η) = Y (x, ξ, η)ek , (x, ξ, η) = − Y (x, ξ, η) f (ξ, η) .
∂ηk ∂ξ
Wir haben also für einen festen Anfangspunkt (ξ, η) zu zeigen, dass
ϕ(x, ξ, η + h) − ϕ(x, ξ, η) − Y (x, ξ, η) h = r(x, h) ,
ϕ(x, ξ + k, η) − ϕ(x, ξ, η) + Y (x, ξ, η) f (ξ, η) = s(x, k)

mit
r(x, h) s(x, k)
lim = 0, lim = 0.
h →0 h k→0 |k |
Lässt sich noch zeigen, dass die Limites gleichmäßig in einem noch zu präzi-
sierenden Sinn existieren, so sind die partiellen Ableitungen von ϕ stetig.
(b) Festlegung eines Arbeitsbereichs K. Sei (x0 , ξ0 , η 0 ) ∈ Ωf gegeben. Wie im

Beweis 7.4 wählen wir ein kompaktes Intervall J ⊃ J(ξ0 , η 0 ) der Länge γ, in
welchem x0 und ξ0 innere Punkte sind und Konstante 0 , L, M > 0 mit

K := (x, y) x ∈ J , y − ϕ(x, ξ0 , η 0 ) ≤ 0 ⊂Ω
und
f (x, y) ≤ M , Dy f (x, y) z ≤ L z , also f ∈ Lip (K, L) .
Nach dem Zusatz zu 7.4 gibt es Zahlen r, R, κ > 0 folgender Art:

Für | ξ − ξ0 | ≤ 2r und η − η 0 < R
2
sowie | k | ≤ r2 , h < R
2
gilt
J ⊂ J(ξ + k, η + h) ,
für x ∈ J liegen die Punkte (x, ϕ(x, ξ + k, η + h)) in K,

ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η) ≤ κ | k | + h .
(c) Abschätzung von R(x, y, z) := f (x, z) − f (x, y) − Dy f (x, y)(z − y).

Wir zeigen, dass es zu jedem ε > 0 ein δ > 0 gibt mit
R(x, y, z) < ε z − y für alle (x, y), (x, z) ∈ K mit z − y < δ .
Denn nach dem Mittelwertsatz für die k–te Komponente Rk von R gibt es zu
je zwei Punkten (x, y), (x, z) ∈ K ein ϑ ∈ ]0, 1[ mit
Rk (x, y, z) = fk (x, z) − fk (x, y) − ∇fk (x, y) , z − y
= ∇fk (x, y + ϑ(z − y) − ∇fk (x, y) , z − y .
Wegen der gleichmäßigen Stetigkeit von ∇fk auf K gibt es zu jedem ε > 0 ein
δ ∈ ]0, 0 [, so dass für (x, w), (x, y) ∈ K mit w − y < δ

∇fk (x, w) − ∇fk (x, y) ≤ √ε (k = 1, . . . , n) .
n
Nach Cauchy–Schwarz folgt | Rk (x, y, z) | ≤ √εn z − y für (x, y), (x, z) ∈ K

mit z − y < δ und daraus die Behauptung für R.
(d) Differenzierbarkeit von ϕ bezüglich η.

Sei (ξ, η) ein fester Punkt mit | ξ − ξ0 | < 1
2
r , η − η 0 < 1
2
R, ferner sei
| k | < 12 r , h < 12 R und x ∈ J.
Wir verwenden folgende Abkürzungen:
x
(1) u(x) := ϕ(x, ξ, η) , also u(x) = η + f (t, u(t)) dt ,
ξ
x
(2) v(x) := ϕ(x, ξ, η + h) , also v(x) = η + h + f (t, v(t)) dt ,
ξ
(3) A(x) := Dy f (x, u(x)) ,
(4) Y (x) := Fundamentalmatrix für y = A(x) y bezüglich der Stelle ξ,

x
(5) w(x) := Y (x) h , also w(x) = h + A(t) w(t) dt ,
ξ
(6) r(x, h) := v(x) − u(x) − w(x) , vgl. (a).
Nach dem in (a) beschriebenen Programm gilt es, zu ε > 0 ein Δ > 0 und eine
Konstante C zu finden mit r(x, h) < ε C h, sobald h < Δ < 12 R. Nun ist
mit den Bezeichnungen (c) und wegen der Darstellungen (1), (2), (5)
x
r(x, h) = f (t, v(t)) − f (t, u(t)) − A(t) w(t) dt
ξ
x x
= R(t, u(t), v(t)) dt + A(t) r(t, h) dt .
ξ ξ
Gemäß (c) gibt es zu gegebenem ε > 0 ein δ > 0 mit
R(x, y, z) < εy − z für y − z < δ .

1
Setzen wir Δ := min 2
R, δ/κ , so folgt für h < Δ zunächst nach (b)
v(t) − u(t) < κh < δ
und dann nach (c)
R(t, u(t), v(t)) < εκh ,

also
x
r(x, h) ≤ ε κ γ h + A(t)2 r(t, h) dt
ξ
x
≤ εκγ h + L r(t, h) dt .
ξ
Mit dem Gronwall–Lemma 4.2 folgt schließlich
r(x, h) < εκγ h eLγ =: ε C h für h < Δ .
∂ϕ
(e) Stetigkeit von ∂ηj
. Die zuletzt gegebene Abschätzung gilt für alle (x, ξ, η)
mit | x − x0 | < 1
2
r, | ξ − ξ0 | < 12 r, η − η 0 < 12 R gleichmäßig. Setzen wir
1
f m (x, ξ, η) := m ϕ(x, ξ, η + 1
m
ej ) − ϕ(x, ξ, η) für m < Δ,
so sind die f m im genannten Gebiet stetig und konvergieren dort gleichmäßig
gegen Dy f (x, ξ, η) ej , was die Stetigkeit dieses Limes in genannten Bereich zur
Folge hat.
(f) Die C1 –Differenzierbarkeit von ϕ bezüglich ξ ergibt sich analog. Für festes
(ξ, η) aus dem obengenannten Bereich setzen wir diesmal
x
v(x) := ϕ(x, ξ + k, η) = η + f (t, v(t)) dt ,
ξ+k
x
w(x) := − k Y (x) f (ξ, η) = −k f (ξ, η) + A(t) w(t) dt
ξ
und wollen jetzt für s(x, k) := v(x) − u(x) − w(x) zeigen, dass es zu gegebenem
ε > 0 ein δ > 0 und Konstanten C1 , C2 gibt mit
(∗) s(x, k) ≤ (C1 ε + C2 k) k für |x − ξ| < δ.
Wir wählen dabei δ > 0 gleich so klein, dass
(∗∗) f (ξ, η) − f (t, η) < ε für |t − ξ| < δ.

Wir erhalten (∗) durch Abschätzung von
x x x
s(x, k) = f (t, v(t)) dt − f (t, u(t)) dt + k f (ξ, η) − A(t) w(t) dt
ξ+k ξ ξ
x x
ξ+k
= R(t, u(t), v(t)) dt + A(t) s(t, k) dt + (f (ξ, η) − f (t, v(t))) dt .
ξ ξ ξ
Die beiden ersten Integrale schätzen wir wie in (d) ab, für das dritte beachten
wir, dass
f (ξ, η) − f (t, v(t)) ≤ f (ξ, η) − f (t, η) + L η − v(t)
(∗∗)
< ε + u(ξ) − u(t) + u(t) − v(t)
≤ ε + L (M + κ) k .
(Detaillierte Ausführung als ÜA .) Die Stetigkeit von ∂ϕ/∂ξ ergibt sich wie in
(e). 2
7.7 Beweis des Satzes über Ck+1 –Differenzierbarkeit von ϕ

Sind f und Dy f Ck –differenzierbar im Gebiet Ω, so ist ϕ nach allen Variablen
Ck+1 –differenzierbar in Ωf . Wir zeigen dies durch Induktion, wobei wie üblich
C0 –Differenzierbarkeit einfach Stetigkeit bedeutet. Für k = 0 ist also die Be-
hauptung richtig nach 7.6. Angenommen, die Behauptung ist für k ≥ 1 schon
richtig, und f , Dy f seien Ck+1 –differenzierbar. Wir betrachten das System
y = f (x, y) , y(ξ) = η ,
z = Dy f (x, y) z , z(ξ) = ζ ,

Ê
wobei F(x, y, z) := f (x, y) , Dy f (x, y) z auf Ω × n Ck –differenzierbar ist.
Die Lösung bezeichnen wir mit x → Φ(x, ξ, η, ζ) ; sie ist nach Induktionsvor-
aussetzung Ck+1 –differenzierbar in allen Variablen. Nach 7.1 ist aber
∂ϕ
Φ(x, ξ, η, ei ) = ϕ(x, ξ, η), ∂ηi
(x, ξ, η) für i = 1, . . . , n,
ϕ
Φ(x, ξ, η, −f (ξ, η)) = ϕ(x, ξ, η), ∂∂ξ (x, ξ, η) .
Also sind ∂ϕ/∂ξ und ∂ϕ/∂ηi (i = 1, . . . , n) nach allen Variablen Ck+1 –

∂ϕ
differenzierbar; dasselbe gilt für ∂x
(x, ξ, η)= f (x, ϕ(x, ξ, η)) . 2
7.8 Beweis von 7.3

Wir betrachten die DG zweiter Ordnung u + f (x) u + g(x) u = h(x) , wobei
o.B.d.A. f, g, h in ]−r, r[ konvergente Potenzreihenentwicklungen

∞
∞
∞
f (x) = αk xk , g(x) = βk xk , h(x) = γk xk ,
k=0 k=0 k=0
besitzen. Diese DG wandeln wir in ein System y = A(x) y + b(x) um mit

u(x) 0 1 0
y(x) = , A(x) = , b(x) = .
u (x) −g(x) −f (x) h(x)
(a) Nach Bd. 1, § 10 : 2.2 konvergieren die Potenzreihen

∞
∞
∞
f (z) = αk z k , g(z) = βk z k , h(z) = γk z k
k=0 k=0 k=0
für alle z ∈ mit | z | < r und stellen dort holomorphe Funktionen dar (Bd. 1,
§ 27). Mit diesen Funktionen bilden wir A(z), b(z).
(b) Das komplexe Kurvenintegral einer für | z | < r holomorphen Funktion v

ist wegunabhängig, da die Kreisscheibe Kr (0) ein einfaches Gebiet ist (Bd. 1,
§ 27 : 2.2). Nach Bd. 1, § 27 : 2.6 liefert daher
z 1
V (z) = v(w) dw = z v(tz) dt
0 0
(Integration längs der Strecke von 0 nach z) eine holomorphe Stammfunktion

V für v.
(c) Statt der Picard–Iterierten für das AWP

η1
y = A(x) y + b(x) , y(0) = η := η2
,
d.h. statt
x
u0 (x) = η , un+1 (x) = η + A(t) un (t) + b(t) dt
0
betrachten wir jetzt die mit v0 (z) = η beginnende Iterationsfolge

1
vn+1 (z) = η + z A(tz) vn (tz) dt + b(tz) dt
0
mit komplexen Argumenten z. Offenbar gilt

vn (x) = un (x) für − r < x < r.
Nach (b) ergibt sich durch Induktion, dass die Komponenten der vn holomorph
sind für | z | < r. Wir zeigen in (d), dass die Komponenten der vn auf jeder kom-
pakten Teilmenge K von Kr (0) gleichmäßig konvergieren. Nach Bd. 1, § 27 : 7.2
sind dann die Komponenten u(z), v(z) von v(z) = lim vn (z) holomorph für
n→∞
| z | < r, insbesondere besitzt dann u eine Potenzreihenentwicklung

∞
u(z) = ak z k für | z | < r
k=0
(Bd. 1, § 27 : 5.3). Für −r < x < r löst aber u(x) nach 5.1 das AWP
u + f (x) u + g(x) u = h(x) , u(0) = η1 , u (0) = η2 .
Es bleibt also nur noch zu zeigen:

(d) Die vn konvergieren gleichmäßig in jeder kompakten Teilmenge K von
Kr (0). Denn K liegt in einer kompakten Kreisscheibe | z | ≤ mit 0 < < r.
Setzen wir

L := max A(z)2 | z | ≤ , M := max v1 (z) − η | z | ≤ ,
so erhalten wir wie im Beweis von 5.1 die Abschätzung

(L )n
vn+1 (z) − vn (z) ≤ M für | z | ≤ .
n!
Daraus folgt wie dort die komponentenweise gleichmäßige Konvergenz von

n−1
vn (z) = η + vk+1 (z) − vk (z) . 2
k=0
55
§ 3 Allgemeine lineare Theorie
1 Lineare Systeme
1.1 Die Struktur des Lösungsraums
Lb bezeichne die Gesamtheit der maximalen Lösungen des linearen Systems
y = A(x) y + b(x) ,
bei dem die Koeffizienten aij (x) der n × n–Matrix A(x) und die Komponenten
bk (x) von b(x) in einem Intervall I stetig seien. Nach § 2 : 6.7 sind die maximalen
Lösungen auf ganz I definiert. (I braucht nicht offen zu sein.)
Satz. (a) Die Lösungsmenge L0 des homogenen Systems
y = A(x) y
Ê
ist ein n–dimensionaler Teilraum von C1 (I, n). Jede Basis von L0 wird ein
Fundamentalsystem genannt. Lösungen u1 , . . . , un von y = A(x) y bilden
genau dann ein Fundamentalsystem, d.h. sind als Vektorfunktionen linear un-
abhängig, wenn für ein beliebiges ξ ∈ I die Vektoren u1 (ξ), . . . , un (ξ) des n Ê
linear unabhängig sind.
(b) Die Lösungsmenge Lb des inhomogenen Systems
y = A(x) y + b(x)
ist ein affiner Teilraum von C1 (I, Ê n
): Ist v eine spezielle (partikuläre) Lösung
des inhomogenen Systems, so gilt
Lb = v + L0 := {v + u | u ∈ L0 } .
Beweis.
Ê
(a) Die Abbildung T : L0 → n, u → u(ξ) ist linear und nach dem Existenz–
und Eindeutigkeitssatz bijektiv. Daher werden durch T und T −1 jeweils Basen
auf Basen abgebildet.
Ê Ê
(b) Die Abbildung L : C1 (I, n ) → C(I, n ), y → y − A y ist linear. Daher
folgt die Behauptung aus der Theorie linearer Gleichungen, wenn noch berück-
sichtigt wird, dass die Gleichung Ly = b nach § 2 : 6.7 (a) eine auf ganz I
definierte Lösung hat. 2
1.2 Fundamentalmatrizen und Lösungsdarstellung für die homogene

Gleichung
(a) Für jedes Fundamentalsystem (u1 , . . . , un ) nennen wir die Matrix U (x)
mit den Spalten u1 (x), . . . , un (x) die zugehörige Fundamentalmatrix.
(b) Die Matrix Y (x, ξ) mit den Spalten ϕ(x, ξ, e1 ), . . . , ϕ(x, ξ, en ) nennen wir
die kanonische Fundamentalmatrix an der Stelle ξ ∈ I.
56 § 3 Allgemeine lineare Theorie
(c) Die Lösung des AWP

y = A(x) y , y(ξ) = η
ist gegeben durch
y(x) = Y (x, ξ) η .
(d) Jede andere Fundamentalmatrix ist von der Form U (x) = Y (x, ξ) C, wobei
C = U (ξ) invertierbar ist. Also gilt für die Lösung y des AWP (c)
y(x) = U (x) U (ξ)−1 η .
Beweis.
(c) ergibt sich aus Y (x, ξ) η = η1 ϕ(x, ξ, e1 ) + . . . + ηn ϕ(x, ξ, en ).
(d) U (x) habe die Spalten u1 (x), . . . , un (x). Nach 1.1 (a) ist U (ξ) invertierbar.
Sei U (ξ)−1 ek = a = (a1 , . . . , an ). Dann ist die k–te Spalte von U (x) U (ξ)−1 ,
U (x) U (ξ)−1 ek = a1 u1 (x) + . . . + an un (x) ,
eine Lösung des homogenen Systems. Diese nimmt für x = ξ den Wert ek an.
Somit ist U (x) U (ξ)−1 ek = ϕ(x, ξ, ek ). 2
1.3 Wronski–Determinante und Fundamentalsysteme

(a) Für Lösungen y1 , . . . , yn von y = A(x) y heißt

W (x) := det y1 (x), . . . , yn (x)
die Wronski–Determinante.
(b) Die Wronski–Determinante genügt der DG W (x) = (Spur A(x)) W (x).
Nach Band 1, §13 : 1.2 gilt daher
x
W (x) = W (ξ) exp (a11 (t) + . . . + ann (t)) dt f ür x, ξ ∈ Ê.
ξ
(c) y1 , . . . , yn bilden genau dann ein Fundamentalsystem, wenn W (ξ) = 0 für

wenigstens ein ξ ∈ I. Nach (b) ist das äquivalent mit W (x) = 0 für alle x ∈ I.
Beweis.
(b) Es gilt

n
W (x) = Wk (x) ,
k=1
wobei Wk (x) aus W (x) durch Differentiation der k–ten Zeile entsteht. Für n = 2
folgt das mit der Produktregel. Der Schluss von n auf n + 1 geschieht durch
1 Lineare Systeme 57
Entwicklung nach der ersten Zeile ÜA . Bezeichnen wir die i–te Komponente
von yk (x) mit yik (x), so folgt aus der DG (wir lassen die Argumente fort)

a11 y11 + . . . + a1n yn1 ... a11 y1n + . . . + a1n ynn

y21 ... y2n
W1 = .. .. .

. .
y ... ynn
n1
Wir multiplizieren für k = 2, . . . , n die k–te Zeile mit a1k und subtrahieren sie
von der ersten. Da W1 sich hierbei nicht ändert, erhalten wir

a11 y11 ... a11 y1n

y21 ... y2n
W1 = . .. = a11 W .
.. .
y ... ynn
n1
Die Beziehung Wk = akk W ergibt sich ganz analog.

(c) folgt aus 1.1 (a) oder aus (b). 2
1.4 Die inhomogene Gleichung y = A(x)y + b(x)

Für die vollständige Lösung dieses Systems stehen nach 1.1 zwei Aufgaben an:
Bestimmung des Lösungsraums L0 des homogenen Systems und einer speziellen
Lösung v des inhomogenen. Für beide reicht es, eine Fundamentalmatrix U (x)
zu kennen. Nach 1.2 (d) hat jede Lösung des homogenen Systems die Form
u(x) = U (x)c. Für v machen wir den Ansatz
v(x) = U (x)c(x)
Ê
mit einer C1 –Funktion c : I → n (Variation der Konstanten, vgl. Bd. 1,
§ 13 : 1.3). Eine leichte Rechnung zeigt: Genau dann liefert dieser Ansatz eine
Lösung, wenn U (x) c (x) = b(x). Daher ist durch die Formel
x
v(x) := U (x) U (t)−1 b(t) dt
ξ
eine Lösung des inhomogenen Systems mit v(ξ) = 0 gegeben. Da diese eindeu-
tig bestimmt ist, hat die rechte Seite dieser Formel für jede Fundamentalma-
trix denselben Wert. Insbesondere gilt für die kanonische Fundamentalmatrix
Y (x, ξ) von 1.2 (b)
x x
v(x) = Y (x, ξ) Y (t, ξ)−1 b(t) dt = Y (x, ξ)Y (t, ξ)−1 b(t) dt .
ξ ξ
Zusammen mit 1.2 (c) erhalten wir den

Satz. Die Lösung u des AWP

y = A(x) y + b(x) , y(ξ) = η
ist gegeben durch
x
u(x) = U (x) U −1 (ξ) η + U −1 (t) b(t) dt
ξ
mit einer beliebigen Fundamentalmatrix U (x), insbesondere mit der kanoni-

schen Fundamentalmatrix Y (x, ξ).
1.5 Homogene Systeme mit konstanten Koeffizienten, die Matrix etA

Hat die n×n–Matrix A konstante Koeffizienten, so ist das zugehörige homogene
System autonom. Wie in § 2 : 6.3 vereinbart, bezeichnen wir die unabhängige
Variable mit t statt x. Es genügt, das AWP
ẏ = A y , y(0) = η
zu lösen. Die Lösung t → ϕ(t, η) existiert nach 1.1 für alle Zeiten t. Das
Iterationsverfahren § 2 : 5.1 von Picard–Lindelöf liefert für die Iterierten ÜA

n
tk
un (t) = k!
Ak η .
k=0
Aus dem Beweis § 2 : 5.1 ergibt sich ϕ(t, η) − un (t) → 0 gleichmäßig auf
jedem kompakten Intervall I = [−δ, δ] . Dies folgt, wie ein kurzer Blick zeigt,
wenn wir im dortigen Beweisteil (c) L := A2 und R := max{u1 (x) − η |
x ∈ I} setzen. Wählen wir η = ei , so erhalten wir als Lösung die i–te Spalte
ϕ(t, ei ) der kanonischen Fundamentalmatrix an der Stelle 0. Damit haben wir

∞
tk
n
tk
ϕ(t, ei ) = k! Ak ei = lim Ak ei .
k=0 n→∞ k=0 k!
Somit gilt der

Satz. (a) Auf jedem kompakten Intervall konvergiert die Reihe

∞
tk
etA := Ak .
k=0 k!
gleichmäßig und liefert die kanonische Fundamentalmatrix Y (t, 0). (Konvergenz
wahlweise zu verstehen als Konvergenz der Spalten oder der Koeffizienten.)
(b) Das AWP ẏ = A y, y(ξ) = η hat die für alle t definierte Lösung
y(t) = e(t−ξ)A η .
(c) Es gilt das Exponentialgesetz

e(s+t)A = esA etA = etA esA für s, t ∈ Ê, e0A = E = Einheitsmatrix.
2 Zur algebraischen Bestimmung von etA 59
−1
Aus (c) ergibt sich ÜA etA = e−tA .
Beweis von (b) und (c).

(b) Genau dann liefert y eine Lösung des genannten AWP, wenn u(t) = y(t+ξ)
das AWP u̇ = A u , u(0) = η löst, d.h. wenn u(t) = etA η .
(c) Sei u(t) = etA η. Wir halten t, η fest und setzen
v(s) := e(s+t)A η = u(s + t) , w(s) := esA etA η = esA u(t) .
Sowohl v als auch w lösen das AWP ẏ = Ay, y(0) = etA η, stimmen also nach
dem Eindeutigkeitssatz überein:
e(s+t)A η = v(s) = w(s) = esA etA η für alle s ∈ Ê.

Ê Ê
Da dies für alle t ∈ , η ∈ n gilt, folgt e(s+t)A = esA etA für s, t ∈ Ê. Durch
Vertauschen der Rollen von s und t ergibt sich der Rest. 2

λ 1
(a) Die Matrix A = 0 λ
ist nicht diagonalähnlich ÜA . Durch Induktion
erhalten wir ÜA

k λk kλk−1 tA eλt teλt 1 t
A = , also e = = eλt .
0 λk 0 eλt 0 1
2 1
(b) Bestimmen Sie etA für A = −1 0
.
(c) Wir erinnern an die Aufgabe § 2 : 5.2 (f).
(d) Zeigen Sie eA+B = eA eB für vertauschbare Matrizen A, B (AB = BA).
Gehen Sie dabei wie im Nachweis von 1.5 (c) vor.
2 Zur algebraischen Bestimmung von etA

2.1 Homogene Systeme mit komplexen Koeffizienten
Die Reihendarstellung der Lösungen in 1.5 läßt sich ohne Probleme auf komplexe
Matrizen A übertragen:
(a) Für jede n × n–Matrix A mit komplexen Koeffizienten besitzt das Anfangs-
wertproblem ẏ = A y , y(0) = η für alle η ∈ n eine eindeutig bestimmte
Lösung z : → n . Diese ist gegeben durch
z(t) = etA η ,
wobei die Reihe

∞
tk
etA := Ak
k!
k=0
auf jedem kompakten Teilintervall von Ê gleichmäßig konvergiert.

(b) Es gilt das Exponentialgesetz
e(s+t)A = esA etA für s, t ∈ Ê, e0A = E .
(c) Für jedes λ ∈ gilt
etA = eλt et(A−λE) für t ∈ .
Beweis.
(a) Eine Durchsicht des Existenzbeweises (§ 2 : 5.1) und des Eindeutigkeitsbe-
weises (§ 2 : 4.3) zeigt die Übertragbarkeit auf den komplexen Fall ÜA .
(b) verläuft wörtlich wie der Beweis von 1.5 (c).
(c) u(t) = et(A−λE) η löst das AWP u̇(t) = (A − λE)u(t), u(0) = η. Ferner
gilt für v(t) = eλt u(t)
v̇(t) = λv(t) + eλt (A − λE) u(t) = A v(t) , v(0) = η
und somit v(t) = etA η nach dem Eindeutigkeitssatz. 2
2.2 Einsetzen von Operatoren in Polynome

(a) Im folgenden seien V ein Vektorraum über = oder und L (V ) der
Vektorraum der linearen Operatoren T : V → V . Für T ∈ L (V ) setzen wir
T 0 := , T 2 := T ◦ T und rekursiv T n+1 := T ◦ T n .
Ein einfacher Induktionsbeweis zeigt ÜA
T n+m n
=T T m
=T T m n
für n, m ∈ 0 = {0, 1, 2, . . .} .
(b) Für p(x) = a0 + a1 x + . . . + an xn mit a0 , . . . , an ∈ definieren wir
p(T ) := a0 T 0 + a1 T + . . . + an T n .
Dann gilt für Polynome p, q ÜA
(p + q)(T ) = p(T ) + q(T ) = q(T ) + p(T ) ,
(p q)(T ) = p(T ) q(T ) = q(T ) p(T ) .

2.3 Das Minimalpolynom

Im folgenden seien V ein Vektorraum der endlichen Dimension n ≥ 2 über Ã
und T ∈ L (V ) ein linearer Operator.
Satz. (a) Es existieren annullierende Polynome für T , d.h. nichtkonstante
Polynome p mit Koeffizienten aus Ã
und mit p(T ) = 0.
(b) Es gibt ein eindeutig bestimmtes annullierendes Polynom von kleinstem po-
sitiven Grad und höchstem Koeffizienten 1. Dieses Minimalpolynom bezeich-
nen wir mit mT .
(c) Das Minimalpolynom teilt jedes annullierende Polynom.
Beweis.
Ã
(b) Der Vektorraum L (V ) hat die Dimension n2 über . Wegen T 0 = V = 0 ½
gibt es eine kleinste natürliche Zahl m, so dass T 0 , . . . , T m−1 linear unabhängig
sind. T m ist dann eine Linearkombination von T 0 , . . . , T m−1 ; wir schreiben
T m = − a0 T 0 − . . . − am−1 T m−1
mit eindeutig bestimmten Koeffizienten a0 , . . . , am−1 . Das Minimalpolynom ist
daher
mT (x) := a0 + a1 x + . . . + am−1 xm−1 + xm
(c) Sei p ein T annullierendes Polynom. Division mit Rest liefert Polynome q, r
mit
p = mT q + r , Grad (r) < Grad (mT ) .
Mit 2.2 folgt p(T ) = mT (T )q(T ) + r(T ), also r(T ) = 0. Wegen der Minima-
litätseigenschaft von mT muss r konstant sein, also ist r das Nullpolynom wegen
r(T ) = 0. 2
Beispiele. (i) Für den Nulloperator 0 gilt m0 (x) = x;
für die Identität ½=½V gilt m½ (x) = x − 1.
0 1
(ii) Hat T die Matrix A = 0 0
, so ist mT (x) = x2 ÜA .
Satz. Ist T diagonalisierbar und σ(T ) = {λ1 , . . . , λr } die Menge der paar-
weise verschiedenen Eigenwerte von T , so ist mT (x) = (x − λ1 ) · · · (x − λr ).
Beweis.
Da es eine Basis für V aus Eigenvektoren von T gibt, ist
p(x) = (x − λ1 ) · · · (x − λr )
= (x − λ1 ) · · · (x − λk−1 )(x − λk+1 ) · · · (x − λr )(x − λk )
ein annullierendes Polynom: Für jeden Eigenvektor v zum Eigenwert λk ist
p(T ) v = (T − λ1 ) · · · (T − λr )(T − λk ) v = 0 .
Also wird p von mT geteilt. Lassen wir in p einen Linearfaktor weg, z.B. den
ersten, so ist das Restpolynom nicht mehr annullierend:
Es sei z.B. q(x) = (x − λ2 ) · · · (x − λr ) und v ein Eigenvektor zum Eigenwert
λ1 . Dann ist
q(T ) v = (T − λ2 ½) · · · (T − λ1 ½ + (λ1 − λr )½) v
= (T − λ2 ½) · · · (T − λr−1 ½)(λ1 − λr ) v
= (λ1 − λ2 ) · · · (λ1 − λr ) v = 0 . 2
2.4 Direkte Summen und direkte Zerlegung eines linearen Operators

(a) Ein Vektorraum V über Ã heißt direkte Summe der Teilräume V , . . . , V ,
1 r
V = V1 ⊕ · · · ⊕ Vr ,
wenn jeder Vektor v ∈ V eine eindeutige Darstellung
v = v1 + . . . + vr
mit
v1 ∈ V1 , . . . , vr ∈ Vr
besitzt.
(b) Ist T ∈ L (V ) ein linearer Operator, V = V1 ⊕ · · · ⊕ Vr , und sind alle
direkten Summanden Vk T –invariant, T (Vk ) ⊂ Vk , so sind die Einschränkungen
Tk von T auf Vk lineare Operatoren Tk : Vk → Vk .
T wird so in kleinere Bausteine T1 , . . . , Tr zerlegt.
Ê
Beispiel: Drehungen im 3 . Ist V1 = Span {u} die Drehachse und V2 der zu
u orthogonale Teilraum, so gilt V = V1 ⊕ V2 , und T1 ist die Identität auf V1 ,
während T2 eine ebene Drehung ist.
2.5 Der Zerlegungssatz

(a) Ist p ein annullierendes Polynom für T ∈ L (V ) und
p = p1 · · · pr (r ≥ 2)
eine Zerlegung in nichtkonstante, paarweise zueinander teilerfremde Polynome
pk , so gibt es eine korrespondierende Darstellung
V = Kern p1 (T ) ⊕ · · · ⊕ Kern pr (T )
in T –invariante Teilräume Vk = Kern pk (T ).

(b) Ist insbesondere p das Minimalpolynom von T , so sind alle Vk echte Teil-
räume: Vk = {0}, Vk = V . Die Einschränkung Tk von T auf Vk hat dann das
Minimalpolynom pk .
Beweis.
(i) Es gilt p = p1 q , wobei p1 und q = p2 · · · pr teilerfremd sind. Nach Bd. 1,
§ 3 : 7.9 gibt es also Polynome r und s mit 1 = q r + p1 s , somit folgt nach 2.2
(∗) ½V = q(T ) r(T ) + p1 (T ) s(T ) = r(T ) q(T ) + s(T ) p1 (T ) .
Jeder Vektor v ∈ V besitzt also eine Zerlegung
v = q(T ) r(T ) v + p1 (T )s(T ) v = v1 + v2
mit p1 (T ) v1 = (p1 q)(T )(r(T )v) = p(T )(r(T ) v) = 0, q(T ) v2 = p(T )(s(T ) v) = 0,
d.h. es gilt v1 ∈ V1 := Kern p1 (T ) und v2 ∈ W := Kern q(T ).
(ii) v1 und v2 sind durch v eindeutig bestimmt:
Aus v = u1 + u2 = v1 + v2 mit u1 , v1 ∈ V1 und u2 , v2 ∈ W folgt v1 − u1 =
u2 − v2 ∈ W , also v1 − u1 ∈ V1 ∩ W . Aus (∗) folgt
v1 − u1 = r(T ) q(T ) (v1 − u1 ) + s(T )p1 (T ) (v1 − u1 ) = 0 ,
also v1 = u1 und damit auch v2 = u2 .

(iii) V1 und W sind T –invariant.
Aus q(T ) v = 0 folgt z.B. q(T ) T v = T q(T ) v = T 0 = 0, entsprechend ergibt
sich: p1 (T ) v = 0 =⇒ p1 (T ) T v = T p1 (T ) v = 0.
(iv) Ist p das Minimalpolynom, so gilt W = V , also V1 = {0}, denn sonst
wäre q ein annullierendes Polynom für T , im Widerpruch zur Definition des
Minimalpolynoms. Entsprechend folgt V1 = V .
Für die Einschränkungen T1 von T auf V1 , S von T auf W sind p1 bzw. q
annullierende Polynome. Wäre p1 nicht das Minimalpolynom von T1 , so gäbe
es ein Polynom m1 , das T1 annulliert und ein echter Teiler von p1 ist (2.3 (c)).
Dann wäre aber schon m1 q ein annullierendes Polynom von T . Entsprechend
folgt q = mS .
(v) Für die Einschränkung S von T auf W ist q ein annullierendes Polynom.
Im Fall r ≥ 3 ist q = q2 (q3 . . . qr ) , und wir verfahren wieder wie oben. Nach
endlich vielen Schritten sind wir am Ziel. 2
2.6 Eigenwerte und Nullstellen des Minimalpolynoms

(a) Das Minimalpolynom mT und das charakteristische Polynom pT besitzen
dieselbe Nullstellenmenge in .
(b) Satz von Cayley–Hamilton. Das Minimalpolynom teilt das charakte-
ristische Polynom. Insbesondere ist die geometrische Vielfachheit eines Eigen-
werts höchstens gleich der algebraischen.
(c) T ist genau dann diagonalisierbar, wenn das Minimalpolynom die Gestalt

mT (x) = (x − λ1 ) · · · (x − λr ) hat mit paarweise verschiedenen λ1 , . . . , λr ∈ .
Beweis.
(a) Ist λ eine k–fache Nullstelle von mT , so gilt
mT (x) = (x − λ)k q(x) mit q(λ) = 0 .
Das ist eine Zerlegung in teilerfremde Faktoren. Nach 2.5 (b) folgt
V = Kern (T − λ½)k ⊕ Kern q(T ) ,
wobei (x − λ)k das Minimalpolynom der Einschränkung T1 von T auf den inva-
rianten Teilraum V1 = Kern (T − λ½)k ist. Wegen (T − λ½V1 )k−1 = 0 gibt es
ein v1 ∈ V1 mit
v := (T − λ½)k−1 v1 = 0 und T v − λv = (T − λ½)k v1 = 0 ,
d.h. v ist Eigenvektor zum Eigenwert λ.
(c) Die Richtung =⇒ “ wurde in 2.3 (iii) gezeigt. Die Richtung ⇐=“ ergibt
” ”
sich wie folgt: Aus
mT (x) = (x − λ1 ) · · · (x − λr ) folgt mit 2.5
V = Kern (T − λ1 ½) ⊕ · · · ⊕ Kern (T − λr ½) ,
d.h. jeder Vektor v ∈ V ist Linearkombination von Eigenvektoren.
Sei umgekehrt T v = λv mit v = 0. Division mit Rest ergibt
mT (x) = (x − λ) q(x) + r mit geeignetem r ∈ , also

0 = mT (T ) v = q(T ) ((T − λ )v) + r v = r v ,
somit r = 0 .
(b) Sei A eine beliebige n × n–Matrix. Wir gehen ins Komplexe und betrachten

y → Ay als Operator T des n . Hier zerfällt das Minimalpolynom in Line-
arfaktoren: mT (x) = (x − λ1 )k1 · · · (x − λr )kr mit paarweise verschiedenen

λ1 , . . . , λr ∈ . Sei
n
= V1 ⊕ · · · ⊕ Vr mit Vj = Kern (T − λj )kj
die nach 2.5 existierende zugehörige direkte Zerlegung. Wir betrachten einen
Summanden Vj , schreiben zur Abkürzung λ = λj , k = kj , V = Kern (A − λE)k .
Aus (a) folgt, dass die algebraische Vielfachheit von λ gleich der Dimension von
V ist. Wir zeigen k < dim V , indem wir k linear unabhängige Vektoren in V

angeben, nämlich wie oben einen Vektor v1 ∈ V mit w := (T − λ )k−1 v1 = 0
und

v2 := (T − λ )v1 , . . . , vk := (T − λ )vk−1 = (T − λ )k−1 v1 .

k
Aus dem Verschwinden einer Linearkombination v = αj vj ergibt sich dann

j=1
0 = (T − λ )k−1 v = α1 w, 0 = (T − λ )k−2 v = α2 w usw., also α1 = 0,
α2 = 0, . . . , αk = 0. 2
2.7 Zerlegung von etA

Wir fassen wie oben y → Ay als Operator T des n auf und betrachten einen
zur Zerlegung mT (x) = (x − λ1 )k q(x) mit q(λ) = 0 gehörenden direkten
Summanden V = Kern (A − λE)k . Dann gilt:
(a) V ist invariant unter etA für t ∈ .
(b) Für η ∈ V ist die Lösung des AWP ẏ = Ay, y(0) = η gegeben durch

tk−1
y(t) = etA η = eλt E + t(A − λE) + . . . + (A − λE)k−1 η .
(k − 1)!
Denn in der nach 2.1 bestehenden Reihenentwicklung

∞
tm
etA η = eλt et(A−λE) η = eλt (A − λE)m η
m!
m=0
gilt
( A − λE)m η = (A − λE)m−k (A − λE)k η = 0 für m ≥ k ,
also bleibt nur die angegebene endliche Summe. Für η ∈ V = Kern (A − λE)k
folgt (A − λE)m η ∈ V für 0 ≤ m < k wegen
(A − λE)k (A − λE)m η = (A − λE)m (A − λE)k η = 0.
2.8 Zur algebraischen Lösung des allgemeinen Anfangswertproblems

(a) Das Minimalpolynom erhalten wir auf folgende Weise: Ist für einen Eigen-
wert λ ∈ die Dimension des Eigenraums (in n ) kleiner als die algebraische
Vielfachheit ν, so tritt nach dem Satz von Cayley–Hamilton x − λ im Minimal-
polynom mindestens in der zweiten, und nach 2.6 (b) höchstens in der ν–ten
Potenz auf. Für das Minimalpolynom bleiben so endlich viele Möglichkeiten;
die richtige können wir durch Probieren finden.
(b) Das Minimalpolynom sei mT (x) = (x − λ1 )k1 · · · (x − λr )kr . Wir setzen
qj (x) := mT (x)(x−λj )−kj . Dann gibt es Polynome s1 , . . . , sr mit Grad sj < kj
und 1 = q1 s1 + . . . + qr sr . Das ergibt sich aus Bd. 1. § 3 : 7.9 durch Induktion
bzw. durch Partialbruchzerlegung
1 s1 (x) sr (x)
= + ... + .
mT (x) (x − λ1 )k1 (x − λr )kr
Es folgt
= q1 (T ) s1 (T ) + . . . + qr (T ) sr (T ) ,
also für v ∈ n
v = q1 (T ) s1 (T ) v + . . . + qr (T ) sr (T ) v = v1 + . . . + vr .
Offenbar gilt (T − λj )kj vj = 0. Also haben wir hiermit eine und damit die
einzige Zerlegung im Sinne des Zerlegungssatzes gefunden.
Setzen wir Pj := qj (T ) sj (T ) (j = 1, . . . , r), so erhalten wir die Lösung des

AWP ẏ = A y , y(0) = η wie folgt:
Mit der Zerlegung η = P1 η + . . . + Pr η = η 1 + . . . + η r erhalten wir
y(t) = y1 (t) + . . . + yr (t) ,
wobei sich yj (t) = etA η j wie in 2.7 ergibt.
Für η ∈ Ê
n
folgt y(t) ∈ Ê n
aus dem Eindeutigkeitssatz.
2.9 Aufgabe (Jordansche Normalform einer 2 × 2–Matrix)

Es sei A eine reelle, über nicht diagonalähnliche 2 × 2–Matrix. Zeigen Sie:
(a) A hat genau einen reellen Eigenwert λ.
(b) Der lineare Operator x → Ax des 2 hat das Minimalpolynom (x − λ)2 .
(c) Es gibt eine Basis B = (v1 , v2 ) des 2 mit

λ 1
MB (T ) = .
0 λ
(d) Stellen Sie etA in der Form 2.7 dar: eλt mal Polynom in A. Zeigen Sie mit
Hilfe von (b), dass y(t) = etA η das AWP ẏ = Ay tatsächlich löst.
n
Bemerkung. Hat der Operator T des das charakteristische Polynom
pT (x) = (x − λ1 ) m1
· · · (x − λr ) mr
,
so läßt sich die Existenz einer Basis B des n
zeigen, für welche gilt
⎛ ⎞
J1 0 $
λi ∗ 0
%
⎜ .. ⎟ ..
MB (T ) = ⎝ . ⎠ mit Ji = . ∗ .
0 λi
0 Jr mi ×mi
Die Untermatrizen Ji enthalten in der Diagonalen den Eigenwert λi , in der

oberen Nebendiagonalen entweder Nullen oder Einsen und sonst nur Nullen
(Jordansche Normalform). Näheres zur Jordanschen Normalform finden Sie
in Fischer [145] 5.4.
2.10 Folgerung für das Abklingen der Lösungen

Genau dann gilt lim etA η = 0 für jedes η ∈
t→∞
n, wenn alle (komplexen)
Eigenwerte von A negativen Realteil haben.

Das folgt direkt aus 2.8 und 2.7 wegen eλt = eRe λt .
Dieses Ergebnis dient als Grundlage für die Theorie der asymptotischen Stabi-
lität autonomer Systeme. Hierfür ist folgender Sachverhalt wesentlich:
ÜA Gilt Re λ < ρ für alle (komplexen) Eigenwerte λ der reellen n × n–Matrix
A, so gibt es eine Konstante c ≥ 1 mit
etA η ≤ c et η für alle η ∈ n und t ≥ 0 .
3 Die lineare Differentialgleichungen n–ter Ordnung 67
3 Die lineare Differentialgleichungen n–ter Ordnung

3.1 Umwandlung in ein System
Gegeben sei eine lineare DG n–ter Ordnung für u ∈ Cn (I)

n
Lu := ak u(k) = f
k=0
mit gegebenen stetigen Funktionen a0 , . . . , an−1 , f auf einem Intervall I und

an = 1.
Um über die Lösungsgesamtheit Lf der Gleichung Lu = f eine Übersicht zu ge-
winnen, verwenden wir die Korrepondenz mit dem Lösungraum Lb des gemäß
§ 2 : 1.3 zugeordneten linearen Systems y = A(x)y + b(x), ausgeschrieben
⎧
⎪
⎪
y1 = y2
⎪
⎨ .. ..
(S) . .
⎪
⎪ y
⎪
⎩ n−1
= yn

yn = − a0 y1 − a1 y2 − . . . − an−1 yn + f .
Zwischen den Lösungsräumen Lf und Lb mit b = f en besteht eine bijektive

Zuordnung J : Lf → Lb , gegeben durch
⎛ ⎞ ⎛ ⎞
u y1
⎜ u ⎟ ⎜ y2 ⎟
⎜ ⎟
Ju := ⎜
⎝
.. ⎟ mit J −1 y = y1
⎠ für y = ⎜ . ⎟ ∈ Lb .
. ⎝ .. ⎠
u(n−1) yn
Im homogenen Fall f = 0 sind die Lösungsräume jeweils Vektorräume, und die

Abbildung J ist eine bijektive, lineare Abbildung von Kern L auf den Lösungs-
raum von y = A(x) y. Dieser läßt sich durch y → y(ξ) (ξ ∈ I) wiederum
Ê
bijektiv auf den n abbilden (1.1 (a)). Daraus ergibt sich die folgende
3.2 Lösungstheorie
(a) Das Anfangswertproblem
Lu = f, u(ξ) = η0 , . . . , u(n−1) (ξ) = ηn−1
besitzt für gegebene Anfangsdaten ξ ∈ I, η0 , . . . , ηn−1 ∈ Ê eine eindeutig be-

stimmte Lösung u ∈ Cn (I).
(b) Der Lösungsraum L0 = Kern L der homogenen Gleichung Lu = 0 ist ein
n–dimensionaler Teilraum von Cn (I).
(c) Genau dann bilden die Funktionen u1 , . . . , un ein Fundamentalsystem

für Lu = 0 , d.h. eine Basis für L0 , wenn die Vektoren Ju1 , . . . , Jun (siehe 3.1)
ein Fundamentalsystem für (S) bilden, d.h. wenn ihre Wronski–Determinante

u1 (x) · · · un (x)

u1 (x) un (x)

W (x) = .. ..
. .

u(n−1) (x) · · · u(n−1) (x)
1 n
wenigstens an einer Stelle von Null verschieden ist.

(d) Für beliebige Lösungen u1 , . . . , un der homogenen DG Lu = 0 gilt
x
W (x) = W (ξ) exp − an−1 (t) dt , vgl. 1.3.
ξ
(e) Kennen wir ein Fundamentalsystem für Lu = 0, so lassen sich die Lösun-
gen der inhomogenen DG Lu = f mit Hilfe der Variation der Konstanten (1.4)
explizit darstellen.
3.3 Die homogene DG n–ter Ordnung mit konstanten Koeffizienten

Sind die Koeffizienten a0 , . . . , an−1 des Differentialoperators L konstant, so
können wir uns ein Fundamentalsystem mit Hilfe des Exponentialansatzes
u(t) = eλt verschaffen. Dieser liefert genau dann eine (ggf. komplexwertige)
Lösung, wenn λ die charakteristische Gleichung
p(λ) := a0 + a1 λ + . . . + an λn = 0 mit an = 1
erfüllt. Hat das Polynom p lauter einfache Nullstellen λ1 , . . . , λn ∈ , so liefern
z1 (t) = eλ1 t , . . . , zn (t) = eλn t ein komplexwertiges Fundamentalsystem. Das
ergibt sich aus folgenden
Satz. (a) Zu jeder Nullstelle λ der Ordnung k von p liefern

w1 (t) = eλt , . . . , wk (t) = tk−1 eλt
über linear unabhängige Lösungen von Lu = 0. Ist λ reell, so sind w1 , . . . , wk
natürlich auch linear unabhängig über .
(b) Ist λ nicht reell, so sind w1 , . . . , wk , w1 , . . . , wk linear unabhängig über ,
und
u1 = Re w1 , . . . , uk = Re wk , v1 = Im w1 , . . . , vk = Im wk
sind linear unabhängig über .
(c) Alle genannten reellwertigen Lösungen zusammen bilden ein reelles Funda-
mentalsystem für Lu = 0.
3 Die lineare Differentialgleichungen n–ter Ordnung 69
Beweis.
(a) Die Gesamtheit L0 = Kern L aller komplexen Lösungen von Lu = 0 ist
ein n–dimensionaler Vektorraum über ( ÜA mit 3.2 (b)). Für u ∈ L0 gilt
offenbar u ∈ Cn+1 () und Lu = 0 , also ist durch u → Du = u ein linearer
Operator D : L0 → L0 gegeben. Statt Lu = 0 können wir auch p(D)u = 0
schreiben. Somit ist p ein annullierendes Polynom für D. Wir zeigen, dass p das
Minimalpolynom von D ist. Denn für ein Polynom q vom Grad m < n ist der
Lösungsraum von q(D)u = 0 nur m–dimensional. Sei
p(x) = (x − λ1 )k1 · · · (x − λr )kr
mit λ1 , . . . , λr ∈ . Dann folgt nach dem Zerlegungssatz 2.5 (b)
L0 = Kern (D − λ1 )k1 ⊕ · · · ⊕ Kern (D − λr )kr .
Es genügt also, die DG (D − λ)k u = 0 zu betrachten. Für k = 1 sind alle

Lösungen von der Form u(t) = u0 eλt . Wir nehmen als Induktionsvoraussetzung
an, jede Lösung von (D − λ)k v = 0 sei von der Form

v(t) = c0 + c1 t + . . . + ck−1 tk−1 eλt .
Dann bedeutet (D − λ)k+1 u = 0 , dass v := u − λu von der Form

u (t) − λu(t) = c0 + c1 t + . . . + ck−1 tk−1 eλt
ist. Wie im Reellen ergibt sich u durch Variation der Konstanten ÜA :
t ck−1 k
u(t) = eλt u0 + v(s) e−λs ds = eλt u0 + c0 t + . . . + t .
0
k
Dieser Induktionsschritt zeigt, dass die in (a) genannten w1 , . . . , wk ein Erzeu-

gendensystem des k–dimensionalen Lösungsraums von (D − λ)k u = 0 bilden,
also linear unabhängig sind.
(b) ergibt sich daraus, dass mit wk auch Re wk und Im wk die homogene Glei-
chung Lu = 0 erfüllen, dass ferner
& ' & '
Span u1 , . . . , uk , v1 , . . . , vk = Span w1 , . . . , wk , w1 , . . . , wk
über gilt, und dass dieser Aufspann 2k–dimensional ist ÜA .

(c) ist, wie im Beweisteil (a) zu sehen war, eine Folge des Zerlegungssatzes. 2
70 § 4 Lineare Differentialgleichungen zweiter Ordnung
§ 4 Lineare Differentialgleichungen zweiter Ordnung

1 Problemstellung
(a) Gewöhnliche lineare Differentialgleichungen zweiter Ordnung treten typi-
scherweise bei Separationsansätzen für die Lösung von partiellen linearen Diffe-
rentialgleichungen zweiter Ordnung auf, z.B. der Wellengleichung, der Wärme-
leitungsgleichung und der Schrödinger–Gleichung.
Wir skizzieren dies am Beispiel der Gleichung für die stationäre Temperaturver-
teilung in der Einheitskreisscheibe, ohne auf rechnerische und beweistechnische
Details einzugehen. In Polarkoordinaten (r, ϕ) ergibt sich folgende partielle DG
für die Temperatur U (r, ϕ) (vgl. § 6 : 5.1, 5.2)
∂2U 1 ∂U 1 ∂2U
(D) 2
+ + 2 = 0 (0 < r < 1, 0 < ϕ < 2π) .
∂r r ∂r r ∂ϕ2
Von Interesse sind nur 2π–periodische, für r → 0 stetige Lösungen. Die Sepa-
rationsmethode besteht darin, zunächst alle Lösungen in Produktgestalt
U (r, ϕ) = u(r) v(ϕ)
zu bestimmen und dann zu zeigen, dass sich jede beliebige Lösung von (D) aus
solchen Produktlösungen durch eine Reihe aufbauen lässt. Für nicht verschwin-
dende Produktlösungen ergibt sich aus (D)
r 2 u (r) + r u (r) v (ϕ)

= −
u(r) v(ϕ)
bis auf Nullstellen der Nenner. Beide Seiten der Gleichung müssen offenbar
konstant sein, d.h. es muss
r 2 u (r) + r u (r) − λu(r) = 0 , v (ϕ) + λv(ϕ) = 0
mit einer Konstanten λ gelten. Damit haben wir die partielle Differentialglei-
chung (D) in zwei gewöhnliche lineare Differentialgleichungen separiert“.
”
Wegen der notwendigen 2π–Periodizität von v(ϕ) hat die DG für v genau dann

nichttriviale Lösungen, wenn λ = n2 mit n ∈ 0 = {0, 1, 2, . . .}. Die DG für u
hat, wie sich in 2.4 ergibt, für λ = n2 die allgemeine Lösung
(
α + β log r für n = 0 ,
u(r) = n −n
αr + β r für n = 1, 2, . . . .
Da u in r = 0 stetig sein muss, ist β = 0 zu wählen. Somit haben die gesuchten

Produktlösungen von (D) die Gestalt
U (r, ϕ) = r n (an cos nϕ + bn sin nϕ) mit Konstanten an , bn (n = 0, 1, . . .).

2 Sturm–Liouville–Form und Fundamentalsysteme 71
(b) Wichtige Beispiele von solchen bei Separationsansätzen auftretenden Dif-

ferentialgleichungen sind:
(1 − x2 ) u (x) − 2 x u (x) + λ u(x) = 0 in ]−1, 1[ (Legendresche DG),

2
u (x) +
1
x
ν
u (x) + λ − 2 u(x) = 0 in
x
Ê >0 (Besselsche DG),
u (x) − 2xu (x) + λu(x) = 0 in Ê (Hermitesche DG).
(c) Wir betrachten im Folgenden Differentialgleichungen der Form

(∗) a2 u + a1 u + a0 u + λu = 0 in I,
wobei I ein offenes Intervall ist und a0 , a1 , a2 gegebene stetige Funktionen auf
I mit a2 > 0 sind. Nach Untersuchung einiger Eigenschaften von Fundamen-
talsystemen in Abschnitt 2 behandeln wir in Abschnitt 3 Reihenentwicklungen
für die Lösungen.
Die zentrale Frage ist das Eigenwertproblem: Gesucht sind alle Zahlen λ, für
die es nichttriviale Lösungen u von (∗) mit zusätzlichen Eigenschaften gibt, z.B.
beschränkte Lösungen oder Lösungen mit beschränktem Integral. Die Bestim-
mung der stationären Zustände des quantenmechanischen harmonischen Oszil-
lators lässt sich beispielsweise auf die Frage nach Lösungen u = 0 der Hermite-
2
schen DG zurückführen, für die e−x /2 u(x) quadratintegrierbar ist.
2 Sturm–Liouville–Form und Fundamentalsysteme

2.1 Sturm–Liouville–Form und Lagrange–Identität
(a) Satz. Jede DG der Gestalt (∗) lässt sich in die Sturm–Liouville–Form
− (pu ) + qu = λ u
bringen, wobei p, q, bis auf einen gemeinsamen, von Null verschiedenen Vor-
faktor eindeutig bestimmt sind. Nach Vorgabe von x0 ∈ I ergibt sich durch
Koeffizientenvergleich ÜA
$ x %
a1 (t) p p a0
p(x) = exp dt , = , q = − .
a2 (t) a2 a2
x0
−1
Diese DG können wir als Eigenwertproblem Lu = λu mit

Lu := − (pu ) + qu
auffassen. Solange wir λ als einen gegebenen Parameter betrachten, ersetzen wir
q durch q − λ und schreiben die DG in der Form Lu = 0.
Die drei Differentialgleichungen in 1 (b) lauten in der Sturm–Liouville–Form
ÜA
− ((1 − x2 ) u ) = λ u ,
ν2
−(x u ) + u = λxu ,
x
2 2
−(e−x u ) = λ e−x u .
(c) Für beliebige Funktionen u1 , u2 ∈ C2 (I) gilt die Lagrange–Identität

(Bezeichnungen wie in 2.1 (a))
u2 Lu1 − u1 Lu2 = (pW ) ,
wobei
u1 u2

W = = u1 u2 − u1 u2
u1 u2
die Wronski–Determinante von u1 und u2 ist.
Für je zwei Lösungen u1 , u2 der Gleichung Lu = 0 ist also der Ausdruck
pW = p (u1 u2 − u1 u2 )
konstant.
Denn es gilt
(pW ) = (u1 (p u2 ) − u2 (p u1 )) = u1 (p u2 ) − u2 (p u1 )
= u2 (−(p u1 ) + q u1 ) − u1 (−(p u2 ) + q u2 ) = u2 Lu1 − u1 Lu2 .
2.2 Fundamentalsysteme
Der Lösungsraum L0 der homogenen Differentialgleichung Lu = 0 ist ein zwei-
dimensionaler Teilraum von C2 (I).
Zwei Lösungen u1 , u2 bilden genau dann ein Fundamentalsystem, wenn p W
eine von Null verschiedene Konstante ist.
Das folgt aus § 3 : 3.2 zusammen mit dem oben Gesagten.
2.3 Ergänzung einer Lösung zu einem Fundamentalsystem

Jede nullstellenfreie Lösung u1 von Lu = 0 lässt sich durch den Produktansatz
u2 = ϕ u1 zu einem Fundamentalsystem u1 , u2 ergänzen: u2 = ϕu1 ist genau
dann eine von u1 linear unabhängige Lösung von Lu = 0 , wenn
x
dt
ϕ(x) = a + b ,
pu21
x0
wobei a, b, x0 Konstanten mit x0 ∈ I, b = 0 sind.

(Reduktionsverfahren von d’Alembert).
Beweis als ÜA : Zeigen Sie pW = 1 .
2 Sturm–Liouville–Form und Fundamentalsysteme 73
2.4 Aufgaben
(a) Gegeben sei die Eulersche Differentialgleichung
x2 u (x) + xu (x) = n2 u(x) für x > 0 (n = 0, 1, . . . ein Parameter).
(i) Berechnen Sie das in Abschnitt 1 angegebene Fundamentalsystem durch

den Ansatz u(x) = v(log x).
(ii) Ein im Hinblick auf die kommende Theorie systematischerer Weg zur Auf-
stellung eines Fundamentalsystems u1 , u2 besteht darin, zuerst eine Lösung u1
der Eulerschen DG in Potenzreihenform zu suchen, dann die DG in Sturm–
Liouville–Form 2.1 zu bringen und das Reduktionsverfahren anzuwenden. Führen
Sie das durch!
(b) Zeigen Sie den folgenden Vergleichssatz: Seien u, u0 > 0 C2 –Funktionen
auf einem offenen Intervall I mit
− (pu ) + qu ≥ 0 , − (pu0 ) + q0 u0 = 0 , q ≤ q0 ,
u0 (ξ) = u(ξ), u0 (ξ)
= u (ξ) für ein ξ ∈ I.
Dann gilt
u(x) ≤ u0 (x) für alle x ∈ I.
Hinweis: Zeigen Sie mit Hilfe der Lagrange–Identität (u/u0 ) (x) ≥ 0 für x < ξ
und (u/u0 ) (x) ≤ 0 für x > ξ.
2.5 Einfachheit von Nullstellen

Ist u = 0 eine Lösung der homogenen DG Lu = 0 auf I, so sind alle Null-
stellen von u einfach und besitzen keinen Häufungspunkt in I, d.h. es gibt keine
konvergente Teilfolge mit Grenzwert in I.
Beweis.
(a) Jede Nullstelle x0 ∈ I von u ist einfach, weil das Anfangswertproblem
Lu = 0, u(x0 ) = u (x0 ) = 0 nur die Lösung u = 0 besitzt.
(b) Gäbe es eine Folge von Nullstellen xk = x0 mit Grenzwert x0 ∈ I, so folgte
die nach (a) unmögliche Beziehung
u(xk ) − u(x0 )
u(x0 ) = lim u(xk ) = 0 , u (x0 ) = lim = 0. 2
k→∞ k→∞ xk − x0
2.6 Nullstellenvergleichssatz
Seien u, v Lösungen der Differentialgleichungen
− (pu ) + qu = 0 , − (pv ) + q0 v = 0 in I
und es gelte q(x) < q0 (x) für alle x ∈ I. Sind dann α < β aufeinander Folgende
Nullstellen von v in I, so hat u eine Nullstelle in ]α, β[.
Folgerung. Jede Lösung u = 0 der DG −u + qu = 0 in ]r, ∞[ mit q < −ω 2

(ω > 0) besitzt dort unendlich viele Nullstellen.
Das ergibt sich durch Vergleich von u mit der Lösung v(x) = sin ωx der DG
−v − ω 2 v = 0.
Beweis.
Wir setzen W := uv − u v und Lw := −(pw ) + q0 w. Angenommen, u
hat in ]α, β[ keine Nullstellen. Dann können wir o.B.d.A. u, v > 0 in ]α, β[
annehmen und erhalten u(α), u(β) ≥ 0, v (α) > 0, v (β) < 0 nach 2.5, woraus
(p W )(α) = p(uv − u v)(α) ≥ 0 folgt. Die Lagrange–Identität liefert
(pW ) = vLu − uLv = (q0 − q)uv > 0 in ]α, β[ .
Hieraus folgt 0 < (p W )(β) = p (uv − u v)(β) = (puv )(β), was u(β) ≥ 0,
v (β) < 0 widerspricht. 2
Mit geringen Modifikationen der eben gemachten Schlüsse ergibt sich:
2.7 Trennung der Nullstellen

Bilden u1 , u2 ein Fundamentalsystem von Lu = 0 , so trennen sich die Null-
stellen von u1 , u2 gegenseitig, d.h. zwischen je zwei aufeinander folgenden Null-
stellen von u1 liegt genau eine von u2 und umgekehrt.
2.8 Aufgabe
Schätzen Sie den Abstand aufeinander Folgender Nullstellen einer Lösung u = 0
der DG −u +(x−2 −1) u = 0 im Intervall ]r, ∞[ (r 1) nach oben und unten
ab.
3 Potenzreihenentwicklungen von Lösungen

3.1 Reihenentwicklungen um innere Punkte
Wir betrachten die Differentialgleichung (∗) in 1 (b) mit festem Parameter λ
und bringen diese in die Form
u + Gu + H u = 0 in I ,
wobei jetzt vorausgesetzt wird, dass die Koeffizienten G und H analytische

Funktionen in I sind. Nach § 2 : 7.3 lässt sich jede Lösung u um jeden beliebigen
Punkt x0 ∈ I in eine Potenzreihe entwickeln. Ihr Konvergenzradius ist minde-
Ê
stens r = dist (x0 , ∂I), bzw. r = ∞ für I = . In vielen Fällen ist es praktisch,
die Reihe in der Gestalt

∞
ak
u(x) = (x − x0 )k
k!
k=0
3 Potenzreihenentwicklungen von Lösungen 75
anzusetzen. Die ak ergeben sich durch Koeffizientenvergleich, wie wir an zwei

Beispielen ausführen.
3.2 Die Legendresche Differentialgleichung

(1 − x2 ) u − 2xu + λu = 0 auf I = ]−1, 1[ .
(a) Wählen wir als Entwicklungspunkt x0 = 0, so wissen wir nach 3.1, dass
jede Lösung u eine für | x | < 1 konvergente Potenzreihenentwicklung besitzt,
die wir in der Form

∞
ak
u(x) = xk
k!
k=0
schreiben. Gliedweise Differentiation ergibt

∞
xk−1
∞
xk−2
∞
x
u (x) = kak , u (x) = k(k − 1) ak = a +2 .
k! k! !
k=1 k=2 =0
Setzen wir dies in die DG ein, so erhalten wir

∞
xk
(ak+2 − k(k − 1)ak − 2kak + λak ) = 0.
k!
k=0
Das Verschwinden aller Koeffizienten ergibt die Rekursionsformel
ak+2 = (k(k + 1) − λ)ak für k = 0, 1, 2, . . . ,
insbesondere
a2 = −λa0 , a3 = (2 − λ)a1 .
Damit sind a2 , a4 , a6 , . . . durch a0 = u(0) und a3 , a5 , a7 , . . . durch a1 = u (0)

eindeutig bestimmt. Aus 3.1 und der eindeutigen Lösbarkeit des AWP folgt:
Geben wir a0 und a1 vor und bestimmen a2 , a3 , . . . aus den Rekursionsformeln,
so konvergiert die Reihe

∞
xk
u(x) = ak
k!
k=0
für | x | < 1 gegen die eindeutig bestimmte Lösung der Legendreschen DG mit
den Anfangsbedingungen u(0) = a0 , u (0) = a1 .
(b) Nichttriviale Polynomlösungen existieren genau dann, wenn λ = n(n + 1)
mit n ∈ {0, 1, 2, . . .}.
Darstellungen für diese geben wir in (c) an.
Beweis.
Ist u eine Polynomlösung mit Grad (u) = n, so folgt aus an+2 = 0, an = 0
sofort 0 = an+2 = (n(n + 1) − λ)an , also λ = n(n + 1). Aus 0 = an+1 =
(n(n − 1) − λ)an−1 mit λ = n(n + 1) folgt an−1 = 0 für n ≥ 1.
Durch Rückwärtsverfolgen der Rekursionsformeln erhalten wir ÜA
0,
a0 = a1 = a3 = . . . = an−1 = 0 für gerades n ,
a1 = 0, a0 = a2 = . . . = an−1 = 0 für ungerades n .
Umgekehrt: Ist λ = n(n + 1) mit n ∈ , so liefern die Anfangsbedingungen
0

u(0) = a0 = 1 , u (0) = a1 = 0 für gerades n bzw.
u(0) = a0 = 0 , u (0) = a1 = 1 für ungerades n
jeweils Lösungen der Gleichung
(1 − x2 ) u − 2 x u + n(n + 1) u = 0
in Form von Polynomen n–ten Grades. 2
(c) Wählen
wir für die Polynomlösung n–ten Grades als höchsten Koeffizienten
an = 21n 2n
n
, so ergibt sich ÜA

1 n 2n − 2k
Pn (x) = (−1)k xn−2k (n = 0, 1, 2, . . .) .
2n k n
0≤2k≤n
Wir zeigen in § 15 : 3.4, dass dies die in Bd. 1, § 19 : 3.3 eingeführten Legendre–
Polynome sind, gekennzeichnet durch die Orthonormalitätsrelation
1 n −1
Pm (x) Pn (x) dx = 1 + 2
δmn .
−1
Es gilt die Formel von Rodrigues:

1 dn
Pn (x) = (x2 − 1)n (n = 0, 1, . . .) .
2n n! dxn
Nachweis als ÜA mit Hilfe der Binomialformel.
(d) Die Legendre–Polynome besitzen eine erzeugende Funktion: Es gilt
−1/2
∞
1 − 2xt + t2 = Pn (x) tn für |x| < 1 , |t| 1 .
n=0
Nachweis als ÜA : Verwenden Sie die Binomialreihe (Bd. 1, § 10 : 1.7)

∞
(−1)m
2m
(1 + ξ)−1/2 = am ξ m (|ξ| < 1) mit am := ,
m=0 22m m
entwickeln Sie ξ m = (t2 − 2xt)m nach der Binomialformel, und ordnen Sie die
entstehende Doppelreihe nach Potenzen tn . Beachten Sie, dass definitionsgemäß
α
β

= 0 für β ∈ 0 , α ∈ , α < β.
(e) Es gelten die Rekursionsformeln
(n + 1) Pn+1 (x) = (2n + 1) x Pn (x) − n Pn−1 (x) f ür n = 1, 2, . . . .
Ausgehend von P0 (x) = 1, P1 (x) = x ermöglichen diese eine einfache Berech-
nung der Legendre–Polynome.
Beweis als ÜA : Differenzieren Sie die Reihe in (d) nach t, multiplizieren Sie
dann die entstehende Gleichung mit 1 − 2xt + t2 , und nehmen Sie Koeffizien-
tenvergleich vor.
Durch Induktion folgt unmittelbar Pn (1) = 1.
3.3 Die Hermitesche Differentialgleichung

(a) Nach 3.1 besitzt jede Lösung u des Anfangswertproblems
(∗) u − 2xu + λ u = 0 , u(0) = a0 , u (0) = a1
eine für alle x ∈ konvergente Reihenentwicklung

∞
xk
u(x) = ak .
k!
k=0
Gliedweise Differentiation und Einsetzen in die DG ergibt wie in 3.2

∞
xk
(ak+2 + (λ − 2k)ak ) = 0,
k!
k=0
und durch Koeffizientenvergleich die Rekursionsformel

ak+2 = (2k − λ) ak (k = 0, 1, 2, . . .) .
Bei gegebenen a0 = u(0), a1 = u (0) sind dann a2 , a3 , . . . eindeutig bestimmt.
Die zugehörige Reihe liefert die Lösung des AWP (∗) auf .
(b) Polynomlösungen vom Grad n gibt es genau für λ = 2n, n = 0, 1, 2, . . . .
Jede Polynomlösung ist durch ihren höchsten Koeffizienten eindeutig festgelegt.
Setzen wir diesen gleich 2n , so ergibt sich das n–te Hermite–Polynom ÜA
n!
Hn (x) = (−1)k (2 x)n−2k .
k! (n − 2k)!
0≤2k≤n
(c) Die Hermite–Polynome besitzen eine erzeugende Funktion: Es gilt

∞
f ür x ∈ , |t| 1 .
2 Hn (x)
e−t +2tx
= tn
n!
n=0
2 2 2 2
∞
ξ2m
Beweis als ÜA : Mit ξ := t − x gilt e−t +2xt
= ex e−ξ = ex (−1)m m!
.
m=0
Entwickeln Sie ξ 2m = (t − x)2m nach der Binomialformel, und ordnen Sie die
entstehende Doppelreihe nach den Potenzen tn .
(d) Es gelten die Formel von Rodrigues
2 dn −x2
Hn (x) = (−1)n ex e .
dxn
und die Rekursionsformeln
Hn+1 (x) = 2 x Hn (x) − 2 n Hn−1 (x) für n = 1, 2, . . . .
Beweis als ÜA : Beachten Sie für die Formel von Rodrigues, dass nach (c) mit
ξ =t−x
dn −t2 +2tx 2 d
n 2
Hn (x) = n
e = (−1)n ex n
e−ξ ξ=x
dt t=0 dξ
gilt. Die Rekursionsformeln ergeben sich durch Differentiation der Reihendar-
stellung (c) nach t und Koeffizientenvergleich.
(d) Satz. Eine Lösung u der Hermiteschen DG ist genau dann ein Polynom,
wenn

+∞
2
e−x u(x)2 dx < ∞ .
−∞
Beweis.
1 2
(i) Zu jeder Polynomlösung u gibt es eine Konstante C mit e− 2 x u(x)2 ≤ C
Ê −1 2
für alle x ∈ . Also liefert C e 2 eine Majorante für den Integranden.
x
(ii) Die Lösung u sei kein Polynom. Aus (b) folgt λ = 2n für n = 0, 1, . . . . Wir
zerlegen u in den geraden und den ungeraden Anteil,

∞
x2k
∞
x2k+1
u(x) = a2k + a2k+1 = u0 (x) + x u1 (x) .
(2k)! (2k + 1)!
k=0 k=0
Im Fall a0 = 0 folgt aus der Rekursionsformel für die Koeffizienten
)
n−1
a2n = a0 (4k − λ) = 0 für n = 0, 1, 2, . . . .
k=0
Wir zeigen, dass es in diesem Fall eine Konstante c0 > 0 gibt mit
1 2
(∗) e− 2 x |u0 (x)| ≥ 1
c
2 0
für |x| 1 .
Wir fixieren ein N ∈

mit 2N ≥ λ+2. Für k ≥ N gilt dann 4k−λ ≥ 2(k+1),
und wir erhalten für n ≥ N + 1
*
N−1
*
n−1
| a2n | ≥ | a0 | | 4k − λ | 2(k + 1)
k=0 k=N
* | 4k − λ | n−1
N−1
* *
n−1
= | a0 | 2(k + 1) = c0 2(k + 1)
2(k + 1)
k=0 k=0 k=0
(2n)!
= c0 2n (2n − 2) · · · 2 > c0 .
2n n!
Da die a2k für k ≥ N alle dasselbe Vorzeichen haben, folgt

N
a2k
∞
a2k 2k
|u0 (x)| = x2k + x
k=0 (2k)! (2k)!
k=N+1
|a2k | 2k
∞ N
|a2k | 2k
≥ x − x
(2k)! (2k)!
k=N+1 k=0

∞
x2k
N
|a2k | 2k 1 2
≥ c0 k
− x = c0 e 2 x − p0 (x)
2 k! (2k)!
k=N+1 k=0
mit einem Polynom p0 . Hieraus folgt die Abschätzung (∗).

Nun zeigen wir, dass es im Fall a1 = 0 eine Konstante c1 > 0 gibt mit
1 2
(∗∗) e− 2 x |u1 (x)| ≥ 1
c
2 1
für |x| 1 .
Da λ nicht geradzahlig ist, liefert die Rekursionsformel für die Koeffizienten
)
n−1
a2n+1 = a1 (4k + 2 − λ) = 0 für k = 0, 1, 2, . . . .
k=0
Sei 2N ≥ λ . Für k ≥ N gilt 4k + 2 − λ ≥ 2(k + 2) ; für n ≥ N + 1 ist daher

)
N−1 )
n−1
|a2n+1 | ≥ |a1 | (4k + 2 − λ) 2(k + 2)
k=0 k=N
* 4k + 2 − λ n−1
N−1
*
= |a1 | 2(k + 2)
2(k + 2)
k=0 k=0
(2n + 1)!
≥ c1 (2n + 2)2n(2n − 2) · · · 4 > c1 .
2n n!
Hieraus ergibt sich wie oben die Abschätzung
1 2
|u1 (x)| ≥ c1 e 2 x − p1 (x)
mit einem Polynom p1 und damit die Abschätzung (∗∗).

Im Fall a1 = 0 gilt a0 = 0, und aus (∗) folgt
2 2
e−x |u(x)|2 = e−x |u0 (x)|2 ≥ 1
4
c20 für |x| 1 .
2
Entsprechend folgt im Fall a0 = 0 aus (∗∗), dass e−x |u(x)|2 nicht integrierbar
ist. Im Fall a0 = 0, a1 = 0 haben u0 (x) und u1 (x) für |x| 1 nach (∗) bzw.
(∗∗) jeweils festes Vorzeichen. Da u0 (x) eine gerade und x u1 (x) eine ungerade
Funktion ist, haben beide entweder für x 1 oder für x −1 dasselbe
Vorzeichen. Es gilt also |u(x)| = |u0 (x)| + |x u1 (x)| ≥ |u0 (x)| entweder für
2
x 1 oder für x −1 , so dass e−x |u(x)|2 nicht über Ê
integrierbar ist. 2
4 Reihendarstellung von Lösungen in singulären Randpunkten

4.1 Schwach singuläre Randpunkte
Wie in Abschnitt 3 betrachten wir die DG (∗) mit gegebenem λ und schreiben
diese in der Form
u + Gu + H u = 0 in I = ]α, β[ .
Wir betrachten den Fall, dass die DG im linken Randpunkt α von I schwach
singulär ist, d.h. dass α ∈ Ê
ist und Folgendes gilt:
(i) G ist analytisch und besitzt in α einen Pol höchstens erster Ordnung,
(ii) H ist analytisch und besitzt in α einen Pol höchstens zweiter Ordnung.
Entsprechend definieren wir schwache Singularitäten im rechten Endpunkt β
von I.
Im folgenden betrachten wir stets den linken Endpunkt als schwach singuläre
Stelle. Die hierfür gewonnenen Aussagen übertragen sich durch die Spiegelung
x → α + β − x auf den rechten Randpunkt β von I, falls I beschränkt ist.
Beispiele. (a) Die Besselsche DG, die wir in der Form

1 ν2
u (x) + u (x) + λ− u(x) = 0 in I = ]0, ∞[
x x2
schreiben, ist schwach singulär im Nullpunkt.

(b) Die Legendresche DG in der Form
2x λ
u (x) − u (x) + u(x) = 0 in I = ] − 1, 1[
1 − x2 1 − x2
ist in beiden Randpunkten schwach singulär, da 1 − x2 = (1 + x)(1 − x) dort
jeweils eine Nullstelle erster Ordnung hat.
4 Reihendarstellung von Lösungen in singulären Randpunkten 81
4.2 Ein Beispiel für das Lösungsverhalten nahe singulärer Punkte

Für die Eulersche Differentialgleichung
x2 u (x) + axu (x) + bu(x) = 0 für x > 0 (a, b ∈ Ê) ,
ist 0 ein schwach singulärer Randpunkt. Der Lösungsansatz
u(x) = xμ = eμ log x
liefert genau dann eine (evtl. komplexwertige) Lösung, wenn μ die Gleichung
(∗) μ(μ − 1) + aμ + b = 0
erfüllt ÜA . Wir haben drei Fälle zu unterscheiden:
(a) (∗) hat zwei reelle Wurzeln μ1 = μ2 . Dann liefern u1 (x) = eμ1 x , u2 = eμ2 x
ein reelles Fundamentalsystem, denn ihre Wronski–Determinante hat an der
Stelle 1 den Wert μ2 − μ1 = 0, vgl. 2.1 (c).
Ê
(b) (∗) hat genau eine Wurzel μ = 12 (1 − a) ∈ . Dann liefert u1 (x) = xμ eine
Lösung ohne Nullstellen in ]0, ∞[. Das d’Alembertsche Verfahren 2.2 ergibt als
zweite Fundamentallösung ÜA
u2 (x) = xμ log x .
(c) (∗) hat zwei nichtreelle Wurzeln μ1 = λ + iω, μ2 = μ1 mit ω > 0. Dann
liefert u(x) = xμ1 = xλ xiω = xλ eiω log x eine komplexwertige Lösung, also
liefern Real– und Imaginärteil
u1 (x) = xλ cos(ω log x) , u2 (x) = xλ sin(ω log x)
reellwertige Lösungen. Diese bilden ein reelles Fundamentalsystem, denn die
Wronski–Determinante an der Stelle 1 ist W (1) = ω = 0 ÜA .
Das Auftreten von Termen (x − α)μ und (x − α)μ log(x − α) im Fall eines
schwach singulären linken Randpunkts α ist typisch, wie sich im Folgenden
zeigen wird.
4.3 Der Reihenansatz von Frobenius

(a) Normalisierung der Differentialgleichung. Die Untersuchung der Lö-
sungen von u + G u + H u = 0 auf I = ]α, β[ in der Nähe des schwach
singulären Randpunkts α kann auf das Studium der Gleichung
(N ) x2 v (x) + xA(x)v (x) + B(x)v(x) = 0 in ]0, r[
mit r = β − α zurückgeführt werden, wobei A und B in einer Umgebung des
Nullpunkts analytisch sind, also Potenzreihenentwicklungen

∞
∞
A(x) = αk xk , B(x) = βk xk
k=0 k=0
mit Konvergenzradius r > 0 besitzen. Dies geschieht wie folgt.

Nach Voraussetzung können wir die Ausgangs–Differentialgleichung durch Mul-
tiplikation mit (x − α)2 in folgende Form bringen
(x − α)2 u (x) + (x − α) A(x − α) u (x) + B(x − α) u(x) = 0 ,
wobei
A(x) = −x G(x + α) , B(x) = x2 H(x + α)
in einer Nullpunktsumgebung analytisch sind. Genau dann ist u eine Lösung in

]α, β[ , wenn v(x) := u(x + α) eine Lösung von (N ) in ]0, r[ liefert.
Ist β ein schwach singulärer rechter Randpunkt, so bringen wir die Differential-
gleichung u + G u + H u = 0 in die Form
(β − x)2 u (x) − (β − x)A(β − x)u (x) + B(β − x)u(x) = 0
mit
A(x) = −x G(β − x) , B(x) = x2 H(β − x) .
Genau dann ist u eine Lösung in ]α, β[, wenn durch v(x) := u(β −x) eine Lösung
von (N ) in ]0, β − α[ gegeben ist.
(b) Reihenansatz. Wir suchen komplexwertige Lösungen v von (N ), die sich

für 0 < x < r (r wie oben) durch eine verallgemeinerte Potenzreihe

∞
v(x) = xμ cn xn (c0 = 0, μ ∈ )
n=0

∞
darstellen lassen, wobei die Potenzreihe cn xn für |x| < r konvergiert und
n=0
xμ für x > 0 durch eμ log x definiert ist. Für solche Funktionen gilt

∞
∞
∞
v (x) = μ xμ−1 cn xn + xμ ncn xn−1 = xμ−1 (n + μ)cn xn ,
n=0 n=0 n=0

∞
v (x) = x μ−2
(n + μ)(n + μ − 1)cn x . n
n=0
Setzen wir das in (N ) ein, so erhalten wir nach Division durch xμ

∞
∞
∞
(n + μ)(n + μ − 1)cn xn + αj xj (k + μ)ck xk
n=0 j=0 k=0

∞
∞
+ βj xj ck xk = 0.
j=0 k=0
Wir multiplizieren die Reihen nach der Cauchy–Produkt–Formel Bd. 1, § 7 : 7.1,

ordnen nach Potenzen von x und erhalten durch Koeffizientenvergleich

(n + μ)(n + μ − 1) cn + ((k + μ) αj + βj ) ck = 0 (n = 0, 1, 2, . . .).
j+k=n
Mit der Abkürzung
D(λ) := λ (λ − 1) + α0 λ + β0 = λ2 + (α0 − 1) λ + β0
folgt für n = 0 wegen c0 = 0 die Indexgleichung oder charakteristische
Gleichung
(∗) D(μ) = 0,
ferner die Rekursionsformel

n−1
(∗∗) D(n + μ) cn + (k + μ) αn−k + βn−k ck = 0 (n = 1, 2, . . .).
k=0
Damit ergeben sich nach Vorgabe von c0 alle Koeffizienten c1 , c2 , . . . , sofern die
Auflösebedingungen
D(n + μ) = 0 für n = 1, 2, . . .
erfüllt sind. In den folgenden drei Abschnitten legen wir c0 = 1 fest.
(c) Satz von Frobenius (1873). Ist μ eine Lösung der charakteristischen
Gleichung D(μ) = 0 mit D(n + μ) = 0 für n = 1, 2, . . . , und sind die Koef-
fizienten c1 , c2 , . . . aus der Rekursionsformel (∗∗) bestimmt, so konvergiert die

∞
Reihe cn xn für |x| < r, und
n=0

∞
v(x) = xμ cn xn
n=0
ist eine Lösung der Differentialgleichung (N ) für 0 < x < r.

Der Konvergenzbeweis für die Reihe besteht in der Aufstellung einer geeigneten
Majorante; wir verweisen auf Heuser [9] § 28, Joergens–Rellich [111] § 7.
Die Verwendung von verallgemeinerten Potenzreihen geht schon auf Euler
(1766) zurück.
4.4 Bestimmung von Fundamentalsystemen in der Nähe singulärer

Randpunkte
Wir gehen von der normalisierten Form
(N ) x2 v (x) + xA(x)v (x) + B(x)v(x) = 0
der DG aus mit

∞
∞
A(x) = αk xk , B(x) = βk xk für | x | < r.
k=0 k=0
Dabei setzen wir voraus, dass die charakteristische Gleichung D(μ) = 0 nur
reelle Wurzeln μ1 , μ2 besitzt, was der für die Anwendungen wichtigste Fall ist.
Wir nehmen μ1 ≥ μ2 an.
Satz. Die normalisierte Gleichung (N ) besitzt auf dem Intervall ]0, r[ ein Fun-
damentalsystem v1 , v2 der Gestalt

∞
∞
v1 (x) = xμ1 cn xn , v2 (x) = xμ2 dn xn + γ v1 (x) log x .
n=0 n=0
Dieses ist eindeutig bestimmt durch c0 = 1 sowie

γ = 0, d0 = 1, wenn μ1 − μ2 keine ganze Zahl ist,
γ = 1, d0 = 0, im Fall μ1 = μ2 ,
d0 = 1, dm = 0, wenn μ1 − μ2 eine natürliche Zahl m ist.
Die Lösung v1 ergibt sich in jedem der drei Fälle mit der Methode von Fro-
benius 4.3, da die Auflösebedingungen D(n + μ1 ) = 0 für alle n ∈ erfüllt

sind. Im Fall μ1 − μ2 ∈ 0 ergibt sich auch v2 nach der Methode 4.3 wegen
D(n + μ2 ) = 0 für n ∈ .

Wegen 4.3 (c) bleibt im Fall μ1 − μ2 ∈ 0 nur zu zeigen, dass v1 und v2 ein
Fundamentalsystem bilden. Die Bestimmung der noch fehlenden Koeffizienten

im Fall μ1 − μ2 ∈ 0 wird anschließend beschrieben.
Machen wir die Transformation 4.3 (a) rückgängig, so erhalten wir für die Ori-
ginalgleichung a2 u + a1 u + a0 u = 0 im Fall eines schwach singulären linken
Randpunkts α die Fundamentalsysteme:

∞
u1 (x) = (x − α)μ1 cn (x − α)n ,
n=0

∞
u2 (x) = (x − α)μ2 dn (x − α)n + γ u1 (x) log(x − α) .
n=0
Im Fall eines schwach singulären rechten Randpunkts β ergibt sich

∞
u1 (x) = (β − x)μ1 cn (β − x)n ,
n=0

∞
u2 (x) = (β − x)μ2 dn (β − x)n + γ u1 (x) log(β − x) ,
n=0
wobei die Koeffizienten cn , dn , γ dieselben wie oben sind.

Dieser Satz gestattet es in den meisten Fällen, durch bloßes Lösen der quadra-
tischen Gleichung (∗) das Verhalten der Lösungen in Umgebung schwach sin-
gulärer Randpunkte zu beschreiben. Eine Ausnahme bildet der Fall μ1 −μ2 ∈ ,
bei dem nicht von vornherein zu sehen ist, ob der Logarithmusterm auftritt oder
nicht.
Bestimmung der Koeffizienten im Fall m := μ1 − μ2 ∈ . 0
Wir machen den Ansatz

∞
v2 (x) = w(x) + γ v1 (x) log x mit w(x) = xμ2 dn x n .
n=0
(Die Begründung dieses Ansatzes wird im Beweis gegeben.)

Ein kurze Rechnung zeigt ÜA : Genau dann ist v2 ein Lösung von (N ), wenn

(1) x w (x) + x A(x)w (x) + B(x)w(x) = γ (1 − A(x))v1 (x) − 2x v1 (x) .
2

∞
Wir entwickeln die rechte Seite für |x| < r in eine Reihe γ xμ1 λk x k .
k=0

∞
Wegen v1 (x) = xμ1 −1 (n + μ1 )cn xn (vgl. 4.3) und c0 = 1 wird dabei λ0 =
n=0
(1 − α0 ) − 2μ1 . Aus (∗) folgt 1 − α0 = μ1 + μ2 nach dem Vietaschen Satz, also
(2) λ0 = μ2 − μ1 = −m .
Setzen wir die Reihe für w in (1) ein, so erhalten wir wie in 4.3
∞

n−1
∞
xμ2 D(n + μ2 )dn + (k + μ2 )αn−k + βn−k dk xn = γ xμ1 λk x k .
n=0 k=0 k=0
μ2
Daraus folgt nach Division durch x mittels Koeffizientenvergleich
(

n−1
0 für n < m
(3) D(n + μ2 )dn + (k + μ2 )αn−k + βn−k dk = .
k=0
γ λn−m für n ≥ m
(4) Im Fall μ1 = μ2 setzen wir γ = 1, d0 = 0.
Nach (2) ist λ0 = 0. Wegen d0 = 0 ist daher (3) für n = 0 erfüllt. Da die
Auflösebedingungen D(n + μ2 ) = D(n + μ1 ) = 0 für alle n ∈ gelten, ergeben
sich d1 , d2 , . . . eindeutig durch Rekursion.
Im Fall m = μ1 − μ2 ∈ beachten wir, dass
D(μ2 ) = D(m + μ2 ) = 0 und D(k + μ2 ) = 0 für k = 1, . . . , m − 1 .
Daher bestimmen die Rekursionsformeln (3), beginnend mit d0 = 1, die Koeffi-

zienten d1 , . . . , dm−1 eindeutig. Für n = m erhalten wir

m−1
(5) (k + μ2 )αn−k + βn−k dk = γ λ0 = −m γ wegen (2).
k=0
Dadurch ist γ festgelegt. Setzen wir dm := 0, so ergeben sich dm+1 , dm+2 , . . .

wieder in eindeutiger Weise.
Zu zeigen bleibt: Die mit den so bestimmten Koeffizienten gebildete Reihe

∞
v2 (x) = xμ2 dn xn + γ v1 (x) log x konvergiert für 0 < x < r und liefert
n=0
eine von v1 linear unabhängige Lösung v2 .
Beweis des Satzes 4.4.

setzen wir
∞ ∞
(a) Im Fall μ1 − μ2 ∈ w1 (x) := cn xn , w2 (x) := dn x n .
n=0 n=0
Nach 4.3 konvergieren diese Reihen für |x| < r, und v1 (x) = xμ1 w1 (x), v2 (x) =
xμ2 w2 (x) liefern Lösungen von (N ) mit
+ ,
v1 v2
= xμ1 +μ2 −1 (μ2 − μ1 )w1 w2 + x w1 w2 .
v1 v2 w1 w2
Dabei ist lim [. . .] = μ2 − μ1 = 0, also verschwindet die Wronski–Determinante

x→0
von v1 und v2 für kleine positive x nicht und damit nirgendwo in ]0, r[. Machen
wir die Substitution 4.3 (a) rückgängig, so ergibt sich u1 (x)u2 (x)−u1 (x)u2 (x) =
0 in ]α, β[ ÜA .

. Nach 4.3 (c) hat die Reihe
∞
(b) Sei μ1 − μ2 = m ∈ 0 cn z n den Konver-
n=0
genzradius r, definiert also eine für z ∈ , |z| < r holomorphe Funktion w1 .
Wegen c0 = w(0) = 1 gibt es ein > 0 mit w1 (z) = 0 für |z| < , also auch
v1 (x) = xμ1 w1 (x) > 0 für 0 < x < ≤ r. Daher können wir in ]0, [ das Verfah-
ren von d’Alembert 2.3 anwenden: Setzen wir x0 := 12 und für | x − x0 | < 12
x x A(t)
dt
ϕ(x) := mit p(x) := exp dt
p(t) v1 (t)2 t
x0 x0
nach 2.1, so liefert v2 (x) = c (ϕ(x) + d)v1 (x) für alle Konstanten c, d ∈ mit
c = 0 eine von v1 linear unabhängige Lösung v2 . Wir geben eine Reihenentwick-
lung für v2 an. Wegen μ1 + μ2 = 1 − α0 ist
x
∞
α0
p(x) = exp + αk+1 tk dt = exp α0 log x + f (x)
t
k=0
x0
α0 f (x) 1−μ1 −μ2 f (x)

= x e = x e ,
wobei die Reihe

∞
αk
∞
αk
f (x) = − α0 log x0 − xk0 + xk
k k
k=1 k=1
den Konvergenzradius r hat. Damit lässt sich f zu einer für |z| < r holomorphen
Funktion z → f (z) fortsetzen, und g(z) = w1 (z)2 ef (z) ist eine für |z| <
holomorphe Funktion ohne Nullstellen. Es gibt also eine für |z| < konvergente
Potenzreihenentwicklung
1 ∞
= ωk z k mit ω0 = 0 .
g(z) k=0
Für | x − x0 | < 1
2
gilt p(x) v1 (x)2 = x1−μ1 −μ2 ef (x) x2μ1 w1 (x)2 = xm+1 g(x),
also
x x x
dt −m−1
∞
k
∞
ϕ(x) = = t ωk t dt = ωk tk−m−1 dt
tm+1 g(t) k=0 k=0
x0 x0 x0

∞
ωk k−m
= x − xk−m + ωm log x − ωm log x0
k−m 0
k=0
k=m
= h0 + x−m h(x) + ωm log x
mit einer geeigneten Konstanten h0 und einer Funktion h, die sich für |x| <

∞
in der Form h(x) = ξk xk mit ξ0 = 0 darstellen lässt. Wir erhalten so
k=0

v2 (x) = c h0 + d + x−m h(x) xμ1 w1 (x) + c ωm v1 (x) log x

= c xμ2 h(x) w1 (x) + xm (h0 + d)w1 (x) + γ v1 (x) log x .
Durch passende Wahl von c und d erhalten wir wegen c0 = 1 eine Reihenent-

∞
wicklung v2 (x) = xμ2 dn xn + γ v1 (x) log x mit d0 = 1, dm = 0. Dass diese
n=0
sogar im vollen Intervall |x| < r konvergiert, wird in Jörgens–Rellich [111] § 7
gezeigt. 2
4.5 Die allgemeine Legendresche Differentialgleichung

m2
(Lλm ) (1 − x2 )u − 2xu + λ− u = 0 für − 1 < x < 1
1 − x2

mit Index m ∈ 0 fällt bei der Separation der dreidimensionalen Wellenglei-
chung nach Einführung von Kugelkoordinaten an, siehe § 15 : 3. In 3.2 wurde
der Fall m = 0 behandelt.
Durch Anwendung der Methode 4.4 kommen wir zu dem folgenden Satz, den
wir der Übersichtlichkeit halber voranstellen.
Satz. Für m = 0, 1, . . . besitzt die Legendresche Differentialgleichung (Lλm ) ge-

nau dann eine in ]−1, 1[ beschränkte Lösung u = 0, wenn
λ = ( + 1) mit ∈ {m, m + 1, . . . } .
Für λ = ( + 1) ist jede beschränkte Lösung ein konstantes Vielfaches der
zugeordneten Legendre–Funktion
dm
P m (x) = (1 − x2 )m/2 P (x) ,
dxm
wobei P das –te Legendre–Polynom ist, vgl. 3.2.
Auf die Eigenschaften der Legendre–Polynome gehen wir in § 15 : 3 näher ein.
Für den Beweis benötigen wir folgenden
Hilfssatz. Jede auf ]−1, 1[ beschränkte Lösung u von (Lλm ) ist von der Form
u(x) = c (1 − x2 )m/2 f (x)

√
mit einer für |z| < 3 holomorphen Funktion f und einer Konstanten c.
Zum Beweis des Hilfssatzes gehen wir gemäß 4.4 vor.

(a) Wir betrachten die Normalisierung xv + xA(x)v + B(x)v = 0 im linken
Randpunkt α = −1. Es ergibt sich gemäß 4.3 (a) ÜA
∞
−2x(x − 1) x−1 1 x k
A(x) = x = 2 = 2− = 1− ,
1 − (x − 1)2 x−2 1− x
2
2
k=1
m2 m2
2
λ− (x−1)2 2
λ− 2x−x2 m2 − λ(2x − x2 )
B(x) = x = x =
1 − (x − 1)2 2x − x2 (x − 2)2
λx 1 m2 1 λx 1 m2 d 1
= − + = − +
2 1− x
2
4 1− x 2
2 1− x
2
2 dx 1 − x
2
2
∞ k−1
λx x k m2
∞
x
= − + k
2 2 4 2
k=0 k=0
∞
m2 m 2
x k
= − − λ+ (k + 1) .
4 4 2
k=1
Die Indexgleichung lautet also
m2 m2
0 = D(μ) = μ(μ − 1) + α0 μ + β0 = μ(μ − 1) + μ − = μ2 − ;
4 4
diese besitzt die Wurzeln μ1 = m

2
und μ2 = − m2
. Nach 4.4 finden wir für (Lλm )
ein Fundamentalsystem v1 , v2 mit den Eigenschaften:

∞
v1 (x) = xm/2 w(x) , wobei w(z) = ncn z n für |z| < 2
n=1
konvergiert und v2 (x) unbeschränkt ist für x → 0+.

( ÜA . Im Fall m = 1, 2, . . . ist zu beachten, dass x−m/2 für x → 0+ stärker als
| log x| gegen Unendlich strebt.)
Hiernach ist jede beschränkte Lösung der normalisierten DG ein Vielfaches der
Funktion v1 .
(b) Gehen wir zur Originaldifferentialgleichung (Lλm ) zurück, so erhalten wir
aus (a) die Existenz einer für |z + 1| < 2 holomorphen Funktion w1 , so dass jede
beschränkte Lösung von (Lλm ) Vielfaches von (x + 1)m/2 w1 (x) ist; wir haben
nur w1 (z) = w(z + 1) zu setzen.
Die analoge Betrachtung für den rechten Randpunkt β = 1 liefert die Existenz
einer für |z − 1| < 2 holomorphen Funktion w2 , so dass jede beschränkte Lösung
von (Lλm ) Vielfaches von (1 − x)m/2 w2 (x) ist. ( ÜA Beachten Sie: Mit u ist
auch x → u(−x) eine Lösung.)
Liefert u(x) := (x + 1)m/2 w1 (x) eine beschränkte Lösung, so gibt es also ein
Ê
c ∈ mit u(x) = c (1 − x)m/2 w2 (x). Setzen wir
f1 (z) := (1 − z)−m/2 w1 (z) , f2 (z) := c (1 + z)−m/2 w2 (z) ,
so ist f1 holomorph in der Kreisscheibe K2 (−1), f2 holomorph in K2 (1), und es

gilt für −1 < x < 1
f1 (x) = (1 − x)−m/2 (1 + x)−m/2 u(x) = c (1 + x)−m/2 w2 (x) = f2 (x) .
Nach dem Identitätssatz für holomorphe Funktionen stimmen f1 √ und f2 im

Bereich K2 (−1) ∩ K2 (1) überein, welcher den Kreis KR (0) mit R = 3 enthält
(Skizze!). Sie dürfen daher zu einer auf K2 (−1) ∪ K2 (1) holomorphen Funktion
f verklebt werden. Es ist dann
u(x) = (1 − x)m/2 (1 + x)m/2 f (x) = (1 − x2 )m/2 f (x) . 2
Beweis des Satzes.

Nach dem Hilfssatz geht es um die Frage, wann es beschränkte nichttriviale
Lösungen u der Form u(x) = (1 − x2 )m/2 f (x) gibt. Solche Lösungen u erfüllen
die Gleichung (Lλm ) genau dann ÜA , wenn
(Rλm ) (1 − x2 ) f (x) − 2(m + 1)xf (x) + (λ − m(m + 1)) f (x) = 0 .

(a) Ist v eine Lösung von (Rλm ), so ist v eine Lösung von (Rλm+1 ) ÜA . Nun
( +1)
erfüllt das Legendre–Polynom P die Gleichung (R0 ), somit löst P m die
( +1)
Gleichung (Rm ).
Damit haben wir für λ = ( + 1) die offensichtlich beschränkte Lösung
u(x) = (1 − x2 )m/2 P m (x)

( +1)
von (Lm ), wie behauptet.

(b) Sei λ nicht von der Form ( + 1) mit ∈ 0 . Nach dem Hilfssatz ist jede
beschränkte Lösung ein Vielfaches von u(x) = (1 − x2 )m/2 f (x) , wobei

∞ √
(∗) f (x) = an xn (Konvergenzradius ≥ 3 > 1)
n=0
die Gleichung (Rλm ) erfüllt. Einsetzen der Reihe für f in diese DG und Koeffi-
zientenvergleich liefert für die an die Rekursionsformel ÜA
(m + n)(m + n + 1) − λ
(∗∗) an+2 = an (n = 0, 1, 2, . . .) .
(n + 1)(n + 2)
Wir zeigen, dass die
√ Reihe (∗) mit den nach (∗∗) bestimmmten Koeffizienten
nur dann für |x| < 3 konvergieren kann, wenn a0 = a1 = 0. Wegen (∗∗) folgt
dann a2 = a3 = s = 0, d.h. jede beschränkte Lösung ist die Nullfunktion.
Ist beispielsweise a0 = 0, so folgt aus (∗∗) wegen der Bedingung für λ, dass

a2n = 0 für alle n ∈ 0 und dass
a2n+2
lim = 1.
n→∞ a2n
√
Wir wählen ein r mit 1 < r < 3. Dann gibt es ein N ∈ mit
a2k+2 1
≥ 2 für k ≥ N . Daraus folgt für n > N
a2k r
+ ,
a2n 2
a2n r2n = a0 a2 · · · a2N r2N a2N+2 r2 · · ·
a0 a2N−2 a2N a2n−2 ≥ c ,
r
wo c = | [. . .] | > 0. Also ist (a2n r 2n ) keine Nullfolge; die Reihe für f divergiert
für x = r. Entsprechend argumentieren wir im Fall a1 = 0. 2
4.6 Die allgemeine Laguerresche Differentialgleichung
(Mλm ) xu + (m + 1 − x) u + λu = 0 für x > 0 , m = 0, 1, . . .

tritt bei der quantenmechanischen Behandlung des Wasserstoffatoms auf, siehe
Heuser [9] V.33.
Hierbei sind nur beschränkte Lösungen u = 0 von Interesse, für die

∞
(∗) xm e−x | u(x) |2 dx < ∞ .
0
Durch Anwendung der Methode 4.4 und Übertragung der Schlüsse von 4.5 er-
halten wir den folgenden
Satz. (a) Für m = 0, 1, . . . besitzt die Gleichung (Mλm ) genau dann nichttri-

viale Lösungen u mit (∗), wenn λ = n mit n ∈ 0 . Die Lösungen sind für
m = 0 konstante Vielfache der Laguerre–Polynome
n
n (−x)k
Ln (x) :=
k k!
k=0
und für m = 1, 2, . . . konstante Vielfache der zugeordneten Laguerre–Poly-

nome
dm
Lm
n (x) := (−1)
m
Lm+n (x) .
dxm
Bemerkung. Die Normierung der Laguerre–Polynome ist in der Literatur nicht

einheitlich.
(b) Wie für Legendre– und Hermite–Polynome gibt es auch für die Laguerre–
Polynome eine Darstellung als n–fache Ableitung (Rodrigues–Formel)
1 ex dn n+m −x
Lm
n (x) =
n! xm dxn
x e (n, m ∈ ).
0
Letztere sei dem Leser als ÜA überlassen (Berechnung der linken und rechten
Seite nach der Leibniz–Regel).
Beweis.
(i) Die normalisierte Gestalt von (Mλm ) im linken Randpunkt α = 0 lautet
mit den Bezeichungen von 4.3
x2 v + x A(x) v + B(x) v = 0 mit A(x) = m + 1 − x , B(x) = λx .
Somit ergibt sich die Indexgleichung D (μ) = μ(m + μ) = 0 mit den Wurzeln
μ1 = 0, μ2 = −m. Nach 4.4 erhalten wir ein Fundamentalsystem u1 , u2 durch

∞
∞
u1 (x) = ck xk , u2 (x) = x−m dk xk + γ u1 (x) log x
k=0 k=0
mit c0 = 1, d0 = 1 für m = 0 und d0 = 0, γ = 1 im Fall m = 0. Die für x → 0+

beschränkten Lösungen sind Vielfache von u1 . Denn es gilt lim u1 (x) = c0 = 1,
x→0+
und u2 (x) ist nahe des Nullpunkts unbeschränkt. Für m = 0 verursacht dies der
Logarithmus, für m ∈
wegen d0 = 1 der Vorfaktor x−m .
(ii) Die Rekursionsformeln 4.3 (∗∗) für die ck lauten wegen μ1 = 0
k−1−λ
(∗∗) ck = ck−1 für k = 1, 2, . . . .
k(m + k)
Somit existieren Polynomlösungen genau dann, wenn λ = n mit n ∈ . Der
0
Grad dieser Polynome ist n. Im Fall m = 0 ergibt sich mit c0 = 1 ÜA

n 1
ck = (−1)k (k = 0, 1, . . .) .
k k!
Um den Fall m ∈ auf diesen zurückzuspielen, beachten wir:
u löst ( Mλk ) =⇒ u löst ( Mλ−1
k+1 ) ÜA .
Durch m–malige Anwendung dieses Schlusses ergibt sich
u löst ( Mλ0 ) =⇒ u(m) löst ( Mλ−m

m ).
(m)
Da Ln+m eine Lösung von (Mn+m 0 ) ist, liefert Ln+m eine Lösung von (Mn
m)
und spannt die für x → 0+ beschränkten Lösungen auf.
Für Polynomlösungen ist die Bedingung (∗) offenbar erfüllt.

(iii) Ist λ ∈ 0 , so erfüllt keine Lösung u = 0 die Bedingung (∗). Dazu haben
wir nach (i) zu zeigen: Hat u1 = 0 die durch (∗∗) bestimmten Koeffizienten
(c0 = 1), so divergiert das Integral
∞
xm e−x u1 (x)2 dx .
0
Zum Nachweis zeigen wir, dass es ein Polynom p und eine Konstante c > 0 gibt,
so dass für x > 0
1
| u1 (x) | ≥ c e 2 x − p(x) .
Dazu wählen wir ein N ∈ mit N ≥ m + 2 + 2| λ |. Für n ≥ N gilt dann

n−1−λ 1
2(n − 1 − λ) ≥ 2(n − 1 − |λ|) ≥ m + n , also ≥ .
m+n 2
Aus der Rekursionsformel (∗∗) mit c0 = 1 folgt
−λ 1 − λ N −λ N +1−λ k − 1 − λ xk
ck xk = ··· ··· .
m+1m+2 m+N +1 m+N +2 m + k k!
Für k > N haben diese Glieder ein festes Vorzeichen, und mit C = | [. . .] | gilt
k−N−1 k k
1 xk x 1 c x
|ck xk | ≥ C = 2 C 2N = ,
2 k! 2 k! k! 2
wobei c = 2C 2N . Daher ist

N
∞
∞
N
| u1 (x) | = ck xk + ck xk ≥ ck xk − | ck | xk
k=0 k=N+1 k=N+1 k=0

∞
N
1 x k
≥ c − | ck | xk = c ex/2 − p(x)
k! 2
k=N+1 k=0
mit einem geeigneten Polynom p. 2
4.7 Die Besselsche Differentialgleichung vom Index ν ≥ 0

x2 u + x u + (x2 − ν 2 ) u = 0 für x > 0
entsteht aus der allgemeinen Besselschen Differentialgleichung in 1 (b) mit Para-
meter λ > 0 durch Umskalierung:
√ Ist v eine Lösung der allgemeinen Gleichung,
so löst u(x) := v(x/ λ) die Besselsche DG mit λ = 1 und umgekehrt ÜA .
Wir bestimmen Fundamentalsysteme für den linken Randpunkt 0 nach der Me-
thode von Frobenius.
(a) Die erste Fundamentallösung nach Frobenius. Mit den Bezeichnungen 4.3 (a)
ist
A(x) = 1 , B(x) = x2 − ν 2 .
Also lautet die Indexgleichung D(μ) = μ2 − ν 2 = 0 mit Wurzeln ν und −ν.

∞
Die Rekursionsformeln für die Koeffizienten cn von u1 (x) = xν cn xn lauten
n=0
nach 4.3 (∗∗) wegen D(n + ν) = (n + ν)2 − ν 2 = n(n + 2ν) und α1 = β1 = 0
0 = (1 + 2ν) c1 + (να1 + β1 ) c0 = (1 + 2ν) c1 ,
n(n + 2ν) cn + cn−2 = 0 für n = 2, 3, . . . .
Hieraus folgt c1 = c3 = c5 = . . . = 0 und per Induktion
(−1)n c0 1
c2n = .
n!(ν + 1)(ν + 2) s(ν + n) 4n

∞
Die Reihe c2n z 2n hat die Majorante

n=0

∞ 2n
1 |z| 1
| c0 | = |c0 | exp ( |z|2 ) ,
n! 2 4
n=0
liefert also eine ganze Funktion. Wir erhalten so die für x > 0 definierte Lösung

∞
v1 (x) = xν c2n x2n .
n=0
(b) Satz. Im Fall ν ∈ Ê\ 0 ist

∞ 2n
1 x
v2 (x) = x−ν (−1)n
n!(1 − ν) · · · (n − ν) 2
n=0
eine für x > 0 definierte zweite Fundamentallösung der Besselschen Differen-

tialgleichung.
Beweis.
Nach 4.4 gibt es im Fall 2ν = μ1 − μ2 ∈ 0v eine zweite Fundamentallösung
−ν

∞
n
von der Form v2 (x) = x dn x . Die Koeffizienten ergeben sich wie oben
n=0
durch Rekursion aus D(n − ν)dn = n(n − 2ν)dn = − dn−2 ÜA .
Der Fall 2ν ∈ 0 , ν ∈ 0 , also ν = n + mit n ∈ 0 bedeutet μ1 − μ2 =
1
2
2ν ∈ . Nach Abschnitt 4.4 können in der Lösung logarithmenhaltige Terme
auftreten. Der in 4.4 beschriebene Zugang führt auf langwierige Rechnungen.
Wir umgehen diese, indem wir zeigen, dass durch den Reihenansatz (b) eine
für alle x > 0 definierte Lösung v2 der Besselschen DG gegeben ist, und dass
v1 , v2 linear unabhängig sind, d.h. v1 v2 − v1 v2 = 0.
Die oben angegebene Reihe für v2 (x) xν mit ν ∈ 0 besitzt die Majorante
x2
. Gliedweise
∞
1 1 n
n! 4
mit = dist (ν, ) > 0, konvergiert also auf ganz
n=0
Differentiation und Koeffizientenvergleich unter Berücksichtigung der Rekur-
sionsformeln zeigt, dass v2 die Besselsche DG erfüllt ÜA .
Setzen wir v1 (x) = xν g(x), v2 (x) = x−ν h(x), so folgt ÜA
2ν
v1 (x)v2 (x) − v1 (x)v2 (x) = − g(x) h(x) + g(x) h (x) − g (x) h(x) .
x
Die rechte Seite hat wegen g(0) h(0) = c0 d0 = 0 einen Pol 1. Ordnung in 0,
kann also nicht identisch verschwinden. 2
(c) Die Besselfunktionen. Durch geeignete Festlegung der Koeffizienten c0 ,

d0 erhalten wir für v1 , v2 die Darstellungen
ν
∞ 2n
x 1 x
Jν (x) = (−1)n (ν ≥ 0),
2 n! Γ(n + 1 + ν) 2
n=0
−ν
∞ 2n
J−ν (x) =
x
2
(−1)n
1
n! Γ(n + 1 − ν)
x
2
(ν ∈ \ 0 ).
n=0
Im Fall ν ∈ 0 liefern also Jν , J−ν ein Fundamentalsystem für die Besselsche

DG. Die Darstellung Jν für v1 erhalten wir mit der Wahl c0 = (2ν Γ(ν + 1))−1 .
Die Gammafunktion und ihre Funktionalgleichung Γ(x + 1) = xΓ(x) für x > 0

wurden in Bd. 1, § 12 : 5.5 behandelt. Für ν ≥ 0 ist danach
Γ(n + 1 + ν) = (n + ν) Γ(n + ν) = (n + ν) (n + ν − 1)Γ(n + ν − 1)
= . . . = (n + ν) (n + ν − 1) · · · (ν + 1) Γ(ν + 1) .
Zu der Darstellung von J−ν sei ohne Beweis mitgeteilt, dass sich die Γ–Funktion
unter Wahrung der Funktionalgleichung Γ(z + 1) = z Γ(z) zu einer auf
\ {0, −1, −2, . . .} holomorphen Funktion mit Polen 1. Ordnung an den Stellen
0, −1, −2, . . . fortsetzen lässt und dass dabei
π
Γ(z) Γ(1 − z) = für z ∈ \
sin πz
gilt (Ergänzungsformel). Für diese Hintergrundinformation sei auf Barner–
Flohr [141] 11.3, Heuser [148] Nr. 150 verwiesen. Für unsere Zwecke genügt
es, Γ(x) für x ∈ ]−n, −n + 1] durch
Γ(x + n + 1)
Γ(x) := mit (λ)n := λ(λ + 1) · · · (λ + n − 1)
(x + 1)n
zu definieren. Es ist dann Γ(n + 1 − ν) = (1 − ν)n Γ(1 − ν). Wir haben in der
Darstellung (b) für v2 also d0 := 2ν /Γ(1 − ν) gesetzt.
Aufgaben. (i) Zeigen Sie mit Hilfe der Darstellung (b) und den oben getrof-
fenen Festlegungen von c0 , d0 , dass
2 2
J 1 (x) = sin x , J− 1 (x) = cos x .
2 πx 2 πx
(ii) Berechnen Sie J0 (x) auf 3 Stellen genau. (Benützen Sie für die Fehler-
abschätzung eine geeignete Majorante für die Reihe.)
(d) Für nichtganzzahliges ν > 0 liefert die Neumann–Funktion (Bessel–
Funktion 2. Art)
Jν (x) cos νπ − J−ν (x)
Nν (x) =
sin νπ
(auch mit Yν (x) bezeichnet) eine von Jν linear unabhängige Lösung der Bessel–
DG; ferner bilden die Hankel–Funktionen
Hν(1) (x) := Jν (x) + i Nν (x) , Hν(2) (x) := Jν (x) − i Nν (x)
ein komplexes Fundamentalsystem ÜA .
(e) Eine zweite Fundamentallösung bei ganzzahligem Index.

Für ν = 0 muss die zweite Fundamentallösung nach 4.4 von der Form

∞
u2 (x) = dn xn + J0 (x) log x
n=1
sein. Ist ν ∈ und m = 2ν, so lauten die Gleichungen (3) von 4.4
n(n − ν) dn + dn−2 = 0 für n = 2, . . . , m − 1
und
1
dm−2 = γ λ0 mit λ0 = − < 0.
2ν−1 (ν − 1)!
Wegen d0 = 1 folgt dm−2 = d2(ν−1) = 0, also γ = 0. Daher gibt es eine zweite
logarithmenhaltige Fundamentallösung. Eine längere Rechnung ergibt für die
zweite Fundamentallösung die Darstellung (vgl. Lense [107, S. 70])
2 Cx
Nn (x) = lim Nν (x) = Jn (x) log
ν→n π 2
∞
1 (n − k − 1)! x 2k−n 1 x n
n−1
sk + sn+k x k
− − (−1)k .
π k! 2 π 2 k!(n + k)! 2
k=0 k=0
Dabei ist

n
1

sn = und C = exp lim (sn − log n) .
k n→∞
k=1
(f) Für jedes ν ≥ 0 besitzt Jν abzählbar viele Nullstellen

0 < jν,1 < jν,2 < . . . mit lim jν,k = ∞ .
k→∞
Beweis.
√
Die Funktion u(x) := x Jν (x) genügt der DG ÜA
−2
1
(∗∗) −u (x) + q(x) u(x) = 0 mit q(x) = x ν2 − 4 − 1.
Wir wählen r > 0 so, dass q(x) < − 41 für x > r gilt. Nach der Folgerung aus
dem Nullstellenvergleichssatz 2.6 hat u und damit auch Jν in ]r, ∞[ unendlich
viele Nullstellen. Da die Nullstellen nach 2.5 in ]0, ∞[ keinen Häufungspunkt
besitzen, gibt es abzählbar viele. Wegen J0 (0) = 1 und Jν (0) = 0, Jν (0) > 0
für ν > 0 kann 0 kein Grenzwert einer Folge von Nullstellen sein, d.h. unter
den Nullstellen in ]0, ∞[ gibt es eine kleinste. 2
Bemerkung. Durch Anwendung von Vergleichsargumenten auf die im Beweis

√
verwendete DG (∗∗) für x Jν (x) lassen sich folgende asymptotische Darstel-
lungen herleiten

2 π 1 ν2 − 1
Jν (x) = cos x− ν + + 4
+ Rν (x) ,
πx 2 2 2x
ν2 − 1
ν 1 ν 1
jν,k = π k + − − 4
+ Sν k + − ,
2 4 2π k + ν
2
− 1
4
2 4
wobei
|Rν (x)| ≤ cν x−5/2 , |Sν (x)| ≤ dν x−2
mit passenden Konstanten cν , dν , siehe Birkhoff–Rota [8] Ch. 10.11, Watson

[110] 7.21, 15.53.
Asymptotisch besitzen aufeinander Folgende Nullstellen von Jν also den Ab-
stand π.
(g) Es bestehen die Beziehungen
2ν
Jν−1 (x) + Jν+1 (x) = Jν (x) , Jν−1 (x) − Jν+1 (x) = 2Jν (x) ,
x
ν ν
Jν (x) + Jν (x) = Jν−1 (x) , Jν (x) − Jν (x) = Jν+1 (x) .
x x
Die beiden ersten ergeben sich unmittelbar aus der Reihendarstellung (c). Aus
diesen folgen die beiden letzten durch Addition und Subtraktion ÜA .
Orthogonalitätsrelationen für die Besselfunktionen werden in § 15 : 3.1 hergelei-

tet.
Für weitere Eigenschaften von Besselfunktionen verweisen wir auf Courant–
Hilbert [2], Kap.7, §2, Lebedev [106] Chap. 5, Watson [110].
4.8 Aufgabe
Gegeben sei die hypergeometrische oder Gaußsche Differentialgleichung
x(1 − x) u + (c − (a + b + 1)x)u + abu = 0 in ]0, 1[
mit Konstanten a, b, c ∈ Ê, c ∈/ .
Bestimmen Sie ein Fundamentalsystem u1 , u2 in der Nähe des linken Rand-
punktes α = 0 nach der Methode von Frobenius. Für die Darstellung der
Lösung sind die Abkürzungen gebräuchlich:
(λ)k := λ (λ + 1) · · · (λ + k − 1) , F (a, b, c ; x) := u1 (x)
für λ ∈ und die gemäß 4.4 festgelegte Lösung u1 .

98 § 5 Einführung in die qualitative Theorie
§ 5 Einführung in die qualitative Theorie

1 Autonome Systeme
1.1 Zielsetzung, grundlegende Sätze
Ziel der qualitativen Theorie ist, das Verhalten von Lösungen zu beschreiben,
ohne diese explizit angeben zu müssen. Aussagen über Lösungen werden also
direkt aus der Differentialgleichung abgeleitet und nicht über den Umweg einer
Lösungsformel gewonnen.
Wir betrachten in diesem Paragraphen ausschließlich autonome Systeme
ẏ = f (y) ,
wobei f : Ω → Ê n
in einem Gebiet Ω ⊂ Ên
C1 –differenzierbar ist.
Beachten Sie im folgenden die gegenüber § 2 : 3.1 (c) und 6.3 geänderte Bezeich-
nungsweise! Insbesondere stellen wir Lösungskurven in der Form t → u(t) dar
und interpretieren t meistens als Zeitkoordinate.
Bei autonomen Systemen genügt es, das Anfangswertproblem in der spezielleren
Form
(∗) ẏ = f (y) , y(0) = η
zu betrachten. Dies ist durch die Invarianz der DG unter Zeitverschiebungen

begründet: Ist u eine Lösung von (∗), so löst t → u(t − t0 ) das AWP ẏ = f (y),
y(t0 ) = η und umgekehrt.
Die grundlegende Theorie der Anfangswertprobleme von § 2 liefert für autonome
Systeme:
(a) Existenz und Eindeutigkeitssatz. Zu gegebenem Startpunkt η ∈ Ω hat
das AWP (∗) genau eine Lösung u : J(η) → Ω auf einem maximalen Intervall
J(η). Das Definitionsintervall J(η) ist offen.
Wir bezeichnen die maximal definierte Lösung mit t → ϕ(t, η).
Für jede andere Lösung v : I → Ω dieses AWP gilt also
I ⊂ J(η) und v(t) = ϕ(t, η) für t ∈ I.
(b) Differenzierbarkeitssatz. Der Definitionsbereich der Abbildung ϕ,

Ωf := (t, η) η ∈ Ω , t ∈ J(η) ,
Ê
ist ein Gebiet des n+1, und ϕ ist in Bezug auf alle Variablen C1 –differenzier-
∂ϕ
bar. Für die partiellen Ableitungen wk (t, η) := ∂ηk
(t, η) gilt
ẇk (t, η) = A(t) wk (t, η) , wk (0) = ek mit A(t) := Df (ϕ(t, η)),

1 Autonome Systeme 99
wobei Df die Jacobi–Matrix von f ist. Im Fall f ∈ Ck (Ω, Ên

) mit k > 1 ist ϕ
nach allen Variablen Ck –differenzierbar.
(c) Kompaktheitssatz. Bleibt ϕ(t, η) für wachsendes t ≥ 0 in einer festen

kompakten Teilmenge von Ω, so umfaßt J(η) alle t ≥ 0. Bleibt ϕ(t, η) für
fallendes t ≤ 0 in einer festen kompakten Teilmenge von Ω, so umfaßt J(η)
alle t ≤ 0. Kann eine in einer kompakten Teilmenge von Ω startende Lösung
diese nicht verlassen, so existiert sie für alle Zeiten.
Beweis.
Um diese Sätze auf die grundlegende Theorie von § 2 zurückzuführen, führen
wir folgende Bezeichnungen ein: Wir setzen Ω := × Ω und Ê
(x, y) → g(x, y) := f (y) , g : Ω → Ê n
.
Die maximale Lösung des AWP ẏ = g(x, y) = f (y), y(ξ) = η bezeichnen wir
mit ψ(x, ξ, η), ihr Definitionsintervall mit I(ξ, η), und den Definitionsbereich
von ψ bezeichnen wir mit

Ωg = (x, ξ, η) (ξ, η) ∈ Ω , x ∈ I(ξ, η) .
Dann erfüllt g in Ω die Standardvoraussetzung § 2 : 3.1. Also ist I(ξ, η) of-

fen (§ 2 : 5.3). Nach § 2 : 7.1 ist Ωg ein Gebiet und ψ(x, ξ, η) dort nach allen
Ê
Variablen Ck –differenzierbar, falls f ∈ Ck (Ω, n ) mit k ∈ .
Wegen der Invarianz autonomer Systeme unter Zeitverschiebungen gilt
(1) ψ(t, ξ, η) = ϕ(t − ξ, η), I(ξ, η) = ξ + J(η),
insbesondere
(2) ϕ(t, η) = ψ(t, 0, η).
Ferner gilt
(3) (t, η) ∈ Ωf ⇐⇒ (t, 0, η) ∈ Ωg .
Aus (1) folgt, dass J(η) offen ist. Zu (t0 , η 0 ) ∈ Ωf , also (t0 , 0, η 0 ) ∈ Ωg gibt
es ein δ > 0, so dass (t, 0, η) ∈ Ωg , d.h. (t, η) ∈ Ωf für | t − t0 | < δ und
η − η 0 < δ. Also ist Ωf offen und ϕ(t, η) dort wegen (2) nach allen Variablen
Ck –differenzierbar. Die Behauptung über wk folgt direkt aus der Variations-
gleichung (L) in § 2 : 7.1. Die Abbildung
h : Ωg → Ωf , (t, ξ, η) → (t, η)
ist stetig und nach (3) surjektiv, also ist Ωf wegzusammenhängend (Band 1,
§ 21 : 9.3). Der Kompaktheitssatz wurde in § 2 : 6.3 bewiesen. 2
1.2 Integralkurven, Orbits, Phasenportraits

In der qualitativen Theorie autonomer y2
Systeme erweist es sich als fruchtbar, 6
die DG ẏ = f (y) geometrisch zu inter- • •
pretieren. Hierbei fassen wir die rechte •
• •
Seite f als Vektorfeld auf Ω auf, d.h.
• • •
denken uns den Vektor f (η) an jeder •
•• -
Stelle η ∈ Ω angeheftet. Das Bestehen •
• • •
y1
der Differentialgleichung für die Kurve • •
t → u(t) bedeutet nichts anderes, als •
dass der Vektor f (η) in jedem Kurven- •
•
punkt η = u(t) mit dem Tangenten-
vektor u̇(t) übereinstimmt.
y2
Es ist üblich, die Differentialgleichung 6
mit dem Vektorfeld f zu identifizie-
ren und die Lösungen Integralkur-
ven oder Trajektorien des Vektor-
feldes zu nennen. In der Physik sind
hierfür auch die Bezeichnungen Feld- -
y1
linie, Flusslinie, Bahnkurve und Or-
bit gebräuchlich, oft ohne deutliche Un- K • η = u(t)
terscheidung zwischen der Abbildung
t → u(t) und ihrer Spur, also der Bild- u̇(t) = f (η)

/
menge {u(t) | t ∈ I}.
Wir verwenden den Begriff Orbit für die Spur der maximalen Lösung, wobei
wir diese mit der durch die Parametrisierung t → u(t) gegebenen Orientierung
versehen (siehe Bd. 1, § 24 : 4.3), falls der Tangentenvektor u̇(t) nirgends ver-
schwindet. In 1.3 zeigen wir, dass dies stets der Fall ist, wenn der Orbit nicht
zu einem Punkt entartet.
Die Punkte η ∈ Ω mit f (η) = 0 heißen kritische Punkte, stationäre Punk-
te, Gleichgewichtspunkte und in der Mechanik auch Gleichgewichtslagen.
Nach dem Eindeutigkeitssatz sind die kritischen Punkte gerade die konstanten
Lösungen, bzw. die einpunktigen Orbits.
Die Invarianz unter Zeitverschiebungen und der Satz 1.1 (b) haben zur Folge:
Treffen sich zwei Orbits, so sind sie als Mengen gleich ÜA .
Da durch jeden Punkt von Ω eine Lösung geht, ist der Phasenraum Ω die
disjunkte Vereinigung sämtlicher Orbits. Wir weisen darauf hin, dass eine ange-
messene Beschreibung von Phasenräumen in vielen Fällen den Begriff der Man-
nigfaltigkeit erfordert. Hierauf gehen wir nicht weiter ein, machen aber in 3.6
das Problem am Beispiel des Pendels deutlich und verweisen die interessierten
Leser auf Arnold [151].
Die Gesamtheit aller Orbits wird das y

Phasenbild genannt. 6
Eine grobe Übersicht über das Phasen-
bild ebener Systeme erhalten wir durch
ein Phasenportrait. Ein solches ent-
steht, indem wir kritische Punkte und
einige typische Orbits eintragen.
-
x
Die nebenstehende Figur zeigt ein Pha-
senportrait für das System
ẋ = 1 − x2 , ẏ = xy .
ÜA Verifizieren Sie dieses Phasenpor-
trait!
In Abschnitt 3 führen wir aus, wie wir uns durch rein qualitative Überlegungen
ein Phasenportrait verschaffen können. Zahlreiche Beispiele von Phasenportraits
finden Sie in Arrowsmith–Place [7] und Hirsch–Smale–Devaney [10].
1.3 Die drei Orbittypen

Satz. Jede Lösung t → u(t) = ϕ(t, η) eines autonomen Systems ist von genau
einem der folgenden Typen:
(a) u ist injektiv,
(b) u ist periodisch, d.h. es existiert eine kleinste Zahl T > 0 (die Periode
von u) mit
u(t + T ) = u(t) für alle t .
Der zugehörige Orbit ist also geschlossen.

(c) u ist konstant.
Im Fall (a) und (b) ist die Kurve u regulär, d.h. der Tangentenvektor u̇(t)
verschwindet nirgends. Im Fall (b) und (c) ist die Lösung für alle t definiert.
Beweis.
Ist u̇(t0 ) = 0 für ein t0 ∈ J(η), so ist f (u(t0 )) = 0, also u(t0 ) ein kritischer
Punkt, und nach dem Eindeutigkeitssatz folgt u(t) = u(t0 ) für alle t ∈ . Ê
Sei jetzt also u nicht stationär und auch nicht injektiv, etwa u(t0 ) = u(t1 ) für
zwei Parameterwerte t0 < t1 aus J(η). Setzen wir v(t) = u(t0 + t), so ist v eine
auf I := J(η) − t0 definierte Lösung mit v(0) = v(τ ), τ = t1 − t0 > 0. Daher
existiert
T := inf {t ∈ I | t > 0, v(t) = v(0)} .

Es gibt dann Zahlen tn > 0 mit tn → T und v(tn ) = v(0). Wäre T = 0, d.h.
tn → 0, so würde folgen
1
v̇(0) = lim v(tn ) − v(0) = 0,
n→∞ tn
also wären v und damit auch u stationär. Somit ist T > 0 und
v(T ) = lim v(tn ) = v(0) .

n→∞
Da I offen ist, ist y(t) := v(T + t) in einer Nullumgebung erklärt, und dort
ist ẏ(t) = f (y(t)), y(0) = v(T ) = v(0). Nach dem Eindeutigkeitssatz folgt
y(t) = v(t) = v(T + t) nicht nur in einer Nullumgebung, sondern auch auf I.
Nunmehr können wir v zu einer T –periodischen, auf ganz definierten Lösung Ê
fortsetzen ( ÜA , z.B. t → v(t − T ) für T ≤ t ≤ 2T ). Dies liefert eine T –
periodische Fortsetzung von u. 2
1.4 Hamiltonsche und dissipative Systeme

(a) Ein Hamiltonsches System hat die Gestalt
∂H
q̇k = (q1 , . . . , qN , p1 , . . . , pN ) (k = 1, . . . , N ),
∂pk
∂H
ṗk = − (q1 , . . . , qN , p1 , . . . , pN ) (k = 1, . . . , N ),
∂qk
hierbei ist H : Ê 2N
⊃Ω→ Ê eine C –Funktion, die Hamilton–Funktion.
2
H ist längs jeder Lösung t → (q(t), p(t)) = (q1 (t), . . . , pN (t)) konstant,
denn nach der Kettenregel gilt
N
d ∂H ∂H
H(q(t), p(t)) = (q(t), p(t)) q̇k (t) + (q(t), p(t)) ṗk (t) = 0 .
dt ∂qk ∂pk
k=1
Aus Sicht der Mechanik ist das der Energieerhaltungssatz; die Konstante E
heißt Gesamtenergie der betreffenden Bahn. Allgemein nennen wir Funktionen,
die auf den Lösungen einer DG konstant sind, erste Integrale oder Erhal-
tungsgrößen. Der Fall N = 1 wird in Abschnitt 3 diskutiert.
Eine weitere Eigenschaft Hamiltonscher Systeme ist die Divergenzfreiheit des
zugehörigen Vektorfeldes. Bezeichnen wir dieses mit f , so gilt wegen H ∈ C2 (Ω)

N

N
∂ ∂H ∂ ∂H
div f = + − = 0.
∂qk ∂pk ∂pk ∂qk
k=1 k=1
Für divergenzfreie Systeme gilt der Satz von Liouville über die Volumentreue
des Flusses, vgl. 6.3.
Beispiel: Das ungedämpfte Pendel. Die Winkelauslenkung ϕ(t) aus der

unteren Ruhelage genügt der DG
ϕ̈ + ω 2 sin ϕ = 0 mit ω = g/l .
Durch Umskalierung q(t) := ϕ(t/ω) erhält diese die Gestalt q̈ + sin q = 0 ; das
zugehörige System 1. Ordnung lautet q̇ = p , ṗ = − sin q . Dieses ist hamiltonisch
mit der Hamilton–Funktion
1
H(q, p) = 2 p2 − cos q + c .
Die Konstante c wählen wir so, dass min H = H(0, 0) = 0 wird, setzen also
c = 1. Dann lautet der Energierhaltungssatz
1
2
p2 + 1 − cos q = const = E längs jeder Lösung t → (q(t), p(t)) .
(b) Das gedämpfte Pendel wird bei einer zur Geschwindigkeit proportiona-
len Dämpfung durch die DG q̈ + D(q) q̇ + sin q = 0 bzw. das System
q̇ = p , ṗ = − D(q) p − sin q
beschrieben. Dabei ist D(q) ≥ 0 ein von der Auslenkung q abhängiger Dämp-
fungsfaktor. Für das zugehörige Vektorfeld f (q, p) = (p, −D(q) p − sin q) gilt
div f (q, p) = − D(q) ≤ 0 .
Allgemein heißt ein System ẏ = f (y) mit div f ≤ 0 gedämpft oder dissipa-
tiv. Gedämpfte mechanische Systeme werden häufig durch Differentialgleichun-
gen
∂H ∂H N
q̇k = (q, p) , ṗk = − (q, p) − Dik (q)pi
∂pk ∂qk i=1
beschrieben. Für das zugehörige Vektorfeld f ergibt sich

N
div f (q, p) = − Dkk (q) ≤ 0 ,
k=1
falls Spur (D) ≥ 0. Weiteres zu gedämpften Systemen in 5.5, 5.6.
1.5 Linearisierung in Gleichgewichtspunkten

Sei x0 ein Gleichgewichtspunkt eines autonomen Systems
(∗) ẏ = f (y) ,
d.h. f (x0 ) = 0. Da f in x0 differenzierbar ist, gilt mit A := Df (x0 )
f (x0 + h) = Ah + R(h) , wobei lim R(h)/h = 0 .
h→0
Verläuft die Lösungkurve t → u(t) nahe bei x0 , so gilt für v(t) := u(t) − x0
v̇(t) = u̇(t) = f (u(t)) = f (x0 + v(t)) = Av(t) + R(v(t)) ,
d.h. mit guter Näherung v̇ = Av. Dies legt es nahe, eine Verwandtschaft des
Phasenbildes von (∗) nahe x0 mit dem Phasenbild des linearisierten Systems
(∗∗) ẏ = Ay
nahe 0 zu vermuten. Eine allgemeine Auskunft gibt der
Linearisierungssatz von Grobman–Hartman (1959/60).

Es sei x0 ein hyperbolischer Gleichgewichtspunkt des Systems (∗); d.h. die
Matrix A = Df (x0 ) besitze keine rein imaginären Eigenwerte.
Dann ist das Phasenbild des Systems (∗) nahe x0 dem Phasenbild der Lineari-
sierung (∗∗) nahe 0 in folgendem Sinne ähnlich:
Es gibt Umgebungen U von x0 , V von 0 und eine bijektive, stetige Abbildung
h : U → V mit stetiger Umkehrabbildung h−1 , so dass
ϕ(t, η) = h−1 (etA h(η)) für η ∈ U
gilt, solange die rechte Seite Sinn macht.
Bemerkung. Dass h ein Diffeomorphismus ist, ist ohne weitere Zusatzvoraus-

setzungen nicht gesichert. Für Beispiele, eine Diskussion dieses Satzes und den
Beweis verweisen wir auf Hartman [20], IX:7, IX:12.
Der qualitative Verlauf der Lösungen von (∗) in der Nähe hyperbolischer Gleich-
gewichtspunkte läßt sich hiernach durch das Verhalten der Lösungen des linea-
risierten Systems (∗∗) beschreiben. Ein Beispiel wird in Abschnitt 3 gegeben.
Anders steht es bei nicht hyperbolischen Gleichgewichtspunkten. Dazu ein
1.6 Beispiel. Für das System

ẋ1 = x2 + c x1 x21 + x22 , ẋ2 = − x1 + c x2 x21 + x22 ,
ist (0, 0) der einzige
Gleichgewichtspunkt. Das linearisierte System ẏ = Ay hat
die Matrix A = −10 10 mit Eigenwerten i, −i; dessen nichtstationäre Orbits
sind im Uhrzeigersinn durchlaufene Kreise mit Mittelpunkt (0, 0) ÜA .
Die nichtkonstanten Lösungen des Originalsystems besitzen Darstellungen
x1 (t) = r(t) cos Θ(t) , x2 (t) = r(t) sin Θ(t) .
Für solche, oft sehr nützliche Polardarstellungen gilt ÜA
x1 ẋ1 + x2 ẋ2 = r ṙ , x1 ẋ2 − x2 ẋ1 = r 2 Θ̇(t) .

Im vorliegenden Fall ergibt sich ÜA
x1 ẋ1 + x2 ẋ2 = c r 4 , x1 ẋ2 − x2 ẋ1 = −r 2 ,

2 Phasenportraits linearer Systeme in der Ebene 105
also Θ̇ = −1 und ṙ = c r 3 . Lösen wir diese separierte DG, so erkennen wir

ÜA : Für c > 0 wächst r(t) monoton und wird in endlicher Zeit unbeschränkt.
Für c < 0 ergibt sich lim r(t) = 0.
t→∞
Das Phasenbild des gegebenen Systems besteht für jedes c = 0 aus Spiralen, es
besteht also keine Ähnlichkeit mit dem Phasenbild der Linearisierung. Die ge-
schlossenen Orbits des linearisierten Systems brechen schon bei kleinen Störun-
gen zu Spiralen auf!
2 Phasenportraits linearer Systeme in der Ebene

2.1 Transformation auf reelle Normalform
Im Hinblick auf das Prinzip 1.5 der Linearisierung studieren wir als erstes die
Phasenportraits linearer 2 × 2–Systeme ẏ = Ay mit A = 0. Wir stellen im fol-
genden die wichtigsten Typen vor. Um diese systematisch erfassen zu können,
nehmen wir mit einer reellen, invertierbaren Matrix S eine Koordinatentrans-
formation
y = Sx , x = S −1 y .
vor. Das System ẏ = Ay ist dann äquivalent zum System
(∗) ẋ = Bx mit B = S −1 AS .
Wir zeigen anschließend: Durch passende Wahl von S läßt sich immer erreichen,
dass B eine der drei Normalformen

λ1 0 λ 1 − −ω
, ,
0 λ2 0 λ ω −
mit reellen Einträgen annimmt. Skizzieren wir in jedem dieser drei Fälle die
möglichen Phasenportraits für (∗), so entstehen diejenigen für ẏ = Ay als Bilder
unter der linearen Abbildung x → Sx.
2.2 Reell–diagonalähnliche Matrizen

λ1
Sei A diagonalähnlich über Ê, also S −1
AS = 0
0
λ2
. Das System (∗)
ẋ1 = λ1 x1 , ẋ2 = λ2 x2 hat die Lösungen x1 (t) = ξ1 eλ1 t , x2 (t) = ξ2 eλ2 t .

Für ξ1 · ξ2 = 0 erfüllen die Orbits die Gleichung |x1 |λ2 |ξ2 |λ1 = |x2 |λ1 |ξ1 |λ2 .
λ2
(a) Für λ2 < λ1 < 0 , also k := λ1
> 1 lautet diese Gleichung
|x2 | = c |x1 |k mit k := λ2

λ1
> 1, c = |ξ2 | · |ξ1 |−k .
Beachten wir noch, dass x1 (t)2 + x2 (t)2 für t → ∞ monoton gegen Null geht,
so erhalten wir für ẋ = Bx das linke und für ẏ = Ay das rechte der folgenden
Phasenportraits
x2 y2
6 6
- -
x1 y1
Wir sprechen von einem echten oder y2

zweitangentigen Knoten im Ursprung. 6
(b) Im Fall λ1 = λ2 < 0 erhal-
ten wir für (∗) das nebenstehende Por-
trait, das unter linearen Abbildungen
unverändert bleibt. Wir sprechen von -
y1
einem Sternpunkt.
(c) Im Fall 0 < λ1 ≤ λ2 erhalten wir
dieselben Phasenportraits, nur mit um-
gekehrtem Durchlaufsinn. Das ergibt
sich durch Zeitumkehr ÜA .
(d) Ist λ1 < 0 und λ2 = 0, so ergibt sich folgendes Phasenportrait für (∗) und
rechts daneben ein lineares Bild hiervon.
x2 y2
6 6
- -
x1 y1
Die kritischen Punkte bilden eine Gerade (entarteter Fall). Für 0 = λ2 < λ1
erhalten wir dasselbe Phasenportrait, nur mit umgekehrtem Durchlaufsinn.
2 Phasenportraits linearer Systeme in der Ebene 107
(e) Im Fall λ2 < 0 < λ1 setzen wir k := − λλ21 . Ist ξ1 = x1 (0) = 0 , so gilt für
die Lösungen
x2 = ± c |x1 |−k mit k > 0 und c = ± ξ2 |ξ1 |k .
Bei den folgenden Phasenportraits wird der Ursprung ein Sattelpunkt genannt.
x2 y2
6 6
x y1
-1 -
2.3 Nichtdiagonalähnliche Matrizen

Ist A nichtdiagonalähnlich über , so besitzt A nur einen einzigen und damit
reellen Eigenwert λ. Wir betrachten den Fall λ < 0. Nach § 3 : 2.9 gilt

λ 1
S −1AS = mit einer geeigneten invertierbaren Matrix S.
0 λ
Die Lösungen des zu S −1 AS gehörigen AWP
ẋ1 = λx1 + x2 , x1 (0) = ξ1

ẋ2 = λx2 , x2 (0) = ξ2
erhalten wir, indem wir erst die letzte Gleichung lösen und mit dieser Lösung
in die erste Gleichung gehen. Variation der Konstanten ergibt
x1 (t) = (ξ1 + ξ2 t) eλt , x2 (t) = ξ2 eλt .
(Dasselbe Ergebnis ergibt sich aus § 3 : 1.6 (a).) Im Fall ξ2 = 0 ist
ẋ1 (t) x1 (t) 1 ξ1 + ξ2 t 1

= + = + .
ẋ2 (t) x2 (t) λ ξ2 λ
Für große Werte von t haben x1 (t) und x2 (t) dasselbe Vorzeichen, nämlich das
von ξ2 . Ferner strebt ẋ2 (t)/ẋ1 (t) für t → ∞ von oben her gegen Null. Das ergibt
folgende Phasenportraits mit dem Ursprung als unechtem oder eintangentigem
Knoten.
x2 y2
6 6
- -
x1 y1
Der Fall λ > 0 ergibt sich durch Zeitumkehr.

ÜA Diskutieren Sie den Fall λ = 0.
2.4 Nichtreelle Eigenwerte

Wir nehmen an, dass λ = − +iω mit ω > 0 ein Eigenwert von A ist. Dann hat
A zwei verschiedene komplexe Eigenwerte λ, λ, ist also diagonalähnlich über .
Ê
Ist w = u + iv mit u, v ∈ 2 ein Eigenvektor zum Eigenwert λ, so ist u − iv
ein davon linear unabhängiger Eigenvektor zum Eigenwert λ, also gilt v = 0.
Ê
Dann sind u, v linear unabhängig über , denn im Fall u = αv wären auch
u ± iv Vielfache von v. Aus Aw = λw folgt durch Vergleich von Real– und
Imaginärteil
Au = − u − ω v , Av = ω u − v .
Bezüglich der Basis (u, v) des Ê2

hat T : x → Ax also die Matrix

− ω
S −1 AS = =: B ,
−ω −
wobei S die Spalten u und v hat. Die Matrix B ist also der Prototyp aller reellen
2 × 2–Matrizen mit nichtreellen Eigenwerten.
Die Gleichung ẋ = Bx für x = (x1 , x2 ) bedeutet bei komplexer Schreibweise
z(t) = x1 (t) + ix2 (t) einfach ż(t) = λz(t), also ist z(t) = z(0) eλt . Schreiben wir
3 Die Differentialgleichung ẍ = F (x) 109
z(0) = r eiϕ , so erhalten wir als allgemeine reellwertige Lösung von ẋ = Bx
x1 (t) = r e−t cos(ωt + ϕ) , x2 (t) = r e−t sin(ωt + ϕ) .
Wir erhalten im Fall = 0 die Phasenportraits einer periodischen Bewegung.

x2 y2
6 6
- -
x1 y1
Das ist neben dem entarteten Fall 2.2 (d) der einzige, wo der Gleichgewichts-
punkt (0, 0) (hier Zentrum genannt) nicht hyperbolisch ist. Im Fall > 0
erhalten wir einen Spiralpunkt (Wirbelpunkt):
. .
x2 y2
x1 y1
. . . .
Im Fall < 0 drehen sich wieder die Richtungspfeile um.
3 Die Differentialgleichung ẍ = F (x)

3.1 Physikalische Deutung
Wir deuten die DG ẍ = F (x) als Newtonsche Bewegungsgleichung eines Teil-
chens mit einem Freiheitsgrad unter dem Einfluss einer nur vom Lageparameter
x abhängigen Kraft F . F sei C1 –differenzierbar auf einem offenen Intervall I.

Das zugehörige System 1. Ordnung
(H) ẋ = y , ẏ = F (x) in Ω = I × Ê
ist hamiltonsch mit der Hamilton–Funktion
1
x
H(x, y) = 2 y 2 + U (x) , U (x) = − F (s) ds .
x0
Für U und damit für H haben wir eine additive Konstante frei, demgemäß
können wir über x0 ∈ I noch verfügen.
3.2 Energieniveaulinien und implizite Lösungsformel

Sei t → (x(t), y(t)) eine Lösung von (H) mit x(t0 ) = x0 . Der Energieerhaltungs-
satz 1.4 liefert
1
2 y(t)2 + U (x(t)) = const =: E .
Der Orbit liegt also in der Niveaumenge

& '
N= (x, y) ∈ I × Ê | H(x, y) = 12 y 2
+ U (x) = E .
Liegen auf N keine kritischen Punkte, (y, F (x)) = (0, 0) für alle (x, y) ∈ N ,
so kann N lokal durch Gleichungen y = ϕ(x) bzw. x = ψ(y) mit geeigneten
C2 –Funktionen ϕ bzw. ψ beschrieben werden (Satz über implizite Funktionen,
Bd. 1, § 22 : 5.5). Die Auflösung nach y ergibt y = 2(E − U (x)) in der oberen
und y = − 2(E − U (x)) in der unteren Halbebene. Somit erhalten wir
ẋ(t) = 2(E − U (x(t))) oder ẋ(t) = − 2(E − U (x(t))) .
Diese separierte DG führt nach bekanntem Muster (Bd. 1, § 13 : 3) auf die im-
plizite Lösungsformel
x(t)
ds
t − t0 = ± .
2(E − U (s))
x0
In den meisten physikalisch interessanten Fällen (z.B. beim ungedämpften Pen-

del mit U (s) = 1 − cos s ) läßt sich für den Integranden keine Stammfunktion
in geschlossener Form angeben, geschweige denn eine explizite Auflösung nach
x(t). Dennoch können wir wichtige Aussagen über das qualitative Verhalten der
Lösungen machen, wie im folgenden ausgeführt wird.
3.3 Periodische Bewegung in einer Potentialmulde

Das Potential besitze im Intervall [a, b] ⊂ I eine Mulde:
U (a) = U (b) =: E ,
U (x) < E für a < x 0 .
Gemäß 3.1 setzen wir U (x0 ) = 0 an einer Minimumstelle x0 von U . Wir betrach-
ten im folgenden Lösungen t → (x(t), y(t)) des Systems (H) ẋ = y, ẏ = F (x)
mit Gesamtenergie E.
Satz. Jede auf dem Energieniveau E
startende Lösung ist periodisch, besitzt 6
die volle Niveaumenge E
N = {(x, y) | H(x, y) = E, a ≤ x ≤ b} U
als Orbit und durchläuft diesen im Uhr-
zeigersinn. Die Periode ist
-
a x0 b x
b
ds
T = 2 . y
2(E − U (s)) 6 y= 2(E − U(x))
a
Wir können uns die Verhältnisse veran-

schaulichen, indem wir uns eine Kugel -
vorstellen, die auf der Konturlinie von x
U rollt und in der Höhe E losgelassen
wurde. Abnahme der potentiellen be-
wirkt Zunahme der kinetischen Energie y=− 2(E − U(x))
und umgekehrt.
Beweis.
√
Es genügt, die Lösung mit x(0) = x0 , y(0) = 2E zu betrachten. Denn ist
diese periodisch und durchläuft ganz N , so erreicht sie jeden auf N gelegenen
Startpunkt.
(a) Die Lösung existiert für alle Zeiten. Denn x(t) kann das Intervall [a, b]
nicht verlassen, andernfalls wäre U (x(t)) > E wegen U (a) < 0, U (b) > 0,
im Widerspruch √ √ y(t)) ∈ N . Also bleibt (x(t), y(t)) in der kompakten
zu (x(t),
Menge [a, b]×[− 2E, 2E] , und die Behauptung folgt aus dem Kompaktheits-
satz 1.1 (c).
(b) Offensichtlich liegt N symmetrisch zur x–Achse.
b −1/2
(c) Konvergenz des Integrals 2(E − U (s)) ds. Nach Voraussetzung
a
über U können wir δ > 0 so wählen, dass U (x) ≥ 12 U (b) > 0 für b−δ < x < b.
Daher ist 2(E − U (s)) = 2(U (b) − U (s)) = 2(b − s)U (ϑ) ≥ (b − s)U (b) für
s ∈ ]b − δ, b[ , und der Integrand hat in einer Umgebung von b die Majorante
−1/2 b −1/2
(b − s)U (b) . Daher existiert 2(E − U (s)) ds . Entsprechendes
x0
gilt am linken Randpunkt a.
(d) Der Teil von N in der oberen Halbebene y ≥ 0 wird voll durchlaufen.
Nach 3.2 gilt mit t0 = 0
x(t)
ds
(∗) t = ,
2(E − U (s))
x0
solange ẋ(t) = y(t) = 2(E − U (x(t))) > 0 gilt, d.h. solange die Lösung in der
oberen Halbebene verbleibt. Nach (c) ist die rechte Seite von (∗) beschränkt,
solange x(t) im Intervall ]a, b[ bleibt. Daher kann (∗) weder für beliebig große
noch für beliebig kleine t bestehen bleiben; irgendwann muss also die Lösung
die obere Halbebene verlassen. Aus y(t) = 0 folgt U (x(t)) = E , also nach
Voraussetzung über U entweder x(t) = a oder x(t) = b. Wegen ẋ(t) > 0 für
y(t) > 0 gibt es somit ein erstes t2 > 0 mit x(t2 ) = b und ein erstes t1 < 0
mit x(t1 ) = a. Nach dem Zwischenwertsatz nimmt x(t) in [t1 , t2 ] jeden Wert
aus [a, b] an und zwar genau einmal, denn nach Konstruktion von t1 , t2 ist
ẋ(t) > 0 in ]t1 , t2 [. Da der obere Teil von N die Gleichung y = 2(E − U (x))
mit a ≤ x ≤ b erfüllt, wird dieser von der Lösung voll durchlaufen, und zwar
wegen ẋ(t) > 0 von links nach rechts.
(e) Periodizität der Lösung. Aus (∗) folgt
1 b −1/2
t2 − t 1 = T mit T := 2 2(E − U (s)) ds, .
2 a
Nun liefern u(t) := x(2t2 − t), v(t) = −y(2t2 − t), wie leicht nachprüfbar ist,
eine nach (a) für alle t definierte Lösung des AWP
u̇ = v , v̇ = F (u) , u(t2 ) = x(t2 ) , v(t2 ) = y(t2 ) = 0 .
Nach dem Eindeutigkeitssatz folgt u(t) = x(t), v(t) = y(t), insbesondere
x(t1 + T ) = u(t1 + T ) = x(t1 ) , ebenso y(t1 + T ) = − y(t1 ) = y(t1 ) .
Wie im Beweis 1.3 (b) folgt, dass x und y beide T –periodisch sind. Nach Wahl
von t1 und t2 ist T die kleinste Periode. Aus Symmetriegründen (vgl. (b))
durchläuft (u(t), v(t)) für t2 ≤ t ≤ t2 + 12 T = t1 + T den unteren Teil von
N , diesmal von rechts nach links. 2
3.4 Phasenportraits in der Nähe von Gleichgewichtspunkten

Sei (x0 , 0) ein Gleichgewichtspunkt von (H), also U (x0 ) = −F (x0 ) = 0. Ferner
sei U (x0 ) = 0. Wir setzen wieder das Potential an der Stelle x0 auf Null. Dann
gilt folgender, am Ende von 3.4 bewiesener
Hilfssatz. Es gibt eine C1 –dif-
ferenzierbare Funktion h in einer Null-
umgebung mit | U (x + x0 ) | = 12 h(x)2 6 U
und h (0) = | U (x0 ) | .
Wir betrachten die Orbits für Energie-

werte 0 < |E| < 1 ergibt sich in jedem -
Fall eine stationäre Lösung (x0 , 0). x0 x

(a) Im Fall U (x0 ) > 0 kann es nur
für E ≥ 0 Lösungen geben. Für kleine y
6
E > 0 sind diese nach 3.3 periodisch.
Die Niveaulinien erfüllen die Gleichung • -
x
h(x − x0 )2 + y 2 = 2E ,
sind also für kleine Energiewerte diffeo-
morphe Bilder von Kreisen.
6

(b) Im Fall U (x0 ) < 0 ist der Graph -
von H in der Nähe von (x0 , 0) sattel- x0 x
artig. Für Energiewerte 0 < |E| 1
erfüllen die Orbits jetzt die Gleichung U
y − h(x − x0 ) = 2E ,
2 2
sind also diffeomorph verbogene Hy- y

6
perbeln. Die vier Linien mit den Glei-
chungen y = h(x − x0 ), bzw. y =
−h(x − x0 ) für x > x0 , bzw. x < x0
heißen Separatrizen. -
ÜA Verifizieren Sie den eingezeichne- x
ten Durchlaufsinn der Orbits.
Die Aussage (b) stellt eine schwache
Form des Linearisierungssatzes 1.5 dar.
Das an der Stelle (x0 , 0) linearisierte System lautet
(L) u̇ = v, v̇ = ω 2 u mit ω = −U (x0 ) ;

dessen Orbits wurden in 2.2 dargestellt.
Der Diffeomorphismus

x
→
u
=
h(x) 6U
y v y
bildet lediglich Orbitstücke von (H) als
Mengen auf Orbitstücke von (L) ab.
(c) Die nebenstehende Skizze fasst das
Ergebnis der bisherigen Diskussion zu- -
x
sammen. y
6
Beweis des Hilfssatzes. Es genügt, den
Fall U (x0 ) < 0 zu behandeln; im Fall
U (x0 ) > 0 betrachten wir −U statt
-
U . Wegen U (x0 ) = 0 gilt x

1
U (x0 + x) = d
dt
U (x0 + tx) dt
0

1
= x U (x0 + tx) dt = x f (x),
0
1
wobei f (x) := U (x0 + tx) dt als Parameterintegral in einer Nullumgebung
0
stetig ist und f (0) = U (x0 ) gilt. Entsprechend erhalten wir wegen U (x0 ) = 0
1 1 1
U (x0 + x) = d
dt
U (x0 + tx) dt = x U (x0 + tx) dt = x2 t f (tx) dt
0 0 0

1
= − 12 x2 g(x) mit g(x) := −2 t f (tx) dt .
0
Es gilt
g(0) = − f (0) = − U (x0 ) > 0 und g(x) = g(0).
Wir wählen ein ε > 0 mit g(x) > 0 für |x| < ε und setzen
h(x) := x g(x) für |x| < ε .
Dann existiert h (0) = lim h(x)/x = g(0) = −U (x0 ) . Nach Konstruktion
x→0
gilt U (x0 +x) = − 21 h(x) < 0 für 0 < |x| < ε, also ist h dort C2 –differenzierbar.
2
Aus h(x) h (x) = −U (x0 + x) für 0 < |x| < ε folgt schließlich
x U (x0 + x) U (x0 )
lim h (x) = − lim = − = h (0) . 2
x→0 x→0 h(x) x h (0)
Aufgabe. Drücken
T Sie für einen periodischen Orbit das Zeitmittel der kineti-
schen Energie T1 0 21 y(t)2 dt über die Periode T mit Hilfe von T und der durch

den Orbit umschlossenen Fläche F aus. (Beachten Sie, dass x(t) in 0, 21 , T
monoton wächst und verwenden Sie die Substitutionsregel.)
3.5 Beschränkte Potentiale

Ê
Wir betrachten auf ganz definierte, nach unten beschränkte Potentiale U . Da
Ê
es auf additive Konstanten nicht ankommt, dürfen wir min{U (x) | x ∈ } = 0
voraussetzen.
Es gilt: 6
(a) Die Lösungen mit Gesamtenergie E
E > 0 existieren für alle Zeiten. U
(b) Ist U (x) b -

und U (b) < 0, so durchläuft die in b x
y
(b, 0) startende Lösung mit Gesamt- 6
energie E = U (b) eine nach rechts of-
fene Schlaufe; insbesondere gilt
x(−t) = x(t), -
b x
y(−t) = −y(t),
lim x(t) = ∞.
t→∞
(c) Ist U nach oben beschränkt und

Ê
E > U (x) für alle x ∈ , so gibt es E
6
zwei Lösungen mit Gesamtenergie E
t → (x1 (t), y1 (t)) , U
t → (x2 (t), y2 (t)) , -

die in der skizzierten Weise verlaufen: x
Bei geeigneter Festlegung der Anfangs- y
werte und der Zeitkoordinate gilt 6
x2 (t) = x1 (−t) ,
-
y2 (t) = − y1 (−t) , x
lim x1 (t) = ∞ ,
t→∞
lim x1 (t) = − ∞.
t→−∞
Beweis. (a) Angenommen, die maximale Lösung t → (x(t), y(t)) existiere nur
für t < T < ∞. Wegen ẋ(t)2 = 2E − U (x(t)) ≤ 2E hätten wir für 0 < t < T
t √ √
| x(t) − x(0) | = ẋ(s) ds ≤ T 2E , | y(t) | = | ẋ(t) | ≤ 2E .
0
Aus dem Kompaktheitssatz 1.1 (c) würde die Existenz für alle t > 0 und damit
ein Widerspruch folgen. Entsprechend folgt die Existenz für t < 0. Nachweis
von (b) und (c) als ÜA : Zeigen Sie y(t) > 0 für t > 0. Verwenden Sie den
Eindeutigkeitssatz und die Formel (∗) von 3.3 (d) in Verbindung mit (a). 2
3.6 Das ungedämpfte Pendel U 6

(a) Wir kommen auf die Gleichung des
ungedämpften Pendels 1.4
ẍ = − sin x
-
zurück. Das Potential mit U (0) = 0 ist x
y
U (x) = 1 − cos x . 6
Das Phasenportrait ergibt sich unmit-
telbar aus den Betrachtungen 3.4 und
3.5 (c). -
x
(b) Für 0 < E < 2 erhalten wir peri-
odische Lösungen mit ellipsenförmigen
Orbits. Der maximale Pendelausschlag
ist a := arccos(1 − E).
Für E = 2 besteht die Niveaumenge N = {(x, y) | H(x, y) = 2, −π ≤ x ≤ π}
aus den beiden Gleichgewichtspunkten (−π, 0) und (π, 0) und den beiden Sepa-
ratrizen

C1 = x, 2 cos x |x| < π , C2 = x, −2 cos x |x| < π .
2 2
Für die auf C1 verlaufende Lösung gilt
lim (x(t), y(t)) = (−π, 0) , lim (x(t), y(t)) = (π, 0) .

t→−∞ t→∞
Die zu den Energieniveaus E > 2 gehörenden Lösungen entsprechen den Über-

schlägen des Pendels. Nach der Theorie sind diese Lösungen injektiv; physika-
lisch gesehen handelt es sich jedoch um periodische Vorgänge! Diese scheinbare
Diskrepanz kommt daher, dass wir als Phasenraum die Ebene zugrundegelegt
hatten. In dieser werden Zustände, deren Winkelkoordinate sich um Vielfache
von 2π unterscheiden, als verschieden angesehen.
Den der Physik angemessenen Phasen-
raum erhalten wir durch Aufwickeln
der Ebene zu einem Zylinder mit Um-
fang 2π. In diesem Phasenraum schlie-
ßen sich die zuletzt genannten Orbits.
Dieses Beispiel zeigt, dass für eine ad-
äquate Modellierung von Phasenräu-
Ê
men Gebiete des n nicht immer aus-
reichen. Die hierfür geeigneten mathe-
matischen Modelle sind Mannigfaltig-
keiten, siehe Bd. 3, §8.
4 Stabilität von Gleichgewichtspunkten 117
Aufgaben (a) Ein fester und ein an einer Feder befestigter beweglicher Magnet
ziehen sich mit einer Kraft an, die umgekehrt proportional zum Abstandsqua-
drat ist, und zwar gelte für die Auslenkung x aus der Ruhelage
ẍ + x = (x − 2)−2 (x < 2) .
Geben Sie die Hamilton–Funktion H mit H(0, 0) = 0 an, bestimmen Sie die
Gleichgewichtslagen, und skizzieren Sie ein Phasenportrait.
(b) Skizzieren Sie das Phasenportrait für die Gleichung
ẍ + x − x3 = 0.
(Der Term x − x3 kann als Rückstellkraft einer Feder mit nichtlinearer Cha-
rakteristik interpretiert werden.)
4 Stabilität von Gleichgewichtspunkten

4.1 Stabile und attraktive Gleichgewichtspunkte
Wir betrachten ein autonomes System ẏ = f (y) auf Ω ⊂ Ê
n
mit einem
Gleichgewichtspunkt x0 ∈ Ω, d.h f (x0 ) = 0.
(a) Das System heißt stabil in x0 (oder x0 ein stabiler Gleichgewichts-
punkt), wenn es zu jedem ε > 0 ein δ > 0 gibt mit
ϕ(t, x) − x0 < ε für alle t ≥ 0 , falls x − x0 < δ .
Das schließt die Existenz von ϕ(t, x) für alle t ≥ 0 ein.
Das System heißt instabil in x0 , wenn es dort nicht stabil ist.
Stabilität in x0 bedeutet, dass die in Nachbarpunkten von x0 startenden Lösun-
Ê
gen auf dem vollen Zeitintervall + kontrollierbar bleiben. Im Kontrast hier-
zu liefert die fundamentale Theorie § 2 : 7.4 nur die Kontrollierbarkeit auf be-
schränkten Intervallen.
(b) Der Gleichgewichtspunkt x0 heißt attraktiv, wenn es ein > 0 gibt mit
lim ϕ(t, x) = x0 , falls x − x0 < .
t→∞
(c) Ein stabiler und attraktiver Gleichgewichtspunkt wird asymptotisch sta-

bil genannt.
Beispiele. (i) Einteilchensysteme ẋ = y, ẏ = F (x). Hat das Potential in Um-
gebung von x0 eine Mulde, so ist der Punkt (x0 , 0) stabil, aber nicht attraktiv,
vgl. 3.3 und 3.4. Der Kreuzungspunkt der Separatrizen in 3.4 ist ein instabiler
Gleichgewichtspunkt. Für solche Systeme gibt es keine attraktiven Gleichge-
wichtspunkte. Erst bei Mitberücksichtigung der Reibung kann Attraktivität ins
Spiel kommen. Beim gedämpften Pendel beispielsweise ist die Ruhelage asymp-
totisch stabil, vgl. 5.7 (b)
(ii) Es gibt attraktive Gleichgewichtslagen, die nicht stabil sind .

Für ein von Vinograd 1957 angege-
6
benes ebenes System mit dem neben-
stehend skizzierten Phasenportrait ist
der Ursprung x0 = 0 attraktiv, aber rη
nicht stabil: Im ersten Quadranten
existiert ein größter“ Orbit mit
”
lim ϕ(t, η) = lim ϕ(t, η) = 0. -
t→−∞ t→∞
Wählen wir η wie skizziert nahe 0 und
setzen ε = η, so gibt es in beliebiger
Nähe von 0 Punkte x auf dem Orbit
durch η mit { ϕ(t, x) | t ≥ 0 } ⊂ Kε (0).
Näheres hierzu in Hahn [18] § 40.
(iii) ÜA Klassifizieren Sie die Gleichgewichtslagen in Abschnitt 2.
4.2 Das Stabilitätsverhalten linearer Systeme

Satz. Für ein lineares System ẏ = Ay ist der Nullpunkt
(a) asymptotisch stabil genau dann, wenn alle Eigenwerte von A, d.h. alle kom-
plexen Nullstellen des charakteristischen Polynoms, negativen Realteil haben,
(b) stabil genau dann, wenn Re λ ≤ 0 für jeden Eigenwert λ von A gilt und
im Fall Re λ = 0 die geometrische Vielfachheit von λ mit der algebraischen
übereinstimmt.
(c) Gilt Re λ < für alle Eigenwerte λ von A, so gibt es eine Konstante c ≥ 1
mit
Ê
etA η ≤ c et η für alle η ∈ n, t ≥ 0 .
Diese Aussagen ergeben sich aus § 3 : 2.7, 2.8, 2.10 ÜA .
4.3 Das Prinzip der linearisierten Stabilität (Eigenwertkriterium)

Satz (Ljapunow, Poincaré 1892). Für einen Gleichgewichtspunkt x0 des
Systems ẏ = f (y) sei A = Df (x0 ) die Matrix der Linearisierung. Dann gilt:
(a) x0 ist asymptotisch stabil, wenn alle Eigenwerte von A negative Realteile
haben.
(b) Gibt es einen Eigenwert mit positivem Realteil, so ist x0 instabil .
Der Satz ist eine unmittelbare Folge des Linearisierungssatzes 1.5 und der Stabi-
litätsaussagen 4.2 für lineare Systeme. Da der Beweis des Linearisierungssatzes
aufwendig ist, geben wir für die Aussage (a) einen elementaren Beweis, der
auf Perron 1929 zurückgeht. Einen Beweis der zweiten Behauptung 4.3 fin-
den Sie in Hirsch–Smale–Devaney [10] Ch. 9, § 2, Walter [12] § 29 VIII oder
Coddington–Levinson [17] Ch. 13, Sec. 1.
4 Stabilität von Gleichgewichtspunkten 119
Beweis der Aussage (a).

O.B.d.A. sei x0 = 0. Wir setzen 2 := max{Re λ | λ ist Eigenwert von A} < 0.
(i) Nach 4.2 (c) gibt es eine Konstante c ≥ 1 mit
etA η ≤ c et η für alle η ∈ Ê n

und t ≥ 0 .
(ii) Da f an der Stelle 0 differenzierbar ist, besteht die Zerlegung

g (y )
f (y) = Ay + g(y) mit lim = 0.
y →0 y
Zu jedem ε > 0 gibt es daher ein δ > 0 mit (c + 1) δ < ε und
y ≤ δ =⇒ g(y) ≤ ε y .
(iii) Sei 0 < ε ≤ − /2c und δ wie oben gewählt. Wir zeigen:
Für x < δ/c kann y(t) := ϕ(t, x) für wachsendes t ≥ 0 die Kugel Kδ (0)
nicht verlassen, existiert also für alle t ≥ 0 . Ferner gilt
1
y(t) ≤ c x e 2 t ≤ c x < δ < ε f ür t ≥ 0.
Das bedeutet wegen < 0 Stabilität und Attraktivität.
Zum Nachweis fixieren wir ein x mit x < δ/c ≤ δ und betrachten ein T ∈ J(x)
mit y(t) = ϕ(t, x) ∈ Kδ (0) für 0 ≤ t < T . Die nach (ii) bestehende Gleichung
ẏ(t) = Ay(t) + g(y(t))
fassen wir als inhomogenes lineares System auf und erhalten durch Variation
der Konstanten (vgl. § 3 : 1.4)
t
y(t) = etA x + e(t−s)A g(y(s)) ds .
0
Für 0 ≤ t < T folgt daraus mit (ii) und durch zweimalige Anwendung von (i)
t
y(t) ≤ etA x + e(t−s)A g(y(s)) ds
0
t
≤ c e t x + ε c e(t−s) y(s) ds ,
0
also
t
e− t y(t) ≤ c x + ε c e− s y(s) ds .
0
Mit dem Gronwall-Lemma § 2 : 4.2 ergibt sich
e− t y(t) ≤ c x eε c t ,
und wegen ε c ≤ − /2, > 0, c x < δ folgt

1
y(t) ≤ c x e 2 t < δ < ε für 0 ≤ t < T.
Somit kann y(t) in keinem Intervall [0, T [ ⊂ J(x) den Rand von Kδ (0) errei-
chen. Damit sind die Behauptungen bewiesen. 2
4.4 Grenzen der Linearisierungsmethode

Das Eigenwertkriterium gestattet es, unter geeigneten Voraussetzungen auf
asymptotische Stabilität oder auf Instabilität zu schließen. Für Systeme, bei
denen die linearisierte DG stabil, aber nicht asymptotisch stabil ist, sagt es
nichts aus.
(a) Dass in solchen Fällen alles möglich ist, zeigt das Beispiel
ẏ1 = y2 + c y1 (y12 + y22 ) , ẏ2 = − y1 + c y2 (y12 + y22 ) .
Die Linearisierungsmatrix im Nullpunkt ist für alle c durch

0 1
A = −1 0
.
gegeben. Die Eigenwerte von A sind i und − i, also ist das linearisierte System
nach 4.2 im Nullpunkt stabil, aber nicht attraktiv. Für r := y12 + y22 ergibt
sich wie in 1.6 die DG ṙ = cr 3 ÜA , so dass für c < 0 asymptotische Stabilität,
für c > 0 aber Instabilität vorliegt.
(b) Für Hamiltonsche Systeme gibt das Eigenwertkriterium nichts her. Dies
zeigt schon das Beispiel von Abschnitt 3
ẋ = y , ẏ = F (x) = − U (x) .
Hat U an der Stelle x0 einen Tiefpunkt mit U (x0 ) = ω 2 > 0, so ist der Gleich-
gewichtspunkt (x0 , 0) nach 3.4 (a) stabil, aber nicht attraktiv. Die Linearisie-
rungsmatrix A an der Stelle (x0 , 0) ist
0 1
A = −ω 2 0
.
Diese besitzt die imaginären Eigenwerte ± i ω.

Für Gleichgewichtspunkte hamiltonscher Systeme läßt sich zeigen, dass das Ei-
genwertspektrum der Linearisierung immer punktsymmetrisch zum Nullpunkt
liegt, so dass sich mit Hilfe von 4.3 allenfalls über Instabilität entscheiden läßt.
5 Die direkte Methode von Ljapunow

5.1 Ljapunow–Funktionen
Die Ljapunowsche Methode zur Untersuchung der Stabilitätseigenschaften eines
Gleichgewichtspunkts x0 des Systems ẏ = f (y) besteht darin, eine Funktion V
mit folgenden Eigenschaften zu bestimmen:
5 Die direkte Methode von Ljapunow 121
V ist in einer Umgebung Ω0 ⊂ Ω von x0 stetig differenzierbar,

V (x0 ) = 0 ,
V (x) > 0 für x ∈ Ω0 und x = x0 ,
∂f V (x) := ∇V (x) , f (x) ≤ 0 in Ω0 .
Eine solche Funktion heißt Ljapunow–Funktion für den Gleichgewichtspunkt

x0 . Gilt zusätzlich
∇V (x) , f (x) < 0 für x ∈ Ω0 , x = x0 ,
so wird V eine strenge Ljapunow–Funktion für x0 genannt.

Die für Stabilitätsuntersuchungen entscheidende Eigenschaft einer Ljapunow–
Funktion besteht darin, dass diese längs jeder Lösung u abnimmt:
d
(∗) dt V (u(t)) = ∇V (u(t)) , u̇(t) = ∇V (u(t)) , f (u(t)) ≤ 0 ,
solange u(t) in Ω0 bleibt. Der Zusammenhang dieser Eigenschaft mit der Stabi-
lität in x0 wird wie folgt plausibel: Für jedes ε > 0 ist Ωε = {x ∈ Ω0 | V (x) ≤ ε}
wegen V (x0 ) = 0 eine Umgebung von x0 . Da x0 die einzige Nullstelle von V in
Ω0 ist, ziehen sich die Mengen Ωε für ε → 0 auf x0 zusammen. Ist Ωε kompakt,
so verläßt jede einmal in Ωε eintretende Lösung u für wachsendes t diese Menge
nicht mehr, denn es gilt
V (u(t)) ≤ V (u(0)) ≤ ε für t ≥ 0 .
Daraus folgt die Existenz von u(t) für alle t ≥ 0 und die Stabilität. Bei strengen
d
Ljapunow–Funktionen V ist dt V (u(t)) < 0. Wir machen plausibel, dass dann
lim V (u(t)) = 0 und daraus wieder
t→∞
lim u(t) = x0
t→∞
folgt. Letzteres beruht darauf, dass .

u
V die Rolle einer krummlinigen Ab-
standsfunktion zum Punkt x0 spielt.
{V < }
Das übrige machen wir uns anhand der
x
Figur klar: ∇V(x)
∇V (x) ist ein äusserer Normalenvek-
tor der Niveaumenge {V = ε}. Wegen f (x) x0
∇V (x) , f (x) < 0 dringen die Punk-
te u(t) durch den Rand {V = ε} in
die Umgebung {V < ε} ein.
Diese Plausibilitätsbetrachtungen
werden durch die folgenden Sätze
bestätigt. . .
5.2 Der Stabilitätssatz von Ljapunow

(a) Existiert für einen Gleichgewichtspunkt x0 des Systems ẏ = f (y) eine
Ljapunow–Funktion V, so ist x0 stabil .
(b) Ist V eine strenge Ljapunow–Funktion für x0 , so ist x0 asymptotisch stabil .
Anwendungen dieser Aussagen folgen in 5.4–5.7.
Beweis.
(a) Wir dürfen x0 = 0 annehmen. Die Ljapunow–Funktion V sei in einer
Umgebung Ω0 des Nullpunkts definiert. Wir wählen ein r > 0 mit Kr (0) ⊂ Ω0 .
Für vorgegebenes ε > 0 mit 0 < ε ≤ r ist Sε = {x | x = ε} eine kompakte
Teilmenge von Ω0 , und V ist dort positiv. Also existiert
m(ε) := min {V (x) | x ∈ Sε } > 0 .
Da V im Nullpunkt stetig ist, gibt es ein δ mit 0 < δ < ε und
x < δ =⇒ V (x) < m(ε) .
Für x < δ fällt t → V (ϕ(t, x)) monoton. Also bleibt V (ϕ(t, x)) < m(ε) für
wachsendes t ≥ 0, und ϕ(t, x) kann die Sphäre Sε nicht erreichen, denn dort
ist V (x) ≥ m(ε).
Für x < δ existiert nach dem Kompaktheitssatz also ϕ(t, x) für alle t ≥ 0
und erfüllt die Bedingung ϕ(t, x) < ε.
(b) Nach (a) gibt es zu ε = r ein mit 0 < < r und
x < =⇒ ϕ(t, x) < r für alle t ≥ 0 .
Wir behaupten: Für x < gilt sogar lim ϕ(t, x) = 0.
t→∞
Sei ε ∈ ]0, [ vorgegeben. Nach (a) gibt es ein δ ∈ ]0, ε[ mit

(∗) η < δ =⇒ ϕ(t, η) < ε für alle t ≥ 0 .
Wir zeigen: Zu jedem x mit x < gibt es ein T ≥ 0 mit ϕ(t, x) < ε für
t ≥ T . Im Fall x < δ folgt das aus (∗) mit T = 0. Sei also δ ≤ x < .
Wegen < r ist nach Voraussetzung
M := max {∂f V (y) = ∇V (y) , f (y) | δ ≤ y ≤ r}
negativ. Es folgt
d
dt
V (ϕ(t, x)) = ∇V (ϕ(t, x)) , f (ϕ(t, x)) ≤ M,
also V (ϕ(t, x)) ≤ V (x) + t M , solange ϕ(t, x) ≥ δ gilt. Da V (ϕ(t, x)) nicht
negativ werden kann, muss es ein T > 0 geben mit ϕ(T, x) < δ.
Wegen des Eindeutigkeitssatzes gilt ϕ(t + T, x) = ϕ(t, ϕ(T, x)). Nach (∗) folgt
ϕ(t + T, x) < ε für t ≥ 0. 2
5.3 Der Instabilitätssatz von Tschetajew (Cetaev)
Eine Gleichgewichtslage x0 ∈ Ω des .

Systems ẏ = f (y) auf Ω ist instabil,
wenn es eine C1 –Funktion V auf ei-
ner Umgebung Ω0 ⊂ Ω von x0 und
ein Gebiet D ⊂ Ω0 mit folgenden Ei-
genschaften gibt: D
x0
x0 ∈ ∂D,
V > 0 und ∂f V > 0 in D,
V = 0 auf Ω0 ∩ ∂D. . .
Wir können uns das Gebiet D als krummes Halbkegelstück mit Spitze x0 vor-
stellen. Ein ebenes Beispiel liefern die Separatrizen in 3.4.
Beweis.
Sei o.B.d.A. x0 = 0 und r > 0 mit Kr (0) ⊂ Ω0 gewählt. Wir nehmen an,
x0 = 0 sei stabil und geben ein ε mit 0 < ε < r vor. Dann gibt es ein δ mit
0 < δ < ε und
(1) x < δ =⇒ Ê + ⊂ J(x) und ϕ(t, x) < ε für alle t ≥ 0 .
Wir fixieren ein x ∈ D mit x < δ, was wegen 0 ∈ ∂D möglich ist. Nach
Voraussetzung gilt V (x) > 0, und x gehört zur Menge
K := {y ∈ D | y ≤ ε , V (y) ≥ V (x)} ⊂ Kε (0) ⊂ Ω0 .
K ist beschränkt und abgeschlossen: Sei y = lim yn mit yn ∈ K. Dann folgt

n→∞
y ≤ ε, also y ∈ Ω0 und somit V (y) = lim V (yn ) ≥ V (x). Wegen V (x) > 0
n→∞
kann y nicht auf ∂D ∩ Ω0 liegen, da dort V = 0 gilt. Somit existiert
m := min {∂f V (y) | y ∈ K } > 0 ,
Letzteres wegen K ⊂ D. Solange ϕ(t, x) in K bleibt gilt
d
dt V (ϕ(t, x)) = ∂f V (ϕ(t, x)) ≥ m ,
somit
(2) V (ϕ(t, x)) ≥ V (x) + tm ,
insbesondere V (ϕ(t, x)) ≥ V (x). Wegen (1) könnten die Punkte ϕ(t, x) ∈ Ω0
für wachsendes t die Menge K also nur über ∂D ∩ Ω0 verlassen, was aber auch
unmöglich ist, da dort V = 0 gilt. Somit ist (2) für alle t ≥ 0 gültig, d.h.
V ist auf K unbeschränkt. Damit führt die Annahme der Stabilität auf einen
Widerspruch. 2
5.4 Erste Integrale als Ljapunow–Funktionen

Eine C1 –Funktion W : Ω0 → Ê
heisst erstes Integral des Systems ẏ = f (y)
im Gebiet Ω0 , wenn W (u(t)) konstant ist für jede Lösung u, solange u(t) ∈ Ω0 .
Äquivalent dazu ist die Bedingung
∂f W (x) = ∇W (x) , f (x) = 0 für alle x ∈ Ω0 ,
wie sich unmittelbar aus der Beziehung (∗) von 5.1 ergibt.
Die Funktion W hat an der Stelle x0 ein striktes lokales Minimum, wenn
W (x0 ) < W (x) für alle x = x0 in einer Umgebung von x0 .
Ist W ein erstes Integral des Systems ẏ = f (y) in Ω0 ⊂ Ω und hat W im
Gleichgewichtspunkt x0 ∈ Ω0 ein striktes lokales Minimum, so ist durch x →
W (x) − W (x0 ) eine Ljapunow–Funktion gegeben, also ist x0 nach 5.2 (a) stabil.
Erste Integrale lassen sich in einfachen Fällen durch geschicktes Kombinieren

der Differentialgleichungen gewinnen.
Beispiel. Das System
ẋ = x − xy , ẏ = − y + x y
im Quadranten x > 0, y > 0 hat den einzigen Gleichgewichtspunkt (1, 1). Für
Lösungen t → (x(t), y(t)) gilt
ẋ + ẏ = x − y und xẏ + ẋy = x2 y − xy 2 = xy(x − y) , also

xẏ + ẋy
ẋ + ẏ − = (x + y − log(xy))˙ = 0 .
xy
Somit ist W (x, y) := x+y−log(xy) konstant längs jeder Lösung. Wegen log t ≤
t − 1 gilt ferner W (x, y) ≥ 2 = V (1, 1) mit Gleichheit nur für (x, y) = (1, 1).
Somit hat W in (1, 1) ein striktes lokales Minimum und ist ein erstes Integral.
5.5 Hamiltonsche Systeme

(a) Ist (q0 , p0 ) eine Gleichgewichtslage des Hamiltonschen Systems
∂H ∂H
q̇k = (q, p) , ṗk = − (q, p) (k = 1, . . . N )
∂pk ∂qk
und hat H dort ein striktes lokales Minimum, so liegt eine stabile Gleichge-
wichtslage vor. Das folgt aus 5.4 aufgrund des Energieerhaltungssatzes
H(q(t), p(t)) = E .
Eine detailliertere Aussage erhalten wir für Hamiltonen–Funktionen der Form
1
N
1
H(q, p) = mij (q) pi pj + U (q) = p , M (q) p + U (q),
2 2
i,j=1
wobei die Matrix M (q) an jeder Stelle q positiv definit ist. Die kanonischen
Gleichungen lauten hier
q̇ = M (q) p ,

N
ṗ = − 21 p , ∂k M (q) p ek − ∇U (q) .
k=1
Wegen Rang M (q) = N haben die Gleichgewichtspunkte die Form (q0 , 0) mit
∇U (q0 ) = 0. Hier gilt also:
Hat U an der Stelle q0 ein striktes lokales Minimum, so liegt nach (a) Stabilität
vor, vgl. 3.4.
(c) Hängt beim zuletzt angegebenen System M nicht von q ab und hat U an
der Stelle q0 ein lokales Maximum mit negativ definiter Hesse–Matrix U (q0 ),
so ist (q0 , 0) eine instabile Gleichgewichtslage.
Wir zeigen dies mit Hilfe des Satzes von Tschetajew 5.3. Dabei dürfen wir
o.B.d.A. q0 = 0 annehmen. Wir wählen δ > 0 so, dass U (q) für q < δ
negativ definit ist, vgl. Bd. 1 § 22 : 4.5 (b). Dann setzen wir
Ω0 := {(q, p) | q < δ} , D := {(q, p) ∈ Ω0 | q , p > 0} ,
V (q, p) := q , p .
Eine leichte Rechnung zeigt, dass für f (q, p) = (M hspace.75ptp, −∇U (q))
∂f V (q, p) = p , M p − q , ∇U (q) .
Nach dem Satz von Taylor gilt für q < δ mit geeignetem ϑ ∈ ]0, 1[
1

U (0) = U (q) − q , ∇U (q) + 2 q , U (ϑ q) q
 0 für (q, p) = (0, 0) und q < δ .
Damit sind die Voraussetzungen für 5.3 erfüllt ÜA .
Bemerkung. Wie die Herleitung zeigt, genügen folgende Voraussetzungen:

∇U (q0 ) = 0 und q − q0 , ∇U (q) < 0 für 0 < q − q0 < δ.
5.6 Gedämpfte Systeme mit einem Freiheitsgrad

Die Bewegungsgleichung
q̈ + D(q) q̇ − F (q) = 0
entsteht aus der in Abschnitt 3 behandelten DG q̈ = F (q) durch Einführung

eines zusätzlichen, der Geschwindigkeit proportionalen Dämpfungsterms. Das
zugehörige System erster Ordnung ist
q̇ = p , ṗ = − D(q) p + F (q) .
Jeder Gleichgewichtspunkt (q0 , 0) das ungedämpften Systems ist offenbar auch

ein Gleichgewichtspunkt des gedämpften und umgekehrt. Für die Hamilton–
Funktion des ungedämpften Systems,
q
H(q, p) = 1
2
p2 + U (q) mit U (q) = − F (s) ds
q0
und das Vektorfeld f = (p, −D(q) p + F (q)) des gedämpften gilt ÜA
(∗) ∂f H(q, p) = − D(q) p . 2
(a) Satz. Der Gleichgewichtspunkt (q0 , 0) ist asymptotisch stabil, wenn

D(q0 ) > 0 und (q − q0 ) F (q) < 0 für 0 < | q − q0 | 1 .
U hat in diesem Fall an der Stelle q0 ein striktes lokales Minimum.
Bemerkung. Im Fall U (x0 ) > 0 folgt die asymptotische Stabilität auch aus
4.3. Hier geht es nicht so sehr um den Fall U (x0 ) = 0, vielmehr um eine
Demonstration der Methode von Ljapunow.
Beweis.
Nach Voraussetzung gibt es Zahlen > 0, δ > 0 mit
D(q) ≥ für | q − q0 | < δ ,
(q − q0 ) F (q) < 0 für 0 < | q − q0 | < δ .
Die zweite Eigenschaft bewirkt U (q) = −F (q) > 0 rechts von q0 und U (q) < 0
links von q0 , also U (q0 ) < U (q) für 0 < | q − q0 | < δ. Deswegen und wegen (∗)
ist H eine Ljapunow–Funktion und (q0 , 0) damit eine stabile Gleichgewichtslage.
Es gilt ∂f H(q, p) < 0 außer für p = 0 . Um eine strenge Ljapunow–Funktion zu
erhalten, modifizieren wir H ein wenig, indem wir
q
V (q, p) := H(q, p) + 1
2
(q − q0 ) p + (s − q0 ) D(s) ds
q0
setzen. Der Übergang von H nach V bewirkt ein leichtes Kippen der Tangenten
der Niveaulinien in den Achsenpunkten (q, 0) gegen den Uhrzeigersinn.
Dann ist V eine strenge Ljapunow–Funktion, denn wegen U (q) > U (q0 ) = 0
für 0 < |q − q0 | < δ gilt

V (q, p) ≥ 1
2
p2 + 1
2
(q − q0 ) p + 1
2
(q − q0 )2
2
> 1
2
p+ 1
2
(q − q0 ) ≥ 0 für (q, p) = (q0 , 0) , |q − q0 | < δ ,
und für diese (q, p) ist ( ÜA )

∂f V (q, p) = − D(q) − 1
2
p2 + 1
2
(q − q0 ) F (q) < 0 . 2
(b) Satz. Der Gleichgewichtspunkt (q0 , 0) ist instabil unter den Voraussetzun-
gen
D(q0 ) > 0 und (q − q0 ) F (q) > 0 für 0 < |q − q0 | 1 .
U hat in diesem Fall an der Stelle q0 ein striktes lokales Maximum.

Beweis.
Um den Satz von Tschetajew anzuwenden, nehmen wir q0 = 0 an und betrach-
ten
q
V (q, p) := q p + s D(s) ds .
0
Wir wählen δ > 0 so, dass q F (q) > 0 und D(q) > 0 für 0 < q < δ. Dann
zeigt eine einfache Rechnung ÜA , dass
∂f V (q, p) = p2 + q F (q) > 0 für p = 0 , 0 < q < δ .
Mit M := max {D(q) | |q| ≤ δ} gilt ferner
V (q, p) ≤ q p + 1
2
M q 2 = q (p + 1
2
M q) .
Also gilt V (q, p) < 0 für q > 0, p < − 12 M q. Ferner ist V (q, p) > 0 und
∂p V (q, p) = q > 0 für 0 < q < δ und p > 0. Daher besitzt die Gleichung
V (q, p) = 0 für 0 < q < δ eine eindeutige C1 –Auflösung p = ϕ(q). Setzen wir

Ω0 := (q, p) | q | < δ , D= (q, p) q > 0 und p > ϕ(q) ,
so sind die Voraussetzungen des Satzes von Tschetajew erfüllt. 2
5.7 Anmerkungen und Aufgaben

(a) Allgemeine gedämpfte mechanische Systeme. Wir betrachten das System
q̇ = M (q) p , ṗ = − ∇U (q) − D(q)p ,
wobei die Matrix D(q) für alle in Betracht kommenden Lagen q positiv definit
ist. Dann gilt: Hat U an der Stelle q0 ein striktes lokales Minimum, so ist (q0 , 0)
eine asymptotisch stabile Gleichgewichtslage. Das ergibt sich aus dem Satz von
La Salle, der eine wichtige Verallgemeinerung des Ljapunowschen Satzes ist.

Wir verweisen auf Knobloch–Kappel [23] III.6.
(b) Das gedämpfte Pendel . Geben Sie eine strenge Ljapunow–Funktion für die
Pendelgleichung
q̈ + Dq̇ + sin q = 0
in Umgebung des Gleichgewichtspunktes (2kπ, 0) an (D > 0 eine Konstante).
Entwerfen Sie ein Phasenportrait.
(c) Zeigen Sie für Gradientensysteme
ẏ = − ∇U (y)
mit U ∈ C2 (Ω): Hat U an der Stelle x0 ∈ Ω ein striktes lokales Minimum
und gilt ∇U (x) = 0 für alle x = x0 einer Umgebung von x0 , so ist x0 eine
asymptotisch stabile Gleichgewichtslage.
6 Die Sätze von Liouville und Poincaré–Bendixson

6.1 Der lokale Fluss eines Vektorfeldes
Bisher galt unser Interesse dem Verlauf einzelner Flusslinien t → ϕ(t, η) des
Systems ẏ = f (y) auf Ω . Nun beziehen wir einen anderen Standpunkt. Wir
halten t fest und fragen, was aus einer bestimmten Menge M von Startpunkten
nach der Zeit t wird, d.h. wie sich die Menge Mt = {ϕ(t, x) | x ∈ M } im Lauf
der Zeit verhält.
Wir betrachten also die Schar von Flussabbildungen
Φt : x → ϕ(t, x) .
Als Definitionsbereich von Φt wählen wir ein Gebiet G ⊂ Ω mit gleichmäßiger
Lebensspanne, d.h. wir verlangen von G, dass es ein T > 0 gibt mit ]−T, T [ ⊂
J(x) für alle x ∈ G. Jedes beschränkte Teilgebiet G mit G ⊂ Ω hat diese
Eigenschaft. Denn da Ωf nach 1.1 (b) offen ist, hat die kompakte Menge {0}×G
zu ∂Ωf einen positiven Abstand T , also gilt ]−T, T [ × G ⊂ Ωf .
Für das ganze Gebiet Ω muss es keine gleichmäßige Lebensspanne geben, vgl.
Aufgabe 6.2 (a).
◦
Satz. Sei G ein Teilgebiet von Ω und I ein Intervall mit 0 ∈ I , so dass I × G
im Definitionsbereich Ωf von ϕ(t, x) liegt. Dann ist für jedes t ∈ I die Menge
Gt := { ϕ(t, x) | x ∈ G }
ein Gebiet in Ω und
Φt : G → Gt , x → ϕ(t, x)
ein orientierungstreuer Diffeomorphismus.
6 Die Sätze von Liouville und Poincaré–Bendixson 129
Beweis.
(a) Nach Definition einer Lösung liegt ϕ(t, x), soweit definiert, in Ω, also gilt
Gt ⊂ Ω.
(b) Nach Definition von Gt ist Φt : G → Gt surjektiv. Φt ist injektiv, denn
aus ϕ(t, x) = ϕ(t, y) folgt x = ϕ(0, x) = ϕ(−t, ϕ(t, x)) = ϕ(−t, ϕ(t, y)) =
ϕ(0, y) = y nach dem Eindeutigkeitssatz.
(c) Φt ist C1 –differenzierbar nach 1.1 (b).
(d) Bestimmung der Umkehrabbildung Φ−1 t . Sei y ∈ Gt , also y = ϕ(t, x) mit
eindeutig bestimmtem x ∈ G. Wir setzen u(s) := ϕ(s + t, x). Dann enthält das
Definitionsintervall J(x) − t von u die Punkte −t und 0, und u ist eine Lösung
von ẏ = f (y) mit u(0) = y und u(−t) = ϕ(0, x) = x. Es folgt −t ∈ J(y) und
(∗) Φ−1
t (y) = x = ϕ(−t, y) .
(e) Gt ist ein Gebiet.

Wegen der Stetigkeit von ϕ auf Ωf ist Φ−1 t = Φ−t stetig, also Gt als Urbild
von G unter dieser Abbildung offen.
Andererseits ist Gt als Φt –Bild der wegzusammenhängenden Menge G auch
wegzusammenhängend, also ein Gebiet. Die C1 –Differenzierbarkeit von Φ−1 t
ergibt sich aus der Darstellung (∗) und aus dem Differenzierbarkeitssatz 1.1 (b).
(f) Orientierungstreue. Da Φt eine C1 –Umkehrfunktion besitzt, ist die Deter-
minante det(DΦt )(x) = 0 für alle x ∈ G. Die Funktion t → det(DΦt )(x) ist
bei festem x stetig in t, wie sich aus dem Laplaceschen Entwicklungssatz mittels
Induktion ergibt. Wegen Φ0 = ½G ist det DΦ0 (x) = det E = 1 für alle x ∈ G,
also ist det DΦt (x) positiv für alle t ∈ I. 2

-
(a) Zeigen Sie für die logistische DG ẏ = y(1 − y), dass J(x) = {0} gilt,
x∈ Ê
und bestimmen Sie Φt (]1, ∞[).
(b) Eine reelle 2×2–Matrix A habe die rein imaginären Eigenwerte iω, −iω mit
ω > 0. Verschaffen Sie sich anhand der zweiten Figur 2.4 eine grobe Vorstellung
davon, wie sich unter der Dynamik des Systems ẏ = Ay die Φt –Bilder der
Strecke σ = {(x, 0) | 0 ≤ x ≤ 1} im Laufe der Zeit verhalten.

(c) Wir betrachten das System ẏ = Ay für A = ω 0 −ω
0
bzw. A = −ω 0 −ω
0
mit ω > 0. Bestimmen Sie für t > 0 und das offene Rechteck R mit den Ecken
(0, 0), (a, 0), (a, b), (b, 0) in beiden Fällen die Gestalt und den Flächeninhalt des
Gebiets Φt (R).
6.3 Der Satz von Liouville

Der lokale Fluss eines divergenzfreien Vektorfeldes f ist volumentreu: Für jedes
Gebiet G ⊂ Ω mit gleichmäßiger Lebensspanne I (vgl. 6.1) und endlichem
Volumen gilt Vol (Φt (G)) = Vol G für alle t ∈ I .
Beweis.
Für t ∈ I und x ∈ G sei At (x) = (DΦt )(x). Nach 6.1 ist det At (x) > 0. Der
Transformationssatz für Integrale (Bd. 1, § 23 : 8.1) liefert für Gt := Φt (G)

Vol (Gt ) = 1 dn y = | det At (x) | dn x = det At (x) dn x .
Gt G G
Wir behaupten, dass det At (x) zeitlich konstant und damit gleich det A0 (x) =
1 ist, woraus dann Vol (Gt ) = 1 dn x = Vol (G) folgt. In der Tat erfüllt die Ma-
G
d
trix At (x) nach 1.1 (b) die Variationsgleichung dt At (x) = (Df )(ϕ(t, x))At (x).
Hieraus folgt bei festem x für die Wronski–Determinante W (t) = det At (x)
nach § 3 : 1.3
Ẇ (t) = Spur (Df )(ϕ(t, x))W (t) = (div f )(ϕ(t, x))W (t) = 0 . 2
6 Die Sätze von Liouville und Poincaré–Bendixson 131
Bemerkung. Für dissipative Systeme (div f ≤ 0) gilt Vol (Gt ) ≤ Vol (G) für
t ≥ 0.
Das folgt durch Modifikation des Beweises unter Beachtung von det At (x) ≤ 1
ÜA .
ÜA Wie verhält sich das Volumen Vol (Gt ) unter dem Fluss eines Vektorfeldes
f mit konstanter Divergenz : div f (x) = k ?
6.4 Halbflüsse und globale Flüsse

Von besonderem Interesse sind Teilgebiete von Ω, auf denen die Flussabbildung
Φt für alle t oder wenigstens für alle t ≥ 0 definiert ist.
(a) Eine Teilmenge M von Ω heißt invariant (bzw. positiv invariant) unter
dem Fluss des Vektorfeldes f , wenn für jeden Startpunkt η ∈ M die Lösung
ϕ(t, η) für alle t (bzw. für alle t ≥ 0) definiert ist und in M verbleibt.
Beispiele. (i) Jeder periodische Orbit ist invariant.

(ii) Bei ebenen Systemen ist das Innere eines periodischen Orbits invariant,
falls dieses zu Ω gehört.
(iii) Für die logistische DG ẏ = y(1 − y) ist [1, ∞[ positiv invariant, aber nicht
invariant, dagegen sind die Intervalle ]0, 1[ und [0, 1] invariant.
(iv) Für lineare Systeme ẏ = A(y) sind die invarianten Teilräume von der
Form Kern (A − λE)k mit Eigenwerten λ, siehe § 3 : 2.7.
(v) Besitzt das System ẏ = f (y) eine Ljapunow–Funktion V , so ist die Menge
{x ∈ Ω | V (x) ≤ c} für genügend kleine c positiv invariant, vgl. 5.1 und 5.2.
(b) Ist Ω0 ein invariantes (bzw. positiv invariantes) Gebiet, so können wir das
System ẏ = f (y) auf Ω0 einschränken. Wir bezeichnen Ω0 wieder mit Ω, die
Einschränkung von f auf Ω0 wieder mit f und haben dann folgende Situation:
(c) Ein Vektorfeld f auf Ω erzeugt dort einen globalen Fluss {Φt | t ∈ }, Ê
wenn alle Lösungen auf ganz Ê
definiert sind.
Es erzeugt einen (positiven) Halbfluss, wenn alle Lösungen für t ≥ 0 definiert
sind.
(d) Satz. Erzeugt das Vektorfeld f einen globalen Fluss, so ist
Φt : Ω → Ω, x → ϕ(t, x)
ein orientierungstreuer Diffeomorphismus mit der Gruppeneigenschaft
Φs ◦ Φt = Φt ◦ Φs = Φs+t für s, t ∈ Ê, Φ 0 = ½Ω , Φ−1

t = Φ−t .
Erzeugt f einen Halbfluss, so gilt wenigstens die Halbgruppeneigenschaft
Φs ◦ Φt = Φt ◦ Φs = Φs+t für s, t ≥ 0 und Φ0 = ½Ω .

Bemerkung. Die Gruppeneigenschaft für globale Flüsse stellt eine Verallge-

meinerung des Exponentialgesetzes § 3 : 1.5 dar: Für ein System ẏ = Ay mit
konstanten Koeffizienten gilt
Φt (x) = etA x und e(s+t)A = esA etA für s, t ∈ Ê.
Beweis.
(i) Die Halbgruppeneigenschaft von Halbflüssen ergibt sich wie folgt: Für x ∈
Ω und festes s ≥ 0 ist u(t) := ϕ(s + t, x) für alle t ≥ 0 definiert und liefert
eine Lösung von ẏ = f (y) mit u(0) = ϕ(s, x). Daher gilt u(t) = ϕ(t, ϕ(s, x))
für alle t ≥ 0. Durch Vertauschen der Rollen von s und t folgt die Behauptung.
(ii) Die Beziehung Φs ◦ Φt = Φt ◦ Φs = Φs+t für alle s, t ∈ Ê folgt bei
globalen Flüssen ganz analog. Für diese ist Φt : Ω → Ωt ⊂ Ω für alle t ∈Ê ein
orientierungstreuer Diffeomorphismus.
Zu zeigen ist Φs (Ω) = Ω und Φ−1 Ê
= Φ−s für alle s ∈ . Sei y ∈ Ω, x =
Ê
s
ϕ(−s, y) und u(t) := ϕ(t − s, y). Dann ist u(t) eine für alle t ∈ definierte
Lösung mit u(0) = x und u(s) = y. Daraus folgt u(t) = ϕ(t, x) , insbesondere
y = ϕ(s, y) und damit x = ϕ(−s, y) = ϕ(−s, ϕ(s, x)), also y ∈ Φs (Ω) und
Φ−s ◦ Φs = ½Ω für alle s ∈ Ê. 2
6.5 Der Satz von Poincaré–Bendixson

Für ebene autonome Systeme
ẋ = f (x, y) , ẏ = g(x, y) auf Ω ⊂ Ê2
gilt: Ist K eine nichtleere, kompakte, positiv invariante Teilmenge von Ω ohne
Gleichgewichtspunkte, so enthält K mindestens einen periodischen Orbit.
Für den Beweis und Anwendungsbeispiele sei auf Arrowsmith–Place [7] 3.9,
Hirsch–Smale [10] Ch. 11 und Miller–Michel [11] Ch. 7 verwiesen. Für höhe-
re Dimensionen n ≥ 3 ist dieser Satz nicht gültig.
Aufgabe. Zeigen Sie, dass das System

ẋ = − y + x (1 − x2 − y 2 ) , ẏ = x + y (2 − x2 − y 2 )
im Kreisring K = {1 ≤ x2 + y 2 ≤ 2} einen periodischen Orbit besitzt.
Anleitung: Setzen Sie r = d 2
x2 + y 2 und zeigen Sie dt r (t) ≥ 0 für r ≤ 1
√
und dt r (t) ≤ 0 für r ≥ 2. Der Kreisring K ist daher positiv invariant.
d 2
Kapitel III
Partielle Differentialgleichungen,
elementare Lösungsmethoden
In diesem einführenden Kapitel behandeln wir einfache Beispiele von partiellen
Differentialgleichungen der Mathematischen Physik. Wir stellen zwei Lösungs-
methoden vor, die insofern elementar sind, als sie sich nur auf die Differential–
und Integralrechnung und auf gewöhnliche Differentialgleichungen stützen.
In § 6 werden Separationsansätze vorgestellt, die auf Fourierreihen führen. An
Vorkenntnissen genügen hierfür die ersten beiden Abschnitte von § 4. In § 15 : 3
werden weitere Beispiele für die Separationsmethode folgen; diese führen uns
auf die speziellen Funktionen der mathematischen Physik.
In § 7 wird die Charakteristikenmethode für partielle Differentialgleichungen
1. Ordnung dargestellt, ferner werden Systeme von partiellen Differentialglei-
chungen 1. Ordnung behandelt. Dabei wird die Kenntnis der grundlegenden
Theorie gewöhnlicher Differentialgleichungen aus § 2 verwendet (Existenz, Ein-
deutigkeit und differenzierbare Abhängigkeit von Lösungen).
§ 6 Separationsansätze und Fourierreihen
1 Die schwingende Saite I

1.1 Problemstellungen und Lösungsansatz
Für die Transversalschwingung einer an den Enden eingespannten elastischen
Saite entnehmen wir aus § 1, Abschnitt 2 folgende Gleichungen für die vertikale
Auslenkung u(x, t) aus der Ruhelage an der Stelle x zur Zeit t:
∂2u
Ê
2
2 ∂ u
(a) (x, t) = c (x, t) für 0 < x < L, t ∈ (Wellengleichung),
∂t2 ∂x2
(b) u(0, t) = u(L, t) = 0 für t ∈ Ê (Randbedingung).
Von den Lösungen u verlangen wir u ∈ C2 (Ω); das bedeutet C2 –Differenzier-

barkeit in Ω = ]0, L[ × Ê
und stetige Fortsetzbarkeit von u und allen partiellen
Ableitungen bis zur 2. Ordnung auf Ω. Dann macht (a) auch in den Rand-
2
punkten x = 0 und x = L Sinn, wenn in diesen ∂∂xu2 als einseitige Ableitung
aufgefasst wird.
Dieses mathematische Modell wird zwei Aspekte der Erfahrung erklären:

134 § 6 Separationsansätze und Fourierreihen
• Jede Saitenschwingung ist eine Überlagerung harmonischer Sinusschwingun-

gen (Grundton und Obertöne). Wir zeigen: Jede Lösung der Gleichungen (a), (b)
besitzt eine Darstellung in Form einer unendlichen Reihe von harmonischen
Schwingungen, wobei wir unter einer harmonischen Schwingung eine Lösung
der Form
πk
u(x, t) = w(t) sin L x (k = 1, 2, . . .)
verstehen. Hierbei liefert die Theorie

der Fourierreihen das Werkzeug für die
Klangsynthese und die Klanganalyse,
also die Bestimmung der Amplituden
der Grund– und Oberschwingungen.
In der Figur ist eine Langzeitaufnah-
me einer solchen stehenden Welle“ in
”
starker Überhöhung wiedergegeben.
• Auslenkungen breiten sich längs der Saite wellenförmig aus. Dabei wird die
Einhaltung der Randbedingung durch Superposition von ein– und auslaufenden
Wellen ermöglicht.
Wir behandeln im folgenden

Das Anfangs–Randwertproblem. Gegeben seien Funktionen
f ∈ C2 [0, L], g ∈ C1 [0, L] mit f (0) = f (L) = g(0) = g(L) = 0.
Gesucht ist eine Lösung der Wellengleichung (a), die der Randbedingung (b)
und der Anfangsbedingung
∂u
(c) u(x, 0) = f (x) , (x, 0) = g(x) für 0 ≤ x ≤ L.
∂t
genügt. Diese Voraussetzungen reichen nicht aus, um die Existenz einer C2 –
differenzierbaren Lösung zu sichern. Wie sie zu verschärfen sind wird im Fol-
genden erörtert.
An die Vorstellung, beliebige Saitenschwingungen durch Superposition von har-
monischen Schwingungen zu gewinnen, knüpft die Separationsmethode an,
die von Daniel Bernoulli 1753 als eine Methode von größtem Nutzen“ intui-
”
tiv erkannt und propagiert wurde. Diese besteht darin, die Lösung in folgenden
Schritten zu gewinnen:
– Bestimmung sämtlicher Produktlösungen u(x, t) = v(x) w(t) von (a) und (b).
Dies führt auf gewöhnliche Differentialgleichungen 2. Ordnung für v und w, wo-
bei v die Randbedingung (b) zu erfüllen hat.
–Ansatz für die gesuchte, den Anfangsbedingungen (c) genügende Lösung als
Superposition dieser Produktlösungen in Form einer Reihe.
1 Die schwingende Saite I 135
– Nachweis, dass dieser Ansatz wirklich eine Lösung liefert, d.h. dass die Reihe
genügend oft gliedweise differenziert werden darf.
1.2 Lösungen in Produktgestalt

Wir suchen nichtverschwindende Lösungen von (a) und (b) in Produktgestalt
u(x, t) = v(x)w(t) mit v ∈ C2 [0, L], w ∈ C2 ( ). Ê
Diese erfüllen die Wellengleichung (a) genau dann, wenn
v(x)w (t) = c2 v (x)w(t) für x ∈ [0, L], t ∈ Ê

bzw.
w (t) v (x)
w(t)
= c2
v(x)
für x ∈ [0, L], t ∈ Ê
(bis auf Nullstellen der Nenner). Die letzte Gleichung kann nur bestehen, wenn
beide Seiten konstant sind: Denn fixieren wir ein t0 mit w(t0 ) = 0, so folgt
v(x)w (t0 ) = c2 v (x)w(t0 ), somit
w (t0 )
(I) v (x) + λv(x) = 0 mit λ := − .
c2 w(t0 )
Fixieren wir jetzt ein x0 mit v(x0 ) = 0 und lassen t laufen, so folgt mit derselben
Konstante λ
(II) w (t) + c2 λ w(t) = 0 .
Durch den Produktansatz ist die partielle DG (a) in zwei gewöhnliche Diffe-
rentialgleichungen zerlegt (separiert) worden. Aus der Einspannbedingung (b)
folgt v(0) = v(L) = 0.
Somit führt (I) auf das Randwertproblem
v + λ v = 0 , v(0) = v(L) = 0 .
Dieses kann höchstens für λ > 0 nichttriviale Lösungen haben. Dies läßt sich
leicht aus der allgemeinen Lösung der Schwingungsgleichung ablesen. Im Hin-
blick auf spätere Verallgemeinerungen leiten wir das direkt aus der Differential-
gleichung ab. Hierzu multiplizieren wir diese mit v, integrieren von 0 bis L und
erhalten unter Beachtung von v(0) = v(L) = 0
L L L L
vv = − vv 0 +
L
v = v > 0 ,
2 2
λ v2 = −
0 0 0 0
denn v kann wegen v(0) = v(L) = 0, v = 0 nicht konstant sein.

Für λ > 0 hat die DG v + λ v = 0 die allgemeine Lösung
√ √
v(x) = a cos λ x + b sin λ x
mit Konstanten a, b.
√
Aus v(0) = 0 folgt a = 0, aus v(L) = 0 und b = 0 folgt weiter sin λL = 0,
also λ = (πk/L) mit k ∈
2

und damit v(x) = b sin(πkx/L). Setzen wir λ in
die DG (II) ein, so ergibt sich
πkc πkc
w(t) = α cos t + β sin t.
L L
Wir erhalten somit:
Sämtliche Lösungen von (a),(b) in Produktform sind von der Form
πkc πkc
πk
ak cos t + bk sin t sin x (k = 1, 2, . . .)
L L L
mit Konstanten ak , bk .
Dies sind die harmonischen Schwingungen der Saite.
1.3 Superposition von Produktlösungen

Wir fragen nun nach der allgemeinen Lösung der Wellengleichung (a) mit der
Randbedingung (b). Da (a) und (b) lineare homogene Gleichungen für u darstel-
len, erfüllt auch jede Linearkombination von Produktlösungen die Bedingungen
(a) und (b). Um die Anfangsbedingungen (c) mit beliebig vorgegebenen Funk-
tionen f und g zu erfüllen, werden diese Linearkombinationen nicht genügen.
Wir gehen daher noch einen Schritt weiter und vermuten, dass sich die allge-
meine Lösung von (a) und (b) als unendliche Reihe
∞
πkc πkc πk
u(x, t) = ak cos t + bk sin t sin x,
L L L
k=1
darstellen läßt ( Superposition harmonischer Schwingungen“).

”
Die Anfangsbedingungen (c) führen auf die Gleichungen

∞
πk
f (x) = u(x, 0) = ak sin x (0 ≤ x ≤ L) ,
L
n=1
∂u πkc
∞
kπ
g(x) = (x, 0) = bk sin x (0 ≤ x ≤ L) .
∂t L L
n=1
Beide Gleichungen stellen uns vor das Problem, eine gegebene Funktionen in
eine Sinus–Reihe zu entwickeln. Die Bewältigung dieser Aufgabe ist der ent-
scheidende Schritt zur Rechtfertigung des Superpositionsansatzes.
Wir beschäftigen uns daher zunächst mit der Frage nach der Entwickelbarkeit
von Funktionen in trigonometrische Reihen. Nach der Klärung dieses Problems
im folgenden Abschnitt setzen wir die Behandlung der schwingenden Saite fort.
2 Fourierreihen 137
2 Fourierreihen
In diesem Abschnitt sollen folgende Fragen beantwortet werden:
(a) Welche Funktionen u : [−π, π] → lassen sich durch trigonometrische
Reihen
1
∞

(∗) u(x) = a0 + ak cos kx + bk sin kx
2
k=1
mit geeigneten Koeffizienten ak , bk darstellen? (Das in 1.3 formulierte Problem

ergibt sich als Spezialfall nach geeigneter Umskalierung der Variablen x, sie-
he 2.1 (a)).
(b) Sind die Koeffizienten ak , bk durch u eindeutig bestimmt, und wie lassen
sich diese gegebenenfalls berechnen?
(c) In welchem Sinn konvergiert die Reihe (∗) ?
(d) Wie spiegeln sich Differenzierbarkeitseigenschaften von u im Verhalten der
Koeffizienten ak , bk wieder?
2.1 Varianten der Reihendarstellung

(a) Für beliebige kompakte Intervalle [a, b] lautet die trigonometrische Reihe
∞
1 πk πk
f (y) = a0 + ak cos (y − m) + bk sin (y − m)
2 L L
k=1
mit m := (a + b)/2 , L := (b − a)/2 . Diese Reihenentwicklung ist äquivalent zu

(∗) durch die Umskalierung u(x) = f (m + Lx/π) bzw. f (y) = u(π(y − m)/L).
Im Fall b = −a = L erhalten wir die Reihe
∞
1 πk πk
f (y) = a0 + ak cos y + bk sin y .
2 k=1 L L
(b) Für theoretische Zwecke ist es zweckmäßig, (∗) in die äquivalente komplexe
”
Form“

n
(∗∗) u(x) = lim ck eikx
n→∞ k=−n
zu bringen; dabei ist

⎧
⎪
⎨
1
2
(ak − i bk ) für k > 0 ,
1
ck = a0 für k = 0 ,
⎪
⎩
2
1
2
(a−k + i b−k ) für k < 0 ,
bzw.
ak = ck + c−k , bk = i (ck − c−k ) für k ∈ ÜA .

Beachten Sie: Aus der Existenz des Grenzwertes (∗∗) folgt noch nicht die Kon-

∞
∞
∞
vergenz der Reihe ck eikx := ck eikx + c−k e−ikx .
k=−∞ k=0 k=1
2.2 Euler–Fouriersche Formeln und Entwicklungsproblem

Satz. Konvergiert die Reihe
1
∞

n
(∗) u(x) = a0 + (ak cos kx + bk sin kx) = lim ck eikx

2 n→∞
k=1 k=−n
gleichmäßig auf [−π, π], so ist u stetig, es gilt u(π) = u(−π), und die Koeffizi-
enten ak , bk , ck ergeben sich aus den Euler–Fourierschen Formeln
1
π
ak = π
u(t) cos kt dt (k = 0, 1, . . .) ,
−π
1

π
bk = π
u(t) sin kt dt (k = 1, 2, . . .) ,
−π
π
ck = 1
2π
u(t) e−ikt dt (k ∈ ).
−π
Diese Formeln fanden Clairaut 1754 und Euler 1777.

Beweis.
Als gleichmäßiger Limes stetiger Funktionen ist u stetig, also machen die an-
gegebenen Integrale Sinn. Wegen der gleichmäßigen Konvergenz ist gliedweise
Integration erlaubt, und wir erhalten
π π π
n
u(t) e−int dt = e−int u(t) dt = e−int lim ck eikt dt
n→∞ k=−n
−π −π −π
π
n
= lim ck ei(k−n)t dt
n→∞ k=−n
−π

n π
∞
= lim ck ei(k−n)t dt = 2πck δnk = 2πcn .
n→∞ k=−n
−π k=−∞
Mit den Umrechnungformeln 2.1 (b) ergeben sich die Integraldarstellungen der
an , bn ÜA . 2
Bemerkungen. (i) Für k = 0 ergibt sich der Mittelwert von u:

1 1
π
2 a0 = 2π u(t) dt .
−π
1
Der Vorfaktor 2
bei a0 in (∗) erlaubt die einheitliche Integraldarstellung der ak .
2 Fourierreihen 139
(ii) Für ungerade Funktionen u verschwinden alle ak , für gerade Funktionen

verschwinden alle bk ÜA .
Unabhängig vom Bestehen der Reihendarstellung (∗) definieren wir für jede über
[−π, π] integrierbare Funktion u die Fourierkoeffizienten ak , bk bzw. ck durch
die Euler–Fourierschen Formeln. Die mit diesen gebildeten Partialsummen
1
n

n
sn (x) := a0 + (ak cos kx + bk sin kx) = ck eikx

2
k=1 k=−n
heißen Fourierpolynome, die zugehörige Reihe die Fourierreihe von u.
Entwicklungsproblem: Unter welchen Voraussetzungen an u konvergiert die

Fourierreihe von u, und wenn, konvergiert sie dann gegen u? Wir werden sehen,
dass die Antwort entscheidend vom gewählten Konvergenzbegriff abhängt.
2.3 Stückweis stetige und abschnittsweis glatte Funktionen

(a) Eine Funktion u : [a, b] → Ê
heißt stückweise stetig, wenn sie höchstens
endlich viele Sprungstellen hat und sonst stetig ist. Dabei heißt ein innerer
Punkt x Sprungstelle, wenn u dort unstetig ist, aber die einseitigen Grenz-
werte u(x−) und u(x+) existieren.
Treppenfunktionen und stetige Funktionen sind stückweise stetig.
Die stückweise stetigen Funktionen bilden einen Vektorraum, bezeichnet mit
PC [a, b] (von piecewise continuous). Das Produkt zweier PC–Funktionen ist
wieder eine PC–Funktion ÜA . Auf [a, b] stückweise stetige Funktionen sind
über [a, b] integrierbar (Bd. 1, § 11 : 4.1).
Für stückweise stetige Funktionen u und injektive C1 –Funktionen ϕ gilt die
Substitutionsregel
b ϕ−1 (b)

u(x) dx = u(ϕ(t)) ϕ (t) dt .
a ϕ−1 (a)
Denn mit u ist auch u ◦ ϕ stückweise stetig. Die Behauptung folgt dann durch
Aufspaltung des Integrals in Integrale über Teilintervalle ohne Sprungstellen
von u im Innern.
(b) Eine Funktion u : [a, b] →
1
Ê
heißt stückweise glatt ( u ∈ PC1 [a, b]),
wenn sie stetig ist und überall C –differenzierbar mit Ausnahme von höchstens
endlich vielen Knickstellen. Dabei heißt x ∈ ]a, b[ Knickstelle, wenn links–
und rechtsseitige Ableitung existieren, aber voneinander verschieden sind. De-
finitionsgemäß gilt C1 [a, b] ⊂ PC1 [a, b]. Setzen wir u (x) = 0 an den Knick-
stellen, so entsteht eine PC–Funktion u mit
y
u(y) − u(x) = u (t) dt für x, y ∈ [a, b] ÜA .
x
Für PC1 –Funktionen bleibt so der Satz über partielle Integration richtig ÜA .
(c) Eine Funktion u : [a, b] → Ê

heißt abschnittsweis glatt, wenn sie höchs-
tens endlich viele Sprung– oder Knickstellen hat. Das soll heißen: Es gibt eine
Unterteilung a = x0 < . . . < xN = b des Intervalls [a, b], so dass die Ein-
schränkung von u auf ]xk−1 , xk [ jeweils zu einer C1 –Funktion uk auf [xk−1 , xk ]
fortgesetzt werden kann. Setzen wir u (x) = 0 an den Sprung– oder Knickstel-
len, so gilt u, u ∈ PC [a, b]. Die abschnittsweis glatten Funktionen bilden einen
Vektorraum, der mit u und v auch u · v enthält ÜA .
(d) Für eine stückweise stetige Funktion u : [−π, π] → Ê
bezeichnen wir die
2π–periodische Fortsetzung mit uper : Ê Ê
→ . Neben den periodisch fortge-
setzten Sprungstellen von u hat uper zusätzlich die Sprungstellen (2k +1)π, falls
u(−π+) = u(π−).
y
Alsdann definieren wir die periodi- 6
sche Standardfortsetzung von u
.
u
durch

.(x) :=
u 1
2
uper (x+) + uper (x−) .
Wir erhalten so eine 2π–periodische -x

Funktion u. : → Ê Ê
, wie nebenste- −3π −π π 3π
hend skizziert.
In Sprungstellen von uper ist die periodische Standardfortsetzung das Sprung-
mittel von uper , an allen anderen Stellen stimmt u. mit uper überein.
Die für reellwertige Funktionen eingeführten Begriffe lassen sich unmittelbar auf
komplexwertige Funktionen übertragen.
2.4 Punktweise und gleichmäßige Konvergenz der Fourierreihe

Satz von Dirichlet. Für jede auf [−π, π] abschnittsweis glatte Funktion u
konvergieren die zugehörigen Fourierpolynome sn für n → ∞ gegen die peri-
odische Standardfortsetzung u. in folgendem Sinn:
.(x) punktweise für jedes x ∈
(a) sn (x) → u Ê,
.(x) gleichmäßig auf jedem kompakten Intervall ohne Sprungstel-
(b) sn (x) → u
..
len von u
Wir notieren die für die Separationsansätze wichtigste Folgerung:
Gleichmäßige Konvergenz für periodische PC1 –Funktionen

Für jede stückweise glatte Funktion u mit u(π) = u(−π) gilt
1
∞
u(x) = 2 a0 + (ak cos kx + bk sin kx)
k=1
gleichmäßig auf [−π, π] ; dabei sind die ak , bk die Fourierkoeffizienten von u.

2 Fourierreihen 141
Bemerkungen.
(i) Dirichlet bewies 1837 als erster die 1811 von Fourier ausgesprochene Ver-
mutung über die Entwickelbarkeit beliebiger“ Funktionen in trigonometrische
”
Reihen. Dieser Beweis war ein bedeutender Beitrag zum Prozeß der zunehmen-
den Schärfung analytischer Grundbegriffe wie Konvergenz, Reihe, Funktion, In-
tegral im 19. Jahrhundert.
(ii) Die an die zu entwickelnde Funktion u gestellte Bedingung der abschnitts-
weisen Glattheit ist leicht verifizierbar und erfaßt die meisten in den Anwen-
dungen auftretenden Fälle. Die Glattheitsbedingung an u läßt sich abschwächen;
schon Dirichlet verwendete eine schwächere Voraussetzung. Stetigkeit von u
allein reicht jedoch nicht für die punktweise Konvergenz der Fourierreihe, wie
raffinierte Beispiele zeigen, siehe Hardy–Rogosinski [40], Zygmund [46].
(iii) Gibbssches Phänomen. In der Nähe einer Sprungstelle von u . kann die
Folge sn nicht gleichmäßig konvergieren. Tatsächlich beobachten wir dort eine
verstärkte Oszillation der Fourierpolynome wie in der Figur, die die Fourierpo-
lynome s5 und s14 der Sägezahnfunktion u(x) = x für |x| ≤ π zeigt.
6 6
s5 s14
−π −π
- -
π π
Allgemein läßt sich folgendes zeigen (Courant–Hilbert [2], Kap.2, §10) : Ist x
eine Sprungstelle von u., so gilt für das x nächstgelegene Maximum Mn und das
x nächstgelegene Minimum mn des Fourier–Polynoms sn
2
π sin t
.(x+) − u
lim (Mn − mn ) = δ | u .(x−) | mit δ = π t dt ≈ 1.18 .
n→∞
0
2.5 Beweis des Satzes von Dirichlet

(a) Integraldarstellung der Fourierpolynome. Nach 2.2 gilt

n π
sn (x) = ck eikx mit ck = 1
2π
e−ikt u(t) dt , also
k=−n −π

n π π
n
sn (x) = 1
2π
eik(x−t) u(t) dt = 1
2π
u(t) eik(x−t) dt
k=−n −π −π k=−n
π π
= Dn (x − t)u(t) dt = Dn (x − t) .
u(t) dt
−π −π
mit dem Dirichlet–Kern

⎧ 1
⎪
⎪ falls eis = 1,
⎨ 2π (2n + 1) ,
1 iks
n
Dn (s) = e =
2π ⎪
⎪
1
1 sin(n + 2 )s
k=−n ⎩ sonst.
2π sin 12 s

n
2n
Nachweis als ÜA : Wenden Sie auf eiks = e−ins (eis )k für eis = 1 die
k=−n k=0
−is/2
geometrische Summenformel an und erweitern Sie mit e .
(b) Eigenschaften des Dirichlet–
Kerns. Dn ist stetig, gerade und 6
2π–periodisch. Weiter gilt Dn (s)
π
n π
Dn = 1
2π
eiks ds = 1
−π k=−n−π
und daher wegen Dn (s) = Dn (−s)

π 0 1
(1) Dn = Dn = 2
.
0 −π
(c) Umformung der Fourierpolynome. -

Aus der Darstellung (a) erhalten wir s
wegen der 2π–Periodizität des Inte-
granden

x+π x
x+π
sn (x) = .(t) dt =
Dn (x − t) u .(t) dt +
Dn (x − t) u .(t) dt .
Dn (x − t) u
x−π x−π x
Substitution s = x − t im ersten Integral bzw. s = t − x im zweiten ergibt

gemäß 2.3 (a) unter Berücksichtigung von Dn (−s) = Dn (s)
π π
(2) sn (x) = .(x − s) + u
Dn (s) ( u .(x + s) ) ds = .(x + s) ds .
Dn (s) u
0 −π
2 Fourierreihen 143
.(x). Sei S die Menge der Sprung– oder Knickstellen

(d) Konvergenz sn (x) → u
. und
von u

M := 1 + sup u (t) t ∈ [−π, π] \ S .
Wir betrachten eine feste Stelle x ∈ Ê

und bezeichnen mit d(x) ihren Abstand
zum nächstgelegenen, von x verschiedenen Punkt von S. (d(x) := 1, falls S = ∅.)
Wegen u .(x) = 12 (u
.(x+) + u
.(x−)) folgt aus (1), (2)
π
.(x) =
sn (x) − u .(x + s) − u
Dn (s) ( u .(x) ) ds
−π
(3) π π
= .(x − s) − u
Dn (s) ( u .(x−) ) ds + .(x + s) − u
Dn (s) ( u .(x+) ) ds .
0 0
Es genügt, das zweite Integral zu untersuchen. Wir definieren f durch
.(x + s) − u
f (s) := u .(x+) für s > 0 , f (0) := 0 .
f ist C1 –differenzierbar in [0, d(x)[ und abschnittsweis glatt ausserhalb dieses
s
Intervalls. Nach 2.3 (b) folgt | f (s) | = . (x + t) dt ≤ M s für 0 ≤ s < d(x) ,
u
0
also
M s MC
| Dn (s) f (s) | ≤ · ≤ für 0 ≤ s < d(x) ,
2π sin 12 s 2π
hierbei sind M und C Konstanten mit |f (s)| ≤ M s für 0 ≤ s < d(x) sowie
|s/ sin( 12 s)| ≤ C für 0 < s ≤ π.
1
Sei jetzt ε > 0 vorgegeben. Wir wählen = (ε, x) := min 2
d(x), ε/4M C .
Dann erhalten wir für das zweite Integral in (3)
π π π
(4) Dn f ≤ Dn f + Dn f ≤ ε + Dn f .
0 0
4
π
Zur Untersuchung von Dn f setzen wir

f (s)
g(s) := .
sin 12 s
Nach der Abschätzung oben gilt | g(s) | ≤ M C für 0 < s < d(x), also ist g
beschränkt: | g(s) | ≤ K für 0 < s ≤ π. Sind s1 < · · · < sm−1 die Sprung–
oder Knickstellen von u . in [ , π] und setzen wir s0 := , sm := π, so ergibt
partielle Integration
π π
m sk
2π f (s) Dn (s) ds = g(s) sin(n + 12 ) s ds = g(s) sin(n + 12 ) s ds
k=1 sk−1
1 m
π
g(s) cos(n + 12 ) s sk
s
= 1
− + g (s) cos(n + 12 ) s ds .
n+ 2 k=1
k−1

Sei N die Gesamtzahl der Sprung– oder Knickstellen von u . in [−π, π], ferner
M := 1 + sup {| g (s) | | s ∈ [ , π] \ S}. Damit erhalten wir
π
(5) Dn f ≤ 1
(2mK + πM ) ≤ 1
(2N K + πM ) =: 1
C .
n+1 n n

π
Für n > 4C /ε gilt also Dn f < ε4 .
0
Die Abschätzung für das erste Integral in (3) verläuft analog.
(e) Gleichmäßige Konvergenz . Die Zahl hängt definitionsgemäß von ε und x
ab. Ist aber [a, b] ein kompaktes Intervall ohne Sprungstellen von u ., also mit
positivem Abstand δ zu S, so gilt d(x) ≥ δ für alle x ∈ [a, b]. Wählen wir zu
gegebenem ε > 0 jetzt = (ε) := min 21 δ, ε/4M C , so gilt die Abschätzung
(4) für alle x ∈ [a, b], und die Konstanten M , C in (5) hängen nicht von x
ab. 2
2.6 Aufgaben
(a) Bestimmen Sie für folgende Funktionen u die Fourierreihe. Diskutieren Sie
deren Konvergenzverhalten, und skizzieren Sie die ersten Fourierpolynome.
(
1 für 0 ≤ x ≤ π ,
(i) u(x) =
−1 für − π ≤ x < 0 .
. beschreibt eine Sägezahnfunktion, wie sie bei
(ii) u(x) = x für | x | ≤ π. (u
Kippschwingungen auftritt, vgl. die Figur in 2.4.)
(iii) u(x) = | sin x| für |x| ≤ π .
(b) Für u ∈ C2 [−π, π] seien an , bn die Fourierkoeffizienten von u und

π π
an := 1
π
u (x) cos nx dx , bn := 1
π
u (x) sin nx dx
−π −π
die Fourierkoeffizienten von u . Zeigen Sie mit partieller Integration, dass
1
an = − an , falls u (−π) = u (π) ,
n2
1
bn = − bn , falls u(−π) = u(π) .
n2
(c) Entwickeln Sie 1

4
x2 in eine Fourierreihe und folgern Sie die Eulerschen
Formeln

∞
1 π2
∞
1 π2
= , (−1)n−1 = .
n2 6 n2 12
n=1 n=1
2 Fourierreihen 145
2.7 Das Abklingverhalten der Fourierkoeffizienten

π
Satz. (a) Für die Fourierkoeffizienten ck = 1
2π
u(t) e−ikt dt einer stückweise
−π
stetigen Funktion u auf [−π, π] gilt

∞
| ck |2 < ∞ , lim ck = 0 .
k=−∞ | k |→∞
(b) Für u ∈ PC1 [−π, π] mit u(π) = u(−π) gilt

∞
∞
|k ck |2 < ∞ , | ck | < ∞ , lim k ck = 0 .
k=−∞ k=−∞ | k |→∞
(c) Ist u Cr –differenzierbar, u(r) ∈ PC1 [−π, π] und u(m) (π) = u(m) (−π) für
m = 0, . . . , r, so gilt

∞ r+1 2
∞
k ck < ∞ , | kr ck | < ∞ .
k=−∞ k=−∞
(d) Die reellen Fourierkoeffizienten ak = ck + c−k , bk = i(ck − c−k ) zeigen

dasselbe Abklingverhalten.
Wir halten fest: Je glatter eine periodische Funktion ist, desto schneller fallen
ihre Fourierkoeffizienten ab.
Beweis.
(a) Wir stellen zunächst fest, dass mit den Bezeichnungen 2.3 (e)
.(x) für x ∈ [−π, π]}

V := {u ∈ PC[−π, π] | u(x) = u
1
π
ein –Vektorraum ist, auf dem u , v := 2π
u v ein Skalarprodukt liefert,
−π
Letzteres wegen der Festlegung der Funktionswerte an den Sprungstellen ÜA .
Durch vk (x) = eikx (k ∈ ) ist ein Orthonormalsystem in V gegeben mit
ck = vk , u . Nach § 9 : 4.3 oder Bd.1 § 19 : 2.5 ergibt sich für beliebige m, n ∈
die Besselsche Ungleichung

m
m
1
π
| ck |2 = | vk , u |2 ≤ u2 = 2π | u |2 < ∞ .
k=−n k=−n −π
(b) Für PC1 –Funktionen ist nach 2.3 (b) partielle Integration erlaubt. Es folgt
π π π
1 u(t) e−ikt 1 ck
ck = 2π u(t) e−ikt dt = −2ikπ + 2πik u (t) e−ikt dt = ik ,
−π −π −π
wobei ck die Fourierkoeffizienten von u ∈ PC [−π, π] sind. Dabei wurde aus-
genützt, dass e−ikπ | ck | < ∞,
ikπ 2
=e und u(π) = u(−π). Nach (a) gilt
also konvergiert | ck | wegen

| ck | ≤ | ck | +
2
| ck | = 1
|k|
1
2
1
k2
nach dem Majorantenkriterium.

(c) ergibt sich durch mehrfache Anwendung von (b) oder mehrfache partielle
Integration ÜA .
(d) Nach 2.1 (b) gilt ak = ck + c−k , bk = i (ck − c−k ), also
| ak |, | bk | ≤ | ck | + | c−k |, | ak |2 , | bk |2 ≤ 2 | ck |2 + 2 | c−k |2 . 2
2.8 Gleichmäßige Entwicklung in Sinus– und Kosinusreihen

(a) Jede PC1 –Funktion u auf [0, L] mit u(0) = u(L) = 0 läßt sich in eine
gleichmäßig konvergente Sinusreihe entwickeln:

∞ L
πkx 2 πkt
u(x) = bk sin mit bk = u(t) sin dt .
L L L
k=1
0

∞
Dabei gilt | bk | < ∞, darüberhinaus
k=1

∞
k | bk | < ∞ , falls zusätzlich u ∈ C2 [0, L] ,
k=1
∞
k2 | bk | < ∞ , falls zusätzlich u ∈ C3 [0, L] und u (0) = u (L) = 0.
k=1
(b) Jede PC1 –Funktion u auf [0, L] besitzt eine gleichmäßig konvergente Ent-
wicklung in eine Kosinusreihe

∞ L
1 πkx 2 πkt
u(x) = a0 + ak cos mit ak = u(t) cos dt .
2 L L L
k=1

∞ 0
Es gilt | ak | < ∞, darüberhinaus

k=0

∞
k | ak | < ∞ , falls u ∈ C2 [0, L] und u (0) = u (L) = 0 ,
k=1
∞
k2 | ak | < ∞ , falls u zusätzlich C3 –differenzierbar ist.
k=1
Nach 2.1 dürfen wir L = π annehmen. Denn mit v(t) := u(Lt/π) gilt

∞
∞
u(x) = bk sin kπ
L
x für x ∈ [0, L] ⇐⇒ v(t) = bk sin kt für t ∈ [0, π]
k=1 k=1
und
2 Fourierreihen 147
2
L kπ 2
L π kπt 2
π
bk = L
u(t) sin L
t dt = L
v( L t) sin L
dt = π
v(s) sin ks ds .
0 0 0
Für u ∈ PC1 [0, π] definieren wir die ungerade Fortsetzung f und die gerade
Fortsetzung g auf [−π, π] durch
( (
u(x) für x ≥ 0 u(x) für x ≥ 0
f (x) := , g(x) := .
−u(−x) für x < 0 u(−x) für x < 0
Hilfssatz. Es gilt:
f ∈ PC1 [−π, π], f (π) = f (−π) ⇐⇒ u(0) = u(π) = 0.
f ∈ C1 [−π, π], f (π) = f (−π) ⇐⇒ u ∈ C1 [0, π], u(0) = u(π) = 0.
f ∈ C2 [−π, π], f (π) = f (−π), f (π) = f (−π) ⇐⇒
u ∈ C2 [0, π], u(0) = u(π) = u (0) = 0.
f ∈ C3 [−π, π], f (m) (π) = f (m) (−π) für m = 0, 1, 2 ⇐⇒
u ∈ C3 [0, π] , u(0) = u (0) = u(π) = u (π) = 0.
g ∈ PC1 [−π, π], g(π) = g(−π) = 0.
g ∈ C1 [−π, π] ⇐⇒ u (0) = 0.
g ∈ C2 [−π, π], g(π) = g(−π), g (π) = g (−π) ⇐⇒
u ∈ C2 [0, π], u (0) = u (π) = 0.
g ∈ C2 [−π, π], g ∈ PC1 [−π, π], g (m) (π) = g (m) (−π) für m = 0, 1, 2 ⇐⇒
u ∈ C3 [0, π], u (0) = u (π) = 0.
Beweis als ÜA . Beachten Sie, dass f , f , g gerade und f , g , g ungerade
Funktionen sind.
Beweis von 2.8.

Die Fortsetzungen f, g von u erfüllen die Voraussetzungen für die gleichmäßige
Entwickelbarkeit nach 2.4. Für die Fourierkoeffizienten von f gilt
1
π 2
π
ak = 0, bk = π
f (t) sin kt dt = π
u(t) sin kt dt ,
−π 0
da f (t) cos kt ungerade und f (t) sin kt gerade ist.

Entsprechend gilt für die Fourierkoeffizienten von g
2
π
ak = π
u(t) cos kt dt , bk = 0 .
0
Für die übrigen Behauptungen beachten wir 2.7 und den Hilfssatz ÜA . 2
2.9 Der Weierstraßsche Approximationssatz

Jede auf einem kompakten Intervall [a, b] stetige Funktion f ist dort gleich-
mäßiger Limes einer Folge von Polynomen.
Beweis.

(a) Es genügt, das Intervall − π2 , π2 zugrundezulegen. Der allgemeine Fall läßt
sich durch Umskalierung auf diesen zurückführen.

(b) Sei ε > 0 gegeben. Da f auf − π2 , π2 gleichmäßig stetig ist, gibt es eine
Polygonfunktion g, d.h. eine Funktion,
deren Graph ein Streckenzug ist, so dass
| f (x) − g(x) | < ε für alle x ∈ − π2 , π2 .
(c) Diese setzen wir zu einer Polygonfunktion G auf [−π, π] mit G(π) =
G(−π) fort. Da G stückweise glatt ist, gibt es nach 2.4 ein Fourierpolynom
S mit
| S(x) − G(x) | < ε für alle x ∈ [−π, π] .

(d) S ist analytisch auf Ê
, also durch eine auf − π2 , π2 gleichmäßig konver-
gente Taylorreihe um den Nullpunkt entwickelbar. Wir wählen eine Teilsumme
p dieser Potenzreihe mit | p(x) − S(x) | < ε für | x | < π2 und haben so ein
Polynom p gewonnen mit
π π
| f (x) − p(x) | < 3ε für − ≤x≤ . 2
2 2
3 Die schwingende Saite II

3.1 Entwicklungs- und Eindeutigkeitssatz für die schwingende Saite
Jede Saitenschwingung entsteht durch Superposition von harmonischen Schwin-
gungen. Der zeitliche Ablauf ist durch die Auslenkung und deren Geschwindig-
keit zu einem Zeitpunkt (den wir t = 0 wählen) eindeutig bestimmt:
Satz. Jede Lösung u der Wellengleichung
∂2u 2
2 ∂ u
= c
∂t2 ∂x2
mit u(0, t) = u(L, t) = 0 besitzt in [0, L] × Ê eine Reihendarstellung

∞
πkc πkc
πk
(∗) u(x, t) = ak cos t + bk sin t sin x,
L L L
k=1
∂u
vgl. 1.3. Die Koeffizienten sind durch u(x, 0), ∂t
(x, 0) eindeutig bestimmt:
L L
2 πk 2 ∂u πk
ak = u(x, 0) sin x dx , bk = (x, 0) sin x dx .
L L πkc ∂t L
0 0
3 Die schwingende Saite II 149

Die Reihe (∗) hat die konvergente Majorante (| ak | + | bk |), konvergiert also
absolut und gleichmäßig.
Beweis.
(a) Fourierentwicklung bei festem t. Nach der Problemstellung 1.1 ist die Funk-
tion ut : x → u(x, t) für jedes t ∈ Ê
C2 –differenzierbar in [0, L], und es gilt
ut (0) = ut (L) = 0. Aus dem Entwicklungssatz 2.8 (a) ergibt sich

∞
πk 2 L πk
u(x, t) = ut (x) = ck (t) sin x mit ck (t) = u(x, t) sin L
x dx
L L0
k=1
gleichmäßig bezüglich x ∈ [0, L] bei festem t.

(b) Die Gestalt der Fourierkoeffizienten ck (t). Die Wellengleichung liefert unter
Verwendung des Satzes über Parameterintegrale (Bd. 1, § 23 : 2.3)
L L
2 ∂2u πkx 2c2 ∂2u πkx
c̈k (t) = 2
(x, t) sin dx = (x, t) sin dx .
L ∂t L L ∂x2 L
0 0
Durch zweimalige partielle Integration folgt ÜA
2 L 2
2 πkc πkx πkc
c̈k (t) = − u(x, t) sin dx = − ck (t) ,
L L L L
0
d.h. ck erfüllt die Schwingungsgleichung c̈k + (πkc/L)2 ck = 0 . Es folgt

πkc πkc
ck (t) = ak cos t + bk sin t
L L
mit geeigneten ak , bk .
(c) Bestimmung der Koeffizienten ak , bk . Wir setzen
∂u
f (x) := u(x, 0) und g(x) := (x, 0) .
∂t
Dann gilt
L L
2 πkx 2 πkx
(1) ak = ck (0) = u(x, 0) sin dx = f (x) sin dx .
L L L L
0 0
Nach dem Satz über Parameterintegrale ergibt sich weiter

L L
πkc 2 ∂u πkx 2 πkx
(2) bk = ċk (0) = (x, 0) sin dx = g(x) sin dx .
L L ∂t L L L
0 0
(d) Gleichmäßige Konvergenz in [0, L] × Ê.

Nach Voraussetzung gilt f ∈ C [0, L], f (0) = f (L) = 0 . Daher konvergiert die
2

∞
Reihe | ak | nach 2.8 (a).
k=1

∞
Wegen g ∈ C[0, L] und (2) konvergiert die Reihe | k bk |2 nach 2.7 (d). Nun
k=1
ist

| bk | = | k b k | 1
k
≤ 1
2
| k bk | 2 + 1
k2
,

∞
also konvergiert die Reihe | bk |. Nach dem Majorantenkriterium folgt die
Ê.
k=1
gleichmäßige Konvergenz der Reihe (∗) in [0, L] × 2
3.2 Lösung des Anfangs–Randwertproblems mit der Separationsme-

thode
Nach dem Entwicklungssatz 3.1 hat jede Lösung der Wellengleichung mit der
Einspannbedingung notwendig die Gestalt (∗). Wir zeigen jetzt die Existenz
einer Lösung des Anfangs–Randwertproblems von 1.1
∂2u 2
2 ∂ u ∂u
= c , u(0, t) = u(L, t) = 0 , u(x, 0) = f (x) , (x, 0) = g(x).
∂t2 ∂x2 ∂t
Dazu kehren wir die Argumentation in 3.1 um und machen daraus ein konstruk-
tives Lösungsverfahren auf der Basis der Separationsmethode.
Existenzsatz. Gegeben seien Anfangsdaten f ∈ C3 [0, L], g ∈ C2 [0, L] mit

f (0) = f (L) = f (0) = f (L) = 0 , g(0) = g(L) = 0 .
Setzen wir
L L
2 πkx 2 πkx
ak = f (x) sin dx , bk = g(x) sin dx ,
L L πkc L
0 0
so ist durch
∞
πkt πkt πkx
(∗) u(x, t) = ak cos + bk sin sin
L L L
k=1
eine Lösung u ∈ C2 ([0, L] × Ê) des Anfangs–Randwertproblems gegeben.

Bemerkung. Die Differenzierbarkeitsbedingungen an die Anfangsdaten sind
um eine Stufe höher als natürlicherweise zu erwarten ist. Ein weiterer Existenz-
beweis unter optimalen Differenzierbarkeitsbedingungen an die Anfangsdaten
wird in 3.4 (b) gegeben.
Beweis.

∞
∞
Nach 2.8 (a) konvergieren die Reihen k 2 | ak | , k2 | bk | . Die erste ist eine
k=1 k=1

∞
∞
∞
Majorante für | ak | und k | ak | , die zweite eine Majorante für | bk |
k=1 k=1 k=1

∞
und k | bk |. Daher gilt:
k=1

(a) Die Reihe (∗) hat die Majorante (| ak | + | bk |) , konvergiert also gleich-
Ê
mäßig für (x, t) ∈ 2 und stellt eine dort stetige Funktion u dar.
(b) Die gliedweise nach t differenzierte Reihe ist gleichmäßig konvergent, denn

∞
sie hat die Majorante const · k (| ak | + | bk |). Nach dem Satz über gliedweise
k=1
Differentiation (Bd. 1, § 12 : 3.6) gilt somit

∞
∂u πkc πct πct πx
(x, t) = −ak sin + bk cos sin
∂t L L L L
k=1
gleichmäßig für (x, t) ∈ Ê , und

2 ∂u
∂t
ist stetig als gleichmäßiger Limes stetiger
Funktionen.
(c) Die letzte Reihe ist nochmals gliedweise nach t differenzierbar, denn die

∞
abgeleitete Reihe hat die Majorante const · k2 (| ak | + | bk |). Entsprechendes
k=1
gilt für die partiellen Ableitungen nach x . Schreiben wir (∗) in der Form

∞
u(x, t) = uk (x, t) ,
k=1
so folgt u ∈ C2 ( Ê ) und
2

∞
∂2u 2
2 ∂ u ∂ 2 uk 2
2 ∂ uk
− c = − c = 0,
∂t2 ∂x2 ∂t2 ∂x2
k=1
da die uk nach 1.2 Lösungen der Wellengleichung sind.

(d) Aus (∗) folgt unmittelbar u(0, t) = u(L, t) = 0.
Ferner gilt nach 2.8 (a)

∞
πkx ∂u πkc ∞
πkx
u(x, 0) = ak sin = f (x), (x, 0) = bk sin = g(x)
L ∂t L L
k=1 k=1
wegen
L L
2 πkx 2 πkx
ak = f (x) sin dx , bk = g(x) sin dx . 2
L L πkc L
0 0
3.3 Aufgabe. Geben Sie die Lösung des oben gestellten Saitenproblems an
für den Fall L = c = 1, f (x) = x4 − 2x3 + x, g = 0 an. Welche Näherung
ergibt sich für u(x, t), wenn die Reihe nach dem Glied abgebrochen wird, für
das erstmalig | an /a1 | < 0.5 · 10−3 wird?
3.4 Die Lösungsdarstellung von d’Alembert

(a) Die Reihendarstellung für die Lösung des Anfangs–Randwertproblems der
schwingenden Saite läßt sich in einen geschlossenen Ausdruck überführen: Hier-
zu setzen wir die gegebenen Anfangswerte f und g ungerade auf [−L, L] und
anschließend 2L–periodisch auf Ê
fort. Die dabei entstehenden Funktionen be-
zeichnen wir mit F und G (machen Sie eine Skizze).
Satz. Unter den Voraussetzungen des Existenzsatzes 3.2 hat die Lösung die
Darstellung
1
1
x+ct
u(x, t) = 2 F (x + ct) + F (x − ct) + 2c G(s) ds
x−ct
für x ∈ [0, L], t ∈ Ê.

Bemerkungen. (i) Die Lösung hat die Form u(x, t) = ϕ(x + ct) + ψ(x − ct)
und ist damit Überlagerung einer ein– und einer auslaufenden Welle ÜA .
(ii) D’Alembert gewann diese Formel 1747 aus der Konstanz von ∂u ∂t
± c ∂u
∂x
längs jeder Geraden mit der Gleichung x ± ct = const, siehe (§ 7 : 1.6 und
§ 17 : 3.1). Das allgemeine Verfahren, Lösungen von Differentialgleichungen auf
diese Art zu gewinnen, ist die in § 7 behandeln Charakteristikenmethode.
Beweis
Nach 3.2 besteht für die Lösung die Darstellung
∞

πkt πkt πkx
(∗) u(x, t) = ak cos + bk sin sin
L L L
k=1
Wir verwenden die aus den Additionstheoremen folgenden Beziehungen

cos α sin β = 1
2
sin(β + α) + sin(β − α) ,

sin α sin β = 1
2
cos(β − α) − cos(β + α) ,
und erhalten nach dem Umordnungssatz für absolut konvergente Reihen

1
∞
πk πk
u(x, t) = ak sin ((x + ct) + sin ((x − ct)
2 L L
(1) k=1

πk πk
− bk cos (x + ct) − cos (x − ct) .
L L
Nach 2.8 (a) und den Formeln für die ak , bk in 3.2 gilt auf [0, L]

∞
πkx
∞
πkx
(2) F (x) = ak sin , G(x) = bk sin ,
L L
k=1 k=1

∞
wobei die Reihe k | bk | konvergiert. Da F, G nach Definition ungerade und
Ê. Daher ergibt gliedweise Integration
k=1
2L–periodisch sind, gilt (2) auf ganz

x+ct
∞ πk πk

G(s) ds = c bk cos (x − ct) − cos (x + ct) .
x−ct
L L
k=1
Dies liefert zusammen mit (1), (2) die Behauptung des Satzes. 2
(b) Die d’Alembertsche Formel ermöglicht einen Existenzbeweis unter optima-

len Differenzierbarkeitsbedingungen an die Anfangsdaten:
Satz. Für f ∈ C2 [0, L], g ∈ C1 [0, L] mit f (0) = f (L) = f (0) = f (L) = 0,
g(0) = g(L) = 0 liefert die Formel

x+ct
1 1
u(x, t) = F (x + ct) + F (x − ct) + G(s) ds
2 2c
x−ct
Ê
eine Lösung u ∈ C2 ([0, L] × ) des Anfangs–Randwertproblems 3.2. Nach 3.1
besitzt diese eine eindeutig bestimmte Reihenentwicklung (∗).
Denn nach dem Hilfssatz in 2.8 ist die rechte Seite C2 –differenzierbar auf 2 . Ê
Dass die Wellengleichung und die Randbedingungen erfüllt sind, ist leicht nach-
zurechnen ÜA .
3.5 Energieerhaltung und Eindeutigkeit der Lösung

Unter den im letzten Satz gemachten Voraussetzungen ist die Energie der
schwingenden Saite, nach § 1 : 2.2 bis auf einen Faktor gegeben durch
L 2 ∂u 2
1 ∂u 2
E(t) = 2
+c (x, t) dx ,
∂t ∂x
0
zeitlich konstant.
Denn wegen u ∈ C2 ([0, L] × Ê) gilt nach dem Satz über Parameterintegrale
L
∂u ∂ 2 u ∂u ∂ 2 u
Ė(t) = 2
+ c2 dx
∂t ∂t ∂x ∂t∂x
0
L
2 ∂u ∂ 2 u ∂u ∂ 2 u
= c 2
+ dx
∂t ∂x ∂x ∂x∂t
0
L
∂ ∂u ∂u ∂u ∂u x=L
= c2
dx = c2 (x, t) (x, t) = 0,
∂x ∂t ∂x ∂t ∂x x=0
0
Letzteres ergibt sich durch Differentiation von u(L, t) = u(0, t) = 0 nach t.
Aus der Energieerhaltung ergibt sich ebenfalls die Eindeutigkeit der Lösung für
das Anfangs–Randwertproblem 3.2:
Sind nämlich u1 , u2 Lösungen, so gilt für die Differenz u := u1 − u2
∂2u 2
2 ∂ u ∂u
= c , u(0, t) = u(L, t) = 0 , u(x, 0) = (x, 0) = 0 .
∂t2 ∂x2 ∂t
Wegen der Wellengleichung folgt ∂u
∂x
(x, 0) = 0, also verschwindet die Energie
von u zur Zeit t = 0 und somit für alle Zeiten t nach dem Erhaltungssatz.
E(t) = 0 bedeutet
∂u ∂u
(x, t) = (x, t) = 0 für 0 ≤ x ≤ L ,
∂x ∂t
somit Konstanz von u. Aus den Randbedingungen folgt nun u1 − u2 = 0.
3.6 Aufgabe zur modellhaften Veranschaulichung der Wellenausbreitung.

Wählen Sie in der d’Alembertschen Darstellung
3.4 als Anfangsdaten
g = 0 und
für f die charakteristische Funktion von 12 L − ε , 12 L + ε . (Aus dieser kann
durch Abrunden der Ecken eine C2 –Funktion gemacht werden, für welche aber
die d’Alembertsche Formel den gleichen Bewegungsablauf liefert.) Skizzieren Sie
die Momentaufnahmen des Saitenprofils x → u(x, t) für die Zeiten t0 = 0, t1 =
L/4c, t2 kurz vor L/2c, t3 kurz nach L/2c, t4 = 3L/4c, t5 = L/c. Skizzieren
Sie die Bahnen der Schwerpunkte der beiden entstehenden Wellenpakete in der
(x, t)–Ebene.
3.7 Die schwingende Saite unter äußeren Kräften

Hier haben wir es mit dem AWP für die inhomogene Wellengleichung
∂2u ∂2u
(a) 2
− c2 = F in 0 < x < L, t > 0 ,
∂t ∂x2
(b) u(0, t) = u(L, t) = 0
Ê
zu tun, wobei die Kraftdichte F (x, t) in [0, L] × + stetig differenzierbar sein
soll mit F (0, t) = F (L, t) = 0 für t ≥ 0. Wir dürfen uns darauf beschränken,
nach Lösungen zu suchen, welche die homogenen Randbedingungen
∂u
(c) u(x, 0) = (x, 0) = 0
∂t
erfüllen. Denn haben wir eine solche gefunden, und ist v eine Lösung der homo-
genen Wellengleichung mit v(x, 0) = f (x), ∂v∂t
(x, 0) = g(x), so ist u + v eine
Lösung von (a), (b) mit diesen Anfangswerten zur Zeit 0.
Die inhomogene Wellengleichung erlaubt die Behandlung von Streichvorgängen
bei Saiteninstrumenten. Z.B. erzeugt ein mit Kolophonium behafteter Bogen
eine im Zeitverlauf sägezahnartige Krafteinwirkung.
Nicht unter den Aufgabentyp (a) fällt das Problem der schweren Saite“, vgl.
”
die folgende Aufgabe (b).
Um die Separationsmethode in modifizierter Form anwenden zu können, haben
wir F zunächst gemäß 2.8 in eine Sinusreihe

∞ L
πkx 2 πkx
F (x, t) = Fk (t) sin mit Fk (t) = F (x, t) sin dx
L L L
k=1
0
zu entwickeln. Dann suchen wir nichtverschwindende Produktlösungen uk (x, t)

= vk (x) wk (t) der inhomogenen Wellengleichungen
∂2u ∂2u πkx

2
(x, t) − c2 (x, t) = Fk (t) sin (k = 1, 2, . . .),
∂t ∂x2 L
mit vk (0) = vk (L) = 0. Analog zu 1.2 erhalten wir ÜA
πkx
vk (x) = ck sin mit ck = 0
L
und wegen (c)
2
πkc
ẅk (t) − wk = Fk (t) , wk (0) = ẇk (0) = 0 .
L
Variation der Konstanten ergibt für k = 1, 2, . . .
t
L πkc
wk (t) = Fk (s) sin (t − s) ds .
πkc L
0
Ähnlich wie in 3.1 kann gezeigt werden, dass sich jede Lösung u als Superposition

∞
πkx
(∗) uk (x, t) = wk (t) sin
L
k=1
darstellen läßt. Wir überlassen das den Lesern als Aufgabe. Verlangen wir von
F eine Differenzierbarkeitsstufe mehr, so läßt sich wiederum zeigen, dass (∗)
eine Lösung der oben gestellten Aufgabe liefert.
Ähnlich wie in 3.4 können wir unter geeigneten Konvergenzvoraussetzungen für

die Reihe (∗) für u einen geschlossenen Ausdruck angeben:
1 t
x+c(t−s)
(∗∗) u(x, t) = F (y, s) dy ds für 0 ≤ x ≤ L , t ≥ 0 .
2c 0 x−c(t−s)
Dabei wurde die ungerade, 2L–periodische Fortsetzung von x → F (x, t) wie-

der mit F bezeichnet. Der Integrationsbereich in (∗∗) ist das charakteristische
”
Dreieck“ mit den Ecken (x−ct, 0), (x+ct, 0) und (x, t) (machen Sie eine Skizze).
Satz. Unter den oben genannten Voraussetzungen über F liefert die Formel
(∗∗) eine Lösung des Problems (a),(b),(c).
Beweis als Aufgabe: Verwenden Sie bei der Differentiation die Formel
t t
d ∂G
G(t, s) ds = G(t, t) + (t, s) ds ,
dt ∂t
0 0
die sich durch Anwendung der Kettenregel auf ϕ(ψ1 (t), ψ2 (t)) mit ϕ(u, v) :=
u
G(v, s) ds und ψ1 (t) = ψ2 (t) = t ergibt.
0
Aufgaben. (a) Berechnen Sie u( 14 , 1) für L = 1, F (x, t) = t sin2 (πx).

(b) Eine eingespannte Saite der Länge L im konstanten Schwerefeld der Erde
werde so unterstützt, dass sie in der x–Achse liegt. Zur Zeit t = 0 werde die
Unterstützung entfernt (u(x, 0) = ∂u∂t
(x, 0) = 0). Welche Art von Bewegung
führt die Saite aus?
Anleitung. Auf die konstante Schwerkraft pro Längeneinheit F (x, t) = − k
läßt sich die oben beschriebene Methode nicht anwenden, weil dort F (0, t) =
F (L, T ) = 0 vorausgesetzt wird. Helfen Sie sich so, dass sie zunächst die zeitu-
nabhängige Lösung v(x, t) = v(x) des Randwertproblems
∂2v ∂2v
2
− c2 = − k , v(0) = v(L) = 0
∂t ∂x2
bestimmen, und schreiben Sie die gesuchte Lösung in der Form u = v + w, wo
w aus der Formel (∗∗) gewonnen wird. Welches Glattheitsverhalten zeigt die so
gewonnene formale Lösung?
4 Wärmeleitung im Draht
4.1 Problemstellung
Ein wärmeleitfähiger Draht der Länge L, repräsentiert durch das Intervall [0, L]
der x–Achse, habe an der Stelle x zur Zeit t > 0 die Temperatur u(x, t). Dann
4 Wärmeleitung im Draht 157
folgt aus der Kontinuitätsgleichung für die Wärmemenge § 1 : 2.5, wenn wir die
physikalischen Konstanten durch Umskalierung der Zeit auf 1 setzen, die DG
∂u ∂2u
(a) (x, t) = (x, t) für 0 < x < L, t > 0 .
∂t ∂x2
Durch ein Wärmebad halten wir die Drahtenden zunächst auf gleicher konstan-
ter Temperatur. Wählen wir diese als Nullpunkt der Temperaturskala, so gilt
also
(b) u(0, t) = u(L, t) = 0 für t ≥ 0 .
Gegeben ist die Anfangstemperaturverteilung
(c) u(x, 0) = f (x) mit f ∈ PC1 [0, L], f (0) = f (L) = 0.
Gesucht ist die Zeitentwicklung für t ≥ 0.
Den allgemeinen Fall u(0, t) = α, u(L, t) = β behandeln wir in 4.8 (f).
Von den Lösungen u verlangen wir die Existenz von ∂u/∂t, ∂u/∂x und ∂ 2 u/∂x2
Ê Ê
in ]0, L[ × >0 sowie die Stetigkeit auf [0, L] × >0 . Anders als bei der schwin-
genden Saite folgt aus diesen schwächeren Voraussetzungen bereits die C∞ –
Differenzierbarkeit der Lösung für t > 0. Demgemäß gehen wir auch beweis-
technisch etwas anders vor.
In 4.5 und 4.6 werden weitere Randbedingungen betrachtet.
4.2 Produktlösungen und Superpositionsansatz

Der Produktansatz u(x, t) := v(x) w(t) mit nichtverschwindenden v ∈ C2 [0, L],
Ê
w ∈ C1 ( +) führt ganz ähnlich wie in 1.2 auf das Randwertproblem

(I) v (x) + λv(x) = 0 , v(0) = v(L) = 0 ,
und die gewöhnliche DG
(II) w (t) + λw(t) = 0 .
Wie in 1.2 ergibt sich λ = (πk/L)2 mit k ∈ , und durch Lösung der Diffe-
rentialgleichungen 4.1 (I), (II) erhalten wir:
Sämtliche Produktlösungen von 4.1 (a) und (b) sind Vielfache von
πk 2 πkx
uk (x, t) := e−( L ) t sin .
L
Für die gesuchte, die Anfangsbedingung (c) erfüllende Lösung machen wir den

∞
Ansatz u(x, t) = ak uk (x, t). Die Koeffizienten ak ergeben sich dann gemäß
k=1
2.8 (a) aus

∞
πkx
f (x) = u(x, 0) = ak sin .
k=1 L
4.3 Existenz einer Lösung

Satz. Für jede stückweise glatte Anfangsverteilung f der Temperatur mit f (0) =
f (L) = 0 besitzt das Wärmeleitungsproblem 4.1 (a),(b),(c) die Lösung

∞
πk )2 t πkx 2 L
(∗) u(x, t) = ak e−( L sin mit ak = f (x) sin πkx
L
dx .
L L0
k=1
In 4.7 zeigen wir, dass dies die einzige Lösung ist.
Bemerkung. Im Vergleich zur Wel-
lengleichung zeigt sich hier ein we-
sentlicher Unterschied: Bei einer nur 6
stückweise glatten Anfangsverteilung
erhalten wir für t > 0 eine C∞ – f
differenzierbare Temperaturverteilung,
wie der Beweis zeigt. Dagegen kann
u1
die Lösung der Wellengleichung nie-
mals glatter sein als die Anfangsda-
ten, wie sich aus der d’Alembertschen u2
Lösungsdarstellung ergibt. Die Figur
u3
•-
zeigt eine stückweise glatte Anfangs-
•
verteilung f und einige Temperatur- 0 L x
profile.
Beweis.
Die Anfangsverteilung f ∈ PC1 [0, L] besitzt nach 2.8 (a) die Reihendarstellung

∞
πkx 2
L πkx
f (x) = ak sin L mit ak = L f (x) sin L dx ,
k=1 0
∞
wobei die Reihe | ak | konvergiert. Die Folge (ak ) ist als Nullfolge beschränkt.
k=1
Für n = 0, 1, . . . und τ > 0 besteht die Ungleichung
πk n 2
L e−(πk/L) τ
≤ C
k2 mit einer Konstanten C = C(n, τ ) > 0 ,
( ÜA mit Bd. 1, § 3 : 2.3 (f)), woraus folgt
∞
2
∞
n
(∗∗) πk
L
| ak | e−(πk/L) τ
≤ const · 1
k2
< ∞.
k=1 k=1
Für τ > 0 setzen wir Kτ := {(x, t) | 0 ≤ x ≤ L , t ≥ τ }. Die Vereinigung aller
Kτ mit t > 0 ist H := {(x, t) | 0 ≤ x ≤ L , t > 0}. Durch

∞
πk )2 t
(∗) u(x, t) := ak e−( L sin πkx
L
k=1
ist eine auf H stetige Funktion gegeben, denn diese Reihe hat die Majorante

| ak |, konvergiert also gleichmäßig auf H.
Für n = 1 und n = 2 liefert (∗∗) auf Kτ = { t ≥ τ } Majoranten für die Reihen

∞ ∞

πk )2 t 2 πk )2 t
πk
L
ak e−( L cos πkx
L
, πk
L
ak e−( L sin πkx
L
.
k=1 k=1
Nach dem Satz über gliedweise Differentiation liefert die erste der beiden Rei-
hen ∂x u(x, t), die zweite sowohl ∂x ∂x u(x, t) als auch ∂t u(x, t). Daher ist die
Wärmeleitungsgleichung 4.1 (a) in jedem Bereich Kτ mit τ > 0 erfüllt, und
damit auch in H.
Ganz analog schließen wir, dass die Funktion u in H = {t > 0} beliebig oft
gliedweise differenzierbar ist, weil (∗∗) für beliebiges n und beliebiges τ > 0 auf
Kτ Majoranten liefert. 2
4.4 Aufgabe. Sei L = π und

x2 für 0 ≤ x ≤ 12 π
f (x) = .
(x − π)2 für 1
2
π ≤x≤π
Bestimmen Sie für die Darstellung (∗) die Partialsumme mit den ersten drei
nichtverschwindenden Gliedern und skizzieren Sie die so gewonnene Näherungs-
lösung für einige Werte von t > 0.
4.5 Wärmeleitung bei Neumannschen Randbedingungen

Das Wärmeleitungsproblem für einen Draht der Länge L bei wärmeisolierten
Drahtenden lautet: Zu einer gegebenen stetigen Funktion f auf [0, L] ist eine
Lösung u gesucht von
∂u ∂2u
(a) = für 0 < x < L , t > 0 ,
∂t ∂x2
∂u ∂u
(b) (0, t) = (L, t) = 0 für t ≥ 0 ,
∂x ∂x
(c) u(x, 0) = f (x) für 0 ≤ x ≤ L .
Von den Lösungen wird neben den Bedingungen 4.1 verlangt, dass x → u(x, t)
für festes t ≥ 0 zu C1 [0, L] gehört.
Produktansatz und Superposition führen hier auf die Lösungsdarstellung
1
∞
πk 2 πkx
(∗) u(x, t) = a0 + ak e−( L ) t cos mit
2 L
k=1
L
2 πkx
ak = f (x) cos dx (k = 0, 1, 2, . . .) .
L L
0
Für stückweise glatte Anfangstemperaturverteilungen f liefert die Reihe (∗) eine

für t > 0 beliebig oft differenzierbare Lösung des Randwertproblems (a),(b),(c).
Die Übertragung der Rechnung 4.2 und des Beweises 4.3 – diesmal mit dem Satz
2.8 (b) über Entwicklung in Kosinusreihen – sei dem Leser als Übung überlassen.
4.6 Wärmeleitung bei gemischten Randbedingungen

Die Separationsmethode läßt sich ohne große Schwierigkeit auf allgemeinere
Randbedingungen der Form
∂u ∂u
α (0, t) + β u(0, t) = 0 , γ (L, t) + δ u(L, t) = 0
∂x ∂x
mit α2 + β 2 > 0, γ 2 + δ 2 > 0 übertragen. Als Beispiel betrachten wir die
gemischten Randbedingungen
∂u
(b) u(0, t) = (L, t) = 0 für t ≥ 0 .
∂x
Produktansatz und Superposition von Produktlösungen lassen eine Lösungs-
darstellung

∞
2

π 1 π 1
(∗) u(x, t) = ak e−( L (k+ 2 )) t
sin k+ x
L 2
k=1
vermuten, wobei f (x) = u(x, 0) die Fourierreihe

∞
π 1
ak sin k+ x
L 2
k=0
besitzt. Um diese als Fourierreihe einer geeigneten Funktion F zu deuten, be-

achten wir, dass die Glieder gk der Reihe die Symmetrieeigenschaft gk (x) =
gk (2L − x) mit Symmetrieachse x = L haben. Setzen wir daher f durch
F (x) := f (2L − x) für L < x ≤ 2L zu einer Funktion F ∈ PC1 [0, 2L]
fort und entwickeln diese im Intervall [0, 2L] in eine Sinusreihe, so gilt wegen
F (2L) = F (0) = f (0) = 0

∞
π 1
F (x) = ak sin k+ x
L 2
k=1
mit
2L L
1 π 1 2 π 1
ak = F (x) sin k+ x dx = F (x) sin k+ x dx ,
L L 2 L L 2
0 0
da die restlichen Fourierkoeffizienten von F verschwinden ÜA . Mit diesen Mo-

difikationen übertragen sich die Aussagen und Beweise von 4.3 sinngemäß.
Für die Behandlung allgemeiner gemischter Randbedingungen verweisen wir auf
Miller–Michel [11] § 4.
4.7 Maximumprinzip und Eindeutigkeitssatz für die Wärmeleitungs-

gleichung
Seien Ω = {(x, t) | 0 < x < L, t > 0} und HT die abgeschlossene Halbebene
{(x, t) | t ≤ T } mit T > 0. Dann gilt für jede auf Ω stetige Lösung u der
Wärmeleitungsgleichung
min u ≤ u(x, t) ≤ max u t 6
HT ∩∂Ω HT ∩∂Ω
T
für alle (x, t) ∈ HT ∩ Ω.
Das Maximum bzw. Minimum von u HT ∩ Ω
auf der kompakten Menge HT ∩Ω wird
also auf dem Randstück HT ∩ ∂Ω von -
Ω angenommen. 0 L x
Beweis.
Wir zeigen zunächst für (x, t) ∈ Ω ∩ HT , dass
u(x, t) ≤ max{u(x, t) | (x, t) ∈ ∂Ω ∩ HT } .
Zum Beweis setzen wir für festes ε > 0 v(x, t) = u(x, t) + ε x2 und erhalten
∂2v
(∗) ∂v
∂t
(x, t) − ∂x2
(x, t) = − 2ε < 0 .
Das Maximum von v auf Ω ∩ HT werde an der Stelle (x0 , t0 ) angenommen.

Wir behaupten (x0 , t0 ) ∈ ∂Ω ∩ HT . Wäre dies nicht der Fall, also 0 < t0 ≤ T
und 0 < x0 < L, so wäre
∂2v
∂v
∂x
(x0 , t0 ) = 0, ∂x2
(x0 , t0 ) ≤ 0 sowie
∂v
∂t
(x0 , t0 ) = 0 , falls t0 < T bzw. ∂v
∂t
(x0 , t0 ) ≥ 0 , falls t0 = T.
In jedem Fall wäre

∂2 v
∂v
∂t
(x0 , t0 ) − ∂x2
(x0 , t0 ) ≥ 0
im Widerspruch zu (∗) . (Beachten Sie, dass für ε = 0 kein Widerspruch ent-
standen wäre.)
Es folgt für (x, t) ∈ Ω ∩ HT
u(x, t) ≤ v(x, t) ≤ v(x0 , t0 ) ≤ u(x0 , t0 ) + εL2 ,
also
sup u ≤ max u + εL2 für jedes ε > 0 .
HT ∩Ω HT ∩∂Ω
Nach Grenzübergang ε → 0 folgt die Behauptung. Die Abschätzung von u(x, t)

nach unten folgt durch Ersetzen von u durch −u. 2
Hieraus ergibt sich unmittelbar der

Eindeutigkeitssatz. Es gibt höchstens eine auf Ω stetige Lösung u der Wär-
meleitungsgleichung mit vorgeschriebenen Werten auf dem Randstück HT ∩ ∂Ω,
d.h. mit den
Anfangswerten u(x, 0) = f (x) (0 ≤ x ≤ L), und den
Randwerten u(0, t) = g(t), u(L, t) = h(t) (t ≥ 0).
Beweis.
Die Behauptung ergibt sich, indem wir für zwei Lösungen u1 , u2 mit gleichen
Randdaten das Maximumprinzip auf u := u2 − u1 anwenden. 2
4.8 Aufgaben
(a) Zeitlicher Abfall der Energie bei der Wärmeleitung. Zeigen Sie
L L
1 ∂u ∂u
E(t) := (x, t)2 dx =⇒ Ė(t) = − (x, t)2 dx ≤ 0
2 ∂x ∂t
0 0
für jede Lösung u mit geeigneten Differenzierbarkeits– und Randbedingungen.
Verfahren Sie dabei wie in 3.5. Folgern Sie hieraus eine Eindeutigkeitsaussage
für die Wärmeleitungsgleichung.
(b) Geben Sie nach dem Muster von 3.7 eine Lösungsdarstellung für die inho-
mogene Wärmeleitungsgleichung
∂u ∂2u
(x, t) − (x, t) = F (x, t)
∂t ∂x2
unter den homogenen Randbedingungen u(0, t) = u(L, t) = u(x, 0) = 0.
(c) Wir betrachten die homogene Wärmeleitungsgleichung mit den gemischten
Randbedingungen
∂u ∂u
(0, t) = 0 , u(L, t) − (L, t) = 0 für t ≥ 0 .
∂x ∂x
Welches Vorzeichen haben die beim Produktansatz auftretenden Eigenwerte λ
und welcher Gleichung genügen sie? (Verfahren Sie wie in 1.2.) Verschaffen Sie
sich eine Vorstellung von der Lage der Eigenwerte λ1 , λ2 , . . . , indem Sie die
λk als Abszissen der Schnittpunkte einer Tangensfunktion und einer Hyperbel
darstellen. Was läßt sich über das asymptotische Verhalten der λk für k → ∞
sagen?
(d) Wärmeleitung ins Erdinnere. Unter der idealisierenden Annahme, dass
die Erdoberfläche eben ist und in der x, y–Ebene liegt, wollen wir annehmen,
dass die Erdtemperatur nur von der Tiefe z ≥ 0 und der Zeit t abhängt:
u = u(z, t).
∂u
Die Wärmeleitungsgleichung ∂t
= k Δu (§ 1 : 2.5) vereinfacht sich dann zu
∂u ∂2u
= k für z, t > 0 ,
∂t ∂z 2
wobei wir die Temperaturleitfähigkeit k diesmal nicht wegskalieren. Wir gehen
von periodischen Temperaturschwankungen an der Erdoberfläche aus:
1 2π
u(0, t) = a0 + a1 cos ωt mit der Periode T = .
2 ω
Ferner fordern wir, dass u(z, t) für z → ∞ beschränkt bleibt.
(i) Warum genügt es, den Fall a0 = 0, a1 = 1 zu betrachten?
(ii) In letzterem Fall führt der Separationsansatz u(x, t) = v(x)w(t) scheinbar
nicht zum Ziel; es müsste v(0)w(t) = cos ωt eine gewöhnliche DG 1. Ordnung
erfüllen. Schreiben wir aber
1 iωt 1
cos ωt = e + e−iωt =: w1 (t) + w2 (t)
2 2
so gibt es komplexwertige Produktlösungen u1 , u2 mit uk (0, t) = wk (t). Abwei-
chend vom üblichen Schema ist hier λ durch die wk eindeutig bestimmt. Führen
Sie das aus!
(iii) In welcher Tiefe z ergibt sich bei einer jährlichen Periode (T = 1 Jahr) bei
einer Temperaturleitfähigkeit k = 2 · 10−7 m2 /sec eine Phasenverschiebung von
einem halben Jahr?
(e) Folgern Sie aus dem Maximumprinzip 4.7 für zwei Lösungen u1 , u2 :
– Aus u1 ≤ u2 auf ∂Ω folgt u1 ≤ u2 auf Ω.
– Aus | u1 − u2 | ≤ ε auf ∂Ω folgt | u1 − u2 | ≤ ε auf Ω.
(f) Temperaturverteilung im endlich langen Draht bei festen Randwerten. Hal-
ten wir durch Wärmezufuhr die Temperaturen der Drahtenden konstant, so
ergibt sich das Problem
∂u
∂t
=
∂2u
∂x2
in Ω = ]0, L[ × Ê >0 ,
u(0, t) = α , u(L, t) = β
u(x, 0) = f (x) , wobei f (0) = α , f (L) = β .
Stellen Sie die Lösung in der Form u(x, t) = u0 (x) + v(x, t) dar, wobei v
das Problem 4.1 mit einer geeigneten Anfangstemperaturverteilung löst und
u0 (x) = lim u(x, t) der stationären (zeitunabhängigen) Wärmeleitungsglei-
t→∞
chung u0 = 0 in einer Dimension genügt.
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe

5.1 Formulierung des Problems
Wir betrachten eine wärmeleitende Kreisscheibe in der x, y–Ebene, deren Tem-
peraturverteilung auf dem Rand zeitlich konstant gehalten wird. Ähnlich wie
in 4.8 (f) dürfen wir erwarten, dass der Vorgang des Wärmeausgleichs nach ei-
ner gewissen Zeit annähernd zur Ruhe gekommen ist. Die Temperatur u hängt
dann nicht mehr von der Zeit ab, aus der Wärmeleitungsgleichung ∂u/∂t = a Δu
wird die Laplace–Gleichung Δu = 0. Lösungen der Laplace–Gleichung wer-
den harmonische Funktionen genannt.
Nach Ausführung einer Translation und einer Streckung der Ebene dürfen wir
das Problem auf der Einheitskreisscheibe
Ω = K1 (0) = {(x, y) | x2 + y 2 < 1}
betrachten. Wir kommen so zum Randwertproblem für die Laplace–Gleichung

(Dirichlet–Problem):
Gegeben ist eine stetige Funktion f auf der Kreislinie ∂Ω. Gesucht ist eine
Funktion u ∈ C0 (Ω) ∩ C2 (Ω) mit
(a) Δu = 0 in Ω,
(b) u = f auf ∂Ω.
5.2 Transformation auf Polarkoordinaten

Es ist leicht zu sehen, dass der Produktansatz u(x, y) = v(x) w(y) zwar eine
Fülle harmonischer Funktionen liefert, aber keine Handhabe bietet, die Rand-
bedingung (b) einzuarbeiten. Das ändert sich, wenn wir die Kreissymmetrie
des Problems ausnützen und zu Polarkoordinaten übergehen. Dabei stellt sich
folgende Aufgabe:
Umrechnung des Laplace–Operators in Polarkoordinaten

Setzen wir für eine C2 –Funktion u auf der Einheitskreisscheibe
U (r, ϕ) := u(r cos ϕ, r sin ϕ) (0 < r < 1, −π < ϕ < π),
so gilt

1 ∂ ∂U 1 ∂2U ∂2U 1 ∂U 1 ∂2U
Δu = r + 2 2
= 2
+ + 2 .
r ∂r ∂r r ∂ϕ ∂r r ∂r r ∂ϕ2
Hierbei sind auf der linken Seite die Argumente (r cos ϕ, r sin ϕ) und auf der
rechten die Argumente (r, ϕ) einzutragen.
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe 165
Diese Identität ergibt sich aus den via Kettenregel gewonnenen Gleichungen
∂U ∂u ∂u ∂U ∂u ∂u
= cos ϕ + sin ϕ , = − r sin ϕ + r cos ϕ ,
∂r ∂x ∂y ∂ϕ ∂x ∂y

∂2U ∂2u ∂2u ∂2u ∂2u
= cos ϕ + sin ϕ cos ϕ + cos ϕ + sin ϕ sin ϕ,
∂r 2 ∂x2 ∂x∂y ∂x∂y ∂y 2

∂2U ∂2u ∂2u
= − r sin ϕ + r cos ϕ (−r sin ϕ)
∂ϕ2 ∂x 2 ∂x∂y

∂2u ∂2u ∂u ∂u
+ − r sin ϕ + r cos ϕ r cos ϕ − r cos ϕ − r sin ϕ .
∂x∂y ∂y 2 ∂x ∂y
Damit geht das Randwertproblem (a), (b) über in

1 ∂ ∂U 1 ∂2U
(a ) r + = 0 für 0 < r < 1, −π < ϕ < π ,
r ∂r ∂r r 2 ∂ϕ2
(b ) U (1, ϕ) = F (ϕ) := f (cos ϕ, sin ϕ) für − π < ϕ < π .
Von den Lösungen U fordern wir C2 –Differenzierbarkeit für 0 < r < 1 und
stetige Fortsetzbarkeit in r = 0. Damit eine Lösung U von (a ),(b ) wieder
zu einer Lösung u des Originalproblems zurücktransformiert werden kann, d.h.
damit es eine Funktion u ∈ C0 (Ω)∩C2 (Ω) gibt mit U (r, ϕ) = u(r cos ϕ, r sin ϕ),
muss sich U bezüglich ϕ periodisch verhalten. Wir verlangen
∂U ∂U
(c ) U (r, π−0) = U (r, −(π+0)), (r, π−0) = (r, −(π+0)) (0 < r < 1),
∂ϕ ∂ϕ
(d ) lim U (r, ϕ) existiert für jedes ϕ und ist unabhängig von ϕ.
r→0+
Dass diese Bedingungen für die Rücktransformation hinreichen, brauchen wir

uns an dieser Stelle nicht zu überlegen; das ergibt sich später von selbst.
5.3 Produktlösungen
Die Bedingungen (a ),(c ),(d ) für die Produktlösung U (r, ϕ) = v(r) w(ϕ) mit
v = 0, w = 0 führen auf die Gleichungen ( ÜA , vgl. § 4 : 1)
1 λ
(1) v + v − 2 v = 0, lim v(r) existiert,
r r r→0+
(2) w + λ w = 0 , w(−π) = w(π) , w (−π) = w (π) .

Aus (2) folgt zunächst λ ≥ 0 nach dem Muster 1.2. Die Periodizitätsbe-
dingungen (c ) liefern dann die sämtlichen möglichen Eigenwerte λ = k2 für
k = 0, 1, . . . ÜA .
Es ergibt sich daher w(ϕ) = a0 /2 für k = 0 und w(ϕ) = ak cos kϕ + bk sin kϕ
für k = 1, 2, . . . mit Konstanten ak , bk . Für λ = k2 hat (1) nach § 4 : 1 bzw.
§ 4 : 2.7 die Fundamentalsysteme
1, log r für k = 0 und r k , r −k für k ∈ .
Von diesen fallen wegen der Bedingung (1) die für r → 0+ unstetigen Lösungen
fort. Damit haben sämtliche Produktlösungen die Form
1
U0 (r, ϕ) = 2 a0 bzw.
Uk (r, ϕ) = (ak cos kϕ + bk sin kϕ) r k für k = 1, 2, . . . .
5.4 Superposition von Produktlösungen, Poissonsche Integralformel

(a) Lösungsformel in Polarkoordinaten. Wir setzen U (r, ϕ) als Superposition
sämtlicher Produktlösungen in Reihenform an; dabei gehen wir der bequemen
Rechnung halber zur komplexen Darstellung über. Außerdem nehmen wir an,
dass die Reihe
1 ∞ n
(∗) U (r, ϕ) = a0 + (ak cos kϕ + bk sin kϕ) r k = lim ck r |k| eikϕ
2 k=1 n→∞ k=−n
für 0 ≤ r ≤ 1 und |ϕ| ≤ π gleichmäßig konvergiert. Dann konvergiert auch

+∞
F (ϕ) = U (1, ϕ) = ck eikϕ

k=−∞
gleichmäßig für alle ϕ ∈ , also gilt nach 2.2

π
ck =
1
2π
F (ψ) e−ikψ dψ für k ∈ .
−π
Für festes r < 1 gewinnen wir damit aus (∗) die folgende Integraldarstellung:

+∞ π
1
U (r, ϕ) = r |k| eik(ϕ−ψ) F (ψ) dψ
2π
k=−∞
−π
π $ %
1 |k| ik(ϕ−ψ)
+∞
= r e F (ψ) dψ
2π
k=−∞
−π
π
= Q(r, ϕ − ψ) F (ψ) dψ
−π
mit
1 |k| ikt
+∞
Q(r, t) := r e .
2π
k=−∞
Für r < 1 ergibt sich

1
∞ ∞
Q(r, t) = (r eit )k + (r e−it )k
2π k=0 k=1

1 1 re−it 1 1 − r2
= + = .
2π 1 − reit 1 − r e−it 2π 1 − 2r cos t + r 2
Hiermit haben wir eine Integraldarstellung der Lösung für r < 1 erraten:
π
(∗∗) U (r, ϕ) = Q(r, ϕ − ψ) F (ψ) dψ .
−π
Wir führen (∗∗) anschließend in kartesische Koordinaten über und zeigen in

5.5, dass wir hierdurch zu einer Lösung des Dirichlet–Problems gelangen. Daher
benötigen wir die zum Erraten der Integraldarstellung oben gemachte Annahme
über die gleichmäßige Entwickelbarkeit von F nicht mehr. (Diese ist nach 2.4 (ii)
auch nicht immer gerechtfertigt.)
(b) Lösungsformel in kartesischen Koordinaten. Für x = (r cos ϕ, r sin ϕ) mit
r < 1 und y = (cos ψ, sin ψ) ergibt sich
x − y2 = 1 − 2r cos(ϕ − ψ) + r 2 ,
also
1 1 − x2
Q(r, ϕ − ψ) = =: P (x, y) .
2π x − y2
Mit U (r, ϕ) = u(r cos ϕ, r sin ϕ), F (ψ) = f (cos ψ, sin ψ) geht die Integraldar-
stellung (∗∗) über in

(P) u(x) = P (x, y) f (y) ds(y) für x < 1 ,
y=1
wobei die rechte Seite als skalares Kurvenintegral über die positiv orientierte
Einheitskreislinie zu verstehen ist. Das ergibt sich sofort mit der Parametrisie-
rung ψ → y = (cos ψ, sin ψ) (−π ≤ ψ ≤ π) ( ÜA , vgl. Bd. 1, § 24 : 3.1).
Die Funktion P heißt der Poisson–Kern für die Einheitskreisscheibe; das
Integral in (P) wird Poisson–Integral genannt.
5.5 Lösung des Dirichlet–Problems durch das Poisson–Integral

Ω bezeichne wieder die offene Einheitskreisscheibe K1 (0) ⊂ Ê. 2
Satz (Poisson 1820). Für jede stetige Funktion f auf der Einheitskreislinie ∂Ω
ist durch
⎧
⎨ 1 − x
2
⎪ f (y)
ds(y) für x < 1,
u(x) := 2π x − y2
⎪
⎩ y=1
f (x) für x = 1
eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω) des Dirichlet–Problems
Δu = 0 in Ω , u = f auf ∂Ω
gegeben.
Bemerkungen. (i) Dass dies die einzige Lösung ist, zeigen wir in 5.6.
(ii) u ist sogar reell–analytisch in Ω, d.h. Realteil einer in Ω holomorphen Funk-
tion:

∞
u(x, y) = Re c0 + 2 ck (x + iy)k
k=1
mit den Koeffizienten
1 π
ck = f (cos ψ, sin ψ) e−ikψ dψ (k = 0, 1, 2, . . .) .
2π −π
(iii) Das Poisson–Integral divergiert für alle x ∈ ∂Ω mit f (x) = 0; es kann

daher die Lösung in Randpunkten nicht darstellen. Die Aussage u ∈ C0 (Ω),
u = f auf ∂Ω bedeutet also
lim u(x) = f (x0 ) für jedes x0 ∈ ∂Ω .
Ω x →x 0
Beweis.
(a) Für die oben definierte Funktion u zeigen wir u ∈ C∞ (Ω) und Δu = 0 in
Ω. Für x = (r cos ϕ, r sin ϕ) mit r < 1 gilt nach der Rechnung in 5.4, die wir
jetzt rückwärts verfolgen,
π
u(x) = P (x, y) f (y) ds(y) = Q(r, ϕ − ψ) F (ψ) dψ
y=1 −π

+∞
∞
∞
= ck r |k| eikϕ = c0 + ck r k eikϕ + c−k r k e−ikϕ
k=−∞ k=1 k=1
mit
π π
ck = 1
2π
F (ψ) e−ikψ dψ = 1
2π
f (cos ψ, sin ψ) e−ikψ dψ .
−π −π
Die gliedweise Integration ist erlaubt, weil die Reihe

+∞
ck r |k| eik(ϕ−ψ)
k=−∞
wegen |ck | ≤ f ∞ bei festem r < 1 gleichmäßig bezüglich ψ konvergiert. Da

Ê
f reellwertig ist, gilt c−k = ck und c0 ∈ , also ist

∞
u(x, y) = Re g(x + iy) mit g(z) := c0 + 2 ck z k .
k=1
Da die letztere Reihe für |z| < 1 konvergiert, ist u in Ω der Realteil der holo-
morphen Funktion g. Nach Bd. 1, § 27 : 3.1 und § 27 : 1.3 sind u(x, y), v(x, y) :=
Im g(x + iy) beliebig oft differenzierbar in Ω und erfüllen dort die Cauchy–
Riemannschen Differentialgleichungen
∂u ∂v ∂u ∂v
= , = − .
∂x ∂y ∂y ∂x
Daraus folgt
∂2u ∂2u ∂2v ∂2v
Δu = + = − = 0 in Ω .
∂x2 ∂y 2 ∂x∂y ∂y∂x
(b) Eigenschaften des Poisson–Kerns.
(1) Für x = (r cos ϕ, r sin ϕ) mit r < 1 und y = 1 gilt P (x, y) > 0 sowie
π π +∞

P (x, y) ds(y) = Q(r, ϕ − ψ) dψ = 1
2π
r |k| eik(ϕ−ψ) dψ
y=1 −π −π k=−∞

+∞ π
= 1
2π
r |k| eik(ϕ−ψ) dψ = 1 .
k=−∞ −π
(2) Sei x0 = 1 und x0 − y ≥ 2δ > 0. Dann folgt für x < 1, x − x0 < δ
zunächst x − y ≥ x0 − y − x0 − x ≥ 2δ − δ = δ, also
1 − x2 (1 + x) (1 − x)

P (x, y) ≤ =
2πδ 2 2πδ 2
2(1 − x) 1
< ≤ x − x0 ,
2πδ 2 πδ 2
Letzteres wegen 1 − x = x0 − x ≤ x − x0 .
(c) u ist stetig in Ω. Dazu müssen wir nach Bemerkung (iii) zeigen, dass
lim u(x) = f (x0 ) für jeden Randpunkt x0 .
Ω x→x0
Sei also x0 = 1 und ε > 0 vorgegeben. Wir wählen δ > 0 so, dass
| f (y) − f (x0 ) | < ε für alle y ∈ ∂Ω mit y − x0 < 2δ .

Dann gilt für alle x ∈ Ω mit x − x0 < δ aufgrund von (b)

| u(x) − f (x0 ) | = P (x, y) f (y) − f (x0 ) ds(y)
y=1

≤ P (x, y) f (y) − f (x0 ) ds(y)
y=1

= P (x, y) f (y) − f (x0 ) ds(y)
y−x0 <2δ

+ P (x, y) f (y) − f (x0 ) ds(y)
y−x0 ≥2δ

< ε P (x, y) ds(y) + 2f ∞ P (x, y)ds(y)
y−x0 <2δ y−x0 ≥2δ
1
< ε + 2f ∞ 2π x − x0
πδ 2
4f ∞
= ε+ x − x0 < 2ε
δ2

für x − x0 < min δ, εδ 2 /4f ∞ . 2
5.6 Maximumprinzip für harmonische Funktionen und

Eindeutigkeitssatz für das Dirichlet–Problem
(a) Maximumprinzip. Für jede auf einem beschränkten Gebiet Ω ⊂ Ê n
harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω) gilt

min u ≤ u ≤ max u .
∂Ω ∂Ω
Gilt lediglich Δu ≥ 0 in Ω, so besteht die Ungleichung u ≤ max u .

∂Ω
Beweis.
(i) Wir beweisen zunächst die zweite Behauptung. Dazu wählen wir ein ε > 0
und setzen
v(x) := u(x) + εx2 .
Die stetige Funktion v nimmt auf der kompakten Menge Ω das Maximum an,
etwa in x0 . Dieser Punkt muss auf dem Rand liegen, denn im Fall x0 ∈ Ω wäre
die Hesse–Matrix H von v in diesem Punkt negativ semidefinit, hätte also keinen
positiven Eigenwert. Wegen Spur H = Δv(x0 ) = Δu(x0 ) + 2nε = 2nε > 0 kann
dies nicht sein.
Es gilt also für alle x ∈ Ω
u(x) ≤ v(x) ≤ v(x0 ) = u(x0 ) + εx0 2 ,
somit wegen x0 ∈ ∂Ω

sup {u(x) | x ∈ Ω} ≤ sup {u(x) | x ∈ ∂Ω} + ε max x2 | x ∈ ∂Ω
für jedes ε > 0. Nach Grenzübergang ε → 0 folgt die Behauptung.

(ii) Die erste Behauptung folgt unmittelbar durch Anwendung von (i) auf u
und auf −u. 2
Eine direkte Folgerung aus (a) ist der

(b) Eindeutigkeitssatz. Jede harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω) ist
durch ihre Randwerte eindeutig bestimmt. Insbesondere hat das Dirichlet–Pro-
blem 5.1 höchstens eine Lösung.
5.7 Aufgaben
(a) Lösen Sie das Dirichlet–Problem in der Einheitskreisscheibe für die folgen-
den Randverteilungen
4 − 2x
f (x, y) = 1 , f (x, y) = x3 , f (x, y) = .
5 − 4x
Verwenden Sie in den letzten beiden Fällen Polarkoordinaten. Im mittleren
Fall ergibt sich für 5.4 (∗) eine endliche Summe. Bestimmen Sie im letzten Fall
zunächst Re 1/(1 − 12 e iϕ ) .
(b) Folgern Sie aus der Poisson–Darstellung 5.5 die Harnacksche Unglei-
chung für die Lösung u des Dirichlet–Problems im Fall f ≥ 0
1 − x 1 + x
u(0) ≤ u(x) ≤ u(0) für x < 1 .
1 + x 1 − x
π
(c) Machen Sie sich plausibel, dass für U (r, ϕ) = Q(r, ϕ − ψ) F (ψ) dψ die
−π
Beziehung lim U (r, ϕ) = F (ϕ) gilt, indem Sie die Funktion t → Q(r, t) für
r→1
einzelne Werte von r < 1 skizzieren. Beachten Sie dabei, dass
1 1+r
lim Q(r, 0) = lim = ∞, lim Q(r, ϕ) = 0 für ϕ = 0 .
r→1 r→1 2π 1 − r r→1
(d) Folgern Sie aus 5.5 mit Hilfe einer Streckung der Ebene, dass die Poisson–
Formel für die Kreisscheibe Ω = KR (0) lautet

R2 − x2 f (y)
u(x) = ds(y) für x < R .
2πR x − y2
y=R
172 § 7 Die Charakteristikenmethode für DG 1. Ordnung
§ 7 Die Charakteristikenmethode für DG 1. Ordnung

In diesem Paragraphen behandeln wir das Anfangswertproblem für die implizite
Differentialgleichung 1. Ordnung
F (x, u(x), ∇u(x)) = 0 .
Gleichungen dieses Typs beschreiben Phänomene der Wellenausbreitung. Zu

diesen gehört die Eikonalgleichung der geometrischen Optik, und deren mecha-
nisches Analogon, die Hamilton–Jacobi–Differentialgleichung. Die Lösung sol-
cher Gleichungen kann vollständig auf die Lösung von Systemen gewöhnlicher
Differentialgleichungen zurückgeführt werden. Wir erläutern die Charakteristi-
kenmethode zunächst an einem Spezialfall:
1 Die quasilineare Differentialgleichung

1.1 Problemstellung
Ê
Gegeben sind ein Gebiet Ω ⊂ n und C1 –Funktionen a1 , . . . , an , b auf Ω × . Ê
Ferner sei M eine (n − 1)–dimensionale orientierbare C1 –Untermannigfaltigkeit
in Ω und f eine C1 –differenzierbare Funktion auf M . Gesucht ist eine Lösung
u der quasilinearen DG 1. Ordnung

n
∂u
n
ai (x, u(x)) (x) = b(x, u(x)) , kurz ai (x, u) ∂i u = b(x, u)

∂xi
i=1 i=1
in einer Umgebung von M , die der Anfangsbedingung
u = f auf M.
genügt.
Wir sprechen von einem Anfangswertproblem oder Cauchy–Problem.
Für die sich auf Untermannigfaltigkeiten beziehenden Begriffe verweisen wir
auf § 11 : 1. Ohne Verlust an Allgemeinheit beschränken wir uns hier auf die
Behandlung des ebenen Falles n = 2, bei dem M eine Kurve ist, die wir mit
C bezeichnen. Das bedeutet, dass sich C lokal durch eine Gleichung g(x) = 0
mit einer C1 –Funktion g beschreiben lässt, wobei ∇g nirgends verschwindet.
Hieraus ergibt sich: Zu jedem Kurvenpunkt ξ ∈ C gibt es eine Umgebung
Ê
U ⊂ 2 , so dass C ∩ U eine reguläre C1 –Parametrisierung ϕ : I → C ∩ U mit
stetiger Umkehrung besitzt, wobei I ein offenes Intervall ist. Der Einfachheit
halber nehmen wir an, dass C durch eine einzige Parametrisierung ϕ : I → 2 Ê
überdeckt wird, die wir im Folgenden fixieren.
Wir nennen die Funktion f C1 –differenzierbar auf C , wenn f ◦ ϕ im ge-
wöhnlichen Sinn C1 –differenzierbar ist.
1 Die quasilineare Differentialgleichung 173
1.2 Der Grundgedanke der Charakteristikenmethode

Der Grundgedanke der Charakteristikenmethode lässt sich geometrisch sehr ein-
fach formulieren:
Sei u eine in einer Umgebung U von C gegebene Lösung des Cauchy–Problems
a1 (x, u) ∂1 u + a2 (x, u) ∂2 u = b(x, u) , u = f auf C.
Wir setzen

/ := (x, u(x)) | x ∈ U ,
M / := (ξ, f (ξ)) | ξ ∈ C ,
C
v := (a1 , a2 , b) und n := (∂1 u, ∂2 u, −1) .
Hiermit erhält das Cauchy–Problem die geometrische Gestalt

/ und C/ ⊂ M
v , n = a1 ∂1 u + a2 ∂2 u − b = 0 auf M /.
Die Abbildung (x, y) → v(x, y) ist

ein Vektorfeld im Ê3
, das auf der
Lösungsfläche M / tangential ist, da
/ ist. Jede x3 Charakteristik
n ein Normalenfeld auf M
/
durch C laufende Integralkurve (Cha-
rakteristik) dieses Vektorfeldes liegt
daher auf M / , siehe die ÜA unten. / = Graph u
M
Die Gesamtheit der Charakteristiken
/.
zerlegt M /
C
Die Charakteristikenmethode zur Lö-

sung des Cauchy–Problems 1.1 besteht x2
nun darin, diese Analyse in ein Kon- C U0
struktionsverfahren für die gesuchte
Funktion u umzumünzen:
– Bestimmung der Charakteristiken;
dies bedeutet Lösung eines AWP
gewöhnlicher Differentialgleichungen,
– Nachweis, dass die Schar der Cha- charakteristische
rakteristiken eine Fläche aufspannt, Projektion x1
die Graph einer Funktion u ist, welche
das Cauchy–Problem löst.
ÜA Zeigen Sie für die Integralkurven t → α(t) = (x1 (t), x2 (t), y(t)) des Vektor-
feldes v: Gilt α(t0 ) ∈ M / für ein t0 , so auch α(t) ∈ M
/ für alle t. (Differenzieren
Sie y(t) − u(x1 (t), x2 (t))).
Die Projektionen der Charakteristiken auf die x1 ,x2 –Ebene heißen charakte-
ristische Projektionen.
1.3 Das charakteristische Anfangswertproblem

Nach Definition ist eine C1 –Kurve t → (x1 (t), x2 (t), y(t)) Charakteristik für
das Cauchy–Problem 1.1, wenn für einen Kurvenpunkt ξ = (ξ1 , ξ2 ) ∈ C gilt:
ẋ1 (t) = a1 (x1 (t), x2 (t), y(t)) , x1 (0) = ξ1 ,

ẋ2 (t) = a2 (x1 (t), x2 (t), y(t)) , x2 (0) = ξ2 ,
ẏ(t) = b(x1 (t), x2 (t), y(t)) , y(0) = f (ξ).
Wir beziehen im Folgenden die Anfangswerte auf den Kurvenparameter s und
schreiben das Anfangswertproblem mit den Abkürzungen
a = (a1 , a2 ), x = (x1 , x2 )
in vektorieller Gestalt
(a) ẋ(t) = a(x(t), y(t)), ẏ(t) = b(x(t), y(t)),
(b) x(0) = ϕ(s), y(0) = ψ(s) := f (ϕ(s)) mit s ∈ I.
Die Lösungsschar des Anfangswertproblems (a),(b) bezeichnen wir mit
t → (X(s, t), Y (s, t)) (s ∈ I) .
Die zugehörigen charakteristischen Projektionen sind dann gegeben durch
t → X(s, t) (s ∈ I).
Die gesuchte Lösung u des Cauchy–Problems soll nach den Überlegungen in

1.2 durch die Gleichung u(X(s, t)) = Y (s, t) eindeutig bestimmt sein, d.h. die
Abbildung (s, t) → X(s, t) soll eine C1 –differenzierbare Inverse besitzen. Dies
erfordert eine Bedingung an die Anfangsdaten:
1.4 Transversalitätsbedingung und charakteristische Umgebungen

An die Anfangsdaten stellen wir folgende Transversalitätsbedingung:
(c) Für kein ξ ∈ C ist a(ξ, f (ξ)) Tangentenvektor an C im Punkt ξ.
Dann schneidet jede charakteristische Projektion t → X(s, t) die Kurve C trans-

versal, das heißt nicht tangential, denn nach 1.3 (a),(b) gilt
Ẋ(s, 0) = a(X(s, 0), Y (s, 0)) = a(ξ, f (ξ)) .
Im folgenden Existenz– und Eindeutigkeitssatz zeigen wir, dass unter dieser Vor-
aussetzung die charakteristischen Projektionen eine Umgebung von C einfach,
d.h. ohne Überschneidungen, überdecken. Genauer erhalten wir: Es existiert ei-
Ê
ne Umgebung U ⊂ Ω der Startkurve C und eine Umgebung V ⊂ 2 der Strecke
{(s, 0) | s ∈ I }, so dass für jeden

Punkt (s, t) ∈ V die Verbindungs- x2
strecke zwischen (s, t) und (s, 0) ganz 6 U
in V liegt. Das bedeutet, dass sich jeder
Punkt von U längs einer charakteristi-
schen Projektion mit einem Punkt in ξ0 C
C verbinden lässt, ohne U zu verlassen.
Wir nennen U eine charakteristische -
t 6 x1
Umgebung der Startkurve C.
X
Analog sprechen wir von einer cha- -
rakteristischen Umgebung U eines s0 s
Punktes ξ0 = ϕ(s0 ) ∈ C, wenn U
wie eben das diffeomorphe Bild unter V
X einer Umgebung V einer Strecke
{(s, 0) | s ∈ J} ist, wobei J eine Inter-
vallumgebung von (s0 , 0) ist.
In den meisten Fällen können wir V als Rechteckumgebung wählen (Figur).
Aus dem Eindeutigkeitssatz für autonome DG folgt: Der Durchschnitt zweier
charakteristischer Umgebungen von ξ0 ist wieder eine, wenn sich diese auf der
Anfangswertkurve C treffen. ÜA : Machen Sie sich das klar!
1.5 Der Existenz– und Eindeutigkeitssatz für das quasilineare Cau–

chy–Problem
Satz. Das quasilineare Cauchy–Problem
a(x, u) , ∇u = b(x, u), u = f auf C
besitzt unter der Transversalitätsbedingung (c) in einer charakteristischen Um-

gebung U ⊂ Ω von C eine eindeutig bestimmte Lösung u : U → . Ê
Der Lösungsweg besteht in folgenden Schritten:
(1) Bestimmung der Lösung X(s, t), Y (s, t) des charakteristischen AWP für
jeden Parameterwert s ∈ I der Startkurve C,
ẋ(t) = a(x(t), y(t)) , ẏ(t) = b(x(t), y(t)) , x(0) = ϕ(s) , y(0) = ψ(s) .
(2) Einschränkung von X auf eine Umgebung V der Strecke {(s, 0) | s ∈ I } in

der s, t–Ebene, so dass X einen Diffeomorphismus von V auf eine charakteri-
stische Umgebung U von C liefert.
(3) Darstellung der Lösung u auf U durch die Beziehung
u ◦ X = Y bzw. u = Y ◦ X−1 .
Der Beweis folgt in 1.8.

Bemerkungen. (a) Ist die Transversalitätsbedingung verletzt, so kann das

Cauchy–Problem unlösbar sein, oder es kann unendlich viele Lösungen geben.
Beispiele hierfür sind:
∂1 u + ∂2 u = u , u(x, x) = 1,
∂1 u + ∂ 2 u = 0 , u(x, x) = 0.
Die Startkurve C ist hier die Diagonale in der Ebene, welche die Parametrisie-
rung s → ψ(s) = (s, s) besitzt. Wegen ψ (s) = (1, 1) und (a1 , a2 ) = (1, 1) ist
die Transversalitätsbedingung verletzt.
Das erste Problem hat keine Lösung, denn für eine solche müßte gelten
d d
0 = 1 = u(x, x) = ∂1 u(x, x) + ∂2 u(x, x) = u(x, x) = 1 .
dx dx
Das zweite AWP hat die unendlich vielen Lösungen u(x1 , x2 ) = c · (x1 − x2 )
Ê
mit c ∈ .
(b) Die eindeutige und C1 –differenzierbare Festlegung der Lösung u durch die
Gleichung u ◦ X = Y ist gewährleistet, solange die Abbildung X ein Diffeo-
morphismus ist, was auf kleinen Umgebungen V0 von (s0 , 0) stets erreichbar ist.
Auf größeren Umgebungen braucht X kein Diffeomorphismus zu sein, und es
kann zweierlei eintreten:
(i) X ist nicht injektiv, d.h. zwei charakteristische Projektionen schneiden
sich. In solchen Schnittpunkten kann u nicht mehr widerspruchsfrei festgelegt
werden.
(ii) Die Jacobi–Matrix DX(s, t) hat in einem Punkt (s, t) nicht den Maximal-
rang 2. Dann heißt die Stelle X(s, t) ein Brennpunkt der charakteristischen
Projektionen; u braucht dort nicht mehr differenzierbar zu sein. Dieses Phäno-
men wird in Beispiel 1.7 illustriert.
Die Fälle (i) und (ii) können auch gleichzeitig eintreten.
(c) Im Fall b = 0 ist jede Lösung konstant längs jeder charakteristischen
Projektion ÜA .
(d) Der Satz behält für n > 2 seine Gültigkeit, wenn der Träger der Anfangs-
werte eine (n − 1)–dimensionale orientierbare C1 –Untermannigfaltigkeit M ist,
vgl. § 11 : 1.5, z.B. eine Hyperebene. Das Lösungsverfahren (1) bis (3) und der
Beweis 1.8 übertragen sich sinngemäß. Die Transversalitätsbedingung lautet
analog zum zweidimensionalen Fall:
(c ) Für kein ξ ∈ M ist a(ξ, f (ξ)) Tangentenvektor an M im Punkt ξ ∈ M .
In den folgenden Beispielen ist die Anfangswertkurve C stets die x–Achse in der
(x, t)–Ebene, die Charakteristiken parametrisieren wir durch den Parameter τ .
1.6 Die Wellengleichung einfachsten Typs

Für eine gegebene C1 –Funktion ψ : Ê → Ê und eine Konstante c = 0 betrach-
ten wir das Cauchy–Problem
t 6
∂u ∂u
c + = 0, u(x, 0) = ψ(x).
∂x ∂t
Das Anfangswertproblem für die Cha-
rakteristiken lautet hier (x, t)
•
ẋ(τ ) = c, ṫ(τ ) = 1, ẏ(τ ) = 0,
x(0) = s, t(0) = 0, y(0) = ψ(s).
Als Lösungsschar ergibt sich

(s, 0)
• -
X(s, τ ) = (s + c τ, τ ), x
Y (s, τ ) = ψ(s).
Die charakteristischen Projektionen sind parallele Geraden, welche die x–Achse

C transversal schneiden und die ganze Ebene einfach überdecken.
Nach 1.5 (3) erhalten wir die Lösung u aus
u(s + cτ, τ ) = u(X(s, τ )) = Y (s, τ ) = ψ(s),
und nach Elimination von s ergibt sich
u(x, t) = ψ(x − ct).
Dies ist eine für c > 0 nach rechts und für c < 0 nach links wandernde Welle
mit festem räumlichen Profil und Geschwindigkeit | c |.
Aufgabe. (Lösungsdarstellung von d’Alembert für die schwingende Saite)

Ê Ê
eien f ∈ C2 ( ), g ∈ C1 ( ). Zeigen Sie: Jede Lösung u ∈ C2 ( Ê ) von
2
∂2u ∂2u ∂u
2
= c2 , u(x, 0) = f (x) , (x, 0) = g(x)
∂t ∂x2 ∂t
mit c > 0 besitzt die Darstellung
1 1
x+ct
u(x, t) = (f (x + ct) + f (x − ct)) + g(y) dy .
2 2c x−ct
Anleitung: Die Funktion v := −c ∂u

∂x
+ ∂u
∂t
löst das Cauchy–Problem
∂v ∂v
c + =0 mit v(x, 0) = ψ(x) := −c f (x) + g(x),
∂x ∂t
besitzt also nach Obigem die Lösung v(x, t) = ψ(x − ct). Hiernach genügt u
dem Cauchy–Problem
∂u ∂u
−c (x, t) + (x, t) = ψ(x − ct), u(x, 0) = f (x).
∂x ∂t
Dessen Lösung nach der Methode 1.5 ergibt die Behauptung.
1.7 Ein Verkehrsflussproblem

Den Verkehrsfluss auf einer Spur einer unendlich langen Landstraße ohne Ab-
zweigungen beschreiben wir in einem kontinuierlichen Modell durch die Fahr-
zeugdichte (x, t) pro Längeneinheit und die Geschwindigkeit v(x, t) an der Stel-
le x zur Zeit t. Dabei gehen wir vom Erhaltungssatz für die Anzahl der Fahrzeuge
auf jedem Streckenabschnitt [a, b] aus,
b x=b
0 = d
dt
(x, t) dx + ( v)(x, t) x=a
a
b ∂
b ∂
= ∂t
(x, t) dx + ∂x
( v)(x, t) dx ,
a a
vgl. Bd. 1, § 26 : 6.1. In differentieller Form bedeutet dies
∂ ∂( v)
+ = 0.
∂t ∂x
Wir machen die Modellannahme, dass die Geschwindigkeit v eine monoton fal-
lende Funktion der Dichte ist. Der einfachste Ansatz hierfür ist v = A − B
mit positiven Konstanten A, B.
Legen wir diese Beziehung mit A = 1, B = 12 zugrunde (durch Umskalieren
erreichbar) und schreiben jetzt u statt , so lautet das zugehörige Anfangswert-
problem für die Fahrzeugdichte u
(1 − u)
∂u
∂x
+
∂u
∂t
= 0, u(x, 0) = ψ(x) für x ∈ Ê,
Ê
wobei ψ ∈ C1 ( ) eine gegebene Anfangsdichteverteilung mit 0 < ψ < 1 ist.
Das Anfangswertproblem 1.3 (a),(b) für die Charakteristiken lautet hier
ẋ(τ ) = 1 − y(τ ) , ṫ(τ ) = 1 , ẏ(τ ) = 0 ,

x(0) = s , t(0) = 0 , y(0) = ψ(s) .
Dessen Lösungen sind gegeben durch
X(s, τ ) = (s + τ (1 − ψ(s)), τ ) , Y (s, τ ) = ψ(s) .

Die charakteristischen Projektionen bilden also eine Geradenschar mit Schar-

Ê
parameter s ∈ . Wegen ṫ(τ ) = 1 schneiden diese die x–Achse C transversal.
Nach 1.5 (3) ist die Lösung u des Cauchy–Problems bestimmt durch
u(X(s, τ )) = Y (s, τ ) = ψ(s).
Wir haben also zu gegebenem (x, t) die Gleichung
(x, t) = X(s, τ ) = (s + τ (1 − ψ(s)), τ ),
bzw.
(∗) t = τ, x = s + t(1 − ψ(s))
C1 –differenzierbar nach (s, τ ) aufzulösen. Hierfür muss die Jacobi–Determinante
von X die Auflösebedingung
det(DX(s, τ )) = 1 − τ ψ (s) > 0.
erfüllen, was i.A. nur für kleine |τ | möglich ist.
Wir machen uns für zwei einfache, aber
typische Fälle ein qualitatives Bild vom 6
Verlauf der Lösung: 1
(a) ψ sei auf einem beschränkten In-
tervall I = ]a, b[ streng monoton fallend ψ
und außerhalb von I konstant. x
-
Die Steigungen der in (s, 0) startenden
charakteristischen Projektionen haben -
x
für s ≤ a denselben konstanten Wert;
entsprechendes gilt für s ≥ b. Damit
ergeben sich die charakteristischen Pro- t1
jektionen in der x,t–Ebene wie in der
Figur skizziert ÜA . Die zweite Glei-
t2
chung in (∗) kann für alle (x, t) mit
t ≥ 0 nach s aufgelöst werden. t ?
Die Lösung u ist nach der Bemerkung
1.5 (c) konstant längs jeder charakteri-
stischen Projektion, beschreibt also ei- u
ne nach rechts laufende, mit wachsen- t0
dem t flacher werdende Welle.
In der nebenstehenden Figur sind Wel- u
lenprofile t1
x → u(x, t)
u
für drei Zeiten 0 = t0 < t1 < t2 wie- t2
dergegeben.
(b) ψ sei auf einem beschränkten

Intervall I = ]a, b[ streng monoton stei- 6
gend und außerhalb von I konstant. 1 ψ
Auch hier haben die charakteristischen
Projektionen mit s ≤ a dieselbe kon-
stante Steigung, entsprechendes gilt x
-
für die charakteristischen Projektionen
mit s ≥ b. Jetzt gibt es für t > 0 -
x
Schnittpunkte zwischen ersteren und
letzteren. Die Lösung u(x, t) kann also t1
nicht für alle t > 0 existieren.
Wie der nebenstehende Film“ zeigt,
” t2
bildet sich eine nach rechts wandernde
Welle aus, deren Front mit wachsen-
dem t immer steiler wird. t ?
Wir bestimmen die maximale Lebens-
spanne [0, t∗ [ der Lösung u. t∗ ist also
das Supremum der t > 0, für welche t0
Ê
x → u(x, t) für alle x ∈ existiert und
u
C1 –differenzierbar ist. Es ergibt sich:
Die maximale Lebensspanne ist gegeben t1
u
durch
t∗ = 1/ max ψ , t2
falls ψ positive Werte annimmt, an- u
dernfalls durch t∗ = ∞.
Im Fall t∗ < ∞ entwickelt die Lösung
Singularitäten (blow up), d.h. es gibt
Stellen x∗ ∈ Ê mit
∂u
lim (x, t) = ∞ (Grenz übergang in 0 < t < t∗ ).
(x,t)→(x∗ ,t∗ ) ∂x
Zum Nachweis setzen wir T∗ := 1/ max ψ , falls ψ positive Werte annimmt,

sonst T∗ := ∞ und zeigen T∗ ≤ t∗ . Denn für 0 ≤ t < T∗ gilt 1 − tψ (s) > 0 für
Ê
alle s ∈ . Die Funktion t → x + t(1 − ψ(s)) ist daher streng monoton steigend
und damit auch bijektiv. Durch (∗) ist damit eine C1 –differenzierbare Lösung
des AWP gegeben, d.h. wir erhalten T∗ ≤ t∗ . Für 0 ≤ t < t∗ gilt
u(x, t) = ψ(s) = ψ(x − t(1 − ψ(s))) = ψ(x − t(1 − u(x, t))) ,
also

∂u ∂u ∂u
(x, t) = ψ (s) 1 + t (x, t) bzw. (x, t) 1 − tψ (s) = ψ (s) .
∂x ∂x ∂x
Angenommen, T∗ < t∗ . Dann wählen wir eine Maximumstelle s∗ ∈ Ê

von ψ
und setzen (x∗ , T∗ , s∗ ) in die letzte Gleichung ein. Wir erhalten ∂u/∂x(x∗ , T∗ ) =
∞, im Widerspruch zur Differenzierbarkeit von x → u(x, T∗ ). Somit ist die erste
Behauptung T∗ = t∗ gezeigt. Die zweite ergibt sich durch nochmalige Anwen-
dung der letzten Gleichung auf (x, t, s) nahe (x∗ , t∗ , s∗ ) mit t < t∗ , x∗ =
s∗ + t∗ (1 − tψ(s∗ )), s∗ eine Maximumstelle von ψ .
Die zuletzt betrachteten Punkte (x∗ , t∗ ) sind Brennpunkte, vgl. Bemerkung
1.5 (b). Dieser ist nicht notwendig Schnittpunkt charakteristischer Projektio-
nen, enthält aber in beliebiger Nachbarschaft solche Schnittpunkte.
Aufgabe. Berechnen Sie für die Anfangswerte
⎧
⎨
1
3
für 0 ≤ s ≤ 3,
ψ(s) = 1
+ 1
sin( π8 (s − 7)) für 3 ≤ s ≤ 11,
⎩ 2 6
2
3
für 11 ≤ s ≤ 18
den Brennpunkt der charakteristischer Projektionen, und skizzieren Sie diese
für 0 ≤ x ≤ 18. Es empfiehlt sich, einen nicht zu kleinen Maßstab und in der
Nähe der Maximumstelle s∗ = 7 von ψ eine feine Einteilung der s–Werte zu
wählen.
1.8 Beweis des Existenz– und Eindeutigkeitssatzes

(a) Eindeutigkeit der Lösung. Sei u eine Lösung des Cauchy–Problems auf ei-
ner charakteristischen Umgebung U = X(V) von C oder eines Punktes von C.
Wir bezeichnen die Lösung des AWP
ṗ(t ) = a(p(t), u(p(t))) , p(0) = ϕ(s)
mit t → P(s, t) und setzen Q(s, t) := u(P(s, t)). Dann gilt auf V
∂P

∂Q
∂t
(s, t) = ∇u(P(s, t)) , ∂t
(s, t)
= ∇u(P(s, t)) , a(P(s, t), Q(s, t)) = b(P(s, t), Q(s, t)).
Also löst (P, Q) das charakteristische AWP ebenso wie (X, Y ). Da nach Vor-
aussetzung mit jedem Punkt (s, t) ∈ V die ganze Strecke zwischen (s, t) und
(s, 0) in V liegt, können wir den Eindeutigkeitssatz für autonome Systeme an-
wenden und erhalten
P = X, Q = Y.
Somit gilt u ◦ X = u ◦ P = Q = Y , d.h. u = Y ◦ X−1 in U.
(b) Existenz einer lokalen Lösung. Wir fixieren ξ = ϕ(s0 ) ∈ C (o.B.d.A. s0 =
0). Sei t → (X(s, t), Y (s, t)) die Lösung des charakteristischen AWP
ẋ(t) = a(x(t), y(t)) , ẏ(t) = b(x(t), y(t)) ,
x(0) = ϕ(s) , y(0) = ψ(s) .
Ê
Nach Voraussetzung sind a, b in Ω× und ϕ, ψ in I jeweils C1 –differenzierbar.
Nach der grundlegenden Theorie autonomer Systeme (§ 5 : 1.1) sind X(s, t),
Ê
Y (s, t) in einer Umgebung V0 ⊂ 2 von (0, 0) definiert, eindeutig bestimmt
und C1 –differenzierbar bezüglich beider Variablen (s, t). Es gilt
∂X ∂X
(0, 0) = ϕ (0) , (0, 0) = a(X(0, 0), Y (0, 0)) = a(ξ, f (ξ)) .
∂s ∂t
Wegen der Transversalitätsbedingung 1.4(c) hat die Jacobi–Matrix DX(0, 0)
den vollen Rang 2. Nach dem Umkehrsatz Bd. 1, § 22 : 5.2 gibt es also Umge-
bungen Vξ ⊂ V 0 von (0, 0) und U ξ ⊂ Ω von ξ, die durch X C1 –diffeomorph
aufeinander abgebildet werden. Dabei dürfen wir Vξ als Rechteckumgebung
wählen.
Die Funktion
u := Y ◦ X−1 : U ξ → Ê
ist C –differenzierbar als Hintereinanderausführung eines C1 –Diffeomorphismus
1
und einer C1 –Funktion. Aus u ◦ X = Y auf V ξ folgt

∂
0 = (Y − u ◦ X)(s, t)
∂t
0 1
∂Y ∂X
= (s, t) − ∇u(X(s, t)) , (s, t)
∂t ∂t
= b(X(s, t), Y (s, t)) − ∇u(X(s, t)) , a(X(s, t), Y (s, t))

2
= b(x, u(x)) − ai (x, u(x))∂i u(x)

i=1
für x = X(s, t) ∈ U ξ . Damit erfüllt u die DG

2
ai (x, u) ∂i u = b(x, u) auf U ξ = X(Vξ ),
i=1
und für ξ = ϕ(s) ∈ C ∩ Uξ gilt
u(ξ) = u(ϕ(s)) = u(X(s, 0)) = Y (s, 0) = f (ϕ(s)) = f (ξ).
(c) Verkleben der lokalen Lösungen. Nach (b) gibt es zu jedem Kurvenpunkt
ξ = ϕ(s0 ) ∈ C eine lokale Lösung uξ : U ξ → Ê
des Cauchy–Problems auf
einer charakteristischen Umgebung Uξ ⊂ Ω , dabei ist X : V ξ →: U ξ ein C1 –
Ê
Diffeomorphismus und V ξ ⊂ 2 eine Rechteckumgebung von (s0 , 0). Für zwei
überlappende Umgebungen U ξ , U η ist Uξ ∩ U η im Fall U ξ ∩ U η ∩ C = ∅
wieder eine charakteristische Umgebung, woraus nach (a) uξ = uη auf U ξ ∩U η
folgt. Im Fall Uξ ∩ Uη ∩ C = ∅ können sich die lokalen Lösungen uξ , uη auf
Uξ ∩ Uη widersprechen. Die folgende Figur zeigt beide Möglichkeiten.
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 183
Es lässt sich zeigen, dass die Umgebun-

gen U ξ und Vξ so verkleinert werden
können, dass der zweite Fall nicht ein-
tritt. Setzen wir
2 2
U= Uξ , V= Vξ , C
ξ∈C ξ∈C
so ist U eine charakteristische Umge-

bung von C und X : V → U ein C1 –
Diffeomorphismus. Auf U ist durch
u(x) := uξ (x), falls x ∈ Uξ
widerspruchsfrei eine Lösung u ∈ C 1 (U) des Cauchy–Problems gegeben. Die

Konstruktion einer Überdeckung von C mit verkleinerten Umgebungen erfordert
Argumente aus der Topologie; für Schlüsse dieser Art siehe Bröcker–Jänich
[142]. 2
Aufgaben. Skizzieren Sie bei den folgenden Anfangswertproblemen die cha-

rakteristischen Projektionen, bestimmen Sie ggf. die Brennpunkte und geben
Sie die Lösung an.
(a) −x2 ∂1 u + x1 ∂2 u = 0, Ê
u(x, 1) = ψ(x) mit ψ ∈ C1 ( ),
(b) x1 ∂1 u + x2 ∂2 u = pu, u(x, 1) = ψ(x) mit ψ ∈ C (Ê),

1
wobei p = 0 eine Konstante ist (Eulersche Homogenitätsrelation).

(c) ∂1 u + ∂2 u = u2 , u(x, 0) = ψ(x) mit ψ ∈ C1 ( ). Ê
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0
2.1 Problemstellung
Wir betrachten die allgemeine implizite Differentiallgleichung 1. Ordnung für
Ê
u: n⊃U→ Ê
F (x, u(x), ∇u(x)) = 0 , kurz F (x, u, ∇u) = 0 .
In dieser darf jetzt der Gradient von u nichtlinear auftreten wie z.B. bei der
Eikonalgleichung der geometrischen Optik, die wir im Abschnitt 3 behandeln.
Wie hier die Anfangsbedingungen zu wählen sind, um Existenz und Eindeu-
tigkeit der Lösung zu gewährleisten, liegt nicht unmittelbar auf der Hand. Es
zeigt sich, dass die Lösung im allgemeinen durch Vorgabe ihrer Anfangswerte
auf einer (n − 1)–dimensionalen Untermannigfaltigkeit M noch nicht eindeutig
bestimmt ist. Wir schreiben deshalb auch für den Gradienten Anfangswerte vor:
u = f, ∇u = g auf M.
Dieses Anfangswertproblem lässt sich trotz der allgemeineren Problemstellung
ebenfalls auf die Lösung charakteristischer gewöhnlicher Differentialgleichungen
zurückführen; allerdings muss der Charakteristikenbegriff gegenüber dem quasi-
linearen Fall modifiziert werden. Im Folgenden beschränken wir uns auf die
Betrachtung des dreidimensionalen Falls.
Wir setzen voraus: Ω ist ein Gebiet im 3
Ê
, F ist eine C3 –differenzierbare
Funktion auf Ω × × Ê Ê 3
⊂ 7
Ê
und M ⊂ Ω eine orientierbare C2 –Fläche
(vgl. § 11). Der Einfachheit halber nehmen wir an, dass M durch eine einzige
Ê Ê
Parametrisierung ϕ : 2 ⊃ W → 3, s → ξ = ϕ(s) dargestellt werden kann.
Die Anfangswerte f und g auf M setzen wir als C2 –differenzierbar voraus, d.h.
die Abbildungen
ψ := f ◦ ϕ, χ := g ◦ ϕ
Ê
auf dem Parametergebiet W ⊂ 2 sind im üblichen Sinn C2 –differenzierbar.
Die Variablen von F fassen wir in der Form
(x, y, z) = (x1 , x2 , x3 , y, z1 , z2 , z3 )
zusammen und setzen

∂F ∂F ∂F
∇x F := , , ,
∂x1 ∂x2 ∂x3

∂F ∂F ∂F
∇z F := , , .
∂z1 ∂z2 ∂z3
2.2 Die charakteristischen Gleichungen

Wie im quasilinearen Fall bauen wir auch hier die Lösungsfläche aus Kurven-
scharen auf. Zu deren Bestimmung muss jetzt ein DG–System für Kurven

t → x(t), y(t), z(t) ∈ Ω× Ê×Ê 3
⊂ Ê 7
herangezogen werden, die den erweiterten Graphen“ der Lösung u,

”

(x, u(x), ∇u(x)) x ∈ U ,
auf einer Umgebung U ⊂ Ω von M aufspannen. Das bedeutet die Erfüllung der
folgenden Gleichungen:
(1) y(t) = u(x(t)),
(2) z(t) = ∇u(x(t)),
(3) F (x(t), y(t), z(t)) = 0.

Wir stellen nun Differentialgleichungen für x(t), y(t), z(t) auf, die diese Bedin-
gungen sichern. Wir verlangen
(i) ẋ(t) = ∇z F (x(t), y(t), z(t)) ,
in Übereinstimmung mit dem quasilinearen Fall, bei welchem gilt
F (x, y, z) = a(x, y) , z − b(x, y) , ∇z F (x, y, z) = a(x, y) .
Die weiteren charakteristischen Gleichungen ergeben sich nun ziemlich zwangs-

läufig aus den Forderungen (1),(2),(3): Aus (1) folgt durch Differentiation nach
t die Gleichung ẏ(t) = ∇u(x(t)) , ẋ(t) und wegen (2) und (i)
(ii) ẏ(t) = ∇z F (x(t), y(t), z(t)) , z(t) .
Durch Differentiation von (3) nach t und Einsetzen von (i) und (ii) ergibt sich
0 = d
dt
F (x(t), y(t), z(t)) = ∇x F (. . .) , ẋ(t) + ∂F
∂y
(. . .)ẏ(t) + ∇z F (. . .) , ż(t)
= ∇x F (. . .) , ∇z F (. . .) + ∂F
∂y
(. . .) ∇z F (. . .) , z(t) + ∇z F (. . .) , ż(t)

= ∇x F (. . .) + ∂F
∂y
(. . .) z(t) + ż(t) , ∇z F (. . .) .
Diese Gleichung ist sicher dann erfüllt, wenn

(iii) ż(t) = − ∇x F (x(t), y(t), z(t)) − ∂F
∂y
(x(t), y(t), z(t)) z(t) .
Wir fassen die Gleichungen (i), (ii), (iii) zusammen:

⎧
⎪ ẋ = ∇z F (x, y, z),
⎨
(∗) ẏ = ∇z F (x, y, z) , z ,
⎪
⎩
ż = − ∇x F (x, y, z) − ∂F
∂y
(x, y, z) z .
Das sind die charakteristischen Differentialgleichungen für das Cauchy–

Problem 2.1. Die Lösungen t → (x(t), y(t), z(t)), welche den Anfangswerten
(∗∗) x(0) = ϕ(s) , y(0) = ψ(s) , z(0) = χ(s)
mit einem Startpunkt ξ = ϕ(s) ∈ M für s = (s1 , s2 ) ∈ W ⊂ Ê 2

genügen,
nennen wir wieder Charakteristiken und bezeichnen diese mit
t → (X(s, t), Y (s, t), Z(s, t)).
Die Kurven t → X(s, t) in Ω ⊂ Ê 3

heißen charakteristische Projektionen.
Die Charakteristikenmethode zur Lösung des Cauchy–Problems 2.1 besteht

– in der Aufstellung der Lösungen X(s, t), Y (s, t), Z(s, t) des charakteristischen
Anfangswertproblems.
– und der Bestimmung der Lösung u aus der Gleichung u(X(s, t)) = Y (s, t).
Auch wenn in der letzten Gleichung der Anteil Z(s, t) der Charakteristiken
nicht explizit auftritt, so wirkt dieser doch über die charakteristischen Differen-
tialgleichungen an der Festlegung von X(s, t), Y (s, t) und damit von u mit.
Nur im quasilinearen Fall kommt Z(s, t) in den ersten beiden charakteristischen
DG nicht vor ÜA .
Wir können die Gleichungen für die Charakteristiken folgendermaßen geome-
trisch interpretieren: Sei α(t) die Raumkurve (x1 (t), x2 (t), y(t)) und längs die-
ser das Vektorfeld
n(t) = (z1 (t), z2 (t), −1) = (∂1 u(x(t)), ∂2 u(x(t)), −1) ,
wobei wir (2) benützen. Die Kurve α mit dem angehefteten Vektorfeld n wird
ein charakteristischer Streifen genannt. Nach (∗) gilt
n(t) , α̇(t) = z1 (t)ẋ1 (t) + z2 (t)ẋ2 (t) − ẏ(t) = 0 ,
also steht n(t) im Punkt α(t) sowohl senkrecht auf der Kurve als auch auf
dem Graphen von u. Durch den charakteristischen Streifen ist also ein schmales
Stück des Graphen längs der Kurve α festgelegt. Machen Sie eine Skizze!
Für die geometrische Interpretation der charakteristischen Gleichungen mit Hil-
fe von Monge–Kegeln verweisen wir auf Courant–Hilbert [3], Kap.2, §3, Ga-
rabedian [47] 2.2, Giaquinta–Hildebrandt [152] Ch.10,1.3.
2.3 Bedingungen für die Anfangswerte

Die Anfangswerte für die Lösung des Cauchy–Problems 2.1 können nicht un-
abhängig voneinander gewählt werden. Denn ist u eine Lösung, so gilt die DG
F (x, u, ∇u) = 0 insbesondere auf M , was die Verträglichkeitsbedingung
(a) F (ξ, f (ξ), g(ξ)) = 0 für ξ ∈ M
liefert. Eine weitere Verträglichkeitsbedingung lautet

0 1
∂ψ χ(s) , ∂ϕ (s)
(b) (s) = für s ∈ W, i = 1, 2.
∂si ∂si
Diese ergibt sich aus
0 1
∂ψ ∂ ∂ ∂ϕ
(s) = f (ϕ(s)) = u(ϕ(s)) = ∇u(ϕ(s)) , (s)
∂si ∂si ∂si ∂si
0 1 0 1
∂ϕ χ(s) , ∂ϕ (s) .
= g(ϕ(s)) , (s) =
∂si ∂si
Analog zum quasilinearen Fall 1.4 verlangen wir, dass die charakteristischen
Projektionen die Fläche M nicht tangential schneiden. Dies bedeutet, dass fol-
gende Transversalitätsbedingung gelten soll:
(c) In keinem Punkt ξ ∈ M ist ∇z F (ξ, f (ξ), g(ξ)) Tangentenvektor an M.
2.4 Existenz– und Eindeutigkeitssatz für das allgemeine Cauchy–Pro-

blem
Satz. Gegeben ist das Cauchy–Problem
F (x, u, ∇u) = 0, u = f und ∇u = g auf M,
dessen Daten die Bedingungen 2.3 (a),(b),(c) erfüllen. Dann gibt es eine Um-
gebung U von M , auf der das Cauchy–Problem eine eindeutig bestimmte C2 –
differenzierbare Lösung u besitzt. Diese ergibt sich aus der Gleichung
u(X(s, t)) = Y (s, t),
wobei (X(s, t), Y (s, t), Z(s, t)) die durch 2.2 (∗),(∗∗) bestimmte Charakteristi-
kenschar ist.
Bemerkung. Die Aussage des Satzes und die Gestalt der charakteristischen
Gleichungen bleiben für n > 3 richtig, wenn M durch eine orientierbare (n − 1)–
dimensionale C2 –Untermannigfaltigkeit M ⊂ Ω ersetzt wird.
Beweis.
(a) Eindeutigkeit der Lösung. Sei u eine C2 –Lösung des Cauchy–Problems auf
einer charakteristischen Umgebung U von M oder von einem Punkt auf M , vgl.
1.4. Wir behaupten
u(X(s, t)) = Y (s, t) für (s, t) ∈ V.
Zum Nachweis betrachten wir die Lösung t → P(s, t) des AWP
ṗ = ∇z F (p, u(p), ∇u(p)), p(0) = ϕ(s) ,
und setzen Q(s, t) := u(P(s, t)), R(s, t) := ∇u(P(s, t)). Dann gilt auf V
(1) Ṗ = ∇z F (P, Q, R) ,

(2) Q̇ = ∇u(P) , Ṗ = R , ∇z F (P, Q, R) .
Für die Komponenten Ri von R erhalten wir

3
∂2u
3
∂2u ∂F
Ṙi = (P) Ṗk = (P) (P, Q, R) .
∂xk ∂xi ∂xi ∂xk ∂zk
k=1 k=1
Aus F (x, u(x), ∇u(x)) = 0 für x = P(s, t) ergibt sich
∂F ∂F ∂u ∂F 3
∂2u
(P, Q, R) + (P, Q, R) (P) + (P, Q, R) (P) = 0
∂xi ∂y ∂xi ∂zk ∂xi ∂xk
k=1
also folgt
∂F ∂F
(3) Ṙi = − (P, Q, R) − (P, Q, R) Ri .
∂xi ∂y
Somit erfüllen P, Q, R die charakteristischen Differentialgleichungen mit den
Anfangswerten
P(s, 0) = ϕ(s) = X(s, 0) , Q(s, 0) = u(ϕ(s)) = f (ϕ(s)) = Y (s, 0),
R(s, 0) = ∇u(ϕ(s)) = g(ϕ(s)) = Z(s, 0).
Aus dem Eindeutigkeitssatz für autonome Systeme ergibt sich
P(s, t) = X(s, t) , Q(s, t) = Y (s, t) , R(s, t) = Z(s, t) für (s, t) ∈ V,

somit
u(X(s, t)) = u(P(s, t)) = Q(s, t) = Y (s, t) für (s, t) ∈ V.
(b) Existenz von lokalen Lösungen. Wir fixieren ξ 0 = ϕ(s0 ) ∈ M mit s0 ∈ W.

Wegen der C3 –Differenzierbarkeit von F sind die rechten Seiten der charakteri-
stischen Gleichungen 2.2 (∗) C2 –differenzierbar. Die rechten Seiten der Anfangs-
bedingungen 2.2 (∗∗)
X(s, 0) = ϕ(s), Y (s, 0) = ψ(s), Z(s, 0) = χ(s)
sind ebenfalls C2 –differenzierbar. Nach der grundlegenden Theorie autonomer

Systeme sind die Lösungen X, Y, Z des charakteristischen AWP C2 –differenzier-
bar auf V .
Aus der Transversalitätsbedingung 2.3 (c) ergibt sich nun wie im Beweisteil (b)
von 1.8, dass (s, t) → X(s, t) nach Einschränkung auf eine geeignete Zylinder-
umgebung V ⊂ W × Ê von (s0 , 0) ein C2 –Diffeomorphismus von V auf eine
charakteristische Umgebung U = X(V) von ξ0 ist (mit Zylinderumgebung mei-
nen wir: jeder Punkt (s, t) ∈ V kann mit (s, 0) durch eine ganz in V verlaufende
Strecke verbunden werden). Dann ist die Funktion
u := Y ◦ X−1 : U → Ê
C –differenzierbar als Hintereinanderausführung einer C2 –Funktion und eines
2
C2 –Diffeomorphismus.
Wir zeigen nun für (s, t) ∈ V
(i) F (X(s, t), Y (s, t), Z(s, t)) = 0 ,
(ii) Z(s, t) = ∇u(X(s, t)).
Ist dies nachgewiesen, so ist u eine Lösung des Cauchy–Problems auf U. Denn
für x = X(s, t) ∈ U gilt u(x) = Y (s, t), also
F (x, u(x), ∇u(x)) = F (X(s, t), Y (s, t), Z(s, t)) = 0,
und für ξ = ϕ(s) = X(s, 0) ergibt sich
u(ξ) = u(X(s, 0)) = Y (s, 0) = f (ϕ(s)) = f (ξ),
∇u(ξ) = Z(s, 0) = g(ϕ(s)) = g(ξ).
Nachweis von (i). Die charakteristischen Gleichungen sind gerade so gewählt

worden, dass t → F (X(s, t), Y (s, t), Z(s, t)) konstant ist, vgl. 2.2. Die Konstan-
te ist nach 2.3 (a)
F (X(s, 0), Y (s, 0), Z(s, 0)) = F (ϕ(s), f (ϕ(s)), g(ϕ(s))) = 0.
Nachweis von (ii). Die Jacobi–Matrix DX(s, t) hat Rang 3, da X : V → U ein

Diffeomorphismus ist. Also sind die Vektoren ∂s1 X(s, t), ∂s2 X(s, t), ∂t X(s, t)
an jeder Stelle (s, t) ∈ V linear unabhängig. Für (ii) reicht es deshalb zu zeigen,
dass
Ai := ∇u(X) − Z , ∂si X = 0 (i = 1, 2), B := ∇u(X) − Z , ∂t X = 0.
Aus den charakteristischen Gleichungen folgt unter Beachtung der C2 –Differen-
zierbarkeit von X, Y, Z
Ai = ∂si (u ◦ X) − Z , ∂si X = ∂si Y − Z , ∂si X ,
also
∂t Ai = ∂t ∂si Y − ∂t Z , ∂si X − Z , ∂t ∂si X
= ∂si ∂t Y − ∂t Z , ∂si X − Z , ∂si ∂t X
= ∂si ∇z F (. . .) , Z + ∇x F (. . .) + ∂y F (. . .) Z , ∂si X
− Z , ∂si ∂t X
= ∂si ∇z F (. . .) , Z + ∇z F (. . .) , ∂si Z
+ ∇x F (. . .) + ∂y F (. . .) Z , ∂si X − Z , ∂si ∇z F (. . .)
= ∂si [F (. . .)] − ∂y F (. . .) Ai = 0 − ∂y F (. . .) Ai ,
wobei in der letzten Gleichung die Identität (i) verwendet wurde. Weiter gilt
wegen der Verträglichkeitsbedingung 2.3 (b)
Ai (s, 0) = ∂si Y (s, 0) − Z(s, 0) , ∂si X(s, 0)
= ∂si (f ◦ ϕ)(s) − g(ϕ(s)) , ∂si ϕ(s) = 0.
Dieses AWP besitzt also die Lösung

t
Ai (s, t) = Ai (s, 0) exp − ∂y F (. . .) dτ = 0 für (s, t) ∈ V.
0
Das Verschwinden von B ergibt sich aus der Beziehung
Z , ∂t X = Z , ∇z F (X, Y, Z) = ∂t Y = ∂t (u ◦ X) = ∇u(X) , ∂t X .
(c) Das Verkleben der lokalen Lösungen erfolgt wie im Beweisteil (c) von 1.8.
2
Bemerkung. Bei gegebener Startfläche M und gegebenen Anfangswerten f auf

M lassen die Verträglichkeitsbedingungen 2.3 (a),(b) wenig Wahlmöglichkeiten
für g. Bei festem ξ = ϕ(s) ∈ M ist 2.3 (b) eine lineare Gleichung mit eindi-
mensionalem Lösungsraum, d.h. einer Geraden. Durch die Bedingung 2.3 (a)
bleiben auf dieser Geraden nur einzelne Punkte übrig. Tritt z.B. in der DG
F (x, u, ∇u) = 0 der Gradient von u nur in der Form ∇u auf, sind dies zwei;
das ist z.B. bei der Eikonalgleichung für isotrope Medien der Fall.
Im quasilinearen Fall ist g(ξ) erwartungsgemäß eindeutig festgelegt, weil hier
∇u linear in die Differentialgleichung eingeht und die Gleichungen 2.3 (a),(b)
wegen 2.3 (c) zusammen Rang 3 haben ÜA .
2.5 Aufgabe
Lösen Sie das Cauchy–Problem
(∂1 u)2 − (∂2 u)2 = 1
mit den Anfangswerten f (ξ) = aξ1 auf der Ebene M = {ξ ∈ Ê 3

| ξ2 = 0},
wobei a > 1 eine gegebene Konstante ist.
Hinweis: Verwenden Sie die Funktion
F (x, y, z) = z1 z1 − z2 z2 − 1
Zeigen Sie, dass die Bedingungen 2.3 (a), 2.3 (b) nur die beiden Werte ∇g(ξ) =
(a, b, 0) auf M mit a2 − b2 = 1 erlauben.
Als Lösung ergibt sich u(x) = ax1 + bx2 .
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung 191
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung

3.1 Grundprinzipien der geometrischen Optik
Die Ausbreitung des Lichts kann unter zwei Gesichtspunkten beschrieben wer-
den: Licht als Welle, wobei das Huygenssche Prinzip zugrundegelegt ist und Be-
wegung von Lichtpartikeln längs Strahlen, die dem Fermatschen Prinzip genü-
gen. Den Formalismus, der beide Standpunkte verbindet, und seine Übertragung
auf die Mechanik verdanken wir Sir William Rowan Hamilton. Wir beschreiben
diesen Formalismus in einer Notation, welche die Analogie zur Mechanik erken-
nen lässt. Für die mathematische Begründung der im Folgenden geschilderten
Zusammenhänge verweisen wir auf Bd. 3, § 5, Abschnitte 2 und 3. Uns kommt
es hier darauf an, die Beziehungen zur Charakteristikentheorie herzustellen.
Ê
Wir betrachten in einem Gebiet Ω ⊂ 3 ein optisches Medium mit orts– und
richtungsabhängigem Brechungsindex n(q, v), d.h. die Geschwindigkeit auf ei-
nem Lichtstrahl durch den Punkt q in Richtung v (v = 1) ist 1/n(q, v)
(Lichtgeschwindigkeit c im Vakuum = 1 gesetzt).
Wir nehmen an, dass n(q, v) bezüglich der Geschwindigkeitsvariablen v punkt-
symmetrisch ist, n(q, −v) = n(q, v). Die in der Geschwindigkeitsvariablen 1–
homogene Fortsetzung L von n ist gegeben durch
L(q, v) := n(q, v/v) v für v = 0 und L(q, 0) := 0.
Von dieser Lagrange–Funktion fordern wir, dass das Quadrat L2 auf Ω × 3 Ê

C3 –differenzierbar und die Hesse–Matrix Lvv (q, v) für v = 0 positiv definit
Ê Ê
ist. Dann ist die Menge {v ∈ 3 | v ∈ 3 mit L(q, v) < 1} beschränkt, strikt
konvex, und für die Hamilton–Funktion

H(q, p) = max p, v | v ∈ Ê 3
mit L(q, v) = 1
ist das Quadrat H(q, p)2 ebenfalls auf Ω × Ê 3

C3 –differenzierbar. Es besteht
die Eulersche Homogenitätsrelation
H(q, p) = ∇p H(q, p) , p ,
weil wegen der 1–Homogeneität von L bezüglich der v–Variablen auch die
Hamilton–Funktion H 1–homogen bezüglich der p–Variablen ist.
Die Punktsymmetrie von n überträgt sich auf L und H:
L(q, −v) = L(q, v) und H(q, −p) = H(q, p).
ÜA Veranschaulichen Sie sich die Konstruktion der Hamilton–Funktion, indem

Sie eine Tangentialebene senkrecht zu p an die geschlossene (= kompakte) und
Ê Ê
strikt konvexe Fläche {v ∈ 3 | v ∈ 3 mit L(q, v) = 1} legen und den
Abstand dieser Stützebene zum Ursprung bestimmen.
ÜA Für ein isotropes Medium mit richtungsunabhängigem Brechungsindex

n(q) ergibt sich L(q, v) = n(q)v, H(q, p) = p/n(q).
Die Ausbreitung des Lichts außerhalb von Brennpunkten erfolgt längs Wellen-
fronten und Lichtstrahlen gemäß den folgenden Prinzipien der geometrischen
Optik (t sei im Folgenden die Zeitkoordinate):
(1) Die Wellenfronten sind die Niveauflächen
{S = t} = {q ∈ Ω | S(q) = t }
einer C1 –Funktion S : Ω → Ê, die der Eikonalgleichung

H(q, ∇S(q)) = 1 für q ∈ Ω
genügt. Eine solche Funktion wird ein Eikonal der betrachteten Lichtausbrei-
tung genannt.
(2) Die Lichtstrahlen t → q(t) gehorchen zusammen mit ihrem Wellen-
vektorfeld t → p(t) := ∇v L(q(t), q̇(t)) den kanonischen (Hamiltonschen)
Gleichungen
q̇(t) = ∇p H(q(t), p(t)), ṗ(t) = − ∇q H(q(t), p(t)).
(3) Wellenfronten und Lichtstrahlen sind korreliert durch die optische Trans-
versalitätsbedingung
p(t) = ∇S(q(t)).
Als Folgerung aus (1),(2),(3) ergibt sich

d
dt
S(q(t)) = ∇S(q(t)) , q̇(t) = p(t) , ∇p H(q(t), p(t))
= H(q(t), p(t)) = H(q(t), ∇S(q(t))) = 1.
Dies bedeutet die optische Äquidistanz der Wellenfronten: Für je zwei Zeitpunk-
te t0 < t1 benötigt ein Lichtstrahl t → q(t) die gleiche Zeit t1 − t0 , um von der
Front {S = t0 } zur Front {S = t1 } zu gelangen:
t1 t1
S(q(t1 )) − S(q(t0 )) = d
dt
S(q(t)) dt = 1 dt = t1 − t0 .
t0 t0
Wegen dieser Eigenschaft wird das Eikonal S auch optische Distanzfunktion

genannt.
Bemerkungen. (i) Die Eikonalgleichung ist nichts anderes als die differenti-
elle Fassung des Huygensschen Prinzips. Dies machen wir in 3.2 plausibel. Im
Fall eines isotropen Mediums lautet die Eikonalgleichung
∇S(q) = n(q) .
Hieran sehen wir, wie der ortsabhängige Brechungsindex das Fortschreiten der
Wellenfronten steuert: An einer Stelle q mit kleiner (großer) Ausbreitungsge-
schwindigkeit des Lichts 1/n(q) ist n(q) = ∇S(q) groß (klein), die Wellen-
fronten rücken nahe q zusammen (auseinander).
(ii) Die kanonischen Gleichungen fol-
gen aus dem Fermatschen Prinzip, nach {S = t}
welchem sich jeder Lichtstrahl zwischen
zwei eng benachbarten Punkten q0 , q1 Licht–
auf einer Bahn kürzester Laufzeit be- strahlen
wegt. Näheres hierzu in 3.3.
q̇(t)
(iii) Die optische Transversalitätsbedin-
gung besagt, dass der Wellenvektor p(t)
eines Lichtstrahls im Punkt q(t) senk- q(t)
p(t) =
recht auf der Wellenfront {S = t} ∇S(q(t))
steht; für den Geschwindigkeitsvektor
q̇(t) trifft das i.A. nicht zu. Im Fall
eines isotropen Mediums sind aller-
dings q̇(t) und p(t) gleichgerichtet; hier 3 45 6
schneiden sich Lichtstrahlen und Wel- Wellenfronten
lenfronten senkrecht ÜA .
3.2 Huygenssches Prinzip und Eikonalgleichung

Nach der Wellentheorie von Huygens
breitet sich Licht längs Wellenfronten
aus, die wir in Abhängigkeit von der
Zeit t durch Niveauflächen
{S = t} = {q ∈ Ω | S(q) = t}
einer C1 –Funktion S auf Ω ⊂ 3 be- Ê

schreiben. Dabei ist der Ausbreitungs-
Eτ (q)
prozeß durch folgende Vorschrift fest-
gelegt: Die Punkte q einer gegebe- q
nen Wellenfront {S = t} sind Aus-
gangspunkte von Elementarwellen-
{S = t − τ } {S = t} {S = t + τ }
fronten Eτ (q), welche von den be-
nachbarten Wellenfronten {S = t + τ }
und {S = t − τ } für 0 < τ 1 eingehüllt werden (Fig.). In erster Näherung
besteht die Elementarwellenfront Eτ (q) für 0 < τ 1 aus denjenigen Punkten
q + v , die von q die Lichtzeitdistanz τ = L(q, v) besitzen:
Eτ (q) ≈ {q + v | v ∈ Ê 3
mit L(q, v) = τ }
= {q + τ w | w ∈ Ê 3
mit L(q, w) = 1} .
Da nach 3.1 die Elementarwellenfront Eτ (q) kompakt und konvex gekrümmt

ist, trifft diese die beiden Wellenfronten jeweils in genau einem Punkt. Wir
machen plausibel, dass als Folge dieses Huygensschen Prinzips die Funktion S
der Eikonalgleichung genügt.
Hierzu fixieren wir einen Punkt q0 und
setzen t = S(q0 ). Nach dem Huygens-
schen Prinzip berührt die Elementar- Eτ (q0 )
wellenfront für 0 < τ 1 qτ
∇S(qτ )
Eτ (q0 ) = {q0 + v | L(q0 , v) = τ }
die Wellenfront { q | S(q) = t + τ } an q0
genau einer Stelle qτ = q0 + vτ :
L(q0 , vτ ) = τ ,
S(qτ ) = t + τ ,
∇S(qτ ) ∇v L(q0 , vτ ) .
Wegen τ = S(qτ ) − S(q0 ) = S(q0 + vτ ) − S(q0 ) ≈ ∇S(qτ ) , vτ ist die

gemeinsame Tangentialebene in erster Näherung gegeben durch

q0 + v v ∈ Ê3
mit ∇S(qτ ), v = τ .
Dass dabei Eτ (q0 ) ganz auf einer Seite dieser Ebene liegt, bedeutet
τ = ∇S(qτ ) , vτ

= max ∇S(qτ ) , v v ∈ Ê3
mit L(q0 , v) = τ

= max ∇S(qτ ) , τ w w ∈ Ê3
mit L(q0 , w) = 1
bzw.

1 = max ∇S(qτ ) , w w ∈ Ê 3
mit L(q0 , w) = 1 .
Für τ → 0 strebt qτ gegen q0 , also ergibt sich nach der Definition der Hamilton–
Funktion H in 3.1 die Eikonalgleichung an der Stelle q0
H(q0 , ∇S(q0 )) = 1.
3.3 Fermatsches Prinzip und kanonische Gleichungen

Für jede Kurve C = {q(s) | s0 ≤ s ≤ s1 } im optischen Medium mit Brechungs-
index n beträgt die Laufzeit zwischen den Punkten q0 = q(s0 ) und q1 = q(s1 )
s1
Tss01 (q) = dt = ds
v
= n ds = L(q(s), q̇(s)) ds .
C C C s0
Das Fermatsche Prinzip besagt, dass sich Lichtteilchen auf Bahnen t → q(t) be-
wegen, für die die Laufzeit zwischen je zwei hinreichend banachbarten Punkten
q0 , q1 minimal ist (verglichen mit der Laufzeit von Vergleichskurven zwischen

diesen Punkten). Äquivalent zu dieser Minimumeigenschaft sind die normalen
Euler–Lagrange–Gleichungen
d
∇v L(q(t), q̇(t)) = ∇q L(q(t), q̇(t)), L(q(t), q̇(t)) = 1,
dt
und die normalen kanonischen (Hamiltonschen) Gleichungen für q(t)

und p(t) = ∇v L(q(t), q̇(t)),
q̇(t) = ∇p H(q(t), p(t)), ṗ(t) = − ∇q H(q(t), p(t)), H(q(t), p(t)) = 1,
vgl. Bd. 3, § 5, Abschnitte 1.3(c), 2.5, 2.7.
3.4 Das Cauchy–Problem für die Eikonalgleichung

(a) Zunächst stellen wir den engen Zusammenhang zwischen Lichtstrahlen (au-
ßerhalb von Brennpunkten) und den Charakteristiken der Eikonalgleichung dar.
Ê
Im Raumgebiet Ω ⊂ 3 eines optischen Mediums mit Hamilton–Funktion
H(q, p) geben wir als Lichtquelle eine Fläche M vor. Wir fassen M als eine Wel-
lenfront in einer Schar von Wellenfronten {S = t} auf, o.B.d.A. M = {S = 0}.
Wir betrachten das Cauchy–Problem für die Eikonalgleichung
H(q, ∇S(q)) = 1, S = 0 auf M.
Wie in 2.1 nehmen wir die Fläche M als C2 –differenzierbar und orientierbar an.
Ê Ê
Wir verwenden jetzt die Notation (q, y, p) ∈ Ω × × 3 anstelle von (x, y, z)
und setzen
1
F (q, y, p) := 2 (H(q, p)
2
− 1).
Es gilt dann
∇q F = H∇q H, ∂y F = 0 , ∇p F = H∇p H.
Hieraus ergibt sich: Erfüllt S die Eikonalgleichung
H(q, ∇S(q)) = 1
mit S = 0 auf M , und ist t → q(t) ein zugehöriger Lichtstrahl mit Wellenvek-
torfeld t → p(t), d.h. gilt
q̇(t) = ∇p H(q(t), p(t)) , ṗ(t) = − ∇q H(q(t), p(t)) , H(q(t), p(t)) = 1

und q(0) ∈ M , so folgt mit y(t) := S(q(t))

q̇(t) = ∇p F (q(t), y(t), p(t)),
ẏ(t) = ∇S(q(t)) , q̇(t) = p(t) , q̇(t) = p(t) , ∇p F (q(t), y(t), p(t)) ,
ṗ(t) = − ∇q F (q(t), y(t), p(t)),
und
q(0) ∈ M, y(0) = S(q(0)) = 0,
d.h. t → (q(t), y(t), p(t)) ist eine Charakteristik von F . Umgekehrt sei t →
(q(t), y(t), p(t)) eine Charakteristik von F mit H(q(0), p(0)) = 1. Dann gilt
nach Beweisteil (b) in 2.4 F (q(t), y(t), p(t)) = 0 und damit H(q(t), p(t)) = 1
für alle t. Hieraus ergeben sich unmittelbar die Gleichungen der Lichtstrahlen.
Als Anwendung des Hauptsatzes 2.4 zeigen wir den
(b) Satz. Für jede orientierbare C2 –Fläche M ⊂ Ω hat das Cauchy–Problem
für die Eikonalgleichung,
H(q, ∇S(q)) = 1, S = 0 auf M,
in einer Umgebung von M genau zwei, sich nur durch das Vorzeichen unter-
scheidende Lösungen ± S.
Jede beliebige orientierbare Fläche erzeugt also eine (bis auf die Zeitorientie-
rung) eindeutig bestimmte Lichtausbreitung längs Wellenfronten und Licht-
strahlen. Dass ein Vorzeichenwechsel des Eikonals ein Wechsel der Zeitorientie-
rung bedeutet, ergibt sich aus der Beziehung S(q(t)) = t , welche unmittelbar
d
aus der in 3.1 abgeleiteten Relation dt S(q(t)) = 1 zusammen mit S(q(0)) = 0
folgt.
Zum Beweis haben wir die Voraussetzungen des Hauptsatzes der gegebenen
Situation anzupassen, d.h. wir müssen den Anfangswerten f = 0 für das Eikonal
S auf M noch Anfangswerte g für den Gradienten ∇S auf M hinzufügen. Die
Verträglichkeitsbedingungen 2.3(a),(b) legen das Vektorfeld g und damit die
Lösung S des Cauchy–Problems bis auf das Vorzeichen fest:
Die Verträglichkeitsbedingungen 2.3(b) liefern
0 1
∂ ∂ϕ
0 = f (ϕ(s)) = g(ϕ(s)) , (s) für s ∈ W, i = 1, 2,
∂si ∂si
d.h. g muss ein Normalenfeld auf der Fläche M sein. Die Bedingung 2.3(a),
H(ξ, g(ξ)) = 1 für ξ ∈ M,
wird für jeden Punkt ξ ∈ M durch genau zwei entgegengesetzt gleiche Vektoren
± g(ξ) erfüllt, was sich aus der Punktsymmetrie von H in 3.1 ergibt. Damit
bleiben wegen der Orientierbarkeit von M genau zwei Möglichkeiten für die
Wahl von g. Die Transversalitätsbedingung 2.3(c) ist erfüllt, denn wegen
∇p F (ξ, 0, g(ξ)) , g(ξ) = ∇p H(ξ, g(ξ)) , g(ξ) = H(ξ, g(ξ)) = 1
ist ∇p F (ξ, 0, g(ξ)) kein Tangentenvektor von M an der Stelle ξ ∈ M . Der

Existenz– und Eindeutigkeitssatz 2.4 sichert für jedes der beiden Normalenfelder
die eindeutige Lösbarkeit des Cauchy–Problems.
Beispiel. Wir betrachten das Cauchy–Problem für ein optisches Medium mit
konstantem Brechungsindex n (L(q, v) = n v, H(q, p) = n−1 p nach 3.1)
∇S = n , S = 0 auf M.
Wir vervollständigen die Anfangsdaten durch Wahl eines Normalenfeldes g mit

g = n auf der gegebenen Fläche M und setzen
1
F (q, y, p) := 2 (p2 − n2 ) .
Es gilt dann
∇q F = 0 , ∂y F = 0 , ∇p F = p ,
und das charakteristische AWP lautet mit den Bezeichnungen von 2.1, 2.4
q̇(t) = p(t) , ẏ(t) = p(t)2 = n2 , ṗ(t) = 0 ,
q(0) = ϕ(s) , y(0) = 0 , p(0) = χ(s) := g(ϕ(s)) .
Dieses hat die Lösung
Q(s, t) = ϕ(s) + t χ(s) , Y (s, t) = n2 t, P(s, t) = χ(s) .
Die charakteristischen Projektionen, also die Lichtstrahlen t → Q(s, t) sind

Geraden. Die Abbildung Q liefert nach Einschränkung auf eine hinreichend
Ê
kleine Umgebung V ⊂ 3 von W × {0} einen C2 –Diffeomorphismus zwischen V
und einer charakteristischen Umgebung U ⊂ Ω von M . Das Eikonal S ist auf
U definiert durch S = Y ◦ Q−1 ; die explizite Bestimmung von S als Funktion
von q ist ohne Interesse. Für je zwei Wellenfronten
{S = t0 } = {Q(s, t0 ) = ϕ(s) + t0 χ(s) | s ∈ W},
{S = t1 } = {Q(s, t1 ) = ϕ(s) + t1 χ(s) | s ∈ W},
und kleine τ = |t1 − t0 |/n > 0 wird der Abstand τ von zwei Punkten Q(s, t0 )
und Q(s, t1 ) durch das Lichtstrahlsegment {Q(s, t) | t0 ≤ t ≤ t1 } realisiert.
Das bedeutet die Gültigkeit des Huygensschen Prinzips: Jede Elementarwellen-
front Eτ (q) = {q + v | L(q, v) = nτ } = {q + v | v = τ } mit Mittelpunkt
q = Q(s, t0 ) auf der Wellenfront {S = t0 } berührt die Wellenfront {S = t1 }
genau im Punkt Q(s, t1 ).
Literatur: Arnold [151] 46, Giaquinta–Hildebrandt [152] Ch.8, Ch.10.
3.5 Zur Geschichte

(a) Die Charakteristikenmethode geht auf Lagrange zurück. Nachdem er 1772
die nichtlineare DG ∂u∂y
= f (x, y, u, ∂u
∂x
) auf eine quasilineare DG zurückgeführt
und 1774 eine Theorie für die allgemeine Lösung aufgestellt hatte, gab er 1779
Differentialgleichungen für die Charakteristiken quasilinearer Probleme an. Ei-
ne geometrische Begründung der Charakteristikenmethode fand 1784 Gaspard
Monge. Pfaff 1815 und Cauchy 1819 erweiterten diese für n > 2.
(b) Nach der Erfindung des Fernrohrs 1609 setzte neues Interesse an der geo-
metrischen Optik ein. Descartes führte das Brechungsgesetz auf einfache, al-
lerdings unzutreffende Prinzipien zurück (Discours de la Méthode 1637). Über
diese kam es zu einer langen Auseinandersetzung zwischen Fermat und den
Cartesianern, in deren Verlauf Fermat 1662 das Prinzip der kürzesten Lauf-
zeit aufstellte. (Das Prinzip des kürzesten Lichtwegs benützte schon Heron
von Alexandria um 66 n. Chr. zur Erklärung der Reflexion.) In seiner Traité
de la Lumière stellte Huygens 1678 das nach ihm benannte Prinzip auf und
erklärte damit Reflexion, Brechung, Ablenkung in inhomogenen Medien und die
Doppelbrechung beim (anisotropen) Islandspat. Bedeutende Beiträge zur Optik
leistete Newton (Opticks 1704: Farbenlehre, Dispersion, Theorie der Newton-
ringe). Er vertrat die Korpuskeltheorie und glaubte wie Descartes, dass die
Geschwindigkeit im optisch dichteren Medium größer sei. In den Principia 1687
versuchte er eine mechanische Herleitung des Brechungsgesetzes.
Mit der Entwicklung der Differential– und Integralrechnung wurde es möglich,
Variationsprobleme wie das der kürzesten Laufzeit anzugehen. Den Anstoß gab
Johann Bernoulli 1696 mit dem Brachistochronenproblem: Gesucht ist die
Verbindungskurve zwischen zwei festen Punkten, auf der ein Massenpunkt in
kürzester Zeit reibungsfrei hinabgleitet. Er löste es durch Zurückführung auf
ein optisches Problem (Brechungsindex umgekehrt proportional zur Wurzel aus
der Höhe) und stellte dabei den Zusammenhang zwischen Huygensschen Wel-
lenfronten und den durch das Fermat–Prinzip gegebenen Lichtstrahlen heraus.
Hamiltons Theorien der Optik (On Systems of Rays . . . ) und der Mechanik
entstanden in den zwanziger Jahren des 19. Jahrhunderts; 1833/34 erschienen
die Abhandlungen On a General Method of Expressing the Paths of Light, and
the Planets, by the Coefficients of a Characteristic Function und On a General
Method on Dynamics . . . . In diesen Arbeiten finden wir die oben geschilder-
ten Konzepte vorgezeichnet und angewandt. Die erste Arbeit blieb auf dem
Kontinent bis zur Jahrhundertwende unbekannt, so dass ähnliche Ergebnisse
von anderen Autoren publiziert wurden (z.B. Bruns 1895). Die zweite der ge-
nannten Arbeiten von Hamilton wurde 1866 von Jacobi in neu gefasster und
gestraffter Form der Öffentlichkeit zugänglich gemacht.
Für Erwin Schrödinger waren 1926 die klassische Wellentheorie und die Ha-
milton–Jacobi–Gleichung als mechanisches Analogon zur Eikonalgleichung An-
knüpfungspunkte für die Aufstellung der stationären Schrödinger–Gleichung der
neuen Wellenmechanik.
4 Systeme von Differentialgleichungen erster Ordnung 199
4 Systeme von Differentialgleichungen erster Ordnung

Gesucht sind C2 –differenzierbare Lösungen u = (u1 , . . . , un ) : Ê m
⊃U→ Ên
des Systems
∂uα
= fiα (x, u) (i = 1, . . . , m, α = 1, . . . , n).
∂xi
Dabei sind die fiα gegebene Cr –Funktionen auf Ω × Ê , wobei
n
Ω⊂ Êm
ein
Gebiet und r ≥ 2 ist.
Notwendig für die Existenz einer Lösung sind die Integrabilitätsbedingun-
gen

m
∂fkα ∂fiα ∂fkα ∂fiα
− + fiβ − fkβ = 0
∂xi ∂xk ∂uβ ∂uβ
β=1
für alle α, i, k mit i = k. Diese ergeben sich unmittelbar aus der Relation
∂i ∂k u = ∂k ∂i u ÜA .
Satz (Frobenius 1877). Sind die Integrabilitätsbedingungen erfüllt, so hat für

Ê
jeden Punkt (a, b) ∈ Ω × n das Anfangswertproblem
∂uα
(∗) = fiα (x, u), u(a) = b
∂xi
in einer Umgebung von a eine eindeutig bestimmte Cr+1 –differenzierbare Lö-
sung.
Dieser Satz hat eine wichtige Anwendung in der Differentialgeometrie.
Beweis und Lösungsverfahren

O.B.d.A. sei a = 0.
(a) Ist u eine Lösung von (∗) auf einer sternförmigen Nullpunktsumgebung U
(d.h. x ∈ U =⇒ tx ∈ U für 0 ≤ t ≤ 1), so löst y(t) := u(tx) das AWP

m
(∗∗) ẏ α (t) = fkα (tx, y(t)) xk (α = 1, . . . , n) , y(0) = b .
k=1
ÜA . Wegen des Eindeutigkeitssatzes für (∗∗) ist daher u eindeutig bestimmt.
(b) Sei umgekehrt t → y(t, x) die Lösung des vom Parameter x abhängigen
AWP (∗∗). Dann existiert y(t, 0) für alle t, und es gilt y(t, 0) = b. Nach der
allgemeinen Theorie (§ 2 : 7.2 in Verbindung mit § 2 : 7.4 (c)) gibt es eine – gleich
sternförmig gewählte – Nullpunktsumgebung U, so dass für alle x ∈ U das Exi-
stenzintervall von y(t, x) das Intervall [0, 1] umfaßt; ferner ist y(t, x) bezüglich
der Variablen t, x C2 –differenzierbar wegen r ≥ 2.
Wir zeigen, dass
u(x) := y(1, x)
eine Cr –differenzierbare Lösung von (∗) liefert. Dazu betrachten wir

∂y α
ziα (t, x) = (t, x) − t fiα (tx, y(t, x)) .
∂xi
∂ 2yα ∂ 2yα
Da y α (0, x) konstant ist, gilt ziα (0, x) = 0 für x ∈ U. Wegen =
∂t∂xi ∂xi ∂t
erhalten wir ferner
∂ziα ∂ 2 yα ∂ α
(t, x) = − tfi (tx, y(t, x))
∂t ∂xi ∂t ∂t
∂ α
m
∂ α
= fk (. . .)xk − fiα (. . .) − t fi (. . .)
∂xi ∂t
k=1

m
∂fkα
n
∂fkα ∂y β
= t (. . .) + (. . .) (t, x) xk
∂xi ∂uβ ∂xi
k=1 β=1

m
∂f α
n
∂f α ∂y β
−t i
(. . .) xk + i
(. . .) (t, x)
∂xk ∂uβ ∂t
k=1 β=1

m
∂f α ∂fiα
n
∂fiα
m
= t k
(. . .) − (. . .) xk + (. . .) fkβ (. . .) xk
∂xi ∂xk ∂uβ
k=1 β=1 k=1
∂f α
n m

+ k
(. . .) ziβ (t, x) + t fiβ (. . .) xk .
∂uβ
β=1 k=1
Berücksichtigen wir jetzt die Integrabilitätsbedingungen, so bleibt
∂ziα
n

m
∂fkα
(t, x) = (tx, y(t, x)) ziβ (t, x).
∂t ∂uβ
β=1 k=1
Dies ist ein homogenes lineares System gewöhnlicher DG für zi = (zi1 , . . . , zin ).
Wegen ziα (0, x) = 0 folgt nach dem Eindeutigkeitssatz § 3 : 1.2 ziα (t, x) = 0 für
α = 1, . . . , n, i = 1, . . . , m . Damit erhalten wir
∂uα
(x) − fiα (x, u(x)) = ziα (1, x) = 0 für x ∈ U
∂xi
und u(0) = y(1, 0) = b.
Ferner folgt aus dem Bestehen dieser DG, dass ∂uα
∂xi
∈ Cr (U), also u ∈ Cr+1 (U).
2
Kapitel IV
Hilfsmittel aus der Analysis
Für die Behandlung partieller Differentialgleichungen wie auch für die mathema-
tischen Grundlagen der Quantenmechanik bedarf es einer Erweiterung unseres
mathematischen Rüstzeugs. Problemorientiertes Vorgehen, also Bereitstellung
der mathematischen Hilfsmittel jeweils nach Bedarf, würde die Geschlossenheit
der Argumentation bei den im folgenden behandelten Themenbereichen stören;
auch werden einige dieser Hilfsmittel an mehreren Stellen benötigt.
Wir empfehlen den Lesern, sich die benötigten Vorkenntnisse erst bei Bedarf
anzueignen; diese werden zu Beginn jedes der folgenden Paragraphen genannt.
Mit dem Lebesgue–Integral und seinen Eigenschaften sollten Sie sich allerdings
schon an dieser Stelle vertraut machen. Um Ihnen den Zugang zu erleichtern
und um rasch zur Sache zu kommen, stellen wir im folgenden Paragraphen die
Grundzüge der Lebesgueschen Theorie zusammen. Für die meisten Beweise wird
auf Kap. VI verwiesen, in welchem im Hinblick auf die Quantenmechanik eine
allgemeine Maß– und Integrationstheorie entwickelt wird.
§ 8 Lebesgue–Theorie und Lp –Räume
1 Eigenschaften des Lebesgue–Integrals

1.1 Zur Notwendigkeit eines erweiterten Integralbegriffs
Existenzbeweise für die Lösung von Differentialgleichungsproblemen und an-
derer Aufgaben der Analysis stützen sich durchweg auf die Vollständigkeit
eines Funktionenraums. Das typische Vorgehen besteht dabei in den folgenden
Schritten:
– Umformulierung der gestellten Aufgabe in ein Gleichungsproblem in einem
geeignet gewählten Funktionenraum.
– Auswahl oder Konstruktion einer Folge u1 , u2 , . . . von approximativen Lö-
sungen, die eine Cauchy–Folge in diesem Raum bildet.
– Nachweis, dass der wegen der Vollständigkeit existierende Grenzwert u dieser
Folge das Gleichungsproblem löst.
– Nachweis, dass u eine Lösung des Originalproblems ist.
Eine besondere Rolle spielen Hilbertraummethoden. Bei diesen führt in vie-

∞
len Fällen ein Reihenansatz u = vi , u vi mit einem Orthonormalsystem
i=1
v1 , v2 , . . . zum Ziel; hier besteht die Folge uk aus den Partialsummen.

202 § 8 Lebesgue–Theorie und Lp –Räume
Eine andere wichtige Hilbertraum–Methode sei an einem Beispiel erläutert:

Das Dirichlet–Problem auf einem beschränkten Gebiet Ω ⊂ Ê n
,
− Δu = f in Ω , u = 0 auf ∂Ω
wird durch partielle Integration umgeformt in das Gleichungsproblem
u, ϕ V = f,ϕ H
für alle in einer Umgebung des Randes ∂Ω verschwindenden C∞ –Funktionen ϕ ;

dabei ist

u, v H := u·v

Ω
zunächst definiert auf H0 = { u ∈ C0 (Ω) | |u|2 < ∞ } und

Ω

n
u, v V := ∇u , ∇v = ∂k u , ∂k v H
Ω k=1
ist definiert auf
V0 = { u ∈ C0 (Ω) ∩ C1 (Ω) | ∂1 u, . . . , ∂n u ∈ H0 , u = 0 auf ∂Ω }.
Beide Räume H0 und V0 sind bezüglich der durch das jeweilige Skalarprodukt
gegebenen Norm nicht vollständig, lassen sich aber zu Hilberträumen erweitern.
Der hierfür entscheidende Schritt ist die Erweiterung des Raums H0 .
Grundlage hierfür ist der 1902 von Henri Lebesgue entwickelte Integralbe-
griff. Ein Hauptergebnis der Lebesgueschen Theorie ist die Vertauschbarkeit
von Limes und Integral unter wesentlich schwächeren Bedingungen als denen
der gleichmäßigen Konvergenz. Damit läßt sich zeigen, dass die gesuchte Ver-
vollständigung von H0 durch

L2 (Ω) = u:Ω→ Ê|u 2
ist im Lebesgueschen Sinn integrierbar
gegeben ist (Genaueres in 2.1).

Der Ansatz von Lebesgue gestattet es, unser bisheriges Integral auf eine größe-
re Klasse von Funktionen auszudehnen, die dann auch hochgradig unstetige
umfasst. Die Konstruktion und die Beweise sind allerdings um einiges kompli-
zierter. Wir stellen im folgenden das Grundkonzept und die Hauptergebnisse
der Lebesgueschen Theorie vor. Für die Beweise verweisen wir auf § 19, § 20.
1.2 Das Lebesgue–Maß

Eine Erweiterung des Integralbegriffs für Funktionen setzt eine Erweiterung des
Volumenbegriffs für Mengen voraus. In Bd. 1, § 23 wurde das n–dimensionale
Volumen V n (Ω) für offene Mengen Ω eingeführt. Wir setzen dieses folgender-
maßen auf eine größere Klasse von Mengen fort:
1 Eigenschaften des Lebesgue–Integrals 203
Ê
Eine Menge M ⊂ n heißt messbar (genauer: Lebesgue–messbar), wenn
es zu jedem ε > 0 eine offene Menge Ω und eine abgeschlossene Menge A gibt
mit
A ⊂ M ⊂ Ω und V n (Ω \ A) < ε .
(V n (Ω \ A) ist für die offene Menge Ω \ A bereits definiert.) Für messbare
Mengen M definieren wir das Volumen, jetzt Lebesgue–Maß genannt, durch
V n (M ) := inf { V n (Ω) | Ω offen, M ⊂ Ω, V n (Ω) < ∞ } ,
falls es eine offene Obermenge endlichen Maßes gibt; andernfalls sagen wir M
”
hat kein endliches Maß“ und schreiben V n (M ) = ∞.
Das System der messbaren Mengen bezeichnen wir mit A . Dieses Mengensystem
erweist sich als sehr umfangreich, enthält aber nicht sämtliche Teilmengen des
Ê n
, vgl. § 19 : 8.1. Quader und offene Mengen sind Lebesgue–messbar, und für
diese stimmen Lebesgue–Maß und das bisher definierte Volumen überein, vgl.
Bd. 1, § 23 : 4.1 und 7.1. Weiter gilt
(i) ∅, Ê
n
∈ A,
(ii) M, N ∈ A =⇒ M \ N ∈ A ,
(iii) M, N ∈ A =⇒ M ∩ N ∈ A ,
(iv) A enthält mit je endlich vielen oder abzählbar vielen Mengen auch deren
Vereinigung.
Ê
Ein solches Mengensystem heißt eine σ–Algebra auf n. Die entscheiden-
de, für Vollständigkeitseigenschaften verantwortliche Eigenschaft des Lebesgue–
Maßes ist die σ–Additivität (abzählbare Additivität)
7
∞
∞
V n( Ak ) = V n (Ak ) für paarweise disjunkte Ak ∈ A.
k=1 k=1
7
∞
Das ist so zu lesen: Genau dann hat A := Ak endliches Maß, wenn alle Ak
k=1

∞
endliches Maß haben und wenn die Reihe V n (Ak ) konvergiert. Dann ist
k=1
V n (A) durch diese Reihe gegeben. Andernfalls schreiben wir V n (A) = ∞.
Für AN+1 = AN+2 = · · · = ∅ folgt die endliche Additivität:
7
N
N
V n( Ak ) = V n (Ak ) für paarweise disjunkte Ak ∈ A.
k=1 k=1
Einpunktige Mengen haben offenbar das Maß Null. Wegen (iv) und der σ–
Additivität sind daher alle abzählbaren Mengen Lebesgue–messbar mit Maß 0,
z.B. die Menge n aller Vektoren mit rationalen Komponenten. ( ÜA : Zeigen
Sie per Induktion, dass n abzählbar ist). Nach (ii) enthält A alle abgeschlos-
senen Mengen. Kompakte Mengen haben endliches Maß.
1.3 Nullmengen und der Begriff fast überall“

”
(a) Eine Lebesgue–messbare Menge A mit V n (A) = 0 heißt Nullmenge (ge-
nauer: Lebesgue–Nullmenge). Äquivalent dazu ist folgende Bedingung: Zu
jedem ε > 0 gibt es endlich viele oder abzählbar viele Quader Ik mit
2
A ⊂ Ik und V n (Ik ) < ε .
k k
Durch eventuelle Hinzunahme entarteter Quader dürfen wir immer von abzähl-
baren Überdeckungen ausgehen. Dieser Nullmengenbegriff ist umfassender als
der in Bd. 1, § 23 : 7.4, da wir jetzt abzählbare Quaderüberdeckungen zulassen
und nicht mehr nur endliche. Die Menge der rationalen Zahlen ist als abzähl- É
Ê
bare Menge eine Lebesgue–Nullmenge des , jedoch keine Nullmenge im alten
Sinn.
Satz. (i) Jede Teilmenge einer Nullmenge ist eine Nullmenge.
7
∞
(ii) Sind A1 , A2 , . . . Nullmengen, so auch Ak .
k=1
Beweis.
(i) folgt direkt aus der Definition.
(ii) Zu gegebenem ε > 0 gibt es nach der oben gemachten Bemerkung Quader
Ik mit
7
∞
∞
Ak ⊂ Ik und V n (Ik ) < ε 2−k .
=1 =1
Nach dem Umordnungssatz Bd. 1, § 7 : 6.6 folgt

7
∞ 7
∞ 7
∞
∞
∞
∞
Ak ⊂ Ik mit V n (Ik ) < ε 2−k = ε . 2
k=1 k=1 =1 k=1 =1 k=1
Beispiele von Nullmengen:

(i) Achsenparallele Hyperebenen ÜA .
Ê
(ii) Graphen stetiger Funktionen f : Ω → auf offenen Mengen Ω ⊂ n−1 . Ê
ÜA : Betrachten Sie zunächst stetige Funktionen auf kompakten Quadern und
stellen Sie dann Ω als abzählbare Vereinigung kompakter Quader dar, vgl. Bd. 1,
§ 23 : 4.1.
(iii) Nullmengen können sehr umfangreich sein. Ein Beispiel ist das Cantorsche
Ê
Diskontinuum in , welches sich bijektiv auf Ê
abbilden läßt (Barner–Flohr
[141] § 15).
(b) Funktionen u, v auf einer messbaren Menge Ω heißen fast überall gleich,
u(x) = v(x) für fast alle x ∈ Ω, kurz u = v f.ü. ,
wenn {x ∈ Ω | u(x) = v(x)} eine Nullmenge ist.
Allgemein heißt eine Eigenschaft E(x) fast überall auf Ω erfüllt, wenn sie
höchstens auf einer Nullmenge verletzt ist. Konvergenz fast überall von
Funktionen uk auf Ω bedeutet also, dass
N := { x ∈ Ω | (uk (x)) konvergiert nicht }
eine Nullmenge ist. In diesem Fall definieren wir u = lim uk durch

k→∞

lim uk (x) für x ∈ Ω \ N ,
k→∞
u(x) :=
0 für x ∈ N .
Entsprechend vereinbaren wir: Bilden die Definitionslücken einer Funktion eine
Nullmenge, so schließen wir diese für Zwecke der Integration durch Zuweisung
des Funktionswertes Null.
In diesem Sinne sind 1/u , bzw. ∂k u zu verstehen, falls u(x) = 0 f.ü. bzw. falls
u fast überall partiell differenzierbar ist.
1.4 Das Lebesgue–Integral

(a) Die Definition des Integrals erfolgt zunächst für integrierbare Elementar-
Ê Ê
funktionen, das sind Funktionen ϕ : n → , die sich in der Form
N
ϕ = ck χAk
k=1
mit reellen ck darstellen lassen, wobei die Ak paarweise disjunkte messbare

Mengen endlichen Maßes sind. Zu diesen gehören die Treppenfunktionen. Für
solche Elementarfunktionen ist das Lebesgue–Integral

N
ϕ = ϕ(x) dn x := ck V n (Ak )
Ê n k=1
unabhängig von der Darstellung und genügt den üblichen Rechenregeln. Die
Ê
charakteristische Funktion χA einer messbaren Menge A ⊂ n ist genau dann
eine integrierbare Elementarfunktion, wenn V n (A) < ∞. Es gilt dann

χA = V n (A) .
Schon unter den Elementarfunktionen gibt es solche, die nicht im herkömmlichen

z.B. die Dirichlet–Funktion É für n = 1. Da
Sinn integrierbar sind, χ É eine
Nullmenge ist, folgt χ É = 0 . Die Dirichlet–Funktion ist überall unstetig und
Ê
auf keinem kompakten Intervall gleichmäßiger Limes von Treppenfunktionen.
(b) Messbare Funktionen. Eine auf einer messbaren Menge Ω definierte
Funktion f : Ω → Êheißt messbar (genauer: Lebesgue–messbar), wenn
für jedes Intervall I das Urbild f −1 (I) eine messbare Menge ist.
Wir notieren folgende Eigenschaften messbarer Funktionen:

Elementarfunktionen sind messbar ÜA . Stetige Funktionen u : Ω → Ê
auf
messbaren Mengen Ω sind messbar. Letzteres wie auch die folgenden Eigen-
schaften messbarer Funktionen entnehmen wir ohne Beweis aus § 20 : 3.
Eine Funktion ist genau dann messbar, wenn das Urbild jeder messbaren Menge
messbar ist.
Die Hintereinanderausführung messbarer Funktionen ist messbar.
Die messbaren Funktionen bilden einen Vektorraum, der mit u, v auch u · v
enthält. Unter Beachtung der Konvention 1.3 (b) gelten folgende Aussagen:
Mit u ist auch |u| messbar; im Fall u = 0 f.ü. ist auch 1/u messbar. Der Limes
einer fast überall konvergenten Folge messbarer Funktionen ist messbar.
Ist u auf dem Gebiet Ω fast überall partiell differenzierbar, so sind die partiel-
len Ableitungen ∂k u messbar, vgl. 1.3 (b).
Die Einschränkung einer messbaren Funktion f : Ω → Ê
auf eine messbare
Teilmenge von Ω ist messbar; setzen wir umgekehrt f durch Nullsetzen außer-
Ê
halb von Ω auf den n fort, so entsteht eine messbare Funktion.
Alles in allem: Die Klasse der messbaren Funktionen ist abgeschlossen unter
algebraischen Operationen, Hintereinanderausführung und Grenzprozessen. Sie
umfasst alle Funktionen, die aus Elementarfunktionen mit Hilfe solcher Pro-
zesse hervorgehen; andere wurden bisher nicht betrachtet. Dennoch dürfen wir
von der Voraussetzung der Messbarkeit nicht einfach absehen, denn es existieren
nichtmessbare Funktionen. Deren Definition stützt sich in starkem Maß auf das
Auswahlaxiom und ist daher nichtkonstruktiv.
(c) Integrierbarkeit positiver Funktionen. Ausgangspunkt für die Inte-
graldefinition ist der folgende, in § 20 : 3.5 bewiesene
Satz. Jede positive messbare Funktion u auf einer messbaren Menge Ω ist punkt-
weiser Limes einer aufsteigenden Folge positiver integrierbarer Elementarfunk-
tionen auf Ω, d.h. es gibt außerhalb von Ω verschwindende integrierbare Ele-
mentarfunktionen ϕk ≥ 0 mit
ϕk (x) ≤ ϕk+1 (x) für k = 1, 2, . . .
und
u(x) = lim ϕk (x) für alle x ∈ Ω .
k→∞

Für die monoton wachsende Folge ( ϕk ) der Integrale gibt es zwei Fälle:

(i) ( ϕk ) ist beschränkt. Dann heißt u über Ω (Lebesgue–)integrierbar,
und das Lebesgue–Integral

u = u(x) dn x := lim ϕk
k→∞
Ω Ω
ist unabhängig von der approximierenden monotonen Folge (ϕk ).

Wir schreiben in diesem Fall u < ∞“.
”Ω

(ii) Die Folge ( ϕk ) ist unbeschränkt. Dann gilt dies auch für jede andere gegen
u aufsteigende Folge positiver integrierbarer Elementarfunktionen.
In diesem
Fall heißt u nicht über Ω integrierbar. Wir sagen auch u existiert nicht“
”Ω
und schreiben u = ∞“.
”Ω
(d) Integrierbarkeit und Integral beliebiger messbarer Funktionen.
Eine messbare Funktion u : Ω → Ê
heißt (Lebesgue–)integrierbar, wenn
die positiven messbaren Funktionen
u+ := 1
2
(|u| + u) , u− := 1
2
(|u| − u)
im Sinne von (c) integrierbar sind. Wir setzen dann

u := u+ − u− .
Ω Ω Ω
Für messbare Funktionen u : Ω → Ê ist die Integrierbarkeit daher äquivalent

zur Integrierbarkeit von |u|.
Eine komplexwertige Funktion f = u + iv : Ω → heißt messbar bzw.
integrierbar, wenn u und v die entsprechende Eigenschaft haben. Wir setzen
im Fall der Integrierbarkeit

f := u+ i v.
Ω Ω Ω
(e) Integrierbarkeit über Teilmengen. Ist u über Ω integrierbar, M eine

messbare Teilmenge von Ω und v die Einschränkung von u auf M , so sind v
über M und u · χM über Ω integrierbar, und die Integrale sind jeweils gleich.
Wir setzen

u := v = u · χM .
M M Ω
1.5 Eigenschaften des Lebesgue–Integrals

(a) Die integrierbaren Funktionen u : Ω → ( = oder = ) bilden
einen –Vektorraum, bezeichnet mit L1 (Ω).
(a) Das Integral ist linear .
(b) Das Integral ist monoton, d.h. für integrierbare Funktionen u, v auf Ω gilt

u ≤ v f.ü. =⇒ u ≤ v.
Ω Ω

(c) u ∈ L1 (Ω) =⇒ |u| ∈ L1 (Ω) und | u| ≤ |u| .
Ω Ω
(d) Alle im herkömmlichen Sinn integrierbaren Funktionen sind auch Lebesgue–
integrierbar mit gleichem Integral (Zur Begründung siehe 1.6 (d)).
(e) Majorantensatz. Eine messbare Funktion u : Ω →

ist genau dann
über Ω integrierbar, wenn sie eine integrierbare Majorante hat:
|u(x)| ≤ f (x) f.ü. mit f ∈ L1 (Ω) .
(f) Sind reellwertige Funktionen u, v über Ω integrierbar, so auch
sup{u, v} : x → max{u(x), v(x)},
inf{u, v} : x → min{u(x), v(x)}.
(g) Aus u ∈ L1 (Ω) und v = u f.ü. folgt v ∈ L1 (Ω) sowie

u= v.
Ω Ω

(h) Ist u über Ω integrierbar und |u| = 0, so gilt u = 0 f.ü.
Ω
1.6 Konvergenzsätze
Die Konvergenzsätze stellen die Hauptresultate der Lebesgueschen Integra-
tionstheorie dar. In dieser Theorie ist für eine Folge integrierbarer Funktionen
u1 , u2 , . . . ∈ L1 (Ω) die Vertauschung von Limes und Integral bereits unter der
schwachen Voraussetzung der punktweisen Konvergenz f.ü. gesichert, dass die
Folge durch eine Majorante kontrollierbar bleibt. Für den Integralbegriff aus
Bd. 1 und das Riemann–Integral besitzen die Konvergenzsätze kein Analogon.
Konvergiert eine Folge (uk ) punktweise f.ü., so definieren wir u = lim uk wie
k→∞
in 1.3 (b) und erhalten nach 1.4 (b) eine messbare Funktion u.
(a) Satz von Lebesgue von der majorisierten Konvergenz (1902).
Konvergiert eine Folge uk ∈ L1 (Ω) fast überall in Ω und besitzt eine integrier-
bare Majorante f ∈ L1 (Ω),
|uk (x)| ≤ f (x) f.ü. (k = 1, 2, . . .) ,
so ist u := lim uk über Ω integrierbar, und es gilt
k→∞

u = lim uk .
k→∞
Ω Ω
Dass auf die Majorantenbedingung nicht verzichtet werden kann, zeigt das Bei-
spiel in Bd. 1, § 12 : 1.2 (b).
(b) Satz von Beppo Levi über monotone Konvergenz (1906).
Bilden uk ∈ L1 (Ω) eine monoton aufsteigende Folge, und ist die Folge der
Integrale uk nach oben beschränkt, so gibt es eine Funktion u ∈ L1 (Ω) mit
Ω

u(x) = lim uk (x) f.ü. und es gilt u = lim uk .
k→∞ k→∞
Ω Ω
Die Voraussetzung uk ≤ uk+1 für k = 1, 2, . . . kann durch die Voraussetzung

uk ≤ uk+1 f.ü. für k = 1, 2, . . . ersetzt werden.
(c) Der kleine Satz von Lebesgue“. Ist V n (Ω) < ∞ und konvergiert eine
”
Folge (uk ) von beschränkten, messbaren Funktionen auf Ω gleichmäßig gegen
eine Funktion u, so sind die Voraussetzungen des Satzes von Lebesgue erfüllt.
Denn ist C eine Schranke für die |uk |, so ist die Elementarfunktion C χΩ eine
Majorante der Folge.
Die Voraussetzung V n (Ω) < ∞ ist wesentlich. Das zeigt das Beispiel Ω = Ê,

Ê und
+∞
uk = 1χ
k [0,k]
mit uk → 0 gleichmäßig auf uk = 1.
−∞
(d) Folgerung. Jede im herkömmlichen Sinn integrierbare Funktion ist auch

Lebesgue–integrierbar, und beide Integrale stimmen überein.
Beweis der Folgerung.

Bezeichnen wir fürkompakte Quader I bzw. für offene Mengen Ω das herkömm-
liche Integral mit u(x) dn x bzw. u(x) dn x und das Lebesgue–Integral mit
I Ω
u bzw. u , so gilt definitionsgemäß
I Ω

ϕ(x) dn x = ϕ für Treppenfunktionen ϕ .
I I
(i) Ist I ein kompakter Quader und u stetig auf I, so ist u gleichmäßiger Limes
von Treppenfunktionen ϕk auf I. Nach Definition des herkömmlichen Integrals
und nach (c) folgt

u(x) dn x = lim ϕk (x) dn x = lim ϕk = u. 2
k→∞ k→∞
I I I I
Ê
(ii) Ist Ω ⊂ n offen und u∈ C0 (Ω) im herkömmlichen Sinn integrierbar, so
gilt u ∈ L1 (Ω) und u = u(x) dn x .
Ω Ω
Es genügt, dies für positive, stetige Funktionen zu zeigen. Nach Bd. 1, § 23 : 4.1
◦ ◦ 7
∞
gibt es kompakte Quader Ik mit I k ∩ I = ∅ für k = und Ω = Ik . Nach
k=1
Bd. 1, § 23 : 4.2 gilt

N
u(x) dn x = lim u(x) dn x .
N→∞ k=1
Ω Ik

N
Für uN := u χIk gilt u1 ≤ u2 ≤ . . . und u(x) = lim uN (x) für jedes
N→∞

k=1
feste x, denn zu jedem x ∈ Ω gibt es ein m ∈ mit uk (x) = u(x) für k ≥ m.
Wegen 1.4 (f), der Linearität des Integrals und nach dem oben Bewiesenen gilt
N

N
N
uN = u χIk = u = u(x) dn x ≤ u(x) dn x .
Ω k=1 Ω k=1 Ik k=1 Ik Ω
Nach dem Satz von Beppo Levi folgt u ∈ L1 (Ω) und

N
u = lim uN = lim u(x) dn x = u(x) dn x . 2
N→∞ N→∞ k=1
Ω Ω Ik Ω
1.7 Parameterintegrale
Sei Ω ⊂ Ên
eine messbare Menge, Λ ⊂ Ê m
ein Gebiet, und das Parameterin-
tegral

U (x) = u(x, y) dn y
Ω
existiere für alle x ∈ Λ. Dann ergibt sich als Anwendung des Satzes von Lebes-
gue der folgende
Satz. (a) Ist x → u(x, y) für fast alle y ∈ Ω stetig und existiert eine Ma-
jorante f ∈ L1 (Ω) mit | u(x, y )| ≤ f (y) für x ∈ Λ, y ∈ Ω, so ist U stetig in
jedem Punkt von Λ.
(b) Ist x → u(x, y) für fast alle y ∈ Ω C1 –differenzierbar und existieren
Majoranten fi ∈ L1 (Ω) mit

∂u
(x, y) ≤ fi (y) für x ∈ Λ , y ∈ Ω (i = 1, . . . , m) ,
∂xi
so ist U C1 –differenzierbar in Λ und es gilt

∂U ∂u
(x) = (x, y) dn y (i = 1, . . . , m) .
∂xi ∂xi
Ω
Dabei ist der Integrand wie üblich an den Nichtdifferenzierbarkeitsstellen von u

gleich Null gesetzt.
Beweis.
(a) Für x ∈ Λ sei (xk ) eine beliebige Folge in Λ mit xk → x. Wir setzen
vk (y) := u(xk , y) und v(y) := u(x, y) . Dann folgt

U (xk ) = vk → v = U (x)
Ω Ω
nach dem Satz von Lebesgue.

(b) Sei x ∈ Λ fest und (tk ) eine Nullfolge mit nichtverschwindenden Gliedern.
Wir setzen
u(x + tk ei , y) − u(x, y)
wk (y) := ,
tk
falls x → u(x, y) ∈ C1 (Λ) und wk (y) := 0 sonst. Nach dem Mittelwertsatz

gilt |wk (y)| ≤ fi (y) , ferner gilt wk (y) → ∂x
∂u
i
(x, y) für alle y ∈ Ω. Nach dem
Satz von Lebesgue folgt

U (x + tk ei ) − U (x) ∂u
= wk → w = (x, y) dn y ,
tk ∂xi
Ω Ω Ω
also existiert ∂U
∂xi
(x) für alle x ∈ Λ. Die Stetigkeit von ∂U
∂xi
(x) folgt aus (a). 2

Ê d +∞ +∞
Beispiel. Für f ∈ L1 ( ) gilt f (t) sin(xt) dt = t f (t) cos(xt) dt.
dx −∞ −∞
1.8 Vertauschung der Integrationsreihenfolge

Im folgenden wird Ê als kartesisches Produkt aufgefasst:
n
Ê = Ê × Ê = {( x, y) | x ∈ Ê , y ∈ Ê } mit n = p + q.
n p q p q
Für eine messbare Menge Ω ⊂ Ê be- n
trachten wir die Mengen y

6
Ωx := {y ∈ Ê q
| (x, y) ∈ Ω} ,

Ωy := {x ∈ Ê p
| (x, y) ∈ Ω} , Ωx
Ω := {x ∈ Ê
1
p
| Ωx = ∅} ,
-
Ω : = {y ∈ Ê
2
p
| Ωy = ∅} x x
3 45 6
(Figur). Diese Mengen sind messbare Ω1
Ê
Teilmengen von p bzw. q . Ê
Ê
Satz von Fubini. Sei Ω ⊂ n eine messbare Menge und u ∈ L1 (Ω). Dann
existiert U (x) := u(x, y) dq y für alle x ∈ Ω1 mit eventueller Ausnahme
Ωx
einer Nullmenge N . Setzen wir U (x) = 0 für x ∈ N , so ist U über Ω1 inte-
grierbar, und es gilt

u = u(x, y) dq y dp x .
Ω Ω1 Ωx
Ganz entsprechend erhalten wir

u = u(x, y) dp x dq y .
Ω Ω2 Ωy
und damit die Vertauschbarkeit der Integrationsreihenfolge.
Wiederholte Anwendung dieses Satzes ermöglicht die Berechnung von Integralen

durch sukzessive eindimensionale Integration.
Für den Beweis siehe Königsberger [150] Bd.2, 6.1, Bauer [115] 22.6.
Satz von Tonelli. Sei u : Ω → Ê eine messbare Funktion, für welche die
Integrale

|u(x, y)| dq y für fast alle x und |u(x, y)| dq y dp x
Ωx Ω1 Ωx
existieren. Dann ist u über Ω integrierbar, und die Integrationsreihenfolge ist

nach dem Satz von Fubini vertauschbar. Entsprechendes ergibt sich, wenn wir
in den Voraussetzungen die Rollen von x und y vertauschen.
Beweis siehe Königsberger [150] Bd.2, 6.2.
Demnach ist u(x, y) = exp(−|y| (1 + x2 )) über den Ê 2

integrierbar. Das innere

+∞
Integral u(x, y) dx existiert nur für y = 0, vgl. Bd. 1, § 23 : 6.2.
−∞
1.9 Der Transformationssatz für Integrale

Sei ϕ : Ω → Ω ein C1 –Diffeomorphismus zwischen den Gebieten Ω und Ω
Ê
des n ; ferner sei A ⊂ Ω messbar und u über ϕ(A) integrierbar. Dann gilt

u(x) dn x = u(ϕ(y)) | det ϕ (y)| dn y .
ϕ(A) A
Konvergiert umgekehrt das rechte Integral, so ist u über ϕ(A) integrierbar .

Beweis siehe Königsberger [150] Bd.2, 7.1, 7.2.
2 Die Räume Lp (Ω)

2.1 Der Hilbertraum L2 (Ω)
(a) Für die Anwendungen ist neben dem L1 (Ω) vor allem der Raum
& '
L2 (Ω) = u:Ω→ | u messbar und |u|2 < ∞
Ω
von Interesse. Dabei ist Ω ⊂ n messbar und = oder .

L2 (Ω) ist ein Vektorraum über , und für u, v ∈ L2 (Ω) gilt u · v ∈ L1 (Ω),
denn für α, β ∈ gilt
2
| αu + βv |2 ≤ |α| · |u| + |β| · |v| ≤ 2 |α|2 |u|2 + |β|2 |v|2 ,

| u · v | = |u| · |v| ≤ 1
2
|u|2 + |v|2 ,
also sind |αu + βv|2 und u · v integrierbar nach dem Majorantenkriterium.
Wir wollen für den Raum L2 (Ω) durch

u, v := u·v
Ω
2 Die Räume Lp (Ω) 213
ein Skalarprodukt definieren, stoßen dabei aber auf die Schwierigkeit der fehlen-
den positiven Definitheit. Aus u , u = |u|2 = 0 folgt nicht u = 0, sondern
Ω
lediglich u = 0 f.ü.
(b) Wir erzwingen die positive Definitheit, indem wir alle fast überall gleichen
L2 –Funktionen identifizieren, d.h. als gleich betrachten. Den so vergröberten
Raum L2 (Ω) bezeichnen wir mit L2 (Ω) .
Das bedeutet, dass wir fast überall gleiche Funktionen zu Klassen
[ u ] := { v ∈ L2 (Ω) | v = u f.ü. }
zusammenfassen und L2 (Ω) := { [ u ] | u ∈ L2 (Ω)} setzen. Wir wollen kurz

skizzieren, welche Überlegungen dabei angestellt werden müssen, um dann zu
einer pragmatischen Handhabung überzugehen.
Da die Vereinigung zweier Nullmengen wieder eine Nullmenge ist, gilt
u = v f.ü., v = w f.ü. =⇒ u = w f.ü..
Hiernach bedeutet die Gleichheit zweier Klassen [ u ] = [ v ] einfach u = v f.ü..

Aus u1 = u2 f.ü. und v1 = v2 f.ü. folgt ÜA
α u1 + β v1 = α u2 + β v2 f.ü. für α, β ∈ ,

u1 v1 = u2 v2 .
Ω Ω
Daher sind die Definitionen

α[ u ] + β [ v ] := [ α u + β v ] und [ u ] , [ v ] := uv
Ω
sinnvoll.
Auf diese Weise wird L2 (Ω) ein Vektorraum über mit Nullvektor [ 0 ], auf
dem [ u ] , [ v ] ein Skalarprodukt liefert.
Im Hinblick auf Vektorraumoperationen, Skalarprodukte und Normen ist es
nach dem oben Gesagten unerheblich, mit welchen Vertretern einer Klasse wir
arbeiten; in dieser Hinsicht sind alle Vertreter einer Klasse gleichwertig. Wir
dürfen also künftig von L2 –Funktionen statt von Klassen sprechen und uns
pragmatisch auf den Standpunkt stellen:
L2 (Ω) ist die Menge aller u ∈ L2 (Ω) mit dem Gleichheitsbegriff u = v f.ü.
Dies ist, wie gesagt, solange unproblematisch, solange wir L2 (Ω) als Skalarpro-
duktraum auffassen. Dagegen macht es keinen Sinn, von einzelnen Funktions-
werten einer L2 –Funktion zu sprechen!
Eine wichtige Ausnahme von dieser Einschränkung bilden die stetigen Funk-
tionen auf einem Gebiet Ω. Für u, v ∈ C0 (Ω) hat u = v f.ü. zur Folge, dass
u(x) = v(x) für alle x ∈ Ω. Denn wäre u(a) − v(a) = 0 für ein a ∈ Ω, so gäbe
es ein r > 0 mit Kr (a) ⊂ Ω und u(x) − v(x) = 0 in Kr (a). Die Kugel Kr (a)
hat aber positives Maß.
Enthält also eine Klasse in L2 (Ω) eine stetige Funktion, so ist dies die einzige
stetige in dieser Klasse; wir wählen immer diese als Vertreterin.

(c) Die zum L2 –Skalarprodukt u , v := u · v auf L2 (Ω) gehörige Norm
Ω
heißt L2 –Norm und wird wahlweise mit
u2 = uL2 := u, u
bezeichnet. Die Konvergenz bezüglich dieser Norm

u − un 2 → 0 ⇐⇒ |u − un |2 → 0
Ω
heißt L2 –Konvergenz oder Konvergenz im Quadratmittel. Näheres dazu
in (d). In § 20 : 7.2 beweisen wir den
Satz von Fischer–Riesz (1907). L2 (Ω) ist vollständig, d.h. ein Hilbertraum
bezüglich des L2 –Skalarprodukts:
Ist (uk ) eine L2 –Cauchyfolge, so gibt es eine L2 –Funktion u mit
u − uk 2 → 0 für k → ∞ .
Darüberhinaus existiert eine Teilfolge (unk ) mit unk → u f.ü. .
(d) Das Verhältnis der L2 –Konvergenz zur punktweisen Konvergenz.

(i) Aus u − uk → 0 folgt die punktweise Konvergenz f.ü. einer geeigneten
Teilfolge, nicht aber die punktweise Konvergenz f.ü. der Originalfolge (uk ). Ein
Beispiel bilden die wandernden Zaunlatten“ auf Ω = [0, 1]: Für jede Zahl
k ∈ ”
gibt es eine eindeutige Darstellung k = 2n + m mit m, n ∈ 0 und
0 ≤ m < 2n . Wir setzen Ik = m 2−n , (m + 1) 2−n und uk = χIk .
ÜA Zeigen Sie uk → 0 im Quadratmittel. Skizzieren Sie u1 , . . . , u8 (es lohnt
sich). Machen Sie sich klar, dass die Folge (uk (x)) für kein x ∈ Ω konvergiert.
Geben Sie eine punktweis konvergente Teilfolge an.
(ii) Das Beispiel uk = k χJk , Jk = ]0, 1/k[ auf Ω = [0, 1] zeigt:
Aus punktweiser Konvergenz folgt nicht die Konvergenz im Quadratmittel ÜA .
Es gilt aber der
Satz. Besitzt eine Folge messbarer Funktionen uk : Ω → eine gemeinsame
Majorante f ∈ L2 (Ω) und existiert lim uk (x) f.ü., so gilt
k→∞
u := lim uk ∈ L2 (Ω) und lim u − uk 2 = 0 .

k→∞ k→∞
Beweis.
Es gilt |uk (x)|2 ≤ |f (x)|2 f.ü. , also auch |u(x)|2 = lim |uk (x)|2 ≤ |f (x)|2 f.ü..
k→∞
Da u := lim uk nach 1.4 (b) messbar ist, folgt die Integrierbarkeit von |u|2
k→∞
und |uk |2 nach dem Majorantenkriterium 1.5 (d). Ferner gilt
| u(x) − uk (x) |2 → 0 f.ü. und | u(x) − uk (x) |2 ≤ 4 |f (x)|2 f.ü..
Also ergibt sich die Behauptung aus dem Satz von Lebesgue 1.6 (a). 2
(iii) Aus der gleichmäßigen Konvergenz uk → u beschränkter messbarer Funk-

tionen uk auf Ω folgt im Fall V n (Ω) < ∞ die Konvergenz im Quadratmittel.
Im Fall V n (Ω) = ∞ ist dieser Schluss nicht zulässig. Beides folgt aus 1.6 (c).
2.2 Die Banachräume Lp (Ω)

Für reelle Zahlen p ≥ 1 definieren wir
Lp (Ω) := = { u : Ω → | u messbar und |u| p
< ∞ },
1/p
Ω
up = uLp := |u|p ,
Ω
wobei wir wie oben fast überall gleiche Funktionen identifizieren.
Satz. Lp (Ω), versehen mit der Norm up , ist vollständig, also ein Banach-
raum.
Weiter folgt aus u − uk p → 0 in Lp (Ω) die Existenz einer Teilfolge (unk )
mit
unk → u f.ü.

Zum Beweis ist zu zeigen: Lp (Ω) ist ein Vektorraum über , · p liefert eine
Norm, und Lp (Ω) ist in dieser Norm vollständig.
Zunächst gilt: u ∈ Lp (Ω), α ∈
=⇒ αu ∈ Lp (Ω) und αup = |α| · up .
Daraus folgt die Vektorraumeigenschaft: Für u, v ∈ Lp (Ω) gilt
p p
| u + v |p ≤ |u| + |v| ≤ 2 sup {|u|, |v|} = 2p sup {|u|p , |v|p } ,
also ist |u + v|p integrierbar nach 1.5 (e),(f). Die Dreiecksungleichung ist für
p = 1 trivial; für p > 1 wird sie in 2.3 bewiesen.
Die Vollständigkeit wird in § 20 : 7.2 gezeigt.
2.3 Die Ungleichungen von Hölder und Minkowski

(a) Lemma. Seien p, q > 1 reelle Zahlen mit 1/p + 1/q = 1. Dann gilt für
alle x, y ≥ 0
xp yq
xy ≤ + .
p q
Beweis als ÜA : Bestimmen Sie für festes y > 0 das Minimum der Funktion
x → f (x) = xp /p + y q /q − xy.
(b) Die Höldersche Ungleichung. Sei p, q > 1 und 1/p + 1/q = 1. Dann
ist für u ∈ Lp (Ω), v ∈ Lq (Ω) die Funktion u · v integrierbar, und es gilt
u · v1 ≤ up · vq .
Beweis.
Aus up = 0 folgt u = 0, also u · v = 0 und damit die Behauptung. Entspre-
chend ist die Behauptung im Fall vq = 0 richtig.
Sei also up , vq > 0 und f := u/up , g := v/vq . Aus (a) folgt
1 | u(x) |p 1 | v(x) |q
| f (x) · g(x) | ≤ + .
p up p
q vqq
Die rechte Seite ist integrierbar, also nach dem Majorantenkriterium auch die
linke. Integration ergibt f · g1 ≤ p1 + 1q = 1 , also u · v1 ≤ up · vq . 2
(c) In Lp (Ω) gilt die Minkowskische Ungleichung
u + vp ≤ up + vp für u, v ∈ Lp (Ω).
Beweis.
Für p = 1 ist das klar. Für p > 1 und u, v ∈ Lp (Ω) gilt u + v ∈ Lp (Ω) und
| u + v |p = | u + v |p−1 · |u + v| ≤ |u + v|p−1 · |u| + |u + v|p−1 · |v| .
Für q mit 1/p + 1/q = 1, also q := p/(p − 1) ist nach Voraussetzung
(|u + v|p−1 )q = |u + v|p ,
somit |u + v|p−1 ∈ Lq (Ω) .

Die Höldersche Ungleichung liefert
1/q 1/p 1/q 1/p
|u + v|p ≤ |u + v|p · |u|p + |u + v|p · |v|p
Ω Ω Ω Ω Ω
1/q
= |u + v|p · up + vp .
Ω
Im Fall |u + v| = 0 ist nichts zu beweisen, andernfalls folgt die Behauptung

1/q
durch Division durch |u + v|p . 2
Ω
2.4 Der Raum L∞ (Ω)

Eine messbare Funktion u : Ω →
heißt wesentlich beschränkt (in Zeichen
u ∈ L∞ (Ω)), wenn es eine Konstante C gibt mit
|u(x)| ≤ C für fast alle x ∈ Ω.
Für wesentlich beschränkte Funktionen u existiert

u∞ := min { C ≥ 0 | |u(x)| ≤ C f.ü.} .
Zum Nachweis setzen wir M = { C ≥ 0 | |u(x)| ≤ C f.ü.} und s = inf M .

Dann gibt es Zahlen sk ∈ M , die monoton gegen s fallen. Zu diesen gibt es
7
∞
Nullmengen Nk mit |u(x)| ≤ sk für alle x ∈ Ω \ Nk . Dann ist N = Nk
k=1
wieder eine Nullmenge, und es gilt
-
x ∈ Ω\N = (Ω \ Nk ) =⇒ |u(x)| ≤ sk für k ∈ Æ =⇒ |u(x)| ≤ s .
k∈
Identifizieren wir alle f.ü. gleichen Funktionen, so erhalten wir den Raum L∞ (Ω).
Auf diesem liefert · ∞ eine Norm ÜA . Es gilt ÜA
Satz. L∞ (Ω) mit der Norm · ∞ ist ein Banachraum.
2.5 Beziehungen zwischen den Lp –Räumen, der Raum L1loc (Ω)
(a) Hat Ω endliches Volumen, so gilt L∞ (Ω) ⊂ Lp (Ω) ⊂ L1 (Ω) für alle p > 1.
Für r < s gilt ferner Ls (Ω) ⊂ Lr (Ω), und für u ∈ Ls (Ω)
ur ≤ c · us mit c = (V n (Ω))(s−r)/(s r) .

∞
L r (Ω) ⊂ Lr (Ω) beachten wir |u| ≤ u∞ · Ω . Der Rest folgt
Zum Beweis von p χ
aus 2.3 (b) für |u| = |u| · 11 mit p = s/r ÜA .
Ω
(b) Im Fall V n (Ω) = ∞ lassen sich keine Inklusionsaussagen treffen.
ÜA Zeigen Sie mit Hilfe geeigneter, auf Ω := Ê
>0 stetiger Funktionen, dass
keiner der Räume L∞ (Ω), L1 (Ω), L2 (Ω) in einem der anderen enthalten ist.
(c) Eine Funktion u : Ω → Ã Ê
auf einem Gebiet Ω ⊂ n heißt lokalinte-
grierbar, wenn sie messbar ist und über jede kompakte Teilmenge K ⊂ Ω
integrierbar, d.h. wenn u · χK über Ω integrierbar ist. Identifizieren wir fast
überall gleiche lokalintegrierbare Funktionen, so erhalten wir den Vektorraum
L1loc (Ω) . Nach (a) gilt
Lp (Ω) ⊂ L1loc (Ω) für p ≥ 1 .
Denn es gilt u ∈ Lp (Ω) =⇒ u ∈ Lp (K) für jede kompakte Teilmenge K von
Ω =⇒ u ∈ L1 (K) nach (a). Beschränkte messbare Funktionen sind lokalinte-
grierbar, ebenso stetige Funktionen.
Aufgabe. Zeigen Sie: Für 1 ≤ p < r < q und u ∈ Lp (Ω) ∩ Lq (Ω) gilt die
Interpolationsungleichung
u ∈ Lr (Ω) und ur ≤ uα
p · uq
β
für Konstanten α, β > 0 mit α + β = 1 und 1/r = α/p + β/q.
2.6 Die Separabilität der Lp –Räume

Ê
Satz. Für 1 ≤ p < ∞ und jedes Gebiet Ω ⊂ n liegen die Treppenfunktionen
dicht in Lp (Ω) , d.h. zu jedem u ∈ Lp (Ω) gibt es Treppenfunktionen ϕk auf Ω
mit u − ϕk p → 0 .
Für den Beweis wird auf § 20 : 8.4 verwiesen. Es ergibt sich als
Folgerung. Für jedes Gebiet Ω enthält Lp (Ω) eine abzählbare dichte Menge
von Treppenfunktionen.
Denn sei u ∈ Lp (Ω), ε > 0 vorgegeben und ϕ eine Treppenfunktion auf Ω
mit u − ϕp < ε . Durch geringfügige Abänderung von ϕ erhalten wir eine
rationale“ Treppenfunktion
”

N
ψ = qk χIk ,
k=1
(d.h. Re qk , Im qk ∈ É
und die Eckpunkte der Quader Ik haben rationale Ko-
ordinaten) so dass ϕ − ψp < ε. Es folgt u − ψp < 2ε. Diese rationalen
Treppenfunktionen ψ bilden eine abzählbare Menge ( ÜA , benützen Sie die
É
Abzählbarkeit von 2n+2 , vgl. 1.2).
Eine Teilmenge M eines normierten Raumes V heißt separabel, wenn es eine

abzählbare Teilmenge A gibt mit M ⊂ A , d.h. wenn jedes v ∈ M Grenzwert
einer Folge aus A ist.
Ãn ist separabel, da die Vektoren x = (x1, . . . , xn ) mit rationalen Koordinaten
xk (d.h. Re xk , Im xk ∈ É) dicht liegen.
Satz. Für messbare Mengen Ω ⊂ Ên und 1 ≤ p < ∞ ist jede Teilmenge des
p
L (Ω) separabel .
Beweis.
Ê
(a) Nach dem eingangs zitierten Satz existiert eine in Lp ( n) dichte Folge (ψk )
von Treppenfunktionen. Dann liegt die Folge (ψk · χΩ ) dicht in Lp (Ω) ÜA .
(b) Sei (uk ) eine in Lp (Ω) dichte Folge und M ⊂ Lp (Ω). Nach Voraussetzung
gibt es zu jedem v ∈ M und jedem n ∈ Æ ein um mit v − um p < n1 , d.h.
v ∈ K1/n (um ) . Diejenigen Kugeln K1/n (um ), deren Durchschnitt mit M nicht
leer ist, lassen sich durchnumerieren: U 1 mit Radius 1 , U2 mit Radius 2 ,
etc. Wir wählen aus jedem U k ein vk ∈ M aus und erhalten so eine in M
Æ
dichte Folge (vk ). Denn zu jedem v ∈ M gibt es eine Teilfolge (nk ) von mit
v ∈ Unk , nk → 0 (s.o.). Es gilt dann v − vnk p < nk → 0 . 2
3* Der Hauptsatz der Differential– und Integralrechnung 219
3* Der Hauptsatz der Differential– und Integralrechnung

Die folgende Verallgemeinerung des Hauptsatzes der Differential– und Integral-
rechnung kommt erst in den Paragraphen § 14, § 16, § 17 und im Schlusskapitel
dieses Bandes zum Tragen und kann bei der ersten Lektüre übergangen werden.
3.1 Absolutstetige Funktionen

Eine Funktion u : I → auf einem Intervall I ⊂ heißt absolutstetig,
wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass

N
| u(bk ) − u(ak ) | < ε
k=1
für je endlich viele Intervalle [ak , bk ] ⊂ I mit paarweise disjunktem Innern und

N
(bk − ak ) < δ .
k=1
Absolutstetige Funktionen sind gleichmäßig stetig (N = 1). Eine Funktion ist

genau dann absolutstetig, wenn Real– und Imaginärteil absolutstetig sind ÜA .
Erfüllt u eine Lipschitzbedingung |u(y) − u(x)| ≤ L |y − x| für alle x, y ∈ I, so
ist u absolutstetig ÜA .
Satz. (a) Die absolutstetigen Funktionen u : I → bilden einen Vektorraum

über .
(b) Mit u sind auch |u| und u absolutstetig.
(c) Sind u und v absolutstetig und beschränkt, so ist u · v absolutstetig.
(d) Ist u absolutstetig auf dem Intervall J und ϕ : I → J absolutstetig und
monoton, so ist u ◦ ϕ absolutstetig.
Beweis als ÜA .
Satz. Für u ∈ L1 (I) und einen festen Punkt a ∈ I ist durch das unbestimmte
Integral
x x
U (x) := u = u(t) dt
a a
eine absolutstetige Funktion U gegeben.
Beweis.
Es genügt, den Beweis für positive Funktionen zu führen. Sei ε > 0 gegeben.
Nach 1.4 (c) gibt es eine Elementarfunktion ϕ mit 0 ≤ ϕ ≤ u und (u − ϕ) < ε2 .
I
Wir setzen C := ϕ∞ + 1 und δ := ε/2C. Haben die [ak , bk ] ⊂ I paarweise

N
disjunktes Inneres und gilt (bk − ak ) < δ , so folgt
k=1

N
N bk
N bk
| U (bk ) − U (ak )| ≤ |f | ≤ (|ϕ| + |f − ϕ|)
k=1 k=1 ak k=1 ak
N
≤ C (bk − ak ) + |f − ϕ| < ε . 2
k=1 I
3.2 Der Hauptsatz

Satz (Lebesgue 1904). (a) Jede absolutstetige Funktion u : I → ist fast Ê
überall differenzierbar. Die gemäß 1.3 (b) definierte Ableitung u : I → ist Ê
lokalintegrierbar, und es gilt
x
u(x) = u(a) + u (t) dt für alle a, x ∈ I .
a
(b) Für jede Funktion u ∈ L1 (I) ist durch

x
U (x) := u(t) dt
a
eine beschränkte absolutstetige Funktion U gegeben mit U = u f.ü..
Für den Beweis verweisen wir auf Riesz/Nagy [131] 5.
3.3 Partielle Integration

Für absolutstetige Funktionen u, v : [a, b] → gilt
b b b
u · v dt = u·v a
− u · v dt .
a a
Denn u, v sind als stetige Funktionen auf [a, b] beschränkt. Also ist u · v nach
3.1 (c) absolutstetig. Nach dem Hauptsatz 3.1 (a) sind u , v integrierbar; also
auch u · v , u · v mit den Majoranten u∞ · |v | und |u | · v∞ . Ebenfalls
nach 3.1 (a) folgt
b b b
u·v a
= (u · v) = (u · v + u · v ) .
a a
221
§ 9 Hilberträume
1 Beispiele für Hilberträume
1.1 Zum Hilbertraumkonzept
Ein Skalarproduktraum H über = bzw. =
heißt Hilbertraum,
wenn er als normierter Raum mit der Norm u = u , u vollständig ist, d.h.
wenn jede Cauchy–Folge (un ) in H einen Grenzwert u ∈ H besitzt.
Wie schon in § 8 : 1.1 gesagt wurde, spielen Hilberträume eine wichtige Rolle
für den Nachweis der Existenz von Lösungen von Differential– und Integralglei-
chungen. Häufig wird dabei der Hilbertraum L2 (Ω) der im Lebesgueschen Sinn
quadratisch integrierbaren Funktionen oder ein passender Teilraum zugrunde-
gelegt, vgl. § 14 : 6.
Der mathematische Formalismus der Quantenmechanik basiert auf der Theorie
linearer Operatoren in komplexen Hilberträumen, Näheres dazu in Kap. VI. Von
besonderer Bedeutung sind hierbei die orthogonalen Projektoren, die wir in
Abschnitt 2 behandeln.
Hauptgegenstand dieses Paragraphen sind Reihenentwicklungen nach Ortho-
normalsystemen in Analogie zu klassischen Fourierreihen.
Die für Hilberträume typische geometrische Betrachtungsweise erlaubt es, ana-
lytische Sachverhalte in eine übersichtliche Form zu bringen.
1.2 Endlichdimenionale Hilberträume

Jeder n–dimensionale Skalarproduktraum V über
ist unitär isomorph zum
n
und daher ein Hilbertraum:
Für jede ONB v1 , . . . , vn von V ist die Koordinatenabbildung
U :V → n
, u → ( v1 , u , . . . , vn , u )
unitär, d.h. linear, bijektiv und isometrisch.
Beweis.
Nach Bd. 1, § 19 : 2.2 ist die Koordinatenabbildung U bijektiv, da jeder Vektor

n
u ∈ V eine eindeutige Basisdarstellung u = vk , u vk besitzt. Die Isometrie
k=1
folgt aus der Parsevalschen Gleichung

n
u2V = | vk , u |2 = U u2n .
k=1
Die Vollständigkeit von V ist wiederum eine Folge der Isometrie. Wir wollen
diesen Schluss wegen der grundsätzlichen Bedeutung des Isomorphiebegriffs an-
schließend in einen allgemeineren Rahmen stellen. 2
222 § 9 Hilberträume
1.3 Isomorphe Skalarprodukträume

Zwei Skalarprodukträume (V1 , · , · 1 ) und (V2 , · , · 2 ) heißen isomorph
oder unitär isomorph, wenn es eine unitäre Abbildung U : V1 → V2 gibt. Die
Abbildung U wird dann unitärer Isomorphismus genannt.
Unitäre Isomorphismen übertragen die lineare Struktur sowie alle topologischen
und geometrischen Eigenschaften.
Für die Vektorraumstruktur bedeutet dies: Linear unabhängige Vektoren gehen
in linear unabhängige über, Dimensionen bleiben erhalten, und es gilt
U (Span {v1 , v2 , . . .}) = Span {U v1 , U v2 , . . .} .
Für einen linearen Operator T : V1 → V1 setzen wir
S := U T U −1 .
Dann ist S : V2 → V2 linear, und es gilt
Bild S = U (Bild T ) , Kern S = U (Kern T ) .
Die lineare Gleichung T u = v ist äquivalent zur linearen Gleichung S(U u) = U v.

Die linearen Operatoren S, T heißen unitär äquivalent.
Da U unitär ist, gilt u − v1 < r genau dann, wenn U u − U v2 < r. Daraus
folgt unmittelbar: (un ) ist Cauchy–Folge in V1 genau dann, wenn (U un ) Cauchy–
Folge in V2 ist, und un → u in V1 ist äquivalent zu U un → U u in V2 . Daher
sind V1 und V2 entweder beide vollständig oder beide unvollständig. Im ersten
Fall heißt U ein Hilbertraumisomorphismus. Eine Teilmenge M von V1 ist
genau dann offen (abgeschlossen, beschränkt, kompakt, dicht), wenn U (M ) die
betreffenden Eigensschaften hat; ferner ist f : V1 ⊃ M → V1 genau dann stetig,
wenn g := U ◦ f ◦ U −1 : U (M ) → V2 stetig ist.
Ê
Für die Übertragung geometrischer Betrachtungen aus dem n auf unendlichdi-
mensionale Skalarprodukträume spielt die Orthogonalität eine wesentliche Rol-
le; dies betrifft vor allem die orthogonalen Projektionen. Da aus der Isometrie
die Erhaltung des Skalarprodukts folgt,
u, v 1 = Uu, Uv 2
(Polarisierungsgleichung), gehen zueinander orthogonale Vektoren in zueinander

orthogonale über und Orthonormalsysteme in Orthonormalsysteme.
Ziel der Hilbertraumtheorie ist es, unter Ausnützung der Vollständigkeit die
Lösbarkeit von Gleichungen, insbesondere Differential– und Integralgleichungen
zu untersuchen. Zu diesem Zweck sind einzig und allein die oben genannten
Strukturmerkmale von Interesse. In dieser Hinsicht haben wir unitär isomorphe
Hilberträume als gleich zu betrachten; sie sind nur verschiedene Ausprägungen
der gleichen mathematischen Struktur.
1 Beispiele für Hilberträume 223
Eines der Hauptergebnisse dieses Paragraphen besteht darin, dass alle separa-
blen Hilberträume unendlicher Dimension isomorph sind und durch den im Fol-
genden beschriebenen Hilbertschen Folgenraum 2 repräsentiert werden können.
1.4 Der Hilbertsche Folgenraum

(a) Satz. Der Folgenraum

,
∞
2 = 2 ( ) := x = (x1 , x2 , . . . ) | xk ∈ |xk |2 < ∞
k=1
versehen mit dem Skalarprodukt

∞
x, y = x k yk
k=1
ist ein Hilbertraum.
Beweis.

2 ist zunächst eine Teilmenge des –Vektorraums aller Folgen, in dem Gleich-
heit und die Vektorraumoperationen auf naheliegende Weise erklärt sind. Die
Vektorraumeigenschaft von 2 und die Konvergenz der das Skalarprodukt dar-
stellenden Reihe ergeben sich unter Verwendung des Majorantenkriteriums für
Reihen aus
1
| αxk + βyk |2 ≤ 2(| α |2 | xk |2 + | β |2 | yk |2 ) , | x k yk | ≤ 2 (| xk |
2
+ | yk |2 ) .
Zum Nachweis der Vollständigkeit betrachten wir eine Cauchy–Folge x(n) =

(n) (n)
(x1 , x2 , . . . ) in 2 . Zu vorgegebenem ε > 0 gibt es also ein nε mit
(m)
∞
(∗) x − x(n) 2 = (m) (n)
|xk − xk |2 < ε2 für m > n > nε .
k=1
(m) (n)
Es folgt |xk − xk | < ε für m > n > nε und jedes feste k ∈ , d.h. jede der
Komponentenfolgen (xk )n∈ ist eine Cauchy–Folge in . Somit existieren die
(n)

(n)
Grenzwerte xk := lim xk (k = 1, 2, . . . ). Für die Folge
n→∞
x = (x1 , x2 , . . . )
ist zu zeigen:
(i) x ∈ 2 , (ii) x − x(n) → 0.
Aus (∗) folgt zunächst

N
(m) (n)
|xk − xk |2 < ε2 für m > n > nε und jede natürliche Zahl N
k=1
und daraus für m → ∞

N
(n)
|xk − xk |2 ≤ ε2 für n > nε und jede natürliche Zahl N .
k=1
Daraus ergibt sich

∞
(n)
|xk − xk |2 ≤ ε2 für n > nε ,
k=1
also x − x(n) ∈ 2 für n > nε und x − x(n) → 0. Da 2 ein Vektorraum ist,

folgt x = x − x(n) + x(n) ∈ 2 . 2
(b) Die Einheitsvektoren
e1 := (1, 0, 0, 0, . . . ) , e2 := (0, 1, 0, 0, . . . ) , e3 := (0, 0, 1, 0, . . . ) , . . .
bilden ein Orthonormalsystem in 2 , aber keine Basis:
20 := Span {e1 , e2 , . . .} = {(x1 , . . . , xN , 0, 0, . . .) | N ∈ , x k ∈ }

ist ein echter Teilraum von 2 , der in 2 dicht liegt.
Denn wegen des Gleichheitsbegriffs in 2 gilt h := (1, 12 , 13 , . . . ) ∈ 2 , aber

h ∈ 20 . Für x = (x1 , x2 , . . .) ∈ 2 und x(n) := (x1 , x2 , . . . , xn , 0, 0, . . .) ∈ 20 gilt

x − x(n) 2 = |xk |2 = |xk |2 − |xk |2 → 0 für n → ∞ .
∞ ∞ n
k=n+1 k=1 k=1
Bemerkungen.
Beachten Sie die Unterschiede zum endlichdimensionalen Fall:
(i) Das ONS e1 , e2 , . . . ist keine ONB und lässt sich auch nicht zu einer ONB
ergänzen, denn jeder zu e1 , e2 , . . . senkrechte Vektor x = (x1 , x2 , . . . ) ist wegen
ek , x = xk der Nullvektor.
(ii) Nicht jeder Teilraum ist abgeschlossen, wie das Beispiel 20 zeigt.
(iii) Nicht jede beschränkte, abgeschlossene Menge ist kompakt. Beispielsweise
√ Einheitskugel {x ∈ | x ≤ 1} die Folge (en ), von
2
enthält die abgeschlossene
der wegen en − em = 2 für n = m keine Teilfolge konvergieren kann.
(c) Der Hilbertsche Folgenraum ist separabel , vgl. § 8: 2.6. Denn die abzählbare
Menge
A = {q = (q1 , . . . , qN , 0, 0, . . .) | N ∈ , Re q k , Im qk ∈ }
liegt dicht in 2 : Zu x = (x1 , x2 , . . .) ∈ 2 , ε > 0 können wir nach (b) ein N ∈

finden mit x(N) = (x1 , . . . , xN , 0, 0, . . .) ∈ Kε (x), und durch geringfügige
Abänderung der xk erhalten wir einen Vektor q = (q1 , . . . , qN , 0, 0, . . .) ∈ A mit
x(N) − q < ε, also insgesamt x − q < 2ε.
2 Abgeschlossene Teilräume und orthogonale Projektionen 225
1.5 Das kartesische Produkt zweier Hilberträume

Für zwei Hilberträumen (H 1 , · , · 1) und (H 2 , · , · 2) ist das kartesische
Produkt
H 1 ×H 2 = {(u, v) | u ∈ H 1 , v ∈ H 2 }
mit dem Skalarprodukt
(u1 , v1 ) , (u2 , v2 ) := u1 , u2 1 + v1 , v2 2
ein Hilbertraum.
Sind H 1 , H 2 separabel, so auch H 1 ×H 2 ÜA .
2 Abgeschlossene Teilräume und orthogonale Projektionen

2.1 Abgeschlossenheit und Vollständigkeit
Sei (E, · ) ein vollständiger normierter Raum (Banachraum) und V ein Teil-
raum. Wir können V , ausgestattet mit der in E gegegebenen Norm, als ei-
genständigen normierten Raum (V, · ) ansehen. Dann gilt der
Satz. (V, · ) ist genau dann vollständig, wenn V als Teilmenge von E abge-
schlossen ist.
Beweis.
(a) Sei V ein abgeschlossener Teilraum von E und (un ) eine Cauchy–Folge in
V . Da (un ) dann auch eine Cauchy–Folge in E ist, existiert u = lim un in E.
n→∞
Aus un ∈ V , un → u folgt u ∈ V , da V abgeschlossen ist.
(b) Sei V nicht abgeschlossen in E. Dann gibt es ein u ∈ E \ V und eine Folge
(vn ) in V mit vn → u. Die Folge (vn ) ist als konvergente Folge eine Cauchy–
Folge in V ohne Grenzwert in V . 2
2.2 Beispiele abgeschlossener Teilräume

(a) Jeder endlichdimensionale Teilraum eines Hilbertraums ist abgeschlossen.
Das folgt aus 2.1 und 1.2.
(b) Für jeden festen Vektor v eines Skalarproduktraums V über ist die

Funktion Lv : V → , u → v , u linear und stetig, denn aus un → u
folgt | v , un − v , u | = | v , un − u | ≤ v · un − u → 0. Daher ist
Kern Lv = {u ∈ V | v , u = 0} ein Teilraum von V und als Nullstellenmenge
einer stetigen Funktion auf einer abgeschlossenen Menge abgeschlossen.
(c) Orthogonalräume. Für jede nichtleere Teilmenge M eines Skalarprodukt-
raums V ist
M ⊥ := {u ∈ V | u , v = 0 für alle v ∈ M }
ein abgeschlossener Teilraum von V .

Denn aus (b) folgt wegen
8
M⊥ = Kern Lv ,
v∈M
dass M ⊥ als Durchschnitt abgeschlossener Teilräume ein abgeschlossener Teil-

raum ist. Für spätere Zwecke notieren wir:
(i) M ⊂ M ⊥⊥ := (M ⊥ )⊥ ,
(ii) M ⊂ N =⇒ N ⊥ ⊂ M ⊥ ÜA .
(d) In unendlichdimensionalen Skalarprodukträumen ist nicht jeder Teilraum

abgeschlossen. Der allgemeine Beweis dieser Aussage folgt später. Ein Beispiel
liefert der Teilraum 20 von 2 .
2.3 Orthogonale Projektion auf einen abgeschlossenen Teilraum

Satz. Sei V ein abgeschlossener Teilraum eines Hilbertraums H . Dann gibt
es zu jedem Vektor u ∈ H einen eindeutig bestimmten Vektor P u ∈ V mit
u − P u = dist (u, V ), d.h.
u − P u ≤ u − v für alle v ∈ V .
Weiter gilt
u − P u ⊥ V für alle u ∈ H ,
u = P u ⇐⇒ u ∈ V.
P u heißt die orthogonale Projektion von u auf V .

Bemerkung. Auf die Abgeschlossenheit von V kommt es wesentlich an. Ist ein
Teilraum V nicht abgeschlossen, so gibt es ein u ∈ V \ V . Für u existiert kein
v ∈ V mit u − v = dist (u, V ) = 0, denn dann wäre v = u ∈/ V.
In unvollständigen Skalarprodukträumen gilt kein entsprechender Satz.
Beweis.
(a) Existenz eines Punktes kleinsten Abstandes. Sei u ∈ H und

d := dist (u, V ) = inf u − v | v ∈ V .
Dann gibt es eine Minimalfolge (vn ) aus V mit
1
d2 ≤ u − vn 2 < d2 + (n = 1, 2, . . .) .
n
Wir zeigen, dass (vn ) eine Cauchy–Folge ist. Dazu verwenden wir die Parallelo-
grammgleichung a + b2 +a − b2 = 2a2 +2b2 und setzen a := 12 (u−vn ),
b := 12 (u − vm ). Beachten wir, dass a − b = 12 (vm − vn ), a + b = u − 12 (vn + vm )

und dass 21 (vn + vm ) zu V gehört, so erhalten wir für m > n
2
d2 + 1
4
vm − vn 2 ≤ u − 1
2
(vn + vm ) + 1
4
vm − vn 2
= 1
2
u − vn 2 + 1
2
u − vm 2
< d2 + 1
2n
+ 1
2m
< d2 + 1
n
,
also vm − vn 2 < n4 für m > n. Da V nach 2.1 vollständig ist, gibt es ein
v0 ∈ V mit vn → v0 . Wegen der Stetigkeit der Norm folgt
u − v0 = lim u − vn = d .
n→∞
(b) Eindeutigkeit. Hat auch v∗ ∈ V von u den Abstand d, so ergibt die Paral-
lelogrammgleichung mit a = 12 (u − v0 ), b = 12 (u − v∗ ) wie oben

v∗ − v0 2 ≤ u − 12 (v∗ + v0 ) +
2
d2 + 1
4
1
4
v∗ − v0 2
= 1
2
u − v0 2 + 1
2
u − v∗ 2 = d2 ,
also v∗ − v0 = 0.
(c) Es genügt zu zeigen, dass u − P u ⊥ v für alle v ∈ V mit v = 1. Sei also
v0 := P u, v ∈ V mit v = 1 und α := v , u − v0 . Dann erhalten wir
d2 ≤ u − (v0 + αv)2 = u − v0 − αv , u − v0 − αv
= u − v0 2 − α v , u − v0 − α u − v0 , v + |α|2 = d2 − |α|2 ,
also α = 0.
(d) Aus P u = u folgt u ∈ V wegen P u ∈ V . Für u ∈ V folgt umgekehrt
u − P u = dist (u, V ) = 0, somit P u = u. 2
2.4 Der Zerlegungssatz

Für jeden abgeschlossenen Teilraum V des Hilbertraums H gilt
H = V ⊕ V ⊥,
d.h., jeder Vektor u ∈ H besitzt eine eindeutige Zerlegung
u = v + w mit v ∈ V und w ∈ V ⊥ .
Hierbei ist v = P u die orthogonale Projektion von u auf V , und es gilt
u2 = v2 + w2 .

Beweis.
Nach 2.3 gilt u = P u + (u − P u) mit P u ∈ V und u − P u ∈ V ⊥ . Also gibt es
eine Zerlegung der behaupteten Art. Diese ist eindeutig: Aus
u = v1 + w1 = v2 + w2 mit v1 , v2 ∈ V , w1 , w2 ∈ V ⊥
folgt V v1 − v2 = w2 − w1 ∈ V ⊥ . Daher ist v1 − v2 zu sich selbst orthogonal:

0 = v1 − v2 , v1 − v2 = v1 − v2 2 . Es folgt v1 = v2 , also auch w1 = w2 .
Die letzte Behauptung ergibt sich aus u2 = v + w , v + w und v , w = 0.
2
2.5 Biorthogonalräume
(a) Für abgeschlossene Teilräume V eines Hilbertraums H gilt V ⊥⊥ = V .
⊥
(b) Für beliebige Teilräume U gilt U ⊥⊥ = U und U ⊥ = U .
Beweis.
(a) Für u ∈ V gilt u , v = 0 für alle v ∈ V ⊥ , also u ∈ V ⊥⊥ := (V ⊥ )⊥ .
Umgekehrt folgt für u ∈ V ⊥⊥ nach dem Zerlegungssatz
u = v + w mit v ∈ V ⊂ V ⊥⊥ und w ∈ V ⊥ .
Wegen w = u − v ∈ V ⊥⊥ ∩ V ⊥ erhalten wir w , w = 0, also w = 0, somit

u=v ∈V.
(b) Wie oben ergibt sich U ⊂ U ⊥⊥ . Da Orthogonalräume nach 2.2 (c) abge-
schlossen sind, folgt U ⊂ U ⊥⊥ . Durch zweimalige Anwendung des Schlusses
⊥⊥
M ⊂ N =⇒ N ⊥ ⊂ M ⊥“ folgt aus U ⊂ U die Inklusion U ⊥⊥ ⊂ U = U,
”
Letzteres nach (a). Somit ist U = U ⊥⊥ .
⊥
(c) Wegen U ⊂ U ist U ⊂ U ⊥ . Für v ∈ U ⊥ und w = lim un mit un ∈ U
n→∞
⊥
folgt v , w = lim v , un = 0. Also gilt auch U ⊥ ⊂ U . 2
n→∞
2.6 Orthogonale Projektoren

Satz. Die orthogonale Projektion auf einen abgeschlossenen Teilraum V des
Hilbertraums H liefert einen linearen Operator P : H → H mit den Eigen-
schaften
(a) P2 = P ,
(b) u, P v = P u, v für alle u, v ∈ H .
Umgekehrt vermittelt jeder orthogonale Projektor, d.h. jeder lineare Opera-

tor P : H → H mit (a), (b), die orthogonale Projektion auf den abgeschlos-
senen Teilraum V := Bild P .
Demnach besteht eine 1–1–Korrespondenz zwischen den abgeschlossenen Teil-

räumen V von H und den orthogonalen Projektoren. Letztere haben die wei-
teren Eigenschaften
(c) u , P u = P u2 .
(d) P ist stetig: P u ≤ u,
und Gleichheit gilt genau dann, wenn P u = u, d.h. u ∈ V .
(e) ½−P ist der orthogonale Projektor auf V ⊥ .
Beweis.
(1) Sei P u die orthogonale Projektion von u auf V . Aus 2.3 entnehmen wir
P u = u ⇐⇒ u ∈ V . Wegen P u ∈ V folgt P 2 u = P u für alle u ∈ H .
(2) Linearität. Seien u1 = v1 + w1 , u2 = v2 + w2 mit v1 , v2 ∈ V , w1 , w2 ∈ V ⊥ .
Dann gilt für α1 , α2 ∈
α1 u1 + α2 u2 = α1 v1 + α2 v2 + α1 w1 + α2 w2 ;
dabei gilt α1 v1 + α2 v2 ∈ V , α1 w1 + α2 w2 ∈ V ⊥ . Wegen der Eindeutigkeit der

Zerlegung folgt
P (α1 u1 + α2 u2 ) = α1 v1 + α2 v2 = α1 P u1 + α2 P u2 .
(3) Symmetrie. Wegen u − P u ⊥ V folgt u − P u ⊥ P v, ebenso v − P v ⊥ P u,
also
0 = u − P u, P v = u, P v − P u, P v ,
0 = P u, v − P v = P u, v − P u, P v .
Subtraktion dieser beiden Gleichungen ergibt die Behauptung.
(4) Der lineare Operator P : H → H habe die Eigenschaften (a),(b).
P ist linear, also ist V = Bild P ein linearer Teilraum. Es gilt v ∈ V ⇐⇒
P v = v, denn v = P u ∈ V =⇒ P v = P 2 u = P u = v.
Umgekehrt gilt P v = v =⇒ v ∈ Bild P = V . Bevor wir zeigen, dass V
abgeschlossen ist und P u die orthogonale Projektion von u auf V , notieren wir,
dass wegen (b) und (a) die Behauptung

(c) P u2 = P u , P u = u , P 2 u = u , P u
folgt. Daraus ergibt sich nach der Cauchy–Schwarzschen Ungleichung
(d) P u2 ≤ P u · u
mit Gleichheit genau dann, wenn u und P u linear abhängig sind, d.h. wenn
P u = 0 oder wenn u ein Vielfaches von P u ist und damit u ∈ V gilt. Das ergibt
P u ≤ u mit Gleichheit genau dann, wenn u ∈ V .
(5) Die Stetigkeit von P folgt aus P u − P un = P (u − un ) ≤ u − un .

(6) V ist abgeschlossen. Für die Vektoren vn ∈ V gelte vn → v. Nach (4) und
(5) folgt v = lim vn = lim P vn = P v, also v ∈ V .
n→∞ n→∞
(7) P u ist die orthogonale Projektion von u auf V . Wegen

u = Pu + u − Pu mit Pu ∈ V
ist nur zu zeigen, dass u − P u ∈ V ⊥ . Dann folgt die Behauptung aus dem
Zerlegungssatz 2.4. Sei also v ∈ V , d.h. v = P v nach (4). Dann gilt

u − P u , v = u − P u , P v = P u − P 2u , v = 0
wegen (b) und (a).
(8) ½ − P ist die orthogonale Projektion auf V ⊥ . Offenbar ist ½ − P ein ortho-
gonaler Projektor, also u ∈ Bild (½ − P ) ⇐⇒ u = (½ − P )u ⇐⇒ P u = 0
⇐⇒ u ∈ V ⊥ nach dem Zerlegungssatz. 2
2.7 Aufgaben
(a) Zeigen Sie für orthogonale Projektoren P1 , P2 :
Bild P1 ⊂ Bild P2 ⇐⇒ P1 P2 = P2 P1 = P1 ⇐⇒ P1 ≤ P2 .
Dabei bedeutet P1 ≤ P2 wie üblich u , P1 u ≤ u , P2 u für alle u ∈ H und
ist nach 2.6 (c) gleichbedeutend mit P1 u ≤ P2 u für alle u ∈ H .
Anleitung: Bild P1 ⊂ Bild P2 ⇐⇒ P2 P1 = P1 ergibt sich leicht. P1 P2 = P1
folgt dann mit dem Zerlegungssatz für P2 . Der Rest ergibt sich aus 2.6 (c), (d).
(b) Im Fall P1 P2 = P2 P1 ist P1 P2 die orthogonale Projektion auf den Raum
Bild P1 ∩ Bild P2 .
(c) Jeder abgeschlossene Teilraum eines separablen Hilbertraums ist separabel.
2.8 Der Darstellungssatz von Riesz–Fréchet

Ein lineares, stetiges Funktional auf einem normierten Raum (V, · ) über

ist eine lineare, stetige Funktion L : V → . Der Vektorraum aller linearen,
stetigen Funktionale auf V heißt Dualraum V ∗ von V . Für L ∈ V ∗ existiert

L := sup |Lu| | u ≤ 1 ,
denn andernfalls gäbe es Vektoren un mit un ≤ 1 und |Lun | ≥ n für n =
1, 2, . . . . Für die Vektoren vn := un /Lun wäre dann lim vn = 0, aber Lvn = 1
für n ∈ . n→∞
Es ist leicht zu sehen, dass durch L eine Norm auf V ∗ gegeben ist ÜA .
Für jeden Vektor v eines Skalarproduktraums liefert Lv : u → v , u ein linea-
res stetiges Funktional, vgl. 2.2 (b). In Hilberträumen gilt auch die Umkehrung:
Satz. Zu jedem linearen, stetigen Funktional L auf einem Hilbertraum H gibt

es einen eindeutig bestimmten Vektor v ∈ H mit
Lu = v , u für alle u ∈ H ,
und es gilt
L = v .
Hiernach sind H ∗ und H normisomorph. In der Physikliteratur werden die

Hilbertraumvektoren meist als ket–Vektoren | u , die linearen Funktionale als
bra–Vektoren v | dargestellt. Das in der bracket–Form v | u geschriebene
Skalarprodukt entsteht dann durch Zusammenfügen bra–ket. Bei abweichender
Notation des Skalarprodukts, d.h. wenn Linearität im ersten Argument vorliegt,
sind die Rollen von bra– und ket–Vektoren zu vertauschen.
Beweis.
(a) Für L = 0 gilt 0 = Lu = 0 , u für alle u ∈ H . Umgekehrt folgt aus
0 = Lu = v , u für alle u ∈ H insbesondere Lv = v , v = 0, also v = 0.
(b) Im Fall L = 0 ist V := Kern L ein echter Teilraum und abgeschlossen als
Nullstellenmenge einer stetigen Funktion. Daher gilt nach dem Zerlegungssatz
H = V ⊕ V ⊥ mit V ⊥ = {0} .
Wenn die Behauptung des Satzes stimmt, so gibt es einen Vektor v = 0 mit

V = Kern L = u ∈ H | v , u = 0 = Span {v}⊥ ,
also V ⊥ = Span {u}⊥⊥ = Span {v} nach 2.5 (a). Da V ⊥ eindimensional ist,
besitzt nach dem Zerlegungssatz jeder Vektor u ∈ H eine eindeutige Zerlegung
u = u0 + αw mit u0 ∈ V , α ∈ und einem festen Vektor 0 = w ∈ V ⊥ .
Ausgehend von dieser Zielvorstellung konstruieren wir jetzt den gesuchten Vek-
tor v. Wegen V ∩ V ⊥ = {0} gilt Lw = 0 für 0 = w ∈ V ⊥ . Wir wählen einen
Vektor w ∈ V ⊥ mit Lw = 1.
Für einen gegebenen Vektor u ∈ H suchen wir eine Darstellung u = u0 +αw mit

u0 ∈ V und α ∈ . Notwendig dafür ist Lu = 0+αLw = α, also u0 = u−Lu·w.
Umgekehrt: Für u0 := u − Lu · w gilt Lu0 = Lu − Lu = 0. Wir erhalten also
u = u0 + Lu · w mit u0 ∈ V , w ∈ V ⊥
und daraus
w , u = Lu · w2 .
Es folgt Lu = v , u mit v = w/w2 .
(c) v ist dadurch eindeutig bestimmt. Aus v , u = v ∗ , u für alle u ∈ H
folgt v − v ∗ ⊥ H , insbesondere v − v ∗ , v − v ∗ = 0, also v = v ∗ .
(d) Wir zeigen L = v: Für u ≤ 1 folgt nach Cauchy–Schwarz
|Lu| = | v , u | ≤ v · u ≤ v .
Dabei gilt Gleichheit für u = v/v. 2
Bemerkung. In dem (nicht vollständigen) Skalarproduktraum C[−1, 1] mit

1 1
u, v = u(x) v(x) dx sei L das durch Lu := u(x) dx gegebene lineare
−1 0
stetige Funktional. Dieses läßt sich nicht in der Form Lu = v , u darstellen; v
müsste die Heavyside–Funktion χ[0,1] sein. Diese gehört aber nicht zu C[−1, 1].
3 Dichte Teilräume
3.1 Beispiele
(a) Die Treppenfunktionen in Ω bil-
den einen dichten Teilraum von L2 (Ω), δ
vgl. § 8: 2.6.
(b) Der Raum C0 [a, b] der stetigen f ϕ

Funktionen f : [a, b] →
mit f (a) =
b
f (b) = 0 liegt dicht in L2 [a, b]. • •-
a
Denn sei u ∈ L2 [a, b] und ε > 0 gege-
ben. Dann gibt es eine Treppenfunktion
ϕ auf [a, b] mit u − ϕ < ε. Zu dieser
gibt es nach der nebenstehenden Skizze
eine PC1 –Funktion f ∈ C0 [a, b] mit
f − ϕ < ε , also
f − u ≤ f − ϕ + ϕ − u < 2ε .
ÜA Geben Sie für ϕ = χ[α,β] und für ε > 0 ein f ∈ PC [α, β] ∩ C0 [α, β] an
1
mit f − u ≤ ε.
(c) Die Polynome liegen dicht in L2 [a, b], daher liegt auch C∞ [a, b] dicht.
Denn seien u ∈ L2 [a, b] und f ∈ C[a, b] mit f − u < ε. Nach dem Weierstraß-
schen Approximationssatz § 6: 2.9 gibt es dann ein Polynom p mit
√
f − p ≤ b − a f − p∞ < ε , also u − p < 2ε .
(d) Für die Differentialgleichungstheorie ist es von fundamentaler Bedeutung,

Ê
dass für jedes Gebiet Ω ⊂ n der Raum C∞ ∞
c (Ω) aller C –Funktionen mit
kompaktem Träger in Ω dicht liegt in L2 (Ω). Näheres dazu folgt im nächsten
Paragraphen.
4 Vollständige Orthonormalsysteme 233
3.2 Das Fundamentallemma

Für eine dichte Teilmenge eines Skalarproduktraums kann nur der Nullvektor
orthogonal sein.
Denn sei D dicht im Skalarproduktraum V und u ⊥ D . Da es eine Folge von
Vektoren un ∈ D gibt mit u = lim un , folgt mit der Stetigkeit des Skalar-
n→∞
produkts
u2 = u , u = lim u , un = 0 ,
n→∞
also u = 0 .
4 Vollständige Orthonormalsysteme
4.1 Problemstellung, Beispiele für symmetrische Operatoren
Orthonormalsysteme (ONS) treten u.a. im Zusammenhang mit symmetrischen
Operatoren auf. In endlichdimensionalen Skalarprodukträumen V gibt es be-
kantlich zu jedem symmetrischen Operator T eine Orthonormalbasis (v1 , . . . , vn )
aus Eigenvektoren, und jeder Vektor u ∈ V besitzt die Darstellung

n
u = vk , u vk .
k=1
Wir erörtern an zwei Beispielen die Verallgemeinerung auf symmetrische Ope-

ratoren im Unendlichdimensionalen und die Bedeutung der Methode.

(a) Wir betrachten den Raum C20 [0, π] := u ∈ C2 [0, π] | u(0) = u(π) = 0 ,
2
π
versehen mit dem Skalarprodukt u , v := π
u(x) v(x) dx , und den Operator
0
A : C20 [0, π] → C0 [0, π] , u → − u .
Durch zweimalige partielle Integration unter Berücksichtigung der Randbedin-
gungen erhalten wir die Symmetriebedingung u , Av = Au , v für u, v ∈
C20 [0, π] ÜA . Sämtliche Eigenwerte λ und Eigenfunktionen v von A wurden
schon in § 6: 1.2 bestimmt: Diese sind gegeben durch
vk (x) = sin kx zu den Eigenwerten λk = k2 (k = 1, 2, . . .).
Nach Wahl des Skalarprodukts bilden die vk ein ONS, und für u ∈ C20 [0, π]
erhalten wir nach § 6 : 2.8 die gleichmäßig konvergente Reihenentwicklung

∞
2
π
u(x) = bk sin kx mit bk = π
u(t) sin kt dt = vk , u .
k=1 0
Hier tritt an die Stelle der Basisdarstellung im endlichdimensionalen Fall die

gleichmäßig und daher im Quadratmittel konvergente Reihenentwicklung

∞
(∗) u = vk , u vk .
k=1
(b) Sei Ω ⊂ Ê 3
ein Gaußsches Gebiet und

V := u ∈ C2 (Ω) ∩ C1 (Ω) | u(x) = 0 auf ∂Ω
mit dem von L2 (Ω) herkommenden Skalarprodukt versehen. Aus Bd. 1, § 26 : 5.7
entnehmen wir u , Δv = Δu , v für u, v ∈ V ; also ist der Laplace–Operator
u → − Δu symmetrisch, und Eigenvektoren zu verschiedenen Eigenwerten sind
zueinander orthogonal. Wir werden später zeigen, dass es eine Folge positiver
Eigenwerte λn mit eindimensionalen Eigenräumen gibt mit λn → ∞. Daher
gibt es ein ONS v1 , v2 , . . . zugehöriger Eigenvektoren, und wir können wieder
fragen, ob für jedes u ∈ V eine Reihenentwicklung der Form (∗) besteht. Ist
dies der Fall, so können wir ähnlich wie in § 6 : 4 das Wärmeleitungsproblem
∂u
= Δu in Ω , u = 0 auf ∂Ω , u(x, 0) = f (x) für x ∈ Ω
∂t
mit der Separationsmethode angehen: Der Produktansatz u(x, t) = w(t) v(x)
für Lösungen u ∈ V der Wärmeleitungsgleichung führt über
ẇ(t) Δv(x)
=
w(t) v(x)
auf das Eigenwertproblem −Δv = λv, v ∈ V und die Bedingung ẇ = −λw. Aus
(∗) folgt dann für jede Lösung u ∈ V des Wärmeleitungsgleichungsproblems

∞
(∗∗) u(x, t) = bk e−λk t vk (x) mit bk = vk (x) u(x, 0) d3 x = vk , f ,
k=1 Ω
also ist das oben gestellte Anfangs–Randwertproblem eindeutig lösbar. Unter

geeigneten Bedingungen an die Anfangswerte f (x) = u(x, 0) liefert die Reihe
(∗∗) eine Lösung.
Bei diesem und ähnlich gelagerten Problemen erweist es sich als zweckmäßig,
das Entwicklungsproblem (∗) in zwei Schritten zu behandeln:
(i) Es wird nachgewiesen, dass (∗) im Hilbertraumsinn gilt, d.h.

n
lim u − vk , u vk = 0 für jedes u ∈ V.
n→∞ k=1
(ii) Wenn dies aufgrund der im Folgenden entwickelten allgemeinen Kriterien

sichergestellt ist, sind Bedingungen aufzustellen, unter denen die Reihe (∗∗) eine
gliedweis differenzierbare Lösung des vorgelegten Problems liefert.
4.2 Orthogonalreihen
Konvergenz von unendlichen Reihen in Skalarprodukträumen definieren
wir durch

∞
n
u = uk : ⇐⇒ lim u − uk = 0 .
k=1 n→∞ k=1
Wir sprechen von einer Orthogonalreihe, wenn ui , uk = 0 für i = k gilt.

Für Orthogonalreihen gilt:

∞
∞
(a) u = uk =⇒ u2 = uk 2 .
k=1 k=1

∞
(b) In Hilberträumen ist die Konvergenz einer Orthogonalreihe uk äqui-
k=1
∞
valent zur Konvergenz der Reihe uk 2 .
k=1
Der Beweis stützt sich auf den verallgemeinerten Satz von Pythagoras

n 2
n
n
n
(P ) uk = ui , uk = uk 2 .
k=m i=m k=m k=m
Wegen der Stetigkeit der Norm schließen wir daraus

n
n
n
uk =⇒ u2 = lim uk = lim
2
u = lim uk 2
n→∞ k=1 n→∞ k=1 n→∞ k=1
und damit (a).

n
Für (b) beachten wir, dass die Folge der Partialsummen sn = uk in einem
k=1
vollständigen Raum genau dann konvergiert, wenn diese das Cauchy–Kriterium
erfüllt. Daher folgt (b) unmittelbar aus (P ). 2
4.3 Fourierkoeffizienten, Entwicklungsproblem und Besselsche Un-

gleichung
(a) Im folgenden sei V ein unendlichdimensionaler Skalarproduktraum über
und v1 , v2 , . . . ein abzählbares Orthonormalsystem. Wir fragen nach Bedingun-

∞
gen für das Bestehen einer Reihenentwicklung u = λk vk mit geeigneten
Koeffizienten λk ∈ . Eine erste Auskunft darüber gibt der k=1
Satz. Eine Reihenentwicklung

∞
u = λk vk
k=1
kann nur bestehen, wenn

λk = vk , u für k = 1, 2, . . . .
Die Zahlen vk , u heißen (verallgemeinerte) Fourierkoeffizienten von u be-

züglich des ONS v1 , v2 , . . . .
Der Zusammenhang mit den in § 6 : 2.1 definierten klassischen Fourierkoeffizien-
ten ergibt sich aus 4.1 (a), vgl. auch 4.5.
Beweis.

∞
n
Aus u = λk vk = lim λk vk folgt wegen der Stetigkeit des Skalarpro-
k=1 n→∞ k=1
dukts

n
vm , u = lim vm , λk vk (m = 1, 2, . . .).
n→∞ k=1
Für n ≥ m gilt aber

n
n
vm , λk vk = λk vm , vk = λm . 2
k=1 k=1
(b) Für die Fourierkoeffizienten von u gilt die Besselsche Ungleichung

∞
| vk , u |2 ≤ u2 .
k=1
Denn nach Bd. 1, § 19 : 2.5 gilt die für das folgende fundamentale Beziehung

n
n
(∗∗) u − vk , u vk = u2 −
2
| vk , u |2 (n = 1, 2, . . . ).
k=1 k=1
Es folgt

.
n
| vk , u |2 ≤ u2 für alle n ∈
k=1
Ist daher v1 , v2 , . . . ein ONS in einem Hilbertraum H , so konvergiert für jeden

∞
Vektor u ∈ H die (verallgemeinerte) Fourierreihe vk , u vk bezüglich der
k=1
Norm gegen einen Vektor v ∈ H . Dies folgt aus § 9 : 4.2 (b) unter Beachtung
von vk , u vk 2 = | vk , u |2 .
(c) Der Grenzwert v der Fourierreihe von u ist i.A. von u verschieden, Näheres
in 4.9. Von fundamentaler Bedeutung ist daher das Entwicklungsproblem:
Unter welchen Voraussetzungen gilt

∞
(∗) u = vk , u vk für alle u ∈ H ?
k=1
4.4 Vollständige Orthonormalsysteme

Satz. Für ein ONS v1 , v2 , . . . in einem unendlichdimensionalen Skalarpro-
duktraum V sind folgende Bedingungen äquivalent:

∞
(a) u = vk , u vk für jeden Vektor u ∈ V .
k=1
(b) Für jeden Vektor u ∈ V gilt die Parsevalsche Gleichung

∞
u2 = | vk , u |2 .
k=1
(c) Für alle Vektoren u, v ∈ V gilt die Parsevalsche Gleichung in polarisierter

Form

∞
u, v = vk , u vk , v .
k=1
(d) Die Linearkombinationen der vk liegen dicht in V .

Ein Orthonormalsystem mit diesen Eigenschaften nennen wir vollständig.
Bemerkungen.
(i) Beispiele folgen in 4.5, 4.6.
(ii) Besitzt ein Skalarproduktraum V ein vollständiges ONS, so ist er separabel,
d.h. er enthält eine abzählbare dichte Menge, vgl. § 8: 2.6. Denn die Vektoren

N
der Form λk vk liegen dicht in V , und jeder solche Vektor läßt sich durch
k=1

N
Vektoren der Form μk vk mit Re μk , Im μk ∈ beliebig gut approximieren.
k=1
Letztere bilden eine abzählbare Menge. In 4.7 zeigen wir, dass umgekehrt jeder
separable Skalarproduktraum ein vollständiges ONS besitzt.
(e) Ein wichtiges Kriterium zum Nachweis der Vollständigkeit eines ONS ist
das folgende:
Satz. Ein ONS v1 , v2 , . . . in einem Hilbertraum H ist genau dann vollständig,
wenn gilt:
Aus u ⊥ vk für k = 1, 2, . . . folgt u = 0 ,
d.h. wenn nur der Nullvektor auf allen vk senkrecht steht.
Beweis.
(a) ⇐⇒ (b) nach 4.3 (∗∗).
(c) =⇒ (b) mit u = v.
(a) =⇒ (c): Wegen der Stetigkeit und der Linearität von v → u , v gilt

n
n
u, v = lim u, vk , v vk = lim vk , v u , vk
n→∞ k=1 n→∞ k=1

∞
= vk , u vk , v .
k=1
Damit sind (a), (b), (c) äquivalent.

(a) =⇒ (d) ist offensichtlich.
Dass (d) umgekehrt (a) zur Folge hat, ergibt sich aus der Beziehung

u − λk vk 2 = u2 − | vk , u |2 + | λk − vk , u |2
n n n
k=1 k=1 k=1

n
n 2
≥ u −2
| vk , u | = u −
2
vk , u vk
k=1 k=1
(Bd. 1, § 19 : 2.3 und 4.3 (∗∗)): Wir fixieren ein u ∈ V . Nach (d) gibt es zu

N
vorgegebenem ε > 0 eine Linearkombination w = λk vk mit u − w < ε.
k=1
Nach den oben angegebenen Beziehungen folgt dann für alle n ≥ N

u − vk , u vk 2 = u2 − | vk , u |2
n n
k=1 k=1
N
N 2
≤ u − 2
| vk , u |2 = u − vk , u vk
k=1 k=1

N 2
≤ u − λk vk < ε nach 4.3 (a).
k=1
(e) Die Bedingung

vk , u = 0 für k = 1, 2, . . . =⇒ u = 0
läßt sich auch so ausdrücken: Für W := Span {v1 , v2 , . . .} gilt W ⊥ = {0}.
Da W ⊥ ein abgeschlossener Teilraum von H ist, gilt nach dem Zerlegungssatz
2.4 H = W ⊥ ⊕ W ⊥⊥ . Somit ist die Bedingung W ⊥ = {0} äquivalent zur
Bedingung W ⊥⊥ = H . Nach 2.5 (b) ist aber W ⊥⊥ = W . Also ist W ⊥ = {0}
äquivalent zu W = H , d.h. dazu, dass die Linearkombinationen der vk dicht
in H liegen. Beachten Sie, dass Satz 2.5 und damit das Kriterium (e) die
Vollständigkeit des Skalarproduktraums voraussetzen! 2
4.5 Die Vollständigkeit der trigonometrischen Funktionen

(a) Wir betrachten H = L2 ([−π, π]) mit dem Skalarprodukt
1
π
u , v := π
u(x) v(x) dx .
−π
Offenbar ist H ein Hilbertraum, und durch

1
√
v1 (x) = 2
,
v2 (x) = sin x , v3 (x) = cos x ,
v4 (x) = sin 2x , v5 (x) = cos 2x , . . .
ist ein ONS gegeben. Für die Fourierkoeffizienten
1
π 1
π
ak = π
u(x) cos kx dx , bk = π
u(x) sin kx dx
−π −π
√
gilt dann a0 = 2 v1 , u und
ak = v2k+1 , u , bk = v2k , u für k ∈ .
Für 2π–periodische PC1 –Funktionen u konvergiert nach dem Satz von Dirichlet
(§ 6: 2.3) die Fourierreihe
1

∞
∞
(∗) u(x) = 2
a0 + (ak cos kx + bk sin kx) = vk , u vk (x)
k=1 k=1
gleichmäßig, also auch im Quadratmittel, d.h. in der L2 –Norm (§ 8 : 2.1 (d) (iii)).
Nach 3.1 (b) liegen die PC1 –Funktionen u mit u(−π) = u(π) = 0 dicht in H .
Mit dem Kriterium 4.4 (d) erhalten wir somit den
Satz. Das ONS v1 , v2 , . . . der trigonometrischen Funktionen ist vollständig.

Für jede Funktion u ∈ L2 ([−π, π]) konvergiert die Fourierentwicklung (∗) im
Quadratmittel .
Folgerung. Für jedes u ∈ L2 ([−π, π]) gilt die Parsevalsche Gleichung

1 π ∞

| u(x) |2 dx = 1
2
|a0 |2 + |ak |2 + |bk |2 .
π −π k=1
Aufgabe. Gewinnen Sie die Eulerschen Formeln

π2 ∞
1 π4 ∞
1
= 2
, = 4
6 k=1 k 90 k=1 k
durch Anwendung der Parsevalschen Gleichung auf die Funktionen u(x) = x

und u(x) = x2 .
(b) Satz. Durch

2
vk (x) = π
sin kx (k = 1, 2, . . . )
ist ein vollständiges ONS auf L2 ([0, π]) gegeben, vgl. 4.1.
Das ergibt sich wie oben: V := {u ∈ PC1 [0, π] | u(0) = u(π) = 0} liegt nach
3.1 (b) dicht in L2 ([0, π]), und für die Funktionen von V gilt der gleichmäßige
Entwicklungssatz § 6 : 2.7.
4.6 Die Vollständigkeit der Legendre–Polynome

Orthonormalisieren wir die Folge der Potenzen uk (x) = xk (k ∈ ) bezüglich
0
1
des Skalarprodukts u, v = u v , so erhalten wir ein ONS v0 , v1 , . . . mit
−1
Span {u0 , . . . , un } = Span {v0 , . . . , vn } (n = 0, 1, . . .). Die Linearkombinatio-
nen der vk sind also Polynome. Diese liegen dicht in L2 ([−1, 1]), vgl. 3.1 (c).
Nach dem Kriterium 4.4 (d)bilden also die v0 , v1 , . . . ein vollständiges ONS für
L2 ([−1, 1]). Die Pn (x) = 2
2n+1
vn (x) (n = 0, 1, 2, . . . ) sind die Legendre–
Polynome, vgl. § 4 : 4.5 und § 15 : 3.4.
4.7 Die Existenz vollständiger Orthonormalsysteme

Satz. In jedem unendlichdimensionalen, separablen Skalarproduktraum V gibt
es vollständige Orthonormalsysteme v1 , v2 , . . . .
Beweis.

Sei A = {an | n ∈ } eine abzählbare, in V dichte Folge. Wir zeigen durch
Induktion: Es gibt eine Teilfolge ( ank ), so dass u1 = an1 , . . . , um = anm jeweils
linear unabhängig sind und dass
{a1 , a2 , . . . , anm } ⊂ Span {u1 , . . . , um } .
Ist dies gezeigt, so folgt A ⊂ Span {u1 , u2 , . . .}, also ist Span {u1 , u2 , . . .}
dicht in V . Konstruieren wir dann mit dem Orthonormalisierungsverfahren von
Gram–Schmidt ein ONS v1 , v2 , . . . mit
Span {v1 , . . . , vn } = Span {u1 , . . . , un } (n = 1, 2, . . .),
so ist nach dem Kriterium 4.4 (d) das ONS v1 , v2 , . . . vollständig.

Zum Induktionsbeweis. Sei an1 das erste von Null verschiedene Folgenglied und
u1 := an1 . Dann gilt {a1 , . . . , an1 } ⊂ Span {u1 }. Sind u1 = an1 , . . . uk = ank
linear unabhängig und {a1 , . . . , ank } ⊂ Sk := Span {u1 , . . . , uk }, so setzen wir
M = {n > nk | an ∈ Sk } , nk+1 := min M und uk+1 := ank+1 .
(M ist nichtleer, sonst wäre A ⊂ Sk , also V = A ⊂ S k = Sk , da Sk als

endlichdimensionaler Teilraum nach 3.1 (b) abgeschlossen ist.)
Nach Konstruktion sind u1 , . . . , uk+1 linear unabhängig, und es gilt
{a1 , . . . , ank+1 } ⊂ Span {u1 , . . . , uk+1 }. 2
4.8 Der Isomorphiesatz

Jeder unendlichdimensionale separable Hilbertraum H über ist unitär iso-
morph zu 2 = 2 ( ).
Einen Hilbertraumisomorphismus U : H → 2 erhalten wir wie folgt: Wir
wählen ein vollständiges ONS v1 , v2 , . . . für H und setzen
U u := ( v1 , u , v2 , u , . . . ) .
U entspricht der Koordinatenabbildung 1.2 im endlichdimensionalen Fall. We-

gen dieser Analogie heißt ein vollständiges ONS auch Hilbertraumbasis, ob-
wohl es im unendlichdimensionalen Fall sicher keine Basis ist. Zur Bedeutung
des Isomorphiebegriffs wird auf die Bemerkungen 1.2 verwiesen.
Es gibt also im Wesentlichen nur die separablen Hilberträume
n
(n ∈ ) und 2 ( ).
Beweis.
Nach 4.7 gibt es ein vollständiges ONS v1 , v2 , . . .. Die oben eingeführte Ab-
bildung U ist linear und isometrisch, denn nach der Parsevalschen Gleichung
4.4 (b), (c) gilt

∞
u2H = | vk , u |2 = U u22 ,
k=1

∞
u, v H = vk , u vk , v = U u , U v 2 .
k=1
Es bleibt nur noch zu zeigen, dass U surjektiv ist. Sei also a = (a1 , a2 , . . .) ∈ 2 ,

∞
∞
d.h. ak vk 2 = |ak |2 < ∞. Nach 4.2 (b) konvergiert die Reihe
k=1 k=1

∞
u := ak vk
k=1
im Normsinn, und aus 4.3 ergibt sich ak = vk , u (k = 1, 2, . . .), somit ist

a = U u. 2
Dass die v1 , v2 , . . . keine Basis für H liefern, ergibt sich jetzt aus der Tatsache,
dass die Einheitsvektoren e1 , e2 , . . . nach 1.4 keine Basis des 2 darstellen.
4.9 Entwicklung nach unvollständigen ONS

Sei v1 , v2 , . . . ein beliebiges ONS in einem Hilbertraum H und u ∈ H . Dann
konvergiert die Fourierreihe von u gegen die orthogonale Projektion P u von u
auf den abgeschlossenen Teilraum V = Span {v1 , v2 , . . .} :

∞
vk , u vk = P u .
k=1
Im Fall V = H ist das ONS v1 , v2 , . . . nicht vollständig, es kann aber durch ein
vollständiges ONS für V ⊥ zu einem vollständigen ONS für H ergänzt werden.
Beweis.
Wegen der Besselschen Ungleichung 4.3 (b) und wegen 4.2 konvergiert die Reihe

∞
v := vk , u vk .
k=1
Dann gilt v ∈ V , und aus 4.3 (a) folgt vk , v = vk , u (k = 1, 2, . . .).

Also ist u − v orthogonal zu allen vk und somit u − v ∈ V ⊥ nach 2.5 (b). Aus
u = v + (u − v) mit v ∈ V , u − v ∈ V ⊥ folgt v = P u nach dem Zerlegungssatz
2.4. 2
242 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen
§ 10 Glättung von Funktionen, Fortsetzung stetiger

Funktionen
Vorkenntnisse: Die Kenntnis des Lebesgue–Integrals ist nur an wenigen Stellen

nötig, die im Text entsprechend ausgewiesen sind. Die Hauptergebnisse und de-
ren Beweise bleiben für das herkömmliche Integral für stetige Funktionen und
Treppenfunktionen gültig, wenn wir u ∈ Lp (Ω)“ so verstehen, dass |u|p über Ω
”
integrierbar ist, und u ∈ L∞ (Ω)“ einfach Beschränktheit auf Ω bedeuten soll.
” 1
Die Voraussetzung u ∈ Lloc (Ω) (u ist lokalintegrierbar) ist für stetige Funktio-
nen und Treppenfunktionen immer erfüllt.
1 Testfunktionen
1.1 Ck –Funktionen mit kompakten Träger
(a) Der Träger (support) einer
Ê
Funktion u : n → ( = oder

= ) ist definiert als
6
supp u := {x ∈ n
| u(x) = 0}.
-
(b) Für eine nichtleere offene Men-
ge Ω ⊂ n
und k = 0, 1, 2, . . . , ∞ 3 45
supp u
6
bezeichnen wir den Raum der Ck –
Funktionen n → mit kompaktem
Träger in Ω mit
Ckc (Ω) :=

u ∈ Ck ( ) supp u ist eine kompakte Teilmenge von Ω .
n
Die Funktionen aus dem Raum C∞ c (Ω) heißen Testfunktionen auf Ω; der
Name erklärt sich in 4.1. Anstelle von C∞c (Ω) sind auch die Bezeichnungen
C∞
0 (Ω) und D(Ω) gebräuchlich.
C0c (Ω) besteht aus den stetigen Funktionen mit kompaktem Träger.
(c) Für u ∈ C0c (Ω) und v ∈ C0 (Ω) ist u · v über Ω integrierbar.

(Das Lebesgue–Integral uv macht genau dann für alle u ∈ C0c (Ω) einen Sinn,
Ω
wenn v ∈ L1loc , d.h. über jede kompakte Teilmenge von Ω integrierbar ist, vgl.
§ 8 : 2.5. Die eine Richtung ist klar: Ist u ∈ C0c (Ω) und A = supp u kompakt,
so existiert u∞ = max{|u(x)| | x ∈ A}, und für v ∈ L1loc (Ω) gilt die Ab-
schätzung |u · v| ≤ u∞ · |v| · χA , woraus die Integrierbarkeit von u · v nach
dem Majorantensatz folgt. Die andere Richtung ergibt sich in 3.5.)
1 Testfunktionen 243
1.2 Die Standardbuckel jε und weitere Testfunktionen

Satz. Zu jedem ε > 0 gibt es eine Testfunktion jε ∈ C∞
c ( Ê) n
mit

jε ≥ 0 , supp jε = Kε (0) , jε = 1 .
Beweis. (
e−1/t für t > 0 ,
Wir gehen aus von f (t) :=
0 für t ≤ 0 .
Durch Induktion erhalten wir für t > 0
f (k) (t) = pk (t) t−2k f (t)
6
1
mit einem geeigneten Polynom pk f
−2k −1/t
ÜA . Wegen lim t e = 0 für
Æ Ê
t→0+
k ∈ 0 folgt f ∈ C∞ ( ), 0 ≤ f ≤ 1 -
Ê
sowie supp f = + . Für
ψε (x) := f (1 − x2 /ε2 )
Ê
gilt also ψε ∈ C∞ ( n), ψε (x) > 0 für 6
x < ε und ψε (x) = 0 sonst.
j1/3
Die Funktion jε := cε ψε mit cε :=
1 / ψε besitzt dann die gewünschten
Eigenschaften. 2
j1
Aus der Konstruktion ergibt sich un- j5/3
mittelbar
( -
∞ für x = 0 ,
lim jε (x) =
ε→0+ 0 für x = 0 .
Aus den Standardbuckeln lassen sich weitere Testfunktionen konstruieren:

(a) Sei Ω offen, r > 0 und Kr (x0 ) ⊂ Ω. Dann ist
ϕ(x) = jr (x − x0 )
eine Testfunktion ϕ ∈ C∞
c (Ω) mit supp ϕ = Kr (x0 ).
(b) Für f ∈ C∞ ( Ê n
) und ϕ ∈ C∞
c ( Ê n
) ist f · ϕ eine Testfunktion.
(c) Für ϕ ∈ C∞
c (Ω) ist jede partielle Ableitung beliebiger Ordnung wieder eine
Testfunktion.
(d) Weitere Testfunktionen ergeben sich in 2.3 durch Faltung von Standard-
buckeln mit Funktionen mit kompaktem Träger.
2 Faltung mit Testfunktionen

2.1 Definition der Faltung
Unter jeder der nachfolgenden Bedingungen konvergiert das Faltungsintegral

(u ∗ v)(x) := u(x − y) v(y) dn y
Ên
für fast alle x ∈ Ên
und ist kommutativ, u ∗ v = v ∗ u f.ü.:
(a) u ∈ L (p
Ê ), v ∈ L (Ê )
n q n
mit p > 1, 1
p
+ 1
q
= 1,
(b) u ∈ L (Ê ), v ∈ L (Ê )
1 n ∞ n
und umgekehrt,
(c) u ∈ C (Ê ), v ∈ L (Ê )
0
c
n 1
loc
n
und umgekehrt.
Denn für y → w(y) := u(x − y) bei festem x erhalten wir:

u ∈ Lp ( Ê) n
⇐⇒ w ∈ Lp ( Ên
) und |u|p = |w|p
Ên Ên
(Substitution z = x − y unter Verwendung des Transformationssatzes für Inte-
grale), ferner
u ∈ C0c ( Ê) n
⇐⇒ w ∈ C0c ( Ê ).n
Somit existiert das Faltungsintegral im Fall (a) nach der Hölderschen Unglei-
chung § 8 : 2.3 (b) und im Fall (b) nach dem Majorantenkriterium. Für den Fall
(c) verweisen wir auf 1.1 (c).
Die Kommutativität des Faltungsprodukts ergibt sich durch Substitution z =
x − y bei festem x (siehe oben).
(d) Für Lebesgue–integrierbare Funktionen u, v existiert das Faltungsintegral
(u ∗ v)(x) f.ü., und u ∗ v = v ∗ u ist Lebesgue–integrierbar .
Denn für fast alle y ∈ Ên

existiert das Integral

f (y) := |u(x − y) · v(y)| dn x = |v(y)| |u(x − y)| dn x = u1 · |v(y)| ,
Letzteres durch Substitution z = x − y. Damit ist f integrierbar, und die Be-

hauptung folgt aus dem Satz von Tonelli § 8 : 1.8.
2.2 Differentialoperatoren und Multiindizes

(a) Ein (n–dimensionaler) Multiindex ist ein n–Tupel
α = (α1 , . . . , αn ) mit α1 , . . . , αn ∈ 0 .
Wir verwenden die Abkürzungen
|α| := α1 + . . . + αn und α! := α1 · · · αn ! .
2 Faltung mit Testfunktionen 245
(b) Für x = (x1 , . . . , xn ) ∈ Ê n

und α = (α1 , . . . , αn ) definieren wir
x α
:= xα
1
1
··· xα
n
n
.
Ein Polynom p vom Grad m ∈ Æ 0 in den Variablen x1 , . . . , xn hat die Form

p(x) = cα xα ,
|α|≤m
wobei mindestens ein cα mit |α| = m von Null verschieden ist. Wir beachten
dabei, dass es nur endlich viele α = (α1 , . . . , αn ) gibt mit |α| ≤ m.
(c) Ferner setzen wir
α1 αn
∂ ∂
∂ α := ··· = ∂1α1 · · · ∂nαn .
∂x1 ∂xn
Es ist also beispielsweise
∂ ∂ ∂ ∂3u
∂ (1,2) u = u = = ∂1 ∂2 ∂2 u .
∂x1 ∂x2 ∂x2 ∂x1 ∂x22
Die Leibnizregel für u, v ∈ Cr (Ω) und |γ| ≤ r lautet ÜA
γ!
∂ γ (u · v) = ∂αu · ∂β v .
α+β=γ α! β!
(d) Ein linearer Differentialoperator m–ter Ordnung auf einem Gebiet

Ê
Ω ⊂ n hat die Form

L : u → Lu = aα ∂ α u ,
|α|≤m
wobei die aα Funktionen auf Ω sind und wenigstens ein aα mit |α| = m keine
Nullstellen besitzt.
Sind die Koeffizienten aα C∞ –Funktionen, so kann L als ein linearer Operator
L : C∞ ∞
c (Ω) → Cc (Ω) aufgefasst werden.
2.3 Faltung mit Testfunktionen

Satz. Für u ∈ Ckc ( Ê n
) und v ∈ L1loc ( Ê n
) gilt:
(a) u ∗ v ∈ C ( k
Ê n
),
(b) ∂ (u ∗ v) = (∂ α u) ∗ v für |α| ≤ k,
α
(c) supp (u ∗ v) ⊂ supp u + supp v := {x + y | x ∈ supp u, y ∈ supp v}.

(d) Mit A := supp v gilt insbesondere jε ∗ v ∈ C∞ ( Ên
) und
2
supp (jε ∗ v) ⊂ Aε := {x ∈ Ê n
| dist (x, A) ≤ ε} = Kε (a) .
a∈A
Beweis.
(a) und (b) K := supp u ist kompakt, also existiert für jeden Multiindex α mit
|α| ≤ k
M α := max{| ∂ α u(x) | | x ∈ K} = max{| ∂ α u(x) | | x ∈ Ê n

},
und es gilt
| ∂ α u(x − y) v(y) | ≤ M α | v(y) | für alle y ∈ Ê.n
Nach dem Satz über Parameterintegrale existiert daher

(∂ α (u ∗ v))(x) = ∂ α u(x − y)v(y) dn y = ∂ α u(x − y)v(y) dn y
und ist stetig.

(c) Seien K := supp u, A := supp v. Für x ∈ K + A verschwindet

(u ∗ v)(x) = u(x − y)v(y) dn y ,
denn dann ist x − y ∈ K für alle y ∈ A und v(y) = 0 für y ∈ A.

(d) Aus (c) folgt
supp (jε ∗ v) ⊂ { a + y | a ∈ A und y ≤ ε}
7
= Kε (a) =: Bε .
a∈A
Zu zeigen bleibt
Bε = Aε := {x | dist (x, A) ≤ ε}.
Für x ∈ Bε gibt es ein a ∈ A mit x − a ≤ ε, also gilt dist (x, A) ≤ ε.
Sei umgekehrt d := dist (x, A) ≤ ε. Dann gibt es Punkte an ∈ A mit
x − an < d + n1 . Es folgt an < x + d + n1 < x + d + 1. Daher
besitzt die Folge, (an ) eine konvergente Teilfolge. Für deren Grenzwert a gilt
x − a ≤ d ≤ ε. 2
3 Glättung von Funktionen

3.1 Definition und Beispiele
Ê
Sei Ω ⊂ n offen und u ∈ L1loc (Ω). Wir setzen u(x) := 0 für x ∈ n \ Ω. Sind Ê
je p die in 1.2 eingeführten Standardbuckel, so heißt die Schar der Funktionen

uε = jε ∗ u , uε (x) = jε (x − y) u(y) dn y (ε > 0) ,
Ên
eine Glättung oder Regularisierung von u. Nach 2.3 gilt uε ∈ C∞ ( Ê
n
).
3 Glättung von Funktionen 247
Beispiele. (a) Für die Heaviside–

Funktion u = χÊ+ ist uε (x) = 0 6 u
•
für x ≤ −ε , uε (x) = 1 für x ≥ ε,
ferner wächst uε streng monoton in
[−ε, ε]. Das folgt unmittelbar aus der -
Darstellung
x 6 uε
uε (x) = (u ∗ jε )(x) = jε (t) dt .
−ε
Offenbar gilt -

+∞ −ε ε
|uε − u|p < 2ε für p ≥ 1 .
−∞
Ê
(b) Ist I ⊂ n ein kompakter Quader und u = χI seine charakteristische
Funktion, so wird uε nach 2.3 (d) eine C∞ –Funktion mit kompaktem Träger in
Iε = {x | dist (x, I) ≤ ε}. Aus

uε (x) = jε (x − y)u(y) dn y = jε (x − y) dn y
Ên I
entnehmen wir, dass uε (x) = u(x) = 1 für alle x ∈ I mit dist (x, ∂I) ≥ ε und
uε (x) = u(x) = 0 für alle x mit dist (x, I) ≥ ε. Ferner gilt | uε (x) − u(x) | ≤ 1
in Sε = {x | dist (x, ∂I) ≤ ε} und Volumen V n (Sε ) ≤ const · ε. Es folgt

|uε − u|p ≤ V n (Sε ) → 0 für ε → 0 + .
Bemerkungen (i) Aus uε (x) = u(x) für alle x mit dist (x, ∂I) ≥ ε folgt
lim uε (x) = u(x) für alle x ∈ ∂I, d.h. fast überall.
ε→0+
(ii) Liegt I in einem Gebiet Ω, so gibt es ein > 0 mit I ⊂ Ω, vgl. Bd. 1, § 21:
8.3. Dann gilt uε ∈ C∞c (Ω) für ε ≤ .
3.2 Glättung stetiger Funktionen

(a) Satz. Für jede stetige Funktion u mit kompaktem Träger in der offenen
Menge Ω gilt ur := jr ∗ u ∈ C∞c (Ω) für r 1,
ur → u gleichmäßig auf Ω und

|u − ur |p → 0 für 1 ≤ p < ∞ .
Ω
Beweis.
Im Fall supp u = ∅, d.h. u = 0 ist uε = 0. Sei also A := supp u = ∅. Wir
Ê
setzen := 14 dist (A, ∂Ω) (bzw. := 1, falls Ω = n ). Nach Bd. 1, § 21 : 8.3
ist > 0. Ferner ist
Ar := {x ∈ Ê n
| dist (x, A) ≤ r} für r ≤ 2
eine kompakte Teilmenge von Ω. Aus 2.3 (a),(d) ergibt sich ur ∈ C∞ ( Ên

) und
supp ur ⊂ Ar ⊂ Ω, also ur ∈ C∞
c (Ω) für r ≤ 2 .
Sei ε > 0 gegeben. Wegen der gleichmäßigen Stetigkeit von u auf A2 gibt es
ein δ mit 0 < δ < und
| u(x) − u(y) | < ε für alle x, y ∈ A2 mit x − y < δ .

Wegen jr (x − y) dn y = 1 folgt für 0 < r < δ

| u(x) − ur (x) | = jr (x − y)(u(x) − u(y)) dn y

= jr (x − y)(u(x) − u(y)) dn y
Kr (x)

< ε jr (x − y) dn y = ε .
Kr (x)
Zum Nachweis der zweiten Behauptung beachten wir, dass supp u, supp ur ⊂
A2 für 0 < r < . Nach Bd. 1, § 23 : 4.6 gibt es kompakte Quader I1 , . . . , IN in
Ω mit A2 ⊂ I1 ∪ · · · ∪ IN =: K. Wegen der gleichmäßigen Konvergenz ur → u
folgt

|u − ur |p = |u − ur |p → 0 für r → 0 . 2
Ω K
(b) Folgerung. Ist K ⊂ Ω kompakt und u : K →

stetig, so gibt es eine
Folge von Testfunktionen ϕn ∈ C∞
c (Ω) mit ϕn → u gleichmäßig auf K.
Beweis.
Nach dem in 5.3 zitierten Satz von Tietze–Uryson läßt sich u zu einer stetigen
. ∈ C0c (Ω) fortsetzen, auf welche wir (a) anwenden.
Funktion u 2
3.3 Testfunktionen liegen dicht in Lp (Ω)

(a) Satz. Für 1 ≤ p < ∞ ist C∞ p
c (Ω) ein dichter Teilraum von L (Ω).
Wegen C∞
c (Ω) ⊂ Cc (Ω) ⊂ L (Ω) ist daher auch Cc (Ω) dicht in L (Ω).
0 p 0 p
Beweis.
Wir zeigen zunächst: Die Treppenfunktionen u mit supp u ⊂ Ω liegen dicht in
Lp (Ω) bezüglich der Norm
1/p
up = |u|p .
Ω

Denn existiert |f |p im herkömmlichen Sinn, so gibt es zu jedem ε > 0 eine
Ω
Vereinigung K = I1 ∪ . . . ∪ IN kompakter Quader Ik ⊂ Ω mit

|f |p − |f |p < ε .
Ω K
Ferner existiert eine Treppenfunktion u auf K mit |u(x) − f (x)| < ε für x ∈ K.
Es folgt

|f − u|p = |f |p + |f − u|p < ε + εp V n (K) .
Ω Ω\K K
Bei Zugrundelegung des Lebesgue–Integrals ergibt sich die Dichtigkeit der Trep-
penfunktionen in Lp (Ω) nicht so leicht, wir verweisen auf § 20 : 8.4:

N
Sei u eine solche Treppenfunktion, u = ck χIk mit kompakten Quadern
k=1
Ik ⊂ Ω. Nach 3.1 (b) (ii) gibt es Testfunktionen ϕk,n ∈ C∞
c (Ω) mit
1
χIk − ϕk,n p < .
n

N
Aus der Dreiecksungleichung folgt für ϕn := ck ϕk,n ∈ C∞
c (Ω) :
k=1

N
1 N
u − ϕn p ≤ | ck | · χIk − ϕk,n p ≤ |ck | → 0 für n → ∞. 2
k=1 n k=1
Ê
(b) Zusatz. Sei u ∈ Lp ( n) eine Funktion mit u = 0 außerhalb von Ω. Dann
gilt für ur := jr ∗ u ∈ C∞
c (
n
) Ê

|ur |p ≤ |u|p und lim |u − ur |p = 0 .
r→0+
Ω Ω Ω
Beweis.
Wir zeigen zunächst, dass für x ∈ Ê n
1/p
|ur (x)| ≤ jr (x − y) |u(y)|p dn y .
Ên
Für p = 1 folgt dies aus der Definition von ur . Für 1 1 mit 1/p + 1/q = 1. Aus der Hölderschen Ungleichung § 8: 2.3 (b) ergibt
sich

|ur (x)| ≤ jr (x − y)1/q , jr (x − y)1/p |u(y)| dn y
Ên
1/q 1/p
≤ jr (x − y)dn y jr (x − y) |u(y)|p dn y
Ên Ên

= jr (x − y) · |u(y)|p dn y .
Ên
Mittels sukzessiver Integration und Vertauschung der Integrationsreihenfolge
(vgl. § 8 : 1.8) ergibt sich die Konvergenz des Integrals

(∗) |ur |p ≤ |u(y)|p jr (x − y) dn x dn y = |u(y)|p dn y .
Ω Ên Ên Ω
Zu gegebenem ε > 0 gibt es nach (a) ein ϕ ∈ C0c (Ω) mit u − ϕp < ε, und nach
3.2 gilt für ϕr := jr ∗ ϕ und genügend kleines r > 0
supp ϕr ⊂ Ω , ϕ − ϕr p < ε .
Aus (∗), angewandt auf u − ϕ, erhalten wir ur − ϕr p ≤ u − ϕp . Es folgt
u − ur p ≤ u − ϕp + ϕ − ϕr p + ϕr − ur p < 3ε für r 1. 2
Bemerkungen
(i) Für u ∈ Lp ( Ê ) folgt u − u
n
r p → 0 für r → 0.
(ii) Der Zusatz wird für die Theorie der Sobolew–Räume benötigt.
(iii) Verschwindet u nicht ausserhalb von Ω, wird die Sache komplizierter, wie
der Beweis des folgenden Satzes zeigt.
3.4 Glättung lokalintegrierbarer Funktionen

Sei u : Ω →
auf Ω im Lebesgueschen Sinn lokalintegrierbar und ur = jr ∗ u.
Dann gilt für jede kompakte Teilmenge A von Ω

lim |u − ur | = 0 .
r→0
A
Beweis.
(a) Sei r > 0 so klein gewählt, dass Ar = {x ∈ Ω | dist (x, A) ≤ r} ⊂ Ω. Für
beliebiges f ∈ L1loc (Ω) gilt nach 2.3 fr = jr ∗ f ⊂ C∞ (Ω) ⊂ L1loc (Ω), und mit
Hilfe von § 8: 1.8 erhalten wir

|fr | = jr (x − y)f (y) dn y dn x ≤ jr (x − y)|f (y)| dn y dn x
A A Ar A Ar

= |f (y)| jr (x − y) d x d y ≤
n n
|f (y)| dn y .
Ar A Ar
Wir schreiben dafür kurz fr 1,A ≤ f 1,Ar .
(b) Wir fixieren ein > 0 mit A ⊂ Ω. Da C0c (Ω) nach 3.3 dicht in L1 (Ω)
finden wir zu gegebenem ε > 0 für u · A ∈ L (Ω) ein v ∈ Cc (Ω) mit
ist, χ 1 0
u · χA − v < ε. Daher gilt

Ω
u − v1,A ≤ u − v1,Ar < ε für r≤ .

Nach (a) mit f := u − v erhalten wir für r <

ur − vr 1,A ≤ u − v1,Ar < ε .
Es folgt
u − ur 1,A ≤ u − v1,A + v − vr 1,A + vr − ur 1,A
< 2ε + v − vr 1,A .

Für genügend kleines r wird v − vr 1,A < ε nach 3.3, also |u − ur | < 3ε. 2
A
3.5 Zerlegungen der Eins

(auch Partitionen der Eins genannt) dienen als technisches Hilfsmittel zur Ein-
führung des Integrals auf Untermannigfaltigkeiten. Dazu benötigen wir das
Lemma. Zu jeder kompakten Teilmenge A einer offenen Menge Ω ⊂ n gibt es Ê
eine Funktion ϕ ∈ C∞
c (Ω) mit ϕ(x) = 1 auf A und 0 ≤ ϕ(x) ≤ 1 sonst.
Folgerung. Ist v messbar und u · v ∈ L1 (Ω) für alle u ∈ C0c (Ω), so gilt
v ∈ L1loc (Ω).
Beweis.
Ê
Wir wählen ein r > 0 mit A2r = {x ∈ n | dist (x, A) ≤ 2r} ⊂ Ω. Für
u = χAr betrachten wir ur := jr ∗ u ∈ C∞
c7 Ê
( n). Aus 2.3 (d) folgt mit Hilfe der
Dreiecksungleichung supp ur ⊂ (Ar )r = Kr (a) ⊂ A2r ⊂ Ω; weiter ist
a∈Ar

0 ≤ jr (x − y) dn y = ur (x) ≤ jr (x − y) dn y = 1 .
Ar Ω

Für x ∈ A ist jr (x − y) = 0 für y ∈ Ar , also ur (x) = jr (x − y) dn y = 1.
Ω
Die Folgerung ergibt sich aus der Tatsache, dass ur · v eine integrierbare Ma-
jorante für v · χA ist. 2
Ê
Satz. Sei K ⊂ n nichtleer und kompakt, und V1 , · · · , VN seien nichtleere
offene Mengen mit K ⊂ V1 ∪ · · · ∪ VN . Dann gibt es Funktionen ψk ∈ C∞
c (Vk )
mit 0 ≤ ψk ≤ 1 und

N
ψk (x) = 1 auf K .
k=1
Beweis.
(a) Wir konstruieren kompakte Mengen Ak ⊂ Vk mit K ⊂ A1 ∪ · · · ∪ AN : Zu
jedem x ∈ K gibt es ein Vk mit x ∈ Vk und ein r > 0 mit Kr (x) ⊂ Vk . Die zu-
gehörigen Ω(x) = Kr (x) bilden eine Überdeckung von K durch offene Mengen.
Nach dem Überdeckungssatz von Heine–Borel (Bd. 1, § 21 : 6.3) genügen endlich

viele davon, um K zu überdecken: K ⊂ Ω(x1 ) ∪ · · · ∪ Ω(xm ). Wir definieren Ak
als die Vereinigung aller Ω(xj ) mit Ω(xj ) ⊂ Vk .
(b) Nach dem vorangehenden Lemma gibt es Funktionen ϕk ∈ C∞ c (Vk ) mit
0 ≤ ϕk ≤ 1 und ϕk (x) = 1 auf Ak (k = 1, . . . , N ). Wir setzen
ψ1 := ϕ1 , ψ2 := ϕ2 (1 − ϕ1 ) , . . . , ψN := ϕN (1 − ϕ1 ) · · · (1 − ϕN−1 ).
Dann gilt 0 ≤ ψk ≤ 1 für k = 1, . . . , N und ψk ∈ C∞ ∞

c (Vk ) wegen ϕk ∈ Cc (Vk ).
Sei x ∈ K, also x ∈ Am für ein geeignetes m. Wir erhalten
ϕm (x) = 1 , ψm+1 (x) = . . . = ψN (x) = 0
und damit

n
m
ψk (x) = ψk (x) = ϕ1 (x) + ϕ2 (x) (1 − ϕ1 (x))
k=1 k=1
+ ϕ3 (x) (1 − ϕ1 (x)) (1 − ϕ2 (x)) + . . .
+ 1 · (1 − ϕ1 (x)) · · · (1 − ϕm−1 (x)) .
Der Rest ergibt sich aus der Formel
a1 + a2 (1 − a1 ) + a3 (1 − a2 )(1 − a1 ) + . . . + (1 − a1 ) · · · (1 − am−1 ) = 1
( ÜA , Induktion). 2
4 Das Fundamentallemma der Variationsrechnung

4.1 Die klassische Version
Lemma von du Bois–Reymond. Eine stetige Funktion u : Ω → Ê auf einer
Ê
offenen Menge Ω ⊂ n verschwindet, wenn

u ϕ dn x = 0 für alle ϕ ∈ C∞
c (Ω).
Ω
Diese Aussage motiviert die Bezeichnung Testfunktion“. Einen Schluss die-

”
ser Art verwendete Lagrange 1755 ohne Begründung bei der Aufstellung der
Euler–Lagrange–Gleichungen der Variationsrechnung.
Beweis.
Angenommen u = 0 , o.B.d.A. u(a) > 0 für ein a ∈ Ω. Dann gibt es ein r > 0
mit Kr (a) ⊂ Ω und
u(x) ≥ := 1
2
u(a) > 0 für x − a ≤ r .
4 Das Fundamentallemma der Variationsrechnung 253
Dann ergibt sich mit ϕ(x) = jr (x − a) der Widerspruch

0 = u ϕ dn x = u ϕ dn x ≥ ϕ dn x = > 0. 2
Ω Kr (a) Kr (a)
4.2 Die allgemeine Version des Fundamentallemmas

Satz. Gilt u ∈ L1loc (Ω) und u ϕ = 0 für alle ϕ ∈ C∞
c (Ω), so ist u = 0 f.ü.
Ω
Dieser Satz ist grundlegend für die Theorie der Distributionen.
Beweis.
7
∞
(a) Nach Bd. 1, § 23 : 4.6 gilt Ω = Ωk mit offenen Mengen Ω1 ⊂ Ω2 ⊂ . . . ,
k=1
wobei die Ωk kompakte Teilmengen von Ω sind. Wir zeigen in (c), dass u = 0
f.ü. in jedem Ωk , d.h. u = 0 in Ωk \ Nk mit einer Nullmenge Nk ⊂ Ωk . Daraus
7
∞ 7
∞
folgt die Behauptung wegen Ω \ Nk ⊂ (Ωk \ Nk ), da eine abzählbare
k=1 k=1
Vereinigung von Nullmengen eine Nullmenge ist.
(b) Sei Ωk offen und Ωk eine kompakte Teilmenge
von Ω. Für ϕ ∈ C∞c (Ωk )
∞
und r 1 gilt ϕr = jr ∗ ϕ ∈ Cc (Ω) und somit u ϕr = 0 nach Voraussetzung.
Ω
Setzen wir G(x) := jr (x − y) |ϕ(y)| dn y, so ist G stetig und hat für r 1
Ωk

einen kompakten Träger in Ω, also existiert |u| · G. Nach dem Satz von Fubini
Ω
folgt unter Beachtung von jr (x − y) = jr (y − x) mit ur = jr ∗ u

0 = u ϕr dn x = u(x) jr (x − y) ϕ(y) dn y dn x
Ω Ω Ωk

= ϕ(y) jr (y − x) u(x) dn x dn y = ϕ ur dn y .
Ωk Ω Ωk
Da ur stetig ist, folgt ur (x) = 0 in Ωk nach 4.1.

(c) Nach 3.4 gilt lim |u − ur | = 0 , also |u| = 0 und u = 0 f.ü. in Ωk
r→0
Ωk Ωk
nach § 8 : 1.5 (h). 2
Die Übertragung des Fundamentallemmas auf vektorwertige und komplexwer-

tige Funktionen bereitet keine Schwierigkeiten.
Weiter läßt sich durch geringfügige Modifikation der Beweise 4.1, 4.2 zeigen:

Satz. Gilt u ∈ L1loc (Ω) und uϕ ≥ 0 für alle ϕ ∈ C∞
c (Ω) mit ϕ ≥ 0 , so
Ω
ist u ≥ 0 f.ü.
4.3 Das Hilbertsche Lemma

Satz. Gilt für eine Funktion u ∈ L1loc (I) auf einem offenen Intervall I

uϕ = 0 für alle ϕ ∈ C∞
c (I),
I
so gibt es eine Konstante c mit u = c f.ü. .
Beweis.

Wir fixieren ein ϕ0 ∈ C∞
c (I) mit ϕ0 = 1 . Zu gegebener Testfunktion ϕ ∈
I
C∞
c (I) wählen wir ein die Träger von ϕ und ϕ0 enthaltendes Intervall [a, b] ⊂ I
und setzen
x
ψ(x) := ( ϕ(t) − ( ϕ ) · ϕ0 (t) ) dt .
a I
Die Funktion ψ ist C∞ -differenzierbar auf Ê , ferner ist ψ(x) = 0 für x ≤ a,

und für x ≥ b gilt
x
ψ(x) = (ϕ(t) − ( ϕ ) · ϕ0 (t) ) dt = ϕ− ( ϕ)· ( ϕ0 ) = 0 .
a I I I I
Somit hat ψ kompakten

Träger in I, und nach Voraussetzung gilt mit der
Konstanten c := ϕ0 · u
I

0 = u · ψ = u · ϕ − ( ϕ ) · ϕ0 = (u − c) · ϕ .
I I I I
Da ϕ ∈ C∞ c (I) beliebig gewählt werden kann, folgt nach dem Fundamental-

lemma die Behauptung u − c = 0 f.ü. . 2
5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω)

5.1 Fortsetzung gleichmäßig stetiger Funktionen
(a) Satz. Sei f : V1 ⊃ D → V2 eine gleichmäßig stetige Abbildung von einer
Teilmenge D eines normierten Raums V1 in einen Banachraum V2 . Dann gibt
es genau eine stetige Fortetzung F : D → V2 von f . Diese ist gegeben durch
F (u) := lim f (un ) , falls u = lim un mit un ∈ D.

n→∞ n→∞
Die Fortsetzung F ist gleichmäßig stetig auf D.

5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω) 255
Beweis.
Besitzt f eine Fortsetzung F ∈ C0 (D), so gilt notwendig F (u) = lim f (un ) für
n→∞
u ∈ D und jede Folge (un ) in D mit un → u. Also gibt es höchstens eine solche
Fortsetzung.
Konstruktion einer Fortsetzung. Wir fixieren ein u ∈ D und betrachten eine
Folge (un ) in D mit un → u. Sei ε > 0 gegeben. Nach Voraussetzung gibt es ein
δ > 0 mit
f (v) − f (w)2 < ε für alle v, w ∈ D mit v − w1 < δ .
Wählen wir nε so, dass um − un 1 < δ für m > n > nε , so folgt daraus
f (um ) − f (un )2 < ε . Also hat (f (un )) als Cauchyfolge einen Limes z ∈ V2 .
Für jede andere Folge (vn ) in D mit vn → u gilt f (vn ) − f (un )2 < ε, sobald
un − vn 1 < δ. Es folgt lim f (vn ) = lim f (un ). Wir definieren F (u) durch
n→∞ n→∞
diesen, von der approximierenden Folge unabhängigen Limes.
Für u ∈ D wählen wir die konstante Folge (u) und erhalten F (u) = f (u).
Gleichmäßige Stetigkeit von F . Sei ε > 0 vorgegeben und δ > 0 wie oben
gewählt. Zu u, v ∈ D mit u − v1 < δ seien (un ), (vn ) Folgen in D mit un → u,
vn → v. Für genügend großes n gilt un − vn 1 < δ, also f (un ) − f (vn )1 < ε.
Es folgt
F (u) − F (v)2 = lim f (un ) − f (vn )1 ≤ ε für u − v1 < δ . 2

n→∞
(b) Folgerung. Ist T : D → V2 ein linearer Operator auf einem dichten

Teilraum D von V1 mit
T u2 ≤ c u1 für alle u ∈ D,
so läßt sich T in eindeutiger Weise zu einem linearen Operator T : V1 → V2

fortsetzen. Für diesen gilt T u2 ≤ c u1 für alle u ∈ V1 .
Beweis.
T ist gleichmäßig stetig auf D wegen T u − T v2 = T (u − v)2 ≤ c u − v1
auf D. Nach (a) gibt es also eine eindeutig bestimmte stetige Fortsetzung T :
V1 = D → V2 . Nach Definition von T , nach den Rechenregeln für Grenzwerte
und wegen der Stetigkeit der Norm folgt ÜA
T ist linear und es gilt T u2 ≤ c u1 für alle u ∈ V1 . 2
5.2 Die Räume Ck (Ω)

Eine Funktion u : Ω → Ê Ê
auf einem Gebiet Ω des n heißt Ck –differenzier-
bar auf Ω ( u ∈ C (Ω) ), wenn u ∈ Ck (Ω) gilt und wenn sich die Funktionen
k
∂ α u für alle Multiindizes α mit |α| ≤ k zu stetigen Funktionen auf Ω fortsetzen

lassen, die wir wieder mit ∂ α u bezeichnen.
Hinreichend dafür, dass eine Funktion u ∈ Ck (Ω) auch zu Ck (Ω) gehört, ist
nach 5.1 die gleichmäßige Stetigkeit aller ∂α u mit |α| ≤ k auf Ω.
Ist Ω beschränkt, so ist diese Bedingung auch notwendig. Denn Ω ist kompakt,
und jede auf Ω stetige Funktion ist dort und damit erst recht auf Ω gleichmäßig
stetig (Bd. 1, § 21 : 8.4).
Bemerkungen, Beispiele
(a) Für offene Intervalle Ω = ]a, b[ stimmt Ck (Ω), wie oben definiert, mit
Ck [a, b] mit der bisher gebräuchlichen überein. Dies ergibt sich aus dem Mittel-
wertsatz ÜA .
β
(b) Sei Ω = ]a, b[, f ∈ C2 (Ω) und |f (x)|2 ≤ C für alle [α, β] ⊂ ]a, b[. Dann
α
gilt f ∈ C2 (Ω) ( ÜA . Zeigen Sie zunächst, dass f gleichmäßig stetig ist.)
Ê
(c) Für ein sternförmiges Gebiet Ω ⊂ n und u ∈ C2 (Ω) seien alle zweiten
Ableitungen ∂i ∂k u beschränkt in Ω. Dann gilt u ∈ C1 (Ω) ÜA .
5.3 Der Satz von Tietze–Uryson

Ê
Jede auf einer kompakten Menge K eines Gebiets Ω ⊂ n stetige Funktion f
läßt sich zu einer Funktion F ∈ C0c (Ω) unter Erhaltung der Norm fortsetzen,
F Ω = f K ,
zu lesen als
sup {|F (x)| | x ∈ Ω } = max {|f (x)| | x ∈ K } .
Für den Beweis verweisen wir auf Cigler–Reichel [143] 4.8, 3.2, Dugundji
[144] VII. 4
257
§ 11 Gaußscher Integralsatz und Greensche Formeln
Der Integralsatz von Gauß und die aus diesem folgenden Greenschen Integral-
formeln sind ein fundamentales Hilfsmittel für die Behandlung partieller Diffe-
rentialgleichungen.
Eine Formulierung des Gaußschen Integralsatzes für Gaußsche Gebiete des 3 Ê
wurde in Bd. 1, § 26 gegeben. Für eine Verallgemeinerung auf höhere Dimensio-
nen und für die wünschenswerte Einbeziehung allgemeinerer Ränder ∂Ω müssen
Ê
wir vom Integral über Flächenstücke des 3 zur Integration auf Untermannigfal-
Ê
tigkeiten des n übergehen. Dies erfordert zwar einige begriffliche Vorbereitun-
gen, doch tritt der Begriff der Untermannigfaltigkeit ohnehin in vielen physika-
lischen Kontexten auf und wurde auch im vorangehenden mehrfach angespro-
chen. An Vorkenntnissen werden das (Lebesgue) Integral stetiger Funktionen
über kompakte Mengen (§ 8 : 1) und die Zerlegung der Eins (§ 10 : 3) benötigt.
1 Untermannigfaltigkeiten des Ê n
1.1 Definitionen und Beispiele

Ê Ê
In Bd. 1, § 25 wurden ein Kurvenstück im n, bzw. ein Flächenstück im 3 als
Bildmenge einer einzigen regulären und stetig invertierbaren C1 –Parametrisie-
rung definiert. Dies hat den Nachteil, dass geschlossene“ Flächen wie z.B. die
Ê ”
Einheitssphäre des 3 nicht erfasst wurden. Die Einheitssphäre wird durch eine
Gleichung x = 1 beschrieben und ist eine Lösungsmannigfaltigkeit im Sinne
2
von Bd. 1, § 22 : 5. Wir erinnern daran, dass eine Lösungsmannigfaltigkeit nach

dem Satz über implizite Funktionen lokale Parametrisierungen besitzt, dass aber
in den meisten Fällen eine einzige Parametrisierung nicht ausreicht.
Ê
Wir definieren jetzt m–dimensionale Untermannigfaltigkeiten des n zunächst
lokal als Nullstellenmengen von Cr –Funktionen, rechtfertigen dann die Bezeich-
nung m–dimensional“ und zeigen schließlich mit Hilfe des Satzes über implizite
”
Funktionen, dass Untermannigfaltigkeiten lokale Cr –Parametrisierungen besit-
zen, die durch Parametertransformationen miteinander verbunden sind.
Ê
Definition. Eine nichtleere Menge M ⊂ n heißt m–dimensionale Cr –
Untermannigfaltigkeit (1 ≤ m < n, 1 ≤ r ≤ ∞), wenn es zu jedem Punkt
Ê
a ∈ M eine Umgebung V und eine Cr –Abbildung f : V → n−m gibt, so dass
(a) M ∩ V = { x ∈ V | f (x) = 0 } und
(b) Rang f (x) = n − m für alle x ∈ V .
Meist spezifizieren wir die Differenzierbarkeitsstufe r ≥ 1 nicht und sprechen
von m–dimensionalen Untermannigfaltigkeiten.
(n − 1)–dimensionale Untermannigfaltigkeiten werden auch Hyperflächen ge-
nannt.
258 § 11 Gaußscher Integralsatz und Greensche Formeln
Beispiele. (i) In 1.2 (c) zeigen wir, dass Flächenstücke im Ê 3

zweidimensio-
nale Untermannigfaltigkeiten sind.
Ê
(ii) Sr (a) := {x ∈ 3 | x = r} ist eine zweidimensionale Untermannigfal-
Ê
tigkeit des 3, aber kein Flächenstück, wie wir in 1.4 (b) zeigen werden.
(iii) Eindimensionale Untermannigfaltigkeiten stellen eine Erweiterung des Be-
griffs Spur einer Cr –Kurve“ dar; sie lassen sich lokal durch Parametrisierungen
”
t → x(t) darstellen. Definitionsgemäß sind auch folgende Gebilde eindimensio-
Ê
nale Untermannigfaltigkeiten des 2: Die Vereinigung endlich vieler sich nicht
schneidender Kreislinien, ein Rechtecksrand ohne die Eckpunkte, die Hyperbel
x2 − y 2 = 1 mitsamt der Asymptoten y = x sowie jede Schar äquidistanter
paralleler Geraden.
(iv) Die Oberfläche eines Würfels ohne die Kanten ist eine zweidimensionale
Untermannigfaltigkeit des 3 . Ê
1.2 Charakterisierungen m–dimensionaler Untermannigfaltigkeiten
(a) Eine m–dimensionale Cr –Untermannigfaltigkeit M läßt sich lokal auf Cr –
differenzierbare Weise zu einem m–dimensionalen Ebenenstück E verbiegen:
Zu jedem Punkt a ∈ M gibt es Umgebungen V von a, W von 0, sowie einen
Cr –Diffeomorphismus F : V → W mit F(a) = 0 und
F(V ∩ M ) = {y = (y1 , . . . , yn ) ∈ W | ym+1 = . . . = yn = 0} =: E .
Beweis.
Nach der Definition 1.1 gibt es eine

M
6Ê n−m
Umgebung V von a und eine Cr –Ab- V W

bildung F
a −→ -
f = (fm+1 , . . . , fn ) : V → Ê n−m E Êm
mit Rang f (x) = n − m in V und
M ∩ V = {x ∈ V | f (x) = 0} .
Ê Ê
Wir schreiben x = (y, z) mit y ∈ m , z ∈ n−m und entsprechend a = (b, c).
Nach geeigneter Umnumerierung der Koordinaten dürfen wir annehmen, dass
∂f
i
d(y, z) := det (y, z) = 0
∂zk
für (y, z) ∈ V , wobei m + 1 ≤ i, k ≤ n. Weiter setzen wir
F(y, z) := (y − b, f (y, z)) .

259
F ist Cr –differenzierbar auf V , und es gilt
F(y, z) = (y − b, 0) ∈ E für (y, z) ∈ V ∩ M,
insbesondere
F(b, c) = 0 ,
ferner det F (y, z) = d(y, z) = 0 ( ÜA , vgl. Bd. 1, § 22 : 5.7 (c)).

Nach dem lokalen Umkehrsatz Bd. 1, § 22 : 5.2 ist F nach passender Einschrän-
kung ein Diffeomorphismus zwischen einer Umgebung V von a und einer Um-
gebung W von 0. 2
(b) Parametrisierungen einer Untermannigfaltigkeit. Zu jedem Punkt

a einer m–dimensionalen Cr –Untermannigfaltigkeit M gibt es eine Umgebung
Ê Ê
V ⊂ n, ein Gebiet U ⊂ m und eine Cr –Abbildung Φ : U → M mit
(i) Φ(U) = V ∩ M ,
(ii) Φ (u) hat für jedes u ∈ U den Maximalrang m,
(iii) Die Umkehrabbildung Φ−1 : V ∩ M → U existiert und ist stetig.
Jede solche Abbildung Φ heißt eine Parametrisierung von M und die Bild-
menge V ∩ M eine Parameterumgebung von a.
Die Umkehrabbildung Φ−1 : V ∩ M → U nennen wir (in Anlehnung an die
Geographie) eine Karte für M .
Beweis.
Es gibt nach (a) einen Diffeomorphismus F : V → W einer Umgebung V von a
auf eine Umgebung W von 0 mit F(a) = 0 und
F(V ∩ M ) = {y ∈ W | ym+1 = . . . = yn = 0} .
Ê
Wir setzen U := {u ∈ m | (u, 0) ∈ W}. Dass U eine offene Teilmenge des m Ê
ist, folgt aus der Offenheit von W. Wegen der Stetigkeit der Projektion P :
W → U, (y1 , . . . , yn ) → (y1 , . . . , ym ) ist U = P(W) zusammenhängend.
Wir definieren
Φ:U→ Ê n
, u → F−1 (u, 0) .
Dann gilt Φ = F−1 ◦ E mit der Einbettung“ E : U → W, u → (u, 0). Aus der
”
C∞ –Differenzierbarkeit von E und der Cr –Differenzierbarkeit von F−1 folgt die
r
C –Differenzierbarkeit von Φ, und es gilt nach der Kettenregel
Φ (u) = (F−1 ) (u, 0) · E (u) .

Aus Rang E (u) = m folgt Rang Φ (u) = m, da die Jacobi–Matrix (F−1 ) (u, 0)
invertierbar ist.
Schließlich ist Φ : U → V ∩ M bijektiv, und die Umkehrabbildung Φ−1 = P ◦ F
(P wie oben) ist stetig. 2
(c) Satz. Für eine nichtleere Teilmenge M des Ê n

sind folgende Eigenschaften
äquivalent:
(i) M ist eine m–dimensionale Cr –Untermannigfaltigkeit.
(ii) M läßt sich im Sinne von (a) lokal zu m–dimensionalen Ebenenstücken
geradebiegen.
(iii) Zu jedem Punkt von M gibt es eine Umgebung V, so dass M ∩ V Bildmenge
Ê
einer Cr –Parametrisierung Φ : m ⊃ U → M ist.
Beweis.
Es wurde bereits (i) =⇒ (ii) =⇒ (iii) gezeigt.
Wir zeigen (iii) =⇒ (i):
Ê
Sei V eine Umgebung von a ∈ M , U ein Gebiet des m und Φ : U → V∩M eine
Cr –Parametrisierung mit stetiger Umkehrung Φ−1 : V ∩ M → U. Schließlich sei
Φ(u0 ) = a und Rang Φ (u) = m für alle u ∈ U. O.B.d.A. dürfen wir annehmen,
dass die ersten m Zeilen von Φ linear unabhängig sind.
Ê Ê
Die Aufspaltung x = (y, z) mit y ∈ m, z ∈ n−m führt zu Aufspaltungen a =
(b, c) und Φ(u) = (ϕ(u), ψ(u)) mit det ϕ (u) = 0 in U und ϕ(u0 ) = b. Nach
dem lokalen Umkehrsatz ist ϕ ein Cr –Diffeomorphismus zwischen geeigneten
Umgebungen U 0 ⊂ U von u0 und V1 := ϕ(U 0 ) von b. Wegen der Stetigkeit von
Φ auf U und von Φ−1 auf V ∩ M gibt es eine Umgebung V von a mit
x = (y, z) ∈ V ∩ M ⇐⇒ Φ−1 (x) ∈ U0
⇐⇒ x = Φ(u) mit u ∈ U0 .
Es folgt
(y, z) ∈ V ∩ M ⇐⇒ y = ϕ(u) , z = ψ(u) mit u ∈ U0
⇐⇒ z = ψ(ϕ−1 (y)) mit y ∈ V1 .
Setzen wir
f (y, z) := z − ψ(ϕ−1 (y)) ,
so gilt
dz f (y, z) = En−m , also Rang f (x) = n − m
für x = (y, z) ∈ V1 × Ê n−m
.
Ferner ist M ∩ V = {x ∈ V | f (x) = 0}. 2
261
1.3 Parametertransformationen
Zu je zwei Parametrisierungen
Φ1 : U 1 → M , Φ2 : U 2 → M M
einer m–dimensionalen Cr –Unterman-
Ê
nigfaltigkeit M des n , deren Bildmen-
D
gen nichtleeren Durchschnitt D haben,
ist
h := Φ−1
2 ◦ Φ1
ein Cr –Diffeomorphismus zwischen Φ1 Φ2

den offenen Mengen W1 = Φ−11 (D),
W2 = Φ−1 (D). h
2 U1 W1 W2 U2
h heißt Parameter– oder Koordina-
tentransformation.
Beweis.
Nach Definition einer Parametrisierung gibt es Gebiete V1 , V 2 ⊂ Ên
mit der
Eigenschaft Φ(Uk ) = V k ∩ M (k = 1, 2), also D = V1 ∩ V 2 ∩ M .
(a) Die Wk sind offen als Urbilder der offenen Menge V 1 ∩V 2 unter den stetigen,
auf den offenen Mengen U k definierten Abbildungen Φk (k = 1, 2). Nach 1.2 (b)
ist h := Φ−1
2 ◦ Φ1 : W1 → W2 bijektiv und mitsamt h
−1
stetig. Zu zeigen bleibt

die C –Differenzierbarkeit von h sowie det h (u) = 0 für u ∈ W1 .
r
(b) Wir fixieren einen Punkt u ∈ W1 und setzen a := Φ1 (u). Nach 1.2 (a) gibt
es Umgebungen, V von a, W von 0 und einen Cr –Diffeomorphismus F : V → W
mit F(a) = 0 und
F(V ∩ M ) ⊂ Span {e1 , . . . , em } =: E .
Dabei dürfen wir V ⊂ V 1 ∩ V 2 annehmen. Wie oben ergibt sich, dass Wk :=
Φ−1
k (V ∩ M ) jeweils eine offene Teilmenge von Wk ist. Nach Wahl von F gilt
F ◦ Φ1 = (ϕ1 , . . . , ϕm , 0, . . . , 0) = (ϕ, 0) auf W1 ,
F ◦ Φ2 = (ψ1 , . . . , ψm , 0, . . . , 0) = (ψ, 0) auf W2
mit ϕk ∈ Cr (W1 ), ψk ∈ Cr (W2 ) sowie
ϕ(W1 ) = ψ(W2 ) = {y ∈ Ê m
| (y, 0) ∈ W} =: Em .
Wegen der Stetigkeit von Φ−1

k ist Em eine offene Teilmenge des m ÜA . Ê
Aus Rang Φk = m und der Invertierbarkeit von F folgt nach der Kettenregel

Rang ϕ = Rang ψ = m. Wegen der Bijektivität der Abbildungen
ϕ : W1 → Em , ψ : W2 → Em
sind diese Diffeomorphismen. Die Einschränkung von h auf die Umgebung W1
von u ist
Φ−1 −1
2 ◦ Φ1 = Φ2 ◦ F
−1
◦ F ◦ Φ1 = (F ◦ Φ2 )−1 ◦ (F ◦ Φ1 ) = ψ −1 ◦ ϕ ,
also Cr –differenzierbar mit det h = det ϕ /(det ψ ) ◦ ϕ = 0. 2
1.4 Atlanten
(a) Für jede Untermannigfaltigkeit M gibt es eine Überdeckung durch höchstens
abzählbar viele Parameterumgebungen M ∩ V i = Φi (U i ).
Die Kollektion der zugehörigen Karten heißt ein Atlas für M .
Im Fall V i ∩ V k ∩ M = ∅ sind Φi und Φk im Sinn von 1.3 durch Parameter-
transformationen verbunden.
Ê
(b) Ist M kompakt, wie z.B. eine r–Sphäre im n oder ein Torus im 3, so Ê
besitzt M einen Atlas mit endlich vielen Karten, aber keinen Atlas mit nur einer
Karte.
(c) Ist M nicht kompakt, so kann die Überdeckung in (a) so gewählt werden,
dass V i ∩ M jeweils kompakte Teilmengen von M sind und jede kompakte Teil-
menge von M durch endlich viele von ihnen überdeckt wird .
Beweis.
(a) Nach 1.2 (a) gibt es zu jedem a ∈ M eine Umgebung V und einen Diffeo-
morphismus F : V → W auf eine Nullumgebung W mit
F(V ∩ M ) = Span {e1 , . . . , em } ∩ W =: Em .
Setzen wir
U := {u ∈ Ê m
| (u, 0) ∈ Em } und Φ(u) := F−1 (u, 0) ,
so erhalten wir nach 1.2 (b) eine Parametrisierung Φ : U → V ∩ M .
Im Hinblick auf (c) wählen wir eine Umgebung V a von a so, dass Va eine
kompakte Teilmenge von V ist. Dann ist F(V a ∩ M ) = Span {e1 , . . . , em } ∩
F(V a ) kompakt, also ist auch die Bildmenge Va ∩ M unter F−1 kompakt. Nach
Einschränkung von Φ auf U a := F(Va ∩M ) erhalten wir eine Parametrisierung
Φa : U a → V a ∩ M .
7
Für Ω := V a gibt es nach Bd. 1, § 23 : 4.6 eine ausschöpfende Folge offener
a∈M
Mengen
2
∞
Ω1 ⊂ Ω2 ⊂ . . . mit Ω = Ωk
k=1
so, dass die Ωk kompakte Teilmengen von Ω sind und jede kompakte Teilmenge
von Ω in einer der Mengen Ωk liegt. Nach dem Überdeckungssatz von Heine–
263
Borel (Bd. 1, § 21 : 6.3) genügen jeweils endlich viele V a , um ein einzelnes Ωk

zu überdecken. Deren Zusammenfassung liefert eine abzählbare Kollektion M
überdeckender Parameterumgebungen.
(b) Der erste Teil folgt wie oben aus dem Überdeckungssatz von Heine–Borel.
Wäre die kompakte Mannigfaltigkeit M durch eine einzige Parametrisierung
Φ : U → M beschrieben, so wäre U = Φ−1 (M ) als stetiges Bild einer kompakten
Menge kompakt, andererseits aber offen, was nicht sein kann. 2
Folgerung. Jede Untermannigfaltigkeit des Ê n

ist eine V n –Nullmenge.
Da jede abzählbare Vereinigung von Nullmengen wieder eine Nullmenge ist,
muss nach dem Beweis (a) nur folgendes gezeigt werden: Ist V Umgebung eines
Flächenpunktes, und gibt es einen Diffeomorphismus
F : V → W mit F(V ∩ M ) =: Em ⊂ Span {e1 , . . . , em },
so ist V ∩ M eine V n –Nullmenge. Da Em eine V n –Nullmenge ist, ergibt sich
dies aus dem folgenden
Satz. Ist ϕ : Ω → Ω ein Diffeomorphismus und N ⊂ Ω eine Nullmenge, so
ist auch ϕ(N ) eine Nullmenge.
Denn aus dem Transformationssatz § 8 : 1.9 ergibt sich

V n (ϕ(N )) = χϕ(N) = (χϕ(N) ◦ ϕ) | det ϕ | = χN | det ϕ | = 0 .
Ω Ω Ω
1.5 Orientierbarkeit und Orientierung

(a) Zwei Parametrisierungen Φ1 : U 1 → M ∩ V 1 , Φ2 : U2 → M ∩ V 2 ei-
ner Untermannigfaltigkeit M mit D := M ∩ V1 ∩ V 2 = ∅ heißen gleich
orientiert, wenn sie durch eine Parametertransformation h mit det h > 0
verbunden sind, d.h. wenn h := Φ−1 −1 −1
2 ◦ Φ1 : Φ1 (V 1 ∩ V 2 ) → Φ2 (V 1 ∩ V 2 )

ein orientierungstreuer Diffeomorphismus ist. Im Fall det h < 0 heißen sie ent-
gegengesetzt orientiert.
(b) Eine Untermannigfaltigkeit heißt orientierbar, wenn es einen Atlas gibt,
bei dem je zwei überlappende Parametrisierungen gleich orientiert sind. Über-
lappende Parametrisierungen Φ eines Atlasses und Ψ eines anderen Atlasses
einer orientierbaren Mannigfaltigkeit M sind entweder immer gleich oder im-
mer entgegengesetzt orientiert ÜA . Die orientierenden Atlanten zerfallen somit
in zwei Klassen. Eine Orientierung von M besteht in der Auszeichnung einer
dieser Klassen.
(c) Wird eine m–dimensionale Untermannigfaltigkeit durch eine einzige Karte
Ê
beschrieben, wie dies bei Flächenstücken im 3 der Fall ist, so ist sie offenbar
orientierbar, vgl. Bd. 1, § 25 : 3.3. Andererseits gibt es zweidimensionale Unter-
Ê
mannigfaltigkeiten des 3 , die nicht orientierbar sind, etwa das Möbiusband
(Barner–Flohr [141, II] 17.5).
1.6 Tangentialräume
Ê
Sei M eine m–dimensionale Untermannigfaltigkeit des n. Ein Vektor v ∈ n Ê
heißt Tangentenvektor von M im Punkt a ∈ M , wenn es eine C1 –Kurve
α : ]−ε, ε[ → M gibt mit
α(0) = a , α̇(0) = v .
Für eine Parametrisierung Φ : U → V ∩ M mit Φ(u) = a ∈ V ∩ M ist

∂k Φ(u) = dtd
Φ(u + tek )t=0 ein Tangentenvektor. Wegen Rang Φ (u) = m
sind v1 = ∂1 Φ(u), . . . , vm = ∂m Φ(u) linear unabhängige Tangentenvektoren.
Satz. (a) Die Menge aller Tangentenvektoren von M im Punkt a ∈ M bildet

einen m–dimensionalen Vektorraum, den Tangentialraum Ta M . Es gilt
(a) Ta M = Span {∂1 Φ(u), . . . , ∂m Φ(u)} = Bild Φ (u)
für jede Parametrisierung Φ mit Φ(u) = a und
(b) Ta M = Kern f (a) bzw. Ta M ⊥ = Span {∇fm+1 (a), . . . , ∇fn (a)}
für jede C1 –Abbildung f = (fm+1 , . . . , fn ), die M in einer Umgebung von a als

Nullstellenmenge beschreibt, vgl. 1.1.
Beweis.
Wir zeigen zunächst Bild Φ (u) ⊂ Ta M ⊂ Kern f (a) und anschließend die
Gleichheit der drei Mengen.
(i) Für v = Φ (u)w ∈ Bild Φ (u) ist t → α(t) := Φ(u + tw) eine Kurve in
M mit α̇(0) = Φ (u)w = v, somit gilt v ∈ Ta M .
(ii) Sei v ∈ Ta M , also v = α̇(0) für eine Kurve α auf M mit α(0) = a. Dann
gilt f (α(t)) = 0 für |t| 1. Daraus folgt f (a)v = dt
d
f (α(t))t=0 = 0, also
v ∈ Kern f (a).
(iii) Aus f ◦ Φ = 0 folgt nach der Kettenregel f (a) · Φ (u) = 0. Also ist
Bild Φ (u) = Span {∂1 Φ(u), . . . , ∂m Φ(u)} ein m–dimensionaler Teilraum von
Kern f (a). Wegen Rang f (a) = n − m hat Kern f (a) die Dimension m,
hieraus ergibt sich die Gleichheit der Teilräume Bild Φ (u) und Kern f (a). 2
1.7 Differenzierbare Funktionen auf Untermannigfaltigkeiten

Nach 1.2 (b) ist eine Funktion f : M → Ê
genau dann stetig (f ∈ C0 (M )),
wenn f ◦ Φ für jede Parametrisierung Φ von M stetig ist. Eine Funktion
f : M → Ê Ê
auf einer Cr –Untermannigfaltigkeit M ⊂ n heißt entsprechend
Ck –differenzierbar (f ∈ Ck (M ), 0 ≤ k ≤ r) wenn f ◦ Φ für jede Cr –
Parametrisierung Φ von M Ck –differenzierbar ist. Hierfür genügt es nach
265
1.2 (c) und 1.3 bereits, dass es zu jedem Punkt a ∈ M wenigstens eine Ck –
Parametrisierung einer Flächenumgebung V ∩ M von a gibt, so dass f ◦ Φ
Ck –differenzierbar ist.
Ê
Ein Vektorfeld v : M → n heißt Ck –differenzierbar oder ein Ck –Vektorfeld
auf M , wenn die einzelnen Komponenten v1 , . . . , vn Ck –differenzierbar sind.
1.8 Die Gramsche Matrix

Für eine Parametrisierung Φ einer m–dimensionalen Untermannigfaltigkeit
Ê
M ⊂ n hat die Gramsche Matrix
G(u) := Φ (u)T Φ (u)
die Koeffizienten
gik (u) = ∂i Φ(u) , ∂k Φ(u) .
Bei einer Umparametrisierung Φ = Ψ ◦ h ergibt die Kettenregel
Φ (u) = Ψ (h(u)) h (u) .
Bezeichnen wir die n × m–Matrix Ψ (h(u)) mit A, so gilt ∂i Φ(u) = A ∂i h(u),
also
G(u) = (Ah (u))T (Ah (u)) = h (u)T ATAh (u) .
Dabei ist AT A = H(h(u)) mit der Gramschen Matrix H(v) := Ψ (v)T Ψ (v)
von Ψ.
Für die Gramsche Determinante g(u) := det(gik (u)) = det G(u) gilt daher
g(u) = det H(h(u)) (det h (u))2 .

Die Gramsche Matrix wird bei der Darstellung der Kurvenlänge benötigt: Ist
α : [a, b] → M eine Kurve auf M , die bezüglich einer Parametrisierung Φ der
Untermannigfaltigkeit M die Koordinatendarstellung α = Φ ◦ γ mit einer C1 –
Kurve γ : [a, b] → U im Parametergebiet U besitzt, so gilt nach Bd. 1, § 24 : 2.1
ÜA
b 9

n
Lba (α) = gik (γ(t))γ̇ i (t)γ̇ k (t) dt .
i,k=1
a
Beispiel. Für die Parametrisierung Φ(u) = (u, ϕ(u)) einer Fläche M als
Graph einer C1 –Funktion ϕ : m ⊃ Ω →Ê Ê
ergibt sich als Gramsche Deter-
minante
g(u) = 1 + ∇ϕ(u)2 .
Zum Nachweis setzen wir a = (a1 , . . . , am ) := ∇ϕ(u) , A := a · aT = (ai ak ) .
Die Gramsche Matrix schreibt sich dann

G(u) = (gik (u)) = ( δik + ai ak ) = E + A .
Im Fall a = 0 gibt es nichts zu beweisen; sei also a = 0. Nach Bd. 1, § 18 : 3.4 ist
g(u) = det G(u) das Produkt der Eigenwerte (mit Vielfachheit) von G(u). Diese
sind von der Form 1 + λ, wobei λ ein Eigenwert von A ist. Aus der Gleichung
Ay = a · aT y = a , y a lesen wir ab, dass alle zu a orthogonalen Vektoren
zu Kern A gehören und dass Aa = a2 a gilt. Die Matrix A hat also den
(m − 1)–fachen Eigenwert 0 und den einfachen Eigenwert λ = a2 . Das liefert
die Behauptung g(u) = (1 + 0)m−1 (1 + a2 ) = 1 + a2 = 1 + ∇ϕ(u)2 .
2 Integration auf Untermannigfaltigkeiten

2.1 Konstruktion des Integrals
Für eine stetige Funktion f : M → Ê
auf einer m–dimensionalen
Unterman-
Ê
nigfaltigkeit M des n definieren wir das Integral f do über kompakte Teil-
K
mengen K von M in zwei Schritten:
(a) Liegt K in einer Parameterumgebung, d.h. in der Bildmenge einer Para-
Ê
metrisierung Φ : m ⊃ U → M ∩ V, so setzen wir
√
f do := f (Φ(u)) g(u) dm u , kurz (f ◦ Φ) g dm u
K Φ−1 (K) Φ−1 (K)
mit der in 1.6 eingeführten Gramschen Matrix g(u). Die Unabhängigkeit der
rechten Seite von der Parametrisierung ergibt sich aus 1.8 mit Hilfe des Trans-
formationssatzes für Integrale ÜA .
(b) Für eine beliebige kompakte Teilmenge K von M gibt es nach 1.4 (b) end-
lich viele Parameterumgebungen V k ∩ M und zugehörige Parametrisierungen
7
Ê
p
Φk : m
⊃ U k → V k ∩ M , so dass K ⊂ V k . Nach § 10: 3.5 gibt es ei-
k=1
ne zugehörige Zerlegung der Eins durch Testfunktionen ϕk ∈ C∞
c (Vk ) mit

p
0 ≤ ϕk ≤ 1 und ϕk = 1 auf K. Wir setzen Ak := K ∩ supp ϕk und
k=1
definieren

p
f do := f ϕk do ,
K k=1 Ak
wobei die rechts auftretenden Integrale im Sinne von (a) zu verstehen sind.
Dass sich für jede Überdeckung von K und jede Zerlegung der Eins derselbe
Wert ergibt, sehen wir wie folgt ein:
Sei K ⊂ W 1 ∪ · · · ∪ W q , wobei W l ∩ M jeweils die Bildmenge einer geeigneten
Parametrisierung Ψl von M ist. Ferner seien ψl ∈ C∞ c (W l ) Testfunktionen mit

q
0 ≤ ψl ≤ 1 und ψl = 1 auf K. Mit Bl := K ∩ supp ψl ergibt sich
l=1
2 Integration auf Untermannigfaltigkeiten 267

p p
q q
p
f ϕk do = f ϕk ψl do = f ϕk ψl do
k=1 Ak k=1 Ak l=1 k=1 l=1 Bl
q
p q

= f ψl ϕk do = f ψl do .
l=1 Bl k=1 l=1 Bl

(c) Das Integral f do über eine Untermannigfaltigkeit M .
M
Ist M kompakt oder wird M durch endlich viele Parameterumgebungen über-
deckt, so definieren wir f do gemäß (b).
M
Andernfalls können wir nach 1.4 (c) abzählbar viele kompakte Mengen Ki ⊂ M
7
∞
so wählen, dass M = Ki und dass jede kompakte Teilmenge von M durch
i=1 7
k
endlich viele von diesen überdeckt wird. Die kompakten Mengen Ck := Ki
i=1
haben dieselbe Eigenschaft, zusätzlich gilt C1 ⊂ C2 ⊂ . . . .
Eine stetige Funktion
f :M → Ê
heißt über M integrierbar, falls die Folge
der Integrale |f | do beschränkt ist. In diesem Fall definieren wir
Ck

f do := lim f do .
k→∞
M Ck
Die Unabhängigkeit dieser Integrale von der Wahl der ausschöpfenden Folge
(Ck ) ergibt sich wie im Beweis des Ausschöpfungssatzes Bd. 1, § 23 : 4.6,4.7.
(d) Der m–dimensionale Inhalt einer kompakten Teilmenge K von M ist
definiert durch

Am (K) := 1 do .
K
Ferner setzen wir

Am (M ) := 1 do = sup {Am (K) | K ist kompakte Teilmenge von M } ,
M

falls 1 do existiert; andernfalls sei Am (M ) := ∞.
M
Bemerkungen. (i) Da in (a) beliebige kompakte Teilmengen Φ−1 (K) als In-
tegrationsgebiete zugelassen sind, ist der Lebesguesche Integralbegriff zugrunde
zu legen.
(ii) Läßt sich M durch eine einzige Parametrisierung beschreiben, so ergibt sich
im Fall m = 1 wieder das skalare Kurvenintegral, im Fall m = 2, n = 3 das
skalare Oberflächenintegral, vgl. Bd. 1, § 24 : 3.1 und § 25 : 3.1.
2.2 Eigenschaften des Integrals über Untermannigfaltigkeiten

(a) Die Linearität und die Monotonie des Integrals ergeben sich direkt aus
der Definition. Die Integrierbarkeit von f ∈ C0 (M ) über M ist äquivalent zur
Existenz einer integrierbaren Majorante g. Es gilt dann

f do ≤ g do .
M M
(b) Für kompakte Mengen K ⊂ M und f ∈ C0 (M ) gilt die Integralabschätzung

f do ≤ max {|f (x)| | x ∈ K} · Am (K) .
K
(c) Unter den folgenden Voraussetzungen ist die Bestimmung des Integrals über
eine kompakte Menge K ohne Heranziehung von Zerlegungen der Eins möglich:
Sei K darstellbar als Vereinigung K = K1 ∪ · · · ∪ KN , wobei jede der kompakten
Mengen Ki in einer Parameterumgebung Φi (Ui ) = V i ∩ M liegt, und für i = j
seien die Mengen Φ−1 −1
i (Ki ∩ Kj ), Φj (Ki ∩ Kj ) Nullmengen im
m
Ê
. Dann gilt
N

f do = f do ,
K i=1 Ki
wobei sich jedes der Integrale auf der rechten Seite nach (a) ergibt.
Beweis.
Das Majorantenkriterium und die Integralabschätzung ergeben sich aus der De-
finition des Integrals ÜA .
(c) Einfachheitshalber betrechten wir nur den Fall N = 2. Nach 2.1 (b) gibt es
Funktionen ϕ1 ∈ C∞ ∞
c (V1 ), ϕ2 ∈ Cc (V 2 ) mit 0 ≤ ϕ1 , ϕ2 ≤ 1 und ϕ1 +ϕ2 = 1 auf
K. Für Ai := supp ϕi ⊂ Vi gilt Φ−1 −1 −1
i (Ai ∩ K1 ) ∪ Φi (Ai ∩ K2 ) = Φi (Ai ∩ K)
−1
und Ai ∩ K1 ∩ K2 ⊂ K1 ∩ K2 . Also sind Φi (Ai ∩ K1 ∩ K2 ) für i = 1, 2
Ê
Nullmengen im m , und nach Definition des Integrals in 2.1 gilt

f do = f ϕ1 do + f ϕ2 do
K A1 A2

= f ϕ1 do + f ϕ1 do
A1 ∩K1 A1 ∩K2

+ f ϕ2 do + f ϕ2 do .
A2 ∩K1 A2 ∩K2
Wegen ϕ1 + ϕ2 = 1 auf jeder der Mengen Ki gilt dabei nach 2.1 (b)

f ϕ1 do + f ϕ2 do = f do (i = 1, 2) . 2
A1 ∩Ki A2 ∩Ki Ki
2.3 Der Beitrag niederdimensionaler Mengen zum Integral

Sei M eine m–dimensionale Untermannigfaltigkeit des n und N ⊂ M eine Ê
kompakte k–dimensionale Untermannigfaltigkeit mit k < m. Dann ist M \ N
eine m–dimensionale Untermannigfaltigkeit, und es gilt

f do = f do sowie f do = 0
M M \N N
für jede über M integrierbare Funktion f ∈ C0 (M ).
Beweißkizze.
Bemerkung. Das erste Integral ist im Sinne der Integration über M zu verste-
hen, das zweite im Sinne der Integration über M \ N und das dritte im Sinne
der Integration über N . Wir schreiben im folgenden deutlichkeitshalber

f do1 , f do2 , f do3 .
M M \N N
(a) M \ N ist eine m–dimensionale Untermannigfaltigkeit, denn zu jedem

Punkt a ∈ M \ N gibt es eine Parameterumgebung V ∩ M für M mit V ∩ N = ∅.
Die zugehörige Parametrisierung von M ist auch eine von für M \ N .

(b) Für kompakte Teilmengen K von M \ N gilt f do1 = f do2 . Das
K K
ergibt sich aus der Definition 2.1 (a),2.1 (b) des Integrals, da jede Parametrisie-
rung von M \ N auch eine Parametrisierung von M ist. Nach Konstruktion des
Integrals 2.1 (c) folgt daher aus der Integrierbarkeit von f ∈ C0 (M ) über M die
Integrierbarkeit über M \ N .
7
∞
(c) Sind C1 ⊂ C2 ⊂ . . . kompakte Mengen mit M \ N = Ck , so gilt
k=1
7
∞
M = (Ck ∪ N ). Wegen (b) und der Definition 2.1 ist daher nur zu zeigen,
k=1
dass

f do1 = f do1
K∪N K
M \ N und dass A (N ) = 0. Nach 2.2 (c) ist

m
für kompakte
Teilmengen
K von
dabei f do1 = f do1 + f do1 , denn K ∩ N = ∅. Somit reduziert sich
K∪N K N
der Beweis auf den Nachweis von Am (N ) = 0.
(d) N wird durch endlich viele Parameterumgebungen V ∩ M der folgenden
Art überdeckt: V ∩ M enthält einen Punkt a ∈ N , und es gibt einen Diffeo-
morphismus F : V → W auf eine Umgebung W von 0 mit F(V ∩ M ) = Em ⊂
Span {e1 , . . . , em }. Ferner ist V ∩ N eine Parameterumgebung von a bezüglich
Ê
N , d.h. es gibt eine bijektive C1 –Abbildung Ψ : k ⊃ Ω → V ∩ N mit stetiger
Inverser. Dann gilt
Ê
(i) F ◦ Ψ : k ⊃ Ω → F(V ∩ N ) ist eine Parametrisierung von F(V ∩ N ),
aufgefasst als k–dimensionale Untermannigfaltigkeit von Em = F(V ∩ M ).
(ii) Nach 1.2 (b) erhalten wir eine Parametrisierung von M durch
Φ : U := {u ∈ Ê m
| (u, 0) ∈ Em } → V ∩ M , u → F−1 (u, 0) ,
wobei Φ−1 (u) = F(u) für u ∈ V∩M . Die Punkte u mit (u, 0) ∈ F(V∩M ) bilden
nach (i) eine k–dimensionale Untermannigfaltigkeit von U . Also gilt für beliebige
kompakte Teilmengen K von V ∩ N nach Definition des Integrals,
wegen der
Folgerung 1.4 und aufgrund des schon Bewiesenen 1 do1 = 1 do3 = 0. 2
K K
2.4 Integration über Sphären und zwiebelweise Integration

Ê
(a) Sei Sr (c) ⊂ m+1 die Sphäre mit Mittelpunkt c = (a, b) und Radius r > 0.
Wir parametrisieren die obere Halbsphäre Sr+ (c) und die untere Halbsphäre
Sr− (c) als Graphen:
& '
Sr± (c) = x, b ± r 2 − x − a2

x∈ Ê m
, x − a < r .
Der Äquator {(x, b) | x − a = r} ist eine kompakte (m − 1)–dimensionale

Untermannigfaltigkeit; das folgt unmittelbar aus der Definition 1.1 ÜA . Da
Sr (c) kompakt ist, gilt für f ∈ C0 (Sr (c)) nach dem vorangehenden Satz

f do = f do + f do .
Sr (c) Sr+ (c) Sr− (c)
Aus der Definition von 2.1 (a) ergibt sich mit Hilfe von 1.8 ÜA

dm x
f do = r f (x, b + r 2 − x − a2 )
r 2 − x − a2
Sr+ (c) Kr (a)

dm ξ
= rm f (a + rξ, b + r 1 − ξ2 ) ,
1 − ξ2
ξ<1
Letzteres nach dem Transformationssatz für Integrale ÜA . Im Integral über

√ √
Sr− (c) ist jeweils nur b + r durch b − r zu ersetzen.
(b) Zwiebelweise Integration. Sei n ≥ 3 und f stetig auf der Kugelschale
K := { x ∈

Ê n
| r1 < x < r2 } mit 0 ≤ r1 < r2 .
Dann ist r → f do stetig in ]r1 , r2 [ , und es gilt
S r (0 )
r2
f (x) dn (x) = f do dr ,
K r1 S r (0 )
falls eines dieser Integrale existiert.

Beweis.

Die Stetigkeit von r → f do = f do + f do folgt aus der zweiten
Sr (0) Sr+ (0) Sr− (0)
Darstellung der rechtsstehenden Integrale in (a); dabei ist m = n − 1.
Wir stellen x ∈ K in der Form (y, t) dar mit y ∈ Ê m
und r12 < y2 + t2 < r22 .
Für r1 < 1 < 2 < r2 sei

Ω := Ê
(ξ, r) | ξ ∈ m
, 1 <r< 2, ξ < 1 und

Ω
:= (y, t) | y ∈ Ê m
, t > 0, 2
1 < y + t <2 2 2
2 .
Dann liefert

ϕ(ξ, r) := r ξ, r 1 − ξ2
eine bijektive Abbildung des Zylinders Ω auf die obere Kugelschale Ω mit
rm
det ϕ (ξ, r) = > 0 ÜA .
1 − ξ2
Daher ist ϕ ein Diffeomorphismus, und der Transformationssatz für Integrale
liefert

rm
f (y, t) dm y dt = f (rξ, r 1 − ξ2 ) dm ξ dr
1 − ξ2
Ω Ω
2

= f do dr ,
1 Sr+ (0)
Letzteres durch sukzessive Integration und nach (a). Entsprechendes ergibt sich
für den unteren Teil der Kugelschale. Der Ausschöpfungssatz Bd. 1, § 23 : 4.7
liefert die Behauptung. 2
(c) Beispiel. Nach (a) ist der Oberflächeninhalt der r–Sphäre Sr (0) im Ê
n

dn−1 ξ
An−1 (Sr (0)) = 2r n−1 =: ωn r n−1 .
1 − ξ2
ξ<1
Dabei ist ωn der Oberflächeninhalt der Einheitssphäre. Aus Forster [147], 14.9
entnehmen wir
⎧
⎪ πk
⎪
⎨ für n = 2k
2π n/2 k!
ωn = =
Γ(n/2) ⎪
⎪ 2k+1 · π k
⎩ für n = 2k + 1 .
1 · 3 · · · · · (2k + 1)!
Folgerungen. (i) x → x−p ist genau dann über jede Kugel Kr (0) des n Ê
Ê
integrierbar, wenn p < n und genau dann über n \ Kr (0) integrierbar, wenn
Ê
p > n. Insbesondere ist 1/(1 + xp ) für p > n über den n integrierbar.
(ii) log x ist über jede Kreisscheibe in der Ebene integrierbar.
ωn n
(iii) Mit Hilfe von (b) folgt V n (Kr (0)) = r .
n
2.5 Parameterintegrale
Ê
Satz. Sei M ⊂ n eine kompakte Cr+1 –Untermannigfaltigkeit (r = 1, 2, . . . ),
Ê
Ω ⊂ m ein Gebiet und f : Ω × M → Ê
eine Cr –Funktion. Dann ist

F (x) = f (x, y) do(y) für x ∈ Ω
M
Cr –differenzierbar und es darf unter dem Integral differenziert werden.
Der Beweis ergibt sich aus der Definition des Integrals über Untermannigfal-
tigkeiten und dem Satz § 8 : 1.7 über Parameterintegrale ÜA .
3 Der Gaußsche Integralsatz

3.1 Normalgebiete
Bei der folgenden Version des Gauß-
schen Integralsatzes folgen wir der
Darstellung in Königsberger [150]
Bd.2, § 10.
Ein Randpunkt a ∈ ∂Ω eines Gebietes n(x)
Ê
Ω ⊂ n (n ≥ 2) heißt regulär, wenn
Ω
x U
es eine Umgebung U von a und eine
C1 –Funktion ψ : U → gibt mit Ê
⎧
⎪
⎨ U ∩ Ω = {x ∈ U | ψ(x) < 0} ,
(∗) U \ Ω = {x ∈ U | ψ(x) ≥ 0} ,
⎪
⎩
∇ψ(x) = 0 für x ∈ U.
Gibt es also reguläre Randpunkte, so bildet deren Gesamtheit nach 1.1 eine
(n − 1)–dimensionale C1 –Untermannigfaltigkeit M = ∂reg Ω.
Auf M = ∂reg Ω existiert genau ein stetiges Vektorfeld n mit
n(x) ⊥ Tx M , n(x) = 1 ,
x + t n(x) ∈ Ê n
\ Ω , x − t n(x) ∈ Ω für 0 < t 1
für jedes x ∈ ∂reg Ω. Ist ψ : U → Ê

eine Ω lokal beschreibende Funktion wie in
(∗), so gilt n = ∇ψ/∇ψ auf U ∩ ∂Ω.
3 Der Gaußsche Integralsatz 273
Beweis.
Es gibt höchstens ein Vektorfeld n mit diesen Eigenschaften. Zum Nachweis der
Existenz wählen wir ψ : U → Ê
wie in (∗) und setzen
∇ψ
n := auf U ∩ ∂reg Ω .
∇ψ
Dann sind die beiden ersten Eigenschaften erfüllt. Für f (t) := ψ(x + t n(x))
gilt f (0) = 0 und f (0) = ∇ψ(x) , n(x) = ∇ψ(x) > 0 . Für 0 < t 1
folgt also ψ(x + t n(x)) = f (t) > 0 und ψ(x − t n(x)) = f (−t) < 0 , somit
x + t n(x) ∈ Ω und x − t n(x) ∈ Ω . 2
Ê
Eine Menge S ⊂ n heißt eine (n − 1)–Nullmenge, wenn es zu jedem ε > 0
Ê
eine Folge von Würfeln W1 , W2 , . . . ⊂ n mit Seitenlängen d(Wi ) gibt, so dass
7
∞
∞
S ⊂ Wi , d(Wi )n−1 < ε .
i=1 i=1
S ist z.B. eine (n − 1)–Nullmenge, wenn S in der endlichen oder abzählbaren

Vereinigung von Untermannigfaltigkeiten der Dimension < n − 1 enthalten ist.
(Punkte werden dabei als 0–dimensionale Untermannigfaltigkeiten gezählt.)
Unter einem Normalgebiet verstehen wir ein beschränktes Gebiet Ω ⊂ Ê n
mit den Eigenschaften

(a) An−1 (∂reg Ω) < ∞,
(b) ∂Ω \ ∂reg Ω ist eine (n − 1)–Nullmenge.
Der Rand eines Normalgebiets besteht also aus einer (n − 1)–dimensionalen
C1 –Untermannigfaltigkeit endlichen Oberflächeninhalts und der Menge von sin-
gulären Punkten (vorzustellen als Ecken und Kanten von ∂Ω), der klein im Sinne
der (n − 1)–dimensionalen Inhaltsmessung ist.
Ê
Ein Gebiet Ω ⊂ n nennen wir Cr –berandet (r ≥ 1), wenn ∂Ω eine (n − 1)–
Ê
dimensionale Cr –Untermannigfaltigkeit des n ist, d.h. wenn Ω nahe ∂Ω lokal
durch Cr –Funktionen ψ wie in (∗) beschreibbar ist.
Offensichtlich ist jedes beschränkte, Cr –berandete Gebiet ein Normalgebiet.
3.2 Der Gaußsche Integralsatz

Ê
Ist Ω ⊂ n ein Normalgebiet mit äußerem Einheitsnormalenfeld n und v ein
Vektorfeld in C0 (Ω) ∩ C1 (Ω) , so gilt

div v dn x = v , n do ,
Ω ∂Ω
falls das Integral auf der linken Seite existiert.

Bemerkungen. (i) Das Integral auf der rechten Seite ist dabei definiert durch
das Integral

v , n do ;
∂reg Ω
dieses existiert wegen An−1 (∂reg Ω) < ∞ und der Stetigkeit von v auf ∂Ω .
(ii) Hinreichend für die Existenz des linksstehenden Integrals ist v ∈ C1 (Ω).
(iii) Weitere Versionen des Gaußschen Integralsatzes finden sich in Ziemer [135]
5.8. Für C1 –berandete Gebiete wird ein kurzer Beweis in Forster [147, 3] § 21
gegeben.
Folgerung (Randlose Version des Gaußschen Satzes). Für jedes Gebiet Ω des
Ên
Ê
und jedes C1 –Vektorfeld v auf n mit kompaktem Träger in Ω gilt

div v dn x = 0 .
Ω
Beweis.
Wir wählen ein R > 0 mit supp v ⊂ KR (0) =: Ω . Wegen v = 0 auf ∂Ω und
supp v ⊂ Ω gilt dann

0= v , n do = div v dn x = div v dn x = div v dn x . 2
∂Ω Ω supp v Ω
3.3 Mehrfache partielle Integration

Ê
Ist Ω ⊂ m ein Gebiet, u ∈ Cm (Ω), v ∈ Cm
c (Ω) und α ein Multiindex mit
|α| ≤ m , so gilt

∂ α u · v dn x = (−1)|α| u · ∂ α v dn x .
Ω Ω
Zur Definition von Multiindizes α und von |α| verweisen wir auf § 10 : 2.2.
Der Beweis ergibt sich durch Induktion nach |α|. Für |α| = 1, also α = ei
folgt die Behauptung durch Anwendung der Folgerung 3.2 auf das Vektorfeld
w := u · v · ei mit kompaktem Träger in Ω:

0 = div w = ∂i (u v) = v ∂i u + u ∂i v .
Ω Ω Ω Ω
Für |α| = 2, also α = ei + ej ergibt die zweimalige Ausnützung dieser Identität

∂αu v = ∂i ∂j u v = − ∂j u ∂i v = u ∂j ∂i v = u ∂αv .
Ω Ω Ω Ω Ω
Die Ausführung der Induktion überlassen wir den Lesern als ÜA . 2
4 Die Greenschen Identitäten 275
4 Die Greenschen Identitäten

4.1 Die Greenschen Identitäten für den Laplace–Operator
Ist Ω ⊂ Ên
ein Normalgebiet, so gilt

(1) ∇u , ∇v + u Δv dn x = u ∂n v do
Ω ∂Ω
für u ∈ C0 (Ω) ∩ C1 (Ω), v ∈ C1 (Ω) ∩ C2 (Ω) mit ∇u, Δv ∈ L2 (Ω),

(2) u Δv − v Δu dn x = u ∂n v − v ∂n u do
Ω ∂Ω
für u, v ∈ C1 (Ω) ∩ C2 (Ω) mit Δu, Δv ∈ L2 (Ω) .
Bemerkung. Wie im Gaußschen Integralsatz schreiben wir in den rechts ste-

henden Integralen ∂Ω anstelle von ∂reg Ω , vgl. die Bemerkung (i) in 3.2.
Der Beweis ergibt sich unmittelbar durch Anwendung des Gaußschen Integral-
satzes 3.2 auf die Vektorfelder u∇v bzw. u∇v − v∇u .
4.2 Die Greensche Identität für Differentialoperatoren 2. Ordnung

Gegeben sei ein linearer Differentialoperator zweiter Ordnung auf Ω ⊂ Ê
n
,
n
n
u → Lu = aik ∂i ∂k u + ai ∂i u + au ,
i,k=1 i=1
C2 (Ω) → C0 (Ω) ,
mit Koeffizienten
aik = aki ∈ C2 (Ω) , ai ∈ C1 (Ω) , a ∈ C0 (Ω) .
Der zu L formal adjungierte Differentialoperator v → L∗ v ist so defi-

niert, dass der Ausdruck
v Lu − u L∗ v
die Divergenz eines Vektorfeldes auf Ω ist.

Es ergibt sich

n
n
v → L∗ v := ∂i ∂k (aik v) − ∂i (ai v) + av,
i,k=1 i=1
C2 (Ω) → C0 (Ω) ,
denn es gilt

n
n
v Lu = aik v ∂i ∂k u + ai v ∂i u + a u v
i,k=1 i=1

n
= ∂i (aik v ∂k u) − ∂i (aik v) ∂k u
i,k=1

n
+ ∂i (ai u v) − ∂i (ai v) u + auv
i=1

n
= ∂i (aik v ∂k u) − ∂k (u ∂i (aik v)) + u ∂k ∂i (aik v)
i,k=1

n
+ ∂i (ai u v) − u ∂i (ai v) + auv
i=1

n
= u L∗ v + ∂i wi = uL∗ v + div w .
i=1
Die Komponenten des Vektorfelds w lauten also

n

wi := aik v ∂k u − u ∂k (aik v) + ai u v .
k=1
Zusammen mit dem Gaußschen Integralsatz ergibt sich hieraus unmittelbar die
Greensche Identität für den Differentialoperator L in zwei Versionen:
(a) Ist Ω ein Normalgebiet mit äußerem Einheitsnormalenfeld n, so gilt

v Lu dn x = u L∗ v dn x + w , n do
Ω Ω ∂Ω
für u, v ∈ C1 (Ω) ∩ C2 (Ω) mit Lu , L∗v ∈ L2 (Ω), wobei

n
wi = (aik v ∂k u − u ∂k (aik v)) + ai uv (i = 1, . . . , n).
k=1

(b) ϕ Lu dn x = u L∗ ϕ dn x
Ω Ω
gilt für u ∈ C2 (Ω), ϕ ∈ C2c (Ω) und beliebige Gebiete Ω.
ÜA Hat L Divergenzgestalt, d.h. ist von der Form

n
Lu = ∂i aik ∂k u + au ,
i,k=1
so gilt

n
L∗ = L und wi = aik v ∂k u − u ∂k v .
k=1
(c) Bemerkung. Für einen linearen Differentialoperator m–ter Ordnung auf

Ω ⊂ n,Ê
u → Lu = aα ∂ α u mit aα ∈ C|α| (Ω) ,
|α|≤m
4 Die Greenschen Identitäten 277
wird der formal adjungierte Differentialoperator

v → L∗ v := (−1)|α| ∂ α (aα v)
|α|≤m
in analoger Weise so festgelegt, dass v Lu − uL∗ v Divergenzform hat, woraus

mit dem Gaußschen Integralsatz folgt

ϕLu dn x = uL∗ ϕ dn x für u ∈ Cm (Ω) , ϕ ∈ Cm
c (Ω) .
Ω Ω
4.3* Verallgemeinerte Greensche Formeln

Diese werden für die Behandlung des Neumann–Problems in § 14 benötigt.
Ê
Sei Ω ⊂ n ein beschränktes Gebiet mit C2 –differenzierbarem Rand. Wir sa-
gen, dass u ∈ C1 (Ω) eine einseitige Normalableitung ∂n u auf ∂Ω besitzt,
kurz u ∈ C1n (Ω), wenn
∂n u(x) := lim ∇u(x − t n(x)) , n(x)

t→0+
gleichmäßig für alle x ∈ ∂Ω konvergiert. Dabei ist n das äußere Normalenfeld

auf ∂Ω wie in 3.1.
Satz. (a) Es gilt C1 (Ω) ⊂ C1n (Ω) ⊂ C0 (Ω) und für u ∈ C1n (Ω) ist ∂n u stetig
auf ∂Ω .

(b) (u Δv + ∇u , ∇v ) dn x = u ∂n v do gilt für u ∈ C0 (Ω) ∩ C1 (Ω),
Ω ∂Ω
v ∈ Cn (Ω) ∩ C2 (Ω) mit u Δv , ∇u , ∇v ∈ L1 (Ω).
1

(c) (u Δv − v Δu) dn x = (u ∂n v − v ∂n u) do gilt für u, v ∈ C1n (Ω)∩C2 (Ω)
Ω Ω
mit u Δv, v Δu ∈ L1 (Ω).
(d) Für jede harmonische Funktion u ∈ C1n (Ω) ∩ C2 (Ω) gilt

∇u2 dn x = u ∂n u do .
Ω ∂Ω
Beweisskizze.
(a) ∂n u ist als gleichmäßiger Limes stetiger Funktionen stetig auf ∂Ω. Für
u ∈ C1 (Ω) existiert lim ∇u(x + t n(x)) =: g(x) , also auch
t→0+
∂n u(x) = g(x) , n(x) .
Damit haben wir C1 (Ω) ⊂ C1n (Ω).

Für y ∈ ∂Ω, t > 0 gilt y − t n(y) ∈ Ω . Umgekehrt bestimmt jeder hinreichend

nahe bei ∂Ω liegende Punkt x ∈ Ω eindeutig ein y ∈ ∂Ω und ein t > 0 mit
x = y − t n(y) , genauer:
Ê
Es gibt eine Umgebung Ur := { x ∈ n | dist (x, ∂Ω) < r } von ∂Ω , eine
C1 –Abbildung p : Ur → ∂Ω und eine C1 –Funktion d : Ur → ]−r, r[ mit
x ∈ Ur ⇐⇒ x = p(x) − d(x) n(p(x)) und
d(x) = x − p(x) = dist (x, ∂Ω) für x ∈ Ur ∩ Ω .
Die Projektion p(x) von x auf ∂Ω ist eindeutig betimmt: x = y − t n(x) ⇐⇒

y = p(x), t = d(x).
Dies und das Folgende ergibt sich aus dem lokalen Umkehrsatz, angewandt auf
h(u, t) = Φ(u) − t n(Φ(u)) , wobei Φ eine C2 –Parametrisierung von ∂Ω ist.
Für festes t mit |t| < r sind die Parallelflächen Σt = { x ∈ Ur | d(x) = t }
zu Σ0 = ∂Ω jeweils C1 –Untermannigfaltigkeiten mit dem Einheitsnormalenfeld
N = −∇d , und für x ∈ Ur gilt
N(x) = n(p(x)) .
Hieraus folgt für u ∈ C1n (Ω) und x ∈ Ur ∩ Ω
(∗) ∂ N u(x) = ∇u(x) , N(x) = ∇u(y − t n(y)) , n(y)
mit y = p(x), t = d(x) > 0.

(a) Für u ∈ C1n (Ω) und y ∈ ∂Ω sei h(t) = u(y − t n(y)) . Dann gilt
h (t) = − ∇u(y − t n(y)) , n(y) und lim h (t) = − ∂n u(y) .

t→0+
Daher existiert
t
u(y) := u(y − t n(y)) + ∇u(y − s n(y)) , n(y) ds .
0
Zu gegebenem ε > 0 gibt es ein t > 0 mit

∂n u(y) − ∇u(y − s n(y)) , n(y) < ε für alle y ∈ ∂Ω, s ∈ [0, t].
Da ∂n u(y) auf ∂Ω und u auf Σt gleichmäßig stetig sind, folgt die gleichmäßige
Stetigkeit von u auf ∂Ω sowie |u(x) − u(p(x))| < ε d(x) für d(x) < δ . Mit
der Dreiecksungleichung folgt lim u(x) = u(y) für y ∈ ∂Ω.
Ω x→y
(b) Für Ωt := { x ∈ Ω | dist (x, ∂Ω) > t } gilt ∂Ωt = Σt und

(u Δv + ∇u , ∇v ) dn x = u ∂ N v do .
Ωt Σt
5 Der Laplace–Operator in krummlinigen Koordinaten 279
Die Behauptung (b) folgt für t → 0 mit dem Ausschöpfungssatz für die linke
Seite und wegen der gleichmäßigen Konvergenz des Integranden der rechten
Seite von (∗) auf einer kompakten Menge. Entsprechend ergibt sich (c).
(d) folgt unter den genannten Voraussetzungen aus

lim ∇u2 dn x = lim u ∂ N u do = u ∂n u do
t→0+ t→0+
Ωt Σt ∂Ω
mit Hilfe des Satzes von Beppo Levi. 2
5 Der Laplace–Operator in krummlinigen Koordinaten

5.1 Koordinatentransformationen und Gramsche Matrix
(a) Für eine Koordinatentransformation (d.h. einen C2 –Diffeomorphismus)
h : Ω → Ω , ξ → x = h(ξ)
definieren wir die Funktionen
gik = ∂i h , ∂k h .
Die aus diesen gebildete Gramsche Matrix G = (gik ) ist symmetrisch und
positiv definit, denn für A := h gilt
G = AT A .
Somit existiert die inverse Matrix
G−1 = (g ik ) = A−1 (AT )−1 = A−1 (A−1 )T = B T B mit B := (A−1 )T
und diese ist ebenfalls positiv definit. Wie in 1.8 definieren wir die Gramsche
Determinante durch
g := det (gik ) = (det A)2 > 0 .
(b) Die meisten in der Mathematischen Physik verwendeten Koordinatentrans-

formationen sind orthogonal, d.h. besitzen die Eigenschaft
gik = 0 für i = k .
Für solche Transformationen gilt
g ik = 0 für i = k , g ii = 1/gii , und g = g11 · · · gnn ,
was die Berechnung des Laplace–Operators nach der folgenden Formel von Ja-
cobi einfach gestaltet.
(c) Als Beispiel betrachten wir die Transformation ξ → h(ξ) = x in Kugelko-

ordinaten,
⎛ ⎞
r sin ϑ cos ϕ
h(r, ϑ, ϕ) = ⎝ r sin ϑ sin ϕ ⎠ für r > 0, 0 < ϑ < π, 0 < ϕ < 2π .
r cos ϑ
Für diese ergibt sich ÜA
g11 (r, ϑ, ϕ) = 1 , g22 (r, ϑ, ϕ) = r 2 , g33 (r, ϑ, ϕ) = r 2 sin2 ϑ ,
gik = 0 für i = k und g = r 4 sin2 ϑ .
Zahlreiche Beispiele von Koordinatentransformationen sind in Arfken–Weber

[1] Ch. 2 angegeben.
5.2 Die Jacobische Formel

Satz (Jacobi 1848). Ist h : Ω → Ω eine Koordinatentransformation, u eine
C2 –Funktion auf Ω und U := u ◦ h , so gilt

1 ∂ √ ik ∂U
n
Δu = √ gg ,
g ∂ξi ∂ξi
i,k=1
wobei auf der linken Seite das Argument x = h(ξ) und auf der rechten das
Argument ξ = (ξ1 , . . . , ξn ) einzutragen ist.
Beispiele. (a) Für Polarkoordinaten in der Ebene ergibt sich hieraus die For-
mel § 6 : 5.2 ohne die dort angestellte längliche Rechnung ÜA .
(b) Bei der Transformation 5.1 (c) auf Kugelkoordinaten erhalten wir ÜA
1 ∂
∂U 1 ∂
∂U
1 2
∂ U
2
Δu = r + sin ϑ + .
r 2 ∂r ∂r r 2 sin ϑ ∂ϑ ∂ϑ r 2 sin2 ϑ ∂ϕ2
Beweis.
Der direkte Weg, nämlich Berechnung von Δ(U ◦ h−1 ) und anschließendes Ein-
setzen von h ist sehr rechenaufwändig. Günstiger ist es, partielle Integration mit
dem Transformationssatz für Integrale und dem Lemma von du Bois–Reymond
zu kombinieren:
Wir verwenden die Bezeichnungen von 5.1. Bezeichnen wir die Koeffizienten von
B = (A−1 )T mit Bji , so gilt wegen G−1 = B T B

n
(1) g ik = Bji Bjk ;
j=1
5 Der Laplace–Operator in krummlinigen Koordinaten 281
ferner folgt aus 5.1

√
(2) g = | det h | .
Wir wählen ϕ ∈ C∞
c (Ω) und setzen Φ := ϕ ◦ h ∈ Cc (Ω ) . Mit der Kettenregel
2
−1 −1
folgt aus ϕ = Φ ◦ h , u = U ◦ h
∂ϕ ∂Φ i ∂u k ∂U
(3) = Bj ◦ h−1 , = Bj ◦ h−1 .
∂xj ∂ξi ∂xj ∂ξk
i k
Partielle Integration 4.2 (b) liefert

∂ϕ ∂u
− n
ϕ Δu d x = dn x
∂xj ∂xj
j
Ω

Ω

∂Φ i k ∂U
◦ h−1 dn x
(3)
= Bj Bj
∂ξi ∂ξk
i,j,k

Ω

∂Φ ∂U
◦ h−1 dn x .
(1)
= g ik
∂ξi ∂ξk
i,k
Ω
Der Transformationssatz und anschließende partielle Integration ergeben

√ ∂Φ ∂U
− n
ϕ Δu d x = g g ik dn ξ
∂ξi ∂ξk
i,k
Ω
Ω
∂ √
∂U
= − Φ g g ik dn ξ .
∂ξi ∂ξk
i,k
Ω
Durch nochmalige Anwendung des Transformationssatzes erhalten wir daraus

1 ∂ √
∂U
ϕ Δu dn x = ϕ √ g g ik ◦ h−1 dn x .
g ∂ξi ∂ξk
i,k
Ω Ω
Mit dem Lemma von du Bois–Reymond § 10 : 4.1 ergibt sich schließlich

1 ∂
n
√ ∂U
(Δu) ◦ h = √ gg ik
. 2
g ∂ξi ∂ξi
i,k=1
5.3 Die Invarianz des Laplace–Operators unter Bewegungen

Satz. Ist h eine Bewegung des Ê n
und u eine C2 –Funktion auf einem Gebiet
Ê
Ω ⊂ n , so gilt
Δ(u ◦ h) = (Δu) ◦ h .
Folgerung. Für jede harmonische Funktion u und jede Bewegung h ist auch
u ◦ h harmonisch.
Beweis.

n
Jede Bewegung h hat die Gestalt h(ξ) = a+A ξ = a+ ξi ai mit einem Vektor
i=1
a, einer orthogonalen Matrix A mit den Spaltenvektoren a1 , . . . , an . Damit gilt
gik = ∂i h , ∂k h = ai , ak = δik , g ik = δik , g = 1.
Für u ∈ C2 (Ω) und U := u ◦ h ∈ C2 (Ω ) mit Ω := h−1 (Ω) ergibt sich aus
der Jacobischen Formel
(Δu) ◦ h = ΔU = Δ(u ◦ h) . 2
5.4 Aufgaben
(a) Berechnen Sie mit der Jacobischen Formel den Laplace–Operator für ellip-
tische Zylinderkoordinaten
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
ξ x cosh ξ cos η
⎝ ⎠ ⎝
h : η −→ y = ⎠ ⎝ sinh ξ sin η ⎠ .
ζ z ζ
(b) Dasselbe für parabolische Zylinderkoordinaten

⎛ ⎞ ⎛ ⎞ ⎛ ⎞
ξ x ξη
h : ⎝η ⎠ −→ ⎝y ⎠ = ⎝ 12 (ξ 2 − η 2 )⎠ .
ζ z ζ
(c) Zeigen Sie für die Spiegelung an der R–Sphäre
ξ −→
R2
ξ2
ξ, Ê n
\ {0} → Ê n
\ {0} ,
dass mit der Abkürzung = R2 /ξ2 und der Notation von 5.2 gilt:

n
2 −n ∂ n−2 ∂U
gik = δik , also Δu = .
∂ξi ∂ξi
i=1
283
§ 12 Die Fouriertransformation
Die Fouriertransformation ist ein wichtiges Hilfsmittel für die Theorie der Dif-
ferentialgleichungen, sie spielt auch in der Quantenmechanik, in der Optik und
in der Systemtheorie eine tragende Rolle.
Vorkenntnisse: Testfunktionen, Faltungsintegral (§ 10). Die Kenntnis des Lebes-
gue–Integrals ist nur an wenigen, eigens ausgewiesenen Stellen nötig.
Literatur: Folland [35], Wladimirow [56], Hörmander [63].
1 Zielsetzung
1.1 Die Fouriertransformation von Differentialgleichungen
(a) Wir suchen eine Transformation von Funktionen, welche Differentiation in
Multiplikation überführt. Hierzu definieren wir den Differentiationsoperator P
und den Multiplikationsoperator Q für differenzierbare Funktionen u : → Ê
durch
1
P : u → i u , Q : u → x· u,
wobei x · u für die Funktion x → xu(x) steht.
/ , unter welcher der Operator
Gesucht ist also eine lineare Transformation u → u
P in den Operator Q übergeht,
(∗) :u = Q u
P /.
Durch zweimalige Anwendung von (∗) folgt
: = P;
(∗∗) − u :u = Q2 u
2u = Q P /.
Somit kann diese Transformation dazu dienen, die Differentialgleichung
u + a u + b u = f (a, b Konstanten, f eine gegebene Funktion)
/ zu überführen, und zwar in
in eine algebraische Gleichung für u
/(y) (−y 2 + iay + b) = f/(y) .
u
(b) Setzen wir die gesuchte Transformation als Integraltransformation

+∞
/(y) =
u K(x, y) u(x) dx
−∞
mit einer beschränkten C1 –Funktion K an, so ergibt sich, falls u und u inte-
grierbar sind und lim u(x) = 0 gilt,
|x|→∞

+∞
+∞
:u)(y) = − i
(P K(x, y)u (x) dx = i ∂K
∂x
(x, y)u(x) dx ,
−∞ −∞

+∞
/)(y) = y u
(Q u /(y) = y K(x, y)u(x) dx .
−∞
284 § 12 Die Fouriertransformation
Die Beziehung (∗) ist also gewährleistet, falls (∂K/∂x)(x, y) = −iy K(x, y) .
Das bedeutet K(x, y) = ce−ixy mit einer Integrationskonstanten c . Aus Grün-
den, die in 1.2 deutlich werden, setzen wir c := (2π)−1/2 und erhalten somit
für integrierbare Funktionen u : → Ê
+∞
1
/(y) := √
u e−ixy u(x) dx .
2π
−∞
(c) Den Nutzen der so heuristisch eingeführten Fouriertransformation u → u /

skizzieren wir am Beispiel des Wärmeleitungsproblems in einem unendlich lan-
gen Draht. Sei u eine Lösung des Anfangswertproblems für die Wärmeleitungs-
gleichung
∂2u
(x, t) für x ∈ , t > 0 und u(x, 0) = f (x) .
∂u
(x, t) =
∂t ∂x2
Wir betrachten die Fouriertransformierte bezüglich der Ortsvariablen, d.h.
+∞
1
/(y, t) := √
u e−ixy u(x, t) dx .
2π
−∞
Unter geeigneten Voraussetzungen über u und f (Näheres dazu in 2.2) ergibt

sich mit Hilfe der Umformung (∗∗)
+∞ +∞
/
∂u 1 −ixy ∂u 1 ∂2u
(y, t) = √ e (x, t) dx = √ e−ixy (x, t) dx
∂t 2π ∂t 2π ∂x2
−∞ −∞
(∗∗)
/(y, t) .
= −y u 2
Nach Integration dieses AWP erhalten wir

2t 2
/(y, 0) e−y
/(y, t) = u
u = f/(y) e−y t .
Wir werden zeigen, dass die Fouriertransformation injektiv ist, d.h. dass u durch
/ eindeutig bestimmt ist. Für die Lösung des Wärmeleitungsproblems bleibt so-
u
mit die Aufgabe, die Fouriertransformation umzukehren. Einen Hinweis darauf,
wie dies zu bewerkstelligen ist und zugleich einen anderen Zugang zur Fourier-
transformation geben die folgenden Betrachtungen.
1.2 Von der Fourierreihe zum Fourierintegral

Gegebensei eine Testfunktion u : → . Wir wählen n ∈ so groß, dass
supp u ⊂ [−nπ, nπ] und bezeichnen mit un diejenige 2πn–periodische Funkti-
on, welche auf [−nπ, nπ] mit u übereinstimmt. Für jedes x ∈ gibt es dann
ein n ∈ mit un (x) = u(x). Somit gilt un → u punktweise auf . (Machen
Sie sich für einen Standardbuckel u anhand einer Skizze klar, wie die Kopien
1 Zielsetzung 285
von u für wachsendes n nach links bzw. rechts wandern.) Wir zeigen, dass die
Fourierreihe von un für n → ∞ in eine Darstellung von u als Fourierintegral“
”
übergeht. Um die Fourierentwicklung der un zu gewinnen, beachten wir, dass
∞
durch fn (t) := un (nt) eine 2π–periodische C –Funktion gegeben ist. Somit gilt
nach dem Satz von Dirichlet § 6 : 2.3 in der komplexen Version § 6 : 2.1

+∞
(n) (n) 1 π −ikt
(1) fn (t) = ck eikt mit ck = e fn (t) dt .
k=−∞ 2π −π
Wegen un (x) = u(x) für |x| ≤ nπ und u(x) = 0 für |x| ≥ nπ folgt
(n) 1 π −ikt 1 nπ −i k x

(2) ck = e un (nt) dt = e n un (x) dx
2π −π 2πn −nπ
1 nπ −i k x 1 +∞ −i k x
= e n u(x) dx = e n u(x) dx
2πn −nπ 2πn −∞
1

k
= √ /
u
2π n n
/ . Somit folgt aus (1)

mit der in 1.1 eingeführten Fouriertransformierten u
1
+∞
k
k 1
(3) un (x) = √ /
ei n x u .
2π k=−∞ n n
Die rechte Seite deuten wir als Approximation des Integrals

1 +∞ ixy
√ e u /(y) dy
2π −∞

durch eine Reihe; u/(y) wird hierbei auf den Intervallen nk , k+1
n
/( nk )
durch u
angenähert, vgl. Bd. 1, § 11 : 4.3 (c). Wegen der punktweisen Konvergenz un →
u erwarten wir daher, dass Gleichung (3) für n → ∞ übergeht in
1 +∞ ixy
(4) u(x) = √ e u /(y) dy .
2π −∞
Damit haben wir die Umkehrformel für die Fouriertransformation erraten: Aus
/ = v folgt u(x) = /
u v (−x). (Den rein technischen Beweis für die Berechtigung
des√Übergangs von (3) nach (4) unterdrücken wir.) Die Wahl des Vorfaktors
1/ 2π erklärt sich einerseits durch die Symmetrie der Umkehrformel, ande-
+∞
+∞
rerseits durch die Formel /(y)|2 dy =
|u |u(x)|2 dx , die in Abschnitt 4
−∞ −∞
bewiesen wird.
2 Die Fouriertransformation auf L1 ( Ê) n

Für jede integrierbare Funktion u : Ên
→ existiert das Integral

für alle y ∈ n
n
/(y) := (2π)− 2
u e−i x , y u(x) dn x
Ên
/:
und liefert eine stetige, beschränkte Funktion u n → , die Fouriertrans-
formierte von u.
Der lineare Operator
F : L1 (n ) → C0 (n) , /
u → u
heißt Fouriertransformation auf L1 ( Ê ).n
Die Existenz des Integrals und die Stetigkeit von u / folgen aus dem Majoran-
−i x , y
tenkriterium und dem Satz über Parameterintegrale, denn der Integrand hat
die von y unabhängige Majorante e u(x) = u(x) .
Bemerkungen.
(a) Vertrautheit mit dem Lebesgue–Integral ist für die Hauptthemen dieses Pa-
ragraphen (Fouriertransformation für schnellfallende Funktionen, Anwendungen
auf DG) nicht erforderlich. Die Voraussetzung u ∈ L1 (n ) kann gelesen werden
als u ist über den n integrierbar“. Sie ist immer erfüllt, wenn u : n →
”
stetig und im herkömmlichen Sinn integrierbar ist (Bd. 1, § 23 : 4). Der Raum
L () umfasst auch stückweis stetige, über integrierbare Funktionen (Bd. 1,
1
§ 12 : 4). Für n ≥ 2, u ∈ L1 (n ) läßt sich u

/ durch sukzessive Integration be-
rechnen, Genaueres in § 8 : 1.8. Die Beweise werden größtenteils ohne Rückgriff
auf das Lebesgue–Integral geführt; Ausnahmen bilden 2.6 (c), und 5.2.
(b) Unter diesen Voraussetzungen gilt beispielsweise für u ∈ L1 (2)

+∞
+∞
/(y1 , y2 ) =
u √1
2π
√1
2π
u(x1 , x2 ) e−ix2 y2 dx2 e−ix1 y1 dx1 ,
−∞ −∞
entsprechend ist die Fouriertransformation auf L1 (n) Hintereinanderausfüh-

rung von n eindimensionalen Fouriertransformationen. Daraus und aus 1.2 er-
klärt sich der Vorfaktor (2π)−n/2 . (In der Literatur wird als Vorfaktor auch 1
statt (2π)−n/2 verwendet.)
(c) Im folgenden lassen wir beim Integral die Angabe des Integrationsgebiets
n meistens fort.
(d) Die für die Fouriertransformation zugelassenen Funktionen müssen zunächst
über den ganzen n integrierbar sein und damit im Unendlichen ein gewisses
Abfallverhalten besitzen. Für nicht integrierbare Funktionen, z.B. Polynome,
kann den Fouriertransformierten noch ein distributioneller Sinn gegeben wer-
den, siehe § 13 : 6.
2 Die Fouriertransformation auf L1 ( Ê n
) 287
Beispiele. (i) Für u = χ[−a,a] mit a > 0 erhalten wir

+∞ a
/(y) =
u √1
2π
e−ixy u(x) dx = √1
2π
e−ixy dx = 2 sin ay
π y
für y = 0 ,
−∞ −a
2a
/(0) = √ = lim u
u /(y) (Fig.). 6
2π y→0
u
Dies entspricht der Formel für die Am-
plitude bei der Beugung an einem Spalt -
der Breite 2a (untere Figur). −a a x
Beachten Sie: u / ist nicht integrierbar:
6

Nπ
N
πk /
u
sin y
y
dy ≥ 1
πk
| sin y| dy
0 k=1 π(k−1)

N
= 2
π
1
k
. -
k=1 y
−a|x|
(ii) Für u(x) = e mit a > 0 gilt
2 a
/(y) =
u ÜA .
π a2 + y 2
/ dienen, vgl.
In manchen Fällen kann der Residuensatz zur Berechnung von u
Bd. 1, § 28 : 7.4.
2.2 Das P, Q–Gesetz

(a) Wir definieren die Ableitungsoperatoren Pk und die Multiplikations-
operatoren Qk durch die Vorschriften
1 ∂u
Pk u := , Qk u : x → xk u(x) (k = 1, . . . , n) .
i ∂xk
Für diese gelten die Vertauschungsrelationen
(Pk Ql − Ql Pk ) u =
1
i
δkl u für u ∈ C1 ( Ê) n
ÜA .
In der Quantenmechanik heißen die h̄Pk Impulsoperatoren und die Qk Orts-

operatoren.
Für Multiindizes α = (α1 , . . . , αn ) setzen wir gemäß § 10 : 2.2
1 ∂ α1 1 ∂ αn
P α := ··· = (−i)|α| ∂ α ,
i ∂x1 i ∂xn
1 · · · xn u(x) .
(Qα u)(x) := xα u(x) = xα1 αn
(b) Satz. (i) Genügt u ∈ Cm = Cm ( Ê ) der Bedingung P

n α
u ∈ L1 := L1 ( Ê
n
)
für |α| ≤ m, so gilt
c
P; / für |α| ≤ m und | u
α u = Qα u /(y) | ≤
1 + ym
mit einer Konstanten c.
(ii) Unter der Voraussetzung Qα u ∈ L1 ( Ê n
/ ∈ Cm (
) für |α| ≤ m gilt u Ê
n
)
und
;
Q α u = (−1)|α| P α u
/ für |α| ≤ m .
/
Wir gewinnen hieraus folgende Regel: Je glatter u ist, desto schneller fällt u
im Unendlichen ab; je schneller u im Unendlichen abfällt, desto glatter ist u/.
Letzteres wird durch folgenden Sachverhalt unterstrichen:
Ê / analytisch,
(c) Zusatz. Für u ∈ C0c ( n) ist u d.h. u /(y) kann um jeden Punkt
Ê
y0 ∈ n in eine überall konvergente Reihe aα (y − y0 )α entwickelt werden
Das folgt aus dem Satz von Paley und Wiener, vgl. Dym–Mc Kean [34], 3.3.
Aus letzterem ergibt sich noch die für die Fouriertransformation von Distributio-
Ê
nen wichtige Aussage: Für u ∈ C0c ( n), u = 0 kann die Fouriertransformierte
/ nach dem Identitätssatz für Potenzreihen keinen kompakten Träger besitzen.
u
(d) Beispiele. Es gilt
;
P /
k u = Qk u für u ∈ C1 ∩ L1 mit ∂1 u, . . . , ∂n u ∈ L1 ,
Pk u ;
/ = −Q / ∈ C1 für Q1 u, . . . , Qn u ∈ L1 ,
k u und u
:
− Δu(y) /(y) für u ∈ C2 mit u, ∂i u, ∂i ∂i u ∈ L1 .
= y2 u
Beweis.
;
(i) Zunächst sei m = 1. Für u ∈ C1 mit u, P1 u, . . . ,Pn u ∈ L1 sind Pk u = Qk u
/(y) zu zeigen. Es genügt, den Fall k = n
und die Beschränktheit von (1+y) u
zu betrachten. Nach der Bemerkung 2.1 (b) können wir P ;n u durch sukzessive
Integration berechnen: Setzen wir x = (ξ, s), y = (η, t) mit ξ, η ∈ n−1 und Ê
Ê
s = yn , t = xn ∈ , so erhalten wir
n
+∞
(1) ;
(2π) 2 i Pn u(y) = e−i ξ,η
e−ist ∂n u(ξ, s) ds dn−1 ξ .
Ên−1 −∞
Da ∂n u stetig ist, gilt
s
u(ξ, s) = u(ξ, 0) + ∂n u(ξ, σ) dσ .
0
Wegen der Integrierbarkeit von σ → ∂n u(ξ, σ) existieren daher die Grenzwer-

te lim u(ξ, s) , und da auch s → |u(ξ, s)| integrierbar ist, müssen diese Grenz-
s→±∞
) 289
werte verschwinden, vgl. Bd. 1, § 12 : 5.2, 5.3. Somit ergibt partielle Integration

+∞
+∞
e−ist ∂n u(ξ, s) ds = it e−ist u(ξ, s) ds .
−∞ −∞
Aus (1) folgt durch sukzessive Integration

+∞
(2) ;
P −
n u(y) = (2π) 2 t
n
e−i ξ,η
e−ist u(ξ, s) ds dξ
Ên−1 −∞
/(y) = yn u
= tu /(y) = (Qn u
/)(y) .
Entsprechend ergibt sich P ; / für k = 1, . . . , n − 1, und nach 2.1 sind

k u = Qk u
; ;
/, P1 u, . . . , Pn u beschränkte Funktionen. Nach (2) gibt es also ein c1 ≥ 0 mit
u
/(y)| ≤ (1 + (|y1 | + . . . + |yn |)) |u

(1 + y)| u /(y)| ≤ c1 für alle y ∈ Ên
.
Unter den Voraussetzungen u ∈ C2 ∩ L1 , Pk u ∈ L1 , Pk Pl u ∈ L1 für 1 ≤ k, l ≤ n

folgt nach dem Vorangehenden ( mit F : u → u /)
/,
F (Pk Pl u) = F (Pk (Pl u)) = Qk F (Pl u) = Qk Ql u
;
außerdem die Beschränktheit von (1 + y)|P /(y)|. Wie
k u(y)| = (1 + y) |yk | |u
/(y)| , also
oben folgt daraus die Beschränktheit von (1 + y)2 |u
/(y)| ≤ (1 + y)2 |u
(1 + y2 )|u /(y)| ≤ c2
mit einer geeigneten Konstanten c2 . Es ist nun zu erkennen, wie sich die Be-
hauptung (i) des Satzes durch Induktion nach m ergibt.
(ii) Sei m = 1. Nach Voraussetzung ist x → xk u(x) integrierbar, und es gilt
−i x , y
e xk u(x) = | xk | · | u(x) | .
Nach dem Satz über Parameterintegrale folgt

n
/(y) = (2π)− 2
/)(y) = ∂k u
(iPk u ;
−i xk e−i x , y u(x) dn x = −i Q k u(y),
somit Pk u ;
/ = −Q k u.
Der Beweis des Satzteils (ii) durch Induktion nach m folgt diesem Muster ÜA .
2
(e) Riemann–Lebesgue–Lemma. Für u ∈ L1 gilt /(y) = 0.

lim u
y→∞
Beweis.
Sei ε> 0 vorgegeben. Nach § 10 : 3.3 gibt es eine Testfunktion v ∈ C∞
−n/2
c (
n
) Ê
mit /(y) − /
| u(x) − v(x)| d x < ε, also |u
n
v (y)| < ε (2π) < ε für alle
Ê
y ∈ n. Nach (b) gibt es eine Konstante c ≥ 0 mit |/ v (y)| ≤ c (1 + y)−1 . Für
y ≥ c/ε folgt
/(y)| ≤ |u
|u /(y) − /
v (y)| + |/
v (y)| < ε + ε = 2ε . 2
2.3 Rechenregeln für die Fouriertransformation auf L1 ( Ê)

n
/ · v, u · /
(a) Wälzformel. Für u, v ∈ L1 gilt u v ∈ L1 und

/·v =
u u·/
v.
(b) Produktformel. Für u ∈ L1 ( Ê ), p

v ∈ L1 ( Ê ) und n = p + q
q
ist durch
w(x1 , . . . , xn ) := u(x1 , . . . , xp ) · v(xp+1 , . . . , xn )
eine Funktion w ∈ L1 ( Ê ) gegeben mit
n
/ 1 , . . . , yn ) = u
w(y /(y1 , . . . , yp ) · /
v (yp+1 , . . . , yn ) .
Skalierungsregeln für L1 –Funktionen u :

/a (y) = e−i a , y u
(c) Für ua (x) := u(x − a ) gilt u /(y).
(d) Für v(x) := ei a , x u(x) gilt / /(y − a).
v (y) = u
/
(e) Für w(x) := u( r1 x) mit r > 0 gilt w(y) /(r y).
= rn u
Dem Beweis schicken wir ein im folgenden mehrfach verwendetes Lemma voraus:
2.4 Lemma. (a) Sei f (x, y) stetig auf Ê × Ê , und es gelte
p q
|f (x, y)| ≤ |u(x)| · |v(y)|
mit stetigen Funktionen u ∈ L1 ( Ê ), v ∈ L (Ê ). Dann ist f über den Ê

p 1 q p+q
integrierbar, und es gilt

f (x, y) dp x dq y = f (x, y) dq y dp x
Êp+q Êp Êq
= f (x, y) dp x dq y .
Êq Êp
(b) Entsprechendes gilt, wenn wir stetig“ durch messbar“ ersetzen und die
” ”
Integrale im Lebesgueschen Sinn verstehen.
(a) ergibt sich nach den Kriterien in Bd. 1, § 23 : 6.1, 6.2, 6.3. (b) ist eine unmit-
telbare Folge des Satzes von Tonelli § 8 : 1.8.
) 291
Beweis von 2.3

/, /
(a) Da u
v nach 2.1 beschränkt und stetig sind, gilt u / · v, u · /
v ∈ L1 nach dem
Majorantensatz. Wegen v(x)u(y) e−i x , y ≤ | v(x) | · | u(y) | folgt nach 2.4

(2π)n/2 /·v =
u v(x) u(y) e−i x , y dn y dn x

= u(y) v(x) e−i y , x dn x dn y = (2π)n/2 u·/
v.
(b) folgt unmittelbar aus 2.4 ÜA .

(c), (d), (e) ergeben sich aus dem Transformationssatz für Integrale ÜA . 2
2.5 Die Fouriertransformation der Gauß–Dichte

1 2
Satz. (a) Für u(x) := e− 2 x / = u.
gilt u
2 2
(b) Für u(x) := e−t x /(y) = (2t)−n/2 e−y
mit t > 0 gilt u /4t
.
Beweis.
(a) Wegen der Produktformel 2.3 (b) muss (a) nur für n = 1 gezeigt werden.
1 2
Die Gauß–Dichte u(x) = e− 2 x genügt dem AWP
(∗) u (x) = −xu(x), u(0) = 1.
Mit Hilfe des P ,Q–Gesetzes folgt hieraus

+∞
/ = iP u
u : = − P:u = − Q u
/ = − i Qu /, /(0) =
u √1
1 2
e− 2 y dy = 1,
2π
−∞
/ dem gleichen AWP (∗) und

Letzteres nach (Bd. 1, § 23 : 8.4). Somit genügt u
ist deshalb nach dem Eindeutigkeitssatz mit u identisch.
1
(b) ergibt sich aus (a) mittels der Skalierungsregel 2.3 (e) mit r = (2t)− 2 . 2

Aufgaben (i) (Verallgemeinerung von (b)). Sei u(x) := exp − 12 x , Ax mit
einer reellen, symmetrischen, positiv definiten n × n–Matrix A. Zeigen Sie mit
Hilfe der Hauptachsentransformation, dass
1
/(y) = (det A)− 2 exp − 12 y , A−1 y
u .
(ii) Zeigen Sie für invertierbare lineare Abbildungen A : x → Ax und für

u ∈ L1 , dass
(u ◦ A−1 ) / = | det A|−1 u

/ ◦ (AT )−1 .
2.6 Umkehrsatz, Faltungssätze für die Fouriertransformation auf L1

(a) Umkehrsatz. Aus u ∈ L1 = L1 ( Ê ) und
n
/ ∈ L1 folgen die Stetigkeit von
u
u und

u(x) = (2π)−n/2 /(y) dn y = /
ei x , y u /(−x) für alle x ∈
u Ên
.
1
Daher ist die Fouriertransformation auf L injektiv :
/ = 0 =⇒ u = 0 .
u ∈ L1 , u
/ ∈ L1 , vgl. 2.1 (i).

Beachten Sie: Aus u ∈ L1 folgt nicht u
/, /
(b) Faltungssatz 1. Unter den Voraussetzungen u, v, u v ∈ L1 gilt u · v ∈ L1
und
/∗/
u v = (2π)n/2 u;
·v.
(c) Faltungssatz 2. Für u, v ∈ L1 gilt u ∗ v ∈ L1 und
u; /·/
∗ v = (2π)n/2 u v.
Die Beweise folgen in 3.4 und 3.5. Der Beweis des zweiten Faltungssatzes stützt
sich auf die Lebesguesche Integrationstheorie.
3 Die Fouriertransformation auf S ( Ê) n
3.1 Schnellfallende Funktionen

Die Fouriertransformation bildet keinen der Räume L1 ( n), C∞ c (
n
Ê Ê
) in sich ab,
wie das Beispiel 2.1 (i) und der Zusatz in 2.2 zeigen. Wir suchen einen Teilraum
Ê
von L1 ( n), der durch die Fouriertransformation und die Operatoren Pk , Qk
in sich überführt wird. In einem solchen Raum ist dann das P ,Q–Gesetz 2.2
beliebig oft anwendbar; die zugehörigen Funktionen müssen deshalb beliebig
oft differenzierbar sein und im Unendlichen rasch abfallen.
Diese Eigenschaft besitzt der von Laurent Schwartz 1948 eingeführte Funktio-
nenraum
S = S( Ê ) := u ∈ C (Ê ) | x ∂ u(x) ist beschränkt für jedes Paar α, β
n ∞ n α β

= u ∈ C (Ê ) | (1 + x ) ∂ u(x) ist beschränkt für jedes
∞ n m β
m ∈ Æ und jeden Multiindex β .
ÜA : Weisen Sie die Gleichheit der beiden Räume nach.

S heißt Schwartz–Raum oder Raum der schnellfallenden Funktionen.
Offenbar gilt
C∞
c ( Ê
n
) ⊂ S( Ên
).
3 Die Fouriertransformation auf S ( Ê n
) 293
Beispiele schnellfallender Funktionen sind für n = 1

2 2 2
e−x , e−x sin x , e−x p(x) mit einem Polynom p .
Weitere schnellfallende Funktionen ergeben sich mit den folgenden Rechenre-

geln.
3.2 Eigenschaften von S ( Ê)

n
(a) S = S ( Ê ) ist ein Teilraum von

n
Lp ( Ên
) für 1 ≤ p ≤ ∞.
(b) u ∈ S =⇒ P u, Q u ∈ S für jeden Multiindex α.
α α
(c) u, v ∈ S =⇒ u ∗ v ∈ S .
(d) Ist u schnellfallend und v eine C∞ –Funktion, deren sämtliche Ableitungen
∂ α v polynomial beschränkt sind, so gilt u · v ∈ S . Insbesondere gilt u · v ∈ S
für u, v ∈ S .
Dabei heißt eine Funktion v : Ê n
→ polynomial beschränkt, wenn
v(x) ≤ c (1 + xm ) für ein m = 0, 1, . . . und eine Konstante c ≥ 0 .
Beweis.
(a) Die Vektorraumeigenschaft folgt unmittelbar aus der Definition.
Sei u ∈ S . Nach 3.1 gilt (1 + x2n ) |u(x)| ≤ c mit einer Konstanten c. Es
folgt |u(x)|p ≤ cp /((1 + x21 ) · · · (1 + x2n )) für alle x ∈ n und beliebiges p ≥ 1.
Daraus ergibt sich die Integrierbarkeit von |u|p durch wiederholte Anwendung
des Lemmas 2.4.
(b) Es genügt zu zeigen: u ∈ S =⇒ Pk u, Qk u ∈ S .
Für u ∈ S gilt Pk u ∈ C∞ (n ) und (mit den Bezeichnungen 2.2) Qα ∂ β Pk u =
Qα ∂ γ u mit γ = β + ek . Damit ist Qα ∂ β Pk u beschränkt für alle Paare von Mul-
tiindizes (α, β). Ferner gilt Qk u ∈ C∞ (n ) nach der allgemeinen Produktregel
§ 10: 2.2 (c). Durch mehrfache Anwendung der Vertauschungsrelationen 2.2 (a),
Pl Qk − Qk Pl = − i δkl S ,
läßt sich Qα ∂ β Qk u = (−i)|β| Qα P β Qk u mittels Durchtauschen von Qk auf eine

Linearkombination von Funktionen des Typs Qγ P δ u zurückführen und ist also
beschränkt.
(c) Wegen ∂ β v ∈ S gibt es zu jedem Multiindex β eine Konstante cβ mit

u(y) ∂ β v(x − y) ≤ cβ | u(y) | .
Daraus folgt mit dem Satz über Parameterintegrale u∗v ∈ C∞ (n ), ∂ β (u∗v) =
u ∗ ∂ β v und |∂ β (u ∗ v)| ≤ cβ u1 für alle Multiindizes β. Weiter gilt ÜA
Qk ∂ β (u ∗ v) = Qk (u ∗ ∂ β v) = (Qk u) ∗ ∂ β v + u ∗ (Qk ∂ β v) .
Jeder der Summanden auf der rechten Seite ist als Faltungsintegral zweier
schnellfallender Funktionen beschränkt. Durch wiederholte Anwendung dieses
Arguments folgt die Beschränktheit von Qα ∂ β (u ∗ v) für beliebige Multiindizes
α, β.
(d) ergibt sich aus der allgemeinen Produktregel § 10 : 2.2 (c) ÜA . 2
3.3 Die Fouriertransformation auf S

/ ∈ S.
(a) Satz. (a) Für u ∈ S gilt u
(b) Für u ∈ S gilt das P ,Q–Gesetz uneingeschränkt:
P; /,
α u = Qα u ;
Q α u = (−1)|α| P α u
/ für alle Multiindizes α.
;
(c) Insbesondere gilt Pk u = Qk u ;
/, Q k u = −Pk u :
/ und Δu(y) /(y) ,
= −y2 u
vgl. 2.2 .
Beweis.
(a) Seien u ∈ S und β ein beliebiger Multiindex. Nach 3.2 (b) gilt Qβ u ∈ S ,
und aus dem P ,Q–Gesetz 2.2 (b) folgt daher
(∗) / ∈ C|β| (
u Ên
) sowie P βu ;
/ = (−1)|β| Q βu .
Da nach 3.2 (b) auch P α Qβ u schnellfallend ist, folgt P α Qβ u ∈ L1 für beliebige

Multiindizes α, und wir erhalten aus (∗) und dem P ,Q–Gesetz 2.2 (b):
/ ist die Fouriertransformierte von (−1)|β| P α Qβ u

Qα P β u
und ist daher beschränkt.

(b) folgt unmittelbar aus (a). 2
3.4 Der Umkehrsatz für die Fouriertransformation auf S und L1

(a) Der Umkehrsatz für die Fouriertransformation auf S .
Die Fouriertransformation bildet S bijektiv auf S ab. Die Umkehrabbildung
ordnet jeder Funktion v ∈ S die durch
u(x) = /
v (−x)
gegebene Funktion u ∈ S zu. Insbesondere gilt die Umkehrformel u(x) = /

/(−x),
u
d.h.

u(x) = (2π)−n/2 ei x , y u
/(y) dn y für alle x ∈ Ên
.
) 295
Bemerkungen. (i) Der Umkehrsatz wird oft so formuliert: Jede schnellfallende

(nach 2.6 (a) sogar jede integrierbare) Funktion läßt sich durch ein Fourierin-
tegral darstellen.
In der Sprache der Wellenmechanik heißt das: Jedes Wellenpaket u ∈ S
kann als Überlagerung ebener Wellen x → ei x , y aufgefaßt werden, wobei
/(y) die Amplitude der Welle mit dem Wellenzahlvektor y ∈ n ist.
( 2π)−n/2 u Ê
(ii) Wir bezeichnen die auf S eingeschränkte Fouriertransformation wieder
mit F und beschreiben die Punktspiegelung im Argument durch den Operator
S:S →S, (Su)(x) := u(−x) .
Mittels Substitution y → −y erhalten wir SF = F S ÜA , und der Umkehrsatz

erhält die Form
F −1 = F S = SF bzw. F 2 S = SF 2 = F SF = ½S .
Beweis.
1 2 1 −2 2
Wir setzen v(x) = e− 2 x und vr (x) = v(x/r) = e− 2 r x mit r > 0.
Für r → ∞ strebt vr monoton aufsteigend gegen 1. Der Grundgedanke des
Beweises besteht darin, das rechts in der Umkehrformel stehende Integral durch
die Integrale

(2π)−n/2 ei x , y u
/(y) vr (y) dn y für r 1
/∈S
zu approximieren. Hierbei beachten wir, dass für u ∈ S nach 3.3 (a) u
/ ∈ L1 , u ∈ L∞ nach 3.2 (a).
gilt und somit u
Aus den Skalierungsregeln 2.3 (c),(d), der Wälzformel 2.3 (a) ergibt sich unter
Verwendung der Substitution η = r y mit ux (y) := u(y − x)

ei x , y u
/(y) vr (y) dn y = u; n
−x (y) vr (y) d y = u−x (y) v/r (y) dn y

= u−x (y) r n /
v (r y) dn y = u−x (η/r) /
v(η) dn η

= u−x (η/r) v(η) dn η ,
Letzteres nach 2.5 (a). Setzen wir r = 1/s2 , so erhalten wir mit dem ersten
und dem letzten Integral jeweils auch für s = 0 definierte Parameterintegrale.
Nach Bd. 1, § 23 : 5.1 hängen beide stetig von s ab, denn der Integrand im ersten
Integral besitzt die von s unabhängige Majorante |u /| ∈ L1 , der im letzten
Integral besitzt die Majorante u∞ · |v| ∈ L . Somit erhalten wir für s → 0
1

ei x , y u
/(y) dn y = u−x (0) v(η) dn η = u(x) v(η) dn η = (2π)n/2 u(x)
für jedes x ∈ Ên , was die Umkehrformel für u ∈ S darstellt. 2

(b) Beweis des Umkehrsatzes auf L1 .

/ ∈ L1 und u0 (x) := (2π)−n/2 ei x , y u
Seien u, u /(y) dn y. Für jede Testfunk-
∞
Ê
tion ϕ ∈ Cc ( ) ⊂ S gibt es nach (a) ein v ∈ S mit /
n
v = ϕ , für welches
dann die Umkehrformel gilt. Mit der Wälzformel 2.3 (a), der Umkehrformel in
(a) und dem Satz von Tonelli § 8 : 1.8 folgt

(2π)n/2 u(y) /
v(y) dn y = (2π)n/2 /(y) v(y) dn y
u

= /(y) (
u ei x , y /
v (x) dn x ) dn y

= v (x) ( ei x , y u
/ /(y) dn y ) dn x

= (2π)n/2 / v (x) u0 (x) dn x .
Damit haben wir

(u − u0 ) ϕ dn x = (u − u0 ) /
v dn x = u/
v dn x − u0 /
v dn x = 0 .
Nach dem Fundamentallemma § 10 : 4.2 folgt hieraus u−u0 = 0 f.ü., also können
wir u mit der nach 2.1 stetigen Funktion u0 gleichsetzen. 2
3.5 Die Faltungssätze für S ( Ê ) und L (Ê )

n 1 n
(a) Die Faltungssätze für schnellfallende Funktionen.

Für u, v ∈ S gilt u ∗ v ∈ S und
/∗/
u v = (2π)n/2 u;
·v, u; /·/
∗ v = (2π)n/2 u v.
Beweis.
(1) Für u, v ∈ S gilt u ∗ v ∈ S nach 3.2 (c). Durch Anwendung des Umkehr-
satzes 3.4 (a)ergibt sich

/∗/
(u v )(x) = /(y) /
u v (x − y) dn y

= (2π)−n/2 /(y)
u v(z) e−i x−y , z dn z dn y

= (2π)−n/2 v(z) e−i x , z u
/(y) ei y , z dn y dn z

= (2π)−n/2 v(z) e−i x , z /(y) ei y , z dn y dn z
u

= u(z) v(z) e−i x , z dn z
= (2π)n/2 u;
· v(x) .
Die Vertauschung der Integrationsreihenfolge ist nach 2.4 erlaubt, da der Inte-
/(y)| · |v(z)| besitzt.
grand die Majorante |u
(2) Für u, v ∈ S gibt es, wieder nach dem Umkehrsatz, Funktionen f, g ∈ S
mit u = f/, v = / / , g = S/
g , also f = S u v . Nach (a) folgt unter Beachtung von
F 2 = S und S 2 = ½S
) 297
∗ v = (2π)−n/2 F (f/ ∗ /
(2π)−n/2 u; g ) = F 2 (f · g) = S(f · g)
/·/
= Sf · Sg = u v. 2
(b) Beweis des Faltungssatzes 2.6 (b).

Sind u, v und u / integrierbar, so existiert das Faltungsintegral u /∗/ v , da /
v be-
schränkt ist, vgl. 2.1 und § 10: 2.1 (b). Da im Falle u, u / ∈ L1 der Umkehrsatz
2.6 (a) für u gilt, läßt sich der Beweisteil (a) ohne weiteres übertragen, und wir
erhalten: u, v, u/ ∈ L1 =⇒ u /∗/v = (2π)n/2 u; · v.
(c) Beweis des Faltungssatzes 2.6 (c).
Zum Beweis der Formel u; ∗ v = (2π)n/2 u /·/v für L1 –Funktionen u, v müssen wir
die Lebesguesche Integrationstheorie heranziehen. Die Konvergenz der nachfol-
genden Integrale und die Vertauschbarkeit der Integrationsreihenfolge stützen
sich auf den Satz von Tonelli § 8 : 1.8: Seien u, v Lebesgue–integrierbar und für
Ê
festes x ∈ n sei
f (y, z) := c(x, y, z) u(y) v(z − y)
mit einer stetigen Funktion c vom Betrag 1. Dann existiert das Integral

|c(x, y, z) f (y, z)| dn z = |u(y)| · |v(z − y)| dn z = |u(y)| · v1
und ist als Funktion von y über den Ê n

integrierbar. Damit ist f über Ê2n
integrierbar, und es gilt

f (y, z) dn y dn z = f (y, z) dn z dn y .
Mit c(x, y, z) = 1 folgt die Existenz von (u ∗ v)(x) f.ü. und u ∗ v ∈ L1 . Setzen
wir c(x, y, z) = exp(−i x , y ) exp(−i x , y − z ), so ergibt sich

(2π)n/2 u;
∗ v(x) = u(y) v(z − y) dn y e−i x , z dn z

= u(y) e−i x , y v(z − y) e−i x , z−y dn y dn z

= u(y) e−i x , y v(z − y) e−i x , z−y dn z dn y .
Durch Substitution z − y → z im zweiten Integral erhalten wir

(2π)n/2 u;
∗ v(x) = u(y) e−i x , y v(z) e−i x , z dn z dn y
/(x) /
= (2π) u n
v(x) . 2
4 Die Fouriertransformation auf L2 ( Ê) n
4.1 Die Fouriertransformation als unitärer Operator auf S ( Ê)n
Die Fouriertransformation vermittelt eine unitäre Abbildung des mit dem L2 –

Skalarprodukt u , v = u v versehenen Schwartzraums S := S ( ) auf n
Ê
sich.
Für u, v ∈ S gilt die Formel von Parseval–Plancherel
u, v /, /
= u v ,
insbesondere ist

|u(x)|2 dn x = /(y)|2 dn y .
|u
Beweis.
Für u, v ∈ S sei g := u/ . Nach 3.4 (b) gilt g = S /
u, also /
g=u ÜA . Mit Hilfe
der Wälzformel 2.3 (a) folgt hieraus

u, v = uv = /
gv = g/
v= //
u /, /
v = u v . 2
4.2 Die Fouriertransformation auf L2 ( Ê)

n
Satz. Die Fouriertransformation F : S → S läßt sich auf eindeutig bestimmte

Weise zu einer unitären Abbildung
F : L2 ( Ê n
) → L2 ( Ê)
n
fortsetzen. Für die Umkehrabbildung von F gilt

F −1 = SF = FS ,
wobei S : L2 ( Ê n
) → L2 ( Ê ) die Punktspiegelung (Su)(x) := u(−x) bedeutet.
n
Beweis.
S ist ein dichter Teilraum von L2 , denn es gilt C∞ c ⊂ S ⊂ L2 , und C∞ c
liegt dicht in L (§ 10 : 3.3). Die Fouriertransformation F : S → S
2
und ihre
Inverse F −1 sind bezüglich des L2 –Skalarproduktes Isometrien auf S . Nach
§ 10 : 5.1 (b) besitzen F und F −1 eindeutig bestimmte Fortsetzungen F und G
auf L2 . Beide sind stetige lineare Operatoren auf L2 und es gilt
Fu = lim F uk , Gu = lim F −1 uk , falls u = lim uk mit uk ∈ S .
k→∞ k→∞ k→∞
Da auch S eine unitäre Abbildung auf L2 ist, ergibt sich für jedes u ∈ L2 durch
Grenzübergang
G Fu = F G u = u , SF u = F Su = G u , SF 2 u = u ,
F u = u = G u .
Dies zeigt, dass F invertierbar und isometrisch ist und dass G = F −1 = S 2 F.
2
5 Anwendungen 299
Bemerkung. Es gibt L2 –Funktionen u, die keine L1 –Funktionen sind, z.B.

u(x) = (1 + xn )−1 , vgl. § 11 : 2.4, Folgerung (i). Für solche läßt sich (Fu)(y)
nicht durch das Integral (2π)−n/2 e−i x , y u(x) dn x darstellen.
Setzen wir aber

vr (y) := (2π)−n/2 e−i x , y u(x) dn x ,
x≤r
so gilt
Fu = L2 –lim vrk für jede Radienfolge rk → ∞ ,
k→∞
Fu = lim vsk f.ü. für eine geeignete Radienfolge sk → ∞ .
k→∞
Denn es gilt vr = Fur mit ur := u χKr (0) . Da u als L2 –Funktion lokalinte-

grierbar ist (§ 8 : 2.5 (c)), und da |u|2 eine integrierbare Majorante für |ur |2 ist,
gilt ur ∈ L1 ∩ L2 und u − urk 2 → 0 nach dem Satz über die majorisierte
Konvergenz § 8 : 2.1 (d) (ii), somit wegen der Isometrieeigenschaft von F
Fu − vrk 2 = Fu − Furk 2 = u − urk 2 → 0 .
Nach dem Satz von Fischer–Riesz § 8 : 2.1 gibt es dann eine Teilfolge (vsk ), die
punktweise f.ü. gegen Fu konvergiert.
5 Anwendungen
5.1 Die Differentialgleichung −(Δ + λ) u = f in S
Satz. Die Differentialgleichung
(∗) − (Δ + λ) u = f mit f ∈ S
besitzt für λ ∈ \ + genau eine Lösung u ∈ S . Für λ ≥ 0 ist (∗) nicht
universell lösbar, d.h. hat nicht für jedes f ∈ S eine Lösung u ∈ S .
Beweis.
Für u, f ∈ S ist die Gleichung (∗) nach dem P ,Q–Gesetz 3.3 (c) und nach dem
Umkehrsatz 3.4 (a) äquivalent zu

(∗∗) /(y) = f/(y) für alle y ∈
y2 − λ u n
.

Im Fall λ ∈ \ + ist g(y) := (y − λ)−1 eine beschränkte C∞ –Funktion,
2
somit gehört für gegebenes f ∈ S die Funktion h := g f/ zu S , vgl. 3.2 (e). Die
durch
u(y) = /
h(−y)
/ = h die
definierte Funktion u ist schnellfallend (3.2 (c)) und erfüllt wegen u
Gleichung (∗∗), also auch (∗).
Ê
Im Fall λ ∈ + wählen wir f (x) = e− 2 x . Nach 2.5 ist f/ = f , also hat
1 2
f/ keine Nullstellen. Somit kann (∗∗) nicht gelten, denn die linke Seite besitzt
Nullstellen. 2
Bemerkungen. (a) Im Falle λ ∈ \+ , also = dist (λ, + ) > 0 gilt für die
oben definierte Funktion h bezüglich der L2 –Norm h ≤ f/ = f . Wegen
der L2 – Isometrie der Fouriertransformation folgt u = S/ h = h ≤ f ,
also hängt die Lösung von (∗) im L2 –Sinn stetig von der rechten Seite ab.
(b) Für n = 1 und λ = −a2 mit a > 0 gilt für die Lösung u von (∗)
1 √ 1 −a|x|
/(y) =
(∗∗) u f/(y) = 2π f/(y) /
v(y) mit v(x) = e ,
a2 +y 2 2a
vgl. das Beispiel 2.1 (ii). Nach dem Faltungssatz 2.6 (c) für L1 –Funktionen gilt
√
2π f/ /
v = f;
∗ v, und wegen der Injektivität der Fouriertransformation folgt
+∞
1
u(x) = (f ∗ v)(x) = e−a|x−y| f (y) dy .
2a
−∞
5.2 Die Vollständigkeit der Hermite–Funktionen

(a) In § 4 : 3.3 wurde gezeigt, dass durch das Hermite–Polynom
2 dn −x2
Hn (x) = (−1)n ex e (n = 0, 1, . . . )
dxn
ein Polynom n–ter Ordnung mit höchstem Koeffizienten 2n gegeben ist, welches
die DG Hn (x) = 2xHn (x) − 2nHn (x) erfüllt. Ferner gilt die Rekursionsformel
Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) (n = 1, 2, . . .).
(b) Die Hermite–Funktionen h0 , h1 , h2 , . . . sind definiert durch
1 2 √
hn (x) := cn e− 2 x Hn (x) mit cn = ( π n! 2n )−1/2 .
Die Hermite–Funktionen sind nach 3.2 (d) schnellfallend und erfüllen die Her-
mitesche Differentialgleichung ÜA
−hn (x) + x2 hn (x) v = (2n + 1) hn (x) ,
welche beim Separationsansatz für die Schrödingergleichung des quantenmecha-

nischen harmonischen Oszillators anfällt (§ 24 : 3.4).
Aus der Definition der Hn folgt unmittelbar ÜA Hn (x) = 2x Hn (x)−Hn+1 (x);
daraus erhalten wir die Rekursionsformel ÜA
2(n + 1) hn+1 = x · hn − hn = Qhn − iP hn .

5 Anwendungen 301
Definitionsgemäß ist h0 (x) = π − 4 e− 2 x , also :

1 1 2
h0 = h0 nach 2.5 (a). Aus der
Rekursionsformel und dem P ,Q–Gesetz 3.3 (c) erhalten wir durch Induktion
ÜA :
Die Hermite–Funktionen sind Eigenfunktionen der Fouriertransformation:

:n = (−i)n hn .
h
(c) Satz. Die Hermite–Funktionen bilden ein vollständiges ONS für L2 ( ). Ê

Beweis.
2
(i) Die Orthogonalitätsrelation für die Hn . Mit (x) := e−x gilt Hn =
n −1 (n)
(−1) , also ergibt m–malige partielle Integration für n ≥ m

+∞ +∞ +∞ (m)
Hm Hn = (−1)n (n)
Hm = . . . = (−1)n−m (n−m)
Hm .
−∞ −∞ −∞
Für n > m ergibt eine weitere partielle Integration

+∞
+∞
(m+1)
Hm Hn = (−1)n−m−1 (n−m−1)
Hm = 0
−∞ −∞
wegen Grad Hm = m. Da Hn den höchsten Koeffizienten 2n besitzt, folgt für

m=n

+∞
+∞
+∞
2
e−x dx
(n)
Hn2 = Hn = n! 2n
−∞ −∞ −∞

+∞
−1 y2 √
= n! 2n √1
2
e 2 dy = π n! 2n .
−∞
(ii) Die hn bilden ein ONS , denn aus (i) folgt

+∞
+∞
+∞
hm hn = cm cn Hm Hn = c2n δmn Hn2 = δmn .
−∞ −∞ −∞
(iii) Die Vollständigkeit der Hermite–Funktionen. Wir verwenden das Kriterium

√
Ê
§ 9 : 4.4 (e). Sei f ∈ L2 ( ) orthogonal zu allen hn . Um f = 0 zu zeigen, setzen
√
wir g := f . Wegen f ∈ L2 und ∈ L2 gilt g ∈ L1 . Wenn /g = 0 nach-
gewiesen ist, folgt g = 0 wegen der Injektivität der Fouriertransformation auf
L1 2.6 (a), also auch f = 0.
Zum Nachweis von /
g = 0 beachten wir, dass nach Voraussetzung

+∞
1 +∞
g Hn = f hn = 0 für n = 0, 1, 2, . . . .
−∞
cn −∞
Wegen Grad (Hn ) = n ist jedes Polynom eine Linearkombination geeigneter

Hn , daher folgt

+∞
g(y) p(y) dy = 0 für jedes Polynom p.
−∞
Insbesondere ergibt sich für festes x ∈ Ê

+∞
n
(−ixy)k
g(y) sn (x, y) dy = 0 mit sn (x, y) := .
−∞ k=0 k!
Die Funktion h(x) := exp(− 41 x2 ) | f (x) | gehört zu L1 , und es gilt

n
|xy|k
|g(y) sn (x, y)| ≤ | g(y )| ≤ exp |xy| − 14 y 2 h(y ) ≤ c(x) h(y)
k=0 k!
mit einer nur von x abhängigen Konstanten c(x). Mit Hilfe des Satzes von Le-
besgue (§ 8 : 1.6 (a)) erhalten wir schließlich
√
+∞
+∞
2π /
g (x) = lim g(y) sn (x, y) dy = lim g(y) sn (x, y) dy = 0 .
n→∞ n→∞
−∞ −∞
2
(d) Folgerung. Der Vektorraum

Ê→
+∞
2
H = u: | u messbar und e−x |u(x)|2 dx < ∞ ,
−∞
versehen mit dem gewichteten Skalarprodukt

+∞
2
u, v = e−x u(x) v(x) dx
−∞
ist ein Hilbertraum, und die normierten Hermite–Polynome cn Hn (n ∈ 0 )

bilden ein vollständiges ONS für H .
Beweis.
√
u ∈ L2 (). Ferner ist (un )
2
Sei wieder (x) := e−x . Dann gilt u ∈ H ⇐⇒
√
genau dann eine Cauchy–Folge in H , wenn die fn := un eine Cauchy–Folge
1
in L2 bilden. Für deren L2 –Limes f und u := ( )− 2 f gilt

+∞ +∞
| u − un |2 = | f − fn |2 → 0 .
−∞ −∞
Also ist H vollständig. Ist u ∈ H orthogonal zu allen Hn , so ist die Funktion

√
f := g ∈ L2 orthogonal zu allen hn , also f = 0 und somit auch g = 0. 2
303
§ 13 Schwache Lösungen und Distributionen

Vorkenntnisse: § 10 : 1–4, Greensche–Identitäten § 11 : 4, Lebesgue–Theorie § 8
(für Abschnitt 5), Fouriertransformation auf S § 12 : 3 (für Abschnitt 6).
1 Schwache Lösungen von Differentialgleichungen

1.1 Gründe für eine Erweiterung des Lösungsbegriffs
Ziel dieses Abschnitts ist, einen erweiterten Lösungsbegriffs für Differentialglei-
chungen festzulegen, durch welchen auch Funktionen Lösungen genannt werden
können, die nicht die volle, von der Differentialgleichung geforderte Differen-
zierbarkeitsstufe besitzen, z.B. Funktionen, deren Ableitungen Unstetigkeitstel-
len aufweisen. Dass eine solche Erweiterung wünschenswert ist, wurde schon in
Kap. III an mehreren Stellen deutlich:
– Die Wellengleichung ∂ 2 u/∂t2 = c2 ∂ 2 u/∂x2 in ]0, L[ × Ê besitzt bei gege-
bener Anfangsauslenkung f (x) = u(x, 0) nur dann eine C2 –differenzierbare
Lösung u, wenn f neben der Einspannbedingung f (0) = f (L) = 0 noch die
weitere Bedingung f (0) = f (L) = 0 erfüllt. Diese Feststellung machte schon
d’Alembert, der daher seiner Lösungsformel § 6 : 3.4 die Anwendbarkeit auf
allgemeinere Situationen, wie etwa bei einer Anfangsgestalt der Saite mit ei-
nem Knick, absprach. Euler hielt dem entgegen, dass auch in einem solchen
Fall das Verhalten der Saite beschrieben werden müsse und dass eben die
d’Alembertsche Formel dies leiste. Um dem Rechnung zu tragen und die durch
die d’Alembertsche Formel gegebene Funktion u eine Lösung des Schwingungs-
problems zu nennen, muss der Begriff der Lösung der Wellengleichung weiter
gefasst werden.
– Die Lösungsformel § 6 : 3.7 (∗∗) für die inhomogene Wellengleichung liefert nur
unter restriktiven Bedingungen an die äußere Kraft eine C2 –Lösung des Saiten-
problems. Schon für das dort gestellte Problem der schweren Saite (Aufgabe
(b)) ist die genannte Formel nicht anwendbar.
– Beim Verkehrsflussproblem § 7 : 1.7 zeigte sich, dass differenzierbare Lösungen
in den meisten Fällen nur für ein beschränktes maximales Zeitintervall [0, t∗ [ exi-
stieren und dass diese für t → t∗ in Funktionen mit Singularitäten übergehen.
Unstetigkeitsphänomene treten auch bei den Gleichungen der Strömungsmecha-
nik auf (Turbulenz, Schockwellen).
1.2 Der Begriff der schwachen Lösung

Gegeben sei ein linearer Differentialoperator m–ter Ordnung auf dem Ê n
,
α
L = aα ∂
|α|≤m
mit konstanten Koeffizienten aα ∈ Ê und n–dimensionalen Multiindizes α .

304 § 13 Schwache Lösungen und Distributionen
Ê
Eine Funktion u ∈ L1loc (Ω) ( Ω ⊂ n ein Gebiet) heißt eine schwache Lösung
von Lu = f , wenn f ∈ L1loc (Ω) gilt und

u L∗ ϕ dn x = f ϕ dn x für alle Testfunktionen ϕ ∈ C∞
c (Ω) .
Ω Ω
Dabei ist

L∗ = (−1)|α| aα ∂ α
|α|≤m
der zu L formal adjungierte Differentialoperator, vgl. § 11 : 4.2.

Eine Lösung u ∈ Cm (Ω) von Lu = f mit f ∈ C0 (Ω) nennen wir im Unter-
schied hierzu eine klassische Lösung.
Satz. Jede klassische Lösung von Lu = f mit f ∈ C0 (Ω) ist auch eine
schwache. Eine schwache Lösung ist eine klassische Lösung, wenn sie Cm –
differenzierbar ist.
Denn für u ∈ Cm (Ω), f ∈ C0 (Ω) ergibt sich mit den Greenschen Identitäten
§ 11 : 4.2 (b) und (c)

(Lu − f ) ϕ = u L∗ ϕ − fϕ für alle ϕ ∈ C∞
c (Ω) .
Ω Ω Ω
Die Behauptung folgt mit Hilfe des Lemmas von Du Bois–Reymond § 10 : 4.2.
Bemerkungen. Schwache Lösungen sind in zweierlei Hinsicht von Interesse:

(i) Zum einen können sie zur Beschreibung physikalischer Vorgänge in Fällen
wie den oben erwähnten dienen, in denen keine klassische Lösung existiert. Dies
tritt z.B. dann ein, wenn der Problemstellung ein Variationsprinzip zugrunde-
liegt, das schon in der Formulierung nicht die volle Differenzierbarkeit verlangt.
(ii) Zum anderen ist das Aufsuchen einer schwachen Lösung häufig ein Zwi-
schenschritt zur Gewinnung einer klassischen Lösung: Es wird zunächst eine
schwache Lösung konstruiert, entweder mit Hilfe von Potentialen (vgl. 5.3) oder
durch Anwendung von Variationsmethoden, vgl. 6.3. In einem zweiten Schritt
wird dann gezeigt, dass diese die gewünschten Differenzierbarkeitseigenschaften
hat.
1.3 Schwache Lösungen der eindimensionalen Wellengleichung

Satz. Die d’Alembertsche Formel 3.4 u(x, t) = 21 (f (x + ct) + f (x − ct)) liefert
Ê
für jedes f ∈ C0 ( ) eine schwache Lösung der Wellengleichung
Ê
2
∂ u ∂2u
2
= c2 in 2
∂t ∂x2
∂u
mit u(x, 0) = f (x) und ∂t
(x, 0) = 0 in allen Differenzierbarkeitsstellen von f .
1 Schwache Lösungen von Differentialgleichungen 305
Beweis.
O.B.d.A. setzen wir c = 1. Sei ϕ ∈ C∞ Ê
c ( ) gegeben und r > 0 so gewählt, dass
supp ϕ ⊂ Q := ] − r, r [2 . Wir führen charakteristische Koordinaten ein durch
die Transformation h : 2 → 2 mit Ê Ê
x + t
1 ξ+η
h(ξ, η) = , h−1 (x, t) = .
2 ξ−η x−t
Es gilt | det dh(ξ, η)| = 12 , und h−1 (Q) ⊂ 2Q :=] − 2r, 2r [2 ist ein auf der
Spitze stehendes Quadrat. Für ψ := ϕ◦h gilt ψ ∈ C∞ c (
2
) und supp ψ ⊂ 2Q , Ê
denn aus ψ(ξ, η) = 0 folgt h(ξ, η) ∈ Q , also (ξ, η) ∈ 2Q. Ferner gilt ÜA
1 ∂2ϕ ∂2ϕ
∂ξ ∂η ψ = (Lϕ) ◦ h mit Lϕ = 2
− .
4 ∂x ∂t2
Nach dem Transformationssatz für Integrale folgt

u L∗ ϕ dx dt = u Lϕ dx dt = (f (ξ) + f (η)) ∂ξ ∂η ψ(ξ, η) dξ dη
Ê2 Ê2 2Q
2r 2r
= f (ξ) ∂η (∂ξ ψ(ξ, η)) dη dξ
−2r −2r
2r 2r
+ f (η) ∂ξ (∂η ψ(ξ, η)) dξ dη = 0
−2r −2r
wegen supp ψ ⊂ 2Q. Die Anfangsbedingungen sind leicht zu verifizieren. 2
1.4 Aufgabe
Zeigen Sie: Das Einschaltproblem für
den RL–Schwingkreis (Fig.) mit der R
DG
˙ R 1 U (t) I(t)
I(t) + I(t) = U (t)
L L
und (
U0 für t ≥ 0
U (t) := , L
0 für t < 0
hat die schwache Lösung

R
<
I0 1 − e− L t für t ≥ 0 U0
I(t) = mit I0 = .
0 für t < 0 R
2 Distributionen
2.1 Einführung
Wir beschränken uns hier auf die Grundkonzepte der Distributionentheorie.
Als weiterführende Werke nennen wir Schwartz [42], Wladimirow [56], Gel-
fand–Schilow [38] und Hörmander [63]. Distributionen verwenden wir in
erster Linie dazu, den Begriff der Grundlösung einer Differentialgleichung durch-
sichtig zu machen, schwache Ableitungen zu definieren und damit den Begriff
der schwachen Lösung einfacher formulieren zu können. Ferner soll mit ihrer
Hilfe die Fouriertransformation für Funktionen definiert werden, die nicht zu L1
oder L2 gehören, z.B. für Polynome.
Anlass für die Schaffung der Distributionentheorie gab eine Entwicklung in der
Analysis, die von Leibniz, Euler und Lagrange ausging und die zu den sym-
bolischen Methoden u.a. von Boole, Heaviside und Dirac führte, nämlich
die Auffassung der Analysis und ihrer Operationen Differentiation, Integrati-
on, Reihenbildung usw. als Kalkül nach dem Vorbild der Algebra. Dies war
zwar äußerst suggestiv, führte aber mangels begrifflicher Grundlagen bald zum
Meinungsstreit über die Berechtigung des Kalküls und auf Widersprüche.
Euler hatte keine Bedenken, physikalische Funktionen“, z.B. solche mit Knik-
”
ken, zu differenzieren oder mit divergenten Funktionenreihen zu rechnen. Dirac
führte 1926 für die Zwecke der Quantenmechanik eine uneigentliche“ Funktion
”
δ ein mit

+∞
ϕ(x) δ(x − a) dx = ϕ(a)
−∞
Ê
für alle Wellenfunktionen ϕ ∈ S und alle a ∈ . Eine Funktion δ mit dieser
Eigenschaft kann es nicht geben, denn für eine solche wäre

+∞
δ(x) dx = 1
−∞
(wie sich mit Hilfe der Testfunktionen ϕ = jε ∗ χ[−n,n] ergibt), andererseits

ergäbe sich δ(x) = 0 f.ü. durch Testen mit passenden Standardbuckeln.
Die um 1945 von Laurent Schwartz entwickelte Theorie der Distributionen gab
diesen Ansätzen eine solide mathematische Grundlage. Ihr Ausgangspunkt ist
die Beobachtung, dass eine lokalintegrable Funktion f : n → Ê ohne Verlust
an Information durch die Linearform

ϕ → c ( ) →
C∞ n
fϕ,
ersetzt werden kann (vgl.2.3). Es ist zum Beispiel unnötig, von der “δ–Funktion“
zu sprechen; es kommt nur auf die Linearform δa : ϕ → ϕ(a) an. Entsprechend

kann für einen linearen Differentialoperator L die Linearform ϕ → uL∗ϕ stell-
Ω
vertretend für ϕ → (Lu) ϕ herangezogen werden, wenn Lu nicht existiert.
Ω
2 Distributionen 307
2.2 Definition
Auf dem Raum D := C∞ c (
n
Ê
) der komplexwertigen Testfunktionen definieren
wir den folgenden Konvergenzbegriff.
D
ϕk −→ ϕ für k → ∞ soll heißen:
Es gibt eine kompakte Menge K ⊂ Ê n

mit supp ϕk ⊂ K für k = 1, 2, . . . , und
für jeden Multiindex α gilt
∂ α ϕk → ∂ α ϕ gleichmäßig für k → ∞.
Aufgrund dieser Definition ist ϕ → ∂ β ϕ ein stetiger Operator auf D :

D D
ϕk −→ ϕ =⇒ ∂ β ϕk −→ ∂ β ϕ für jeden Multiindex β.
Eine Distribution oder verallgemeinerte Funktion auf Ê n

ist eine stetige
Linearform U : D → , d.h. es gilt
(a) U (aϕ + b ψ) = aU ϕ + bU ψ für a, b ∈ , ϕ, ψ ∈ D ,
D
(b) ϕk −→ ϕ =⇒ U ϕk → U ϕ für k → ∞ .
Der Vektorraum der Distributionen wird mit D bezeichnet.
Beispiele. (i) Die Dirac–Distribution δa mit Pol a ist definiert durch
δa ϕ := ϕ(a) für alle ϕ ∈ D .
Die Linearität und die Stetigkeit von δa : D → sind offensichtlich. Statt

δ0 schreiben wir einfach δ.
(ii) Für a ∈ n und jeden Multiindex α ist
ϕ −→ ∂ αϕ(a)
aufgrund des Konvergenzbegriffs auf D ebenfalls eine Distribution.
2.3 Reguläre Distributionen

Satz. (a) Jeder lokalintegrierbaren Funktion u : n → wird durch

{u} ϕ := uϕ für alle ϕ ∈ D
eine Distribution {u} zugeordnet. Distributionen dieser Form heißen regulär.
(b) Aus {u} = {v} folgt u = v f.ü..

Die Aussage (b) besagt, dass bei der Uminterpretation von Funktionen zu Dis-
tributionen keine Information verloren geht. Das ergibt sich direkt aus dem
Fundamentallemma § 10 : 4.2, welches somit grundlegend für die Theorie der
Distributionen ist.
Beweis von (a)

D
Sei ϕk −→ ϕ für k → ∞. Nach 2.2 gibt es eine kompakte Kugel K ⊂ n mit Ê
supp ϕk ⊂ K für k = 1, 2, . . . ; ferner gilt ϕk → ϕ gleichmäßig auf K für k → ∞.
Es folgt

| {u} ϕ − {u} ϕk | = u (ϕ − ϕk ) ≤ ϕ − ϕk ∞ |u| → 0
K K
für k → ∞. Das bedeutet, dass die Linearform {u} : D → stetig ist. 2
Beispiele. (i) Für die charakteristische Funktion von + , Θ := χÊ+ ist

durch

+∞ ∞
{Θ} ϕ = Θ(x) ϕ(x) dx = ϕ(x) dx
−∞ 0
eine reguläre Distribution auf gegeben, genannt Heaviside–Distribution.

(ii) Für einen
linearen Differentialoperator L mit konstanten Koeffizienten lie-
fert ϕ → u L∗ ϕ für jede lokalintegrierbare Funktion u eine Distribution
Ω
∗ D
(L ist der zu L formal adjungierte Operator). Denn aus ϕk −→ ϕ folgt
D
L∗ ϕk −→ L∗ ϕ . Wie im Beweis (a) folgt u L∗ ϕk → u L∗ ϕ . Diese Distribu-
tion ist regulär und hat die Form {f }, wenn u eine schwache Lösung von Lu = f
ist, vgl. 1.2.
2.4 Singuläre Distributionen

Jede nicht reguläre Distribution wird singulär genannt.
Die Dirac–Distribution δa ist singulär .

Denn angenommen, es gilt δa = {u} mit einer lokalintegrierbaren Funktion
u : n → . Für jede Testfunktion ϕ ist dann auch ψ(x) = x − a2 ϕ(x)
eine Testfunktion, also gilt

0 = ψ(a) = δa ψ = {u} ψ = u(x) x − a2 ϕ(x) dn x .
Nach dem Fundamentallemma § 10 : 4.2 folgt x − a2 u(x) = 0 f.ü., also auch
u(x) = 0 f.ü. und damit δa = {u} = 0, was ein Widerspruch ist.
3 Konvergenz von Distributionenfolgen 309

Dennoch ziehen viele Autoren die griffige Symbolik ϕ(x) δ(x − a) dn x der
etwas blassen Notation δa ϕ vor. Dagegen ist auch nichts einzuwenden, solan-
ge das Symbol δ(x − a) unter dem Integral bleibt und sich nicht als Dirac–
”
Funktion“
verselbstständigt. Es sei angemerkt, dass sich δa ϕ durchaus als In-
tegral ϕ(x) dμ(x) auffassen läßt. Dies setzt aber den Begriff der Integration
bezüglich eines Maßes μ voraus, siehe § 20.
ÜA Zeigen Sie, dass ϕ → ∂ α ϕ(a) eine singuläre Distribution ist.
3 Konvergenz von Distributionenfolgen

Die Konvergenz einer Folge (Uk ) von Distributionen gegen die Distribution U
definieren wir durch
D
Uk −→ U : ⇐⇒ lim Uk ϕ = U ϕ für jede Testfunktion ϕ ∈ D .
k→∞
Für lokalintegrierbare Funktionen uk , u sprechen wir von Konvergenz im

Distributionensinn, wenn
D
{uk } −→ {u} für k → ∞, d.h. wenn

lim uk ϕ = uϕ für jede Testfunktion ϕ ∈ D gilt.
k→∞
Beispiel. Die Funktionenfolgen (sin kx) bzw. (sin2 kx) besitzen keinen punkt-
weisen Grenzwert. Sie konvergieren aber im Distributionensinn gegen die kon-
stanten Funktionen 0 bzw. 1/2. Das ergibt sich mit Hilfe partieller Integration
ÜA .
3.2 Die Dirac–Distribution als Limes von Dirac–Folgen

Eine Familie (ur )r>0 von stetigen Funktionen ur auf Ê n
heißt eine im Punkt
a konzentrierte Dirac–Folge, wenn

ur ≥ 0 , supp ur ⊂ Kr (a) , ur (x) dn x = 1 .
Beispiel. ur (x) = jr (x − a) = jr (a − x), vgl. § 10 : 1.2.
Satz. Für jede im Punkt a konzentrierte Dirac–Folge (ur ) gilt
D
{ur } −→ δa für r → 0 .
Beweis.
Sei ε > 0 gegeben und ϕ eine Testfunktion. Da ϕ stetig ist, gibt es ein δ > 0
mit |ϕ(x) − ϕ(a)| < ε, falls x − a < δ. Wegen ur (x) dn x = 1 und ur ≥ 0
gilt für r < δ

| {ur } ϕ − δa ϕ | = | {ur } ϕ − ϕ(a) | = ur (x) (ϕ(x) − ϕ(a)) dn x

≤ ur (x) |ϕ(x) − ϕ(a)| dn x < ε ur (x) dn x = ε . 2
Bemerkungen. (a) Für jede im Punkt a konzentrierte Dirac–Folge (ur ) gilt

lim ur (x) = 0 für x = a, lim ur (a) = ∞. Der Satz gibt die korrekte Fassung
r→0 r→0
der häufig anzutreffenden Schreibweise lim ur (x) = δ(x − a) .
r→0
(b) Das folgende Kriterium entnehmen wir Schwartz [42] II.4, Satz 13:
Satz. Es gilt lim {uk } = δ für jede Folge (uk ) stetiger Funktionen mit folgen-
k→∞
den Eigenschaften:
(i) Es gibt ein R > 0 mit uk (x) ≥ 0 für x < R und k = 1, 2, . . . ,
(ii) uk (x) → 0 gleichmäßig auf jeder Kugelschale {x ∈

Ê n
| 1
r
≤ x ≤ r},
n
(iii) lim uk (x) d x = 1 für jedes r > 0.
k→∞
Kr (0)
Die genannten Voraussetzungen sind beispielsweise erfüllt für

n2
1 k 1 2
uk (x) = sin kx (n = 1) und uk (x) = e− 4 kx ÜA .
πx 4π
3.3 Punktladungen und Punktmassen

(a) Ist (ur ) eine im Punkt a konzentrierte Dirac–Folge, so bietet sich die Vor-
stellung von Ladungsdichten ur der Gesamtladung 1 an, die für r → 0 immer
schärfer lokalisiert sind. Daher dient δa als mathematisches Modell für den
idealisierten Fall der Ladungsdichte einer Punktladung 1 an der Stelle a. Die
Distribution
q1 δa1 + . . . + qN δaN
wird als Verteilung von N Punktladungen q1 , . . . , qN an den Stellen a1 , . . . , aN

interpretiert; entsprechend m1 δa1 + . . . + mN δaN als Massendichte eines Sy-
stems von N Massenpunkten mit den Massen mk > 0.
(b) Flächenladungen werden ebenfalls durch Distributionen beschrieben, und
zwar mittels gewichteter Oberflächenintegrale über Testfunktionen, vgl. Wladi-
mirow [56] § 6.5 und Schwartz [42] II.1. Diese Betrachtungsweisen mag formale
Vorzüge haben; der begriffliche Aufwand für eine mathematisch strenge Hand-
habung ist aber derart, dass der Distributionenkalkül letztlich als schwerfällig
4 Differentiation von Distributionen 311
anzusehen ist. Wesentlich einfacher ist die einheitliche Auffassung diskreter und
kontinuierlicher Ladungs– oder Massenverteilungen als Maße, vgl. § 20.
3.4 Distributionen als Limites von Testfunktionen

Satz. Für jede Distribution U gibt es eine Folge (uk ) von Testfunktionen mit
D
{uk } −→ U für k → ∞ .
Dieser Satz, dessen Beweis in Wladimirow [56] § 7.7 gegeben wird, dient hier
nur als Hintergrundinformation. Zum einen stellt er die Verbindung zu dem
folgenden allgemeineren Distributionenbegriff her (Mikusinski 1948):
(uk ) eine Folge von Testfunktionen mit der Eigenschaft, dass die Folge
Sei
( uk ϕ ) für jede Testfunktion ϕ konvergiert. Dann ist durch

M ϕ := lim uk ϕ
k→∞
eine Distribution im Sinne von Mikusinski gegeben. Jede durch 2.1 definierte
Distribution U ist demnach auch eine Distribution im erweiterten Sinn. Eine
Übersicht über andere Varianten des Mikusinskischen Ansatzes finden Sie bei
Temple [44].
Zum anderen gibt der Satz einen Hinweis darauf, wie die Differentiation von
Distributionen im folgenden zu definieren ist.
4 Differentiation von Distributionen

4.1 Der Ableitungsbegriff für Distributionen
Der Ableitungsbegriff für Distributionen soll folgenden Forderungen genügen:
(a) Für jede Distribution U und jeden Multiindex α ist ∂ α U wieder eine Dis-
tribution.
(b) Für Testfunktionen u gilt ∂ α {u} = {∂ α u} .
D
(c) Differentiation und Grenzübergang sind vertauschbar, d.h. aus Uk −→ U
D
für k → ∞ folgt ∂ α Uk −→ ∂ α U für k → ∞ und jeden Multiindex α.
Aus der Forderung (b) folgt nach dem Satz § 11 : 3.3 über partielle Integration

∂ α {u} ϕ = {∂ α u} ϕ = ∂ α u ϕ = (−1)|α| u ∂ α ϕ = (−1)|α| {u} ∂ α ϕ
für alle ϕ ∈ D .
Nach 3.3 gibt es zu U ∈ D Testfunktionen {uk } mit {uk } ϕ → U ϕ für alle
Testfunktionen ϕ. Die Forderung (c) verlangt daher
(∂ α U ) ϕ = lim (∂ α {uk }) ϕ = lim (−1)|α| {uk } ∂ α ϕ = (−1)|α| U (∂ α ϕ) .

k→∞ k→∞
Satz. Für jede Distribution U und jeden Multiindex α ist durch
(∂ α U ) ϕ := (−1)|α| U (∂ α ϕ) für alle ϕ ∈ D
eine Distribution ∂ α U gegeben.

D D
Aus Uk −→ U für k→∞ folgt ∂ α Uk −→ ∂ α U für k → ∞.
Beweis.
D D
(i) ∂ α U : D → ist linear. Aus ϕk −→ ϕ folgt ∂ α ϕk −→ ∂ α ϕ nach 2.2. Da
U eine Distribution ist, folgt daraus für k → ∞
(∂ α U ) ϕk = (−1)|α| U (∂ α ϕk ) → (−1)|α| U (∂ α ϕ) = (∂ α U ) ϕ .
D
(ii) Sei Uk −→ U , d.h. Uk ϕ → U ϕ für alle Testfunktionen ϕ. Dann folgt
(∂ α Uk ) ϕ = (−1)|α| Uk (∂ α ϕ) → (−1)|α| U (∂ α ϕ) = (∂ α U ) ϕ
für alle ϕ ∈ D , somit ∂ α Uk → ∂ α U für k → ∞. 2
4.2 Beispiele
(a) Für die Heaviside–Funktion Θ = χÊ+ gilt {Θ} = δ. Denn ist ϕ eine
Testfunktion mit supp ϕ ⊂ ] − R, R [ , so gilt definitionsgemäß
∞ R
{Θ} ϕ = −{Θ} ϕ = − ϕ = − ϕ = ϕ(0) − ϕ(R) = ϕ(0) .
0 0
(b) Die Ableitungen der Dirac–Distribution δa ergeben sich nach Definition

aus
(∂ α δa ) ϕ = (−1)|α| (∂ α ϕ)(a) .

n
n
(c) Sei L = aik ∂i ∂k + ak ∂k + a ein linearer Differentialoperator mit
i,k=1 k=1
∗
konstanten Koeffizienten und L der zu L formal adjungierte Operator, vgl.
1.2. Dann gilt für jede lokalintegrierbare Funktion u und für ϕ ∈ D nach (b)

(L{u}) ϕ = u L∗ ϕ .
(d) Ist u : →
abschnittsweise glatt (vgl. § 6 : 2.2 (b)) und besitzt in jedem
kompakten Intervall höchstens endlich viele Sprungstellen, so gilt

{u} = {u } + (u(x+) − u(x−)) δx .
x∈ Ê
ÜA Wie ist diese Formel zu verstehen? Beachten Sie 3.1.
4 Differentiation von Distributionen 313
(e) Für jede stetige Funktion u auf Ê gilt ÜA

{uh } → {u} für h → 0 mit uh (x) := (u(x + h) − u(x))/h .
(f) Ein Dipol der Stärke 1 an der Stelle a mit Richtungsvektor v (v = 1)
entsteht als Grenzwert beim Aneinanderrücken der Punktladungen
1 1
im Punkt a + tv und − im Punkt a.
t t
Nach der Bemerkung 3.3 (a) beschreiben wir ihn durch die Distribution
δa+tv − δa
lim .
t→∞ t
Dies ergibt sich nach (b) aus
ϕ(a + tv) − ϕ(a)
δa+tv − δa
lim ϕ = lim = ∂v ϕ(a)
t→0 t t→0 t

3
3
= vk ∂k ϕ(a) = − vk ∂k δa ϕ für ϕ ∈ D .
k=1 k=1

3
Für den oben definierten Grenzwert erhalten wir somit ∂v δa := − vk ∂k δa .
k=1
4.3 Das Produkt von Distributionen mit C∞ –Funktionen

(a) Für jede C∞ –Funktion a auf Ê n
und jede Distribution U auf Ên
ist durch
(aU )ϕ := U (aϕ) (ϕ ∈ D )
eine Distribution aU definiert.

(b) Für das so definierte Produkt gilt die Leibniz–Regel
γ!
∂ γ (aU ) = ∂αa ∂β U .
α! β!
α+β=γ
Beweis.
(a) Mit ϕ ist auch aϕ eine Testfunktion, und nach § 10 : 2.2 (c) gilt die Leibniz–
Regel
γ!
(∗) ∂ γ (a ϕ) = ∂αa ∂β ϕ .
α! · β!
α+β=γ
D
Sei ϕk −→ ϕ für k → ∞, also supp ϕk in einer kompakten Menge K für
alle k ∈
und ∂ β ϕk → ∂ β ϕ gleichmäßig für alle Multiindizes β. Wegen der
D
Beschränktheit der Funktionen ∂ α a (|α| ≤ |γ|) folgt aus (∗) a ϕk −→ a ϕ. Also
ist a U eine Distribution.
(b) Nach Definition der k–ten partiellen Ableitung einer Distribution und auf-
grund der Definition (a) erhalten wir für ϕ ∈ D
∂k (a U ) ϕ = −(a U ) ∂k ϕ = −U (a ∂k ϕ) = −U (∂k (a ϕ) − ∂k a ϕ)
= ∂k U (a ϕ) + U (∂k a ϕ) = (a ∂k U )ϕ + (∂k a U )ϕ , also
∂k (a U ) = a ∂k U + ∂k a U .
Durch nochmalige Anwendung der eben erhaltenen Regel erhalten wir weiter
∂i ∂k (a U ) = ∂i (a ∂k U + ∂k a U )
= a ∂i ∂k U + ∂i a ∂k U + ∂k a ∂i U + ∂i ∂k a U.
Die allgemeine Formel ergibt sich entsprechend durch Induktion nach |γ| ÜA .
Beispiele. Für a ∈ C∞ ( Ê n
) gilt ÜA
(i) aδ = a(0)δ , (ii) ∂k (aδ) = (∂k a)(0)δ + a(0)∂k δ .
4.4 Affine Transformationen von Distributionen

Gegeben sei eine affine Transformation
F : Ê n
→ Ê,
n
x → c + Ax
mit c ∈ Ê n
und einer invertierbaren Matrix A.
(a) Für u ∈ L1loc ( Ê n
) definieren wir F {u} durch
F {u} := {u ◦ F } .
(b) Die Definition von F U für beliebige Distributionen U fassen wir so, dass
sie mit (a) verträglich ist, vgl. 3.4. Dazu beachten wir, dass aufgrund des Trans-
formationssatzes für Integrale

F {u} ϕ = {u ◦ F } ϕ = u(F (x)) ϕ(x) dn x

= u(y) ϕ(F −1 (y)) | det A|−1 dn y = | det A|−1 {u}(ϕ ◦ F −1 ) .
Definieren wir für beliebige Distributionen U die Linearform F U durch
(F U )ϕ := |detA|−1 U (ϕ ◦ F −1 ) für alle ϕ∈D,
so ist F U eine Distribution ÜA .

5 Grundlösungen 315
5 Grundlösungen
5.1 Differentialgleichungen für Distributionen
Ê
Seien L ein linearer Differentialoperator auf dem n mit konstanten reellen
Koeffizienten und L∗ der zu L formal adjungierte Operator:

L = aα ∂ α , L∗ = (−1)|α| aα ∂ α .
|α|≤m |α|≤m
Für eine Distribution U auf Ên

ist nach 4.1

L U := aα ∂ α U
|α|≤m
wieder eine Distribution. Die Differentialgleichung L U = F mit einer gegebe-

nen Distribution F hat also Sinn.
Für u, f ∈ L1loc ( Ê n
) bedeutet die Differentialgleichung L{u} = {f } nach
4.2 (c)

u L∗ ϕ = f ϕ für alle ϕ ∈ D ,
d.h. dass u eine schwache Lösung von Lu = f ist, vgl. 1.2.
5.2 Grundlösungen
Eine Distribution U heißt Grundlösung für L an der Stelle a ∈ Ê n
(oder
mit Pol a), wenn
L U = δa .
Ist U eine Grundlösung mit Pol a, so ist Ua = τa U mit τa (x) = x − a eine
Grundlösung mit Pol 0 und umgekehrt ÜA . Es reicht also, eine Grundlösung
mit Pol 0 zu kennen; diese bezeichnen wir meistens schlechthin als Grundlö-
sung.
Eine Funktion Γ ∈ L1loc ( Ê ) mit
n
L {Γ} = δa
nennen wir ebenfalls eine (reguläre) Grundlösung für L mit Pol a . Diese Diffe-
rentialgleichung bedeutet also

Γ L∗ ϕ = ϕ(a) für jede Testfunktion ϕ ∈ D .
Die Grundlösungen eines Differentialoperators sind nicht eindeutig bestimmt.
Ê
Ist Γ ∈ L1loc ( n ) eine Grundlösung von L und u eine klassische oder schwache
Lösung der homogenen Differentialgleichung Lu = 0 , so ist auch Γ + u eine
Ê
Grundlösung. Sind umgekehrt Γ1 , Γ2 ∈ L1loc ( n ) Grundlösungen für L , so
ist u = Γ2 − Γ1 eine schwache Lösung der homogenen Gleichung, d.h. es gilt
L{u} = 0 .
Beispiel. Das Newton–Potential U (x) = Gm / x − a (G=Gravitations-

Ê
konstante) einer Punktmasse m im Punkt a ∈ 3 ist Lösung der Distributi-
onsgleichung
−Δ{U } = 4π Gmδa .
Der Nachweis folgt in § 14 : 2.4.
5.3 Konstruktion schwacher Lösungen aus Grundlösungen

Ê
Satz. Sei Γ ∈ L1loc ( n ) eine Grundlösung für L und f ∈ C0c ( Ê ) . Dann ist
n
durch das Faltungsintegral

u(x) := (Γ ∗ f )(x) = Γ(x − y) f (y) dn y für x ∈ Ên
eine schwache Lösung u der inhomogenen Differentialgleichung Lu = f gege-

ben.
Bemerkung. Dieser Satz ergibt sich im Wesentlichen durch Anwendung des

Superpositionsprinzips auf den linearen Operator L. Da der nachfolgende Be-
weis das nicht so deutlich zeigt, machen wir die Verwendung des Superposi-
tionsprinzips am Beispiel der Newtonschen Gravitationsgleichung − Δu = 4πf
plausibel (f = Massendichte, die Gravitationskonstante G = 1 gesetzt).
Für die “Massendichte“ f = m δy eines Massenpunktes der Masse m an der
Stelle y ist u = 4πmΓy nach dem letzten Beispiel eine Lösung. Für die
“Massendichte“
f = m 1 δ y 1 + . . . + m N δy N
von Massenpunkten mit den Massen m1 , . . . , mN an den Stellen y1 , . . . , yN
ist dann durch Superposition

N
N
u(x) = 4π mk Γyk (x) = 4π mk Γ(x − yk )
k=1 k=1
eine Lösung von − Δ{u} = 4πf . Für eine stetige Massendichte f ∈ C0c ( 3 ) ist Ê
dann plausibel (und läßt sich auch beweisen), dass hieraus durch Grenzübergang
im Distributionssinn folgt

u(x) = 4π f (y) Γ(x − y) d3 y .
Beweis des Satzes.

Nach 5.2 gilt L{Γy } = δy , d.h.

Γ(x − y) (L∗ ϕ)(x) dn x = ϕ(y)
für alle Testfunktionen ϕ ∈ D und alle y ∈ Ê . Mit dem Satz von Fubini § 8 : 1.8
n
folgt
5 Grundlösungen 317

{f } ϕ = ϕ(y) f (y) dn y = Γ(x − y) (L∗ ϕ)(x) dn x f (y) dn y

= Γ(x − y) f (y) dn y (L∗ ϕ)(x) dn x

= u(x) (L∗ ϕ)(x) dn x) = L{u} ϕ . 2
5.4 Grundlösungen gewöhnlicher Differentialgleichungen

Für m ≥ 1 sei

m
dk
L = ak
dxk
k=0
ein linearer Differentialoperator auf Ê mit konstanten Koeffizienten ak ∈ Ê

und am = 1.
Satz. Wir erhalten eine Grundlösung Γ für L, indem wir das AWP
Lu = 0 , u(0) = . . . = u(m−2) (0) = 0 , u(m−1) (0) = 1
lösen und
(
u(x) für x ≥ 0,
Γ(x) :=
0 für x < 0
setzen.
Bemerkungen. (i) Bei Kenntnis der Nullstellen des charakteristischen Poly-

m
noms ak λk von L können wir nach § 3 : 3.3 u und damit Γ explizit angeben.
k=0
(ii) Γ(m−1) ist stetig bis auf eine Sprungstelle im Nullpunkt mit Sprunghöhe 1.
Für m ≥ 2 ist Γ Cm−2 –differenzierbar. Es läßt sich zeigen, dass jede Grundlö-
sung von L diese Differenzierbarkeitseigenschaften hat.
Beweis.
Die Lösung u des AWP ist nach § 3 : 3.3 C∞ –differenzierbar. Γ läßt sich mit
Hilfe der Heaviside–Funktion Θ (2.2 (i)) als Produkt Γ = uΘ schreiben. Nach
4.2 (d) folgt
{Γ} = {uΘ} = {(uΘ) } + (u(0) − 0)δ0 = {u Θ} + u(0)δ ,

{Γ} = {u Θ} + u (0)δ + u(0)δ ,
und durch Induktion
{Γ}(k) = {u(k) Θ} + u(k−1) (0)δ + u(k−2) (0)δ + . . . + u(0)δ (k−1) .
Aus u(0) = . . . = u(m−2) (0) = 0, u(m−1) (0) = 1, am = 1, Lu = 0 ergibt

sich dann

m &
m '
L{Γ} = ak {Γ}(k) = ak u(k) Θ + am u(m−1) (0)δ
k=0 k=0
= {(Lu) Θ} + δ = δ . 2
Aufgaben. (a) Bestimmen Sie eine Grundlösung für den Operator

d2
dx2
+ a
für die Fälle a > 0, a < 0, a = 0.

(b) Zeigen Sie direkt mit Hilfe der Definition 5.2, dass x → 12 |x| eine Grund-
d2
lösung für dx 2 ist.
(c) Bestimmen Sie den Stromverlauf IT (t) im R–L–Schwingkreis 1.4 bei An-
regung durch einen kurzen Spannungsstoß U = (U0 /T ) χ[0,T ] (T > 0), indem
Sie für die DG
˙
I(t) + R
I(t) = 1
U (t)
L L
zwei Anfangswertprobleme lösen: Zuerst auf [0, T ] mit dem Anfangswert I(0) =
0 und dann auf [T, ∞[ durch stetigen Anschluss der Lösungen an der Stelle
t = T.
Zeigen Sie: Γ(t) := lim L IT (t) ist die oben konstruierte Grundlösung für
T →0
d R
dt
+ L
.
6 Die Fouriertransformation für temperierte Distributionen
6.1 Temperierte Distributionen

Ê
(a) Zielsetzung. Die Fouriertransformation auf L1 ( n) soll für Distributionen
Ê ; = {u
T ∈ D so fortgesetzt werden, dass für u ∈ L1 ( n ) die Gleichung {u} /} gilt.
Diese Forderung führt aufgrund der Wälzformel § 12 : 2.3 (a) auf die Bedingung

; ϕ = {u
{u} /} ϕ = /ϕ =
u / = {u} ϕ/ für alle ϕ ∈ D .
uϕ
Daher ist es naheliegend, T/ durch T/ϕ := T ϕ / für alle ϕ ∈ D zu definieren.

Dem aber steht entgegen, dass ϕ / für alle nichtverschwindenden ϕ ∈ D keine
Testfunktion ist (§ 12 : 2.2 (c)).
Für schnellfallende Funktionen ϕ ∈ S ist dagegen auch die Fouriertransfor-
mierte ϕ/ schnellfallend (§ 12 : 3.3). Um der Definition T/ϕ := T ϕ
/ Sinn zu geben,
betrachten wir eine neue Art von Distributionen, Distributionen mit Definiti-
onsbereich S statt D :
6 Die Fouriertransformation für temperierte Distributionen 319
(b) Auf S legen wir einen Konvergenzbegriff fest durch

S
ϕk −→ ϕ ⇐⇒ xα ∂ β ϕk (x) → xα ∂ β ϕ(x) gleichmäßig auf Ê
n
für k → ∞ und jedes Paar von Multiindizes α, β.

Ê
Eine temperierte Distribution T auf n ist eine Linearform T : S → ,
welche bezüglich dieses Konvergenzbegriffs stetig ist,
S
ϕk −→ ϕ =⇒ T ϕk → T ϕ .
Die Gesamtheit S = S (n ) der temperierten Distributionen auf n ist auf

natürliche Weise ein Vektorraum über . Aufgrund des folgenden Satzes kann
S als Teilraum von D aufgefasst werden:
(c) Satz. Für jede temperierte Distribution T ist die Einschränkung U = T |D
von T auf D eine Distribution U ∈ D . Die Restriktionsabbildung
T → T |D : S → D
ist injektiv .
Beweis.
D S
(i) T |D ∈ D : Aus der Konvergenz ϕk −→ ϕ folgt ϕk −→ ϕ ÜA . (Beachten
Sie, dass die Vereinigung aller supp ϕk in einer kompakten Menge liegt, auf der
xα beschränkt ist.) Für die temperierte Distribution T folgt T ϕk → T ϕ.
(ii) Es sei T ∈ S und T |D = 0. Wir zeigen in Lemma (d), dass es zu jedem
S
ϕ ∈ S eine Folge (ϕk ) in D gibt mit ϕk −→ ϕ. Daraus folgt dann T ϕ =
lim T ϕk = 0. Somit besteht der Kern der Restriktionsabbildung nur aus dem
k→∞
Nullfunktional. 2
(d) Lemma. Für jede schnellfallende Funktion ϕ gibt es eine Folge (ϕk ) von
S
Testfunktionen mit ϕk −→ ϕ.
Beweis.
Nach § 10 : 3.5 gibt es ein η ∈ D mit η(x) = 1 für x ≤ 1 und 0 ≤ η(x) ≤ 1
sonst. Zu gegebenem ϕ ∈ S sind durch ϕk (x) := η( k1 x) ϕ(x) für k ∈
Testfunktionen definiert mit ϕk (x) = ϕ(x) für x ≤ k. Für feste Multiindizes
α, β sind durch
β! 1 μ 1
(1) ψk (x) := xα ∂ β ϕk (x) = xα ∂ η( k x) ∂ ν ϕ(x)
μ! ν! k|μ|
μ+ν=β
ebenfalls Testfunktionen ψk gegeben, und nach Wahl von η gilt
(2) ψk (x) = xα ∂ β ϕ(x) für x < k .

Es gibt eine Konstante C mit | ∂ μ η(x) | ≤ C für x ≤ 1 und |μ| ≤ |β| und eine
Ê
Konstante D mit | xα ∂ ν ϕ(x) | ≤ D für x ∈ n und |ν| ≤ |β|. Es folgt
ψk (x) − xα ∂ β ϕ(x) = xα ∂ β ϕ(x)(η( k1 x) − 1) + sk (x) ,
wobei sk die in (1) stehende Summe ohne das Glied mit β = 0 ist. Es gilt also
|sk (x) ≤ A/k mit einer geeigneten Konstanten A. Zu gegebenem ε > 0 wählen
wir R > 0 so, dass
| xα ϕ(x) C | ≤ ε für x ≥ R .
Dann folgt für k > R aus (1) und (2)

ψk (x) − xα ∂ β ϕ(x) ≤ ε + 1 A für x ≥ k . 2
k
(e) Beispiel. Das Dirac–Funktional ϕ → ϕ(a) auf S und dessen Ableitungen

sind temperierte Distributionen.
6.2 Reguläre temperierte Distributionen

Wir wollen nun die Fourier–Transformation auf nicht integrierbare Funktionen
ausdehnen. Hierzu geben wir eine Klasse von Funktionen an, welche reguläre
temperierte Distributionen liefert und definieren für diese Funktionen dann die
Fourier–Transformierten als temperierte Distributionen.
Satz. Unter jeder der folgenden Bedingungen ist durch

{u} : S → , ϕ→ uϕ
eine temperierte Distribution gegeben:

(a) u ∈ L1loc (n ), und es gibt ein N = 1, 2, . . . mit

|u(x)|
dn x < ∞ ,
1 + xN
(b) u ∈ Lp (n ) für ein p ≥ 1,
(c) u ist ein Polynom.
Beweis.
S
(a) Es genügt zu zeigen:
ϕk −→ 0 =⇒ {u}ϕk → 0. Für eine Nullfolge (ϕk )
in S gilt ck := sup (1 + x ) | ϕk (x) | x ∈ n → 0 für k → ∞. Es folgt
N

|u(x)|
u(x) ϕk (x) dn x = (1 + xN ) | ϕk (x) | dn x
1 + xN

|u(x)|
≤ ck dn x → 0 .
1 + xN
(b) Im Fall u ∈ L1 ( Ê n
) ist die Voraussetzung (a) mit N = 0 erfüllt.
Im Fall p > 1 sei q > 1 mit p1 + 1q = 1 gewählt. Für u ∈ Lp ( n ) und Ê
v(x) := (1 + xn )−1 gilt |v(x)|q ≤ (1 + xn q )−1 . Wegen nq > n ist |v|q
Ê
über N integrierbar (§ 11 : 2.4 Folgerung (i)). Mit der Hölderschen Ungleichung
§ 8 : 2.3 (b) folgt die Integrierbarkeit von |uv|, d.h. die Bedingung (a) ist mit
N = n erfüllt.

(c) Sei u(x) = aα xα mit m ∈ Æ. Dann gilt außerhalb des Einheitswürfels
|α|≤m
|u(x)| ≤ |aα | xm
∞ , also gibt es wegen x∞ ≤ x eine Konstante c
|α|≤m
mit |u(x)| ≤ c xm ≤ c (1 + xm ). Mit N := m + n + 1 folgt
|u(x)|
1 + xN
≤
c
1 + xn+1
für alle x ∈ Ê n
.
Da die rechte Seite über Ê n

integrierbar ist (§ 11 : 2.4 (i)), erfüllt u die Bedingung
(a) des Satzes. 2
6.3 Operationen mit temperierten Distributionen

Sei T eine temperierte Distribution auf Ê n
. Dann gilt
(a) Für jeden Multiindex α ist durch
(∂ α T ) ϕ := (−1)|α| T (∂ α ϕ) für alle ϕ ∈ S

α
eine temperierte Distribution ∂ T definiert.
(b) Sind sämtliche Ableitungen ∂ α a von a ∈ C∞ ( Ê n

) polynomial beschränkt
(vgl. § 12 : 3.2 (d)), so ist durch
(a T ) ϕ := T (a ϕ) für alle ϕ ∈ S
eine temperierte Distribution a T definiert.

(c) Für jede affine Abbildung
F : Ên
→ Ên
, x → c + Ax mit c ∈ Ê n
, det A = 0
ist durch
(F T )ϕ := | det A|−1 T (ϕ ◦ F −1 ) für alle ϕ ∈ S
eine temperierte Distribution T definiert. Erfüllt u eine der Bedingungen 6.2(a),

(b),(c), so gilt
F {u} = {u ◦ F }.
Damit sind die temperierten Distributionen

P α T := (−i)|α| ∂ α T , Qα T = xα T , ea T (ea (x) := ei x , a )
definiert.
Desweiteren erhalten wir für die Abbildungen
1
τa (x) = x − a , μr (x) = r x, σ(x) = −x
die temperierten Distributionen
τa T , μr T , σT .
Beweis.
S S
(a) Aus ϕk −→ ϕ folgt ∂ α ϕk −→ ∂ α ϕ, denn für beliebige Multiindizes γ, β
γ γ
gilt mit (Q u)(x) = x u(x)
Qγ ∂ β (∂ α ϕk ) = Qγ ∂ β+α ϕk → Qγ ∂ β+α ϕ = Qγ ∂ β (∂ α ϕ) .
(b) Nach § 10 : 3.2 (d) gilt: ϕ ∈ S =⇒ a ϕ ∈ S . Zu zeigen bleibt
S S
ϕk −→ ϕ =⇒ a ϕk −→ a ϕ .
Dies ergibt sich aus der Leibniz–Regel (§ 10 : 2.2 (c)): Qα ∂ β (a ϕk ) ist Linearkom-
bination von Funktionen Qα ∂ μ a ∂ ν ϕk = ∂ μ a Qα ∂ ν ϕk mit |μ|, |ν| ≤ |β| . Da alle
∂ μ a polynomial beschränkt sind, gibt es ein N mit
μ α ν
∂ a Q (∂ ϕ − ∂ ν ϕk ) (x) ≤ 1 + x2N (∂ ν ϕ − ∂ ν ϕk ) (x) .
S
Nach Voraussetzung ϕk −→ ϕ geht in die rechte Seite gegen 0 für k → ∞.
(c) Mit ϕ, ϕk gehören auch ψ = | det A|−1 ϕ ◦ F −1 und ψk = | det A|−1 ϕk ◦ F −1
S S
zu S , und aus ϕk −→ ϕ folgt ψk −→ ψ. Die Formel F {u} = {u ◦ F } folgt wie
im Beweis 4.4 (b) durch Rückwärtslesen der Transformationsformel. 2
6.4 Die Fouriertransformation für temperierte Distributionen

Gemäß den Überlegungen in 6.1 definieren wir für temperierte Distributionen
T die Fouriertransformierte T/ durch
T/ϕ := T ϕ
/ für ϕ ∈ S .
Satz. (a) T/ ist eine temperierte Distribution.

(b) Die Fouriertransformation
Φ : S → S , T → T/
ist linear und bijektiv. Die Umkehrabbildung ist gegeben durch
Φ−1 : S → S , T → T/S = σ T/ ,
wobei σ(x) = −x und Sϕ = ϕ ◦ σ = ϕ ◦ σ −1 .
Insbesondere gilt
/
/ = σT = T S .
T
Mit den Bezeichnungen von 6.3 gilt
(c) P; /,
α T = Qα T Q; /
α T = (−1)|α| P α T für jeden Multiindex α,
(d) τ; /,
a T = ea T e; /,
a T = τa T μ; n /.
r T = r μ1/r T
Beweis.
S S
/k −→ 0.
(a) Es genügt zu zeigen ϕk −→ 0 =⇒ ϕ
S
Es gelte also ϕk −→ 0. Für beliebige Multiindizes α, β gilt nach dem P ,Q–Gesetz
auf S (§ 12 : 3.3 (b))
α β
x ∂ ϕ/k (x) = (Qα P β ϕ/k )(x) = Qα Q;β ϕ (x) = (P α Qβ ϕ )/ (x)
k k
n
≤ (2π)− 2 (P α Qβ ϕk )(y) dn y

≤ c sup (1 + y2n ) P α Qβ ϕk (y) y ∈ n Ê
mit

n dn y
c := (2π)− 2 < ∞
1 + y2n
nach § 11 : 2.4, Folgerung (i).
Da sich P α Qβ ϕk mittels der kanonischen Vertauschungsrelationen § 12 : 2.2 (a)
in eine Linearkombination von Funktionen des Typs Qμ P ν ϕk verwandeln läßt,
/k → 0 auf n.
folgt die gleichmäßige Konvergenz Qα P β ϕ Ê
(b) Zunächst bemerken wir: Ist T eine beliebige temperierte Distribution, so
gilt nach 6.3 (c)
σT ϕ = T (ϕ ◦ σ −1 ) = T (ϕ ◦ σ) = T Sϕ für alle ϕ∈S,
wo T S : ϕ → T Sϕ eine temperierte Distribution ist. Es folgt σT = T S und

σ T/ = T/S, da auch T/ eine temperierte Distribution ist.
Φ ist injektiv: Aus T/ = 0 folgt T ϕ
/ = T/ϕ = 0 für alle ϕ ∈ S . Da die Fourier-
transformation auf S surjektiv ist, folgt T = 0. Für ϕ ∈ S gilt
: : = T/S ϕ/ = T S:ϕ
T/Sϕ = T/Sϕ / = Tϕ
nach der Umkehrformel § 12 : 3.4. Dies bedeutet Φ(T/S) = T und damit die
Surjektivität von Φ : S → S sowie Φ−1 (T ) = T/S.
(c) Nach dem P ,Q–Gesetz § 12 : 3.3 und nach 6.3 gilt für alle ϕ ∈ S
P; / = (−1)|α| T (P α ϕ
α T ϕ = (P α T )ϕ ;
/) = T (Q /(Qα ϕ) = Qα T/ϕ ,
α ϕ) = T
;
Q /) = T (P;
/ = T (Qα ϕ
α T ϕ = (Qα T )ϕ /(P α ϕ)
α ϕ) = T
= (−1)|α| (P α T/)ϕ .
(d) ergibt sich aus der Definition der betreffenden Operationen auf S mit
Hilfe der Skalierungsregeln § 12 : 2.3 (c),(d),(e) ÜA . 2
Nunmehr sind wir in der Lage, Polynomen Fouriertransformierte zuzuordnen,

die jetzt allerdings temperierte Distributionen sind.
Beispiele.
: = (2π) n2 δ ,
(1) {1}
;
(2) {x
n
α } = (2π) 2 (−1)|α| ∂ α δ für jeden Multiindex α,
(3) δ/a = (2π)− 2 {e−a } für a ∈

n
Ê, n
;
(4) {e
n
a } = (2π) 2 δa für a ∈ Ê n
.
Nachweis mit Hilfe der vorangehenden Rechenregeln als ÜA .
Schlussbemerkung. Wir haben hiermit zwei Typen von Distributionen, bei-

de werden gebraucht: Die Distributionen aus D benötigen wir zur Definition
von Grundlösungen, die Distributionen aus S für die Erweiterung der Fourier-
transformation. D kann nicht für beide Zwecke verwendet werden, denn dieser
Raum erweist sich nach 6.1 für die Anwendung der Fouriertransformation als
zu groß. Umgekehrt reicht S nicht zur Beschreibung aller Grundlösungen aus,
d
wie das folgende Beispiel zeigt. Für den Differentialoperator L = dx − a liefert
Γ(x) = a e für x ≥ 0, Γ(x) = 0 für x < 0 eine Grundlösung in D nach 5.4.
1 ax
1 x
Im Fall a > 0 gehört aber Γ nicht zu S , denn durch ϕ(x) = e− 2 ax j1 (t) dt
−∞
ist eine Funktion ϕ ∈ S gegeben, für welche das Integral {u}ϕ = u ϕ diver-
giert, wie sich der Leser leicht klar macht (die Mollifier jε wurden in § 10 : 3.1
eingeführt).
Kapitel V Die drei Grundtypen linearer
Differentialgleichungen 2. Ordnung
Hierunter verstehen wir die Gleichungen
∂u ∂2u
−Δu = f , − Δu = f , − Δu = f
∂t ∂t2
mit gegebener rechter Seite f . Wie in § 1 dargelegt wurde, fallen diese Gleichun-
gen in verschiedenen physikalischen Kontexten an. Jeder dieser drei Typen trägt
ganz charakteristische Wesenszüge und ist in dieser Hinsicht stellvertretend für
den allgemeinen Fall, bei dem der Laplace–Operator durch einen gleichmäßig
elliptischen Operator ersetzt wird, vgl. § 14 : 1 (b), § 16 : 1 (c), § 17 : 1 (c).
Explizite Lösungsdarstellungen erhalten wir nur für Raumgebiete mit starken
Symmetrien, wie z.B. Kreisscheibe und Kugel. Beispiele hierfür haben wir bei
den Separationsansätzen in § 6 kennengelernt; weitere Anwendungen der Sepa-
rationsmethode folgen in § 15 : 3, § 16, § 17. Bei Problemstellungen ohne solche
Symmetrieeigenschaften wird eine Theorie benötigt, welche die Existenz von
Lösungen sicherstellt, Eindeutigkeitsaussagen macht und das qualitative Ver-
halten der Lösungen beschreibt. Theoretische Kenntnis des Lösungsverhaltens
ist auch für die Entwicklung effizienter numerischer Verfahren unerlässlich.
In den folgenden vier Paragraphen stellen wir für die drei Grundtypen die wich-
tigsten Aspekte der Theorie in aller Kürze dar. Vieles kann nur skizziert werden;
den an Einzelheiten interessierten Lesern wird durch ausführliche Literaturan-
gaben weitergeholfen.
§ 14 Randwertprobleme für den Laplace–Operator

Vorkenntnisse für die ersten fünf Abschnitte: Lebesgue–Integral (§ 8), Testfunk-
tionen (Anfang von § 10), Integralsätze von Gauß und Green (§ 11, für den 3 : Ê
Bd. 1, § 26 : 4); für Abschnitt 6: Hilberträume (§ 9), schwache Lösungen und Dis-
tributionen (§ 12).
1 Übersicht
(a) Wir behandeln in diesem Paragraphen das Dirichlet–Problem (1. Rand-
wertproblem)
− Δu = f in Ω , u=g auf ∂Ω
und das Neumann–Problem (2. Randwertproblem)
− Δu = f in Ω , ∂n u = g auf ∂Ω

326 § 14 Randwertprobleme für den Laplace–Operator
(n das äußere Einheitsnormalenfeld von Ω) mit gegebenen Funktionen f auf Ω

und g auf ∂Ω. Hierbei ist Ω entweder ein beschränktes Gebiet (Innenraum)
Ê
oder n \ Ω ist beschränkt und nicht leer (Außenraum).
Die Gleichung − Δu = f heißt Poisson–Gleichung ; die zugehörige homogene
Gleichung Δu = 0 wird Laplace–Gleichung genannt.
In § 15 werden Eigenwertprobleme für den Laplace–Operator auf beschränkten
Gebieten betrachtet:
− Δu = λu in Ω , u = 0 auf ∂Ω ,
und
− Δu = λu in Ω , ∂n u = 0 auf ∂Ω ,
Auf diese werden wir geführt, wenn in der Wärmeleitungsgleichung oder in
der Wellengleichung die Zeitkoordinate von den Ortskoordinaten durch einen
Produktansatz absepariert wird.
(b) Gleichmäßig elliptische Differentialoperatoren. Die meisten der fol-
genden Ergebnisse bleiben mit geringfügigen Modifikationen gültig, wenn wir
den Laplace–Operator −Δ durch einen Operator −L der Form

n
n
Lu = aik ∂i ∂k u + bi ∂i u + cu
i,k=1 i=1
ersetzen, wobei die aik , bi , c beschränkte Funktionen auf Ω mit aik = aki sind
und

Ê
n
λ ξ2 ≤ aik (x) ξi ξk ≤ μ ξ2 für x ∈ Ω , ξ ∈ n
i,k=1
mit Konstanten μ ≥ λ > 0 gilt. Nicht übertragbar auf allgemeine elliptische

Gleichungen sind die Poissonsche Integralformel in 2.6 und die Kelvin–Trans-
formation in 2.8.
Als Literatur über elliptische Differentialgleichungen empfehlen wir Gilbarg–
Trudinger [79] und Evans [60].
2 Eigenschaften des Laplace–Operators

Hier und im folgenden bezeichnen wir den Operator −Δ als Laplace–Ope-
rator. Die Vorzeichenwahl ist Konventionssache, für das negative Vorzeichen
sprechen jedoch zwei Gründe:
– Grundlösungen und Greensche Funktionen des Operators −Δ sind nahe der
Singularität positiv (siehe 2.4, 2.5),
– Die Eigenwerte von −Δ sind positiv (siehe § 15 : 1.2).
2 Eigenschaften des Laplace–Operators 327
2.1 Harmonische Funktionen

Ê
Eine C2 –Funktion u auf einem Gebiet Ω ⊂ n wird harmonisch genannt,
wenn sie der Laplace–Gleichung Δu = 0 genügt.
Für n = 1 sind harmonische Funktionen von der Gestalt u(x) = ax + b; ihre
Theorie ist also erst für n ≥ 2 von Interesse. Für n = 2 stehen harmonische
Funktionen in folgender Korrespondenz zu holomorphen Funktionen: Für jede
holomorphe Funktion f (x + iy) = u(x, y) + iv(x, y) ist der Realteil u (ebenso
wie der Imaginärteil v) eine harmonische Funktion, was unmittelbar aus den
Cauchy–Riemannschen Differentialgleichungen folgt. Umgekehrt ist jede har-
Ê
monische Funktion u auf einem einfachen Gebiet Ω ⊂ 2 Realteil einer ho-
lomorphen Funktion f = u + iv, denn das Vektorfeld (−∂y u, ∂x u) erfüllt die
Integrabilitätsbedingungen und besitzt somit ein Potential v in Ω. Für u und v
sind dann die Cauchy–Riemannschen DG erfüllt.
2.2 Die Invarianz des Laplace–Operators unter Bewegungen

Ê
Für C2 –Funktionen u auf einem Gebiet Ω ⊂ n und eine Bewegung des Ê n
,
h : x → a + Ax mit A ∈ On , gilt nach § 11 : 5.3 auf Ω = h−1 (Ω)
(Δu) ◦ h = Δ(u ◦ h) .
Hiernach ist u genau dann harmonisch, wenn u ◦ h auf Ω harmonisch ist.
2.3 Das Maximumprinzip

erlaubt die Kontrolle von Lösungen der Poisson–Gleichung durch die gegebenen
Randwerte, insbesondere sichert es die Eindeutigkeit der Lösung. Es stellt auch
das wichtigste Hilfsmittel für die Untersuchung von qualitativen Eigenschaften
von harmonischen Funktionen dar.
(a) Satz. Für jede Funktion u ∈ C0 (Ω) ∩ C2 (Ω) mit Δu ≥ 0 auf einem be-
schränkten Gebiet Ω gilt
u(x) ≤ max u für x ∈ Ω , kurz u ≤ max u .
∂Ω ∂Ω
Insbesondere gilt für jede harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω)

min u ≤ u ≤ max u .
∂Ω ∂Ω
Der Beweis wurde in § 6 : 5.6 geführt.

(b) Strenges Maximumprinzip. Nimmt eine auf einem Gebiet Ω ⊂ n har- Ê
monische Funktion ein Maximum oder Minimum in Ω an, so ist sie konstant.
Der Beweis wird in 2.7 (b) nachgetragen.
(c) Randpunktlemma (Zaremba 1910). Sei u ∈ C0 (Ω) ∩ C2 (Ω) eine Funk-
tion mit Δu ≥ 0, die in einem Randpunkt a ∈ ∂Ω ein striktes Maximum
annimmt,
u(x) < u(a) für alle x ∈ Ω .
(i) Gibt es eine Kugel K = KR (x0 ) ⊂ Ω mit a ∈ ∂K, so besitzt u bei normaler
Annäherung an den Randpunkt a positive Steigung, d.h. es gilt
1
inf u(a) − u(a + tn) > 0
0<t<δ t
für hinreichend kleine δ > 0, wobei n = (x0 − a)/R der innere Normalenvektor
der Kugel K im Punkt a ist. Insbesondere gilt
1
− ∂n u(a) := lim u(a) − u(a + tn) > 0 ,
t→0+ t
falls dieser Grenzwert existiert.
(ii) Dieselbe Folgerung ergibt sich, wenn ∂Ω in einer Umgebung von a ein C2 –
Flächenstück mit innerem Einheitsnormalenvektor n im Punkt a ist.
Bemerkungen. Die Voraussetzung in (i) kann nicht wesentlich abgeschwächt

werden, vgl. John [49] 13 § 2. Einspringende Ecken und Kanten von Ω sind
zugelassen, während nach außen weisende Ecken und Kanten ausgeschlossen
sind. Ein Beispiel wird in 2.9 gegeben.
Beweis.
(i) Wegen der Translationsinvarianz des Laplace–Operators 2.2 dürfen wir
Ê
x0 = 0 annehmen. Auf der Kugelschale Ω0 := {x ∈ n | R/2 < x < R} ⊂ Ω
betrachten wir
2 2
w(x) := u(x) − u(a) + v(x) mit v(x) := e−αx − e−αR .
Nach Voraussetzung gilt w(x) = u(x) − u(a) ≤ 0 für x = R. Für α 1

erhalten wir
2
Δw(x) ≥ Δv(x) = 2α 2α x2 − n e−αx ≥ 0 in Ω0 und
2
w(x) ≤ u(x) − u(a) + e−αR /4
< 0 für x = R/2 , α 1 ,
da nach Voraussetzung max {u(x) − u(a) | x = R/2} < 0.
Somit gilt w ≤ 0 auf ∂Ω0 , Δw ≥ 0 in Ω0 , und aus dem Maximumprinzip folgt
w ≤ 0 in Ω0 .
Für 0 < t < R/2 gilt x := a + tn ∈ Ω0 und x = R − t, also folgt
u(a) − u(a + tn) v(x) − w(x) v(x) 2

= ≥ ≥ α R e−αR > 0
t t t
2
nach dem Mittelwertsatz für f (t) := e−α(R−t) ÜA .
(ii) Wir zeigen, dass es unter der Voraussetzung (ii) eine Kugel K der in (i)
genannten Art gibt. Wegen der Bewegungsinvarianz 2.2 dürfen wir a = 0 und
n = e1 annehmen. Nach Voraussetzung gibt es eine Umgebung U von 0 und
eine C2 –Funktion ψ : U → Ê mit ∇ψ = 0 in U und ψ(x) < 0 ⇐⇒ x ∈ Ω
für alle x ∈ U, vgl. § 11 : 3.1. Dabei gilt ψ(0) = 0 und ∇ψ(0) = βe1 mit
β = ∇ψ(0) > 0.
Aus dem Satz von Taylor folgt für x ≤ δ, Kδ (0) ⊂ U
1
ψ(x) = βx1 + ψ (ϑx)x , x ≤ βx1 + λx2
2

mit λ = max ψ (x)2 | x ≤ δ .
Wir wählen R > 0 so klein, dass 2R < δ und λ − 2R β
< 0. Dann erfüllt die
Kugel K = Kr (−Re1 ) die Voraussetzungen (i): Es ist 0 ∈ ∂K, weiter gilt für
x ∈ K sowohl x < δ als auch
2Rx1 + x2 = x + Re1 2 − R2 < 0 .
Damit ergibt sich
β
β

ψ(x) ≤ βx1 + λ x2 = 2Rx1 + x2 + λ − x2 < 0 ,
2R 2R
d.h. x ∈ Ω. 2
2.4 Die Standardgrundlösung für den Laplace–Operator

Ê
Eine auf n lokalintegrierbare Funktion Γ ist nach § 13 : 5.2 eine Grundlösung
für den Laplace–Operato −Δ, wenn − Δ{Γ} = δ, d.h. wenn

− Γ(x) Δϕ(x) dn x = ϕ(0) für alle Testfunktionen ϕ ∈ C∞
c ( Ê ).
n
Ên
Eine Standardmethode zur Bestimmung von Grundlösungen liefert die Fourier-
transformation, siehe Hörmander [63] Ch.2, Wladimirow [56] § 10.
Beim Laplace–Operator kommen wir jedoch schneller zum Ziel, wenn wir einen
kugelsymmetrischen Ansatz
Γ(x) = γ(x)
machen. Ein solcher wird durch die Invarianz 2.2 des Laplace–Operators unter
Ê
Drehungen des n nahegelegt. Setzen wir r = x und beachten

∂r xi ∂2r 1 xi xk
(∗) = , = δik − 2 ,
∂xi r ∂xi ∂xk r r
so erhalten wir für r = 0 ÜA
n−1 d n−1
ΔΓ(x) = γ (r) + γ (r) = r 1−n (r γ (r)) .
r dr
Verlangen wir ΔΓ(x) = 0 für x = 0, so folgt
(
cn r 2−n für n = 2 ,
γ(r) =
c2 log r für n = 2
bis auf additive Konstanten. Das Auftreten von Singularitäten im Nullpunkt

ist für Grundlösungen charakteristisch. Wie die multiplikative Konstante cn zu
wählen ist, damit eine Grundlösung entsteht, ergibt sich aus dem folgenden
Beweis.
Satz. (a) Durch

⎧ 1
⎪
⎨ (n − 2) ω xn−2 für n > 2 ,
n
Γ(x) :=
⎪
⎩ 1
− log x für n = 2
2π
ist eine Grundlösung für den Laplace–Operator −Δ gegeben; dabei ist ωn der
Oberflächeninhalt der (n − 1)–dimensionalen Einheitssphäre, vgl. § 11 : 2.4.
Weiter gilt
(b) Γ ist in Ên
\ {0} harmonisch.
(c) Für jedes Normalgebiet Ω ⊂ Ê n
und jede Funktion u ∈ C2 (Ω) gilt die
Darstellungsformel

u(x) = − Γx (y) Δu(y) dn y + (Γx ∂n u − u ∂n Γx ) do für x ∈ Ω,
Ω ∂Ω
wobei wir Γx (y) := Γ(y − x) gesetzt haben.
Bemerkungen. (i) Wie aus dem Beweis hervorgeht, gilt die Formel auch unter
der schwächeren Voraussetzung u ∈ C1n (Ω) ∩ C2 (Ω) , vgl. § 11 : 4.3*.
(ii) Durch Einsetzen von u = 1 in die Darstellungsformel ergibt sich

∂n Γx do = −1 für jedes x ∈ Ω .
∂Ω
(iii) Für n = 3 ist das Newton–Potential

Gm
U (x) = (G = Gravitationskonstante)
x
das Gravitationspotential eines Massenpunktes der Masse m im Ursprung, d.h.

genügt der Gravitationsgleichung
− Δ{u} = 4πGδ .
Beweis.
Ê
(a) Γ ist in n \ {0} stetig und über jede Kugel Kr (0) integrierbar (§ 11 : 2.4,
Ê
Folgerung (i)), also gilt Γ, Γx ∈ L1loc ( n). Dass Γ eine Grundlösung ist, ergibt
sich aus (c) wie folgt: Für ϕ ∈ C∞
c (
n
Ê
) wählen wir Ω als eine Kugel mit der
Eigenschaft supp ϕ ⊂ Ω und erhalten

− ϕ(0) = Γ(y) Δϕ(y) dn y = Γ(y) Δϕ(y) dn y .
Ω Ên
(b) Nach Konstruktion ist Γ in Ê n

\ {0} eine harmonische C∞ –Funktion.
(c) Wir fixieren x ∈ Ω und setzen Ωr := Ω \ Kr (x) für r 1 . Dann ergibt
die 2. Greensche Identität § 11 : 4.2 wegen ΔΓx (y) = 0 für y ∈ Ωr

Γx Δu dn y = (Γx ∂n u − u ∂n Γx ) do
Ωr ∂Ωr

(∗∗) = (Γx ∂n u − u ∂n Γx ) do
∂Ω

+ (Γx ∂n u − u ∂n Γx ) do .
∂Kr (x)
Im Fall n > 2 erhalten wir für y ∈ ∂Kr (x)

y−x
n(y) = − = äußerer Einheitsnormalenvektor von Ωr ,
r
Γx (y) = cn r 2−n mit cn = 1/(n − 2)ωn ,
cn (2 − n) cn (n − 2)
∇Γx (y) = (y − x) = n(y) nach (∗),
rn r n−1
∂n Γx (y) = n(y) , ∇Γx (y) = cn (n − 2) r 1−n .
Mit der Transformationsformel § 11 : 2.4 ergibt sich

Γx ∂n u do = r n−1 (Γx ∂n u)(x + rξ) do(ξ)
∂Kr (x) ∂K1 (0)

= cn r ∂n u(x + rξ) do(ξ) → 0 für r → 0 .
∂K1 (0)
Weiter folgt

u ∂n Γx do = r n−1 (u ∂n Γx )(x + rξ) do(ξ)
∂Kr (x) ∂K1 (0)

= u ∂n Γx do
∂Kr (x)

= r n−1 (u ∂n Γx )(x + rξ) do(ξ)
∂K1 (0)

= cn (n − 2) u(x + rξ) do(ξ)
∂K1 (0)
→ cn (n − 2)ωn u(x) für r → 0.

Unter Beachtung von lim Γx Δu dn y = Γx Δu dn y ergibt sich wegen der
r→0
Ωr Ω
Festlegung 1/cn = (n − 2) ωn die Behauptung aus (∗∗). Im Fall n = 2 erhalten
wir mit 1/c2 = − 2π das gleiche Ergebnis. 2
Aufgabe. Zeigen Sie, dass das Gravitationspotential U der Kugel KR (0) ⊂ Ê 3
mit der konstanten Massendichte μ gegeben ist durch

3GM x2 GM
U (x) = 1− für x ≤ R , U (x) = für x ≥ R ,
2R 3R2 x
wobei M = 43 πR3 μ die Gesamtmasse der Kugel ist.

Hinweis: Bestimmen Sie U als radiale Lösung U (x) = u(x) der Newtonschen
Gravitationsgleichung
−ΔU = 4π Gμ in KR (0) , ΔU = 0 außerhalb KR (0) ,
wobei lim U (x) = 0 und C1 –differenzierbarer Anschluss auf ∂KR (0) ver-
x→∞
langt werden. Dass dies die einzige Lösung ist, wird in 3.3 gezeigt.
2.5 Greensche Funktionen

Unser Ziel ist, für das 1. und 2. Randwertproblem Lösungsdarstellungen zu
gewinnen, indem wir Grundlösungen für − Δ mit passenden Randbedingun-
gen konstruieren. Für jedes x ∈ Ω sei Γx (y) = Γ(y − x) die Standard-
grundlösung von − Δ an der Stelle x und Hx ∈ C1n (Ω) ∩ C2 (Ω) eine harmoni-
sche Funktion, vgl. § 11 : 4.3*. Dann ist auch Gx := Γx + Hx eine Grundlösung
von −Δ in Ω , vgl. § 13 : 5.2. (Für C2 –berandete Gebiete lässt sich zeigen,
dass jede Grundlösung von − Δ so geschrieben werden kann.) Für jede solche
Grundlösung gilt die Greensche Darstellungsformel

u(x) = − Gx Δu dn y + (Gx ∂n u − u ∂n Gx ) do für x ∈ Ω,
Ω ∂Ω
und u ∈ C1n (Ω) ∩ C2 (Ω) (Green 1828). Diese folgt aus 2.4 (c) unter Berück-
sichtigung der Greenschen Identität § 11 : 4.3*:

Hx Δu dn y = (Hx Δu − u ΔHx ) dn y
Ω Ω

= (Hx ∂n u − u ∂n Hx ) do .
∂Ω
Um eine Lösungsformel für das erste Randwertproblem

− Δu = f in Ω , u = g auf ∂Ω
zu gewinnen, wählen wir die Randbedingungen für Gx so, dass auf der rechten
Seite der Greenschen Darstellungsformel nur die Daten f und g auftreten, nicht
aber die gesuchte Lösung u und deren Ableitungen.
Für das erste Randwertproblem stellen wir demgemäß die Randbedingung
Gx (y) = 0 für y ∈ ∂Ω , x ∈ Ω .
Ist diese erfüllt, so heißt G(x, y) = Gx (y) eine Greensche Funktion 1. Art
für Ω. Für eine solche und jede Lösung u ∈ C1n (Ω) ∩ C2 (Ω) des 1. RWP liefert
die Greensche Darstellungsformel dann

(1) u(x) = Gx f dn y − ∂n Gx g do für x ∈ Ω .
Ω ∂Ω
Umgekehrt erwarten wir, dass diese Formel tatsächlich eine Lösung liefert.
Um eine Green–Funktion für das 2. Randwertproblem aufzustellen, scheint auf
den ersten Blick die Forderung ∂n Gx = 0 auf ∂Ω zweckmäßig; man erhielte so
eine Lösungsdarstellung durch die Daten f und g. Dem entgegen steht jedoch
die Beziehung

∂n Gx do = −1 für x ∈ Ω ,
∂Ω
die sich aus der Greenschen Darstellungsformel durch Einsetzen der konstanten
Funktion u = 1 ergibt. Wir fordern daher lediglich ∂n Gx = c = const auf
∂Ω, was auf −1/c = do = An−1 (∂Ω) führt. Dementsprechend heißt eine
∂Ω
Grundlösung G eine Greensche Funktion 2. Art für Ω, wenn
1
∂n Gx (y) = −
An−1 (∂Ω)
für x ∈ Ω und jeden regulären Randpunkt y ∈ ∂Ω gilt.
Mit einer solchen liefert die Greensche Darstellungsformel für jede Lösung u ∈
C1n (Ω) ∩ C2 (Ω) des 2. Randwertproblems

(2) u(x) = Gx f dn y + Gx g do für x ∈ Ω, falls u do = 0 .
Ω ∂Ω ∂Ω
Satz. Sei G(x, y) = Gx (y) eine Greensche Funktion erster Art für ein be-
Ê
schränktes Gebiet Ω ⊂ n (n ≥ 2). Dann gilt
(a) G ist durch Ω eindeutig bestimmt,
(b) G(x, y) = G(y, x) für x, y ∈ Ω mit x = y (Symmetrie),
(c) Gx ist harmonisch in Ω \ {x} für x ∈ Ω,
(d) für x, y ∈ Ω mit x = y gilt
⎧
⎨ Γ(y − x) für n ≥ 3,
0 ≤ G(x, y) ≤
⎩ 1 log diam Ω für n = 2;
2π y − x
dabei ist diam Ω = sup {x − y | x, y ∈ Ω}.
Beweis.
(a) Für zwei Greenfunktionen F , G auf Ω ist Hx := Fx − Gx harmonisch
in Ω und stetig auf Ω , ferner gilt Hx = 0 auf ∂Ω. Aus dem Maximumprinzip
2.3 (a) folgt Hx = 0, d.h. Fx = Gx für jedes x ∈ Ω und somit F = G .
(b) Wir fixieren zwei beliebige Punkte x, y ∈ Ω mit x = y, setzen Ωr :=
Ω \ ( Kr (x) ∪ Kr (y) ) mit 0 < r 1 und verfahren wie beim Beweis für 2.4 (c):

0 = (Gx ΔGy − Gy ΔGx ) dn z
Ωr

= (Gx ∂n Gy − Gy ∂n Gx ) do
∂Kr (x)

+ (Gx ∂n Gy − Gy ∂n Gx ) do
∂Kr (y)
→ − Gy (x) + Gx (y) für r → 0 .
(c) Gx = Γx + Hx ist nach 2.4 (b) harmonisch in Ω \ {x}.

(d) Wir fixieren x, y ∈ Ω mit y = x . Wegen Gx (z) = Γx (z) + Hx (z) → ∞
für z → x gibt es ein r mit 0 < r < x − y und Gx (z) > 0 auf ∂Kr (x) . Da
Gx auf ∂Ω verschwindet, folgt Gx (y) ≥ 0 nach dem Maximumprinzip 2.3 (a),
angewandt auf Ωr = Ω \ Kr (x) .
Im Fall n ≥ 3 gilt Γx − Gx ≥ 0 auf ∂Ω . Nach dem Maximumprinzip für die
harmonische Funktion −Hx = Γx −Gx gilt diese Ungleichung dann auch in Ω .
Im Fall n = 2 wenden wir das Maximumprinzip auf die harmonische Funktion
−Hx + 1
2π
log(diam Ω) = Γx − Gx + 1
2π
log(diam Ω)
an. 2
Bemerkungen. Greensche Funktionen erster und zweiter Art existieren für

jedes beschränkte Gebiet Ω mit hinreichend glattem Rand, vgl. 5.1.
Können wir eine Green–Funktion explizit angeben (dies gelingt i.A. nur für
Gebiete mit starken Symmetrien), so liefern die Formeln (1),(2) Lösungen der
beiden Randwertprobleme, falls f und der Rand ∂Ω hinreichend glatt sind,
vgl. Abschnitt 5. Dies wird für die Laplace–Gleichung auf Kugeln im nächsten
Abschnitt durchgeführt. Im Fall n = 2 kann die Methode der konformen Ab-
bildung zur Konstruktion von Greenschen Funktionen verwendet werden, vgl.
Courant–Hilbert [2], Kap.5, §15.3.
2.6 Die Poissonsche Integralformel

(a) Für Kugeln Ω = KR (0) ⊂ Ê n
, n ≥ 2 ist die Greensche Funktion erster
Art gegeben durch
x
Γ(y − x) − Γ( R (y − x∗ )) für x = 0 ,
G(x, y) =
Γ(y) − Γ(R e) für x = 0.
Dabei ist Γ die Standardgrundlösung
für den Laplace–Operator − Δ,
R2
x∗ := x
x2 x∗
der Bildpunkt bei der Spiegelung von

x = 0 an der Sphäre ∂KR (0) und e
ein beliebiger Vektor der Länge 1.
Die nach 2.5 (b) bestehende Symmetrie
R x
G(x, y) = G(y, x) ist nicht auf den er-
sten Blick erkennbar. 0
Durch die Translation x → x − a
des Ê n
ergibt sich G(x − a, y − a)
als Greensche Funktion für die Kugel
KR (a) .
Beweis.
Sei Ω := KR (0). Für x = 0 ist
⎧
⎨ Rn−2 x2−n Γx∗ (y) für n ≥ 3
−Hx (y) =
⎩ Γx (y) + 1 log x für n = 2
∗ 2π R
wegen x∗ ∈ Ω harmonisch in einer Umgebung von Ω. Ferner ist Γ0 − G0 kon-
stant, also ist Hx = Gx − Γx für jeden festen Punkt x ∈ Ω harmonisch in einer
Umgebung von Ω. Offenbar gilt G0 (y) = 0 für y = R.
Für 0 = x ∈ Ω und y = R gilt

x 2
(∗) (y − x∗ ) = x2 + R2 − 2 x , y = x − y2 ,
R
also Gx (y) = 0 wegen der Kugelsymmetrie von Γ. 2
Lord Kelvin gewann 1845 die Greensche Funktion für Kugeln im 3 , indem Ê
er Gx als Potential zweier Punktladungen interpretierte, nämlich der Ladung
q = 1 im Punkt x = 0 und der Gegenladung q∗ = −R/x im Spiegelpunkt
x∗ :
Gx = q Γx + q∗ Γx∗ .
(b) Für den Poisson–Kern P (x, y) := − ∂n Gx (y) ( n = y/R ) der Kugel

KR (0) ergibt sich ÜA
R2 − x2
P (x, y) = für x < R , y = R .
ωn R y − xn
Aus der Greenschen Darstellungsformel 2.4 (1) folgt damit

Ist u harmonisch im Gebiet Ω ⊂ Ê n
(n ≥ 2) und Kr (0) ⊂ Ω, so gilt die
Poissonsche Integralformel

u(x) = P (x, y) u(y) do für x ∈ Kr (0) .
Sr (0)
Diese stellt das n–dimensionale Analogon zur Cauchyschen Integralformel der

Funktionentheorie dar und hat ähnlich weitreichende Konsequenzen; auf einige
gehen wir im folgenden Abschnitt ein.
(c) Wir verwenden die Poissonsche Integraldarstellung (wie schon in § 6 : 5.5

für n = 2) als Lösungsformel für das erste Randwertproblem:
Satz. Für jede stetige Funktion g auf ∂KR (0) besitzt das Randwertproblem
Δu = 0 in Ω = KR (0) , u = g auf ∂Ω
eine eindeutig bestimmte Lösung u ∈ C0 (Ω) ∩ C2 (Ω). Diese ist gegeben durch
die Poissonsche Integralformel
⎧ 2
⎨ R − x
⎪
2
g(y)
do(y) für x < R ,
u(x) = ωn R y − xn
⎪
⎩ SR (0)
g(x) für x = R .
Beweis.
(i) Sind u1 , u2 Lösungen, so ist v = u1 − u2 harmonisch mit Randwerten
Null. Aus dem Maximumprinzip 2.2 (a) folgt v = 0, also u1 = u2 .
(ii) Der Poisson-Kern

R2 − x2
x −→ P (x, y) =
ωn R y − xn
ist C∞ –differenzierbar und harmonisch in KR (0) für jedes y ∈ KR (0). Letz-
teres ergibt sich mit Hilfe der Rechenregeln (∗) von 2.4 ÜA .
Weil unter dem Integral differenziert werden darf, gilt dies auch für die durch
das Integral dargestellte Funktion u.

(iii) Es gilt P (x, y) do(y) = 1 für x ∈ KR (0) . Dies ergibt sich aus der
S R (x )
Greenschen Darstellungsformel mit der Funktion u = 1.
(iv) Für x, y ∈ KR (0) , x0 ∈ SR (0) mit x0 − y ≥ 2δ und x − x0 < δ

folgt y − x ≥ δ und
R2 − x2 = (R + x)(R − x) < 2 R (x0 − x) ≤ 2Rx − x0 .
Damit ergibt sich die Abschätzung
2x − x0
0 ≤ P (x, y) ≤ .
ωn δ n
(v) Wir zeigen lim u(x) = g(x0 ) für x0 ∈ ∂Ω = SR (0) . Zu gegebenem ε > 0
x→x0
wählen wir δ > 0 so, dass

g(y) − g(x0 ) < ε für y ∈ SR (0) und y − x0 < 2δ .
Wir setzen S1 := SR (0) ∩ K2δ (x0 ) , S2 := SR (0) \ K2δ (x0 ) und erhalten nach
(iii),(iv) für x ∈ KR (0) mit x − x0 < δ

| u(x) − u(x0 ) | = | u(x) − g(x0 ) | = P (x, y) (g(y) − g(x0 )) do(y)
S r (0 )

= P (x, y) (g(y) − g(x0 )) do(y) + P (x, y) (g(y) − g(x0 )) do(y)
S1 S2
4 g∞
≤ ε P (x, y) do(y) + x − x0 ωn Rn−1
S1
ωn δ n
≤ ε + 4Rn−1 δ −n g∞ x − x0 ≤ 2ε ,
wenn wir noch x − x0 hinreichend klein wählen. 2

(d) Aufgabe. Zeigen Sie: Ist u harmonisch in Ω und KR (a) ⊂ Ω , so gilt

u(x) = P (x − a, y − a) u(y) do(y)
SR (a)
mit dem in (b) definierten Poisson–Kern P . Machen Sie sich hierzu klar, dass

v(y) do(y) = v(a + y) do(y) ,
S R (a ) S R (0 )
und verwenden Sie die Translationsinvarianz des Laplace–Operators.

(e) Aufgabe. Bestimmen Sie die Green–Funktion 1. Art für
(i) das Quadrat Ω = ]0, 1[2 ⊂ Ê, 2
(ii) die Kugelschale Ω = {x ∈ Ê | 1 < x < 2} 3
durch (mehrfache) Anwendung der in (a) beschriebenen Kelvinschen Spiege-

lungsmethode.
2.7 Folgerungen aus der Poissonschen Integralformel

Wir leiten aus der Poissonschen Integralformel und der zugehörigen Lösungs-
formel 2.5 (b), (c) einige wichtige Eigenschaften harmonischer Funktionen her,
welche in Analogie zu denen holomorpher Funktionen stehen: Mittelwerteigen-
schaft, starkes Maximumprinzip, Entwickelbarkeit in Potenzreihen, Hebbarkeit
von Singularitäten und Satz von Liouville. Weiterführende Untersuchungen fin-
den sich in Dautray–Lions [4] Vol.1, Chapt. II.
(a) Die Mittelwerteigenschaft harmonischer Funktionen. Jede auf ei-
Ê
nem Gebiet Ω ⊂ n harmonische Funktion u hat die Mittelwerteigenschaft für
Sphären und Vollkugeln,
1
u(a) = n−1
u do für a ∈ Ω und R 1 ,
ωn R S (a )R
n
u(a) = n
u dn x für a ∈ Ω und R 1 ,
ω n R K (a )
R
Da nach § 11 : 2.4 (c) die Sphäre SR (a) den Oberflächeninhalt ωn Rn−1 hat und
die Kugel KR (a) das Volumen ωn Rn /n, bedeutet dies: Der Wert von u im
Mittelpunkt jeder Kugel KR (a) ⊂ Ω ist sowohl das Mittel der Werte von u
auf der Randsphäre als auch der Werte auf der Vollkugel.
Beweis.
Wegen der Translationsinvarianz des Laplace–Operators sowie des Oberflächen–
und Volumenintegrals dürfen wir o.B.d.A. a = 0 annehmen, vgl. 2.6 (d). Die
erste Formel ergibt sich dann unmittelbar aus der Poissonschen Integralformel.
Mit zwiebelweiser Integration (§ 11 : 2.4 (b)) folgt hieraus
ωn n R R
R u(0) = ωn r n−1 u(0) dr = ( u do) dr = u dn x . 2
n 0 0 Sr (0) KR (0)
(b) Das strenge Maximumprinzip für subharmonische Funktionen.

Wir nennen u ∈ C0 (Ω) subharmonisch, wenn
1
u(a) ≤ n−1
u do für a ∈ Ω und R 1 .
ωn R S (a )
R
Hieraus folgt mit zwiebelweiser Integration analog zu (a)

n
u(a) ≤ u dn x für a ∈ Ω und R 1 .
ω n R n K (a )
R
Satz. Jede Funktion u ∈ C2 (Ω) mit Δu ≥ 0 ist subharmonisch.
Beweis.
Sei a ∈ Ω , o.B.d.A. a = 0 und KR (0) ⊂ Ω . Nach 2.6 (c) gibt es eine har-
monische Funktion v auf KR (0) mit den gleichen Randwerten wie u, und es
gilt
1
v(0) = u do .
ωn Rn−1 S (0)
R
Das auf die subharmonische Funktion u−v angewandte Maximumprinzip 2.3 (a)
liefert u(0) − v(0) ≤ max (u − v) = 0, also ist
S R (0 )
1
u(0) ≤ u do . 2
ωn Rn−1 S (0)
R
Strenges Maximumprinzip. Nimmt eine auf einem Gebiet Ω ⊂ Ê n

sub-
harmonische Funktion u ein Maximum in Ω an, so ist sie konstant.
Hieraus ergibt sich der noch ausstehende Beweis von 2.3 (b), denn ist u auf Ω
harmonisch, so sind nach dem vorangehenden u und −u subharmonisch.
Beweis.
Es existiere M = max {u(x) | x ∈ Ω}, und u sei nicht konstant. Dann gibt es
Punkte x0 , x1 ∈ Ω mit u(x0 ) = M , u(x1 ) < M . Wir verbinden diese durch
einen Weg ϕ : [0, 1] → Ω und setzen s := sup { t ∈ [0, 1] | u(ϕ(t)) = M } . Für
a := ϕ(s) gilt dann u(a) = M , und in jeder Kugel KR (a), deren Abschluss in
Ω liegt, gibt es Punkte x mit u(x) < M . Diese bilden eine offene Menge, also
gilt
n
u dn x < M = u(a)
ωn Rn K (a)
R
im Widerspruch zur oben bewiesenen Mittelwertgleichung für Vollkugeln. 2
Eine unmittelbare Folgerung hieraus sind die beiden folgenden Aussagen.

Das schwache Maximumprinzip. Für jede auf einem beschränkten Gebiet
Ê
Ω ⊂ n subharmonische Funktion u ∈ C0 (Ω) gilt
u ≤ max u .
∂Ω
Maximumprinzip für holomorphe Funktionen. Ist f auf dem Gebiet Ω ⊂

holomorph und nicht konstant, so nimmt |f | dort kein Maximum an.
Denn |f |2 ist reellwertig und subharmonisch ÜA .
(c) Charakterisierung harmonischer Funktionen durch die Mittel-

werteigenschaft. Jede auf Ω ⊂ n stetige Funktion mit der sphärischen Mit-
telwerteigenschaft 2.7 (a) ist harmonisch.
Beweis.
Es reicht, die Harmonizität von u in einer Umgebung jedes Punktes a ∈ Ω
nachzuweisen. Sei also a ∈ Ω, KR (a) ⊂ Ω und v die nach 2.6 (c) existierende
harmonische Funktion auf KR (a) mit den gleichen Randwerten wie u. Nach (a)
hat auch w := v − u die sphärische Mittelwerteigenschaft. Angenommen, es gilt
w = 0. Wegen w = 0 auf ∂KR (a) nimmt w ein Maximum oder Minimum in
KR (a) an, ist also nach (b) konstant, Widerspruch! Somit ist u = v auf KR (a)
harmonisch. 2
(d) Analytizität harmonischer Funktionen. Jede auf einem Gebiet Ω ⊂

n harmonische Funktion u ist dort reell–analytisch, d.h. zu jedem Punkt x0 ∈
Ω gibt es ein r > 0, so dass u in Kr (x0 ) ⊂ Ω in eine Potenzreihe entwickelbar
ist ( α durchläuft alle Multiindizes, vgl. § 10 : 2.2):
1 α
u(x) = aα (x − x0 )α mit aα = ∂ u(x0 ) .
α!
α
Beweisskizze.
u ist C∞ –differenzierbar, denn nach 2.6 (b) und (d) ist jede durch das Poisson–
Integral darstellbare Funktion auf Kugeln C∞ –differenzierbar. Aufgrund der
Translationsinvarianz des Laplace–Operators dürfen wir x0 = 0 ∈ Ω annehmen.
Wir wählen R > 0 mit K2R (0) ⊂ Ω. Die Taylorentwicklung von u in KR (0)
im Ursprung lautet
1 1
u(x) = ∂ α u(0) xα + Rm (x) mit Rm (x) = ∂ α u(ϑx) xα
α! α!
|α|<m |α|=m
mit geeignetem ϑ ∈ ]0, 1[. Zu zeigen ist lim Rm (x) = 0.

m→∞
Wegen u ∈ C∞ (Ω) sind alle Ableitungen ∂ α u harmonisch. Aus der Mittel-

werteigenschaft für ∂i u und dem Gaußschen Satz folgt
n n
∂i u(x) = n
∂i u(y) dn y = n
u(y) n , ei do(y) ,
ωn R K (x) ωn R S (x)
R R
n
| ∂i u(x) | ≤ M mit M = max {|u(y)| | y ≤ R} .
R
Nach diesem Prinzip ergibt sich durch trickreiche Abschätzungen und Induktion
nach m (siehe Dibenedetto [59] II.5)
M (n e)m
| ∂ α u(x) | ≤ m! für |α| = m und x ≤ R .
e Rm
Wählen wir nun r = R/(2n2 e) , so gilt für x ≤ r wegen | xα | ≤ xm
M ne m m m
M n2 e M 1
| Rm (x) | ≤ rm = rm ≤ . 2
e R e R e 2
|α|=m
(e) Hebbarkeit von Singularitäten (H. A. Schwarz 1872). Sei Ω ⊂ n Ê

(n ≥ 2) ein Gebiet, a ∈ Ω und u eine in Ω\{a} harmonische Funktion. Wächst
u(x) für x → a schwächer als die Standardgrundlösung Γa (x) = Γ(x − a),
u(x)
lim = 0,
x →a Γa (x)
so kann u zu einer harmonischen Funktion auf ganz Ω fortgesetzt werden.
Das ist insbesondere der Fall, wenn u in einer Umgebung von a beschränkt
ist. Dass die Wachstumsbedingung nicht abgeschwächt werden kann, zeigt das
Beispiel u(x) = Γa (x).
Beweis.
Sei o.B.d.A. a = 0. Wir wählen ein R > 0 mit KR (0) ⊂ Ω und weisen nach,
dass u in KR (0) \ {0} mit der nach 2.6 (c) existierenden Lösung v von
Δv = 0 in KR (0) , v=u auf ∂KR (0)
übereinstimmt. Wir zeigen dies zuerst für n ≥ 3.
Hierzu fixieren wir x0 ∈ KR (0) \ {0} und setzen zu gegebenem ε > 0

ε
h(x) := x2−n − R2−n mit a := x0 2−n − R2−n .
a
v ist auf KR (0) beschränkt. Weiter ist h nach Satz 2.4 harmonisch in Ê n
\ {0},
und es gilt lim xn−2 u(x) = 0. Daher gibt es ein r > 0 mit
x →0
ε
r n−2
|u(x)| ≤ auf KR (0) ,
4a
ε 2−n
| v(x) | ≤ r auf KR (0) ,
4a
r n−2 1
r < x0 < R und ≤ .
R 2
Hieraus folgt
|u − v| = 0 = h auf ∂KR (0) ,

n−2
ε 2−n ε 2−n r
|u − v| ≤ |u| + |v| ≤ r ≤ r 1−
2a a R
ε 2−n
= r − R2−n = h auf ∂KR (0) ,
a
d.h. auf dem Rand der Kugelschale KR (0) \ Kr (0) gilt
−h ≤ u − v ≤ h .
Nach dem Maximumprinzip besteht diese Ungleichung auch im Innern dieser

Kugelschale, insbesondere gilt für jedes ε > 0
| u(x0 ) − v(x0 ) | ≤ h(x0 ) = ε .
Im Fall n = 2 verwenden wir als harmonische Majorante
log(R/x)
h(x) := ε
log(R/x0 )
und argumentieren ganz entsprechend. 2
(f) Verallgemeinerter Satz von Liouville. Jede auf dem Ên

harmonische
Æ
Funktion u, welche für ein m ∈ 0 der Wachstumsbedingung
| u(x) | ≤ c (1 + xm ) für alle x ∈ Ê n
mit c ≥ 0 genügt, ist ein Polynom höchstens m–ten Grades.

Beweisskizze.
Wir wählen 0 < r < R und wenden die Poissonsche Darstellungsformel 2.6 (b)
auf u und die R–Sphäre SR (0) an. Durch mehrfache Differentiation ergibt sich
nach etwas mühseliger Rechnung die Abschätzung
1 + Rm
| ∂ α u(x) | ≤ KRn für x < r
(R − r)n+| α |
mit einer Konstanten K = K(n, α) > 0. Für jeden Multiindex α mit | α | =
m + 1 folgt hieraus nach Grenzübergang R → ∞ das Verschwinden von ∂ α u
auf jeder Kugel Kr (0) und damit auf dem ganzen n , was die Behauptung Ê
liefert. 2
2.8 Die Kelvin–Transformation

Die Kelvin–Transformation ermöglicht, Außenraumaufgaben in Innenraumauf-
gaben zu überführen.
(a) Die Spiegelung an der R–Sphäre,
h : Ên
\ {0} → Ê n
\ {0} , x → x∗ := R2
x 2
x,
ist ein Diffeomorphismus mit h ◦ h = ½ ÜA . Für jedes Gebiet Ω ⊂ Ên ist
daher die Bildmenge Ω∗ := h(Ω \ {0}) ein Gebiet, und es gilt Ω∗∗ = Ω \ {0}.
Für jede Funktion u : Ω → Ê definieren wir die Kelvin–Transformierte
u∗ : Ω∗ → Ê durch
n−2
R
u∗ (x) := x u(x∗ ) für x ∈ Ω∗ .
Satz. Es gilt u∗∗ = u auf Ω \ {0}.

Ist u harmonisch in Ω , so ist u∗ harmonisch in Ω∗ .
Beweis.
Die erste Behauptung folgt nach einfacher Rechnung aus den Definitionen von
x∗ und u∗ .
Die zweite Behauptung beruht auf der Beziehung
n+2
R
Δu∗ (x) = x Δu(x∗ ) für u ∈ C2 (Ω), x ∈ Ω \ {0} ,
die sich nach den Rechenregeln (∗) in 2.4 ergibt, ÜA . 2
(b) Beispiel. Das Außenraumproblem in Ω \ KR (0) besitzt die Lösungsdar-

stellung

x2 − R2 g(y)
u(x) = do(y) für x > R .
ωn R y − xn
S R (0 )
Nachweis als ÜA unter Verwendung der Beziehung (∗) in 2.6.

(c) Das Außenraumproblem
Δu = 0 für x > 1 , u(x) = 0 für x = 1
hat zwei verschiedene Lösungen: Die Funktion u1 = 0 und

1 − x2−n für n > 2 ,
u2 (x) =
log x für n = 2 .
Für die eindeutige Lösbarkeit des Dirichletschen Außenraumproblems muss da-

her eine zusätzliche Bedingung gestellt werden:
Wir nennen eine harmonische Funktion u in einem Außenraum Ω ⊂ Ê n
(n ≥ 2)
regulär im Unendlichen, wenn
lim u(x) = 0 im Fall n > 2 ,

x→∞
u(x) beschränkt ist für x 1 im Fall n = 2 .
Satz. Ist u in einem Außenraum Ω ⊂ Ê n

(n ≥ 2) harmonisch und regulär im
Unendlichen, so gilt:
(i) Die Kelvin–Transformierte u∗ bezüglich einer Sphäre kann zu einer har-
monischen Funktion auf Ω∗ ∪ {0} fortgesetzt werden.
(ii) Es gibt Konstanten c0 , c1 ≥ 0 mit
c0 c1
| u(x) | ≤ , ∇u(x) ≤ für x 1 (n > 2) ,
xn−2 xn−1
c1
∇u(x) ≤ für x 1 (n = 2) .
x2
Beweis.
(i) Wir spiegeln an der Einheitssphäre (R = 1). Nach Voraussetzung gilt
xn−2 u∗ (x) = u(x∗ ) → 0 für x → 0 im Fall n > 2,

u∗ (x)
= u(x∗ ) ≤ M
→ 0 für x → 0 im Fall n = 2 ,
log x log x | log x |
d.h. die harmonische Funktion u∗ wächst für x → 0 schwächer als die Grund-
lösung. Nach dem Hebbarkeitssatz 2.7 (e) gibt es daher eine auf Ω∗ ∪ {0} har-
monische Funktion v mit u∗ = v auf Ω∗ .
(ii) Wählen wir > 0 mit K (0) ⊂ Ω∗ ∪ {0}, so gibt es für die C2 –dif-
ferenzierbare Funktion v Zahlen a, b ≥ 0 mit
| v(y) | ≤ a , ∇v(y) ≤ b für y ≤ .
Mit x∗ = x/x2 = h(x) ergibt sich
u(x) = u(x∗∗ ) = x∗ n−2 u∗ (x∗ ) = x2−n(v ◦ h)(x) .
Hieraus folgt für r = x ≥ 1/
| u(x) | = | v(x∗ ) | r2−n ≤ a r 2−n .
Weiter ergibt sich aus u = r 2−n (v ◦ h) mit den Rechenregeln (∗) in 2.4
∇u = (2 − n) r−n (v ◦ h) x + r 2−n ((∇v) ◦ h) dh =: (n − 2) a + b
und damit die Abschätzungen

√
a ≤ a r 1−n , b ≤ b n r −n .
Die letzte Ungleichung folgt dabei aus

n
1 2xi xk n
∂i hk (x) = 2 δik − 2 , dh(x)22 = (∂i hk (x))2 = . 2
r r r4
i,k=1
2.9 Ein Beispiel für das Verhalten harmonischer Funktionen in Ecken

Das folgende Beispiel ist typisch für das Randverhalten harmonischer Funktio-
nen in Gebieten mit Ecken. Es illustriert auch die zum Randpunktlemma 2.3 (c)
gemachten Bemerkungen.
Für 0 < Θ < 2π betrachten wir auf dem Kreissektor

Ω = (r cos ϕ, r sin ϕ) 0 < r < 1 , 0 < ϕ < Θ
das Randwertproblem
⎧
⎪ Δu = 0 in Ω ,
⎨
u = 0 auf den beiden radialen Randstücken,
⎪
⎩
u(cos ϕ, sin ϕ) = − sin(πϕ/Θ) für 0 < ϕ < Θ .
Für die Lösung u machen wir einen Produktansatz bezüglich Polarkoordinaten:
u(r cos ϕ, r sin ϕ) = v(r) w(ϕ) .

Analog zu § 6 : 5.2,5.3 ergeben sich die Bedingungen

⎧
⎨ v (r) + 1 v (r) − λ v(r) = 0 für r > 0 ,
r r 2
(a)
⎩ lim v(r) = 0 , v(1) = 1,
r→0
⎧
⎪
⎨ w (ϕ) + λ w(ϕ) = 0 für 0 < ϕ < Θ ,
(b) w(ϕ) = − sin(πϕ/Θ) für 0 < ϕ < Θ ,
⎪
⎩
w(0) = w(Θ) = 0 .
Es ergibt sich λ = (π/Θ)2 √und für die Lösung der Eulerschen DG (a) (vgl.
§ 4 : 4.2) v(r) = r p mit p = λ = π/Θ . Somit lautet die Lösung des Randwert-
problems
u(x) = − r p sin(p ϕ) .
Wegen u < 0 in Ω wird das Maximum von u genau im Nullpunkt angenom-
men. Für Θ ≥ π ist die Voraussetzung (i) des Randpunktlemmas 2.3 (c) erfüllt.
Tatsächlich gilt dann für v := −(cos ψ, sin ψ) mit 0 < ψ < Θ
(
u(tv) − u(0) ∞ für Θ > π ,
lim = lim tp−1 sin(p ψ) =
t→0+ t t→0+ sin(p ψ) > 0 für Θ = π .
Im Fall Θ > π folgt u ∈ C1 (Ω) , weil lim u(tv) , v nicht existiert. Im Fall
t→0+
∞
Θ = π ist dagegen u(x, y) = −y eine C –differenzierbare Funktion. Für Θ < π
besitzt der Kreissektorrand im Ursprung eine nach außen weisende Ecke. Hier
gilt
1
lim (u(tv) − u(0)) = 0 .
t→0+ t
Es ist nicht schwer zu sehen, dass lim ∇u(x) = 0 und u ∈ C1 (Ω).
Ω x→0
3 Eindeutigkeit von Lösungen

3.1 Dirichlet–Problem (Erstes Randwertproblem)
Satz. Das Dirichlet–Problem für ein beschränktes Gebiet Ω ⊂ Ên
− Δu = f in Ω , u = g auf ∂Ω
mit gegebenen Funktionen f ∈ C0 (Ω) , g ∈ C0 (∂Ω) besitzt höchstens eine Lö-

sung u ∈ C0 (Ω) ∩ C2 (Ω) .
Der Beweis ergibt sich unmittelbar durch Anwendung des Maximumprinzips

2.1 (a) auf die Differenz zweier Lösungen.
3 Eindeutigkeit von Lösungen 347
Satz. Das Dirichlet–Problem für einen Außenraum Ω ⊂ Ê n

(n ≥ 2),
−Δu = f in Ω , u = g auf ∂Ω , u regulär im Unendlichen,
mit gegebenen Funktionen f ∈ C0 (Ω) , g ∈ C0 (∂Ω) besitzt höchstens eine Lö-

sung u ∈ C0 (Ω) ∩ C2 (Ω) .
Die Zusatzbedingung der Regularität im Unendlichen ist unentbehrlich für die
Ê
Eindeutigkeit der Lösung. Dies wurde für den Fall Ω = n \ Kr (0) in 2.8 (b)
gezeigt. Auch im Beispiel 2.9 ist keine Eindeutigkeit gegeben.
Beweis.
Ê
O.B.d.A. dürfen wir 0 ∈ n \ Ω annehmen. Für zwei Lösungen u1 , u2 sei u∗
die Kelvin–Transformierte von u = u1 − u2 . Nach 2.8 (c) lässt sich u∗ zu einer
auf dem Innenraum Ω∗ ∪ {0} harmonischen Funktion v fortsetzen, und es gilt
v(x) = u∗ (x) = 0 auf dem Rand dieses Gebiets. Der vorangehende Satz liefert
v = 0 , insbesondere u∗ = 0 auf Ω∗ und somit u = u∗∗ = 0 auf Ω. 2
3.2 Neumann–Problem (Zweites Randwertproblem)

Ê
Ω ⊂ n (n ≥ 2) sei ein C2 –berandeter Innen– oder Außenraum mit äußerem
Normalenfeld n. Die auf den Ergebnissen 5.2 der Potentialtheorie beruhenden
Existenzbeweise zeigen, dass wir für das Neumann–Problem die Randableitung
∂n u in folgendem Sinn zu definieren haben:
∂n u(x) := lim ∇u(x − tn(x)) , n(x) gleichmäßig für x ∈ ∂Ω .

t→0+
Die Greensche Integralformel für den Raum C1n (Ω) dieser Funktionen wurde in
§ 11 : 4.3* bewiesen.
Satz. Das Neumann–Problem auf einem Innenraum Ω,
−Δu = f in Ω , ∂n u = g auf ∂Ω
mit gegebenen stetigen Funktionen f, g besitzt bis auf additive Konstanten höch-
stens eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω).
Bemerkungen. (i) Als notwendige Bedingung für die Lösbarkeit ergibt sich
nach 5.1 (c)

f dn x + g do = 0 .
Ω ∂Ω
(ii) Die eindeutige Lösbarkeit erhalten wir durch zusätzliche Vorgabe des Mit-
telwerts von u auf Ω oder auf ∂Ω.
Beweis.
Für die Differenz u zweier Lösungen gilt nach § 11 : 4.3*

∇u2 dn x = u ∂n u do = 0 ,
Ω ∂Ω
also u = const. 2
Satz. Das Neumann–Problem für einen Außenraum Ω ⊂ Ê n

(n ≥ 2),
− Δu = f in Ω , ∂n u = g auf ∂Ω , u regulär im Unendlichen,
mit gegebenen stetigen Funktionen f, g besitzt für n > 2 höchstens eine Lösung
u ∈ C1n (Ω) ∩ C2 (Ω) ; im Fall n = 2 ist die Lösung bis auf additive Konstanten
eindeutig bestimmt.
Beweis.
Für die Differenz u zweier Lösungen gilt u ∈ C1n (Ω) ∩ C2 (Ω),
Δu = 0 in Ω , ∂n u = 0 auf Ω , u regulär im Unendlichen.
Wir wählen R 1 mit ∂Ω ⊂ Kr (0) . Dann gilt nach § 11 : 4.3* für das be-
schränkte Gebiet ΩR = Ω ∩ KR (0)

∇u2 dn x = u ∂n u do = u ∂n u do + u ∂n u do
ΩR ∂ΩR ∂Ω S R (0 )

= u ∂n u do .
SR (0)
Dabei gelten nach 2.8 mit R = x die Abschätzungen
| u(x) | ≤ c0 /Rn−2 , ∇u(x) ≤ c1 /Rn−1 für n > 2,

| u(x) | ≤ c0 , ∇u(x) ≤ c1 /R2 für n = 2.
Es folgt
(
ωn c0 c1 /Rn−2 für n > 2,
∇u2 dn x ≤
ΩR ω2 c0 c1 /R für n = 2.
Nach dem Ausschöpfungssatz Bd. 1, § 23 : 4.7 ergibt sich

∇u2 dn x = lim ∇u2 dn x = 0 ,
R→∞
Ω ΩR
somit ∇u = 0 in Ω . Damit ist u konstant, und wegen lim u(x) = 0 für

x→∞
n > 2 folgt die Behauptung. 2
4 Existenz von Lösungen: Perron–Methode 349
3.3 Das Ganzraumproblem

Sei Ω ⊂ Ê n
(n ≥ 2) ein beschränktes Gebiet und f ∈ C0 (Ω).
Satz. Das Ganzraumproblem

− Δu = f in Ω , − Δu = 0 in Ê n
\ Ω,
lim u(x) = 0
x→∞
besitzt höchstens eine Lösung u ∈ C1 ( Ê ) ∩ C (Ê

n 2 n
\ ∂Ω).
Beweis.
Für die Differenz u zweier Lösungen gilt u ∈ C1 ( Ê ) ∩ C (Ê
n 2 n
\ ∂Ω),
Δu = 0 in Ê n
\ ∂Ω und lim u(x) = 0 .
x→∞
Wir wählen R > 0 mit Ω ⊂ KR (0) und erhalten aus § 11 : 4.3* (d), angewandt
auf die Gebiete KR (0), KR (0) \ Ω

∇u2 dn x = ∇u2 dn x + ∇u2 dn x = u ∂n u do ,
KR (0) Ω KR (0)\Ω S R (0 )
weil sich die beiden Randintegrale über ∂Ω wegheben. Dabei ist zu beachten,
dass C1 (Ω) ⊂ C1n (Ω), entsprechendes für KR (0) \ Ω. Der Rest des Beweises
erfolgt wie in 3.2 mit dem Ergebnis u = const = c , c = lim u(x) = 0. 2
x→∞
4 Existenz von Lösungen: Perron–Methode

4.1 Vorbemerkungen zur Existenztheorie
Im folgenden stellen wir drei Beweismethoden für die Existenz von Lösungen
vor: Die Perron–Methode, die Integralgleichungsmethode und die Variationsme-
thode. Jede hat ihre eigene Berechtigung und ihre Besonderheiten in Bezug auf
Voraussetzungen an die Daten, beweistechnischen Aufwand und Tragweite.
Bei allen Methoden müssen Bedingungen an den Rand ∂Ω gestellt werden,
um die stetige Annahme der vorgegebenen Randwerte durch die Lösung zu
gewährleisten. Die Notwendigkeit solcher Bedingungen zeigt ein Beispiel von
Lebesgue (1913), in dem ein Gebiet im 3
Ê
mit einer scharfen, nach innen
weisenden Spitze ( Lebesgue–Stachel“) und Randwerte angegeben werden, für
”
welche das Dirichlet–Problem keine Lösung besitzt, siehe Courant–Hilbert
[3], Kap.4, §4.4.
Die Perron–Methode benötigt den geringsten technischen Aufwand, sie ist je-
doch auf das 1. Randwertproblem für die Laplace–Gleichung Δu = 0 be-
schränkt (und allgemeiner auf eine homogene elliptische Gleichung Lu = 0 ).
An den Gebietsrand werden hierbei nur schwache Bedingungen gestellt.
Die Integralgleichungsmethode beruht auf der Darstellung der Lösung durch

Volumenpotentiale auf Ω und Oberflächenpotentiale auf ∂Ω. Die Oberflächen-
potentiale müssen hierbei Integralgleichungen im Funktionenraum C0 (∂Ω) erfül-
len. Diese Methode ist auf Innen– und Außenraumgebiete sowohl für das erste als
auch das zweite Randwertproblem anwendbar. Wesentliche Voraussetzung für
die Anwendbarkeit der Integralgleichungsmethode ist die Glattheit des Randes
∂Ω.
Die Variationsmethode geht von der Tatsache aus, dass jede Lösung eines Rand-
wertproblems die Minimumstelle eines Integralausdrucks, des Dirichlet–Integrals
ist. Beim Existenzbeweis wird zunächst der Definitionsbereich des Dirichlet–
Integrals zu einem Hilbertraum so vervollständigt, dass die Existenz einer Mini-
mumstelle des Dirichlet–Integrals leicht nachweisbar ist. Von der hiermit gefun-
denen schwachen Lösung ist in einem zweiten Schritt zu zeigen, dass sie auch
eine klassische Lösung des gegebenen Randwertproblems ist (Regularitätsbe-
weis).
Die Variationsmethode erweist sich als sehr ausbaufähig, sie ist insbesondere
auch auf nichtlineare und vektorwertige Probleme anwendbar, siehe Bd. 3, § 6.
Läßt die Problemstellung keine klassischen Lösungen zu (z.B. wenn die Differen-
tialgleichung unstetige Koeffizienten besitzt), so liefert die Variationsmethode
den Hinweis auf einen adäquaten Lösungsbegriff.
4.2 Der Existenzsatz von Perron

(a) Der Rand eines Gebiets Ω erfüllt die äußere Kegelbedingung, wenn
jeder Randpunkt die Spitze eines außerhalb von Ω liegenden Kegelstücks ist:
Zu jedem a ∈ ∂Ω gibt es einen Vektor e der Länge 1, einen Winkel Θ mit
0 < Θ < π/2 und ein r > 0, so dass das Kegelstück

K = a + tv v cos Θ ≤ v , e , v ≤ r
mit Ω nur den Punkt a gemeinsam hat.

Durch diese Bedingung werden einspringenden Spitzen mit Winkel 0 (Lebesgue–
Stachel s.o.) ausgeschlossen. C2 –berandete und konvexe Gebiete erfüllen die
äußere Kegelbedingung.
Wir sprechen von einer gleichmäßigen äußeren Kegelbedingung, wenn Θ
und r unabhängig vom Randpunkt a gewählt werden können.
(b) Existenz– und Eindeutigkeitssatz. Das Dirichlet–Problem
Δu = 0 in Ω , u = g auf ∂Ω
mit gegebener Funktion g ∈ C0 (∂Ω) besitzt für ein beschränktes Gebiet Ω mit
äußerer Kegelbedingung genau eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).
4 Existenz von Lösungen: Perron–Methode 351
(c) Den auf Perron (1923) zurückgehenden Beweis finden Sie u.a. in Gil-
barg–Trudinger [79] 2.8, Dibenedetto [59] II.6. Wir begnügen uns mit der
Wiedergabe der Grundidee.
Ausgangspunkt ist folgender Sachverhalt: Ist u eine Lösung und v ∈ C0 (Ω)
eine subharmonische Funktion mit v ≤ g auf ∂Ω, so gilt v ≤ u auf ganz Ω.
Das folgt aus dem schwachen Maximumprinzip 2.7 (b) für die nach 2.7 (a),
2.7 (b) subharmonische Funktion v − u . Bezeichnet SLg (Ω) die Gesamtheit
aller subharmonischen Funktionen v ∈ C0 (Ω) mit v ≤ g auf ∂Ω (SL steht für
Sublösung), so gilt also
(∗) u(x) = sup { v(x) | v ∈ SLg (Ω)} für x ∈ Ω .
Beim Existenzbeweis wird umgekehrt durch (∗) eine Funktion u definiert, von
der sich zeigen lässt, dass sie harmonisch ist. Dies wird mit der Vorstellung
plausibel, dass aus der Mittelwertungleichung 2.7 (b) für subharmonische Funk-
tionen durch die Supremumsbildung die Mittelwertgleichung für u folgt, durch
welche nach 2.7 (c) harmonische Funktionen charakterisiert sind.
Die stetige Annahme der Randwerte durch die Funktion u lässt sich bei Gültig-
keit der äußeren Kegelbedingung beweisen; dabei werden für jeden Randpunkt
sogenannte Barriere–Funktionen konstruiert Dautray–Lions ([4] Vol.II, Ch. 2,
§ 4.1, Example 9).
Folgerung. Für jeden C2 –berandeten Außenraum Ω ⊂ Ê n

hat das Dirichlet–
Problem
Δu = 0 in Ω , u = g auf ∂Ω ,
u regulär im Unendlichen.
mit gegebener Funktion g ∈ C0 (∂Ω) genau eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).
Beweis.
Ê
als ÜA : Nehmen Sie o.B.d.A. 0 ∈ n \ Ω an. Verwenden Sie die Kelvin–Trans-
formation und zeigen Sie, dass der Rand des gespiegelten Gebiets Ω∗ ebenfalls
C2 –differenzierbar ist. 2
4.3 Beispiel für ein unlösbares Dirichlet–Problem

Ê
Die gelochte Kugel Ω = K1 (0) \ {0} ⊂ n (n ≥ 2) erfüllt die äußere Kegelbe-
dingung im isolierten Randpunkt 0 nicht.
Das Dirichlet–Problem
Δu = 0 in Ω , u = 0 auf S1 (0) , u(0) = 1
besitzt auch keine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).

Denn eine solche wäre beschränkt und könnte daher nach 2.7 (e) zu einer auf
K1 (0) harmonischen Funktion v ∈ C0 (K1 (0)) fortgesetzt werden. Für diese
wäre aber das Maximumprinzip 2.3 (a) verletzt.
5 Existenz von Lösungen: Integralgleichungsmethode

5.1 Überblick: Existenz und Konstruktion von Lösungen
In diesem Abschnitt beschreiben wir das klassische Verfahren, Lösungen des
Dirichlet– und des Neumann–Problems für den Laplace–Operator in Form von
Potentialen zu gewinnen. Dieses orientiert sich an der physikalischen Vorstel-
lung, dass Gravitationsfelder und elektrische Felder durch Massen-, bzw. La-
dungsverteilungen erzeugt werden. Es gestattet eine einheitliche Behandlung
des Dirichlet– und des Neumann–Problems sowohl für Innenräume als auch für
Außenräume. Als Nebenresultat ergibt sich die Existenz der Green–Funktion
erster und zweiter Art. Die Methode macht wesentlichen Gebrauch von den Er-
gebnissen der Potentialtheorie und der Integralgleichungstheorie auf dem Funk-
tionenraum C0 (∂Ω).
In diesem Abschnitt wird vorausgesetzt, dass Ω ein beschränktes Gebiet des
Ê n
(n ≥ 2) mit C2 –differenzierbarem, wegzusammenhängendem Rand ∂Ω ist.
Wir geben zunächst eine Übersicht über die Ergebnisse und Beweisschritte und
gehen anschließend ins Detail.
(a) Das Dirichlet–Problem für einen Innenraum Ω,
− Δu = f in Ω , u = g auf ∂Ω mit f ∈ C1 (Ω), g ∈ C0 (∂Ω)
besitzt eine eindeutig bestimmte Lösung u ∈ C0 (Ω)∩C2 (Ω). Im Fall g ∈ C1 (∂Ω)
gilt zusätzlich u ∈ C1 (Ω). Die Lösung setzt sich in der unten beschriebenen
Weise aus einem Volumenpotential und dem Potential einer Dipolbelegung auf
∂Ω zusammen.
Folgerung. Es existiert eine Greensche Funktion erster Art.
Bemerkung. Die Voraussetzung f ∈ C1 (Ω) kann zur Forderung der Hölder–
Stetigkeit auf Ω abgeschwächt werden, vgl. Gilbarg–Trudinger [79] 6.3. Für
nur stetige Funktionen f braucht das Randwertproblem keine klassische Lösung
zu besitzen.
Der Beweis verläuft in folgenden Schritten:

(i) Abkopplung der Inhomogenität. Für das Volumenpotential

U (x) := Γx (y) f (y) dn y
Ω
mit der Grundlösung Γ ergibt sich U ∈ C2 (Ω), −ΔU = f in Ω , ΔU = 0 in

Ên
\ Ω ; Näheres hierzu in 5.2. Löst v ∈ C0 (Ω) ∩ C2 (Ω) das Problem
Δv = 0 in Ω , v = g − U auf ∂Ω ,
5 Existenz von Lösungen: Integralgleichungsmethode 353
so löst u = v + U das Ausgangsproblem. Es genügt also, den oben genannten

Satz für das Randwertproblem
(H) Δu = 0 in Ω , u = g auf ∂Ω
zu zeigen. Ist dies geleistet, so ergibt sich die Green–Funktion Gx = Γx + Hx

aus der Lösung Hx des Problems Δu = 0 in Ω, u = −Γx auf ∂Ω. Wegen
Γx ∈ C1 (∂Ω) ist dann Hx ∈ C1 (Ω) ∩ C2 (Ω) .
(ii) Für die Lösung u von (H) wird der Ansatz

u(x) = ∂n Γx · ν do mit ν ∈ C0 (∂Ω)
∂Ω
gemacht. Physikalisch entspricht dies dem Potential einer Dipolbelegung ν auf

∂Ω . Die Eigenschaften von Flächenpotentialen werden in 5.2 beschrieben, ins-
besondere ergibt sich aus der Sprungeigenschaft der Doppelschichtpotentiale

2 ∂n Γx · ν do − ν(x) = 2g(x) für x ∈ ∂Ω .
∂Ω
Dies ist eine Integralgleichung für ν ; wir schreiben diese in der Form

Sν − ν = 2g mit Sν(x) := 2 ∂n Γx · ν do für x ∈ Ω .
∂Ω
Auf die Lösbarkeit dieser Integralgleichung wird in 5.3 eingegangen.
(b) Die Lösung des Dirichletschen Außenraumproblems
Δu = 0 in Ω , u = g auf ∂Ω ,
u regulär im Unendlichen
ergibt sich ebenfalls in der Form u = 21 Sν , wobei ν ∈ C0 (Ω) diesmal der
Integralgleichung Sν + ν = 2 g genügt, siehe 5.3.
(c) Das Neumannsche Innenraumproblem lautet
−Δu = f in Ω , ∂n u, = g auf ∂Ω ,
wobei f ∈ C (Ω) und g ∈ C0 (∂Ω) der Verträglichkeitsbedingung

1

(∗) f dn x + g do = 0
Ω ∂Ω
genügen und die Randbedingung im Sinne von

lim ∇u(x − tn(x)) , n(x) = g(x) für x ∈ ∂Ω
t→0+
zu verstehen ist, vgl. § 11 : 4.3*.

Diese Aufgabe besitzt eine bis auf eine additive Konstante eindeutig bestimmte
Lösung u ∈ C1n (Ω) ∩ C2 (Ω) , die sich in der unten beschriebenen Weise aus
einem Volumenpotential und dem Potential einer einfachen Belegung von ∂Ω
zusammensetzt. Im Fall g ∈ C1 (∂Ω) gilt zusätzlich u ∈ C1 (Ω).
Bemerkungen.
(i) Aus dem letzten Sachverhalt folgt die Existenz einer Green–Funktion zwei-
ter Art, vgl. 2.5.
(ii) Hinsichtlich der Abschwächbarkeit der Voraussetzung über f gilt das in (a)
Gesagte.
(iii) Die Notwendigkeit der Bedingung (c) ergibt sich aus der verallgemeinerten
Greenschen Formel § 11 : 4.3* (c): Für eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω) folgt mit
v=1

f dn x = − Δu dn x = − ∂n u do = − g do .
Ω Ω ∂Ω ∂Ω
Das Beweisverfahren ist ähnlich wie für (a):

(i) Es genügt, den Fall f = 0 zu betrachten: Ist U (x) = Γx f dn y und
Ω
v ∈ C1n (Ω) ∩ C2 (Ω) eine Lösung des Neumann–Problems
−Δv = 0 in Ω , ∂n v = g − ∂n U auf ∂Ω ,
so löst u = v + U das Ausgangsproblem.

(ii) Die Lösung u des Neumann–Problems Δu = 0 in Ω, ∂n u = g auf ∂Ω
wird angesetzt als Potential der einfachen Randbelegung μ,

u(x) := Γx μ do .
∂Ω
Die Eigenschaften solcher Flächenpotentiale werden in 5.2 beschrieben. Als Be-

dingung für μ ergibt sich die Integralgleichung

μ(x) − 2 Γx μ do = −2g(x) , kurz μ − T μ = −2g .
∂Ω
Näheres hierzu in 5.3.

(iii) Die Green–Funktion zweiter Art Gx = Γx +Hx ergibt sich aus der Lösung
Hx ∈ C1 (Ω) ∩ C2 (Ω) des Problems Δu = 0 in Ω , ∂n u = −1/An−1 (∂Ω) auf
∂Ω unter Berücksichtigung der letzten Behauptung des Satzes.
(d) Die Neumannsche Außenraumaufgabe
Δu = 0 in Ω ,

∂n u = g auf ∂Ω , g do = 0 mit g ∈ C0 (∂Ω) ,
∂Ω
u regulär im Unendlichen
besitzt eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω) . Diese ist für n ≥ 3 eindeutig bestimmt;
für n = 2 besteht Eindeutigkeit bis auf additive Konstanten. Wie in (c) gibt es
1
eine Lösung der Form u = 2
T μ , wobei die Randbelegung μ der einfachen
Schicht der Integralgleichung
μ + T μ = −2g
genügt.
(e) Das Ganzraumproblem. Ω sei ein beschränktes, C2 –berandetes Gebiet
und f ∈ C1 (Ω) eine Funktion, die wir durch Nullsetzen außerhalb von Ω auf
Ê
den n fortsetzen. Dann hat das Ganzraumproblem
−Δu = f in Ê n
\ ∂Ω , lim u(x) = 0
x→∞
genau eine Lösung u ∈ C1 ( Ê ) ∩ C (Ê

n 2 n
\ ∂Ω), und diese ist gegeben durch das
Volumenpotential

u(x) = Γx (y) f (y) dn y .
Ω
Das ergibt sich aus Satz 1 des folgenden Abschnitts.
5.2 Ergebnisse der Potentialtheorie

Ê
Im folgenden sei Ω ⊂ n (n ≥ 2) ein beschränktes Gebiet mit C2 –differen-
Ê
zierbarem Rand Σ := ∂Ω, und n \ Ω sei ebenfalls ein Gebiet. Ferner sei n
das äußere Normalenfeld von Ω und Γ die Grundlösung von −Δ. Zu gegebenen
Funktionen f ∈ C0 (Ω), μ, ν ∈ C0 (Σ) definieren wir Potentiale U, V, W auf
Ê
dem n durch

U (x) := Γx (y)f (y) dn y
Ω
(Volumenpotential mit der Dichte f ),

V (x) = (V μ)(x) := Γx (y) μ(y) do(y)
Σ
(Potential der einfachen Schicht mit der Belegung μ ),

W (x) = (W ν)(x) := ∂n Γx (y) · ν(y) do(y)
Σ
(Potential der doppelten Schicht mit der Dipolbelegung ν ).
Wegen Γx (y) = cn y − x2−n für n ≥ 3 und |Γx (y)| = (2π)−1 log y − x

für n = 2 konvergieren die Integrale U (x), V(x), nach § 11 : 2.4 (c) für alle
Ê
x ∈ n ; für V (x) folgt das aus der Definition des Integrals auf der (n − 1)−
dimensionalen Untermannigfaltigkeit Σ ÜA . Die Konvergenz des Integrals
Ê
W (x) ist im Fall x ∈ n \ Σ unproblematisch. Dass W (x) auch für x ∈ Σ
existiert, folgt aus der Ungleichung | ∂n Γx (y) | ≤ c x − y2−n für benachbarte

Punkte x, y ∈ Σ mit x = y . Zum Nachweis verwenden wir aus dem Beweis in
2.4 die Beziehung
| y − x , n(y) |
| ∂n Γx (y) | = | ∇Γx (y) , n(y) | = .
ωn y − xn
Nach Wahl einer C2 –Parametrisierung Φ von Σ ergibt sich mit x = Φ(u),
y = Φ(v)
Φ(u) − Φ(v) = dΦ(u)(u − v) + R(u − v) ,
R(u − v) ≤ const u − v2 ≤ const x − y2 ,
dΦ(u)(u − v) ⊥ n(Φ(u)) .
Wir zitieren die wichtigsten Ergebnisse der Potentialtheorie; Literaturangaben

für die Beweise werden anschliessend gegeben.
Satz 1. Für f ∈ C0 (Ω) und das zugehörige Volumenpotential U gilt

(a) U ∈ C1 ( Ê ),
n
(b) U ist harmonisch in Ê n

\ Ω,
(c) |U (x)| ≤ c x 2−n
für x 1 mit einer Konstanten c ≥ 0.
(d) Gilt zusätzlich f ∈ C1 (Ω), so ist U ∈ C2 (Ω) und −Δu = f in Ω.
Ê
Für das Folgende setzen wir Ω− := Ω, Ω+ := n \ Ω und definieren die einsei-
tigen Normalableitungen von V im Punkt x ∈ Σ, soweit existent, durch
∂n V± (x) := lim ∇V (x + tn(x)) , n(x) ,

t→0±
entsprechend für W .
Satz 2. Für μ ∈ C0 (Σ) und V := V μ gilt:

(a) V ∈ C0 ( Ên
),
Ê
(b) V ist harmonisch in n \ Σ = Ω+ ∪ Ω− .
(c) Die einseitigen Normalableitungen ∂n V± (x) existieren für jedes x ∈ Σ
und erfüllen die Sprungrelationen
1
∂n V± (x) = N (x) ∓ μ(x) für x ∈ Σ
2
mit

N (x) := ∂n Γy (x) · μ(y) do(y) .
Σ
(Die Konvergenz dieses Integrals ergibt sich wie in 5.2.)

(d) N ist stetig auf Σ.

(e) |V (x)| ≤ c x2−n für x 1 mit einer Konstanten c ≥ 0.
(f) Für μ ∈ C1 (Σ) gilt V ∈ C1 (Ω± ) , d.h. die Einschränkung von ∇V auf
Ω± lässt sich stetig auf Ω± = Ω± ∪ Σ fortsetzen.
Die Aussagen (b), (c), (d) implizieren also die für das Neumann–Problem gefor-
derten Eigenschaften V ∈ C1n (Ω− ) ∩ C2 (Ω− ).
Satz 3. Für ν ∈ C0 (Σ) und W := W ν gilt:

(a) W ist harmonisch in Ê n
\ Σ = Ω+ ∪ Ω− ,
(b) W ist stetig auf Σ,
(c) Die Einschränkung von W auf Ω± besitzt eine stetige Fortsetzung W± auf
Ω± ∪ Σ und es bestehen die Sprungrelationen
1
W± (x) = W (x) ± ν(x) für x ∈ Σ ,
2
(d) |W (x)| ≤ c x1−n für x 1 mit einer Konstanten c ≥ 0.
Der Beweis von Satz 1 ist zu finden in Dibenedetto [59] Ch. II, Gilbarg–
Trudinger [79] 4.2, 4.3, Leis [50] II, Wladimirow [56] § 22.
Die Sätze 2, 3 werden bewiesen in Dibenedetto [59] Ch. III, Colton–Kress
[88] 2, Michlin [51] Kap. 12, 16, Wladimirow [56] § 22.
Die Potentialtheorie hat eine lange Geschichte. Laplace fand 1785/89, dass
das Volumenpotential außerhalb Ω der nach ihm benannten Gleichung Δu = 0
genügt. Poisson zeigte 1813, dass dieses in Ω die Gleichung −Δu = f erfüllt;
seine Herleitung war jedoch nicht korrekt. Der Nachweis der Stetigkeits– und
Differenzierbarkeitseigenschaften von U, V, W erfordert wegen der Singularität
der Grundlösung diffizile Abschätzungen. Grundlegende Beiträge zur Potential-
theorie leisteten Gauß 1840, Otto Hölder 1882, Ljapunow 1892, Korn 1909,
Lichtenstein 1912, vgl. Burkhardt–Meyer [194], Lichtenstein [84].
5.3 Die Integralgleichungen der Flächenbelegungen

(a) Wir legen die Voraussetzungen und Bezeichnungen 5.2 zugrunde und defi-
nieren die Integraloperatoren S, T : C0 (Σ) → C0 (Σ) durch

(Sν)(x) := 2 ∂n Γx (y) · ν(y) do(y) ,
Σ

(T μ)(x) := 2 ∂n Γy (x) μ(y) do(y) .
Σ
Satz. (i) u := ± W ν in Ω± , u := g auf Σ = ∂Ω± löst das erste Rand-

wertproblem für die Laplace–Gleichung im Außen–/Innenraum Ω± genau dann,
wenn ν ∈ C0 (Σ) die Integralgleichung
Sν ± ν = 2g
erfüllt.
(ii) u := V μ in Ω± löst das zweite Randwertproblem für die Laplace–Gleichung
im Außen–/Innenraum Ω± genau dann, wenn μ ∈ C0 (Σ) der Integralgleichung
± T μ − μ = −2g
genügt.
1
Teil (i) folgt aus 5.2, Satz 3 wegen W ν = 2
Sν .
Teil (ii) folgt aus 5.2, Satz 2 mit (T μ)(x) = 2N (x) , wobei für die Außenraum-
aufgabe zu beachten ist, dass −n das äußere Normalenfeld von Ω+ ist.
(b) Damit ist die Frage nach der Existenz von Lösungen der obengenannten vier
Randwertprobleme auf die Lösung von Integralgleichungen zurückgeführt. Wir
referieren das Vorgehen in Kürze und verweisen für Einzelheiten auf Colton–
Kress [88] 3.4, Dautray–Lions [4] Vol.1, II § 45, Leis [50] II, III, IV, Michlin
[51] Kap. 17, Wladimirow [56] § 16, § 23.
Die wesentliche Eigenschaft der Operatoren S, T : C0 (Σ) → C0 (Σ) ist die die
Kompaktheit (Vollstetigkeit) : Für jede in der Supremumsnorm · ∞ be-
schränkte Folge (fn ) enthalten die Bildfolgen (Sfn ), (T fn ) jeweils bezüglich
der Norm · ∞ (also gleichmäßig) konvergente Teilfolgen. Für kompakte Ope-
ratoren A auf dem unendlichdimensionalen Banachraum C0 (Σ) gilt wie im End-
lichdimensionalen: Ist λ = 0 kein Eigenwert von A, so ist A − λ½ bijektiv.
Es zeigt sich, dass 1 kein Eigenwert von S ist, woraus sich die eindeutige Lösbar-
keit der ersten Randwertaufgabe ergibt. Ferner gilt aufgrund des Satzes von
Fubini bezüglich des L2 –Skalarproduktes auf C0 (Σ)
u , Sv = T u , v .
Daraus und aus der Kompaktheit von S, T ergibt sich: Ist λ = 0 ein Ei-
genwert von T , so haben Kern (S − λ½) und Kern (T − λ½) dieselbe end-
liche Dimension. Die Gleichung T μ − λμ = 2g ist genau dann lösbar, wenn
g ⊥ Kern (S − λ½) . Es zeigt sich, dass −1 ein Eigenwert von S ist und dass
der zugehörige Eigenraum aus den konstanten Funktionen besteht. Daher ist
die Gleichung T μ + μ = 2g für die Neumannsche Innenraumaufgabe genau
dann lösbar, wenn

g do = 0 .
Σ
Die Lösung ist bis auf additive Konstanten eindeutig bestimmt.

6 Existenz von Lösungen: Variationsmethode 359
6 Existenz von Lösungen: Variationsmethode

6.1 Der Grundgedanke der Variationsmethode
(a) Wir betrachten für ein beschränktes Normalgebiet Ω ⊂ Ê n
das Dirichlet–
Problem
(D) − Δu = f in Ω , u = g auf ∂Ω
mit gegebenen Funktionen g ∈ C0 (∂Ω) und f ∈ C0 (Ω).

Wir setzen

C1g (Ω) := v ∈ C1 (Ω) v = g auf ∂Ω
und definieren auf C1g (Ω) das Dirichlet–Integral durch

1
J(v) := 2
∇v2 − f v dn x .
Ω
Satz. Eine Funktion u ∈ C1g (Ω) ∩ C2 (Ω) ist genau dann eine Lösung von (D),
wenn u eine Minimumstelle von J auf C1g (Ω) ist.
Dieser Zusammenhang wurde für den Fall f = 0 von Gauß (1840) und Lord
Kelvin (1847) gefunden.
Beweis.
(i) Sei u ∈ C1g (Ω) ∩ C2 (Ω) und −Δu = f in Ω . Für v ∈ C1g (Ω) setzen wir
ϕ := v − u ∈ C10 (Ω) und erhalten mit der 1. Greenschen Identität
1
J(v) − J(u) = 2
∇(u + ϕ)2 − 1
2
∇u2 − f ϕ dn x
Ω

= ∇u , ∇ϕ + 1
2
∇ϕ2 − f ϕ dn x
Ω

= ϕ ∂n u do − (Δu + f ) ϕ dn x + 1
2
∇ϕ2 dn x
∂Ω Ω Ω

= 1
2
∇ϕ2 dn x ≥ 0 ,
Ω
also ist u eine Minimumstelle von J .

(ii) Sei u ∈ C1g (Ω) ∩ C2 (Ω) eine Minimumstelle von J : C1g (Ω) → Ê . Dann
gilt u + sϕ ∈ C1g (Ω) für s ∈ Ê
und jede Testfunktion ϕ ∈ C∞c (Ω) .
Die Funktion
1
s → j(s) = J(u + sϕ) = 2
∇u2 − f u dn x
Ω

+ s ( ∇u , ∇ϕ − f ϕ) dn x + 1
2
s2 ∇ϕ2 dn x
Ω Ω
hat dann an der Stelle s = 0 ein Minimum. Aus j (0) = 0 ergibt sich die
Variationsgleichung

(V) 0 = ( ∇u , ∇ϕ − f ϕ) dn x = − (Δu + f ) ϕ dn x ,
Ω Ω
Letzteres nach dem Gaußschen Integralsatz in der randlosen Version § 11 : 3.2.

Da (V) für jede Testfunktion ϕ ∈ C∞
c (Ω) erfüllt ist, ergibt sich aus dem Funda-
mentallemma der Variationsrechnung § 10 : 4.1 die Poisson–Gleichung
Δu + f = 0 in Ω . 2
(b) Umformung des Dirichlet–Problems. Unter geeigneten Voraussetzungen (Nä-

heres in 6.6) lassen sich die Randwerte g zu einer wieder mit g bezeichneten
Funktion g ∈ C1 (Ω) ∩ C2 (Ω) fortsetzen. In diesem Fall ist u genau dann eine
Lösung von (D), wenn u0 := u − g das Randwertproblem
(D0 ) − Δu = f + Δg in Ω , u = 0 auf ∂Ω
löst. Das zu (D0 ) gehörige Dirchlet–Integral J0 : C10 (Ω) → Ê ist

1
J0 (v) = 2
∇v2 − (f + Δg) v dn x
Ω
1
= 2
∇v2 − f v + ∇g , ∇v dn x .
Ω
Wir behandeln im folgenden das reduzierte Dirichlet-Problem (D0 ). Haben wir

für dieses eine Lösung u0 gefunden, so ist u = u0 + g Lösung des Originalpro-
blems (D).
(b) Die Variationsmethode besteht darin, für das Dirichlet–Integral J0 die Exi-
stenz einer Minimumstelle nachzuweisen und damit das Randwertproblem (D0 )
zu lösen. Das Vorgehen erfolgt in zwei Schritten:
(i) Existenz einer schwachen Lösung. Auf C10 (Ω) wird durch

u, v 1 := (u v + ∇u , ∇v ) dn x
Ω
ein Skalarprodukt definiert. Der so entstandene Skalarproduktraum muss zu

einem Hilbertraum erweitert werden; Vollständigkeit ist, wie immer in der Ana-
lysis, eine Grundvoraussetzung für das Führen von Existenzbeweisen.
Die Erweiterung besteht darin, Funktionen v ∈ L2 (Ω) zuzulassen, welche Ab-

leitungen ∂1 v, . . . , ∂n v ∈ L2 (Ω) im Distributionssinn besitzen. Auf dem Sobo-
lew–Raum dieser Funktionen ist J0 (v) definiert und stetig in der Norm · 1 .
Der Existenzbeweis für Minimumstellen von J0 im Sobolew–Raum verläuft mit
ganz analogen Schlüssen, wie sie beim Beweis des Projektionssatzes im Hilbert-
raum § 9 : 2.3 verwendet werden. Eine solche Minimumstelle heißt eine schwache
Lösung des Minimumproblems, bzw. des zugehörigen Randwertproblems (D0 ).
(ii) Regularität der schwachen Lösung. Die Hauptarbeit der Variationsmetho-
de besteht im Nachweis, dass schwache Lösungen auch Lösungen im Sinne der
ursprünglichen Problemstellung sind, d.h. C2 –differenzierbar in Ω und stetig
auf Ω . Dies gelingt unter geeigneten Glattheitsvoraussetzungen an die Daten.
(c) Bei der hiermit skizzierten direkten Methode der Variationsrech-

nung wird der Existenzbeweis für die Lösung also abgetrennt vom Nachweis
der Regularitätseigenschaften. Die lange Auseinandersetzung mit diesem Ge-
genstand in der ersten Hälfte des 20. Jahrhunderts hat die Mathematiker zu
der Einsicht geführt, dass dieses Vorgehen natürlich und angemessen ist; vgl.
Ladyzhenskaya–Uraltseva [82] Preface. Dies wird auch dadurch gestützt,
dass zahlreiche Minimumprobleme der Mathematischen Physik (z.B. in der Ela-
stizitätstheorie) keine differenzierbaren Lösungen besitzen; für solche ist der
schwache Lösungsbegriff der natürliche. Die Bedeutung der direkten Methode
der Variationsrechnung liegt darüberhinaus darin, dass sie auch auf nichtlineare
Probleme und Systeme von Differentialgleichungen anwendbar ist.
Wir führen im folgenden die wichtigsten Argumente der Variationsmethode vor;

den an Einzelheiten interessierten Leser verweisen wir auf [75]. Historische No-
tizen zur Entwicklung der direkten Methode finden Sie in Courant–Hilbert
[3], Kap. 7 und Leis [50] IV, 7.
6.2 Die Sobolew–Räume W1 (Ω) und W10 (Ω)

Literatur: Gilbarg–Trudinger [79] Ch. 7, Adams [132].
Sei Ω ein Gebiet des Ê n

. Norm und Skalarprodukt von L2 (Ω) bezeichnen wir
mit u bzw. u , v .
(a) Für u ∈ L2 (Ω) heißen v1 , . . . , vn ∈ L2 (Ω) schwache oder distributio-
nelle Ableitungen von u, wenn für alle ϕ ∈ C∞ c (Ω)
u , ∂i ϕ = − vi , ϕ (i = 1, . . . , n)
gilt. Da L2 –Funktionen lokalintegrierbar sind und somit reguläre Distributionen

liefern (§ 13 : 2.3), bedeutet dies nach § 13 : 4.1
∂i {u} = {vi } (i = 1, . . . , n) .
Nach § 13 : 2.3 sind die schwachen Ableitungen, sofern sie existieren, eindeutig
bestimmt. Für u ∈ C1 (Ω) und ϕ ∈ C∞ c (Ω) gilt u , ∂i ϕ = − ∂i u , ϕ nach
§ 11 : 3.3. Also sind ∂1 u, . . . ∂n u die schwachen Ableitungen von u, falls diese und
u selbst zu L2 (Ω) gehören. Für u ∈ C1 (Ω) ist daher die partielle Ableitung
∂i u eine schwache Ableitung. Es ist üblich, auch im allgemeinen Fall u ∈ L2 (Ω)
die schwachen Ableitungen vi mit ∂i u zu bezeichnen.
Der Sobolew–Raum W1 (Ω) ist definiert als der Vektorraum aller Funktionen
u ∈ L2 (Ω), die schwache Ableitungen ∂1 u, . . . , ∂n u ∈ L2 (Ω) besitzen, versehen

n
u, v 1 = u, v + ∂i u , ∂i v = (u v + ∇u , ∇v ) dn x
i=1 Ω
und der zugehörigen Norm

u21 = |u|2 + ∇u2 dn x .
Ω

Für u ∈ W1 (Ω) gilt also u1 ≥ u und u21 ≥ ∇u2 dn x .
Ω
In der Literatur wird der Sobolew–Raum W1 (Ω) meistens mit W1,2 (Ω) bezeich-
net.
Satz. W1 (Ω) ist ein separabler Hilbertraum.
Beweis.
(i) Vollständigkeit. Ist (uk ) eine Cauchy–Folge in W1 (Ω), so sind die Folgen
(uk ), (∂1 uk ), . . . , (∂n uk ) Cauchy–Folgen in L2 (Ω), besitzen also L2 –Limites
u, v1 , . . . , vn ∈ L2 (Ω). Für Testfunktionen ϕ ∈ C∞
c (Ω) gilt

∂i uk , ϕ + uk , ∂i ϕ = (∂i uk ϕ + uk ∂i ϕ) dn x = 0 .
Ω
Wegen der Stetigkeit des Skalarprodukts folgt daraus
vi , ϕ + u , ∂i ϕ = 0,
also u ∈ W (Ω) und ∂i u = vi (i = 1, . . . , n).

1
(ii) Separabilität. Nach § 9 : 1.5 ist L2 (Ω,

n
Ên+1
) = {(u0 , . . . , un ) | uk ∈ L2 (Ω)}

mit der Norm (u0 , . . . , un )2 = |uk |2 dn x separabel. Durch
k=0 Ω
W1 (Ω) → L2 (Ω, Ê n+1

), u → (u, ∂1 u, . . . , ∂n u)
1
ist eine Isometrie zwischen W (Ω) und einem nach (i) abgeschlossenen Teilraum
Ê
von L2 (Ω, n+1 ) gegeben. Dieser ist nach § 9 : 2.7 separabel. 2
(b) Der Raum W10 (Ω). Für eine Funktion u ∈ W1 (Ω) auf einem beschränk-
ten Gebiet Ω sind die Werte auf ∂Ω nicht notwendig definiert; wir können aber
das Verschwinden auf dem Rand in einem schwachen Sinn erklären. Hierzu be-
trachten wir den Abschluss W01 (Ω) von C∞ c (Ω) ⊂ W (Ω) in der Sobolew–Norm
1
· 1 ; dabei lassen wir beliebige Gebiete Ω ⊂ n

Ê
zu. Anstelle von C∞
c (Ω) kann
ebensogut C1c (Ω) oder C10 (Ω) genommen werden, vgl. 6.4. Für beschränkte,
C1 –berandetete Gebiete Ω nehmen Funktionen u ∈ C0 (Ω) ∩ W01 (Ω) in allen
Randpunkten den Wert Null an; vgl. Brezis [133] Th. IX.17. Ohne Glattheits-
bedingungen an den Rand lässt sich das nicht behaupten.
(c) Satz. Sei Ω ein beschränktes Gebiet. Dann ist V := W01 (Ω) ist ein echter
Teilraum von W1 (Ω). Auf W01 (Ω) ist durch
1/2
uV := ∇u2 dn x
Ω
eine zur Sobolew–Norm äquivalente Norm gegeben; d.h. es gilt
uV ≤ u1 ≤ k uV mit einer Konstanten k > 1 .
W01 (Ω), versehen mit dem zu · V gehörigen Skalarprodukt ·, · V ist also

ein separabler Hilbertraum.
Der Beweis beruht auf der
(d) Poincaré–Ungleichung. Liegt √ Ω zwischen zwei parallelen Hyperebenen
mit Abstand d, so gilt mit c = d/ 2
u ≤ c uV für alle u ∈ W01 (Ω) .
Die demnach endliche Poincaré–Konstante

( =
u
c(Ω) := sup u ∈ W01 (Ω) , u = 0
uV
spielt als geometrische Kennzahl des Gebiets Ω bei vielen Differentialgleichungs-

problemen eine wichtige Rolle.
√ Unter den Voraussetzungen der Poincaré–Unglei-
chung ist also c(Ω) ≤ d/ 2 . In § 15 : 1.3 (c) zeigen wir für beschränkte Gebiete
Ω, dass λ1 = c(Ω)−2 der kleinste Eigenwert des Laplace–Operators ist.
Beweis der Poincaré–Ungleichung.

Aufgrund des Transformationssatzes für Integrale gilt für u ∈ W01 (Ω) und jede
Bewegung h : u ∈ W01 (Ω) ⇐⇒ v = u ◦ h ∈ W01 (Ω ) mit Ω = h−1 (Ω) ; ferner
ist u = v , uV = vV , jeweils auf Ω bzw. Ω bezogen ÜA . Wir dürfen
daher annehmen, dass

Ω ⊂ Ê n−1
× ]0, d[ = (y, t) | y ∈ Ê
n−1
, 0<t<d .
Wir betrachten zunächst eine Funktion ϕ ∈ C∞ c (Ω). Für x = (y, t) ∈ Ω und

x0 = (y, 0) ∈ Ω ergibt die Cauchy–Schwarzsche Ungleichung
t
| ϕ(x) | = | ϕ(x) − ϕ(x0 ) | ≤ | ∂n ϕ(y, s) | ds
0
t t 1/2 t 1/2
≤ 1 ∇ϕ(y, s) ds ≤ 12 ds ∇ϕ(y, s)2 ds .
0 0 0
Daraus folgt mit sukzessiver Integration
d d
ϕ2 ≤ t ∇ϕ(y, s)2 ds dt dn−1 y
Ên−1 0 0
d
= 1
d2 ∇ϕ(y, s)2 ds dn−1 y
Ên−1
2
0
= c2 ϕV 2
√
mit c = d/ 2 . Aus u − ϕn 1 → 0 mit ϕn ∈ C∞ c (Ω) folgt u − ϕn → 0
und u − ϕn V → 0, somit u2 ≤ c2 , uV 2 . 2
Der Beweis von (c) folgt aus der Poincaré–Ungleichung mit k2 = 1 + c(Ω)2 .
W01 (Ω) ist ein echter Teilraum von W1 (Ω) , weil die konstante Funktion 1 zu
W1 (Ω), aber wegen 1V = 0 und der Poincaré–Ungleichung nicht zu W01 (Ω)
gehört.
(e) Auswahlsatz von Rellich (F. Rellich (1930)) Jede in W01 (Ω) beschränk-
te Folge besitzt eine in L2 (Ω) konvergente Teilfolge.
Für den Beweis siehe Ladyzhenskaya [65] I, Thm.6.1, Leis [50] VI.5.
6.3 Die Existenz einer schwachen Lösung

Ê
Sei Ω ein beschränktes Gebiet des n. Wir zeigen für das auf verschwindende
Randwerte reduzierte Randwertproblem
(D0 ) −Δu = f + Δg in Ω , u = 0 auf ∂Ω
die Existenz einer schwachen Lösung. Hierbei genügt es, f ∈ L2 (Ω) , g ∈ W1 (Ω)
vorauszusetzen. Wir verwenden die Bezeichnungen

H = L2 (Ω) , u, v H = u v dn x , u2H = u2 dn x ,
Ω Ω

V = W01 (Ω) , u, v V = ∇u , ∇v dn x , u2V = ∇u2 dn x .
Ω Ω
Dem Programm 6.1 (b) folgend, fassen wir das Dirichlet–Integral

1
J0 (v) = 2
∇v2 − f v + ∇g , ∇v dn x
Ω
= 1
2
v, v V − f, v H + g, v V
als Funktion auf dem Hilbertraum V = W01 (Ω) auf, wobei die Gradienten jetzt
aus schwachen Ableitungen bestehen.
Satz. Das Dirichlet–Integral J0 : W01 (Ω) → Ê

besitzt genau eine Minimum-
stelle u ∈ W01 (Ω). Diese ist charakterisiert durch die Beziehung
(∗) u, ϕ V = f,ϕ H − g, ϕ V für alle ϕ ∈ W01 (Ω) .
Die Gleichung (∗) lautet ausgeschrieben

∇u , ∇ϕ dn x = (f ϕ − ∇g , ∇ϕ ) dn x für alle ϕ ∈ W01 (Ω).
Ω Ω
Eine der Gleichung (∗) genügende Funktion u ∈ W01 (Ω) wird eine schwache
Lösung des Dirichlet–Problems (D0 ) genannt.
Bemerkung. Die Variationsmethode zum Nachweis der Existenz von schwa-

chen Lösungen stammt von Friedrichs (1934); sie wird in der Literatur mei-
stens nach Lax und Milgram (1954) benannt.
Beweis.
(1) Die Existenz einer Minimumstelle kann direkt bewiesen werden, indem wir
eine Minimalfolge für J0 : V → Ê
wählen (d.h. eine Folge (uk ) in V mit
lim J0 (uk ) = inf {J0 (v) | v ∈ V } ) und mit Hilfe der Parallelogrammgleichung
k→∞
zeigen, dass diese eine Cauchy–Folge in V ist. Das Grenzelement u ∈ V ist
Ê
dann die Minimumstelle von J0 : V → ; vgl. John [49] 4.5 Probl. 1.
(2) Schneller zum Ziel kommen wir durch Anwendung der Hilbertraumtheorie.
Hierzu zeigen wir zunächst:
(i) Die Gleichung (∗) hat genau eine Lösung u ∈ V . Denn nach der Poincaré–
Ungleichung 6.2 gilt

f,ϕ − g, ϕ ≤ f ϕ + g ϕ
H V H H V V
≤ (c(Ω) f H + gV ) ϕV für jedes ϕ ∈ V,
Ê
also ist F : V → , ϕ → f , ϕ H − g , ϕ V eine stetige Linearform auf dem
Hilbertraum V . Nach dem Darstellungssatz von Riesz–Fréchet § 9 : 2.8 existiert
genau ein u ∈ V mit u , ϕ V = F ϕ für jedes ϕ ∈ V ; u erfüllt also (∗).
(ii) u ∈ V löst (∗) genau dann, wenn u eine Minimumstelle von J0 : V → Ê

ist. Denn erfüllt u die Gleichung (∗), so gilt für jedes v ∈ V und für ϕ = u − v
J0 (v) − J0 (u) = J0 (u + ϕ) − J0 (u)
= u, ϕ V − f, ϕ H + g, ϕ V + 1
2
ϕ2H
= 1
2
ϕ2H ≥ 0,
also ist u ∈ V Minimumstelle von J0 .

Ist umgekehrt u eine Minimumstelle von J0 , so hat für jedes ϕ ∈ V die reell-
wertige Funktion
s → j(s) := J0 (u + sϕ)

= J(u) + s u, ϕ V − f,ϕ H + g, ϕ V + 12 s2 ϕ2V
in s = 0 eine Minimumstelle, folglich gilt
0 = j (0) = u , ϕ V − f,ϕ H + g, ϕ V ,
d.h. u genügt der Gleichung (∗). 2
6.4 Weiteres über Sobolew–Räume

(a) Approximation von W1 –Funktionen durch C∞ –Funktionen.
Definition. Eine Funktion u ∈ L2 (Ω) gehört zur Klasse H1 (Ω), wenn es Funk-
tionen uk ∈ C1 (Ω) ∩ L2 (Ω) gibt, die im L2 –Sinn gegen u konvergieren und für
die (∂1 uk ), . . . , (∂n uk ) Cauchy–Folgen in L2 (Ω) sind.
Für vi = lim ∂i uk (i = 1, . . . , n) und Testfunktionen ϕ ∈ C∞
c (Ω) folgt dann
k→∞
aus der Stetigkeit des Skalarprodukts
u , ∂i ϕ + vi , ϕ = lim ( uk , ∂i ϕ + ∂i uk , ϕ ) = 0
k→∞
für i = 1, . . . , n, da die uk nach 6.2 (a) zu W1 (Ω) gehören.

Somit gilt H1 (Ω) ⊂ W1 (Ω), und H1 (Ω) ist der Abschluss von W1 (Ω) ∩ C1 (Ω) in
der Sobolew–Norm · 1 . Den Abschluss von C∞ c (Ω) in dieser Norm bezeichnen
wir mit H10 (Ω).
Satz (Kasuga 1957). Es gilt
H1 (Ω) = W1 (Ω) , H10 (Ω) = W01 (Ω) , W1 ( Ê n

) = W01 ( Ê n
).
Für jedes u ∈ W1 (Ω) gibt es also Funktionen ϕk ∈ C∞ (Ω) mit ϕk → u für

Ê
k → ∞ in der W1 –Norm; im Fall u ∈ W1 ( n) können diese mit kompaktem
Träger gewählt werden.
Beweis.
Wir führen den Beweis nur für Ω = Ê . Nach § 10 : 3.4 (b) gilt für u ∈ L (Ê )
n 2 n
lim u − jr ∗ u = 0 .
r→0
Dabei sind die jr ∗ u Testfunktionen. Für u ∈ W1 ( Ê ) gilt daher auch

n
lim ∂i u − jr ∗ ∂i u = 0 (i = 1, . . . , n) .
r→0
Für u ∈ W1 ( Ê
n
) gilt nach dem Satz über Parameterintegrale

(jr ∗ ∂i u)(x) = ∂i u(y) jr (x − y) dn y = − ∂
u(y) ∂y jr (x − y) dn y
Ên Ên i
= ∂
u(y) ∂x jr (x − y) dn y = ∂
u(y) jr (x − y) dn y ,
Ên Ên
i ∂xi
also jr ∗ ∂i u = ∂i (jr ∗ u) und somit für ur := jr ∗ u ∈ C∞

c ( Ê n
)

n
u − ur 21 = u − ur 2 + ∂i u − ∂i ur 2 → 0 für r → 0.
i=1
Ê
Im Fall Ω = n setzen wir u ∈ W1 (Ω) durch Nullsetzen außerhalb von Ω
Ê
zu einer Funktion auf n fort, die wir wieder mit u bezeichnen. Da jr ∗ u
i.A. nicht zu C∞
c (Ω) gehört, kann nicht wir oben auf jr ∗ ∂i u = ∂i (jr ∗ u)
Ê
geschlossen werden; dies wäre nur im Fall u ∈ W1 ( n ) möglich. Der Beweis

∞
beruht hier darauf, Funktionen ψk ∈ C∞
c (Ω) mit u(x) = u(x)ψk (x) in Ω
k=1
zu konstruieren, wobei für jedes x nur endlich viele Glieder der Reihe von Null
verschieden sind (Teilung der Eins). Auf u · ψk lässt sich die Schlussweise von
oben wieder anwenden. Für Einzelheiten siehe Adams [132] III, 3.16, Gilbarg–
Trudinger [79] 7.6. 2
(b) Die Sobolew-Räume Wk (Ω). Für einen Multiindex α = (α1 , . . . , αn )

heißt vα ∈ L1loc (Ω) schwache α–te Ableitung von u ∈ L1loc (Ω), wenn

∂ α {u} = {vα }, d.h. u ∂ α ϕ = (−1)|α| vα ϕ für alle ϕ ∈ C∞
c (Ω).
Ω Ω
Gibt es eine Funktion vα mit dieser Eigenschaft, so bezeichnen wir sie mit ∂ α u.
Für k = 0, 1, . . . setzen wir

Wk (Ω) := u ∈ L2 (Ω) ∂ α u ∈ L2 (Ω) existieren für |α| ≤ k ,
versehen mit der Norm

1/2
uk := | ∂ α u | 2 dn x
|α|≤k Ω
und dem zugehörigen Skalarprodukt. Für k = 0 ist also W0 (Ω) = L2 (Ω) und
u0 die L2 –Norm. Ähnlich wie in 6.2 ergibt sich:
Satz. Wk (Ω) ist ein separabler Hilbertraum, und es gilt
Wk (Ω) = Hk (Ω) ,
wobei Hk (Ω) der Abschluss von {u ∈ Ck (Ω) | ∂ α u ∈ L2 (Ω) für |α| ≤ k} be-
züglich der Norm · k ist.
(c) Sobolew–Funktionen auf Intervallen. Sobolew–Funktionen u ∈ W1 (I)

auf offenen Intervallen I lassen sich auf einfache Weise charakterisieren:
Satz. Für u, v ∈ L2 (I) sind folgende Aussagen äquivalent:

(i) u ∈ W1 (I), und v ist schwache Ableitung von u.
(ii) u ist stetig, und es gilt
x
u(x) = u(x0 ) + v(t) dt für x, x0 ∈ I .
x0
Unter diesen Bedingungen ist die Funktion u fast überall differenzierbar und es
gilt u = v f.ü. .
Bemerkung. Es gibt nichtkonstante, stetige Funktionen u mit u = 0 f.ü. , d.h.
allein aus der Existenz der Ableitung u f.ü. lässt sich nicht auf die schwache
Differenzierbarkeit von u schließen; vgl. Riesz–Nagy [131] Nr. 24.
Beweis.
(ii) =⇒ (i): Nach dem Hauptsatz der Differential- und Integralrechnung in der
erweiterten Fassung von Lebesgue (§ 8 : 3.2) folgt aus (ii) die Absolutstetigkeit
von u und u = v f.ü. . Da jede Testfunktion absolutstetig ist, ergibt partielle
Integration gemäß § 8 : 3.3 für ϕ ∈ C∞
c (I) mit supp ϕ ⊂ [α, β] ⊂ I
β β

uϕ = uϕ = − vϕ = − vϕ.
I α α I
x
(i) =⇒ (ii): Ist v schwache Ableitung von u, so ist u0 (x) := v(t)dt (x0 ∈ I)
x0
absolutstetig. Partielle Integration ergibt

0 = u ϕ + vϕ = (u − u0 ) ϕ
I I I
für alle ϕ ∈ C∞
c (I). Mit dem Hilbertschen Lemma § 10 : 4.3 folgt u − u0 = c mit
einer Konstanten c . Wegen u0 (x0 ) = 0 ergibt sich c = u(x0 ) und damit (ii). 2
(d) Glattheitseigenschaften von Wk –Funktionen.

Bereits für n = 2 enthält W1 (Ω) unstetige und unbeschränkte Funktionen, z.B.
u(x) = log log(4/x) auf der Einheitskreisscheibe Ω, vgl. Adams [132] p.118 ff.
Im folgenden Satz werden Bedingungen für die Stetigkeit und die Differenzier-
barkeit von Sobolew–Funktionen angegeben. Mit der üblichen, etwas ungenauen
Schreibweise Wr (Ω) ⊂ Cs (Ω) ist gemeint, dass jede Funktion u ∈ Wr (Ω) nach
Abänderung auf einer Nullmenge in Cs (Ω) liegt; u bezeichnet in diesem Fall
die eindeutig bestimmte Funktion in Cs (Ω).
Den Raum Cs (Ω) versehen wir mit der Supremumsnorm

uCs (Ω) := sup |∂ α u(x)| | x ∈ Ω .
|α|≤s
Einbettungssatz (C.B. Morrey 1940). Ist Ω ein beschränktes, C1 – oder

Lipschitz–berandetes Gebiet, so gilt für r > s + n/2
Wr (Ω) ⊂ Cs (Ω) ,
und es gibt eine Konstante c = c(Ω, r, s) > 0 mit
uCs (Ω) ≤ c ur für u ∈ Wr (Ω) .
Dieser Satz wird meistens als Teil des Sobolewschen Einbettungssatzes

zitiert. Für den Beweis siehe Adams [132] 5.4 Thm., Rauch [67] § 5.9, § 2.6.
Für Intervalle Ω = I ergibt sich die schon in (c) festgestellte Stetigkeit von
Ê
Funktionen u ∈ W 1 (I). Für Ω ⊂ n mit n ≤ 3 ist jede Funktion u ∈
W2 (Ω) stetig, und aus der Konvergenz uk → u im Sobolew–Raum W2 (Ω)
folgt gleichmäßige Konvergenz uk → u .
Seien X , Y normierte Räume mit Normen X , Y . Gilt X ⊂ Y und
uY ≤ const uX für alle u ∈ X ,
so schreiben wir X → Y und nennen X stetig eingebettet in Y . Mit dieser

Notation lautet der Einbettungssatz Wr (Ω) → Cs (Ω) für r > s + n/2.
6.5 Regularität schwacher Lösungen

Nach 6.3 hat das reduzierte Randwertproblem
(D0 ) − Δu = f + Δg in Ω , u = 0 auf ∂Ω
für alle f ∈ L2 (Ω), g ∈ W1 (Ω) eine schwache Lösung u0 ∈ W01 (Ω), d.h. es gilt

( ∇u0 , ∇ϕ − f ϕ + ∇g , ∇ϕ ) dn x = 0 für jedes ϕ ∈ W01 (Ω) .
Ω
Für u := u0 + g ∈ W1 (Ω) gilt dann u − g ∈ W01 (Ω) und

(∗∗) ( ∇u , ∇ϕ − f ϕ) dn x = 0 für jedes ϕ ∈ W01 (Ω) .
Ω
Wir nennen u eine schwache Lösung des Dirichlet–Problems
(D) − Δu = f in Ω , u = g auf ∂Ω .
Ohne allzu großen Aufwand lässt sich zeigen (John [49] 4.5):
Ê
Satz. (a) Sei Ω ⊂ 2 beschränkt, f ∈ C1 (Ω) und g = 0. Dann ist u nach
Abänderung auf einer Nullmenge C2 –differenzierbar in Ω .
Ê
(b) Für C2 –berandete Gebiete Ω ⊂ 2 ist unter den gleichen Voraussetzungen
wie in (a) die schwache Lösung u auf Ω stetig und verschwindet auf ∂Ω .
Für n ≥ 3 ist der Nachweis der stetigen Annahme der vorgeschriebenen Rand-
werte aufwendiger. Es gilt der fundamentale

Regularitätssatz. Seien k ∈ 0 , Ω ein beschränktes Ck+2 –berandetes Gebiet,
f ∈ Wk (Ω) und g ∈ Wk+2 (Ω). Dann gehört die schwache Lösung u von (D)
zu Wk+2 (Ω), und es gilt
uk+2 ≤ c ( f k + gk+2 )
mit einer von u unabhängigen Konstanten c = c(Ω, k) > 0 .
Zusammen mit dem Einbettungssatz 6.4 (d) ergibt sich für k + 2 − n/2 > s die
Differenzierbarkeitsaussage u ∈ Cs (Ω) , insbesondere Stetigkeit auf Ω im Fall
k + 2 − n/2 > 0 .
Der Regularitätssatz wurde von Friedrichs, Ladyzhenskaya, Nirenberg,
Browder, Lax und anderen um 1953 bewiesen. Der Beweis beruht auf trickrei-
cher Wahl von Testfunktionen ϕ in der Gleichung (∗∗) und auf lokalem Gerade-
biegen des Randes ∂Ω durch Ck+2 –Diffeomorphismen. Unter diesen Diffeomor-
phismen geht die Poisson–Gleichung in eine gleichmäßig elliptische Gleichung
(vgl.6.1 (b)) über.
Für den Beweis verweisen wir auf Gilbarg–Trudinger [79] 8.3, 8.4, Bers–
John–Schechter [58] Part II, Ch. 2, § 1, Rauch [67] § 5.9.
Bemerkungen.
(i) Der Regularitätssatz liefert die Kontrollierbarkeit der vollen Wk+2 –Norm
einer Funktion u ∈ W01 (Ω) mit Δu ∈ Wk (Ω) durch die Wk –Norm von Δu ,
uk+2 ≤ c Δuk .
Diese wichtige Tatsache erlaubt bei der Entwicklung nach Eigenfunktionen des
Laplace–Operators 1.2 die Charakterisierung des Abfallverhaltens der Fourier-
koeffizienten von Funktionen im Sobolew–Raum durch ihre Differenzierbarkeits-
stufe.
(ii) Die Voraussetzungen des Regularitätssatzes sind nicht optimal. Dies zeigt
der Vergleich mit dem auf der Potentialtheorie beruhenden Existenzsatz 5.1 (a).
(iii) Bei nicht glatt berandeten Gebieten Ω sind der maximal erreichbaren Re-
gularitätsstufe der Lösung Grenzen gesetzt. Dies lässt sich am Beispiel von har-
monischen Funktionen auf Kreissektoren (vgl. 2.9) plausibel machen; siehe auch
Grisvard [80] Ch. 4, Nazarov [86] Ch. 2.
6.6 Fortsetzung von Randwerten ins Innere

Ê
Ist Ω ⊂ n beschränkt und Ck+1 –berandet, so lässt sich jede Ck –Funktion g
auf ∂Ω zu einer Ck –Funktion G auf Ω fortsetzen, und es gilt
GC k (Ω) ≤ c gC k (∂Ω) .
mit einer von g unabhängigen Konstanten c = c(Ω, k) > 0 .
Beweisskizze. Wir führen wie in § 11 : 4.3* Normalkoordinaten in einer Umge-

bung des Randes ∂Ω ein: Das äußere Einheitsnormalenfeld n : ∂Ω → n von Ê
Ω ist Ck – differenzierbar und
Φ : ∂Ω × ] − ε, ε [ → Ê n
, (y, r) → y − r n(y)
ist für ε 1 ein Ck –Diffeomorphismus auf eine Umgebung U ⊂ Ê

n
von ∂Ω .
Die Umkehrabbildung von Φ hat die Gestalt
Φ−1 (x) = (p(x), d(x)) ∈ ∂Ω × ] − ε, ε [
mit Ck –differenzierbaren Funktionen p und d auf U.

Wir wählen η ∈ C∞
c (] − ε, ε[) mit η(0) = 1 und definieren G : Ê n
→ Ê durch

η(d(x)) g(p(x)) für x ∈ U ,
Ê
G(x) :=
0 für x ∈ n
\U.
Dann ist G eine Ck –Funktion mit G = g auf ∂Ω. Die Abschätzung von G in
der Ck –Norm ergibt sich aus der Tatsache, dass alle Ableitungen von p, d, η
durch Konstanten beschränkt sind, die nur von Ω und ε = ε(Ω) abhängen. 2
372 § 15 Eigenwertprobleme für den Laplace–Operator
§ 15 Eigenwertprobleme für den Laplace–Operator

1 Entwicklung nach Eigenfunktionen des Laplace–Operators
1.1 Problemstellung
Auf das Dirichletsche Eigenwertproblem für den Laplace–Operator auf ei-
nem beschränkten Gebiet Ω ⊂ n , Ê
(D) − Δv = λv in Ω , v = 0 auf ∂Ω
werden wir durch den Produktansatz u(x, t) = a(t)v(x) für das Anfangswert-
problem der Wellengleichung
⎧ 2
⎪
⎨ ∂ u
2
∂t
− c2 Δu = 0 in Ω × Ê, u = 0 auf ∂Ω × Ê,
⎪
⎩ u = u0 , ∂u
= u1 auf Ω × {0}
∂t
geführt. Wie bei den Separationsansätzen für den Fall n = 1 spaltet sich dieses
Problem auf in das Eigenwertproblem (D) und die gewöhnliche Differentialglei-
chung
ä(t) + c2 λ a(t) = 0 .
Haben wir für das Eigenwertproblem (D) ein vollständiges Orthonormalsystem

von Eigenfunktionen v1 , v2 , . . . in L2 (Ω) und zugehörige positive Eigenwerte
λ1 , λ2 , . . . gefunden, so ist der zu vk , λk gehörende zeitabhängige Faktor a(t) =
ak (t) von der Gestalt
ak (t) = αk cos(μk t) + βk sin(μk t)

√
mit μk := c λk und Konstanten αk , βk ∈ Ê. Zu erwarten ist, dass die aus den
Produktlösungen bestehende Reihe

∞
u(x, t) = ak (t)vk (x)
k=1
eine Lösung des obigen Anfangswertproblems in einem geeigneten Sinn liefert,

falls die Anfangsbedingungen

∞
∂u ∞
u0 (x) = u(x, 0) = αk vk (x) , u1 (x) = (x, 0) = βk μk vk (x)
k=1 ∂t k=1
erfüllt sind.
Wie bei den Fourierreihen in § 6 : 2 stellt sich somit auch hier als zentrales Prob-
lem die Entwickelbarkeit beliebiger“ Funktionen in Reihen nach Eigenfunktio-
”
nen des Laplace–Operators. Diese Reihen nennen wir wie dort Fourierreihen.
1 Entwicklung nach Eigenfunktionen des Laplace–Operators 373
Werden beim Anfangs–Randwertproblem homogene Neumannsche Randbedin-

gungen gestellt, so führt der Produktansatz auf das Neumannsche Eigen-
wertproblem
(N) − Δv = λv in Ω , ∂n v = 0 auf ∂Ω .
Wir zeigen im folgenden für das Dirichletsche Eigenwertproblem auf beschränk-

Ê
ten Gebieten Ω ⊂ n die Existenz eines vollständigen ONS von Eigenfunk-
tionen in den Räumen L2 (Ω), Wr (Ω) und Cs (Ω). Die Beweise lassen sich mit
geringen Modifikationen auf das Neumannsche Eigenwertproblem übertragen.
1.2 Der Entwicklungssatz in L2 (Ω)

Es werden die Bezeichnungen von § 14 : 6.3 verwendet:

H = L2 (Ω) , u, v H = u v dn x , u2H = u2 dn x ,
Ω Ω

Ω Ω
Entwicklungssatz I. (a) Für jedes beschränkte Gebiet Ω ⊂ n gibt es Funk- Ê

tionen vi ∈ W01 (Ω) und Zahlen λi > 0 (i = 1, 2, . . . ) mit folgenden Eigenschaf-
ten:
(i) Die vi sind schwache Lösungen des Dirichletschen Eigenwertproblems,
vi , ϕ V = λi vi , ϕ H für alle ϕ ∈ W01 (Ω) (i = 1, 2, . . .) ,
(ii) 0 < λ1 ≤ λ2 ≤ . . . , lim λk = ∞ .

k→∞
(iii) v1 , v2 , . . . ist ein vollständiges ONS in L2 (Ω), das heißt für jede Funktion

k
u ∈ L2 (Ω) konvergieren die Partialsummen sk := vi , u H vi der zugehöri-
i=1
2
gen Fourierreihe in der L –Norm gegen u,

∞
lim u − sk H = 0 und u2H = vi , u 2
H .
k→∞ i=1
(b) Ist Ω zusätzlich Cr –berandet mit r > 2 + n/2, so liegt jede Eigenfunktion
vi in C2 (Ω) und löst das Eigenwertproblem im klassischen Sinn,
−Δvi = λi vi in Ω , vi = 0 auf ∂Ω für i = 1, 2, . . . .
Bemerkungen. (i) Jeder Eigenwert λ kommt unter den λ1 , λ2 , . . . vor. Denn

andernfalls wäre jede zu λ gehörende Eigenfunktion v zu den v1 , v2 , . . . ortho-

∞
gonal und nach (iii) folgte v = vi , v H vi = 0 .
i=1
(ii) Jeder Eigenwert hat endliche geometrische Vielfachheit. Das ergibt sich
unmittelbar aus lim λk = ∞.
k→∞
(iii) Für das Neumannsche Eigenwertproblem bleiben die Aussagen des Ent-
wicklungssatzes mit zwei Modifikationen gültig: Es ist λ1 = 0 (die zugehörigen
Eigenfunktionen sind die Konstanten), und W01 (Ω) ist durch W1 (Ω) zu ersetzen;
siehe Courant–Hilbert [3], Kap.7, § 6.2, Ladyzhenskaya [65] II.5.
Der Beweis von Teil (a) des Entwicklungssatzes beruht darauf, die Inverse des
Laplace–Operators zu einem Operator G auf L2 (Ω) fortzusetzen und auf die-
sen Operator den Spektralsatz für kompakte symmetrische Operatoren aus § 22
anzuwenden. Hierzu benötigen wir einige Vorbereitungen.
(c) Nach § 14 : 6.3 gibt es zu jeder Funktion f ∈ H = L2 (Ω) genau eine schwa-
che Lösung u ∈ V = W01 (Ω) der Gleichung − Δu = f , bestimmt durch die
Beziehung
u, ϕ V = f,ϕ H für alle ϕ ∈ C∞

c (Ω) .
Diese ist äquivalent zur Gleichung
(1) u, v V = f,ϕ H für alle ϕ ∈ W01 (Ω) ,
denn C∞ 1
c (Ω) ist dicht in V = W0 (Ω), und wegen der Poincaré–Ungleichung
§ 14 : 6.2 (d) impliziert die Konvergenz in V die Konvergenz in H = L2 (Ω).
Die durch die Beziehung (1) definierte Abbildung
G:H →V ⊂H, f →u
wird der Green–Operator für das Dirichletsche Randwertproblem auf Ω ge-

nannt.
Eigenschaften des Green–Operators. Der Green–Operator
G : L2 (Ω) → L2 (Ω)
ist symmetrisch, positiv definit und kompakt.

Die Kompaktheit von G bedeutet, dass für jede in H = L2 (Ω) beschränkte
Folge (fk ) die Bildfolge (Gfk ) eine in H konvergente Teilfolge enthält.
Beweis.
Mit Gf = u ∈ W01 (Ω) ergibt sich aus (1) und der Poincaré–Ungleichung
(2) Gf 2H = u2H = u , u H ≤ c2 u , u V = c2 f , Gf H ,
woraus mit der Cauchy–Schwarzschen Ungleichung die Stetigkeit von G folgt:
(3) Gf H ≤ c2 f H für alle f ∈ H.

G ist injektiv, was sich unmittelbar aus der Definition (1) und dem Fundamen-
tallemma § 10 : 4.2 ergibt. Zusammen mit (2) folgt hieraus die positive Definit-
heit von G,
f , Gf H ≥ c−2 Gf 2H > 0 für f = 0 .
Die Symmetrie von G ergibt sich nach Bd. 1, § 20 : 2.1 (c).

Der Green–Operator G ist kompakt. Denn aus fn H ≤ M folgt nach (3)
Gfn H ≤ c2 M für n = 1, 2, . . . ,
und mit (2) ergibt sich
Gfn 2V = fn , Gfn H ≤ fn H Gfn H ≤ c2 M 2 .
Nach dem Rellichschen Auswahlsatz § 14 : 6.2 (e) enthält somit (Gfn ) eine in H
konvergente Teilfolge. 2
(d) Beweis des Entwicklungssatzes.

Zum Nachweis von (a) wenden wir den Spektralsatz für kompakte, symmetrische
und positiv definite Operatoren § 22 : 4.5 auf den Green–Operator G an. Nach
diesem existiert in H ein vollständiges ONS v1 , v2 , . . . von Eigenvektoren von G,
wobei die zugehörigen Eigenwerte μi = vi , Gvi H > 0 eine monoton fallende
Nullfolge bilden. Die Eigenwertgleichung Gvi = μi vi bedeutet
vi , ϕ H = μi vi , ϕ V für alle ϕ ∈ W01 (Ω) ,
d.h. die vi lösen das Dirichletsche Eigenwertproblem für den Laplace–Operator

im schwachen Sinn, und für die zugehörigen Eigenwerte λi := μ−1i gilt
λi > 0 , lim λk = ∞.
k→∞
Teil (b) des Entwicklungssatzes ergibt sich durch mehrfache Anwendung des
Reguläritätssatzes in § 14 : 6.5 ÜA . 2
Die Bezeichnungen vi , λi behalten wir in den folgenden Unterabschnitten bei.
1.3 Der Entwicklungssatz in W10 (Ω)

(a) Satz. Es gilt

∞
W01 (Ω) = u ∈ L2 (Ω) λi vi , u 2
H <∞ ,
i=1

∞
u2V = λi vi , u 2
H für u ∈ W01 (Ω) .
i=1
−1/2
Durch wi = λi vi (i = 1, 2, . . . ) ist ein vollständiges ONS für den Hilbert-
raum V = W01 (Ω) gegeben, d.h. für u ∈ V gilt

∞
∞
u = wi , u V wi in V und u2V = wi , u 2
V .
i=1 i=1
Beweis.
(i) Wir erinnern daran, dass nach § 9 : 4.8 jeder Hilbertraum H über mit Ê
Skalarprodukt · , · , der ein abzählbares vollständiges ONS u1 , u2 , . . . besitzt,
isomorph zum Hilbertschen Folgenraum 2 ist: Für h ∈ H gilt die Parsevalsche

∞
Gleichung h2 = ui , h 2
, und für jede Folge (c1 , c2 , . . . ) ∈ 2 konver-
i=1

∞
giert die Reihe ci ui in H .
i=1
(ii) Aus der Eigenwertgleichung
(4) vi , v V = λi vi , v H für alle v ∈ W01 (Ω)

−1/2
folgt vi , vk V = λi vi , vk H = λi δik , also bilden die wi = λi vi bezüglich
des Skalarprodukts · , · V ein ONS, und es gilt
(5) wi , u V = λi vi , u H für i = 1, 2, . . . .
Zum Nachweis der Vollständigkeit dieses ONS ist nach dem Kriterium § 9 : 4.4 (e)
zu zeigen:
wi , u V = 0 für alle i = 1, 2, . . . =⇒ u = 0 .
In der Tat folgt aus wi , u V = 0 nach (5) auch vi , u H = 0 für i ∈ und

wegen der Vollständigkeit des ONS vi in H dann u = 0 in H.
(iii) Daher gilt für u ∈ V = W01 (Ω) die Parsevalsche Gleichung

∞
(5)
∞
u2V = wi , u 2
V = λi vi , u 2
H .
i=1 i=1

∞
Zu zeigen bleibt: Aus u ∈ L2 (Ω) und λi vi , u 2
H < ∞ folgt u ∈ W01 (Ω).
i=1

∞
Denn nach (5) ist wi , u 2
V < ∞ , also gibt es nach (i) ein v ∈ V = W01 (Ω)
i=1
mit wi , v V = wi , u V für i = 1, 2, . . . , und nach 1.2 (a) ergibt sich
∞
(5)
∞
∞
u = vi , u H vi = wi , u V wi = wi , v V wi = v
i=1 i=1 i=1
in der Norm · H , somit u = v ∈ W01 (Ω). 2

(b) Rayleigh–Prinzip und Poincaré–Konstante. Eigenwerte und Eigen-

funktionen lassen sich durch folgende Minimumeigenschaft charakterisieren:
( =
u2V
λ1 = min u ∈ V , u = 0 ;
u2H
das Minimum wird genau für die Eigenfunktionen u zum Eigenwert λ1 ange-
nommen.
Weiter gilt für k > 1
( =
u2V
λk = min u ∈ V , u = 0 , vi , u = 0 für i < k ,
u2H H
wobei das Minimum genau für die Eigenfunktionen zum Eigenwert λk angenom-
men wird.
√
Für die Poincaré–Konstante (§ 14 : 6.2 (d)) ergibt sich damit c(Ω) = 1/ λ1 .
Denn nach (a) und der Parsevalschen Gleichung gilt für u ∈ V, u = 0

∞
∞
u2V = λi vi , u 2
H ≥ λ1 vi , u 2
H = λ1 u2H
i=1 i=1
mit Gleichheit genau dann, wenn (λi − λ1 ) vi , u 2H = 0 für i = 1, 2, . . . gilt,

was nach 1.2 (a) bedeutet, dass u ein Eigenvektor zum Eigenwert λ1 ist.
Der Fall k > 1 ergibt sich analog ÜA .
1.4 Der Entwicklungssatz in Wr (Ω) und Cs (Ω)

Ê
(a) Sei Ω ⊂ n ein beschränktes Gebiet. Nach 1.1 (c) ordnet der Green–
Operator G jedem f ∈ H = L2 (Ω) die schwache Lösung u ∈ V = W01 (Ω) der
Gleichung − Δu = f zu, definiert durch
(∗) u, ϕ V = f,ϕ H für alle ϕ ∈ W01 (Ω) .
Wir betrachten den inversen Operator A von G mit dem Definitionsbereich
D(A) := G(H). Es gilt also u ∈ D(A) genau dann, wenn es ein f ∈ H gibt mit
(∗) ; in diesem Fall ist Au = f und u = Gf . Es folgt u , Au H = Gf , f H >
0 für 0 = u ∈ D(A) und damit die Symmetrie von A,
u , Av H = Au , v H für u, v ∈ D(A).
Der Operator A ist eine Fortsetzung des auf C20 (Ω) := {u ∈ C2 (Ω) ∩ C0 (Ω) |
u = 0 auf ∂Ω} definierten Laplace–Operators u → − Δu, auch Abschluss
des Laplace–Operators auf C20 (Ω) genannt. Die Eigenwertgleichung vi , ϕ V =
λ vi , ϕ H für ϕ ∈ V lautet dann
Avi = λi vi .
Aus dem Regularitätssatz in § 14 : 6.5 (für g = 0, k = 0) ergibt sich ÜA der

Satz. Für beschränkte, C 2 –berandete Gebiete Ω ⊂ Ê n

gilt
D(A) = W01 (Ω) ∩ W (Ω) .

2
Die Norm u → AuH ist äquivalent zur Sobolew–Norm

1/2
u2 = |∂ α u|2 dn x ,
|α|≤2 Ω
d.h. es gilt mit einer Konstanten c ≥ 1
AuH ≤ u2 ≤ c AuH für alle u ∈ D(A).
(b) Satz. Es gilt

∞
D(A) = u ∈ L2 (Ω) λ2i vi , u 2
H <∞ ,
i=1

∞
∞
Au = λi vi , u H vi , Au2H = λ2i vi , u 2
H für u ∈ D(A) .
i=1 i=1
Beweis.
Für u ∈ D(A) gilt v := Au ∈ H und vi , v H = vi , Au H = Avi , u H =
λi vi , u H . Gemäß 1.2 (a) folgt damit

∞
∞
Au2H = v2H = vi , v 2
H = λ2i vi , u 2
H < ∞.
i=1 i=1

∞
Umgekehrt folgt aus λ2i vi , u 2
H < ∞ nach Beweisteil (i) von 1.3 (a) die
i=1

∞
Existenz eines v ∈ H mit v = λi vi , u H vi . Wegen der Stetigkeit des
i=1
Green–Operators G, vgl. 1.2 (c), folgt mit Gvi = λ−1
i vi

∞
∞
u = vi , u H vi = λi vi , u H Gvi = Gv ∈ D(A). 2
i=1 i=1
(c) Für p ≥ 0 definieren wir die p–te Potenz von A als den Operator Ap
mit dem Definitionsbereich

∞
D(Ap ) := u ∈ L2 (Ω) λ2p
i vi , u 2
H <∞
i=1
und der Vorschrift

∞
Ap u := λpi vi , u H vi für u ∈ D(Ap ) .
i=1
Nach 1.3 (a) und 1.4 (b) gilt also
D(A0 ) = H, D(A1/2 ) = W01 (Ω), D(A1 ) = D(A), A1 = A .
Auf D(Ap ) definieren wir ein Skalarprodukt und die zugehörige Norm durch

∞
u, v Ap := Ap u , Ap v H = λ2p
i vi , u H vi , v H ,
i=1
∞
u2Ap := Ap u2H = λ2p
i vi , u 2
H .
i=1

Satz. D(Ap ) , · , · Ap ist ein Hilbertraum, und die (λ−p
k vk ) bilden ein voll-
ständiges ONS für D(Ap ).
Beweis.
Wegen
vi , vk Ap = Ap vi , Ap vk H = λpi vi , λpk vk H
= λ2p
i δik
bilden die wk := λ−p

k vk ein ONS in D(A ). Zum Nachweis der Hilbertraum-
p
eigenschaft von D(A ) betrachten wir die Abbildung

p

Φ : D(Ap ) → 2 , u → Φ(u) := λpi vi , u H i∈ .
Φ ist eine Isometrie wegen

∞
Φu , Φv 2 = λ2p
i vi , u H vi , v H = u, v Ap .
i=1
Φ ist surjektiv: Zu gegebenem a = (a1 , a2 , . . . ) ∈ 2 setzen wir bi := λ−p

i ai

∞
∞
∞
und erhalten λ2p
1 b2i ≤ λ2p 2
i bi = a2i < ∞ . Nach 1.3 (a), Beweisteil (i)
i=1 i=1 i=1
existiert dann eine Funktion u ∈ L2 (Ω) mit vi , u H = bi (i = 1, 2, . . . ) .

∞
∞
Für diese gilt λ2p
i vi , u 2
H = a2i < ∞, also u ∈ D(Ap ) und Φu = a.
i=1 i=1
Φ : D(Ap ) → 2 ist somit unitär, D(Ap ) also ein Hilbertraum. Die wk bilden
ein vollständiges ONS in D(A), weil diese unter Φ auf die Einheitsvektoren des
2 abgebildet werden. 2

(d) Äquivalenzsatz. Sei r ∈ und Ω ⊂ n ein beschränktes, Cr –beran- Ê
detes Gebiet. Dann gilt mit q := 12 (r − 1) = Int 12 (r − 1)

D(Ar/2 ) = u ∈ Wr (Ω) | u, Au, . . . , Aq u ∈ W01 (Ω) ,
und die Norm · Ar/2 ist äquivalent zur Sobolew–Norm · r (vgl. § 14 : 6.4 (b)).
Beweis.
(i) Der Regularitätssatz § 14 : 6.5 (mit g = 0 ) liefert für u ∈ W01 (Ω), ≤ r − 2
Au ∈ W (Ω) ⇐⇒ u ∈ W +2
(Ω),
Au ≤ u +2 ≤ c(Ω, ) Au für u ∈ W +2
(Ω) .

(ii) Für p ≥ 0 gilt nach 1.3 (a) D(Ap+1 ) = u ∈ W01 (Ω) | Au ∈ D(Ap ) ÜA .
(iii) Wir zeigen die Behauptung zunächst für gerades r = 2k durch Induktion
nach k = 1, 2, . . . . Wegen q = [ r−1
2
] = [k − 12 ] = k − 1 lautet die Behauptung

D(Ak ) = u ∈ W2k (Ω) | u, Au, . . . , Ak−1 u ∈ W01 (Ω) ,
uAk ≤ u2k ≤ ck uAk
mit Konstanten ck = ck (Ω). Für k = 1 ist die Behauptung nach dem Satz in
(a) richtig. Ist diese richtig für k ≥ 1, so folgt
(ii)
D(Ak+1 ) = u ∈ W01 (Ω) | Au ∈ D(Ak )
(iii)
= u ∈ W01 (Ω) | Au ∈ W2k (Ω), Au, A2 u, . . . , Ak−1 Au ∈ W01 (Ω)
(i)
= u ∈ W2(k+1) (Ω) | u, Au, . . . , Ak u ∈ W01 (Ω) ,
und für u ∈ D(Ak+1 ) gilt

(iii) (i) (i)
uAk+1 = AuAk ≤ Au2k ≤ u2(k+1) ≤ c(Ω, 2k) Au2k
(iii)
≤ ck c(Ω, 2k) AuAk = ck c(Ω, 2k) uAk+1 .
(iv) Für ungerades r = 2k−1 folgt die Behauptung analog durch Induktion nach
k = 1, 2, . . . . Der Induktionsanfang, d.h. die Behauptung D(A1/2 ) = W01 (Ω)
und die Äquivalenz der Normen · A1/2 und · 1 ergibt sich wie folgt: Die
erste Behauptung folgt nach (c). Nach der Poincaré–Ungleichung § 14 : 6.2 (d)
sind die Normen · 1 und · V äquivalent, und nach 1.3 (a) und der Definition
von · A1/2 gilt

∞
u2A1/2 = λi vi , u 2
H = u2V . 2
i=1
Ê
(e) Entwicklungssatz II. Ist Ω ⊂ n ein Cr –berandetes Gebiet (r ∈ ),
so konvergiert für jede Funktion u ∈ Wr (Ω) die Fourierreihe

∞
u = vi , u H vi in Wr (Ω) ,
i=1
2 Geometrische Eigenschaften von Eigenwerten und -funktionen 381
falls u die Randbedingungen

u, Au, . . . , Aq u ∈ W01 (Ω) mit q := [ r−1
2 ]
erfüllt.
Gilt r > s + n2 für ein s = 0, 1, . . . , so konvergiert die Fourierreihe von u in
Cs (Ω), d.h. es gilt

∞
∂αu = vi , u H ∂ α vi
i=1
gleichmäßig auf Ω für |α| ≤ s. Dies ist insbesondere dann gegeben, wenn
u ∈ Cr (Ω) und u = Δu = . . . = Δq u = 0 auf ∂Ω .
Beweis.
Nach dem Äquivalenzsatz liegt u in D(Ar/2 ) und hat daher nach 1.4 (c) bezüg-
−r/2
lich des ONS wk := λk vk die Fourierentwicklung in D(Ar/2 )

∞

∞
u = wi , u Ar/2 wi = vi , u H vi .
i=1 i=1
Nach dem Äquivalenzsatz konvergiert die Reihe dann auch in Wr (Ω).

Die zweite Aussage ergibt sich mit Hilfe des Einbettungssatzes von Morrey
§ 14 : 6.4 (d). 2
Ê
Beispiel. Ist Ω ⊂ 3 ein C2 –berandetes Gebiet, so konvergiert für jede Funk-
tion u ∈ C 2 (Ω) mit u = Δu = 0 auf ∂Ω die Fourierreihe gleichmäßig auf Ω.
1.5 Aufgaben
(a) Zeigen Sie, dass
A − λ½ : D(A) → L2 (Ω) für λ < 0
bijektiv ist.Weisen Sie hierzu zuerst die Lösbarkeit der Gleichung Au − λu =

g für g ∈ D(A) durch Fourierdarstellung nach und approximieren Sie dann
eine gegebene rechte Seite f ∈ L2 (Ω) unter Verwendung der Eigenschaften des
Green–Operators G (1.2 (c)) durch eine Folge gk ∈ D(A).
(b) Zeigen Sie D(Ar ) → D(As ) für r > s, vgl. 6.4 (d).
2 Geometrische Eigenschaften von Eigenwerten und -funktionen

Wir berichten im folgenden über einige Eigenschaften der Eigenwerte und Ei-
genfunktionen des Laplace–Operators auf beschränkten Gebieten Ω, ohne auf
die Beweise einzugehen (Bezeichnungen wie in 1.2).
2.1 Einfachheit des kleinsten Eigenwerts

(a) λ1 ist einfach, d.h. der zugehörige Eigenraum ist eindimensional.
(b) Die zugehörigen Eigenfunktionen haben keine Nullstelle in Ω.
Für den Beweis von (b) verweisen wir auf Evans [60] 6.5.1, Thm. 2 (iii), Strauss
[53] 11.6, Übg. 9. Aus (b) folgt (a), da zwei Eigenfunktionen ohne Nullstellen in
Ω nicht orthogonal in L2 (Ω) sein können.
2.2 Gebietsmonotonie der Eigenwerte (Courant 1920)

Ê
Für beschränkte C2 –berandete Gebiete Ω1 , Ω2 ⊂ n mit Ω1 ⊂ Ω2 gilt für die
korrespondierenden Eigenwerte des Laplace–Operators
λk (Ω1 ) ≥ λk (Ω2 ) (k = 1, 2, . . . ),
und im Fall Ω2 \ Ω1 = ∅,
λk (Ω1 ) > λk (Ω2 ) (k = 1, 2, . . . ).

√
Da die μk = c λk nach 1.1 als Frequenzen eines am Rand eingespannten
schwingenden Gebildes (Saite, Membran, Kirchenglocke) aufgefasst werden kön-
nen, deckt sich diese Aussage mit der Erfahrung, dass sich bei Verkleinerung
des Gebildes die Frequenzen erhöhen.
Der Beweis beruht auf dem Minimum–Maximum–Prinzip von Courant, einer Er-
weiterung des Rayleigh–Prinzips 1.3 (b). Siehe Courant–Hilbert [2], Kap.6, §2,
Chavel [74] I.5.
2.3 Knotensatz (Courant 1923)

Für eine Eigenfunktion v heißt jede
Zusammenhangskomponente, d.h. je-
des maximale Teilgebiet der Menge
{ x ∈ Ω | v(x) = 0 } ein Knoten-
gebiet von v. Die Figur zeigt acht
Knotengebiete einer Eigenfunktion für
die Kreisscheibe; weitere Knotengebie-
te lassen sich den Figuren in 3.2 ent-
nehmen.
Satz. Die Anzahl der Knotengebiete einer zu λk gehörigen Eigenfunktion beträgt
nicht mehr als k (k = 1, 2, . . .).
Für k = 1 ergibt sich hieraus wieder die Aussage 2.1 (b).
Für den Beweis siehe Courant–Hilbert [2], Kap.6, §2, Chavel [74] 5.1, Dau-
tray–Lions [4, 3] Ch. 8, § 2.9.4.
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 383
2.4 Asymptotische Verteilung der Eigenwerte

Für beschränkte, C2 –berandete Gebiete Ω ⊂ Ê n
gilt
k (2π)n
V n (Ω) = cn lim mit cn = ,
k→∞ n/2
λk V n (K1 (0))
d.h. aus dem Spektrum {λ1 , λ2 , . . . } des Laplace–Operators läßt sich das Volu-
men von Ω bestimmen. (Weyl 1912, Courant 1920).
Für den Beweis siehe Courant–Hilbert [2], Kap.6, §4, Chavel [74] VII.3, Tay-
lor [69, II] 8.3, und für scharfe Fehlerschranken R. Seeley: A sharp asymptotic
remainder estimate . . . , Adv. Math. 29 (1978) 244–269.
Zu diesem berühmten Resultat wurde Weyl durch eine von dem Physiker H. A.
Lorentz 1910 aufgestellte Vermutung zur Hohlraumstrahlung schwarzer Körper
angeregt. Courant fand später einen einfachen Beweis, in welchem er das Ge-
biet Ω von innen und außen durch Quadervereinigungen approximierte und
die Gebietsmonotonie der Eigenwerte ausnutzte. Der Weylsche Satz gab in den
sechziger Jahren Anstoß zu Untersuchungen über die Frage, welche weiteren In-
formationen über die Geometrie von Gebieten oder von geschlossenen Flächen
im Spektrum des Laplace–Operators enthalten sind; siehe hierzu M. Kac: Can
one hear the shape of a drum? Amer. Math. Monthly 73(4) (1966) 1–23.
2.5 Eine isoperimetrische Ungleichung (Faber 1923, Krahn 1925)

Ê
Unter allen Gebieten Ω ⊂ n gleichen Volumens besitzt die Kugel KR = KR (0)
den kleinsten ersten Eigenwert:
λ1 (Ω) ≥ λ1 (KR ) für V n (Ω) = V n (KR ) .
Für den Beweis siehe Chavel [74] IV.2.

Der kleinste Eigenwert der n–dimensionalen R–Kugel ist nach 3.6 gegeben durch
λ1 (KR ) = (jh,1 /R)2 , wobei jh,1 die erste positive Nullstelle der Besselfunktion
Jh mit h = (n − 2)/2 ist.
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel

Im folgenden bestimmen wir vollständige Orthonormalsysteme von Eigenfunk-
tionen für das Dirichletsche Eigenwertproblem
(∗) − Δu = λu in Ω , u = 0 auf ∂Ω
Ê
auf Kreisscheiben und Kugeln Ω = KR = KR (0) ⊂ n (n = 2, 3) durch Sepa-
rationsansätze bezüglich Polar– bzw. Kugelkoordinaten. Wir machen plausibel,
warum Separationsansätze zum Ziel führen.
Der Produktansatz für Eigenfunktionen von (∗) auf der n–dimensionalen Kugel
Ê
KR ⊂ n,
u(x) = X(r) Y (ξ) mit r = x , ξ = x/r ,
führt auf eine gewöhnliche DG zweiter Ordnung für X(r) und ein Eigenwert-
Ê
problem für Y (ξ) auf der Einheitssphäre S n−1 ⊂ n. Die Lösungen des Ei-
genwertproblems auf der Sphäre S n−1 werden Kugelfunktionen (spherical
harmonics) genannt.
Entscheidend ist nun, dass jede Kugelfunktion aus harmonischen, homogenen
Ê
Polynomen auf dem n durch Einschränkung auf die Einheitssphäre S n−1 ent-
steht, und dass sich beliebige“ Funktionen auf der Sphäre S n−1 in Reihen
”
nach solchen Polynomen entwickeln lassen (Weierstraßscher Approximations-
satz). Das hat zur Folge, dass mit den harmonischen Polynomen schon alle
Kugelfunktionen gefunden sind.
Auf dem Ê 2
sind z.B. homogene harmonische Polynome
1, x1 , x2 , x1 x1 − x2 x2 , 2x1 x2 ,
x1 x1 x1 − 3x1 x2 x2 , 3x1 x1 x2 − x2 x2 x2 , . . . ,
ÜA . Nach Einschränkung auf den Einheitskreis S 1 ergibt sich aus diesen in
Polarkoordinaten
1, cos ϕ, sin ϕ, cos 2ϕ , sin 2ϕ, cos 3ϕ , sin 3ϕ, . . . .
Auf dem Ê 3
sind homogene harmonische Polynome
1, x1 , x2 , x3 , x1 x1 − x3 x3 , x2 x2 − x3 x3 , x1 x2 , x1 x3 , x2 x3 , . . . .
Die zugehörigen Kugelfunktionen auf der S 2 lassen sich durch Produkte von
trigonometrischen Funktionen und Legendre–Polynomen darstellen.
Auf diesen systematischen Zugang können wir aus Platzgründen nicht eingehen
und verweisen auf Folland [61] p.126–139, Michlin [51] Kap.14.
Im Folgenden bestimmen wir Orthonormalsysteme für das Dirichletsche Eigen-
wertproblem (∗) direkt durch Separationsansatz, machen also keinen Gebrauch
von harmonischen Polynomen. Der Radialanteil X(r) der Eigenfunktionen auf
Kreisscheiben und Kugeln wird bis auf einen Faktor durch Besselfunktionen dar-
gestellt, und die Eigenwerte λ können aus den Nullstellen von Besselfunktionen
bestimmt werden.
3.1 Die Orthogonalität der Besselfunktionen

Jede Lösung v der Besselschen Differentialgleichung vom Index ν ≥ 0 zum
Eigenwert λ > 0,

1 ν2
v (r) + v (r) + λ− v(r) = 0 für r > 0,
r r2
√
geht durch die Umskalierung V (t) := v(t/ λ) über in eine Lösung der Bessel-
schen Differentialgleichung vom Index ν zum Eigenwert λ = 1,

1 ν2
V (t) + V (t) + 1− V (t) = 0 für t > 0 .
t r2
Nach § 4 : 4.7 ist jede Lösung dieser Gleichung, für die t−ν V (t) beschränkt ist,
bis auf einen konstanten Faktor die Besselfunktion Jν . Deren Reihendarstellung
lautet

∞ ν+2k
(−1)k t
Jν (t) =
k! Γ(ν + k + 1) 2
k=0
1 t
ν 1 t
2 1
4
t

= 1− + − ... .
Γ(ν + 1) 2 1! (ν + 1) 2 2! (ν + 1)(ν + 2) 2
Weiter wurde in § 4 : 4.7 (e) gezeigt, dass die positiven Nullstellen von Jν eine
Folge 0 < jν,1 < jν,2 < . . . mit lim jν,k = ∞ bilden.
k→∞
Aus diesen Feststellungen ergibt sich:

(a) Für jede Lösung λ > 0, v = 0 des Eigenwertproblems

1 ν2
v (r) + v (r) + λ− v(r) = 0 in ]0, R[ ,
r r2
r −ν v(r) beschränkt , v(R) = 0
gibt es (genau) ein k ∈ und eine Konstante c mit

λ = (jν,k /R) , 2
v(r) = c Jν (jν,k r/R) für r ∈ [0, R] .
Wie sich zeigen wird, liefern die Nullstellen jν,k der Besselfunktionen für halb-
zahlige ν die Eigenwerte des Dirichletschen Eigenwertproblems (∗). Diese Null-
stellen können mit Computerprogrammen (z.B. MAPLE, MATHEMATICA) be-
rechnet oder Tabellenwerken entnommen werden.
(b) Satz. Für R > 0, ν ≥ 0 ist { vkν | k ∈ } mit

√ √
r 2 2
vkν (r) := ckν Jν (jν,k R ), ckν := =
R |Jν (jν,k )| R |Jν+1 (jν,k )|
ein Orthonormalsystem bezüglich des gewichteten Skalarprodukts
R
u, v r := u(r) v(r) r dr .
0
Beweis.
Für k = setzen wir u(r) := Jν (jν,k R
r r
), v(r) := Jν (jν, R ), λ := (jν,k /R)2 ,
2
μ = (jν, /R) und schreiben die Besselsche DG in der Form Lu = λu, Lv = μv.
Wegen u(R) = v(R) = 0 gilt dann
(λ − μ) u , v r = Lu , v r − u , Lv r

R

1 ν2 1 ν2
= − (r u ) + 2 u v − u − (r v ) + 2 v r dr
r r r r
0
R
R
= − (r u ) v + u (r v ) dr = −r (u v − uv ) 0 = 0 ,
0
also vkν , v ν r = ckν c ν u, v r = 0 wegen λ − μ = 0.

Aus der Besselschen DG für u ergibt sich

1 ν2
0 = (r u ) + λ− u 2r 2 u
r r2

= (r u )2 + λr 2 − ν 2 (u2 )

= (r u )2 + λr 2 − ν 2 u2 − 2λr u2 ,
woraus durch Integration von 0 bis R unter Beachtung von ν u(0) = 0 folgt
R
0 = (r u )2 + (λr 2 − ν 2 ) u2 0 − 2λ
R
u(r)2 r dr
0
= (R u (R))2 − 2λ u2r ,
2 2
R R
c−2
kν vkν r = ur =
2 2
√ u (R) = √ Jν (jν,k )
2λ 2
2
R −2
= √ Jν+1 (jν,k ) = ckν .
2
Die vorletzte Gleichheit ergibt sich dabei aus der Identität in § 4 : 4.7 (f)
ν
Jν+1 (jν,k ) = Jν (jν,k ) − Jν (jν,k ) = − Jν (jν,k ) . 2
jν,k
(c) Ersetzen wir in (a) die Randbedingung v(R) = 0 durch v (R) = 0, so bleibt
∗
Aussage (b) richtig, wenn die jν,k ersetzt werden durch die Nullstellen jν,k von
Jν und die Normierungskonstanten ckν durch
2 1
c∗kν := ∗ ∗
.
1 − (ν/jν,k )2 R |Jν (jν,k )|
Das ergibt sich unmittelbar aus dem vorhergehenden Beweis ÜA .
3.2 Eigenwerte und Eigenfunktionen auf der Kreisscheibe

(a) Nach § 6 : 5.2 geht das Eigenwertproblem (∗) durch Transformation in Po-
larkoordinaten (r, ϕ) über in
⎧ ∂U
⎪ 1 ∂ 1 ∂2U
⎪
⎪ − r − = λU in 0 < r < R , −π < ϕ < π ,
⎪
⎪ r ∂r ∂r r 2 ∂ϕ2
⎪
⎪
⎨ ∂U ∂U
(∗∗) U (r, π) = U (r, −π) , (r, π) = (r, −π) für 0 < r < R ,
⎪
⎪
∂ϕ ∂ϕ
⎪
⎪
⎪
⎪ U beschränkt,
⎪
⎩
U (R, ϕ) = 0 für − π < ϕ < π .
Der Separationsansatz U (r, ϕ) = v(r) w(ϕ) führt nach bekanntem Muster auf
die Gleichungen
⎧ 2
⎨ 1 (rv (r)) + λ − v(r) = 0 in ]0, R[ ,
(1) r r2
⎩
v beschränkt, v(R) = 0 ,

w (ϕ) + 2 w(ϕ) = 0 für − π < ϕ < π ,
(2)
w(π) = w(−π) , w (π) = w (−π) ,
wobei eine Konstante ist. Die sämtlichen Lösungen von (2) sind
w(ϕ) = a0 für = 0 ,
w(ϕ) = a cos(ϕ) + b sin(ϕ) für = 1, 2, . . .
Ê
mit Konstanten a , b ∈ . Nach 3.1 (a) erhalten wir sämtliche Eigenwerte und
zugehörige Eigenfunktionen durch
λk0 = (j0,k /R)2 , r
J0 (j0,k R ),
2 r r
λk = (j ,k /R) , J (j ,k R ) cos(ϕ) und J (j ,k R ) sin(ϕ)
für k, = 1, 2, . . . , wobei J die Besselfunktion vom Index ist und j ,k deren
positive Nullstellen sind.
Diese Eigenfunktionen nummerieren wir folgendermaßen:

J (j r
,k R ) cos(ϕ) für ≥ 0 ,
uk (r cos ϕ, r sin ϕ) :=
r
J− (j− ,k R ) sin(ϕ) für < 0
(0 < r < R, −π < ϕ ≤ π, k ∈ , ∈ ).
Satz. Für das Dirichletsche Eigenwertproblem (∗) auf der Kreisscheibe Ω =

KR (0) ⊂ 2 sind ein vollständiges Orthonormalsystem von Eigenfunktionen in
L2 (Ω) und die zugehörigen Eigenwerte gegeben durch
(k ∈ , ∈
ck 2
uk , λk = (j| |,k /R) )
π (1 + δ 0 )
mit dem Kronecker–Symbol δ00 = 1 und δ 0 = 0 für = 0

√ √
2 2
ck = = .
R |J (j ,k )| R |J +1 (j| |,k )|
Euler fand diese Eigenfunktionen 1759 bei der Untersuchung der Schwingungen
der kreisförmigen Membran.
Nach 1.1 liefern die√uk die Eigenschwingungen der kreisförmigen Membran√ mit
den Frequenzen c λk = c j ,k /R . Der Grundton hat die Frequenz c λ10 =
c j0,1 /R ≈ 2.4048 c/R .
Der kleinste Eigenwert λ10 ist einfach, während die höheren Eigenwerte λk mit
k + || > 1 mindestens die Vielfachheit 2 besitzen.
Die folgenden Abbildungen zeigen einige Eigenfunktionen der kreisförmigen
Membran.
u10 u31
u25 u17
Für das Neumannsche Eigenwertproblem ergibt sich ein ähnlich gebautes Or-
thonormalsystem.
ÜA Bestimmen Sie dieses unter Verwendung von 3.1 (c).
Beweis.
(i) Nach dem Transformationssatz für Integrale hat das L2 –Skalarprodukt auf
der Kreisscheibe für Funktionen in Produktform
(vi ⊗ wi )(r cos ϕ, r sin ϕ) := vi (r) wi (ϕ)
die Gestalt
R π
v1 ⊗ v2 , w1 ⊗ w2 = v1 (r) v2 (r) r dr w1 (ϕ) w2 (ϕ) dϕ .
0 −π
Hieraus ergibt sich die Orthonormalität des Systems

<

A :=
ck
uk k ∈ , ∈
π (1 + δ 0 )
aus den Orthonormalitätseigenschaften der trigonometrischen Funktionen und
der Besselfunktionen 3.1 (b) ÜA .
(ii) Nach dem Entwicklungssatz in 1.2 existiert ein vollständiges ONS B für
L2 (Ω) aus Eigenfunktionen des Dirichletschen Eigenwertproblems (∗). Die Voll-
ständigkeit des ONS A ist bewiesen, wenn wir gezeigt haben, dass jede Eigen-
funktion eine Linearkombination von Funktionen aus A ist, was insbesondere
B ⊂ Span A bedeutet.
Es sei also λ > 0, u ∈ C2 (Ω) eine beliebige Lösung des Eigenwertproblems (∗)
und U (r, ϕ) := u(r cos ϕ, r sin ϕ). Für jedes r ∈ [0, R] besitzt die 2π–periodische
Funktion ϕ → U (r, ϕ) nach § 6 : 2.3 die gleichmäßig konvergente Fourierentwick-
lung
∞
1 π
U (r, ϕ) = a (r) ei ϕ mit a (r) = U (r, ϕ) e−i ϕ dϕ .
=−∞ 2π −π
Die Fourierkoeffizienten r → a (r) sind C2 –Funktionen auf [0, R], genügen

nach (∗∗) der Randbedingung a (R) = 0 und erfüllen die Besselsche DG

1 2
rv (r) + λ− v(r) = 0 in ]0, R] ;
r r2
Letzteres ergibt sich durch zweimalige partielle Integration ÜA .

Für jedes ∈ mit a = 0 gibt es daher nach 3.1 (a) (genau) ein k ∈ und
eine Konstante α mit
2 r
√
λ = (j| |,k /R) = λk| | , a (r) = α J| | (j| |,k R ) = α J| | ( λ r) .
Die Menge I dieser ∈ ist wegen u = 0 nicht leer. I ist endlich, weil der
Eigenwert λ nach 1.2 endliche Vielfachheit besitzt. Damit erhalten wir
√
u(x) = U (r, ϕ) = a (r) ei ϕ
= α J| | ( λ r) ei ϕ
∈I ∈I
und nach Umformung der letzten Summe in eine Summe von reellen Ausdrücken
schließlich u ∈ Span A. 2
Aufgaben. Bestimmen Sie Lösungen des Dirichletschen Eigenwertproblems:

(a) für den Kreissektor durch Produktansatz in Polarkoordinaten,
(b) für den Zylinder mit Radius R und Höhe H durch Produktansatz in Zylin-
derkoordinaten.
3.3 Separationsansatz für das Eigenwertproblem auf Kugeln

(a) Der Laplace–Operator auf der Kugel Ω = KR (0) ⊂ 3 läßt sich in Kugel-
koordinaten nach der Jacobischen Formel § 11 : 5.2 (b) in der Form

1 ∂ ∂U 1
Δu = r2 + Δ 2U
r 2 ∂r ∂r r2 S
schreiben, wobei der Laplace–Beltrami–Operator ΔS 2 auf der Einheits-

sphäre S 2 ⊂ 3 definiert ist durch

1 ∂ ∂U 1 ∂2U
ΔS 2 U := sin ϑ + 2
sin ϑ ∂ϑ ∂ϑ sin ϑ ∂ϕ2
(zur Koordinatenunabhängigkeit dieses Ausdrucks siehe Teil (b) dieses Ab-

schnitts).
Die Eigenwertgleichung (∗) für die dreidimensionale Kugel erhält damit in Ku-
gelkoordinaten die Gestalt
⎧
1 ∂ 2 ∂U 1
⎪
⎪ − r − 2 ΔS 2 U = λU
⎪
⎪ r 2 ∂r ∂r r
⎪
⎪
⎪
⎪ in 0 < r < R , 0 < ϑ < π , −π < ϕ < π ,
⎪
⎪
⎨ ∂U ∂U
(∗∗∗) U (r, ϑ, π) = U (r, ϑ, −π) , (r, ϑ, π) = (r, ϑ, −π)
⎪
⎪
∂ϕ ∂ϕ
⎪
⎪ für 0 < r < R , 0 < ϑ < π ,
⎪
⎪
⎪
⎪
⎪
⎪ U beschränkt,
⎩
U (R, ϑ, ϕ) = 0 für 0 < ϑ < π , −π < ϕ < π .
Der Separationsansatz U (r, ϑ, ϕ) = X(r)Y (ϑ, ϕ) zerlegt das Problem (∗∗∗) mit
den aus § 6 bekannten Argumenten in die Gleichungen
⎧
⎨ 1 r2 X (r)
+ λ−
μ
X(r) = 0 in 0 < r < R ,
2r r2
(1)
⎩
X beschränkt , X(R) = 0 ,
und
⎧
⎪ −ΔS 2 Y = μY in 0 < ϑ < π , −π < ϕ < π ,
⎪
⎨
∂Y ∂Y
(KF) Y (ϑ, π) = Y (ϑ, −π) , (ϑ, π) = (ϑ, −π) für 0 < ϑ < π ,
⎪
⎪ ∂ϕ ∂ϕ
⎩
Y beschränkt
mit einer Konstanten μ. Die Lösungen Y = 0 von (KF) sind die Kugelfunktio-
nen, dargestellt in Kugelkoordinaten.
Die weitere Separation Y (ϑ, ϕ) = V (ϑ) W (ϕ) spaltet die Gleichungen (KF) auf
in
⎧
⎪
⎨ 1 m2
sin ϑ V (ϑ) + μ− V (ϑ) = 0 in 0 < ϑ < π ,
(2) sin ϑ sin2 ϑ
⎪
⎩ V beschränkt,
und

W (ϕ) + m2 W (ϕ) = 0 in − π < ϕ < π ,
(3)
W (π) = W (−π) , W (π) = W (−π) ,
mit einer Konstanten m, für die nach (3) nur m = 0, 1, . . . in Frage kommt.
Durch die Transformation v(s) := V (arccos s), bzw. V (ϑ) = v(cos ϑ) geht (2)
über in das Eigenwertproblem
⎧
⎨ (1 − s2 ) v (s) m2
+ μ− v(s) = 0 in − 1 < s < 1 ,

(2 ) 1 − s2
⎩
v beschränkt.
Die hierin auftretende Legendresche Differentialgleichung hat nach § 4 : 4.5 nur

für die Werte μ = ( + 1) mit = m, m + 1, . . . beschränkte Lösungen, und
diese sind bis auf multiplikative Konstanten die Legendre–Funktionen P m .
Die Gleichung
√ (1) geht für die Werte μ = ( + 1) durch die Transformation
x(r) := r X(r) über in das Eigenwertproblem für die Besselsche Differential-
gleichung vom Index + 12 ÜA
⎧ 1 2
⎨ x (r) + 1 x (r) + λ − ( + 2 ) x(r) = 0 in ]0, R[ ,
(1 ) r r 2
⎩
x beschränkt, x(R) = 0 .
Die Lösungen λ, x = 0 dieses Eigenwertproblems haben nach 3.1 (a) die Gestalt
λ = (jν,k /R)2 , r
x(r) = Jν (rν,k R ) mit ν := + 1
2
und k ∈ (die multiplikative Konstante vor J (. . .) gleich 1 gesetzt).

ν
Wir erhalten somit Eigenfunktionen in Produktgestalt bezüglich Kugelkoordi-

naten r, ϑ, ϕ des Eigenwertproblems (∗) auf der Kugel Ω = KR (d.h. Lösungen
von (∗∗∗))
1 r 1 r
√ Jν (jν,k R ) P m (cos ϑ) cos(mϕ) und √ Jν (jν,k R ) P m (cos ϑ) sin(mϕ)
r r
für ν := + 12 , k ∈ , ∈ , m ∈ {0, 1, . . . , }.

0
In 3.6 zeigen wir, dass diese nach geeigneter Normierung ein vollständiges Or-
thonormalsystem in L2 (Ω) liefern.
(b) Für C2 –Funktionen u auf einer m–dimensionalen C2 –Untermannigfaltigkeit

Ê
M ⊂ n setzen wir
1 m
√
(ΔM u)(x) := √ ∂i ( g g ik ∂k U )(ξ) für x = Φ(ξ) ∈ M.
g i,k=1
Dabei sind ξ = (ξ1 , . . . , ξm ) → Φ(ξ) eine lokale Parametrisierung von M ,

U := u ◦ Φ,
gik := ∂i Φ , ∂k Φ die Koeffizienten der Gramschen Matrix,
(g ik ) die zu (gik ) inverse Matrix,
g := det(gik ) die Gramsche Determinante.
Satz. Der Ausdruck ΔM u ist koordinateninvariant, d.h. hängt nicht von der
Wahl der Parametrisierung Φ ab.
ΔM u wird der Laplace–Beltrami–Operator auf M genannt.
Der Beweis erfolgt mit analogen Argumenten wie beim Beweis der Jacobischen
Formel § 11 : 5.2, siehe Bd. 3, § 9 : 3.3 (c).
ÜA Überzeugen Sie sich davon, dass ΔM für die zweidimensionale Sphäre
M = S 2 bei Verwendung von Kugelkoordinaten Φ mit dem in (a) definierten
Ausdruck übereinstimmt.
3.4 Die Vollständigkeit der Legendre–Funktionen

(a) Die (allgemeine) Legendresche Differentialgleichung vom Index m ∈ , 0
m 2

(1 − s2 )v (s) + μ− v(s) = 0 in − 1 < s < 1 ,
1 − s2
besitzt nach § 4 : 4.5 nur für die Werte μ = ( + 1) mit = m, m + 1, . . .
beschränkte Lösungen, und diese sind konstante Vielfache der (zugeordneten)
Legendre–Funktionen
(1 − s2 )m/2
+m
d
P m (s) = (s2 − 1) .
2 ! ds
Für die Legendre–Polynome P := P 0 gilt nach § 4 : 3.2

1 d 1 2 − 2k −2k
P (s) = (s2 − 1) = (−1)k s ,
2 ! ds 2 k
0≤2k≤
(m)
P m (s) = (1 − s2 )m/2 P (s) .
Legendre verwendete die nach ihm benannten Funktionen bei der Untersu-
chung der Anziehungskräfte von Rotationskörpern (1785/87).
& '

(b) Satz. + 1
2
P = 0, 1, . . . ist ein vollständiges Orthonormalsys-
2
tem in L (]−1, 1[). Dieses Orthonormalsystem stellt die Gram–Schmidt–Ortho-
normalisierung der Potenzen 1, s, s2 , . . . dar.
Beweis.
(i) Für g(s) := (s2 − 1) = (s + 1) (s − 1) folgt mit Hilfe der Leibniz–Regel
g (k) (1) = g (k) (−1) = 0 für k < . Definitionsgemäß ist g ( ) = 2 ! P . Für jede
Funktion f ∈ C∞ [−1, 1] folgt durch –fache partielle Integration ÜA
1 1 1 1 ( )
f,P = f (s) g ( ) (s) ds = f (s) (1 − s2 ) ds .
2 ! −1 2 ! −1
(ii) Für k < gilt Pk , P = 0, da Pk ein Polynom k–ten Grades ist.

Aus der Reihendarstellung von f := P folgt f ( ) (s) = (2)!/(2 !), also
(2)! 1 (2)! 1
P ,P = (1 − s 2
) ds = (1 + s) (1 − s) ds .
(2 !)2 −1 (2 !)2 −1
Durch weitere –malige partielle Integration ergibt sich hieraus ÜA
1 1 2
P ,P = (1 + s)2 (1 − s)0 ds = .
22 −1
2 + 1
(iii) Der höchste Koeffizient von P ist positiv. Dasselbe ergibt sich für die
höchsten Koeffizienten der Polynome vn , die aus den Potenzen uk (s) = sk
durch Orthonormalisierung entstehen:
Nach Bd. 1, § 19 : 3.1 gilt vn = (un − Pn−1 un )/un − Pn−1 un , wobei Pn−1 un
vom Grad ≤ n−1 ist. Da Orthonormalsysteme bis auf das Vorzeichen festgelegt
sind, folgt vn = Pn für n ∈ 0 .
(iv) Die Vollständigkeit wird in (c) mitbewiesen. 2
& '
(c) Satz. Für jedes m ∈ 0 ist ( −m)!
( +m)!

( + 12 ) P m = m, m + 1, . . .
ein vollständiges Orthonormalsystem in L (] − 1, 1[). 2
Beweis.
(i) Für k, ≥ m und k = setzen wir zur Abkürzung u := Pkm , v := P m und
schreiben die Legendresche DG in der Form
Lu = k(k + 1)u , Lv = ( + 1)v .
Damit erhalten wir

k(k + 1) − ( + 1) u, v = Lu , v − u , Lv
1 m2

m2

= −((1 − s2 )u ) + 1−s2
u v − u −((1 − s2 )v ) + 1−s2
v ds
−1
1
= − (1 − s2 )u v + u (1 − s2 )v ds
−1

−(1 − s2 ) (u v − uv ) −1 = 0 ,
1
=
also Pkm , P m = u , v = 0 wegen k = .

(ii) Für festes gilt mit der Abkürzung um := P m (m = 0, 1, . . . , )

(m)
um = (1 − s2 )1/2 (1 − s)(m−1)/2 P

(m−1)
= (1 − s)1/2 (1 − s2 )(m−1)/2 P

(m−1)
+ (m − 1) s (1 − s2 )(m−3)/2 P
= (1 − s2 )1/2 um−1 + (m − 1) s (1 − s2 )−1/2 um−1 ,
(m−1)2 s2
u2m = (1 − s2 ) u2
m−1 + 2(m − 1) s um−1 um−1 + 1−s2
u2m−1

= (1 − s2 ) um−1 um−1 + (m − 1) s u2m−1
(m−1)2 s2
− (1 − s2 )um−1 um−1 − (m − 1) u2m−1 + 1−s2
u2m−1

(m−1)2 (m−1)2 s2
= ... + ( + 1) − 1−s2
− (m − 1) + 1−s2
u2m−1

= ... + ( + 1) − m (m − 1) u2m−1

= ... + ( + m) ( − m + 1) u2m−1 .
Hieraus folgt
1 1
u2m ds = ( + m) ( − m + 1) u2m−1 ds ,
−1 −1
und durch m–fache Iteration dieser Beziehung ergibt sich zusammen mit (b)
1 1 ( + m)! 1 2
(P m )2 ds = u2m ds = u ds
−1 −1
( − m)! −1 0
( + m)! 1 ( + m)! 2
= (P )2 ds = .
( − m)! −1 ( − m)! 2 + 1
(iii) Da C0c (]−1, 1[) in L2 (]−1, 1[) dicht liegt (§ 10 : 3.2), reicht es für die Voll-
ständigkeit des Orthonormalsystems nachzuweisen, dass es zu f ∈ C0c (]−1, 1[)
und jedem ε > 0 ein g ∈ Span {P m | = m, m + 1, . . .} mit f − g ≤ ε gibt.
Da F (s) := (1 − s2 )−m/2 f (s) auf [−1, 1] stetig ist, existiert nach dem Weier-
straßschen Approximationssatz (§ 6 : 2.9) ein Polynom G mit
√
|F (s) − G(s)| ≤ ε/ 2 für s ∈ [−1, 1] .
(m)
Da die P Polynome ( − m)–ten Grades sind, folgt
(m)
G ∈ Span {P | ≥ m },
und für g(s) := (1 − s2 )m/2 G(s) dann
g ∈ Span {P m | ≥ m }.
Weiter ist
√
f (s) − g(s) = (1 − s2 )m/2 F (s) − G(s) ≤ ε/ 2 für s ∈ [−1, 1] ,
√
also f − g ≤ 2 f − g∞ ≤ ε . 2
3.5 Die Vollständigkeit der Kugelfunktionen

(a) Der Vektorraum aller messbaren Funktionen Y : ]0, π[ × ]−π, π[ mit der
Norm
π π
Y 2S 2 := Y (ϑ, ϕ)2 sin ϑ dϑ dϕ < ∞
0 −π
und dem zugehörigen Skalarprodukt
π π
Y1 , Y2 S2 := Y1 (ϑ, ϕ) Y2 (ϑ, ϕ) sin ϑ dϑ dϕ
0 −π
(mit der üblichen Identifizierung fast überall gleicher Funktionen) ist ein Hil-
bertraum, bezeichnet mit L2 (S 2 ).
√
Um dies einzusehen, betrachten wir Ω = ]0, π[ × ]−π, π[ und (ϑ, ϕ) = sin ϑ.
Wegen > 0 auf Ω ist Y : Ω → Ê
genau dann messbar, wenn y := Y / mess-
bar ist, und es gilt Y ∈ L2 (S 2 ) ⇐⇒ y = Y / ∈ L2 (Ω). Die Abbildung
U : L2 (Ω) → L2 (S 2 ), y → y ist also ein Isomorphismus, vgl. § 9 : 1.2.
Da do = sin ϑ dϑ dϕ das Oberflächenelement
der Sphäre S 2 ist, können wir
Y1 , Y2 S 2 als Oberflächenintegral S 2 u1 u2 do auffassen; dabei ist Yk = uk ◦Φ
(k = 1, 2) und Φ die Parametrisierung von S 2 durch Kugelkoordinaten.
(b) Die in 3.3 gefundenen Produktlösungen des Eigenwertproblems (KF) und
die zugehörigen Eigenwerte μ nummerieren wir wie folgt: Für ∈ 0 , m ∈
mit |m| ≤ setzen wir

m
P m (cos ϑ) cos(mϕ) für 0 ≤ m ≤ ,
Y (ϑ, ϕ) := −m
P (cos ϑ) sin(mϕ) für − ≤ m < 0 ,
μm := ( + 1) .
Satz. Die Kugelfunktionen cm Y m ( ∈ , 0 m∈ , |m| ≤ ) mit

⎧
⎪ 1
⎪
⎪ √ + 1
für m=0
⎨ 2π 2
m
c :=
⎪
⎪ ( − |m|)!

⎪
⎩ √1 +
1
für m = 0
π ( + |m|)! 2
bilden ein vollständiges Orthonormalsystem für L2 (S 2 ).

Der Eigenraum des Eigenwertproblems (KF) zum Eigenwert (+1) ist (2+1)–
dimensional und wird aufgespannt von Y −m , . . . , Y 0 , . . . , Y m .
Bemerkungen. (i) Die Y m ( |m| ≤ ) fallen als Real– und Imaginärteile der
Z m (ϑ, ϕ) = P m (cos ϑ) eimϕ an. Die Z m bilden bei passender Normierung ein
vollständiges ONS für den komplexen Hilbertraum L2 (S 2 ) mit dem entspre-
chenden Skalarprodukt und werden ebenfalls Kugelfunktionen genannt.
(ii) Laplace fand 1785 die Kugel-
funktionen bei Untersuchungen
über die Anziehungskräfte
von Rotationskörpern.
Die nebenstehende
Figur zeigt den
6
Graphen von Y11
über dem halben
Koordinatenrechteck [0, π] × [0, π].
Beweis.
Wir verwenden das Vollständigkeitskriterium § 9 : 4.4 (e), nach welchem ein ONS
genau dann vollständig ist, wenn nur der Nullvektor zu diesem orthogonal ist.
Sei also
f ∈ L2 (S 2 ) und Ym, f S2 = 0 für ∈ 0 , |m| ≤ .
Wir gehen der Übersichtlichkeit halber ins Komplexe. Für die oben definierten
Z m und für F (s, ϕ) := f (arccos s, ϕ) gilt dann aufgrund des Satzes von Fubini
§ 8 : 1.8 und des Transformationssatzes § 8 : 1.9
π π
e−imϕ P
(m)
0 = Zm , f S2 := (cos ϑ) f (ϑ, ϕ) sin ϑ dϑ dϕ
0 −π
1 π
e−imϕ F (s, ϕ) dϕ P
(m)
= (s) ds
−1 −π
für festes m ∈ und alle ≥ |m|. Wegen der in 3.4 (c) festgestellten Vollstän–
digkeit der Legendre–Funktionen folgt daraus

π π π
0= e−imϕ F (s, ϕ) dϕ = F (s, ϕ) cos(mϕ) dϕ − i F (s, ϕ) sin(mϕ) dϕ
−π −π −π
für fast alle s ∈ [−1, 1] und alle m ∈ . Wegen der Vollständigkeit der tri-
gonometrischen Funktionen in L2 [−π, π] (§ 9 : 4.5) ergibt sich daraus mit der
π
Parsevalschen Gleichung F (s, ϕ)2 dϕ = 0 für fast alle s ∈ [−1, 1].
−π
Der Satz von Tonelli § 8 : 1.8 und der Transformationssatz § 8 : 1.9 liefern
π π 1 π
f (ϑ, ϕ)2 sin ϑ dϑ dϕ = F (s, ϕ)2 dϕ ds = 0
0 −π −1 −π
und damit f = 0. 2
(c) Aufgabe. Für x = (r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ) sei
H m (x) := r Y m (ϑ, ϕ) für |m| ≤ ≤ 2 .
Zeigen Sie, dass H m ein harmonisches und vom Grad homogenes Polynom ist,
siehe die Einleitung zu diesem Abschnitt.
Zeigen Sie weiter, dass sich jedes homogene Polynom zweiten Grades (d.h. jede
quadratische Form in 3) auf eindeutige Weise in der Gestalt

3
2
2 H2 (x) + α0 x H0 (x)
2
aik xi xk = αm m 0 0
i,k=1 m=−2
darstellen läßt.
3.6 Eigenwerte und Eigenfunktionen auf Kugeln

Satz. Für das Dirichletsche Eigenwertproblem (∗) auf der Kugel Ω = KR (0)
im 3 sind ein vollständiges Orthonormalsystem von Eigenfunktionen in L2 (Ω)
und die zugehörigen Eigenwerte gegeben durch

uk m | k ∈ , ∈ 0 , m ∈ mit |m| ≤ , λk m = (j +1/2,k /R)
2
mit
ck m r
uk m (x) = √ J +1/2 j +1/2,k R Y m (ϑ, ϕ)
r
für x = (r sin ϑ cos ϕ, r sin ϑ sin ϑ, r cos ϑ) (0 < r ≤ R, 0 ≤ ϑ ≤ π, −π < ϕ ≤ π)
und
√
2 ( − |m|)! 1 1
ck m =
+ .
R |J +1/2 (j +1/2 )| ( + |m|)! 2 π (1 + δm0 )
Dabei ist J +1/2 die Besselfunktion vom Index + 12 , j +1/2,k sind die positiven

Nullstellen von J +1/2 (k ∈ , ∈ 0 , vgl. 3.1), {Y m } ist das in 3.5 definier-
te System von Kugelfunktionen und δm0 das Kronecker–Symbol ( δ00 = 1 und
δm0 = 0 für m ∈ ).
Für das Neumannsche Eigenwertproblem ergibt sich ein ganz entsprechendes
Orthonormalsystem, indem die j +1/2,k durch die Nullstellen der abgeleiteten
Besselfunktionen J +1/2 ersetzt werden, vgl. 3.2 (b), 3.1 (c).
Beweis.
(i) Nach dem Transformationssatz für Integrale hat das L2 –Skalarprodukt auf
der Kugel Ω = KR (0) für Funktionen in Produktform (Xi ⊗ Yi )(r, ϑ, ϕ) :=
Xi (r) Yi (ϑ, ϕ) die Gestalt
R π π
X1 ⊗ Y1 , X2 ⊗ Y2 = X1 (r) X2 (r) r 2 dr Y1 (ϑ, ϕ) Y2 (ϑ, ϕ) sin ϑ dϑ dϕ .
0 −π 0
Hieraus ergibt sich die Orthonormalität des Systems A := {uk m } aus den
Orthonormalitätseigenschaften der Besselfunktionen 3.1 (b) und denen der Ku-
gelfunktionen 3.4 ÜA .
(ii) Nach dem Entwicklungssatz 1.2 existiert ein vollständiges ONS B für L2 (Ω),
bestehend aus Eigenfunktionen vi ∈ C2 (Ω) des Dirichletschen Eigenwertpro-
blems (∗). Die Vollständigkeit des ONS A ist bewiesen, wenn wir gezeigt haben,
dass jede Eigenfunktion u eine Linearkombination von Funktionen aus A ist,
was B ⊂ Span A bedeutet.
Sei also u ∈ C2 (Ω) eine beliebige Eigenfunktion des Problems (∗) zum Eigenwert
λ > 0 und U (r, ϑ, ϕ) := u(r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ). Für jedes r ∈ [0, R]
besitzt die Funktion (ϑ, ϕ) → U (r, ϑ, ϕ) nach 3.5 die Fourierentwicklung

U (r, ϑ, ϕ) = Am (r) Y m (ϑ, ϕ)
|m|≤
in L2 (S 2 ) mit den Fourierkoeffizienten
( − |m|)! + 12 π π
Am (r) = U (r, ϑ, ϕ) Y m (ϑ, ϕ) sin ϑ dϑ dϕ .
( + |m|)! π (1 + δm0 ) 0 −π
Die Funktionen r → Am (r) sind C2 –differenzierbar auf [0, R], genügen nach
(∗∗∗) in 3.3 der Randbedingung Am (R) = 0 und erfüllen die DG

1 2 ( + 1)
r X (r) + λ− X(r) = 0 in ]0, R] ,
r2 r2
was sich aus der Eigenwertgleichung in (∗∗∗) durch zweimalige partielle Inte-
gration ergibt ÜA .
√
Für jedes Paar , m mit Am = 0 ist am (r) := r Am (r) nach 3.3 eine Lösung
1
der Besselschen DG vom Index + 2 zum Eigenwert λ mit der Eigenschaft,
dass r −1/2 am (r) beschränkt ist. Nach 3.1 (a) gibt es (genau) ein k ∈ und
eine Konstante αm ∈ mit Ê
2
λ = (j +1/2,k /R) = λ|k|m ,
Am (r) = r −1/2 am (r) = r −1/2 αm J r

+1/2 (j +1/2,k R )
√
= αm r −1/2 J +1/2 ( λ r) .
Wegen u = 0 ist die Menge I dieser (m, ) nicht leer. Weiter ist I endlich, weil
der Eigenwert λ nach 1.2 endliche Vielfachheit besitzt. Damit ist

u(x) = U (r, ϑ, ϕ) = Am (r) Y m (ϑ, ϕ)
(m, )∈I
αm √
= √ J +1/2 ( λ r) Y m (ϑ, ϕ) ,
(m, )∈I r
was u ∈ Span A bedeutet. 2
Für die R–Kugel im Ê n

ergeben sich die Eigenwerte
λk = (j +h,k /R)
2
mit h := n−2
2 (k ∈ Æ, ∈ Æ ) ,
0
und die Radialanteile der zugehörigen Eigenfunktionen sind

r −h J +h j +h,k R
r
,
siehe Folland [61] p. 126–139.

401
§ 16 Die Wärmeleitungsgleichung
Vorkenntnisse. Die ersten drei Abschnitte verlangen keine besonderen Vorkennt-
nisse, abgesehen von der Fouriertransformation auf dem Schwartz–Raum, die
im Rahmen einer Plausibilitätsbetrachtung auftritt. Der Abschnitt 4 stützt sich
wesentlich auf § 14 : 6 und § 15 : 1.
1 Bezeichnungen, Problemstellungen
(a) Wir definieren den Wärmeleitungsoperator H durch
∂
H = − Δ.
∂t
Für ein Gebiet Ω ⊂ Ê n
und eine Zeitspanne T mit 0 < T ≤ ∞ setzen wir
ΩT := Ω × ]0, T [ , ∂ ΩT := ( Ω × {0}) ∪ (∂Ω × [0, T [ ) .
Ê
Im Fall Ω = n besteht ∂ ΩT aus Boden und Mantelfläche des Zylinders ΩT .
Von klassischen Lösungen verlangen wir natürlicherweise Zugehörigkeit zu
( =
∂u ∂u ∂2u
C 2,1
(ΩT ) := 0
u ∈ C (ΩT ) , , ∈ C (ΩT ) .
0
∂t ∂xi ∂xi ∂xk
(b) Wir betrachten folgende Problemstellungen:

(i) Das Anfangswertproblem (AWP) oder Cauchy–Problem auf Ω = Ê n
:
Zu gegebenem T > 0 ist eine Funktion u ∈ C ( 0
Ên
× [0, T [) ∩ C
2,1
( Ên
× ]0, T [)
gesucht mit
Hu = f auf Ê n
× ]0, T [ ,
u(x, 0) = u0 (x) für x ∈ Ê n
.
Dabei sind f : Ê
× ]0, T [ →
n
Ê
und u0 : n → Ê Ê gegebene Funktionen, deren
Differenzierbarkeitsstufe noch festzulegen ist.
Von besonderem Interesse sind Lösungen unbegrenzter Lebensspanne T = ∞.
(ii) Das Anfangs–Randwertproblem (ARWP) auf einem beschränkten Ge-

Ê
biet Ω ⊂ n :
Gegeben sind T > 0 und Funktionen f auf ΩT , g auf ∂Ω × ]0, T [ und u0 auf Ω.
Gesucht ist eine Funktion u ∈ C0 (ΩT ∪ ∂ ΩT ) ∩ C2,1 (ΩT ) mit
Hu = f in ΩT ,
u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) für x ∈ Ω .
402 § 16 Die Wärmeleitungsgleichung
Auch im Fall, dass Lösungen unbegrenzter Lebensspanne gesucht sind, wird

dieses Problem zunächst für endliches T untersucht.
Beide Probleme sind so gestellt, dass sie eindeutig lösbar sind und unter geeig-
neten Differenzierbarkeitsvoraussetzungen an die Daten eine Lösung besitzen.
Zur Herleitung und physikalischen Deutung der Wärmeleitungsgleichung ver-
weisen wir auf § 1 : 2.5. Im Fall der Raumdimension n = 1 wurde das ARWP in
§ 6 : 4 behandelt.
(c) Gleichmässig parabolische Differentialoperatoren.

Die Ergebnisse dieses Paragraphen bleiben mit geringen Modifikationen gültig,
wenn wir im Wärmeleitungsoperator ∂t ∂
− Δ anstelle von Δ einen gleichmäßig
elliptischen Operator L setzen, vgl. § 14 : 1 (b).
Hierzu verweisen wir auf Dautray–Lions [4, 5], Friedman [78], Ladyzhens-
kaya [65], Ladyzhenskaya–Solonnikov–Uraltseva [83], Wloka [72].
2 Eigenschaften des Wärmeleitungsoperators

2.1 Der Wärmeleitungskern
(a) Wir betrachten das Cauchy–Problem für die homogene Wärmeleitungsglei-
chung
(∗)
∂u
∂t
− Δu = 0 in Ê n
× Ê >0 , u(x, 0) = u0 (x) für x ∈ Ê n
mit einer gegebenen schnellfallenden Funktion u0 ∈ S ( n ), vgl. § 12 : 3.1. Um Ê

eine Lösungsformel zu erraten, nehmen wir an, dass u eine Lösung von (∗) ist
Ê
mit x → u(x, t) ∈ S ( n) für alle t ≥ 0 und dass

/(y, t) := (2π)−n/2
u e−i x , y u(y, t) dn y
Ên
als Parameterintegral nach t differenziert werden kann,

∂
/(y, t) = (2π)−n/2
u e−i x , y ∂
u(y, t) dn y für t > 0 .
Ên
∂t ∂t
Dann folgt aus der Differentialgleichung und dem P ,Q–Gesetz § 12 : 3.3 (c)

∂
/(y, t) = (2π)−n/2
u e−i x , y Δu(y, t) dn y = −y2 u
/(y, t) ,
Ên
∂t
also
2 2
u /(y, 0) e−y
/(y, t) = u t
/0 (y) e−y
= u t
.
−y2 t
Der Term e läßt sich als Fouriertransformierte darstellen: Nach der Ska-
lierungsregel § 12 : 2.5 (b) gilt für t > 0
2 2
e−y t /t (y) mit Gt (x) = (2t)−n/2 e−x
= G /4t
.
2 Eigenschaften des Wärmeleitungsoperators 403
Mit dem Faltungssatz § 12 : 2.6 (c) ergibt sich wegen Gt ∈ S ( Ên

) für t > 0
/t (y) /
/(y, t) = G
u u0 (y) = (2π)−n/2 G;
t ∗u0 (y) ,
und daher u(x, t) = (2π)−n/2 (Gt ∗ u0 )(x) wegen der Injektivität der Fourier-
transformation. Damit erhalten wir die Lösungsdarstellung

(∗∗) u(x, t) = Γ(x − y, t) u0 (y) dn y für x ∈ Ê n
, t>0
Ên
mit dem Wärmeleitungskern
Γ(x, t) := (4πt)−n/2 e−x

2
/4t
für x ∈ Ê n
, t > 0.
In Abschnitt 3 zeigen wir, dass durch das Faltungsintegral (∗∗) unter geeig-
neten Voraussetzungen über u0 auch eine Lösung u des Cauchy–Problems (∗)
gegeben wird. Ohne Beweis sei angemerkt, dass diese für u0 ∈ S ( n) den Ê
oben gemachten Annahmen genügt. Die Eindeutigkeit der Lösung wird in 2.2
behandelt.
(b) Der Wärmeleitungskern als Grundlösung für H. Durch

( 2
(4πt)−n/2 e−x /4t
f ür t > 0 ,
Γ(x, t) :=
0 f ür t ≤ 0
Ê
ist eine auf n+1
∗ Ê
:= n+1 \ {0} stetige Grundlösung für den Wärmeleitungs-
operator H gegeben, d.h. es gilt
∂
ϕ(0, 0) = − Γ(y, s) ϕ + Δϕ (y, s) dn y ds
Ê
∂t
n
für jede Testfunktion ϕ auf Ê n+1

, vgl. § 13 : 5.2.
Für den ziemlich technischen Beweis verweisen wir auf Forster [147] § 17, Satz 4.
Ist f (x, t) stetig auf Ê n

× Ê+, so ist hiernach durch

u(x, t) = Γ(x − y, t − s) f (y, s) dn y ds
Ê Ên
eine schwache Lösung der DG Hu = f gegeben. Das folgt aus § 13 : 5.3 unter
Beachtung von Γ(x, t) = 0 = f (x, t) für t ≤ 0. Unter geeigneten Differen-
zierbarkeitsbedingungen an f liefert diese Formel eine klassische Lösung von
Ê Ê
Hu = f auf n × ]0, T [, u = 0 auf n × {0}. Dies zeigen wir in 3.3, ohne auf
die oben angegebenene Grundlösung zurückzugreifen.
(c) Eigenschaften des Wärmeleitungskerns.

Es gilt
(i) Γ ∈ C∞ ( Ê n+1
∗ ),
(ii) H Γ = 0 in Ê n+1
∗ ,

(ii) Γ(x, t) dn x = 1 für t > 0.
Ên
Die ersten beiden Eigenschaften
ergeben sich durch direktes Nach-
rechnen ÜA .
Die Formel (iii) folgt durch An-
wendung des Transformationssat-
zes für Integrale
√ mit der Substi-
t
tution y = 2t x und sukzessiver
Integration ÜA .
x
(d) Aufgaben.
(i) Veranschaulichen Sie sich den Wärmeleitungskern für n = 1, indem Sie die
Schnitte t → Γ(x, t) für x = 0, für x = 0, und die Schnitte x → Γ(x, t) für
t > 0 skizzieren.
(ii) Rechnen Sie nach, dass durch
u(x, t) := (T − t)−n/2 e−x

2
/(T −t)
in Ên
× ]0, T [
eine Lösung der homogenen Wärmeleitungsgleichung ∂t u = Δu gegeben ist.

Wegen der Translationsinvarianz des Laplace–Operators erfüllt deswegen auch
v(x, t) = u(x − x0 , t) die homogene Wärmeleitungsgleichung in n × ]0, T [. Ê
2.2 Maximumprinzipien, Eindeutigkeit von Lösungen
(a) Maximumprinzip für das Anfangs–Randwertproblem. Sei Ω ⊂ n Ê
ein beschränktes Gebiet und T > 0. Genügt u ∈ C0 (ΩT ∪ ∂ ΩT ) ∩ C2,1 (ΩT ) der
Ungleichung
Hu ≤ 0 in ΩT ,
so gilt
u ≤ sup u auf ΩT .
∂ ΩT
Insbesondere ergeben sich für jede Lösung u von Hu = 0 die Schranken

inf u ≤ u ≤ sup u auf ΩT .
∂ ΩT ∂ ΩT
2 Eigenschaften des Wärmeleitungsoperators 405
Folgerung. Das Anfangs–Randwertproblem

Hu = f in ΩT ,
u = g auf ∂ ΩT
besitzt höchstens eine Lösung u ∈ C0 (ΩT ∪ ∂ ΩT ) ∩ C2,1 (ΩT ).
Beweis des Maximumprinzips.

Wir fixieren (x0 , t0 ) ∈ ΩT , wählen ε, δ > 0 mit t0 < T − ε und setzen uδ (x, t) :=
u(x, t) − δt. Dann gilt
(∗) H uδ ≤ − δ < 0 in ΩT ,
und uδ nimmt auf dem kompakten Zylinder ΩT −ε = Ω×[0, T −ε] das Maximum
an einer Stelle (ξ, τ ) an.
Fall 1: (ξ, τ ) ∈ ∂ ΩT , also (ξ, τ ) ∈ Ω × ]0, T − ε] . Die notwendigen Bedingungen
für lokale Maxima liefern

∂uδ = 0 für τ < T − ε , ∂ 2 uδ
(ξ, τ ) (ξ, τ ) ≤ 0,
∂t ≥ 0 für τ = T − ε , ∂xi ∂xk
woraus Δuδ (ξ, τ ) ≤ 0 und H uδ (ξ, τ ) ≥ 0 folgt, ein Widerspruch zu (∗).

Fall 2: (ξ, τ ) ∈ ∂ ΩT . Dann gilt
u(x0 , t0 ) = uδ (x0 , t0 ) + δt0 ≤ uδ (ξ, τ ) + δT ≤ sup uδ + δT

∂ ΩT
≤ sup u + δT .
∂ ΩT
Da diese Ungleichung für alle δ > 0 richtig ist, gilt sie auch für δ = 0. 2
(b) Maximumprinzip für das Anfangswertproblem (Tychonow 1935).

Ê Ê Ê
Ist u ∈ C0 ( n × [0, T [) ∩ C2,1 ( n × ]0, T [) auf n × {0} beschränkt und erfüllt
die Wachstumbedingung
| u(x, t) | ≤ M eax
2
für (x, t) ∈ Ê n
× [0, T [
mit Konstanten M, a ≥ 0, sowie die Ungleichung
Hu ≤ 0 in Ê n
× ]0, T [ ,
so gilt
u ≤ sup u auf
Ên ×{0}
Ê n
× ]0, T [ .
Bemerkung. Tychonow zeigte an einem Beispiel, dass ohne die Wachstums-

bedingung eine Kontrolle der Lösung durch die Anfangswerte nicht möglich ist;
siehe John [49] Ch. 7.1 (a).
Beweis.
Wir fixieren (x0 , t0 ) ∈ Ê n
× [0, T [ .
(i) Im Fall 16aT < 1 setzen wir für δ > 0
2
uδ := u − δ v mit v(x, t) := (2T − t)−n/2 ex−x0 /4(2T −t)
.
Nach Aufgabe 2.1 (d) gilt Hv = 0, also Huδ ≤ 0 in n × ]0, T [ . Das Maxi- Ê
mumprinzip (a), angewandt auf uδ und den Zylinder ΩT := Kr (x0 ) × ]0, T [
liefert
(∗) uδ (x0 , t0 ) ≤ sup uδ .

∂ ΩT
Wir schätzen uδ auf ∂ ΩT ab: Für x ∈ Kr (x0 ) gilt
uδ (x, 0) ≤ u(x, 0) ≤ sup u

Ên ×{0}
und für (x, t) ∈ ∂Kr (x0 ) × [0, T [ ergibt sich mit der Wachstumbedingung an u
2 2
u(x, t) ≤ M eax ≤ M ea(r+x0 )
2
+2ax0 2 2
≤ M e2ar =: M1 e2ar ,
2 2
v(x, t) ≥ (2T )−n/2 er /8T
=: M2 er /8T
,
somit
2 2
uδ (x, t) = u(x, t) − δ v(x, t) ≤ M1 e2ar − M2 δ er /8T
.
Wegen 1/(8T ) − 2a = (1 − 16aT )/8T > 0 überwiegt in dieser Differenz der

erste Term für r 1. Somit folgt aus (∗)
uδ (x0 , t0 ) ≤ sup u ,
Ên ×{0}
und damit
u(x0 , t0 ) = uδ (x0 , t0 ) + δ v(x0 , t0 ) ≤ sup u + δ (2T )−n/2 .
Ên ×{0}
Da diese Ungleichung für jedes δ > 0 gilt, besteht sie auch für δ = 0.
(ii) Im Fall 16aT ≥ 1 unterteilen wir das Intervall [0, T [ in Teilintervalle der
Länge T < 1/16a und wenden (i) mehrfach an. 2
3 Das Anfangswertproblem 407
Folgerung. Lösungen des Anfangswertproblems 1 (b) (i) mit höchstens qua-

dratisch exponentiellem Wachstum sind durch die Anfangswerte eindeutig be-
stimmt.
Dies ergibt sich durch Anwendung des Maximumprinzips (b) auf die Differenz
zweier Lösungen.
(c) Strenges Maximumprinzip (Nirenberg 1953). Genügt u ∈ C2,1 (ΩT )

Ê
(Ω ⊂ n ein beliebiges Gebiet) der Ungleichung
Hu ≤ 0 in ΩT ,
und nimmt u das Maximum an einer Stelle (x0 , t0 ) ∈ ΩT an, so ist u konstant
in Ω × ]0, t0 ].
Für den Beweis siehe Protter–Weinberger [52] 3.3, Thm. 4, Friedman [78]
2.2.
3 Das Anfangswertproblem
3.1 Das AWP für die homogene Wärmeleitungsgleichung
Im folgenden bezeichne Γ den Wärmeleitungskern, vgl. 2.1.
Satz. Sei u0 eine stetige Funktion auf Ê , die der Wachstumsbedingung

n
| u0 (x) | ≤ M eax
2
für x ∈ Ê n
mit Konstanten M, a ≥ 0 genügt. Dann ist für T < 1/4a durch

Γ(x − y, t)u0 (y) dn y für t > 0 ,
u(x, t) := Ên
u0 (x) für t = 0
die eindeutig bestimmte Lösung u ∈ C0 ( Ê n

× [0, T [) ∩ C2 ( Ên
× ]0, T [) des An-
fangswertproblems
Hu = 0 in Ê n
× ]0, T [ , u(x, 0) = u0 (x) für x ∈ Ê n
gegeben. Für diese gilt u ∈ C∞ ( Ê n

× ]0, T [).
Diese Integraldarstellung der Lösung wurde für n = 1 von Fourier 1811 for-
muliert und 1815 von Poisson bewiesen.
Bemerkungen. (i) Ist u0 beschränkt, so kann a = 0 und damit T = ∞ ge-

wählt werden.
(ii) Das Funktion x → u(x, t) ist für jedes t ∈ ]0, T [ sogar analytisch. Das ergibt
sich durch Fortsetzung des Integrals ins Komplexe, siehe John [49] Ch. 7.1.
(iii) Das Anfangswertproblem besitzt selbst dann noch eine C∞ –Lösung u für
t > 0, wenn die Anfangswerte u0 nur lokal integrierbar sind, also unstetig sein
können. Die stetige Annahme der Anfangswerte durch die Lösung erfolgt in
diesem Fall im Sinne der L1loc –Konvergenz,

lim
t→0+
| u(x, t) − u0 (x) | dn x = 0 für jedes kompakte K ⊂ Ên
,
K
siehe Dibenedetto [59] V.6.
Beweis.
(1) Die eindeutige Bestimmtheit der Lösung folgt aus dem Eindeutigkeitssatz
2.2 (a).
(2) Die durch das Integral dargestellte Funktion ist in n × ]0, T [ stetig. Ê
Hierzu reicht es nach dem Satz über die Stetigkeit von Parameterintegralen
(Bd. 1, § 23 : 5.1 bzw. § 8 : 1.4), zu jedem kompakten Quader K ⊂ n × ]0, T [ Ê
eine integrierbare Majorante für den Integranden anzugeben.
Für (x, t) ∈ K und y ∈ Ê n
gilt nach Voraussetzung

Γ(x − y, t) u0 (y) = (4πt)−n/2 e−x−y2 /4t |u0 (y)|
2
/4t ay2
≤ M (4πt)−n/2 e−x−y e .
Quadratische Ergänzung des Exponenten ergibt ÜA

x − y 2
α x 2 a
− + ay2 = − y − + x2
4t 4tα α
a
= − η2 + x2
α
mit

α x
α := 1 − 4at > 1 − 4aT > 0 , η := y− .
4t α
Somit folgt durch Substitution y → η unter Beachtung von
2 +∞
2
e−η dn y =
n
e−s ds = π n/2
Ên −∞
(Bd. 1, § 23 : 8.4) die Majoranteneigenschaft ÜA :

Γ(x − y, t) u0 (y) ≤ gK (x, y, t) := M (4πt)−n/2 e−η2 ea x2 /α ,
wobei
2
gK (x, y, t) dn y = M (1 − 4at)−n/2 ea x /α
≤ c(K) .
Ên
(3) Die Funktion u ist in n
Ê
× ]0, T [ C∞ –differenzierbar und löst dort die
Wärmeleitungsgleichung Hu = 0.
Zum Nachweis reicht es nach dem Satz über die Differenzierbarkeit von Para-
meterintegralen (Bd. 1, § 23 : 5.2), für jeden kompakten Quader K ⊂ n × ]0, T [ Ê
und jede partielle Ableitung des Integranden nach x1 , . . . , xn , t eine integrier-
bare Majorante anzugeben. Dies ist möglich, weil bei jeder Ableitung der Inte-
grand ein Polynom in 1/t als Faktor erhält. Dieses Polynom ist beschränkt für
Ê
(x, t) ∈ K, weil der Quader K zu n × {0} = {t = 0} einen positiven Abstand
hat.
Ê
Da (x, t) → Γ(x−y, t) nach 2.1 (c) für jedes y ∈ n und für t > 0 die homogene
Wärmeleitungsgleichung löst, gilt dies auch für u.
(4) u ist auch auf Ê n
× [0, T [ stetig. Hierzu ist nach (2) noch zu zeigen, dass
lim
(x,t)→(x0 ,0)
u(x, t) = u0 (x0 ) für jedes x0 ∈ Ê n
.
Aufgrund des nachfolgenden Hilfssatzes gibt es zu gegebenem x0 ∈ Ên

für jedes
ε > 0 ein b > 0 mit

u0 (y) − u0 (x0 ) ≤ εeb y−x0 2 für alle y ∈ Ê n
.
2
Wählen wir δ > 0 mit e2bδ = 2, so folgt für x − x0 < δ

y − x0 2 = (y − x) + (x − x0 ) ≤ 2y − x2 + 2x − x0 2
2
≤ 2y − x2 + 2δ 2 ,

u0 (y) − u0 (x0 ) ≤ εe2by−x2 +2bδ2 = 2εe2by−x2 .
Nach 2.1 ist Γ(ξ, t) für t > 0 positiv, und es gilt

Γ(x − y, t) dn y = Γ(ξ, t) dn ξ = 1 .
Ên Ên
Für x − x0 < δ und 0 < t < 1/16b folgt somit

u(x, t) − u0 (x0 ) = Γ(x − y, t) u0 (y) − u0 (x0 ) dn y

Ên
≤ Γ(x − y, t) | u0 (y) − u0 (x0 ) | d y
n
Ên
2
/4t 2by−x2
≤ 2ε (4πt)−n/2 e−y−x e dn y
Ê n
und nach Ausführung der Substitution y → η = 1−8bt

4t
(y − x) analog wie in
(2) unter Beachtung von 1 − 8bt > 1/2
| u(x, t) − u0 (x0 ) | ≤ 2ε(1 − 8bt)−n/2 < 2 2n/2 ε ,
was die Behauptung darstellt. 2

Hilfssatz. Zu x0 ∈ Ê n
und ε > 0 gibt es ein b > 0 mit

u0 (y) − u0 (x0 ) ≤ ε eb y−x0 2 für alle y ∈ Ê n
.
Beweis.
Zu ε > 0, x0 ∈ Ê
n
wählen wir ein δ > 0 mit

u0 (y) − u0 (x0 ) < ε für y − x0 < δ .
Aufgrund der Wachstumsbedingung gilt für alle y ∈ Ên

mit y − x0 ≥ δ unter
Verwendung der Abkürzung N := M + |u0 (x0 )|

u0 (y) − u0 (x0 ) ≤ | u0 (y) | + | u0 (x0 ) | ≤ M eay2 + | u0 (x0 ) |
2 2
≤ N eay ≤ N ea(y−x0 +x0 )
2
+2ax0 2
≤ N e2ay−x0 .
Wählen wir b > 2a so groß, dass log(N/ε) + 2ax0 2 ≤ (b − 2a)δ 2 und bδ ≥ 1

gilt, so folgt
N
log + 2ax0 2 ≤ (b − 2a)y − x0 2 ,
ε
2
+2a x0 2 2
N e2a y−x0 ≤ εeb y−x0 ,
woraus sich die Behauptung für y − x0 ≥ δ ergibt. Im Fall y − x0 < δ ist

sie ohnehin richtig. 2
Das glättende Verhalten des Lösungsoperators
u0 ∈ C0 =⇒ ut ∈ C∞ (t > 0)
(ut (x) := u(x, t)), bzw. nach Bemerkung (iii)
u0 ∈ L1loc =⇒ ut ∈ C∞ (t > 0)
kann als Ausdruck der Tatsache angesehen werden, dass die Wärmeleitungsglei-
chung einen Ausgleichsvorgang beschreibt. Dieses Verhalten hat auch zur Folge,
dass das Rückwärtsproblem
Hu = 0 in Ê n
× ]T, 0[ , u(x, 0) = u0 (x) für x ∈ Ên
, (T < 0)
für nicht C∞ –differenzierbare Anfangswerte u0 keine Lösung besitzt ( ÜA unter

Verwendung des Eindeutigkeitssatzes 2.2 (b)).
Aus der Lösungsformel ergibt sich folgende Paradoxie: Ist für t = 0 nur ein
kleines Raumgebiet erwärmt (z.B. u0 ein Standardbuckel mit kleinem Träger),
so ist für jedes noch so kleine t > 0 die Temperatur ut im ganzen Raum positiv.
Dies bedeutet unendliche Ausbreitungsgeschwindigkeit der Wärme und zeigt,
dass die Wärmeleitungsgleichung die reale Situation nur näherungsweise be-
schreibt.
3.2 Schranken für die Lösung nahe t = 0

Die folgenden Abschätzungen benötigen wir bei der Lösung der inhomogenen
Wärmeleitungsgleichung in 3.3.
Satz. Genügt die Anfangsverteilung u0 ∈ C1 ( Ê n

) der Wachstumsbedingung
| u0 (x) | ≤ M e ax
2
für x ∈ Ê n
mit Konstanten M, a ≥ 0, so bestehen für die Lösung des AWP die Abschätzun-
gen

∂u ∂2u c1 (r)
| u(x, t) | ≤ c0 (r) , (x, t) , (x, t) ≤ √
∂t ∂xi ∂xk t
für (x, t) ∈ Kr (0) × ]0, T [ , r > 0 und T ≤ 1/16a.
Das sich in der Abschätzung von t → ∂u/∂t(x, t) zeigende Verhalten der Lösung
ist ein Indiz dafür, dass diese an der Stelle t = 0 bezüglich t nicht differenzierbar
zu sein braucht.
Beweis.
(1) Aus der letzten Zeile des Beweisteils (2) von 3.1 entnehmen wir für x ≤ r,
t ≤ 1/16a wegen 1 − 4at ≥ 3/4 die Abschätzung
n/2
4 2
| u(x, t) | ≤ M ear /α
.
3

(2) Nach Beweisteil (3) von 3.1 ist das Parameterintegral Γ(x − y, t) dn y
Ên
für t > 0 differenzierbar, also folgt aus Γ(x − y, t) dn y = 1 die Identität
Ên

∂ ∂
Γ(x − y, t) dn y = Γ(x − y, t) dn y = 0 .
∂t ∂t
Ên Ên
Die Ableitung des Wärmeleitungskerns ist für t > 0

∂Γ n x − y2
(x − y, t) = − + Γ(x − y, t) .
∂t 2t 4t2
Mit der Lösungsdarstellung 3.1 folgt für x ∈ Kr (0), 0 < t < T < 1/16a
∂
∂
u(x, t) = Γ(x − y, t) u0 (y) − u0 (x) dn y
Ên
∂t ∂t
n x−y2
≤ + 2
u0 (y) − u0 (x) dn y
Ên
2t 4t

= ... + ... =: I1 + I2 .
Kr (x) Ên \Kr (x)
Wegen u0 ∈ C1 ( Ê ) gilt mit einer auf K
n
2r (0) bezogenen Lipschitzkonstanten
a(r)

u0 (y) − u0 (x) ≤ a(r)y − x
für y ∈ Kr (x) ⊂ K2r (0) .
√
√ die Substitution y → η := (y − x)/ 4t ergibt sich daraus mit R :=
Durch
r/ 4t (vgl. Beweisteil (2) in 3.1)

n η2 √ 2
I1 ≤ (4πt) −n/2
(4t) n/2
a(r) + 4tηe−η dn η
2t t
η <R

2π −n/2 a(r) n 2 c11 (r)
≤ √ + η2 ηe−η dn η =: √ .
t 2 t
Ên
Für y ∈ Ê n
\ Kr (x) ergibt sich analog zum Beweis des Hilfssatzes in 3.1

u0 (y) − u0 (x) ≤ b(r) e2a y−x2
√
und durch die gleiche Substitution y → η wie oben mit R = r/ 4t
η 2 2 2
I2 ≤ π −n/2 b(r) n
2t
+ t
e8at η e−η dn η .
η ≥R
√
Für η ≥ R = r/ 4t gilt die Abschätzung
1 1 1 2η
= √ √ ≤ √ .
t t t r t
Wir erhalten unter Beachtung von 1 − 8at > 1 − 8aT > 1/2
2π −n/2 b(r)
n 2
I2 ≤ √
r t
η 2
+ η2 e−(1−8at)η dn η
η ≥R
2π −n/2 b(r)
n 1 2
≤ √ η + η2 e− 2 η dn η =: c12 (r)
√ .
Ên
r t 2 t
(3) Die Abschätzung für ∂ 2 u/∂xi ∂xk verläuft ganz analog zu (2). 2
3.3 Das AWP für die inhomogene Wärmeleitungsgleichung

Wir behandeln das Anfangswertproblem
(∗) Hu = f in Ê n
× ]0, T [ , u = 0 auf Ê n
× {0}
mit gegebener rechter Seite f . Durch Addition einer Lösung von (∗) und der
durch 3.1 gelieferten Lösung des Problems Hu = 0, u(x, 0) = u0 (x) erhalten
wir die Lösung des allgemeinen Anfangswertproblem 1 (b) (i).
Satz. Genügt f ∈ C0 ( Ê n
× [0, T [) ∩ C1 ( Ê n
× ]0, T [) der Wachstumsbedingung
2
| f (x, t) | ≤ M e ax
für alle (x, t) ∈ Ê n

× [0, T [ mit M, a ≥ 0, so ist für T < 1/4a durch
t
u(x, t) = Γ(x − y, t − s)f (y, s) dn y ds
0 Ên
die eindeutig bestimmte Lösung des AWP (∗) gegeben.
Dabei ist Γ der in 2.1 (b) definierte Wärmeleitungskern.
Beweis.
Die Eindeutigkeit der Lösung ergibt sich nach 2.2 (b).
Wir betrachten die Schar von AWP mit Scharparameter s ∈ ]0, T [:
Hus = 0 in Ê n
× ]s, T [ , us (x, s) = f (x, s) für x ∈ Ê n
.
Die Anfangswerte werden hier also auf der Hyperebene {t = s} und nicht wie
bisher auf {t = 0} vorgegeben.
Nach Ausführung der Zeittranslationen t → t − s erhalten wir mit der Lö-
sungsdarstellung aus 3.1

us (x, t) = Γ(x − y, t − s)f (y, s) dn y .
Ên
Wir zeigen, dass u : Ê n
× [0, T [ → Ê mit
t t
u(x, t) := us (x, t) ds = Γ(x − y, t − s)f (y, s) dn y ds
0 0 Ên
eine Lösung des AWP (∗) ist.

Nach den Abschätzungen in 3.2 sind die Integrale
t t ∂
t
us (x, t) ds , u (x, t) ds ,
∂t s
Δus (x, t) ds
0 0 0
stetig in x und t (Satz über Parameterintegrale § 8 : 1.7).

Es gilt u(x, 0) = 0, und für (x, t) ∈ Ê n
× ]0, T [ ergibt sich nach der Differen-
tiationsregel in § 6 : 3.7
∂ t ∂ t
u(x, t) = us (x, t) s=t + us (x, t) ds = f (x, t) + Δus (x, t) ds.
∂t 0
∂t 0
Aufgrund der Abschätzungen in 3.2 können wir den Satz über Parameterinte-
grale anwenden und erhalten
∂ t
u(x, t) = f (x, t) + Δ us (x, t) ds = f (x, t) + Δu(x, t) . 2
∂t 0
Die hier verwendete Methode, Lösungen von inhomogenen Differentialgleichun-

gen aus Lösungen von homogenen zu gewinnen, wird das Duhamelsche Prin-
zip genannt (Duhamel 1843).
4 Das Anfangs–Randwertproblem
4.1 Lösungsansatz durch Raum– und Zeitseparation
Wir betrachten das ARWP auf einem beschränkten Gebiet Ω ⊂ Ê n
für T > 0:
⎧
⎨ Hu = f in ΩT = Ω × ]0, T [ ,
(∗) u = 0 auf ∂Ω × [0, T [ ,
⎩
u(x, 0) = u0 (x) für x ∈ Ω
mit gegebenen Funktionen f und u0 .
Für den Fall nicht verschwindender Randwerte und für das Neumannsche Rand-
wertproblem verweisen wir auf Daurey–Lions [4] Ch. 18, § 4.2, Ladyzhens-
kaya–Solonnikov–Uraltseva [83] Ch. III, Wloka [72] § 26.
Im folgenden verwenden wir wieder die Bezeichnungen von § 14 : 6.3:

H = L2 (Ω) , u, v H = uv dn x , u2H = u2 dn x ,
Ω Ω

Ω Ω
Zur Konstruktion einer Lösung mit der Separationsnsmethode nach dem Vor-
bild § 6 : 4 verwenden wir den Entwicklungssatz in § 15 : 1.2, nach welchem das
Eigenwertproblem
−Δu = λv in Ω , v = 0 auf ∂Ω
4 Das Anfangs–Randwertproblem 415
eine Folge von (ggf. schwachen) Lösungen λi , vi besitzt mit
0 < λ1 ≤ λ2 ≤ . . . , lim λk = ∞ , vi , vk H = δik

k→∞

∞
und jede Funktion u ∈ L2 (Ω) durch ihre Fourierreihe vi , u H vi dargestellt
i=1
werden kann.
Die Eigenwertgleichung − Δvi = λi vi lautet in schwacher Form
(a) vi , v V = λi vi , v H für alle v ∈ V ,
insbesondere gilt
(b) vi , vk V = λi δik .
Für das AWP (∗) machen wir den Lösungsansatz

∞
(c) u(x, t) = ai (t) vi (x)
i=1
und erhalten nach formaler Rechnung (Konvergenz aller auftretenden Reihen

und − Δvi = λi vi angenommen)
∂u ∞
(x, t) = ȧi (t) vi (x) ,
∂t i=1

∞
∞
Δu(x, t) = ai (t) Δvi (x) = − λi ai (t) vi (x) .
i=1 i=1
Weiter verwenden wir die Fourierentwicklungen von u0 und der mit f (t) be-
zeichneten Funktion x → f (x, t)

∞
∞
u0 (x) = vi , u0 H vi (x) , f (x, t) = vi , f (t) H vi (x) .
i=1 i=1
Dann liefern die Wärmeleitungsgleichung und die Anfangsbedingung

∞ ∂
(ȧ(t) + λi ai (t)) vi (x) = ∂t
u − Δu (x, t) = f (x, t)
i=1

∞
= vi , f (t) H vi (x) ,
i=1

∞
∞
ai (0)vi (x) = u(x, 0) = u0 (x) = vi , u0 H vi (x) ,
i=1 i=1
woraus sich durch Koeffizientenvergleich
ȧi (t) + λi ai (t) = vi , f (t) H , ai (0) = vi , u0 H für i = 1, 2, . . .
ergibt. Diese gewöhnlichen Anfangswertprobleme besitzen die Lösungen ÜA
t
(d) ai (t) = vi , u0 H e−λi t + vi , f (s) H e−λi (t−s) ds (i = 1, 2, . . .) .
0

∞
Die Frage ist nun, in welchem Sinne die Reihe u(x, t) = ai (t) vi (x) mit den
i=1
durch (d) bestimmten Koeffizienten ai (t) konvergiert, und in welchem Sinne die
so definierte Funktion u das ARWP löst.
Eine erste Antwort liefert der Existenzsatz 4.5, nach welchem u unter den Vor-
aussetzungen u0 ∈ L2 (Ω), f ∈ L2 (ΩT ) eine schwache Lösung in einem noch
zu präzisierenden Sinn ist. In 4.6 wird gezeigt, dass u eine klassische Lösung
ist, falls die Daten u0 , f genügend glatt sind und ihre Ableitungen
geeignete
Randbedingungen erfüllen. Hierzu sind für die Reihe u(x, t) = ai (t) vi (x)
und ihre gliedweisen Ableitungen geeignete Majoranten aufzustellen. Diese er-
geben sich aus den Abklingbedingungen § 15 : 1.4 für die Fourierkoeffizienten
vi , u0 H und vi , f (t) H ,
4.2 Funktionenräume für Evolutionsgleichungen

Literatur: Evans [60] § 5.9, Wloka [72] §§ 24, 25.
(a) Bei den im folgenden eingeführten Funktionenräumen interpretieren wir
Funktionen u(x, t) des Ortes x ∈ Ω und der Zeit t ∈ I um in Zeitentwicklungen
t → u(t) , I → H mit u(t)(x) := u(x, t) ,
wobei H typischerweise einer der Hilberträume L2 (Ω), W01 (Ω), W01 (Ω) ∩ W2 (Ω)
ist. Der Übersichtlichkeit halber abstrahieren wir zunächst von diesen Beispielen
und betrachten H als separablen Hilbertraum mit Skalarprodukt , H . Die
Zeitentwicklungen u : I → H fassen wir als Kurven in H auf.
(b) Stetigkeit einer Kurve u : I → H bedeutet lim u(s) − u(t)H = 0 ; die-

s→t
se ist äquivalent zur Stetigkeit aller Funktionen t → v , u(t) H mit v ∈ H .
Das folgt aus der Cauchy–Schwarzschen Ungleichung und der Polarisierungs-
gleichung ÜA .
Satz 1. Für jedes kompakte Intervall I ist der Raum C0 (I, H ) aller stetigen
Kurven u : I → H ein Banachraum mit der Norm

uC0 (I,H ) := max u(t)H t ∈ I .
Dies ergibt sich wie im Vollständigkeitsbeweis Bd. 1, § 21 : 5.4 für C0 (I, Ê).
(c) Eine Kurve u : I → H auf einem offenen Intervall J heißt schwach
messbar, wenn alle Funktionen t → v , u(t) H mit v ∈ H messbar sind, vgl.
§ 8 : 1.4 (b). Daraus folgt mit der Parsevalschen Gleichung § 9 : 4.4 die Messbar-
keit von t → u(t)2H und von t → u(t) , v(t) H für je zwei schwach messbare
Kurven u, v : J → H .
Der Raum L2 (J, H ) ist definiert als die Gesamtheit aller schwach messbaren
Funktionen u : J → mit Ê

uL2 (J,H ) := u(t)2H dt < ∞ ,
J

wobei alle Kurven u, v mit u(t) − v(t)2H dt = 0 zu identifizieren sind, vgl.
J
§ 8 : 2.1.
Satz 2. (i) L2 (J, H ) ist ein Hilbertraum mit dem Skalarprodukt

u, v L2 (J,H ) := u(t) , v(t) H dt .
J
(ii) Für J = [0, T ] ist L2 (J, L2 (Ω)) isomorph zu L2 (ΩT ).

Den Beweis finden Sie in Wloka [72] § 24.1. Die Aussage (ii) basiert auf den
Sätzen von Fubini und Tonelli und der Gleichung
T
u(x, t)2 dn x dt = u(x, t)2 dn x dt = u2L2 (J,L2 (Ω)) .
ΩT 0 Ω
(d) Eine Kurve u ∈ L2 (J, H ) auf einem offenen Intervall J heißt schwach
differenzierbar mit schwacher Ableitung w = u̇ ∈ L2 (J, H ), wenn für jedes
v ∈ H die Funktion t → v , u(t) H schwach differenzierbar ist, d.h.

v , w(t) H ϕ(t) dt = − v , u(t) H ϕ̇(t) dt
J J
für alle ϕ ∈ C∞ c (J). Nach dem verallgemeinerten Hauptsatz § 14 : 6.4 bedeutet

dies für alle v ∈ H die Absolutstetigkeit von t → v , u(t) H und
t
v , u(t) H − v , u(t0 ) H = v , w(s) H ds für t0 , t ∈ J .
t0
Eine Kurve uj ∈ L2 (J, H ) heißt j–te schwache Ableitung von u ∈ L2 (J, H ),

wenn

v , uj (t) H ϕ(t) dt = (−1)j v , u(t) H ϕ(j) (t) dt
J J
für alle v ∈ H und alle ϕ ∈ C∞ j j

c (J). Wir bezeichnen uj mit d u/dt . Existiert
die zweite schwache Ableitung ü = d2 u/dt2 ∈ L2 (J, H ), so gehört nach § 14 : 6.4
die Funktion t → v , u(t) H für jedes v ∈ H zu C1 (J).
(e) Für k = 1, 2, . . . ist der Sobolew–Raum Wk (J, H ) definiert als die Menge
aller u ∈ L2 (J, H ), die schwachen Ableitungen dj u/dtj ∈ L2 (J, H ) für j ≤ k
besitzen. Auf diesem definieren wir eine Norm durch
k j
d u 2
u2Wk (J,H ) := j 2 .
dt L (J,H )
j=0
Satz 3. (i) Wk (J, H ) ist ein Hilbertraum.

(ii) Für J = ]0, T [ und für C1 –berandete Gebiete Ω ⊂ Ê n
gilt
Wk (J, Wk (Ω)) → Wk (ΩT ) .
Beweis siehe Wloka [72] Satz 27.8.
4.3 Eigenschaften von W10 (ΩT )

Für das mit ·, · T bezeichnete Skalarprodukt in W01 (ΩT ) gilt

n
u, v T = ∂i u ∂i v + ∂u ∂v
∂t ∂t
dn x dt
ΩT i=1
(1)
T
= u(t) , v(t) V + u̇(t) , v̇(t) H dt ,
0
T T
wobei die Integrale u(t)2V dt und u̇(t)2H dt wegen der Isomorphie
0 0
L2 (ΩT ) ∼
= L2 (]0, T [ , H) konvergieren. (Bezeichnungen wie in 4.1.)
Sei v1 , v2 , . . . ein vollständiges ONS von Eigenfunktionen des Dirichletschen Ei-
genwertproblems für H = L2 (Ω) (§ 15 : 1.2), und λ1 , λ2 , . . . seien die zugehöri-
gen Eigenwerte.
Für Funktionen ϕ : Ω → Ê, ψ : J → Ê setzen wir
(ϕ ⊗ ψ)(x, t) := ϕ(x) ψ(t) für x ∈ Ω, t ∈ J.
Satz. (a) Für u ∈ W01 (ΩT ) sind die Fourierkoeffizienten ak (t) := u(t) , vk H
absolutstetig auf J = ]0, T [. Ferner besitzen diese die schwachen Ableitungen
ȧk (t) = u̇(t) , vk H und lassen sich stetig auf I = [0, T ] fortsetzen. Es gilt
t
ak (t) = ak (0) + u̇(s) , vk H ds für t ∈ I und k ∈ ,
0

∞ ∞
T
u(t)2V = λk ak (t)2 , u2T = λk ak (t)2 + ȧk (t)2 dt .
k=1 k=1 0
(b) Der von den Produkten ϕ ⊗ ψ mit ϕ ∈ C∞ ∞

c (Ω), ψ ∈ Cc (J) aufgespannte
1
Teilraum U liegt dicht in W0 (ΩT ).
Beweis.
(a) Für u ∈ W01 (ΩT ) gilt u, ∂u/∂t ∈ L2 (ΩT ) ∼
= L2 (I, H) und

∂Φ n ∂u
u d x dt = − Φ dn x dt
∂t ∂t
ΩT ΩT
für alle Φ ∈ C∞
c (ΩT ), insbesondere für Φ = ϕ⊗ψ mit ϕ ∈ C∞ ∞
c (Ω), ψ ∈ Cc (J)
T T
u(t) , ϕ H ψ̇(t) dt = − u̇(t) , ϕ H ψ(t) dt
0 0
wegen L2 (I, H) ∼
= L2 (ΩT ). Da C∞
c (Ω) dicht in H liegt, folgt
T T
(2) u(t) , v H ψ̇(t) dt = − u̇(t) , v H ψ(t) dt
0 0
für v ∈ V und alle ψ ∈ C∞ c (J). Nach § 14 : 6.4 (c) bedeutet das insbesondere,
dass ak (t) = u(t) , vk H absolutstetig ist und die schwache Ableitung ȧk (t) =
u̇(t) , vk H besitzt, d.h. es gilt
t
ak (t) − ak (t0 ) = ȧk (s) ds
t0
für t0 , t ∈ J. Wegen ȧk ∈ L2 (I) ⊂ L1 (I) existieren die Grenzwerte von ak (t)
für t → 0 und t → T , also gilt sogar
t
(3) ak (t) − ak (0) = ȧk (s) ds für 0 ≤ t ≤ T .
0
√
Nach § 15 : 1.3 bilden die wk := vk / λk ein vollständiges ONS für V . Unter
Berücksichtigung von u(t) , vk V = λk u(t) , vk H ergibt die Parsevalsche Glei-
chung daher

∞
∞
∞
u(t)2V = u(t) , wk 2
V = λk u(t) , vk 2
H = λk ak (t)2 .
k=1 k=1 k=1
Wegen u̇(t) ∈ H gilt ferner

∞
∞
u̇(t)2H = u̇(t) , vk 2
H = ȧk (t)2 ,
k=1 k=1
somit folgt die letzte Behauptung in (a) nach Definition von uT mit Hilfe des
Satzes von Beppo Levi.
(b) Zum Nachweis beachten wir, dass nach § 9 : 2.5 (b) ein Teilraum und sein
Abschluss dasselbe orthogonale Komplement besitzen.
Zu zeigen ist also:
u, ϕ ⊗ ψ T = 0 für alle ϕ ⊗ ψ ∈ U =⇒ u = 0.
Aus u, ϕ ⊗ ψ T = 0 für alle ϕ ⊗ ψ ∈ U folgt nach (1)

T
(4) u(t) , ϕ V ψ(t) + u̇(t) , ϕ H ψ̇ dt = 0
0
für alle ϕ ⊗ ψ ∈ U . Da aber C∞ ∞

c (Ω) und Cc (J) bezüglich der jeweiligen
Sobolew–Normen dicht in V bzw. W0 (J) liegen, folgt (4) für alle ϕ ∈ V ,
1
ψ ∈ W01 (J) ÜA .

Wir wählen ϕ := vk und ψ(t) := ψ (t) := 2
T
sin πT t . Wegen ak , ψ ∈ W01 (J)
folgt aus (4) durch partielle Integration (vgl. § 8 : 3.3)
T π 2 T
0 = λk ak (t) ψ (t) − ak (t)ψ̈ (t) dt = λk + T
ak (t)ψ (t) dt
0 0

für ∈ . Wegen der Vollständigkeit des ONS ψ1 , ψ2 , . . . in L2 (J) (§ 9 : 4.5
oder § 15 : 1.2) ergibt sich daraus ak = 0 f.ü., also sogar ak (t) = 0 für alle
t ∈ I, da die ak nach (a) stetig sind. Nach (a) folgt u = 0. 2
4.4 Schwache Formulierung des Anfangs–Randwertproblems

Im folgenden sei Ω ein beschränktes Gebiet, T > 0 und
H = L2 (Ω), V = W01 (Ω), I = [0, T ] , J = ]0, T [ .
Gegeben seien u0 ∈ L2 (Ω) und f ∈ L2 (ΩT ). Eine Funktion u heißt schwache
Lösung des ARWP 4.1 (∗), wenn gilt:
u ∈ L2 (I, V ) ∩ C0 (I, H),
Hu = f schwach in ΩT ,
u(0) = u0 .
Dieser Lösungsbegriff bietet sich auf natürliche Weise an. Die Bedingung u ∈
L2 (I, W01 (Ω)) sichert das Verschwinden der Randwerte von u für fast alle t ∈ I,
und die Bedingung u ∈ C0 (I, L2 (Ω)) sorgt für die stetige Annahme des An-
fangswerts in der L2 –Norm: lim u(t) − u0 H = 0.
t→0
Dass diese Bedingungen dem Problem angepasst sind, wird anschließend und in
den Beweisteilen (2),(3) des Existenz– und Eindeutigkeitssatzes 4.5 deutlich.
Für den Beweis des Existenz– und Eindeutigkeitssatzes benötigen wir äqui-
valente Varianten der schwach formulierten Wärmeleitungsgleichung:
Nach Definition in § 13 : 1.2 lautet diese in der schwachen Form

(I) u H ∗ Φ dn x dt = f Φ dn x dt für alle Φ ∈ C∞
c (ΩT ) ;
ΩT ΩT
dabei ist Φ → H ∗ Φ = − ∂Φ∂t

− ΔΦ der formal adjungierte Wärmeleitungs-
operator. Weil mit Φ ∈ C∞
c (Ω T ) auch ∂1 Φ, . . . , ∂n Φ Testfunktionen sind, darf
nach Definition der schwachen Ableitungen von u(t) ∈ W01 (Ω) partiell integriert
werden. Unter Verwendung des Satzes von Fubini ergibt sich
T
− u ΔΦ dn x dt = − u ΔΦ dn x dt
ΩT 0 Ω
(1)
T T
= ∇u , ∇Φ dn x dt = u(t) , Φ(t) V dt .
0 Ω 0
Wählen wir Testfunktionen Φ in Produktgestalt ϕ ⊗ ψ mit ϕ ∈ C∞

c (Ω) und
ψ ∈ C∞c (J), so geht (I) über in
T
(2) − u(t) , ϕ H ψ̇(t) + u(t) , ϕ V ψ(t) − f (t) , ϕ H ψ(t) dt = 0 .
0
Das bedeutet, dass für alle ϕ ∈ C∞

c (Ω) die gewöhnliche Differentialgleichung
d
(II) u(t) , ϕ H + u(t) , ϕ V = f (t) , ϕ H
dt
in schwacher Form auf J erfüllt ist. Da C∞ c (Ω) bezüglich der Sobolew–Norm

dicht in V = W01 (Ω) liegt, gilt (II) für alle ϕ ∈ V . Wegen der Isomorphie
L2 (ΩT ) ∼= L2 (J, L2 (Ω)) nach Satz 2 (ii) in 4.2 ist f (s) , ϕ H über ]0, T [ qua-
dratintegrierbar; ferner ist u(t) , ϕ H absolutstetig mit schwacher Ableitung
d
dt
u(t) , ϕ H = f (t) , ϕ H − u(t) , ϕ V , wie sich aus dem Beweis 4.3 (a) er-
gibt. Ebenso wie dort folgt
t t
(III) u(t) , ϕ H − u0 , ϕ H + u(s) , ϕ V ds = f (s) , ϕ H ds
0 0
für alle ϕ ∈ V und t ∈ I := [0, T ].

Aus (III) folgt mit Hilfe des Hauptsatzes die zu (II) äquivalente Gleichung (2)
und damit die Gleichung (1) für alle Testfunktionen Φ = ϕ ⊗ ψ in Produkt-
form. Da deren Aufspann nach 4.2, Satz 4 in W01 (ΩT ) dicht liegt, folgt (1) für
alle Φ ∈ C∞c (ΩT ) und damit (I) durch partielle und sukzessive Integration.
4.5 Existenz und Eindeutigkeit schwacher Lösungen

Wir verwenden wie in 4.4 die Abkürzungen I = [0, T ] , J = ]0, T [ , H = L2 (Ω),
V = W01 (Ω).
Satz. Das Anfangs–Randwertproblem (∗) besitzt für u0 ∈ L2 (Ω), f ∈ L2 (ΩT )
genau eine schwache Lösung u ∈ L2 (]0, T [ , W01 (Ω)) ∩ C0 ([0, T ], L2 (Ω)) .
Diese ist gegeben durch die in beiden Normen L2 (J,V ) , C0 (I,H) konver-
gente Reihe

∞
u(x, t) = ai (t) vi (x)
i=1
mit
t
ai (t) := vi , u0 H e−λi t + vi , f (s) H e−λi (t−s) ds .
0
Dabei sind λk , vk die nach § 15 : 2.1 existierenden Eigenwertpaare des Laplace–
Operators auf Ω.
Weiter gilt die Energiegleichung
t t
1
2
u(t)2H + u(s)2V ds = 1
2
u0 2H + f (s) , u(s) H ds
0 0
für alle t ∈ [0, T ].

Dass die auftretenden Integrale Sinn machen, wurde in 4.4 erörtert.
Beweis.
(1) Eindeutigkeit der Lösung. Sind u1 , u2 schwache Lösungen des ARWP, so ist
u := u1 − u2 eine schwache Lösung mit Daten f = 0 und u0 = 0:
t
u(t) , ϕ H + u(s) , ϕ V ds = 0 für t ∈ I , ϕ ∈ V
0
und u(0) = 0 (Version (III) der Wärmeleitungsgleichung in 4.4). Wir wählen
ϕ = vi und erhalten mit u(s) , vi V = λi u(s) , vi H (nach 4.1 (a))
t
u(t) , vi H + λi u(s) , vi H ds = 0 für t ∈ I , i = 1, 2, . . . .
0
Da die Integranden Ai (t) := u(t) , vi H wegen u ∈ C0 (I, H) stetig sind, folgt
Ai ∈ C1 (I) und
Ȧi (t) + λi Ai (t) = 0 , Ai (0) = u(0) , vi H = 0,
also Ai = 0 für i = 1, 2, . . . . Aus der in § 15 : 1.2 festgestellten Vollständigkeit
des ONS v1 , v2 , . . . in H ergibt sich die in H konvergente Fourierentwicklung

∞
∞
u(t) = vi , u(t) H vi = Ai (t)vi = 0
i=1 i=1
für alle t ∈ I, somit u1 = u2 .

(2) Abschätzung der Koeffizienten ai (t).

Mit den Abkürzungen αi := vi , u0 H , βi (t) := vi , f (t) H gilt
t
ai (t) = αi e−λi t + βi (s) e−λi (t−s) ds (i = 1, 2, . . . )
0
und aufgrund der Parsevalschen Gleichung

∞
u0 2H = α2i ,
i=1

∞
f (t)2H = βi (t)2 ,
i=1
T T
∞ ∞
T
f 2L2 (I,H) = f (t)2H dt = βi (t)2 dt = βi (t)2 dt ,
0 0 i=1 i=1 0
letzteres nach dem Satz von Beppo Levi.

Mit der Cauchy–Schwarzschen Ungleichung ergibt sich die Abschätzung
2 t 2
ai (t)2 ≤ 2 αi e−λi t + 2 βi (s) e−λi (t−s) ds
0
t t
≤ 2α2i e−2λi t + 2 βi (s)2 ds · e−2λi (t−σ) dσ
0 0
T 1 − e−2λi t
≤ 2α2i e−2λi t + 2 βi (s)2 ds .
0
2λi
Durch Integration folgt
T 1 − e−2λi T T T
αi (t)2 dt ≤ 2α2i + βi (s)2 ds
0
2λi λi 0
1 2 T
≤ αi + T βi (s)2 ds .
λi 0
Hiermit erhalten wir für t ∈ I die Konvergenz der Reihen
∞
∞ ∞
1 T
1
(a) ai (t)2 ≤ 2 α2i + βi (s)2 ds = 2u0 2H + f 2L2 (I,H) ,
i=1 i=1 λ1 i=1 0 λ1

∞ T
∞ ∞
T
(b) λi ai (t)2 dt ≤ α2i + T βi (s)2 ds = u0 2H + T f 2L2 (I,H) .
i=1 0 i=1 i=1 0

∞
(3) Konvergenz der Reihe ai vi in C0 (I, H) und L2 (J, V ).
i=1

k
(i) Die Partialsummen uk := ai vi bilden eine Cauchy–Folge in C0 (I, H),
i=1
denn nach der Abschätzung (2) (a) und dem Konvergenzkriterium von Cauchy
gibt es zu gegebenem ε > 0 ein nε , so dass für > k ≥ nε

u (t) − uk (t)2H = ai (t)vi H =
2
ai (t)2 ≤ ε2
i=k+1 i=k+1
für alle t ∈ I gilt und somit

u − uk C0 (I,H) = sup u (t) − uk (t)H t ∈ I ≤ ε.
Die Cauchy–Folge (uk ) besitzt im Banachraum C0 (I, H) (4.2, Satz 1) einen

Grenzwert u.
(ii) Ebenso ergibt sich, dass die uk eine Cauchy–Folge in L2 (J, V ) bilden: Wegen
der Orthogonalitätsrelation 4.1 (b) und der Konvergenz der Reihe (2) (b) gibt
es zu jedem ε > 0 ein nε , so dass für > k > nε
T T 2
u − uk 2L2 (J,V ) = u (t) − uk (t)2V dt = ai (t)vi V dt
0 0 i=k+1
T
= λi ai (t)2 dt ≤ ε2 .
i=k+1 0
Die Cauchy–Folge (uk ) besitzt im Hilbertraum L2 (J, V ) (4.2, Satz 2) einen

Grenzwert v.
(iii) Die beiden Grenzwerte stimmen überein, denn wegen der Poincaré–Unglei-
chung wH ≤ c(Ω)wV für w ∈ V = W01 (Ω) (§ 14 : 6.2) gilt ÜA
u − vL2 (J,H) ≤ u − uk L2 (J,H) + v − uk L2 (J,H)

√
≤ T u − uk C0 (I,H) + c(Ω)v − uk L2 (J,V ) → 0
für k → ∞, somit ist u = v in den nach 4.2, Satz 2 isomorphen Hilberträumen

L2 (J, H), L2 (ΩT ) und damit u = v f.ü. in ΩT .

∞
(4) u := ai vi ist eine schwache Lösung des ARWP (∗). Für
i=1
t
ai (t) = e−λi t vi , u0 H + vi , f (s) H eλi s ds
0
gilt nach § 8 : 3.2 bzw. § 14 : 6.4 (c) die DG
ȧ(t) + λi ai (t) = vi , f (t) H

in schwacher Form (und fast überall). Äquivalent hierzu ist nach den in 4.4
gemachten Schlüssen
t t
ai (t) − ai (0) + λi ai (s) ds = vi , f (s) H ds .
0 0
Für die Partialsummen der Fourierreihen

k
k
uk (t) := aj (t)vj , fk (t) := vj , f (t) H vj
j=1 j=1
und für i ≤ k folgt wegen vi , uk (t) H = ai (t), vi , fk (t) H = vi , f (t) H

und wegen vi , vj V = λi δij
vi , u̇k (t) H + vi , uk (t) V = vi , fk (t) H
im Sinne von
t t
vi , uk (t) H − vi , uk (0) H + vi , uk (s) V ds = vi , fk (s) H ds .
0 0
Der Grenzübergang k → ∞ ergibt

t t
(III ) vi , u(t) H − vi , u(0) H + vi , u(s) V ds = vi , f (s) H ds
0 0
für i = 1, 2, . . . , denn es gilt fk → f in L2 (J, H), uk (t) → u(t) in H und

uk → u in L2 (]0, t[ , V ).
Aus (III ) folgt die Wärmeleitungsgleichung in der schwachen Version 4.4 (III),
denn Span {v1 , v2 , . . .} liegt nach § 15 : 1.3 auch in V dicht.
(5) Energiegleichung. Aus der in (4) aufgestellten schwachen DG

vi , u̇k (s) H + vi , uk (s) V = vi , fk (s) H
folgt
uk (s) , u̇k (s) H + uk (s) , uk (s) V = uk (s) , fk (s) H ;

k
dabei ist uk (s) , uk (s) H = ai (s)2 absolutstetig und damit Integral seiner
i=1

k
Ableitung 2ai (s)ȧi (s) = 2 uk (s) , u̇k (s) H. Somit gilt
i=1
1 1 t t
uk (t)2H − uk (0)2H + uk (s)2V ds = uk (s) , fk (s) H .
2 2 0 0
Die Energiegleichung ergibt sich durch Grenzübergang k → ∞ mit denselben

Schlüssen wie oben. 2
4.6 Regularität schwacher Lösungen

Wir beschränken uns auf die homogene Wärmeleitungsgleichung. Für die inho-
mogene lassen sich mit Hilfe des Duhamelschen Prinzips entsprechende Aussa-
gen formulieren, siehe Wloka [72] § 27, § 28.
Satz. Sei Ω ⊂ Ê n
ein beschränktes, C∞ –berandetes Gebiet. Weiter sei u die

k
schwache Lösung des homogenen ARWP (∗) und uk := ai vi seien die zu-
i=1
gehörigen Partialsummen. Dann gilt:
(a) Für u0 ∈ L2 (Ω) ist u ∈ C∞ (Ω × ]0, ∞[), und es gilt
uk → u in Cs (Ω × [τ, T ]) für k → ∞
und alle s, τ, T mit s = 1, 2, . . . und 0 < τ < T .

Insbesondere ist u eine klassische Lösung der Wärmeleitungsgleichung Hu = 0
in Ω × ]0, ∞[.
(b) Für u0 ∈ Cp (Ω) mit u0 = Δu0 = . . . = Δq u0 = 0 auf ∂Ω, q := [(p − 1)/2],

Ê
p > n/2 ist u stetig auf Ω × + , und es gilt
uk → u in C0 (Ω × [0, T ]) für k → ∞
und jedes T > 0.
Beweis.
Nach 4.5 gilt ai (t) = αi e−λi t mit αi = vi , u0 H.
(a) Es sei 0 < τ < T , j, r = 0, 1, . . . und j ≤ r. Für die j–te Ableitung
αi (t) = αi (−λi )j e−λi t von ai (t) gilt
(j)

∞ T (j)
∞
e−2λi τ − e−2λi T
λri αi (t)2 dt = λr+2j
i α2i
i=1 τ i=1 2λi
1
∞
≤ 2 λr+2j−1
i α2i e−2λi τ .
i=1
n/2
Aufgrund des asymptotischen Verteilungsgesetzes § 15 : 2.4 λk /k → const für
k → ∞ ist (λsk e−2λk τ )k∈ für jedes s ∈ Ê
eine Nullfolge und ist deshalb durch
eine Schranke c = c(s, τ ) > 0 beschränkt. Hiermit folgt weiter

∞ T (j) c ∞
c
λri (αi )2 (t) dt ≤ α2i = u0 2H .
i=1 τ
2 i=1 2
Wie in 4.5, Beweisteil (3) ergibt sich mit dieser Majorante die Konvergenz der
Partialsummen dj uk /dtj für k → ∞ im Hilbertraum L2 (]τ, T [ , D(Ar/2 ))
gegen ein Element wj .
Diese Konvergenz besteht auch in L2 (]τ, T [ , Wr (Ω)), weil nach dem Äquiva-
lenzsatz in § 15 : 1.4 (d) die Norm Ar/2 äquivalent zu der Wr –Norm r ist.
Weiter ist wj die schwache Ableitung dj u/dtj ÜA für j = 0, 1, . . . , r. Damit
gilt
uk → u in Wr (]τ, T [ , Wr (Ω)) für k → ∞ .
Nach Satz 3 (i) in 4.2 (e) und dem Einbettungssatz von Morrey § 14 : 6.4 (d)
existieren für r > s + (n + 1)/2 die stetigen Einbettungen
Wr (]τ, T [ , Wr (Ω)) → Wr (Ω × ]τ, T [), → Cs (Ω × [τ, T ]) .
Somit ergibt sich

uk → u in Cs (Ω × [τ, T ]) für k → ∞
und alle s, τ, T mit s = 1, 2, . . . und 0 < τ < T .
(b) Aufgrund des Entwicklungssatzes II § 15 : 1.4 (e) gehört u0 ∈ Cp (Ω) mit

den vorausgesetzten Randbedingungen zum Hilbertraum D(Ap/2 ), also gilt

∞
∞
∞
λpi ai (t)2 ≤ λpi α2i = λpi vi , u0 2
H = u0 2Ap/2
i=1 i=1 i=1
für jedes t ≥ 0. Wie in 4.5, Beweisteil (3) ergibt sich mit dieser Majoran-
te die Konvergenz der Partialsummen uk → u für k → ∞ im Banachraum
C0 ([0, T ], D(Ap/2 )) für jedes T > 0.
Diese Konvergenz besteht auch in C0 ([0, T ], Wp (Ω)) wegen der Äquivalenz der
Normen · Ap/2 und · p . Für p > n/2 existieren nach dem Morreyschen
Einbettungssatz § 14 : 6.4 (d) und nach 4.2 (a) die stetigen Einbettungen
C0 ([0, T ], Wp (Ω)) → C0 ([0, T ], C0 (Ω)) → C0 (Ω × [0, T ]) ,
somit folgt
uk → u in C0 (Ω × [0, T ]) für k → ∞
und jedes T > 0. 2
Um differenzierbare Annäherung u(t) → u0 für t → 0 der schwachen Lösung

an die Anfangswerte zu erzielen, müssen wir an u0 stärkere Bedingungen stellen:
Ê
Satz. Sei Ω ⊂ n ein beschränktes Cp –berandetes Gebiet, und u0 ∈ Cp (Ω)
erfülle u0 = Δu0 = . . . = Δq u0 = 0 auf ∂Ω mit q := [(p − 1)/2]. Unter der
Bedingung (p − 1)/3 > s + (n + 1)/2 gilt dann u ∈ Cs (Ω × + ) und Ê
uk → u in Cs (Ω × [0, T ]) für k → ∞ und jedes T > 0 .
Der Beweis des Satzes ergibt sich mit ähnlichen Argumenten wie im vorange-
henden Beweis.
4.7 Wärmeleitungsproblem bei vorgegebener Randtemperatur

(a) Wir betrachten für ein beschränktes Gebiet Ω ⊂ Ê n
das Problem
⎧
⎪
⎨ Hu = 0 in Ω × Ê >0 ,
(1) u(x, t) = g(x) für x ∈ ∂Ω und t > 0 ,

⎪
⎩
u(x, 0) = u0 (x) für x ∈ Ω .
Hierfür machen wir den Lösungsansatz u = v + w , wobei v ∈ C0 (Ω × Ê +) ∩
Ê
C2,1 (Ω × >0 ) eine Lösung des homogenen ARWP
(
(2)
Hv = 0 in Ω × Ê >0 ,
v(x, 0) = u0 (x) für x ∈ Ω
ist und w ∈ C0 (Ω) ∩ C2 (Ω) eine Lösung des Dirichlet–Problems
(3) Δw = 0 in Ω , w = g auf ∂Ω .
Sind beide Probleme lösbar, so liefert u = v + w eine und nach 2.2 die eindeutig
bestimmte Lösung von (∗).
(b) Es gilt dann lim u(t) − wH = 0 , d.h. für t → ∞ geht die Lösung von (1)
t→∞
über in die Lösung des stationären Wärmeleitungsproblems (3), vgl. § 6 : 5.1.
Denn für die Fourierkoeffizienten ai (t) = vi , v(t) H gilt nach den Abschät-
zungen im Beweisteil (2) zu 4.5
ai (t)2 ≤ 2α2i e−2λi t mit αi = vi , u0 H (i = 1, 2, . . .),

∞
somit für v = ai vi
i=1

∞
∞
u(t) − w2H = v(t)2H ≤ 2 α2i e−2λi t ≤ 2 e−2λ1 t α2i = 2e−2λ1 t u0 2H .
i=1 i=1
Aufgabe. Denken Sie sich ein Ei als eine homogene Kugel vom Radius π cm.
Es wird mit einer Anfangstemperatur von 20o C in einem Topf mit siedendem
Wasser (100o C) gelegt. Wie lange dauert es, bis der Mittelpunkt eine Tempera-
tur von 50o C erreicht?
Setzen Sie in der Wärmeleitungsgleichung ∂u/∂t = k Δu eine Wärmeleitfähig-
keit von k = 6 · 10−3 cm2 /s voraus.
Hinweis. Verwenden Sie den ersten Term in der Reihendarstellung:

∞
u(0, t) = vi , u0 H e−λi k t vi (0) ≈ v1 , u0 H e−λ1 k t v1 (0) ,
i=1
wobei gemäß § 15 : 3.6 und § 4 : 4.7 (c) v1 = u100 und λ1 = λ100 = (j1/2,1 /π)2 =
1 s−1 ist.
(Diese Aufgabe Eier Fourier“ ist dem Buch Strauss [53] p. 283 entnommen.)
”
429
§ 17 Die Wellengleichung
Vorkenntnisse: Die ersten drei Abschnitte verlangen keine besonderen Vorkennt-
nisse. Abschnitt 4 stützt sich im Wesentlichen auf § 14 : 6 (Sobolew–Räume),
§ 15 : 1 und § 16 : 4 (Funktionenräume für Evolutionsgleichungen).
1 Bezeichnungen, Problemstellungen
(a) Der Operator der Wellenausbreitung
¡ =
∂2
∂t2
− c2 Δ (c > 0 eine Konstante).
wird d’Alembert–Operator genannt.

Ê Ê Ê
Für (x0 , t0 ) ∈ n × = n+1 definieren wir die Kegel bzw. Kegelränder mit
Ê Ê Ê
Spitze (x0 , t0 ) ∈ n × = n+1
K± (x0 , t0 ) = K±
n+1
(x0 , t0 )

:= (x, t) ∈ Ê n+1
| x − x0 < c |t − tf 0|, t ≷ t0 ,
C± (x0 , t0 ) = C±
n+1
(x0 , t0 )

:= (x, t) ∈ Ê n+1
| x − x0 = c |t − t0 |, t ≷ t0 .
Für die Punkte des Raum–Zeit–Kontinuums n+1 = n × Ê Ê

schreiben wir Ê
mitunter auch x = (x1 , . . . , xn+1 ) mit xn+1 = t und bezeichnen den Raum–
Zeit–Gradienten und die Raum–Zeit–Divergenz entsprechend mit
∇u := (∂1 u, . . . , ∂n+1 u) ,

n+1
div v := ∂i vi .
i=1
Des Weiteren verwenden wir wie in § 16 : 1 für ein Gebiet Ω ⊂ Ê n

und für
T > 0 die Bezeichnungen

ΩT := Ω × ]0, T [ , ∂ ΩT := Ω × {0} ∪ ∂Ω × [0, T [ .
(b) Wir betrachten die folgenden Problemstellungen:

(i) Das Anfangswertproblem (Cauchy–Problem, AWP):
¡u = f in Ê n
× ]0, T [ ,
u(x, 0) = u0 (x), ∂u
∂t
(x, 0) = u1 (x) für x ∈ Ê n
mit gegebenen Funktionen f, u0 , u1 ,

430 § 17 Die Wellengleichung
(ii) das Anfangs–Randwertproblem (ARWP) auf einem beschränkten Ge-

Ê
biet Ω ⊂ n :
¡u = f in ΩT ,
u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) , ∂u
∂t
(x, 0) = u1 (x) für x ∈ Ω
mit gegebenen Funktionen f, g, u0 , u1 .
(c) Gleichmäßig hyperbolische Operatoren haben die Gestalt
∂2
− L,
∂t2
wobei L ein gleichmäßig elliptischer Operator ist, vgl. § 14 : 1 (b).

Für Operatoren dieses Typs lassen sich die für die Wellengleichung gewonnenen
Resultate mit geringfügigen Modifikationen übertragen. Eine Ausnahme macht
die Methode der sphärischen Mittel in Abschnitt 3, welche wesentlich auf der
Invarianz des Laplace–Operators unter räumlichen Drehungen beruht. Für el-
liptische Operatoren mit variablen Koeffizienten gibt es eine solche Symmetrie
im allgemeinen nicht.
Als Literatur empfehlen wir : Courant–Hilbert [3], Kap.6, Dautray–Lions

[4, 5], Ladyzhenskaya [65] Ch. IV, Sogge [100], Wloka [72] § 29–34.
2 Eigenschaften des d’Alembert–Operators

2.1 Invarianz unter Zeitspiegelungen
Der d’Alembert–Operator ist unter Zeitspiegelungen t → t∗ − t (t∗ ∈ ) in- Ê
¡
variant: Ist u eine Lösung der Wellengleichung u = f , so ist u∗ eine Lösung
¡
von u∗ = f∗ ; dabei haben wir
u∗ (x, t) := u(x, t∗ − t) , f∗ (x, t) := f (x, t∗ − t)
gesetzt.
2.2 Energiegleichung und Eindeutigkeit von Lösungen

(a) Wir nennen ein Gebiet U im Raum–Zeit–Kontinuum n × Ê Ê
raumar-
tig, wenn für je zwei Zeitpunkte σ < τ die Teilmenge U ∩ {σ < t < τ } ein
Gaußsches Gebiet (allgemeiner ein Normalgebiet) ist und wenn für das äußere
Einheitsnormalenfeld ν = (ν1 , . . . , νn+1 ) von U
2 Eigenschaften des d’Alembert–Operators 431

n
2
νn+1 − c2 νi2 ≤ 0
i=1
gilt, siehe die Figur auf der nächsten Seite. Beispiele für raumartige Gebiete
sind:
(i) Raum–Zeit–Zylinder Ω × Ê mit einem Normalgebiet Ω ⊂ Ê , n
(ii) die Kegel K (x , t ), K (x , t ) für (x , t ) ∈ Ê

+ 0 0 − 0 ÜA .
0 0 0
n+1
(b) Für raumartige Gebiete U ⊂ Ê und Lösungen u ∈ C (U) ∩ C (U) der

n+1 1 2
Wellengleichung ¡ u = f in U definieren wir die Energie von u in U zur Zeit

t durch
2
1 ∂u
E(t) = E U (t) := + c2 ∇u2 (x, t) dn x ,
2 ∂t
U(t)
wobei U(t) := {x ∈ Ê n
| (x, t) ∈ U}. Im Fall U = Ω × Ê schreiben wir EΩ (t)
statt EU (t).
Energiegleichung. Sei σ < τ und U(t) = ∅ für alle t ∈ ]σ, τ [ . Dann gilt

∂u n
E(τ ) = E(σ) − v , ν do + f d x dt ;
∂t
τU
∂σ Uτ
σ
dabei ist v = (v1 , . . . , vn+1 ),

2
∂u ∂u 1 ∂u
vi := − c2 (i = 1, . . . , n), vn+1 := + c2 ∇u2 ,
∂t ∂xi 2 ∂t
7
U τσ := U ∩ ]σ, τ [ = U(t) , ∂στ U := ∂U ∩ ]σ, τ [ ,
σ<t<τ
ν = (ν1 , . . . , νn+1 ) das äußere Einheitsnormalenfeld von U.
Beweis.
Es besteht die Identität

∂u ∂2u ∂u
f = − c2 Δu
∂t ∂t2 ∂t
2 0 1
1 ∂ ∂u ∂u ∂u
= − c2 div ∇u + c2 ∇ , ∇u
2 ∂t ∂t ∂t ∂t
2
1 ∂ ∂u ∂u 1 2 ∂
= − c2 div ∇u + c ∇u2
2 ∂t ∂t ∂t 2 ∂t

n+1
= ∂i vi = div v .
i=1
Das Normalgebiet Uτσ ⊂ n+1 besitzt Ê t

den Rand ∂Uτσ = U(σ) ∪ U(τ ) ∪ ∂στ U,
U(τ )
und für das äußere Einheitsnormalen-
feld ν von Uτσ gilt τ
ν = − en+1 auf U(σ) ,
∂στ U
ν = en+1 auf U(τ ) . U τσ
Mit dem Gaußschen Integralsatz ergibt

sich damit σ

f ∂u
∂t
dn+1 x = div v dn+1 x U(σ)
Uτ
σ Uτ
σ
x
= v , ν do
∂U τ
σ

= v , ν do + v , ν do + v , ν do
U(σ) U(τ ) τU
∂σ

= − vn+1 do + vn+1 do + v , ν do
U(σ) U(τ ) τU
∂σ

= − E(σ) + E(τ ) + v , ν do . 2
τU
∂σ
Die Energiegleichung hat wichtige Konsequenzen:
Ê
(c) Energieerhaltungssatz. Sei Ω ⊂ n ein Normalgebiet, T > 0, ν das
äußere Einheitsnormalenfeld von ΩT und u ∈ C1 (ΩT ∪ ∂ ΩT ) ∩ C2 (ΩT ) eine
Lösung der homogenen Wellengleichung u = 0 in ΩT mit
u = 0 oder ∂ ν u = 0 auf ∂Ω × ]0, T [ .
Dann ist die Energie EΩ (t) von u konstant für t ∈ [0, T [.
Beweis.
Für das äußere Einheitsnormalenfeld ν = (ν1 , . . . , νn+1 ) von Ω × ]0, T [ gilt
νn+1 = 0 auf ∂Ω × ]0, T [ , also folgt mit den eben verwendeten Bezeichnungen
∂u ∂u
n
∂u
v, ν = − c2 νi = − c2 ∂ν u = 0 auf ∂Ω × ]0, T [
∂t ∂xi ∂t
i=1
für beide Randbedingungen. Mit f = 0 liefert die Energiegleichung die Behaup-

tung EΩ (t) = EΩ (0) für t ∈ ]0, T [. 2
Als unmittelbare Folgerung ergibt sich der

(d) Eindeutigkeitssatz für das ARWP. Seien Ω, T , ν wie im vorigen Satz.

Dann besitzt das Anfangs–Randwertproblem
¡u = f in ΩT ,
u = g oder ∂ ν u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) , ∂
∂t
u(x, 0) = u1 (x) für x ∈ Ω
höchstens eine Lösung u ∈ C (ΩT ∪ ∂ ΩT ) ∩ C2 (ΩT ).
1
(e) Eine Hyperfläche M ⊂ Ê n+1

heißt charakteristisch, wenn

n
2
νn+1 − c 2
νi2 = 0
i=1
für ein (und damit jedes) Normalenfeld ν = (ν1 , . . . , νn+1 ) von M gilt.
Ist M als Nullstellenmenge einer C∞ –Funktion Φ mit ∇Φ = 0 gegeben, so heißt

n
(∂n+1 Φ)2 − c2 (∂i Φ)2 = 0 die charakteristische Differentialgleichung.
i=1
Die Kegelflächen C+ (x0 , t0 ), C− (x0 , t0 ) (vgl. 1 (a)) sind charakteristisch ÜA .
Wie sich charakteristische Flächen allgemein erzeugen lassen, zeigt die ÜA am
Ende dieses Abschnitts für den Spezialfall n = 2.
Eine weitere wichtige Folgerung aus der Energiegleichung ist die
Ê
Monotonie der Energie. Sei Ω ⊂ n ein Gebiet, u ∈ C1 (Ω×[0, T [)∩C2 (ΩT )
eine Lösung der homogenen Wellengleichung in ΩT , U ⊂ n+1 ein raumartiges Ê
Gebiet mit charakteristischer Randfläche ∂U und äußerem Einheitsnormalen-
feld ν = (ν1 , . . . , νn+1 ). Dann gilt für alle σ < τ mit U τσ ⊂ Ω × [0, T [
EU (σ) EU (τ ) , falls νn+1 0 .
Über die Werte von u auf ∂U wird hierbei nichts vorausgesetzt!
Beweis. Auf der charakteristischen Hyperfläche ∂στ U gilt |νn+1 | = c ν mit
ν := (ν1 , . . . , νn ). Im Fall νn+1 > 0 folgt mit der Cauchy–Schwarzschen Un-
gleichung

n
v, ν = vi νi + vn+1 νn+1
i=1

n
2
= − c2 ∂u
∂t
∂u
∂xi
νi + 1
2
∂
∂t
u + c2 ∇u2 νn+1
i=1
∂u 2
= − c2 ∂u
∂t
∇u , ν + 1
2 ∂t
+ c2 ∇u2 νn+1

≥ − c2 ∂u
∂t
∇u ν + 1
2
∂u 2
∂t
+ c2 ∇u2 νn+1

= − c ∂u ∇u νn+1 + 2
∂t
1
2
∂u
∂t
+ c2 ∇u2 νn+1 ≥ 0 ,
also nach der Energiegleichung

E(σ) − E(τ ) = v , ν do ≥ 0 .
τU
∂σ
Im Fall νn+1 ≤ 0 schließen wir analog oder wenden auf die eben abgeleitete
Ungleichung die Zeitspiegelung t → −t an ÜA . 2
ÜA Ist s → ϕ(s) = (ϕ1 (s), ϕ2 (s)) eine ebene, durch die Bogenlänge parame-
trisierte C2 –Kurve mit dem Normalenfeld N(s) = (ϕ̇2 (s), −ϕ̇1 (s)), so sind die
Ê
Flächen M± ⊂ 3 , parametrisiert durch
⎛ ⎞ ⎛ ⎞
ϕ1 (s) N1 (s)
(s, t) → Φ± (s, t) = ⎝ϕ2 (s)⎠ ± ct ⎝N2 (s)⎠ ,
t 0
charakteristisch (vgl. die Figur in 2.5).

Hinweis: Verwenden Sie ϕ̇21 + ϕ̇22 = 1 =⇒ ϕ̇1 ϕ̈1 + ϕ̇2 ϕ̈2 = 0 =⇒ ϕ̈21 + ϕ̈22 =
(ϕ̇21 + ϕ̇22 )(ϕ̈21 + ϕ̈22 ) = (ϕ̇1 ϕ̈2 − ϕ̇2 ϕ̈1 )2 .
2.3 Das schwache Huygenssche Prinzip

(a) Das Maximumprinzip ist für die Wellengleichung nicht gültig.
Beispiel. u(x, t) = sin x · sin(ct) löst
¡ u = 0 im Rechteck ΩT = ]0, π[×]0, T [
mit T = π/c. Es gilt u = 0 auf ∂ΩT , t
aber u(π/2, T /2) = 1.
Die folgende Aussage kann als Ersatz (x0 , t0 )
für das fehlende Maximumprinzip an-
gesehen werden:
Satz (Zaremba 1915). Ω ⊂ n sei Ê

ein Gebiet, u ∈ C1 (Ω × [0, T [) ∩ C2 (ΩT ) Ên
eine Lösung der homogenen Wellen-

gleichung in ΩT und (x0 , t0 ) ∈ ΩT eine Kct0 (x0 ) × {0}
Stelle mit Kct0 (x0 ) ⊂ Ω.
Gilt
∂u
u = 0 und = 0 auf Kct0 (x0 ) × {0} ,
∂t
so verschwindet u auf dem Kegelstück K− (x0 , t0 ) ∩ {t ≥ 0} und insbesondere
in der Kegelspitze (x0 , t0 ).
Bemerkung. Durch Zeitspiegelung t → −t ergibt sich eine entprechende Aus-
sage für negative Zeiten.
Beweis.
Wir setzen U = K− (x0 , t0 ) (vgl. 1 (a)) und verwenden die Bezeichnung U(t) :=
Ê
{x ∈ n | (x, t) ∈ U} von 2.2. Der Kegel U hat − von der Kegelspitze (x0 , t0 )
abgesehen − als Rand die charakteristische Hyperfläche C− (x0 , t0 ); und für
das äußere Einheitsnormalenfeld ν gilt νn+1 = (1 + c−2 )−1/2 > 0. Daher ist
EU (τ ) ≤ EU (0) für jedes τ ∈ ]0, t0 [ nach dem Monotoniesatz in 2.2.
Nach Voraussetzung gilt u = ∂u/∂t = 0 auf U(0) = Kct0 (x0 ) × {0}, woraus
∇u = 0 und damit EU (0) = 0 folgt.
Aus EU (τ ) = 0 schließen wir ∂u/∂t = 0 auf U(τ ) für jedes
7 τ ∈ ]0, t0 [ und
erhalten ∂u/∂t = 0 im ganzen Kegelstück U ∩ {t > 0} = U(τ ). Zusam-
0<τ <t0
men mit u = 0 auf U(0) folgt hieraus durch Integration längs zur t–Achse
parallelen Segmenten in U ∩ {t ≥ 0} dann
u = 0 in U ∩ {t ≥ 0} = K− (x0 , t0 ) ∩ {t ≥ 0}. 2
Folgerung (Schwaches Huygenssches Prinzip). Ω, T , x0 , t0 seien wie im

vorhergehenden Satz. Dann hängt die Lösung der homogenen Wellengleichung
im Punkt x0 zur Zeit t0 nur von den Anfangswerten auf der Kugel Kct0 (x0 ) ab:
Gilt für Anfangswerte u0 , u1 und v0 , v1 zum Zeitpunkt 0
u0 = v0 und u1 = v1 auf Kct0 (x0 ) ,
so gilt für die zugehörigen Lösungen u und v
u(x0 , t0 ) = v(x0 , t0 ) .
(b) Aus dem Satz von Zaremba können wir folgern, dass sich Signale mit end-
licher Geschwindigkeit ausbreiten. Unter einem zur Zeit t = 0 an der Stelle
y0 ∈ Ω ausgesandten Signal verstehen wir dabei Anfangswerte u0 , u1 mit nahe
um y0 konzentrierten Trägern,
supp u0 , supp u1 ⊂ Kr (y0 ) mit r 1 .
Sei ur die zugehörige Lösung der homogenen Wellengleichung,
Tr (x0 ) := inf{ t > 0 | ur (x0 , t) = 0}
die Ankunftszeit des Signals an der Stelle x0 ∈ Ω und
T0 := sup {Tr (x0 ) | r 1} .
Wir machen plausibel, dass die Ausbreitungsgeschwindigkeit v := x0 − y0 /T0

die Konstante c in der Wellengleichung nicht übertrifft, falls y0 hinreichend nahe
bei x0 liegt.
Zum Nachweis setzen wir tr := (x0 − y0 − r)/c. Wegen x0 − y0 = r + c tr

Ê
gilt supp u0 , supp u1 ⊂ Kr (y0 ) ⊂ n \Kctr (x0 ), also ur (x0 , t) = 0 für t ∈ [0, tr ]
nach dem Satz von Zaremba. Das bedeutet tr ≤ Tr (x0 ),
x0 − y0 x0 − y0 − r
= T0 ≥ Tr (x0 ) ≥ tr = für r 1
v c
und damit v ≤ c.
Für die Präzisierung der Argumentation verweisen wir auf Dautray–Lions [4,
2] Ch. 5.§ 3 und Treves [71] Ch. II. § 14. Zur weiteren Diskussion des Huygens-
schen Prinzips siehe 3.3.
Die Bedingung Kct0 (x0 ) ⊂ Ω im Satz von Zaremba begrenzt die Anwendbarkeit
auf kleine Zeiten t0 . Für große t0 gilt folgende Erweiterung:
Ê
Satz. Seien Ω ⊂ n ein beschränktes Gebiet, u ∈ C1 (ΩT ∪ ∂ ΩT ) ∩ C2 (ΩT )
eine Lösung der homogenen Wellengleichung in ΩT und (x0 , t0 ) ∈ ΩT . Ist
U := ΩT ∩ K− (x0 , t0 ) ein Normalgebiet und gilt
∂u
u = 0 und = 0 auf (Ω ∩ Kct0 (x0 )) × {0} ,
∂t

u = 0 oder ∂ν u = 0 auf ∂Ω × ]0, T [ ∩ K− (x0 , t0 ) ,
so verschwindet u in U und insbesondere in der Kegelspitze (x0 , t0 ).
Beweis als Aufgabe unter Verwendung von Argumenten der Beweise des Ener-
gieerhaltungssatzes, der Monotonieeigenschaft in 2.2 und des Satzes von Zarem-
ba.
2.4 Ausbreitung von Singularitäten

Unter einer schwachen Stoßwelle verstehen wir eine schwache Lösung u der
Ê
homogenen Wellengleichung auf einem Gebiet U ⊂ n+1, für welche u ∈ C1 (U)
gilt und eine C∞ –Hyperfläche M ⊂ U mit folgenden Eigenschaften existiert:
(i) U \ M besteht aus zwei Gebieten U+ und U − ,
(ii) es gibt Lösungen u± ∈ C∞ (U) der homogenen Wellengleichung mit
u = u+ auf U + ∪ M , u = u− auf U − ∪ M .
Wir nennen M die Singularitätenfläche von u.
Die Bedingung der C∞ –Differenzierbarkeit von M und u± wurde der Einfach-
heit halber gestellt; sie kann abgeschwächt werden.
Ist u eine schwache Stoßwelle mit Singularitätenfläche M , so gilt für [u] :=
u+ − u− wegen u ∈ C1 (U) und (ii)
[u] = 0 , ∂i [u] = 0 (i = 1, . . . , n + 1) auf M .
Die zweiten Ableitungen von u (definiert als die einseitigen Grenzwerte der
zweiten Ableitungen von u+ und u− ) können auf M Sprungstellen besitzen,
d.h. es kann ∂i ∂j [u] = 0 auf M eintreten. In diesem Fall sagen wir, u hat
schwache Singularitäten (Singularitäten zweiter Ordnung). Grundlage
einer genaueren Beschreibung dieser Singularitäten ist folgender
Hilfssatz. Beschreibt Φ ∈ C∞ (U) die Singularitätenfläche einer schwachen

Stoßwelle u als Nullstellenmenge,
M = {Φ = 0} und ∇Φ(x) = 0 für jedes x ∈ M ,
so existiert eine C∞ –Funktion σ auf U mit

1
[u] = σ Φ2 .
2
Eine Beweisskizze folgt am Ende des Abschnitts.
Aus der Darstellung von [u] durch Φ und σ folgt unmittelbar
(∗) ∂i ∂j [u] = σ ∂i Φ∂j Φ auf M = {Φ = 0} .
Wir nennen die auf die Hyperfläche M eingeschränkte Funktion σ : M → Ê

deshalb die Sprungintensität der zweiten Ableitungen von u.
Für das Folgende vereinbaren wir die Abkürzung

⎧
⎨−c2 für i = j = 1, . . . , n ,
ηij := 1 für i = j = n + 1 ,
⎩ 0 sonst.
Hiermit schreiben sich der d’Alembert–Operator und die Gleichung von charak-
teristischen Hyperflächen (siehe 2.2 (e))

¡u =
n+1 n+1
ηij ∂i ∂j u , ηij νi νj = 0 .
i,j=1 i,j=1
Satz. Sei u eine schwache Stoßwelle mit der durch Φ = 0 beschriebenen Sin-
gularitätenfläche M (Φ wie im Hilfssatz ). Dann gilt
(1) Ist u eine echte schwache Stoßwelle, d.h. verschwindet die Sprungintensität
σ nirgends auf M , so ist M eine charakteristische Hyperfläche.
(2) Ist M eine charakteristische Hyperfläche, so genügt die Sprungintensität
σ:M → Êder homogenen linearen Differentialgleichung erster Ordnung

n+1
ai ∂i σ + bσ = 0 auf M,
i=1

n+1
wobei a = (a1 , . . . , an+1 ) das tangentiale Vektorfeld auf M mit ai = ηij νj
j=1
∞
und b eine C –Funktion auf M ist.
Der Beweis folgt am Ende dieses Unterabschnitts.
Dieser Satz geht auf Untersuchungen von Christoffel (1877), Hugoniot
(1887) und Hadamard (1903) zurück. Nach der ersten Aussage können sich
die Singularitäten einer schwachen Stoßwelle nur in einer bestimmten Wei-
se ausbreiten; auf die Interpretation gehen wir in 2.5 näher ein. Um die Be-
deutung der zweiten Aussage zu verstehen, betrachten wir das Verhalten der
Sprungintensität σ längs Integralkurven I → M , s → x(s) des Vektorfeldes
a (Bicharakteristiken der charakteristischen Hyperfläche M ). Die DG für σ
führt unter Beachtung von ẋi (s) = ai (x(s)) auf die gewöhnliche DG
d
n+1
n+1
σ(x(s)) = ∂i σ(x(s)) ẋi (s) = (ai ∂i σ)(x(s)) = − (b σ)(x(s))
ds i=1 i=1
mit der Lösung

s
σ(x(s)) = σ(x(s0 )) exp − b(x(t)) dt für ein s0 ∈ I.
s0
Hiernach verschwindet die Sprungintensität σ längs einer Bicharakteristik der

Singularitätenfläche M entweder überall oder nirgends. Hat also eine schwa-
che Stoßwelle zu einem Zeitpunkt schwache Singularitäten (etwa vorgegeben
durch Anfangswerte), so bestehen diese für alle Zeiten. Hiermit zeigt sich ein
deutlicher Kontrast zum glättenden Verhalten der Wärmeleitungsgleichung, vgl.
§ 15 : 3.1. Eine anschaulichere Beschreibung der Ausbreitung von schwachen Sin-
gularitäten mittels Wellenfronten und Strahlen folgt in 2.5.
Beweisskizze für den Hilfssatz.

Es sei (s, ξ) → Ψ(s, ξ) der C∞ –Fluss des Vektorfeldes ∇Φ−2 ∇Φ , vgl.
§ 5 : 6.1. Für jedes ξ ∈ M gilt Φ(Ψ(0, ξ)) = Φ(ξ) = 0 und
d
n+1
∂Ψi
Φ(Ψ(s, ξ)) = ∂i Φ(Ψ(s, ξ)) (s, ξ) = 1 ,
ds ∂s
i=1
somit erhalten wir
Φ(Ψ(s, ξ)) = s für ξ ∈ M , |s| 1 .
Für die Funktion v := [u] ◦ Ψ und jedes ξ ∈ M gilt nach Voraussetzung
∂v
n+1
∂Ψi
v(0, ξ) = [u](ξ) = 0 , (0, ξ) = ∂i [u](ξ) (0, ξ) = 0 .
∂s ∂s
i=1
Mit partieller Integration ergibt sich hieraus ÜA
1
∂2v
v(s, ξ) = s2 (1 − τ ) (τ s, ξ) dτ .
∂s2
0
1
Definieren wir σ(x) für x = Ψ(s, ξ) durch das rechtsstehende Integral, so
2
erhalten wir eine C∞ –Funktion σ : U → mit [u] = 12 σ Φ2 . Ê 2
Beweis des Satzes.

Nach Voraussetzung erfüllen u+ und u− in U die homogene Wellengleichung,
also gilt

u u [u] =
n+1
(∗∗) 0 = + − − = ηij ∂i ∂j [u] in U .
i,j=1
Wir setzen im folgenden νi := ∂i Φ.

(1) Aus (∗) und (∗∗) folgt

n+1
n+1
0 = ηij ∂i ∂j [u] = σ ηij νi νj auf M ,
i,j=1 i,j=1
woraus wir mit σ = 0 auf M die Aussage (1) erhalten.

(2) Aus [u] = 21 σ Φ2 ergibt sich durch dreimaliges Ableiten und Einschränkung
auf M = {Φ = 0}
1
∂k ∂j ∂i [u] = ∂k ∂j ∂i 2
σ Φ2
= ∂ i σ νj νk + ∂ j σ νi νk + ∂ k σ νi νj

+ σ νi ∂ j ∂ k Φ + νj ∂ i ∂ k Φ + νk ∂ i ∂ j Φ .
Wir erhalten durch Ableiten der Gleichung (∗∗) in Richtung des Normalenvek-
tors ν = (ν1 , . . . , νn+1 ) = ∇Φ auf M

[u] =
n+1 n+1
0 = νk ∂ k ηij νk ∂k ∂j ∂i [u]
k=1 i,j,k=1

n+1
= ηij νk ∂i σ νj νk + ∂j σ νi νk + ∂k σ νi νj
i,j,k=1
n+1
+σ ηij νk νi ∂j ∂k Φ + νj ∂i ∂k Φ + νk ∂i ∂j Φ .
i,j,k=1
Fassen wir im letzten Ausdruck die beiden ersten Terme zusammen, so ergibt

n+1
n+1
sich 2ν2 ai ∂i σ mit ai = ηij νj ; der dritte Term verschwindet auf der
i=1 j=1
nach Voraussetzung charakteristischen Fläche M , der vierte und fünfte Term

n+1
n+1
lassen sich zu νk ∂k N mit N := ηij ∂i Φ ∂j Φ zusammenfassen, und der
k=1 i,j=1
letzte Term liefert σ ν2 ¡ Φ . Setzen wir

n+1
2b := ¡ Φ + ν −2
νk ∂ k N ,
k=1
so ergibt sich die Differentialgleichung

n+1
ai ∂i σ + bσ = 0 auf M .
i=1
Das Vektorfeld a = (a1 , . . . , an+1 ) ist tangential zur Hyperfläche M wegen

n+1
n+1
a, ν = a i νi = ηij νi νj = 0 auf M . 2
i=1 i,j=1
2.5 Wellenfronten und Strahlen

Wir zeigen jetzt, dass die Ausbreitung schwacher Singularitäten den Gesetzen
der geometrischen Optik folgt.
Nach der ersten Aussage des Satzes in 2.4 ist die Singularitätenfläche M ei-
ner echten schwachen Stoßwelle u eine charakteristische Hyperfläche. M kann
wegen |νn+1 | = c ν = 0 als Graph einer C∞ –Funktion ϕ auf einem Ge-
Ê
biet Ω ⊂ n dargestellt werden. M ist damit Nullstellenmenge der Funktion
Φ(x1 , . . . , xn+1 ) = xn+1 − ϕ(x1 , . . . , xn ), und es folgt mit den Bezeichnungen
von 2.4

ν = −∂1 ϕ, . . . , −∂n ϕ, 1 , a = c2 ∂1 ϕ, . . . , c2 ∂n ϕ, 1 .
Die charakteristische Differentialgleichung (siehe 2.2 (e)) erhält somit die Gestalt
c ∇ϕ = 1 ,
und die Differentialgleichung der Bicharakteristiken s → (x1 (s), . . . , xn+1 (s))

lautet mit der Abkürzung x(s) := (x1 (s), . . . , xn (s))
ẋ(s) = c2 ∇ϕ(x(s)) , ẋn+1 (s) = 1 .
Die Bicharakteristiken lassen sich also durch die Zeitkoordinate s = xn+1 = t

parametrisieren.
Wir nennen die Hyperflächen im Ê n
Mt := {x ∈ Ω | (x, t) ∈ M } = {x ∈ Ω | ϕ(x) = t} (t ∈ Ê)
die Wellenfronten und die Projektio-

nen der Bicharakteristiken auf den n, Ê t
t → x(t) = (x1 (t), . . . , xn (t)),
die Strahlen von M .
Satz. Die Punkte x(t) bewegen sich

mit der Geschwindigkeit c auf Gera-
den und schneiden die Wellenfronten
senkrecht, d.h. die Wellenfronten brei- x2
ten sich mit der Geschwindigkeit c in
Richtung ihrer Normalen aus.
Bei der Ausbreitung von Singularitäten

gelten somit die Gesetze der geometri- x1
schen Optik für ein Medium mit Bre- Wellenfront
chungsindex n = 1, vgl. § 7 : 3.1. Strahl
Beweis.
ẋ(t) = c2 ∇ϕ(x(t)) ist ein Normalenvektor der Wellenfront Mt im Punkt x(t),
es gilt ẋ(t) = c2 ∇ϕ(x(t)) = c und für i = 1, . . . , n
d n
ẍi (t) = c2 (∂i ϕ(x(t))) = c2 ∂j ∂i ϕ(x(t)) ẋj (t)
dt j=1

n
= c4 ∂j ∂i ϕ(x(t)) ∂j ϕ(x(t))
j=1
1 4 n
= c ∂i (∂j ϕ)2 (x(t)) = 0 . 2
2 j=1
Für die Sprungintensität σ der schwachen Stoßwelle gilt längs jeder Bicharak-
teristik (wir schreiben jetzt σ(t) anstelle von σ(x(t))
σ̇ + 1
2
Θσ = 0 mit Θ := c2 Δϕ .
Das ergibt sich aus dem Beweisteil (2) des Satzes in 2.4 mit

n+1
N = ηij ∂i Φ∂j Φ = 1 − c2 ∇ϕ2 =, 0 ,
i,j=1
2b = Φ = −c 2
Δϕ auf M .
√
Es läßt sich zeigen, dass Θ die Änderungsrate des Oberflächenelements g der
Wellenfronten unter dem Normalenfluß c2 ∇ϕ ist, d.h. dass gilt
√ √
Θ = ˙g/ g = ġ/2g .
Zusammen mit der DG

1
σ̇/σ = − 2 Θ
folgt hieraus durch Integration
√
σ 2 = const / g .
Die Sprungintensität ist hiernach im Wesentlichen eine geometrische Größe der
Wellenfronten.
Beispiel. Für die charakteristischen Kegel C± (x0 , t0 ) ergibt sich
σ 2 (x(t), t) = const / x(t) − x0 ±(n−1) .

auf jedem Strahl x(t) ÜA .
Literatur zu schwachen Singularitäten: Courant–Hilbert [3], Kap.6, §1, §2,
Hadamard [90] 69–123.
3 Das Anfangswertproblem
Wir betrachten in diesem Abschnitt für n = 1, 2, 3 das Anfangswertproblem
⎧
⎨ ¡u = f in Ên
× Ê,
(∗)
⎩ u(x, 0) = u0 (x) , ∂u (x, 0) = u1 (x) für x ∈ Ên .
∂t
3.1 Die homogene Wellengleichung im Ê 1
Satz (d’Alembert (1747)). (a) Jede Lösung u der eindimensionalen Wellen-

gleichung
¡u = ∂2u
∂t 2
∂2u
− c2 2 = 0
∂x
hat die Gestalt
u(x, t) = F (x + ct) + G(x − ct)
mit geeigneten Funktionen F, G ∈ C2 ( ). Ê
Die Lösung ist also die Überlagerung einer nach links und einer nach rechts
wandernden Welle, beide mit festem Profil und der Geschwindigkeit c.
Ê Ê
(b) Zu gegebenen Anfangswerten u0 ∈ C2 ( ), u1 ∈ C1 ( ) liefert die Lösungs-
formel von d’Alembert

x+ct
1 1
u(x, t) = u0 (x + ct) + u0 (x − ct) + u1 (s) ds
2 2c
x−ct
die eindeutig bestimmte Lösung des Anfangswertproblems.

Beweis.
(a) Wir führen in der Ebene charakteristische Koordinaten ξ, η ein durch
ξ = x + ct , η = x − ct , bzw. x = 12 (ξ + η) , t = 1
2c
(ξ − η) .
Dabei geht {(x, t) | x ∈ Ê, t > 0} über in das Gebiet {(ξ, η) | ξ > η} .
Ist u eine Lösung der homogenen Wellengleichung, so erfüllt
1 1
U (ξ, η) := u 2 (ξ + η), 2c (ξ − η)
die Gleichung

1 ∂2U ∂2u 2
2 ∂ u
− (ξ, η) = − c (x, t) = 0 .
4c2 ∂ξ ∂η ∂t2 ∂x2
Aus dieser folgt
∂U
(ξ, η) = g(η)
∂η
η
Ê
mit einer Funktion g ∈ C1 ( ) . Setzen wir G(η) := g(s) ds , so ergibt sich
0
∂
∂η
U (ξ, η) − G(η) = 0 für ξ ∈ Ê, ξ > η,
somit
U (ξ, η) − G(η) = F (ξ) für ξ ∈ Ê, ξ > η,
wobei F : Ê → Ê eine C –Funktion ist. Damit erhalten wir für x ∈ Ê, t > 0
2
u(x, t) = U (ξ, η) = F (ξ) + G(η) = F (x + ct) + G(x − ct) .

Die rechte Seite stellt eine für alle (x, t) ∈ Ê 2
definierte Lösung der Wellenglei-
chung dar.
(b) Ist u eine Lösung des Anfangswertproblems, so besteht nach (a) die Dar-
stellung u(x, t) = F (x + ct) + G(x − ct) mit F, G ∈ C2 ( ) . Bezeichnet U1 die Ê
Stammfunktion von u1 mit U1 (0) = c (F (0) − G(0)) , so gilt
u0 (x) = u(x, 0) = F (x) + G(x) ,
∂
U1 (x) = u1 (x) = u(x, 0) = c (F (x) − G (x)) .
∂t
Durch Integration der zweiten Identität ergibt sich
1 1 1 1
F = 2 u0 + 2c U1 , G = 2 u0 − 2c U1 ,
woraus die d’Alembertsche Formel folgt. Dass u eine Lösung des AWP darstellt,
ist leicht nachzurechnen. 2
Aufgabe. Zeigen Sie für jede Lösung u t

der eindimensionalen homogenen Wel- P3
lengleichung die Beziehung
P2
u(P0 ) + u(P3 ) = u(P1 ) + u(P2 ) , P1
falls die vier Punkte P0 , P2 , P3 , P1 ein

P0
charakteristisches Parallelogramm bil-
den, d.h. falls folgendes gilt (Fig.): x
P0 , P2 und P1 , P3 liegen jeweils auf Geraden x − ct = const,

P0 , P1 und P2 , P3 liegen jeweils auf Geraden x + ct = const.
3.2 Sphärische Mittel

Die Lösungen der 3–dimensionalen Wellengleichung lassen sich durch Integrale
über Sphären darstellen (Euler 1766, Poisson 1808). Zum Nachweis benötigen
wir einige Eigenschaften sphärischer Integrale.
Ê
Sr (x) := ∂Kr (x) = {y ∈ 3 | y − x = r} bezeichne die r–Sphäre mit
Ê
Mittelpunkt x ∈ 3 und Radius r > 0 . Das sphärische Mittel einer im 3 Ê
Ê
stetigen Funktion u ist für x ∈ 3 , r > 0 definiert durch

1
m(x, r) = − u do := u(y) do(y) .
4πr 2
Sr (x) S r (x )
Durch Anwendung des Transformationssatzes für Integrale mit der Substitution

S1 (0) → Sr (x) , ξ → x + rξ ergibt sich

1
m(x, r) = u(x + rξ) do(ξ) .
4π
S1 (0)
Diese Darstellung zeigt, dass r → m(x, r) für jedes x zu einer stetigen, in r

geraden Funktion auf Ê
fortsetzbar ist.
Eigenschaften des sphärischen Mittels

(a) m(x, 0) = u(x).
(b) Ist u Cs –differenzierbar, so auch (x, r) → m(x, r), und ∂m/∂xi ist das
sphärische Mittel von ∂u/∂xi .
(c) Hängt u Cs –differenzierbar von einem Parameter t ab, so auch das sphä-
rische Mittel, und ∂m/∂t ist das sphärische Mittel von ∂u/∂t .

(d)
∂m
∂r
(x, r) =
1
2
4πr Kr (x)
Δu(y) d3 y gilt für u ∈ C2 ( Ê ) und r > 0 .
n
(e)
∂2m
∂r 2
(x, r) +
2 ∂m
r ∂r
(x, r) = Δx m(x, r) gilt für u ∈ C2 ( Ên
) und r = 0.
(Darboux–Gleichung).
Beweis.
Wir verwenden die zweite Darstellung des sphärischen Mittels.
(a) ist unmittelbar klar.
(b) und (c) ergeben sich aus dem Satz über die differenzierbare Abhängigkeit
von Parameterintegralen , vgl. Bd. 1, § 23 : 5.1.
(d) Für y = x + rξ ∈ Sr (x) mit ξ ∈ S1 (0) ist n(y) = ξ der äussere Einheits-
normalenvektor von Kr (x) in y. Hieraus folgt zusammen mit dem Gaußschen
Integralsatz
∂m 1 ∂ 1 ∂
(x, r) = u(x + rξ) do(ξ) = ∂r
u(x + rξ) do(ξ)
∂r 4π ∂r S (0) 4π S (0)
1 1
1
= ∇u(x + rξ) , ξ do(ξ)
4π S (0)
1
1
= ∇u(y) , n(y) do(y)
4πr 2 Sr (x)
1 1
= 2
∂n u do = 2
Δu(y) d3 y .
4πr Sr (x) 4πr Kr (x)
(e) Aus (d) folgt durch zwiebelweise Integration (Bd. 1, § 25 : 3.2)

∂2m 2 ∂m 1 ∂ ∂m
+ (x, r) = 2 r2 (x, r)
∂r 2 r ∂r r ∂r ∂r
1 ∂
= 2
Δu(y) d3 y
4πr ∂r Kr (x)
1 ∂ r
= 2
Δu do d
4πr ∂r 0 S (x)
1
= 2
Δu do = Δx m(x, r) . 2
4πr Sr (x)
3.3 Die homogene Wellengleichung im Ê 3
Sei u eine Lösung des Anfangswerproblems für die dreidimensionale homoge-

ne Wellengleichung. Nach den Rechenregeln 3.2 (b),(c),(e) erfüllt das sphärische
Mittel m(x, r, t) von x → u(x, t) (t als Parameter aufgefaßt) die Differential-
gleichung von Euler–Poisson–Darboux

1 ∂2m 1 ∂2u
2 2
(x, r, t) = 2 − (y, t) do(y) = − Δu(y, t) do(y)
c ∂t c ∂t2
S r (x ) S r (x )
2

∂ m 2 ∂m 1 ∂2
= 2
+ (x, r, t) = (r m) (x, r, t)
∂r r ∂r r ∂r 2
Ê
für x ∈ 3 , r > 0 , t > 0 . Setzen wir M (x, r, t) := r · m(x, r, t) , so erfüllt
Ê
(r, t) → M (x, r, t) für jedes x ∈ 3 die 1–dimensionale Wellengleichung
∂2M ∂2M
(x, r, t) = c2 (x, r, t)
∂t2 ∂r 2
und genügt den Anfangsbedingungen

M (x, r, 0) = r − u0 (y) do(y) =: M0 (x, r) ,
S r (x )
∂M
(x, r, 0) = r − u1 (y) do(y) =: M1 (x, r) .
∂t S r (x )
Die Anwendung der d’Alembertschen Darstellungsformel 3.1 (b) auf die Funk-
tion (r, t) → M (x, r, t) (x festgehalten) ergibt daher
1 1
r+ct
(+) M (x, r, t) = (M0 (x, r + ct) + M0 (x, r − ct)) + M1 (x, s) ds
2 2c r−ct
für x ∈ Ê 3
, r∈ Ê, t ≥ 0 .
Hieraus läßt sich eine Darstellung der Lösung u durch die Mittel der Anfangs-
werte ableiten:
Zunächst ist nach 3.2 (a)
1
u(x, t) = m(x, 0, t) = lim m(x, r, t) = lim M (x, r, t) .
r→0 r→0 r
Weil M0 (x, r) und M1 (x, r) ungerade in r sind, gilt

r−ct
M0 (x, r − ct) = − M0 (x, ct − r) , M1 (x, s) ds = 0 .
ct−r
Hieraus folgt einerseits

1 1
M0 (x, r + ct) + M0 (x, r − ct) = M0 (x, r + ct) − M0 (x, ct − r)
2r 2r
1 1
= M0 (x, r + ct) − M0 (x, ct) − M0 (x, ct − r) − M0 (x, ct)
2r 2r
∂M0 1 ∂M0
→ (x, ct) = (x, ct) für r → 0 ;
∂r c ∂t
andererseits folgt

1 r+ct
1 r+ct
1 r−ct
M1 (x, s) ds = M1 (x, s) ds + M1 (x, s) ds
2cr r−ct 2cr r−ct 2cr ct−r

1 r+ct
1 r+ct 1 ct
= M1 (x, s) ds = M1 (x, s) ds + M1 (x, s) ds
2cr ct−r 2cr ct 2cr ct−r

1 r+ct
1 ct−r
= M1 (x, s)ds − M1 (x, s) ds
2cr ct 2cr ct
1
→ M1 (x, ct) für r → 0 .
c
Aus (+) ergibt sich somit nach Ausführung des Grenzübergangs r → 0
1 ∂M0 1
u(x, t) = (x, ct) + M1 (x, ct) .
c ∂t c
Hiermit haben wir die Poissonsche Darstellungsformel erhalten:

Satz (Poisson (1818)). Jede Lösung u des Anfangswertproblems für die homo-
gene dreidimensionale Wellengleichung besitzt die Darstellung
1
∂ 1
u(x, t) = u0 do + u1 do
∂t 4πc2 t 4πc2 t
Sct (x) Sct (x)

1
= u0 (y) + t u1 (y) + ∇u0 (y) , y − x do(y)
4πc2 t2
Sct (x)
für x ∈ Ê3
, t > 0 . Diese läßt sich zu einer Lösung für alle t ∈ Ê fortsetzen.
Die zweite Lösungsdarstellung ergibt t
sich aus der ersten mit Hilfe des Be-
weises 2.2 (d). Der zweiten Darstellung (x0 , t0 )
entnehmen wir, dass die Lösung u an
der Stelle (x, t) nur von den Anfangs-
werten u0 , u1 , ∇u0 auf der Sphäre x0
Sct (x) abhängt; wir nennen deshalb die Ê 3 y0
Sphäre Sct (x) das Abhängigkeitsge-
biet der Lösung an der Stelle (x, t) . Sct0 (x0 )
Aufgrund dieser Tatsache ist die Übermittlung scharfer Signale mittels der drei-
dimensionalen Wellengleichung in folgendem Sinne möglich: Eine lokale Anre-
gung des Feldes zur Zeit t = 0 an der Stelle y0 (d.h. Anfangswerte u0 , u1 , deren
Träger in einer Kugel Kr (y0 ) für r 1 liegen) pflanzt sich so fort, dass an einer
Stelle x0 = y0 zur Zeit t0 := x0 − y0 /c ein kurzes Signal empfangen wird
(d.h. für die zugehörige Lösung gilt u(x0 , t) = 0 nur für |t − t0 | ≤ r/c ) (Fig.)
ÜA . Dieses Huygenssche Prinzip für die Wellengleichung verschärft die
allgemeine Aussage von 2.3, nach welcher das Abhängigkeitsgebiet in der Kugel
Kct0 (x0 ) liegt.
Die Bezeichnung Huygenssches Prinzip“ wurde von J. Hadamard 1923 im
”
Zusammenhang mit der Vermutung verwendet, dass unter allen normal hyper-
”
bolischen“ Gleichungen im Wesentlichen nur die Wellengleichung in ungeraden
Raumdimensionen eine scharfe Signalübertragung erlaubt. Diese Vermutung er-
wies sich im Fall n = 3 als falsch, wie P. Günther 1965 zeigte (Arch. Rat. Mech.
Anal. 18 (1965) 103–106).
Die Poissonsche Darstellungsformel kann als Lösungsformel verwendet werden:

Satz. Für u0 ∈ C3 ( Ê ), u
3
1 ∈ C2 ( Ê ),
3
x∈ Ê3
und t > 0 setzen wir

∂ 1 1
u(x, t) := u0 do + u1 do .
∂t 4πc2 t 4πc2 t
Sct (x) Sct (x)
Dann kann u zu einer Lösung des Anfangswertproblems für die homogene Wel-
lengleichung auf 3 ×Ê Ê fortgesetzt werden und stellt die eindeutig bestimmte
Ê Ê
Lösung dar. Im Fall u0 ∈ Cm+1 ( 3 ), u1 ∈ Cm ( 3 ) mit m ≥ 2 ist die Lösung
Cm –differenzierbar.
Der Beweis ergibt sich durch direktes Nachrechnen unter Verwendung der Re-
chenregeln 3.2 für das sphärischen Mittel. Die Eindeutigkeit der Lösung folgt
aus der Poissonschen Darstellungsformel.
Die Differenzierbarkeitsbedingungen an die Anfangswerte können nicht abge-
schwächt werden. Dies zeigt Teil (c) der folgenden
Aufgabe. (a) Zeigen Sie, dass jede kugelsymmetrische Lösung der 3–dimensio-
nalen Wellengleichung u(x, t) = U (r, t) (r = x) mit den Anfangsdaten u0 = 0,
u1 (x) = U1 (r) mit einer geraden C2 –Funktion U1 ∈ C2 ( ) die DarstellungÊ
⎧
⎪
1 r+ct
⎨ s U1 (s)ds für r > 0,
U (r, t) := 2cr r−ct
⎪
⎩
t U1 (t) für r=0
besitzt.
(b) Die hierdurch definierte Funktion U liefert umgekehrt auch eine Lösung
des AWP.
(c) Für die C1 –differenzierbare, aber nicht C2 –differenzierbare Anfangsge-
schwindigkeit

(c2 − r 2 )3/2 für r ≤ c ,
U1 (r) :=
0 für r ≥ c
ist die in (a) definierte Funktion u(x, t) = U (r, t) im Kegel mit der Spitze
(x0 , t0 ) = (0, 0, 0, 1),
K−
4
(x0 , t0 ) = {(x, t) ∈ Ê4
| x < c (1 − t) , t < 1} ,
eine Lösung des AWP. In der Kegelspitze (x0 , t0 ) ist ∂ 2 u/∂t2 unstetig. Die
Ê
auf der Sphäre Sc (x0 ) ⊂ 3 liegenden Unstetigkeiten der zweiten Ableitungen
der Anfangswerte u1 (x) = U1 (r) erreichen die Stelle x0 = 0 also erst zur Zeit
t0 = 1 .
3.4 Die homogene Wellengleichung im Ê2
Jeder Lösung u(x, t) = u(x1 , x2 , t) der zweidimensionalen Wellengleichung ist

durch U (x1 , x2 , x3 , t) := u(x1 , x2 , t) eine Lösung U der dreidimensionalen Wel-
lengleichung zugeordnet. Aus der Poissonschen Integraldarstellung 3.3 für U
gewinnen wir damit eine Integraldarstellung für u . Dieser Kunstgriff wird Ha-
damardsche Abstiegsmethode genannt. Hiermit ergibt sich der
Satz. Jede Lösung u des Anfangswertproblems für die zweidimensionalen Wel-
lengleichung besitzt für t > 0 die Darstellung

∂ 1 u0 (y)
u(x, t) = d2 y
∂t 2πc c2 t2 − y − x2
Kct (x)

1 u1 (y)
+ d2 y .
2πc c2 t2 − y − x2
Kct (x)
Bemerkung. Anders als im Fall n = 3 hängt hier die Lösung an der Stelle
(x, t) von den Anfangswerten auf der ganzen Kreisscheibe Kct (x) ab. Ein zur
Zeit t = 0 im Punkt y0 ausgesandtes Signal wird an der Stelle x0 = y0 als
zur Zeit t0 = x0 − y0 / c einsetzendes und allmählich abklingendes Signal
empfangen; vgl. 3.3, 2.3. (Ähnliches beobachten wir bei Wasserwellen, wobei
dahingestellt sei, ob diese der zweidimensionalen Wellengleichung genügen.)
Beweis.
Wir setzen U (x1 , x2 , x3 , t) := u(x1 , x2 , t) und Uk (x1 , x2 , x3 ) = uk (x1 , x2 ) für
k = 0, 1. Da U der dreidimensionalen Wellengleichung genügt und deshalb nach
3.3 durch sphärische Mittel von U0 und U1 dargestellt werden kann, geht es
nur darum, die beiden Integrale über Sphären in Integrale über Kreisscheiben
umzuformen.
Für x = (x1 , x2 ) ∈ Ê , r > 0 setzen wir x/ := (x , x , 0),

2
1 2
Sr+ (x)/ := {ξ ∈ Sr (/
x) | ξ3 > 0} , Sr− (x) / := {ξ ∈ Sr (/
x) | ξ3 < 0}
und parametrisieren die beiden Halbsphären als Graphen über der Kreisscheibe
Ê
Kr (x) ⊂ 2 , z.B. die obere durch
Φ : Kr (x) → Sr+ (/
x) , y = (y1 , y2 ) → (y1 , y2 , ϕ(y))
mit ϕ(y) := r 2 − y − x2 . Für das Oberflächenelement ergibt sich nach

§ 11 : 2.4 oder Bd. 1, § 25 : 2.5 (a)

r
do = 1 + ∇ϕ(y)2 d2 y = d2 y ;
r2 − y − x2
derselbe Ausdruck ergibt sich für das Oberflächenelement der unteren Halb-
sphäre Sr− (/
x). Weiter gilt für beide Halbsphären (Uk ◦ Φ)(y) = uk (y) , und
daher

Uk do = Uk do + Uk do = 2 Uk do
/
Sr (x) /
Sr+ (x) Sr− (x)/ /
Sr+ (x)

uk (y)
= 2r d2 y .
r 2 − y − x2
Kct (x)
Damit erhalten wir für die Integrale in der Poissonschen Darstellungformel

1 1 uk (y)
Uk do = d2 y . 2
4πc2 t 2πc r 2 − y − x2
/
Sct (x) Kct (x)
Aus der Lösungsdarstellung in 3.3 ergibt sich mit diesen Umformungen:
Satz. Für u0 ∈ C3 ( Ê ),
2
u1 ∈ C2 ( Ê ),
2
x∈ Ê 2
, t > 0 setzen wir

∂ 1 u0 (y)
u(x, t) := d2 y
∂t 2πc c2 t2 − y − x2
Kct (x)

1 u1 (y)
+ d2 y .
2πc c2 t2 − y − x2
Kct (x)
Dann kann u zu einer Lösung des Anfangswertproblems für die homogene Wel-
lengleichung auf 2
× Ê Ê
fortgesetzt werden und diese stellt die eindeutig be-
Ê
stimmte Lösung dar. Im Fall u0 ∈ Cm+1 ( 2) , u1 ∈ Cm ( 2) mit m ≥ 2 ist Ê
die Lösung Cm –differenzierbar.
3.5 Die inhomogene Wellengleichung

Wir betrachten für n = 1, 2, 3 das Anfangswertproblem
⎧
⎨ ¡u = f in Ê n
× Ê >0 ,
(∗∗)
⎩ u(x, 0) = ∂u (x, 0) = 0 für x ∈ Ên .
∂t
mit gegebener Funktion f auf Ê n
× Ê +.
Ist dieses gelöst, so folgt durch Superposition der Lösung mit der Lösung der
homogenen Wellengleichung in 3.1, 3.3, 3.4 die allgemeine Lösung des Anfangs-
wertproblems (∗). Zur Lösung des Problems (∗∗) dient der folgende
Satz (Duhamelsches Prinzip). Gegeben sei f ∈ C2 ( Ê n

× Ê +) . Für jedes
s ≥ 0 bezeichne us die Lösung des Anfangswertproblems
¡u = 0 in Ê n
× ]s, ∞[ ,
u(x, s) = 0 für x ∈ Ê n
,
∂u
∂t
(x, s) = f (x, s) für x ∈ Ê n
.
Dann ist durch

t
u(x, t) := us (x, t) ds
0
die eindeutig bestimmte Lösung u ∈ C1 ( Ên

× Ê+) ∩ C2 ( Ê n
× Ê>0 ) des An-
fangswertproblems (∗∗) gegeben.
Das Duhamelsche Prinzip wird auch für die Lösung der inhomogenen Wärmelei-
tungsgleichung verwendet, vgl. § 16 : 3.3.
Beweis.
Hängen in den Lösungsformeln in 3.1, 3.3, 3.4 die Anfangswerte u0 und u1
C2 –differenzierbar von einem Parameter s ab, so gilt das nach 3.2 (b) auch für
die Lösungen der homogenen Wellengleichung. Hiernach ist (x, t, s) → us (x, t)
C2 –differenzierbar und für das Integral u(x, t) ergibt sich unter Verwendung der
in § 6 : 3.7 verwendeten Ableitungsregel
t t
∂u ∂us ∂us
(x, t) = us (x, t) s=t + (x, t) ds = (x, t) ds ,
∂t ∂t ∂t
0 0
t
∂2u ∂us ∂ 2 us
(x, t) = (x, t) + (x, t) ds
∂t2 ∂t s=t ∂t2
0
t
= f (x, t) + c2 Δus (x, t) ds
0
t
= f (x, t) + c2 Δ us (x, t) ds
0
2
= f (x, t) + c Δu(x, t)
und
∂u
u(x, 0) = 0, (x, 0) = 0 . 2
∂t
Das Duhamelsche Prinzip liefert zusammen mit den Lösungsdarstellungen in

3.1, 3.3, 3.4 die Lösung des Anfangswertproblems (∗∗).
K±
n+1
(x, t) bezeichnen im Folgenden die in 1 (a) eingeführten Kegel.
Ê Ê
Satz Zu gegebener Funktion f ∈ C2c ( n × ) liefern die folgenden Integrale
für t > 0 die eindeutig bestimmten Lösungen des Anfangswertproblems (∗∗)

1
u(x, t) = f (y, s) dy ds (n = 1) ,
2c
K2
−
(x,t)

1 f (y, s)
u(x, t) = d2 y ds (n = 2) ,
2πc c2 (t − s)2 − y − x 2
K3
−
(x,t)

1 f (y, t − y − x/c) 3
u(x, t) = d y (n = 3) .
4πc2 y − x
Kct (x)
Der Beweis ergibt sich unmittelbar aus dem Duhamelschen Prinzip und den
Lösungsdarstellungen 3.1, 3.3, 3.4 nach Ausführung der Zeittranslationen t →
t−s.
Durch Zeitspiegelung t → t∗ − t ergeben sich aus diesen retardierten Poten-

tialen weitere Lösungen der inhomogenen Wellengleichung, die avancierten
Potentiale einer Anregung f ∈ C2c ( Ê n

× Ê) ÜA :

1
u(x, t) = f (y, s) dy ds (n = 1) ,
2c
K2
+
(x,t)

1 f (y, s)
u(x, t) = d2 y ds (n = 2) ,
2πc c2 (s − t)2 − y − x 2
K3
+
(x,t)

1 f (y, t + y − x/c) 3
u(x, t) = d y (n = 3) .
4πc2 y − x
Kct (x)
4 Das Anfangs–Randwertproblem
4.1 Problemstellung und Lösungsansatz
(a) Für ein beschränktes Gebiet Ω ⊂ Ê n
lautet das allgemeine ARWP
⎧
⎪
⎪ u = f in ΩT = Ω × ]0, T [ ,
⎪
⎨
∂u
(∗) u(x, 0) = u0 (x) , (x, 0) = u1 (x) für x ∈ Ω ,
⎪
⎪ ∂t
⎪
⎩
u = g auf ∂Ω × ]0, T [ ;
dabei sind T > 0 und f , g, u0 , u1 gegeben.
Wir betrachten nur den Fall g = 0. Im Fall g ∈ C0 (ΩT ) ∩ C2 (ΩT ) läßt (∗) auf
diesen unschwer zurückführen.
Für den allgemeinen Fall und für Neumannsche Randbedingungen verweisen
wir auf Dautray–Lions [4, 5] Ch. 18, § 5, Ladyzhenskaya [65] Ch. IV, Wloka
[72] § 29.
Wir gehen ganz analog vor wie beim Wärmeleitungsproblem § 16 : 4 und kombi-
nieren die Bernoullische Methode zur Behandlung der schwingenden Saite § 6 : 3
mit dem Entwicklungssatz in § 15 : 1:

∞
− Aufstellung der formalen Lösung als Reihe u(x, t) = ai (t)vi (x) durch
i=1
Raum– und Zeitseparation nach der Methode von Daniel Bernoulli.
− Konvergenzbeweis für die Reihe durch Aufstellung von Majoranten und
Nachweis, dass u eine schwache Lösung liefert.
− Regularitätsbeweis für die schwache Lösung bei hinreichend glatten Daten.
Auch für die Wellengleichung erweist sich dieses Vorgehen von der physikalischen
Problemstellung her als ganz natürlich.
(b) Lösungsansatz durch Raum– und Zeitseparation.

Wir stützen uns auf den Entwicklungssatz § 15 : 1.2, wobei wir wie dort die
Bezeichnungen H = L2 (Ω), V = W01 (Ω) und

u, v H = uv dn x , u, v V = ∇u , ∇v dn x
Ω Ω
verwenden. Demnach gibt es ein vollständiges ONS v1 , v2 , . . . für H aus Eigen-

vektoren des Dirichletschen Eigenwertproblems
− Δv = λv in Ω , v = 0 auf ∂Ω
zu Eigenwerten 0 < λ1 ≤ λ2 ≤ . . . mit lim λk = ∞ ; ferner gilt vi ∈ V und

k→∞
(a) vi , v V = λi vi , v H für v ∈ V ,
(b) vi , vk H = δik , vi , vk V = λi δik .
Für das ARWP (∗) mit g = 0 machen wir den Lösungsansatz

∞
(c) u(x, t) = ai (t)vi (x)
i=1
und erhalten mit formaler Rechnung
∂2u ∞
2
(x, t) = äi (t)vi (x) ,
∂t i=1

∞
∞
Δu(x, t) = ai (t)Δvi (x) = − λi ai (t)vi (x) .
i=1 i=1
Die Wellengleichung und die Anfangsbedingungen liefern zusammen mit den

Fourierentwicklungen der Daten√u0 , u1 , f unter Verwendung der Abkürzungen
f (t)(x) := f (x, t) und μi := c λi

∞
∂2u
(äi (t) + μ2i ai (t))vi (x) = − c2 Δu (x, t)
i=1 ∂t2

∞
= f (x, t) = vi , f (t) H vi (x) ,
i=1

∞
∞
ai (0)vi (x) = u(x, 0) = u0 (x) = vi , u0 H vi (x) ,
i=1 i=1

∞
∂u ∞
ȧi (0) vi (x) = (x, 0) = u1 (x) = vi , u1 H vi (x) .
i=1 ∂t i=1
Durch Koeffizientenvergleich ergeben sich die Anfangswertprobleme
äi (t) + μ2i ai (t) = vi , f (t) H ,

ai (0) = vi , u0 H , ȧi (0) = vi , u1 H
mit den Lösungen

vi , u1 H
ai (t) = vi , u0 H cos(μi t) + sin(μi t)
μi
(d)
1 t
+ vi , f (s) H sin(μi (t − s)) ds
μi 0
für t ∈ I := [0, T ] , i = 1, 2, . . . ÜA .
Die Konvergenz der Reihe (c) mit den Koeffizienten (d) wird mit der gleichen
Methode gezeigt, die für die Wärmeleitungsgleichung verwendet wurde, siehe
§ 16 : 4.5. Insbesondere benötigen wir zur Beschreibung der Glattheitseigenschaf-
ten von u die Funktionenräume aus § 16 : 4.2.
4.2 Der schwache Lösungsbegriff für das Anfangs–Randwertproblem

(a) Von einer schwachen Lösung u des ARWP (∗) mit Randwerten g = 0 und

f ∈ L2 (ΩT ) verlangen wir, dass die Gleichung u = f schwach erfüllt ist, ferner
dass wie üblich u(t) : x → u(x, t) zu W01 (Ω) gehört, diesmal für alle t ∈ [0, T ].
Hinsichtlich der Zeitabhängigkeit wird die Differenzierbarkeit von u̇(t) in recht
schwacher Form gefordert. Das leistet, wie wir in (b) zeigen, die folgende
Definition. Wir nennen u eine schwache Lösung des ARWP (∗) mit ver-
schwindenden Randwerten g = 0 , wenn die Gleichung u = f im Distributi-
onssinn erfüllt ist und wenn u ∈ C0 ([0, T ], W01 (Ω)) eine schwache Zeitableitung
u̇ ∈ C0 ([0, T ], L2 (Ω)) besitzt.
Aufgrund der Definition § 13 : 1.2 einer schwachen Lösung, wegen ∗ = und

nach den Definitionen § 16 : 4.2 bedeutet dies im Einzelnen: u ∈ L1loc (ΩT ) und

(1) u Φ d n
x dt = f Φ dn x dt
ΩT ΩT
für alle Φ ∈ C∞
c (ΩT ),

(2) u(t) ∈ W01 (Ω) , lim u(s) − u(t) V = 0 für jedes t ∈ I = [0, T ] ,
s→t
T T
(3) u(t) , v H ψ̇(t) dt = − u̇(t) , v H ψ(t) dt
0 0
für alle v ∈ H und alle ψ ∈ C∞

c (]0, T [).
Die Wahl von C0 ([0, T ], W01 (Ω)) × C0 ([0, T ], L2 (Ω)) als Funktionenraum für
die Lösung t → (u(t), u̇(t)) stellt insbesondere die Existenz und Stetigkeit der
Energie sicher.
(b) Wir geben für die distributionelle Wellengleichung (1) äquivalente Formu-
lierungen:
Unter der Voraussetzung u(t) ∈ W01 (Ω) für alle t ∈ I ist (1) äquivalent zu

∂2Φ n
(1.1) u d x dt + c2 ∇u , ∇Φ dn x dt = f Φ dn x dt .
∂t2
ΩT ΩT ΩT
Durch Spezialisierung Φ = ϕ ⊗ ψ, d.h. Φ(x, t) = ϕ(x) ψ(t) mit ϕ ∈ C∞

c (Ω),
ψ ∈ C∞
c (]0, T [) folgt daraus

(1.2) u ϕ ψ̈ dn x dt + c2 ∇u , ∇ϕ ψ dn x dt = f ϕ ψ dn x dt .
ΩT ΩT ΩT
Nach § 16 : 4.3 (b) kommen wir von (1.2) wieder zu (1.1) und zu (1) zurück.
Wegen der Isomorphie von L2 (ΩT ) =∼ L2 (I, H) ist (1.2) äquivalent zu
T T T
(1.3) u(t) , ϕ H ψ̈(t) dt + c2 u(t) , ϕ V ψ(t) dt = f (t) , ϕ H ψ(t) dt.
0 0 0
für alle ϕ ∈ V , ψ ∈ C∞ ∞
c (]0, T [), denn Cc (Ω) liegt bezüglich . V und daher
auch bezüglich . H dicht in V . Aus (3) mit ψ̇ statt ψ und aus (1.3) ergibt
sich
T T T
(1.4) − u̇(t) , ϕ H ψ̇(t) dt + c2 u(t) , ϕ V ψ(t) dt = f (t) , ϕ H ψ(t) dt.
0 0 0
Das bedeutet nach § 14 : 6.4 (c), dass u̇(t) , ϕ H absolutstetig ist mit schwacher
(und fast überall existierender) Ableitung f (t) , ϕ H − c2 u(t) , ϕ V . Wegen
der vorausgesetzten Stetigkeit von u(t) , ϕ V ergibt sich wie in § 16 : 4.3, 4.4
t t
(1.5) u̇(t) , ϕ H − u̇(0) , ϕ H + c2 u(s) , ϕ V ds = f (s) , ϕ H ds
0 0
für alle ϕ ∈ V und alle t ∈ [0, T ]. Aus (3) und § 14 : 6.4 (c) ergibt sich wie in
§ 16 : 4.3 (a), dass u̇(t) , ϕ H die schwache Ableitung der auf [0, T ] absolutste-
tigen Funktion t → u(t) , ϕ H ist.
Erfüllt umgekehrt u ∈ L2 ([0, T ], V ) die Bedingung (1.5), wobei u(t) , ϕ H
jeweils absolutstetig ist, so folgt (1.4) und durch partielle Integration auch (1.3).
4.3 Existenz und Eindeutigkeit schwacher Lösungen

Satz. Zu gegebenen Daten u0 ∈ W01 (Ω), u1 ∈ L2 (Ω), f ∈ L2 (ΩT ), g = 0
besitzt das ARWP (∗) genau eine schwache Lösung u im Sinne von 4.2. Diese
ist durch die Fourierreihe 4.1 (c) mit den Koeffizienten 4.1 (d) gegeben, und für
die Partialsummen uk dieser Reihe gilt
uk → u in C0 ([0, T ], W01 (Ω)) , u̇k → u̇ in C0 ([0, T ], L2 (Ω))
für k → ∞.
Weiter besteht die Energiegleichung
t
EΩ (t) = EΩ (0) + f (s) , u̇(s) H ds f ür t ∈ [0, T ]
0
mit
2
1 ∂u
EΩ (t) := + c2 ∇u2 (x, t) dn x
2 ∂t
Ω
1
= u̇(t)2H + c2 u(t)2V .
2
Der Funktionenraum C0 ([0, T ], W01 (Ω)) × C0 ([0, T ], L2 (Ω)) wird die Energie-
klasse für die Wellengleichung genannt. Auf diesem ist die Stetigkeit der Energie
sowie die stetige Annahme der Anfangswerte gesichert,
lim u(t) − u0 V = 0 , lim u̇(t) − u1 H = 0 .

t→0 t→0
Folgerung. Seien u0 ∈ W01 (Ω), u1 ∈ L2 (Ω) und f : Ω × + → für Ê Ê

jedes T > 0 über ΩT quadratintegrierbar. Dann gibt es eine eindeutig bestimmte
Ê Ê
globale Lösung u : Ω × + → , d.h. u liefert für jedes T > 0 eine Lösung des
ARWP (∗) mit verschwindenden Randwerten g = 0.
Beweis.
(1) Eindeutigkeit der Lösung.
Für die Differenz u zweier Lösungen bestehen wegen u(t) ∈ V , u̇(t) ∈ H für
jedes t ∈ I = [0, T ] nach § 15 : 1.2, 1.3 die Fourierentwicklungen

∞
∞
u(t) = Ai (t) vi in V , u̇(t) = Bi (t) vi in H ,
i=1 i=1
wobei wegen vi , vk V = λi vi , vk H für vi , vk ∈ H die Ai , Bi gegeben sind

durch
1
Ai (t) = u(t) , vi V = u(t) , vi H , Bi (t) =, u̇(t) , vi H .
λi
Nach den Überlegungen 4.2 sind die Ai , Bi absolutstetig, und aus 4.2 (b) folgt
mit f = 0, μi := c2 λi
t
Bi (t) − Bi (0) = − μi Ai (s) ds (i = 1, 2, . . .) .
0
Da die Ai (absolut)stetig sind, folgt Bi ∈ C1 (I) und
Ḃi (t) + μi Ai (t) = 0 für t ∈ I, i ∈ .

Da nach den Ausführungen 4.2 die Ai unbestimmte Integrale ihrer schwachen
Ableitungen Bi sind, erfüllen sie im klassischen Sinn die Schwingungsgleichung
Äi + μi Ai = 0
mit Ai (0) = u(0) , vi H = 0 und Ȧi (0) = Bi (0) = u̇(0) , vi H = 0, was nur
für Ai = 0 möglich ist (i = 1, 2, . . . ). Aus der Reihendarstellung von u folgt
u = 0.
(2) Abschätzung der Koeffizienten ai (t).

Nach 4.1 (d) gilt
t
ai (t) = αi cos(μi t) + βi sin(μi t) + γi (s) sin(μi (t − s)) ds
0
mit den Abkürzungen

1 1
αi = vi , u0 H , βi = vi , u1 H , γi (t) = vi , f (t) H .
μi μi
Nach den Entwicklungssätzen § 15 : 1.2, 1.3 konvergieren für u0 ∈ V , u1 ∈ H
und f ∈ L2 (ΩT ) ∼
= L2 (I, H) die Reihen

∞
∞
u0 2V = λi vi , u0 2
H = λi α2i ,
i=1 i=1

∞
∞
1 ∞
u1 2H = vi , u1 2
H = μ2i βi2 = 2
λi βi2 ,
i=1 i=1 c i=1

∞
∞
f (t)2H = vi , f (t) 2
H = μ2i γi (t)2 ,
i=1 i=1
T T
∞
f (t)2L2 (I,H) = f (t)2H dt = μ2i γi (t)2 dt
0 0 i=1
1 ∞ T
= 2 λi γi (t)2 dt .
c i=1 0
Mit der Ungleichung (a+b+c)2 ≤ 3a2 +3b2 +3c2 und der Cauchy–Schwarzschen
Ungleichung ergibt sich hieraus
ai (t)2 ≤ 3 (αi cos(μi t))2 + 3 (βi sin(μi t))2
T 2
+ 3 γi (s) sin(μi (t − s)) ds
0
T T
≤ 3 α2i + 3 βi2 + 3 γi (s)2 ds sin2 (μi (t − r)) dr
0 0

T
≤ 3 α2i + 3 βi2 + 3 T γi (s)2 ds ,
0
also

∞
∞
∞
∞ T
λi ai (t)2 ≤ 3 λi α2i + 3 λi βi2 + 3 T λi γi (s)2 ds
(a) i=1 i=1 i=1 i=1 0
3 2
= c u0 2V + u1 2H + T f 2L2 (I,H) .
c2
Ganz entsprechend erhalten wir ÜA

∞
(b) ȧi (t)2 ≤ 3 c2 u0 2V + u1 2H + T f 2L2 (I,H) für alle t ∈ I .
i=1

(3) Die Reihe ai vi konvergiert in C0 (I, V ).

k
Die Partialsummen uk := ai vi bilden eine Cauchy–Folge in C0 (I, V ), denn
i=1
wegen der gleichmäßigen Konvergenz der Reihe in (2) (a) gibt es zu ε > 0 ein
nε , so dass für > k > nε
2
u (t) − uk (t)2V = ai (t) vi V = λi ai (t)2 < ε2
i=k+1 i=k+1
für alle t ∈ I , also

u − uk C0 (I,V ) = sup u (t) − vk (t)V t ∈ I ≤ ε.
Die Folge uk hat somit im Banachraum C0 (I, V ) (§ 16 : 4.2 (b)) einen Grenzwert

∞
u= ai vi .
i=1

(4) Konvergenz der Reihe ȧi vi in C0 (I, H).
Ganz analog folgt aus der gleichmäßigen Konvergenz der Reihe in (2) (b) die
Konvergenz der Folge u̇k im Banachraum C0 (I, H) mit einem Grenzwert v.
(5) v = ∂u/∂t gilt im schwachen Sinn.

Für j ≤ k und ψ ∈ C∞
c (]0, T [) gilt
T
uk (t) , vj H ψ̇(t) + u̇k (t) , vj H ψ(t) dt
0
T T
= aj (t) ψ̇(t) + ȧj (t) ψ(t) dt = (aj ψ)· (t) dt = 0 .
0 0
Aus der gleichmäßigen Konvergenz uk → u in C0 (I, V ) folgt mit der Poincaré–

Ungleichung u(t) − uk (t)V ≤ c(Ω) u(t) − uk (t)H (§ 14 : 6.2) auch uk → u
in C0 (I, H). Zusammen mit u̇k → v in C0 (I, H) folgt für Φ = vj ⊗ ψ
T
u ∂Φ
∂t
+ v Φ dn x dt = u(t) , vj H ψ̇(t) + u(t) , vj H ψ(t) dt = 0 .
ΩT 0
Nach § 16 : 4.2, Satz 4 ergibt sich hieraus v = ∂u/∂t im schwachen Sinn.

(6) u = ai vi ist schwache Lösung des ARWP.

k
Mit fk (t) := vi , f (t) H vi gilt für j ≤ k
i=1
ük (t) , vj H + c2 uk (t) , vj V = äj (t) + μ2j aj (t) = vj , fj (t) H

(∗∗)
= fk (t) , vj H
und durch Integration

t t
u̇k (t) , vj H − u̇k (0) , vj H + c2 uk (s) , vj V ds = fk (s) , vj H ds .
0 0
Grenzübergang k → ∞ liefert (wieder unter Verwendung der Poincaré–Unglei-

chung wie in (5))
t t
u̇(t) , vj H − u̇(0) , vj H + c2 u(s) , vj V ds = f (s) , vj H ds
0 0
für j = 1, 2, . . . und t ∈ I. Nach Gleichung(1.5) in 4.1 (b) ist u daher eine

schwache Lösung des ARWP. Weiter gilt nach den Konvergenzbedingungen in
(2) und den Entwicklungssätzen § 15 : 1.2,1.3

∞
∞
u(0) = ai (0) vi = vi , u0 H vi = u0 in V,
i=1 i=1

∞
∞
u̇(0) = ȧi (0) vi = vi , u1 H vi = u1 in H.
i=1 i=1
(7) Energiegleichung. Aus (∗∗) folgt durch Multiplikation mit ȧj (t) und Sum-
mation über j von 1 bis k
fk (s) , u̇k (s) H = ük (s) , u̇k (s) H + c2 uk (s) , u̇k (s) V
1 d
= u̇k (s)2H + c2 uk (s)2V .
2 dt
Integration von 0 bis t und Grenzübergang k → ∞ liefert die Energiegleichung
t
1
u̇(s)2H + c2 u(s)2V 0 = EΩ (t) − EΩ (0)
t
f (s) , u̇(s) H ds = 2
0
für t ∈ I. 2
4.4 Regularität der schwachen Lösung

Der Einfachheit halber beschränken wir uns auf den Fall der homogenen Wel-
lengleichung mit verschwindenden Randwerten (f = 0, g = 0). Die inhomogene
Wellengleichung kann mit Hilfe des Duhamelschen Prinzips behandelt werden,
siehe Wloka [72] § 30.
Ê
Regularitätssatz. Es sei Ω ⊂ n ein beschränktes, C2r –berandetes Gebiet
( 1 ≤ r ≤ ∞ ), und für die Anfangswerte u0 , u1 gelte
u0 ∈ C2r (Ω) , u0 = Δu0 = . . . = Δr u0 = 0 auf ∂Ω ,
u1 ∈ C 2r−1
(Ω) , u1 = Δu1 = . . . = Δ r−1
u1 = 0 auf ∂Ω .
Dann gilt für die schwache Lösung u des ARWP (∗) und die zugehörigen Par-

k
tialsummen uk = ai vi im Fall r > s + 12 (n + 1)
i=1
u ∈ Cs (Ω × Ê +) ,
uk → u in Cs (Ω × [0, T ]) für k → ∞ und jedes T > 0 .
Insbesondere ist u für s ≥ 2 eine klassische Lösung des ARWP.
Bemerkung. Dass für die Anfangswerte u0 , u1 bestimmte Krümmungsbedin-

gungen auf dem Rand ∂Ω für die Existenz einer klassischen Lösung u notwendig
sind, zeigt das Beispiel der schwingenden Saite in § 6 : 3. Schon d’Alembert hatte
erkannt, dass seine Lösungsformel nur dann eine klassische Lösung liefert, wenn
u0 (x) = u0 (x) = 0 in den Randpunkten x = 0 und x = L
gilt. Der Regularitätssatz verlangt im Fall n = 1, s = 2 die Bedingung r > 3,
während wir aus § 6 : 3.4 wissen, dass für die Existenz einer klassischen Lösung
die Voraussetzungen u0 ∈ C2 [0, L], u1 ∈ C1 [0, L], u0 = u0 = u1 = 0 auf ∂Ω
ausreichen. Die Voraussetzungen des Regularitätssatzes sind also nicht optimal.
Beweis.
Wir setzen der Übersichtlichkeit halber c = 1 und schreiben wie in 4.2
ai (t) = αi cos(μi t) + βi sin(μi t) ,
αi = vi , u0 H , βi = μ−1
i vi , u1 H , μi = λi .
(j)
Für die j–te Ableitung ai (t) der Koeffizienten gilt
(j)

ai (t)2 ≤ 2 μ2j
i α2i + βi2 ≤ 2 λji α2i + βi2 ,
und aus den über u0 und u1 gemachten Voraussetzungen ergibt sich nach dem
Äquivalenzsatz § 15 : 1.4 (d)

∞
∞
u0 2Ar = λ2r
i vi , u0 2
H = λ2r 2
i αi ,
i=1 i=1
∞ ∞
u1 2Ar−1/2 = λ2r−1
i vi , u1 2H = λ2r 2
i βi .
i=1 i=1
Für j = 0, 1, . . . , r und T > 0 erhalten wir damit

∞ T (j)
∞ T
λri ai (t)2 dt ≤ λri 2 λji α2i + βi2 dt
i=1 0 i=1 0

∞
≤ 2T λ2r
i α2i + βi2

i=1
= 2T u0 2Ar + u1 2Ar−1/2 .
Wie im Beweisteil (3) von § 16 : 4.5 ergibt sich, dass die Partialsummen dj uk /dtj
für k → ∞ im Hilbertraum L2 ([0, T ], D(Ar/2 )) gegen ein Element wj konver-
gieren. Dies ist nach dem Äquivalenzsatz § 15 : 1.4 (d) dann auch in Wr (Ω)) der
Fall. Weiter gilt wj = dj u/dtj im schwachen Sinn ÜA , woraus wir erhalten
uk → u in Wr (]0, T [ , Wr (Ω)) für k → ∞.
Nach § 16 : 4.2 (c) und dem Morreyschen Einbettungssatz § 14 : 6.4 (d) bestehen
für r > s + 12 (n + 1) die stetigen Einbettungen
Wr (]0, T [ , Wr (Ω)) → Wr (Ω × ]0, T [) → Cs (Ω × [0, T ]).
Hieraus folgt
uk → u in Cs (Ω × [0, T ]) für k → ∞
und alle T > 0. 2
Kapitel VI Mathematische Grundlagen der
Quantenmechanik
§ 18 Mathematische Probleme der Quantenmechanik

1 Ausgangspunkt, Zielsetzung, Wegweiser
Dieses Kapitel besteht aus zwei Teilen: Einer Einführung in die Integrations–
und Wahrscheinlichkeitstheorie und einer Einführung in die Theorie linearer
Operatoren im Hilbertraum. Jeder Teil ist von eigenem Interesse; gleichwohl
gibt es sowohl historisch als auch im Hinblick auf die Zielsetzung dieses Kapitels
Verbindungen, auf die wir kurz eingehen.
Beide Theorien wurden in ihren Grundzügen im ersten Drittel des 20. Jahrhun-
derts entwickelt. Den Anfang markieren die Einführung des Lebesgue–Integrals
1902 und die Arbeiten von Hilbert und Schmidt über Gleichungen mit unend-
lich vielen Variablen 1904–1909; am Ende stehen die Grundbegriffe der Wahr-
”
scheinlichkeitstheorie“ (Kolmogorow 1933) und die Mathematischen Grund-
”
lagen der Quantenmechanik“ (1932) von Neumanns.
Die Quantenmechanik wurde 1925/26 durch zwei scheinbar verschiedene An-
sätze auf den Weg gebracht, die diskrete Matrizenmechanik von Heisenberg,
Born, Jordan und die Wellenmechanik von Schrödinger. Deren Vereinheit-
lichung gelang nach verschiedenen Versuchen schließlich Dirac (1930) und von
Neumann (1932). Letzterer stützte sich auf die Isomorphie des Hilbertschen Fol-
genraumes 2 als Konfigurationsraum der Matrizenmechanik und von L2 ( n) Ê
als Konfigurationsraum der Wellenmechanik. Von Neumann zeigte, dass sich
durch den von ihm maßgeblich mitentwickelten Hilbertraum-Formalismus und
dessen Interpretation wesentliche Aspekte der Quantenmechanik erfassen lassen.
Die auf dieser Basis von ihm und seinen Zeitgenossen erarbeiteten Sichtweisen
fassen wir mit Primas [139] unter dem Stichwort Pionier–Quantenmechanik
zusammen.
Die Theorie linearer Operatoren im Hilbertraum bildet nicht nur die mathema-
tische Grundlage der Pionier–Quantenmechanik; sie ist auch als Basis für die
heute übliche operatoralgebraische Betrachtungsweise unerlässlich. Inzwischen
ist sie weit über ihre ursprüngliche Zweckbestimmung hinaus zu einem wichtigen
Hilfsmittel der Analysis geworden, insbesondere der Theorie von Differential–
und Integralgleichungen. Sie gestattet, eine Reihe von Einzelproblemen unter
einheitlichen strukturellen Gesichtspunkten zu behandeln und liefert übergrei-
fende Standardschlussweisen.
Im klassischen Hilbertraumformalismus werden quantenmechanische Observa-
ble und Zustände durch Operatoren bzw. Vektoren eines Hilbertraums beschrie-
ben. Eine wichtige Rolle spielt das Spektrum als möglicher Wertebereich einer

464 § 18 Mathematische Probleme der Quantenmechanik
Observablen. Welcher Spektralwert bei einer Einzelmessung anfällt, hängt i.A.

vom Zufall ab; Gesetze müssen sich daher auf Wahrscheinlichkeiten, Verteilun-
gen von Beobachtungswerten sowie deren Erwartungswert und Varianz bezie-
hen. Eine wichtige Aufgabe dieses Kapitels besteht darin, die Verbindung zwi-
schen Operatorenkalkül und Wahrscheinlichkeitstheorie herzustellen, beispiels-
weise E = ϕ , Aϕ als einen Erwartungswert und Aϕ − Eϕ2 als zugehörige
Varianz zu identifizieren. Hierzu ist es notwendig, Erwartungswert und Varianz
einer beliebigen Verteilung als Integrale darzustellen. Dies leistet die Integra-
tionstheorie in § 20, die gleich so weit gefasst ist, dass auch das Lebesgue–Integral
mit einbezogen werden kann, welches für die Konstruktion quantenmechanischer
Systemhilberträume unerlässlich ist. Die Wahrscheinlichkeitstheorie wird hier
nur so weit verfolgt, wie es für die Quantenmechanik nötig ist.
Der mathematische Formalismus der Pionier–Quantenmechanik hat sich in der
Praxis bewährt oder, frei nach Feynman, the mystery works“. Grundsätzliche
”
Fragen zur Interpretation und Systematik sind aber offen geblieben. So ist bei-
spielsweise die Diskussion über eine Theorie des Messprozesses und über Quan-
tisierung noch in vollem Gang. Im Wesentlichen ist noch heute gültig, was Max
Born, einer der Pioniere der Quantenmechanik, 1955 in seiner Nobelpreisrede
rückblickend sagte: Was aber dieser Formalismus bedeutete, war keineswegs
”
klar. Die Mathematik war, wie es öfters vorkommt, klüger als das sinngebende
Denken.“ Unter diesen Umständen müssen wir uns bei physikalischen Interpre-
tationen weitgehend auf das beschränken, was die Mathematik hergibt und auf
wenige, allgemein akzeptierte Grundanschauungen.
Wer mehr über Entwicklung und Stand der Grundlagendiskussion und über
neuere Ansätze beyond pioneer quantum mechanics“ erfahren möchte, sei auf
”
die vorzüglichen Darstellungen von Jauch [136] und Primas [139] verwiesen.
Wegweiser. In diesem Paragraphen wird anhand idealisierter Modellsituatio-

nen der Quantenmechanik ein Fragenkatalog erstellt, der die mathematischen
Themen dieses Kapitels motivieren soll, ohne dabei auf mathematische Feinhei-
ten einzugehen. Vorausgesetzt werden hierzu nur elementare Kenntnisse über
Hilberträume (§ 8 : 2.1 und § 9) und die eindimensionale Fouriertransformation
auf dem Raum S der schnellfallenden Funktionen (§ 12 : 2 und 3).
Die beiden folgenden Paragraphen über Wahrscheinlichkeit, Maß und Integral
erfordern keine besonderen Vorkenntnisse. Den an der Quantenmechanik inter-
essierten Lesern wird ein Schnelldurchgang empfohlen: Gründliches Studium der
Abschnitte 1–4 und 9 von § 19; für den Rest genügt es vorab, die Grundbegriffe
und Sätze zur Kenntnis zu nehmen, ohne auf Beweise einzugehen. (Wir haben
die meisten Beweise ausgeführt, um den Lesern das Zusammensuchen in der
Literatur zu ersparen.)
Die Theorie der linearen Operatoren im Hilbertraum stützt sich wesentlich auf
§ 9, § 19 und § 20. Nähere Angaben zu den Vorkenntnissen finden Sie wie immer
2 Beugung und Interferenz von Elektronen 465
am Beginn eines Paragraphen. Um einen Quereinstieg in dieses Schlusskapi-

tel zu ermöglichen, werden als Beispiele für Differentialoperatoren vorwiegend
gewöhnliche diskutiert und nur am Rand auf den Bezug zu partiellen hingewie-
sen. Am Ende dieses Kapitels fassen wir zusammen, welche Konsequenzen sich
aus der bis dahin entwickelten mathematischen Theorie für die physikalische
Interpretation ergeben. Wir gehen dann abschließend kurz auf die Grenzen des
von uns angenommenen naiven Standpunkts ein.
2 Beugung und Interferenz von Elektronen

(a) Eine Elektronenkanone schieße in größeren zeitlichen Abständen einzelne
Elektronen mit gleichem Impuls p senkrecht auf eine mit einem kleinen Loch
versehene Platte ab.
Auf einer hinter dieser Lochblende an-
gebrachten Fotoplatte hinterlässt dann
jedes einzelne Elektron einen kleinen
schwarzen Fleck. Die Einschlagsorte
sind zunächst scheinbar regellos ver-
teilt; nach langer Dauer des Experi-
ments stellen sich jedoch Ringe wech-
selnd starker Schwärzung ein, die an
das Beugungsbild einer senkrecht auf
die Lochplatte auftreffenden ebenen
Welle erinnern.
Tatsächlich handelt es sich nicht bloß um eine Ähnlichkeit: Ist r der Abstand ei-
nes Punktes auf der Fotoplatte von der Symmetrieachse, S(r) der sich schließlich
einstellende Schwärzungsgrad beim Elektronenexperiment und I(r) die Inten-
sität der Schwärzung im Beugungsbild einer ebenen Welle, so gilt
S(r) I(r)
= .
S(0) I(0)
Die einzelnen Elektronen treten also beim Einschlag in die Fotoplatte als Kor-
puskeln in Erscheinung, bringen aber in ihrer Gesamtheit dasselbe Phänomen
wie eine ebene Welle hervor. Der Zusammenhang zwischen deren Wellenzahl k,
Frequenz ν, Kreisfrequenz ω = 2πν sowie dem Impuls p und der Energie E
des Elektrons ist nach de Broglie und Einstein gegeben durch
p = h̄k , E = hν = h̄ω ,
wobei h = 6.622 · 10−27 g · cm2 · s−1 das Plancksche Wirkungsquantum ist.
(b) Über den Einschlagsort eines einzelnen Elektrons sind prinzipiell keine Vor-
aussagen möglich. Anders verhält es sich mit dem Beugungsbild als Ergebnis
sehr vieler Einschläge. Wir beschreiben es durch eine Schwärzungsdichte auf
der Fotoplatte derart, dass

p(Ω) = (x, y) dx dy
Ω
der auf den Bereich Ω der Fotoplatte entfallende Schwärzungsanteil ist. Für den
Kreisring
Ω = {(x, y) | r12 < x2 + y 2 < r22 }
ist demnach mit den Bezeichnungen von (a)
r2 > ∞
p(Ω) = r I(r) dr r I(r) dr ,
r1 0
wobei sich I(r) nach den Gesetzen der Optik ergibt. Im Teilchenbild gibt p(Ω)
die Wahrscheinlichkeit dafür an, einen Einschlag im Bereich Ω zu finden. Eine
solche Wahrscheinlichkeitsaussage lässt sich statistisch überprüfen: Schlagen von
n abgeschossenen Elektronen n(Ω) im Bereich Ω ein, so wird sich die relative
Häufigkeit n(Ω)/n für wachsendes n auf p(Ω) einspielen (Gesetz der großen Zahl,
Präzisierung in § 19 : 3.4).
Dies setzt voraus, dass sich der Versuch unter identischen Bedingungen im Prin-
zip beliebig oft wiederholen lässt. Wir sprechen dann von einer Gesamtheit gleich
präparierter oder im gleichen Zustand befindlicher Elektronen.
Der Zustand der Gesamtheit hängt von der Bauart der Kanone, der Vorspan-
nung und Geometrie des Spalts ab. Wir beschreiben diesen Zustand durch eine
Ê
Wellenfunktion ψ : 2 → mit |ψ|2 = . Die Komplexwertigkeit von ψ gestat-
tet es, Beugung und Interferenz nach dem Vorbild der Optik zu beschreiben.
(c) Schießen wir mit der Elektronenkanone auf einen Doppelspalt, so erhal-
ten wir das Interferenzmuster einer senkrecht auf den Doppelspalt auftreffen-
den ebenen Welle. Dies scheint im Teilchenbild paradox: Nehmen wir an, dass
ein Elektron mit gleicher Wahrscheinlichkeit entweder durch Spalt 1 oder durch
Spalt 2 geflogen ist und sind ψ1 , 1 = |ψ1 |2 Wellenfunktionen und Schwärzungs-
dichte bei geschlossenem zweiten Spalt und ψ2 , 2 = |ψ2 |2 die entsprechenden
Größen bei geschlossenem ersten Spalt, so würden wir eigentlich bei Öffnung
beider Spalte erwarten, dass die Schwärzungsdichte 12 ( 1 + 2 ) ist. Tatsächlich
ist diese aber
>
| ψ1 + ψ2 |2 | ψ1 + ψ2 |2 .
Ê 2
Die Erklärung liegt darin, dass die Frage, welcher der beiden Spalte von ei-
nem Elektron durchflogen wurde, unzulässig ist. Zu ihrer experimentellen Über-
prüfung – etwa durch Beleuchten“ des Elektrons mittels eines Photons – würden
”
wir den Zustand und damit das Beugungsbild ändern.
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials 467
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials

3.1 Die Schrödinger–Gleichung
(a) Wir betrachten der Einfachheit halber ein spinloses Teilchen der Masse m
im Raum unter dem Einfluß eines Potentials V . Den Zustand einer Gesamtheit
solcher Teilchen zum Zeitpunkt t beschreiben wir durch eine Wellenfunktion
ψt : Ê 3
→ , x → ψ(x, t) .
Wie oben deuten wir

p(Ω) := | ψt |2 = | ψ(x, t) |2 d3 x
Ω Ω
im Teilchenbild als die Wahrscheinlichkeit, das Teilchen im Gebiet Ω anzutref-

fen. Demnach ist zu verlangen, dass

| ψt |2 = p(3) = 1 für alle t ∈ .
Ê 3
Unter geeigneten Voraussetzungen über das Potential V und den Anfangszu-

stand ψ0 gilt die zeitabhängige Schrödinger–Gleichung
∂ h̄2
i h̄ ψ(x, t) = − Δψ(x, t) + V (x) · ψ(x, t)
∂t 2m
(Schrödinger: Quantisierung als Eigenwertproblem II, 1926).
√
Für ϕt (x) = ϕ(x, t) := α3 ψ(αx, h̄t) mit α := h̄/ m gilt ebenfalls | ϕt |2 = 1,
Ê3
und die Schrödinger–Gleichung geht über in
∂ 1
(∗) i ϕ(x, t) = − Δϕ(x, t) + v(x) · ϕ(x, t)
∂t 2
mit v(x) = V (αx) ÜA . Wir dürfen daher im folgenden die Zahlenwerte von h̄
und m gleich Eins setzen.
Definieren wir den Hamilton–Operator H eines Teilchens im umskalierten Po-
tential v durch
1
Hu = − Δu + v · u ,
2
so erhält Gleichung (∗) die Gestalt
(∗∗) ϕ̇t = − iH ϕt .
Dies ist auch die Form der Schrödinger–Gleichung für allgemeine Hamilton–
Operatoren.
(b) Wir diskutieren die Schrödinger–Gleichung (∗∗) für den einfachsten Fall
eines Freiheitsgrades der Lage und setzen über das Potential v voraus, dass
für schnellfallende Funktionen u : → Ê
auch v u und damit auch Hu :=
− 12 u + v u zum Schwartzraum S der schnellfallenden Funktionen gehört (vgl.
§ 12 : 3). Mit dem Skalarprodukt

+∞
u1 , u2 = u1 (x) u2 (x) dx
−∞
erhalten wir dann durch zweimalige partielle Integration die Symmetrie von H:
1

+∞
+∞
u1 , Hu2 = − 2 u1 u2 + v u1 u2 = Hu1 , u2 .
−∞ −∞
Die Quantenmechanik postuliert, dass die Zeitentwicklung t → ϕt der Wellen-

funktionen (Zustände) eines sich selbst überlassenen Systems determininis-
tisch ist: Für jeden Anfangszustand ϕ0 ∈ S ( ϕ0 = 1 ) soll die Gleichung
(∗∗) eine eindeutig bestimmte, für alle Zeiten definierte Lösung ϕ besitzen.
Wir geben dieser Forderung eine andere Gestalt; dabei lassen wir mathematische
Feinheiten außer Acht und erhalten unter der Annahme ϕt ∈ S für t ∈
d d
ϕt 2 = ϕt , ϕt = ϕ̇t , ϕt + ϕt , ϕ̇t
dt dt
= −iHϕt , ϕt + ϕt , −iHϕt
= i ( Hϕt , ϕt − ϕt , Hϕt ) = 0
wegen der Symmetrie von H. Daher ist ϕt = 1 für alle t ∈ , und
U (t) : S → S , ϕ0 → ϕt
ist eine Isometrie. Für ψt := ϕs+t = U (s + t)ϕ0 gilt dann

d
ψ̇t = ϕs+t = −iH ϕs+t = − iH ψt und ψ0 = ϕs .
dt
Aus der vorausgesetzten Eindeutigkeit der Lösung von (∗∗) folgt
U (s + t)ϕ0 = ψt = U (t)ϕs = U (t) U (s)ϕ0 für alle ϕ0 ∈ S ,
also gilt
U (s + t) = U (s) U (t) für s, t ∈ und U (0) = .
Es folgt
U (−t) U (t) = U (−t) U (t) = U (0) = .
Damit bildet die Schar U (t) : S → S eine Einparametergruppe unitärer
Operatoren.
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials 469
Energieoperatoren H wie H = − 12 Δ + v, für welche die Zeitentwicklung

der Zustände wie oben beschrieben deterministisch ist, heißen Hamilton–
Operatoren. Ein wesentliches Ziel dieses Kapitels ist die Charakterisierung sol-
cher Operatoren und allgemeiner der Operatoren, die eine Einparametergruppe
unitärer Operatoren erzeugen. Die entscheidende Bedingung ist die Selbstadjun-
giertheit, wohl zu unterscheiden von der Symmetrie.
3.2 Stationäre Lösungen und Eigenwertproblem

(a) Der Separationsansatz für die Schrödinger–Gleichung. Wir bleiben
beim eindimensionalen Modell 3.1 (b) und suchen für die Schrödinger–Gleichung
ϕ̇t = −iH ϕt
Lösungen in Produktgestalt
ϕ(x, t) = w(t) v(x) mit w = 0 , v = 1 .
Solche Lösungen müssen für alle x, t ∈ Ê die Bedingung

(∗) ẇ(t) v(x) = − i w(t) (Hv)(x)
erfüllen. Bis auf Nullstellen des Nenners gilt also

ẇ(t) (Hv)(x)
i = .
w(t) v(x)
Daher müssen beide Seiten konstant sein:
Hv = λv, ẇ(t) = −i λw(t)
mit einer Konstanten λ.

Somit sind sämtliche Produktlösungen bis auf multiplikative Konstanten von
der Form
ϕ(x, t) = e−iλt v(x) ,
Eigenvektor
wobei λ ein Eigenwert von H und v ein zugehöriger mit v = 1
ist. Wegen der Symmetrie von H ist λ reell, also e−iλt = 1. Wir sprechen von
einem stationären Zustand (Bindungszustand), wenn die Zeitabhängigkeit nur
in einem Vorfaktor vom Betrag 1 steckt, Näheres dazu in 4.2.
(b) Physikalische Deutung: Stationäre Zustände sind die einzigen, bei denen
die Energiemessung an einzelnen Objekten jedesmal und unabhängig vom Zeit-
punkt der Messung denselben Wert (hier λ) ergibt.
Der Beweis dieser Aussage ergibt sich aus der Wahrscheinlichkeitsinterpretation
des Spektralsatzes, einem Hauptteil dieses Kapitels.
3.3 Das Energiespektrum

(a) Der Idealfall: Hamilton–Operatoren mit nichtentartetem diskre-
tem Spektrum.
Für eine Reihe von Potentialen v gibt es eine Folge (λk ) von einfachen Eigen-
werten des Operators H : u → − 12 u + v u mit
λ 0 < λ1 < λ2 < . . . , lim λk = ∞ ,
k→∞
so dass die zugehörigen Eigenvektoren v0 , v1 , v2 , . . . mit Norm 1 ein vollständiges

Orthonormalsystem bilden. Das Paradebeispiel ist der harmonische Oszillator
mit v(x) = 12 x2 . Gehen wir von einer Funktion

∞
ϕ = vk , ϕ vk
k=0
mit ϕ = 1 aus, für die H ϕ Sinn macht, so ist die Lösung des Schrödingerschen
Anfangswertproblems
ϕ̇t = − i H ϕt , ϕ0 = ϕ
gegeben durch

∞
ϕt = vk , ϕ e−iλk t vk .
k=0
Eine solche Lösungsdarstellung ist typisch für allgemeine Hamilton–Operatoren

mit nichtentartetem diskretem Energiespektrum. In diesen Fällen ist ϕt also
Superposition stationärer Lösungen. Bei einer Einzelmessung, etwa an einem
Teilchen, kann nur einer der Werte λ0 , λ1 , . . . anfallen, und die Wahrscheinlich-
keit, dass der Wert λk gemessen wird, ist | vk , ϕ |2 . Der Erwartungswert Eϕ
der Energie, d.h. der sich bei langen Versuchsreihen einstellende mittlere Wert
der Energie für eine Gesamtheit mit Wellenfunktion ϕ zur Zeit t = 0, ist nach
den Regeln der Wahrscheinlichkeitsrechnung

∞
Eϕ = λk | vk , ϕ |2 .
k=0
(b) Kontinuierliches Spektrum. Der Hamilton–Operator H : u → − 12 u

eines (kräfte–)freien Teilchens mit einem Freiheitsgrad besitzt keine Eigenwerte:
Aus Hv = λv , d.h. 12 v + λv = 0 mit v = 0 folgt in jedem der Fälle λ > 0,

+∞
λ = 0, λ < 0, dass v nicht normierbar“ ist, d.h. dass |v|2 nicht konvergiert.
” −∞
Hier sind die möglichen Energiewerte kontinuierlich verteilt.
(c) Es wird sich später zeigen, dass das Energiespektrum σ(H) eines Hamilton–
Operators H, d.h. die Menge der möglichen Energiewerte, auch sein Spektrum
im mathematischen Sinne ist; das sind grob gesagt alle Werte λ, für die H − λ½
4 Das mathematische Modell der Pionier–Quantenmechanik 471
nicht invertierbar ist. Im Fall (a) besteht das Spektrum nur aus den Eigenwerten
λ0 , λ1 , . . . , d.h. aus den Zahlen λ, für die H − λ½ nicht injektiv ist. Für den
Fall (b) zeigen wir später σ(H) = + .
(d) Die Grobstruktur des Wasserstoffspektrums. Wir betrachten ein
Elektron mit Masse m und Ladung e unter dem Einfluß eines Coulombpotenti-
als
1 e2 h̄2
V (x) = − · mit Hamilton–Operator H : u → − Δu + V u ,
4πε0 x 2m
(dessen Definitionsbereich noch geeignet festzulegen ist). Hier ergibt sich ein
gemischtes Spektrum, und zwar ein Eigenwertspektrum
0 < λ0 < λ1 < . . . mit lim λk = η < ∞
k→∞
und ein kontinuierliches Spektrum [η, ∞[ jenseits der Ionisierungsenergie η.

Die Feinstruktur des Wasserstoffspektrums ergibt sich durch Auffassung des
Wasserstoffatoms als Zweiteilchensystem und Einbeziehung des Drehimpulses
sowie des Spins. Für Einzelheiten siehe Cohen–Tannoudji [157] Vol. 2, Ch. XII.
4 Das mathematische Modell der Pionier–Quantenmechanik

4.1 Systemhilberträume
Jedem quantenmechanischen System wird ein Systemhilbertraum H über
zugeordnet; dieser enthält die Zustandsvektoren.
Wir geben einige Beispiele.
(a) Bei einem Teilchen mit einem Freiheitsgrad der Lage ist dies der Raum

H = L2 ( ) aller (messbaren) Funktionen f : → , für die |f |2 integrierbar
ist, versehen mit dem Skalarprodukt

+∞
f,g = f (x) g(x) dx .
−∞
Die Integrale sind dabei im Lebesgueschen Sinn zu verstehen, Näheres in § 20.
(b) Entsprechend wählen wir L2 ( 3) als Systemhilbertraum zur Beschreibung
eines im Raum frei beweglichen, spinlosen Teilchens unter dem Einfluß eines
Potentials.
(c) Für ein im Raumgebiet Ω ⊂ 3 eingesperrtes, spinloses Teilchen dient
L2 (Ω) als Systemhilbertraum. Für Modellrechnungen wird häufig der eindimen-
sionale Fall Ω = ]a, b[ betrachtet.
(d) Ein Teilchen im Raum mit Spin ± 21 wird beschrieben durch zwei Wellen-
funktionen ϕ+ (für Spin 12 ) und ϕ− (für Spin − 12 ). Als Systemhilbertraum dient
hier das kartesische Produkt

H = (ϕ+ , ϕ− ) ϕ+ , ϕ− ∈ L2 ( 3
)

(ϕ+ , ϕ− ) , (ψ+ , ψ− ) := ϕ+ , ψ+ + ϕ− , ψ− ,

wobei u , v = u v d3 x . Dieser Hilbertraum wird auch mit L2 ( Ê )⊗
3 2
Ê3
bezeichnet. Lassen sich Spinphänomene abkoppeln, so genügt zu ihrer Beschrei-
bung der Hilbertraum 2 .
(e) Als Systemhilbertraum für ein System von m spinlosen Teilchen dient
L2 (3m ).
(f) Auf kompliziertere Situationen wie Vielteilchensysteme und die zugehörigen
Systemhilberträume gehen wir hier nicht ein.
4.2 Zustände
(a) Der Zustand eines klassisch–mechanischen Systems wird beschrieben durch
einen Punkt im Phasenraum. Das Verhalten des Systems in Zukunft und Vergan-
genheit ist durch den Zustand zu einem Zeitpunkt determiniert. Der Zustands-
begriff der Quantenmechanik soll ähnliches leisten. Dieser kann sich daher nicht
auf eine Einzelmessung am System beziehen, sondern auf das statistische Ver-
halten einer Gesamtheit gleich präparierter Systeme derselben Art, idealisiert
durch zugrundeliegende Wahrscheinlichkeiten.
In 3.1 hatten wir den Zustand eines Einteilchensystems
zur Zeit t durch eine
Wellenfunktion ϕ = ψt beschrieben und |ϕ(x)|2 d3 x als Wahrscheinlichkeit
Ω
gedeutet, das Teilchen in Ω anzutreffen. Entsprechend repräsentieren wir fürs
erste den Zustand eines beliebigen Systems zu einem festen Zeitpunkt durch
einen Vektor ϕ des Systemhilbertraumes mit ϕ = 1 (Zustandsvektor), wo-
bei jeder Vektor c · ϕ mit |c| = 1 für denselben Zustand steht. Wollen wir dem
Zustand selbst eindeutig ein mathematisches Objekt zuordnen, so können wir
hierfür den von einem Zustandsvektor ϕ aufgespannten eindimensionalen Teil-
raum ( Strahl“) S = Span {ϕ} wählen.
”
(b) Die so beschriebenen Zustände heißen Vektorzustände oder im Rahmen
der Pionier–Quantenmechanik reine Zustände. Später werden wir auch gemisch-
te Zustände (inkohärente Überlagerungen) in Betracht ziehen. In dieser Hinsicht
ist es zweckmäßig, einen Vektorzustand nicht durch einen Strahl S = Span {ϕ}
darzustellen, sondern durch den orthogonalen Projektor auf S,
Pϕ : ψ −→ ϕ , ψ ϕ .
Es ist leicht nachzurechnen, dass Pcϕ = Pϕ für |c| = 1 ÜA . Wird ein Zustand
also durch den Vektor e−iλt ϕ mit λ ∈ beschrieben, so ist er zeitunabhängig,
vgl. 3.2 (a).
(c) Der Projektor Pϕ : ψ → ϕ , ψ ϕ wird auch mit
Pϕ = | ϕ ϕ|,
bezeichnet, dies in Anlehnung an die von Dirac 1930 vorgeschlagene Bracket–

Schreibweise, die wir darüber hinaus im Interesse einer übersichtlichen Notation
selten übernehmen, vgl. die Anmerkung in § 9 : 2.8.
4.3 Observable
(a) Quantisierung. Klassischen Beobachtungsgrößen (Observablen) wie Orts-
koordinaten qx , qy , qz , Impulskoordinaten px , py , pz , kinetischer Energie
1
2m
(p2x +p2y +p2z ) , Hamiltonfunktion (Gesamtenergie), Drehimpuls usw. werden
im Hilbertraumformalismus der Quantenmechanik lineare Operatoren auf dem
Systemhilbertraum H zugeordnet:
Klassische Observable a ←→ linearer Operator A .
Die Quantisierungsvorschrift a ←→ A sollte bestimmten Verträglichkeitsbedin-

gungen genügen, z.B. a2 ←→ A2 , falls a ←→ A, mit Einschränkungen auch
a + b ←→ A + B , falls a ←→ A und b ←→ B.
(b) Beispiele. Für ein Teilchen mit einem Freiheitsgrad lautet die Vorschrift
Ort q ←→ Ortsoperator Q, gegeben durch ϕ → x · ϕ ,
Impuls p ←→ Impulsoperator P = h̄ d
i dx
,
Potential v ←→ Multiplikationsoperator V : ϕ → v · ϕ .
Nach dem unter (a) Gesagten müssen wir der kinetischen Energie 1
2m
p2 den
Operator 1
2m
P 2 und der Gesamtenergie h = 1
2m
p2 + v(q) den Energie–
Operator (bzw. Hamilton–Operator) H = 1
2m
P 2 + V zuordnen, also
h̄2
kinetische Energie ←→ 1
2m
P2 : ϕ → − 2m
ϕ ,
2
Gesamtenergie h ←→ H : ϕ → − 2m
h̄
ϕ + v · ϕ .
Analog für ein Teilchen im Raum:
Ortskoordinate qk ←→ Ortsoperator Qk : ϕ → xk · ϕ , (k = 1, 2, 3),

Impulskoordinate pk ←→ Impulsoperator Pk = h̄ ∂
i xk
, (k = 1, 2, 3),
2
Gesamtenergie h ←→ Hamilton–Operator H : ϕ → − 2m
h̄
Δϕ + v · ϕ .
Für alle genannten Operatoren A müssen geeignete Definitionsbereiche D(A)

festgelegt werden. Für Orts– und Impulsoperatoren kann das der Schwartzraum
S sein, für den Operator ϕ → v · ϕ die Menge {ϕ ∈ L2 | v · ϕ ∈ L2 }; dabei
Ê Ê
steht L2 für L2 ( ) bzw. für L2 ( 3). Wesentlich ist, dass die Definitionsbereiche
in den jeweiligen Systemhilberträumen dicht liegen.
(c) Den hier angegebenen Quantisierungsvorschriften lagen ursprünglich kei-
ne systematischen Begründungen, sondern intuitive Einsichten der Pioniere zu-
grunde. Eine ad–hoc–Rechtfertigung geben wir beispielhaft in 4.5*. Das Quanti-
sierungsproblem ist noch weitgehend offen. Eine Reihe von Quantisierungsregeln
lässt sich im Zusammenhang mit dem Satz von Stone (§ 25) verstehen.
(d) Eine besondere Rolle spielen orthogonale Projektoren, das sind lineare Ope-
ratoren
P : H → H mit P 2 = P und ϕ, P ψ = P ϕ, ψ für ϕ, ψ ∈ H .
Diese entsprechen dem Ausgang eines Ja/Nein–Experiments. Ist z.B. Ω ein
Ê
Gebiet des 3, so ist P : ϕ → χΩ ·ϕ mit der Frage Teilchen in Ω ?“ verbunden.
”
Da bei vorgegebener Messgenauigkeit und einer darauf abgestimmten Skala das
Messergebnis für eine Observable durch eine Folge von Ja/Nein–Fragen ermittelt
werden kann, liegt die Vorstellung nahe, dass sich jede Observable aus ortho-
gonalen Projektoren aufbauen lässt. Das ist in der Tat richtig; die Präzisierung
und den Beweis dieses Sachverhalts liefert der Spektralsatz (§ 25).
Eine wichtige Rolle spielen orthogonale Projektoren auch für neuere Ansätze
zur Grundlegung der Quantenmechanik auf der Basis des Propositionenkalküls
(auch Quantenlogik genannt), zu finden in Jauch [136] und Primas [139].
4.4 Erwartungswerte von Observablen

(a) Für eine feste Observable a gehört zu jedem Zustandsvektor ϕ ein Wahr-
Ê
scheinlichkeitsmaß μϕ auf . Dieses gibt für ein beliebiges Intervall I die Wahr-
scheinlichkeit μϕ (I) an, dass die beobachteten Werte von a für ein System im
Zustand | ϕ ϕ | ins Intervall I fallen. Wir konstruieren es im Zusammenhang
mit dem Spektralsatz.
Für ein Teilchen mit einem Freiheitsgrad im Zustand | ϕ ϕ | ist z.B.

μϕ (I) = |ϕ|2
I
die Wahrscheinlichkeit, dass der Ort des Teilchens im Intervall I ist, vgl. 3.1. Hat
der Hamilton–Operator H dieses Einteilchensystems ein diskretes Spektrum, so
ist mit den Bezeichnungen 3.3 (a)

νϕ (I) = | vk , ϕ |2
λk ∈I
die Wahrscheinlichkeit, dass die Energie Werte aus I annimmt.

(b) Im nächsten Paragraphen definieren wir den Erwartungswert μ / eines Wahr-

Ê
scheinlichkeitmaßes μ auf . Dabei ergibt sich für die Beispiele (a)

+∞
+∞
/ϕ =
μ x | ϕ(x) |2 dx = ϕ(x) x ϕ(x) dx = ϕ , Qϕ ,
−∞ −∞

∞
ν/ϕ = λk | vk , ϕ |2 = ϕ , Hϕ .
k=0
Dass die Reihe den Wert ϕ , Hϕ ergibt, wollen wir hier nicht nachrechnen.
Ebensowenig gehen wir auf die Frage nach der Konvergenz des Integrals bzw.
der Reihe ein. Wichtiger ist folgendes: Genügt die Zeitentwicklung eines Zustan-
des der Schrödinger–Gleichung ϕ̇t = −iHϕt , so sind die Erwartungswerte ν/ϕt
zeitunabhängig, denn mit den Bezeichnungen 3.3 (a) ist

vk , ϕt = e−iλk t vk , ϕ0 = vk , ϕ0 .
(c) Allgemein gilt: Entspricht der Observablen a der Operator A und liefert
μϕ die Verteilung der Beobachtungswerte von a im Zustand | ϕ ϕ | , so ist für
ϕ ∈ D(A)
/ϕ = ϕ , Aϕ .
μ
Dies wird sich aus dem Spektralsatz ergeben.
(d) Zur Deutung von μ /ϕ . Machen wir N Beobachtungen der Observablen a
an einem System im Zustand | ϕ ϕ |, so erhalten wir zufällig schwankende
Beobachtungswerte a1 , . . . , aN , obwohl die Versuchsbedingungen (die durch ϕ
beschriebene Präparation) immer gleich sind. Für wachsende Versuchszahlen N
spielt sich der mittlere Wert N1 (a1 + . . . + aN ) immer besser auf μ /ϕ ein. Ge-
setzmäßigkeiten können sich daher nur auf μ /ϕ beziehen, und ihre experimentelle
Überprüfung erfordert die statistische Analyse von Versuchsreihen. Dafür spielt
die in § 19 : 3.1, § 20 : 6.3 definierte Streuung eine wesentliche Rolle.
Es lässt sich zeigen, dass ein Operator A durch die Erwartungswerte ϕ , Aϕ für
alle ϕ ∈ D(A) eindeutig bestimmt ist. Dies gibt uns im folgenden die Möglich-
keit, zwei einfache Quantisierungsvorschriften plausibel zu machen.
4.5* Zum Orts– und Impulsoperator für einen Freiheitsgrad

(a) Für ein Teilchen mit einem Freiheitsgrad ist der Erwartungswert des Orts
im Zustand | ϕ ϕ | mit ϕ ∈ S nach 4.4 (b) gegeben durch ϕ , Qϕ wobei
(Qϕ)(x) = x ϕ(x). Nach dem soeben Gesagten schließen wir darauf, dass Q der
Ortsoperator ist.
(b) Für eine ebene harmonische Welle, die im Raum in Richtung der x–Achse
fortschreitet, ist die x–Komponente der Wellenerregung
ψ(x, t) = A · ei(kx−ωt) ,
dabei ist ω die Kreisfrequenz und k die Wellenzahl.

Ein durch ψ(x, t) = e−iωt ϕ(x) beschriebener stationärer Zustand setzt sich inte-
grativ aus harmonischen ebenen Wellen zusammen, denn nach dem Umkehrsatz
für die Fouriertransformation gilt
1 +∞
ψ(x, t) = √ /(k) ei(kx−ωt) dk .
ϕ
2π −∞
Dabei leisten alle Wellenzahlen einen Beitrag. Aus der Parsevalschen Gleichung
folgt

+∞
+∞
+∞
1 = | ψ(x, t) |2 dx = | ϕ(x) |2 dx = / |2 dk .
| ϕ(k)
−∞ −∞ −∞
Wir deuten daher |ϕ/| als Wellenzahldichte: Der Anteil der ins Intervall [a, b]
2
fallenden Wellenzahlen ist

b
/ |2 dk ,
| ϕ(k)
a
interpretiert als Wahrscheinlichkeit, dass eine Wellenzahl im Intervall [a, b] liegt.

Legen wir weiter mit de Broglie die Beziehung p = k h̄ zugrunde, so ist die
Wahrscheinlichkeit, dass der Impuls ins Intervall [p1 , p2 ] fällt und damit die
Wellenzahl in das Intervall [p1 /h̄, p2 /h̄] = [k1 , k2 ], nach der Substitutionsregel
k2 1 p2
μϕ ([p1 , p2 ]) = / |2 dk =
| ϕ(k) / h̄y ) |2 dy .
| ϕ(
k1
h̄ p1
/ ( h̄y ) |2 als Impulsdichte. Für den Erwartungswert

Wir deuten daher (y) := h̄1 | ϕ
/ϕ des Impulses im Zustand | ϕ ϕ | erhalten wir gemäß der schon in 4.4 (b)
μ
verwendeten Formel und mit Hilfe der Substitution y = h̄ x
+∞
+∞
/ϕ =
μ y (y) dy = / |2 dx = h̄ ϕ/ , Qϕ
x | ϕ(x) / .
−∞ −∞
/ = −i ϕ/ , und wegen der Isometrie der Fouriertransfor-

Nach § 12 : 2.2 gilt Q ϕ
mation ergibt sich schließlich
h̄
μ / , −iϕ/
/ϕ = h̄ ϕ = h̄ ϕ , −iϕ = ϕ, P ϕ ϕ. mit P ϕ :=
i
Nach der letzten Bemerkung in 4.4 schließen wir, dass P der Impulsoperator
ist.
Dies war eine Plausibilitätsbetrachtung mit vielen ad-hoc–Annahmen. Eine
überzeugendere Begründung für die Wahl von P geben wir in § 25.
477
§ 19 Maß und Wahrscheinlichkeit
1 Diskrete Verteilungen
1.1 Bernoulli–Experimente
Wir betrachten Ja/Nein–Experimente, bei denen nur die Frage interessiert, ob
ein bestimmter Effekt eintritt oder nicht. Beispiele hierfür sind der Münzwurf
(Frage: Zahl“?), Geburtenstatistik (Frage: Knabe“?) oder bei Observablen der
” ”
Physik die Fragestellung Wert im Intervall I“? Wir denken uns das Experiment
”
unter gleichen Bedingungen beliebig oft wiederholbar, wobei das Ergebnis einer
Einzelmessung nicht vorhersehbar ist. Der interessierende Effekt trete bei N –
maliger Wiederholung kN –mal auf. Dann lehrt die Erfahrung, dass sich die
kN
relative Häufigkeit hN :=
N
für wachsendes N auf eine Zahl p ∈ [0, 1] einpendelt (Gesetz der großen Zahl).
Wir unterstellen im folgenden die Existenz einer solchen Erfolgswahrscheinlich-
keit p; dabei stehen p = 1 bzw. p = 0 für die Extremfälle, dass der Effekt mit
Sicherheit eintritt bzw. nicht eintritt.
Wie urteilen wir über p? Beim Münzwurf unterstellen wir, solange nichts Näher-
es bekannt ist, aus Symmetriegründen p = 12 (ideale Münze). Entsprechend
schätzen wir die Wahrscheinlichkeit für Sechs“ beim Würfelspiel auf p = 16
”
und die Komplementärwahrscheinlichkeit für nicht Sechs“ auf 1 − p = 56 ein.
”
Karl Pearson, ein Pionier der Wahrscheinlichkeitstheorie, erzielte zu Beginn
des 20. Jahrhunderts bei 24000 Münzwürfen 12012–mal die Zahl“, was die
”
Einschätzung p = 12 gut bestätigte. Hätte er 12480–mal Zahl“ erzielt, würde
1 ”
er die Annahme p = 2 verworfen haben, da eine relative Häufigkeit von 0.52
oder mehr unter dieser Annahme und bei so vielen Versuchen extrem unwahr-
scheinlich wäre, wie unwahrscheinlich, werden wir noch ausrechnen.
Pearson hätte wohl aufgrund der Statistik die Erfolgswahrscheinlichkeit als
12480
24000
= 0.52 geschätzt. Dies entspricht der empirischen relativen Häufigkeit
von Knabengeburten. Für das Folgende halten wir fest:
Wahrscheinlichkeitsaussagen und empirische Befunde sollen über das (in 3.4
präzisierte) Gesetz der großen Zahl aufeinander bezogen sein. Daher ist die
Wahrscheinlichkeitsrechnung so zu konzipieren, dass sie konsistent mit der Häu-
figkeitsrechnung ist.
Für sich gegenseitig ausschließende Ereignisse bedeutet dies insbesondere, dass
sich ihre Wahrscheinlichkeiten addieren, da dies auch für die entsprechenden
relativen Häufigkeiten der Fall ist.
478 § 19 Maß und Wahrscheinlichkeit
1.2 Der Produktsatz

Wir führen nach einem Bernoulli–Experiment mit Erfolgswahrscheinlichkeit p1
ein Zweites durch, dessen Erfolgswahrscheinlichkeit (unabhängig vom Ausgang
des ersten) p2 sei. Das Ergebnis protokollieren wir wie folgt:
(1, 1) : beidesmal Erfolg,
(1, 0) : beim ersten Mal Erfolg, beim zweiten Mal Mißerfolg,
(0, 1) : beim ersten Mal Mißerfolg, beim zweiten Mal Erfolg,
(0, 0) : beidesmal Mißerfolg.
Dann ist für die Wahrscheinlichkeiten dieser vier Versuchsausgänge des Gesamt-
experiments der Reihe nach p1 · p2 , p1 · (1 − p2 ), (1 − p1 ) · p2 , (1 − p1 ) · (1 − p2 )
anzusetzen. Wir machen uns dies für das Versuchsergebnis (1, 0) klar, wobei wir
0 < p1 , p2 < 1 annehmen. Bei einer sehr großen Zahl N von Wiederholungen des
Doppelexperiments sei M –mal im ersten Teilexperiment ein Erfolg eingetreten.
Es ist dann auch M 1, also nach dem Gesetz der großen Zahl M ≈ N · p1 .
Innerhalb dieser M Versuche sei L–mal beim zweiten Teilexperiment ein Miß-
erfolg zu verzeichnen. Nach dem Gesetz der großen Zahl ist L ≈ M (1 − p2 )
und
L M (1 − p2 )
≈ ≈ p1 · (1 − p2 )
N N
die relative Häufigkeit von (1, 0). Die anderen Fälle sind analog zu analysieren.
Die oben vorausgesetzte Unabhängigkeit des zweiten Versuchsausgang vom Er-
gebnis des ersten ist eine Modellannahme, die im konkreten Anwendungsfall zu
rechtfertigen ist!
1.3 Die Binomialverteilung

Ein Bernoulli–Experiment werde n–mal hintereinander mit jeweils gleicher Er-
folgswahrscheinlichkeit p ausgeführt. Das Gesamtergebnis protokollieren wir
durch ein n–Tupel aus Nullen und Einsen (1 steht für Erfolg). Durch mehr-
fache Anwendung des Produktsatzes 1.2 erhält jedes n–Tupel mit k Einsen und
n − k Nullen die Wahrscheinlichkeit pk · (1 − p)n−k . Die Anzahl Xn der Einsen
in einem n–Tupel hängt vom Zufall ab. Für die Wahrscheinlichkeit P (Xn = k)
dafür, dass genau k Einsen auftreten gilt
n
P (Xn = k) = pk (1 − p)n−k .
k

Denn es gibt nk Realisierungsmöglichkeiten des Ergebnisses Xn = k (Induk-
tion, ÜA ), und jede Realisierungsmöglichkeit hat dieselbe Wahrscheinlichkeit
pk · (1 − p)n−k . Da sich diese Möglichkeiten ausschließen, addieren sich ihre
Wahrscheinlichkeiten nach 1.1.
1 Diskrete Verteilungen 479
Allgemein heißt eine Zufallsgröße X mit möglichen Werten in
Ωn := {0, 1, . . . , n}
binomialverteilt (genauer: b(n, p)–verteilt mit 0 ≤ p ≤ 1), wenn

n k
P (X = k) = p (1 − p)n−k für k = 0, . . . , n .
k
Die Wahrscheinlichkeit P (X ∈ A) dafür, dass die Werte von X in eine beliebige
Teilmenge A von Ê
fallen, definieren wir durch
n
P (X ∈ A) := P (X = k) = pk (1 − p)n−k .
k
k∈A k∈A
Diese Formel ist so zu verstehen, dass P (X ∈ A) = 0, falls A ∩ Ωn = ∅. Da die

Werte von X mit Sicherheit in die Menge Ωn fallen, muss P (X ∈ Ωn ) = 1 sein.
In der Tat gilt
n
n
P (X ∈ Ωn ) = pk (1 − p)n−k
k
k=0
= (p + (1 − p))n = 1n = 1
nach dem binomischen Lehrsatz.
1.4 Radioaktiver Zerfall und Poisson–Verteilung

(a) Rutherford, Chadwick und Ellis beschrieben 1920 ein Experiment,
bei dem in einem Zeitraum von 326 Minuten in einem Zählrohr N = 10094
Anschläge aufgetreten waren. Sie teilten den Zeitraum in 2608 Intervalle zu
7.5 Sekunden und bestimmten die Zahl z(k) der Intervalle mit k Anschlägen
z(k)
(k = 0, 1, 2, . . .). Für die relativen Häufigkeiten h(k) = 2608 ergab sich in guter
Näherung
λk −λ
h(k) ≈ e mit λ = 3.87 .
k!
k
(b) Die Idee, einen Ansatz h(k) = λk! e−λ mit λ > 0 zu machen und λ an die
Beobachtungsdaten anzupassen, stammt von Poisson (1832). Poisson zeigte für
die Binomialverteilung 1.3: Bleibt n · p konstant gleich λ > 0, so gilt
n λk −λ
lim pk (1 − p)n−k = e
n→∞ k k!
(Beweis als ÜA ).
Daher kann der Poissonsche Ansatz zur Beschreibung seltener Ereignisse dienen
(n groß, p = nλ klein).
1.5 Diskrete Verteilungen

(a) Eine Zufallsgröße X heißt diskret verteilt, wenn die Menge ΩX der mög-
lichen Werte für X eine höchstens abzählbare Teilmenge von ist und wenn Ê
jedem x ∈ ΩX eine positive Zahl P (X = x) zugeordnet ist mit

P (X = x) = 1 .
x∈ΩX
Dabei bedeutet P (X = x) die Wahrscheinlichkeit dafür, dass X den Wert x

annimmt.
Diese Definition schließt zwei Fälle ein:
Den endlichen Fall

n
ΩX = {x0 , . . . , xn } , P (X = x) := P (X = xk ) = 1 ,
x∈ΩX k=0
vgl. 1.3, und den Fall, dass ΩX aus unendlich vielen verschiedenen Zahlen
x0 , x1 , . . . besteht. Im letzteren Fall ist

∞
P (X = x) := P (X = xk ) = 1 .
x∈ΩX k=0
Die Art der Durchnumerierung von ΩX (für ΩX = bietet sich nicht nur eine
Möglichkeit an) spielt keine Rolle; dies folgt aus dem Umordnungssatz Bd. 1,
§ 7 : 6.3. Ein Beispiel bieten Poisson–verteilte Zufallsgrößen, d.h. Zufallsgrößen
X mit ΩX = 0 = {0, 1, 2, . . .},
λk −λ
∞
λk
P (X = k) = e , e−λ = 1 ,
k! k!
k=0
vgl. 1.4.
Für die gemeinsame mathematische Behandlung beider Fälle nehmen wir ΩX
als unendlich an, ΩX = {x0 , x1 , x2 , . . .}, und lassen ggf. zu, dass
pk := P (X = xk )
den Wert Null hat.
(b) Für beliebige Mengen A ⊂ definieren wir

∞
P (X ∈ A) := P (X = xk ) = pk χA (xk ) ,
xk ∈A k=0
wobei P (X ∈ ∅) := 0 gesetzt wird. Dabei ist zu beachten, dass der mittlere

Term eine endliche Summe oder eine unendliche Reihe sein kann. Es ist klar,
dass P (X ∈ A) als Wahrscheinlichkeit zu deuten ist, dass die X–Werte in die
Menge A fallen. Nach Voraussetzung ist dann P (X ⊂ ) = 1.
1 Diskrete Verteilungen 481
(c) Für μ(A) := P (X ⊂ A) mit A ⊂ Ê gilt also

(i) μ(A) ≥ 0 für alle A ⊂ Ê,
(ii) μ({x}) > 0 für höchstens abzählbar viele x,

(iii) μ(A) = μ({x}),
x∈A
Ê
(iv) μ( ) = 1.
Ê
Allgemein heißt eine Mengenfunktion mit den Eigenschaften (i)–(iv) diskrete
Verteilung oder diskretes Wahrscheinlichkeitsmaß auf . Die Menge
supp μ := {x ∈ Ê
| μ({x}) > 0} heißt Träger von μ. Wir sagen auch: μ lebt
auf supp μ.
1.6 Beispiele
(a) Relative Häufigkeiten.
Sei X eine Zufallsgröße mit ΩX = {x0 , x1 , . . . }. Bei N Beobachtungen von X

∞
sei zk –mal der Messwert xk angefallen (k = 0, 1, 2, . . .). Dann ist zk = N ,
k=0
wobei in der Reihe nur endlich viele Glieder von Null verschieden sind. Die
relative Häufigkeit der in eine Menge A fallenden Beobachtungswerte,
1
hN (A) = zk ,
N
xk ∈A
liefert eine diskrete Verteilung hN auf Ê mit endlichem Träger.

(b) Das Dirac–Maß δa beschreibt eine scharfe Messung, d.h. einen Versuch,
bei dem mit Sicherheit immer der Messwert a ∈ Ê
anfällt. Für die zugehörige
Beobachtungsgröße X gilt also
(
1 für a ∈ A,
δa (A) = P (X ∈ A) =
0 sonst.
1.7 Eigenschaften diskreter Verteilungen

(a) Für eine diskrete Verteilung μ gilt
(W1 ) μ(A) ≥ 0 für alle A ⊂ Ê,

Ê
(W2 ) μ( ) = 1 ,
7
∞
∞
(W3 ) μ( Ak ) = μ(Ak ) , falls Ai ∩ Aj = ∅ für i = j (σ–Additivität).
k=1 k=1
Beweis.
(W1 ), (W2 ) folgen unmittelbar aus der Definition 1.5 (c).
Zum Nachweis von (W3 ) wählen wir, um die Fallunterscheidung zwischen end-
lichem/nicht endlichem Träger zu vermeiden, eine abählbar unendliche Menge
Ω = {x0 , x1 , . . .} mit supp μ ⊂ Ω. Ferner setzen wir pk := μ({xk }) (k =
7
∞
0, 1, . . .) und A := Ak .
k=1
Dann gilt nach Definition

∞
μ(Ak ) = pi = pi χAk (xi ) .
xi ∈Ak i=0
Wegen Ai ∩ Aj = ∅ für i = j enthält die Reihe

∞
χA (xi ) = χAk (xi )
k=1
höchstens ein von Null verschiedenes Glied. Wir erhalten

∞
∞
∞ ∞
∞
μ(A) = pi χA (xi ) = pi χAk (xi ) = pi χAk (xi ) .
i=0 i=0 k=1 i=0 k=1
Da alle auftretenden Glieder nicht negativ sind, folgt aus dem großen Umord-
nungssatz Bd. 1, § 7 : 6.6
∞
∞
∞
μ(A) = pi χAk (xi ) = μ(Ak ) . 2
k=1 i=0 k=1
(b) Folgerungen aus (W1 ), (W2 ), (W3 ).

(i) μ( Ê \ A) = 1 − μ(A) .
7
N
N
(ii) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak
k=1 k=1
(endliche Additivität).
(iii) μ(A) = μ(A ∩ B) + μ(A \ B).
(iv) A ⊂ B =⇒ μ(A) ≤ μ(B) .
(v) μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B) für beliebige Mengen A, B ⊂ Ê.
Beweis.
Im Hinblick auf spätere Verallgemeinerungen stützen wir uns nur auf (W1 ),
7
∞
∞
(W2 ), (W3 ). Aus (W3 ) folgt zunächst μ(∅) = μ( ∅) = μ(∅), also μ(∅) = 0.
k=1 k=1
Für (ii) setzen wir AN+1 = AN+2 = · · · := ∅ und erhalten aus (W3 )
7
N 7
∞
∞
N
μ( Ak ) = μ( Ak ) = μ(Ak ) = μ(Ak ) .
k=1 k=1 k=1 k=1
2 Erwartungswert und Streuung einer diskreten Verteilung 483
Ê
(i) folgt nun aus (ii) wegen μ( ) = 1 und Ê = A ∪ (Ê \ A), A ∩ (Ê \ A) = ∅.
(iii), (iv) und (v) als ÜA (Venn–Diagramm). 2
2 Erwartungswert und Streuung einer diskreten Verteilung

2.1 Erwartungswerte
(a) Für eine Zufallsgröße X mit möglichen Werten x0 , x1 , . . . , xn definieren wir
den Erwartungswert E(X) = X / durch

n
/ :=
E(X) = X xk P (X = xk ) .
k=0
Sind unendlich viele verschiedene Werte x0 , x1 , . . . möglich, so setzen wir

∞
/ :=
E(X) = X xk P (X = xk ) ,
k=0
falls diese Reihe absolut konvergiert. Diese Bedingung sichert die Unabhängig-
keit von der Nummerierung der möglichen Beobachtungswerte (Umordnungs-
satz Bd. 1, § 7 : 6.3). Der Erwartungswert muss nicht existieren, wie das Beispiel
1
P (X = k) = (k+1)(k+2) (k = 0, 1, 2, . . .) zeigt.
Den Erwartungswert μ / einer diskreten Verteilung μ mit Träger in der
abzählbaren Menge {x0 , x1 , . . .} definieren wir ganz entsprechend:

∞
∞
/ :=
μ xk μ({xk }), falls |xk | μ({xk }) < ∞ .
k=0 k=0
(b) Wir interpretieren X / als den bei häufigen Beobachtungen zu erwartenden

Durchschnittswert und verstehen dies wie folgt: Für die Zufallsgröße X, von
der wir einfachheitshalber ΩX = {x0 , . . . , xn } annehmen, seien bei N Beobach-
tungen z0 –mal der Wert x0 , . . . , zn –mal der Wert xn angefallen (zk ∈ 0 ).
Nach dem Gesetz der großen Zahl erwarten wir, dass die relativen Häufigkeiten
hk = zk /N der Beobachtungswerte xk annähernd gleich ihren Wahrscheinlich-
keiten pk = P (X = xk ) sind. Für den empirischen Mittelwert, d.h. das arith-
metische Mittel x aller beobachteten Werte gilt dann
1 n n n
/.
x = zk x k = hk xk ≈ xk pk = X
N k=0 k=0 k=0
2.2 Beispiele
(a) Für die in 1.3 definierte Binomialverteilung μ = b(n, p) erhalten wir

n n
n
n!
/ =
μ k pk (1 − p)n−k = k pk (1 − p)n−k =
k k! (n − k)!
k=0 k=1
n n−1
n−1 n−1
= n pk (1 − p)n−k = n p pm (1 − p)n−1−m
k−1 m
k=1 m=0
= n p (p + 1 − p) n−1
= np ,
was zu erwarten war.

Insbesondere ergibt sich für ein Bernoulli–Experiment mit Erfolgswahrschein-
lichkeit p (also ΩX = {0, 1}, P (X = 0) = 1 − p, P (X = 1) = p) der Erwar-
tungswert p.

(b) Für die durch μ(A) = e−λ λk / k! mit λ > 0 gegebene Poisson–Ver-
k∈ 0∩A
/ = λ (vgl. 1.4)
teilung erhalten wir μ ÜA .
(c) Das Banachsche Schlüsselproblem. Sie stehen im Dunkeln vor der Haustür
und wollen aus Ihrem Schlüsselbund mit n Schlüsseln den richtigen durch Pro-
bieren finden. Im Fall n = 2 genügt ein Versuch. Mit wie vielen Versuchen
müssen Sie im Mittel rechnen, wenn Sie
(i) jeden nichtpassenden Schlüssel zurückhalten und mit den restlichen weiter-
probieren,
(ii) dazu nicht mehr in der Lage sind?
2.3 Der Erwartungswert einer transformierten Zufallsgröße

(a) Sei X eine Zufallsgröße mit möglichem Wertebereich ΩX = {x0 , x1 , . . .}
und f eine auf einem ΩX umfassenden Intervall I definierte reellwertige Funkti-
on. Ordnen wir jedem beobachteten Wert x für X den Wert f (x) zu, so erhalten
wir eine Zufallsgröße Y , die wir als transformierte Zufallsgröße f (X) bezeich-
nen. Solche Messtransformationen sind insbesondere für die Quantenmechanik
von Interesse, wo mikroskopische Observable meist indirekt beobachtet werden.
Der Zufallsgröße Y ist in natürlicher Weise eine diskrete Verteilung zugeordnet:
Mit ΩX ist auch die Menge ΩY = f (ΩX ) der möglichen Werte von Y höchstens
abzählbar. Da die Aussagen y = f (x) und x ∈ f −1 ({y}) äquivalent sind, ist
P (Y = y) = P (X ∈ f −1 ({y})) .
Beachten Sie dabei, dass f nicht injektiv sein muss. Daher kann auch im Fall,
dass ΩX = {x0 , x1 , . . .} abzählbar ist, ΩY = {y0 , y1 , . . .} endlich sein. Für
Bm := f −1 ({ym }) gilt
7
(1) Bm = ΩX und Bm ∩ Bn = ∅ für m = n .
m
Aufgrund der σ–Additivität (W3 ) bzw. aufgrund der endlichen Additivität

1.7 (b) folgt
2 Erwartungswert und Streuung einer diskreten Verteilung 485

P (Y = ym ) = P (X ∈ Bm )
m m
7
= P (X ∈ Bm ) = P (X ∈ ΩX ) = 1 .
m
(b) Satz. Für den Erwartungswert von f (X) gilt

E(f (X)) = f (xk ) P (X = xk ) ,
xk ∈ΩX
falls eine der beiden Seiten Sinn macht, d.h. falls E(f (X)) existiert oder falls
die rechte Seite eine endliche Summe oder eine absolut konvergente Reihe ist.
Existiert insbesondere E(X), so folgt die Existenz von
E(αX + β) = αE(X) + β .
Beweis.
Nach der Konvention 1.5 (a) dürfen wir ΩX als abzählbar annehmen, wobei wir
zulassen, dass pk := P (X = xk ) Null ist. Wegen (1) gilt

(2) χBm (xk ) = 1 für k = 0, 1, . . . ,
m
wobei in der linken Reihe/Summe jeweils nur ein Glied von Null verschieden ist.

∞
Ferner hat die folgende Reihe die Majorante pk , konvergiert also absolut:
k=0
∞
∞
(3) P (Y = ym ) = P (X ∈ Bm ) = P (X = xk ) χBm (xk ) = pk χBm (xk ) .
k=0 k=0
Für xk ∈ Bm ist f (xk ) = ym . Existiert also

E(Y ) = ym P (Y = ym ) ,
m
so gilt nach (3)

∞
E(Y ) = ym pk χBm (xk )
m k=0
∞
= pk f (xk ) χBm (xk ) ,
m k=0
wobei nach (3) die erste innere Reihe und damit die ihr gleiche zweite innere
Reihe absolut konvergieren. Mit (2) folgt
∞

E(Y ) = pk f (xk ) χBm (xk )
k=0 m
∞
∞
= f (xk ) pk χBm (xk ) = f (xk ) pk
k=0 m k=0
entweder nach den Rechengesetzen für Reihen, falls ΩY endlich ist, oder nach
dem großen Umordnungssatz Bd. 1, § 7 : 6.6 sonst.

∞
Konvergiert die Reihe |f (xk )| pk , so lassen sich alle Schritte rückwärts ver-
k=0
folgen, und es ergibt sich die Existenz von E(Y ).

Existiert umgekehrt E(X), so gilt wegen pk = 1
k

E(αX + β) = (αxk + β)pk = α xk pk + β pk = αE(X) + β . 2
k k k
3 Varianz und Streuung einer diskreten Verteilung

(a) Die Varianz V (X) einer Zufallsgröße X mit ΩX = {x0 , x1 , . . .} ist def-
iniert als ihre mittlere quadratische Abweichung vom Erwartungswert X:/
Wir setzen

/ 2) =
V (X) := E((X − X) / 2 P (X = xk ) ,
(xk − X)
k
/ = E(X) existiert und die rechte Seite Sinn macht, vgl. 2.3 (b).
falls X
In diesem Fall heißt
σ(X) := V (X)
die Streuung oder Standardabweichung von X.
Entsprechend sind Varianz V (μ) und Streuung σ(μ) einer diskreten Verteilung
μ definiert.
(b) Satz. Genau dann existieren E(X) und V (X), wenn

E(X 2 ) = x2k P (X = xk )
k
konvergiert. Es gilt dann
V (X) = E(X 2 ) − E(X)2
Beweis als ÜA ; beachten Sie |xk | ≤ 1

2
(x2k + 1).
(c) Beispiele. (i) Binomialverteilung. Für b(n, p)–verteilte Zufallsgrößen X gilt

√
V (X) := n p q , σ(X) := n p q mit q := 1 − p .
Denn nach 2.2 (a) ist E(X) = n p, und aus 2.3 (b) folgt
V (X) = E(X 2 ) − E(X)2 = E(X (X − 1)) + E(X) − E(X)2

= E(X (X − 1)) + n p − n2 p2 ,
3 Varianz und Streuung einer diskreten Verteilung 487
wobei (mit der Abkürzung q := 1 − p)

n n
n
n!
E(X(X − 1)) = k (k − 1) pk q n−k = pk q n−k
k (k − 2)!(n − k)!
k=0 k=2
n
n−2
= n(n − 1) p2 pk−2 q n−2−(k−2)
k−2
k=2
n − 2
n−2
= n(n − 1) p 2
pm q n−2−m
m
m=0
= n(n − 1) p (p + q)n−2 = n(n − 1) p2 = n2 p2 − np2 .

2
(ii) Für Poisson–verteilte Zufallsgrößen X (also P (X = k) = e−λ λk /k! für

k ∈ 0 ) existiert V (X) = λ ( ÜA nach dem Muster 1).
3.2 Zur Bedeutung der Streuung

(a) Streufreie (schwankungsfreie) Zufallsgrößen. Die Varianz einer Zu-
fallsgröße X ist genau dann Null, wenn ihre Verteilung ein Dirac–Maß δa ist.
Dies bedeutet, dass bei Beobachtung von X immer ein und derselbe Messwert a
anfällt.
Denn sei E(X) = a und V (X) = 0. Dann gilt (x − a)2 P (X = x) = 0 für alle
x ∈ ΩX , also P (X = x) = 0 für x = a. Wegen P (X = x) = 1 folgt a ∈ ΩX
x∈ΩX
und P (X = a) = 1. Liefert umgekehrt jede Beobachtung von X denselben Wert
a, so ist offenbar E(X) = a und V (X) = 0.
(b) Besitzt die Zufallsgröße X eine Varianz V (X) = σ 2 mit σ = σ(X) > 0,
/ > 3 σ) dafür, dass die X–Werte von
so ist die Wahrscheinlichkeit P (|X − X|
X/ um mehr als die dreifache Streuung abweichen, sehr gering. Aus der in (c)
behandelten Tschebyschewschen Ungleichung ergibt sich die grobe Abschätzung
/ > 3 σ) 3 σ) ≈ 0.0027
verteilte Zufallsgrößen X mit n p (1−p) 1 gilt z.B. P (|X − X|
vgl. 4.1 (c).
In der Praxis fallen die meisten Beobachtungswerte für X in das Intervall
/ − 3 σ(X) , X
[X / + 3 σ(X) ] ( 3 σ–Regel ).
(c) Die Tschebyschewsche Ungleichung. Ist X eine nicht streufreie Zu-

fallsgröße mit endlicher Varianz V (X) = σ 2 , so gilt für k > 0
/ > k σ) < 1
P (|X − X| .
k2
Mit ε = k σ folgt insbesondere
/ > ε) < V (X)

P (|X − X| .
ε2
Beweis.
/ > k σ} gilt nach 1.5 (b)
Für B := {xi ∈ ΩX | |xi − X|

/ > k σ) =
P (X ∈ B) = P (|X − X| P (X = xi ) .
xi ∈B
Im Fall B = ∅ ist P (X ∈ B) = 0 < 1

k2
, andernfalls gilt

σ 2 = V (X) = / |2 P (X = xi )
| xi − X
xi ∈ΩX

≥ / |2 P (X = xi )
| xi − X
xi ∈B

> k2 σ 2 P (X = xi ) = k2 V (X) P (X ∈ B) . 2
xi ∈B
(d) Anwendung. In 1.1 wurde gefragt, wie wahrscheinlich es ist, bei 24000
Münzwürfen 12480–mal oder öfter Zahl“ zu erhalten. Es geht also um eine
Abschätzung von P (X − X / ≥ 480),” wobei X eine b( 24000 , 12 )–verteilte Zu-
/ = 12000. Nach 3.1 (c) ist V (X) = 14 · 24000 = 6000. Nach
fallsgröße ist und X
der zweiten Variante der Tschebyschewschen Ungleichung erhalten wir
/ ≥ 480) = P (|X − X|
/ > 479) < 6000
P (|X − X| < 0.0262 .
(479)2
n n
Wegen k
= n−k
folgt
/ ≥ 480) =
P (X − X 1 / ≥ 480) < 0.0131 .
P (|X − X|
2
In Wirklichkeit ist diese Wahrscheinlichkeit kleiner als 10−9 , vgl. 4.1.
3.3 Die Varianz von αX + β

(a) Existieren E(X) und V (X), so gilt für α, β ∈ Ê ÜA
E(αX + β) = αE(X) + β , V (αX + β) = α2 V (X) .
(b) Im Fall V (X) > 0 heißt Y := 1

σ(X)
/ die zu X gehörige standardi-
(X − X)
sierte Zufallsgröße. Für diese gilt
E(Y ) = 0, V (Y ) = 1.
3 Varianz und Streuung einer diskreten Verteilung 489
3.4 Das schwache Gesetz der großen Zahl

(a) Satz (Jakob Bernoulli um 1685, publ. 1713). Sei Xn die zufallsabhängige
Zahl der Erfolge bei n–maliger Durchführung eines Bernoulli–Experiments mit
Erfolgswahrscheinlichkeit 0 0
p (1 − p)
P (|Hn − p| > ε) < → 0 für n → ∞ .
n ε2
(b) Folgerung. Sei X eine diskret verteilte Zufallsgröße und A eine Teil-
menge von Ê mit 0 ε) = 0 für jedes ε > 0 .

n→∞
Bemerkungen.
Dies ist die mathematische Präzisierung der Formulierung die relativen Häu-
”
figkeiten hn spielen sich für n → ∞ auf p ein“, vgl. 1.1. Die manchmal anzutref-
fende Formulierung lim hn = p“ ist in dieser Form unsinnig; hn ist ja keine
”n→∞
wohlbestimmte Größe, sondern hängt vom Zufall ab. Es hätte durchaus sein
können, dass Pearson bei den Nächsten 24000 Münzwürfen 12950 mal Zahl
erhalten hätte, d.h. h24000 ≈ 0.52. Ein solches Ergebnis wäre zwar möglich,
aber äußerst unwahrscheinlich.
Anders verhält es sich mit der Formulierung lim hn = p mit Wahrschein-
”n→∞
lichkeit 1“. Die Präzisierung dieser Aussage (starkes Gesetz der großen Zahl)
erfordert erheblichen begrifflichen Aufwand, siehe Bauer [115].
Beweis.
(a) Xn ist b(n, p)–verteilt mit Erwartungswert n p und Varianz n p (1−p). Nach
3.3 folgt für Hn = Xn /n
1 p (1 − p)
E(Hn ) = p , V (Hn ) = n p (1 − p) = .
n2 n
Die Behauptung (a) ergibt sich nun aus der zweiten Version der Tschebyschew-
schen Ungleichung 3.2 (c).
(b) Bezeichnen wir das Ergebnis X ∈ A als Erfolg, so erhalten wir ein Ber-
noulli–Experiment mit Erfolgswahrscheinlichkeit p, sind also im Fall (a). 2
4 Verteilungen mit Dichten

4.1 Der Grenzwertsatz von de Moivre–Laplace
Die Zufallsgröße Xn sei b(n, p)–verteilt mit 0 < p < 1. Dann gilt für die zu-
gehörige standardisierte Zufallsgröße
Yn := √Xn −n p
n p (1−p)
(vgl. 3.3 (b)) die Beziehung

x 1 2
lim P (Yn ≤ x) = Φ(x) := √1 e− 2 t dt
n→∞ 2π
−∞
gleichmäßig für alle x ∈Ê, und zwar gibt es eine Konstante M mit
√
| Φ(x) − P (Yn ≤ x) | ≤ M/ n für alle x ∈ Ê.
Für den Beweis verweisen wir auf Freudenthal [119]. Die auf de Moivre (um
1721) zurückgehende
√ Beweisidee beruht auf der Stirlingschen–Formel (Bd.1,
§ 10 : 1.5) n! ≈ 2πn (n/e)n .
Folgerungen. Für n 1 gilt

(a) P (α ≤ Yn ≤ β) ≈ Φ(β) − Φ(α) ,

(b) P (a ≤ Xn ≤ b) = P √ a−np ≤ Yn ≤ √ b−np
np(1−p) np(1−p)

≈ Φ √ b−np − Φ √ a−np .
np(1−p) np(1−p)
/n | ≥ k σ(Xn )) ≈ 2 Φ(−k).
(c) P (|Xn − X
Tabellen für Φ finden Sie in jedem Lehrbuch über Wahrscheinlichkeitsrechnung,
eine kurze Tabelle auch in Bd. 1, S. 95. Hier einige Zahlenwerte zur Anwendung
von (c):
2Φ(−1) ≈ 0.317 , 2Φ(−2) ≈ 0.0455 , 2Φ(−3) ≈ 0.0027 , 2Φ(−6) < 2 · 10−9 .
Wir kommen auf das Beispiel 3.2 (d) zurück: Für eine b(24000, 12 )–verteilte Zu-
√
fallsgröße X ist σ(X) = 12 24000 ≈ 77.5. Daher ist 479 mehr als die sechsfache
Streuung, also P (X − E(X) ≥ 480) < Φ(−6) < 10−9 .
4.2 Die Normalverteilung

Gauss schlug 1809 für die Wahrscheinlichkeit, eine astronomische Beobach-
tungsgröße X im Intervall I zu finden, den Ansatz

1 1 x−m 2
(∗) P (X ∈ I) = √ e− 2 ( σ ) dx
2π σ
I
4 Verteilungen mit Dichten 491
vor. Diesen Ansatz (und damit verbunden eine Begründung für die Methode
der kleinsten Quadrate) erhielt er aus seinem Postulat, dass das arithmetische
Mittel immer ein Schätzwert mit der größten Wahrscheinlichkeit sei.
Die Begründung für den Ansatz (∗) liefert aus heutiger Sicht der zentrale
Grenzwertsatz: Kommen die zufälligen Schwankungen einer Beobachtungs-
größe X durch Überlagerung sehr vieler, unabhängig voneinander wirkender
Elementarstörungen“ zustande, so gilt (∗) mit geeigneten Parametern m, σ in
”
guter Näherung. Dieser Sachverhalt wurde erstmalig 1901 von Ljapunow unter
geeigneten Voraussetzungen bewiesen. Astronomische Beobachtungswerte sind
annähernd m–σ–verteilt, d.h. (∗) ist mit großer Genauigkeit erfüllt.
Eine b(n, p)–verteilte Zufallsgröße X ist nach 4.1 für 0 < p < 1 und n 1
annähernd m–σ–normalverteilt mit
σ = n p (1 − p) .
Die m–σ–Normalverteilung ist (wie die Poisson–Verteilung) eine Grenzver-
teilung, geeignet zur Approximation bestimmter realer Verteilungen.
4.3 Verteilungen mit Dichten
(a) Eine Zufallsgröße X heißt stetig verteilt mit Dichte , wenn für jedes
Intervall I

P (X ∈ I) = (x) dx
Ê→Ê
I
gilt, wobei : + eine integrierbare Funktion ist mit

+∞
(x) dx = 1 .
−∞
Für die Verteilung μ (der Beobachtungswerte) von X ergeben sich folgende
Unterschiede zu diskreten Verteilungen:
– Ein einzelner Beobachtungswert hat Wahrscheinlichkeit Null.
– Die Wahrscheinlichkeit μ(A) = P (X ∈ A) ist nicht für alle Teilmengen
A⊂ Ê definiert.
Damit ist gemeint, dass es unter den üblichen Grundannahmen der Mengenlehre
Ê
kein für alle Teilmengen von definiertes Wahrscheinlichkeitsmaß gibt, welches
die Eigenschaften (W1 ), (W2 ), (W3 ) von 1.7 erfüllt und auf den Intervallen I mit
μ übereinstimmt (Banach, Kuratowski 1929).
Für offene Mengen Ω ⊂

Ê und stetige Funktionen : Ê→Ê + lässt sich
μ(Ω) := (x) dx
Ω
gemäß Bd. 1, § 23 : 4.2, 4.3 definieren. Da wir die Kenntnis des Lebesgue–Inte-
grals an dieser Stelle nicht voraussetzen, soll dies vorläufig genügen, zumal wir
auf Definitionsbereiche allgemeiner Wahrscheinlichkeitsmaße noch ausführlicher
eingehen.
(b) In Analogie zu 2.1, 3.1 definieren wir den Erwartungswert E(X) und die
Varianz V (X) durch

+∞
+∞
/ :=
E(X) = X x (x) dx , V (X) := / 2 (x) dx ,
(x − X)
−∞ −∞
falls diese Integrale existieren. Hier gilt generell V (X) > 0, was für stetige
Dichten leicht zu sehen ist.
Die Tschebyschewsche Ungleichung und damit das schwache Gesetz der großen
Zahl lassen sich leicht auf den vorliegenden Fall übertragen ÜA . Der Beweis
der Formel
+∞
E(f (X)) = f (x) (x) dx
−∞
für transformierte Zufallsgrößen f (X) muss auf später verschoben werden.
4.4 Allgemeine Verteilungen

Wir haben bisher diskrete Verteilungen und Verteilungen mit Dichten ein-
geführt. Bei der Behandlung des einfachen Wasserstoffmodells (§ 18 : 3.3 (c))
müssen Energieverteilungen mit diskreten und kontinuierlichen Anteilen her-
angezogen werden. Für die mathematische Theorie der Quantenmechanik er-
weist es sich darüberhinaus als notwendig, Verteilungen μ allgemeiner Art zu
betrachten.
Was von solchen Verteilungen zu verlangen ist, wurde 1933 von Kolmogorow
als Resümee einer über dreißigjährigen Diskussion zusammengefasst. Es sind
dies im Wesentlichen die in 1.7 aufgeführten Eigenschaften (W1 ), (W2 ), (W3 );
im Hinblick auf das in 4.3 (a) Gesagte sind diese aber wie folgt zu modifizieren:
Die Verteilung μ ist auf einem System B von Teilmengen von definiert, Ê
welches nicht notwendig alle Teilmengen von Ê
enthalten muss, das aber alle
Intervalle enthält.
Die Forderungen lauten:
(W1 ) μ(A) ≥ 0 für die zu B gehörenden Mengen A ,
Ê
(W2 ) μ( ) = 1 ,
2
∞

∞
(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen A1 , A2 , . . . ∈ B.
k=1
k=1
Dabei ist zu verlangen, dass mit den Ak auch die Vereinigung zu B gehört.
Im Hinblick auf das Rechnen mit Wahrscheinlichkeiten muss B mit A auch
5 σ–Algebren und Borelmengen 493
Ê
das Komplement \ A enthalten und gegenüber Durchschnittsbildungen abge-
schlossen sein. Dies führt auf den Begriff der σ–Algebra, den wir als Nächstes
behandeln. Bevor wir allgemeine Verteilungen genauer charakterisieren können
(Abschnitt 9), müssen wir einiges über die Konstruktion von Maßen voraus-
schicken.
5 σ–Algebren und Borelmengen

5.1 Eigenschaften von σ–Algebren
(a) Definition. Eine Kollektion A von Teilmengen einer nichtleeren Menge Ω
heißt σ–Algebra auf Ω, wenn folgendes gilt:
(i) Ω gehört zu A ,
(ii) mit A gehört auch Ac := Ω \ A zu A ,
7
∞
(iii) mit A1 , A2 , . . . gehört auch Ak zu A .
k=1
Dann gehört auch ∅ zu A, und mit je endlich ober abzählbar vielen Mengen
enthält A auch deren Durchschnitt ÜA .
Wir fassen künftig eine σ–Algebra A als eine Menge von Mengen auf und schrei-
ben A ∈ A statt A gehört zu A“. Als Definitionsbereiche des Lebesgue–Maßes
”
Ê
bzw. von Verteilungen (Wahrscheinlichkeitsmaßen auf ) wählen wir grundsätz-
lich σ–Algebren.
(b) Beispiele. (i) Die Gesamtheit sämtlicher Teilmengen von Ω bildet eine
σ–Algebra auf Ω, genannt die Potenzmenge von Ω und bezeichnet mit (Ω). È
(ii) Die kleinste σ–Algebra auf Ω ist {∅, Ω}.
Diskrete Verteilungen lassen sich als Wahrscheinlichkeitsmaße auf der vollen
Potenzmenge von Ê
definieren; für Verteilungen mit Dichten ist dies nach 4.3
nicht möglich.
(c) Zum Nachweis, dass ein Mengensystem ein σ–Algebra bildet, dient der
folgende
Satz. Eine Kollektion A von Teilmengen von Ω ist genau dann eine σ–Algebra
auf Ω, wenn folgendes gilt:
(S1 ) Ω ∈ A ,
(S2 ) A ∈ A =⇒ Ac := Ω \ A ∈ A ,
(S3 ) A, B ∈ A =⇒ A ∩ B ∈ A ,
7
∞
(S4 ) für paarweise disjunkte A1 , A2 , . . . aus A gehört Ak zu A.
k=1
Bemerkung. In der Literatur werden σ–Algebren häufig durch die Eigenschaf-

ten (S1 ) bis (S4 ) definiert.
Beweis.
Offenbar ist nur zu zeigen, dass für ein Mengensystem A mit (S1 )–(S4 ) die
Eigenschaft (iii) einer σ–Algebra erfüllt ist. Für beliebige Mengen B1 , B2 , . . .
aus A seien
A1 := B1 , A2 := B2 \ B1 und allgemein
7
n -
n
An+1 := Bn+1 \ Bk = Bn+1 ∩ (Ω \ Bk ) für n = 1, 2, . . . .
k=1 k=1
Dann gilt An ∈ A für alle n ∈ , A n ∩ Am = ∅ für m > n und ( ÜA )

7
∞ 7
∞
Bk = An . 2
k=1 n=1
5.2 Die von einem Mengensystem erzeugte σ–Algebra

(a) Satz. Sei Ω = ∅ und K eine nichtleere Kollektion von Teilmengen von Ω.
Dann gibt es eine kleinste σ–Algebra σ(K), die alle Mengen von K enthält, d.h.
σ(K) ist eine σ–Algebra, und jede σ–Algebra, die alle Mengen von K enthält,
umfasst σ(K).
Es ist üblich, σ(K) die von K erzeugte σ–Algebra zu nennen.
Beweis.
È
Es gibt wenigstens eine K umfassende σ–Algebra, nämlich (Ω). Wir definieren
σ(K) als den Durchscnitt aller K umfassenden σ–Algebren:
A ∈ σ(K) ⇐⇒ A ∈ A für jede K umfassende σ–Algebra A.
Der Durchschnitt beliebig vieler σ–Algebren ist eine σ–Algebra, ÜA . Daher ist
σ(K) eine σ–Algebra und hat nach Konstruktion die behauptete Minimaleigen-
schaft. 2
(b) Lemma. Für K1 ⊂ K2 gilt σ(K1 ) ⊂ σ(K2 ).

Dies folgt aus (a), da σ(K2 ) eine K1 umfassende σ–Algebra ist.
(c) ÜA Sei Ω = ∅. Bestimmen Sie σ(K) für K = {∅} und für K = {A} mit
∅ = A = Ω.
5.3 Borelmengen
Ê
(a) Die von den offenen Teilmengen des n erzeugte σ–Algebra bezeichnen wir
Ê
mit B( n ); deren Mitglieder heißen Borelmengen. Statt B( ) schreiben wir Ê
kurz B.
(b) Für eine nichtleere Borelmenge M ⊂ Ên definieren wir
B(M ) := {B ∈ B( Ên) | B ⊂ M } = {A ∩ M | A ∈ B(Ên)} .
5 σ–Algebren und Borelmengen 495
Ê
(c) Nach 5.1 (a) enthält B( n ) alle offenen und abgeschlossenen Mengen, fer-
ner alle abzählbaren Vereinigungen abgeschlossener Megen (Fσ –Mengen) und
alle abzählbaren Durchschnitte offener Mengen (Gσ –Mengen). Durch wieder-
holte Bildung von Komplementen, abzählbaren Vereinigungen und abzählbaren
Durchschnitten ergeben sich immer neue Borelmengen, doch lassen sich auf die-
se Weise nicht alle Borelmengen erzeugen“. Insofern ist die in der Literatur
”
gebräuchliche Bezeichnung die von den offenen Mengen erzeugte σ–Algebra“
”
etwas irreführend; angemessener, aber sprachlich unschön wäre die die offenen
”
Mengen einhüllende σ–Algebra“.
5.4 Weitere Charakterisierungen der Borel–Algebra

Satz. (a) Alle Intervalle I ⊂ Ê sind Borelmengen.
(b) B wird bereits von allen Intervallen eines der Typen [a, b], ]a, b[, ]a, b],
]−∞, b] usw. erzeugt.
(c) Enthält eine σ–Algebra Σ auf Ê alle Intervalle eines bestimmten Typs, so
enthält sie alle Borelmengen.
(d) Entsprechendes gilt für B( Ê n
) und die Quadertypen
[a, b] := { x ∈ Ê n
| a k ≤ x k ≤ bk für k = 1, . . . , n} ,
]a, b] := { x ∈ Ê n
| a k < x k ≤ bk für k = 1, . . . , n} , usw.
Folgerung. Zum Nachweis, dass alle Borelmengen eine Eigenschaft E besitzen,

genügt es zu zeigen
– Alle Intervalle (Quader) eines bestimmten Typs haben die Eigenschaft E.
– Die Mengen mit der Eigenschaft E bilden eine σ–Algebra A.
Denn ist K die Kollektion aller Intervalle (Quader) des betreffenden Typs, so
Ê
gilt K ⊂ A und damit B( n) = σ(K) ⊂ A nach 5.2 (a).
Beweis.
Wir beschränken uns auf Intervalle I ⊂ Ê; (d) ergibt sich in analoger Weise.
(a) Nach 5.3 (c) gehört die Kollektion K der kompakten Intervalle zu B, also
gilt σ(K) ⊂ B. Es folgt
∞
7 ∞
7
]a, b[ = a+ 1
n
,b − 1
n
∈ B, ]a, b] = a+ 1
n
,b ∈ B,
n=1 n=1
7
∞
]−∞, b] = [−n, b] ∈ B ,
n=1
und entsprechend ergibt sich, dass jedes Intervall zu σ(K) und damit zu B gehört
ÜA . Ist KT die Kollektion aller Intervalle eines Typs T , so folgt nach 5.2 also
σ(KT ) ⊂ σ(K) ⊂ B. Andererseits gilt
∞
- ∞
-
[a, b] = a− 1
n
,b + 1
n
= a− 1
n
,b
n=1 n=1

Ê \ 7 −∞, a −
∞
= ]−∞, b] \ ]−∞, a[ = ]−∞, b] ∩ 1
n
,
n=1
also K ⊂ σ(KT ) für die Intervalltypen ]a, b[, ]a, b], ]−∞, b]. Entsprechend folgt
K ⊂ σ(KT ) für die anderen Intervalltypen ÜA . Daher gilt σ(KT ) = σ(K) ⊂ B
für jeden Intervalltyp T .
(b) Jede offene Menge Ω ⊂ Ê
ist die Vereinigung abzählbar vieler kompakter
Intervalle (Bd. 1, § 23 : 4.1). Mit Lemma 5.2 (b) erhalten wir B ⊂ σ(K) und somit
insgesamt B = σ(K) = σ(KT ) für jeden Intervalltyp T . 2
6 Eigenschaften von Maßen

Wir diskutieren zunächst den allgemeinen Maßbegriff und behandeln anschlies-
send zwei Spezialfälle, Wahrscheinlichkeitsmaße auf in Abschnitt 9 und zuvor Ê
das Lebesgue-Maß als Erweiterung des herkömmlichen Volumenbegriffs im n. Ê
Bei letzterem müssen wir zulassen, dass eine Menge A kein endliches Volumen
besitzt; wir schreiben dann V n (A) = ∞.
6.1 Definition. Unter einem Maß verstehen wir eine Vorschrift, die jeder Men-
ge A einer σ–Algebra A auf einer nichtleeren Menge Ω ein Maß μ(A) zuordnet
mit
(M1 ) μ(A) ≥ 0 oder μ(A) = ∞ ,
(M2 ) μ(∅) = 0 ,
7
∞
∞
(M3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak ∈ A .
k=1 k=1
Die σ–Additivität (M3 ) ist wie folgt zu verstehen:

7
∞
Genau dann hat A = Ak endliches Maß, wenn alle Ak endliches Maß haben
k=1

∞
und die Reihe μ(Ak ) konvergiert. Diese liefert dann μ(A).
k=1
Die Mengen A ∈ A nennen wir wahlweise A–messbar, μ–messbar oder messbar.

Das Tripel (Ω, A, μ) heißt Maßraum.
Das Maß μ heißt σ–endlich, wenn es Mengen Ωk endlichen Maßes gibt mit
7
∞
Ω1 ⊂ Ω2 ⊂ . . . und Ω = Ωk . Gilt μ(Ω) < ∞ , so heißt μ ein endliches
k=1
Maß. Für endliche Maße ist die Forderung (M2 ) überflüssig ÜA .
6 Eigenschaften von Maßen 497
Im Fall μ(Ω) = 1 heißt μ ein Wahrscheinlichkeitsmaß auf Ω. Ein Wahr-

scheinlichkeitsraum (Ω, A, μ) ist charakterisiert durch
(W1 ) μ(A) ≥ 0 für alle A ∈ A ,
(W2 ) μ(Ω) = 1 ,
7
∞
∞
(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak ∈ A .
k=1 k=1
6.2 Rechenregeln für Maße

7
N
N
(a) μ( Ak ) = μ(Ak ) für paarweise disjunkte Ak ∈ A mit endlichem Maß.
k=1 k=1
(b) A ⊂ B, μ(B) < ∞ =⇒ μ(B \ A) = μ(B) − μ(A).
(c) A ⊂ B =⇒ μ(A) ≤ μ(B) für μ–messbare Mengen A, B.

Dabei gilt die Ungleichung μ(A) ≤ μ(B) als erfüllt, wenn μ(B) = ∞.
(d) μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B), falls A und B μ–messbar sind und
μ(A ∪ B) < ∞.
Beweis als ÜA , vgl. 1.7 (b).
6.3 Stetigkeitseigenschaften von Maßen

(a) Für μ–messbare Mengen A1 , A2 , . . . mit A1 ⊂ A2 ⊂ . . . gilt
7
∞
μ( Ak ) = lim μ(An ) .
k=1 n→∞
7
∞
Dies schließt den Fall μ( Ak ) = ∞ ein.
k=1
(b) Für μ–messbare Mengen B1 , B2 , . . . mit B1 ⊃ B2 ⊃ . . . gilt

-
∞
μ( Bk ) = lim μ(Bn ) , falls μ(B1 ) < ∞ .
k=1 n→∞
Auf die Bedingung μ(B1 ) < ∞ kann nicht verzichtet

werden. Beispielsweise
Ê
haben die Streifen Bk := (x, y) 0 < y < k1 ⊂ 2 keinen endlichen Flä-
cheninhalt, und ihr Durchschnitt ist leer.
Beweis.
(a) Wir setzen C1 := A1 und Ck := Ak \ Ak−1 für k ≥ 2 (Skizze!). Wegen
(S2 ), (S3 ) gehören die Ck = Ak ∩ (Ω \ Ak−1 ) für k ≥ 2 zu A.
Für k < l gilt Ak ∩ Cl ⊂ Al−1 ∩ Cl , also Cl ∩ Ak = ∅, da l > 1.

Wegen Ck ⊂ Ak ist daher Ck ∩ Cl = ∅ für k < l. Wir zeigen
7
∞ 7
∞
A := Ak = Ck .
k=1 k=1
Wegen Ck ⊂ Ak ⊂ A ist die rechte Seite in der linken enthalten.

Umgekehrt gibt es zu jedem ω ∈ A ein kleinstes m ∈ mit ω ∈ Am . Es ist
dann
ω ∈ A1 = C1 für m=1 bzw. ω ∈ Am \ Am−1 = Cm für m > 1.
Gibt es ein N ∈
mit μ(AN ) = ∞, so folgt mit 6.2 (c) auch μ(Ak ) = ∞ für
k ≥ N sowie μ(A) = ∞. Andernfalls gilt nach 6.2 (b)
μ(Ck ) = μ(Ak ) − μ(Ak−1 ) für k > 1 ,
also wegen der σ–Additivität von μ

∞
n
μ(A) = μ(Ck ) = lim μ(A1 ) + (μ(Ak ) − μ(Ak−1 ))
k=1 n→∞ k=2
= lim μ(An ) .
n→∞
-
∞
(b) Wir setzen Ak := B1 \ Bk ∈ A, B := Bk und
k=1
7
∞ 7
∞ -
∞
A := Ak = (B1 \ Bk ) = B1 \ Bk = B1 \ B .
k=1 k=1 k=1
Letzteres folgt wegen B ⊂ Bk ⊂ B1 nach den de Morganschen Regeln Bd. 1,

§ 4 : 4.2. Wegen μ(B1 ) < ∞ und wegen Ak ⊂ A ⊂ B1 haben nach 6.2 (d) auch
alle Ak endliches Maß. Aus (a) und 6.2 (b) erhalten wir
μ(B1 ) − μ(B) = μ(A) = lim μ(An ) = lim (μ(B1 ) − μ(Bn ))

n→∞ n→∞
= μ(B1 ) − lim μ(Bn ) . 2

n→∞
6.4 Die Subadditivität von Maßen

Für beliebige μ–messbare Mengen M1 , M2 , . . . gilt
7
∞
∞
μ( Mk ) ≤ μ(Mk ) ,
k=1 k=1
wobei diese Ungleichung als erfüllt gilt, wenn nicht alle Mk endliches Maß haben
oder wenn die rechtsstehende Reihe divergiert.
7 Konstruktion von Maßen durch Fortsetzung 499
Beweis als ÜA in zwei Schritten:

7
n
n
(a) Folgern Sie aus 6.2 (d) durch Induktion, dass μ( Mk ) ≤ μ(Mk ).
7
n k=1 k=1
(b) Wenden Sie 6.3 (a) auf An = Mk an.
k=1
7 Konstruktion von Maßen durch Fortsetzung

7.1 Mengenringe und Prämaße
(a) Bisher kennen wir nur ein nichttriviales Beispiel für Maßräume: diskrete
Ê ÈÊ
Wahrscheinlichkeitsräume ( , ( ) , μ ). Nun soll eine zunächst für die halb-
Ê
offenen Quader ]a, b] = {x ∈ n | ai < xi ≤ bi (i = 1, . . . , n)} gegebene Maß-
vorschrift wie der elementargeometrische Inhalt V n (]a, b]) oder im Fall n = 1
die Wahrscheinlichkeit
b
μ(]a, b]) = (x) dx
a
zu einem Maß auf eine σ–Algebra A fortgesetzt werden. Dies geschieht nach
einem allgemeinen Prinzip, welches wir im folgenden schildern.
(b) Eine nichtleere Kollektion R von Teilmengen von Ω = ∅ heißt ein Men-
genring auf Ω, wenn R mit je zwei Mengen A, B auch A ∪ B und A \ B enthält.
Es gilt dann
∅ = C \ C ∈ R,
da R wenigstens eine Menge C enthält, und
A, B ∈ R =⇒ A ∩ B = A \ (A \ B) ∈ R .
Eine abzählbare Vereinigung von Mengen aus R muss ebensowenig zu R
gehören wie Ω selbst.
Ê
Uns interessiert vor allem der Mengenring Rn auf n , bestehend aus der lee-
ren Menge und allen endlichen Vereinigungen halboffener Quader ]a, b]. Zum
Nachweis der Mengenringeigenschaft ist offenbar nur zu zeigen: A, B ∈ Rn
=⇒ A \ B ∈ Rn . Daraus ergibt sich dann leicht, dass jede nichtleere Menge
A ∈ Rn die endliche Vereinigung paarweise disjunkter Quader vom Typ ]a, b]
ist.
ÜA Machen Sie sich diese Sachverhalte für R1 und R2 anhand von Skiz-
zen klar. Daraus ergibt sich die Beweisidee für Rn ; wir verzichten auf die
Ausführung.
(c) Ein Prämaß μ auf einem Mengenring R ist definiert durch die Eigen-
schaften
μ(A) ≥ 0 oder μ(A) = ∞ für A ∈ R , μ(∅) = 0 ,
2
∞

∞
μ( Ak ) = μ(Ak )
k=1
k=1
7
∞
für paarweise disjunkte Ak ∈ R , falls Ak ∈ R .
k=1
Das Prämaß heißt σ–endlich, wenn es Mengen Ak ∈ R gibt, mit μ(Ak ) < ∞,
7
∞
Ak ⊂ Ak+1 (k = 1, 2, . . .) und Ω = Ak .
k=1
Beispiele für Prämaße folgen in den Abschnitten 8 und 9.
7.2 Fortsetzung eines Prämaßes zu einem Maß

Satz. Jedes Prämaß auf einem Mengenring R lässt sich zu einem Maß fortset-
zen. Für ein σ–endliches Prämaß ist die Fortsetzung auf der von R erzeugten
σ–Algebra σ(R) eindeutig bestimmt.
Wir beschreiben im folgenden das Fortsetzungsverfahren (Carathéodory 1938);
ausführliche Beweise hierzu finden Sie in Bauer [115] § 5.
(a) Einführung eines äußeren Maßes μ∗ . Für beliebige Teilmengen M des
Grundraums Ω sei

∞ 7
∞
μ∗ (M ) := inf μ(Ak ) A1 , A2 , . . . ∈ R , M ⊂ Ak ,
k=1 k=1
falls es wenigstens eine Überdeckung von M durch Mengen Ak ∈ R mit

∞
μ(Ak ) < ∞ gibt, und
k=1
μ∗ (M ) := ∞ sonst.
Das äußere Maß μ∗ hat folgende Eigenschaften:
(1) μ∗ (M ) = μ(M ) f ür M ∈ R ,
(2) μ∗ (M ) ≥ 0 oder μ∗ (M ) = ∞ , μ∗ (∅) = 0 ,
(3) M1 ⊂ M2 =⇒ μ∗ (M1 ) ≤ μ∗ (M2 ) ,

7
∞
∞
(4) μ∗ ( Mk ) ≤ μ∗ (Mk ) f ür beliebige Mk ⊂ Ω
k=1 k=1
(Subadditivität, vgl. 6.4).
In der Regel ist μ∗ nicht einmal endlich additiv: Ist der Rand einer Menge A
zu ausgefranst, so kann es Mengen M geben mit
μ∗ (M ) < μ∗ (M ∩ A) + μ∗ (M \ A) .
7 Konstruktion von Maßen durch Fortsetzung 501
(Die Figur soll diese Situation andeu-

ten.)
.
Die folgende Definition kennzeichnet
messbare Mengen A durch die Gutar-
tigkeit ihres Randes, formuliert mit Hil-
fe der additiven Zerlegbarkeit von Test-
mengen M durch A und deren Komple- M
ment:
(b) Definition. Eine Menge A ⊂ Ω

heißt μ–messbar, wenn A
. .
μ∗ (M ) = μ∗ (M ∩ A) + μ∗ (M \ A)
für alle M ⊂ Ω .
(c) Die μ–messbaren Mengen bilden eine R umfassende σ–Algebra A. Setzen
wir ein σ–endliches Prämaß μ auf die σ–Algebra A fort durch die Vorschrift
μ(A) := μ∗ (A) f ür A ∈ A ,
so entsteht ein σ–endliches Maß μ.

(d) Jede andere Fortsetzung eines σ–endlichen Prämaßes μ zu einem Maß
stimmt auf σ(R) mit der in (c) definierten Fortsetzung überein.
Bemerkungen. Wir wenden den Fortsetzungssatz nur auf Prämaße auf dem
Ê
Mengenring Rn an. Dieser erzeugt die σ–Algebra B( n ) der Borelmengen (vgl.
Ê
5.4). Die oben definierte σ–Algebra A kann größer als B( n ) sein: Beim Dirac-
ÈÊ
schen Prämaß auf R1 ergibt sich z.B. A = ( ); für den elementargeometri-
schen Inhalt und für die Normalverteilung auf R1 besteht A aus den Lebesgue–
messbaren Mengen (Abschnitt 8). Für Wahrscheinlichkeitsmaße auf Êwählen
wir, auch im Hinblick auf die Eindeutigkeit der Fortsetzung, als gemeinsamen
Definitionsbereich immer die Borelalgebra B.
7.3 Nullmengen, vollständige Maße

(a) Für das nach 7.2 konstruierte Maß μ gilt: Hat N ⊂ Ω das äußere Maß Null,
so ist jede Menge A ⊂ N μ–messbar mit μ(A) = 0. Denn aus den Eigenschaften
(3), (4) von μ∗ folgt für beliebige Mengen M ⊂ Ω
μ∗ (M ∩ N ) ≤ μ∗ (N ) = 0 , μ∗ (M \ N ) ≤ μ∗ (M ) ,
also
μ∗ (M ) ≤ μ∗ (M ∩ N ) + μ∗ (M \ N ) ≤ μ∗ (M ) ,
so dass überall das Gleichheitszeichen stehen muss. Dies bedeutet nach 7.2 (b),
dass N μ–messbar ist. Für A ⊂ N gilt μ∗ (A) ≤ μ∗ (N ) = 0, so dass auch A
μ–messbar ist mit μ(A) = 0.
(b) Sei (Ω, A, μ) ein beliebiger Maßraum. Eine Menge N ∈ A mit μ(N ) = 0
heißt μ–Nullmenge .
Das Maß μ heißt vollständig, wenn für jede μ–Nullmenge auch alle Teilmengen
zu A gehören (und daher μ–Nullmengen sind).
Nach (a) ist die in 7.2 konstruierte Fortsetzung (Ω, A, μ) eines Prämaßes voll-
ständig. Schränken wir es (wie bei Wahrscheinlichkeitsmaßen üblich) auf die
Borelmengen ein, so kann die Vollständigkeit verloren gehen.
(c) μ–Nullmengen können sehr groß sein: Für diskrete Verteilungen μ mit
supp μ = {x0 , x1 , . . .} ist Ê
\ {x0 , x1 , . . .} eine μ–Nullmenge.
(d) Satz. Die Vereinigung und der Durchschnitt höchstens abzählbar vieler μ–
Nullmengen sind jeweils wieder μ–Nullmengen.
Denn nach 5.1 sind die Vereinigung V und der Durchschnitt D höchstens abzähl-
bar vieler μ–messbarer Mengen wieder μ–messbar. Für V ergibt sich die Null-
mengeneigenschaft aus der Subadditivität 6.4. Weiter folgt aus D ⊂ N und
μ(N ) = 0 auch μ(D) ≤ μ(N ) = 0.
8 Das Lebesgue–Maß
8.1 Fortsetzung des Lebesgueschen Prämaßes
(a) Die endlichen Vereinigungen halboffener Quader ]a, b] bilden zusammen
mit der leeren Menge einen Mengenring Rn . Das Lebesgue–Maß V n wird wie
folgt eingeführt:
Wir setzen V n (∅) := 0 und für jede nichtleere Menge M ∈ Rn

N
V n (M ) := V n (Ik ) ,
k=1
falls
7
N
M = Ik mit paarweise disjunkten Quadern Ik = ]ak , bk ].
k=1
Das macht Sinn, d.h. die rechte Seite hängt nicht von der Art der Zerlegung ab.
Dies ergibt sich wie in Bd. 1, § 23 : 1.
Hiermit erhalten wir ein endlich–additives Maß V n auf Rn . Zum Nachweis der
Prämaßeigenschaft genügt es daher zu zeigen: Aus
7
∞
I = ]a, b] = Ik mit paarweise disjunkten Ik = ]ak , bk ]
k=1
folgt

∞
V n (I) = V n (Ik ) .
k=1
8 Das Lebesgue–Maß 503
Die Ungleichung

N N
V n (Ik ) = V n (I k ) ≤ V n (I) = V n (I) für N ∈
k=1 k=1
erhalten wir wie in Bd. 1, § 23 : 1 aus einer Rasterung von I durch Einziehen
aller an I1 , . . . , IN beteiligten Randhyperebenen. Zu zeigen bleibt

∞
V n (I) ≤ V n (Ik ) .
k=1
Hierzu wählen wir zu vorgegebenem ε > 0 einen kompakten Quader K ⊂ I mit

V n (I) ≤ V n (K) + ε und offene Quader Jk mit
ε
Ik ⊂ Jk , V n (Jk ) < V n (Ik ) + k (k = 1, 2, . . .) .
2
Da K von den Jk überdeckt wird, gibt es nach dem Überdeckungssatz von
7
mit K ⊂
M
Heine–Borel ein M ∈ Jk . Wie in 6.4 (a) erhalten wir
k=1

M
∞
V n (I) < V n (K) + ε ≤ V n (Jk ) + ε < V n (Ik ) + 2ε
k=1 k=1
für jedes ε > 0.

Die σ–Endlichkeit von V n ergibt sich mittels Ausschöpfung von n durch die Ê
Quader Qk = {x = (x1 , . . . , xn ) | −k < xi ≤ k für i = 1, . . . , n} ∈ Rn .
(b) Wir fassen zusammen: Durch Fortsetzung des elementaren Volumens von
Quadern mit Hilfe des Verfahrens von Carathéodory in 7.2 erhalten wir ein
vollständiges Maß auf einer die Borelmengen enthaltenden σ–Algebra Ln .
Wir nennen dieses das Lebesgue–Maß und bezeichnen es wahlweise mit V n
oder λn , im Fall n = 1 auch mit λ.
(c) Das Lebesgue–Maß ist translationsinvariant:
V n (a + M ) = V n (M ) für M ∈ Ln .
Denn aus der Translationsinvarianz des Lebesgueschen Prämaßes folgt die des
äußeren Lebesgueschen Maßes ÜA .
(d) Nicht alle Teilmengen des Ê n
sind Lebesgue–messbar.
Siehe Barner–Flohr [141] 15.2 (Stichwort Vitali–Mengen“).
”
8.2 Die klassische Definition des Lebesgue–Maßes
In § 8 wurde eine elementare Definition der Lebesgue–Messbarkeit und des Le-
besgue–Maßes gegeben, wie sie in den meisten Analysis–Büchern zu finden ist.
Die Äquivalenz zu der in 8.1 gegebenen maßtheoretischen Definition ergibt sich
aus dem folgenden Satz, dessen Beweis in Elstrodt [117] Satz II.7.4 ausgeführt
ist.
Ê
Satz. (a) Eine Menge M ⊂ n ist genau dann Lebesgue–messbar im Sinne
von 8.1, wenn es zu jedem ε > 0 eine offene Menge Ω und eine abgeschlossene
Menge A gibt mit
A⊂M ⊂Ω und V n (Ω \ A) < ε .
Im Fall V n (M ) < ∞ gilt
V n (M ) = inf { V n (Ω) | Ω offen, M ⊂ Ω }.
(b) Zu jeder Lebesgue–messbaren Menge M gibt es Borelmengen F und G mit
F ⊂ M ⊂ G , V n (G \ F ) = 0 , V n (F ) = V n (M ) = V n (G) .
Aus (b) und 7.2 (d) folgt, dass das Lebesgue–Maß die einzige Fortsetzung des
n–dimensionalen Volumens von Quadern auf die σ–Algebra Ln ist.
9 Wahrscheinlichkeitsmaße auf Ê
9.1 Allgemeines
Ê
(a) Nach den Bemerkungen 7.2 verstehen wir unter einem Wahrscheinlich-
keitsmaß auf (im Folgenden Verteilung genannt)eine auf den Borelmen-
gen in Ê definierte Mengenfunktion μ mit
(W1 ) μ(A) ≥ 0 für alle A ∈ B ,
Ê
(W2 ) μ( ) = 1 ,
7
∞
∞
(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Ak ∈ B.
k=1 k=1
Wie in 1.7 (b) folgt die endliche Additivität und daraus für A, B ∈ B
μ( Ê \ A) = 1 − μ(A) ,
A ⊂ B =⇒ μ(B \ A) = μ(B) − μ(A) , also μ(A) ≤ μ(B) ,
μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B) .
Weiter gelten die Stetigkeitsaussagen 6.3 und die Subadditivität 6.4; die Vor-
aussetzung μ(B1 ) < ∞ in 6.3 (b) ist immer erfüllt.
(b) Sei μ die Verteilung einer Zufallsgröße X (d.h. μ(B) = P {X ∈ B | für B ∈

Ê
B}). Dann heißt a ∈ ein möglicher Messwert für X, wenn
μ(]a − ε, a + ε]) > 0 für alle ε > 0 .
Beachten Sie, dass für Verteilungen mit Dichten ein einzelner Messwert die
Wahrscheinlichkeit Null hat. Ist μ eine diskrete Verteilung mit dem Träger
supp μ = {x0 , x1 , . . . }, so sind x0 , x1 , . . . genau die möglichen Messwerte.
9 Wahrscheinlichkeitsmaße auf Ê 505
(c) Mischung von Wahrscheinlichkeitsmaßen. Sind pk ≥ 0 Zahlen mit

Ê, so liefert
∞
pk = 1 und μ1 , μ2 , . . . Wahrscheinlichkeitsmaße auf
k=1

∞
μ(A) := pk μk (A) für A ∈ B
k=1

Ê, bezeichnet mit
∞
ein Wahrscheinlichkeitsmaß auf μ= pk μk .
k=1
Die Eigenschaften (W1 ),(W2 ) sind evident; (W3 ) folgt aus dem großen Umord-
nungssatz Bd. 1, § 7 : 6.6 ÜA .
9.2 Die Verteilungsfunktion

Für eine Verteilung μ auf Ê
definieren wir die Verteilungsfunktion F durch
Verteilung!einer Zufallsgröße
F (x) := μ(] − ∞, x]) für x ∈ . Ê
Beispiele. (i) Für das Dirac–Maß δa (vgl. 1.6 (b)) ist F = χ[a,∞[ .
(ii) Für ein Bernoulli–Experiment mit Erfolgswahrscheinlichkeit p ist die Ver-
teilung μ = (1 − p) δ0 + p δ1 (siehe 9.1 (c)).
ÜA : Skizzieren Sie die zugehörige Verteilungsfunktion F .
(iii) Für die standardisierte Normalverteilung 4.1 erhalten wir

x
1 1 2
F (x) = Φ(x) = √ e− 2 t dt .
2π
−∞
Satz. Die Verteilungsfunktion F : Ê → [0, 1] hat die Eigenschaften

(a) F ist monoton wachsend,
(b) F ist rechtsseitig stetig,
(c) lim F (x) = 0, lim F (x) = 1.
x→−∞ x→∞
Ferner existiert der linksseitige Grenzwert F (a−) an jeder Stelle a ∈ Ê, und es

gilt
(d) μ(]a, b]) = F (b) − F (a) für a < b,
(e) μ({a}) = F (a) − F (a−),
(f) μ([a, b]) = F (b) − F (a−).
Beweis.
(a) Für a < b gilt ]−∞, a] ⊂ ]−∞, b], also μ(]−∞, a]) ≤ μ(]−∞, b]).
Unter (g) zeigen wir die Existenz der einseitigen Grenzwerte F (a+), F (a−) für
a∈ Êsowie der Grenzwerte lim F (x) , lim F (x).
x→∞ x→−∞
(b) Für Bn = ]−∞, an ] gilt B1 ⊃ B2 ⊃ . . . , also folgt nach 6.3 (b)

-
∞
F (a) = μ(]−∞, a]) = μ( Bn ) = lim μ(Bn ) = lim F (an ) = F (a+) .
n=1 n→∞ n→∞
-
∞
(c) Für Cn = ]−∞, −n] gilt C1 ⊃ C2 ⊃ . . . und Cn = ∅ , somit
n=1
-
∞
lim F (x) = lim F (−n) = lim μ(Cn ) = μ( Cn ) = 0
x→−∞ n→∞ n→∞ n=1
nach 6.3 (b); entsprechend folgt lim F (x) = 1 aus 6.3 (a) ÜA .
x→∞
(d) F (b) − F (a) = μ(]−∞, b] \ ]−∞, a]) = μ(]a, b]) für a < b.
-
∞
(f) Für Bn = a− 1
n
,b gilt B1 ⊃ B2 ⊃ . . . und Bn = [a, b], also
n=1
μ([a, b]) = lim μ(]a − 1
n
, b]) = F (b) − F (a−). (e) ist ein Spezialfall von (f).
n→∞
(g) Lemma. Ist F : Ê → Ê monoton und beschränkt, so existieren die Grenz-

werte
F (a+) = lim F (x) , F (a−) = lim F (x) , lim F (x) , lim F (x) .
x→a+ x→a− x→∞ x→−∞
Denn sei o.B.d.A. F monoton wachsend und an = a + n1 . Dann existiert s :=

lim F (an ). Zu gegebenem ε > 0 wählen wir ein m mit 0 < F (am ) − s < ε und
haben dann |F (x) − s| = F (x) − s < ε für 0 < x − a < am − a. Die Existenz
des linksseitigen Grenzwerts F (a−) und die Existenz der übrigen Grenzwerte
folgen analog mit an = a − n1 bzw. an = n bzw. an = −n ÜA . 2
9.3 Die zu einer Verteilungsfunktion gehörige Verteilung

Satz. Jede monoton wachsende, rechtsseitig stetige Funktion F : → [0, 1] Ê
mit lim F (x) = 0, lim F (x) = 1 ist die Verteilungsfunktion einer durch
x→−∞ x→+∞
F eindeutig bestimmten Verteilung μ, gegeben mittels Fortsetzung des durch
μ(]a, b]) := F (b) − F (a)
auf dem Mengenring R1 definierten endlichen Prämaßes gemäß 7.2.
Beweis.
Entscheidende Voraussetzung des Fortsetzungssatzes 7.2 ist die Prämaßeigen-
schaft. Dazu genügt es, zu zeigen:
Ist I = ]a, b] die Vereinigung abzählbar vieler, paarweise disjunkter Mengen
Ri ∈ R1 , so gilt

∞
μ(I) = μ(Ri ) .
k=1
9 Wahrscheinlichkeitsmaße auf Ê 507
Wir können jedes Ri als Vereinigung endlich vieler paarweise disjunkter In-
tervalle des Typs ]α, β] darstellen und erhalten so insgesamt abzählbar viele,
paarweise disjunkte Intervalle Ik = ]ak , bk ], deren Vereinigung I ist. Zu zeigen
bleibt

∞
μ(I) = μ(Ik ) .
k=1
(a) Von endlich vielen Intervallen I1 , . . . , IN dürfen wir, ggf. nach Umnume-
rierung, voraussetzen
a ≤ a 1 < b1 ≤ a 2 < b 2 ≤ · · · < bN ≤ b .
Aufgrund der Monotonie von F erhalten wir

N
N
μ(Ik ) = (F (bk ) − F (ak ))
k=1 k=1

N−1
≤ (F (ak+1 − F (ak )) + F (bN ) − F (aN )
k=1
= F (bN ) − F (a1 ) ≤ F (b) − F (a) = μ(I) .
Es folgt die Konvergenz der Reihe

∞
μ(Ik ) ≤ μ(I) .
k=1

∞
(b) Zu zeigen ist μ(I) ≤ μ(Ik ).
k=1
Sei ε > 0 vorgegeben. Aufgrund der rechtsseitigen Stetigkeit von F gibt es

– ein Intervall J = ]c, b] mit a < c bk und μ(Jk ) − μ(Ik ) < ε 2−k (k = 1, 2, . . . ).
Dann gilt
◦ ◦
[c, b] = J ⊂ I , Ik ⊂ Jk =: Ωk .
Nach dem Überdeckungssatz von Heine–Borel gibt es ein M ∈ mit
7
M 7
M
J ⊂ [c, b] ⊂ Ωk ⊂ Jk .
k=1 k=1
Es folgt

M
M
μ(I) < μ(J) + ε ≤ μ(Jk ) + ε ≤ μ(Ik ) + 2ε
k=1 k=1

∞
≤ μ(Ik ) + 2ε für jedes ε > 0 . 2
k=1
508 § 20 Integration bezüglich eines Maßes μ
§ 20 Integration bezüglich eines Maßes μ

1 Das Konzept des μ–Integrals
(a) In diesem Paragraphen verfolgen wir vor allem zwei Ziele,
• die Grundlagen für das Lebesgue–Integral bereitzustellen und
• für ein allgemeines Wahrscheinlichkeitsmaß
μ, aufgefasst als Verteilung einer
Zufallsgröße X, das μ–Integral f dμ und damit Erwartungswert, Varianz von
Ê
X und den Erwartungswert der transformierten Zufallsgröße f (X) zu definieren.
Beide Aufgaben lassen sich gemeinsam unter dem Dach der Integrationstheo-
rie bezüglich eines Maßes μ behandeln. Diese legen wir gleich weit genug an,
um auch für andere Themen wie Momente allgemeiner Massenverteilungen und
klassische Wahrscheinlichkeitstheorie offen zu sein.
(b) Ausgangspunkt ist ein beliebiger Maßraum (Ω, A, μ) mit einem σ–endlichen
Maß μ, vgl. § 19 : 6. Die Mengen A ∈ A nennen wir μ–messbar oder kurz
messbar. Die Verbindung zwischen Maß und Integral wird über die Beziehung

(∗) χA dμ := μ(A) für A ∈ A mit μ(A) < ∞
Ω
hergestellt. Für das Lebesgue–Maß ergibt sich schon hier eine erhebliche Erwei-
terung des Integralbegriffs von Bd. 1, § 23, z.B. ist Ê χ dλ = 0.
Für eine Elementarfunktion ϕ der Form

N
ϕ = ak χAk ,
k=1
wobei die Ak paarweise disjunkte messbare Mengen endlichen Maßes sind, de-
finieren wir

N
ϕ dμ := ak μ(Ak )
Ω k=1
und zeigen in Abschnitt 2, dass dieses Integral linear und monoton ist.

(c) Wir definieren nun das Integral f dμ für beschränkte reellwertige Funk-
Ω
tionen f auf Ω, von denen wir nur voraussetzen, dass das Urbild f −1 (I) beliebi-
ger Intervalle I zu A gehört. Solche Funktionen nennen wir messbar, Näheres
dazu in Abschnitt 3. Einfachheitshalber setzen wir zunächst μ(Ω) < ∞ voraus.
Satz. Zu jeder messbaren Funktion f : Ω → [−M, M ] gibt es eine Folge von

Elementarfunktionen ϕ1 , ϕ2 , . . . mit
−M χΩ ≤ ϕ1 ≤ ϕ2 ≤ . . . ≤ f ,
2 Das μ–Integral für Elementarfunktionen 509
die auf Ω gleichmäßig gegen f konver-

gieren. Wegen
M

ϕ1 dμ ≤ ϕ2 dμ ≤ . . . ≤ M μ(Ω)
Ω Ω
f
existiert ak

f dμ := lim ϕn dμ .
n→∞
Ω Ω
Beweis. ω
Für n ∈
sei N := 2n . Wir untertei-
len [−M, M ] durch die äquidistanten
Teilpunkte
2M
ak := −M + k
N
a1
(k = 0, . . . , N ) in N paarweise dis-
−M
junkte Teilintervalle I0 = [a0 , a1 ] und
Ik = ]ak , ak+1 ] für k = 1, . . . , N − 1.
Da f messbar ist, sind Ak := f −1 (Ik ) zu A gehörige, paarweise disjunkte

Mengen, deren Vereinigung Ω ist. Nach Konstruktion ist

N−1
ϕn := ak χAk
k=0
eine Elementarfunktion mit ϕn ≤ f und f − ϕn ∞ ≤ 2M/N = M · 21−n .

Bei Übergang von n zu n + 1 werden die Ik durch die neu hinzukommenden
Teilpunkte halbiert, und es ergibt sich ϕn ≤ ϕn+1 . (Machen Sie eine Skizze!) 2
Die Unabhängigkeit der Integraldefinition von der approximierenden Folge (ϕn )

und die Ausdehnung der Integraldefinition auf unbeschränkte messbare Funk-
tionen f und nicht endliche Maße μ behandeln wir in Abschnitt 4.
2 Das μ–Integral für Elementarfunktionen

2.1 Elementarfunktionen
(a) Sei im folgenden Ω = ∅ und A eine σ–Algebra auf Ω. Die Mengen aus A
heißen messbar. Eine Funktion ϕ : Ω → Ê
heißt Elementarfunktion, wenn
sie eine Linearkombination

M
ϕ = ai χAi
i=1
charakteristischer Funktionen messbarer Mengen ist.
Definitionsgemäß bilden also die Elementarfunktionen einen Vektorraum über

Ê . Spezialfälle sind charakteristische Funktionen χA mit A ∈ A. Dabei setzen
wir χ∅ = 0 . Beachten Sie im folgenden, dass ÜA
χA∩B = χA · χB = min{χA , χB } ,
χΩ\A = 1 − χA ,
χA∪B = max {χA , χB } und
χA∪B = χA + χB falls A ∩ B = ∅ .
(b) Jede Elementarfunktion ϕ besitzt eine disjunkte Darstellung

N
ϕ = bk χBk mit paarweise disjunkten messbaren Bk .
k=1
7
N
Diese kann so gewählt werden, dass Bk = Ω ÜA , vgl. Bd. 1, § 23 : 1.3.
k=1

N
Für Treppenfunktionen ϕ = ck χIk bedeutet disjunkte Darstellung“ hier,
k=1
”
anders als in Bd. 1, § 23 : 1.3, dass die Quader Ik paarweise disjunkt sind. Hier-
durch wird der Möglichkeit Rechnung getragen, dass Teile von Quaderrändern
positives Maß haben können.
Der Träger supp ϕ einer Elementarfunktion ϕ ist, abweichend von § 10 : 1.1,

definiert als {ω ∈ Ω | ϕ(ω) = 0}, kurz supp ϕ := {ϕ = 0}. Für die oben
wiedergegebene disjunkte Darstellung von ϕ ist supp ϕ die Vereinigung aller
Bk mit bk = 0, also messbar. Aus der disjunkten Darstellbarkeit ergibt sich:
Mit ϕ sind auch |ϕ|, ϕ+ , ϕ− Elementarfunktionen, ebenso f ◦ ϕ für jede auf
ϕ(Ω) erklärte Funktion f .
(c) Für je zwei Elementarfunktionen ϕ, ψ gibt es eine gemeinsame disjunkte

Darstellung

N
N
ϕ = bk χBk , ψ = ck χBk .
k=1 k=1
Daher sind neben aϕ + bψ (a, b ∈ Ê) auch

ϕ · ψ , max{ϕ, ψ} und min{ϕ, ψ}
Elementarfunktionen.
Der Beweis ergibt sich wie in Bd. 1, § 23 : 1.3.
(d) Für zwei Elementarfunktionen ϕ, ψ sind die Mengen
{ϕ = ψ} = supp (ϕ − ψ) und {ϕ > ψ} = supp (ϕ − ψ)+

messbare Mengen. Wir definieren Gleichheit μ–fast überall durch

ϕ = ψ μ–f.ü. : ⇐⇒ μ({ϕ = ψ}) = 0 ,
ϕ ≤ ψ μ–f.ü. : ⇐⇒ μ({ϕ > ψ}) = 0 .

N
Für jede disjunkte Darstellung ϕ = bk χBk gilt offenbar
k=1
ϕ = 0 μ–f.ü. ⇐⇒ bk = 0 für alle Bk mit μ(Bk ) = 0 .
2.2 Das μ–Integral für Elementarfunktionen

Eine Elementarfunktion ϕ heißt μ–integrierbar, wenn μ(supp ϕ) < ∞. Für
μ–integrierbare Funktionen ϕ in disjunkter Darstellung

N
ϕ = bk χBk
k=1
setzen wir

N
ϕ dμ = ϕ(ω) dμ(ω) := bk μ(Bk ) .
Ω Ω k=1
Dass diese Definition Sinn macht, d.h. dass die rechte Seite für jede disjunkte
Darstellung denselben endlichen Wert hat, sehen wir wie folgt ein. Wegen Bk ⊂
supp ϕ für k = 1, . . . , N ist die rechte Seite endlich. Gegeben seien zwei disjunkte
Darstellungen

M
N 7
M 7
N
ϕ = ai χAi = bk χBk mit Ai = Bk = Ω .
i=1 k=1 i=1 k=1
Dann sind Ai , Bk Vereinigungen paarweise disjunkter messbarer Mengen,

7
N 7
M
Ai = Ai ∩ Bk , Bk = Ai ∩ Bk , somit
k=1 i=1

N
M
χAi = χAi ∩Bk , χBk = χAi ∩Bk und daraus
k=1 i=1
M
N
M
N
ai χAi ∩Bk = ϕ = bk χAi ∩Bk .
i=1 k=1 i=1 k=1
Es folgt ai = bk , falls μ(Ai ∩Bk ) > 0, und damit wegen der endlichen Additivität

M
M
N
N
M
ai μ(Ai ) = ai μ(Ai ∩ Bk ) = bk μ(Ai ∩ Bk )
i=1 i=1 k=1 k=1 i=1

N
= bk μ(Bk ) .
k=1
2.3 Eigenschaften des μ–Integrals für Elementarfunktionen

(a) Die μ–integrierbaren Elementarfunktionen bilden einen mit E (μ) bezeich-
Ê
neten Vektorraum über . Für ϕ, ψ ∈ E (μ) und a, b ∈ gilt Ê

(aϕ + bψ) dμ = a ϕ dμ + b ψ dμ .
Ω Ω Ω
Daher gilt auch für nicht disjunkte Darstellungen von ϕ ∈ E(μ)

M
M
ϕ = ai χAi =⇒ ϕ dμ = ai μ(Ai ) .
i=1 Ω i=1
(b) Für ϕ, ψ ∈ E(μ) gilt

ϕ ≤ ψ μ–f.ü. =⇒ ϕ dμ ≤ ψ dμ .
Ω Ω
(c) Mit ϕ gehört auch |ϕ| zu E (μ), und es gilt

ϕ dμ ≤ |ϕ| dμ .
Ω Ω

(d) Aus ϕ ∈ E (μ) und ψ = ϕ μ–f.ü. folgt ψ ∈ E (μ) und ϕ dμ = ψ dμ .
Ω Ω

(e) Aus |ϕ| dμ = 0 folgt ϕ = 0 μ–f.ü.
Ω
Beweis als ÜA : Die Aussagen (a), (b), (d) ergeben sich aus einer gemeinsamen
disjunkten Darstellung. Für (d) und (e) ist 2.1 (d) zu beachten. 2
2.4 Beispiele
Ê
(a) Treppenfunktionen im n sind spezielle Elementarfunktionen, die bezüg-
lich des Lebesgue–Maßes λn = V n integrierbar sind. Aus 2.3 (a) ergibt sich

ϕ dV n = ϕ(x) dn x ,
Ên Ên
wobei die rechte Seite im herkömmlichen Sinn zu verstehen ist (Bd. 1, § 23 : 1.4).
(b) Das Dirac–Maß δa . Für Borelmengen B ⊂ Ê n

definieren wir
(
1, falls a ∈ B
δa (B) =
0 sonst.
Für jede Elementarfunktion ϕ auf Ω = Ên

bezüglich A = B( Ê ) gilt
n
ÜA

ϕ dδa = ϕ(a) .
Ên
Um die Punktauswertung ϕ → ϕ(a) als Integral aufzufassen, ist es also unnötig,

eine Dirac–Funktion“ δ ins Spiel zu bringen mit
”

ϕ(a) = δ(x − a) ϕ(x) dn x .
Ê n
(c) Diskrete Verteilungen. Seien x0 , x1 , . . . abzählbar viele verschiedene

∞
reelle Zahlen und p1 , p2 , . . . nichtnegative Zahlen mit pk = 1. Für Borel-
mengen B ⊂ Ê sei k=0

∞
μ(B) = pk = pk χB (xk ) .
xk ∈B k=0
Nach der Definition § 19 : 9.1 (c) ist also

∞
μ = p k δx k .
k=0
Wegen der Endlichkeit von μ ist jede Elementarfunktion ϕ μ–integrierbar, und

es gilt

∞
ϕ dμ = ϕ(xk ) pk ,
Ê k=0
wobei die Reihe absolut konvergiert.

Es zeigt sich später, dass diese Formel für alle μ–integrierbaren Funktionen ϕ
gilt. Insbesondere sind Erwartungswert μ / und Varianz V (μ), falls sie existieren,
als μ–Integrale darstellbar:

/=
μ x dμ(x) , V (μ) = /)2 dμ(x) .
(x − μ
Ê Ê
Beweis.

N 7
N
Sei ϕ = bi χBi eine disjunkte Darstellung mit Bi = Ω. Dann gilt
i=1 i=1

N
N
∞
∞
N
ϕ dμ = bi μ(Bi ) = bi pk χBi (xk ) = pk bi χBi (xk ) .
Ê i=1 i=1 k=0 k=0 i=1
Dabei ist

ϕ(xk ) falls xk ∈ Bi ,
bi χBi (xk ) =
0 sonst.
Da jedes xk in genau einer der Mengen Bi liegt folgt

N
bi χBi (xk ) = ϕ(xk ) für k = 1, 2, . . .
i=1
und damit die Behauptung. Die absolute Konvergenz der Reihe folgt wegen
| ϕ(xk ) pk | ≤ ϕ∞ pk aus dem Majorantenkriterium.
3 Messbare Funktionen
3.1 Definitionen, Bezeichnungen
(a) Gegeben sei eine σ–Algebra A auf einer nichtleeren Menge Ω. Eine Funktion
Ê
f : Ω → heißt messbar (genauer A–messbar), wenn für jedes Intervall I das
Urbild f −1 (I) zu A gehört, vgl. 1 (c).
Eine komplexwertige Funktion heißt messbar, wenn Real– und Imaginärteil
messbar sind.
(b) Für Funktionen f : Ω → Ê führen wir folgende Bezeichnungen ein:

{f ∈ B} := {ω ∈ Ω | f (ω) ∈ B} = f −1 (B) ,
{f ≤ β} := {ω ∈ Ω | f (ω) ≤ β} = f −1 (] − ∞, β]) ,
{α < f ≤ β} := {ω ∈ Ω | α < f (ω) ≤ β} ,
entsprechend {f = α}, {f > α} usw.
3.2 Charakterisierungen messbarer Funktionen

Satz. Für eine Funktion f : Ω → Ê sind folgende Aussagen äquivalent:
(a) f ist A–messbar,
(b) {f ≤ β} ∈ A für jedes β ∈ Ê,
(c) {f ≥ α} ∈ A für jedes α ∈ Ê,
(d) {f ∈ I} ∈ A für jedes Intervall I eines speziellen Typs,
(e) {f ∈ B} ∈ A für jede Borelmenge B ⊂ Ê,
(f) {f ∈ U } ∈ A für jede offene Menge U ⊂ Ê.
Beweis.
Für eine beliebige Funktion f : Ω → Ê
ist Σ := {M ⊂ | f −1 (M ) ∈ A} eine Ê
Ê Ê Ê
σ–Algebra auf . Denn es gilt f ( ) = Ω, f −1 ( \ M ) = Ω \ f −1 (M ), sowie
−1
7
∞ 7
∞ -
∞ -
∞
f −1 ( Ai ) = f −1 (Ai ) , f −1 ( Bj ) = f −1 (Bj )
i=1 i=1 j=1 j=1
für beliebige Teilmengen Ai , Bj von Ê ÜA .

3 Messbare Funktionen 515
Enthält Σ alle Intervalle eines der in (a) bis (d) genannten Typen, so enthält Σ
nach § 19 : 5.4 alle Borelmengen. Auch aus (f) folgt (e): Enthält Σ alle offenen
Mengen, so enthält Σ alle Intervalle vom Typ ]α, β[. Umgekehrt folgen aus (e)
alle übrigen Aussagen. 2
3.3 Beispiele, Folgerungen

(a) Elementarfunktionen sind messbar.

N 7
N
Denn für ϕ = bk χBk mit paarweise disjunkten Bk ∈ A und Ω = Bk
7
k=1 k=1
gilt ϕ−1 (I) = Bk ∈ A für jedes Intervall I.
bk ∈I
Ê
(b) Jede auf einer Borelmenge Ω ⊂ n stetige Funktion f : Ω → Ê ist Borel–
messbar (d.h. B(Ω)–messbar) und Lebesgue–messbar.
Denn für f ∈ C(Ω) gilt {f ≤ β} = Ω ∩ {f ≤ β} für alle β ∈ ÜA . Die Ê
Behauptung folgt aus 3.2 (b), da abgeschlossene Mengen Borelmengen und somit
auch Lebesgue–messbar sind.
(c) Mit f ist auch −f messbar, da in 3.2 die Bedingungen (a), (b), (c) äqui-
valent sind.
(d) Mit f : Ω → Ê ist auch αf + β für α, β ∈ Ê messbar ÜA .
(e) Die Hintereinanderausführung messbarer Funktionen ist messbar : Sei A ei-

ne σ–Algebra auf Ω, B eine σ–Algebra auf Ω ; f : Ω → Ê
sei B–messbar und
g −1 (B) ∈ A für alle B ∈ B. Dann folgt nach 3.2 (e) die A–Messbarkeit von
f ◦ g.
(f) Mit f sind auch f+ , f− und |f | messbar. Denn {f+ ≤ β} = ∅ für β < 0,
und {f+ ≤ β} = {f ≤ β} für β ≥ 0. Entsprechend für f− . Schließlich gilt
{|f | ≤ β} = ∅ für β < 0 und {|f | ≤ β} = {f ≤ β} ∩ {−f ≤ β} für β ≥ 0.
3.4 Supremum und Limes messbarer Funktionenfolgen

(a) Für eine Folge von Funktionen fn : Ω → Ê sagen wir, dass
g := sup {fn | n ∈ Æ} existiert,
wenn für jedes ω ∈ Ω die Folge (fn (ω)) nach oben beschränkt ist, also ein
mit g(ω) bezeichnetes Supremum besitzt. Entsprechend soll die Aussage h =
Æ
inf{fn | n ∈ } existiert“ verstanden werden.
”
Æ
Satz. Existiert g = sup { fn | n ∈ } für eine Folge messbarer Funktionen
Ê Æ
fn : Ω → , so ist g messbar. Existiert h = inf{fn | n ∈ }, so ist h messbar.
Beweis.
-
∞
(i) Es gilt {g ≤ β} = {fn ≤ β} ÜA . Mit den Mengen {fn ≤ β} gehört
n=1
auch ihr Durchschnitt zu A. Also ist g nach 3.2 (b) messbar.
-
∞
(ii) Die zweite Behauptung folgt aus {h ≥ α} = {fn ≥ α} ÜA und aus
n=1
3.2 (c). 2
(b) Satz. Konvergieren messbare Funktionen fn : Ω → Ê

punktweise gegen
eine Funktion f , d.h. fn (ω) → f (ω) für alle ω ∈ Ω, so ist f messbar.
Der Beweis stützt sich auf folgendes
Lemma. Der Grenzwert a einer konvergenten reellen Zahlenfolge (an ) lässt sich
darstellen durch
a = inf sup am .
n∈ m≥n
Aus diesem ergibt sich die Behauptung des Satzes mit am = fm (ω), gn (ω) =
Æ
sup{fm (ω) | m ≥ n} und f (ω) = inf{gn (ω) | n ∈ } mit Hilfe von (a).
Zum Beweis des Lemmas beachten wir, dass konvergente Folgen beschränkt
sind. Also existieren die Suprema
bn := sup { am | m ≥ n} für n = 1, 2, . . . .
Die Folge (bn ) fällt monoton und ist durch inf{am | m ∈ Æ} nach unten be-
schränkt, also existiert b := lim bn = inf{bn | n ∈ }.
n→∞
Æ
Wegen bn ≥ an gilt b = lim bn ≥ lim an = a.
n→∞ n→∞
Zu gegebenem ε > 0 gibt es ein nε mit am < a + ε für m ≥ nε . Es folgt

b ≤ bn = inf{ am | m ≥ n} < a + ε für n ≥ nε .
Für ε → 0 erhalten wir b ≤ a, also insgesamt a = b. 2
3.5 Approximation messbarer Funktionen durch Elementarfunktio-

nen
Eine Funktion f : Ω → Ê
heißt positiv ( f ≥ 0 ) wenn f (ω) ≥ 0 für alle
ω ∈ Ω. Wir definieren f ≤ g durch g − f ≥ 0. Eine Funktionenfolge (fn ) heißt
aufsteigend, wenn fn ≤ fn+1 für n = 1, 2, . . . .
Ausgangspunkt für die Definition des μ–Integrals ist der folgende
Satz. (a) Jede beschränkte messbare Funktion f : Ω → Ê ist gleichmäßiger
Limes einer aufsteigenden Folge von Elementarfunktionen.
3 Messbare Funktionen 517
(b) Für einen σ–endlichen Maßraum (Ω, A, μ) ist jede positive messbare Funk-
tion f auf Ω punktweiser Limes einer aufsteigenden Folge μ–integrierbarer,
positiver Elementarfunktionen.
(c) Folgerung. Eine Funktion f : Ω → Ê
ist genau dann messbar, wenn sie
punktweiser Limes einer Folge von Elementarfunktionen ist.
Beweis.
(a) wurde in Abschnitt 1 gezeigt. Die dortige Voraussetzung μ(Ω) < ∞ sollte
nur die μ–Integrierbarkeit der approximierenden Elementarfunktionen sichern.
Diese sind nach Konstruktion positiv, wenn f positiv ist.
(b) Wegen der σ–Endlichkeit von μ gibt es Mengen Ωn ∈ A mit μ(Ωn ) < ∞,
7
∞
so dass Ω1 ⊂ Ω2 ⊂ . . . und Ω = Ωn . Für die Mengen
n=1
Bn := Ωn ∩ {f ≤ n} ∈ A
7
∞
gilt ebenfalls μ(Bn ) < ∞, B1 ⊂ B2 ⊂ . . . und Ω = Bn . Die Funktionen
n=1
fn := f χBn
sind positiv und aufgrund der Bedingung 3.2 (c) messbar:
{fn ≥ α} = Ω für α ≤ 0 und
{fn ≥ α} = Bn ∩ {f ≥ α} für α > 0 ,
denn für α > 0 gilt {fn ≥ α} ⊂ Bn , und auf Bn gilt fn (ω) = f (ω). Nach (a)
gibt es Elementarfunktionen ψn mit
1 χ
0 ≤ ψn ≤ fn ≤ ψn + Ω.
n
Wegen supp ψn ⊂ Ωn sind die ψn und damit auch die ϕn = sup{ψ1 , . . . , ψn }
μ–integrierbare Elementarfunktionen, und es gilt
0 ≤ ϕ1 ≤ ϕ2 ≤ . . . ≤ f .
Zu jedem ω ∈ Ω gibt es ein N ∈ Æ mit ω ∈ BN . Dann gilt auch ω ∈ Bn für
n ≥ N , also
1
0 ≤ f (ω) − ϕn (ω) ≤ f (ω) − ψn (ω) ≤ → 0 für n → ∞ .
n
(c) Elementarfunktionen sind messbar, also ist nach 3.4 (b) auch jeder punkt-
weise Limes von Elementarfunktionen messbar. Ist umgekehrt f : Ω → Ê
messbar, so sind auch f+ , f− messbar, also nach (b) punktweise Limites (μ–
integrierbarer) Elementarfunktionen. 2
3.6 Weitere Eigenschaften messbarer Funktionen

(a) Die komplexwertigen messbaren Funktionen bilden einen Vektorraum. Mit
f, g ist auch f · g messbar. Setzen wir für eine messbare Funktion f : Ω →
(
1/f (ω) falls f (ω) = 0
h(ω) :=
0 sonst ,
so ist h messbar.
Beweis.
Seien f, g : Ω → messbar. Nach 3.5 (c) gibt es dann Elementarfunktionen
ϕn , ψn mit ϕn → f , ψn → g punktweise auf Ω. Nach 3.5 (c) sind dann auch
αf + βg = lim (αϕn + βψn ) und f · g = lim ϕn · ψn

n→∞ n→∞
messbar. Da die Menge {f = 0} = {f > 0} ∪ {f < 0} messbar ist, ergibt sich

auch die Messbarkeit von h nach den Kriterien 3.2 (b), (c) ÜA .
Die Übertragung auf komplexwertige Funktion sei den Lesern als ÜA über-
lassen. 2
(b) Fast überall konvergierende Folgen messbarer Funktionen. Eine Folge mess-
barer Funktionen fn : Ω →
heißt konvergent μ–f.ü., wenn es eine μ–
Nullmenge N gibt, so dass die Folge (fn (ω)) für alle ω ∈ Ω \ N konvergiert. In
diesem Fall ist durch
(
lim fn (ω) für ω ∈ Ω \ N ,
f (ω) := n→∞
0 für ω ∈ N
eine messbare Funktion f gegeben, denn die Folge fn · χΩ\N konvergiert überall
gegen f . Wir schreiben hierfür f = lim fn μ–f.ü.
n→∞
(c) Fast überall differenzierbare Funktionen. Sei f auf dem Intervall I messbar
und fast überall differenzierbar, d.h. es gebe eine Lebesgue–Nullmenge N , so
dass f (x) für alle x ∈ I \ N existiert. Definieren wir f (x) := 0 für x ∈ N ,
so erhalten wir eine (Lebesgue–)messbare Funktion f : I → . Wir zeigen
dies für Intervalle I = ]a, b[. Da d(x) := 12 dist (x, ∂I) stetig ist, sind durch

n
fn (x) = d(x) f (x + d(x)
n
) − f (x) für x ∈ I \ N bzw. fn (x) = 0 für x ∈ N
messbare Funktionen fn : I → gegeben mit fn (x) → f (x) für alle x ∈ I.
Den Beweis für andere Intervalltypen überlassen wir den Lesern als ÜA .
Entsprechend definieren wir partielle Ableitungen fast überall.
4 Das μ–Integral 519
(d) Zusammenfassung. Durch Anwendung algebraischer Operationen, durch

Hintereinanderausführung, durch Supremumsbildung und durch Grenzübergänge
entstehen aus messbaren Funktionen wieder messbare. Nicht messbare Funktio-
nen lassen sich nicht konstruieren.
Ê
Dass es auch Funktionen auf dem n gibt, die nicht Lebesgue–messbar sind,
liegt an der Existenz nicht Lebesgue–messbarer Mengen. (Der Beweis hierfür
erfordert nichtkonstruktive Mittel, vgl. Barner–Flohr [141] 15.2.)
Ê
Ist V ⊂ n nicht Lebesgue–messbar, so gilt dies auch für V c = n \ V . Dann Ê
ist f := χV − χV c nicht Lebesgue–messbar wegen {f ≥ 1} = V . Dagegen sind
|f | und damit auch |f |2 messbar.
Aus der Messbarkeit von |f | darf nicht auf die Messbarkeit von f geschlossen
werden.
4 Das μ–Integral
4.1 Das μ–Integral für positive messbare Funktionen
Durch (Ω, A, μ) sei ein σ–endliches Maß μ gegeben. Dann gibt es nach 3.5 zu
Ê
jeder A–messbaren Funktion f : Ω → + eine aufsteigende Folge positiver
μ–integrierbarer Elementarfunktionen ϕn , die auf Ω punktweise gegen f kon-
vergieren. Jede solche Folge nennen wir integraldefinierend
für f . Ist die nach
2.3 monoton wachsende Folge der μ–Integrale ϕn dμ nach oben beschränkt,
Ω
so heißt f μ–integrierbar, und das μ–Integral von f ist definiert durch

f dμ := lim ϕn dμ .
n→∞
Ω Ω

Ist f nicht μ–integrierbar, so schreiben wir f dμ = ∞ .
Ω
Die Wahl der integraldefinierenden Folge (ϕn ) spielt dabei keine Rolle. Denn
für jede andere integraldefinierende Folge (ψn ) für f gilt
ϕm (ω) ≤ lim ψn (ω) = f (ω) , ψm (ω) ≤ lim ϕn (ω) = f (ω)
n→∞ n→∞
für alle m ∈ und alle ω ∈ Ω. Mit dem nachfolgenden Lemma folgt

ϕm dμ ≤ lim ψn dμ , ψm dμ ≤ lim ϕn dμ ;
n→∞ n→∞
Ω Ω Ω Ω
daraus ergibt sich für m → ∞ die Gleichheit der Grenzwerte beider Integralfol-
gen bzw. deren simultane Divergenz.
Lemma. Seien ψ, ϕ1 , ϕ2 , . . . positive, μ–integrierbare Elementarfunktionen

mit 0 ≤ ϕ1 ≤ ϕ2 ≤ . . . ,
ψ(ω) ≤ lim ϕn (ω) für alle ω ∈ Ω .
n→∞
Dann gilt

ψ dμ ≤ lim ϕn dμ ,
n→∞
Ω Ω

wobei diese Ungleichung auch als erfüllt gilt, wenn lim ϕn dμ = ∞.
n→∞
Ω
Beweis.
Für ψ = 0 ist nichts zu beweisen; sei also ψ = 0. Wir definieren
P := {ψ > 0} , α := min{ψ(ω) | ω ∈ P } , β := max{ψ(ω) | ω ∈ P } .
Da ψ messbar und μ–integrierbar ist, gilt P ∈ A und μ(P ) < ∞, ferner gilt
0 < α ≤ β. Sei ε ∈ ]0, α[ vorgegeben. Dann gehören die Mengen
An = {ϕn ≥ ψ − ε} ∩ P und Bn := P \ An
7
∞
zu A. Ferner gilt A1 ⊂ A2 ⊂ . . . und P = An nach Voraussetzung. Aus
n=1
§ 19 : 6.3 folgt
μ(P ) = lim μ(An ) , lim μ(Bn ) = μ(P ) − lim μ(An ) = 0 .

n→∞ n→∞ n→∞
Nach Definition der An und wegen ϕn ≥ 0 gilt
ϕn ≥ (ψ − ε) χAn ,
also
ϕn + (ψ − ε) χBn ≥ (ψ − ε) χP = ψ − ε χP
und daraus
ϕn + (β − ε) χBn + ε χP ≥ ϕn + (ψ − ε) χBn + ε χP ≥ ψ .
Es folgt

ψ dμ ≤ ϕn dμ + (β − ε) μ(Bn ) + ε μ(P ) und für n → ∞ ,
Ω Ω

ψ dμ ≤ sup ϕn dμ n ∈ + ε μ(P ) für jedes ε > 0 . 2
Ω Ω
4.2 Das μ–Integral für komplexwertige Funktionen

(a) Eine messbare Funktion f : Ω → Ê
heißt μ–integrierbar, wenn f+ und
f− beide μ–integrierbar sind. Wir definieren in diesem Fall

f dμ := f+ dμ − f− dμ .
Ω Ω Ω
(b) Eine komplexwertige messbare Funktion f auf Ω heißt μ–integrierbar,

wenn u = Re f und v = Im f beide μ–integrierbar sind. Wir setzen dann

f dμ := u dμ + i v dμ .
Ω Ω Ω

(c) Statt f dμ schreiben wir auch f (ω) dμ(ω) bzw.
Ω Ω

f (x) dμ(x) , falls Ω ⊂ Ê und f (x) dμ(x) , falls Ω ⊂ Ê n
.
Ω Ω
4.3 Elementare Eigenschaften des μ–Integrals

(a) Die komplexwertigen μ–integrierbaren Funktionen auf Ω bilden einen –
Vektorraum, bezeichnet mit L1 (Ω, μ). Für f, g ∈ L1 (Ω, μ) und α, β ∈ gilt

(αf + βg) dμ = α f dμ + β g dμ .
Ω Ω Ω
(b) Für reellwertige f, g ∈ L1 (Ω, μ) gilt

f ≤ g =⇒ f dμ ≤ g dμ .
Ω Ω
(c) Mit f ist auch |f | μ–integrierbar, und es gilt

f dμ ≤ |f | dμ .
Ω Ω
Bemerkungen. (i) In den späteren Anwendungen gehört zum Maß μ immer

eine kanonische σ–Algebra A, daher erübrigt sich die genauere Kennzeichnung
L1 (Ω, A, μ).
(ii) Statt L1 (Ω, V n ) schreiben wir L1 (Ω).
Beweis.

Wir verwenden die Abkürzung f für f dμ, L1 für L1 (Ω, μ) und L1+ für
Ω
{f ∈ L1 | f ≥ 0}.
(a) Unmittelbar aus der Definition 4.1 und der Linearität des μ–Integrals für
Elementarfunktionen folgt

f, g ∈ L1+ , α, β ∈ + =⇒ αf + βg ∈ L1+ und
(1)
(αf + βg) = α f +β g.
Wir betrachten zunächst nur reellwertige Funktionen f, g und zeigen als erstes

(2) f ∈ L1 , α ∈ =⇒ αf ∈ L1 und αf = α f.

Für f ∈ L1 gilt definitionsgemäß f+ , f− ∈ L1+ und f = f+ − f− . Für
α ≥ 0 folgt
αf+ , αf− ∈ L1+ , αf = αf+ − αf− ∈ L1 und mit (1)

αf = αf+ − αf− = α f+ − α f− = α f+ − f− = α f.
Für α < 0 gilt (αf )+ = |α|f− ∈ L1+ , (αf )− = |α|f+ ∈ L1+ und somit
αf = |α|f− − |α|f+ ∈ L1 sowie mit (1)

αf = |α|f− − |α|f+ = |α|( f− − f+ ) = −|α| f =α f.
Als nächstes zeigen wir für reellwertige f, g

(3) f, g ∈ L1 =⇒ f + g ∈ L1 und (f + g) = f+ g.
Hierzu schreiben wir F := f + g in der Form
F = u−v mit u = f+ + g+ , v = f− + g− .
Nach (1) gilt u, v ∈ L1+ und

(4) u = f+ + g+ , v = f− + g− .
Wir betrachten integraldefinierende Folgen
(ϕn ) für u , (ψn ) für v , (Φn ) für F+ , (Ψn ) für F− .
Durch
ξn := min{ϕn , Φn } , ηn := min{ψn , Ψn }
erhalten wir aufsteigende Folgen (ξn ), (ηn ) von L1+ –Elementarfunktionen. We-
gen F+ ≤ u, F− ≤ v gilt punktweise
F+ = lim ξn = sup, {ξn | n ∈

n→∞
} , F− = lim ηn = sup, {ηn | n ∈
n→∞
} ,
ferner

ξn ≤ ϕn ≤ u, ηn ≤ ψn ≤ v.
Aus der Definition 4.1 folgt F+ , F− ∈ L1+ , und aus (1) erhalten wir

(5) F+ + v = (F+ + v) = (F− + u) = F− + u.
Mit Hilfe von (4), (5) ergibt sich schließlich

(f + g) = F = F+ − F− = u− v

= f+ + g+ − f− − g− = f+ g.
Daraus und aus (2) folgt (a) für reelle Funktionen und α, β ∈ . Die Über-Ê
tragung von (a) ins Komplexe bereitet nunmehr keine Schwierigkeiten ÜA .
(b)
Sind f,g reellwertige
L1 –Funktionen mit f ≤ g, so gilt h := g − f ∈ L1+
und h = g − f nach (a). Wegen h ∈ L1+ gilt h ≥ 0 nach 4.1.
(c) Für reellwertige f ∈ L1 gilt definitionsgemäß f+ , f− ∈ L1+ . Nach (a) folgt

|f | = f+ + f− ∈ L1+ und

f = f+ − f− ≤ f+ + f− = |f | .
Für komplexwerige Funktionen f ∈ L1 ergibt sich die μ–Integrierbarkeit von |f |

erst später mittels des Majorantenkriteriums. Unter Vorwegnahme von |f | ∈ L1+
setzen wir f = r eiϕ und erhalten mit (a), 4.2 (b) und dem Vorangehenden

f = r = Re e−iϕ f = Re e−iϕ f = Re (e−iϕ f )
−iϕ
≤ |e f| = |f | . 2
4.4 Die Rolle von μ–Nullmengen für die Integration

(a) Eine Eigenschaft E(ω) wie f (ω) = g(ω), f (ω) ≤ g(ω) f (ω) = lim fn (ω)
n→∞
heißt μ–fast überall erfüllt, wenn es eine μ–Nullmenge N gibt, so dass E(ω)
für alle ω ∈ Ω \ N besteht. Wir verwenden die Schreibweisen
f = g μ–f.ü., f ≤ g μ–f.ü., f = lim fn μ–f.ü. usw.

n→∞
Beachten Sie: E(ω) μ–fast überall bedeutet beim Lebesgue–Maß μ = V n (wie

bei jedem vollständigen Maß), dass die Ausnahmemenge { ω | E(ω) gilt nicht}
eine μ–Nullmenge ist. Fast überall (f.ü.) steht für V n –fast überall.
(b) Satz. Ist f : Ω → μ–integrierbar, g : Ω → messbar und f = g μ–f.ü.,

so ist auch g μ–integrierbar, und es gilt

g dμ = f dμ .
Ω Ω
Sind f, g ∈ L1 (Ω, μ) reellwertig, so gilt

f ≤ g μ–f.ü. =⇒ f dμ ≤ g dμ .
Ω Ω
Beweis.
(i) Wir zeigen zunächst: Ist h messbar und h = 0 μ–f.ü., so gilt

h ∈ L1 (Ω, μ) und h dμ = 0 .
Ω
Im Fall h ≥ 0 folgt dies aus der Definition 4.1, denn für jede
μ–integrierbare
Elementarfunktion ϕ mit 0 ≤ ϕ ≤ h gilt ϕ = 0 μ–f.ü., also ϕ dμ = 0.
Ω
Für reellwertige messbare h mit h = 0 μ–f.ü. gilt auch h+ = 0 μ–f.ü. und h− = 0

μ–f.ü., woraus nach dem Vorangehenden die μ–Integrierbarkeit von h+ , h− und
das Verschwinden deren μ–Integrale folgt.
Im allgemeinen Fall h = u + iv folgt aus h = 0 μ–f.ü. auch u = 0 μ–f.ü. und
v = 0 μ–f.ü. (und umgekehrt).
(ii) Sei f ∈ L1 (Ω), g messbar und N eine μ–Nullmenge mit f (ω) = g(ω) für
ω ∈ Ω \ N . Dann gilt g = f + (g − f ) · χN ; dabei ist h := (g − f )χN eine messbare
Funktion mit h = 0 μ–f.ü.. Nach (i) und 4.3 (a) folgt die μ–Integrierbarkeit von
g und die Gleichheit der μ–Integrale von f und von g.
(iii) Für die reellwertigen Funktionen f, g ∈ L1 (Ω, μ) sei f ≤ g μ–f.ü.. Dann
gibt es eine μ–Nullmenge N mit f (ω) ≤ g(ω) auf Ω \ N . Wir setzen
M := Ω \ N , F := f · χM , G := g · χM .
Dann gilt F = f μ–f.ü., G = g μ–f.ü. und F (ω) ≤ G(ω) für alle ω ∈ Ω. Nach
(ii) folgt F, G ∈ L1 (Ω, μ), und aus 4.3 (b) ergibt sich

f dμ = F dμ ≤ G dμ = g dμ . 2
Ω Ω Ω Ω
4.5 Das Majorantenkriterium

Satz. Besitzt eine messbare Funktion f : Ω → eine μ–Majorante g, das ist
eine μ–integrierbare Funktion g : Ω → + mit Ê
| f (ω) | ≤ g(ω) μ–f.ü.,
so ist auch f μ–integrierbar, und es gilt

f dμ ≤ g dμ .
Ω Ω
Dies ist das Hauptkriterium für μ–Integrierbarkeit. Typische Anwen-

dungssituationen sind:
(i) f ist Lebesgue–messbar und besitzt eine stetige V n –Majorante g. Für ste-
tige Funktionen lässt sich die Lebesgue–Integrierbarkeit nach den Kriterien von
Bd. 1, § 23 feststellen, Näheres in 5.5.
(ii) Ω hat endliches Maß und |f | ≤ C μ–f.ü. mit einer Konstanten C. Dann ist

g = C · χΩ eine μ–Majorante und f dμ ≤ C μ(Ω).
Ω
5 Vertauschbarkeit von Limes und Integral 525
Bemerkung. Aus dem Majorantenkriterium folgt:

Ist f messbar und |f | μ–integrierbar, so ist auch f μ–integrierbar. Allein die
μ–Integrierbarkeit von |f | impliziert nicht die Messbarkeit von f , vgl. 3.6 (d).
Beweis.
(i) Besitzt f eine μ–Majorante g ∈ L1 (Ω, μ), so dürfen wir annehmen, dass
|f (ω)| ≤ g(ω) für alle ω ∈ Ω, denn Nullsetzen von f auf einer μ–Nullmenge
berührt weder die Integrierbarkeit noch das Integral.
(ii) Wir setzen zunächst voraus, dass f messbar ist und dass 0 ≤ f ≤ g gilt mit

C = g dμ < ∞ .
Ω
Nach 4.1 gibt es integraldefinierende Folgen (ϕn ) für f , (ψn ) für g. Wegen
g(ω) = sup {ψn (ω) | n ∈ } ≥ f (ω) ≥ ϕ m (ω) für alle ω ∈ Ω
sind die Voraussetzungen des Lemmas in 4.1 erfüllt, und wir erhalten

ϕm dμ ≤ sup ψn dμ n ∈ = g dμ = C .
Ω Ω Ω

Aus der Definition 4.1 folgt für die μ–Integrierbarkeit von f und f dμ ≤ C.
Ω
(iii) Ist f reellwertig und messbar mit μ–Majorante g, so ist g auch eine μ–
Majorante für f+ und für f− , also sind diese Funktionen und somit auf f und
|f | μ–integrierbar. Die Integralabschätzung folgt aus 4.3 (b).
(iv) Hat die komplexwertige messbare Funktion f = u + iv die μ–Majorante g,
so ist g auch eine μ–Majorante für die Funktionen u, v; nach (iii) sind diese und
damit auch f μ–integrierbar. Die Integralabschätzung folgt nach 4.3 (c). 2
5 Vertauschbarkeit von Limes und Integral

5.1 Der Satz von der monotonen Konvergenz (Satz von Beppo Levi)
Ist (fn ) eine aufsteigende Folge
μ–integrierbarer, reellwertiger Funktionen und
ist die Folge der Integrale fn dμ nach oben beschränkt, so gibt es eine μ–
Ê mit
Ω
integrierbare Funktion f : Ω →
f = lim fn μ–f.ü.
n→∞
und

f dμ = lim fn dμ .
n→∞
Ω Ω
Dabei ist die Ausnahmemenge { ω ∈ Ω | fn (ω) divergiert } eine μ–Nullmenge.

Folgerungen.
(a) Sind die Funktionen uk : Ω →
∞
Ê + (k = 0, 1, . . .) μ–integrierbar und kon-

∞
vergiert die Reihe uk dμ , so konvergiert die Reihe uk μ–f.ü. gegen
k=0 Ω k=0
eine μ–integrierbare Funktion u, und es gilt
∞

u dμ = uk dμ .
Ω k=0 Ω

(b) Ist f μ–integrierbar und |f | dμ = 0, so ist f = 0 μ–f.ü., d.h. die Aus-
Ω
nahmemenge {f = 0} ist eine μ–Nullmenge.
Beweis.
(a) Wegen der Linearität und Monotonie
des μ–Integrals dürfen wir o.B.d.A.
voraussetzen, dass fn ≥ 0 und 0 ≤ fn dμ ≤ C für alle n ∈ .
Ω
(b) Konvergenz μ–f.ü.. Sei N = {ω ∈ Ω | (fn (ω)) divergiert}. Da die Folge

(fn (ω)) monoton wächst, gilt ω ∈ N genau dann, wenn es zu jedem m ∈
ein n ∈
gibt, mit fn (ω) ≥ m. Also gilt
-
∞ 7
∞
N = {fn ≥ m} ∈ A ,
m=1 n=1
denn wegen der Messbarkeit der fn gilt An,m := {fn ≥ m} ∈ A, somit auch
7
∞ -
∞
Bm = An,m ∈ A und N = Bm ∈ A .
n=1 m=1
Wegen fn ≥ 0 gilt m χAn,m ≤ fn , daher nach 4.3 (b)

C
m μ(An,m ) ≤ fn dμ ≤ C , d.h. μ(An,m ) ≤ .
Ω
m
7
∞
Aus An,m ⊂ An+1,m und Bm = An,m folgt nach § 19 : 6.3 (a)
n=1
C
μ(Bm ) = lim μ(An,m ) ≤ für m = 1, 2, . . . ,
n→∞ m
-
∞
insbesondere μ(B1 ) < ∞. Wegen B1 ⊃ B2 ⊃ . . . und N = Bm ergibt
m=1
§ 19 : 6.3 (b)
μ(N ) = lim μ(Bm ) = 0 .

m→∞
(c) Die Grenzfunktion f . Nach 3.6 (b) ist durch

(
lim fn (ω) für ω ∈ M := Ω \ N,
f (ω) := n→∞
0 für ω ∈ N
eine messbare Funktion f ≥ 0 gegeben, die punktweiser Limes der Funktionen

gn := fn · χM ist. Für letztere gilt g1 ≤ g2 ≤ . . . ≤ f und nach 4.4

gn ∈ L1 (Ω, μ) , gn dμ = fn dμ (n ∈ ) .
Ω Ω
(d) Seien (ϕn,m )m integraldefinierende Folgen für gn (n = 1, 2, . . .). Dann

gilt ϕn,m ≥ 0, ϕn,m (ω) = 0 für ω ∈ N . Wir betrachten die positiven, μ–
integrierbaren Elementarfunktionen
ψm := max {ϕ1,m , . . . , ϕm,m } .
Wegen 0 ≤ ϕk,m ≤ ϕk,m+1 ≤ gk ≤ gm für k ≤ m erhalten wir
ϕn,m ≤ ψm für n ≤ m, ψm ≤ ψm+1 und ψm ≤ gm , also
gm = sup ϕn,m ≤ sup ψm ≤ sup gm = f .

m m m
Da die gn punktweise gegen f konvergieren, folgt
f = sup ψm = lim ψm .
m m→∞
Wegen ψm ≤ gm gilt ferner

ψm ≤ gm = fm ≤ C .
Ω Ω Ω
Nach 4.1 folgt die μ–Integrierbarkeit von f und

f dμ = lim ψn dμ ≤ lim gn dμ = lim fn dμ ,
n→∞ n→∞ n→∞
Ω Ω Ω Ω

wobei sich die Existenz des letzteren Grenzwerts aus fn dμ ≤ fn+1 dμ ≤ C
Ω Ω
ergibt. Umgekehrt gilt gn ≤ f , also

fn dμ = gn dμ ≤ f dμ , somit lim fn dμ ≤ f dμ .
n→∞
Ω Ω Ω Ω Ω
Damit ist der Satz von der monotonen Konvergenz bewiesen.

Die Folgerung (a) ergibt sich unmittelbar ÜA .
Für die Folgerung (b) beachten wir, dass N := { ω ∈ Ω | |f (ω)| > 0 } wegen
der Messbarkeit von |f| zu A gehört. Die Funktionen fn := n |f | bilden eine
aufsteigende Folge mit fn dμ = 0, und es gilt
Ω
N = { ω ∈ Ω | (fn (ω)) konvergiert nicht } .
Nach dem Satz von Beppo Levi folgt μ(N ) = 0. 2
5.2 Der Satz von der majorisierten Konvergenz (Satz von Lebesgue)
Haben die messbaren Funktionen fn : Ω → eine gemeinsame μ–Majorante
g und konvergieren sie auf Ω punktweise gegen eine Funktion f , so ist f (wie
auch die fn ) μ–integrierbar, und es gilt

f dμ = lim fn dμ .
n→∞
Ω Ω
Bemerkungen. (a) Die μ–Integrierbarkeit der fn folgt aus 4.5.

(b) Die Voraussetzung der punktweisen Konvergenz kann durch die schwächere
Bedingung fn → f μ–f.ü. ersetzt werden ÜA , vgl. 3.6 (b), 4.4.
Beweis.
Nach Voraussetzung gibt es μ–Nullmengen Nn mit | fn (ω) | ≤ g(ω) für alle
7
∞
ω ∈ Ω \ Nn . Dann ist auch N = Nn eine μ–Nullmenge, vgl. § 19 : 7.3 (d),
n=1
und wir erhalten
| fn (ω) | ≤ g(ω) und | f (ω) | = lim | fn (ω) | ≤ g(ω) für alle ω ∈ Ω \ N .

n→∞
Da f als punktweiser Limes der fn messbar ist (vgl. 3.4 (b)), folgt die μ–Inte-
grierbarkeit von f aus dem Majorantenkriterium 4.5.
Wir betrachten die Funktionen un := |f − fn |. Wegen |un | ≤ 2g sind diese
μ–integrierbar, und nach 3.4 (a) sind durch gm := sup{un | n ≥ m} messbare
Funktionen gegeben mit 0 ≤ gm ≤ 2g. Nach 4.5 folgt die μ–Integrierbarkeit
der gm . Ferner bilden die gm eine absteigende und damit die hm := −gm eine
aufsteigende Folge μ–integrierbarer Funktionen mit hm ≤ 0. Aus dem Lemma
in 3.4 (b) entnehmen wir
0 = lim un (ω) = inf{gm (ω) | m ∈

n→∞
} = lim gm (ω) für alle ω ∈ Ω ,
m→∞
also auch lim hm (ω) = 0 für alle ω ∈ Ω. Aus dem Satz von Beppo Levi folgt
m→∞

lim hm dμ = 0 , also auch lim gm dμ = 0 .
m→∞ m→∞
Ω Ω
Wegen |un | ≤ gn folgt daher

f dμ − fn dμ = (f − fn ) dμ ≤ un dμ
Ω Ω Ω Ω

≤ gn dμ → 0 für n → ∞. 2
Ω
5.3 Weiteres zur Vertauschbarkeit von Limes und Integral

(a) Konvergieren die μ–integrierbaren Funktionen fn punktweise gegen f , so ist
f nach 3.4 messbar. Damit f auch μ–integrierbar ist, bedarf es nach 4.3 (c) und
4.5 einer μ–Majorante für f . Dies reicht jedoch nicht aus, um die Vertauschbar-
keit von Limes und μ–Integral zu garantieren, selbst wenn die fn gleichmäßig ge-
gen f konvergieren. Ein Gegenbeispiel erhalten wir durch die gleichmäßig gegen
f = 0 konvergierenden Elementarfunktionen fn = n1 χ[0,n] und das Lebesgue–
Ê
Integral auf .
(b) Ist μ ein endliches Maß, so gilt der kleine Satz von Lebesgue: Kon-
vergieren die beschränkten messbaren Funktionen auf Ω gleichmäßig gegen f ,
so folgt die μ–Integrierbarkeit von f und die Vertauschbarkeit von Limes und
μ–Integral ( ÜA , beachten Sie 4.5 (ii)).
5.4 Integration über Teilbereiche

(a) Sei f ∈ L1 (Ω, μ), und B = ∅ gehöre zum Definitionsbereich A von μ. Dann
gilt f χB ∈ L1 (Ω, μ) nach dem Majorantenkriterium. Wir definieren

f dμ := f χB dμ .
B Ω
(b) B = {A ∈ A | A ⊂ B} ist eine σ–Algebra auf B, und die Einschränkung

ν von μ auf B ist ein σ–endliches Maß ÜA . Für jede A–messbare Funktion
f : Ω → ist die Einschränkung g = f B von f auf B B–messbar ÜA .
Genau dann gilt f χB ∈ L1 (Ω, μ), wenn g ∈ L1 (B, ν). In diesem Fall ist

g dν = f χB dμ .
B Ω
ÜA : Zeigen Sie dies zunächst für Elementarfunktionen und dann mit Hilfe des
Satzes von Beppo Levi für positive messbare Funktionen. Der Rest folgt aus
4.2.
(c) Setzen wir eine B–messbare Funktion u : B → zu einer Funktion u .:Ω→

mit u.(ω) = 0 für ω ∈ Ω \ B fort, so gilt u ∈ L1 (B, ν) ⇐⇒ u
. ∈ L1 (Ω, μ) und
im Fall der Integrierbarkeit ( ÜA )

. dμ =
u u dν .
Ω B
5.5 Zum Lebesgue–Integral

Als ersten Spezialfall der allgemeinen Integrationstheorie besprechen wir das
Ê
Lebesgue–Integral über Teilmengen des n . Für n ≥ 2 bezeichnen wir es wahl-
weise mit

f dV n , f dλn , f (x) dn x, f dn x.
Ω Ω Ω Ω
Ê
Dabei ist Ω eine Lebesgue–messbare Teilmenge des n , und der Definitionsbe-
reich A des Lebesgue–Maßes V n = λn besteht aus den Lebesgue–messbaren
Teilmengen von Ω, vgl. § 19 : 8.
Für n = 1 und Intervalle I ⊂ Ê verwenden wir die Bezeichnungen

f dλ bzw. f (x) dx .
I I
Die Bezeichnungen fast überall (f.ü.), integrierbar, L1 (Ω), Majorante

beziehen sich stets auf das Lebesgue–Integral, stehen also für V n –f.ü., V n –
integrierbar, L1 (Ω, λn ) und V n –Majorante. In diesem Rahmen bedeutet Messbar-
keit von Mengen bzw. Funktionen die V n – bzw. Ln –Messbarkeit.
Die wichtigsten Eigenschaften des Lebesgue–Integrals sind in § 8, Abschnitt 1
zusammengestellt; inzwischen wurden die meisten Beweise nachgetragen (Aus-
nahme: Sätze von Fubini, Tonelli und Transformationssatz).
Wir halten nochmals fest: Für die Fälle, dass Ω ein kompakter Quader, eine
offene Menge oder eine gutberandete kompakte Menge ist, folgt aus der Inte-
grierbarkeit im herkömmlichen Sinn (Bd. 1, § 23 : 2.1,4.2,7.5) die Integrierbarkeit
im Lebesgueschen Sinn, und das Lebesgue–Integral ist gleich dem herkömmli-
chen. Für kompakte Quader und offene Mengen wurde dies in § 8 : 1.6 gezeigt; für
gutberandete kompakte Mengen folgt dies daraus, dass jede Jordan–Nullmenge
eine V n –Nullmenge ist.
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê

Als Definitionsbereich für Wahrscheinlichkeitsmaße (Verteilungen) μ auf wäh- Ê
len wir den Bemerkungen § 19 : 7.2 gemäß immer die Borel–Algebra B, vgl.
§ 19 : 5.3,5.4. In diesem Rahmen steht Messbarkeit für B–Messbarkeit; diese zieht
die Lebesgue–Messbarkeit nach sich.
Nach § 19 : 9.2, 9.3 sind Verteilungen μ durch ihre Verteilungsfunktion, d.h.
durch F (x) = μ(] − ∞, x]) festgelegt. Dies ist zunächst eine reine Existenzaus-
sage, daher ist auch das zugehörige μ–Integral zunächst ein abstrakter Begriff.
Für zwei wichtige Spezialfälle werden wir jetzt das μ–Integral konkret angeben.
Für allgemeine Maße μ werden wir das μ–Integral stetiger Funktionen in 6.2
wenigstens näherungsweise bestimmen.
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê 531
6.1 Beispiele
(a) Diskrete Wahrscheinlichkeitsmaße. Für B ∈ B sei

∞
μ(B) = pk = pk χB (xk ) ;
xk ∈B k=0
dabei seien x0 , x1 , . . . abzählbar viele verschiedene reelle Zahlen, p0 , p1 , . . . ≥ 0

∞
und pk = 1.
k=0
Satz. Für messbare Funktionen f : Ê→ existiert das μ–Integral

∞
f dμ = f (xk ) pk
Ê k=0
genau dann, wenn die Reihe absolut konvergiert. Beim Dirac–Maß δa gilt

f dδa = f (a)
Ê
für jede messbare Funktionen f : → .
Beweis.
Nach 2.4 (c) ist jede Elementarfunktion ϕ μ–integrierbar, wobei die Reihe

∞
ϕ dμ = ϕ(xk ) pk
Ê k=0
absolut konvergiert.
Wir betrachten zunächst eine messbare Funktion f ≥ 0 und eine integraldefi-
nierende Folge (ϕn ) für f . Für diese gilt

N
N
ϕn (xk ) pk ≤ f (xk ) pk für n, N ∈ .
k=0 k=0
Besitzen die Partialsummen der rechten Seite ein Supremum C, so folgt

N
∞
ϕn dμ = lim ϕn (xk ) pk ≤ C = f (xk ) pk
Ê N→∞ k=0 k=0
und damit nach 4.1 die μ–Integrierbarkeit von f sowie

∞
f dμ = lim ϕn dμ ≤ f (xk ) pk .
Ê n→∞
Ê k=0

Existiert umgekehrt I = f dμ, so gilt für jede integraldefinierende Folge (ϕn )
Ê

N
ϕn (xk ) pk ≤ ϕn dμ ≤ I
k=0 Ê
und somit auch

N
N
f (xk ) pk = lim ϕn (xk ) pk ≤ I .
k=0 n→∞ k=0
Es folgt die Konvergenz von

∞
f (xk ) pk ≤ I = f dμ .
k=0 Ê
Für beliebige messbare Funktionen f ist nach 4.3 (c) und 4.5 die μ–Integrier-
barkeit äquivalent zur μ–Integrierbarkeit von |f |. Die Formel für das μ–Integral
ergibt sich durch Zerlegung von f gemäß 4.2. 2
(b) Wahrscheinlichkeitsmaße
mit Dichte. Sei : Ê→Ê + integrierbar
und dλ = 1. Dann ist durch
Ê

μ(B) := dλ = χB dλ für B ∈ B
B Ê
ein Wahrscheinlichkeitsmaß μ auf Ê gegeben.
Eine messbare Funktion f : → Ê
ist genau dann μ–integrierbar, wenn f
Lebesgue–integrierbar ist. In diesem Fall gilt

f dμ = f dλ .
Ê Ê
Bemerkung. Offenbar hat μ die Eigenschaft, dass jede (Lebesgue–)Nullmenge
auch eine μ–Nullmenge ist. Umgekehrt gibt es zu jedem Wahrscheinlichkeitsmaß
μ auf mit dieser Eigenschaft eine integrierbare Funktion ≥ 0 mit Integral
1, so dass

μ(B) = dλ
B
(Satz von Radon–Nykodym, vgl. Bauer [115], 17.8).
Beweis.
(i) Jede Borelmenge B ist Lebesgue–messbar. Nach dem Majorantenkriterium
ist χB also Lebesgue–integrierbar, und aus den Eigenschaften des Integrals
folgt 0 ≤ μ(B) ≤ μ() = 1. Ist A die Vereinigung der paarweise disjunkten
Borelmengen A1 , A2 , . . . , so gilt: Die

∞
uk := χAk , u := χA = uk
k=1
sind integrierbare Funktionen; die Reihe konvergiert punktweise, wobei für jedes
x∈ Ê höchstens ein Reihenglied von Null verschieden ist, und schließlich gilt
N

uk dλ ≤ u dλ .
k=1 Ê Ê
Nach der Reihenversion 5.1 (a) des Satzes von der monotonen Konvergenz er-
halten wir
∞

∞
μ(A) = u dλ = uk dλ = μ(Ak ) .
Ê k=1 Ê k=1
(ii) Für Mengen B ∈ B mit λ(B) = 0 gilt χB = 0 f.ü., also μ(B) = 0.

(iii) Die Formel

f dμ = f dλ
Ê Ê
gilt nach Definition von μ für charakteristische Funktionen f = χB mit B ∈ B.
Wegen der Linearität von μ–Integral und Lebesgue–Integral gilt sie daher auch
für Elementarfunktionen bezüglich B.
Die Behauptung über die Integrierbarkeit und die Formel für das Integral ergibt
sich für positive messbare Funktionen f nach 4.1, da eine Folge (ϕn ) genau dann
μ–integraldefinierend für f ist, wenn ( ϕn ) (Lebesgue–)integraldefinierend für
f ist ÜA . Die Übertragung auf beliebige messbare Funktionen f geschieht
wie im Beweis (a). 2
6.2 Riemann–Stieltjes–Summen und μ–Integral

Der folgende Satz gestattet es, μ–Integrale approximativ zu berechnen. Dar-
überhinaus spielt er eine Schlüsselrolle für die wahrscheinlichkeitstheoretische
Interpretation des Hilbertraumformalismus der Quantenmechanik.
Riemann–Stieltjes–Summen. Sei f : → Ê
stetig und μ eine beliebige
Verteilung mit Verteilungsfunktion F . Ein System Z = { x0 , . . . , xN } heißt
Einteilung von [a, b], wenn
x0 < a ≤ x1 < . . . < xN = b .
Für solche Einteilungen Z definieren wir
δ(Z) := max { xk − xk−1 | k = 1, . . . , N }

und die zugehörige Riemann–Stieltjes–Summe durch

N
R(f, Z) := f (xk ) (F (xk ) − F (xk−1 )) .
k=1
Satz. Für jede Folge von Einteilungen Zn von [a, b] mit δ(Zn ) → 0 gilt
b
f dμ = lim R(f, Zn ) .
n→∞
a
Beweis.
(i) R(f, Z) ist das μ–Integral der Elementarfunktion ϕ in disjunkter Darstellung

N
ϕ(f, Z) = f (xk ) χIk mit Ik = ]xk−1 , xk ] .
k=1
(ii) Seien Zn Einteilungen mit δ(Zn ) → 0, := sup{ δ(Zn ) | n ∈ } und ϕn :=

ϕ(f, Zn ). Wir setzen f0 (x) := f (x) für x ∈ [a, b], f0 (x) := 0 sonst und zeigen
die punktweise Konvergenz ϕn → f0 auf [a − , b] :
Wegen der gleichmäßigen Stetigkeit von f auf [a, b] folgt ϕn → f gleichmäßig
auf [a, b]. Für a − ≤ x < a gilt ϕn (x) = 0 = f0 (x) , sobald δ(Zn ) < a − x.
(iii) Es gilt | ϕn (x) | ≤ C := max{|f (x)| | a ≤ x ≤ b}. Somit besitzen die ϕn
die gemeinsame μ–Majorante C χ[a−,b] , und der Satz von der majorisierten
Konvergenz ergibt für n → ∞
b b b
R(f, Zn ) = ϕn dμ = ϕn dμ → f0 dμ = f dμ 2
Ê a− a− a
Bemerkungen. (a) Die Aussage des Satzes verliert ihre Allgemeingültigkeit,

wenn wir nur Zerlegungen
Z : a = x0 < x1 < . . . < xN = b
zugrundelegen. ÜA : Welche Verteilungen werden hierdurch ausgeschlossen?
(b) Durch den Satz erklärt sich die häufig anzutreffende Bezeichnungsweise
b b
f (x) dF (x) für f dμ .
a a
Für Wahrscheinlichkeitsmaße mit Dichte ist die Verteilungsfunktion F nach

dem Hauptsatz § 8 : 3.2 absolutstetig mit F = f.ü.. Hier ist also
b b
f (x) dF (x) = f (x) F (x) dx .
a a
6.3 Erwartungswert und Streuung reeller Verteilungen

Für eine Verteilung μ definieren wir Erwartungswert E(μ) und Varianz V (μ)
durch

+∞ +∞
/ :=
E(μ) = μ x dμ(x) , V (μ) := /)2 dμ(x) ,
(x − μ
−∞ −∞
falls diese Integrale existieren. Hinreichend für die Existenz beider Integrale ist
die μ–Integrierbarkeit von x2 ÜA . Nach 6.1 (a),(b) entspricht dies für diskrete
Verteilungen und Verteilungen mit Dichten den Definitionen in § 19.
Die Streuung (Standardabweichung) σ(μ) definieren wir durch
σ(μ) := V (μ) .
6.4 Der Erwartungswert einer transformierten Zufallsgröße

(a) Wir interpretieren ein Wahrscheinlichkeitsmaß μ auf Ê
als Verteilung der
möglichen Werte einer Zufallsgröße X. Für eine messbare Funktion f : → Ê Ê
ist die transformierte Zufallsgröße f (X) dadurch definiert, dass jedem zufälligen
Beobachtungswert x für X der Wert f (x) zugeordnet wird. Die Verteilung μf
der Beobachtungswerte für f (X) ist gegeben durch
μf (B) = μ(f −1 (B)) = μ({f ∈ B}) .
Dass ν := μf ein Wahrscheinlichkeitsmaß ist, lässt sich leicht nachprüfen ÜA .
Satz. Der Erwartungswert E(f (X)) existiert genau dann, wenn f μ–integrier-
bar ist. In diesem Fall gilt

E(f (X)) = f dμ .
Ê

/)2 ), falls
Insbesondere ist V (X) = E((X − μ x2 dμ(x) konvergiert.
Ê
Der Beweis ergibt sich aus dem folgenden
(b) Transformationssatz für Bildmaße. Sei (Ω, A, μ) ein σ–endlicher Maß-
raum und B eine σ–Algebra auf Ω . Ferner sei f : Ω → Ω eine A–B–messbare
Funktion, d.h. f −1 (B) ∈ A für alle B ∈ B. Dann ist durch
μf (B) := μ(f −1 (B)) für B ∈ B
ein σ–endliches Maß μf auf B gegeben, das Bildmaß von μ unter f .

Für eine B–messbare Funktion u : Ω → gilt

u dμf = u ◦ f dμ , falls eines dieser Integrale existiert.
Ω Ω
Bemerkungen. (i) Ist μ ein Wahrscheinlichkeitsmaß, so auch μf .

(ii) Die Behauptung des Satzes (a) folgt mit u(x) = x, Ω = Ω = Ê, A = B.
Ê
(iii) Ist f ein Diffeomorphismus zwischen zwei Gebieten Ω, Ω ⊂ n und ist
μ(B) = | det f | χB dV n , so ist V n das Bildmaß von μ unter f . Auf diesem
Ω
Sachverhalt beruht der Transformationssatz für das Lebesgue–Integral § 8 : 1.9.
Beweis des Transformationssatzes.

(1) Wir überlassen den Nachweis, dass μf ein σ–endliches Maß ist, den Lesern
als ÜA .
(2) Sei B ∈ B, A = f −1 (B) und ϕ = χB . Dann gilt μf (B) = μ(A) und
ϕ ◦ f = χA . Im Fall μ(A) < ∞ ist

(∗) ϕ dμf = μf (B) = μ(A) = ϕ ◦ f dμ ,
Ω Ω
andernfalls existiert keines der beiden Integrale.

N
(3) Für eine Elementarfunktion ϕ = bk χBk mit paarweise disjunkten Bk ∈
k=1

N
B ist ϕ ◦ f = bk χAk mit Ak = f −1 (Bk ) eine Elementarfunktion bezüglich
k=1
(Ω, A). Sie ist nach (2) genau dann μ–integrierbar, wenn ϕ μf –integrierbar ist.
In diesem Fall gilt (∗) wegen der Linearität der Integrale.
Ê
(4) Für eine B–messbare Funktion u : Ω → + sei (ϕn ) eine μf –integralde-
finierende Folge. Dann bilden die (ϕn ◦ f ) nach (3) eine μ–integraldefinierende

Folge für u ◦ f . Ferner ist die Beschränktheit der Folge ϕn dμf äquivalent
Ω
zur Beschränktheit der Folge ϕn ◦ f dμ . Somit folgt die Behauptung für u
Ω
nach der Integraldefinition 4.1.
(5) Für beliebige B–messbare Funktionen u ergibt sich die Behauptung wie im
Beweis 6.1 (a). 2
6.5* Der Begriff Zufallsvariable

Wir wollen kurz erläutern, warum wir hier von Zufallsgrößen und nicht, wie in
der klassischen Wahrscheinlichkeitstheorie üblich, von Zufallsvariablen sprechen.
Eine Funktion X : Ω → Êauf einem Wahrscheinlichkeitsraum (Ω, A, p) heißt
Zufallsvariable, wenn sie A–B–messbar ist: X −1 (B) ∈ A für jede Borelmenge
B. Die Verteilung μ von X ist definiert als das Bildmaß von p unter X:
μ(B) := p(X −1 (B)) = p({X ∈ B}) .

Ausgangspunkt für die klassische Wahrscheinlichkeitstheorie ist, dass alle in ei-

nem Problemzusammenhang auftretenden Zufallsgrößen eine gemeiname Quelle
des Zufalls haben, d.h. dass sie sich durch Zufallsvariable auf einem und dem-
selben Wahrscheinlichkeitsraum (Ω, A, p) beschreiben lassen.
Für zwei Zufallsvariable X, Y hat dies folgende Konsequenzen:
(i) Existenz einer gemeinsamen Verteilung. Die Wahrscheinlichkeit
ν(A × B) := p(X −1 (A) ∩ Y −1 (B)) = P ({X ∈ A und Y ∈ B})
lässt sich zu einem Wahrscheinlichkeitsmaß ν auf B( Ê ) fortsetzen, zu deuten

2
als Verteilung der Wertepaare (x, y) für X, Y .
(ii) Die Linearität des Erwartungswerts. Mit X, Y : Ω → Ê ist auch αX + βY

eine Zufallsvariable, und es gilt
E(αX + βY ) = αE(X) + βE(Y ) ,
falls E(X) und E(Y ) existieren. Dies ergibt sich aus der Darstellung des Erwar-
tungswerts als p–Integral: Existiert E(X), so gilt

E(X) = x dμ(x) = X dp
Ê Ω
nach dem Transformationssatz für das Bildmaß μ von p unter X.

Die Annahme einer gemeinsamen Verteilung zweier Zufallsgrößen X, Y bedeu-
tet, dass es von der Sache her und hinsichtlich der empirischen Überprüfbarkeit
Sinn macht, von der Wahrscheinlichkeit
P (X ∈ A und Y ∈ B)
zu sprechen.
Eine solche Annahme ist in der Quantenmechanik nur in Ausnahmefällen ge-
rechtfertigt (kompatible Observable, siehe § 25 : 4.6). Gemeinsame Messung“
”
zweier Observabler X, Y wie Ort und Impuls setzt voraus, dass die Messwerte
x für X und y für Y paarweise anfallen. Geschieht dies in kurzen zeitlichen
Abständen, so hängen die Messergebnisse in der Regel von der Reihenfolge ab:
Eine Messung für X kann den Zustand des Systems und damit die Bedingungen
für die nachfolgende Messung von Y empfindlich beeinflussen. Die Ergebnisse
x, y können ganz anders verteilt sein als die Ergebnisse y, x einer Messung erst
Y , dann X. Auch bei gleichzeitiger (simultaner) Messung“, sofern überhaupt
”
realisierbar, bleibt das Problem der Nichtkommutativität bestehen.
Für den Aufbau der klassischen Wahrscheinlichkeitstheorie und ihre Anwendun-
gen in der Statistik ist der Begriff der Zufallsvariablen dagegen zentral. Hierzu
verweisen wir u.a. auf Bauer [115], Krengel [121] und Renyi [123].
7 Lp –Räume und ihre Eigenschaften

7.1 Die Räume Lp (Ω, μ) für 1 ≤ p < ∞
(a) Sei Ω eine nichtleere Menge und μ ein Maß auf Ω mit Definitionsbereich
A ( A = B für reelle Verteilungen, A = Ln für das Lebesgue–Maß λn , vgl.
§ 19 : 8.1 (b)). Für 1 ≤ p < ∞ definieren wir

Lp (Ω, μ) := f :Ω→ f messbar und |f |p μ–integrierbar .
Beachten Sie: Aus der μ–Integrierbarkeit von |f |p folgt nicht die Messbarkeit
(genauer: A–Messbarkeit) von f , vgl. 3.6 (d).
Satz. Lp (Ω, μ) ist ein Vektorraum. Für f, g ∈ Lp (Ω, μ) gilt

1/p 1/p 1/p
|f + g|p dμ ≤ |f |p dμ + |g|p dμ .
Ω Ω Ω
Für f ∈ Lp (Ω, μ) und g ∈ Lq (Ω, μ) mit 1

p
+ 1
q
= 1 gilt f g ∈ L1 (Ω, μ) und
1/p 1/q
|f g| dμ ≤ |f |p dμ · |g|q dμ .
Ω Ω Ω
Der Beweis ergibt sich wörtlich wie in § 8, Abschnitt 2 mit Hilfe der Unglei-
chungen von Hölder und Minkowski sowie dem Majorantenkriterium.
1/p
(b) Durch f p := |f |p dμ ist eine Halbnorm auf Lp (Ω, μ) gegeben:
Ω
αf p = |α| · f p und f + gp ≤ f p + gp . Aus f p = 0 folgt dagegen nur
f = 0 μ–f.ü., vgl. 5.1 (b). Um eine Norm zu erhalten, erzwingen wir die positive
Definitheit, indem wir alle μ–f.ü. gleichen Lp –Funktionen identifizieren. Den
so vergröberten Raum Lp (Ω, μ) bezeichnen wir mit Lp (Ω, μ). Lesen Sie hierzu
die unter § 8 : 2.1 gemachten Bemerkungen! Als Resümee ergibt sich: Lp (Ω, μ)
besteht genau genommen aus Klassen
u = [f ] := { g | g = f μ–f.ü.}
μ–fast überall gleicher Lp –Funktionen. Für alle geometrischen und topologi-

schen Betrachtungen in Lp (Ω, μ) als normiertem Raum ist es gleichgültig, mit
welchem Vertreter einer Klasse gerechnet wird; insoweit dürfen wir von Lp –
Funktionen statt von Klassen sprechen.
Die Bemerkungen § 8 : 2.1 ergänzen wir wie folgt: Vom Funktionswert u(ω) einer
Lp –Funktion u zu sprechen macht auch dann Sinn, wenn μ({ω}) > 0.
Für ein Wahrscheinlichkeitsmaß μ mit endlichem Träger {x0 , . . . , xn−1 }, d.h.

n−1
pk = μ({xk }) > 0 für k = 0, . . . , n − 1, pk = 1 ist Lp ( , μ) isomorph zu

k=0
n
, versehen mit einer passenden Norm ÜA .
7 Lp –Räume und ihre Eigenschaften 539
7.2 Die Vollständigkeit der Lp –Räume

Satz. Zu jeder Cauchy–Folge (un ) in Lp (Ω, μ) gibt es ein u ∈ Lp (Ω, μ) mit
u − un p → 0 für n → ∞ .
Darüberhinaus gibt es eine Teilfolge (unk )k mit u = lim unk μ–f.ü..

k→∞
Beweis.
(a) Da (un ) eine Cauchy–Folge ist, gibt es eine Teilfolge (unk )k mit

unk+1 − unk < 2−k (k = 1, 2, . . .) .
p
(b) Weil Lp (Ω, μ) ein Vektorraum ist, der mit u auch |u| enthält, sind mit

n
vk := unk+1 − unk auch sn := |vk |
k=1
Lp –Funktionen. Aus der Dreiecksungleichung folgt

n
n
sn p ≤ vk p < 2−k < 1 .
k=1 k=1
Nach dem Satz von der monotonen Konvergenz gibt es daher eine μ–integrier-
bare Funktion h ≥ 0 und eine μ–Nullmenge N mit
(1) h(ω) = lim spn (ω) für alle ω ∈ Ω \ N .

n→∞
Durch Nullsetzen der beteiligten Funktionen auf N können wir erreichen, dass
(1) für alle ω ∈ Ω gilt.
Für s := h1/p gilt dann s ∈ Lp (Ω, μ) und

∞
(2) s(ω) = lim sn (ω) = |vk (ω)| für alle ω ∈ Ω.
n→∞ k=1
(c) Als Folgerung ergibt sich für k ≥ ν

k
unk+1 − unν = vn ≤ |vn | = s ,
∞
(3)
n=ν n=1
und nach dem Majorantenkriterium für Reihen folgt aus (2) die Existenz des
punktweisen Limes

∞
k
(4) u := un1 + vn = lim un1 + vn = lim unk+1 .
n=1 k→∞ n=1 k→∞
Aus (4) und (3) folgt |u| ≤ |un1 | + |s|, also u ∈ Lp (Ω, μ).
(d) Nach (3) gilt

| u − unν |p = lim unk+1 − unν ≤ s ,
p
k→∞
und aus (4) folgt
lim | u − unν |p = 0 .
ν→∞
Der Satz von der majorisierten Konvergenz ergibt daher

| u − unν |p dμ → 0 für ν → ∞ .
Ω
Konvergiert eine Teilfolge einer Cauchy–Folge (un ) gegen u, so auch die Folge
(un ) selbst (Bd. 1, § 21 : 5.1). 2
7.3 Der Banachraum L∞ (Ω, μ)

(a) Eine messbare Funktion f : Ω → heißt μ–wesentlich beschränkt, in
Zeichen f ∈ L∞ (Ω, μ), wenn es eine Konstante C gibt mit
| f (ω) | ≤ C μ–f.ü.
Wörtlich wie in § 8 : 2.4 erhalten wir: Für f ∈ L∞ (Ω, μ) existiert

f ∞ := min C∈ +
| f (ω) | ≤ C μ–f.ü. .
(b) Den Raum L∞ (Ω, μ) erhalten wir aus L∞ (Ω, μ), indem wir wie in 7.1 alle
μ–f.ü. gleichen Funktionen identifizieren.
Satz. (L∞ (Ω, μ), · ∞ ) ist ein Banachraum.
Beweis.
(i) Die positive Definitheit der Norm haben wir durch die Klassenbildung (b)
erzwungen. Offenbar gilt αf ∞ = |α| · f ∞ für f ∈ L∞ (Ω, μ), α ∈ .
∞
Zu f, g ∈ L (Ω, μ) gibt es μ–Nullmengen N1 , N2 mit
| f (ω) | ≤ f ∞ für ω ∈ Ω \ N1 , | g(ω) | ≤ g∞ für ω ∈ Ω \ N2 .
Für die μ–Nullmenge N = N1 ∪ N2 folgt
| f (ω) + g(ω) | ≤ | f (ω) | + | g(ω) | ≤ f ∞ +, g∞
für ω ∈ Ω \ N , d.h. μ–fast überall. Nach (a) folgt f + g ∈ L∞ (Ω, μ) und

f + g∞ ≤ f ∞ + g∞ . Mit der Dreiecksungleichung nach unten folgt aus
f = g μ–f.ü., dass f ∞ = g∞ .
7 Lp –Räume und ihre Eigenschaften 541
(ii) Gegeben sei eine Cauchy–Folge in L∞ (Ω, μ), repräsentiert durch L∞ –

Funktionen un . Dann gibt es zu jedem k ∈
ein nk ∈
und μ–Nullmengen
N (k, m, n) mit
1
(∗) | um (ω) − un (ω) | < für m > n > nk
k
und ω ∈ N (k, m, n). Die Vereinigung N aller N (k, m, n) ist ebenfalls eine μ–
Nullmenge, und (∗) gilt für alle ω ∈ Ω \ N . Dies bedeutet, dass (un (ω)) eine
Cauchy–Folge in ist für alle ω ∈ Ω \ N . Durch

lim un (ω) für ω ∈ N ,
n→∞
u(ω) :=
0 für ω ∈ N
ist eine messbare Funktion gegeben mit

1
| u(ω) − un (ω) | = lim | um (ω) − un (ω) | ≤ für n > nk
m→∞ k
und ω ∈ Ω \ N . Es folgt u − un ∈ L∞ (Ω, μ), also auch
1
u = u − un + un ∈ L∞ (Ω, μ) und u − un ∞ ≤ für n > nk . 2
k
7.4 Beziehungen zwischen L1 , L2 und L∞

(a) Es gilt L1 (Ω, μ) ∩ L∞ (Ω, μ) ⊂ L2 (Ω, μ).
(b) Für endliche Maße, z.B. Wahrscheinlichkeitsmaße oder das Lebesgue–Maß
auf Mengen Ω endlichen Volumens, gilt
L∞ (Ω, μ) ⊂ L2 (Ω, μ) ⊂ L1 (Ω, μ) .
(c) Für offene Mengen Ω ⊂ n mit V n (Ω) = ∞ ist keiner der Räume L1 (Ω),
L2 (Ω), L∞ (Ω) in einem der anderen enthalten.
Beweis.
(a) Für u ∈ L1 (Ω, μ) ∩ L∞ (Ω, μ) ist u∞ · u eine μ–Majorante für |u|2 .
(b) Sei μ(Ω) < ∞. Dann gilt χΩ ∈ L1 (Ω, μ) ∩ L2 (Ω, μ). Für u ∈ L∞ (Ω, μ) ist
u2∞ · χΩ eine μ–Majorante für |u|2 . Für u ∈ L2 (Ω, μ) ist u = u · χΩ ∈ L1 (Ω, μ)
nach 7.1 (a).
(c) soll hier nicht bewiesen werden. Hierzu als
ÜA Zeigen Sie mit Hilfe geeigneter stetiger Funktionen, dass (c) für Ω = >0
richtig ist und dass die Inklusionen (b) für das Lebesgue–Maß auf ]0, 1[ echt
sind. 2
8 Dichte Teilräume und Separabilität

8.1 Übersicht
Vorkenntnisse für den letzten Teil dieses Paragraphen: Testfunktionen § 10 : 1,
§ 10 : 2, § 10 : 3.
Für die Theorie von Differentialoperatoren ist es wesentlich, dass der Raum
C∞
c (Ω) der Testfunktionen auf Ω für 1 ≤ p < ∞ ein dichter Teilraum von
Lp (Ω) ist. Vor allem für die Hilbertraumtheorie benötigen wir die Separabilität
Ê
von Lp (Ω) und von Lp ( , μ) für Wahrscheinlichkeitsmaße μ. Grundlegend für
beides ist, dass die Treppenfunktionen in diesen Räumen dicht liegen.
Bekanntlich heißt eine Teilmenge M eines normierten Raumes (V, · ) dicht
in V , wenn M = V . Die Relation B ⊂ A bedeutet, dass jedes u ∈ B Limes
einer geeigneten Folge aus A ist. Die folgenden Sätze stützen sich auf das
Lemma. (a) Aus B ⊂ A und B = V für Teilmengen A, B von V folgt A = V.
Mehrmalige Anwendung von (a) ergibt folgende Schlusskette:
Aus A1 = V , Ak ⊂ Ak+1 für k = 1, . . . , N folgt Ak = V für k = 1, . . . , N .
(b) Ist U ein Teilraum von V mit M ⊂ U , so ist auch Span M ⊂ U .
Beweis. (a) Aus B ⊂ A folgt V = B ⊂ A ⊂ V und damit überall das
Gleichheitszeichen.

N
(b) Seien m1 , . . . , mN ∈ M und w = αk mk . Wegen mk ∈ U gibt es zu
k=1
gegebenem ε > 0 Vektoren uk ∈ U mit |αk | · uk − mk < ε/2k (1 ≤ k ≤ N ).

N
Es folgt w − αk uk < ε . 2
k=1
8.2 Approximation von Lp -Funktionen durch Elementarfunktionen

Ê
(a) Sei Ω ⊂ N offen und μ entweder ein Wahrscheinlichkeitsmaß auf Ω oder
das Lebesgue–Maß auf Ω . Die
folgenden Ergebnisse gelten auch für Maße μ
mit stetiger Dichte: μ(B) = f dV n für Lebesgue–messbare Mengen B ⊂ Ω .
B
In jedem Fall gilt μ(K) < ∞ für kompakte Mengen K ⊂ Ω.
(b) Lemma. Unter der Voraussetzung (a) gilt für u ∈ Lp (Ω, μ):
Zu jedem ε > 0 gibt es eine kompakte Menge K ⊂ Ω mit

|u|p dμ − |u|p dμ = |u − u χK |p dμ < ε ;
Ω K Ω
ferner gibt es eine Elementarfunktion ϕ mit supp ϕ ⊂ K und

u − ϕp < 2ε .
Für K kann eine endliche Vereinigung kompakter Quader gewählt werden.

8 Dichte Teilräume und Separabilität 543
Beweis.
7
∞
(a) Sei u ∈ Lp (Ω, μ). Für eine Quaderzerlegung Ω = Ik (Bd. 1, § 23 : 4.1)
k=1
setzen wir
7
n
Kn := Ik und Bn := {x ∈ Kn | |u(x)| ≤ n} .
k=1
Für die messbaren Funktionen un := u χBn gilt dann

|un | ≤ |u| , |u − un |p ≤ |u|p ,
also un , u − un ∈ Lp (Ω, μ). Ferner gilt
lim un (x) = u(x) für alle x ∈ Ω ,
n→∞
denn zu x ∈ Ω gibt es ein m mit x ∈ Bm ; dann ist un (x) = u(x) für n ≥ m.

Nach dem Satz von der majorisierten Konvergenz folgt lim u − un p = 0.
n→∞
Wegen der Stetigkeit der p–Norm erhalten wir insbesondere für n → ∞

|u|p dμ − |u|p dμ = |u|p dμ − |un |p dμ → 0 .
Ω Kn Ω Ω
(b) Wir wählen ein un mit u − un p < ε. Nach 3.5 (a) gibt es eine Folge
von auf Kn lebenden Elementarfunktionen ϕk mit |ϕk | ≤ n und ϕk → un
gleichmäßig auf Kn . Daraus folgt
un − ϕk p < ε und u − ϕk p < 2ε für genügend großes k. 2
8.3 Approximation von Lp –Funktionen durch Treppenfunktionen

Unter der Voraussetzung 8.2 (a) liegen die Treppenfunktionen dicht in Lp (Ω, μ),
falls Ω offen oder ein kompakter Quader ist.
Beweis.
Wegen 8.2 (b) und 8.1 (a) genügt es, für kompakte Quader I ⊂ Ω folgendes zu
zeigen:
Ist B ⊂ I eine μ–messbare Menge, so ist χB Lp –Limes einer Folge von Trep-
penfunktionen. Wir müssen dies sogar nur für Borelmengen B zeigen, denn zu
jeder Lebesgue–messbaren Menge A ⊂ I gibt es eine Borelmenge B ⊂ I mit
χA = χB f.ü., siehe § 19 : 8.2 (b).
Sei also I ⊂ Ω ein kompakter Quader. Wir nennen eine Menge A ⊂ Ê N
gut,
wenn es Treppenfunktionen ϕn auf I gibt mit
(∗) 0 ≤ ϕn ≤ 1 und χA∩I − ϕn p → 0 für n → ∞ .
Jede solche Folge (ϕn ) nennen wir geeignet für A.

Offenbar sind alle Quader gut. Bilden daher die guten Mengen eine σ–Algebra,
so sind nach § 19 : 5.4 alle Borelmengen B gut, d.h. χB∩I ist Lp –Limes von
Treppenfunktionen auf I.
Ist A gut und (ϕn ) geeignet für A, so bilden die ψn = χI − ϕn eine geeignete
Ê
Folge für C := N \ A, denn χC∩I − ψn = ϕn − χA∩I ÜA und 0 ≤ ψn ≤ 1.
Sind (ϕn ), (ψn ) geeignete Folgen für die guten Mengen A, B, so ist (ϕn · ψn )
eine geeignete Folge für A ∩ B ( ÜA , beachten Sie χA∩B∩I = χA · χB · χI ).
7
∞
Seien A1 , A2 , . . . paarweise disjunkte gute Mengen und A := Ak . Wir setzen
k=1
n
f := χA∩I , fk := χAk ∩I und sn := fk .
k=1
Es gilt

|f − sn |p dμ = (f − sn ) dμ
I I

n
= μ(A ∩ I) − μ(Ak ∩ I) → 0 für n → ∞ .
Æ mit f − s
k=1
Zu gegebenem ε > 0 gibt es daher ein m ∈ n p < ε für n > m.
Da die Ak gut sind, gibt es Treppenfunktionen ψk auf I mit
0 ≤ ψk ≤ 1 , fk − ψk < 2−k (k = 1, . . . , n) .
Dann ist

n
ϕn = min χI , ψk
k=1
eine Treppenfunktion auf I mit 0 ≤ ϕn ≤ 1 und sn − ϕn p < ε. Es folgt

f − ϕn < 2ε für n > m. Somit bilden die ϕn eine geeignete Folge für A. 2
8.4 Die Separabilität von Lp –Räumen

Ein normierter Raum (V, · ) heißt separabel, wenn es eine abzählbare Menge
A ⊂ V gibt mit A = V .
Satz. Für die in 8.2 (a) genannten Maße μ und 1 ≤ p < ∞ ist der Raum
Ê
Lp (Ω, μ) separabel, falls Ω ⊂ N offen oder ein kompakter Quader ist.
Beweis.

n
Es sei A die abzählbare Menge aller Treppenfunktionen ψ = rk χRk mit
Æ
k=1
n ∈ , rationalen rk und rationalen Koordinaten der Eckpunkte jedes der
Quader Rk und von Ω, falls Ω ein kompakter Quader ist).

N
Eine beliebige Treppenfunktion ϕ = ck χIk ändern wir wie folgt zu einer
k=1
rationalen Treppenfunktion ab: Wir vergrößern jeden Quader Ik zu einem ähn-
8 Dichte Teilräume und Separabilität 545
lichen Quader Rk ⊂ Ω mit rationalen Eckdaten und mit μ(Rk ) − μ(Ik ) < ε,
was wegen der Stetigkeitseigenschaft § 19 : 6.3 (b) von μ möglich ist.
Ferner ersetzen wir jedes ck durch ein rk ∈ mit |ck − rk | < ε. Auf diese Weise

N
erhalten wir eine Treppenfunktion ψ = rk χRk ∈ A mit ϕ − ψp < C ε
k=1
mit einer nur von ϕ abhängigen Konstanten C ÜA .
p
Nach 8.3 folgt A = L (Ω, μ). 2
8.5 Weitere dichte Teilräume von Lp –Räumen

(a) C∞
c (Ω) liegt für 1 ≤ p < ∞ dicht in L (Ω) .
p
(b) Ist μ ein Wahrscheinlichkeitsmaß auf Ê und 1 ≤ p < ∞, so liegt C (Ê) ∞
Ê
c
dicht in Lp ( , μ) .
(c) Gibt es zusätzlich eine kompakte Menge K ⊂ Ê mit μ(K) = 1, so liegen
Ê
die Polynome dicht in Lp ( , μ) = Lp (K, μ) .
Beweis.
(a) wurde in § 10 : 3.3 gezeigt.
(b) Wir zeigen zunächst, dass die stetigen Funktionen mit kompaktem Träger
Ê Ê
dicht in Lp ( , μ) liegen. Da die Treppenfunktionen in Lp ( , μ) dicht liegen,
genügt es, charakteristische Funktionen beschränkter Intervalle im Lp –Sinn
durch stetige Funktionen mit kompaktem Träger zu approximieren. Dabei ist
in Betracht zu ziehen, dass Intervallränder positives Maß haben können. Daher
sind Fallunterscheidungen nötig.
(i) Sei f = χ[a,b] . Für die links skizzierten Funktionen fn gilt |f − fn | ≤ 1, also

|f − fn |p dμ ≤ μ({f = fn }) = μ a− 1
,a + μ b, b + 1
→ 0
Ê
n n
für n → ∞ nach § 19 : 6.3 (b).
fn gn
1 1
a− 1 a b b+ 1 a a+ 1 b− 1 b
n n n n
(ii) Sei g = χ]a,b[ . Für die rechts skizzierten Funktionen gn gilt entsprechend

|g − gn |p dμ ≤ μ({g = gn }) = μ a, a + 1
+ μ b− 1
,b → 0
Ê
n n
für n → ∞, ebenfalls nach § 19 : 6.3 (b). Die Fälle ]a, b], und [a, b[ überlassen wir
den Lesern als ÜA .
Nach § 10 : 3.2 gibt es zu jeder stetigen Funktion f mit kompaktem Träger
K ⊂ Ê Testfunktionen ϕn , die gleichmäßig gegen f konvergieren. Da μ ein
Wahrscheinlichkeitsmaß ist, folgt f − ϕn p → 0 nach dem kleinen Satz von
Lebesgue 5.3 (b).
Ê
(c) Für f ∈ C0 ( ) gibt es nach dem Approximationssatz von Weierstraß Po-
lynome pn , die auf K gleichmäßig gegen f konvergieren. Nach dem kleinen Satz
Ê
von Lebesgue 5.3 (b) folgt wegen μ( \ K) = 0

|f − pn |p dμ = |f − pn |p dμ → 0 für n → ∞ . 2
Ê K
547
§ 21 Spektrum und Funktionalkalkül beschränkter

symmetrischer Operatoren
Vorkenntnisse : Hilberträume (§ 9), Maß, Wahrscheinlichkeit, μ–Integral (§ 19,
§ 20).
1 Beschränkte Operatoren und Operatornorm

1.1 Vorbemerkungen
Unser Ziel ist die Entwicklung einer Spektraltheorie für selbstadjungierte Ope-
ratoren im Hilbertraum. Dabei soll insbesondere auf deren Bedeutung für die
Quantenmechanik eingegangen werden; wir verweisen hierzu auf die in § 18 auf-
geworfenen Fragen. Wir gehen in zwei Schritten vor: In § 21 und § 22 analy-
sieren wir beschränkte symmetrische Operatoren; anschließend gehen wir zu
unbeschränkten selbstadjungierten Operatoren über. Die leitende Idee dabei
ist, dass sich eine unbeschränkte Observable aus beschränkten aufbauen lässt
(Zerlegung nach beschränkten Messbereichen).
Das Symbol H steht im folgenden für einen separablen Hilbertraum über ;
dabei heißt H separabel, wenn es eine abzählbare Menge M ⊂ H gibt mit
M = H , vgl. § 8 : 2.6. Nach § 9 : 4.8 ist H dann isomorph zum Hilbertschen
Folgenraum 2 = 2 ( ) oder zu einem n .
Auch für die im Folgenden auftretenden Vektorräume, insbesondere für Räume
von Operatoren, legen wir immer den Körper zugrunde.
1.2 Beschränktheit und Stetigkeit

Ein linearer Operator T : V1 → V2 zwischen normierten Räumen (V1 , · 1 )
und (V2 , · 2 ) heißt beschränkt, wenn das Bild der Einheitskugel unter T
beschränkt ist, d.h. wenn es eine Konstante C ≥ 0 gibt mit
T u2 ≤ C für alle u ∈ V1 mit u1 ≤ 1 .
Äquivalent hierzu ist die Bedingung ÜA
T u2 ≤ C u1 für alle u ∈ V1 .
Jede Zahl C mit dieser Eigenschaft heißt eine Normschranke für T .

Hat V1 endliche Dimension, so ist jeder lineare Operator T : V1 → V2 be-
schränkt, Näheres hierzu in 2.8. Ist V1 unendlichdimensional, so gilt dies nicht.
Als Beispiel betrachten wir den Ableitungsoperator
T : C1 [0, 1] → C0 [0, 1] , u → u ,
wobei beide Räume mit der Supremumsnorm · ∞ versehen sind. Für un (x) =
xn gilt dann un ∞ = 1 und T un ∞ = n.
548 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren
Satz. Für lineare Operatoren T : V1 → V2 sind folgende Aussagen äquivalent:

(a) T ist beschränkt,
(b) T ist in jedem Punkt u ∈ V1 stetig,
(c) T ist im Nullpunkt stetig.
Beweis.
Ist T im Nullpunkt stetig, so gibt es zu ε = 1 ein δ > 0 mit
v1 < δ =⇒ T v2 < 1 .
Für u1 ≤ 1 und v = δ
2
u folgt T u2 = 2
δ
T v2 < 2
δ
. Also hat T die
Normschranke C = 2/δ.
Gilt T u2 ≤ C u1 für alle u ∈ V1 , so ist T in jedem Punkt u ∈ V1 stetig:
Aus u = lim un folgt
n→∞
T u − T un 2 = T (u − un )2 ≤ C u − un 1 → 0 für n → ∞ . 2
1.3 Die Operatornorm

(a) Satz. Auf dem Vektorraum L (V1 , V2 ) der beschränkten linearen Operato-
ren T : V1 → V2 ist durch
T := sup { T u2 | u1 ≤ 1 } = sup { T u2 | u1 = 1 }
eine Norm gegeben. Diese ist die kleinste Normschranke, d.h. es gilt
T u2 ≤ T · u1 für alle u ∈ V1 und
T u2 ≤ C u1 für alle u ∈ V1 =⇒ T ≤ C .
Beweis.
Die beiden letzten Behauptungen folgen leicht aus der Definition von T ÜA .
Offenbar gilt T = 0 ⇐⇒ T = 0 und αT = |α| · T ÜA .
Für S, T ∈ L (V1 , V2 ) gilt
(S + T )u2 = Su + T u2 ≤ Su2 + T u2 ≤ (S + T ) u1 ,
also ist S + T Normschranke für S + T . Es folgt S + T ≤ S + T . 2
(b) Für beschränkte lineare Operatoren T : V1 → V2 , S : V2 → V3 gilt

ST ≤ S · T .
Denn für u ∈ V1 gilt nach Definition von ST
ST u3 = S(T u)3 ≤ S · T u2 ≤ S · T · u1 .
Da ST die kleinste Normschranke für ST ist, folgt ST ≤ S · T .
1 Beschränkte Operatoren und Operatornorm 549
Beispiele für beschränkte Operatoren und Operatornormen bzw. Normschran-

ken folgen in Abschnitt 2.
1.4 Die Vollständigkeit von L (V1 , V2 )

Satz. L (V1 , V2 ) mit der Operatornorm ist vollständig, also ein Banachraum,
falls (V2 , · 2 ) ein Banachraum ist.
Beweis.
Sei (Tn ) eine Cauchy–Folge in L (V1 , V2 ), d.h. zu jedem ε > 0 gebe es ein nε
mit
Tm − Tn < ε für m > n > nε .
Für u ∈ V1 folgt
(∗) Tm u − Tn u2 = (Tm − Tn )u2 ≤ Tm − Tn · u1 ≤ ε u1
für m > n > nε , also ist (Tn u) eine Cauchy–Folge in V2 . Somit existiert
T u := lim Tn u
n→∞
für jedes u ∈ V1 . Nach den Rechenregeln für konvergente Folgen ist T linear.
Aus (∗) folgt für m → ∞
(T − Tn )u2 = lim Tm u − Tn u2 ≤ ε u1 ,
m→∞
also
T − Tn ≤ ε für n > nε .
Mit T − Tn ist auch T = T − Tn + Tn beschränkt. 2
1.5 Die Banach–Algebra L (H )

Wir bezeichnen den Raum der beschränkten linearen Operatoren T : H → H
auf einem Hilbertraum H mit L (H ). Nach 1.4 ist L (H ) ein Banachraum
bezüglich der Operatornorm. L (H ) ist eine Banachalgebra, darunter verste-
hen wir einen Banachraum über , in dem neben den Vektorraumoperationen
noch eine multiplikativ geschriebene Verknüpfung definiert ist, mit den Eigen-
schaften
R(ST ) = (RS)T, R(S + T ) = RS + RT,
(αS)(βT ) = αβST für α, β ∈ und ST ≤ S · T .
Im Fall dim H = 1, d.h. H = Span {u} mit u = 0 ist L (H ) = ÜA .

In mehrdimensionalen Hilberträumen gibt es immer nicht kommutierende Ope-
ratoren S, T , d.h. solche mit ST = T S.
Nachweis als ÜA : Betrachten Sie Operatoren, welche einen zweidimensionalen

Teilraum in sich überführen und den Orthogonalraum fest lassen.
Für dim H ≥ 2 ist L (H ) also eine nichtkommutative Banachalgebra mit
Eins, d.h. einem neutralen Element ½ der Multiplikation.
Kommutative Banachalgebren mit Eins sind L∞ (Ω, μ) und C(K) für eine kom-
pakte Menge K, jeweils mit der Supremumsnorm und der üblichen Multipli-
kation von Funktionen. Eine kommutative Banachalgebra ohne Eins ist der
Schwartzraum S unter der Supremumsnorm.
2 Beispiele
n
2.1 Die Spektralnorm auf L ( )
Sei A eine komplexe n × n–Matrix und T : x → Ax die zugehörige lineare
Abbildung. Dann gilt
T = λmax , wo λmax der größte Eigenwert von A∗A ist.
Denn die Matrix A∗A ist symmetrisch und positiv, also gilt nach dem Rayleigh–
Prinzip Bd. 1, § 20 : 4.1

T 2 = max Ax2 x = 1 = max x, A∗Ax x = 1 = λmax .
2.2 Lineare Funktionale

Nach dem Darstellungssatz von Riesz–Fréchet § 9 : 2.8 besitzt jedes lineare Funk-
tional auf einem Hilbertraum H , d.h. jede stetige lineare Funktion L : H →
die Form
Lu = v , u für u ∈ H
mit eindeutig bestimmtem v ∈ H , und es gilt

L = max |Lu| u = 1 = v .
2.3 Rechts– und Linksshift auf 2

Auf dem Hilbertschen Folgenraum 2 (vgl. § 9 : 1.4) betrachten wir den
Rechtsshift R : x = (x1 , x2 , x3 , . . .) −→ (0, x1 , x2 , . . .)
und den
Linksshift L : x = (x1 , x2 , x3 , . . .) −→ (x2 , x3 , . . .) .
Wegen Rx = x gilt R = 1. Mit Lx ≤ x folgt L ≤ 1. Andererseits
gilt L = sup{Lx | x = 1} ≥ Le2 = e1 = 1, also insgesamt L = 1.
2 Beispiele 551
2.4 Unendliche Matrizen

(a) Jedem beschränkten Operator T auf 2 ordnen wir wie folgt eine Doppel-
folge (unendliche Matrix) (amn )n,m∈ zu. Für x = (x1 , x2 , . . .) sei Ln x =
en , T x die n–te Komponente von T x. Dann ist Ln ein lineares Funktional
auf 2 , denn die Cauchy–Schwarzsche Ungleichung ergibt
| Ln x | ≤ T x ≤ T · x .
Nach 2.1 gibt es einen eindeutig bestimmten Vektor y (n) = (an1 , an2 , . . .) ∈ 2
mit

∞
Ln x = y (n) , x = anm xm ,
m=1
und es gilt y (n) = Ln ≤ T .

(b) Wollen wir umgekehrt für eine Doppelfolge (amn ) durch

∞
∞
(∗) T x := a1m xm , a2m xm , . . .
m=1 m=1
einen beschränkten Operator T auf 2 definieren, so muss es nach (a) für y (n) =

∞
(an1 , an2 , . . .) eine Konstante C geben mit y (n) 2 = |anm |2 ≤ C. Diese
m=1
(1)
Bedingung reicht aber nicht aus, wie das Beispiel y = y (2) = . . . zeigt.

∞
Verlangen wir zusätzlich die Konvergenz der Reihe y (n) 2 =: s2 , so liefert
n=1
(∗) einen beschränkten Operator T mir T ≤ s.
( ÜA , verwenden Sie die Cauchy–Schwarzsche Ungleichung.)
2.5 Integraloperatoren
Sei Ω ein Gebiet des Ê n
und G : Ω × Ω → eine messbare Funktion, für
welche die Integrale

F (x) := |G(x, y)|2 dn y und S 2 := F (x) dn x
Ω Ω
konvergieren. Dann ist durch

(T u)(x) := G(x, y) u(y) dn y
Ω
ein beschränkter Operator T auf L2 (Ω) gegeben mit T ≤ S. Denn da die

Funktion Gx : y → G(x, y) zu L2 (Ω) gehört, existiert (T u)(x) = Gx , u , und
nach der Cauchy–Schwarzschen Ungleichung gilt

| (T u)(x) |2 ≤ | G(x, y) |2 dn y · | u(y) |2 dn y = F (x) u2 ,
Ω Ω
also gilt T u ∈ L2 (Ω) und T u ≤ S u.

Bemerkung. Es genügt, die Konvergenz des Integrals für F (x) fast überall
vorauszusetzen. Wie üblich wird im Fall der Divergenz des Integrals F (x) := 0
gesetzt. Nach dem Satz von Tonelli § 8 : 1.8 folgt G ∈ L2 (Ω × Ω).
2.6 Multiplikatoren auf 2

Eine ganz besondere Rolle für die Operatorentheorie auf 2 spielen die Multi-
plikatoren
Ma : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) ,
wobei a = (a1 , a2 , . . . ) eine komplexe Zahlenfolge ist. Diese entsprechen unend-

lichen Diagonalmatrizen anm = δnm an , vgl. 2.4.
Satz. Die Vorschrift Ma liefert genau dann eine lineare Abbildung

Ma : 2 → 2 ,
d.h. Ma x ∈ 2 für alle x ∈ 2 , wenn die Folge a = (a1 , a2 , . . . ) beschränkt ist.
In diesem Fall ist der Operator Ma beschränkt, und es gilt

Ma = sup | an | n ∈ .
Beweis.
(a) Sei (an ) unbeschränkt. Zur Konstruktion eines x ∈ 2 mit Ma x ∈ 2 wählen
wir eine Teilfolge (ank )k mit |ank | > k für k = 1, 2, . . . und setzen

∞
1
x := enk .
k
k=1
Dann gilt x ∈ 2 , x2 = π 2 /6, aber Ma x ∈ 2 , da unendlich viele Komponen-

ten von Ma x betragsmäßig größer als 1 sind.
(b) Sei (an ) beschränkt und s := sup{|an | | n ∈ }. Für x = (x , x , . . . ) ∈

1 2
2
gilt dann |an xn | ≤ s · |xn |, also Ma x ∈ 2 und
Ma x2 ≤ s2 x2 .
Somit ist s eine Normschranke für Ma . Dass s die kleinste Normschranke für
Ma und damit die Operatornorm Ma ist, ergibt sich wie folgt: Für t < s gibt
es ein n ∈ mit t < |an | ≤ s. Es folgt
Ma = sup { Ma x | x = 1} ≥ Ma en = |an | > t ,
also ist t keine Normschranke. 2

2 Beispiele 553
2.7 Multiplikatoren auf L2 (Ω, μ)

Wir betrachten H = L2 (Ω, μ) für einen σ–endlichen Maßraum (Ω, A, μ). Sei
v:Ω→ eine A–messbare Funktion. Dann gilt in Analogie zu 2.6 der
Satz. Die Vorschrift
Mv : u → v · u
liefert genau dann einen linearen Operator auf L2 (Ω, μ) (d.h. genau dann gilt
v · u ∈ L2 (Ω, μ) für alle u ∈ L2 (Ω, μ)), wenn v ∈ L∞ (Ω, μ).
In diesem Fall ist der Multiplikator Mv beschränkt, und es gilt
Mv = v∞ .
Bemerkungen. (i) Für μ–f.ü. gleiche L∞ –Funktionen v, w gilt Mv = Mw .

Nach § 20 : 7.3 erhalten wir den Raum L∞ (Ω, μ), indem wir alle μ–f.ü. glei-
chen Funktionen im Sinne von § 20 : 7.1 identifizieren. Daher liefert die Zuord-
nung v → Mv einen isometrischen Isomorphismus zwischen L∞ (Ω, μ) und
den beschränkten Multiplikatoren auf L2 (Ω, μ). Im Folgenden repräsentieren
wir ein Element von L∞ (Ω, μ) immer durch eine L∞ –Funktion v : Ω → mit
|v(w)| ≤ v∞ = Mv für alle w ∈ Ω.
(ii) Beschränkte Multiplikatoren stellen das Analogon zu unendlichen Diago-
nalmatrizen dar, vgl. 2.6. Ihre Bedeutung liegt darin, dass sich jeder beschränkte
symmetrische Operator T auf einem separablen Hilbertraum H in folgendem
Sinn diagonalisieren lässt: Es gibt ein Wahrscheinlichkeitsmaß μ auf , eine Ê
Ê
reellwertige Funktion v ∈ L∞ ( , μ) und eine unitäre Abbildung U : H →
Ê
L2 ( , μ) mit
T = U −1 Mv U (§ 22 : 3.6).
In der Quantenmechanik werden beschränkte Potentiale v durch beschränkte

Multiplikatoren Mv beschrieben, vgl. § 18 : 4.3.
Beweis.
(a) Sei v ∈ L∞ (Ω, μ). Dann sind die Bn := {ω ∈ Ω | n ≤ |v(ω)| < n + 1}
messbare, paarweise disjunkte Mengen mit μ(Bn ) > 0 für unendlich viele n,
denn andernfalls gäbe es ein N ∈ Æ
mit |v(ω)| ≤ N μ–f.ü.
Wir wählen eine Folge (nk )k mit μ(Bnk ) > 0 (k ∈ Æ). Da μ σ–endlich ist, gibt
es Mengen Ak ∈ A mit Ak ⊂ Bk und
(∗) 0 < ck := μ(Ak ) < ∞ , k ≤ nk ≤ |v(ω)| für ω ∈ Ak .
Die Ak sind ebenfalls paarweise disjunkt. Die Elementarfunktionen

1 χ
uk := Ak
k ck

n
sind paarweise orthogonal mit uk = 1
k
. Ferner existiert für sn := uk
k=1

∞
u(ω) := lim sn (ω) = uk (ω) für jedes ω ∈ Ω ,
n→∞ k=1
denn in der Reihe ist höchstens ein Glied von Null verschieden.

∞
∞
Andererseits konvergiert nach § 9 : 4.2 (b) mit 1
k2
die Orthogonalreihe uk
k=1 k=1
im Quadratmittel, und nach § 20 : 7.2 konvergiert eine Teilfolge von (sn ) punkt-

∞
weise μ–f.ü. Somit gilt u = uk im L2 –Sinne. Wegen 0 ≤ sn (ω) ≤ u(ω) und
k=1
|v(ω)| ≥ k für ω ∈ Ak gilt für alle ω ∈ Ω

n
1 χ
| v(ω) | · | u(ω) | ≥ | v(ω) | · | sn (ω) | ≥ Ak (ω)
ck
k=1
und daher

n
| v · sn |2 dμ ≥ c−2
k μ(Ak ) = n .
Ω k=1
Also kann v · u nicht zu L2 (Ω, μ) gehören.
(b) Sei v ∈ L∞ (Ω, μ) und C := v∞ . Für u ∈ L2 (Ω, μ) gilt dann
| v · u |2 ≤ C 2 |u|2 μ–f.ü.
Nach dem Majorantenkriterium § 20 : 4.5 folgt v · u ∈ L2 (Ω, μ) sowie v · u ≤

C u. Damit ist C eine Normschranke für Mv : u → v · u.
Sei ε > 0 gegeben. Dann hat B = {|v| > C − ε} positives Maß. Wegen der σ–
Endlichkeit von μ gibt es eine Menge A ∈ A mit A ⊂ B und 0 < μ(A) < ∞.
Für u := μ(A)−1/2 χA gilt dann
u ∈ L2 (Ω, μ) , u = 1 und | u · v | ≥ (C − ε) | u | ,
also v · u ≥ C − ε. Es folgt Mv ≥ C − ε für jedes ε > 0. 2
2.8 Operatoren auf endlichdimensionalen normierten Räumen

Satz. Ist (V, · ) ein normierter Raum über und B = (v1 , . . . , vn ) eine
Basis für V mit v1 = . . . = vn = 1, so ist die Koordinatenabbildung
T :V → n
, u = x1 v1 + . . . + un vn → x = (x1 , . . . , xn )
bijektiv und stetig mit stetiger Umkehrabbildung T −1 .

2 Beispiele 555
Folgerungen. (a) Jeder endlichdimensionale normierte Raum V ist vollstän-

dig, und jede beschränkte, abgeschlossene Teilmenge von V ist kompakt.
(b) Jeder lineare Operator S : V → V ist beschränkt.
Beweis.
Auf n wählen wir die Norm x1 := |x1 | + . . . + |xn |.
Für u = x1 v1 + . . . + xn vn gilt dann nach der Dreiecksungleichung
u ≤ |x1 | + . . . + |xn | = T u1 .
Dies zeigt die Beschränktheit von T −1 und T −1 ≤ 1.

Daher ist die Menge K := {u ∈ V | T u1 = 1} als Bild der kompakten Menge
S := {x ∈ n | x1 = 1} unter T −1 kompakt. Da die Norm stetig ist, existiert
:= min{u | u ∈ K}. Aus = 0 würde 0 ∈ K, also 0 = T 0 ∈ S folgen.
Somit gilt > 0, d.h.
T u1 = 1 =⇒ u ≥ > 0.

−1
Daraus folgt leicht, dass T beschränkt ist mit Normschranke ÜA .
Folgerung (a): Wegen u ≤ T u1 ≤ −1 u führen die Operatoren T und
T −1 konvergente Folgen in konvergente Folgen über und beschränkte Mengen
in beschränkte Mengen.
Folgerung (b): Für einen linearen Operator S : V → V ist der Operator
A = T ST −1 : n → n nach 2.1 stetig, also ist auch S = T −1AT stetig. 2
2.9 Der Fortsetzungssatz

Sei U ein dichter Teilraum des Banachraums V , und der Operator A : U → V
sei linear und beschränkt: Au ≤ C ·u für u ∈ U . Dann lässt sich A zu einem
eindeutig bestimmten beschränkten linearen Operator A : V → V fortsetzen. Für
diesen gilt

A = sup Au u ∈ U, u ≤ 1 .
Beweis in § 10 : 5.1.
2.10 Die Fouriertransformation und der Paritätsoperator auf L2 ( Ê)

n
Wir rekapitulieren die Ergebnisse von § 12, Abschnitt 3. Der Schwartzraum

Ê
S ( n ) der schnellfallenden Funktionen auf n
Ê Ê
ist dicht in L2 ( n). Für ei-
Ê
ne Funktion u ∈ S ( n) ist die Fouriertransformierte u Ê
/ ∈ S ( n) definiert
durch

/(y) := (2π)−n/2
u e−i x , y u(x) dn y .
Ên
/ und durch
Durch die Fouriertransformation F : u → u
(Su)(x) := u(−x)
sind unitäre Operatoren
F : S( Ê)n
→ S( Ê n
), S : S( Ê n
) → S( Ê)
n
gegeben mit S −1 = S und F −1 = SF 2 .

Nach 2.9 lassen sich F, S zu beschränkten Operatoren auf L2 ( n) fortsetzen, Ê
die wir wieder mit F, S bezeichnen. In § 12 : 4.2 wurde dargelegt, dass auch die
Fortsetzungen unitär sind und den Identitäten F −1 = SF 2 , S −1 = S genügen.
Ê Ê
/ gilt nur für u ∈ L1 ( n ) ∩ L2 ( n ), aber i.A. nicht
Die Integraldarstellung für u
2
Ê
für u ∈ L ( ); Näheres hierzu in § 12 : 4.2. S wird in der Quantenmechanik
n
der der Paritätsoperator auf n genannt. Ê

3 Die C*–Algebra L (H )
3.1 Invertierbare Operatoren
(a) Der Satz von der stetigen Inversen. Ist ein linearer Operator T : V1 → V2
zwischen Banachräumen V1 , V2 stetig und bijektiv, so ist auch T −1 stetig.
Den (schwierigen) Beweis finden Sie in Hirzebruch–Scharlau [127] § 9 und
in Reed–Simon [130] III.5.
Für einen Operator T ∈ L (H ) sind daher folgende Aussagen äquivalent:
(i) T : H → H ist bijektiv (Invertierbarkeit im Sinne der linearen Algebra),
(ii) es gibt einen Operator S ∈ L (H ) mit T S = ST = ½ (Invertierbarkeit in
der Banachalgebra L (H )).
Wir sprechen im Folgenden schlicht von Invertierbarkeit in L (H ), kurz von
Invertierbarkeit.
(b) Sind T1 , T2 ∈ L (H ) invertierbar, so auch T1 T2 , und es gilt
(T1 T2 )−1 = T2−1 T1−1 .
In unendlichdimensionalen Hilberträumen folgt (anders als in endlichdimensio-
nalen) aus der Invertierbarkeit von T1 T2 weder die Invertierbarkeit von T1 oder
T2 noch die Invertierbarkeit von T2 T1 .
Beispiel. Für den Rechtsshift R und den Linksshift L in 2 (vgl. 2.3) gilt
LR = ½, RL : (x1 , x2 , x3 , . . . ) −→ (0, x2 , x3 , . . . ) .
Hier ist LR invertierbar, RL ist aber weder surjektiv noch injektiv. R ist
injektiv, aber nicht surjektiv; L ist surjektiv, aber nicht injektiv.
(c) Ist für einen Operator T ∈ L (H ) eine Potenz T m invertierbar ( m =
2, 3, . . . ), so ist T selbst invertierbar ÜA .
3 Die C*–Algebra L (H ) 557
Nach (b) existiert dann (T n )−1 = (T −1 )n für alle n ∈ .

Für die Potenzen T 0 := , T −n := (T n )−1 besteht die Gruppeneigenschaft
T m+n = T m T n = T n T m für alle m, n ∈ .
3.2 Der adjungierte Operator

Satz. Zu jedem Operator T ∈ L (H ) gibt es einen eindeutig bestimmten Ope-
rator T ∗ ∈ L (H ) mit
v , T u = T ∗v , u für u, v ∈ H .
T ∗ heißt der zu T adjungierte Operator oder die Adjungierte von T .
Beweis.
Für jeden festen Vektor v ∈ H ist durch Lv u := v , T u ein lineares Funk-
tional Lv : H → gegeben: |Lv u| ≤ v · T u ≤ (v · T ) · u.
Nach 2.2 gibt es einen eindeutig besimmten, mit T ∗ v bezeichneten Vektor mit
v , T u = Lv u = T ∗ v , u für alle u ∈ H .
T ∗ : H → H ist linear wegen
T ∗ (α1 v1 + α2 v2 ) , u = α1 v2 + α2 v2 , T u
= α1 v1 , T u + α2 v2 , T u
= α1 T ∗ v1 , u + α2 T ∗ v2 , u
= α1 T ∗ v1 , u + α2 T ∗ v2 , u
= α1 T ∗ v1 + α2 T ∗ v2 , u
für alle u ∈ H . Die Behauptung folgt mit dem üblichen Schluss
w1 , u = w2 , u für alle u ∈ H =⇒ w1 = w2 .
∗
T ist beschränkt, denn nach 2.2 gilt

T ∗ v = Lv = max | v , T u | u = 1

≤ sup v · T u u = 1 = v · T ,
also ist T eine Normschranke für T ∗ . 2
3.3 Rechenregeln für die Adjungierte, L (H ) als C*–Algebra

(a) Für S, T ∈ L (H ) gilt
(1) T ∗∗ = T ,
(2) (αS + βT )∗ = αS ∗ + βT ∗ ,
(3) (ST )∗ = T ∗ S ∗ ,
(4) T ∗ = T ,
(5) T ∗ T = T 2 .
(b) L (H ) ist also eine Banachalgebra mit Eins (vgl. 1.5), auf der eine bijektive
Abbildung T → T ∗ erklärt ist, die (1) involutorisch, (2) antilinear, (4) isome-
trisch ist, die Bedingung (3) (ST )∗ = T ∗ S ∗ erfüllt und die C*–Eigenschaft (5)
besitzt. Eine solche Struktur heißt C*–Algebra mit Eins.
Weitere Beispiele für C*–Algebren mit Eins sind L∞ (Ω, μ) und C(K) für eine
kompakte Menge K, jeweils mit der Supremumsnorm und mit f ∗ := f .
(c) Mit T ∈ L (H ) ist auch T ∗ invertierbar, und es gilt
(T ∗ )−1 = (T −1 )∗ .
(d) Bemerkung. Gilt für eine Abbildung S : H → H

v , T u = Sv , u für alle u, v ∈ H ,
∗
so folgt S = T , siehe Beweis 3.2.
Beweis.
(a) Die Eigenschaften (1), (2), (3) ergeben sich nach dem Prinzip (d) durch
einfaches Nachrechnen ÜA .
(4) Aus dem Beweis 3.2 entnehmen wir T ∗ ≤ T . Mit Hilfe von (1) ergibt
sich daraus T = (T ∗ )∗ ≤ T ∗ .
(5) Aus (4) und 1.2 (b) folgt T ∗ T ≤ T ∗ · T = T 2 . Die umgekehrte
Ungleichung T 2 ≤ T ∗ T folgt aus
T u2 = T u , T u = u , T ∗ T u ≤ u · T ∗ T u ≤ T ∗ T · u2 .
(c) Offenbar gilt ½∗ = ½. Nach Definition von (T −1 )∗ für invertierbae T gilt

v , ½u = v, T −1
Tu = (T −1 ∗
) v , Tu = T ∗ (T −1 )∗ v , u
für alle u, v ∈ H , also T ∗ (T −1 )∗ = ½∗ = ½. Entsprechend folgt (T −1 )∗ T ∗ = ½
∗ ∗ −1
ÜA . Also ist T invertierbar und (T ) = (T −1 )∗ . 2
3.4 Beispiele
(a) Symmetrische Operatoren. Die Bedingung T ∗ = T bedeutet
v, Tu = Tv, u für alle u, v ∈ H .
Operatoren T ∈ L (H ) mit dieser Eigenschaft heißen symmetrisch, in man-
chen Lehrbüchern auch hermitesch. Zu den symmetrischen Operatoren gehö-
ren nach § 9 : 2.6 (b) die orthogonalen Projektoren.
(b) Für den Linksshift L und den Rechtsshift R auf 2 (vgl. 2.3) bestehen die
Beziehungen L∗ = R und R∗ = L. Denn für x = (x1 , x2 , . . .) und y = (y1 , y2 , . . .)
gilt

∞
∞
y , Rx = yk xk−1 = y k+1 xk = Ly , x ,
k=2 k=1

∞
∞
y , Lx = yk xk+1 = yk−1 xk = Ry , x .
k=1 k=2
(c) Sei a = (a1 , a2 , . . .) eine beschränkte Folge und a = (a1 , a2 , . . .). Für den
in 2.6 definierten Multiplikator Ma gilt dann Ma∗ = Ma ÜA .
(d) Sei v ∈ L∞ (Ω, μ). Dann gilt Mv ∗ = Mv , vgl. 2.7.
(e) Für den in 2.5 definierten Integraloperator T ist

(T ∗ v)(x) = G(y, x) v(y) dn y .
Ω
Denn nach dem Satz von Fubini–Tonelli (§ 8 : 1.8) gilt für v, u ∈ L2 (Ω)

v, Tu = v(y) G(y, x) u(x) dn x dn y
Ω Ω

= u(x) G(y, x) v(y) dn y dn x .
Ω Ω
(f) Der Operator des unbestimmten Integrals. Für u ∈ H := L2 [0, 1] setzen

wir
x
(T u)(x) := u(t) dt .
0
√
Aufgabe. (i) Zeigen Sie: T ∈ L (H ) und T ≤ 1/ 2. (Verwenden Sie die
Cauchy–Schwarzsche Ungleichung.)
(ii) Bestimmen Sie T ∗ .
(g) Sei H ein Hilbertraum. Ein Operator U : H → H ist genau dann unitär,
d.h. bijektiv und isometrisch, wenn U ∗ = U −1 ÜA .
3.5 Kern und Bild von T und T ∗

Satz. Für beschränkte lineare Operatoren T auf einem Hilbertraum H gilt
(a) Kern T ∗ = (Bild T )⊥ ,
(b) (Kern T ∗ )⊥ = Bild T .
(c) Bild T muss nicht abgeschlossen sein.
Beweis.
Wegen der Stetigkeit von T und T ∗ sind Kern T und Kern T ∗ abgeschlossen.
(a) Für v ∈ Kern T ∗ gilt 0 = T ∗ v , u = v , T u , also v ∈ (Bild T )⊥ . Für
v ∈ (Bild T )⊥ gilt umgekehrt 0 = v , T u = T ∗ v , u für alle u ∈ H . Für
u = T ∗ v ergibt sich insbesondere T ∗ v = 0, also v ∈ Kern T ∗ .
(b) Aus (a) ergibt sich mit § 9 : 2.5 (b): (Kern T ∗ )⊥ = (Bild T )⊥⊥ = Bild T .
(c) Als Beispiel wählen wir den Multiplikator Ma in 2 mit a = (1, 21 , 13 , . . . ).
Nach § 9 : 1.4 (b) liegt der Teilraum 20 = Span {e1 , e2 , . . . } aller abbrechenden

N
Folgen (x1 , . . . , xN , 0, 0, . . . ) dicht in 2 . Für y = yk ek ∈ 20 gilt y = Ma x

N k=1
mit x = k yk ek . Es folgt 20 ⊂ Bild Ma , also ist Bild Ma dicht in 2 . Es ist
k=1
aber a ∈ Bild Ma , somit gilt Bild Ma = 2 = Bild Ma . 2
3.6 Formen und Operatoren, positive Operatoren

(a) Sei U ein Teilraum des Hilbertraums H . Eine Funktion Q : U × U →
heißt Sesquilinearform (kurz Form) auf U , wenn folgendes gilt:
u → Q(v, u) ist linear
v → Q(v, u) ist antilinear, d.h.
Q(α1 v1 + α2 v2 , u) = α1 Q(v1 , u) + α2 Q(v2 , u) .
Beispiele. (i) Q(v, u) := v , Au für jeden linearen Operator A : U → H .

A muss nicht beschränkt sein. Beispiel: H = L2 ( ), U = S , Au = −u .
(ii) Quadratische Formen auf U . Eine Funktion Q : U × U → heißt
quadratische Form auf U , wenn u → Q(v, u) linear ist und wenn Q(u, v) =
Q(v, u) gilt. Dann ist Q eine Form mit Q(u, u) ∈ für u ∈ U .
Eine Form Q auf U heißt beschränkt mit Formschranke C, wenn
| Q(v, u) | ≤ C v · u auf U.
Für T ∈ L (H ) liefert Q(v, u) := v , T u eine beschränkte Form auf H mit

Formschranke T .
(b) Die Polarisierungsgleichung. Für eine Sesquilinearform Q auf U gilt

1

Q(v, u) = 4 Q(u + v, u + v) − Q(u − v, u − v)
i

+ 4 Q(u + iv, u + iv) − Q(u − iv, u − iv) .
Damit ist die Form Q schon durch die Werte Q(u, u) für u ∈ U eindeutig
bestimmt.
Beweis durch Ausnützen der Sesquilinearität als ÜA .
Für lineare Operatoren A : U → H folgt

v , Au = 1
4
u + v , A(u + v) − u − v , A(u − v)
i

+ 4 u + iv , A(u + iv) − u − iv , A(u − iv) .
Im Fall U = H ist A durch die Werte u , Au auf U festgelegt. Das ergibt

sich aus dem Fundamentallemma § 9 : 3.2 ÜA .
Satz. Sei U ein Teilraum des Hilbertraums H und A : U → H ein linearer,

nicht notwendig beschränkter Operator. Genau dann erfüllt A die Symmetrie-
bedingung
v , Au = Av , u für u, v ∈ U ,
wenn u , Au auf U reellwertig ist.

Denn aus der Symmetriebedingung folgt u , Au = Au , u = u , Au für
u ∈ U . Ist umgekehrt u , Au reellwertig auf U , so folgt aus der Polarisierungs-
gleichung Re u , Av = Re v , Au und Im u , Av = −Im v , Au , also
Av , u = u , Av = v , Au für u, v ∈ V . 2
(c) Satz. Für jeden Operator T ∈ L (H ) ist durch Q(v, u) := v , T u eine

beschränkte Form auf H mit Formschranke T gegeben. Umgekehrt gibt es
zu jeder beschränkten Form Q auf H genau einen Operator T ∈ L (H ) mit
Q(v, u) = v , T u für alle u, v ∈ H . Jede Formschranke für Q ist eine Norm-
schranke für T .
Beschränkten quadratischen Formen Q entsprechen auf diese Weise beschränkte
symmetrische Operatoren T . Diese sind durch die Werte u , T u für u ∈ H
eindeutig bestimmt.
Beweis.
Die erste Behauptung ist leicht einzusehen, vgl. (a).
Für eine beschränkte Form Q auf H mit Formschranke C liefert
Lv u := Q(v, u)
ein lineares Funktional auf H , denn es gilt | Lv u | ≤ (C · v) · u. Nach 2.2
gibt es daher einen mit Sv bezeichneten Vektor, so dass
Q(v, u) = Lv u = Sv , u ;
ferner gilt Sv = Lv ≤ C · v.

Aus der Antilinearität von Q folgt, dass S linear ist ÜA . Somit gilt S ∈ L (H )
und S ≤ C. Der Operator T := S ∗ leistet das Gewünschte.
Schließlich gilt Q(v, u) = Q(u, v) ⇐⇒ v , T u = u , T v = T v , u . 2
(d) Positive Operatoren. Ein Operator T ∈ L (H ) heißt positiv (T ≥ 0),

wenn
u , T u ≥ 0 für alle u ∈ H
und positiv definit (T > 0) wenn u , T u > 0 für alle u ∈ H mit u = 0.

Nach (b) sind positive Operatoren S, T ∈ L (H ) symmetrisch.
Für symmetrische S, T ∈ L (H ) schreiben wir S ≤ T , falls T − S ≥ 0. Zwei
Operatoren müssen in diesem Sinn nicht vergleichbar sein. Es gilt
R ≤ S , S ≤ T =⇒ R ≤ T ,
S ≤ T , T ≤ S =⇒ S = T .
Das Erste ist klar. Aus S ≤ T, T ≤ S folgt zunächst

u , (S − T )u = 0 für alle u ∈ H und dann S − T = 0 nach (c).
Für positive Operatoren gilt die Cauchy–Schwarzsche Ungleichung

v , T u 2 ≤ v , T v u, T u .
Denn für Tn := T + n1 ½ gilt Tn > 0, also liefert v , Tn u ein Skalarprodukt auf

H und erfüllt die Cauchy–Schwarzsche Ungleichung

v , Tn u 2 ≤ v , Tn v u , Tn u .
Die Behauptung folgt für n → ∞ ÜA . 2
4 Konvergenz von Operatoren

4.1 Konvergenzbegriffe auf L (H )
(a) Für beschränkte Operatoren T, T1 , T2 , . . . auf einem Hilbertraum H defi-
nieren wir die Normkonvergenz (gleichmäßige Konvergenz, Konvergenz
in der Operatornorm) Tn → T durch
lim Tn = T : ⇐⇒ T − Tn → 0 für alle n → ∞ .

n→∞
s
Die starke (punktweise) Konvergenz Tn −→ T ist definiert durch
s–lim Tn = T : ⇐⇒ lim Tn u = T u für alle u ∈ H

n→∞ n→∞
4 Konvergenz von Operatoren 563
w
und die schwache Konvergenz Tn −→ T durch
w–lim Tn = T : ⇐⇒ lim v , Tn u = v , T u für alle u, v ∈ H .

n→∞ n→∞
In der Literatur finden Sie häufig die Bezeichnungen stop–lim für s–lim (von
strong operator limit) und wop–lim für w–lim (von weak operator limit).
(b) Genau dann gilt w–lim Tn = T , wenn

n→∞
lim u , Tn u = u , T u für alle u ∈ H .

n→∞
Das folgt unmittelbar aus der Polarisierungsgleichung 3.6 (a).

In der Quantenmechanik bedeutet schwache Konvergenz bedeutet Konvergenz
der Erwartungswerte, vgl. § 18 : 4.4.
4.2 Beziehungen zwischen den Konvergenzbegriffen

s
(a) Tn → T =⇒ Tn −→ T ,
s w
(b) Tn −→ T =⇒ Tn −→ T .
(c) Für endlichdimensionale Hilberträume fallen alle diese Konvergenzbegriffe
zusammen.
(d) Für unendlichdimensionale Hilberträume handelt es sich um drei verschie-
dene Arten von Konvergenz.
Beweis.
(a) T − Tn → 0 =⇒ T u − Tn u = (T − Tn )u ≤ T − Tn · u → 0.
s
(b) Tn −→ T =⇒ | v , T u − v , Tn u | = | v , T u − Tn u |
≤ v · T u − Tn u → 0 .
(c) Da jeder N –dimensionale Hilbertraum über nach § 9 : 1.2 isomorph zu
N
ist, müssen wir nur zeigen: Für lineare Abbildungen T, Tn : N → N
folgt aus schwacher Konvergenz die Normkonvergenz. Für die Matrizen
(n)
MK (Tn ) = An = aik und MK (T ) = A = (aik )
w
folgt aus Tn −→ T
(n)
aik = ei , An ek → ei , Aek = aik für n → ∞ .
Daraus ergibt sich

(n)
T − Tn 2 ≤ A − An 22 = |aik − aik |2 → 0 für n → ∞. 2
i,k
(d) Nach § 9 : 4.8 ist jeder separable, unendlichdimensionale Hilbertraum iso-

morph zu 2 ; es genügt also, Gegenbeipiele in 2 zu finden. Dass aus starker
Konvergenz nicht die Normkonvergenz folgt, zeigen die iterierten Linksshifts
Tn = Ln : x = (x1 , x2 , . . .) → (xn+1 , xn+2 , . . . ) , vgl. 2.3.

∞
n
s
Wegen Tn x2 = |xk |2 = x − | xk |2 → 0 für n → ∞ gilt Tn −→ 0.
k=n+1 k=1
Für m > n erhalten wir
Tm − Tn ≥ (Tm − Tn ) em = em−n = 1 ,
also bilden die Tn keine Cauchy–Folge in der Operatornorm. Eine schwach, aber
nicht stark konvergente Folge von Operatoren bilden die iterierten Rechtsshifts
Tn = Rn , vgl. 2.3:
Für x = (x1 , x2 , . . . ) und y = (y1 , y2 , . . . ) gilt
∞
y , Tn x = yn+k xk ≤ x
∞
1/2
|yk |2 → 0
k=1 k=n+1
für n → ∞, also Tn −→ 0.
w
Schon die Folge (Tn e1 ) = (en+1 ) kann nicht konvergieren, denn

√
Tm e1 − Tn e1 = em+1 − en+1 = 2 für m > n . 2
4.3 Der Satz von der gleichmäßigen Beschränktheit

Eine Folge von Operatoren Tn : V1 → V2 zwischen normierten Räumen heißt
punktweise beschränkt, wenn die Folge (Tn u) für jedes u ∈ V1 beschränkt
ist. Die Folge heißt normbeschränkt, wenn die Folge (Tn ) beschränkt ist.
Satz. Jede punktweise beschränkte Folge stetiger Operatoren Tn : V1 → V2 auf
einem Banachraum V1 ist normbeschränkt.
Den nichttrivialen Beweis finden Sie in Hirzebruch–Scharlau [127] § 8 und
Reed–Simon [130, I] III.9.
Eine Folge von Operatoren Tn ∈ L (H ) heißt schwach beschränkt, wenn es zu
je zwei Vektoren u, v ∈ H eine Zahl c(u, v) gibt mit | v , Tn u | ≤ c(u, v) für
n = 1, 2, . . . .
Folgerung. Jede schwach beschränkte Folge von Operatoren Tn ∈ L (H ) ist
normbeschränkt.
Beweis.
Für festes v ∈ H sind durch Ln u = v , Tn u = Tn∗ v , u lineare Funktionale

Ln gegeben mit |Ln u| ≤ c(u, v) =: k(u) für n ∈ . Aus der punktweisen
Beschränktheit der Ln folgt Normbeschränktheit, d.h. Ln = Tn∗ v ≤ c(v)
für n = 1, 2, . . . mit einer Zahl c(v). Somit sind die Tn∗ punktweise beschränkt,
also normbeschränkt: Tn = Tn∗ ≤ C mit passendem C. 2
4.4 Rechenregeln für konvergente Folgen und Reihen

(a) Aus der gleichmäßigen/starken/schwachen Konvergenz Sn → S, Tn → T
folgt jeweils die entsprechende Konvergenz der Linearkombinationen
αSn + βTn → αS + βT .
(b) Aus der gleichmäßigen/starken/schwachen Konvergenz Tn → T folgt je-
weils die entsprechende Konvergenz
STn → ST und Tn S → T S für S ∈ L (H ) .
(c) Für Normkonvergenz/starke Konvergenz gilt jeweils die Implikation
Sn → S , Tn → T =⇒ Sn Tn → ST .
(d) Für Normkonvergenz/schwache Konvergenz gilt jeweils
Tn → T =⇒ Tn∗ → T ∗ .
(e) Die gleichmäßige/starke/schwache Konvergenz von Reihen in L (H ) defi-
nieren wir in naheliegender Weise durch

∞
n
S = Ak ⇐⇒ Sn := Ak → S für n → ∞ .
k=0 k=0
Aus (a) und (b) ergibt sich

∞
∞
∞
S = Ak , T ∈ L (H ) =⇒ T S = T Ak und ST = Ak T .
k=0 k=0 k=0
w w w
(f) Aus Sn −→ S und Tn −→ T folgt nicht Sn Tn −→ ST .
(g) Aus Tn −→ T folgt nicht Tn∗ −→ T ∗ .
s s
Beweis.
(a), (b) und (d) als ÜA .
s
(c) Wegen der punktweisen Konvergenz Sn −→ S gibt es nach 4.3 eine Kon-

stante C mit Sn ≤ C für alle n ∈ . Die Behauptung über die Normkonver-
genz folgt aus
Sn Tn − ST = (Sn − S)T + Sn (Tn − T )
≤ Sn − S · T + C · Tn − T .
Zum Beweis der Aussage über punktweise Konvergenz fixieren wir u ∈ H und
erhalten entsprechend
Sn Tn u − ST u ≤ Sn T u − ST u + Sn (Tn u − T u)
≤ Sn (T u) − S(T u) + C · Tn u − T u → 0 für n → ∞ .

(f) Betrachten Sie die iterierten Shifts Sn = Ln , Tn = Rn auf 2 , vgl. 4.2 (d).
(g) Für Tn = Ln gilt Tn∗ = Rn , vgl. 3.4 (b) und 3.3 (3). Aus dem Beispiel zu
4.2 (d) entnehmen wir, dass die Tn stark konvergieren, die Tn∗ aber nicht. 2
4.5 Der Satz von der monotonen Konvergenz

(a) Konvergenz schwacher Cauchy–Folgen. Eine Folge von Operatoren
Tn ∈ L (H ) konvergiert genau dann schwach gegen einen Operator T ∈ L (H ),
wenn die Folge der Skalarprodukte ( u , Tn u ) für jedes u ∈ H eine Cauchy–
Folge in ist.
Beweis.
Sei ( u , Tn u ) für jedes u ∈ H eine Cauchy–Folge. Aus der Polarisierungs-
gleichung 3.6 (b) folgt: Für u, v ∈ H ist ( v , Tn u ) eine Cauchy–Folge, also
existiert
Q(v, u) := lim v , Tn u .
n→∞
Nach der Folgerung 4.3 gibt es ein Konstante C mit Tn ≤ C für alle n ∈ ,
also gilt |Q(v, u)| ≤ C ·v·u. Nach 3.6 (c) gibt es einen Operator T ∈ L (H )
mit
lim v , Tn u = Q(v, u) = v , T u für u, v ∈ H . 2
n→∞
(b) Satz von der monotonen Konvergenz. Jede absteigende Folge positiver
Operatoren Tn ∈ L (H ) konvergiert stark gegen einen positiven Operator T ∈
L (H ).
Beweis.
(i) Schwache Konvergenz. Es gelte T1 ≥ T2 ≥ · · · ≥ 0. Dann existiert nach
dem Monotoniekriterium für reelle Folgen lim u , Tn u für alle u ∈ H . Nach
n→∞
(a) gibt es daher einen Operator T ∈ L (H ) mit
T = w–lim Tn ,
n→∞
und es gilt Tn ≥ T ≥ 0 für n = 1, 2, . . . .

(ii) Starke Konvergenz. Wir setzen B := Tn − T und v := Bu = (Tn − T )u für
ein festes u ∈ H . Anwendung der Cauchy–Schwarzschen Ungleichung 3.6 (d)
auf B ≥ 0 ergibt
(Tn − T )u4 = | (Tn − T )u , (Tn − T )u |2 = | v , Bu |2

≤ v , Bv · u , Bu
= v , (Tn − T )v · u , Bu
≤ v , (T1 − T )v · u , Bu
≤ T1 − T · v2 · u , Bu
= T1 − T · (Tn − T )u2 u , Bu ,
also
(Tn − T )u2 ≤ T1 − T · u , (Tn − T )u → 0 für n → ∞ . 2
4.6 Konvergenz von Multiplikatoren auf L2 (Ω, μ)

(a) Normkonvergenz. Eine Folge von Multiplikatoren Mvn ist genau dann norm-
konvergent, wenn die vn eine Cauchy–Folge in L∞ (Ω, μ) bilden. Da der Raum
L∞ (Ω, μ) vollständig ist, gibt es dann ein v ∈ L∞ (Ω, μ) mit
Mv − Mvn = v − vn ∞ → 0 für n → ∞ .
Das folgt unmittelbar aus Mv = v∞ , vgl. 2.7.
(b) Monotone Konvergenz. Ist (vn ) eine monoton fallende Folge von positiven
Funktionen in L∞ (Ω, μ), so existiert der Grenzwert
v(ω) = lim vn (ω) für alle ω ∈ Ω,

n→∞
und es gilt v ∈ L∞ (Ω, μ) sowie
Mv = s–lim Mvn .
n→∞
Dass die Mvn stark gegen einen Operator T ≥ 0 konvergieren, ergibt sich wegen
Mv1 ≥ Mv2 ≥ · · · ≥ 0 aus 4.5 (b). Die Gleichung T = Mv ist eine Folge des
Satzes von der monotonen Konvergenz für μ–Integrale: Für u ∈ H bilden die
fn := |vn · u − v · u|2 = |vn − v|2 · |u|2 eine absteigende Folge μ–integrierbarer
Funktionen mit lim fn (ω) = 0 für alle ω ∈ Ω. Daraus folgt
n→∞

vn · u − v · u2 = fn dμ → 0 für n → ∞ .
Ω
4.7 Starke Konvergenz orthogonaler Projektoren

Konvergieren die orthogonalen Projektoren Pn stark gegen einen Operator P ,
so ist auch P ein orthogonaler Projektor.
Vertauschen die Pn mit einem Operator T ∈ L (H ), Pn T = T Pn , so vertauscht
auch P mit T .
Beweis als ÜA unter Beachtung von § 9 : 2.6.
5 Das Spektrum beschränkter Operatoren

5.1 Spektrum und Resolvente
(a) Das Spektrum ist für die Theorie beschränkter und unbeschränkter Opera-
toren ein zentraler Begriff. Dass ein in der Optik gebräuchliches Wort Namens-
geber für einen mathematischen Begriff wurde, ist kein Zufall, siehe 5.7. Wird
eine quantenmechanische Observable durch einen beschränkten symmetrischen
Operator (allgemeiner durch einen selbstadjungierten Operator) dargestellt, so
erweist sich das Spektrum im mathematischen Sinn als die Menge der möglichen
Messwerte dieser Observablen, vgl. § 18 : 3.3 und § 25 : 4.4.
Vereinbarung. Im Folgenden schreiben wir
T − λ , λ − T für T − λ½ , λ½ − T .
(b) Definition. Das Spektrum σ(T ) eines Operators T ∈ L (H ) ist definiert
als die Menge

σ(T ) := λ∈ T − λ ist nicht invertierbar .
Beachten Sie, dass nach 3.1 der Operator T − λ : H → H genau dann bijektiv
ist, wenn er eine stetige Inverse besitzt. In 6.3 zeigen wir σ(T ) = ∅.
Das Komplement des Spektrums,

(T ) := \ σ(T ) = λ∈ T − λ ist invertierbar ,
heißt Resolventenmenge von T . Für λ ∈ (T ) heißt
R(λ, T ) := (λ − T )−1 = − (T − λ)−1 ∈ L (H )
die Resolvente von T zum Wert λ.
(c) Einteilung des Spektrums. Das Spektrum von T zerfällt in drei disjunk-
te Mengen: Das Punktspektrum (Eigenwertspektrum)

σp (T ) := λ∈ T − λ ist nicht injektiv ,
das kontinuierliche Spektrum

σc (T ) := λ ∈ σ(T ) T − λ ist injektiv, Bild (T − λ) ist dicht in H
und das Restspektrum

σc (T ) := λ∈ T − λ ist injektiv, Bild (T − λ) = H
(d) Bemerkungen. (i) Ist H endlichdimensional, so besteht das Spektrum
eines Operators T ∈ L (H ) nur aus Eigenwerten, denn T − λ : H → H ist
genau dann bijektiv, wenn T − λ injektiv ist. Im unendlichdimensionalen Fall
gibt es dagegen Operatoren mit rein kontinuierlichem Spektrum; dies ergibt sich
in 5.3, Bemerkung (iii).
5 Das Spektrum beschränkter Operatoren 569
(ii) Die Bezeichnungen Punktspektrum und kontinuierliches Spektrum sind

nicht wörtlich zu nehmen. Es gibt Operatoren, deren Punktspektrum ein Gebiet
ist und Operatoren, deren kontinuierliches Spektrum aus isolierten Punkten be-
steht (Beispiele in 5.6 und 5.2). Die Wortwahl kontinuierlich“ erklärt sich aus
”
Eigenschaften der Spektralschar (§ 22 : 1.5, 1.6).
(iii) In der Literatur wird auch der Begriff Residualspektrum verwendet, teils
für das Restspektrum, teils in der Bedeutung { λ ∈ | Bild (T − λ) = H }.
(e) Aufgaben. Zeigen Sie:
(i) σ(½) = σp (½) = {1}, σ(0) = σp (0) = {0},
(ii) λ ∈ σ(T ) ⇐⇒ λ − λ0 ∈ σ(T − λ0 ),
(iii) λ ∈ σ(T ) =⇒ λ2 ∈ σ(T 2 ).
5.2 Das Spektrum von Multiplikatoren in 2

Sei a = (a1 , a2 , . . . ) eine beschränkte Folge komplexer Zahlen und
Ma : 2 → 2 , x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) .
Nach 2.6 gilt Ma ∈ L (2 ) und Ma = a∞ = sup{|an | | n ∈ Æ}.
Satz. σp (Ma ) = {an | n ∈ Æ}, σr (Ma ) = ∅, σ(Ma ) = σp (Ma ) .
Beweis.
(i) Die Eigenwertgleichung Ma x = λx für x = (x1 , x2 , . . . ) ∈ 2 ist äquivalent
zu (an − λ)xn = 0 für n = 1, 2, . . . .
Ist λ = an für alle n ∈ Æ, so besitzen diese Gleichungen nur die triviale Lösung
x1 = x2 = . . . = 0. Jedes an ist Eigenwert mit zugehörigem Eigenvektor en .
Also gilt σp (Ma ) = {an | n ∈ Æ}.
(ii) Es sei nun λ ∈ σp (Ma ). Dann ist Ma − λ injektiv, und es gilt
λ ∈ (Ma ) ⇐⇒ Ma − λ : 2 → 2 ist surjektiv.
Zur Bestimmung von (Ma ) haben wir also die universelle Lösbarkeit der Glei-
chung (Ma − λ) x = y für gegebenes y = (y1 , y2 , . . . ) ∈ 2 zu untersuchen.
Diese besagt für die Koordinaten
yn
(an − λ) xn = yn , d.h. xn = für n = 1, 2, . . . .
an − λ
Es stellt sich die Frage, ob der hierdurch eindeutig bestimmte Koordinatenvektor
x = (x1 , x2 , . . . ) immer zu 2 gehört, d.h. ob der Multiplikator Mb mit b =
((a1 − λ)−1 , (a2 − λ)−1 , . . . ) jedem y ∈ 2 ein x = Mb y = (Ma − λ)−1 y ∈ 2
zuordnet. Nach 2.6 ist das genau dann der Fall, wenn die Folge b beschränkt ist,
d.h. wenn λ ∈ {an | n ∈ Æ} .
en
(iii) Für λ ∈ σp (Ma ) hat die Gleichung (Ma − λ)x = en die Lösung x = .
an − λ
Somit umfaßt Bild (Ma − λ) die in dichte Menge Span {e1 , e2 , . . . }. Es folgt
2
σr (Ma ) = ∅. 2
5.3 Das Spektrum beschränkter Multiplikatoren in L2 (Ω, μ)

Für eine Funktion v ∈ L∞ (Ω, μ) ist durch Mv u := v ·u nach 2.7 ein beschränk-
ter Operator Mv auf H = L2 (Ω, μ) gegeben mit Mv = v∞ . Wir setzen
wie in § 20 : 3.1
{v ≤ c} := {ω ∈ Ω | v(ω) ≤ c} ,
{|v − λ| < ε} := {ω | |v(ω) − λ| < ε} usw.
Satz. (a) λ ∈ σ(Mv ) ⇐⇒ μ({|v − λ| < ε}) > 0 für alle ε > 0,
(b) λ ∈ σp (Mv ) ⇐⇒ μ({v = λ}) > 0,
(c) σr (Mv ) = ∅,
(d) μ({v ∈ (Mv )}) = 0,
1
(e) Für λ ∈ (Mv ) ist R(λ, Mv ) der Multiplikator Mg mit g := .
λ−v
Bemerkungen. (i) Zwei μ–f.ü. gleiche L∞ –Funktionen sind im L∞ –Sinn gleich
und definieren denselben Multiplikator. In Hinblick auf (d) können wir den
Multiplikator Mv durch eine L∞ –Funktion v mit v(ω) ∈ σ(Mv ) für alle ω ∈ Ω
repräsentieren.
(ii) Die Aussage (a) drücken wir so aus: σ(Mv ) ist der essentielle Wertevorrat
von v.
(iii) Für den Operator Mx auf L2 [a, b], d.h. den Operator Mv mit v(x) = x, gilt
σ(Mx ) = σc (Mx ) = [a, b]. Denn aus (a) folgt σ(Mx ) = [a, b] ÜA . Aus (b) und
(c) folgt σp (Mx ) = ∅, σr (Mx ) = ∅.
Bei quantenmechanischen Modellrechnungen wird Mx als Ortsoperator eines in
das Intervall [a, b] eingesperrten Teilchens verwendet.
Beweis.
(b) Die Eigenwertgleichung Mv u = λu ist für u ∈ L2 (Ω, μ) äquivalent zur
Gleichung (v − λ)u = 0 μ–f.ü. Ist μ({v = λ}) = 0, so folgt aus Mv u = λu also
u = 0 μ–f.ü., somit kann λ kein Eigenwert von Mv sein.
Ist M := {v = λ} keine μ–Nullmenge, so gibt es wegen der σ–Endlichkeit von
μ eine Menge B ⊂ M mit 0 < μ(B) < ∞. Dann ist χB ein Eigenvektor zum
Eigenwert λ; außerdem gilt μ({|v − λ| < ε}) ≥ μ({v = λ}) > 0 für jedes ε > 0.
(a) und (e): Für λ ∈ σp (Mv ) setzen wir
1
λ−v(ω)
für v(ω) = λ ,
g(ω) :=
0 auf der μ–Nullmenge {v = λ} .
Dann ist g μ–messbar, und für messbare Funktionen u, w gilt
(λ − Mv )u = w ⇐⇒ u = g · w .
Die Gleichung (λ − Mv )u = w ist also genau dann universell und eindeutig

lösbar, wenn g · w ∈ L2 (Ω, μ) für alle w ∈ L2 (Ω, μ). Nach 2.7 ist das äquivalent
zu g ∈ L∞ (Ω, μ). In diesem Fall ist R(λ, Mv ) = Mg . Wir haben also
λ ∈ σ(Mv ) \ σp (Mv ) ⇐⇒ g ∈ L∞ (Ω, μ) ⇐⇒

1

Bε = |g| > ε = |v − λ| < ε hat positives Maß für alle ε > 0.

(d) Für Bn := λ ∈ μ({|v − λ| < 1 }) = 0 gilt nach (a)
n
7
∞
Bn ⊂ (Mv ) und (Mv ) = Bn .
n=1
Wir zeigen μ({v ∈ Bn }) = 0. Sei λ0 ∈ Bn und |λ − λ0 | < 1/2n. Dann gilt

|v − λ| < 1/2n ⊂ |v − λ0 | < 1/n , also μ( {|v − λ| < 1/2n }) = 0 .
Zu jedem λ0 ∈ Bn ist also μ({v ∈ K1/2n (λ0 )}) = 0. Da Bn durch abzählbar

viele Kreise K1/2n (λ0 ) überdeckt wird, folgt μ({v ∈ Bn }) = 0 und somit auch
7
∞
μ( v ∈ (Mv ) ) ≤ μ ( { v ∈ Bn } ) = 0 .
n=1
(c) ergibt sich als einfache Folgerung des folgenden Satzes 5.4. 2
5.4 Spektrum und Resolvente von T ∗

Das Spektrum von T ∈ L (H ) korrespondiert auf folgende Weise mit dem
Spektrum von T ∗ :
(a) λ ∈ σ(T ) ⇐⇒ λ ∈ σ(T ∗) ,
(b) λ ∈ σc (T ) ⇐⇒ λ ∈ σc (T ∗ ) ,
(c) λ ∈ σr (T ) =⇒ λ ∈ σp (T ∗ ) ,
(d) Für λ ∈ (T ) gilt λ ∈ (T ∗ ) und R(λ, T ∗ ) = R(λ, T )∗ .
Bemerkungen.
(i) Für λ ∈ σp (T ) kann jeder der Fälle λ ∈ σp (T ∗ ), λ ∈ σr (T ∗ ) eintreten, s.u.
(ii) Aus (c) folgt, dass Multiplikatoren auf L2 (Ω, μ) kein Restspektrum besitzen
( ÜA , beachten Sie Mv∗ = Mv ).
Beweis.
Grundlage ist der Satz 3.5 zusammen mit den Rechenregeln 3.3 für Adjungierte.
(a) und (d). Nach 3.3 (2) gilt (λ − T )∗ = λ − T ∗ . Mit 3.3 (c) folgt
λ ∈ (T ) ⇐⇒ λ − T ist invertierbar
⇐⇒ (λ − T ∗ )−1 = ((λ − T )−1 )∗ existiert ⇐⇒ λ ∈ (T ∗ ) .
Für (b) und (c) stützen wir uns auf die nach 3.5 (b) geltende Beziehung
(∗) Kern (T ∗ − λ)⊥ = Bild (T − λ)
sowie auf den Zerlegungssatz § 9 : 2.4.
(c) Sei λ ∈ σr (T ), also Bild (T − λ) = H . Nach (∗) und dem Zerlegungssatz
folgt Kern (T ∗ − λ) = {0}, d.h. λ ∈ σp (T ∗ ).
(b) Sei λ ∈ σc (T ). Aus (a) folgt λ ∈ σ(T ∗ ). Wir schließen die Fälle λ ∈ σr (T ∗ )
und λ ∈ σp (T ∗ ) aus: Im Fall λ ∈ σp (T ∗ ) wäre nach (∗) und dem Zerlegungssatz
Bild (T − λ) = H im Widerspruch zu λ ∈ σc (T ). Im Fall λ ∈ σr (T ∗ ) würde
nach (c) folgen λ = λ ∈ σp (T ∗∗ ) = σp (T ).
Zu Bemerkung (i): In endlichdimensionalen Räumen folgt aus λ ∈ σp (T ) immer
λ ∈ σ(T ∗ ) = σp (T ∗ ). Im unendlichdimensionalen Fall gilt das nicht: Für den
Linksshift L im 2 gilt 0 ∈ σp (L) wegen Le1 = 0. Für L∗ = R ist 0 kein
Eigenwert, da R eine Isometrie ist. Wegen Bild R ⊥ e1 ist daher 0 ∈ σr (L∗ ). 2
5.5 Das approximative Eigenwertspektrum

Eine Zahl λ ∈ heißt approximativer Eigenwert des Operators T ∈ L (H ),
wenn es eine Folge (un ) gibt mit
un = 1 , T un − λun → 0 für n → ∞ .
Die un heißen approximative Eigenvektoren von T zum Wert λ. Die Ge-
samtheit σapp (T ) der approximativen Eigenwerte wird approximatives Ei-
genwertspektrum oder approximatives Punktspektrum von T genannt.
Approximative Eigenwerte gehören zum Spektrum.
Denn würde R(λ, T ) existieren, so folgte aus vn := λun − T un → 0 für n → ∞
mit un = 1 auch un = R(λ, T ) vn → 0 für n → ∞, im Widerspruch zu
un = 1.
Satz. Das approximative Eigenwertspektrum umfaßt das Eigenwertspektrum,
das kontinuierliche Spektrum und den Rand des Spektrums.
Bemerkungen. Das approximative Punktspektrum kann auch Teile des Rest-
spektrums enthalten; ein Beispiel wird in 5.6 (b) gegeben. Beispiele dieser Art
sind allerdings eher pathologisch. Unser Interesse richtet sich in diesem Paragra-
phen auf Operatoren mit leerem Restspektrum, für die also das Spektrum nur
aus approximativen Eigenwerten besteht. Dies gilt insbesondere für beschränkte

symmetrische Operatoren. Bei unbeschränkten symmetrischen Operatoren, auf
die sich die vorangehenden Begriffe übertragen lassen, liegen die Dinge etwas
komplizierter.
ÜA Zeigen Sie: |λ| > T =⇒ λ ∈ σapp (T ) (Dreiecksungleichung nach unten).
Allgemein gilt |λ| ≤ T für λ ∈ σ(T ), wie in Abschnitt 6 gezeigt wird.
Beweis.
(a) Gilt T u = λu, u = 1, so erhalten wir durch un = u approximative Eigen-
vektoren.
(b) Sei λ ∈ σc (T ), also T − λ injektiv und W := Bild (T − λ) dicht in H .
Wir betrachten den linearen Operator S : W → H , w → (λ − T )−1 w.
Angenommen S ist beschränkt, Sw ≤ C für alle w ∈ W mit w ≤ 1.
Dann lässt sich S nach 2.9 zu einem beschränkten Operator S ∈ L (H ) mit
Normschranke C fortsetzen. Für u = lim wn mit wn ∈ W gilt dann Su =
n→∞
lim Swn . Daraus folgt S(λ−T ) = (λ−T )S = ½, also λ ∈ (T ) und S = R(λ, T )
n→∞
im Widerspruch zu λ ∈ σc (T ). Somit ist S unbeschränkt: Es gibt eine Folge (wn )
mit wn = 1 und Swn → ∞. Für un := Swn /Swn gilt dann un = 1
und (λ − T )un = wn /Swn → 0 für n → ∞.
(c) Wir nehmen vorweg, dass σ(T ) nach 6.3 abgeschlossen ist. Sei λ ∈ ∂σ(T ).
Dann gilt λ ∈ σ(T ), und es gibt Zahlen n ∈ (T ) mit λ = lim n . Wegen der
n→∞
Bijektivität von n − T gibt es zu jedem u ∈ H eindeutig bestimmte Vektoren
vn ∈ H mit
(∗) u = ( n − T )vn = (λ − T )vn + ( n − λ)vn .
Zwei Fälle sind denkbar:
(I) Für jedes u ∈ H ist die so definierte Folge (vn ) beschränkt;
(II) Es gibt ein u ∈ H , so dass die zugeordnete Folge (vn ) unbeschränkt ist.
Im Fall (I) folgt jeweils ( n − λ)vn → 0, mit (∗) also u = lim (λ − T )vn ∈
n→∞
Bild (T − λ) für jeden Vektor u ∈ H . Es folgt λ ∈ σp (T ) oder λ ∈ σc (T ),
insgesamt λ ∈ σapp (T ) nach (a) und (b).
Im Fall (II) setzen wir cn := vn . Für un := vn /cn gilt dann un = 1,
( n − λ)un = | n − λ| → 0. Da nach (∗) die Folge (( n − T )vn ) beschränkt
ist, erhalten wir
(λ − T )un = ( n − T )un + (λ − n )un
1
≤ ( n − T )vn + |λ − n| → 0 für n → ∞ ,
cn
somit λ ∈ σapp (T ). 2
5.6 Aufgaben. (a) Spektrum von Rechts– und Linksshift. Zeigen Sie
σ(L) = σ(R) = K1 (0) = {λ ∈ | |λ| ≤ 1} ,
σp (R) = ∅ , σr (R) = K1 (0) ,
σp (L) = K1 (0) , σ(L) = σapp (L) .
Das Punktspektrum von L besteht also nicht aus isolierten Punkten.

Anleitung: Zeigen Sie unter Verwendung der Sätze 5.4, 5.5 (einschließlich der
ÜA in 5.5) der Reihe nach: σp (R) = ∅, σr (L) = ∅, σ(L) = σapp (L) ⊂ K1 (0),
σ(R) ⊂ K1 (0), σp (L) = K1 (0) = σr (R), ∂σ(L) = {λ ∈ | |λ| = 1}.
(b) Zeigen Sie für den Operator
T : 2 → 2 , x = (x1 , x2 , x3 , . . . ) −→ (0, x1 , 12 x2 , 13 x3 , . . . ) ,
dass 0 ∈ σapp (T ) ∩ σr (T ).
5.7 Zur Namensgeschichte

Die Gelehrten des islamischen Kulturkreises, insbesondere Alhazen (Ibn Al–
Haytham, um 1000), bezeichneten in ihren Untersuchungen zur Optik das Pris-
menspektrum mit aš–šabah. (Phänomen, Erscheinung, Gestalt, auch Geist, Ge-
spenst, Schrägbild). Von den Übersetzern des Mittelalters wurde dies durch das
lateinische Wort spectrum (für Erscheinung, Schemen, Gesicht) wiedergegeben.
Mit der Entwicklung der Spektralanalyse (Wollaston 1802, Bunsen und
Kirchhoff 1859) entstanden Wortverbindungen wie Spektrallinien, Banden-
spektrum, Emissions– und Absorptionsspektrum. Um 1900 wurde auch im Zu-
sammenhang mit akustischen und mechanischen Schwingungsproblemen von
Spektren gesprochen. So heißt es bei W. Wirtinger (Mathematische Annalen
1897): In der Ausdrucksweise der Optik würde also die Schwingung einer un-
”
endlich langen Saite im Allgemeinen einem Bandenspektrum entsprechen.“ Und
etwas später: Die Intervalle für λ schließen sich nun lückenlos aneinander, das
”
Bandenspektrum wird zum continuirlichen Spektrum.“
In seiner vierten Mitteilung über Grundzüge einer allgemeinen Theorie der
”
linearen Integralgleichungen“ definiert Hilbert 1906: Die Gesamtheit dieser
”
n Eigenwerte heiße das Spektrum der Form Kn“. Mit Bezug auf quadratische
2
Formen im Folgenraum sagt er an späterer Stelle: Die Gesamtheit der Stel-
”
len λ1 , λ2 , . . . werde das Punktspektrum oder diskontinuirliche Spektrum der
Form K genannt.“ Anschließend führt Hilbert das Streckenspektrum oder
”
kontinuirliche Spektrum“ ein.
6 Analytizität der Resolvente, Folgerungen für das Spektrum 575
In einem Aufsatz über Naturerkennen und Logik“ schreibt Hilbert 1930: In

” ”
neuster Zeit häufen sich die Fälle, daß gerade die wichtigsten im Mittelpunkt des
Interesses der Mathematik stehenden mathematischen Theorien zugleich die in
der Physik benötigten sind. Ich hatte die Theorie der unendlich vielen Variablen
aus rein mathematischem Interesse entwickelt und dabei sogar die Bezeichnung
Spektralanalyse angewandt, ohne ahnen zu können, daß diese einmal später in
dem wirklichen Spektrum der Physik realisiert werden würde.“
Dies klingt einigermaßen erstaunlich aus dem Munde eines Gelehrten, der wie
kaum ein anderer die mathematisch–naturwissenschaftliche Diskussion seiner
Zeit überblickte und anregte, der in seinen Mitteilungen“ ausführlich auf die
”
Bedeutung seiner Methode für die mathematische Physik eingegangen war und
der sehr wahrscheinlich die Arbeit von Wirtinger kannte.
6 Analytizität der Resolvente, Folgerungen für das Spektrum

6.1 Die Neumannsche Reihe
Satz. Aus T < 1 folgt die Invertierbarkeit von 1−T und die Normkonvergenz
der Reihenentwicklung

∞
(1 − T )−1 = Tk .
k=0

∞
Dasselbe ergibt sich unter der schwächeren Voraussetzung T k < ∞.
k=0
Beweis.

∞
Aus T < 1 und T k ≤ T k folgt die Konvergenz der Reihe T k .
k=0

n
Wir setzen letzteres voraus und betrachten Sn := T k . Wegen
k=0

m
m
Sm − Sn = Tk ≤ T k für m > n
k=n+1 k=n+1
ist (Sn ) eine Cauchy–Folge in der Operatornorm. Für den nach 2.1 existierenden
Normlimes S = lim Sn gilt
n→∞
(1 − T )S − (1 − T )Sn = (1 − T )(S − Sn ) ≤ 1 − T · S − Sn → 0

für n → ∞. Daraus folgt, da (T n+1 ) eine Nullfolge ist,
(1 − T )S = lim (1 − T )Sn = lim (1 − T )(1 + T + · · · + T n )
n→∞ n→∞
= lim (1 − T n+1 ) = ½.
n→∞
Entsprechend erhalten wir S(1 − T ) = ½ ÜA . 2

6.2 Reihenentwicklungen der Resolvente

Satz. (a) Für |λ| > T gilt λ ∈ (T ) und

∞
1
R(λ, T ) = Tk
λk+1
k=0
im Sinne der Normkonvergenz.

(b) Für λ0 ∈ (T ) und r = R(λ0 , T )−1 gilt Kr (λ0 ) ⊂ (T ).
Für |λ − λ0 | < r erhalten wir die normkonvergente Potenzreihenentwicklung

∞
R(λ, T ) = (λ0 − λ)k R(λ0 , T )k+1 .
k=0
(c) Insbesondere ist für beliebige u, v ∈ H durch f (λ) := v , R(λ, T )u eine

auf der offenen Menge (T ) holomorphe Funktion f gegeben mit lim f (λ) = 0 .
|λ|→∞
Beweis.
(a) Für |λ| > T und A := λ−1 T gilt A < 1. Nach 6.1 existiert daher
(1−A)−1 = λ·(λ−T )−1 = λ R(λ, T ) und ist gegeben durch die normkonvergente
Reihe

∞
∞
λ R(λ, T ) = (1 − A)−1 = Ak = λ−k T k .
k=0 k=0
(b) Wegen (λ0 − T )R(λ0 , T ) = ½ ist R(λ0 , T ) > 0.

Für |λ − λ0 | < r := R(λ0 , T )−1 setzen wir B := (λ0 − λ)R(λ0 , T ). Dann gilt
B ∈ L (H ) und
(1 − B)(λ0 − T ) = (1 − (λ0 − λ)R(λ0 , T ))(λ0 − T )
(1)
= λ0 − T − (λ0 − λ) = λ − T .
Nach Wahl von λ gilt ferner B < 1, also ist 1 − B nach 6.1 invertierbar, und
(1 − B)−1 ist gegeben durch die normkonvergente Reihe

∞
(2) (1 − B)−1 = Bk .
k=0
Aus (1) und 3.1 (b) erhalten wir daher die Existenz von
(3) R(λ, T ) = R(λ0 , T ) (1 − B)−1 für |λ − λ0 | < r .
Die Reihendarstellung für R(λ, T ) ergibt sich aus (3),(2) und der Definition von
B nach der Regel 4.4 (e):

∞
∞
R(λ, T ) = R(λ0 , T ) B k = (λ0 − λ)k R(λ0 , T )k+1
k=0 k=0
für |λ − λ0 | < r. Damit folgt die Offenheit von (T ) ⊂ .
(c) Aus der Normkonvergenz der Reihe für R(λ, T ) folgt nach 4.2 die schwache
Konvergenz, somit erhalten wir für die Funktion f (λ) = v , R(λ, T )u die Po-
tenzreihenentwicklung

∞
f (λ) = (−1)k v , R(λ0 , T )k+1 u (λ − λ0 )k für |λ − λ0 | < r ,
k=0
d.h. f ist analytisch und somit holomorph in der nach (b) offenen Menge (T ).
Für |λ| > T gilt nach (a) λ ∈ (T ) und

1 1 k ≤ 1 lim |λ|−k T k =
n n
1
R(λ, T ) = lim T .
n→∞ λ k=0 λk |λ| n→∞ k=0 |λ| − T
Hieraus folgt lim R(λ, T ) = 0 und damit auch

|λ|→∞
lim v , R(λ, T )u = 0 . 2
|λ|→∞
6.3 Die Existenz von Spektralwerten

Satz. Das Spektrum σ(T ) eines Operators T ∈ L (H ) ist nichtleer, kompakt
und liegt in der abgeschlossenen Kreisscheibe mit Radius T .
Beweis.
Nach 6.2 ist (T ) offen, und für |λ| > T gilt λ ∈ (T ). Zu zeigen bleibt,
dass σ(T ) = ∅. Angenommen (T ) = . Dann ist für beliebige u, v ∈ H
durch f (λ) := v , R(λ, T )u nach 6.2 (c) eine auf ganz definierte holomor-
phe, d.h. ganze Funktion f gegeben. Wegen lim f (λ) = 0 ist f beschränkt.
|λ|→∞
Nach dem Satz von Liouville (Bd. 1, § 27 : 6.3) ist f konstant, also f = 0. Aus
v , R(λ, T )u = 0 für alle u, v ∈ H folgt R(λ, T ) = 0 für alle λ ∈ im
Widerspruch zu R(λ, T )(λ − T ) = . 2
Wir definieren den Spektralradius von T durch

r(T ) := max |λ| λ ∈ σ(T ) .
Es gilt demnach r(T ) ≤ T . Für symmetrische Operatoren T zeigen wir in 6.5,

dass r(T ) = T . In 6.4 (b) wird ein Operator T mit r(T ) < T angegeben.
6.4 Aufgaben
(a) Zeigen Sie mit Hilfe von 5.2, dass es zu jeder kompakten Menge K ⊂
einen beschränkten Operator T auf 2 gibt mit σ(T ) = K.
(b) Das Spektrum des Operators des unbestimmten Integrals.

Für u ∈ L2 [0, 1] sei
x
(T u)(x) := u(t) dt , vgl. 3.4 (f) .
0
Zeigen Sie per Induktion mit Hilfe der Cauchy–Schwarzschen Ungleichung

n n
(T u)(x) 2 ≤ x u2 .
n!
Folgern Sie daraus mit Hilfe der letzten Aussagen von 6.1 die Existenz von
−1
1 1
(λ − T )−1 = 1− T für alle λ = 0.
λ λ
Es ist also σ(T ) = {0}, insbesondere 0 = r(T ) < T .
Warum gilt 0 ∈ σc (T )?
6.5 Das Spektrum symmetrischer Operatoren

(a) Für einen Operator T ∈ L (H ) sind folgende Bedingungen äquivalent:
(1) v, Tu = Tv, u für u, v ∈ H (Symmetrie),
∗
(2) T = T,
(3) u, T u ∈ Ê für alle u ∈ H , vgl. 3.6 (b).
Wir notieren für symmetrische T ∈ L (H ) und für λ = α + iβ ∈

(T − λ)u2 ≥ |β|2 u2 .
Dies folgt aus der Symmetrie von T − α für α ∈ durch Ausmultiplizieren:
(T − λ)u , (T − λ)u = (T − α)u − iβu , (T − α)u − iβu

= (T − α)u2 + iβ u , (T − α)u − iβ (T − α)u , u + |β|2 · u2 .
(b) Satz. Symmetrische Operatoren T ∈ L (H ) haben ein reelles Spektrum.

Alle Spektralwerte sind approximative Eigenwerte.
Für den Spektralradius gilt r(T ) = T , also gehört wenigstens eine der Zahlen
T , −T zum Spektrum von T .
Beweis.
(i) Alle Eigenwerte von T sind reell: Aus T u = λu, u = 1 folgt
λ = λ u , u = u , λu = u , T u ∈ .
(ii) Daher hat T kein Restspektrum, denn für λ ∈ σr (T ) folgt nach 5.4, dass
Ê
λ ∈ σp (T ∗ ) = σp (T ), also λ ∈ und damit λ ∈ σp (T ), ein Widerspruch.
(iii) Nach 5.5 folgt σ(T ) = σapp (T ). Für λ ∈ Ê gilt nach (a)
(T − λ)u ≥ | Im λ | u ,
also kann λ nicht zu σapp (T ) = σ(T ) gehören.

(iv) Für := T = sup{T u | u = 1} gibt es Vektoren un ∈ H mit
un = 1 , T u1 ≤ T u2 ≤ . . . , lim T un = .
n→∞
Für diese gilt wegen der Symmetrie von T

(T 2 − 2
) un 2 = (T 2 − 2
) un , (T 2 − 2
) un
= T 2 un 2 − 2 2
un , T 2 un + 4
= T (T un )2 − 2 2 T un 2 + 4
≤ T 2 T un 2 − 2 2 T un 2 + 4
→ 0 für n → ∞ .
Somit gilt 2 = T 2 ∈ σapp (T 2 ), d.h. T 2 − 2 = (T − )(T + ) ist nicht

invertierbar. Dann können T + , T − nicht beide invertierbar sein (vgl.
3.1 (b)), also gilt − ∈ σ(T ) oder ∈ σ(T ). 2
(c) Satz. Für symmetrische Operatoren T ∈ L (H ) gilt

T = sup | u , T u | u = 1 .
Beweis.
Wegen | u , T u | ≤ u · T u ≤ T · u2 gilt

s := sup | u , T u | u = 1 ≤ T .
Nach (b) gibt es ein λ ∈ σ(T ) = σapp (T ) mit |λ| = T . Da es un ∈ H gibt

mit un = 1 und T un − λun → 0 für n → ∞, ergibt sich
| un , (T − λ)un | ≤ un · T un − λun → 0 für n → ∞ ,
also λ = lim un , T un und somit

n→∞
T = |λ| = lim | un , T un | ≤ s . 2
n→∞
7 Der Funktionalkalkül für symmetrische Operatoren

In diesem Abschnitt geht es darum, für einen symmetrischen Operator T ∈
L (H ) den Operator f (T ) zu definieren, wobei zunächst stetige Funktionen
Ê
f : → und später auch charakteristische Funktionen f = χ]−∞,λ] betrach-
ten werden. Die Bedeutung dieses Funktionalkalküls soll durch zwei Beispiele
beleuchtet werden:
Für einen symmetrischen Operator H ∈ L (H ) liefert
u(t) = e−iHt ϕ
eine Lösung des Problems
u̇(t) = − iHu(t) , u(0) = ϕ ,
vgl. § 18 : 3.1. Für eλ = χ]−∞,λ] und u = 1 ist durch
F (λ) := u , eλ (T )u
eine Verteilungsfunktion gegeben und damit die Möglichkeit einer wahrschein-
lichkeitstheoretischen Interpretation des Operatorenkalküls eröffnet.
Das Spektrum von T spielt dabei eine wesentliche Rolle: Es zeigt sich, dass f (T )
nur von den Werten von f auf σ(T ) abhängt.
7.1 Einsetzen symmetrischer Operatoren in Polynome

Für symmetrische Operatoren T ∈ L (H ) und p(x) = a0 + a1 x + . . . + an xn
setzen wir
p(T ) = a0 + a1 T + . . . + an T n .
(Nach der Vereinbarung 5.1 steht a0 für a0 · = a0 T 0 .) Dann gilt ÜA
(a) (αp + βq)(T ) = αp(T ) + βq(T ) für α, β ∈ ,

(b) (p · q)(T ) = p(T ) · q(T ) = q(T ) · p(T ),
(c) p(T )∗ = p(T ) mit p(x) := a0 + a1 x + . . . + an xn .
7.2 Der spektrale Abbildungssatz für Polynome

Satz. Für symmetrische Operatoren T ∈ L (H ) gilt
(a) σ(p(T )) = σapp (p(T )) = p(σ(T )), d.h.
μ ∈ σ(p(T )) ⇐⇒ μ ∈ σapp (p(T ))
⇐⇒ es gibt ein λ ∈ σ(T ) mit μ = p(λ).
(b) σp (p(T )) = p(σp (T )), falls p nicht konstant ist. Dabei ist jeder Eigenvektor
von T auch Eigenvektor von p(T ).

(c) p(T ) = max | p(λ) | λ ∈ σ(T ) .
(d) p(T ) = q(T ), falls p und q auf σ(T ) übereinstimmen.
7 Der Funktionalkalkül für symmetrische Operatoren 581
Beweis.
Wir betrachten zunächst konstante Polynome p(x) = a0 . Für solche hat p(T ) =
a0 ½ ein einpunktiges Spektrum: σ(p(T )) = σp (p(T )) = {a0 }. Jeder Vektor u = 0
ist Eigenvektor von p(T ) zum Eigenwert a0 . Nach 6.3 ist σ(T ) nicht leer. Für
alle λ ∈ σ(T ) gilt p(λ) = a0 . Schließlich ist p(T ) = |a0 | = |p(λ)| für alle
λ ∈ σ(T ).
Für den Rest des Beweises setzen wir Grad (p) = n ≥ 1 voraus:
p(x) = a0 + . . . + an xn , n ≥ 1 , an = 0 .
(a) Zu jeder Zahl μ ∈ gibt es Zahlen λ1 , . . . , λn ∈ , so dass
(1) p(x) − μ = an · (x − λ1 ) · · · (x − λn ) , (an = 0) .
Aus 7.1 folgt
(2) p(T ) − μ = an (T − λ1 ) · · · (T − λn ) .
Da das Produkt invertierbarer Operatoren nach 3.1 (b) invertierbar ist, ergibt
sich daraus
μ ∈ σ(p(T )) =⇒ λk ∈ σ(T ) für wenigstens ein k;
dabei ist p(λk ) = μ.

Sei umgekehrt λ ∈ σ(T ) und μ = p(λ). Dann gibt es ein Polynom q mit
(3) p(x) − μ = (x − λ)q(x) , also p(T ) − μ = q(T )(T − λ) .
Wegen σ(T ) = σapp (T ) (vgl. 6.5 (b)) gibt es Vektoren un ∈ H mit
un = 1 , (T − λ)un → 0 für n → ∞ . Aus (3) folgt
(4) (p(T ) − μ)un = q(T )(T − λ)un → 0 für n → ∞ ,
da q(T ) stetig ist. Somit haben wir
λ ∈ σ(T ) = σapp (T ) =⇒ p(λ) ∈ σapp (p(T )) .
(b) Sei T u = λu mit u = 1 und μ = p(λ). Aus (4) mit un = u folgt
(p(T ) − μ)u = q(T )(T − λ)u = 0 .
Somit ist u Eigenvektor von p(T ) zum Eigenwert μ.

Sei umgekehrt p(T )v = μ · v mit v = 0. Wir verwenden die Darstellungen (1),
(2) und erhalten
(T − λ1 ) · · · (T − λn )v = 0 .
Für w := (T − λn )v gilt entweder w = 0, dann ist λn ∈ σp (T ), oder es gilt

w = 0 und (T − λ1 ) · · · (T − λn−1 )w = 0. Auf diese Weise fortfahrend erhalten
wir schließlich ein u = 0 und ein k mit (T − λk )u = 0, d.h. λk ∈ σp (T ). Also ist
μ = p(λ) mit einem geeigneten λ ∈ σp (T ).
(c) Für λ ∈ Ê und das in 7.1 (c) definierte Polynom p gilt p(λ)p(λ) = |p(λ)| . 2
Nach 7.1 gilt

(p · p)(T ) = p(T ) · p(T ) = p(T )∗ · p(T ) ,
also ist (p · p)(T ) symmetrisch und positiv, vgl. 3.3 (3). Aus (a) und den Sätzen
6.5 (b) und (c) folgt daher

max |p(λ)|2 λ ∈ σ(T ) = max (p · p)(λ) λ ∈ σ(T )

= max μ μ ∈ σ((pp)(T )) = sup { u , (pp)(T )u | u = 1}

= sup { u , p(T )∗ p(T )u | u = 1} = sup p(T )u2 u = 1
= p(T )2 . 2
7.3 Der Funktionalkalkül für stetige Funktionen

(a) Satz. Zu jedem symmetrischen Operator T ∈ L (H ) und jeder stetigen
Ê
Funktion f : → gibt es einen Operator f (T ) mit folgender Eigenschaft:
Ist [a, b] ein beliebiges kompaktes Intervall mit σ(T ) ⊂ [a, b] und (pn ) eine auf
[a, b] gleichmäßig gegen f konvergierende Folge von Polynomen, so gilt
f (T ) = lim pn (T )
n→∞
im Normsinn. Dieser Operator hängt nur von den Werten von f auf σ(T ) ab:

f (T ) = max |f (λ)| λ ∈ σ(T ) .
Beweis.
Sei σ(T ) ⊂ [a, b]. Nach dem Weierstraßschen Approximationssatz § 6 : 2.9 gibt
es Polynome pn , die auf [a, b] gleichmäßig gegen f konvergieren. Nach 7.2 (c)
gilt

pm (T ) − pn (T ) = max | pm (λ) − pn (λ) | λ ∈ σ(T ) ,
also bilden die pn (T ) eine Cauchy–Folge im Raum L (H ). Da dieser vollständig

ist, existiert der Normlimes S := lim pn (T ).
n→∞
Ist σ(T ) ⊂ [c, d] und konvergieren die Polynome qn auf [c, d] gleichmäßig gegen
f , so existiert entsprechend der Normlimes lim qn (T ). Nach 7.2 (c) gilt
n→∞

pn (T ) − qn (T ) = max | pn (λ) − qn (λ) | λ ∈ σ(T ) → 0
für n → ∞, somit lim pn (T ) = lim qn (T ).

n→∞ n→∞
Mit der Abkürzung u∞ = max {|u(λ)| | λ ∈ σ(T )} erhalten wir wegen der
Stetigkeit der Norm aus 7.3 (a)
f (T ) = lim pn (T ) = lim pn ∞ = f ∞ . 2

n→∞ n→∞
(b) Für die Definition von f (T ) erweist es sich im Nachhinein als unnötig, die
Stetigkeit von f auf ganz Ê
zu verlangen; es kommt nur auf die Einschränkung
von f auf σ(T ) an. Umgekehrt lässt sich jede stetige Funktion f : σ(T ) →
zu einer stetigen Funktion F : → mit gleicher Supremumsnorm fortsetzen
(Satz von Tietze–Uryson § 10 : 5.3). Dies berechtigt uns zu folgender
Definition. Für f ∈ C(σ(T )) setzen wir f (T ) := F (T ), wobei F : → eine
beliebige stetige Fortsetzung von f ist. In diesem Fall definieren wir
F ∞ = f ∞ := sup {|f (λ) | λ ∈ σ(T ) }.
7.4 Eigenschaften des Funktionalkalküls für stetige Funktionen

(a) Für f ∈ C(σ(T )) gilt

f (T ) = f ∞ := max | f (λ) | λ ∈ σ(T ) und
f (T )∗ = f (T ) .
Ist f also reellwertig auf σ(T ), so ist f (T ) symmetrisch.
(b) Für f, g ∈ C(σ(T )) gilt
(αf + βg)(T ) = αf (T ) + βg(T ) (α, β ∈ ),
(f · g)(T ) = f (T )g(T ) = g(T )f (T ) .
Die erste Aussage (a) wurde in 7.3 bewiesen; die restlichen Aussagen ergeben
sich aus den entsprechenden Eigenschaften 7.1 des polynomialen Funktional-
kalküls durch Grenzübergang ÜA .
(c) Zusammenfassung. Der Normabschluss von Span {, T, T 2 , . . .},
C∗ (T ) := {p(T ) | p ist Polynom} ,
ist eine kommutative C∗ –Algebra und als solche isomorph zu (C(σ(T )), · ∞ ):
Die Einsetzungsabbildung E : C(σ(T )) → C∗ (T ), f → f (T ) ist bijektiv und hat
die Eigenschaften (a), (b). Insbesondere ist also

C∗ (T ) = f (T ) f ∈ C(σ(T )) .
Die einzige über das Vorangehende hinausgehende Behauptung,
C∗ (T ) = {f (T ) | f ∈ C(σ(T ))} ,
ist folgendermaßen einzusehen. Zu jedem Operator S ∈ C∗ (T ) gibt es Polynome

pn mit S = lim pn (T ). Wegen pm (T ) − pn (T ) = pm − pn ∞ ist (pn ) ein
n→∞
Cauchy–Folge in C(σ(T )), konvergiert also gleichmäßig gegen eine Funktion
f ∈ C(σ(T )). Definitionsgemäß ist f (T ) = lim pn (T ) = S.
n→∞
(d) Aufgabe. Für jeden Operator R ∈ L (H ) mit RT = T R gilt RS = SR

für alle S ∈ C∗ (T ).
7.5 Der spektrale Abbildungssatz

Für symmetrische Operatoren T ∈ L (H ) und f ∈ C(σ(T )) gilt
(a) σ(f (T )) = σapp (f (T )) = f (σ(T )).
(b) T u = λu =⇒ f (T )u = f (λ)u .
(c) un = 1 , (T − λ)un → 0 =⇒ f (T )un − f (λ)un → 0 .
(d) Für μ ∈ (f (T )) gilt R(μ, f (T )) = g(T ) mit g = 1
μ−f
∈ C(σ(T )).
Bemerkung. Die für Polynome f gültige Beziehung σp (f (T )) = f (σp (T ))

überträgt sich nicht; ein Gegenbeispiel wird in 7.6 (b) gegeben.
Beweis.
(i) σ(f (T )) ⊂ f (σ(T )): Für μ ∈ f (σ(T )) ist g(λ) := 1/(μ − f (λ)) stetig auf
σ(T ). Somit ist der Operator g(T ) definiert, und aus 7.4 (b) ergibt sich
(μ − f (T ))g(T ) = g(T )(μ − f (T )) = ½.
Damit gilt:
μ ∈ f (σ(T )) =⇒ μ ∈ (f (T )) und die Aussage (d) über R(μ, f (T )).
(ii) f (σ(T )) ⊂ σapp (f (T )): Sei μ = f (λ) mit λ ∈ σ(T ). Wegen σ(T ) = σapp (T )
gibt es approximative Eigenvektoren un mit un = 1 und (T − λ)un → 0. Aus
dem Beweisteil (4) von 7.2 entnehmen wir
(1) (p(T ) − p(λ))un → 0
für jedes nichtkonstante Polynom p; für konstante Polynome gilt dies trivialer-
weise ebenso. Zum Nachweis von (f (T ) − f (λ))un → 0 fixieren wir zu vorgebe-
nem ε > 0 ein Polynom p mit
(2) f − p∞ = f (T ) − p(T ) < ε .

Für dieses Polynom gibt es aufgrund von (1) ein nε mit
(3) (p(T ) − p(λ))un < ε für n > nε .
Aus (2) und (3) folgt für n > nε
(f (T ) − f (λ))un
= (f (T ) − p(T ))un + (p(T ) − p(λ))un + (p(λ) − f (λ))un
≤ f (T ) − p(T ) + (p(T ) − p(λ))un + | p(λ) − f (λ) | < 3ε .
Aus (i) und (ii) folgt (a), (c) und (d). Der Aussage (b) folgt aus (c) mit un =
u/u (n = 1, 2, . . .). 2
7.6 Der stetige Funktionalkalkül für Multiplikatoren

(a) Multiplikatoren in 2 . Sei a = (a1 , a2 , . . . ) eine beschränkte Folge reeller
Zahlen und T = Ma der Multiplikator
T : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) .
Nach 3.4 (c) ist T symmetrisch, und aus 5.2 folgt
σ(T ) = {an | n ∈ }.

Aufgaben. (i) Zeigen Sie
f (T )x = (f (a1 ) x1 , f (a2 ) x2 , . . . )
zunächst für Polynome f und dann für Funktionen f ∈ C(σ(T )).

(ii) Was bedeutet f ∈ C(σ(T )) für T = Ma mit a = (1, 12 , 13 , . . . ) ?
(b) Multiplikatoren in L2 (Ω, μ). Für eine reellwertige Funktion v ∈ L∞ (Ω, μ)

sei Mv : u → v · u. Nach 3.4 (d) ist Mv symmetrisch, und nach 5.3 ist σ(Mv )
der essentielle Wertebereich von v; ferner dürfen wir v(Ω) ⊂ σ(Mv ) annehmen.
Aufgaben. (i) Zeigen Sie
f (Mv ) = Mf ◦v
zunächst für Polynome f und dann mit Hilfe des kleinen Satzes von Lebesgue
für f ∈ C(σ(Mv )).
(ii) Für den Multiplikator Mx auf L2 [a, b] ist σp (Mx ) = ∅, vgl. die Bemerkung
5.3 (iii). Geben Sie ein f ∈ C(σ(Mx )) an mit σp (f (Mx )) = ∅.
7.7 Spektralzerlegung und Funktionalkalkül bei endlichem Spektrum

(a) Wir betrachten einen symmetrischen Operator T auf einem n–dimensio-
nalen Hilbertraum H . Bekanntlich gibt es eine Orthonormalbasis B für H
aus Eigenvektoren zu reellen Eigenwerten λk von T , also σ(T ) = σp (T ) =
{λ1 , . . . , λm }. Dann bilden alle zum Eigenwert λk gehörigen Eigenvektoren aus
B eine Orthonormalbasis für den Eigenraum Nk = Kern (T − λk ). Bezeichnen
wir den orthogonalen Projektor auf diesen Eigenraum mit Pk , so gilt ÜA
(1) P1 + . . . + Pm = ½,
(2) T = λ1 P1 + . . . + λm Pm (Spektralzerlegung von T ),
(3) Pi Pk = Pk Pi = δik Pk .
(b) Diese Formeln lassen sich auch mit Hilfe des Funktionalkalküls beweisen;
dabei wird nur die Endlichkeit des Spektrums verwendet, nicht die Vorausset-
zung dim H < ∞.
Satz. Hat ein symmetrischer Operator T ∈ L (H ) ein endliches Spektrum,
σ(T ) = {λ1 , . . . , λm } ,
so besteht dieses aus Eigenwerten. Für die orthogonalen Projektoren Pk auf die
paarweise orthogonalen Eigenräume Nk = Kern (T − λk ) gelten dann die Iden-
titäten (1),(2),(3).
Beweis.
Auf der endlichen Menge σ(T ) = {λ1 , . . . , λm } ist jede Funktion f : σ(T ) →
stetig. Wir betrachten für k = 1, . . . , m die Funktion fk : σ(T ) → , die auf
λk den Wert 1 annimmt und auf den übrigen Spektralwerten Null ist. Für diese
Funktionen gilt
(1 ) f1 (x) + . . . + fm (x) = 1 auf σ(T ) ,
(2 ) σ(T ) = λ1 f1 + . . . + λm fm
(3 ) fi · fk = δik fk .
Für die Operatoren Pk := fk (T ) folgen nach 7.4 unmittelbar die Formeln

(1), (2), (3). Ferner folgt Pk2 = Pk und die Symmetrie jedes Pk , da fk reell-
wertig ist. Nach § 9 : 2.6 ist Pk ein orthogonaler Projektor, und nach 7.4 (a) gilt
Pk = fk ∞ = 1. Also ist Nk = Bild Pk = {0}.
Aus (2 ), (1 ) folgt weiter T Pk = Pk T = λk Pk . Daher gilt
u ∈ Nk =⇒ Pk u = u =⇒ T u = T Pk u = λk Pk u = λk u .
Wegen Nk = {0} ist daher λk ein Eigenwert von T . Nach 7.5 (b) gilt
T u = λk u =⇒ Pk u = fk (T )u = fk (λk )u = u =⇒ u ∈ Nk .
Somit ist Nk der Eigenraum Kern (T − λk ). Ferner gilt für i = k

u ∈ Ni , v ∈ Nk =⇒
u, v = Pi u , Pk v = u , Pi Pk u = u , 0 = 0 . 2
(c) Der Funktionalkalkül. Aus den Identitäten (1)–(3) folgt per Induktion
T k = λk1 P1 + . . . + λkm Pm für k = 0, 1, 2, . . . (T 0 := ½) .
Daraus ergibt sich für Polynome p
p(T ) = p(λ1 ) P1 + . . . + p(λm ) Pm .
Zu jeder Funktion f ∈ C(σ(T )) gibt es ein eindeutig bestimmtes Interpolations-

polynom p mit
f (λk ) = p(λk ) für k = 1, . . . , m, Grad (pk ) ≤ m − 1
(Bd. 1, § 16 : 5). Aus 7.3 (a) folgt
f (T ) = f (λ1 ) P1 + . . . + f (λm ) Pm .
Da P1 , . . . , Pm wegen Pi Pk = 0 für i = k linear unabhängig sind, ist C∗(T )

ein Vektorraum der Dimension m.
(d) Aufgaben. (i) Sei P ein orthogonaler Projektor mit P = 0, P = ½.

Bestimmen Sie σ(P ) und f (P ) für f ∈ C(σ(P )).
(ii) Für x ∈ n sei T x = e , x e mit e = (1, 1, . . . , 1). Bestimmen Sie die
Matrix A = MK (T ) und deren Eigenwerte (vgl. Bd. 1, § 18 : 4.4). Geben Sie
f (T ) für f ∈ C(σ(T )) an.
7.8 Die von einem beschränkten symmetrischen Operator erzeugte

unitäre Gruppe
(a) Für einen symmetrischen Operator T ∈ L (H ) und t ∈ sei
U (t) := e−itT , d.h. U (t) := ft (T ) mit ft (x) = e−ixt .
Dann hat die Schar {U (t)} die Gruppeneigenschaft
U (s + t) = U (s) U (t) = U (t) U (s) für s, t ∈ , U (0) = .

Ferner sind die U (t) unitäre Operatoren mit
U (t)∗ = U (t)−1 = U (−t) (t ∈ Ê) .

Beweis als ÜA mit Hilfe von 7.4.
(b) Es gilt U̇ (t) = − i T U (t) = −i U (t)T im Normsinn, d.h.

lim
h→0
1
h

U (t + h) − U (t) + i T U (t) = 0 für alle t ∈ Ê.
Beweis als ÜA : Zeigen Sie für h = 0

1 1
U (t + h) − U (t) + iT U (t) = U (h) − ½ + iT ≤ | h | · T 2
h h
durch Taylorentwicklung von cos(hx), sin(hx) mit Restglied zweiter Ordnung

und unter Verwendung von f (T ) = f ∞ , T = r(T ).
(c) Eine Funktion u : I → H auf einem offenen Intervall I heißt differen-

zierbar im Hilbertraumsinn mit Ableitung u̇ = v, wenn

1
lim u(t + h) − u(t) − v(t) = 0 für alle t ∈ I .
h→0 h
Ist u : I → H differenzierbar im Hilbertraumsinn, so ist u stetig.

Sind u, v : I → H differenzierbar im Hilbertraumsinn, so ist die reellwertige
Funktion t → u(t) , v(t) im gewöhnlichen Sinn differenzierbar mit
d
u(t) , v(t) = u̇(t) , v(t) + u(t) , v̇(t) (Produktregel).
dt
Beweis als ÜA . Beweisen und verwenden Sie die Stetigkeit des Skalarprodukts
in beiden Variablen: un → u, vn → v =⇒ un , vn → u , v .
(d) Satz. Zu jedem vorgegebenen Vektor u0 ∈ H gibt es eine eindeutig be-

stimmte Lösung des Cauchy–Problems im Hilbertraumsinn
u̇(t) = − i T u(t) , u(0) = u0 .
Diese ist gegeben durch u(t) = U (t) u0 = e−itT u0 .

Beweis als ÜA in folgenden Schritten:
(i) Aus (b) folgt, dass U (t)u0 eine Lösung liefert.
(ii) Sei v eine für |t| ≤ δ, δ > 0 definierte Lösung. Betrachten Sie die Funktion
w(t) := U (−t) v(t) und zeigen Sie h , w(t) = h , u0 für jeden Vektor h ∈ H .
8 Positive Operatoren und Zerlegung von Operatoren 589
8 Positive Operatoren und Zerlegung von Operatoren

8.1 Das Spektrum positiver Operatoren
Ein Operator T ∈ L (H ) heißt positiv (in Zeichen T ≥ 0), wenn u, T u ≥ 0
für alle u ∈ H gilt.
Positive Operatoren sind symmetrisch vgl. 3.6 (d).
(a) Beispiele. Für jeden Operator T ∈ L (H ) ist T ∗ T positiv.
Ist T symmetrisch und f : σ(T ) → Ê + stetig, so ist f (T ) positiv.
Für f, g ∈ C(σ(T )) mit f ≤ g gilt also f (T ) ≤ g(T ).
Ersteres folgt aus u , T ∗ T u = T u , T u ≥ 0.
√
Für f ∈ C(σ(T )) mit f ≥ 0 ist g = f stetig und reellwertig auf σ(T ). Daher
ist g(T ) ein symmetrischer Operator, und wegen f = g 2 gilt
f (T ) = g 2 (T ) = g(T )∗g(T ) ≥ 0 .
(b) Satz. Ein symmetrischer Operator T ∈ L (H ) ist genau dann positiv,

Ê
wenn σ(T ) ⊂ + .
Beweis.
Ê √
Ist T symmetrisch und σ(T ) ⊂ +, so ist w(x) = x stetig auf σ(T ). Wie in
(a) ergibt sich T = w(T ) ≥ 0. Außerdem gilt T
2 1/2
:= w(T ) ≥ 0.
Sei umgekehrt T ≥ 0. Wegen der Symmetrie von T ist σ(T ) = σapp (T ) ⊂ Ê
nach 6.5 (b). Für λ < 0 und u = 1 gilt
T u − λu2 = T u2 − 2λ u , T u + |λ|2 ≥ |λ|2 > 0 ,
also λ ∈ σapp (T ), was die Behauptung σ(T ) = σapp (T ) ⊂ Ê + liefert. 2
8.2 Die Quadratwurzel eines positiven Operators

Für jeden positiven Operator T ∈ L (H ) gibt es genau einen positiven Operator
S ∈ L (H ) mit S 2 = T , nämlich S = T 1/2 ∈ C*(T ).
Beweis.
(a) Für S := T 1/2 gilt 0 ≤ S ∈ C*(T ) und S 2 = T nach dem Beweis 8.1 (b).
(b) Sei R ∈ L (H ) ein positiver Operator mit R2 = T . Dann gilt RT = R3 =
T R, also RS = SR nach 7.4 (d). Es folgt (S − R)(S + R) = S 2 − R2 = 0. Für
A := (S − R)S(S − R) und B := (S − R)R(S − R) gilt A ≥ 0, B ≥ 0 ÜA und
A + B = (S − R)(S + R)(S − R) = 0 .
Wir haben also 0 ≤ A, B ≤ A + B ≤ 0. Nach 3.6 (d) folgt A = B = 0. Daraus

erhalten wir (S − R)3 = A − B = 0. Der spektrale Abbildungssatz 7.5 liefert
σ(S − T ) = {0}. Mit 6.5 (b) folgt S − T = 0, also S = T . 2
8.3 Betrag und Polarzerlegung von Operatoren

(a) Für T ∈ L (H ) setzen wir |T | := (T ∗ T )1/2 , vgl. 8.1 (a), 8.2. Dann gilt
0 ≤ |T | ∈ C*(T ), |T | = T und Kern |T | = Kern T , denn

T u2 = u , T ∗ T u = u , |T |2 u = |T |u , |T |u = |T |u 2 .
(b) Satz. Zu jedem Operator T ∈ L (H ) gibt es einen eindeutig bestimmten
Operator U ∈ L (H ) mit
T = U |T | , Kern U = Kern T (Polarzerlegung von T ) .
U ist eine partielle Isometrie: Die Einschränkung
U : Bild |T | → Bild T
ist bijektiv und isometrisch.
Beweis.
Für einen Operator U mit den behaupteten Eigenschaften gilt notwendigerweise
(∗) U (|T |u) = T u .
Umgekehrt lässt sich durch (∗) ein Operator U : Bild |T | → Bild T definieren.
Die Vorschrift U (|T |u) := T u macht Sinn: Aus |T |u = |T |v folgt u − v ∈
Kern |T | = Kern T , also T u = T v. Daher ist
U : Bild |T | → Bild T , |T |u → T u
bijektiv und isometrisch wegen |T |u2 = T u2 . Nach 2.9 lässt sich U zu einer
bijektiven und isometrischen Abbildung
U : Bild |T | → Bild T
fortsetzen.
Da |T | symmetrisch ist, gilt Bild |T | = Kern |T |⊥ = Kern T ⊥ nach 3.5, also
H = Bild |T | ⊕ Kern T
nach dem Zerlegungssatz § 9 : 2.4. Definieren wir also U v := 0 für v ∈ Kern T ,

so ist ein Operator der gewünschten Art konstruiert. 2
8.4 Aufgaben
1 0
(a) Auf H = 2
seien S : x → 0
0
0
x und T : x → 0
1
0
x. Geben Sie |S|
und |T | an. Zeigen Sie, dass weder |ST | = |S| |T | noch |S + T | ≤ |S| + |T | gilt.
(b) Geben Sie die Polarzerlegung von T an.
(c) Zeigen Sie: Jeder Operator T ∈ L (H ) lässt sich darstellen als
9 Erweiterung des Funktionalkalküls 591
1
T = S1 + iS2 , wobei S1 := 2 (T + T ∗ ) , S2 := i
2 (T ∗ − T )
symmetrische Operatoren sind.
(d) Zeigen Sie: Für symmetrische Operatoren T mit T ≤ 1 gilt 0 ≤ T 2 ≤ ½,
und
U1 := T + i(1 − T 2 )1/2 , U2 := T − i(1 − T 2 )1/2
sind unitäre Operatoren.
Folgerung aus (c) und (d): Jeder Operator T ∈ L (H ) ist Linearkombination
von vier unitären Operatoren.
9 Erweiterung des Funktionalkalküls

9.1 Die Funktionenklasse F
Mit F bezeichnen wir die Klasse al-
ler Funktionen f : Ê Ê
→ + , welche
punktweiser Limes einer absteigenden
Folge beschränkter stetiger Funktionen 1
Ê Ê
fn : → + sind. fn
Das für uns wichtigste Beispiel ist die
charakteristische Funktion des Inter-
valls ] − ∞, λ] , λ λ+ 1
n
eλ := χ]−∞,λ] ,
die durch die nebenstehend skizzzierte Folge fn approximiert wird. Unmittelbar
aus der Definition ergibt sich
f, g ∈ F =⇒ f · g ∈ F und αf + βg ∈ F für α, β ≥ 0 .
Die Funktionen f ∈ F sind an jeder Stelle x0 nach oben halbstetig: Zu jedem
ε > 0 gibt es ein δ > 0, so dass
f (x) < f (x0 ) + ε für |x − x0 | < δ .
Daraus folgt, dass f auf jeder kompakten Teilmenge K ⊂ Ê
ein Maximum an-
nimmt. Die Beweise dieser beiden für das Folgende unerheblichen Eigenschaften
seien den Lesern als ÜA überlassen.
Zum Beweis benötigen wir folgendes
Lemma. Seien f = lim fn , g = lim gn , wobei (fn ) und (gn ) jeweils absteigen-
n→∞ n→∞
de Folgen beschränkter, stetiger und positiver Funktionen sind.
Ist K ⊂ Ê kompakt und f (x) ≤ g(x) auf K, so gibt es zu jedem n ∈ Æ ein
Æ
M ∈ , so dass
1
fm (x) < gn (x) + n für m > M und x ∈ K.
Beweis.
Wir fixieren n und betrachten einen Punkt y ∈ K. Zu diesem gibt es wegen
lim fk (y) = f (y) < g(y) + n1 ≤ gn (y) + n1 ein k = k(y) mit
k→∞
1
fk (y) < gn (y) + n .
Da fk , gn stetig sind, gilt diese Ungleichung auch in einer Umgebung U (y) von
y. Nach dem Überdeckungssatz von Heine–Borel (Bd. 1, § 21 : 6.3) wird K von
endlich vielen solcher Umgebungen überdeckt: K ⊂ U (y1 ) ∪ · · · ∪ U (yN ). Für
M := max{k(y1 ), . . . , k(yN )} gilt dann wegen des Absteigens der Folge (fn )
1
fm (x) < gn (x) + n für x ∈ K und alle m > M . 2
9.2 Der Funktionalkalkül für die Klasse F

Satz. Es sei T ∈ L (H ) symmetrisch und f ∈ F. Für jede absteigende Folge
beschränkter stetiger Funktionen fn : Ê Ê
→ + mit f = lim fn konvergiert
n→∞
dann die Folge der Operatoren fn (T ) stark gegen einen nur von f abhängenden
positiven beschränkten Operator, den wir mit f (T ) bezeichnen. Dieser hängt nur
von den Werten von f auf σ(T ) ab.
Beweis.
(a) Nach 8.1 (a) folgt aus der Ungleichung 0 ≤ fn+1 ≤ fn , dass die Operatoren
fn (T ) positiv sind und dass
0 ≤ fn+1 (T ) ≤ fn (T ) für n = 1, 2, . . . .
Aus dem Satz von der monotonen Konvergenz 4.5 folgt die Existenz von
S := s–lim fn (T ) ≥ 0 .
n→∞
(b) Sei (gn ) eine absteigende Folge beschränkter, positiver, stetiger Funktionen,
deren Limes g auf σ(T ) mit f übereinstimmt. Nach dem Lemma 9.1 gibt es zu
jedem n ∈ ein M ∈ mit
1
0 ≤ fm (x) < gn (x) + n für m > M und x ∈ σ(T ) .
Nach 8.1 (a) folgt
1
0 ≤ fm (T ) ≤ gn (T ) + n für m > M,
also
1
u , Su = lim u , fm (T )u ≤ u , gn (T )u + n u2 .
m→∞
Für den nach (a) existierenden s–lim gn (T ) =: R folgt S ≤ R. Durch Vertau-

n→∞
schung der Rollen von (fn ) und (gn ) erhalten wir ebenso R ≤ S und damit
R = S nach 3.6 (d). 2
9.3 Eigenschaften des erweiterten Funktionalkalküls

Für f, g ∈ F gilt
(a) (αf + β g)(T ) = αf (T ) + β g(T ), falls α, β ≥ 0,
(b) (f · g)(T ) = f (T ) · g(T ) = g(T ) · f (T ),
(c) f (λ) ≤ g(λ) für λ ∈ σ(T ) =⇒ f (T ) ≤ g(T ),

(d) f (T ) ≤ f ∞ = sup |f (λ)| λ ∈ σ(T ) ,
(e) f (T ) − g(T ) ≤ f − g∞ := sup {|f (λ) − g(λ)| | λ ∈ σ(T )}.
Bemerkung. Dass in (d) der Fall <“ eintreten kann und dass sich der spek-
”
trale Abbildungssatz nicht übertragen lässt, zeigt das Beispiel in 9.4 (b).
Beweis.
Sei f = lim fn , g = lim gn punktweise auf
n→∞ n→∞
Ê, wobei (f
n ), (gn ) absteigende
Folgen beschränkter, positiver, stetiger Funktionen sind. Dann sind auch die
Folgen (αfn + β gn ), (fn · gn ) absteigend mit Grenzwerten
αf + β g = lim (αfn + β gn ) , f · g = lim fn · gn .

n→∞ n→∞
Die Rechenregeln (a),(b) ergeben sich daraus mit Hilfe der Rechenregeln 4.4 für
starke Konvergenz; (c) ergibt sich aus dem Beweis 9.2 (b).
Zu zeigen bleibt (e); (d) folgt daraus mit g = 0.
Sei M := f − g∞ . Dann gilt
f ≤ g + M , g ≤ f + M in σ(T ) , also mit (c)
f (T ) ≤ g(T ) + M , g(T ) ≤ f (T ) + M .
Es folgt für u = 1
| u , (f (T ) − g(T ))u | = | u , f (T )u − u , g(T )u | ≤ M .
Wegen f (T ) ≥ 0, g(T ) ≥ 0 ist f (T ) − g(T ) symmetrisch. Aus 6.5 (c) folgt

f (T ) − g(T ) = sup | u , (f (T ) − g(T ))u | u = 1 ≤ M. 2
9.4 Der erweiterte Funktionalkalkül für Multiplikatoren

(a) Für eine beschränkte reelle Folge a = (a1 , a2 , . . . ) und den Multiplikator
Ma : (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . )
auf 2 ist f (Ma ) für f ∈ F gegeben durch
f (Ma ) : (x1 , x2 , . . .) −→ (f (a1 ) x1 , f (a2 ) x2 , . . . ) .
Beweis.
Sei f = lim fn mit einer absteigenden Folge beschränkter, stetiger Funktionen
Ê Ê
n→∞
fn : → + . Dann gilt 0 ≤ f (λ) ≤ f1 (λ) ≤ C mit einer Konstanten C, also
ist der Multiplikator
S : (x1 , x2 , . . . ) −→ (f (a1 ) x1 , f (a2 ) x2 , . . . )
beschränkt und positiv.

Zu zeigen ist S = s–lim fn (Ma ). Hierzu fixieren wir x = (x1 , x2 , . . . ) ∈ 2 . Sei
n→∞
ε > 0 vorgegeben und

C2 |xk |2 < ε2 .
k=N+1
Nach 7.6 gilt fn (Ma )x = (fn (a1 )x1 , fn (a2 )x2 , . . .), und nach Voraussetzung gilt
0 ≤ fn (ak ) − f (ak ) ≤ f1 (ak ) − f (ak ) ≤ C. Es folgt

N
fn (Ma )x − Sx2 < (fn (ak ) − f (ak ))2 |xk |2 + ε2 .
k=1
Nach Definition von f (Ma ) folgt wegen lim fn (ak ) = f (ak )

n→∞
f (Ma )x − Sx = lim fn (Ma )x − Sx ≤ ε für jedes ε > 0. 2

n→∞
(b) Beispiel. Für

a = (1, 12 , 13 , . . . ) und f = e0 = χ]−∞,0] ∈ F
gilt σ(Ma ) = {0, 1, 12 , 13 , . . . } nach 5.2. Wegen f (0) = 1 und f ( n1 ) = 0 ist f

nicht stetig auf σ(Ma ). Aus (a) ergibt sich f (Ma ) = 0. Also gilt
0 = f (Ma ) < f ∞ = 1 und σ(f (Ma )) = {0} = f (σ(Ma )) = {0, 1}.
In diesem Beispiel sind folgende Eigenschaften des Funktionalkalküls mit steti-

gen Funktionen verletzt:
– Injektivität der Einsetzungsabbildung f → f (T ),
– Normisomorphie f (T ) = f ∞ = max{|f (λ)| | λ ∈ σ(T )},
– spektraler Abbildungssatz f (σ(T )) = σ(f (T )).
(c) Für den Multiplikator Mv : u → v · u auf L2 (Ω, μ) mit v ∈ L∞ (Ω, μ) gilt

f (Mv ) = Mf ◦v für alle f ∈ F .
Beweis.
Sei f = lim fn mit einer absteigenden Folge beschränkter, stetiger Funktionen
Ê Ê
n→∞
fn : → + . Wegen 0 ≤ f ≤ f1 und der Beschränktheit von f1 gilt dann
f ◦ v ∈ L∞ (Ω, μ). Aus 7.6 (b) entnehmen wir fn (Mv ) = Mfn ◦v . Aus
f1 ◦ v ≥ f2 ◦ v ≥ . . . ≥ 0 und f ◦ v = lim fn ◦ v
n→∞
folgt die Behauptung mit 4.6 (b). 2
(d) Beispiel. Sei v : [a, b] → Ê stetig und nicht konstant. Für den Multipli-
kator Mv auf L2 [a, b] ist σ(Mv ) der essentielle Wertebereich von v, vgl. 5.3.
Da v stetig ist und wir das Lebesgue–Maß zugrundegelegt haben, gilt ÜA
σ(Mv ) = v([a, b]) ,
also ist σ(Mv ) ein kompaktes Intervall mit nichtleerem Innern. Nach 9.1 gilt
eλ := χ]−∞,0] ∈ F .
Für Eλ := eλ (Mv ) erhalten wir aus (c)
Eλ = Meλ ◦v .
Für innere Punkte λ von σ(Mv ) gilt offenbar 0 = Eλ = ½, und wegen e2λ = eλ
ist Eλ ein nichttrivialer orthogonaler Projektor mit σ(Eλ ) = {0, 1}, vgl. 7.7 (d).
Damit haben wir einen beschränkten symmetrischen Operator T , für den der
erweiterte Funktionalkalkül aus der C*–Algebra C*(T ) hinausführt. Denn nach
7.4 (c) besteht C*(Mv ) aus allen Operatoren g(Mv ) mit g ∈ C(σ(Mv )), und nach
7.6 (b) ist g(Mv ) = Mg◦v wieder ein Multiplikator mit einer stetigen Funktion.
Dessen Spektrum ist aber nach den Ausführungen oben immer ein Intervall.
596 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren
§ 22 Der Spektralsatz für beschränkte symmetrische

Operatoren
1 Spektralzerlegung und Spektralsatz

1.1 Die Spektralschar
Im folgenden sei T ein beschränkter symmetrischer Operator auf einem separab-
len Hilbertraum H . Gemäß § 21 : 9.1 definieren wir für λ ∈ Ê
Eλ := eλ (T ) mit eλ = χ]−∞,λ] .
Die hierdurch gegebene Spektralschar {Eλ | λ ∈ Ê} von T hat folgende Eigen-
schaften:
(a) Eλ ist ein orthogonaler Projektor für jedes λ ∈ Ê.
(b) Für λ ≤ μ gilt Eλ ≤ Eμ und Eλ Eμ = Eμ Eλ = Eλ .
(c) Die Spektralschar ist stark rechtsseitig stetig: Eλ = s–lim Eμ für λ ∈
μ→λ+
Ê.
(d) Eλ = 0 für λ < min σ(T ), Eλ = ½ für λ ≥ max σ(T ).
Bemerkung. Für λ ≤ μ ist Eμ − Eλ ein orthogonaler Projektor.
Beweis.
(a) Definitionsgemäß gilt Eλ ≥ 0 (§ 21 : 9.2). Aus e2λ = eλ folgt Eλ2 = Eλ
(§ 21 : 9.3 (b)). Also ist Eλ ein orthogonaler Projektor (§ 9 : 2.6).
(b) Für λ ≤ μ gilt eλ eμ = eλ und eλ ≤ eμ , somit Eλ Eμ = Eμ Eλ = Eλ und
Eλ ≤ Eμ nach § 21 : 9.3 (b), (c). Es folgt:
Für λ ≤ μ ist Eμ − Eλ ein orthogonaler Projektor, denn Eμ − Eλ ist symme-
trisch, und nach dem Vorangehenden gilt
(Eμ − Eλ )(Eμ − Eλ ) = Eμ2 − Eλ Eμ − Eμ Eλ + Eλ2
= Eμ − 2Eλ + Eλ = Eμ − Eλ .
(c) Die nebenstehend skizzierten ste-

tigen Funktionen fn ≥ 0 bilden eine
absteigende Folge mit
1
eλ = lim fn .
n→∞ fn
Nach § 21 : 9.2 gilt daher
Eλ = s–lim fn (T ) .
1 2
n→∞ λ λ+ n λ+ n
Für λ < μ < λ + ist Pμ := Eμ − Eλ

1
n
ein orthogonaler Projektor,
1 Spektralzerlegung und Spektralsatz 597
und wegen eλ ≤ eμ ≤ fn gilt Eλ ≤ Eμ ≤ fn (T ), also
0 ≤ Pμ ≤ fn (T ) − Eλ .
Es folgt
Pμ u2 = Pμ u , Pμ u = u , Pμ u ≤ u , (fn (T ) − Eλ )u .
Daher gilt Eμ u − Eλ u ≤ u fn (T )u − Eλ u für λ<μ<λ+ 1

n
.
(d) Für λ < min σ(T ) ergibt sich Eλ ≤ sup {eλ (x) | x ∈ σ(T )} = 0 aus
§ 21 : 9.3 (d), und für λ ≥ max σ(T ) gilt nach § 21 : 9.3 (e)

½ − Eλ ≤ sup 1 − eλ (x) x ∈ σ(T ) = 0. 2
(e) Satz. An jeder Stelle λ ∈ Ê existiert der linksseitige starke Limes

Eλ− := s–lim Eμ ,
μ→λ−
und dieser ist ein mit der Spektralschar vertauschender orthogonaler Projektor.
Beweis.
Die Projektoren Pn = Eλ − Eλ−1/n bilden nach (b) eine absteigende Folge
positiver Operatoren. Nach dem Satz § 21 : 4.5 von der monotonen Konvergenz
existiert daher Pλ := s–lim Pn . Wir definieren
n→∞
Eλ− := Eλ − Pλ = s–lim Eλ−1/n .

n→∞
Dass Pλ und Eλ− orthogonale Projektoren sind, die mit allen Eν vertauschen,
ergibt sich aus § 21 : 4.7. Sei λ− n1 < μ < λ. Es ist leicht zu sehen, dass Eλ− −Eμ
ein orthogonaler Projektor ist. Wegen Eλ− − Eμ ≤ Eλ− − Eλ− 1 = Pn − Pλ
n
folgt
(Eλ− − Eμ )u2 = u , (Eλ− − Eμ )u ≤ u , (Pn − Pλ )u .
Da die rechte Seite eine Nullfolge ist, ergibt sich die Behauptung (e). 2
1.2 Spektralmaße
Für jeden Vektor u ∈ H mit u = 1 ist durch
F (λ) = u , Eλ u = Eλ u2
eine Verteilungsfunktion gegeben. Nach § 19 : 9.3 gibt es ein eindeutig bestimmtes

Wahrscheinlichkeitsmaß μu auf Ê
mit
μu (]a, b]) = F (b) − F (a) = u , (Eb − Ea )u = (Eb − Ea )u2 .
Wir nennen μu das zum Zustandsvektor u gehörige Spektralmaß für T . Es
Ê
gilt supp μu ⊂ σ(T ), d.h. \ σ(T ) ist eine μu –Nullmenge.
Bemerkung. Aus Satz 1.1 (e) und § 19 : 9.2 erhalten wir
μu ([a, b]) = F (b) − F (a−) = u , (Eb − Ea− )u ,
μu ({λ}) = F (λ) − F (λ−) = u , (Eλ − Eλ− )u .
Beweis.
(a) Aus 1.1 folgt, dass F monoton wächst und dass F (λ) = 0 für λ < σ(T ),
F (λ) = 1 für λ ≥ σ(T ). Da aus starker Konvergenz von Operatoren die schwache
folgt, ist F rechtsseitig stetig. Also ist F eine Verteilungsfunktion und bestimmt
nach § 19 : 9.3 ein Wahrscheinlichkeitsmaß μu auf den Borelmengen in . Ê
Ê
(b) Ω = \ σ(T ) ist offen, also Vereinigung abzählbar vieler kompakter Inter-
valle [a, b] (Bd. 1, § 23 : 4.1). Für jedes solche Intervall gilt dist ([a, b] , σ(T )) > 0,
also gibt es ein c < a mit [c, b] ⊂ Ω. Dann ist eb (x) − ec (x) = 0 für x ∈ σ(T ),
also Eb − Ec = 0 und somit
μu ([a, b]) ≤ μu (]c, b]) = F (b) − F (c) = u , (Eb − Ec )u = 0 .
Daher ist Ω als abzählbare Vereinigung von μu –Nullmengen eine μu –Null-

menge. 2
1.3 Spektralzerlegung beschränkter symmetrischer Operatoren

(a) Für einen symmetrischen Operator T ∈ L (H ) mit σ(T ) ⊂ [a, b], eine auf
[a, b] stetige Funktion f und eine zu [a, b] passende Einteilung
Z = {x0 , . . . , xN } mit x0 < a < x1 < . . . < xN = b
definieren wir
δ(Z) := max{xk − xk−1 | k = 1, . . . , N }
und

N
S(f, Z) := f (xk ) Exk − Exk−1 ;
k=1
dabei ist {Eλ | λ ∈ Ê} die Spektralschar von T .

(b) Spektralzerlegungssatz. Unter den Voraussetzungen und mit den Be-
zeichnungen (a) gilt im Sinne der Normkonvergenz
f (T ) = lim S(f, Zn )
n→∞
für jede Folge von Einteilungen Zn mit lim δ(Zn ) = 0. Wir schreiben hierfür
n→∞

b
f (T ) = f (λ) dEλ .
a
Insbesondere gilt
b
T = λ dEλ .
a
Beweis.
(i) Sei zunächst f ≥ 0. Wir dürfen annehmen, dass f auf ganz Ê
stetig und
beschränkt ist. Für jede Einteilung Z gemäß (a) gilt im Sinne von § 21 : 9.1, 9.2
S(f, Z) = g(T ) − h(T )

mit

N
g := f (xk ) exk ∈ F ,
k=1

N
h := f (xk ) exk−1 ∈ F ,
k=1
f +h ∈ F.
Aus § 21 : 9.3 (e) folgt
(1) f (T ) − S(f, Z) = (f + h)(T ) − g(T ) ≤ f + h − g∞ .
Dabei ist
(2) f (x)+h(x)−g(x) = f (x)−f (xk ) für xk−1 < x ≤ xk (k = 1, . . . , N ) .
Seien Zn Einteilungen mit δ(Zn ) → 0 und := sup{δ(Zn ) | n ∈ }. Da f auf

[a − , b] gleichmäßig stetig ist, gibt es nach (1), (2) zu vorgegebenem ε > 0 ein
δ > 0 mit δ ≤ und f (T ) − S(f, Zn ) < ε, falls δ(Zn ) < δ.
(ii) Für komplexwertige stetige Funktionen f = u + iv wenden wir (i) auf u+ ,
u− , v+ , v− an und erhalten die Behauptung mit Hilfe der Dreiecksungleichung
ÜA . 2
1.4 Der Spektralsatz

(a) Satz. Sei T ∈ L (H ) symmetrisch und f ∈ C(σ(T )). Dann gilt

u , f (T ) u = f dμu
σ(T )
für jeden Vektor u ∈ H mit u = 1. Dabei ist μu das in 1.2 definierte Spek-
/u = E(μu ) und die Varianz
tralmaß. Insbesondere gilt für den Erwartungswert μ
V (μu )
/u = u , T u ,
E(μu ) = μ /u ) u .
V (μu ) = (T − μ
2
Beweis.
Wir setzen f stetig auf Ê
fort. Die Art der Fortsetzung
spielt dabei für f (T )
keine Rolle (§ 21 : 7.3); ebensowenig beeinflußt sie f dμu , da μu nach 1.2 auf
σ(T ) lebt. Sei σ(T ) ⊂ [a, b] und Z eine Einteilung der in 1.3 (a) beschriebenen
Art. Dann gilt für u = 1 und F (λ) = u , Eλ u

N
u , S(f, Z) u = f (xk ) u , (Exk − Exk−1 ) u
k=1
(∗)
N
= f (xk ) (F (xk ) − F (xk−1 )) .
k=1
Die rechte Seite ist eine Riemann–Stieltjes Summe für

b
f dμu ,
a
vgl. § 20 : 6.2. Wir setzen in (∗) Zerlegungen Zn ein mit δ(Zn ) → 0 und erhalten
aus § 20 : 6.2 und 1.3 (aus Normkonvergenz folgt schwache)
b
u , f (T ) u = lim u , S(f, Zn ) u = f dμu = f dμu .
n→∞
a σ(T )
Die Formeln für E(μu ) und V (μu ) ergeben sich für f (x) = x beziehungsweise
/u )2 .
für f (x) = (x − μ 2
(b) Ein Grundpostulat der Quantenmechanik (vgl. § 18 : 4). Für eine auf ein
quantenmechanisches System mit Systemhilbertraum H bezogene Observable
sei der Bereich der möglichen Messwerte beschränkt. Dann wird diese durch
einen beschränkten symmetrischen Operator T auf H dargestellt. Für jeden
Vektorzustand | u u | des Systems bilden die Beobachtungswerte der Obser-
vablen eine Zufallsgröße X mit Verteilung μu und Erwartungswert X /=μ /u =
u, T u .
Daraus ergibt sich folgende Deutung des Funktionalkalküls : Ist f : → Ê Ê
stetig, so hat die transformierte Zufallsgröße f (X) nach § 20 : 6.4 und nach (a)
den Erwartungswert

f dμu = u , f (T )u ,
wobei f (T ) symmetrisch ist. Nach § 21 : 3.6 (c) ist ein symmetrischer Operator
durch die zugehörige quadratische Form eindeutig bestimmt, d.h. eine quan-
tenmechanische Observable ist durch ihre Erwartungswerte in allen denkbaren
Vektorzuständen festgelegt. Somit beschreibt f (T ) diejenige Observable, die aus
der durch T beschriebenen Observablen durch die Messtransformation x → f (x)
hervorgeht.
Weitere Anmerkungen zur Quantenmechanik folgen in 1.6.
1.5 Spektrum und Wachstumsstellen der Spektralschar

Wir erinnern an die Definition von Eλ und Eλ− in 1.1.
Satz. Für die Spektralschar { Eλ | λ ∈ Ê} eines symmetrischen Operators
T ∈ L (H ) gilt:
(a) λ ∈ σ(T ) ⇐⇒ Eλ+ε − Eλ−ε = 0 für jedes ε > 0λ heißt dann eine
Wachstumsstelle der Spektralschar.
(b) λ ∈ σp (T ) ⇐⇒ Eλ − Eλ− = 0, d.h. λ ist eine Sprungstelle der Spek-
tralschar. Dann ist Qλ := Eλ − Eλ− der orthogonale
Projektor auf den Eigenraum Kern (T − λ).
(c) λ ∈ σc (T ) ⇐⇒ λ ist eine Stelle kontinuierlichen Wachstums der
Spektralschar, d.h. eine Wachstumsstelle, aber keine
Sprungstelle.
Beweis.
Grundlegend für das Folgende sind die Sachverhalte:
(1) μu (]λ − ε, λ + ε]) = u , (Eλ+ε − Eλ−ε )u für u = 1 , vgl. 1.2,
(2) σ(T ) = σapp (T ) , vgl. § 21 : 6.5, und

(3) T u − λu2 = (x − λ)2 dμu (x) für λ ∈ Ê, u = 1 .
Ê
Letzteres folgt aus dem Spektralsatz 1.4, da T − λ symmetrisch ist:
(T − λ) u , (T − λ) u = u , (T − λ)2 u = u , f (T ) u
mit f (x) = (x − λ) .
2
(a) Nach der Bemerkung 1.1 ist Pε := Eλ+ε −Eλ−ε ein orthogonaler Projektor.
Gibt es ein ε > 0 mit Pε = 0, so folgt aus (1) für u = 1
μu (]λ − ε, λ + ε]) = u , Pε u = 0 .
Daher gilt (x − λ)2 ≥ ε2 μu –f.ü., und aus (3) folgt
T u − λu2 ≥ ε2
für alle u ∈ H mit u = 1. Daher kann λ nicht zu σapp (T ) = σ(T ) gehören.
Im Fall Pε = 0 gibt es ein v ∈ H mit Pε v = 0. Für u := Pε v/Pε v gilt dann
u = 1, Pε u = u und somit nach (1)
(4) μu (]λ − ε, λ + ε]) = u , Pε u = u , u = 1 .
Daher gilt (x − λ)2 ≤ ε2 μu –f.ü., und aus (3) folgt
T u − λu2 ≤ ε2 .
Gilt daher Pε = 0 für alle ε > 0, so finden wir zu ε = n1 jeweils einen Vektor
un ∈ H mit un = 1 und T un − λun ≤ n1 . Ist also λ eine Wachstumsstelle
der Spektralschar, so gilt λ ∈ σapp (T ).
(b) Sei Qλ := Eλ − Eλ− . Nach 1.1 (e) ist Qλ ein mit allen Eν vertauschender
orthogonaler Projektor. Für u = 1 ergibt (1) wegen der Stetigkeitseigenschaft
von μu (§ 19 : 6.3)

Qλ u2 = u , Qλ u = lim u , (Eλ − Eλ−1/n )u
n→∞
= lim μu (]λ − 1
n
, λ]) = μu ({λ}) .
n→∞
Für u = 1 gilt also

u ∈ Bild Qλ ⇐⇒ u = Qλ u
(5) ⇐⇒ μu ({λ}) = Qλ u2 = 1
⇐⇒ μu = δλ .
Aus μu = δλ folgt mit (3) und § 20 : 6.1 (a)

T u − λu2 = (x − λ)2 dμu = (x − λ)2 dδλ = 0 ,
Ê Ê
also T u = λu. Umgekehrt folgt aus T u = λu, u = 1 mit (3)

0 = (x − λ)2 dμu ,
Ê
also x = λ μu –f.ü. und damit μu = δλ , d.h. u ∈ Bild Qλ . 2
1.6 Spektrum und mögliche Messwerte

Eine beschränkte Observable sei durch einen symmetrischen Operator T auf ei-
nem Hilbertraum H dargestellt. Die Werteverteilung der Observablen im Vek-
torzustand | u u | ist nach 1.4 (b) durch μu gegeben.
Satz. (a) Genau dann fällt ein Wert λ als scharfer Messwert für T in einem
geeigneten Zustand | u u | an (d.h. μu = δλ ), wenn λ ein Eigenwert von T
und u ein zugehöriger Eigenvektor ist.
(b) Alle übrigen Spektralwerte λ lassen sich beliebig genau messen: Zu jedem
ε > 0 gibt es einen Zustandsvektor u mit
μu (]λ − ε, λ + ε]) = 1 ,
d.h. alle Beobachtungswerte für T im Zustand | u u | liegen in ]λ − ε, λ + ε].
(c) Ist λ ∈ σ(T ), so gibt es ein ε > 0, so dass für jeden Zustand | u u|
μu (]λ − ε, λ + ε]) = 0
gilt
2 Beispiele 603
Beweis.
(a) folgt unmittelbar aus dem Beweisteil (b) von 1.5, Gleichung (5).
(b) folgt aus 1.5 (a) und dem zugehörigen Beweis (Gleichung (4)).
(c) Für λ ∈ (T ) gibt es nach 1.5 (a) und dem zugehörigen Beweis ein ε > 0,
so dass μu (]λ − ε, λ + ε]) = 0 für jeden Zustandsvektor u. 2
(d) Die Aussage (b) lässt sich wie folgt verschärfen:

Das Spektrum von T ist die Menge der möglichen Messwerte für T im Sinne
von § 19 : 9.1 (b): Zu jedem λ ∈ σ(T ) gibt es einen Zustand mit zugehörigem
Spektralmaß μ, so dass
μ(]λ − ε, λ + ε]) > 0 für jedes ε > 0 .
Hierzu muss jedoch der allgemeine Zustandsbegriff zugrundegelegt werden, siehe

6.4. Der Beweis wird in § 25 : 4.4 gegeben.
2 Beispiele
2.1 Operatoren mit endlichem Spektrum
Hat ein symmetrischer Operator T ∈ L (H ) ein endliches Spektrum σ(T ) =
{λ1 , . . . , λm } mit λ1 < . . . < λm , so gilt nach § 21 : 7.7 für jede auf σ(T ) definierte
Funktion f
f (T ) = f (λ1 ) P1 + . . . + f (λm ) Pm ;
dabei ist Pk für k = 1, . . . , m der orthogonale Projektor auf den Eigenraum
Kern (T − λk ). Insbesondere ist die Spektralschar von T gegeben durch

Eλ = eλ (λ1 ) P1 + . . . + eλ (λm ) Pm = Pk .
λk ≤λ
Aus 1.6 (b) folgt

Eλ− = Pk .
λk <λ
Für u = 1 ist die Verteilungsfunktion des Spektralmaßes μu

F (λ) = u , Eλ u = u , Pk u ,
λk ≤λ
also gilt

μu (B) = u , Pk u = Pk u2
λk ∈B λk ∈B
für jede Borelmenge B, d.h. μu ist das diskrete Wahrscheinlichkeitsmaß

m
μu = Pk u2 δλk .
k=1
2.2 Orthogonale Projektoren und Ja/Nein–Experimente

Für einen orthogonalen Projektor P mit 0 = P = ½ gilt σ(P ) = {0, 1}. Der
Eigenraum zum Eigenwert 0 ist Kern P = Bild (1 − P ); der Eigenraum zum
Eigenwert 1 ist {u ∈ H | P u = u} = Bild P . Somit erhalten wir aus 2.1 für
u = 1
μu = u − P u2 δ0 + P u2 δ1 .
Dies ist eine Bernoulli–Verteilung mit Erfolgswahrscheinlichkeit P u2 ; das zu-

gehörige Ja/Nein–Experiment zielt auf die Frage P u = u ?“. Als Beispiel be-
”
Ê
trachten wir im Einteilchenhilbertraum H = L2 ( 3) den Orthogonalprojektor
P : u → u χΩ ; dabei ist Ω ein Raumgebiet. Die Frage Teilchen in Ω ?“ wird
”
mit Wahrscheinlichkeit

P u2 = |u|2 d3 V
Ω
bejaht.
2.3 Multiplikatoren in L2 (Ω, μ)

Die Spektralschar des Multiplikators Mv mit v ∈ L∞ (Ω, μ) ist nach § 21 : 9.4 (c)
gegeben durch
Eλ = eλ (Mv ) = Meλ ◦v ;
dabei ist eλ ◦ v die charakteristische Funktion der Menge {v ≤ λ}, vgl. § 20 : 3.1.
Sei u = 1. Die Verteilungsfunktion F des Spektralmaßes μu ergibt sich durch

F (λ) = u , Eλ u = u , eλ◦v u = |u|2 dμ .
{v≤λ}
Daher gilt für Intervalle I = ]a, b]

(1) μu (I) = |u|2 dμ .
v −1 (I)

Auf den μ–messbaren Mengen A ⊂ Ω ist durch ν(A) := |u|2 dμ ein Wahr-
A
scheinlichkeitsmaß gegeben; wir bezeichnen es mit ν = |u|2 μ. Aus (1) folgt nach
dem Fortsetzungssatz von Carathéodory (§ 19 : 7.2):
μu ist das Bildmaß von ν = |u|2 μ unter v ,
vgl. § 20 : 6.4. Für f ∈ C(σ(Mv )) gilt nach dem Spektralsatz unter Beachtung
von f (Mv ) = Mf ◦v

(2) u , f (Mv )u L2 = f ◦ v |u|2 dμ = f ◦ v dν = f dμu .
Ω Ω σ(Mv )
3 Diagonalisierung beschränkter symmetrischer Operatoren 605
Da nach § 21 : 5.3 angenommen werden darf, dass v(Ω) ⊂ σ(Mv ) gilt, wobei
σ(Mv ) \ v(Ω) eine μ–Nullmenge ist ÜA , folgt aus (2)

f ◦ v dν = f dμu .
Ω v(Ω)
Dies entspricht der Aussage des Transformationssatzes für Bildmaße § 20 : 6.4 (b).
3 Diagonalisierung beschränkter symmetrischer Operatoren

3.1 Nichtentartete Spektren und zyklische Vektoren
(a) Charakterisierung nichtentarteter Spektren in endlichdimensionalen Hil-
berträumen. Für einen symmetrischen Operator T auf einem n–dimensionalen
Hilbertraum H gilt nach § 21 : 7.7
(1) T = λ1 P1 + . . . + λm Pm ;
dabei sind λ1 < . . . < λm die verschiedenen Eigenwerte von T und Pk die
orthogonalen Projektoren auf die Eigenräume Kern (T − λk ) für k = 1, . . . , m.
Ferner gilt für Polynome p und für a ∈ H nach § 21 : 7.7
(2) p(T )a = p(λ1 ) P1 a + . . . + p(λm ) Pm a ∈ Span {P1 a, . . . , Pm a} .
Das Spektrum von T heißt nichtentartet, wenn m = n gilt, d.h. wenn alle
Eigenwerte von T einfach und die zugehörigen Eigenräume eindimensional sind.
Aus (2) erhalten wir im Fall dim H < ∞ das folgende Kriterium:
Satz. Genau dann ist σ(T ) nichtentartet, wenn es ein a ∈ H gibt mit
{ p(T ) a | p Polynom } = H .
Beweis.
Ist σ(T ) entartet, also m < n, so folgt aus (2) für jeden Vektor a ∈ H die
Ungleichung dim{p(T ) a | p Polynom} ≤ m < n .
Ist σ(T ) nichtentartet, so gibt es eine Orthonormalbasis (v1 , . . . , vn ) für H
mit T vk = λk vk (k = 1, . . . , n), wobei λ1 < . . . < λn . Wir setzen a :=
v1 + . . . + vn . Wegen Pk a = vk , a vk = vk folgt aus (2)
p(T )a = p(λ1 ) v1 + . . . + p(λn ) vn .
Für einen beliebigen Vektor u = x1 v1 + . . . + xn vn ∈ H sei p das Inter-
polationspolynom mit p(λ1 ) = x1 , . . . , p(λn ) = xn . Dann gilt p(T ) a = u.
2
(b) Multiplikatoren in 2 . Für eine beschränkte reelle Folge λ = (λ1 , λ2 , . . .)

betrachten wir den Multiplikator
Mλ : (x1 , x2 , . . . ) −→ (λ1 x1 , λ2 x2 , . . . )
in . Das Spektrum von Mλ heißt nichtentartet, wenn λm = λn für m = n.
2
Satz. Genau dann ist σ(Mλ ) nichtentartet, wenn es ein a ∈ 2 gibt mit
Z(a) := { p(Mλ ) a | p Polynom } = 2 .
Beweis.
Nach § 21 : 7.6 (a) gilt für Polynome p und für a = (a1 , a2 , . . . ) ∈ 2
(∗) p(Mλ )a = (p(λ1 )a1 , p(λ2 )a2 , . . . ) .
(i) Sei Z(a) = 2 . Dann kann keine Koordinate von a Null sein, denn im Fall
an = 0 ist en ⊥ p(T )a für jedes Polynom p. Ferner muss λm = λn für n = m
gelten, denn andernfalls ist p(λm ) = p(λn ) und somit an em − am en ein zu Z(a)
orthogonaler Vektor. Also ist σ(Mλ ) nichtentartet.
(ii) Ist σ(Mλ ) nichtentartet und a = (a1 , a2 , . . .) ∈ 2 ein beliebiger Vektor
mit nichtverschwindenden Koordinaten, so gilt Z(a) = 2 . Denn zu gegebenem
Einheitsvektor em gibt es für jedes n ≥ m ein Interpolationspolynom p = pn
mit
1
p(λm ) = , p(λk ) = 0 für k ≤ n , k = m .
am
Aus (∗) folgt mit p∞ = sup { | p(λk ) | | k = 1, 2, . . .}

∞
∞
p(Ma ) a − em 2 = | p(λk ) |2 | ak |2 ≤ p2∞ |ak |2 → 0
k=n+1 k=n+1
für n → ∞. Somit gilt em ∈ Z(a) für m = 1, 2, . . . . Es folgt 2 = Z(a), da

20 = Span {e1 , e2 , . . .} dicht in 2 ist. 2
(c) Definition. Es sei T ∈ L (H ) ein symmetrischer Operator. Ein Vektor

a ∈ H heißt zyklischer Vektor für T , wenn {a, T a, T 2 a, . . .} eine in H dichte
Menge ist, d.h. wenn
{p(T )a | p Polynom} = H .
Das Spektrum von T heißt nichtentartet, wenn es einen zyklischen Vektor für
T gibt.
(d) Beispiele. (i) Der Multiplikator Mx := Mv mit v(x) = x auf L2 [−1, 1]

hat ein nichtentartetes Spektrum: Nach § 21 : 3.6 (b) gilt
p(Mx ) = Mp für Polynome p.
Für die konstante Funktion a = 1 ist also Mp a = p. Da die Polynome dicht in

L2 [−1, 1] liegen, ist a ein zyklischer Vektor für Mx .
(ii) Das Spektrum des Multiplikators Mx2 ist dagegen entartet. Zum Nachweis
betrachten wir den durch (Su)(x) = u(−x) gegebenen unitären Operator S
auf L2 [−1, 1]. Wegen SMx2 = Mx2 S und S 2 = S gilt Sp(Mx2 )S = Sp(Mx2 )
für jedes Polynom p. Angenommen, es gibt einen zyklischen Vektor a für Mx2 .
Dann gilt für u ∈ L2 [−1, 1] und jedes Polynom p
p(Mx2 ) a − u = Sp(Mx2 )Sa − Su = p(Mx2 )Sa − u .
Mit Hilfe der Dreiecksungleichung folgt, dass 12 (a + Sa) ebenfalls ein zyklischer
Vektor ist. Wir dürfen also gleich annehmen, dass a gerade ist: Sa = a. Wählen
wir nun u(x) := xa(x), so kann es keine Polynomfolge (pn ) geben mit
1
pn (Mx2 ) a − u 2 = | pn (x2 ) − x |2 | a(x) |2 dx → 0 für n → ∞
−1
im Widerspruch dazu, dass a zyklisch sein sollte.
3.2 Multiplikatordarstellung bei nichtentartetem Spektrum

Der symmetrische Operator T ∈ L (H ) besitze einen zyklischen Vektor a mit
a = 1, und μ = μa sei das zu a gehörige Spektralmaß. Dann gibt es eine
unitäre Abbildung
U : H → L2 (σ(T ), μ)
T
mit H - H
−1
T = U Mx U .
U 6 −1
U
Dabei ist Mx der Multiplikator Mv mit
v(x) = x. ?
Dieses Ergebnis ist eine Verallgemeine- L2 (σ, μ) - L2 (σ, μ)
rung der Diagonalisierbarkeit symme- Mx
trischer Matrizen, vgl. die Bemerkung
in § 21 : 2.7.
Beweis.
(a) Konstruktion der unitären Abbildung U : H → L2 := L2 (σ(T ), μ) mit
μ = μa . Wir bezeichnen im Folgenden die Norm in L2 mit 2 . Für Polynome
p gilt nach dem Spektralsatz und nach § 21 : 7.1 (c)

(∗) p(T ) a2 = a , p(T ) p(T ) a = a , |p|2 (T ) a = |p|2 dμ ,
σ(T )
d.h. p(T ) a = p2 .

Sei u ∈ H vorgegeben. Da a ein zyklischer Vektor ist, gibt es Polynome pn mit
pn (T )a − u → 0 für u → ∞. Insbesondere ist (pn (T )a) eine Cauchy–Folge
in H . Nach (∗) ist (pn ) eine Cauchy–Folge in L2 , also gibt es ein f ∈ L2 mit
pn − f 2 → 0. Für jede andere Polynomfolge (qn ) mit qn (T )a − u → 0 folgt

aus (∗) pn − qn 2 = pn (T )a − qn (T )a → 0 für n → ∞. Also ist f durch u
eindeutig bestimmt. Wir definieren
U u := L2 -lim pn , falls pn (T )a → u .
n→∞
Es gilt U u2 = lim pn 2 = lim pn (T )a = u wegen der Stetigkeit der
n→∞ n→∞
Normen. Offenbar ist U a = 1. Die Linearität von U ist leicht einzusehen ÜA .
(b) U ist surjektiv. Sei g ∈ L2 . Nach § 20 : 8.5 (c) gibt es Polynome qn mit
g = L2 -lim qn . Nach (∗) existiert w := lim qn (T )a, und nach Konstruktion
n→∞ n→∞
von U ist dann U w = g.
(c) Darstellung von T . Für jedes Polynom p gilt T p(T ) = p(T ) T = q(T )
mit q(x) = x p(x). Sei u = lim pn (T ) a mit Polynomen pn . Da T stetig ist, gilt
n→∞
T u = lim T pn (T ) a = lim qn (T ) a mit qn (x) = x pn (x) .

n→∞ n→∞
Daher ist U T u = L2 -lim qn . Für f := L2 -lim pn gilt

n→∞ n→∞

| Mx f − qn |2 dμ = x2 | f (x) − pn (x) |2 dμ(x) ≤ T 2 f − pn 22
σ(T ) σ(T )

wegen σ(T ) ∈ −T , T . Es folgt
U T u = L2 -lim qn = Mx f = Mx U u ,
n→∞
also T u = U −1 Mx U u. 2
3.3 Zyklische Teilräume und Teildarstellungen

(a) Für einen symmetrischen Operator T ∈ L (H ) und für 0 = a ∈ H heißt
Z(a) := {a, T a, T 2 a, . . .} = { p(T ) a | p Polynom }
der von a erzeugte zyklische Teilraum für T .

Z(a) und der Orthogonalraum Z(a)⊥ sind T –invariant.
Das Erste folgt aus der Stetigkeit von T ÜA , das Zweite aus der Symmetrie
von T , denn allgemein gilt:
Ist T ∈ L (H ) symmetrisch und V ein T –invarianter Teilraum von H , so ist
V ⊥ ein abgeschlossener T –invarianter Teilraum ÜA .
(b) Für die Einschränkung T0 von T auf H 0 := Z(a) mit a = 1 ist a ein
zyklischer Vektor. Da T0 symmetrisch ist, gilt ÜA
σ(T0 ) = σapp (T0 ) ⊂ σapp (T ) = σ(T ) .
Daher gibt es nach 3.2 ein auf σ(T ) lebendes Wahrscheinlichkeitsmaß μ0 und
Ê
eine unitäre Abbildung U0 : H 0 → L2 ( , μ0 ) mit
T0 = U0−1 Mx U0 .
(c) Hat T ein entartetes Spektrum, so zerlegen wir H in mehrere zyklische

Teilräume. Um die gemäß (b) zugehörigen Teildarstellungen voneinander zu
trennen, führen wir Translationen im Argument nach folgendem Muster durch:
Für ein auf σ(T ) lebendes Wahrscheinlichkeitsmaß μ0 und für τ = 0 setzen wir
μ(B) := μ0 (B − τ ) für B ∈ B .
Dann ist μ ein auf S := σ(T ) + τ lebendes Wahrscheinlichkeitsmaß, deswei-

Ê Ê
teren ist L2 ( , μ) ist unitär isomorph zu L2 ( , μ0 ): Ordnen wir der Funk-
Ê
tion f ∈ L2 ( , μ0 ) die durch
2 g(x) := f (x − τ ) gegebene Funktion g zu,
Ê
so gilt g ∈ L2 ( , μ) und |g| dμ = |f |2 dμ0 . Dies gilt offenbar zunächst
Ê Ê
für g = χB ÜA , damit für Elementarfunktionen und dann auch allgemein,
da die Elementarfunktionen nach § 20 : 8.2 dicht im L2 liegen. Jeder Funktion
Ê
Mx f ∈ L2 ( , μ0 ) wird dabei die Funktion x → (x − τ )g(x) zugeordnet.
Somit vermittelt (U f )(x) = f (x − τ ) für f ∈ H 0 = L2 (σ(T ), μ0 ) eine unitäre
Abbildung
U : H 0 → L2 (S, μ) mit Mx = U −1 Mv U, wobei v(x) = x − τ .
3.4 Multiplikatordarstellung bei einfach entartetem Spektrum

(a) Das Spektrum eines symmetrischen Operators T ∈ L (H ) heißt einfach
entartet, wenn es Vektoren a1 , a2 ∈ H gibt mit a1 = a2 = 1 und
H = Z(a1 ) ⊕ Z(a2 ) , Z(a2 ) ⊥ Z(a1 ) .
(b) Satz. Hat ein symmetrischer Ope-

rator T ∈ L (H ) ein einfach entar-
tetes Spektrum, so gibt es ein Wahr-
Ê
scheinlichkeitsmaß μ auf , eine Zick-
σ(T ) σ(T ) + τ
zackfunktion v der nebenstehend skiz-
zierten Art und eine unitäre Abbildung
Ê
U : H → L2 ( , μ) mit
−1
T = U Mv U .
Beweis.
Im Fall T = 0 ist nach Voraussetzung dim H = 2 ÜA , also H isomorph zu
Ê
L2 ( , μ) mit μ := 12 (δ0 + δ1 ). Sei also T = 0, c := T > 0 und τ := 4c.
Nach 3.3 sind H 1 := Z(a1 ) und H 2 := Z(a2 ) abgeschlossene T –invariante
Teilräume von H .
Für k = 1, 2 bezeichnen wir mit Tk die Einschränkungen von T auf H k . Ferner
seien S1 = σ(T ), S2 = σ(T ) + τ . Dann gilt S1 ∩ S2 = ∅. Nach 3.3 gibt es für
k = 1, 2 Wahrscheinlichkeitsmaße μk mit Träger in Sk und unitäre Abbildungen
Ê
Uk : H k → L2 ( , μk ), so dass
Tk = Uk−1 Mv Uk ,
wobei v die oben eingeführte Zackenfunktion ist.

Das Wahrscheinlichkeitsmaß μ := 12 (μ1 +μ2 ) lebt auf S1 ∪S2 , und jede Funktion
Ê
f ∈ L2 ( , μ) lässt sich in der Form
f = f1 + f2 mit Ê
fk = f χSk ∈ L2 ( , μk ) = L2 (Sk , μk )
darstellen, dabei ist

(∗) |f |2 dμ = 1
|f1 |2 dμ1 + 1
|f2 |2 dμ2 , f 1 f2 dμ = 0 .
Ê Ê
2 2
S1 S2
Ê Ê
Umgekehrt: Für f1 ∈ L2 ( , μ1 ), f2 ∈ L2 ( , μ2 ) ist f = f1 + f2 ∈ L2 ( , μ), und Ê
es gelten die Gleichungen (∗), denn fk = fk χSk μk –f.ü.
Für u ∈ H gibt es nach dem Zerlegungssatz eindeutig bestimmte Vektoren
u1 , u2 mit
u = u1 + u2 , u1 ∈ H 1 , u2 ∈ H 2 .
Dabei gilt u2 = u1 2 + u2 2 . Setzen wir daher

√ √
U u := 2 U1 u1 + 2 U2 u2
Ê
so ist U : H → L2 ( , μ) unitär:
√
Für f1 := U1 u1 , f2 := U2 u2 , f := f1 + f2 gilt also U u = 2f und

u2 = u1 2 + u2 2 = |f1 |2 dμ1 + |f2 |2 dμ2
Ê Ê
(∗)
= 2 |f |2 dμ = U u2 .
Ê
Ferner ist T u = T1 u1 + T2 u2 , also
√ √ √
U T u = 2(U1 T1 u1 + U2 T2 u2 ) = 2 v (f1 + f2 ) = v 2f = v U u. 2
3.5 Direkte Summen in H und direkte Zerlegung von H

(a) Satz. Seien H 1 , H 2 , . . . abgeschlossene, paarweise zueinander orthogo-
nale Teilräume von H ( dim H = ∞) und P1 , P2 , . . . die zugehörigen orthogo-
nalen Projektoren. Dann konvergiert für jeden Vektor u ∈ H die Reihe

∞
P u := Pk u
k=1
und liefert einen orthogonalen Projektor P . Für den abgeschlossenen Teilraum

V = Bild P gilt

∞
v ∈ V ⇐⇒ v2 = Pk v2 .
k=1
Jeder Vektor v ∈ V besitzt eine eindeutig bestimmte Zerlegung

∞
v = vk mit vk ∈ H k (k = 1, 2, . . .) ;
k=1
diese ist gegeben durch vk = Pk v für k = 1, 2, . . . .

V heißt die direkte Summe der H k , bezeichnet mit
?
∞
V = Hk.
k=1
Gilt H k = {0} für k > N , so schreiben wir V = H 1 ⊕ · · · ⊕ H N .

Im wichtigsten Fall V = H ergibt sich eine direkte Zerlegung von H :
?
∞
H = Hk bzw. H = H1 ⊕ ··· ⊕ HN .
k=1
Beweis.
Durch Ausmultiplizieren ergeben sich wegen u , Pk u = Pk u , u = Pk u2
und wegen Pk u ⊥ P u für k = die Gleichungen

n 2
n
(1) u− Pk u = u2 − Pk u2 ,
k=1 k=1

m 2
m
(2) Pk u = Pk u2 .
k=n+1 k=n+1

∞
Aus (1) folgt Pk u2 ≤ u2 , aus (2) dann die Konvergenz der Reihe
k=1

∞
P u := Pk u für alle u ∈ H .
k=1
P ist symmetrisch als starker Limes symmetrischer Operatoren; außerdem gilt

n
2
n
P 2 = P wegen Pk = Pk . Also ist P der orthogonale Projektor auf
k=1 k=1
einen abgeschlossenen Teilraum V . Aus (1) folgt

∞
∞
v∈V ⇐⇒ v = P v ⇐⇒ v = Pk v ⇐⇒ v2 = Pk v2 ,
k=1 k=1
insbesondere die Existenz von Vektoren vk ∈ H k , (k = 1, 2, . . . ) mit

∞
(3) v = vk .
k=1
Umgekehrt folgt für v ∈ V aus dem Bestehen einer Zerlegung (3), dass

∞
Pi v = Pi vk = Pi vi = vi (i = 1, 2, . . .) . 2
k=1
(b) Satz. Zu jedem symmetrischen Operator T ∈ L (H ) gibt es eine direkte

Zerlegung von H in höchstens abzählbar viele zyklische Teilräume für T .
Beweis.
Da H separabel ist, gibt es eine abzählbare Menge M = {u1 , u2 , . . . } mit
M = H , ui = uj für i = j und u1 = 0 . Wir setzen
a1 := u1 −1 u1 und H 1 := Z(a1 ) .
Im Fall M ⊂ H 1 gilt H = M ⊂ H 1 = H 1 . Andernfalls existiert
m1 = min { k ∈ |u k ∈ H 1 } .
Mit dem orthogonalen Projektor P1 auf H 1 definieren wir
a2 := um1 − P1 um1 −1 (um1 − P1 um1 ) und H 2 := Z(a2 ) .
Dann gilt a2 ⊥ H 1 , und daher H 2 ⊥ H 1 :

Für h1 ∈ H 1 h2 ∈ H 2 gibt es es Polynome pn mit h2 = lim pn (T ) a2 . Da
n→∞
H 1 nach 3.3 T –invariant ist, gilt
h1 , h2 = lim h1 , pn (T )a2 = lim pn (T )h1 , a2 = 0

n→∞ n→∞
wegen pn (T ) h1 ∈ H 1 .
Im Fall M ⊂ H 1 ⊕ H 2 gilt H = M ⊂ H 1 ⊕ H 2 = H 1 ⊕ H 2 . Andernfalls
betrachten wir den orthogonalen Projektor Q = P1 + P2 auf H 1 ⊕ H 2 und

setzen m2 := min { k ∈ | uk ∈ H 1 ⊕ H 2 },
a3 := um2 − Qum2 −1 (um2 − Qum2 ) , H 3 := Z(a3 ) .
Wie oben folgt H 3 ⊥ H 1 ⊕ H 2 , also H 3 ⊥ H 1 , H 2 ÜA .

So fahren wir fort. Bricht das Verfahren nicht ab, so betrachten wir V :=
?
∞ ?
n
H k . Nach Konstruktion gilt un ∈ H k , also M ⊂ V . Es folgt
k=1 k=1
H = M ⊂ V = V. 2
3.6 Die Multiplikatordarstellung im allgemeinen Fall

Satz. Zu jedem symmetrischen Operator T ∈ L (H ) gibt es
Ê → [ − T , T ] ,
eine stetige, periodische Funktion v :
ein Wahrscheinlichkeitsmaß μ auf Ê und
eine unitäre Abbildung U : H → L (Ê, μ) mit
2
T = U −1 Mv U .
Beweis.
Ê
Im Fall T = 0 wählen wir ein Wahrscheinlichkeitsmaß μ, für welches L2 ( , μ)
isomorph zu H ist (z.B. eine diskrete Verteilung)und setzen v := 0.
Sei also T = 0, c := T und τ := 4c. Wir setzen die durch
v(x) := c − | c − x | für − c ≤ x ≤ 3c
definierte Funktion zu einer τ –periodischen Funktion fort:
−c c 4c 8c x
Nach 3.5 (b) gibt es eine direkte Zerlegung von H in zyklische Teilräume für
T:
@
N
@
∞
H = Z(ak ) oder H = Z(ak ) .

k=1 k=1
Wir betrachten nur den zweiten Fall; bei endlich vielen direkten Summanden
verläuft die Argumentation ähnlich, vgl. 3.4.
Wir verschaffen uns abzählbar viele Kopien Sk = σ(T )+τ (k −1) des Spektrums
von T (in der Figur durch fette Striche bzw. Punkte angedeutet). Nach 3.3 gibt
es für k = 1, 2, . . . auf Sk lebende Wahrscheinlichkeitsmaße μk und unitäre
Ê
Abbildungen Uk : Z(ak ) → L2 ( , μk ), so dass die Einschränkungen Tk von T
auf Z(ak ) dargestellt werden können durch
Tk = Uk−1 Mv Uk .

∞
Nun setzen wir μ := 2−k μk . Wie in 3.4 erhalten wir
k=1

Ê Ê
∞
f ∈ L2 ( , μ) ⇐⇒ f = fk mit fk ∈ L2 ( , μk ) ,
k=1
wobei jeweils fk (x) = 0 außerhalb von Sk gilt, so dass die Reihe für jedes x ∈ Ê
höchstens ein von Null verschiedenes Glied besitzt. Es gilt dann

∞
|f |2 dμ = 2−k |fk |2 dμk .
Ê k=1 Ê

∞
Für u = uk mit uk ∈ Z(ak ) definieren wir f := U u durch
k=1

Æ) .
∞
f = fk mit fk := 2k/2 gk , gk = Uk uk (k ∈
k=1
Ê
Nach dem oben Gesagten ist U : H → L2 ( , μ) surjektiv. Die Isometrie von
U und die Behauptung T = U −1 Mv U ergeben sich wie in 3.4. 2
3.7 Der Funktionalkalkül für beschränkte messbare Funktionen

(a) Unitär äquivalente Operatoren. Zwei Operatoren T ∈ L (H ) und
S ∈ L (H ) werden unitär äquivalent genannt, wenn es eine unitäre Abbildung
U : H → H gibt mit
T = U −1 S U .
Sei dies der Fall. Da unter unitären Abbildungen die lineare Struktur sowie
Normen und Skalarprodukte unverändert bleiben, ergibt sich
T = S , T ∗ = U −1 S ∗ U , T ≥ 0 ⇐⇒ S ≥ 0 ,
σ(T ) = σ(S) , σapp (T ) = σapp (S) , σp (T ) = σp (S) , σc (T ) = σc (S) .
Ferner gilt T 2 = U −1 SU U −1 S U = U −1 S 2 U und entsprechend
T k = U −1 S k U für k ∈ Æ 0 .
Falls S, T symmetrisch sind, folgt daraus
f (T ) = U −1 f (S) U
zunächst für Polynome f und daher wegen der Konvergenztreue von U, U −1

auch für f ∈ F. Insbesondere gilt für die Spektralscharen {Eλ (T ) | λ ∈ } von Ê
Ê
T , {Eλ (S) | λ ∈ } von S,
Eλ (T ) = U −1 Eλ (S) U .
Für u = 1 und u := U u folgt die Gleichheit der Spektralmaße μu bezüglich

T und νu bezüglich S.
(b) Satz. Es sei T ∈ L (H ) ein symmetrischer Operator mit einer Multipli-

katordarstellung
T = U −1 Mv U ,
Ê
wobei U : H → L2 ( , μ) eine unitäre Abbildung, μ ein Wahrscheinlichkeits-
maß auf Ê Ê
und und v : → σ(T ) eine stetige Funktion ist.
Dann ist für jede messbare, auf σ(T ) stetige Funktion f : → durch Ê
f (T ) := U −1 Mf ◦v U
ein Operator f (T ) ∈ L (H ) definiert, d.h. für jede Multiplikatordarstellung der

oben beschriebenen Art ergibt sich derselbe Operator.
f (T ) ist schwacher Limes von Operatoren aus der von T erzeugten C*–Algebra
C*(T ).
Beweis.
(i) Für u ∈ H mit u = 1 sei w := U u ∈ L2 (, μ). Dann folgt aus
dem Spektralsatz 1.4 und den Folgerungen 2.3 für Multiplikatoren nach den
Überlegungen in (a)

(∗) u , g(T )u H = g μu = (g ◦ v) |w|2 dμ = Uu , g(Mv )U u L2
Ê Ê
für jede auf σ(T ) stetige Funktion g.
(ii) Es genügt, reellwertige, auf σ(T ) beschränkte Funktionen f zu betrachten.
Für solche ist f ◦ v beschränkt und reellwertig. Der Operator F := U −1 Mf ◦v U
ist daher nach (a) ebenso wie Mf ◦v beschränkt und symmetrisch.
Da f μu –integrierbar
ist, gibt es nach § 20 : 8.5 (b) stetige Funktionen gn mit
f dμu = lim gn dμu . Aus (∗) folgt, dass die Operatoren gn (T ) ∈ C*(T )
Ê n→∞
Ê
schwach gegen einen Operator S ∈ L (H ) konvergieren, für welchen gilt

u , Su = lim u , gn (T )u = lim gn dμ = f dμu
n→∞ n→∞
Ê Ê

= (f ◦ v) |w|2 dμ = w , Mf ◦v w L2 .
Ê
Da ein symmetrische Operator F nach § 21 : 3.6 (c) durch seine quadratische
Form festgelegt ist, folgt S := U −1 Mf ◦v U = F , wobei S nur von f und T ,
nicht aber von der Multiplikatordarstellung abhängt. 2
3.8 Vertauschbarkeit beschränkter symmetrischer Operatoren

(a) Satz (v. Neumann). Sind zwei symmetrische Operatoren S, T ∈ L (H )
vertauschbar (ST = T S), so gibt es einen symmetrischen Operator A ∈ L (H )
und beschränkte messbare Funktionen g, h : → Ê Ê mit
S = g(A) , T = h(A) ,
Hat T zusätzlich ein nichtentartetes Spektrum, so gibt es eine beschränkte messba-
re Funktion f mit
S = f (T ) .
Beachten Sie die Bemerkungen 1.4 (b) zur physikalischen Interpretation.

Den komplizierten Beweis der ersten Aussage finden Sie in Riesz–Nagy [131],
Abschnitt 130. Auf dem verbandstheoretischen Zugang zur Quantenmechanik
basiert ein kürzerer Beweis von Varadarajan, vgl. Jauch [136] 6–7.
Relativ einfach ist der Beweis der zweiten Behauptung:
Nach 3.2 und den Bemerkungen 3.7 (a) dürfen wir annehmen, dass
Ê
T = Mx auf L2 ( , μ) ,
wobei μ das zur konstanten Funktion a = 1 gehörige Spektralmaß für Mx ist,
siehe Beweis zu 3.2 (a). Vertauscht S mit T und setzen wir
v = ½, f = Sa,
so ergibt sich der Reihe nach
Sv = ST a = T Sa = vf ,
Sv 2 = ST 2 a = T 2 Sa = v 2 f ,
allgemein Sv n = v nf und daher Sp = pf für alle Polynome p. Da die Polynome
gleichmäßig dicht in C(σ(T )) liegen und C(σ(T )) eine dichte Teilmenge von
L2 (Ê, μ) ist, gibt es zu jedem u ∈ L2 (Ê, μ) ein Folge von Polynomen pn mit
pn → u und Spn = pn f → Su für n → ∞ .
Nach § 20 : 7.2 gibt es eine wieder mit (pn ) bezeichnete Teilfolge dieser Polynom-
folge, die μ–f.ü. konvergiert. Daher gilt
(Su)(x) = lim pn (x) f (x) = u(x) f (x) μ–f.ü.
n→∞
Es folgt
Su = f u = Mf u = Mf ◦v u = f (T )u
für alle u ∈ L2 (Ê, μ) und nach § 21 : 2.7 daher f ∈ L∞ (Ê, μ). 2
4 Spektralzerlegung kompakter symmetrischer Operatoren 617
(b) Für symmetrische Operatoren S, T ∈ L (H ) heißt

[S, T ] := ST − T S
der Kommutator. Für einen Zustandsvektor u ∈ H (u = 1) seien
Eu (S) = u , Su , Eu (T ) = u , T u
die Erwartungswerte bezüglich S, T ; die zugehörigen Varianzen seien
Vu (S) = (S − Eu (S))u2 , Vu (T ) = (T − Eu (T ))u2 .
Dann gilt folgende Unschärferelation:

Vu (S) Vu (T ) ≥ 1 u , [S, T ] u 2 .
4
Beweis als ÜA : Betrachten Sie zur Vereinfachung der Rechnung die Operato-
ren
A := S − Eu (S) , B := T − Eu (T )
und bestimmen Sie zunächst Eu (A), Eu (B), Vu (A), Vu (B).
Bemerkung. Auf den ersten Blick scheint hiermit die Heisenbergsche Unschärfe-
relation bewiesen. Es zeigt sich aber, dass die kanonische Vertauschungsrelation
[S, T ] = − i h̄ nicht durch beschränkte symmetrische Operatoren S, T erfüllt
werden kann (§ 23 : 1.2). Die Rechnung war dennoch nicht umsonst; sie lässt sich
ohne weiteres auf unbeschränkte selbstadjungierte Operatoren wie z.B. Orts–
und Impulsoperator übertragen.
4 Spektralzerlegung kompakter symmetrischer Operatoren

4.1 Kompakte Operatoren
(a) Ein linearer Operator T : H → H heißt kompakt (vollstetig), wenn
es zu jeder beschränkten Folge (un ) eine Teilfolge (unk )k gibt, für welche die
Bildfolge (T unk ) konvergiert. Dies ist gleichbedeutend damit, dass es zu jeder
beschränkten Menge B ⊂ H eine kompakte Menge K ⊂ H gibt mit T (B) ⊂ K
ÜA .
Kompakte Operatoren sind beschränkt ÜA .
(b) Operatoren endlichen Rangs, d.h. Operatoren T ∈ L (H ) mit end-

lichdimensionalem Bildraum sind kompakt.
Denn für un ≤ C gilt T un ∈ {w ∈ Bild T | w ≤ T C} =: K. Wegen
dim Bild T < ∞ ist K kompakt, vgl. § 21 : 2.8. Somit enthält die Bildfolge (T un )
eine konvergente Teilfolge.
Lemma. Genau dann ist T von endlichem Rang, wenn es ein N ∈ und Vek-
toren u1 , . . . , uN , v1 , . . . , vN gibt mit

N
Tu = uk , u vk für alle u ∈ H .
k=1
In Bracket–Schreibweise lautet diese Gleichung

N
T = | vk uk | mit | vk uk | : u → uk , u vk ,
k=1
vgl. § 9 : 2.8.
Beweis.
Jeder so dargestellte Operator ist offenbar stetig und von endlichem Rang. Ist
umgekehrt (v1 , . . . , vN ) eine ONB für Bild T und T ∈ L (H ), so gilt

N
N
Tu = vk , T u vk = T ∗ vk , u vk , also
k=1 k=1

N
T = | T ∗ vk vk | . 2
k=1
(c) Die Identität ist genau dann kompakt, wenn H endlichdimensional ist.
Denn im Fall dim H = N ist nach (b) kompakt. Ist H unendlichdimensional
√
und v1 , v2 , . . . ein abzählbares ONS, so gilt vm − vn = 2 für m = n, also
kann (vn ) keine konvergente Teilfolge enthalten.
(d) Weitere Beispiele folgen in 4.3.
4.2 Das C*–Ideal K (H )

Satz. Die kompakten Operatoren bilden eine C*–Unteralgebra K (H ) von
L (H ) mit der Eigenschaft T ∈ K (H ) =⇒ ST, T S ∈ K (H ) für alle
S ∈ L (H ). Das bedeutet im Einzelnen:
(a) Die kompakten Operatoren bilden einen Vektorraum.
(b) Der Limes einer normkonvergenten Folge kompakter Operatoren ist kom-
pakt.
(c) Für T ∈ K (H ) und S ∈ L (H ) sind ST und T S kompakt.
(d) Mit T ist auch T ∗ kompakt.
Beweis.
(a) Seien S, T ∈ L (H ) kompakt und (un ) eine beschränkte Folge. Dann gibt
es eine Teilfolge (unk )k , für die (Sunk )k konvergiert und davon eine mit (vm )
bezeichnete Teilfolge, für die auch (T vm ) und damit (αSvm +βT vm ) für α, β ∈
konvergiert.
(b) Wir betrachten eine Folge von Operatoren Tn ∈ K (H ), die bezüglich der
Operatornorm eine Cauchy–Folge bilden. Nach § 21 : 1.4 gibt es einen Operator
T ∈ L (H ) mit T − Tn → 0 .
Sei (uk ) eine beschränkte Folge, o.B.d.A. uk ≤ 1 für k = 1, 2, . . . . Dann gibt
es eine mit (u1,k ) bezeichnete Teilfolge, für die (T1 u1,k ) konvergiert. Davon gibt
es eine mit (u2,k ) bezeichnete Teilfolge, für die auch (T2 u2,k ) konvergiert. So
fortfahrend erhalten wir ein Schema von zeilenweise notierten Teilfolgen
u1,1 u1,2 u1,3 ···

u2,1 u2,2 u2,3 ···
.. .. .. ..
. . . .
..
un,1 un,2 un,3 .
.. .. ..
. . .
mit folgenden Eigenschaften:

(i) Jede Zeile beschreibt eine Teilfolge aller vorausgehenden Zeilenfolgen,
(ii) für jedes n ∈ konvergieren die Folgen (T u 1 n,k )k , . . . , (Tn un,k )k .
Wir bezeichnen die Diagonalfolge (un,n ) mit vn . Da vn in jeder der vorange-

henden Zeilen auftritt, ist (vn ) eine Teilfolge der ursprünglichen Folge (uk ) und
(vn )n≥m eine Teilfolge von (um,k )k . Daher konvergiert die Folge (Tm vn )n für
jedes m ∈ .
Wir zeigen die Konvergenz der Folge (T vn ) durch ein 3ε–Argument: Sei ε > 0

gegeben. Wir fixieren ein m ∈ mit T − Tm < ε. Wegen der Konvergenz der
Folge (Tm vn )n gibt es ein nε mit
Tm vk − Tm vn < ε für k > n > nε .
Wegen vn ≤ 1 folgt für k > n > nε
T vk − T vn = (T − Tm )vk + (Tm vk − Tm vn ) + (Tm − T )vn

≤ 2 T − Tm + Tm vk − Tm vn < 3ε .
(c) folgt direkt aus der Definition 4.1 (a) und der Stetigkeit von S ÜA .
(d) Nach (c) ist T T ∗ kompakt. Sei un ≤ C für n ∈ . Dann gibt es eine
wieder mit (un ) bezeichneten Teilfolge, für die (T T ∗un ) konvergiert. Die Folge
(T ∗ un ) ist eine Cauchy–Folge wegen
T ∗ um − T ∗ un 2 = um − un , T T ∗(um − un )
≤ 2 C T T ∗ um − T T ∗ un . 2
4.3 Beispiele
(a) Der Multiplikator Ma : (x1 , x2 , . . . ) → (a1 x1 , a2 x2 , . . . ) in 2 ist genau
dann kompakt, wenn (an ) eine Nullfolge ist.
Beweis.
(i) Sei (an ) keine Nullfolge. Dann gibt es ein ε > 0 mit |an | ≥ ε für unendlich

viele n ∈ , also gibt es eine Teilfolge (ank )k mit |ank | ≥ ε für alle k ∈ . Für
die Einheitsvektoren uk := enk gilt uk = 1 und
Ma uk − Ma um 2 = | ank |2 + | anm |2 ≥ 2ε2 ,
also kann die Bildfolge (Ma uk ) keine Cauchy–Folge enthalten.

(ii) Sei (an ) eine Nullfolge. Die Operatoren
Tn : (x1 , x2 , . . .) → (a1 x1 , . . . , an xn , 0, 0, . . .)
sind von endlichem Rang, also nach 4.1 (b) kompakt. Sei ε > 0 gegeben und nε
so gewählt, dass |ak | < ε für k > nε . Dann gilt

∞
Ma x − Tn x2 = |ak |2 |xk |2 ≤ ε2 x2 für n > nε ,
k=n+1
also Ma − Tn ≤ ε für n > nε . Nach 4.2 (b) ist Ma kompakt. 2
(b) Integraloperatoren vom Hilbert–Schmidt–Typ. Sei Ω ein Gebiet des

n

und G : Ω × Ω → eine messbare Funktion, für welche die Integrale

F (x) := |G(x, y)|2 dn y und S 2 := F (x) dn x
Ω Ω
konvergieren. Nach § 21 : 2.5 ist durch

(T u)(x) := G(x, y)u(y) dn y
Ω
ein beschränkter Operator T auf H = L2 (Ω) mit T ≤ S gegeben.
Satz. T ist kompakt.
Beweis.
Nach dem Satz von Tonelli § 8 : 1.8 gilt G ∈ L2 (Ω × Ω). Nach § 20 : 8.3 gibt es
daher eine Folge von Treppenfunktionen ϕm auf Ω × Ω mit

(∗) G(x, y) − ϕm (x, y) 2 dn x dn y → 0 für m → ∞ .
Ω×Ω
Jede Treppenfunktion ϕm auf Ω hat die Form

N
ϕm (x, y) = ck χIk (x) χJk (y) f.ü. ,
k=1
wo Ik , Jk kompakte Intervalle in Ω sind. Wir betrachten den zugehörigen Inte-

graloperator Tm , gegeben durch

(Tm u)(x) := ϕm (x, y) u(y) dn y .
Ω
Mit dem Skalarprodukt ., . auf L2 (Ω) gilt

N
Tm u = χJk , u ck χIk ,
k=1
also ist jeder der Operatoren Tm von endlichem Rang und somit kompakt. Aus
(∗) folgt T − Tm → 0 für m → ∞, also ist auch T kompakt nach 4.2 (b). 2
4.4 Das Spektrum kompakter symmetrischer Operatoren

Satz. Für einen kompakten symmetrischen Operator T auf einem unendlichdi-
mensionalen Hilbertraum H gilt:
(a) 0 ∈ σ(T ).
(b) Jeder von 0 verschiedene Spektralwert λ ist ein Eigenwert endlicher Viel-
fachheit, d.h. dim Kern (T − λ) < ∞.
(c) Ist T nicht von endlichem Rang, so bilden die von Null verschiedenen Ei-
genwerte von T eine Nullfolge und umgekehrt.
Beweis.
(a) Im Fall 0 ∈ (T ) hätte T eine stetige Inverse. Nach 4.2 (c) wäre dann
½ = T −1 T kompakt im Widerspruch zu 4.1 (c). Somit gilt 0 ∈ σ(T ).
(b) Sei 0 = λ ∈ σ(T ). Da T symmetrisch ist, gilt σ(T ) = σapp (T ), also gibt es
Vektoren un ∈ H mit un = 1 und T un − λun → 0 für n → ∞. Wir wählen
diese Folge gleich so, dass die Bildfolge (T un ) konvergiert. Wegen λ = 0 und
T un − λun → 0 existiert dann
1
v := lim T un = lim un ,
n→∞ λ n→∞
und es gilt v = lim un = 1. Da T stetig ist, folgt

n→∞
λv = lim T un = T v , also λ ∈ σp (T ) .
n→∞
Wäre Kern (T − λ) unendlichdimensional, so gäbe es ein ONS v1 , v2 , . . . mit

T vn = λvn (n = 1, 2, . . .). Wegen
T vm − T vn 2 = |λ|2 vm − vn 2 = 2 |λ|2 für m = n
könnte die Folge (T vn ) keine konvergente Teilfolge besitzen.

(c) Besitzt T nur endlich viele von Null verschiedene Eigenwerte λ1 , . . . , λm ,
so gilt nach § 21 : 7.7
T = λ1 P1 + . . . + λm Pm ,
wobei die Pk die orthogonalen Projektoren auf die (nach (b) endlichdimen-
sionalen) Eigenräume Kern (T − λk ) sind. Somit gilt dim Bild T < ∞. Ist al-
so T nicht von endlichem Rang, so gibt es eine Folge von Eigenwerten λn
mit |λ1 | ≥ |λ2 | ≥ . . . und ein ONS v1 , v2 , . . . zugehöriger Eigenvektoren:
T vn = λn vn für n = 1, 2, . . . . Wir können diese gleich so auswählen, dass die
Folge (T vn ) konvergiert. Aus der Abschätzung
T vm − T vn 2 = λm vm − λn vn 2 = |λm |2 + |λn |2 ≥ 2 |λn |2
für n > m entnehmen wir, dass (T un ) nur eine Cauchy–Folge sein kann, wenn
λn → 0 für n → ∞.
Bilden die Eigenwerte λ = 0 von T eine Nullfolge, so müssen es abzählbar viele
sein, und die zugehörigen Eigenvektoren liefern ein abzählbares ONS in Bild T .
2
4.5 Der Spektralsatz für kompakte symmetrische Operatoren

Satz (Hilbert 1904, Schmidt 1907) Sei T ∈ L (H ) kompakt, symmetrisch
und nicht von endlichem Rang. Dann gibt es ein abzählbares ONS v1 , v2 , . . .
aus Eigenvektoren von T und zugehörige, von Null verschiedene Eigenwerte λk
mit folgenden Eigenschaften:
(a) |λ1 | ≥ |λ2 | ≥ . . . , lim λn = 0 .
n→∞

∞
(b) T u = λk vk , u vk gilt für jeden Vektor u ∈ H , d.h. v1 , v2 , . . . ist ein
k=1
vollständiges ONS für Bild T .
(c) Die Eigenwerte λk ergeben sich nach dem Rayleigh–Prinzip

|λ1 | = max | u , T u | u = 1 = v1 , T v1 ,

|λn+1 | = max | u , T u | u = 1, u ⊥ v1 , . . . , vn

= vn+1 , T vn+1 für n = 1, 2, . . . .
(d) Weiter gilt

|λ1 | = max T u u = 1 = T v1 ,

|λn+1 | = max T u u = 1 , u ⊥ v1 , . . . , vn = T vn+1
für n = 1, 2, . . . .
Bemerkungen.
(i) Hierbei ergeben sich alle von Null verschiedenen Eigenwerte von T nach
dem Rayleigh–Prinzip (c),(d).
(ii) Ist λ = 0 kein Eigenwert von T , so ist v1 , v2 , . . . ein vollständiges ONS für
H . Denn es gilt Bild T = Kern T ⊥ = H , und Span {v1 , v2 , . . .} liegt dicht in
Bild T , also auch in H . Beachten Sie, dass in diesem Fall Bild T = H ist, da
0 ∈ σc (T ) nach 4.4 (a).
Ist λ = 0 ein Eigenwert von T , so kann der Eigenraum Kern T unendlichdi-
mensional sein (Beispiel Ma auf 2 mit a = (1, 0, 12 , 0, 13 , . . . ). Nehmen wir zu
v1 , v2 , . . . eine ONB bzw. ein vollständiges ONS u1 , u2 , . . . für Kern T hinzu, so
erhalten wir nach geeigneter Durchnummerierung insgesamt ein vollständiges
ONS für H , Näheres in 4.6.
(iii) Die Existenz der in (c), (d) angegebenen Maxima liegt nicht auf der Hand,
denn nach Voraussetzung gilt dim H = ∞, also ist {u ∈ H | u = 1} nicht
kompakt.
Beweis.
(i) Nach Voraussetzung ist T = 0. Aus § 21 : 6.5 (b),(c) entnehmen wir:

T = sup u , T u u = 1 > 0,
und T oder −T gehören zum Spektrum von T . Nach 4.4 (b) gibt es also
einen Eigenwert λ1 von T und einen zugehörigen Eigenvektor v1 mit v1 = 1
und

|λ1 | = T = sup T u u = 1 = sup u , T u u = 1 .
Wegen |λ1 | = | v1 , T v1 | = T v1 kann sup jeweils durch max ersetzt werden.

(ii) Die restlichen Behauptungen (c),(d) ergeben sich durch Induktion. Ist
v1 , . . . , vn ein ONS mit T vk = λk vk für k = 1, . . . , n, so setzen wir
Vn := Span {v1 , . . . , vn } , H n := Vn⊥ .
Offenbar ist Vn ein T –invarianter Teilraum, also ist H n ein T –invarianter, abge-
schlossener Teilraum von H , vgl. 3.3 (a). Wir betrachten die Einschränkung Tn
von T auf H n . Nach Voraussetzung gilt Tn = 0, denn sonst wäre H n ⊂ Kern T ,
also Bild T = Kern T ⊥ ⊂ H ⊥ n = Vn . Mit T ist auch Tn kompakt und symme-

trisch. Wie in (i) erhalten wir die Existenz eines Eigenwerts λn+1 und eines
zugehörigen Eigenvektors vn+1 von Tn (und damit auch von T ) mit

|λn+1 | = max u , T u u = 1 , u ∈ H n

= max T u u = 1 , u ∈ H n = Tn .
(iii) Daraus ergibt sich die Behauptung (a): Sei u ∈ H und

n
un := u − vk , u vk = u − Pn u ,
k=1
wo Pn der orthogonale Projektor auf Vn ist. Dann gilt un ∈ H n = (Bild Pn )⊥

und u2 = un 2 + Pn u2 ≥ un 2 , also
T un = Tn un ≤ Tn · un ≤ |λn+1 | · u → 0 für n → ∞,
da (λn ) eine Nullfolge ist. Nach Definition der un folgt

n
n
T u = lim vk , u T vk = lim λk vk , u vk .
n→∞ k=1 n→∞ k=1
Zu Bemerkung (i). Sei T u = λu, u = 0, λ = 0. Dann gilt u = 1

λ
T u ∈ Bild T .

∞
Da v1 , v2 , . . . ein vollständiges ONS für Bild T ist, folgt u = vk , u vk .
k=1
Daher gilt aufgrund des Entwicklungssatzes (b)

∞
0 = T u − λu = (λk − λ) vk , u vk .
k=1
Wegen u = 0 gibt es ein m mit vm , u = 0, also λ = λm . 2
4.6 Darstellungen kompakter symmetrischer Operatoren

(a) Satz. Ein linearer Operator T : H → H auf einem unendlichdimensio-
nalen Hilbertraum H ist genau dann kompakt und symmetrisch, wenn es ein
vollständiges ONS v1 , v2 , . . . für H und eine reelle Nullfolge (λn ) gibt, so dass

∞
T = λk | vk vk |
k=1
im Normsinn gilt. Dabei ist | vk vk | der Projektor u → vk , u vk .

Mit der unitären Abbildung U : H → 2 , u → ( v1 , u , v2 , u , . . . ) ist also
T = U −1 Mλ U ;
dabei ist Mλ der Multiplikator (x1 , x2 , . . . ) → (λ1 x1 , λ2 x2 , . . . ) auf 2 .

Für jede Funktion f : σ(T ) → mit lim f (λn ) = f (0) ist daher
n→∞

∞
f (T ) = f (λk ) | vk vk | .
k=1
Beweis.
(i) Für jedes ONS v1 , v2 , . . . und jede reelle Nullfolge (λn ) sind

n
Tn := λk | vk vk |
k=1
symmetrische Operatoren endlichen Rangs, insbesondere kompakt. Bilden diese

eine Cauchy–Folge in der Operatornorm, so ist ihr Normlimes T kompakt und
symmetrisch.
(ii) Sei T kompakt und symmetrisch. Dann gilt H = Kern T ⊕ Bild T , wobei
Kern T und Bild T = Kern T ⊥ beide T –invariant sind, vgl. 3.3 (a).
Ist T von endlichem Rang, so gibt es nach Bd. 1, § 20 : 3 eine ONB (v1 , . . . , vm )
für Bild T , bestehend aus Eigenvektoren zu von Null verschiedenen Eigenwer-
ten λ1 , . . . , λm . Wir ergänzen diese durch ein vollständiges abzählbares ONS
vm+1 , vm+2 , . . . für Kern T zu einem vollständigen ONS v1 , v2 , . . . für H und
setzen λk := 0 für k > m.
Sei T nicht von endlichem Rang. Im Fall Kern T = {0} folgt die Behauptung
aus 4.5, Bemerkung (ii). Andernfalls gibt es ein (endliches oder abzählbares)
vollständiges ONS u1 , u2 , . . . für Kern T und ein vollständiges ONS w1 , w2 , . . .

für Bild T aus Eigenvektoren, T wk = μk wk (k ∈ ), wobei |μ1 | ≥ |μ2 | ≥ . . . .
Im Fall dim Kern T = m setzen wir
vk := uk , λk := 0 für k = 1, . . . , m ,
vm+k := wk , λm+k := μk für k ≥ m .
Im Fall dim Kern T = ∞ setzen wir
v2k−1 := wk , λ2k−1 := μk ,
v2k := uk , λ2k := 0 für k = 1, 2, . . . .
In jedem Fall ist dann v1 , v2 , . . . ein vollständiges ONS für H aus Eigenvektoren,
und die zugehörigen Eigenwerte bilden eine reelle Nullfolge. Für u ∈ H gilt also

∞
u= vk , u vk ,
k=1
und wegen der Stetigkeit von T

∞
∞
Tu = vk , u T vk = λk vk , u vk .
k=1 k=1
Definieren wir die Operatoren Tn wie oben, so folgt aus der Besselschen Unglei-
chung

∞
(T − Tn ) u 2 = |λk |2 | vk , u |2 ≤ max {|λk |2 | k > n} u2 ,
k=n+1
also
T − Tn → 0 für n → ∞ .
Die letzte Behauptung des Satzes folgt aus § 21 : 7.6 (a): Gilt lim f (λn ) = f (0),
n→∞
so ist f stetig auf σ(T ) = {(0, λ1 , λ2 , . . . )}, also ist nach den Bemerkungen
3.7 (a)
f (T ) = U −1 Mf ◦λ U
mit
Mf ◦λ = (x1 , x2 , . . . ) −→ (f (λ1 ) x1 , f (λ2 )x2 , . . . ) . 2
(b) Spektralzerlegung positiver kompakter Operatoren. Für einen posi-

tiven kompakten Operator T ordnen wir die von Null verschiedenen Eigenwerte
der Größe nach:
μ1 > μ2 > . . . > 0 ,
und bezeichnen die orthogonalen Projektoren auf die Eigenräume Kern (T − μk )
mit Pk (k = 1, 2, . . . ). Nach 4.5 ist dann

T = μk Pk
k
eine endliche Summe oder eine normkonvergente Reihe. Da die Funktionen

eλ = χ]−∞,λ] für alle λ = 0 stetig auf σ(T ) sind ÜA , erhalten wir aus (a)
die Spektralschar auf folgende Weise: Wir setzen μ0 = 0 und bezeichnen den
orthogonalen Projektor auf Kern T mit P0 . Dann gilt wegen E0 = lim Eλ
λ→0+
ÜA

Eλ = Pk für alle λ ∈ Ê.
μk ≤λ
Für einen Vektor u ∈ H mit u = 1 ist dann das Spektralmaß

μu = Pk u2 δμk
k≥0
ein diskretes Wahrscheinlichkeitsmaß.

5 Anwendung auf Rand–Eigenwertprobleme 627
5 Anwendung auf Rand–Eigenwertprobleme

5.1 Umkehrung des Hamilton Operators eines in ]0, 1[ eingesperrten
Teilchens
(a) Für eine gegebene Funktion f ∈ C [0, 1] besitzt das Randwertproblem
(∗) −u = f , u(0) = u(1) = 0
eine eindeutig bestimmte Lösung u ∈ C2 [0, 1], gegeben durch

(
1 t(1 − x) für t ≤ x,
u(x) = G(x, t) f (t) dt mit G(x, t) =
0 x(1 − t) für t ≥ x.
Diese Lösungsformel lässt sich wie folgt gewinnen: Für eine Lösung u von (∗)
gilt
x t
u(x) = u (t) dt mit u (t) = u (0) − f (s) ds .
0 0
Daraus ergibt sich durch partielle Integration wegen u(0) = u(1) = 0
x t
u(x) = u (0) x − 1 f (s) ds dt
0 0
(1)
x x
= u (0) x − (x − 1) f (t) dt + (t − 1) f (t) dt .
0 0
1
Wegen u(1) = 0 folgt u (0) = (1 − t) f (t) dt. Setzen wir dies in (1) ein, so
0
erhalten wir nach passender Umstellung ÜA
x 1 1
(2) u(x) = (1 − x) t f (t) dt + x (1 − t) f (t) dt = G(x, t) f (t) dt .
0 x 0
Erfüllt u umgekehrt die Gleichung (2) mit f ∈ C [0, 1], so folgt offenbar u(0) =
u(1) = 0. Differentiation ergibt zunächst
x 1
(3) u (x) = − t f (t) dt + (1 − t) f (t) dt ,
0 x
woraus die C2 –Differenzierbarkeit von u und u = −f folgt ÜA .
(b) Im Hinblick auf die im nächsten Paragraphen behandelte Theorie unbe-

schränkter Operatoren geben wir diesem Ergebnis eine andere Fassung. Sei

C20 [0, 1] := u ∈ C2 [0, 1] u(0) = u(1) = 0 .
Da dieser Raum die Testfunktionen mit Träger in ]0, 1[ umfaßt, liegt er nach
§ 20 : 8.5 dicht in L2 [0, 1]. Für u ∈ C20 [0, 1] sei
H0 u := − u .
Dann ist H0 : C20 [0, 1] → C [0, 1] bijektiv, und für f ∈ C [0, 1] gilt
1
H0 u = f ⇐⇒ u = T f mit (T f )(x) := G(x, t) f (t) dt .
0
(c) Der Operator T ist für alle f ∈ L2 [0, 1] definiert. Bevor wir seine Eigen-
schaften analysieren, setzen wir den Operator H0 auf einen größeren Definiti-
onsbereich fort. Hierzu berufen wir uns auf den Begriff der Absolutstetigkeit
(§ 8 : 3.1) und auf den verallgemeinerten Hauptsatz § 8 : 3.2. Sei

D(H) := u ∈ C1 [0, 1] u absolutstetig, u ∈ L2 [0, 1], u(0) = u(1)
und Hu := −u für u ∈ D(H). Der hierdurch definierte Operator H (genauer

1
2
H ) dient als Hamilton–Operator eines in ]0, 1[ eingesperrten Teilchens. Dieser
ist unbeschränkt, denn für
vn (x) := √1 sin(πnx)
2
gilt vn = 1, Hvn = π 2 n2 .
(d) Satz. T ist ein kompakter symmetrischer Operator auf L2 [0, 1] mit folgen-
den Eigenschaften:
T ist injektiv,
Bild T = D(H) ,
der Operator H besitzt also die kompakte Inverse T .
Ferner gilt
1 1
T f 2∞ ≤ |f (x)|2 dx für f ∈ L2 [0, 1],
48 0
d.h. für jede in L2 [0, 1] konvergente Folge (fn ) ist die Bildfolge (T fn ) gleich-
mäßig konvergent.
Beweis.
(i) Die Kompaktheit von T folgt aus 4.3 (b), da G auf [0, 1] × [0, 1] stetig ist.
Wegen G(t, x) = G(x, t) für 0 ≤ x, t ≤ 1 ÜA ist T symmetrisch (§ 21 : 3.4 (e)).
(ii) Sei u = T f mit f ∈ L2 [0, 1]. Dann folgt aus (2) nach dem Hauptsatz § 8 : 3.2
aufgrund derselben Rechnung wie oben u(0) = u(1) = 0 und
x 1
(3) u (x) = − t f (t) dt + (1 − t) f (t) dt f.ü.
0 x
Wiederum nach dem Hauptsatz folgen die Absolutstetigkeit von u und daher die
C1 –Differenzierbarkeit von u als unbestimmtem Integral von u . Differentiation
von (3) ergibt u = −f f.ü., d.h. u ∈ L2 [0, 1].
Aus T f = 0 folgt insbesondere f = −(T f ) = 0 f.ü.
(iii) Für u ∈ D(H) und f := −u ∈ L2 [0, 1] ergibt sich die Formel (1), d.h.
u = T f , wie in (a) mittels des Hauptsatzes und partieller Integration (vgl.
§ 8 : 3.3).
(iv) Für u = T f gilt nach der Cauchy–Schwarzschen Ungleichung
1 1 1 1
|u(x)|2 ≤ G(x, t)2 dt |f (t)|2 dt , dabei ist G(x, t)2 dt ≤
0 0 0
48
für alle x ∈ [0, 1]. Ferner gilt T ≤ 2 1

90
ÜA . 2
√
(e) Bemerkung. In § 9 : 4.5 (b) wurde gezeigt, dass durch vn (x) = 2 sin(πnx)
2
(n = 1, 2, . . .) ein vollständiges ONS für L [0, 1] gegeben ist. Aus dem Satz (d)
ergibt sich ein weiterer Beweis dieses Sachverhalts. Da 0 nach (d) kein Eigenwert
von T ist, gibt es nach 4.5, Bemerkung (ii) ein vollständiges ONS für L2 [0, 1]
aus Eigenvektoren v ∈ L2 [0, 1] zu Eigenwerten λ = 0 von T . Für solche gilt
v = T (v/λ) ∈ Bild T = D(H), insbesondere v ∈ C [0, 1]. Nach (a) folgt dann
sogar v ∈ C20 [0, 1] und
v + λv = 0 , v(0) = v(1) = 0 .
Die einzigen Lösungen dieses Eigenwertproblems ergeben sich aber bekanntlich

durch λ = π 2 n2 , v = c vn mit geeignetem n ∈
und einer Konstanten c = 0.
5.2* Die inhomogene schwingende Saite

(a) Separationsansatz und Eigenwertproblem. Eine elastische, an den
Enden eingespannte Saite der Länge 1 mit der stetigen Massendichte > 0
unter der Spannung σ möge kleine Transversalschwingungen in der x, u–Ebene
ausführen. Für die Auslenkung u(x, t) aus der Ruhelage an der Stelle x ∈ [0, 1]
zur Zeit t ergeben sich wie in § 1 : 2 die Wellengleichung und die Einspannbedin-
gungen
∂ 2 u(x, t) ∂ 2 u(x, t)
(1) p(x) = , u(0, t) = u(1, t) = 0 ,
∂t2 ∂x2
dabei ist p(x) = (x)/σ stetig und strikt positiv. Gegeben seien ein Anfangs-
profil f und eine Anfangsgeschwindigkeit g. Wir fragen nach der Existenz und
Eindeutigkeit einer Lösung u von (1) mit den Anfangsbedingungen
∂u
(2) u(x, 0) = f (x) , (x, 0) = g(x) .
∂t
Die Separationsmethode zur Lösung dieses Problems besteht darin, wie in § 6
zunächst alle Produktlösungen u(x, t) = v(x) w(t) von (1) zu bestimmen (ste-
hende Wellen) und dann zu zeigen, dass sich die Lösung von (1), (2) als Super-

∞
position u(x, t) = vk (x) wk (t) von Produktlösungen ergibt.
k=1
Für die Produktlösungen erhalten wir in gewohnter Weise die Bedingungen
(∗) −v (x) = λ p(x) v(x) , v(0) = v(1) = 0
und w (t) + λw(t) = 0 mit einer passenden Konstanten λ. Durch partielle
1 1
Integration ergibt sich aus (∗) λ p |v|2 = |v |2 , also λ > 0 für v = 0.
0 0
(b) Das Eigenwertproblem (∗) für 0 = v ∈ C2 [0, 1] ist nach 5.1 äquivalent zur
Integralgleichung
1
v(x) = λ G(x, t) p(t) v(t) dt (0 ≤ x ≤ 1) .
0
Wir schreiben diese in der Form

1 1
(∗∗) Sv = μ v mit μ= , (Sv)(x) := G(x, t) p(t) v(t) dt .
λ 0
(c) Satz. S ist ein kompakter symmetrischer Operator auf dem Hilbertraum
H = L2 [0, 1] mit dem Skalarprodukt
1
u, v p := u(x) v(x) p(x) dx .
0
Es gibt ein vollständiges ONS v1 , v2 , . . . für H aus Eigenfunktionen von S und

zugehörige Eigenwerte μ1 > μ2 > . . . > 0 mit folgenden Eigenschaften:
Die vk sind reellwertige C2 –Funktionen mit

1
−vk = λk p vk λk = μk , vk (0) = vk (1) = 0 .
Für die Eigenwerte besteht die Identität

∞ 1 1
μ2k = G(x, t)2 p(x) p(t) dx dt .
k=1 0 0
Beweis.
(i) Nach Voraussetzung 0 < p ∈ C [0, 1] gibt es Zahlen 0 < p0 < p1 mit
1
p0 |u(x)|2 dx = p0 u2 ≤ u2p ≤ p1 u2 ,
0
also sind die gewöhnliche L2 –Norm und die Norm . p äquivalent. Daraus folgt
die Vollständigkeit von H und die Kompaktheit von S, denn es gilt Su = T (pu)
mit dem kompakten Operator T von 5.1. Die Symmetrie von S folgt aus
u , Sv p = u , pT pv = pu , T pv = T pu , pv = Su , pv = Su , v p .
(ii) 0 ist kein Eigenwert von S : Sv = T (pv) = 0 =⇒ pv = 0 =⇒ v = 0 f.ü.

nach 5.1 (d). Aus Sv = μv, 0 = v ∈ H , μ = 0 folgt nach 5.1 (b) zunächst, dass
v = μ−1 T (pv) stetig ist mit v(0) = v(1) = 0. Nach 5.1 (a) ist v dann sogar eine
C2 –Lösung des Rand–Eigenwertproblems (∗) mit λ = 1/μ > 0.
(iii) Für zwei reellwertige Lösungen u, v von (∗) ist die Wronski–Determinante
W (x) = u(x) v (x) − u (x) v(x)
konstant und verschwindet daher wegen der Randbedingungen identisch. Daher

sind u, v linear abhängig, vgl. § 4 : 2.2. Da für jede komplexwertige Lösung (∗)
auch Real– und Imaginärteil Lösungen von (∗) liefern, sind die Eigenräume von
S eindimensional und werden von reellwertigen Funktionen aufgespannt.
(iv) Aus (ii) und (iii) und 4.5, Bemerkung (ii) ergibt sich die Existenz eines
vollständigen ONS v1 , v2 , . . . der oben angegebenen Art für H .

∞
Für Gx (t) := G(x, t) gilt Gx ∈ H und damit Gx = vk , Gx p vk im
k=1
Hilbertraumsinn für jedes feste x ∈ [0, 1]. Dabei ist
1
vk , Gx p = G(x, t) p(t) vk (t) dt = (Svk )(x) = μk vk (x) .
0
Aus der Parsevalschen Gleichung folgt somit

1
∞
G(x, t)2 p(t) dt = Gx 2p = μ2k vk (x)2 für 0 ≤ x ≤ 1 .
0 k=1
Nach dem Satz von Beppo Levi ist die gliedweise Integration dieser Reihe erlaubt
und ergibt
1 1
∞ 1
∞
G(x, t)2 p(t) dt p(x) dx = μ2k vk2 (x) p(x) dx = μ2k . 2
0 0 k=1 0 k=1
Als Folgerung erhalten wir den

(d) Entwicklungssatz. Jede Funktion u ∈ C20 [0, 1] besitzt die für 0 ≤ x ≤ 1

gleichmäßig konvergente Reihenentwicklung

∞
u(x) = vk , u p vk (x) .
k=1
Beweis.
Nach 5.1 (a) gilt u = T (−u ) = Sf mit f := −u /p ∈ H . Mit dem im Satz
genannten ONS v1 , v2 , . . . erhalten wir die Entwicklung

∞
f = vk , f p vk
k=1
in H . Wegen der nach 5.1 (b) bestehenden Abschätzung
Sw2∞ = T (pw)2∞ ≤ 1
48
p2∞ w2p
führt S jede in H konvergente Reihenentwicklung in eine gleichmäßig konver-

gente Reihenentwicklung über, also konvergiert die Reihe

∞
u = Sf = vk , f p Svk
k=1
gleichmäßig in [0, 1]. Die Behauptung ergibt sich nun aus

vk , f p Svk = vk , f p μk vk = μk vk , f p vk
= Svk , f p vk = vk , Sf p vk
= vk , u p vk . 2
(e) Aufgabe. Zeigen Sie, dass jede Lösung u des Randwertproblems (1) der
inhomogenen schwingenden Saite Superposition von Produktlösungen ist:

∞
u(x, t) = wk (t) vk (x) , wobei ẅk + λk wk = 0 .
k=1
Anleitung: Wenden Sie auf ut : x → u(x, t) den Entwicklungssatz (d) an und

untersuchen Sie wk (t) = vk , ut p in Analogie zu § 6 : 3.1.
(f) Aufgabe. Seien f = S 3 f0 , g = S 3 g0 mit f0 , g0 ∈ L2 [0, 1]. Zeigen Sie, dass

dann das Anfangs–Randwertproblem (1), (2) eine Lösung besitzt.
Anleitung: Gehen Sie analog zu § 6 : 3.2 vor: Reihenansatz gemäß (e) mit
√
wk (t) = αk cos λk t + βk sin λk t , αk = vk , f p , βk = μk vk , g p ,
und Nachweis der zweimaligen gliedweisen Differenzierbarkeit der Reihe für u.
Beachten Sie dabei, dass nach 5.1 (b) vk ∞ ≤ λk c mit einer Konstanten c gilt

∞
und dass die Reihe μ2k konvergiert.
k=1
6 Der allgemeine Zustandsbegriff 633
6 Der allgemeine Zustandsbegriff

6.1 Die Spurklasse
(a) Sei T ein symmetrischer Operator auf einem n–dimensionalen Hilbertraum
H , A = (ϕ1 , . . . , ϕn ) eine ONB für H und A = (aik ) = MA (T ) die Koeffi-
zientenmatrix von T . Ferner sei B = (v1 , . . . , vn ) ein ONB aus Eigenvektoren
von T zu den Eigenwerten λk = vk , T vk (k = 1, . . . , n).
Dann gilt bekanntlich aik = ϕi , T ϕk und

n
n
n
n
Spur A = akk = ϕk , T ϕk = λk = vk , T vk .
k=1 k=1 k=1 k=1
Wir verallgemeinern dieses Ergebnis auf unendlichdimensionale Hilberträume,

wobei geeignete Voraussetzungen über die Konvergenz der an die Stelle der
Summen tretenden Reihen zu machen sind.
(b) Ein Operator T ∈ L (H ) heißt Spurklasse–Operator, wenn es ein voll-
ständiges ONS ϕ1 , ϕ2 , . . . für H gibt mit

ϕk , |T | ϕk < ∞.
k
Dabei ist |T | := (T ∗ T )1/2 , vgl. § 21 : 8.3 (a). Die Gesamtheit T (H ) der Spur-
klasse–Operatoren auf H wird die Spurklasse (trace class) genannt.
Hat H endliche Dimension, so gehört jeder Operator T : H → H zur Spur-
klasse. Unser Interesse gilt im Folgenden den positiven Spurklasse–Operatoren
auf unendlichdimensionalen Hilberträumen H .
Beispiel. Ist T ∈ L (H ) kompakt und positiv, so gibt es ein vollständiges

ONS v1 , v2 , . . . aus Eigenvektoren und zugehörige Eigenwerte λ1 , λ2 , . . . . We-
gen vk , T vk = λk ≥ 0 gehört T sicher dann zur Spurklasse, wenn

∞
λk < ∞ .
k=1
Satz. Spurklasseoperatoren sind kompakt. Ist T ein ein positiver Spurklasse-

operator, so hat die Spur

∞
tr (T ) := ϕk , T ϕk
k=1
von T für jedes vollständige ONS ϕ1 , ϕ2 , . . . denselben Wert.

Ist insbesondere v1 , v2 , . . . ein vollständiges ONS aus Eigenvektoren von T mit
zugehörigen Eigenwerten λk = vk , T vk , . . . , so gilt

∞
tr (T ) = λk .
k=1
Die entsprechenden Aussagen für dim H < ∞ wurden unter (a) aufgeführt.
Beweis.
(i) Es genügt, die Kompaktheit positiver Spurklasseoperatoren zu zeigen, denn
mit T ist definitionsgemäß auch |T | ein Spurklasseoperator. Ist |T | kompakt, so
auch T wegen der Polardarstellung T = U |T |, vgl. § 21 : 8.3. Wir betrachten
im Folgenden neben T ≥ 0 die positive Quadratwurzel T 1/2 (§ 21 : 8.2) und
beachten, dass
v , T u = v , T 1/2 T 1/2 u = T 1/2 v , T 1/2 u ,
insbesondere
u , T u = T 1/2 u2 .
Sei dim H = ∞, 0 ≤ T ∈ T (H ) und ϕ1 , ϕ2 , . . . ein vollständiges ONS für H

mit

∞
∞
ϕk , T ϕk = T 1/2 ϕk 2 < ∞ .
k=1 k=1
Durch

n
Tn u := ϕk , T u ϕk
k=1
sind Operatoren endlichen Rangs gegeben. Mit der Parsevalschen Gleichung und
der Cauchy–Schwarzschen Ungleichung erhalten wir für u ≤ 1

∞
T u − Tn u2 = | ϕk , T u |2
k=n+1

∞
= | T 1/2 ϕk , T 1/2 u |2
k=n+1

∞
≤ T 1/2 u2 T 1/2 ϕk 2
k=n+1
∞
≤ T 1/2 2 ϕk , T ϕk u2 ,
k=n+1
also gilt lim T − Tn = 0, und T ist nach 4.2 (b) kompakt.

n→∞
(ii) Somit gibt es ein vollständiges ONS v1 , v2 , . . . aus Eigenvektoren von T mit
zugehörigen Eigenwerten λ1 ≥ λ2 ≥ . . . . Aus den Darstellungen

∞
∞
ϕk = vn , ϕk vn , T ϕk = vn , T ϕk vn
n=1
n=0
folgt mit der allgemeinen Parsevalschen Gleichung § 9 : 4.4 (c)

∞
∞
ϕk , T ϕk = vn , ϕk vn , T ϕk = vn , ϕk T vn , ϕk
n=1 n=1
(1)
∞
= λn | vn , ϕk |2 .
n=1
Da nach der Parsevalschen Gleichung die Reihe

∞
(2) | vn , ϕk |2 = vn 2 = 1
k=1

∞
konvergiert und wegen der vorausgesetzten Konvergenz der Reihe ϕk , T ϕk
k=1
erhalten wir aus dem großen Umordnungssatz Bd. 1, § 7 : 6.6

∞ ∞
∞
ϕk , T ϕk = λn | vn , ϕk |2
k=1 k=1 n=1
(3)
∞ ∞
∞
∞
= λn | vn , ϕk |2 = λn vn 2 = λn ,
n=1 k=1 n=1 n=1
insbesondere die Konvergenz der letzten Reihe.

(iii) Ist ψ1 , ψ2 , . . . ein anderes vollständiges ONS für H , so gelten die Glei-

∞
chungen (1), (2) mit ψk statt ϕk . Da λn konvergiert, erhalten wir mit (2)
n=1
die Konvergenz der Reihen

∞ ∞
∞ ∞
∞
λn = λn | vn , ψk |2 = λn | vn , ψk |2
n=1 n=1 k=1 k=1 n=1
nach dem großen Umordnungssatz. Aufgrund von (1) mit ψk statt ϕk folgt die
Konvergenz der Reihe

∞
∞
∞
ψk , T ψk = λn = ϕk , T ϕk .
k=1 n=1 k=1
Im Fall dim H < ∞ sind die Reihen durch endliche Summen zu ersetzen. 2
6.2 Der allgemeine Spurbegriff

Satz. Für einen positiven Spurklasseoperator T und einen Operator A ∈ L (H )
hat die Spur

tr (AT ) := ϕn , AT ϕn
n
für jedes vollständige ONS ϕ1 , ϕ2 , . . . denselben endlichen Wert. Insbesondere
gilt

tr (AT ) = λk vk , Avk
k

für jede nach 4.6 (a) und 6.1 bestehende Darstellung T = λk | vk vk | . Für
k
den Projektor T = | ϕ ϕ | auf Span {ϕ} mit ϕ = 1 ergibt sich insbesondere
tr (AT ) = ϕ , Aϕ für A ∈ L (H ) .
Beweis.
Da T nach 6.1 kompakt ist, gibt es nach 4.6 (a) ein vollständiges Orthonor-
malsystem vk (k = 1, 2,. . . ) aus Eigenvektoren von T zu den Eigenwerten
λk = vk , T vk , wobei λk = tr (T ) < ∞.
k
Sei ϕ1 , ϕ2 , . . . ein beliebiges vollständiges ONS. Dann gilt für n = 1, 2, . . .

T ϕn = vk , T ϕn vk = T vk , ϕn vk = λk vk , ϕn vk .
k k k
Da A stetig ist folgt

AT ϕn = λk vk , ϕn Avk ,
k
und wegen der Stetigkeit des Skalarprodukts ergibt sich daraus

(1) ϕn , AT ϕn = λk ϕn , vk ϕn , Avk .
k
Die Parsevalsche Gleichung § 9 : 4.4 liefert die absolute Konvergenz der Reihe

(2) vk , Avk = ϕn , vk ϕn , Avk .
n
Wegen | λk vk , Avk | ≤ |λk | Avk ≤ |λk | A konvergiert die Reihe

s := λk vk , Avk
k
absolut. Aus dem großen Umordnungssatz folgt mit (2) und (1)
(2)
s = λk ϕn , vk ϕn , Avk = λk ϕn , vk ϕn , Avk
k n n k
(1)
= ϕn , AT ϕn im Sinne absoluter Konvergenz.
n
Ist ϕ = 1 und T = | ϕ ϕ |, so ergänzen wir ϕ1 := ϕ zu einem vollständigen

ONS ϕ1 , ϕ2 , . . . für H . Wegen T ϕ1 = T ϕ = ϕ und T ϕn = 0 für n ≥ 2 folgt
nach dem Vorangehenden

tr (AT ) = ϕn , AT ϕn = ϕ1 , AT ϕ1 = ϕ , Aϕ . 2
n
Bemerkung. Die Spurklasse T (H ) ist bezüglich der Spurnorm T 1 = tr (|T |)

ein Banachraum. Jedes stetige lineare Funktional L auf (T (H ), 1 ) hat die
Form
L(T ) = tr (AT ) für T ∈ T (H )
mit einem geeigneten Operator A ∈ L (H ).

Für den Beweis verweisen wir auf Reed–Simon [130] VI.6.
6.3 Zusammensetzen zweier Vektorzustände

(a) Im folgenden seien ϕ, ψ ∈ H linear unabhängige Vektoren mit ϕ =
ψ = 1. Wir betrachten eine Linearkombination η = α ϕ + β ψ mit η = 1.
Der Zustand Pη = | η η | wird kohärente Überlagerung der Zustände Pϕ , Pψ
genannt.
(b) Eine Gesamtheit heißt echtes statistisches Gemisch der durch ϕ, ψ beschrie-
benen Gesamtheiten, wenn ihre Teilchen mit einer Wahrscheinlichkeit p > 0 im
Zustand Pϕ und mit Wahrscheinlichkeit q = 1−p > 0 im Zustand Pψ präpariert
sind.
Eine illustrative Diskussion der physikalischen Bedeutung und der Abgrenzung
dieser Begriffe gegeneinander finden Sie in Cohen–Tannoudji [157] Ch. III E.
Wir betrachten eine beschränkte Observable, beschrieben durch einen symme-
trischen Operator A ∈ L (H ). Sind μϕ , μψ die zugehörigen Spektralmaße und
/ϕ , μ
μ /ψ deren Erwartungswerte, so ist es naheliegend, die Verteilung μ der Be-
obachtungswerte der Observablen A im statistischen Gemisch in der Form
μ := p μϕ + q μψ
anzusetzen mit Erwartungswert
(∗) / = pμ
μ /ϕ + q μ
/ψ = p ϕ , Aϕ + q ψ , Aψ .
Aus der letzten Formel entnehmen wir: Echte statistische Gemische sind keine
Vektorzustände, insbesondere keine kohärenten Überlagerungen. Denn es gibt
keinen Vektor η mit η = 1, so dass μ/η = p μ
/ϕ + q μ
/ψ , d.h.
η , Aη = p ϕ , Aϕ + q ψ , Aψ
für jede beschränkte Observable A gilt ( ÜA , betrachten Sie A = Pη ).
(c) Dem Zustand des oben genannten statistischen Gemischs soll ein Operator
W so zugeordnet werden, dass sich Vektorzustände Pϕ = | ϕ ϕ | als Spezialfall
unterordnen. Dies soll vor allem die Formel für die Erwartungswerte betreffen.
Dazu beachten wir, dass Pϕ = | ϕ ϕ | ein positiver Spurklasseoperator mit
Spur 1 ist und dass nach 6.2
/ϕ = ϕ , Aϕ = tr (APϕ )
μ
für jede Observable A gilt.

Der Ansatz
W := p | ϕ ϕ| + q |ψ ψ|
zur Beschreibung des Zustands unseres statistischen Gemischs leistet das Ge-
wünschte:
(d) Satz. W = p | ϕ ϕ| + q |ψ ψ | ist ein positiver Spurklasseoperator mit

der Eigenschaft
tr (AW ) = p ϕ , Aϕ + q ψ , Aψ /ϕ + q μ
= pμ /ψ
für alle symmetrischen Operatoren A ∈ L (H ). Für A = ½ gilt insbesondere
tr W = 1 .
Beweis.
Aus W u = p ϕ , u ϕ + q ψ , u ψ folgt dim Bild W = 2 und
u , W u = p | ϕ , u |2 + q | ψ , u |2 ≥ 0 .
Als positiver Operator endlichen Rangs gehört W also zur Spurklasse T und ist
insbesondere kompakt. Also gibt es eine ONB v1 , v2 für Bild W und zugehörige
Eigenwerte λ1 > λ2 > 0 mit
W = λ1 | v1 v1 | + λ2 | v2 v2 | .
Wir ergänzen v1 , v2 durch ein vollständiges ONS v3 , v4 , . . . von Kern W zu
einem vollständigen ONS v1 , v2 , . . . für H . Nach 6.2 gilt für A ∈ L (H )
tr (AW ) = v1 , AW v1 + v2 , AW v2
= v1 , A(p ϕ , v1 ϕ + q ψ , v1 ψ) + v2 , A(p ϕ , v2 ϕ + q ψ , v2 ψ)
= p ( ϕ , v1 v1 , Aϕ + ϕ , v2 v2 , Aϕ )
+ q ( ψ , v1 v1 , Aψ + ψ , v2 v2 , Aψ )
= p ϕ , Aϕ + q ψ , Aψ
nach der Parsevalschen Gleichung § 9 : 4.4 (c). Für A = ½ folgt
tr T = p ϕ , ϕ + q ψ , ψ = p +q = 1. 2
6.4 Der allgemeine Zustandsbegriff

(a) Der Zustand eines quantenmechanischen Systems mit Systemhilbertraum
H wird durch einen positiven Spurklasseoperator W mit tr W = 1 (Dichte-
operator) beschrieben. Nach 4.6 besitzt jeder Dichteoperator eine Darstellung

dim H
W = pk | vk vk | ,
k=1
wobei v1 , v2 , . . . ein vollständiges ONS für H aus Eigenvektoren von W zu den

Ê
Eigenwerten p1 , p2 , . . . ∈ + ist sowie (nach 6.1)

pk = 1 = tr W .
k
Ist eine Observable durch einen symmetrischen Operator A ∈ L (H ) beschrie-

ben und sind μv1 , μv2 , . . . die zugehörigen Spektralmaße, so deuten wir deren
Konvexkombination

μ = μW := pk μvk
k
als die Verteilung der Beobachtungswerte für A im Zustand W . Demgemäß ist

/=
μ /vk =
pk μ pk vk , Avk = tr (AW ) .
k k
(b) Satz. Seien u1 , u2 , . . . beliebige Vektoren der Norm 1 und c1 , c2 , . . . nicht-

∞
negative Zahlen mit cn = 1. Dann ist durch die normkonvergente Reihe
n=1

∞
W := cn | un un |
n=1
ein Dichteoperator gegeben.
Beweis.
Für den Projektor Pn = | un un | vom Rang 1 gilt Pn = 1. Für die Par-

m
m+k
tialsummen Sm = cn | un un | ist daher Sm+k − Sm ≤ cn .
n=1 n=m+1
Somit ist W nach 4.2 (b) kompakt.

Wegen Pn ϕ = un , ϕ un gilt W ≥ 0, denn

∞
∞
ϕ, W ϕ = cn ϕ , un un , ϕ = cn | un , ϕ |2 ≥ 0 .
n=1 n=1
Für jedes vollständige ONS ϕ1 , ϕ2 , . . . folgt mit dem Umordnungssatz und der
Parsevalschen Gleichung

∞
∞
∞
∞
ϕk , W ϕk = cn | un , ϕk |2 = cn un 2
k=1 n=1 k=1 n=1
∞
= cn = 1 . 2
n=1
(c) Bemerkungen. (i) Durch die Überlegungen 6.3 wurde der allgemeine Zu-
standsbegriff allenfalls plausibel gemacht. Dass der Ansatz 6.4 vom Grundla-
genstandpunkt aus zwingend ist, wurde 1953 von Gleason gezeigt, Näheres
dazu in Mackey [137] 2–2.
(ii)Die Frage, ob alle Dichteoperatoren möglichen Zuständen eines konkreten
quantenmechanischen Systems entsprechen, soll uns hier nicht beschäftigen. Wir
kommen in § 25 : 4.7, 4.8 darauf zurück.
6.5 Ideale Messungen

Gegeben sei ein symmetrischer Operator A mit nichtentartetem diskreten Spek-
trum, den wir in der Form

A = λk Pk mit Pk = | ϕk ϕk |
k
darstellen; dabei ist ϕ1 , ϕ2 , . . . ein vollständiges ONS, die λk sind paarweise

verschieden und σ(A) = {λk | k ∈ } . Ob die Folge (λk ) beschränkt ist (wie
bisher immer angenommen) oder unbeschränkt sein darf wie in den nächsten
Paragraphen, ist dabei unerheblich.
Führen wir für die durch A beschriebene Observable eine Messung durch, so
bedeutet dies einen Eingriff ins System und bewirkt im allgemeinen eine Zu-
standsänderung. Wir studieren dies zunächst für den einfachsten Fall eines Vek-
torzustands W = | ψ ψ | mit ψ = 1. Da die Spektralschar nur Sprungstellen
besitzt und nach 1.5 an den Stellen λk um Pk springt, erhalten wir für das
Spektralmaß

μψ = Pk ψ2 δλk = | ϕk , ψ |2 δλk .
k k
Dies bedeutet, dass λ1 , λ2 , . . . die einzigen möglichen Messwerte sind und dass
im Zustand W = | ψ ψ | der Messwert λk mit Wahrscheinlichkeit Pk ψ2
anfällt.
Das Reduktionsprinzip der Quantenmechanik besagt, dass sich das System
nach Messung eines Eigenwerts λk in einem Eigenzustand befindet. Demnach
muss das System dann im Zustand Pk sein, da die Eigenräume eindimensional
sind, und der Zustand kann sich bei nochmaliger Messung nicht mehr ändern.
Wir drücken die Wahrscheinlichkeit Pk ψ2 , im Zustand W = | ψ ψ | den Wert
λk zu beobachten, auf andere Weise aus. Nach 6.1 gilt
Pk ψ2 = ψ , Pk ψ = tr (Pk W ) .
Sei nun das System vor der Messung im gemischten Zustand

W = pn | ψn ψn |
n

mit p1 , p2 , . . . ∈ Ê +, pk = 1 und einem vollständigen ONS ψ1 , ψ2 , . . . . Für
k
das zum Zustand W und zur Observablen A gehörige Spektralmaß μ gilt dann
nach 6.4 und der Rechnung oben

μ = pn μψn = pn Pk ψn 2 δλk = pn Pk ψn 2 δλ k
n n k k n

= pn ψn , Pk ψn δλ k = tr (Pk W ) δλk ,
k n k
d.h. der Wert λk hat auch hier die Wahrscheinlichkeit tr (Pk W ). Daher haben
wir den Zustand W nach der Messung anzusetzen als

W = tr (Pk W ) Pk .
k
Um diese Gleichung umzuformen, testen wir den Operator tr (Pk W )Pk mit dem
ONS ϕ1 , ϕ2 , . . . . Wir erhalten tr (Pk W ) Pk ϕi = 0 für k = i und

tr (Pk W )Pk ϕk = tr (Pk W ) ϕk = pn ψn , Pk ψn ϕk
n
= pn ψn , ϕk ϕk , ψn ϕk
n

= ϕk , pn ψn , ϕk ψn ϕk
n
= ϕk , W ϕk ϕk = Pk W ϕk = Pk W Pk ϕk .
Wegen Pk W Pk ϕi = 0 für i = k gilt somit

(∗) W = Pk W Pk .
k
Unabhängig von den oben gemachten Annahmen heißt eine Messung ideal, wenn
für den Zustand W vor der Messung und den Zustand W nach der Messung
eine Formel der Bauart (∗) gilt, wobei die Pk orthogonale Projektoren sind mit
Pi Pk = δik Pk . Für solche folgt aus (∗) wegen der Stetigkeit der Projektoren und
aus Pi Pk = δik Pk ÜA : Der Zustand

W = Pi W Pi
i
nach einer nochmaligen Messung der Observablen A ist wieder W .

Zur Diskussion des Messprozesses bei entarteten oder kontinuierlichen Spektren
aus physikalischer Sicht verweisen wir auf Cohen–Tannoudji [157] Ch. III E.
642 § 23 Unbeschränkte Operatoren
§ 23 Unbeschränkte Operatoren
Vorkenntnisse. Maß und Integral (§ 19, § 20), Spektraltheorie beschränkter sym-
metrischer Operatoren (§ 21, § 22), Testfunktionen und Glättung von Funktio-
Ê
nen (§ 10), Fouriertransformation auf S ( n ) (§ 12 : 3). Einige Beispiele und
Sätze beziehen sich auf die Theorie des Laplace–Operators auf Gebieten des
Ê n
und erfordern zusätzliche, separat ausgewiesene Vorkenntnisse; diese können
von nur an der Quantenmechanik interessierten Lesern übergangen werden.
1 Definitionen und Beispiele

1.1 Orts– und Impulsoperator auf dem Schwartzraum S
Wir realisieren die Heisenbergsche Vertauschungsrelation AB − BA = − i½
(h̄ = 1 gesetzt) durch das Operatorenpaar
P, Q : S → S , P u := −i u , Q u := x · u für u ∈ S
auf dem Schwartz–Raum S = S (Ê) der schnellfallenden Funktionen; dabei
steht x · u für die Funktion x → x · u(x).
Diese Operatoren erfüllen in der Tat die Vertauschungsrelation
P Q − QP = −i ½S ,
denn für u ∈ S gilt
d
(P Q u)(x) = −i (x u(x)) = − i u(x) − i x u (x) = − i u(x) + (QP u)(x).
dx
Dass Q als Ortsoperator und P als Impulsoperator eines spinlosen Teilchens mit
einem Freiheitsgrad aufgefasst werden, wurde in § 18 : 4.5* plausibel gemacht;
was P anbetrifft, geben wir in § 25 (4.1 (d) und 3.5 (a)) eine tiefergehende Be-
gründung.
Wir notieren einige typische Eigenschaften dieser Operatoren:
(a) Der Definitionsbereich S ist ein dichter Teilraum von H = L2 (Ê).
(b) P und Q sind symmetrisch:
u, P v = P u, v , u , Qv = Qu , v für alle u, v ∈ S .
(c) P und Q sind unbeschränkt.
(e) P und Q besitzen symmetrische Fortsetzungen.
Nachweis der Eigenschaften (a)–(e):
c (Ê) ⊂ S .
(a) folgt aus § 20 : 8.5 (a) und C∞
(b) Es gilt

+∞
+∞
u , Qv = u(x) x v(x) dx = x u(x) v(x) dx = Qu , v ,
−∞ −∞
1 Definitionen und Beispiele 643
und partielle Integration ergibt

u, P v = −i u v dx = i u v dx = −iu v dx = P u , v .
Ê Ê Ê
2
(c) Für un (x) := (2n/π)1/4 e−nx gilt un = 1, P un 2 = un = n
2
ÜA ,
/n = 1, Qu
also u /n 2 = n nach § 12 : 3.
(d) Eine Fortsetzung Q : D → H des Ortsoperators Q : S → H erhalten wir

+∞
durch Qu = x·u auf D = {u ∈ H | |x·u(x)|2 dx < ∞ }. Der Impulsoperator
−∞
P lässt sich durch P u = −i u auf den Teilraum
Ê Ê
W1 ( ) = { u ∈ L2 ( ) | u absolutstetig, u ∈ L2 ( ) } Ê
fortsetzen, vgl. § 8 : 3.1, 3.2. Wir zeigen später, dass die so definierten Fortset-
zungen maximal symmetrisch sind, d.h. ihrerseits keine echten symmetrischen
Fortsetzungen besitzen.
1.2 Vertauschungsrelation und unbeschränkte Operatoren

Typisch für die Quantenmechanik ist das Auftreten von Observablenpaaren,
welche die kanonische Vertauschungsrelation AB − BA = −i½ erfüllen. Die
dieser Relation genügenden Operatoren P und Q erwiesen sich als unbeschränkt.
Dass die Vertauschungsrelation prinzipiell nicht durch beschränkte Operatoren,
insbesondere nicht durch n × n–Matrizen erfüllbar ist, besagt der
Satz von Wintner (1929). Für beschränkte Operatoren A, B auf einem nor-
mierten Raum kann die Gleichung AB − BA = α½ nur für α = 0 gelten.
Beweis nach Wielandt (1949).
Aus AB − BA = α½ folgt
A2 B − BA2 = A(AB − BA) + (AB − BA)A = 2αA ,
A3 B − BA3 = A(A2 B − BA2 ) + (AB − BA)A2 = 3αA2
und entsprechend durch Induktion
An B − BAn = n α An−1 für alle n ∈ Æ.
Daraus ergibt sich
n · |α| · An−1 ≤ An−1 AB + BA An−1 ≤ 2 A · B · An−1 .
Im Fall An = 0 für alle n ∈ Æ folgt n |α| ≤ 2A · B für alle n ∈ Æ, also
α = 0.
Andernfalls gibt es ein m ∈ Æ mit Am = 0 und Am−1 = 0 . Daraus ergibt sich
mαAm−1 = Am B − BAm = 0, also ebenfalls α = 0. 2
1.3 Lineare Operatoren

(a) Ein linearer Operator auf einem Hilbertraum H ist ein Paar A =
(D, L), bestehend aus einem dichten Teilraum D von H und einer linearen
Abbildung
L:D→H .
Gleichheit zweier Operatoren A1 = (D1 , L1 ) und A2 = (D2 , L2 ) bedeutet im

Folgenden in erster Linie Gleichheit der Definitionsbereiche und dann natürlich
auch der Operationsvorschriften:
D1 = D2 und L1 u = L2 u für alle u ∈ D1 = D2 .
Dass der Definitionsbereich eine entscheidende Rolle spielen wird, hat folgenden
Grund: Dieselbe Operationsvorschrift L (z.B. u → − Δu ) kann je nach Defini-
tionsbereich Operatoren mit ganz verschiedenen Eigenschaften liefern, wie wir
in den folgenden Beispielen vorführen.
Meist werden wir bequemlichkeitshalber dem in der Literatur üblichen, nicht
ganz konsequenten Sprachgebrauch folgen: Ein linearer Operator A ist gegeben
durch seinen Definitionsbereich D(A) und die Vorschrift
A : D(A) → H , u → Au .
Von besonderem Interesse sind symmetrische Operatoren A, gekennzeichnet

durch
u , Av = Au , v für u, v ∈ D(A) .
(b) Beispiele. Auf H = L2 [a, b] betrachten wir die Operatoren A0 , A1 , A2 , A3

mit der Operationsvorschrift
L = − Δ : u → −u
und den Definitionsbereichen
D(A0 ) = C∞
c (]a, b[),

D(A1 ) = C20 [a, b] := u ∈ C2 [a, b] | u(a) = u(b) = 0 ,

D(A2 ) = C2per [a, b] := u ∈ C2 [a, b] | u(a) = eiϕ u(b) , u (a) = eiϕ u (b)
mit einer festen Zahl ϕ ∈ Ê,
D(A3 ) = C2 [a, b] .
A0 heißt der minimale Laplace–Operator auf [a, b], A1 ist im Wesentlichen

der Hamilton–Operator eines in ]a, b[ eingesperrten Teilchens mit einem Frei-
heitsgrad und A2 tritt im Zusammenhang mit periodischen Bewegungen bzw.
1 Definitionen und Beispiele 645
Bewegungen eines Teilchens in einer Raumrichtung eines Kristallgitters auf. A3

hat keine physikalische Bedeutung.
Wir machen uns zunächst klar, dass A0 , A1 , A2 , A3 lineare Operatoren sind.
Hierzu ist zu zeigen, dass sie dicht definiert, d.h. dass ihre Definitionsberei-
che dicht in H sind. Dies folgt für A0 aus § 20 : 8.5 (a) und für die anderen
Operatoren wegen D(A0 ) ⊂ D(Ak ) für k = 1, 2, 3.
Die Operatoren A1 , A2 , A3 sind zwar Fortsetzungen von A0 , unterscheiden sich
aber in folgenden Punkten:
A0 und A1 sind injektiv, Kern A2 = { u ∈ D(A2 ) | u = 0 } ist für ϕ = 0
eindimensional, und Kern A3 ist zweidimensional.
A0 , A1 und A2 sind symmetrisch ( ÜA , zweimalige partielle Integration).
A3 ist nicht symmetrisch ( ÜA , betrachten Sie u(x) = 1, v(x) = x2 ).
Weitere wesentliche Unterschiede zwischen A1 und A2 werden in 3.6 (a) disku-
tiert.
(c) Wir betrachten im Folgenden mehrfach den Raum
H × H = { (u1 , u2 ) | u1 , u2 ∈ H }
mit der Vektorraumoperation
α(u1 , u2 ) + β(v1 , v2 ) = (αu1 + βv1 , αu2 + βv2 ).
Ausgestattet mit dem Skalarprodukt
(u1 , u2 ) , (v1 , v2 ) H ×H := u1 , v1 + u2 , v2
und der zugehörigen Norm
1/2
(u1 , u2 )H ×H = u1 2 + u2 2
ist H × H ein Hilbertraum ÜA .
Der Graph G(A) eines Operators A,
G(A) := {(u, Au) | u ∈ D(A)} ,
ist offenbar ein Teilraum von H × H .
Zwei Operatoren A, B sind genau dann gleich, wenn ihre Graphen als Mengen
gleich sind : G(A) = G(B).
1.4 Fortsetzung von Operatoren

(a) Ein Operator A2 = (D2 , L2 ) heißt eine Fortsetzung des Operators A1 =
(D1 , L1 ), wenn D1 ⊂ D2 und L2 u = L1 u für u ∈ D1 gilt. Für die Graphen
bedeutet dies G(A1 ) ⊂ G(A2 ). Wir schreiben hierfür kurz
A1 ⊂ A2 .
Für die in 1.3 (b) beschriebenen Operatoren gilt A0 ⊂ A1 , A2 ⊂ A3 . Dagegen

gilt weder A1 ⊂ A2 noch A2 ⊂ A1 ÜA .
(b) Ist ein Operator A = (D, L) beschränkt, so besitzt er eine eindeutig be-
stimmte Fortsetzung zu einem beschränkten Operator A ∈ L (H ), vgl. § 21 : 2.9.
Unbeschränkte Operatoren lassen sich dagegen auf verschiedene Weise fortset-
zen, vgl. 1.3 (b).
(c) Von besonderem Interesse sind symmetrische Fortsetzungen symmetrischer

Operatoren. Ohne Beweis sei mitgeteilt, dass jeder symmetrische Operator A
mindestens eine maximal symmetrische Fortsetzung B besitzt, d.h. es gibt
wenigstens einen symmetrischen Operator B, der seinerseits keine echte symme-
trische Fortsetzung besitzt, siehe Reed-Simon [130, II] X.3, Riesz–Nagy [131]
Nr. 123.
Ein unbeschränkter Operator lässt sich nicht zu einem auf dem ganzen Raum
H definierten symmetrischen Operator fortsetzen. Das besagt der
Satz von Hellinger und Toeplitz (1910). Ein symmetrischer Operator A mit
D(A) = H ist beschränkt.
Beweis.
Angenommen, A : H → H ist symmetrisch und unbeschränkt. Dann gibt es
Vektoren vn ∈ H mit vn = 1 und Avn → ∞. Wir betrachten die Folge
von linearen Funktionalen
Ln : u → Avn , u = vn , Au .
Wegen |Ln u| ≤ vn · Au = Au sind diese punktweise beschränkt, also
normbeschränkt (§ 21 : 4.3). Mit Ln = Avn → ∞ für n → ∞ ergibt sich
ein Widerspruch. 2
1.5 Unbeschränkte Multiplikatoren

(a) Multiplikatoren im 2 . Für jede komplexe Zahlenfolge a = (a1 , a2 , . . . )
ist durch

∞
D(Ma ) := x = (x1 , x2 , . . . ) ∈ 2 |ak |2 · |xk |2 < ∞ ,
k=1
Ma : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . )
ein linearer Operator Ma definiert, denn D(Ma ) enthält offensichtlich den in

2 dichten Teilraum 20 = Span {e1 , e2 , . . . } .
Dieser Operator ist nach § 21 : 2.6 genau dann überall definiert und damit be-
schränkt, wenn die Folge (an ) beschränkt ist.
2 Abgeschlossene Operatoren 647
(b) Multiplikatoren in L2 (Ω, μ). Sei (Ω, A, μ) ein σ–endlicher Maßraum

und v : Ω → eine beliebige A–messbare Funktion. Dann ist durch

D(Mv ) := u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)
und die Vorschrift u → v · u ein linearer Operator Mv auf L2 (Ω, μ) definiert.
Nach § 21 : 2.7 ist dieser genau dann unbeschränkt, wenn v ∈ L∞ (Ω, μ).
Dass D(Mv ) dicht in L2 (Ω, μ) liegt, ergibt sich wie folgt: Für n = 1, 2, . . . ist

Bn := |v| ≤ n = ω ∈ Ω |v(ω)| ≤ n ∈ A.
Für eine gegebene Funktion u ∈ L2 (Ω, μ) und un := u · χBn gilt
|un |2 ≤ |u|2 und | v · un |2 ≤ n2 |u|2 ,
also un , v · un ∈ L2 (Ω, μ) und somit un ∈ D(Mv ). Nach Konstruktion besitzt
die Funktionenfolge (|u − un |2 ) die Majorante |u|2 und konvergiert punktweise
gegen Null. Daher gilt u − un 2 → 0 nach dem Satz von der majorisierten
Konvergenz § 20 : 5.2. 2
2 Abgeschlossene Operatoren
2.1 Der Abschluss eines symmetrischen Operators
(a) Im folgenden stellen wir lineare Operatoren in der vereinfachten Form
A : D(A) → H , u → Au
dar, siehe 1.3 (a). Für einen symmetrischen Operator A mit Definitionsbereich
D(A) konstruieren wir eine Fortsetzung A durch Grenzübergang:
Wir legen den Definitionsbereich D(A) fest durch
(
Es gibt eine Folge (un ) in D(A) mit u = lim un ,
u ∈ D(A) : ⇐⇒ n→∞
für welche die Folge (Aun ) konvergiert.
Für u ∈ D(A) und eine Folge (un ) der genannten Art setzen wir
Au := lim Aun .
n→∞
Satz. Durch diese Vorschrift ist eine symmetrische Fortsetzung A von A defi-
niert. Der Graph von A ist der Abschluss des Graphen von A in H × H .
Wir nennen A den Abschluss von A. Durch Abschließung entstandene Ope-
ratoren haben ausgezeichnete Eigenschaften, die wir in 2.2 diskutieren. Weitere
Anmerkungen folgen in 2.3, Beispiele werden in Abschnitt 3 gegeben.
Beweis.
(i) Wohldefiniertheit von A. Seien (un ), (vn ) Folgen in D(A), so dass
u = lim un = lim vn , g = lim Aun , h = lim Avn
n→∞ n→∞ n→∞ n→∞
existieren.
Zu zeigen ist g = h. Nach dem Fundamentallemma § 9 : 3.2 genügt es nachzu-

weisen, dass g − h orthogonal zu dem in H dichten Teilraum D(A) ist.
Sei v ∈ D(A). Wegen der Symmetrie von A, der Stetigkeit des Skalarprodukts
und wegen lim (un − vn ) = 0 ergibt sich
n→∞
v , g − h = lim v , A(un − vn ) = lim Av , un − vn = 0.

n→∞ n→∞
(ii) Die Linearität und die Symmetrie von A folgen direkt aus der Definition
von A und der Stetigkeit des Skalarprodukts ÜA .
(iii) A ist eine Fortsetzung von A und daher dicht definiert, denn für u ∈ D(A)
hat die konstante Folge un = u die Eigenschaften lim un = u, lim Aun = Au.
n→∞ n→∞
Es folgt u ∈ D(A) und Au = Au.
(iv) G(A) ist der Abschluss von G(A) in H × H . Dies liegt daran, dass eine
Folge (un , vn ) in H × H genau dann gegen (u, v) konvergiert, wenn un → u
und vn → v in H . Daher gilt (u, v) ∈ G(A) genau dann, wenn es eine Folge
(un ) in D(A) gibt mit un → u, Aun → v für n → ∞. Dies heißt aber gerade
u ∈ D(A) und v = Au, d.h. (u, v) ∈ G(A). 2
(b) Ein Operator A heißt abschließbar, wenn folgendes gilt: Sind (un ), (vn )
Folgen in D(A) mit demselben Limes u und konvergieren die Folgen (Aun ),
(Avn ), so ist lim Aun = lim Avn . Wir können dann den Abschluss A wie
n→∞ n→∞
oben definieren:

Es gibt eine Folge (un ) in D(A)
u ∈ D(A) , Au = v : ⇐⇒
mit u = lim un , v = lim Aun .
n→∞ n→∞
Wie in (a) folgt: G(A) ist der Abschluss von G(A) in H × H .

Nicht jeder Operator ist abschließbar.
Das zeigt das folgende Beispiel: Sei H = L2 [0, 2] und 0 = h ∈ H . Für v ∈
D(A) := C[0, 2] sei Av := v(0) h. Für die Funktion u := χ[0,1] ∈ H \ D(A)
gibt es stetige Funktionen un , vn mit lim un = u = lim vn und un (0) = 1,
n→∞ n→∞
vn (0) = 0 ( ÜA , Skizze). Für diese gilt Aun = h, Avn = 0 = h.
Der Beweis der folgenden Aussagen sei den Lesern zur Einübung der Begriffe
nahegelegt.
(c) Für abschließbare Operatoren gilt
A ⊂ B =⇒ A ⊂ B .
(d) Sei A abschließbar und T ein beschränkter Operator. Wir definieren A + T
durch
(A + T ) u := A u + T u für u ∈ D(A + T ) := D(A) .
2 Abgeschlossene Operatoren 649
Dann ist A + T abschließbar, und es gilt
A+T = A+T , D(A + T ) = D(A) .

Insbesondere ist für jeden symmetrischen Operator A und für λ ∈ der auf
D(A) definierte Operator A − λ : u → Au − λu abschließbar mit
A − λ = A − λ.
2.2 Abgeschlossene Operatoren und Graphennorm

(a) Ein Operator A heißt abgeschlossen, wenn der Graph von A in H × H
abgeschlossen ist, d.h. wenn folgendes gilt:
Existieren für eine Folge (un ) in D(A) die Limites u = lim un , v = lim Aun ,
n→∞ n→∞
so folgt u ∈ D(A) und Au = v.
(b) Beispiele. (i) Für einen abschließbaren Operator A ist A abgeschlossen,

da G(A) = G(A) abgeschlossen in H × H ist.
(ii) Jeder Operator T ∈ L (H ) ist abgeschlossen.
(iii) Die in 1.5 (b) definierten Multiplikatoren Mv sind abgeschlossen.
Denn sei (un ) eine Folge in D(Mv ), für welche die Grenzwerte
u = lim un , w = lim Mv un = lim v un

n→∞ n→∞ n→∞
existieren. Nach § 20 : 7.2 gibt es eine Teilfolge (unk )k mit
u(ω) = lim unk (ω) μ–f.ü. , w(ω) = lim v(ω) unk (ω) μ–f.ü.
k→∞ k→∞
Es folgt v(ω) u(ω) = lim v(ω) unk (ω) = w(ω) μ–f.ü., d.h. u ∈ L2 (Ω, μ), v u =
k→∞
w ∈ L2 (Ω, μ) und damit u ∈ D(Mv ), w = Mv u.
(iv) ÜA Zeigen Sie: Die in 1.5 (a) definierten Multiplikatoren auf 2 sind ab-
geschlossen.
(c) Für einen Operator A : D(A) → H ist durch
u, v A := u , v + Au , Av
offensichtlich ein Skalarprodukt auf D(A) gegeben. Die zugehörige Norm · A

heißt die Graphennorm von A.
Satz. Bezüglich dieser Norm ist A ein stetiger Operator, genauer:
T : (D(A), · A ) → (H , · ) , u → Au
ist stetig mit T ≤ 1 und T = 1, falls A unbeschränkt ist ÜA .

(d) Satz. Ein Operator A ist genau dann abgeschlossen, wenn D(A) bezüglich
des zur Graphennorm gehörigen Skalarprodukts ein Hilbertraum ist.
Ein abgeschlossener Operator vermittelt also eine beschränkte lineare Abbildung
zwischen den Hilberträumen (D(A), · A ) und (H , · ).
Beweis.
Wir bezeichnen das Skalarprodukt in H × H mit · , · H ×H und die zu-
gehörige Norm mit · H ×H . Offenbar ist die Abbildung
U : (D(A), · A ) → (G(A), · H ×H ) , u → (u, Au)
bijektiv und wegen der Linearität von A linear. Nach Definition der Graphen-
norm ist sie ferner isometrisch, also insgesamt unitär. Somit ist (D(A), · A )
genau dann vollständig, wenn (G(A), · H ×H ) vollständig, d.h. abgeschlossen
in H × H ist, vgl. § 9 : 2.1. 2
(e) Folgerung. Ist ein abgeschlossener Operator
A : D(A) → H
bijektiv, so ist A−1 : H → D(A) beschränkt, d.h. A−1 ∈ L (H ).

Diese Folgerung bildet die Grundlage für die Übertragung der Sätze über Spek-
trum und Resolvente auf abgeschlossene unbeschränkte Operatoren, Näheres in
Abschnitt 5.
Beweis.
Nach dem Satz § 21 : 3.1 (a) über stetige Inverse gibt es eine Konstante C ≥ 0
mit
−1
A u ≤ C u
A
für alle u ∈ H . (Beachten Sie, dass Bild A−1 = D(A).) Es folgt

−1 2
A u ≤ A−1 u2 + u2 = A−1 u2 ≤ C 2 u2
A
für alle u ∈ H . 2
2.3 Gene abgeschlossener Operatoren

(a) Sei A ein abgeschlossener Operator. Jeder Operator B mit B = A heißt
ein Gen für A; sein Definitionsbereich D(B) heißt Genbereich (engl. core =
Kern, Kernstück) für A.
Zwei Operatoren B, C heißen wesentlich gleich, wenn sie abschließbar sind
und wenn B = C gilt.
3 Der Abschluss gewöhnlicher Differentialoperatoren 651
Folgende Aussagen über einen Operator B sind äquivalent:

(i) B ist ein Gen für den abgeschlossenen Operator A,
(ii) G(A) ist der Abschluss von G(B) in H × H ,
(iii) B ⊂ A und D(B) liegt dicht in D(A) bezüglich der Graphennorm · A .
Dies ergibt sich aus dem Vorangehenden.
(b) Bemerkungen. Die Namensgebung ist in der Literatur nicht einheitlich.

Die von uns getroffene Wortwahl soll ausdrücken, dass ein Gen eines abgeschlos-
senen Operators bereits alle wesentlichen Informationen über diesen enthält.
Im folgenden werden Kriterien entwickelt, die es gestatten, anhand geeigneter
Gene auf Eigenschaften des Abschlusses zu schließen.
Im Allgemeinen ist die explizite Bestimmung des Abschlusses eines konkret ge-
gebenen Operators schwierig, wenn überhaupt möglich; denken Sie etwa an den
Ê
Laplace–Operator −Δ auf einem Gebiet Ω des n mit dem natürlichen Defi-
nitionsbereich {u ∈ C2 (Ω) ∩ C(Ω) | u = 0 auf ∂Ω}. Für die Anwendung von
Hilbertraummethoden auf Differentialgleichungen und für die mathematischen
Grundlagen der Quantenmechanik genügt zunächst allein die Existenz des Ab-
schlusses, um die Lösbarkeit bestimmter Gleichungen zu garantieren. Erst wenn
spezielle Eigenschaften dieser Lösungen gefragt sind, z.B. Differenzierbarkeits-
eigenschaften im klassischen Sinn, muss der Definitionsbereich des Abschlusses
genauer untersucht werden. Hierfür gibt es eine ganze Industrie (Theorie der
Sobolew–Räume, Regularitätstheorie, siehe § 14, Abschnitt 6).
Für eine Reihe gewöhnlicher Differentialoperatoren lässt sich der Abschluss ex-
plizit bestimmen. Wir führen dies im nächsten Abschnitt aus, um Beispielma-
terial auch für die nachfolgenden Begriffe zur Verfügung zu haben. Wie schon
oben bemerkt wurde, ist die Bestimmung solcher Abschlüsse für den Fortgang
der Theorie nicht unbedingt erforderlich.
3 Der Abschluss gewöhnlicher Differentialoperatoren

3.1 Der Raum W1 [a, b]
Satz. Für jedes kompakte Intervall [a, b] ist der Raum

W1 [a, b] := u ∈ L2 [a, b] u ist absolutstetig, u ∈ L2 [a, b] ,
versehen mit dem Skalarprodukt
b b
u, v 1 = u , v + u , v = u v dλ + u v dλ ,
a a
ein Hilbertraum.
Die Konvergenz u − un 1 → 0 impliziert die gleichmäßige Konvergenz un → u
auf [a, b].
Der Raum C∞ [a, b] liegt bezüglich der Norm · 1 dicht in W1 [a, b].
Folgerung. Die Räume C∞ [a, b] und C1 [a, b] sind Genbereiche für den abge-
schlossenen Operator
A : u → −iu mit D(A) = W1 [a, b] .
Beweis.
(a) Sei (un ) eine Cauchy–Folge in W1 [a, b]. Wegen
um − un 21 = um − un 2 + um − un 2
sind (un ), (un ) Cauchy–Folgen in L2 [a, b] , also gibt es Funktionen u, v ∈
L2 [a, b] mit
un → u , un → v im Quadratmittel.
Nach dem Hauptsatz § 8 : 3.2 gilt

x
(∗) un (x) − un (a) = un dλ .
a
Für
x x
fn (x ) := un (x) − un (a) = un dλ , f (x) := v dλ
a a
gilt
x b
| f (x) − fn (x) | = (v − un ) dλ ≤ 1 · | v − un | dλ
a a
√
≤ b − a · v − un
nach der Cauchy–Schwarzschen Ungleichung, also gilt fn → f gleichmäßig auf
[a, b]. Es folgt fn → f im Quadratmittel, also
un (a) · χ[a,b] = un − fn → u − f im Quadratmittel.
Dies ist nur möglich, wenn α := lim un (a) existiert.

n→∞
Damit haben wir die gleichmäßige Konvergenz un (x) → α + f (x) auf [a, b], also
mit (∗)
x
u(x) − α = lim fn (x) = v dλ .
n→∞
a
Nach dem Hauptsatz folgt die Absolutstetigkeit von u, α = u(a) und u = v.

Damit gilt u ∈ W1 [a, b] und un (x) → u(a) + f (x) = u(x) gleichmäßig auf [a, b].
Da daraus u − un → 0 folgt und wegen un − v = un − u → 0 ergibt
sich
u − un 1 → 0 für n → ∞ .
(b) Für u ∈ W1 [a, b] gilt u ∈ L2 [a, b], also gibt es nach § 20 : 8.5 (a) Funktionen
ψn ∈ C∞
c (]a, b[) mit u − ψn → 0. Wir setzen
x
ϕn (x) := u(a) + ψn dλ .
a
x
Dann gilt ϕn ∈ C∞ [a, b] sowie ϕn (x) → u(a) + u dλ = u(x) gleichmäßig auf
a
[a, b] und somit u − ϕn 1 → 0 nach denselben Schlüssen wie oben.
(c) Die Norm · 1 ist die Graphennorm von A : u → −iu auf W1 [a, b],
daher ist A abgeschlossen nach 2.2 (d). Da C∞ [a, b] und damit auch C1 [a, b]
bezüglich dieser Norm dicht in D(A) liegen, folgen die übrigen Behauptungen
aus 2.3 (a). 2
3.2 Symmetrische Differentialoperatoren 1. Ordnung auf [a, b]

Der durch D(A) = W1 [a, b], Au = −iu definierte Operator ist also abgeschlos-
sen, aber nicht symmetrisch. Denn für u, v ∈ D(A) ergibt sich durch partielle
Integration gemäß § 8 : 3.3

(∗) u , Av − Au , v = i u(b) v(b) − u(a) v(a) ,
und für u(x) = x − a, v(x) = 1 ist die rechte Seite von Null verschieden.
Um einen symmetrischen Operator B mit der Vorschrift u → −iu zu erhalten,
muss der Definitionsbereich von A eingeschränkt werden, z.B. durch Randbe-
dingungen. Als notwendige Bedingung für die Symmetrie von B ergibt sich aus
(∗) u(b) v(b) = u(a) v(a) für u, v ∈ D(B), insbesondere |u(a)| = |u(b)| für
u ∈ D(B). Existiert daher ein u ∈ D(A) mit u(b) = 0, so gibt es ein ϕ ∈ mit Ê
u(a) = eiϕ u(b) und damit auch v(a) = eiϕ v(b) für alle v ∈ D(B). Andernfalls
gilt u(a) = u(b) = 0 für alle u ∈ D(B).
Soll also der Operator A allein durch Randbedingungen zu einem symmetrischen
Operator eingeschränkt werden, so müssen diese entweder von der Form u(a) =
u(b) = 0 oder von der periodischen Form u(a) = eiϕ u(b) sein.
Satz. (a) Der Operator A0 : u → −iu auf

D(A0 ) = W01 [a, b] := u ∈ W1 [a, b] u(a) = u(b) = 0
ist symmetrisch und abgeschlossen. Ein Genbereich für A0 ist C∞

c (]a, b[).
(b) Der Operator A0 besitzt unendlich viele symmetrische abgeschlossene Fort-

setzungen: Für jede Zahl ϕ ∈ ]−π, π] ist der Operator Pper : u → −iu mit

D(Pper ) = Dϕ := u ∈ W1 [a, b] u(a) = eiϕ u(b)
symmetrisch und abgeschlossen mit Genbereich {u ∈ C∞ [a, b] | u(a) = eiϕ u(b)}.

Bemerkungen. Dies sind die einzigen abgeschlossenen symmetrischen, in A

enthaltenen Fortsetzungen von A0 , denn eine Fortsetzung kann nur durch Ab-
schwächung der an D(A0 ) gestellten Bedingungen, also der Randbedingungen
geschehen. Hierfür kommen nach den oben angestellten Überlegungen nur noch
die periodischen in Frage. In § 24 zeigen wir, dass jeder der Operatoren Pper
maximal symmetrisch ist. Eine ausführliche Diskussion der Fortsetzungen von
A0 finden Sie in Reed–Simon [130, II] X.1, example 1.
Beweis.
(i) Symmetrie und Abgeschlossenheit. Die Symmetrie der Operatoren A0 , Pper
folgt unmittelbar aus (∗). Ist (un ) eine Folge in D(A0 ) (bzw. D(Pper )), für welche
u = lim un , v = lim un im L2 –Sinn existieren, so folgt nach 3.1 erstens
n→∞ n→∞
u ∈ W1 [a, b], u = v und zweitens u(a) = u(b) = 0 (bzw. u(a) = eiϕ u(b)), da
die un gleichmäßig gegen u konvergieren.
(ii) Wegen C∞ ∞
c (]a, b[) ⊂ D(A0 ) ist der Abschluss von Cc (]a, b[) bezüglich der
Graphennorm von A0 in der diesbezüglich abgeschlossenen Menge D(A0 ) ent-
halten. Wir konstruieren zu gegebener Funktion u ∈ D(A0 ) Testfunktionen ϕn
mit u − ϕn 2 + u − ϕn = u − ϕn A0 → 0 für n → ∞.
2
Da C∞ ∞
c (]a, b[) in L [a, b] dicht ist, gibt es Funktionen ψn ∈ Cc (]a, b[) mit
2
b
u − ψn 2 = |u − ψn |2 dλ → 0 .
a
Mit der Cauchy–Schwarzschen Ungleichung ergibt sich die gleichmäßige Kon-

vergenz
x x √
u(x) − ψn dλ = (u − ψn ) dλ ≤ b − a u − ψn → 0
a a
b
für n → ∞ ; für cn := ψn dλ folgt insbesondere lim cn = u(b) = 0.
n→∞
a
Durch
x
Ψn (x) = ψn dλ
a
sind C∞ –Funktionen gegeben, die in einer rechtsseitigen Umgebung von a ver-

schwinden und in einer linksseitigen Umgebung von b konstant gleich cn sind.
Sind alle Ψn Testfunktionen, so setzen wir ϕn := Ψn und erhalten u − ϕn →
0. Andernfalls wählen wir ein Ψm mit Ψm (b) = 0, setzen η := Ψm /Ψm (b) und
definieren
ϕn := Ψn − cn η ∈ C∞
c (]a, b[) .
Mit den Ψn konvergieren auch die ϕn gleichmäßig und damit im L2 –Sinn gegen
u, und es gilt u − ϕn ≤ u − ψn + |cn | · η → 0 für n → ∞.
sich aus der Tatsache, dass Pper als Genbereich
Der Rest des Beweises ergibt
die Klasse { u ∈ C∞ [a, b] u(a) = eiϕ u(b) } besitzt (Nachweis als nachfolgende
Aufgabe). 2
(c) Aufgabe. Zeigen Sie auf ähnliche Weise wie oben, dass

u ∈ C∞ [a, b] u(a) = eiϕ u(b) ein Genbereich für Pper ist.
3.3 Die Sobolew–Räume W1 ( Ê +) und W1 ( Ê)

Satz. Für jedes der Intervalle I =

Ê + bzw. I = Ê ist

1
W (I) := u ∈ L (I) u ist absolutstetig, u ∈ L2 (I)
2
ein Hilbertraum mit dem Skalarprodukt

u, v 1 = u , v + u , v = u v dλ + u v dλ .
I I
Für u ∈ W1 (I) gilt lim u(x) = 0 und
|x|→∞
u∞ ≤ u1 ,
also impliziert die Konvergenz u − un 1 → 0 die gleichmäßige Konvergenz

un → u auf I.
Der Raum C∞ Ê
c ( ) liegt bezüglich der Norm · 1 dicht in W ( ).
1
Ê
Beweis.
(a) Sei (un ) eine Cauchy–Folge in (W1 (I), · 1 ). Dann sind (un ), (un ) Cau-
chy–Folgen in (L2 (I), · ), also gibt es Funktionen u, v ∈ L2 (I) mit
u − un → 0 , v − un → 0 für n → ∞ .
Für jedes kompakte Intervall J ⊂ I ist (un ) auch eine Cauchy–Folge in W1 (J).
Aus 3.1 erhalten wir daher die Absolutstetigkeit von u und u = v auf jedem
kompakten Intervall, somit u = v ∈ L2 (I) und
u − un → 0 , u − un → 0 .
(b) Es bleibt zu zeigen, dass u absolutstetig auf ganz I ist und im Unendli-
chen verschwindet. Wir betrachten hierzu der Einfachheit halber I = + . Nach Ê
§ 8 : 3.1 und dem Hauptsatz § 8 : 3.2 gilt
x x
|u(x)|2 = |u(0)|2 + ( u · u) dλ = |u(0)|2 + ( u · u + u · u ) dλ
0 0
für alle x ≥ 0. Somit existiert

lim |u(x)|2 = |u(0)|2 + u , u + u , u .
x→∞
Ê
Wegen u ∈ L2 ( +) muss dieser Limes Null sein. Zum Nachweis der Absolut-
Ê
stetigkeit von u auf + gemäß der Definition § 8 : 3.1 wählen wir zu gegebenem
ε > 0 ein R > 0 mit |u(x)| < ε für x > R und nützen die Absolutstetigkeit von
u auf [0, R] aus ÜA .
Für I = Ê argumentieren wir entsprechend.
(c) Wie in (b) erhalten wir für u ∈ W1 (I)
x
|u(x)|2 = |u(y)|2 + ( u · u + u · u ) dλ .
y
Für y → ∞ ergibt sich nach (b) und der Cauchy–Schwarzschen Ungleichung

∞
|u(x)|2 = ( u · u + u · u ) dλ ≤ 2 · u · u ≤ u2 + u 2
x
für alle x ∈ I, somit u∞ ≤ u1 .

Ê
(d) Sei u ∈ W1 ( ) und ε > 0 vorgegeben. Wir wählen ein R > 0 mit

|u(x)| ≤ ε für |x| ≥ R und |u|2 + |u |2 dλ < ε2 .
|x|≥R
Für
⎧
⎪ u(x) für −R ≤ x ≤ R,
⎪
⎨ u(R) (R + 1 − x) für R < x < R + 1,
v(x) :=
⎪
⎪ u(−R) (x + R + 1) für −R − 1 < x < −R,
⎩
0 sonst
√
Ê
gilt dann ÜA v ∈ W1 ( ) und u − v1 < 3 · 2 · ε. (Beachten Sie, dass
|u(x) − v(x)| ≤ 2ε und |u (x) − v (x)| ≤ |u (x)| + ε für R < |x| < R + 1.) Nach
3.2 (b) gibt es eine auf ]−R −1, R +1[ lebende Testfunktion ϕ mit v − ϕ1 < ε.
Für diese gilt dann u − ϕ1 < 6ε. 2
3.4 Der Impulsoperator auf W1 ( Ê)

Ê
(a) Der auf W1 ( ) definierte Operator P : u → −iu ist abgeschlossen und
symmetrisch. Genbereiche für P sind C∞ Ê
c ( ) und S (vgl. 1.1).
P heißt der (maximal definierte) Impulsoperator auf . Dieser dient zur Ê

Beschreibung des Impulses eines längs einer Geraden frei beweglichen Teilchens.
Ê Ê
(b) Der durch D(A) := W01 ( +) = {u ∈ W1 ( +) | u(0) = 0} und Au = − iu
für u ∈ D(A) gegebene Differentialoperator A ist ebenfalls abgeschlossen und
symmetrisch; ein Genbereich ist C∞
c ( >0 ). Ê
Wie wir später sehen werden, entspricht diesem keine quantenmechanische Ob-
servable.
Beweis.
(a) Die Graphennorm von P ist gegeben durch u2P = u2 + u 2 . Nach 3.3
liegt C∞ Ê 1
c ( ) bezüglich dieser Norm dicht in W ( ). Ê
Wegen C∞ Ê Ê
) ⊂ S ⊂ W ( ) ist daher auch S ein Genbereich für P . Da der
c (
1
auf S definierte Impulsoperator nach 1.1 symmetrisch ist, gilt dies nach 2.1
auch für den Abschluss.
(b) Die Symmetrie von A ergibt sich durch partielle Integration wegen der
Randbedingungen u(a) = 0 und lim u(x) = 0 für u ∈ D(A) ÜA .
x→∞
Ist (un ) eine Cauchy–Folge in (D(A), · A ), so gibt es nach 3.3 ein u ∈ W1 ( +) Ê

Ê
mit lim u − un 1 = 0. Da (un ) auf + gleichmäßig konvergiert, folgt u(0) =
Ê
n→∞
lim un (0) = 0, also u ∈ D(A). Dass C∞
c ( >0 ) ein Genbereich ist, ergibt sich
n→∞
wie im Beweis 3.3 (c) ÜA . 2
3.5 Der Hamilton–Operator eines in ]a, b[ eingesperrten Teilchens

(a) Der Laplace–Operator
− Δ : u → − u
mit Definitionsbereich
D(−Δ) = { u ∈ W01 [a, b] | u ∈ W1 [a, b] }

= { u ∈ C1 [a, b] | u ∈ W1 [a, b] , u(a) = u(b) = 0 }
ist abgeschlossen und symmetrisch.
(b) Ein Genbereich für − Δ ist C20 [a, b] = { u ∈ C2 [a, b] | u(a) = u(b) = 0 }.
Der Operator H := − 21 Δ wird als Hamilton–Operator eines in ]a, b[ einge-
sperrten Teilchens mit einem Freiheitsgrad aufgefasst (h̄ = m = 1).
Beweis.
(a) Wir lassen den Vorfaktor 12 außer Acht und bezeichnen den Operator − Δ
mit H. Partielle Integration und die Cauchy–Schwarzsche Ungleichung ergeben
b b
|u |2 dλ = [ u u ]a − u u dλ = − u , u ≤ u · u ,
b
a a
also
1

(∗) u 2 ≤ u · u ≤ 2 u2 + u 2 .
Ist daher (un ) eine Cauchy–Folge in (D(H), · H ), so ist (un ) eine Cauchy–
Folge in (W01 [a, b] , · 1 ) und (un ) eine Cauchy–Folge in (W1 [a, b] , · 1 ).
Nach 3.1 und 3.2 (a) gibt es daher Funktionen u ∈ W01 [a, b], v ∈ W1 [a, b] mit
u − un 1 → 0, v − un 1 → 0 für n → ∞. Da dann insbesondere (u − un ),
(v − un ), (v − un ) Nullfolgen sind, folgt v = u und u − un H → 0 für
n → ∞.
Die Symmetrie von H erhalten wir durch zweimalige partielle Integration ÜA .
(b) Wir dürfen uns auf das Intervall [0, 1] beziehen, der allgemeine Fall kann
per Substitution auf diesen speziellen zurückgeführt werden ÜA . Für den in
§ 22 : 5.1 eingeführten Integraloperator T gilt
T : L2 [0, 1] → D(H) , T H = ½D(H) , HT = ½ .
Für u ∈ D(H) gibt es Testfunktionen ψn mit Hu − ψn → 0 für n → ∞.

Nach § 22 : 5.1 gilt ϕn := −T ψn ∈ C20 [a, b] und ϕn = ψn . Da T stetig ist, folgt
ϕn = −T ψn → −T u = u für n → ∞ ,
insgesamt
u − ϕn 2H = u − ϕn 2 + u − ϕn 2 → 0 für n → ∞ . 2
3.6 Weitere Energieoperatoren für einen Freiheitsgrad

(a) Für eine feste Zahl ϕ ∈ Ê
betrachten wir den in 3.2 (c) eingeführten Ope-
rator Pper auf dem Definitionsbereich Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)}
und setzen
2
Hper := Pper : u → − u auf
D(Hper ) := { u ∈ Dϕ | u ∈ Dϕ } .
Der Operator Hper ist symmetrisch und abgeschlossen. Ein Genbereich für Hper
ist

u ∈ C2 [a, b] u(a) = eiϕ u(b), u (a) = eiϕ u (b) .
Für ϕ = 0 beschreibt 12 Hper die kinetische Energie einer periodischen Bewe-

gung (h̄ = m = 1). Der Phasenfaktor eiϕ wird eingeführt, um die kinetische
Energie der Bewegung eines Teilchens in einer Raumrichtung eines Kristallgit-
ters zu beschreiben. Der zugehörige Impulsoperator ist jeweils Pper .
Bemerkung. Für den Hamilton–Operator H von 3.5 gibt es keinen symmetri-

schen Operator P der Form u → − i u auf einem passenden Definitionsbereich,
so dass H = P 2 gilt ( ÜA mit Hilfe von 3.2). Dies führt auf die Frage, wie
der Impulsoperator eines (etwa in einer Ionenfalle) eingesperrten Teilchens zu
definieren ist und weist auf die Grenzen der Modellannahme unendlich hoher
Potentialwälle in a und b hin.
4 Der adjungierte Operator 659
Beweis als ÜA :

Verfahren Sie analog zum Beweis 3.5 (a), verwenden Sie das Ergebnis von 3.2 (b).
(b) Für den in 3.4 behandelten Impulsoperator P definieren wir
− Δ = P 2 : u → − u mit
Ê Ê
D(−Δ) = W2 ( ) := {u ∈ W1 ( ) | P u = − i u ∈ W1 ( )} . Ê
Dieser Operator ist abgeschlossen und symmetrisch; Genbereiche sind der Raum
C∞ Ê
c ( ) und der Schwartzraum S . Dies ergibt sich wie oben ÜA .
Der Operator W0 = 12 P 2 wird als Hamilton–Operator eines in einer Raum-

richtung ohne Einfluß eines Potentials bewegten, spinlosen Teilchens aufgefasst
( h̄ = m = 1).
4 Der adjungierte Operator

4.1 Definition und Anmerkungen
(a) Definition. Für einen linearen Operator A : D(A) → H definieren wir
die Adjungierte A∗ durch
(
Es gibt ein w ∈ H mit v , Au = w , u
v ∈ D(A∗ ) : ⇐⇒
für alle u ∈ D(A).
Wir setzen dann
A∗ v := w .
Die Adjungierte ist also gekennzeichnet durch
v , Au = A∗ v , u für u ∈ D(A) , v ∈ D(A∗ ) .
Dass w = A∗ v durch v eindeutig bestimmt ist, folgt aus dem Fundamentallemma

§ 9 : 3.2. Es ist leicht einzusehen ÜA , dass D(A∗ ) ein Teilraum von H ist und
A∗ : D(A∗ ) → H linear, vgl. § 21 : 3.2.
(b) Genau dann gilt v ∈ D(A∗ ), wenn die Linearform
D(A) → , u → v , Au
auf D(A) beschränkt ist und somit zu einem linearen Funktional u → w , u

auf H fortgesetzt werden kann.
(c) Satz. Genau dann ist A∗ ein linearer Operator, d.h. dicht definiert, wenn
A abschließbar ist, vgl. 2.1 (b).
A∗ heißt dann der zu A adjungierte Operator.
Dass aus D(A∗ ) = H die Abschließbarkeit von A folgt, ergibt sich wie im
Beweisteil (i) von 2.1 mit der Abänderung v , A(un − vn ) = A∗ v , un − vn
an Stelle von v , A(un − vn ) = Av , un − vn ÜA .
Die Umkehrung: A abschließbar =⇒ A∗ dicht definiert ergibt sich in 4.4 (c).
Als Beispiel eines linearen Operators, für den A∗ nicht dicht definiert ist,
wählen wir
A : C[0, 2] → L2 [0, 2] , u → u(0)h mit 0 = h ∈ L2 [0, 2] ,
vgl. 2.1 (b). Hier gilt v , Au = u(0) v , h . Nach (b) gehört v genau dann zu
D(A∗ ), wenn u → u(0) v , h beschränkt ist. Für un (x) = n + 12 · (1 − x)n
gilt un = 1 und un (0) → ∞ für n → ∞, also v ∈ D(A∗ ) nur, falls v ⊥ h.
Es folgt D(A∗ ) ⊂ {h}⊥ .
(d) Ein linearer Operator A ist genau dann symmetrisch, wenn A ⊂ A∗ .

Denn die Symmetriebedingung
v , Au = Av , u für v ∈ D(A) und alle u ∈ D(A)
ist äquivalent zu D(A) ⊂ D(A∗ ) und A∗ v = Av für v ∈ D(A).
(e) Beispiele. (i) Für Multiplikatoren Mv auf L2 (Ω, μ) gilt Mv∗ = Mv ÜA .
2
(ii) Für Multiplikatoren Ma auf gilt entsprechend Ma∗ = Ma ÜA .
4.2 Elementare Eigenschaften der Adjungierten

(a) B ⊂ A =⇒ A∗ ⊂ B ∗ .
(b) A∗ ist abgeschlossen.
(c) Ist A abschließbar, so gilt A∗ = A∗ ,
dabei steht A∗ für (A)∗ .
Zur Bestimmung von A∗ ist also die Kenntnis von A unnötig.
(d) (A + T )∗ = A∗ + T ∗ für T ∈ L (H ), insbesondere (A − λ)∗ = A∗ − λ.
Dabei ist A + T für T ∈ L (H ) hier wie im Folgenden definiert durch
A + T : D(A) → H , u → Au + T u .
Beweis.
(a) folgt direkt aus der Definition ÜA .
(b) Existieren für eine Folge (vn ) in D(A∗ ) die Grenzwerte v = lim vn und
n→∞
w = lim A∗ vn , so folgt für alle u ∈ D(A)
n→∞
v , Au = lim vn , Au = lim A∗ vn , v = w, u .
n→∞ n→∞
Das bedeutet v ∈ D(A∗ ) und A∗ v = w.

(c) Wegen A ⊂ A folgt A∗ ⊂ A∗ nach (a). Zu zeigen bleibt A∗ ⊂ A∗ . Seien
v ∈ D(A∗ ), u ∈ D(A). Dann gibt es eine Folge (un ) in D(A) mit u = lim un ,
n→∞
Au = lim Aun . Daher erhalten wir
n→∞
v , Au = lim v , Aun = lim A∗ v , un = A∗ v , u .

n→∞ n→∞
Das bedeutet v ∈ D(A∗ ) und A∗ v = A∗ v.

(d) als einfache ÜA . 2
4.3 Selbstadjungiertheit und Symmetrie

(a) Ein linearer Operator A heißt selbstadjungiert, wenn A∗ = A gilt. Als
Observable abgeschlossener quantenmechanischer Systeme kommen nur selbst-
adjungierte Operatoren in Frage; Näheres hierzu in § 25 : 4.1.
Nach 4.1 (b) sind reelle Multiplikatoren selbstadjungiert.
In der Physikliteratur wird statt selbstadjungiert häufig der Begriff hermitesch
verwendet, wobei unklar bleibt, ob hiermit nicht symmetrisch gemeint ist.
Hierzu notieren wir zunächst:
Selbstadjungierte Operatoren sind symmetrisch und abgeschlossen.
Das Erste folgt aus 4.1 (d), das Zweite aus 4.2 (b).
Die Umkehrung gilt nicht, wie das folgende Beispiel zeigt.
(b) Beispiel. Nach 3.2 (a) ist der (hier anders bezeichnete) Operator
A : W01 [a, b] → L2 [a, b] , u → −iu
symmetrisch und abgeschlossen. Wir zeigen im Folgenden, dass A∗ der Operator
B : W1 [a, b] → L2 [a, b] , u → −iu
mit B = B, Kern B = Kern A ist. Somit ist A nicht selbstadjungiert.
Für v ∈ D(B) und u ∈ D(A) erhalten wir mittels partieller Integration
b b b
v , Au = −i v u dλ = i v u dλ = (− i v ) u dλ = Bv , u ,
a a a
also v ∈ D(A∗ ) und A∗ v = Bv. Somit gilt B ⊂ A∗ .

Sei umgekehrt v ∈ D(A∗ ) und h := A∗ v. Wir setzen
x
w(x) := h(t) dt .
a
Wegen h ∈ L2 [a, b] ⊂ L1 [a, b] ist w absolutstetig und w = h ∈ L2 [a, b], somit

w ∈ D(B). Für u ∈ D(A) ergibt partielle Integration
h, u = w , u = − w , u = iw , − i u = i w , Au .
∗
Es folgt v , Au = A v , u = h , u = iw , Au , d.h. v−iw ist orthogonal
zu Bild A. Aufgrund des nachfolgenden Lemmas muss v − iw dann gleich einer
Konstanten c sein, also v = c + iw ∈ D(B) und
A∗ v = h = w = i(c − v) = −iv = Bv .
Somit ist auch A∗ ⊂ B.
Hilbertsches Lemma. Eine Funktion f ∈ L2 [a, b] ist genau dann orthogonal
zu Bild A = {u | u ∈ W1 [a, b]}, wenn sie konstant ist.
Beweis.
(i) Ist f = c konstant, so gilt
f , u = c (u(b) − u(a)) = 0 für alle u ∈ D(A) .
x
(ii) Sei umgekehrt f ⊥ Bild A, d := 1 , f und u(x) := f dλ − d x−a
b−a
.
a
Dann gilt u ∈ D(A) und u (x) = f (x) − c mit c := d/(b − a). Nach (i) ist
f − c = u orthogonal zur konstanten Funktion c, und nach Voraussetzung gilt
f , f − c = f , u = 0. Es folgt
f − c2 = f − c , f − c = f , f − c − c , f − c = 0 . 2
4.4 Der Graph des adjungierten Operators

(a) In diesem Unterabschnitt betrachten wir Teilräume V des Hilbertraums
H × H mit dem Skalarprodukt (u1 , u2 ), (v1 , v2 ) H ×H = u1 , v1 + u2 , v2 .
Unter V ist der Abschluss von V in der Norm · H ×H und unter V ⊥ ist das
orthogonale Komplement von V in H × H zu verstehen. Die Abbildung
U : H ×H →H ×H ,
H
(u1 , u2 ) → (u2 , −u1 ) (u1 , u2 )
ist unitär ÜA . Daher gilt
U (V ) = U (V)⊥
⊥
und
U (V) = U (V) = U (V)⊥⊥
H
= U (V ⊥ )⊥
für jeden Teilraum V von H × H , vgl. (u2 , −u1 )
§ 9 : 2.5.
(b) Satz. Zwischen dem Graphen G(A) eines linearen Operators A und dem
Graphen G(A∗ ) seiner Adjungierten besteht die Beziehung
G(A∗ ) = U (G(A))⊥ = U (G(A)⊥ ) .
Denn es gilt
(v, w) ∈ G(A∗ ) ⇐⇒ v , Au = w , u für alle u ∈ D(A)
⇐⇒ 0 = v , Au + w , −u = (v, w) , (Au, −u) H ×H
= (v, w) , U (u, Au) H ×H für alle u ∈ D(A)
⇐⇒ (v, w) ⊥ U (G(A)) . 2
(c) Folgerung. Für abschließbare Operatoren A ist A∗ ein linearer Operator

(d.h. dicht definiert), und es gilt
A∗∗ := (A∗ )∗ = A .
Beweis.
(i) Nach (a) und 2.1 (b) gilt
(∗) G(A∗ )⊥ = (U (G(A)⊥ ))⊥ = U (G(A)⊥⊥ ) = U (G(A)) = U (G(A)) .

Angenommen, D(A∗ ) ist nicht dicht in H . Dann gibt es ein w ∈ H mit w = 0
und w , v = 0 für alle v ∈ D(A∗ ). Es folgt
(w, 0) , (v, A∗ v) H ×H = w, v = 0
für alle v ∈ D(A∗ ) und somit nach (∗) (w, 0) ∈ G(A∗ )⊥ = U (G(A)). Daher gilt
(0, w) = U −1 (w, 0) ∈ G(A) im Widerspruch zu A0 = 0.
(ii) Offenbar ist U 2 = −½H ×H , also U 2 (V ) = V für Teilräume V von H × H .

Somit ergibt sich aus (b) und aus (∗)
G(A∗∗ ) = U (G(A∗ )⊥ ) = U (U (G(A))) = G(A) . 2
4.5 Kerne und Bildräume von A und A∗

Für lineare Operatoren A : D(A) → H seien wie immer
Kern A := { u ∈ D(A) | Au = 0 } und Bild A := { Au | u ∈ D(A) } ,
entsprechend Kern A∗ und Bild A∗ .
Satz. (a) Kern A∗ = (Bild A)⊥ .
(b) (Kern A∗ )⊥ = Bild A.
(c) Für abgeschlossene Operatoren A ist Kern A = (Bild A∗ )⊥ ein abgeschlos-
sener Teilraum von H .
Beweis.
(a) Kern A∗ ⊂ (Bild A)⊥ : Für v ∈ Kern A∗ und u ∈ D(A) gilt
v , Au = A∗ v , u = 0 , u = 0 .
Ist umgekehrt v ∈ (Bild A)⊥ , so gilt für alle u ∈ D(A)
v , Au = 0 = 0 , u ,
somit v ∈ D(A∗ ) und A∗ v = 0, d.h. v ∈ Kern A∗ nach Definition von A∗ .

(b) Daraus folgt mit § 9 : 2.5
(Kern A∗ )⊥ = (Bild A)⊥⊥ = Bild A .
(c) Für abgeschlossene Operatoren A gilt A∗∗ = A nach 4.4 (c), also mit (a)
(Bild A∗ )⊥ = Kern A∗∗ = Kern A . 2
5 Spektrum und Resolvente

5.1 Definition und Anmerkungen
(a) Für einen abgeschlossenen Operator A definieren wir die Resolventen-
menge (A) und die Resolvente R(λ, A) durch
λ ∈ (A) ⇐⇒ λ − A : D(A) → H besitzt eine stetige Inverse R(λ, A) .
Aus 2.2 (e) entnehmen wir
λ ∈ (A) ⇐⇒ (A − λ) : D(A) → H ist bijektiv .
Das Spektrum σ(A) von A ist definiert als
σ(A) := \ (A) = {λ ∈ | A − λ : D(A) → H ist nicht bijektiv}.
(b) Bemerkungen. (i) Gibt es für einen linearen Operator ein λ ∈ , so

dass λ − A : D(A) → H eine Inverse R(λ, A) ∈ L (H ) besitzt, so ist A
abgeschlossen.
Denn sei (un ) eine Folge in D(A), für die u = lim un und v = lim Aun
n→∞ n→∞
existieren. Dann gilt λu − v = lim (λ − A)un , und wegen der Stetigkeit von
n→∞
R(λ, A) folgt
u = lim un = lim R(λ, A)(λ − A)un = R(λ, A)(λu − v) ∈ D(A) ,
n→∞ n→∞
(λ − A)u = lim (λ − A)un = λu − v ,

n→∞
somit Au = v.
5 Spektrum und Resolvente 665
Daher macht der Begriff des Spektrums nur für abgeschlossene Operatoren Sinn;
gleichwohl schreiben wir für abschließbare (z.B. symmetrische) Operatoren A
manchmal σ(A) statt σ(A).
(ii) Das Spektrum eines unbeschränkten abgeschlossenen Operators kann leer
sein.
Als Beispiel betrachten wir A : u → − iu auf

D(A) := u ∈ W1 [a, b] u(a) = 0 .
Die Abgeschlossenheit von A ergibt sich wie im Beweis 3.2 (a) ÜA . Für beliebige
λ ∈ ist A − λ injektiv, denn aus Au − λu = 0 mit u ∈ D(A) folgt, dass
u = iλu ∈ C [a, b], also u(x) = u(a)eiλ(x−a) und somit u = 0 wegen u(a) = 0.
A − λ : D(A) → L2 [a, b] ist surjektiv, denn für f ∈ L2 [a, b] ist die Gleichung
Au−λu = f äquivalent zu u −iλu = if , u(a) = 0. Es ist leicht nachzurechnen,
dass die Variation–der–Konstanten–Formel
x
u(x) = ieiλx f (t) e−iλt dt
a
eine Lösung u ∈ D(A) liefert. Somit gilt (A) = .
5.2 Einteilung des Spektrums

(a) Jeder Spektralwert eines abgeschlossenen Operators A gehört zu genau
einer der folgenden Mengen, dem Punktspektrum (Eigenwertspektrum)
σp (A) := { λ ∈ | A − λ ist nicht injektiv} ,
dem kontinuierlichen Spektrum
σc (A) := { λ ∈ σ(A) | A − λ ist injektiv, Bild (A − λ) ist dicht in H } ,
oder dem Restspektrum
σr (A) := { λ ∈ | A − λ ist injektiv, Bild (A − λ) = H } .
Für λ ∈ σc (A) ist
(A − λ)−1 : Bild (A − λ) → D(A)
ein unbeschränkter und abgeschlossener linearer Operator ( ÜA , beachten Sie

dass A − λ nach 2.1 (d) abgeschlossen ist).
Unbeschränkte symmetrische Operatoren können, anders als beschränkte sym-
metrische, ein nichtleeres Restspektrum haben, vgl. 6.3 (b).
(b) Eine Zahl λ ∈ heißt approximativer Eigenwert, wenn es eine Folge

(un ) in D(A) gibt mit
un = 1 , Aun − λun → 0 für n → ∞ .
Die approximativen Eigenwerte bilden das approximative Punktspektrum
σapp (A).
Satz. Das approximative Punktspektrum ist eine Teilmenge des Spektrums. Es
umfasst das Punktspektrum und das kontinuierliche Spektrum.
Beweis.
(i) Für die Folge (un ) in D(A) mit un = 1 sei lim (λ − A)un = 0. Hätte
n→∞
λ − A eine stetige Inverse R(λ, A), so würde ein Widerspruch folgen:
un = R(λ, A)(λ − A)un → 0 für n → ∞ .
(ii) Es ist einfach zu sehen, dass σp (A) ⊂ σapp (A) ÜA .
(iii) Sei λ ∈ σc (A) und w ∈ Bild (A − λ). Da Bild (A − λ) dicht in H ist, gibt es
eine Folge (vn ) in D(A) mit wn := (A − λ)vn → w für n → ∞. Die Folge (vn )
kann nicht konvergieren, denn aus
vn → v , (A − λ)vn → w
würde wegen der Abgeschlossenheit von A − λ folgen, dass v in D(A) liegt und
(A − λ)v = w gilt.
Da (vn ) keine Cauchy–Folge ist, gibt es ein ε > 0, zu dem kein N ∈ existiert
mit vm − vn < ε für m > n > N . Daher gibt es Teilfolgen (ak ), (bk ) von (vn )
mit ak − bk ≥ ε für k = 1, 2, . . . sowie
lim (A − λ)ak = w = lim (A − λ)bk .
k→∞ k→∞
Für uk := (ak − bk )/ak − bk gilt dann uk ∈ D(A), uk = 1 und

(A − λ)uk ≤ ε−1 (A − λ)ak − (A − λ)bk → 0 für k → ∞ . 2
5.3 Das Spektrum des adjungierten Operators

(a) Satz. Ist A : D(A) → H abgeschlossen und bijektiv, so ist mit A auch A∗
stetig invertierbar, und es gilt
(A∗ )−1 = (A−1 )∗ .
Denn nach 4.5 ist dann A∗ injektiv. Für T := A−1 ∈ L (H ), h ∈ H gilt ferner
h , u = h , T Au = T ∗ h , Au für u ∈ D(A) ,
somit T h ∈ D(A ) und A T h = h für alle h ∈ H . Somit ist A∗ auch surjektiv,
∗ ∗ ∗ ∗
und es gilt (A∗ )−1 h = T ∗ h = (A−1 )∗ h für alle h ∈ H .

(b) Folgerungen. Für abgeschlossene Operatoren A gilt

λ ∈ σ(A) ⇐⇒ λ ∈ σ(A∗ ) ,
λ ∈ σc (A) ⇐⇒ λ ∈ σc (A∗ ) ,
λ ∈ σr (A) =⇒ λ ∈ σp (A∗ ) ,
λ ∈ σr (A∗ ) =⇒ λ ∈ σp (A) .
Beweis als ÜA mit Hilfe von (a), A − λ = A − λ, A∗∗ = A und 4.5.

(a) Wir betrachten die in 4.3 (b) untersuchten abgeschlossenen Operatoren
A : D(A) := W01 [a, b] → L2 [a, b] , u → −iu ,
B : D(B) := W1 [a, b] → L2 [a, b] , u → −iu ,
Nach 4.3 (b) ist B = A∗ und aus 4.4 (c) folgt B ∗ = A∗∗ = A. Es gilt
(∗) u ∈ Kern (B − λ) ⇐⇒ u = iλu ∈ C [a, b] ⇐⇒ u(x) = c eiλx
mit einer geeigneten Konstanten c. Somit haben wir
σp (B) = , Kern (B − λ) = Span {fλ } mit fλ (x) = eiλx .
Aus 4.5 folgt Bild (A − λ) = {fλ }⊥ für alle λ ∈ und damit
σ(A) = σr (A) = ,
denn in (∗) wird c = 0, falls u(a) = 0 gilt, woraus σp (A) = ∅ folgt.
(b) Aufgabe. Zeigen Sie für den auf Dϕ = {u ∈ W1 [a, b] | u(a) = eiϕ u(b)}
definierten Impulsoperator P := Pper
& '
2πn − ϕ
σ(P ) = σp (P ) = n∈ ,
b−a
indem Sie zunächst σp (P ) bestimmen und dann zeigen, dass für λ ∈ σp (P ) und
beliebiges f ∈ L2 [a, b] die Gleichung P u − λu = f immer eine Lösung u ∈ Dϕ
der Form
x
u(x) = eiλx c + i f (t) e−iλt dt
a
mit einer passenden Konstanten c besitzt.
(c) Der Operator H : u → − u auf D(H) = {u ∈ C10 [0, 1] | u ∈ W1 [0, 1]} ist
symmetrisch und abgeschlossen, vgl. 3.5. Sein Spektrum ist gegeben durch
σ(H) = σp (H) = {π 2 n2 | n ∈ } .
Denn aus § 22 : 5.1 entnehmen wir, dass H eine kompakte, symmetrische Inverse
T = H −1 : L2 [0, 1] → D(H)
besitzt mit
σp (T ) = { 1/π 2 n2 | n ∈ } , σ(T ) = σ (T ) ∪ {0} ,
p
und dass σp (H) = { π n 2 2

| n ∈ } . Insbesondere ist 0 ∈ (H), und zu zeigen
bleibt λ ∈ (H) für alle λ = 0 mit λ ∈ σp (H). Für diese λ ist die Gleichung
Hu − λu = f äquivalent zu μu − T u = μT f mit μ = 1/λ, und diese besitzt
wegen μ ∈ σ(T ) für jede Funktion f ∈ L2 [0, 1] eine eindeutig bestimmte
Lösung u ∈ Bild T = D(H).
5.5 Das Spektrum von Multiplikatoren

(a) Für eine Folge a = (a1 , a2 , . . . ) setzen wir

∞
D(Ma ) := x = (x1 , x2 , . . . ) ∈ 2 | ak xk |2 < ∞
k=1
und
Ma x = (a1 x1 , a2 x2 , . . . ) für x = (x1 , x2 , . . .) ∈ 2 .
Dann gilt wie für beschränkte Multiplikatoren
σp (Ma ) = { an | n ∈ }, σ(Ma ) = σp (Ma ) , σr (Ma ) = ∅ .
Dies ergibt sich wörtlich wie in § 21 : 5.2; der dort gegebene Beweis macht an
keiner Stelle von der Beschränktheit von Ma Gebrauch.
ÜA : Prüfen Sie das nach.
(b) Für einen unbeschränkten Multiplikator Mv : u → v · u mit Definitionsbe-

reich {u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)} gilt wie für beschränkte Multiplikatoren
λ ∈ σ(Mv ) ⇐⇒ μ({|v − λ| < ε}) > 0 für alle ε > 0 ,
λ ∈ σp (Mv ) ⇐⇒ μ({v = λ}) > 0 ,
σ(Mv ) = σapp (Mv ) ,
σr (Mv ) = ∅ .
Ferner ist μ({v ∈ σ(Mv )}) = 0, so dass wir annehmen dürfen
v(ω) ∈ σ(Mv ) für alle ω ∈ Ω , insbesondere ist σ(Mv ) = ∅ .
Das ergibt sich wörtlich wie in § 21 : 5.3 ÜA .

(c) Demnach gilt für den Ortsoperator Q = Mx auf L2 ( ) Ê ÜA
σ(Q) = σc (Q) = Ê.
Genbereiche für Q sind C∞ Ê
c ( ) bzw. der Schwartzraum S ( ). Ê
(d) Für den Multiplikator Mv : v → v u mit der Funktion v(x) := x2 und
Ê
dem Definitionsbereich D(Mv ) = {u ∈ L2 ( n ) | v u ∈ L2 ( n)} giltÊ
σ(Mv ) = σc (Mv ) = Ê +.
Genbereiche für Mv sind C∞

c ( Ê ) und der Schwartzraum
n
S( Ê ).
n
Beweis.
Die Behauptungen über die Genbereiche für Mv (v(x) = x bzw. v(x) = x2 )
ergeben sich wie folgt: Für u ∈ D(Mv ) gilt (i + v) u ∈ L2 (= L2 ( ) bzw. Ê
Ê
L2 ( n )). Nach § 20 : 8.5 gibt es Testfunktionen ψn mit (i + v)u = L2 -lim ψn .
n→∞
Dann sind auch ϕn := ψn /(i + v) Testfunktionen mit (i + v) ϕn → (i + v) u
und (da v reellwertig ist)
|ψn − (i + v) u|
|ϕn − u| = ≤ |ψn − (i + v) u| ,
|i + v|
also u = L2 -lim ϕn , und wegen (i + v) u = L2 -lim (i + v) ϕn ergibt sich auch
n→∞ n→∞
v u = L2 -lim v ϕn
n→∞
Die Behauptung (d) folgt aus (b): Die Mengen {v = λ} sind entweder leer oder
einpunktig oder Sphären, also Lebesgue–Nullmengen. Daher ist σp (Mv ) leer.
Ê
Für λ ∈ + und ε > 0 ist {|v − λ| < ε} nichtleer und offen, somit von
Ê
positivem Lebesgue–Maß. Für λ ∈ + besitzt die Gleichung v u − λu = w für
Ê
jedes w ∈ L2 ( n ) die eindeutige Lösung
w
u := ∈ D(Mv ) ,
v−λ
Ê
denn wegen |u| ≤ dist (λ, + )−1 |w| gilt u ∈ L2 ( Ên
) und daher auch (v−λ)u =
Ê
w ∈ L2 ( n), also u ∈ D(Mv − λ) = D(Mv ). 2
5.6 Die Analytizität der Resolvente

(a) Die Resolventenmenge eines abgeschlossenen Operators A ist offen: Für
λ0 ∈ (A) und alle λ ∈ mit |λ − λ0 | < R(λ0 , A)−1 gilt λ ∈ (A) und

∞
R(λ, A) = (λ0 − λ)k R(λ0 , A)k+1 im Normsinn.
k=0
Das Spektrum σ(A) ist also abgeschlossen.

(b) Für λ, μ ∈ (A) besteht die Resolventengleichung
R(λ, A) − R(μ, A) = (μ − λ)R(λ, A)R(μ, A) = (μ − λ)R(μ, A)R(λ, A) .
Beweis.
(a) Sei R0 := R(λ0 , A) und |λ−λ0 |·R0 < 1. Dann konvergiert nach § 21 : 6.1
die Neumannsche Reihe

∞
n
S := (λ0 − λ)k R0k+1 = lim Sn mit Sn := (λ0 − λ)k R0k+1
k=0 n→∞ k=0
im Normsinn. Zu zeigen ist, dass S die Inverse von λ − A ist, d.h.
(i) S : H → D(A) , (λ − A)S = ½, (ii) S(λ − A) = ½D(A) .
Den Beweis in § 21 : 6.2 müssen wir dahingehend modifizieren, dass an die Stelle
der dort vorausgesetzten Stetigkeit die Abgeschlossenheit tritt.
Zu (i): Sei u ∈ H und vn := Sn u. Es gilt Bild R0k ⊂ D(A) für k = 1, 2, . . .
wegen Bild R0 = D(A), also
(1) vn ∈ D(A) , lim vn = Su .
n→∞
Aus (λ0 − A)R0 = ½ erhalten wir

(λ − A ) vn = (λ − λ0 ) vn + (λ0 − A) vn
= (λ − λ0 )Sn u + (λ0 − A)Sn u

n
n
= − (λ0 − λ)k+1 R0k+1 u + (λ0 − λ)k R0k u
k=1 k=1
= u − (λ0 − λ)n+1 R0n+1 u .

Mit der Abschätzung (λ0 − λ)n+1 R0n+1 u ≤ (|λ0 − λ| · R0 )n+1 u folgt
(2) lim (λ − A) vn = u .
n→∞
Aus (1) und (2) folgt Su ∈ D(A) und (λ − A)Su = u, da A abgeschlossen ist.
Zu (ii): Für u ∈ D(A) ergibt sich wie oben ÜA
Sn (λ − A) u = Sn ((λ0 − A) u + (λ − λ0 ) u) = u − (λ0 − λ)n+1 R0n+1 u ,

d.h.
Sn (λ − A)u → u für n → ∞ .
Wegen der Normkonvergenz Sn → S gilt also
u = lim Sn (λ − A) u = S(λ − A) u für u ∈ D(A) .
n→∞
6 Zur praktischen Bestimmung des Spektrums 671
(b) Die Resolventengleichung folgt aus der Identität
R(λ, A) = R(λ, A)(μ − A)R(μ, A) für λ, μ ∈ (A) ÜA . 2
6 Zur praktischen Bestimmung des Spektrums

6.1 Ein Kriterium für die Invertierbarkeit des Abschlusses
Für viele symmetrische, nicht abgeschlossene Operatoren A können Aussagen
über das Spektrum von A gemacht werden, ohne dass der Abschluss A bestimmt
werden muss. Grundlage dafür sind die folgenden Sätze.
(a) Lemma. Für abschließbare Operatoren A und für λ ∈ gilt ÜA
Bild (A − λ) ⊂ Bild (A − λ) .
Hiernach gehört λ zum Punktspektrum oder zum Restspektrum von A, wenn

Bild (A − λ) nicht dicht in H liegt.
(b) Satz. Ist A abschließbar und gibt es eine Konstante > 0 mit
(∗) Au − λu ≥ u für u ∈ D(A) ,
so gilt
Bild (A − λ) = Bild (A − λ) .
Daher gehört λ genau dann zur Resolventenmenge von A, wenn Bild (A − λ)

dicht in H ist und die Bedingung (∗) erfüllt ist.
In diesem Fall ergibt sich die Resolvente R(λ, A) durch stetige Fortsetzung des
beschränkten, dicht definierten und bijektiven Operators
(λ − A)−1 : Bild (A − λ) → D(A)
mit Normschranke 1/ , und es gilt Au − λu ≥ u für u ∈ D(A).
Beweis.
(i) Wir zeigen zunächst Bild (A − λ) ⊂ Bild (A − λ).
Ist h = lim (Aun − λun ) mit un ∈ D(A) für n ∈
n→∞
, so folgt aus (∗), dass (u
n)
eine Cauchy–Folge ist. Für u = lim un gilt dann

n→∞
lim Aun = h + λu ,
n→∞
also u ∈ D(A) und Au = h + λu, somit h = (A − λ)u ∈ Bild (A − λ). Mit

Lemma (a) ergibt sich die erste Behauptung.
(ii) Für λ ∈ (A) gilt daher H = Bild (A − λ) = Bild (A − λ) und

u = R(λ, A)(λ − A)u ≤ R(λ, A) · Au − λu
für u ∈ D(A), d.h. (∗) ist erfüllt mit := R(λ, A)−1 > 0.
(iii) Ist (∗) mit > 0 erfüllt, so folgt Au − λu ≥ · u für u ∈ D(A) ÜA ,
somit ist A − λ injektiv. Ist zusätzlich Bild (A − λ) dicht in H , so folgt aus
(b), dass A − λ surjektiv ist und daher λ ∈ (A).
(iv) Ferner ist dann T = (λ − A)−1 : Bild (A − λ) → D(A) dicht definiert und
beschränkt mit Normschranke 1/ . Nach dem Fortsetzungssatz § 21 : 2.9 lässt
sich T zu einem Operator T ∈ L (H ) mit Normschranke 1/ fortsetzen.
Für u ∈ D(A) gibt es eine Folge (un ) in D(A) mit u = lim un , Au = lim Aun ,
n→∞ n→∞
somit (λ − A)u = lim (λ − A)un . Wegen der Stetigkeit von T folgt
n→∞
T (λ − A)u = lim T (λ − A)un = lim T (λ − A)un = lim un = u ,

n→∞ n→∞ n→∞
somit T (λ − A) = ½D(A) . Andererseits gilt R(λ, A)(λ − A) = ½D(A) .

Wegen der Surjektivität von λ − A folgt T = R(λ, A). 2
6.2 Das Spektrum symmetrischer Operatoren

Ê
(a) Für symmetrische Operatoren A gilt σapp (A) ⊂ , insbesondere sind alle
Eigenwerte reell. Nichtreelle Spektralwerte gehören somit immer zum Restspek-
trum.
Dies folgt unmittelbar aus der Abschätzung

Au − λu ≥ | Im λ | · u für u ∈ D(A) ,
die sich wie in § 21 : 6.5 (a) ergibt.
(b) Ein unbeschränkter symmetrischer Operator kann ein nichtleeres Restspek-

trum besitzen, wie das Beispiel 6.3 (b) zeigt.
Für beschränkte symmetrische Operatoren T ist das Restspektrum leer. Das
ergibt sich unter Verwendung von T ∗ = T wie folgt:
λ ∈ σr (T ) =⇒ λ ∈ σp (T ∗ ) = σp (T ) =⇒ λ ∈ Ê =⇒ λ = λ ∈ σp (T ).
Hiervon lässt sich für unbeschränkte symmetrische Operatoren A der Schluss
λ ∈ σr (A) =⇒ λ ∈ σp (A∗ )
übernehmen, denn aus 4.5 folgt Kern (A∗ − λ) = Bild (A − λ)⊥ . Doch nur im
Fall A∗ = A kommt wie oben ein Widerspruch zustande.
(c) Folgerung. Für selbstadjungierte Operatoren A gilt σ(A) = σapp (A) ⊂ Ê.

(d) Aus 6.1 und der Abschätzung (a) ergibt sich der
Satz. Für einen symmetrischen Operator A gehört λ genau dann zur Resolven-
tenmenge von A, wenn Bild (A − λ) dicht in H ist und wenn es ein >0
gibt mit
Au − λu ≥ u für u ∈ D(A) .
Für nichtreelle λ ist die letzte Bedingung automatisch erfüllt ( = |Im λ|), somit
gehört λ ∈ \ genau dann zum Spektrum (und zwar zum Restspektrum) von
A, wenn Bild (A − λ) nicht dicht in H ist.
6.3 Beispiele
(a) Der Laplace–Operator auf dem Ê n
Wir bezeichnen den Schwartzraum S (n ) im Folgenden kurz mit S und be-
trachten den Laplace–Operator
L : S → S , u → − Δu .
Satz. L ist symmetrisch mit σ(L) = σapp (L) = +.
Beweis.
/ unitär, und
Nach § 12 : 3.3 ist die Fouriertransformation F : S → S , u → u
es gilt
:
− Δu(y) /(y) für u ∈ S und y ∈ n ,
= y2 u
d.h.
(1) L = F −1 AF ,
wobei A die Einschränkung des Multiplikators My2 auf S ist. Es folgt
(2) / − λu
Lu − λu = w ⇐⇒ Au /= w
/ für u, w ∈ S und
(3) / − λu
Lu − λu2 = Au /2 für u ∈ S .
Wir zeigen zunächst, dass σ(L) ⊂ + . Sei λ ∈ + , also := dist (λ, + ) > 0.
Für u ∈ S folgt aus (3) wegen | y2 − λ | ≥
(4) / − λu
Lu − λu = Au / ≥ / =
u u .
Für eine gegebene Funktion w ∈ S ist die Gleichung Lu − λu = w für u ∈ S
nach (2) äquivalent zur Gleichung
/(y) = (y2 − λ)−1 w(y)
u / (y ∈ n ) .
Es ist leicht zu sehen, dass im Fall λ ∈ + hierdurch eine Funktion u
/∈ S
definiert ist. Für u := F −1 u
/ gilt somit u ∈ S und Lu − λu = w.
Ê
Daher umfasst Bild (L − λ) den in H = L2 ( n) dichten Teilraum S . Aus (4)
Ê
und 6.2 (d) folgt λ ∈ (L). Somit haben wir gezeigt: λ ∈ + =⇒ λ ∈ (L),
Ê
d.h. σ(L) ⊂ + .
Wir zeigen nun
Ê + ⊂ σc (L) = σapp (L) = σapp (A) = σc (A).
Ê
Seien λ ∈ + und ε > 0 vorgegeben. Wir wählen eine Funktion ϕ ∈ C∞
c ( ) Ê
mit supp ϕ ⊂ ]λ − ε, λ + ε[ und setzen
v(x) := c ϕ(x2 ) ,
wobei wir die Konstante c > 0 so wählen, dass v = 1. Dann gilt v ∈ C∞
c ( Ê n
)
und v(x) = 0 für | x2 − λ | ≥ ε, somit |Av − λv| ≤ ε|v|, also
Av − λv ≤ ε .
Für ε = 1/n erhalten wir auf diese Weise Funktionen vn ∈ S mit vn = 1,
Avn − λvn ≤ 1/n. Für un := F −1 vn gilt dann un ∈ S , un = 1 und
Lun − λun ≤ 1/n wegen (4). Somit gilt λ ∈ σapp (A) und λ ∈ σapp (L). Nach
5.5 (b) ist σ(A) = σapp (A) = σc (A). 2
Bei diesem und den folgenden Beispielen geht es vor allem darum, zu Demon-
strationszwecken das Spektrum eines abgeschlossenen symmetrischen Operators
allein mit Hilfe eines Gens zu bestimmen.
(b) Der Operator u → − iu auf der Halbgeraden
Für den durch
D(A) := {u ∈ C1 ( Ê +) ∩ L2 ( Ê+) | u(0) = 0, u ∈ L2 ( Ê+)},

Au = − iu
definierten, symmetrischen Operator A gilt
σ(A) = {λ ∈ | Im λ ≤ 0} , λ ∈ σr (A) für Im λ < 0 .
Beweis.
Wegen C∞c (>0 ) ⊂ D(A) ist A dicht definiert. Die Symmetrie von A ergibt sich
durch partielle Integration ÜA .
Wir betrachten die Gleichung Au − λu = v für v ∈ C1 (+ ) ∩ L2 (+ ). Nach

Wahl von D(A) ist diese äquivalent zum inhomogenen linearen AWP
(1) u − iλu = iv , u(0) = 0 , u ∈ C1 (+ )
mit der Zusatzbedingung u ∈ L2 (+). Für jede Lösung u ∈ L2 (+ ) von (1)
gilt dann auch u = iλu + iv ∈ L2 (+), also u ∈ D(A).
Die Gleichung (1) ist für u ∈ D(A) äquivalent zu
x
(2) u(x) = i eiλx v(t) e−iλt dt
0
(Variation der Konstanten).

Wir setzen g(x) := eiλx , h(x) := e−iλx .
Für Im λ = ω > 0 gilt |g(x)| = e−ωx , |h(x)| = eωx , insbesondere g ∈ L2 ( Ê
+).
Wählen wir v ∈ C∞
c ( Ê >0 ) mit supp v ⊂ ]0, R[ , so folgt aus (2)
R
|u(x)| ≤ e−ωx |v(t)| eωt dt für x ≥ R ,
0
somit liefert (2) eine Lösung u ∈ D(A) von Au − λu = v. In diesem Fall umfasst
Ê
Bild (A − λ) die in L2 ( + ) dichte Menge C∞ Ê
c ( >0 ). Aus 6.2 (d) folgt λ ∈ (A).
Im Fall Im λ = −ω < 0 gilt |g(x)| = e ωx

≥ 1, somit g ∈ L2 ( Ê
+ ), aber h ∈
Ê
L2 ( + ).
Aus (2) folgt
x x
|u(x)| = eωx v(t) h(t) dt ≥ v(t) h(t) dt .
0 0
Daher kann u nur dann zu L ( 2

Ê+) gehören, wenn

∞
v(t) h(t) dt = 0 ,
0
also v ⊥ h. Daher ist in diesem Fall Bild (A − λ) nicht dicht in L2 ( +). Es Ê

folgt λ ∈ σr (A) aus 6.2 (d). Im Fall ω = 0 ergibt sich λ ∈ σ(A) wegen der
Abgeschlossenheit des Spektrums. 2
(c) Das Spektrum des Impulsoperators auf Ê

Die Fouriertransformation u → u / liefert eine unitäre Abbildung des Schwartz-
raums S der schnellfallenden Funktionen auf sich (§ 12 : 3.1, 3.4). Für u ∈ D(A)
:
:= S sei Au := − iu. Dann gilt Au(y) = y·u /(y) (§ 12 : 3.3), d.h. der Operator
A ist unitär äquivalent zum Multiplikator My mit Definitionsbereich S . Nach
5.5 (c) ist dessen Abschluss der Ortsoperator Q, und es ist σ(Q) = σapp (Q) = . Ê
Also gilt für den Impulsoperator P = A ebenfalls
σ(P ) = σapp (P ) = Ê.
Für dieses Ergebnis war die Kenntnis des genauen Definitionsbereichs von P =
A nicht erforderlich (D(P ) = W1 ( ) nach 3.4 (a)).Ê
676 § 24 Selbstadjungierte Operatoren
§ 24 Selbstadjungierte und wesentlich selbstadjungier-

te Operatoren
1 Charakterisierung selbstadjungierter Operatoren

1.1 Selbstadjungiertheit und maximale Symmetrie
(a) Ein Operator A heißt selbstadjungiert, wenn A = A∗ gilt. Die Bedeutung
selbstadjungierter Operatoren für die Quantenmechanik wurde in § 18 : 3.1 (b)
schon kurz angesprochen; mehr hierzu folgt in § 25 : 4. Ihre Rolle in der Analysis,
insbesondere der Differentialgleichungstheorie ergibt sich aus der Existenz einer
Spektralzerlegung (Abschnitt 3 und § 25 : 1.4), dem Spektralsatz und dem Satz
von Stone (§ 25 : 3.2, 3.4).
In diesem Paragraphen sollen Kriterien aufgestellt werden, die es gestatten, aus
Eigenschaften eines symmetrischen Operators A auf die Selbstadjungiertheit
von A zu schließen, ohne A explizit bestimmen zu müssen. Hierzu stellen wir
zunächst Bedingungen für die Selbstadjungiertheit eines Operators auf.
In § 23 : 4.3 wurde festgestellt, dass selbstadjungierte Operatoren symmetrisch
und abgeschlossen sind. Darüberhinaus gilt der folgende
(b) Satz. Selbstadjungierte Operatoren sind maximal symmetrisch: Ist A selbst-

adjungiert und B eine symmetrische Fortsetzung von A, so gilt B = A.
Mit Hilfe dieses Satzes kann die Gleichheit zweier selbstadjungierter Operatoren
nachgewiesen werden.
Beweis.
Nach Voraussetzung gilt A = A∗ und A ⊂ B ⊂ B ∗ . Mit § 23 : 4.2 (a) folgt
B ⊂ B ∗ ⊂ A∗ = A ⊂ B , also A = B . 2
Nicht jeder maximal symmetrische Operator ist selbstadjungiert.

Ê
Nach § 23 : 6.3 (b) ist der auf W01 ( +) definierte Operator A : u → − iu abge-
schlossen und symmetrisch, und es gilt i ∈ (A), also ist A−i : D(A) → L2 ( + )Ê
bijektiv. Für eine echte symmetrische Fortsetzung B von A wäre B − i zwar
surjektiv, aber nicht mehr injektiv und somit i ∈ σp (B), was nicht sein kann
Ê
(§ 23 : 6.2 (a)). A ist nicht selbstadjungiert, denn D(A∗ ) umfaßt W1 ( ), wie sich
leicht durch partielle Integration ergibt.
1.2 Das Spektrum selbstadjungierter Operatoren

Satz. Ein abgeschlossener symmetrischer Operator A ist genau dann selbstad-
jungiert, wenn sein Spektrum reell ist. Es ist dann σ(A) = σapp (A).
1 Charakterisierung selbstadjungierter Operatoren 677
Beweis.
(a) Sei A = A∗ . Dann ist A abgeschlossen und symmetrisch, ferner σ(A) ⊂ Ê
nach § 23 : 6.2 (c).
Ê
(b) Sei A symmetrisch und abgeschlossen mit σ(A) ⊂ . Wegen A ⊂ A∗ bleibt
zu zeigen, dass A∗ ⊂ A. Wir fixieren ein λ ∈ \ . Dann ist nach Voraussetzung
λ, λ ∈ (A), also ist
(1) A − λ : D(A) → H surjektiv,
(2) Bild (A − λ) = H (sogar Bild (A − λ) = H ).
Sei v ∈ D(A∗ ). Dann gibt es nach (1) ein u ∈ D(A) mit

(3) (A − λ) u = (A∗ − λ) v .
Wegen A ⊂ A∗ folgt (A∗ − λ) u = (A∗ − λ) v, also mit § 23 : 4.5

u − v ∈ Kern (A∗ − λ) = Kern (A − λ)∗ = Bild (A − λ)⊥ = {0}
aufgrund von (2). Somit gilt v = u ∈ D(A), und aus (3) folgt A∗ v = Au = Av.
Dies zeigt A∗ ⊂ A. 2
Folgerung. Gibt es für einen symmetrischen Operator A eine Zahl λ ∈ mit

∗
Bild (A − λ) ⊂ Bild (A − λ) und Bild (A − λ) = H ,
so ist A selbstadjungiert und damit auch abgeschlossen.
Ist insbesondere A symmetrisch und Bild (A − λ) = H für ein λ ∈ , so ist A
selbstadjungiert.
Dies ergibt eine nochmalige Durchsicht des Beweises (b); andere als die genann-
ten Voraussetzungen werden nicht benötigt.
1.3 Die Hauptkriterien für Selbstadjungiertheit

Für einen symmetrischen Operator A sind folgende Aussagen äquivalent:
(a) A ist selbstadjungiert.
(b) A ist abgeschlossen und σ(A) ⊂ .
(c) A + i und A − i sind surjektiv.
(d) A − λ und A − λ sind surjektiv für mindestens ein λ ∈ .
Beweis.
(a) ⇐⇒ (b) nach 1.2.
(b) =⇒ (c) =⇒ (d) nach der Definition von σ(A) und ρ(A).
(d) =⇒ (a) nach der Folgerung von 1.2, denn im Fall Bild (A − λ) = H
gilt natürlich Bild (A∗ − λ) ⊂ Bild (A − λ). 2
(e) Folgerung. Ein symmetrischer Operator A ist genau dann selbstadjun-

giert, wenn er abgeschlossen ist und
Kern (A∗ − λ) = Kern (A∗ − λ) = {0} für ein λ ∈ \
gilt.
Ist A selbstadjungiert, so besteht diese Beziehung für alle λ ∈ \ .
Beweis.
(i) Ist A selbstadjungiert, so ist A abgeschlossen und σ(A) ⊂ . Für alle

λ ∈ \ gilt dann λ, λ ∈ (A), somit wegen A = A∗
Kern (A∗ − λ) = Kern (A − λ) = {0} = Kern (A − λ) = Kern (A∗ − λ) .
(ii) Sei A symmetrisch und abgeschlossen, und es existiere ein λ ∈ \ mit

Kern (A∗ − λ) = Kern (A∗ − λ) = {0}. Nach § 23 : 4.5 (b) und 6.1 (b) folgt
Bild (A − λ) = Bild (A − λ) = {0}⊥ = H = Bild (A − λ)

= Bild (A − λ).
Somit ist A selbstadjungiert nach dem Kriterium 1.3 (d). 2
1.4 Beispiele selbstadjungierter Operatoren

(a) Reelle Multiplikatoren. Für eine μ–messbare Funktion v : Ω → ist
der Multiplikator
Mv : u → v · u mit D(Mv ) = {u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)}
selbstadjungiert. Das folgt aus Mv∗ = Mv = Mv , vgl. § 23 : 4.1 (e).

Entsprechend folgt die Selbstadjungiertheit des Multiplikators Ma auf 2 mit
einer reellen Zahlenfolge a = (a1 , a2 , . . . ).
Ein anderer, die Kenntnis von Ma∗ nicht voraussetzender Nachweis der Selbst-
adjungiertheit stützt sich auf 1.3 (c): Ma ist offenbar symmetrisch. Für y =
(y1 , y2 , . . . ) ∈ 2 und x = (x1 , x2 , . . . ) mit xk = yk /(ak ± i) gilt |xk | ≤ |yk |,
somit x ∈ 2 und (Ma ± i) x = y.
(b) Impulsoperatoren.
(i) Der auf W1 ( ) definierte Impulsoperator P : u → − iu eines geradlinig
bewegten Teilchens ist nach 1.2 und § 23 : 6.3 (c) selbstadjungiert.
(ii) Der auf Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} definierte Impulsoperator
Pper := u → − iu ist selbstadjungiert. Wir können dies aus 1.3 (b) folgern,
indem wir die in § 23 : 3.2 bewiesene Abgeschlossenheit heranziehen und das
Ergebnis der Aufgabe § 23 : 5.4 (b) verwenden: σ(Pper ) = σp (Pper ) ⊂ .
Direkter führt das Kriterium 1.3 (c) zum Ziel: Für f ∈ L2 [a, b] liefert
1 Charakterisierung selbstadjungierter Operatoren 679
x
u(x) := e±x c + i f (t) e∓t dt
a
eine absolutstetige Lösung der DG u = ±u + if , d.h. der Gleichung
Pper u ± iu = f .
Es ist leicht zu sehen, dass α := e±a − eiϕ e±b für a = b von Null verschieden
b
ist. Legen wir c durch α · c = ieiϕ e±b f (t) e∓t dt fest, so erfüllt u die Rand-
a
bedingung u(a) = eiϕ u(b) ÜA .
(c) Der Hamilton–Operator H eines in ]a, b[ eingesperrten Teilchens mit

D(H) := u ∈ C10 [0, 1] u ∈ W1 [0, 1] , Hu = − 1
2 u für u ∈ D(H)
ist aufgrund des Kriteriums 1.3 (b) selbstadjungiert, denn nach § 23 : 5.4 (c) ist
u → −u auf D(H) symmetrisch mit reellem Spektrum.
1.5 Die Selbstadjungiertheit von A∗A

Satz. Für jeden abgeschlossenen Operator A ist A∗A mit
D(A∗A) := { u ∈ D(A) | Au ∈ D(A∗ ) }
selbstadjungiert.
Für jeden selbstadjungierten Operator A ist somit A2 selbstadjungiert.
Bemerkung. Für einen linearen Operator A ist {u ∈ D(A) | Au ∈ D(A∗ )} i.A.
kein dichter Teilraum von H , also A∗A nicht notwendig ein linearer Operator.
Beweis.
(a) Für u, v ∈ D(A∗A) gilt A∗Au , v = Au , Av = u , A∗Av , also ist A∗A
ein symmetrischer Operator, falls D(A∗A) dicht in H ist.
(b) Wir zeigen, dass sich jeder Vektor h ∈ H in der Form h = u + A∗Au mit
u ∈ D(A∗A) darstellen lässt. Nach § 23 : 2.2 (a) ist G(A) = {(u, Au) | u ∈ D(A)}
und damit auch U (G(A)) := {(Au, −u) | u ∈ D(A)} abgeschlossen in H × H .
Nach § 23 : 4.4 ist
G(A∗ ) = U (G(A))⊥ (Orthogonalität in H × H )
ebenfalls abgeschlossen in H × H . Nach dem Zerlegungssatz § 9 : 2.4 lässt sich
daher jedes Paar (0, −h) ∈ H × H in der Form
(0, −h) = (v, A∗ v) + (Au, −u) mit u ∈ D(A) , v ∈ D(A∗ )
darstellen. Dann gelten die Gleichungen
0 = v + Au , h = u − A∗ v .
Aus diesen folgt Au = −v ∈ D(A∗ ) und h = u + A∗Au.

(c) D(A∗A) ist dicht in H : Sei h ⊥ D(A∗A) und u ∈ D(A∗A) ⊂ D(A) so
gewählt, dass h = u + A∗Au. Dann folgt mit (a)
0 = h , u = u2 + Au2 , also u = 0 und somit h = 0 .
(d) Nun folgt die Selbstadjungiertheit von A∗A aus dem Kriterium 1.3 (d) mit
λ = λ = −1, da A∗A + 1 nach (b) surjektiv ist. 2
2 Wesentlich selbstadjungierte Operatoren

(a) Die Zielsetzung dieses Abschnitts wird am besten durch ein Beispiel ver-
deutlicht. Die Energie eines freien, spinlosen Teilchens im Raum soll, wie je-
de Observable der Quantenmechanik, durch einen selbstadjungierten Operator
H beschrieben werden. Unter Vernachlässigung physikalischer Konstanten wird
Ê
H := − 12 Δ gesetzt, wobei −Δ der auf S ( n ) definierte Laplace–Operator ist.
Die direkte Anwendung eines der Kriterien 1.3 wäre für n > 1 relativ schwierig,
Ê
dies würde Kenntnisse über den Sobolew–Raum D(Δ) = W2 ( n) vorausset-
zen. Wir nützen daher das Kriterium 1.3 (b) indirekt aus, indem wir uns nur auf
Ê
die Eigenschaften des Gens − Δ auf S ( n) stützen. Die entsprechenden Rech-
nungen wurden in § 23 : 6.3 (a) durchgeführt mit dem Ergebnis σ(− Δ) = + . Ê
Offenbar gilt auch σ(H) = 12 σ(−Δ) = + . Ê
(b) Ein symmetrischer Operator A heißt wesentlich selbstadjungiert, wenn
∗
sein Abschluss A selbstadjungiert ist, d.h. wenn A = A = A∗ , vgl. § 23 : 4.2 (c).
Ein Operator A ist genau dann wesentlich selbstadjungier, wenn A ⊂ A∗ ⊂ A .
Denn A ⊂ A∗ bedeutet Symmetrie, und aus dieser folgt nach der Folgerung
∗ ∗∗
§ 23 : 4.4 (c) A = A∗∗ ⊂ A∗ . Aus A∗ ⊂ A ergibt sich dann A = A = A.
(c) Beispiele.
Ê
(i) Der auf S ( n) definierte Laplace–Operator u → − Δu ist nach (a) we-
sentlich selbstadjungiert.
(ii) Der Operator Pϕ : u → − iu mit D(Pϕ ) = {u ∈ C∞ [a, b] | u(a) =
eiϕ u(b)} ist wesentlich selbstadjungiert. Denn nach § 23 : 3.2 (b) ist sein Ab-
schluss der auf Dϕ = {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} definierte Impulsoperator
u → −iu , und dieser ist nach 1.4 (b) selbstadjungiert.
(iii) Der auf C20 [a, b] = {u ∈ C2 [a, b] | u(a) = u(b) = 0} definierte Laplace–
Operator u → −u ist wesentlich selbstadjungiert, vgl. § 23 : 3.5 und § 23 : 5.4 (c).
Ê
(iv) Der auf dem Schwartzraum S ( n) eingeschränkte Multiplikator Mv mit
v(x) = x2 ist nach § 23 : 5.5 (d) ein Gen für den maximal definierten Multipli-
kator Mv , dessen Selbstadjungiertheit in 1.4 (a) festgestellt wurde.
2 Wesentlich selbstadjungierte Operatoren 681
2.2 Kriterien für wesentliche Selbstadjungiertheit

Für einen symmetrischen Operator A sind die folgenden Aussagen äquivalent:
(a) A ist wesentlich selbstadjungiert.
(b) Bild (A − i) und Bild (A + i) sind dicht in H .
(c) Es gibt eine Zahl λ ∈ und ein > 0, so dass A − λ, A − λ dichtes Bild
haben und dass
Au − λu ≥ u , Au − λu ≥ u für u ∈ D(A) .

∗ ∗
(d) Kern (A + i) = Kern (A − i) = {0}.
Bemerkungen. (i) Nach § 23 : 6.1 (b) ist die Bedingung (c) äquivalent zu
λ, λ ∈ (A). Für nichtreelle λ gilt Au − λu ≥ |Im λ| · u für u ∈ D(A),
vgl. § 23 : 6.2, also ist für nichtreelle λ die Bedingung (c) schon dann erfüllt,
wenn Bild (A − λ) und Bild (A − λ) dicht in H sind.
(ii) Ist A wesentlich selbstadjungiert, so ist die Bedingung (c) für alle nichtre-
ellen λ erfüllt, denn nach 1.3 (b) gilt σ(A) ⊂ .
Beweis.
(a) =⇒ (b). Ist A selbstadjungiert, so gilt σ(A) ⊂ , also Bild (A − λ) =
H für alle nichtreellen λ. Nach § 23 : 6.1 (a) folgt Bild (A − λ) = H für alle

λ ∈ \ , insbesondere für λ = ±i.
(b) =⇒ (c) mit λ = i nach Bemerkung (i).
(c) =⇒ (a). Nach Bemerkung (i) folgt aus (c) die Existenz einer Zahl λ
mit λ, λ ∈ (A), woraus Bild (A − λ) = Bild (A − λ) = H folgt. Somit ist A
selbstadjungiert aufgrund von 1.3 (d).
(a) ⇐⇒ (d) nach dem Kriterium 1.3 (e), denn nach § 23 : 2.1 (d), § 23 : 4.2 (c)
gilt (A ± i)∗ = (A ± i)∗ = (A ± i)∗ . 2
2.3 Halbbeschränkte Operatoren

Ein linearer Operator A heißt positiv (A ≥ 0), wenn
u , Au ≥ 0 für u ∈ D(A)
und halbbeschränkt mit unterer Schranke , wenn A − positiv ist, d.h.

wenn
u , Au ≥ u2 für u ∈ D(A) .
Wegen u , Au ∈ für u ∈ D(A) sind halbbeschränkte Operatoren symme-

trisch (Polarisierungsgleichung § 21 : 3.6 (b)). Aus A − ≥ 0 folgt A − ≥ 0
ÜA .
Satz. (a) Ist A halbbeschränkt mit unterer Schranke , so gilt

Au − λu ≥ ( − λ) u für λ < .
(b) Gibt es daher ein λ0 < , so dass Bild (A − λ0 ) dicht in H ist, so ist A
wesentlich selbstadjungiert und σ(A) ⊂ [ , ∞[ .
Für alle λ < ist dann R(λ, A) die Fortsetzung des beschränkten, dicht defi-
nierten Operators (λ − A)−1 : Bild (A − λ) → D(A).
(c) Andernfalls gilt λ ∈ σr (A) für alle λ < , und A besitzt unendlich viele
selbstadjungierte Fortsetzungen.
Beweis.
(a) B := A − ist symmetrisch mit B ≥ 0. Für u ∈ D(A), λ < ρ gilt somit
Au − λu2 = Bu + ( − λ)u , Bu + ( − λ)u
= Bu2 + 2( − λ) u , Bu + ( − λ)2 u2
≥ ( − λ)2 u2 .
(b) Die wesentlich Selbstadjungiertheit von A folgt unmittelbar aus dem Krite-
rium 2.2 (c). Die Aussage über die Resolvente folgt aus § 23 : 6.1. Aufgrund von
(a) schließen wir: λ < =⇒ λ ∈ σapp (A) = σ(A), vgl. 1.2.
(c) Tritt der Fall (b) nicht ein, so gilt λ ∈ σr (A) für alle λ < , denn für λ <
ist λ ∈ σp (A) nach (a). Für den Beweis der Fortsetzbarkeit und Einzelheiten
hierzu verweisen wir auf Riesz–Nagy [131] Nr. 122–125 und Reed-Simon [130,
II] Ch. X (Stichworte Defektindizes“, Friedrichs–Erweiterung“). 2
” ”
Beispiel. Der Operator B : W01 [a, b] → L2 [a, b], u → −iu ist symmetrisch
und abgeschlossen, aber nicht selbstadjungiert (§ 23 : 4.3). Setzen wir B auf den
Definitionsbereich Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} fort, so entsteht nach
1.4 (b) jeweils ein selbstadjungierter Operator Bϕ : u → −iu . Somit besitzt
der Operator A = B 2 ≥ 0 die nach 1.5 selbstadjungierten Fortsetzungen Bϕ2 .
3 Symmetrische Operatoren mit diskretem Spektrum

3.1 Wesentliche Selbstadjungiertheit und Spektralzerlegung
In einer Reihe von Anwendungen sind folgende Bedingungen erfüllt:
(a) A ist ein symmetrischer Operator auf einem unendlichdimensionalen Hil-
bertraum.
(b) Es gibt ein vollständiges ONS v1 , v2 , . . . für H , bestehend aus Eigenvek-
toren von A.
(c) Die zugehörigen Eigenwerte λk = vk , Avk bilden eine monoton wach-
sende Folge reeller Zahlen mit lim λk = ∞.
k→∞
3 Symmetrische Operatoren mit diskretem Spektrum 683
Satz. Unter diesen Voraussetzungen ist A wesentlich selbstadjungiert und halb-

beschränkt mit unterer Schranke λ1 .
Der Abschluss A und sein Spektrum sind gegeben durch

∞
u ∈ D(A) ⇐⇒ λ2k | vk , u |2 < ∞ ,
k=1

∞
∞
Au = λk vk , u vk = vk , u Avk für u ∈ D(A) ,
k=1 k=1
σ(A) = σp (A) = {λn | n ∈ } .

Die Eigenräume Kern (A − λk ) = Kern (A − λk ) haben endliche Dimension.
Ein Operator A mit den Eigenschaften (a), (b), (c) heißt ein symmetrischer
Operator mit diskretem Spektrum.
Beweis.
Sei u ∈ D(A). Da v1 , v2 , . . . ein vollständiges ONS ist mit Avk = Avk = λk vk
und wegen der Symmetrie von A ergibt sich mit der Parsevalschen Gleichung

∞
∞
∞
Au = vk , Au vk = Avk , u vk = λk vk , u vk ,
k=1 k=1 k=1

∞
λ2k | vk , u |2 = Au2 < ∞ .
k=1

∞
Konvergiert umgekehrt λ2k | vk , u |2 , so gibt es wegen der Isomorphie von
k=1
H und 2 ein v ∈ H mit

n
v = lim sn , sn := λk vk , u vk .
n→∞ k=1

n
Für un := vk , u vk gilt dann un ∈ D(A), u = lim un und sn = Aun → v.
k=1 n→∞
Es folgt u ∈ D(A) und Au = v.

Mit der unitären Abbildung
U : H → 2 , u → ( v1 , u , v2 , u , . . .)
drückt sich dies wie folgt aus:
A = U −1 Mλ U ;
dabei ist Mλ der maximal definierte, nach 1.4 (a) selbstadjungierte Multiplikator
Mλ : (x1 , x2 , . . .) −→ (λ1 x1 , λ2 x2 , . . . )
auf 2 . Da U die Hilbertraumstruktur überträgt, ist A ebenfalls selbstadjun-

giert, und es gilt σ(A) = σ(Mλ ), σp (A) = σp (Mλ ). Aus § 23 : 5.5 (a) entnehmen

wir σ(Mλ ) = σp (Mλ ) = {λk | k ∈ }, denn wegen lim λk = ∞ ist die Menge

k→∞
{λk | k ∈ } abgeschlossen, und jedes λn kommt in der Folge (λk ) nur endlich
oft vor. Insbesondere ist dim Kern (A − λn ) = dim Kern (Mλ − λn ) endlich.
Aus der Reihendarstellung für Au folgt schließlich
u , Au ≥ λ1 u2 für u ∈ D(A). 2
Folgerungen.
(a) Unter den obengenannten Vorausetzungen ist (A − λ)−1 für λ < λ1 kom-
pakt und positiv definit.
(b) Ist umgekehrt T kompakt und positiv definit, so ist A = T −1 : Bild T → H

ein positiver, abgeschlossener Operator mit diskretem Spektrum und 0 ∈ σp (A).
Beweis.
(a) Wegen σ(A) ⊂ [λ1 , ∞[ gilt für λ < λ1 : λ ∈ (A), also T := (A − λ)−1 ∈
L (H ). Daher ist jeder Vektor u ∈ H von der Form u = (A−λ)v mit v ∈ D(A).
Für u = 0 gilt v = 0, somit
u, T u = (A − λ)v , v = v , (A − λ)v ≥ (λ1 − λ) v2 > 0 .
Wegen vk = T (A−λ)vk = (λk −λ)T vk für k = 1, 2, . . . gibt es ein vollständiges

ONS aus Eigenvektoren von T , und die zugehörigen Eigenwerte (λk − λ)−1
bilden eine Nullfolge. Daher ist T kompakt nach § 22 : 4.6.
(b) Nach § 22 : 4.6 gibt es ein vollständiges ONS v1 , v2 , . . . für H und eine
monoton fallende Nullfolge (μn ) mit T vk = μk vk (k = 1, 2, . . . ). Aus AT = ½
folgt vk = μk Avk , also Avk = λk vk mit λk := 1/μk für k = 1, 2, . . . .
Zu jedem u ∈ D(A) gibt es ein v ∈ H mit u = T v. Für u = 0 folgt v = 0 ,
also Au = AT v = v = 0 sowie
u , Au = T v , v > 0 .
Sei u = lim un mit un ∈ D(A) für n = 1, 2, . . . , und v = lim Aun existiere.

n→∞ n→∞
Da es Vektoren vn gibt mit un = T vn für n ∈ Æ, gilt
vn = Aun → v für n → ∞ und T vn = un → u für n → ∞ .
Da T stetig ist, folgt T v = u, also u ∈ D(A) und Au = v. 2

3.2 Operatoren mit diskretem Spektrum und unitäre Gruppen

Satz. Sei A ein selbstadjungierter Operator mit diskretem Spektrum, d.h. A
genüge den Bedingungen 3.1 und sei abgeschlossen. Dann besitzt das Cauchy–
Problem
(∗) ϕ̇t = − i A ϕt , ϕ0 ∈ D(A) vorgegeben
eine eindeutig bestimmte Lösung t → ϕt im Hilbertraumsinn, d.h. im Sinne

von
1
lim (ϕt+h − ϕt ) + i Aϕt = 0 .
h→0 h
Diese existiert für alle t ∈ Ê und ist gegeben durch
∞
(∗∗) ϕt = e−iλk t vk , ϕ0 vk = U (t)ϕ0 , wobei
k=1

∞
U (t)u := e−iλk t vk , u vk .
k=1
Die U (t) : H → H sind unitäre Operatoren mit der Gruppeneigenschaft
U (s + t) = U (s) U (t) = U (t) U (s) für s, t ∈ Ê, U (0) = ½,

U (t)∗ = U (−t) = U (t)−1 für t ∈ Ê .
Ferner gilt lim U (s)u = U (t)u für alle u ∈ H , t ∈ Ê.

s→t
Beweis.
(a) Eindeutigkeit. Für jede Lösung ϕt der Gleichung ϕ̇t = − i A ϕt gilt

∞
ϕt = vk , ϕt vk ∈ D(A) .
k=1
Die Differenzierbarkeit im Hilbertraumsinn hat zur Folge, dass die Fourierkoef-

fizienten ck (t) := vk , ϕt im gewöhnlichen Sinn differenzierbar sind mit
ċk (t) = vk , ϕ̇t = − i vk , Aϕt = − i Avk , ϕt = − i λk ck (t) ,
also ck (t) = ck (0) e−iλk t = vk , ϕ0 e−iλk t für k ∈ Æ. Es folgt (∗∗).
(b) Die Operatoren U (t). Wegen der Isomorphie von H und 2 folgt
∞

∞
(1) e−iλk t vk , u 2 = | vk , u |2 = u2
k=1 k=1
und somit die Konvergenz der folgenden Reihe


∞
(2) U (t) u = e−iλk t vk , u vk
k=1
sowie die Isometriebedingung U (t)u = u für alle u ∈ H . Aus der Darstel-
lung (2) folgt ferner
vk , U (s + t) u = e−iλk s e−iλk t vk , u = e−iλk s vk , U (t) u

= vk , U (s)U (t) u
für k = 1, 2, . . . und somit U (s + t) u = U (s)U (t) u für s, t ∈ . Offenbar gilt Ê

U (0) = ½. Es folgt U (−t)U (t) = U (t)U (−t) = U (0) = ½, und damit existiert
U (t)−1 = U (−t) für alle t ∈ Ê. Da U (t) unitär ist, folgt U (t)∗ = U (t)−1 ÜA .
(c) Existenz einer Lösung. Für gegebenes ϕ0 ∈ D(A) sei ϕt := U (t) ϕ0 gemäß
(2) bzw. (∗∗) definiert. Nach (1) und 3.1 konvergiert die Reihe

∞
∞
∞
λ2k e−iλk t vk , ϕ0 =
2
(3) λ2k | vk , ϕt |2 = λ2k | vk , ϕ0 |2 ,
k=1 k=1 k=1
also gilt ϕt ∈ D(A) für alle t ∈ Ê . Aus (∗∗) erhalten wir
| vk , ϕt+h − ϕt + i h Aϕt | = | vk , ϕt+h − ϕt + Avk , i h ϕt |

= | vk , ϕt+h − ϕt + ihλk ϕt | = e−iλk t e−iλk h − 1 + i λk h vk , ϕ0

= e− i λk h − 1 + i λk h · | vk , ϕ0 | = | f (λk h) | · | vk , ϕ0 |
mit f (x) = e−ix − 1 + ix. Wir setzen g(x) := f (x)/x für x = 0 und g(0) := 0 .
Dann ist g : Ê → Ê+ stetig und beschränkt ÜA , es gilt also |g(x)| ≤ C
für x ∈ Ê mit eine Konstanten C. Nach der Parsevalschen Gleichung folgt für
h = 0
2
1 1
∞
(ϕt+h − ϕt ) + iAϕt = 2 |f (λk h)|2 | vk , ϕ0 |2
h h k=1
(4)

∞
∞
= λ2k |g(λk h)|2 | vk , ϕ0 |2 ≤ C 2 λ2k | vk , ϕ0 |2 .
k=1 k=1
Die letzte Reihe liefert eine von h unabhängige Majorante für die vorletzte,
die somit aufgrund gleichmäßiger Konvergenz eine für alle h stetige, für h = 0
verschwindende Funktion darstellt. Die Behauptung ϕ̇t = −iAϕt folgt aus (4)
für h → 0.
(d) Stetigkeit von t → U (t) u. Sei u ∈ H . Wegen
(U (t + h) − U (t)) u = U (t)(U (h) − ½) u = U (h) u − u
ist nur zu zeigen, dass

∞
2
U (h) u − u2 = e−iλk h − 1 · | vk , ϕ0 |2 → 0 für h → 0 .
k=1

Das folgt wie oben aus e−ix − 1 = |f (x) − ix| ≤ (1 + C) |x| ÜA . 2
3.3 Die Schrödinger–Gleichung für ein in ]0, 1[ eingesperrtes Teilchen

Wir betrachten den durch Hu = − 12 u auf D(H) = C20 [0, 1] definierten Ope-
√
rator H. Durch vk (x) := 2 sin(πkx) für k = 1, 2, . . . ist nach § 22 : 5.1 (e) ein
vollständiges ONS für H := L2 [0, 1] gegeben mit
1
Hvk = 2 π 2 k2 vk (k = 1, 2, . . . ) ,
somit ist H ein positiv definiter Operator mit diskretem Spektrum.

Das Schrödingersche Anfangswertproblem auf ]0, 1[ × Ê,
∂ϕ(x, t) i ∂ 2 ϕ(x, t)
(1) = , ϕ(x, 0) = ϕ0 (x) ,
∂t 2 ∂x2
schreiben wir in der Form
(1 ) ϕ̇t = − i Hϕt mit ϕt (x) := ϕ(x, t) .
Die Hilbertraumlösung mit ϕ0 ∈ D(H) ist nach 3.2 gegeben durch

∞ 1 2 2
(2) ϕt = e− 2 iπ k t
vk , ϕ0 vk .
k=1
Setzen wir zusätzlich ϕ0 ∈ D(H 2 ) voraus, so gilt

1
vk , H 2 ϕ0 = H 2 vk , ϕ0 = 4 π 4 k4 vk , ϕ0 ,

also | vk , ϕ0 | ≤ ck k−4 mit ck := 4 π −4 | vk , H 2 ϕ0 | ≤ 4π −4 H 2 ϕ0 . Daher
konvergiert die Reihe

∞ 2
k2 t/2
(2 ) ϕ(x, t) = e−iπ vk , ϕ0 vk (x)
k=1
Ê
gleichmäßig auf , und die gliedweise einmal nach t bzw. zweimal nach x dif-
ferenzierte Reihe besitzen die Majorante
π 2 ck
∞

∞
√ mit |ck |2 < ∞ .
2 k=1 k2 k=1
Somit liefern (2) bzw. (2 ) eine Lösung von (1) im klassischen Sinn.
3.4 Der quantenmechanische harmonische Oszillator

(a) In der klassischen Mechanik ist die Hamilton–Funktion eines Teilchens mit
einem Freiheitsgrad, das sich unter dem Einfluss einer linear von der Ortskoordi-
nate abhängigen Rückstellkraft (Hookesches Gesetz) bewegt, nach Umskalierung
gegeben durch
1 1
h(q, p) = 2 p2 + 2 q2 .
(b) In der Quantenmechanik beschreiben wir die Zeitentwicklung der Wellen-

funktion eines Teilchens mit einem Freiheitsgrad unter dem Einfluss des Poten-
tials v(q) = 12 q 2 durch die Schrödinger–Gleichung
(∗) ϕ̇t = − iHϕt
mit dem Hamilton–Operator
1 1
H = 2 P2 + 2 Q2 ;
dabei ist P : u → −iu der Impulsoperator und Q = Mx der Ortsoperator,
vgl. § 23 : 1.1. Es gilt also
1 1
(Hu)(x) = − 2 u (x) + 2 x2 u(x).
Als Definitionsbereich für H wählen wir einfachheitshalber den Schwartzraum

S.
(c) H : S → S ist ein symmetrischer Operator mit diskretem Spektrum.

Denn für die Hermite–Funktionen hn gilt nach § 12 : 5.2

(1) −hn (x) + x2 hn (x) = (2n + 1)hn (x) , also Hhn = n + 1
2
hn
für n = 0, 1, 2, . . ., und die hn bilden ein vollständiges ONS für H = L2 ( ). Ê

Nach 3.2 ist die Hilbertraumlösung von (∗) mit vorgegebenem Anfangszustand
ϕ0 ∈ S gegeben durch

∞ 1
ϕt = e−i(n+ 2 )t hn , ϕ0 hn .
n=0
Ähnlich wie in 3.3 ergibt sich, dass wegen ϕ0 ∈ S die Reihe

∞ 1
(2) ϕ(x, t) = e−i(n+ 2 )t hn , ϕ0 hn (x)
n=0
gliedweise einmal nach t und zweimal nach x differenzierbar ist und damit die
klassische Lösung der Schrödinger–Gleichung
2
(3) i ∂ϕ(x,t)
∂t
= − 1 ∂ ϕ(x,t)
2 ∂x2
+ 1
2
x2 ϕ(x, t) , ϕ(x, 0) = ϕ0 (x)
liefert:
Beweisskizze.
Wegen ϕ0 ∈ D(H k ) für k ∈ gilt
1 k
hn , H k ϕ0 = H k hn , ϕ0 = n+ 2
hn , ϕ0 .
Daher gibt es für jedes k ∈ √ | hn , ϕ0 | ≤ ck n

eine Konstante ck mit −k
für
n = 1, 2, . . . . Es lässt sich zeigen, dass |hn (x)| ≤ 2 4 n und |hn (x)| ≤ 8(n + 1)
für n ∈ .
Daher ist die Gleichung (2) einmal gliedweise nach x differenzierbar, und die
einmal nach x abgeleitete Reihe konvergiert gleichmäßig auf ganz . Aus der Ê
Differentialgleichung der hn folgt für |x| ≤ R
√
|hn (x)| ≤ R2 + 2n + 1 |hn (x)| ≤ 2 4
n R2 + 2n + 1 ,
√
x2 |hn (x)| ≤ 2R2 4
n.
Daher lässt sich die Gleichung (2) zweimal gliedweise nach x differenzieren,
denn die zweimal gliedweise abgeleitete Reihe konvergiert gleichmäßig in jedem
kompakten Intervall. Die gliedweise Differenzierbarkeit der Reihe (2) nach t ist
unproblematisch. 2
3.5* Formen und selbstadjungierte Operatoren

(a) Sei V ein dichter Teilraum des Hilbertraums H und Q eine auf V definierte
quadratische Form, vgl. § 21 : 3.6. Diese heißt positiv, wenn Q(u, u) ≥ 0 für
alle u ∈ V . Für positive Formen Q ist durch
u, v Q = Q(u, v) + u , v
ein Skalarprodukt auf V gegeben. Die Form Q heißt abgeschlossen, wenn

(V, · , · Q ) ein Hilbertraum ist.
Ê
(b) Beispiel. Sei Ω ⊂ n ein beschränktes Gebiet, H = L2 (Ω) und V =
W01 (Ω), vgl. § 14 : 6.2 (b). Für u ∈ V liefert

Q(u, v) = ∇u , ∇v dV n
Ω
eine abgeschlossene, positiv definite quadratische Form (§ 14 : 6.2 (c)), und die
Normen
uQ = ( u , u Q)
1/2
und uV = Q(u, u)1/2
sind zueinander äquivalent (§ 14 : 6.2 (d)).

(c) Satz. Für jede positive abgeschlossene Form Q auf V ist durch
D(A) := { u ∈ V | v → Q(u, v) ist stetig auf V }

= { u ∈ V | Q(u, v) = f , v gilt für ein f ∈ H und alle v ∈ V } ,
Au := f
ein selbstadjungierter Operator A mit

Au , v = Q(u, v) für u ∈ D(A), v ∈ V
definiert.
Im Fall des Laplace–Operators für auf ∂Ω verschwindende Funktionen ist A die
in § 15 : 1.2 (c) eingeführte Fortsetzung. Nach § 15 : 1.2 (a) hat diese ein diskretes
Spektrum.
Beweis.
(i) Für u ∈ D(A) lässt sich v → Q(u, v) zu einem linearen Funktional auf H
fortsetzen; daher gibt es ein eindeutig bestimmtes f ∈ H mit Q(u, v) = f , v
für alle v ∈ V . Wir definieren A durch die Vorschrift Au := f . Dann gilt
Au , u = f , u = Q(u, u) ≥ 0 für alle u ∈ D(A),
also ist A positiv, insbesondere symmetrisch, vgl. § 21 : 3.6.

(ii) Wir zeigen, dass A + 1 surjektiv ist. Für ein gegebenes h ∈ H gilt
| h , v | ≤ h · v ≤ h · vQ , also ist v → h , v stetig auf (V, · Q ) .
Somit gibt es ein u ∈ V mit
h, v = u, v Q = u , v + Q(u, v) für alle v ∈ V .
Da v → Q(u, v) = h − u , v stetig auf H ist, folgt u ∈ D(A) und Au = h−u,

d.h. (A + 1)u = h.
(iii) Wir zeigen, dass A ein linearer Operator, d.h. dicht definiert ist. Dann ist
A selbstadjungiert nach 1.3 (d).
Erster Schritt: D(A) ist dicht in V bezüglich · Q . Angenommen, es gibt ein
v ∈ V mit u , v Q = 0 für alle u ∈ D(A). Da es ein u ∈ D(A) gibt mit
(A + 1)u = v, folgt nach Definition von A
v, v = Au + u , v = Q(u, v) + u , v = u, v Q = 0,
also v = 0 .
Zweiter Schritt: Ist also w ∈ V gegeben, so gibt eine Folge (un ) in D(A) mit
w − un Q → 0. Dann gilt auch w − un ≤ w − un Q → 0. Somit liegt D(A)
bezüglich der Norm · dicht in V und damit auch in H . 2
4 Störung wesentlich selbstadjungierter Operatoren 691
4 Störung wesentlich selbstadjungierter Operatoren

4.1 Problemstellung, Schrödinger–Operatoren
(a) Für ein Gebiet Ω des Ê n
betrachten wir das Problem
(∗) ϕ̇t = − i H ϕt , ϕ0 ∈ D(H) ,
wobei der Operator H auf D(H) ⊂ L2 (Ω) gegeben ist durch
Hu = − 21 Δu + v · u mit einer messbaren Funktion v : Ω → Ê.

Dieses Problem hat genau dann für alle ϕ0 ∈ D(H) eine eindeutig bestimmte,
für alle t ∈Ê definierte Lösung ϕt , wenn H selbstadjungiert ist. Das ergibt
sich aus dem Satz von Stone § 25 : 3.4. In diesem Fall heißt H ein Schrödinger–
Operator und (∗) die zugehörige Schrödinger–Gleichung.
1
Wir lassen im folgenden bequemlichkeitshalber den Vorfaktor 2
weg und schrei-
ben
H = A+B mit A = − Δ , B = Mv .
Dabei soll A eine selbstadjungierte Fortsetzung des Laplace–Operators sein, also

Ê
der Abschluss des auf S ( n) definierten Laplace–Operators für Ω = n (vgl. Ê
2.1 (c) (i)) oder der Abschluss des auf C20 (Ω) definierten Laplace–Operators,
vgl. 3.5*. Da reelle Multiplikatoren nach 1.4 (a) selbstadjungiert sind, werden
wir auf folgende Frage geführt:
Seien A, B selbstadjungiert. Unter welchen Voraussetzungen ist die Summe
A + B : D(A) ∩ D(B) → H , u → Au + Bu
selbstadjungiert?
(b) Als erstes erhebt sich die Frage, ob A + B ein linearer Operator, d.h. dicht
definiert ist. Ist z.B. A der Operator
Ê Ê
u → − u auf D(A) = W2 ( ) := { u ∈ W1 ( ) | u ∈ W1 ( ) } Ê
Ê
und die Funktion v ∈ L1 ( ) über kein offenes Intervall ]a, b[ quadratinte-
grierbar, so ist D(A) ∩ D(Mv ) = {0 }, denn dann ist |v u|2 für keine Funktion
Ê
0 = u ∈ W2 ( ) integrierbar ÜA . Eine solche Funktion v erhalten wir durch

∞
1 1
v(x) := ϕ(x − rk ) mit ϕ(0) = 0 , ϕ(x) = e−|x| für x = 0 ,
2k |x|
k=1
wenn die rk alle rationalen Zahlen durchlaufen ( ÜA , Satz von Beppo Levi).
(c) Der Definitionsbereich von A + B ist sicher dann dicht in H , wenn D(A) ⊂
D(B) gilt. Auch dann folgt aus der Selbstadjungiertheit von A, B nicht die
Selbstadjungiertheit von A + B. Ein Gegenbeispiel wird in 4.3, Bemerkung (iii)
gegeben.
(d) Da wir in der Regel die Bestimmung des Abschlusses wesentlich selbst-
adjungierter Operatoren vermeiden wollen, ist folgendes Problem von großer
praktischer Bedeutung:
Seien A, B wesentlich selbstadjungiert mit D(A) ⊂ D(B). Gesucht sind hinrei-
chende Kriterien für die wesentliche Selbstadjungiertheit von A + B.
4.2 Kleine Störungen

(a) Seien A, B symmetrische Operatoren mit D(A) ⊂ D(B). Der Operator B
heißt A–beschränkt, wenn es Zahlen a, b ∈ + gibt mit Ê
(∗) Bu ≤ a Au + b u für alle u ∈ D(A) .
Lässt sich dabei a < 1 wählen, so heißt B eine kleine Störung von A.
Gibt es zu jedem a ∈ ]0, 1] ein b ≥ 0 mit (∗), so heißt B eine unendlich kleine
Störung von A.
(b) Genau dann ist ein symmetrischer Operator B eine kleine Störung des
symmetrischen Operators A mit D(A) ⊂ D(B), wenn es Konstanten α, β gibt
mit
(∗∗) 0 ≤ α < 1 , β ≥ 0 , Bu2 ≤ α Au2 + β u2 für alle u ∈ D(A) .
Aus √
(∗) folgt (∗∗) mit α = β und geeignetem β > b. Aus (∗∗) folgt (∗) mit
a = α und geeignetem b ÜA .
(c) Beispiele. (i) Ist A symmetrisch und B beschränkt und symmetrisch, so

ist B eine unendlich kleine Störung von A (a = 0 bzw. α = 0).

(ii) Für u ∈ D(A) = u ∈ W01 [a, b] | u ∈ W1 [a, b] sei Au = −u , und für
u ∈ D(B) = W01 [a, b] sei Bu = −iu . Dann ist B eine unendlich kleine Störung
von A: Denn A ist selbstadjungiert, B ist symmetrisch mit D(A) ⊂ D(B), und
für u ∈ D(A) gilt
b b
u , Au = − u u dλ = |u |2 dλ = Bu2 ,
a a
also
1
2
Bu2 = u , Au ≤ Au · u ≤ α Au + u
2α
für beliebige α ∈ ]0, 1[.
4.3 Der Satz von Kato–Rellich

Für jede kleine symmetrische Störung B eines selbstadjungierten Operators A
ist die Summe A + B : D(A) → H selbstadjungiert.
Bemerkungen. (i) B muß weder selbstadjungiert noch abgeschlossen sein.

(ii) Der Satz geht auf Rellich (1939) zurück. Eine Reihe von Verallgemei-
nerungen und Anwendungen wurden von Kato [128] 1966 angegeben; Anwen-
dungsbeispiele folgen in 4.5, 4.6.
(iii) Für die in 4.2 zuletzt angegebenen Operatoren A, B ist demnach
C := −A + B : D(A) → L2 [a, b] , u → u − iu
selbstadjungiert, denn nach 1.4 (a) sind A und damit auch −A selbstadjungiert.
Dies Beispiel zeigt auch, dass die Summe zweier selbstadjungierter Operatoren
i.A. nicht selbstadjungiert ist: B = A + C : D(A) → L2 [a, b], u → −iu ist nach
§ 23 : 3.2 (a), 4.3 (a) weder abgeschlossen noch wesentlich selbstadjungiert.
Beweis.
(a) Da A + B symmetrisch ist, genügt es nach 1.3 (d) zu zeigen, dass es ein
t > 0 gibt, so dass A+B +it, A+B −it surjektiv sind. Wir betrachten zunächst
A + B + it für t > 0. Da A selbstadjungiert ist, ist A + it stetig invertierbar.
Aus der Gleichung
(A + it)u2 = Au2 + t2 u2 für u ∈ D(A)
folgt

(1) (A + it)−1 ≤ 1 und
t
(2) Au ≤ (A + it)u für u ∈ D(A) .
Zu gegebenem v ∈ H gibt es genau ein u ∈ D(A) mit v = (A + it)u. Aus (2)

folgt

(3) A(A + it)−1 v = Au ≤ (A + it)u = v .
Daher ist A(A + it)−1 beschränkt mit Normschranke 1.
(b) Für den symmetrischen Operator B gibt es nach Voraussetzung Zahlen a, b

mit 0 ≤ a < 1, b ≥ 0 und Bu ≤ a Au + b u für u ∈ D(A). Für v ∈ H
gilt (A + it)−1 v ∈ D(A) ⊂ D(B). Daher folgt mit (3) und (1)

(4) B(A + it)−1 v ≤ a A(A + it)−1 v + b (A + it)−1 v ≤ a + b v .
t
Somit ist ½ + B(A + it) −1
für a + b/t < 1 stetig invertierbar (§ 21 : 6.1).
(c) Ist also v ∈ H vorgegeben, so gibt es ein w ∈ H mit

v = w + B(A + it)−1 w .
Da A + it surjektiv ist, gibt es ein u ∈ D(A) mit w = (A + it)u, also
v = (½ + B(A + it)−1 )(A + it)u = (A + it + B)u .
(d) Die Surjektivität von A − it + B folgt wie oben, indem überall A + it durch
A − it ersetzt wird. 2
4.4 Kriterien für die wesentliche Selbstadjungiertheit

Satz. (a) Für jede kleine symmetrische Störung B eines wesentlich selbstad-
jungierten Operators A ist A + B wesentlich selbstadjungiert.
(b) Es gilt dann
D(A + B) = D(A) ⊂ D(B) und A + B = A + B.
Im Fall D(A) ⊂ D(B) gilt darüberhinaus A + B = A + B.

Bemerkung. Die Aussage (b) gilt für jede kleine symmetrische Störung B eines
beliebigen symmetrischen Operators A, wie der folgende Beweis zeigt.
(c) Satz von Wüst (1971). Sei A selbstadjungiert und B ein symmetrischer
Operator mit D(A) ⊂ D(B). Gibt es eine Zahl b ≥ 0 mit
Bu ≤ Au + bu für alle u ∈ D(A) ,
so ist A + B wesentlich selbstadjungiert auf jedem Genbereich für A.
Den Beweis von (c) finden Sie in Reed-Simon [130, II] Thm.X.14.
Beweis.
(b) Nach Voraussetzung ist D(A) ⊂ D(B), und es gibt Zahlen a, b mit a < 1,
Ê
b ∈ + und
(1) Bu ≤ a Au + b u für u ∈ D(A).
Für u ∈ D(A + B) := D(A) folgt
Au = (A + B)u − Bu ≤ (A + B)u + a Au + b u , also
1 b
(2) Au ≤ (A + B)u + u .
1−a 1−a
Mit A, B ist auch A + B symmetrisch, also abschließbar. Wir zeigen zunächst

D(A) ⊂ D(B) , D(A) ⊂ D(A + B) und
(i)
(A + B)u = Au + Bu für u ∈ D(A).
Sei u ∈ D(A), also u = lim un und Au = lim Aun mit einer Folge (un ) in
n→∞ n→∞
D(A). Nach (1), angewandt auf um − un , ist (Bun ) eine Cauchy–Folge, somit
gilt u ∈ D(B), Bu = lim Bun . Da lim (Aun + Bun ) = Au + Bu existiert,
n→∞ n→∞
folgt u ∈ D(A + B) und (A + B)u = Au + Bu.
Im Fall D(A) ⊂ D(B) gilt zusätzlich u ∈ D(B), also Bu = Bu und somit
(A + B)u = Au + Bu.
(ii) Die Inklusion D(A + B) ⊂ D(A) ergibt sich analog mit Hilfe von (2): Für
u ∈ D(A + B) gibt es eine Folge (un ) in D(A + B) = D(A) mit un → u
und Aun + Bun → (A + B)u. Aus (2) folgt, dass die Folge (Aun ) konvergiert,
somit u ∈ D(A). Dann konvergiert auch die Folge (Bun ), und wir erhalten
(A + B)u = lim (Aun + Bun ) = Au + Bu; im Fall D(A) ⊂ D(B) wieder
n→∞
Bu = Bu.
(a) Ist A wesentlich selbstadjungiert und B eine symmetrische Störung mit (1),
so gilt also D(A + B) = D(A) ⊂ D(B), A + B = A + B.
Für u ∈ D(A), u = lim un , Au = lim Aun mit un ∈ D(A) folgt aus den
n→∞ n→∞
Überlegungen (i), dass u ∈ D(B) und Bu = lim Bun . Aus (1) erhalten wir
n→∞
Bu ≤ a Au + b u .
Somit ist B eine kleine symmetrische Störung von A, und die Behauptung folgt
aus 4.3. 2
(d) Folgerung. Ist A abgeschlossen und B eine kleine Störung von A, so ist
A + B mit dem Definitionsbereich D(A) abgeschlossen.
Denn im Beweisteil (b) wurde von der Symmetrie kein Gebrauch gemacht, und
wegen der Voraussetzung D(A) = D(A) ⊂ D(B) folgt A + B = A+B = A+B.
4.5 Anwendung auf Hu = − u + v · u

Ê Ê Ê Ê
Sei v ∈ L2 ( ) + L∞ ( ), d.h. v = f + g mit f ∈ L2 ( ) und g ∈ L∞ ( ). Dann
ist der Operator
− Δ + Mv : u → − u + v · u mit Definitionsbereich S
wesentlich selbstadjungiert, und sein Abschluss
H : u → − u + v · u mit Definitionsbereich W2 ( ) Ê

ist ein Schrödinger–Operator.
Ê Ê Ê
Hierbei ist W2 ( ) = {u ∈ W1 ( ) | u ∈ W1 ( )} = D(P 2 ).
Beispiel. Durch v(x) = |x|−1/4 für x = 0 ist ein Potential gegeben, das über
[−1, 1] quadratintegrierbar und für |x| ≥ 1 beschränkt ist. Daher erfüllt v die
Voraussetzung des Satzes mit f := v χ[−1,1] , g = v − f .
Beweis.
(a) Es gilt − Δ + Mv = A + B mit A = − Δ + Mf und dem beschränkten
Operator B = Mg . Falls A wesentlich selbstadjungiert ist, gilt dies auch für
A+B, denn B ist eine (nach 4.2 (c) unendlich) kleine Störung von A mit D(A) ⊂
Ê
D(B) = L2 ( ), somit folgen die wesentliche Selbstadjungiertheit von A+B und
die Beziehung A + B = A + B aus 4.4. Wir dürfen daher g ignorieren und von
Ê
vornherein v = f ∈ L2 := L2 ( ) annehmen.
(b) Nach 2.1 (c) (i) ist der auf S definierte Operator − Δ wesentlich selbstad-
jungiert.
(c) Wir zeigen zunächst, dass D(−Δ) ⊂ D(Mv ). Hierzu genügt es wegen v ∈
L2 zu zeigen, dass alle Funktionen u ∈ D(−Δ) beschränkt sind.
Für u ∈ S gilt
x
(1) | u(x) |2 = u(x) u(x) = (u u + u u) dλ ≤ 2 u · u .
−∞
Ferner folgt für u ∈ S durch partielle Integration u , −u = u , u , also
(2) u 2 ≤ u · u .
Aus (1) und (2) ergibt sich

(
2 u2 , falls u ≤ u ,
(3) u2∞ ≤ 2 u3/2 · u 1/2 ≤
2 u · u sonst.
In jedem Fall gilt

u2∞ ≤ 2 u2 + u 2 = 2 u2Δ für u ∈ S .
Für u ∈ D(−Δ) gibt es schnellfallende Funktionen un mit u − un Δ → 0. Es

folgt u − un ∞ → 0, also
√ √
u∞ = lim un ∞ ≤ 2 lim un Δ = 2 uΔ .
n→∞ n→∞
(d) Mv ist eine unendlich kleine Störung von −Δ. Denn für u ∈ S und jede
Zahl a ∈ ]0, 1[ folgt aus (3) durch Fallunterscheidung ÜA
a 2
2
u v2 ≤ u2∞ · v2 ≤ u + u v2 . 2
2 a
4.6 Beispiele für Schrödinger–Operatoren auf L2 ( Ê)

3
Satz (Kato 1951). Der auf S ( Ê ) definierte Operator

3
− Δ + Mv : u → − Δu + v · u
ist für jedes Potential v ∈ L2 ( Ê ) + L (Ê )

3 ∞ 3
wesentlich selbstadjungiert.
Das wichtigste Beispiel ist das durch

v(x) := 1/x für x = 0, v(0) = 0
gegebene Coulomb–Potential: Mit der charakteristischen Funktion ϕ der Ein-
heitskugel K1 (0) und mit f := v · ϕ, g := v · (1 − ϕ) gilt
v = f + g , wobei g ∈ L∞ ( Ê)
3
und f ∈ L2 ( Ê ),3
f 2 = 4π 2 ,
vgl. Bd. 1, § 23 : 8.3.
Beweis.
(a) Es genügt, den Operator − Δ + Mv mit v ∈ L2 ( Ê ) zu betrachten, wie am
3
Beginn des Beweises 4.5 dargelegt wurde.

Ê
(b) Nach 2.1 (c) (i) ist der auf S ( 3 ) definierte Laplace–Operator wesentlich
Ê
selbstadjungiert. Ferner gilt S ( 3 ) ⊂ D(Mv ), denn für u ∈ S gilt
|u · v| ≤ u∞ |v| , somit u · v ∈ L2 := L2 ( Ê ).3
(c) Für r(x) := x gehört (1 + r 2 )−1 zu L2 (§ 20 : 7.3). Wir setzen

(1) K := (2π)−3/2 , L := (1 + r 2 )−1 = (1 + r 2 )−1 L2 .
(d) Sei ϕ ∈ S := S ( Ê ). Nach § 12 : 3.4 gilt

3

ϕ(x) = K /(y) ei x , y d3 y .
ϕ
Ê3
Es folgt

(2) /1 = K
ϕ∞ ≤ K ϕ /| dV 3 .
|ϕ
Ê3
/ ∈ S ⊂ L2 folgt mit der Cauchy–Schwarzschen Ungleichung
Wegen (1 + r 2 ) ϕ

(3) /1 =
ϕ /| dV 3 ≤ L (1 + r2 ) ϕ
(1 + r 2 )−1 (1 + r 2 ) |ϕ / .
Ê3
Nach dem Multiplikations– und Ableitungssatz § 12 : 3.3 gilt
/= ϕ
(1 + r 2 ) ϕ : = (ϕ − Δϕ) /.
/ − Δϕ
Wegen der Isometrie der Fouriertransformation ist also

(4) (1 + r2 ) ϕ
/ = ϕ − Δϕ ≤ ϕ + Δϕ .
Aus (2), (3), (4) erhalten wir somit für ϕ ∈ S mit der Graphennorm . Δ
√ 1 √
(5) ϕ∞ ≤ KL (ϕ + Δϕ) ≤ 2KL(ϕ2 + Δϕ2 ) 2 = 2 KL ϕΔ .
Für u ∈ D(−Δ) gibt es Funktionen ϕn aus S mit u − ϕn Δ → 0 . Es folgt

√
u − ϕn ∞ → 0 , also mit C := ( 2KL)1/2
(5 ) u∞ ≤ lim ϕn ∞ ≤ C lim ϕn Δ = C uΔ .

n→∞ n→∞
Also gilt D(−Δ) ⊂ D(Mv ), denn u v ∈ L2 für u ∈ D(−Δ).

(e) Wir zeigen abschließend, dass Mv eine unendlich kleine Störung von − Δ
ist. Sei u ∈ S = D(−Δ) und ϕt (y) := t3 u /(ty) mit t > 0. Wegen ϕt ∈ L1 ( 3 ) Ê
folgt aus dem Transformationssatz für Integrale ÜA
/1 , ϕt = t3/2 u
ϕt 1 = u / = t3/2 u
und
r 2 ϕt = t−1/2 r 2 u
/ = t−1/2 Δu
;
wegen Δ /.
u = − r2 u
Aus (3) ergibt sich also, da ϕt eine Fouriertransformierte ist,

(6) /1 = ϕt 1 ≤ L ϕt + r2 ϕt = L t−1/2 Δu + t3/2 u .
u
Aus (2) mit u statt ϕ erhalten wir schließlich
v · u ≤ u∞ · v ≤ at Δu + bt u
mit at := K Lv t−1/2 und bt ∈ Ê +. Hierbei kann at beliebig klein gewählt

werden. 2
4.7 Weitere Störungssätze

Ê Ê
Die Potentiale v ∈ L2 ( 3 ) + L∞ ( 3) sind nicht die einzigen, welche Schrödin-
ger–Operatoren liefern. Für das Studium von Wechselwirkungspotentialen und
Ê
von Schrödinger–Operatoren im n sind eine ganze Reihe weiterer Störungssätze
entwickelt worden. Wir verweisen hierzu auf Reed-Simon [130, II] Ch. X.2 und
Kato [128].
699
§ 25 Der Spektralsatz und der Satz von Stone

1 Spektralzerlegung und Funktionalkalkül selbstadjungierter
Operatoren
1.1 Übersicht
In § 22 wurde der Spektralsatz für beschränkte symmetrische
Operatoren T
in drei Versionen formuliert:
Spektralzerlegung T = λ dE λ , Erwartungswert–
Formel u , f (T )u = f dμu und Multiplikatordarstellung T = U −1 Mv U .
Grundlage dafür war der zuvor entwickelte Funktionalkalkül.
In diesem Abschnitt werden entsprechende Ergebnisse für unbeschränkte selbst-
adjungierte Operatoren A auf einem Hilbertraum H gewonnen, doch in anderer
Reihenfolge. Ausgangspunkt ist eine Multiplikatordarstellung für A, deren Exi-
stenz sich im Fall σ(A) = Ê relativ einfach beweisen lässt. Für Multiplikatoren
Mv bietet sich die im folgenden entwickelte Methode der Zurückführung auf
spektrale Teilräume in natürlicher und anschaulicher Weise an. Wir schildern
zunächst Vorgehen und Ergebnisse; die Beweise werden dann in Abschnitt 2
zusammengefasst.
Ein Ziel dieses Paragraphen ist die Begründung des Funktionalkalküls und
dessen wahrscheinlichkeitstheoretische Deutung durch den Spektralsatz. Der
Kalkül des Einsetzens von A in Funktionen gestattet die Übertragung von
Lösungsformeln für gewöhnliche Differentialgleichungen auf partielle. Insbeson-
dere sichert er die Existenz und Eindeutigkeit einer für alle t ∈ Ê definierten
Hilbertraumlösung des Cauchy–Problems ϕ̇t = −iAϕt , ϕ0 ∈ D(A) in der Form
ϕt = e−iAt ϕ0 , was die entscheidende Eigenschaft ist, welche die selbstadjungier-
ten Operatoren A vor den symmetrischen auszeichnet. Dies besagt der Satz 3.4
von Stone.
Am Ende dieses Paragraphen diskutieren wir einige Konsequenzen der Hilber-
traumtheorie für die physikalische Interpretation: Verteilung der Messwerte,
Heisenbergsche Unschärferelation, die Rolle des Spektrums als Menge der mögli-
chen Messwerte einer Observablen A und die Bedeutung der Vertauschbarkeit
von Observablen.
1.2 Multiplikatordarstellung selbstadjungierter Operatoren

(a) Ist A ein selbstadjungierter Operator auf einem Hilbertraum H , so gibt es
Ê
ein Wahrscheinlichkeitsmaß μ auf , eine messbare Funktion v : → Ê Ê und
Ê
eine unitäre Abbildung U : H → L2 ( , μ) mit
A = U −1 Mv U .
Die Funktion v kann dabei so gewählt werden, dass ihr Wertevorrat v( ) im Ê

Spektrum von A liegt und die Menge ihrer Unstetigkeitsstellen in einer diskreten
μ–Nullmenge N = {nδ | n ∈ } mit δ > 0.
700 § 25 Der Spektralsatz und der Satz von Stone
Beweis.
Wir betrachten zunächst nur den am meisten interessierenden Fall σ(A) = , Ê
der z.B. bei halbbeschränkten Operatoren vorliegt. Wir können dann ∈ so Ê
wählen, dass die Resolvente R( , A) existiert und wegen ∈ Êsymmetrisch
ist. Nach § 22 : 3.6 gibt es ein Wahrscheinlichkeitsmaß μ auf Ê
, eine stetige,
Ê
periodische Sägezahnfunktion w : → σ(R( , A)) und eine unitäre Abbildung
Ê
U : H → L2 ( , μ) mit
R( , A) = U −1 Mw U .
Da 0 kein Eigenwert von R( , A) ist, gilt für die äquidistante Nullstellenmenge

N von w nach § 21 : 5.3 (b) μ(N ) = μ({w = 0}) = 0. Wir setzen
⎧
⎨ − 1
falls w(x) = 0 ,
v(x) := w(x)
⎩
ν für x ∈ N
mit einer beliebigen Zahl ν ∈ σ(Mv ).

Mit dem Operator Mv ist auch der Operator
B := U −1 Mv U
selbstadjungiert, was sich z.B. aus dem Kriterium § 24 : 1.3 (c) ergibt.
Wir zeigen A = B. Da selbstadjungierte Operatoren maximal symmetrisch sind
(§ 23 : 1.2), genügt hierzu der Nachweis von A ⊂ B.
Sei u ∈ D(A). Dann gibt es ein h ∈ H mit u = R( , A)h. Für f := U u und
g := U h gilt f = w · g ∈ D(Mv ), somit u ∈ D(B) und
( − B)u = U −1 (( − v)f ) = U −1 g = h = ( − A)u . 2
Für Operatoren A mit σ(A) = Ê wird der Beweis in 2.6 nachgetragen.

(b) Die unitäre Äquivalenz A = U −1 Mv U gestattet es, die Spektralzerlegung
und den Spektralsatz in anschaulicher Weise auf die Analyse unbeschränkter
Multiplikatoren zurückzuführen. Aus den Ergebnissen von § 23 : 5.5 über deren
Spektrum und den allgemeinen Ausführungen § 9 : 1.3 über unitäre Äquivalenz
ergibt sich z.B. ÜA

σ(A) = σ(Mv ) = Ê μ({|v − λ| < ε}) > 0
λ∈ für alle ε > 0 ,

σ (A) = σ (M ) = λ ∈ Ê μ({v = λ}) > 0 ,
p p v
σc (A) = σc (Mv ).
Nach § 23 : 5.5 (b) dürfen wir v(x) ∈ σ(Mv ) = σ(A) für alle x ∈ Ê annehmen.
1 Spektralzerlegung und Funktionalkalkül 701
1.3 Einschränkung auf spektrale Teilräume

(a) Aus dem Vorangehenden ergibt sich, dass das Spektrum eines unbeschränk-
ten selbstadjungierten Operators A nichtleer und unbeschränkt ist. In der Quan-
tenmechanik wird das Spektrum von A als die Menge der möglichen Messwerte
für die durch A beschriebene Observable gedeutet, Näheres hierzu in 4.4.
Registrieren wir nur die in ein Intervall I = ]a, b] fallenden Werte, so ist dadurch
eine neue Observable definiert.
Diese ergibt sich in naheliegender Wei-
se aus einer Multiplikatordarstellung v
A = U −1 Mv U gemäß 1.2. Da σ(A) = b
σ(Mv ) der essentielle Wertevorrat von
v ist, können wir die nicht ins Intervall
I fallenden Werte wie folgt ausblenden.
Wir betrachten die μ–messbare Menge a
S := {a < v ≤ b} = v −1 (]a, b])

und w := χS = χI ◦ v. Durch
Ê
P f := w · f für f ∈ L2 ( , μ) x
ist ein symmetrischer Multiplikator P mit P 2 = P definiert. Daher vermittelt P

Ê
die orthogonale Projektion auf einen abgeschlossenen Teilraum VI von L2 ( , μ).
Dieser Teilraum wird durch Mv in sich übergeführt: Für g = f · χS ∈ VI gilt
Ê
|v · g| ≤ c |f | mit c := max{|a|, |b|}, also v · g ∈ L2 ( , μ) und damit g ∈ D(Mv )
Ê
sowie v · g = v · g · χS ∈ VI . Dem Teilraum VI von L2 ( , μ) entspricht in H
der spektrale Teilraum
H I := U −1 (VI ) .
H I ist abgeschlossen und A–invariant, d.h. H I ⊂ D(A) und A(H I ) ⊂ H I .
Der orthogonale Projektor PI mit H I = PI (H ) heißt der zu I gehörige Spek-
tralprojektor.
(b) Satz. Sei A ein selbstadjungierter Operator auf dem Hilbertraum H . Dann
sind für jedes beschränkte Intervall I = ]a, b] ein Spektralprojektor PI und ein
spektraler Teilraum H I definiert mit folgenden Eigenschaften:
(i) H I ist A–invariant; H I = {0}, falls σ(A) ∩ I = ∅.
(ii) Im Fall H I = {0} ist die Einschränkung AI von A auf H I ein beschränk-
ter symmetrischer Operator auf H I mit
σ(AI ) = σ(A) ∩ [a, b] , σp (AI ) = σp (A) ∩ ]a, b] .
(iii) Für jede Multiplikatordarstellung A = U −1 Mv U von A gilt
PI = U −1 Mw U mit w = χI ◦ v .
(iv) Jeder A–invariante Teilraum liegt in einem spektralen Teilraum H I .
Die Aussage (i) ergibt sich aus (a), die anderen anschaulich plausiblen Behaup-
tungen werden in 2.1, 2.2 bewiesen. Beachten Sie, dass die H I , PI nach (iii)
wohldefiniert sind, d.h. nicht von der Multiplikatordarstellung abhängen.
1.4 Der Spektralzerlegungssatz
(a) Jeder unbeschränkte selbstadjungierte Operator A lässt sich auf folgende
Weise aus beschränkten symmetrischen Anteilen aufbauen:
7
Für n ∈ seien In = ]αn , αn+1 ] nichtleere Intervalle mit n∈
In = , z.B.
In = ]n, n + 1]. Wir betrachten die für die In gemäß 1.3 definierten Spektralpro-
jektoren Pn = PIn und die zugehörigen spektralen Teilräume H n = Pn (H ).
Dann gilt
@
+∞
H = Hn ,
n=−∞
d.h. die H n sind paarweise zueinander orthogonal, und jeder Vektor u ∈ H
besitzt eine eindeutige Darstellung

+∞
u = un mit un := Pn u ∈ H n .
n=−∞
Wegen der A–Invarianz der H n vertauscht A mit allen Spektralprojektoren:

Pn APn = APn und Pn Au = APn u für u ∈ D(A). Es gilt

+∞
u ∈ D(A) ⇐⇒ APn u2 < ∞ ,
n=−∞

+∞
Au = APn u für u ∈ D(A) .
n=−∞
Für jedes Intervall In mit σ(A) ∩ In = ∅ ist die Einschränkung An von A auf
H n ein beschränkter symmetrischer Operator mit
σ(An ) = σ(A) ∩ In , σp (An ) = σp (A) ∩ In .
Der mit Hilfe einer Multiplikatordarstellung leicht zu führende Beweis wird in

2.3 gegeben.
Aus der A–Invarianz der H n folgt für u ∈ H n , dass Ak u für k = 1, 2, . . .

definiert ist und wieder zu H n gehört.
(b) Satz. Durch

+∞
Ak = Ak Pn , d.h.
n=−∞

+∞
u ∈ D(Ak ) ⇐⇒ Ak Pn u2 < ∞ ,
n=−∞
+∞
Ak u = Ak Pn u für u ∈ D(Ak ) ,
n=−∞
sind selbstadjungierte Operatoren Ak (k = 1, 2, . . .) gegeben.

Die Selbstadjungiertheit der Operatoren Ak folgt aus einer Multiplikatordarstel-

lung A = U −1 Mv U wegen Ak = U −1 Mvk U oder ergibt sich aus dem folgenden
Lemma (c). Der Rest folgt aus (a).
(c) Damit steht einer Definition des selbstadjungierten Operators p(A) für re-
elle Polynome p nichts mehr im Wege. Für die Definition eines allgemeinen
Funktionalkalküls in 1.5 benötigen wir das folgende
Lemma. Auf jedem spektralen Teilraum H n = {0} sei ein beschränkter symme-
trischer Operator Bn : H n → H n gegeben. Dann ist durch

u ∈ D(B) : ⇐⇒ Bn Pn u2 < ∞ , Bu := Bn Pn u für u ∈ D(B)
n∈ n∈
(Summation nur über die n ∈ mit H n = {0}) ein selbstadjungierter Operator

B definiert.
Beweis.
Es ist leicht zu sehen, dass B symmetrisch ist. Wir wenden das Kriterium
§ 24 : 1.3 (c) an.

Sei v = vn ∈ H mit vn = Pn v. Wegen i ∈ σ(Bn ) gibt es im Fall H n = {0}
n∈
Vektoren un ∈ H n mit (Bn − i)un = vn . Im Fall H n = {0} setzen wir un = 0.
Wegen vn 2 = (Bn − i)un 2 = Bn un 2 + un 2 konvergieren die Reihen

un 2 , u := un , Bn un 2 , Bn un = iu + v.
n∈ n∈ Hn ={0} Hn ={0}
Somit gilt u ∈ D(B) und (B − i)u = v. Analog folgt die Surjektivität von B + i.
2
1.5 Der Funktionalkalkül
(a) Definition. Sei A ein unbeschränkter selbstadjungierter Operator, ferner
sei f : → stetig oder gehöre zur Klasse F aller Funktionen f : → + , die
punktweiser Limes einer absteigenden Folge beschränkter stetiger Funktionen
fn : → + sind 7 (vgl. § 21 : 9.2). Wie in 1.4 seien In = ]αn , αn+1 ] beschränkte
Intervalle mit n∈ In = , Pn die nach 1.3 für die Intervalle In definierten
Spektralprojektionen und H n = Bild Pn die zugehörigen spektralen Teilräume.
Für H n = {0} ist die Einschränkung An von A auf H n beschränkt und sym-
metrisch, also ist f (An ) für f ∈ C() nach § 21 : 7.3 bzw. für f ∈ F nach
§ 21 : 9.2 erklärt. Wir definieren f (A) durch

u ∈ D(f (A)) : ⇐⇒ f (An )Pn u2 < ∞ und
n∈

f (A)u = f (An )Pn u für u ∈ D(A) ;
n∈
dabei ist nur über die n ∈ mit σ(A) ∩ In = ∅ zu summieren.

Nach 1.4 (c) ist f (A) selbstadjungiert, falls f reellwertig ist.
(b) Satz. Für stetige Funktionen f : Ê→ bzw. für f ∈ F und jede Multi-
plikatordarstellung A = U −1 Mv U von A ist
f (A) = U −1 Mf ◦v U .
Daher ist f (A) abgeschlossen für unbeschränkte stetige Funktionen f : →

und beschränkt für beschränkte Funktionen f ∈ C() bzw. für f ∈ F.
Den Beweis von (b) führen wir in 2.4 (b). Auf den Spezialfall f = eλ = χ]−∞,λ]
gehen wir in 1.7 ein.
(c) Zu jeder messbaren Funktion f : → gibt es einen abgeschlossenen

Operator f (A) mit der Eigenschaft
f (A) = U −1 Mf ◦v U für jede Multiplikatordarstellung A = U −1 Mv U .
Der Beweis folgt als Anmerkung zum Beweis des Spektralsatzes in 1.8.
1.6 Eigenschaften des Funktionalkalküls für beschränkte stetige

Funktionen
Mit Cb () bezeichnen wir den Vektorraum der beschränkten stetigen Funktio-
nen f : → . Für f ∈ Cb () gilt
(a) f (A) ∈ L (H ), f (A) = f ∞ := sup{|f (λ)| | λ ∈ σ(A)},
∗
(b) f (A) = f (A),
(c) f (A) ≥ 0, falls f (λ) ≥ 0 für λ ∈ σ(A).
Für f, g ∈ Cb () ergibt sich
(d) (αf + βg)(A) = αf (A) + βg(A),
(e) (f g)(A) = f (A) g(A ) = g(A)f (A).
Dies folgt unmittelbar aus 1.5 (b) und den entsprechenden Eigenschaften von
Multiplikatoren ÜA .
1.7 Spektralschar und Spektralmaß

(a) Nach 1.5 ist für einen selbstadjungierten Operator A und f ∈ F ein be-
schränkter symmetrischer Operator f (A) ≥ 0 erklärt mit f (A) = U −1 Mf ◦v U
für jede Multiplikatordarstellung A = U −1 Mv U . Aus der Multiplikatordarstel-
lung folgt unmittelbar für f, g ∈ F:
(f g)(A) = f (A)g(A) = g(A)f (A) ,
f (A) − g(A) ≤ f − g∞ ,
f ≤ g =⇒ f (A) ≤ g(A) .
(b) Wir definieren die Spektralschar {Eλ | λ ∈ Ê} von A durch

Eλ = eλ (A) mit eλ = χ]−∞,λ] ∈ F .
Die Einschränkung von Eλ auf einen spektralen Teilraum H I = {0} mit einem
Intervall I = ]αn , αn+1 ] ist nach 1.5 (a) die Spektralschar der Einschränkung
AI von A auf H I .
Satz. Die Eλ sind symmetrische Projektoren mit folgenden Eigenschaften:
(i) λ ≤ μ =⇒ Eλ ≤ Eμ und Eλ = Eλ Eμ = Eμ Eλ .
(ii) Eλ = s–lim Eμ ; ferner existiert Eλ− := s–lim Eμ .
μ→λ+ μ→λ−
(iii) s–lim Eλ = 0 , s–lim Eλ = .

λ→−∞ λ→∞
(iv) Eλ = U −1 Meλ ◦v U für jede Multiplikatordarstellung A = U −1 Mv U .

(v) Für jedes Intervall I = ]a, b] ist Eb − Ea der Projektor PI auf den spek-
tralen Teilraum H I .
Der Beweis wird in 2.5 gegeben.
(c) Spektralmaße. Für u = 1 ist wegen der Eigenschaften (i), (ii), (iii) der
Spektralschar durch
F (λ) = u , Eλ u = Eλ u2
eine Verteilungsfunktion F gegeben. Das nach § 19 : 9.3 durch F bestimmte
Wahrscheinlichkeitsmaß auf bezeichnen wir mit μu . In der Quantenmecha-
nik liefert μu die Verteilung der Messwerte der durch A beschriebenen Obser-
vablen A für ein System im Zustand | u u |.
Für einen selbstadjungierten Multiplikator Mv auf L2 (, μ) gilt

μu (B) = |u|2 dμ
v −1 (B)
für jede Borelmenge B, vgl. § 22 : 2.3.
1.8 Spektralsatz und Erwartungswerte

(a) Der Spektralsatz. Seien A ein selbstadjungierter Operator auf einem se-
parablen Hilbertraum H , f : → stetig und u = 1. Dann gilt

u ∈ D(f (A)) ⇐⇒ |f |2 dμu < ∞ und
Ê

u , f (A)u = f dμu für u ∈ D(f (A)) .
Ê
Hierbei ist μu das zu u gehörige Spektralmaß bezüglich A, vgl. 1.7 (c).
Durch die obengenannten Eigenschaften ist dieses und damit die Spektralschar
eindeutig bestimmt.
(b) Für u ∈ D(A) existieren insbesondere Erwartungswert und Varianz von

μu ,

/u =
E(μu ) = μ x dμu (x) = u , Au ,
Ê

V (μu ) = /u )2 dμu (x) = (A − μ
(x − μ /u )u2 .
Ê
(c) Aus (a) ergibt sich folgende Deutung des Funktionalkalküls für die Quan-
tenmechanik: Beschreibt A eine Observable, so beschreibt f (A) die durch Trans-
formation x → f (x) der Messwerte x für A hervorgehende Observable. Dies
wurde bereits in § 22 : 1.4 begründet.
Beweis.
(i) Der einfachste Beweis beruht auf dem Transformationssatz für Bildmaße
§ 20 : 6.4. Da nach Definition des Funktionalkalküls u , f (A)u invariant unter
unitären Transformationen ist, dürfen wir annehmen, dass A ein Multiplikator
Ê
Mv auf einem L2 ( , μ) ist. Nach 1.7 (c) gilt dann für u = 1 und I = ]a, b]

μu (I) = u , (χI ◦ v) · u = |u|2 dμ .
v −1 (I)

Für das durch ν(B) = |u|2 dμ gegebene Wahrscheinlichkeitsmaß ν ist also
B
μu (I) = ν(v −1 (I)). Wie in § 22 : 2.3 ergibt sich mit Hilfe des Fortsetzungssatzes
§ 19 : 7.2, dass μu das Bildmaß von ν unter v ist.
Nach dem Transformationssatz für Bildmaße folgt

f (Mv )u2 = |(f ◦ v) · u|2 dμ = |f ◦ v|2 dν = |f |2 dμu ,
Ê Ê Ê
falls einer dieser Terme Sinn macht. In diesem Fall gilt wegen L1 ( , μu ) ⊂ Ê
Ê Ê Ê
L2 ( , μu ) und L1 ( , ν) ⊂ L2 ( , ν) ebenfalls nach dem Transformationssatz

u , f (Mv )u = (f ◦ v) · |u|2 dμ = f ◦ v dν = f dμu .
Ê Ê Ê
(ii) Charakterisierung der Spektralschar. Seien {Eλ | λ ∈ }, {Fλ | λ ∈ } zwei Ê Ê
Spektralscharen und μu , νu die jeweils zugehörigen Spektralmaße für u = 1
derart, dass

(∗) f dμu = u , f (A)u = f dνu
Ê Ê
Ê
für alle f ∈ Cb ( ) und alle u ∈ H mit u = 1.
Nach dem Satz von Beppo Levi folgt (∗) auch für alle f ∈ F, insbesondere

u , Eλ u = μu (] − ∞, λ]) = eλ dμu = eλ dνu = νu (] − ∞, λ]) = u , Fλ u
Ê Ê
Ê
und damit Eλ = Fλ für alle λ ∈ . Da Wahrscheinlichkeitsmaße durch ihre
Verteilungsfunktionen eindeutig bestimmt sind, folgt μu = νu für alle u ∈ H
mit u = 1. 2
Bemerkung. Auf Grund dieser Betrachtungen ergibt sich die in 1.5 (c) behaup-
tete Eindeutigkeit des Funktionalkalküls für messbare Funktionen f : → . Ê
Sei A = U −1 Mv U mit einem unitären Operator U : H → L2 (, μ). Für
u = 1 und w = U u ist μu eindeutig bestimmt durch

u , f (A)u = (f ◦ v) |w|2 dμ = f dμu für f ∈ F.
Ê Ê
Sei nun f : → eine messbare Funktion und B := U −1 Mf ◦v U . Dann folgt
wie in (i) für u ∈ D(B) , d.h. (f ◦ v) w ∈ L2 (, μ) die Beziehung

u , Bu H = U −1 w , U −1 U BU −1 w H
= w , Mf ◦v w L2

= (f ◦ v) |w|2 dμ = f dμu .
Ê Ê
Die rechte Seite hängt nur von u und f ab. Da Mf ◦v und damit auch B dicht
definiert sind, ist B durch die quadratische Form u , Bu H festgelegt.
1.9 Weiteres zu Erwartungswert und Varianz

(a) Die Heisenbergsche Unschärferelation. Für selbstadjungierte Opera-
toren A, B und für u ∈ D(A) ∩ D(B) mit u = 1 seien
Eu (A) := u , Au , Eu (B) := u , Bu ,
Vu (A) := (A − Eu (A))u2 , Vu (B) := (B − Eu (B))u2 .
Dann ergibt sich nach der Anleitung § 22 : 3.8 (b)

1
Vu (A) Vu (B) ≥ 4 | Au , Bu − Bu , Au |2 für u ∈ D(A) ∩ D(B).
Stehen die Operatoren A, B in der kanonischen Vertauschungsrelation
[A, B] = AB − BA = −i h̄ D
mit dem in H dichten Definitionsbereich
D := {u ∈ D(A) ∩ D(B) | Au ∈ D(B), Bu ∈ D(A)}
des Kommutators [A, B], so folgt die Heisenbergsche Unschärferelation

1
Vu (A) Vu (B) ≥ 4 h̄ .
(b) Erwartungswerte in allgemeinen Zuständen. Nach § 22 : 6.4 werden

allgemeine Zustände durch Spurklasseoperatoren

W = pk | vk vk |
k
mit einem vollständigen ONS v1 , v2 , . . . für H und Zahlen pk ∈ Ê + mit

pk = 1
k
beschrieben. W heißt zulässig für den selbstadjungierten Operator A, wenn alle

vk zu D(A) gehören. In diesem Fall gilt für das zu W gehörige Spektralmaß

μW := pk μvk
k
bezüglich A ÜA

/W = tr (AW ) :=
E(μW ) = μ pk vk , Avk ,
k

V (μW ) = /W ) vk 2 ,
pk (A − μ
k
vgl. § 22 : 6.4. Aus der letzten Beziehung folgt, dass die Heisenbergsche Un-
schärferelation auch für allgemeine Zustände gilt ÜA .
Ê
Ferner ergibt sich mit Hilfe von § 22 : 1.6 (a): Genau dann ist λ ∈ ein scharfer
Messwert für die Observable A im Zustand W , wenn λ ein Eigenwert von A ist
und Bild W ⊂ Kern (A − λ) ÜA .
2 Ausführung der Beweise für 1.3 – 1.7

2.1 Spektrum der Einschränkung auf einen spektralen Teilraum
Es genügt, die Behauptungen (i) und (ii) von 1.3 (b) für einen Multiplikator
Ê Ê
A = Mv auf L2 ( , μ) mit μ( ) = 1 zu beweisen, wobei wir nach 1.2 (a)
voraussetzen dürfen, dass v( ) ⊂ σ(A). Ê
Seien I = ]a, b], w := χI ◦ v und P = Mw der Orthogonalprojektor auf den
Teilraum V = Bild P .
(i) Im Fall σ(A) ∩ I = ∅ ist v(x) ∈ I für alle x ∈ Ê, somit gilt w = 0, P = 0,
V = {0}.
(ii) Sei V = {0}. Die Einschränkung von A = Mv auf V bezeichnen wir mit
T : V → V, u → v · u.
T ist beschränkt und symmetrisch. Wir zeigen
σ(T ) = σ(A) ∩ I und σp (T ) = σp (A) ∩ I.
2 Ausführung der Beweise für 1.3 – 1.7 709
Da Eigenvektoren bzw. approximative Eigenvektoren von T auch solche von A

sind, gilt
σ(T ) = σapp (T ) ⊂ σapp (A) = σ(A) und σp (T ) ⊂ σp (A) .
Für λ ∈ [a, b], ρ = dist (λ, [a, b]) > 0 gilt (T − λ)u = (v − λ)u ≥ ρ u für
u ∈ V , also λ ∈ σapp (T ). Somit haben wir σ(T ) ⊂ σ(A) ∩ [a, b] .
Wir zeigen σ(A)∩ ]a, b[ ⊂ σ(T ), woraus wegen der Abgeschlossenheit der Spek-
tren σ(A)∩[a, b] ⊂ σ(T ) folgt. Sei also λ ∈ σ(A)∩ ]a, b[ . Für In := [λ− n1 , λ+ n1 ]
folgt dann nach § 23 : 5.5, dass Bn := v −1 (In ) positives Maß hat. Für In ⊂
]a, b[ gilt dann un := χBn · μ(Bn )−1/2 ∈ V, un = 1 und T un − λun =
(v − λ)un ≤ 1/n .
Nach § 23 : 5.5 (b) ist λ genau dann Eigenwert von A = Mv , wenn {v = λ} =
v −1 (λ) positives Maß hat. In diesem Fall ist uλ = χ{v=λ} zugehörige Eigenfunk-
tion von A. Für a < λ ≤ b gehört uλ zu V , also gilt σp (A)∩I ⊂ σp (T ). Schließlich
ist a ∈ σp (T ), denn für u ∈ V gilt T u − λu = 0 ⇐⇒ (v − λ)u = 0 ⇐⇒ u = 0 .
Die Aussagen (i) und (ii) übertragen sich auf jeden zu Mv unitär äquivalenten
Operator. 2
2.2 Zur Definition der spektralen Teilräume

(a) Mv –invariante Teilräume. Sei V ein abgeschlossener, Mv –invarianter
Ê
Teilraum von L2 ( , μ) : u ∈ V =⇒ v · u ∈ V . Wir betrachten die Ein-
schränkung T = Mv |V von Mv auf V . Da T auf ganz V definiert ist, gilt nach
dem Satz von Hellinger–Toeplitz § 23 : 1.4 (c):
T : V → V, u → v · u ist ein beschränkter symmetrischer Operator..
Daher ist f (T ) für Funktionen f ∈ C(σ(T )) definiert sowie für Funktionen der
Ê Ê
Klasse F der Funktionen f : → + , die punktweiser Limes einer absteigenden
Folge stetiger, beschränkter Funktionen sind. Erwartungsgemäß gilt
Ê
Lemma. Sei V = {0} ein Mv –invarianter Teilraum von L2 ( , μ) und T die
Einschränkung von Mv auf V . Dann ist f (T ) für f ∈ C(σ(T )) bzw. für f ∈ F
die Einschränkung des Multiplikators Mf ◦v auf V :
(∗) f (T )u = (f ◦ v) · u für u ∈ V.
Insbesondere ist die Spektralschar {Fλ | λ ∈ Ê} von T gegeben durch

Fλ · u = (eλ ◦ v) · u für u ∈ V.
Beweis.
V ist invariant unter Mv2 , Mv3 , . . . ; für u ∈ V und jedes Polynom p ist also
p(v) · u ∈ V . Nach Definition des Funktionalkalküls für f ∈ C(σ(T )) und mit
Hilfe des kleinen Satzes von Lebesgue ergibt sich (∗) für f ∈ C(σ(T )) wie in
§ 21 : 7.6 (b). Für f ∈ F folgt (∗) wie in § 21 : 9.4 (c) mit Hilfe des Satzes von
Beppo Levi. 2
Folgerung. Ist I = ]a, b] ein beschränktes Intervall mit σ(T ) ⊂ I, σp (T ) ⊂ I,

so ist V ein Teilraum des in 1.3 (a) definierten spektralen Teilraums VI ,
VI = Bild P, P = Mw mit w = χI ◦ v .
Denn für die Spektralschar {Fλ | λ ∈ Ê} von T gilt nach § 22 : 1.2, 1.5
Fλ = 0V für λ ≤ a (wegen a ∈ σp (T )) und Fλ = ½V für λ ≥ b .
Für u ∈ V folgt
u = (Fb − Fa )u = (eb ◦ v − ea ◦ v) · u = (χI ◦ v) · u ∈ VI .
Bemerkung. Nicht jeder Mv –invarianter Teilrauum ist ein spektraler. Dies zeigt
das Beispiel v(x) = x2 , V = {u ∈ L2 (Ê, μ) | u(x) = 0 für x ≤ 0} mit der
Normalverteilung μ.
(b) Eindeutige Bestimmtheit der spektralen Teilräume. Sei A ein selbst-

adjungierter Operator auf einem Hilbertraum H . Dann gibt es zu jedem be-
schränkten Intervall I = ]a, b] einen abgeschlossenen A–invarianten Teilraum
H I mit folgender Eigenschaft:
Für jede Darstellung A = U −1 Mv U von A als Multiplikator auf L2 (Ê, μ) ist
H I = U −1 (VI ) mit VI = { (χI ◦ v)u | u ∈ L2 (Ê, μ) } .
Beweis.
Es genügt den Fall zu betrachten, dass A ein Multiplikator Mv auf einem
L2 (Ê, ν) mit einer reellen Verteilung ν ist und dass es eine unitäre Abbildung
U : L2 (Ê, ν) → L2 (Ê, μ) gibt mit A = U −1 Mv U . Für u ∈ L2 (Ê, ν) gilt dann
U Au = (U w) · u = v · (U u) .
Für I = ]a, b] seien
PI der Multiplikator mit χI ◦ v auf L2 (Ê, μ) , VI = Bild (PI ) ,

QI der Multiplikator mit χI ◦ w auf L2 (Ê, ν) , WI = Bild (QI ) .
Zu zeigen ist WI = U −1 (VI ). Sei W := U −1 (VI ).

Für die Einschränkung T von Mv auf VI gilt σ(T ) ⊂ I, σp (T ) ⊂ I. Für u ∈ W
ist U u ∈ VI , also U Au = v · (U u) ∈ VI und daher Au ∈ W . Somit ist W
A–invariant, und die Einschränkung S von A auf W ist unitär äquivalent zu T ,
insbesondere ist σ(S) ⊂ I, σp (S) ⊂ I. Nach 2.2 (a), angewandt auf Mw , folgt
W ⊂ WI . Durch Vertauschung der Rollen von v und w ergibt sich entsprechend
U W I ⊂ VI . 2
2.3 Beweis des Spektralzerlegungssatzes 1.4

Nach dem Vorangehenden gilt für jede Darstellung A = U −1 Mv U von A als
Ê
Multiplikator Mv auf einem L2 ( , μ) , dass H I = U −1 Vn mit
Ê
Vn = { (χIn ◦ v) · f | f ∈ L2 ( , μ) } .
Für hn ∈ Vn , hm ∈ Vm mit m = n ist hn · hm = 0, also gilt Vn ⊥ Vm
und entsprechend H n ⊥ H m für m = n. Für n ∈ sei hn die orthogonale
Projektion von h ∈ L2 (, μ) auf Vn . Dann gilt

|h(x)|2 = |hn (x)|2 für jedes x ∈ ,
n∈
da die Reihe jeweils höchstens ein von Null verschiedenes Glied enthält. Mit
dem Satz von Beppo Levi folgt

h2 = hn 2 , also h = hn im Hilbertraumsinn,
n∈ n∈
d.h. im Quadratmittel, vgl. § 25 : 4.2 (a). Anwendung von U −1 ergibt als erstes
Ergebnis
@
∞
H = Hn ,
n=−∞

∞
d.h. jedes u ∈ H besitzt die Zerlegung u = un mit un = Pn u ∈ H n .
n=−∞
Wir können nun zum Operator A auf H zurückkehren. Für u ∈ D(A) und
h ∈ H gilt wegen Pn h ∈ D(A) und weil Pn APn beschränkt und symmetrisch
ist
h , Pn Au = APn h , u = Pn APn h , u = h , Pn APn u
= h , APn u für u ∈ D(A) ,
somit
Pn APn = APn und Pn Au = APn u für u ∈ D(A) .
Für u ∈ D(A) konvergiert daher nach dem oben Bewiesenen die Orthogonalrei-
he

Au = Pn Au = APn u ,
n∈ n∈

und deren Konvergenz ist äquivalent zu APn 2 < ∞ , vgl. § 9 : 4.2 (b).
n∈
Existiert umgekehrt

m
m
w = Pn Au = lim APn u = lim A Pn u ,
n∈ m→∞ n=−m m→∞ n=−m

m
so folgt aus u = lim Pn u und der Abgeschlossenheit von A, dass u ∈
m→∞ n=−m
D(A) und Au = w. Die Aussagen über die An wurden in 2.1 bewiesen. 2

2.4 Zum Funktionalkalkül

(a) Für die Definition 1.5 (a) beachten wir, dass f (An )Pn u eine Orthogo-
n∈
nalreihe ist (s.o.).
Ê
(b) Sei A = U −1 Mv U mit dem Multiplikator Mv auf L2 ( , μ). Da f (T ) für
beschränkte, symmetrische Operatoren Stop–Limes von Operatoren p(T ) (p
Polynom) ist, geht f (An ) unter U in f (Mn ) über, wo Mn die Einschränkung
von Mv auf Vn = U (H n ) ist. Nach 2.2 (a) ist Mn un = (f ◦ v) · un für un ∈ Vn .
Zu zeigen ist daher nur f (Mv ) = Mf ◦v . Da beide Operatoren
selbstadjungiert
und daher maximal symmetrisch sind, bleibt für u = un mit un ∈ Vn zu
n∈
zeigen:
u ∈ D(Mf ◦v ) =⇒ u ∈ D(f (Mv )) ,

f (Mv )u = f (Mn )un = (f ◦ v) · un = (f ◦ v) · u .
n∈ n∈
Hierfür beachten wir, dass die un = (χIn ◦ v) · u paarweise disjunkte Träger

m
haben. Für die Partialsummen sm = un der Orthogonalreihe für u gilt
n=−m
daher

m
|sm (x)|2 = |un (x)|2 ≤ |u(x)|2 , |u(x) − sm (x)|2 ≤ |u(x)|2 .
n=−m
Es folgt

m
m
f (Mn )un 2 = (f ◦ v) · un 2 ≤ (f ◦ v) · u2 ,
n=−m n=−m

m
(f ◦ v) · u − (f ◦ v) · un 2 = (f ◦ v)(u − sm )2 → 0 für m → ∞ ,
n=−m
letzteres nach dem Satz von Lebesgue mit der Majorante |(f ◦ v) · u|2 . 2
2.5 Zur Spektralschar

Die Aussage (i) von 1.7 (b) folgt aus Eλ Eμ = Eλ für λ ≤ μ, (ii) ergibt sich
durch Einschränkung von Eλ auf einen spektralen Teilraum H I mit λ ∈ I,
(iv) folgt nach 1.5 (b).
Für die Intervalle In = ]n, n + 1] betrachten
wiir die zugehörigen spektralen
Teilräume H n . Wir fixieren u = un mit un ∈ H n für n ∈ . Zu ge-
n∈

m
gebenem ε > 0 gibt es ein m ∈ , so dass sm := un die Ungleichung
n=−m
u − sm < ε erfüllt. Für λ ≤ −m gilt Eλ = 0, falls |n| ≤ m. Es folgt
Eλ u = Eλ u − Eλ sm ≤ u − sm < ε , für λ ≤ −m .
Im Fall λ ≥ m gilt Eλ un = un , falls |n| ≤ m und somit Eλ sm = sm , also
Eλ u − u = Eλ u − Eλ sm + Eλ sm − u
≤ Eλ u − Eλ sm + sm − u < 2ε für λ ≥ m .
Es genügt, die Behauptung (v) für Multiplikatoren Mv zu nachzuweisen. Für

diese ist Eλ = Meλ ◦v , also Eb − Ea nach 1.3 der Projektor auf VI .
2.6* Multiplikatordarstellung im allgemeinen Fall

(a) Der Satz über die Multiplikatordarstellung eines selbstadjungierten Ope-
rators A wurde in 1.2 nur für den Fall σ(A) = Ê
bewiesen. Der folgende Be-
weis erfasst auch den Fall σ(A) = Ê
und beruht auf folgender Idee: Angenom-
men A = Mv . Dann ist der Operator T := f (A) mit der bijektiven Funktion
Ê
f : → ]−1, 1[ , x → x · (1 + x2 )−1/2 beschränkt und symmetrisch, und mit der
Umkehrfunktion g : y → y · (1 − y 2 )−1/2 von f gilt A = g(T ). Wir konstruieren
im folgenden einen beschränkten symmetrischen Operator T mit A = g(T ).
(b) Nach § 24 : 1.5 und § 24 : 2.3 ist ½+A2 ein selbstadjungierter, halbbeschränk-
ter Operator mit unterer Schranke 1, also σ(½ + A2 ) ⊂ [1, ∞[. Daher ist
R = (½ + A2 )−1
beschränkt und symmetrisch mit 0 ∈ σp (R), 0 ≤ R ≤ ½, R ≤ 1 ÜA .

Ferner gilt Ru ∈ D(A ) für alle u ∈ H , (½ + A )R = ½H , R(½ + A ) = ½D(A2 ) .
2 2 2
(c) Der Operator S := AR ist beschränkt und symmetrisch mit
RS = SR , R2 + S 2 = R , S ≤ 1 .
Zum Nachweis zeigen wir zunächst, dass
(1) ARu = RAu für u ∈ D(A) .
Dazu beachten wir, dass i, −i ∈ (A) und (A+i)(A−i) = ½ +A2 = (A−i)(A+i),

somit R(A + i) = (A − i)−1 = (A + i)R. Für u ∈ D(A) erhalten wir daher
RAu = R(A + i)u − iRu = (A − i)−1 u − iRu = (A + i)Ru − iRu = ARu .
Daraus ergibt sich wegen Ru ∈ D(A) für alle u ∈ H
(2) SRu = AR2 u = RARu = RSu .
Wegen Bild R ⊂ D(A) erhalten wir ferner für alle u ∈ H
(3) (R2 + S 2 )u = R2 u + ARARu = R2 u + A2 R2 u = (½ + A2 )R2 u = Ru .

S ist überall definiert und symmetrisch: Für u ∈ D(A) und v ∈ H gilt mit (1)
(4) u , Sv = u , AR v = A u , R v = RA u , v = AR u , v = S u , v .
Schließlich erhalten wir S ≤ 1 aus R ≤ ½ und aus (3):
(5) Su2 = u , S 2 u ≤ u , (R2 + S 2 )u = u , Ru ≤ 1 für u ≤ 1 .
(d) Der Operator R1/2 ist beschränkt, symmetrisch und injektiv. Ferner gilt
Bild R1/2 ⊂ D(A).
Die Injektivität ergibt sich wie folgt: R1/2 u = 0 =⇒ Ru = R1/2 R1/2 u = 0
=⇒ u = 0 wegen 0 ∈ σp (R).
Wegen Bild R1/2 = (Kern R1/2 )⊥ = H gibt es zu jedem h ∈ H Vektoren un
mit h = lim R1/2 un , also R1/2 h = lim Run . Aus (5) ergibt sich
n→∞ n→∞

S um − Sun 2 ≤ um − un , R(um − un ) = R1/2 (um − un )2 ,
also existiert lim Sun = lim ARun . Wegen der Abgeschlossenheit von A folgt
n→∞ n→∞
R 1/2
h ∈ D(A) und AR1/2 h = lim ARun = lim Sun .
n→∞ n→∞
(e) Durch T := AR1/2 ist ein symmetrischer Operator T ∈ L (H ) definiert

mit
R = 1 − T2 , S = AR = T (1 − T 2 )1/2 , σ(T ) ⊂ [−1, 1] , 1 ∈ σp (T ) .
Denn nach (d) ist T überall definiert. Aus (1) folgt für u ∈ D(A)
(6) f (R)Au = Af (R)u
zunächst für f (x) = xn und daher auch für Polynome f . Da A abgeschlossen

ist, gilt (6) für alle auf σ(R) ⊂ [0, 1] stetigen Funktionen. Für u ∈ D(A), v ∈ H
folgt
u , T v = u , AR1/2 v = R1/2 Au , v = AR1/2 u , v = T u , v .
Da D(A) dicht in H ist, folgt die Symmetrie von T .

√
Aus (6) mit f (x) = x folgt T 2 = AR1/2 AR1/2 = A2 R = (1+A2 )R−R = 1−R,
also
R1/2 = (1 − T 2 )1/2 , S = AR = AR1/2 R1/2 = T (1 − T 2 )1/2 .
Aus dem spektralen Abbildungssatz folgt σ(T 2 ) = 1−σ(R) ⊂ [0, 1], also σ(T ) ⊂
[−1, 1]. Aus T u = u folgt T 2 u = u, also Ru = 0 und damit u = 0 nach (b).
3 Selbstadjungierte Operatoren und unitäre Gruppen 715
(f) Die Multiplikatordarstellung. Nach § 22 : 3.6 gibt es ein Wahrscheinlichkeits-

Ê
maß μ auf , eine Sägezahnfunktion w : Ê
→ [−1, 1] und eine unitäre Abbil-
Ê
dung U : H → L2 ( , μ) mit T = U −1 Mw U . Wegen 1 ∈ σp (T ) gilt w(x) ∈
[−1, 1[ μ–f.ü. Durch Abänderung von w auf einer μ–Nullmenge erreichen wir
Ê Ê
w(x) ⊂ [−1, 1[ für alle x ∈ . Dann ist w auf \ {4n + 1 | n ∈ } periodisch
und stetig. Wir definieren
w
T/ := U T U −1 , R
/ := U R U −1 , S/ := U S U −1 , A
/ := U A U −1 , v := √ .
1 − w2
Nach § 21 : 7.6 gilt
T/ = Mw , / = M1−w2 ,
R / = M √ 2.
S w 1−w
Zum Nachweis von A / = Mv , d.h. A = U −1 Mv U , genügt es zu zeigen, dass

Mv ⊂ A,/ da beide Operator maximal symmetrisch sind (§ 24 : 1.1 (b)).
Sei also f ∈ D(Mv ) und Mn := {1 − w2 ≥ 1/n2 } für n ∈ . Für fn := f χMn
und gn := (1 − w2 )−1 fn gilt
|fn | ≤ |f |, |f − fn | ≤ |f |, |gn | ≤ n2 |f |, |vfn | ≤ |vf |, |v(f − fn )| ≤ |vf |,
7
ferner fn → f , vfn → vf punktweise auf = Mn .
n∈
Aus dem Satz von Lebesgue erhalten wir f − fn → 0, vf − vfn → 0.
Andererseits gilt wegen gn ∈ L2 (, μ) und Bild R ⊂ D(A)
/ gn ∈ D(A)
fn = (1 − w2 )gn = R / und
/ n = A/ Rg
Af / n = Sg
/ n = vfn → vf in L2 (, μ) .
/ abgeschlossen ist, folgt f ∈ D(A)
Da A / und Af
/ = vf . Somit ist A = U −1 Mv U .
2
3 Selbstadjungierte Operatoren und unitäre Gruppen

3.1 Die von einem selbstadjungierten Operator erzeugte unitäre Ein-
parametergruppe
Für einen selbstadjungierten Operator A ist durch
U (t) := e−iAt = ft (A) mit ft (x) = e−ixt (t ∈ )
eine stark stetige Einparametergruppe von unitären Operatoren gegeben:
U (s + t) = U (s)U (t) = U (t)U (s) , U (0) = ,
∗ −1
U (t) = U (−t) = U (t) ,
U (t) = s–lim U (t + h) .
h→0
Denn aus den Eigenschaften 1.6 des Funktionalkalküls für beschränkte stetige
Funktionen folgt U (0) = f0 (A) = 1(A) = ,
U (s + t) = fs+t (A) = (fs ft )(A) = fs (A)ft (A) = U (s)U (t) ,
U (t)∗ = f t (A) = f−t (A) =, U (−t) ,
½ = U (0) = U (t − t) = U (t)U (−t) .
Für u = 1 ergibt sich aus dem Spektralsatz

U (t + h) − U (t) u2 = | ft+h − ft |2 dμu = | fh − 1 |2 dμu → 0
Ê Ê
für h → 0 nach dem Satz von Lebesgue, denn
lim (fh (x) − 1) = 0 und |fh (x) − 1| ≤ 2 für alle x ∈

h→0
Ê.
3.2 Das mit einem selbstadjungierten Operator verbundene Cauchy–
Problem
Satz. Für einen selbstadjungierten Operator A besitzt das Cauchy–Problem
u̇(t) = − iAu(t) , u(0) = u
genau dann eine Lösung t → u(t) im Hilbertraumsinn,

1
lim
h→0 h
u(t + h) − u(t) + iAu(t) = 0 für alle t ∈ Ê,
wenn u ∈ D(A). Die Lösung ist dann eindeutig bestimmt und gegeben durch
u(t) = U (t)u .
1
Zusatz. Es gilt sogar u ∈ D(A) ⇐⇒ lim U (h) − 1 u existiert.
h→0 h
Beweis.
(a) Nach den Überlegungen in § 24 : 3.2 (c) gibt es eine Konstante C mit

(∗) | fh (x) − 1 + ihx | = e−ihx − 1 + ihx ≤ C |hx| für alle x, h ∈ Ê.
Nach dem Spektralsatz 1.8 konvergiert für u ∈ D(A) mit u = 1 das Integral
2
x dμu (x), und es folgt für u(t) = U (t)u und h = 0
Ê
1
u(t + h) − u(t) + iAu(t) 2 = 1 ft+h (x) − ft (x) + ixft (x) 2 dμu (x)
Ê
h h
1
= fh (x) − 1 + ix 2 dμu (x) → 0 für h → 0 und alle t ∈ Ê.
Ê
h
Dies ergibt sich aus dem Satz von Lebesgue, denn nach (∗) hat der Integrand
im letzten Integral die μu –Majorante C 2 x2 und den punktweisen Limes 0.
(b) Zum Beweis des Zusatzes definieren wir einen Operator B durch

u ∈ D(B) ⇐⇒ lim 1
U (h)u − u existiert und
h→0 h

Bu = lim i
h
U (h)u − u für u ∈ D(B) .
h→0
Nach (a) gilt A ⊂ B. Zu zeigen ist, dass B symmetrisch ist. Dann folgt A = B,
da nach § 24 : 1.1 (b) selbstadjungierte Operatoren maximal symmetrisch sind.
In der Tat gilt für u, v ∈ D(B) wegen U (h)∗ = U (−h)
1
v , Bu = i lim v , 1
h
(U (h) − 1)u = i lim h
(U (−h) − 1)v , u
h→0 h→0
1
= − i lim k
(U (k) − 1)v , u = Bv , u .
k→0
(c) Eindeutigkeit. Für eine Lösung t → v(t) des Cauchy–Problems v̇(t) =

−iAv(t), v(0) = u setzen wir w(t) := U (−t)v(t) und erhalten wie in § 21 : 7.7
ÜA
d
dt
h , w(t) = h , ẇ(t) = 0 für alle t ∈ Ê,
somit ẇ(t) = 0 und daraus u = w(t) = U (−t)v(t) für alle t ∈ Ê. 2
3.3 Beispiele
(a) Selbstadjungierte Operatoren mit diskretem Spektrum. Hierfür
wird auf § 24 : 3.2 verwiesen.
(b) Für den Ortsoperator Q = Mx und für f ∈ Cb ( ) ist f (Q) = Mf nach Ê

§ 21 : 7.6. Somit ist U (t) = e−itQ der Multiplikator mit e−itx :
U (t)u : x → e−itx u(x) .
ÜA Rechnen Sie für ut (x) = e−itx u(x) nach, dass entsprechend dem Zusatz
3.2
1 2
lim (uh − u) + iQu = 0 ⇐⇒ x |u(x)|2 dx < ∞ .
h→0 h Ê
(c) Impulsoperator und Translationsgruppe. Für die Fouriertransforma-
tion F0 : S → S , u → u / und die Einschränkung P0 von P und Q0 von Q
auf S gilt P0 = F0−1 Q0 F0 nach § 12 : 3.3. Für die Fouriertransformation F auf
Ê
L2 ( ) folgt P = F −1 QF ÜA . Nach 1.5 (b) ist daher
(∗) e−itP = F −1 e−itQ F .
Für u ∈ S sei ut := e−itP u. Mit (b) und (∗) folgt u /t (y) = e−ity u
/(y) ÜA .
Der Umkehrsatz für die Fouriertransformation liefert
1 +∞ −ity 1 +∞
ut (x) = √ e /(y) eixy dy = √
u /(y) ei(x−t)y dy = u(x − t)
u
2π −∞ 2π −∞
für u ∈ S . Da e−itP stetig ist und die Translation im Argument eine Isometrie,
gilt diese Beziehung für alle u ∈ L2 ( ). Ê
(d) Ein anderer Zugang. Sei t → ut (x) = ϕ(x, t) eine klassische Lösung des
Ê
AWP u̇t = −iP ut , u0 = u, d.h. es sei ϕ ∈ C1 ( 2). Dann erfüllt ϕ die Wellen-
gleichung ∂ϕ + ∂ϕ = 0 . Daher gilt dtd
ϕ(t, t + c) = 0 für t, c ∈ . Es folgt Ê
∂t ∂x
Ê
ϕ(t, t+c) = ϕ(0, c) = u(0) für t, c ∈ und daher ϕ(x, t) = u(x−t) für x, t ∈ . Ê
Definieren wir nun ut (x) := u(x − t) für u ∈ D(P ) = W ( ), so erhalten wir 1
Ê

lim h1 (uh − u) + iP u = 0
h→0
ÜA /t (y) = e−iyt u

. Zeigen Sie u /(y) und wenden Sie (b) an.
3.4 Der Satz von Stone

Satz (M.H. Stone 1932). Zu jeder unitären stark stetigen Einparametergruppe
Ê
{ U (t) | t ∈ } auf H gibt es einen eindeutig bestimmten selbstadjungierten
Ê
Operator A mit U (t) = e−itA für t ∈ . Dieser ist gegeben durch
1
u ∈ D(A) ⇐⇒ Au := i lim (U (t)u − u) existiert,
t→0 t
vgl. den Zusatz 3.2.

Der Operator A heißt Generator der Einparametergruppe. Auf die Bedeutung
dieses Satzes für die Quantenmechanik gehen wir in 4.1 (a) kurz ein. Der Beweis
beruht auf mehreren Lemmata, die auch von eigenem Interesse sind.
(a) Integration stetiger Funktionen mit Werten im Hilbertraum
Lemma. Zu jeder stetigen Funktion u : [a, b] → H gibt einen eindeutig bestimm-
ten Vektor h ∈ H mit
b
(1) h, v = a
u(t) , v dt für alle v ∈ H .
b
Wir bezeichnen diesen mit h = a
u(t) dt. Per Definition gilt also
b b
(2) a
u(t) dt , v = a
u(t) , v dt .
Das so definierte Integral hat die Eigenschaften
b
(3) u(t) dt ≤ b u(t) dt ,
a a

b+s b
(4) u(τ − s) dτ = a
u(t) dt .
a+s
Bemerkung. Zur Festlegung von h genügt es, dass (1) bzw. (2) für alle v aus
einem dichten Teilraum von H gilt ÜA .
Beweis.
Die Funktion t → u(t) ist stetig, ebenso die Funktion t → u(t) , v für belie-
bige v ∈ H . Mit der Cauchy–Schwarzschen Ungleichung ergibt sich
b b b
u(t) , v dt ≤ a u(t) , v dt ≤ v a u(t) dt .
a
b
Daher liefert Lv := a u(t) , v dt ein lineares Funktional auf H mit Norm-
b
schranke a u(t) dt und bestimmt somit einen Vektor h ∈ H mit Lv =
b
h , v für alle v ∈ H . Für diesen gilt h = L ≤ a u(t) dt; das ist die
Abschätzung (3). Die Beziehung (4) ist leicht einzusehen ÜA .
(b) Eine verallgemeinerte Fouriertransformation
Für jede stetige Funktion ϕ : [a, b] → und für jeden Vektor u ∈ H ist die
hilbertraumwertige Funktion t → ϕ(t)U (t)u stetig ÜA . Für Testfunktionen
ϕ ∈ C∞ Ê
c ( ) dürfen wir daher definieren

+∞ b
(5) [ϕ, u] := ϕ(t)U (t)u dt = ϕ(t)U (t)u dt , falls supp ϕ ⊂ [a, b] .
−∞ a
Beispiel. Für die vom Ortsoperator Q = Mx auf L2 ( ) erzeugte unitäre Ê

Gruppe ist U (t)u die Funktion x → e−itx u(x). Für u ∈ L2 ( ) und supp ϕ ⊂ Ê
Ê
[a, b] ist die Funktion [ϕ, u] ∈ L2 ( ) nach (a) und (5) festgelegt durch
b
v , [ϕ, u] = v , ϕ(t)U (t)u dt für v ∈ S .
a
Für u ∈ S ergibt sich durch Vertauschung der Integrationsreihenfolge

b +∞

v , [ϕ, u] = v(x) ϕ(t) e−ixt u(x) dx dt
a −∞
+∞ b
= v(x) u(x) e−ixt ϕ(t) dt dx
−∞ a
√
+∞ √
= 2π /(x) dt =
v(x) u(x) ϕ v, /u ,
2π ϕ
−∞
also
√
[ϕ, u] = /u .
2π ϕ
√ √
Es folgt [ϕ, u] ∈ S und Q[ϕ, u] = /u =
2π Q ϕ 2π P:ϕ u = −i[ϕ , u] für
u ∈ S.
Entsprechend ergibt sich im folgenden: Ist { U (t) | t ∈ } eine stark stetige Ê
unitäre Gruppe und [ϕ, u] gemäß (5) definiert, so ergibt sich der gesuchte Ge-
nerator A aus A[ϕ, u] = −i [ϕ , u].
(c) Lemma. D := Span {[ϕ, u] | ϕ ∈ C∞ Ê

c ( ), u ∈ H } ist ein dichter Teilraum
von H , welcher unter der Gruppe {U (t) | t ∈ } invariant ist, Ê
U (t)[ϕ, u] = [ϕ, U (t)u] ∈ D für alle t ∈ Ê.
Weiter gilt
1
lim (U (s) − 1)[ϕ, u] = [−ϕ , u] .
s→0 s
Setzen wir die Vorschrift

A[ϕ, u] := −i [ϕ , u]
linear auf D fort, so erhalten wir einen symmetrischen Operator A auf D.
Beweis.
(i) Seien u ∈ H und ε > 0. Dann gibt es ein δ > 0 mit U (t)u − u ≤ ε für
∞
Ê
|t| ≤ δ. Für den Standardbuckel jδ ∈ Cc ( ) mit jδ ≥ 0, supp jδ = [−δ, δ],
jδ dλ = 1 (vgl. § 10 : 1.2) setzen wir uδ := [jδ , u] und erhalten aus (3) wegen
Ê
jδ (t) u dt = u
|t|≤δ
die Ungleichung
δ δ
u − uδ = jδ (t)(u − U (t)u) dt ≤ jδ (t) u − U (t)u dt ≤ ε .
−δ −δ
(ii) Die Beziehung U (t)[ϕ, u] = [ϕ, U (t)u] erhalten wir aus der Integraldefiniti-
on (1),(2): Sei supp ϕ ⊂ [a, b] und v ∈ H beliebig. Dann gilt
b
U (t)[ϕ, u] , v = [ϕ, u] , U (−t)v = ϕ(s) U (s)u ds , U (−t)v
a
b b
= ϕ(s)U (s)u , U (−t)v ds = ϕ(s) U (t)U (s)u , v ds
a a
b
= ϕ(s) U (s)U (t)u ds , v = [ϕ, U (t)u] , v .
a
(iii) Insbesondere gilt (U (s) − 1)[ϕ, u] = [ϕ, (U (s) − 1)u], also für s = 0
1
1 +∞
(U (s) − 1)[ϕ, u] = ϕ(t)U (t)(U (s) − 1)u dt
s s −∞

1 +∞ (4) ϕ(τ − s) − ϕ(τ )
+∞
= ϕ(t)(U (s + t) − U (t))u dt = U (τ )u dτ .
s −∞ −∞
s
Da supp ϕ kompakt ist, gilt lim 1s (ϕ(τ − s) − ϕ(τ )) = −ϕ (τ ) gleichmäßig auf
Ê. Mit Hilfe der Integralabschätzung (3) erhalten wir
s→0
ÜA
1
lim (U (s) − 1)[ϕ, u] = [−ϕ , u] .
s→0 s
(iv) Für ϕ, ψ ∈ C∞ Ê
c ( ), u, v ∈ H und A[ϕ, u] := −i [ϕ , u] folgt

A[ϕ, u] , [ψ, v] = lim − si (U (s) − 1)[ϕ, u] , [ψ, v]
s→0

= lim [ϕ, u] , si (U (−s) − 1)[ψ, v] = [ϕ, u] , −i[ψ , v]
s→0
= [ϕ, u] , A[ψ, v] .
Diese Symmetrieeigenschaft überträgt sich auf alle Linearkombinationen von
Vektoren der Form [ϕ, u], [ψ, v] und damit auf D. 2
(d) Lemma. Der Operator A ist wesentlich selbstadjungiert.
Nach dem Kriterium § 24 : 2.2 (d) ist Kern (A∗ + i) = Kern (A∗ − i) = {0}
zu zeigen. Sei also v ∈ Kern (A∗ − i), d.h.. A∗ v = iv. Dann ergibt sich für
h := [ϕ, u] ∈ D mit Hilfe des Lemmas (c)
d
0 1 (c)
0 1
U (s)−1 U(s)−1
v , U (t)h = lim v , s U (t) h = lim v, s [ϕ, U (t) u]
dt s→0 s→0
(c) (c)
= v , −iA [ϕ, U (t) u] = − v , iAU (t) h = − A∗ v , iU (t) h
= − iv , i(U (t) h = − v , U (t) h

und somit v , U (t)h = e−t v , h . Da v , U (t)h beschränkt ist, folgt ein Wi-
derspruch für t → −∞, falls nicht v , h = 0. Damit ist v orthogonal zum in
H dichten Teilraum D, also v = 0. Entsprechend folgt Kern (A∗ + i) = {0}.
(e) Lemma. Der Abschluss A ist Generator der Gruppe {U (t) | t ∈ Ê}.
−itA
Denn da A selbstadjungiert ist, liefert V (t) = e eine stark stetige unitäre
Einparametergruppe. Für diese gilt nach 3.2 mit h = [ϕ, u] ∈ D
d

dt v , V (t)h = −i v , AV (t)h .
Da D invariant unter U (t) ist und in D(A) enthalten, folgt nach der Rechnung
in (d)
d

dt v , U (t)h = −i v , AU (t)h = −i v , AU (t)h .
Für w(t) = v , U (t)h − v , V (t)h ist also ẇ = 0 und w(0) = 0, somit w = 0.
Nach dem Fundamentallemma folgt U (t)h = V (t)h für alle h ∈ D und wegen
der Stetigkeit der Operatoren U (t), V (t) dann auch für alle h ∈ H .
(f) Lemma. Der Operator A ist eindeutig bestimmt.
Denn sind A, B selbstadjungierte Operatoren mit e−itA = e−itB für alle t ∈ , Ê
so folgt nach dem Zusatz zu 3.2 zunächst D(A) = D(B) und daher für alle
u ∈ D(A) = D(B)
1 −itA
−iAu = lim e − 1 u = lim e−itB − 1 u = −iBu . 2
t→0 t t→0
3.5 Aufgaben
Ê
(a) Impulsoperator und Translationsgruppe. Sei v ∈ 3, v = 1 und P u :=
Ê
−i ∇u , v für u ∈ S ( 3 ). Dann ergibt sich wie in 3.3 (c) ÜA
(e−itP u)(x) = u(x − tv) .
(b) Das Cauchy–Problem für den Operator u → −iu auf W01 ( +). Durch Ê
Ê
Au = −iu für u ∈ W01 ( + ) ist ein abgeschlossener und symmetrischer, aber
nicht selbstadjungierter Operator gegeben, vgl. § 23 : 6.3 (b). Nach dem Satz von
Stone kann das Cauchy–Problem
(∗∗) u̇t = −iAut , u0 = u ∈ W01 ( Ê +)
Ê definierte, durch u eindeutig bestimmte Lösung mit u =

keine für alle t ∈
Ê besitzen.
t
u für alle t ∈
Rechnen Sie in Analogie zum Vorgehen in 3.3 (d) nach, dass jede klassische
Lösung der DG (∗∗) konstant längs jeder Geraden mit der Gleichung t = x + c
ist (Skizze). Zeigen Sie für u ∈ C∞ Ê
c ( >0 ):
(i) Das Problem (∗∗) besitzt für t > 0 unendlich viele klassische Lösungen.
(ii) Für t < 0 ist die Lösung von (∗∗) durch Vorgabe von u eindeutig bestimmt;
für die Lösung fällt ut für t → −∞ monoton gegen Null.
(iii) Der Operator −A erzeugt eine Kontraktionshalbgruppe: Die Lösung des
Cauchy–Problems u̇t = iAut für t ≥ 0, u0 = u ist von der Form ut = V (t)u mit
V (s + t) = V (s)V (t) = V (t)V (s) für s, t ∈ Ê+,
V (t) ≤ 1 , s–lim V (t) = 0 .

t→∞
(c) Drehimpulsoperatoren. Für k = 1, 2, 3 seien Dk (t) die Matrizen der Drehung

Ê
im 3 um die xk –Achse mit Drehwinkel t. Zeigen Sie:
(i) Durch Uk (t)u : x → u(Dk−1 (t)x) sind unitäre Einparametergruppen
Ê Ê
{Uk (t) | t ∈ } auf L2 ( 3 ) gegeben.
(ii) Bestimmen Sie Ak u = i lim
t→0
1
t
(Uk (t)u − u) für u ∈ S ( Ê ).
3
4 Hilbertraumtheorie und Quantenmechanik

Wir fassen die Hauptergebnisse dieses Kapitels unter dem Aspekt ihrer Bedeu-
tung für die Quantenmechanik zusammen. Dabei müssen wir den Standpunkt
der von Primas so genannten Pionier–Quantenmechanik beziehen; der heu-
tige Diskussionsstand (vgl. Jauch [136], Mackey [137], Primas [139]) erfordert
weitergehende mathematische Hilfsmittel. Bemerkungen hierzu folgen in 4.7.
4 Hilbertraumtheorie und Quantenmechanik 723
4.1 Observable
(a) Zur Beschreibung eines quantenmechanischen Systems wird zunächst ein
Systemhilbertraum H zugrundegelegt; einfache Beispiele wurden in § 18 : 4.1
angegeben. Observable werden prinzipiell durch selbstadjungierte, i.A. unbe-
schränkte Operatoren A auf einem in H dichten Definitionsbereich D(A) be-
schrieben. Wir fassen im folgenden die Gründe hierfür zusammen.
(b) Warum unbeschränkte Operatoren?
Beschränkte Operatoren A, B können niemals die Heisenbergsche Vertausch-
ungsrelation AB −BA = −i½ erfüllen (§ 23 : 1.2). Ein unbeschränkter symmetri-
scher Operator kann nicht auf dem ganzen Hilbertraum definiert sein (§ 23 : 1.4).
(c) Warum selbstadjungierte Operatoren?
Die Deutung von u , Au als Erwartungswert und die Forderung nach reel-
len Erwartungswerten führen zunächst auf die Symmetrie von A (§ 21 : 3.6 (b)).
In 4.4 führen wir aus, dass das Spektrum einer Observablen die Menge der
möglichen Messwerte ist. Die Forderung nach reellen Messwerten führt nach
§ 24 : 1.2 auf selbstadjungierte Operatoren. Nicht jeder abgeschlossene symme-
trische Operator ist selbstadjungiert (§ 23 : 4.3, 6.3 (b)).
Der tiefere Grund, warum wir nur selbstadjungierte Operatoren betrachten, liegt
darin, dass sie die einzigen sind, welche unitäre Einparametergruppen erzeugen
(3.1 und 3.4). Für einen Hamilton–Operator H bedeutet dies, dass zu einem
gegebenen Anfangszustand | ϕ ϕ | mit ϕ ∈ D(H), ϕ = 1 das Schrödinger–
Problem
u̇t = −iHut , u0 = ϕ
eine eindeutig bestimmte, für alle Zeiten definierte Lösung t → ut besitzt, gege-
ben durch ut = U (t)u mit den unitären Abbildungen U (t) = e−itH . Wegen der
Gruppeneigenschaft der U (t) ist die Zeitentwicklung t → ut deterministisch,
d.h. jeder Zustandsvektor ut0 legt alle anderen ut fest. Da H mit allen U (t) ver-
tauscht, sind die Erwartungswerte konstant: ut , Hut = ϕ , Hϕ für t ∈ . Ê
(d) Quantisierung klassisch–mechanischer Observablen.
Ist ein System der klassischen Mechanik invariant unter einer Einparameter–
Untergruppe der Galilei–Gruppe, so besitzt es nach dem Noetherschen Satz
eine Erhaltungsgröße: Invarianz unter Zeitverschiebungen führt auf Erhaltung
der Gesamtenergie, Translationsinvarianz in einer Richtung bedeutet Erhaltung
der Impulskomponente in dieser Richtung, Rotationssymmetrie bezüglich einer
festen Achse bedeutet Erhaltung des Drehimpulses bezüglich dieser Achse usw.
Näheres hierzu in Band 3, § 4 : 3.4.
In speziellen Fällen ergibt sich die Quantisierung dieser Erhaltungsgröße aus
einer Darstellung der Einparametergruppe auf dem Systemhilbertraum. Wir
betrachten den einfachsten Fall eines spinlosen Teilchens im Raum unter dem
Einfluß eines Potentials und setzen die Invarianz des Systems unter einer räum-
Ê
lichen Einparametergruppe {τt | t ∈ } voraus, wobei jede der Transforma-
tionen τt zu SO3 gehört. Die zugehörige klassische Erhaltungsgröße sei a. Nach
dem Transformationssatz für Integrale ist durch
(U (t)u)(x) := u(τt−1 (x))
Ê
eine stark stetige Einparametergruppe unitärer Operatoren auf L2 ( 3 ) gegeben,
und wir ordnen der klassischen Observablen a den nach 3.4 beschriebenen selbst-
adjungierten Operator A mit U (t) = e−itA zu, vgl. 3.3 (c) sowie 3.5 (a),(c). Diese
Betrachtungen lassen sich leicht auf ein N –Teilchen–System mit Systemhilber-
Ê
traum 3N übertragen. Genaueres zur kanonischen Quantisierung klassisch–
mechanischer Observablen finden Sie in Mackey [137] 2-3, 2-4 und in Primas
[139] 3.3.
(e) Orthogonalprojektoren.
Einem Ja/Nein–Experiment wird ein symmetrischer Operator P ∈ L (H ) mit
P 2 = P zugeordnet. Jedem Vektor ϕ ∈ H mit ϕ = 1 entpricht dabei eine
Bernoulli–Verteilung mit Erfolgswahrscheinlichkeit P ϕ2 , vgl. § 22 : 2.2.
Von besonderer Wichtigkeit sind die einem selbstadjungierten Operator A und
den Intervallen I = ]a, b] zugeordneten Spektralprojektoren PI = χI (A), vgl.
1.3 (b). Wir interpretieren PI ϕ2 als Wahrscheinlichkeit, dass die Messwerte
der Observablen A im Zustand | ϕ ϕ | (siehe 4.2) ins Intervall I fallen.
Jeder selbstadjungierte Operator A lässt sich nach dem Spektralzerlegungssatz
1.4 mit Hilfe der Spektralprojektoren Pn = χ]n,n+1] (A) in beschränkte Anteile
Pn APn zerlegen.
(f) Funktionalkalkül.
Ê Ê
Für Observable A und messbare Funktionen f : → wurde in 1.5 ein selbst-
adjungierter Operator f (A) definiert. Wir deuten f (A) als diejenige Observable,
die den Messwerten x für A jeweils den Wert f (x) zuordnet (indirekte Messung
oder Umskalierung der Messwerte).
4.2 Zustände
(a) Der Zustand eines quantenmechanischen Systems mit Systemhilbertraum
H wird durch einen Dichteoperator

W = pk | ϕk ϕk |
k
. ein vollständiges ONS für H und p1 , p2 , . . .

beschrieben; dabei ist ϕ1 , ϕ2 , . .
sind nichtnegative Zahlen mit pk = 1, vgl. § 22 : 6.4. Im Fall dim H = ∞
k
ist die Reihe für W normkonvergent.
(b) Einen Spezialfall bilden die Vektorzustände

|ϕ ϕ | : u → ϕ, u ϕ
mit ϕ = 1. Offenbar gilt | cϕ cϕ | = | ϕ ϕ | für |c| = 1; deshalb ist

| eiωt ϕ eiωt ϕ | als Zustand zeitunabhängig.
4.3 Die Verteilung der Beobachtungswerte

(a) Zu jedem selbstadjungierten Operator A und jedem Vektor ϕ ∈ H mit
ϕ = 1 ist nach 1.7 ein Wahrscheinlichkeitsmaß μϕ mit Verteilungsfunktion
F (λ) = ϕ , Eλ ϕ definiert; dabei ist Eλ = eλ (A). Wir deuten μϕ als Verteilung
der Beobachtungswerte für die durch A beschriebene Observable im Zustand
| ϕ ϕ |. Für ϕ ∈ D(A) existieren nach 1.8 (b)
E(μϕ ) = ϕ , Aϕ , V (μϕ ) = Aϕ − E(μϕ )ϕ2 .
(b) Legen wir die Interpretation 4.1 (d) des Funktionalkalküls zugrunde, so
ist diese Deutung des Spektralmaßes zwangsläufig! Bezeichnen wir nämlich für
einen Zustand | ϕ ϕ | die zu A gehörige Verteilung der Beobachtungswerte mit
μϕ , die zu f (A) gehörige Verteilung mit νϕ , so muss nach der Interpretation
4.1 (d) gelten
νϕ (B) = μϕ (f −1 (B)) für B ∈ B ,
Ê
d.h. νϕ ist das Bildmaß von μϕ unter f . Für f ∈ Cb ( ) folgt nach dem Trans-
formationssatz für Bildmaße § 20 : 6.4 und dem Spektralsatz 1.8

E(νϕ ) = f dμϕ = ϕ , f (A)ϕ ,
Ê
und nach 1.8 (a) ist μϕ hierdurch eindeutig bestimmt.
(c) Die Verteilung μW der Beobachtungswerte für A im gemischten Zustand

W = pk | ϕk ϕk |
k
mit einem vollständigen ONS ϕ1 , ϕ2 , . . . ist gegeben durch

μW = pk μϕk .
k
Ist I = ]a, b] und P = PI = Eb −Ea der Orthogonalprojektor auf den spektralen

Teilraum H I , so gilt nach 6.2

μW (I) = pk ϕk , P ϕk = tr (P W ) .
k
Diese Formel gestattet die Charakterisierung von μW ohne Rückgriff auf die
Darstellung von W .
Gehören alle ϕk zum Definitionsbereich von A, so gilt ÜA

E(μW ) = tr (AW ) = pk E(μϕk ) , V (μW ) = pk V (μϕk ) .
k k
4.4 Spektrum und mögliche Messwerte

(a) Eine Zahl λ heißt möglicher Messwert einer Zufallsgröße X mit Vertei-
lung μ, wenn Spektrum!und mögliche Messwerte
μ(]λ − ε, λ + ε]) > 0 für alle ε > 0 .
(b) Satz. Genau dann gilt λ ∈ σ(A), wenn es einen Zustand W gibt mit
μW (]λ − ε, λ + ε]) > 0 für alle ε > 0 .
Beweis.
Ê
(i) Wir fixieren ein λ ∈ . Für ε > 0 sei Pε := Eλ+ε − Eλ−ε der Ortho-
gonalprojektor auf den zum Intervall Iε = ]λ − ε, λ + ε] gehörigen spektralen
Teilraum H ε = Bild Pε , vgl. 1.7 (b) (v).
(ii) Im Fall λ ∈ σ(A) gibt es wegen σ(A) = σ(A) ein ε > 0 mit σ(A) ∩ Iε = ∅.
Nach 1.3 (b) folgt H ε = {0}, Pε = 0 und somit μϕ (Iε ) = ϕ , Pε ϕ = 0 für
ϕ = 1. Es folgt μW (Iε ) = 0 für jeden Dichteoperator W .
(iii) Im Fall λ ∈ σ(A) gilt Pε = 0 für jedes ε > 0. Dies gilt nach § 22 : 1.5 für
jede Einschränkung AI von A auf einen spektralen Teilraum und daher wegen
1.3 (b) auch für A selbst. Für jeden Zustandsvektor ϕ (ϕ = 1) in H ε ist
Pε ϕ = ϕ, also
μϕ (]λ − ε, λ + ε]) = ϕ , Pε ϕ = ϕ , ϕ = 1 ,
d.h. für den Zustand | ϕ ϕ | liegen alle Messwerte in ]λ − ε, λ + ε].
(iv) Wir betrachten für n ∈

die Intervalle In = ]λ − n1 , λ + n1 ] und die
zugehörigen Spektralprojektoren Pn auf die spektralen Teilräume H n . Aus
Eλ Eμ = Eλ für λ ≤ μ folgt Pm Pn = Pn für m ≤ n , d.h. aus Pn u = u
folgt Pm u = u für m ≤ n .
Sei nun u1 , u2 , . . . eine Folge von Vektoren mit un = 1, un = P un .
Dann ist

∞
W := cn | un un | mit cn := 2−n
n=1
√
ein Dichteoperator (§ 22 : 6.4 (b)). Für vn := cn un ist W := | vn vn | ,
n
also

∞
∞
Wϕ = vn , ϕ vn , ϕ , Pm W ϕ = Pm ϕ , W ϕ = vn , ϕ Pm ϕ , vn .
n=1 n=1
Nach 4.3 (c) ist μW (Im ) = tr (Pm W ). Mit der Parsevalschen Gleichung für
vollständige ONS ϕ1 , ϕ2 , . . . folgt

∞
∞
tr (Pm W ) = vn , ϕk Pm ϕk , vn
k=1 n=1

∞ ∞
= vn , ϕk Pm vn , ϕk
n=1 k=1
∞
= vn , Pm vn
n=1

m−1
∞
∞
= vn , Pm vn + vn 2 ≥ 2−n > 0
n=1 n=m n=m
wegen Pm ≥ 0 und Pm vn = vn für n ≥ m.

Somit ist μW ( ]λ − 1
m
,λ + 1
m
]) > 0 für alle m ∈ . 2
4.5 Scharfe und unscharfe Messungen

(a) Ein Spektralwert λ der Observablen A tritt genau dann als scharfer
Messwert auf, d.h. μW = δλ für einen geeigneten Zustand W , wenn λ ein
Eigenwert von A ist.
Denn ist

W = pk | ϕk ϕk |
k
ein für A zulässiger Zustand, d.h. gehören alle ϕk zu D(A), so gilt nach 4.3 (c)

/W =
E(μW ) = μ pk ϕk , Aϕk ,
k
V (μW ) = /W ϕk ,
pk Aϕk − μ
2
/W
also V (μW ) = 0 genau dann, wenn mit λ := μ
pk > 0 ⇐⇒ Aϕk = λϕk .
Ist λ ein einfacher Eigenwert von A, so ist W ein Bindungszustand ( = Eigen-
zustand).
(b) Ist ein Spektralwert λ von A kein Eigenwert, so gibt es nach 4.4 (b) (ii)
zu jedem ε > 0 einen Vektorzustand | ϕ ϕ | mit μϕ (]λ − ε, λ + ε]) = 1, also
E(μϕ ) ∈ ]λ − ε, λ + ε] und V (μϕ ) < 2ε.
4.6 Kompatible Observable

Zwei Observable A, B heißen kompatibel, wenn es im Prinzip möglich ist, die
Beobachtungswerte für A und B simultan beliebig genau zu messen, d.h. wenn
es zu jedem Paar von Werten λ1 ∈ σ(A), λ2 ∈ σ(B) und jedem ε > 0 einen
Zustand W gibt, so dass das zu A gehörige Spektralmaß μW auf ]λ1 − ε, λ1 + ε]
lebt und das zu B gehörige Spektralmaß νW auf ]λ2 − ε, λ2 + ε].
Nach Prugovecki [140] Chapter IV, 1.2, 1.3 gilt für zwei kompatible Observable
Ê
A, B, dass die Spektralscharen {Eλ (A) | λ ∈ } von A und {Eλ (B) | λ ∈ } Ê
Ê
von B vertauschen: Eλ (A)Eμ (B) = Eμ (B)Eλ (A) für alle λ, μ ∈ . Daraus folgt
wiederum die Existenz einer Observablen C und zweier messbarer Funktionen
Ê Ê
f, g : → mit A = f (C), B = g(C), vgl. Riesz–Nagy [131] 130.
Zu jedem symmetrischen Operator A ∈ L (H ) gibt es im Fall dim H ≥ 2
einen symmetrischen Operator B ∈ L (H ) mit AB = BA ÜA .
4.7 Kritik der Pionier–Quantenmechanik

Wir stützen uns hier auf die ausführliche Übersicht von Primas [139] über die
historische Entwicklung der Pionier–Quantenmechanik, verschiedene Interpre-
tationen und die Diskussion darüber.
Zusammengefasst ergeben sich folgende Kritikpunkte:
– Die Pionier–Quantenmechanik ist unvereinbar mit der klassischen Mechanik,
wenn auch formale Analogien bestehen.
– Beim Konzept der Quantisierung ist die Pionier–Quantenmechanik über ad–
hoc–Regeln wie Korrespondenzprinzip h̄ → 0 oder Plausibilitätsbetrachtun-
gen wie in 4.1 (d) nicht wesentlich hinausgekommen.
– Die Pionier–Quantenmechanik bietet keine umfassende Theorie der moleku-
laren Materie (Thermodynamik, Chemie); eine solche muss makroskopische
Observable vorsehen.
– Die Beschreibung des Messprozesses im Rahmen der Theorie ist mit wis-
senschaftstheoretisch schwer zu akzeptierenden Annahmen verbunden. Das
von Neumannsche Reduktionspostulat führt in letzter Konsequenz dazu, das
Bewusstsein des Beobachters ins Spiel zu bringen und verträgt sich dadurch
schlecht mit der Vorstellung einer unabhängig vom Bewusstsein existierenden
realen physikalischen Welt.
Bei der Messung quantenmechanischer Observabler findet in der Regel eine In-
teraktion statt zwischen den interessierenden Mikroobjekten, beschreibbar im
Formalismus der Quantenmechanik und dem Messapparat, dessen Wirkungswei-
se durch die klassische Physik beschrieben wird. Die Beschreibung der Gesamtsi-
tuation durch eine umfassende Theorie muss daher auch klassische Eigenschaf-
ten wie Masse, Ladung und Temperatur erfassen. Klassische makroskopische
Observable müssen mit allen in Betracht kommenden Observablen kompatibel
und damit vertauschbar sein, vgl. 4.6. Werden alle selbstadjungierten Operato-
ren des Systemhilbertraums als Observable zugelassen (v. Neumannsche Irredu-
zibilitätsannahme), so gibt es keine nichttriviale klassische Observable, da nur
Vielfache der Identität mit L (H ) vertauschen.
Ebensowenig können alle Vektoren des Systemhilbertraums Zustände beschrei-
ben, d.h. das Superpositionsprinzip gilt nicht uneingeschränkt. Vielmehr gibt
es Auswahlregeln (Wick, Wightman, Wigner 1952). Beispielsweise führt die
Invarianz unter Galilei–Transformationen und das Massenerhaltungsgesetz auf
Bargmanns Superauswahlregel (1954).
4.8 Axiomatische Grundlegung der neueren Quantenmechanik

Die Pionier–Quantenmechanik kann nur einfache Situationen zutreffend be-
schreiben. Von den verschiedenen Ansätzen, eine umfassende Quantenmechanik
axiomatisch aufzubauen, skizzieren wir den von Mackey gewählten Zugang
(Mackey [137], Chap. 2):
Jedem System wird eine Observablenmenge A, ein Zustandsmenge Z und eine
Funktion p : A × Z × B → [0, 1] zugrundegelegt. Dabei wird folgendes verlangt:
I. μA,ω : B → p(A, ω, B) ist für jede Observable A und jeden Zustand ω
ein Wahrscheinlichkeitsmaß; p(A, ω, B) gibt die Wahrscheinlichkeit an, dass im
Zustand ω ein Messwert für A in die Borelmenge B ⊂ fällt. Ê
II. Aus p(A, ω, B) = p(A , ω, B) für alle ω ∈ Z, B ∈ B folgt A = A ; aus

p(A, ω, B) = p(A, ω , B) für alle A ∈ A, B ∈ B folgt ω = ω .

III. Zu jeder Observablen A und jeder messbaren Funktion f : → Ê Ê
gibt es
eine Observable A ∈ A mit p(A , ω, B) = p(A, ω, f −1 (B)) für alle ω ∈ Z und
alle B ∈ B, d.h. p(A , ω, B) ist die Wahrscheinlichkeit, dass im Zustand ω für
einen Messwert x von A der Messwert f (x) in die Menge B fällt. Die Observable
A wird mit f (A) bezeichnet.
IV. Zu je abzählbar vielen Zuständen ω1 , ω2 , . . . und Zahlen p1 , p2 , . . . ≥ 0 mit

∞
pk = 1 gibt es einen Zustand ω ∈ Z mit
k=1

∞
p(A, ω, B) = pk p(A, ωk , B) für alle A ∈ A, B ∈ B .
k=0
Die weiteren Axiome betreffen die sogenannten questions (Ja/Nein–Fragen, Pro-

positionen), dies sind Observable Q, für die μQ,ω eine Bernoulli–Verteilung mit
Erfolgswahrscheinlichkeit mω (Q) = p(Q, ω, {1}) ist. Sie werden zum Fragenver-
band Q zusammengefasst. Es zeigt sich
Q ∈ Q =⇒ Q2 = Q und 1 − Q ∈ Q vgl. III..
Mit der Festlegung Q1 ≤ Q2 : ⇐⇒ mω (Q1 ) ≤ mω (Q2 ) für alle ω ∈ Z ergibt
sich eine Ordnungsrelation, die der von Orthogonalprojektoren entspricht. Zwei
Fragen Q1 , Q2 heißen unvereinbar, wenn Q1 ≤ 1−Q2 ⇐⇒ mω (Q1 )+mω (Q2 ) ≤
1 für alle ω ∈ Z. Unvereinbare Fragen können nicht simultan mit Ja beantwortet
werden.
Spezialfälle sind die Fragen Messwert der Observablen A in B ?“, gegeben durch
χB (A). ”
V. Zu je abzählbar vielen paarweise unvereinbaren Q1 , Q2 , . . . ∈ Q gibt es ein

∞
Q ∈ Q mit der Eigenschaft mω (Q) = mω (Qk ) für alle ω ∈ Z, d.h. eine Frage
k=1
Q, die genau dann bejaht wird, wenn wenigstens ein Qk bejaht wird.
VI. Sei jeder Borelmenge B eine Frage QB zugeordnet, und es gelte

Q∅ = 0 , QÊ = ½ ,
QB1 und QB2 sind unvereinbar für B1 ∩ B2 = ∅ ,
7
∞
∞
aus B = Bk mit paarweise disjunkten Bk ∈ B folgt QB = QBk .
k=1 k=1
Dann gibt es eine Observable A ∈ A mit QB = χB (A) für alle B ∈ B.

VII. Zu jedem Q ∈ Q mit Q = 0 gibt es ein ω ∈ Z mit mω (Q) = 1, d.h.
μQ,ω = δ1 .. (Bei Mackey ist dies Axiom VIII.) Das Axiom VII bei Mackey
lässt sich grob so formulieren:
VIII. Es gibt eine äquivalente Darstellung von A und Z auf einem separablen
Hilbertraum H derart, dass A aus den symmetrischen Operatoren einer Unter-
algebra von L (H ) besteht, Z aus einer Teilmenge der Dichteoperatoren und
μA,ω das in 4.3 (c) beschriebene Spektralmaß ist.
Die Pionier–Quantenmechanik ordnet sich dieser Axiomatik unter, indem für Z
die Menge aller Dichteoperatoren und für A die Menge aller symmetrischen Ope-
ratoren A ∈ L (H ) gewählt werden. (Unbeschränkte selbstadjungierte Opera-
toren sind durch die Folge ihrer spektralen Anteile gegeben.)
Die klassische statistische Mechanik ordnet sich wie folgt ein: Zustände sind die
Wahrscheinlichkeitsmaße ω auf dem Phasenraum Φ, Observable sind messbare
Ê
Funktionen A : Φ → , und p ist definiert durch
p(A, ω, B) = ω(A−1 (B)) .
Dann ist f (A) die Funktion f ◦A, und Fragen sind durch zweiwertige Funktionen
q : Φ → {0, 1} gegeben, eindeutig bestimmt durch die Menge q −1 ({1}).
Die Punktmechanik ergibt sich durch Spezialisierung der Zustandsmenge: Zu-
stände werden durch Dirac–Maße auf dem Phasenraum beschrieben.
Für die Einbeziehung der Thermodynamik und der Chemie sei auf Primas [139]
verwiesen.
Die neuere Quantenmechanik bedient sich der Theorie der C*–Algebren. Hierfür
ist die in diesem Kapitel entwickelte Operatorentheorie ein Grundbaustein, nicht
zuletzt weil wichtige Observablenalgebren Darstellungen als Unteralgebren ei-
nes passenden L (H ) besitzen. In echten Unteralgebren A von L (H ) kann es
Operatoren geben, die mit A vertauschen; somit leuchtet ein, dass die Berück-
sichtigung von Superauswahlregeln und die entsprechende Einschränkung der
zulässigen Observablenmenge die Einbeziehung makroskopischer Observabler
ermöglicht. Für den operatoralgebraischen Zugang zur Quantenmechanik ver-
weisen wir auf Primas [139] Ch. 4.
Namen und Lebensdaten
d’Alembert, Jean Baptiste Le Rond Fermat, Pierre de (1607–1665)
(1717–1783) Fourier, Jean Baptiste Joseph
Alhazen (Ibn Al–Haytham) (1768–1830)
(965–1040?) Fredholm, Erik Ivar (1866–1927)
Banach, Stefan (1892–1945)
Friedrichs, Kurt Otto (1901–1982)
Bendixson, Ivar (1861–1935)
Frobenius, Kurt Otto Georg
Bernoulli, Jakob (1655–1705) (1849–1917)
Bernoulli, Johann (1667–1748) Fubini, Guido (1879–1943)
Bernoulli, Daniel (1700–1782) Gauss, Carl Friedrich (1777–1855)
Bessel, Friedrich Wilhelm Green, George (1793–1841)
(1784–1846)
Gronwall, Thomas Hakon
Borel, Emile (1871–1956) (1877–1932)
Born, Max (1882–1970) Hadamard, Jacques (1865–1963)
Browder, Felix, E. (*1927) Hamilton, Sir William Rowan
Carathéodory, Constantin (1805–1865)
(1873–1950) Hankel, Hermann (1839–1873)
Cauchy, Augustin–Louis (1789–1857) Heaviside, Oliver (1850–1925)
Christoffel, Elwin Bruno Heisenberg, Werner (1901–1976)
(1829–1900)
Hellinger, Ernst (1883–1950)
Clairaut, Alexis Claude (1717–1765)
Hermite, Charles (1822–1901)
Courant, Richard (1888–1972)
Hilbert, David (1862–1943)
Darboux, Jean Gaston (1842–1917)
Hölder, Otto (1859–1937)
Dirac, Paul Adrien Maurice
(1902–1984) Hopf, Eberhard (1902–1983)
Dirichlet, Gustav Peter Lejeune Hugoniot, Pierre Henri (1851–1887)
(1805–1859) Huygens, Christiaan (1629–1695)
du Bois–Reymond, Paul (1831–1889) Jacobi, Carl Gustav (1804–1851)
Duhamel, Jean Marie Constant Jordan, Pascual (1902–1980)
(1797–1872)
Kato, Tosio (1917–1999)
Einstein, Albert (1879–1955)
Kelvin (Thomson), Lord William
Euler, Leonard (1707–1783) (1824–1907)
Faraday, Michael (1791–1867) Kolmogorow, Andrej Nikolajewitsch
Fischer, Ernst (1875–1959) (1903–1987)

DOI 10.1007/978-3-658-00477-4, © Springer Fachmedien Wiesbaden 2014
Namen und Lebensdaten 733
Korn, Arthur (1870–1945) Perron, Oskar (1880–1975)

Ladyzhenskaja, Olga Alexandrowa Picard, Emile (1856–1941)
(1922–2004)
Planchérel, Michel (1885–1967)
Lagrange, Joseph Louis (1736–1813)
Planck, Max (1858–1947)
Laguerre, Edmond (1834–1886)
Poincaré, Henri (1854–1912)
Laplace, Pierre Simon (1749–1827)
Poisson, Siméon–Denis (1781–1840)
Lebesgue, Henri (1875–1941)
Rayleigh, Lord John William Strutt
Legendre, Adrien Marie (1752–1833) (1842–1919)
Levi, Beppo (1875–1961) Rellich, Franz (1906–1955)
Lichtenstein, Leon (1878–1933)
Riesz, Friedrich (1880–1956)
Lindelöf, Ernst Leonard (1870–1946)
Rodrigues, Olinde (1794–1851)
Liouville, Joseph (1809–1882)
Schmidt, Erhard (1876–1959)
Lipschitz, Rudolph Otto Sigismund
(1832–1903) Schrödinger, Erwin (1887–1961)
Ljapunow, Alexander Michailowitsch Schwartz, Laurent (1915–2002)

(1856–1918) Schwarz, Hermann Amandus
Maxwell, James Clerk (1831–1879) (1843–1921)
Milgram, Arthur Norton (1912–1961) Sobolew, Sergei Lwowitsch
(1908–1989)
Minkowski, Hermann (1864–1909)
Sommerfeld, Arnold (1868–1951)
Moivre, Abraham de (1667–1754)
Stokes, Sir Georg Gabriel
Monge, Gaspard (1746–1818)
(1819–1903)
Morrey, Charles Bradfield
(1907–1984) Stone, Marshall Harvey (1903–1989)
Navier, Claude Louis Marie Henri Sturm, Charles (1803–1855)

(1785–1836) Toeplitz, Otto (1881–1940)
Neumann, Carl Gottfried (1832–1925) Tonelli, Leonida (1885–1946)
Neumann, Johann von (1903–1957) Tschebyschew, Pafnuti Lwowitsch
Newton, Isaac (1643–1727) (1821–1894)
Nirenberg, Louis (*1925) Weierstraß, Karl (1815–1897)
Pauli, Wolfgang (1900–1958) Weyl, Hermann (1885–1955)
Parseval, Marc Antoine (1755–1836) Zaremba, Stanislaw (1863–1942)
Literaturverzeichnis
Methoden der Mathematischen Physik
[1] Arfken, G.B., Weber, H.J.: Mathematical Methods for Physicists. Academic
Press 2005.
[2] Courant, R., Hilbert, D.: Methoden der Mathematischen Physik I. Springer
1968.
[3] Courant, R., Hilbert, D.: Methoden der Mathematischen Physik II. Springer
1968.
[4] Dautray, R., Lions, J.L.: Mathematical Analysis and Numerical Methods for
Science and Technology 1–6 . Springer 2000.
[5] Frank, P., von Mises, R.: Die Differential– und Integralgleichungen der Me-
chanik und Physik I, II . Nachdruck Dover und Vieweg 1967.
[6] Goldhorn, K.H., Heinz, H.P., Kraus, M.: Moderne mathematische Methoden
der Physik 1,2 . Springer 2009/10.
Gewöhnliche Differentialgleichungen, Dynamische Systeme

Einführende Werke
[7] Arrowsmith, D.K., Place, C.M.: Dynamical systems. Differential equations,
maps and chaotic behaviour . Chapman and Hall 1992.
[8] Birkhoff, G., Rota, G.C.: Ordinary Differential Equations. Wiley 1989.
[9] Heuser, H.: Gewöhnliche Differentialgleichungen. Springer 2009.
[10] Hirsch, M.W., Smale, S., Devaney, R.: Differential Equations, Dynamical
Systems, and an Introduction to Chaos. Elsevier 2003.
[11] Miller, R.K., Michel, A.N.: Ordinary Differential Equations. Acad. Press
1982.
[12] Walter, W.: Gewöhnliche Differentialgleichungen. Springer 1993.
Weiterführende Werke
[13] Amann, H.: Gewöhnliche Differentialgleichungen. de Gruyter 1995.
[14] Arnold, V.I.: Gewöhnliche Differentialgleichungen. Springer 1979.
[15] Arrowsmith, D.K., Place, C.M.: An Introduction to Dynamical Systems.
Cambridge Univ. Press 1990.
[16] Chicone, C.: Ordinary Differential Equations with Applications. Springer 2006.
[17] Coddington, E.A., Levinson, N.: Theory of Ordinary Differential Equations.
Mc Graw–Hill 1955.
[18] Hahn, W.: Stabilty of Motion. Springer 1967.
[19] Hale, J.: Ordinary Differential Equations. Wiley–Interscience 1969/R. Krieger
Publ. Co. 1980.
[20] Hartman, P.: Ordinary Differential Equations. Birkhäuser 1982.
[21] Hille, E.: Lectures on Ordinary Differential Equations. Addison–Wesley Publ.
Comp. 1969.

Literaturverzeichnis 735
[22] Kamke, E.: Differentialgleichungen. Lösungsmethoden und Lösungen 1, 2 .

Teubner 1983.
[23] Knobloch, H.W., Kappel, F.: Gewöhnliche Differentialgleichungen. Teubner
1974.
[24] Palis, J., de Melo, W.: Geometric Theory of Dynamical Systems. Springer
1982.
[25] Perko, L.: Differential Equations and Dynamical Systems. Springer 2001.
Verzweigung, Attraktoren
[26] Berry, M.V.: Regular and Irregular Motion, in Topics in Nonlinear Dynamics.
(Jorna, Ed.). Americ. Inst. Phys. 1978, p. 16–121.
[27] Chow, S.N., Hale, J.: Methods of Bifurcation Theory. Springer 1982.
[28] Guckenheimer, J., Holmes, P.: Nonlinear Oscillations, Dynamical Systems,
and Bifurcations of Vectorfields. Springer 2002.
[29] Hale, J., Kociak, H.: Dynamics and Bifurcation. Springer 1991.
[30] Kielhöfer, H.: Methods of Bifurcation Theory. An Introduction with Applica-
tions to PDEs. Springer 2010.
[31] Moser, J.: Stable and Random Motion in Dynamical Systems. Princeton
Univ. Press 1973.
siehe auch [70]
Fourieranalysis, Distributionen, Integraltransformationen

[32] Bochner, S.: Vorlesungen über Fouriersche Integrale. Akad. Verlagsgesellschaft
1932 / repr. Chelsea 1949.
[33] Daubechies, I.: Ten Lectures on Wavelets. Soc. Indust. Appl. Math. 1992.
[34] Dym, H., Mc Kean, H.P.: Fourier Series and Integrals. Acad. Press 1972.
[35] Folland, G.B.: Fourier Analysis and its Applications. Wadsworth and
Brooks/Cole 1992.
[36] Friedlander, F.G.: Introduction to the Theory of Distributions. Cambridge
Univ. Press 1998.
[37] Gasquet, C., Witomski, P.: Fourier Analysis with Applications. Springer 1999.
[38] Gelfand, I.M., Schilow, G.E.: Verallgemeinerte Funktionen (Distributionen)
I–IV . Deutscher Verlag der Wissenschaften 1960–64.
[39] Gónzalez–Velasco, E.A.: Fourier Analysis and Boundary Value Problems.
Acad. Press 1995.
[40] Hardy, G.H., Rogosinski, W.W.: Fourier Series. MacMillan Comp. 1944.
[41] Schempp, W., Dreseler, B.: Einführung in die harmonische Analyse. Teubner
1980.
[42] Schwartz, L.: Mathematics for the Physical Sciences. Hermann/Addison–
Wesley 1966.
[43] Stein, E.M., Weiss, G.: Introduction to Fourier Analysis on Euclidean Spaces.
Princeton Univ. Press 1971.
736 Literaturverzeichnis
[44] Temple, G.: Theories and Applications of Generalized Functions. J. London

Math. Soc. 28 (1953) 134–148 .
[45] Widder, D.V.: The Laplace–Transform. Acad. Press 1975.
[46] Zygmund, A.: Trigonometric Series. Cambridge Univ. Press 2002.
siehe auch [2], [4, 2], [56], [91, I]
Partielle Differentialgleichungen
Einführende Werke
[47] Garabedian, P.R.: Partial Differential Equations. Wiley 1964.
[48] Hellwig, G.: Partielle Differentialgleichungen. Teubner 1960.
[49] John, F.: Partial Differential Equations. Springer 1993.
[50] Leis, R.: Vorlesungen über partielle Differentialgleichungen 2. Ordnung . Bibl.
Inst. 1967.
[51] Michlin, S.G.: Partielle Differentialgleichungen in der Mathematischen Physik .
Verlag Harri Deutsch 1978.
[52] Protter, M.H., Weinberger, H.F.: Maximum Principles in Differential Equa-
tions. Prentice–Hall 1967 / repr. Springer 1984.
[53] Strauss, W.A.: Partielle Differentialgleichungen. Eine Einführung. Vieweg
1995.
[54] Tychonoff, A.N., Samarski, A.A.: Differentialgleichungen der Mathemati-
schen Physik . Deutscher Verlag der Wissenschaften 1959.
[55] Weinberger, H.F.: A First Course in Partial Differential Equations. Blaisdell
Publ. Comp. 1965 / repr. Dover.
[56] Wladimirow, W.S.: Gleichungen der Mathematischen Physik . Deutscher Ver-
lag der Wissenschaften 1972.
[57] Zauderer, E.: Partial Differential Equations of Applied Mathematics. Wiley
2006.
siehe auch [3], [22, 2].
Weiterführende Werke
[58] Bers, L., John, F., Schechter, M.: Partial Differential Equations. Interscience
Publ. 1964 / repr. Amer. Math. Soc.
[59] Dibenedetto, E.: Partial Differential Equations. Birkhäuser 2010.
[60] Evans, L.C.: Partial Differential Equations. Amer. Math. Soc. 2010.
[61] Folland, G.B.: Introduction to Partial Differential Equations. Princeton Univ.
Press 1976.
[62] Friedman, A.: Partial Differential Equations. Holt, Rinehart and Winston 1969.
[63] Hörmander, L.: The Analysis of Partial Differential Operators I–IV . Springer
2003–09.
[64] Jost, J.: Partial Differential Equations. Springer 2013.
[65] Ladyzhenskaya, O.A.: Boundary Value Problems of Mathematical Physics.
Springer 1985.
[66] Lions, J.L., Magenes, E.: Non–homogenous Boundary Value Problem and Ap-
plications I . Springer 1972/73.
[67] Rauch, J.: Partial Differential Equations. Springer 1991.
[68] Sobolew, S. L.: Einige Anwendungen der Funktionalanalysis auf Gleichungen
der Mathematischen Physik . Akademie–Verlag 1964.
[69] Taylor, M. E.: Partial Differential Equations I–III . Springer 1996.
[70] Temam, R.: Infinite–Dimensional Dynamical Systems in Mechanics and Phy-
sics. Springer 1997.
[71] Treves, F.: Basic Linear Partial Differential Equations . Academic Press 1975.
[72] Wloka, J.: Partielle Differentialgleichungen. Teubner 1982.
[73] Zeidler, E.: Nonlinear Functional Analysis with Applications I–IV . Springer
1985–90.
siehe auch [3], [4, 1], [4, 5], [4, 6]
Elliptische und parabolische Differentialgleichungen

[74] Chavel, I.: Eigenvalues in Riemannian Geometry. Academic Press 1984.
[75] Dacorogna, B.: Direct Methods in the Calculus of Variations. Springer 1989.
[76] Egorov, Y., Kondratiev, V.: On Spectral Theory of Elliptic Operators.
Birkhäuser 1996.
[77] Eidelman, S.D., Zhitarashu, N.V.: Parabolic boundary problems. Birkhäuser
1998.
[78] Friedman, A.: Partial Differential Equations of Parabolic Type. Prentice–Hall
1964.
[79] Gilbarg, D., Trudinger, N.S.: Elliptic Differential Equations of Second Order .
Springer 2001.
[80] Grisvard, P.: Elliptic Problems in Nonsmooth Domains. Pitman 1985.
[81] Krylow, N.V.: Lectures on Elliptic and Parabolic Equations in Hölder Spaces.
Amer. Math. Soc. 1996.
[82] Ladyzhenskaya, O.A., Uraltseva, N.N.: Linear and Quasilinear Elliptic
Equations. Acad. Press 1968.
[83] Ladyzhenskaya, O.A., Solonnikov, V.A., Uraltseva, N.N.: Linear and Qua-
silinear Equations of Parabolic Type. Acad. Press 1968 / repr. Amer. Math. Soc..
[84] Lichtenstein, L.: Neuere Entwicklung der Potentialtheorie. Konforme Abbil-
dung. Encykl. der Math. Wiss. Bd. II.3.1, 177–377. Teubner 1919.
[85] Lieberman, G.M.: Second Order Parabolic Equations. World Scient. Publ. 1996.
[86] Nazarov, S.A., Plamenevsky, B.A.: Elliptic Problems in Domains with Pie-
cewise Smooth Boundaries. de Gruyter 2011.
siehe auch [3], [4, 1], [4, 4]
Hyperbolische Gleichungen, Wellenausbreitung

[87] Cakoni, F., Colton, D.: Qualitative Methods in Inverse Scattering Theory .
Springer 2006.
[88] Colton, D., Kress, R.: Integral Equation Methods in Scattering Theory. Wiley
1983.
[89] Dafermos, C.M.: Hyperbolic Conservation Laws in Continuum Physics. Sprin-
ger 2010.
[90] Hadamard, J.: Leçons sur la propagation des ondes et les équations de
l’hydrodynamique. Hermann 1903.
[91] Hörmander, L.: Nonlinear Hyperbolic Differential Equations. Springer 1997.
[92] Jackson, J.D.: Classical Electrodynamics. Wiley 1998.
[93] Jeffrey, A., Taniuti, T.: Nonlinear Wave Propagation. Acad. Press 1966.
[94] John, F.: Nonlinear Wave Equations, Formation of Singularities. Amer. Math.
Soc. 1990.
[95] Kichenassamy, S.: Nonlinear Wave Equations. Marcel Dekker 1996.
[96] Kato, T.: The Cauchy Problem for Quasi–Linear Symmetric Hyperbolic Sy-
stems. Arch. Rat. Mech. Anal. 58 (1975) 181–205 .
[97] Lax, P.: Hyperbolic Systems of Conservation Laws and the Mathematical Theo-
ry of Shock Waves. SIAM 1973.
[98] Leis, R.: Initial Boundary Value Problems in Mathematical Physics. Teubner /
Wiley 1986.
[99] Racke, R.: Lectures on Nonlinear Evolution Equations. Vieweg 1992.
[100] Sogge, C. D..: Lectures on Nonlinear Wave Equations. Internat. Press 1995.
[101] Taniuti, T., Nishihara, K.: Nonlinear Waves. Pitman 1983.
[102] Toda, M.: Nonlinear Waves and Solitons. Kluwer Acad. Publ. 1989.
[103] Whitham, C.B.: Linear and Nonlinear Waves. Wiley 1974.
[104] Wilcox, C.H.: Scattering Theory for the d’Alembert Equations in Exterior Do-
mains. Springer 1975.
siehe auch [3]
Spezielle Funktionen der Mathematischen Physik,

Entwicklung nach Eigenfunktionen
Spezielle Funktionen der mathematischen Physik
[105] Hobson, E.W.: The Theory of Spherical and Ellipsoidal Harmonics. Chelsea
Publishing Comp. 1931.
[106] Lebedev, N.N.: Special Functions and their Applications. Prentice–Hall 1965.
[107] Lense, J.: Reihenentwicklungen in der Mathematischen Physik . de Gruyter
1953.
[108] Sansone, G.: Orthogonal Functions. Interscience Publ. 1959.
[109] Szegö, G.: Orthogonal Polynomials. Amer. Math. Soc. 1939.
[110] Watson, G.N.: A Treatise on the Theory of Bessel Functions. Cambridge
Univ. Press 1944.
siehe auch [1], [2], [4, 2], [4, 3]
Entwicklung nach Eigenfunktionen

[111] Jörgens, K., Rellich, F.: Eigenwerttheorie gewöhnlicher Differentialgleichun-
gen. Springer 1976.
[112] Levitan, B.M., Sargsjan, I.S.: Introduction to Spectral Theory. Amer. Math.
Soc. 1975.
[113] Titchmarsh, E.C.: Eigenfunction Expansions I, II . Clarendon Press 1962/58.
[114] Yosida, K.: Lectures on Differential and Integral Equations. Interscience Publ.
1960.
siehe auch [2], [9], [17]
Wahrscheinlichkeit, Maß, Integral

[115] Bauer, H.: Wahrscheinlichkeitstheorie. de Gruyter 2011.
[116] Behnken, K., Neuhaus, G.: Grundkurs Stochastik . Teubner 1984.
[117] Elstrodt, J.: Maß– und Integrationstheorie. Springer 2011.
[118] Floret, K.: Maß– und Integrationstheorie. Teubner 1981.
[119] Freudenthal, H.: Wahrscheinlichkeit und Statistik . Oldenbourg 1963.
[120] Halmos, P.R.: Measure Theory. Van Nostrand 1950.
[121] Krengel, U.: Einführung in die Wahrscheinlichkeitstheorie und Statistik .
Vieweg 2005.
[122] Lang, S.: Analysis II . Addison–Wesley 1973.
[123] Renyi, A.: Wahrscheinlichkeitsrechnung mit einem Anhang über Informations-
theorie. Deutscher Verlag der Wissenschaften 1962.
siehe auch [122], [140].
Funktionalanalysis, Operatoren im Hilbertraum

Lineare Operatoren im Hilbertraum
[124] Achieser, N.L., Glasmann, I.M.: Theorie der linearen Operatoren im Hilbert-
raum. Akademie–Verlag 1968.
[125] Edmunds, D.E., Evans, W.D.: Spectral Theory and Differential Operators. Cla-
rendon Press 1987.
[126] Faris, W.G.: Self–adjoint Operators. Springer 1975.
[127] Hirzebruch, F., Scharlau, W.: Einführung in die Funktionalanalysis. Bibl.
Inst. 1971.
[128] Kato, T.: Perturbation Theory of Linear Operators. Springer 1966.
[129] Neumark, M.A.: Lineare Differentialoperatoren. Akademie–Verlag 1967.
[130] Reed, M., Simon, B.: Methods of Modern Physics I–IV . Acad. Press 1972–75.
[131] Riesz, F., Nagy, B.Sz.: Vorlesungen über Funktionalanalysis. Verlag Harri
Deutsch 1982.
siehe auch [4, 2], [4, 3]
Sobolew–Räume
[132] Adams, R.A.: Sobolev Spaces. Acad. Press 2003.
[133] Brezis, H.: Analyse fonctionelle. Théorie et applications. Masson 1983.
[134] Kufner, A. et al.: Function Spaces. Noordhoff Int. Pub. & Academia 1977.
[135] Ziemer, W.P.: Weakly Differentiable Functions. Springer 1989.
siehe auch [4, 2]
Mathematische Grundlagen der Quantenmechanik

[136] Jauch, J.M.: Mathematical Foundations of Quantum Mechanics. Addison–
Wesley 1988.
[137] Mackey, G.W.: The Mathematical Foundations of Quantum Mechanics. Ben-
jamin 1963.
[138] von Neumann, J.: Mathematische Grundlagen der Quantenmechanik . Springer
1932/1996.
[139] Primas, H.: Chemistry, Quantum Mechanics and Reductionism. Springer 1981.
[140] Prugovečki, E.: Quantum Mechanics in Hilbert Space. Acad. Press 1981.
siehe auch [4, 3]
Lineare Algebra, Analysis, Topologie

[141] Barner, M., Flohr, F.: Analysis II . de Gruyter 1995.
[142] Bröcker, T., Jänich, K.: Einführung in die Differentialtopologie. Springer
1990.
[143] Cigler, J., Reichel, H.–C.: Topologie. Bibl. Inst. 1978.
[144] Dugundji, J.: Topology. Allyn and Bacon 1965.
[145] Fischer, G.: Lineare Algebra. Springer 2012.
[146] Fleming, W.: Functions of Several Variables. Springer 1977.
[147] Forster, O.: Analysis 3 . Springer 2012.
[148] Heuser, H.: Lehrbuch der Analysis 2 . Springer 2008.
[149] Jänich, K.: Vektoranalysis. Springer 1972.
[150] Königsberger, K.: Analysis 2 . Springer 2004.
Geometrische Optik und Hamiltonsche Mechanik

[151] Arnold, V.I.: Mathematical Methods of Classical Mechanics. Springer 1997.
[152] Giaquinta, M., Hildebrandt, S.: Calculus of Variations I, II . Springer 2004.
[153] Rund, H.: The Hamilton–Jacobi–Theory in the Calculus of Variations. Van
Nostrand 1966.
siehe auch [3]
Theoretische Physik
Gesamtdarstellungen
[154] Feynman, R.P., Leighton, R.B., Sands, M.: The Feynman Lectures on Physics
I–III . Addison–Wesley Publ. Comp. 1964.
[155] Landau, L.D., Lifschitz, E.M.: Lehrbuch der Theoretischen Physik 1–10 . Ver-
lag Harri Deutsch 1986–2004.
[156] Sommerfeld, A.: Vorlesungen über Theoretische Physik I–VI . Akad. Verlags-
gesellschaft 1962–68.
Quantenmechanik
[157] Cohen–Tannoudji, C., Diu, B., Laloë, F.: Quantenmechanik 1,2 . de Gruyter
2009.
[158] Bohm, A.: Quantum Mechanics: Foundations and Applications. Springer 1986.
[159] Dirac, P.A.M.: The Principles of Quantum Mechanics. Clarendon Press 1974.
[160] d’Espagnat, B.: Conceptual Foundations of Quantum Mechanics. Benjamin
1971.
[161] Fick, E.: Einführung in die Grundlagen der Quantentheorie. Akad. Verlagsge-
sellschaft 1968.
[162] Messiah, A.: Quantenmechanik 1,2 . de Gruyter 1991/2010.
[163] Primas, H., Müller–Herold, U.: Elementare Quantenchemie. Teubner 1990.
siehe auch [139],
[154, III]
Numerik
Numerische Mathematik
[164] Freund, R.W., Hoppe, R.H.W.: Stoer/Bulirsch: Numerische Mathematik 1/2 .
Springer 2007/2011.
[165] Deuflhard, P., Hohmann, A.: Numerische Mathematik 1 . de Gruyter 2008.
[166] Hanke–Bourgeois, M.: Grundlagen der numerischen Mathematik und des wis-
senschaftlichen Rechnens. Springer 2009.
[167] Quarteroni, A., Sacco, R., Salieri, F.: Numerische Mathematik 1,2. Springer
2002.
[168] Strang, G.: Introduction to applied Mathematics. Wellesley–Cambridge Press
1986.
[169] Strang, G.: Wissenschaftliches Rechnen. Springer 2010.
Matrizennumerik
[170] Golub, G.H., van Loan, C.F.: Matrix Computations. John Hopkins Univ. Press
1996.
[171] Saad, Y.: Numerical Methods for Large Eigenvalue Problems. SIAM 2011.
[172] Saad, Y.: Iterative Methods for Sparse Linear Systems. SIAM 2003.
[173] Varga, R.S.: Matrix Iterative Analysis. Springer 2000.
[174] Young, D.M.: Iterative Solution of Large Linear Systems. Acad. Press 1971 /
repr. Dover.
Numerik von Differentialgleichungen

[175] Rylander, T., Ingelström, P., Bondeson, A.: Computational electromagne-
tics. Springer 2013.
[176] Bossavit, A.: Computational electromagnetism. Variational formulations, com-
plementary, edge elements. Acad. Press 1998.
[177] Braess, D.: Finite Elemente. Springer 2013.
[178] Deuflhard, P., Bornemann, F.: Numerische Mathematik 2 . de Gruyter 2013.
[179] Deuflhard, P., Weiser, M.: Adaptive Lösung partieller Differentialgleichun-
gen. de Gruyter 2011.
[180] Grossmann, C., Roos, H.G.: Numerische Behandlung partieller Differential-
gleichungen. Vieweg+Teubner 2005.
[181] Hackbusch, W.: Theorie und Numerik elliptischer Differentialgleichungen.
Teubner 1986.
[182] Hackbusch, W.: Integralgleichungen. Teubner 1989.
[183] Hairer, E., Nørsett, S.P., Wanner, G.: Solving Ordinary Differential Equa-
tions I . Springer 1993.
[184] Hairer, E., Wanner, G.: Solving Ordinary Differential Equations II . Springer
1996.
[185] Hairer, E., Lubich, C., Wanner, G.: Geometric numerical integration.
Structure–preserving algorithms for ordinary differential equations. Springer
2006.
[186] Knabner, P., Angermann, L.: Numerical methods for Elliptic and Parabolic
Partial Differential Equations. Springer 2003.
[187] Brenner, S.C., Scott, L.R.: The Mathematical Theory of Finite Element Me-
thods. Springer 2008.
[188] Ciarlet, P.G.: The Finite Element Method for Elliptic Problems. North-
Holland Publishing Co. 1978.
[189] Dziuk, G.: Theorie und Numerik partieller Differentialgleichungen. de Gruyter
2010.
[190] Kröner, D.: Numerical Schemes for Conservation Laws. Wiley 1997.
[191] Raviart, P.A., Thomas, J.M.: Introduction à l’analyse numérique des
équations aux dérivées partielles. Mason 1983.
siehe auch [4, 4] [4, 6]
Geschichte
[192] Bemelmans, J., Hildebrandt, S., von Wahl, W.: Partielle Differentialglei-
chungen und Variationsrechnung. Ein Jahrhundert Mathematik 1890–1990,
Festschrift zum Jubiläum der DMV. (Fischer, Hirzebruch, Scharlau, Törnig,
Hrsg.), pp.149–230. Vieweg 1990.
[193] Burkhardt, H.: Entwicklungen nach oscillierenden Functionen und Integration
der Differentialgleichungen der mathematischen Physik . Jahresber. DMV 10
(1908), pp.1–1804.
[194] Burkhardt, H., Meyer, W.F.: Potentialtheorie. Encykl. der Math. Wiss.
Bd. II.1, pp.464–503. Teubner 1900.
[195] Hellinger, E.: Hilberts Arbeiten über Integralgleichungen und unendliche

Gleichungssysteme. David Hilbert, Gesammelte Abhandlungen III, pp.94–145.
Springer 1970.
[196] Hund, F.: Geschichte der Quantentheorie. Bibl. Inst. 1975.
[197] Kline, M.: Mathematical Thought from Ancient to Modern Times. Oxford Univ.
Press 1972.
[198] Leis, R.: Zur Entwicklung der angewandten Analysis und mathematischen Phy-
sik in den letzten 100 Jahren. Ein Jahrhundert Mathematik 1890–1990, Fest-
schrift zum Jubiläum der DMV. (Fischer, Hirzebruch, Scharlau, Törnig, Hrsg.),
pp.491–535. Vieweg 1990.
[199] Lützen, J.: The Solution of Partial Differential Equations by Separation of
Variables. A Historical Survey. Studies in the History of Mathematics (Phillips,
Ed.). The Math. Association of America 1987.
[200] Ter Haar, D.: The Old Quantum Theory. Pergamon Press 1967.
[201] Szabó, I.: Geschichte der mechanischen Prinzipien. Birkhäuser 1979.
[202] Van Der Waerden, B.L.: Sources of Quantum Mechanics. Dover 1967.
siehe auch [9]
Handbücher, Tabellenwerke
[203] Abramovitz, M., Stegun, I.A. (Eds.): Handbook of Mathematical Functions.
Dover 1970.
[204] Doetsch, G.: Handbuch der Laplace–Transformation 1–3 . Birkhäuser 1971–73.
[205] Erdelyi, A., Magnus, W., Oberhettinger, F., Tricomi, F.G.: Higher Tran-
scendental Functions 1–3 . Mc Graw–Hill Book Comp. 1953, Krieger Publ. Co.
1981.
[206] Gradshsteyn, I.S., Ryzhik, I.M.: Table of Integrals, Series, and Products.
Acad. Press 1994.
[207] Jahnke, E., Emde, F., Lösch, F.: Tafeln höherer Funktionen. Teubner 1966.
[208] Jeffrey, A.: Tables of Integrals, Series and Products. Academic Press 2008.
[209] Magnus, W., Oberhettinger, F., Soni, R.P.: Formulas and Theorems for the
Special Functions of Mathematical Physics. Springer 1966.
[210] Zeidler, E. (Hrsg.): Springer–Taschenbuch der Mathematik. Springer 2013.
Symbole und Abkürzungen
DG, 28 Ã
2 , 2 ( ), 223
AWP, 28, 401, 429 20 , 224
Dy f , 30 U ⊥ , 225
Lip , 31 U ⊥⊥ , 226, 228
ϕ(x, ξ, η ), 37 V ⊕ W , 227
J(ξ, η ), 37 supp u, 242
t → ϕ(t, η ), 40 Ckc (Ω), C∞
c (Ω), 242
J(η ), 40 u ∗ v (Faltung), 244
Y (x, ξ), 55 Ta M (Tangentialraum), 264
etA , 58 Ck (M ), 264
p(T ), 60 Am (M ), Am (K), 267
L (V ), 60 L∗ , 275, 277
Æ0, 75 C1n (Ω), 277
P , Pm (Legendre–Funktionen), 88 /
u(x), 286
Ln , Lm
n (Laguerre–Polynome), 91 Pk , Qk , 287
Jν , J−ν (Bessel–Funktionen), 94 Ê
S = S ( n ), 292
D , D , 307
(1) (2)
Hν , Hν (Hankel–Funktionen), 95
Nν , Yν (Neumann–Funktionen), 95 δ, δa (Dirac–Distribution), 307
(λ)n , 95 ∂ α T (Distributionen), 312
S
J(η ), 98 ϕk −→ ϕ, 319
ϕ(t, η ), 98 Ê
S = S ( n ), 319
Ωf , 98 T/, 322
∂f V (x), 121 Γx , 330
Ck (Ω), 133, 255 C1g (Ω), 359
PC [a, b], 139 ∂i u, 362
PC1 [a, b], 139 W1 (Ω), W1 (I), 362, 368
∇x , ∇z , ∇p , ∇q , 184 W01 (Ω), 363
f.ü., 204, 523, 530 H1 (Ω), 366
L1 (Ω), 207, 530 H10 (Ω), 366
L2 (Ω), 212 Wk (Ω), 367
L2 (Ω), 213 →, 369
Lp (Ω), 215, 242 jν,k (Nullstellen der Besselfunkt.), 385
u∞ , 217, 583 ΔS 2 , ΔM , 390, 393
L∞ (Ω), 217, 242 Y m (Kugelfunktionen), 397
L1loc (Ω), 217, 242 H (Wärmeleitungsoperator), 401
H , 221, 547 ARWP, 401, 430

Symbole und Abkürzungen 745
uC0 (I,H ) , 416 w–lim Tn , 563

n→∞
L2 (J, H ), 417 T − λ, λ − T , 568
uL2 (J,H ) , 417 (T ), (A), 568, 664
Wk (J, H ), 418 R(λ, T ), 568
¡ (d’Alembert–Operator), 429 σ(T ), σ(A), 568, 664
x, 429 σp (T ), σp (A), 568, 665
∇, 429 σc (T ), σc (A), 568, 665
Sr (x), 444 σr (T ), σr (A), 568, 665

− u do, 444 σapp (T ), σapp (A), 572, 666
| ϕ ϕ |, 473, 618 p(T ), f (T ), 580, 582
μu , /
/ μϕ , 475 C∗ (T ), 583
P (X = x), P (X ∈ A), 478, 479, 480 e−itT , 587
b(n, p), 479 T 1/2 , 589
δa (Dirac–Maß), 481 | T |, 590
/ 483
X, F, 591
σ(K) (σ–Algebren), 494 Eλ (Spektralschar), 596, 705
B( Ên ), 494 μu (Spektralmaß), 597, 705
]a, b], 495 Z(a), 606
Ln , V n , 503 L2 -lim , 608
n→∞
λ, λn (Lebesgue–Maß), 503 ?
∞
H k , 611
μ–f.ü., 511, 523 k=1
{f ∈ B}, {f ≤ β}, {α < f ≤ β}, 514 tr (T ), tr (AT ), 633, 635
f = lim fn μ–f.ü., 518 P, Q, 642
n→∞
D(A), 644
f dμ, 519, 520
Ω C20 [a, b], 644
L1 (Ω, μ), L1 (Ω), 521 H × H , 645
Lp (Ω, μ), 538 G(A) (Graph von A), 645
L∞ (Ω, μ), 540 A ⊂ B (Operatoren), 645
T , 548 A (Operatoren), 647
L (H ), 549 · A , 649
Ma , 552, 646 W01 [a, b], 653
Mv , 553, 647 W1 (I), 655
T ∗ , 557 W10 ( Ê+ ), 656
T ≥ 0, T > 0, A ≥ 0, 562 A∗ , 659
T ≥ 0, T > 0, A ≥ 0, 681 R(λ, A), 664
S ≤ T , 562 f (A), 703
lim Tn , 562
n→∞
Ê
Cb ( ), 704
s–lim Tn , 562 e−iAt , 715
n→∞
Index
abgeschlossener Operator, 649 Binomialverteilung, 478
Ableitung Borelmengen, 494
schwache, 361 Brennpunkt (char. Projektion), 176
abschließbarer Operator, 648
Abschluss eines Operators, 647 Ck –Differenzierbarkeit auf Ω, 255
abschnittsweis glatt, 140 Cr –berandet, 273
absolutstetig, 219 Cauchy–Problem, 172, 401
Adjungierte, 659 Cauchy–Schwarzsche Ungleichung
adjungierter Operator, 557, 659 für positive Operatoren, 562
d’Alembert Cayley–Hamilton, 65
Lösungsformel, 152, 442 Cetaev (Instabilitätssatz), 123
Reduktionsverfahren, 72 Charakteristik, 174, 185
Saitenschwingung, 177 Charakteristikenmethode, 186
d’Alembert–Operator, 429 charakteristische DG, 174, 184
Anfangs–Randwertproblem charakteristische Gleichung, 83
schwingende Saite, 134 charakteristische Hyperfläche, 433
Wärmeleitungsgleichung, 401 charakteristische Projektion, 174, 185
Wellengleichung, 453 charakteristische Umgebung, 175
Anfangswertproblem, 28
Dichteoperator, 638
als Integralgleichung, 30
Differentialgleichung
für DG n–ter Ordnung, 29
explizite, 28
für die Wärmeleitungsgl., 401
implizite, 28
in Fixpunktform, 30
implizite 1. Ordnung, 183
approximatives Punktspektrum, 572,
quasilineare 1. Ordnung, 172
666
Differentialgleichungssysteme
asymptotisch stabil, 117
1. Ordnung, 199
Atlas, 262
Dirac–Distribution, 307, 309
attraktiv, 117
Dirac–Maß, 481, 512
Außenraum, 326
direkte Summe, 62, 611
Autonome Systeme, 31, 40, 98 Dirichlet
avanciertes Potential, 453 Satz von, 140
Dirichlet–Integral, 359
Banachraum, 215 Dirichlet–Problem, 20, 164, 325
Beobachtungswert Dirichletsches Eigenwertproblem, 372
möglicher, 504, 602, 699, 726 disjunkte Darstellung, 510
Bernoulli–Experiment, 477 diskrete Verteilung, 481
beschränkter Operator, 547 diskretes Spektrum, 683
Bessel–Funktionen, 94, 384 diskretes Wahrscheinlichkeitsmaß, 481
Besselsche DG, 71, 93 dissipativ, 103
Besselsche Ungleichung, 236 Distribution, 307
Betrag eines Operators, 590 Ableitung, 312
Bicharakteristik, 438 reguläre, 307
Bildmaß, 535 singuläre, 308

Index 747
temperierte, 319 Fourierintegral, 295

Drehimpulsoperatoren, 722 Fourierkoeffizienten, 139
Duhamelsches Prinzip verallgemeinerte, 235
Wärmeleitungsgleichung, 414 Fourierreihe, 139, 236, 372
Wellengleichung, 451 Fouriertransformation
Ê
auf S ( n ), 322
Eikonalgleichung, 192, 195 Ê
auf S ( n ), 294
Einbettungssatz Ê
auf L2 ( n ), 298
von Morrey–Sobolew, 369 Ê
auf L1 ( n ), 286
Eindeutigkeitssatz Fouriertransformierte, 286
für gewöhnliche DG, 34 Frobenius–Methode, 81
eingesperrtes Teilchen, 627, 657, 687 Fundamentallemma, 233
Elementarfunktionen, 205, 509 der Variationsrechnung, 252
Energie (Wellengleichung), 431 Fundamentalmatrix, 44, 55
Energieerhaltungssatz, 102, 432 Fundamentalsystem, 44, 55, 68
Erhaltungsgröße, 102 Funktional
erstes Integral, 102, 124 lineares, stetiges, 230
Erwartungswert, 470, 474, 475, 483, 706, Funktionalkalkül
708 allgemeiner, 614, 615, 704
transformierter Zufallsgrößen, 484, für F, 703
535 für die Klasse F , 592
erzeugende Funktion, 76 für Polynome, 580
erzeugte σ–Algebra, 494 für stetige Funktionen, 582, 703
Eulersche DG, 73, 81
Eulersche DG (Strömungsmechanik), Gauß–Verteilung, 490
22 Gaußscher Integralsatz, 273
Existenz– und Eindeutigkeitssatz Gen, 650
gewöhnliche DG, 37 Genbereich, 650
partielle DG 1. Ordnung, 187 Gesetz der großen Zahl, 489
quasilineares Cauchy–Problem, 175 Gibbsches Phänomen, 141
explizite DG n–ter Ordnung, 28 Glättung, 246
explizite Differentialgleichung, 28 Gleichgewichtspunkt, 100
asymptotisch stabiler, 117
Faltung, 244 attraktiver, 117
Faltungssatz, 292, 296 hyperbolischer, 104
fast überall, 204, 523 instabiler, 117
μ–fast überall, 523 stabiler, 117
Fixpunktform einer DG, 30 globaler Fluß, 131
Fluß Gramsche Determinante, 265, 279
globaler, 131 Gramsche Matrix, 265, 279
Flußabbildung, 128 Graph eines Operators, 645
formal adjungierter Differentialopera- Graphennorm, 649
tor, 275, 277 Greensche Formeln
Formen und Operatoren, 560, 689 verallgemeinerte, 277
für autonome Systeme, 40 Greensche Funktion
fur Prämaße, 500 erster Art, 333
748 Index
zweiter Art, 333, 354 Integralgleichung, 358

Greensche Identitäten, 275 Integralkurven, 100, 438
Grenzwertsatz Integraloperatoren, 357, 551
de Moivre–Laplace, 490 Integration
zentraler, 491 auf Untermannigf., 266
Gronwallsches Lemma, 33 partielle, 220, 274
Grundlösung, 315 invariant
Laplace–Operator, 330 unter einem Fluß, 131
Wärmeleitung, 403 invarianter Teilraum, 701
Invarianz des Laplace–Operators unter
Höldersche Ungleichung, 216 Bewegungen, 327
halbbeschränkter Operator, 681 Invertierbarkeit in L (H ), 556
Halbfluß, 131 Isomorphiesatz für Hilberträume, 240
Hamilton–Cayley, 65 Isomorphismus
Hamilton–Funktion, 102, 191 unitärer, 222
Hamilton–Operator, 473, 657
Hamiltonsches System, 102, 124 Jordansche Normalform, 66
Hankel–Funktionen, 95
harmonische Funktionen, 164, 327 kanonischen Gleichungen, 192
harmonischer Oszillator (QM), 688 Karte, 259
Harnacksche Ungleichung, 171 Kegelbedingung, äussere, 350
Hauptsatz (Lebesgue), 220 Kelvin–Transformation, 343
Heisenbergsche Unschärferelation, 707 klassische Lösung, 304
Hermite–Funktionen, 300, 688 kleine Störung, 692
Hermite–Polynome, 77, 300 Knickstelle, 139
Hermitesche DG, 71, 77, 300 Kommutator, 617
Hilbertraum, 221 kompakte Operatoren, 358, 617, 684
Hilbertraumisomorphismus, 222 kompatible Observable, 727
Hilbertscher Folgenraum, 223 kontinuierliches Spektrum, 568, 665
Hilbertsches Lemma, 254 Konvergenz
Huygenssches Prinzip μ–f.ü., 518
geometrische Optik, 193 im Distributionensinn, 309
Wellengleichung, 448 im Quadratmittel, 214
hyperbolischer Gleichgewichtspunkt, 104 in der Operatornorm, 562
hypergeometrische DG, 97 schwache, 563
starke, 562
ideale Messungen, 640 Koordinatentransformation, 261, 279
implizite Differentialgleichung, 28 Kosinusreihe, 146
Impulsoperatoren, 287, 473, 475, 642, kritischer Punkt (Vektorfeld), 100
656, 675, 678, 717 Kugelfunktionen, 384
Indexgleichung, 83
Innenraum, 326 L2 –Funktion, 213
instabil, 117 Lp –Raume, 215
Integral Lösung
erstes, 102 maximale, 37
integraldefinierende Folge, 519 Lagrange–Funktion, 191
Index 749
Lagrange–Identitat, 72 maximale Lösung, 37

Laguerre–Polynome, 91 Maximumprinzip
zugeordnete, 91 Dirichlet–Problem, 170
Laguerresche DG, 90 für holomorphe Funktionen, 340
Laplace–Beltrami–Operator, 393 Laplace–Operator, 327
Laplace–Gleichung, 20, 326 strenges, 327, 339, 407
Laplace–Operator, 325, 326, 690 subharmonische Funktionen, 339
Ê
auf dem n , 680 Wärmeleitung, 161, 404, 405
Ê
auf dem n , 673 Maxwellsche Gleichungen, 20
in Kugelkoordinaten, 280, 391 meßbar
in Polarkoordinaten, 164 Lebesgue–, 203
Lebesgue meßbare Funktionen, 205, 514, 519
Satz von, 528 meßbare Menge, 496, 508
Lebesgue–Integral, 206, 530 Meßwert
Lebesgue–Maß, 203, 503 möglicher, 504, 602, 699, 726
Legendre–Funktionen Messung
zugeordnete, 88, 393 ideale, 640
Legendre–Polynome, 76, 239, 393 scharfe, 602, 727
Legendresche DG, 71 Minimalpolynom, 61
allgemeine, 87 Minkowskische Ungleichung, 216
Leibnizregel, 245 Mischung von Wahrscheinlichkeitsma-
Lemma von du Bois–Reymond, 252 ßen, 505
linear beschränkte Systeme, 42 Mittelwerteigenschaft
lineare DG harmonischer Funktionen, 338
n–ter Ordnung, 67 μ–Integral, 511, 519, 520
mit konstanten Koeffizienten, 68 μ–integrierbar, 519
lineare Systeme μ–Majorante, 524
gewöhnlicher DGn, 31, 55 μ–Nullmenge, 502
komplexe Lösungen, 59 Multiindex, 244
konstante Koeffizienten, 58 Multiplikatordarstellung, 607, 613, 699
linearisierte DG, 48 Multiplikatoren
Linearisierungssatz auf 2 , 552, 646
von Grobman–Hartman, 104 auf L2 (Ω, μ), 553, 647
Linksshift, 550
Lipschitz–Bedingung, 31 Navier–Stokes–Gleichungen, 22
Ljapunow–Funktion, 121 Neumann–Problem, 20, 159, 325
lokalintegrierbar, 217 für Außenräume, 354
für Innenräume, 353
Maß, 496 Neumann–Funktionen, 95
σ–endliches, 496 Neumannsche Reihe, 575
endliches, 496 Neumannsches Eigenwertproblem, 373
Majorantenkriterium, 524 Newton–Potential, 330
majorisierte Konvergenz, 528 nichtentartetes Spektrum, 605, 606
Mannigfaltigkeit Normalgebiet, 273
orientierbare, 263 Normalverteilung, 491
maximal symmetrisch, 646 Normkonvergenz (Operatoren), 562
750 Index
Normschranke, 547 Fehlerabschätzung, 36

Nullmenge, 204 Plancksches Wirkungsquantum, 465
Poincaré–Ungleichung, 363
Oberflächeninhalt, 267 Poisson–
Observable, 473, 723 Gleichung, 20, 326
kompatible, 727 Integral, 167, 336
ONS, Orthonormalsystem, 233 Kern, 167, 336
vollständiges, 236, 237 Verteilung, 479
Operator Poissonsche Darstellungsformel (Wel-
abgeschlossener, 649 lengleichung), 447
abschließbarer, 648 Polarisierungsgleichung
adjungierter, 557, 659 für Formen, 560
beschränkter, 547 für Operatoren, 561
halbbeschränkter, 681 Polarzerlegung, 590
kompakter, 358, 617, 684 polynomial beschränkt, 293
linearer, 644 positive Operatoren, 562, 589
mit diskretem Spektrum, 683 Potential
positiver, 562, 589 der doppelten Schicht, 353, 355
selbstadjungierter, 661, 676 der einfachen Schicht, 353, 355
symmetrischer, 558, 644 Potentialtheorie, 355
von endlichem Rang, 617 P ,Q–Gesetz, 287, 294
wesentlich selbstadjungierter, 680 Prämaß, 499
Orbit, 100 Projektor
orientierbare Mannigfaltigkeit, 263 orthogonaler, 228
Orientierung, 263 Punktspektrum, 568, 665
orthogonale Projektion, 226
orthogonaler Projektor, 228 quadratische Form, 560
Orthogonalreihe, 234 Quantisierung, 473, 722, 723
Orthonormalsystem, 233 quasilineare DG, 172
Ortsoperatoren, 287, 473, 475, 642, 717 quasilineare DG 1. Ordnung, 172
Parameterintegrale, 210 Radon–Nykodym, 532

Parametertransformation, 261 Randwertproblem
Parameterumgebung, 259 erstes, 325
Parametrisierung zweites, 325
einer Untermannigf., 259 Rayleigh–Prinzip, 377, 622
Parseval–Plancherel–Formel, 298 Rechtsshift, 550
Parsevalsche Gleichung, 236 regulär im Unendlichen, 344
partielle Integration, 220, 274 regulärer Randpunkt, 272
Pendel, 103, 116, 130 Regularisierung, 246
periodische Standardfortsetzung, 140 Regularitätssatz (Dirichlet–Problem),
Phasenbild, 101 370
Phasenportrait, 101 relative Häufigkeit, 481
Phasenraum, 100 Rellichscher Auswahlsatz, 364
Picard–Iterierte, 34 Resolvente, 568, 576, 664, 669
Picard–Lindelöf, 34 Resolventenmenge, 568, 664
Index 751
Restspektrum, 568, 665 selbstadjungierte Operatoren, 661, 676

retardiertes Potential, 452 selbstadjungierter Differentialoperator,
Riemann–Stieltjes–Summen, 533 275
Riesz–Fréchet separabler Raum, 218, 544
Darstellungssatz, 231 Separationsmethode, 70, 134, 150
Rodrigues–Formel, 76, 78, 91 Sesquilinearform, 560
σ–Additivität, 203, 482, 496
Satz von σ–Algebra, 203, 493
Beppo Levi (monotone Konver- erzeugte, 494
genz), 208, 525 singuläre DG 2. Ordnung, 14
Cayley–Hamilton, 65 Singularitäten
der gleichmäßigen Beschränktheit, schwache, 80, 437
564 Sinusreihe, 146
der monotonen Konvergenz, 525, Sobolew–Räume, 362
566 spektraler Abbildungssatz, 580, 584
Dirichlet, 140 spektraler Teilraum, 701
Fischer–Riesz, 214, 539 Spektralmaß, 597, 705, 708
Fubini, 211
Spektralprojektor, 701
Hellinger und Toeplitz, 646
Spektralsatz
Hilbert–Schmidt, 622
beschränkte symm. Op., 599
Kato–Rellich, 693
kompakte symm. Op., 622
Lebesgue (kleiner), 529
selbstadjungierte Op., 705
Lebesgue (majorisierte Konvergenz),
Spektralschar, 596, 705
208, 528
Spektralzerlegung, 598, 702
Radon–Nykodym, 532
Spektrum, 568, 664
Stone, 718
approximatives Punkt–, 572, 666
Tietze–Uryson, 256
diskretes, 683
Tonelli, 212
scharfe Messung, 602, 727 in der Physik, 470, 574
schnellfallende Funktionen, 292 kontinuierliches, 568, 665
Schrödinger–Gleichung, 24, 467, 687 nichtentartetes, 605, 606
Schrödinger–Operator, 691, 697 Punkt–, 568, 665
schwach meßbar, 416 Rest–, 568, 665
schwache Ableitung, 361 und mögliche Messwerte, 726
schwache Konvergenz, 563 sphärisches Mittel, 444
schwache Lösung, 303 spherical harmonics, 384
Dirichlet–Problem, 365, 370 Sprungstelle, 139
Wellengleichung, 455 Spur, 633, 635
schwache Losung Spurklasse, 633
Wärmeleitungsgleichung, 420 Störung, kleine, 692
schwache Singularitäten stückweis glatt, 139
lineare DG 2. Ordng., 80 stückweis stetig, 139
Stoßwellen, 436 stabil, 117
Schwartz–Raum, 292 Stabilitätssatz
schwingende Saite, 15, 133, 148 Eigenwertkriterium, 118
inhomogene, 629 Ljapunow, 122
752 Index
Standardabweichung, 486 Vektor

Standardvoraussetzung für GDG, 30 zyklischer, 606
starke Konvergenz, 562 vertauschbare Operatoren, 616, 730
stationärer Punkt (Vektorfeld), 100 Verteilung, 504
statistisches Gemisch, 637, 639 der Beobachtungswerte, 725
Stetigkeit von Maßen, 497 diskrete, 480
Stoßwelle einer Zufallsgröße, 478, 480, 504
schwache, 436 mit Dichte, 490, 491, 532
Streuung, 486, 535 und Verteilungsfunktion, 506
Sturm–Liouville–Form, 71 Verteilungsfunktion, 505
Subadditivität von Maßen, 498 vollständiges ONS, 236, 237
subharmonisch, 339 Vollständigkeit von Lp (Ω, μ), 539
Summe Volumenpotential, 352, 355
direkte, 611
Superpositionsprinzip, 148 Wärmeleitungsgleichung, 19, 401
support, 242 Wärmeleitungskern, 403
symmetrischer Operator, 558, 644 Wärmeleitungsproblem
im Draht, 156
Tangentialraum, 264 in der Kreisscheibe, 164
Teilraum Wahrscheinlichkeitsmaß, 497, 504
A–invarianter, 701 Wahrscheinlichkeitsraum, 497
temperierte Distribution, 319 Weierstraßscher Approx.satz, 148
Testfunktion, 242 Wellenfronten und Strahlen, 441
Tietze–Uryson, 256 Wellenfunktion, 467
Träger, 242, 510 Wellengleichung, 18, 442, 449
Transformationssatz avanciertes Potential, 453
für Bildmaße, 535 inhomogene, 154, 451
Transformationssatz für Integrale, 212 retardiertes Potential, 452
Transversalitätsbedingung, 187 wesentlich selbstadjungiert, 680
Tschebyschewsche Ungleichung, 487 Wirkungsquantum, 465
Tschetajew (Instabilitätssatz), 123 Wronski–Determinante, 56, 68
Umgebung Zerlegungssatz
charakteristische, 175 für Hilberträume, 227
Umkehrsatz (Fouriertransformation), 292, Minimalpolynom, 62
294, 296 Zufallsgröße
unitär äquivalente Operatoren, 222, 614 diskret verteilte, 480
unitäre Abbildung, 221 allgemeine, 504, 536
unitäre Gruppe, 468, 587, 685 Zufallsvariable, 536
unitärer Isomorphismus, 222 Zustand, 466, 472, 724
unitare Gruppe, 715 Zustandsvektor, 472
Ê
Untermannigfaltigkeiten des n , 257 zwiebelweise Integration, 270
zyklischer Teilraum, 608
Varianz, 486, 535, 706, 708 zyklischer Vektor, 606
Variation der Konstanten, 57
Variationsgleichung, 48

Mathematik Für Physiker Band 2 Gewöhnliche Und Partielle Differentialgleichungen, Mathematische Grundlagen Der Quantenmechanik by Helmut Fischer, Helmut Kaul (Auth.)

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Mathematik Für Physiker Band 2 Gewöhnliche Und Partielle Differentialgleichungen, Mathematische Grundlagen Der Quantenmechanik by Helmut Fischer, Helmut Kaul (Auth.)

Hochgeladen von

Copyright:

Verfügbare Formate

Mathematik für Physiker Band 2

Helmut Fischer • Helmut Kaul

Mathematik für Physiker

4., aktualisierte Auflage

ISBN 978-3-658-00476-7 ISBN 978-3-658-00477-4 (eBook)

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Natio-

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.

geben, sich einschlägige Argumentations- und Arbeitsweisen anzueignen. Wo

Tübingen, Mai 2014 H. Fischer, H. Kaul

Wegweiser. Mit den Grundkenntnissen aus Band 1 direkt zugänglich sind § 6

Fehlermeldungen und Verbesserungsvorschläge von unseren Lesern neh-

Kapitel II Gewöhnliche Diﬀerentialgleichungen

Kapitel III Partielle Differentialgleichungen, elementare

§6 Separationsansätze und Fourierreihen

Kapitel IV Hilfsmittel aus der Analysis

Kapitel V Die drei Grundtypen linearer Diﬀerentialgleichungen

Kapitel VI Mathematische Grundlagen der Quantenmechanik

§ 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Namen und Lebensdaten . . . . . . . . . . . . . . . . . . . . . . . . . 732

Symbole und Abkürzungen . . . . . . . . . . . . . . . . . . . . . . . . 744

§ 1 Beispiele für Diﬀerentialgleichungsprobleme

ẏ(t) = f (t, y(t)) , kurz ẏ = f (t, y).

Von solchen Systemen erwarten wir deterministisches Verhalten: Durch Kennt-

(∗) ẏ = f (t, y) , y(t0 ) = y0 .

q̇ = M (q) p , ṗ = −∇U (q) − D(q) p

mit positiv deﬁniten Massematrizen M (q) und Dämpfungsmatrizen D(q).

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,

1.2 Singuläre Diﬀerentialgleichungen zweiter Ordnung

1.3 Die Charakteristikenmethode

aufzubauen, die durch ein System gewöhnlicher Diﬀerentialgleichungen gegeben

In § 6 wird gezeigt, dass das hiermit formulierte Anfangs–Randwertproblem un-

2.2 Herleitung der Wellengleichung aus dem Hamiltonschen Prinzip

hierbei ist die Konstante σ > 0 der Spannungskoeﬃzient der Saite.

ist W (u + sϕ) ein Polynom zweiten Grades in s, also muss gelten

2.3 Die schwingende Membran

Der Laplace–Operator wirkt dabei nur auf die Ortsvariablen,

2.4 Die Wellengleichung im Ê n

Hierunter verstehen wir die Diﬀerentialgleichung

Für jede C2 –Funktion U : Ê → Ê und jeden Vektor k ∈ Ên

2.5 Die Wärmeleitungsgleichung

Wie in Bd. 1, § 26 : 6.1 erhalten wir hieraus die Wärmeleitungsgleichung.

u(x, 0) = u0 (x) für x ∈ Ω

wird eine Anfangstemperaturverteilung u0 ∈ C(Ω) vorgeschrieben. Hinzu kom-

u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

(Dirichletsches oder erstes Randwertproblem).

k ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

(Neumannsches oder Zweites Randwertproblem). Dabei ist n das äußere

a(x, t) u(x, t) + k b(x, t) ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

mit |a| + |b| > 0.

bzw. bei nichtvorhandenen Wärmequellen ( f = 0 ) der Laplace–Gleichung

Bei dieser Gleichung entfällt die Anfangsbedingung.

2.6 Die Maxwellschen Gleichungen

(2) div (μH) = 0 , div (εE) = 4π .

(Maxwell 1856, gestützt auf Vorarbeiten von Ampère, Faraday u.a.).

2.7 Die Gleichungen der Strömungsmechanik

hierbei ist die konstante Massendichte und μ ≥ 0 die Zähigkeitskonstante

| − 0| 1, p ( 0 ) > 0 für die Zustandsgleichung p = p( ),

(ii) Vernachlässigung der Konvektionsterme in den Eulerschen Gleichungen,

(iii) rotationsfreies Geschwindigkeitsfeld, rot v = 0,

Die Zustandsgrößen v, erfüllen also die Wellengleichung mit c = p ( 0 ) als

3 Was bedeutet Lösung einer Diﬀerentialgleichung“?

f (x, y) − f (x, z) ≤ L y − z

f (x, y) − f (x, z) ≤ A(x)2 y − z ,

M := max {f 0 (x, y) | (x, y) ∈ K} ,

ε1 := max {f 0 (x, y) − f (x, y) | (x, y) ∈ K} .

Daher gilt mit ε0 := η 0 − η + | ξ0 − ξ |M

(x) := u0 (x) − u(x) ≤ δ , d.h. (x, u(x)) ⊂ K für |x − x0 | ≤ r .

f (t, u(t)) − f (t, uk (t)) ≤ L u(t) − uk (t)