Sie sind auf Seite 1von 750

Mathematik für Physiker Band 2

Helmut Fischer • Helmut Kaul

Mathematik für Physiker


Band 2
Gewöhnliche und partielle
Differentialgleichungen, mathematische
Grundlagen der Quantenmechanik

4., aktualisierte Auflage


Helmut Fischer
Helmut Kaul
Univ. Tübingen
Tübingen, Deutschland

ISBN 978-3-658-00476-7 ISBN 978-3-658-00477-4 (eBook)


DOI 10.1007/978-3-658-00477-4

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Natio-


nalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de
abrufbar.

Springer Spektrum
© Springer Fachmedien Wiesbaden 1998, 2004, 2008, 2014
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung,
die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen
Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen,
Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektro-
nischen Systemen.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in


diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass
solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu
betrachten wären und daher von jedermann benutzt werden dürften.

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.


Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media.
www.springer-spektrum.de
Vorwort
In diesem Band behandeln wir die Theorie und elementare Lösungsmethoden für
wichtige Grundtypen von Differentialgleichungen der Physik und stellen mathe-
matische Grundlagen für die Quantenmechanik bereit. Zielgruppe sind Studie-
rende und Absolventen der Physik und der Mathematik, die sich mit Methoden
und Ergebnissen der mathematischen Physik vertraut machen wollen.
Für die zahlreichen hier behandelten Problemstellungen und Methoden gibt es
über die Literatur verstreut gute und detaillierte Darstellungen, deren gezielte
Nutzung für Studierende aber oft einen großen Aufwand bedeutet. Wir wollen
mit diesem Werk eine Übersicht geben und eine Orientierungshilfe bieten, indem
wir wichtige Methoden vorstellen und die leitenden Grundgedanken herausar-
beiten, die Theorie aber nicht bis in die letzten Details verfolgen.
Bei der Organisation dieses Bandes ließen wir uns von folgenden Gesichtspunk-
ten leiten: Es sollte ein Leserkreis unterschiedlicher mathematischer Vorbildung
angesprochen werden. Die Möglichkeit von Quereinstiegen sollte so gut es geht
geboten und erleichtert werden. Daher verbot es sich, die benötigten umfang-
reichen Hilfsmittel aus der Analysis an den Anfang zu stellen, was zur Folge
gehabt hätte, dass die Leser erst nach mehr als 120 Seiten bei den Kernthemen
angekommen wären.
Dementsprechend sind wir stufenweise vorgegangen. Die ersten drei Kapitel set-
zen nur Kenntnisse aus Band 1 voraus. Sie führen in die Theorie gewöhnlicher
Differentialgleichungen ein und enthalten partielle Differentialgleichungen, die
sich mit elementaren Methoden behandeln lassen. Hierbei geht es um die schwin-
gende Saite, die Wärmeleitung in einem Draht, die stationäre Wärmeverteilung
in der Kreisscheibe und nichtlineare partielle Differentialgleichungen erster Ord-
nung. Erst danach wird der für mehrdimensionale Differentialgleichungsproble-
me benötigte mathematische Apparat in einem eigenen Kapitel bereitgestellt:
Übersicht über die Lebesgue–Integration, Hilberträume, Glättung von Funktio-
nen, Integralsätze, Fouriertransformation, schwache Lösungen und Distributio-
nen. Da die dort entwickelten Hilfsmittel in den folgenden Kapiteln nicht gleich
von Anfang an und auch nicht alle zugleich verwendet werden, empfehlen wir
den Lesern, sich diese erst bei Bedarf anzueignen; die benötigten Vorkenntnisse
werden jeweils zu Beginn eines Paragraphen genannt. Der Wegweiser auf der
folgenden Seite kann der groben Orientierung dienen.
Bei diesem Aufbau waren Brüche nicht zu vermeiden. So werden z.B. die das
Lebesgue–Integral betreffenden Beweise erst später im Rahmen einer allgemei-
nen Integrationstheorie nachgeholt, und für die Entwicklung nach Eigenfunk-
tionen des Laplace–Operators in § 15 wird auf den Spektralsatz für kompakte
Operatoren aus § 22 vorgegriffen.
Die meisten Beweise sind ausgeführt, um den logischen Zusammenhang der
jeweiligen Theorie erkennbar zu machen und um dem Leser die Möglichkeit zu
6 Vorwort

geben, sich einschlägige Argumentations- und Arbeitsweisen anzueignen. Wo


Beweise weggelassen werden, haben wir uns bemüht, den Zugang zur Literatur
gezielt zu erleichtern.
Nachdem in der dritten, überarbeitenden Auflage noch die alte Rechtsschrei-
bung der ersten Auflage von 1998 beibehalten wurde, haben wir die vorliegende
Auflage auf die neue Rechtschreibung umgestellt. Inhaltlich hat sich gegenüber
der dritten Auflage nichts Wesentliches gendert.
Wir danken den Herren J. Hellmich, J. Hertle, R. Honegger und B. Kümme-
rer dafür, dass sie uns in vielen Diskussionen zu Fragen der Quantenmechanik
beraten haben. Unser ganz besonderer Dank gilt Ralph Hungerbühler für die
drucktechnische Ausgestaltung der ersten drei Auflagen und die Anfertigung der
Figuren. Ohne seine Unterstützung wäre dieser Band nicht zustande gekommen.

Tübingen, Mai 2014 H. Fischer, H. Kaul

Zum Gebrauch. Ein Querverweis wie z.B. § 2 : 6.7 (b) bezieht sich auf § 2,
Abschnitt 6, Unterabschnitt 6.7, Teil (b). Innerhalb von § 2 wird die betreffende
Stelle lediglich in der Form 6.7 (b) zitiert.
Literaturverweise wie z.B. auf [130] Reed, M., Simon, B.: Methods of Modern
Physics I–IV, Band II, Theorem X.14 erfolgen nach dem Muster
[130, II] X.14 oder [Reed–Simon II] X.14.
Durch das Symbol ÜA (Übungsaufgabe) wird dazu aufgefordert, Rechnungen,
Beweisschritte oder Übungsbeispiele selbst auszuführen.

Wegweiser. Mit den Grundkenntnissen aus Band 1 direkt zugänglich sind § 6


(Fourierreihen, Separationsansätze), §§ 8, 9 (Lebesgue–Integral, Hilberträume),
§ 12 (Fouriertransformation), jeweils die ersten drei Abschnitte von § 16 (Wär-
meleitungsgleichung) und von § 17 (Wellengleichung) sowie §§ 19, 20 (Wahr-
scheinlichkeit, Maß und Integral). Die Charakteristikenmethode für partielle
Differentialgleichungen erster Ordnung in § 7 setzt die Theorie gewöhnlicher
Differentialgleichungen (§ 2) voraus. Für das Schlusskapitel über mathemati-
sche Grundlagen der Quantenmechanik sind elementare Kenntnisse über das
Lebesgue–Integral nützlich und die Theorie der Hilberträume (§ 9) unerlässlich;
darüber hinaus sind nur wenige, zu Beginn jedes Paragraphen benannte Vor-
kenntnisse aus dem vorangehenden Text erforderlich.

Fehlermeldungen und Verbesserungsvorschläge von unseren Lesern neh-


men wir dankbar entgegen unter helmut.kaul@uni-tuebingen.de.
Inhalt

Kapitel I Übersicht
§ 1 Beispiele für Differentialgleichungsprobleme
1 Gewöhnliche Differentialgleichungen . . . . . . . . . . . . . . . . . . 13
2 Partielle Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 15
3 Was bedeutet Lösung einer Differentialgleichung“? . . . . . . . . . 23

4 Die Schrödinger–Gleichung . . . . . . . . . . . . . . . . . . . . . . . 24

Kapitel II Gewöhnliche Differentialgleichungen


§ 2 Grundlegende Theorie
1 Das allgemeine Anfangswertproblem . . . . . . . . . . . . . . . . . . 27
2 Das Anfangswertproblem als Integralgleichung . . . . . . . . . . . . 29
3 Die Standardvoraussetzung für DG–Systeme . . . . . . . . . . . . . 30
4 Kontrolle und Eindeutigkeit von Lösungen . . . . . . . . . . . . . . 32
5 Existenz von Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . 34
6 Zum Definitionsintervall maximaler Lösungen . . . . . . . . . . . . 38
7 Differenzierbarkeitseigenschaften von Lösungen . . . . . . . . . . . . 44
§ 3 Allgemeine lineare Theorie
1 Lineare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2 Zur algebraischen Bestimmung von etA . . . . . . . . . . . . . . . . 59
3 Die lineare Differentialgleichungen n–ter Ordnung . . . . . . . . . . 67
§ 4 Lineare Differentialgleichungen zweiter Ordnung
1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2 Sturm–Liouville–Form und Fundamentalsysteme . . . . . . . . . . . 71
3 Potenzreihenentwicklungen von Lösungen . . . . . . . . . . . . . . . 74
4 Reihendarstellung von Lösungen in singulären Randpunkten . . . . 80
§ 5 Einführung in die qualitative Theorie
1 Autonome Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2 Phasenportraits linearer Systeme in der Ebene . . . . . . . . . . . . 105
3 Die Differentialgleichung ẍ = F (x) . . . . . . . . . . . . . . . . . . 109
4 Stabilität von Gleichgewichtspunkten . . . . . . . . . . . . . . . . . 117
5 Die direkte Methode von Ljapunow . . . . . . . . . . . . . . . . . . 120
6 Die Sätze von Liouville und Poincaré–Bendixson . . . . . . . . . . . 128
8 Inhalt

Kapitel III Partielle Differentialgleichungen, elementare


Losungsmethoden
¨

§6 Separationsansätze und Fourierreihen


1 Die schwingende Saite I . . . . . . . . . . . . . . . . . . . . . . . . . 133
2 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3 Die schwingende Saite II . . . . . . . . . . . . . . . . . . . . . . . . 148
4 Wärmeleitung im Draht . . . . . . . . . . . . . . . . . . . . . . . . . 156
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe . . . . . 164
§7 Die Charakteristikenmethode für DG 1. Ordnung
1 Die quasilineare Differentialgleichung . . . . . . . . . . . . . . . . . 172
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 . . . . . . . . . . 183
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung . . . . . . . . . . 191
4 Systeme von Differentialgleichungen erster Ordnung . . . . . . . . . 199

Kapitel IV Hilfsmittel aus der Analysis


§ 8 Lebesgue–Theorie und Lp –Räume
1 Eigenschaften des Lebesgue–Integrals . . . . . . . . . . . . . . . . . 201
2 Die Räume Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
3* Der Hauptsatz der Differential– und Integralrechnung . . . . . . . . 219
§9 Hilberträume
1 Beispiele für Hilberträume . . . . . . . . . . . . . . . . . . . . . . . 221
2 Abgeschlossene Teilräume und orthogonale Projektionen . . . . . . 225
3 Dichte Teilräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
4 Vollständige Orthonormalsysteme . . . . . . . . . . . . . . . . . . . 233
§ 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen
1 Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
2 Faltung mit Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . 244
3 Glättung von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 246
4 Das Fundamentallemma der Variationsrechnung . . . . . . . . . . . 252
5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω) . . . . . . . . . 254
§ 11 Gaußscher Integralsatz und Greensche Formeln
1 Ê
Untermannigfaltigkeiten des n . . . . . . . . . . . . . . . . . . . . 257
2 Integration auf Untermannigfaltigkeiten . . . . . . . . . . . . . . . . 266
3 Der Gaußsche Integralsatz . . . . . . . . . . . . . . . . . . . . . . . 272
4 Die Greenschen Identitäten . . . . . . . . . . . . . . . . . . . . . . . 275
5 Der Laplace–Operator in krummlinigen Koordinaten . . . . . . . . 279
Inhalt 9

§ 12 Die Fouriertransformation
1 Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
2 Ê
Die Fouriertransformation auf L1 ( n ) . . . . . . . . . . . . . . . . 286
3 Ê
Die Fouriertransformation auf S ( n ) . . . . . . . . . . . . . . . . 292
4 Ê
Die Fouriertransformation auf L2 ( n ) . . . . . . . . . . . . . . . . 298
5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
§ 13 Schwache Lösungen und Distributionen
1 Schwache Lösungen von Differentialgleichungen . . . . . . . . . . . 303
2 Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
3 Konvergenz von Distributionenfolgen . . . . . . . . . . . . . . . . . 309
4 Differentiation von Distributionen . . . . . . . . . . . . . . . . . . . 311
5 Grundlösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
6 Die Fouriertransformation für temperierte Distributionen . . . . . . 318

Kapitel V Die drei Grundtypen linearer Differentialgleichungen


2. Ordnung
§ 14 Randwertprobleme für den Laplace–Operator
1 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
2 Eigenschaften des Laplace–Operators . . . . . . . . . . . . . . . . . 326
3 Eindeutigkeit von Lösungen . . . . . . . . . . . . . . . . . . . . . . 346
4 Existenz von Lösungen: Perron–Methode . . . . . . . . . . . . . . . 349
5 Existenz von Lösungen: Integralgleichungsmethode . . . . . . . . . 352
6 Existenz von Lösungen: Variationsmethode . . . . . . . . . . . . . . 359
§ 15 Eigenwertprobleme für den Laplace–Operator
1 Entwicklung nach Eigenfunktionen des Laplace–Operators . . . . . 372
2 Geometrische Eigenschaften von Eigenwerten und -funktionen . . . 381
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel . . . . 383
§ 16 Die Wärmeleitungsgleichung
1 Bezeichnungen, Problemstellungen . . . . . . . . . . . . . . . . . . . 401
2 Eigenschaften des Wärmeleitungsoperators . . . . . . . . . . . . . . 402
3 Das Anfangswertproblem . . . . . . . . . . . . . . . . . . . . . . . . 407
4 Das Anfangs–Randwertproblem . . . . . . . . . . . . . . . . . . . . 414
§ 17 Die Wellengleichung
1 Bezeichnungen, Problemstellungen . . . . . . . . . . . . . . . . . . . 429
2 Eigenschaften des d’Alembert–Operators . . . . . . . . . . . . . . . 430
3 Das Anfangswertproblem . . . . . . . . . . . . . . . . . . . . . . . . 442
4 Das Anfangs–Randwertproblem . . . . . . . . . . . . . . . . . . . . 453
10 Inhalt

Kapitel VI Mathematische Grundlagen der Quantenmechanik


§ 18 Mathematische Probleme der Quantenmechanik
1 Ausgangspunkt, Zielsetzung, Wegweiser . . . . . . . . . . . . . . . . 463
2 Beugung und Interferenz von Elektronen . . . . . . . . . . . . . . . 465
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials . . . . 467
4 Das mathematische Modell der Pionier–Quantenmechanik . . . . . 471
§ 19 Maß und Wahrscheinlichkeit
1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . 477
2 Erwartungswert und Streuung einer diskreten Verteilung . . . . . . 483
3 Varianz und Streuung einer diskreten Verteilung . . . . . . . . . . . 486
4 Verteilungen mit Dichten . . . . . . . . . . . . . . . . . . . . . . . . 490
5 σ–Algebren und Borelmengen . . . . . . . . . . . . . . . . . . . . . 493
6 Eigenschaften von Maßen . . . . . . . . . . . . . . . . . . . . . . . . 496
7 Konstruktion von Maßen durch Fortsetzung . . . . . . . . . . . . . 499
8 Das Lebesgue–Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . 502
9 Wahrscheinlichkeitsmaße auf Ê . . . . . . . . . . . . . . . . . . . . 504
§ 20 Integration bezüglich eines Maßes μ
1 Das Konzept des μ–Integrals . . . . . . . . . . . . . . . . . . . . . . 508
2 Das μ–Integral für Elementarfunktionen . . . . . . . . . . . . . . . 509
3 Messbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 514
4 Das μ–Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
5 Vertauschbarkeit von Limes und Integral . . . . . . . . . . . . . . . 525
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf . Ê . . . . . . . . . 530
p
7 L –Räume und ihre Eigenschaften . . . . . . . . . . . . . . . . . . . 538
8 Dichte Teilräume und Separabilität . . . . . . . . . . . . . . . . . . 542
§ 21 Spektrum und Funktionalkalkül symmetrischer Operatoren
1 Beschränkte Operatoren und Operatornorm . . . . . . . . . . . . . 547
2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550
3 Die C*–Algebra L (H ) . . . . . . . . . . . . . . . . . . . . . . . . . 556
4 Konvergenz von Operatoren . . . . . . . . . . . . . . . . . . . . . . 562
5 Das Spektrum beschränkter Operatoren . . . . . . . . . . . . . . . . 568
6 Analytizität der Resolvente, Folgerungen für das Spektrum . . . . . 575
7 Der Funktionalkalkül für symmetrische Operatoren . . . . . . . . . 580
8 Positive Operatoren und Zerlegung von Operatoren . . . . . . . . . 589
9 Erweiterung des Funktionalkalküls . . . . . . . . . . . . . . . . . . . 591
Inhalt 11

§ 22 Der Spektralsatz für beschränkte symmetrische Operatoren


1 Spektralzerlegung und Spektralsatz . . . . . . . . . . . . . . . . . . 596
2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603
3 Diagonalisierung beschränkter symmetrischer Operatoren . . . . . . 605
4 Spektralzerlegung kompakter symmetrischer Operatoren . . . . . . 617
5 Anwendung auf Rand–Eigenwertprobleme . . . . . . . . . . . . . . 627
6 Der allgemeine Zustandsbegriff . . . . . . . . . . . . . . . . . . . . . 633
§ 23 Unbeschränkte Operatoren
1 Definitionen und Beispiele . . . . . . . . . . . . . . . . . . . . . . . 642
2 Abgeschlossene Operatoren . . . . . . . . . . . . . . . . . . . . . . . 647
3 Der Abschluss gewöhnlicher Differentialoperatoren . . . . . . . . . . 651
4 Der adjungierte Operator . . . . . . . . . . . . . . . . . . . . . . . . 659
5 Spektrum und Resolvente . . . . . . . . . . . . . . . . . . . . . . . . 664
6 Zur praktischen Bestimmung des Spektrums . . . . . . . . . . . . . 671
§ 24 Selbstadjungierte Operatoren
1 Charakterisierung selbstadjungierter Operatoren . . . . . . . . . . . 676
2 Wesentlich selbstadjungierte Operatoren . . . . . . . . . . . . . . . 680
3 Symmetrische Operatoren mit diskretem Spektrum . . . . . . . . . 682
4 Störung wesentlich selbstadjungierter Operatoren . . . . . . . . . . 691
§ 25 Der Spektralsatz und der Satz von Stone
1 Spektralzerlegung und Funktionalkalkül . . . . . . . . . . . . . . . . 699
2 Ausführung der Beweise für 1.3 – 1.7 . . . . . . . . . . . . . . . . . 708
3 Selbstadjungierte Operatoren und unitäre Gruppen . . . . . . . . . 715
4 Hilbertraumtheorie und Quantenmechanik . . . . . . . . . . . . . . 722

Namen und Lebensdaten . . . . . . . . . . . . . . . . . . . . . . . . . 732

Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734

Symbole und Abkürzungen . . . . . . . . . . . . . . . . . . . . . . . . 744

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746
Kapitel I Übersicht

§ 1 Beispiele für Differentialgleichungsprobleme


1 Gewöhnliche Differentialgleichungen
1.1 Mechanische Systeme
Die Hamiltonschen kanonischen Gleichungen
∂H
q̇k (t) = (t, q1 (t), . . . , qN (t), p1 (t), . . . , pN (t)) (k = 1, . . . , N ) ,
∂pk
∂H
ṗk (t) = − (t, q1 (t), . . . , qN (t), p1 (t), . . . , pN (t)) (k = 1, . . . , N )
∂qk
stellen ein gekoppeltes System von gewöhnlichen Differentialgleichungen dar.
Durch Zusammenfassung der Orts– und Impulsvariablen zu einem Vektor y(t) =
(q(t), p(t)) erhält dieses die Gestalt

ẏ(t) = f (t, y(t)) , kurz ẏ = f (t, y).

Von solchen Systemen erwarten wir deterministisches Verhalten: Durch Kennt-


nis des Zustandsvektors y0 = (q0 , p0 ) zu irgend einem Zeitpunkt t0 ist die
Lösung y(t) = (q(t), p(t)) in Vergangenheit und Zukunft eindeutig bestimmt.
Das bedeutet, dass das Anfangswertproblem

(∗) ẏ = f (t, y) , y(t0 ) = y0 .

eine eindeutig bestimmte Lösung haben soll. Deren explizite Bestimmung ist
in der Regel nicht möglich und steht auch nicht in jedem Fall im Vordergrund
des Interesses. Die statistische Mechanik will beispielsweise Aussagen über Ei-
genschaften des Flusses im Phasenraum machen (Volumentreue, Raummittel,
Zeitmittel). Eine andere Frage richtet sich auf das qualitative Verhalten der
Lösungen in der Nähe von Gleichgewichtslagen von Systemen ẏ = f (y), z.B.
bei zeitunabhängiger Hamilton–Funktion oder bei gedämpften mechanischen
Systemem

q̇ = M (q) p , ṗ = −∇U (q) − D(q) p

mit positiv definiten Massematrizen M (q) und Dämpfungsmatrizen D(q).


Um über diese und andere Fragen nach dem qualitativen Verhalten ohne expli-
zite Kenntnis der Lösungen entscheiden zu können, bedarf es einer allgemeinen
Theorie des Anfangswertproblems (∗): Existenz und Eindeutigkeit von Lösun-
gen, Existenz der Lösungen für alle Zeiten, differenzierbare Abhängigkeit der
Lösungen vom Anfangswert (§ 2) und Stabilitätsverhalten (§ 5).

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_1, © Springer Fachmedien Wiesbaden 2014
14 § 1 Beispiele für Differentialgleichungsprobleme

1.2 Singuläre Differentialgleichungen zweiter Ordnung


Produktansätze für lineare partielle Differentialgleichungen zweiter Ordnung
führen auf gewöhnliche Differentialgleichungen zweiter Ordnung. Zum Beispiel
wird das stationäre Wärmeleitungsproblem in der Einheitskreisscheibe durch
die Laplace–Gleichung für die Temperaturverteilung (2.5) beschrieben, welche
in Polarkoordinaten folgende Gestalt besitzt (vgl. § 6 : 5.2):
 
1 ∂ ∂u(r, ϕ) 1 ∂ 2 u(r, ϕ)
r + = 0.
r ∂r ∂r r2 ∂ϕ2
Der Produktansatz u(r, ϕ) = v(r) w(ϕ) führt auf zwei gewöhnliche Differential-
gleichungen 2. Ordnung
1 λ
(a) v  (r) + v  (r) − 2 v(r) = 0 ,
r r
(b) w (ϕ) + λ w(ϕ) = 0
mit einer geeigneten Konstanten λ. Da w 2π–periodisch sein muss, kommen nur
die Werte λ = k2 mit k = 0, 1, . . . in Betracht (§ 6 : 5.3). In ähnlicher Weise
führt der Produktansatz bei der Behandlung der kreisförmigen schwingenden
Membran oder von Schwingungen der Kugel auf die Besselsche Differentialglei-
chung
1 

ν2

(c) v  (r) + v (r) + λ − 2 v(r) = 0
r r
für r > 0 mit Parametern λ und ν.
Die Differentialgleichungen (a) und (c) werden singulär genannt, weil die Koeffi-
zienten vor v  und v an der Stelle r = 0 Pole besitzen. Für die Lösungen solcher
Differentialgleichungen lassen sich nicht die Werte im Randpunkt r = 0 vor-
schreiben; hier besteht nur die Möglichkeit, Lösungen durch ihre Beschränktheit
oder Unbeschränktheit nahe r = 0 zu unterscheiden.
Die Darstellung von Lösungen singulärer Differentialgleichungen durch verall-
gemeinerte Potenzreihen wird in § 4 behandelt.

1.3 Die Charakteristikenmethode


Partielle Differentialgleichungen 1. Ordnung für eine gesuchte Funktion u,
F (x, u(x), ∇u(x)) = 0 ,
beschreiben Phänomene der Wellenausbreitung. Hierzu gehört z.B. die Eikonal-
gleichung (Hamilton–Jacobi–Gleichung) der geometrischen Optik,
H(x, ∇u(x)) = 1 .
Die Charakteristikenmethode zur Lösung dieser Differentialgleichungen besteht
darin, den Graphen der Lösung u aus einer Kurvenschar (den Charakteristiken)
2 Partielle Differentialgleichungen 15

aufzubauen, die durch ein System gewöhnlicher Differentialgleichungen gegeben


ist. Hierbei ist es entscheidend, dass die Charakteristikenschar auf differenzier-
bare Weise von den Anfangswerten abhängt, was in § 2 bewiesen wird. Bei der
Eikonalgleichung beschreiben die Charakteristiken die Lichtstrahlen und die Ni-
veauflächen {u = const} die zugehörigen Wellenfronten.
Die Charakteristikenmethode wird in § 7 behandelt.

2 Partielle Differentialgleichungen
2.1 Die Gleichung der schwingenden Saite
Wir betrachten eine an den Enden fest
eingespannte elastische Saite, die ebene
y
Transversalschwingungen ausführt. In 6
der Schwingungsebene wählen wir kar-
u(x, t)
tesische Koordinaten so, dass die Saite -
x x
in der Ruhelage die Strecke
{(x, y) | 0 ≤ x ≤ L , y = 0}
einnimmt. Die vertikale Auslenkung der Saite an der Stelle x zum Zeitpunkt t
bezeichnen wir mit u(x, t).
Wir machen folgende Annahmen:
– Die Saite ist homogen und von vernachlässigbarer Biegesteifigkeit.
 
– Die Auslenkungen der Saite sind klein,  ∂u
∂x
  1.
– Es wirken keine Schwerkraft und keine Anregungen durch Zupfen oder Strei-
chen der Seite.
Dann lautet die Bewegungsgleichung
∂2u 2
2 ∂ u
= c mit einer Konstanten c > 0
∂t2 ∂x2
(eindimensionale Wellengleichung, d’Alembert 1746). In geometrischer Inter-
pretation bedeutet diese Gleichung, dass die Transversalbeschleunigung propor-
tional zur Krümmung der Saite ist.
Ein spezieller Schwingungsablauf wird durch geeignete Zusatzbedigungen fest-
gelegt; diese bestehen aus der Randbedingung (Einspannbedingung)
u(0, t) = u(L, t) = 0 für alle t ∈ Ê,
und den Anfangsbedingungen zu einem Zeitpunkt, etwa zur Zeit t = 0,
∂u
u(x, 0) = f (x), (x, 0) = g(x),
∂t
wobei f und g vorgegebene, an den Endpunkten verschwindende Funktionen
auf [0, L] sind.
16 § 1 Beispiele für Differentialgleichungsprobleme

In § 6 wird gezeigt, dass das hiermit formulierte Anfangs–Randwertproblem un-


ter geeigneten Voraussetzungen über f und g eine eindeutig bestimmte Lösung
u besitzt, die sich explizit angeben läßt.

2.2 Herleitung der Wellengleichung aus dem Hamiltonschen Prinzip


der stationären Wirkung
Wie für viele Differentialgleichungen der Mathematischen Physik ergibt sich
auch die Bewegungsgleichung der schwingende Saite aus einem Variationsprin-
zip, dem Hamiltonschen Prinzip der stationären Wirkung, das wir wie folgt
formulieren: Zur Zeit t seien u(x, t) die vertikale Auslenkung der Saite an der
Stelle x, T (u, t) die kinetische und U (u, t) die potentielle Energie.
Das Wirkungsintegral für ein Zeitintervall [t1 , t2 ] ist definiert durch
t2

W (u) = T (u, t) − U (u, t) dt .
t1

Das Hamiltonsche Prinzip der stationären Wirkung besagt, dass die Bewegungs-
gleichung der Saite gegeben ist durch
d 
(∗) δW (u)ϕ := W (u + sϕ) s=0 = 0
ds
für jedes Zeitintervall [t1 , t2 ] und für jede C1 –Funktion ϕ, die auf dem Rand ∂R
des Rechtecks R := [0, L] × [t1 , t2 ] verschwindet.
Im Fall einer homogenen Saite der Masse pro Längeneinheit ist die kinetische
Energie zur Zeit t
L
1 ∂u
T (u, t) = (x, t)2 dx ,
2 ∂t
0

die durch Verlängerung der Saite bedingte potentielle Energie zur Zeit t ist
L   L
∂u 1 ∂u
U (u, t) = σ 1+ (x, t)2 − 1 dx ≈ σ (x, t)2 dx ,
∂x 2 ∂x
0 0

hierbei ist die Konstante σ > 0 der Spannungskoeffizient der Saite.


Für das Wirkungsintegral
t2L  
1 ∂u ∂u
W (u) = (x, t)2 − σ (x, t)2 dx dt
2 ∂t ∂x
t1 0

ist W (u + sϕ) ein Polynom zweiten Grades in s, also muss gelten


2 Partielle Differentialgleichungen 17

t2 L  
d  ∂u ∂ϕ ∂u ∂ϕ
0 = W (u + sϕ) s=0 = −σ dx dt
ds ∂t ∂t ∂x ∂x
t1 0
(∗∗)
L  t2  t2  L 
∂u ∂ϕ ∂u ∂ϕ
= dt dx − σ dx dt .
∂t ∂t ∂x ∂x
0 t1 t1 0

Durch partielle Integration folgt wegen ϕ = 0 auf dem Rand ∂R des Rechtecks
L  t2  t2  L 
∂2u ∂2u
0 = − ϕ dt dx + σ ϕ dx dt
∂t2 ∂x2
0 t1 t1 0
t2 L 2 2
∂ u ∂ u
= − + σ ϕ dx dt .
∂t2 ∂x2
t1 0
Das letzte Integral kann nur dann für alle oben zugelassenen Variationen“ ϕ

Null sein, wenn die eckige Klammer im Innern von R verschwindet, d.h. wenn
∂2u ∂2u
2
(x, t) = c2 (x, t) mit c = σ/
∂t ∂x2
in jedem Zeitintervall und für alle x ∈ ]0, L[. Denn wäre die eckige Klammer
in einer Kreisscheibe Kr (x0 , t0 ) um einen Punkt (x0 , t0 ) beispielsweise positiv,
so ergäbe sich mit ϕ(x, t) = (r 2 − (x − x0 )2 − (t − t0 )2 )2 (außerhalb Kr (x0 , t0 )
gleich Null gesetzt) ein Widerspruch.

2.3 Die schwingende Membran


Eine elastische Membran sei in einen
ebenen Rahmen eingespannt und führe
kleine Schwingungen senkrecht zu der
Ebene des Rahmens aus. Wir wählen
ein räumliches Koordinatensystem so,
dass die Membran in der Ruhelage ein
Gebiet Ω der x1 ,x2 –Ebene bedeckt.
Unter entsprechenden Annahmen wie
bei der schwingenden Saite ergibt sich
für die senkrechte Auslenkung u(x, t)
des Membranpunkts x = (x1 , x2 ) ∈ Ω
aus der Ruhelage zur Zeit t die Bewe-
gungsgleichung
∂2u
= c2 Δu mit einer Konstanten c > 0 ,
∂t2
die zweidimensionale Wellengleichung
18 § 1 Beispiele für Differentialgleichungsprobleme

Der Laplace–Operator wirkt dabei nur auf die Ortsvariablen,


∂2u ∂2u
Δu = 2
+ .
∂x1 ∂x22
Die Randbedingung für die eingespannte Membran lautet
u(x, t) = 0 für x ∈ ∂Ω , t ∈ Ê,
die Anfangsbedingungen stellen wir wie bei der Saite:
∂u
u(x, 0) = f (x) , (x, t) = g(x) für x ∈ Ω
∂t
mit gegebenen, auf dem Rand verschwindenden Funktionen f und g auf Ω.
Die Ableitung der Schwingungsgleichung ∂ 2 u/∂t2 = c2 Δu aus dem Hamilton-
schen Prinzip der stationären Wirkung erfolgt ganz analog zu der für die schwin-
gende Saite. Als potentielle Energie im Wirkungsintegral wird das Integral über
die Verzerrung des Flächeninhalts bei der Auslenkung der Membran zugrunde-
gelegt:
   
1
U (t) = σ 1 + ∇u2 − 1 d2 x ≈ σ ∇u2 d2 x .
2
Ω Ω

Der Gradient ∇u = (∂1 u, ∂2 u) bezieht sich dabei auf die Raumvariablen, und
es werden kleine Auslenkungen ∇u  1 angenommen.
ÜA Leiten Sie nach dem Vorbild von 2.2 die Schwingungsgleichung für die
Membran aus dem Hamiltonschen Prinzip her unter Verwendung des Gaußschen
Integralsatzes und geeigneter Buckelfunktionen ϕ.

2.4 Die Wellengleichung im Ê n

Hierunter verstehen wir die Differentialgleichung


∂2u
= c2 Δu mit einer Konstanten c > 0
∂t2
Ê
für eine Funktion u(x, t) von x ∈ Ω und t ∈ , wobei Ω ein Gebiet des n ist. Ê
Hier – wie auch im Folgenden – verabreden wir, dass der Laplace–Operator nur
auf die räumlichen Variablen x = (x1 , . . . , xn ) wirken soll.
Das Anfangs–Randwertproblem für die Wellengleichung auf beschränkten Ge-
bieten wird in § 17 behandelt.
Ê
Die Wellengleichung im 3 beschreibt in der Gasdynamik die Schallausbreitung
und in der Maxwellschen Theorie die Ausbreitung elektromagnetischer Wellen,
vgl. 2.6 (b) und 2.7 (c). Die Behandlung der Wellengleichung in der Ebene und
im Raum erfolgt in § 17.
Dass die Konstante c als Ausbreitungsgeschwindigkeit von Wellenfronten ge-
deutet werden kann, machen wir an den Beispielen der ebenen Welle und der
Kugelwelle plausibel:
2 Partielle Differentialgleichungen 19

Für jede C2 –Funktion U : Ê → Ê und jeden Vektor k ∈ Ên


ist durch
u(x, t) = U ( k , x − ct)
eine Lösung der Wellengleichung gegeben, ÜA . Die Wellenfronten, d.h. die
Ê
Flächen konstanter Phase {x ∈ 3 | k , x − ct = const} sind Ebenen, die
sich mit der Geschwindigkeit c bewegen.
Durch
1
u(x, t) = U (r − ct) mit r := x > 0
r
ist eine weitere Lösung der Wellengleichung gegeben ( ÜA , berechnen Sie zu-
Ê
nächst ∂i ∂k r). Deren Wellenfronten { x ∈ 3 | x−ct = const } sind Sphären,
die sich mit der Geschwindigkeit c ausbreiten.

2.5 Die Wärmeleitungsgleichung


(a) Die Wärmeleitungsgleichung für die Temperaturverteilung u(x, t) in einem
das Gebiet Ω ausfüllenden, wärmeleitenden homogenen Medium lautet nach
Fourier (1807)
∂u
cp (x, t) − κ Δu(x, t) = Q(x)
∂t
(Landau–Lifschitz [155] (50,7)). Dabei ist die Dichte, cp die spezifische
Wärme bei konstantem Druck, κ das Wärmeleitvermögen und Q die pro Volu-
men– und Zeiteinheit durch eine Wärmequelle abgegebene Wärmemenge.
Diese Gleichung ergibt sich aus der Annahme, dass der Wärmefluß q(x, t) pro-
portional zum negativen Temperaturgradienten ist,
q = − κ ∇u .
Aus dem Erhaltungssatz für die Wärmemenge folgt die Bilanzgleichung
  

∂t
cp u d3 x + ·
q do = Q d3 x
K ∂K K

für jedes Gaußsche Gebiet K, und daraus mit dem Gaußschen Integralsatz
   
∂u
cp − κ div ∇u d3 x = Q d3 x .
∂t
K K

Wie in Bd. 1, § 26 : 6.1 erhalten wir hieraus die Wärmeleitungsgleichung.


(b) Zur Bestimmung eines konkreten Wärmeleitungsprozesses sind neben der
Wärmeleitungsgleichung, die wir in der Form
∂u
− k Δu = f
∂t
schreiben, Anfangs– und Randbedingungen zu stellen. Durch
20 § 1 Beispiele für Differentialgleichungsprobleme

u(x, 0) = u0 (x) für x ∈ Ω

wird eine Anfangstemperaturverteilung u0 ∈ C(Ω) vorgeschrieben. Hinzu kom-


men wahlweise weitere Bedingungen. Ist Ω ein beschränktes Gebiet (Innen-
raumaufgabe), so werden alternativ folgende Randbedingungen betrachtet:
(1) Vorgeschriebene Temperatur am Gebietsrand (etwa durch ein Wärmebad)

u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

(Dirichletsches oder erstes Randwertproblem).


(2) Vorgeschriebener Wärmefluß durch den Rand

k ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

(Neumannsches oder Zweites Randwertproblem). Dabei ist n das äußere


Normalenfeld des als hinreichend glatt berandet vorausgesetzten Gebietes Ω.
(3) Gemischte (Robinsche) Randbedingung (drittes Randwertpro-
blem)

a(x, t) u(x, t) + k b(x, t) ∂n u(x, t) = g(x, t) für x ∈ ∂Ω , t ≥ 0

mit |a| + |b| > 0.


Ê
Ist n \ Ω beschränkt und nicht leer (Außenraumaufgabe), so kommt zu (1),
(2) oder (3) noch die Randbedingung im Unendlichen“ hinzu:

lim u(x, t) = 0 für t ≥ 0.
x→∞

(c) Bei zeitunabhängigen Randwerten stellt sich nach längerer Zeit ein Gleich-
gewicht ein, und die Lösungen werden stationär , d.h. unabhängig von der Zeit-
koordinate. Diese genügen dann der Poisson–Gleichung

−k Δu = f in Ω ,

bzw. bei nichtvorhandenen Wärmequellen ( f = 0 ) der Laplace–Gleichung

Δu = 0 in Ω .

Bei dieser Gleichung entfällt die Anfangsbedingung.

2.6 Die Maxwellschen Gleichungen


Diese lauten für ein isotropes (d.h. nicht kristallines) Medium im cgs–System
1 ∂(μH) 1 ∂(εE) 4π
(1) + rot E = 0 , − + rot H = j,
c ∂t c ∂t c

(2) div (μH) = 0 , div (εE) = 4π .


2 Partielle Differentialgleichungen 21

(Maxwell 1856, gestützt auf Vorarbeiten von Ampère, Faraday u.a.).


Hierbei bezeichnen E die elektrische, H die magnetische Feldstärke, die La-
dungsdichte, j die elektrische Stromdichte, ε die Dielektrizitätskonstante, μ die
Permeabilität und c die Lichtgeschwindigkeit im Vakuum.
Die Maxwellschen Gleichungen stellen ein System partieller Differentialgleichun-
gen dar. Eine Diskussion nur der wichtigsten damit verbundenen Aufgabenstel-
lungen würde den Rahmen dieses Buches sprengen; wir beschränken uns daher
auf einige spezielle Aspekte.
(a) Strom– und Ladungsdichte hängen über die Kontinuitätsgleichung

+ div j = 0
∂t
miteinander zusammen. Das ergibt sich wie in Bd. 1, § 26 : 6.1 bzw. wie in Ab-
schnitt 2 mit Hilfe des Gaußschen Integralsatzes.
Seien , j, E0 , H0 mit div (μH0 ) = 0, div (εE0 ) = 4π 0 vorgegeben, wobei
0 (x) = (x, 0) gesetzt wird. Für Lösungen E(x, t), H(x, t) der Maxwell–Glei-
chungen (1) mit den Anfangswerten
E(x, 0) = E0 (x) , H(x, 0) = H0 (x) für alle x ∈ Ê 3

gelten dann automatisch die Gleichungen (2). Denn aus (1) folgt ÜA

∂ ∂
div (μH) = 0 , (div (εE) − 4π ) = 0 ,
∂t ∂t
also gelten die Gleichungen (2) für alle Zeiten.
(b) Im Vakuum (ε = μ = 1, = 0, j = 0) gilt für Lösungen von (1)

∂2E ∂2H
= c2 ΔE , = c2 ΔH ,
∂t2 ∂t2
d.h. die Komponenten von E und H erfüllen jede für sich die Wellengleichung
∂2u
= c2 Δu
∂t2
Ê
im 3 . Das ergibt sich mit Hilfe der Identität rot rot u = ∇div u − Δu von
Bd. 1, § 24 : 7.2 (d) ÜA .
(c) Sind E, H, , ε, μ und j zeitunabhängig, so ergibt sich in sternförmigen
Gebieten aus rot E = 0, div (μH) = 0 die Existenz eines Potentials U und
eines Vektorpotentials A mit

E = − ∇U , μH = rot A

(vgl. Bd. 1, § 24 : 5.5 und 7.3). Dabei dürfen wir div A = 0 annehmen, denn
ist A0 irgend ein Vektorpotential für μH und ist ϕ eine Lösung der Poisson–
Gleichung Δϕ = div A0 , so ist A = A0 − ∇ϕ ebenfalls ein Vektorpotential
22 § 1 Beispiele für Differentialgleichungsprobleme

für μH mit div A = 0. Wegen ΔU = div ∇U = div E und der schon in (b)
verwendeten Beziehung rot rot A = ∇div A − ΔA = −ΔA reduzieren sich die
Maxwell–Gleichungen auf die Gleichungen der Elektro– und Magnetostatik
4π 4π
− ΔU = , − ΔA = j.
ε c
Wir stellen fest, dass sich aus den Maxwell–Gleichungen in Spezialfällen die
Wellengleichung und Poisson–Gleichung ergeben.

2.7 Die Gleichungen der Strömungsmechanik


Die Differentialgleichungen für Gase und Flüssigkeiten beruhen auf den Erhal-
tungssätzen für Impuls und Masse sowie auf der Annahme, dass die Verformun-
gen des Mediums linear von den inneren Spannungen abhängen. Die auftre-
tenden Zustandsgrößen sind das Geschwindigkeitsfeld v(x, t), die Massendichte
(x, t) und der Druck p(x, t) an der Stelle x zum Zeitpunkt t.
(a) Für Gase und ideale (nicht zähe) Flüssigkeiten gelten nach Bd. 1, § 26 : 6
die Eulerschen Gleichungen

∂v 
3
∂v 1 ∂
+ vi + ∇p = f , + div ( v) = 0 .
∂t ∂xi ∂t
i=1

Dabei ist f die Kraftdichte der äußeren Kräfte pro Masseneinheit (z.B. der
Gravitationskräfte). Hinzu kommt noch eine Zustandsgleichung F ( , p) = 0,
mit deren Hilfe wir p oder in den Eulerschen Gleichungen eliminieren können.
Beispiele von Zustandsgleichungen sind p = K γ (K > 0, γ > 1 Konstanten)
für polytrope Gase und = const für inkompressible Flüssigkeiten.
(b) Die Gleichungen von Navier–Stokes für zähe, inkompressible Flüssig-
keiten lauten

∂v 
3
∂v 1 μ
+ vi + ∇p − Δv = f , div v = 0 ;
∂t ∂xi
i=1

hierbei ist die konstante Massendichte und μ ≥ 0 die Zähigkeitskonstante


(Navier 1822, Poisson 1831, Saint–Venant 1834, Stokes 1845).
(c) Wir leiten die Gleichungen der Schallausbreitung aus den Eulerschen Glei-
chungen unter den folgenden Annahmen (i)–(iv) ab:
(i) Kompressibles Gas mit kleinen Abweichungen der Dichte von einem kon-
stanten Wert 0 > 0,

| − 0|  1, p ( 0 ) > 0 für die Zustandsgleichung p = p( ),


3 Was bedeutet Lösung einer Differentialgleichung“? 23

(ii) Vernachlässigung der Konvektionsterme in den Eulerschen Gleichungen,


3
∂v 
3

vi ≈ 0, vi ≈ 0,
∂xi ∂xi
i=1 i=1

(iii) rotationsfreies Geschwindigkeitsfeld, rot v = 0,


(iv) Abwesenheit von äußeren Kräften, f = 0.
Dann folgt aus der Zustandsgleichung p = p( ), dass ∇p = p ( )∇ ≈ p ( 0 )∇
gilt. Die Eulerschen Gleichungen gehen damit über in

∂v p ( 0 ) ∂
+ ∇ = 0, + 0 div v = 0 ,
∂t 0 ∂t

und durch Ableitung beider Gleichungen nach der Zeit ergibt sich ÜA

∂2v ∂2
= c2 Δv , = c2 Δ mit c = p ( 0 ) .
∂t2 ∂t2

Die Zustandsgrößen v, erfüllen also die Wellengleichung mit c = p ( 0 ) als


Schallgeschwindigkeit. Die Interpretation der Konstanten c in der Wellenglei-
chung als Ausbreitungsgeschwindigkeit von Wellenfronten wurde in 1.3 plausibel
gemacht.
Zum Beispiel ergibt sich für die polytrope Zustandsgleichung p( ) = p0 ( / 0 )γ
als Schallgeschwindigkeit c = γ p0 / 0 .
Die Behandlung der Gleichungen von Euler und Navier–Stokes würde den Rah-
men dieses Buches bei weitem sprengen. Auch hier müssen wir uns mit der
Diskussion der Wärmeleitungsgleichung und der Wellengleichung begnügen.

3 Was bedeutet Lösung einer Differentialgleichung“?



In einfach gelagerten Fällen kann die Lösung eines Differentialgleichungsprob-
lems durch eine explizite Lösungsdarstellung, d.h. durch einen Funktionsaus-
druck, ein Integral oder eine Reihe angegeben werden. Bei partiellen Differen-
tialgleichungen setzt dies in der Regel eine Symmetrieeigenschaft der physika-
lischen Konfiguration voraus; Beispiele sind die Laplace–Gleichung, Wärmelei-
tungsgleichung und Wellengleichung auf der Kreisscheibe und der Kugel; diese
nehmen in § 14, § 16, § 17 den ihnen gebührenden Raum ein.
Für die meisten Probleme ist es aber unumgänglich, eine Lösungstheorie zu
entwickeln. Diese umfasst einerseits den Beweis der Existenz und der eindeutigen
Bestimmtheit einer Lösung und andererseits die Untersuchung deren qualitati-
ver Eigenschaften. Letztere sind nicht nur für die physikalische Theorie von
Interesse, sondern auch für numerische Rechnungen. Die Entwicklung effizienter
24 § 1 Beispiele für Differentialgleichungsprobleme

Näherungsverfahren gelingt umso besser, je mehr über die Eigentümlichkeiten


der Lösung theoretisch bekannt ist.
Ein Differentialgleichungsproblem ist stets verbunden mit weiteren Forderun-
gen wie Anfangs- und Randbedingungen. Diese ergeben sich meistens aus der
zugrunde liegenden physikalischen Fragestellung und sollten so beschaffen sein,
dass nur eine Lösung in Frage kommt. Für die Untersuchung der Existenz ei-
ner Lösung müssen wir zunächst klären, welche Differenzierbarkeitsstufe und
welche Anfangs- und Randbedingungen wir verlangen, m.a.W. welchem Funk-
tionenraum sie angehören soll. Nicht immer ist es sinnvoll, nach Lösungen
zu fragen, die so glatt sind, wie es der Bauart der Differentialgleichung ent-
spricht. Beim Anfangs–Randwertproblem 2.1 für die schwingende Saite ist es
z.B. natürlich, von den Lösungen C2 –Differenzierbarkeit in ]0, L[ × Ê zu ver-
langen. Dies schließt aber den durchaus interessanten Fall aus, dass die Anfangs-
gestalt der Saite einen Knick hat, dessen Fortpflanzung untersucht werden soll.
Mehr noch: Selbst wenn die Anfangsdaten f, g beliebig glatt sind, gibt es nur
dann eine C2 –Lösung, wenn f  (0) = f  (L) = 0 gilt. In jedem Fall gibt es eine
schwache Lösung von 2.1, das ist grob gesagt eine Funktion u, für welche das
Wirkungsintegral W (u) von 2.2 erklärt ist und sich die Bedingung δW (u) = 0
in der Form 2.2 Gl. (∗),(∗∗) ausdrückt. Ähnliches gilt für die Gleichungen der
Strömungsmechanik, wo Schockwellen und Turbulenzen als Singularitäten von
schwachen Lösungen beschrieben werden müssen.
In den Lösungstheorien in § 14, § 16, § 17 gehen wir in zwei Schritten vor. Zu-
nächst wählen wir einen Funktionenraum, der bezüglich einer dem Problem an-
gepassten Norm vollständig ist. In diesem konstruieren wir eine Cauchy-Folge
von Näherungslösungen, von deren Grenzwert gezeigt wird, dass er eine schwa-
che Lösung darstellt. In einem zweiten Schritt geht es um die Untersuchung der
Regularität dieser schwachen Lösung, d.h. um deren Stetigkeits- und Differen-
zierbarkeitseigenschaften.

4 Die Schrödinger–Gleichung
(a) Der Bewegung eines Teilchens der Masse m unter dem Einfluß eines Poten-
tials V in der klassischen Mechanik entspricht in der Quantenmechanik folgen-
de Grundaufgabe.
 Ê
Gegeben ist eine hinreichend glatte Funktion ψ0 : 3 →
mit | ψ0 (x) |2 d3 x = 1 . Gesucht ist eine komplexwertige Lösung ψ(x, t) der
Ê3
Schrödinger–Gleichung

∂ψ h̄2
(∗) ih̄ (x, t) = − Δψ(x, t) + V (x) ψ(x, t)
∂t 2m
mit ψ(x, 0) = ψ0 (x) . Durch Umskalierung der Orts– und Zeitkoordinate können
wir h̄ = m = 1 erreichen.
4 Die Schrödinger–Gleichung 25

(b) Die mit (∗) und mit ähnlichen Gleichungen der Quantenmechanik verbun-
denen Fragestellungen führen uns in die Theorie der linearen Operatoren im
Hilbertraum. Für (∗) legen wir den Raum

L2 = L2 ( Ê ) = {u : Ê
3 3
→ | | u(x) |2 d3 x < ∞}
Ê3
zugrunde, versehen mit dem Skalarprodukt

u, v = u(x) v(x) d3 x .
Ê3
Der Raum L2 ist vollständig, d.h. ist ein Hilbertraum, wenn wir den Lebesgue-
schen Integralbegriff verwenden. Das Lebesgue–Integral und seine Eigenschaften
werden in § 8 kurz vorgestellt; die Beweise und die Konstruktion weiterer Hil-
berträume der Quantenmechanik sind in § 20 zu finden.
Mit den Abkürzungen
∂ψ
ψt : x → ψ(x, t) , ψ̇t : x → (x, t)
∂t
erhält die auf h̄ = m = 1 skalierte Schrödinger–Gleichung (∗) die Form

(∗∗) ψ̇t = −iHψt ;

dabei ist H der durch


1
Hu := − 2 Δu + V u

gegebene Hamilton–Operator. Da Hu nicht für alle u ∈ L2 Sinn macht, ist eine


Teilmenge des Hilbertraums L2 als Definitionsbereich D für H festzulegen,
z.B. die Menge aller C∞ –Funktionen u, für die u , Δu , V u für x → ∞
rasch abfallen und zu L2 gehören. H erfüllt dann die Symmetriebedingung

u , Hv = Hu , v für u, v ∈ D.

(c) Das Anfangswertproblem für (∗∗) lautet: Gegeben sei eine Funktion ψ0 ∈ D
mit ψ0 2 = ψ0 , ψ0 = 1. Gesucht sind Funktionen ψt ∈ D mit
 
 ψt+h − ψt 
lim  − (−iHψt )  = 0 für alle t ∈ 
h→0 h
(Lösungen von (∗∗) im Hilbertraumsinn). Besitzt dieses Problem eine eindeu-
tig bestimmte stetige Lösung t → ψt ,  → D für alle t ∈ , so heißt H ein
Schrödinger–Operator oder wesentlich selbstadjungiert. Dies trifft z.B. für das
Coulomb–Potential V (x) = x−1 und für V (x) = 12 x2 zu. Eine Grund-
aufgabe der mathematischen Quantenmechanik besteht darin, Kriterien für we-
sentliche Selbstadjungiertheit des Energieoperators“ H und anderer Hilber-

traumoperatoren anzugeben.
26 § 1 Beispiele für Differentialgleichungsprobleme

(d) Zu jedem Schrödinger–Operator H gehört eine Schar von unitären Abbil-


dungen U (t) : D → D , die definiert ist durch ψt = U (t)ψ0 , wobei ψt die
Lösung zum Anfangswert ψ0 ist. Für diese Schar läßt sich zeigen, dass

U (s + t) = U (s)U (t) , U (0) = ½, U (t)−1 = U (−t) .

Wir sprechen von einer unitären Zeitentwicklungsgruppe.


(e) Die Wellenfunktion ψt beschreibt den Zustand eines spinlosen Teilchens“

der Masse m unter dem Einfluß des Potentials V zur Zeit t. Dies ist so zu
verstehen: Über das zeitliche Verhalten eines einzelnen Elementarteilchens sind
prinzipiell keine Voraussagen möglich, wohl aber über das statistische Verhalten
eines Teilchenstrahls bzw. der Messergebnisse bei hohen Versuchszahlen unter
identischen Versuchsbedingungen. Die Gruppeneigenschaft (d) besagt gerade,
dass die Kenntnis des Zustandes ψs zu irgend einem Zeitpunkt s das zeit-
liche Verhalten der Zustände für alle Zeiten festlegt (Determinismus für die
Zustände).
(f) Wie schon der Name sagt, können mit Hilfe der Funktionen ψt Wellen-
eigenschaften einer Gesamtheit von Elementarteilchen wie Interferenz und Beu-
gung beschrieben werden; dies wird
 durch2die3 Komplexwertigkeit von ψt ermög-
licht. Im Korpuskelbild kann |ψt (x)| d x als Wahrscheinlichkeit gedeutet
Ω
werden, ein Teilchen bei einer Ortsmessung im Raumgebiet Ω vorzufinden.
In Kap. VI wird sich zeigen, dass ψt , Hψt zeitunabhängig ist und als stati-
stischer Mittelwert (Erwartungswert) der Energie über die Teilchengesamtheit
zu deuten ist. Den mathematischen Hintergrund für solche Aussagen liefert die
Wahrscheinlichkeitstheorie, mit der wir uns in § 19 befassen.
(g) Neben der Energie werden auch weiteren Observablen wie Ort, Impuls
und Drehimpuls in der Quantenmechanik (wesentlich) selbstadjungierte Hil-
bertraumoperatoren zugeordnet. Die Theorie solcher Operatoren wird in den
Paragraphen § 18 – § 22 entwickelt. Im Mittelpunkt steht dabei der Begriff Spek-
trum und dessen physikalische Deutung als Menge der möglichen Messwerte der
betreffenden Observablen.
Kapitel II
Gewöhnliche Differentialgleichungen

§ 2 Grundlegende Theorie
1 Das allgemeine Anfangswertproblem
1.1 Zielsetzung
Im ersten Band wurde eine Reihe von Differentialgleichungsproblemen behan-
delt, u.a. die Schwingungsgleichung ÿ + aẏ + by = f , die separierte Differen-
tialgleichung y  = a(x) b(y) und lineare Systeme ÿ = By mit symmetrischer
Matrix B, jeweils mit geeigneten Anfangsbedingungen.
In allen Fällen ergab sich die eindeutige Lösbarkeit des Anfangswertproblems
aus dem Lösungsverfahren: Das Differentialgleichungsproblem konnte auf ein-
fachere Aufgaben zurückgeführt werden wie Aufsuchen einer Stammfunktion,
Auflösung einer Gleichung F (x, y) = 0, Bestimmung von Polynomnullstellen,
oder Diagonalisierung einer Matrix.
Nicht für jeden Differentialgleichungstyp gibt es solche Lösungsverfahren. Au-
ßerdem wollen wir Aussagen über qualitatives Verhalten und Gesetzmäßigkeiten
der Lösungen machen, ohne diese explizit bestimmen zu müssen. Aus beiden
Gründen bedarf es einer Theorie, welche für geeignet formulierte Anfangswert-
probleme die Existenz und Eindeutigkeit der Lösung sicherstellt und ihr Ver-
halten beschreibt.

1.2 Die allgemeine Form des Anfangswertproblems


Ê
(a) Es sei f : Ω → n eine stetige Funktion auf einem Gebiet Ω des Ên+1
,
dessen Punkte wir mit

(x, y) = (x, y1 , . . . , yn ) oder (ξ, η) = (ξ, η1 , . . . , ηn )

bezeichnen.
Unter einer Lösung der Differentialgleichung (DG) y = f (x, y) verstehen
Ê
wir eine C1 –Kurve u : I → n auf einem nicht einpunktigen Intervall I mit

(x, u(x)) ∈ Ω und u (x) = f (x, u(x)) für alle x ∈ I ,

in Komponentenschreibweise
u1 (x) = f1 (x, u1 (x), . . . , un (x)) ,
..
.
un (x) = fn (x, u1 (x), . . . , un (x)) .

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_2, © Springer Fachmedien Wiesbaden 2014
28 § 2 Grundlegende Theorie

Wenngleich es sich im Fall n ≥ 2 um ein System von Differentialgleichun-


gen 1. Ordnung handelt, werden wir doch meist von einer Differentialglei-
chung (DG) sprechen. Die Funktion f heißt traditionsgemäß die rechte Seite
der Differentialgleichungen. Differentialgleichungen der betrachteten Art wer-
den explizit genannt im Gegensatz zu impliziten Differentialgleichungen
der Form F(x, y, y ) = 0.
Wie wir gleich zeigen, lässt sich jede explizite DG höherer Ordnung in ein äqui-
valentes System 1. Ordnung überführen. Bei den folgenden grundlegenden Aus-
sagen über Lösungen betrachten wir daher durchweg Systeme 1. Ordnung.
(b) Das Anfangswertproblem (AWP) besteht darin, für einen gegebenen
Anfangspunkt (ξ, η) ∈ Ω eine Lösung u auf einem ξ umfassenden Intervall I
mit u(ξ) = η zu finden.
Für diese Aufgabe schreiben wir kurz

y = f (x, y) , y(ξ) = η .

Das Anfangswertproblem heißt eindeutig lösbar, wenn Folgendes gilt:


Ist (ξ, η) ein beliebiger Punkt aus Ω und sind

u 1 : I1 → Ê n
, u2 : I2 → Ê n

Lösungen des AWP y = f (x, y), y(ξ) = η, so ist

u1 (x) = u2 (x) für x ∈ I1 ∩ I2 .

Wir interessieren uns hier nur für eindeutig lösbare Anfangswertprobleme und
fassen die Voraussetzungen über die rechte Seite entsprechend.

1.3 Differentialgleichungen n–ter Ordnung als Systeme erster Ord-


nung
Eine explizite DG n–ter Ordnung hat die Form

y (n) = f (x, y, y  , . . . , y (n−1) ) .

Ê
Dabei sei f eine auf einem Gebiet Ω ⊂ n+1 stetige Funktion. Von einer Lösung
u in einem nicht einpunktigem Intervall I verlangen wir:
(a) u ∈ Cn (I),
(b) (x, u(x), u (x), . . . , u(n−1) (x)) ∈ Ω für x ∈ I,
(c) u(n) (x) = f (x, u(x), u (x), . . . , u(n−1) (x)) für x ∈ I.

Satz. Für jede Lösung u ∈ Cn (I) der DG y (n) = f (x, y, y  , . . . , y (n−1) ) liefert

y := (y1 , . . . , yn ) mit y1 := u, y2 := u , . . . , yn := u(n−1)


2 Das Anfangswertproblem als Integralgleichung 29

eine C1 –differenzierbare Lösung y : I → Ê n


des Systems
⎧ 

⎪ y1 = y2

⎨ ..
(S) .



yn−1 = yn

⎩ 
yn = f (x, y1 , . . . , yn ) .

Ê
Ist umgekehrt u = (u1 , . . . , un ) : I → n eine C1 –differenzierbare Lösung von
(S), so ist u := u1 eine Cn –differenzierbare Lösung der Differentialgleichung
y (n) = f (x, y, y  , . . . , y (n−1) ) ÜA .

Daraus ergibt sich die adäquate Form des Anfangswertproblems für eine
DG n–ter Ordnung:

y (n) = f (x, y, y  , . . . , y (n−1) ) , y(ξ) = η1 , . . . , y (n−1) (ξ) = ηn

für einen gegebenen Punkt (ξ, η1 , . . . , ηn ) = (ξ, η) ∈ Ω.

Satz. Dieses AWP ist eindeutig lösbar genau dann, wenn das AWP (S) mit
der Anfangsbedingung y(ξ) = η eindeutig lösbar ist. Es handelt sich also um
äquivalente Problemstellungen.
Denn für u, v ∈ Cn (I) gilt u = v ⇐⇒ (u, u , . . . , u(n−1) ) = (v, v  , . . . , v (n−1) ).

1.4 Systeme von Differentialgleichungen n–ter Ordnung lassen sich auf


diesem Wege ebenfalls in Systeme erster Ordnung umwandeln.
ÜA Führen Sie dies für ein System ÿ = By mit einer 2 × 2–Matrix B aus.

2 Das Anfangswertproblem als Integralgleichung


2.1 Integrale von vektorwertigen Funktionen
Für eine vektorwertige Funktion a(t) = (a1 (t), . . . , an (t)) mit reell– oder kom-
plexwertigen Funktionen ak ∈ C(I) definieren wir das Integral komponenten-
weise:

β  β β
a(t) dt := a1 (t) dt , . . . , an (t) dt
α α α

(α, β ∈ I, auch für β < α). Bezüglich des kanonischen Skalarproduktes gilt
 β  β
(∗) b, a(t) dt = b , a(t) dt ,
α α
30 § 2 Grundlegende Theorie

wobei t → b , a(t) stetig ist. Auch a(t) ist stetig in t, und es gilt die
Integralabschätzung
 β   β 
   
 a(t) dt  ≤  a(t) dt  .
α α

(Die Betragsstriche auf der rechten Seite tragen der Möglichkeit β < α Rech-
nung.)
Dies ergibt sich für α < β aus (∗) mit der Cauchy–Schwarzschen Ungleichung

und anschließendem Einsetzen von a(t) dt für b ÜA . Diese Integralabschät-
α
zung gilt auch bezüglich der Norm a∞ = max{|a1 |, . . . , |an |} ÜA .

2.2 Das Anfangswertproblem in Fixpunktform


Genau dann ist u : I → Ên
eine Lösung des AWP

y = f (x, y) , y(ξ) = η ,

wenn u : I → Ê n
stetig ist und die Integralgleichung
x
u(x) = η + f (t, u(t)) dt
ξ

für alle x ∈ I erfüllt.

Schreiben wir für die rechte Seite dieser Gleichung T (u)(x), so haben wir das
AWP auf eine einzige Fixpunktgleichung der Gestalt

u = T (u)

zurückgeführt, wobei nur nach stetigen Lösungen zu suchen ist.


Das folgt sofort aus dem Hauptsatz der Differential– und Integralrechnung für
die Komponenten des Integrals ÜA .

3 Die Standardvoraussetzung für DG–Systeme


3.1 Die Standardvoraussetzung für die rechte Seite ist in diesem Para-
Ê
graphen: f : n+1 ⊃ Ω → n
Ê ∂fi
ist stetig, die partiellen Ableitungen ∂y
k
existieren in Ω und sind dort stetige Funktionen, kurz
 
∂fi
f und Dy f sind stetig auf Ω, wobei Dy f (x, y) := (x, y) .
∂yk
Der Sinn dieser scheinbar unnötig komplizierten Voraussetzung ergibt sich dar-
aus, dass die allgemeine Theorie zwei wichtigen Spezialfällen Rechnung tragen
soll:
3 Die Standardvoraussetzung für DG–Systeme 31

(a) Lineare Systeme y = A(x)y + b(x) . Hier muss zugelassen werden, dass
die Komponenten aik (x) der n × n–Matrix A(x) und die Komponenten bj (x)
von b(x) auf einem offenen Intervall I stetig sind. Dann erfüllt die rechte Seite
Ê
f (x, y) = A(x)y + b(x) auf Ω = I × n die Standardvoraussetzung.

(b) Autonome Systeme y = g(y) , bei denen die rechte Seite nicht explizit
Ê Ê
von x abhängt. Ist g : n ⊃ Ω → n eine C1 –Abbildung, so erfüllt die
Funktion f (x, y) := g(y) auf Ω := Ê
× Ω die Standardvoraussetzung. Auf
autonome Systeme gehen wir in § 5 näher ein.

3.2 Die Lipschitz–Bedingung


(a) Die rechte Seite f erfüllt auf einer Teilmenge K von Ω eine Lipschitz–
Bedingung mit der Lipschitz–Konstanten L, in Zeichen

f ∈ Lip (K, L),

wenn für alle (x, y), (x, z) ∈ K die Ungleichung

f (x, y) − f (x, z) ≤ L y − z

erfüllt ist.
(b) Die Lipschitz–Bedingung für lineare Systeme y = A(x)y + b(x) .
Sind die Komponenten aik von A und bi von b stetig auf einem Intervall I
und setzen wir

n 
n
1/2
A(x)2 := aik (x)2 ,
i=1k=1

so gilt für f (x, y) = A(x)y + b(x)

f (x, y) − f (x, z) ≤ A(x)2 y − z ,

vgl. Bd.1, § 21 : 7.2. Ist also J ein kompaktes Teilintervall von I und K = J × Ê n
,
so gilt f ∈ Lip (K, L) mit L = max{A(x)2 | x ∈ J}.

(c) Satz. Unter der Standardvoraussetzung 3.1 erfüllt f eine Lipschitz–Be-


dingung in jeder kompakten Menge K ⊂ Ω, die mit je zwei Punkten (x, y),
(x, z) auch die Verbindungsstrecke enthält.

Beweis. Wir setzen (vgl. (b))


 
∂fi  
A(x, y) = (x, y) , L = max A(x, y)2 | (x, y) ∈ K .
∂yk

Für (x, y), (x, z) ∈ K und b ∈ Ê n


setzen wir ϕ(t) := b , f (x, z + t(y − z)) .
32 § 2 Grundlegende Theorie

Nach dem Mittelwertsatz gilt mit geeignetem ϑ ∈ ]0, 1[

b , f (x, y) − f (x, z) = ϕ(1) − ϕ(0)


= b , A(x, z + ϑ(y − z))(y − z)
≤ b A(x, z + ϑ(y − z))(y − z)
≤ b L y − z .

Die Behauptung folgt jetzt mit b = f (x, y) − f (x, z). 2

(d) Eine Lipschitz–Bedingung für Graphenumgebungen.


Ê
Sei u : [α, β] → n eine stetige Kurve, deren Graph
 
Gu := (x, u(x)) | α ≤ x ≤ β

in Ω liegt. Dann gibt es ein δ > 0, so dass der δ–Schlauch


 
Sδ (u) := (x, y) | α ≤ x ≤ β, y − u(x) ≤ δ

eine kompakte Teilmenge von Ω der in (c) genannten Art ist.


Denn Gu ist als Bildmenge des kompakten Intervalls [α, β] unter der stetigen
Ê
Abbildung x → (x, u(x)) kompakt. Im Fall Ω = n+1 ist nichts zu beweisen,
andernfalls setzen wir δ := 12 dist (Gu , ∂Ω) .

4 Kontrolle und Eindeutigkeit von Lösungen


4.1 Abstandskontrolle von Lösungen
Seien u0 , u : I → Ê
n
Lösungen der Anfangswertprobleme

u0 = f 0 (x, u0 ) , u0 (ξ0 ) = η 0 und u = f (x, u) , u(ξ) = η .

Gesucht ist eine Abschätzung für den Abstand (x) := u0 (x) − u(x) der bei-
den Lösungen in Abhängigkeit von den Abweichungen der Ausgangsdaten

f 0 − f  , | ξ0 − ξ | , η 0 − η .

Wir setzen voraus, dass beide Lösungsgraphen in einer kompakten Teilmenge


K von Ω verlaufen und dass f 0 ∈ Lip (K, L) gilt. Ferner setzen wir

M := max {f 0 (x, y) | (x, y) ∈ K} ,

ε1 := max {f 0 (x, y) − f (x, y) | (x, y) ∈ K} .

Dann ergibt sich aus der Fixpunktform 2.2 der beiden Anfangswertprobleme
4 Kontrolle und Eindeutigkeit von Lösungen 33

 x x 
(x) = u0 (x) − u(x) =  η 0 + f 0 (t, u0 (t)) dt − η − f (t, u(t)) dt 
ξ0 ξ
 x  
=  η0 − η + f 0 (t, u0 (t)) − f 0 (t, u(t)) + f 0 (t, u(t)) − f (t, u(t)) dt
ξ
ξ 
+ f 0 (t, u0 (t)) dt 
ξ0
 x  
 
≤ η 0 − η +  L u0 (t) − u(t) + ε1 dt  + | ξ0 − ξ |M .
ξ

Daher gilt mit ε0 := η 0 − η + | ξ0 − ξ |M


 x  
 
(∗) (x) ≤ ε0 +  L (t) + ε1 dt  .
ξ

Um daraus eine Abschätzung für (x) zu gewinnen, dient uns

4.2 Das Lemma von Gronwall


Ê
Genügt eine stetige Funktion : I → + der Integralungleichung (∗) mit Kon-
stanten ε0 , ε1 ≥ 0 und L > 0, so gilt für x ∈ I
ε1  L|x−ξ|
(x) ≤ ε0 eL|x−ξ| + e −1 .
L

Beweis.
 x 
 
Wir setzen h(x) := ε0 +  (L (t) + ε1 ) dt  .
ξ
Die Funktion h ist stetig und es gilt (x) ≤ h(x). Zwar existiert h (ξ) nicht,
aber die Einschränkungen von h auf {x ∈ I | x < ξ} und {x ∈ I | x > ξ} sind
C1 –differenzierbar. Für x < ξ gilt

h (x) = −L (x) − ε1 ≥ − L h(x) − ε1 ,

d  Lt
e h(t) = L eLt h(t) + eLt h (t) ≥ − ε1 eLt .
dt
Integration von x bis ξ ergibt
ε1  Lx
eLξ ε0 − eLx h(x) = eLξ h(ξ) − eLx h(x) ≥ e − eLξ .
L
Daraus folgt
ε1  L(x−ξ)
(x) ≤ h(x) ≤ ε0 eL(x−ξ) + e −1 .
L
Der Fall x > ξ ergibt sich analog (Integration von d
dt
(e−Lt h(t)) von ξ bis x). 2
34 § 2 Grundlegende Theorie

4.3 Der Eindeutigkeitssatz


Unter der Standardvoraussetzung 3.1 hat das Anfangswertproblem

y = f (x, y) , y(ξ) = η

höchstens eine Lösung.

Beweis.
Ê
Angenommen, für zwei Lösungen u0 : I → n, u : J → n dieses AWP gibt Ê
es ein s ∈ I ∩ J mit u0 (s) = u(s), o.B.d.A. s > ξ. Dann existiert
  
x0 := inf x > ξ  u0 (x) = u(x) ,

und es gilt u0 (x0 ) = u(x0 ) =: y0 . Wir wählen eine Graphenumgebung


  
K = (x, y)  |x − x0 | ≤ r , y − u0 (x) ≤ δ ⊂ Ω

für u0 , wobei wir r > 0 so wählen, dass

(x) := u0 (x) − u(x) ≤ δ , d.h. (x, u(x)) ⊂ K für |x − x0 | ≤ r .

Nach 3.2 (d) gibt es eine Lipschitzkonstante L für f in K. Aus 4.1 folgt mit
ξ = ξ0 := x0 , η = η 0 := y0 und f 0 := f (also ε1 = ε0 = 0)
x
(x) ≤ L (t) dt für x0 ≤ x < x0 + r .
x0

Nach dem Gronwallschen Lemma ergibt sich hieraus (x) = 0, d.h. u(x) =
u0 (x) für x0 ≤ x ≤ x0 + r, was im Widerspruch zur Wahl von x0 steht. 2

5 Existenz von Lösungen


5.1 Das Iterationsverfahren von Picard–Lindelöf
Unter der Standardvoraussetzung 3.1 gibt es zu jedem Punkt (ξ, η) ∈ Ω eine
lokale Lösung des Anfangswertproblems

y = f (x, y) , y(ξ) = η,

Ê
d.h. es gibt eine eindeutig bestimmte Lösung u : I → n auf einem Intervall
I = [ξ − δ, ξ + δ] mit δ > 0 . Diese ist gleichmäßiger Limes der Picard–
Iterierten uk , gegeben durch die Iterationsvorschrift

u0 (x) = η ,
x
uk+1 (x) = η + f (t, uk (t)) dt für k = 0, 1, . . . .
ξ
5 Existenz von Lösungen 35

Beweis.
(a) Wahl von δ. Wir bestimmen zunächst r > 0, R > 0 so, dass der Zylinder
  
Z = (x, y)  | x − ξ | ≤ r, y − η ≤ R

ganz in Ω liegt. Ist M = max{f (x, y) | (x, y) ∈ Z}, so wählen wir δ > 0 so,
dass δ ≤ r und δ M ≤ R.
Nun setzen wir
  
K := (x, y)  | x − ξ | ≤ δ , y − η ≤ R

und wählen eine Lipschitzkonstante L für f auf K gemäß 3.2 (c).


(b) Durchführbarkeit des Iterationsverfahrens. Wir zeigen per Induktion, dass
der Graph der Iterierten uk in K liegt. Für u0 ist das richtig. Liegt (x, uk (x))
für | x − ξ | ≤ δ in K, so folgt
 x 
 
uk+1 (x) − η ≤  f (t, uk (t)) dt  ≤ M | x − ξ | ≤ M δ ≤ R .
ξ

(c) Die gleichmäßige Konvergenz der Picard–Iterierten uk .


Zunächst ist nach (b) u1 (x) − u0 (x) = u1 (x) − η ≤ R. Allgemein gilt
 x 
 
uk+1 (x) − uk (x) =  [f (t, uk (t)) − f (t, uk−1 (t))] dt 
ξ
 x 
 
≤  f (t, uk (t)) − f (t, uk−1 (t)) dt 
ξ
 x 
 
≤ L  uk (t) − uk−1 (t) dt  .
ξ

Daraus ergibt sich sukzessive


 x 
 
u2 (x) − u1 (x) ≤ L  u1 (t) − u0 (t) dt  ≤ R L | x − ξ | ,
ξ
 x 
  | x − ξ |2
u3 (x) − u2 (x) ≤ L  R L | t − ξ | dt  = R L2 .
ξ
2

Durch Induktion erhalten wir für k = 0, 1, . . . ÜA

(L | x − ξ |)k (Lδ)k
(∗) uk+1 − uk  ≤ R ≤ R .
k! k!
Also konvergiert jede Komponente von
k 

uk+1 (x) = η + uj+1 (x) − uj (x)
j=0
36 § 2 Grundlegende Theorie

gleichmäßig auf I = [ξ − δ, ξ + δ], denn die Komponenten der Reihe


∞ 
 

(δL)j
uj+1 (x) − uj (x) haben nach (∗) die Majorante R .
j=0 j=0 j!

(d) u := lim uk löst das Anfangswertproblem auf I. Denn die Komponenten


k→∞
von u sind stetig als gleichmäßige Limites stetiger Funktionen. Da K abgeschlos-
sen ist, liegt der Graph von u in K. Aus

f (t, u(t)) − f (t, uk (t)) ≤ L u(t) − uk (t)

folgt die gleichmäßige Konvergenz f (t, uk (t)) → f (t, u(t)) , somit


 x
u(x) = lim uk+1 (x) = lim η+ f (t, uk (t)) dt
k→∞ k→∞
ξ
x x
= η+ lim f (t, uk (t)) dt = η + f (t, u(t)) dt .
k→∞
ξ ξ

Damit ist u : I → Ê n
eine Lösung des AWP nach 2.2. 2

5.2 Aufgaben
(a) Sei n = 1 und f (x, y) = x |y| in Ê × Ê. Warum kann f in [−1, 1] × [−1, 1]
keine Lipschitz–Bedingung erfüllen?
(b) Das Anwachsen der Lösung. Mit den Bezeichnungen des Beweises 5.1
gilt u(x) − η ≤ R eL |x−ξ| . Begründung?
(c) Führen Sie die Picard–Iteration für das AWP

2 1
y1 = y2 , y2 = y1 , y1 (1) = 2 , y2 (1) = 1
x 2x
in Ê>0 × Ê durch. Es ergibt sich ein einfaches Resultat.
(d) Fehlerabschätzung für das Iterationsverfahren. Zeigen Sie mit Hilfe
der Fixpunktgleichung für die Lösung u und mittels Induktion, dass für die
Picard–Iterierte uk unter den Voraussetzungen 5.1 (a) Folgendes gilt:

|x − ξ|k+1
u(x) − uk (x) ≤ M Lk für |x − ξ| ≤ δ .
(k + 1)!
 2 1 2
 Lösung des AWP y = 1 + 3x + 4 y , y(0) = 0 auf dem Intervall
(e) Sei u die
I = − 2 , 2 . Geben Sie ein Polynom p an mit | u(x) − p(x) | ≤ 0.02 für x ∈ I.
1 1

Anleitung: Um die Fehlerabschätzung


  (d) anwenden zu können, ist zunächst
ein Rechteck KR = − 12 , 12 × [−R, R] so zu bestimmen, dass die Graphen
5 Existenz von Lösungen 37

aller Picard–Iterierten dort verbleiben. Nach 5.1 (a) lautet die Bedingung dafür
1
2
M (R) ≤ R, wobei
 
M (R) = max 1 + 3x2 + 14 y 2 | | x | ≤ 12 , | y | ≤ R .

Wählen Sie R passend und bestimmen Sie die Lipschitz–Konstante für KR .


(f) Führen Sie das Iterationsverfahren für das Anfangswertproblem

y1 = 3
y
2 1
− 1
y
2 2
, y1 (0) = 2 ,
y2 = 1
y
2 1
+ 1
y
2 2
, y2 (0) = 0

durch. Nach wenigen Schritten erkennen Sie das Bildungsgesetz der Reihe für
y2 ; es ergibt sich eine einfache Formel für y2 . Aus der zweiten DG erhalten Sie
dann y1 . Vergleichen Sie den realen Fehler mit der Fehlerabschätzung (d).

Bemerkung. Die dem System zugrundeliegende Matrix A = 21 31 −11 ist
nicht diagonalähnlich; der Entkopplungsansatz von Bd. 1, § 18 : 5 führt hier nicht
zum Ziel. Weiteres zu linearen Systemen siehe § 3 Abschnitte 1 und 2.

5.3 Der globale Existenz– und Eindeutigkeitssatz


Unter der Standardvoraussetzung 3.1 hat das Anfangswertproblem

y = f (x, y) , y(ξ) = η

für jeden Startpunkt (ξ, η) ∈ Ω genau eine Lösung x → ϕ(x, ξ, η) auf einem
maximalen Intervall J(ξ, η). Dieses Existenzintervall J(ξ, η) ist offen.
Ê
Für jede andere Lösung u : I → n des Anfangswertproblems gilt also

I ⊂ J(ξ, η) und u(x) = ϕ(x, ξ, η) für alle x ∈ I .

Wir nennen

x → ϕ(x, ξ, η), J(ξ, η) → Ê n

die maximal definierte (maximale) Lösung des AWP.

Beweis.
Wir definieren J(ξ, η) als Vereinigung aller Lösungsintervalle, d.h. aller Inter-
valle I, für die ξ innerer Punkt ist und die Definitionsintervall einer Lösung
des AWP y = f (x, y), y(ξ) = η sind. Nach dem lokalen Existenzsatz gibt
es solche, und nach dem Eindeutigkeitssatz bestimmt jedes Lösungsintervall I
eindeutig eine dort definierte Lösung uI . Der Durchschnitt und die Vereinigung
zweier Lösungsintervalle I, J ist wieder eines, Letzteres wegen ξ ∈ I ∪ J. Daher
ist J(ξ, η) ein Intervall, d.h. für α, β ∈ J(ξ, η) mit α < β ist [α, β] ⊂ J(ξ, η)
38 § 2 Grundlegende Theorie

(Bd. 1, § 8 : 4.7). Sind nämlich I, J Lösungsintervalle mit α ∈ I, β ∈ J, so gilt


[α, β] ⊂ I ∪ J ⊂ J(ξ, η). Wegen des Eindeutigkeitssatzes dürfen wir definieren

ϕ(x, ξ, η) := uI (x), falls x im Lösungsintervall I liegt.

Dann ist x → ϕ(x, ξ, η) eine nach Konstruktion maximal definierte Lösung.


Das Existenzintervall J(ξ, η) ist offen. Denn zu jedem x0 ∈ J(ξ, η) gibt es
nach 5.1 ein mit δ > 0 und eine lokale Lösung z : [x0 − δ, x0 + δ] → n des Ê
AWP

y = f (x, y) , y(x0 ) = ϕ(x0 , ξ, η).

Als maximale Lösung muss ϕ eine Fortsetzung der lokalen Lösung z sein, somit
ist [x0 − δ, x0 + δ] in J(ξ, η) enthalten. 2

5.4 Beispiele und Aufgaben


(a) Bestimmen Sie die maximalen Lösungen und deren Definitionsintervall für
das AWP y  = f (x, y), y(0) = y0 mit den rechten Seiten

f (x, y) =
y
1 − x2
bzw. f (x, y) =
y2
1 − x2
in Ω = ] − 1, 1[ × Ê.
(b) Zeigen Sie: Die Lösung y(x) = y0 exp((x − 1) sin log(1 − x)) des AWP

y  = y (sin log(1 − x) + cos log(1 − x)) , y(0) = y0 > 0

in Ω = ]− ∞, 1[ × Ê
existiert für x < 1 und besitzt für x → 1− einen Grenz-
wert, während lim y  (x) nicht existiert.
x→1−

6 Zum Definitionsintervall maximaler Lösungen


6.1 Der Fortsetzungssatz
Ê
Für die DG y = f (x, y) auf Ω ⊂ n+1 sei die Standardvoraussetzung 3.1
erfüllt, und u sei eine Lösung. Dann gilt
(a) Liegen alle Punkte (x, u(x)) für x ∈ ]a, b[ in einer kompakten Teilmenge
von Ω, so kann u zu einer Lösung auf einem größeren Intervall ]a − ε, b + ε[
(ε > 0) fortgesetzt werden.
(b) Ist u maximal definiert, so verlassen die Punkte (x, u(x)) sowohl für wach-
sendes als auch für fallendes x schließlich jede kompakte Teilmenge von Ω.
Da sich Ω durch kompakte Mengen ausschöpfen lässt (Bd. 1, § 23 : 4.7), können
wir für (b) auch sagen: Der Graph von u läuft in Ω von Rand zu Rand.“

6 Zum Definitionsintervall maximaler Lösungen 39

Beweis.
(a) folgt unmittelbar aus (b).
(b) Sei u eine maximale Lösung auf dem nach 5.3 offenen Intervall I, deren
Graph die kompakte Menge K ⊂ Ω trifft.
Dann ist A := {x ∈ I | (x, u(x)) ∈ K} nicht leer und beschränkt, da K
beschränkt ist. Also existiert β := sup A. Haben wir β ∈ I gezeigt, so gibt es
Zahlen x ∈ I mit x > β, und für alle diese x gilt (x, u(x)) ∈ K.
Zum Nachweis von β ∈ I geben wir anschließend ein δ > 0 an mit
(∗) [ξ − δ, ξ + δ] ⊂ J(ξ, η) für jeden Punkt (ξ, η) ∈ K;
dabei ist J(ξ, η) gemäß 5.3 definiert. Da es nach Definition von β ein ξ ∈ A gibt
mit β − δ < ξ ≤ β, also β ∈ [ξ, ξ + δ[ , folgt dann β ∈ J(ξ, u(ξ)) = I.
Nachweis von (∗) : Für := 1
dist (K, ∂Ω) bzw. := 1 im Fall Ω = Ê n+1
ist
 
2

K := z ∈

Ê n+1
| dist (z, K) ≤
eine kompakte Teilmenge von Ω. Wir√setzen M := max{f (x, y) | (x, y) ∈ K  }
und wählen δ > 0 so, dass M δ ≤ / 2. Für (ξ, η) ∈ K gilt
 √ √ 
Z (ξ, η) := (x, y) | |x − ξ| ≤ / 2 , y − η ≤ / 2 ⊂ K (ξ, η) ⊂ K  .

Dem Teil (a) des Existenzbeweises 5.1 entnehmen wir die Aussage (∗).
Entsprechend schließen wir, dass α := inf A ∈ I. 2

6.2 Zur Anwendung


Sei u : I = [α, β] → Ê n
stetig, und
der δ–Schlauch
K := {(x, y) | x ∈ I, y − u(x) ≤ δ}
6' $
y
liege ganz in Ω. Läßt sich für die in
(ξ, η) ∈ K startende Lösung ϕ(x, ξ, η) K
zeigen, dass sie den Schlauchmantel u
nicht trifft, d.h.
η0 •
ϕ(x, ξ, η) − u(x) < δ •

für x ∈ I ∩ J(ξ, η), so folgt [α, β] ⊂


J(ξ, η). Denn nach 6.1 (c) verlassen die Ω
Punkte (x, ϕ(x, ξ, η)) für wachsendes & %
bzw. fallendes x ∈ J(ξ, η) die kom-
pakte Menge K. Da dies nicht durch -
den Schlauchmantel geschehen kann α ξ0 β x
( (x) := ϕ(x, ξ, η) − u(x) ist stetig),
müssen sie die Schlauchenden x = β,
x = α durchstoßen.
40 § 2 Grundlegende Theorie

6.3 Anwendung auf autonome Systeme


Autonome Systeme haben nach 3.1 (c) die Form ẏ = g(y), wobei g in einem
Ê
Gebiet Ω ⊂ n stetig differenzierbar ist. Wir deuten hier im Hinblick auf die
Anwendungen die unabhängige Variable als Zeit und bezeichnen sie mit t.
Als Startzeitpunkt dürfen wir immer ξ = 0 wählen. Denn gilt
u̇(t) = g(u(t)) für t ∈ I und u(ξ) = η ,
so löst v(t) = u(t + ξ) im verschobenen Intervall I − ξ das AWP
v̇(t) = g(v(t)) , v(0) = η ,
und für jede Lösung v des letzteren AWP löst u(t) = v(t−ξ) das ursprüngliche.
Wir bezeichnen die maximale Lösung des AWP
ẏ(t) = g(y) , y(0) = η
mit t → ϕ(t, η), ihr Definitionsintervall mit J(η).

Der Fortsetzungssatz für autonome Systeme


(a) Bleibt ϕ(t, η), soweit definiert, für wachsendes t ≥ 0 in einer kompakten
Teilmenge K  von Ω , so existiert ϕ(t, η) in aller Zukunft, das heißt, es gilt
Ê + ⊂ J(η).

(b) Bleibt ϕ(t, η) für fallendes t ≤ 0 in einer kompakten Teilmenge K  von Ω ,


Ê
so existiert ϕ(t, η) in der vollen Vergangenheit, d.h. ≤0 ⊂ J(η).
(c) Sind beide Voraussetzungen erfüllt, so existiert ϕ(t, η) für alle Zeiten.

Beweis.
(a) Sei Ω = Ê×Ω 
und f : Ω → Ê n
, (t, y) → g(y) .
Ê
Angenommen, ϕ(t, η) sei nicht für alle t ≥ 0 definiert, also J(η) ∩ + = [0, T [.
Dann bleiben die Punkte (t, ϕ(t, η)) für 0 ≤ t < T in der kompakten Teilmenge
K = [0, T ] × K  von Ω, und nach 6.1 (a) ließe sich ϕ(x, η) auf ein Intervall
[0, T + δ[ fortsetzen im Widerspruch zur Wahl von T .
(b) ergibt sich analog; (c) folgt aus (a) und (b). 2

6.4 Die logistische Differentialgleichung


Vermehrt sich eine Population mit konstanter Wachstumsrate α > 0, d.h. gilt
für den Populationsstand u(t) zur Zeit t die DG

u̇(t) = α u(t) ,

so wächst die Population nach dem Exponentialgesetz u(t) = u(0) eαt . Ein sol-
ches Wachstum ist unrealistisch, denn mit wachsender Populationszahl gehen
irgendwann die Ressourcen zu Ende.
6 Zum Definitionsintervall maximaler Lösungen 41

Das einfachste Modell einer von der


Population abhängigen Wachstumsrate y
liefert die DG 6
u̇ = β (K − u) u
mit Konstanten β, K > 0 (gedämpftes
Wachstum mit Sättigungsgrenze K).
Die Umskalierung
 
y(t) = 1
u t -
K βK t
führt auf die logistische DG
ẏ = y (1 − y)
Diese hat die konstanten Lösungen 0
und 1.
Startet eine Lösung mit einem von 0 oder 1 verschiedenen Anfangswert, so kann
diese wegen des Eindeutigkeitssatzes keinen dieser beiden Werte annehmen.
Für η ∈ ]0, 1[ bleibt also ϕ(t, η), soweit definiert, immer in [0, 1] (sogar in ]0, 1[).
Nach 6.3 existiert also ϕ(t, η) für alle Zeiten.
Für η > 1 bleibt aus den obengenannten Gründen ϕ(t, η) > 1, soweit definiert.
Also gilt ϕ̇(t, η) = ϕ(t, η)(1 − ϕ(t, η)) < 0, d.h. ϕ(t, η) fällt monoton und
bleibt für wachsendes t im Intervall ]1, η]. Somit existiert ϕ(t, η) nach 6.3 für
alle t ≥ 0. Entsprechend ergibt sich, dass ϕ(t, η) im Fall η < 0 für alle t ≤ 0
existiert.
Für 0 < η < 1 folgt aus der DG, dass ϕ(t, η) monoton wächst. Also existiert
c := limt→∞ ϕ(t, η).
Daraus folgt lim ϕ̇(t, η) = c(1 − c), andererseits muss dieser Limes Null sein.
t→∞
Damit ergibt sich lim ϕ(t, η) = 1 für alle η > 0.
t→∞
Betrachtungen dieser Art sind typisch für die qualitative Behandlung von Dif-
ferentialgleichungen, vgl. § 5
Aufgabe. Bestimmen Sie ϕ(t, η) und J(η) nach dem Verfahren Bd. 1, § 13 : 3.
Es ergibt sich für η > 1, dass ϕ(t, η) nicht in der vollen Vergangenheit existiert.
Für η < 0 existiert ϕ(t, η) nicht für alle t ≥ 0.

6.5 Beispiel
Wir betrachten für r = x2 + y 2 > 0 das System
x y
ẋ = − y + r (1 − r 2 ) , ẏ = x + r (1 − r 2 ) .
Eine leichte Rechung ÜA zeigt
1
ṙ = r (xẋ + y ẏ) = 1 − r 2 längs jeder Lösung t → (x(t), y(t)) .
42 § 2 Grundlegende Theorie

Die DG ṙ = 1 − r 2 besitzt die konstante Lösung r = 1, und tatsächlich ist

t → u(t) := (cos t, sin t) eine Lösung des Ausgangssystems.

Jede mit 0 < r(0) < 1 startende Lösung v kann die Einheitskreislinie nicht
treffen: Aus v(t2 ) = u(t1 ) würde folgen v(t + t2 ) = u(t + t1 ) für alle t, vgl. 6.3.
Wegen ṙ > 0 existiert sie daher nach dem Fortsetzungssatz 6.3 mindestens für
t∈ + Ê
Aufgabe. (a) Zeigen Sie, dass auch die außerhalb des Einheitskreises star-
tenden Lösungen für alle t ≥ 0 existieren. (Beachten Sie: ṙ(t) < 0.)
(b) Zeigen Sie analog zu 6.4, dass lim r(t) = 1.
t→∞

6.6 Linear beschränkte Systeme


Ê Ê
Die rechte Seite f : I × n → n heißt linear beschränkt (von linearem
Wachstum), wenn I ein offenes Intervall ist und wenn es stetige Funktionen
Ê
a, b : I → + gibt mit
 
f (x, y)  ≤ a(x)y + b(x)

für alle x ∈ I, y ∈ Ê.n

Für linear beschränkte Systeme gilt immer J(ξ, η) = I, d.h. die Lösung ist so
weit definiert, wie es die rechte Seite überhaupt zulässt.

Beweis.
Für u(x) = ϕ(x, ξ, η) gilt
 x   x 
   
u(x) =  η + f (t, u(t)) dt  ≤ η +  f (t, u(t)) dt 
 xξ
 ξ
 
≤ η +  (a(t)u(t) + b(t)) dt 
ξ
 x 
 
≤ B(x) + A(x)  u(t) dt 
ξ

mit
 x   
 
B(x) = η +  b(t) dt  , A(x) = max a(t) | | t − ξ | ≤ | x − ξ | .
ξ

Sei [ξ, β] ein kompaktes Teilintervall von I. Wir zeigen [ξ, β] ⊂ J(ξ, η). Offenbar
ist

A(x) ≤ A(β) , B(x) ≤ B(β) für ξ ≤ x ≤ β .


6 Zum Definitionsintervall maximaler Lösungen 43


Wir setzen C(β) := B(β) exp A(β) (β − ξ) . Aus
 x 
 
u(x) ≤ B(β) + A(β)  u(t) dt  für x ∈ [ξ, β] ∩ J(ξ, η)
ξ

folgt nach dem Gronwallschen Lemma mit ε0 = B(β), L = A(β), dass


u(x) ≤ C(β) für x ∈ [ξ, β] ∩ J(ξ, η) .
Angenommen, β ∈ J(ξ, η). Dann bleiben die Punkte (x, u(x)) für alle x ∈
J(ξ, η) mit x ≥ ξ in der kompakten Menge
K := {(x, y) | ξ ≤ x ≤ β , y ≤ C(β)} .
Nach dem Fortsetzungssatz 6.1 (a) ließe sich dann die Lösung über das rechte
Intervallende von J(ξ, η) hinaus fortsetzen, ein Widerspruch. Somit liegt jedes
kompakte Teilintervall [ξ, β] von I in J(ξ, η). Es folgt I = J(ξ, η). Entspre-
chend ergibt sich, dass jedes kompakte Teilintervall [α, ξ] von I zu J(ξ, η) gehört
ÜA . 2

Beispiel. Jede maximale Lösung der inhomogenen Pendelgleichung


ÿ(t) + sin y(t) = f (t)
Ê
mit f ∈ C( ) existiert für alle Zeiten ÜA .

6.7 Lineare Systeme y  = A(x)y + b(x)


(a) Nach 3.2 (b) ist die rechte Seite linear beschränkt. Sind also die Kompo-
nentenfunktionen von A, b auf einem Intervall I stetig, so sind die maximalen
Lösungen jeweils auf ganz I erklärt. Dies gilt auch für abgeschlossene Intervalle
I, die wir bei linearen Systemen zulassen. Um diese in die bisher entwickelte
Theorie einzuordnen, brauchen wir die Koeffizientenfunktionen nur stetig auf
ein I umfassendes offenes Intervall fortzusetzen.
(b) Die Lösungsvektoren y : I → Ê n
der homogenen Gleichung bilden einen
Vektorraum der Dimension n über Ê.
Beweis.
Ê Ê
Für y ∈ C1 (I, n ) sei Ly = y − Ay. Dann ist L : C1 (I, n ) → C(I, n ) eine Ê
lineare Abbildung, also ist L0 = Kern L ein Vektorraum. Für festes ξ ∈ I ist
die Abbildung
T : L0 → Ê n
, u → u(ξ)
ebenfalls linear. Nach dem Existenz– und Eindeutigkeitssatz und nach (a) gibt
Ê
es zu jedem η ∈ n genau ein u ∈ L0 mit u(ξ) = η. Also ist T : L0 → n Ê
bijektiv und damit dim L0 = n. 2
44 § 2 Grundlegende Theorie

(c) Ein System von n linear unabhängigen Lösungen y1 , . . . , yn ∈ L0 heißt


Fundamentalsystem oder Lösungsbasis für die DG y = A(x)y.
Ein spezielles Fundamentalsystem ist gegeben durch

yk (x) = ϕ(x, ξ, ek ) (k = 1, . . . , n) ,

wo ξ ein fester Punkt in I ist, ek die kanonischen Basisvektoren des Ên


und
x → ϕ(x, ξ, ek ) die maximale Lösung des AWP

y = A(x)y , y(ξ) = ek .

Die Matrix Y (x, ξ) mit den Spalten y1 (x), . . . , yn (x) wird die kanonische Fun-
damentalmatrix an der Stelle ξ genannt. Offenbar gilt

n
ϕ(x, ξ, η) = Y (x, ξ)η = ηk yk (x) .
k=1

(d) Weiteres zu linearen Systemen finden Sie in § 3 : 1.

7 Differenzierbarkeitseigenschaften von Lösungen


7.1 Differenzierbarkeit der Lösung nach den Anfangswerten
Wir betrachten das Anfangswertproblem

y = f (x, y) , y(ξ) = η

unter der Standardvoraussetzung, dass f und Dy f stetig im Gebiet Ω ⊂ n+1 Ê


sind. Die maximale Lösung bezeichnen wir wieder mit x → ϕ(x, ξ, η), ihr Defi-
nitionsintervall mit J(ξ, η). Als Funktion sämtlicher Variabler besitzt ϕ(x, ξ, η)
den Definitionsbereich
 
Ωf := (x, ξ, η) | (ξ, η) ∈ Ω , x ∈ J(ξ, η) ⊂ Ê n+2
.

Satz. (a) Ωf ist ein Gebiet.


(b) ϕ ist dort C1 –differenzierbar nach allen Variablen x, ξ, η.
(c) Die partiellen Ableitungen von ϕ nach den Anfangsdaten
∂ϕ ∂ϕ
v(x) := (x, ξ, η) , wk (x) := (x, ξ, η) für k = 1, . . . , n
∂ξ ∂ηk
erfüllen die lineare homogene Differentialgleichung

(L) y = A(x) y mit A(x) := Dy f (x, ϕ(x, ξ, η))

und besitzen die Anfangswerte

v(ξ) = − f (ξ, η) , wk (ξ) = ek für k = 1, . . . , n .


7 Differenzierbarkeitseigenschaften von Lösungen 45

(d) Sind f und Dy f nach allen Variablen Ck –differenzierbar, so ist ϕ nach


allen Variablen Ck+1 –differenzierbar. Ist insbesondere f nach allen Variablen
C∞ –differenzierbar, so auch ϕ.

Bemerkungen. (i) Der langwierige Beweis wird im Anschluß an die Formu-


lierung der Sätze 7.2 und 7.3 in drei Schritten geführt:
– In 7.4 : Gebietseigenschaft von Ωf und Stetigkeit von ϕ. Der hierbei anfallende
Satz über die Kontrolle der Lösungen ist von eigenem Interesse.
– In 7.6 : C1 –Differenzierbarkeit von ϕ und Bestehen der Variationsgleichung
(L).
– In 7.7 : Beweis von (d).
(ii) Die lokale Existenz von Lösungen einschließlich ihrer differenzierbaren bzw.
analytischen Abhängigkeit lässt sich auch mit Hilfe des Satzes über impliziten
Funktionen auf Banachräumen zeigen, siehe Chow–Hale [27] III, § 1, Zeidler
[73] Vol.1, Thm.4.D.

7.2 Differenzierbare Abhängigkeit der Lösung von Parametern


Wir nehmen an, dass die rechte Seite der DG von Parametern λ1 , . . . , λm ab-
hängt, die wir zu einem Vektor λ = (λ1 , . . . , λm ) zusammenfassen. f (x, y, λ) sei
Ê
stetig in einem Gebiet Ω ⊂ n+m+1 und besitze dort stetige partielle Ableitun-
gen ∂f /∂yk , ∂f /∂λj . Die maximale Lösung des AWP

y = f (x, y, λ) , y(ξ) = η

bezeichnen wir mit x → ϕ(x, ξ, η, λ), ihr Definitionsintervall mit J(x, η, λ).

  
Satz. (a) Ωf := (x, ξ, η, λ) ∈ Ên+m+2  (x, η, λ) ∈ Ω , x ∈ J(x, η, λ) ist
ein Gebiet, und
(b) ϕ(x, ξ, η, λ) ist dort C1 –differenzierbar nach allen Variablen.
(c) Hängen f , Dy f und Dλ f in Ck –differenzierbarer Weise von allen Variablen
ab, so ist ϕ(x, ξ, η, λ) sogar Ck+1 –differenzierbar.
Das ergibt sich unmittelbar aus 7.1, wenn wir das erweiterte AWP

y = f (x, y, z) , y(ξ) = η ,

z = 0, z(ξ) = λ

betrachten. (u(x), v(x)) ist genau dann Lösung dieses Problems, wenn u das
Originalproblem löst und v(x) der konstante Vektor λ ist.
46 § 2 Grundlegende Theorie

7.3 Analytische Lösungen linearer Differentialgleichungen


Lineare Differentialgleichungen

u + f (x) u + g(x) u = h(x)

mit analytischen Koeffizienten f, g, h treten bei Separationsansätzen für partielle


Differentialgleichungen auf; diese werden in § 3 : 3 ausführlich behandelt. Der
Beweis des folgenden Satzes wird in 7.8 geführt.

Satz. Besitzen die Funktionen f, g, h für | x − x0 | < r konvergente Potenzrei-


henentwicklungen, so lässt sich jede Lösung u der obengenannten Gleichung in
eine für | x − x0 | < r konvergente Potenzreihe entwickeln.

7.4 Zur stetigen Abhängigkeit der Lösung von den Anfangswerten


Als ersten Beweisschritt für 7.1 zeigen wir unter den Standardvoraussetzungen:
(a) Ωf ist ein Gebiet.
(b) ϕ ist stetig in Ωf .
Kernstück des Beweises ist die Kontrollierbarkeit im Kleinen:
(c) Gegeben seien ein Anfangspunkt (ξ0 , η 0 ) ∈ Ω und ein kompaktes Teilintervall
I von J(ξ0 , η 0 ) mit ξ0 ∈ I. Dann gibt es Zahlen r, R, κ > 0, so dass für alle
Anfangspunkte (ξ, η) mit | ξ − ξ0 | < r, η − η 0  < R Folgendes gilt:
I ⊂ J(ξ, η) ,

ϕ(x, ξ, η) − ϕ(x, ξ0 , η 0 ) ≤ κ | ξ − ξ0 | + η − η 0  für x ∈ I .

Bemerkung. Dass auf nicht kompak-


ten Intervallen i.A. keine Kontrollier-
barkeit der Lösung gegeben ist, zeigt y
das Beispiel der DG y  = y . Hier ist 6' $

ϕ(x, ξ, η) = η ex−ξ . K

Die beiden Lösungen ϕ(x, 0, 0) = 0 u


und ϕ(x, ξ, η) mit η = 0 entfernen sich η0 •

für x → ∞ beliebig weit voneinander,
ganz gleich, wie nahe (ξ, η) bei (0, 0)
liegt. Ω
Beweis. & %
Wir beginnen mit (c). Sei I = [α, β]
und u(x) = ϕ(x, ξ0 , η 0 ). Da J(ξ0 , η 0 ) -
α ξ0 β x
offen ist, gibt es ein δ > 0 mit
J := [α − δ, β + δ] ⊂ J(ξ0 , η 0 ) .
7 Differenzierbarkeitseigenschaften von Lösungen 47

(1) Nach 3.2 (d) gibt es ein 0 > 0, so dass der 0 –Schlauch um u über dem
Intervall J ganz in Ω liegt:
 
K := (x, y) | x ∈ J , y − u(x) ≤ 0 ⊂ Ω,

und es gibt Zahlen L, M > 0 mit

f ∈ Lip (K, L) , f (x, y) ≤ M für (x, y) ∈ K .


R 
(2) Wir setzen γ := β − α + 2δ, R := 1
2 0 e−L γ und r := min M
, δ . Sei

jetzt | ξ − ξ0 | < r und η − η 0  < R. Dann ist ξ ∈ J , η − η 0  < 1
2 0 und
ε0 := η − η 0  + M | ξ − ξ0 | < 0 .
(3) Für (x) := ϕ(x, ξ, η) − u(x) folgt aus der Fixpunktgleichung für u

(ξ) = η − u(ξ) ≤ η − η 0  + M | ξ − ξ0 | = ε0 < 0 ,



also (ξ, η) = (ξ, ϕ(x, ξ, η)) ∈ K .
(4) Solange die Punkte (x, ϕ(x, ξ, η)) in K verbleiben, ergibt das Prinzip der
Fehlerkontrolle 4.1 (mit ε1 = 0, ε0 wie oben)
 x 
(x) ≤ ε0 +  L (x) dt  ,
ξ

also nach dem Gronwall–Lemma 4.2 wegen | x − ξ | < γ für x ∈ J

(x) ≤ ε0 eL |x−ξ| < ε0 eL γ < (R + M r) eL γ < 2R eL γ < 0 .

Das heißt aber: Entfernt sich x von ξ, so können die Punkte (x, ϕ(x, ξ, η))
die Mantelfläche von K nicht treffen. Nach dem Fortsetzungsprinzip 6.2 folgt
J(ξ, η) ⊃ J ⊃ I.
Der Rest von (c) folgt aus (x) < ε0 eL γ mit ε0 = η − η 0  + M | ξ − ξ0 |.
(5) Ωf ist offen, und ϕ ist dort stetig. Sei (x0 , ξ0 , η 0 ) ∈ Ωf . Wir wählen ein
kompaktes Intervall I = [α, β] ⊂ J(ξ0 , η 0 ) mit x0 , ξ0 ∈ I und dazu δ, r, R, κ
wie oben. Für | x − x0 | < r, | ξ − ξ0 | < r und η − η 0  < R ist zunächst

(ξ, η) ∈ K ⊂ Ω nach (3) und x ∈ J ⊂ J(ξ, η) nach (4); somit ist (x, ξ, η) ∈ Ωf .
Ferner gilt

ϕ(x, ξ, η) − ϕ(x0 , ξ0 , η 0 ) ≤ ϕ(x, ξ, η) − u(x) + u(x) − u(x0 )



≤ ε0 eL γ + M | x − x0 | = M | x − x0 | + eL γ M | ξ − ξ0 | + η − η 0  .

(6) Ωf ist wegzusammenhängend . Für (x, ξ, η) ∈ Ωf gilt x, ξ ∈ J(ξ, η) , also


liegt die Verbindungsstrecke zwischen (x, ξ, η) und (ξ, ξ, η) in Ωf .
48 § 2 Grundlegende Theorie


Ist t → u(t), v(t) ein Weg, der die Punkte (ξ, η), (ξ1 , η 1 ) in Ω verbindet,

so liefert t → u(t), u(t), v(t) einen Verbindungsweg in Ωf von (ξ, ξ, η) nach
(ξ1 , ξ1 , η 1 ). 2

(d) Zusatz. (Bezeichnungen wie in (c)). Für alle (ξ, η) mit | ξ − ξ0 | ≤ r


2
,
η − η 0  ≤ R
2
und alle (k, h) mit | k | ≤ r2 und h ≤ R
2
gilt
J(ξ + k, η + h) ⊃ J ⊃ I
und

ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η) ≤ κ | k | + h für x ∈ J.

Ersteres folgt aus (c) wegen η + h − η 0  < R, | ξ + k − ξ0 | < r. Für die zwei-
te Behauptung betrachten wir w(x) = ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η). Dann
ergibt sich wie in (3)

w(ξ) = ϕ(ξ, ξ + k, η + h) − η = ϕ(ξ, ξ + k, η + h) − (η + h) + h

= ϕ(ξ, ξ + k, η + h) − ϕ(ξ + k, ξ + k, η + h) + h

≤ M |k| + h < 1


2 0

und nach 4.1 und 4.2 ( ÜA )

w(x) ≤ (h + M | k |) eL |x−ξ| ≤ (h + M | k |) eL δ .

7.5 Die Variationsgleichung


(a) Zu gegebener Lösung x → u(x) von y = f (x, y) heißt die homogene
lineare DG

y = A(x) y mit der Matrix A(x) := Dy f (x, u(x))

die linearisierte Differentialgleichung (Linearisierung, Variationsglei-


chung) der gegebenen Differentialgleichung längs der Lösung u.
Diese kommt in natürlicher Weise ins Spiel, wenn sich zwei Lösungen u und v
von y = f (x, y) nur wenig unterscheiden. Denn dann gilt nach dem Mittel-
wertsatz für y := v − u

n
yi (x) = fi (x, v(x)) − fi (x, u(x)) ≈ aik (x) yk (x).
k=1

(b) Existieren die partiellen Ableitungen

∂ϕ ∂ϕ
v(x) := (x, ξ, η) , wk (x) := (x, ξ, η) (k = 1, . . . , n)
∂ξ ∂ηk
7 Differenzierbarkeitseigenschaften von Lösungen 49

in Ωf und sind diese dort stetig, so erfüllen sie die Variationsgleichung längs
x → ϕ(x, ξ, η) mit den Anfangsbedingungen

v(ξ) = − f (ξ, η) ,

wk (ξ) = ek (k = 1, . . . , n) .

Denn aus der Fixpunktgleichung


x
ϕ(x, ξ, η) = η + f (t, ϕ(t, ξ, η)) dt
ξ

folgt nach dem Satz über Parameterintegrale und der Kettenregel ÜA

∂ϕ x ∂ϕ
(x, ξ, η) = ek + Dy f (t, ϕ(t, ξ, η)) (t, ξ, η) dt
∂ηk ξ
∂ηk

und
∂ϕ x ∂ϕ
(x, ξ, η) = − f (x, ϕ(x, ξ, η)) + Dy f (t, ϕ(t, ξ, η) (t, ξ, η) dt .
∂ξ ξ
∂ξ

7.6 Beweis der C1 –Differenzierbarkeit von ϕ


(a) Zum Vorgehen. Falls die partiellen Ableitungen ∂ϕ/∂ξ, ∂ϕ/∂η k existieren
und stetig sind, genügen sie nach 7.5 der linearisierten DG

y = Dy f (x, ξ, η) y .

Bezeichnen wir die zugehörige kanonische Fundamentalmatrix mit Y (x, ξ, η)


(vgl. 6.7), so muss nach 7.5 gelten

∂ϕ ∂ϕ
(x, ξ, η) = Y (x, ξ, η)ek , (x, ξ, η) = − Y (x, ξ, η) f (ξ, η) .
∂ηk ∂ξ

Wir haben also für einen festen Anfangspunkt (ξ, η) zu zeigen, dass

ϕ(x, ξ, η + h) − ϕ(x, ξ, η) − Y (x, ξ, η) h = r(x, h) ,

ϕ(x, ξ + k, η) − ϕ(x, ξ, η) + Y (x, ξ, η) f (ξ, η) = s(x, k)


mit
r(x, h) s(x, k)
lim = 0, lim = 0.
h →0 h k→0 |k |

Lässt sich noch zeigen, dass die Limites gleichmäßig in einem noch zu präzi-
sierenden Sinn existieren, so sind die partiellen Ableitungen von ϕ stetig.
50 § 2 Grundlegende Theorie

(b) Festlegung eines Arbeitsbereichs K. Sei (x0 , ξ0 , η 0 ) ∈ Ωf gegeben. Wie im


Beweis 7.4 wählen wir ein kompaktes Intervall J ⊃ J(ξ0 , η 0 ) der Länge γ, in
welchem x0 und ξ0 innere Punkte sind und Konstante 0 , L, M > 0 mit
  
K := (x, y)  x ∈ J , y − ϕ(x, ξ0 , η 0 ) ≤ 0 ⊂Ω

und

f (x, y) ≤ M , Dy f (x, y) z ≤ L z , also f ∈ Lip (K, L) .

Nach dem Zusatz zu 7.4 gibt es Zahlen r, R, κ > 0 folgender Art:


Für | ξ − ξ0 | ≤ 2r und η − η 0  < R
2
sowie | k | ≤ r2 , h < R
2
gilt

J ⊂ J(ξ + k, η + h) ,

für x ∈ J liegen die Punkte (x, ϕ(x, ξ + k, η + h)) in K,



ϕ(x, ξ + k, η + h) − ϕ(x, ξ, η) ≤ κ | k | + h .

(c) Abschätzung von R(x, y, z) := f (x, z) − f (x, y) − Dy f (x, y)(z − y).


Wir zeigen, dass es zu jedem ε > 0 ein δ > 0 gibt mit

R(x, y, z) < ε z − y für alle (x, y), (x, z) ∈ K mit z − y < δ .

Denn nach dem Mittelwertsatz für die k–te Komponente Rk von R gibt es zu
je zwei Punkten (x, y), (x, z) ∈ K ein ϑ ∈ ]0, 1[ mit

Rk (x, y, z) = fk (x, z) − fk (x, y) − ∇fk (x, y) , z − y

= ∇fk (x, y + ϑ(z − y) − ∇fk (x, y) , z − y .

Wegen der gleichmäßigen Stetigkeit von ∇fk auf K gibt es zu jedem ε > 0 ein
δ ∈ ]0, 0 [, so dass für (x, w), (x, y) ∈ K mit w − y < δ
 
∇fk (x, w) − ∇fk (x, y) ≤ √ε (k = 1, . . . , n) .
n

Nach Cauchy–Schwarz folgt | Rk (x, y, z) | ≤ √εn z − y für (x, y), (x, z) ∈ K


mit z − y < δ und daraus die Behauptung für R.

(d) Differenzierbarkeit von ϕ bezüglich η.


Sei (ξ, η) ein fester Punkt mit | ξ − ξ0 | < 1
2
r , η − η 0  < 1
2
R, ferner sei
| k | < 12 r , h < 12 R und x ∈ J.
Wir verwenden folgende Abkürzungen:
7 Differenzierbarkeitseigenschaften von Lösungen 51

x
(1) u(x) := ϕ(x, ξ, η) , also u(x) = η + f (t, u(t)) dt ,
ξ
x
(2) v(x) := ϕ(x, ξ, η + h) , also v(x) = η + h + f (t, v(t)) dt ,
ξ

(3) A(x) := Dy f (x, u(x)) ,

(4) Y (x) := Fundamentalmatrix für y = A(x) y bezüglich der Stelle ξ,


x
(5) w(x) := Y (x) h , also w(x) = h + A(t) w(t) dt ,
ξ

(6) r(x, h) := v(x) − u(x) − w(x) , vgl. (a).

Nach dem in (a) beschriebenen Programm gilt es, zu ε > 0 ein Δ > 0 und eine
Konstante C zu finden mit r(x, h) < ε C h, sobald h < Δ < 12 R. Nun ist
mit den Bezeichnungen (c) und wegen der Darstellungen (1), (2), (5)
x 
r(x, h) = f (t, v(t)) − f (t, u(t)) − A(t) w(t) dt
ξ
x x
= R(t, u(t), v(t)) dt + A(t) r(t, h) dt .
ξ ξ

Gemäß (c) gibt es zu gegebenem ε > 0 ein δ > 0 mit

R(x, y, z) < εy − z für y − z < δ .


1 
Setzen wir Δ := min 2
R, δ/κ , so folgt für h < Δ zunächst nach (b)

v(t) − u(t) < κh < δ

und dann nach (c)

R(t, u(t), v(t)) < εκh ,


also
 x 
r(x, h) ≤ ε κ γ h +  A(t)2 r(t, h) dt 
ξ
 x 
≤ εκγ h +  L r(t, h) dt  .
ξ

Mit dem Gronwall–Lemma 4.2 folgt schließlich

r(x, h) < εκγ h eLγ =: ε C h für h < Δ .

∂ϕ
(e) Stetigkeit von ∂ηj
. Die zuletzt gegebene Abschätzung gilt für alle (x, ξ, η)
mit | x − x0 | < 1
2
r, | ξ − ξ0 | < 12 r, η − η 0  < 12 R gleichmäßig. Setzen wir
52 § 2 Grundlegende Theorie

 1
f m (x, ξ, η) := m ϕ(x, ξ, η + 1
m
ej ) − ϕ(x, ξ, η) für m < Δ,
so sind die f m im genannten Gebiet stetig und konvergieren dort gleichmäßig
gegen Dy f (x, ξ, η) ej , was die Stetigkeit dieses Limes in genannten Bereich zur
Folge hat.
(f) Die C1 –Differenzierbarkeit von ϕ bezüglich ξ ergibt sich analog. Für festes
(ξ, η) aus dem obengenannten Bereich setzen wir diesmal
x
v(x) := ϕ(x, ξ + k, η) = η + f (t, v(t)) dt ,
ξ+k
x
w(x) := − k Y (x) f (ξ, η) = −k f (ξ, η) + A(t) w(t) dt
ξ

und wollen jetzt für s(x, k) := v(x) − u(x) − w(x) zeigen, dass es zu gegebenem
ε > 0 ein δ > 0 und Konstanten C1 , C2 gibt mit

(∗) s(x, k) ≤ (C1 ε + C2 k) k für |x − ξ| < δ.

Wir wählen dabei δ > 0 gleich so klein, dass

(∗∗) f (ξ, η) − f (t, η) < ε für |t − ξ| < δ.


Wir erhalten (∗) durch Abschätzung von
x x x
s(x, k) = f (t, v(t)) dt − f (t, u(t)) dt + k f (ξ, η) − A(t) w(t) dt
ξ+k ξ ξ

x x 
ξ+k
= R(t, u(t), v(t)) dt + A(t) s(t, k) dt + (f (ξ, η) − f (t, v(t))) dt .
ξ ξ ξ

Die beiden ersten Integrale schätzen wir wie in (d) ab, für das dritte beachten
wir, dass
f (ξ, η) − f (t, v(t)) ≤ f (ξ, η) − f (t, η) + L η − v(t)
(∗∗)
< ε + u(ξ) − u(t) + u(t) − v(t)

≤ ε + L (M + κ) k .

(Detaillierte Ausführung als ÜA .) Die Stetigkeit von ∂ϕ/∂ξ ergibt sich wie in
(e). 2

7.7 Beweis des Satzes über Ck+1 –Differenzierbarkeit von ϕ


Sind f und Dy f Ck –differenzierbar im Gebiet Ω, so ist ϕ nach allen Variablen
Ck+1 –differenzierbar in Ωf . Wir zeigen dies durch Induktion, wobei wie üblich
C0 –Differenzierbarkeit einfach Stetigkeit bedeutet. Für k = 0 ist also die Be-
hauptung richtig nach 7.6. Angenommen, die Behauptung ist für k ≥ 1 schon
richtig, und f , Dy f seien Ck+1 –differenzierbar. Wir betrachten das System
7 Differenzierbarkeitseigenschaften von Lösungen 53

y = f (x, y) , y(ξ) = η ,

z = Dy f (x, y) z , z(ξ) = ζ ,

Ê
wobei F(x, y, z) := f (x, y) , Dy f (x, y) z auf Ω × n Ck –differenzierbar ist.
Die Lösung bezeichnen wir mit x → Φ(x, ξ, η, ζ) ; sie ist nach Induktionsvor-
aussetzung Ck+1 –differenzierbar in allen Variablen. Nach 7.1 ist aber
 ∂ϕ
Φ(x, ξ, η, ei ) = ϕ(x, ξ, η), ∂ηi
(x, ξ, η) für i = 1, . . . , n,
 ϕ
Φ(x, ξ, η, −f (ξ, η)) = ϕ(x, ξ, η), ∂∂ξ (x, ξ, η) .

Also sind ∂ϕ/∂ξ und ∂ϕ/∂ηi (i = 1, . . . , n) nach allen Variablen Ck+1 –


∂ϕ
differenzierbar; dasselbe gilt für ∂x
(x, ξ, η)= f (x, ϕ(x, ξ, η)) . 2

7.8 Beweis von 7.3


Wir betrachten die DG zweiter Ordnung u + f (x) u + g(x) u = h(x) , wobei
o.B.d.A. f, g, h in ]−r, r[ konvergente Potenzreihenentwicklungen

∞ 
∞ 

f (x) = αk xk , g(x) = βk xk , h(x) = γk xk ,
k=0 k=0 k=0

besitzen. Diese DG wandeln wir in ein System y = A(x) y + b(x) um mit


     
u(x) 0 1 0
y(x) = , A(x) = , b(x) = .
u (x) −g(x) −f (x) h(x)

(a) Nach Bd. 1, § 10 : 2.2 konvergieren die Potenzreihen



∞ 
∞ 

f (z) = αk z k , g(z) = βk z k , h(z) = γk z k
k=0 k=0 k=0

für alle z ∈ mit | z | < r und stellen dort holomorphe Funktionen dar (Bd. 1,
§ 27). Mit diesen Funktionen bilden wir A(z), b(z).

(b) Das komplexe Kurvenintegral einer für | z | < r holomorphen Funktion v


ist wegunabhängig, da die Kreisscheibe Kr (0) ein einfaches Gebiet ist (Bd. 1,
§ 27 : 2.2). Nach Bd. 1, § 27 : 2.6 liefert daher

z 1
V (z) = v(w) dw = z v(tz) dt
0 0

(Integration längs der Strecke von 0 nach z) eine holomorphe Stammfunktion


V für v.
54 § 2 Grundlegende Theorie

(c) Statt der Picard–Iterierten für das AWP


 η1
y = A(x) y + b(x) , y(0) = η := η2
,

d.h. statt
x 
u0 (x) = η , un+1 (x) = η + A(t) un (t) + b(t) dt
0

betrachten wir jetzt die mit v0 (z) = η beginnende Iterationsfolge


1 
vn+1 (z) = η + z A(tz) vn (tz) dt + b(tz) dt
0

mit komplexen Argumenten z. Offenbar gilt


vn (x) = un (x) für − r < x < r.
Nach (b) ergibt sich durch Induktion, dass die Komponenten der vn holomorph
sind für | z | < r. Wir zeigen in (d), dass die Komponenten der vn auf jeder kom-
pakten Teilmenge K von Kr (0) gleichmäßig konvergieren. Nach Bd. 1, § 27 : 7.2
sind dann die Komponenten u(z), v(z) von v(z) = lim vn (z) holomorph für
n→∞
| z | < r, insbesondere besitzt dann u eine Potenzreihenentwicklung


u(z) = ak z k für | z | < r
k=0

(Bd. 1, § 27 : 5.3). Für −r < x < r löst aber u(x) nach 5.1 das AWP

u + f (x) u + g(x) u = h(x) , u(0) = η1 , u (0) = η2 .

Es bleibt also nur noch zu zeigen:


(d) Die vn konvergieren gleichmäßig in jeder kompakten Teilmenge K von
Kr (0). Denn K liegt in einer kompakten Kreisscheibe | z | ≤ mit 0 < < r.
Setzen wir
     
L := max A(z)2  | z | ≤ , M := max v1 (z) − η  | z | ≤ ,

so erhalten wir wie im Beweis von 5.1 die Abschätzung


(L )n
vn+1 (z) − vn (z) ≤ M für | z | ≤ .
n!
Daraus folgt wie dort die komponentenweise gleichmäßige Konvergenz von

n−1
vn (z) = η + vk+1 (z) − vk (z) . 2
k=0
55

§ 3 Allgemeine lineare Theorie

1 Lineare Systeme
1.1 Die Struktur des Lösungsraums
Lb bezeichne die Gesamtheit der maximalen Lösungen des linearen Systems
y = A(x) y + b(x) ,
bei dem die Koeffizienten aij (x) der n × n–Matrix A(x) und die Komponenten
bk (x) von b(x) in einem Intervall I stetig seien. Nach § 2 : 6.7 sind die maximalen
Lösungen auf ganz I definiert. (I braucht nicht offen zu sein.)
Satz. (a) Die Lösungsmenge L0 des homogenen Systems
y = A(x) y
Ê
ist ein n–dimensionaler Teilraum von C1 (I, n). Jede Basis von L0 wird ein
Fundamentalsystem genannt. Lösungen u1 , . . . , un von y = A(x) y bilden
genau dann ein Fundamentalsystem, d.h. sind als Vektorfunktionen linear un-
abhängig, wenn für ein beliebiges ξ ∈ I die Vektoren u1 (ξ), . . . , un (ξ) des n Ê
linear unabhängig sind.
(b) Die Lösungsmenge Lb des inhomogenen Systems
y = A(x) y + b(x)
ist ein affiner Teilraum von C1 (I, Ê n
): Ist v eine spezielle (partikuläre) Lösung
des inhomogenen Systems, so gilt
Lb = v + L0 := {v + u | u ∈ L0 } .

Beweis.
Ê
(a) Die Abbildung T : L0 → n, u → u(ξ) ist linear und nach dem Existenz–
und Eindeutigkeitssatz bijektiv. Daher werden durch T und T −1 jeweils Basen
auf Basen abgebildet.
Ê Ê
(b) Die Abbildung L : C1 (I, n ) → C(I, n ), y → y − A y ist linear. Daher
folgt die Behauptung aus der Theorie linearer Gleichungen, wenn noch berück-
sichtigt wird, dass die Gleichung Ly = b nach § 2 : 6.7 (a) eine auf ganz I
definierte Lösung hat. 2

1.2 Fundamentalmatrizen und Lösungsdarstellung für die homogene


Gleichung
(a) Für jedes Fundamentalsystem (u1 , . . . , un ) nennen wir die Matrix U (x)
mit den Spalten u1 (x), . . . , un (x) die zugehörige Fundamentalmatrix.
(b) Die Matrix Y (x, ξ) mit den Spalten ϕ(x, ξ, e1 ), . . . , ϕ(x, ξ, en ) nennen wir
die kanonische Fundamentalmatrix an der Stelle ξ ∈ I.
56 § 3 Allgemeine lineare Theorie

(c) Die Lösung des AWP


y = A(x) y , y(ξ) = η
ist gegeben durch
y(x) = Y (x, ξ) η .
(d) Jede andere Fundamentalmatrix ist von der Form U (x) = Y (x, ξ) C, wobei
C = U (ξ) invertierbar ist. Also gilt für die Lösung y des AWP (c)
y(x) = U (x) U (ξ)−1 η .

Beweis.
(c) ergibt sich aus Y (x, ξ) η = η1 ϕ(x, ξ, e1 ) + . . . + ηn ϕ(x, ξ, en ).
(d) U (x) habe die Spalten u1 (x), . . . , un (x). Nach 1.1 (a) ist U (ξ) invertierbar.
Sei U (ξ)−1 ek = a = (a1 , . . . , an ). Dann ist die k–te Spalte von U (x) U (ξ)−1 ,

U (x) U (ξ)−1 ek = a1 u1 (x) + . . . + an un (x) ,

eine Lösung des homogenen Systems. Diese nimmt für x = ξ den Wert ek an.
Somit ist U (x) U (ξ)−1 ek = ϕ(x, ξ, ek ). 2

1.3 Wronski–Determinante und Fundamentalsysteme


(a) Für Lösungen y1 , . . . , yn von y = A(x) y heißt

W (x) := det y1 (x), . . . , yn (x)

die Wronski–Determinante.
(b) Die Wronski–Determinante genügt der DG W  (x) = (Spur A(x)) W (x).
Nach Band 1, §13 : 1.2 gilt daher
 x
W (x) = W (ξ) exp (a11 (t) + . . . + ann (t)) dt f ür x, ξ ∈ Ê.
ξ

(c) y1 , . . . , yn bilden genau dann ein Fundamentalsystem, wenn W (ξ) = 0 für


wenigstens ein ξ ∈ I. Nach (b) ist das äquivalent mit W (x) = 0 für alle x ∈ I.

Beweis.
(b) Es gilt

n
W  (x) = Wk (x) ,
k=1

wobei Wk (x) aus W (x) durch Differentiation der k–ten Zeile entsteht. Für n = 2
folgt das mit der Produktregel. Der Schluss von n auf n + 1 geschieht durch
1 Lineare Systeme 57

Entwicklung nach der ersten Zeile ÜA . Bezeichnen wir die i–te Komponente
von yk (x) mit yik (x), so folgt aus der DG (wir lassen die Argumente fort)
 
 a11 y11 + . . . + a1n yn1 ... a11 y1n + . . . + a1n ynn 
 
 y21 ... y2n 
W1 =  .. .. .

 . . 
 y ... ynn 
n1

Wir multiplizieren für k = 2, . . . , n die k–te Zeile mit a1k und subtrahieren sie
von der ersten. Da W1 sich hierbei nicht ändert, erhalten wir
 
 a11 y11 ... a11 y1n 
 
 y21 ... y2n 
W1 =  . ..  = a11 W .
 .. . 
 y ... ynn 
n1

Die Beziehung Wk = akk W ergibt sich ganz analog.


(c) folgt aus 1.1 (a) oder aus (b). 2

1.4 Die inhomogene Gleichung y = A(x)y + b(x)


Für die vollständige Lösung dieses Systems stehen nach 1.1 zwei Aufgaben an:
Bestimmung des Lösungsraums L0 des homogenen Systems und einer speziellen
Lösung v des inhomogenen. Für beide reicht es, eine Fundamentalmatrix U (x)
zu kennen. Nach 1.2 (d) hat jede Lösung des homogenen Systems die Form
u(x) = U (x)c. Für v machen wir den Ansatz

v(x) = U (x)c(x)

Ê
mit einer C1 –Funktion c : I → n (Variation der Konstanten, vgl. Bd. 1,
§ 13 : 1.3). Eine leichte Rechnung zeigt: Genau dann liefert dieser Ansatz eine
Lösung, wenn U (x) c (x) = b(x). Daher ist durch die Formel
x
v(x) := U (x) U (t)−1 b(t) dt
ξ

eine Lösung des inhomogenen Systems mit v(ξ) = 0 gegeben. Da diese eindeu-
tig bestimmt ist, hat die rechte Seite dieser Formel für jede Fundamentalma-
trix denselben Wert. Insbesondere gilt für die kanonische Fundamentalmatrix
Y (x, ξ) von 1.2 (b)
x x
v(x) = Y (x, ξ) Y (t, ξ)−1 b(t) dt = Y (x, ξ)Y (t, ξ)−1 b(t) dt .
ξ ξ

Zusammen mit 1.2 (c) erhalten wir den


58 § 3 Allgemeine lineare Theorie

Satz. Die Lösung u des AWP


y = A(x) y + b(x) , y(ξ) = η
ist gegeben durch
 x
u(x) = U (x) U −1 (ξ) η + U −1 (t) b(t) dt
ξ

mit einer beliebigen Fundamentalmatrix U (x), insbesondere mit der kanoni-


schen Fundamentalmatrix Y (x, ξ).

1.5 Homogene Systeme mit konstanten Koeffizienten, die Matrix etA


Hat die n×n–Matrix A konstante Koeffizienten, so ist das zugehörige homogene
System autonom. Wie in § 2 : 6.3 vereinbart, bezeichnen wir die unabhängige
Variable mit t statt x. Es genügt, das AWP
ẏ = A y , y(0) = η
zu lösen. Die Lösung t → ϕ(t, η) existiert nach 1.1 für alle Zeiten t. Das
Iterationsverfahren § 2 : 5.1 von Picard–Lindelöf liefert für die Iterierten ÜA

n
tk
un (t) = k!
Ak η .
k=0

Aus dem Beweis § 2 : 5.1 ergibt sich ϕ(t, η) − un (t) → 0 gleichmäßig auf
jedem kompakten Intervall I = [−δ, δ] . Dies folgt, wie ein kurzer Blick zeigt,
wenn wir im dortigen Beweisteil (c) L := A2 und R := max{u1 (x) − η |
x ∈ I} setzen. Wählen wir η = ei , so erhalten wir als Lösung die i–te Spalte
ϕ(t, ei ) der kanonischen Fundamentalmatrix an der Stelle 0. Damit haben wir


tk 
n
tk
ϕ(t, ei ) = k! Ak ei = lim Ak ei .
k=0 n→∞ k=0 k!

Somit gilt der


Satz. (a) Auf jedem kompakten Intervall konvergiert die Reihe


tk
etA := Ak .
k=0 k!
gleichmäßig und liefert die kanonische Fundamentalmatrix Y (t, 0). (Konvergenz
wahlweise zu verstehen als Konvergenz der Spalten oder der Koeffizienten.)
(b) Das AWP ẏ = A y, y(ξ) = η hat die für alle t definierte Lösung
y(t) = e(t−ξ)A η .

(c) Es gilt das Exponentialgesetz


e(s+t)A = esA etA = etA esA für s, t ∈ Ê, e0A = E = Einheitsmatrix.
2 Zur algebraischen Bestimmung von etA 59

 −1
Aus (c) ergibt sich ÜA etA = e−tA .

Beweis von (b) und (c).


(b) Genau dann liefert y eine Lösung des genannten AWP, wenn u(t) = y(t+ξ)
das AWP u̇ = A u , u(0) = η löst, d.h. wenn u(t) = etA η .
(c) Sei u(t) = etA η. Wir halten t, η fest und setzen

v(s) := e(s+t)A η = u(s + t) , w(s) := esA etA η = esA u(t) .

Sowohl v als auch w lösen das AWP ẏ = Ay, y(0) = etA η, stimmen also nach
dem Eindeutigkeitssatz überein:

e(s+t)A η = v(s) = w(s) = esA etA η für alle s ∈ Ê.


Ê Ê
Da dies für alle t ∈ , η ∈ n gilt, folgt e(s+t)A = esA etA für s, t ∈ Ê. Durch
Vertauschen der Rollen von s und t ergibt sich der Rest. 2

1.6 Beispiele und Aufgaben


λ 1
(a) Die Matrix A = 0 λ
ist nicht diagonalähnlich ÜA . Durch Induktion
erhalten wir ÜA
     
k λk kλk−1 tA eλt teλt 1 t
A = , also e = = eλt .
0 λk 0 eλt 0 1
 2 1
(b) Bestimmen Sie etA für A = −1 0
.
(c) Wir erinnern an die Aufgabe § 2 : 5.2 (f).
(d) Zeigen Sie eA+B = eA eB für vertauschbare Matrizen A, B (AB = BA).
Gehen Sie dabei wie im Nachweis von 1.5 (c) vor.

2 Zur algebraischen Bestimmung von etA


2.1 Homogene Systeme mit komplexen Koeffizienten
Die Reihendarstellung der Lösungen in 1.5 läßt sich ohne Probleme auf komplexe
Matrizen A übertragen:
(a) Für jede n × n–Matrix A mit komplexen Koeffizienten besitzt das Anfangs-
wertproblem ẏ = A y , y(0) = η für alle η ∈ n eine eindeutig bestimmte
Lösung z :  → n . Diese ist gegeben durch

z(t) = etA η ,
60 § 3 Allgemeine lineare Theorie

wobei die Reihe




tk
etA := Ak
k!
k=0

auf jedem kompakten Teilintervall von Ê gleichmäßig konvergiert.


(b) Es gilt das Exponentialgesetz

e(s+t)A = esA etA für s, t ∈ Ê, e0A = E .

(c) Für jedes λ ∈ gilt

etA = eλt et(A−λE) für t ∈  .

Beweis.
(a) Eine Durchsicht des Existenzbeweises (§ 2 : 5.1) und des Eindeutigkeitsbe-
weises (§ 2 : 4.3) zeigt die Übertragbarkeit auf den komplexen Fall ÜA .
(b) verläuft wörtlich wie der Beweis von 1.5 (c).
(c) u(t) = et(A−λE) η löst das AWP u̇(t) = (A − λE)u(t), u(0) = η. Ferner
gilt für v(t) = eλt u(t)

v̇(t) = λv(t) + eλt (A − λE) u(t) = A v(t) , v(0) = η

und somit v(t) = etA η nach dem Eindeutigkeitssatz. 2

2.2 Einsetzen von Operatoren in Polynome


(a) Im folgenden seien V ein Vektorraum über  =  oder und L (V ) der
Vektorraum der linearen Operatoren T : V → V . Für T ∈ L (V ) setzen wir

T 0 := , T 2 := T ◦ T und rekursiv T n+1 := T ◦ T n .

Ein einfacher Induktionsbeweis zeigt ÜA

T n+m n
=T T m
=T T m n
für n, m ∈ 0 = {0, 1, 2, . . .} .

(b) Für p(x) = a0 + a1 x + . . . + an xn mit a0 , . . . , an ∈  definieren wir

p(T ) := a0 T 0 + a1 T + . . . + an T n .

Dann gilt für Polynome p, q ÜA

(p + q)(T ) = p(T ) + q(T ) = q(T ) + p(T ) ,

(p q)(T ) = p(T ) q(T ) = q(T ) p(T ) .


2 Zur algebraischen Bestimmung von etA 61

2.3 Das Minimalpolynom


Im folgenden seien V ein Vektorraum der endlichen Dimension n ≥ 2 über Ã
und T ∈ L (V ) ein linearer Operator.
Satz. (a) Es existieren annullierende Polynome für T , d.h. nichtkonstante
Polynome p mit Koeffizienten aus Ã
und mit p(T ) = 0.
(b) Es gibt ein eindeutig bestimmtes annullierendes Polynom von kleinstem po-
sitiven Grad und höchstem Koeffizienten 1. Dieses Minimalpolynom bezeich-
nen wir mit mT .
(c) Das Minimalpolynom teilt jedes annullierende Polynom.
Beweis.
Ã
(b) Der Vektorraum L (V ) hat die Dimension n2 über . Wegen T 0 = V = 0 ½
gibt es eine kleinste natürliche Zahl m, so dass T 0 , . . . , T m−1 linear unabhängig
sind. T m ist dann eine Linearkombination von T 0 , . . . , T m−1 ; wir schreiben
T m = − a0 T 0 − . . . − am−1 T m−1
mit eindeutig bestimmten Koeffizienten a0 , . . . , am−1 . Das Minimalpolynom ist
daher
mT (x) := a0 + a1 x + . . . + am−1 xm−1 + xm
(c) Sei p ein T annullierendes Polynom. Division mit Rest liefert Polynome q, r
mit
p = mT q + r , Grad (r) < Grad (mT ) .
Mit 2.2 folgt p(T ) = mT (T )q(T ) + r(T ), also r(T ) = 0. Wegen der Minima-
litätseigenschaft von mT muss r konstant sein, also ist r das Nullpolynom wegen
r(T ) = 0. 2
Beispiele. (i) Für den Nulloperator 0 gilt m0 (x) = x;
für die Identität ½=½V gilt m½ (x) = x − 1.
0 1
(ii) Hat T die Matrix A = 0 0
, so ist mT (x) = x2 ÜA .
Satz. Ist T diagonalisierbar und σ(T ) = {λ1 , . . . , λr } die Menge der paar-
weise verschiedenen Eigenwerte von T , so ist mT (x) = (x − λ1 ) · · · (x − λr ).

Beweis.
Da es eine Basis für V aus Eigenvektoren von T gibt, ist
p(x) = (x − λ1 ) · · · (x − λr )
= (x − λ1 ) · · · (x − λk−1 )(x − λk+1 ) · · · (x − λr )(x − λk )
ein annullierendes Polynom: Für jeden Eigenvektor v zum Eigenwert λk ist
p(T ) v = (T − λ1 ) · · · (T − λr )(T − λk ) v = 0 .
62 § 3 Allgemeine lineare Theorie

Also wird p von mT geteilt. Lassen wir in p einen Linearfaktor weg, z.B. den
ersten, so ist das Restpolynom nicht mehr annullierend:
Es sei z.B. q(x) = (x − λ2 ) · · · (x − λr ) und v ein Eigenvektor zum Eigenwert
λ1 . Dann ist
q(T ) v = (T − λ2 ½) · · · (T − λ1 ½ + (λ1 − λr )½) v
= (T − λ2 ½) · · · (T − λr−1 ½)(λ1 − λr ) v
= (λ1 − λ2 ) · · · (λ1 − λr ) v = 0 . 2

2.4 Direkte Summen und direkte Zerlegung eines linearen Operators


(a) Ein Vektorraum V über à heißt direkte Summe der Teilräume V , . . . , V ,
1 r

V = V1 ⊕ · · · ⊕ Vr ,

wenn jeder Vektor v ∈ V eine eindeutige Darstellung

v = v1 + . . . + vr
mit
v1 ∈ V1 , . . . , vr ∈ Vr
besitzt.
(b) Ist T ∈ L (V ) ein linearer Operator, V = V1 ⊕ · · · ⊕ Vr , und sind alle
direkten Summanden Vk T –invariant, T (Vk ) ⊂ Vk , so sind die Einschränkungen
Tk von T auf Vk lineare Operatoren Tk : Vk → Vk .
T wird so in kleinere Bausteine T1 , . . . , Tr zerlegt.

Ê
Beispiel: Drehungen im 3 . Ist V1 = Span {u} die Drehachse und V2 der zu
u orthogonale Teilraum, so gilt V = V1 ⊕ V2 , und T1 ist die Identität auf V1 ,
während T2 eine ebene Drehung ist.

2.5 Der Zerlegungssatz


(a) Ist p ein annullierendes Polynom für T ∈ L (V ) und
p = p1 · · · pr (r ≥ 2)
eine Zerlegung in nichtkonstante, paarweise zueinander teilerfremde Polynome
pk , so gibt es eine korrespondierende Darstellung
V = Kern p1 (T ) ⊕ · · · ⊕ Kern pr (T )

in T –invariante Teilräume Vk = Kern pk (T ).


(b) Ist insbesondere p das Minimalpolynom von T , so sind alle Vk echte Teil-
räume: Vk = {0}, Vk = V . Die Einschränkung Tk von T auf Vk hat dann das
Minimalpolynom pk .
2 Zur algebraischen Bestimmung von etA 63

Beweis.
(i) Es gilt p = p1 q , wobei p1 und q = p2 · · · pr teilerfremd sind. Nach Bd. 1,
§ 3 : 7.9 gibt es also Polynome r und s mit 1 = q r + p1 s , somit folgt nach 2.2

(∗) ½V = q(T ) r(T ) + p1 (T ) s(T ) = r(T ) q(T ) + s(T ) p1 (T ) .

Jeder Vektor v ∈ V besitzt also eine Zerlegung

v = q(T ) r(T ) v + p1 (T )s(T ) v = v1 + v2

mit p1 (T ) v1 = (p1 q)(T )(r(T )v) = p(T )(r(T ) v) = 0, q(T ) v2 = p(T )(s(T ) v) = 0,
d.h. es gilt v1 ∈ V1 := Kern p1 (T ) und v2 ∈ W := Kern q(T ).
(ii) v1 und v2 sind durch v eindeutig bestimmt:
Aus v = u1 + u2 = v1 + v2 mit u1 , v1 ∈ V1 und u2 , v2 ∈ W folgt v1 − u1 =
u2 − v2 ∈ W , also v1 − u1 ∈ V1 ∩ W . Aus (∗) folgt

v1 − u1 = r(T ) q(T ) (v1 − u1 ) + s(T )p1 (T ) (v1 − u1 ) = 0 ,

also v1 = u1 und damit auch v2 = u2 .


(iii) V1 und W sind T –invariant.
Aus q(T ) v = 0 folgt z.B. q(T ) T v = T q(T ) v = T 0 = 0, entsprechend ergibt
sich: p1 (T ) v = 0 =⇒ p1 (T ) T v = T p1 (T ) v = 0.
(iv) Ist p das Minimalpolynom, so gilt W = V , also V1 = {0}, denn sonst
wäre q ein annullierendes Polynom für T , im Widerpruch zur Definition des
Minimalpolynoms. Entsprechend folgt V1 = V .
Für die Einschränkungen T1 von T auf V1 , S von T auf W sind p1 bzw. q
annullierende Polynome. Wäre p1 nicht das Minimalpolynom von T1 , so gäbe
es ein Polynom m1 , das T1 annulliert und ein echter Teiler von p1 ist (2.3 (c)).
Dann wäre aber schon m1 q ein annullierendes Polynom von T . Entsprechend
folgt q = mS .
(v) Für die Einschränkung S von T auf W ist q ein annullierendes Polynom.
Im Fall r ≥ 3 ist q = q2 (q3 . . . qr ) , und wir verfahren wieder wie oben. Nach
endlich vielen Schritten sind wir am Ziel. 2

2.6 Eigenwerte und Nullstellen des Minimalpolynoms


(a) Das Minimalpolynom mT und das charakteristische Polynom pT besitzen
dieselbe Nullstellenmenge in . 
(b) Satz von Cayley–Hamilton. Das Minimalpolynom teilt das charakte-
ristische Polynom. Insbesondere ist die geometrische Vielfachheit eines Eigen-
werts höchstens gleich der algebraischen.
(c) T ist genau dann diagonalisierbar, wenn das Minimalpolynom die Gestalt

mT (x) = (x − λ1 ) · · · (x − λr ) hat mit paarweise verschiedenen λ1 , . . . , λr ∈ .
64 § 3 Allgemeine lineare Theorie

Beweis.
(a) Ist λ eine k–fache Nullstelle von mT , so gilt
mT (x) = (x − λ)k q(x) mit q(λ) = 0 .
Das ist eine Zerlegung in teilerfremde Faktoren. Nach 2.5 (b) folgt
V = Kern (T − λ½)k ⊕ Kern q(T ) ,
wobei (x − λ)k das Minimalpolynom der Einschränkung T1 von T auf den inva-
rianten Teilraum V1 = Kern (T − λ½)k ist. Wegen (T − λ½V1 )k−1 = 0 gibt es
ein v1 ∈ V1 mit
v := (T − λ½)k−1 v1 = 0 und T v − λv = (T − λ½)k v1 = 0 ,
d.h. v ist Eigenvektor zum Eigenwert λ.
(c) Die Richtung =⇒ “ wurde in 2.3 (iii) gezeigt. Die Richtung ⇐=“ ergibt
” ”
sich wie folgt: Aus
mT (x) = (x − λ1 ) · · · (x − λr ) folgt mit 2.5
V = Kern (T − λ1 ½) ⊕ · · · ⊕ Kern (T − λr ½) ,
d.h. jeder Vektor v ∈ V ist Linearkombination von Eigenvektoren.
Sei umgekehrt T v = λv mit v = 0. Division mit Rest ergibt
mT (x) = (x − λ) q(x) + r mit geeignetem r ∈ , also

0 = mT (T ) v = q(T ) ((T − λ )v) + r v = r v ,
somit r = 0 .
(b) Sei A eine beliebige n × n–Matrix. Wir gehen ins Komplexe und betrachten

y → Ay als Operator T des n . Hier zerfällt das Minimalpolynom in Line-
arfaktoren: mT (x) = (x − λ1 )k1 · · · (x − λr )kr mit paarweise verschiedenen

λ1 , . . . , λr ∈ . Sei
 n
= V1 ⊕ · · · ⊕ Vr mit Vj = Kern (T − λj )kj
die nach 2.5 existierende zugehörige direkte Zerlegung. Wir betrachten einen
Summanden Vj , schreiben zur Abkürzung λ = λj , k = kj , V = Kern (A − λE)k .
Aus (a) folgt, dass die algebraische Vielfachheit von λ gleich der Dimension von
V ist. Wir zeigen k < dim V , indem wir k linear unabhängige Vektoren in V

angeben, nämlich wie oben einen Vektor v1 ∈ V mit w := (T − λ )k−1 v1 = 0
und
  
v2 := (T − λ )v1 , . . . , vk := (T − λ )vk−1 = (T − λ )k−1 v1 .

k
Aus dem Verschwinden einer Linearkombination v = αj vj ergibt sich dann

 
j=1
0 = (T − λ )k−1 v = α1 w, 0 = (T − λ )k−2 v = α2 w usw., also α1 = 0,
α2 = 0, . . . , αk = 0. 2
2 Zur algebraischen Bestimmung von etA 65

2.7 Zerlegung von etA


Wir fassen wie oben y → Ay als Operator T des n auf und betrachten einen
zur Zerlegung mT (x) = (x − λ1 )k q(x) mit q(λ) = 0 gehörenden direkten
Summanden V = Kern (A − λE)k . Dann gilt:
(a) V ist invariant unter etA für t ∈ .
(b) Für η ∈ V ist die Lösung des AWP ẏ = Ay, y(0) = η gegeben durch
 
tk−1
y(t) = etA η = eλt E + t(A − λE) + . . . + (A − λE)k−1 η .
(k − 1)!
Denn in der nach 2.1 bestehenden Reihenentwicklung


tm
etA η = eλt et(A−λE) η = eλt (A − λE)m η
m!
m=0
gilt
( A − λE)m η = (A − λE)m−k (A − λE)k η = 0 für m ≥ k ,
also bleibt nur die angegebene endliche Summe. Für η ∈ V = Kern (A − λE)k
folgt (A − λE)m η ∈ V für 0 ≤ m < k wegen
(A − λE)k (A − λE)m η = (A − λE)m (A − λE)k η = 0.

2.8 Zur algebraischen Lösung des allgemeinen Anfangswertproblems


(a) Das Minimalpolynom erhalten wir auf folgende Weise: Ist für einen Eigen-
wert λ ∈ die Dimension des Eigenraums (in n ) kleiner als die algebraische
Vielfachheit ν, so tritt nach dem Satz von Cayley–Hamilton x − λ im Minimal-
polynom mindestens in der zweiten, und nach 2.6 (b) höchstens in der ν–ten
Potenz auf. Für das Minimalpolynom bleiben so endlich viele Möglichkeiten;
die richtige können wir durch Probieren finden.
(b) Das Minimalpolynom sei mT (x) = (x − λ1 )k1 · · · (x − λr )kr . Wir setzen
qj (x) := mT (x)(x−λj )−kj . Dann gibt es Polynome s1 , . . . , sr mit Grad sj < kj
und 1 = q1 s1 + . . . + qr sr . Das ergibt sich aus Bd. 1. § 3 : 7.9 durch Induktion
bzw. durch Partialbruchzerlegung
1 s1 (x) sr (x)
= + ... + .
mT (x) (x − λ1 )k1 (x − λr )kr
Es folgt
 = q1 (T ) s1 (T ) + . . . + qr (T ) sr (T ) ,
also für v ∈ n

v = q1 (T ) s1 (T ) v + . . . + qr (T ) sr (T ) v = v1 + . . . + vr .
Offenbar gilt (T − λj )kj vj = 0. Also haben wir hiermit eine und damit die
einzige Zerlegung im Sinne des Zerlegungssatzes gefunden.
66 § 3 Allgemeine lineare Theorie

Setzen wir Pj := qj (T ) sj (T ) (j = 1, . . . , r), so erhalten wir die Lösung des


AWP ẏ = A y , y(0) = η wie folgt:
Mit der Zerlegung η = P1 η + . . . + Pr η = η 1 + . . . + η r erhalten wir
y(t) = y1 (t) + . . . + yr (t) ,
wobei sich yj (t) = etA η j wie in 2.7 ergibt.
Für η ∈ Ê
n
folgt y(t) ∈ Ê n
aus dem Eindeutigkeitssatz.

2.9 Aufgabe (Jordansche Normalform einer 2 × 2–Matrix)


Es sei A eine reelle, über nicht diagonalähnliche 2 × 2–Matrix. Zeigen Sie:
(a) A hat genau einen reellen Eigenwert λ.
(b) Der lineare Operator x → Ax des 2 hat das Minimalpolynom (x − λ)2 .
(c) Es gibt eine Basis B = (v1 , v2 ) des 2 mit
 
λ 1
MB (T ) = .
0 λ
(d) Stellen Sie etA in der Form 2.7 dar: eλt mal Polynom in A. Zeigen Sie mit
Hilfe von (b), dass y(t) = etA η das AWP ẏ = Ay tatsächlich löst.
n
Bemerkung. Hat der Operator T des das charakteristische Polynom
pT (x) = (x − λ1 ) m1
· · · (x − λr ) mr
,
so läßt sich die Existenz einer Basis B des n
zeigen, für welche gilt
⎛ ⎞
J1 0 $
λi ∗ 0
%
⎜ .. ⎟ ..
MB (T ) = ⎝ . ⎠ mit Ji = . ∗ .
0 λi
0 Jr mi ×mi

Die Untermatrizen Ji enthalten in der Diagonalen den Eigenwert λi , in der


oberen Nebendiagonalen entweder Nullen oder Einsen und sonst nur Nullen
(Jordansche Normalform). Näheres zur Jordanschen Normalform finden Sie
in Fischer [145] 5.4.

2.10 Folgerung für das Abklingen der Lösungen


Genau dann gilt lim etA η = 0 für jedes η ∈
t→∞
n, wenn alle (komplexen)
Eigenwerte von A negativen Realteil haben.
 
Das folgt direkt aus 2.8 und 2.7 wegen  eλt  = eRe λt .
Dieses Ergebnis dient als Grundlage für die Theorie der asymptotischen Stabi-
lität autonomer Systeme. Hierfür ist folgender Sachverhalt wesentlich:
ÜA Gilt Re λ < ρ für alle (komplexen) Eigenwerte λ der reellen n × n–Matrix
A, so gibt es eine Konstante c ≥ 1 mit
etA η ≤ c et η für alle η ∈ n und t ≥ 0 .
3 Die lineare Differentialgleichungen n–ter Ordnung 67

3 Die lineare Differentialgleichungen n–ter Ordnung


3.1 Umwandlung in ein System
Gegeben sei eine lineare DG n–ter Ordnung für u ∈ Cn (I)

n
Lu := ak u(k) = f
k=0

mit gegebenen stetigen Funktionen a0 , . . . , an−1 , f auf einem Intervall I und


an = 1.
Um über die Lösungsgesamtheit Lf der Gleichung Lu = f eine Übersicht zu ge-
winnen, verwenden wir die Korrepondenz mit dem Lösungraum Lb des gemäß
§ 2 : 1.3 zugeordneten linearen Systems y = A(x)y + b(x), ausgeschrieben
⎧ 


y1 = y2

⎨ .. ..
(S) . .

⎪ y

⎩ n−1
= yn

yn = − a0 y1 − a1 y2 − . . . − an−1 yn + f .

Zwischen den Lösungsräumen Lf und Lb mit b = f en besteht eine bijektive


Zuordnung J : Lf → Lb , gegeben durch
⎛ ⎞ ⎛ ⎞
u y1
⎜ u ⎟ ⎜ y2 ⎟
⎜ ⎟
Ju := ⎜

.. ⎟ mit J −1 y = y1
⎠ für y = ⎜ . ⎟ ∈ Lb .
. ⎝ .. ⎠
u(n−1) yn

Im homogenen Fall f = 0 sind die Lösungsräume jeweils Vektorräume, und die


Abbildung J ist eine bijektive, lineare Abbildung von Kern L auf den Lösungs-
raum von y = A(x) y. Dieser läßt sich durch y → y(ξ) (ξ ∈ I) wiederum
Ê
bijektiv auf den n abbilden (1.1 (a)). Daraus ergibt sich die folgende

3.2 Lösungstheorie
(a) Das Anfangswertproblem

Lu = f, u(ξ) = η0 , . . . , u(n−1) (ξ) = ηn−1

besitzt für gegebene Anfangsdaten ξ ∈ I, η0 , . . . , ηn−1 ∈ Ê eine eindeutig be-


stimmte Lösung u ∈ Cn (I).
(b) Der Lösungsraum L0 = Kern L der homogenen Gleichung Lu = 0 ist ein
n–dimensionaler Teilraum von Cn (I).
68 § 3 Allgemeine lineare Theorie

(c) Genau dann bilden die Funktionen u1 , . . . , un ein Fundamentalsystem


für Lu = 0 , d.h. eine Basis für L0 , wenn die Vektoren Ju1 , . . . , Jun (siehe 3.1)
ein Fundamentalsystem für (S) bilden, d.h. wenn ihre Wronski–Determinante
 
 u1 (x) · · · un (x) 
 
 u1 (x) un (x) 
 
W (x) =  .. .. 
 . . 
 
 u(n−1) (x) · · · u(n−1) (x) 
1 n

wenigstens an einer Stelle von Null verschieden ist.


(d) Für beliebige Lösungen u1 , . . . , un der homogenen DG Lu = 0 gilt
 x 
W (x) = W (ξ) exp − an−1 (t) dt , vgl. 1.3.
ξ

(e) Kennen wir ein Fundamentalsystem für Lu = 0, so lassen sich die Lösun-
gen der inhomogenen DG Lu = f mit Hilfe der Variation der Konstanten (1.4)
explizit darstellen.

3.3 Die homogene DG n–ter Ordnung mit konstanten Koeffizienten


Sind die Koeffizienten a0 , . . . , an−1 des Differentialoperators L konstant, so
können wir uns ein Fundamentalsystem mit Hilfe des Exponentialansatzes
u(t) = eλt verschaffen. Dieser liefert genau dann eine (ggf. komplexwertige)
Lösung, wenn λ die charakteristische Gleichung
p(λ) := a0 + a1 λ + . . . + an λn = 0 mit an = 1
erfüllt. Hat das Polynom p lauter einfache Nullstellen λ1 , . . . , λn ∈ , so liefern
z1 (t) = eλ1 t , . . . , zn (t) = eλn t ein komplexwertiges Fundamentalsystem. Das
ergibt sich aus folgenden

Satz. (a) Zu jeder Nullstelle λ der Ordnung k von p liefern


w1 (t) = eλt , . . . , wk (t) = tk−1 eλt
über linear unabhängige Lösungen von Lu = 0. Ist λ reell, so sind w1 , . . . , wk
natürlich auch linear unabhängig über .
(b) Ist λ nicht reell, so sind w1 , . . . , wk , w1 , . . . , wk linear unabhängig über ,
und
u1 = Re w1 , . . . , uk = Re wk , v1 = Im w1 , . . . , vk = Im wk
sind linear unabhängig über .
(c) Alle genannten reellwertigen Lösungen zusammen bilden ein reelles Funda-
mentalsystem für Lu = 0.
3 Die lineare Differentialgleichungen n–ter Ordnung 69

Beweis.
(a) Die Gesamtheit L0 = Kern L aller komplexen Lösungen von Lu = 0 ist
ein n–dimensionaler Vektorraum über ( ÜA mit 3.2 (b)). Für u ∈ L0 gilt
offenbar u ∈ Cn+1 () und Lu = 0 , also ist durch u → Du = u ein linearer
Operator D : L0 → L0 gegeben. Statt Lu = 0 können wir auch p(D)u = 0
schreiben. Somit ist p ein annullierendes Polynom für D. Wir zeigen, dass p das
Minimalpolynom von D ist. Denn für ein Polynom q vom Grad m < n ist der
Lösungsraum von q(D)u = 0 nur m–dimensional. Sei

p(x) = (x − λ1 )k1 · · · (x − λr )kr

mit λ1 , . . . , λr ∈ . Dann folgt nach dem Zerlegungssatz 2.5 (b)

L0 = Kern (D − λ1 )k1 ⊕ · · · ⊕ Kern (D − λr )kr .

Es genügt also, die DG (D − λ)k u = 0 zu betrachten. Für k = 1 sind alle


Lösungen von der Form u(t) = u0 eλt . Wir nehmen als Induktionsvoraussetzung
an, jede Lösung von (D − λ)k v = 0 sei von der Form

v(t) = c0 + c1 t + . . . + ck−1 tk−1 eλt .

Dann bedeutet (D − λ)k+1 u = 0 , dass v := u − λu von der Form



u (t) − λu(t) = c0 + c1 t + . . . + ck−1 tk−1 eλt

ist. Wie im Reellen ergibt sich u durch Variation der Konstanten ÜA :

 t  ck−1 k
u(t) = eλt u0 + v(s) e−λs ds = eλt u0 + c0 t + . . . + t .
0
k

Dieser Induktionsschritt zeigt, dass die in (a) genannten w1 , . . . , wk ein Erzeu-


gendensystem des k–dimensionalen Lösungsraums von (D − λ)k u = 0 bilden,
also linear unabhängig sind.
(b) ergibt sich daraus, dass mit wk auch Re wk und Im wk die homogene Glei-
chung Lu = 0 erfüllen, dass ferner
& ' & '
Span u1 , . . . , uk , v1 , . . . , vk = Span w1 , . . . , wk , w1 , . . . , wk

über gilt, und dass dieser Aufspann 2k–dimensional ist ÜA .


(c) ist, wie im Beweisteil (a) zu sehen war, eine Folge des Zerlegungssatzes. 2
70 § 4 Lineare Differentialgleichungen zweiter Ordnung

§ 4 Lineare Differentialgleichungen zweiter Ordnung


1 Problemstellung
(a) Gewöhnliche lineare Differentialgleichungen zweiter Ordnung treten typi-
scherweise bei Separationsansätzen für die Lösung von partiellen linearen Diffe-
rentialgleichungen zweiter Ordnung auf, z.B. der Wellengleichung, der Wärme-
leitungsgleichung und der Schrödinger–Gleichung.
Wir skizzieren dies am Beispiel der Gleichung für die stationäre Temperaturver-
teilung in der Einheitskreisscheibe, ohne auf rechnerische und beweistechnische
Details einzugehen. In Polarkoordinaten (r, ϕ) ergibt sich folgende partielle DG
für die Temperatur U (r, ϕ) (vgl. § 6 : 5.1, 5.2)

∂2U 1 ∂U 1 ∂2U
(D) 2
+ + 2 = 0 (0 < r < 1, 0 < ϕ < 2π) .
∂r r ∂r r ∂ϕ2
Von Interesse sind nur 2π–periodische, für r → 0 stetige Lösungen. Die Sepa-
rationsmethode besteht darin, zunächst alle Lösungen in Produktgestalt

U (r, ϕ) = u(r) v(ϕ)

zu bestimmen und dann zu zeigen, dass sich jede beliebige Lösung von (D) aus
solchen Produktlösungen durch eine Reihe aufbauen lässt. Für nicht verschwin-
dende Produktlösungen ergibt sich aus (D)

r 2 u (r) + r u (r) v  (ϕ)


= −
u(r) v(ϕ)
bis auf Nullstellen der Nenner. Beide Seiten der Gleichung müssen offenbar
konstant sein, d.h. es muss

r 2 u (r) + r u (r) − λu(r) = 0 , v  (ϕ) + λv(ϕ) = 0

mit einer Konstanten λ gelten. Damit haben wir die partielle Differentialglei-
chung (D) in zwei gewöhnliche lineare Differentialgleichungen separiert“.

Wegen der notwendigen 2π–Periodizität von v(ϕ) hat die DG für v genau dann

nichttriviale Lösungen, wenn λ = n2 mit n ∈ 0 = {0, 1, 2, . . .}. Die DG für u
hat, wie sich in 2.4 ergibt, für λ = n2 die allgemeine Lösung
(
α + β log r für n = 0 ,
u(r) = n −n
αr + β r für n = 1, 2, . . . .

Da u in r = 0 stetig sein muss, ist β = 0 zu wählen. Somit haben die gesuchten


Produktlösungen von (D) die Gestalt

U (r, ϕ) = r n (an cos nϕ + bn sin nϕ) mit Konstanten an , bn (n = 0, 1, . . .).


2 Sturm–Liouville–Form und Fundamentalsysteme 71

(b) Wichtige Beispiele von solchen bei Separationsansätzen auftretenden Dif-


ferentialgleichungen sind:

(1 − x2 ) u (x) − 2 x u (x) + λ u(x) = 0 in ]−1, 1[ (Legendresche DG),


 2
u (x) +
1 
x
ν
u (x) + λ − 2 u(x) = 0 in
x
Ê >0 (Besselsche DG),

u (x) − 2xu (x) + λu(x) = 0 in Ê (Hermitesche DG).

(c) Wir betrachten im Folgenden Differentialgleichungen der Form


(∗) a2 u + a1 u + a0 u + λu = 0 in I,
wobei I ein offenes Intervall ist und a0 , a1 , a2 gegebene stetige Funktionen auf
I mit a2 > 0 sind. Nach Untersuchung einiger Eigenschaften von Fundamen-
talsystemen in Abschnitt 2 behandeln wir in Abschnitt 3 Reihenentwicklungen
für die Lösungen.
Die zentrale Frage ist das Eigenwertproblem: Gesucht sind alle Zahlen λ, für
die es nichttriviale Lösungen u von (∗) mit zusätzlichen Eigenschaften gibt, z.B.
beschränkte Lösungen oder Lösungen mit beschränktem Integral. Die Bestim-
mung der stationären Zustände des quantenmechanischen harmonischen Oszil-
lators lässt sich beispielsweise auf die Frage nach Lösungen u = 0 der Hermite-
2
schen DG zurückführen, für die e−x /2 u(x) quadratintegrierbar ist.

2 Sturm–Liouville–Form und Fundamentalsysteme


2.1 Sturm–Liouville–Form und Lagrange–Identität
(a) Satz. Jede DG der Gestalt (∗) lässt sich in die Sturm–Liouville–Form
− (pu ) + qu = λ u
bringen, wobei p, q, bis auf einen gemeinsamen, von Null verschiedenen Vor-
faktor eindeutig bestimmt sind. Nach Vorgabe von x0 ∈ I ergibt sich durch
Koeffizientenvergleich ÜA
$ x %
a1 (t) p p a0
p(x) = exp dt , = , q = − .
a2 (t) a2 a2
x0
−1
Diese DG können wir als Eigenwertproblem Lu = λu mit
 
Lu := − (pu ) + qu
auffassen. Solange wir λ als einen gegebenen Parameter betrachten, ersetzen wir
q durch q − λ und schreiben die DG in der Form Lu = 0.
Die drei Differentialgleichungen in 1 (b) lauten in der Sturm–Liouville–Form
ÜA
72 § 4 Lineare Differentialgleichungen zweiter Ordnung

− ((1 − x2 ) u ) = λ u ,
ν2
−(x u ) + u = λxu ,
x
2 2
−(e−x u ) = λ e−x u .

(c) Für beliebige Funktionen u1 , u2 ∈ C2 (I) gilt die Lagrange–Identität


(Bezeichnungen wie in 2.1 (a))
u2 Lu1 − u1 Lu2 = (pW ) ,
wobei  
 u1 u2 

W =    = u1 u2 − u1 u2
u1 u2 
die Wronski–Determinante von u1 und u2 ist.
Für je zwei Lösungen u1 , u2 der Gleichung Lu = 0 ist also der Ausdruck
pW = p (u1 u2 − u1 u2 )
konstant.
Denn es gilt
(pW ) = (u1 (p u2 ) − u2 (p u1 )) = u1 (p u2 ) − u2 (p u1 )
= u2 (−(p u1 ) + q u1 ) − u1 (−(p u2 ) + q u2 ) = u2 Lu1 − u1 Lu2 .

2.2 Fundamentalsysteme
Der Lösungsraum L0 der homogenen Differentialgleichung Lu = 0 ist ein zwei-
dimensionaler Teilraum von C2 (I).
Zwei Lösungen u1 , u2 bilden genau dann ein Fundamentalsystem, wenn p W
eine von Null verschiedene Konstante ist.
Das folgt aus § 3 : 3.2 zusammen mit dem oben Gesagten.

2.3 Ergänzung einer Lösung zu einem Fundamentalsystem


Jede nullstellenfreie Lösung u1 von Lu = 0 lässt sich durch den Produktansatz
u2 = ϕ u1 zu einem Fundamentalsystem u1 , u2 ergänzen: u2 = ϕu1 ist genau
dann eine von u1 linear unabhängige Lösung von Lu = 0 , wenn
x
dt
ϕ(x) = a + b ,
pu21
x0

wobei a, b, x0 Konstanten mit x0 ∈ I, b = 0 sind.


(Reduktionsverfahren von d’Alembert).
Beweis als ÜA : Zeigen Sie pW = 1 .
2 Sturm–Liouville–Form und Fundamentalsysteme 73

2.4 Aufgaben
(a) Gegeben sei die Eulersche Differentialgleichung
x2 u (x) + xu (x) = n2 u(x) für x > 0 (n = 0, 1, . . . ein Parameter).

(i) Berechnen Sie das in Abschnitt 1 angegebene Fundamentalsystem durch


den Ansatz u(x) = v(log x).
(ii) Ein im Hinblick auf die kommende Theorie systematischerer Weg zur Auf-
stellung eines Fundamentalsystems u1 , u2 besteht darin, zuerst eine Lösung u1
der Eulerschen DG in Potenzreihenform zu suchen, dann die DG in Sturm–
Liouville–Form 2.1 zu bringen und das Reduktionsverfahren anzuwenden. Führen
Sie das durch!
(b) Zeigen Sie den folgenden Vergleichssatz: Seien u, u0 > 0 C2 –Funktionen
auf einem offenen Intervall I mit
− (pu ) + qu ≥ 0 , − (pu0 ) + q0 u0 = 0 , q ≤ q0 ,
u0 (ξ) = u(ξ), u0 (ξ) 
= u (ξ) für ein ξ ∈ I.
Dann gilt
u(x) ≤ u0 (x) für alle x ∈ I.

Hinweis: Zeigen Sie mit Hilfe der Lagrange–Identität (u/u0 ) (x) ≥ 0 für x < ξ
und (u/u0 ) (x) ≤ 0 für x > ξ.

2.5 Einfachheit von Nullstellen


Ist u = 0 eine Lösung der homogenen DG Lu = 0 auf I, so sind alle Null-
stellen von u einfach und besitzen keinen Häufungspunkt in I, d.h. es gibt keine
konvergente Teilfolge mit Grenzwert in I.
Beweis.
(a) Jede Nullstelle x0 ∈ I von u ist einfach, weil das Anfangswertproblem
Lu = 0, u(x0 ) = u (x0 ) = 0 nur die Lösung u = 0 besitzt.
(b) Gäbe es eine Folge von Nullstellen xk = x0 mit Grenzwert x0 ∈ I, so folgte
die nach (a) unmögliche Beziehung
u(xk ) − u(x0 )
u(x0 ) = lim u(xk ) = 0 , u (x0 ) = lim = 0. 2
k→∞ k→∞ xk − x0

2.6 Nullstellenvergleichssatz
Seien u, v Lösungen der Differentialgleichungen
− (pu ) + qu = 0 , − (pv  ) + q0 v = 0 in I
und es gelte q(x) < q0 (x) für alle x ∈ I. Sind dann α < β aufeinander Folgende
Nullstellen von v in I, so hat u eine Nullstelle in ]α, β[.
74 § 4 Lineare Differentialgleichungen zweiter Ordnung

Folgerung. Jede Lösung u = 0 der DG −u + qu = 0 in ]r, ∞[ mit q < −ω 2


(ω > 0) besitzt dort unendlich viele Nullstellen.
Das ergibt sich durch Vergleich von u mit der Lösung v(x) = sin ωx der DG
−v  − ω 2 v = 0.

Beweis.
Wir setzen W := uv  − u v und Lw := −(pw ) + q0 w. Angenommen, u
hat in ]α, β[ keine Nullstellen. Dann können wir o.B.d.A. u, v > 0 in ]α, β[
annehmen und erhalten u(α), u(β) ≥ 0, v  (α) > 0, v  (β) < 0 nach 2.5, woraus
(p W )(α) = p(uv  − u v)(α) ≥ 0 folgt. Die Lagrange–Identität liefert

(pW ) = vLu − uLv = (q0 − q)uv > 0 in ]α, β[ .

Hieraus folgt 0 < (p W )(β) = p (uv  − u v)(β) = (puv  )(β), was u(β) ≥ 0,
v  (β) < 0 widerspricht. 2

Mit geringen Modifikationen der eben gemachten Schlüsse ergibt sich:

2.7 Trennung der Nullstellen


Bilden u1 , u2 ein Fundamentalsystem von Lu = 0 , so trennen sich die Null-
stellen von u1 , u2 gegenseitig, d.h. zwischen je zwei aufeinander folgenden Null-
stellen von u1 liegt genau eine von u2 und umgekehrt.

2.8 Aufgabe
Schätzen Sie den Abstand aufeinander Folgender Nullstellen einer Lösung u = 0
der DG −u +(x−2 −1) u = 0 im Intervall ]r, ∞[ (r  1) nach oben und unten
ab.

3 Potenzreihenentwicklungen von Lösungen


3.1 Reihenentwicklungen um innere Punkte
Wir betrachten die Differentialgleichung (∗) in 1 (b) mit festem Parameter λ
und bringen diese in die Form

u + Gu + H u = 0 in I ,

wobei jetzt vorausgesetzt wird, dass die Koeffizienten G und H analytische


Funktionen in I sind. Nach § 2 : 7.3 lässt sich jede Lösung u um jeden beliebigen
Punkt x0 ∈ I in eine Potenzreihe entwickeln. Ihr Konvergenzradius ist minde-
Ê
stens r = dist (x0 , ∂I), bzw. r = ∞ für I = . In vielen Fällen ist es praktisch,
die Reihe in der Gestalt


ak
u(x) = (x − x0 )k
k!
k=0
3 Potenzreihenentwicklungen von Lösungen 75

anzusetzen. Die ak ergeben sich durch Koeffizientenvergleich, wie wir an zwei


Beispielen ausführen.

3.2 Die Legendresche Differentialgleichung


(1 − x2 ) u − 2xu + λu = 0 auf I = ]−1, 1[ .

(a) Wählen wir als Entwicklungspunkt x0 = 0, so wissen wir nach 3.1, dass
jede Lösung u eine für | x | < 1 konvergente Potenzreihenentwicklung besitzt,
die wir in der Form


ak
u(x) = xk
k!
k=0

schreiben. Gliedweise Differentiation ergibt




xk−1 

xk−2 

x
u (x) = kak , u (x) = k(k − 1) ak = a +2 .
k! k! !
k=1 k=2 =0

Setzen wir dies in die DG ein, so erhalten wir




xk
(ak+2 − k(k − 1)ak − 2kak + λak ) = 0.
k!
k=0

Das Verschwinden aller Koeffizienten ergibt die Rekursionsformel

ak+2 = (k(k + 1) − λ)ak für k = 0, 1, 2, . . . ,

insbesondere

a2 = −λa0 , a3 = (2 − λ)a1 .

Damit sind a2 , a4 , a6 , . . . durch a0 = u(0) und a3 , a5 , a7 , . . . durch a1 = u (0)


eindeutig bestimmt. Aus 3.1 und der eindeutigen Lösbarkeit des AWP folgt:
Geben wir a0 und a1 vor und bestimmen a2 , a3 , . . . aus den Rekursionsformeln,
so konvergiert die Reihe


xk
u(x) = ak
k!
k=0

für | x | < 1 gegen die eindeutig bestimmte Lösung der Legendreschen DG mit
den Anfangsbedingungen u(0) = a0 , u (0) = a1 .
(b) Nichttriviale Polynomlösungen existieren genau dann, wenn λ = n(n + 1)
mit n ∈ {0, 1, 2, . . .}.
Darstellungen für diese geben wir in (c) an.
76 § 4 Lineare Differentialgleichungen zweiter Ordnung

Beweis.
Ist u eine Polynomlösung mit Grad (u) = n, so folgt aus an+2 = 0, an = 0
sofort 0 = an+2 = (n(n + 1) − λ)an , also λ = n(n + 1). Aus 0 = an+1 =
(n(n − 1) − λ)an−1 mit λ = n(n + 1) folgt an−1 = 0 für n ≥ 1.
Durch Rückwärtsverfolgen der Rekursionsformeln erhalten wir ÜA

 0,
a0 = a1 = a3 = . . . = an−1 = 0 für gerades n ,
a1 = 0, a0 = a2 = . . . = an−1 = 0 für ungerades n .
Umgekehrt: Ist λ = n(n + 1) mit n ∈  , so liefern die Anfangsbedingungen
0


u(0) = a0 = 1 , u (0) = a1 = 0 für gerades n bzw.
u(0) = a0 = 0 , u (0) = a1 = 1 für ungerades n
jeweils Lösungen der Gleichung
(1 − x2 ) u − 2 x u + n(n + 1) u = 0
in Form von Polynomen n–ten Grades. 2

(c) Wählen
 wir für die Polynomlösung n–ten Grades als höchsten Koeffizienten
an = 21n 2n
n
, so ergibt sich ÜA
   
1 n 2n − 2k
Pn (x) = (−1)k xn−2k (n = 0, 1, 2, . . .) .
2n k n
0≤2k≤n

Wir zeigen in § 15 : 3.4, dass dies die in Bd. 1, § 19 : 3.3 eingeführten Legendre–
Polynome sind, gekennzeichnet durch die Orthonormalitätsrelation
1  n −1
Pm (x) Pn (x) dx = 1 + 2
δmn .
−1

Es gilt die Formel von Rodrigues:


1 dn
Pn (x) = (x2 − 1)n (n = 0, 1, . . .) .
2n n! dxn
Nachweis als ÜA mit Hilfe der Binomialformel.
(d) Die Legendre–Polynome besitzen eine erzeugende Funktion: Es gilt
 −1/2 

1 − 2xt + t2 = Pn (x) tn für |x| < 1 , |t|  1 .
n=0

Nachweis als ÜA : Verwenden Sie die Binomialreihe (Bd. 1, § 10 : 1.7)




(−1)m
 2m 
(1 + ξ)−1/2 = am ξ m (|ξ| < 1) mit am := ,
m=0 22m m
3 Potenzreihenentwicklungen von Lösungen 77

entwickeln Sie ξ m = (t2 − 2xt)m nach der Binomialformel, und ordnen Sie die
entstehende Doppelreihe nach Potenzen tn . Beachten Sie, dass definitionsgemäß
α
β

= 0 für β ∈ 0 , α ∈ , α < β.
(e) Es gelten die Rekursionsformeln
(n + 1) Pn+1 (x) = (2n + 1) x Pn (x) − n Pn−1 (x) f ür n = 1, 2, . . . .
Ausgehend von P0 (x) = 1, P1 (x) = x ermöglichen diese eine einfache Berech-
nung der Legendre–Polynome.
Beweis als ÜA : Differenzieren Sie die Reihe in (d) nach t, multiplizieren Sie
dann die entstehende Gleichung mit 1 − 2xt + t2 , und nehmen Sie Koeffizien-
tenvergleich vor.
Durch Induktion folgt unmittelbar Pn (1) = 1.

3.3 Die Hermitesche Differentialgleichung


(a) Nach 3.1 besitzt jede Lösung u des Anfangswertproblems

(∗) u − 2xu + λ u = 0 , u(0) = a0 , u (0) = a1

eine für alle x ∈  konvergente Reihenentwicklung




xk
u(x) = ak .
k!
k=0

Gliedweise Differentiation und Einsetzen in die DG ergibt wie in 3.2




xk
(ak+2 + (λ − 2k)ak ) = 0,
k!
k=0

und durch Koeffizientenvergleich die Rekursionsformel


ak+2 = (2k − λ) ak (k = 0, 1, 2, . . .) .
Bei gegebenen a0 = u(0), a1 = u (0) sind dann a2 , a3 , . . . eindeutig bestimmt.
Die zugehörige Reihe liefert die Lösung des AWP (∗) auf .
(b) Polynomlösungen vom Grad n gibt es genau für λ = 2n, n = 0, 1, 2, . . . .
Jede Polynomlösung ist durch ihren höchsten Koeffizienten eindeutig festgelegt.
Setzen wir diesen gleich 2n , so ergibt sich das n–te Hermite–Polynom ÜA
 n!
Hn (x) = (−1)k (2 x)n−2k .
k! (n − 2k)!
0≤2k≤n

(c) Die Hermite–Polynome besitzen eine erzeugende Funktion: Es gilt




f ür x ∈  , |t|  1 .
2 Hn (x)
e−t +2tx
= tn
n!
n=0
78 § 4 Lineare Differentialgleichungen zweiter Ordnung

2 2 2 2 

ξ2m
Beweis als ÜA : Mit ξ := t − x gilt e−t +2xt
= ex e−ξ = ex (−1)m m!
.
m=0
Entwickeln Sie ξ 2m = (t − x)2m nach der Binomialformel, und ordnen Sie die
entstehende Doppelreihe nach den Potenzen tn .
(d) Es gelten die Formel von Rodrigues
2 dn −x2
Hn (x) = (−1)n ex e .
dxn
und die Rekursionsformeln
Hn+1 (x) = 2 x Hn (x) − 2 n Hn−1 (x) für n = 1, 2, . . . .

Beweis als ÜA : Beachten Sie für die Formel von Rodrigues, dass nach (c) mit
ξ =t−x

dn −t2 +2tx  2 d
n 2 
Hn (x) = n
e = (−1)n ex n
e−ξ ξ=x
dt t=0 dξ
gilt. Die Rekursionsformeln ergeben sich durch Differentiation der Reihendar-
stellung (c) nach t und Koeffizientenvergleich.

(d) Satz. Eine Lösung u der Hermiteschen DG ist genau dann ein Polynom,
wenn

+∞
2
e−x u(x)2 dx < ∞ .
−∞

Beweis.
1 2
(i) Zu jeder Polynomlösung u gibt es eine Konstante C mit e− 2 x u(x)2 ≤ C
Ê −1 2
für alle x ∈ . Also liefert C e 2 eine Majorante für den Integranden.
x

(ii) Die Lösung u sei kein Polynom. Aus (b) folgt λ = 2n für n = 0, 1, . . . . Wir
zerlegen u in den geraden und den ungeraden Anteil,



x2k 

x2k+1
u(x) = a2k + a2k+1 = u0 (x) + x u1 (x) .
(2k)! (2k + 1)!
k=0 k=0

Im Fall a0 = 0 folgt aus der Rekursionsformel für die Koeffizienten

)
n−1
a2n = a0 (4k − λ) = 0 für n = 0, 1, 2, . . . .
k=0

Wir zeigen, dass es in diesem Fall eine Konstante c0 > 0 gibt mit
1 2
(∗) e− 2 x |u0 (x)| ≥ 1
c
2 0
für |x|  1 .
3 Potenzreihenentwicklungen von Lösungen 79

Wir fixieren ein N ∈ 


mit 2N ≥ λ+2. Für k ≥ N gilt dann 4k−λ ≥ 2(k+1),
und wir erhalten für n ≥ N + 1
*
N−1
*
n−1

| a2n | ≥ | a0 | | 4k − λ | 2(k + 1)
k=0 k=N

* | 4k − λ | n−1
N−1
* *
n−1

= | a0 | 2(k + 1) = c0 2(k + 1)
2(k + 1)
k=0 k=0 k=0
(2n)!
= c0 2n (2n − 2) · · · 2 > c0 .
2n n!
Da die a2k für k ≥ N alle dasselbe Vorzeichen haben, folgt
 
N
a2k 

a2k 2k 
|u0 (x)| =  x2k + x
k=0 (2k)! (2k)!
k=N+1

  |a2k | 2k  
∞ N
|a2k | 2k
≥  x  − x
(2k)! (2k)!
k=N+1 k=0



x2k 
N
|a2k | 2k 1 2
≥ c0 k
− x = c0 e 2 x − p0 (x)
2 k! (2k)!
k=N+1 k=0

mit einem Polynom p0 . Hieraus folgt die Abschätzung (∗).


Nun zeigen wir, dass es im Fall a1 = 0 eine Konstante c1 > 0 gibt mit
1 2
(∗∗) e− 2 x |u1 (x)| ≥ 1
c
2 1
für |x|  1 .
Da λ nicht geradzahlig ist, liefert die Rekursionsformel für die Koeffizienten
)
n−1
a2n+1 = a1 (4k + 2 − λ) = 0 für k = 0, 1, 2, . . . .
k=0

Sei 2N ≥ λ . Für k ≥ N gilt 4k + 2 − λ ≥ 2(k + 2) ; für n ≥ N + 1 ist daher


)
N−1 )
n−1
|a2n+1 | ≥ |a1 | (4k + 2 − λ) 2(k + 2)
k=0 k=N

* 4k + 2 − λ n−1
N−1
*
= |a1 | 2(k + 2)
2(k + 2)
k=0 k=0
(2n + 1)!
≥ c1 (2n + 2)2n(2n − 2) · · · 4 > c1 .
2n n!
Hieraus ergibt sich wie oben die Abschätzung
1 2
|u1 (x)| ≥ c1 e 2 x − p1 (x)
80 § 4 Lineare Differentialgleichungen zweiter Ordnung

mit einem Polynom p1 und damit die Abschätzung (∗∗).


Im Fall a1 = 0 gilt a0 = 0, und aus (∗) folgt
2 2
e−x |u(x)|2 = e−x |u0 (x)|2 ≥ 1
4
c20 für |x|  1 .
2
Entsprechend folgt im Fall a0 = 0 aus (∗∗), dass e−x |u(x)|2 nicht integrierbar
ist. Im Fall a0 = 0, a1 = 0 haben u0 (x) und u1 (x) für |x|  1 nach (∗) bzw.
(∗∗) jeweils festes Vorzeichen. Da u0 (x) eine gerade und x u1 (x) eine ungerade
Funktion ist, haben beide entweder für x  1 oder für x  −1 dasselbe
Vorzeichen. Es gilt also |u(x)| = |u0 (x)| + |x u1 (x)| ≥ |u0 (x)| entweder für
2
x  1 oder für x  −1 , so dass e−x |u(x)|2 nicht über Ê
integrierbar ist. 2

4 Reihendarstellung von Lösungen in singulären Randpunkten


4.1 Schwach singuläre Randpunkte
Wie in Abschnitt 3 betrachten wir die DG (∗) mit gegebenem λ und schreiben
diese in der Form

u + Gu + H u = 0 in I = ]α, β[ .

Wir betrachten den Fall, dass die DG im linken Randpunkt α von I schwach
singulär ist, d.h. dass α ∈ Ê
ist und Folgendes gilt:
(i) G ist analytisch und besitzt in α einen Pol höchstens erster Ordnung,
(ii) H ist analytisch und besitzt in α einen Pol höchstens zweiter Ordnung.
Entsprechend definieren wir schwache Singularitäten im rechten Endpunkt β
von I.
Im folgenden betrachten wir stets den linken Endpunkt als schwach singuläre
Stelle. Die hierfür gewonnenen Aussagen übertragen sich durch die Spiegelung
x → α + β − x auf den rechten Randpunkt β von I, falls I beschränkt ist.

Beispiele. (a) Die Besselsche DG, die wir in der Form


 
1  ν2
u (x) + u (x) + λ− u(x) = 0 in I = ]0, ∞[
x x2

schreiben, ist schwach singulär im Nullpunkt.


(b) Die Legendresche DG in der Form
2x λ
u (x) − u (x) + u(x) = 0 in I = ] − 1, 1[
1 − x2 1 − x2
ist in beiden Randpunkten schwach singulär, da 1 − x2 = (1 + x)(1 − x) dort
jeweils eine Nullstelle erster Ordnung hat.
4 Reihendarstellung von Lösungen in singulären Randpunkten 81

4.2 Ein Beispiel für das Lösungsverhalten nahe singulärer Punkte


Für die Eulersche Differentialgleichung
x2 u (x) + axu (x) + bu(x) = 0 für x > 0 (a, b ∈ Ê) ,
ist 0 ein schwach singulärer Randpunkt. Der Lösungsansatz
u(x) = xμ = eμ log x
liefert genau dann eine (evtl. komplexwertige) Lösung, wenn μ die Gleichung
(∗) μ(μ − 1) + aμ + b = 0
erfüllt ÜA . Wir haben drei Fälle zu unterscheiden:
(a) (∗) hat zwei reelle Wurzeln μ1 = μ2 . Dann liefern u1 (x) = eμ1 x , u2 = eμ2 x
ein reelles Fundamentalsystem, denn ihre Wronski–Determinante hat an der
Stelle 1 den Wert μ2 − μ1 = 0, vgl. 2.1 (c).
Ê
(b) (∗) hat genau eine Wurzel μ = 12 (1 − a) ∈ . Dann liefert u1 (x) = xμ eine
Lösung ohne Nullstellen in ]0, ∞[. Das d’Alembertsche Verfahren 2.2 ergibt als
zweite Fundamentallösung ÜA
u2 (x) = xμ log x .
(c) (∗) hat zwei nichtreelle Wurzeln μ1 = λ + iω, μ2 = μ1 mit ω > 0. Dann
liefert u(x) = xμ1 = xλ xiω = xλ eiω log x eine komplexwertige Lösung, also
liefern Real– und Imaginärteil
u1 (x) = xλ cos(ω log x) , u2 (x) = xλ sin(ω log x)
reellwertige Lösungen. Diese bilden ein reelles Fundamentalsystem, denn die
Wronski–Determinante an der Stelle 1 ist W (1) = ω = 0 ÜA .
Das Auftreten von Termen (x − α)μ und (x − α)μ log(x − α) im Fall eines
schwach singulären linken Randpunkts α ist typisch, wie sich im Folgenden
zeigen wird.

4.3 Der Reihenansatz von Frobenius


(a) Normalisierung der Differentialgleichung. Die Untersuchung der Lö-
sungen von u + G u + H u = 0 auf I = ]α, β[ in der Nähe des schwach
singulären Randpunkts α kann auf das Studium der Gleichung
(N ) x2 v  (x) + xA(x)v  (x) + B(x)v(x) = 0 in ]0, r[
mit r = β − α zurückgeführt werden, wobei A und B in einer Umgebung des
Nullpunkts analytisch sind, also Potenzreihenentwicklungen

∞ 

A(x) = αk xk , B(x) = βk xk
k=0 k=0
82 § 4 Lineare Differentialgleichungen zweiter Ordnung

mit Konvergenzradius r > 0 besitzen. Dies geschieht wie folgt.


Nach Voraussetzung können wir die Ausgangs–Differentialgleichung durch Mul-
tiplikation mit (x − α)2 in folgende Form bringen

(x − α)2 u (x) + (x − α) A(x − α) u (x) + B(x − α) u(x) = 0 ,

wobei

A(x) = −x G(x + α) , B(x) = x2 H(x + α)

in einer Nullpunktsumgebung analytisch sind. Genau dann ist u eine Lösung in


]α, β[ , wenn v(x) := u(x + α) eine Lösung von (N ) in ]0, r[ liefert.
Ist β ein schwach singulärer rechter Randpunkt, so bringen wir die Differential-
gleichung u + G u + H u = 0 in die Form

(β − x)2 u (x) − (β − x)A(β − x)u (x) + B(β − x)u(x) = 0

mit

A(x) = −x G(β − x) , B(x) = x2 H(β − x) .

Genau dann ist u eine Lösung in ]α, β[, wenn durch v(x) := u(β −x) eine Lösung
von (N ) in ]0, β − α[ gegeben ist.

(b) Reihenansatz. Wir suchen komplexwertige Lösungen v von (N ), die sich


für 0 < x < r (r wie oben) durch eine verallgemeinerte Potenzreihe


v(x) = xμ cn xn (c0 = 0, μ ∈ )
n=0



darstellen lassen, wobei die Potenzreihe cn xn für |x| < r konvergiert und
n=0
xμ für x > 0 durch eμ log x definiert ist. Für solche Funktionen gilt

∞ 
∞ 

v  (x) = μ xμ−1 cn xn + xμ ncn xn−1 = xμ−1 (n + μ)cn xn ,
n=0 n=0 n=0




v (x) = x μ−2
(n + μ)(n + μ − 1)cn x . n

n=0

Setzen wir das in (N ) ein, so erhalten wir nach Division durch xμ



∞ 
∞ 

(n + μ)(n + μ − 1)cn xn + αj xj (k + μ)ck xk
n=0 j=0 k=0

∞ 

+ βj xj ck xk = 0.
j=0 k=0
4 Reihendarstellung von Lösungen in singulären Randpunkten 83

Wir multiplizieren die Reihen nach der Cauchy–Produkt–Formel Bd. 1, § 7 : 7.1,


ordnen nach Potenzen von x und erhalten durch Koeffizientenvergleich

(n + μ)(n + μ − 1) cn + ((k + μ) αj + βj ) ck = 0 (n = 0, 1, 2, . . .).
j+k=n
Mit der Abkürzung
D(λ) := λ (λ − 1) + α0 λ + β0 = λ2 + (α0 − 1) λ + β0
folgt für n = 0 wegen c0 = 0 die Indexgleichung oder charakteristische
Gleichung
(∗) D(μ) = 0,
ferner die Rekursionsformel

n−1
(∗∗) D(n + μ) cn + (k + μ) αn−k + βn−k ck = 0 (n = 1, 2, . . .).
k=0

Damit ergeben sich nach Vorgabe von c0 alle Koeffizienten c1 , c2 , . . . , sofern die
Auflösebedingungen
D(n + μ) = 0 für n = 1, 2, . . .
erfüllt sind. In den folgenden drei Abschnitten legen wir c0 = 1 fest.
(c) Satz von Frobenius (1873). Ist μ eine Lösung der charakteristischen
Gleichung D(μ) = 0 mit D(n + μ) = 0 für n = 1, 2, . . . , und sind die Koef-
fizienten c1 , c2 , . . . aus der Rekursionsformel (∗∗) bestimmt, so konvergiert die


Reihe cn xn für |x| < r, und
n=0


v(x) = xμ cn xn
n=0

ist eine Lösung der Differentialgleichung (N ) für 0 < x < r.


Der Konvergenzbeweis für die Reihe besteht in der Aufstellung einer geeigneten
Majorante; wir verweisen auf Heuser [9] § 28, Joergens–Rellich [111] § 7.
Die Verwendung von verallgemeinerten Potenzreihen geht schon auf Euler
(1766) zurück.

4.4 Bestimmung von Fundamentalsystemen in der Nähe singulärer


Randpunkte
Wir gehen von der normalisierten Form
(N ) x2 v  (x) + xA(x)v  (x) + B(x)v(x) = 0
der DG aus mit

∞ 

A(x) = αk xk , B(x) = βk xk für | x | < r.
k=0 k=0
84 § 4 Lineare Differentialgleichungen zweiter Ordnung

Dabei setzen wir voraus, dass die charakteristische Gleichung D(μ) = 0 nur
reelle Wurzeln μ1 , μ2 besitzt, was der für die Anwendungen wichtigste Fall ist.
Wir nehmen μ1 ≥ μ2 an.
Satz. Die normalisierte Gleichung (N ) besitzt auf dem Intervall ]0, r[ ein Fun-
damentalsystem v1 , v2 der Gestalt

∞ 

v1 (x) = xμ1 cn xn , v2 (x) = xμ2 dn xn + γ v1 (x) log x .
n=0 n=0

Dieses ist eindeutig bestimmt durch c0 = 1 sowie


γ = 0, d0 = 1, wenn μ1 − μ2 keine ganze Zahl ist,
γ = 1, d0 = 0, im Fall μ1 = μ2 ,
d0 = 1, dm = 0, wenn μ1 − μ2 eine natürliche Zahl m ist.
Die Lösung v1 ergibt sich in jedem der drei Fälle mit der Methode von Fro-
benius 4.3, da die Auflösebedingungen D(n + μ1 ) = 0 für alle n ∈ erfüllt 

sind. Im Fall μ1 − μ2 ∈ 0 ergibt sich auch v2 nach der Methode 4.3 wegen
D(n + μ2 ) = 0 für n ∈ . 

Wegen 4.3 (c) bleibt im Fall μ1 − μ2 ∈ 0 nur zu zeigen, dass v1 und v2 ein
Fundamentalsystem bilden. Die Bestimmung der noch fehlenden Koeffizienten

im Fall μ1 − μ2 ∈ 0 wird anschließend beschrieben.
Machen wir die Transformation 4.3 (a) rückgängig, so erhalten wir für die Ori-
ginalgleichung a2 u + a1 u + a0 u = 0 im Fall eines schwach singulären linken
Randpunkts α die Fundamentalsysteme:


u1 (x) = (x − α)μ1 cn (x − α)n ,
n=0


u2 (x) = (x − α)μ2 dn (x − α)n + γ u1 (x) log(x − α) .
n=0

Im Fall eines schwach singulären rechten Randpunkts β ergibt sich




u1 (x) = (β − x)μ1 cn (β − x)n ,
n=0


u2 (x) = (β − x)μ2 dn (β − x)n + γ u1 (x) log(β − x) ,
n=0

wobei die Koeffizienten cn , dn , γ dieselben wie oben sind.


Dieser Satz gestattet es in den meisten Fällen, durch bloßes Lösen der quadra-
tischen Gleichung (∗) das Verhalten der Lösungen in Umgebung schwach sin-
gulärer Randpunkte zu beschreiben. Eine Ausnahme bildet der Fall μ1 −μ2 ∈ , 
bei dem nicht von vornherein zu sehen ist, ob der Logarithmusterm auftritt oder
nicht.
4 Reihendarstellung von Lösungen in singulären Randpunkten 85

Bestimmung der Koeffizienten im Fall m := μ1 − μ2 ∈ . 0

Wir machen den Ansatz




v2 (x) = w(x) + γ v1 (x) log x mit w(x) = xμ2 dn x n .
n=0

(Die Begründung dieses Ansatzes wird im Beweis gegeben.)


Ein kurze Rechnung zeigt ÜA : Genau dann ist v2 ein Lösung von (N ), wenn

(1) x w (x) + x A(x)w (x) + B(x)w(x) = γ (1 − A(x))v1 (x) − 2x v1 (x) .
2  



Wir entwickeln die rechte Seite für |x| < r in eine Reihe γ xμ1 λk x k .
k=0


Wegen v1 (x) = xμ1 −1 (n + μ1 )cn xn (vgl. 4.3) und c0 = 1 wird dabei λ0 =
n=0
(1 − α0 ) − 2μ1 . Aus (∗) folgt 1 − α0 = μ1 + μ2 nach dem Vietaschen Satz, also

(2) λ0 = μ2 − μ1 = −m .

Setzen wir die Reihe für w in (1) ein, so erhalten wir wie in 4.3
∞ 
 
n−1  

xμ2 D(n + μ2 )dn + (k + μ2 )αn−k + βn−k dk xn = γ xμ1 λk x k .
n=0 k=0 k=0

μ2
Daraus folgt nach Division durch x mittels Koeffizientenvergleich
(

n−1
0 für n < m
(3) D(n + μ2 )dn + (k + μ2 )αn−k + βn−k dk = .
k=0
γ λn−m für n ≥ m

(4) Im Fall μ1 = μ2 setzen wir γ = 1, d0 = 0.

Nach (2) ist λ0 = 0. Wegen d0 = 0 ist daher (3) für n = 0 erfüllt. Da die
Auflösebedingungen D(n + μ2 ) = D(n + μ1 ) = 0 für alle n ∈ gelten, ergeben
sich d1 , d2 , . . . eindeutig durch Rekursion.
Im Fall m = μ1 − μ2 ∈  beachten wir, dass
D(μ2 ) = D(m + μ2 ) = 0 und D(k + μ2 ) = 0 für k = 1, . . . , m − 1 .

Daher bestimmen die Rekursionsformeln (3), beginnend mit d0 = 1, die Koeffi-


zienten d1 , . . . , dm−1 eindeutig. Für n = m erhalten wir
 
m−1
(5) (k + μ2 )αn−k + βn−k dk = γ λ0 = −m γ wegen (2).
k=0

Dadurch ist γ festgelegt. Setzen wir dm := 0, so ergeben sich dm+1 , dm+2 , . . .


wieder in eindeutiger Weise.
86 § 4 Lineare Differentialgleichungen zweiter Ordnung

Zu zeigen bleibt: Die mit den so bestimmten Koeffizienten gebildete Reihe




v2 (x) = xμ2 dn xn + γ v1 (x) log x konvergiert für 0 < x < r und liefert
n=0
eine von v1 linear unabhängige Lösung v2 .

Beweis des Satzes 4.4.


 
 setzen wir
∞ ∞
(a) Im Fall μ1 − μ2 ∈ w1 (x) := cn xn , w2 (x) := dn x n .
n=0 n=0
Nach 4.3 konvergieren diese Reihen für |x| < r, und v1 (x) = xμ1 w1 (x), v2 (x) =
xμ2 w2 (x) liefern Lösungen von (N ) mit
  +  ,
 v1 v2   
  = xμ1 +μ2 −1 (μ2 − μ1 )w1 w2 + x  w1 w2  .
 v1 v2   w1 w2 

Dabei ist lim [. . .] = μ2 − μ1 = 0, also verschwindet die Wronski–Determinante


x→0
von v1 und v2 für kleine positive x nicht und damit nirgendwo in ]0, r[. Machen
wir die Substitution 4.3 (a) rückgängig, so ergibt sich u1 (x)u2 (x)−u1 (x)u2 (x) =
0 in ]α, β[ ÜA .

 . Nach 4.3 (c) hat die Reihe

(b) Sei μ1 − μ2 = m ∈ 0 cn z n den Konver-
n=0
genzradius r, definiert also eine für z ∈ , |z| < r holomorphe Funktion w1 .
Wegen c0 = w(0) = 1 gibt es ein > 0 mit w1 (z) = 0 für |z| < , also auch
v1 (x) = xμ1 w1 (x) > 0 für 0 < x < ≤ r. Daher können wir in ]0, [ das Verfah-
ren von d’Alembert 2.3 anwenden: Setzen wir x0 := 12 und für | x − x0 | < 12

x  x A(t) 
dt
ϕ(x) := mit p(x) := exp dt
p(t) v1 (t)2 t
x0 x0

nach 2.1, so liefert v2 (x) = c (ϕ(x) + d)v1 (x) für alle Konstanten c, d ∈  mit
c = 0 eine von v1 linear unabhängige Lösung v2 . Wir geben eine Reihenentwick-
lung für v2 an. Wegen μ1 + μ2 = 1 − α0 ist

 x  
∞   
α0
p(x) = exp + αk+1 tk dt = exp α0 log x + f (x)
t
k=0
x0

α0 f (x) 1−μ1 −μ2 f (x)


= x e = x e ,

wobei die Reihe




αk 

αk
f (x) = − α0 log x0 − xk0 + xk
k k
k=1 k=1
4 Reihendarstellung von Lösungen in singulären Randpunkten 87

den Konvergenzradius r hat. Damit lässt sich f zu einer für |z| < r holomorphen
Funktion z → f (z) fortsetzen, und g(z) = w1 (z)2 ef (z) ist eine für |z| <
holomorphe Funktion ohne Nullstellen. Es gibt also eine für |z| < konvergente
Potenzreihenentwicklung

1 ∞
= ωk z k mit ω0 = 0 .
g(z) k=0

Für | x − x0 | < 1
2
gilt p(x) v1 (x)2 = x1−μ1 −μ2 ef (x) x2μ1 w1 (x)2 = xm+1 g(x),
also
x x x
dt  −m−1 

k 

ϕ(x) = = t ωk t dt = ωk tk−m−1 dt
tm+1 g(t) k=0 k=0
x0 x0 x0



ωk  k−m
= x − xk−m + ωm log x − ωm log x0
k−m 0
k=0
k=m

= h0 + x−m h(x) + ωm log x

mit einer geeigneten Konstanten h0 und einer Funktion h, die sich für |x| <


in der Form h(x) = ξk xk mit ξ0 = 0 darstellen lässt. Wir erhalten so
k=0

v2 (x) = c h0 + d + x−m h(x) xμ1 w1 (x) + c ωm v1 (x) log x

= c xμ2 h(x) w1 (x) + xm (h0 + d)w1 (x) + γ v1 (x) log x .

Durch passende Wahl von c und d erhalten wir wegen c0 = 1 eine Reihenent-


wicklung v2 (x) = xμ2 dn xn + γ v1 (x) log x mit d0 = 1, dm = 0. Dass diese
n=0
sogar im vollen Intervall |x| < r konvergiert, wird in Jörgens–Rellich [111] § 7
gezeigt. 2

4.5 Die allgemeine Legendresche Differentialgleichung


 
m2
(Lλm ) (1 − x2 )u − 2xu + λ− u = 0 für − 1 < x < 1
1 − x2


mit Index m ∈ 0 fällt bei der Separation der dreidimensionalen Wellenglei-
chung nach Einführung von Kugelkoordinaten an, siehe § 15 : 3. In 3.2 wurde
der Fall m = 0 behandelt.
Durch Anwendung der Methode 4.4 kommen wir zu dem folgenden Satz, den
wir der Übersichtlichkeit halber voranstellen.
88 § 4 Lineare Differentialgleichungen zweiter Ordnung

Satz. Für m = 0, 1, . . . besitzt die Legendresche Differentialgleichung (Lλm ) ge-


nau dann eine in ]−1, 1[ beschränkte Lösung u = 0, wenn

λ = ( + 1) mit  ∈ {m, m + 1, . . . } .

Für λ = ( + 1) ist jede beschränkte Lösung ein konstantes Vielfaches der
zugeordneten Legendre–Funktion

dm
P m (x) = (1 − x2 )m/2 P (x) ,
dxm
wobei P das –te Legendre–Polynom ist, vgl. 3.2.
Auf die Eigenschaften der Legendre–Polynome gehen wir in § 15 : 3 näher ein.
Für den Beweis benötigen wir folgenden
Hilfssatz. Jede auf ]−1, 1[ beschränkte Lösung u von (Lλm ) ist von der Form

u(x) = c (1 − x2 )m/2 f (x)



mit einer für |z| < 3 holomorphen Funktion f und einer Konstanten c.

Zum Beweis des Hilfssatzes gehen wir gemäß 4.4 vor.


(a) Wir betrachten die Normalisierung xv  + xA(x)v  + B(x)v = 0 im linken
Randpunkt α = −1. Es ergibt sich gemäß 4.3 (a) ÜA
∞  
−2x(x − 1) x−1 1  x k
A(x) = x = 2 = 2− = 1− ,
1 − (x − 1)2 x−2 1− x
2
2
k=1

m2 m2
2
λ− (x−1)2 2
λ− 2x−x2 m2 − λ(2x − x2 )
B(x) = x = x =
1 − (x − 1)2 2x − x2 (x − 2)2

λx 1 m2 1 λx 1 m2 d 1
= − +  = − +
2 1− x
2
4 1− x 2
2 1− x
2
2 dx 1 − x
2
2
∞    k−1
λx  x k m2 

x
= − + k
2 2 4 2
k=0 k=0
∞   
m2  m 2
x k
= − − λ+ (k + 1) .
4 4 2
k=1

Die Indexgleichung lautet also

m2 m2
0 = D(μ) = μ(μ − 1) + α0 μ + β0 = μ(μ − 1) + μ − = μ2 − ;
4 4
4 Reihendarstellung von Lösungen in singulären Randpunkten 89

diese besitzt die Wurzeln μ1 = m


2
und μ2 = − m2
. Nach 4.4 finden wir für (Lλm )
ein Fundamentalsystem v1 , v2 mit den Eigenschaften:


v1 (x) = xm/2 w(x) , wobei w(z) = ncn z n für |z| < 2
n=1

konvergiert und v2 (x) unbeschränkt ist für x → 0+.


( ÜA . Im Fall m = 1, 2, . . . ist zu beachten, dass x−m/2 für x → 0+ stärker als
| log x| gegen Unendlich strebt.)
Hiernach ist jede beschränkte Lösung der normalisierten DG ein Vielfaches der
Funktion v1 .
(b) Gehen wir zur Originaldifferentialgleichung (Lλm ) zurück, so erhalten wir
aus (a) die Existenz einer für |z + 1| < 2 holomorphen Funktion w1 , so dass jede
beschränkte Lösung von (Lλm ) Vielfaches von (x + 1)m/2 w1 (x) ist; wir haben
nur w1 (z) = w(z + 1) zu setzen.
Die analoge Betrachtung für den rechten Randpunkt β = 1 liefert die Existenz
einer für |z − 1| < 2 holomorphen Funktion w2 , so dass jede beschränkte Lösung
von (Lλm ) Vielfaches von (1 − x)m/2 w2 (x) ist. ( ÜA Beachten Sie: Mit u ist
auch x → u(−x) eine Lösung.)
Liefert u(x) := (x + 1)m/2 w1 (x) eine beschränkte Lösung, so gibt es also ein
Ê
c ∈ mit u(x) = c (1 − x)m/2 w2 (x). Setzen wir

f1 (z) := (1 − z)−m/2 w1 (z) , f2 (z) := c (1 + z)−m/2 w2 (z) ,

so ist f1 holomorph in der Kreisscheibe K2 (−1), f2 holomorph in K2 (1), und es


gilt für −1 < x < 1

f1 (x) = (1 − x)−m/2 (1 + x)−m/2 u(x) = c (1 + x)−m/2 w2 (x) = f2 (x) .

Nach dem Identitätssatz für holomorphe Funktionen stimmen f1 √ und f2 im


Bereich K2 (−1) ∩ K2 (1) überein, welcher den Kreis KR (0) mit R = 3 enthält
(Skizze!). Sie dürfen daher zu einer auf K2 (−1) ∪ K2 (1) holomorphen Funktion
f verklebt werden. Es ist dann

u(x) = (1 − x)m/2 (1 + x)m/2 f (x) = (1 − x2 )m/2 f (x) . 2

Beweis des Satzes.


Nach dem Hilfssatz geht es um die Frage, wann es beschränkte nichttriviale
Lösungen u der Form u(x) = (1 − x2 )m/2 f (x) gibt. Solche Lösungen u erfüllen
die Gleichung (Lλm ) genau dann ÜA , wenn

(Rλm ) (1 − x2 ) f  (x) − 2(m + 1)xf  (x) + (λ − m(m + 1)) f (x) = 0 .


90 § 4 Lineare Differentialgleichungen zweiter Ordnung

(a) Ist v eine Lösung von (Rλm ), so ist v  eine Lösung von (Rλm+1 ) ÜA . Nun
( +1)
erfüllt das Legendre–Polynom P die Gleichung (R0 ), somit löst P m die
( +1)
Gleichung (Rm ).
Damit haben wir für λ = ( + 1) die offensichtlich beschränkte Lösung

u(x) = (1 − x2 )m/2 P m (x)


( +1)
von (Lm ), wie behauptet.

(b) Sei λ nicht von der Form ( + 1) mit  ∈ 0 . Nach dem Hilfssatz ist jede
beschränkte Lösung ein Vielfaches von u(x) = (1 − x2 )m/2 f (x) , wobei

∞ √
(∗) f (x) = an xn (Konvergenzradius ≥ 3 > 1)
n=0

die Gleichung (Rλm ) erfüllt. Einsetzen der Reihe für f in diese DG und Koeffi-
zientenvergleich liefert für die an die Rekursionsformel ÜA
(m + n)(m + n + 1) − λ
(∗∗) an+2 = an (n = 0, 1, 2, . . .) .
(n + 1)(n + 2)
Wir zeigen, dass die
√ Reihe (∗) mit den nach (∗∗) bestimmmten Koeffizienten
nur dann für |x| < 3 konvergieren kann, wenn a0 = a1 = 0. Wegen (∗∗) folgt
dann a2 = a3 = s = 0, d.h. jede beschränkte Lösung ist die Nullfunktion.
Ist beispielsweise a0 = 0, so folgt aus (∗∗) wegen der Bedingung für λ, dass

a2n = 0 für alle n ∈ 0 und dass
a2n+2
lim = 1.
n→∞ a2n

Wir wählen ein r mit 1 < r < 3. Dann gibt es ein N ∈  mit
a2k+2 1
≥ 2 für k ≥ N . Daraus folgt für n > N
a2k r
+ ,    
     a2n 2 
 a2n r2n  =  a0 a2 · · · a2N r2N   a2N+2 r2  · · ·  
 a0 a2N−2  a2N  a2n−2  ≥ c ,
r

wo c = | [. . .] | > 0. Also ist (a2n r 2n ) keine Nullfolge; die Reihe für f divergiert
für x = r. Entsprechend argumentieren wir im Fall a1 = 0. 2

4.6 Die allgemeine Laguerresche Differentialgleichung

(Mλm ) xu + (m + 1 − x) u + λu = 0 für x > 0 , m = 0, 1, . . .


tritt bei der quantenmechanischen Behandlung des Wasserstoffatoms auf, siehe
Heuser [9] V.33.
4 Reihendarstellung von Lösungen in singulären Randpunkten 91

Hierbei sind nur beschränkte Lösungen u = 0 von Interesse, für die


∞
(∗) xm e−x | u(x) |2 dx < ∞ .
0

Durch Anwendung der Methode 4.4 und Übertragung der Schlüsse von 4.5 er-
halten wir den folgenden

Satz. (a) Für m = 0, 1, . . . besitzt die Gleichung (Mλm ) genau dann nichttri-

viale Lösungen u mit (∗), wenn λ = n mit n ∈ 0 . Die Lösungen sind für
m = 0 konstante Vielfache der Laguerre–Polynome
n  
 n (−x)k
Ln (x) :=
k k!
k=0

und für m = 1, 2, . . . konstante Vielfache der zugeordneten Laguerre–Poly-


nome
dm
Lm
n (x) := (−1)
m
Lm+n (x) .
dxm

Bemerkung. Die Normierung der Laguerre–Polynome ist in der Literatur nicht


einheitlich.

(b) Wie für Legendre– und Hermite–Polynome gibt es auch für die Laguerre–
Polynome eine Darstellung als n–fache Ableitung (Rodrigues–Formel)

1 ex dn  n+m −x
Lm
n (x) =
n! xm dxn
x e (n, m ∈  ).
0

Letztere sei dem Leser als ÜA überlassen (Berechnung der linken und rechten
Seite nach der Leibniz–Regel).

Beweis.
(i) Die normalisierte Gestalt von (Mλm ) im linken Randpunkt α = 0 lautet
mit den Bezeichungen von 4.3

x2 v  + x A(x) v  + B(x) v = 0 mit A(x) = m + 1 − x , B(x) = λx .

Somit ergibt sich die Indexgleichung D (μ) = μ(m + μ) = 0 mit den Wurzeln
μ1 = 0, μ2 = −m. Nach 4.4 erhalten wir ein Fundamentalsystem u1 , u2 durch

∞ 

u1 (x) = ck xk , u2 (x) = x−m dk xk + γ u1 (x) log x
k=0 k=0

mit c0 = 1, d0 = 1 für m = 0 und d0 = 0, γ = 1 im Fall m = 0. Die für x → 0+


beschränkten Lösungen sind Vielfache von u1 . Denn es gilt lim u1 (x) = c0 = 1,
x→0+
92 § 4 Lineare Differentialgleichungen zweiter Ordnung

und u2 (x) ist nahe des Nullpunkts unbeschränkt. Für m = 0 verursacht dies der
Logarithmus, für m ∈ 
wegen d0 = 1 der Vorfaktor x−m .
(ii) Die Rekursionsformeln 4.3 (∗∗) für die ck lauten wegen μ1 = 0
k−1−λ
(∗∗) ck = ck−1 für k = 1, 2, . . . .
k(m + k)
Somit existieren Polynomlösungen genau dann, wenn λ = n mit n ∈  . Der
0
Grad dieser Polynome ist n. Im Fall m = 0 ergibt sich mit c0 = 1 ÜA
 
n 1
ck = (−1)k (k = 0, 1, . . .) .
k k!
Um den Fall m ∈  auf diesen zurückzuspielen, beachten wir:
u löst ( Mλk ) =⇒ u löst ( Mλ−1
k+1 ) ÜA .

Durch m–malige Anwendung dieses Schlusses ergibt sich

u löst ( Mλ0 ) =⇒ u(m) löst ( Mλ−m


m ).
(m)
Da Ln+m eine Lösung von (Mn+m 0 ) ist, liefert Ln+m eine Lösung von (Mn
m)
und spannt die für x → 0+ beschränkten Lösungen auf.
Für Polynomlösungen ist die Bedingung (∗) offenbar erfüllt.

(iii) Ist λ ∈ 0 , so erfüllt keine Lösung u = 0 die Bedingung (∗). Dazu haben
wir nach (i) zu zeigen: Hat u1 = 0 die durch (∗∗) bestimmten Koeffizienten
(c0 = 1), so divergiert das Integral
∞
xm e−x u1 (x)2 dx .
0

Zum Nachweis zeigen wir, dass es ein Polynom p und eine Konstante c > 0 gibt,
so dass für x > 0
1
| u1 (x) | ≥ c e 2 x − p(x) .

Dazu wählen wir ein N ∈  mit N ≥ m + 2 + 2| λ |. Für n ≥ N gilt dann


n−1−λ 1
2(n − 1 − λ) ≥ 2(n − 1 − |λ|) ≥ m + n , also ≥ .
m+n 2
Aus der Rekursionsformel (∗∗) mit c0 = 1 folgt

−λ 1 − λ N −λ N +1−λ k − 1 − λ xk
ck xk = ··· ··· .
m+1m+2 m+N +1 m+N +2 m + k k!
Für k > N haben diese Glieder ein festes Vorzeichen, und mit C = | [. . .] | gilt
 k−N−1  k  k
1 xk x 1 c x
|ck xk | ≥ C = 2 C 2N = ,
2 k! 2 k! k! 2
4 Reihendarstellung von Lösungen in singulären Randpunkten 93

wobei c = 2C 2N . Daher ist


 
N 
∞   
∞  
N
| u1 (x) | =  ck xk + ck xk  ≥  ck xk  − | ck | xk
k=0 k=N+1 k=N+1 k=0


∞   
N
1 x k
≥ c − | ck | xk = c ex/2 − p(x)
k! 2
k=N+1 k=0

mit einem geeigneten Polynom p. 2

4.7 Die Besselsche Differentialgleichung vom Index ν ≥ 0


x2 u + x u + (x2 − ν 2 ) u = 0 für x > 0
entsteht aus der allgemeinen Besselschen Differentialgleichung in 1 (b) mit Para-
meter λ > 0 durch Umskalierung:
√ Ist v eine Lösung der allgemeinen Gleichung,
so löst u(x) := v(x/ λ) die Besselsche DG mit λ = 1 und umgekehrt ÜA .
Wir bestimmen Fundamentalsysteme für den linken Randpunkt 0 nach der Me-
thode von Frobenius.
(a) Die erste Fundamentallösung nach Frobenius. Mit den Bezeichnungen 4.3 (a)
ist
A(x) = 1 , B(x) = x2 − ν 2 .
Also lautet die Indexgleichung D(μ) = μ2 − ν 2 = 0 mit Wurzeln ν und −ν.


Die Rekursionsformeln für die Koeffizienten cn von u1 (x) = xν cn xn lauten
n=0
nach 4.3 (∗∗) wegen D(n + ν) = (n + ν)2 − ν 2 = n(n + 2ν) und α1 = β1 = 0
0 = (1 + 2ν) c1 + (να1 + β1 ) c0 = (1 + 2ν) c1 ,
n(n + 2ν) cn + cn−2 = 0 für n = 2, 3, . . . .
Hieraus folgt c1 = c3 = c5 = . . . = 0 und per Induktion
(−1)n c0 1
c2n = .
n!(ν + 1)(ν + 2) s(ν + n) 4n


Die Reihe c2n z 2n hat die Majorante


n=0


∞  2n
1 |z| 1
| c0 | = |c0 | exp ( |z|2 ) ,
n! 2 4
n=0

liefert also eine ganze Funktion. Wir erhalten so die für x > 0 definierte Lösung


v1 (x) = xν c2n x2n .
n=0
94 § 4 Lineare Differentialgleichungen zweiter Ordnung

(b) Satz. Im Fall ν ∈ Ê\ 0 ist



∞  2n
1 x
v2 (x) = x−ν (−1)n
n!(1 − ν) · · · (n − ν) 2
n=0

eine für x > 0 definierte zweite Fundamentallösung der Besselschen Differen-


tialgleichung.

Beweis.
Nach 4.4 gibt es im Fall 2ν = μ1 − μ2 ∈ 0v eine zweite Fundamentallösung
−ν


n
von der Form v2 (x) = x dn x . Die Koeffizienten ergeben sich wie oben
n=0
durch Rekursion aus D(n − ν)dn = n(n − 2ν)dn = − dn−2 ÜA .
Der Fall 2ν ∈ 0 , ν ∈ 0 , also ν = n + mit n ∈ 0 bedeutet μ1 − μ2 =
1
2
2ν ∈ . Nach Abschnitt 4.4 können in der Lösung logarithmenhaltige Terme
auftreten. Der in 4.4 beschriebene Zugang führt auf langwierige Rechnungen.
Wir umgehen diese, indem wir zeigen, dass durch den Reihenansatz (b) eine
für alle x > 0 definierte Lösung v2 der Besselschen DG gegeben ist, und dass
v1 , v2 linear unabhängig sind, d.h. v1 v2 − v1 v2 = 0.
Die oben angegebene Reihe für v2 (x) xν mit ν ∈ 0 besitzt die Majorante
  x2
 . Gliedweise

1 1 n
 n! 4
mit = dist (ν, ) > 0, konvergiert also auf ganz
n=0
Differentiation und Koeffizientenvergleich unter Berücksichtigung der Rekur-
sionsformeln zeigt, dass v2 die Besselsche DG erfüllt ÜA .
Setzen wir v1 (x) = xν g(x), v2 (x) = x−ν h(x), so folgt ÜA


v1 (x)v2 (x) − v1 (x)v2 (x) = − g(x) h(x) + g(x) h (x) − g  (x) h(x) .
x
Die rechte Seite hat wegen g(0) h(0) = c0 d0 = 0 einen Pol 1. Ordnung in 0,
kann also nicht identisch verschwinden. 2

(c) Die Besselfunktionen. Durch geeignete Festlegung der Koeffizienten c0 ,


d0 erhalten wir für v1 , v2 die Darstellungen
 ν 
∞  2n
x 1 x
Jν (x) = (−1)n (ν ≥ 0),
2 n! Γ(n + 1 + ν) 2
n=0

 −ν 
∞  2n
J−ν (x) =
x
2
(−1)n
1
n! Γ(n + 1 − ν)
x
2
(ν ∈ \ 0 ).
n=0

Im Fall ν ∈ 0 liefern also Jν , J−ν ein Fundamentalsystem für die Besselsche


DG. Die Darstellung Jν für v1 erhalten wir mit der Wahl c0 = (2ν Γ(ν + 1))−1 .
4 Reihendarstellung von Lösungen in singulären Randpunkten 95

Die Gammafunktion und ihre Funktionalgleichung Γ(x + 1) = xΓ(x) für x > 0


wurden in Bd. 1, § 12 : 5.5 behandelt. Für ν ≥ 0 ist danach
Γ(n + 1 + ν) = (n + ν) Γ(n + ν) = (n + ν) (n + ν − 1)Γ(n + ν − 1)
= . . . = (n + ν) (n + ν − 1) · · · (ν + 1) Γ(ν + 1) .
Zu der Darstellung von J−ν sei ohne Beweis mitgeteilt, dass sich die Γ–Funktion
unter Wahrung der Funktionalgleichung Γ(z + 1) = z Γ(z) zu einer auf
\ {0, −1, −2, . . .} holomorphen Funktion mit Polen 1. Ordnung an den Stellen
0, −1, −2, . . . fortsetzen lässt und dass dabei
π
Γ(z) Γ(1 − z) = für z ∈ \
sin πz
gilt (Ergänzungsformel). Für diese Hintergrundinformation sei auf Barner–
Flohr [141] 11.3, Heuser [148] Nr. 150 verwiesen. Für unsere Zwecke genügt
es, Γ(x) für x ∈ ]−n, −n + 1] durch
Γ(x + n + 1)
Γ(x) := mit (λ)n := λ(λ + 1) · · · (λ + n − 1)
(x + 1)n
zu definieren. Es ist dann Γ(n + 1 − ν) = (1 − ν)n Γ(1 − ν). Wir haben in der
Darstellung (b) für v2 also d0 := 2ν /Γ(1 − ν) gesetzt.

Aufgaben. (i) Zeigen Sie mit Hilfe der Darstellung (b) und den oben getrof-
fenen Festlegungen von c0 , d0 , dass

2 2
J 1 (x) = sin x , J− 1 (x) = cos x .
2 πx 2 πx
(ii) Berechnen Sie J0 (x) auf 3 Stellen genau. (Benützen Sie für die Fehler-
abschätzung eine geeignete Majorante für die Reihe.)
(d) Für nichtganzzahliges ν > 0 liefert die Neumann–Funktion (Bessel–
Funktion 2. Art)
Jν (x) cos νπ − J−ν (x)
Nν (x) =
sin νπ
(auch mit Yν (x) bezeichnet) eine von Jν linear unabhängige Lösung der Bessel–
DG; ferner bilden die Hankel–Funktionen
Hν(1) (x) := Jν (x) + i Nν (x) , Hν(2) (x) := Jν (x) − i Nν (x)
ein komplexes Fundamentalsystem ÜA .

(e) Eine zweite Fundamentallösung bei ganzzahligem Index.


Für ν = 0 muss die zweite Fundamentallösung nach 4.4 von der Form


u2 (x) = dn xn + J0 (x) log x
n=1
96 § 4 Lineare Differentialgleichungen zweiter Ordnung

sein. Ist ν ∈  und m = 2ν, so lauten die Gleichungen (3) von 4.4
n(n − ν) dn + dn−2 = 0 für n = 2, . . . , m − 1
und
1
dm−2 = γ λ0 mit λ0 = − < 0.
2ν−1 (ν − 1)!
Wegen d0 = 1 folgt dm−2 = d2(ν−1) = 0, also γ = 0. Daher gibt es eine zweite
logarithmenhaltige Fundamentallösung. Eine längere Rechnung ergibt für die
zweite Fundamentallösung die Darstellung (vgl. Lense [107, S. 70])
2 Cx
Nn (x) = lim Nν (x) = Jn (x) log
ν→n π 2
    ∞  
1  (n − k − 1)! x 2k−n 1 x n
n−1
sk + sn+k x k
− − (−1)k .
π k! 2 π 2 k!(n + k)! 2
k=0 k=0
Dabei ist

n
1
 
sn = und C = exp lim (sn − log n) .
k n→∞
k=1

(f) Für jedes ν ≥ 0 besitzt Jν abzählbar viele Nullstellen


0 < jν,1 < jν,2 < . . . mit lim jν,k = ∞ .
k→∞

Beweis.

Die Funktion u(x) := x Jν (x) genügt der DG ÜA
 −2
 1
(∗∗) −u (x) + q(x) u(x) = 0 mit q(x) = x ν2 − 4 − 1.

Wir wählen r > 0 so, dass q(x) < − 41 für x > r gilt. Nach der Folgerung aus
dem Nullstellenvergleichssatz 2.6 hat u und damit auch Jν in ]r, ∞[ unendlich
viele Nullstellen. Da die Nullstellen nach 2.5 in ]0, ∞[ keinen Häufungspunkt
besitzen, gibt es abzählbar viele. Wegen J0 (0) = 1 und Jν (0) = 0, Jν (0) > 0
für ν > 0 kann 0 kein Grenzwert einer Folge von Nullstellen sein, d.h. unter
den Nullstellen in ]0, ∞[ gibt es eine kleinste. 2

Bemerkung. Durch Anwendung von Vergleichsargumenten auf die im Beweis



verwendete DG (∗∗) für x Jν (x) lassen sich folgende asymptotische Darstel-
lungen herleiten
   
2 π 1 ν2 − 1
Jν (x) = cos x− ν + + 4
+ Rν (x) ,
πx 2 2 2x
  ν2 − 1 
ν 1 ν 1
jν,k = π k + − −  4
+ Sν k + − ,
2 4 2π k + ν
2
− 1
4
2 4
4 Reihendarstellung von Lösungen in singulären Randpunkten 97

wobei

|Rν (x)| ≤ cν x−5/2 , |Sν (x)| ≤ dν x−2

mit passenden Konstanten cν , dν , siehe Birkhoff–Rota [8] Ch. 10.11, Watson


[110] 7.21, 15.53.
Asymptotisch besitzen aufeinander Folgende Nullstellen von Jν also den Ab-
stand π.
(g) Es bestehen die Beziehungen

Jν−1 (x) + Jν+1 (x) = Jν (x) , Jν−1 (x) − Jν+1 (x) = 2Jν (x) ,
x
ν ν
Jν (x) + Jν (x) = Jν−1 (x) , Jν (x) − Jν (x) = Jν+1 (x) .
x x
Die beiden ersten ergeben sich unmittelbar aus der Reihendarstellung (c). Aus
diesen folgen die beiden letzten durch Addition und Subtraktion ÜA .

Orthogonalitätsrelationen für die Besselfunktionen werden in § 15 : 3.1 hergelei-


tet.
Für weitere Eigenschaften von Besselfunktionen verweisen wir auf Courant–
Hilbert [2], Kap.7, §2, Lebedev [106] Chap. 5, Watson [110].

4.8 Aufgabe
Gegeben sei die hypergeometrische oder Gaußsche Differentialgleichung

x(1 − x) u + (c − (a + b + 1)x)u + abu = 0 in ]0, 1[

mit Konstanten a, b, c ∈ Ê, c ∈/ .
Bestimmen Sie ein Fundamentalsystem u1 , u2 in der Nähe des linken Rand-
punktes α = 0 nach der Methode von Frobenius. Für die Darstellung der
Lösung sind die Abkürzungen gebräuchlich:

(λ)k := λ (λ + 1) · · · (λ + k − 1) , F (a, b, c ; x) := u1 (x)

für λ ∈  und die gemäß 4.4 festgelegte Lösung u1 .


98 § 5 Einführung in die qualitative Theorie

§ 5 Einführung in die qualitative Theorie


1 Autonome Systeme
1.1 Zielsetzung, grundlegende Sätze
Ziel der qualitativen Theorie ist, das Verhalten von Lösungen zu beschreiben,
ohne diese explizit angeben zu müssen. Aussagen über Lösungen werden also
direkt aus der Differentialgleichung abgeleitet und nicht über den Umweg einer
Lösungsformel gewonnen.
Wir betrachten in diesem Paragraphen ausschließlich autonome Systeme

ẏ = f (y) ,

wobei f : Ω → Ê n
in einem Gebiet Ω ⊂ Ên
C1 –differenzierbar ist.
Beachten Sie im folgenden die gegenüber § 2 : 3.1 (c) und 6.3 geänderte Bezeich-
nungsweise! Insbesondere stellen wir Lösungskurven in der Form t → u(t) dar
und interpretieren t meistens als Zeitkoordinate.
Bei autonomen Systemen genügt es, das Anfangswertproblem in der spezielleren
Form

(∗) ẏ = f (y) , y(0) = η

zu betrachten. Dies ist durch die Invarianz der DG unter Zeitverschiebungen


begründet: Ist u eine Lösung von (∗), so löst t → u(t − t0 ) das AWP ẏ = f (y),
y(t0 ) = η und umgekehrt.
Die grundlegende Theorie der Anfangswertprobleme von § 2 liefert für autonome
Systeme:
(a) Existenz und Eindeutigkeitssatz. Zu gegebenem Startpunkt η ∈ Ω hat
das AWP (∗) genau eine Lösung u : J(η) → Ω auf einem maximalen Intervall
J(η). Das Definitionsintervall J(η) ist offen.
Wir bezeichnen die maximal definierte Lösung mit t → ϕ(t, η).
Für jede andere Lösung v : I → Ω dieses AWP gilt also

I ⊂ J(η) und v(t) = ϕ(t, η) für t ∈ I.

(b) Differenzierbarkeitssatz. Der Definitionsbereich der Abbildung ϕ,


  
Ωf := (t, η)  η ∈ Ω , t ∈ J(η) ,

Ê
ist ein Gebiet des n+1, und ϕ ist in Bezug auf alle Variablen C1 –differenzier-
∂ϕ
bar. Für die partiellen Ableitungen wk (t, η) := ∂ηk
(t, η) gilt

ẇk (t, η) = A(t) wk (t, η) , wk (0) = ek mit A(t) := Df (ϕ(t, η)),


1 Autonome Systeme 99

wobei Df die Jacobi–Matrix von f ist. Im Fall f ∈ Ck (Ω, Ên


) mit k > 1 ist ϕ
nach allen Variablen Ck –differenzierbar.

(c) Kompaktheitssatz. Bleibt ϕ(t, η) für wachsendes t ≥ 0 in einer festen


kompakten Teilmenge von Ω, so umfaßt J(η) alle t ≥ 0. Bleibt ϕ(t, η) für
fallendes t ≤ 0 in einer festen kompakten Teilmenge von Ω, so umfaßt J(η)
alle t ≤ 0. Kann eine in einer kompakten Teilmenge von Ω startende Lösung
diese nicht verlassen, so existiert sie für alle Zeiten.

Beweis.
Um diese Sätze auf die grundlegende Theorie von § 2 zurückzuführen, führen
wir folgende Bezeichnungen ein: Wir setzen Ω := × Ω und Ê
(x, y) → g(x, y) := f (y) , g : Ω → Ê n
.

Die maximale Lösung des AWP ẏ = g(x, y) = f (y), y(ξ) = η bezeichnen wir
mit ψ(x, ξ, η), ihr Definitionsintervall mit I(ξ, η), und den Definitionsbereich
von ψ bezeichnen wir mit
  
Ωg = (x, ξ, η)  (ξ, η) ∈ Ω , x ∈ I(ξ, η) .

Dann erfüllt g in Ω die Standardvoraussetzung § 2 : 3.1. Also ist I(ξ, η) of-


fen (§ 2 : 5.3). Nach § 2 : 7.1 ist Ωg ein Gebiet und ψ(x, ξ, η) dort nach allen
Ê
Variablen Ck –differenzierbar, falls f ∈ Ck (Ω, n ) mit k ∈ . 
Wegen der Invarianz autonomer Systeme unter Zeitverschiebungen gilt
(1) ψ(t, ξ, η) = ϕ(t − ξ, η), I(ξ, η) = ξ + J(η),
insbesondere
(2) ϕ(t, η) = ψ(t, 0, η).
Ferner gilt
(3) (t, η) ∈ Ωf ⇐⇒ (t, 0, η) ∈ Ωg .
Aus (1) folgt, dass J(η) offen ist. Zu (t0 , η 0 ) ∈ Ωf , also (t0 , 0, η 0 ) ∈ Ωg gibt
es ein δ > 0, so dass (t, 0, η) ∈ Ωg , d.h. (t, η) ∈ Ωf für | t − t0 | < δ und
η − η 0  < δ. Also ist Ωf offen und ϕ(t, η) dort wegen (2) nach allen Variablen
Ck –differenzierbar. Die Behauptung über wk folgt direkt aus der Variations-
gleichung (L) in § 2 : 7.1. Die Abbildung

h : Ωg → Ωf , (t, ξ, η) → (t, η)

ist stetig und nach (3) surjektiv, also ist Ωf wegzusammenhängend (Band 1,
§ 21 : 9.3). Der Kompaktheitssatz wurde in § 2 : 6.3 bewiesen. 2
100 § 5 Einführung in die qualitative Theorie

1.2 Integralkurven, Orbits, Phasenportraits


In der qualitativen Theorie autonomer y2
Systeme erweist es sich als fruchtbar, 6
die DG ẏ = f (y) geometrisch zu inter- • •
pretieren. Hierbei fassen wir die rechte •
• •
Seite f als Vektorfeld auf Ω auf, d.h.
• • •
denken uns den Vektor f (η) an jeder •
•• -
Stelle η ∈ Ω angeheftet. Das Bestehen •
• • •
y1
der Differentialgleichung für die Kurve • •
t → u(t) bedeutet nichts anderes, als •
dass der Vektor f (η) in jedem Kurven- •

punkt η = u(t) mit dem Tangenten-
vektor u̇(t) übereinstimmt.
y2
Es ist üblich, die Differentialgleichung 6
mit dem Vektorfeld f zu identifizie-
ren und die Lösungen Integralkur-
ven oder Trajektorien des Vektor-
feldes zu nennen. In der Physik sind
hierfür auch die Bezeichnungen Feld- -
y1
linie, Flusslinie, Bahnkurve und Or-
bit gebräuchlich, oft ohne deutliche Un- K • η = u(t)
terscheidung zwischen der Abbildung 
t → u(t) und ihrer Spur, also der Bild-  u̇(t) = f (η)

/
menge {u(t) | t ∈ I}.
Wir verwenden den Begriff Orbit für die Spur der maximalen Lösung, wobei
wir diese mit der durch die Parametrisierung t → u(t) gegebenen Orientierung
versehen (siehe Bd. 1, § 24 : 4.3), falls der Tangentenvektor u̇(t) nirgends ver-
schwindet. In 1.3 zeigen wir, dass dies stets der Fall ist, wenn der Orbit nicht
zu einem Punkt entartet.
Die Punkte η ∈ Ω mit f (η) = 0 heißen kritische Punkte, stationäre Punk-
te, Gleichgewichtspunkte und in der Mechanik auch Gleichgewichtslagen.
Nach dem Eindeutigkeitssatz sind die kritischen Punkte gerade die konstanten
Lösungen, bzw. die einpunktigen Orbits.
Die Invarianz unter Zeitverschiebungen und der Satz 1.1 (b) haben zur Folge:
Treffen sich zwei Orbits, so sind sie als Mengen gleich ÜA .
Da durch jeden Punkt von Ω eine Lösung geht, ist der Phasenraum Ω die
disjunkte Vereinigung sämtlicher Orbits. Wir weisen darauf hin, dass eine ange-
messene Beschreibung von Phasenräumen in vielen Fällen den Begriff der Man-
nigfaltigkeit erfordert. Hierauf gehen wir nicht weiter ein, machen aber in 3.6
das Problem am Beispiel des Pendels deutlich und verweisen die interessierten
Leser auf Arnold [151].
1 Autonome Systeme 101

Die Gesamtheit aller Orbits wird das y


Phasenbild genannt. 6
Eine grobe Übersicht über das Phasen-
bild ebener Systeme erhalten wir durch
ein Phasenportrait. Ein solches ent-
steht, indem wir kritische Punkte und
einige typische Orbits eintragen.
-
x
Die nebenstehende Figur zeigt ein Pha-
senportrait für das System
ẋ = 1 − x2 , ẏ = xy .
ÜA Verifizieren Sie dieses Phasenpor-
trait!
In Abschnitt 3 führen wir aus, wie wir uns durch rein qualitative Überlegungen
ein Phasenportrait verschaffen können. Zahlreiche Beispiele von Phasenportraits
finden Sie in Arrowsmith–Place [7] und Hirsch–Smale–Devaney [10].

1.3 Die drei Orbittypen


Satz. Jede Lösung t → u(t) = ϕ(t, η) eines autonomen Systems ist von genau
einem der folgenden Typen:
(a) u ist injektiv,
(b) u ist periodisch, d.h. es existiert eine kleinste Zahl T > 0 (die Periode
von u) mit

u(t + T ) = u(t) für alle t .

Der zugehörige Orbit ist also geschlossen.


(c) u ist konstant.
Im Fall (a) und (b) ist die Kurve u regulär, d.h. der Tangentenvektor u̇(t)
verschwindet nirgends. Im Fall (b) und (c) ist die Lösung für alle t definiert.

Beweis.
Ist u̇(t0 ) = 0 für ein t0 ∈ J(η), so ist f (u(t0 )) = 0, also u(t0 ) ein kritischer
Punkt, und nach dem Eindeutigkeitssatz folgt u(t) = u(t0 ) für alle t ∈ . Ê
Sei jetzt also u nicht stationär und auch nicht injektiv, etwa u(t0 ) = u(t1 ) für
zwei Parameterwerte t0 < t1 aus J(η). Setzen wir v(t) = u(t0 + t), so ist v eine
auf I := J(η) − t0 definierte Lösung mit v(0) = v(τ ), τ = t1 − t0 > 0. Daher
existiert

T := inf {t ∈ I | t > 0, v(t) = v(0)} .


102 § 5 Einführung in die qualitative Theorie

Es gibt dann Zahlen tn > 0 mit tn → T und v(tn ) = v(0). Wäre T = 0, d.h.
tn → 0, so würde folgen
1 
v̇(0) = lim v(tn ) − v(0) = 0,
n→∞ tn
also wären v und damit auch u stationär. Somit ist T > 0 und

v(T ) = lim v(tn ) = v(0) .


n→∞

Da I offen ist, ist y(t) := v(T + t) in einer Nullumgebung erklärt, und dort
ist ẏ(t) = f (y(t)), y(0) = v(T ) = v(0). Nach dem Eindeutigkeitssatz folgt
y(t) = v(t) = v(T + t) nicht nur in einer Nullumgebung, sondern auch auf I.
Nunmehr können wir v zu einer T –periodischen, auf ganz definierten Lösung Ê
fortsetzen ( ÜA , z.B. t → v(t − T ) für T ≤ t ≤ 2T ). Dies liefert eine T –
periodische Fortsetzung von u. 2

1.4 Hamiltonsche und dissipative Systeme


(a) Ein Hamiltonsches System hat die Gestalt
∂H
q̇k = (q1 , . . . , qN , p1 , . . . , pN ) (k = 1, . . . , N ),
∂pk
∂H
ṗk = − (q1 , . . . , qN , p1 , . . . , pN ) (k = 1, . . . , N ),
∂qk
hierbei ist H : Ê 2N
⊃Ω→ Ê eine C –Funktion, die Hamilton–Funktion.
2

H ist längs jeder Lösung t → (q(t), p(t)) = (q1 (t), . . . , pN (t)) konstant,
denn nach der Kettenregel gilt
N  
d  ∂H ∂H
H(q(t), p(t)) = (q(t), p(t)) q̇k (t) + (q(t), p(t)) ṗk (t) = 0 .
dt ∂qk ∂pk
k=1

Aus Sicht der Mechanik ist das der Energieerhaltungssatz; die Konstante E
heißt Gesamtenergie der betreffenden Bahn. Allgemein nennen wir Funktionen,
die auf den Lösungen einer DG konstant sind, erste Integrale oder Erhal-
tungsgrößen. Der Fall N = 1 wird in Abschnitt 3 diskutiert.
Eine weitere Eigenschaft Hamiltonscher Systeme ist die Divergenzfreiheit des
zugehörigen Vektorfeldes. Bezeichnen wir dieses mit f , so gilt wegen H ∈ C2 (Ω)


N

N  
∂ ∂H ∂ ∂H
div f = + − = 0.
∂qk ∂pk ∂pk ∂qk
k=1 k=1

Für divergenzfreie Systeme gilt der Satz von Liouville über die Volumentreue
des Flusses, vgl. 6.3.
1 Autonome Systeme 103

Beispiel: Das ungedämpfte Pendel. Die Winkelauslenkung ϕ(t) aus der


unteren Ruhelage genügt der DG
ϕ̈ + ω 2 sin ϕ = 0 mit ω = g/l .
Durch Umskalierung q(t) := ϕ(t/ω) erhält diese die Gestalt q̈ + sin q = 0 ; das
zugehörige System 1. Ordnung lautet q̇ = p , ṗ = − sin q . Dieses ist hamiltonisch
mit der Hamilton–Funktion
1
H(q, p) = 2 p2 − cos q + c .
Die Konstante c wählen wir so, dass min H = H(0, 0) = 0 wird, setzen also
c = 1. Dann lautet der Energierhaltungssatz
1
2
p2 + 1 − cos q = const = E längs jeder Lösung t → (q(t), p(t)) .

(b) Das gedämpfte Pendel wird bei einer zur Geschwindigkeit proportiona-
len Dämpfung durch die DG q̈ + D(q) q̇ + sin q = 0 bzw. das System
q̇ = p , ṗ = − D(q) p − sin q
beschrieben. Dabei ist D(q) ≥ 0 ein von der Auslenkung q abhängiger Dämp-
fungsfaktor. Für das zugehörige Vektorfeld f (q, p) = (p, −D(q) p − sin q) gilt
div f (q, p) = − D(q) ≤ 0 .
Allgemein heißt ein System ẏ = f (y) mit div f ≤ 0 gedämpft oder dissipa-
tiv. Gedämpfte mechanische Systeme werden häufig durch Differentialgleichun-
gen
∂H ∂H N
q̇k = (q, p) , ṗk = − (q, p) − Dik (q)pi
∂pk ∂qk i=1

beschrieben. Für das zugehörige Vektorfeld f ergibt sich



N
div f (q, p) = − Dkk (q) ≤ 0 ,
k=1

falls Spur (D) ≥ 0. Weiteres zu gedämpften Systemen in 5.5, 5.6.

1.5 Linearisierung in Gleichgewichtspunkten


Sei x0 ein Gleichgewichtspunkt eines autonomen Systems
(∗) ẏ = f (y) ,
d.h. f (x0 ) = 0. Da f in x0 differenzierbar ist, gilt mit A := Df (x0 )
f (x0 + h) = Ah + R(h) , wobei lim R(h)/h = 0 .
h→0

Verläuft die Lösungkurve t → u(t) nahe bei x0 , so gilt für v(t) := u(t) − x0
104 § 5 Einführung in die qualitative Theorie

v̇(t) = u̇(t) = f (u(t)) = f (x0 + v(t)) = Av(t) + R(v(t)) ,

d.h. mit guter Näherung v̇ = Av. Dies legt es nahe, eine Verwandtschaft des
Phasenbildes von (∗) nahe x0 mit dem Phasenbild des linearisierten Systems

(∗∗) ẏ = Ay

nahe 0 zu vermuten. Eine allgemeine Auskunft gibt der

Linearisierungssatz von Grobman–Hartman (1959/60).


Es sei x0 ein hyperbolischer Gleichgewichtspunkt des Systems (∗); d.h. die
Matrix A = Df (x0 ) besitze keine rein imaginären Eigenwerte.
Dann ist das Phasenbild des Systems (∗) nahe x0 dem Phasenbild der Lineari-
sierung (∗∗) nahe 0 in folgendem Sinne ähnlich:
Es gibt Umgebungen U von x0 , V von 0 und eine bijektive, stetige Abbildung
h : U → V mit stetiger Umkehrabbildung h−1 , so dass

ϕ(t, η) = h−1 (etA h(η)) für η ∈ U

gilt, solange die rechte Seite Sinn macht.

Bemerkung. Dass h ein Diffeomorphismus ist, ist ohne weitere Zusatzvoraus-


setzungen nicht gesichert. Für Beispiele, eine Diskussion dieses Satzes und den
Beweis verweisen wir auf Hartman [20], IX:7, IX:12.
Der qualitative Verlauf der Lösungen von (∗) in der Nähe hyperbolischer Gleich-
gewichtspunkte läßt sich hiernach durch das Verhalten der Lösungen des linea-
risierten Systems (∗∗) beschreiben. Ein Beispiel wird in Abschnitt 3 gegeben.
Anders steht es bei nicht hyperbolischen Gleichgewichtspunkten. Dazu ein

1.6 Beispiel. Für das System


 
ẋ1 = x2 + c x1 x21 + x22 , ẋ2 = − x1 + c x2 x21 + x22 ,
ist (0, 0) der einzige
 Gleichgewichtspunkt. Das linearisierte System ẏ = Ay hat
die Matrix A = −10 10 mit Eigenwerten i, −i; dessen nichtstationäre Orbits
sind im Uhrzeigersinn durchlaufene Kreise mit Mittelpunkt (0, 0) ÜA .
Die nichtkonstanten Lösungen des Originalsystems besitzen Darstellungen
x1 (t) = r(t) cos Θ(t) , x2 (t) = r(t) sin Θ(t) .
Für solche, oft sehr nützliche Polardarstellungen gilt ÜA

x1 ẋ1 + x2 ẋ2 = r ṙ , x1 ẋ2 − x2 ẋ1 = r 2 Θ̇(t) .


Im vorliegenden Fall ergibt sich ÜA

x1 ẋ1 + x2 ẋ2 = c r 4 , x1 ẋ2 − x2 ẋ1 = −r 2 ,


2 Phasenportraits linearer Systeme in der Ebene 105

also Θ̇ = −1 und ṙ = c r 3 . Lösen wir diese separierte DG, so erkennen wir


ÜA : Für c > 0 wächst r(t) monoton und wird in endlicher Zeit unbeschränkt.
Für c < 0 ergibt sich lim r(t) = 0.
t→∞
Das Phasenbild des gegebenen Systems besteht für jedes c = 0 aus Spiralen, es
besteht also keine Ähnlichkeit mit dem Phasenbild der Linearisierung. Die ge-
schlossenen Orbits des linearisierten Systems brechen schon bei kleinen Störun-
gen zu Spiralen auf!

2 Phasenportraits linearer Systeme in der Ebene


2.1 Transformation auf reelle Normalform
Im Hinblick auf das Prinzip 1.5 der Linearisierung studieren wir als erstes die
Phasenportraits linearer 2 × 2–Systeme ẏ = Ay mit A = 0. Wir stellen im fol-
genden die wichtigsten Typen vor. Um diese systematisch erfassen zu können,
nehmen wir mit einer reellen, invertierbaren Matrix S eine Koordinatentrans-
formation
y = Sx , x = S −1 y .
vor. Das System ẏ = Ay ist dann äquivalent zum System
(∗) ẋ = Bx mit B = S −1 AS .
Wir zeigen anschließend: Durch passende Wahl von S läßt sich immer erreichen,
dass B eine der drei Normalformen
     
λ1 0 λ 1 − −ω
, ,
0 λ2 0 λ ω −
mit reellen Einträgen annimmt. Skizzieren wir in jedem dieser drei Fälle die
möglichen Phasenportraits für (∗), so entstehen diejenigen für ẏ = Ay als Bilder
unter der linearen Abbildung x → Sx.

2.2 Reell–diagonalähnliche Matrizen


 λ1
Sei A diagonalähnlich über Ê, also S −1
AS = 0
0
λ2
. Das System (∗)

ẋ1 = λ1 x1 , ẋ2 = λ2 x2 hat die Lösungen x1 (t) = ξ1 eλ1 t , x2 (t) = ξ2 eλ2 t .


Für ξ1 · ξ2 = 0 erfüllen die Orbits die Gleichung |x1 |λ2 |ξ2 |λ1 = |x2 |λ1 |ξ1 |λ2 .
λ2
(a) Für λ2 < λ1 < 0 , also k := λ1
> 1 lautet diese Gleichung

|x2 | = c |x1 |k mit k := λ2


λ1
> 1, c = |ξ2 | · |ξ1 |−k .

Beachten wir noch, dass x1 (t)2 + x2 (t)2 für t → ∞ monoton gegen Null geht,
so erhalten wir für ẋ = Bx das linke und für ẏ = Ay das rechte der folgenden
Phasenportraits
106 § 5 Einführung in die qualitative Theorie

x2 y2
6 6

- -
x1 y1

Wir sprechen von einem echten oder y2


zweitangentigen Knoten im Ursprung. 6
(b) Im Fall λ1 = λ2 < 0 erhal-
ten wir für (∗) das nebenstehende Por-
trait, das unter linearen Abbildungen
unverändert bleibt. Wir sprechen von -
y1
einem Sternpunkt.
(c) Im Fall 0 < λ1 ≤ λ2 erhalten wir
dieselben Phasenportraits, nur mit um-
gekehrtem Durchlaufsinn. Das ergibt
sich durch Zeitumkehr ÜA .
(d) Ist λ1 < 0 und λ2 = 0, so ergibt sich folgendes Phasenportrait für (∗) und
rechts daneben ein lineares Bild hiervon.
x2 y2
6 6

- -
x1 y1

Die kritischen Punkte bilden eine Gerade (entarteter Fall). Für 0 = λ2 < λ1
erhalten wir dasselbe Phasenportrait, nur mit umgekehrtem Durchlaufsinn.
2 Phasenportraits linearer Systeme in der Ebene 107

(e) Im Fall λ2 < 0 < λ1 setzen wir k := − λλ21 . Ist ξ1 = x1 (0) = 0 , so gilt für
die Lösungen

x2 = ± c |x1 |−k mit k > 0 und c = ± ξ2 |ξ1 |k .

Bei den folgenden Phasenportraits wird der Ursprung ein Sattelpunkt genannt.

x2 y2
6 6

x y1
-1 -

2.3 Nichtdiagonalähnliche Matrizen


Ist A nichtdiagonalähnlich über , so besitzt A nur einen einzigen und damit
reellen Eigenwert λ. Wir betrachten den Fall λ < 0. Nach § 3 : 2.9 gilt
 
λ 1
S −1AS = mit einer geeigneten invertierbaren Matrix S.
0 λ

Die Lösungen des zu S −1 AS gehörigen AWP

ẋ1 = λx1 + x2 , x1 (0) = ξ1


ẋ2 = λx2 , x2 (0) = ξ2

erhalten wir, indem wir erst die letzte Gleichung lösen und mit dieser Lösung
in die erste Gleichung gehen. Variation der Konstanten ergibt

x1 (t) = (ξ1 + ξ2 t) eλt , x2 (t) = ξ2 eλt .

(Dasselbe Ergebnis ergibt sich aus § 3 : 1.6 (a).) Im Fall ξ2 = 0 ist

ẋ1 (t) x1 (t) 1 ξ1 + ξ2 t 1


= + = + .
ẋ2 (t) x2 (t) λ ξ2 λ
108 § 5 Einführung in die qualitative Theorie

Für große Werte von t haben x1 (t) und x2 (t) dasselbe Vorzeichen, nämlich das
von ξ2 . Ferner strebt ẋ2 (t)/ẋ1 (t) für t → ∞ von oben her gegen Null. Das ergibt
folgende Phasenportraits mit dem Ursprung als unechtem oder eintangentigem
Knoten.
x2 y2
6 6

- -
x1 y1

Der Fall λ > 0 ergibt sich durch Zeitumkehr.


ÜA Diskutieren Sie den Fall λ = 0.

2.4 Nichtreelle Eigenwerte


Wir nehmen an, dass λ = − +iω mit ω > 0 ein Eigenwert von A ist. Dann hat
A zwei verschiedene komplexe Eigenwerte λ, λ, ist also diagonalähnlich über .
Ê
Ist w = u + iv mit u, v ∈ 2 ein Eigenvektor zum Eigenwert λ, so ist u − iv
ein davon linear unabhängiger Eigenvektor zum Eigenwert λ, also gilt v = 0.
Ê
Dann sind u, v linear unabhängig über , denn im Fall u = αv wären auch
u ± iv Vielfache von v. Aus Aw = λw folgt durch Vergleich von Real– und
Imaginärteil

Au = − u − ω v , Av = ω u − v .

Bezüglich der Basis (u, v) des Ê2


hat T : x → Ax also die Matrix
 
− ω
S −1 AS = =: B ,
−ω −

wobei S die Spalten u und v hat. Die Matrix B ist also der Prototyp aller reellen
2 × 2–Matrizen mit nichtreellen Eigenwerten.
Die Gleichung ẋ = Bx für x = (x1 , x2 ) bedeutet bei komplexer Schreibweise
z(t) = x1 (t) + ix2 (t) einfach ż(t) = λz(t), also ist z(t) = z(0) eλt . Schreiben wir
3 Die Differentialgleichung ẍ = F (x) 109

z(0) = r eiϕ , so erhalten wir als allgemeine reellwertige Lösung von ẋ = Bx

x1 (t) = r e−t cos(ωt + ϕ) , x2 (t) = r e−t sin(ωt + ϕ) .

Wir erhalten im Fall = 0 die Phasenportraits einer periodischen Bewegung.


x2 y2
6 6

- -
x1 y1

Das ist neben dem entarteten Fall 2.2 (d) der einzige, wo der Gleichgewichts-
punkt (0, 0) (hier Zentrum genannt) nicht hyperbolisch ist. Im Fall > 0
erhalten wir einen Spiralpunkt (Wirbelpunkt):
. .
x2 y2

x1 y1

. . . .

Im Fall < 0 drehen sich wieder die Richtungspfeile um.

3 Die Differentialgleichung ẍ = F (x)


3.1 Physikalische Deutung
Wir deuten die DG ẍ = F (x) als Newtonsche Bewegungsgleichung eines Teil-
chens mit einem Freiheitsgrad unter dem Einfluss einer nur vom Lageparameter
110 § 5 Einführung in die qualitative Theorie

x abhängigen Kraft F . F sei C1 –differenzierbar auf einem offenen Intervall I.


Das zugehörige System 1. Ordnung

(H) ẋ = y , ẏ = F (x) in Ω = I × Ê
ist hamiltonsch mit der Hamilton–Funktion

1
x
H(x, y) = 2 y 2 + U (x) , U (x) = − F (s) ds .
x0

Für U und damit für H haben wir eine additive Konstante frei, demgemäß
können wir über x0 ∈ I noch verfügen.

3.2 Energieniveaulinien und implizite Lösungsformel


Sei t → (x(t), y(t)) eine Lösung von (H) mit x(t0 ) = x0 . Der Energieerhaltungs-
satz 1.4 liefert
1
2 y(t)2 + U (x(t)) = const =: E .

Der Orbit liegt also in der Niveaumenge


& '
N= (x, y) ∈ I × Ê | H(x, y) = 12 y 2
+ U (x) = E .

Liegen auf N keine kritischen Punkte, (y, F (x)) = (0, 0) für alle (x, y) ∈ N ,
so kann N lokal durch Gleichungen y = ϕ(x) bzw. x = ψ(y) mit geeigneten
C2 –Funktionen ϕ bzw. ψ beschrieben werden (Satz über implizite Funktionen,
Bd. 1, § 22 : 5.5). Die Auflösung nach y ergibt y = 2(E − U (x)) in der oberen
und y = − 2(E − U (x)) in der unteren Halbebene. Somit erhalten wir

ẋ(t) = 2(E − U (x(t))) oder ẋ(t) = − 2(E − U (x(t))) .

Diese separierte DG führt nach bekanntem Muster (Bd. 1, § 13 : 3) auf die im-
plizite Lösungsformel

x(t)
ds
t − t0 = ± .
2(E − U (s))
x0

In den meisten physikalisch interessanten Fällen (z.B. beim ungedämpften Pen-


del mit U (s) = 1 − cos s ) läßt sich für den Integranden keine Stammfunktion
in geschlossener Form angeben, geschweige denn eine explizite Auflösung nach
x(t). Dennoch können wir wichtige Aussagen über das qualitative Verhalten der
Lösungen machen, wie im folgenden ausgeführt wird.
3 Die Differentialgleichung ẍ = F (x) 111

3.3 Periodische Bewegung in einer Potentialmulde


Das Potential besitze im Intervall [a, b] ⊂ I eine Mulde:
U (a) = U (b) =: E ,
U (x) < E für a < x < b ,
U  (a) < 0 und U  (b) > 0 .
Gemäß 3.1 setzen wir U (x0 ) = 0 an einer Minimumstelle x0 von U . Wir betrach-
ten im folgenden Lösungen t → (x(t), y(t)) des Systems (H) ẋ = y, ẏ = F (x)
mit Gesamtenergie E.
Satz. Jede auf dem Energieniveau E
startende Lösung ist periodisch, besitzt 6
die volle Niveaumenge E
N = {(x, y) | H(x, y) = E, a ≤ x ≤ b} U
als Orbit und durchläuft diesen im Uhr-
zeigersinn. Die Periode ist
-
a x0 b x
b
ds
T = 2 . y
2(E − U (s)) 6 y= 2(E − U(x))
a

Wir können uns die Verhältnisse veran-


schaulichen, indem wir uns eine Kugel -
vorstellen, die auf der Konturlinie von x
U rollt und in der Höhe E losgelassen
wurde. Abnahme der potentiellen be-
wirkt Zunahme der kinetischen Energie y=− 2(E − U(x))
und umgekehrt.

Beweis.

Es genügt, die Lösung mit x(0) = x0 , y(0) = 2E zu betrachten. Denn ist
diese periodisch und durchläuft ganz N , so erreicht sie jeden auf N gelegenen
Startpunkt.
(a) Die Lösung existiert für alle Zeiten. Denn x(t) kann das Intervall [a, b]
nicht verlassen, andernfalls wäre U (x(t)) > E wegen U  (a) < 0, U  (b) > 0,
im Widerspruch √ √ y(t)) ∈ N . Also bleibt (x(t), y(t)) in der kompakten
zu (x(t),
Menge [a, b]×[− 2E, 2E] , und die Behauptung folgt aus dem Kompaktheits-
satz 1.1 (c).
(b) Offensichtlich liegt N symmetrisch zur x–Achse.
b  −1/2
(c) Konvergenz des Integrals 2(E − U (s)) ds. Nach Voraussetzung
a
über U  können wir δ > 0 so wählen, dass U  (x) ≥ 12 U  (b) > 0 für b−δ < x < b.
112 § 5 Einführung in die qualitative Theorie

Daher ist 2(E − U (s)) = 2(U (b) − U (s)) = 2(b − s)U  (ϑ) ≥ (b − s)U  (b) für
s ∈ ]b − δ, b[ , und der Integrand hat in einer Umgebung von b die Majorante
 −1/2 b  −1/2
(b − s)U  (b) . Daher existiert 2(E − U (s)) ds . Entsprechendes
x0
gilt am linken Randpunkt a.
(d) Der Teil von N in der oberen Halbebene y ≥ 0 wird voll durchlaufen.
Nach 3.2 gilt mit t0 = 0

x(t)
ds
(∗) t = ,
2(E − U (s))
x0

solange ẋ(t) = y(t) = 2(E − U (x(t))) > 0 gilt, d.h. solange die Lösung in der
oberen Halbebene verbleibt. Nach (c) ist die rechte Seite von (∗) beschränkt,
solange x(t) im Intervall ]a, b[ bleibt. Daher kann (∗) weder für beliebig große
noch für beliebig kleine t bestehen bleiben; irgendwann muss also die Lösung
die obere Halbebene verlassen. Aus y(t) = 0 folgt U (x(t)) = E , also nach
Voraussetzung über U entweder x(t) = a oder x(t) = b. Wegen ẋ(t) > 0 für
y(t) > 0 gibt es somit ein erstes t2 > 0 mit x(t2 ) = b und ein erstes t1 < 0
mit x(t1 ) = a. Nach dem Zwischenwertsatz nimmt x(t) in [t1 , t2 ] jeden Wert
aus [a, b] an und zwar genau einmal, denn nach Konstruktion von t1 , t2 ist
ẋ(t) > 0 in ]t1 , t2 [. Da der obere Teil von N die Gleichung y = 2(E − U (x))
mit a ≤ x ≤ b erfüllt, wird dieser von der Lösung voll durchlaufen, und zwar
wegen ẋ(t) > 0 von links nach rechts.
(e) Periodizität der Lösung. Aus (∗) folgt

1 b  −1/2
t2 − t 1 = T mit T := 2 2(E − U (s)) ds, .
2 a

Nun liefern u(t) := x(2t2 − t), v(t) = −y(2t2 − t), wie leicht nachprüfbar ist,
eine nach (a) für alle t definierte Lösung des AWP

u̇ = v , v̇ = F (u) , u(t2 ) = x(t2 ) , v(t2 ) = y(t2 ) = 0 .

Nach dem Eindeutigkeitssatz folgt u(t) = x(t), v(t) = y(t), insbesondere

x(t1 + T ) = u(t1 + T ) = x(t1 ) , ebenso y(t1 + T ) = − y(t1 ) = y(t1 ) .

Wie im Beweis 1.3 (b) folgt, dass x und y beide T –periodisch sind. Nach Wahl
von t1 und t2 ist T die kleinste Periode. Aus Symmetriegründen (vgl. (b))
durchläuft (u(t), v(t)) für t2 ≤ t ≤ t2 + 12 T = t1 + T den unteren Teil von
N , diesmal von rechts nach links. 2
3 Die Differentialgleichung ẍ = F (x) 113

3.4 Phasenportraits in der Nähe von Gleichgewichtspunkten


Sei (x0 , 0) ein Gleichgewichtspunkt von (H), also U  (x0 ) = −F (x0 ) = 0. Ferner
sei U  (x0 ) = 0. Wir setzen wieder das Potential an der Stelle x0 auf Null. Dann
gilt folgender, am Ende von 3.4 bewiesener
Hilfssatz. Es gibt eine C1 –dif-
ferenzierbare Funktion h in einer Null-
umgebung mit | U (x + x0 ) | = 12 h(x)2 6 U
und h (0) = | U  (x0 ) | .

Wir betrachten die Orbits für Energie-


werte 0 < |E| < 1 ergibt sich in jedem -
Fall eine stationäre Lösung (x0 , 0). x0 x

(a) Im Fall U (x0 ) > 0 kann es nur
für E ≥ 0 Lösungen geben. Für kleine y
6
E > 0 sind diese nach 3.3 periodisch.
Die Niveaulinien erfüllen die Gleichung • -
x
h(x − x0 )2 + y 2 = 2E ,
sind also für kleine Energiewerte diffeo-
morphe Bilder von Kreisen.
6

(b) Im Fall U (x0 ) < 0 ist der Graph -
von H in der Nähe von (x0 , 0) sattel- x0 x
artig. Für Energiewerte 0 < |E|  1
erfüllen die Orbits jetzt die Gleichung U
y − h(x − x0 ) = 2E ,
2 2

sind also diffeomorph verbogene Hy- y


6
perbeln. Die vier Linien mit den Glei-
chungen y = h(x − x0 ), bzw. y =
−h(x − x0 ) für x > x0 , bzw. x < x0
heißen Separatrizen. -
ÜA Verifizieren Sie den eingezeichne- x
ten Durchlaufsinn der Orbits.
Die Aussage (b) stellt eine schwache
Form des Linearisierungssatzes 1.5 dar.

Das an der Stelle (x0 , 0) linearisierte System lautet

(L) u̇ = v, v̇ = ω 2 u mit ω = −U  (x0 ) ;


dessen Orbits wurden in 2.2 dargestellt.
114 § 5 Einführung in die qualitative Theorie

Der Diffeomorphismus
     
x

u
=
h(x) 6U
y v y
bildet lediglich Orbitstücke von (H) als
Mengen auf Orbitstücke von (L) ab.
(c) Die nebenstehende Skizze fasst das
Ergebnis der bisherigen Diskussion zu- -
x
sammen. y
6
Beweis des Hilfssatzes. Es genügt, den
Fall U  (x0 ) < 0 zu behandeln; im Fall
U  (x0 ) > 0 betrachten wir −U statt
-
U . Wegen U  (x0 ) = 0 gilt x


1
U (x0 + x) = d
dt
U  (x0 + tx) dt
0

1
= x U  (x0 + tx) dt = x f (x),
0
1
wobei f (x) := U  (x0 + tx) dt als Parameterintegral in einer Nullumgebung
0
stetig ist und f (0) = U  (x0 ) gilt. Entsprechend erhalten wir wegen U (x0 ) = 0
1 1 1
U (x0 + x) = d
dt
U (x0 + tx) dt = x U  (x0 + tx) dt = x2 t f (tx) dt
0 0 0

1
= − 12 x2 g(x) mit g(x) := −2 t f (tx) dt .
0
Es gilt
g(0) = − f (0) = − U  (x0 ) > 0 und g(x) = g(0).
Wir wählen ein ε > 0 mit g(x) > 0 für |x| < ε und setzen
h(x) := x g(x) für |x| < ε .
Dann existiert h (0) = lim h(x)/x = g(0) = −U  (x0 ) . Nach Konstruktion
x→0
gilt U (x0 +x) = − 21 h(x) < 0 für 0 < |x| < ε, also ist h dort C2 –differenzierbar.
2

Aus h(x) h (x) = −U  (x0 + x) für 0 < |x| < ε folgt schließlich
x U  (x0 + x) U  (x0 )
lim h (x) = − lim = −  = h (0) . 2
x→0 x→0 h(x) x h (0)

Aufgabe. Drücken
 T Sie für einen periodischen Orbit das Zeitmittel der kineti-
schen Energie T1 0 21 y(t)2 dt über die Periode T mit Hilfe von T und der durch
 
den Orbit umschlossenen Fläche F aus. (Beachten Sie, dass x(t) in 0, 21 , T
monoton wächst und verwenden Sie die Substitutionsregel.)
3 Die Differentialgleichung ẍ = F (x) 115

3.5 Beschränkte Potentiale


Ê
Wir betrachten auf ganz definierte, nach unten beschränkte Potentiale U . Da
Ê
es auf additive Konstanten nicht ankommt, dürfen wir min{U (x) | x ∈ } = 0
voraussetzen.
Es gilt: 6
(a) Die Lösungen mit Gesamtenergie E
E > 0 existieren für alle Zeiten. U

(b) Ist U (x) < U (b) für alle x > b -


und U  (b) < 0, so durchläuft die in b x
y
(b, 0) startende Lösung mit Gesamt- 6
energie E = U (b) eine nach rechts of-
fene Schlaufe; insbesondere gilt
x(−t) = x(t), -
b x
y(−t) = −y(t),
lim x(t) = ∞.
t→∞

(c) Ist U nach oben beschränkt und


Ê
E > U (x) für alle x ∈ , so gibt es E
6
zwei Lösungen mit Gesamtenergie E
t → (x1 (t), y1 (t)) , U

t → (x2 (t), y2 (t)) , -


die in der skizzierten Weise verlaufen: x
Bei geeigneter Festlegung der Anfangs- y
werte und der Zeitkoordinate gilt 6
x2 (t) = x1 (−t) ,
-
y2 (t) = − y1 (−t) , x
lim x1 (t) = ∞ ,
t→∞
lim x1 (t) = − ∞.
t→−∞

Beweis. (a) Angenommen, die maximale Lösung t → (x(t), y(t)) existiere nur
für t < T < ∞. Wegen ẋ(t)2 = 2E − U (x(t)) ≤ 2E hätten wir für 0 < t < T
 t  √ √
| x(t) − x(0) | =  ẋ(s) ds  ≤ T 2E , | y(t) | = | ẋ(t) | ≤ 2E .
0
Aus dem Kompaktheitssatz 1.1 (c) würde die Existenz für alle t > 0 und damit
ein Widerspruch folgen. Entsprechend folgt die Existenz für t < 0. Nachweis
von (b) und (c) als ÜA : Zeigen Sie y(t) > 0 für t > 0. Verwenden Sie den
Eindeutigkeitssatz und die Formel (∗) von 3.3 (d) in Verbindung mit (a). 2
116 § 5 Einführung in die qualitative Theorie

3.6 Das ungedämpfte Pendel U 6


(a) Wir kommen auf die Gleichung des
ungedämpften Pendels 1.4
ẍ = − sin x
-
zurück. Das Potential mit U (0) = 0 ist x
y
U (x) = 1 − cos x . 6
Das Phasenportrait ergibt sich unmit-
telbar aus den Betrachtungen 3.4 und
3.5 (c). -
x
(b) Für 0 < E < 2 erhalten wir peri-
odische Lösungen mit ellipsenförmigen
Orbits. Der maximale Pendelausschlag
ist a := arccos(1 − E).
Für E = 2 besteht die Niveaumenge N = {(x, y) | H(x, y) = 2, −π ≤ x ≤ π}
aus den beiden Gleichgewichtspunkten (−π, 0) und (π, 0) und den beiden Sepa-
ratrizen
     
C1 = x, 2 cos x  |x| < π , C2 = x, −2 cos x  |x| < π .
2 2

Für die auf C1 verlaufende Lösung gilt

lim (x(t), y(t)) = (−π, 0) , lim (x(t), y(t)) = (π, 0) .


t→−∞ t→∞

Die zu den Energieniveaus E > 2 gehörenden Lösungen entsprechen den Über-


schlägen des Pendels. Nach der Theorie sind diese Lösungen injektiv; physika-
lisch gesehen handelt es sich jedoch um periodische Vorgänge! Diese scheinbare
Diskrepanz kommt daher, dass wir als Phasenraum die Ebene zugrundegelegt
hatten. In dieser werden Zustände, deren Winkelkoordinate sich um Vielfache
von 2π unterscheiden, als verschieden angesehen.
Den der Physik angemessenen Phasen-
raum erhalten wir durch Aufwickeln
der Ebene zu einem Zylinder mit Um-
fang 2π. In diesem Phasenraum schlie-
ßen sich die zuletzt genannten Orbits.
Dieses Beispiel zeigt, dass für eine ad-
äquate Modellierung von Phasenräu-
Ê
men Gebiete des n nicht immer aus-
reichen. Die hierfür geeigneten mathe-
matischen Modelle sind Mannigfaltig-
keiten, siehe Bd. 3, §8.
4 Stabilität von Gleichgewichtspunkten 117

Aufgaben (a) Ein fester und ein an einer Feder befestigter beweglicher Magnet
ziehen sich mit einer Kraft an, die umgekehrt proportional zum Abstandsqua-
drat ist, und zwar gelte für die Auslenkung x aus der Ruhelage
ẍ + x = (x − 2)−2 (x < 2) .
Geben Sie die Hamilton–Funktion H mit H(0, 0) = 0 an, bestimmen Sie die
Gleichgewichtslagen, und skizzieren Sie ein Phasenportrait.
(b) Skizzieren Sie das Phasenportrait für die Gleichung
ẍ + x − x3 = 0.
(Der Term x − x3 kann als Rückstellkraft einer Feder mit nichtlinearer Cha-
rakteristik interpretiert werden.)

4 Stabilität von Gleichgewichtspunkten


4.1 Stabile und attraktive Gleichgewichtspunkte
Wir betrachten ein autonomes System ẏ = f (y) auf Ω ⊂ Ê
n
mit einem
Gleichgewichtspunkt x0 ∈ Ω, d.h f (x0 ) = 0.
(a) Das System heißt stabil in x0 (oder x0 ein stabiler Gleichgewichts-
punkt), wenn es zu jedem ε > 0 ein δ > 0 gibt mit
ϕ(t, x) − x0  < ε für alle t ≥ 0 , falls x − x0  < δ .
Das schließt die Existenz von ϕ(t, x) für alle t ≥ 0 ein.
Das System heißt instabil in x0 , wenn es dort nicht stabil ist.
Stabilität in x0 bedeutet, dass die in Nachbarpunkten von x0 startenden Lösun-
Ê
gen auf dem vollen Zeitintervall + kontrollierbar bleiben. Im Kontrast hier-
zu liefert die fundamentale Theorie § 2 : 7.4 nur die Kontrollierbarkeit auf be-
schränkten Intervallen.
(b) Der Gleichgewichtspunkt x0 heißt attraktiv, wenn es ein > 0 gibt mit
lim ϕ(t, x) = x0 , falls x − x0  < .
t→∞

(c) Ein stabiler und attraktiver Gleichgewichtspunkt wird asymptotisch sta-


bil genannt.
Beispiele. (i) Einteilchensysteme ẋ = y, ẏ = F (x). Hat das Potential in Um-
gebung von x0 eine Mulde, so ist der Punkt (x0 , 0) stabil, aber nicht attraktiv,
vgl. 3.3 und 3.4. Der Kreuzungspunkt der Separatrizen in 3.4 ist ein instabiler
Gleichgewichtspunkt. Für solche Systeme gibt es keine attraktiven Gleichge-
wichtspunkte. Erst bei Mitberücksichtigung der Reibung kann Attraktivität ins
Spiel kommen. Beim gedämpften Pendel beispielsweise ist die Ruhelage asymp-
totisch stabil, vgl. 5.7 (b)
118 § 5 Einführung in die qualitative Theorie

(ii) Es gibt attraktive Gleichgewichtslagen, die nicht stabil sind .


Für ein von Vinograd 1957 angege-
6
benes ebenes System mit dem neben-
stehend skizzierten Phasenportrait ist
der Ursprung x0 = 0 attraktiv, aber rη
nicht stabil: Im ersten Quadranten
existiert ein größter“ Orbit mit

lim ϕ(t, η) = lim ϕ(t, η) = 0. -
t→−∞ t→∞
Wählen wir η wie skizziert nahe 0 und
setzen ε = η, so gibt es in beliebiger
Nähe von 0 Punkte x auf dem Orbit
durch η mit { ϕ(t, x) | t ≥ 0 } ⊂ Kε (0).
Näheres hierzu in Hahn [18] § 40.
(iii) ÜA Klassifizieren Sie die Gleichgewichtslagen in Abschnitt 2.

4.2 Das Stabilitätsverhalten linearer Systeme


Satz. Für ein lineares System ẏ = Ay ist der Nullpunkt
(a) asymptotisch stabil genau dann, wenn alle Eigenwerte von A, d.h. alle kom-
plexen Nullstellen des charakteristischen Polynoms, negativen Realteil haben,
(b) stabil genau dann, wenn Re λ ≤ 0 für jeden Eigenwert λ von A gilt und
im Fall Re λ = 0 die geometrische Vielfachheit von λ mit der algebraischen
übereinstimmt.
(c) Gilt Re λ < für alle Eigenwerte λ von A, so gibt es eine Konstante c ≥ 1
mit
Ê
etA η ≤ c et η für alle η ∈ n, t ≥ 0 .

Diese Aussagen ergeben sich aus § 3 : 2.7, 2.8, 2.10 ÜA .

4.3 Das Prinzip der linearisierten Stabilität (Eigenwertkriterium)


Satz (Ljapunow, Poincaré 1892). Für einen Gleichgewichtspunkt x0 des
Systems ẏ = f (y) sei A = Df (x0 ) die Matrix der Linearisierung. Dann gilt:
(a) x0 ist asymptotisch stabil, wenn alle Eigenwerte von A negative Realteile
haben.
(b) Gibt es einen Eigenwert mit positivem Realteil, so ist x0 instabil .
Der Satz ist eine unmittelbare Folge des Linearisierungssatzes 1.5 und der Stabi-
litätsaussagen 4.2 für lineare Systeme. Da der Beweis des Linearisierungssatzes
aufwendig ist, geben wir für die Aussage (a) einen elementaren Beweis, der
auf Perron 1929 zurückgeht. Einen Beweis der zweiten Behauptung 4.3 fin-
den Sie in Hirsch–Smale–Devaney [10] Ch. 9, § 2, Walter [12] § 29 VIII oder
Coddington–Levinson [17] Ch. 13, Sec. 1.
4 Stabilität von Gleichgewichtspunkten 119

Beweis der Aussage (a).


O.B.d.A. sei x0 = 0. Wir setzen 2 := max{Re λ | λ ist Eigenwert von A} < 0.
(i) Nach 4.2 (c) gibt es eine Konstante c ≥ 1 mit

etA η ≤ c et  η für alle η ∈ Ê n


und t ≥ 0 .

(ii) Da f an der Stelle 0 differenzierbar ist, besteht die Zerlegung


g (y )
f (y) = Ay + g(y) mit lim = 0.
y →0  y 
Zu jedem ε > 0 gibt es daher ein δ > 0 mit (c + 1) δ < ε und
y ≤ δ =⇒ g(y) ≤ ε y .

(iii) Sei 0 < ε ≤ − /2c und δ wie oben gewählt. Wir zeigen:
Für x < δ/c kann y(t) := ϕ(t, x) für wachsendes t ≥ 0 die Kugel Kδ (0)
nicht verlassen, existiert also für alle t ≥ 0 . Ferner gilt
1
y(t) ≤ c x e 2  t ≤ c x < δ < ε f ür t ≥ 0.
Das bedeutet wegen < 0 Stabilität und Attraktivität.
Zum Nachweis fixieren wir ein x mit x < δ/c ≤ δ und betrachten ein T ∈ J(x)
mit y(t) = ϕ(t, x) ∈ Kδ (0) für 0 ≤ t < T . Die nach (ii) bestehende Gleichung
ẏ(t) = Ay(t) + g(y(t))
fassen wir als inhomogenes lineares System auf und erhalten durch Variation
der Konstanten (vgl. § 3 : 1.4)
t
y(t) = etA x + e(t−s)A g(y(s)) ds .
0

Für 0 ≤ t < T folgt daraus mit (ii) und durch zweimalige Anwendung von (i)
t
y(t) ≤ etA x + e(t−s)A g(y(s)) ds
0
t
≤ c e t x + ε c e(t−s)  y(s) ds ,
0
also
t
e− t y(t) ≤ c x + ε c e− s y(s) ds .
0

Mit dem Gronwall-Lemma § 2 : 4.2 ergibt sich

e− t y(t) ≤ c x eε c t ,

und wegen ε c ≤ − /2, > 0, c x < δ folgt


120 § 5 Einführung in die qualitative Theorie

1
y(t) ≤ c x e 2  t < δ < ε für 0 ≤ t < T.

Somit kann y(t) in keinem Intervall [0, T [ ⊂ J(x) den Rand von Kδ (0) errei-
chen. Damit sind die Behauptungen bewiesen. 2

4.4 Grenzen der Linearisierungsmethode


Das Eigenwertkriterium gestattet es, unter geeigneten Voraussetzungen auf
asymptotische Stabilität oder auf Instabilität zu schließen. Für Systeme, bei
denen die linearisierte DG stabil, aber nicht asymptotisch stabil ist, sagt es
nichts aus.
(a) Dass in solchen Fällen alles möglich ist, zeigt das Beispiel

ẏ1 = y2 + c y1 (y12 + y22 ) , ẏ2 = − y1 + c y2 (y12 + y22 ) .

Die Linearisierungsmatrix im Nullpunkt ist für alle c durch


 0 1
A = −1 0
.

gegeben. Die Eigenwerte von A sind i und − i, also ist das linearisierte System
nach 4.2 im Nullpunkt stabil, aber nicht attraktiv. Für r := y12 + y22 ergibt
sich wie in 1.6 die DG ṙ = cr 3 ÜA , so dass für c < 0 asymptotische Stabilität,
für c > 0 aber Instabilität vorliegt.
(b) Für Hamiltonsche Systeme gibt das Eigenwertkriterium nichts her. Dies
zeigt schon das Beispiel von Abschnitt 3

ẋ = y , ẏ = F (x) = − U  (x) .

Hat U an der Stelle x0 einen Tiefpunkt mit U (x0 ) = ω 2 > 0, so ist der Gleich-
gewichtspunkt (x0 , 0) nach 3.4 (a) stabil, aber nicht attraktiv. Die Linearisie-
rungsmatrix A an der Stelle (x0 , 0) ist
 0 1
A = −ω 2 0
.

Diese besitzt die imaginären Eigenwerte ± i ω.


Für Gleichgewichtspunkte hamiltonscher Systeme läßt sich zeigen, dass das Ei-
genwertspektrum der Linearisierung immer punktsymmetrisch zum Nullpunkt
liegt, so dass sich mit Hilfe von 4.3 allenfalls über Instabilität entscheiden läßt.

5 Die direkte Methode von Ljapunow


5.1 Ljapunow–Funktionen
Die Ljapunowsche Methode zur Untersuchung der Stabilitätseigenschaften eines
Gleichgewichtspunkts x0 des Systems ẏ = f (y) besteht darin, eine Funktion V
mit folgenden Eigenschaften zu bestimmen:
5 Die direkte Methode von Ljapunow 121

V ist in einer Umgebung Ω0 ⊂ Ω von x0 stetig differenzierbar,


V (x0 ) = 0 ,
V (x) > 0 für x ∈ Ω0 und x = x0 ,
∂f V (x) := ∇V (x) , f (x) ≤ 0 in Ω0 .

Eine solche Funktion heißt Ljapunow–Funktion für den Gleichgewichtspunkt


x0 . Gilt zusätzlich

∇V (x) , f (x) < 0 für x ∈ Ω0 , x = x0 ,

so wird V eine strenge Ljapunow–Funktion für x0 genannt.


Die für Stabilitätsuntersuchungen entscheidende Eigenschaft einer Ljapunow–
Funktion besteht darin, dass diese längs jeder Lösung u abnimmt:
d
(∗) dt V (u(t)) = ∇V (u(t)) , u̇(t) = ∇V (u(t)) , f (u(t)) ≤ 0 ,
solange u(t) in Ω0 bleibt. Der Zusammenhang dieser Eigenschaft mit der Stabi-
lität in x0 wird wie folgt plausibel: Für jedes ε > 0 ist Ωε = {x ∈ Ω0 | V (x) ≤ ε}
wegen V (x0 ) = 0 eine Umgebung von x0 . Da x0 die einzige Nullstelle von V in
Ω0 ist, ziehen sich die Mengen Ωε für ε → 0 auf x0 zusammen. Ist Ωε kompakt,
so verläßt jede einmal in Ωε eintretende Lösung u für wachsendes t diese Menge
nicht mehr, denn es gilt

V (u(t)) ≤ V (u(0)) ≤ ε für t ≥ 0 .

Daraus folgt die Existenz von u(t) für alle t ≥ 0 und die Stabilität. Bei strengen
d
Ljapunow–Funktionen V ist dt V (u(t)) < 0. Wir machen plausibel, dass dann
lim V (u(t)) = 0 und daraus wieder
t→∞

lim u(t) = x0
t→∞

folgt. Letzteres beruht darauf, dass .


u
V die Rolle einer krummlinigen Ab-
standsfunktion zum Punkt x0 spielt.
{V < }
Das übrige machen wir uns anhand der
x
Figur klar: ∇V(x)
∇V (x) ist ein äusserer Normalenvek-
tor der Niveaumenge {V = ε}. Wegen f (x) x0
∇V (x) , f (x) < 0 dringen die Punk-
te u(t) durch den Rand {V = ε} in
die Umgebung {V < ε} ein.
Diese Plausibilitätsbetrachtungen
werden durch die folgenden Sätze
bestätigt. . .
122 § 5 Einführung in die qualitative Theorie

5.2 Der Stabilitätssatz von Ljapunow


(a) Existiert für einen Gleichgewichtspunkt x0 des Systems ẏ = f (y) eine
Ljapunow–Funktion V, so ist x0 stabil .
(b) Ist V eine strenge Ljapunow–Funktion für x0 , so ist x0 asymptotisch stabil .
Anwendungen dieser Aussagen folgen in 5.4–5.7.
Beweis.
(a) Wir dürfen x0 = 0 annehmen. Die Ljapunow–Funktion V sei in einer
Umgebung Ω0 des Nullpunkts definiert. Wir wählen ein r > 0 mit Kr (0) ⊂ Ω0 .
Für vorgegebenes ε > 0 mit 0 < ε ≤ r ist Sε = {x | x = ε} eine kompakte
Teilmenge von Ω0 , und V ist dort positiv. Also existiert
m(ε) := min {V (x) | x ∈ Sε } > 0 .
Da V im Nullpunkt stetig ist, gibt es ein δ mit 0 < δ < ε und
x < δ =⇒ V (x) < m(ε) .
Für x < δ fällt t → V (ϕ(t, x)) monoton. Also bleibt V (ϕ(t, x)) < m(ε) für
wachsendes t ≥ 0, und ϕ(t, x) kann die Sphäre Sε nicht erreichen, denn dort
ist V (x) ≥ m(ε).
Für x < δ existiert nach dem Kompaktheitssatz also ϕ(t, x) für alle t ≥ 0
und erfüllt die Bedingung ϕ(t, x) < ε.
(b) Nach (a) gibt es zu ε = r ein mit 0 < < r und
x < =⇒ ϕ(t, x) < r für alle t ≥ 0 .
Wir behaupten: Für x < gilt sogar lim ϕ(t, x) = 0.
t→∞

Sei ε ∈ ]0, [ vorgegeben. Nach (a) gibt es ein δ ∈ ]0, ε[ mit


(∗) η < δ =⇒ ϕ(t, η) < ε für alle t ≥ 0 .
Wir zeigen: Zu jedem x mit x < gibt es ein T ≥ 0 mit ϕ(t, x) < ε für
t ≥ T . Im Fall x < δ folgt das aus (∗) mit T = 0. Sei also δ ≤ x < .
Wegen < r ist nach Voraussetzung
M := max {∂f V (y) = ∇V (y) , f (y) | δ ≤ y ≤ r}
negativ. Es folgt
d
dt
V (ϕ(t, x)) = ∇V (ϕ(t, x)) , f (ϕ(t, x)) ≤ M,
also V (ϕ(t, x)) ≤ V (x) + t M , solange ϕ(t, x) ≥ δ gilt. Da V (ϕ(t, x)) nicht
negativ werden kann, muss es ein T > 0 geben mit ϕ(T, x) < δ.
Wegen des Eindeutigkeitssatzes gilt ϕ(t + T, x) = ϕ(t, ϕ(T, x)). Nach (∗) folgt
ϕ(t + T, x) < ε für t ≥ 0. 2
5 Die direkte Methode von Ljapunow 123

5.3 Der Instabilitätssatz von Tschetajew (Cetaev)

Eine Gleichgewichtslage x0 ∈ Ω des .


Systems ẏ = f (y) auf Ω ist instabil,
wenn es eine C1 –Funktion V auf ei-
ner Umgebung Ω0 ⊂ Ω von x0 und
ein Gebiet D ⊂ Ω0 mit folgenden Ei-
genschaften gibt: D
x0
x0 ∈ ∂D,
V > 0 und ∂f V > 0 in D,
V = 0 auf Ω0 ∩ ∂D. . .

Wir können uns das Gebiet D als krummes Halbkegelstück mit Spitze x0 vor-
stellen. Ein ebenes Beispiel liefern die Separatrizen in 3.4.
Beweis.
Sei o.B.d.A. x0 = 0 und r > 0 mit Kr (0) ⊂ Ω0 gewählt. Wir nehmen an,
x0 = 0 sei stabil und geben ein ε mit 0 < ε < r vor. Dann gibt es ein δ mit
0 < δ < ε und
(1) x < δ =⇒ Ê + ⊂ J(x) und ϕ(t, x) < ε für alle t ≥ 0 .

Wir fixieren ein x ∈ D mit x < δ, was wegen 0 ∈ ∂D möglich ist. Nach
Voraussetzung gilt V (x) > 0, und x gehört zur Menge

K := {y ∈ D | y ≤ ε , V (y) ≥ V (x)} ⊂ Kε (0) ⊂ Ω0 .

K ist beschränkt und abgeschlossen: Sei y = lim yn mit yn ∈ K. Dann folgt


n→∞
y ≤ ε, also y ∈ Ω0 und somit V (y) = lim V (yn ) ≥ V (x). Wegen V (x) > 0
n→∞
kann y nicht auf ∂D ∩ Ω0 liegen, da dort V = 0 gilt. Somit existiert
m := min {∂f V (y) | y ∈ K } > 0 ,
Letzteres wegen K ⊂ D. Solange ϕ(t, x) in K bleibt gilt
d
dt V (ϕ(t, x)) = ∂f V (ϕ(t, x)) ≥ m ,
somit
(2) V (ϕ(t, x)) ≥ V (x) + tm ,
insbesondere V (ϕ(t, x)) ≥ V (x). Wegen (1) könnten die Punkte ϕ(t, x) ∈ Ω0
für wachsendes t die Menge K also nur über ∂D ∩ Ω0 verlassen, was aber auch
unmöglich ist, da dort V = 0 gilt. Somit ist (2) für alle t ≥ 0 gültig, d.h.
V ist auf K unbeschränkt. Damit führt die Annahme der Stabilität auf einen
Widerspruch. 2
124 § 5 Einführung in die qualitative Theorie

5.4 Erste Integrale als Ljapunow–Funktionen


Eine C1 –Funktion W : Ω0 → Ê
heisst erstes Integral des Systems ẏ = f (y)
im Gebiet Ω0 , wenn W (u(t)) konstant ist für jede Lösung u, solange u(t) ∈ Ω0 .
Äquivalent dazu ist die Bedingung

∂f W (x) = ∇W (x) , f (x) = 0 für alle x ∈ Ω0 ,

wie sich unmittelbar aus der Beziehung (∗) von 5.1 ergibt.
Die Funktion W hat an der Stelle x0 ein striktes lokales Minimum, wenn
W (x0 ) < W (x) für alle x = x0 in einer Umgebung von x0 .
Ist W ein erstes Integral des Systems ẏ = f (y) in Ω0 ⊂ Ω und hat W im
Gleichgewichtspunkt x0 ∈ Ω0 ein striktes lokales Minimum, so ist durch x →
W (x) − W (x0 ) eine Ljapunow–Funktion gegeben, also ist x0 nach 5.2 (a) stabil.

Erste Integrale lassen sich in einfachen Fällen durch geschicktes Kombinieren


der Differentialgleichungen gewinnen.
Beispiel. Das System

ẋ = x − xy , ẏ = − y + x y

im Quadranten x > 0, y > 0 hat den einzigen Gleichgewichtspunkt (1, 1). Für
Lösungen t → (x(t), y(t)) gilt

ẋ + ẏ = x − y und xẏ + ẋy = x2 y − xy 2 = xy(x − y) , also


xẏ + ẋy
ẋ + ẏ − = (x + y − log(xy))˙ = 0 .
xy

Somit ist W (x, y) := x+y−log(xy) konstant längs jeder Lösung. Wegen log t ≤
t − 1 gilt ferner W (x, y) ≥ 2 = V (1, 1) mit Gleichheit nur für (x, y) = (1, 1).
Somit hat W in (1, 1) ein striktes lokales Minimum und ist ein erstes Integral.

5.5 Hamiltonsche Systeme


(a) Ist (q0 , p0 ) eine Gleichgewichtslage des Hamiltonschen Systems

∂H ∂H
q̇k = (q, p) , ṗk = − (q, p) (k = 1, . . . N )
∂pk ∂qk

und hat H dort ein striktes lokales Minimum, so liegt eine stabile Gleichge-
wichtslage vor. Das folgt aus 5.4 aufgrund des Energieerhaltungssatzes

H(q(t), p(t)) = E .
5 Die direkte Methode von Ljapunow 125

Eine detailliertere Aussage erhalten wir für Hamiltonen–Funktionen der Form

1 
N
1
H(q, p) = mij (q) pi pj + U (q) = p , M (q) p + U (q),
2 2
i,j=1

wobei die Matrix M (q) an jeder Stelle q positiv definit ist. Die kanonischen
Gleichungen lauten hier

q̇ = M (q) p ,

N
ṗ = − 21 p , ∂k M (q) p ek − ∇U (q) .
k=1

Wegen Rang M (q) = N haben die Gleichgewichtspunkte die Form (q0 , 0) mit
∇U (q0 ) = 0. Hier gilt also:
Hat U an der Stelle q0 ein striktes lokales Minimum, so liegt nach (a) Stabilität
vor, vgl. 3.4.
(c) Hängt beim zuletzt angegebenen System M nicht von q ab und hat U an
der Stelle q0 ein lokales Maximum mit negativ definiter Hesse–Matrix U  (q0 ),
so ist (q0 , 0) eine instabile Gleichgewichtslage.
Wir zeigen dies mit Hilfe des Satzes von Tschetajew 5.3. Dabei dürfen wir
o.B.d.A. q0 = 0 annehmen. Wir wählen δ > 0 so, dass U  (q) für q < δ
negativ definit ist, vgl. Bd. 1 § 22 : 4.5 (b). Dann setzen wir

Ω0 := {(q, p) | q < δ} , D := {(q, p) ∈ Ω0 | q , p > 0} ,

V (q, p) := q , p .

Eine leichte Rechnung zeigt, dass für f (q, p) = (M hspace.75ptp, −∇U (q))

∂f V (q, p) = p , M p − q , ∇U (q) .

Nach dem Satz von Taylor gilt für q < δ mit geeignetem ϑ ∈ ]0, 1[
1
 
U (0) = U (q) − q , ∇U (q) + 2 q , U  (ϑ q) q

< U (0) − q , ∇U (q) ,


also
∂f V (q, p) > 0 für (q, p) = (0, 0) und q < δ .
Damit sind die Voraussetzungen für 5.3 erfüllt ÜA .

Bemerkung. Wie die Herleitung zeigt, genügen folgende Voraussetzungen:


∇U (q0 ) = 0 und q − q0 , ∇U (q) < 0 für 0 < q − q0  < δ.
126 § 5 Einführung in die qualitative Theorie

5.6 Gedämpfte Systeme mit einem Freiheitsgrad


Die Bewegungsgleichung

q̈ + D(q) q̇ − F (q) = 0

entsteht aus der in Abschnitt 3 behandelten DG q̈ = F (q) durch Einführung


eines zusätzlichen, der Geschwindigkeit proportionalen Dämpfungsterms. Das
zugehörige System erster Ordnung ist

q̇ = p , ṗ = − D(q) p + F (q) .

Jeder Gleichgewichtspunkt (q0 , 0) das ungedämpften Systems ist offenbar auch


ein Gleichgewichtspunkt des gedämpften und umgekehrt. Für die Hamilton–
Funktion des ungedämpften Systems,
q
H(q, p) = 1
2
p2 + U (q) mit U (q) = − F (s) ds
q0

und das Vektorfeld f = (p, −D(q) p + F (q)) des gedämpften gilt ÜA

(∗) ∂f H(q, p) = − D(q) p . 2

(a) Satz. Der Gleichgewichtspunkt (q0 , 0) ist asymptotisch stabil, wenn


D(q0 ) > 0 und (q − q0 ) F (q) < 0 für 0 < | q − q0 |  1 .
U hat in diesem Fall an der Stelle q0 ein striktes lokales Minimum.

Bemerkung. Im Fall U  (x0 ) > 0 folgt die asymptotische Stabilität auch aus
4.3. Hier geht es nicht so sehr um den Fall U  (x0 ) = 0, vielmehr um eine
Demonstration der Methode von Ljapunow.
Beweis.
Nach Voraussetzung gibt es Zahlen > 0, δ > 0 mit
D(q) ≥ für | q − q0 | < δ ,
(q − q0 ) F (q) < 0 für 0 < | q − q0 | < δ .
Die zweite Eigenschaft bewirkt U  (q) = −F (q) > 0 rechts von q0 und U  (q) < 0
links von q0 , also U (q0 ) < U (q) für 0 < | q − q0 | < δ. Deswegen und wegen (∗)
ist H eine Ljapunow–Funktion und (q0 , 0) damit eine stabile Gleichgewichtslage.
Es gilt ∂f H(q, p) < 0 außer für p = 0 . Um eine strenge Ljapunow–Funktion zu
erhalten, modifizieren wir H ein wenig, indem wir
 q
V (q, p) := H(q, p) + 1
2
(q − q0 ) p + (s − q0 ) D(s) ds
q0

setzen. Der Übergang von H nach V bewirkt ein leichtes Kippen der Tangenten
der Niveaulinien in den Achsenpunkten (q, 0) gegen den Uhrzeigersinn.
5 Die direkte Methode von Ljapunow 127

Dann ist V eine strenge Ljapunow–Funktion, denn wegen U (q) > U (q0 ) = 0
für 0 < |q − q0 | < δ gilt

V (q, p) ≥ 1
2
p2 + 1
2
(q − q0 ) p + 1
2
(q − q0 )2
 2
> 1
2
p+ 1
2
(q − q0 ) ≥ 0 für (q, p) = (q0 , 0) , |q − q0 | < δ ,

und für diese (q, p) ist ( ÜA )



∂f V (q, p) = − D(q) − 1
2
p2 + 1
2
(q − q0 ) F (q) < 0 . 2

(b) Satz. Der Gleichgewichtspunkt (q0 , 0) ist instabil unter den Voraussetzun-
gen
D(q0 ) > 0 und (q − q0 ) F (q) > 0 für 0 < |q − q0 |  1 .

U hat in diesem Fall an der Stelle q0 ein striktes lokales Maximum.


Beweis.
Um den Satz von Tschetajew anzuwenden, nehmen wir q0 = 0 an und betrach-
ten
q
V (q, p) := q p + s D(s) ds .
0
Wir wählen δ > 0 so, dass q F (q) > 0 und D(q) > 0 für 0 < q < δ. Dann
zeigt eine einfache Rechnung ÜA , dass

∂f V (q, p) = p2 + q F (q) > 0 für p = 0 , 0 < q < δ .

Mit M := max {D(q) | |q| ≤ δ} gilt ferner

V (q, p) ≤ q p + 1
2
M q 2 = q (p + 1
2
M q) .

Also gilt V (q, p) < 0 für q > 0, p < − 12 M q. Ferner ist V (q, p) > 0 und
∂p V (q, p) = q > 0 für 0 < q < δ und p > 0. Daher besitzt die Gleichung
V (q, p) = 0 für 0 < q < δ eine eindeutige C1 –Auflösung p = ϕ(q). Setzen wir
     
Ω0 := (q, p)  | q | < δ , D= (q, p)  q > 0 und p > ϕ(q) ,

so sind die Voraussetzungen des Satzes von Tschetajew erfüllt. 2

5.7 Anmerkungen und Aufgaben


(a) Allgemeine gedämpfte mechanische Systeme. Wir betrachten das System
q̇ = M (q) p , ṗ = − ∇U (q) − D(q)p ,
wobei die Matrix D(q) für alle in Betracht kommenden Lagen q positiv definit
ist. Dann gilt: Hat U an der Stelle q0 ein striktes lokales Minimum, so ist (q0 , 0)
eine asymptotisch stabile Gleichgewichtslage. Das ergibt sich aus dem Satz von
128 § 5 Einführung in die qualitative Theorie

La Salle, der eine wichtige Verallgemeinerung des Ljapunowschen Satzes ist.


Wir verweisen auf Knobloch–Kappel [23] III.6.
(b) Das gedämpfte Pendel . Geben Sie eine strenge Ljapunow–Funktion für die
Pendelgleichung
q̈ + Dq̇ + sin q = 0
in Umgebung des Gleichgewichtspunktes (2kπ, 0) an (D > 0 eine Konstante).
Entwerfen Sie ein Phasenportrait.
(c) Zeigen Sie für Gradientensysteme
ẏ = − ∇U (y)
mit U ∈ C2 (Ω): Hat U an der Stelle x0 ∈ Ω ein striktes lokales Minimum
und gilt ∇U (x) = 0 für alle x = x0 einer Umgebung von x0 , so ist x0 eine
asymptotisch stabile Gleichgewichtslage.

6 Die Sätze von Liouville und Poincaré–Bendixson


6.1 Der lokale Fluss eines Vektorfeldes
Bisher galt unser Interesse dem Verlauf einzelner Flusslinien t → ϕ(t, η) des
Systems ẏ = f (y) auf Ω . Nun beziehen wir einen anderen Standpunkt. Wir
halten t fest und fragen, was aus einer bestimmten Menge M von Startpunkten
nach der Zeit t wird, d.h. wie sich die Menge Mt = {ϕ(t, x) | x ∈ M } im Lauf
der Zeit verhält.
Wir betrachten also die Schar von Flussabbildungen
Φt : x → ϕ(t, x) .
Als Definitionsbereich von Φt wählen wir ein Gebiet G ⊂ Ω mit gleichmäßiger
Lebensspanne, d.h. wir verlangen von G, dass es ein T > 0 gibt mit ]−T, T [ ⊂
J(x) für alle x ∈ G. Jedes beschränkte Teilgebiet G mit G ⊂ Ω hat diese
Eigenschaft. Denn da Ωf nach 1.1 (b) offen ist, hat die kompakte Menge {0}×G
zu ∂Ωf einen positiven Abstand T , also gilt ]−T, T [ × G ⊂ Ωf .
Für das ganze Gebiet Ω muss es keine gleichmäßige Lebensspanne geben, vgl.
Aufgabe 6.2 (a).

Satz. Sei G ein Teilgebiet von Ω und I ein Intervall mit 0 ∈ I , so dass I × G
im Definitionsbereich Ωf von ϕ(t, x) liegt. Dann ist für jedes t ∈ I die Menge
Gt := { ϕ(t, x) | x ∈ G }
ein Gebiet in Ω und
Φt : G → Gt , x → ϕ(t, x)
ein orientierungstreuer Diffeomorphismus.
6 Die Sätze von Liouville und Poincaré–Bendixson 129

Beweis.
(a) Nach Definition einer Lösung liegt ϕ(t, x), soweit definiert, in Ω, also gilt
Gt ⊂ Ω.
(b) Nach Definition von Gt ist Φt : G → Gt surjektiv. Φt ist injektiv, denn
aus ϕ(t, x) = ϕ(t, y) folgt x = ϕ(0, x) = ϕ(−t, ϕ(t, x)) = ϕ(−t, ϕ(t, y)) =
ϕ(0, y) = y nach dem Eindeutigkeitssatz.
(c) Φt ist C1 –differenzierbar nach 1.1 (b).
(d) Bestimmung der Umkehrabbildung Φ−1 t . Sei y ∈ Gt , also y = ϕ(t, x) mit
eindeutig bestimmtem x ∈ G. Wir setzen u(s) := ϕ(s + t, x). Dann enthält das
Definitionsintervall J(x) − t von u die Punkte −t und 0, und u ist eine Lösung
von ẏ = f (y) mit u(0) = y und u(−t) = ϕ(0, x) = x. Es folgt −t ∈ J(y) und

(∗) Φ−1
t (y) = x = ϕ(−t, y) .

(e) Gt ist ein Gebiet.


Wegen der Stetigkeit von ϕ auf Ωf ist Φ−1 t = Φ−t stetig, also Gt als Urbild
von G unter dieser Abbildung offen.
Andererseits ist Gt als Φt –Bild der wegzusammenhängenden Menge G auch
wegzusammenhängend, also ein Gebiet. Die C1 –Differenzierbarkeit von Φ−1 t
ergibt sich aus der Darstellung (∗) und aus dem Differenzierbarkeitssatz 1.1 (b).
(f) Orientierungstreue. Da Φt eine C1 –Umkehrfunktion besitzt, ist die Deter-
minante det(DΦt )(x) = 0 für alle x ∈ G. Die Funktion t → det(DΦt )(x) ist
bei festem x stetig in t, wie sich aus dem Laplaceschen Entwicklungssatz mittels
Induktion ergibt. Wegen Φ0 = ½G ist det DΦ0 (x) = det E = 1 für alle x ∈ G,
also ist det DΦt (x) positiv für alle t ∈ I. 2

6.2 Beispiele und Aufgaben


-
(a) Zeigen Sie für die logistische DG ẏ = y(1 − y), dass J(x) = {0} gilt,
x∈ Ê
und bestimmen Sie Φt (]1, ∞[).
(b) Eine reelle 2×2–Matrix A habe die rein imaginären Eigenwerte iω, −iω mit
ω > 0. Verschaffen Sie sich anhand der zweiten Figur 2.4 eine grobe Vorstellung
davon, wie sich unter der Dynamik des Systems ẏ = Ay die Φt –Bilder der
Strecke σ = {(x, 0) | 0 ≤ x ≤ 1} im Laufe der Zeit verhalten.
 
(c) Wir betrachten das System ẏ = Ay für A = ω 0 −ω
0
bzw. A = −ω 0 −ω
0

mit ω > 0. Bestimmen Sie für t > 0 und das offene Rechteck R mit den Ecken
(0, 0), (a, 0), (a, b), (b, 0) in beiden Fällen die Gestalt und den Flächeninhalt des
Gebiets Φt (R).
130 § 5 Einführung in die qualitative Theorie

6.3 Der Satz von Liouville


Der lokale Fluss eines divergenzfreien Vektorfeldes f ist volumentreu: Für jedes
Gebiet G ⊂ Ω mit gleichmäßiger Lebensspanne I (vgl. 6.1) und endlichem
Volumen gilt Vol (Φt (G)) = Vol G für alle t ∈ I .

Beweis.
Für t ∈ I und x ∈ G sei At (x) = (DΦt )(x). Nach 6.1 ist det At (x) > 0. Der
Transformationssatz für Integrale (Bd. 1, § 23 : 8.1) liefert für Gt := Φt (G)
  
Vol (Gt ) = 1 dn y = | det At (x) | dn x = det At (x) dn x .
Gt G G

Wir behaupten, dass det At (x) zeitlich konstant und damit gleich det A0 (x) =
1 ist, woraus dann Vol (Gt ) = 1 dn x = Vol (G) folgt. In der Tat erfüllt die Ma-
G
d
trix At (x) nach 1.1 (b) die Variationsgleichung dt At (x) = (Df )(ϕ(t, x))At (x).
Hieraus folgt bei festem x für die Wronski–Determinante W (t) = det At (x)
nach § 3 : 1.3
Ẇ (t) = Spur (Df )(ϕ(t, x))W (t) = (div f )(ϕ(t, x))W (t) = 0 . 2
6 Die Sätze von Liouville und Poincaré–Bendixson 131

Bemerkung. Für dissipative Systeme (div f ≤ 0) gilt Vol (Gt ) ≤ Vol (G) für
t ≥ 0.
Das folgt durch Modifikation des Beweises unter Beachtung von det At (x) ≤ 1
ÜA .

ÜA Wie verhält sich das Volumen Vol (Gt ) unter dem Fluss eines Vektorfeldes
f mit konstanter Divergenz : div f (x) = k ?

6.4 Halbflüsse und globale Flüsse


Von besonderem Interesse sind Teilgebiete von Ω, auf denen die Flussabbildung
Φt für alle t oder wenigstens für alle t ≥ 0 definiert ist.
(a) Eine Teilmenge M von Ω heißt invariant (bzw. positiv invariant) unter
dem Fluss des Vektorfeldes f , wenn für jeden Startpunkt η ∈ M die Lösung
ϕ(t, η) für alle t (bzw. für alle t ≥ 0) definiert ist und in M verbleibt.

Beispiele. (i) Jeder periodische Orbit ist invariant.


(ii) Bei ebenen Systemen ist das Innere eines periodischen Orbits invariant,
falls dieses zu Ω gehört.
(iii) Für die logistische DG ẏ = y(1 − y) ist [1, ∞[ positiv invariant, aber nicht
invariant, dagegen sind die Intervalle ]0, 1[ und [0, 1] invariant.
(iv) Für lineare Systeme ẏ = A(y) sind die invarianten Teilräume von der
Form Kern (A − λE)k mit Eigenwerten λ, siehe § 3 : 2.7.
(v) Besitzt das System ẏ = f (y) eine Ljapunow–Funktion V , so ist die Menge
{x ∈ Ω | V (x) ≤ c} für genügend kleine c positiv invariant, vgl. 5.1 und 5.2.

(b) Ist Ω0 ein invariantes (bzw. positiv invariantes) Gebiet, so können wir das
System ẏ = f (y) auf Ω0 einschränken. Wir bezeichnen Ω0 wieder mit Ω, die
Einschränkung von f auf Ω0 wieder mit f und haben dann folgende Situation:
(c) Ein Vektorfeld f auf Ω erzeugt dort einen globalen Fluss {Φt | t ∈ }, Ê
wenn alle Lösungen auf ganz Ê
definiert sind.
Es erzeugt einen (positiven) Halbfluss, wenn alle Lösungen für t ≥ 0 definiert
sind.
(d) Satz. Erzeugt das Vektorfeld f einen globalen Fluss, so ist

Φt : Ω → Ω, x → ϕ(t, x)

ein orientierungstreuer Diffeomorphismus mit der Gruppeneigenschaft

Φs ◦ Φt = Φt ◦ Φs = Φs+t für s, t ∈ Ê, Φ 0 = ½Ω , Φ−1


t = Φ−t .

Erzeugt f einen Halbfluss, so gilt wenigstens die Halbgruppeneigenschaft

Φs ◦ Φt = Φt ◦ Φs = Φs+t für s, t ≥ 0 und Φ0 = ½Ω .


132 § 5 Einführung in die qualitative Theorie

Bemerkung. Die Gruppeneigenschaft für globale Flüsse stellt eine Verallge-


meinerung des Exponentialgesetzes § 3 : 1.5 dar: Für ein System ẏ = Ay mit
konstanten Koeffizienten gilt
Φt (x) = etA x und e(s+t)A = esA etA für s, t ∈ Ê.
Beweis.
(i) Die Halbgruppeneigenschaft von Halbflüssen ergibt sich wie folgt: Für x ∈
Ω und festes s ≥ 0 ist u(t) := ϕ(s + t, x) für alle t ≥ 0 definiert und liefert
eine Lösung von ẏ = f (y) mit u(0) = ϕ(s, x). Daher gilt u(t) = ϕ(t, ϕ(s, x))
für alle t ≥ 0. Durch Vertauschen der Rollen von s und t folgt die Behauptung.
(ii) Die Beziehung Φs ◦ Φt = Φt ◦ Φs = Φs+t für alle s, t ∈ Ê folgt bei
globalen Flüssen ganz analog. Für diese ist Φt : Ω → Ωt ⊂ Ω für alle t ∈Ê ein
orientierungstreuer Diffeomorphismus.
Zu zeigen ist Φs (Ω) = Ω und Φ−1 Ê
= Φ−s für alle s ∈ . Sei y ∈ Ω, x =
Ê
s
ϕ(−s, y) und u(t) := ϕ(t − s, y). Dann ist u(t) eine für alle t ∈ definierte
Lösung mit u(0) = x und u(s) = y. Daraus folgt u(t) = ϕ(t, x) , insbesondere
y = ϕ(s, y) und damit x = ϕ(−s, y) = ϕ(−s, ϕ(s, x)), also y ∈ Φs (Ω) und
Φ−s ◦ Φs = ½Ω für alle s ∈ Ê. 2

6.5 Der Satz von Poincaré–Bendixson


Für ebene autonome Systeme
ẋ = f (x, y) , ẏ = g(x, y) auf Ω ⊂ Ê2
gilt: Ist K eine nichtleere, kompakte, positiv invariante Teilmenge von Ω ohne
Gleichgewichtspunkte, so enthält K mindestens einen periodischen Orbit.
Für den Beweis und Anwendungsbeispiele sei auf Arrowsmith–Place [7] 3.9,
Hirsch–Smale [10] Ch. 11 und Miller–Michel [11] Ch. 7 verwiesen. Für höhe-
re Dimensionen n ≥ 3 ist dieser Satz nicht gültig.

Aufgabe. Zeigen Sie, dass das System


ẋ = − y + x (1 − x2 − y 2 ) , ẏ = x + y (2 − x2 − y 2 )
im Kreisring K = {1 ≤ x2 + y 2 ≤ 2} einen periodischen Orbit besitzt.
Anleitung: Setzen Sie r = d 2
x2 + y 2 und zeigen Sie dt r (t) ≥ 0 für r ≤ 1

und dt r (t) ≤ 0 für r ≥ 2. Der Kreisring K ist daher positiv invariant.
d 2
Kapitel III
Partielle Differentialgleichungen,
elementare Lösungsmethoden
In diesem einführenden Kapitel behandeln wir einfache Beispiele von partiellen
Differentialgleichungen der Mathematischen Physik. Wir stellen zwei Lösungs-
methoden vor, die insofern elementar sind, als sie sich nur auf die Differential–
und Integralrechnung und auf gewöhnliche Differentialgleichungen stützen.
In § 6 werden Separationsansätze vorgestellt, die auf Fourierreihen führen. An
Vorkenntnissen genügen hierfür die ersten beiden Abschnitte von § 4. In § 15 : 3
werden weitere Beispiele für die Separationsmethode folgen; diese führen uns
auf die speziellen Funktionen der mathematischen Physik.
In § 7 wird die Charakteristikenmethode für partielle Differentialgleichungen
1. Ordnung dargestellt, ferner werden Systeme von partiellen Differentialglei-
chungen 1. Ordnung behandelt. Dabei wird die Kenntnis der grundlegenden
Theorie gewöhnlicher Differentialgleichungen aus § 2 verwendet (Existenz, Ein-
deutigkeit und differenzierbare Abhängigkeit von Lösungen).

§ 6 Separationsansätze und Fourierreihen

1 Die schwingende Saite I


1.1 Problemstellungen und Lösungsansatz
Für die Transversalschwingung einer an den Enden eingespannten elastischen
Saite entnehmen wir aus § 1, Abschnitt 2 folgende Gleichungen für die vertikale
Auslenkung u(x, t) aus der Ruhelage an der Stelle x zur Zeit t:
∂2u
Ê
2
2 ∂ u
(a) (x, t) = c (x, t) für 0 < x < L, t ∈ (Wellengleichung),
∂t2 ∂x2
(b) u(0, t) = u(L, t) = 0 für t ∈ Ê (Randbedingung).

Von den Lösungen u verlangen wir u ∈ C2 (Ω); das bedeutet C2 –Differenzier-


barkeit in Ω = ]0, L[ × Ê
und stetige Fortsetzbarkeit von u und allen partiellen
Ableitungen bis zur 2. Ordnung auf Ω. Dann macht (a) auch in den Rand-
2
punkten x = 0 und x = L Sinn, wenn in diesen ∂∂xu2 als einseitige Ableitung
aufgefasst wird.

Dieses mathematische Modell wird zwei Aspekte der Erfahrung erklären:

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_3, © Springer Fachmedien Wiesbaden 2014
134 § 6 Separationsansätze und Fourierreihen

• Jede Saitenschwingung ist eine Überlagerung harmonischer Sinusschwingun-


gen (Grundton und Obertöne). Wir zeigen: Jede Lösung der Gleichungen (a), (b)
besitzt eine Darstellung in Form einer unendlichen Reihe von harmonischen
Schwingungen, wobei wir unter einer harmonischen Schwingung eine Lösung
der Form
πk
u(x, t) = w(t) sin L x (k = 1, 2, . . .)

verstehen. Hierbei liefert die Theorie


der Fourierreihen das Werkzeug für die
Klangsynthese und die Klanganalyse,
also die Bestimmung der Amplituden
der Grund– und Oberschwingungen.
In der Figur ist eine Langzeitaufnah-
me einer solchen stehenden Welle“ in

starker Überhöhung wiedergegeben.
• Auslenkungen breiten sich längs der Saite wellenförmig aus. Dabei wird die
Einhaltung der Randbedingung durch Superposition von ein– und auslaufenden
Wellen ermöglicht.

Wir behandeln im folgenden


Das Anfangs–Randwertproblem. Gegeben seien Funktionen

f ∈ C2 [0, L], g ∈ C1 [0, L] mit f (0) = f (L) = g(0) = g(L) = 0.

Gesucht ist eine Lösung der Wellengleichung (a), die der Randbedingung (b)
und der Anfangsbedingung
∂u
(c) u(x, 0) = f (x) , (x, 0) = g(x) für 0 ≤ x ≤ L.
∂t
genügt. Diese Voraussetzungen reichen nicht aus, um die Existenz einer C2 –
differenzierbaren Lösung zu sichern. Wie sie zu verschärfen sind wird im Fol-
genden erörtert.
An die Vorstellung, beliebige Saitenschwingungen durch Superposition von har-
monischen Schwingungen zu gewinnen, knüpft die Separationsmethode an,
die von Daniel Bernoulli 1753 als eine Methode von größtem Nutzen“ intui-

tiv erkannt und propagiert wurde. Diese besteht darin, die Lösung in folgenden
Schritten zu gewinnen:
– Bestimmung sämtlicher Produktlösungen u(x, t) = v(x) w(t) von (a) und (b).
Dies führt auf gewöhnliche Differentialgleichungen 2. Ordnung für v und w, wo-
bei v die Randbedingung (b) zu erfüllen hat.
–Ansatz für die gesuchte, den Anfangsbedingungen (c) genügende Lösung als
Superposition dieser Produktlösungen in Form einer Reihe.
1 Die schwingende Saite I 135

– Nachweis, dass dieser Ansatz wirklich eine Lösung liefert, d.h. dass die Reihe
genügend oft gliedweise differenziert werden darf.

1.2 Lösungen in Produktgestalt


Wir suchen nichtverschwindende Lösungen von (a) und (b) in Produktgestalt
u(x, t) = v(x)w(t) mit v ∈ C2 [0, L], w ∈ C2 ( ). Ê
Diese erfüllen die Wellengleichung (a) genau dann, wenn

v(x)w (t) = c2 v  (x)w(t) für x ∈ [0, L], t ∈ Ê


bzw.
w (t) v  (x)
w(t)
= c2
v(x)
für x ∈ [0, L], t ∈ Ê
(bis auf Nullstellen der Nenner). Die letzte Gleichung kann nur bestehen, wenn
beide Seiten konstant sind: Denn fixieren wir ein t0 mit w(t0 ) = 0, so folgt
v(x)w (t0 ) = c2 v  (x)w(t0 ), somit
w (t0 )
(I) v  (x) + λv(x) = 0 mit λ := − .
c2 w(t0 )
Fixieren wir jetzt ein x0 mit v(x0 ) = 0 und lassen t laufen, so folgt mit derselben
Konstante λ
(II) w (t) + c2 λ w(t) = 0 .
Durch den Produktansatz ist die partielle DG (a) in zwei gewöhnliche Diffe-
rentialgleichungen zerlegt (separiert) worden. Aus der Einspannbedingung (b)
folgt v(0) = v(L) = 0.
Somit führt (I) auf das Randwertproblem
v  + λ v = 0 , v(0) = v(L) = 0 .
Dieses kann höchstens für λ > 0 nichttriviale Lösungen haben. Dies läßt sich
leicht aus der allgemeinen Lösung der Schwingungsgleichung ablesen. Im Hin-
blick auf spätere Verallgemeinerungen leiten wir das direkt aus der Differential-
gleichung ab. Hierzu multiplizieren wir diese mit v, integrieren von 0 bis L und
erhalten unter Beachtung von v(0) = v(L) = 0
L L  L L
vv  = − vv  0 +
L
v = v > 0 ,
2 2
λ v2 = −
0 0 0 0

denn v kann wegen v(0) = v(L) = 0, v = 0 nicht konstant sein.


Für λ > 0 hat die DG v  + λ v = 0 die allgemeine Lösung
√ √
v(x) = a cos λ x + b sin λ x
mit Konstanten a, b.
136 § 6 Separationsansätze und Fourierreihen


Aus v(0) = 0 folgt a = 0, aus v(L) = 0 und b = 0 folgt weiter sin λL = 0,
also λ = (πk/L) mit k ∈
2

und damit v(x) = b sin(πkx/L). Setzen wir λ in
die DG (II) ein, so ergibt sich

πkc πkc
w(t) = α cos t + β sin t.
L L
Wir erhalten somit:
Sämtliche Lösungen von (a),(b) in Produktform sind von der Form
 πkc πkc
πk
ak cos t + bk sin t sin x (k = 1, 2, . . .)
L L L
mit Konstanten ak , bk .
Dies sind die harmonischen Schwingungen der Saite.

1.3 Superposition von Produktlösungen


Wir fragen nun nach der allgemeinen Lösung der Wellengleichung (a) mit der
Randbedingung (b). Da (a) und (b) lineare homogene Gleichungen für u darstel-
len, erfüllt auch jede Linearkombination von Produktlösungen die Bedingungen
(a) und (b). Um die Anfangsbedingungen (c) mit beliebig vorgegebenen Funk-
tionen f und g zu erfüllen, werden diese Linearkombinationen nicht genügen.
Wir gehen daher noch einen Schritt weiter und vermuten, dass sich die allge-
meine Lösung von (a) und (b) als unendliche Reihe
∞  
 πkc πkc πk
u(x, t) = ak cos t + bk sin t sin x,
L L L
k=1

darstellen läßt ( Superposition harmonischer Schwingungen“).



Die Anfangsbedingungen (c) führen auf die Gleichungen


πk
f (x) = u(x, 0) = ak sin x (0 ≤ x ≤ L) ,
L
n=1

∂u  πkc


g(x) = (x, 0) = bk sin x (0 ≤ x ≤ L) .
∂t L L
n=1

Beide Gleichungen stellen uns vor das Problem, eine gegebene Funktionen in
eine Sinus–Reihe zu entwickeln. Die Bewältigung dieser Aufgabe ist der ent-
scheidende Schritt zur Rechtfertigung des Superpositionsansatzes.
Wir beschäftigen uns daher zunächst mit der Frage nach der Entwickelbarkeit
von Funktionen in trigonometrische Reihen. Nach der Klärung dieses Problems
im folgenden Abschnitt setzen wir die Behandlung der schwingenden Saite fort.
2 Fourierreihen 137

2 Fourierreihen
In diesem Abschnitt sollen folgende Fragen beantwortet werden:
(a) Welche Funktionen u : [−π, π] → lassen sich durch trigonometrische
Reihen

1 


(∗) u(x) = a0 + ak cos kx + bk sin kx
2
k=1

mit geeigneten Koeffizienten ak , bk darstellen? (Das in 1.3 formulierte Problem


ergibt sich als Spezialfall nach geeigneter Umskalierung der Variablen x, sie-
he 2.1 (a)).
(b) Sind die Koeffizienten ak , bk durch u eindeutig bestimmt, und wie lassen
sich diese gegebenenfalls berechnen?
(c) In welchem Sinn konvergiert die Reihe (∗) ?
(d) Wie spiegeln sich Differenzierbarkeitseigenschaften von u im Verhalten der
Koeffizienten ak , bk wieder?

2.1 Varianten der Reihendarstellung


(a) Für beliebige kompakte Intervalle [a, b] lautet die trigonometrische Reihe
 ∞     
1 πk πk
f (y) = a0 + ak cos (y − m) + bk sin (y − m)
2 L L
k=1

mit m := (a + b)/2 , L := (b − a)/2 . Diese Reihenentwicklung ist äquivalent zu


(∗) durch die Umskalierung u(x) = f (m + Lx/π) bzw. f (y) = u(π(y − m)/L).
Im Fall b = −a = L erhalten wir die Reihe
∞  
1 πk πk
f (y) = a0 + ak cos y + bk sin y .
2 k=1 L L

(b) Für theoretische Zwecke ist es zweckmäßig, (∗) in die äquivalente komplexe

Form“

n
(∗∗) u(x) = lim ck eikx
n→∞ k=−n

zu bringen; dabei ist





1
2
(ak − i bk ) für k > 0 ,
1
ck = a0 für k = 0 ,


2
1
2
(a−k + i b−k ) für k < 0 ,

bzw.
138 § 6 Separationsansätze und Fourierreihen

ak = ck + c−k , bk = i (ck − c−k ) für k ∈  ÜA .


Beachten Sie: Aus der Existenz des Grenzwertes (∗∗) folgt noch nicht die Kon-

∞ 
∞ 

vergenz der Reihe ck eikx := ck eikx + c−k e−ikx .
k=−∞ k=0 k=1

2.2 Euler–Fouriersche Formeln und Entwicklungsproblem


Satz. Konvergiert die Reihe
1 


n

(∗) u(x) = a0 + (ak cos kx + bk sin kx) = lim ck eikx


2 n→∞
k=1 k=−n

gleichmäßig auf [−π, π], so ist u stetig, es gilt u(π) = u(−π), und die Koeffizi-
enten ak , bk , ck ergeben sich aus den Euler–Fourierschen Formeln
1

ak = π
u(t) cos kt dt (k = 0, 1, . . .) ,
−π

1

π
bk = π
u(t) sin kt dt (k = 1, 2, . . .) ,
−π
π 
ck = 1

u(t) e−ikt dt (k ∈ ).
−π

Diese Formeln fanden Clairaut 1754 und Euler 1777.


Beweis.
Als gleichmäßiger Limes stetiger Funktionen ist u stetig, also machen die an-
gegebenen Integrale Sinn. Wegen der gleichmäßigen Konvergenz ist gliedweise
Integration erlaubt, und wir erhalten
π π π  
n
u(t) e−int dt = e−int u(t) dt = e−int lim ck eikt dt
n→∞ k=−n
−π −π −π
π 
n
= lim ck ei(k−n)t dt
n→∞ k=−n
−π

n π  

= lim ck ei(k−n)t dt = 2πck δnk = 2πcn .
n→∞ k=−n
−π k=−∞

Mit den Umrechnungformeln 2.1 (b) ergeben sich die Integraldarstellungen der
an , bn ÜA . 2

Bemerkungen. (i) Für k = 0 ergibt sich der Mittelwert von u:


1 1

2 a0 = 2π u(t) dt .
−π
1
Der Vorfaktor 2
bei a0 in (∗) erlaubt die einheitliche Integraldarstellung der ak .
2 Fourierreihen 139

(ii) Für ungerade Funktionen u verschwinden alle ak , für gerade Funktionen


verschwinden alle bk ÜA .
Unabhängig vom Bestehen der Reihendarstellung (∗) definieren wir für jede über
[−π, π] integrierbare Funktion u die Fourierkoeffizienten ak , bk bzw. ck durch
die Euler–Fourierschen Formeln. Die mit diesen gebildeten Partialsummen
1 
n

n

sn (x) := a0 + (ak cos kx + bk sin kx) = ck eikx


2
k=1 k=−n
heißen Fourierpolynome, die zugehörige Reihe die Fourierreihe von u.

Entwicklungsproblem: Unter welchen Voraussetzungen an u konvergiert die


Fourierreihe von u, und wenn, konvergiert sie dann gegen u? Wir werden sehen,
dass die Antwort entscheidend vom gewählten Konvergenzbegriff abhängt.

2.3 Stückweis stetige und abschnittsweis glatte Funktionen


(a) Eine Funktion u : [a, b] → Ê
heißt stückweise stetig, wenn sie höchstens
endlich viele Sprungstellen hat und sonst stetig ist. Dabei heißt ein innerer
Punkt x Sprungstelle, wenn u dort unstetig ist, aber die einseitigen Grenz-
werte u(x−) und u(x+) existieren.
Treppenfunktionen und stetige Funktionen sind stückweise stetig.
Die stückweise stetigen Funktionen bilden einen Vektorraum, bezeichnet mit
PC [a, b] (von piecewise continuous). Das Produkt zweier PC–Funktionen ist
wieder eine PC–Funktion ÜA . Auf [a, b] stückweise stetige Funktionen sind
über [a, b] integrierbar (Bd. 1, § 11 : 4.1).
Für stückweise stetige Funktionen u und injektive C1 –Funktionen ϕ gilt die
Substitutionsregel
b ϕ−1 (b)

u(x) dx = u(ϕ(t)) ϕ (t) dt .
a ϕ−1 (a)

Denn mit u ist auch u ◦ ϕ stückweise stetig. Die Behauptung folgt dann durch
Aufspaltung des Integrals in Integrale über Teilintervalle ohne Sprungstellen
von u im Innern.
(b) Eine Funktion u : [a, b] →
1
Ê
heißt stückweise glatt ( u ∈ PC1 [a, b]),
wenn sie stetig ist und überall C –differenzierbar mit Ausnahme von höchstens
endlich vielen Knickstellen. Dabei heißt x ∈ ]a, b[ Knickstelle, wenn links–
und rechtsseitige Ableitung existieren, aber voneinander verschieden sind. De-
finitionsgemäß gilt C1 [a, b] ⊂ PC1 [a, b]. Setzen wir u (x) = 0 an den Knick-
stellen, so entsteht eine PC–Funktion u mit
y
u(y) − u(x) = u (t) dt für x, y ∈ [a, b] ÜA .
x

Für PC1 –Funktionen bleibt so der Satz über partielle Integration richtig ÜA .
140 § 6 Separationsansätze und Fourierreihen

(c) Eine Funktion u : [a, b] → Ê


heißt abschnittsweis glatt, wenn sie höchs-
tens endlich viele Sprung– oder Knickstellen hat. Das soll heißen: Es gibt eine
Unterteilung a = x0 < . . . < xN = b des Intervalls [a, b], so dass die Ein-
schränkung von u auf ]xk−1 , xk [ jeweils zu einer C1 –Funktion uk auf [xk−1 , xk ]
fortgesetzt werden kann. Setzen wir u (x) = 0 an den Sprung– oder Knickstel-
len, so gilt u, u ∈ PC [a, b]. Die abschnittsweis glatten Funktionen bilden einen
Vektorraum, der mit u und v auch u · v enthält ÜA .
(d) Für eine stückweise stetige Funktion u : [−π, π] → Ê
bezeichnen wir die
2π–periodische Fortsetzung mit uper : Ê Ê
→ . Neben den periodisch fortge-
setzten Sprungstellen von u hat uper zusätzlich die Sprungstellen (2k +1)π, falls
u(−π+) = u(π−).
y
Alsdann definieren wir die periodi- 6
sche Standardfortsetzung von u
.
u
durch

.(x) :=
u 1
2
uper (x+) + uper (x−) .

Wir erhalten so eine 2π–periodische -x


Funktion u. : → Ê Ê
, wie nebenste- −3π −π π 3π
hend skizziert.
In Sprungstellen von uper ist die periodische Standardfortsetzung das Sprung-
mittel von uper , an allen anderen Stellen stimmt u. mit uper überein.
Die für reellwertige Funktionen eingeführten Begriffe lassen sich unmittelbar auf
komplexwertige Funktionen übertragen.

2.4 Punktweise und gleichmäßige Konvergenz der Fourierreihe


Satz von Dirichlet. Für jede auf [−π, π] abschnittsweis glatte Funktion u
konvergieren die zugehörigen Fourierpolynome sn für n → ∞ gegen die peri-
odische Standardfortsetzung u. in folgendem Sinn:
.(x) punktweise für jedes x ∈
(a) sn (x) → u Ê,
.(x) gleichmäßig auf jedem kompakten Intervall ohne Sprungstel-
(b) sn (x) → u
..
len von u
Wir notieren die für die Separationsansätze wichtigste Folgerung:

Gleichmäßige Konvergenz für periodische PC1 –Funktionen


Für jede stückweise glatte Funktion u mit u(π) = u(−π) gilt

1 

u(x) = 2 a0 + (ak cos kx + bk sin kx)
k=1

gleichmäßig auf [−π, π] ; dabei sind die ak , bk die Fourierkoeffizienten von u.


2 Fourierreihen 141

Bemerkungen.
(i) Dirichlet bewies 1837 als erster die 1811 von Fourier ausgesprochene Ver-
mutung über die Entwickelbarkeit beliebiger“ Funktionen in trigonometrische

Reihen. Dieser Beweis war ein bedeutender Beitrag zum Prozeß der zunehmen-
den Schärfung analytischer Grundbegriffe wie Konvergenz, Reihe, Funktion, In-
tegral im 19. Jahrhundert.
(ii) Die an die zu entwickelnde Funktion u gestellte Bedingung der abschnitts-
weisen Glattheit ist leicht verifizierbar und erfaßt die meisten in den Anwen-
dungen auftretenden Fälle. Die Glattheitsbedingung an u läßt sich abschwächen;
schon Dirichlet verwendete eine schwächere Voraussetzung. Stetigkeit von u
allein reicht jedoch nicht für die punktweise Konvergenz der Fourierreihe, wie
raffinierte Beispiele zeigen, siehe Hardy–Rogosinski [40], Zygmund [46].
(iii) Gibbssches Phänomen. In der Nähe einer Sprungstelle von u . kann die
Folge sn nicht gleichmäßig konvergieren. Tatsächlich beobachten wir dort eine
verstärkte Oszillation der Fourierpolynome wie in der Figur, die die Fourierpo-
lynome s5 und s14 der Sägezahnfunktion u(x) = x für |x| ≤ π zeigt.

6 6
s5 s14

−π −π
- -
π π

Allgemein läßt sich folgendes zeigen (Courant–Hilbert [2], Kap.2, §10) : Ist x
eine Sprungstelle von u., so gilt für das x nächstgelegene Maximum Mn und das
x nächstgelegene Minimum mn des Fourier–Polynoms sn

2
π sin t
.(x+) − u
lim (Mn − mn ) = δ | u .(x−) | mit δ = π t dt ≈ 1.18 .
n→∞
0
142 § 6 Separationsansätze und Fourierreihen

2.5 Beweis des Satzes von Dirichlet


(a) Integraldarstellung der Fourierpolynome. Nach 2.2 gilt

n π
sn (x) = ck eikx mit ck = 1

e−ikt u(t) dt , also
k=−n −π

n π π 
n
sn (x) = 1

eik(x−t) u(t) dt = 1

u(t) eik(x−t) dt
k=−n −π −π k=−n
π π
= Dn (x − t)u(t) dt = Dn (x − t) .
u(t) dt
−π −π

mit dem Dirichlet–Kern


⎧ 1

⎪ falls eis = 1,
⎨ 2π (2n + 1) ,
1  iks
n

Dn (s) = e =
2π ⎪

1
1 sin(n + 2 )s
k=−n ⎩ sonst.
2π sin 12 s


n 
2n
Nachweis als ÜA : Wenden Sie auf eiks = e−ins (eis )k für eis = 1 die
k=−n k=0
−is/2
geometrische Summenformel an und erweitern Sie mit e .
(b) Eigenschaften des Dirichlet–
Kerns. Dn ist stetig, gerade und 6
2π–periodisch. Weiter gilt Dn (s)
π 
n π
Dn = 1

eiks ds = 1
−π k=−n−π

und daher wegen Dn (s) = Dn (−s)


π 0 1
(1) Dn = Dn = 2
.
0 −π

(c) Umformung der Fourierpolynome. -


Aus der Darstellung (a) erhalten wir s
wegen der 2π–Periodizität des Inte-
granden


x+π x 
x+π
sn (x) = .(t) dt =
Dn (x − t) u .(t) dt +
Dn (x − t) u .(t) dt .
Dn (x − t) u
x−π x−π x

Substitution s = x − t im ersten Integral bzw. s = t − x im zweiten ergibt


gemäß 2.3 (a) unter Berücksichtigung von Dn (−s) = Dn (s)
π π
(2) sn (x) = .(x − s) + u
Dn (s) ( u .(x + s) ) ds = .(x + s) ds .
Dn (s) u
0 −π
2 Fourierreihen 143

.(x). Sei S die Menge der Sprung– oder Knickstellen


(d) Konvergenz sn (x) → u
. und
von u
  
M := 1 + sup  u (t)   t ∈ [−π, π] \ S .

Wir betrachten eine feste Stelle x ∈ Ê


und bezeichnen mit d(x) ihren Abstand
zum nächstgelegenen, von x verschiedenen Punkt von S. (d(x) := 1, falls S = ∅.)
Wegen u .(x) = 12 (u
.(x+) + u
.(x−)) folgt aus (1), (2)

.(x) =
sn (x) − u .(x + s) − u
Dn (s) ( u .(x) ) ds
−π
(3) π π
= .(x − s) − u
Dn (s) ( u .(x−) ) ds + .(x + s) − u
Dn (s) ( u .(x+) ) ds .
0 0

Es genügt, das zweite Integral zu untersuchen. Wir definieren f durch

.(x + s) − u
f (s) := u .(x+) für s > 0 , f (0) := 0 .
f ist C1 –differenzierbar in [0, d(x)[ und abschnittsweis glatt ausserhalb dieses
 s 
Intervalls. Nach 2.3 (b) folgt | f (s) | =  . (x + t) dt  ≤ M s für 0 ≤ s < d(x) ,
u
0
also
M s MC
| Dn (s) f (s) | ≤ · ≤ für 0 ≤ s < d(x) ,
2π sin 12 s 2π
hierbei sind M und C Konstanten mit |f (s)| ≤ M s für 0 ≤ s < d(x) sowie
|s/ sin( 12 s)| ≤ C für 0 < s ≤ π.
1 
Sei jetzt ε > 0 vorgegeben. Wir wählen = (ε, x) := min 2
d(x), ε/4M C .
Dann erhalten wir für das zweite Integral in (3)
 π      π   π 
(4)  Dn f  ≤  Dn f  +  Dn f  ≤ ε +  Dn f  .
0 0 
4 

Zur Untersuchung von Dn f setzen wir

f (s)
g(s) := .
sin 12 s
Nach der Abschätzung oben gilt | g(s) | ≤ M C für 0 < s < d(x), also ist g
beschränkt: | g(s) | ≤ K für 0 < s ≤ π. Sind s1 < · · · < sm−1 die Sprung–
oder Knickstellen von u . in [ , π] und setzen wir s0 := , sm := π, so ergibt
partielle Integration
π π 
m sk
2π f (s) Dn (s) ds = g(s) sin(n + 12 ) s ds = g(s) sin(n + 12 ) s ds
  k=1 sk−1

1 m 
  π
g(s) cos(n + 12 ) s sk
s
= 1
− + g  (s) cos(n + 12 ) s ds .
n+ 2 k=1
k−1

144 § 6 Separationsansätze und Fourierreihen

Sei N die Gesamtzahl der Sprung– oder Knickstellen von u . in [−π, π], ferner
M := 1 + sup {| g  (s) | | s ∈ [ , π] \ S}. Damit erhalten wir
 π 
(5)  Dn f  ≤ 1
(2mK + πM ) ≤ 1
(2N K + πM ) =: 1
C .
n+1 n n


 π 
Für n > 4C /ε gilt also  Dn f  < ε4 .
0
Die Abschätzung für das erste Integral in (3) verläuft analog.
(e) Gleichmäßige Konvergenz . Die Zahl hängt definitionsgemäß von ε und x
ab. Ist aber [a, b] ein kompaktes Intervall ohne Sprungstellen von u ., also mit
positivem Abstand δ zu S, so gilt d(x) ≥ δ für alle x ∈ [a, b]. Wählen wir zu
gegebenem ε > 0 jetzt = (ε) := min 21 δ, ε/4M C , so gilt die Abschätzung
(4) für alle x ∈ [a, b], und die Konstanten M , C in (5) hängen nicht von x
ab. 2

2.6 Aufgaben
(a) Bestimmen Sie für folgende Funktionen u die Fourierreihe. Diskutieren Sie
deren Konvergenzverhalten, und skizzieren Sie die ersten Fourierpolynome.
(
1 für 0 ≤ x ≤ π ,
(i) u(x) =
−1 für − π ≤ x < 0 .
. beschreibt eine Sägezahnfunktion, wie sie bei
(ii) u(x) = x für | x | ≤ π. (u
Kippschwingungen auftritt, vgl. die Figur in 2.4.)
(iii) u(x) = | sin x| für |x| ≤ π .

(b) Für u ∈ C2 [−π, π] seien an , bn die Fourierkoeffizienten von u und


π π
an := 1
π
u (x) cos nx dx , bn := 1
π
u (x) sin nx dx
−π −π

die Fourierkoeffizienten von u . Zeigen Sie mit partieller Integration, dass
1
an = − an , falls u (−π) = u (π) ,
n2
1
bn = − bn , falls u(−π) = u(π) .
n2

(c) Entwickeln Sie 1


4
x2 in eine Fourierreihe und folgern Sie die Eulerschen
Formeln


1 π2 

1 π2
= , (−1)n−1 = .
n2 6 n2 12
n=1 n=1
2 Fourierreihen 145

2.7 Das Abklingverhalten der Fourierkoeffizienten



Satz. (a) Für die Fourierkoeffizienten ck = 1

u(t) e−ikt dt einer stückweise
−π
stetigen Funktion u auf [−π, π] gilt


| ck |2 < ∞ , lim ck = 0 .
k=−∞ | k |→∞

(b) Für u ∈ PC1 [−π, π] mit u(π) = u(−π) gilt



∞ 

|k ck |2 < ∞ , | ck | < ∞ , lim k ck = 0 .
k=−∞ k=−∞ | k |→∞

(c) Ist u Cr –differenzierbar, u(r) ∈ PC1 [−π, π] und u(m) (π) = u(m) (−π) für
m = 0, . . . , r, so gilt

∞  r+1 2 

 k ck  < ∞ , | kr ck | < ∞ .
k=−∞ k=−∞

(d) Die reellen Fourierkoeffizienten ak = ck + c−k , bk = i(ck − c−k ) zeigen


dasselbe Abklingverhalten.
Wir halten fest: Je glatter eine periodische Funktion ist, desto schneller fallen
ihre Fourierkoeffizienten ab.

Beweis.
(a) Wir stellen zunächst fest, dass mit den Bezeichnungen 2.3 (e)

.(x) für x ∈ [−π, π]}


V := {u ∈ PC[−π, π] | u(x) = u

1

ein –Vektorraum ist, auf dem u , v := 2π
u v ein Skalarprodukt liefert,
−π
Letzteres wegen der Festlegung der Funktionswerte an den Sprungstellen ÜA .
Durch vk (x) = eikx (k ∈ ) ist ein Orthonormalsystem in V gegeben mit
ck = vk , u . Nach § 9 : 4.3 oder Bd.1 § 19 : 2.5 ergibt sich für beliebige m, n ∈ 
die Besselsche Ungleichung

m 
m
1

| ck |2 = | vk , u |2 ≤ u2 = 2π | u |2 < ∞ .
k=−n k=−n −π

(b) Für PC1 –Funktionen ist nach 2.3 (b) partielle Integration erlaubt. Es folgt
π π π
1 u(t) e−ikt  1 ck
ck = 2π u(t) e−ikt dt = −2ikπ  + 2πik u (t) e−ikt dt = ik ,
−π −π −π
146 § 6 Separationsansätze und Fourierreihen

wobei ck die Fourierkoeffizienten von u ∈ PC [−π, π] sind. Dabei wurde aus-
genützt, dass e−ikπ | ck | < ∞,
ikπ 2
 =e und u(π) = u(−π). Nach (a) gilt
also konvergiert | ck | wegen

| ck | ≤ | ck | +
2
| ck | = 1
|k|
1
2
1
k2

nach dem Majorantenkriterium.


(c) ergibt sich durch mehrfache Anwendung von (b) oder mehrfache partielle
Integration ÜA .
(d) Nach 2.1 (b) gilt ak = ck + c−k , bk = i (ck − c−k ), also
| ak |, | bk | ≤ | ck | + | c−k |, | ak |2 , | bk |2 ≤ 2 | ck |2 + 2 | c−k |2 . 2

2.8 Gleichmäßige Entwicklung in Sinus– und Kosinusreihen


(a) Jede PC1 –Funktion u auf [0, L] mit u(0) = u(L) = 0 läßt sich in eine
gleichmäßig konvergente Sinusreihe entwickeln:

∞ L
πkx 2 πkt
u(x) = bk sin mit bk = u(t) sin dt .
L L L
k=1
0


Dabei gilt | bk | < ∞, darüberhinaus
k=1


k | bk | < ∞ , falls zusätzlich u ∈ C2 [0, L] ,
k=1
∞
k2 | bk | < ∞ , falls zusätzlich u ∈ C3 [0, L] und u (0) = u (L) = 0.
k=1

(b) Jede PC1 –Funktion u auf [0, L] besitzt eine gleichmäßig konvergente Ent-
wicklung in eine Kosinusreihe

∞ L
1 πkx 2 πkt
u(x) = a0 + ak cos mit ak = u(t) cos dt .
2 L L L
k=1

∞ 0

Es gilt | ak | < ∞, darüberhinaus


k=0


k | ak | < ∞ , falls u ∈ C2 [0, L] und u (0) = u (L) = 0 ,
k=1
∞
k2 | ak | < ∞ , falls u zusätzlich C3 –differenzierbar ist.
k=1

Nach 2.1 dürfen wir L = π annehmen. Denn mit v(t) := u(Lt/π) gilt

∞ 

u(x) = bk sin kπ
L
x für x ∈ [0, L] ⇐⇒ v(t) = bk sin kt für t ∈ [0, π]
k=1 k=1

und
2 Fourierreihen 147

2
L kπ 2
L π kπt 2

bk = L
u(t) sin L
t dt = L
v( L t) sin L
dt = π
v(s) sin ks ds .
0 0 0

Für u ∈ PC1 [0, π] definieren wir die ungerade Fortsetzung f und die gerade
Fortsetzung g auf [−π, π] durch
( (
u(x) für x ≥ 0 u(x) für x ≥ 0
f (x) := , g(x) := .
−u(−x) für x < 0 u(−x) für x < 0

Hilfssatz. Es gilt:
f ∈ PC1 [−π, π], f (π) = f (−π) ⇐⇒ u(0) = u(π) = 0.
f ∈ C1 [−π, π], f (π) = f (−π) ⇐⇒ u ∈ C1 [0, π], u(0) = u(π) = 0.
f ∈ C2 [−π, π], f (π) = f (−π), f  (π) = f  (−π) ⇐⇒
u ∈ C2 [0, π], u(0) = u(π) = u (0) = 0.
f ∈ C3 [−π, π], f (m) (π) = f (m) (−π) für m = 0, 1, 2 ⇐⇒
u ∈ C3 [0, π] , u(0) = u (0) = u(π) = u (π) = 0.
g ∈ PC1 [−π, π], g(π) = g(−π) = 0.
g ∈ C1 [−π, π] ⇐⇒ u (0) = 0.
g ∈ C2 [−π, π], g(π) = g(−π), g  (π) = g  (−π) ⇐⇒
u ∈ C2 [0, π], u (0) = u (π) = 0.
g ∈ C2 [−π, π], g  ∈ PC1 [−π, π], g (m) (π) = g (m) (−π) für m = 0, 1, 2 ⇐⇒
u ∈ C3 [0, π], u (0) = u (π) = 0.
Beweis als ÜA . Beachten Sie, dass f  , f  , g  gerade und f  , g  , g  ungerade
Funktionen sind.

Beweis von 2.8.


Die Fortsetzungen f, g von u erfüllen die Voraussetzungen für die gleichmäßige
Entwickelbarkeit nach 2.4. Für die Fourierkoeffizienten von f gilt
1
π 2

ak = 0, bk = π
f (t) sin kt dt = π
u(t) sin kt dt ,
−π 0

da f (t) cos kt ungerade und f (t) sin kt gerade ist.


Entsprechend gilt für die Fourierkoeffizienten von g
2

ak = π
u(t) cos kt dt , bk = 0 .
0

Für die übrigen Behauptungen beachten wir 2.7 und den Hilfssatz ÜA . 2
148 § 6 Separationsansätze und Fourierreihen

2.9 Der Weierstraßsche Approximationssatz


Jede auf einem kompakten Intervall [a, b] stetige Funktion f ist dort gleich-
mäßiger Limes einer Folge von Polynomen.
Beweis.
 
(a) Es genügt, das Intervall − π2 , π2 zugrundezulegen. Der allgemeine Fall läßt
sich durch Umskalierung auf diesen zurückführen.
 
(b) Sei ε > 0 gegeben. Da f auf − π2 , π2 gleichmäßig stetig ist, gibt es eine
Polygonfunktion g, d.h. eine Funktion,
 deren Graph ein Streckenzug ist, so dass
| f (x) − g(x) | < ε für alle x ∈ − π2 , π2 .
(c) Diese setzen wir zu einer Polygonfunktion G auf [−π, π] mit G(π) =
G(−π) fort. Da G stückweise glatt ist, gibt es nach 2.4 ein Fourierpolynom
S mit

| S(x) − G(x) | < ε für alle x ∈ [−π, π] .


 
(d) S ist analytisch auf Ê
, also durch eine auf − π2 , π2 gleichmäßig konver-
gente Taylorreihe um den Nullpunkt entwickelbar. Wir wählen eine Teilsumme
p dieser Potenzreihe mit | p(x) − S(x) | < ε für | x | < π2 und haben so ein
Polynom p gewonnen mit
π π
| f (x) − p(x) | < 3ε für − ≤x≤ . 2
2 2

3 Die schwingende Saite II


3.1 Entwicklungs- und Eindeutigkeitssatz für die schwingende Saite
Jede Saitenschwingung entsteht durch Superposition von harmonischen Schwin-
gungen. Der zeitliche Ablauf ist durch die Auslenkung und deren Geschwindig-
keit zu einem Zeitpunkt (den wir t = 0 wählen) eindeutig bestimmt:
Satz. Jede Lösung u der Wellengleichung

∂2u 2
2 ∂ u
= c
∂t2 ∂x2
mit u(0, t) = u(L, t) = 0 besitzt in [0, L] × Ê eine Reihendarstellung


πkc πkc
 πk
(∗) u(x, t) = ak cos t + bk sin t sin x,
L L L
k=1
∂u
vgl. 1.3. Die Koeffizienten sind durch u(x, 0), ∂t
(x, 0) eindeutig bestimmt:
L L
2 πk 2 ∂u πk
ak = u(x, 0) sin x dx , bk = (x, 0) sin x dx .
L L πkc ∂t L
0 0
3 Die schwingende Saite II 149


Die Reihe (∗) hat die konvergente Majorante (| ak | + | bk |), konvergiert also
absolut und gleichmäßig.

Beweis.
(a) Fourierentwicklung bei festem t. Nach der Problemstellung 1.1 ist die Funk-
tion ut : x → u(x, t) für jedes t ∈ Ê
C2 –differenzierbar in [0, L], und es gilt
ut (0) = ut (L) = 0. Aus dem Entwicklungssatz 2.8 (a) ergibt sich


πk 2 L πk
u(x, t) = ut (x) = ck (t) sin x mit ck (t) = u(x, t) sin L
x dx
L L0
k=1

gleichmäßig bezüglich x ∈ [0, L] bei festem t.


(b) Die Gestalt der Fourierkoeffizienten ck (t). Die Wellengleichung liefert unter
Verwendung des Satzes über Parameterintegrale (Bd. 1, § 23 : 2.3)
L L
2 ∂2u πkx 2c2 ∂2u πkx
c̈k (t) = 2
(x, t) sin dx = (x, t) sin dx .
L ∂t L L ∂x2 L
0 0

Durch zweimalige partielle Integration folgt ÜA

 2 L  2
2 πkc πkx πkc
c̈k (t) = − u(x, t) sin dx = − ck (t) ,
L L L L
0

d.h. ck erfüllt die Schwingungsgleichung c̈k + (πkc/L)2 ck = 0 . Es folgt


πkc πkc
ck (t) = ak cos t + bk sin t
L L
mit geeigneten ak , bk .
(c) Bestimmung der Koeffizienten ak , bk . Wir setzen
∂u
f (x) := u(x, 0) und g(x) := (x, 0) .
∂t
Dann gilt
L L
2 πkx 2 πkx
(1) ak = ck (0) = u(x, 0) sin dx = f (x) sin dx .
L L L L
0 0

Nach dem Satz über Parameterintegrale ergibt sich weiter


L L
πkc 2 ∂u πkx 2 πkx
(2) bk = ċk (0) = (x, 0) sin dx = g(x) sin dx .
L L ∂t L L L
0 0
150 § 6 Separationsansätze und Fourierreihen

(d) Gleichmäßige Konvergenz in [0, L] × Ê.


Nach Voraussetzung gilt f ∈ C [0, L], f (0) = f (L) = 0 . Daher konvergiert die
2



Reihe | ak | nach 2.8 (a).
k=1


Wegen g ∈ C[0, L] und (2) konvergiert die Reihe | k bk |2 nach 2.7 (d). Nun
k=1
ist

| bk | = | k b k | 1
k
≤ 1
2
| k bk | 2 + 1
k2
,


also konvergiert die Reihe | bk |. Nach dem Majorantenkriterium folgt die
Ê.
k=1
gleichmäßige Konvergenz der Reihe (∗) in [0, L] × 2

3.2 Lösung des Anfangs–Randwertproblems mit der Separationsme-


thode
Nach dem Entwicklungssatz 3.1 hat jede Lösung der Wellengleichung mit der
Einspannbedingung notwendig die Gestalt (∗). Wir zeigen jetzt die Existenz
einer Lösung des Anfangs–Randwertproblems von 1.1
∂2u 2
2 ∂ u ∂u
= c , u(0, t) = u(L, t) = 0 , u(x, 0) = f (x) , (x, 0) = g(x).
∂t2 ∂x2 ∂t
Dazu kehren wir die Argumentation in 3.1 um und machen daraus ein konstruk-
tives Lösungsverfahren auf der Basis der Separationsmethode.

Existenzsatz. Gegeben seien Anfangsdaten f ∈ C3 [0, L], g ∈ C2 [0, L] mit


f (0) = f (L) = f  (0) = f  (L) = 0 , g(0) = g(L) = 0 .
Setzen wir
L L
2 πkx 2 πkx
ak = f (x) sin dx , bk = g(x) sin dx ,
L L πkc L
0 0

so ist durch
∞  
 πkt πkt πkx
(∗) u(x, t) = ak cos + bk sin sin
L L L
k=1

eine Lösung u ∈ C2 ([0, L] × Ê) des Anfangs–Randwertproblems gegeben.


Bemerkung. Die Differenzierbarkeitsbedingungen an die Anfangsdaten sind
um eine Stufe höher als natürlicherweise zu erwarten ist. Ein weiterer Existenz-
beweis unter optimalen Differenzierbarkeitsbedingungen an die Anfangsdaten
wird in 3.4 (b) gegeben.
3 Die schwingende Saite II 151

Beweis.

∞ 

Nach 2.8 (a) konvergieren die Reihen k 2 | ak | , k2 | bk | . Die erste ist eine
k=1 k=1

∞ 
∞ 

Majorante für | ak | und k | ak | , die zweite eine Majorante für | bk |
k=1 k=1 k=1


und k | bk |. Daher gilt:
k=1

(a) Die Reihe (∗) hat die Majorante (| ak | + | bk |) , konvergiert also gleich-
Ê
mäßig für (x, t) ∈ 2 und stellt eine dort stetige Funktion u dar.
(b) Die gliedweise nach t differenzierte Reihe ist gleichmäßig konvergent, denn


sie hat die Majorante const · k (| ak | + | bk |). Nach dem Satz über gliedweise
k=1
Differentiation (Bd. 1, § 12 : 3.6) gilt somit

∞  
∂u πkc πct πct πx
(x, t) = −ak sin + bk cos sin
∂t L L L L
k=1

gleichmäßig für (x, t) ∈ Ê , und


2 ∂u
∂t
ist stetig als gleichmäßiger Limes stetiger
Funktionen.
(c) Die letzte Reihe ist nochmals gliedweise nach t differenzierbar, denn die


abgeleitete Reihe hat die Majorante const · k2 (| ak | + | bk |). Entsprechendes
k=1
gilt für die partiellen Ableitungen nach x . Schreiben wir (∗) in der Form


u(x, t) = uk (x, t) ,
k=1

so folgt u ∈ C2 ( Ê ) und
2


∞  
∂2u 2
2 ∂ u ∂ 2 uk 2
2 ∂ uk
− c = − c = 0,
∂t2 ∂x2 ∂t2 ∂x2
k=1

da die uk nach 1.2 Lösungen der Wellengleichung sind.


(d) Aus (∗) folgt unmittelbar u(0, t) = u(L, t) = 0.
Ferner gilt nach 2.8 (a)


πkx ∂u  πkc ∞
πkx
u(x, 0) = ak sin = f (x), (x, 0) = bk sin = g(x)
L ∂t L L
k=1 k=1
wegen
L L
2 πkx 2 πkx
ak = f (x) sin dx , bk = g(x) sin dx . 2
L L πkc L
0 0
152 § 6 Separationsansätze und Fourierreihen

3.3 Aufgabe. Geben Sie die Lösung des oben gestellten Saitenproblems an
für den Fall L = c = 1, f (x) = x4 − 2x3 + x, g = 0 an. Welche Näherung
ergibt sich für u(x, t), wenn die Reihe nach dem Glied abgebrochen wird, für
das erstmalig | an /a1 | < 0.5 · 10−3 wird?

3.4 Die Lösungsdarstellung von d’Alembert


(a) Die Reihendarstellung für die Lösung des Anfangs–Randwertproblems der
schwingenden Saite läßt sich in einen geschlossenen Ausdruck überführen: Hier-
zu setzen wir die gegebenen Anfangswerte f und g ungerade auf [−L, L] und
anschließend 2L–periodisch auf Ê
fort. Die dabei entstehenden Funktionen be-
zeichnen wir mit F und G (machen Sie eine Skizze).

Satz. Unter den Voraussetzungen des Existenzsatzes 3.2 hat die Lösung die
Darstellung

1
 1
x+ct
u(x, t) = 2 F (x + ct) + F (x − ct) + 2c G(s) ds
x−ct

für x ∈ [0, L], t ∈ Ê.


Bemerkungen. (i) Die Lösung hat die Form u(x, t) = ϕ(x + ct) + ψ(x − ct)
und ist damit Überlagerung einer ein– und einer auslaufenden Welle ÜA .
(ii) D’Alembert gewann diese Formel 1747 aus der Konstanz von ∂u ∂t
± c ∂u
∂x
längs jeder Geraden mit der Gleichung x ± ct = const, siehe (§ 7 : 1.6 und
§ 17 : 3.1). Das allgemeine Verfahren, Lösungen von Differentialgleichungen auf
diese Art zu gewinnen, ist die in § 7 behandeln Charakteristikenmethode.

Beweis
Nach 3.2 besteht für die Lösung die Darstellung
∞ 
 
πkt πkt πkx
(∗) u(x, t) = ak cos + bk sin sin
L L L
k=1

Wir verwenden die aus den Additionstheoremen folgenden Beziehungen



cos α sin β = 1
2
sin(β + α) + sin(β − α) ,

sin α sin β = 1
2
cos(β − α) − cos(β + α) ,

und erhalten nach dem Umordnungssatz für absolut konvergente Reihen


 
1 

πk πk
u(x, t) = ak sin ((x + ct) + sin ((x − ct)
2 L L
(1) k=1
 
πk πk
− bk cos (x + ct) − cos (x − ct) .
L L
3 Die schwingende Saite II 153

Nach 2.8 (a) und den Formeln für die ak , bk in 3.2 gilt auf [0, L]


πkx 

πkx
(2) F (x) = ak sin , G(x) = bk sin ,
L L
k=1 k=1


wobei die Reihe k | bk | konvergiert. Da F, G nach Definition ungerade und
Ê. Daher ergibt gliedweise Integration
k=1
2L–periodisch sind, gilt (2) auf ganz

x+ct 
∞  πk πk

G(s) ds = c bk cos (x − ct) − cos (x + ct) .
x−ct
L L
k=1

Dies liefert zusammen mit (1), (2) die Behauptung des Satzes. 2

(b) Die d’Alembertsche Formel ermöglicht einen Existenzbeweis unter optima-


len Differenzierbarkeitsbedingungen an die Anfangsdaten:

Satz. Für f ∈ C2 [0, L], g ∈ C1 [0, L] mit f (0) = f (L) = f  (0) = f  (L) = 0,
g(0) = g(L) = 0 liefert die Formel

x+ct
1 1
u(x, t) = F (x + ct) + F (x − ct) + G(s) ds
2 2c
x−ct

Ê
eine Lösung u ∈ C2 ([0, L] × ) des Anfangs–Randwertproblems 3.2. Nach 3.1
besitzt diese eine eindeutig bestimmte Reihenentwicklung (∗).
Denn nach dem Hilfssatz in 2.8 ist die rechte Seite C2 –differenzierbar auf 2 . Ê
Dass die Wellengleichung und die Randbedingungen erfüllt sind, ist leicht nach-
zurechnen ÜA .

3.5 Energieerhaltung und Eindeutigkeit der Lösung


Unter den im letzten Satz gemachten Voraussetzungen ist die Energie der
schwingenden Saite, nach § 1 : 2.2 bis auf einen Faktor gegeben durch
L  2  ∂u 2 
1 ∂u 2
E(t) = 2
+c (x, t) dx ,
∂t ∂x
0
zeitlich konstant.
Denn wegen u ∈ C2 ([0, L] × Ê) gilt nach dem Satz über Parameterintegrale
L  
∂u ∂ 2 u ∂u ∂ 2 u
Ė(t) = 2
+ c2 dx
∂t ∂t ∂x ∂t∂x
0
L  
2 ∂u ∂ 2 u ∂u ∂ 2 u
= c 2
+ dx
∂t ∂x ∂x ∂x∂t
0
154 § 6 Separationsansätze und Fourierreihen

L   
∂ ∂u ∂u ∂u ∂u x=L
= c2
dx = c2 (x, t) (x, t)  = 0,
∂x ∂t ∂x ∂t ∂x x=0
0

Letzteres ergibt sich durch Differentiation von u(L, t) = u(0, t) = 0 nach t.

Aus der Energieerhaltung ergibt sich ebenfalls die Eindeutigkeit der Lösung für
das Anfangs–Randwertproblem 3.2:
Sind nämlich u1 , u2 Lösungen, so gilt für die Differenz u := u1 − u2

∂2u 2
2 ∂ u ∂u
= c , u(0, t) = u(L, t) = 0 , u(x, 0) = (x, 0) = 0 .
∂t2 ∂x2 ∂t
Wegen der Wellengleichung folgt ∂u
∂x
(x, 0) = 0, also verschwindet die Energie
von u zur Zeit t = 0 und somit für alle Zeiten t nach dem Erhaltungssatz.
E(t) = 0 bedeutet

∂u ∂u
(x, t) = (x, t) = 0 für 0 ≤ x ≤ L ,
∂x ∂t
somit Konstanz von u. Aus den Randbedingungen folgt nun u1 − u2 = 0.

3.6 Aufgabe zur modellhaften Veranschaulichung der Wellenausbreitung.


Wählen Sie in der d’Alembertschen Darstellung
 3.4 als Anfangsdaten
 g = 0 und
für f die charakteristische Funktion von 12 L − ε , 12 L + ε . (Aus dieser kann
durch Abrunden der Ecken eine C2 –Funktion gemacht werden, für welche aber
die d’Alembertsche Formel den gleichen Bewegungsablauf liefert.) Skizzieren Sie
die Momentaufnahmen des Saitenprofils x → u(x, t) für die Zeiten t0 = 0, t1 =
L/4c, t2 kurz vor L/2c, t3 kurz nach L/2c, t4 = 3L/4c, t5 = L/c. Skizzieren
Sie die Bahnen der Schwerpunkte der beiden entstehenden Wellenpakete in der
(x, t)–Ebene.

3.7 Die schwingende Saite unter äußeren Kräften


Hier haben wir es mit dem AWP für die inhomogene Wellengleichung

∂2u ∂2u
(a) 2
− c2 = F in 0 < x < L, t > 0 ,
∂t ∂x2

(b) u(0, t) = u(L, t) = 0

Ê
zu tun, wobei die Kraftdichte F (x, t) in [0, L] × + stetig differenzierbar sein
soll mit F (0, t) = F (L, t) = 0 für t ≥ 0. Wir dürfen uns darauf beschränken,
nach Lösungen zu suchen, welche die homogenen Randbedingungen
∂u
(c) u(x, 0) = (x, 0) = 0
∂t
3 Die schwingende Saite II 155

erfüllen. Denn haben wir eine solche gefunden, und ist v eine Lösung der homo-
genen Wellengleichung mit v(x, 0) = f (x), ∂v∂t
(x, 0) = g(x), so ist u + v eine
Lösung von (a), (b) mit diesen Anfangswerten zur Zeit 0.
Die inhomogene Wellengleichung erlaubt die Behandlung von Streichvorgängen
bei Saiteninstrumenten. Z.B. erzeugt ein mit Kolophonium behafteter Bogen
eine im Zeitverlauf sägezahnartige Krafteinwirkung.
Nicht unter den Aufgabentyp (a) fällt das Problem der schweren Saite“, vgl.

die folgende Aufgabe (b).
Um die Separationsmethode in modifizierter Form anwenden zu können, haben
wir F zunächst gemäß 2.8 in eine Sinusreihe


∞ L
πkx 2 πkx
F (x, t) = Fk (t) sin mit Fk (t) = F (x, t) sin dx
L L L
k=1
0

zu entwickeln. Dann suchen wir nichtverschwindende Produktlösungen uk (x, t)


= vk (x) wk (t) der inhomogenen Wellengleichungen

∂2u ∂2u πkx


2
(x, t) − c2 (x, t) = Fk (t) sin (k = 1, 2, . . .),
∂t ∂x2 L

mit vk (0) = vk (L) = 0. Analog zu 1.2 erhalten wir ÜA

πkx
vk (x) = ck sin mit ck = 0
L
und wegen (c)
 2
πkc
ẅk (t) − wk = Fk (t) , wk (0) = ẇk (0) = 0 .
L
Variation der Konstanten ergibt für k = 1, 2, . . .
t
L πkc
wk (t) = Fk (s) sin (t − s) ds .
πkc L
0

Ähnlich wie in 3.1 kann gezeigt werden, dass sich jede Lösung u als Superposition



πkx
(∗) uk (x, t) = wk (t) sin
L
k=1

darstellen läßt. Wir überlassen das den Lesern als Aufgabe. Verlangen wir von
F eine Differenzierbarkeitsstufe mehr, so läßt sich wiederum zeigen, dass (∗)
eine Lösung der oben gestellten Aufgabe liefert.
156 § 6 Separationsansätze und Fourierreihen

Ähnlich wie in 3.4 können wir unter geeigneten Konvergenzvoraussetzungen für


die Reihe (∗) für u einen geschlossenen Ausdruck angeben:

1 t  
x+c(t−s)
(∗∗) u(x, t) = F (y, s) dy ds für 0 ≤ x ≤ L , t ≥ 0 .
2c 0 x−c(t−s)

Dabei wurde die ungerade, 2L–periodische Fortsetzung von x → F (x, t) wie-


der mit F bezeichnet. Der Integrationsbereich in (∗∗) ist das charakteristische

Dreieck“ mit den Ecken (x−ct, 0), (x+ct, 0) und (x, t) (machen Sie eine Skizze).

Satz. Unter den oben genannten Voraussetzungen über F liefert die Formel
(∗∗) eine Lösung des Problems (a),(b),(c).
Beweis als Aufgabe: Verwenden Sie bei der Differentiation die Formel
t t
d ∂G
G(t, s) ds = G(t, t) + (t, s) ds ,
dt ∂t
0 0

die sich durch Anwendung der Kettenregel auf ϕ(ψ1 (t), ψ2 (t)) mit ϕ(u, v) :=
u
G(v, s) ds und ψ1 (t) = ψ2 (t) = t ergibt.
0

Aufgaben. (a) Berechnen Sie u( 14 , 1) für L = 1, F (x, t) = t sin2 (πx).


(b) Eine eingespannte Saite der Länge L im konstanten Schwerefeld der Erde
werde so unterstützt, dass sie in der x–Achse liegt. Zur Zeit t = 0 werde die
Unterstützung entfernt (u(x, 0) = ∂u∂t
(x, 0) = 0). Welche Art von Bewegung
führt die Saite aus?
Anleitung. Auf die konstante Schwerkraft pro Längeneinheit F (x, t) = − k
läßt sich die oben beschriebene Methode nicht anwenden, weil dort F (0, t) =
F (L, T ) = 0 vorausgesetzt wird. Helfen Sie sich so, dass sie zunächst die zeitu-
nabhängige Lösung v(x, t) = v(x) des Randwertproblems
∂2v ∂2v
2
− c2 = − k , v(0) = v(L) = 0
∂t ∂x2
bestimmen, und schreiben Sie die gesuchte Lösung in der Form u = v + w, wo
w aus der Formel (∗∗) gewonnen wird. Welches Glattheitsverhalten zeigt die so
gewonnene formale Lösung?

4 Wärmeleitung im Draht
4.1 Problemstellung
Ein wärmeleitfähiger Draht der Länge L, repräsentiert durch das Intervall [0, L]
der x–Achse, habe an der Stelle x zur Zeit t > 0 die Temperatur u(x, t). Dann
4 Wärmeleitung im Draht 157

folgt aus der Kontinuitätsgleichung für die Wärmemenge § 1 : 2.5, wenn wir die
physikalischen Konstanten durch Umskalierung der Zeit auf 1 setzen, die DG
∂u ∂2u
(a) (x, t) = (x, t) für 0 < x < L, t > 0 .
∂t ∂x2
Durch ein Wärmebad halten wir die Drahtenden zunächst auf gleicher konstan-
ter Temperatur. Wählen wir diese als Nullpunkt der Temperaturskala, so gilt
also
(b) u(0, t) = u(L, t) = 0 für t ≥ 0 .
Gegeben ist die Anfangstemperaturverteilung
(c) u(x, 0) = f (x) mit f ∈ PC1 [0, L], f (0) = f (L) = 0.
Gesucht ist die Zeitentwicklung für t ≥ 0.
Den allgemeinen Fall u(0, t) = α, u(L, t) = β behandeln wir in 4.8 (f).
Von den Lösungen u verlangen wir die Existenz von ∂u/∂t, ∂u/∂x und ∂ 2 u/∂x2
Ê Ê
in ]0, L[ × >0 sowie die Stetigkeit auf [0, L] × >0 . Anders als bei der schwin-
genden Saite folgt aus diesen schwächeren Voraussetzungen bereits die C∞ –
Differenzierbarkeit der Lösung für t > 0. Demgemäß gehen wir auch beweis-
technisch etwas anders vor.
In 4.5 und 4.6 werden weitere Randbedingungen betrachtet.

4.2 Produktlösungen und Superpositionsansatz


Der Produktansatz u(x, t) := v(x) w(t) mit nichtverschwindenden v ∈ C2 [0, L],
Ê
w ∈ C1 ( +) führt ganz ähnlich wie in 1.2 auf das Randwertproblem

(I) v (x) + λv(x) = 0 , v(0) = v(L) = 0 ,
und die gewöhnliche DG
(II) w (t) + λw(t) = 0 .
Wie in 1.2 ergibt sich λ = (πk/L)2 mit k ∈ , und durch Lösung der Diffe-
rentialgleichungen 4.1 (I), (II) erhalten wir:
Sämtliche Produktlösungen von 4.1 (a) und (b) sind Vielfache von
πk 2 πkx
uk (x, t) := e−( L ) t sin .
L
Für die gesuchte, die Anfangsbedingung (c) erfüllende Lösung machen wir den


Ansatz u(x, t) = ak uk (x, t). Die Koeffizienten ak ergeben sich dann gemäß
k=1
2.8 (a) aus


πkx
f (x) = u(x, 0) = ak sin .
k=1 L
158 § 6 Separationsansätze und Fourierreihen

4.3 Existenz einer Lösung


Satz. Für jede stückweise glatte Anfangsverteilung f der Temperatur mit f (0) =
f (L) = 0 besitzt das Wärmeleitungsproblem 4.1 (a),(b),(c) die Lösung


πk )2 t πkx 2 L
(∗) u(x, t) = ak e−( L sin mit ak = f (x) sin πkx
L
dx .
L L0
k=1
In 4.7 zeigen wir, dass dies die einzige Lösung ist.
Bemerkung. Im Vergleich zur Wel-
lengleichung zeigt sich hier ein we-
sentlicher Unterschied: Bei einer nur 6
stückweise glatten Anfangsverteilung
erhalten wir für t > 0 eine C∞ – f
differenzierbare Temperaturverteilung,
wie der Beweis zeigt. Dagegen kann
u1
die Lösung der Wellengleichung nie-
mals glatter sein als die Anfangsda-
ten, wie sich aus der d’Alembertschen u2
Lösungsdarstellung ergibt. Die Figur
u3
•-
zeigt eine stückweise glatte Anfangs-

verteilung f und einige Temperatur- 0 L x
profile.
Beweis.
Die Anfangsverteilung f ∈ PC1 [0, L] besitzt nach 2.8 (a) die Reihendarstellung


πkx 2
L πkx
f (x) = ak sin L mit ak = L f (x) sin L dx ,
k=1 0
∞ 
wobei die Reihe | ak | konvergiert. Die Folge (ak ) ist als Nullfolge beschränkt.
k=1
Für n = 0, 1, . . . und τ > 0 besteht die Ungleichung
 πk n 2

L e−(πk/L) τ
≤ C
k2 mit einer Konstanten C = C(n, τ ) > 0 ,
( ÜA mit Bd. 1, § 3 : 2.3 (f)), woraus folgt
∞ 
 2 

n
(∗∗) πk
L
| ak | e−(πk/L) τ
≤ const · 1
k2
< ∞.
k=1 k=1
Für τ > 0 setzen wir Kτ := {(x, t) | 0 ≤ x ≤ L , t ≥ τ }. Die Vereinigung aller
Kτ mit t > 0 ist H := {(x, t) | 0 ≤ x ≤ L , t > 0}. Durch


πk )2 t
(∗) u(x, t) := ak e−( L sin πkx
L
k=1

ist eine auf H stetige Funktion gegeben, denn diese Reihe hat die Majorante

| ak |, konvergiert also gleichmäßig auf H.
4 Wärmeleitung im Draht 159

Für n = 1 und n = 2 liefert (∗∗) auf Kτ = { t ≥ τ } Majoranten für die Reihen



∞ ∞ 

πk )2 t 2 πk )2 t
πk
L
ak e−( L cos πkx
L
, πk
L
ak e−( L sin πkx
L
.
k=1 k=1

Nach dem Satz über gliedweise Differentiation liefert die erste der beiden Rei-
hen ∂x u(x, t), die zweite sowohl ∂x ∂x u(x, t) als auch ∂t u(x, t). Daher ist die
Wärmeleitungsgleichung 4.1 (a) in jedem Bereich Kτ mit τ > 0 erfüllt, und
damit auch in H.
Ganz analog schließen wir, dass die Funktion u in H = {t > 0} beliebig oft
gliedweise differenzierbar ist, weil (∗∗) für beliebiges n und beliebiges τ > 0 auf
Kτ Majoranten liefert. 2

4.4 Aufgabe. Sei L = π und



x2 für 0 ≤ x ≤ 12 π
f (x) = .
(x − π)2 für 1
2
π ≤x≤π

Bestimmen Sie für die Darstellung (∗) die Partialsumme mit den ersten drei
nichtverschwindenden Gliedern und skizzieren Sie die so gewonnene Näherungs-
lösung für einige Werte von t > 0.

4.5 Wärmeleitung bei Neumannschen Randbedingungen


Das Wärmeleitungsproblem für einen Draht der Länge L bei wärmeisolierten
Drahtenden lautet: Zu einer gegebenen stetigen Funktion f auf [0, L] ist eine
Lösung u gesucht von
∂u ∂2u
(a) = für 0 < x < L , t > 0 ,
∂t ∂x2
∂u ∂u
(b) (0, t) = (L, t) = 0 für t ≥ 0 ,
∂x ∂x

(c) u(x, 0) = f (x) für 0 ≤ x ≤ L .

Von den Lösungen wird neben den Bedingungen 4.1 verlangt, dass x → u(x, t)
für festes t ≥ 0 zu C1 [0, L] gehört.
Produktansatz und Superposition führen hier auf die Lösungsdarstellung

1 

πk 2 πkx
(∗) u(x, t) = a0 + ak e−( L ) t cos mit
2 L
k=1
L
2 πkx
ak = f (x) cos dx (k = 0, 1, 2, . . .) .
L L
0
160 § 6 Separationsansätze und Fourierreihen

Für stückweise glatte Anfangstemperaturverteilungen f liefert die Reihe (∗) eine


für t > 0 beliebig oft differenzierbare Lösung des Randwertproblems (a),(b),(c).
Die Übertragung der Rechnung 4.2 und des Beweises 4.3 – diesmal mit dem Satz
2.8 (b) über Entwicklung in Kosinusreihen – sei dem Leser als Übung überlassen.

4.6 Wärmeleitung bei gemischten Randbedingungen


Die Separationsmethode läßt sich ohne große Schwierigkeit auf allgemeinere
Randbedingungen der Form
∂u ∂u
α (0, t) + β u(0, t) = 0 , γ (L, t) + δ u(L, t) = 0
∂x ∂x
mit α2 + β 2 > 0, γ 2 + δ 2 > 0 übertragen. Als Beispiel betrachten wir die
gemischten Randbedingungen
∂u
(b) u(0, t) = (L, t) = 0 für t ≥ 0 .
∂x
Produktansatz und Superposition von Produktlösungen lassen eine Lösungs-
darstellung


2
 
π 1 π 1
(∗) u(x, t) = ak e−( L (k+ 2 )) t
sin k+ x
L 2
k=1
vermuten, wobei f (x) = u(x, 0) die Fourierreihe

∞    
π 1
ak sin k+ x
L 2
k=0

besitzt. Um diese als Fourierreihe einer geeigneten Funktion F zu deuten, be-


achten wir, dass die Glieder gk der Reihe die Symmetrieeigenschaft gk (x) =
gk (2L − x) mit Symmetrieachse x = L haben. Setzen wir daher f durch
F (x) := f (2L − x) für L < x ≤ 2L zu einer Funktion F ∈ PC1 [0, 2L]
fort und entwickeln diese im Intervall [0, 2L] in eine Sinusreihe, so gilt wegen
F (2L) = F (0) = f (0) = 0

∞  
π 1
F (x) = ak sin k+ x
L 2
k=1
mit
2L   L  
1 π 1 2 π 1
ak = F (x) sin k+ x dx = F (x) sin k+ x dx ,
L L 2 L L 2
0 0

da die restlichen Fourierkoeffizienten von F verschwinden ÜA . Mit diesen Mo-


difikationen übertragen sich die Aussagen und Beweise von 4.3 sinngemäß.
Für die Behandlung allgemeiner gemischter Randbedingungen verweisen wir auf
Miller–Michel [11] § 4.
4 Wärmeleitung im Draht 161

4.7 Maximumprinzip und Eindeutigkeitssatz für die Wärmeleitungs-


gleichung
Seien Ω = {(x, t) | 0 < x < L, t > 0} und HT die abgeschlossene Halbebene
{(x, t) | t ≤ T } mit T > 0. Dann gilt für jede auf Ω stetige Lösung u der
Wärmeleitungsgleichung
min u ≤ u(x, t) ≤ max u t 6
HT ∩∂Ω HT ∩∂Ω
T
für alle (x, t) ∈ HT ∩ Ω.
Das Maximum bzw. Minimum von u HT ∩ Ω
auf der kompakten Menge HT ∩Ω wird
also auf dem Randstück HT ∩ ∂Ω von -
Ω angenommen. 0 L x
Beweis.
Wir zeigen zunächst für (x, t) ∈ Ω ∩ HT , dass
u(x, t) ≤ max{u(x, t) | (x, t) ∈ ∂Ω ∩ HT } .
Zum Beweis setzen wir für festes ε > 0 v(x, t) = u(x, t) + ε x2 und erhalten
∂2v
(∗) ∂v
∂t
(x, t) − ∂x2
(x, t) = − 2ε < 0 .

Das Maximum von v auf Ω ∩ HT werde an der Stelle (x0 , t0 ) angenommen.


Wir behaupten (x0 , t0 ) ∈ ∂Ω ∩ HT . Wäre dies nicht der Fall, also 0 < t0 ≤ T
und 0 < x0 < L, so wäre
∂2v
∂v
∂x
(x0 , t0 ) = 0, ∂x2
(x0 , t0 ) ≤ 0 sowie
∂v
∂t
(x0 , t0 ) = 0 , falls t0 < T bzw. ∂v
∂t
(x0 , t0 ) ≥ 0 , falls t0 = T.

In jedem Fall wäre


∂2 v
∂v
∂t
(x0 , t0 ) − ∂x2
(x0 , t0 ) ≥ 0
im Widerspruch zu (∗) . (Beachten Sie, dass für ε = 0 kein Widerspruch ent-
standen wäre.)
Es folgt für (x, t) ∈ Ω ∩ HT
u(x, t) ≤ v(x, t) ≤ v(x0 , t0 ) ≤ u(x0 , t0 ) + εL2 ,
also
sup u ≤ max u + εL2 für jedes ε > 0 .
HT ∩Ω HT ∩∂Ω

Nach Grenzübergang ε → 0 folgt die Behauptung. Die Abschätzung von u(x, t)


nach unten folgt durch Ersetzen von u durch −u. 2
162 § 6 Separationsansätze und Fourierreihen

Hieraus ergibt sich unmittelbar der


Eindeutigkeitssatz. Es gibt höchstens eine auf Ω stetige Lösung u der Wär-
meleitungsgleichung mit vorgeschriebenen Werten auf dem Randstück HT ∩ ∂Ω,
d.h. mit den
Anfangswerten u(x, 0) = f (x) (0 ≤ x ≤ L), und den
Randwerten u(0, t) = g(t), u(L, t) = h(t) (t ≥ 0).
Beweis.
Die Behauptung ergibt sich, indem wir für zwei Lösungen u1 , u2 mit gleichen
Randdaten das Maximumprinzip auf u := u2 − u1 anwenden. 2

4.8 Aufgaben
(a) Zeitlicher Abfall der Energie bei der Wärmeleitung. Zeigen Sie
L L
1 ∂u ∂u
E(t) := (x, t)2 dx =⇒ Ė(t) = − (x, t)2 dx ≤ 0
2 ∂x ∂t
0 0
für jede Lösung u mit geeigneten Differenzierbarkeits– und Randbedingungen.
Verfahren Sie dabei wie in 3.5. Folgern Sie hieraus eine Eindeutigkeitsaussage
für die Wärmeleitungsgleichung.
(b) Geben Sie nach dem Muster von 3.7 eine Lösungsdarstellung für die inho-
mogene Wärmeleitungsgleichung
∂u ∂2u
(x, t) − (x, t) = F (x, t)
∂t ∂x2
unter den homogenen Randbedingungen u(0, t) = u(L, t) = u(x, 0) = 0.
(c) Wir betrachten die homogene Wärmeleitungsgleichung mit den gemischten
Randbedingungen
∂u ∂u
(0, t) = 0 , u(L, t) − (L, t) = 0 für t ≥ 0 .
∂x ∂x
Welches Vorzeichen haben die beim Produktansatz auftretenden Eigenwerte λ
und welcher Gleichung genügen sie? (Verfahren Sie wie in 1.2.) Verschaffen Sie
sich eine Vorstellung von der Lage der Eigenwerte λ1 , λ2 , . . . , indem Sie die
λk als Abszissen der Schnittpunkte einer Tangensfunktion und einer Hyperbel
darstellen. Was läßt sich über das asymptotische Verhalten der λk für k → ∞
sagen?
(d) Wärmeleitung ins Erdinnere. Unter der idealisierenden Annahme, dass
die Erdoberfläche eben ist und in der x, y–Ebene liegt, wollen wir annehmen,
dass die Erdtemperatur nur von der Tiefe z ≥ 0 und der Zeit t abhängt:
u = u(z, t).
4 Wärmeleitung im Draht 163

∂u
Die Wärmeleitungsgleichung ∂t
= k Δu (§ 1 : 2.5) vereinfacht sich dann zu

∂u ∂2u
= k für z, t > 0 ,
∂t ∂z 2
wobei wir die Temperaturleitfähigkeit k diesmal nicht wegskalieren. Wir gehen
von periodischen Temperaturschwankungen an der Erdoberfläche aus:
1 2π
u(0, t) = a0 + a1 cos ωt mit der Periode T = .
2 ω
Ferner fordern wir, dass u(z, t) für z → ∞ beschränkt bleibt.
(i) Warum genügt es, den Fall a0 = 0, a1 = 1 zu betrachten?
(ii) In letzterem Fall führt der Separationsansatz u(x, t) = v(x)w(t) scheinbar
nicht zum Ziel; es müsste v(0)w(t) = cos ωt eine gewöhnliche DG 1. Ordnung
erfüllen. Schreiben wir aber
1 iωt 1
cos ωt = e + e−iωt =: w1 (t) + w2 (t)
2 2
so gibt es komplexwertige Produktlösungen u1 , u2 mit uk (0, t) = wk (t). Abwei-
chend vom üblichen Schema ist hier λ durch die wk eindeutig bestimmt. Führen
Sie das aus!
(iii) In welcher Tiefe z ergibt sich bei einer jährlichen Periode (T = 1 Jahr) bei
einer Temperaturleitfähigkeit k = 2 · 10−7 m2 /sec eine Phasenverschiebung von
einem halben Jahr?
(e) Folgern Sie aus dem Maximumprinzip 4.7 für zwei Lösungen u1 , u2 :
– Aus u1 ≤ u2 auf ∂Ω folgt u1 ≤ u2 auf Ω.
– Aus | u1 − u2 | ≤ ε auf ∂Ω folgt | u1 − u2 | ≤ ε auf Ω.
(f) Temperaturverteilung im endlich langen Draht bei festen Randwerten. Hal-
ten wir durch Wärmezufuhr die Temperaturen der Drahtenden konstant, so
ergibt sich das Problem

∂u
∂t
=
∂2u
∂x2
in Ω = ]0, L[ × Ê >0 ,

u(0, t) = α , u(L, t) = β

u(x, 0) = f (x) , wobei f (0) = α , f (L) = β .

Stellen Sie die Lösung in der Form u(x, t) = u0 (x) + v(x, t) dar, wobei v
das Problem 4.1 mit einer geeigneten Anfangstemperaturverteilung löst und
u0 (x) = lim u(x, t) der stationären (zeitunabhängigen) Wärmeleitungsglei-
t→∞
chung u0 = 0 in einer Dimension genügt.
164 § 6 Separationsansätze und Fourierreihen

5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe


5.1 Formulierung des Problems
Wir betrachten eine wärmeleitende Kreisscheibe in der x, y–Ebene, deren Tem-
peraturverteilung auf dem Rand zeitlich konstant gehalten wird. Ähnlich wie
in 4.8 (f) dürfen wir erwarten, dass der Vorgang des Wärmeausgleichs nach ei-
ner gewissen Zeit annähernd zur Ruhe gekommen ist. Die Temperatur u hängt
dann nicht mehr von der Zeit ab, aus der Wärmeleitungsgleichung ∂u/∂t = a Δu
wird die Laplace–Gleichung Δu = 0. Lösungen der Laplace–Gleichung wer-
den harmonische Funktionen genannt.
Nach Ausführung einer Translation und einer Streckung der Ebene dürfen wir
das Problem auf der Einheitskreisscheibe

Ω = K1 (0) = {(x, y) | x2 + y 2 < 1}

betrachten. Wir kommen so zum Randwertproblem für die Laplace–Gleichung


(Dirichlet–Problem):
Gegeben ist eine stetige Funktion f auf der Kreislinie ∂Ω. Gesucht ist eine
Funktion u ∈ C0 (Ω) ∩ C2 (Ω) mit
(a) Δu = 0 in Ω,
(b) u = f auf ∂Ω.

5.2 Transformation auf Polarkoordinaten


Es ist leicht zu sehen, dass der Produktansatz u(x, y) = v(x) w(y) zwar eine
Fülle harmonischer Funktionen liefert, aber keine Handhabe bietet, die Rand-
bedingung (b) einzuarbeiten. Das ändert sich, wenn wir die Kreissymmetrie
des Problems ausnützen und zu Polarkoordinaten übergehen. Dabei stellt sich
folgende Aufgabe:

Umrechnung des Laplace–Operators in Polarkoordinaten


Setzen wir für eine C2 –Funktion u auf der Einheitskreisscheibe

U (r, ϕ) := u(r cos ϕ, r sin ϕ) (0 < r < 1, −π < ϕ < π),

so gilt
 
1 ∂ ∂U 1 ∂2U ∂2U 1 ∂U 1 ∂2U
Δu = r + 2 2
= 2
+ + 2 .
r ∂r ∂r r ∂ϕ ∂r r ∂r r ∂ϕ2

Hierbei sind auf der linken Seite die Argumente (r cos ϕ, r sin ϕ) und auf der
rechten die Argumente (r, ϕ) einzutragen.
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe 165

Diese Identität ergibt sich aus den via Kettenregel gewonnenen Gleichungen

∂U ∂u ∂u ∂U ∂u ∂u
= cos ϕ + sin ϕ , = − r sin ϕ + r cos ϕ ,
∂r ∂x ∂y ∂ϕ ∂x ∂y
   
∂2U ∂2u ∂2u ∂2u ∂2u
= cos ϕ + sin ϕ cos ϕ + cos ϕ + sin ϕ sin ϕ,
∂r 2 ∂x2 ∂x∂y ∂x∂y ∂y 2
 
∂2U ∂2u ∂2u
= − r sin ϕ + r cos ϕ (−r sin ϕ)
∂ϕ2 ∂x 2 ∂x∂y
 
∂2u ∂2u ∂u ∂u
+ − r sin ϕ + r cos ϕ r cos ϕ − r cos ϕ − r sin ϕ .
∂x∂y ∂y 2 ∂x ∂y

Damit geht das Randwertproblem (a), (b) über in


 
1 ∂ ∂U 1 ∂2U
(a ) r + = 0 für 0 < r < 1, −π < ϕ < π ,
r ∂r ∂r r 2 ∂ϕ2

(b ) U (1, ϕ) = F (ϕ) := f (cos ϕ, sin ϕ) für − π < ϕ < π .

Von den Lösungen U fordern wir C2 –Differenzierbarkeit für 0 < r < 1 und
stetige Fortsetzbarkeit in r = 0. Damit eine Lösung U von (a ),(b ) wieder
zu einer Lösung u des Originalproblems zurücktransformiert werden kann, d.h.
damit es eine Funktion u ∈ C0 (Ω)∩C2 (Ω) gibt mit U (r, ϕ) = u(r cos ϕ, r sin ϕ),
muss sich U bezüglich ϕ periodisch verhalten. Wir verlangen

∂U ∂U
(c ) U (r, π−0) = U (r, −(π+0)), (r, π−0) = (r, −(π+0)) (0 < r < 1),
∂ϕ ∂ϕ

(d ) lim U (r, ϕ) existiert für jedes ϕ und ist unabhängig von ϕ.
r→0+

Dass diese Bedingungen für die Rücktransformation hinreichen, brauchen wir


uns an dieser Stelle nicht zu überlegen; das ergibt sich später von selbst.

5.3 Produktlösungen
Die Bedingungen (a ),(c ),(d ) für die Produktlösung U (r, ϕ) = v(r) w(ϕ) mit
v = 0, w = 0 führen auf die Gleichungen ( ÜA , vgl. § 4 : 1)

1  λ
(1) v  + v − 2 v = 0, lim v(r) existiert,
r r r→0+

(2) w + λ w = 0 , w(−π) = w(π) , w (−π) = w (π) .


166 § 6 Separationsansätze und Fourierreihen

Aus (2) folgt zunächst λ ≥ 0 nach dem Muster 1.2. Die Periodizitätsbe-
dingungen (c ) liefern dann die sämtlichen möglichen Eigenwerte λ = k2 für
k = 0, 1, . . . ÜA .
Es ergibt sich daher w(ϕ) = a0 /2 für k = 0 und w(ϕ) = ak cos kϕ + bk sin kϕ
für k = 1, 2, . . . mit Konstanten ak , bk . Für λ = k2 hat (1) nach § 4 : 1 bzw.
§ 4 : 2.7 die Fundamentalsysteme
1, log r für k = 0 und r k , r −k für k ∈ .
Von diesen fallen wegen der Bedingung (1) die für r → 0+ unstetigen Lösungen
fort. Damit haben sämtliche Produktlösungen die Form
1
U0 (r, ϕ) = 2 a0 bzw.
Uk (r, ϕ) = (ak cos kϕ + bk sin kϕ) r k für k = 1, 2, . . . .

5.4 Superposition von Produktlösungen, Poissonsche Integralformel


(a) Lösungsformel in Polarkoordinaten. Wir setzen U (r, ϕ) als Superposition
sämtlicher Produktlösungen in Reihenform an; dabei gehen wir der bequemen
Rechnung halber zur komplexen Darstellung über. Außerdem nehmen wir an,
dass die Reihe
1 ∞ n
(∗) U (r, ϕ) = a0 + (ak cos kϕ + bk sin kϕ) r k = lim ck r |k| eikϕ
2 k=1 n→∞ k=−n

für 0 ≤ r ≤ 1 und |ϕ| ≤ π gleichmäßig konvergiert. Dann konvergiert auch



+∞

F (ϕ) = U (1, ϕ) = ck eikϕ


k=−∞

gleichmäßig für alle ϕ ∈ , also gilt nach 2.2


ck =
1

F (ψ) e−ikψ dψ für k ∈ .
−π

Für festes r < 1 gewinnen wir damit aus (∗) die folgende Integraldarstellung:

+∞ π
1
U (r, ϕ) = r |k| eik(ϕ−ψ) F (ψ) dψ

k=−∞
−π
π $ %
1  |k| ik(ϕ−ψ)
+∞

= r e F (ψ) dψ

k=−∞
−π
π 
= Q(r, ϕ − ψ) F (ψ) dψ
−π
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe 167

mit

1  |k| ikt
+∞

Q(r, t) := r e .

k=−∞

Für r < 1 ergibt sich


1  
∞ ∞
Q(r, t) = (r eit )k + (r e−it )k
2π k=0 k=1
 
1 1 re−it 1 1 − r2
= + = .
2π 1 − reit 1 − r e−it 2π 1 − 2r cos t + r 2
Hiermit haben wir eine Integraldarstellung der Lösung für r < 1 erraten:

(∗∗) U (r, ϕ) = Q(r, ϕ − ψ) F (ψ) dψ .
−π

Wir führen (∗∗) anschließend in kartesische Koordinaten über und zeigen in


5.5, dass wir hierdurch zu einer Lösung des Dirichlet–Problems gelangen. Daher
benötigen wir die zum Erraten der Integraldarstellung oben gemachte Annahme
über die gleichmäßige Entwickelbarkeit von F nicht mehr. (Diese ist nach 2.4 (ii)
auch nicht immer gerechtfertigt.)
(b) Lösungsformel in kartesischen Koordinaten. Für x = (r cos ϕ, r sin ϕ) mit
r < 1 und y = (cos ψ, sin ψ) ergibt sich

x − y2 = 1 − 2r cos(ϕ − ψ) + r 2 ,

also

1 1 − x2
Q(r, ϕ − ψ) = =: P (x, y) .
2π x − y2

Mit U (r, ϕ) = u(r cos ϕ, r sin ϕ), F (ψ) = f (cos ψ, sin ψ) geht die Integraldar-
stellung (∗∗) über in

(P) u(x) = P (x, y) f (y) ds(y) für x < 1 ,
y=1

wobei die rechte Seite als skalares Kurvenintegral über die positiv orientierte
Einheitskreislinie zu verstehen ist. Das ergibt sich sofort mit der Parametrisie-
rung ψ → y = (cos ψ, sin ψ) (−π ≤ ψ ≤ π) ( ÜA , vgl. Bd. 1, § 24 : 3.1).
Die Funktion P heißt der Poisson–Kern für die Einheitskreisscheibe; das
Integral in (P) wird Poisson–Integral genannt.
168 § 6 Separationsansätze und Fourierreihen

5.5 Lösung des Dirichlet–Problems durch das Poisson–Integral


Ω bezeichne wieder die offene Einheitskreisscheibe K1 (0) ⊂ Ê. 2

Satz (Poisson 1820). Für jede stetige Funktion f auf der Einheitskreislinie ∂Ω
ist durch
⎧ 
⎨ 1 − x
2
⎪ f (y)
ds(y) für x < 1,
u(x) := 2π x − y2

⎩ y=1
f (x) für x = 1

eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω) des Dirichlet–Problems

Δu = 0 in Ω , u = f auf ∂Ω

gegeben.

Bemerkungen. (i) Dass dies die einzige Lösung ist, zeigen wir in 5.6.
(ii) u ist sogar reell–analytisch in Ω, d.h. Realteil einer in Ω holomorphen Funk-
tion:
 

u(x, y) = Re c0 + 2 ck (x + iy)k
k=1
mit den Koeffizienten
1 π
ck = f (cos ψ, sin ψ) e−ikψ dψ (k = 0, 1, 2, . . .) .
2π −π

(iii) Das Poisson–Integral divergiert für alle x ∈ ∂Ω mit f (x) = 0; es kann


daher die Lösung in Randpunkten nicht darstellen. Die Aussage u ∈ C0 (Ω),
u = f auf ∂Ω bedeutet also
lim u(x) = f (x0 ) für jedes x0 ∈ ∂Ω .
Ω x →x 0

Beweis.
(a) Für die oben definierte Funktion u zeigen wir u ∈ C∞ (Ω) und Δu = 0 in
Ω. Für x = (r cos ϕ, r sin ϕ) mit r < 1 gilt nach der Rechnung in 5.4, die wir
jetzt rückwärts verfolgen,
 π
u(x) = P (x, y) f (y) ds(y) = Q(r, ϕ − ψ) F (ψ) dψ
y=1 −π


+∞ 
∞ 

= ck r |k| eikϕ = c0 + ck r k eikϕ + c−k r k e−ikϕ
k=−∞ k=1 k=1

mit
π π
ck = 1

F (ψ) e−ikψ dψ = 1

f (cos ψ, sin ψ) e−ikψ dψ .
−π −π
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe 169

Die gliedweise Integration ist erlaubt, weil die Reihe



+∞
ck r |k| eik(ϕ−ψ)
k=−∞

wegen |ck | ≤ f ∞ bei festem r < 1 gleichmäßig bezüglich ψ konvergiert. Da


Ê
f reellwertig ist, gilt c−k = ck und c0 ∈ , also ist


u(x, y) = Re g(x + iy) mit g(z) := c0 + 2 ck z k .
k=1
Da die letztere Reihe für |z| < 1 konvergiert, ist u in Ω der Realteil der holo-
morphen Funktion g. Nach Bd. 1, § 27 : 3.1 und § 27 : 1.3 sind u(x, y), v(x, y) :=
Im g(x + iy) beliebig oft differenzierbar in Ω und erfüllen dort die Cauchy–
Riemannschen Differentialgleichungen
∂u ∂v ∂u ∂v
= , = − .
∂x ∂y ∂y ∂x
Daraus folgt
∂2u ∂2u ∂2v ∂2v
Δu = + = − = 0 in Ω .
∂x2 ∂y 2 ∂x∂y ∂y∂x
(b) Eigenschaften des Poisson–Kerns.
(1) Für x = (r cos ϕ, r sin ϕ) mit r < 1 und y = 1 gilt P (x, y) > 0 sowie
 π π +∞

P (x, y) ds(y) = Q(r, ϕ − ψ) dψ = 1

r |k| eik(ϕ−ψ) dψ
y=1 −π −π k=−∞

+∞ π
= 1

r |k| eik(ϕ−ψ) dψ = 1 .
k=−∞ −π

(2) Sei x0  = 1 und x0 − y ≥ 2δ > 0. Dann folgt für x < 1, x − x0  < δ
zunächst x − y ≥ x0 − y − x0 − x ≥ 2δ − δ = δ, also

1 − x2 (1 + x) (1 − x)


P (x, y) ≤ =
2πδ 2 2πδ 2
2(1 − x) 1
< ≤ x − x0  ,
2πδ 2 πδ 2
Letzteres wegen 1 − x = x0  − x ≤ x − x0 .

(c) u ist stetig in Ω. Dazu müssen wir nach Bemerkung (iii) zeigen, dass
lim u(x) = f (x0 ) für jeden Randpunkt x0 .
Ω x→x0

Sei also x0  = 1 und ε > 0 vorgegeben. Wir wählen δ > 0 so, dass

| f (y) − f (x0 ) | < ε für alle y ∈ ∂Ω mit y − x0  < 2δ .


170 § 6 Separationsansätze und Fourierreihen

Dann gilt für alle x ∈ Ω mit x − x0  < δ aufgrund von (b)


   
 
| u(x) − f (x0 ) | =  P (x, y) f (y) − f (x0 ) ds(y) 
y=1
  
≤ P (x, y) f (y) − f (x0 )  ds(y)
y=1
  
= P (x, y) f (y) − f (x0 )  ds(y)
y−x0 <2δ
  
+ P (x, y) f (y) − f (x0 )  ds(y)
y−x0 ≥2δ
 
< ε P (x, y) ds(y) + 2f ∞ P (x, y)ds(y)
y−x0 <2δ y−x0 ≥2δ

1
< ε + 2f ∞ 2π x − x0 
πδ 2

4f ∞
= ε+ x − x0  < 2ε
δ2
 
für x − x0  < min δ, εδ 2 /4f ∞ . 2

5.6 Maximumprinzip für harmonische Funktionen und


Eindeutigkeitssatz für das Dirichlet–Problem
(a) Maximumprinzip. Für jede auf einem beschränkten Gebiet Ω ⊂ Ê n

harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω) gilt


min u ≤ u ≤ max u .
∂Ω ∂Ω

Gilt lediglich Δu ≥ 0 in Ω, so besteht die Ungleichung u ≤ max u .


∂Ω

Beweis.
(i) Wir beweisen zunächst die zweite Behauptung. Dazu wählen wir ein ε > 0
und setzen
v(x) := u(x) + εx2 .
Die stetige Funktion v nimmt auf der kompakten Menge Ω das Maximum an,
etwa in x0 . Dieser Punkt muss auf dem Rand liegen, denn im Fall x0 ∈ Ω wäre
die Hesse–Matrix H von v in diesem Punkt negativ semidefinit, hätte also keinen
positiven Eigenwert. Wegen Spur H = Δv(x0 ) = Δu(x0 ) + 2nε = 2nε > 0 kann
dies nicht sein.
Es gilt also für alle x ∈ Ω
u(x) ≤ v(x) ≤ v(x0 ) = u(x0 ) + εx0 2 ,
5 Das stationäre Wärmeleitungsproblem für die Kreisscheibe 171

somit wegen x0 ∈ ∂Ω
 
sup {u(x) | x ∈ Ω} ≤ sup {u(x) | x ∈ ∂Ω} + ε max x2 | x ∈ ∂Ω

für jedes ε > 0. Nach Grenzübergang ε → 0 folgt die Behauptung.


(ii) Die erste Behauptung folgt unmittelbar durch Anwendung von (i) auf u
und auf −u. 2

Eine direkte Folgerung aus (a) ist der


(b) Eindeutigkeitssatz. Jede harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω) ist
durch ihre Randwerte eindeutig bestimmt. Insbesondere hat das Dirichlet–Pro-
blem 5.1 höchstens eine Lösung.

5.7 Aufgaben
(a) Lösen Sie das Dirichlet–Problem in der Einheitskreisscheibe für die folgen-
den Randverteilungen
4 − 2x
f (x, y) = 1 , f (x, y) = x3 , f (x, y) = .
5 − 4x
Verwenden Sie in den letzten beiden Fällen Polarkoordinaten. Im mittleren
Fall ergibt sich für 5.4 (∗) eine endliche Summe. Bestimmen Sie im letzten Fall
zunächst Re 1/(1 − 12 e iϕ ) .
(b) Folgern Sie aus der Poisson–Darstellung 5.5 die Harnacksche Unglei-
chung für die Lösung u des Dirichlet–Problems im Fall f ≥ 0
1 − x 1 + x
u(0) ≤ u(x) ≤ u(0) für x < 1 .
1 + x 1 − x

(c) Machen Sie sich plausibel, dass für U (r, ϕ) = Q(r, ϕ − ψ) F (ψ) dψ die
−π
Beziehung lim U (r, ϕ) = F (ϕ) gilt, indem Sie die Funktion t → Q(r, t) für
r→1
einzelne Werte von r < 1 skizzieren. Beachten Sie dabei, dass
1 1+r
lim Q(r, 0) = lim = ∞, lim Q(r, ϕ) = 0 für ϕ = 0 .
r→1 r→1 2π 1 − r r→1

(d) Folgern Sie aus 5.5 mit Hilfe einer Streckung der Ebene, dass die Poisson–
Formel für die Kreisscheibe Ω = KR (0) lautet

R2 − x2 f (y)
u(x) = ds(y) für x < R .
2πR x − y2
y=R
172 § 7 Die Charakteristikenmethode für DG 1. Ordnung

§ 7 Die Charakteristikenmethode für DG 1. Ordnung


In diesem Paragraphen behandeln wir das Anfangswertproblem für die implizite
Differentialgleichung 1. Ordnung

F (x, u(x), ∇u(x)) = 0 .

Gleichungen dieses Typs beschreiben Phänomene der Wellenausbreitung. Zu


diesen gehört die Eikonalgleichung der geometrischen Optik, und deren mecha-
nisches Analogon, die Hamilton–Jacobi–Differentialgleichung. Die Lösung sol-
cher Gleichungen kann vollständig auf die Lösung von Systemen gewöhnlicher
Differentialgleichungen zurückgeführt werden. Wir erläutern die Charakteristi-
kenmethode zunächst an einem Spezialfall:

1 Die quasilineare Differentialgleichung


1.1 Problemstellung
Ê
Gegeben sind ein Gebiet Ω ⊂ n und C1 –Funktionen a1 , . . . , an , b auf Ω × . Ê
Ferner sei M eine (n − 1)–dimensionale orientierbare C1 –Untermannigfaltigkeit
in Ω und f eine C1 –differenzierbare Funktion auf M . Gesucht ist eine Lösung
u der quasilinearen DG 1. Ordnung

n
∂u 
n

ai (x, u(x)) (x) = b(x, u(x)) , kurz ai (x, u) ∂i u = b(x, u)


∂xi
i=1 i=1

in einer Umgebung von M , die der Anfangsbedingung

u = f auf M.

genügt.
Wir sprechen von einem Anfangswertproblem oder Cauchy–Problem.
Für die sich auf Untermannigfaltigkeiten beziehenden Begriffe verweisen wir
auf § 11 : 1. Ohne Verlust an Allgemeinheit beschränken wir uns hier auf die
Behandlung des ebenen Falles n = 2, bei dem M eine Kurve ist, die wir mit
C bezeichnen. Das bedeutet, dass sich C lokal durch eine Gleichung g(x) = 0
mit einer C1 –Funktion g beschreiben lässt, wobei ∇g nirgends verschwindet.
Hieraus ergibt sich: Zu jedem Kurvenpunkt ξ ∈ C gibt es eine Umgebung
Ê
U ⊂ 2 , so dass C ∩ U eine reguläre C1 –Parametrisierung ϕ : I → C ∩ U mit
stetiger Umkehrung besitzt, wobei I ein offenes Intervall ist. Der Einfachheit
halber nehmen wir an, dass C durch eine einzige Parametrisierung ϕ : I → 2 Ê
überdeckt wird, die wir im Folgenden fixieren.
Wir nennen die Funktion f C1 –differenzierbar auf C , wenn f ◦ ϕ im ge-
wöhnlichen Sinn C1 –differenzierbar ist.
1 Die quasilineare Differentialgleichung 173

1.2 Der Grundgedanke der Charakteristikenmethode


Der Grundgedanke der Charakteristikenmethode lässt sich geometrisch sehr ein-
fach formulieren:
Sei u eine in einer Umgebung U von C gegebene Lösung des Cauchy–Problems
a1 (x, u) ∂1 u + a2 (x, u) ∂2 u = b(x, u) , u = f auf C.
Wir setzen
   
/ := (x, u(x)) | x ∈ U ,
M / := (ξ, f (ξ)) | ξ ∈ C ,
C
v := (a1 , a2 , b) und n := (∂1 u, ∂2 u, −1) .

Hiermit erhält das Cauchy–Problem die geometrische Gestalt


/ und C/ ⊂ M
v , n = a1 ∂1 u + a2 ∂2 u − b = 0 auf M /.

Die Abbildung (x, y) → v(x, y) ist


ein Vektorfeld im Ê3
, das auf der
Lösungsfläche M / tangential ist, da
/ ist. Jede x3 Charakteristik
n ein Normalenfeld auf M
/
durch C laufende Integralkurve (Cha-
rakteristik) dieses Vektorfeldes liegt
daher auf M / , siehe die ÜA unten. / = Graph u
M
Die Gesamtheit der Charakteristiken
/.
zerlegt M /
C

Die Charakteristikenmethode zur Lö-


sung des Cauchy–Problems 1.1 besteht x2
nun darin, diese Analyse in ein Kon- C U0
struktionsverfahren für die gesuchte
Funktion u umzumünzen:
– Bestimmung der Charakteristiken;
dies bedeutet Lösung eines AWP
gewöhnlicher Differentialgleichungen,
– Nachweis, dass die Schar der Cha- charakteristische
rakteristiken eine Fläche aufspannt, Projektion x1
die Graph einer Funktion u ist, welche
das Cauchy–Problem löst.

ÜA Zeigen Sie für die Integralkurven t → α(t) = (x1 (t), x2 (t), y(t)) des Vektor-
feldes v: Gilt α(t0 ) ∈ M / für ein t0 , so auch α(t) ∈ M
/ für alle t. (Differenzieren
Sie y(t) − u(x1 (t), x2 (t))).
Die Projektionen der Charakteristiken auf die x1 ,x2 –Ebene heißen charakte-
ristische Projektionen.
174 § 7 Die Charakteristikenmethode für DG 1. Ordnung

1.3 Das charakteristische Anfangswertproblem


Nach Definition ist eine C1 –Kurve t → (x1 (t), x2 (t), y(t)) Charakteristik für
das Cauchy–Problem 1.1, wenn für einen Kurvenpunkt ξ = (ξ1 , ξ2 ) ∈ C gilt:

ẋ1 (t) = a1 (x1 (t), x2 (t), y(t)) , x1 (0) = ξ1 ,


ẋ2 (t) = a2 (x1 (t), x2 (t), y(t)) , x2 (0) = ξ2 ,
ẏ(t) = b(x1 (t), x2 (t), y(t)) , y(0) = f (ξ).
Wir beziehen im Folgenden die Anfangswerte auf den Kurvenparameter s und
schreiben das Anfangswertproblem mit den Abkürzungen

a = (a1 , a2 ), x = (x1 , x2 )

in vektorieller Gestalt
(a) ẋ(t) = a(x(t), y(t)), ẏ(t) = b(x(t), y(t)),
(b) x(0) = ϕ(s), y(0) = ψ(s) := f (ϕ(s)) mit s ∈ I.

Die Lösungsschar des Anfangswertproblems (a),(b) bezeichnen wir mit

t → (X(s, t), Y (s, t)) (s ∈ I) .

Die zugehörigen charakteristischen Projektionen sind dann gegeben durch

t → X(s, t) (s ∈ I).

Die gesuchte Lösung u des Cauchy–Problems soll nach den Überlegungen in


1.2 durch die Gleichung u(X(s, t)) = Y (s, t) eindeutig bestimmt sein, d.h. die
Abbildung (s, t) → X(s, t) soll eine C1 –differenzierbare Inverse besitzen. Dies
erfordert eine Bedingung an die Anfangsdaten:

1.4 Transversalitätsbedingung und charakteristische Umgebungen


An die Anfangsdaten stellen wir folgende Transversalitätsbedingung:

(c) Für kein ξ ∈ C ist a(ξ, f (ξ)) Tangentenvektor an C im Punkt ξ.

Dann schneidet jede charakteristische Projektion t → X(s, t) die Kurve C trans-


versal, das heißt nicht tangential, denn nach 1.3 (a),(b) gilt

Ẋ(s, 0) = a(X(s, 0), Y (s, 0)) = a(ξ, f (ξ)) .

Im folgenden Existenz– und Eindeutigkeitssatz zeigen wir, dass unter dieser Vor-
aussetzung die charakteristischen Projektionen eine Umgebung von C einfach,
d.h. ohne Überschneidungen, überdecken. Genauer erhalten wir: Es existiert ei-
Ê
ne Umgebung U ⊂ Ω der Startkurve C und eine Umgebung V ⊂ 2 der Strecke
1 Die quasilineare Differentialgleichung 175

{(s, 0) | s ∈ I }, so dass für jeden


Punkt (s, t) ∈ V die Verbindungs- x2
strecke zwischen (s, t) und (s, 0) ganz 6 U
in V liegt. Das bedeutet, dass sich jeder
Punkt von U längs einer charakteristi-
schen Projektion mit einem Punkt in ξ0 C
C verbinden lässt, ohne U zu verlassen.
Wir nennen U eine charakteristische -
t 6 x1
Umgebung der Startkurve C.
X
Analog sprechen wir von einer cha- -
rakteristischen Umgebung U eines s0 s
Punktes ξ0 = ϕ(s0 ) ∈ C, wenn U
wie eben das diffeomorphe Bild unter V
X einer Umgebung V einer Strecke
{(s, 0) | s ∈ J} ist, wobei J eine Inter-
vallumgebung von (s0 , 0) ist.
In den meisten Fällen können wir V als Rechteckumgebung wählen (Figur).
Aus dem Eindeutigkeitssatz für autonome DG folgt: Der Durchschnitt zweier
charakteristischer Umgebungen von ξ0 ist wieder eine, wenn sich diese auf der
Anfangswertkurve C treffen. ÜA : Machen Sie sich das klar!

1.5 Der Existenz– und Eindeutigkeitssatz für das quasilineare Cau–


chy–Problem
Satz. Das quasilineare Cauchy–Problem

a(x, u) , ∇u = b(x, u), u = f auf C

besitzt unter der Transversalitätsbedingung (c) in einer charakteristischen Um-


gebung U ⊂ Ω von C eine eindeutig bestimmte Lösung u : U → . Ê
Der Lösungsweg besteht in folgenden Schritten:
(1) Bestimmung der Lösung X(s, t), Y (s, t) des charakteristischen AWP für
jeden Parameterwert s ∈ I der Startkurve C,

ẋ(t) = a(x(t), y(t)) , ẏ(t) = b(x(t), y(t)) , x(0) = ϕ(s) , y(0) = ψ(s) .

(2) Einschränkung von X auf eine Umgebung V der Strecke {(s, 0) | s ∈ I } in


der s, t–Ebene, so dass X einen Diffeomorphismus von V auf eine charakteri-
stische Umgebung U von C liefert.
(3) Darstellung der Lösung u auf U durch die Beziehung

u ◦ X = Y bzw. u = Y ◦ X−1 .

Der Beweis folgt in 1.8.


176 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Bemerkungen. (a) Ist die Transversalitätsbedingung verletzt, so kann das


Cauchy–Problem unlösbar sein, oder es kann unendlich viele Lösungen geben.
Beispiele hierfür sind:

∂1 u + ∂2 u = u , u(x, x) = 1,
∂1 u + ∂ 2 u = 0 , u(x, x) = 0.

Die Startkurve C ist hier die Diagonale in der Ebene, welche die Parametrisie-
rung s → ψ(s) = (s, s) besitzt. Wegen ψ  (s) = (1, 1) und (a1 , a2 ) = (1, 1) ist
die Transversalitätsbedingung verletzt.
Das erste Problem hat keine Lösung, denn für eine solche müßte gelten

d d
0 = 1 = u(x, x) = ∂1 u(x, x) + ∂2 u(x, x) = u(x, x) = 1 .
dx dx

Das zweite AWP hat die unendlich vielen Lösungen u(x1 , x2 ) = c · (x1 − x2 )
Ê
mit c ∈ .
(b) Die eindeutige und C1 –differenzierbare Festlegung der Lösung u durch die
Gleichung u ◦ X = Y ist gewährleistet, solange die Abbildung X ein Diffeo-
morphismus ist, was auf kleinen Umgebungen V0 von (s0 , 0) stets erreichbar ist.
Auf größeren Umgebungen braucht X kein Diffeomorphismus zu sein, und es
kann zweierlei eintreten:
(i) X ist nicht injektiv, d.h. zwei charakteristische Projektionen schneiden
sich. In solchen Schnittpunkten kann u nicht mehr widerspruchsfrei festgelegt
werden.
(ii) Die Jacobi–Matrix DX(s, t) hat in einem Punkt (s, t) nicht den Maximal-
rang 2. Dann heißt die Stelle X(s, t) ein Brennpunkt der charakteristischen
Projektionen; u braucht dort nicht mehr differenzierbar zu sein. Dieses Phäno-
men wird in Beispiel 1.7 illustriert.
Die Fälle (i) und (ii) können auch gleichzeitig eintreten.
(c) Im Fall b = 0 ist jede Lösung konstant längs jeder charakteristischen
Projektion ÜA .
(d) Der Satz behält für n > 2 seine Gültigkeit, wenn der Träger der Anfangs-
werte eine (n − 1)–dimensionale orientierbare C1 –Untermannigfaltigkeit M ist,
vgl. § 11 : 1.5, z.B. eine Hyperebene. Das Lösungsverfahren (1) bis (3) und der
Beweis 1.8 übertragen sich sinngemäß. Die Transversalitätsbedingung lautet
analog zum zweidimensionalen Fall:
(c ) Für kein ξ ∈ M ist a(ξ, f (ξ)) Tangentenvektor an M im Punkt ξ ∈ M .
In den folgenden Beispielen ist die Anfangswertkurve C stets die x–Achse in der
(x, t)–Ebene, die Charakteristiken parametrisieren wir durch den Parameter τ .
1 Die quasilineare Differentialgleichung 177

1.6 Die Wellengleichung einfachsten Typs


Für eine gegebene C1 –Funktion ψ : Ê → Ê und eine Konstante c = 0 betrach-
ten wir das Cauchy–Problem
t 6
∂u ∂u
c + = 0, u(x, 0) = ψ(x).
∂x ∂t
Das Anfangswertproblem für die Cha-
rakteristiken lautet hier (x, t)

ẋ(τ ) = c, ṫ(τ ) = 1, ẏ(τ ) = 0,
x(0) = s, t(0) = 0, y(0) = ψ(s).

Als Lösungsschar ergibt sich


(s, 0)
• -
X(s, τ ) = (s + c τ, τ ), x
Y (s, τ ) = ψ(s).

Die charakteristischen Projektionen sind parallele Geraden, welche die x–Achse


C transversal schneiden und die ganze Ebene einfach überdecken.
Nach 1.5 (3) erhalten wir die Lösung u aus

u(s + cτ, τ ) = u(X(s, τ )) = Y (s, τ ) = ψ(s),

und nach Elimination von s ergibt sich

u(x, t) = ψ(x − ct).

Dies ist eine für c > 0 nach rechts und für c < 0 nach links wandernde Welle
mit festem räumlichen Profil und Geschwindigkeit | c |.

Aufgabe. (Lösungsdarstellung von d’Alembert für die schwingende Saite)


Ê Ê
eien f ∈ C2 ( ), g ∈ C1 ( ). Zeigen Sie: Jede Lösung u ∈ C2 ( Ê ) von
2

∂2u ∂2u ∂u
2
= c2 , u(x, 0) = f (x) , (x, 0) = g(x)
∂t ∂x2 ∂t
mit c > 0 besitzt die Darstellung

1 1 
x+ct
u(x, t) = (f (x + ct) + f (x − ct)) + g(y) dy .
2 2c x−ct

Anleitung: Die Funktion v := −c ∂u


∂x
+ ∂u
∂t
löst das Cauchy–Problem

∂v ∂v
c + =0 mit v(x, 0) = ψ(x) := −c f  (x) + g(x),
∂x ∂t
178 § 7 Die Charakteristikenmethode für DG 1. Ordnung

besitzt also nach Obigem die Lösung v(x, t) = ψ(x − ct). Hiernach genügt u
dem Cauchy–Problem

∂u ∂u
−c (x, t) + (x, t) = ψ(x − ct), u(x, 0) = f (x).
∂x ∂t
Dessen Lösung nach der Methode 1.5 ergibt die Behauptung.

1.7 Ein Verkehrsflussproblem


Den Verkehrsfluss auf einer Spur einer unendlich langen Landstraße ohne Ab-
zweigungen beschreiben wir in einem kontinuierlichen Modell durch die Fahr-
zeugdichte (x, t) pro Längeneinheit und die Geschwindigkeit v(x, t) an der Stel-
le x zur Zeit t. Dabei gehen wir vom Erhaltungssatz für die Anzahl der Fahrzeuge
auf jedem Streckenabschnitt [a, b] aus,

b x=b
0 = d
dt
(x, t) dx + ( v)(x, t) x=a
a

b ∂
b ∂
= ∂t
(x, t) dx + ∂x
( v)(x, t) dx ,
a a

vgl. Bd. 1, § 26 : 6.1. In differentieller Form bedeutet dies

∂ ∂( v)
+ = 0.
∂t ∂x
Wir machen die Modellannahme, dass die Geschwindigkeit v eine monoton fal-
lende Funktion der Dichte ist. Der einfachste Ansatz hierfür ist v = A − B
mit positiven Konstanten A, B.
Legen wir diese Beziehung mit A = 1, B = 12 zugrunde (durch Umskalieren
erreichbar) und schreiben jetzt u statt , so lautet das zugehörige Anfangswert-
problem für die Fahrzeugdichte u

(1 − u)
∂u
∂x
+
∂u
∂t
= 0, u(x, 0) = ψ(x) für x ∈ Ê,
Ê
wobei ψ ∈ C1 ( ) eine gegebene Anfangsdichteverteilung mit 0 < ψ < 1 ist.
Das Anfangswertproblem 1.3 (a),(b) für die Charakteristiken lautet hier

ẋ(τ ) = 1 − y(τ ) , ṫ(τ ) = 1 , ẏ(τ ) = 0 ,


x(0) = s , t(0) = 0 , y(0) = ψ(s) .

Dessen Lösungen sind gegeben durch

X(s, τ ) = (s + τ (1 − ψ(s)), τ ) , Y (s, τ ) = ψ(s) .


1 Die quasilineare Differentialgleichung 179

Die charakteristischen Projektionen bilden also eine Geradenschar mit Schar-


Ê
parameter s ∈ . Wegen ṫ(τ ) = 1 schneiden diese die x–Achse C transversal.
Nach 1.5 (3) ist die Lösung u des Cauchy–Problems bestimmt durch
u(X(s, τ )) = Y (s, τ ) = ψ(s).
Wir haben also zu gegebenem (x, t) die Gleichung
(x, t) = X(s, τ ) = (s + τ (1 − ψ(s)), τ ),
bzw.
(∗) t = τ, x = s + t(1 − ψ(s))
C1 –differenzierbar nach (s, τ ) aufzulösen. Hierfür muss die Jacobi–Determinante
von X die Auflösebedingung
det(DX(s, τ )) = 1 − τ ψ  (s) > 0.
erfüllen, was i.A. nur für kleine |τ | möglich ist.
Wir machen uns für zwei einfache, aber
typische Fälle ein qualitatives Bild vom 6
Verlauf der Lösung: 1
(a) ψ sei auf einem beschränkten In-
tervall I = ]a, b[ streng monoton fallend ψ
und außerhalb von I konstant. x
-
Die Steigungen der in (s, 0) startenden
charakteristischen Projektionen haben -
x
für s ≤ a denselben konstanten Wert;
entsprechendes gilt für s ≥ b. Damit
ergeben sich die charakteristischen Pro- t1
jektionen in der x,t–Ebene wie in der
Figur skizziert ÜA . Die zweite Glei-
t2
chung in (∗) kann für alle (x, t) mit
t ≥ 0 nach s aufgelöst werden. t ?
Die Lösung u ist nach der Bemerkung
1.5 (c) konstant längs jeder charakteri-
stischen Projektion, beschreibt also ei- u
ne nach rechts laufende, mit wachsen- t0
dem t flacher werdende Welle.
In der nebenstehenden Figur sind Wel- u
lenprofile t1
x → u(x, t)
u
für drei Zeiten 0 = t0 < t1 < t2 wie- t2
dergegeben.
180 § 7 Die Charakteristikenmethode für DG 1. Ordnung

(b) ψ sei auf einem beschränkten


Intervall I = ]a, b[ streng monoton stei- 6
gend und außerhalb von I konstant. 1 ψ
Auch hier haben die charakteristischen
Projektionen mit s ≤ a dieselbe kon-
stante Steigung, entsprechendes gilt x
-
für die charakteristischen Projektionen
mit s ≥ b. Jetzt gibt es für t > 0 -
x
Schnittpunkte zwischen ersteren und
letzteren. Die Lösung u(x, t) kann also t1
nicht für alle t > 0 existieren.
Wie der nebenstehende Film“ zeigt,
” t2
bildet sich eine nach rechts wandernde
Welle aus, deren Front mit wachsen-
dem t immer steiler wird. t ?
Wir bestimmen die maximale Lebens-
spanne [0, t∗ [ der Lösung u. t∗ ist also
das Supremum der t > 0, für welche t0
Ê
x → u(x, t) für alle x ∈ existiert und
u
C1 –differenzierbar ist. Es ergibt sich:
Die maximale Lebensspanne ist gegeben t1
u
durch
t∗ = 1/ max ψ  , t2
falls ψ  positive Werte annimmt, an- u
dernfalls durch t∗ = ∞.
Im Fall t∗ < ∞ entwickelt die Lösung
Singularitäten (blow up), d.h. es gibt
Stellen x∗ ∈ Ê mit

∂u
lim (x, t) = ∞ (Grenz übergang in 0 < t < t∗ ).
(x,t)→(x∗ ,t∗ ) ∂x

Zum Nachweis setzen wir T∗ := 1/ max ψ  , falls ψ  positive Werte annimmt,


sonst T∗ := ∞ und zeigen T∗ ≤ t∗ . Denn für 0 ≤ t < T∗ gilt 1 − tψ  (s) > 0 für
Ê
alle s ∈ . Die Funktion t → x + t(1 − ψ(s)) ist daher streng monoton steigend
und damit auch bijektiv. Durch (∗) ist damit eine C1 –differenzierbare Lösung
des AWP gegeben, d.h. wir erhalten T∗ ≤ t∗ . Für 0 ≤ t < t∗ gilt

u(x, t) = ψ(s) = ψ(x − t(1 − ψ(s))) = ψ(x − t(1 − u(x, t))) ,

also
  
∂u ∂u ∂u
(x, t) = ψ  (s) 1 + t (x, t) bzw. (x, t) 1 − tψ  (s) = ψ  (s) .
∂x ∂x ∂x
1 Die quasilineare Differentialgleichung 181

Angenommen, T∗ < t∗ . Dann wählen wir eine Maximumstelle s∗ ∈ Ê


von ψ 
und setzen (x∗ , T∗ , s∗ ) in die letzte Gleichung ein. Wir erhalten ∂u/∂x(x∗ , T∗ ) =
∞, im Widerspruch zur Differenzierbarkeit von x → u(x, T∗ ). Somit ist die erste
Behauptung T∗ = t∗ gezeigt. Die zweite ergibt sich durch nochmalige Anwen-
dung der letzten Gleichung auf (x, t, s) nahe (x∗ , t∗ , s∗ ) mit t < t∗ , x∗ =
s∗ + t∗ (1 − tψ(s∗ )), s∗ eine Maximumstelle von ψ  .
Die zuletzt betrachteten Punkte (x∗ , t∗ ) sind Brennpunkte, vgl. Bemerkung
1.5 (b). Dieser ist nicht notwendig Schnittpunkt charakteristischer Projektio-
nen, enthält aber in beliebiger Nachbarschaft solche Schnittpunkte.
Aufgabe. Berechnen Sie für die Anfangswerte


1
3
für 0 ≤ s ≤ 3,
ψ(s) = 1
+ 1
sin( π8 (s − 7)) für 3 ≤ s ≤ 11,
⎩ 2 6
2
3
für 11 ≤ s ≤ 18
den Brennpunkt der charakteristischer Projektionen, und skizzieren Sie diese
für 0 ≤ x ≤ 18. Es empfiehlt sich, einen nicht zu kleinen Maßstab und in der
Nähe der Maximumstelle s∗ = 7 von ψ  eine feine Einteilung der s–Werte zu
wählen.

1.8 Beweis des Existenz– und Eindeutigkeitssatzes


(a) Eindeutigkeit der Lösung. Sei u eine Lösung des Cauchy–Problems auf ei-
ner charakteristischen Umgebung U = X(V) von C oder eines Punktes von C.
Wir bezeichnen die Lösung des AWP
ṗ(t ) = a(p(t), u(p(t))) , p(0) = ϕ(s)
mit t → P(s, t) und setzen Q(s, t) := u(P(s, t)). Dann gilt auf V
 ∂P

∂Q
∂t
(s, t) = ∇u(P(s, t)) , ∂t
(s, t)

= ∇u(P(s, t)) , a(P(s, t), Q(s, t)) = b(P(s, t), Q(s, t)).
Also löst (P, Q) das charakteristische AWP ebenso wie (X, Y ). Da nach Vor-
aussetzung mit jedem Punkt (s, t) ∈ V die ganze Strecke zwischen (s, t) und
(s, 0) in V liegt, können wir den Eindeutigkeitssatz für autonome Systeme an-
wenden und erhalten
P = X, Q = Y.
Somit gilt u ◦ X = u ◦ P = Q = Y , d.h. u = Y ◦ X−1 in U.
(b) Existenz einer lokalen Lösung. Wir fixieren ξ = ϕ(s0 ) ∈ C (o.B.d.A. s0 =
0). Sei t → (X(s, t), Y (s, t)) die Lösung des charakteristischen AWP
ẋ(t) = a(x(t), y(t)) , ẏ(t) = b(x(t), y(t)) ,
x(0) = ϕ(s) , y(0) = ψ(s) .
182 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Ê
Nach Voraussetzung sind a, b in Ω× und ϕ, ψ in I jeweils C1 –differenzierbar.
Nach der grundlegenden Theorie autonomer Systeme (§ 5 : 1.1) sind X(s, t),
Ê
Y (s, t) in einer Umgebung V0 ⊂ 2 von (0, 0) definiert, eindeutig bestimmt
und C1 –differenzierbar bezüglich beider Variablen (s, t). Es gilt
∂X ∂X
(0, 0) = ϕ (0) , (0, 0) = a(X(0, 0), Y (0, 0)) = a(ξ, f (ξ)) .
∂s ∂t
Wegen der Transversalitätsbedingung 1.4(c) hat die Jacobi–Matrix DX(0, 0)
den vollen Rang 2. Nach dem Umkehrsatz Bd. 1, § 22 : 5.2 gibt es also Umge-
bungen Vξ ⊂ V 0 von (0, 0) und U ξ ⊂ Ω von ξ, die durch X C1 –diffeomorph
aufeinander abgebildet werden. Dabei dürfen wir Vξ als Rechteckumgebung
wählen.
Die Funktion

u := Y ◦ X−1 : U ξ → Ê
ist C –differenzierbar als Hintereinanderausführung eines C1 –Diffeomorphismus
1

und einer C1 –Funktion. Aus u ◦ X = Y auf V ξ folgt



0 = (Y − u ◦ X)(s, t)
∂t
0 1
∂Y ∂X
= (s, t) − ∇u(X(s, t)) , (s, t)
∂t ∂t

= b(X(s, t), Y (s, t)) − ∇u(X(s, t)) , a(X(s, t), Y (s, t))

2

= b(x, u(x)) − ai (x, u(x))∂i u(x)


i=1

für x = X(s, t) ∈ U ξ . Damit erfüllt u die DG



2
ai (x, u) ∂i u = b(x, u) auf U ξ = X(Vξ ),
i=1

und für ξ = ϕ(s) ∈ C ∩ Uξ gilt

u(ξ) = u(ϕ(s)) = u(X(s, 0)) = Y (s, 0) = f (ϕ(s)) = f (ξ).

(c) Verkleben der lokalen Lösungen. Nach (b) gibt es zu jedem Kurvenpunkt
ξ = ϕ(s0 ) ∈ C eine lokale Lösung uξ : U ξ → Ê
des Cauchy–Problems auf
einer charakteristischen Umgebung Uξ ⊂ Ω , dabei ist X : V ξ →: U ξ ein C1 –
Ê
Diffeomorphismus und V ξ ⊂ 2 eine Rechteckumgebung von (s0 , 0). Für zwei
überlappende Umgebungen U ξ , U η ist Uξ ∩ U η im Fall U ξ ∩ U η ∩ C = ∅
wieder eine charakteristische Umgebung, woraus nach (a) uξ = uη auf U ξ ∩U η
folgt. Im Fall Uξ ∩ Uη ∩ C = ∅ können sich die lokalen Lösungen uξ , uη auf
Uξ ∩ Uη widersprechen. Die folgende Figur zeigt beide Möglichkeiten.
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 183

Es lässt sich zeigen, dass die Umgebun-


gen U ξ und Vξ so verkleinert werden
können, dass der zweite Fall nicht ein-
tritt. Setzen wir
2 2
U= Uξ , V= Vξ , C
ξ∈C ξ∈C

so ist U eine charakteristische Umge-


bung von C und X : V → U ein C1 –
Diffeomorphismus. Auf U ist durch

u(x) := uξ (x), falls x ∈ Uξ

widerspruchsfrei eine Lösung u ∈ C 1 (U) des Cauchy–Problems gegeben. Die


Konstruktion einer Überdeckung von C mit verkleinerten Umgebungen erfordert
Argumente aus der Topologie; für Schlüsse dieser Art siehe Bröcker–Jänich
[142]. 2

Aufgaben. Skizzieren Sie bei den folgenden Anfangswertproblemen die cha-


rakteristischen Projektionen, bestimmen Sie ggf. die Brennpunkte und geben
Sie die Lösung an.
(a) −x2 ∂1 u + x1 ∂2 u = 0, Ê
u(x, 1) = ψ(x) mit ψ ∈ C1 ( ),

(b) x1 ∂1 u + x2 ∂2 u = pu, u(x, 1) = ψ(x) mit ψ ∈ C (Ê),


1

wobei p = 0 eine Konstante ist (Eulersche Homogenitätsrelation).


(c) ∂1 u + ∂2 u = u2 , u(x, 0) = ψ(x) mit ψ ∈ C1 ( ). Ê
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0
2.1 Problemstellung
Wir betrachten die allgemeine implizite Differentiallgleichung 1. Ordnung für
Ê
u: n⊃U→ Ê
F (x, u(x), ∇u(x)) = 0 , kurz F (x, u, ∇u) = 0 .

In dieser darf jetzt der Gradient von u nichtlinear auftreten wie z.B. bei der
Eikonalgleichung der geometrischen Optik, die wir im Abschnitt 3 behandeln.
Wie hier die Anfangsbedingungen zu wählen sind, um Existenz und Eindeu-
tigkeit der Lösung zu gewährleisten, liegt nicht unmittelbar auf der Hand. Es
zeigt sich, dass die Lösung im allgemeinen durch Vorgabe ihrer Anfangswerte
auf einer (n − 1)–dimensionalen Untermannigfaltigkeit M noch nicht eindeutig
bestimmt ist. Wir schreiben deshalb auch für den Gradienten Anfangswerte vor:
184 § 7 Die Charakteristikenmethode für DG 1. Ordnung

u = f, ∇u = g auf M.
Dieses Anfangswertproblem lässt sich trotz der allgemeineren Problemstellung
ebenfalls auf die Lösung charakteristischer gewöhnlicher Differentialgleichungen
zurückführen; allerdings muss der Charakteristikenbegriff gegenüber dem quasi-
linearen Fall modifiziert werden. Im Folgenden beschränken wir uns auf die
Betrachtung des dreidimensionalen Falls.
Wir setzen voraus: Ω ist ein Gebiet im 3
Ê
, F ist eine C3 –differenzierbare
Funktion auf Ω × × Ê Ê 3
⊂ 7
Ê
und M ⊂ Ω eine orientierbare C2 –Fläche
(vgl. § 11). Der Einfachheit halber nehmen wir an, dass M durch eine einzige
Ê Ê
Parametrisierung ϕ : 2 ⊃ W → 3, s → ξ = ϕ(s) dargestellt werden kann.
Die Anfangswerte f und g auf M setzen wir als C2 –differenzierbar voraus, d.h.
die Abbildungen
ψ := f ◦ ϕ, χ := g ◦ ϕ

Ê
auf dem Parametergebiet W ⊂ 2 sind im üblichen Sinn C2 –differenzierbar.
Die Variablen von F fassen wir in der Form
(x, y, z) = (x1 , x2 , x3 , y, z1 , z2 , z3 )
zusammen und setzen
 
∂F ∂F ∂F
∇x F := , , ,
∂x1 ∂x2 ∂x3
 
∂F ∂F ∂F
∇z F := , , .
∂z1 ∂z2 ∂z3

2.2 Die charakteristischen Gleichungen


Wie im quasilinearen Fall bauen wir auch hier die Lösungsfläche aus Kurven-
scharen auf. Zu deren Bestimmung muss jetzt ein DG–System für Kurven

t → x(t), y(t), z(t) ∈ Ω× Ê×Ê 3
⊂ Ê 7

herangezogen werden, die den erweiterten Graphen“ der Lösung u,


 ”
 
(x, u(x), ∇u(x))  x ∈ U ,
auf einer Umgebung U ⊂ Ω von M aufspannen. Das bedeutet die Erfüllung der
folgenden Gleichungen:
(1) y(t) = u(x(t)),

(2) z(t) = ∇u(x(t)),

(3) F (x(t), y(t), z(t)) = 0.


2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 185

Wir stellen nun Differentialgleichungen für x(t), y(t), z(t) auf, die diese Bedin-
gungen sichern. Wir verlangen

(i) ẋ(t) = ∇z F (x(t), y(t), z(t)) ,

in Übereinstimmung mit dem quasilinearen Fall, bei welchem gilt

F (x, y, z) = a(x, y) , z − b(x, y) , ∇z F (x, y, z) = a(x, y) .

Die weiteren charakteristischen Gleichungen ergeben sich nun ziemlich zwangs-


läufig aus den Forderungen (1),(2),(3): Aus (1) folgt durch Differentiation nach
t die Gleichung ẏ(t) = ∇u(x(t)) , ẋ(t) und wegen (2) und (i)

(ii) ẏ(t) = ∇z F (x(t), y(t), z(t)) , z(t) .

Durch Differentiation von (3) nach t und Einsetzen von (i) und (ii) ergibt sich

0 = d
dt
F (x(t), y(t), z(t)) = ∇x F (. . .) , ẋ(t) + ∂F
∂y
(. . .)ẏ(t) + ∇z F (. . .) , ż(t)

= ∇x F (. . .) , ∇z F (. . .) + ∂F
∂y
(. . .) ∇z F (. . .) , z(t) + ∇z F (. . .) , ż(t)
 
= ∇x F (. . .) + ∂F
∂y
(. . .) z(t) + ż(t) , ∇z F (. . .) .

Diese Gleichung ist sicher dann erfüllt, wenn


(iii) ż(t) = − ∇x F (x(t), y(t), z(t)) − ∂F
∂y
(x(t), y(t), z(t)) z(t) .

Wir fassen die Gleichungen (i), (ii), (iii) zusammen:



⎪ ẋ = ∇z F (x, y, z),

(∗) ẏ = ∇z F (x, y, z) , z ,


ż = − ∇x F (x, y, z) − ∂F
∂y
(x, y, z) z .

Das sind die charakteristischen Differentialgleichungen für das Cauchy–


Problem 2.1. Die Lösungen t → (x(t), y(t), z(t)), welche den Anfangswerten

(∗∗) x(0) = ϕ(s) , y(0) = ψ(s) , z(0) = χ(s)

mit einem Startpunkt ξ = ϕ(s) ∈ M für s = (s1 , s2 ) ∈ W ⊂ Ê 2


genügen,
nennen wir wieder Charakteristiken und bezeichnen diese mit

t → (X(s, t), Y (s, t), Z(s, t)).

Die Kurven t → X(s, t) in Ω ⊂ Ê 3


heißen charakteristische Projektionen.
186 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Die Charakteristikenmethode zur Lösung des Cauchy–Problems 2.1 besteht


– in der Aufstellung der Lösungen X(s, t), Y (s, t), Z(s, t) des charakteristischen
Anfangswertproblems.
– und der Bestimmung der Lösung u aus der Gleichung u(X(s, t)) = Y (s, t).
Auch wenn in der letzten Gleichung der Anteil Z(s, t) der Charakteristiken
nicht explizit auftritt, so wirkt dieser doch über die charakteristischen Differen-
tialgleichungen an der Festlegung von X(s, t), Y (s, t) und damit von u mit.
Nur im quasilinearen Fall kommt Z(s, t) in den ersten beiden charakteristischen
DG nicht vor ÜA .
Wir können die Gleichungen für die Charakteristiken folgendermaßen geome-
trisch interpretieren: Sei α(t) die Raumkurve (x1 (t), x2 (t), y(t)) und längs die-
ser das Vektorfeld

n(t) = (z1 (t), z2 (t), −1) = (∂1 u(x(t)), ∂2 u(x(t)), −1) ,

wobei wir (2) benützen. Die Kurve α mit dem angehefteten Vektorfeld n wird
ein charakteristischer Streifen genannt. Nach (∗) gilt

n(t) , α̇(t) = z1 (t)ẋ1 (t) + z2 (t)ẋ2 (t) − ẏ(t) = 0 ,

also steht n(t) im Punkt α(t) sowohl senkrecht auf der Kurve als auch auf
dem Graphen von u. Durch den charakteristischen Streifen ist also ein schmales
Stück des Graphen längs der Kurve α festgelegt. Machen Sie eine Skizze!
Für die geometrische Interpretation der charakteristischen Gleichungen mit Hil-
fe von Monge–Kegeln verweisen wir auf Courant–Hilbert [3], Kap.2, §3, Ga-
rabedian [47] 2.2, Giaquinta–Hildebrandt [152] Ch.10,1.3.

2.3 Bedingungen für die Anfangswerte


Die Anfangswerte für die Lösung des Cauchy–Problems 2.1 können nicht un-
abhängig voneinander gewählt werden. Denn ist u eine Lösung, so gilt die DG
F (x, u, ∇u) = 0 insbesondere auf M , was die Verträglichkeitsbedingung

(a) F (ξ, f (ξ), g(ξ)) = 0 für ξ ∈ M

liefert. Eine weitere Verträglichkeitsbedingung lautet


0 1
∂ψ χ(s) , ∂ϕ (s)
(b) (s) = für s ∈ W, i = 1, 2.
∂si ∂si
Diese ergibt sich aus
0 1
∂ψ ∂ ∂ ∂ϕ
(s) = f (ϕ(s)) = u(ϕ(s)) = ∇u(ϕ(s)) , (s)
∂si ∂si ∂si ∂si
0 1 0 1
∂ϕ χ(s) , ∂ϕ (s) .
= g(ϕ(s)) , (s) =
∂si ∂si
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 187

Analog zum quasilinearen Fall 1.4 verlangen wir, dass die charakteristischen
Projektionen die Fläche M nicht tangential schneiden. Dies bedeutet, dass fol-
gende Transversalitätsbedingung gelten soll:
(c) In keinem Punkt ξ ∈ M ist ∇z F (ξ, f (ξ), g(ξ)) Tangentenvektor an M.

2.4 Existenz– und Eindeutigkeitssatz für das allgemeine Cauchy–Pro-


blem
Satz. Gegeben ist das Cauchy–Problem

F (x, u, ∇u) = 0, u = f und ∇u = g auf M,

dessen Daten die Bedingungen 2.3 (a),(b),(c) erfüllen. Dann gibt es eine Um-
gebung U von M , auf der das Cauchy–Problem eine eindeutig bestimmte C2 –
differenzierbare Lösung u besitzt. Diese ergibt sich aus der Gleichung

u(X(s, t)) = Y (s, t),

wobei (X(s, t), Y (s, t), Z(s, t)) die durch 2.2 (∗),(∗∗) bestimmte Charakteristi-
kenschar ist.
Bemerkung. Die Aussage des Satzes und die Gestalt der charakteristischen
Gleichungen bleiben für n > 3 richtig, wenn M durch eine orientierbare (n − 1)–
dimensionale C2 –Untermannigfaltigkeit M ⊂ Ω ersetzt wird.

Beweis.
(a) Eindeutigkeit der Lösung. Sei u eine C2 –Lösung des Cauchy–Problems auf
einer charakteristischen Umgebung U von M oder von einem Punkt auf M , vgl.
1.4. Wir behaupten

u(X(s, t)) = Y (s, t) für (s, t) ∈ V.

Zum Nachweis betrachten wir die Lösung t → P(s, t) des AWP

ṗ = ∇z F (p, u(p), ∇u(p)), p(0) = ϕ(s) ,

und setzen Q(s, t) := u(P(s, t)), R(s, t) := ∇u(P(s, t)). Dann gilt auf V

(1) Ṗ = ∇z F (P, Q, R) ,
 
(2) Q̇ = ∇u(P) , Ṗ = R , ∇z F (P, Q, R) .

Für die Komponenten Ri von R erhalten wir


3
∂2u 
3
∂2u ∂F
Ṙi = (P) Ṗk = (P) (P, Q, R) .
∂xk ∂xi ∂xi ∂xk ∂zk
k=1 k=1
188 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Aus F (x, u(x), ∇u(x)) = 0 für x = P(s, t) ergibt sich

∂F ∂F ∂u  ∂F 3
∂2u
(P, Q, R) + (P, Q, R) (P) + (P, Q, R) (P) = 0
∂xi ∂y ∂xi ∂zk ∂xi ∂xk
k=1

also folgt
∂F ∂F
(3) Ṙi = − (P, Q, R) − (P, Q, R) Ri .
∂xi ∂y
Somit erfüllen P, Q, R die charakteristischen Differentialgleichungen mit den
Anfangswerten

P(s, 0) = ϕ(s) = X(s, 0) , Q(s, 0) = u(ϕ(s)) = f (ϕ(s)) = Y (s, 0),

R(s, 0) = ∇u(ϕ(s)) = g(ϕ(s)) = Z(s, 0).

Aus dem Eindeutigkeitssatz für autonome Systeme ergibt sich

P(s, t) = X(s, t) , Q(s, t) = Y (s, t) , R(s, t) = Z(s, t) für (s, t) ∈ V,


somit
u(X(s, t)) = u(P(s, t)) = Q(s, t) = Y (s, t) für (s, t) ∈ V.

(b) Existenz von lokalen Lösungen. Wir fixieren ξ 0 = ϕ(s0 ) ∈ M mit s0 ∈ W.


Wegen der C3 –Differenzierbarkeit von F sind die rechten Seiten der charakteri-
stischen Gleichungen 2.2 (∗) C2 –differenzierbar. Die rechten Seiten der Anfangs-
bedingungen 2.2 (∗∗)

X(s, 0) = ϕ(s), Y (s, 0) = ψ(s), Z(s, 0) = χ(s)

sind ebenfalls C2 –differenzierbar. Nach der grundlegenden Theorie autonomer


Systeme sind die Lösungen X, Y, Z des charakteristischen AWP C2 –differenzier-
bar auf V .
Aus der Transversalitätsbedingung 2.3 (c) ergibt sich nun wie im Beweisteil (b)
von 1.8, dass (s, t) → X(s, t) nach Einschränkung auf eine geeignete Zylinder-
umgebung V ⊂ W × Ê von (s0 , 0) ein C2 –Diffeomorphismus von V auf eine
charakteristische Umgebung U = X(V) von ξ0 ist (mit Zylinderumgebung mei-
nen wir: jeder Punkt (s, t) ∈ V kann mit (s, 0) durch eine ganz in V verlaufende
Strecke verbunden werden). Dann ist die Funktion

u := Y ◦ X−1 : U → Ê
C –differenzierbar als Hintereinanderausführung einer C2 –Funktion und eines
2

C2 –Diffeomorphismus.
2 Die implizite Differentialgleichung F (x, u, ∇u) = 0 189

Wir zeigen nun für (s, t) ∈ V

(i) F (X(s, t), Y (s, t), Z(s, t)) = 0 ,

(ii) Z(s, t) = ∇u(X(s, t)).

Ist dies nachgewiesen, so ist u eine Lösung des Cauchy–Problems auf U. Denn
für x = X(s, t) ∈ U gilt u(x) = Y (s, t), also

F (x, u(x), ∇u(x)) = F (X(s, t), Y (s, t), Z(s, t)) = 0,

und für ξ = ϕ(s) = X(s, 0) ergibt sich

u(ξ) = u(X(s, 0)) = Y (s, 0) = f (ϕ(s)) = f (ξ),

∇u(ξ) = Z(s, 0) = g(ϕ(s)) = g(ξ).

Nachweis von (i). Die charakteristischen Gleichungen sind gerade so gewählt


worden, dass t → F (X(s, t), Y (s, t), Z(s, t)) konstant ist, vgl. 2.2. Die Konstan-
te ist nach 2.3 (a)

F (X(s, 0), Y (s, 0), Z(s, 0)) = F (ϕ(s), f (ϕ(s)), g(ϕ(s))) = 0.

Nachweis von (ii). Die Jacobi–Matrix DX(s, t) hat Rang 3, da X : V → U ein


Diffeomorphismus ist. Also sind die Vektoren ∂s1 X(s, t), ∂s2 X(s, t), ∂t X(s, t)
an jeder Stelle (s, t) ∈ V linear unabhängig. Für (ii) reicht es deshalb zu zeigen,
dass
Ai := ∇u(X) − Z , ∂si X = 0 (i = 1, 2), B := ∇u(X) − Z , ∂t X = 0.
Aus den charakteristischen Gleichungen folgt unter Beachtung der C2 –Differen-
zierbarkeit von X, Y, Z
Ai = ∂si (u ◦ X) − Z , ∂si X = ∂si Y − Z , ∂si X ,
also
∂t Ai = ∂t ∂si Y − ∂t Z , ∂si X − Z , ∂t ∂si X
= ∂si ∂t Y − ∂t Z , ∂si X − Z , ∂si ∂t X
= ∂si ∇z F (. . .) , Z + ∇x F (. . .) + ∂y F (. . .) Z , ∂si X
− Z , ∂si ∂t X
= ∂si ∇z F (. . .) , Z + ∇z F (. . .) , ∂si Z
+ ∇x F (. . .) + ∂y F (. . .) Z , ∂si X − Z , ∂si ∇z F (. . .)
= ∂si [F (. . .)] − ∂y F (. . .) Ai = 0 − ∂y F (. . .) Ai ,
190 § 7 Die Charakteristikenmethode für DG 1. Ordnung

wobei in der letzten Gleichung die Identität (i) verwendet wurde. Weiter gilt
wegen der Verträglichkeitsbedingung 2.3 (b)

Ai (s, 0) = ∂si Y (s, 0) − Z(s, 0) , ∂si X(s, 0)

= ∂si (f ◦ ϕ)(s) − g(ϕ(s)) , ∂si ϕ(s) = 0.

Dieses AWP besitzt also die Lösung


 t 
Ai (s, t) = Ai (s, 0) exp − ∂y F (. . .) dτ = 0 für (s, t) ∈ V.
0

Das Verschwinden von B ergibt sich aus der Beziehung

Z , ∂t X = Z , ∇z F (X, Y, Z) = ∂t Y = ∂t (u ◦ X) = ∇u(X) , ∂t X .

(c) Das Verkleben der lokalen Lösungen erfolgt wie im Beweisteil (c) von 1.8.
2

Bemerkung. Bei gegebener Startfläche M und gegebenen Anfangswerten f auf


M lassen die Verträglichkeitsbedingungen 2.3 (a),(b) wenig Wahlmöglichkeiten
für g. Bei festem ξ = ϕ(s) ∈ M ist 2.3 (b) eine lineare Gleichung mit eindi-
mensionalem Lösungsraum, d.h. einer Geraden. Durch die Bedingung 2.3 (a)
bleiben auf dieser Geraden nur einzelne Punkte übrig. Tritt z.B. in der DG
F (x, u, ∇u) = 0 der Gradient von u nur in der Form ∇u auf, sind dies zwei;
das ist z.B. bei der Eikonalgleichung für isotrope Medien der Fall.
Im quasilinearen Fall ist g(ξ) erwartungsgemäß eindeutig festgelegt, weil hier
∇u linear in die Differentialgleichung eingeht und die Gleichungen 2.3 (a),(b)
wegen 2.3 (c) zusammen Rang 3 haben ÜA .

2.5 Aufgabe
Lösen Sie das Cauchy–Problem

(∂1 u)2 − (∂2 u)2 = 1

mit den Anfangswerten f (ξ) = aξ1 auf der Ebene M = {ξ ∈ Ê 3


| ξ2 = 0},
wobei a > 1 eine gegebene Konstante ist.
Hinweis: Verwenden Sie die Funktion

F (x, y, z) = z1 z1 − z2 z2 − 1

Zeigen Sie, dass die Bedingungen 2.3 (a), 2.3 (b) nur die beiden Werte ∇g(ξ) =
(a, b, 0) auf M mit a2 − b2 = 1 erlauben.
Als Lösung ergibt sich u(x) = ax1 + bx2 .
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung 191

3 Wellenfronten, Lichtstrahlen und Eikonalgleichung


3.1 Grundprinzipien der geometrischen Optik
Die Ausbreitung des Lichts kann unter zwei Gesichtspunkten beschrieben wer-
den: Licht als Welle, wobei das Huygenssche Prinzip zugrundegelegt ist und Be-
wegung von Lichtpartikeln längs Strahlen, die dem Fermatschen Prinzip genü-
gen. Den Formalismus, der beide Standpunkte verbindet, und seine Übertragung
auf die Mechanik verdanken wir Sir William Rowan Hamilton. Wir beschreiben
diesen Formalismus in einer Notation, welche die Analogie zur Mechanik erken-
nen lässt. Für die mathematische Begründung der im Folgenden geschilderten
Zusammenhänge verweisen wir auf Bd. 3, § 5, Abschnitte 2 und 3. Uns kommt
es hier darauf an, die Beziehungen zur Charakteristikentheorie herzustellen.
Ê
Wir betrachten in einem Gebiet Ω ⊂ 3 ein optisches Medium mit orts– und
richtungsabhängigem Brechungsindex n(q, v), d.h. die Geschwindigkeit auf ei-
nem Lichtstrahl durch den Punkt q in Richtung v (v = 1) ist 1/n(q, v)
(Lichtgeschwindigkeit c im Vakuum = 1 gesetzt).
Wir nehmen an, dass n(q, v) bezüglich der Geschwindigkeitsvariablen v punkt-
symmetrisch ist, n(q, −v) = n(q, v). Die in der Geschwindigkeitsvariablen 1–
homogene Fortsetzung L von n ist gegeben durch

L(q, v) := n(q, v/v) v für v = 0 und L(q, 0) := 0.

Von dieser Lagrange–Funktion fordern wir, dass das Quadrat L2 auf Ω × 3 Ê


C3 –differenzierbar und die Hesse–Matrix Lvv (q, v) für v = 0 positiv definit
Ê Ê
ist. Dann ist die Menge {v ∈ 3 | v ∈ 3 mit L(q, v) < 1} beschränkt, strikt
konvex, und für die Hamilton–Funktion
 
H(q, p) = max p, v | v ∈ Ê 3
mit L(q, v) = 1

ist das Quadrat H(q, p)2 ebenfalls auf Ω × Ê 3


C3 –differenzierbar. Es besteht
die Eulersche Homogenitätsrelation

H(q, p) = ∇p H(q, p) , p ,

weil wegen der 1–Homogeneität von L bezüglich der v–Variablen auch die
Hamilton–Funktion H 1–homogen bezüglich der p–Variablen ist.
Die Punktsymmetrie von n überträgt sich auf L und H:

L(q, −v) = L(q, v) und H(q, −p) = H(q, p).

ÜA Veranschaulichen Sie sich die Konstruktion der Hamilton–Funktion, indem


Sie eine Tangentialebene senkrecht zu p an die geschlossene (= kompakte) und
Ê Ê
strikt konvexe Fläche {v ∈ 3 | v ∈ 3 mit L(q, v) = 1} legen und den
Abstand dieser Stützebene zum Ursprung bestimmen.
192 § 7 Die Charakteristikenmethode für DG 1. Ordnung

ÜA Für ein isotropes Medium mit richtungsunabhängigem Brechungsindex


n(q) ergibt sich L(q, v) = n(q)v, H(q, p) = p/n(q).

Die Ausbreitung des Lichts außerhalb von Brennpunkten erfolgt längs Wellen-
fronten und Lichtstrahlen gemäß den folgenden Prinzipien der geometrischen
Optik (t sei im Folgenden die Zeitkoordinate):
(1) Die Wellenfronten sind die Niveauflächen

{S = t} = {q ∈ Ω | S(q) = t }

einer C1 –Funktion S : Ω → Ê, die der Eikonalgleichung


H(q, ∇S(q)) = 1 für q ∈ Ω

genügt. Eine solche Funktion wird ein Eikonal der betrachteten Lichtausbrei-
tung genannt.
(2) Die Lichtstrahlen t → q(t) gehorchen zusammen mit ihrem Wellen-
vektorfeld t → p(t) := ∇v L(q(t), q̇(t)) den kanonischen (Hamiltonschen)
Gleichungen

q̇(t) = ∇p H(q(t), p(t)), ṗ(t) = − ∇q H(q(t), p(t)).

(3) Wellenfronten und Lichtstrahlen sind korreliert durch die optische Trans-
versalitätsbedingung

p(t) = ∇S(q(t)).

Als Folgerung aus (1),(2),(3) ergibt sich


d
dt
S(q(t)) = ∇S(q(t)) , q̇(t) = p(t) , ∇p H(q(t), p(t))

= H(q(t), p(t)) = H(q(t), ∇S(q(t))) = 1.

Dies bedeutet die optische Äquidistanz der Wellenfronten: Für je zwei Zeitpunk-
te t0 < t1 benötigt ein Lichtstrahl t → q(t) die gleiche Zeit t1 − t0 , um von der
Front {S = t0 } zur Front {S = t1 } zu gelangen:
t1 t1
S(q(t1 )) − S(q(t0 )) = d
dt
S(q(t)) dt = 1 dt = t1 − t0 .
t0 t0

Wegen dieser Eigenschaft wird das Eikonal S auch optische Distanzfunktion


genannt.
Bemerkungen. (i) Die Eikonalgleichung ist nichts anderes als die differenti-
elle Fassung des Huygensschen Prinzips. Dies machen wir in 3.2 plausibel. Im
Fall eines isotropen Mediums lautet die Eikonalgleichung

∇S(q) = n(q) .
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung 193

Hieran sehen wir, wie der ortsabhängige Brechungsindex das Fortschreiten der
Wellenfronten steuert: An einer Stelle q mit kleiner (großer) Ausbreitungsge-
schwindigkeit des Lichts 1/n(q) ist n(q) = ∇S(q) groß (klein), die Wellen-
fronten rücken nahe q zusammen (auseinander).
(ii) Die kanonischen Gleichungen fol-
gen aus dem Fermatschen Prinzip, nach {S = t}
welchem sich jeder Lichtstrahl zwischen
zwei eng benachbarten Punkten q0 , q1 Licht–
auf einer Bahn kürzester Laufzeit be- strahlen
wegt. Näheres hierzu in 3.3.
q̇(t)
(iii) Die optische Transversalitätsbedin-
gung besagt, dass der Wellenvektor p(t) 
eines Lichtstrahls im Punkt q(t) senk- q(t)
p(t) =
recht auf der Wellenfront {S = t} ∇S(q(t))
steht; für den Geschwindigkeitsvektor
q̇(t) trifft das i.A. nicht zu. Im Fall
eines isotropen Mediums sind aller-
dings q̇(t) und p(t) gleichgerichtet; hier 3 45 6
schneiden sich Lichtstrahlen und Wel- Wellenfronten
lenfronten senkrecht ÜA .

3.2 Huygenssches Prinzip und Eikonalgleichung


Nach der Wellentheorie von Huygens
breitet sich Licht längs Wellenfronten
aus, die wir in Abhängigkeit von der
Zeit t durch Niveauflächen

{S = t} = {q ∈ Ω | S(q) = t}

einer C1 –Funktion S auf Ω ⊂ 3 be- Ê


schreiben. Dabei ist der Ausbreitungs-
Eτ (q)
prozeß durch folgende Vorschrift fest-
gelegt: Die Punkte q einer gegebe- q
nen Wellenfront {S = t} sind Aus-
gangspunkte von Elementarwellen-
{S = t − τ } {S = t} {S = t + τ }
fronten Eτ (q), welche von den be-
nachbarten Wellenfronten {S = t + τ }
und {S = t − τ } für 0 < τ  1 eingehüllt werden (Fig.). In erster Näherung
besteht die Elementarwellenfront Eτ (q) für 0 < τ  1 aus denjenigen Punkten
q + v , die von q die Lichtzeitdistanz τ = L(q, v) besitzen:

Eτ (q) ≈ {q + v | v ∈ Ê 3
mit L(q, v) = τ }
= {q + τ w | w ∈ Ê 3
mit L(q, w) = 1} .
194 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Da nach 3.1 die Elementarwellenfront Eτ (q) kompakt und konvex gekrümmt


ist, trifft diese die beiden Wellenfronten jeweils in genau einem Punkt. Wir
machen plausibel, dass als Folge dieses Huygensschen Prinzips die Funktion S
der Eikonalgleichung genügt.
Hierzu fixieren wir einen Punkt q0 und
setzen t = S(q0 ). Nach dem Huygens-
schen Prinzip berührt die Elementar- Eτ (q0 )
wellenfront für 0 < τ  1 qτ
∇S(qτ )
Eτ (q0 ) = {q0 + v | L(q0 , v) = τ }
die Wellenfront { q | S(q) = t + τ } an q0
genau einer Stelle qτ = q0 + vτ :
L(q0 , vτ ) = τ ,
S(qτ ) = t + τ ,
∇S(qτ )  ∇v L(q0 , vτ ) .

Wegen τ = S(qτ ) − S(q0 ) = S(q0 + vτ ) − S(q0 ) ≈ ∇S(qτ ) , vτ ist die


gemeinsame Tangentialebene in erster Näherung gegeben durch
  
q0 + v  v ∈ Ê3
mit ∇S(qτ ), v = τ .
Dass dabei Eτ (q0 ) ganz auf einer Seite dieser Ebene liegt, bedeutet
τ = ∇S(qτ ) , vτ
  
= max ∇S(qτ ) , v  v ∈ Ê3
mit L(q0 , v) = τ
  
= max ∇S(qτ ) , τ w  w ∈ Ê3
mit L(q0 , w) = 1
bzw.
  
1 = max ∇S(qτ ) , w  w ∈ Ê 3
mit L(q0 , w) = 1 .
Für τ → 0 strebt qτ gegen q0 , also ergibt sich nach der Definition der Hamilton–
Funktion H in 3.1 die Eikonalgleichung an der Stelle q0
H(q0 , ∇S(q0 )) = 1.

3.3 Fermatsches Prinzip und kanonische Gleichungen


Für jede Kurve C = {q(s) | s0 ≤ s ≤ s1 } im optischen Medium mit Brechungs-
index n beträgt die Laufzeit zwischen den Punkten q0 = q(s0 ) und q1 = q(s1 )
   s1
Tss01 (q) = dt = ds
v
= n ds = L(q(s), q̇(s)) ds .
C C C s0

Das Fermatsche Prinzip besagt, dass sich Lichtteilchen auf Bahnen t → q(t) be-
wegen, für die die Laufzeit zwischen je zwei hinreichend banachbarten Punkten
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung 195

q0 , q1 minimal ist (verglichen mit der Laufzeit von Vergleichskurven zwischen


diesen Punkten). Äquivalent zu dieser Minimumeigenschaft sind die normalen
Euler–Lagrange–Gleichungen

d
∇v L(q(t), q̇(t)) = ∇q L(q(t), q̇(t)), L(q(t), q̇(t)) = 1,
dt

und die normalen kanonischen (Hamiltonschen) Gleichungen für q(t)


und p(t) = ∇v L(q(t), q̇(t)),

q̇(t) = ∇p H(q(t), p(t)), ṗ(t) = − ∇q H(q(t), p(t)), H(q(t), p(t)) = 1,

vgl. Bd. 3, § 5, Abschnitte 1.3(c), 2.5, 2.7.

3.4 Das Cauchy–Problem für die Eikonalgleichung


(a) Zunächst stellen wir den engen Zusammenhang zwischen Lichtstrahlen (au-
ßerhalb von Brennpunkten) und den Charakteristiken der Eikonalgleichung dar.
Ê
Im Raumgebiet Ω ⊂ 3 eines optischen Mediums mit Hamilton–Funktion
H(q, p) geben wir als Lichtquelle eine Fläche M vor. Wir fassen M als eine Wel-
lenfront in einer Schar von Wellenfronten {S = t} auf, o.B.d.A. M = {S = 0}.
Wir betrachten das Cauchy–Problem für die Eikonalgleichung

H(q, ∇S(q)) = 1, S = 0 auf M.

Wie in 2.1 nehmen wir die Fläche M als C2 –differenzierbar und orientierbar an.
Ê Ê
Wir verwenden jetzt die Notation (q, y, p) ∈ Ω × × 3 anstelle von (x, y, z)
und setzen
1
F (q, y, p) := 2 (H(q, p)
2
− 1).

Es gilt dann

∇q F = H∇q H, ∂y F = 0 , ∇p F = H∇p H.

Hieraus ergibt sich: Erfüllt S die Eikonalgleichung

H(q, ∇S(q)) = 1

mit S = 0 auf M , und ist t → q(t) ein zugehöriger Lichtstrahl mit Wellenvek-
torfeld t → p(t), d.h. gilt

q̇(t) = ∇p H(q(t), p(t)) , ṗ(t) = − ∇q H(q(t), p(t)) , H(q(t), p(t)) = 1


196 § 7 Die Charakteristikenmethode für DG 1. Ordnung

und q(0) ∈ M , so folgt mit y(t) := S(q(t))


q̇(t) = ∇p F (q(t), y(t), p(t)),
ẏ(t) = ∇S(q(t)) , q̇(t) = p(t) , q̇(t) = p(t) , ∇p F (q(t), y(t), p(t)) ,
ṗ(t) = − ∇q F (q(t), y(t), p(t)),
und
q(0) ∈ M, y(0) = S(q(0)) = 0,

d.h. t → (q(t), y(t), p(t)) ist eine Charakteristik von F . Umgekehrt sei t →
(q(t), y(t), p(t)) eine Charakteristik von F mit H(q(0), p(0)) = 1. Dann gilt
nach Beweisteil (b) in 2.4 F (q(t), y(t), p(t)) = 0 und damit H(q(t), p(t)) = 1
für alle t. Hieraus ergeben sich unmittelbar die Gleichungen der Lichtstrahlen.
Als Anwendung des Hauptsatzes 2.4 zeigen wir den
(b) Satz. Für jede orientierbare C2 –Fläche M ⊂ Ω hat das Cauchy–Problem
für die Eikonalgleichung,

H(q, ∇S(q)) = 1, S = 0 auf M,

in einer Umgebung von M genau zwei, sich nur durch das Vorzeichen unter-
scheidende Lösungen ± S.
Jede beliebige orientierbare Fläche erzeugt also eine (bis auf die Zeitorientie-
rung) eindeutig bestimmte Lichtausbreitung längs Wellenfronten und Licht-
strahlen. Dass ein Vorzeichenwechsel des Eikonals ein Wechsel der Zeitorientie-
rung bedeutet, ergibt sich aus der Beziehung S(q(t)) = t , welche unmittelbar
d
aus der in 3.1 abgeleiteten Relation dt S(q(t)) = 1 zusammen mit S(q(0)) = 0
folgt.
Zum Beweis haben wir die Voraussetzungen des Hauptsatzes der gegebenen
Situation anzupassen, d.h. wir müssen den Anfangswerten f = 0 für das Eikonal
S auf M noch Anfangswerte g für den Gradienten ∇S auf M hinzufügen. Die
Verträglichkeitsbedingungen 2.3(a),(b) legen das Vektorfeld g und damit die
Lösung S des Cauchy–Problems bis auf das Vorzeichen fest:
Die Verträglichkeitsbedingungen 2.3(b) liefern
0 1
∂ ∂ϕ
0 = f (ϕ(s)) = g(ϕ(s)) , (s) für s ∈ W, i = 1, 2,
∂si ∂si
d.h. g muss ein Normalenfeld auf der Fläche M sein. Die Bedingung 2.3(a),
H(ξ, g(ξ)) = 1 für ξ ∈ M,
wird für jeden Punkt ξ ∈ M durch genau zwei entgegengesetzt gleiche Vektoren
± g(ξ) erfüllt, was sich aus der Punktsymmetrie von H in 3.1 ergibt. Damit
bleiben wegen der Orientierbarkeit von M genau zwei Möglichkeiten für die
Wahl von g. Die Transversalitätsbedingung 2.3(c) ist erfüllt, denn wegen
3 Wellenfronten, Lichtstrahlen und Eikonalgleichung 197

∇p F (ξ, 0, g(ξ)) , g(ξ) = ∇p H(ξ, g(ξ)) , g(ξ) = H(ξ, g(ξ)) = 1

ist ∇p F (ξ, 0, g(ξ)) kein Tangentenvektor von M an der Stelle ξ ∈ M . Der


Existenz– und Eindeutigkeitssatz 2.4 sichert für jedes der beiden Normalenfelder
die eindeutige Lösbarkeit des Cauchy–Problems.
Beispiel. Wir betrachten das Cauchy–Problem für ein optisches Medium mit
konstantem Brechungsindex n (L(q, v) = n v, H(q, p) = n−1 p nach 3.1)

∇S = n , S = 0 auf M.

Wir vervollständigen die Anfangsdaten durch Wahl eines Normalenfeldes g mit


g = n auf der gegebenen Fläche M und setzen
1
F (q, y, p) := 2 (p2 − n2 ) .

Es gilt dann

∇q F = 0 , ∂y F = 0 , ∇p F = p ,

und das charakteristische AWP lautet mit den Bezeichnungen von 2.1, 2.4

q̇(t) = p(t) , ẏ(t) = p(t)2 = n2 , ṗ(t) = 0 ,

q(0) = ϕ(s) , y(0) = 0 , p(0) = χ(s) := g(ϕ(s)) .

Dieses hat die Lösung

Q(s, t) = ϕ(s) + t χ(s) , Y (s, t) = n2 t, P(s, t) = χ(s) .

Die charakteristischen Projektionen, also die Lichtstrahlen t → Q(s, t) sind


Geraden. Die Abbildung Q liefert nach Einschränkung auf eine hinreichend
Ê
kleine Umgebung V ⊂ 3 von W × {0} einen C2 –Diffeomorphismus zwischen V
und einer charakteristischen Umgebung U ⊂ Ω von M . Das Eikonal S ist auf
U definiert durch S = Y ◦ Q−1 ; die explizite Bestimmung von S als Funktion
von q ist ohne Interesse. Für je zwei Wellenfronten
{S = t0 } = {Q(s, t0 ) = ϕ(s) + t0 χ(s) | s ∈ W},
{S = t1 } = {Q(s, t1 ) = ϕ(s) + t1 χ(s) | s ∈ W},
und kleine τ = |t1 − t0 |/n > 0 wird der Abstand τ von zwei Punkten Q(s, t0 )
und Q(s, t1 ) durch das Lichtstrahlsegment {Q(s, t) | t0 ≤ t ≤ t1 } realisiert.
Das bedeutet die Gültigkeit des Huygensschen Prinzips: Jede Elementarwellen-
front Eτ (q) = {q + v | L(q, v) = nτ } = {q + v | v = τ } mit Mittelpunkt
q = Q(s, t0 ) auf der Wellenfront {S = t0 } berührt die Wellenfront {S = t1 }
genau im Punkt Q(s, t1 ).
Literatur: Arnold [151] 46, Giaquinta–Hildebrandt [152] Ch.8, Ch.10.
198 § 7 Die Charakteristikenmethode für DG 1. Ordnung

3.5 Zur Geschichte


(a) Die Charakteristikenmethode geht auf Lagrange zurück. Nachdem er 1772
die nichtlineare DG ∂u∂y
= f (x, y, u, ∂u
∂x
) auf eine quasilineare DG zurückgeführt
und 1774 eine Theorie für die allgemeine Lösung aufgestellt hatte, gab er 1779
Differentialgleichungen für die Charakteristiken quasilinearer Probleme an. Ei-
ne geometrische Begründung der Charakteristikenmethode fand 1784 Gaspard
Monge. Pfaff 1815 und Cauchy 1819 erweiterten diese für n > 2.
(b) Nach der Erfindung des Fernrohrs 1609 setzte neues Interesse an der geo-
metrischen Optik ein. Descartes führte das Brechungsgesetz auf einfache, al-
lerdings unzutreffende Prinzipien zurück (Discours de la Méthode 1637). Über
diese kam es zu einer langen Auseinandersetzung zwischen Fermat und den
Cartesianern, in deren Verlauf Fermat 1662 das Prinzip der kürzesten Lauf-
zeit aufstellte. (Das Prinzip des kürzesten Lichtwegs benützte schon Heron
von Alexandria um 66 n. Chr. zur Erklärung der Reflexion.) In seiner Traité
de la Lumière stellte Huygens 1678 das nach ihm benannte Prinzip auf und
erklärte damit Reflexion, Brechung, Ablenkung in inhomogenen Medien und die
Doppelbrechung beim (anisotropen) Islandspat. Bedeutende Beiträge zur Optik
leistete Newton (Opticks 1704: Farbenlehre, Dispersion, Theorie der Newton-
ringe). Er vertrat die Korpuskeltheorie und glaubte wie Descartes, dass die
Geschwindigkeit im optisch dichteren Medium größer sei. In den Principia 1687
versuchte er eine mechanische Herleitung des Brechungsgesetzes.
Mit der Entwicklung der Differential– und Integralrechnung wurde es möglich,
Variationsprobleme wie das der kürzesten Laufzeit anzugehen. Den Anstoß gab
Johann Bernoulli 1696 mit dem Brachistochronenproblem: Gesucht ist die
Verbindungskurve zwischen zwei festen Punkten, auf der ein Massenpunkt in
kürzester Zeit reibungsfrei hinabgleitet. Er löste es durch Zurückführung auf
ein optisches Problem (Brechungsindex umgekehrt proportional zur Wurzel aus
der Höhe) und stellte dabei den Zusammenhang zwischen Huygensschen Wel-
lenfronten und den durch das Fermat–Prinzip gegebenen Lichtstrahlen heraus.
Hamiltons Theorien der Optik (On Systems of Rays . . . ) und der Mechanik
entstanden in den zwanziger Jahren des 19. Jahrhunderts; 1833/34 erschienen
die Abhandlungen On a General Method of Expressing the Paths of Light, and
the Planets, by the Coefficients of a Characteristic Function und On a General
Method on Dynamics . . . . In diesen Arbeiten finden wir die oben geschilder-
ten Konzepte vorgezeichnet und angewandt. Die erste Arbeit blieb auf dem
Kontinent bis zur Jahrhundertwende unbekannt, so dass ähnliche Ergebnisse
von anderen Autoren publiziert wurden (z.B. Bruns 1895). Die zweite der ge-
nannten Arbeiten von Hamilton wurde 1866 von Jacobi in neu gefasster und
gestraffter Form der Öffentlichkeit zugänglich gemacht.
Für Erwin Schrödinger waren 1926 die klassische Wellentheorie und die Ha-
milton–Jacobi–Gleichung als mechanisches Analogon zur Eikonalgleichung An-
knüpfungspunkte für die Aufstellung der stationären Schrödinger–Gleichung der
neuen Wellenmechanik.
4 Systeme von Differentialgleichungen erster Ordnung 199

4 Systeme von Differentialgleichungen erster Ordnung


Gesucht sind C2 –differenzierbare Lösungen u = (u1 , . . . , un ) : Ê m
⊃U→ Ên

des Systems
∂uα
= fiα (x, u) (i = 1, . . . , m, α = 1, . . . , n).
∂xi
Dabei sind die fiα gegebene Cr –Funktionen auf Ω × Ê , wobei
n
Ω⊂ Êm
ein
Gebiet und r ≥ 2 ist.
Notwendig für die Existenz einer Lösung sind die Integrabilitätsbedingun-
gen

m  
∂fkα ∂fiα ∂fkα ∂fiα
− + fiβ − fkβ = 0
∂xi ∂xk ∂uβ ∂uβ
β=1

für alle α, i, k mit i = k. Diese ergeben sich unmittelbar aus der Relation
∂i ∂k u = ∂k ∂i u ÜA .

Satz (Frobenius 1877). Sind die Integrabilitätsbedingungen erfüllt, so hat für


Ê
jeden Punkt (a, b) ∈ Ω × n das Anfangswertproblem
∂uα
(∗) = fiα (x, u), u(a) = b
∂xi
in einer Umgebung von a eine eindeutig bestimmte Cr+1 –differenzierbare Lö-
sung.
Dieser Satz hat eine wichtige Anwendung in der Differentialgeometrie.

Beweis und Lösungsverfahren


O.B.d.A. sei a = 0.
(a) Ist u eine Lösung von (∗) auf einer sternförmigen Nullpunktsumgebung U
(d.h. x ∈ U =⇒ tx ∈ U für 0 ≤ t ≤ 1), so löst y(t) := u(tx) das AWP

m
(∗∗) ẏ α (t) = fkα (tx, y(t)) xk (α = 1, . . . , n) , y(0) = b .
k=1

ÜA . Wegen des Eindeutigkeitssatzes für (∗∗) ist daher u eindeutig bestimmt.
(b) Sei umgekehrt t → y(t, x) die Lösung des vom Parameter x abhängigen
AWP (∗∗). Dann existiert y(t, 0) für alle t, und es gilt y(t, 0) = b. Nach der
allgemeinen Theorie (§ 2 : 7.2 in Verbindung mit § 2 : 7.4 (c)) gibt es eine – gleich
sternförmig gewählte – Nullpunktsumgebung U, so dass für alle x ∈ U das Exi-
stenzintervall von y(t, x) das Intervall [0, 1] umfaßt; ferner ist y(t, x) bezüglich
der Variablen t, x C2 –differenzierbar wegen r ≥ 2.
200 § 7 Die Charakteristikenmethode für DG 1. Ordnung

Wir zeigen, dass

u(x) := y(1, x)

eine Cr –differenzierbare Lösung von (∗) liefert. Dazu betrachten wir


∂y α
ziα (t, x) = (t, x) − t fiα (tx, y(t, x)) .
∂xi
∂ 2yα ∂ 2yα
Da y α (0, x) konstant ist, gilt ziα (0, x) = 0 für x ∈ U. Wegen =
∂t∂xi ∂xi ∂t
erhalten wir ferner
∂ziα ∂ 2 yα ∂  α 
(t, x) = − tfi (tx, y(t, x))
∂t ∂xi ∂t ∂t
∂  α 
m
∂ α
= fk (. . .)xk − fiα (. . .) − t fi (. . .)
∂xi ∂t
k=1


m
 ∂fkα 
n
∂fkα ∂y β
= t (. . .) + (. . .) (t, x) xk
∂xi ∂uβ ∂xi
k=1 β=1


m
 ∂f α 
n
∂f α ∂y β
−t i
(. . .) xk + i
(. . .) (t, x)
∂xk ∂uβ ∂t
k=1 β=1


m
 ∂f α ∂fiα 
n
∂fiα 
m

= t k
(. . .) − (. . .) xk + (. . .) fkβ (. . .) xk
∂xi ∂xk ∂uβ
k=1 β=1 k=1

  ∂f α
n m
 
+ k
(. . .) ziβ (t, x) + t fiβ (. . .) xk .
∂uβ
β=1 k=1

Berücksichtigen wir jetzt die Integrabilitätsbedingungen, so bleibt

∂ziα 
n

m
∂fkα
(t, x) = (tx, y(t, x)) ziβ (t, x).
∂t ∂uβ
β=1 k=1

Dies ist ein homogenes lineares System gewöhnlicher DG für zi = (zi1 , . . . , zin ).
Wegen ziα (0, x) = 0 folgt nach dem Eindeutigkeitssatz § 3 : 1.2 ziα (t, x) = 0 für
α = 1, . . . , n, i = 1, . . . , m . Damit erhalten wir
∂uα
(x) − fiα (x, u(x)) = ziα (1, x) = 0 für x ∈ U
∂xi
und u(0) = y(1, 0) = b.
Ferner folgt aus dem Bestehen dieser DG, dass ∂uα
∂xi
∈ Cr (U), also u ∈ Cr+1 (U).
2
Kapitel IV
Hilfsmittel aus der Analysis
Für die Behandlung partieller Differentialgleichungen wie auch für die mathema-
tischen Grundlagen der Quantenmechanik bedarf es einer Erweiterung unseres
mathematischen Rüstzeugs. Problemorientiertes Vorgehen, also Bereitstellung
der mathematischen Hilfsmittel jeweils nach Bedarf, würde die Geschlossenheit
der Argumentation bei den im folgenden behandelten Themenbereichen stören;
auch werden einige dieser Hilfsmittel an mehreren Stellen benötigt.
Wir empfehlen den Lesern, sich die benötigten Vorkenntnisse erst bei Bedarf
anzueignen; diese werden zu Beginn jedes der folgenden Paragraphen genannt.
Mit dem Lebesgue–Integral und seinen Eigenschaften sollten Sie sich allerdings
schon an dieser Stelle vertraut machen. Um Ihnen den Zugang zu erleichtern
und um rasch zur Sache zu kommen, stellen wir im folgenden Paragraphen die
Grundzüge der Lebesgueschen Theorie zusammen. Für die meisten Beweise wird
auf Kap. VI verwiesen, in welchem im Hinblick auf die Quantenmechanik eine
allgemeine Maß– und Integrationstheorie entwickelt wird.

§ 8 Lebesgue–Theorie und Lp –Räume

1 Eigenschaften des Lebesgue–Integrals


1.1 Zur Notwendigkeit eines erweiterten Integralbegriffs
Existenzbeweise für die Lösung von Differentialgleichungsproblemen und an-
derer Aufgaben der Analysis stützen sich durchweg auf die Vollständigkeit
eines Funktionenraums. Das typische Vorgehen besteht dabei in den folgenden
Schritten:
– Umformulierung der gestellten Aufgabe in ein Gleichungsproblem in einem
geeignet gewählten Funktionenraum.
– Auswahl oder Konstruktion einer Folge u1 , u2 , . . . von approximativen Lö-
sungen, die eine Cauchy–Folge in diesem Raum bildet.
– Nachweis, dass der wegen der Vollständigkeit existierende Grenzwert u dieser
Folge das Gleichungsproblem löst.
– Nachweis, dass u eine Lösung des Originalproblems ist.
Eine besondere Rolle spielen Hilbertraummethoden. Bei diesen führt in vie-


len Fällen ein Reihenansatz u = vi , u vi mit einem Orthonormalsystem
i=1
v1 , v2 , . . . zum Ziel; hier besteht die Folge uk aus den Partialsummen.

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_4, © Springer Fachmedien Wiesbaden 2014
202 § 8 Lebesgue–Theorie und Lp –Räume

Eine andere wichtige Hilbertraum–Methode sei an einem Beispiel erläutert:


Das Dirichlet–Problem auf einem beschränkten Gebiet Ω ⊂ Ê n
,

− Δu = f in Ω , u = 0 auf ∂Ω

wird durch partielle Integration umgeformt in das Gleichungsproblem

u, ϕ V = f,ϕ H

für alle in einer Umgebung des Randes ∂Ω verschwindenden C∞ –Funktionen ϕ ;


dabei ist

u, v H := u·v

Ω

zunächst definiert auf H0 = { u ∈ C0 (Ω) | |u|2 < ∞ } und


Ω
 
n
u, v V := ∇u , ∇v = ∂k u , ∂k v H
Ω k=1
ist definiert auf

V0 = { u ∈ C0 (Ω) ∩ C1 (Ω) | ∂1 u, . . . , ∂n u ∈ H0 , u = 0 auf ∂Ω }.

Beide Räume H0 und V0 sind bezüglich der durch das jeweilige Skalarprodukt
gegebenen Norm nicht vollständig, lassen sich aber zu Hilberträumen erweitern.
Der hierfür entscheidende Schritt ist die Erweiterung des Raums H0 .
Grundlage hierfür ist der 1902 von Henri Lebesgue entwickelte Integralbe-
griff. Ein Hauptergebnis der Lebesgueschen Theorie ist die Vertauschbarkeit
von Limes und Integral unter wesentlich schwächeren Bedingungen als denen
der gleichmäßigen Konvergenz. Damit läßt sich zeigen, dass die gesuchte Ver-
vollständigung von H0 durch
 
L2 (Ω) = u:Ω→ Ê|u 2
ist im Lebesgueschen Sinn integrierbar

gegeben ist (Genaueres in 2.1).


Der Ansatz von Lebesgue gestattet es, unser bisheriges Integral auf eine größe-
re Klasse von Funktionen auszudehnen, die dann auch hochgradig unstetige
umfasst. Die Konstruktion und die Beweise sind allerdings um einiges kompli-
zierter. Wir stellen im folgenden das Grundkonzept und die Hauptergebnisse
der Lebesgueschen Theorie vor. Für die Beweise verweisen wir auf § 19, § 20.

1.2 Das Lebesgue–Maß


Eine Erweiterung des Integralbegriffs für Funktionen setzt eine Erweiterung des
Volumenbegriffs für Mengen voraus. In Bd. 1, § 23 wurde das n–dimensionale
Volumen V n (Ω) für offene Mengen Ω eingeführt. Wir setzen dieses folgender-
maßen auf eine größere Klasse von Mengen fort:
1 Eigenschaften des Lebesgue–Integrals 203

Ê
Eine Menge M ⊂ n heißt messbar (genauer: Lebesgue–messbar), wenn
es zu jedem ε > 0 eine offene Menge Ω und eine abgeschlossene Menge A gibt
mit
A ⊂ M ⊂ Ω und V n (Ω \ A) < ε .
(V n (Ω \ A) ist für die offene Menge Ω \ A bereits definiert.) Für messbare
Mengen M definieren wir das Volumen, jetzt Lebesgue–Maß genannt, durch
V n (M ) := inf { V n (Ω) | Ω offen, M ⊂ Ω, V n (Ω) < ∞ } ,
falls es eine offene Obermenge endlichen Maßes gibt; andernfalls sagen wir M

hat kein endliches Maß“ und schreiben V n (M ) = ∞.
Das System der messbaren Mengen bezeichnen wir mit A . Dieses Mengensystem
erweist sich als sehr umfangreich, enthält aber nicht sämtliche Teilmengen des
Ê n
, vgl. § 19 : 8.1. Quader und offene Mengen sind Lebesgue–messbar, und für
diese stimmen Lebesgue–Maß und das bisher definierte Volumen überein, vgl.
Bd. 1, § 23 : 4.1 und 7.1. Weiter gilt
(i) ∅, Ê
n
∈ A,
(ii) M, N ∈ A =⇒ M \ N ∈ A ,
(iii) M, N ∈ A =⇒ M ∩ N ∈ A ,
(iv) A enthält mit je endlich vielen oder abzählbar vielen Mengen auch deren
Vereinigung.
Ê
Ein solches Mengensystem heißt eine σ–Algebra auf n. Die entscheiden-
de, für Vollständigkeitseigenschaften verantwortliche Eigenschaft des Lebesgue–
Maßes ist die σ–Additivität (abzählbare Additivität)
7
∞ 

V n( Ak ) = V n (Ak ) für paarweise disjunkte Ak ∈ A.
k=1 k=1
7

Das ist so zu lesen: Genau dann hat A := Ak endliches Maß, wenn alle Ak
k=1


endliches Maß haben und wenn die Reihe V n (Ak ) konvergiert. Dann ist
k=1
V n (A) durch diese Reihe gegeben. Andernfalls schreiben wir V n (A) = ∞.
Für AN+1 = AN+2 = · · · = ∅ folgt die endliche Additivität:
7
N 
N
V n( Ak ) = V n (Ak ) für paarweise disjunkte Ak ∈ A.
k=1 k=1

Einpunktige Mengen haben offenbar das Maß Null. Wegen (iv) und der σ–
Additivität sind daher alle abzählbaren Mengen Lebesgue–messbar mit Maß 0,
z.B. die Menge n aller Vektoren mit rationalen Komponenten. ( ÜA : Zeigen
Sie per Induktion, dass n abzählbar ist). Nach (ii) enthält A alle abgeschlos-
senen Mengen. Kompakte Mengen haben endliches Maß.
204 § 8 Lebesgue–Theorie und Lp –Räume

1.3 Nullmengen und der Begriff fast überall“



(a) Eine Lebesgue–messbare Menge A mit V n (A) = 0 heißt Nullmenge (ge-
nauer: Lebesgue–Nullmenge). Äquivalent dazu ist folgende Bedingung: Zu
jedem ε > 0 gibt es endlich viele oder abzählbar viele Quader Ik mit
2 
A ⊂ Ik und V n (Ik ) < ε .
k k
Durch eventuelle Hinzunahme entarteter Quader dürfen wir immer von abzähl-
baren Überdeckungen ausgehen. Dieser Nullmengenbegriff ist umfassender als
der in Bd. 1, § 23 : 7.4, da wir jetzt abzählbare Quaderüberdeckungen zulassen
und nicht mehr nur endliche. Die Menge der rationalen Zahlen ist als abzähl- É
Ê
bare Menge eine Lebesgue–Nullmenge des , jedoch keine Nullmenge im alten
Sinn.
Satz. (i) Jede Teilmenge einer Nullmenge ist eine Nullmenge.
7

(ii) Sind A1 , A2 , . . . Nullmengen, so auch Ak .
k=1

Beweis.
(i) folgt direkt aus der Definition.
(ii) Zu gegebenem ε > 0 gibt es nach der oben gemachten Bemerkung Quader
Ik mit
7
∞ 

Ak ⊂ Ik und V n (Ik ) < ε 2−k .
=1 =1

Nach dem Umordnungssatz Bd. 1, § 7 : 6.6 folgt


7
∞ 7
∞ 7
∞ 
∞ 
∞ 

Ak ⊂ Ik mit V n (Ik ) < ε 2−k = ε . 2
k=1 k=1 =1 k=1 =1 k=1

Beispiele von Nullmengen:


(i) Achsenparallele Hyperebenen ÜA .
Ê
(ii) Graphen stetiger Funktionen f : Ω → auf offenen Mengen Ω ⊂ n−1 . Ê
ÜA : Betrachten Sie zunächst stetige Funktionen auf kompakten Quadern und
stellen Sie dann Ω als abzählbare Vereinigung kompakter Quader dar, vgl. Bd. 1,
§ 23 : 4.1.
(iii) Nullmengen können sehr umfangreich sein. Ein Beispiel ist das Cantorsche
Ê
Diskontinuum in , welches sich bijektiv auf Ê
abbilden läßt (Barner–Flohr
[141] § 15).
(b) Funktionen u, v auf einer messbaren Menge Ω heißen fast überall gleich,
u(x) = v(x) für fast alle x ∈ Ω, kurz u = v f.ü. ,
wenn {x ∈ Ω | u(x) = v(x)} eine Nullmenge ist.
1 Eigenschaften des Lebesgue–Integrals 205

Allgemein heißt eine Eigenschaft E(x) fast überall auf Ω erfüllt, wenn sie
höchstens auf einer Nullmenge verletzt ist. Konvergenz fast überall von
Funktionen uk auf Ω bedeutet also, dass

N := { x ∈ Ω | (uk (x)) konvergiert nicht }

eine Nullmenge ist. In diesem Fall definieren wir u = lim uk durch


k→∞

lim uk (x) für x ∈ Ω \ N ,
k→∞
u(x) :=
0 für x ∈ N .
Entsprechend vereinbaren wir: Bilden die Definitionslücken einer Funktion eine
Nullmenge, so schließen wir diese für Zwecke der Integration durch Zuweisung
des Funktionswertes Null.
In diesem Sinne sind 1/u , bzw. ∂k u zu verstehen, falls u(x) = 0 f.ü. bzw. falls
u fast überall partiell differenzierbar ist.

1.4 Das Lebesgue–Integral


(a) Die Definition des Integrals erfolgt zunächst für integrierbare Elementar-
Ê Ê
funktionen, das sind Funktionen ϕ : n → , die sich in der Form
N
ϕ = ck χAk
k=1

mit reellen ck darstellen lassen, wobei die Ak paarweise disjunkte messbare


Mengen endlichen Maßes sind. Zu diesen gehören die Treppenfunktionen. Für
solche Elementarfunktionen ist das Lebesgue–Integral
  
N
ϕ = ϕ(x) dn x := ck V n (Ak )
Ê n k=1

unabhängig von der Darstellung und genügt den üblichen Rechenregeln. Die
Ê
charakteristische Funktion χA einer messbaren Menge A ⊂ n ist genau dann
eine integrierbare Elementarfunktion, wenn V n (A) < ∞. Es gilt dann

χA = V n (A) .

Schon unter den Elementarfunktionen gibt es solche, die nicht im herkömmlichen


 z.B. die Dirichlet–Funktion É für n = 1. Da
Sinn integrierbar sind, χ É eine
Nullmenge ist, folgt χ É = 0 . Die Dirichlet–Funktion ist überall unstetig und
Ê
auf keinem kompakten Intervall gleichmäßiger Limes von Treppenfunktionen.
(b) Messbare Funktionen. Eine auf einer messbaren Menge Ω definierte
Funktion f : Ω → Êheißt messbar (genauer: Lebesgue–messbar), wenn
für jedes Intervall I das Urbild f −1 (I) eine messbare Menge ist.
206 § 8 Lebesgue–Theorie und Lp –Räume

Wir notieren folgende Eigenschaften messbarer Funktionen:


Elementarfunktionen sind messbar ÜA . Stetige Funktionen u : Ω → Ê
auf
messbaren Mengen Ω sind messbar. Letzteres wie auch die folgenden Eigen-
schaften messbarer Funktionen entnehmen wir ohne Beweis aus § 20 : 3.
Eine Funktion ist genau dann messbar, wenn das Urbild jeder messbaren Menge
messbar ist.
Die Hintereinanderausführung messbarer Funktionen ist messbar.
Die messbaren Funktionen bilden einen Vektorraum, der mit u, v auch u · v
enthält. Unter Beachtung der Konvention 1.3 (b) gelten folgende Aussagen:
Mit u ist auch |u| messbar; im Fall u = 0 f.ü. ist auch 1/u messbar. Der Limes
einer fast überall konvergenten Folge messbarer Funktionen ist messbar.
Ist u auf dem Gebiet Ω fast überall partiell differenzierbar, so sind die partiel-
len Ableitungen ∂k u messbar, vgl. 1.3 (b).
Die Einschränkung einer messbaren Funktion f : Ω → Ê
auf eine messbare
Teilmenge von Ω ist messbar; setzen wir umgekehrt f durch Nullsetzen außer-
Ê
halb von Ω auf den n fort, so entsteht eine messbare Funktion.
Alles in allem: Die Klasse der messbaren Funktionen ist abgeschlossen unter
algebraischen Operationen, Hintereinanderausführung und Grenzprozessen. Sie
umfasst alle Funktionen, die aus Elementarfunktionen mit Hilfe solcher Pro-
zesse hervorgehen; andere wurden bisher nicht betrachtet. Dennoch dürfen wir
von der Voraussetzung der Messbarkeit nicht einfach absehen, denn es existieren
nichtmessbare Funktionen. Deren Definition stützt sich in starkem Maß auf das
Auswahlaxiom und ist daher nichtkonstruktiv.
(c) Integrierbarkeit positiver Funktionen. Ausgangspunkt für die Inte-
graldefinition ist der folgende, in § 20 : 3.5 bewiesene
Satz. Jede positive messbare Funktion u auf einer messbaren Menge Ω ist punkt-
weiser Limes einer aufsteigenden Folge positiver integrierbarer Elementarfunk-
tionen auf Ω, d.h. es gibt außerhalb von Ω verschwindende integrierbare Ele-
mentarfunktionen ϕk ≥ 0 mit
ϕk (x) ≤ ϕk+1 (x) für k = 1, 2, . . .
und
u(x) = lim ϕk (x) für alle x ∈ Ω .
k→∞

Für die monoton wachsende Folge ( ϕk ) der Integrale gibt es zwei Fälle:

(i) ( ϕk ) ist beschränkt. Dann heißt u über Ω (Lebesgue–)integrierbar,
und das Lebesgue–Integral
  
u = u(x) dn x := lim ϕk
k→∞
Ω Ω
ist unabhängig von der approximierenden monotonen Folge (ϕk ).
1 Eigenschaften des Lebesgue–Integrals 207


Wir schreiben in diesem Fall u < ∞“.
”Ω

(ii) Die Folge ( ϕk ) ist unbeschränkt. Dann gilt dies auch für jede andere gegen
u aufsteigende Folge positiver integrierbarer Elementarfunktionen.
 In diesem
Fall heißt u nicht über Ω integrierbar. Wir sagen auch u existiert nicht“
 ”Ω
und schreiben u = ∞“.
”Ω
(d) Integrierbarkeit und Integral beliebiger messbarer Funktionen.
Eine messbare Funktion u : Ω → Ê
heißt (Lebesgue–)integrierbar, wenn
die positiven messbaren Funktionen
u+ := 1
2
(|u| + u) , u− := 1
2
(|u| − u)
im Sinne von (c) integrierbar sind. Wir setzen dann
  
u := u+ − u− .
Ω Ω Ω

Für messbare Funktionen u : Ω → Ê ist die Integrierbarkeit daher äquivalent


zur Integrierbarkeit von |u|.
Eine komplexwertige Funktion f = u + iv : Ω → heißt messbar bzw.
integrierbar, wenn u und v die entsprechende Eigenschaft haben. Wir setzen
im Fall der Integrierbarkeit
  
f := u+ i v.
Ω Ω Ω

(e) Integrierbarkeit über Teilmengen. Ist u über Ω integrierbar, M eine


messbare Teilmenge von Ω und v die Einschränkung von u auf M , so sind v
über M und u · χM über Ω integrierbar, und die Integrale sind jeweils gleich.
Wir setzen
  
u := v = u · χM .
M M Ω

1.5 Eigenschaften des Lebesgue–Integrals


(a) Die integrierbaren Funktionen u : Ω →  ( = oder  = ) bilden
einen –Vektorraum, bezeichnet mit L1 (Ω).
(a) Das Integral ist linear .
(b) Das Integral ist monoton, d.h. für integrierbare Funktionen u, v auf Ω gilt
 
u ≤ v f.ü. =⇒ u ≤ v.
Ω Ω
 
(c) u ∈ L1 (Ω) =⇒ |u| ∈ L1 (Ω) und | u| ≤ |u| .
Ω Ω
(d) Alle im herkömmlichen Sinn integrierbaren Funktionen sind auch Lebesgue–
integrierbar mit gleichem Integral (Zur Begründung siehe 1.6 (d)).
208 § 8 Lebesgue–Theorie und Lp –Räume

(e) Majorantensatz. Eine messbare Funktion u : Ω → 


ist genau dann
über Ω integrierbar, wenn sie eine integrierbare Majorante hat:
|u(x)| ≤ f (x) f.ü. mit f ∈ L1 (Ω) .
(f) Sind reellwertige Funktionen u, v über Ω integrierbar, so auch
sup{u, v} : x → max{u(x), v(x)},
inf{u, v} : x → min{u(x), v(x)}.
(g) Aus u ∈ L1 (Ω) und v = u f.ü. folgt v ∈ L1 (Ω) sowie
 
u= v.
Ω Ω

(h) Ist u über Ω integrierbar und |u| = 0, so gilt u = 0 f.ü.
Ω

1.6 Konvergenzsätze
Die Konvergenzsätze stellen die Hauptresultate der Lebesgueschen Integra-
tionstheorie dar. In dieser Theorie ist für eine Folge integrierbarer Funktionen
u1 , u2 , . . . ∈ L1 (Ω) die Vertauschung von Limes und Integral bereits unter der
schwachen Voraussetzung der punktweisen Konvergenz f.ü. gesichert, dass die
Folge durch eine Majorante kontrollierbar bleibt. Für den Integralbegriff aus
Bd. 1 und das Riemann–Integral besitzen die Konvergenzsätze kein Analogon.
Konvergiert eine Folge (uk ) punktweise f.ü., so definieren wir u = lim uk wie
k→∞
in 1.3 (b) und erhalten nach 1.4 (b) eine messbare Funktion u.
(a) Satz von Lebesgue von der majorisierten Konvergenz (1902).
Konvergiert eine Folge uk ∈ L1 (Ω) fast überall in Ω und besitzt eine integrier-
bare Majorante f ∈ L1 (Ω),
|uk (x)| ≤ f (x) f.ü. (k = 1, 2, . . .) ,
so ist u := lim uk über Ω integrierbar, und es gilt
k→∞
 
u = lim uk .
k→∞
Ω Ω

Dass auf die Majorantenbedingung nicht verzichtet werden kann, zeigt das Bei-
spiel in Bd. 1, § 12 : 1.2 (b).
(b) Satz von Beppo Levi über monotone Konvergenz (1906).
Bilden uk ∈ L1 (Ω) eine monoton aufsteigende Folge, und ist die Folge der
Integrale uk nach oben beschränkt, so gibt es eine Funktion u ∈ L1 (Ω) mit
Ω
 
u(x) = lim uk (x) f.ü. und es gilt u = lim uk .
k→∞ k→∞
Ω Ω

Die Voraussetzung uk ≤ uk+1 für k = 1, 2, . . . kann durch die Voraussetzung


uk ≤ uk+1 f.ü. für k = 1, 2, . . . ersetzt werden.
1 Eigenschaften des Lebesgue–Integrals 209

(c) Der kleine Satz von Lebesgue“. Ist V n (Ω) < ∞ und konvergiert eine

Folge (uk ) von beschränkten, messbaren Funktionen auf Ω gleichmäßig gegen
eine Funktion u, so sind die Voraussetzungen des Satzes von Lebesgue erfüllt.
Denn ist C eine Schranke für die |uk |, so ist die Elementarfunktion C χΩ eine
Majorante der Folge.
Die Voraussetzung V n (Ω) < ∞ ist wesentlich. Das zeigt das Beispiel Ω = Ê,

Ê und
+∞
uk = 1χ
k [0,k]
mit uk → 0 gleichmäßig auf uk = 1.
−∞

(d) Folgerung. Jede im herkömmlichen Sinn integrierbare Funktion ist auch


Lebesgue–integrierbar, und beide Integrale stimmen überein.

Beweis der Folgerung.


Bezeichnen wir fürkompakte Quader I bzw. für offene Mengen Ω das herkömm-
liche Integral mit u(x) dn x bzw. u(x) dn x und das Lebesgue–Integral mit
  I Ω
u bzw. u , so gilt definitionsgemäß
I Ω
 
ϕ(x) dn x = ϕ für Treppenfunktionen ϕ .
I I

(i) Ist I ein kompakter Quader und u stetig auf I, so ist u gleichmäßiger Limes
von Treppenfunktionen ϕk auf I. Nach Definition des herkömmlichen Integrals
und nach (c) folgt
   
u(x) dn x = lim ϕk (x) dn x = lim ϕk = u. 2
k→∞ k→∞
I I I I

Ê
(ii) Ist Ω ⊂ n offen und u∈ C0 (Ω) im herkömmlichen Sinn integrierbar, so
gilt u ∈ L1 (Ω) und u = u(x) dn x .
Ω Ω

Es genügt, dies für positive, stetige Funktionen zu zeigen. Nach Bd. 1, § 23 : 4.1
◦ ◦ 7

gibt es kompakte Quader Ik mit I k ∩ I = ∅ für k =  und Ω = Ik . Nach
k=1
Bd. 1, § 23 : 4.2 gilt
 
N 
u(x) dn x = lim u(x) dn x .
N→∞ k=1
Ω Ik

N
Für uN := u χIk gilt u1 ≤ u2 ≤ . . . und u(x) = lim uN (x) für jedes
N→∞

k=1
feste x, denn zu jedem x ∈ Ω gibt es ein m ∈ mit uk (x) = u(x) für k ≥ m.
Wegen 1.4 (f), der Linearität des Integrals und nach dem oben Bewiesenen gilt
 N 
 
N  
N  
uN = u χIk = u = u(x) dn x ≤ u(x) dn x .
Ω k=1 Ω k=1 Ik k=1 Ik Ω
210 § 8 Lebesgue–Theorie und Lp –Räume

Nach dem Satz von Beppo Levi folgt u ∈ L1 (Ω) und


  
N  
u = lim uN = lim u(x) dn x = u(x) dn x . 2
N→∞ N→∞ k=1
Ω Ω Ik Ω

1.7 Parameterintegrale
Sei Ω ⊂ Ên
eine messbare Menge, Λ ⊂ Ê m
ein Gebiet, und das Parameterin-
tegral

U (x) = u(x, y) dn y
Ω

existiere für alle x ∈ Λ. Dann ergibt sich als Anwendung des Satzes von Lebes-
gue der folgende
Satz. (a) Ist x → u(x, y) für fast alle y ∈ Ω stetig und existiert eine Ma-
jorante f ∈ L1 (Ω) mit | u(x, y )| ≤ f (y) für x ∈ Λ, y ∈ Ω, so ist U stetig in
jedem Punkt von Λ.
(b) Ist x → u(x, y) für fast alle y ∈ Ω C1 –differenzierbar und existieren
Majoranten fi ∈ L1 (Ω) mit
 
 ∂u 
 (x, y)  ≤ fi (y) für x ∈ Λ , y ∈ Ω (i = 1, . . . , m) ,
∂xi

so ist U C1 –differenzierbar in Λ und es gilt



∂U ∂u
(x) = (x, y) dn y (i = 1, . . . , m) .
∂xi ∂xi
Ω

Dabei ist der Integrand wie üblich an den Nichtdifferenzierbarkeitsstellen von u


gleich Null gesetzt.
Beweis.
(a) Für x ∈ Λ sei (xk ) eine beliebige Folge in Λ mit xk → x. Wir setzen
vk (y) := u(xk , y) und v(y) := u(x, y) . Dann folgt
 
U (xk ) = vk → v = U (x)
Ω Ω

nach dem Satz von Lebesgue.


(b) Sei x ∈ Λ fest und (tk ) eine Nullfolge mit nichtverschwindenden Gliedern.
Wir setzen
u(x + tk ei , y) − u(x, y)
wk (y) := ,
tk

falls x → u(x, y) ∈ C1 (Λ) und wk (y) := 0 sonst. Nach dem Mittelwertsatz


gilt |wk (y)| ≤ fi (y) , ferner gilt wk (y) → ∂x
∂u
i
(x, y) für alle y ∈ Ω. Nach dem
1 Eigenschaften des Lebesgue–Integrals 211

Satz von Lebesgue folgt


  
U (x + tk ei ) − U (x) ∂u
= wk → w = (x, y) dn y ,
tk ∂xi
Ω Ω Ω

also existiert ∂U
∂xi
(x) für alle x ∈ Λ. Die Stetigkeit von ∂U
∂xi
(x) folgt aus (a). 2

 
Ê d +∞ +∞
Beispiel. Für f ∈ L1 ( ) gilt f (t) sin(xt) dt = t f (t) cos(xt) dt.
dx −∞ −∞

1.8 Vertauschung der Integrationsreihenfolge


Im folgenden wird Ê als kartesisches Produkt aufgefasst:
n

Ê = Ê × Ê = {( x, y) | x ∈ Ê , y ∈ Ê } mit n = p + q.
n p q p q

Für eine messbare Menge Ω ⊂ Ê be- n

trachten wir die Mengen y


6
Ωx := {y ∈ Ê q
| (x, y) ∈ Ω} ,

Ωy := {x ∈ Ê p
| (x, y) ∈ Ω} , Ωx
Ω := {x ∈ Ê
1
p
| Ωx = ∅} ,
-
Ω : = {y ∈ Ê
2
p
| Ωy = ∅} x x
3 45 6
(Figur). Diese Mengen sind messbare Ω1
Ê
Teilmengen von p bzw. q . Ê
Ê
Satz von Fubini. Sei Ω ⊂ n eine messbare Menge und u ∈ L1 (Ω). Dann
existiert U (x) := u(x, y) dq y für alle x ∈ Ω1 mit eventueller Ausnahme
Ωx
einer Nullmenge N . Setzen wir U (x) = 0 für x ∈ N , so ist U über Ω1 inte-
grierbar, und es gilt
  
u = u(x, y) dq y dp x .
Ω Ω1 Ωx

Ganz entsprechend erhalten wir


  
u = u(x, y) dp x dq y .
Ω Ω2 Ωy

und damit die Vertauschbarkeit der Integrationsreihenfolge.

Wiederholte Anwendung dieses Satzes ermöglicht die Berechnung von Integralen


durch sukzessive eindimensionale Integration.
Für den Beweis siehe Königsberger [150] Bd.2, 6.1, Bauer [115] 22.6.
212 § 8 Lebesgue–Theorie und Lp –Räume

Satz von Tonelli. Sei u : Ω → Ê eine messbare Funktion, für welche die
Integrale
  
|u(x, y)| dq y für fast alle x und |u(x, y)| dq y dp x
Ωx Ω1 Ωx

existieren. Dann ist u über Ω integrierbar, und die Integrationsreihenfolge ist


nach dem Satz von Fubini vertauschbar. Entsprechendes ergibt sich, wenn wir
in den Voraussetzungen die Rollen von x und y vertauschen.
Beweis siehe Königsberger [150] Bd.2, 6.2.

Demnach ist u(x, y) = exp(−|y| (1 + x2 )) über den Ê 2


integrierbar. Das innere

+∞
Integral u(x, y) dx existiert nur für y = 0, vgl. Bd. 1, § 23 : 6.2.
−∞

1.9 Der Transformationssatz für Integrale


Sei ϕ : Ω → Ω ein C1 –Diffeomorphismus zwischen den Gebieten Ω und Ω
Ê
des n ; ferner sei A ⊂ Ω messbar und u über ϕ(A) integrierbar. Dann gilt
 
u(x) dn x = u(ϕ(y)) | det ϕ (y)| dn y .
ϕ(A) A

Konvergiert umgekehrt das rechte Integral, so ist u über ϕ(A) integrierbar .


Beweis siehe Königsberger [150] Bd.2, 7.1, 7.2.

2 Die Räume Lp (Ω)


2.1 Der Hilbertraum L2 (Ω)
(a) Für die Anwendungen ist neben dem L1 (Ω) vor allem der Raum
&  '
L2 (Ω) = u:Ω→ | u messbar und |u|2 < ∞
Ω

von Interesse. Dabei ist Ω ⊂ n messbar und  = oder .  


L2 (Ω) ist ein Vektorraum über , und für u, v ∈ L2 (Ω) gilt u · v ∈ L1 (Ω),
denn für α, β ∈ gilt
 2 
| αu + βv |2 ≤ |α| · |u| + |β| · |v| ≤ 2 |α|2 |u|2 + |β|2 |v|2 ,

| u · v | = |u| · |v| ≤ 1
2
|u|2 + |v|2 ,

also sind |αu + βv|2 und u · v integrierbar nach dem Majorantenkriterium.

Wir wollen für den Raum L2 (Ω) durch



u, v := u·v
Ω
2 Die Räume Lp (Ω) 213

ein Skalarprodukt definieren, stoßen dabei aber auf die Schwierigkeit der fehlen-
den positiven Definitheit. Aus u , u = |u|2 = 0 folgt nicht u = 0, sondern
Ω
lediglich u = 0 f.ü.
(b) Wir erzwingen die positive Definitheit, indem wir alle fast überall gleichen
L2 –Funktionen identifizieren, d.h. als gleich betrachten. Den so vergröberten
Raum L2 (Ω) bezeichnen wir mit L2 (Ω) .
Das bedeutet, dass wir fast überall gleiche Funktionen zu Klassen

[ u ] := { v ∈ L2 (Ω) | v = u f.ü. }

zusammenfassen und L2 (Ω) := { [ u ] | u ∈ L2 (Ω)} setzen. Wir wollen kurz


skizzieren, welche Überlegungen dabei angestellt werden müssen, um dann zu
einer pragmatischen Handhabung überzugehen.
Da die Vereinigung zweier Nullmengen wieder eine Nullmenge ist, gilt

u = v f.ü., v = w f.ü. =⇒ u = w f.ü..

Hiernach bedeutet die Gleichheit zweier Klassen [ u ] = [ v ] einfach u = v f.ü..


Aus u1 = u2 f.ü. und v1 = v2 f.ü. folgt ÜA

α u1 + β v1 = α u2 + β v2 f.ü. für α, β ∈ ,
 
u1 v1 = u2 v2 .
Ω Ω

Daher sind die Definitionen



α[ u ] + β [ v ] := [ α u + β v ] und [ u ] , [ v ] := uv
Ω

sinnvoll.
Auf diese Weise wird L2 (Ω) ein Vektorraum über  mit Nullvektor [ 0 ], auf
dem [ u ] , [ v ] ein Skalarprodukt liefert.
Im Hinblick auf Vektorraumoperationen, Skalarprodukte und Normen ist es
nach dem oben Gesagten unerheblich, mit welchen Vertretern einer Klasse wir
arbeiten; in dieser Hinsicht sind alle Vertreter einer Klasse gleichwertig. Wir
dürfen also künftig von L2 –Funktionen statt von Klassen sprechen und uns
pragmatisch auf den Standpunkt stellen:

L2 (Ω) ist die Menge aller u ∈ L2 (Ω) mit dem Gleichheitsbegriff u = v f.ü.

Dies ist, wie gesagt, solange unproblematisch, solange wir L2 (Ω) als Skalarpro-
duktraum auffassen. Dagegen macht es keinen Sinn, von einzelnen Funktions-
werten einer L2 –Funktion zu sprechen!
214 § 8 Lebesgue–Theorie und Lp –Räume

Eine wichtige Ausnahme von dieser Einschränkung bilden die stetigen Funk-
tionen auf einem Gebiet Ω. Für u, v ∈ C0 (Ω) hat u = v f.ü. zur Folge, dass
u(x) = v(x) für alle x ∈ Ω. Denn wäre u(a) − v(a) = 0 für ein a ∈ Ω, so gäbe
es ein r > 0 mit Kr (a) ⊂ Ω und u(x) − v(x) = 0 in Kr (a). Die Kugel Kr (a)
hat aber positives Maß.
Enthält also eine Klasse in L2 (Ω) eine stetige Funktion, so ist dies die einzige
stetige in dieser Klasse; wir wählen immer diese als Vertreterin.

(c) Die zum L2 –Skalarprodukt u , v := u · v auf L2 (Ω) gehörige Norm
Ω
heißt L2 –Norm und wird wahlweise mit
u2 = uL2 := u, u
bezeichnet. Die Konvergenz bezüglich dieser Norm

u − un 2 → 0 ⇐⇒ |u − un |2 → 0
Ω
heißt L2 –Konvergenz oder Konvergenz im Quadratmittel. Näheres dazu
in (d). In § 20 : 7.2 beweisen wir den
Satz von Fischer–Riesz (1907). L2 (Ω) ist vollständig, d.h. ein Hilbertraum
bezüglich des L2 –Skalarprodukts:
Ist (uk ) eine L2 –Cauchyfolge, so gibt es eine L2 –Funktion u mit
u − uk 2 → 0 für k → ∞ .
Darüberhinaus existiert eine Teilfolge (unk ) mit unk → u f.ü. .

(d) Das Verhältnis der L2 –Konvergenz zur punktweisen Konvergenz.


(i) Aus u − uk  → 0 folgt die punktweise Konvergenz f.ü. einer geeigneten
Teilfolge, nicht aber die punktweise Konvergenz f.ü. der Originalfolge (uk ). Ein
Beispiel bilden die wandernden Zaunlatten“ auf Ω = [0, 1]: Für jede Zahl
k ∈  ”
gibt es eine eindeutige Darstellung k = 2n + m mit m, n ∈ 0 und 
0 ≤ m < 2n . Wir setzen Ik = m 2−n , (m + 1) 2−n und uk = χIk .
ÜA Zeigen Sie uk → 0 im Quadratmittel. Skizzieren Sie u1 , . . . , u8 (es lohnt
sich). Machen Sie sich klar, dass die Folge (uk (x)) für kein x ∈ Ω konvergiert.
Geben Sie eine punktweis konvergente Teilfolge an.
(ii) Das Beispiel uk = k χJk , Jk = ]0, 1/k[ auf Ω = [0, 1] zeigt:
Aus punktweiser Konvergenz folgt nicht die Konvergenz im Quadratmittel ÜA .
Es gilt aber der
Satz. Besitzt eine Folge messbarer Funktionen uk : Ω →  eine gemeinsame
Majorante f ∈ L2 (Ω) und existiert lim uk (x) f.ü., so gilt
k→∞

u := lim uk ∈ L2 (Ω) und lim u − uk 2 = 0 .


k→∞ k→∞
2 Die Räume Lp (Ω) 215

Beweis.
Es gilt |uk (x)|2 ≤ |f (x)|2 f.ü. , also auch |u(x)|2 = lim |uk (x)|2 ≤ |f (x)|2 f.ü..
k→∞
Da u := lim uk nach 1.4 (b) messbar ist, folgt die Integrierbarkeit von |u|2
k→∞
und |uk |2 nach dem Majorantenkriterium 1.5 (d). Ferner gilt
| u(x) − uk (x) |2 → 0 f.ü. und | u(x) − uk (x) |2 ≤ 4 |f (x)|2 f.ü..
Also ergibt sich die Behauptung aus dem Satz von Lebesgue 1.6 (a). 2

(iii) Aus der gleichmäßigen Konvergenz uk → u beschränkter messbarer Funk-


tionen uk auf Ω folgt im Fall V n (Ω) < ∞ die Konvergenz im Quadratmittel.
Im Fall V n (Ω) = ∞ ist dieser Schluss nicht zulässig. Beides folgt aus 1.6 (c).

2.2 Die Banachräume Lp (Ω)


Für reelle Zahlen p ≥ 1 definieren wir
Lp (Ω) := = { u : Ω →  | u messbar und  |u| p
< ∞ },
 1/p
Ω
up = uLp := |u|p ,
Ω

wobei wir wie oben fast überall gleiche Funktionen identifizieren.

Satz. Lp (Ω), versehen mit der Norm up , ist vollständig, also ein Banach-
raum.
Weiter folgt aus u − uk p → 0 in Lp (Ω) die Existenz einer Teilfolge (unk )
mit
unk → u f.ü.


Zum Beweis ist zu zeigen: Lp (Ω) ist ein Vektorraum über ,  · p liefert eine
Norm, und Lp (Ω) ist in dieser Norm vollständig.
Zunächst gilt: u ∈ Lp (Ω), α ∈ 
=⇒ αu ∈ Lp (Ω) und αup = |α| · up .
Daraus folgt die Vektorraumeigenschaft: Für u, v ∈ Lp (Ω) gilt
 p  p
| u + v |p ≤ |u| + |v| ≤ 2 sup {|u|, |v|} = 2p sup {|u|p , |v|p } ,

also ist |u + v|p integrierbar nach 1.5 (e),(f). Die Dreiecksungleichung ist für
p = 1 trivial; für p > 1 wird sie in 2.3 bewiesen.
Die Vollständigkeit wird in § 20 : 7.2 gezeigt.

2.3 Die Ungleichungen von Hölder und Minkowski


(a) Lemma. Seien p, q > 1 reelle Zahlen mit 1/p + 1/q = 1. Dann gilt für
alle x, y ≥ 0
xp yq
xy ≤ + .
p q
216 § 8 Lebesgue–Theorie und Lp –Räume

Beweis als ÜA : Bestimmen Sie für festes y > 0 das Minimum der Funktion
x → f (x) = xp /p + y q /q − xy.

(b) Die Höldersche Ungleichung. Sei p, q > 1 und 1/p + 1/q = 1. Dann
ist für u ∈ Lp (Ω), v ∈ Lq (Ω) die Funktion u · v integrierbar, und es gilt
u · v1 ≤ up · vq .

Beweis.
Aus up = 0 folgt u = 0, also u · v = 0 und damit die Behauptung. Entspre-
chend ist die Behauptung im Fall vq = 0 richtig.
Sei also up , vq > 0 und f := u/up , g := v/vq . Aus (a) folgt

1 | u(x) |p 1 | v(x) |q
| f (x) · g(x) | ≤ + .
p up p
q vqq

Die rechte Seite ist integrierbar, also nach dem Majorantenkriterium auch die
linke. Integration ergibt f · g1 ≤ p1 + 1q = 1 , also u · v1 ≤ up · vq . 2

(c) In Lp (Ω) gilt die Minkowskische Ungleichung

u + vp ≤ up + vp für u, v ∈ Lp (Ω).

Beweis.
Für p = 1 ist das klar. Für p > 1 und u, v ∈ Lp (Ω) gilt u + v ∈ Lp (Ω) und

| u + v |p = | u + v |p−1 · |u + v| ≤ |u + v|p−1 · |u| + |u + v|p−1 · |v| .

Für q mit 1/p + 1/q = 1, also q := p/(p − 1) ist nach Voraussetzung

(|u + v|p−1 )q = |u + v|p ,

somit |u + v|p−1 ∈ Lq (Ω) .


Die Höldersche Ungleichung liefert
  1/q  1/p  1/q  1/p
|u + v|p ≤ |u + v|p · |u|p + |u + v|p · |v|p
Ω Ω Ω Ω Ω
 1/q 
= |u + v|p · up + vp .
Ω

Im Fall |u + v| = 0 ist nichts zu beweisen, andernfalls folgt die Behauptung


 1/q
durch Division durch |u + v|p . 2
Ω
2 Die Räume Lp (Ω) 217

2.4 Der Raum L∞ (Ω)


Eine messbare Funktion u : Ω → 
heißt wesentlich beschränkt (in Zeichen
u ∈ L∞ (Ω)), wenn es eine Konstante C gibt mit
|u(x)| ≤ C für fast alle x ∈ Ω.

Für wesentlich beschränkte Funktionen u existiert


u∞ := min { C ≥ 0 | |u(x)| ≤ C f.ü.} .

Zum Nachweis setzen wir M = { C ≥ 0 | |u(x)| ≤ C f.ü.} und s = inf M .


Dann gibt es Zahlen sk ∈ M , die monoton gegen s fallen. Zu diesen gibt es
7

Nullmengen Nk mit |u(x)| ≤ sk für alle x ∈ Ω \ Nk . Dann ist N = Nk
k=1
wieder eine Nullmenge, und es gilt
-
x ∈ Ω\N = (Ω \ Nk ) =⇒ |u(x)| ≤ sk für k ∈ Æ =⇒ |u(x)| ≤ s .
k∈ 
Identifizieren wir alle f.ü. gleichen Funktionen, so erhalten wir den Raum L∞ (Ω).
Auf diesem liefert  · ∞ eine Norm ÜA . Es gilt ÜA
Satz. L∞ (Ω) mit der Norm  · ∞ ist ein Banachraum.
2.5 Beziehungen zwischen den Lp –Räumen, der Raum L1loc (Ω)
(a) Hat Ω endliches Volumen, so gilt L∞ (Ω) ⊂ Lp (Ω) ⊂ L1 (Ω) für alle p > 1.
Für r < s gilt ferner Ls (Ω) ⊂ Lr (Ω), und für u ∈ Ls (Ω)

ur ≤ c · us mit c = (V n (Ω))(s−r)/(s r) .



 L r (Ω) ⊂ Lr (Ω) beachten wir |u| ≤ u∞ · Ω . Der Rest folgt
Zum Beweis von p χ
aus 2.3 (b) für |u| = |u| · 11 mit p = s/r ÜA .
Ω
(b) Im Fall V n (Ω) = ∞ lassen sich keine Inklusionsaussagen treffen.
ÜA Zeigen Sie mit Hilfe geeigneter, auf Ω := Ê
>0 stetiger Funktionen, dass
keiner der Räume L∞ (Ω), L1 (Ω), L2 (Ω) in einem der anderen enthalten ist.
(c) Eine Funktion u : Ω → Ã Ê
auf einem Gebiet Ω ⊂ n heißt lokalinte-
grierbar, wenn sie messbar ist und über jede kompakte Teilmenge K ⊂ Ω
integrierbar, d.h. wenn u · χK über Ω integrierbar ist. Identifizieren wir fast
überall gleiche lokalintegrierbare Funktionen, so erhalten wir den Vektorraum
L1loc (Ω) . Nach (a) gilt
Lp (Ω) ⊂ L1loc (Ω) für p ≥ 1 .
Denn es gilt u ∈ Lp (Ω) =⇒ u ∈ Lp (K) für jede kompakte Teilmenge K von
Ω =⇒ u ∈ L1 (K) nach (a). Beschränkte messbare Funktionen sind lokalinte-
grierbar, ebenso stetige Funktionen.
218 § 8 Lebesgue–Theorie und Lp –Räume

Aufgabe. Zeigen Sie: Für 1 ≤ p < r < q und u ∈ Lp (Ω) ∩ Lq (Ω) gilt die
Interpolationsungleichung
u ∈ Lr (Ω) und ur ≤ uα
p · uq
β

für Konstanten α, β > 0 mit α + β = 1 und 1/r = α/p + β/q.

2.6 Die Separabilität der Lp –Räume


Ê
Satz. Für 1 ≤ p < ∞ und jedes Gebiet Ω ⊂ n liegen die Treppenfunktionen
dicht in Lp (Ω) , d.h. zu jedem u ∈ Lp (Ω) gibt es Treppenfunktionen ϕk auf Ω
mit u − ϕk p → 0 .
Für den Beweis wird auf § 20 : 8.4 verwiesen. Es ergibt sich als
Folgerung. Für jedes Gebiet Ω enthält Lp (Ω) eine abzählbare dichte Menge
von Treppenfunktionen.
Denn sei u ∈ Lp (Ω), ε > 0 vorgegeben und ϕ eine Treppenfunktion auf Ω
mit u − ϕp < ε . Durch geringfügige Abänderung von ϕ erhalten wir eine
rationale“ Treppenfunktion


N
ψ = qk χIk ,
k=1

(d.h. Re qk , Im qk ∈ É
und die Eckpunkte der Quader Ik haben rationale Ko-
ordinaten) so dass ϕ − ψp < ε. Es folgt u − ψp < 2ε. Diese rationalen
Treppenfunktionen ψ bilden eine abzählbare Menge ( ÜA , benützen Sie die
É
Abzählbarkeit von 2n+2 , vgl. 1.2).

Eine Teilmenge M eines normierten Raumes V heißt separabel, wenn es eine


abzählbare Teilmenge A gibt mit M ⊂ A , d.h. wenn jedes v ∈ M Grenzwert
einer Folge aus A ist.
Ãn ist separabel, da die Vektoren x = (x1, . . . , xn ) mit rationalen Koordinaten
xk (d.h. Re xk , Im xk ∈ É) dicht liegen.

Satz. Für messbare Mengen Ω ⊂ Ên und 1 ≤ p < ∞ ist jede Teilmenge des
p
L (Ω) separabel .
Beweis.
Ê
(a) Nach dem eingangs zitierten Satz existiert eine in Lp ( n) dichte Folge (ψk )
von Treppenfunktionen. Dann liegt die Folge (ψk · χΩ ) dicht in Lp (Ω) ÜA .
(b) Sei (uk ) eine in Lp (Ω) dichte Folge und M ⊂ Lp (Ω). Nach Voraussetzung
gibt es zu jedem v ∈ M und jedem n ∈ Æ ein um mit v − um p < n1 , d.h.
v ∈ K1/n (um ) . Diejenigen Kugeln K1/n (um ), deren Durchschnitt mit M nicht
leer ist, lassen sich durchnumerieren: U 1 mit Radius 1 , U2 mit Radius 2 ,
etc. Wir wählen aus jedem U k ein vk ∈ M aus und erhalten so eine in M
Æ
dichte Folge (vk ). Denn zu jedem v ∈ M gibt es eine Teilfolge (nk ) von mit
v ∈ Unk , nk → 0 (s.o.). Es gilt dann v − vnk p < nk → 0 . 2
3* Der Hauptsatz der Differential– und Integralrechnung 219

3* Der Hauptsatz der Differential– und Integralrechnung


Die folgende Verallgemeinerung des Hauptsatzes der Differential– und Integral-
rechnung kommt erst in den Paragraphen § 14, § 16, § 17 und im Schlusskapitel
dieses Bandes zum Tragen und kann bei der ersten Lektüre übergangen werden.

3.1 Absolutstetige Funktionen


Eine Funktion u : I → auf einem Intervall I ⊂ heißt absolutstetig,
wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass

N
| u(bk ) − u(ak ) | < ε
k=1

für je endlich viele Intervalle [ak , bk ] ⊂ I mit paarweise disjunktem Innern und


N
(bk − ak ) < δ .
k=1

Absolutstetige Funktionen sind gleichmäßig stetig (N = 1). Eine Funktion ist


genau dann absolutstetig, wenn Real– und Imaginärteil absolutstetig sind ÜA .
Erfüllt u eine Lipschitzbedingung |u(y) − u(x)| ≤ L |y − x| für alle x, y ∈ I, so
ist u absolutstetig ÜA .

Satz. (a) Die absolutstetigen Funktionen u : I →  bilden einen Vektorraum



über .
(b) Mit u sind auch |u| und u absolutstetig.
(c) Sind u und v absolutstetig und beschränkt, so ist u · v absolutstetig.
(d) Ist u absolutstetig auf dem Intervall J und ϕ : I → J absolutstetig und
monoton, so ist u ◦ ϕ absolutstetig.
Beweis als ÜA .

Satz. Für u ∈ L1 (I) und einen festen Punkt a ∈ I ist durch das unbestimmte
Integral
x x
U (x) := u = u(t) dt
a a

eine absolutstetige Funktion U gegeben.

Beweis.
Es genügt, den Beweis für positive Funktionen zu führen. Sei ε > 0 gegeben.
Nach 1.4 (c) gibt es eine Elementarfunktion ϕ mit 0 ≤ ϕ ≤ u und (u − ϕ) < ε2 .
I
220 § 8 Lebesgue–Theorie und Lp –Räume

Wir setzen C := ϕ∞ + 1 und δ := ε/2C. Haben die [ak , bk ] ⊂ I paarweise



N
disjunktes Inneres und gilt (bk − ak ) < δ , so folgt
k=1

N 
N bk 
N bk
| U (bk ) − U (ak )| ≤ |f | ≤ (|ϕ| + |f − ϕ|)
k=1 k=1 ak k=1 ak
N  
≤ C (bk − ak ) + |f − ϕ| < ε . 2
k=1 I

3.2 Der Hauptsatz


Satz (Lebesgue 1904). (a) Jede absolutstetige Funktion u : I → ist fast Ê
überall differenzierbar. Die gemäß 1.3 (b) definierte Ableitung u : I → ist Ê
lokalintegrierbar, und es gilt
x
u(x) = u(a) + u (t) dt für alle a, x ∈ I .
a

(b) Für jede Funktion u ∈ L1 (I) ist durch


x
U (x) := u(t) dt
a
eine beschränkte absolutstetige Funktion U gegeben mit U  = u f.ü..

Für den Beweis verweisen wir auf Riesz/Nagy [131] 5.

3.3 Partielle Integration


Für absolutstetige Funktionen u, v : [a, b] → gilt
b  b b
u · v  dt = u·v a
− u · v dt .
a a
Denn u, v sind als stetige Funktionen auf [a, b] beschränkt. Also ist u · v nach
3.1 (c) absolutstetig. Nach dem Hauptsatz 3.1 (a) sind u , v  integrierbar; also
auch u · v  , u · v mit den Majoranten u∞ · |v  | und |u | · v∞ . Ebenfalls
nach 3.1 (a) folgt
 b b b
u·v a
= (u · v) = (u · v + u · v  ) .
a a
221

§ 9 Hilberträume
1 Beispiele für Hilberträume
1.1 Zum Hilbertraumkonzept
Ein Skalarproduktraum H über =  bzw. =  
heißt Hilbertraum,
wenn er als normierter Raum mit der Norm u = u , u vollständig ist, d.h.
wenn jede Cauchy–Folge (un ) in H einen Grenzwert u ∈ H besitzt.
Wie schon in § 8 : 1.1 gesagt wurde, spielen Hilberträume eine wichtige Rolle
für den Nachweis der Existenz von Lösungen von Differential– und Integralglei-
chungen. Häufig wird dabei der Hilbertraum L2 (Ω) der im Lebesgueschen Sinn
quadratisch integrierbaren Funktionen oder ein passender Teilraum zugrunde-
gelegt, vgl. § 14 : 6.
Der mathematische Formalismus der Quantenmechanik basiert auf der Theorie
linearer Operatoren in komplexen Hilberträumen, Näheres dazu in Kap. VI. Von
besonderer Bedeutung sind hierbei die orthogonalen Projektoren, die wir in
Abschnitt 2 behandeln.
Hauptgegenstand dieses Paragraphen sind Reihenentwicklungen nach Ortho-
normalsystemen in Analogie zu klassischen Fourierreihen.
Die für Hilberträume typische geometrische Betrachtungsweise erlaubt es, ana-
lytische Sachverhalte in eine übersichtliche Form zu bringen.

1.2 Endlichdimenionale Hilberträume


Jeder n–dimensionale Skalarproduktraum V über 
ist unitär isomorph zum
 n
und daher ein Hilbertraum:
Für jede ONB v1 , . . . , vn von V ist die Koordinatenabbildung
U :V →  n
, u → ( v1 , u , . . . , vn , u )
unitär, d.h. linear, bijektiv und isometrisch.

Beweis.
Nach Bd. 1, § 19 : 2.2 ist die Koordinatenabbildung U bijektiv, da jeder Vektor

n
u ∈ V eine eindeutige Basisdarstellung u = vk , u vk besitzt. Die Isometrie
k=1
folgt aus der Parsevalschen Gleichung

n
u2V = | vk , u |2 = U u2n .
k=1

Die Vollständigkeit von V ist wiederum eine Folge der Isometrie. Wir wollen
diesen Schluss wegen der grundsätzlichen Bedeutung des Isomorphiebegriffs an-
schließend in einen allgemeineren Rahmen stellen. 2
222 § 9 Hilberträume

1.3 Isomorphe Skalarprodukträume


Zwei Skalarprodukträume (V1 , · , · 1 ) und (V2 , · , · 2 ) heißen isomorph
oder unitär isomorph, wenn es eine unitäre Abbildung U : V1 → V2 gibt. Die
Abbildung U wird dann unitärer Isomorphismus genannt.
Unitäre Isomorphismen übertragen die lineare Struktur sowie alle topologischen
und geometrischen Eigenschaften.
Für die Vektorraumstruktur bedeutet dies: Linear unabhängige Vektoren gehen
in linear unabhängige über, Dimensionen bleiben erhalten, und es gilt

U (Span {v1 , v2 , . . .}) = Span {U v1 , U v2 , . . .} .

Für einen linearen Operator T : V1 → V1 setzen wir

S := U T U −1 .

Dann ist S : V2 → V2 linear, und es gilt

Bild S = U (Bild T ) , Kern S = U (Kern T ) .

Die lineare Gleichung T u = v ist äquivalent zur linearen Gleichung S(U u) = U v.


Die linearen Operatoren S, T heißen unitär äquivalent.
Da U unitär ist, gilt u − v1 < r genau dann, wenn U u − U v2 < r. Daraus
folgt unmittelbar: (un ) ist Cauchy–Folge in V1 genau dann, wenn (U un ) Cauchy–
Folge in V2 ist, und un → u in V1 ist äquivalent zu U un → U u in V2 . Daher
sind V1 und V2 entweder beide vollständig oder beide unvollständig. Im ersten
Fall heißt U ein Hilbertraumisomorphismus. Eine Teilmenge M von V1 ist
genau dann offen (abgeschlossen, beschränkt, kompakt, dicht), wenn U (M ) die
betreffenden Eigensschaften hat; ferner ist f : V1 ⊃ M → V1 genau dann stetig,
wenn g := U ◦ f ◦ U −1 : U (M ) → V2 stetig ist.
Ê
Für die Übertragung geometrischer Betrachtungen aus dem n auf unendlichdi-
mensionale Skalarprodukträume spielt die Orthogonalität eine wesentliche Rol-
le; dies betrifft vor allem die orthogonalen Projektionen. Da aus der Isometrie
die Erhaltung des Skalarprodukts folgt,

u, v 1 = Uu, Uv 2

(Polarisierungsgleichung), gehen zueinander orthogonale Vektoren in zueinander


orthogonale über und Orthonormalsysteme in Orthonormalsysteme.
Ziel der Hilbertraumtheorie ist es, unter Ausnützung der Vollständigkeit die
Lösbarkeit von Gleichungen, insbesondere Differential– und Integralgleichungen
zu untersuchen. Zu diesem Zweck sind einzig und allein die oben genannten
Strukturmerkmale von Interesse. In dieser Hinsicht haben wir unitär isomorphe
Hilberträume als gleich zu betrachten; sie sind nur verschiedene Ausprägungen
der gleichen mathematischen Struktur.
1 Beispiele für Hilberträume 223

Eines der Hauptergebnisse dieses Paragraphen besteht darin, dass alle separa-
blen Hilberträume unendlicher Dimension isomorph sind und durch den im Fol-
genden beschriebenen Hilbertschen Folgenraum 2 repräsentiert werden können.

1.4 Der Hilbertsche Folgenraum


(a) Satz. Der Folgenraum
  
 ,

2 = 2 ( ) := x = (x1 , x2 , . . . ) | xk ∈ |xk |2 < ∞
k=1
versehen mit dem Skalarprodukt


x, y = x k yk
k=1
ist ein Hilbertraum.
Beweis.

2 ist zunächst eine Teilmenge des –Vektorraums aller Folgen, in dem Gleich-
heit und die Vektorraumoperationen auf naheliegende Weise erklärt sind. Die
Vektorraumeigenschaft von 2 und die Konvergenz der das Skalarprodukt dar-
stellenden Reihe ergeben sich unter Verwendung des Majorantenkriteriums für
Reihen aus
1
| αxk + βyk |2 ≤ 2(| α |2 | xk |2 + | β |2 | yk |2 ) , | x k yk | ≤ 2 (| xk |
2
+ | yk |2 ) .

Zum Nachweis der Vollständigkeit betrachten wir eine Cauchy–Folge x(n) =


(n) (n)
(x1 , x2 , . . . ) in 2 . Zu vorgegebenem ε > 0 gibt es also ein nε mit
 (m)  

(∗) x − x(n) 2 = (m) (n)
|xk − xk |2 < ε2 für m > n > nε .
k=1
(m) (n)
Es folgt |xk − xk | < ε für m > n > nε und jedes feste k ∈ , d.h. jede der 
Komponentenfolgen (xk )n∈ ist eine Cauchy–Folge in . Somit existieren die
(n)

(n)
Grenzwerte xk := lim xk (k = 1, 2, . . . ). Für die Folge
n→∞

x = (x1 , x2 , . . . )
ist zu zeigen:
(i) x ∈ 2 , (ii) x − x(n)  → 0.
Aus (∗) folgt zunächst

N
(m) (n)
|xk − xk |2 < ε2 für m > n > nε und jede natürliche Zahl N
k=1

und daraus für m → ∞



N
(n)
|xk − xk |2 ≤ ε2 für n > nε und jede natürliche Zahl N .
k=1
224 § 9 Hilberträume

Daraus ergibt sich



(n)
|xk − xk |2 ≤ ε2 für n > nε ,
k=1

also x − x(n) ∈ 2 für n > nε und x − x(n)  → 0. Da 2 ein Vektorraum ist,


folgt x = x − x(n) + x(n) ∈ 2 . 2

(b) Die Einheitsvektoren

e1 := (1, 0, 0, 0, . . . ) , e2 := (0, 1, 0, 0, . . . ) , e3 := (0, 0, 1, 0, . . . ) , . . .

bilden ein Orthonormalsystem in 2 , aber keine Basis:

20 := Span {e1 , e2 , . . .} = {(x1 , . . . , xN , 0, 0, . . .) | N ∈ , x k ∈ }


ist ein echter Teilraum von 2 , der in 2 dicht liegt.

Denn wegen des Gleichheitsbegriffs in 2 gilt h := (1, 12 , 13 , . . . ) ∈ 2 , aber


h ∈ 20 . Für x = (x1 , x2 , . . .) ∈ 2 und x(n) := (x1 , x2 , . . . , xn , 0, 0, . . .) ∈ 20 gilt

 
x − x(n) 2 =  |xk |2 =  |xk |2 −  |xk |2 → 0 für n → ∞ .
∞ ∞ n

k=n+1 k=1 k=1

Bemerkungen.
Beachten Sie die Unterschiede zum endlichdimensionalen Fall:
(i) Das ONS e1 , e2 , . . . ist keine ONB und lässt sich auch nicht zu einer ONB
ergänzen, denn jeder zu e1 , e2 , . . . senkrechte Vektor x = (x1 , x2 , . . . ) ist wegen
ek , x = xk der Nullvektor.
(ii) Nicht jeder Teilraum ist abgeschlossen, wie das Beispiel 20 zeigt.
(iii) Nicht jede beschränkte, abgeschlossene Menge ist kompakt. Beispielsweise
√ Einheitskugel {x ∈  | x ≤ 1} die Folge (en ), von
2
enthält die abgeschlossene
der wegen en − em  = 2 für n = m keine Teilfolge konvergieren kann.
(c) Der Hilbertsche Folgenraum ist separabel , vgl. § 8: 2.6. Denn die abzählbare
Menge

A = {q = (q1 , . . . , qN , 0, 0, . . .) | N ∈ , Re q k , Im qk ∈ }

liegt dicht in 2 : Zu x = (x1 , x2 , . . .) ∈ 2 , ε > 0 können wir nach (b) ein N ∈


 finden mit x(N) = (x1 , . . . , xN , 0, 0, . . .) ∈ Kε (x), und durch geringfügige
Abänderung der xk erhalten wir einen Vektor q = (q1 , . . . , qN , 0, 0, . . .) ∈ A mit
x(N) − q < ε, also insgesamt x − q < 2ε.
2 Abgeschlossene Teilräume und orthogonale Projektionen 225

1.5 Das kartesische Produkt zweier Hilberträume


Für zwei Hilberträumen (H 1 , · , · 1) und (H 2 , · , · 2) ist das kartesische
Produkt
H 1 ×H 2 = {(u, v) | u ∈ H 1 , v ∈ H 2 }
mit dem Skalarprodukt
(u1 , v1 ) , (u2 , v2 ) := u1 , u2 1 + v1 , v2 2

ein Hilbertraum.
Sind H 1 , H 2 separabel, so auch H 1 ×H 2 ÜA .

2 Abgeschlossene Teilräume und orthogonale Projektionen


2.1 Abgeschlossenheit und Vollständigkeit
Sei (E,  · ) ein vollständiger normierter Raum (Banachraum) und V ein Teil-
raum. Wir können V , ausgestattet mit der in E gegegebenen Norm, als ei-
genständigen normierten Raum (V,  · ) ansehen. Dann gilt der
Satz. (V,  · ) ist genau dann vollständig, wenn V als Teilmenge von E abge-
schlossen ist.

Beweis.
(a) Sei V ein abgeschlossener Teilraum von E und (un ) eine Cauchy–Folge in
V . Da (un ) dann auch eine Cauchy–Folge in E ist, existiert u = lim un in E.
n→∞
Aus un ∈ V , un → u folgt u ∈ V , da V abgeschlossen ist.
(b) Sei V nicht abgeschlossen in E. Dann gibt es ein u ∈ E \ V und eine Folge
(vn ) in V mit vn → u. Die Folge (vn ) ist als konvergente Folge eine Cauchy–
Folge in V ohne Grenzwert in V . 2

2.2 Beispiele abgeschlossener Teilräume


(a) Jeder endlichdimensionale Teilraum eines Hilbertraums ist abgeschlossen.
Das folgt aus 2.1 und 1.2.
(b) Für jeden festen Vektor v eines Skalarproduktraums V über ist die 

Funktion Lv : V → , u → v , u linear und stetig, denn aus un → u
folgt | v , un − v , u | = | v , un − u | ≤ v · un − u → 0. Daher ist
Kern Lv = {u ∈ V | v , u = 0} ein Teilraum von V und als Nullstellenmenge
einer stetigen Funktion auf einer abgeschlossenen Menge abgeschlossen.
(c) Orthogonalräume. Für jede nichtleere Teilmenge M eines Skalarprodukt-
raums V ist
M ⊥ := {u ∈ V | u , v = 0 für alle v ∈ M }
226 § 9 Hilberträume

ein abgeschlossener Teilraum von V .


Denn aus (b) folgt wegen
8
M⊥ = Kern Lv ,
v∈M

dass M ⊥ als Durchschnitt abgeschlossener Teilräume ein abgeschlossener Teil-


raum ist. Für spätere Zwecke notieren wir:
(i) M ⊂ M ⊥⊥ := (M ⊥ )⊥ ,
(ii) M ⊂ N =⇒ N ⊥ ⊂ M ⊥ ÜA .

(d) In unendlichdimensionalen Skalarprodukträumen ist nicht jeder Teilraum


abgeschlossen. Der allgemeine Beweis dieser Aussage folgt später. Ein Beispiel
liefert der Teilraum 20 von 2 .

2.3 Orthogonale Projektion auf einen abgeschlossenen Teilraum


Satz. Sei V ein abgeschlossener Teilraum eines Hilbertraums H . Dann gibt
es zu jedem Vektor u ∈ H einen eindeutig bestimmten Vektor P u ∈ V mit
u − P u = dist (u, V ), d.h.

u − P u ≤ u − v für alle v ∈ V .
Weiter gilt
u − P u ⊥ V für alle u ∈ H ,
u = P u ⇐⇒ u ∈ V.

P u heißt die orthogonale Projektion von u auf V .


Bemerkung. Auf die Abgeschlossenheit von V kommt es wesentlich an. Ist ein
Teilraum V nicht abgeschlossen, so gibt es ein u ∈ V \ V . Für u existiert kein
v ∈ V mit u − v = dist (u, V ) = 0, denn dann wäre v = u ∈/ V.
In unvollständigen Skalarprodukträumen gilt kein entsprechender Satz.

Beweis.
(a) Existenz eines Punktes kleinsten Abstandes. Sei u ∈ H und
 
d := dist (u, V ) = inf u − v | v ∈ V .
Dann gibt es eine Minimalfolge (vn ) aus V mit
1
d2 ≤ u − vn 2 < d2 + (n = 1, 2, . . .) .
n
Wir zeigen, dass (vn ) eine Cauchy–Folge ist. Dazu verwenden wir die Parallelo-
grammgleichung a + b2 +a − b2 = 2a2 +2b2 und setzen a := 12 (u−vn ),
2 Abgeschlossene Teilräume und orthogonale Projektionen 227

b := 12 (u − vm ). Beachten wir, dass a − b = 12 (vm − vn ), a + b = u − 12 (vn + vm )


und dass 21 (vn + vm ) zu V gehört, so erhalten wir für m > n
 2
d2 + 1
4
vm − vn 2 ≤ u − 1
2
(vn + vm ) + 1
4
vm − vn 2

= 1
2
u − vn 2 + 1
2
u − vm 2

< d2 + 1
2n
+ 1
2m
< d2 + 1
n
,

also vm − vn 2 < n4 für m > n. Da V nach 2.1 vollständig ist, gibt es ein
v0 ∈ V mit vn → v0 . Wegen der Stetigkeit der Norm folgt

u − v0  = lim u − vn  = d .
n→∞

(b) Eindeutigkeit. Hat auch v∗ ∈ V von u den Abstand d, so ergibt die Paral-
lelogrammgleichung mit a = 12 (u − v0 ), b = 12 (u − v∗ ) wie oben
 
v∗ − v0 2 ≤ u − 12 (v∗ + v0 ) +
2
d2 + 1
4
1
4
v∗ − v0 2

= 1
2
u − v0 2 + 1
2
u − v∗ 2 = d2 ,

also v∗ − v0  = 0.
(c) Es genügt zu zeigen, dass u − P u ⊥ v für alle v ∈ V mit v = 1. Sei also
v0 := P u, v ∈ V mit v = 1 und α := v , u − v0 . Dann erhalten wir

d2 ≤ u − (v0 + αv)2 = u − v0 − αv , u − v0 − αv

= u − v0 2 − α v , u − v0 − α u − v0 , v + |α|2 = d2 − |α|2 ,

also α = 0.
(d) Aus P u = u folgt u ∈ V wegen P u ∈ V . Für u ∈ V folgt umgekehrt
u − P u = dist (u, V ) = 0, somit P u = u. 2

2.4 Der Zerlegungssatz


Für jeden abgeschlossenen Teilraum V des Hilbertraums H gilt

H = V ⊕ V ⊥,

d.h., jeder Vektor u ∈ H besitzt eine eindeutige Zerlegung

u = v + w mit v ∈ V und w ∈ V ⊥ .

Hierbei ist v = P u die orthogonale Projektion von u auf V , und es gilt

u2 = v2 + w2 .


228 § 9 Hilberträume

Beweis.
Nach 2.3 gilt u = P u + (u − P u) mit P u ∈ V und u − P u ∈ V ⊥ . Also gibt es
eine Zerlegung der behaupteten Art. Diese ist eindeutig: Aus

u = v1 + w1 = v2 + w2 mit v1 , v2 ∈ V , w1 , w2 ∈ V ⊥

folgt V  v1 − v2 = w2 − w1 ∈ V ⊥ . Daher ist v1 − v2 zu sich selbst orthogonal:


0 = v1 − v2 , v1 − v2 = v1 − v2 2 . Es folgt v1 = v2 , also auch w1 = w2 .
Die letzte Behauptung ergibt sich aus u2 = v + w , v + w und v , w = 0.
2

2.5 Biorthogonalräume
(a) Für abgeschlossene Teilräume V eines Hilbertraums H gilt V ⊥⊥ = V .

(b) Für beliebige Teilräume U gilt U ⊥⊥ = U und U ⊥ = U .

Beweis.
(a) Für u ∈ V gilt u , v = 0 für alle v ∈ V ⊥ , also u ∈ V ⊥⊥ := (V ⊥ )⊥ .
Umgekehrt folgt für u ∈ V ⊥⊥ nach dem Zerlegungssatz

u = v + w mit v ∈ V ⊂ V ⊥⊥ und w ∈ V ⊥ .

Wegen w = u − v ∈ V ⊥⊥ ∩ V ⊥ erhalten wir w , w = 0, also w = 0, somit


u=v ∈V.
(b) Wie oben ergibt sich U ⊂ U ⊥⊥ . Da Orthogonalräume nach 2.2 (c) abge-
schlossen sind, folgt U ⊂ U ⊥⊥ . Durch zweimalige Anwendung des Schlusses
⊥⊥
M ⊂ N =⇒ N ⊥ ⊂ M ⊥“ folgt aus U ⊂ U die Inklusion U ⊥⊥ ⊂ U = U,

Letzteres nach (a). Somit ist U = U ⊥⊥ .

(c) Wegen U ⊂ U ist U ⊂ U ⊥ . Für v ∈ U ⊥ und w = lim un mit un ∈ U
n→∞

folgt v , w = lim v , un = 0. Also gilt auch U ⊥ ⊂ U . 2
n→∞

2.6 Orthogonale Projektoren


Satz. Die orthogonale Projektion auf einen abgeschlossenen Teilraum V des
Hilbertraums H liefert einen linearen Operator P : H → H mit den Eigen-
schaften

(a) P2 = P ,
(b) u, P v = P u, v für alle u, v ∈ H .

Umgekehrt vermittelt jeder orthogonale Projektor, d.h. jeder lineare Opera-


tor P : H → H mit (a), (b), die orthogonale Projektion auf den abgeschlos-
senen Teilraum V := Bild P .
2 Abgeschlossene Teilräume und orthogonale Projektionen 229

Demnach besteht eine 1–1–Korrespondenz zwischen den abgeschlossenen Teil-


räumen V von H und den orthogonalen Projektoren. Letztere haben die wei-
teren Eigenschaften

(c) u , P u = P u2 .
(d) P ist stetig: P u ≤ u,
und Gleichheit gilt genau dann, wenn P u = u, d.h. u ∈ V .

(e) ½−P ist der orthogonale Projektor auf V ⊥ .

Beweis.
(1) Sei P u die orthogonale Projektion von u auf V . Aus 2.3 entnehmen wir
P u = u ⇐⇒ u ∈ V . Wegen P u ∈ V folgt P 2 u = P u für alle u ∈ H .
(2) Linearität. Seien u1 = v1 + w1 , u2 = v2 + w2 mit v1 , v2 ∈ V , w1 , w2 ∈ V ⊥ .
Dann gilt für α1 , α2 ∈
α1 u1 + α2 u2 = α1 v1 + α2 v2 + α1 w1 + α2 w2 ;

dabei gilt α1 v1 + α2 v2 ∈ V , α1 w1 + α2 w2 ∈ V ⊥ . Wegen der Eindeutigkeit der


Zerlegung folgt

P (α1 u1 + α2 u2 ) = α1 v1 + α2 v2 = α1 P u1 + α2 P u2 .
(3) Symmetrie. Wegen u − P u ⊥ V folgt u − P u ⊥ P v, ebenso v − P v ⊥ P u,
also
0 = u − P u, P v = u, P v − P u, P v ,
0 = P u, v − P v = P u, v − P u, P v .
Subtraktion dieser beiden Gleichungen ergibt die Behauptung.
(4) Der lineare Operator P : H → H habe die Eigenschaften (a),(b).
P ist linear, also ist V = Bild P ein linearer Teilraum. Es gilt v ∈ V ⇐⇒
P v = v, denn v = P u ∈ V =⇒ P v = P 2 u = P u = v.
Umgekehrt gilt P v = v =⇒ v ∈ Bild P = V . Bevor wir zeigen, dass V
abgeschlossen ist und P u die orthogonale Projektion von u auf V , notieren wir,
dass wegen (b) und (a) die Behauptung
 
(c) P u2 = P u , P u = u , P 2 u = u , P u

folgt. Daraus ergibt sich nach der Cauchy–Schwarzschen Ungleichung

(d) P u2 ≤ P u · u

mit Gleichheit genau dann, wenn u und P u linear abhängig sind, d.h. wenn
P u = 0 oder wenn u ein Vielfaches von P u ist und damit u ∈ V gilt. Das ergibt
P u ≤ u mit Gleichheit genau dann, wenn u ∈ V .
230 § 9 Hilberträume

(5) Die Stetigkeit von P folgt aus P u − P un  = P (u − un ) ≤ u − un .


(6) V ist abgeschlossen. Für die Vektoren vn ∈ V gelte vn → v. Nach (4) und
(5) folgt v = lim vn = lim P vn = P v, also v ∈ V .
n→∞ n→∞

(7) P u ist die orthogonale Projektion von u auf V . Wegen


u = Pu + u − Pu mit Pu ∈ V
ist nur zu zeigen, dass u − P u ∈ V ⊥ . Dann folgt die Behauptung aus dem
Zerlegungssatz 2.4. Sei also v ∈ V , d.h. v = P v nach (4). Dann gilt
 
u − P u , v = u − P u , P v = P u − P 2u , v = 0
wegen (b) und (a).
(8) ½ − P ist die orthogonale Projektion auf V ⊥ . Offenbar ist ½ − P ein ortho-
gonaler Projektor, also u ∈ Bild (½ − P ) ⇐⇒ u = (½ − P )u ⇐⇒ P u = 0
⇐⇒ u ∈ V ⊥ nach dem Zerlegungssatz. 2

2.7 Aufgaben
(a) Zeigen Sie für orthogonale Projektoren P1 , P2 :
Bild P1 ⊂ Bild P2 ⇐⇒ P1 P2 = P2 P1 = P1 ⇐⇒ P1 ≤ P2 .
Dabei bedeutet P1 ≤ P2 wie üblich u , P1 u ≤ u , P2 u für alle u ∈ H und
ist nach 2.6 (c) gleichbedeutend mit P1 u ≤ P2 u für alle u ∈ H .
Anleitung: Bild P1 ⊂ Bild P2 ⇐⇒ P2 P1 = P1 ergibt sich leicht. P1 P2 = P1
folgt dann mit dem Zerlegungssatz für P2 . Der Rest ergibt sich aus 2.6 (c), (d).
(b) Im Fall P1 P2 = P2 P1 ist P1 P2 die orthogonale Projektion auf den Raum
Bild P1 ∩ Bild P2 .
(c) Jeder abgeschlossene Teilraum eines separablen Hilbertraums ist separabel.

2.8 Der Darstellungssatz von Riesz–Fréchet


Ein lineares, stetiges Funktional auf einem normierten Raum (V,  · ) über
 
ist eine lineare, stetige Funktion L : V → . Der Vektorraum aller linearen,
stetigen Funktionale auf V heißt Dualraum V ∗ von V . Für L ∈ V ∗ existiert
 
L := sup |Lu| | u ≤ 1 ,
denn andernfalls gäbe es Vektoren un mit un  ≤ 1 und |Lun | ≥ n für n =
1, 2, . . . . Für die Vektoren vn := un /Lun wäre dann lim vn = 0, aber Lvn = 1
für n ∈ . n→∞

Es ist leicht zu sehen, dass durch L eine Norm auf V ∗ gegeben ist ÜA .
Für jeden Vektor v eines Skalarproduktraums liefert Lv : u → v , u ein linea-
res stetiges Funktional, vgl. 2.2 (b). In Hilberträumen gilt auch die Umkehrung:
2 Abgeschlossene Teilräume und orthogonale Projektionen 231

Satz. Zu jedem linearen, stetigen Funktional L auf einem Hilbertraum H gibt


es einen eindeutig bestimmten Vektor v ∈ H mit
Lu = v , u für alle u ∈ H ,
und es gilt
L = v .

Hiernach sind H ∗ und H normisomorph. In der Physikliteratur werden die


Hilbertraumvektoren meist als ket–Vektoren | u , die linearen Funktionale als
bra–Vektoren v | dargestellt. Das in der bracket–Form v | u geschriebene
Skalarprodukt entsteht dann durch Zusammenfügen bra–ket. Bei abweichender
Notation des Skalarprodukts, d.h. wenn Linearität im ersten Argument vorliegt,
sind die Rollen von bra– und ket–Vektoren zu vertauschen.

Beweis.
(a) Für L = 0 gilt 0 = Lu = 0 , u für alle u ∈ H . Umgekehrt folgt aus
0 = Lu = v , u für alle u ∈ H insbesondere Lv = v , v = 0, also v = 0.
(b) Im Fall L = 0 ist V := Kern L ein echter Teilraum und abgeschlossen als
Nullstellenmenge einer stetigen Funktion. Daher gilt nach dem Zerlegungssatz
H = V ⊕ V ⊥ mit V ⊥ = {0} .
Wenn die Behauptung des Satzes stimmt, so gibt es einen Vektor v = 0 mit
 
V = Kern L = u ∈ H | v , u = 0 = Span {v}⊥ ,

also V ⊥ = Span {u}⊥⊥ = Span {v} nach 2.5 (a). Da V ⊥ eindimensional ist,
besitzt nach dem Zerlegungssatz jeder Vektor u ∈ H eine eindeutige Zerlegung
u = u0 + αw mit u0 ∈ V , α ∈  und einem festen Vektor 0 = w ∈ V ⊥ .
Ausgehend von dieser Zielvorstellung konstruieren wir jetzt den gesuchten Vek-
tor v. Wegen V ∩ V ⊥ = {0} gilt Lw = 0 für 0 = w ∈ V ⊥ . Wir wählen einen
Vektor w ∈ V ⊥ mit Lw = 1.
Für einen gegebenen Vektor u ∈ H suchen wir eine Darstellung u = u0 +αw mit

u0 ∈ V und α ∈ . Notwendig dafür ist Lu = 0+αLw = α, also u0 = u−Lu·w.
Umgekehrt: Für u0 := u − Lu · w gilt Lu0 = Lu − Lu = 0. Wir erhalten also
u = u0 + Lu · w mit u0 ∈ V , w ∈ V ⊥
und daraus
w , u = Lu · w2 .
Es folgt Lu = v , u mit v = w/w2 .
(c) v ist dadurch eindeutig bestimmt. Aus v , u = v ∗ , u für alle u ∈ H
folgt v − v ∗ ⊥ H , insbesondere v − v ∗ , v − v ∗ = 0, also v = v ∗ .
232 § 9 Hilberträume

(d) Wir zeigen L = v: Für u ≤ 1 folgt nach Cauchy–Schwarz

|Lu| = | v , u | ≤ v · u ≤ v .

Dabei gilt Gleichheit für u = v/v. 2

Bemerkung. In dem (nicht vollständigen) Skalarproduktraum C[−1, 1] mit


1 1
u, v = u(x) v(x) dx sei L das durch Lu := u(x) dx gegebene lineare
−1 0
stetige Funktional. Dieses läßt sich nicht in der Form Lu = v , u darstellen; v
müsste die Heavyside–Funktion χ[0,1] sein. Diese gehört aber nicht zu C[−1, 1].

3 Dichte Teilräume
3.1 Beispiele
(a) Die Treppenfunktionen in Ω bil-
den einen dichten Teilraum von L2 (Ω), δ
vgl. § 8: 2.6.

(b) Der Raum C0 [a, b] der stetigen f ϕ


Funktionen f : [a, b] → 
mit f (a) =
b
f (b) = 0 liegt dicht in L2 [a, b]. • •-
a
Denn sei u ∈ L2 [a, b] und ε > 0 gege-
ben. Dann gibt es eine Treppenfunktion
ϕ auf [a, b] mit u − ϕ < ε. Zu dieser
gibt es nach der nebenstehenden Skizze
eine PC1 –Funktion f ∈ C0 [a, b] mit
f − ϕ < ε , also

f − u ≤ f − ϕ + ϕ − u < 2ε .

ÜA Geben Sie für ϕ = χ[α,β] und für ε > 0 ein f ∈ PC [α, β] ∩ C0 [α, β] an
1

mit f − u ≤ ε.
(c) Die Polynome liegen dicht in L2 [a, b], daher liegt auch C∞ [a, b] dicht.
Denn seien u ∈ L2 [a, b] und f ∈ C[a, b] mit f − u < ε. Nach dem Weierstraß-
schen Approximationssatz § 6: 2.9 gibt es dann ein Polynom p mit

f − p ≤ b − a f − p∞ < ε , also u − p < 2ε .

(d) Für die Differentialgleichungstheorie ist es von fundamentaler Bedeutung,


Ê
dass für jedes Gebiet Ω ⊂ n der Raum C∞ ∞
c (Ω) aller C –Funktionen mit
kompaktem Träger in Ω dicht liegt in L2 (Ω). Näheres dazu folgt im nächsten
Paragraphen.
4 Vollständige Orthonormalsysteme 233

3.2 Das Fundamentallemma


Für eine dichte Teilmenge eines Skalarproduktraums kann nur der Nullvektor
orthogonal sein.
Denn sei D dicht im Skalarproduktraum V und u ⊥ D . Da es eine Folge von
Vektoren un ∈ D gibt mit u = lim un , folgt mit der Stetigkeit des Skalar-
n→∞
produkts
u2 = u , u = lim u , un = 0 ,
n→∞

also u = 0 .

4 Vollständige Orthonormalsysteme
4.1 Problemstellung, Beispiele für symmetrische Operatoren
Orthonormalsysteme (ONS) treten u.a. im Zusammenhang mit symmetrischen
Operatoren auf. In endlichdimensionalen Skalarprodukträumen V gibt es be-
kantlich zu jedem symmetrischen Operator T eine Orthonormalbasis (v1 , . . . , vn )
aus Eigenvektoren, und jeder Vektor u ∈ V besitzt die Darstellung

n
u = vk , u vk .
k=1

Wir erörtern an zwei Beispielen die Verallgemeinerung auf symmetrische Ope-


ratoren im Unendlichdimensionalen und die Bedeutung der Methode.
 
(a) Wir betrachten den Raum C20 [0, π] := u ∈ C2 [0, π] | u(0) = u(π) = 0 ,
2

versehen mit dem Skalarprodukt u , v := π
u(x) v(x) dx , und den Operator
0
A : C20 [0, π] → C0 [0, π] , u → − u .
Durch zweimalige partielle Integration unter Berücksichtigung der Randbedin-
gungen erhalten wir die Symmetriebedingung u , Av = Au , v für u, v ∈
C20 [0, π] ÜA . Sämtliche Eigenwerte λ und Eigenfunktionen v von A wurden
schon in § 6: 1.2 bestimmt: Diese sind gegeben durch
vk (x) = sin kx zu den Eigenwerten λk = k2 (k = 1, 2, . . .).
Nach Wahl des Skalarprodukts bilden die vk ein ONS, und für u ∈ C20 [0, π]
erhalten wir nach § 6 : 2.8 die gleichmäßig konvergente Reihenentwicklung


2

u(x) = bk sin kx mit bk = π
u(t) sin kt dt = vk , u .
k=1 0

Hier tritt an die Stelle der Basisdarstellung im endlichdimensionalen Fall die


gleichmäßig und daher im Quadratmittel konvergente Reihenentwicklung


(∗) u = vk , u vk .
k=1
234 § 9 Hilberträume

(b) Sei Ω ⊂ Ê 3
ein Gaußsches Gebiet und
 
V := u ∈ C2 (Ω) ∩ C1 (Ω) | u(x) = 0 auf ∂Ω

mit dem von L2 (Ω) herkommenden Skalarprodukt versehen. Aus Bd. 1, § 26 : 5.7
entnehmen wir u , Δv = Δu , v für u, v ∈ V ; also ist der Laplace–Operator
u → − Δu symmetrisch, und Eigenvektoren zu verschiedenen Eigenwerten sind
zueinander orthogonal. Wir werden später zeigen, dass es eine Folge positiver
Eigenwerte λn mit eindimensionalen Eigenräumen gibt mit λn → ∞. Daher
gibt es ein ONS v1 , v2 , . . . zugehöriger Eigenvektoren, und wir können wieder
fragen, ob für jedes u ∈ V eine Reihenentwicklung der Form (∗) besteht. Ist
dies der Fall, so können wir ähnlich wie in § 6 : 4 das Wärmeleitungsproblem
∂u
= Δu in Ω , u = 0 auf ∂Ω , u(x, 0) = f (x) für x ∈ Ω
∂t
mit der Separationsmethode angehen: Der Produktansatz u(x, t) = w(t) v(x)
für Lösungen u ∈ V der Wärmeleitungsgleichung führt über
ẇ(t) Δv(x)
=
w(t) v(x)
auf das Eigenwertproblem −Δv = λv, v ∈ V und die Bedingung ẇ = −λw. Aus
(∗) folgt dann für jede Lösung u ∈ V des Wärmeleitungsgleichungsproblems

∞ 
(∗∗) u(x, t) = bk e−λk t vk (x) mit bk = vk (x) u(x, 0) d3 x = vk , f ,
k=1 Ω

also ist das oben gestellte Anfangs–Randwertproblem eindeutig lösbar. Unter


geeigneten Bedingungen an die Anfangswerte f (x) = u(x, 0) liefert die Reihe
(∗∗) eine Lösung.
Bei diesem und ähnlich gelagerten Problemen erweist es sich als zweckmäßig,
das Entwicklungsproblem (∗) in zwei Schritten zu behandeln:
(i) Es wird nachgewiesen, dass (∗) im Hilbertraumsinn gilt, d.h.
 
n 
lim  u − vk , u vk  = 0 für jedes u ∈ V.
n→∞ k=1

(ii) Wenn dies aufgrund der im Folgenden entwickelten allgemeinen Kriterien


sichergestellt ist, sind Bedingungen aufzustellen, unter denen die Reihe (∗∗) eine
gliedweis differenzierbare Lösung des vorgelegten Problems liefert.

4.2 Orthogonalreihen
Konvergenz von unendlichen Reihen in Skalarprodukträumen definieren
wir durch

∞  
n 
u = uk : ⇐⇒ lim  u − uk  = 0 .
k=1 n→∞ k=1
4 Vollständige Orthonormalsysteme 235

Wir sprechen von einer Orthogonalreihe, wenn ui , uk = 0 für i = k gilt.


Für Orthogonalreihen gilt:

∞ 

(a) u = uk =⇒ u2 = uk 2 .
k=1 k=1


(b) In Hilberträumen ist die Konvergenz einer Orthogonalreihe uk äqui-
k=1
∞
valent zur Konvergenz der Reihe uk 2 .
k=1

Der Beweis stützt sich auf den verallgemeinerten Satz von Pythagoras
 
n 2  
n 
n  
n
(P )  uk  = ui , uk = uk 2 .
k=m i=m k=m k=m

Wegen der Stetigkeit der Norm schließen wir daraus



n  
n  
n
uk =⇒ u2 = lim  uk  = lim
2
u = lim uk 2
n→∞ k=1 n→∞ k=1 n→∞ k=1

und damit (a).



n
Für (b) beachten wir, dass die Folge der Partialsummen sn = uk in einem
k=1
vollständigen Raum genau dann konvergiert, wenn diese das Cauchy–Kriterium
erfüllt. Daher folgt (b) unmittelbar aus (P ). 2

4.3 Fourierkoeffizienten, Entwicklungsproblem und Besselsche Un-


gleichung
(a) Im folgenden sei V ein unendlichdimensionaler Skalarproduktraum über 
und v1 , v2 , . . . ein abzählbares Orthonormalsystem. Wir fragen nach Bedingun-


gen für das Bestehen einer Reihenentwicklung u = λk vk mit geeigneten
Koeffizienten λk ∈ . Eine erste Auskunft darüber gibt der k=1

Satz. Eine Reihenentwicklung




u = λk vk
k=1

kann nur bestehen, wenn


λk = vk , u für k = 1, 2, . . . .

Die Zahlen vk , u heißen (verallgemeinerte) Fourierkoeffizienten von u be-


züglich des ONS v1 , v2 , . . . .
Der Zusammenhang mit den in § 6 : 2.1 definierten klassischen Fourierkoeffizien-
ten ergibt sich aus 4.1 (a), vgl. auch 4.5.
236 § 9 Hilberträume

Beweis.

∞ 
n
Aus u = λk vk = lim λk vk folgt wegen der Stetigkeit des Skalarpro-
k=1 n→∞ k=1
dukts
 
n 
vm , u = lim vm , λk vk (m = 1, 2, . . .).
n→∞ k=1
Für n ≥ m gilt aber
 
n  
n
vm , λk vk = λk vm , vk = λm . 2
k=1 k=1

(b) Für die Fourierkoeffizienten von u gilt die Besselsche Ungleichung




| vk , u |2 ≤ u2 .
k=1

Denn nach Bd. 1, § 19 : 2.5 gilt die für das folgende fundamentale Beziehung
 
n  
n
(∗∗)  u − vk , u vk  = u2 −
2
| vk , u |2 (n = 1, 2, . . . ).
k=1 k=1

Es folgt

.
n
| vk , u |2 ≤ u2 für alle n ∈
k=1

Ist daher v1 , v2 , . . . ein ONS in einem Hilbertraum H , so konvergiert für jeden




Vektor u ∈ H die (verallgemeinerte) Fourierreihe vk , u vk bezüglich der
k=1
Norm gegen einen Vektor v ∈ H . Dies folgt aus § 9 : 4.2 (b) unter Beachtung
von  vk , u vk 2 = | vk , u |2 .
(c) Der Grenzwert v der Fourierreihe von u ist i.A. von u verschieden, Näheres
in 4.9. Von fundamentaler Bedeutung ist daher das Entwicklungsproblem:
Unter welchen Voraussetzungen gilt


(∗) u = vk , u vk für alle u ∈ H ?
k=1

4.4 Vollständige Orthonormalsysteme


Satz. Für ein ONS v1 , v2 , . . . in einem unendlichdimensionalen Skalarpro-
duktraum V sind folgende Bedingungen äquivalent:


(a) u = vk , u vk für jeden Vektor u ∈ V .
k=1

(b) Für jeden Vektor u ∈ V gilt die Parsevalsche Gleichung




u2 = | vk , u |2 .
k=1
4 Vollständige Orthonormalsysteme 237

(c) Für alle Vektoren u, v ∈ V gilt die Parsevalsche Gleichung in polarisierter


Form


u, v = vk , u vk , v .
k=1

(d) Die Linearkombinationen der vk liegen dicht in V .


Ein Orthonormalsystem mit diesen Eigenschaften nennen wir vollständig.

Bemerkungen.
(i) Beispiele folgen in 4.5, 4.6.
(ii) Besitzt ein Skalarproduktraum V ein vollständiges ONS, so ist er separabel,
d.h. er enthält eine abzählbare dichte Menge, vgl. § 8: 2.6. Denn die Vektoren

N
der Form λk vk liegen dicht in V , und jeder solche Vektor läßt sich durch
k=1

N
Vektoren der Form μk vk mit Re μk , Im μk ∈ beliebig gut approximieren.
k=1
Letztere bilden eine abzählbare Menge. In 4.7 zeigen wir, dass umgekehrt jeder
separable Skalarproduktraum ein vollständiges ONS besitzt.

(e) Ein wichtiges Kriterium zum Nachweis der Vollständigkeit eines ONS ist
das folgende:
Satz. Ein ONS v1 , v2 , . . . in einem Hilbertraum H ist genau dann vollständig,
wenn gilt:

Aus u ⊥ vk für k = 1, 2, . . . folgt u = 0 ,

d.h. wenn nur der Nullvektor auf allen vk senkrecht steht.

Beweis.
(a) ⇐⇒ (b) nach 4.3 (∗∗).
(c) =⇒ (b) mit u = v.
(a) =⇒ (c): Wegen der Stetigkeit und der Linearität von v → u , v gilt
 
n  
n
u, v = lim u, vk , v vk = lim vk , v u , vk
n→∞ k=1 n→∞ k=1



= vk , u vk , v .
k=1

Damit sind (a), (b), (c) äquivalent.


(a) =⇒ (d) ist offensichtlich.
Dass (d) umgekehrt (a) zur Folge hat, ergibt sich aus der Beziehung
238 § 9 Hilberträume

 
 u −  λk vk 2 = u2 −  | vk , u |2 +  | λk − vk , u |2
n n n

k=1 k=1 k=1


n  
n 2
≥ u −2
| vk , u | =  u −
2
vk , u vk 
k=1 k=1

(Bd. 1, § 19 : 2.3 und 4.3 (∗∗)): Wir fixieren ein u ∈ V . Nach (d) gibt es zu

N
vorgegebenem ε > 0 eine Linearkombination w = λk vk mit u − w < ε.
k=1
Nach den oben angegebenen Beziehungen folgt dann für alle n ≥ N
 
 u −  vk , u vk 2 = u2 −  | vk , u |2
n n

k=1 k=1
N  
N 2
≤ u − 2
| vk , u |2 =  u − vk , u vk 
k=1 k=1
 
N 2
≤ u − λk vk  < ε nach 4.3 (a).
k=1

(e) Die Bedingung


vk , u = 0 für k = 1, 2, . . . =⇒ u = 0
läßt sich auch so ausdrücken: Für W := Span {v1 , v2 , . . .} gilt W ⊥ = {0}.
Da W ⊥ ein abgeschlossener Teilraum von H ist, gilt nach dem Zerlegungssatz
2.4 H = W ⊥ ⊕ W ⊥⊥ . Somit ist die Bedingung W ⊥ = {0} äquivalent zur
Bedingung W ⊥⊥ = H . Nach 2.5 (b) ist aber W ⊥⊥ = W . Also ist W ⊥ = {0}
äquivalent zu W = H , d.h. dazu, dass die Linearkombinationen der vk dicht
in H liegen. Beachten Sie, dass Satz 2.5 und damit das Kriterium (e) die
Vollständigkeit des Skalarproduktraums voraussetzen! 2

4.5 Die Vollständigkeit der trigonometrischen Funktionen


(a) Wir betrachten H = L2 ([−π, π]) mit dem Skalarprodukt
1

u , v := π
u(x) v(x) dx .
−π

Offenbar ist H ein Hilbertraum, und durch


1

v1 (x) = 2
,
v2 (x) = sin x , v3 (x) = cos x ,
v4 (x) = sin 2x , v5 (x) = cos 2x , . . .
ist ein ONS gegeben. Für die Fourierkoeffizienten
1
π 1

ak = π
u(x) cos kx dx , bk = π
u(x) sin kx dx
−π −π

gilt dann a0 = 2 v1 , u und
ak = v2k+1 , u , bk = v2k , u für k ∈ .
4 Vollständige Orthonormalsysteme 239

Für 2π–periodische PC1 –Funktionen u konvergiert nach dem Satz von Dirichlet
(§ 6: 2.3) die Fourierreihe

1

∞ 

(∗) u(x) = 2
a0 + (ak cos kx + bk sin kx) = vk , u vk (x)
k=1 k=1

gleichmäßig, also auch im Quadratmittel, d.h. in der L2 –Norm (§ 8 : 2.1 (d) (iii)).
Nach 3.1 (b) liegen die PC1 –Funktionen u mit u(−π) = u(π) = 0 dicht in H .
Mit dem Kriterium 4.4 (d) erhalten wir somit den

Satz. Das ONS v1 , v2 , . . . der trigonometrischen Funktionen ist vollständig.


Für jede Funktion u ∈ L2 ([−π, π]) konvergiert die Fourierentwicklung (∗) im
Quadratmittel .

Folgerung. Für jedes u ∈ L2 ([−π, π]) gilt die Parsevalsche Gleichung


1 π ∞ 

| u(x) |2 dx = 1
2
|a0 |2 + |ak |2 + |bk |2 .
π −π k=1

Aufgabe. Gewinnen Sie die Eulerschen Formeln


π2 ∞
1 π4 ∞
1
= 2
, = 4
6 k=1 k 90 k=1 k

durch Anwendung der Parsevalschen Gleichung auf die Funktionen u(x) = x


und u(x) = x2 .

(b) Satz. Durch


2
vk (x) = π
sin kx (k = 1, 2, . . . )

ist ein vollständiges ONS auf L2 ([0, π]) gegeben, vgl. 4.1.
Das ergibt sich wie oben: V := {u ∈ PC1 [0, π] | u(0) = u(π) = 0} liegt nach
3.1 (b) dicht in L2 ([0, π]), und für die Funktionen von V gilt der gleichmäßige
Entwicklungssatz § 6 : 2.7.

4.6 Die Vollständigkeit der Legendre–Polynome


Orthonormalisieren wir die Folge der Potenzen uk (x) = xk (k ∈  ) bezüglich
0
1
des Skalarprodukts u, v = u v , so erhalten wir ein ONS v0 , v1 , . . . mit
−1
Span {u0 , . . . , un } = Span {v0 , . . . , vn } (n = 0, 1, . . .). Die Linearkombinatio-
nen der vk sind also Polynome. Diese liegen dicht in L2 ([−1, 1]), vgl. 3.1 (c).
Nach dem Kriterium 4.4 (d)bilden also die v0 , v1 , . . . ein vollständiges ONS für
L2 ([−1, 1]). Die Pn (x) = 2
2n+1
vn (x) (n = 0, 1, 2, . . . ) sind die Legendre–
Polynome, vgl. § 4 : 4.5 und § 15 : 3.4.
240 § 9 Hilberträume

4.7 Die Existenz vollständiger Orthonormalsysteme


Satz. In jedem unendlichdimensionalen, separablen Skalarproduktraum V gibt
es vollständige Orthonormalsysteme v1 , v2 , . . . .
Beweis.

Sei A = {an | n ∈ } eine abzählbare, in V dichte Folge. Wir zeigen durch
Induktion: Es gibt eine Teilfolge ( ank ), so dass u1 = an1 , . . . , um = anm jeweils
linear unabhängig sind und dass

{a1 , a2 , . . . , anm } ⊂ Span {u1 , . . . , um } .

Ist dies gezeigt, so folgt A ⊂ Span {u1 , u2 , . . .}, also ist Span {u1 , u2 , . . .}
dicht in V . Konstruieren wir dann mit dem Orthonormalisierungsverfahren von
Gram–Schmidt ein ONS v1 , v2 , . . . mit

Span {v1 , . . . , vn } = Span {u1 , . . . , un } (n = 1, 2, . . .),

so ist nach dem Kriterium 4.4 (d) das ONS v1 , v2 , . . . vollständig.


Zum Induktionsbeweis. Sei an1 das erste von Null verschiedene Folgenglied und
u1 := an1 . Dann gilt {a1 , . . . , an1 } ⊂ Span {u1 }. Sind u1 = an1 , . . . uk = ank
linear unabhängig und {a1 , . . . , ank } ⊂ Sk := Span {u1 , . . . , uk }, so setzen wir

M = {n > nk | an ∈ Sk } , nk+1 := min M und uk+1 := ank+1 .

(M ist nichtleer, sonst wäre A ⊂ Sk , also V = A ⊂ S k = Sk , da Sk als


endlichdimensionaler Teilraum nach 3.1 (b) abgeschlossen ist.)
Nach Konstruktion sind u1 , . . . , uk+1 linear unabhängig, und es gilt

{a1 , . . . , ank+1 } ⊂ Span {u1 , . . . , uk+1 }. 2

4.8 Der Isomorphiesatz


Jeder unendlichdimensionale separable Hilbertraum H über  ist unitär iso-
morph zu 2 = 2 ( ).
Einen Hilbertraumisomorphismus U : H → 2 erhalten wir wie folgt: Wir
wählen ein vollständiges ONS v1 , v2 , . . . für H und setzen
U u := ( v1 , u , v2 , u , . . . ) .

U entspricht der Koordinatenabbildung 1.2 im endlichdimensionalen Fall. We-


gen dieser Analogie heißt ein vollständiges ONS auch Hilbertraumbasis, ob-
wohl es im unendlichdimensionalen Fall sicher keine Basis ist. Zur Bedeutung
des Isomorphiebegriffs wird auf die Bemerkungen 1.2 verwiesen.
Es gibt also im Wesentlichen nur die separablen Hilberträume
 n
(n ∈ ) und 2 ( ).
4 Vollständige Orthonormalsysteme 241

Beweis.
Nach 4.7 gibt es ein vollständiges ONS v1 , v2 , . . .. Die oben eingeführte Ab-
bildung U ist linear und isometrisch, denn nach der Parsevalschen Gleichung
4.4 (b), (c) gilt


u2H = | vk , u |2 = U u22 ,
k=1



u, v H = vk , u vk , v = U u , U v 2 .
k=1

Es bleibt nur noch zu zeigen, dass U surjektiv ist. Sei also a = (a1 , a2 , . . .) ∈ 2 ,

∞ 

d.h. ak vk 2 = |ak |2 < ∞. Nach 4.2 (b) konvergiert die Reihe
k=1 k=1


u := ak vk
k=1

im Normsinn, und aus 4.3 ergibt sich ak = vk , u (k = 1, 2, . . .), somit ist


a = U u. 2

Dass die v1 , v2 , . . . keine Basis für H liefern, ergibt sich jetzt aus der Tatsache,
dass die Einheitsvektoren e1 , e2 , . . . nach 1.4 keine Basis des 2 darstellen.

4.9 Entwicklung nach unvollständigen ONS


Sei v1 , v2 , . . . ein beliebiges ONS in einem Hilbertraum H und u ∈ H . Dann
konvergiert die Fourierreihe von u gegen die orthogonale Projektion P u von u
auf den abgeschlossenen Teilraum V = Span {v1 , v2 , . . .} :


vk , u vk = P u .
k=1

Im Fall V = H ist das ONS v1 , v2 , . . . nicht vollständig, es kann aber durch ein
vollständiges ONS für V ⊥ zu einem vollständigen ONS für H ergänzt werden.

Beweis.
Wegen der Besselschen Ungleichung 4.3 (b) und wegen 4.2 konvergiert die Reihe


v := vk , u vk .
k=1

Dann gilt v ∈ V , und aus 4.3 (a) folgt vk , v = vk , u (k = 1, 2, . . .).


Also ist u − v orthogonal zu allen vk und somit u − v ∈ V ⊥ nach 2.5 (b). Aus
u = v + (u − v) mit v ∈ V , u − v ∈ V ⊥ folgt v = P u nach dem Zerlegungssatz
2.4. 2
242 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

§ 10 Glättung von Funktionen, Fortsetzung stetiger


Funktionen

Vorkenntnisse: Die Kenntnis des Lebesgue–Integrals ist nur an wenigen Stellen


nötig, die im Text entsprechend ausgewiesen sind. Die Hauptergebnisse und de-
ren Beweise bleiben für das herkömmliche Integral für stetige Funktionen und
Treppenfunktionen gültig, wenn wir u ∈ Lp (Ω)“ so verstehen, dass |u|p über Ω

integrierbar ist, und u ∈ L∞ (Ω)“ einfach Beschränktheit auf Ω bedeuten soll.
” 1
Die Voraussetzung u ∈ Lloc (Ω) (u ist lokalintegrierbar) ist für stetige Funktio-
nen und Treppenfunktionen immer erfüllt.

1 Testfunktionen
1.1 Ck –Funktionen mit kompakten Träger
(a) Der Träger (support) einer
Ê
Funktion u : n → ( =  oder

= ) ist definiert als
6

supp u := {x ∈  n
| u(x) = 0}.
-
(b) Für eine nichtleere offene Men-
ge Ω ⊂  n
und k = 0, 1, 2, . . . , ∞ 3 45
supp u
6
bezeichnen wir den Raum der Ck –
Funktionen n → mit kompaktem
Träger in Ω mit

Ckc (Ω) :=

u ∈ Ck (  )  supp u ist eine kompakte Teilmenge von Ω .
n

Die Funktionen aus dem Raum C∞ c (Ω) heißen Testfunktionen auf Ω; der
Name erklärt sich in 4.1. Anstelle von C∞c (Ω) sind auch die Bezeichnungen
C∞
0 (Ω) und D(Ω) gebräuchlich.

C0c (Ω) besteht aus den stetigen Funktionen mit kompaktem Träger.

(c) Für u ∈ C0c (Ω) und v ∈ C0 (Ω) ist u · v über Ω integrierbar.



(Das Lebesgue–Integral uv macht genau dann für alle u ∈ C0c (Ω) einen Sinn,
Ω
wenn v ∈ L1loc , d.h. über jede kompakte Teilmenge von Ω integrierbar ist, vgl.
§ 8 : 2.5. Die eine Richtung ist klar: Ist u ∈ C0c (Ω) und A = supp u kompakt,
so existiert u∞ = max{|u(x)| | x ∈ A}, und für v ∈ L1loc (Ω) gilt die Ab-
schätzung |u · v| ≤ u∞ · |v| · χA , woraus die Integrierbarkeit von u · v nach
dem Majorantensatz folgt. Die andere Richtung ergibt sich in 3.5.)
1 Testfunktionen 243

1.2 Die Standardbuckel jε und weitere Testfunktionen


Satz. Zu jedem ε > 0 gibt es eine Testfunktion jε ∈ C∞
c ( Ê) n
mit

jε ≥ 0 , supp jε = Kε (0) , jε = 1 .

Beweis. (
e−1/t für t > 0 ,
Wir gehen aus von f (t) :=
0 für t ≤ 0 .
Durch Induktion erhalten wir für t > 0
f (k) (t) = pk (t) t−2k f (t)
6
1
mit einem geeigneten Polynom pk f
−2k −1/t
ÜA . Wegen lim t e = 0 für
Æ Ê
t→0+
k ∈ 0 folgt f ∈ C∞ ( ), 0 ≤ f ≤ 1 -
Ê
sowie supp f = + . Für
ψε (x) := f (1 − x2 /ε2 )
Ê
gilt also ψε ∈ C∞ ( n), ψε (x) > 0 für 6
x < ε und ψε (x) = 0 sonst.
j1/3
Die Funktion jε := cε ψε mit cε :=
1 / ψε besitzt dann die gewünschten
Eigenschaften. 2
j1
Aus der Konstruktion ergibt sich un- j5/3
mittelbar
( -
∞ für x = 0 ,
lim jε (x) =
ε→0+ 0 für x = 0 .

Aus den Standardbuckeln lassen sich weitere Testfunktionen konstruieren:


(a) Sei Ω offen, r > 0 und Kr (x0 ) ⊂ Ω. Dann ist

ϕ(x) = jr (x − x0 )

eine Testfunktion ϕ ∈ C∞
c (Ω) mit supp ϕ = Kr (x0 ).

(b) Für f ∈ C∞ ( Ê n
) und ϕ ∈ C∞
c ( Ê n
) ist f · ϕ eine Testfunktion.
(c) Für ϕ ∈ C∞
c (Ω) ist jede partielle Ableitung beliebiger Ordnung wieder eine
Testfunktion.
(d) Weitere Testfunktionen ergeben sich in 2.3 durch Faltung von Standard-
buckeln mit Funktionen mit kompaktem Träger.
244 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

2 Faltung mit Testfunktionen


2.1 Definition der Faltung
Unter jeder der nachfolgenden Bedingungen konvergiert das Faltungsintegral

(u ∗ v)(x) := u(x − y) v(y) dn y
Ên
für fast alle x ∈ Ên
und ist kommutativ, u ∗ v = v ∗ u f.ü.:
(a) u ∈ L (p
Ê ), v ∈ L (Ê )
n q n
mit p > 1, 1
p
+ 1
q
= 1,
(b) u ∈ L (Ê ), v ∈ L (Ê )
1 n ∞ n
und umgekehrt,
(c) u ∈ C (Ê ), v ∈ L (Ê )
0
c
n 1
loc
n
und umgekehrt.

Denn für y → w(y) := u(x − y) bei festem x erhalten wir:


 
u ∈ Lp ( Ê) n
⇐⇒ w ∈ Lp ( Ên
) und |u|p = |w|p
Ên Ên
(Substitution z = x − y unter Verwendung des Transformationssatzes für Inte-
grale), ferner

u ∈ C0c ( Ê) n
⇐⇒ w ∈ C0c ( Ê ).n

Somit existiert das Faltungsintegral im Fall (a) nach der Hölderschen Unglei-
chung § 8 : 2.3 (b) und im Fall (b) nach dem Majorantenkriterium. Für den Fall
(c) verweisen wir auf 1.1 (c).
Die Kommutativität des Faltungsprodukts ergibt sich durch Substitution z =
x − y bei festem x (siehe oben).
(d) Für Lebesgue–integrierbare Funktionen u, v existiert das Faltungsintegral
(u ∗ v)(x) f.ü., und u ∗ v = v ∗ u ist Lebesgue–integrierbar .

Denn für fast alle y ∈ Ên


existiert das Integral
 
f (y) := |u(x − y) · v(y)| dn x = |v(y)| |u(x − y)| dn x = u1 · |v(y)| ,

Letzteres durch Substitution z = x − y. Damit ist f integrierbar, und die Be-


hauptung folgt aus dem Satz von Tonelli § 8 : 1.8.

2.2 Differentialoperatoren und Multiindizes


(a) Ein (n–dimensionaler) Multiindex ist ein n–Tupel

α = (α1 , . . . , αn ) mit α1 , . . . , αn ∈  0 .

Wir verwenden die Abkürzungen

|α| := α1 + . . . + αn und α! := α1 · · · αn ! .
2 Faltung mit Testfunktionen 245

(b) Für x = (x1 , . . . , xn ) ∈ Ê n


und α = (α1 , . . . , αn ) definieren wir
x α
:= xα
1
1
··· xα
n
n
.
Ein Polynom p vom Grad m ∈ Æ 0 in den Variablen x1 , . . . , xn hat die Form

p(x) = cα xα ,
|α|≤m

wobei mindestens ein cα mit |α| = m von Null verschieden ist. Wir beachten
dabei, dass es nur endlich viele α = (α1 , . . . , αn ) gibt mit |α| ≤ m.
(c) Ferner setzen wir
 α1  αn
∂ ∂
∂ α := ··· = ∂1α1 · · · ∂nαn .
∂x1 ∂xn
Es ist also beispielsweise
∂ ∂ ∂ ∂3u
∂ (1,2) u = u = = ∂1 ∂2 ∂2 u .
∂x1 ∂x2 ∂x2 ∂x1 ∂x22
Die Leibnizregel für u, v ∈ Cr (Ω) und |γ| ≤ r lautet ÜA

 γ!
∂ γ (u · v) = ∂αu · ∂β v .
α+β=γ α! β!

(d) Ein linearer Differentialoperator m–ter Ordnung auf einem Gebiet


Ê
Ω ⊂ n hat die Form

L : u → Lu = aα ∂ α u ,
|α|≤m

wobei die aα Funktionen auf Ω sind und wenigstens ein aα mit |α| = m keine
Nullstellen besitzt.
Sind die Koeffizienten aα C∞ –Funktionen, so kann L als ein linearer Operator
L : C∞ ∞
c (Ω) → Cc (Ω) aufgefasst werden.

2.3 Faltung mit Testfunktionen


Satz. Für u ∈ Ckc ( Ê n
) und v ∈ L1loc ( Ê n
) gilt:
(a) u ∗ v ∈ C ( k
Ê n
),
(b) ∂ (u ∗ v) = (∂ α u) ∗ v für |α| ≤ k,
α

(c) supp (u ∗ v) ⊂ supp u + supp v := {x + y | x ∈ supp u, y ∈ supp v}.


(d) Mit A := supp v gilt insbesondere jε ∗ v ∈ C∞ ( Ên
) und
2
supp (jε ∗ v) ⊂ Aε := {x ∈ Ê n
| dist (x, A) ≤ ε} = Kε (a) .
a∈A
246 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

Beweis.
(a) und (b) K := supp u ist kompakt, also existiert für jeden Multiindex α mit
|α| ≤ k

M α := max{| ∂ α u(x) | | x ∈ K} = max{| ∂ α u(x) | | x ∈ Ê n


},

und es gilt

| ∂ α u(x − y) v(y) | ≤ M α | v(y) | für alle y ∈ Ê.n

Nach dem Satz über Parameterintegrale existiert daher


 
(∂ α (u ∗ v))(x) = ∂ α u(x − y)v(y) dn y = ∂ α u(x − y)v(y) dn y

und ist stetig.


(c) Seien K := supp u, A := supp v. Für x ∈ K + A verschwindet

(u ∗ v)(x) = u(x − y)v(y) dn y ,

denn dann ist x − y ∈ K für alle y ∈ A und v(y) = 0 für y ∈ A.


(d) Aus (c) folgt
supp (jε ∗ v) ⊂ { a + y | a ∈ A und y ≤ ε}
7
= Kε (a) =: Bε .
a∈A
Zu zeigen bleibt
Bε = Aε := {x | dist (x, A) ≤ ε}.
Für x ∈ Bε gibt es ein a ∈ A mit x − a ≤ ε, also gilt dist (x, A) ≤ ε.
Sei umgekehrt d := dist (x, A) ≤ ε. Dann gibt es Punkte an ∈ A mit
x − an  < d + n1 . Es folgt an  < x + d + n1 < x + d + 1. Daher
besitzt die Folge, (an ) eine konvergente Teilfolge. Für deren Grenzwert a gilt
x − a ≤ d ≤ ε. 2

3 Glättung von Funktionen


3.1 Definition und Beispiele
Ê
Sei Ω ⊂ n offen und u ∈ L1loc (Ω). Wir setzen u(x) := 0 für x ∈ n \ Ω. Sind Ê
je p die in 1.2 eingeführten Standardbuckel, so heißt die Schar der Funktionen

uε = jε ∗ u , uε (x) = jε (x − y) u(y) dn y (ε > 0) ,
Ên
eine Glättung oder Regularisierung von u. Nach 2.3 gilt uε ∈ C∞ ( Ê
n
).
3 Glättung von Funktionen 247

Beispiele. (a) Für die Heaviside–


Funktion u = χÊ+ ist uε (x) = 0 6 u

für x ≤ −ε , uε (x) = 1 für x ≥ ε,
ferner wächst uε streng monoton in
[−ε, ε]. Das folgt unmittelbar aus der -
Darstellung
x 6 uε
uε (x) = (u ∗ jε )(x) = jε (t) dt .
−ε

Offenbar gilt -

+∞ −ε ε
|uε − u|p < 2ε für p ≥ 1 .
−∞

Ê
(b) Ist I ⊂ n ein kompakter Quader und u = χI seine charakteristische
Funktion, so wird uε nach 2.3 (d) eine C∞ –Funktion mit kompaktem Träger in
Iε = {x | dist (x, I) ≤ ε}. Aus
 
uε (x) = jε (x − y)u(y) dn y = jε (x − y) dn y
Ên I

entnehmen wir, dass uε (x) = u(x) = 1 für alle x ∈ I mit dist (x, ∂I) ≥ ε und
uε (x) = u(x) = 0 für alle x mit dist (x, I) ≥ ε. Ferner gilt | uε (x) − u(x) | ≤ 1
in Sε = {x | dist (x, ∂I) ≤ ε} und Volumen V n (Sε ) ≤ const · ε. Es folgt

|uε − u|p ≤ V n (Sε ) → 0 für ε → 0 + .
Bemerkungen (i) Aus uε (x) = u(x) für alle x mit dist (x, ∂I) ≥ ε folgt
lim uε (x) = u(x) für alle x ∈ ∂I, d.h. fast überall.
ε→0+

(ii) Liegt I in einem Gebiet Ω, so gibt es ein > 0 mit I ⊂ Ω, vgl. Bd. 1, § 21:
8.3. Dann gilt uε ∈ C∞c (Ω) für ε ≤ .

3.2 Glättung stetiger Funktionen


(a) Satz. Für jede stetige Funktion u mit kompaktem Träger in der offenen
Menge Ω gilt ur := jr ∗ u ∈ C∞c (Ω) für r  1,

ur → u gleichmäßig auf Ω und



|u − ur |p → 0 für 1 ≤ p < ∞ .
Ω

Beweis.
Im Fall supp u = ∅, d.h. u = 0 ist uε = 0. Sei also A := supp u = ∅. Wir
Ê
setzen := 14 dist (A, ∂Ω) (bzw. := 1, falls Ω = n ). Nach Bd. 1, § 21 : 8.3
ist > 0. Ferner ist
Ar := {x ∈ Ê n
| dist (x, A) ≤ r} für r ≤ 2
248 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

eine kompakte Teilmenge von Ω. Aus 2.3 (a),(d) ergibt sich ur ∈ C∞ ( Ên


) und
supp ur ⊂ Ar ⊂ Ω, also ur ∈ C∞
c (Ω) für r ≤ 2 .

Sei ε > 0 gegeben. Wegen der gleichmäßigen Stetigkeit von u auf A2 gibt es
ein δ mit 0 < δ < und

| u(x) − u(y) | < ε für alle x, y ∈ A2 mit x − y < δ .



Wegen jr (x − y) dn y = 1 folgt für 0 < r < δ
 
| u(x) − ur (x) | =  jr (x − y)(u(x) − u(y)) dn y 
  
=  jr (x − y)(u(x) − u(y)) dn y 
Kr (x)

< ε jr (x − y) dn y = ε .
Kr (x)

Zum Nachweis der zweiten Behauptung beachten wir, dass supp u, supp ur ⊂
A2 für 0 < r < . Nach Bd. 1, § 23 : 4.6 gibt es kompakte Quader I1 , . . . , IN in
Ω mit A2 ⊂ I1 ∪ · · · ∪ IN =: K. Wegen der gleichmäßigen Konvergenz ur → u
folgt
 
|u − ur |p = |u − ur |p → 0 für r → 0 . 2
Ω K

(b) Folgerung. Ist K ⊂ Ω kompakt und u : K → 


stetig, so gibt es eine
Folge von Testfunktionen ϕn ∈ C∞
c (Ω) mit ϕn → u gleichmäßig auf K.

Beweis.
Nach dem in 5.3 zitierten Satz von Tietze–Uryson läßt sich u zu einer stetigen
. ∈ C0c (Ω) fortsetzen, auf welche wir (a) anwenden.
Funktion u 2

3.3 Testfunktionen liegen dicht in Lp (Ω)


(a) Satz. Für 1 ≤ p < ∞ ist C∞ p
c (Ω) ein dichter Teilraum von L (Ω).

Wegen C∞
c (Ω) ⊂ Cc (Ω) ⊂ L (Ω) ist daher auch Cc (Ω) dicht in L (Ω).
0 p 0 p

Beweis.
Wir zeigen zunächst: Die Treppenfunktionen u mit supp u ⊂ Ω liegen dicht in
Lp (Ω) bezüglich der Norm
 1/p
up = |u|p .
Ω
3 Glättung von Funktionen 249


Denn existiert |f |p im herkömmlichen Sinn, so gibt es zu jedem ε > 0 eine
Ω
Vereinigung K = I1 ∪ . . . ∪ IN kompakter Quader Ik ⊂ Ω mit
 
|f |p − |f |p < ε .
Ω K

Ferner existiert eine Treppenfunktion u auf K mit |u(x) − f (x)| < ε für x ∈ K.
Es folgt
  
|f − u|p = |f |p + |f − u|p < ε + εp V n (K) .
Ω Ω\K K

Bei Zugrundelegung des Lebesgue–Integrals ergibt sich die Dichtigkeit der Trep-
penfunktionen in Lp (Ω) nicht so leicht, wir verweisen auf § 20 : 8.4:

N
Sei u eine solche Treppenfunktion, u = ck χIk mit kompakten Quadern
k=1
Ik ⊂ Ω. Nach 3.1 (b) (ii) gibt es Testfunktionen ϕk,n ∈ C∞
c (Ω) mit

1
χIk − ϕk,n p < .
n

N
Aus der Dreiecksungleichung folgt für ϕn := ck ϕk,n ∈ C∞
c (Ω) :
k=1

N
1 N
u − ϕn p ≤ | ck | · χIk − ϕk,n p ≤ |ck | → 0 für n → ∞. 2
k=1 n k=1

Ê
(b) Zusatz. Sei u ∈ Lp ( n) eine Funktion mit u = 0 außerhalb von Ω. Dann
gilt für ur := jr ∗ u ∈ C∞
c (
n
) Ê
  
|ur |p ≤ |u|p und lim |u − ur |p = 0 .
r→0+
Ω Ω Ω

Beweis.
Wir zeigen zunächst, dass für x ∈ Ê n

 1/p
|ur (x)| ≤ jr (x − y) |u(y)|p dn y .
Ên
Für p = 1 folgt dies aus der Definition von ur . Für 1 < p < ∞ gibt es ein
q > 1 mit 1/p + 1/q = 1. Aus der Hölderschen Ungleichung § 8: 2.3 (b) ergibt
sich

|ur (x)| ≤ jr (x − y)1/q , jr (x − y)1/p |u(y)| dn y
Ên
 1/q  1/p
≤ jr (x − y)dn y jr (x − y) |u(y)|p dn y
Ên Ên
250 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen


= jr (x − y) · |u(y)|p dn y .
Ên
Mittels sukzessiver Integration und Vertauschung der Integrationsreihenfolge
(vgl. § 8 : 1.8) ergibt sich die Konvergenz des Integrals
    
(∗) |ur |p ≤ |u(y)|p jr (x − y) dn x dn y = |u(y)|p dn y .
Ω Ên Ên Ω

Zu gegebenem ε > 0 gibt es nach (a) ein ϕ ∈ C0c (Ω) mit u − ϕp < ε, und nach
3.2 gilt für ϕr := jr ∗ ϕ und genügend kleines r > 0
supp ϕr ⊂ Ω , ϕ − ϕr p < ε .
Aus (∗), angewandt auf u − ϕ, erhalten wir ur − ϕr p ≤ u − ϕp . Es folgt
u − ur p ≤ u − ϕp + ϕ − ϕr p + ϕr − ur p < 3ε für r  1. 2

Bemerkungen
(i) Für u ∈ Lp ( Ê ) folgt u − u 
n
r p → 0 für r → 0.
(ii) Der Zusatz wird für die Theorie der Sobolew–Räume benötigt.
(iii) Verschwindet u nicht ausserhalb von Ω, wird die Sache komplizierter, wie
der Beweis des folgenden Satzes zeigt.

3.4 Glättung lokalintegrierbarer Funktionen


Sei u : Ω → 
auf Ω im Lebesgueschen Sinn lokalintegrierbar und ur = jr ∗ u.
Dann gilt für jede kompakte Teilmenge A von Ω

lim |u − ur | = 0 .
r→0
A

Beweis.
(a) Sei r > 0 so klein gewählt, dass Ar = {x ∈ Ω | dist (x, A) ≤ r} ⊂ Ω. Für
beliebiges f ∈ L1loc (Ω) gilt nach 2.3 fr = jr ∗ f ⊂ C∞ (Ω) ⊂ L1loc (Ω), und mit
Hilfe von § 8: 1.8 erhalten wir
     
|fr | =  jr (x − y)f (y) dn y  dn x ≤ jr (x − y)|f (y)| dn y dn x
A A Ar A Ar
   
= |f (y)| jr (x − y) d x d y ≤
n n
|f (y)| dn y .
Ar A Ar

Wir schreiben dafür kurz fr 1,A ≤ f 1,Ar .

(b) Wir fixieren ein > 0 mit A ⊂ Ω. Da C0c (Ω) nach 3.3 dicht in L1 (Ω)
  finden wir zu gegebenem ε > 0 für u · A ∈ L (Ω) ein v ∈ Cc (Ω) mit
ist, χ 1 0

 u · χA − v  < ε. Daher gilt


Ω

u − v1,A ≤ u − v1,Ar < ε für r≤ .


3 Glättung von Funktionen 251

Nach (a) mit f := u − v erhalten wir für r <


ur − vr 1,A ≤ u − v1,Ar < ε .
Es folgt
u − ur 1,A ≤ u − v1,A + v − vr 1,A + vr − ur 1,A

< 2ε + v − vr 1,A .

Für genügend kleines r wird v − vr 1,A < ε nach 3.3, also |u − ur | < 3ε. 2
A

3.5 Zerlegungen der Eins


(auch Partitionen der Eins genannt) dienen als technisches Hilfsmittel zur Ein-
führung des Integrals auf Untermannigfaltigkeiten. Dazu benötigen wir das
Lemma. Zu jeder kompakten Teilmenge A einer offenen Menge Ω ⊂ n gibt es Ê
eine Funktion ϕ ∈ C∞
c (Ω) mit ϕ(x) = 1 auf A und 0 ≤ ϕ(x) ≤ 1 sonst.

Folgerung. Ist v messbar und u · v ∈ L1 (Ω) für alle u ∈ C0c (Ω), so gilt
v ∈ L1loc (Ω).

Beweis.
Ê
Wir wählen ein r > 0 mit A2r = {x ∈ n | dist (x, A) ≤ 2r} ⊂ Ω. Für
u = χAr betrachten wir ur := jr ∗ u ∈ C∞
c7 Ê
( n). Aus 2.3 (d) folgt mit Hilfe der
Dreiecksungleichung supp ur ⊂ (Ar )r = Kr (a) ⊂ A2r ⊂ Ω; weiter ist
a∈Ar
 
0 ≤ jr (x − y) dn y = ur (x) ≤ jr (x − y) dn y = 1 .
Ar Ω

Für x ∈ A ist jr (x − y) = 0 für y ∈ Ar , also ur (x) = jr (x − y) dn y = 1.
Ω
Die Folgerung ergibt sich aus der Tatsache, dass ur · v eine integrierbare Ma-
jorante für v · χA ist. 2

Ê
Satz. Sei K ⊂ n nichtleer und kompakt, und V1 , · · · , VN seien nichtleere
offene Mengen mit K ⊂ V1 ∪ · · · ∪ VN . Dann gibt es Funktionen ψk ∈ C∞
c (Vk )
mit 0 ≤ ψk ≤ 1 und

N
ψk (x) = 1 auf K .
k=1

Beweis.
(a) Wir konstruieren kompakte Mengen Ak ⊂ Vk mit K ⊂ A1 ∪ · · · ∪ AN : Zu
jedem x ∈ K gibt es ein Vk mit x ∈ Vk und ein r > 0 mit Kr (x) ⊂ Vk . Die zu-
gehörigen Ω(x) = Kr (x) bilden eine Überdeckung von K durch offene Mengen.
252 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

Nach dem Überdeckungssatz von Heine–Borel (Bd. 1, § 21 : 6.3) genügen endlich


viele davon, um K zu überdecken: K ⊂ Ω(x1 ) ∪ · · · ∪ Ω(xm ). Wir definieren Ak
als die Vereinigung aller Ω(xj ) mit Ω(xj ) ⊂ Vk .
(b) Nach dem vorangehenden Lemma gibt es Funktionen ϕk ∈ C∞ c (Vk ) mit
0 ≤ ϕk ≤ 1 und ϕk (x) = 1 auf Ak (k = 1, . . . , N ). Wir setzen

ψ1 := ϕ1 , ψ2 := ϕ2 (1 − ϕ1 ) , . . . , ψN := ϕN (1 − ϕ1 ) · · · (1 − ϕN−1 ).

Dann gilt 0 ≤ ψk ≤ 1 für k = 1, . . . , N und ψk ∈ C∞ ∞


c (Vk ) wegen ϕk ∈ Cc (Vk ).
Sei x ∈ K, also x ∈ Am für ein geeignetes m. Wir erhalten

ϕm (x) = 1 , ψm+1 (x) = . . . = ψN (x) = 0

und damit

n 
m
ψk (x) = ψk (x) = ϕ1 (x) + ϕ2 (x) (1 − ϕ1 (x))
k=1 k=1

+ ϕ3 (x) (1 − ϕ1 (x)) (1 − ϕ2 (x)) + . . .

+ 1 · (1 − ϕ1 (x)) · · · (1 − ϕm−1 (x)) .

Der Rest ergibt sich aus der Formel

a1 + a2 (1 − a1 ) + a3 (1 − a2 )(1 − a1 ) + . . . + (1 − a1 ) · · · (1 − am−1 ) = 1

( ÜA , Induktion). 2

4 Das Fundamentallemma der Variationsrechnung


4.1 Die klassische Version
Lemma von du Bois–Reymond. Eine stetige Funktion u : Ω → Ê auf einer
Ê
offenen Menge Ω ⊂ n verschwindet, wenn

u ϕ dn x = 0 für alle ϕ ∈ C∞
c (Ω).
Ω

Diese Aussage motiviert die Bezeichnung Testfunktion“. Einen Schluss die-



ser Art verwendete Lagrange 1755 ohne Begründung bei der Aufstellung der
Euler–Lagrange–Gleichungen der Variationsrechnung.
Beweis.
Angenommen u = 0 , o.B.d.A. u(a) > 0 für ein a ∈ Ω. Dann gibt es ein r > 0
mit Kr (a) ⊂ Ω und

u(x) ≥ := 1
2
u(a) > 0 für x − a ≤ r .
4 Das Fundamentallemma der Variationsrechnung 253

Dann ergibt sich mit ϕ(x) = jr (x − a) der Widerspruch


  
0 = u ϕ dn x = u ϕ dn x ≥ ϕ dn x = > 0. 2
Ω Kr (a) Kr (a)

4.2 Die allgemeine Version des Fundamentallemmas



Satz. Gilt u ∈ L1loc (Ω) und u ϕ = 0 für alle ϕ ∈ C∞
c (Ω), so ist u = 0 f.ü.
Ω

Dieser Satz ist grundlegend für die Theorie der Distributionen.

Beweis.
7

(a) Nach Bd. 1, § 23 : 4.6 gilt Ω = Ωk mit offenen Mengen Ω1 ⊂ Ω2 ⊂ . . . ,
k=1
wobei die Ωk kompakte Teilmengen von Ω sind. Wir zeigen in (c), dass u = 0
f.ü. in jedem Ωk , d.h. u = 0 in Ωk \ Nk mit einer Nullmenge Nk ⊂ Ωk . Daraus
7
∞ 7

folgt die Behauptung wegen Ω \ Nk ⊂ (Ωk \ Nk ), da eine abzählbare
k=1 k=1
Vereinigung von Nullmengen eine Nullmenge ist.
(b) Sei Ωk offen und Ωk eine kompakte Teilmenge
 von Ω. Für ϕ ∈ C∞c (Ωk )

und r  1 gilt ϕr = jr ∗ ϕ ∈ Cc (Ω) und somit u ϕr = 0 nach Voraussetzung.
 Ω
Setzen wir G(x) := jr (x − y) |ϕ(y)| dn y, so ist G stetig und hat für r  1
Ωk

einen kompakten Träger in Ω, also existiert |u| · G. Nach dem Satz von Fubini
Ω
folgt unter Beachtung von jr (x − y) = jr (y − x) mit ur = jr ∗ u
  
0 = u ϕr dn x = u(x) jr (x − y) ϕ(y) dn y dn x
Ω Ω Ωk
   
= ϕ(y) jr (y − x) u(x) dn x dn y = ϕ ur dn y .
Ωk Ω Ωk

Da ur stetig ist, folgt ur (x) = 0 in Ωk nach 4.1.


 
(c) Nach 3.4 gilt lim |u − ur | = 0 , also |u| = 0 und u = 0 f.ü. in Ωk
r→0
Ωk Ωk
nach § 8 : 1.5 (h). 2

Die Übertragung des Fundamentallemmas auf vektorwertige und komplexwer-


tige Funktionen bereitet keine Schwierigkeiten.
Weiter läßt sich durch geringfügige Modifikation der Beweise 4.1, 4.2 zeigen:

Satz. Gilt u ∈ L1loc (Ω) und uϕ ≥ 0 für alle ϕ ∈ C∞
c (Ω) mit ϕ ≥ 0 , so
Ω
ist u ≥ 0 f.ü.
254 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

4.3 Das Hilbertsche Lemma


Satz. Gilt für eine Funktion u ∈ L1loc (I) auf einem offenen Intervall I

uϕ = 0 für alle ϕ ∈ C∞
c (I),
I

so gibt es eine Konstante c mit u = c f.ü. .

Beweis.

Wir fixieren ein ϕ0 ∈ C∞
c (I) mit ϕ0 = 1 . Zu gegebener Testfunktion ϕ ∈
I
C∞
c (I) wählen wir ein die Träger von ϕ und ϕ0 enthaltendes Intervall [a, b] ⊂ I
und setzen
x 
ψ(x) := ( ϕ(t) − ( ϕ ) · ϕ0 (t) ) dt .
a I

Die Funktion ψ ist C∞ -differenzierbar auf Ê , ferner ist ψ(x) = 0 für x ≤ a,


und für x ≥ b gilt

x    
ψ(x) = (ϕ(t) − ( ϕ ) · ϕ0 (t) ) dt = ϕ− ( ϕ)· ( ϕ0 ) = 0 .
a I I I I

Somit hat ψ kompakten


 Träger in I, und nach Voraussetzung gilt mit der
Konstanten c := ϕ0 · u
I

    
0 = u · ψ = u · ϕ − ( ϕ ) · ϕ0 = (u − c) · ϕ .
I I I I

Da ϕ ∈ C∞ c (I) beliebig gewählt werden kann, folgt nach dem Fundamental-


lemma die Behauptung u − c = 0 f.ü. . 2

5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω)


5.1 Fortsetzung gleichmäßig stetiger Funktionen
(a) Satz. Sei f : V1 ⊃ D → V2 eine gleichmäßig stetige Abbildung von einer
Teilmenge D eines normierten Raums V1 in einen Banachraum V2 . Dann gibt
es genau eine stetige Fortetzung F : D → V2 von f . Diese ist gegeben durch

F (u) := lim f (un ) , falls u = lim un mit un ∈ D.


n→∞ n→∞

Die Fortsetzung F ist gleichmäßig stetig auf D.


5 Fortsetzung stetiger Funktionen, die Räume Ck (Ω) 255

Beweis.
Besitzt f eine Fortsetzung F ∈ C0 (D), so gilt notwendig F (u) = lim f (un ) für
n→∞
u ∈ D und jede Folge (un ) in D mit un → u. Also gibt es höchstens eine solche
Fortsetzung.
Konstruktion einer Fortsetzung. Wir fixieren ein u ∈ D und betrachten eine
Folge (un ) in D mit un → u. Sei ε > 0 gegeben. Nach Voraussetzung gibt es ein
δ > 0 mit

f (v) − f (w)2 < ε für alle v, w ∈ D mit v − w1 < δ .

Wählen wir nε so, dass um − un 1 < δ für m > n > nε , so folgt daraus
f (um ) − f (un )2 < ε . Also hat (f (un )) als Cauchyfolge einen Limes z ∈ V2 .
Für jede andere Folge (vn ) in D mit vn → u gilt f (vn ) − f (un )2 < ε, sobald
un − vn 1 < δ. Es folgt lim f (vn ) = lim f (un ). Wir definieren F (u) durch
n→∞ n→∞
diesen, von der approximierenden Folge unabhängigen Limes.
Für u ∈ D wählen wir die konstante Folge (u) und erhalten F (u) = f (u).
Gleichmäßige Stetigkeit von F . Sei ε > 0 vorgegeben und δ > 0 wie oben
gewählt. Zu u, v ∈ D mit u − v1 < δ seien (un ), (vn ) Folgen in D mit un → u,
vn → v. Für genügend großes n gilt un − vn 1 < δ, also f (un ) − f (vn )1 < ε.
Es folgt

F (u) − F (v)2 = lim f (un ) − f (vn )1 ≤ ε für u − v1 < δ . 2


n→∞

(b) Folgerung. Ist T : D → V2 ein linearer Operator auf einem dichten


Teilraum D von V1 mit

T u2 ≤ c u1 für alle u ∈ D,

so läßt sich T in eindeutiger Weise zu einem linearen Operator T : V1 → V2


fortsetzen. Für diesen gilt T u2 ≤ c u1 für alle u ∈ V1 .

Beweis.
T ist gleichmäßig stetig auf D wegen T u − T v2 = T (u − v)2 ≤ c u − v1
auf D. Nach (a) gibt es also eine eindeutig bestimmte stetige Fortsetzung T :
V1 = D → V2 . Nach Definition von T , nach den Rechenregeln für Grenzwerte
und wegen der Stetigkeit der Norm folgt ÜA

T ist linear und es gilt T u2 ≤ c u1 für alle u ∈ V1 . 2

5.2 Die Räume Ck (Ω)


Eine Funktion u : Ω → Ê Ê
auf einem Gebiet Ω des n heißt Ck –differenzier-
bar auf Ω ( u ∈ C (Ω) ), wenn u ∈ Ck (Ω) gilt und wenn sich die Funktionen
k
256 § 10 Glättung von Funktionen, Fortsetzung stetiger Funktionen

∂ α u für alle Multiindizes α mit |α| ≤ k zu stetigen Funktionen auf Ω fortsetzen


lassen, die wir wieder mit ∂ α u bezeichnen.
Hinreichend dafür, dass eine Funktion u ∈ Ck (Ω) auch zu Ck (Ω) gehört, ist
nach 5.1 die gleichmäßige Stetigkeit aller ∂α u mit |α| ≤ k auf Ω.
Ist Ω beschränkt, so ist diese Bedingung auch notwendig. Denn Ω ist kompakt,
und jede auf Ω stetige Funktion ist dort und damit erst recht auf Ω gleichmäßig
stetig (Bd. 1, § 21 : 8.4).

Bemerkungen, Beispiele
(a) Für offene Intervalle Ω = ]a, b[ stimmt Ck (Ω), wie oben definiert, mit
Ck [a, b] mit der bisher gebräuchlichen überein. Dies ergibt sich aus dem Mittel-
wertsatz ÜA .

(b) Sei Ω = ]a, b[, f ∈ C2 (Ω) und |f  (x)|2 ≤ C für alle [α, β] ⊂ ]a, b[. Dann
α
gilt f ∈ C2 (Ω) ( ÜA . Zeigen Sie zunächst, dass f  gleichmäßig stetig ist.)
Ê
(c) Für ein sternförmiges Gebiet Ω ⊂ n und u ∈ C2 (Ω) seien alle zweiten
Ableitungen ∂i ∂k u beschränkt in Ω. Dann gilt u ∈ C1 (Ω) ÜA .

5.3 Der Satz von Tietze–Uryson


Ê
Jede auf einer kompakten Menge K eines Gebiets Ω ⊂ n stetige Funktion f
läßt sich zu einer Funktion F ∈ C0c (Ω) unter Erhaltung der Norm fortsetzen,
F Ω = f K ,
zu lesen als
sup {|F (x)| | x ∈ Ω } = max {|f (x)| | x ∈ K } .

Für den Beweis verweisen wir auf Cigler–Reichel [143] 4.8, 3.2, Dugundji
[144] VII. 4
257

§ 11 Gaußscher Integralsatz und Greensche Formeln

Der Integralsatz von Gauß und die aus diesem folgenden Greenschen Integral-
formeln sind ein fundamentales Hilfsmittel für die Behandlung partieller Diffe-
rentialgleichungen.
Eine Formulierung des Gaußschen Integralsatzes für Gaußsche Gebiete des 3 Ê
wurde in Bd. 1, § 26 gegeben. Für eine Verallgemeinerung auf höhere Dimensio-
nen und für die wünschenswerte Einbeziehung allgemeinerer Ränder ∂Ω müssen
Ê
wir vom Integral über Flächenstücke des 3 zur Integration auf Untermannigfal-
Ê
tigkeiten des n übergehen. Dies erfordert zwar einige begriffliche Vorbereitun-
gen, doch tritt der Begriff der Untermannigfaltigkeit ohnehin in vielen physika-
lischen Kontexten auf und wurde auch im vorangehenden mehrfach angespro-
chen. An Vorkenntnissen werden das (Lebesgue) Integral stetiger Funktionen
über kompakte Mengen (§ 8 : 1) und die Zerlegung der Eins (§ 10 : 3) benötigt.

1 Untermannigfaltigkeiten des Ê n

1.1 Definitionen und Beispiele


Ê Ê
In Bd. 1, § 25 wurden ein Kurvenstück im n, bzw. ein Flächenstück im 3 als
Bildmenge einer einzigen regulären und stetig invertierbaren C1 –Parametrisie-
rung definiert. Dies hat den Nachteil, dass geschlossene“ Flächen wie z.B. die
Ê ”
Einheitssphäre des 3 nicht erfasst wurden. Die Einheitssphäre wird durch eine
Gleichung x = 1 beschrieben und ist eine Lösungsmannigfaltigkeit im Sinne
2

von Bd. 1, § 22 : 5. Wir erinnern daran, dass eine Lösungsmannigfaltigkeit nach


dem Satz über implizite Funktionen lokale Parametrisierungen besitzt, dass aber
in den meisten Fällen eine einzige Parametrisierung nicht ausreicht.
Ê
Wir definieren jetzt m–dimensionale Untermannigfaltigkeiten des n zunächst
lokal als Nullstellenmengen von Cr –Funktionen, rechtfertigen dann die Bezeich-
nung m–dimensional“ und zeigen schließlich mit Hilfe des Satzes über implizite

Funktionen, dass Untermannigfaltigkeiten lokale Cr –Parametrisierungen besit-
zen, die durch Parametertransformationen miteinander verbunden sind.

Ê
Definition. Eine nichtleere Menge M ⊂ n heißt m–dimensionale Cr –
Untermannigfaltigkeit (1 ≤ m < n, 1 ≤ r ≤ ∞), wenn es zu jedem Punkt
Ê
a ∈ M eine Umgebung V und eine Cr –Abbildung f : V → n−m gibt, so dass
(a) M ∩ V = { x ∈ V | f (x) = 0 } und
(b) Rang f  (x) = n − m für alle x ∈ V .
Meist spezifizieren wir die Differenzierbarkeitsstufe r ≥ 1 nicht und sprechen
von m–dimensionalen Untermannigfaltigkeiten.
(n − 1)–dimensionale Untermannigfaltigkeiten werden auch Hyperflächen ge-
nannt.
258 § 11 Gaußscher Integralsatz und Greensche Formeln

Beispiele. (i) In 1.2 (c) zeigen wir, dass Flächenstücke im Ê 3


zweidimensio-
nale Untermannigfaltigkeiten sind.
Ê
(ii) Sr (a) := {x ∈ 3 | x = r} ist eine zweidimensionale Untermannigfal-
Ê
tigkeit des 3, aber kein Flächenstück, wie wir in 1.4 (b) zeigen werden.
(iii) Eindimensionale Untermannigfaltigkeiten stellen eine Erweiterung des Be-
griffs Spur einer Cr –Kurve“ dar; sie lassen sich lokal durch Parametrisierungen

t → x(t) darstellen. Definitionsgemäß sind auch folgende Gebilde eindimensio-
Ê
nale Untermannigfaltigkeiten des 2: Die Vereinigung endlich vieler sich nicht
schneidender Kreislinien, ein Rechtecksrand ohne die Eckpunkte, die Hyperbel
x2 − y 2 = 1 mitsamt der Asymptoten y = x sowie jede Schar äquidistanter
paralleler Geraden.
(iv) Die Oberfläche eines Würfels ohne die Kanten ist eine zweidimensionale
Untermannigfaltigkeit des 3 . Ê
1.2 Charakterisierungen m–dimensionaler Untermannigfaltigkeiten
(a) Eine m–dimensionale Cr –Untermannigfaltigkeit M läßt sich lokal auf Cr –
differenzierbare Weise zu einem m–dimensionalen Ebenenstück E verbiegen:
Zu jedem Punkt a ∈ M gibt es Umgebungen V von a, W von 0, sowie einen
Cr –Diffeomorphismus F : V → W mit F(a) = 0 und

F(V ∩ M ) = {y = (y1 , . . . , yn ) ∈ W | ym+1 = . . . = yn = 0} =: E .

Beweis.

Nach der Definition 1.1 gibt es eine


M
6Ê n−m

Umgebung V von a und eine Cr –Ab- V W


bildung F
a −→ -
f = (fm+1 , . . . , fn ) : V → Ê n−m E Êm

mit Rang f  (x) = n − m in V und

M ∩ V = {x ∈ V | f (x) = 0} .

Ê Ê
Wir schreiben x = (y, z) mit y ∈ m , z ∈ n−m und entsprechend a = (b, c).
Nach geeigneter Umnumerierung der Koordinaten dürfen wir annehmen, dass
 ∂f 
i
d(y, z) := det (y, z) = 0
∂zk

für (y, z) ∈ V , wobei m + 1 ≤ i, k ≤ n. Weiter setzen wir

F(y, z) := (y − b, f (y, z)) .


1 Untermannigfaltigkeiten des Ê n
259

F ist Cr –differenzierbar auf V , und es gilt

F(y, z) = (y − b, 0) ∈ E für (y, z) ∈ V ∩ M,

insbesondere

F(b, c) = 0 ,

ferner det F (y, z) = d(y, z) = 0 ( ÜA , vgl. Bd. 1, § 22 : 5.7 (c)).


Nach dem lokalen Umkehrsatz Bd. 1, § 22 : 5.2 ist F nach passender Einschrän-
kung ein Diffeomorphismus zwischen einer Umgebung V von a und einer Um-
gebung W von 0. 2

(b) Parametrisierungen einer Untermannigfaltigkeit. Zu jedem Punkt


a einer m–dimensionalen Cr –Untermannigfaltigkeit M gibt es eine Umgebung
Ê Ê
V ⊂ n, ein Gebiet U ⊂ m und eine Cr –Abbildung Φ : U → M mit
(i) Φ(U) = V ∩ M ,
(ii) Φ (u) hat für jedes u ∈ U den Maximalrang m,
(iii) Die Umkehrabbildung Φ−1 : V ∩ M → U existiert und ist stetig.
Jede solche Abbildung Φ heißt eine Parametrisierung von M und die Bild-
menge V ∩ M eine Parameterumgebung von a.
Die Umkehrabbildung Φ−1 : V ∩ M → U nennen wir (in Anlehnung an die
Geographie) eine Karte für M .

Beweis.
Es gibt nach (a) einen Diffeomorphismus F : V → W einer Umgebung V von a
auf eine Umgebung W von 0 mit F(a) = 0 und

F(V ∩ M ) = {y ∈ W | ym+1 = . . . = yn = 0} .

Ê
Wir setzen U := {u ∈ m | (u, 0) ∈ W}. Dass U eine offene Teilmenge des m Ê
ist, folgt aus der Offenheit von W. Wegen der Stetigkeit der Projektion P :
W → U, (y1 , . . . , yn ) → (y1 , . . . , ym ) ist U = P(W) zusammenhängend.
Wir definieren

Φ:U→ Ê n
, u → F−1 (u, 0) .

Dann gilt Φ = F−1 ◦ E mit der Einbettung“ E : U → W, u → (u, 0). Aus der

C∞ –Differenzierbarkeit von E und der Cr –Differenzierbarkeit von F−1 folgt die
r
C –Differenzierbarkeit von Φ, und es gilt nach der Kettenregel

Φ (u) = (F−1 ) (u, 0) · E (u) .


260 § 11 Gaußscher Integralsatz und Greensche Formeln

Aus Rang E (u) = m folgt Rang Φ (u) = m, da die Jacobi–Matrix (F−1 ) (u, 0)
invertierbar ist.
Schließlich ist Φ : U → V ∩ M bijektiv, und die Umkehrabbildung Φ−1 = P ◦ F
(P wie oben) ist stetig. 2

(c) Satz. Für eine nichtleere Teilmenge M des Ê n


sind folgende Eigenschaften
äquivalent:
(i) M ist eine m–dimensionale Cr –Untermannigfaltigkeit.
(ii) M läßt sich im Sinne von (a) lokal zu m–dimensionalen Ebenenstücken
geradebiegen.
(iii) Zu jedem Punkt von M gibt es eine Umgebung V, so dass M ∩ V Bildmenge
Ê
einer Cr –Parametrisierung Φ : m ⊃ U → M ist.

Beweis.
Es wurde bereits (i) =⇒ (ii) =⇒ (iii) gezeigt.
Wir zeigen (iii) =⇒ (i):
Ê
Sei V eine Umgebung von a ∈ M , U ein Gebiet des m und Φ : U → V∩M eine
Cr –Parametrisierung mit stetiger Umkehrung Φ−1 : V ∩ M → U. Schließlich sei
Φ(u0 ) = a und Rang Φ (u) = m für alle u ∈ U. O.B.d.A. dürfen wir annehmen,
dass die ersten m Zeilen von Φ linear unabhängig sind.
Ê Ê
Die Aufspaltung x = (y, z) mit y ∈ m, z ∈ n−m führt zu Aufspaltungen a =
(b, c) und Φ(u) = (ϕ(u), ψ(u)) mit det ϕ (u) = 0 in U und ϕ(u0 ) = b. Nach
dem lokalen Umkehrsatz ist ϕ ein Cr –Diffeomorphismus zwischen geeigneten
Umgebungen U 0 ⊂ U von u0 und V1 := ϕ(U 0 ) von b. Wegen der Stetigkeit von
Φ auf U und von Φ−1 auf V ∩ M gibt es eine Umgebung V von a mit
x = (y, z) ∈ V ∩ M ⇐⇒ Φ−1 (x) ∈ U0
⇐⇒ x = Φ(u) mit u ∈ U0 .
Es folgt
(y, z) ∈ V ∩ M ⇐⇒ y = ϕ(u) , z = ψ(u) mit u ∈ U0
⇐⇒ z = ψ(ϕ−1 (y)) mit y ∈ V1 .
Setzen wir
f (y, z) := z − ψ(ϕ−1 (y)) ,
so gilt
dz f (y, z) = En−m , also Rang f  (x) = n − m
für x = (y, z) ∈ V1 × Ê n−m
.
Ferner ist M ∩ V = {x ∈ V | f (x) = 0}. 2
1 Untermannigfaltigkeiten des Ê n
261

1.3 Parametertransformationen
Zu je zwei Parametrisierungen
Φ1 : U 1 → M , Φ2 : U 2 → M M
einer m–dimensionalen Cr –Unterman-
Ê
nigfaltigkeit M des n , deren Bildmen-
D
gen nichtleeren Durchschnitt D haben,
ist
h := Φ−1
2 ◦ Φ1

ein Cr –Diffeomorphismus zwischen Φ1 Φ2


den offenen Mengen W1 = Φ−11 (D),
W2 = Φ−1 (D). h
2 U1 W1 W2 U2
h heißt Parameter– oder Koordina-
tentransformation.
Beweis.
Nach Definition einer Parametrisierung gibt es Gebiete V1 , V 2 ⊂ Ên
mit der
Eigenschaft Φ(Uk ) = V k ∩ M (k = 1, 2), also D = V1 ∩ V 2 ∩ M .
(a) Die Wk sind offen als Urbilder der offenen Menge V 1 ∩V 2 unter den stetigen,
auf den offenen Mengen U k definierten Abbildungen Φk (k = 1, 2). Nach 1.2 (b)
ist h := Φ−1
2 ◦ Φ1 : W1 → W2 bijektiv und mitsamt h
−1
stetig. Zu zeigen bleibt

die C –Differenzierbarkeit von h sowie det h (u) = 0 für u ∈ W1 .
r

(b) Wir fixieren einen Punkt u ∈ W1 und setzen a := Φ1 (u). Nach 1.2 (a) gibt
es Umgebungen, V von a, W von 0 und einen Cr –Diffeomorphismus F : V → W
mit F(a) = 0 und

F(V ∩ M ) ⊂ Span {e1 , . . . , em } =: E .

Dabei dürfen wir V ⊂ V 1 ∩ V 2 annehmen. Wie oben ergibt sich, dass Wk :=
Φ−1
k (V ∩ M ) jeweils eine offene Teilmenge von Wk ist. Nach Wahl von F gilt

F ◦ Φ1 = (ϕ1 , . . . , ϕm , 0, . . . , 0) = (ϕ, 0) auf W1 ,

F ◦ Φ2 = (ψ1 , . . . , ψm , 0, . . . , 0) = (ψ, 0) auf W2

mit ϕk ∈ Cr (W1 ), ψk ∈ Cr (W2 ) sowie

ϕ(W1 ) = ψ(W2 ) = {y ∈ Ê m
| (y, 0) ∈ W} =: Em .

Wegen der Stetigkeit von Φ−1


k ist Em eine offene Teilmenge des m ÜA . Ê
Aus Rang Φk = m und der Invertierbarkeit von F folgt nach der Kettenregel


Rang ϕ = Rang ψ  = m. Wegen der Bijektivität der Abbildungen

ϕ : W1 → Em , ψ : W2 → Em
262 § 11 Gaußscher Integralsatz und Greensche Formeln

sind diese Diffeomorphismen. Die Einschränkung von h auf die Umgebung W1
von u ist
Φ−1 −1
2 ◦ Φ1 = Φ2 ◦ F
−1
◦ F ◦ Φ1 = (F ◦ Φ2 )−1 ◦ (F ◦ Φ1 ) = ψ −1 ◦ ϕ ,
also Cr –differenzierbar mit det h = det ϕ /(det ψ  ) ◦ ϕ = 0. 2

1.4 Atlanten
(a) Für jede Untermannigfaltigkeit M gibt es eine Überdeckung durch höchstens
abzählbar viele Parameterumgebungen M ∩ V i = Φi (U i ).
Die Kollektion der zugehörigen Karten heißt ein Atlas für M .
Im Fall V i ∩ V k ∩ M = ∅ sind Φi und Φk im Sinn von 1.3 durch Parameter-
transformationen verbunden.
Ê
(b) Ist M kompakt, wie z.B. eine r–Sphäre im n oder ein Torus im 3, so Ê
besitzt M einen Atlas mit endlich vielen Karten, aber keinen Atlas mit nur einer
Karte.
(c) Ist M nicht kompakt, so kann die Überdeckung in (a) so gewählt werden,
dass V i ∩ M jeweils kompakte Teilmengen von M sind und jede kompakte Teil-
menge von M durch endlich viele von ihnen überdeckt wird .

Beweis.
(a) Nach 1.2 (a) gibt es zu jedem a ∈ M eine Umgebung V und einen Diffeo-
morphismus F : V → W auf eine Nullumgebung W mit
F(V ∩ M ) = Span {e1 , . . . , em } ∩ W =: Em .
Setzen wir
U := {u ∈ Ê m
| (u, 0) ∈ Em } und Φ(u) := F−1 (u, 0) ,
so erhalten wir nach 1.2 (b) eine Parametrisierung Φ : U → V ∩ M .
Im Hinblick auf (c) wählen wir eine Umgebung V a von a so, dass Va eine
kompakte Teilmenge von V ist. Dann ist F(V a ∩ M ) = Span {e1 , . . . , em } ∩
F(V a ) kompakt, also ist auch die Bildmenge Va ∩ M unter F−1 kompakt. Nach
Einschränkung von Φ auf U a := F(Va ∩M ) erhalten wir eine Parametrisierung
Φa : U a → V a ∩ M .
7
Für Ω := V a gibt es nach Bd. 1, § 23 : 4.6 eine ausschöpfende Folge offener
a∈M
Mengen
2

Ω1 ⊂ Ω2 ⊂ . . . mit Ω = Ωk
k=1
so, dass die Ωk kompakte Teilmengen von Ω sind und jede kompakte Teilmenge
von Ω in einer der Mengen Ωk liegt. Nach dem Überdeckungssatz von Heine–
1 Untermannigfaltigkeiten des Ê n
263

Borel (Bd. 1, § 21 : 6.3) genügen jeweils endlich viele V a , um ein einzelnes Ωk


zu überdecken. Deren Zusammenfassung liefert eine abzählbare Kollektion M
überdeckender Parameterumgebungen.
(b) Der erste Teil folgt wie oben aus dem Überdeckungssatz von Heine–Borel.
Wäre die kompakte Mannigfaltigkeit M durch eine einzige Parametrisierung
Φ : U → M beschrieben, so wäre U = Φ−1 (M ) als stetiges Bild einer kompakten
Menge kompakt, andererseits aber offen, was nicht sein kann. 2

Folgerung. Jede Untermannigfaltigkeit des Ê n


ist eine V n –Nullmenge.
Da jede abzählbare Vereinigung von Nullmengen wieder eine Nullmenge ist,
muss nach dem Beweis (a) nur folgendes gezeigt werden: Ist V Umgebung eines
Flächenpunktes, und gibt es einen Diffeomorphismus
F : V → W mit F(V ∩ M ) =: Em ⊂ Span {e1 , . . . , em },
so ist V ∩ M eine V n –Nullmenge. Da Em eine V n –Nullmenge ist, ergibt sich
dies aus dem folgenden
Satz. Ist ϕ : Ω → Ω ein Diffeomorphismus und N ⊂ Ω eine Nullmenge, so
ist auch ϕ(N ) eine Nullmenge.
Denn aus dem Transformationssatz § 8 : 1.9 ergibt sich
  
V n (ϕ(N )) = χϕ(N) = (χϕ(N) ◦ ϕ) | det ϕ | = χN | det ϕ | = 0 .
Ω Ω Ω

1.5 Orientierbarkeit und Orientierung


(a) Zwei Parametrisierungen Φ1 : U 1 → M ∩ V 1 , Φ2 : U2 → M ∩ V 2 ei-
ner Untermannigfaltigkeit M mit D := M ∩ V1 ∩ V 2 = ∅ heißen gleich
orientiert, wenn sie durch eine Parametertransformation h mit det h > 0
verbunden sind, d.h. wenn h := Φ−1 −1 −1
2 ◦ Φ1 : Φ1 (V 1 ∩ V 2 ) → Φ2 (V 1 ∩ V 2 )

ein orientierungstreuer Diffeomorphismus ist. Im Fall det h < 0 heißen sie ent-
gegengesetzt orientiert.
(b) Eine Untermannigfaltigkeit heißt orientierbar, wenn es einen Atlas gibt,
bei dem je zwei überlappende Parametrisierungen gleich orientiert sind. Über-
lappende Parametrisierungen Φ eines Atlasses und Ψ eines anderen Atlasses
einer orientierbaren Mannigfaltigkeit M sind entweder immer gleich oder im-
mer entgegengesetzt orientiert ÜA . Die orientierenden Atlanten zerfallen somit
in zwei Klassen. Eine Orientierung von M besteht in der Auszeichnung einer
dieser Klassen.
(c) Wird eine m–dimensionale Untermannigfaltigkeit durch eine einzige Karte
Ê
beschrieben, wie dies bei Flächenstücken im 3 der Fall ist, so ist sie offenbar
orientierbar, vgl. Bd. 1, § 25 : 3.3. Andererseits gibt es zweidimensionale Unter-
Ê
mannigfaltigkeiten des 3 , die nicht orientierbar sind, etwa das Möbiusband
(Barner–Flohr [141, II] 17.5).
264 § 11 Gaußscher Integralsatz und Greensche Formeln

1.6 Tangentialräume
Ê
Sei M eine m–dimensionale Untermannigfaltigkeit des n. Ein Vektor v ∈ n Ê
heißt Tangentenvektor von M im Punkt a ∈ M , wenn es eine C1 –Kurve
α : ]−ε, ε[ → M gibt mit

α(0) = a , α̇(0) = v .

Für eine Parametrisierung  Φ : U → V ∩ M mit Φ(u) = a ∈ V ∩ M ist


∂k Φ(u) = dtd
Φ(u + tek )t=0 ein Tangentenvektor. Wegen Rang Φ (u) = m
sind v1 = ∂1 Φ(u), . . . , vm = ∂m Φ(u) linear unabhängige Tangentenvektoren.

Satz. (a) Die Menge aller Tangentenvektoren von M im Punkt a ∈ M bildet


einen m–dimensionalen Vektorraum, den Tangentialraum Ta M . Es gilt

(a) Ta M = Span {∂1 Φ(u), . . . , ∂m Φ(u)} = Bild Φ (u)

für jede Parametrisierung Φ mit Φ(u) = a und

(b) Ta M = Kern f  (a) bzw. Ta M ⊥ = Span {∇fm+1 (a), . . . , ∇fn (a)}

für jede C1 –Abbildung f = (fm+1 , . . . , fn ), die M in einer Umgebung von a als


Nullstellenmenge beschreibt, vgl. 1.1.

Beweis.
Wir zeigen zunächst Bild Φ (u) ⊂ Ta M ⊂ Kern f  (a) und anschließend die
Gleichheit der drei Mengen.
(i) Für v = Φ (u)w ∈ Bild Φ (u) ist t → α(t) := Φ(u + tw) eine Kurve in
M mit α̇(0) = Φ (u)w = v, somit gilt v ∈ Ta M .
(ii) Sei v ∈ Ta M , also v = α̇(0) für eine Kurve α auf M mit α(0) = a. Dann
gilt f (α(t)) = 0 für |t|  1. Daraus folgt f  (a)v = dt
d
f (α(t))t=0 = 0, also
v ∈ Kern f  (a).
(iii) Aus f ◦ Φ = 0 folgt nach der Kettenregel f  (a) · Φ (u) = 0. Also ist
Bild Φ (u) = Span {∂1 Φ(u), . . . , ∂m Φ(u)} ein m–dimensionaler Teilraum von
Kern f  (a). Wegen Rang f  (a) = n − m hat Kern f  (a) die Dimension m,
hieraus ergibt sich die Gleichheit der Teilräume Bild Φ (u) und Kern f  (a). 2

1.7 Differenzierbare Funktionen auf Untermannigfaltigkeiten


Nach 1.2 (b) ist eine Funktion f : M → Ê
genau dann stetig (f ∈ C0 (M )),
wenn f ◦ Φ für jede Parametrisierung Φ von M stetig ist. Eine Funktion
f : M → Ê Ê
auf einer Cr –Untermannigfaltigkeit M ⊂ n heißt entsprechend
Ck –differenzierbar (f ∈ Ck (M ), 0 ≤ k ≤ r) wenn f ◦ Φ für jede Cr –
Parametrisierung Φ von M Ck –differenzierbar ist. Hierfür genügt es nach
1 Untermannigfaltigkeiten des Ê n
265

1.2 (c) und 1.3 bereits, dass es zu jedem Punkt a ∈ M wenigstens eine Ck –
Parametrisierung einer Flächenumgebung V ∩ M von a gibt, so dass f ◦ Φ
Ck –differenzierbar ist.
Ê
Ein Vektorfeld v : M → n heißt Ck –differenzierbar oder ein Ck –Vektorfeld
auf M , wenn die einzelnen Komponenten v1 , . . . , vn Ck –differenzierbar sind.

1.8 Die Gramsche Matrix


Für eine Parametrisierung Φ einer m–dimensionalen Untermannigfaltigkeit
Ê
M ⊂ n hat die Gramsche Matrix
G(u) := Φ (u)T Φ (u)
die Koeffizienten
gik (u) = ∂i Φ(u) , ∂k Φ(u) .
Bei einer Umparametrisierung Φ = Ψ ◦ h ergibt die Kettenregel
Φ (u) = Ψ (h(u)) h (u) .
Bezeichnen wir die n × m–Matrix Ψ (h(u)) mit A, so gilt ∂i Φ(u) = A ∂i h(u),
also
G(u) = (Ah (u))T (Ah (u)) = h (u)T ATAh (u) .
Dabei ist AT A = H(h(u)) mit der Gramschen Matrix H(v) := Ψ (v)T Ψ (v)
von Ψ.
Für die Gramsche Determinante g(u) := det(gik (u)) = det G(u) gilt daher

g(u) = det H(h(u)) (det h (u))2 .


Die Gramsche Matrix wird bei der Darstellung der Kurvenlänge benötigt: Ist
α : [a, b] → M eine Kurve auf M , die bezüglich einer Parametrisierung Φ der
Untermannigfaltigkeit M die Koordinatendarstellung α = Φ ◦ γ mit einer C1 –
Kurve γ : [a, b] → U im Parametergebiet U besitzt, so gilt nach Bd. 1, § 24 : 2.1
ÜA
b 9

n
Lba (α) = gik (γ(t))γ̇ i (t)γ̇ k (t) dt .
i,k=1
a

Beispiel. Für die Parametrisierung Φ(u) = (u, ϕ(u)) einer Fläche M als
Graph einer C1 –Funktion ϕ : m ⊃ Ω →Ê Ê
ergibt sich als Gramsche Deter-
minante
g(u) = 1 + ∇ϕ(u)2 .
Zum Nachweis setzen wir a = (a1 , . . . , am ) := ∇ϕ(u) , A := a · aT = (ai ak ) .
266 § 11 Gaußscher Integralsatz und Greensche Formeln

Die Gramsche Matrix schreibt sich dann


G(u) = (gik (u)) = ( δik + ai ak ) = E + A .
Im Fall a = 0 gibt es nichts zu beweisen; sei also a = 0. Nach Bd. 1, § 18 : 3.4 ist
g(u) = det G(u) das Produkt der Eigenwerte (mit Vielfachheit) von G(u). Diese
sind von der Form 1 + λ, wobei λ ein Eigenwert von A ist. Aus der Gleichung
Ay = a · aT y = a , y a lesen wir ab, dass alle zu a orthogonalen Vektoren
zu Kern A gehören und dass Aa = a2 a gilt. Die Matrix A hat also den
(m − 1)–fachen Eigenwert 0 und den einfachen Eigenwert λ = a2 . Das liefert
die Behauptung g(u) = (1 + 0)m−1 (1 + a2 ) = 1 + a2 = 1 + ∇ϕ(u)2 .

2 Integration auf Untermannigfaltigkeiten


2.1 Konstruktion des Integrals
Für eine stetige Funktion f : M → Ê
auf einer m–dimensionalen
 Unterman-
Ê
nigfaltigkeit M des n definieren wir das Integral f do über kompakte Teil-
K
mengen K von M in zwei Schritten:
(a) Liegt K in einer Parameterumgebung, d.h. in der Bildmenge einer Para-
Ê
metrisierung Φ : m ⊃ U → M ∩ V, so setzen wir
   √
f do := f (Φ(u)) g(u) dm u , kurz (f ◦ Φ) g dm u
K Φ−1 (K) Φ−1 (K)
mit der in 1.6 eingeführten Gramschen Matrix g(u). Die Unabhängigkeit der
rechten Seite von der Parametrisierung ergibt sich aus 1.8 mit Hilfe des Trans-
formationssatzes für Integrale ÜA .
(b) Für eine beliebige kompakte Teilmenge K von M gibt es nach 1.4 (b) end-
lich viele Parameterumgebungen V k ∩ M und zugehörige Parametrisierungen
7
Ê
p
Φk : m
⊃ U k → V k ∩ M , so dass K ⊂ V k . Nach § 10: 3.5 gibt es ei-
k=1
ne zugehörige Zerlegung der Eins durch Testfunktionen ϕk ∈ C∞
c (Vk ) mit

p
0 ≤ ϕk ≤ 1 und ϕk = 1 auf K. Wir setzen Ak := K ∩ supp ϕk und
k=1
definieren
 
p 
f do := f ϕk do ,
K k=1 Ak

wobei die rechts auftretenden Integrale im Sinne von (a) zu verstehen sind.
Dass sich für jede Überdeckung von K und jede Zerlegung der Eins derselbe
Wert ergibt, sehen wir wie folgt ein:
Sei K ⊂ W 1 ∪ · · · ∪ W q , wobei W l ∩ M jeweils die Bildmenge einer geeigneten
Parametrisierung Ψl von M ist. Ferner seien ψl ∈ C∞ c (W l ) Testfunktionen mit

q
0 ≤ ψl ≤ 1 und ψl = 1 auf K. Mit Bl := K ∩ supp ψl ergibt sich
l=1
2 Integration auf Untermannigfaltigkeiten 267


p  p   
 q  q 
p 
f ϕk do = f ϕk ψl do = f ϕk ψl do
k=1 Ak k=1 Ak l=1 k=1 l=1 Bl
q   
 p q 

= f ψl ϕk do = f ψl do .
l=1 Bl k=1 l=1 Bl


(c) Das Integral f do über eine Untermannigfaltigkeit M .
M
Ist M kompakt oder wird  M durch endlich viele Parameterumgebungen über-
deckt, so definieren wir f do gemäß (b).
M
Andernfalls können wir nach 1.4 (c) abzählbar viele kompakte Mengen Ki ⊂ M
7

so wählen, dass M = Ki und dass jede kompakte Teilmenge von M durch
i=1 7
k
endlich viele von diesen überdeckt wird. Die kompakten Mengen Ck := Ki
i=1
haben dieselbe Eigenschaft, zusätzlich gilt C1 ⊂ C2 ⊂ . . . .
Eine stetige Funktion
 f :M → Ê
heißt über M integrierbar, falls die Folge
der Integrale |f | do beschränkt ist. In diesem Fall definieren wir
Ck
 
f do := lim f do .
k→∞
M Ck

Die Unabhängigkeit dieser Integrale von der Wahl der ausschöpfenden Folge
(Ck ) ergibt sich wie im Beweis des Ausschöpfungssatzes Bd. 1, § 23 : 4.6,4.7.
(d) Der m–dimensionale Inhalt einer kompakten Teilmenge K von M ist
definiert durch

Am (K) := 1 do .
K

Ferner setzen wir



Am (M ) := 1 do = sup {Am (K) | K ist kompakte Teilmenge von M } ,
M


falls 1 do existiert; andernfalls sei Am (M ) := ∞.
M

Bemerkungen. (i) Da in (a) beliebige kompakte Teilmengen Φ−1 (K) als In-
tegrationsgebiete zugelassen sind, ist der Lebesguesche Integralbegriff zugrunde
zu legen.
(ii) Läßt sich M durch eine einzige Parametrisierung beschreiben, so ergibt sich
im Fall m = 1 wieder das skalare Kurvenintegral, im Fall m = 2, n = 3 das
skalare Oberflächenintegral, vgl. Bd. 1, § 24 : 3.1 und § 25 : 3.1.
268 § 11 Gaußscher Integralsatz und Greensche Formeln

2.2 Eigenschaften des Integrals über Untermannigfaltigkeiten


(a) Die Linearität und die Monotonie des Integrals ergeben sich direkt aus
der Definition. Die Integrierbarkeit von f ∈ C0 (M ) über M ist äquivalent zur
Existenz einer integrierbaren Majorante g. Es gilt dann
  
 f do  ≤ g do .
M M

(b) Für kompakte Mengen K ⊂ M und f ∈ C0 (M ) gilt die Integralabschätzung


 
 f do  ≤ max {|f (x)| | x ∈ K} · Am (K) .
K

(c) Unter den folgenden Voraussetzungen ist die Bestimmung des Integrals über
eine kompakte Menge K ohne Heranziehung von Zerlegungen der Eins möglich:
Sei K darstellbar als Vereinigung K = K1 ∪ · · · ∪ KN , wobei jede der kompakten
Mengen Ki in einer Parameterumgebung Φi (Ui ) = V i ∩ M liegt, und für i = j
seien die Mengen Φ−1 −1
i (Ki ∩ Kj ), Φj (Ki ∩ Kj ) Nullmengen im
m
Ê
. Dann gilt

 N 

f do = f do ,
K i=1 Ki

wobei sich jedes der Integrale auf der rechten Seite nach (a) ergibt.

Beweis.
Das Majorantenkriterium und die Integralabschätzung ergeben sich aus der De-
finition des Integrals ÜA .
(c) Einfachheitshalber betrechten wir nur den Fall N = 2. Nach 2.1 (b) gibt es
Funktionen ϕ1 ∈ C∞ ∞
c (V1 ), ϕ2 ∈ Cc (V 2 ) mit 0 ≤ ϕ1 , ϕ2 ≤ 1 und ϕ1 +ϕ2 = 1 auf
K. Für Ai := supp ϕi ⊂ Vi gilt Φ−1 −1 −1
i (Ai ∩ K1 ) ∪ Φi (Ai ∩ K2 ) = Φi (Ai ∩ K)
−1
und Ai ∩ K1 ∩ K2 ⊂ K1 ∩ K2 . Also sind Φi (Ai ∩ K1 ∩ K2 ) für i = 1, 2
Ê
Nullmengen im m , und nach Definition des Integrals in 2.1 gilt
  
f do = f ϕ1 do + f ϕ2 do
K A1 A2
 
= f ϕ1 do + f ϕ1 do
A1 ∩K1 A1 ∩K2
 
+ f ϕ2 do + f ϕ2 do .
A2 ∩K1 A2 ∩K2

Wegen ϕ1 + ϕ2 = 1 auf jeder der Mengen Ki gilt dabei nach 2.1 (b)
  
f ϕ1 do + f ϕ2 do = f do (i = 1, 2) . 2
A1 ∩Ki A2 ∩Ki Ki
2 Integration auf Untermannigfaltigkeiten 269

2.3 Der Beitrag niederdimensionaler Mengen zum Integral


Sei M eine m–dimensionale Untermannigfaltigkeit des n und N ⊂ M eine Ê
kompakte k–dimensionale Untermannigfaltigkeit mit k < m. Dann ist M \ N
eine m–dimensionale Untermannigfaltigkeit, und es gilt
  
f do = f do sowie f do = 0
M M \N N

für jede über M integrierbare Funktion f ∈ C0 (M ).

Beweißkizze.
Bemerkung. Das erste Integral ist im Sinne der Integration über M zu verste-
hen, das zweite im Sinne der Integration über M \ N und das dritte im Sinne
der Integration über N . Wir schreiben im folgenden deutlichkeitshalber
  
f do1 , f do2 , f do3 .
M M \N N

(a) M \ N ist eine m–dimensionale Untermannigfaltigkeit, denn zu jedem


Punkt a ∈ M \ N gibt es eine Parameterumgebung V ∩ M für M mit V ∩ N = ∅.
Die zugehörige Parametrisierung von M ist auch eine von für M \ N .
 
(b) Für kompakte Teilmengen K von M \ N gilt f do1 = f do2 . Das
K K
ergibt sich aus der Definition 2.1 (a),2.1 (b) des Integrals, da jede Parametrisie-
rung von M \ N auch eine Parametrisierung von M ist. Nach Konstruktion des
Integrals 2.1 (c) folgt daher aus der Integrierbarkeit von f ∈ C0 (M ) über M die
Integrierbarkeit über M \ N .
7

(c) Sind C1 ⊂ C2 ⊂ . . . kompakte Mengen mit M \ N = Ck , so gilt
k=1
7

M = (Ck ∪ N ). Wegen (b) und der Definition 2.1 ist daher nur zu zeigen,
k=1
dass
 
f do1 = f do1
K∪N K

 M \ N und dass A (N ) = 0. Nach 2.2 (c) ist


m
für kompakte
 Teilmengen
 K von
dabei f do1 = f do1 + f do1 , denn K ∩ N = ∅. Somit reduziert sich
K∪N K N
der Beweis auf den Nachweis von Am (N ) = 0.
(d) N wird durch endlich viele Parameterumgebungen V ∩ M der folgenden
Art überdeckt: V ∩ M enthält einen Punkt a ∈ N , und es gibt einen Diffeo-
morphismus F : V → W auf eine Umgebung W von 0 mit F(V ∩ M ) = Em ⊂
Span {e1 , . . . , em }. Ferner ist V ∩ N eine Parameterumgebung von a bezüglich
Ê
N , d.h. es gibt eine bijektive C1 –Abbildung Ψ : k ⊃ Ω → V ∩ N mit stetiger
Inverser. Dann gilt
270 § 11 Gaußscher Integralsatz und Greensche Formeln

Ê
(i) F ◦ Ψ : k ⊃ Ω → F(V ∩ N ) ist eine Parametrisierung von F(V ∩ N ),
aufgefasst als k–dimensionale Untermannigfaltigkeit von Em = F(V ∩ M ).
(ii) Nach 1.2 (b) erhalten wir eine Parametrisierung von M durch
Φ : U := {u ∈ Ê m
| (u, 0) ∈ Em } → V ∩ M , u → F−1 (u, 0) ,
wobei Φ−1 (u) = F(u) für u ∈ V∩M . Die Punkte u mit (u, 0) ∈ F(V∩M ) bilden
nach (i) eine k–dimensionale Untermannigfaltigkeit von U . Also gilt für beliebige
kompakte Teilmengen K von V ∩ N nach Definition  des Integrals,
 wegen der
Folgerung 1.4 und aufgrund des schon Bewiesenen 1 do1 = 1 do3 = 0. 2
K K

2.4 Integration über Sphären und zwiebelweise Integration


Ê
(a) Sei Sr (c) ⊂ m+1 die Sphäre mit Mittelpunkt c = (a, b) und Radius r > 0.
Wir parametrisieren die obere Halbsphäre Sr+ (c) und die untere Halbsphäre
Sr− (c) als Graphen:
&  '
Sr± (c) = x, b ± r 2 − x − a2

 x∈ Ê m
, x − a < r .

Der Äquator {(x, b) | x − a = r} ist eine kompakte (m − 1)–dimensionale


Untermannigfaltigkeit; das folgt unmittelbar aus der Definition 1.1 ÜA . Da
Sr (c) kompakt ist, gilt für f ∈ C0 (Sr (c)) nach dem vorangehenden Satz
  
f do = f do + f do .
Sr (c) Sr+ (c) Sr− (c)

Aus der Definition von 2.1 (a) ergibt sich mit Hilfe von 1.8 ÜA
 
dm x
f do = r f (x, b + r 2 − x − a2 )
r 2 − x − a2
Sr+ (c) Kr (a)

dm ξ
= rm f (a + rξ, b + r 1 − ξ2 ) ,
1 − ξ2
ξ<1

Letzteres nach dem Transformationssatz für Integrale ÜA . Im Integral über


√ √
Sr− (c) ist jeweils nur b + r durch b − r zu ersetzen.
(b) Zwiebelweise Integration. Sei n ≥ 3 und f stetig auf der Kugelschale
K := { x ∈

Ê n
| r1 < x < r2 } mit 0 ≤ r1 < r2 .
Dann ist r → f do stetig in ]r1 , r2 [ , und es gilt
S r (0 )

 r2  
f (x) dn (x) = f do dr ,
K r1 S r (0 )

falls eines dieser Integrale existiert.


2 Integration auf Untermannigfaltigkeiten 271

Beweis.
  
Die Stetigkeit von r → f do = f do + f do folgt aus der zweiten
Sr (0) Sr+ (0) Sr− (0)
Darstellung der rechtsstehenden Integrale in (a); dabei ist m = n − 1.
Wir stellen x ∈ K in der Form (y, t) dar mit y ∈ Ê m
und r12 < y2 + t2 < r22 .
Für r1 < 1 < 2 < r2 sei
 
Ω := Ê
(ξ, r) | ξ ∈ m
, 1 <r< 2, ξ < 1 und
 
Ω 
:= (y, t) | y ∈ Ê m
, t > 0, 2
1 < y + t <2 2 2
2 .
Dann liefert
 
ϕ(ξ, r) := r ξ, r 1 − ξ2

eine bijektive Abbildung des Zylinders Ω auf die obere Kugelschale Ω mit
rm
det ϕ (ξ, r) = > 0 ÜA .
1 − ξ2
Daher ist ϕ ein Diffeomorphismus, und der Transformationssatz für Integrale
liefert
 
rm
f (y, t) dm y dt = f (rξ, r 1 − ξ2 ) dm ξ dr
1 − ξ2
Ω Ω
2 

= f do dr ,
1 Sr+ (0)

Letzteres durch sukzessive Integration und nach (a). Entsprechendes ergibt sich
für den unteren Teil der Kugelschale. Der Ausschöpfungssatz Bd. 1, § 23 : 4.7
liefert die Behauptung. 2

(c) Beispiel. Nach (a) ist der Oberflächeninhalt der r–Sphäre Sr (0) im Ê
n


dn−1 ξ
An−1 (Sr (0)) = 2r n−1 =: ωn r n−1 .
1 − ξ2
ξ<1
Dabei ist ωn der Oberflächeninhalt der Einheitssphäre. Aus Forster [147], 14.9
entnehmen wir

⎪ πk

⎨ für n = 2k
2π n/2 k!
ωn = =
Γ(n/2) ⎪
⎪ 2k+1 · π k
⎩ für n = 2k + 1 .
1 · 3 · · · · · (2k + 1)!
272 § 11 Gaußscher Integralsatz und Greensche Formeln

Folgerungen. (i) x → x−p ist genau dann über jede Kugel Kr (0) des n Ê
Ê
integrierbar, wenn p < n und genau dann über n \ Kr (0) integrierbar, wenn
Ê
p > n. Insbesondere ist 1/(1 + xp ) für p > n über den n integrierbar.
(ii) log x ist über jede Kreisscheibe in der Ebene integrierbar.
ωn n
(iii) Mit Hilfe von (b) folgt V n (Kr (0)) = r .
n

2.5 Parameterintegrale
Ê
Satz. Sei M ⊂ n eine kompakte Cr+1 –Untermannigfaltigkeit (r = 1, 2, . . . ),
Ê
Ω ⊂ m ein Gebiet und f : Ω × M → Ê
eine Cr –Funktion. Dann ist

F (x) = f (x, y) do(y) für x ∈ Ω
M
Cr –differenzierbar und es darf unter dem Integral differenziert werden.
Der Beweis ergibt sich aus der Definition des Integrals über Untermannigfal-
tigkeiten und dem Satz § 8 : 1.7 über Parameterintegrale ÜA .

3 Der Gaußsche Integralsatz


3.1 Normalgebiete
Bei der folgenden Version des Gauß-
schen Integralsatzes folgen wir der
Darstellung in Königsberger [150]
Bd.2, § 10.
Ein Randpunkt a ∈ ∂Ω eines Gebietes n(x)
Ê
Ω ⊂ n (n ≥ 2) heißt regulär, wenn
Ω
x U
es eine Umgebung U von a und eine
C1 –Funktion ψ : U → gibt mit Ê


⎨ U ∩ Ω = {x ∈ U | ψ(x) < 0} ,
(∗) U \ Ω = {x ∈ U | ψ(x) ≥ 0} ,


∇ψ(x) = 0 für x ∈ U.

Gibt es also reguläre Randpunkte, so bildet deren Gesamtheit nach 1.1 eine
(n − 1)–dimensionale C1 –Untermannigfaltigkeit M = ∂reg Ω.
Auf M = ∂reg Ω existiert genau ein stetiges Vektorfeld n mit

n(x) ⊥ Tx M , n(x) = 1 ,
x + t n(x) ∈ Ê n
\ Ω , x − t n(x) ∈ Ω für 0 < t  1

für jedes x ∈ ∂reg Ω. Ist ψ : U → Ê


eine Ω lokal beschreibende Funktion wie in
(∗), so gilt n = ∇ψ/∇ψ auf U ∩ ∂Ω.
3 Der Gaußsche Integralsatz 273

Beweis.
Es gibt höchstens ein Vektorfeld n mit diesen Eigenschaften. Zum Nachweis der
Existenz wählen wir ψ : U → Ê
wie in (∗) und setzen

∇ψ
n := auf U ∩ ∂reg Ω .
∇ψ

Dann sind die beiden ersten Eigenschaften erfüllt. Für f (t) := ψ(x + t n(x))
gilt f (0) = 0 und f  (0) = ∇ψ(x) , n(x) = ∇ψ(x) > 0 . Für 0 < t  1
folgt also ψ(x + t n(x)) = f (t) > 0 und ψ(x − t n(x)) = f (−t) < 0 , somit
x + t n(x) ∈ Ω und x − t n(x) ∈ Ω . 2

Ê
Eine Menge S ⊂ n heißt eine (n − 1)–Nullmenge, wenn es zu jedem ε > 0
Ê
eine Folge von Würfeln W1 , W2 , . . . ⊂ n mit Seitenlängen d(Wi ) gibt, so dass

7
∞ 

S ⊂ Wi , d(Wi )n−1 < ε .
i=1 i=1

S ist z.B. eine (n − 1)–Nullmenge, wenn S in der endlichen oder abzählbaren


Vereinigung von Untermannigfaltigkeiten der Dimension < n − 1 enthalten ist.
(Punkte werden dabei als 0–dimensionale Untermannigfaltigkeiten gezählt.)
Unter einem Normalgebiet verstehen wir ein beschränktes Gebiet Ω ⊂ Ê n

mit den Eigenschaften


(a) An−1 (∂reg Ω) < ∞,
(b) ∂Ω \ ∂reg Ω ist eine (n − 1)–Nullmenge.
Der Rand eines Normalgebiets besteht also aus einer (n − 1)–dimensionalen
C1 –Untermannigfaltigkeit endlichen Oberflächeninhalts und der Menge von sin-
gulären Punkten (vorzustellen als Ecken und Kanten von ∂Ω), der klein im Sinne
der (n − 1)–dimensionalen Inhaltsmessung ist.
Ê
Ein Gebiet Ω ⊂ n nennen wir Cr –berandet (r ≥ 1), wenn ∂Ω eine (n − 1)–
Ê
dimensionale Cr –Untermannigfaltigkeit des n ist, d.h. wenn Ω nahe ∂Ω lokal
durch Cr –Funktionen ψ wie in (∗) beschreibbar ist.
Offensichtlich ist jedes beschränkte, Cr –berandete Gebiet ein Normalgebiet.

3.2 Der Gaußsche Integralsatz


Ê
Ist Ω ⊂ n ein Normalgebiet mit äußerem Einheitsnormalenfeld n und v ein
Vektorfeld in C0 (Ω) ∩ C1 (Ω) , so gilt
 
div v dn x = v , n do ,
Ω ∂Ω

falls das Integral auf der linken Seite existiert.


274 § 11 Gaußscher Integralsatz und Greensche Formeln

Bemerkungen. (i) Das Integral auf der rechten Seite ist dabei definiert durch
das Integral

v , n do ;
∂reg Ω

dieses existiert wegen An−1 (∂reg Ω) < ∞ und der Stetigkeit von v auf ∂Ω .
(ii) Hinreichend für die Existenz des linksstehenden Integrals ist v ∈ C1 (Ω).
(iii) Weitere Versionen des Gaußschen Integralsatzes finden sich in Ziemer [135]
5.8. Für C1 –berandete Gebiete wird ein kurzer Beweis in Forster [147, 3] § 21
gegeben.

Folgerung (Randlose Version des Gaußschen Satzes). Für jedes Gebiet Ω des
Ên
Ê
und jedes C1 –Vektorfeld v auf n mit kompaktem Träger in Ω gilt

div v dn x = 0 .
Ω

Beweis.
Wir wählen ein R > 0 mit supp v ⊂ KR (0) =: Ω . Wegen v = 0 auf ∂Ω und
supp v ⊂ Ω gilt dann
   
0= v , n do = div v dn x = div v dn x = div v dn x . 2
∂Ω Ω supp v Ω

3.3 Mehrfache partielle Integration


Ê
Ist Ω ⊂ m ein Gebiet, u ∈ Cm (Ω), v ∈ Cm
c (Ω) und α ein Multiindex mit
|α| ≤ m , so gilt
 
∂ α u · v dn x = (−1)|α| u · ∂ α v dn x .
Ω Ω

Zur Definition von Multiindizes α und von |α| verweisen wir auf § 10 : 2.2.
Der Beweis ergibt sich durch Induktion nach |α|. Für |α| = 1, also α = ei
folgt die Behauptung durch Anwendung der Folgerung 3.2 auf das Vektorfeld
w := u · v · ei mit kompaktem Träger in Ω:
   
0 = div w = ∂i (u v) = v ∂i u + u ∂i v .
Ω Ω Ω Ω

Für |α| = 2, also α = ei + ej ergibt die zweimalige Ausnützung dieser Identität


    
∂αu v = ∂i ∂j u v = − ∂j u ∂i v = u ∂j ∂i v = u ∂αv .
Ω Ω Ω Ω Ω

Die Ausführung der Induktion überlassen wir den Lesern als ÜA . 2
4 Die Greenschen Identitäten 275

4 Die Greenschen Identitäten


4.1 Die Greenschen Identitäten für den Laplace–Operator

Ist Ω ⊂ Ên
ein Normalgebiet, so gilt
 
(1) ∇u , ∇v + u Δv dn x = u ∂n v do
Ω ∂Ω

für u ∈ C0 (Ω) ∩ C1 (Ω), v ∈ C1 (Ω) ∩ C2 (Ω) mit ∇u, Δv ∈ L2 (Ω),


  
(2) u Δv − v Δu dn x = u ∂n v − v ∂n u do
Ω ∂Ω

für u, v ∈ C1 (Ω) ∩ C2 (Ω) mit Δu, Δv ∈ L2 (Ω) .

Bemerkung. Wie im Gaußschen Integralsatz schreiben wir in den rechts ste-


henden Integralen ∂Ω anstelle von ∂reg Ω , vgl. die Bemerkung (i) in 3.2.
Der Beweis ergibt sich unmittelbar durch Anwendung des Gaußschen Integral-
satzes 3.2 auf die Vektorfelder u∇v bzw. u∇v − v∇u .

4.2 Die Greensche Identität für Differentialoperatoren 2. Ordnung


Gegeben sei ein linearer Differentialoperator zweiter Ordnung auf Ω ⊂ Ê
n
,
n 
n
u → Lu = aik ∂i ∂k u + ai ∂i u + au ,
i,k=1 i=1

C2 (Ω) → C0 (Ω) ,

mit Koeffizienten

aik = aki ∈ C2 (Ω) , ai ∈ C1 (Ω) , a ∈ C0 (Ω) .

Der zu L formal adjungierte Differentialoperator v → L∗ v ist so defi-


niert, dass der Ausdruck

v Lu − u L∗ v

die Divergenz eines Vektorfeldes auf Ω ist.


Es ergibt sich

n 
n
v → L∗ v := ∂i ∂k (aik v) − ∂i (ai v) + av,
i,k=1 i=1

C2 (Ω) → C0 (Ω) ,

denn es gilt
276 § 11 Gaußscher Integralsatz und Greensche Formeln


n 
n
v Lu = aik v ∂i ∂k u + ai v ∂i u + a u v
i,k=1 i=1
 
n
= ∂i (aik v ∂k u) − ∂i (aik v) ∂k u
i,k=1

n
+ ∂i (ai u v) − ∂i (ai v) u + auv
i=1
 
n
= ∂i (aik v ∂k u) − ∂k (u ∂i (aik v)) + u ∂k ∂i (aik v)
i,k=1

n
+ ∂i (ai u v) − u ∂i (ai v) + auv
i=1

n
= u L∗ v + ∂i wi = uL∗ v + div w .
i=1

Die Komponenten des Vektorfelds w lauten also


n 

wi := aik v ∂k u − u ∂k (aik v) + ai u v .
k=1

Zusammen mit dem Gaußschen Integralsatz ergibt sich hieraus unmittelbar die
Greensche Identität für den Differentialoperator L in zwei Versionen:
(a) Ist Ω ein Normalgebiet mit äußerem Einheitsnormalenfeld n, so gilt
  
v Lu dn x = u L∗ v dn x + w , n do
Ω Ω ∂Ω

für u, v ∈ C1 (Ω) ∩ C2 (Ω) mit Lu , L∗v ∈ L2 (Ω), wobei



n
wi = (aik v ∂k u − u ∂k (aik v)) + ai uv (i = 1, . . . , n).
k=1
 
(b) ϕ Lu dn x = u L∗ ϕ dn x
Ω Ω
gilt für u ∈ C2 (Ω), ϕ ∈ C2c (Ω) und beliebige Gebiete Ω.

ÜA Hat L Divergenzgestalt, d.h. ist von der Form



n 
Lu = ∂i aik ∂k u + au ,
i,k=1
so gilt

n 
L∗ = L und wi = aik v ∂k u − u ∂k v .
k=1

(c) Bemerkung. Für einen linearen Differentialoperator m–ter Ordnung auf


Ω ⊂ n,Ê 
u → Lu = aα ∂ α u mit aα ∈ C|α| (Ω) ,
|α|≤m
4 Die Greenschen Identitäten 277

wird der formal adjungierte Differentialoperator



v → L∗ v := (−1)|α| ∂ α (aα v)
|α|≤m

in analoger Weise so festgelegt, dass v Lu − uL∗ v Divergenzform hat, woraus


mit dem Gaußschen Integralsatz folgt
 
ϕLu dn x = uL∗ ϕ dn x für u ∈ Cm (Ω) , ϕ ∈ Cm
c (Ω) .
Ω Ω

4.3* Verallgemeinerte Greensche Formeln


Diese werden für die Behandlung des Neumann–Problems in § 14 benötigt.
Ê
Sei Ω ⊂ n ein beschränktes Gebiet mit C2 –differenzierbarem Rand. Wir sa-
gen, dass u ∈ C1 (Ω) eine einseitige Normalableitung ∂n u auf ∂Ω besitzt,
kurz u ∈ C1n (Ω), wenn

∂n u(x) := lim ∇u(x − t n(x)) , n(x)


t→0+

gleichmäßig für alle x ∈ ∂Ω konvergiert. Dabei ist n das äußere Normalenfeld


auf ∂Ω wie in 3.1.

Satz. (a) Es gilt C1 (Ω) ⊂ C1n (Ω) ⊂ C0 (Ω) und für u ∈ C1n (Ω) ist ∂n u stetig
auf ∂Ω .
 
(b) (u Δv + ∇u , ∇v ) dn x = u ∂n v do gilt für u ∈ C0 (Ω) ∩ C1 (Ω),
Ω ∂Ω
v ∈ Cn (Ω) ∩ C2 (Ω) mit u Δv , ∇u , ∇v ∈ L1 (Ω).
1

 
(c) (u Δv − v Δu) dn x = (u ∂n v − v ∂n u) do gilt für u, v ∈ C1n (Ω)∩C2 (Ω)
Ω Ω
mit u Δv, v Δu ∈ L1 (Ω).

(d) Für jede harmonische Funktion u ∈ C1n (Ω) ∩ C2 (Ω) gilt


 
∇u2 dn x = u ∂n u do .
Ω ∂Ω

Beweisskizze.
(a) ∂n u ist als gleichmäßiger Limes stetiger Funktionen stetig auf ∂Ω. Für
u ∈ C1 (Ω) existiert lim ∇u(x + t n(x)) =: g(x) , also auch
t→0+

∂n u(x) = g(x) , n(x) .

Damit haben wir C1 (Ω) ⊂ C1n (Ω).


278 § 11 Gaußscher Integralsatz und Greensche Formeln

Für y ∈ ∂Ω, t > 0 gilt y − t n(y) ∈ Ω . Umgekehrt bestimmt jeder hinreichend


nahe bei ∂Ω liegende Punkt x ∈ Ω eindeutig ein y ∈ ∂Ω und ein t > 0 mit
x = y − t n(y) , genauer:
Ê
Es gibt eine Umgebung Ur := { x ∈ n | dist (x, ∂Ω) < r } von ∂Ω , eine
C1 –Abbildung p : Ur → ∂Ω und eine C1 –Funktion d : Ur → ]−r, r[ mit

x ∈ Ur ⇐⇒ x = p(x) − d(x) n(p(x)) und

d(x) = x − p(x) = dist (x, ∂Ω) für x ∈ Ur ∩ Ω .

Die Projektion p(x) von x auf ∂Ω ist eindeutig betimmt: x = y − t n(x) ⇐⇒


y = p(x), t = d(x).
Dies und das Folgende ergibt sich aus dem lokalen Umkehrsatz, angewandt auf
h(u, t) = Φ(u) − t n(Φ(u)) , wobei Φ eine C2 –Parametrisierung von ∂Ω ist.
Für festes t mit |t| < r sind die Parallelflächen Σt = { x ∈ Ur | d(x) = t }
zu Σ0 = ∂Ω jeweils C1 –Untermannigfaltigkeiten mit dem Einheitsnormalenfeld
N = −∇d , und für x ∈ Ur gilt

N(x) = n(p(x)) .

Hieraus folgt für u ∈ C1n (Ω) und x ∈ Ur ∩ Ω

(∗) ∂ N u(x) = ∇u(x) , N(x) = ∇u(y − t n(y)) , n(y)

mit y = p(x), t = d(x) > 0.


(a) Für u ∈ C1n (Ω) und y ∈ ∂Ω sei h(t) = u(y − t n(y)) . Dann gilt

h (t) = − ∇u(y − t n(y)) , n(y) und lim h (t) = − ∂n u(y) .


t→0+

Daher existiert
t
u(y) := u(y − t n(y)) + ∇u(y − s n(y)) , n(y) ds .
0

Zu gegebenem ε > 0 gibt es ein t > 0 mit


 
 ∂n u(y) − ∇u(y − s n(y)) , n(y)  < ε für alle y ∈ ∂Ω, s ∈ [0, t].

Da ∂n u(y) auf ∂Ω und u auf Σt gleichmäßig stetig sind, folgt die gleichmäßige
Stetigkeit von u auf ∂Ω sowie |u(x) − u(p(x))| < ε d(x) für d(x) < δ . Mit
der Dreiecksungleichung folgt lim u(x) = u(y) für y ∈ ∂Ω.
Ω x→y

(b) Für Ωt := { x ∈ Ω | dist (x, ∂Ω) > t } gilt ∂Ωt = Σt und


 
(u Δv + ∇u , ∇v ) dn x = u ∂ N v do .
Ωt Σt
5 Der Laplace–Operator in krummlinigen Koordinaten 279

Die Behauptung (b) folgt für t → 0 mit dem Ausschöpfungssatz für die linke
Seite und wegen der gleichmäßigen Konvergenz des Integranden der rechten
Seite von (∗) auf einer kompakten Menge. Entsprechend ergibt sich (c).
(d) folgt unter den genannten Voraussetzungen aus
  
lim ∇u2 dn x = lim u ∂ N u do = u ∂n u do
t→0+ t→0+
Ωt Σt ∂Ω

mit Hilfe des Satzes von Beppo Levi. 2

5 Der Laplace–Operator in krummlinigen Koordinaten


5.1 Koordinatentransformationen und Gramsche Matrix
(a) Für eine Koordinatentransformation (d.h. einen C2 –Diffeomorphismus)

h : Ω → Ω , ξ → x = h(ξ)

definieren wir die Funktionen

gik = ∂i h , ∂k h .

Die aus diesen gebildete Gramsche Matrix G = (gik ) ist symmetrisch und
positiv definit, denn für A := h gilt

G = AT A .

Somit existiert die inverse Matrix

G−1 = (g ik ) = A−1 (AT )−1 = A−1 (A−1 )T = B T B mit B := (A−1 )T

und diese ist ebenfalls positiv definit. Wie in 1.8 definieren wir die Gramsche
Determinante durch

g := det (gik ) = (det A)2 > 0 .

(b) Die meisten in der Mathematischen Physik verwendeten Koordinatentrans-


formationen sind orthogonal, d.h. besitzen die Eigenschaft

gik = 0 für i = k .

Für solche Transformationen gilt

g ik = 0 für i = k , g ii = 1/gii , und g = g11 · · · gnn ,

was die Berechnung des Laplace–Operators nach der folgenden Formel von Ja-
cobi einfach gestaltet.
280 § 11 Gaußscher Integralsatz und Greensche Formeln

(c) Als Beispiel betrachten wir die Transformation ξ → h(ξ) = x in Kugelko-


ordinaten,
⎛ ⎞
r sin ϑ cos ϕ
h(r, ϑ, ϕ) = ⎝ r sin ϑ sin ϕ ⎠ für r > 0, 0 < ϑ < π, 0 < ϕ < 2π .
r cos ϑ

Für diese ergibt sich ÜA

g11 (r, ϑ, ϕ) = 1 , g22 (r, ϑ, ϕ) = r 2 , g33 (r, ϑ, ϕ) = r 2 sin2 ϑ ,

gik = 0 für i = k und g = r 4 sin2 ϑ .

Zahlreiche Beispiele von Koordinatentransformationen sind in Arfken–Weber


[1] Ch. 2 angegeben.

5.2 Die Jacobische Formel


Satz (Jacobi 1848). Ist h : Ω → Ω eine Koordinatentransformation, u eine
C2 –Funktion auf Ω und U := u ◦ h , so gilt
 
1  ∂ √ ik ∂U
n

Δu = √ gg ,
g ∂ξi ∂ξi
i,k=1

wobei auf der linken Seite das Argument x = h(ξ) und auf der rechten das
Argument ξ = (ξ1 , . . . , ξn ) einzutragen ist.

Beispiele. (a) Für Polarkoordinaten in der Ebene ergibt sich hieraus die For-
mel § 6 : 5.2 ohne die dort angestellte längliche Rechnung ÜA .
(b) Bei der Transformation 5.1 (c) auf Kugelkoordinaten erhalten wir ÜA

1 ∂
 ∂U  1 ∂
 ∂U
 1 2
∂ U
2
Δu = r + sin ϑ + .
r 2 ∂r ∂r r 2 sin ϑ ∂ϑ ∂ϑ r 2 sin2 ϑ ∂ϕ2

Beweis.
Der direkte Weg, nämlich Berechnung von Δ(U ◦ h−1 ) und anschließendes Ein-
setzen von h ist sehr rechenaufwändig. Günstiger ist es, partielle Integration mit
dem Transformationssatz für Integrale und dem Lemma von du Bois–Reymond
zu kombinieren:
Wir verwenden die Bezeichnungen von 5.1. Bezeichnen wir die Koeffizienten von
B = (A−1 )T mit Bji , so gilt wegen G−1 = B T B

n
(1) g ik = Bji Bjk ;
j=1
5 Der Laplace–Operator in krummlinigen Koordinaten 281

ferner folgt aus 5.1



(2) g = | det h | .

Wir wählen ϕ ∈ C∞ 
c (Ω) und setzen Φ := ϕ ◦ h ∈ Cc (Ω ) . Mit der Kettenregel
2
−1 −1
folgt aus ϕ = Φ ◦ h , u = U ◦ h
∂ϕ   ∂Φ i ∂u   k ∂U
(3) = Bj ◦ h−1 , = Bj ◦ h−1 .
∂xj ∂ξi ∂xj ∂ξk
i k

Partielle Integration 4.2 (b) liefert


  
∂ϕ ∂u
− n
ϕ Δu d x = dn x
∂xj ∂xj
j
Ω

Ω
 
∂Φ i k ∂U
◦ h−1 dn x
(3)
= Bj Bj
∂ξi ∂ξk
i,j,k

Ω
 
∂Φ ∂U
◦ h−1 dn x .
(1)
= g ik
∂ξi ∂ξk
i,k
Ω

Der Transformationssatz und anschließende partielle Integration ergeben


   
√ ∂Φ ∂U
− n
ϕ Δu d x = g g ik dn ξ
∂ξi ∂ξk
i,k
Ω
Ω
  ∂ √ 
∂U
= − Φ g g ik dn ξ .
∂ξi ∂ξk
i,k
Ω

Durch nochmalige Anwendung des Transformationssatzes erhalten wir daraus


   1  ∂ √ 
∂U
ϕ Δu dn x = ϕ √ g g ik ◦ h−1 dn x .
g ∂ξi ∂ξk
i,k
Ω Ω

Mit dem Lemma von du Bois–Reymond § 10 : 4.1 ergibt sich schließlich


 
1  ∂
n
√ ∂U
(Δu) ◦ h = √ gg ik
. 2
g ∂ξi ∂ξi
i,k=1

5.3 Die Invarianz des Laplace–Operators unter Bewegungen


Satz. Ist h eine Bewegung des Ê n
und u eine C2 –Funktion auf einem Gebiet
Ê
Ω ⊂ n , so gilt

Δ(u ◦ h) = (Δu) ◦ h .
282 § 11 Gaußscher Integralsatz und Greensche Formeln

Folgerung. Für jede harmonische Funktion u und jede Bewegung h ist auch
u ◦ h harmonisch.

Beweis.

n
Jede Bewegung h hat die Gestalt h(ξ) = a+A ξ = a+ ξi ai mit einem Vektor
i=1
a, einer orthogonalen Matrix A mit den Spaltenvektoren a1 , . . . , an . Damit gilt

gik = ∂i h , ∂k h = ai , ak = δik , g ik = δik , g = 1.

Für u ∈ C2 (Ω) und U := u ◦ h ∈ C2 (Ω ) mit Ω := h−1 (Ω) ergibt sich aus
der Jacobischen Formel

(Δu) ◦ h = ΔU = Δ(u ◦ h) . 2

5.4 Aufgaben
(a) Berechnen Sie mit der Jacobischen Formel den Laplace–Operator für ellip-
tische Zylinderkoordinaten
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
ξ x cosh ξ cos η
⎝ ⎠ ⎝
h : η −→ y = ⎠ ⎝ sinh ξ sin η ⎠ .
ζ z ζ

(b) Dasselbe für parabolische Zylinderkoordinaten


⎛ ⎞ ⎛ ⎞ ⎛ ⎞
ξ x ξη
h : ⎝η ⎠ −→ ⎝y ⎠ = ⎝ 12 (ξ 2 − η 2 )⎠ .
ζ z ζ

(c) Zeigen Sie für die Spiegelung an der R–Sphäre

ξ −→
R2
ξ2
ξ, Ê n
\ {0} → Ê n
\ {0} ,

dass mit der Abkürzung = R2 /ξ2 und der Notation von 5.2 gilt:


n  
2 −n ∂ n−2 ∂U
gik = δik , also Δu = .
∂ξi ∂ξi
i=1
283

§ 12 Die Fouriertransformation
Die Fouriertransformation ist ein wichtiges Hilfsmittel für die Theorie der Dif-
ferentialgleichungen, sie spielt auch in der Quantenmechanik, in der Optik und
in der Systemtheorie eine tragende Rolle.
Vorkenntnisse: Testfunktionen, Faltungsintegral (§ 10). Die Kenntnis des Lebes-
gue–Integrals ist nur an wenigen, eigens ausgewiesenen Stellen nötig.
Literatur: Folland [35], Wladimirow [56], Hörmander [63].

1 Zielsetzung
1.1 Die Fouriertransformation von Differentialgleichungen
(a) Wir suchen eine Transformation von Funktionen, welche Differentiation in
Multiplikation überführt. Hierzu definieren wir den Differentiationsoperator P
und den Multiplikationsoperator Q für differenzierbare Funktionen u : → Ê
durch
1
P : u → i u , Q : u → x· u,
wobei x · u für die Funktion x → xu(x) steht.
/ , unter welcher der Operator
Gesucht ist also eine lineare Transformation u → u
P in den Operator Q übergeht,
(∗) :u = Q u
P /.
Durch zweimalige Anwendung von (∗) folgt
: = P;
(∗∗) − u :u = Q2 u
2u = Q P /.
Somit kann diese Transformation dazu dienen, die Differentialgleichung
u + a u + b u = f (a, b Konstanten, f eine gegebene Funktion)
/ zu überführen, und zwar in
in eine algebraische Gleichung für u
/(y) (−y 2 + iay + b) = f/(y) .
u
(b) Setzen wir die gesuchte Transformation als Integraltransformation

+∞
/(y) =
u K(x, y) u(x) dx
−∞

mit einer beschränkten C1 –Funktion K an, so ergibt sich, falls u und u inte-
grierbar sind und lim u(x) = 0 gilt,
|x|→∞

+∞ 
+∞
:u)(y) = − i
(P K(x, y)u (x) dx = i ∂K
∂x
(x, y)u(x) dx ,
−∞ −∞

+∞
/)(y) = y u
(Q u /(y) = y K(x, y)u(x) dx .
−∞
284 § 12 Die Fouriertransformation

Die Beziehung (∗) ist also gewährleistet, falls (∂K/∂x)(x, y) = −iy K(x, y) .
Das bedeutet K(x, y) = ce−ixy mit einer Integrationskonstanten c . Aus Grün-
den, die in 1.2 deutlich werden, setzen wir c := (2π)−1/2 und erhalten somit
für integrierbare Funktionen u : → Ê
+∞
1
/(y) := √
u e−ixy u(x) dx .

−∞

(c) Den Nutzen der so heuristisch eingeführten Fouriertransformation u → u /


skizzieren wir am Beispiel des Wärmeleitungsproblems in einem unendlich lan-
gen Draht. Sei u eine Lösung des Anfangswertproblems für die Wärmeleitungs-
gleichung

∂2u
(x, t) für x ∈ , t > 0 und u(x, 0) = f (x) .
∂u
(x, t) =
∂t ∂x2
Wir betrachten die Fouriertransformierte bezüglich der Ortsvariablen, d.h.
+∞
1
/(y, t) := √
u e−ixy u(x, t) dx .

−∞

Unter geeigneten Voraussetzungen über u und f (Näheres dazu in 2.2) ergibt


sich mit Hilfe der Umformung (∗∗)
+∞ +∞
/
∂u 1 −ixy ∂u 1 ∂2u
(y, t) = √ e (x, t) dx = √ e−ixy (x, t) dx
∂t 2π ∂t 2π ∂x2
−∞ −∞
(∗∗)
/(y, t) .
= −y u 2

Nach Integration dieses AWP erhalten wir


2t 2
/(y, 0) e−y
/(y, t) = u
u = f/(y) e−y t .

Wir werden zeigen, dass die Fouriertransformation injektiv ist, d.h. dass u durch
/ eindeutig bestimmt ist. Für die Lösung des Wärmeleitungsproblems bleibt so-
u
mit die Aufgabe, die Fouriertransformation umzukehren. Einen Hinweis darauf,
wie dies zu bewerkstelligen ist und zugleich einen anderen Zugang zur Fourier-
transformation geben die folgenden Betrachtungen.

1.2 Von der Fourierreihe zum Fourierintegral


Gegebensei eine Testfunktion u :  → . Wir wählen n ∈  so groß, dass
supp u ⊂ [−nπ, nπ] und bezeichnen mit un diejenige 2πn–periodische Funkti-
on, welche auf [−nπ, nπ] mit u übereinstimmt. Für jedes x ∈  gibt es dann
ein n ∈  mit un (x) = u(x). Somit gilt un → u punktweise auf . (Machen
Sie sich für einen Standardbuckel u anhand einer Skizze klar, wie die Kopien
1 Zielsetzung 285

von u für wachsendes n nach links bzw. rechts wandern.) Wir zeigen, dass die
Fourierreihe von un für n → ∞ in eine Darstellung von u als Fourierintegral“

übergeht. Um die Fourierentwicklung der un zu gewinnen, beachten wir, dass

durch fn (t) := un (nt) eine 2π–periodische C –Funktion gegeben ist. Somit gilt
nach dem Satz von Dirichlet § 6 : 2.3 in der komplexen Version § 6 : 2.1


+∞
(n) (n) 1 π −ikt
(1) fn (t) = ck eikt mit ck = e fn (t) dt .
k=−∞ 2π −π

Wegen un (x) = u(x) für |x| ≤ nπ und u(x) = 0 für |x| ≥ nπ folgt

(n) 1 π −ikt 1 nπ −i k x


(2) ck = e un (nt) dt = e n un (x) dx
2π −π 2πn −nπ

1 nπ −i k x 1 +∞ −i k x
= e n u(x) dx = e n u(x) dx
2πn −nπ 2πn −∞

1
 
k
= √ /
u
2π n n

/ . Somit folgt aus (1)


mit der in 1.1 eingeführten Fouriertransformierten u

1 
+∞
k
k 1
(3) un (x) = √ /
ei n x u .
2π k=−∞ n n

Die rechte Seite deuten wir als Approximation des Integrals


1 +∞  ixy
√ e u /(y) dy
2π −∞
 
durch eine Reihe; u/(y) wird hierbei auf den Intervallen nk , k+1
n
/( nk )
durch u
angenähert, vgl. Bd. 1, § 11 : 4.3 (c). Wegen der punktweisen Konvergenz un →
u erwarten wir daher, dass Gleichung (3) für n → ∞ übergeht in

1 +∞  ixy
(4) u(x) = √ e u /(y) dy .
2π −∞

Damit haben wir die Umkehrformel für die Fouriertransformation erraten: Aus
/ = v folgt u(x) = /
u v (−x). (Den rein technischen Beweis für die Berechtigung
des√Übergangs von (3) nach (4) unterdrücken wir.) Die Wahl des Vorfaktors
1/ 2π erklärt sich einerseits durch die Symmetrie der Umkehrformel, ande-
+∞  
+∞
rerseits durch die Formel /(y)|2 dy =
|u |u(x)|2 dx , die in Abschnitt 4
−∞ −∞
bewiesen wird.
286 § 12 Die Fouriertransformation

2 Die Fouriertransformation auf L1 ( Ê) n

2.1 Definition und Beispiele


Für jede integrierbare Funktion u : Ên
→ existiert das Integral

für alle y ∈ n
n
/(y) := (2π)− 2
u e−i x , y  u(x) dn x
Ên

/:
und liefert eine stetige, beschränkte Funktion u n → , die Fouriertrans-
formierte von u.
Der lineare Operator

F : L1 (n ) → C0 (n) , /
u → u

heißt Fouriertransformation auf L1 ( Ê ).n

Die Existenz des Integrals und die Stetigkeit von u / folgen aus dem Majoran-
 −i x , y 
tenkriterium und dem Satz über Parameterintegrale,  denn der Integrand hat
die von y unabhängige Majorante  e u(x)  =  u(x)  .

Bemerkungen.
(a) Vertrautheit mit dem Lebesgue–Integral ist für die Hauptthemen dieses Pa-
ragraphen (Fouriertransformation für schnellfallende Funktionen, Anwendungen
auf DG) nicht erforderlich. Die Voraussetzung u ∈ L1 (n ) kann gelesen werden
als u ist über den n integrierbar“. Sie ist immer erfüllt, wenn u : n →

stetig und im herkömmlichen Sinn integrierbar ist (Bd. 1, § 23 : 4). Der Raum
L () umfasst auch stückweis stetige, über  integrierbare Funktionen (Bd. 1,
1

§ 12 : 4). Für n ≥ 2, u ∈ L1 (n ) läßt sich u


/ durch sukzessive Integration be-
rechnen, Genaueres in § 8 : 1.8. Die Beweise werden größtenteils ohne Rückgriff
auf das Lebesgue–Integral geführt; Ausnahmen bilden 2.6 (c), und 5.2.
(b) Unter diesen Voraussetzungen gilt beispielsweise für u ∈ L1 (2)
 
+∞ 
+∞
/(y1 , y2 ) =
u √1

√1

u(x1 , x2 ) e−ix2 y2 dx2 e−ix1 y1 dx1 ,
−∞ −∞

entsprechend ist die Fouriertransformation auf L1 (n) Hintereinanderausfüh-


rung von n eindimensionalen Fouriertransformationen. Daraus und aus 1.2 er-
klärt sich der Vorfaktor (2π)−n/2 . (In der Literatur wird als Vorfaktor auch 1
statt (2π)−n/2 verwendet.)
(c) Im folgenden lassen wir beim Integral die Angabe des Integrationsgebiets
n meistens fort.
(d) Die für die Fouriertransformation zugelassenen Funktionen müssen zunächst
über den ganzen n integrierbar sein und damit im Unendlichen ein gewisses
Abfallverhalten besitzen. Für nicht integrierbare Funktionen, z.B. Polynome,
kann den Fouriertransformierten noch ein distributioneller Sinn gegeben wer-
den, siehe § 13 : 6.
2 Die Fouriertransformation auf L1 ( Ê n
) 287

Beispiele. (i) Für u = χ[−a,a] mit a > 0 erhalten wir


+∞ a
/(y) =
u √1

e−ixy u(x) dx = √1

e−ixy dx = 2 sin ay
π y
für y = 0 ,
−∞ −a

2a
/(0) = √ = lim u
u /(y) (Fig.). 6
2π y→0
u
Dies entspricht der Formel für die Am-
plitude bei der Beugung an einem Spalt -
der Breite 2a (untere Figur). −a a x
Beachten Sie: u / ist nicht integrierbar:
6

Nπ 
N 
πk /
u
sin y
y
dy ≥ 1
πk
| sin y| dy
0 k=1 π(k−1)

N
= 2
π
1
k
. -
k=1 y
−a|x|
(ii) Für u(x) = e mit a > 0 gilt

2 a
/(y) =
u ÜA .
π a2 + y 2

/ dienen, vgl.
In manchen Fällen kann der Residuensatz zur Berechnung von u
Bd. 1, § 28 : 7.4.

2.2 Das P, Q–Gesetz


(a) Wir definieren die Ableitungsoperatoren Pk und die Multiplikations-
operatoren Qk durch die Vorschriften
1 ∂u
Pk u := , Qk u : x → xk u(x) (k = 1, . . . , n) .
i ∂xk
Für diese gelten die Vertauschungsrelationen

(Pk Ql − Ql Pk ) u =
1
i
δkl u für u ∈ C1 ( Ê) n
ÜA .

In der Quantenmechanik heißen die h̄Pk Impulsoperatoren und die Qk Orts-


operatoren.
Für Multiindizes α = (α1 , . . . , αn ) setzen wir gemäß § 10 : 2.2
 1 ∂ α1  1 ∂ αn
P α := ··· = (−i)|α| ∂ α ,
i ∂x1 i ∂xn

1 · · · xn u(x) .
(Qα u)(x) := xα u(x) = xα1 αn
288 § 12 Die Fouriertransformation

(b) Satz. (i) Genügt u ∈ Cm = Cm ( Ê ) der Bedingung P


n α
u ∈ L1 := L1 ( Ê
n
)
für |α| ≤ m, so gilt
c
P; / für |α| ≤ m und | u
α u = Qα u /(y) | ≤
1 + ym
mit einer Konstanten c.
(ii) Unter der Voraussetzung Qα u ∈ L1 ( Ê n
/ ∈ Cm (
) für |α| ≤ m gilt u Ê
n
)
und
;
Q α u = (−1)|α| P α u
/ für |α| ≤ m .

/
Wir gewinnen hieraus folgende Regel: Je glatter u ist, desto schneller fällt u
im Unendlichen ab; je schneller u im Unendlichen abfällt, desto glatter ist u/.
Letzteres wird durch folgenden Sachverhalt unterstrichen:
Ê / analytisch,
(c) Zusatz. Für u ∈ C0c ( n) ist u  d.h. u /(y) kann um jeden Punkt
Ê
y0 ∈ n in eine überall konvergente Reihe aα (y − y0 )α entwickelt werden
Das folgt aus dem Satz von Paley und Wiener, vgl. Dym–Mc Kean [34], 3.3.
Aus letzterem ergibt sich noch die für die Fouriertransformation von Distributio-
Ê
nen wichtige Aussage: Für u ∈ C0c ( n), u = 0 kann die Fouriertransformierte
/ nach dem Identitätssatz für Potenzreihen keinen kompakten Träger besitzen.
u
(d) Beispiele. Es gilt
;
P /
k u = Qk u für u ∈ C1 ∩ L1 mit ∂1 u, . . . , ∂n u ∈ L1 ,
Pk u ;
/ = −Q / ∈ C1 für Q1 u, . . . , Qn u ∈ L1 ,
k u und u

:
− Δu(y) /(y) für u ∈ C2 mit u, ∂i u, ∂i ∂i u ∈ L1 .
= y2 u

Beweis.
;
(i) Zunächst sei m = 1. Für u ∈ C1 mit u, P1 u, . . . ,Pn u ∈ L1 sind Pk u = Qk u
/(y) zu zeigen. Es genügt, den Fall k = n
und die Beschränktheit von (1+y) u
zu betrachten. Nach der Bemerkung 2.1 (b) können wir P ;n u durch sukzessive
Integration berechnen: Setzen wir x = (ξ, s), y = (η, t) mit ξ, η ∈ n−1 und Ê
Ê
s = yn , t = xn ∈ , so erhalten wir
n   
+∞
(1) ;
(2π) 2 i Pn u(y) = e−i ξ,η
e−ist ∂n u(ξ, s) ds dn−1 ξ .
Ên−1 −∞
Da ∂n u stetig ist, gilt
s
u(ξ, s) = u(ξ, 0) + ∂n u(ξ, σ) dσ .
0

Wegen der Integrierbarkeit von σ → ∂n u(ξ, σ) existieren daher die Grenzwer-


te lim u(ξ, s) , und da auch s → |u(ξ, s)| integrierbar ist, müssen diese Grenz-
s→±∞
2 Die Fouriertransformation auf L1 ( Ê n
) 289

werte verschwinden, vgl. Bd. 1, § 12 : 5.2, 5.3. Somit ergibt partielle Integration


+∞ 
+∞
e−ist ∂n u(ξ, s) ds = it e−ist u(ξ, s) ds .
−∞ −∞

Aus (1) folgt durch sukzessive Integration

  
+∞
(2) ;
P −
n u(y) = (2π) 2 t
n
e−i ξ,η
e−ist u(ξ, s) ds dξ
Ên−1 −∞

/(y) = yn u
= tu /(y) = (Qn u
/)(y) .

Entsprechend ergibt sich P ; / für k = 1, . . . , n − 1, und nach 2.1 sind


k u = Qk u
; ;
/, P1 u, . . . , Pn u beschränkte Funktionen. Nach (2) gibt es also ein c1 ≥ 0 mit
u

/(y)| ≤ (1 + (|y1 | + . . . + |yn |)) |u


(1 + y)| u /(y)| ≤ c1 für alle y ∈ Ên
.

Unter den Voraussetzungen u ∈ C2 ∩ L1 , Pk u ∈ L1 , Pk Pl u ∈ L1 für 1 ≤ k, l ≤ n


folgt nach dem Vorangehenden ( mit F : u → u /)

/,
F (Pk Pl u) = F (Pk (Pl u)) = Qk F (Pl u) = Qk Ql u

;
außerdem die Beschränktheit von (1 + y)|P /(y)|. Wie
k u(y)| = (1 + y) |yk | |u
/(y)| , also
oben folgt daraus die Beschränktheit von (1 + y)2 |u

/(y)| ≤ (1 + y)2 |u
(1 + y2 )|u /(y)| ≤ c2

mit einer geeigneten Konstanten c2 . Es ist nun zu erkennen, wie sich die Be-
hauptung (i) des Satzes durch Induktion nach m ergibt.
(ii) Sei m = 1. Nach Voraussetzung ist x → xk u(x) integrierbar, und es gilt
 −i x , y  
e xk u(x)  = | xk | · | u(x) | .

Nach dem Satz über Parameterintegrale folgt


n 
/(y) = (2π)− 2
/)(y) = ∂k u
(iPk u ;
−i xk e−i x , y  u(x) dn x = −i Q k u(y),

somit Pk u ;
/ = −Q k u.

Der Beweis des Satzteils (ii) durch Induktion nach m folgt diesem Muster ÜA .
2
290 § 12 Die Fouriertransformation

(e) Riemann–Lebesgue–Lemma. Für u ∈ L1 gilt /(y) = 0.


lim u
y→∞

Beweis.
Sei ε> 0 vorgegeben. Nach § 10 : 3.3 gibt es eine Testfunktion v ∈ C∞
−n/2
c (
n
) Ê
mit /(y) − /
| u(x) − v(x)| d x < ε, also |u
n
v (y)| < ε (2π) < ε für alle
Ê
y ∈ n. Nach (b) gibt es eine Konstante c ≥ 0 mit |/ v (y)| ≤ c (1 + y)−1 . Für
y ≥ c/ε folgt

/(y)| ≤ |u
|u /(y) − /
v (y)| + |/
v (y)| < ε + ε = 2ε . 2

2.3 Rechenregeln für die Fouriertransformation auf L1 ( Ê)


n

/ · v, u · /
(a) Wälzformel. Für u, v ∈ L1 gilt u v ∈ L1 und
 
/·v =
u u·/
v.

(b) Produktformel. Für u ∈ L1 ( Ê ), p


v ∈ L1 ( Ê ) und n = p + q
q
ist durch
w(x1 , . . . , xn ) := u(x1 , . . . , xp ) · v(xp+1 , . . . , xn )
eine Funktion w ∈ L1 ( Ê ) gegeben mit
n

/ 1 , . . . , yn ) = u
w(y /(y1 , . . . , yp ) · /
v (yp+1 , . . . , yn ) .

Skalierungsregeln für L1 –Funktionen u :


/a (y) = e−i a , y  u
(c) Für ua (x) := u(x − a ) gilt u /(y).
(d) Für v(x) := ei a , x  u(x) gilt / /(y − a).
v (y) = u
/
(e) Für w(x) := u( r1 x) mit r > 0 gilt w(y) /(r y).
= rn u

Dem Beweis schicken wir ein im folgenden mehrfach verwendetes Lemma voraus:
2.4 Lemma. (a) Sei f (x, y) stetig auf Ê × Ê , und es gelte
p q

|f (x, y)| ≤ |u(x)| · |v(y)|

mit stetigen Funktionen u ∈ L1 ( Ê ), v ∈ L (Ê ). Dann ist f über den Ê


p 1 q p+q

integrierbar, und es gilt


  
f (x, y) dp x dq y = f (x, y) dq y dp x
Êp+q Êp  Êq
= f (x, y) dp x dq y .
Êq Êp
(b) Entsprechendes gilt, wenn wir stetig“ durch messbar“ ersetzen und die
” ”
Integrale im Lebesgueschen Sinn verstehen.
(a) ergibt sich nach den Kriterien in Bd. 1, § 23 : 6.1, 6.2, 6.3. (b) ist eine unmit-
telbare Folge des Satzes von Tonelli § 8 : 1.8.
2 Die Fouriertransformation auf L1 ( Ê n
) 291

Beweis von 2.3


/, /
(a) Da u 
v nach 2.1 beschränkt und stetig sind, gilt u / · v, u · /
v ∈ L1 nach dem
Majorantensatz. Wegen  v(x)u(y) e−i x , y   ≤ | v(x) | · | u(y) | folgt nach 2.4
  
(2π)n/2 /·v =
u v(x) u(y) e−i x , y  dn y dn x
  
= u(y) v(x) e−i y , x  dn x dn y = (2π)n/2 u·/
v.

(b) folgt unmittelbar aus 2.4 ÜA .


(c), (d), (e) ergeben sich aus dem Transformationssatz für Integrale ÜA . 2

2.5 Die Fouriertransformation der Gauß–Dichte


1 2
Satz. (a) Für u(x) := e− 2 x / = u.
gilt u
2 2
(b) Für u(x) := e−t x /(y) = (2t)−n/2 e−y
mit t > 0 gilt u /4t
.

Beweis.
(a) Wegen der Produktformel 2.3 (b) muss (a) nur für n = 1 gezeigt werden.
1 2
Die Gauß–Dichte u(x) = e− 2 x genügt dem AWP
(∗) u (x) = −xu(x), u(0) = 1.

Mit Hilfe des P ,Q–Gesetzes folgt hieraus



+∞
/  = iP u
u : = − P:u = − Q u
/ = − i Qu /, /(0) =
u √1
1 2
e− 2 y dy = 1,

−∞

/ dem gleichen AWP (∗) und


Letzteres nach (Bd. 1, § 23 : 8.4). Somit genügt u
ist deshalb nach dem Eindeutigkeitssatz mit u identisch.
1
(b) ergibt sich aus (a) mittels der Skalierungsregel 2.3 (e) mit r = (2t)− 2 . 2


Aufgaben (i) (Verallgemeinerung von (b)). Sei u(x) := exp − 12 x , Ax mit
einer reellen, symmetrischen, positiv definiten n × n–Matrix A. Zeigen Sie mit
Hilfe der Hauptachsentransformation, dass
1   
/(y) = (det A)− 2 exp − 12 y , A−1 y
u .

(ii) Zeigen Sie für invertierbare lineare Abbildungen A : x → Ax und für


u ∈ L1 , dass

(u ◦ A−1 ) / = | det A|−1 u


/ ◦ (AT )−1 .
292 § 12 Die Fouriertransformation

2.6 Umkehrsatz, Faltungssätze für die Fouriertransformation auf L1


(a) Umkehrsatz. Aus u ∈ L1 = L1 ( Ê ) und
n
/ ∈ L1 folgen die Stetigkeit von
u
u und

u(x) = (2π)−n/2 /(y) dn y = /
ei x , y  u /(−x) für alle x ∈
u Ên
.
1
Daher ist die Fouriertransformation auf L injektiv :
/ = 0 =⇒ u = 0 .
u ∈ L1 , u

/ ∈ L1 , vgl. 2.1 (i).


Beachten Sie: Aus u ∈ L1 folgt nicht u
/, /
(b) Faltungssatz 1. Unter den Voraussetzungen u, v, u v ∈ L1 gilt u · v ∈ L1
und

/∗/
u v = (2π)n/2 u;
·v.

(c) Faltungssatz 2. Für u, v ∈ L1 gilt u ∗ v ∈ L1 und

u; /·/
∗ v = (2π)n/2 u v.

Die Beweise folgen in 3.4 und 3.5. Der Beweis des zweiten Faltungssatzes stützt
sich auf die Lebesguesche Integrationstheorie.

3 Die Fouriertransformation auf S ( Ê) n

3.1 Schnellfallende Funktionen


Die Fouriertransformation bildet keinen der Räume L1 ( n), C∞ c (
n
Ê Ê
) in sich ab,
wie das Beispiel 2.1 (i) und der Zusatz in 2.2 zeigen. Wir suchen einen Teilraum
Ê
von L1 ( n), der durch die Fouriertransformation und die Operatoren Pk , Qk
in sich überführt wird. In einem solchen Raum ist dann das P ,Q–Gesetz 2.2
beliebig oft anwendbar; die zugehörigen Funktionen müssen deshalb beliebig
oft differenzierbar sein und im Unendlichen rasch abfallen.
Diese Eigenschaft besitzt der von Laurent Schwartz 1948 eingeführte Funktio-
nenraum
S = S( Ê ) := u ∈ C (Ê ) | x ∂ u(x) ist beschränkt für jedes Paar α, β 
n ∞ n α β


= u ∈ C (Ê ) | (1 + x ) ∂ u(x) ist beschränkt für jedes 
∞ n m β

m ∈ Æ und jeden Multiindex β .

ÜA : Weisen Sie die Gleichheit der beiden Räume nach.


S heißt Schwartz–Raum oder Raum der schnellfallenden Funktionen.
Offenbar gilt
C∞
c ( Ê
n
) ⊂ S( Ên
).
3 Die Fouriertransformation auf S ( Ê n
) 293

Beispiele schnellfallender Funktionen sind für n = 1


2 2 2
e−x , e−x sin x , e−x p(x) mit einem Polynom p .

Weitere schnellfallende Funktionen ergeben sich mit den folgenden Rechenre-


geln.

3.2 Eigenschaften von S ( Ê)


n

(a) S = S ( Ê ) ist ein Teilraum von


n
Lp ( Ên
) für 1 ≤ p ≤ ∞.
(b) u ∈ S =⇒ P u, Q u ∈ S für jeden Multiindex α.
α α

(c) u, v ∈ S =⇒ u ∗ v ∈ S .
(d) Ist u schnellfallend und v eine C∞ –Funktion, deren sämtliche Ableitungen
∂ α v polynomial beschränkt sind, so gilt u · v ∈ S . Insbesondere gilt u · v ∈ S
für u, v ∈ S .
Dabei heißt eine Funktion v : Ê n
→ polynomial beschränkt, wenn
v(x) ≤ c (1 + xm ) für ein m = 0, 1, . . . und eine Konstante c ≥ 0 .

Beweis.
(a) Die Vektorraumeigenschaft folgt unmittelbar aus der Definition.
Sei u ∈ S . Nach 3.1 gilt (1 + x2n ) |u(x)| ≤ c mit einer Konstanten c. Es
folgt |u(x)|p ≤ cp /((1 + x21 ) · · · (1 + x2n )) für alle x ∈ n und beliebiges p ≥ 1.
Daraus ergibt sich die Integrierbarkeit von |u|p durch wiederholte Anwendung
des Lemmas 2.4.
(b) Es genügt zu zeigen: u ∈ S =⇒ Pk u, Qk u ∈ S .
Für u ∈ S gilt Pk u ∈ C∞ (n ) und (mit den Bezeichnungen 2.2) Qα ∂ β Pk u =
Qα ∂ γ u mit γ = β + ek . Damit ist Qα ∂ β Pk u beschränkt für alle Paare von Mul-
tiindizes (α, β). Ferner gilt Qk u ∈ C∞ (n ) nach der allgemeinen Produktregel
§ 10: 2.2 (c). Durch mehrfache Anwendung der Vertauschungsrelationen 2.2 (a),

Pl Qk − Qk Pl = − i δkl S ,

läßt sich Qα ∂ β Qk u = (−i)|β| Qα P β Qk u mittels Durchtauschen von Qk auf eine


Linearkombination von Funktionen des Typs Qγ P δ u zurückführen und ist also
beschränkt.
(c) Wegen ∂ β v ∈ S gibt es zu jedem Multiindex β eine Konstante cβ mit
 
 u(y) ∂ β v(x − y)  ≤ cβ | u(y) | .

Daraus folgt mit dem Satz über Parameterintegrale u∗v ∈ C∞ (n ), ∂ β (u∗v) =
u ∗ ∂ β v und |∂ β (u ∗ v)| ≤ cβ u1 für alle Multiindizes β. Weiter gilt ÜA

Qk ∂ β (u ∗ v) = Qk (u ∗ ∂ β v) = (Qk u) ∗ ∂ β v + u ∗ (Qk ∂ β v) .
294 § 12 Die Fouriertransformation

Jeder der Summanden auf der rechten Seite ist als Faltungsintegral zweier
schnellfallender Funktionen beschränkt. Durch wiederholte Anwendung dieses
Arguments folgt die Beschränktheit von Qα ∂ β (u ∗ v) für beliebige Multiindizes
α, β.
(d) ergibt sich aus der allgemeinen Produktregel § 10 : 2.2 (c) ÜA . 2

3.3 Die Fouriertransformation auf S


/ ∈ S.
(a) Satz. (a) Für u ∈ S gilt u
(b) Für u ∈ S gilt das P ,Q–Gesetz uneingeschränkt:

P; /,
α u = Qα u ;
Q α u = (−1)|α| P α u
/ für alle Multiindizes α.
;
(c) Insbesondere gilt Pk u = Qk u ;
/, Q k u = −Pk u :
/ und Δu(y) /(y) ,
= −y2 u
vgl. 2.2 .

Beweis.
(a) Seien u ∈ S und β ein beliebiger Multiindex. Nach 3.2 (b) gilt Qβ u ∈ S ,
und aus dem P ,Q–Gesetz 2.2 (b) folgt daher

(∗) / ∈ C|β| (
u Ên
) sowie P βu ;
/ = (−1)|β| Q βu .

Da nach 3.2 (b) auch P α Qβ u schnellfallend ist, folgt P α Qβ u ∈ L1 für beliebige


Multiindizes α, und wir erhalten aus (∗) und dem P ,Q–Gesetz 2.2 (b):

/ ist die Fouriertransformierte von (−1)|β| P α Qβ u


Qα P β u

und ist daher beschränkt.


(b) folgt unmittelbar aus (a). 2

3.4 Der Umkehrsatz für die Fouriertransformation auf S und L1


(a) Der Umkehrsatz für die Fouriertransformation auf S .
Die Fouriertransformation bildet S bijektiv auf S ab. Die Umkehrabbildung
ordnet jeder Funktion v ∈ S die durch

u(x) = /
v (−x)

gegebene Funktion u ∈ S zu. Insbesondere gilt die Umkehrformel u(x) = /


/(−x),
u
d.h.

u(x) = (2π)−n/2 ei x , y  u
/(y) dn y für alle x ∈ Ên
.
3 Die Fouriertransformation auf S ( Ê n
) 295

Bemerkungen. (i) Der Umkehrsatz wird oft so formuliert: Jede schnellfallende


(nach 2.6 (a) sogar jede integrierbare) Funktion läßt sich durch ein Fourierin-
tegral darstellen.
In der Sprache der Wellenmechanik heißt das: Jedes Wellenpaket u ∈ S
kann als Überlagerung ebener Wellen x → ei x , y  aufgefaßt werden, wobei
/(y) die Amplitude der Welle mit dem Wellenzahlvektor y ∈ n ist.
( 2π)−n/2 u Ê
(ii) Wir bezeichnen die auf S eingeschränkte Fouriertransformation wieder
mit F und beschreiben die Punktspiegelung im Argument durch den Operator

S:S →S, (Su)(x) := u(−x) .

Mittels Substitution y → −y erhalten wir SF = F S ÜA , und der Umkehrsatz


erhält die Form

F −1 = F S = SF bzw. F 2 S = SF 2 = F SF = ½S .

Beweis.
1 2 1 −2 2
Wir setzen v(x) = e− 2 x und vr (x) = v(x/r) = e− 2 r x mit r > 0.
Für r → ∞ strebt vr monoton aufsteigend gegen 1. Der Grundgedanke des
Beweises besteht darin, das rechts in der Umkehrformel stehende Integral durch
die Integrale

(2π)−n/2 ei x , y  u
/(y) vr (y) dn y für r  1

/∈S
zu approximieren. Hierbei beachten wir, dass für u ∈ S nach 3.3 (a) u
/ ∈ L1 , u ∈ L∞ nach 3.2 (a).
gilt und somit u
Aus den Skalierungsregeln 2.3 (c),(d), der Wälzformel 2.3 (a) ergibt sich unter
Verwendung der Substitution η = r y mit ux (y) := u(y − x)
  
ei x , y  u
/(y) vr (y) dn y = u; n
−x (y) vr (y) d y = u−x (y) v/r (y) dn y
 
= u−x (y) r n /
v (r y) dn y = u−x (η/r) /
v(η) dn η

= u−x (η/r) v(η) dn η ,

Letzteres nach 2.5 (a). Setzen wir r = 1/s2 , so erhalten wir mit dem ersten
und dem letzten Integral jeweils auch für s = 0 definierte Parameterintegrale.
Nach Bd. 1, § 23 : 5.1 hängen beide stetig von s ab, denn der Integrand im ersten
Integral besitzt die von s unabhängige Majorante |u /| ∈ L1 , der im letzten
Integral besitzt die Majorante u∞ · |v| ∈ L . Somit erhalten wir für s → 0
1

  
ei x , y  u
/(y) dn y = u−x (0) v(η) dn η = u(x) v(η) dn η = (2π)n/2 u(x)

für jedes x ∈ Ên , was die Umkehrformel für u ∈ S darstellt. 2


296 § 12 Die Fouriertransformation

(b) Beweis des Umkehrsatzes auf L1 .



/ ∈ L1 und u0 (x) := (2π)−n/2 ei x , y  u
Seien u, u /(y) dn y. Für jede Testfunk-

Ê
tion ϕ ∈ Cc ( ) ⊂ S gibt es nach (a) ein v ∈ S mit /
n
v = ϕ , für welches
dann die Umkehrformel gilt. Mit der Wälzformel 2.3 (a), der Umkehrformel in
(a) und dem Satz von Tonelli § 8 : 1.8 folgt
 
(2π)n/2 u(y) /
v(y) dn y = (2π)n/2 /(y) v(y) dn y
u
 
= /(y) (
u ei x , y  /
v (x) dn x ) dn y
 
= v (x) ( ei x , y  u
/ /(y) dn y ) dn x

= (2π)n/2 / v (x) u0 (x) dn x .
Damit haben wir
   
(u − u0 ) ϕ dn x = (u − u0 ) /
v dn x = u/
v dn x − u0 /
v dn x = 0 .
Nach dem Fundamentallemma § 10 : 4.2 folgt hieraus u−u0 = 0 f.ü., also können
wir u mit der nach 2.1 stetigen Funktion u0 gleichsetzen. 2

3.5 Die Faltungssätze für S ( Ê ) und L (Ê )


n 1 n

(a) Die Faltungssätze für schnellfallende Funktionen.


Für u, v ∈ S gilt u ∗ v ∈ S und

/∗/
u v = (2π)n/2 u;
·v, u; /·/
∗ v = (2π)n/2 u v.

Beweis.
(1) Für u, v ∈ S gilt u ∗ v ∈ S nach 3.2 (c). Durch Anwendung des Umkehr-
satzes 3.4 (a)ergibt sich

/∗/
(u v )(x) = /(y) /
u v (x − y) dn y
 
= (2π)−n/2 /(y)
u v(z) e−i x−y , z  dn z dn y
 
= (2π)−n/2 v(z) e−i x , z  u
/(y) ei y , z  dn y dn z
 
= (2π)−n/2 v(z) e−i x , z  /(y) ei y , z  dn y dn z
u

= u(z) v(z) e−i x , z  dn z
= (2π)n/2 u;
· v(x) .
Die Vertauschung der Integrationsreihenfolge ist nach 2.4 erlaubt, da der Inte-
/(y)| · |v(z)| besitzt.
grand die Majorante |u
(2) Für u, v ∈ S gibt es, wieder nach dem Umkehrsatz, Funktionen f, g ∈ S
mit u = f/, v = / / , g = S/
g , also f = S u v . Nach (a) folgt unter Beachtung von
F 2 = S und S 2 = ½S
3 Die Fouriertransformation auf S ( Ê n
) 297

∗ v = (2π)−n/2 F (f/ ∗ /
(2π)−n/2 u; g ) = F 2 (f · g) = S(f · g)

/·/
= Sf · Sg = u v. 2

(b) Beweis des Faltungssatzes 2.6 (b).


Sind u, v und u / integrierbar, so existiert das Faltungsintegral u /∗/ v , da /
v be-
schränkt ist, vgl. 2.1 und § 10: 2.1 (b). Da im Falle u, u / ∈ L1 der Umkehrsatz
2.6 (a) für u gilt, läßt sich der Beweisteil (a) ohne weiteres übertragen, und wir
erhalten: u, v, u/ ∈ L1 =⇒ u /∗/v = (2π)n/2 u; · v.
(c) Beweis des Faltungssatzes 2.6 (c).
Zum Beweis der Formel u; ∗ v = (2π)n/2 u /·/v für L1 –Funktionen u, v müssen wir
die Lebesguesche Integrationstheorie heranziehen. Die Konvergenz der nachfol-
genden Integrale und die Vertauschbarkeit der Integrationsreihenfolge stützen
sich auf den Satz von Tonelli § 8 : 1.8: Seien u, v Lebesgue–integrierbar und für
Ê
festes x ∈ n sei

f (y, z) := c(x, y, z) u(y) v(z − y)

mit einer stetigen Funktion c vom Betrag 1. Dann existiert das Integral
 
|c(x, y, z) f (y, z)| dn z = |u(y)| · |v(z − y)| dn z = |u(y)| · v1

und ist als Funktion von y über den Ê n


integrierbar. Damit ist f über Ê2n

integrierbar, und es gilt


   
f (y, z) dn y dn z = f (y, z) dn z dn y .

Mit c(x, y, z) = 1 folgt die Existenz von (u ∗ v)(x) f.ü. und u ∗ v ∈ L1 . Setzen
wir c(x, y, z) = exp(−i x , y ) exp(−i x , y − z ), so ergibt sich
 
(2π)n/2 u;
∗ v(x) = u(y) v(z − y) dn y e−i x , z  dn z
 
= u(y) e−i x , y  v(z − y) e−i x , z−y  dn y dn z
 
= u(y) e−i x , y  v(z − y) e−i x , z−y  dn z dn y .

Durch Substitution z − y → z im zweiten Integral erhalten wir


 
(2π)n/2 u;
∗ v(x) = u(y) e−i x , y  v(z) e−i x , z  dn z dn y
/(x) /
= (2π) u n
v(x) . 2
298 § 12 Die Fouriertransformation

4 Die Fouriertransformation auf L2 ( Ê) n

4.1 Die Fouriertransformation als unitärer Operator auf S ( Ê)n

Die Fouriertransformation  vermittelt eine unitäre Abbildung des mit dem L2 –


Skalarprodukt u , v = u v versehenen Schwartzraums S := S ( ) auf n
Ê
sich.
Für u, v ∈ S gilt die Formel von Parseval–Plancherel
u, v /, /
= u v ,
insbesondere ist
 
|u(x)|2 dn x = /(y)|2 dn y .
|u

Beweis.
Für u, v ∈ S sei g := u/ . Nach 3.4 (b) gilt g = S /
u, also /
g=u ÜA . Mit Hilfe
der Wälzformel 2.3 (a) folgt hieraus
   
u, v = uv = /
gv = g/
v= //
u /, /
v = u v . 2

4.2 Die Fouriertransformation auf L2 ( Ê)


n

Satz. Die Fouriertransformation F : S → S läßt sich auf eindeutig bestimmte


Weise zu einer unitären Abbildung
F : L2 ( Ê n
) → L2 ( Ê)
n

fortsetzen. Für die Umkehrabbildung von F gilt


F −1 = SF = FS ,
wobei S : L2 ( Ê n
) → L2 ( Ê ) die Punktspiegelung (Su)(x) := u(−x) bedeutet.
n

Beweis.
S ist ein dichter Teilraum von L2 , denn es gilt C∞ c ⊂ S ⊂ L2 , und C∞ c
liegt dicht in L (§ 10 : 3.3). Die Fouriertransformation F : S → S
2
und ihre
Inverse F −1 sind bezüglich des L2 –Skalarproduktes Isometrien auf S . Nach
§ 10 : 5.1 (b) besitzen F und F −1 eindeutig bestimmte Fortsetzungen F und G
auf L2 . Beide sind stetige lineare Operatoren auf L2 und es gilt
Fu = lim F uk , Gu = lim F −1 uk , falls u = lim uk mit uk ∈ S .
k→∞ k→∞ k→∞

Da auch S eine unitäre Abbildung auf L2 ist, ergibt sich für jedes u ∈ L2 durch
Grenzübergang
G Fu = F G u = u , SF u = F Su = G u , SF 2 u = u ,
F u = u = G u .
Dies zeigt, dass F invertierbar und isometrisch ist und dass G = F −1 = S 2 F.
2
5 Anwendungen 299

Bemerkung. Es gibt L2 –Funktionen u, die keine L1 –Funktionen sind, z.B.


u(x) = (1 + xn )−1 , vgl. § 11 : 2.4, Folgerung (i). Für solche läßt sich (Fu)(y)
nicht durch das Integral (2π)−n/2 e−i x , y  u(x) dn x darstellen.
Setzen wir aber

vr (y) := (2π)−n/2 e−i x , y  u(x) dn x ,
x≤r
so gilt
Fu = L2 –lim vrk für jede Radienfolge rk → ∞ ,
k→∞
Fu = lim vsk f.ü. für eine geeignete Radienfolge sk → ∞ .
k→∞

Denn es gilt vr = Fur mit ur := u χKr (0) . Da u als L2 –Funktion lokalinte-


grierbar ist (§ 8 : 2.5 (c)), und da |u|2 eine integrierbare Majorante für |ur |2 ist,
gilt ur ∈ L1 ∩ L2 und  u − urk 2 → 0 nach dem Satz über die majorisierte
Konvergenz § 8 : 2.1 (d) (ii), somit wegen der Isometrieeigenschaft von F

 Fu − vrk 2 =  Fu − Furk 2 =  u − urk 2 → 0 .

Nach dem Satz von Fischer–Riesz § 8 : 2.1 gibt es dann eine Teilfolge (vsk ), die
punktweise f.ü. gegen Fu konvergiert.

5 Anwendungen
5.1 Die Differentialgleichung −(Δ + λ) u = f in S
Satz. Die Differentialgleichung
(∗) − (Δ + λ) u = f mit f ∈ S
besitzt für λ ∈ \ + genau eine Lösung u ∈ S . Für λ ≥ 0 ist (∗) nicht
universell lösbar, d.h. hat nicht für jedes f ∈ S eine Lösung u ∈ S .

Beweis.
Für u, f ∈ S ist die Gleichung (∗) nach dem P ,Q–Gesetz 3.3 (c) und nach dem
Umkehrsatz 3.4 (a) äquivalent zu

(∗∗) /(y) = f/(y) für alle y ∈
y2 − λ u n
.


Im Fall λ ∈ \ + ist g(y) := (y − λ)−1 eine beschränkte C∞ –Funktion,
2

somit gehört für gegebenes f ∈ S die Funktion h := g f/ zu S , vgl. 3.2 (e). Die
durch
u(y) = /
h(−y)
/ = h die
definierte Funktion u ist schnellfallend (3.2 (c)) und erfüllt wegen u
Gleichung (∗∗), also auch (∗).
300 § 12 Die Fouriertransformation

Ê
Im Fall λ ∈ + wählen wir f (x) = e− 2 x . Nach 2.5 ist f/ = f , also hat
1 2

f/ keine Nullstellen. Somit kann (∗∗) nicht gelten, denn die linke Seite besitzt
Nullstellen. 2

Bemerkungen. (a) Im Falle λ ∈ \+ , also = dist (λ, + ) > 0 gilt für die
oben definierte Funktion h bezüglich der L2 –Norm h ≤ f/ = f . Wegen
der L2 – Isometrie der Fouriertransformation folgt u = S/ h = h ≤ f ,
also hängt die Lösung von (∗) im L2 –Sinn stetig von der rechten Seite ab.
(b) Für n = 1 und λ = −a2 mit a > 0 gilt für die Lösung u von (∗)
1 √ 1 −a|x|
/(y) =
(∗∗) u f/(y) = 2π f/(y) /
v(y) mit v(x) = e ,
a2 +y 2 2a

vgl. das Beispiel 2.1 (ii). Nach dem Faltungssatz 2.6 (c) für L1 –Funktionen gilt

2π f/ /
v = f;
∗ v, und wegen der Injektivität der Fouriertransformation folgt
+∞
1
u(x) = (f ∗ v)(x) = e−a|x−y| f (y) dy .
2a
−∞

5.2 Die Vollständigkeit der Hermite–Funktionen


(a) In § 4 : 3.3 wurde gezeigt, dass durch das Hermite–Polynom
2 dn −x2
Hn (x) = (−1)n ex e (n = 0, 1, . . . )
dxn
ein Polynom n–ter Ordnung mit höchstem Koeffizienten 2n gegeben ist, welches
die DG Hn (x) = 2xHn (x) − 2nHn (x) erfüllt. Ferner gilt die Rekursionsformel
Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) (n = 1, 2, . . .).
(b) Die Hermite–Funktionen h0 , h1 , h2 , . . . sind definiert durch
1 2 √
hn (x) := cn e− 2 x Hn (x) mit cn = ( π n! 2n )−1/2 .

Die Hermite–Funktionen sind nach 3.2 (d) schnellfallend und erfüllen die Her-
mitesche Differentialgleichung ÜA

−hn (x) + x2 hn (x) v = (2n + 1) hn (x) ,

welche beim Separationsansatz für die Schrödingergleichung des quantenmecha-


nischen harmonischen Oszillators anfällt (§ 24 : 3.4).
Aus der Definition der Hn folgt unmittelbar ÜA Hn (x) = 2x Hn (x)−Hn+1 (x);
daraus erhalten wir die Rekursionsformel ÜA

2(n + 1) hn+1 = x · hn − hn = Qhn − iP hn .


5 Anwendungen 301

Definitionsgemäß ist h0 (x) = π − 4 e− 2 x , also :


1 1 2
h0 = h0 nach 2.5 (a). Aus der
Rekursionsformel und dem P ,Q–Gesetz 3.3 (c) erhalten wir durch Induktion
ÜA :

Die Hermite–Funktionen sind Eigenfunktionen der Fouriertransformation:


:n = (−i)n hn .
h

(c) Satz. Die Hermite–Funktionen bilden ein vollständiges ONS für L2 ( ). Ê


Beweis.
2
(i) Die Orthogonalitätsrelation für die Hn . Mit (x) := e−x gilt Hn =
n −1 (n)
(−1) , also ergibt m–malige partielle Integration für n ≥ m


+∞ +∞ +∞  (m)
Hm Hn = (−1)n (n)
Hm = . . . = (−1)n−m (n−m)
Hm .
−∞ −∞ −∞

Für n > m ergibt eine weitere partielle Integration


+∞ 
+∞
(m+1)
Hm Hn = (−1)n−m−1 (n−m−1)
Hm = 0
−∞ −∞

wegen Grad Hm = m. Da Hn den höchsten Koeffizienten 2n besitzt, folgt für


m=n

+∞ 
+∞ 
+∞
2
e−x dx
(n)
Hn2 = Hn = n! 2n
−∞ −∞ −∞

+∞
−1 y2 √
= n! 2n √1
2
e 2 dy = π n! 2n .
−∞

(ii) Die hn bilden ein ONS , denn aus (i) folgt


+∞ 
+∞ 
+∞
hm hn = cm cn Hm Hn = c2n δmn Hn2 = δmn .
−∞ −∞ −∞

(iii) Die Vollständigkeit der Hermite–Funktionen. Wir verwenden das Kriterium



Ê
§ 9 : 4.4 (e). Sei f ∈ L2 ( ) orthogonal zu allen hn . Um f = 0 zu zeigen, setzen

wir g := f . Wegen f ∈ L2 und ∈ L2 gilt g ∈ L1 . Wenn /g = 0 nach-
gewiesen ist, folgt g = 0 wegen der Injektivität der Fouriertransformation auf
L1 2.6 (a), also auch f = 0.
Zum Nachweis von /
g = 0 beachten wir, dass nach Voraussetzung


+∞ 
1 +∞
g Hn = f hn = 0 für n = 0, 1, 2, . . . .
−∞
cn −∞
302 § 12 Die Fouriertransformation

Wegen Grad (Hn ) = n ist jedes Polynom eine Linearkombination geeigneter


Hn , daher folgt

+∞
g(y) p(y) dy = 0 für jedes Polynom p.
−∞

Insbesondere ergibt sich für festes x ∈ Ê



+∞ 
n
(−ixy)k
g(y) sn (x, y) dy = 0 mit sn (x, y) := .
−∞ k=0 k!

Die Funktion h(x) := exp(− 41 x2 ) | f (x) | gehört zu L1 , und es gilt


n
|xy|k 
|g(y) sn (x, y)| ≤ | g(y )| ≤ exp |xy| − 14 y 2 h(y ) ≤ c(x) h(y)
k=0 k!

mit einer nur von x abhängigen Konstanten c(x). Mit Hilfe des Satzes von Le-
besgue (§ 8 : 1.6 (a)) erhalten wir schließlich

√ 
+∞ 
+∞
2π /
g (x) = lim g(y) sn (x, y) dy = lim g(y) sn (x, y) dy = 0 .
n→∞ n→∞
−∞ −∞
2

(d) Folgerung. Der Vektorraum


  
Ê→
+∞
2
H = u: | u messbar und e−x |u(x)|2 dx < ∞ ,
−∞

versehen mit dem gewichteten Skalarprodukt



+∞
2
u, v  = e−x u(x) v(x) dx
−∞

ist ein Hilbertraum, und die normierten Hermite–Polynome cn Hn (n ∈ 0 )


bilden ein vollständiges ONS für H .

Beweis.

u ∈ L2 (). Ferner ist (un )
2
Sei wieder (x) := e−x . Dann gilt u ∈ H ⇐⇒

genau dann eine Cauchy–Folge in H , wenn die fn := un eine Cauchy–Folge
1
in L2 bilden. Für deren L2 –Limes f und u := ( )− 2 f gilt

+∞ +∞ 
| u − un |2 = | f − fn |2 → 0 .
−∞ −∞

Also ist H vollständig. Ist u ∈ H orthogonal zu allen Hn , so ist die Funktion



f := g ∈ L2 orthogonal zu allen hn , also f = 0 und somit auch g = 0. 2
303

§ 13 Schwache Lösungen und Distributionen


Vorkenntnisse: § 10 : 1–4, Greensche–Identitäten § 11 : 4, Lebesgue–Theorie § 8
(für Abschnitt 5), Fouriertransformation auf S § 12 : 3 (für Abschnitt 6).

1 Schwache Lösungen von Differentialgleichungen


1.1 Gründe für eine Erweiterung des Lösungsbegriffs
Ziel dieses Abschnitts ist, einen erweiterten Lösungsbegriffs für Differentialglei-
chungen festzulegen, durch welchen auch Funktionen Lösungen genannt werden
können, die nicht die volle, von der Differentialgleichung geforderte Differen-
zierbarkeitsstufe besitzen, z.B. Funktionen, deren Ableitungen Unstetigkeitstel-
len aufweisen. Dass eine solche Erweiterung wünschenswert ist, wurde schon in
Kap. III an mehreren Stellen deutlich:
– Die Wellengleichung ∂ 2 u/∂t2 = c2 ∂ 2 u/∂x2 in ]0, L[ × Ê besitzt bei gege-
bener Anfangsauslenkung f (x) = u(x, 0) nur dann eine C2 –differenzierbare
Lösung u, wenn f neben der Einspannbedingung f (0) = f (L) = 0 noch die
weitere Bedingung f  (0) = f  (L) = 0 erfüllt. Diese Feststellung machte schon
d’Alembert, der daher seiner Lösungsformel § 6 : 3.4 die Anwendbarkeit auf
allgemeinere Situationen, wie etwa bei einer Anfangsgestalt der Saite mit ei-
nem Knick, absprach. Euler hielt dem entgegen, dass auch in einem solchen
Fall das Verhalten der Saite beschrieben werden müsse und dass eben die
d’Alembertsche Formel dies leiste. Um dem Rechnung zu tragen und die durch
die d’Alembertsche Formel gegebene Funktion u eine Lösung des Schwingungs-
problems zu nennen, muss der Begriff der Lösung der Wellengleichung weiter
gefasst werden.
– Die Lösungsformel § 6 : 3.7 (∗∗) für die inhomogene Wellengleichung liefert nur
unter restriktiven Bedingungen an die äußere Kraft eine C2 –Lösung des Saiten-
problems. Schon für das dort gestellte Problem der schweren Saite (Aufgabe
(b)) ist die genannte Formel nicht anwendbar.
– Beim Verkehrsflussproblem § 7 : 1.7 zeigte sich, dass differenzierbare Lösungen
in den meisten Fällen nur für ein beschränktes maximales Zeitintervall [0, t∗ [ exi-
stieren und dass diese für t → t∗ in Funktionen mit Singularitäten übergehen.
Unstetigkeitsphänomene treten auch bei den Gleichungen der Strömungsmecha-
nik auf (Turbulenz, Schockwellen).

1.2 Der Begriff der schwachen Lösung


Gegeben sei ein linearer Differentialoperator m–ter Ordnung auf dem Ê n
,
 α
L = aα ∂
|α|≤m

mit konstanten Koeffizienten aα ∈ Ê und n–dimensionalen Multiindizes α .


304 § 13 Schwache Lösungen und Distributionen

Ê
Eine Funktion u ∈ L1loc (Ω) ( Ω ⊂ n ein Gebiet) heißt eine schwache Lösung
von Lu = f , wenn f ∈ L1loc (Ω) gilt und
 
u L∗ ϕ dn x = f ϕ dn x für alle Testfunktionen ϕ ∈ C∞
c (Ω) .
Ω Ω

Dabei ist

L∗ = (−1)|α| aα ∂ α
|α|≤m

der zu L formal adjungierte Differentialoperator, vgl. § 11 : 4.2.


Eine Lösung u ∈ Cm (Ω) von Lu = f mit f ∈ C0 (Ω) nennen wir im Unter-
schied hierzu eine klassische Lösung.

Satz. Jede klassische Lösung von Lu = f mit f ∈ C0 (Ω) ist auch eine
schwache. Eine schwache Lösung ist eine klassische Lösung, wenn sie Cm –
differenzierbar ist.
Denn für u ∈ Cm (Ω), f ∈ C0 (Ω) ergibt sich mit den Greenschen Identitäten
§ 11 : 4.2 (b) und (c)
  
(Lu − f ) ϕ = u L∗ ϕ − fϕ für alle ϕ ∈ C∞
c (Ω) .
Ω Ω Ω

Die Behauptung folgt mit Hilfe des Lemmas von Du Bois–Reymond § 10 : 4.2.

Bemerkungen. Schwache Lösungen sind in zweierlei Hinsicht von Interesse:


(i) Zum einen können sie zur Beschreibung physikalischer Vorgänge in Fällen
wie den oben erwähnten dienen, in denen keine klassische Lösung existiert. Dies
tritt z.B. dann ein, wenn der Problemstellung ein Variationsprinzip zugrunde-
liegt, das schon in der Formulierung nicht die volle Differenzierbarkeit verlangt.
(ii) Zum anderen ist das Aufsuchen einer schwachen Lösung häufig ein Zwi-
schenschritt zur Gewinnung einer klassischen Lösung: Es wird zunächst eine
schwache Lösung konstruiert, entweder mit Hilfe von Potentialen (vgl. 5.3) oder
durch Anwendung von Variationsmethoden, vgl. 6.3. In einem zweiten Schritt
wird dann gezeigt, dass diese die gewünschten Differenzierbarkeitseigenschaften
hat.

1.3 Schwache Lösungen der eindimensionalen Wellengleichung


Satz. Die d’Alembertsche Formel 3.4 u(x, t) = 21 (f (x + ct) + f (x − ct)) liefert
Ê
für jedes f ∈ C0 ( ) eine schwache Lösung der Wellengleichung

Ê
2
∂ u ∂2u
2
= c2 in 2
∂t ∂x2
∂u
mit u(x, 0) = f (x) und ∂t
(x, 0) = 0 in allen Differenzierbarkeitsstellen von f .
1 Schwache Lösungen von Differentialgleichungen 305

Beweis.
O.B.d.A. setzen wir c = 1. Sei ϕ ∈ C∞ Ê
c ( ) gegeben und r > 0 so gewählt, dass
supp ϕ ⊂ Q := ] − r, r [2 . Wir führen charakteristische Koordinaten ein durch
die Transformation h : 2 → 2 mit Ê Ê
  x + t
1 ξ+η
h(ξ, η) = , h−1 (x, t) = .
2 ξ−η x−t

Es gilt | det dh(ξ, η)| = 12 , und h−1 (Q) ⊂ 2Q :=] − 2r, 2r [2 ist ein auf der
Spitze stehendes Quadrat. Für ψ := ϕ◦h gilt ψ ∈ C∞ c (
2
) und supp ψ ⊂ 2Q , Ê
denn aus ψ(ξ, η) = 0 folgt h(ξ, η) ∈ Q , also (ξ, η) ∈ 2Q. Ferner gilt ÜA

1 ∂2ϕ ∂2ϕ
∂ξ ∂η ψ = (Lϕ) ◦ h mit Lϕ = 2
− .
4 ∂x ∂t2

Nach dem Transformationssatz für Integrale folgt


  
u L∗ ϕ dx dt = u Lϕ dx dt = (f (ξ) + f (η)) ∂ξ ∂η ψ(ξ, η) dξ dη
Ê2 Ê2 2Q

2r  2r
= f (ξ) ∂η (∂ξ ψ(ξ, η)) dη dξ
−2r −2r

2r  2r
+ f (η) ∂ξ (∂η ψ(ξ, η)) dξ dη = 0
−2r −2r

wegen supp ψ ⊂ 2Q. Die Anfangsbedingungen sind leicht zu verifizieren. 2

1.4 Aufgabe
Zeigen Sie: Das Einschaltproblem für
den RL–Schwingkreis (Fig.) mit der R
DG
˙ R 1 U (t) I(t)
I(t) + I(t) = U (t)
L L
und (
U0 für t ≥ 0
U (t) := , L
0 für t < 0

hat die schwache Lösung


  R
 <
I0 1 − e− L t für t ≥ 0 U0
I(t) = mit I0 = .
0 für t < 0 R
306 § 13 Schwache Lösungen und Distributionen

2 Distributionen
2.1 Einführung
Wir beschränken uns hier auf die Grundkonzepte der Distributionentheorie.
Als weiterführende Werke nennen wir Schwartz [42], Wladimirow [56], Gel-
fand–Schilow [38] und Hörmander [63]. Distributionen verwenden wir in
erster Linie dazu, den Begriff der Grundlösung einer Differentialgleichung durch-
sichtig zu machen, schwache Ableitungen zu definieren und damit den Begriff
der schwachen Lösung einfacher formulieren zu können. Ferner soll mit ihrer
Hilfe die Fouriertransformation für Funktionen definiert werden, die nicht zu L1
oder L2 gehören, z.B. für Polynome.
Anlass für die Schaffung der Distributionentheorie gab eine Entwicklung in der
Analysis, die von Leibniz, Euler und Lagrange ausging und die zu den sym-
bolischen Methoden u.a. von Boole, Heaviside und Dirac führte, nämlich
die Auffassung der Analysis und ihrer Operationen Differentiation, Integrati-
on, Reihenbildung usw. als Kalkül nach dem Vorbild der Algebra. Dies war
zwar äußerst suggestiv, führte aber mangels begrifflicher Grundlagen bald zum
Meinungsstreit über die Berechtigung des Kalküls und auf Widersprüche.
Euler hatte keine Bedenken, physikalische Funktionen“, z.B. solche mit Knik-

ken, zu differenzieren oder mit divergenten Funktionenreihen zu rechnen. Dirac
führte 1926 für die Zwecke der Quantenmechanik eine uneigentliche“ Funktion

δ ein mit

+∞
ϕ(x) δ(x − a) dx = ϕ(a)
−∞

Ê
für alle Wellenfunktionen ϕ ∈ S und alle a ∈ . Eine Funktion δ mit dieser
Eigenschaft kann es nicht geben, denn für eine solche wäre

+∞
δ(x) dx = 1
−∞

(wie sich mit Hilfe der Testfunktionen ϕ = jε ∗ χ[−n,n] ergibt), andererseits


ergäbe sich δ(x) = 0 f.ü. durch Testen mit passenden Standardbuckeln.
Die um 1945 von Laurent Schwartz entwickelte Theorie der Distributionen gab
diesen Ansätzen eine solide mathematische Grundlage. Ihr Ausgangspunkt ist
die Beobachtung, dass eine lokalintegrable Funktion f : n → Ê ohne Verlust
an Information durch die Linearform

ϕ → c ( ) →
C∞ n
fϕ,
ersetzt werden kann (vgl.2.3). Es ist zum Beispiel unnötig, von der “δ–Funktion“
zu sprechen; es kommt nur auf die Linearform δa : ϕ → ϕ(a) an. Entsprechend

kann für einen linearen Differentialoperator L die Linearform ϕ → uL∗ϕ stell-
 Ω
vertretend für ϕ → (Lu) ϕ herangezogen werden, wenn Lu nicht existiert.
Ω
2 Distributionen 307

2.2 Definition
Auf dem Raum D := C∞ c (
n
Ê
) der komplexwertigen Testfunktionen definieren
wir den folgenden Konvergenzbegriff.
D
ϕk −→ ϕ für k → ∞ soll heißen:

Es gibt eine kompakte Menge K ⊂ Ê n


mit supp ϕk ⊂ K für k = 1, 2, . . . , und
für jeden Multiindex α gilt

∂ α ϕk → ∂ α ϕ gleichmäßig für k → ∞.

Aufgrund dieser Definition ist ϕ → ∂ β ϕ ein stetiger Operator auf D :


D D
ϕk −→ ϕ =⇒ ∂ β ϕk −→ ∂ β ϕ für jeden Multiindex β.

Eine Distribution oder verallgemeinerte Funktion auf Ê n


ist eine stetige
Linearform U : D → , d.h. es gilt

(a) U (aϕ + b ψ) = aU ϕ + bU ψ für a, b ∈ , ϕ, ψ ∈ D ,

D
(b) ϕk −→ ϕ =⇒ U ϕk → U ϕ für k → ∞ .

Der Vektorraum der Distributionen wird mit D  bezeichnet.

Beispiele. (i) Die Dirac–Distribution δa mit Pol a ist definiert durch

δa ϕ := ϕ(a) für alle ϕ ∈ D .

Die Linearität und die Stetigkeit von δa : D → sind offensichtlich. Statt


δ0 schreiben wir einfach δ.
(ii) Für a ∈ n und jeden Multiindex α ist

ϕ −→ ∂ αϕ(a)

aufgrund des Konvergenzbegriffs auf D ebenfalls eine Distribution.

2.3 Reguläre Distributionen


Satz. (a) Jeder lokalintegrierbaren Funktion u : n → wird durch

{u} ϕ := uϕ für alle ϕ ∈ D

eine Distribution {u} zugeordnet. Distributionen dieser Form heißen regulär.

(b) Aus {u} = {v} folgt u = v f.ü..


308 § 13 Schwache Lösungen und Distributionen

Die Aussage (b) besagt, dass bei der Uminterpretation von Funktionen zu Dis-
tributionen keine Information verloren geht. Das ergibt sich direkt aus dem
Fundamentallemma § 10 : 4.2, welches somit grundlegend für die Theorie der
Distributionen ist.

Beweis von (a)


D
Sei ϕk −→ ϕ für k → ∞. Nach 2.2 gibt es eine kompakte Kugel K ⊂ n mit Ê
supp ϕk ⊂ K für k = 1, 2, . . . ; ferner gilt ϕk → ϕ gleichmäßig auf K für k → ∞.
Es folgt
  
| {u} ϕ − {u} ϕk | =  u (ϕ − ϕk )  ≤ ϕ − ϕk ∞ |u| → 0
K K

für k → ∞. Das bedeutet, dass die Linearform {u} : D → stetig ist. 2

Beispiele. (i) Für die charakteristische Funktion von + , Θ := χÊ+ ist


durch

+∞ ∞
{Θ} ϕ = Θ(x) ϕ(x) dx = ϕ(x) dx
−∞ 0

eine reguläre Distribution auf  gegeben, genannt Heaviside–Distribution.


(ii) Für einen
 linearen Differentialoperator L mit konstanten Koeffizienten lie-
fert ϕ → u L∗ ϕ für jede lokalintegrierbare Funktion u eine Distribution
Ω
∗ D
(L ist der zu L formal adjungierte Operator). Denn aus ϕk −→ ϕ folgt
D  
L∗ ϕk −→ L∗ ϕ . Wie im Beweis (a) folgt u L∗ ϕk → u L∗ ϕ . Diese Distribu-
tion ist regulär und hat die Form {f }, wenn u eine schwache Lösung von Lu = f
ist, vgl. 1.2.

2.4 Singuläre Distributionen


Jede nicht reguläre Distribution wird singulär genannt.

Die Dirac–Distribution δa ist singulär .


Denn angenommen, es gilt δa = {u} mit einer lokalintegrierbaren Funktion
u : n → . Für jede Testfunktion ϕ ist dann auch ψ(x) = x − a2 ϕ(x)
eine Testfunktion, also gilt

0 = ψ(a) = δa ψ = {u} ψ = u(x) x − a2 ϕ(x) dn x .

Nach dem Fundamentallemma § 10 : 4.2 folgt x − a2 u(x) = 0 f.ü., also auch
u(x) = 0 f.ü. und damit δa = {u} = 0, was ein Widerspruch ist.
3 Konvergenz von Distributionenfolgen 309


Dennoch ziehen viele Autoren die griffige Symbolik ϕ(x) δ(x − a) dn x der
etwas blassen Notation δa ϕ vor. Dagegen ist auch nichts einzuwenden, solan-
ge das Symbol δ(x − a) unter dem Integral bleibt und sich nicht als Dirac–

Funktion“
 verselbstständigt. Es sei angemerkt, dass sich δa ϕ durchaus als In-
tegral ϕ(x) dμ(x) auffassen läßt. Dies setzt aber den Begriff der Integration
bezüglich eines Maßes μ voraus, siehe § 20.
ÜA Zeigen Sie, dass ϕ → ∂ α ϕ(a) eine singuläre Distribution ist.

3 Konvergenz von Distributionenfolgen


3.1 Definition und Beispiele
Die Konvergenz einer Folge (Uk ) von Distributionen gegen die Distribution U
definieren wir durch
D
Uk −→ U : ⇐⇒ lim Uk ϕ = U ϕ für jede Testfunktion ϕ ∈ D .
k→∞

Für lokalintegrierbare Funktionen uk , u sprechen wir von Konvergenz im


Distributionensinn, wenn

D
{uk } −→ {u} für k → ∞, d.h. wenn
 
lim uk ϕ = uϕ für jede Testfunktion ϕ ∈ D gilt.
k→∞

Beispiel. Die Funktionenfolgen (sin kx) bzw. (sin2 kx) besitzen keinen punkt-
weisen Grenzwert. Sie konvergieren aber im Distributionensinn gegen die kon-
stanten Funktionen 0 bzw. 1/2. Das ergibt sich mit Hilfe partieller Integration
ÜA .

3.2 Die Dirac–Distribution als Limes von Dirac–Folgen


Eine Familie (ur )r>0 von stetigen Funktionen ur auf Ê n
heißt eine im Punkt
a konzentrierte Dirac–Folge, wenn

ur ≥ 0 , supp ur ⊂ Kr (a) , ur (x) dn x = 1 .

Beispiel. ur (x) = jr (x − a) = jr (a − x), vgl. § 10 : 1.2.

Satz. Für jede im Punkt a konzentrierte Dirac–Folge (ur ) gilt

D
{ur } −→ δa für r → 0 .
310 § 13 Schwache Lösungen und Distributionen

Beweis.
Sei ε > 0 gegeben und ϕ eine Testfunktion. Da ϕ stetig ist, gibt es ein δ > 0
mit |ϕ(x) − ϕ(a)| < ε, falls x − a < δ. Wegen ur (x) dn x = 1 und ur ≥ 0
gilt für r < δ
 
| {ur } ϕ − δa ϕ | = | {ur } ϕ − ϕ(a) | =  ur (x) (ϕ(x) − ϕ(a)) dn x 
 
≤ ur (x) |ϕ(x) − ϕ(a)| dn x < ε ur (x) dn x = ε . 2

Bemerkungen. (a) Für jede im Punkt a konzentrierte Dirac–Folge (ur ) gilt


lim ur (x) = 0 für x = a, lim ur (a) = ∞. Der Satz gibt die korrekte Fassung
r→0 r→0
der häufig anzutreffenden Schreibweise lim ur (x) = δ(x − a) .
r→0

(b) Das folgende Kriterium entnehmen wir Schwartz [42] II.4, Satz 13:

Satz. Es gilt lim {uk } = δ für jede Folge (uk ) stetiger Funktionen mit folgen-
k→∞
den Eigenschaften:
(i) Es gibt ein R > 0 mit uk (x) ≥ 0 für x < R und k = 1, 2, . . . ,
(ii) uk (x) → 0 gleichmäßig auf jeder Kugelschale {x ∈

Ê n
| 1
r
≤ x ≤ r},
n
(iii) lim uk (x) d x = 1 für jedes r > 0.
k→∞
Kr (0)

Die genannten Voraussetzungen sind beispielsweise erfüllt für


 n2
1 k 1 2
uk (x) = sin kx (n = 1) und uk (x) = e− 4 kx ÜA .
πx 4π

3.3 Punktladungen und Punktmassen


(a) Ist (ur ) eine im Punkt a konzentrierte Dirac–Folge, so bietet sich die Vor-
stellung von Ladungsdichten ur der Gesamtladung 1 an, die für r → 0 immer
schärfer lokalisiert sind. Daher dient δa als mathematisches Modell für den
idealisierten Fall der Ladungsdichte einer Punktladung 1 an der Stelle a. Die
Distribution

q1 δa1 + . . . + qN δaN

wird als Verteilung von N Punktladungen q1 , . . . , qN an den Stellen a1 , . . . , aN


interpretiert; entsprechend m1 δa1 + . . . + mN δaN als Massendichte eines Sy-
stems von N Massenpunkten mit den Massen mk > 0.
(b) Flächenladungen werden ebenfalls durch Distributionen beschrieben, und
zwar mittels gewichteter Oberflächenintegrale über Testfunktionen, vgl. Wladi-
mirow [56] § 6.5 und Schwartz [42] II.1. Diese Betrachtungsweisen mag formale
Vorzüge haben; der begriffliche Aufwand für eine mathematisch strenge Hand-
habung ist aber derart, dass der Distributionenkalkül letztlich als schwerfällig
4 Differentiation von Distributionen 311

anzusehen ist. Wesentlich einfacher ist die einheitliche Auffassung diskreter und
kontinuierlicher Ladungs– oder Massenverteilungen als Maße, vgl. § 20.

3.4 Distributionen als Limites von Testfunktionen


Satz. Für jede Distribution U gibt es eine Folge (uk ) von Testfunktionen mit
D
{uk } −→ U für k → ∞ .

Dieser Satz, dessen Beweis in Wladimirow [56] § 7.7 gegeben wird, dient hier
nur als Hintergrundinformation. Zum einen stellt er die Verbindung zu dem
folgenden allgemeineren Distributionenbegriff her (Mikusinski 1948):
 (uk ) eine Folge von Testfunktionen mit der Eigenschaft, dass die Folge
Sei
( uk ϕ ) für jede Testfunktion ϕ konvergiert. Dann ist durch

M ϕ := lim uk ϕ
k→∞

eine Distribution im Sinne von Mikusinski gegeben. Jede durch 2.1 definierte
Distribution U ist demnach auch eine Distribution im erweiterten Sinn. Eine
Übersicht über andere Varianten des Mikusinskischen Ansatzes finden Sie bei
Temple [44].
Zum anderen gibt der Satz einen Hinweis darauf, wie die Differentiation von
Distributionen im folgenden zu definieren ist.

4 Differentiation von Distributionen


4.1 Der Ableitungsbegriff für Distributionen
Der Ableitungsbegriff für Distributionen soll folgenden Forderungen genügen:
(a) Für jede Distribution U und jeden Multiindex α ist ∂ α U wieder eine Dis-
tribution.
(b) Für Testfunktionen u gilt ∂ α {u} = {∂ α u} .
D
(c) Differentiation und Grenzübergang sind vertauschbar, d.h. aus Uk −→ U
D
für k → ∞ folgt ∂ α Uk −→ ∂ α U für k → ∞ und jeden Multiindex α.
Aus der Forderung (b) folgt nach dem Satz § 11 : 3.3 über partielle Integration
 
∂ α {u} ϕ = {∂ α u} ϕ = ∂ α u ϕ = (−1)|α| u ∂ α ϕ = (−1)|α| {u} ∂ α ϕ

für alle ϕ ∈ D .
Nach 3.3 gibt es zu U ∈ D  Testfunktionen {uk } mit {uk } ϕ → U ϕ für alle
Testfunktionen ϕ. Die Forderung (c) verlangt daher

(∂ α U ) ϕ = lim (∂ α {uk }) ϕ = lim (−1)|α| {uk } ∂ α ϕ = (−1)|α| U (∂ α ϕ) .


k→∞ k→∞
312 § 13 Schwache Lösungen und Distributionen

Satz. Für jede Distribution U und jeden Multiindex α ist durch

(∂ α U ) ϕ := (−1)|α| U (∂ α ϕ) für alle ϕ ∈ D

eine Distribution ∂ α U gegeben.


D D
Aus Uk −→ U für k→∞ folgt ∂ α Uk −→ ∂ α U für k → ∞.

Beweis.
D D
(i) ∂ α U : D → ist linear. Aus ϕk −→ ϕ folgt ∂ α ϕk −→ ∂ α ϕ nach 2.2. Da
U eine Distribution ist, folgt daraus für k → ∞

(∂ α U ) ϕk = (−1)|α| U (∂ α ϕk ) → (−1)|α| U (∂ α ϕ) = (∂ α U ) ϕ .
D
(ii) Sei Uk −→ U , d.h. Uk ϕ → U ϕ für alle Testfunktionen ϕ. Dann folgt

(∂ α Uk ) ϕ = (−1)|α| Uk (∂ α ϕ) → (−1)|α| U (∂ α ϕ) = (∂ α U ) ϕ

für alle ϕ ∈ D , somit ∂ α Uk → ∂ α U für k → ∞. 2

4.2 Beispiele
(a) Für die Heaviside–Funktion Θ = χÊ+ gilt {Θ} = δ. Denn ist ϕ eine
Testfunktion mit supp ϕ ⊂ ] − R, R [ , so gilt definitionsgemäß

∞ R
{Θ} ϕ = −{Θ} ϕ = − ϕ = − ϕ = ϕ(0) − ϕ(R) = ϕ(0) .
0 0

(b) Die Ableitungen der Dirac–Distribution δa ergeben sich nach Definition


aus

(∂ α δa ) ϕ = (−1)|α| (∂ α ϕ)(a) .

n 
n
(c) Sei L = aik ∂i ∂k + ak ∂k + a ein linearer Differentialoperator mit
i,k=1 k=1

konstanten Koeffizienten und L der zu L formal adjungierte Operator, vgl.
1.2. Dann gilt für jede lokalintegrierbare Funktion u und für ϕ ∈ D nach (b)

(L{u}) ϕ = u L∗ ϕ .

(d) Ist u : → 
abschnittsweise glatt (vgl. § 6 : 2.2 (b)) und besitzt in jedem
kompakten Intervall höchstens endlich viele Sprungstellen, so gilt

{u} = {u } + (u(x+) − u(x−)) δx .
x∈ Ê
ÜA Wie ist diese Formel zu verstehen? Beachten Sie 3.1.
4 Differentiation von Distributionen 313

(e) Für jede stetige Funktion u auf Ê gilt ÜA


{uh } → {u} für h → 0 mit uh (x) := (u(x + h) − u(x))/h .

(f) Ein Dipol der Stärke 1 an der Stelle a mit Richtungsvektor v (v = 1)
entsteht als Grenzwert beim Aneinanderrücken der Punktladungen
1 1
im Punkt a + tv und − im Punkt a.
t t
Nach der Bemerkung 3.3 (a) beschreiben wir ihn durch die Distribution

δa+tv − δa
lim .
t→∞ t
Dies ergibt sich nach (b) aus
  ϕ(a + tv) − ϕ(a)
δa+tv − δa
lim ϕ = lim = ∂v ϕ(a)
t→0 t t→0 t

3 
3
= vk ∂k ϕ(a) = − vk ∂k δa ϕ für ϕ ∈ D .
k=1 k=1


3
Für den oben definierten Grenzwert erhalten wir somit ∂v δa := − vk ∂k δa .
k=1

4.3 Das Produkt von Distributionen mit C∞ –Funktionen


(a) Für jede C∞ –Funktion a auf Ê n
und jede Distribution U auf Ên
ist durch

(aU )ϕ := U (aϕ) (ϕ ∈ D )

eine Distribution aU definiert.


(b) Für das so definierte Produkt gilt die Leibniz–Regel
 γ!
∂ γ (aU ) = ∂αa ∂β U .
α! β!
α+β=γ

Beweis.
(a) Mit ϕ ist auch aϕ eine Testfunktion, und nach § 10 : 2.2 (c) gilt die Leibniz–
Regel
 γ!
(∗) ∂ γ (a ϕ) = ∂αa ∂β ϕ .
α! · β!
α+β=γ
D
Sei ϕk −→ ϕ für k → ∞, also supp ϕk in einer kompakten Menge K für
alle k ∈ 
und ∂ β ϕk → ∂ β ϕ gleichmäßig für alle Multiindizes β. Wegen der
314 § 13 Schwache Lösungen und Distributionen

D
Beschränktheit der Funktionen ∂ α a (|α| ≤ |γ|) folgt aus (∗) a ϕk −→ a ϕ. Also
ist a U eine Distribution.
(b) Nach Definition der k–ten partiellen Ableitung einer Distribution und auf-
grund der Definition (a) erhalten wir für ϕ ∈ D

∂k (a U ) ϕ = −(a U ) ∂k ϕ = −U (a ∂k ϕ) = −U (∂k (a ϕ) − ∂k a ϕ)

= ∂k U (a ϕ) + U (∂k a ϕ) = (a ∂k U )ϕ + (∂k a U )ϕ , also

∂k (a U ) = a ∂k U + ∂k a U .

Durch nochmalige Anwendung der eben erhaltenen Regel erhalten wir weiter

∂i ∂k (a U ) = ∂i (a ∂k U + ∂k a U )
= a ∂i ∂k U + ∂i a ∂k U + ∂k a ∂i U + ∂i ∂k a U.

Die allgemeine Formel ergibt sich entsprechend durch Induktion nach |γ| ÜA .

Beispiele. Für a ∈ C∞ ( Ê n
) gilt ÜA

(i) aδ = a(0)δ , (ii) ∂k (aδ) = (∂k a)(0)δ + a(0)∂k δ .

4.4 Affine Transformationen von Distributionen


Gegeben sei eine affine Transformation

F : Ê n
→ Ê,
n
x → c + Ax

mit c ∈ Ê n
und einer invertierbaren Matrix A.
(a) Für u ∈ L1loc ( Ê n
) definieren wir F {u} durch

F {u} := {u ◦ F } .

(b) Die Definition von F U für beliebige Distributionen U fassen wir so, dass
sie mit (a) verträglich ist, vgl. 3.4. Dazu beachten wir, dass aufgrund des Trans-
formationssatzes für Integrale

F {u} ϕ = {u ◦ F } ϕ = u(F (x)) ϕ(x) dn x

= u(y) ϕ(F −1 (y)) | det A|−1 dn y = | det A|−1 {u}(ϕ ◦ F −1 ) .

Definieren wir für beliebige Distributionen U die Linearform F U durch

(F U )ϕ := |detA|−1 U (ϕ ◦ F −1 ) für alle ϕ∈D,

so ist F U eine Distribution ÜA .


5 Grundlösungen 315

5 Grundlösungen
5.1 Differentialgleichungen für Distributionen
Ê
Seien L ein linearer Differentialoperator auf dem n mit konstanten reellen
Koeffizienten und L∗ der zu L formal adjungierte Operator:
 
L = aα ∂ α , L∗ = (−1)|α| aα ∂ α .
|α|≤m |α|≤m

Für eine Distribution U auf Ên


ist nach 4.1

L U := aα ∂ α U
|α|≤m

wieder eine Distribution. Die Differentialgleichung L U = F mit einer gegebe-


nen Distribution F hat also Sinn.
Für u, f ∈ L1loc ( Ê n
) bedeutet die Differentialgleichung L{u} = {f } nach
4.2 (c)
 
u L∗ ϕ = f ϕ für alle ϕ ∈ D ,
d.h. dass u eine schwache Lösung von Lu = f ist, vgl. 1.2.

5.2 Grundlösungen
Eine Distribution U heißt Grundlösung für L an der Stelle a ∈ Ê n
(oder
mit Pol a), wenn
L U = δa .
Ist U eine Grundlösung mit Pol a, so ist Ua = τa U mit τa (x) = x − a eine
Grundlösung mit Pol 0 und umgekehrt ÜA . Es reicht also, eine Grundlösung
mit Pol 0 zu kennen; diese bezeichnen wir meistens schlechthin als Grundlö-
sung.
Eine Funktion Γ ∈ L1loc ( Ê ) mit
n

L {Γ} = δa
nennen wir ebenfalls eine (reguläre) Grundlösung für L mit Pol a . Diese Diffe-
rentialgleichung bedeutet also

Γ L∗ ϕ = ϕ(a) für jede Testfunktion ϕ ∈ D .
Die Grundlösungen eines Differentialoperators sind nicht eindeutig bestimmt.
Ê
Ist Γ ∈ L1loc ( n ) eine Grundlösung von L und u eine klassische oder schwache
Lösung der homogenen Differentialgleichung Lu = 0 , so ist auch Γ + u eine
Ê
Grundlösung. Sind umgekehrt Γ1 , Γ2 ∈ L1loc ( n ) Grundlösungen für L , so
ist u = Γ2 − Γ1 eine schwache Lösung der homogenen Gleichung, d.h. es gilt
L{u} = 0 .
316 § 13 Schwache Lösungen und Distributionen

Beispiel. Das Newton–Potential U (x) = Gm / x − a (G=Gravitations-


Ê
konstante) einer Punktmasse m im Punkt a ∈ 3 ist Lösung der Distributi-
onsgleichung

−Δ{U } = 4π Gmδa .

Der Nachweis folgt in § 14 : 2.4.

5.3 Konstruktion schwacher Lösungen aus Grundlösungen


Ê
Satz. Sei Γ ∈ L1loc ( n ) eine Grundlösung für L und f ∈ C0c ( Ê ) . Dann ist
n

durch das Faltungsintegral



u(x) := (Γ ∗ f )(x) = Γ(x − y) f (y) dn y für x ∈ Ên

eine schwache Lösung u der inhomogenen Differentialgleichung Lu = f gege-


ben.

Bemerkung. Dieser Satz ergibt sich im Wesentlichen durch Anwendung des


Superpositionsprinzips auf den linearen Operator L. Da der nachfolgende Be-
weis das nicht so deutlich zeigt, machen wir die Verwendung des Superposi-
tionsprinzips am Beispiel der Newtonschen Gravitationsgleichung − Δu = 4πf
plausibel (f = Massendichte, die Gravitationskonstante G = 1 gesetzt).
Für die “Massendichte“ f = m δy eines Massenpunktes der Masse m an der
Stelle y ist u = 4πmΓy nach dem letzten Beispiel eine Lösung. Für die
“Massendichte“
f = m 1 δ y 1 + . . . + m N δy N
von Massenpunkten mit den Massen m1 , . . . , mN an den Stellen y1 , . . . , yN
ist dann durch Superposition

N 
N
u(x) = 4π mk Γyk (x) = 4π mk Γ(x − yk )
k=1 k=1

eine Lösung von − Δ{u} = 4πf . Für eine stetige Massendichte f ∈ C0c ( 3 ) ist Ê
dann plausibel (und läßt sich auch beweisen), dass hieraus durch Grenzübergang
im Distributionssinn folgt

u(x) = 4π f (y) Γ(x − y) d3 y .

Beweis des Satzes.


Nach 5.2 gilt L{Γy } = δy , d.h.

Γ(x − y) (L∗ ϕ)(x) dn x = ϕ(y)

für alle Testfunktionen ϕ ∈ D und alle y ∈ Ê . Mit dem Satz von Fubini § 8 : 1.8
n

folgt
5 Grundlösungen 317

  
{f } ϕ = ϕ(y) f (y) dn y = Γ(x − y) (L∗ ϕ)(x) dn x f (y) dn y
 
= Γ(x − y) f (y) dn y (L∗ ϕ)(x) dn x

= u(x) (L∗ ϕ)(x) dn x) = L{u} ϕ . 2

5.4 Grundlösungen gewöhnlicher Differentialgleichungen


Für m ≥ 1 sei

m
dk
L = ak
dxk
k=0

ein linearer Differentialoperator auf Ê mit konstanten Koeffizienten ak ∈ Ê


und am = 1.
Satz. Wir erhalten eine Grundlösung Γ für L, indem wir das AWP
Lu = 0 , u(0) = . . . = u(m−2) (0) = 0 , u(m−1) (0) = 1
lösen und
(
u(x) für x ≥ 0,
Γ(x) :=
0 für x < 0
setzen.
Bemerkungen. (i) Bei Kenntnis der Nullstellen des charakteristischen Poly-

m
noms ak λk von L können wir nach § 3 : 3.3 u und damit Γ explizit angeben.
k=0

(ii) Γ(m−1) ist stetig bis auf eine Sprungstelle im Nullpunkt mit Sprunghöhe 1.
Für m ≥ 2 ist Γ Cm−2 –differenzierbar. Es läßt sich zeigen, dass jede Grundlö-
sung von L diese Differenzierbarkeitseigenschaften hat.

Beweis.
Die Lösung u des AWP ist nach § 3 : 3.3 C∞ –differenzierbar. Γ läßt sich mit
Hilfe der Heaviside–Funktion Θ (2.2 (i)) als Produkt Γ = uΘ schreiben. Nach
4.2 (d) folgt

{Γ} = {uΘ} = {(uΘ) } + (u(0) − 0)δ0 = {u Θ} + u(0)δ ,


{Γ} = {u Θ} + u (0)δ + u(0)δ  ,

und durch Induktion

{Γ}(k) = {u(k) Θ} + u(k−1) (0)δ + u(k−2) (0)δ  + . . . + u(0)δ (k−1) .

Aus u(0) = . . . = u(m−2) (0) = 0, u(m−1) (0) = 1, am = 1, Lu = 0 ergibt


sich dann
318 § 13 Schwache Lösungen und Distributionen


m &
m '
L{Γ} = ak {Γ}(k) = ak u(k) Θ + am u(m−1) (0)δ
k=0 k=0

= {(Lu) Θ} + δ = δ . 2

Aufgaben. (a) Bestimmen Sie eine Grundlösung für den Operator


d2
dx2
+ a

für die Fälle a > 0, a < 0, a = 0.


(b) Zeigen Sie direkt mit Hilfe der Definition 5.2, dass x → 12 |x| eine Grund-
d2
lösung für dx 2 ist.

(c) Bestimmen Sie den Stromverlauf IT (t) im R–L–Schwingkreis 1.4 bei An-
regung durch einen kurzen Spannungsstoß U = (U0 /T ) χ[0,T ] (T > 0), indem
Sie für die DG

˙
I(t) + R
I(t) = 1
U (t)
L L

zwei Anfangswertprobleme lösen: Zuerst auf [0, T ] mit dem Anfangswert I(0) =
0 und dann auf [T, ∞[ durch stetigen Anschluss der Lösungen an der Stelle
t = T.
Zeigen Sie: Γ(t) := lim L IT (t) ist die oben konstruierte Grundlösung für
T →0
d R
dt
+ L
.

6 Die Fouriertransformation für temperierte Distributionen

6.1 Temperierte Distributionen


Ê
(a) Zielsetzung. Die Fouriertransformation auf L1 ( n) soll für Distributionen
Ê ; = {u
T ∈ D  so fortgesetzt werden, dass für u ∈ L1 ( n ) die Gleichung {u} /} gilt.
Diese Forderung führt aufgrund der Wälzformel § 12 : 2.3 (a) auf die Bedingung
 
; ϕ = {u
{u} /} ϕ = /ϕ =
u / = {u} ϕ/ für alle ϕ ∈ D .

Daher ist es naheliegend, T/ durch T/ϕ := T ϕ / für alle ϕ ∈ D zu definieren.


Dem aber steht entgegen, dass ϕ / für alle nichtverschwindenden ϕ ∈ D keine
Testfunktion ist (§ 12 : 2.2 (c)).
Für schnellfallende Funktionen ϕ ∈ S ist dagegen auch die Fouriertransfor-
mierte ϕ/ schnellfallend (§ 12 : 3.3). Um der Definition T/ϕ := T ϕ
/ Sinn zu geben,
betrachten wir eine neue Art von Distributionen, Distributionen mit Definiti-
onsbereich S statt D :
6 Die Fouriertransformation für temperierte Distributionen 319

(b) Auf S legen wir einen Konvergenzbegriff fest durch


S
ϕk −→ ϕ ⇐⇒ xα ∂ β ϕk (x) → xα ∂ β ϕ(x) gleichmäßig auf Ê
n

für k → ∞ und jedes Paar von Multiindizes α, β.


Ê
Eine temperierte Distribution T auf n ist eine Linearform T : S → ,
welche bezüglich dieses Konvergenzbegriffs stetig ist,
S
ϕk −→ ϕ =⇒ T ϕk → T ϕ .

Die Gesamtheit S  = S  (n ) der temperierten Distributionen auf n ist auf


natürliche Weise ein Vektorraum über . Aufgrund des folgenden Satzes kann
S  als Teilraum von D  aufgefasst werden:
(c) Satz. Für jede temperierte Distribution T ist die Einschränkung U = T |D
von T auf D eine Distribution U ∈ D  . Die Restriktionsabbildung
T → T |D : S  → D 
ist injektiv .

Beweis.
D S
(i) T |D ∈ D  : Aus der Konvergenz ϕk −→ ϕ folgt ϕk −→ ϕ ÜA . (Beachten
Sie, dass die Vereinigung aller supp ϕk in einer kompakten Menge liegt, auf der
xα beschränkt ist.) Für die temperierte Distribution T folgt T ϕk → T ϕ.
(ii) Es sei T ∈ S  und T |D = 0. Wir zeigen in Lemma (d), dass es zu jedem
S
ϕ ∈ S eine Folge (ϕk ) in D gibt mit ϕk −→ ϕ. Daraus folgt dann T ϕ =
lim T ϕk = 0. Somit besteht der Kern der Restriktionsabbildung nur aus dem
k→∞
Nullfunktional. 2

(d) Lemma. Für jede schnellfallende Funktion ϕ gibt es eine Folge (ϕk ) von
S
Testfunktionen mit ϕk −→ ϕ.

Beweis.
Nach § 10 : 3.5 gibt es ein η ∈ D mit η(x) = 1 für x ≤ 1 und 0 ≤ η(x) ≤ 1
sonst. Zu gegebenem ϕ ∈ S sind durch ϕk (x) := η( k1 x) ϕ(x) für k ∈ 
Testfunktionen definiert mit ϕk (x) = ϕ(x) für x ≤ k. Für feste Multiindizes
α, β sind durch
 β! 1 μ 1
(1) ψk (x) := xα ∂ β ϕk (x) = xα ∂ η( k x) ∂ ν ϕ(x)
μ! ν! k|μ|
μ+ν=β

ebenfalls Testfunktionen ψk gegeben, und nach Wahl von η gilt

(2) ψk (x) = xα ∂ β ϕ(x) für x < k .


320 § 13 Schwache Lösungen und Distributionen

Es gibt eine Konstante C mit | ∂ μ η(x) | ≤ C für x ≤ 1 und |μ| ≤ |β| und eine
Ê
Konstante D mit | xα ∂ ν ϕ(x) | ≤ D für x ∈ n und |ν| ≤ |β|. Es folgt

ψk (x) − xα ∂ β ϕ(x) = xα ∂ β ϕ(x)(η( k1 x) − 1) + sk (x) ,

wobei sk die in (1) stehende Summe ohne das Glied mit β = 0 ist. Es gilt also
|sk (x) ≤ A/k mit einer geeigneten Konstanten A. Zu gegebenem ε > 0 wählen
wir R > 0 so, dass

| xα ϕ(x) C | ≤ ε für x ≥ R .

Dann folgt für k > R aus (1) und (2)


 
 ψk (x) − xα ∂ β ϕ(x)  ≤ ε + 1 A für x ≥ k . 2
k

(e) Beispiel. Das Dirac–Funktional ϕ → ϕ(a) auf S und dessen Ableitungen


sind temperierte Distributionen.

6.2 Reguläre temperierte Distributionen


Wir wollen nun die Fourier–Transformation auf nicht integrierbare Funktionen
ausdehnen. Hierzu geben wir eine Klasse von Funktionen an, welche reguläre
temperierte Distributionen liefert und definieren für diese Funktionen dann die
Fourier–Transformierten als temperierte Distributionen.

Satz. Unter jeder der folgenden Bedingungen ist durch



{u} : S → , ϕ→ uϕ

eine temperierte Distribution gegeben:


(a) u ∈ L1loc (n ), und es gibt ein N = 1, 2, . . . mit

|u(x)|
dn x < ∞ ,
1 + xN
(b) u ∈ Lp (n ) für ein p ≥ 1,
(c) u ist ein Polynom.

Beweis.
S
(a) Es genügt zu zeigen:
 ϕk −→ 0 =⇒  {u}ϕk →  0. Für eine Nullfolge (ϕk )
in S gilt ck := sup (1 + x ) | ϕk (x) |  x ∈ n → 0 für k → ∞. Es folgt
N

 
  |u(x)|
 u(x) ϕk (x) dn x  = (1 + xN ) | ϕk (x) | dn x
1 + xN

|u(x)|
≤ ck dn x → 0 .
1 + xN
6 Die Fouriertransformation für temperierte Distributionen 321

(b) Im Fall u ∈ L1 ( Ê n
) ist die Voraussetzung (a) mit N = 0 erfüllt.
Im Fall p > 1 sei q > 1 mit p1 + 1q = 1 gewählt. Für u ∈ Lp ( n ) und Ê
v(x) := (1 + xn )−1 gilt |v(x)|q ≤ (1 + xn q )−1 . Wegen nq > n ist |v|q
Ê
über N integrierbar (§ 11 : 2.4 Folgerung (i)). Mit der Hölderschen Ungleichung
§ 8 : 2.3 (b) folgt die Integrierbarkeit von |uv|, d.h. die Bedingung (a) ist mit
N = n erfüllt.

(c) Sei u(x) = aα xα mit m ∈ Æ. Dann gilt außerhalb des Einheitswürfels
 |α|≤m
|u(x)| ≤ |aα | xm
∞ , also gibt es wegen x∞ ≤ x eine Konstante c
|α|≤m
mit |u(x)| ≤ c xm ≤ c (1 + xm ). Mit N := m + n + 1 folgt

|u(x)|
1 + xN

c
1 + xn+1
für alle x ∈ Ê n
.

Da die rechte Seite über Ê n


integrierbar ist (§ 11 : 2.4 (i)), erfüllt u die Bedingung
(a) des Satzes. 2

6.3 Operationen mit temperierten Distributionen


Sei T eine temperierte Distribution auf Ê n
. Dann gilt
(a) Für jeden Multiindex α ist durch

(∂ α T ) ϕ := (−1)|α| T (∂ α ϕ) für alle ϕ ∈ S


α
eine temperierte Distribution ∂ T definiert.

(b) Sind sämtliche Ableitungen ∂ α a von a ∈ C∞ ( Ê n


) polynomial beschränkt
(vgl. § 12 : 3.2 (d)), so ist durch

(a T ) ϕ := T (a ϕ) für alle ϕ ∈ S

eine temperierte Distribution a T definiert.


(c) Für jede affine Abbildung

F : Ên
→ Ên
, x → c + Ax mit c ∈ Ê n
, det A = 0

ist durch

(F T )ϕ := | det A|−1 T (ϕ ◦ F −1 ) für alle ϕ ∈ S

eine temperierte Distribution T definiert. Erfüllt u eine der Bedingungen 6.2(a),


(b),(c), so gilt

F {u} = {u ◦ F }.
322 § 13 Schwache Lösungen und Distributionen

Damit sind die temperierten Distributionen


P α T := (−i)|α| ∂ α T , Qα T = xα T , ea T (ea (x) := ei x , a  )
definiert.
Desweiteren erhalten wir für die Abbildungen
1
τa (x) = x − a , μr (x) = r x, σ(x) = −x
die temperierten Distributionen
τa T , μr T , σT .

Beweis.
S S
(a) Aus ϕk −→ ϕ folgt ∂ α ϕk −→ ∂ α ϕ, denn für beliebige Multiindizes γ, β
γ γ
gilt mit (Q u)(x) = x u(x)
Qγ ∂ β (∂ α ϕk ) = Qγ ∂ β+α ϕk → Qγ ∂ β+α ϕ = Qγ ∂ β (∂ α ϕ) .
(b) Nach § 10 : 3.2 (d) gilt: ϕ ∈ S =⇒ a ϕ ∈ S . Zu zeigen bleibt
S S
ϕk −→ ϕ =⇒ a ϕk −→ a ϕ .
Dies ergibt sich aus der Leibniz–Regel (§ 10 : 2.2 (c)): Qα ∂ β (a ϕk ) ist Linearkom-
bination von Funktionen Qα ∂ μ a ∂ ν ϕk = ∂ μ a Qα ∂ ν ϕk mit |μ|, |ν| ≤ |β| . Da alle
∂ μ a polynomial beschränkt sind, gibt es ein N mit
 μ α ν   
 ∂ a Q (∂ ϕ − ∂ ν ϕk ) (x)  ≤  1 + x2N (∂ ν ϕ − ∂ ν ϕk ) (x)  .
S
Nach Voraussetzung ϕk −→ ϕ geht in die rechte Seite gegen 0 für k → ∞.
(c) Mit ϕ, ϕk gehören auch ψ = | det A|−1 ϕ ◦ F −1 und ψk = | det A|−1 ϕk ◦ F −1
S S
zu S , und aus ϕk −→ ϕ folgt ψk −→ ψ. Die Formel F {u} = {u ◦ F } folgt wie
im Beweis 4.4 (b) durch Rückwärtslesen der Transformationsformel. 2

6.4 Die Fouriertransformation für temperierte Distributionen


Gemäß den Überlegungen in 6.1 definieren wir für temperierte Distributionen
T die Fouriertransformierte T/ durch
T/ϕ := T ϕ
/ für ϕ ∈ S .

Satz. (a) T/ ist eine temperierte Distribution.


(b) Die Fouriertransformation
Φ : S  → S  , T → T/
ist linear und bijektiv. Die Umkehrabbildung ist gegeben durch
Φ−1 : S  → S  , T → T/S = σ T/ ,
wobei σ(x) = −x und Sϕ = ϕ ◦ σ = ϕ ◦ σ −1 .
6 Die Fouriertransformation für temperierte Distributionen 323

Insbesondere gilt
/
/ = σT = T S .
T
Mit den Bezeichnungen von 6.3 gilt
(c) P; /,
α T = Qα T Q; /
α T = (−1)|α| P α T für jeden Multiindex α,

(d) τ; /,
a T = ea T e; /,
a T = τa T μ; n /.
r T = r μ1/r T

Beweis.
S S
/k −→ 0.
(a) Es genügt zu zeigen ϕk −→ 0 =⇒ ϕ
S
Es gelte also ϕk −→ 0. Für beliebige Multiindizes α, β gilt nach dem P ,Q–Gesetz
auf S (§ 12 : 3.3 (b))
 α β       
 x ∂ ϕ/k (x)  =  (Qα P β ϕ/k )(x)  =  Qα Q;β ϕ (x)  =  (P α Qβ ϕ )/ (x) 
k  k

n   
≤ (2π)− 2  (P α Qβ ϕk )(y)  dn y
  
≤ c sup  (1 + y2n ) P α Qβ ϕk (y)   y ∈ n Ê
mit

n dn y
c := (2π)− 2 < ∞
1 + y2n
nach § 11 : 2.4, Folgerung (i).
Da sich P α Qβ ϕk mittels der kanonischen Vertauschungsrelationen § 12 : 2.2 (a)
in eine Linearkombination von Funktionen des Typs Qμ P ν ϕk verwandeln läßt,
/k → 0 auf n.
folgt die gleichmäßige Konvergenz Qα P β ϕ Ê
(b) Zunächst bemerken wir: Ist T eine beliebige temperierte Distribution, so
gilt nach 6.3 (c)

σT ϕ = T (ϕ ◦ σ −1 ) = T (ϕ ◦ σ) = T Sϕ für alle ϕ∈S,

wo T S : ϕ → T Sϕ eine temperierte Distribution ist. Es folgt σT = T S und


σ T/ = T/S, da auch T/ eine temperierte Distribution ist.
Φ ist injektiv: Aus T/ = 0 folgt T ϕ
/ = T/ϕ = 0 für alle ϕ ∈ S . Da die Fourier-
transformation auf S surjektiv ist, folgt T = 0. Für ϕ ∈ S gilt
: : = T/S ϕ/ = T S:ϕ
T/Sϕ = T/Sϕ / = Tϕ
nach der Umkehrformel § 12 : 3.4. Dies bedeutet Φ(T/S) = T und damit die
Surjektivität von Φ : S  → S  sowie Φ−1 (T ) = T/S.
(c) Nach dem P ,Q–Gesetz § 12 : 3.3 und nach 6.3 gilt für alle ϕ ∈ S

P; / = (−1)|α| T (P α ϕ
α T ϕ = (P α T )ϕ ;
/) = T (Q /(Qα ϕ) = Qα T/ϕ ,
α ϕ) = T
324 § 13 Schwache Lösungen und Distributionen

;
Q /) = T (P;
/ = T (Qα ϕ
α T ϕ = (Qα T )ϕ /(P α ϕ)
α ϕ) = T

= (−1)|α| (P α T/)ϕ .
(d) ergibt sich aus der Definition der betreffenden Operationen auf S  mit
Hilfe der Skalierungsregeln § 12 : 2.3 (c),(d),(e) ÜA . 2

Nunmehr sind wir in der Lage, Polynomen Fouriertransformierte zuzuordnen,


die jetzt allerdings temperierte Distributionen sind.
Beispiele.
: = (2π) n2 δ ,
(1) {1}
;
(2) {x
n
α } = (2π) 2 (−1)|α| ∂ α δ für jeden Multiindex α,

(3) δ/a = (2π)− 2 {e−a } für a ∈


n
Ê, n

;
(4) {e
n
a } = (2π) 2 δa für a ∈ Ê n
.

Nachweis mit Hilfe der vorangehenden Rechenregeln als ÜA .

Schlussbemerkung. Wir haben hiermit zwei Typen von Distributionen, bei-


de werden gebraucht: Die Distributionen aus D  benötigen wir zur Definition
von Grundlösungen, die Distributionen aus S  für die Erweiterung der Fourier-
transformation. D  kann nicht für beide Zwecke verwendet werden, denn dieser
Raum erweist sich nach 6.1 für die Anwendung der Fouriertransformation als
zu groß. Umgekehrt reicht S  nicht zur Beschreibung aller Grundlösungen aus,
d
wie das folgende Beispiel zeigt. Für den Differentialoperator L = dx − a liefert
Γ(x) = a e für x ≥ 0, Γ(x) = 0 für x < 0 eine Grundlösung in D  nach 5.4.
1 ax

1 x
Im Fall a > 0 gehört aber Γ nicht zu S  , denn durch ϕ(x) = e− 2 ax j1 (t) dt
−∞
ist eine Funktion ϕ ∈ S gegeben, für welche das Integral {u}ϕ = u ϕ diver-
giert, wie sich der Leser leicht klar macht (die Mollifier jε wurden in § 10 : 3.1
eingeführt).
Kapitel V Die drei Grundtypen linearer
Differentialgleichungen 2. Ordnung
Hierunter verstehen wir die Gleichungen

∂u ∂2u
−Δu = f , − Δu = f , − Δu = f
∂t ∂t2
mit gegebener rechter Seite f . Wie in § 1 dargelegt wurde, fallen diese Gleichun-
gen in verschiedenen physikalischen Kontexten an. Jeder dieser drei Typen trägt
ganz charakteristische Wesenszüge und ist in dieser Hinsicht stellvertretend für
den allgemeinen Fall, bei dem der Laplace–Operator durch einen gleichmäßig
elliptischen Operator ersetzt wird, vgl. § 14 : 1 (b), § 16 : 1 (c), § 17 : 1 (c).
Explizite Lösungsdarstellungen erhalten wir nur für Raumgebiete mit starken
Symmetrien, wie z.B. Kreisscheibe und Kugel. Beispiele hierfür haben wir bei
den Separationsansätzen in § 6 kennengelernt; weitere Anwendungen der Sepa-
rationsmethode folgen in § 15 : 3, § 16, § 17. Bei Problemstellungen ohne solche
Symmetrieeigenschaften wird eine Theorie benötigt, welche die Existenz von
Lösungen sicherstellt, Eindeutigkeitsaussagen macht und das qualitative Ver-
halten der Lösungen beschreibt. Theoretische Kenntnis des Lösungsverhaltens
ist auch für die Entwicklung effizienter numerischer Verfahren unerlässlich.
In den folgenden vier Paragraphen stellen wir für die drei Grundtypen die wich-
tigsten Aspekte der Theorie in aller Kürze dar. Vieles kann nur skizziert werden;
den an Einzelheiten interessierten Lesern wird durch ausführliche Literaturan-
gaben weitergeholfen.

§ 14 Randwertprobleme für den Laplace–Operator


Vorkenntnisse für die ersten fünf Abschnitte: Lebesgue–Integral (§ 8), Testfunk-
tionen (Anfang von § 10), Integralsätze von Gauß und Green (§ 11, für den 3 : Ê
Bd. 1, § 26 : 4); für Abschnitt 6: Hilberträume (§ 9), schwache Lösungen und Dis-
tributionen (§ 12).

1 Übersicht
(a) Wir behandeln in diesem Paragraphen das Dirichlet–Problem (1. Rand-
wertproblem)

− Δu = f in Ω , u=g auf ∂Ω

und das Neumann–Problem (2. Randwertproblem)

− Δu = f in Ω , ∂n u = g auf ∂Ω

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_5, © Springer Fachmedien Wiesbaden 2014
326 § 14 Randwertprobleme für den Laplace–Operator

(n das äußere Einheitsnormalenfeld von Ω) mit gegebenen Funktionen f auf Ω


und g auf ∂Ω. Hierbei ist Ω entweder ein beschränktes Gebiet (Innenraum)
Ê
oder n \ Ω ist beschränkt und nicht leer (Außenraum).
Die Gleichung − Δu = f heißt Poisson–Gleichung ; die zugehörige homogene
Gleichung Δu = 0 wird Laplace–Gleichung genannt.
In § 15 werden Eigenwertprobleme für den Laplace–Operator auf beschränkten
Gebieten betrachtet:
− Δu = λu in Ω , u = 0 auf ∂Ω ,
und
− Δu = λu in Ω , ∂n u = 0 auf ∂Ω ,
Auf diese werden wir geführt, wenn in der Wärmeleitungsgleichung oder in
der Wellengleichung die Zeitkoordinate von den Ortskoordinaten durch einen
Produktansatz absepariert wird.
(b) Gleichmäßig elliptische Differentialoperatoren. Die meisten der fol-
genden Ergebnisse bleiben mit geringfügigen Modifikationen gültig, wenn wir
den Laplace–Operator −Δ durch einen Operator −L der Form

n 
n
Lu = aik ∂i ∂k u + bi ∂i u + cu
i,k=1 i=1

ersetzen, wobei die aik , bi , c beschränkte Funktionen auf Ω mit aik = aki sind
und

Ê
n
λ ξ2 ≤ aik (x) ξi ξk ≤ μ ξ2 für x ∈ Ω , ξ ∈ n

i,k=1

mit Konstanten μ ≥ λ > 0 gilt. Nicht übertragbar auf allgemeine elliptische


Gleichungen sind die Poissonsche Integralformel in 2.6 und die Kelvin–Trans-
formation in 2.8.
Als Literatur über elliptische Differentialgleichungen empfehlen wir Gilbarg–
Trudinger [79] und Evans [60].

2 Eigenschaften des Laplace–Operators


Hier und im folgenden bezeichnen wir den Operator −Δ als Laplace–Ope-
rator. Die Vorzeichenwahl ist Konventionssache, für das negative Vorzeichen
sprechen jedoch zwei Gründe:
– Grundlösungen und Greensche Funktionen des Operators −Δ sind nahe der
Singularität positiv (siehe 2.4, 2.5),
– Die Eigenwerte von −Δ sind positiv (siehe § 15 : 1.2).
2 Eigenschaften des Laplace–Operators 327

2.1 Harmonische Funktionen


Ê
Eine C2 –Funktion u auf einem Gebiet Ω ⊂ n wird harmonisch genannt,
wenn sie der Laplace–Gleichung Δu = 0 genügt.
Für n = 1 sind harmonische Funktionen von der Gestalt u(x) = ax + b; ihre
Theorie ist also erst für n ≥ 2 von Interesse. Für n = 2 stehen harmonische
Funktionen in folgender Korrespondenz zu holomorphen Funktionen: Für jede
holomorphe Funktion f (x + iy) = u(x, y) + iv(x, y) ist der Realteil u (ebenso
wie der Imaginärteil v) eine harmonische Funktion, was unmittelbar aus den
Cauchy–Riemannschen Differentialgleichungen folgt. Umgekehrt ist jede har-
Ê
monische Funktion u auf einem einfachen Gebiet Ω ⊂ 2 Realteil einer ho-
lomorphen Funktion f = u + iv, denn das Vektorfeld (−∂y u, ∂x u) erfüllt die
Integrabilitätsbedingungen und besitzt somit ein Potential v in Ω. Für u und v
sind dann die Cauchy–Riemannschen DG erfüllt.

2.2 Die Invarianz des Laplace–Operators unter Bewegungen


Ê
Für C2 –Funktionen u auf einem Gebiet Ω ⊂ n und eine Bewegung des Ê n
,
h : x → a + Ax mit A ∈ On , gilt nach § 11 : 5.3 auf Ω = h−1 (Ω)

(Δu) ◦ h = Δ(u ◦ h) .

Hiernach ist u genau dann harmonisch, wenn u ◦ h auf Ω harmonisch ist.

2.3 Das Maximumprinzip


erlaubt die Kontrolle von Lösungen der Poisson–Gleichung durch die gegebenen
Randwerte, insbesondere sichert es die Eindeutigkeit der Lösung. Es stellt auch
das wichtigste Hilfsmittel für die Untersuchung von qualitativen Eigenschaften
von harmonischen Funktionen dar.
(a) Satz. Für jede Funktion u ∈ C0 (Ω) ∩ C2 (Ω) mit Δu ≥ 0 auf einem be-
schränkten Gebiet Ω gilt
u(x) ≤ max u für x ∈ Ω , kurz u ≤ max u .
∂Ω ∂Ω

Insbesondere gilt für jede harmonische Funktion u ∈ C0 (Ω) ∩ C2 (Ω)


min u ≤ u ≤ max u .
∂Ω ∂Ω

Der Beweis wurde in § 6 : 5.6 geführt.


(b) Strenges Maximumprinzip. Nimmt eine auf einem Gebiet Ω ⊂ n har- Ê
monische Funktion ein Maximum oder Minimum in Ω an, so ist sie konstant.
Der Beweis wird in 2.7 (b) nachgetragen.
(c) Randpunktlemma (Zaremba 1910). Sei u ∈ C0 (Ω) ∩ C2 (Ω) eine Funk-
tion mit Δu ≥ 0, die in einem Randpunkt a ∈ ∂Ω ein striktes Maximum
annimmt,
328 § 14 Randwertprobleme für den Laplace–Operator

u(x) < u(a) für alle x ∈ Ω .

(i) Gibt es eine Kugel K = KR (x0 ) ⊂ Ω mit a ∈ ∂K, so besitzt u bei normaler
Annäherung an den Randpunkt a positive Steigung, d.h. es gilt
1
inf u(a) − u(a + tn) > 0
0<t<δ t
für hinreichend kleine δ > 0, wobei n = (x0 − a)/R der innere Normalenvektor
der Kugel K im Punkt a ist. Insbesondere gilt
1
− ∂n u(a) := lim u(a) − u(a + tn) > 0 ,
t→0+ t
falls dieser Grenzwert existiert.
(ii) Dieselbe Folgerung ergibt sich, wenn ∂Ω in einer Umgebung von a ein C2 –
Flächenstück mit innerem Einheitsnormalenvektor n im Punkt a ist.

Bemerkungen. Die Voraussetzung in (i) kann nicht wesentlich abgeschwächt


werden, vgl. John [49] 13 § 2. Einspringende Ecken und Kanten von Ω sind
zugelassen, während nach außen weisende Ecken und Kanten ausgeschlossen
sind. Ein Beispiel wird in 2.9 gegeben.

Beweis.
(i) Wegen der Translationsinvarianz des Laplace–Operators 2.2 dürfen wir
Ê
x0 = 0 annehmen. Auf der Kugelschale Ω0 := {x ∈ n | R/2 < x < R} ⊂ Ω
betrachten wir
2 2
w(x) := u(x) − u(a) + v(x) mit v(x) := e−αx − e−αR .

Nach Voraussetzung gilt w(x) = u(x) − u(a) ≤ 0 für x = R. Für α  1


erhalten wir
 2
Δw(x) ≥ Δv(x) = 2α 2α x2 − n e−αx ≥ 0 in Ω0 und
2
w(x) ≤ u(x) − u(a) + e−αR /4
< 0 für x = R/2 , α  1 ,
da nach Voraussetzung max {u(x) − u(a) | x = R/2} < 0.
Somit gilt w ≤ 0 auf ∂Ω0 , Δw ≥ 0 in Ω0 , und aus dem Maximumprinzip folgt
w ≤ 0 in Ω0 .
Für 0 < t < R/2 gilt x := a + tn ∈ Ω0 und x = R − t, also folgt

u(a) − u(a + tn) v(x) − w(x) v(x) 2


= ≥ ≥ α R e−αR > 0
t t t
2
nach dem Mittelwertsatz für f (t) := e−α(R−t) ÜA .
2 Eigenschaften des Laplace–Operators 329

(ii) Wir zeigen, dass es unter der Voraussetzung (ii) eine Kugel K der in (i)
genannten Art gibt. Wegen der Bewegungsinvarianz 2.2 dürfen wir a = 0 und
n = e1 annehmen. Nach Voraussetzung gibt es eine Umgebung U von 0 und
eine C2 –Funktion ψ : U → Ê mit ∇ψ = 0 in U und ψ(x) < 0 ⇐⇒ x ∈ Ω
für alle x ∈ U, vgl. § 11 : 3.1. Dabei gilt ψ(0) = 0 und ∇ψ(0) = βe1 mit
β = ∇ψ(0) > 0.
Aus dem Satz von Taylor folgt für x ≤ δ, Kδ (0) ⊂ U

1   
ψ(x) = βx1 + ψ (ϑx)x , x ≤ βx1 + λx2
2
 
mit λ = max ψ  (x)2 | x ≤ δ .
Wir wählen R > 0 so klein, dass 2R < δ und λ − 2R β
< 0. Dann erfüllt die
Kugel K = Kr (−Re1 ) die Voraussetzungen (i): Es ist 0 ∈ ∂K, weiter gilt für
x ∈ K sowohl x < δ als auch

2Rx1 + x2 = x + Re1 2 − R2 < 0 .

Damit ergibt sich

β 
 β

ψ(x) ≤ βx1 + λ x2 = 2Rx1 + x2 + λ − x2 < 0 ,
2R 2R
d.h. x ∈ Ω. 2

2.4 Die Standardgrundlösung für den Laplace–Operator


Ê
Eine auf n lokalintegrierbare Funktion Γ ist nach § 13 : 5.2 eine Grundlösung
für den Laplace–Operato −Δ, wenn − Δ{Γ} = δ, d.h. wenn

− Γ(x) Δϕ(x) dn x = ϕ(0) für alle Testfunktionen ϕ ∈ C∞
c ( Ê ).
n

Ên
Eine Standardmethode zur Bestimmung von Grundlösungen liefert die Fourier-
transformation, siehe Hörmander [63] Ch.2, Wladimirow [56] § 10.
Beim Laplace–Operator kommen wir jedoch schneller zum Ziel, wenn wir einen
kugelsymmetrischen Ansatz

Γ(x) = γ(x)

machen. Ein solcher wird durch die Invarianz 2.2 des Laplace–Operators unter
Ê
Drehungen des n nahegelegt. Setzen wir r = x und beachten
 
∂r xi ∂2r 1 xi xk
(∗) = , = δik − 2 ,
∂xi r ∂xi ∂xk r r
330 § 14 Randwertprobleme für den Laplace–Operator

so erhalten wir für r = 0 ÜA

n−1  d n−1 
ΔΓ(x) = γ  (r) + γ (r) = r 1−n (r γ (r)) .
r dr
Verlangen wir ΔΓ(x) = 0 für x = 0, so folgt
(
cn r 2−n für n = 2 ,
γ(r) =
c2 log r für n = 2

bis auf additive Konstanten. Das Auftreten von Singularitäten im Nullpunkt


ist für Grundlösungen charakteristisch. Wie die multiplikative Konstante cn zu
wählen ist, damit eine Grundlösung entsteht, ergibt sich aus dem folgenden
Beweis.

Satz. (a) Durch


⎧ 1

⎨ (n − 2) ω xn−2 für n > 2 ,
n
Γ(x) :=

⎩ 1
− log x für n = 2

ist eine Grundlösung für den Laplace–Operator −Δ gegeben; dabei ist ωn der
Oberflächeninhalt der (n − 1)–dimensionalen Einheitssphäre, vgl. § 11 : 2.4.
Weiter gilt
(b) Γ ist in Ên
\ {0} harmonisch.
(c) Für jedes Normalgebiet Ω ⊂ Ê n
und jede Funktion u ∈ C2 (Ω) gilt die
Darstellungsformel
 
u(x) = − Γx (y) Δu(y) dn y + (Γx ∂n u − u ∂n Γx ) do für x ∈ Ω,
Ω ∂Ω

wobei wir Γx (y) := Γ(y − x) gesetzt haben.

Bemerkungen. (i) Wie aus dem Beweis hervorgeht, gilt die Formel auch unter
der schwächeren Voraussetzung u ∈ C1n (Ω) ∩ C2 (Ω) , vgl. § 11 : 4.3*.
(ii) Durch Einsetzen von u = 1 in die Darstellungsformel ergibt sich

∂n Γx do = −1 für jedes x ∈ Ω .
∂Ω

(iii) Für n = 3 ist das Newton–Potential


Gm
U (x) = (G = Gravitationskonstante)
x
2 Eigenschaften des Laplace–Operators 331

das Gravitationspotential eines Massenpunktes der Masse m im Ursprung, d.h.


genügt der Gravitationsgleichung

− Δ{u} = 4πGδ .

Beweis.
Ê
(a) Γ ist in n \ {0} stetig und über jede Kugel Kr (0) integrierbar (§ 11 : 2.4,
Ê
Folgerung (i)), also gilt Γ, Γx ∈ L1loc ( n). Dass Γ eine Grundlösung ist, ergibt
sich aus (c) wie folgt: Für ϕ ∈ C∞
c (
n
Ê
) wählen wir Ω als eine Kugel mit der
Eigenschaft supp ϕ ⊂ Ω und erhalten
 
− ϕ(0) = Γ(y) Δϕ(y) dn y = Γ(y) Δϕ(y) dn y .
Ω Ên

(b) Nach Konstruktion ist Γ in Ê n


\ {0} eine harmonische C∞ –Funktion.
(c) Wir fixieren x ∈ Ω und setzen Ωr := Ω \ Kr (x) für r  1 . Dann ergibt
die 2. Greensche Identität § 11 : 4.2 wegen ΔΓx (y) = 0 für y ∈ Ωr
 
Γx Δu dn y = (Γx ∂n u − u ∂n Γx ) do
Ωr ∂Ωr

(∗∗) = (Γx ∂n u − u ∂n Γx ) do
∂Ω

+ (Γx ∂n u − u ∂n Γx ) do .
∂Kr (x)

Im Fall n > 2 erhalten wir für y ∈ ∂Kr (x)


y−x
n(y) = − = äußerer Einheitsnormalenvektor von Ωr ,
r

Γx (y) = cn r 2−n mit cn = 1/(n − 2)ωn ,

cn (2 − n) cn (n − 2)
∇Γx (y) = (y − x) = n(y) nach (∗),
rn r n−1

∂n Γx (y) = n(y) , ∇Γx (y) = cn (n − 2) r 1−n .

Mit der Transformationsformel § 11 : 2.4 ergibt sich


 
Γx ∂n u do = r n−1 (Γx ∂n u)(x + rξ) do(ξ)
∂Kr (x) ∂K1 (0)

= cn r ∂n u(x + rξ) do(ξ) → 0 für r → 0 .
∂K1 (0)

Weiter folgt
332 § 14 Randwertprobleme für den Laplace–Operator

 
u ∂n Γx do = r n−1 (u ∂n Γx )(x + rξ) do(ξ)
∂Kr (x) ∂K1 (0)

= u ∂n Γx do
∂Kr (x)

= r n−1 (u ∂n Γx )(x + rξ) do(ξ)
∂K1 (0)

= cn (n − 2) u(x + rξ) do(ξ)
∂K1 (0)

→ cn (n − 2)ωn u(x) für r → 0.


 
Unter Beachtung von lim Γx Δu dn y = Γx Δu dn y ergibt sich wegen der
r→0
Ωr Ω
Festlegung 1/cn = (n − 2) ωn die Behauptung aus (∗∗). Im Fall n = 2 erhalten
wir mit 1/c2 = − 2π das gleiche Ergebnis. 2

Aufgabe. Zeigen Sie, dass das Gravitationspotential U der Kugel KR (0) ⊂ Ê 3

mit der konstanten Massendichte μ gegeben ist durch


 
3GM x2 GM
U (x) = 1− für x ≤ R , U (x) = für x ≥ R ,
2R 3R2 x

wobei M = 43 πR3 μ die Gesamtmasse der Kugel ist.


Hinweis: Bestimmen Sie U als radiale Lösung U (x) = u(x) der Newtonschen
Gravitationsgleichung

−ΔU = 4π Gμ in KR (0) , ΔU = 0 außerhalb KR (0) ,

wobei lim U (x) = 0 und C1 –differenzierbarer Anschluss auf ∂KR (0) ver-
x→∞
langt werden. Dass dies die einzige Lösung ist, wird in 3.3 gezeigt.

2.5 Greensche Funktionen


Unser Ziel ist, für das 1. und 2. Randwertproblem Lösungsdarstellungen zu
gewinnen, indem wir Grundlösungen für − Δ mit passenden Randbedingun-
gen konstruieren. Für jedes x ∈ Ω sei Γx (y) = Γ(y − x) die Standard-
grundlösung von − Δ an der Stelle x und Hx ∈ C1n (Ω) ∩ C2 (Ω) eine harmoni-
sche Funktion, vgl. § 11 : 4.3*. Dann ist auch Gx := Γx + Hx eine Grundlösung
von −Δ in Ω , vgl. § 13 : 5.2. (Für C2 –berandete Gebiete lässt sich zeigen,
dass jede Grundlösung von − Δ so geschrieben werden kann.) Für jede solche
Grundlösung gilt die Greensche Darstellungsformel
 
u(x) = − Gx Δu dn y + (Gx ∂n u − u ∂n Gx ) do für x ∈ Ω,
Ω ∂Ω
2 Eigenschaften des Laplace–Operators 333

und u ∈ C1n (Ω) ∩ C2 (Ω) (Green 1828). Diese folgt aus 2.4 (c) unter Berück-
sichtigung der Greenschen Identität § 11 : 4.3*:
 
Hx Δu dn y = (Hx Δu − u ΔHx ) dn y
Ω Ω

= (Hx ∂n u − u ∂n Hx ) do .
∂Ω

Um eine Lösungsformel für das erste Randwertproblem


− Δu = f in Ω , u = g auf ∂Ω
zu gewinnen, wählen wir die Randbedingungen für Gx so, dass auf der rechten
Seite der Greenschen Darstellungsformel nur die Daten f und g auftreten, nicht
aber die gesuchte Lösung u und deren Ableitungen.
Für das erste Randwertproblem stellen wir demgemäß die Randbedingung
Gx (y) = 0 für y ∈ ∂Ω , x ∈ Ω .
Ist diese erfüllt, so heißt G(x, y) = Gx (y) eine Greensche Funktion 1. Art
für Ω. Für eine solche und jede Lösung u ∈ C1n (Ω) ∩ C2 (Ω) des 1. RWP liefert
die Greensche Darstellungsformel dann
 
(1) u(x) = Gx f dn y − ∂n Gx g do für x ∈ Ω .
Ω ∂Ω

Umgekehrt erwarten wir, dass diese Formel tatsächlich eine Lösung liefert.
Um eine Green–Funktion für das 2. Randwertproblem aufzustellen, scheint auf
den ersten Blick die Forderung ∂n Gx = 0 auf ∂Ω zweckmäßig; man erhielte so
eine Lösungsdarstellung durch die Daten f und g. Dem entgegen steht jedoch
die Beziehung

∂n Gx do = −1 für x ∈ Ω ,
∂Ω

die sich aus der Greenschen Darstellungsformel durch Einsetzen der konstanten
Funktion u = 1 ergibt. Wir fordern daher lediglich ∂n Gx = c = const auf
∂Ω, was auf −1/c = do = An−1 (∂Ω) führt. Dementsprechend heißt eine
∂Ω
Grundlösung G eine Greensche Funktion 2. Art für Ω, wenn
1
∂n Gx (y) = −
An−1 (∂Ω)
für x ∈ Ω und jeden regulären Randpunkt y ∈ ∂Ω gilt.
Mit einer solchen liefert die Greensche Darstellungsformel für jede Lösung u ∈
C1n (Ω) ∩ C2 (Ω) des 2. Randwertproblems
  
(2) u(x) = Gx f dn y + Gx g do für x ∈ Ω, falls u do = 0 .
Ω ∂Ω ∂Ω
334 § 14 Randwertprobleme für den Laplace–Operator

Satz. Sei G(x, y) = Gx (y) eine Greensche Funktion erster Art für ein be-
Ê
schränktes Gebiet Ω ⊂ n (n ≥ 2). Dann gilt
(a) G ist durch Ω eindeutig bestimmt,
(b) G(x, y) = G(y, x) für x, y ∈ Ω mit x = y (Symmetrie),
(c) Gx ist harmonisch in Ω \ {x} für x ∈ Ω,
(d) für x, y ∈ Ω mit x = y gilt

⎨ Γ(y − x) für n ≥ 3,
0 ≤ G(x, y) ≤
⎩ 1 log diam Ω für n = 2;
2π y − x

dabei ist diam Ω = sup {x − y | x, y ∈ Ω}.

Beweis.
(a) Für zwei Greenfunktionen F , G auf Ω ist Hx := Fx − Gx harmonisch
in Ω und stetig auf Ω , ferner gilt Hx = 0 auf ∂Ω. Aus dem Maximumprinzip
2.3 (a) folgt Hx = 0, d.h. Fx = Gx für jedes x ∈ Ω und somit F = G .
(b) Wir fixieren zwei beliebige Punkte x, y ∈ Ω mit x = y, setzen Ωr :=
Ω \ ( Kr (x) ∪ Kr (y) ) mit 0 < r  1 und verfahren wie beim Beweis für 2.4 (c):

0 = (Gx ΔGy − Gy ΔGx ) dn z
Ωr

= (Gx ∂n Gy − Gy ∂n Gx ) do
∂Kr (x)

+ (Gx ∂n Gy − Gy ∂n Gx ) do
∂Kr (y)

→ − Gy (x) + Gx (y) für r → 0 .

(c) Gx = Γx + Hx ist nach 2.4 (b) harmonisch in Ω \ {x}.


(d) Wir fixieren x, y ∈ Ω mit y = x . Wegen Gx (z) = Γx (z) + Hx (z) → ∞
für z → x gibt es ein r mit 0 < r < x − y und Gx (z) > 0 auf ∂Kr (x) . Da
Gx auf ∂Ω verschwindet, folgt Gx (y) ≥ 0 nach dem Maximumprinzip 2.3 (a),
angewandt auf Ωr = Ω \ Kr (x) .
Im Fall n ≥ 3 gilt Γx − Gx ≥ 0 auf ∂Ω . Nach dem Maximumprinzip für die
harmonische Funktion −Hx = Γx −Gx gilt diese Ungleichung dann auch in Ω .
Im Fall n = 2 wenden wir das Maximumprinzip auf die harmonische Funktion
−Hx + 1

log(diam Ω) = Γx − Gx + 1

log(diam Ω)
an. 2
2 Eigenschaften des Laplace–Operators 335

Bemerkungen. Greensche Funktionen erster und zweiter Art existieren für


jedes beschränkte Gebiet Ω mit hinreichend glattem Rand, vgl. 5.1.
Können wir eine Green–Funktion explizit angeben (dies gelingt i.A. nur für
Gebiete mit starken Symmetrien), so liefern die Formeln (1),(2) Lösungen der
beiden Randwertprobleme, falls f und der Rand ∂Ω hinreichend glatt sind,
vgl. Abschnitt 5. Dies wird für die Laplace–Gleichung auf Kugeln im nächsten
Abschnitt durchgeführt. Im Fall n = 2 kann die Methode der konformen Ab-
bildung zur Konstruktion von Greenschen Funktionen verwendet werden, vgl.
Courant–Hilbert [2], Kap.5, §15.3.

2.6 Die Poissonsche Integralformel


(a) Für Kugeln Ω = KR (0) ⊂ Ê n
, n ≥ 2 ist die Greensche Funktion erster
Art gegeben durch
 x
Γ(y − x) − Γ( R (y − x∗ )) für x = 0 ,
G(x, y) =
Γ(y) − Γ(R e) für x = 0.
Dabei ist Γ die Standardgrundlösung
für den Laplace–Operator − Δ,

R2
x∗ := x
x2 x∗

der Bildpunkt bei der Spiegelung von


x = 0 an der Sphäre ∂KR (0) und e
ein beliebiger Vektor der Länge 1.
Die nach 2.5 (b) bestehende Symmetrie
R x
G(x, y) = G(y, x) ist nicht auf den er-
sten Blick erkennbar. 0
Durch die Translation x → x − a
des Ê n
ergibt sich G(x − a, y − a)
als Greensche Funktion für die Kugel
KR (a) .
Beweis.
Sei Ω := KR (0). Für x = 0 ist

⎨ Rn−2 x2−n Γx∗ (y) für n ≥ 3
−Hx (y) =
⎩ Γx (y) + 1 log x für n = 2
∗ 2π R
wegen x∗ ∈ Ω harmonisch in einer Umgebung von Ω. Ferner ist Γ0 − G0 kon-
stant, also ist Hx = Gx − Γx für jeden festen Punkt x ∈ Ω harmonisch in einer
Umgebung von Ω. Offenbar gilt G0 (y) = 0 für y = R.
336 § 14 Randwertprobleme für den Laplace–Operator

Für 0 = x ∈ Ω und y = R gilt


 x 2
(∗)  (y − x∗ )  = x2 + R2 − 2 x , y = x − y2 ,
R
also Gx (y) = 0 wegen der Kugelsymmetrie von Γ. 2

Lord Kelvin gewann 1845 die Greensche Funktion für Kugeln im 3 , indem Ê
er Gx als Potential zweier Punktladungen interpretierte, nämlich der Ladung
q = 1 im Punkt x = 0 und der Gegenladung q∗ = −R/x im Spiegelpunkt
x∗ :
Gx = q Γx + q∗ Γx∗ .

(b) Für den Poisson–Kern P (x, y) := − ∂n Gx (y) ( n = y/R ) der Kugel


KR (0) ergibt sich ÜA

R2 − x2
P (x, y) = für x < R , y = R .
ωn R y − xn

Aus der Greenschen Darstellungsformel 2.4 (1) folgt damit


Ist u harmonisch im Gebiet Ω ⊂ Ê n
(n ≥ 2) und Kr (0) ⊂ Ω, so gilt die
Poissonsche Integralformel

u(x) = P (x, y) u(y) do für x ∈ Kr (0) .
Sr (0)

Diese stellt das n–dimensionale Analogon zur Cauchyschen Integralformel der


Funktionentheorie dar und hat ähnlich weitreichende Konsequenzen; auf einige
gehen wir im folgenden Abschnitt ein.

(c) Wir verwenden die Poissonsche Integraldarstellung (wie schon in § 6 : 5.5


für n = 2) als Lösungsformel für das erste Randwertproblem:
Satz. Für jede stetige Funktion g auf ∂KR (0) besitzt das Randwertproblem

Δu = 0 in Ω = KR (0) , u = g auf ∂Ω

eine eindeutig bestimmte Lösung u ∈ C0 (Ω) ∩ C2 (Ω). Diese ist gegeben durch
die Poissonsche Integralformel
⎧ 2 
⎨ R − x

2
g(y)
do(y) für x < R ,
u(x) = ωn R y − xn

⎩ SR (0)
g(x) für x = R .
2 Eigenschaften des Laplace–Operators 337

Beweis.
(i) Sind u1 , u2 Lösungen, so ist v = u1 − u2 harmonisch mit Randwerten
Null. Aus dem Maximumprinzip 2.2 (a) folgt v = 0, also u1 = u2 .

(ii) Der Poisson-Kern


R2 − x2
x −→ P (x, y) =
ωn R y − xn
ist C∞ –differenzierbar und harmonisch in KR (0) für jedes y ∈ KR (0). Letz-
teres ergibt sich mit Hilfe der Rechenregeln (∗) von 2.4 ÜA .

Weil unter dem Integral differenziert werden darf, gilt dies auch für die durch
das Integral dargestellte Funktion u.

(iii) Es gilt P (x, y) do(y) = 1 für x ∈ KR (0) . Dies ergibt sich aus der
S R (x )
Greenschen Darstellungsformel mit der Funktion u = 1.

(iv) Für x, y ∈ KR (0) , x0 ∈ SR (0) mit x0 − y ≥ 2δ und x − x0  < δ


folgt y − x ≥ δ und
R2 − x2 = (R + x)(R − x) < 2 R (x0  − x) ≤ 2Rx − x0 .

Damit ergibt sich die Abschätzung

2x − x0 
0 ≤ P (x, y) ≤ .
ωn δ n

(v) Wir zeigen lim u(x) = g(x0 ) für x0 ∈ ∂Ω = SR (0) . Zu gegebenem ε > 0
x→x0
wählen wir δ > 0 so, dass
 
 g(y) − g(x0 )  < ε für y ∈ SR (0) und y − x0  < 2δ .

Wir setzen S1 := SR (0) ∩ K2δ (x0 ) , S2 := SR (0) \ K2δ (x0 ) und erhalten nach
(iii),(iv) für x ∈ KR (0) mit x − x0  < δ

| u(x) − u(x0 ) | = | u(x) − g(x0 ) | = P (x, y) (g(y) − g(x0 )) do(y)
S r (0 )
 
= P (x, y) (g(y) − g(x0 )) do(y) + P (x, y) (g(y) − g(x0 )) do(y)
S1 S2
 4 g∞
≤ ε P (x, y) do(y) + x − x0  ωn Rn−1
S1
ωn δ n

≤ ε + 4Rn−1 δ −n g∞ x − x0  ≤ 2ε ,

wenn wir noch x − x0  hinreichend klein wählen. 2


338 § 14 Randwertprobleme für den Laplace–Operator

(d) Aufgabe. Zeigen Sie: Ist u harmonisch in Ω und KR (a) ⊂ Ω , so gilt



u(x) = P (x − a, y − a) u(y) do(y)
SR (a)

mit dem in (b) definierten Poisson–Kern P . Machen Sie sich hierzu klar, dass
 
v(y) do(y) = v(a + y) do(y) ,
S R (a ) S R (0 )

und verwenden Sie die Translationsinvarianz des Laplace–Operators.


(e) Aufgabe. Bestimmen Sie die Green–Funktion 1. Art für
(i) das Quadrat Ω = ]0, 1[2 ⊂ Ê, 2

(ii) die Kugelschale Ω = {x ∈ Ê | 1 < x < 2} 3

durch (mehrfache) Anwendung der in (a) beschriebenen Kelvinschen Spiege-


lungsmethode.

2.7 Folgerungen aus der Poissonschen Integralformel


Wir leiten aus der Poissonschen Integralformel und der zugehörigen Lösungs-
formel 2.5 (b), (c) einige wichtige Eigenschaften harmonischer Funktionen her,
welche in Analogie zu denen holomorpher Funktionen stehen: Mittelwerteigen-
schaft, starkes Maximumprinzip, Entwickelbarkeit in Potenzreihen, Hebbarkeit
von Singularitäten und Satz von Liouville. Weiterführende Untersuchungen fin-
den sich in Dautray–Lions [4] Vol.1, Chapt. II.
(a) Die Mittelwerteigenschaft harmonischer Funktionen. Jede auf ei-
Ê
nem Gebiet Ω ⊂ n harmonische Funktion u hat die Mittelwerteigenschaft für
Sphären und Vollkugeln,
1 
u(a) = n−1
u do für a ∈ Ω und R  1 ,
ωn R S (a )R

n 
u(a) = n
u dn x für a ∈ Ω und R  1 ,
ω n R K (a )
R

Da nach § 11 : 2.4 (c) die Sphäre SR (a) den Oberflächeninhalt ωn Rn−1 hat und
die Kugel KR (a) das Volumen ωn Rn /n, bedeutet dies: Der Wert von u im
Mittelpunkt jeder Kugel KR (a) ⊂ Ω ist sowohl das Mittel der Werte von u
auf der Randsphäre als auch der Werte auf der Vollkugel.

Beweis.
Wegen der Translationsinvarianz des Laplace–Operators sowie des Oberflächen–
und Volumenintegrals dürfen wir o.B.d.A. a = 0 annehmen, vgl. 2.6 (d). Die
erste Formel ergibt sich dann unmittelbar aus der Poissonschen Integralformel.
2 Eigenschaften des Laplace–Operators 339

Mit zwiebelweiser Integration (§ 11 : 2.4 (b)) folgt hieraus

ωn n R R  
R u(0) = ωn r n−1 u(0) dr = ( u do) dr = u dn x . 2
n 0 0 Sr (0) KR (0)

(b) Das strenge Maximumprinzip für subharmonische Funktionen.


Wir nennen u ∈ C0 (Ω) subharmonisch, wenn
1 
u(a) ≤ n−1
u do für a ∈ Ω und R  1 .
ωn R S (a )
R

Hieraus folgt mit zwiebelweiser Integration analog zu (a)


n 
u(a) ≤ u dn x für a ∈ Ω und R  1 .
ω n R n K (a )
R

Satz. Jede Funktion u ∈ C2 (Ω) mit Δu ≥ 0 ist subharmonisch.

Beweis.
Sei a ∈ Ω , o.B.d.A. a = 0 und KR (0) ⊂ Ω . Nach 2.6 (c) gibt es eine har-
monische Funktion v auf KR (0) mit den gleichen Randwerten wie u, und es
gilt
1 
v(0) = u do .
ωn Rn−1 S (0)
R

Das auf die subharmonische Funktion u−v angewandte Maximumprinzip 2.3 (a)
liefert u(0) − v(0) ≤ max (u − v) = 0, also ist
S R (0 )

1 
u(0) ≤ u do . 2
ωn Rn−1 S (0)
R

Strenges Maximumprinzip. Nimmt eine auf einem Gebiet Ω ⊂ Ê n


sub-
harmonische Funktion u ein Maximum in Ω an, so ist sie konstant.
Hieraus ergibt sich der noch ausstehende Beweis von 2.3 (b), denn ist u auf Ω
harmonisch, so sind nach dem vorangehenden u und −u subharmonisch.

Beweis.
Es existiere M = max {u(x) | x ∈ Ω}, und u sei nicht konstant. Dann gibt es
Punkte x0 , x1 ∈ Ω mit u(x0 ) = M , u(x1 ) < M . Wir verbinden diese durch
einen Weg ϕ : [0, 1] → Ω und setzen s := sup { t ∈ [0, 1] | u(ϕ(t)) = M } . Für
a := ϕ(s) gilt dann u(a) = M , und in jeder Kugel KR (a), deren Abschluss in
340 § 14 Randwertprobleme für den Laplace–Operator

Ω liegt, gibt es Punkte x mit u(x) < M . Diese bilden eine offene Menge, also
gilt
n 
u dn x < M = u(a)
ωn Rn K (a)
R

im Widerspruch zur oben bewiesenen Mittelwertgleichung für Vollkugeln. 2

Eine unmittelbare Folgerung hieraus sind die beiden folgenden Aussagen.


Das schwache Maximumprinzip. Für jede auf einem beschränkten Gebiet
Ê
Ω ⊂ n subharmonische Funktion u ∈ C0 (Ω) gilt
u ≤ max u .
∂Ω

Maximumprinzip für holomorphe Funktionen. Ist f auf dem Gebiet Ω ⊂


holomorph und nicht konstant, so nimmt |f | dort kein Maximum an.
Denn |f |2 ist reellwertig und subharmonisch ÜA .

(c) Charakterisierung harmonischer Funktionen durch die Mittel-


werteigenschaft. Jede auf Ω ⊂ n stetige Funktion mit der sphärischen Mit-
telwerteigenschaft 2.7 (a) ist harmonisch.

Beweis.
Es reicht, die Harmonizität von u in einer Umgebung jedes Punktes a ∈ Ω
nachzuweisen. Sei also a ∈ Ω, KR (a) ⊂ Ω und v die nach 2.6 (c) existierende
harmonische Funktion auf KR (a) mit den gleichen Randwerten wie u. Nach (a)
hat auch w := v − u die sphärische Mittelwerteigenschaft. Angenommen, es gilt
w = 0. Wegen w = 0 auf ∂KR (a) nimmt w ein Maximum oder Minimum in
KR (a) an, ist also nach (b) konstant, Widerspruch! Somit ist u = v auf KR (a)
harmonisch. 2

(d) Analytizität harmonischer Funktionen. Jede auf einem Gebiet Ω ⊂


n harmonische Funktion u ist dort reell–analytisch, d.h. zu jedem Punkt x0 ∈
Ω gibt es ein r > 0, so dass u in Kr (x0 ) ⊂ Ω in eine Potenzreihe entwickelbar
ist ( α durchläuft alle Multiindizes, vgl. § 10 : 2.2):
 1 α
u(x) = aα (x − x0 )α mit aα = ∂ u(x0 ) .
α!
α

Beweisskizze.
u ist C∞ –differenzierbar, denn nach 2.6 (b) und (d) ist jede durch das Poisson–
Integral darstellbare Funktion auf Kugeln C∞ –differenzierbar. Aufgrund der
Translationsinvarianz des Laplace–Operators dürfen wir x0 = 0 ∈ Ω annehmen.
2 Eigenschaften des Laplace–Operators 341

Wir wählen R > 0 mit K2R (0) ⊂ Ω. Die Taylorentwicklung von u in KR (0)
im Ursprung lautet
 1  1
u(x) = ∂ α u(0) xα + Rm (x) mit Rm (x) = ∂ α u(ϑx) xα
α! α!
|α|<m |α|=m

mit geeignetem ϑ ∈ ]0, 1[. Zu zeigen ist lim Rm (x) = 0.


m→∞

Wegen u ∈ C∞ (Ω) sind alle Ableitungen ∂ α u harmonisch. Aus der Mittel-


werteigenschaft für ∂i u und dem Gaußschen Satz folgt
n  n 
∂i u(x) = n
∂i u(y) dn y = n
u(y) n , ei do(y) ,
ωn R K (x) ωn R S (x)
R R

n
| ∂i u(x) | ≤ M mit M = max {|u(y)| | y ≤ R} .
R
Nach diesem Prinzip ergibt sich durch trickreiche Abschätzungen und Induktion
nach m (siehe Dibenedetto [59] II.5)

M (n e)m
| ∂ α u(x) | ≤ m! für |α| = m und x ≤ R .
e Rm
Wählen wir nun r = R/(2n2 e) , so gilt für x ≤ r wegen | xα | ≤ xm
 M  ne m  m  m
M n2 e M 1
| Rm (x) | ≤ rm = rm ≤ . 2
e R e R e 2
|α|=m

(e) Hebbarkeit von Singularitäten (H. A. Schwarz 1872). Sei Ω ⊂ n Ê


(n ≥ 2) ein Gebiet, a ∈ Ω und u eine in Ω\{a} harmonische Funktion. Wächst
u(x) für x → a schwächer als die Standardgrundlösung Γa (x) = Γ(x − a),

u(x)
lim = 0,
x →a Γa (x)
so kann u zu einer harmonischen Funktion auf ganz Ω fortgesetzt werden.
Das ist insbesondere der Fall, wenn u in einer Umgebung von a beschränkt
ist. Dass die Wachstumsbedingung nicht abgeschwächt werden kann, zeigt das
Beispiel u(x) = Γa (x).

Beweis.
Sei o.B.d.A. a = 0. Wir wählen ein R > 0 mit KR (0) ⊂ Ω und weisen nach,
dass u in KR (0) \ {0} mit der nach 2.6 (c) existierenden Lösung v von
Δv = 0 in KR (0) , v=u auf ∂KR (0)
übereinstimmt. Wir zeigen dies zuerst für n ≥ 3.
342 § 14 Randwertprobleme für den Laplace–Operator

Hierzu fixieren wir x0 ∈ KR (0) \ {0} und setzen zu gegebenem ε > 0


ε
h(x) := x2−n − R2−n mit a := x0 2−n − R2−n .
a

v ist auf KR (0) beschränkt. Weiter ist h nach Satz 2.4 harmonisch in Ê n
\ {0},
und es gilt lim xn−2 u(x) = 0. Daher gibt es ein r > 0 mit
x →0
ε
r n−2
|u(x)| ≤ auf KR (0) ,
4a
ε 2−n
| v(x) | ≤ r auf KR (0) ,
4a
 r n−2 1
r < x0  < R und ≤ .
R 2
Hieraus folgt

|u − v| = 0 = h auf ∂KR (0) ,


  n−2 
ε 2−n ε 2−n r
|u − v| ≤ |u| + |v| ≤ r ≤ r 1−
2a a R
ε  2−n
= r − R2−n = h auf ∂KR (0) ,
a
d.h. auf dem Rand der Kugelschale KR (0) \ Kr (0) gilt

−h ≤ u − v ≤ h .

Nach dem Maximumprinzip besteht diese Ungleichung auch im Innern dieser


Kugelschale, insbesondere gilt für jedes ε > 0

| u(x0 ) − v(x0 ) | ≤ h(x0 ) = ε .

Im Fall n = 2 verwenden wir als harmonische Majorante

log(R/x)
h(x) := ε
log(R/x0 )

und argumentieren ganz entsprechend. 2

(f) Verallgemeinerter Satz von Liouville. Jede auf dem Ên


harmonische
Æ
Funktion u, welche für ein m ∈ 0 der Wachstumsbedingung

| u(x) | ≤ c (1 + xm ) für alle x ∈ Ê n

mit c ≥ 0 genügt, ist ein Polynom höchstens m–ten Grades.


2 Eigenschaften des Laplace–Operators 343

Beweisskizze.
Wir wählen 0 < r < R und wenden die Poissonsche Darstellungsformel 2.6 (b)
auf u und die R–Sphäre SR (0) an. Durch mehrfache Differentiation ergibt sich
nach etwas mühseliger Rechnung die Abschätzung
1 + Rm
| ∂ α u(x) | ≤ KRn für x < r
(R − r)n+| α |
mit einer Konstanten K = K(n, α) > 0. Für jeden Multiindex α mit | α | =
m + 1 folgt hieraus nach Grenzübergang R → ∞ das Verschwinden von ∂ α u
auf jeder Kugel Kr (0) und damit auf dem ganzen n , was die Behauptung Ê
liefert. 2

2.8 Die Kelvin–Transformation


Die Kelvin–Transformation ermöglicht, Außenraumaufgaben in Innenraumauf-
gaben zu überführen.
(a) Die Spiegelung an der R–Sphäre,
h : Ên
\ {0} → Ê n
\ {0} , x → x∗ := R2
x 2
x,
ist ein Diffeomorphismus mit h ◦ h = ½ ÜA . Für jedes Gebiet Ω ⊂ Ên ist
daher die Bildmenge Ω∗ := h(Ω \ {0}) ein Gebiet, und es gilt Ω∗∗ = Ω \ {0}.
Für jede Funktion u : Ω → Ê definieren wir die Kelvin–Transformierte
u∗ : Ω∗ → Ê durch
 n−2
R
u∗ (x) := x  u(x∗ ) für x ∈ Ω∗ .

Satz. Es gilt u∗∗ = u auf Ω \ {0}.


Ist u harmonisch in Ω , so ist u∗ harmonisch in Ω∗ .
Beweis.
Die erste Behauptung folgt nach einfacher Rechnung aus den Definitionen von
x∗ und u∗ .
Die zweite Behauptung beruht auf der Beziehung
 n+2
R
Δu∗ (x) = x Δu(x∗ ) für u ∈ C2 (Ω), x ∈ Ω \ {0} ,

die sich nach den Rechenregeln (∗) in 2.4 ergibt, ÜA . 2

(b) Beispiel. Das Außenraumproblem in Ω \ KR (0) besitzt die Lösungsdar-


stellung

x2 − R2 g(y)
u(x) = do(y) für x > R .
ωn R y − xn
S R (0 )

Nachweis als ÜA unter Verwendung der Beziehung (∗) in 2.6.


344 § 14 Randwertprobleme für den Laplace–Operator

(c) Das Außenraumproblem

Δu = 0 für x > 1 , u(x) = 0 für x = 1

hat zwei verschiedene Lösungen: Die Funktion u1 = 0 und



1 − x2−n für n > 2 ,
u2 (x) =
log x für n = 2 .

Für die eindeutige Lösbarkeit des Dirichletschen Außenraumproblems muss da-


her eine zusätzliche Bedingung gestellt werden:
Wir nennen eine harmonische Funktion u in einem Außenraum Ω ⊂ Ê n
(n ≥ 2)
regulär im Unendlichen, wenn

lim u(x) = 0 im Fall n > 2 ,


x→∞

u(x) beschränkt ist für x  1 im Fall n = 2 .

Satz. Ist u in einem Außenraum Ω ⊂ Ê n


(n ≥ 2) harmonisch und regulär im
Unendlichen, so gilt:
(i) Die Kelvin–Transformierte u∗ bezüglich einer Sphäre kann zu einer har-
monischen Funktion auf Ω∗ ∪ {0} fortgesetzt werden.
(ii) Es gibt Konstanten c0 , c1 ≥ 0 mit
c0 c1
| u(x) | ≤ , ∇u(x) ≤ für x  1 (n > 2) ,
xn−2 xn−1

c1
∇u(x) ≤ für x  1 (n = 2) .
x2

Beweis.
(i) Wir spiegeln an der Einheitssphäre (R = 1). Nach Voraussetzung gilt

xn−2 u∗ (x) = u(x∗ ) → 0 für x → 0 im Fall n > 2,


   
 u∗ (x)   
  =  u(x∗ )  ≤ M
→ 0 für x → 0 im Fall n = 2 ,
 log x   log x  | log x |

d.h. die harmonische Funktion u∗ wächst für x → 0 schwächer als die Grund-
lösung. Nach dem Hebbarkeitssatz 2.7 (e) gibt es daher eine auf Ω∗ ∪ {0} har-
monische Funktion v mit u∗ = v auf Ω∗ .
2 Eigenschaften des Laplace–Operators 345

(ii) Wählen wir > 0 mit K (0) ⊂ Ω∗ ∪ {0}, so gibt es für die C2 –dif-
ferenzierbare Funktion v Zahlen a, b ≥ 0 mit

| v(y) | ≤ a , ∇v(y) ≤ b für y ≤ .

Mit x∗ = x/x2 = h(x) ergibt sich

u(x) = u(x∗∗ ) = x∗ n−2 u∗ (x∗ ) = x2−n(v ◦ h)(x) .

Hieraus folgt für r = x ≥ 1/

| u(x) | = | v(x∗ ) | r2−n ≤ a r 2−n .

Weiter ergibt sich aus u = r 2−n (v ◦ h) mit den Rechenregeln (∗) in 2.4

∇u = (2 − n) r−n (v ◦ h) x + r 2−n ((∇v) ◦ h) dh =: (n − 2) a + b

und damit die Abschätzungen



a ≤ a r 1−n , b ≤ b n r −n .

Die letzte Ungleichung folgt dabei aus


  
n
1 2xi xk n
∂i hk (x) = 2 δik − 2 , dh(x)22 = (∂i hk (x))2 = . 2
r r r4
i,k=1

2.9 Ein Beispiel für das Verhalten harmonischer Funktionen in Ecken


Das folgende Beispiel ist typisch für das Randverhalten harmonischer Funktio-
nen in Gebieten mit Ecken. Es illustriert auch die zum Randpunktlemma 2.3 (c)
gemachten Bemerkungen.
Für 0 < Θ < 2π betrachten wir auf dem Kreissektor
  
Ω = (r cos ϕ, r sin ϕ)  0 < r < 1 , 0 < ϕ < Θ

das Randwertproblem

⎪ Δu = 0 in Ω ,

u = 0 auf den beiden radialen Randstücken,


u(cos ϕ, sin ϕ) = − sin(πϕ/Θ) für 0 < ϕ < Θ .

Für die Lösung u machen wir einen Produktansatz bezüglich Polarkoordinaten:

u(r cos ϕ, r sin ϕ) = v(r) w(ϕ) .


346 § 14 Randwertprobleme für den Laplace–Operator

Analog zu § 6 : 5.2,5.3 ergeben sich die Bedingungen



⎨ v  (r) + 1 v  (r) − λ v(r) = 0 für r > 0 ,
r r 2
(a)
⎩ lim v(r) = 0 , v(1) = 1,
r→0

⎧ 

⎨ w (ϕ) + λ w(ϕ) = 0 für 0 < ϕ < Θ ,
(b) w(ϕ) = − sin(πϕ/Θ) für 0 < ϕ < Θ ,


w(0) = w(Θ) = 0 .

Es ergibt sich λ = (π/Θ)2 √und für die Lösung der Eulerschen DG (a) (vgl.
§ 4 : 4.2) v(r) = r p mit p = λ = π/Θ . Somit lautet die Lösung des Randwert-
problems
u(x) = − r p sin(p ϕ) .
Wegen u < 0 in Ω wird das Maximum von u genau im Nullpunkt angenom-
men. Für Θ ≥ π ist die Voraussetzung (i) des Randpunktlemmas 2.3 (c) erfüllt.
Tatsächlich gilt dann für v := −(cos ψ, sin ψ) mit 0 < ψ < Θ
(
u(tv) − u(0) ∞ für Θ > π ,
lim = lim tp−1 sin(p ψ) =
t→0+ t t→0+ sin(p ψ) > 0 für Θ = π .

Im Fall Θ > π folgt u ∈ C1 (Ω) , weil lim u(tv) , v nicht existiert. Im Fall
t→0+

Θ = π ist dagegen u(x, y) = −y eine C –differenzierbare Funktion. Für Θ < π
besitzt der Kreissektorrand im Ursprung eine nach außen weisende Ecke. Hier
gilt
1
lim (u(tv) − u(0)) = 0 .
t→0+ t
Es ist nicht schwer zu sehen, dass lim ∇u(x) = 0 und u ∈ C1 (Ω).
Ω x→0

3 Eindeutigkeit von Lösungen


3.1 Dirichlet–Problem (Erstes Randwertproblem)
Satz. Das Dirichlet–Problem für ein beschränktes Gebiet Ω ⊂ Ên

− Δu = f in Ω , u = g auf ∂Ω

mit gegebenen Funktionen f ∈ C0 (Ω) , g ∈ C0 (∂Ω) besitzt höchstens eine Lö-


sung u ∈ C0 (Ω) ∩ C2 (Ω) .

Der Beweis ergibt sich unmittelbar durch Anwendung des Maximumprinzips


2.1 (a) auf die Differenz zweier Lösungen.
3 Eindeutigkeit von Lösungen 347

Satz. Das Dirichlet–Problem für einen Außenraum Ω ⊂ Ê n


(n ≥ 2),

−Δu = f in Ω , u = g auf ∂Ω , u regulär im Unendlichen,

mit gegebenen Funktionen f ∈ C0 (Ω) , g ∈ C0 (∂Ω) besitzt höchstens eine Lö-


sung u ∈ C0 (Ω) ∩ C2 (Ω) .
Die Zusatzbedingung der Regularität im Unendlichen ist unentbehrlich für die
Ê
Eindeutigkeit der Lösung. Dies wurde für den Fall Ω = n \ Kr (0) in 2.8 (b)
gezeigt. Auch im Beispiel 2.9 ist keine Eindeutigkeit gegeben.

Beweis.
Ê
O.B.d.A. dürfen wir 0 ∈ n \ Ω annehmen. Für zwei Lösungen u1 , u2 sei u∗
die Kelvin–Transformierte von u = u1 − u2 . Nach 2.8 (c) lässt sich u∗ zu einer
auf dem Innenraum Ω∗ ∪ {0} harmonischen Funktion v fortsetzen, und es gilt
v(x) = u∗ (x) = 0 auf dem Rand dieses Gebiets. Der vorangehende Satz liefert
v = 0 , insbesondere u∗ = 0 auf Ω∗ und somit u = u∗∗ = 0 auf Ω. 2

3.2 Neumann–Problem (Zweites Randwertproblem)


Ê
Ω ⊂ n (n ≥ 2) sei ein C2 –berandeter Innen– oder Außenraum mit äußerem
Normalenfeld n. Die auf den Ergebnissen 5.2 der Potentialtheorie beruhenden
Existenzbeweise zeigen, dass wir für das Neumann–Problem die Randableitung
∂n u in folgendem Sinn zu definieren haben:

∂n u(x) := lim ∇u(x − tn(x)) , n(x) gleichmäßig für x ∈ ∂Ω .


t→0+

Die Greensche Integralformel für den Raum C1n (Ω) dieser Funktionen wurde in
§ 11 : 4.3* bewiesen.

Satz. Das Neumann–Problem auf einem Innenraum Ω,

−Δu = f in Ω , ∂n u = g auf ∂Ω

mit gegebenen stetigen Funktionen f, g besitzt bis auf additive Konstanten höch-
stens eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω).

Bemerkungen. (i) Als notwendige Bedingung für die Lösbarkeit ergibt sich
nach 5.1 (c)
 
f dn x + g do = 0 .
Ω ∂Ω

(ii) Die eindeutige Lösbarkeit erhalten wir durch zusätzliche Vorgabe des Mit-
telwerts von u auf Ω oder auf ∂Ω.
348 § 14 Randwertprobleme für den Laplace–Operator

Beweis.
Für die Differenz u zweier Lösungen gilt nach § 11 : 4.3*
 
∇u2 dn x = u ∂n u do = 0 ,
Ω ∂Ω

also u = const. 2

Satz. Das Neumann–Problem für einen Außenraum Ω ⊂ Ê n


(n ≥ 2),

− Δu = f in Ω , ∂n u = g auf ∂Ω , u regulär im Unendlichen,

mit gegebenen stetigen Funktionen f, g besitzt für n > 2 höchstens eine Lösung
u ∈ C1n (Ω) ∩ C2 (Ω) ; im Fall n = 2 ist die Lösung bis auf additive Konstanten
eindeutig bestimmt.

Beweis.
Für die Differenz u zweier Lösungen gilt u ∈ C1n (Ω) ∩ C2 (Ω),
Δu = 0 in Ω , ∂n u = 0 auf Ω , u regulär im Unendlichen.

Wir wählen R  1 mit ∂Ω ⊂ Kr (0) . Dann gilt nach § 11 : 4.3* für das be-
schränkte Gebiet ΩR = Ω ∩ KR (0)
   
∇u2 dn x = u ∂n u do = u ∂n u do + u ∂n u do
ΩR ∂ΩR ∂Ω S R (0 )

= u ∂n u do .
SR (0)

Dabei gelten nach 2.8 mit R = x die Abschätzungen

| u(x) | ≤ c0 /Rn−2 , ∇u(x) ≤ c1 /Rn−1 für n > 2,


| u(x) | ≤ c0 , ∇u(x) ≤ c1 /R2 für n = 2.

Es folgt
(
 ωn c0 c1 /Rn−2 für n > 2,
∇u2 dn x ≤
ΩR ω2 c0 c1 /R für n = 2.

Nach dem Ausschöpfungssatz Bd. 1, § 23 : 4.7 ergibt sich


 
∇u2 dn x = lim ∇u2 dn x = 0 ,
R→∞
Ω ΩR

somit ∇u = 0 in Ω . Damit ist u konstant, und wegen lim u(x) = 0 für


x→∞
n > 2 folgt die Behauptung. 2
4 Existenz von Lösungen: Perron–Methode 349

3.3 Das Ganzraumproblem


Sei Ω ⊂ Ê n
(n ≥ 2) ein beschränktes Gebiet und f ∈ C0 (Ω).

Satz. Das Ganzraumproblem


− Δu = f in Ω , − Δu = 0 in Ê n
\ Ω,
lim u(x) = 0
x→∞

besitzt höchstens eine Lösung u ∈ C1 ( Ê ) ∩ C (Ê


n 2 n
\ ∂Ω).
Beweis.
Für die Differenz u zweier Lösungen gilt u ∈ C1 ( Ê ) ∩ C (Ê
n 2 n
\ ∂Ω),

Δu = 0 in Ê n
\ ∂Ω und lim u(x) = 0 .
x→∞

Wir wählen R > 0 mit Ω ⊂ KR (0) und erhalten aus § 11 : 4.3* (d), angewandt
auf die Gebiete KR (0), KR (0) \ Ω
   
∇u2 dn x = ∇u2 dn x + ∇u2 dn x = u ∂n u do ,
KR (0) Ω KR (0)\Ω S R (0 )

weil sich die beiden Randintegrale über ∂Ω wegheben. Dabei ist zu beachten,
dass C1 (Ω) ⊂ C1n (Ω), entsprechendes für KR (0) \ Ω. Der Rest des Beweises
erfolgt wie in 3.2 mit dem Ergebnis u = const = c , c = lim u(x) = 0. 2
x→∞

4 Existenz von Lösungen: Perron–Methode


4.1 Vorbemerkungen zur Existenztheorie
Im folgenden stellen wir drei Beweismethoden für die Existenz von Lösungen
vor: Die Perron–Methode, die Integralgleichungsmethode und die Variationsme-
thode. Jede hat ihre eigene Berechtigung und ihre Besonderheiten in Bezug auf
Voraussetzungen an die Daten, beweistechnischen Aufwand und Tragweite.
Bei allen Methoden müssen Bedingungen an den Rand ∂Ω gestellt werden,
um die stetige Annahme der vorgegebenen Randwerte durch die Lösung zu
gewährleisten. Die Notwendigkeit solcher Bedingungen zeigt ein Beispiel von
Lebesgue (1913), in dem ein Gebiet im 3
Ê
mit einer scharfen, nach innen
weisenden Spitze ( Lebesgue–Stachel“) und Randwerte angegeben werden, für

welche das Dirichlet–Problem keine Lösung besitzt, siehe Courant–Hilbert
[3], Kap.4, §4.4.
Die Perron–Methode benötigt den geringsten technischen Aufwand, sie ist je-
doch auf das 1. Randwertproblem für die Laplace–Gleichung Δu = 0 be-
schränkt (und allgemeiner auf eine homogene elliptische Gleichung Lu = 0 ).
An den Gebietsrand werden hierbei nur schwache Bedingungen gestellt.
350 § 14 Randwertprobleme für den Laplace–Operator

Die Integralgleichungsmethode beruht auf der Darstellung der Lösung durch


Volumenpotentiale auf Ω und Oberflächenpotentiale auf ∂Ω. Die Oberflächen-
potentiale müssen hierbei Integralgleichungen im Funktionenraum C0 (∂Ω) erfül-
len. Diese Methode ist auf Innen– und Außenraumgebiete sowohl für das erste als
auch das zweite Randwertproblem anwendbar. Wesentliche Voraussetzung für
die Anwendbarkeit der Integralgleichungsmethode ist die Glattheit des Randes
∂Ω.
Die Variationsmethode geht von der Tatsache aus, dass jede Lösung eines Rand-
wertproblems die Minimumstelle eines Integralausdrucks, des Dirichlet–Integrals
ist. Beim Existenzbeweis wird zunächst der Definitionsbereich des Dirichlet–
Integrals zu einem Hilbertraum so vervollständigt, dass die Existenz einer Mini-
mumstelle des Dirichlet–Integrals leicht nachweisbar ist. Von der hiermit gefun-
denen schwachen Lösung ist in einem zweiten Schritt zu zeigen, dass sie auch
eine klassische Lösung des gegebenen Randwertproblems ist (Regularitätsbe-
weis).
Die Variationsmethode erweist sich als sehr ausbaufähig, sie ist insbesondere
auch auf nichtlineare und vektorwertige Probleme anwendbar, siehe Bd. 3, § 6.
Läßt die Problemstellung keine klassischen Lösungen zu (z.B. wenn die Differen-
tialgleichung unstetige Koeffizienten besitzt), so liefert die Variationsmethode
den Hinweis auf einen adäquaten Lösungsbegriff.

4.2 Der Existenzsatz von Perron


(a) Der Rand eines Gebiets Ω erfüllt die äußere Kegelbedingung, wenn
jeder Randpunkt die Spitze eines außerhalb von Ω liegenden Kegelstücks ist:
Zu jedem a ∈ ∂Ω gibt es einen Vektor e der Länge 1, einen Winkel Θ mit
0 < Θ < π/2 und ein r > 0, so dass das Kegelstück
  
K = a + tv  v cos Θ ≤ v , e , v ≤ r

mit Ω nur den Punkt a gemeinsam hat.


Durch diese Bedingung werden einspringenden Spitzen mit Winkel 0 (Lebesgue–
Stachel s.o.) ausgeschlossen. C2 –berandete und konvexe Gebiete erfüllen die
äußere Kegelbedingung.
Wir sprechen von einer gleichmäßigen äußeren Kegelbedingung, wenn Θ
und r unabhängig vom Randpunkt a gewählt werden können.
(b) Existenz– und Eindeutigkeitssatz. Das Dirichlet–Problem

Δu = 0 in Ω , u = g auf ∂Ω

mit gegebener Funktion g ∈ C0 (∂Ω) besitzt für ein beschränktes Gebiet Ω mit
äußerer Kegelbedingung genau eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).
4 Existenz von Lösungen: Perron–Methode 351

(c) Den auf Perron (1923) zurückgehenden Beweis finden Sie u.a. in Gil-
barg–Trudinger [79] 2.8, Dibenedetto [59] II.6. Wir begnügen uns mit der
Wiedergabe der Grundidee.
Ausgangspunkt ist folgender Sachverhalt: Ist u eine Lösung und v ∈ C0 (Ω)
eine subharmonische Funktion mit v ≤ g auf ∂Ω, so gilt v ≤ u auf ganz Ω.
Das folgt aus dem schwachen Maximumprinzip 2.7 (b) für die nach 2.7 (a),
2.7 (b) subharmonische Funktion v − u . Bezeichnet SLg (Ω) die Gesamtheit
aller subharmonischen Funktionen v ∈ C0 (Ω) mit v ≤ g auf ∂Ω (SL steht für
Sublösung), so gilt also

(∗) u(x) = sup { v(x) | v ∈ SLg (Ω)} für x ∈ Ω .

Beim Existenzbeweis wird umgekehrt durch (∗) eine Funktion u definiert, von
der sich zeigen lässt, dass sie harmonisch ist. Dies wird mit der Vorstellung
plausibel, dass aus der Mittelwertungleichung 2.7 (b) für subharmonische Funk-
tionen durch die Supremumsbildung die Mittelwertgleichung für u folgt, durch
welche nach 2.7 (c) harmonische Funktionen charakterisiert sind.
Die stetige Annahme der Randwerte durch die Funktion u lässt sich bei Gültig-
keit der äußeren Kegelbedingung beweisen; dabei werden für jeden Randpunkt
sogenannte Barriere–Funktionen konstruiert Dautray–Lions ([4] Vol.II, Ch. 2,
§ 4.1, Example 9).

Folgerung. Für jeden C2 –berandeten Außenraum Ω ⊂ Ê n


hat das Dirichlet–
Problem
Δu = 0 in Ω , u = g auf ∂Ω ,
u regulär im Unendlichen.

mit gegebener Funktion g ∈ C0 (∂Ω) genau eine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).

Beweis.
Ê
als ÜA : Nehmen Sie o.B.d.A. 0 ∈ n \ Ω an. Verwenden Sie die Kelvin–Trans-
formation und zeigen Sie, dass der Rand des gespiegelten Gebiets Ω∗ ebenfalls
C2 –differenzierbar ist. 2

4.3 Beispiel für ein unlösbares Dirichlet–Problem


Ê
Die gelochte Kugel Ω = K1 (0) \ {0} ⊂ n (n ≥ 2) erfüllt die äußere Kegelbe-
dingung im isolierten Randpunkt 0 nicht.
Das Dirichlet–Problem

Δu = 0 in Ω , u = 0 auf S1 (0) , u(0) = 1

besitzt auch keine Lösung u ∈ C0 (Ω) ∩ C2 (Ω).


352 § 14 Randwertprobleme für den Laplace–Operator

Denn eine solche wäre beschränkt und könnte daher nach 2.7 (e) zu einer auf
K1 (0) harmonischen Funktion v ∈ C0 (K1 (0)) fortgesetzt werden. Für diese
wäre aber das Maximumprinzip 2.3 (a) verletzt.

5 Existenz von Lösungen: Integralgleichungsmethode


5.1 Überblick: Existenz und Konstruktion von Lösungen
In diesem Abschnitt beschreiben wir das klassische Verfahren, Lösungen des
Dirichlet– und des Neumann–Problems für den Laplace–Operator in Form von
Potentialen zu gewinnen. Dieses orientiert sich an der physikalischen Vorstel-
lung, dass Gravitationsfelder und elektrische Felder durch Massen-, bzw. La-
dungsverteilungen erzeugt werden. Es gestattet eine einheitliche Behandlung
des Dirichlet– und des Neumann–Problems sowohl für Innenräume als auch für
Außenräume. Als Nebenresultat ergibt sich die Existenz der Green–Funktion
erster und zweiter Art. Die Methode macht wesentlichen Gebrauch von den Er-
gebnissen der Potentialtheorie und der Integralgleichungstheorie auf dem Funk-
tionenraum C0 (∂Ω).
In diesem Abschnitt wird vorausgesetzt, dass Ω ein beschränktes Gebiet des
Ê n
(n ≥ 2) mit C2 –differenzierbarem, wegzusammenhängendem Rand ∂Ω ist.
Wir geben zunächst eine Übersicht über die Ergebnisse und Beweisschritte und
gehen anschließend ins Detail.
(a) Das Dirichlet–Problem für einen Innenraum Ω,
− Δu = f in Ω , u = g auf ∂Ω mit f ∈ C1 (Ω), g ∈ C0 (∂Ω)
besitzt eine eindeutig bestimmte Lösung u ∈ C0 (Ω)∩C2 (Ω). Im Fall g ∈ C1 (∂Ω)
gilt zusätzlich u ∈ C1 (Ω). Die Lösung setzt sich in der unten beschriebenen
Weise aus einem Volumenpotential und dem Potential einer Dipolbelegung auf
∂Ω zusammen.
Folgerung. Es existiert eine Greensche Funktion erster Art.
Bemerkung. Die Voraussetzung f ∈ C1 (Ω) kann zur Forderung der Hölder–
Stetigkeit auf Ω abgeschwächt werden, vgl. Gilbarg–Trudinger [79] 6.3. Für
nur stetige Funktionen f braucht das Randwertproblem keine klassische Lösung
zu besitzen.

Der Beweis verläuft in folgenden Schritten:


(i) Abkopplung der Inhomogenität. Für das Volumenpotential

U (x) := Γx (y) f (y) dn y
Ω

mit der Grundlösung Γ ergibt sich U ∈ C2 (Ω), −ΔU = f in Ω , ΔU = 0 in


Ên
\ Ω ; Näheres hierzu in 5.2. Löst v ∈ C0 (Ω) ∩ C2 (Ω) das Problem
Δv = 0 in Ω , v = g − U auf ∂Ω ,
5 Existenz von Lösungen: Integralgleichungsmethode 353

so löst u = v + U das Ausgangsproblem. Es genügt also, den oben genannten


Satz für das Randwertproblem

(H) Δu = 0 in Ω , u = g auf ∂Ω

zu zeigen. Ist dies geleistet, so ergibt sich die Green–Funktion Gx = Γx + Hx


aus der Lösung Hx des Problems Δu = 0 in Ω, u = −Γx auf ∂Ω. Wegen
Γx ∈ C1 (∂Ω) ist dann Hx ∈ C1 (Ω) ∩ C2 (Ω) .
(ii) Für die Lösung u von (H) wird der Ansatz

u(x) = ∂n Γx · ν do mit ν ∈ C0 (∂Ω)
∂Ω

gemacht. Physikalisch entspricht dies dem Potential einer Dipolbelegung ν auf


∂Ω . Die Eigenschaften von Flächenpotentialen werden in 5.2 beschrieben, ins-
besondere ergibt sich aus der Sprungeigenschaft der Doppelschichtpotentiale

2 ∂n Γx · ν do − ν(x) = 2g(x) für x ∈ ∂Ω .
∂Ω

Dies ist eine Integralgleichung für ν ; wir schreiben diese in der Form

Sν − ν = 2g mit Sν(x) := 2 ∂n Γx · ν do für x ∈ Ω .
∂Ω
Auf die Lösbarkeit dieser Integralgleichung wird in 5.3 eingegangen.
(b) Die Lösung des Dirichletschen Außenraumproblems
Δu = 0 in Ω , u = g auf ∂Ω ,
u regulär im Unendlichen
ergibt sich ebenfalls in der Form u = 21 Sν , wobei ν ∈ C0 (Ω) diesmal der
Integralgleichung Sν + ν = 2 g genügt, siehe 5.3.
(c) Das Neumannsche Innenraumproblem lautet
−Δu = f in Ω , ∂n u, = g auf ∂Ω ,

wobei f ∈ C (Ω) und g ∈ C0 (∂Ω) der Verträglichkeitsbedingung


1

 
(∗) f dn x + g do = 0
Ω ∂Ω

genügen und die Randbedingung im Sinne von


lim ∇u(x − tn(x)) , n(x) = g(x) für x ∈ ∂Ω
t→0+

zu verstehen ist, vgl. § 11 : 4.3*.


Diese Aufgabe besitzt eine bis auf eine additive Konstante eindeutig bestimmte
Lösung u ∈ C1n (Ω) ∩ C2 (Ω) , die sich in der unten beschriebenen Weise aus
einem Volumenpotential und dem Potential einer einfachen Belegung von ∂Ω
zusammensetzt. Im Fall g ∈ C1 (∂Ω) gilt zusätzlich u ∈ C1 (Ω).
354 § 14 Randwertprobleme für den Laplace–Operator

Bemerkungen.
(i) Aus dem letzten Sachverhalt folgt die Existenz einer Green–Funktion zwei-
ter Art, vgl. 2.5.
(ii) Hinsichtlich der Abschwächbarkeit der Voraussetzung über f gilt das in (a)
Gesagte.
(iii) Die Notwendigkeit der Bedingung (c) ergibt sich aus der verallgemeinerten
Greenschen Formel § 11 : 4.3* (c): Für eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω) folgt mit
v=1
   
f dn x = − Δu dn x = − ∂n u do = − g do .
Ω Ω ∂Ω ∂Ω

Das Beweisverfahren ist ähnlich wie für (a):



(i) Es genügt, den Fall f = 0 zu betrachten: Ist U (x) = Γx f dn y und
Ω
v ∈ C1n (Ω) ∩ C2 (Ω) eine Lösung des Neumann–Problems

−Δv = 0 in Ω , ∂n v = g − ∂n U auf ∂Ω ,

so löst u = v + U das Ausgangsproblem.


(ii) Die Lösung u des Neumann–Problems Δu = 0 in Ω, ∂n u = g auf ∂Ω
wird angesetzt als Potential der einfachen Randbelegung μ,

u(x) := Γx μ do .
∂Ω

Die Eigenschaften solcher Flächenpotentiale werden in 5.2 beschrieben. Als Be-


dingung für μ ergibt sich die Integralgleichung

μ(x) − 2 Γx μ do = −2g(x) , kurz μ − T μ = −2g .
∂Ω

Näheres hierzu in 5.3.


(iii) Die Green–Funktion zweiter Art Gx = Γx +Hx ergibt sich aus der Lösung
Hx ∈ C1 (Ω) ∩ C2 (Ω) des Problems Δu = 0 in Ω , ∂n u = −1/An−1 (∂Ω) auf
∂Ω unter Berücksichtigung der letzten Behauptung des Satzes.
(d) Die Neumannsche Außenraumaufgabe
Δu = 0 in Ω ,

∂n u = g auf ∂Ω , g do = 0 mit g ∈ C0 (∂Ω) ,
∂Ω
u regulär im Unendlichen
besitzt eine Lösung u ∈ C1n (Ω) ∩ C2 (Ω) . Diese ist für n ≥ 3 eindeutig bestimmt;
für n = 2 besteht Eindeutigkeit bis auf additive Konstanten. Wie in (c) gibt es
5 Existenz von Lösungen: Integralgleichungsmethode 355

1
eine Lösung der Form u = 2
T μ , wobei die Randbelegung μ der einfachen
Schicht der Integralgleichung

μ + T μ = −2g

genügt.
(e) Das Ganzraumproblem. Ω sei ein beschränktes, C2 –berandetes Gebiet
und f ∈ C1 (Ω) eine Funktion, die wir durch Nullsetzen außerhalb von Ω auf
Ê
den n fortsetzen. Dann hat das Ganzraumproblem

−Δu = f in Ê n
\ ∂Ω , lim u(x) = 0
x→∞

genau eine Lösung u ∈ C1 ( Ê ) ∩ C (Ê


n 2 n
\ ∂Ω), und diese ist gegeben durch das
Volumenpotential

u(x) = Γx (y) f (y) dn y .
Ω

Das ergibt sich aus Satz 1 des folgenden Abschnitts.

5.2 Ergebnisse der Potentialtheorie


Ê
Im folgenden sei Ω ⊂ n (n ≥ 2) ein beschränktes Gebiet mit C2 –differen-
Ê
zierbarem Rand Σ := ∂Ω, und n \ Ω sei ebenfalls ein Gebiet. Ferner sei n
das äußere Normalenfeld von Ω und Γ die Grundlösung von −Δ. Zu gegebenen
Funktionen f ∈ C0 (Ω), μ, ν ∈ C0 (Σ) definieren wir Potentiale U, V, W auf
Ê
dem n durch

U (x) := Γx (y)f (y) dn y
Ω

(Volumenpotential mit der Dichte f ),



V (x) = (V μ)(x) := Γx (y) μ(y) do(y)
Σ

(Potential der einfachen Schicht mit der Belegung μ ),



W (x) = (W ν)(x) := ∂n Γx (y) · ν(y) do(y)
Σ

(Potential der doppelten Schicht mit der Dipolbelegung ν ).

Wegen Γx (y) = cn y − x2−n für n ≥ 3 und |Γx (y)| = (2π)−1 log y − x


für n = 2 konvergieren die Integrale U (x), V(x), nach § 11 : 2.4 (c) für alle
Ê
x ∈ n ; für V (x) folgt das aus der Definition des Integrals auf der (n − 1)−
dimensionalen Untermannigfaltigkeit Σ ÜA . Die Konvergenz des Integrals
Ê
W (x) ist im Fall x ∈ n \ Σ unproblematisch. Dass W (x) auch für x ∈ Σ
356 § 14 Randwertprobleme für den Laplace–Operator

existiert, folgt aus der Ungleichung | ∂n Γx (y) | ≤ c x − y2−n für benachbarte


Punkte x, y ∈ Σ mit x = y . Zum Nachweis verwenden wir aus dem Beweis in
2.4 die Beziehung
| y − x , n(y) |
| ∂n Γx (y) | = | ∇Γx (y) , n(y) | = .
ωn y − xn
Nach Wahl einer C2 –Parametrisierung Φ von Σ ergibt sich mit x = Φ(u),
y = Φ(v)

Φ(u) − Φ(v) = dΦ(u)(u − v) + R(u − v) ,

R(u − v) ≤ const u − v2 ≤ const x − y2 ,

dΦ(u)(u − v) ⊥ n(Φ(u)) .

Wir zitieren die wichtigsten Ergebnisse der Potentialtheorie; Literaturangaben


für die Beweise werden anschliessend gegeben.

Satz 1. Für f ∈ C0 (Ω) und das zugehörige Volumenpotential U gilt


(a) U ∈ C1 ( Ê ),
n

(b) U ist harmonisch in Ê n


\ Ω,
(c) |U (x)| ≤ c x 2−n
für x  1 mit einer Konstanten c ≥ 0.
(d) Gilt zusätzlich f ∈ C1 (Ω), so ist U ∈ C2 (Ω) und −Δu = f in Ω.

Ê
Für das Folgende setzen wir Ω− := Ω, Ω+ := n \ Ω und definieren die einsei-
tigen Normalableitungen von V im Punkt x ∈ Σ, soweit existent, durch

∂n V± (x) := lim ∇V (x + tn(x)) , n(x) ,


t→0±

entsprechend für W .

Satz 2. Für μ ∈ C0 (Σ) und V := V μ gilt:


(a) V ∈ C0 ( Ên
),
Ê
(b) V ist harmonisch in n \ Σ = Ω+ ∪ Ω− .
(c) Die einseitigen Normalableitungen ∂n V± (x) existieren für jedes x ∈ Σ
und erfüllen die Sprungrelationen
1
∂n V± (x) = N (x) ∓ μ(x) für x ∈ Σ
2
mit

N (x) := ∂n Γy (x) · μ(y) do(y) .
Σ

(Die Konvergenz dieses Integrals ergibt sich wie in 5.2.)


5 Existenz von Lösungen: Integralgleichungsmethode 357

(d) N ist stetig auf Σ.


(e) |V (x)| ≤ c x2−n für x  1 mit einer Konstanten c ≥ 0.
(f) Für μ ∈ C1 (Σ) gilt V ∈ C1 (Ω± ) , d.h. die Einschränkung von ∇V auf
Ω± lässt sich stetig auf Ω± = Ω± ∪ Σ fortsetzen.

Die Aussagen (b), (c), (d) implizieren also die für das Neumann–Problem gefor-
derten Eigenschaften V ∈ C1n (Ω− ) ∩ C2 (Ω− ).

Satz 3. Für ν ∈ C0 (Σ) und W := W ν gilt:


(a) W ist harmonisch in Ê n
\ Σ = Ω+ ∪ Ω− ,
(b) W ist stetig auf Σ,
(c) Die Einschränkung von W auf Ω± besitzt eine stetige Fortsetzung W± auf
Ω± ∪ Σ und es bestehen die Sprungrelationen

1
W± (x) = W (x) ± ν(x) für x ∈ Σ ,
2

(d) |W (x)| ≤ c x1−n für x  1 mit einer Konstanten c ≥ 0.

Der Beweis von Satz 1 ist zu finden in Dibenedetto [59] Ch. II, Gilbarg–
Trudinger [79] 4.2, 4.3, Leis [50] II, Wladimirow [56] § 22.
Die Sätze 2, 3 werden bewiesen in Dibenedetto [59] Ch. III, Colton–Kress
[88] 2, Michlin [51] Kap. 12, 16, Wladimirow [56] § 22.

Die Potentialtheorie hat eine lange Geschichte. Laplace fand 1785/89, dass
das Volumenpotential außerhalb Ω der nach ihm benannten Gleichung Δu = 0
genügt. Poisson zeigte 1813, dass dieses in Ω die Gleichung −Δu = f erfüllt;
seine Herleitung war jedoch nicht korrekt. Der Nachweis der Stetigkeits– und
Differenzierbarkeitseigenschaften von U, V, W erfordert wegen der Singularität
der Grundlösung diffizile Abschätzungen. Grundlegende Beiträge zur Potential-
theorie leisteten Gauß 1840, Otto Hölder 1882, Ljapunow 1892, Korn 1909,
Lichtenstein 1912, vgl. Burkhardt–Meyer [194], Lichtenstein [84].

5.3 Die Integralgleichungen der Flächenbelegungen


(a) Wir legen die Voraussetzungen und Bezeichnungen 5.2 zugrunde und defi-
nieren die Integraloperatoren S, T : C0 (Σ) → C0 (Σ) durch

(Sν)(x) := 2 ∂n Γx (y) · ν(y) do(y) ,
Σ

(T μ)(x) := 2 ∂n Γy (x) μ(y) do(y) .
Σ
358 § 14 Randwertprobleme für den Laplace–Operator

Satz. (i) u := ± W ν in Ω± , u := g auf Σ = ∂Ω± löst das erste Rand-


wertproblem für die Laplace–Gleichung im Außen–/Innenraum Ω± genau dann,
wenn ν ∈ C0 (Σ) die Integralgleichung
Sν ± ν = 2g
erfüllt.
(ii) u := V μ in Ω± löst das zweite Randwertproblem für die Laplace–Gleichung
im Außen–/Innenraum Ω± genau dann, wenn μ ∈ C0 (Σ) der Integralgleichung
± T μ − μ = −2g
genügt.
1
Teil (i) folgt aus 5.2, Satz 3 wegen W ν = 2
Sν .
Teil (ii) folgt aus 5.2, Satz 2 mit (T μ)(x) = 2N (x) , wobei für die Außenraum-
aufgabe zu beachten ist, dass −n das äußere Normalenfeld von Ω+ ist.

(b) Damit ist die Frage nach der Existenz von Lösungen der obengenannten vier
Randwertprobleme auf die Lösung von Integralgleichungen zurückgeführt. Wir
referieren das Vorgehen in Kürze und verweisen für Einzelheiten auf Colton–
Kress [88] 3.4, Dautray–Lions [4] Vol.1, II § 45, Leis [50] II, III, IV, Michlin
[51] Kap. 17, Wladimirow [56] § 16, § 23.
Die wesentliche Eigenschaft der Operatoren S, T : C0 (Σ) → C0 (Σ) ist die die
Kompaktheit (Vollstetigkeit) : Für jede in der Supremumsnorm  · ∞ be-
schränkte Folge (fn ) enthalten die Bildfolgen (Sfn ), (T fn ) jeweils bezüglich
der Norm  · ∞ (also gleichmäßig) konvergente Teilfolgen. Für kompakte Ope-
ratoren A auf dem unendlichdimensionalen Banachraum C0 (Σ) gilt wie im End-
lichdimensionalen: Ist λ = 0 kein Eigenwert von A, so ist A − λ½ bijektiv.
Es zeigt sich, dass 1 kein Eigenwert von S ist, woraus sich die eindeutige Lösbar-
keit der ersten Randwertaufgabe ergibt. Ferner gilt aufgrund des Satzes von
Fubini bezüglich des L2 –Skalarproduktes auf C0 (Σ)
u , Sv = T u , v .
Daraus und aus der Kompaktheit von S, T ergibt sich: Ist λ = 0 ein Ei-
genwert von T , so haben Kern (S − λ½) und Kern (T − λ½) dieselbe end-
liche Dimension. Die Gleichung T μ − λμ = 2g ist genau dann lösbar, wenn
g ⊥ Kern (S − λ½) . Es zeigt sich, dass −1 ein Eigenwert von S ist und dass
der zugehörige Eigenraum aus den konstanten Funktionen besteht. Daher ist
die Gleichung T μ + μ = 2g für die Neumannsche Innenraumaufgabe genau
dann lösbar, wenn

g do = 0 .
Σ

Die Lösung ist bis auf additive Konstanten eindeutig bestimmt.


6 Existenz von Lösungen: Variationsmethode 359

6 Existenz von Lösungen: Variationsmethode


6.1 Der Grundgedanke der Variationsmethode
(a) Wir betrachten für ein beschränktes Normalgebiet Ω ⊂ Ê n
das Dirichlet–
Problem

(D) − Δu = f in Ω , u = g auf ∂Ω

mit gegebenen Funktionen g ∈ C0 (∂Ω) und f ∈ C0 (Ω).


Wir setzen
  
C1g (Ω) := v ∈ C1 (Ω)  v = g auf ∂Ω

und definieren auf C1g (Ω) das Dirichlet–Integral durch


 1
J(v) := 2
∇v2 − f v dn x .
Ω

Satz. Eine Funktion u ∈ C1g (Ω) ∩ C2 (Ω) ist genau dann eine Lösung von (D),
wenn u eine Minimumstelle von J auf C1g (Ω) ist.
Dieser Zusammenhang wurde für den Fall f = 0 von Gauß (1840) und Lord
Kelvin (1847) gefunden.

Beweis.
(i) Sei u ∈ C1g (Ω) ∩ C2 (Ω) und −Δu = f in Ω . Für v ∈ C1g (Ω) setzen wir
ϕ := v − u ∈ C10 (Ω) und erhalten mit der 1. Greenschen Identität
 1
J(v) − J(u) = 2
∇(u + ϕ)2 − 1
2
∇u2 − f ϕ dn x
Ω
 
= ∇u , ∇ϕ + 1
2
∇ϕ2 − f ϕ dn x
Ω
  
= ϕ ∂n u do − (Δu + f ) ϕ dn x + 1
2
∇ϕ2 dn x
∂Ω Ω Ω

= 1
2
∇ϕ2 dn x ≥ 0 ,
Ω

also ist u eine Minimumstelle von J .


(ii) Sei u ∈ C1g (Ω) ∩ C2 (Ω) eine Minimumstelle von J : C1g (Ω) → Ê . Dann
gilt u + sϕ ∈ C1g (Ω) für s ∈ Ê
und jede Testfunktion ϕ ∈ C∞c (Ω) .
360 § 14 Randwertprobleme für den Laplace–Operator

Die Funktion
 1
s → j(s) = J(u + sϕ) = 2
∇u2 − f u dn x
Ω
 
+ s ( ∇u , ∇ϕ − f ϕ) dn x + 1
2
s2 ∇ϕ2 dn x
Ω Ω

hat dann an der Stelle s = 0 ein Minimum. Aus j  (0) = 0 ergibt sich die
Variationsgleichung
 
(V) 0 = ( ∇u , ∇ϕ − f ϕ) dn x = − (Δu + f ) ϕ dn x ,
Ω Ω

Letzteres nach dem Gaußschen Integralsatz in der randlosen Version § 11 : 3.2.


Da (V) für jede Testfunktion ϕ ∈ C∞
c (Ω) erfüllt ist, ergibt sich aus dem Funda-
mentallemma der Variationsrechnung § 10 : 4.1 die Poisson–Gleichung
Δu + f = 0 in Ω . 2

(b) Umformung des Dirichlet–Problems. Unter geeigneten Voraussetzungen (Nä-


heres in 6.6) lassen sich die Randwerte g zu einer wieder mit g bezeichneten
Funktion g ∈ C1 (Ω) ∩ C2 (Ω) fortsetzen. In diesem Fall ist u genau dann eine
Lösung von (D), wenn u0 := u − g das Randwertproblem

(D0 ) − Δu = f + Δg in Ω , u = 0 auf ∂Ω

löst. Das zu (D0 ) gehörige Dirchlet–Integral J0 : C10 (Ω) → Ê ist


 1
J0 (v) = 2
∇v2 − (f + Δg) v dn x
Ω
 1
= 2
∇v2 − f v + ∇g , ∇v dn x .
Ω

Wir behandeln im folgenden das reduzierte Dirichlet-Problem (D0 ). Haben wir


für dieses eine Lösung u0 gefunden, so ist u = u0 + g Lösung des Originalpro-
blems (D).

(b) Die Variationsmethode besteht darin, für das Dirichlet–Integral J0 die Exi-
stenz einer Minimumstelle nachzuweisen und damit das Randwertproblem (D0 )
zu lösen. Das Vorgehen erfolgt in zwei Schritten:
(i) Existenz einer schwachen Lösung. Auf C10 (Ω) wird durch

u, v 1 := (u v + ∇u , ∇v ) dn x
Ω

ein Skalarprodukt definiert. Der so entstandene Skalarproduktraum muss zu


einem Hilbertraum erweitert werden; Vollständigkeit ist, wie immer in der Ana-
lysis, eine Grundvoraussetzung für das Führen von Existenzbeweisen.
6 Existenz von Lösungen: Variationsmethode 361

Die Erweiterung besteht darin, Funktionen v ∈ L2 (Ω) zuzulassen, welche Ab-


leitungen ∂1 v, . . . , ∂n v ∈ L2 (Ω) im Distributionssinn besitzen. Auf dem Sobo-
lew–Raum dieser Funktionen ist J0 (v) definiert und stetig in der Norm  · 1 .
Der Existenzbeweis für Minimumstellen von J0 im Sobolew–Raum verläuft mit
ganz analogen Schlüssen, wie sie beim Beweis des Projektionssatzes im Hilbert-
raum § 9 : 2.3 verwendet werden. Eine solche Minimumstelle heißt eine schwache
Lösung des Minimumproblems, bzw. des zugehörigen Randwertproblems (D0 ).
(ii) Regularität der schwachen Lösung. Die Hauptarbeit der Variationsmetho-
de besteht im Nachweis, dass schwache Lösungen auch Lösungen im Sinne der
ursprünglichen Problemstellung sind, d.h. C2 –differenzierbar in Ω und stetig
auf Ω . Dies gelingt unter geeigneten Glattheitsvoraussetzungen an die Daten.

(c) Bei der hiermit skizzierten direkten Methode der Variationsrech-


nung wird der Existenzbeweis für die Lösung also abgetrennt vom Nachweis
der Regularitätseigenschaften. Die lange Auseinandersetzung mit diesem Ge-
genstand in der ersten Hälfte des 20. Jahrhunderts hat die Mathematiker zu
der Einsicht geführt, dass dieses Vorgehen natürlich und angemessen ist; vgl.
Ladyzhenskaya–Uraltseva [82] Preface. Dies wird auch dadurch gestützt,
dass zahlreiche Minimumprobleme der Mathematischen Physik (z.B. in der Ela-
stizitätstheorie) keine differenzierbaren Lösungen besitzen; für solche ist der
schwache Lösungsbegriff der natürliche. Die Bedeutung der direkten Methode
der Variationsrechnung liegt darüberhinaus darin, dass sie auch auf nichtlineare
Probleme und Systeme von Differentialgleichungen anwendbar ist.

Wir führen im folgenden die wichtigsten Argumente der Variationsmethode vor;


den an Einzelheiten interessierten Leser verweisen wir auf [75]. Historische No-
tizen zur Entwicklung der direkten Methode finden Sie in Courant–Hilbert
[3], Kap. 7 und Leis [50] IV, 7.

6.2 Die Sobolew–Räume W1 (Ω) und W10 (Ω)


Literatur: Gilbarg–Trudinger [79] Ch. 7, Adams [132].

Sei Ω ein Gebiet des Ê n


. Norm und Skalarprodukt von L2 (Ω) bezeichnen wir
mit u bzw. u , v .
(a) Für u ∈ L2 (Ω) heißen v1 , . . . , vn ∈ L2 (Ω) schwache oder distributio-
nelle Ableitungen von u, wenn für alle ϕ ∈ C∞ c (Ω)

u , ∂i ϕ = − vi , ϕ (i = 1, . . . , n)

gilt. Da L2 –Funktionen lokalintegrierbar sind und somit reguläre Distributionen


liefern (§ 13 : 2.3), bedeutet dies nach § 13 : 4.1

∂i {u} = {vi } (i = 1, . . . , n) .
362 § 14 Randwertprobleme für den Laplace–Operator

Nach § 13 : 2.3 sind die schwachen Ableitungen, sofern sie existieren, eindeutig
bestimmt. Für u ∈ C1 (Ω) und ϕ ∈ C∞ c (Ω) gilt u , ∂i ϕ = − ∂i u , ϕ nach
§ 11 : 3.3. Also sind ∂1 u, . . . ∂n u die schwachen Ableitungen von u, falls diese und
u selbst zu L2 (Ω) gehören. Für u ∈ C1 (Ω) ist daher die partielle Ableitung
∂i u eine schwache Ableitung. Es ist üblich, auch im allgemeinen Fall u ∈ L2 (Ω)
die schwachen Ableitungen vi mit ∂i u zu bezeichnen.
Der Sobolew–Raum W1 (Ω) ist definiert als der Vektorraum aller Funktionen
u ∈ L2 (Ω), die schwache Ableitungen ∂1 u, . . . , ∂n u ∈ L2 (Ω) besitzen, versehen
mit dem Skalarprodukt

n 
u, v 1 = u, v + ∂i u , ∂i v = (u v + ∇u , ∇v ) dn x
i=1 Ω

und der zugehörigen Norm



u21 = |u|2 + ∇u2 dn x .
Ω

Für u ∈ W1 (Ω) gilt also u1 ≥ u und u21 ≥ ∇u2 dn x .
Ω

In der Literatur wird der Sobolew–Raum W1 (Ω) meistens mit W1,2 (Ω) bezeich-
net.

Satz. W1 (Ω) ist ein separabler Hilbertraum.

Beweis.
(i) Vollständigkeit. Ist (uk ) eine Cauchy–Folge in W1 (Ω), so sind die Folgen
(uk ), (∂1 uk ), . . . , (∂n uk ) Cauchy–Folgen in L2 (Ω), besitzen also L2 –Limites
u, v1 , . . . , vn ∈ L2 (Ω). Für Testfunktionen ϕ ∈ C∞
c (Ω) gilt

∂i uk , ϕ + uk , ∂i ϕ = (∂i uk ϕ + uk ∂i ϕ) dn x = 0 .
Ω

Wegen der Stetigkeit des Skalarprodukts folgt daraus

vi , ϕ + u , ∂i ϕ = 0,

also u ∈ W (Ω) und ∂i u = vi (i = 1, . . . , n).


1

(ii) Separabilität. Nach § 9 : 1.5 ist L2 (Ω,


n 
Ên+1
) = {(u0 , . . . , un ) | uk ∈ L2 (Ω)}

mit der Norm (u0 , . . . , un )2 = |uk |2 dn x separabel. Durch
k=0 Ω

W1 (Ω) → L2 (Ω, Ê n+1


), u → (u, ∂1 u, . . . , ∂n u)
1
ist eine Isometrie zwischen W (Ω) und einem nach (i) abgeschlossenen Teilraum
Ê
von L2 (Ω, n+1 ) gegeben. Dieser ist nach § 9 : 2.7 separabel. 2
6 Existenz von Lösungen: Variationsmethode 363

(b) Der Raum W10 (Ω). Für eine Funktion u ∈ W1 (Ω) auf einem beschränk-
ten Gebiet Ω sind die Werte auf ∂Ω nicht notwendig definiert; wir können aber
das Verschwinden auf dem Rand in einem schwachen Sinn erklären. Hierzu be-
trachten wir den Abschluss W01 (Ω) von C∞ c (Ω) ⊂ W (Ω) in der Sobolew–Norm
1

 · 1 ; dabei lassen wir beliebige Gebiete Ω ⊂ n


Ê
zu. Anstelle von C∞
c (Ω) kann
ebensogut C1c (Ω) oder C10 (Ω) genommen werden, vgl. 6.4. Für beschränkte,
C1 –berandetete Gebiete Ω nehmen Funktionen u ∈ C0 (Ω) ∩ W01 (Ω) in allen
Randpunkten den Wert Null an; vgl. Brezis [133] Th. IX.17. Ohne Glattheits-
bedingungen an den Rand lässt sich das nicht behaupten.

(c) Satz. Sei Ω ein beschränktes Gebiet. Dann ist V := W01 (Ω) ist ein echter
Teilraum von W1 (Ω). Auf W01 (Ω) ist durch
 1/2
uV := ∇u2 dn x
Ω

eine zur Sobolew–Norm äquivalente Norm gegeben; d.h. es gilt

uV ≤ u1 ≤ k uV mit einer Konstanten k > 1 .

W01 (Ω), versehen mit dem zu  · V gehörigen Skalarprodukt ·, · V ist also


ein separabler Hilbertraum.
Der Beweis beruht auf der
(d) Poincaré–Ungleichung. Liegt √ Ω zwischen zwei parallelen Hyperebenen
mit Abstand d, so gilt mit c = d/ 2

u ≤ c uV für alle u ∈ W01 (Ω) .

Die demnach endliche Poincaré–Konstante


(  =
u 
c(Ω) := sup u ∈ W01 (Ω) , u = 0
uV 

spielt als geometrische Kennzahl des Gebiets Ω bei vielen Differentialgleichungs-


problemen eine wichtige Rolle.
√ Unter den Voraussetzungen der Poincaré–Unglei-
chung ist also c(Ω) ≤ d/ 2 . In § 15 : 1.3 (c) zeigen wir für beschränkte Gebiete
Ω, dass λ1 = c(Ω)−2 der kleinste Eigenwert des Laplace–Operators ist.

Beweis der Poincaré–Ungleichung.


Aufgrund des Transformationssatzes für Integrale gilt für u ∈ W01 (Ω) und jede
Bewegung h : u ∈ W01 (Ω) ⇐⇒ v = u ◦ h ∈ W01 (Ω ) mit Ω = h−1 (Ω) ; ferner
ist u = v , uV = vV , jeweils auf Ω bzw. Ω bezogen ÜA . Wir dürfen
daher annehmen, dass
 
Ω ⊂ Ê n−1
× ]0, d[ = (y, t) | y ∈ Ê
n−1
, 0<t<d .
364 § 14 Randwertprobleme für den Laplace–Operator

Wir betrachten zunächst eine Funktion ϕ ∈ C∞ c (Ω). Für x = (y, t) ∈ Ω und


x0 = (y, 0) ∈ Ω ergibt die Cauchy–Schwarzsche Ungleichung

t
| ϕ(x) | = | ϕ(x) − ϕ(x0 ) | ≤ | ∂n ϕ(y, s) | ds
0
t  t 1/2  t 1/2
≤ 1 ∇ϕ(y, s) ds ≤ 12 ds ∇ϕ(y, s)2 ds .
0 0 0

Daraus folgt mit sukzessiver Integration

  d  d
ϕ2 ≤ t ∇ϕ(y, s)2 ds dt dn−1 y
Ên−1 0 0
  d
= 1
d2 ∇ϕ(y, s)2 ds dn−1 y
Ên−1
2
0

= c2 ϕV 2

mit c = d/ 2 . Aus u − ϕn 1 → 0 mit ϕn ∈ C∞ c (Ω) folgt u − ϕn  → 0
und u − ϕn V → 0, somit u2 ≤ c2 , uV 2 . 2

Der Beweis von (c) folgt aus der Poincaré–Ungleichung mit k2 = 1 + c(Ω)2 .
W01 (Ω) ist ein echter Teilraum von W1 (Ω) , weil die konstante Funktion 1 zu
W1 (Ω), aber wegen 1V = 0 und der Poincaré–Ungleichung nicht zu W01 (Ω)
gehört.

(e) Auswahlsatz von Rellich (F. Rellich (1930)) Jede in W01 (Ω) beschränk-
te Folge besitzt eine in L2 (Ω) konvergente Teilfolge.
Für den Beweis siehe Ladyzhenskaya [65] I, Thm.6.1, Leis [50] VI.5.

6.3 Die Existenz einer schwachen Lösung


Ê
Sei Ω ein beschränktes Gebiet des n. Wir zeigen für das auf verschwindende
Randwerte reduzierte Randwertproblem

(D0 ) −Δu = f + Δg in Ω , u = 0 auf ∂Ω

die Existenz einer schwachen Lösung. Hierbei genügt es, f ∈ L2 (Ω) , g ∈ W1 (Ω)
vorauszusetzen. Wir verwenden die Bezeichnungen
 
H = L2 (Ω) , u, v H = u v dn x , u2H = u2 dn x ,
Ω Ω
 
V = W01 (Ω) , u, v V = ∇u , ∇v dn x , u2V = ∇u2 dn x .
Ω Ω
6 Existenz von Lösungen: Variationsmethode 365

Dem Programm 6.1 (b) folgend, fassen wir das Dirichlet–Integral


 1
J0 (v) = 2
∇v2 − f v + ∇g , ∇v dn x
Ω

= 1
2
v, v V − f, v H + g, v V

als Funktion auf dem Hilbertraum V = W01 (Ω) auf, wobei die Gradienten jetzt
aus schwachen Ableitungen bestehen.

Satz. Das Dirichlet–Integral J0 : W01 (Ω) → Ê


besitzt genau eine Minimum-
stelle u ∈ W01 (Ω). Diese ist charakterisiert durch die Beziehung

(∗) u, ϕ V = f,ϕ H − g, ϕ V für alle ϕ ∈ W01 (Ω) .

Die Gleichung (∗) lautet ausgeschrieben


 
∇u , ∇ϕ dn x = (f ϕ − ∇g , ∇ϕ ) dn x für alle ϕ ∈ W01 (Ω).
Ω Ω

Eine der Gleichung (∗) genügende Funktion u ∈ W01 (Ω) wird eine schwache
Lösung des Dirichlet–Problems (D0 ) genannt.

Bemerkung. Die Variationsmethode zum Nachweis der Existenz von schwa-


chen Lösungen stammt von Friedrichs (1934); sie wird in der Literatur mei-
stens nach Lax und Milgram (1954) benannt.

Beweis.
(1) Die Existenz einer Minimumstelle kann direkt bewiesen werden, indem wir
eine Minimalfolge für J0 : V → Ê
wählen (d.h. eine Folge (uk ) in V mit
lim J0 (uk ) = inf {J0 (v) | v ∈ V } ) und mit Hilfe der Parallelogrammgleichung
k→∞
zeigen, dass diese eine Cauchy–Folge in V ist. Das Grenzelement u ∈ V ist
Ê
dann die Minimumstelle von J0 : V → ; vgl. John [49] 4.5 Probl. 1.
(2) Schneller zum Ziel kommen wir durch Anwendung der Hilbertraumtheorie.
Hierzu zeigen wir zunächst:
(i) Die Gleichung (∗) hat genau eine Lösung u ∈ V . Denn nach der Poincaré–
Ungleichung 6.2 gilt
 
 f,ϕ − g, ϕ  ≤ f  ϕ + g ϕ
H V H H V V

≤ (c(Ω) f H + gV ) ϕV für jedes ϕ ∈ V,

Ê
also ist F : V → , ϕ → f , ϕ H − g , ϕ V eine stetige Linearform auf dem
Hilbertraum V . Nach dem Darstellungssatz von Riesz–Fréchet § 9 : 2.8 existiert
genau ein u ∈ V mit u , ϕ V = F ϕ für jedes ϕ ∈ V ; u erfüllt also (∗).
366 § 14 Randwertprobleme für den Laplace–Operator

(ii) u ∈ V löst (∗) genau dann, wenn u eine Minimumstelle von J0 : V → Ê


ist. Denn erfüllt u die Gleichung (∗), so gilt für jedes v ∈ V und für ϕ = u − v
J0 (v) − J0 (u) = J0 (u + ϕ) − J0 (u)
= u, ϕ V − f, ϕ H + g, ϕ V + 1
2
ϕ2H

= 1
2
ϕ2H ≥ 0,

also ist u ∈ V Minimumstelle von J0 .


Ist umgekehrt u eine Minimumstelle von J0 , so hat für jedes ϕ ∈ V die reell-
wertige Funktion
s → j(s) := J0 (u + sϕ)

= J(u) + s u, ϕ V − f,ϕ H + g, ϕ V + 12 s2 ϕ2V
in s = 0 eine Minimumstelle, folglich gilt

0 = j  (0) = u , ϕ V − f,ϕ H + g, ϕ V ,

d.h. u genügt der Gleichung (∗). 2

6.4 Weiteres über Sobolew–Räume


(a) Approximation von W1 –Funktionen durch C∞ –Funktionen.
Definition. Eine Funktion u ∈ L2 (Ω) gehört zur Klasse H1 (Ω), wenn es Funk-
tionen uk ∈ C1 (Ω) ∩ L2 (Ω) gibt, die im L2 –Sinn gegen u konvergieren und für
die (∂1 uk ), . . . , (∂n uk ) Cauchy–Folgen in L2 (Ω) sind.
Für vi = lim ∂i uk (i = 1, . . . , n) und Testfunktionen ϕ ∈ C∞
c (Ω) folgt dann
k→∞
aus der Stetigkeit des Skalarprodukts
u , ∂i ϕ + vi , ϕ = lim ( uk , ∂i ϕ + ∂i uk , ϕ ) = 0
k→∞

für i = 1, . . . , n, da die uk nach 6.2 (a) zu W1 (Ω) gehören.


Somit gilt H1 (Ω) ⊂ W1 (Ω), und H1 (Ω) ist der Abschluss von W1 (Ω) ∩ C1 (Ω) in
der Sobolew–Norm  · 1 . Den Abschluss von C∞ c (Ω) in dieser Norm bezeichnen
wir mit H10 (Ω).

Satz (Kasuga 1957). Es gilt

H1 (Ω) = W1 (Ω) , H10 (Ω) = W01 (Ω) , W1 ( Ê n


) = W01 ( Ê n
).

Für jedes u ∈ W1 (Ω) gibt es also Funktionen ϕk ∈ C∞ (Ω) mit ϕk → u für


Ê
k → ∞ in der W1 –Norm; im Fall u ∈ W1 ( n) können diese mit kompaktem
Träger gewählt werden.
6 Existenz von Lösungen: Variationsmethode 367

Beweis.
Wir führen den Beweis nur für Ω = Ê . Nach § 10 : 3.4 (b) gilt für u ∈ L (Ê )
n 2 n

lim u − jr ∗ u = 0 .
r→0

Dabei sind die jr ∗ u Testfunktionen. Für u ∈ W1 ( Ê ) gilt daher auch


n

lim ∂i u − jr ∗ ∂i u = 0 (i = 1, . . . , n) .
r→0

Für u ∈ W1 ( Ê
n
) gilt nach dem Satz über Parameterintegrale
 
(jr ∗ ∂i u)(x) = ∂i u(y) jr (x − y) dn y = − ∂
u(y) ∂y jr (x − y) dn y
Ên Ên  i

= ∂
u(y) ∂x jr (x − y) dn y = ∂
u(y) jr (x − y) dn y ,
Ên Ên
i ∂xi

also jr ∗ ∂i u = ∂i (jr ∗ u) und somit für ur := jr ∗ u ∈ C∞


c ( Ê n
)

n
u − ur 21 = u − ur 2 + ∂i u − ∂i ur 2 → 0 für r → 0.
i=1

Ê
Im Fall Ω = n setzen wir u ∈ W1 (Ω) durch Nullsetzen außerhalb von Ω
Ê
zu einer Funktion auf n fort, die wir wieder mit u bezeichnen. Da jr ∗ u
i.A. nicht zu C∞
c (Ω) gehört, kann nicht wir oben auf jr ∗ ∂i u = ∂i (jr ∗ u)
Ê
geschlossen werden; dies wäre nur im Fall u ∈ W1 ( n ) möglich. Der Beweis


beruht hier darauf, Funktionen ψk ∈ C∞
c (Ω) mit u(x) = u(x)ψk (x) in Ω
k=1
zu konstruieren, wobei für jedes x nur endlich viele Glieder der Reihe von Null
verschieden sind (Teilung der Eins). Auf u · ψk lässt sich die Schlussweise von
oben wieder anwenden. Für Einzelheiten siehe Adams [132] III, 3.16, Gilbarg–
Trudinger [79] 7.6. 2

(b) Die Sobolew-Räume Wk (Ω). Für einen Multiindex α = (α1 , . . . , αn )


heißt vα ∈ L1loc (Ω) schwache α–te Ableitung von u ∈ L1loc (Ω), wenn
 
∂ α {u} = {vα }, d.h. u ∂ α ϕ = (−1)|α| vα ϕ für alle ϕ ∈ C∞
c (Ω).
Ω Ω

Gibt es eine Funktion vα mit dieser Eigenschaft, so bezeichnen wir sie mit ∂ α u.
Für k = 0, 1, . . . setzen wir
  
Wk (Ω) := u ∈ L2 (Ω)  ∂ α u ∈ L2 (Ω) existieren für |α| ≤ k ,

versehen mit der Norm


   1/2
uk := | ∂ α u | 2 dn x
|α|≤k Ω
368 § 14 Randwertprobleme für den Laplace–Operator

und dem zugehörigen Skalarprodukt. Für k = 0 ist also W0 (Ω) = L2 (Ω) und
u0 die L2 –Norm. Ähnlich wie in 6.2 ergibt sich:

Satz. Wk (Ω) ist ein separabler Hilbertraum, und es gilt

Wk (Ω) = Hk (Ω) ,

wobei Hk (Ω) der Abschluss von {u ∈ Ck (Ω) | ∂ α u ∈ L2 (Ω) für |α| ≤ k} be-
züglich der Norm  · k ist.

(c) Sobolew–Funktionen auf Intervallen. Sobolew–Funktionen u ∈ W1 (I)


auf offenen Intervallen I lassen sich auf einfache Weise charakterisieren:

Satz. Für u, v ∈ L2 (I) sind folgende Aussagen äquivalent:


(i) u ∈ W1 (I), und v ist schwache Ableitung von u.
(ii) u ist stetig, und es gilt
x
u(x) = u(x0 ) + v(t) dt für x, x0 ∈ I .
x0

Unter diesen Bedingungen ist die Funktion u fast überall differenzierbar und es
gilt u = v f.ü. .
Bemerkung. Es gibt nichtkonstante, stetige Funktionen u mit u = 0 f.ü. , d.h.
allein aus der Existenz der Ableitung u f.ü. lässt sich nicht auf die schwache
Differenzierbarkeit von u schließen; vgl. Riesz–Nagy [131] Nr. 24.

Beweis.
(ii) =⇒ (i): Nach dem Hauptsatz der Differential- und Integralrechnung in der
erweiterten Fassung von Lebesgue (§ 8 : 3.2) folgt aus (ii) die Absolutstetigkeit
von u und u = v f.ü. . Da jede Testfunktion absolutstetig ist, ergibt partielle
Integration gemäß § 8 : 3.3 für ϕ ∈ C∞
c (I) mit supp ϕ ⊂ [α, β] ⊂ I

 β β 
 
uϕ = uϕ = − vϕ = − vϕ.
I α α I
x
(i) =⇒ (ii): Ist v schwache Ableitung von u, so ist u0 (x) := v(t)dt (x0 ∈ I)
x0
absolutstetig. Partielle Integration ergibt
  
0 = u ϕ + vϕ = (u − u0 ) ϕ
I I I

für alle ϕ ∈ C∞
c (I). Mit dem Hilbertschen Lemma § 10 : 4.3 folgt u − u0 = c mit
einer Konstanten c . Wegen u0 (x0 ) = 0 ergibt sich c = u(x0 ) und damit (ii). 2
6 Existenz von Lösungen: Variationsmethode 369

(d) Glattheitseigenschaften von Wk –Funktionen.


Bereits für n = 2 enthält W1 (Ω) unstetige und unbeschränkte Funktionen, z.B.
u(x) = log log(4/x) auf der Einheitskreisscheibe Ω, vgl. Adams [132] p.118 ff.
Im folgenden Satz werden Bedingungen für die Stetigkeit und die Differenzier-
barkeit von Sobolew–Funktionen angegeben. Mit der üblichen, etwas ungenauen
Schreibweise Wr (Ω) ⊂ Cs (Ω) ist gemeint, dass jede Funktion u ∈ Wr (Ω) nach
Abänderung auf einer Nullmenge in Cs (Ω) liegt; u bezeichnet in diesem Fall
die eindeutig bestimmte Funktion in Cs (Ω).
Den Raum Cs (Ω) versehen wir mit der Supremumsnorm
  
uCs (Ω) := sup |∂ α u(x)| | x ∈ Ω .
|α|≤s

Einbettungssatz (C.B. Morrey 1940). Ist Ω ein beschränktes, C1 – oder


Lipschitz–berandetes Gebiet, so gilt für r > s + n/2
Wr (Ω) ⊂ Cs (Ω) ,
und es gibt eine Konstante c = c(Ω, r, s) > 0 mit
uCs (Ω) ≤ c ur für u ∈ Wr (Ω) .

Dieser Satz wird meistens als Teil des Sobolewschen Einbettungssatzes


zitiert. Für den Beweis siehe Adams [132] 5.4 Thm., Rauch [67] § 5.9, § 2.6.
Für Intervalle Ω = I ergibt sich die schon in (c) festgestellte Stetigkeit von
Ê
Funktionen u ∈ W 1 (I). Für Ω ⊂ n mit n ≤ 3 ist jede Funktion u ∈
W2 (Ω) stetig, und aus der Konvergenz uk → u im Sobolew–Raum W2 (Ω)
folgt gleichmäßige Konvergenz uk → u .

Seien X , Y normierte Räume mit Normen  X ,  Y . Gilt X ⊂ Y und

uY ≤ const uX für alle u ∈ X ,

so schreiben wir X → Y und nennen X stetig eingebettet in Y . Mit dieser


Notation lautet der Einbettungssatz Wr (Ω) → Cs (Ω) für r > s + n/2.

6.5 Regularität schwacher Lösungen


Nach 6.3 hat das reduzierte Randwertproblem

(D0 ) − Δu = f + Δg in Ω , u = 0 auf ∂Ω

für alle f ∈ L2 (Ω), g ∈ W1 (Ω) eine schwache Lösung u0 ∈ W01 (Ω), d.h. es gilt

( ∇u0 , ∇ϕ − f ϕ + ∇g , ∇ϕ ) dn x = 0 für jedes ϕ ∈ W01 (Ω) .
Ω
370 § 14 Randwertprobleme für den Laplace–Operator

Für u := u0 + g ∈ W1 (Ω) gilt dann u − g ∈ W01 (Ω) und



(∗∗) ( ∇u , ∇ϕ − f ϕ) dn x = 0 für jedes ϕ ∈ W01 (Ω) .
Ω

Wir nennen u eine schwache Lösung des Dirichlet–Problems

(D) − Δu = f in Ω , u = g auf ∂Ω .

Ohne allzu großen Aufwand lässt sich zeigen (John [49] 4.5):

Ê
Satz. (a) Sei Ω ⊂ 2 beschränkt, f ∈ C1 (Ω) und g = 0. Dann ist u nach
Abänderung auf einer Nullmenge C2 –differenzierbar in Ω .
Ê
(b) Für C2 –berandete Gebiete Ω ⊂ 2 ist unter den gleichen Voraussetzungen
wie in (a) die schwache Lösung u auf Ω stetig und verschwindet auf ∂Ω .

Für n ≥ 3 ist der Nachweis der stetigen Annahme der vorgeschriebenen Rand-
werte aufwendiger. Es gilt der fundamentale


Regularitätssatz. Seien k ∈ 0 , Ω ein beschränktes Ck+2 –berandetes Gebiet,
f ∈ Wk (Ω) und g ∈ Wk+2 (Ω). Dann gehört die schwache Lösung u von (D)
zu Wk+2 (Ω), und es gilt

uk+2 ≤ c ( f k + gk+2 )

mit einer von u unabhängigen Konstanten c = c(Ω, k) > 0 .

Zusammen mit dem Einbettungssatz 6.4 (d) ergibt sich für k + 2 − n/2 > s die
Differenzierbarkeitsaussage u ∈ Cs (Ω) , insbesondere Stetigkeit auf Ω im Fall
k + 2 − n/2 > 0 .
Der Regularitätssatz wurde von Friedrichs, Ladyzhenskaya, Nirenberg,
Browder, Lax und anderen um 1953 bewiesen. Der Beweis beruht auf trickrei-
cher Wahl von Testfunktionen ϕ in der Gleichung (∗∗) und auf lokalem Gerade-
biegen des Randes ∂Ω durch Ck+2 –Diffeomorphismen. Unter diesen Diffeomor-
phismen geht die Poisson–Gleichung in eine gleichmäßig elliptische Gleichung
(vgl.6.1 (b)) über.
Für den Beweis verweisen wir auf Gilbarg–Trudinger [79] 8.3, 8.4, Bers–
John–Schechter [58] Part II, Ch. 2, § 1, Rauch [67] § 5.9.

Bemerkungen.
(i) Der Regularitätssatz liefert die Kontrollierbarkeit der vollen Wk+2 –Norm
einer Funktion u ∈ W01 (Ω) mit Δu ∈ Wk (Ω) durch die Wk –Norm von Δu ,

uk+2 ≤ c Δuk .
6 Existenz von Lösungen: Variationsmethode 371

Diese wichtige Tatsache erlaubt bei der Entwicklung nach Eigenfunktionen des
Laplace–Operators 1.2 die Charakterisierung des Abfallverhaltens der Fourier-
koeffizienten von Funktionen im Sobolew–Raum durch ihre Differenzierbarkeits-
stufe.
(ii) Die Voraussetzungen des Regularitätssatzes sind nicht optimal. Dies zeigt
der Vergleich mit dem auf der Potentialtheorie beruhenden Existenzsatz 5.1 (a).
(iii) Bei nicht glatt berandeten Gebieten Ω sind der maximal erreichbaren Re-
gularitätsstufe der Lösung Grenzen gesetzt. Dies lässt sich am Beispiel von har-
monischen Funktionen auf Kreissektoren (vgl. 2.9) plausibel machen; siehe auch
Grisvard [80] Ch. 4, Nazarov [86] Ch. 2.

6.6 Fortsetzung von Randwerten ins Innere


Ê
Ist Ω ⊂ n beschränkt und Ck+1 –berandet, so lässt sich jede Ck –Funktion g
auf ∂Ω zu einer Ck –Funktion G auf Ω fortsetzen, und es gilt

GC k (Ω) ≤ c gC k (∂Ω) .

mit einer von g unabhängigen Konstanten c = c(Ω, k) > 0 .

Beweisskizze. Wir führen wie in § 11 : 4.3* Normalkoordinaten in einer Umge-


bung des Randes ∂Ω ein: Das äußere Einheitsnormalenfeld n : ∂Ω → n von Ê
Ω ist Ck – differenzierbar und

Φ : ∂Ω × ] − ε, ε [ → Ê n
, (y, r) → y − r n(y)

ist für ε  1 ein Ck –Diffeomorphismus auf eine Umgebung U ⊂ Ê


n
von ∂Ω .
Die Umkehrabbildung von Φ hat die Gestalt

Φ−1 (x) = (p(x), d(x)) ∈ ∂Ω × ] − ε, ε [

mit Ck –differenzierbaren Funktionen p und d auf U.


Wir wählen η ∈ C∞
c (] − ε, ε[) mit η(0) = 1 und definieren G : Ê n
→ Ê durch

η(d(x)) g(p(x)) für x ∈ U ,
Ê
G(x) :=
0 für x ∈ n
\U.

Dann ist G eine Ck –Funktion mit G = g auf ∂Ω. Die Abschätzung von G in
der Ck –Norm ergibt sich aus der Tatsache, dass alle Ableitungen von p, d, η
durch Konstanten beschränkt sind, die nur von Ω und ε = ε(Ω) abhängen. 2
372 § 15 Eigenwertprobleme für den Laplace–Operator

§ 15 Eigenwertprobleme für den Laplace–Operator


1 Entwicklung nach Eigenfunktionen des Laplace–Operators
1.1 Problemstellung
Auf das Dirichletsche Eigenwertproblem für den Laplace–Operator auf ei-
nem beschränkten Gebiet Ω ⊂ n , Ê
(D) − Δv = λv in Ω , v = 0 auf ∂Ω

werden wir durch den Produktansatz u(x, t) = a(t)v(x) für das Anfangswert-
problem der Wellengleichung
⎧ 2

⎨ ∂ u
2
∂t
− c2 Δu = 0 in Ω × Ê, u = 0 auf ∂Ω × Ê,

⎩ u = u0 , ∂u
= u1 auf Ω × {0}
∂t
geführt. Wie bei den Separationsansätzen für den Fall n = 1 spaltet sich dieses
Problem auf in das Eigenwertproblem (D) und die gewöhnliche Differentialglei-
chung

ä(t) + c2 λ a(t) = 0 .

Haben wir für das Eigenwertproblem (D) ein vollständiges Orthonormalsystem


von Eigenfunktionen v1 , v2 , . . . in L2 (Ω) und zugehörige positive Eigenwerte
λ1 , λ2 , . . . gefunden, so ist der zu vk , λk gehörende zeitabhängige Faktor a(t) =
ak (t) von der Gestalt

ak (t) = αk cos(μk t) + βk sin(μk t)



mit μk := c λk und Konstanten αk , βk ∈ Ê. Zu erwarten ist, dass die aus den
Produktlösungen bestehende Reihe


u(x, t) = ak (t)vk (x)
k=1

eine Lösung des obigen Anfangswertproblems in einem geeigneten Sinn liefert,


falls die Anfangsbedingungen


∂u ∞
u0 (x) = u(x, 0) = αk vk (x) , u1 (x) = (x, 0) = βk μk vk (x)
k=1 ∂t k=1

erfüllt sind.
Wie bei den Fourierreihen in § 6 : 2 stellt sich somit auch hier als zentrales Prob-
lem die Entwickelbarkeit beliebiger“ Funktionen in Reihen nach Eigenfunktio-

nen des Laplace–Operators. Diese Reihen nennen wir wie dort Fourierreihen.
1 Entwicklung nach Eigenfunktionen des Laplace–Operators 373

Werden beim Anfangs–Randwertproblem homogene Neumannsche Randbedin-


gungen gestellt, so führt der Produktansatz auf das Neumannsche Eigen-
wertproblem

(N) − Δv = λv in Ω , ∂n v = 0 auf ∂Ω .

Wir zeigen im folgenden für das Dirichletsche Eigenwertproblem auf beschränk-


Ê
ten Gebieten Ω ⊂ n die Existenz eines vollständigen ONS von Eigenfunk-
tionen in den Räumen L2 (Ω), Wr (Ω) und Cs (Ω). Die Beweise lassen sich mit
geringen Modifikationen auf das Neumannsche Eigenwertproblem übertragen.

1.2 Der Entwicklungssatz in L2 (Ω)


Es werden die Bezeichnungen von § 14 : 6.3 verwendet:
 
H = L2 (Ω) , u, v H = u v dn x , u2H = u2 dn x ,
Ω Ω
 
V = W01 (Ω) , u, v V = ∇u , ∇v dn x , u2V = ∇u2 dn x .
Ω Ω

Entwicklungssatz I. (a) Für jedes beschränkte Gebiet Ω ⊂ n gibt es Funk- Ê


tionen vi ∈ W01 (Ω) und Zahlen λi > 0 (i = 1, 2, . . . ) mit folgenden Eigenschaf-
ten:
(i) Die vi sind schwache Lösungen des Dirichletschen Eigenwertproblems,

vi , ϕ V = λi vi , ϕ H für alle ϕ ∈ W01 (Ω) (i = 1, 2, . . .) ,

(ii) 0 < λ1 ≤ λ2 ≤ . . . , lim λk = ∞ .


k→∞

(iii) v1 , v2 , . . . ist ein vollständiges ONS in L2 (Ω), das heißt für jede Funktion

k
u ∈ L2 (Ω) konvergieren die Partialsummen sk := vi , u H vi der zugehöri-
i=1
2
gen Fourierreihe in der L –Norm gegen u,


lim u − sk H = 0 und u2H = vi , u 2
H .
k→∞ i=1

(b) Ist Ω zusätzlich Cr –berandet mit r > 2 + n/2, so liegt jede Eigenfunktion
vi in C2 (Ω) und löst das Eigenwertproblem im klassischen Sinn,

−Δvi = λi vi in Ω , vi = 0 auf ∂Ω für i = 1, 2, . . . .

Bemerkungen. (i) Jeder Eigenwert λ kommt unter den λ1 , λ2 , . . . vor. Denn


andernfalls wäre jede zu λ gehörende Eigenfunktion v zu den v1 , v2 , . . . ortho-


gonal und nach (iii) folgte v = vi , v H vi = 0 .
i=1
374 § 15 Eigenwertprobleme für den Laplace–Operator

(ii) Jeder Eigenwert hat endliche geometrische Vielfachheit. Das ergibt sich
unmittelbar aus lim λk = ∞.
k→∞

(iii) Für das Neumannsche Eigenwertproblem bleiben die Aussagen des Ent-
wicklungssatzes mit zwei Modifikationen gültig: Es ist λ1 = 0 (die zugehörigen
Eigenfunktionen sind die Konstanten), und W01 (Ω) ist durch W1 (Ω) zu ersetzen;
siehe Courant–Hilbert [3], Kap.7, § 6.2, Ladyzhenskaya [65] II.5.

Der Beweis von Teil (a) des Entwicklungssatzes beruht darauf, die Inverse des
Laplace–Operators zu einem Operator G auf L2 (Ω) fortzusetzen und auf die-
sen Operator den Spektralsatz für kompakte symmetrische Operatoren aus § 22
anzuwenden. Hierzu benötigen wir einige Vorbereitungen.
(c) Nach § 14 : 6.3 gibt es zu jeder Funktion f ∈ H = L2 (Ω) genau eine schwa-
che Lösung u ∈ V = W01 (Ω) der Gleichung − Δu = f , bestimmt durch die
Beziehung

u, ϕ V = f,ϕ H für alle ϕ ∈ C∞


c (Ω) .

Diese ist äquivalent zur Gleichung

(1) u, v V = f,ϕ H für alle ϕ ∈ W01 (Ω) ,

denn C∞ 1
c (Ω) ist dicht in V = W0 (Ω), und wegen der Poincaré–Ungleichung
§ 14 : 6.2 (d) impliziert die Konvergenz in V die Konvergenz in H = L2 (Ω).
Die durch die Beziehung (1) definierte Abbildung

G:H →V ⊂H, f →u

wird der Green–Operator für das Dirichletsche Randwertproblem auf Ω ge-


nannt.

Eigenschaften des Green–Operators. Der Green–Operator

G : L2 (Ω) → L2 (Ω)

ist symmetrisch, positiv definit und kompakt.


Die Kompaktheit von G bedeutet, dass für jede in H = L2 (Ω) beschränkte
Folge (fk ) die Bildfolge (Gfk ) eine in H konvergente Teilfolge enthält.

Beweis.
Mit Gf = u ∈ W01 (Ω) ergibt sich aus (1) und der Poincaré–Ungleichung

(2) Gf 2H = u2H = u , u H ≤ c2 u , u V = c2 f , Gf H ,

woraus mit der Cauchy–Schwarzschen Ungleichung die Stetigkeit von G folgt:

(3) Gf H ≤ c2 f H für alle f ∈ H.


1 Entwicklung nach Eigenfunktionen des Laplace–Operators 375

G ist injektiv, was sich unmittelbar aus der Definition (1) und dem Fundamen-
tallemma § 10 : 4.2 ergibt. Zusammen mit (2) folgt hieraus die positive Definit-
heit von G,

f , Gf H ≥ c−2 Gf 2H > 0 für f = 0 .

Die Symmetrie von G ergibt sich nach Bd. 1, § 20 : 2.1 (c).


Der Green–Operator G ist kompakt. Denn aus fn H ≤ M folgt nach (3)

Gfn H ≤ c2 M für n = 1, 2, . . . ,

und mit (2) ergibt sich

Gfn 2V = fn , Gfn H ≤ fn H Gfn H ≤ c2 M 2 .

Nach dem Rellichschen Auswahlsatz § 14 : 6.2 (e) enthält somit (Gfn ) eine in H
konvergente Teilfolge. 2

(d) Beweis des Entwicklungssatzes.


Zum Nachweis von (a) wenden wir den Spektralsatz für kompakte, symmetrische
und positiv definite Operatoren § 22 : 4.5 auf den Green–Operator G an. Nach
diesem existiert in H ein vollständiges ONS v1 , v2 , . . . von Eigenvektoren von G,
wobei die zugehörigen Eigenwerte μi = vi , Gvi H > 0 eine monoton fallende
Nullfolge bilden. Die Eigenwertgleichung Gvi = μi vi bedeutet

vi , ϕ H = μi vi , ϕ V für alle ϕ ∈ W01 (Ω) ,

d.h. die vi lösen das Dirichletsche Eigenwertproblem für den Laplace–Operator


im schwachen Sinn, und für die zugehörigen Eigenwerte λi := μ−1i gilt

λi > 0 , lim λk = ∞.
k→∞

Teil (b) des Entwicklungssatzes ergibt sich durch mehrfache Anwendung des
Reguläritätssatzes in § 14 : 6.5 ÜA . 2

Die Bezeichnungen vi , λi behalten wir in den folgenden Unterabschnitten bei.

1.3 Der Entwicklungssatz in W10 (Ω)


(a) Satz. Es gilt
  
∞ 
W01 (Ω) = u ∈ L2 (Ω)  λi vi , u 2
H <∞ ,
i=1



u2V = λi vi , u 2
H für u ∈ W01 (Ω) .
i=1
376 § 15 Eigenwertprobleme für den Laplace–Operator

−1/2
Durch wi = λi vi (i = 1, 2, . . . ) ist ein vollständiges ONS für den Hilbert-
raum V = W01 (Ω) gegeben, d.h. für u ∈ V gilt

∞ 

u = wi , u V wi in V und u2V = wi , u 2
V .
i=1 i=1

Beweis.
(i) Wir erinnern daran, dass nach § 9 : 4.8 jeder Hilbertraum H über mit Ê
Skalarprodukt · , · , der ein abzählbares vollständiges ONS u1 , u2 , . . . besitzt,
isomorph zum Hilbertschen Folgenraum 2 ist: Für h ∈ H gilt die Parsevalsche


Gleichung h2 = ui , h 2
, und für jede Folge (c1 , c2 , . . . ) ∈ 2 konver-
i=1


giert die Reihe ci ui in H .
i=1

(ii) Aus der Eigenwertgleichung

(4) vi , v V = λi vi , v H für alle v ∈ W01 (Ω)


−1/2
folgt vi , vk V = λi vi , vk H = λi δik , also bilden die wi = λi vi bezüglich
des Skalarprodukts · , · V ein ONS, und es gilt

(5) wi , u V = λi vi , u H für i = 1, 2, . . . .

Zum Nachweis der Vollständigkeit dieses ONS ist nach dem Kriterium § 9 : 4.4 (e)
zu zeigen:

wi , u V = 0 für alle i = 1, 2, . . . =⇒ u = 0 .

In der Tat folgt aus wi , u V = 0 nach (5) auch vi , u H = 0 für i ∈  und


wegen der Vollständigkeit des ONS vi in H dann u = 0 in H.
(iii) Daher gilt für u ∈ V = W01 (Ω) die Parsevalsche Gleichung


(5) 

u2V = wi , u 2
V = λi vi , u 2
H .
i=1 i=1


Zu zeigen bleibt: Aus u ∈ L2 (Ω) und λi vi , u 2
H < ∞ folgt u ∈ W01 (Ω).
i=1


Denn nach (5) ist wi , u 2
V < ∞ , also gibt es nach (i) ein v ∈ V = W01 (Ω)
i=1
mit wi , v V = wi , u V für i = 1, 2, . . . , und nach 1.2 (a) ergibt sich
∞
(5) 
∞ 

u = vi , u H vi = wi , u V wi = wi , v V wi = v
i=1 i=1 i=1

in der Norm  · H , somit u = v ∈ W01 (Ω). 2


1 Entwicklung nach Eigenfunktionen des Laplace–Operators 377

(b) Rayleigh–Prinzip und Poincaré–Konstante. Eigenwerte und Eigen-


funktionen lassen sich durch folgende Minimumeigenschaft charakterisieren:
(  =
u2V 
λ1 = min u ∈ V , u = 0 ;
u2H 
das Minimum wird genau für die Eigenfunktionen u zum Eigenwert λ1 ange-
nommen.
Weiter gilt für k > 1
(  =
u2V 
λk = min  u ∈ V , u = 0 , vi , u = 0 für i < k ,
u2H  H

wobei das Minimum genau für die Eigenfunktionen zum Eigenwert λk angenom-
men wird.

Für die Poincaré–Konstante (§ 14 : 6.2 (d)) ergibt sich damit c(Ω) = 1/ λ1 .
Denn nach (a) und der Parsevalschen Gleichung gilt für u ∈ V, u = 0

∞ 

u2V = λi vi , u 2
H ≥ λ1 vi , u 2
H = λ1 u2H
i=1 i=1

mit Gleichheit genau dann, wenn (λi − λ1 ) vi , u 2H = 0 für i = 1, 2, . . . gilt,


was nach 1.2 (a) bedeutet, dass u ein Eigenvektor zum Eigenwert λ1 ist.
Der Fall k > 1 ergibt sich analog ÜA .

1.4 Der Entwicklungssatz in Wr (Ω) und Cs (Ω)


Ê
(a) Sei Ω ⊂ n ein beschränktes Gebiet. Nach 1.1 (c) ordnet der Green–
Operator G jedem f ∈ H = L2 (Ω) die schwache Lösung u ∈ V = W01 (Ω) der
Gleichung − Δu = f zu, definiert durch
(∗) u, ϕ V = f,ϕ H für alle ϕ ∈ W01 (Ω) .
Wir betrachten den inversen Operator A von G mit dem Definitionsbereich
D(A) := G(H). Es gilt also u ∈ D(A) genau dann, wenn es ein f ∈ H gibt mit
(∗) ; in diesem Fall ist Au = f und u = Gf . Es folgt u , Au H = Gf , f H >
0 für 0 = u ∈ D(A) und damit die Symmetrie von A,
u , Av H = Au , v H für u, v ∈ D(A).
Der Operator A ist eine Fortsetzung des auf C20 (Ω) := {u ∈ C2 (Ω) ∩ C0 (Ω) |
u = 0 auf ∂Ω} definierten Laplace–Operators u → − Δu, auch Abschluss
des Laplace–Operators auf C20 (Ω) genannt. Die Eigenwertgleichung vi , ϕ V =
λ vi , ϕ H für ϕ ∈ V lautet dann
Avi = λi vi .

Aus dem Regularitätssatz in § 14 : 6.5 (für g = 0, k = 0) ergibt sich ÜA der


378 § 15 Eigenwertprobleme für den Laplace–Operator

Satz. Für beschränkte, C 2 –berandete Gebiete Ω ⊂ Ê n


gilt

D(A) = W01 (Ω) ∩ W (Ω) .


2

Die Norm u → AuH ist äquivalent zur Sobolew–Norm


   1/2
u2 = |∂ α u|2 dn x ,
|α|≤2 Ω

d.h. es gilt mit einer Konstanten c ≥ 1

AuH ≤ u2 ≤ c AuH für alle u ∈ D(A).

(b) Satz. Es gilt


  
∞ 
D(A) = u ∈ L2 (Ω)  λ2i vi , u 2
H <∞ ,
i=1

∞ 

Au = λi vi , u H vi , Au2H = λ2i vi , u 2
H für u ∈ D(A) .
i=1 i=1

Beweis.
Für u ∈ D(A) gilt v := Au ∈ H und vi , v H = vi , Au H = Avi , u H =
λi vi , u H . Gemäß 1.2 (a) folgt damit

∞ 

Au2H = v2H = vi , v 2
H = λ2i vi , u 2
H < ∞.
i=1 i=1



Umgekehrt folgt aus λ2i vi , u 2
H < ∞ nach Beweisteil (i) von 1.3 (a) die
i=1


Existenz eines v ∈ H mit v = λi vi , u H vi . Wegen der Stetigkeit des
i=1
Green–Operators G, vgl. 1.2 (c), folgt mit Gvi = λ−1
i vi


∞ 

u = vi , u H vi = λi vi , u H Gvi = Gv ∈ D(A). 2
i=1 i=1

(c) Für p ≥ 0 definieren wir die p–te Potenz von A als den Operator Ap
mit dem Definitionsbereich
  
∞ 
D(Ap ) := u ∈ L2 (Ω)  λ2p
i vi , u 2
H <∞
i=1

und der Vorschrift




Ap u := λpi vi , u H vi für u ∈ D(Ap ) .
i=1
1 Entwicklung nach Eigenfunktionen des Laplace–Operators 379

Nach 1.3 (a) und 1.4 (b) gilt also

D(A0 ) = H, D(A1/2 ) = W01 (Ω), D(A1 ) = D(A), A1 = A .

Auf D(Ap ) definieren wir ein Skalarprodukt und die zugehörige Norm durch


u, v Ap := Ap u , Ap v H = λ2p
i vi , u H vi , v H ,
i=1
∞
u2Ap := Ap u2H = λ2p
i vi , u 2
H .
i=1


Satz. D(Ap ) , · , · Ap ist ein Hilbertraum, und die (λ−p
k vk ) bilden ein voll-
ständiges ONS für D(Ap ).

Beweis.
Wegen

vi , vk Ap = Ap vi , Ap vk H = λpi vi , λpk vk H
= λ2p
i δik

bilden die wk := λ−p


k vk ein ONS in D(A ). Zum Nachweis der Hilbertraum-
p

eigenschaft von D(A ) betrachten wir die Abbildung


p


Φ : D(Ap ) → 2 , u → Φ(u) := λpi vi , u H i∈ .
Φ ist eine Isometrie wegen


Φu , Φv 2 = λ2p
i vi , u H vi , v H = u, v Ap .
i=1

Φ ist surjektiv: Zu gegebenem a = (a1 , a2 , . . . ) ∈ 2 setzen wir bi := λ−p


i ai

∞ 
∞ 

und erhalten λ2p
1 b2i ≤ λ2p 2
i bi = a2i < ∞ . Nach 1.3 (a), Beweisteil (i)
i=1 i=1 i=1
existiert dann eine Funktion u ∈ L2 (Ω) mit vi , u H = bi (i = 1, 2, . . . ) .

∞ 

Für diese gilt λ2p
i vi , u 2
H = a2i < ∞, also u ∈ D(Ap ) und Φu = a.
i=1 i=1

Φ : D(Ap ) → 2 ist somit unitär, D(Ap ) also ein Hilbertraum. Die wk bilden
ein vollständiges ONS in D(A), weil diese unter Φ auf die Einheitsvektoren des
2 abgebildet werden. 2


(d) Äquivalenzsatz. Sei r ∈  und Ω ⊂ n ein beschränktes, Cr –beran- Ê
detes Gebiet. Dann gilt mit q := 12 (r − 1) = Int 12 (r − 1)
 
D(Ar/2 ) = u ∈ Wr (Ω) | u, Au, . . . , Aq u ∈ W01 (Ω) ,

und die Norm  · Ar/2 ist äquivalent zur Sobolew–Norm  · r (vgl. § 14 : 6.4 (b)).
380 § 15 Eigenwertprobleme für den Laplace–Operator

Beweis.
(i) Der Regularitätssatz § 14 : 6.5 (mit g = 0 ) liefert für u ∈ W01 (Ω),  ≤ r − 2
Au ∈ W (Ω) ⇐⇒ u ∈ W +2
(Ω),
Au ≤ u +2 ≤ c(Ω, ) Au für u ∈ W +2
(Ω) .

 
(ii) Für p ≥ 0 gilt nach 1.3 (a) D(Ap+1 ) = u ∈ W01 (Ω) | Au ∈ D(Ap ) ÜA .
(iii) Wir zeigen die Behauptung zunächst für gerades r = 2k durch Induktion
nach k = 1, 2, . . . . Wegen q = [ r−1
2
] = [k − 12 ] = k − 1 lautet die Behauptung
 
D(Ak ) = u ∈ W2k (Ω) | u, Au, . . . , Ak−1 u ∈ W01 (Ω) ,
uAk ≤ u2k ≤ ck uAk

mit Konstanten ck = ck (Ω). Für k = 1 ist die Behauptung nach dem Satz in
(a) richtig. Ist diese richtig für k ≥ 1, so folgt
(ii)  
D(Ak+1 ) = u ∈ W01 (Ω) | Au ∈ D(Ak )
(iii)  
= u ∈ W01 (Ω) | Au ∈ W2k (Ω), Au, A2 u, . . . , Ak−1 Au ∈ W01 (Ω)
(i)  
= u ∈ W2(k+1) (Ω) | u, Au, . . . , Ak u ∈ W01 (Ω) ,

und für u ∈ D(Ak+1 ) gilt


(iii) (i) (i)
uAk+1 = AuAk ≤ Au2k ≤ u2(k+1) ≤ c(Ω, 2k) Au2k
(iii)
≤ ck c(Ω, 2k) AuAk = ck c(Ω, 2k) uAk+1 .

(iv) Für ungerades r = 2k−1 folgt die Behauptung analog durch Induktion nach
k = 1, 2, . . . . Der Induktionsanfang, d.h. die Behauptung D(A1/2 ) = W01 (Ω)
und die Äquivalenz der Normen  · A1/2 und  · 1 ergibt sich wie folgt: Die
erste Behauptung folgt nach (c). Nach der Poincaré–Ungleichung § 14 : 6.2 (d)
sind die Normen  · 1 und  · V äquivalent, und nach 1.3 (a) und der Definition
von  · A1/2 gilt


u2A1/2 = λi vi , u 2
H = u2V . 2
i=1

Ê
(e) Entwicklungssatz II. Ist Ω ⊂ n ein Cr –berandetes Gebiet (r ∈ ),
so konvergiert für jede Funktion u ∈ Wr (Ω) die Fourierreihe


u = vi , u H vi in Wr (Ω) ,
i=1
2 Geometrische Eigenschaften von Eigenwerten und -funktionen 381

falls u die Randbedingungen


u, Au, . . . , Aq u ∈ W01 (Ω) mit q := [ r−1
2 ]
erfüllt.
Gilt r > s + n2 für ein s = 0, 1, . . . , so konvergiert die Fourierreihe von u in
Cs (Ω), d.h. es gilt


∂αu = vi , u H ∂ α vi
i=1

gleichmäßig auf Ω für |α| ≤ s. Dies ist insbesondere dann gegeben, wenn

u ∈ Cr (Ω) und u = Δu = . . . = Δq u = 0 auf ∂Ω .

Beweis.
Nach dem Äquivalenzsatz liegt u in D(Ar/2 ) und hat daher nach 1.4 (c) bezüg-
−r/2
lich des ONS wk := λk vk die Fourierentwicklung in D(Ar/2 )




u = wi , u Ar/2 wi = vi , u H vi .
i=1 i=1

Nach dem Äquivalenzsatz konvergiert die Reihe dann auch in Wr (Ω).


Die zweite Aussage ergibt sich mit Hilfe des Einbettungssatzes von Morrey
§ 14 : 6.4 (d). 2

Ê
Beispiel. Ist Ω ⊂ 3 ein C2 –berandetes Gebiet, so konvergiert für jede Funk-
tion u ∈ C 2 (Ω) mit u = Δu = 0 auf ∂Ω die Fourierreihe gleichmäßig auf Ω.

1.5 Aufgaben
(a) Zeigen Sie, dass
A − λ½ : D(A) → L2 (Ω) für λ < 0

bijektiv ist.Weisen Sie hierzu zuerst die Lösbarkeit der Gleichung Au − λu =


g für g ∈ D(A) durch Fourierdarstellung nach und approximieren Sie dann
eine gegebene rechte Seite f ∈ L2 (Ω) unter Verwendung der Eigenschaften des
Green–Operators G (1.2 (c)) durch eine Folge gk ∈ D(A).
(b) Zeigen Sie D(Ar ) → D(As ) für r > s, vgl. 6.4 (d).

2 Geometrische Eigenschaften von Eigenwerten und -funktionen


Wir berichten im folgenden über einige Eigenschaften der Eigenwerte und Ei-
genfunktionen des Laplace–Operators auf beschränkten Gebieten Ω, ohne auf
die Beweise einzugehen (Bezeichnungen wie in 1.2).
382 § 15 Eigenwertprobleme für den Laplace–Operator

2.1 Einfachheit des kleinsten Eigenwerts


(a) λ1 ist einfach, d.h. der zugehörige Eigenraum ist eindimensional.
(b) Die zugehörigen Eigenfunktionen haben keine Nullstelle in Ω.
Für den Beweis von (b) verweisen wir auf Evans [60] 6.5.1, Thm. 2 (iii), Strauss
[53] 11.6, Übg. 9. Aus (b) folgt (a), da zwei Eigenfunktionen ohne Nullstellen in
Ω nicht orthogonal in L2 (Ω) sein können.

2.2 Gebietsmonotonie der Eigenwerte (Courant 1920)


Ê
Für beschränkte C2 –berandete Gebiete Ω1 , Ω2 ⊂ n mit Ω1 ⊂ Ω2 gilt für die
korrespondierenden Eigenwerte des Laplace–Operators

λk (Ω1 ) ≥ λk (Ω2 ) (k = 1, 2, . . . ),

und im Fall Ω2 \ Ω1 = ∅,

λk (Ω1 ) > λk (Ω2 ) (k = 1, 2, . . . ).



Da die μk = c λk nach 1.1 als Frequenzen eines am Rand eingespannten
schwingenden Gebildes (Saite, Membran, Kirchenglocke) aufgefasst werden kön-
nen, deckt sich diese Aussage mit der Erfahrung, dass sich bei Verkleinerung
des Gebildes die Frequenzen erhöhen.
Der Beweis beruht auf dem Minimum–Maximum–Prinzip von Courant, einer Er-
weiterung des Rayleigh–Prinzips 1.3 (b). Siehe Courant–Hilbert [2], Kap.6, §2,
Chavel [74] I.5.

2.3 Knotensatz (Courant 1923)


Für eine Eigenfunktion v heißt jede
Zusammenhangskomponente, d.h. je-
des maximale Teilgebiet der Menge
{ x ∈ Ω | v(x) = 0 } ein Knoten-
gebiet von v. Die Figur zeigt acht
Knotengebiete einer Eigenfunktion für
die Kreisscheibe; weitere Knotengebie-
te lassen sich den Figuren in 3.2 ent-
nehmen.
Satz. Die Anzahl der Knotengebiete einer zu λk gehörigen Eigenfunktion beträgt
nicht mehr als k (k = 1, 2, . . .).
Für k = 1 ergibt sich hieraus wieder die Aussage 2.1 (b).
Für den Beweis siehe Courant–Hilbert [2], Kap.6, §2, Chavel [74] 5.1, Dau-
tray–Lions [4, 3] Ch. 8, § 2.9.4.
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 383

2.4 Asymptotische Verteilung der Eigenwerte


Für beschränkte, C2 –berandete Gebiete Ω ⊂ Ê n
gilt

k (2π)n
V n (Ω) = cn lim mit cn = ,
k→∞ n/2
λk V n (K1 (0))

d.h. aus dem Spektrum {λ1 , λ2 , . . . } des Laplace–Operators läßt sich das Volu-
men von Ω bestimmen. (Weyl 1912, Courant 1920).
Für den Beweis siehe Courant–Hilbert [2], Kap.6, §4, Chavel [74] VII.3, Tay-
lor [69, II] 8.3, und für scharfe Fehlerschranken R. Seeley: A sharp asymptotic
remainder estimate . . . , Adv. Math. 29 (1978) 244–269.
Zu diesem berühmten Resultat wurde Weyl durch eine von dem Physiker H. A.
Lorentz 1910 aufgestellte Vermutung zur Hohlraumstrahlung schwarzer Körper
angeregt. Courant fand später einen einfachen Beweis, in welchem er das Ge-
biet Ω von innen und außen durch Quadervereinigungen approximierte und
die Gebietsmonotonie der Eigenwerte ausnutzte. Der Weylsche Satz gab in den
sechziger Jahren Anstoß zu Untersuchungen über die Frage, welche weiteren In-
formationen über die Geometrie von Gebieten oder von geschlossenen Flächen
im Spektrum des Laplace–Operators enthalten sind; siehe hierzu M. Kac: Can
one hear the shape of a drum? Amer. Math. Monthly 73(4) (1966) 1–23.

2.5 Eine isoperimetrische Ungleichung (Faber 1923, Krahn 1925)


Ê
Unter allen Gebieten Ω ⊂ n gleichen Volumens besitzt die Kugel KR = KR (0)
den kleinsten ersten Eigenwert:

λ1 (Ω) ≥ λ1 (KR ) für V n (Ω) = V n (KR ) .

Für den Beweis siehe Chavel [74] IV.2.


Der kleinste Eigenwert der n–dimensionalen R–Kugel ist nach 3.6 gegeben durch
λ1 (KR ) = (jh,1 /R)2 , wobei jh,1 die erste positive Nullstelle der Besselfunktion
Jh mit h = (n − 2)/2 ist.

3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel


Im folgenden bestimmen wir vollständige Orthonormalsysteme von Eigenfunk-
tionen für das Dirichletsche Eigenwertproblem

(∗) − Δu = λu in Ω , u = 0 auf ∂Ω

Ê
auf Kreisscheiben und Kugeln Ω = KR = KR (0) ⊂ n (n = 2, 3) durch Sepa-
rationsansätze bezüglich Polar– bzw. Kugelkoordinaten. Wir machen plausibel,
warum Separationsansätze zum Ziel führen.
384 § 15 Eigenwertprobleme für den Laplace–Operator

Der Produktansatz für Eigenfunktionen von (∗) auf der n–dimensionalen Kugel
Ê
KR ⊂ n,

u(x) = X(r) Y (ξ) mit r = x , ξ = x/r ,

führt auf eine gewöhnliche DG zweiter Ordnung für X(r) und ein Eigenwert-
Ê
problem für Y (ξ) auf der Einheitssphäre S n−1 ⊂ n. Die Lösungen des Ei-
genwertproblems auf der Sphäre S n−1 werden Kugelfunktionen (spherical
harmonics) genannt.
Entscheidend ist nun, dass jede Kugelfunktion aus harmonischen, homogenen
Ê
Polynomen auf dem n durch Einschränkung auf die Einheitssphäre S n−1 ent-
steht, und dass sich beliebige“ Funktionen auf der Sphäre S n−1 in Reihen

nach solchen Polynomen entwickeln lassen (Weierstraßscher Approximations-
satz). Das hat zur Folge, dass mit den harmonischen Polynomen schon alle
Kugelfunktionen gefunden sind.
Auf dem Ê 2
sind z.B. homogene harmonische Polynome
1, x1 , x2 , x1 x1 − x2 x2 , 2x1 x2 ,
x1 x1 x1 − 3x1 x2 x2 , 3x1 x1 x2 − x2 x2 x2 , . . . ,
ÜA . Nach Einschränkung auf den Einheitskreis S 1 ergibt sich aus diesen in
Polarkoordinaten
1, cos ϕ, sin ϕ, cos 2ϕ , sin 2ϕ, cos 3ϕ , sin 3ϕ, . . . .
Auf dem Ê 3
sind homogene harmonische Polynome
1, x1 , x2 , x3 , x1 x1 − x3 x3 , x2 x2 − x3 x3 , x1 x2 , x1 x3 , x2 x3 , . . . .
Die zugehörigen Kugelfunktionen auf der S 2 lassen sich durch Produkte von
trigonometrischen Funktionen und Legendre–Polynomen darstellen.
Auf diesen systematischen Zugang können wir aus Platzgründen nicht eingehen
und verweisen auf Folland [61] p.126–139, Michlin [51] Kap.14.
Im Folgenden bestimmen wir Orthonormalsysteme für das Dirichletsche Eigen-
wertproblem (∗) direkt durch Separationsansatz, machen also keinen Gebrauch
von harmonischen Polynomen. Der Radialanteil X(r) der Eigenfunktionen auf
Kreisscheiben und Kugeln wird bis auf einen Faktor durch Besselfunktionen dar-
gestellt, und die Eigenwerte λ können aus den Nullstellen von Besselfunktionen
bestimmt werden.

3.1 Die Orthogonalität der Besselfunktionen


Jede Lösung v der Besselschen Differentialgleichung vom Index ν ≥ 0 zum
Eigenwert λ > 0,
 
1  ν2
v  (r) + v (r) + λ− v(r) = 0 für r > 0,
r r2
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 385


geht durch die Umskalierung V (t) := v(t/ λ) über in eine Lösung der Bessel-
schen Differentialgleichung vom Index ν zum Eigenwert λ = 1,
 
1  ν2
V  (t) + V (t) + 1− V (t) = 0 für t > 0 .
t r2

Nach § 4 : 4.7 ist jede Lösung dieser Gleichung, für die t−ν V (t) beschränkt ist,
bis auf einen konstanten Faktor die Besselfunktion Jν . Deren Reihendarstellung
lautet

∞  ν+2k
(−1)k t
Jν (t) =
k! Γ(ν + k + 1) 2
k=0

1 t
 ν 1 t
 2 1
 4
t

= 1− + − ... .
Γ(ν + 1) 2 1! (ν + 1) 2 2! (ν + 1)(ν + 2) 2

Weiter wurde in § 4 : 4.7 (e) gezeigt, dass die positiven Nullstellen von Jν eine
Folge 0 < jν,1 < jν,2 < . . . mit lim jν,k = ∞ bilden.
k→∞

Aus diesen Feststellungen ergibt sich:


(a) Für jede Lösung λ > 0, v = 0 des Eigenwertproblems
 
1  ν2
v  (r) + v (r) + λ− v(r) = 0 in ]0, R[ ,
r r2

r −ν v(r) beschränkt , v(R) = 0

gibt es (genau) ein k ∈  und eine Konstante c mit


λ = (jν,k /R) , 2
v(r) = c Jν (jν,k r/R) für r ∈ [0, R] .

Wie sich zeigen wird, liefern die Nullstellen jν,k der Besselfunktionen für halb-
zahlige ν die Eigenwerte des Dirichletschen Eigenwertproblems (∗). Diese Null-
stellen können mit Computerprogrammen (z.B. MAPLE, MATHEMATICA) be-
rechnet oder Tabellenwerken entnommen werden.

(b) Satz. Für R > 0, ν ≥ 0 ist { vkν | k ∈ } mit


√ √
r 2 2
vkν (r) := ckν Jν (jν,k R ), ckν := =
R |Jν (jν,k )| R |Jν+1 (jν,k )|

ein Orthonormalsystem bezüglich des gewichteten Skalarprodukts

R
u, v r := u(r) v(r) r dr .
0
386 § 15 Eigenwertprobleme für den Laplace–Operator

Beweis.
Für k =  setzen wir u(r) := Jν (jν,k R
r r
), v(r) := Jν (jν, R ), λ := (jν,k /R)2 ,
2
μ = (jν, /R) und schreiben die Besselsche DG in der Form Lu = λu, Lv = μv.
Wegen u(R) = v(R) = 0 gilt dann

(λ − μ) u , v r = Lu , v r − u , Lv r

 
R
  
1 ν2 1 ν2
= − (r u ) + 2 u v − u − (r v  ) + 2 v r dr
r r r r
0

R
 R
= − (r u ) v + u (r v  ) dr = −r (u v − uv  ) 0 = 0 ,
0

also vkν , v ν r = ckν c ν u, v r = 0 wegen λ − μ = 0.


Aus der Besselschen DG für u ergibt sich
   
1 ν2
0 = (r u ) + λ− u 2r 2 u
r r2
  
= (r u )2 + λr 2 − ν 2 (u2 )
  
= (r u )2 + λr 2 − ν 2 u2 − 2λr u2 ,

woraus durch Integration von 0 bis R unter Beachtung von ν u(0) = 0 folgt
  R
0 = (r u )2 + (λr 2 − ν 2 ) u2 0 − 2λ
R
u(r)2 r dr
0
= (R u (R))2 − 2λ u2r ,
 2  2
R R
c−2
kν vkν r = ur =
2 2
√ u (R) = √ Jν (jν,k )
2λ 2
 2
R −2
= √ Jν+1 (jν,k ) = ckν .
2
Die vorletzte Gleichheit ergibt sich dabei aus der Identität in § 4 : 4.7 (f)
ν
Jν+1 (jν,k ) = Jν (jν,k ) − Jν (jν,k ) = − Jν (jν,k ) . 2
jν,k

(c) Ersetzen wir in (a) die Randbedingung v(R) = 0 durch v  (R) = 0, so bleibt

Aussage (b) richtig, wenn die jν,k ersetzt werden durch die Nullstellen jν,k von
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 387

Jν und die Normierungskonstanten ckν durch

2 1
c∗kν := ∗ ∗
.
1 − (ν/jν,k )2 R |Jν (jν,k )|

Das ergibt sich unmittelbar aus dem vorhergehenden Beweis ÜA .

3.2 Eigenwerte und Eigenfunktionen auf der Kreisscheibe


(a) Nach § 6 : 5.2 geht das Eigenwertproblem (∗) durch Transformation in Po-
larkoordinaten (r, ϕ) über in
⎧  ∂U 
⎪ 1 ∂ 1 ∂2U

⎪ − r − = λU in 0 < r < R , −π < ϕ < π ,

⎪ r ∂r ∂r r 2 ∂ϕ2


⎨ ∂U ∂U
(∗∗) U (r, π) = U (r, −π) , (r, π) = (r, −π) für 0 < r < R ,


∂ϕ ∂ϕ



⎪ U beschränkt,


U (R, ϕ) = 0 für − π < ϕ < π .

Der Separationsansatz U (r, ϕ) = v(r) w(ϕ) führt nach bekanntem Muster auf
die Gleichungen
⎧  2
⎨ 1 (rv  (r)) + λ −  v(r) = 0 in ]0, R[ ,
(1) r r2

v beschränkt, v(R) = 0 ,

w (ϕ) + 2 w(ϕ) = 0 für − π < ϕ < π ,
(2)
w(π) = w(−π) , w (π) = w (−π) ,

wobei  eine Konstante ist. Die sämtlichen Lösungen von (2) sind
w(ϕ) = a0 für  = 0 ,

w(ϕ) = a cos(ϕ) + b sin(ϕ) für  = 1, 2, . . .

Ê
mit Konstanten a , b ∈ . Nach 3.1 (a) erhalten wir sämtliche Eigenwerte und
zugehörige Eigenfunktionen durch
λk0 = (j0,k /R)2 , r
J0 (j0,k R ),
2 r r
λk = (j ,k /R) , J (j ,k R ) cos(ϕ) und J (j ,k R ) sin(ϕ)
für k,  = 1, 2, . . . , wobei J die Besselfunktion vom Index  ist und j ,k deren
positive Nullstellen sind.
388 § 15 Eigenwertprobleme für den Laplace–Operator

Diese Eigenfunktionen nummerieren wir folgendermaßen:



J (j r
,k R ) cos(ϕ) für  ≥ 0 ,
uk (r cos ϕ, r sin ϕ) :=
r
J− (j− ,k R ) sin(ϕ) für  < 0

(0 < r < R, −π < ϕ ≤ π, k ∈ ,  ∈ ).

Satz. Für das Dirichletsche Eigenwertproblem (∗) auf der Kreisscheibe Ω =


KR (0) ⊂ 2 sind ein vollständiges Orthonormalsystem von Eigenfunktionen in
L2 (Ω) und die zugehörigen Eigenwerte gegeben durch

(k ∈ ,  ∈
ck 2
uk , λk = (j| |,k /R) )
π (1 + δ 0 )

mit dem Kronecker–Symbol δ00 = 1 und δ 0 = 0 für  = 0


√ √
2 2
ck = = .
R |J  (j ,k )| R |J +1 (j| |,k )|

Euler fand diese Eigenfunktionen 1759 bei der Untersuchung der Schwingungen
der kreisförmigen Membran.
Nach 1.1 liefern die√uk die Eigenschwingungen der kreisförmigen Membran√ mit
den Frequenzen c λk = c j ,k /R . Der Grundton hat die Frequenz c λ10 =
c j0,1 /R ≈ 2.4048 c/R .
Der kleinste Eigenwert λ10 ist einfach, während die höheren Eigenwerte λk mit
k + || > 1 mindestens die Vielfachheit 2 besitzen.
Die folgenden Abbildungen zeigen einige Eigenfunktionen der kreisförmigen
Membran.

u10 u31
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 389

u25 u17

Für das Neumannsche Eigenwertproblem ergibt sich ein ähnlich gebautes Or-
thonormalsystem.
ÜA Bestimmen Sie dieses unter Verwendung von 3.1 (c).

Beweis.
(i) Nach dem Transformationssatz für Integrale hat das L2 –Skalarprodukt auf
der Kreisscheibe für Funktionen in Produktform
(vi ⊗ wi )(r cos ϕ, r sin ϕ) := vi (r) wi (ϕ)
die Gestalt
R π
v1 ⊗ v2 , w1 ⊗ w2 = v1 (r) v2 (r) r dr w1 (ϕ) w2 (ϕ) dϕ .
0 −π

Hieraus ergibt sich die Orthonormalität des Systems


 <

A :=
ck
uk  k ∈ ,  ∈
π (1 + δ 0 )
aus den Orthonormalitätseigenschaften der trigonometrischen Funktionen und
der Besselfunktionen 3.1 (b) ÜA .

(ii) Nach dem Entwicklungssatz in 1.2 existiert ein vollständiges ONS B für
L2 (Ω) aus Eigenfunktionen des Dirichletschen Eigenwertproblems (∗). Die Voll-
ständigkeit des ONS A ist bewiesen, wenn wir gezeigt haben, dass jede Eigen-
funktion eine Linearkombination von Funktionen aus A ist, was insbesondere
B ⊂ Span A bedeutet.
Es sei also λ > 0, u ∈ C2 (Ω) eine beliebige Lösung des Eigenwertproblems (∗)
und U (r, ϕ) := u(r cos ϕ, r sin ϕ). Für jedes r ∈ [0, R] besitzt die 2π–periodische
Funktion ϕ → U (r, ϕ) nach § 6 : 2.3 die gleichmäßig konvergente Fourierentwick-
lung
∞
1 π
U (r, ϕ) = a (r) ei ϕ mit a (r) = U (r, ϕ) e−i ϕ dϕ .
=−∞ 2π −π
390 § 15 Eigenwertprobleme für den Laplace–Operator

Die Fourierkoeffizienten r → a (r) sind C2 –Funktionen auf [0, R], genügen


nach (∗∗) der Randbedingung a (R) = 0 und erfüllen die Besselsche DG
 
1   2
rv (r) + λ− v(r) = 0 in ]0, R] ;
r r2

Letzteres ergibt sich durch zweimalige partielle Integration ÜA .


Für jedes  ∈ mit a = 0 gibt es daher nach 3.1 (a) (genau) ein k ∈  und
eine Konstante α mit

2 r

λ = (j| |,k /R) = λk| | , a (r) = α J| | (j| |,k R ) = α J| | ( λ r) .

Die Menge I dieser  ∈ ist wegen u = 0 nicht leer. I ist endlich, weil der
Eigenwert λ nach 1.2 endliche Vielfachheit besitzt. Damit erhalten wir
  √
u(x) = U (r, ϕ) = a (r) ei ϕ
= α J| | ( λ r) ei ϕ

∈I ∈I

und nach Umformung der letzten Summe in eine Summe von reellen Ausdrücken
schließlich u ∈ Span A. 2

Aufgaben. Bestimmen Sie Lösungen des Dirichletschen Eigenwertproblems:


(a) für den Kreissektor durch Produktansatz in Polarkoordinaten,
(b) für den Zylinder mit Radius R und Höhe H durch Produktansatz in Zylin-
derkoordinaten.

3.3 Separationsansatz für das Eigenwertproblem auf Kugeln


(a) Der Laplace–Operator auf der Kugel Ω = KR (0) ⊂ 3 läßt sich in Kugel-
koordinaten nach der Jacobischen Formel § 11 : 5.2 (b) in der Form
 
1 ∂ ∂U 1
Δu = r2 + Δ 2U
r 2 ∂r ∂r r2 S

schreiben, wobei der Laplace–Beltrami–Operator ΔS 2 auf der Einheits-


sphäre S 2 ⊂ 3 definiert ist durch
 
1 ∂ ∂U 1 ∂2U
ΔS 2 U := sin ϑ + 2
sin ϑ ∂ϑ ∂ϑ sin ϑ ∂ϕ2

(zur Koordinatenunabhängigkeit dieses Ausdrucks siehe Teil (b) dieses Ab-


schnitts).
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 391

Die Eigenwertgleichung (∗) für die dreidimensionale Kugel erhält damit in Ku-
gelkoordinaten die Gestalt
⎧  
1 ∂ 2 ∂U 1

⎪ − r − 2 ΔS 2 U = λU

⎪ r 2 ∂r ∂r r



⎪ in 0 < r < R , 0 < ϑ < π , −π < ϕ < π ,


⎨ ∂U ∂U
(∗∗∗) U (r, ϑ, π) = U (r, ϑ, −π) , (r, ϑ, π) = (r, ϑ, −π)


∂ϕ ∂ϕ

⎪ für 0 < r < R , 0 < ϑ < π ,





⎪ U beschränkt,

U (R, ϑ, ϕ) = 0 für 0 < ϑ < π , −π < ϕ < π .

Der Separationsansatz U (r, ϑ, ϕ) = X(r)Y (ϑ, ϕ) zerlegt das Problem (∗∗∗) mit
den aus § 6 bekannten Argumenten in die Gleichungen
⎧   
⎨ 1 r2 X  (r) 
+ λ−
μ
X(r) = 0 in 0 < r < R ,
2r r2
(1)

X beschränkt , X(R) = 0 ,
und

⎪ −ΔS 2 Y = μY in 0 < ϑ < π , −π < ϕ < π ,


∂Y ∂Y
(KF) Y (ϑ, π) = Y (ϑ, −π) , (ϑ, π) = (ϑ, −π) für 0 < ϑ < π ,

⎪ ∂ϕ ∂ϕ

Y beschränkt

mit einer Konstanten μ. Die Lösungen Y = 0 von (KF) sind die Kugelfunktio-
nen, dargestellt in Kugelkoordinaten.
Die weitere Separation Y (ϑ, ϕ) = V (ϑ) W (ϕ) spaltet die Gleichungen (KF) auf
in
⎧  

⎨ 1   m2
sin ϑ V  (ϑ) + μ− V (ϑ) = 0 in 0 < ϑ < π ,
(2) sin ϑ sin2 ϑ

⎩ V beschränkt,

und

W  (ϕ) + m2 W (ϕ) = 0 in − π < ϕ < π ,
(3)
W (π) = W (−π) , W  (π) = W  (−π) ,

mit einer Konstanten m, für die nach (3) nur m = 0, 1, . . . in Frage kommt.
Durch die Transformation v(s) := V (arccos s), bzw. V (ϑ) = v(cos ϑ) geht (2)
über in das Eigenwertproblem
392 § 15 Eigenwertprobleme für den Laplace–Operator

⎧  
⎨ (1 − s2 ) v  (s)  m2
+ μ− v(s) = 0 in − 1 < s < 1 ,

(2 ) 1 − s2

v beschränkt.

Die hierin auftretende Legendresche Differentialgleichung hat nach § 4 : 4.5 nur


für die Werte μ =  ( + 1) mit  = m, m + 1, . . . beschränkte Lösungen, und
diese sind bis auf multiplikative Konstanten die Legendre–Funktionen P m .
Die Gleichung
√ (1) geht für die Werte μ =  ( + 1) durch die Transformation
x(r) := r X(r) über in das Eigenwertproblem für die Besselsche Differential-
gleichung vom Index  + 12 ÜA
⎧  1 2
⎨ x (r) + 1 x (r) + λ − ( + 2 ) x(r) = 0 in ]0, R[ ,
(1 ) r r 2

x beschränkt, x(R) = 0 .

Die Lösungen λ, x = 0 dieses Eigenwertproblems haben nach 3.1 (a) die Gestalt

λ = (jν,k /R)2 , r
x(r) = Jν (rν,k R ) mit ν :=  + 1
2

und k ∈  (die multiplikative Konstante vor J (. . .) gleich 1 gesetzt).


ν

Wir erhalten somit Eigenfunktionen in Produktgestalt bezüglich Kugelkoordi-


naten r, ϑ, ϕ des Eigenwertproblems (∗) auf der Kugel Ω = KR (d.h. Lösungen
von (∗∗∗))

1 r 1 r
√ Jν (jν,k R ) P m (cos ϑ) cos(mϕ) und √ Jν (jν,k R ) P m (cos ϑ) sin(mϕ)
r r

für ν :=  + 12 , k ∈ ,  ∈  , m ∈ {0, 1, . . . , }.


0

In 3.6 zeigen wir, dass diese nach geeigneter Normierung ein vollständiges Or-
thonormalsystem in L2 (Ω) liefern.

(b) Für C2 –Funktionen u auf einer m–dimensionalen C2 –Untermannigfaltigkeit


Ê
M ⊂ n setzen wir
1  m

(ΔM u)(x) := √ ∂i ( g g ik ∂k U )(ξ) für x = Φ(ξ) ∈ M.
g i,k=1

Dabei sind ξ = (ξ1 , . . . , ξm ) → Φ(ξ) eine lokale Parametrisierung von M ,


U := u ◦ Φ,
gik := ∂i Φ , ∂k Φ die Koeffizienten der Gramschen Matrix,
(g ik ) die zu (gik ) inverse Matrix,
g := det(gik ) die Gramsche Determinante.
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 393

Satz. Der Ausdruck ΔM u ist koordinateninvariant, d.h. hängt nicht von der
Wahl der Parametrisierung Φ ab.
ΔM u wird der Laplace–Beltrami–Operator auf M genannt.
Der Beweis erfolgt mit analogen Argumenten wie beim Beweis der Jacobischen
Formel § 11 : 5.2, siehe Bd. 3, § 9 : 3.3 (c).
ÜA Überzeugen Sie sich davon, dass ΔM für die zweidimensionale Sphäre
M = S 2 bei Verwendung von Kugelkoordinaten Φ mit dem in (a) definierten
Ausdruck übereinstimmt.

3.4 Die Vollständigkeit der Legendre–Funktionen


(a) Die (allgemeine) Legendresche Differentialgleichung vom Index m ∈ , 0

  m 2 

(1 − s2 )v  (s) + μ− v(s) = 0 in − 1 < s < 1 ,
1 − s2
besitzt nach § 4 : 4.5 nur für die Werte μ =  ( + 1) mit  = m, m + 1, . . .
beschränkte Lösungen, und diese sind konstante Vielfache der (zugeordneten)
Legendre–Funktionen

(1 − s2 )m/2
  +m
d
P m (s) = (s2 − 1) .
2 ! ds
Für die Legendre–Polynome P := P 0 gilt nach § 4 : 3.2
   
1 d 1  2 − 2k −2k
P (s) = (s2 − 1) = (−1)k s ,
2 ! ds 2 k 
0≤2k≤

(m)
P m (s) = (1 − s2 )m/2 P (s) .

Legendre verwendete die nach ihm benannten Funktionen bei der Untersu-
chung der Anziehungskräfte von Rotationskörpern (1785/87).
&  '

(b) Satz. + 1
2
P   = 0, 1, . . . ist ein vollständiges Orthonormalsys-
2
tem in L (]−1, 1[). Dieses Orthonormalsystem stellt die Gram–Schmidt–Ortho-
normalisierung der Potenzen 1, s, s2 , . . . dar.

Beweis.
(i) Für g(s) := (s2 − 1) = (s + 1) (s − 1) folgt mit Hilfe der Leibniz–Regel
g (k) (1) = g (k) (−1) = 0 für k < . Definitionsgemäß ist g ( ) = 2 ! P . Für jede
Funktion f ∈ C∞ [−1, 1] folgt durch –fache partielle Integration ÜA

1 1 1 1 ( )
f,P = f (s) g ( ) (s) ds = f (s) (1 − s2 ) ds .
2 ! −1 2 ! −1
394 § 15 Eigenwertprobleme für den Laplace–Operator

(ii) Für k <  gilt Pk , P = 0, da Pk ein Polynom k–ten Grades ist.


Aus der Reihendarstellung von f := P folgt f ( ) (s) = (2)!/(2 !), also

(2)! 1 (2)! 1
P ,P = (1 − s 2
) ds = (1 + s) (1 − s) ds .
(2 !)2 −1 (2 !)2 −1

Durch weitere –malige partielle Integration ergibt sich hieraus ÜA

1 1 2
P ,P = (1 + s)2 (1 − s)0 ds = .
22 −1
2 + 1

(iii) Der höchste Koeffizient von P ist positiv. Dasselbe ergibt sich für die
höchsten Koeffizienten der Polynome vn , die aus den Potenzen uk (s) = sk
durch Orthonormalisierung entstehen:
Nach Bd. 1, § 19 : 3.1 gilt vn = (un − Pn−1 un )/un − Pn−1 un , wobei Pn−1 un
vom Grad ≤ n−1 ist. Da Orthonormalsysteme bis auf das Vorzeichen festgelegt
sind, folgt vn = Pn für n ∈ 0 . 
(iv) Die Vollständigkeit wird in (c) mitbewiesen. 2
&  '
(c) Satz. Für jedes m ∈  0 ist ( −m)!
( +m)!

( + 12 ) P m   = m, m + 1, . . .
ein vollständiges Orthonormalsystem in L (] − 1, 1[). 2

Beweis.
(i) Für k,  ≥ m und k =  setzen wir zur Abkürzung u := Pkm , v := P m und
schreiben die Legendresche DG in der Form

Lu = k(k + 1)u , Lv = ( + 1)v .

Damit erhalten wir



k(k + 1) − ( + 1) u, v = Lu , v − u , Lv
1  m2
 
m2

= −((1 − s2 )u ) + 1−s2
u v − u −((1 − s2 )v  ) + 1−s2
v ds
−1

1    
= − (1 − s2 )u v + u (1 − s2 )v  ds
−1
 
−(1 − s2 ) (u v − uv  ) −1 = 0 ,
1
=

also Pkm , P m = u , v = 0 wegen k = .


3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 395

(ii) Für festes  gilt mit der Abkürzung um := P m (m = 0, 1, . . . , )


(m)
um = (1 − s2 )1/2 (1 − s)(m−1)/2 P

(m−1) 
= (1 − s)1/2 (1 − s2 )(m−1)/2 P

(m−1)
+ (m − 1) s (1 − s2 )(m−3)/2 P

= (1 − s2 )1/2 um−1 + (m − 1) s (1 − s2 )−1/2 um−1 ,

(m−1)2 s2
u2m = (1 − s2 ) u2 
m−1 + 2(m − 1) s um−1 um−1 + 1−s2
u2m−1
 
= (1 − s2 ) um−1 um−1 + (m − 1) s u2m−1
  (m−1)2 s2
− (1 − s2 )um−1 um−1 − (m − 1) u2m−1 + 1−s2
u2m−1
   
(m−1)2 (m−1)2 s2
= ... +  ( + 1) − 1−s2
− (m − 1) + 1−s2
u2m−1
  
= ... +  ( + 1) − m (m − 1) u2m−1
 
= ... + ( + m) ( − m + 1) u2m−1 .

Hieraus folgt
1 1
u2m ds = ( + m) ( − m + 1) u2m−1 ds ,
−1 −1

und durch m–fache Iteration dieser Beziehung ergibt sich zusammen mit (b)
1 1 ( + m)! 1 2
(P m )2 ds = u2m ds = u ds
−1 −1
( − m)! −1 0
( + m)! 1 ( + m)! 2
= (P )2 ds = .
( − m)! −1 ( − m)! 2 + 1

(iii) Da C0c (]−1, 1[) in L2 (]−1, 1[) dicht liegt (§ 10 : 3.2), reicht es für die Voll-
ständigkeit des Orthonormalsystems nachzuweisen, dass es zu f ∈ C0c (]−1, 1[)
und jedem ε > 0 ein g ∈ Span {P m |  = m, m + 1, . . .} mit f − g ≤ ε gibt.
Da F (s) := (1 − s2 )−m/2 f (s) auf [−1, 1] stetig ist, existiert nach dem Weier-
straßschen Approximationssatz (§ 6 : 2.9) ein Polynom G mit

|F (s) − G(s)| ≤ ε/ 2 für s ∈ [−1, 1] .
(m)
Da die P Polynome ( − m)–ten Grades sind, folgt
(m)
G ∈ Span {P |  ≥ m },
396 § 15 Eigenwertprobleme für den Laplace–Operator

und für g(s) := (1 − s2 )m/2 G(s) dann

g ∈ Span {P m |  ≥ m }.

Weiter ist
     √
 f (s) − g(s)  =  (1 − s2 )m/2 F (s) − G(s)  ≤ ε/ 2 für s ∈ [−1, 1] ,

also f − g ≤ 2 f − g∞ ≤ ε . 2

3.5 Die Vollständigkeit der Kugelfunktionen


(a) Der Vektorraum aller messbaren Funktionen Y : ]0, π[ × ]−π, π[ mit der
Norm
π π
Y 2S 2 := Y (ϑ, ϕ)2 sin ϑ dϑ dϕ < ∞
0 −π

und dem zugehörigen Skalarprodukt

π π
Y1 , Y2 S2 := Y1 (ϑ, ϕ) Y2 (ϑ, ϕ) sin ϑ dϑ dϕ
0 −π

(mit der üblichen Identifizierung fast überall gleicher Funktionen) ist ein Hil-
bertraum, bezeichnet mit L2 (S 2 ).

Um dies einzusehen, betrachten wir Ω = ]0, π[ × ]−π, π[ und (ϑ, ϕ) = sin ϑ.
Wegen > 0 auf Ω ist Y : Ω → Ê
genau dann messbar, wenn y := Y / mess-
bar ist, und es gilt Y ∈ L2 (S 2 ) ⇐⇒ y = Y / ∈ L2 (Ω). Die Abbildung
U : L2 (Ω) → L2 (S 2 ), y → y ist also ein Isomorphismus, vgl. § 9 : 1.2.
Da do = sin ϑ dϑ dϕ das Oberflächenelement
 der Sphäre S 2 ist, können wir
Y1 , Y2 S 2 als Oberflächenintegral S 2 u1 u2 do auffassen; dabei ist Yk = uk ◦Φ
(k = 1, 2) und Φ die Parametrisierung von S 2 durch Kugelkoordinaten.
(b) Die in 3.3 gefundenen Produktlösungen des Eigenwertproblems (KF) und
die zugehörigen Eigenwerte μ nummerieren wir wie folgt: Für  ∈ 0 , m ∈ 
mit |m| ≤  setzen wir

m
P m (cos ϑ) cos(mϕ) für 0 ≤ m ≤ ,
Y (ϑ, ϕ) := −m
P (cos ϑ) sin(mϕ) für −  ≤ m < 0 ,

μm :=  ( + 1) .
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 397

Satz. Die Kugelfunktionen cm Y m ( ∈ , 0 m∈ , |m| ≤ ) mit


⎧ 
⎪ 1

⎪ √ + 1
für m=0
⎨ 2π 2
m
c :=

⎪ ( − |m|)!
 

⎩ √1 +
1
für m = 0
π ( + |m|)! 2

bilden ein vollständiges Orthonormalsystem für L2 (S 2 ).


Der Eigenraum des Eigenwertproblems (KF) zum Eigenwert (+1) ist (2+1)–
dimensional und wird aufgespannt von Y −m , . . . , Y 0 , . . . , Y m .

Bemerkungen. (i) Die Y m ( |m| ≤  ) fallen als Real– und Imaginärteile der
Z m (ϑ, ϕ) = P m (cos ϑ) eimϕ an. Die Z m bilden bei passender Normierung ein
vollständiges ONS für den komplexen Hilbertraum L2 (S 2 ) mit dem entspre-
chenden Skalarprodukt und werden ebenfalls Kugelfunktionen genannt.
(ii) Laplace fand 1785 die Kugel-
funktionen bei Untersuchungen
über die Anziehungskräfte
von Rotationskörpern.
Die nebenstehende
Figur zeigt den
6
Graphen von Y11
über dem halben
Koordinatenrechteck [0, π] × [0, π].

Beweis.
Wir verwenden das Vollständigkeitskriterium § 9 : 4.4 (e), nach welchem ein ONS
genau dann vollständig ist, wenn nur der Nullvektor zu diesem orthogonal ist.
Sei also
f ∈ L2 (S 2 ) und Ym, f S2 = 0 für  ∈ 0 , |m| ≤  .
Wir gehen der Übersichtlichkeit halber ins Komplexe. Für die oben definierten
Z m und für F (s, ϕ) := f (arccos s, ϕ) gilt dann aufgrund des Satzes von Fubini
§ 8 : 1.8 und des Transformationssatzes § 8 : 1.9
π π
e−imϕ P
(m)
0 = Zm , f S2 := (cos ϑ) f (ϑ, ϕ) sin ϑ dϑ dϕ
0 −π
1  π
e−imϕ F (s, ϕ) dϕ P
(m)
= (s) ds
−1 −π

für festes m ∈ und alle  ≥ |m|. Wegen der in 3.4 (c) festgestellten Vollstän–
398 § 15 Eigenwertprobleme für den Laplace–Operator

digkeit der Legendre–Funktionen folgt daraus


π π π
0= e−imϕ F (s, ϕ) dϕ = F (s, ϕ) cos(mϕ) dϕ − i F (s, ϕ) sin(mϕ) dϕ
−π −π −π

für fast alle s ∈ [−1, 1] und alle m ∈ . Wegen der Vollständigkeit der tri-
gonometrischen Funktionen in L2 [−π, π] (§ 9 : 4.5) ergibt sich daraus mit der

Parsevalschen Gleichung F (s, ϕ)2 dϕ = 0 für fast alle s ∈ [−1, 1].
−π

Der Satz von Tonelli § 8 : 1.8 und der Transformationssatz § 8 : 1.9 liefern
π π 1  π
f (ϑ, ϕ)2 sin ϑ dϑ dϕ = F (s, ϕ)2 dϕ ds = 0
0 −π −1 −π

und damit f = 0. 2

(c) Aufgabe. Für x = (r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ) sei

H m (x) := r Y m (ϑ, ϕ) für |m| ≤  ≤ 2 .

Zeigen Sie, dass H m ein harmonisches und vom Grad  homogenes Polynom ist,
siehe die Einleitung zu diesem Abschnitt.
Zeigen Sie weiter, dass sich jedes homogene Polynom zweiten Grades (d.h. jede
quadratische Form in 3) auf eindeutige Weise in der Gestalt

3 
2
2 H2 (x) + α0 x H0 (x)
2
aik xi xk = αm m 0 0

i,k=1 m=−2

darstellen läßt.

3.6 Eigenwerte und Eigenfunktionen auf Kugeln


Satz. Für das Dirichletsche Eigenwertproblem (∗) auf der Kugel Ω = KR (0)
im 3 sind ein vollständiges Orthonormalsystem von Eigenfunktionen in L2 (Ω)
und die zugehörigen Eigenwerte gegeben durch
 
uk m | k ∈ ,  ∈ 0 , m ∈ mit |m| ≤  , λk m = (j +1/2,k /R)
2

mit
ck m  r
uk m (x) = √ J +1/2 j +1/2,k R Y m (ϑ, ϕ)
r
für x = (r sin ϑ cos ϕ, r sin ϑ sin ϑ, r cos ϑ) (0 < r ≤ R, 0 ≤ ϑ ≤ π, −π < ϕ ≤ π)
und
√  
2 ( − |m|)! 1 1
ck m = 
+ .
R |J +1/2 (j +1/2 )| ( + |m|)! 2 π (1 + δm0 )
3 Eigenwerte und Eigenfunktionen für Kreisscheibe und Kugel 399

Dabei ist J +1/2 die Besselfunktion vom Index + 12 , j +1/2,k sind die positiven
 
Nullstellen von J +1/2 (k ∈ ,  ∈ 0 , vgl. 3.1), {Y m } ist das in 3.5 definier-
te System von Kugelfunktionen und δm0 das Kronecker–Symbol ( δ00 = 1 und
δm0 = 0 für m ∈ ). 
Für das Neumannsche Eigenwertproblem ergibt sich ein ganz entsprechendes
Orthonormalsystem, indem die j +1/2,k durch die Nullstellen der abgeleiteten
Besselfunktionen J +1/2 ersetzt werden, vgl. 3.2 (b), 3.1 (c).

Beweis.
(i) Nach dem Transformationssatz für Integrale hat das L2 –Skalarprodukt auf
der Kugel Ω = KR (0) für Funktionen in Produktform (Xi ⊗ Yi )(r, ϑ, ϕ) :=
Xi (r) Yi (ϑ, ϕ) die Gestalt

R π π
X1 ⊗ Y1 , X2 ⊗ Y2 = X1 (r) X2 (r) r 2 dr Y1 (ϑ, ϕ) Y2 (ϑ, ϕ) sin ϑ dϑ dϕ .
0 −π 0

Hieraus ergibt sich die Orthonormalität des Systems A := {uk m } aus den
Orthonormalitätseigenschaften der Besselfunktionen 3.1 (b) und denen der Ku-
gelfunktionen 3.4 ÜA .
(ii) Nach dem Entwicklungssatz 1.2 existiert ein vollständiges ONS B für L2 (Ω),
bestehend aus Eigenfunktionen vi ∈ C2 (Ω) des Dirichletschen Eigenwertpro-
blems (∗). Die Vollständigkeit des ONS A ist bewiesen, wenn wir gezeigt haben,
dass jede Eigenfunktion u eine Linearkombination von Funktionen aus A ist,
was B ⊂ Span A bedeutet.
Sei also u ∈ C2 (Ω) eine beliebige Eigenfunktion des Problems (∗) zum Eigenwert
λ > 0 und U (r, ϑ, ϕ) := u(r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ). Für jedes r ∈ [0, R]
besitzt die Funktion (ϑ, ϕ) → U (r, ϑ, ϕ) nach 3.5 die Fourierentwicklung

U (r, ϑ, ϕ) = Am (r) Y m (ϑ, ϕ)
|m|≤

in L2 (S 2 ) mit den Fourierkoeffizienten

( − |m|)!  + 12 π π
Am (r) = U (r, ϑ, ϕ) Y m (ϑ, ϕ) sin ϑ dϑ dϕ .
( + |m|)! π (1 + δm0 ) 0 −π

Die Funktionen r → Am (r) sind C2 –differenzierbar auf [0, R], genügen nach
(∗∗∗) in 3.3 der Randbedingung Am (R) = 0 und erfüllen die DG
 
1  2   ( + 1)
r X (r) + λ− X(r) = 0 in ]0, R] ,
r2 r2

was sich aus der Eigenwertgleichung in (∗∗∗) durch zweimalige partielle Inte-
gration ergibt ÜA .
400 § 15 Eigenwertprobleme für den Laplace–Operator


Für jedes Paar , m mit Am = 0 ist am (r) := r Am (r) nach 3.3 eine Lösung
1
der Besselschen DG vom Index  + 2 zum Eigenwert λ mit der Eigenschaft,
dass r −1/2 am (r) beschränkt ist. Nach 3.1 (a) gibt es (genau) ein k ∈ und 
eine Konstante αm ∈ mit Ê
2
λ = (j +1/2,k /R) = λ|k|m ,

Am (r) = r −1/2 am (r) = r −1/2 αm J r


+1/2 (j +1/2,k R )

= αm r −1/2 J +1/2 ( λ r) .

Wegen u = 0 ist die Menge I dieser (m, ) nicht leer. Weiter ist I endlich, weil
der Eigenwert λ nach 1.2 endliche Vielfachheit besitzt. Damit ist

u(x) = U (r, ϑ, ϕ) = Am (r) Y m (ϑ, ϕ)
(m, )∈I
 αm √
= √ J +1/2 ( λ r) Y m (ϑ, ϕ) ,
(m, )∈I r

was u ∈ Span A bedeutet. 2

Für die R–Kugel im Ê n


ergeben sich die Eigenwerte

λk = (j +h,k /R)
2
mit h := n−2
2 (k ∈ Æ,  ∈ Æ ) ,
0

und die Radialanteile der zugehörigen Eigenfunktionen sind



r −h J +h j +h,k R
r
,

siehe Folland [61] p. 126–139.


401

§ 16 Die Wärmeleitungsgleichung
Vorkenntnisse. Die ersten drei Abschnitte verlangen keine besonderen Vorkennt-
nisse, abgesehen von der Fouriertransformation auf dem Schwartz–Raum, die
im Rahmen einer Plausibilitätsbetrachtung auftritt. Der Abschnitt 4 stützt sich
wesentlich auf § 14 : 6 und § 15 : 1.

1 Bezeichnungen, Problemstellungen
(a) Wir definieren den Wärmeleitungsoperator H durch

H = − Δ.
∂t
Für ein Gebiet Ω ⊂ Ê n
und eine Zeitspanne T mit 0 < T ≤ ∞ setzen wir

ΩT := Ω × ]0, T [ , ∂  ΩT := ( Ω × {0}) ∪ (∂Ω × [0, T [ ) .

Ê
Im Fall Ω = n besteht ∂  ΩT aus Boden und Mantelfläche des Zylinders ΩT .
Von klassischen Lösungen verlangen wir natürlicherweise Zugehörigkeit zu
(  =
 ∂u ∂u ∂2u
C 2,1
(ΩT ) := 0
u ∈ C (ΩT )  , , ∈ C (ΩT ) .
0
∂t ∂xi ∂xi ∂xk

(b) Wir betrachten folgende Problemstellungen:


(i) Das Anfangswertproblem (AWP) oder Cauchy–Problem auf Ω = Ê n
:
Zu gegebenem T > 0 ist eine Funktion u ∈ C ( 0
Ên
× [0, T [) ∩ C
2,1
( Ên
× ]0, T [)
gesucht mit
Hu = f auf Ê n
× ]0, T [ ,
u(x, 0) = u0 (x) für x ∈ Ê n
.
Dabei sind f : Ê
× ]0, T [ →
n
Ê
und u0 : n → Ê Ê gegebene Funktionen, deren
Differenzierbarkeitsstufe noch festzulegen ist.
Von besonderem Interesse sind Lösungen unbegrenzter Lebensspanne T = ∞.

(ii) Das Anfangs–Randwertproblem (ARWP) auf einem beschränkten Ge-


Ê
biet Ω ⊂ n :
Gegeben sind T > 0 und Funktionen f auf ΩT , g auf ∂Ω × ]0, T [ und u0 auf Ω.
Gesucht ist eine Funktion u ∈ C0 (ΩT ∪ ∂  ΩT ) ∩ C2,1 (ΩT ) mit
Hu = f in ΩT ,
u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) für x ∈ Ω .
402 § 16 Die Wärmeleitungsgleichung

Auch im Fall, dass Lösungen unbegrenzter Lebensspanne gesucht sind, wird


dieses Problem zunächst für endliches T untersucht.
Beide Probleme sind so gestellt, dass sie eindeutig lösbar sind und unter geeig-
neten Differenzierbarkeitsvoraussetzungen an die Daten eine Lösung besitzen.
Zur Herleitung und physikalischen Deutung der Wärmeleitungsgleichung ver-
weisen wir auf § 1 : 2.5. Im Fall der Raumdimension n = 1 wurde das ARWP in
§ 6 : 4 behandelt.

(c) Gleichmässig parabolische Differentialoperatoren.


Die Ergebnisse dieses Paragraphen bleiben mit geringen Modifikationen gültig,
wenn wir im Wärmeleitungsoperator ∂t ∂
− Δ anstelle von Δ einen gleichmäßig
elliptischen Operator L setzen, vgl. § 14 : 1 (b).
Hierzu verweisen wir auf Dautray–Lions [4, 5], Friedman [78], Ladyzhens-
kaya [65], Ladyzhenskaya–Solonnikov–Uraltseva [83], Wloka [72].

2 Eigenschaften des Wärmeleitungsoperators


2.1 Der Wärmeleitungskern
(a) Wir betrachten das Cauchy–Problem für die homogene Wärmeleitungsglei-
chung

(∗)
∂u
∂t
− Δu = 0 in Ê n
× Ê >0 , u(x, 0) = u0 (x) für x ∈ Ê n

mit einer gegebenen schnellfallenden Funktion u0 ∈ S ( n ), vgl. § 12 : 3.1. Um Ê


eine Lösungsformel zu erraten, nehmen wir an, dass u eine Lösung von (∗) ist
Ê
mit x → u(x, t) ∈ S ( n) für alle t ≥ 0 und dass

/(y, t) := (2π)−n/2
u e−i x , y  u(y, t) dn y
Ên
als Parameterintegral nach t differenziert werden kann,


/(y, t) = (2π)−n/2
u e−i x , y  ∂
u(y, t) dn y für t > 0 .
Ên
∂t ∂t

Dann folgt aus der Differentialgleichung und dem P ,Q–Gesetz § 12 : 3.3 (c)


/(y, t) = (2π)−n/2
u e−i x , y  Δu(y, t) dn y = −y2 u
/(y, t) ,
Ên
∂t

also
2 2
u /(y, 0) e−y
/(y, t) = u t
/0 (y) e−y
= u t
.
−y2 t
Der Term e läßt sich als Fouriertransformierte darstellen: Nach der Ska-
lierungsregel § 12 : 2.5 (b) gilt für t > 0
2 2
e−y t /t (y) mit Gt (x) = (2t)−n/2 e−x
= G /4t
.
2 Eigenschaften des Wärmeleitungsoperators 403

Mit dem Faltungssatz § 12 : 2.6 (c) ergibt sich wegen Gt ∈ S ( Ên


) für t > 0

/t (y) /
/(y, t) = G
u u0 (y) = (2π)−n/2 G;
t ∗u0 (y) ,

und daher u(x, t) = (2π)−n/2 (Gt ∗ u0 )(x) wegen der Injektivität der Fourier-
transformation. Damit erhalten wir die Lösungsdarstellung

(∗∗) u(x, t) = Γ(x − y, t) u0 (y) dn y für x ∈ Ê n
, t>0
Ên
mit dem Wärmeleitungskern

Γ(x, t) := (4πt)−n/2 e−x


2
/4t
für x ∈ Ê n
, t > 0.

In Abschnitt 3 zeigen wir, dass durch das Faltungsintegral (∗∗) unter geeig-
neten Voraussetzungen über u0 auch eine Lösung u des Cauchy–Problems (∗)
gegeben wird. Ohne Beweis sei angemerkt, dass diese für u0 ∈ S ( n) den Ê
oben gemachten Annahmen genügt. Die Eindeutigkeit der Lösung wird in 2.2
behandelt.

(b) Der Wärmeleitungskern als Grundlösung für H. Durch


( 2
(4πt)−n/2 e−x /4t
f ür t > 0 ,
Γ(x, t) :=
0 f ür t ≤ 0

Ê
ist eine auf n+1
∗ Ê
:= n+1 \ {0} stetige Grundlösung für den Wärmeleitungs-
operator H gegeben, d.h. es gilt
 ∂
ϕ(0, 0) = − Γ(y, s) ϕ + Δϕ (y, s) dn y ds
Ê
∂t
n

für jede Testfunktion ϕ auf Ê n+1


, vgl. § 13 : 5.2.
Für den ziemlich technischen Beweis verweisen wir auf Forster [147] § 17, Satz 4.

Ist f (x, t) stetig auf Ê n


× Ê+, so ist hiernach durch

u(x, t) = Γ(x − y, t − s) f (y, s) dn y ds
Ê Ên
eine schwache Lösung der DG Hu = f gegeben. Das folgt aus § 13 : 5.3 unter
Beachtung von Γ(x, t) = 0 = f (x, t) für t ≤ 0. Unter geeigneten Differen-
zierbarkeitsbedingungen an f liefert diese Formel eine klassische Lösung von
Ê Ê
Hu = f auf n × ]0, T [, u = 0 auf n × {0}. Dies zeigen wir in 3.3, ohne auf
die oben angegebenene Grundlösung zurückzugreifen.
404 § 16 Die Wärmeleitungsgleichung

(c) Eigenschaften des Wärmeleitungskerns.


Es gilt
(i) Γ ∈ C∞ ( Ê n+1
∗ ),
(ii) H Γ = 0 in Ê n+1
∗ ,

(ii) Γ(x, t) dn x = 1 für t > 0.
Ên
Die ersten beiden Eigenschaften
ergeben sich durch direktes Nach-
rechnen ÜA .
Die Formel (iii) folgt durch An-
wendung des Transformationssat-
zes für Integrale
√ mit der Substi-
t
tution y = 2t x und sukzessiver
Integration ÜA .
x
(d) Aufgaben.
(i) Veranschaulichen Sie sich den Wärmeleitungskern für n = 1, indem Sie die
Schnitte t → Γ(x, t) für x = 0, für x = 0, und die Schnitte x → Γ(x, t) für
t > 0 skizzieren.
(ii) Rechnen Sie nach, dass durch

u(x, t) := (T − t)−n/2 e−x


2
/(T −t)
in Ên
× ]0, T [

eine Lösung der homogenen Wärmeleitungsgleichung ∂t u = Δu gegeben ist.


Wegen der Translationsinvarianz des Laplace–Operators erfüllt deswegen auch
v(x, t) = u(x − x0 , t) die homogene Wärmeleitungsgleichung in n × ]0, T [. Ê
2.2 Maximumprinzipien, Eindeutigkeit von Lösungen
(a) Maximumprinzip für das Anfangs–Randwertproblem. Sei Ω ⊂ n Ê
ein beschränktes Gebiet und T > 0. Genügt u ∈ C0 (ΩT ∪ ∂  ΩT ) ∩ C2,1 (ΩT ) der
Ungleichung
Hu ≤ 0 in ΩT ,
so gilt
u ≤ sup u auf ΩT .
∂  ΩT

Insbesondere ergeben sich für jede Lösung u von Hu = 0 die Schranken


inf u ≤ u ≤ sup u auf ΩT .
∂  ΩT ∂  ΩT
2 Eigenschaften des Wärmeleitungsoperators 405

Folgerung. Das Anfangs–Randwertproblem


Hu = f in ΩT ,
u = g auf ∂  ΩT
besitzt höchstens eine Lösung u ∈ C0 (ΩT ∪ ∂  ΩT ) ∩ C2,1 (ΩT ).

Beweis des Maximumprinzips.


Wir fixieren (x0 , t0 ) ∈ ΩT , wählen ε, δ > 0 mit t0 < T − ε und setzen uδ (x, t) :=
u(x, t) − δt. Dann gilt

(∗) H uδ ≤ − δ < 0 in ΩT ,

und uδ nimmt auf dem kompakten Zylinder ΩT −ε = Ω×[0, T −ε] das Maximum
an einer Stelle (ξ, τ ) an.
Fall 1: (ξ, τ ) ∈ ∂  ΩT , also (ξ, τ ) ∈ Ω × ]0, T − ε] . Die notwendigen Bedingungen
für lokale Maxima liefern
  
∂uδ = 0 für τ < T − ε , ∂ 2 uδ
(ξ, τ ) (ξ, τ ) ≤ 0,
∂t ≥ 0 für τ = T − ε , ∂xi ∂xk

woraus Δuδ (ξ, τ ) ≤ 0 und H uδ (ξ, τ ) ≥ 0 folgt, ein Widerspruch zu (∗).


Fall 2: (ξ, τ ) ∈ ∂  ΩT . Dann gilt

u(x0 , t0 ) = uδ (x0 , t0 ) + δt0 ≤ uδ (ξ, τ ) + δT ≤ sup uδ + δT


∂  ΩT
≤ sup u + δT .
∂  ΩT

Da diese Ungleichung für alle δ > 0 richtig ist, gilt sie auch für δ = 0. 2

(b) Maximumprinzip für das Anfangswertproblem (Tychonow 1935).


Ê Ê Ê
Ist u ∈ C0 ( n × [0, T [) ∩ C2,1 ( n × ]0, T [) auf n × {0} beschränkt und erfüllt
die Wachstumbedingung

| u(x, t) | ≤ M eax
2
für (x, t) ∈ Ê n
× [0, T [

mit Konstanten M, a ≥ 0, sowie die Ungleichung

Hu ≤ 0 in Ê n
× ]0, T [ ,

so gilt

u ≤ sup u auf
Ên ×{0}
Ê n
× ]0, T [ .
406 § 16 Die Wärmeleitungsgleichung

Bemerkung. Tychonow zeigte an einem Beispiel, dass ohne die Wachstums-


bedingung eine Kontrolle der Lösung durch die Anfangswerte nicht möglich ist;
siehe John [49] Ch. 7.1 (a).

Beweis.
Wir fixieren (x0 , t0 ) ∈ Ê n
× [0, T [ .
(i) Im Fall 16aT < 1 setzen wir für δ > 0
2
uδ := u − δ v mit v(x, t) := (2T − t)−n/2 ex−x0  /4(2T −t)
.

Nach Aufgabe 2.1 (d) gilt Hv = 0, also Huδ ≤ 0 in n × ]0, T [ . Das Maxi- Ê
mumprinzip (a), angewandt auf uδ und den Zylinder ΩT := Kr (x0 ) × ]0, T [
liefert

(∗) uδ (x0 , t0 ) ≤ sup uδ .


∂  ΩT

Wir schätzen uδ auf ∂  ΩT ab: Für x ∈ Kr (x0 ) gilt

uδ (x, 0) ≤ u(x, 0) ≤ sup u


Ên ×{0}
und für (x, t) ∈ ∂Kr (x0 ) × [0, T [ ergibt sich mit der Wachstumbedingung an u
2 2
u(x, t) ≤ M eax ≤ M ea(r+x0 )
2
+2ax0 2 2
≤ M e2ar =: M1 e2ar ,
2 2
v(x, t) ≥ (2T )−n/2 er /8T
=: M2 er /8T
,
somit
2 2
uδ (x, t) = u(x, t) − δ v(x, t) ≤ M1 e2ar − M2 δ er /8T
.

Wegen 1/(8T ) − 2a = (1 − 16aT )/8T > 0 überwiegt in dieser Differenz der


erste Term für r  1. Somit folgt aus (∗)

uδ (x0 , t0 ) ≤ sup u ,
Ên ×{0}
und damit
u(x0 , t0 ) = uδ (x0 , t0 ) + δ v(x0 , t0 ) ≤ sup u + δ (2T )−n/2 .
Ên ×{0}
Da diese Ungleichung für jedes δ > 0 gilt, besteht sie auch für δ = 0.

(ii) Im Fall 16aT ≥ 1 unterteilen wir das Intervall [0, T [ in Teilintervalle der
Länge T  < 1/16a und wenden (i) mehrfach an. 2
3 Das Anfangswertproblem 407

Folgerung. Lösungen des Anfangswertproblems 1 (b) (i) mit höchstens qua-


dratisch exponentiellem Wachstum sind durch die Anfangswerte eindeutig be-
stimmt.
Dies ergibt sich durch Anwendung des Maximumprinzips (b) auf die Differenz
zweier Lösungen.

(c) Strenges Maximumprinzip (Nirenberg 1953). Genügt u ∈ C2,1 (ΩT )


Ê
(Ω ⊂ n ein beliebiges Gebiet) der Ungleichung

Hu ≤ 0 in ΩT ,

und nimmt u das Maximum an einer Stelle (x0 , t0 ) ∈ ΩT an, so ist u konstant
in Ω × ]0, t0 ].
Für den Beweis siehe Protter–Weinberger [52] 3.3, Thm. 4, Friedman [78]
2.2.

3 Das Anfangswertproblem
3.1 Das AWP für die homogene Wärmeleitungsgleichung
Im folgenden bezeichne Γ den Wärmeleitungskern, vgl. 2.1.

Satz. Sei u0 eine stetige Funktion auf Ê , die der Wachstumsbedingung


n

| u0 (x) | ≤ M eax
2
für x ∈ Ê n

mit Konstanten M, a ≥ 0 genügt. Dann ist für T < 1/4a durch



Γ(x − y, t)u0 (y) dn y für t > 0 ,
u(x, t) := Ên
u0 (x) für t = 0

die eindeutig bestimmte Lösung u ∈ C0 ( Ê n


× [0, T [) ∩ C2 ( Ên
× ]0, T [) des An-
fangswertproblems

Hu = 0 in Ê n
× ]0, T [ , u(x, 0) = u0 (x) für x ∈ Ê n

gegeben. Für diese gilt u ∈ C∞ ( Ê n


× ]0, T [).

Diese Integraldarstellung der Lösung wurde für n = 1 von Fourier 1811 for-
muliert und 1815 von Poisson bewiesen.

Bemerkungen. (i) Ist u0 beschränkt, so kann a = 0 und damit T = ∞ ge-


wählt werden.
(ii) Das Funktion x → u(x, t) ist für jedes t ∈ ]0, T [ sogar analytisch. Das ergibt
sich durch Fortsetzung des Integrals ins Komplexe, siehe John [49] Ch. 7.1.
408 § 16 Die Wärmeleitungsgleichung

(iii) Das Anfangswertproblem besitzt selbst dann noch eine C∞ –Lösung u für
t > 0, wenn die Anfangswerte u0 nur lokal integrierbar sind, also unstetig sein
können. Die stetige Annahme der Anfangswerte durch die Lösung erfolgt in
diesem Fall im Sinne der L1loc –Konvergenz,

lim
t→0+
| u(x, t) − u0 (x) | dn x = 0 für jedes kompakte K ⊂ Ên
,
K

siehe Dibenedetto [59] V.6.

Beweis.
(1) Die eindeutige Bestimmtheit der Lösung folgt aus dem Eindeutigkeitssatz
2.2 (a).
(2) Die durch das Integral dargestellte Funktion ist in n × ]0, T [ stetig. Ê
Hierzu reicht es nach dem Satz über die Stetigkeit von Parameterintegralen
(Bd. 1, § 23 : 5.1 bzw. § 8 : 1.4), zu jedem kompakten Quader K ⊂ n × ]0, T [ Ê
eine integrierbare Majorante für den Integranden anzugeben.
Für (x, t) ∈ K und y ∈ Ê n
gilt nach Voraussetzung
 
 Γ(x − y, t) u0 (y)  = (4πt)−n/2 e−x−y2 /4t |u0 (y)|
2
/4t ay2
≤ M (4πt)−n/2 e−x−y e .
Quadratische Ergänzung des Exponenten ergibt ÜA
 
x − y 2
α x 2 a
− + ay2 = −  y −  + x2
4t 4tα α
a
= − η2 + x2
α
mit
  
α x
α := 1 − 4at > 1 − 4aT > 0 , η := y− .
4t α
Somit folgt durch Substitution y → η unter Beachtung von
 2  +∞
 2
e−η  dn y =
n
e−s ds = π n/2
Ên −∞

(Bd. 1, § 23 : 8.4) die Majoranteneigenschaft ÜA :


 
 Γ(x − y, t) u0 (y)  ≤ gK (x, y, t) := M (4πt)−n/2 e−η2 ea x2 /α ,
wobei
 2
gK (x, y, t) dn y = M (1 − 4at)−n/2 ea x /α
≤ c(K) .
Ên
(3) Die Funktion u ist in n
Ê
× ]0, T [ C∞ –differenzierbar und löst dort die
Wärmeleitungsgleichung Hu = 0.
3 Das Anfangswertproblem 409

Zum Nachweis reicht es nach dem Satz über die Differenzierbarkeit von Para-
meterintegralen (Bd. 1, § 23 : 5.2), für jeden kompakten Quader K ⊂ n × ]0, T [ Ê
und jede partielle Ableitung des Integranden nach x1 , . . . , xn , t eine integrier-
bare Majorante anzugeben. Dies ist möglich, weil bei jeder Ableitung der Inte-
grand ein Polynom in 1/t als Faktor erhält. Dieses Polynom ist beschränkt für
Ê
(x, t) ∈ K, weil der Quader K zu n × {0} = {t = 0} einen positiven Abstand
hat.
Ê
Da (x, t) → Γ(x−y, t) nach 2.1 (c) für jedes y ∈ n und für t > 0 die homogene
Wärmeleitungsgleichung löst, gilt dies auch für u.
(4) u ist auch auf Ê n
× [0, T [ stetig. Hierzu ist nach (2) noch zu zeigen, dass
lim
(x,t)→(x0 ,0)
u(x, t) = u0 (x0 ) für jedes x0 ∈ Ê n
.

Aufgrund des nachfolgenden Hilfssatzes gibt es zu gegebenem x0 ∈ Ên


für jedes
ε > 0 ein b > 0 mit
 
 u0 (y) − u0 (x0 )  ≤ εeb y−x0 2 für alle y ∈ Ê n
.
2
Wählen wir δ > 0 mit e2bδ = 2, so folgt für x − x0  < δ
 
y − x0 2 = (y − x) + (x − x0 )  ≤ 2y − x2 + 2x − x0 2
2

≤ 2y − x2 + 2δ 2 ,
 
 u0 (y) − u0 (x0 )  ≤ εe2by−x2 +2bδ2 = 2εe2by−x2 .

Nach 2.1 ist Γ(ξ, t) für t > 0 positiv, und es gilt


 
Γ(x − y, t) dn y = Γ(ξ, t) dn ξ = 1 .
Ên Ên
Für x − x0  < δ und 0 < t < 1/16b folgt somit
     
 u(x, t) − u0 (x0 )  =  Γ(x − y, t) u0 (y) − u0 (x0 ) dn y 

Ên
≤ Γ(x − y, t) | u0 (y) − u0 (x0 ) | d y
n

Ên
 2
/4t 2by−x2
≤ 2ε (4πt)−n/2 e−y−x e dn y
Ê n

und nach Ausführung der Substitution y → η = 1−8bt


4t
(y − x) analog wie in
(2) unter Beachtung von 1 − 8bt > 1/2

| u(x, t) − u0 (x0 ) | ≤ 2ε(1 − 8bt)−n/2 < 2 2n/2 ε ,

was die Behauptung darstellt. 2


410 § 16 Die Wärmeleitungsgleichung

Hilfssatz. Zu x0 ∈ Ê n
und ε > 0 gibt es ein b > 0 mit
 
 u0 (y) − u0 (x0 )  ≤ ε eb y−x0 2 für alle y ∈ Ê n
.

Beweis.
Zu ε > 0, x0 ∈ Ê
n
wählen wir ein δ > 0 mit
 
 u0 (y) − u0 (x0 )  < ε für y − x0  < δ .

Aufgrund der Wachstumsbedingung gilt für alle y ∈ Ên


mit y − x0  ≥ δ unter
Verwendung der Abkürzung N := M + |u0 (x0 )|
 
 u0 (y) − u0 (x0 )  ≤ | u0 (y) | + | u0 (x0 ) | ≤ M eay2 + | u0 (x0 ) |
2 2
≤ N eay ≤ N ea(y−x0 +x0 )
2
+2ax0 2
≤ N e2ay−x0  .

Wählen wir b > 2a so groß, dass log(N/ε) + 2ax0 2 ≤ (b − 2a)δ 2 und bδ ≥ 1


gilt, so folgt
N
log + 2ax0 2 ≤ (b − 2a)y − x0 2 ,
ε
2
+2a x0 2 2
N e2a y−x0  ≤ εeb y−x0  ,

woraus sich die Behauptung für y − x0  ≥ δ ergibt. Im Fall y − x0  < δ ist


sie ohnehin richtig. 2

Das glättende Verhalten des Lösungsoperators

u0 ∈ C0 =⇒ ut ∈ C∞ (t > 0)

(ut (x) := u(x, t)), bzw. nach Bemerkung (iii)

u0 ∈ L1loc =⇒ ut ∈ C∞ (t > 0)

kann als Ausdruck der Tatsache angesehen werden, dass die Wärmeleitungsglei-
chung einen Ausgleichsvorgang beschreibt. Dieses Verhalten hat auch zur Folge,
dass das Rückwärtsproblem

Hu = 0 in Ê n
× ]T, 0[ , u(x, 0) = u0 (x) für x ∈ Ên
, (T < 0)

für nicht C∞ –differenzierbare Anfangswerte u0 keine Lösung besitzt ( ÜA unter


Verwendung des Eindeutigkeitssatzes 2.2 (b)).
3 Das Anfangswertproblem 411

Aus der Lösungsformel ergibt sich folgende Paradoxie: Ist für t = 0 nur ein
kleines Raumgebiet erwärmt (z.B. u0 ein Standardbuckel mit kleinem Träger),
so ist für jedes noch so kleine t > 0 die Temperatur ut im ganzen Raum positiv.
Dies bedeutet unendliche Ausbreitungsgeschwindigkeit der Wärme und zeigt,
dass die Wärmeleitungsgleichung die reale Situation nur näherungsweise be-
schreibt.

3.2 Schranken für die Lösung nahe t = 0


Die folgenden Abschätzungen benötigen wir bei der Lösung der inhomogenen
Wärmeleitungsgleichung in 3.3.

Satz. Genügt die Anfangsverteilung u0 ∈ C1 ( Ê n


) der Wachstumsbedingung

| u0 (x) | ≤ M e ax
2
für x ∈ Ê n

mit Konstanten M, a ≥ 0, so bestehen für die Lösung des AWP die Abschätzun-
gen
   
 ∂u   ∂2u  c1 (r)
| u(x, t) | ≤ c0 (r) ,  (x, t)  ,  (x, t)  ≤ √
∂t ∂xi ∂xk t
für (x, t) ∈ Kr (0) × ]0, T [ , r > 0 und T ≤ 1/16a.

Das sich in der Abschätzung von t → ∂u/∂t(x, t) zeigende Verhalten der Lösung
ist ein Indiz dafür, dass diese an der Stelle t = 0 bezüglich t nicht differenzierbar
zu sein braucht.

Beweis.
(1) Aus der letzten Zeile des Beweisteils (2) von 3.1 entnehmen wir für x ≤ r,
t ≤ 1/16a wegen 1 − 4at ≥ 3/4 die Abschätzung
 n/2
4 2
| u(x, t) | ≤ M ear /α
.
3

(2) Nach Beweisteil (3) von 3.1 ist das Parameterintegral Γ(x − y, t) dn y
 Ên
für t > 0 differenzierbar, also folgt aus Γ(x − y, t) dn y = 1 die Identität
Ên

 
∂ ∂
Γ(x − y, t) dn y = Γ(x − y, t) dn y = 0 .
∂t ∂t
Ên Ên
Die Ableitung des Wärmeleitungskerns ist für t > 0
 
∂Γ n x − y2
(x − y, t) = − + Γ(x − y, t) .
∂t 2t 4t2
412 § 16 Die Wärmeleitungsgleichung

Mit der Lösungsdarstellung 3.1 folgt für x ∈ Kr (0), 0 < t < T < 1/16a
    ∂  
 ∂
u(x, t)  =  Γ(x − y, t) u0 (y) − u0 (x) dn y 
Ên
∂t ∂t

  n x−y2   
≤ + 2
 u0 (y) − u0 (x)  dn y
Ên
2t 4t

 
= ... + ... =: I1 + I2 .
Kr (x) Ên \Kr (x)
Wegen u0 ∈ C1 ( Ê ) gilt mit einer auf K
n
2r (0) bezogenen Lipschitzkonstanten
a(r)
 
 u0 (y) − u0 (x)  ≤ a(r)y − x
für y ∈ Kr (x) ⊂ K2r (0) .

√ die Substitution y → η := (y − x)/ 4t ergibt sich daraus mit R :=
Durch
r/ 4t (vgl. Beweisteil (2) in 3.1)
  
n η2 √ 2
I1 ≤ (4πt) −n/2
(4t) n/2
a(r) + 4tηe−η dn η
2t t
η <R
  
2π −n/2 a(r) n 2 c11 (r)
≤ √ + η2 ηe−η dn η =: √ .
t 2 t
Ên
Für y ∈ Ê n
\ Kr (x) ergibt sich analog zum Beweis des Hilfssatzes in 3.1
 
 u0 (y) − u0 (x)  ≤ b(r) e2a y−x2

und durch die gleiche Substitution y → η wie oben mit R = r/ 4t
  η 2 2 2
I2 ≤ π −n/2 b(r) n
2t
+ t
e8at η e−η dn η .
η ≥R


Für η ≥ R = r/ 4t gilt die Abschätzung

1 1 1 2η
= √ √ ≤ √ .
t t t r t
Wir erhalten unter Beachtung von 1 − 8at > 1 − 8aT > 1/2
2π −n/2 b(r)
 n 2
I2 ≤ √
r t
η 2
+ η2 e−(1−8at)η dn η
η ≥R
2π −n/2 b(r)
 n 1 2
≤ √ η + η2 e− 2 η dn η =: c12 (r)
√ .
Ên
r t 2 t

(3) Die Abschätzung für ∂ 2 u/∂xi ∂xk verläuft ganz analog zu (2). 2
3 Das Anfangswertproblem 413

3.3 Das AWP für die inhomogene Wärmeleitungsgleichung


Wir behandeln das Anfangswertproblem

(∗) Hu = f in Ê n
× ]0, T [ , u = 0 auf Ê n
× {0}

mit gegebener rechter Seite f . Durch Addition einer Lösung von (∗) und der
durch 3.1 gelieferten Lösung des Problems Hu = 0, u(x, 0) = u0 (x) erhalten
wir die Lösung des allgemeinen Anfangswertproblem 1 (b) (i).

Satz. Genügt f ∈ C0 ( Ê n
× [0, T [) ∩ C1 ( Ê n
× ]0, T [) der Wachstumsbedingung
2
| f (x, t) | ≤ M e ax

für alle (x, t) ∈ Ê n


× [0, T [ mit M, a ≥ 0, so ist für T < 1/4a durch
t 
u(x, t) = Γ(x − y, t − s)f (y, s) dn y ds
0 Ên
die eindeutig bestimmte Lösung des AWP (∗) gegeben.
Dabei ist Γ der in 2.1 (b) definierte Wärmeleitungskern.

Beweis.
Die Eindeutigkeit der Lösung ergibt sich nach 2.2 (b).
Wir betrachten die Schar von AWP mit Scharparameter s ∈ ]0, T [:

Hus = 0 in Ê n
× ]s, T [ , us (x, s) = f (x, s) für x ∈ Ê n
.

Die Anfangswerte werden hier also auf der Hyperebene {t = s} und nicht wie
bisher auf {t = 0} vorgegeben.
Nach Ausführung der Zeittranslationen t → t − s erhalten wir mit der Lö-
sungsdarstellung aus 3.1

us (x, t) = Γ(x − y, t − s)f (y, s) dn y .
Ên
Wir zeigen, dass u : Ê n
× [0, T [ → Ê mit
t t 
u(x, t) := us (x, t) ds = Γ(x − y, t − s)f (y, s) dn y ds
0 0 Ên

eine Lösung des AWP (∗) ist.


Nach den Abschätzungen in 3.2 sind die Integrale
t t ∂
t
us (x, t) ds , u (x, t) ds ,
∂t s
Δus (x, t) ds
0 0 0
414 § 16 Die Wärmeleitungsgleichung

stetig in x und t (Satz über Parameterintegrale § 8 : 1.7).


Es gilt u(x, 0) = 0, und für (x, t) ∈ Ê n
× ]0, T [ ergibt sich nach der Differen-
tiationsregel in § 6 : 3.7

∂  t ∂ t
u(x, t) = us (x, t) s=t + us (x, t) ds = f (x, t) + Δus (x, t) ds.
∂t 0
∂t 0

Aufgrund der Abschätzungen in 3.2 können wir den Satz über Parameterinte-
grale anwenden und erhalten

∂ t
u(x, t) = f (x, t) + Δ us (x, t) ds = f (x, t) + Δu(x, t) . 2
∂t 0

Die hier verwendete Methode, Lösungen von inhomogenen Differentialgleichun-


gen aus Lösungen von homogenen zu gewinnen, wird das Duhamelsche Prin-
zip genannt (Duhamel 1843).

4 Das Anfangs–Randwertproblem
4.1 Lösungsansatz durch Raum– und Zeitseparation
Wir betrachten das ARWP auf einem beschränkten Gebiet Ω ⊂ Ê n
für T > 0:

⎨ Hu = f in ΩT = Ω × ]0, T [ ,
(∗) u = 0 auf ∂Ω × [0, T [ ,

u(x, 0) = u0 (x) für x ∈ Ω

mit gegebenen Funktionen f und u0 .

Für den Fall nicht verschwindender Randwerte und für das Neumannsche Rand-
wertproblem verweisen wir auf Daurey–Lions [4] Ch. 18, § 4.2, Ladyzhens-
kaya–Solonnikov–Uraltseva [83] Ch. III, Wloka [72] § 26.

Im folgenden verwenden wir wieder die Bezeichnungen von § 14 : 6.3:


 
H = L2 (Ω) , u, v H = uv dn x , u2H = u2 dn x ,
Ω Ω
 
V = W01 (Ω) , u, v V = ∇u , ∇v dn x , u2V = ∇u2 dn x .
Ω Ω

Zur Konstruktion einer Lösung mit der Separationsnsmethode nach dem Vor-
bild § 6 : 4 verwenden wir den Entwicklungssatz in § 15 : 1.2, nach welchem das
Eigenwertproblem

−Δu = λv in Ω , v = 0 auf ∂Ω
4 Das Anfangs–Randwertproblem 415

eine Folge von (ggf. schwachen) Lösungen λi , vi besitzt mit

0 < λ1 ≤ λ2 ≤ . . . , lim λk = ∞ , vi , vk H = δik


k→∞



und jede Funktion u ∈ L2 (Ω) durch ihre Fourierreihe vi , u H vi dargestellt
i=1
werden kann.
Die Eigenwertgleichung − Δvi = λi vi lautet in schwacher Form

(a) vi , v V = λi vi , v H für alle v ∈ V ,

insbesondere gilt

(b) vi , vk V = λi δik .

Für das AWP (∗) machen wir den Lösungsansatz



(c) u(x, t) = ai (t) vi (x)
i=1

und erhalten nach formaler Rechnung (Konvergenz aller auftretenden Reihen


und − Δvi = λi vi angenommen)

∂u ∞
(x, t) = ȧi (t) vi (x) ,
∂t i=1


∞ 

Δu(x, t) = ai (t) Δvi (x) = − λi ai (t) vi (x) .
i=1 i=1

Weiter verwenden wir die Fourierentwicklungen von u0 und der mit f (t) be-
zeichneten Funktion x → f (x, t)


∞ 

u0 (x) = vi , u0 H vi (x) , f (x, t) = vi , f (t) H vi (x) .
i=1 i=1

Dann liefern die Wärmeleitungsgleichung und die Anfangsbedingung



∞ ∂
(ȧ(t) + λi ai (t)) vi (x) = ∂t
u − Δu (x, t) = f (x, t)
i=1


= vi , f (t) H vi (x) ,
i=1


∞ 

ai (0)vi (x) = u(x, 0) = u0 (x) = vi , u0 H vi (x) ,
i=1 i=1
416 § 16 Die Wärmeleitungsgleichung

woraus sich durch Koeffizientenvergleich

ȧi (t) + λi ai (t) = vi , f (t) H , ai (0) = vi , u0 H für i = 1, 2, . . .

ergibt. Diese gewöhnlichen Anfangswertprobleme besitzen die Lösungen ÜA

t
(d) ai (t) = vi , u0 H e−λi t + vi , f (s) H e−λi (t−s) ds (i = 1, 2, . . .) .
0



Die Frage ist nun, in welchem Sinne die Reihe u(x, t) = ai (t) vi (x) mit den
i=1
durch (d) bestimmten Koeffizienten ai (t) konvergiert, und in welchem Sinne die
so definierte Funktion u das ARWP löst.
Eine erste Antwort liefert der Existenzsatz 4.5, nach welchem u unter den Vor-
aussetzungen u0 ∈ L2 (Ω), f ∈ L2 (ΩT ) eine schwache Lösung in einem noch
zu präzisierenden Sinn ist. In 4.6 wird gezeigt, dass u eine klassische Lösung
ist, falls die Daten u0 , f genügend glatt sind und ihre Ableitungen
 geeignete
Randbedingungen erfüllen. Hierzu sind für die Reihe u(x, t) = ai (t) vi (x)
und ihre gliedweisen Ableitungen geeignete Majoranten aufzustellen. Diese er-
geben sich aus den Abklingbedingungen § 15 : 1.4 für die Fourierkoeffizienten
vi , u0 H und vi , f (t) H ,

4.2 Funktionenräume für Evolutionsgleichungen


Literatur: Evans [60] § 5.9, Wloka [72] §§ 24, 25.
(a) Bei den im folgenden eingeführten Funktionenräumen interpretieren wir
Funktionen u(x, t) des Ortes x ∈ Ω und der Zeit t ∈ I um in Zeitentwicklungen

t → u(t) , I → H mit u(t)(x) := u(x, t) ,

wobei H typischerweise einer der Hilberträume L2 (Ω), W01 (Ω), W01 (Ω) ∩ W2 (Ω)
ist. Der Übersichtlichkeit halber abstrahieren wir zunächst von diesen Beispielen
und betrachten H als separablen Hilbertraum mit Skalarprodukt , H . Die
Zeitentwicklungen u : I → H fassen wir als Kurven in H auf.

(b) Stetigkeit einer Kurve u : I → H bedeutet lim u(s) − u(t)H = 0 ; die-


s→t
se ist äquivalent zur Stetigkeit aller Funktionen t → v , u(t) H mit v ∈ H .
Das folgt aus der Cauchy–Schwarzschen Ungleichung und der Polarisierungs-
gleichung ÜA .

Satz 1. Für jedes kompakte Intervall I ist der Raum C0 (I, H ) aller stetigen
Kurven u : I → H ein Banachraum mit der Norm
  
uC0 (I,H ) := max u(t)H  t ∈ I .
4 Das Anfangs–Randwertproblem 417

Dies ergibt sich wie im Vollständigkeitsbeweis Bd. 1, § 21 : 5.4 für C0 (I, Ê).
(c) Eine Kurve u : I → H auf einem offenen Intervall J heißt schwach
messbar, wenn alle Funktionen t → v , u(t) H mit v ∈ H messbar sind, vgl.
§ 8 : 1.4 (b). Daraus folgt mit der Parsevalschen Gleichung § 9 : 4.4 die Messbar-
keit von t → u(t)2H und von t → u(t) , v(t) H für je zwei schwach messbare
Kurven u, v : J → H .
Der Raum L2 (J, H ) ist definiert als die Gesamtheit aller schwach messbaren
Funktionen u : J → mit Ê

uL2 (J,H ) := u(t)2H dt < ∞ ,
J

wobei alle Kurven u, v mit u(t) − v(t)2H dt = 0 zu identifizieren sind, vgl.
J
§ 8 : 2.1.

Satz 2. (i) L2 (J, H ) ist ein Hilbertraum mit dem Skalarprodukt



u, v L2 (J,H ) := u(t) , v(t) H dt .
J

(ii) Für J = [0, T ] ist L2 (J, L2 (Ω)) isomorph zu L2 (ΩT ).


Den Beweis finden Sie in Wloka [72] § 24.1. Die Aussage (ii) basiert auf den
Sätzen von Fubini und Tonelli und der Gleichung
 T  
u(x, t)2 dn x dt = u(x, t)2 dn x dt = u2L2 (J,L2 (Ω)) .
ΩT 0 Ω

(d) Eine Kurve u ∈ L2 (J, H ) auf einem offenen Intervall J heißt schwach
differenzierbar mit schwacher Ableitung w = u̇ ∈ L2 (J, H ), wenn für jedes
v ∈ H die Funktion t → v , u(t) H schwach differenzierbar ist, d.h.
 
v , w(t) H ϕ(t) dt = − v , u(t) H ϕ̇(t) dt
J J

für alle ϕ ∈ C∞ c (J). Nach dem verallgemeinerten Hauptsatz § 14 : 6.4 bedeutet


dies für alle v ∈ H die Absolutstetigkeit von t → v , u(t) H und

t
v , u(t) H − v , u(t0 ) H = v , w(s) H ds für t0 , t ∈ J .
t0

Eine Kurve uj ∈ L2 (J, H ) heißt j–te schwache Ableitung von u ∈ L2 (J, H ),


wenn
 
v , uj (t) H ϕ(t) dt = (−1)j v , u(t) H ϕ(j) (t) dt
J J
418 § 16 Die Wärmeleitungsgleichung

für alle v ∈ H und alle ϕ ∈ C∞ j j


c (J). Wir bezeichnen uj mit d u/dt . Existiert
die zweite schwache Ableitung ü = d2 u/dt2 ∈ L2 (J, H ), so gehört nach § 14 : 6.4
die Funktion t → v , u(t) H für jedes v ∈ H zu C1 (J).

(e) Für k = 1, 2, . . . ist der Sobolew–Raum Wk (J, H ) definiert als die Menge
aller u ∈ L2 (J, H ), die schwachen Ableitungen dj u/dtj ∈ L2 (J, H ) für j ≤ k
besitzen. Auf diesem definieren wir eine Norm durch
k  j 
  d u 2
u2Wk (J,H ) :=  j  2 .
dt L (J,H )
j=0

Satz 3. (i) Wk (J, H ) ist ein Hilbertraum.


(ii) Für J = ]0, T [ und für C1 –berandete Gebiete Ω ⊂ Ê n
gilt

Wk (J, Wk (Ω)) → Wk (ΩT ) .

Beweis siehe Wloka [72] Satz 27.8.

4.3 Eigenschaften von W10 (ΩT )


Für das mit ·, · T bezeichnete Skalarprodukt in W01 (ΩT ) gilt
 
n
u, v T = ∂i u ∂i v + ∂u ∂v
∂t ∂t
dn x dt
ΩT i=1
(1)
T 
= u(t) , v(t) V + u̇(t) , v̇(t) H dt ,
0

T T
wobei die Integrale u(t)2V dt und u̇(t)2H dt wegen der Isomorphie
0 0
L2 (ΩT ) ∼
= L2 (]0, T [ , H) konvergieren. (Bezeichnungen wie in 4.1.)
Sei v1 , v2 , . . . ein vollständiges ONS von Eigenfunktionen des Dirichletschen Ei-
genwertproblems für H = L2 (Ω) (§ 15 : 1.2), und λ1 , λ2 , . . . seien die zugehöri-
gen Eigenwerte.
Für Funktionen ϕ : Ω → Ê, ψ : J → Ê setzen wir
(ϕ ⊗ ψ)(x, t) := ϕ(x) ψ(t) für x ∈ Ω, t ∈ J.

Satz. (a) Für u ∈ W01 (ΩT ) sind die Fourierkoeffizienten ak (t) := u(t) , vk H
absolutstetig auf J = ]0, T [. Ferner besitzen diese die schwachen Ableitungen
ȧk (t) = u̇(t) , vk H und lassen sich stetig auf I = [0, T ] fortsetzen. Es gilt

t
ak (t) = ak (0) + u̇(s) , vk H ds für t ∈ I und k ∈ ,
0
4 Das Anfangs–Randwertproblem 419


∞ ∞ 
 T
u(t)2V = λk ak (t)2 , u2T = λk ak (t)2 + ȧk (t)2 dt .
k=1 k=1 0

(b) Der von den Produkten ϕ ⊗ ψ mit ϕ ∈ C∞ ∞


c (Ω), ψ ∈ Cc (J) aufgespannte
1
Teilraum U liegt dicht in W0 (ΩT ).

Beweis.
(a) Für u ∈ W01 (ΩT ) gilt u, ∂u/∂t ∈ L2 (ΩT ) ∼
= L2 (I, H) und
 
∂Φ n ∂u
u d x dt = − Φ dn x dt
∂t ∂t
ΩT ΩT

für alle Φ ∈ C∞
c (ΩT ), insbesondere für Φ = ϕ⊗ψ mit ϕ ∈ C∞ ∞
c (Ω), ψ ∈ Cc (J)

T T
u(t) , ϕ H ψ̇(t) dt = − u̇(t) , ϕ H ψ(t) dt
0 0

wegen L2 (I, H) ∼
= L2 (ΩT ). Da C∞
c (Ω) dicht in H liegt, folgt

T T
(2) u(t) , v H ψ̇(t) dt = − u̇(t) , v H ψ(t) dt
0 0

für v ∈ V und alle ψ ∈ C∞ c (J). Nach § 14 : 6.4 (c) bedeutet das insbesondere,
dass ak (t) = u(t) , vk H absolutstetig ist und die schwache Ableitung ȧk (t) =
u̇(t) , vk H besitzt, d.h. es gilt
t
ak (t) − ak (t0 ) = ȧk (s) ds
t0

für t0 , t ∈ J. Wegen ȧk ∈ L2 (I) ⊂ L1 (I) existieren die Grenzwerte von ak (t)
für t → 0 und t → T , also gilt sogar
t
(3) ak (t) − ak (0) = ȧk (s) ds für 0 ≤ t ≤ T .
0

Nach § 15 : 1.3 bilden die wk := vk / λk ein vollständiges ONS für V . Unter
Berücksichtigung von u(t) , vk V = λk u(t) , vk H ergibt die Parsevalsche Glei-
chung daher

∞ 
∞ 

u(t)2V = u(t) , wk 2
V = λk u(t) , vk 2
H = λk ak (t)2 .
k=1 k=1 k=1

Wegen u̇(t) ∈ H gilt ferner



∞ 

u̇(t)2H = u̇(t) , vk 2
H = ȧk (t)2 ,
k=1 k=1
420 § 16 Die Wärmeleitungsgleichung

somit folgt die letzte Behauptung in (a) nach Definition von uT mit Hilfe des
Satzes von Beppo Levi.
(b) Zum Nachweis beachten wir, dass nach § 9 : 2.5 (b) ein Teilraum und sein
Abschluss dasselbe orthogonale Komplement besitzen.
Zu zeigen ist also:
u, ϕ ⊗ ψ T = 0 für alle ϕ ⊗ ψ ∈ U =⇒ u = 0.

Aus u, ϕ ⊗ ψ T = 0 für alle ϕ ⊗ ψ ∈ U folgt nach (1)



T
(4) u(t) , ϕ V ψ(t) + u̇(t) , ϕ H ψ̇ dt = 0
0

für alle ϕ ⊗ ψ ∈ U . Da aber C∞ ∞


c (Ω) und Cc (J) bezüglich der jeweiligen
Sobolew–Normen dicht in V bzw. W0 (J) liegen, folgt (4) für alle ϕ ∈ V ,
1

ψ ∈ W01 (J) ÜA .


Wir wählen ϕ := vk und ψ(t) := ψ (t) := 2
T
sin πT t . Wegen ak , ψ ∈ W01 (J)
folgt aus (4) durch partielle Integration (vgl. § 8 : 3.3)
T   π 2 T
0 = λk ak (t) ψ (t) − ak (t)ψ̈ (t) dt = λk + T
ak (t)ψ (t) dt
0 0


für  ∈ . Wegen der Vollständigkeit des ONS ψ1 , ψ2 , . . . in L2 (J) (§ 9 : 4.5
oder § 15 : 1.2) ergibt sich daraus ak = 0 f.ü., also sogar ak (t) = 0 für alle
t ∈ I, da die ak nach (a) stetig sind. Nach (a) folgt u = 0. 2

4.4 Schwache Formulierung des Anfangs–Randwertproblems


Im folgenden sei Ω ein beschränktes Gebiet, T > 0 und
H = L2 (Ω), V = W01 (Ω), I = [0, T ] , J = ]0, T [ .
Gegeben seien u0 ∈ L2 (Ω) und f ∈ L2 (ΩT ). Eine Funktion u heißt schwache
Lösung des ARWP 4.1 (∗), wenn gilt:
u ∈ L2 (I, V ) ∩ C0 (I, H),
Hu = f schwach in ΩT ,
u(0) = u0 .
Dieser Lösungsbegriff bietet sich auf natürliche Weise an. Die Bedingung u ∈
L2 (I, W01 (Ω)) sichert das Verschwinden der Randwerte von u für fast alle t ∈ I,
und die Bedingung u ∈ C0 (I, L2 (Ω)) sorgt für die stetige Annahme des An-
fangswerts in der L2 –Norm: lim u(t) − u0 H = 0.
t→0

Dass diese Bedingungen dem Problem angepasst sind, wird anschließend und in
den Beweisteilen (2),(3) des Existenz– und Eindeutigkeitssatzes 4.5 deutlich.
4 Das Anfangs–Randwertproblem 421

Für den Beweis des Existenz– und Eindeutigkeitssatzes benötigen wir äqui-
valente Varianten der schwach formulierten Wärmeleitungsgleichung:
Nach Definition in § 13 : 1.2 lautet diese in der schwachen Form
 
(I) u H ∗ Φ dn x dt = f Φ dn x dt für alle Φ ∈ C∞
c (ΩT ) ;
ΩT ΩT

dabei ist Φ → H ∗ Φ = − ∂Φ∂t


− ΔΦ der formal adjungierte Wärmeleitungs-
operator. Weil mit Φ ∈ C∞
c (Ω T ) auch ∂1 Φ, . . . , ∂n Φ Testfunktionen sind, darf
nach Definition der schwachen Ableitungen von u(t) ∈ W01 (Ω) partiell integriert
werden. Unter Verwendung des Satzes von Fubini ergibt sich

 T  
− u ΔΦ dn x dt = − u ΔΦ dn x dt
ΩT 0 Ω
(1)
T   T
= ∇u , ∇Φ dn x dt = u(t) , Φ(t) V dt .
0 Ω 0

Wählen wir Testfunktionen Φ in Produktgestalt ϕ ⊗ ψ mit ϕ ∈ C∞


c (Ω) und
ψ ∈ C∞c (J), so geht (I) über in

T 
(2) − u(t) , ϕ H ψ̇(t) + u(t) , ϕ V ψ(t) − f (t) , ϕ H ψ(t) dt = 0 .
0

Das bedeutet, dass für alle ϕ ∈ C∞


c (Ω) die gewöhnliche Differentialgleichung

d
(II) u(t) , ϕ H + u(t) , ϕ V = f (t) , ϕ H
dt

in schwacher Form auf J erfüllt ist. Da C∞ c (Ω) bezüglich der Sobolew–Norm


dicht in V = W01 (Ω) liegt, gilt (II) für alle ϕ ∈ V . Wegen der Isomorphie
L2 (ΩT ) ∼= L2 (J, L2 (Ω)) nach Satz 2 (ii) in 4.2 ist f (s) , ϕ H über ]0, T [ qua-
dratintegrierbar; ferner ist u(t) , ϕ H absolutstetig mit schwacher Ableitung
d
dt
u(t) , ϕ H = f (t) , ϕ H − u(t) , ϕ V , wie sich aus dem Beweis 4.3 (a) er-
gibt. Ebenso wie dort folgt

t t
(III) u(t) , ϕ H − u0 , ϕ H + u(s) , ϕ V ds = f (s) , ϕ H ds
0 0

für alle ϕ ∈ V und t ∈ I := [0, T ].


Aus (III) folgt mit Hilfe des Hauptsatzes die zu (II) äquivalente Gleichung (2)
und damit die Gleichung (1) für alle Testfunktionen Φ = ϕ ⊗ ψ in Produkt-
form. Da deren Aufspann nach 4.2, Satz 4 in W01 (ΩT ) dicht liegt, folgt (1) für
alle Φ ∈ C∞c (ΩT ) und damit (I) durch partielle und sukzessive Integration.
422 § 16 Die Wärmeleitungsgleichung

4.5 Existenz und Eindeutigkeit schwacher Lösungen


Wir verwenden wie in 4.4 die Abkürzungen I = [0, T ] , J = ]0, T [ , H = L2 (Ω),
V = W01 (Ω).
Satz. Das Anfangs–Randwertproblem (∗) besitzt für u0 ∈ L2 (Ω), f ∈ L2 (ΩT )
genau eine schwache Lösung u ∈ L2 (]0, T [ , W01 (Ω)) ∩ C0 ([0, T ], L2 (Ω)) .
Diese ist gegeben durch die in beiden Normen  L2 (J,V ) ,  C0 (I,H) konver-
gente Reihe


u(x, t) = ai (t) vi (x)
i=1
mit
t
ai (t) := vi , u0 H e−λi t + vi , f (s) H e−λi (t−s) ds .
0
Dabei sind λk , vk die nach § 15 : 2.1 existierenden Eigenwertpaare des Laplace–
Operators auf Ω.
Weiter gilt die Energiegleichung
t t
1
2
u(t)2H + u(s)2V ds = 1
2
u0 2H + f (s) , u(s) H ds
0 0

für alle t ∈ [0, T ].


Dass die auftretenden Integrale Sinn machen, wurde in 4.4 erörtert.
Beweis.
(1) Eindeutigkeit der Lösung. Sind u1 , u2 schwache Lösungen des ARWP, so ist
u := u1 − u2 eine schwache Lösung mit Daten f = 0 und u0 = 0:
t
u(t) , ϕ H + u(s) , ϕ V ds = 0 für t ∈ I , ϕ ∈ V
0
und u(0) = 0 (Version (III) der Wärmeleitungsgleichung in 4.4). Wir wählen
ϕ = vi und erhalten mit u(s) , vi V = λi u(s) , vi H (nach 4.1 (a))
t
u(t) , vi H + λi u(s) , vi H ds = 0 für t ∈ I , i = 1, 2, . . . .
0
Da die Integranden Ai (t) := u(t) , vi H wegen u ∈ C0 (I, H) stetig sind, folgt
Ai ∈ C1 (I) und
Ȧi (t) + λi Ai (t) = 0 , Ai (0) = u(0) , vi H = 0,
also Ai = 0 für i = 1, 2, . . . . Aus der in § 15 : 1.2 festgestellten Vollständigkeit
des ONS v1 , v2 , . . . in H ergibt sich die in H konvergente Fourierentwicklung

∞ 

u(t) = vi , u(t) H vi = Ai (t)vi = 0
i=1 i=1

für alle t ∈ I, somit u1 = u2 .


4 Das Anfangs–Randwertproblem 423

(2) Abschätzung der Koeffizienten ai (t).


Mit den Abkürzungen αi := vi , u0 H , βi (t) := vi , f (t) H gilt

t
ai (t) = αi e−λi t + βi (s) e−λi (t−s) ds (i = 1, 2, . . . )
0

und aufgrund der Parsevalschen Gleichung




u0 2H = α2i ,
i=1


f (t)2H = βi (t)2 ,
i=1
T T 
∞ ∞ 
 T
f 2L2 (I,H) = f (t)2H dt = βi (t)2 dt = βi (t)2 dt ,
0 0 i=1 i=1 0

letzteres nach dem Satz von Beppo Levi.


Mit der Cauchy–Schwarzschen Ungleichung ergibt sich die Abschätzung

 2  t 2
ai (t)2 ≤ 2 αi e−λi t + 2 βi (s) e−λi (t−s) ds
0

t t
≤ 2α2i e−2λi t + 2 βi (s)2 ds · e−2λi (t−σ) dσ
0 0

T 1 − e−2λi t
≤ 2α2i e−2λi t + 2 βi (s)2 ds .
0
2λi

Durch Integration folgt

T 1 − e−2λi T T T
αi (t)2 dt ≤ 2α2i + βi (s)2 ds
0
2λi λi 0
1  2 T
≤ αi + T βi (s)2 ds .
λi 0

Hiermit erhalten wir für t ∈ I die Konvergenz der Reihen

  ∞ 
∞ ∞
1  T
1
(a) ai (t)2 ≤ 2 α2i + βi (s)2 ds = 2u0 2H + f 2L2 (I,H) ,
i=1 i=1 λ1 i=1 0 λ1


∞ T 
∞ ∞ 
 T
(b) λi ai (t)2 dt ≤ α2i + T βi (s)2 ds = u0 2H + T f 2L2 (I,H) .
i=1 0 i=1 i=1 0
424 § 16 Die Wärmeleitungsgleichung



(3) Konvergenz der Reihe ai vi in C0 (I, H) und L2 (J, V ).
i=1

k
(i) Die Partialsummen uk := ai vi bilden eine Cauchy–Folge in C0 (I, H),
i=1
denn nach der Abschätzung (2) (a) und dem Konvergenzkriterium von Cauchy
gibt es zu gegebenem ε > 0 ein nε , so dass für  > k ≥ nε
   
u (t) − uk (t)2H =  ai (t)vi H =
2
ai (t)2 ≤ ε2
i=k+1 i=k+1

für alle t ∈ I gilt und somit


  
u − uk C0 (I,H) = sup u (t) − uk (t)H  t ∈ I ≤ ε.

Die Cauchy–Folge (uk ) besitzt im Banachraum C0 (I, H) (4.2, Satz 1) einen


Grenzwert u.
(ii) Ebenso ergibt sich, dass die uk eine Cauchy–Folge in L2 (J, V ) bilden: Wegen
der Orthogonalitätsrelation 4.1 (b) und der Konvergenz der Reihe (2) (b) gibt
es zu jedem ε > 0 ein nε , so dass für  > k > nε
T T   2
u − uk 2L2 (J,V ) = u (t) − uk (t)2V dt =  ai (t)vi V dt
0 0 i=k+1

 T
= λi ai (t)2 dt ≤ ε2 .
i=k+1 0

Die Cauchy–Folge (uk ) besitzt im Hilbertraum L2 (J, V ) (4.2, Satz 2) einen


Grenzwert v.
(iii) Die beiden Grenzwerte stimmen überein, denn wegen der Poincaré–Unglei-
chung wH ≤ c(Ω)wV für w ∈ V = W01 (Ω) (§ 14 : 6.2) gilt ÜA

u − vL2 (J,H) ≤ u − uk L2 (J,H) + v − uk L2 (J,H)



≤ T u − uk C0 (I,H) + c(Ω)v − uk L2 (J,V ) → 0

für k → ∞, somit ist u = v in den nach 4.2, Satz 2 isomorphen Hilberträumen


L2 (J, H), L2 (ΩT ) und damit u = v f.ü. in ΩT .


(4) u := ai vi ist eine schwache Lösung des ARWP (∗). Für
i=1
 t 
ai (t) = e−λi t vi , u0 H + vi , f (s) H eλi s ds
0

gilt nach § 8 : 3.2 bzw. § 14 : 6.4 (c) die DG

ȧ(t) + λi ai (t) = vi , f (t) H


4 Das Anfangs–Randwertproblem 425

in schwacher Form (und fast überall). Äquivalent hierzu ist nach den in 4.4
gemachten Schlüssen
t t
ai (t) − ai (0) + λi ai (s) ds = vi , f (s) H ds .
0 0

Für die Partialsummen der Fourierreihen



k 
k
uk (t) := aj (t)vj , fk (t) := vj , f (t) H vj
j=1 j=1

und für i ≤ k folgt wegen vi , uk (t) H = ai (t), vi , fk (t) H = vi , f (t) H


und wegen vi , vj V = λi δij
vi , u̇k (t) H + vi , uk (t) V = vi , fk (t) H

im Sinne von
t t
vi , uk (t) H − vi , uk (0) H + vi , uk (s) V ds = vi , fk (s) H ds .
0 0

Der Grenzübergang k → ∞ ergibt


t t
(III ) vi , u(t) H − vi , u(0) H + vi , u(s) V ds = vi , f (s) H ds
0 0

für i = 1, 2, . . . , denn es gilt fk → f in L2 (J, H), uk (t) → u(t) in H und


uk → u in L2 (]0, t[ , V ).
Aus (III ) folgt die Wärmeleitungsgleichung in der schwachen Version 4.4 (III),
denn Span {v1 , v2 , . . .} liegt nach § 15 : 1.3 auch in V dicht.

(5) Energiegleichung. Aus der in (4) aufgestellten schwachen DG


vi , u̇k (s) H + vi , uk (s) V = vi , fk (s) H

folgt
uk (s) , u̇k (s) H + uk (s) , uk (s) V = uk (s) , fk (s) H ;

k
dabei ist uk (s) , uk (s) H = ai (s)2 absolutstetig und damit Integral seiner
i=1

k
Ableitung 2ai (s)ȧi (s) = 2 uk (s) , u̇k (s) H. Somit gilt
i=1

1 1 t t
uk (t)2H − uk (0)2H + uk (s)2V ds = uk (s) , fk (s) H .
2 2 0 0

Die Energiegleichung ergibt sich durch Grenzübergang k → ∞ mit denselben


Schlüssen wie oben. 2
426 § 16 Die Wärmeleitungsgleichung

4.6 Regularität schwacher Lösungen


Wir beschränken uns auf die homogene Wärmeleitungsgleichung. Für die inho-
mogene lassen sich mit Hilfe des Duhamelschen Prinzips entsprechende Aussa-
gen formulieren, siehe Wloka [72] § 27, § 28.

Satz. Sei Ω ⊂ Ê n
ein beschränktes, C∞ –berandetes Gebiet. Weiter sei u die

k
schwache Lösung des homogenen ARWP (∗) und uk := ai vi seien die zu-
i=1
gehörigen Partialsummen. Dann gilt:
(a) Für u0 ∈ L2 (Ω) ist u ∈ C∞ (Ω × ]0, ∞[), und es gilt

uk → u in Cs (Ω × [τ, T ]) für k → ∞

und alle s, τ, T mit s = 1, 2, . . . und 0 < τ < T .


Insbesondere ist u eine klassische Lösung der Wärmeleitungsgleichung Hu = 0
in Ω × ]0, ∞[.

(b) Für u0 ∈ Cp (Ω) mit u0 = Δu0 = . . . = Δq u0 = 0 auf ∂Ω, q := [(p − 1)/2],


Ê
p > n/2 ist u stetig auf Ω × + , und es gilt

uk → u in C0 (Ω × [0, T ]) für k → ∞

und jedes T > 0.

Beweis.
Nach 4.5 gilt ai (t) = αi e−λi t mit αi = vi , u0 H.
(a) Es sei 0 < τ < T , j, r = 0, 1, . . . und j ≤ r. Für die j–te Ableitung
αi (t) = αi (−λi )j e−λi t von ai (t) gilt
(j)


∞ T (j) 

e−2λi τ − e−2λi T
λri αi (t)2 dt = λr+2j
i α2i
i=1 τ i=1 2λi
1 

≤ 2 λr+2j−1
i α2i e−2λi τ .
i=1
n/2
Aufgrund des asymptotischen Verteilungsgesetzes § 15 : 2.4 λk /k → const für
k → ∞ ist (λsk e−2λk τ )k∈ für jedes s ∈ Ê
eine Nullfolge und ist deshalb durch
eine Schranke c = c(s, τ ) > 0 beschränkt. Hiermit folgt weiter

∞ T (j) c ∞
c
λri (αi )2 (t) dt ≤ α2i = u0 2H .
i=1 τ
2 i=1 2
Wie in 4.5, Beweisteil (3) ergibt sich mit dieser Majorante die Konvergenz der
Partialsummen dj uk /dtj für k → ∞ im Hilbertraum L2 (]τ, T [ , D(Ar/2 ))
gegen ein Element wj .
4 Das Anfangs–Randwertproblem 427

Diese Konvergenz besteht auch in L2 (]τ, T [ , Wr (Ω)), weil nach dem Äquiva-
lenzsatz in § 15 : 1.4 (d) die Norm  Ar/2 äquivalent zu der Wr –Norm  r ist.
Weiter ist wj die schwache Ableitung dj u/dtj ÜA für j = 0, 1, . . . , r. Damit
gilt
uk → u in Wr (]τ, T [ , Wr (Ω)) für k → ∞ .
Nach Satz 3 (i) in 4.2 (e) und dem Einbettungssatz von Morrey § 14 : 6.4 (d)
existieren für r > s + (n + 1)/2 die stetigen Einbettungen

Wr (]τ, T [ , Wr (Ω)) → Wr (Ω × ]τ, T [), → Cs (Ω × [τ, T ]) .

Somit ergibt sich


uk → u in Cs (Ω × [τ, T ]) für k → ∞
und alle s, τ, T mit s = 1, 2, . . . und 0 < τ < T .

(b) Aufgrund des Entwicklungssatzes II § 15 : 1.4 (e) gehört u0 ∈ Cp (Ω) mit


den vorausgesetzten Randbedingungen zum Hilbertraum D(Ap/2 ), also gilt

∞ 
∞ 

λpi ai (t)2 ≤ λpi α2i = λpi vi , u0 2
H = u0 2Ap/2
i=1 i=1 i=1

für jedes t ≥ 0. Wie in 4.5, Beweisteil (3) ergibt sich mit dieser Majoran-
te die Konvergenz der Partialsummen uk → u für k → ∞ im Banachraum
C0 ([0, T ], D(Ap/2 )) für jedes T > 0.
Diese Konvergenz besteht auch in C0 ([0, T ], Wp (Ω)) wegen der Äquivalenz der
Normen  · Ap/2 und  · p . Für p > n/2 existieren nach dem Morreyschen
Einbettungssatz § 14 : 6.4 (d) und nach 4.2 (a) die stetigen Einbettungen

C0 ([0, T ], Wp (Ω)) → C0 ([0, T ], C0 (Ω)) → C0 (Ω × [0, T ]) ,

somit folgt
uk → u in C0 (Ω × [0, T ]) für k → ∞
und jedes T > 0. 2

Um differenzierbare Annäherung u(t) → u0 für t → 0 der schwachen Lösung


an die Anfangswerte zu erzielen, müssen wir an u0 stärkere Bedingungen stellen:

Ê
Satz. Sei Ω ⊂ n ein beschränktes Cp –berandetes Gebiet, und u0 ∈ Cp (Ω)
erfülle u0 = Δu0 = . . . = Δq u0 = 0 auf ∂Ω mit q := [(p − 1)/2]. Unter der
Bedingung (p − 1)/3 > s + (n + 1)/2 gilt dann u ∈ Cs (Ω × + ) und Ê
uk → u in Cs (Ω × [0, T ]) für k → ∞ und jedes T > 0 .

Der Beweis des Satzes ergibt sich mit ähnlichen Argumenten wie im vorange-
henden Beweis.
428 § 16 Die Wärmeleitungsgleichung

4.7 Wärmeleitungsproblem bei vorgegebener Randtemperatur


(a) Wir betrachten für ein beschränktes Gebiet Ω ⊂ Ê n
das Problem


⎨ Hu = 0 in Ω × Ê >0 ,

(1) u(x, t) = g(x) für x ∈ ∂Ω und t > 0 ,




u(x, 0) = u0 (x) für x ∈ Ω .
Hierfür machen wir den Lösungsansatz u = v + w , wobei v ∈ C0 (Ω × Ê +) ∩
Ê
C2,1 (Ω × >0 ) eine Lösung des homogenen ARWP
(
(2)
Hv = 0 in Ω × Ê >0 ,
v(x, 0) = u0 (x) für x ∈ Ω
ist und w ∈ C0 (Ω) ∩ C2 (Ω) eine Lösung des Dirichlet–Problems
(3) Δw = 0 in Ω , w = g auf ∂Ω .

Sind beide Probleme lösbar, so liefert u = v + w eine und nach 2.2 die eindeutig
bestimmte Lösung von (∗).
(b) Es gilt dann lim u(t) − wH = 0 , d.h. für t → ∞ geht die Lösung von (1)
t→∞
über in die Lösung des stationären Wärmeleitungsproblems (3), vgl. § 6 : 5.1.
Denn für die Fourierkoeffizienten ai (t) = vi , v(t) H gilt nach den Abschät-
zungen im Beweisteil (2) zu 4.5
ai (t)2 ≤ 2α2i e−2λi t mit αi = vi , u0 H (i = 1, 2, . . .),


somit für v = ai vi
i=1

∞ 

u(t) − w2H = v(t)2H ≤ 2 α2i e−2λi t ≤ 2 e−2λ1 t α2i = 2e−2λ1 t u0 2H .
i=1 i=1

Aufgabe. Denken Sie sich ein Ei als eine homogene Kugel vom Radius π cm.
Es wird mit einer Anfangstemperatur von 20o C in einem Topf mit siedendem
Wasser (100o C) gelegt. Wie lange dauert es, bis der Mittelpunkt eine Tempera-
tur von 50o C erreicht?
Setzen Sie in der Wärmeleitungsgleichung ∂u/∂t = k Δu eine Wärmeleitfähig-
keit von k = 6 · 10−3 cm2 /s voraus.
Hinweis. Verwenden Sie den ersten Term in der Reihendarstellung:


u(0, t) = vi , u0 H e−λi k t vi (0) ≈ v1 , u0 H e−λ1 k t v1 (0) ,
i=1

wobei gemäß § 15 : 3.6 und § 4 : 4.7 (c) v1 = u100 und λ1 = λ100 = (j1/2,1 /π)2 =
1 s−1 ist.
(Diese Aufgabe Eier Fourier“ ist dem Buch Strauss [53] p. 283 entnommen.)

429

§ 17 Die Wellengleichung
Vorkenntnisse: Die ersten drei Abschnitte verlangen keine besonderen Vorkennt-
nisse. Abschnitt 4 stützt sich im Wesentlichen auf § 14 : 6 (Sobolew–Räume),
§ 15 : 1 und § 16 : 4 (Funktionenräume für Evolutionsgleichungen).

1 Bezeichnungen, Problemstellungen
(a) Der Operator der Wellenausbreitung

¡ =
∂2
∂t2
− c2 Δ (c > 0 eine Konstante).

wird d’Alembert–Operator genannt.


Ê Ê Ê
Für (x0 , t0 ) ∈ n × = n+1 definieren wir die Kegel bzw. Kegelränder mit
Ê Ê Ê
Spitze (x0 , t0 ) ∈ n × = n+1

K± (x0 , t0 ) = K±
n+1
(x0 , t0 )
 
:= (x, t) ∈ Ê n+1
| x − x0  < c |t − tf 0|, t ≷ t0 ,

C± (x0 , t0 ) = C±
n+1
(x0 , t0 )
 
:= (x, t) ∈ Ê n+1
| x − x0  = c |t − t0 |, t ≷ t0 .

Für die Punkte des Raum–Zeit–Kontinuums n+1 = n × Ê Ê


schreiben wir Ê
mitunter auch x = (x1 , . . . , xn+1 ) mit xn+1 = t und bezeichnen den Raum–
Zeit–Gradienten und die Raum–Zeit–Divergenz entsprechend mit
∇u := (∂1 u, . . . , ∂n+1 u) ,

n+1
div v := ∂i vi .
i=1

Des Weiteren verwenden wir wie in § 16 : 1 für ein Gebiet Ω ⊂ Ê n


und für
T > 0 die Bezeichnungen
 
ΩT := Ω × ]0, T [ , ∂  ΩT := Ω × {0} ∪ ∂Ω × [0, T [ .

(b) Wir betrachten die folgenden Problemstellungen:


(i) Das Anfangswertproblem (Cauchy–Problem, AWP):

¡u = f in Ê n
× ]0, T [ ,

u(x, 0) = u0 (x), ∂u
∂t
(x, 0) = u1 (x) für x ∈ Ê n

mit gegebenen Funktionen f, u0 , u1 ,


430 § 17 Die Wellengleichung

(ii) das Anfangs–Randwertproblem (ARWP) auf einem beschränkten Ge-


Ê
biet Ω ⊂ n :

¡u = f in ΩT ,
u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) , ∂u
∂t
(x, 0) = u1 (x) für x ∈ Ω

mit gegebenen Funktionen f, g, u0 , u1 .

(c) Gleichmäßig hyperbolische Operatoren haben die Gestalt

∂2
− L,
∂t2

wobei L ein gleichmäßig elliptischer Operator ist, vgl. § 14 : 1 (b).


Für Operatoren dieses Typs lassen sich die für die Wellengleichung gewonnenen
Resultate mit geringfügigen Modifikationen übertragen. Eine Ausnahme macht
die Methode der sphärischen Mittel in Abschnitt 3, welche wesentlich auf der
Invarianz des Laplace–Operators unter räumlichen Drehungen beruht. Für el-
liptische Operatoren mit variablen Koeffizienten gibt es eine solche Symmetrie
im allgemeinen nicht.

Als Literatur empfehlen wir : Courant–Hilbert [3], Kap.6, Dautray–Lions


[4, 5], Ladyzhenskaya [65] Ch. IV, Sogge [100], Wloka [72] § 29–34.

2 Eigenschaften des d’Alembert–Operators


2.1 Invarianz unter Zeitspiegelungen
Der d’Alembert–Operator ist unter Zeitspiegelungen t → t∗ − t (t∗ ∈ ) in- Ê
¡
variant: Ist u eine Lösung der Wellengleichung u = f , so ist u∗ eine Lösung
¡
von u∗ = f∗ ; dabei haben wir

u∗ (x, t) := u(x, t∗ − t) , f∗ (x, t) := f (x, t∗ − t)

gesetzt.

2.2 Energiegleichung und Eindeutigkeit von Lösungen


(a) Wir nennen ein Gebiet U im Raum–Zeit–Kontinuum n × Ê Ê
raumar-
tig, wenn für je zwei Zeitpunkte σ < τ die Teilmenge U ∩ {σ < t < τ } ein
Gaußsches Gebiet (allgemeiner ein Normalgebiet) ist und wenn für das äußere
Einheitsnormalenfeld ν = (ν1 , . . . , νn+1 ) von U
2 Eigenschaften des d’Alembert–Operators 431


n
2
νn+1 − c2 νi2 ≤ 0
i=1

gilt, siehe die Figur auf der nächsten Seite. Beispiele für raumartige Gebiete
sind:
(i) Raum–Zeit–Zylinder Ω × Ê mit einem Normalgebiet Ω ⊂ Ê , n

(ii) die Kegel K (x , t ), K (x , t ) für (x , t ) ∈ Ê


+ 0 0 − 0 ÜA .
0 0 0
n+1

(b) Für raumartige Gebiete U ⊂ Ê und Lösungen u ∈ C (U) ∩ C (U) der


n+1 1 2

Wellengleichung ¡ u = f in U definieren wir die Energie von u in U zur Zeit


t durch
  2 
1 ∂u
E(t) = E U (t) := + c2 ∇u2 (x, t) dn x ,
2 ∂t
U(t)

wobei U(t) := {x ∈ Ê n
| (x, t) ∈ U}. Im Fall U = Ω × Ê schreiben wir EΩ (t)
statt EU (t).

Energiegleichung. Sei σ < τ und U(t) = ∅ für alle t ∈ ]σ, τ [ . Dann gilt
 
∂u n
E(τ ) = E(σ) − v , ν do + f d x dt ;
∂t
τU
∂σ Uτ
σ

dabei ist v = (v1 , . . . , vn+1 ),


 2 
∂u ∂u 1 ∂u
vi := − c2 (i = 1, . . . , n), vn+1 := + c2 ∇u2 ,
∂t ∂xi 2 ∂t
7
U τσ := U ∩ ]σ, τ [ = U(t) , ∂στ U := ∂U ∩ ]σ, τ [ ,
σ<t<τ

ν = (ν1 , . . . , νn+1 ) das äußere Einheitsnormalenfeld von U.

Beweis.
Es besteht die Identität
 
∂u ∂2u ∂u
f = − c2 Δu
∂t ∂t2 ∂t
 2   0 1
1 ∂ ∂u ∂u ∂u
= − c2 div ∇u + c2 ∇ , ∇u
2 ∂t ∂t ∂t ∂t
 2  
1 ∂ ∂u ∂u 1 2 ∂
= − c2 div ∇u + c ∇u2
2 ∂t ∂t ∂t 2 ∂t

n+1
= ∂i vi = div v .
i=1
432 § 17 Die Wellengleichung

Das Normalgebiet Uτσ ⊂ n+1 besitzt Ê t


den Rand ∂Uτσ = U(σ) ∪ U(τ ) ∪ ∂στ U,
U(τ )
und für das äußere Einheitsnormalen-
feld ν von Uτσ gilt τ
ν = − en+1 auf U(σ) ,
∂στ U
ν = en+1 auf U(τ ) . U τσ

Mit dem Gaußschen Integralsatz ergibt


sich damit σ
 
f ∂u
∂t
dn+1 x = div v dn+1 x U(σ)

σ Uτ
σ
 x
= v , ν do
∂U τ
σ
  
= v , ν do + v , ν do + v , ν do
U(σ) U(τ ) τU
∂σ
  
= − vn+1 do + vn+1 do + v , ν do
U(σ) U(τ ) τU
∂σ

= − E(σ) + E(τ ) + v , ν do . 2
τU
∂σ

Die Energiegleichung hat wichtige Konsequenzen:

Ê
(c) Energieerhaltungssatz. Sei Ω ⊂ n ein Normalgebiet, T > 0, ν das
äußere Einheitsnormalenfeld von ΩT und u ∈ C1 (ΩT ∪ ∂  ΩT ) ∩ C2 (ΩT ) eine
Lösung der homogenen Wellengleichung u = 0 in ΩT mit 
u = 0 oder ∂ ν u = 0 auf ∂Ω × ]0, T [ .

Dann ist die Energie EΩ (t) von u konstant für t ∈ [0, T [.

Beweis.
Für das äußere Einheitsnormalenfeld ν = (ν1 , . . . , νn+1 ) von Ω × ]0, T [ gilt
νn+1 = 0 auf ∂Ω × ]0, T [ , also folgt mit den eben verwendeten Bezeichnungen

∂u  ∂u
n
∂u
v, ν = − c2 νi = − c2 ∂ν u = 0 auf ∂Ω × ]0, T [
∂t ∂xi ∂t
i=1

für beide Randbedingungen. Mit f = 0 liefert die Energiegleichung die Behaup-


tung EΩ (t) = EΩ (0) für t ∈ ]0, T [. 2

Als unmittelbare Folgerung ergibt sich der


2 Eigenschaften des d’Alembert–Operators 433

(d) Eindeutigkeitssatz für das ARWP. Seien Ω, T , ν wie im vorigen Satz.


Dann besitzt das Anfangs–Randwertproblem
¡u = f in ΩT ,
u = g oder ∂ ν u = g auf ∂Ω × ]0, T [ ,
u(x, 0) = u0 (x) , ∂
∂t
u(x, 0) = u1 (x) für x ∈ Ω
höchstens eine Lösung u ∈ C (ΩT ∪ ∂  ΩT ) ∩ C2 (ΩT ).
1

(e) Eine Hyperfläche M ⊂ Ê n+1


heißt charakteristisch, wenn

n
2
νn+1 − c 2
νi2 = 0
i=1
für ein (und damit jedes) Normalenfeld ν = (ν1 , . . . , νn+1 ) von M gilt.

Ist M als Nullstellenmenge einer C∞ –Funktion Φ mit ∇Φ = 0 gegeben, so heißt



n
(∂n+1 Φ)2 − c2 (∂i Φ)2 = 0 die charakteristische Differentialgleichung.
i=1

Die Kegelflächen C+ (x0 , t0 ), C− (x0 , t0 ) (vgl. 1 (a)) sind charakteristisch ÜA .

Wie sich charakteristische Flächen allgemein erzeugen lassen, zeigt die ÜA am
Ende dieses Abschnitts für den Spezialfall n = 2.

Eine weitere wichtige Folgerung aus der Energiegleichung ist die

Ê
Monotonie der Energie. Sei Ω ⊂ n ein Gebiet, u ∈ C1 (Ω×[0, T [)∩C2 (ΩT )
eine Lösung der homogenen Wellengleichung in ΩT , U ⊂ n+1 ein raumartiges Ê
Gebiet mit charakteristischer Randfläche ∂U und äußerem Einheitsnormalen-
feld ν = (ν1 , . . . , νn+1 ). Dann gilt für alle σ < τ mit U τσ ⊂ Ω × [0, T [
EU (σ)  EU (τ ) , falls νn+1  0 .

Über die Werte von u auf ∂U wird hierbei nichts vorausgesetzt!

Beweis. Auf der charakteristischen Hyperfläche ∂στ U gilt |νn+1 | = c ν mit
ν := (ν1 , . . . , νn ). Im Fall νn+1 > 0 folgt mit der Cauchy–Schwarzschen Un-
gleichung

n
v, ν = vi νi + vn+1 νn+1
i=1

n  
2
= − c2 ∂u
∂t
∂u
∂xi
νi + 1
2

∂t
u + c2 ∇u2 νn+1
i=1  
∂u 2
= − c2 ∂u
∂t
∇u , ν + 1
2 ∂t
+ c2 ∇u2 νn+1
   
≥ − c2  ∂u
∂t
 ∇u ν + 1
2
∂u 2
∂t
+ c2 ∇u2 νn+1
   
= − c  ∂u  ∇u νn+1 + 2
∂t
1
2
∂u
∂t
+ c2 ∇u2 νn+1 ≥ 0 ,
434 § 17 Die Wellengleichung

also nach der Energiegleichung



E(σ) − E(τ ) = v , ν do ≥ 0 .
τU
∂σ

Im Fall νn+1 ≤ 0 schließen wir analog oder wenden auf die eben abgeleitete
Ungleichung die Zeitspiegelung t → −t an ÜA . 2

ÜA Ist s → ϕ(s) = (ϕ1 (s), ϕ2 (s)) eine ebene, durch die Bogenlänge parame-
trisierte C2 –Kurve mit dem Normalenfeld N(s) = (ϕ̇2 (s), −ϕ̇1 (s)), so sind die
Ê
Flächen M± ⊂ 3 , parametrisiert durch
⎛ ⎞ ⎛ ⎞
ϕ1 (s) N1 (s)
(s, t) → Φ± (s, t) = ⎝ϕ2 (s)⎠ ± ct ⎝N2 (s)⎠ ,
t 0

charakteristisch (vgl. die Figur in 2.5).


Hinweis: Verwenden Sie ϕ̇21 + ϕ̇22 = 1 =⇒ ϕ̇1 ϕ̈1 + ϕ̇2 ϕ̈2 = 0 =⇒ ϕ̈21 + ϕ̈22 =
(ϕ̇21 + ϕ̇22 )(ϕ̈21 + ϕ̈22 ) = (ϕ̇1 ϕ̈2 − ϕ̇2 ϕ̈1 )2 .

2.3 Das schwache Huygenssche Prinzip


(a) Das Maximumprinzip ist für die Wellengleichung nicht gültig.
Beispiel. u(x, t) = sin x · sin(ct) löst
¡ u = 0 im Rechteck ΩT = ]0, π[×]0, T [
mit T = π/c. Es gilt u = 0 auf ∂ΩT , t
aber u(π/2, T /2) = 1.
Die folgende Aussage kann als Ersatz (x0 , t0 )
für das fehlende Maximumprinzip an-
gesehen werden:

Satz (Zaremba 1915). Ω ⊂ n sei Ê


ein Gebiet, u ∈ C1 (Ω × [0, T [) ∩ C2 (ΩT ) Ên

eine Lösung der homogenen Wellen-


gleichung in ΩT und (x0 , t0 ) ∈ ΩT eine Kct0 (x0 ) × {0}
Stelle mit Kct0 (x0 ) ⊂ Ω.
Gilt
∂u
u = 0 und = 0 auf Kct0 (x0 ) × {0} ,
∂t
so verschwindet u auf dem Kegelstück K− (x0 , t0 ) ∩ {t ≥ 0} und insbesondere
in der Kegelspitze (x0 , t0 ).
Bemerkung. Durch Zeitspiegelung t → −t ergibt sich eine entprechende Aus-
sage für negative Zeiten.
2 Eigenschaften des d’Alembert–Operators 435

Beweis.
Wir setzen U = K− (x0 , t0 ) (vgl. 1 (a)) und verwenden die Bezeichnung U(t) :=
Ê
{x ∈ n | (x, t) ∈ U} von 2.2. Der Kegel U hat − von der Kegelspitze (x0 , t0 )
abgesehen − als Rand die charakteristische Hyperfläche C− (x0 , t0 ); und für
das äußere Einheitsnormalenfeld ν gilt νn+1 = (1 + c−2 )−1/2 > 0. Daher ist
EU (τ ) ≤ EU (0) für jedes τ ∈ ]0, t0 [ nach dem Monotoniesatz in 2.2.
Nach Voraussetzung gilt u = ∂u/∂t = 0 auf U(0) = Kct0 (x0 ) × {0}, woraus
∇u = 0 und damit EU (0) = 0 folgt.
Aus EU (τ ) = 0 schließen wir ∂u/∂t = 0 auf U(τ ) für jedes
7 τ ∈ ]0, t0 [ und
erhalten ∂u/∂t = 0 im ganzen Kegelstück U ∩ {t > 0} = U(τ ). Zusam-
0<τ <t0
men mit u = 0 auf U(0) folgt hieraus durch Integration längs zur t–Achse
parallelen Segmenten in U ∩ {t ≥ 0} dann
u = 0 in U ∩ {t ≥ 0} = K− (x0 , t0 ) ∩ {t ≥ 0}. 2

Folgerung (Schwaches Huygenssches Prinzip). Ω, T , x0 , t0 seien wie im


vorhergehenden Satz. Dann hängt die Lösung der homogenen Wellengleichung
im Punkt x0 zur Zeit t0 nur von den Anfangswerten auf der Kugel Kct0 (x0 ) ab:
Gilt für Anfangswerte u0 , u1 und v0 , v1 zum Zeitpunkt 0
u0 = v0 und u1 = v1 auf Kct0 (x0 ) ,
so gilt für die zugehörigen Lösungen u und v
u(x0 , t0 ) = v(x0 , t0 ) .

(b) Aus dem Satz von Zaremba können wir folgern, dass sich Signale mit end-
licher Geschwindigkeit ausbreiten. Unter einem zur Zeit t = 0 an der Stelle
y0 ∈ Ω ausgesandten Signal verstehen wir dabei Anfangswerte u0 , u1 mit nahe
um y0 konzentrierten Trägern,

supp u0 , supp u1 ⊂ Kr (y0 ) mit r  1 .

Sei ur die zugehörige Lösung der homogenen Wellengleichung,

Tr (x0 ) := inf{ t > 0 | ur (x0 , t) = 0}

die Ankunftszeit des Signals an der Stelle x0 ∈ Ω und

T0 := sup {Tr (x0 ) | r  1} .

Wir machen plausibel, dass die Ausbreitungsgeschwindigkeit v := x0 − y0 /T0


die Konstante c in der Wellengleichung nicht übertrifft, falls y0 hinreichend nahe
bei x0 liegt.
436 § 17 Die Wellengleichung

Zum Nachweis setzen wir tr := (x0 − y0  − r)/c. Wegen x0 − y0  = r + c tr


Ê
gilt supp u0 , supp u1 ⊂ Kr (y0 ) ⊂ n \Kctr (x0 ), also ur (x0 , t) = 0 für t ∈ [0, tr ]
nach dem Satz von Zaremba. Das bedeutet tr ≤ Tr (x0 ),
x0 − y0  x0 − y0  − r
= T0 ≥ Tr (x0 ) ≥ tr = für r  1
v c
und damit v ≤ c.
Für die Präzisierung der Argumentation verweisen wir auf Dautray–Lions [4,
2] Ch. 5.§ 3 und Treves [71] Ch. II. § 14. Zur weiteren Diskussion des Huygens-
schen Prinzips siehe 3.3.

Die Bedingung Kct0 (x0 ) ⊂ Ω im Satz von Zaremba begrenzt die Anwendbarkeit
auf kleine Zeiten t0 . Für große t0 gilt folgende Erweiterung:

Ê
Satz. Seien Ω ⊂ n ein beschränktes Gebiet, u ∈ C1 (ΩT ∪ ∂  ΩT ) ∩ C2 (ΩT )
eine Lösung der homogenen Wellengleichung in ΩT und (x0 , t0 ) ∈ ΩT . Ist
U := ΩT ∩ K− (x0 , t0 ) ein Normalgebiet und gilt
∂u
u = 0 und = 0 auf (Ω ∩ Kct0 (x0 )) × {0} ,
∂t

u = 0 oder ∂ν u = 0 auf ∂Ω × ]0, T [ ∩ K− (x0 , t0 ) ,

so verschwindet u in U und insbesondere in der Kegelspitze (x0 , t0 ).

Beweis als Aufgabe unter Verwendung von Argumenten der Beweise des Ener-
gieerhaltungssatzes, der Monotonieeigenschaft in 2.2 und des Satzes von Zarem-
ba.

2.4 Ausbreitung von Singularitäten


Unter einer schwachen Stoßwelle verstehen wir eine schwache Lösung u der
Ê
homogenen Wellengleichung auf einem Gebiet U ⊂ n+1, für welche u ∈ C1 (U)
gilt und eine C∞ –Hyperfläche M ⊂ U mit folgenden Eigenschaften existiert:
(i) U \ M besteht aus zwei Gebieten U+ und U − ,
(ii) es gibt Lösungen u± ∈ C∞ (U) der homogenen Wellengleichung mit
u = u+ auf U + ∪ M , u = u− auf U − ∪ M .
Wir nennen M die Singularitätenfläche von u.
Die Bedingung der C∞ –Differenzierbarkeit von M und u± wurde der Einfach-
heit halber gestellt; sie kann abgeschwächt werden.
Ist u eine schwache Stoßwelle mit Singularitätenfläche M , so gilt für [u] :=
u+ − u− wegen u ∈ C1 (U) und (ii)
[u] = 0 , ∂i [u] = 0 (i = 1, . . . , n + 1) auf M .
2 Eigenschaften des d’Alembert–Operators 437

Die zweiten Ableitungen von u (definiert als die einseitigen Grenzwerte der
zweiten Ableitungen von u+ und u− ) können auf M Sprungstellen besitzen,
d.h. es kann ∂i ∂j [u] = 0 auf M eintreten. In diesem Fall sagen wir, u hat
schwache Singularitäten (Singularitäten zweiter Ordnung). Grundlage
einer genaueren Beschreibung dieser Singularitäten ist folgender

Hilfssatz. Beschreibt Φ ∈ C∞ (U) die Singularitätenfläche einer schwachen


Stoßwelle u als Nullstellenmenge,

M = {Φ = 0} und ∇Φ(x) = 0 für jedes x ∈ M ,

so existiert eine C∞ –Funktion σ auf U mit


1
[u] = σ Φ2 .
2
Eine Beweisskizze folgt am Ende des Abschnitts.

Aus der Darstellung von [u] durch Φ und σ folgt unmittelbar

(∗) ∂i ∂j [u] = σ ∂i Φ∂j Φ auf M = {Φ = 0} .

Wir nennen die auf die Hyperfläche M eingeschränkte Funktion σ : M → Ê


deshalb die Sprungintensität der zweiten Ableitungen von u.

Für das Folgende vereinbaren wir die Abkürzung



⎨−c2 für i = j = 1, . . . , n ,
ηij := 1 für i = j = n + 1 ,
⎩ 0 sonst.

Hiermit schreiben sich der d’Alembert–Operator und die Gleichung von charak-
teristischen Hyperflächen (siehe 2.2 (e))

 
¡u =
n+1 n+1
ηij ∂i ∂j u , ηij νi νj = 0 .
i,j=1 i,j=1

Satz. Sei u eine schwache Stoßwelle mit der durch Φ = 0 beschriebenen Sin-
gularitätenfläche M (Φ wie im Hilfssatz ). Dann gilt
(1) Ist u eine echte schwache Stoßwelle, d.h. verschwindet die Sprungintensität
σ nirgends auf M , so ist M eine charakteristische Hyperfläche.
(2) Ist M eine charakteristische Hyperfläche, so genügt die Sprungintensität
σ:M → Êder homogenen linearen Differentialgleichung erster Ordnung

n+1
ai ∂i σ + bσ = 0 auf M,
i=1
438 § 17 Die Wellengleichung


n+1
wobei a = (a1 , . . . , an+1 ) das tangentiale Vektorfeld auf M mit ai = ηij νj
j=1

und b eine C –Funktion auf M ist.
Der Beweis folgt am Ende dieses Unterabschnitts.
Dieser Satz geht auf Untersuchungen von Christoffel (1877), Hugoniot
(1887) und Hadamard (1903) zurück. Nach der ersten Aussage können sich
die Singularitäten einer schwachen Stoßwelle nur in einer bestimmten Wei-
se ausbreiten; auf die Interpretation gehen wir in 2.5 näher ein. Um die Be-
deutung der zweiten Aussage zu verstehen, betrachten wir das Verhalten der
Sprungintensität σ längs Integralkurven I → M , s → x(s) des Vektorfeldes
a (Bicharakteristiken der charakteristischen Hyperfläche M ). Die DG für σ
führt unter Beachtung von ẋi (s) = ai (x(s)) auf die gewöhnliche DG

d 
n+1 
n+1
σ(x(s)) = ∂i σ(x(s)) ẋi (s) = (ai ∂i σ)(x(s)) = − (b σ)(x(s))
ds i=1 i=1

mit der Lösung


 s
σ(x(s)) = σ(x(s0 )) exp − b(x(t)) dt für ein s0 ∈ I.
s0

Hiernach verschwindet die Sprungintensität σ längs einer Bicharakteristik der


Singularitätenfläche M entweder überall oder nirgends. Hat also eine schwa-
che Stoßwelle zu einem Zeitpunkt schwache Singularitäten (etwa vorgegeben
durch Anfangswerte), so bestehen diese für alle Zeiten. Hiermit zeigt sich ein
deutlicher Kontrast zum glättenden Verhalten der Wärmeleitungsgleichung, vgl.
§ 15 : 3.1. Eine anschaulichere Beschreibung der Ausbreitung von schwachen Sin-
gularitäten mittels Wellenfronten und Strahlen folgt in 2.5.

Beweisskizze für den Hilfssatz.


Es sei (s, ξ) → Ψ(s, ξ) der C∞ –Fluss des Vektorfeldes ∇Φ−2 ∇Φ , vgl.
§ 5 : 6.1. Für jedes ξ ∈ M gilt Φ(Ψ(0, ξ)) = Φ(ξ) = 0 und

d 
n+1
∂Ψi
Φ(Ψ(s, ξ)) = ∂i Φ(Ψ(s, ξ)) (s, ξ) = 1 ,
ds ∂s
i=1

somit erhalten wir

Φ(Ψ(s, ξ)) = s für ξ ∈ M , |s|  1 .

Für die Funktion v := [u] ◦ Ψ und jedes ξ ∈ M gilt nach Voraussetzung

∂v 
n+1
∂Ψi
v(0, ξ) = [u](ξ) = 0 , (0, ξ) = ∂i [u](ξ) (0, ξ) = 0 .
∂s ∂s
i=1
2 Eigenschaften des d’Alembert–Operators 439

Mit partieller Integration ergibt sich hieraus ÜA

 1
∂2v
v(s, ξ) = s2 (1 − τ ) (τ s, ξ) dτ .
∂s2
0

1
Definieren wir σ(x) für x = Ψ(s, ξ) durch das rechtsstehende Integral, so
2
erhalten wir eine C∞ –Funktion σ : U → mit [u] = 12 σ Φ2 . Ê 2

Beweis des Satzes.


Nach Voraussetzung erfüllen u+ und u− in U die homogene Wellengleichung,
also gilt

u u  [u] =
n+1
(∗∗) 0 = + − − = ηij ∂i ∂j [u] in U .
i,j=1

Wir setzen im folgenden νi := ∂i Φ.


(1) Aus (∗) und (∗∗) folgt

n+1 
n+1
0 = ηij ∂i ∂j [u] = σ ηij νi νj auf M ,
i,j=1 i,j=1

woraus wir mit σ = 0 auf M die Aussage (1) erhalten.


(2) Aus [u] = 21 σ Φ2 ergibt sich durch dreimaliges Ableiten und Einschränkung
auf M = {Φ = 0}
1
∂k ∂j ∂i [u] = ∂k ∂j ∂i 2
σ Φ2
= ∂ i σ νj νk + ∂ j σ νi νk + ∂ k σ νi νj

+ σ νi ∂ j ∂ k Φ + νj ∂ i ∂ k Φ + νk ∂ i ∂ j Φ .

Wir erhalten durch Ableiten der Gleichung (∗∗) in Richtung des Normalenvek-
tors ν = (ν1 , . . . , νn+1 ) = ∇Φ auf M
 
 [u] =
n+1 n+1
0 = νk ∂ k ηij νk ∂k ∂j ∂i [u]
k=1 i,j,k=1

n+1 
= ηij νk ∂i σ νj νk + ∂j σ νi νk + ∂k σ νi νj
i,j,k=1
n+1  
+σ ηij νk νi ∂j ∂k Φ + νj ∂i ∂k Φ + νk ∂i ∂j Φ .
i,j,k=1

Fassen wir im letzten Ausdruck die beiden ersten Terme zusammen, so ergibt

n+1 
n+1
sich 2ν2 ai ∂i σ mit ai = ηij νj ; der dritte Term verschwindet auf der
i=1 j=1
440 § 17 Die Wellengleichung

nach Voraussetzung charakteristischen Fläche M , der vierte und fünfte Term



n+1 
n+1
lassen sich zu νk ∂k N mit N := ηij ∂i Φ ∂j Φ zusammenfassen, und der
k=1 i,j=1
letzte Term liefert σ ν2 ¡ Φ . Setzen wir

n+1

2b := ¡ Φ + ν −2
νk ∂ k N ,
k=1

so ergibt sich die Differentialgleichung



n+1
ai ∂i σ + bσ = 0 auf M .
i=1

Das Vektorfeld a = (a1 , . . . , an+1 ) ist tangential zur Hyperfläche M wegen



n+1 
n+1
a, ν = a i νi = ηij νi νj = 0 auf M . 2
i=1 i,j=1

2.5 Wellenfronten und Strahlen


Wir zeigen jetzt, dass die Ausbreitung schwacher Singularitäten den Gesetzen
der geometrischen Optik folgt.
Nach der ersten Aussage des Satzes in 2.4 ist die Singularitätenfläche M ei-
ner echten schwachen Stoßwelle u eine charakteristische Hyperfläche. M kann
wegen |νn+1 | = c ν = 0 als Graph einer C∞ –Funktion ϕ auf einem Ge-
Ê
biet Ω ⊂ n dargestellt werden. M ist damit Nullstellenmenge der Funktion
Φ(x1 , . . . , xn+1 ) = xn+1 − ϕ(x1 , . . . , xn ), und es folgt mit den Bezeichnungen
von 2.4
 
ν = −∂1 ϕ, . . . , −∂n ϕ, 1 , a = c2 ∂1 ϕ, . . . , c2 ∂n ϕ, 1 .

Die charakteristische Differentialgleichung (siehe 2.2 (e)) erhält somit die Gestalt

c ∇ϕ = 1 ,

und die Differentialgleichung der Bicharakteristiken s → (x1 (s), . . . , xn+1 (s))


lautet mit der Abkürzung x(s) := (x1 (s), . . . , xn (s))

ẋ(s) = c2 ∇ϕ(x(s)) , ẋn+1 (s) = 1 .

Die Bicharakteristiken lassen sich also durch die Zeitkoordinate s = xn+1 = t


parametrisieren.
Wir nennen die Hyperflächen im Ê n

Mt := {x ∈ Ω | (x, t) ∈ M } = {x ∈ Ω | ϕ(x) = t} (t ∈ Ê)
2 Eigenschaften des d’Alembert–Operators 441

die Wellenfronten und die Projektio-


nen der Bicharakteristiken auf den n, Ê t

t → x(t) = (x1 (t), . . . , xn (t)),

die Strahlen von M .

Satz. Die Punkte x(t) bewegen sich


mit der Geschwindigkeit c auf Gera-
den und schneiden die Wellenfronten
senkrecht, d.h. die Wellenfronten brei- x2
ten sich mit der Geschwindigkeit c in
Richtung ihrer Normalen aus.

Bei der Ausbreitung von Singularitäten


gelten somit die Gesetze der geometri- x1
schen Optik für ein Medium mit Bre- Wellenfront
chungsindex n = 1, vgl. § 7 : 3.1. Strahl

Beweis.
ẋ(t) = c2 ∇ϕ(x(t)) ist ein Normalenvektor der Wellenfront Mt im Punkt x(t),
es gilt ẋ(t) = c2 ∇ϕ(x(t)) = c und für i = 1, . . . , n
d n
ẍi (t) = c2 (∂i ϕ(x(t))) = c2 ∂j ∂i ϕ(x(t)) ẋj (t)
dt j=1


n
= c4 ∂j ∂i ϕ(x(t)) ∂j ϕ(x(t))
j=1

1 4  n
= c ∂i (∂j ϕ)2 (x(t)) = 0 . 2
2 j=1

Für die Sprungintensität σ der schwachen Stoßwelle gilt längs jeder Bicharak-
teristik (wir schreiben jetzt σ(t) anstelle von σ(x(t))

σ̇ + 1
2
Θσ = 0 mit Θ := c2 Δϕ .

Das ergibt sich aus dem Beweisteil (2) des Satzes in 2.4 mit

n+1
N = ηij ∂i Φ∂j Φ = 1 − c2 ∇ϕ2 =, 0 ,
i,j=1

2b =  Φ = −c 2
Δϕ auf M .

Es läßt sich zeigen, dass Θ die Änderungsrate des Oberflächenelements g der
Wellenfronten unter dem Normalenfluß c2 ∇ϕ ist, d.h. dass gilt
√ √
Θ = ˙g/ g = ġ/2g .
442 § 17 Die Wellengleichung

Zusammen mit der DG


1
σ̇/σ = − 2 Θ
folgt hieraus durch Integration

σ 2 = const / g .
Die Sprungintensität ist hiernach im Wesentlichen eine geometrische Größe der
Wellenfronten.
Beispiel. Für die charakteristischen Kegel C± (x0 , t0 ) ergibt sich

σ 2 (x(t), t) = const / x(t) − x0 ±(n−1) .


auf jedem Strahl x(t) ÜA .
Literatur zu schwachen Singularitäten: Courant–Hilbert [3], Kap.6, §1, §2,
Hadamard [90] 69–123.

3 Das Anfangswertproblem
Wir betrachten in diesem Abschnitt für n = 1, 2, 3 das Anfangswertproblem

⎨ ¡u = f in Ên
× Ê,
(∗)
⎩ u(x, 0) = u0 (x) , ∂u (x, 0) = u1 (x) für x ∈ Ên .
∂t

3.1 Die homogene Wellengleichung im Ê 1

Satz (d’Alembert (1747)). (a) Jede Lösung u der eindimensionalen Wellen-


gleichung

¡u = ∂2u
∂t 2
∂2u
− c2 2 = 0
∂x
hat die Gestalt
u(x, t) = F (x + ct) + G(x − ct)
mit geeigneten Funktionen F, G ∈ C2 ( ). Ê
Die Lösung ist also die Überlagerung einer nach links und einer nach rechts
wandernden Welle, beide mit festem Profil und der Geschwindigkeit c.

Ê Ê
(b) Zu gegebenen Anfangswerten u0 ∈ C2 ( ), u1 ∈ C1 ( ) liefert die Lösungs-
formel von d’Alembert

x+ct
1 1
u(x, t) = u0 (x + ct) + u0 (x − ct) + u1 (s) ds
2 2c
x−ct

die eindeutig bestimmte Lösung des Anfangswertproblems.


3 Das Anfangswertproblem 443

Beweis.
(a) Wir führen in der Ebene charakteristische Koordinaten ξ, η ein durch
ξ = x + ct , η = x − ct , bzw. x = 12 (ξ + η) , t = 1
2c
(ξ − η) .
Dabei geht {(x, t) | x ∈ Ê, t > 0} über in das Gebiet {(ξ, η) | ξ > η} .
Ist u eine Lösung der homogenen Wellengleichung, so erfüllt
1 1
U (ξ, η) := u 2 (ξ + η), 2c (ξ − η)

die Gleichung
 
1 ∂2U ∂2u 2
2 ∂ u
− (ξ, η) = − c (x, t) = 0 .
4c2 ∂ξ ∂η ∂t2 ∂x2
Aus dieser folgt
∂U
(ξ, η) = g(η)
∂η

Ê
mit einer Funktion g ∈ C1 ( ) . Setzen wir G(η) := g(s) ds , so ergibt sich
0
∂ 
∂η
U (ξ, η) − G(η) = 0 für ξ ∈ Ê, ξ > η,

somit
U (ξ, η) − G(η) = F (ξ) für ξ ∈ Ê, ξ > η,
wobei F : Ê → Ê eine C –Funktion ist. Damit erhalten wir für x ∈ Ê, t > 0
2

u(x, t) = U (ξ, η) = F (ξ) + G(η) = F (x + ct) + G(x − ct) .


Die rechte Seite stellt eine für alle (x, t) ∈ Ê 2
definierte Lösung der Wellenglei-
chung dar.

(b) Ist u eine Lösung des Anfangswertproblems, so besteht nach (a) die Dar-
stellung u(x, t) = F (x + ct) + G(x − ct) mit F, G ∈ C2 ( ) . Bezeichnet U1 die Ê
Stammfunktion von u1 mit U1 (0) = c (F (0) − G(0)) , so gilt
u0 (x) = u(x, 0) = F (x) + G(x) ,

U1 (x) = u1 (x) = u(x, 0) = c (F  (x) − G (x)) .
∂t
Durch Integration der zweiten Identität ergibt sich
1 1 1 1
F = 2 u0 + 2c U1 , G = 2 u0 − 2c U1 ,

woraus die d’Alembertsche Formel folgt. Dass u eine Lösung des AWP darstellt,
ist leicht nachzurechnen. 2
444 § 17 Die Wellengleichung

Aufgabe. Zeigen Sie für jede Lösung u t


der eindimensionalen homogenen Wel- P3
lengleichung die Beziehung
P2
u(P0 ) + u(P3 ) = u(P1 ) + u(P2 ) , P1

falls die vier Punkte P0 , P2 , P3 , P1 ein


P0
charakteristisches Parallelogramm bil-
den, d.h. falls folgendes gilt (Fig.): x

P0 , P2 und P1 , P3 liegen jeweils auf Geraden x − ct = const,


P0 , P1 und P2 , P3 liegen jeweils auf Geraden x + ct = const.

3.2 Sphärische Mittel


Die Lösungen der 3–dimensionalen Wellengleichung lassen sich durch Integrale
über Sphären darstellen (Euler 1766, Poisson 1808). Zum Nachweis benötigen
wir einige Eigenschaften sphärischer Integrale.
Ê
Sr (x) := ∂Kr (x) = {y ∈ 3 | y − x = r} bezeichne die r–Sphäre mit
Ê
Mittelpunkt x ∈ 3 und Radius r > 0 . Das sphärische Mittel einer im 3 Ê
Ê
stetigen Funktion u ist für x ∈ 3 , r > 0 definiert durch
 
1
m(x, r) = − u do := u(y) do(y) .
4πr 2
Sr (x) S r (x )

Durch Anwendung des Transformationssatzes für Integrale mit der Substitution


S1 (0) → Sr (x) , ξ → x + rξ ergibt sich

1
m(x, r) = u(x + rξ) do(ξ) .

S1 (0)

Diese Darstellung zeigt, dass r → m(x, r) für jedes x zu einer stetigen, in r


geraden Funktion auf Ê
fortsetzbar ist.

Eigenschaften des sphärischen Mittels


(a) m(x, 0) = u(x).
(b) Ist u Cs –differenzierbar, so auch (x, r) → m(x, r), und ∂m/∂xi ist das
sphärische Mittel von ∂u/∂xi .
(c) Hängt u Cs –differenzierbar von einem Parameter t ab, so auch das sphä-
rische Mittel, und ∂m/∂t ist das sphärische Mittel von ∂u/∂t .

(d)
∂m
∂r
(x, r) =
1
2
4πr Kr (x)
Δu(y) d3 y gilt für u ∈ C2 ( Ê ) und r > 0 .
n
3 Das Anfangswertproblem 445

(e)
∂2m
∂r 2
(x, r) +
2 ∂m
r ∂r
(x, r) = Δx m(x, r) gilt für u ∈ C2 ( Ên
) und r = 0.

(Darboux–Gleichung).

Beweis.
Wir verwenden die zweite Darstellung des sphärischen Mittels.
(a) ist unmittelbar klar.
(b) und (c) ergeben sich aus dem Satz über die differenzierbare Abhängigkeit
von Parameterintegralen , vgl. Bd. 1, § 23 : 5.1.
(d) Für y = x + rξ ∈ Sr (x) mit ξ ∈ S1 (0) ist n(y) = ξ der äussere Einheits-
normalenvektor von Kr (x) in y. Hieraus folgt zusammen mit dem Gaußschen
Integralsatz
∂m 1 ∂  1  ∂
(x, r) = u(x + rξ) do(ξ) = ∂r
u(x + rξ) do(ξ)
∂r 4π ∂r S (0) 4π S (0)
1 1

1 
= ∇u(x + rξ) , ξ do(ξ)
4π S (0)
1
1 
= ∇u(y) , n(y) do(y)
4πr 2 Sr (x)
1  1 
= 2
∂n u do = 2
Δu(y) d3 y .
4πr Sr (x) 4πr Kr (x)

(e) Aus (d) folgt durch zwiebelweise Integration (Bd. 1, § 25 : 3.2)


   
∂2m 2 ∂m 1 ∂ ∂m
+ (x, r) = 2 r2 (x, r)
∂r 2 r ∂r r ∂r ∂r
1 ∂ 
= 2
Δu(y) d3 y
4πr ∂r Kr (x)

1 ∂ r  
= 2
Δu do d
4πr ∂r 0 S (x)

1 
= 2
Δu do = Δx m(x, r) . 2
4πr Sr (x)

3.3 Die homogene Wellengleichung im Ê 3

Sei u eine Lösung des Anfangswerproblems für die dreidimensionale homoge-


ne Wellengleichung. Nach den Rechenregeln 3.2 (b),(c),(e) erfüllt das sphärische
Mittel m(x, r, t) von x → u(x, t) (t als Parameter aufgefaßt) die Differential-
gleichung von Euler–Poisson–Darboux
446 § 17 Die Wellengleichung

 
1 ∂2m 1 ∂2u
2 2
(x, r, t) = 2 − (y, t) do(y) = − Δu(y, t) do(y)
c ∂t c ∂t2
S r (x ) S r (x )
 2

∂ m 2 ∂m 1 ∂2
= 2
+ (x, r, t) = (r m) (x, r, t)
∂r r ∂r r ∂r 2

Ê
für x ∈ 3 , r > 0 , t > 0 . Setzen wir M (x, r, t) := r · m(x, r, t) , so erfüllt
Ê
(r, t) → M (x, r, t) für jedes x ∈ 3 die 1–dimensionale Wellengleichung

∂2M ∂2M
(x, r, t) = c2 (x, r, t)
∂t2 ∂r 2
und genügt den Anfangsbedingungen

M (x, r, 0) = r − u0 (y) do(y) =: M0 (x, r) ,
S r (x )
∂M 
(x, r, 0) = r − u1 (y) do(y) =: M1 (x, r) .
∂t S r (x )

Die Anwendung der d’Alembertschen Darstellungsformel 3.1 (b) auf die Funk-
tion (r, t) → M (x, r, t) (x festgehalten) ergibt daher
1 1 
r+ct
(+) M (x, r, t) = (M0 (x, r + ct) + M0 (x, r − ct)) + M1 (x, s) ds
2 2c r−ct

für x ∈ Ê 3
, r∈ Ê, t ≥ 0 .
Hieraus läßt sich eine Darstellung der Lösung u durch die Mittel der Anfangs-
werte ableiten:
Zunächst ist nach 3.2 (a)
1
u(x, t) = m(x, 0, t) = lim m(x, r, t) = lim M (x, r, t) .
r→0 r→0 r
Weil M0 (x, r) und M1 (x, r) ungerade in r sind, gilt

r−ct
M0 (x, r − ct) = − M0 (x, ct − r) , M1 (x, s) ds = 0 .
ct−r

Hieraus folgt einerseits


1  1 
M0 (x, r + ct) + M0 (x, r − ct) = M0 (x, r + ct) − M0 (x, ct − r)
2r 2r
1  1 
= M0 (x, r + ct) − M0 (x, ct) − M0 (x, ct − r) − M0 (x, ct)
2r 2r
∂M0 1 ∂M0
→ (x, ct) = (x, ct) für r → 0 ;
∂r c ∂t
3 Das Anfangswertproblem 447

andererseits folgt


1 r+ct 
1 r+ct 
1 r−ct
M1 (x, s) ds = M1 (x, s) ds + M1 (x, s) ds
2cr r−ct 2cr r−ct 2cr ct−r

1 r+ct 
1 r+ct 1 ct
= M1 (x, s) ds = M1 (x, s) ds + M1 (x, s) ds
2cr ct−r 2cr ct 2cr ct−r

1 r+ct 
1 ct−r
= M1 (x, s)ds − M1 (x, s) ds
2cr ct 2cr ct
1
→ M1 (x, ct) für r → 0 .
c
Aus (+) ergibt sich somit nach Ausführung des Grenzübergangs r → 0
1 ∂M0 1
u(x, t) = (x, ct) + M1 (x, ct) .
c ∂t c

Hiermit haben wir die Poissonsche Darstellungsformel erhalten:


Satz (Poisson (1818)). Jede Lösung u des Anfangswertproblems für die homo-
gene dreidimensionale Wellengleichung besitzt die Darstellung
 1   
∂ 1
u(x, t) = u0 do + u1 do
∂t 4πc2 t 4πc2 t
Sct (x) Sct (x)

1 
= u0 (y) + t u1 (y) + ∇u0 (y) , y − x do(y)
4πc2 t2
Sct (x)

für x ∈ Ê3
, t > 0 . Diese läßt sich zu einer Lösung für alle t ∈ Ê fortsetzen.
Die zweite Lösungsdarstellung ergibt t
sich aus der ersten mit Hilfe des Be-
weises 2.2 (d). Der zweiten Darstellung (x0 , t0 )
entnehmen wir, dass die Lösung u an
der Stelle (x, t) nur von den Anfangs-
werten u0 , u1 , ∇u0 auf der Sphäre x0
Sct (x) abhängt; wir nennen deshalb die Ê 3 y0
Sphäre Sct (x) das Abhängigkeitsge-
biet der Lösung an der Stelle (x, t) . Sct0 (x0 )

Aufgrund dieser Tatsache ist die Übermittlung scharfer Signale mittels der drei-
dimensionalen Wellengleichung in folgendem Sinne möglich: Eine lokale Anre-
gung des Feldes zur Zeit t = 0 an der Stelle y0 (d.h. Anfangswerte u0 , u1 , deren
Träger in einer Kugel Kr (y0 ) für r  1 liegen) pflanzt sich so fort, dass an einer
448 § 17 Die Wellengleichung

Stelle x0 = y0 zur Zeit t0 := x0 − y0 /c ein kurzes Signal empfangen wird
(d.h. für die zugehörige Lösung gilt u(x0 , t) = 0 nur für |t − t0 | ≤ r/c ) (Fig.)
ÜA . Dieses Huygenssche Prinzip für die Wellengleichung verschärft die
allgemeine Aussage von 2.3, nach welcher das Abhängigkeitsgebiet in der Kugel
Kct0 (x0 ) liegt.
Die Bezeichnung Huygenssches Prinzip“ wurde von J. Hadamard 1923 im

Zusammenhang mit der Vermutung verwendet, dass unter allen normal hyper-

bolischen“ Gleichungen im Wesentlichen nur die Wellengleichung in ungeraden
Raumdimensionen eine scharfe Signalübertragung erlaubt. Diese Vermutung er-
wies sich im Fall n = 3 als falsch, wie P. Günther 1965 zeigte (Arch. Rat. Mech.
Anal. 18 (1965) 103–106).

Die Poissonsche Darstellungsformel kann als Lösungsformel verwendet werden:


Satz. Für u0 ∈ C3 ( Ê ), u
3
1 ∈ C2 ( Ê ),
3
x∈ Ê3
und t > 0 setzen wir
 
∂  1 1
u(x, t) := u0 do + u1 do .
∂t 4πc2 t 4πc2 t
Sct (x) Sct (x)

Dann kann u zu einer Lösung des Anfangswertproblems für die homogene Wel-
lengleichung auf 3 ×Ê Ê fortgesetzt werden und stellt die eindeutig bestimmte
Ê Ê
Lösung dar. Im Fall u0 ∈ Cm+1 ( 3 ), u1 ∈ Cm ( 3 ) mit m ≥ 2 ist die Lösung
Cm –differenzierbar.
Der Beweis ergibt sich durch direktes Nachrechnen unter Verwendung der Re-
chenregeln 3.2 für das sphärischen Mittel. Die Eindeutigkeit der Lösung folgt
aus der Poissonschen Darstellungsformel.
Die Differenzierbarkeitsbedingungen an die Anfangswerte können nicht abge-
schwächt werden. Dies zeigt Teil (c) der folgenden

Aufgabe. (a) Zeigen Sie, dass jede kugelsymmetrische Lösung der 3–dimensio-
nalen Wellengleichung u(x, t) = U (r, t) (r = x) mit den Anfangsdaten u0 = 0,
u1 (x) = U1 (r) mit einer geraden C2 –Funktion U1 ∈ C2 ( ) die DarstellungÊ

⎪ 
1 r+ct
⎨ s U1 (s)ds für r > 0,
U (r, t) := 2cr r−ct


t U1 (t) für r=0

besitzt.
(b) Die hierdurch definierte Funktion U liefert umgekehrt auch eine Lösung
des AWP.
(c) Für die C1 –differenzierbare, aber nicht C2 –differenzierbare Anfangsge-
schwindigkeit
3 Das Anfangswertproblem 449


(c2 − r 2 )3/2 für r ≤ c ,
U1 (r) :=
0 für r ≥ c

ist die in (a) definierte Funktion u(x, t) = U (r, t) im Kegel mit der Spitze
(x0 , t0 ) = (0, 0, 0, 1),

K−
4
(x0 , t0 ) = {(x, t) ∈ Ê4
| x < c (1 − t) , t < 1} ,

eine Lösung des AWP. In der Kegelspitze (x0 , t0 ) ist ∂ 2 u/∂t2 unstetig. Die
Ê
auf der Sphäre Sc (x0 ) ⊂ 3 liegenden Unstetigkeiten der zweiten Ableitungen
der Anfangswerte u1 (x) = U1 (r) erreichen die Stelle x0 = 0 also erst zur Zeit
t0 = 1 .

3.4 Die homogene Wellengleichung im Ê2

Jeder Lösung u(x, t) = u(x1 , x2 , t) der zweidimensionalen Wellengleichung ist


durch U (x1 , x2 , x3 , t) := u(x1 , x2 , t) eine Lösung U der dreidimensionalen Wel-
lengleichung zugeordnet. Aus der Poissonschen Integraldarstellung 3.3 für U
gewinnen wir damit eine Integraldarstellung für u . Dieser Kunstgriff wird Ha-
damardsche Abstiegsmethode genannt. Hiermit ergibt sich der
Satz. Jede Lösung u des Anfangswertproblems für die zweidimensionalen Wel-
lengleichung besitzt für t > 0 die Darstellung
  
∂ 1 u0 (y)
u(x, t) = d2 y
∂t 2πc c2 t2 − y − x2
Kct (x)

1 u1 (y)
+ d2 y .
2πc c2 t2 − y − x2
Kct (x)

Bemerkung. Anders als im Fall n = 3 hängt hier die Lösung an der Stelle
(x, t) von den Anfangswerten auf der ganzen Kreisscheibe Kct (x) ab. Ein zur
Zeit t = 0 im Punkt y0 ausgesandtes Signal wird an der Stelle x0 = y0 als
zur Zeit t0 = x0 − y0  / c einsetzendes und allmählich abklingendes Signal
empfangen; vgl. 3.3, 2.3. (Ähnliches beobachten wir bei Wasserwellen, wobei
dahingestellt sei, ob diese der zweidimensionalen Wellengleichung genügen.)

Beweis.
Wir setzen U (x1 , x2 , x3 , t) := u(x1 , x2 , t) und Uk (x1 , x2 , x3 ) = uk (x1 , x2 ) für
k = 0, 1. Da U der dreidimensionalen Wellengleichung genügt und deshalb nach
3.3 durch sphärische Mittel von U0 und U1 dargestellt werden kann, geht es
nur darum, die beiden Integrale über Sphären in Integrale über Kreisscheiben
umzuformen.
450 § 17 Die Wellengleichung

Für x = (x1 , x2 ) ∈ Ê , r > 0 setzen wir x/ := (x , x , 0),


2
1 2

Sr+ (x)/ := {ξ ∈ Sr (/
x) | ξ3 > 0} , Sr− (x) / := {ξ ∈ Sr (/
x) | ξ3 < 0}

und parametrisieren die beiden Halbsphären als Graphen über der Kreisscheibe
Ê
Kr (x) ⊂ 2 , z.B. die obere durch

Φ : Kr (x) → Sr+ (/
x) , y = (y1 , y2 ) → (y1 , y2 , ϕ(y))

mit ϕ(y) := r 2 − y − x2 . Für das Oberflächenelement ergibt sich nach


§ 11 : 2.4 oder Bd. 1, § 25 : 2.5 (a)

r
do = 1 + ∇ϕ(y)2 d2 y = d2 y ;
r2 − y − x2

derselbe Ausdruck ergibt sich für das Oberflächenelement der unteren Halb-
sphäre Sr− (/
x). Weiter gilt für beide Halbsphären (Uk ◦ Φ)(y) = uk (y) , und
daher
   
Uk do = Uk do + Uk do = 2 Uk do
/
Sr (x) /
Sr+ (x) Sr− (x)/ /
Sr+ (x)

uk (y)
= 2r d2 y .
r 2 − y − x2
Kct (x)

Damit erhalten wir für die Integrale in der Poissonschen Darstellungformel


 
1 1 uk (y)
Uk do = d2 y . 2
4πc2 t 2πc r 2 − y − x2
/
Sct (x) Kct (x)

Aus der Lösungsdarstellung in 3.3 ergibt sich mit diesen Umformungen:

Satz. Für u0 ∈ C3 ( Ê ),
2
u1 ∈ C2 ( Ê ),
2
x∈ Ê 2
, t > 0 setzen wir
  
∂ 1 u0 (y)
u(x, t) := d2 y
∂t 2πc c2 t2 − y − x2
Kct (x)

1 u1 (y)
+ d2 y .
2πc c2 t2 − y − x2
Kct (x)

Dann kann u zu einer Lösung des Anfangswertproblems für die homogene Wel-
lengleichung auf 2
× Ê Ê
fortgesetzt werden und diese stellt die eindeutig be-
Ê
stimmte Lösung dar. Im Fall u0 ∈ Cm+1 ( 2) , u1 ∈ Cm ( 2) mit m ≥ 2 ist Ê
die Lösung Cm –differenzierbar.
3 Das Anfangswertproblem 451

3.5 Die inhomogene Wellengleichung


Wir betrachten für n = 1, 2, 3 das Anfangswertproblem

⎨ ¡u = f in Ê n
× Ê >0 ,
(∗∗)
⎩ u(x, 0) = ∂u (x, 0) = 0 für x ∈ Ên .
∂t
mit gegebener Funktion f auf Ê n
× Ê +.

Ist dieses gelöst, so folgt durch Superposition der Lösung mit der Lösung der
homogenen Wellengleichung in 3.1, 3.3, 3.4 die allgemeine Lösung des Anfangs-
wertproblems (∗). Zur Lösung des Problems (∗∗) dient der folgende

Satz (Duhamelsches Prinzip). Gegeben sei f ∈ C2 ( Ê n


× Ê +) . Für jedes
s ≥ 0 bezeichne us die Lösung des Anfangswertproblems

¡u = 0 in Ê n
× ]s, ∞[ ,

u(x, s) = 0 für x ∈ Ê n
,

∂u
∂t
(x, s) = f (x, s) für x ∈ Ê n
.

Dann ist durch


t
u(x, t) := us (x, t) ds
0

die eindeutig bestimmte Lösung u ∈ C1 ( Ên


× Ê+) ∩ C2 ( Ê n
× Ê>0 ) des An-
fangswertproblems (∗∗) gegeben.

Das Duhamelsche Prinzip wird auch für die Lösung der inhomogenen Wärmelei-
tungsgleichung verwendet, vgl. § 16 : 3.3.

Beweis.
Hängen in den Lösungsformeln in 3.1, 3.3, 3.4 die Anfangswerte u0 und u1
C2 –differenzierbar von einem Parameter s ab, so gilt das nach 3.2 (b) auch für
die Lösungen der homogenen Wellengleichung. Hiernach ist (x, t, s) → us (x, t)
C2 –differenzierbar und für das Integral u(x, t) ergibt sich unter Verwendung der
in § 6 : 3.7 verwendeten Ableitungsregel

t t
∂u  ∂us ∂us
(x, t) = us (x, t) s=t + (x, t) ds = (x, t) ds ,
∂t ∂t ∂t
0 0
452 § 17 Die Wellengleichung

 t
∂2u ∂us  ∂ 2 us
(x, t) = (x, t) + (x, t) ds
∂t2 ∂t s=t ∂t2
0
t
= f (x, t) + c2 Δus (x, t) ds
0
t
= f (x, t) + c2 Δ us (x, t) ds
0
2
= f (x, t) + c Δu(x, t)

und
∂u
u(x, 0) = 0, (x, 0) = 0 . 2
∂t

Das Duhamelsche Prinzip liefert zusammen mit den Lösungsdarstellungen in


3.1, 3.3, 3.4 die Lösung des Anfangswertproblems (∗∗).


n+1
(x, t) bezeichnen im Folgenden die in 1 (a) eingeführten Kegel.

Ê Ê
Satz Zu gegebener Funktion f ∈ C2c ( n × ) liefern die folgenden Integrale
für t > 0 die eindeutig bestimmten Lösungen des Anfangswertproblems (∗∗)

1
u(x, t) = f (y, s) dy ds (n = 1) ,
2c
K2

(x,t)

1 f (y, s)
u(x, t) = d2 y ds (n = 2) ,
2πc c2 (t − s)2 − y − x 2
K3

(x,t)


1 f (y, t − y − x/c) 3
u(x, t) = d y (n = 3) .
4πc2 y − x
Kct (x)

Der Beweis ergibt sich unmittelbar aus dem Duhamelschen Prinzip und den
Lösungsdarstellungen 3.1, 3.3, 3.4 nach Ausführung der Zeittranslationen t →
t−s.

Durch Zeitspiegelung t → t∗ − t ergeben sich aus diesen retardierten Poten-


tialen weitere Lösungen der inhomogenen Wellengleichung, die avancierten
4 Das Anfangs–Randwertproblem 453

Potentiale einer Anregung f ∈ C2c ( Ê n


× Ê) ÜA :

1
u(x, t) = f (y, s) dy ds (n = 1) ,
2c
K2
+
(x,t)

1 f (y, s)
u(x, t) = d2 y ds (n = 2) ,
2πc c2 (s − t)2 − y − x 2
K3
+
(x,t)


1 f (y, t + y − x/c) 3
u(x, t) = d y (n = 3) .
4πc2 y − x
Kct (x)

4 Das Anfangs–Randwertproblem
4.1 Problemstellung und Lösungsansatz
(a) Für ein beschränktes Gebiet Ω ⊂ Ê n
lautet das allgemeine ARWP


⎪ u = f in ΩT = Ω × ]0, T [ ,


∂u
(∗) u(x, 0) = u0 (x) , (x, 0) = u1 (x) für x ∈ Ω ,

⎪ ∂t


u = g auf ∂Ω × ]0, T [ ;
dabei sind T > 0 und f , g, u0 , u1 gegeben.
Wir betrachten nur den Fall g = 0. Im Fall g ∈ C0 (ΩT ) ∩ C2 (ΩT ) läßt (∗) auf
diesen unschwer zurückführen.
Für den allgemeinen Fall und für Neumannsche Randbedingungen verweisen
wir auf Dautray–Lions [4, 5] Ch. 18, § 5, Ladyzhenskaya [65] Ch. IV, Wloka
[72] § 29.

Wir gehen ganz analog vor wie beim Wärmeleitungsproblem § 16 : 4 und kombi-
nieren die Bernoullische Methode zur Behandlung der schwingenden Saite § 6 : 3
mit dem Entwicklungssatz in § 15 : 1:


− Aufstellung der formalen Lösung als Reihe u(x, t) = ai (t)vi (x) durch
i=1
Raum– und Zeitseparation nach der Methode von Daniel Bernoulli.
− Konvergenzbeweis für die Reihe durch Aufstellung von Majoranten und
Nachweis, dass u eine schwache Lösung liefert.
− Regularitätsbeweis für die schwache Lösung bei hinreichend glatten Daten.
Auch für die Wellengleichung erweist sich dieses Vorgehen von der physikalischen
Problemstellung her als ganz natürlich.
454 § 17 Die Wellengleichung

(b) Lösungsansatz durch Raum– und Zeitseparation.


Wir stützen uns auf den Entwicklungssatz § 15 : 1.2, wobei wir wie dort die
Bezeichnungen H = L2 (Ω), V = W01 (Ω) und
 
u, v H = uv dn x , u, v V = ∇u , ∇v dn x
Ω Ω

verwenden. Demnach gibt es ein vollständiges ONS v1 , v2 , . . . für H aus Eigen-


vektoren des Dirichletschen Eigenwertproblems

− Δv = λv in Ω , v = 0 auf ∂Ω

zu Eigenwerten 0 < λ1 ≤ λ2 ≤ . . . mit lim λk = ∞ ; ferner gilt vi ∈ V und


k→∞

(a) vi , v V = λi vi , v H für v ∈ V ,

(b) vi , vk H = δik , vi , vk V = λi δik .

Für das ARWP (∗) mit g = 0 machen wir den Lösungsansatz




(c) u(x, t) = ai (t)vi (x)
i=1

und erhalten mit formaler Rechnung

∂2u ∞

2
(x, t) = äi (t)vi (x) ,
∂t i=1


∞ 

Δu(x, t) = ai (t)Δvi (x) = − λi ai (t)vi (x) .
i=1 i=1

Die Wellengleichung und die Anfangsbedingungen liefern zusammen mit den


Fourierentwicklungen der Daten√u0 , u1 , f unter Verwendung der Abkürzungen
f (t)(x) := f (x, t) und μi := c λi

∞  
∂2u
(äi (t) + μ2i ai (t))vi (x) = − c2 Δu (x, t)
i=1 ∂t2


= f (x, t) = vi , f (t) H vi (x) ,
i=1


∞ 

ai (0)vi (x) = u(x, 0) = u0 (x) = vi , u0 H vi (x) ,
i=1 i=1



∂u ∞
ȧi (0) vi (x) = (x, 0) = u1 (x) = vi , u1 H vi (x) .
i=1 ∂t i=1
4 Das Anfangs–Randwertproblem 455

Durch Koeffizientenvergleich ergeben sich die Anfangswertprobleme

äi (t) + μ2i ai (t) = vi , f (t) H ,


ai (0) = vi , u0 H , ȧi (0) = vi , u1 H

mit den Lösungen


vi , u1 H
ai (t) = vi , u0 H cos(μi t) + sin(μi t)
μi
(d)
1 t
+ vi , f (s) H sin(μi (t − s)) ds
μi 0

für t ∈ I := [0, T ] , i = 1, 2, . . . ÜA .

Die Konvergenz der Reihe (c) mit den Koeffizienten (d) wird mit der gleichen
Methode gezeigt, die für die Wärmeleitungsgleichung verwendet wurde, siehe
§ 16 : 4.5. Insbesondere benötigen wir zur Beschreibung der Glattheitseigenschaf-
ten von u die Funktionenräume aus § 16 : 4.2.

4.2 Der schwache Lösungsbegriff für das Anfangs–Randwertproblem


(a) Von einer schwachen Lösung u des ARWP (∗) mit Randwerten g = 0 und

f ∈ L2 (ΩT ) verlangen wir, dass die Gleichung u = f schwach erfüllt ist, ferner
dass wie üblich u(t) : x → u(x, t) zu W01 (Ω) gehört, diesmal für alle t ∈ [0, T ].
Hinsichtlich der Zeitabhängigkeit wird die Differenzierbarkeit von u̇(t) in recht
schwacher Form gefordert. Das leistet, wie wir in (b) zeigen, die folgende

Definition. Wir nennen u eine schwache Lösung des ARWP (∗) mit ver-
schwindenden Randwerten g = 0 , wenn die Gleichung u = f im Distributi- 
onssinn erfüllt ist und wenn u ∈ C0 ([0, T ], W01 (Ω)) eine schwache Zeitableitung
u̇ ∈ C0 ([0, T ], L2 (Ω)) besitzt.

Aufgrund der Definition § 13 : 1.2 einer schwachen Lösung, wegen ∗ = und  


nach den Definitionen § 16 : 4.2 bedeutet dies im Einzelnen: u ∈ L1loc (ΩT ) und
 
(1) u Φ d n
x dt = f Φ dn x dt
ΩT ΩT

für alle Φ ∈ C∞
c (ΩT ),
 
(2) u(t) ∈ W01 (Ω) , lim u(s) − u(t) V = 0 für jedes t ∈ I = [0, T ] ,
s→t

T T
(3) u(t) , v H ψ̇(t) dt = − u̇(t) , v H ψ(t) dt
0 0

für alle v ∈ H und alle ψ ∈ C∞


c (]0, T [).
456 § 17 Die Wellengleichung

Die Wahl von C0 ([0, T ], W01 (Ω)) × C0 ([0, T ], L2 (Ω)) als Funktionenraum für
die Lösung t → (u(t), u̇(t)) stellt insbesondere die Existenz und Stetigkeit der
Energie sicher.

(b) Wir geben für die distributionelle Wellengleichung (1) äquivalente Formu-
lierungen:
Unter der Voraussetzung u(t) ∈ W01 (Ω) für alle t ∈ I ist (1) äquivalent zu
  
∂2Φ n
(1.1) u d x dt + c2 ∇u , ∇Φ dn x dt = f Φ dn x dt .
∂t2
ΩT ΩT ΩT

Durch Spezialisierung Φ = ϕ ⊗ ψ, d.h. Φ(x, t) = ϕ(x) ψ(t) mit ϕ ∈ C∞


c (Ω),
ψ ∈ C∞
c (]0, T [) folgt daraus
  
(1.2) u ϕ ψ̈ dn x dt + c2 ∇u , ∇ϕ ψ dn x dt = f ϕ ψ dn x dt .
ΩT ΩT ΩT

Nach § 16 : 4.3 (b) kommen wir von (1.2) wieder zu (1.1) und zu (1) zurück.
Wegen der Isomorphie von L2 (ΩT ) =∼ L2 (I, H) ist (1.2) äquivalent zu

T T T
(1.3) u(t) , ϕ H ψ̈(t) dt + c2 u(t) , ϕ V ψ(t) dt = f (t) , ϕ H ψ(t) dt.
0 0 0

für alle ϕ ∈ V , ψ ∈ C∞ ∞
c (]0, T [), denn Cc (Ω) liegt bezüglich  . V und daher
auch bezüglich  . H dicht in V . Aus (3) mit ψ̇ statt ψ und aus (1.3) ergibt
sich

T T T
(1.4) − u̇(t) , ϕ H ψ̇(t) dt + c2 u(t) , ϕ V ψ(t) dt = f (t) , ϕ H ψ(t) dt.
0 0 0

Das bedeutet nach § 14 : 6.4 (c), dass u̇(t) , ϕ H absolutstetig ist mit schwacher
(und fast überall existierender) Ableitung f (t) , ϕ H − c2 u(t) , ϕ V . Wegen
der vorausgesetzten Stetigkeit von u(t) , ϕ V ergibt sich wie in § 16 : 4.3, 4.4

t t
(1.5) u̇(t) , ϕ H − u̇(0) , ϕ H + c2 u(s) , ϕ V ds = f (s) , ϕ H ds
0 0

für alle ϕ ∈ V und alle t ∈ [0, T ]. Aus (3) und § 14 : 6.4 (c) ergibt sich wie in
§ 16 : 4.3 (a), dass u̇(t) , ϕ H die schwache Ableitung der auf [0, T ] absolutste-
tigen Funktion t → u(t) , ϕ H ist.
Erfüllt umgekehrt u ∈ L2 ([0, T ], V ) die Bedingung (1.5), wobei u(t) , ϕ H
jeweils absolutstetig ist, so folgt (1.4) und durch partielle Integration auch (1.3).
4 Das Anfangs–Randwertproblem 457

4.3 Existenz und Eindeutigkeit schwacher Lösungen


Satz. Zu gegebenen Daten u0 ∈ W01 (Ω), u1 ∈ L2 (Ω), f ∈ L2 (ΩT ), g = 0
besitzt das ARWP (∗) genau eine schwache Lösung u im Sinne von 4.2. Diese
ist durch die Fourierreihe 4.1 (c) mit den Koeffizienten 4.1 (d) gegeben, und für
die Partialsummen uk dieser Reihe gilt

uk → u in C0 ([0, T ], W01 (Ω)) , u̇k → u̇ in C0 ([0, T ], L2 (Ω))

für k → ∞.
Weiter besteht die Energiegleichung
t
EΩ (t) = EΩ (0) + f (s) , u̇(s) H ds f ür t ∈ [0, T ]
0

mit
  2 
1 ∂u
EΩ (t) := + c2 ∇u2 (x, t) dn x
2 ∂t
Ω
1
= u̇(t)2H + c2 u(t)2V .
2

Der Funktionenraum C0 ([0, T ], W01 (Ω)) × C0 ([0, T ], L2 (Ω)) wird die Energie-
klasse für die Wellengleichung genannt. Auf diesem ist die Stetigkeit der Energie
sowie die stetige Annahme der Anfangswerte gesichert,

lim u(t) − u0 V = 0 , lim u̇(t) − u1 H = 0 .


t→0 t→0

Folgerung. Seien u0 ∈ W01 (Ω), u1 ∈ L2 (Ω) und f : Ω × + → für Ê Ê


jedes T > 0 über ΩT quadratintegrierbar. Dann gibt es eine eindeutig bestimmte
Ê Ê
globale Lösung u : Ω × + → , d.h. u liefert für jedes T > 0 eine Lösung des
ARWP (∗) mit verschwindenden Randwerten g = 0.

Beweis.
(1) Eindeutigkeit der Lösung.
Für die Differenz u zweier Lösungen bestehen wegen u(t) ∈ V , u̇(t) ∈ H für
jedes t ∈ I = [0, T ] nach § 15 : 1.2, 1.3 die Fourierentwicklungen

∞ 

u(t) = Ai (t) vi in V , u̇(t) = Bi (t) vi in H ,
i=1 i=1

wobei wegen vi , vk V = λi vi , vk H für vi , vk ∈ H die Ai , Bi gegeben sind


durch
1
Ai (t) = u(t) , vi V = u(t) , vi H , Bi (t) =, u̇(t) , vi H .
λi
458 § 17 Die Wellengleichung

Nach den Überlegungen 4.2 sind die Ai , Bi absolutstetig, und aus 4.2 (b) folgt
mit f = 0, μi := c2 λi
t
Bi (t) − Bi (0) = − μi Ai (s) ds (i = 1, 2, . . .) .
0

Da die Ai (absolut)stetig sind, folgt Bi ∈ C1 (I) und

Ḃi (t) + μi Ai (t) = 0 für t ∈ I, i ∈ .


Da nach den Ausführungen 4.2 die Ai unbestimmte Integrale ihrer schwachen
Ableitungen Bi sind, erfüllen sie im klassischen Sinn die Schwingungsgleichung

Äi + μi Ai = 0

mit Ai (0) = u(0) , vi H = 0 und Ȧi (0) = Bi (0) = u̇(0) , vi H = 0, was nur
für Ai = 0 möglich ist (i = 1, 2, . . . ). Aus der Reihendarstellung von u folgt
u = 0.

(2) Abschätzung der Koeffizienten ai (t).


Nach 4.1 (d) gilt
t
ai (t) = αi cos(μi t) + βi sin(μi t) + γi (s) sin(μi (t − s)) ds
0

mit den Abkürzungen


1 1
αi = vi , u0 H , βi = vi , u1 H , γi (t) = vi , f (t) H .
μi μi
Nach den Entwicklungssätzen § 15 : 1.2, 1.3 konvergieren für u0 ∈ V , u1 ∈ H
und f ∈ L2 (ΩT ) ∼
= L2 (I, H) die Reihen

∞ 

u0 2V = λi vi , u0 2
H = λi α2i ,
i=1 i=1


∞ 

1 ∞
u1 2H = vi , u1 2
H = μ2i βi2 = 2
λi βi2 ,
i=1 i=1 c i=1


∞ 

f (t)2H = vi , f (t) 2
H = μ2i γi (t)2 ,
i=1 i=1

T T 

f (t)2L2 (I,H) = f (t)2H dt = μ2i γi (t)2 dt
0 0 i=1

1 ∞ T
= 2 λi γi (t)2 dt .
c i=1 0
4 Das Anfangs–Randwertproblem 459

Mit der Ungleichung (a+b+c)2 ≤ 3a2 +3b2 +3c2 und der Cauchy–Schwarzschen
Ungleichung ergibt sich hieraus

ai (t)2 ≤ 3 (αi cos(μi t))2 + 3 (βi sin(μi t))2

 T 2
+ 3 γi (s) sin(μi (t − s)) ds
0
T T
≤ 3 α2i + 3 βi2 + 3 γi (s)2 ds sin2 (μi (t − r)) dr
0 0

T
≤ 3 α2i + 3 βi2 + 3 T γi (s)2 ds ,
0
also

∞ 
∞ 
∞ 
∞ T
λi ai (t)2 ≤ 3 λi α2i + 3 λi βi2 + 3 T λi γi (s)2 ds
(a) i=1 i=1 i=1 i=1 0
3  2
= c u0 2V + u1 2H + T f 2L2 (I,H) .
c2
Ganz entsprechend erhalten wir ÜA


∞ 
(b) ȧi (t)2 ≤ 3 c2 u0 2V + u1 2H + T f 2L2 (I,H) für alle t ∈ I .
i=1

(3) Die Reihe ai vi konvergiert in C0 (I, V ).

k
Die Partialsummen uk := ai vi bilden eine Cauchy–Folge in C0 (I, V ), denn
i=1
wegen der gleichmäßigen Konvergenz der Reihe in (2) (a) gibt es zu ε > 0 ein
nε , so dass für  > k > nε

  2 
u (t) − uk (t)2V =  ai (t) vi V = λi ai (t)2 < ε2
i=k+1 i=k+1

für alle t ∈ I , also


  
u − uk C0 (I,V ) = sup u (t) − vk (t)V  t ∈ I ≤ ε.

Die Folge uk hat somit im Banachraum C0 (I, V ) (§ 16 : 4.2 (b)) einen Grenzwert


u= ai vi .
i=1

(4) Konvergenz der Reihe ȧi vi in C0 (I, H).
Ganz analog folgt aus der gleichmäßigen Konvergenz der Reihe in (2) (b) die
Konvergenz der Folge u̇k im Banachraum C0 (I, H) mit einem Grenzwert v.
460 § 17 Die Wellengleichung

(5) v = ∂u/∂t gilt im schwachen Sinn.


Für j ≤ k und ψ ∈ C∞
c (]0, T [) gilt

T 
uk (t) , vj H ψ̇(t) + u̇k (t) , vj H ψ(t) dt
0

T  T
= aj (t) ψ̇(t) + ȧj (t) ψ(t) dt = (aj ψ)· (t) dt = 0 .
0 0

Aus der gleichmäßigen Konvergenz uk → u in C0 (I, V ) folgt mit der Poincaré–


Ungleichung u(t) − uk (t)V ≤ c(Ω) u(t) − uk (t)H (§ 14 : 6.2) auch uk → u
in C0 (I, H). Zusammen mit u̇k → v in C0 (I, H) folgt für Φ = vj ⊗ ψ
  T 
u ∂Φ
∂t
+ v Φ dn x dt = u(t) , vj H ψ̇(t) + u(t) , vj H ψ(t) dt = 0 .
ΩT 0

Nach § 16 : 4.2, Satz 4 ergibt sich hieraus v = ∂u/∂t im schwachen Sinn.



(6) u = ai vi ist schwache Lösung des ARWP.

k
Mit fk (t) := vi , f (t) H vi gilt für j ≤ k
i=1

ük (t) , vj H + c2 uk (t) , vj V = äj (t) + μ2j aj (t) = vj , fj (t) H


(∗∗)
= fk (t) , vj H

und durch Integration


t t
u̇k (t) , vj H − u̇k (0) , vj H + c2 uk (s) , vj V ds = fk (s) , vj H ds .
0 0

Grenzübergang k → ∞ liefert (wieder unter Verwendung der Poincaré–Unglei-


chung wie in (5))

t t
u̇(t) , vj H − u̇(0) , vj H + c2 u(s) , vj V ds = f (s) , vj H ds
0 0

für j = 1, 2, . . . und t ∈ I. Nach Gleichung(1.5) in 4.1 (b) ist u daher eine


schwache Lösung des ARWP. Weiter gilt nach den Konvergenzbedingungen in
(2) und den Entwicklungssätzen § 15 : 1.2,1.3

∞ 

u(0) = ai (0) vi = vi , u0 H vi = u0 in V,
i=1 i=1


∞ 

u̇(0) = ȧi (0) vi = vi , u1 H vi = u1 in H.
i=1 i=1
4 Das Anfangs–Randwertproblem 461

(7) Energiegleichung. Aus (∗∗) folgt durch Multiplikation mit ȧj (t) und Sum-
mation über j von 1 bis k
fk (s) , u̇k (s) H = ük (s) , u̇k (s) H + c2 uk (s) , u̇k (s) V
1 d 
= u̇k (s)2H + c2 uk (s)2V .
2 dt
Integration von 0 bis t und Grenzübergang k → ∞ liefert die Energiegleichung
t  
1
u̇(s)2H + c2 u(s)2V 0 = EΩ (t) − EΩ (0)
t
f (s) , u̇(s) H ds = 2
0

für t ∈ I. 2

4.4 Regularität der schwachen Lösung


Der Einfachheit halber beschränken wir uns auf den Fall der homogenen Wel-
lengleichung mit verschwindenden Randwerten (f = 0, g = 0). Die inhomogene
Wellengleichung kann mit Hilfe des Duhamelschen Prinzips behandelt werden,
siehe Wloka [72] § 30.

Ê
Regularitätssatz. Es sei Ω ⊂ n ein beschränktes, C2r –berandetes Gebiet
( 1 ≤ r ≤ ∞ ), und für die Anfangswerte u0 , u1 gelte
u0 ∈ C2r (Ω) , u0 = Δu0 = . . . = Δr u0 = 0 auf ∂Ω ,
u1 ∈ C 2r−1
(Ω) , u1 = Δu1 = . . . = Δ r−1
u1 = 0 auf ∂Ω .
Dann gilt für die schwache Lösung u des ARWP (∗) und die zugehörigen Par-

k
tialsummen uk = ai vi im Fall r > s + 12 (n + 1)
i=1

u ∈ Cs (Ω × Ê +) ,

uk → u in Cs (Ω × [0, T ]) für k → ∞ und jedes T > 0 .

Insbesondere ist u für s ≥ 2 eine klassische Lösung des ARWP.

Bemerkung. Dass für die Anfangswerte u0 , u1 bestimmte Krümmungsbedin-


gungen auf dem Rand ∂Ω für die Existenz einer klassischen Lösung u notwendig
sind, zeigt das Beispiel der schwingenden Saite in § 6 : 3. Schon d’Alembert hatte
erkannt, dass seine Lösungsformel nur dann eine klassische Lösung liefert, wenn
u0 (x) = u0 (x) = 0 in den Randpunkten x = 0 und x = L
gilt. Der Regularitätssatz verlangt im Fall n = 1, s = 2 die Bedingung r > 3,
während wir aus § 6 : 3.4 wissen, dass für die Existenz einer klassischen Lösung
die Voraussetzungen u0 ∈ C2 [0, L], u1 ∈ C1 [0, L], u0 = u0 = u1 = 0 auf ∂Ω
ausreichen. Die Voraussetzungen des Regularitätssatzes sind also nicht optimal.
462 § 17 Die Wellengleichung

Beweis.
Wir setzen der Übersichtlichkeit halber c = 1 und schreiben wie in 4.2
ai (t) = αi cos(μi t) + βi sin(μi t) ,
αi = vi , u0 H , βi = μ−1
i vi , u1 H , μi = λi .
(j)
Für die j–te Ableitung ai (t) der Koeffizienten gilt
(j)
 
ai (t)2 ≤ 2 μ2j
i α2i + βi2 ≤ 2 λji α2i + βi2 ,

und aus den über u0 und u1 gemachten Voraussetzungen ergibt sich nach dem
Äquivalenzsatz § 15 : 1.4 (d)

∞ 

u0 2Ar = λ2r
i vi , u0 2
H = λ2r 2
i αi ,
i=1 i=1
∞  ∞
u1 2Ar−1/2 = λ2r−1
i vi , u1 2H = λ2r 2
i βi .
i=1 i=1

Für j = 0, 1, . . . , r und T > 0 erhalten wir damit


∞ T (j) 
∞ T 
λri ai (t)2 dt ≤ λri 2 λji α2i + βi2 dt
i=1 0 i=1 0

∞ 
≤ 2T λ2r
i α2i + βi2

i=1

= 2T u0 2Ar + u1 2Ar−1/2 .

Wie im Beweisteil (3) von § 16 : 4.5 ergibt sich, dass die Partialsummen dj uk /dtj
für k → ∞ im Hilbertraum L2 ([0, T ], D(Ar/2 )) gegen ein Element wj konver-
gieren. Dies ist nach dem Äquivalenzsatz § 15 : 1.4 (d) dann auch in Wr (Ω)) der
Fall. Weiter gilt wj = dj u/dtj im schwachen Sinn ÜA , woraus wir erhalten
uk → u in Wr (]0, T [ , Wr (Ω)) für k → ∞.
Nach § 16 : 4.2 (c) und dem Morreyschen Einbettungssatz § 14 : 6.4 (d) bestehen
für r > s + 12 (n + 1) die stetigen Einbettungen
Wr (]0, T [ , Wr (Ω)) → Wr (Ω × ]0, T [) → Cs (Ω × [0, T ]).
Hieraus folgt
uk → u in Cs (Ω × [0, T ]) für k → ∞
und alle T > 0. 2
Kapitel VI Mathematische Grundlagen der
Quantenmechanik

§ 18 Mathematische Probleme der Quantenmechanik


1 Ausgangspunkt, Zielsetzung, Wegweiser
Dieses Kapitel besteht aus zwei Teilen: Einer Einführung in die Integrations–
und Wahrscheinlichkeitstheorie und einer Einführung in die Theorie linearer
Operatoren im Hilbertraum. Jeder Teil ist von eigenem Interesse; gleichwohl
gibt es sowohl historisch als auch im Hinblick auf die Zielsetzung dieses Kapitels
Verbindungen, auf die wir kurz eingehen.
Beide Theorien wurden in ihren Grundzügen im ersten Drittel des 20. Jahrhun-
derts entwickelt. Den Anfang markieren die Einführung des Lebesgue–Integrals
1902 und die Arbeiten von Hilbert und Schmidt über Gleichungen mit unend-
lich vielen Variablen 1904–1909; am Ende stehen die Grundbegriffe der Wahr-

scheinlichkeitstheorie“ (Kolmogorow 1933) und die Mathematischen Grund-

lagen der Quantenmechanik“ (1932) von Neumanns.
Die Quantenmechanik wurde 1925/26 durch zwei scheinbar verschiedene An-
sätze auf den Weg gebracht, die diskrete Matrizenmechanik von Heisenberg,
Born, Jordan und die Wellenmechanik von Schrödinger. Deren Vereinheit-
lichung gelang nach verschiedenen Versuchen schließlich Dirac (1930) und von
Neumann (1932). Letzterer stützte sich auf die Isomorphie des Hilbertschen Fol-
genraumes 2 als Konfigurationsraum der Matrizenmechanik und von L2 ( n) Ê
als Konfigurationsraum der Wellenmechanik. Von Neumann zeigte, dass sich
durch den von ihm maßgeblich mitentwickelten Hilbertraum-Formalismus und
dessen Interpretation wesentliche Aspekte der Quantenmechanik erfassen lassen.
Die auf dieser Basis von ihm und seinen Zeitgenossen erarbeiteten Sichtweisen
fassen wir mit Primas [139] unter dem Stichwort Pionier–Quantenmechanik
zusammen.
Die Theorie linearer Operatoren im Hilbertraum bildet nicht nur die mathema-
tische Grundlage der Pionier–Quantenmechanik; sie ist auch als Basis für die
heute übliche operatoralgebraische Betrachtungsweise unerlässlich. Inzwischen
ist sie weit über ihre ursprüngliche Zweckbestimmung hinaus zu einem wichtigen
Hilfsmittel der Analysis geworden, insbesondere der Theorie von Differential–
und Integralgleichungen. Sie gestattet, eine Reihe von Einzelproblemen unter
einheitlichen strukturellen Gesichtspunkten zu behandeln und liefert übergrei-
fende Standardschlussweisen.
Im klassischen Hilbertraumformalismus werden quantenmechanische Observa-
ble und Zustände durch Operatoren bzw. Vektoren eines Hilbertraums beschrie-
ben. Eine wichtige Rolle spielt das Spektrum als möglicher Wertebereich einer

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4_6, © Springer Fachmedien Wiesbaden 2014
464 § 18 Mathematische Probleme der Quantenmechanik

Observablen. Welcher Spektralwert bei einer Einzelmessung anfällt, hängt i.A.


vom Zufall ab; Gesetze müssen sich daher auf Wahrscheinlichkeiten, Verteilun-
gen von Beobachtungswerten sowie deren Erwartungswert und Varianz bezie-
hen. Eine wichtige Aufgabe dieses Kapitels besteht darin, die Verbindung zwi-
schen Operatorenkalkül und Wahrscheinlichkeitstheorie herzustellen, beispiels-
weise E = ϕ , Aϕ als einen Erwartungswert und Aϕ − Eϕ2 als zugehörige
Varianz zu identifizieren. Hierzu ist es notwendig, Erwartungswert und Varianz
einer beliebigen Verteilung als Integrale darzustellen. Dies leistet die Integra-
tionstheorie in § 20, die gleich so weit gefasst ist, dass auch das Lebesgue–Integral
mit einbezogen werden kann, welches für die Konstruktion quantenmechanischer
Systemhilberträume unerlässlich ist. Die Wahrscheinlichkeitstheorie wird hier
nur so weit verfolgt, wie es für die Quantenmechanik nötig ist.
Der mathematische Formalismus der Pionier–Quantenmechanik hat sich in der
Praxis bewährt oder, frei nach Feynman, the mystery works“. Grundsätzliche

Fragen zur Interpretation und Systematik sind aber offen geblieben. So ist bei-
spielsweise die Diskussion über eine Theorie des Messprozesses und über Quan-
tisierung noch in vollem Gang. Im Wesentlichen ist noch heute gültig, was Max
Born, einer der Pioniere der Quantenmechanik, 1955 in seiner Nobelpreisrede
rückblickend sagte: Was aber dieser Formalismus bedeutete, war keineswegs

klar. Die Mathematik war, wie es öfters vorkommt, klüger als das sinngebende
Denken.“ Unter diesen Umständen müssen wir uns bei physikalischen Interpre-
tationen weitgehend auf das beschränken, was die Mathematik hergibt und auf
wenige, allgemein akzeptierte Grundanschauungen.
Wer mehr über Entwicklung und Stand der Grundlagendiskussion und über
neuere Ansätze beyond pioneer quantum mechanics“ erfahren möchte, sei auf

die vorzüglichen Darstellungen von Jauch [136] und Primas [139] verwiesen.

Wegweiser. In diesem Paragraphen wird anhand idealisierter Modellsituatio-


nen der Quantenmechanik ein Fragenkatalog erstellt, der die mathematischen
Themen dieses Kapitels motivieren soll, ohne dabei auf mathematische Feinhei-
ten einzugehen. Vorausgesetzt werden hierzu nur elementare Kenntnisse über
Hilberträume (§ 8 : 2.1 und § 9) und die eindimensionale Fouriertransformation
auf dem Raum S der schnellfallenden Funktionen (§ 12 : 2 und 3).
Die beiden folgenden Paragraphen über Wahrscheinlichkeit, Maß und Integral
erfordern keine besonderen Vorkenntnisse. Den an der Quantenmechanik inter-
essierten Lesern wird ein Schnelldurchgang empfohlen: Gründliches Studium der
Abschnitte 1–4 und 9 von § 19; für den Rest genügt es vorab, die Grundbegriffe
und Sätze zur Kenntnis zu nehmen, ohne auf Beweise einzugehen. (Wir haben
die meisten Beweise ausgeführt, um den Lesern das Zusammensuchen in der
Literatur zu ersparen.)
Die Theorie der linearen Operatoren im Hilbertraum stützt sich wesentlich auf
§ 9, § 19 und § 20. Nähere Angaben zu den Vorkenntnissen finden Sie wie immer
2 Beugung und Interferenz von Elektronen 465

am Beginn eines Paragraphen. Um einen Quereinstieg in dieses Schlusskapi-


tel zu ermöglichen, werden als Beispiele für Differentialoperatoren vorwiegend
gewöhnliche diskutiert und nur am Rand auf den Bezug zu partiellen hingewie-
sen. Am Ende dieses Kapitels fassen wir zusammen, welche Konsequenzen sich
aus der bis dahin entwickelten mathematischen Theorie für die physikalische
Interpretation ergeben. Wir gehen dann abschließend kurz auf die Grenzen des
von uns angenommenen naiven Standpunkts ein.

2 Beugung und Interferenz von Elektronen


(a) Eine Elektronenkanone schieße in größeren zeitlichen Abständen einzelne
Elektronen mit gleichem Impuls p senkrecht auf eine mit einem kleinen Loch
versehene Platte ab.
Auf einer hinter dieser Lochblende an-
gebrachten Fotoplatte hinterlässt dann
jedes einzelne Elektron einen kleinen
schwarzen Fleck. Die Einschlagsorte
sind zunächst scheinbar regellos ver-
teilt; nach langer Dauer des Experi-
ments stellen sich jedoch Ringe wech-
selnd starker Schwärzung ein, die an
das Beugungsbild einer senkrecht auf
die Lochplatte auftreffenden ebenen
Welle erinnern.
Tatsächlich handelt es sich nicht bloß um eine Ähnlichkeit: Ist r der Abstand ei-
nes Punktes auf der Fotoplatte von der Symmetrieachse, S(r) der sich schließlich
einstellende Schwärzungsgrad beim Elektronenexperiment und I(r) die Inten-
sität der Schwärzung im Beugungsbild einer ebenen Welle, so gilt
S(r) I(r)
= .
S(0) I(0)
Die einzelnen Elektronen treten also beim Einschlag in die Fotoplatte als Kor-
puskeln in Erscheinung, bringen aber in ihrer Gesamtheit dasselbe Phänomen
wie eine ebene Welle hervor. Der Zusammenhang zwischen deren Wellenzahl k,
Frequenz ν, Kreisfrequenz ω = 2πν sowie dem Impuls p und der Energie E
des Elektrons ist nach de Broglie und Einstein gegeben durch
p = h̄k , E = hν = h̄ω ,
wobei h = 6.622 · 10−27 g · cm2 · s−1 das Plancksche Wirkungsquantum ist.
(b) Über den Einschlagsort eines einzelnen Elektrons sind prinzipiell keine Vor-
aussagen möglich. Anders verhält es sich mit dem Beugungsbild als Ergebnis
sehr vieler Einschläge. Wir beschreiben es durch eine Schwärzungsdichte auf
der Fotoplatte derart, dass
466 § 18 Mathematische Probleme der Quantenmechanik


p(Ω) = (x, y) dx dy
Ω

der auf den Bereich Ω der Fotoplatte entfallende Schwärzungsanteil ist. Für den
Kreisring

Ω = {(x, y) | r12 < x2 + y 2 < r22 }

ist demnach mit den Bezeichnungen von (a)

r2 > ∞
p(Ω) = r I(r) dr r I(r) dr ,
r1 0

wobei sich I(r) nach den Gesetzen der Optik ergibt. Im Teilchenbild gibt p(Ω)
die Wahrscheinlichkeit dafür an, einen Einschlag im Bereich Ω zu finden. Eine
solche Wahrscheinlichkeitsaussage lässt sich statistisch überprüfen: Schlagen von
n abgeschossenen Elektronen n(Ω) im Bereich Ω ein, so wird sich die relative
Häufigkeit n(Ω)/n für wachsendes n auf p(Ω) einspielen (Gesetz der großen Zahl,
Präzisierung in § 19 : 3.4).
Dies setzt voraus, dass sich der Versuch unter identischen Bedingungen im Prin-
zip beliebig oft wiederholen lässt. Wir sprechen dann von einer Gesamtheit gleich
präparierter oder im gleichen Zustand befindlicher Elektronen.
Der Zustand der Gesamtheit hängt von der Bauart der Kanone, der Vorspan-
nung und Geometrie des Spalts ab. Wir beschreiben diesen Zustand durch eine
Ê
Wellenfunktion ψ : 2 → mit |ψ|2 = . Die Komplexwertigkeit von ψ gestat-
tet es, Beugung und Interferenz nach dem Vorbild der Optik zu beschreiben.
(c) Schießen wir mit der Elektronenkanone auf einen Doppelspalt, so erhal-
ten wir das Interferenzmuster einer senkrecht auf den Doppelspalt auftreffen-
den ebenen Welle. Dies scheint im Teilchenbild paradox: Nehmen wir an, dass
ein Elektron mit gleicher Wahrscheinlichkeit entweder durch Spalt 1 oder durch
Spalt 2 geflogen ist und sind ψ1 , 1 = |ψ1 |2 Wellenfunktionen und Schwärzungs-
dichte bei geschlossenem zweiten Spalt und ψ2 , 2 = |ψ2 |2 die entsprechenden
Größen bei geschlossenem ersten Spalt, so würden wir eigentlich bei Öffnung
beider Spalte erwarten, dass die Schwärzungsdichte 12 ( 1 + 2 ) ist. Tatsächlich
ist diese aber
>
| ψ1 + ψ2 |2 | ψ1 + ψ2 |2 .
Ê 2

Die Erklärung liegt darin, dass die Frage, welcher der beiden Spalte von ei-
nem Elektron durchflogen wurde, unzulässig ist. Zu ihrer experimentellen Über-
prüfung – etwa durch Beleuchten“ des Elektrons mittels eines Photons – würden

wir den Zustand und damit das Beugungsbild ändern.
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials 467

3 Dynamik eines Teilchens unter dem Einfluß eines Potentials


3.1 Die Schrödinger–Gleichung
(a) Wir betrachten der Einfachheit halber ein spinloses Teilchen der Masse m
im Raum unter dem Einfluß eines Potentials V . Den Zustand einer Gesamtheit
solcher Teilchen zum Zeitpunkt t beschreiben wir durch eine Wellenfunktion

ψt : Ê 3
→ , x → ψ(x, t) .

Wie oben deuten wir


 
p(Ω) := | ψt |2 = | ψ(x, t) |2 d3 x
Ω Ω

im Teilchenbild als die Wahrscheinlichkeit, das Teilchen im Gebiet Ω anzutref-


fen. Demnach ist zu verlangen, dass

| ψt |2 = p(3) = 1 für alle t ∈  .
Ê 3

Unter geeigneten Voraussetzungen über das Potential V und den Anfangszu-


stand ψ0 gilt die zeitabhängige Schrödinger–Gleichung

∂ h̄2
i h̄ ψ(x, t) = − Δψ(x, t) + V (x) · ψ(x, t)
∂t 2m
(Schrödinger: Quantisierung als Eigenwertproblem II, 1926).
√ 
Für ϕt (x) = ϕ(x, t) := α3 ψ(αx, h̄t) mit α := h̄/ m gilt ebenfalls | ϕt |2 = 1,
Ê3
und die Schrödinger–Gleichung geht über in
∂ 1
(∗) i ϕ(x, t) = − Δϕ(x, t) + v(x) · ϕ(x, t)
∂t 2
mit v(x) = V (αx) ÜA . Wir dürfen daher im folgenden die Zahlenwerte von h̄
und m gleich Eins setzen.
Definieren wir den Hamilton–Operator H eines Teilchens im umskalierten Po-
tential v durch
1
Hu = − Δu + v · u ,
2
so erhält Gleichung (∗) die Gestalt

(∗∗) ϕ̇t = − iH ϕt .

Dies ist auch die Form der Schrödinger–Gleichung für allgemeine Hamilton–
Operatoren.
468 § 18 Mathematische Probleme der Quantenmechanik

(b) Wir diskutieren die Schrödinger–Gleichung (∗∗) für den einfachsten Fall
eines Freiheitsgrades der Lage und setzen über das Potential v voraus, dass
für schnellfallende Funktionen u : → Ê
auch v u und damit auch Hu :=
− 12 u + v u zum Schwartzraum S der schnellfallenden Funktionen gehört (vgl.
§ 12 : 3). Mit dem Skalarprodukt

+∞
u1 , u2 = u1 (x) u2 (x) dx
−∞

erhalten wir dann durch zweimalige partielle Integration die Symmetrie von H:

1

+∞ 
+∞
u1 , Hu2 = − 2 u1 u2 + v u1 u2 = Hu1 , u2 .
−∞ −∞

Die Quantenmechanik postuliert, dass die Zeitentwicklung t → ϕt der Wellen-


funktionen (Zustände) eines sich selbst überlassenen Systems determininis-
tisch ist: Für jeden Anfangszustand ϕ0 ∈ S ( ϕ0  = 1 ) soll die Gleichung
(∗∗) eine eindeutig bestimmte, für alle Zeiten definierte Lösung ϕ besitzen.
Wir geben dieser Forderung eine andere Gestalt; dabei lassen wir mathematische
Feinheiten außer Acht und erhalten unter der Annahme ϕt ∈ S für t ∈ 
d d
ϕt 2 = ϕt , ϕt = ϕ̇t , ϕt + ϕt , ϕ̇t
dt dt
= −iHϕt , ϕt + ϕt , −iHϕt

= i ( Hϕt , ϕt − ϕt , Hϕt ) = 0

wegen der Symmetrie von H. Daher ist ϕt  = 1 für alle t ∈  , und

U (t) : S → S , ϕ0 → ϕt

ist eine Isometrie. Für ψt := ϕs+t = U (s + t)ϕ0 gilt dann


d
ψ̇t = ϕs+t = −iH ϕs+t = − iH ψt und ψ0 = ϕs .
dt
Aus der vorausgesetzten Eindeutigkeit der Lösung von (∗∗) folgt
U (s + t)ϕ0 = ψt = U (t)ϕs = U (t) U (s)ϕ0 für alle ϕ0 ∈ S ,
also gilt
U (s + t) = U (s) U (t) für s, t ∈  und U (0) = .
Es folgt
U (−t) U (t) = U (−t) U (t) = U (0) = .
Damit bildet die Schar U (t) : S → S eine Einparametergruppe unitärer
Operatoren.
3 Dynamik eines Teilchens unter dem Einfluß eines Potentials 469

Energieoperatoren H wie H = − 12 Δ + v, für welche die Zeitentwicklung


der Zustände wie oben beschrieben deterministisch ist, heißen Hamilton–
Operatoren. Ein wesentliches Ziel dieses Kapitels ist die Charakterisierung sol-
cher Operatoren und allgemeiner der Operatoren, die eine Einparametergruppe
unitärer Operatoren erzeugen. Die entscheidende Bedingung ist die Selbstadjun-
giertheit, wohl zu unterscheiden von der Symmetrie.

3.2 Stationäre Lösungen und Eigenwertproblem


(a) Der Separationsansatz für die Schrödinger–Gleichung. Wir bleiben
beim eindimensionalen Modell 3.1 (b) und suchen für die Schrödinger–Gleichung

ϕ̇t = −iH ϕt

Lösungen in Produktgestalt

ϕ(x, t) = w(t) v(x) mit w = 0 , v = 1 .

Solche Lösungen müssen für alle x, t ∈ Ê die Bedingung


(∗) ẇ(t) v(x) = − i w(t) (Hv)(x)

erfüllen. Bis auf Nullstellen des Nenners gilt also


ẇ(t) (Hv)(x)
i = .
w(t) v(x)
Daher müssen beide Seiten konstant sein:

Hv = λv, ẇ(t) = −i λw(t)

mit einer Konstanten λ.


Somit sind sämtliche Produktlösungen bis auf multiplikative Konstanten von
der Form

ϕ(x, t) = e−iλt v(x) ,

 Eigenvektor
wobei λ ein Eigenwert von H und v ein zugehöriger  mit v = 1
ist. Wegen der Symmetrie von H ist λ reell, also  e−iλt  = 1. Wir sprechen von
einem stationären Zustand (Bindungszustand), wenn die Zeitabhängigkeit nur
in einem Vorfaktor vom Betrag 1 steckt, Näheres dazu in 4.2.
(b) Physikalische Deutung: Stationäre Zustände sind die einzigen, bei denen
die Energiemessung an einzelnen Objekten jedesmal und unabhängig vom Zeit-
punkt der Messung denselben Wert (hier λ) ergibt.
Der Beweis dieser Aussage ergibt sich aus der Wahrscheinlichkeitsinterpretation
des Spektralsatzes, einem Hauptteil dieses Kapitels.
470 § 18 Mathematische Probleme der Quantenmechanik

3.3 Das Energiespektrum


(a) Der Idealfall: Hamilton–Operatoren mit nichtentartetem diskre-
tem Spektrum.
Für eine Reihe von Potentialen v gibt es eine Folge (λk ) von einfachen Eigen-
werten des Operators H : u → − 12 u + v u mit
λ 0 < λ1 < λ2 < . . . , lim λk = ∞ ,
k→∞

so dass die zugehörigen Eigenvektoren v0 , v1 , v2 , . . . mit Norm 1 ein vollständiges


Orthonormalsystem bilden. Das Paradebeispiel ist der harmonische Oszillator
mit v(x) = 12 x2 . Gehen wir von einer Funktion


ϕ = vk , ϕ vk
k=0

mit ϕ = 1 aus, für die H ϕ Sinn macht, so ist die Lösung des Schrödingerschen
Anfangswertproblems
ϕ̇t = − i H ϕt , ϕ0 = ϕ
gegeben durch


ϕt = vk , ϕ e−iλk t vk .
k=0

Eine solche Lösungsdarstellung ist typisch für allgemeine Hamilton–Operatoren


mit nichtentartetem diskretem Energiespektrum. In diesen Fällen ist ϕt also
Superposition stationärer Lösungen. Bei einer Einzelmessung, etwa an einem
Teilchen, kann nur einer der Werte λ0 , λ1 , . . . anfallen, und die Wahrscheinlich-
keit, dass der Wert λk gemessen wird, ist | vk , ϕ |2 . Der Erwartungswert Eϕ
der Energie, d.h. der sich bei langen Versuchsreihen einstellende mittlere Wert
der Energie für eine Gesamtheit mit Wellenfunktion ϕ zur Zeit t = 0, ist nach
den Regeln der Wahrscheinlichkeitsrechnung


Eϕ = λk | vk , ϕ |2 .
k=0

(b) Kontinuierliches Spektrum. Der Hamilton–Operator H : u → − 12 u


eines (kräfte–)freien Teilchens mit einem Freiheitsgrad besitzt keine Eigenwerte:
Aus Hv = λv , d.h. 12 v  + λv = 0 mit v = 0 folgt in jedem der Fälle λ > 0,

+∞
λ = 0, λ < 0, dass v nicht normierbar“ ist, d.h. dass |v|2 nicht konvergiert.
” −∞
Hier sind die möglichen Energiewerte kontinuierlich verteilt.
(c) Es wird sich später zeigen, dass das Energiespektrum σ(H) eines Hamilton–
Operators H, d.h. die Menge der möglichen Energiewerte, auch sein Spektrum
im mathematischen Sinne ist; das sind grob gesagt alle Werte λ, für die H − λ½
4 Das mathematische Modell der Pionier–Quantenmechanik 471

nicht invertierbar ist. Im Fall (a) besteht das Spektrum nur aus den Eigenwerten
λ0 , λ1 , . . . , d.h. aus den Zahlen λ, für die H − λ½ nicht injektiv ist. Für den
Fall (b) zeigen wir später σ(H) = + .
(d) Die Grobstruktur des Wasserstoffspektrums. Wir betrachten ein
Elektron mit Masse m und Ladung e unter dem Einfluß eines Coulombpotenti-
als
1 e2 h̄2
V (x) = − · mit Hamilton–Operator H : u → − Δu + V u ,
4πε0 x 2m
(dessen Definitionsbereich noch geeignet festzulegen ist). Hier ergibt sich ein
gemischtes Spektrum, und zwar ein Eigenwertspektrum
0 < λ0 < λ1 < . . . mit lim λk = η < ∞
k→∞

und ein kontinuierliches Spektrum [η, ∞[ jenseits der Ionisierungsenergie η.


Die Feinstruktur des Wasserstoffspektrums ergibt sich durch Auffassung des
Wasserstoffatoms als Zweiteilchensystem und Einbeziehung des Drehimpulses
sowie des Spins. Für Einzelheiten siehe Cohen–Tannoudji [157] Vol. 2, Ch. XII.

4 Das mathematische Modell der Pionier–Quantenmechanik


4.1 Systemhilberträume
Jedem quantenmechanischen System wird ein Systemhilbertraum H über
 zugeordnet; dieser enthält die Zustandsvektoren.
Wir geben einige Beispiele.
(a) Bei einem Teilchen mit einem Freiheitsgrad der Lage ist dies der Raum

H = L2 ( ) aller (messbaren) Funktionen f : → , für die |f |2 integrierbar
ist, versehen mit dem Skalarprodukt

+∞
f,g = f (x) g(x) dx .
−∞
Die Integrale sind dabei im Lebesgueschen Sinn zu verstehen, Näheres in § 20.
(b) Entsprechend wählen wir L2 ( 3) als Systemhilbertraum zur Beschreibung
eines im Raum frei beweglichen, spinlosen Teilchens unter dem Einfluß eines
Potentials.
(c) Für ein im Raumgebiet Ω ⊂ 3 eingesperrtes, spinloses Teilchen dient
L2 (Ω) als Systemhilbertraum. Für Modellrechnungen wird häufig der eindimen-
sionale Fall Ω = ]a, b[ betrachtet.
(d) Ein Teilchen im Raum mit Spin ± 21 wird beschrieben durch zwei Wellen-
funktionen ϕ+ (für Spin 12 ) und ϕ− (für Spin − 12 ). Als Systemhilbertraum dient
hier das kartesische Produkt
  
H = (ϕ+ , ϕ− )  ϕ+ , ϕ− ∈ L2 ( 3
)
472 § 18 Mathematische Probleme der Quantenmechanik

mit dem Skalarprodukt


 
(ϕ+ , ϕ− ) , (ψ+ , ψ− ) := ϕ+ , ψ+ + ϕ− , ψ− ,

wobei u , v = u v d3 x . Dieser Hilbertraum wird auch mit L2 ( Ê )⊗
3 2

Ê3
bezeichnet. Lassen sich Spinphänomene abkoppeln, so genügt zu ihrer Beschrei-
bung der Hilbertraum 2 .
(e) Als Systemhilbertraum für ein System von m spinlosen Teilchen dient
L2 (3m ).
(f) Auf kompliziertere Situationen wie Vielteilchensysteme und die zugehörigen
Systemhilberträume gehen wir hier nicht ein.

4.2 Zustände
(a) Der Zustand eines klassisch–mechanischen Systems wird beschrieben durch
einen Punkt im Phasenraum. Das Verhalten des Systems in Zukunft und Vergan-
genheit ist durch den Zustand zu einem Zeitpunkt determiniert. Der Zustands-
begriff der Quantenmechanik soll ähnliches leisten. Dieser kann sich daher nicht
auf eine Einzelmessung am System beziehen, sondern auf das statistische Ver-
halten einer Gesamtheit gleich präparierter Systeme derselben Art, idealisiert
durch zugrundeliegende Wahrscheinlichkeiten.
In 3.1 hatten wir den Zustand eines Einteilchensystems
 zur Zeit t durch eine
Wellenfunktion ϕ = ψt beschrieben und |ϕ(x)|2 d3 x als Wahrscheinlichkeit
Ω
gedeutet, das Teilchen in Ω anzutreffen. Entsprechend repräsentieren wir fürs
erste den Zustand eines beliebigen Systems zu einem festen Zeitpunkt durch
einen Vektor ϕ des Systemhilbertraumes mit ϕ = 1 (Zustandsvektor), wo-
bei jeder Vektor c · ϕ mit |c| = 1 für denselben Zustand steht. Wollen wir dem
Zustand selbst eindeutig ein mathematisches Objekt zuordnen, so können wir
hierfür den von einem Zustandsvektor ϕ aufgespannten eindimensionalen Teil-
raum ( Strahl“) S = Span {ϕ} wählen.

(b) Die so beschriebenen Zustände heißen Vektorzustände oder im Rahmen
der Pionier–Quantenmechanik reine Zustände. Später werden wir auch gemisch-
te Zustände (inkohärente Überlagerungen) in Betracht ziehen. In dieser Hinsicht
ist es zweckmäßig, einen Vektorzustand nicht durch einen Strahl S = Span {ϕ}
darzustellen, sondern durch den orthogonalen Projektor auf S,

Pϕ : ψ −→ ϕ , ψ ϕ .

Es ist leicht nachzurechnen, dass Pcϕ = Pϕ für |c| = 1 ÜA . Wird ein Zustand
also durch den Vektor e−iλt ϕ mit λ ∈  beschrieben, so ist er zeitunabhängig,
vgl. 3.2 (a).
4 Das mathematische Modell der Pionier–Quantenmechanik 473

(c) Der Projektor Pϕ : ψ → ϕ , ψ ϕ wird auch mit

Pϕ = | ϕ ϕ|,

bezeichnet, dies in Anlehnung an die von Dirac 1930 vorgeschlagene Bracket–


Schreibweise, die wir darüber hinaus im Interesse einer übersichtlichen Notation
selten übernehmen, vgl. die Anmerkung in § 9 : 2.8.

4.3 Observable
(a) Quantisierung. Klassischen Beobachtungsgrößen (Observablen) wie Orts-
koordinaten qx , qy , qz , Impulskoordinaten px , py , pz , kinetischer Energie
1
2m
(p2x +p2y +p2z ) , Hamiltonfunktion (Gesamtenergie), Drehimpuls usw. werden
im Hilbertraumformalismus der Quantenmechanik lineare Operatoren auf dem
Systemhilbertraum H zugeordnet:

Klassische Observable a ←→ linearer Operator A .

Die Quantisierungsvorschrift a ←→ A sollte bestimmten Verträglichkeitsbedin-


gungen genügen, z.B. a2 ←→ A2 , falls a ←→ A, mit Einschränkungen auch
a + b ←→ A + B , falls a ←→ A und b ←→ B.

(b) Beispiele. Für ein Teilchen mit einem Freiheitsgrad lautet die Vorschrift
Ort q ←→ Ortsoperator Q, gegeben durch ϕ → x · ϕ ,
Impuls p ←→ Impulsoperator P = h̄ d
i dx
,
Potential v ←→ Multiplikationsoperator V : ϕ → v · ϕ .

Nach dem unter (a) Gesagten müssen wir der kinetischen Energie 1
2m
p2 den
Operator 1
2m
P 2 und der Gesamtenergie h = 1
2m
p2 + v(q) den Energie–
Operator (bzw. Hamilton–Operator) H = 1
2m
P 2 + V zuordnen, also

h̄2
kinetische Energie ←→ 1
2m
P2 : ϕ → − 2m
ϕ ,
2
Gesamtenergie h ←→ H : ϕ → − 2m

ϕ + v · ϕ .

Analog für ein Teilchen im Raum:

Ortskoordinate qk ←→ Ortsoperator Qk : ϕ → xk · ϕ , (k = 1, 2, 3),


Impulskoordinate pk ←→ Impulsoperator Pk = h̄ ∂
i xk
, (k = 1, 2, 3),
2
Gesamtenergie h ←→ Hamilton–Operator H : ϕ → − 2m

Δϕ + v · ϕ .
474 § 18 Mathematische Probleme der Quantenmechanik

Für alle genannten Operatoren A müssen geeignete Definitionsbereiche D(A)


festgelegt werden. Für Orts– und Impulsoperatoren kann das der Schwartzraum
S sein, für den Operator ϕ → v · ϕ die Menge {ϕ ∈ L2 | v · ϕ ∈ L2 }; dabei
Ê Ê
steht L2 für L2 ( ) bzw. für L2 ( 3). Wesentlich ist, dass die Definitionsbereiche
in den jeweiligen Systemhilberträumen dicht liegen.
(c) Den hier angegebenen Quantisierungsvorschriften lagen ursprünglich kei-
ne systematischen Begründungen, sondern intuitive Einsichten der Pioniere zu-
grunde. Eine ad–hoc–Rechtfertigung geben wir beispielhaft in 4.5*. Das Quanti-
sierungsproblem ist noch weitgehend offen. Eine Reihe von Quantisierungsregeln
lässt sich im Zusammenhang mit dem Satz von Stone (§ 25) verstehen.
(d) Eine besondere Rolle spielen orthogonale Projektoren, das sind lineare Ope-
ratoren
P : H → H mit P 2 = P und ϕ, P ψ = P ϕ, ψ für ϕ, ψ ∈ H .
Diese entsprechen dem Ausgang eines Ja/Nein–Experiments. Ist z.B. Ω ein
Ê
Gebiet des 3, so ist P : ϕ → χΩ ·ϕ mit der Frage Teilchen in Ω ?“ verbunden.

Da bei vorgegebener Messgenauigkeit und einer darauf abgestimmten Skala das
Messergebnis für eine Observable durch eine Folge von Ja/Nein–Fragen ermittelt
werden kann, liegt die Vorstellung nahe, dass sich jede Observable aus ortho-
gonalen Projektoren aufbauen lässt. Das ist in der Tat richtig; die Präzisierung
und den Beweis dieses Sachverhalts liefert der Spektralsatz (§ 25).
Eine wichtige Rolle spielen orthogonale Projektoren auch für neuere Ansätze
zur Grundlegung der Quantenmechanik auf der Basis des Propositionenkalküls
(auch Quantenlogik genannt), zu finden in Jauch [136] und Primas [139].

4.4 Erwartungswerte von Observablen


(a) Für eine feste Observable a gehört zu jedem Zustandsvektor ϕ ein Wahr-
Ê
scheinlichkeitsmaß μϕ auf . Dieses gibt für ein beliebiges Intervall I die Wahr-
scheinlichkeit μϕ (I) an, dass die beobachteten Werte von a für ein System im
Zustand | ϕ ϕ | ins Intervall I fallen. Wir konstruieren es im Zusammenhang
mit dem Spektralsatz.
Für ein Teilchen mit einem Freiheitsgrad im Zustand | ϕ ϕ | ist z.B.

μϕ (I) = |ϕ|2
I

die Wahrscheinlichkeit, dass der Ort des Teilchens im Intervall I ist, vgl. 3.1. Hat
der Hamilton–Operator H dieses Einteilchensystems ein diskretes Spektrum, so
ist mit den Bezeichnungen 3.3 (a)

νϕ (I) = | vk , ϕ |2
λk ∈I

die Wahrscheinlichkeit, dass die Energie Werte aus I annimmt.


4 Das mathematische Modell der Pionier–Quantenmechanik 475

(b) Im nächsten Paragraphen definieren wir den Erwartungswert μ / eines Wahr-


Ê
scheinlichkeitmaßes μ auf . Dabei ergibt sich für die Beispiele (a)

+∞ 
+∞
/ϕ =
μ x | ϕ(x) |2 dx = ϕ(x) x ϕ(x) dx = ϕ , Qϕ ,
−∞ −∞



ν/ϕ = λk | vk , ϕ |2 = ϕ , Hϕ .
k=0

Dass die Reihe den Wert ϕ , Hϕ ergibt, wollen wir hier nicht nachrechnen.
Ebensowenig gehen wir auf die Frage nach der Konvergenz des Integrals bzw.
der Reihe ein. Wichtiger ist folgendes: Genügt die Zeitentwicklung eines Zustan-
des der Schrödinger–Gleichung ϕ̇t = −iHϕt , so sind die Erwartungswerte ν/ϕt
zeitunabhängig, denn mit den Bezeichnungen 3.3 (a) ist
     
 vk , ϕt  =  e−iλk t vk , ϕ0  =  vk , ϕ0  .

(c) Allgemein gilt: Entspricht der Observablen a der Operator A und liefert
μϕ die Verteilung der Beobachtungswerte von a im Zustand | ϕ ϕ | , so ist für
ϕ ∈ D(A)
/ϕ = ϕ , Aϕ .
μ
Dies wird sich aus dem Spektralsatz ergeben.
(d) Zur Deutung von μ /ϕ . Machen wir N Beobachtungen der Observablen a
an einem System im Zustand | ϕ ϕ |, so erhalten wir zufällig schwankende
Beobachtungswerte a1 , . . . , aN , obwohl die Versuchsbedingungen (die durch ϕ
beschriebene Präparation) immer gleich sind. Für wachsende Versuchszahlen N
spielt sich der mittlere Wert N1 (a1 + . . . + aN ) immer besser auf μ /ϕ ein. Ge-
setzmäßigkeiten können sich daher nur auf μ /ϕ beziehen, und ihre experimentelle
Überprüfung erfordert die statistische Analyse von Versuchsreihen. Dafür spielt
die in § 19 : 3.1, § 20 : 6.3 definierte Streuung eine wesentliche Rolle.
Es lässt sich zeigen, dass ein Operator A durch die Erwartungswerte ϕ , Aϕ für
alle ϕ ∈ D(A) eindeutig bestimmt ist. Dies gibt uns im folgenden die Möglich-
keit, zwei einfache Quantisierungsvorschriften plausibel zu machen.

4.5* Zum Orts– und Impulsoperator für einen Freiheitsgrad


(a) Für ein Teilchen mit einem Freiheitsgrad ist der Erwartungswert des Orts
im Zustand | ϕ ϕ | mit ϕ ∈ S nach 4.4 (b) gegeben durch ϕ , Qϕ wobei
(Qϕ)(x) = x ϕ(x). Nach dem soeben Gesagten schließen wir darauf, dass Q der
Ortsoperator ist.

(b) Für eine ebene harmonische Welle, die im Raum in Richtung der x–Achse
fortschreitet, ist die x–Komponente der Wellenerregung

ψ(x, t) = A · ei(kx−ωt) ,
476 § 18 Mathematische Probleme der Quantenmechanik

dabei ist ω die Kreisfrequenz und k die Wellenzahl.


Ein durch ψ(x, t) = e−iωt ϕ(x) beschriebener stationärer Zustand setzt sich inte-
grativ aus harmonischen ebenen Wellen zusammen, denn nach dem Umkehrsatz
für die Fouriertransformation gilt
1 +∞ 
ψ(x, t) = √ /(k) ei(kx−ωt) dk .
ϕ
2π −∞
Dabei leisten alle Wellenzahlen einen Beitrag. Aus der Parsevalschen Gleichung
folgt

+∞ 
+∞ 
+∞
1 = | ψ(x, t) |2 dx = | ϕ(x) |2 dx = / |2 dk .
| ϕ(k)
−∞ −∞ −∞

Wir deuten daher |ϕ/| als Wellenzahldichte: Der Anteil der ins Intervall [a, b]
2

fallenden Wellenzahlen ist


b
/ |2 dk ,
| ϕ(k)
a

interpretiert als Wahrscheinlichkeit, dass eine Wellenzahl im Intervall [a, b] liegt.


Legen wir weiter mit de Broglie die Beziehung p = k h̄ zugrunde, so ist die
Wahrscheinlichkeit, dass der Impuls ins Intervall [p1 , p2 ] fällt und damit die
Wellenzahl in das Intervall [p1 /h̄, p2 /h̄] = [k1 , k2 ], nach der Substitutionsregel
k2 1 p2
μϕ ([p1 , p2 ]) = / |2 dk =
| ϕ(k) / h̄y ) |2 dy .
| ϕ(
k1
h̄ p1

/ ( h̄y ) |2 als Impulsdichte. Für den Erwartungswert


Wir deuten daher (y) := h̄1 | ϕ
/ϕ des Impulses im Zustand | ϕ ϕ | erhalten wir gemäß der schon in 4.4 (b)
μ
verwendeten Formel und mit Hilfe der Substitution y = h̄ x
+∞  
+∞
/ϕ =
μ y (y) dy = / |2 dx = h̄ ϕ/ , Qϕ
x | ϕ(x) / .
−∞ −∞

/ = −i ϕ/ , und wegen der Isometrie der Fouriertransfor-


Nach § 12 : 2.2 gilt Q ϕ
mation ergibt sich schließlich
h̄ 
μ / , −iϕ/
/ϕ = h̄ ϕ = h̄ ϕ , −iϕ = ϕ, P ϕ ϕ. mit P ϕ :=
i
Nach der letzten Bemerkung in 4.4 schließen wir, dass P der Impulsoperator
ist.
Dies war eine Plausibilitätsbetrachtung mit vielen ad-hoc–Annahmen. Eine
überzeugendere Begründung für die Wahl von P geben wir in § 25.
477

§ 19 Maß und Wahrscheinlichkeit

1 Diskrete Verteilungen
1.1 Bernoulli–Experimente
Wir betrachten Ja/Nein–Experimente, bei denen nur die Frage interessiert, ob
ein bestimmter Effekt eintritt oder nicht. Beispiele hierfür sind der Münzwurf
(Frage: Zahl“?), Geburtenstatistik (Frage: Knabe“?) oder bei Observablen der
” ”
Physik die Fragestellung Wert im Intervall I“? Wir denken uns das Experiment

unter gleichen Bedingungen beliebig oft wiederholbar, wobei das Ergebnis einer
Einzelmessung nicht vorhersehbar ist. Der interessierende Effekt trete bei N –
maliger Wiederholung kN –mal auf. Dann lehrt die Erfahrung, dass sich die

kN
relative Häufigkeit hN :=
N

für wachsendes N auf eine Zahl p ∈ [0, 1] einpendelt (Gesetz der großen Zahl).
Wir unterstellen im folgenden die Existenz einer solchen Erfolgswahrscheinlich-
keit p; dabei stehen p = 1 bzw. p = 0 für die Extremfälle, dass der Effekt mit
Sicherheit eintritt bzw. nicht eintritt.
Wie urteilen wir über p? Beim Münzwurf unterstellen wir, solange nichts Näher-
es bekannt ist, aus Symmetriegründen p = 12 (ideale Münze). Entsprechend
schätzen wir die Wahrscheinlichkeit für Sechs“ beim Würfelspiel auf p = 16

und die Komplementärwahrscheinlichkeit für nicht Sechs“ auf 1 − p = 56 ein.

Karl Pearson, ein Pionier der Wahrscheinlichkeitstheorie, erzielte zu Beginn
des 20. Jahrhunderts bei 24000 Münzwürfen 12012–mal die Zahl“, was die

Einschätzung p = 12 gut bestätigte. Hätte er 12480–mal Zahl“ erzielt, würde
1 ”
er die Annahme p = 2 verworfen haben, da eine relative Häufigkeit von 0.52
oder mehr unter dieser Annahme und bei so vielen Versuchen extrem unwahr-
scheinlich wäre, wie unwahrscheinlich, werden wir noch ausrechnen.
Pearson hätte wohl aufgrund der Statistik die Erfolgswahrscheinlichkeit als
12480
24000
= 0.52 geschätzt. Dies entspricht der empirischen relativen Häufigkeit
von Knabengeburten. Für das Folgende halten wir fest:
Wahrscheinlichkeitsaussagen und empirische Befunde sollen über das (in 3.4
präzisierte) Gesetz der großen Zahl aufeinander bezogen sein. Daher ist die
Wahrscheinlichkeitsrechnung so zu konzipieren, dass sie konsistent mit der Häu-
figkeitsrechnung ist.
Für sich gegenseitig ausschließende Ereignisse bedeutet dies insbesondere, dass
sich ihre Wahrscheinlichkeiten addieren, da dies auch für die entsprechenden
relativen Häufigkeiten der Fall ist.
478 § 19 Maß und Wahrscheinlichkeit

1.2 Der Produktsatz


Wir führen nach einem Bernoulli–Experiment mit Erfolgswahrscheinlichkeit p1
ein Zweites durch, dessen Erfolgswahrscheinlichkeit (unabhängig vom Ausgang
des ersten) p2 sei. Das Ergebnis protokollieren wir wie folgt:
(1, 1) : beidesmal Erfolg,
(1, 0) : beim ersten Mal Erfolg, beim zweiten Mal Mißerfolg,
(0, 1) : beim ersten Mal Mißerfolg, beim zweiten Mal Erfolg,
(0, 0) : beidesmal Mißerfolg.
Dann ist für die Wahrscheinlichkeiten dieser vier Versuchsausgänge des Gesamt-
experiments der Reihe nach p1 · p2 , p1 · (1 − p2 ), (1 − p1 ) · p2 , (1 − p1 ) · (1 − p2 )
anzusetzen. Wir machen uns dies für das Versuchsergebnis (1, 0) klar, wobei wir
0 < p1 , p2 < 1 annehmen. Bei einer sehr großen Zahl N von Wiederholungen des
Doppelexperiments sei M –mal im ersten Teilexperiment ein Erfolg eingetreten.
Es ist dann auch M  1, also nach dem Gesetz der großen Zahl M ≈ N · p1 .
Innerhalb dieser M Versuche sei L–mal beim zweiten Teilexperiment ein Miß-
erfolg zu verzeichnen. Nach dem Gesetz der großen Zahl ist L ≈ M (1 − p2 )
und
L M (1 − p2 )
≈ ≈ p1 · (1 − p2 )
N N
die relative Häufigkeit von (1, 0). Die anderen Fälle sind analog zu analysieren.
Die oben vorausgesetzte Unabhängigkeit des zweiten Versuchsausgang vom Er-
gebnis des ersten ist eine Modellannahme, die im konkreten Anwendungsfall zu
rechtfertigen ist!

1.3 Die Binomialverteilung


Ein Bernoulli–Experiment werde n–mal hintereinander mit jeweils gleicher Er-
folgswahrscheinlichkeit p ausgeführt. Das Gesamtergebnis protokollieren wir
durch ein n–Tupel aus Nullen und Einsen (1 steht für Erfolg). Durch mehr-
fache Anwendung des Produktsatzes 1.2 erhält jedes n–Tupel mit k Einsen und
n − k Nullen die Wahrscheinlichkeit pk · (1 − p)n−k . Die Anzahl Xn der Einsen
in einem n–Tupel hängt vom Zufall ab. Für die Wahrscheinlichkeit P (Xn = k)
dafür, dass genau k Einsen auftreten gilt
n
P (Xn = k) = pk (1 − p)n−k .
k

Denn es gibt nk Realisierungsmöglichkeiten des Ergebnisses Xn = k (Induk-
tion, ÜA ), und jede Realisierungsmöglichkeit hat dieselbe Wahrscheinlichkeit
pk · (1 − p)n−k . Da sich diese Möglichkeiten ausschließen, addieren sich ihre
Wahrscheinlichkeiten nach 1.1.
1 Diskrete Verteilungen 479

Allgemein heißt eine Zufallsgröße X mit möglichen Werten in

Ωn := {0, 1, . . . , n}

binomialverteilt (genauer: b(n, p)–verteilt mit 0 ≤ p ≤ 1), wenn


 
n k
P (X = k) = p (1 − p)n−k für k = 0, . . . , n .
k
Die Wahrscheinlichkeit P (X ∈ A) dafür, dass die Werte von X in eine beliebige
Teilmenge A von Ê
fallen, definieren wir durch
  n
P (X ∈ A) := P (X = k) = pk (1 − p)n−k .
k
k∈A k∈A

Diese Formel ist so zu verstehen, dass P (X ∈ A) = 0, falls A ∩ Ωn = ∅. Da die


Werte von X mit Sicherheit in die Menge Ωn fallen, muss P (X ∈ Ωn ) = 1 sein.
In der Tat gilt
n  
 n
P (X ∈ Ωn ) = pk (1 − p)n−k
k
k=0

= (p + (1 − p))n = 1n = 1
nach dem binomischen Lehrsatz.

1.4 Radioaktiver Zerfall und Poisson–Verteilung


(a) Rutherford, Chadwick und Ellis beschrieben 1920 ein Experiment,
bei dem in einem Zeitraum von 326 Minuten in einem Zählrohr N = 10094
Anschläge aufgetreten waren. Sie teilten den Zeitraum in 2608 Intervalle zu
7.5 Sekunden und bestimmten die Zahl z(k) der Intervalle mit k Anschlägen
z(k)
(k = 0, 1, 2, . . .). Für die relativen Häufigkeiten h(k) = 2608 ergab sich in guter
Näherung

λk −λ
h(k) ≈ e mit λ = 3.87 .
k!
k
(b) Die Idee, einen Ansatz h(k) = λk! e−λ mit λ > 0 zu machen und λ an die
Beobachtungsdaten anzupassen, stammt von Poisson (1832). Poisson zeigte für
die Binomialverteilung 1.3: Bleibt n · p konstant gleich λ > 0, so gilt
n λk −λ
lim pk (1 − p)n−k = e
n→∞ k k!
(Beweis als ÜA ).
Daher kann der Poissonsche Ansatz zur Beschreibung seltener Ereignisse dienen
(n groß, p = nλ klein).
480 § 19 Maß und Wahrscheinlichkeit

1.5 Diskrete Verteilungen


(a) Eine Zufallsgröße X heißt diskret verteilt, wenn die Menge ΩX der mög-
lichen Werte für X eine höchstens abzählbare Teilmenge von ist und wenn Ê
jedem x ∈ ΩX eine positive Zahl P (X = x) zugeordnet ist mit

P (X = x) = 1 .
x∈ΩX

Dabei bedeutet P (X = x) die Wahrscheinlichkeit dafür, dass X den Wert x


annimmt.
Diese Definition schließt zwei Fälle ein:
Den endlichen Fall
 
n
ΩX = {x0 , . . . , xn } , P (X = x) := P (X = xk ) = 1 ,
x∈ΩX k=0

vgl. 1.3, und den Fall, dass ΩX aus unendlich vielen verschiedenen Zahlen
x0 , x1 , . . . besteht. Im letzteren Fall ist
 

P (X = x) := P (X = xk ) = 1 .
x∈ΩX k=0

Die Art der Durchnumerierung von ΩX (für ΩX = bietet sich nicht nur eine
Möglichkeit an) spielt keine Rolle; dies folgt aus dem Umordnungssatz Bd. 1,
§ 7 : 6.3. Ein Beispiel bieten Poisson–verteilte Zufallsgrößen, d.h. Zufallsgrößen
X mit ΩX = 0 = {0, 1, 2, . . .},

λk −λ 

λk
P (X = k) = e , e−λ = 1 ,
k! k!
k=0

vgl. 1.4.
Für die gemeinsame mathematische Behandlung beider Fälle nehmen wir ΩX
als unendlich an, ΩX = {x0 , x1 , x2 , . . .}, und lassen ggf. zu, dass
pk := P (X = xk )
den Wert Null hat.
(b) Für beliebige Mengen A ⊂  definieren wir
 

P (X ∈ A) := P (X = xk ) = pk χA (xk ) ,
xk ∈A k=0

wobei P (X ∈ ∅) := 0 gesetzt wird. Dabei ist zu beachten, dass der mittlere


Term eine endliche Summe oder eine unendliche Reihe sein kann. Es ist klar,
dass P (X ∈ A) als Wahrscheinlichkeit zu deuten ist, dass die X–Werte in die
Menge A fallen. Nach Voraussetzung ist dann P (X ⊂ ) = 1.
1 Diskrete Verteilungen 481

(c) Für μ(A) := P (X ⊂ A) mit A ⊂ Ê gilt also


(i) μ(A) ≥ 0 für alle A ⊂ Ê,
(ii) μ({x}) > 0 für höchstens abzählbar viele x,

(iii) μ(A) = μ({x}),
x∈A
Ê
(iv) μ( ) = 1.

Ê
Allgemein heißt eine Mengenfunktion mit den Eigenschaften (i)–(iv) diskrete
Verteilung oder diskretes Wahrscheinlichkeitsmaß auf . Die Menge
supp μ := {x ∈ Ê
| μ({x}) > 0} heißt Träger von μ. Wir sagen auch: μ lebt
auf supp μ.

1.6 Beispiele
(a) Relative Häufigkeiten.
Sei X eine Zufallsgröße mit ΩX = {x0 , x1 , . . . }. Bei N Beobachtungen von X


sei zk –mal der Messwert xk angefallen (k = 0, 1, 2, . . .). Dann ist zk = N ,
k=0
wobei in der Reihe nur endlich viele Glieder von Null verschieden sind. Die
relative Häufigkeit der in eine Menge A fallenden Beobachtungswerte,
1 
hN (A) = zk ,
N
xk ∈A

liefert eine diskrete Verteilung hN auf Ê mit endlichem Träger.


(b) Das Dirac–Maß δa beschreibt eine scharfe Messung, d.h. einen Versuch,
bei dem mit Sicherheit immer der Messwert a ∈ Ê
anfällt. Für die zugehörige
Beobachtungsgröße X gilt also
(
1 für a ∈ A,
δa (A) = P (X ∈ A) =
0 sonst.

1.7 Eigenschaften diskreter Verteilungen


(a) Für eine diskrete Verteilung μ gilt

(W1 ) μ(A) ≥ 0 für alle A ⊂ Ê,


Ê
(W2 ) μ( ) = 1 ,
7
∞ 

(W3 ) μ( Ak ) = μ(Ak ) , falls Ai ∩ Aj = ∅ für i = j (σ–Additivität).
k=1 k=1
482 § 19 Maß und Wahrscheinlichkeit

Beweis.
(W1 ), (W2 ) folgen unmittelbar aus der Definition 1.5 (c).
Zum Nachweis von (W3 ) wählen wir, um die Fallunterscheidung zwischen end-
lichem/nicht endlichem Träger zu vermeiden, eine abählbar unendliche Menge
Ω = {x0 , x1 , . . .} mit supp μ ⊂ Ω. Ferner setzen wir pk := μ({xk }) (k =
7

0, 1, . . .) und A := Ak .
k=1
Dann gilt nach Definition
 

μ(Ak ) = pi = pi χAk (xi ) .
xi ∈Ak i=0

Wegen Ai ∩ Aj = ∅ für i = j enthält die Reihe




χA (xi ) = χAk (xi )
k=1
höchstens ein von Null verschiedenes Glied. Wir erhalten

∞ 
∞ 
∞ ∞ 
 ∞ 
μ(A) = pi χA (xi ) = pi χAk (xi ) = pi χAk (xi ) .
i=0 i=0 k=1 i=0 k=1

Da alle auftretenden Glieder nicht negativ sind, folgt aus dem großen Umord-
nungssatz Bd. 1, § 7 : 6.6
∞ 
 ∞ 

μ(A) = pi χAk (xi ) = μ(Ak ) . 2
k=1 i=0 k=1

(b) Folgerungen aus (W1 ), (W2 ), (W3 ).


(i) μ( Ê \ A) = 1 − μ(A) .
7
N 
N
(ii) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak
k=1 k=1

(endliche Additivität).
(iii) μ(A) = μ(A ∩ B) + μ(A \ B).
(iv) A ⊂ B =⇒ μ(A) ≤ μ(B) .
(v) μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B) für beliebige Mengen A, B ⊂ Ê.
Beweis.
Im Hinblick auf spätere Verallgemeinerungen stützen wir uns nur auf (W1 ),
7
∞ 

(W2 ), (W3 ). Aus (W3 ) folgt zunächst μ(∅) = μ( ∅) = μ(∅), also μ(∅) = 0.
k=1 k=1
Für (ii) setzen wir AN+1 = AN+2 = · · · := ∅ und erhalten aus (W3 )
7
N 7
∞ 
∞ 
N
μ( Ak ) = μ( Ak ) = μ(Ak ) = μ(Ak ) .
k=1 k=1 k=1 k=1
2 Erwartungswert und Streuung einer diskreten Verteilung 483

Ê
(i) folgt nun aus (ii) wegen μ( ) = 1 und Ê = A ∪ (Ê \ A), A ∩ (Ê \ A) = ∅.
(iii), (iv) und (v) als ÜA (Venn–Diagramm). 2

2 Erwartungswert und Streuung einer diskreten Verteilung


2.1 Erwartungswerte
(a) Für eine Zufallsgröße X mit möglichen Werten x0 , x1 , . . . , xn definieren wir
den Erwartungswert E(X) = X / durch

n
/ :=
E(X) = X xk P (X = xk ) .
k=0

Sind unendlich viele verschiedene Werte x0 , x1 , . . . möglich, so setzen wir




/ :=
E(X) = X xk P (X = xk ) ,
k=0

falls diese Reihe absolut konvergiert. Diese Bedingung sichert die Unabhängig-
keit von der Nummerierung der möglichen Beobachtungswerte (Umordnungs-
satz Bd. 1, § 7 : 6.3). Der Erwartungswert muss nicht existieren, wie das Beispiel
1
P (X = k) = (k+1)(k+2) (k = 0, 1, 2, . . .) zeigt.
Den Erwartungswert μ / einer diskreten Verteilung μ mit Träger in der
abzählbaren Menge {x0 , x1 , . . .} definieren wir ganz entsprechend:

∞ 

/ :=
μ xk μ({xk }), falls |xk | μ({xk }) < ∞ .
k=0 k=0

(b) Wir interpretieren X / als den bei häufigen Beobachtungen zu erwartenden


Durchschnittswert und verstehen dies wie folgt: Für die Zufallsgröße X, von
der wir einfachheitshalber ΩX = {x0 , . . . , xn } annehmen, seien bei N Beobach-
tungen z0 –mal der Wert x0 , . . . , zn –mal der Wert xn angefallen (zk ∈ 0 ). 
Nach dem Gesetz der großen Zahl erwarten wir, dass die relativen Häufigkeiten
hk = zk /N der Beobachtungswerte xk annähernd gleich ihren Wahrscheinlich-
keiten pk = P (X = xk ) sind. Für den empirischen Mittelwert, d.h. das arith-
metische Mittel x aller beobachteten Werte gilt dann
1 n n n
/.
x = zk x k = hk xk ≈ xk pk = X
N k=0 k=0 k=0

2.2 Beispiele
(a) Für die in 1.3 definierte Binomialverteilung μ = b(n, p) erhalten wir

n n 
n
n!
/ =
μ k pk (1 − p)n−k = k pk (1 − p)n−k =
k k! (n − k)!
k=0 k=1
484 § 19 Maß und Wahrscheinlichkeit

n   n−1  
 n−1  n−1
= n pk (1 − p)n−k = n p pm (1 − p)n−1−m
k−1 m
k=1 m=0

= n p (p + 1 − p) n−1
= np ,

was zu erwarten war.


Insbesondere ergibt sich für ein Bernoulli–Experiment mit Erfolgswahrschein-
lichkeit p (also ΩX = {0, 1}, P (X = 0) = 1 − p, P (X = 1) = p) der Erwar-
tungswert p.

(b) Für die durch μ(A) = e−λ λk / k! mit λ > 0 gegebene Poisson–Ver-
k∈ 0∩A
/ = λ (vgl. 1.4)
teilung erhalten wir μ ÜA .

(c) Das Banachsche Schlüsselproblem. Sie stehen im Dunkeln vor der Haustür
und wollen aus Ihrem Schlüsselbund mit n Schlüsseln den richtigen durch Pro-
bieren finden. Im Fall n = 2 genügt ein Versuch. Mit wie vielen Versuchen
müssen Sie im Mittel rechnen, wenn Sie
(i) jeden nichtpassenden Schlüssel zurückhalten und mit den restlichen weiter-
probieren,
(ii) dazu nicht mehr in der Lage sind?

2.3 Der Erwartungswert einer transformierten Zufallsgröße


(a) Sei X eine Zufallsgröße mit möglichem Wertebereich ΩX = {x0 , x1 , . . .}
und f eine auf einem ΩX umfassenden Intervall I definierte reellwertige Funkti-
on. Ordnen wir jedem beobachteten Wert x für X den Wert f (x) zu, so erhalten
wir eine Zufallsgröße Y , die wir als transformierte Zufallsgröße f (X) bezeich-
nen. Solche Messtransformationen sind insbesondere für die Quantenmechanik
von Interesse, wo mikroskopische Observable meist indirekt beobachtet werden.
Der Zufallsgröße Y ist in natürlicher Weise eine diskrete Verteilung zugeordnet:
Mit ΩX ist auch die Menge ΩY = f (ΩX ) der möglichen Werte von Y höchstens
abzählbar. Da die Aussagen y = f (x) und x ∈ f −1 ({y}) äquivalent sind, ist

P (Y = y) = P (X ∈ f −1 ({y})) .

Beachten Sie dabei, dass f nicht injektiv sein muss. Daher kann auch im Fall,
dass ΩX = {x0 , x1 , . . .} abzählbar ist, ΩY = {y0 , y1 , . . .} endlich sein. Für
Bm := f −1 ({ym }) gilt
7
(1) Bm = ΩX und Bm ∩ Bn = ∅ für m = n .
m

Aufgrund der σ–Additivität (W3 ) bzw. aufgrund der endlichen Additivität


1.7 (b) folgt
2 Erwartungswert und Streuung einer diskreten Verteilung 485

 
P (Y = ym ) = P (X ∈ Bm )
m m
7
= P (X ∈ Bm ) = P (X ∈ ΩX ) = 1 .
m

(b) Satz. Für den Erwartungswert von f (X) gilt



E(f (X)) = f (xk ) P (X = xk ) ,
xk ∈ΩX

falls eine der beiden Seiten Sinn macht, d.h. falls E(f (X)) existiert oder falls
die rechte Seite eine endliche Summe oder eine absolut konvergente Reihe ist.
Existiert insbesondere E(X), so folgt die Existenz von

E(αX + β) = αE(X) + β .

Beweis.
Nach der Konvention 1.5 (a) dürfen wir ΩX als abzählbar annehmen, wobei wir
zulassen, dass pk := P (X = xk ) Null ist. Wegen (1) gilt

(2) χBm (xk ) = 1 für k = 0, 1, . . . ,
m

wobei in der linken Reihe/Summe jeweils nur ein Glied von Null verschieden ist.


Ferner hat die folgende Reihe die Majorante pk , konvergiert also absolut:
k=0
∞ 

(3) P (Y = ym ) = P (X ∈ Bm ) = P (X = xk ) χBm (xk ) = pk χBm (xk ) .
k=0 k=0

Für xk ∈ Bm ist f (xk ) = ym . Existiert also



E(Y ) = ym P (Y = ym ) ,
m

so gilt nach (3)




E(Y ) = ym pk χBm (xk )
m k=0
 ∞
= pk f (xk ) χBm (xk ) ,
m k=0

wobei nach (3) die erste innere Reihe und damit die ihr gleiche zweite innere
Reihe absolut konvergieren. Mit (2) folgt
∞ 

E(Y ) = pk f (xk ) χBm (xk )
k=0 m
∞  

= f (xk ) pk χBm (xk ) = f (xk ) pk
k=0 m k=0
486 § 19 Maß und Wahrscheinlichkeit

entweder nach den Rechengesetzen für Reihen, falls ΩY endlich ist, oder nach
dem großen Umordnungssatz Bd. 1, § 7 : 6.6 sonst.


Konvergiert die Reihe |f (xk )| pk , so lassen sich alle Schritte rückwärts ver-
k=0
folgen, und es ergibt sich die Existenz von E(Y ).

Existiert umgekehrt E(X), so gilt wegen pk = 1
k
  
E(αX + β) = (αxk + β)pk = α xk pk + β pk = αE(X) + β . 2
k k k

3 Varianz und Streuung einer diskreten Verteilung


3.1 Definition und Beispiele
(a) Die Varianz V (X) einer Zufallsgröße X mit ΩX = {x0 , x1 , . . .} ist def-
iniert als ihre mittlere quadratische Abweichung vom Erwartungswert X:/
Wir setzen

/ 2) =
V (X) := E((X − X) / 2 P (X = xk ) ,
(xk − X)
k

/ = E(X) existiert und die rechte Seite Sinn macht, vgl. 2.3 (b).
falls X
In diesem Fall heißt
σ(X) := V (X)
die Streuung oder Standardabweichung von X.
Entsprechend sind Varianz V (μ) und Streuung σ(μ) einer diskreten Verteilung
μ definiert.

(b) Satz. Genau dann existieren E(X) und V (X), wenn



E(X 2 ) = x2k P (X = xk )
k
konvergiert. Es gilt dann

V (X) = E(X 2 ) − E(X)2

Beweis als ÜA ; beachten Sie |xk | ≤ 1


2
(x2k + 1).

(c) Beispiele. (i) Binomialverteilung. Für b(n, p)–verteilte Zufallsgrößen X gilt



V (X) := n p q , σ(X) := n p q mit q := 1 − p .

Denn nach 2.2 (a) ist E(X) = n p, und aus 2.3 (b) folgt

V (X) = E(X 2 ) − E(X)2 = E(X (X − 1)) + E(X) − E(X)2


= E(X (X − 1)) + n p − n2 p2 ,
3 Varianz und Streuung einer diskreten Verteilung 487

wobei (mit der Abkürzung q := 1 − p)



n n 
n
n!
E(X(X − 1)) = k (k − 1) pk q n−k = pk q n−k
k (k − 2)!(n − k)!
k=0 k=2
n  
 n−2
= n(n − 1) p2 pk−2 q n−2−(k−2)
k−2
k=2
 n − 2
n−2

= n(n − 1) p 2
pm q n−2−m
m
m=0

= n(n − 1) p (p + q)n−2 = n(n − 1) p2 = n2 p2 − np2 .


2

(ii) Für Poisson–verteilte Zufallsgrößen X (also P (X = k) = e−λ λk /k! für



k ∈ 0 ) existiert V (X) = λ ( ÜA nach dem Muster 1).

3.2 Zur Bedeutung der Streuung


(a) Streufreie (schwankungsfreie) Zufallsgrößen. Die Varianz einer Zu-
fallsgröße X ist genau dann Null, wenn ihre Verteilung ein Dirac–Maß δa ist.
Dies bedeutet, dass bei Beobachtung von X immer ein und derselbe Messwert a
anfällt.
Denn sei E(X) = a und V (X) = 0. Dann gilt  (x − a)2 P (X = x) = 0 für alle
x ∈ ΩX , also P (X = x) = 0 für x = a. Wegen P (X = x) = 1 folgt a ∈ ΩX
x∈ΩX
und P (X = a) = 1. Liefert umgekehrt jede Beobachtung von X denselben Wert
a, so ist offenbar E(X) = a und V (X) = 0.

(b) Besitzt die Zufallsgröße X eine Varianz V (X) = σ 2 mit σ = σ(X) > 0,
/ > 3 σ) dafür, dass die X–Werte von
so ist die Wahrscheinlichkeit P (|X − X|
X/ um mehr als die dreifache Streuung abweichen, sehr gering. Aus der in (c)
behandelten Tschebyschewschen Ungleichung ergibt sich die grobe Abschätzung
/ > 3 σ) <
P (|X − X| 1
,
9
doch in der Praxis ergeben sich meist wesentlich kleinere Werte. Für b(n, p)–
/ > 3 σ) ≈ 0.0027
verteilte Zufallsgrößen X mit n p (1−p)  1 gilt z.B. P (|X − X|
vgl. 4.1 (c).
In der Praxis fallen die meisten Beobachtungswerte für X in das Intervall
/ − 3 σ(X) , X
[X / + 3 σ(X) ] ( 3 σ–Regel ).

(c) Die Tschebyschewsche Ungleichung. Ist X eine nicht streufreie Zu-


fallsgröße mit endlicher Varianz V (X) = σ 2 , so gilt für k > 0
/ > k σ) < 1
P (|X − X| .
k2
488 § 19 Maß und Wahrscheinlichkeit

Mit ε = k σ folgt insbesondere

/ > ε) < V (X)


P (|X − X| .
ε2

Beweis.
/ > k σ} gilt nach 1.5 (b)
Für B := {xi ∈ ΩX | |xi − X|

/ > k σ) =
P (X ∈ B) = P (|X − X| P (X = xi ) .
xi ∈B

Im Fall B = ∅ ist P (X ∈ B) = 0 < 1


k2
, andernfalls gilt

σ 2 = V (X) = / |2 P (X = xi )
| xi − X
xi ∈ΩX

≥ / |2 P (X = xi )
| xi − X
xi ∈B


> k2 σ 2 P (X = xi ) = k2 V (X) P (X ∈ B) . 2
xi ∈B

(d) Anwendung. In 1.1 wurde gefragt, wie wahrscheinlich es ist, bei 24000
Münzwürfen 12480–mal oder öfter Zahl“ zu erhalten. Es geht also um eine
Abschätzung von P (X − X / ≥ 480),” wobei X eine b( 24000 , 12 )–verteilte Zu-
/ = 12000. Nach 3.1 (c) ist V (X) = 14 · 24000 = 6000. Nach
fallsgröße ist und X
der zweiten Variante der Tschebyschewschen Ungleichung erhalten wir

/ ≥ 480) = P (|X − X|
/ > 479) < 6000
P (|X − X| < 0.0262 .
(479)2
n  n
Wegen k
= n−k
folgt

/ ≥ 480) =
P (X − X 1 / ≥ 480) < 0.0131 .
P (|X − X|
2

In Wirklichkeit ist diese Wahrscheinlichkeit kleiner als 10−9 , vgl. 4.1.

3.3 Die Varianz von αX + β


(a) Existieren E(X) und V (X), so gilt für α, β ∈ Ê ÜA

E(αX + β) = αE(X) + β , V (αX + β) = α2 V (X) .

(b) Im Fall V (X) > 0 heißt Y := 1


σ(X)
/ die zu X gehörige standardi-
(X − X)
sierte Zufallsgröße. Für diese gilt
E(Y ) = 0, V (Y ) = 1.
3 Varianz und Streuung einer diskreten Verteilung 489

3.4 Das schwache Gesetz der großen Zahl


(a) Satz (Jakob Bernoulli um 1685, publ. 1713). Sei Xn die zufallsabhängige
Zahl der Erfolge bei n–maliger Durchführung eines Bernoulli–Experiments mit
Erfolgswahrscheinlichkeit 0 < p < 1 und Hn = n1 Xn die zugehörige relative
Erfolgshäufigkeit, aufgefasst als Zufallsgröße. Dann gilt für jedes ε > 0

p (1 − p)
P (|Hn − p| > ε) < → 0 für n → ∞ .
n ε2

(b) Folgerung. Sei X eine diskret verteilte Zufallsgröße und A eine Teil-
menge von Ê mit 0 < p := P (X ∈ A) < 1. Machen wir unter identischen
Bedingungen n Beobachtungen für X, und bezeichnet Zn die Zahl der Fälle mit
Beobachtungsergebnis in A, so gilt für Hn = n1 Zn

lim P (|Hn − p| > ε) = 0 für jedes ε > 0 .


n→∞

Bemerkungen.
Dies ist die mathematische Präzisierung der Formulierung die relativen Häu-

figkeiten hn spielen sich für n → ∞ auf p ein“, vgl. 1.1. Die manchmal anzutref-
fende Formulierung lim hn = p“ ist in dieser Form unsinnig; hn ist ja keine
”n→∞
wohlbestimmte Größe, sondern hängt vom Zufall ab. Es hätte durchaus sein
können, dass Pearson bei den Nächsten 24000 Münzwürfen 12950 mal Zahl
erhalten hätte, d.h. h24000 ≈ 0.52. Ein solches Ergebnis wäre zwar möglich,
aber äußerst unwahrscheinlich.
Anders verhält es sich mit der Formulierung lim hn = p mit Wahrschein-
”n→∞
lichkeit 1“. Die Präzisierung dieser Aussage (starkes Gesetz der großen Zahl)
erfordert erheblichen begrifflichen Aufwand, siehe Bauer [115].

Beweis.
(a) Xn ist b(n, p)–verteilt mit Erwartungswert n p und Varianz n p (1−p). Nach
3.3 folgt für Hn = Xn /n

1 p (1 − p)
E(Hn ) = p , V (Hn ) = n p (1 − p) = .
n2 n

Die Behauptung (a) ergibt sich nun aus der zweiten Version der Tschebyschew-
schen Ungleichung 3.2 (c).
(b) Bezeichnen wir das Ergebnis X ∈ A als Erfolg, so erhalten wir ein Ber-
noulli–Experiment mit Erfolgswahrscheinlichkeit p, sind also im Fall (a). 2
490 § 19 Maß und Wahrscheinlichkeit

4 Verteilungen mit Dichten


4.1 Der Grenzwertsatz von de Moivre–Laplace
Die Zufallsgröße Xn sei b(n, p)–verteilt mit 0 < p < 1. Dann gilt für die zu-
gehörige standardisierte Zufallsgröße

Yn := √Xn −n p
n p (1−p)

(vgl. 3.3 (b)) die Beziehung


x 1 2
lim P (Yn ≤ x) = Φ(x) := √1 e− 2 t dt
n→∞ 2π
−∞

gleichmäßig für alle x ∈Ê, und zwar gibt es eine Konstante M mit

| Φ(x) − P (Yn ≤ x) | ≤ M/ n für alle x ∈ Ê.

Für den Beweis verweisen wir auf Freudenthal [119]. Die auf de Moivre (um
1721) zurückgehende
√ Beweisidee beruht auf der Stirlingschen–Formel (Bd.1,
§ 10 : 1.5) n! ≈ 2πn (n/e)n .

Folgerungen. Für n  1 gilt


(a) P (α ≤ Yn ≤ β) ≈ Φ(β) − Φ(α) ,
 
(b) P (a ≤ Xn ≤ b) = P √ a−np ≤ Yn ≤ √ b−np
np(1−p) np(1−p)
   
≈ Φ √ b−np − Φ √ a−np .
np(1−p) np(1−p)
/n | ≥ k σ(Xn )) ≈ 2 Φ(−k).
(c) P (|Xn − X
Tabellen für Φ finden Sie in jedem Lehrbuch über Wahrscheinlichkeitsrechnung,
eine kurze Tabelle auch in Bd. 1, S. 95. Hier einige Zahlenwerte zur Anwendung
von (c):
2Φ(−1) ≈ 0.317 , 2Φ(−2) ≈ 0.0455 , 2Φ(−3) ≈ 0.0027 , 2Φ(−6) < 2 · 10−9 .

Wir kommen auf das Beispiel 3.2 (d) zurück: Für eine b(24000, 12 )–verteilte Zu-

fallsgröße X ist σ(X) = 12 24000 ≈ 77.5. Daher ist 479 mehr als die sechsfache
Streuung, also P (X − E(X) ≥ 480) < Φ(−6) < 10−9 .

4.2 Die Normalverteilung


Gauss schlug 1809 für die Wahrscheinlichkeit, eine astronomische Beobach-
tungsgröße X im Intervall I zu finden, den Ansatz

1 1 x−m 2
(∗) P (X ∈ I) = √ e− 2 ( σ ) dx
2π σ
I
4 Verteilungen mit Dichten 491

vor. Diesen Ansatz (und damit verbunden eine Begründung für die Methode
der kleinsten Quadrate) erhielt er aus seinem Postulat, dass das arithmetische
Mittel immer ein Schätzwert mit der größten Wahrscheinlichkeit sei.
Die Begründung für den Ansatz (∗) liefert aus heutiger Sicht der zentrale
Grenzwertsatz: Kommen die zufälligen Schwankungen einer Beobachtungs-
größe X durch Überlagerung sehr vieler, unabhängig voneinander wirkender
Elementarstörungen“ zustande, so gilt (∗) mit geeigneten Parametern m, σ in

guter Näherung. Dieser Sachverhalt wurde erstmalig 1901 von Ljapunow unter
geeigneten Voraussetzungen bewiesen. Astronomische Beobachtungswerte sind
annähernd m–σ–verteilt, d.h. (∗) ist mit großer Genauigkeit erfüllt.
Eine b(n, p)–verteilte Zufallsgröße X ist nach 4.1 für 0 < p < 1 und n  1
annähernd m–σ–normalverteilt mit

σ = n p (1 − p) .
Die m–σ–Normalverteilung ist (wie die Poisson–Verteilung) eine Grenzver-
teilung, geeignet zur Approximation bestimmter realer Verteilungen.
4.3 Verteilungen mit Dichten
(a) Eine Zufallsgröße X heißt stetig verteilt mit Dichte , wenn für jedes
Intervall I

P (X ∈ I) = (x) dx

Ê→Ê
I
gilt, wobei : + eine integrierbare Funktion ist mit

+∞
(x) dx = 1 .
−∞
Für die Verteilung μ (der Beobachtungswerte) von X ergeben sich folgende
Unterschiede zu diskreten Verteilungen:
– Ein einzelner Beobachtungswert hat Wahrscheinlichkeit Null.
– Die Wahrscheinlichkeit μ(A) = P (X ∈ A) ist nicht für alle Teilmengen
A⊂ Ê definiert.
Damit ist gemeint, dass es unter den üblichen Grundannahmen der Mengenlehre
Ê
kein für alle Teilmengen von definiertes Wahrscheinlichkeitsmaß gibt, welches
die Eigenschaften (W1 ), (W2 ), (W3 ) von 1.7 erfüllt und auf den Intervallen I mit
μ übereinstimmt (Banach, Kuratowski 1929).
Für offene Mengen Ω ⊂

Ê und stetige Funktionen : Ê→Ê + lässt sich
μ(Ω) := (x) dx
Ω

gemäß Bd. 1, § 23 : 4.2, 4.3 definieren. Da wir die Kenntnis des Lebesgue–Inte-
grals an dieser Stelle nicht voraussetzen, soll dies vorläufig genügen, zumal wir
auf Definitionsbereiche allgemeiner Wahrscheinlichkeitsmaße noch ausführlicher
eingehen.
492 § 19 Maß und Wahrscheinlichkeit

(b) In Analogie zu 2.1, 3.1 definieren wir den Erwartungswert E(X) und die
Varianz V (X) durch


+∞ 
+∞
/ :=
E(X) = X x (x) dx , V (X) := / 2 (x) dx ,
(x − X)
−∞ −∞

falls diese Integrale existieren. Hier gilt generell V (X) > 0, was für stetige
Dichten leicht zu sehen ist.
Die Tschebyschewsche Ungleichung und damit das schwache Gesetz der großen
Zahl lassen sich leicht auf den vorliegenden Fall übertragen ÜA . Der Beweis
der Formel
+∞ 
E(f (X)) = f (x) (x) dx
−∞

für transformierte Zufallsgrößen f (X) muss auf später verschoben werden.

4.4 Allgemeine Verteilungen


Wir haben bisher diskrete Verteilungen und Verteilungen mit Dichten ein-
geführt. Bei der Behandlung des einfachen Wasserstoffmodells (§ 18 : 3.3 (c))
müssen Energieverteilungen mit diskreten und kontinuierlichen Anteilen her-
angezogen werden. Für die mathematische Theorie der Quantenmechanik er-
weist es sich darüberhinaus als notwendig, Verteilungen μ allgemeiner Art zu
betrachten.
Was von solchen Verteilungen zu verlangen ist, wurde 1933 von Kolmogorow
als Resümee einer über dreißigjährigen Diskussion zusammengefasst. Es sind
dies im Wesentlichen die in 1.7 aufgeführten Eigenschaften (W1 ), (W2 ), (W3 );
im Hinblick auf das in 4.3 (a) Gesagte sind diese aber wie folgt zu modifizieren:
Die Verteilung μ ist auf einem System B von Teilmengen von definiert, Ê
welches nicht notwendig alle Teilmengen von Ê
enthalten muss, das aber alle
Intervalle enthält.
Die Forderungen lauten:

(W1 ) μ(A) ≥ 0 für die zu B gehörenden Mengen A ,

Ê
(W2 ) μ( ) = 1 ,
2



(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen A1 , A2 , . . . ∈ B.
k=1
k=1

Dabei ist zu verlangen, dass mit den Ak auch die Vereinigung zu B gehört.
Im Hinblick auf das Rechnen mit Wahrscheinlichkeiten muss B mit A auch
5 σ–Algebren und Borelmengen 493

Ê
das Komplement \ A enthalten und gegenüber Durchschnittsbildungen abge-
schlossen sein. Dies führt auf den Begriff der σ–Algebra, den wir als Nächstes
behandeln. Bevor wir allgemeine Verteilungen genauer charakterisieren können
(Abschnitt 9), müssen wir einiges über die Konstruktion von Maßen voraus-
schicken.

5 σ–Algebren und Borelmengen


5.1 Eigenschaften von σ–Algebren
(a) Definition. Eine Kollektion A von Teilmengen einer nichtleeren Menge Ω
heißt σ–Algebra auf Ω, wenn folgendes gilt:
(i) Ω gehört zu A ,
(ii) mit A gehört auch Ac := Ω \ A zu A ,
7

(iii) mit A1 , A2 , . . . gehört auch Ak zu A .
k=1

Dann gehört auch ∅ zu A, und mit je endlich ober abzählbar vielen Mengen
enthält A auch deren Durchschnitt ÜA .
Wir fassen künftig eine σ–Algebra A als eine Menge von Mengen auf und schrei-
ben A ∈ A statt A gehört zu A“. Als Definitionsbereiche des Lebesgue–Maßes

Ê
bzw. von Verteilungen (Wahrscheinlichkeitsmaßen auf ) wählen wir grundsätz-
lich σ–Algebren.
(b) Beispiele. (i) Die Gesamtheit sämtlicher Teilmengen von Ω bildet eine
σ–Algebra auf Ω, genannt die Potenzmenge von Ω und bezeichnet mit (Ω). È
(ii) Die kleinste σ–Algebra auf Ω ist {∅, Ω}.
Diskrete Verteilungen lassen sich als Wahrscheinlichkeitsmaße auf der vollen
Potenzmenge von Ê
definieren; für Verteilungen mit Dichten ist dies nach 4.3
nicht möglich.
(c) Zum Nachweis, dass ein Mengensystem ein σ–Algebra bildet, dient der
folgende
Satz. Eine Kollektion A von Teilmengen von Ω ist genau dann eine σ–Algebra
auf Ω, wenn folgendes gilt:
(S1 ) Ω ∈ A ,
(S2 ) A ∈ A =⇒ Ac := Ω \ A ∈ A ,
(S3 ) A, B ∈ A =⇒ A ∩ B ∈ A ,
7

(S4 ) für paarweise disjunkte A1 , A2 , . . . aus A gehört Ak zu A.
k=1

Bemerkung. In der Literatur werden σ–Algebren häufig durch die Eigenschaf-


ten (S1 ) bis (S4 ) definiert.
494 § 19 Maß und Wahrscheinlichkeit

Beweis.
Offenbar ist nur zu zeigen, dass für ein Mengensystem A mit (S1 )–(S4 ) die
Eigenschaft (iii) einer σ–Algebra erfüllt ist. Für beliebige Mengen B1 , B2 , . . .
aus A seien
A1 := B1 , A2 := B2 \ B1 und allgemein
7
n -
n
An+1 := Bn+1 \ Bk = Bn+1 ∩ (Ω \ Bk ) für n = 1, 2, . . . .
k=1 k=1

Dann gilt An ∈ A für alle n ∈ , A n ∩ Am = ∅ für m > n und ( ÜA )


7
∞ 7

Bk = An . 2
k=1 n=1

5.2 Die von einem Mengensystem erzeugte σ–Algebra


(a) Satz. Sei Ω = ∅ und K eine nichtleere Kollektion von Teilmengen von Ω.
Dann gibt es eine kleinste σ–Algebra σ(K), die alle Mengen von K enthält, d.h.
σ(K) ist eine σ–Algebra, und jede σ–Algebra, die alle Mengen von K enthält,
umfasst σ(K).
Es ist üblich, σ(K) die von K erzeugte σ–Algebra zu nennen.

Beweis.
È
Es gibt wenigstens eine K umfassende σ–Algebra, nämlich (Ω). Wir definieren
σ(K) als den Durchscnitt aller K umfassenden σ–Algebren:

A ∈ σ(K) ⇐⇒ A ∈ A für jede K umfassende σ–Algebra A.

Der Durchschnitt beliebig vieler σ–Algebren ist eine σ–Algebra, ÜA . Daher ist
σ(K) eine σ–Algebra und hat nach Konstruktion die behauptete Minimaleigen-
schaft. 2

(b) Lemma. Für K1 ⊂ K2 gilt σ(K1 ) ⊂ σ(K2 ).


Dies folgt aus (a), da σ(K2 ) eine K1 umfassende σ–Algebra ist.

(c) ÜA Sei Ω = ∅. Bestimmen Sie σ(K) für K = {∅} und für K = {A} mit
∅ = A = Ω.

5.3 Borelmengen
Ê
(a) Die von den offenen Teilmengen des n erzeugte σ–Algebra bezeichnen wir
Ê
mit B( n ); deren Mitglieder heißen Borelmengen. Statt B( ) schreiben wir Ê
kurz B.
(b) Für eine nichtleere Borelmenge M ⊂ Ên definieren wir
B(M ) := {B ∈ B( Ên) | B ⊂ M } = {A ∩ M | A ∈ B(Ên)} .
5 σ–Algebren und Borelmengen 495

Ê
(c) Nach 5.1 (a) enthält B( n ) alle offenen und abgeschlossenen Mengen, fer-
ner alle abzählbaren Vereinigungen abgeschlossener Megen (Fσ –Mengen) und
alle abzählbaren Durchschnitte offener Mengen (Gσ –Mengen). Durch wieder-
holte Bildung von Komplementen, abzählbaren Vereinigungen und abzählbaren
Durchschnitten ergeben sich immer neue Borelmengen, doch lassen sich auf die-
se Weise nicht alle Borelmengen erzeugen“. Insofern ist die in der Literatur

gebräuchliche Bezeichnung die von den offenen Mengen erzeugte σ–Algebra“

etwas irreführend; angemessener, aber sprachlich unschön wäre die die offenen

Mengen einhüllende σ–Algebra“.

5.4 Weitere Charakterisierungen der Borel–Algebra


Satz. (a) Alle Intervalle I ⊂ Ê sind Borelmengen.
(b) B wird bereits von allen Intervallen eines der Typen [a, b], ]a, b[, ]a, b],
]−∞, b] usw. erzeugt.
(c) Enthält eine σ–Algebra Σ auf Ê alle Intervalle eines bestimmten Typs, so
enthält sie alle Borelmengen.
(d) Entsprechendes gilt für B( Ê n
) und die Quadertypen
[a, b] := { x ∈ Ê n
| a k ≤ x k ≤ bk für k = 1, . . . , n} ,
]a, b] := { x ∈ Ê n
| a k < x k ≤ bk für k = 1, . . . , n} , usw.

Folgerung. Zum Nachweis, dass alle Borelmengen eine Eigenschaft E besitzen,


genügt es zu zeigen
– Alle Intervalle (Quader) eines bestimmten Typs haben die Eigenschaft E.
– Die Mengen mit der Eigenschaft E bilden eine σ–Algebra A.
Denn ist K die Kollektion aller Intervalle (Quader) des betreffenden Typs, so
Ê
gilt K ⊂ A und damit B( n) = σ(K) ⊂ A nach 5.2 (a).

Beweis.
Wir beschränken uns auf Intervalle I ⊂ Ê; (d) ergibt sich in analoger Weise.
(a) Nach 5.3 (c) gehört die Kollektion K der kompakten Intervalle zu B, also
gilt σ(K) ⊂ B. Es folgt
∞ 
7  ∞ 
7 
]a, b[ = a+ 1
n
,b − 1
n
∈ B, ]a, b] = a+ 1
n
,b ∈ B,
n=1 n=1
7

]−∞, b] = [−n, b] ∈ B ,
n=1

und entsprechend ergibt sich, dass jedes Intervall zu σ(K) und damit zu B gehört
ÜA . Ist KT die Kollektion aller Intervalle eines Typs T , so folgt nach 5.2 also
σ(KT ) ⊂ σ(K) ⊂ B. Andererseits gilt
496 § 19 Maß und Wahrscheinlichkeit

∞ 
-  ∞ 
- 
[a, b] = a− 1
n
,b + 1
n
= a− 1
n
,b
n=1 n=1

Ê \ 7 −∞, a − 

= ]−∞, b] \ ]−∞, a[ = ]−∞, b] ∩ 1
n
,
n=1

also K ⊂ σ(KT ) für die Intervalltypen ]a, b[, ]a, b], ]−∞, b]. Entsprechend folgt
K ⊂ σ(KT ) für die anderen Intervalltypen ÜA . Daher gilt σ(KT ) = σ(K) ⊂ B
für jeden Intervalltyp T .
(b) Jede offene Menge Ω ⊂ Ê
ist die Vereinigung abzählbar vieler kompakter
Intervalle (Bd. 1, § 23 : 4.1). Mit Lemma 5.2 (b) erhalten wir B ⊂ σ(K) und somit
insgesamt B = σ(K) = σ(KT ) für jeden Intervalltyp T . 2

6 Eigenschaften von Maßen


Wir diskutieren zunächst den allgemeinen Maßbegriff und behandeln anschlies-
send zwei Spezialfälle, Wahrscheinlichkeitsmaße auf in Abschnitt 9 und zuvor Ê
das Lebesgue-Maß als Erweiterung des herkömmlichen Volumenbegriffs im n. Ê
Bei letzterem müssen wir zulassen, dass eine Menge A kein endliches Volumen
besitzt; wir schreiben dann V n (A) = ∞.

6.1 Definition. Unter einem Maß verstehen wir eine Vorschrift, die jeder Men-
ge A einer σ–Algebra A auf einer nichtleeren Menge Ω ein Maß μ(A) zuordnet
mit
(M1 ) μ(A) ≥ 0 oder μ(A) = ∞ ,

(M2 ) μ(∅) = 0 ,
7
∞ 

(M3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak ∈ A .
k=1 k=1

Die σ–Additivität (M3 ) ist wie folgt zu verstehen:


7

Genau dann hat A = Ak endliches Maß, wenn alle Ak endliches Maß haben
k=1


und die Reihe μ(Ak ) konvergiert. Diese liefert dann μ(A).
k=1

Die Mengen A ∈ A nennen wir wahlweise A–messbar, μ–messbar oder messbar.


Das Tripel (Ω, A, μ) heißt Maßraum.

Das Maß μ heißt σ–endlich, wenn es Mengen Ωk endlichen Maßes gibt mit
7

Ω1 ⊂ Ω2 ⊂ . . . und Ω = Ωk . Gilt μ(Ω) < ∞ , so heißt μ ein endliches
k=1
Maß. Für endliche Maße ist die Forderung (M2 ) überflüssig ÜA .
6 Eigenschaften von Maßen 497

Im Fall μ(Ω) = 1 heißt μ ein Wahrscheinlichkeitsmaß auf Ω. Ein Wahr-


scheinlichkeitsraum (Ω, A, μ) ist charakterisiert durch

(W1 ) μ(A) ≥ 0 für alle A ∈ A ,

(W2 ) μ(Ω) = 1 ,
7
∞ 

(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Mengen Ak ∈ A .
k=1 k=1

6.2 Rechenregeln für Maße


7
N 
N
(a) μ( Ak ) = μ(Ak ) für paarweise disjunkte Ak ∈ A mit endlichem Maß.
k=1 k=1

(b) A ⊂ B, μ(B) < ∞ =⇒ μ(B \ A) = μ(B) − μ(A).

(c) A ⊂ B =⇒ μ(A) ≤ μ(B) für μ–messbare Mengen A, B.


Dabei gilt die Ungleichung μ(A) ≤ μ(B) als erfüllt, wenn μ(B) = ∞.

(d) μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B), falls A und B μ–messbar sind und
μ(A ∪ B) < ∞.

Beweis als ÜA , vgl. 1.7 (b).

6.3 Stetigkeitseigenschaften von Maßen


(a) Für μ–messbare Mengen A1 , A2 , . . . mit A1 ⊂ A2 ⊂ . . . gilt
7

μ( Ak ) = lim μ(An ) .
k=1 n→∞
7

Dies schließt den Fall μ( Ak ) = ∞ ein.
k=1

(b) Für μ–messbare Mengen B1 , B2 , . . . mit B1 ⊃ B2 ⊃ . . . gilt


-

μ( Bk ) = lim μ(Bn ) , falls μ(B1 ) < ∞ .
k=1 n→∞

Auf die Bedingung μ(B1 ) <  ∞ kann nicht verzichtet


 werden. Beispielsweise
Ê
haben die Streifen Bk := (x, y)  0 < y < k1 ⊂ 2 keinen endlichen Flä-
cheninhalt, und ihr Durchschnitt ist leer.

Beweis.
(a) Wir setzen C1 := A1 und Ck := Ak \ Ak−1 für k ≥ 2 (Skizze!). Wegen
(S2 ), (S3 ) gehören die Ck = Ak ∩ (Ω \ Ak−1 ) für k ≥ 2 zu A.
498 § 19 Maß und Wahrscheinlichkeit

Für k < l gilt Ak ∩ Cl ⊂ Al−1 ∩ Cl , also Cl ∩ Ak = ∅, da l > 1.


Wegen Ck ⊂ Ak ist daher Ck ∩ Cl = ∅ für k < l. Wir zeigen
7
∞ 7

A := Ak = Ck .
k=1 k=1

Wegen Ck ⊂ Ak ⊂ A ist die rechte Seite in der linken enthalten.


Umgekehrt gibt es zu jedem ω ∈ A ein kleinstes m ∈  mit ω ∈ Am . Es ist
dann

ω ∈ A1 = C1 für m=1 bzw. ω ∈ Am \ Am−1 = Cm für m > 1.

Gibt es ein N ∈ 
mit μ(AN ) = ∞, so folgt mit 6.2 (c) auch μ(Ak ) = ∞ für
k ≥ N sowie μ(A) = ∞. Andernfalls gilt nach 6.2 (b)

μ(Ck ) = μ(Ak ) − μ(Ak−1 ) für k > 1 ,

also wegen der σ–Additivität von μ



∞  
n
μ(A) = μ(Ck ) = lim μ(A1 ) + (μ(Ak ) − μ(Ak−1 ))
k=1 n→∞ k=2

= lim μ(An ) .
n→∞

-

(b) Wir setzen Ak := B1 \ Bk ∈ A, B := Bk und
k=1
7
∞ 7
∞ -

A := Ak = (B1 \ Bk ) = B1 \ Bk = B1 \ B .
k=1 k=1 k=1

Letzteres folgt wegen B ⊂ Bk ⊂ B1 nach den de Morganschen Regeln Bd. 1,


§ 4 : 4.2. Wegen μ(B1 ) < ∞ und wegen Ak ⊂ A ⊂ B1 haben nach 6.2 (d) auch
alle Ak endliches Maß. Aus (a) und 6.2 (b) erhalten wir

μ(B1 ) − μ(B) = μ(A) = lim μ(An ) = lim (μ(B1 ) − μ(Bn ))


n→∞ n→∞

= μ(B1 ) − lim μ(Bn ) . 2


n→∞

6.4 Die Subadditivität von Maßen


Für beliebige μ–messbare Mengen M1 , M2 , . . . gilt
7
∞ 

μ( Mk ) ≤ μ(Mk ) ,
k=1 k=1

wobei diese Ungleichung als erfüllt gilt, wenn nicht alle Mk endliches Maß haben
oder wenn die rechtsstehende Reihe divergiert.
7 Konstruktion von Maßen durch Fortsetzung 499

Beweis als ÜA in zwei Schritten:


7
n 
n
(a) Folgern Sie aus 6.2 (d) durch Induktion, dass μ( Mk ) ≤ μ(Mk ).
7
n k=1 k=1
(b) Wenden Sie 6.3 (a) auf An = Mk an.
k=1

7 Konstruktion von Maßen durch Fortsetzung


7.1 Mengenringe und Prämaße
(a) Bisher kennen wir nur ein nichttriviales Beispiel für Maßräume: diskrete
Ê ÈÊ
Wahrscheinlichkeitsräume ( , ( ) , μ ). Nun soll eine zunächst für die halb-
Ê
offenen Quader ]a, b] = {x ∈ n | ai < xi ≤ bi (i = 1, . . . , n)} gegebene Maß-
vorschrift wie der elementargeometrische Inhalt V n (]a, b]) oder im Fall n = 1
die Wahrscheinlichkeit
b
μ(]a, b]) = (x) dx
a

zu einem Maß auf eine σ–Algebra A fortgesetzt werden. Dies geschieht nach
einem allgemeinen Prinzip, welches wir im folgenden schildern.

(b) Eine nichtleere Kollektion R von Teilmengen von Ω = ∅ heißt ein Men-
genring auf Ω, wenn R mit je zwei Mengen A, B auch A ∪ B und A \ B enthält.
Es gilt dann
∅ = C \ C ∈ R,
da R wenigstens eine Menge C enthält, und
A, B ∈ R =⇒ A ∩ B = A \ (A \ B) ∈ R .
Eine abzählbare Vereinigung von Mengen aus R muss ebensowenig zu R
gehören wie Ω selbst.
Ê
Uns interessiert vor allem der Mengenring Rn auf n , bestehend aus der lee-
ren Menge und allen endlichen Vereinigungen halboffener Quader ]a, b]. Zum
Nachweis der Mengenringeigenschaft ist offenbar nur zu zeigen: A, B ∈ Rn
=⇒ A \ B ∈ Rn . Daraus ergibt sich dann leicht, dass jede nichtleere Menge
A ∈ Rn die endliche Vereinigung paarweise disjunkter Quader vom Typ ]a, b]
ist.
ÜA Machen Sie sich diese Sachverhalte für R1 und R2 anhand von Skiz-
zen klar. Daraus ergibt sich die Beweisidee für Rn ; wir verzichten auf die
Ausführung.
(c) Ein Prämaß μ auf einem Mengenring R ist definiert durch die Eigen-
schaften
μ(A) ≥ 0 oder μ(A) = ∞ für A ∈ R , μ(∅) = 0 ,
500 § 19 Maß und Wahrscheinlichkeit

2



μ( Ak ) = μ(Ak )
k=1
k=1
7

für paarweise disjunkte Ak ∈ R , falls Ak ∈ R .
k=1

Das Prämaß heißt σ–endlich, wenn es Mengen Ak ∈ R gibt, mit μ(Ak ) < ∞,
7

Ak ⊂ Ak+1 (k = 1, 2, . . .) und Ω = Ak .
k=1
Beispiele für Prämaße folgen in den Abschnitten 8 und 9.

7.2 Fortsetzung eines Prämaßes zu einem Maß


Satz. Jedes Prämaß auf einem Mengenring R lässt sich zu einem Maß fortset-
zen. Für ein σ–endliches Prämaß ist die Fortsetzung auf der von R erzeugten
σ–Algebra σ(R) eindeutig bestimmt.
Wir beschreiben im folgenden das Fortsetzungsverfahren (Carathéodory 1938);
ausführliche Beweise hierzu finden Sie in Bauer [115] § 5.
(a) Einführung eines äußeren Maßes μ∗ . Für beliebige Teilmengen M des
Grundraums Ω sei
 
∞  7
∞ 
μ∗ (M ) := inf μ(Ak )  A1 , A2 , . . . ∈ R , M ⊂ Ak ,
k=1 k=1

falls es wenigstens eine Überdeckung von M durch Mengen Ak ∈ R mit




μ(Ak ) < ∞ gibt, und
k=1

μ∗ (M ) := ∞ sonst.

Das äußere Maß μ∗ hat folgende Eigenschaften:

(1) μ∗ (M ) = μ(M ) f ür M ∈ R ,

(2) μ∗ (M ) ≥ 0 oder μ∗ (M ) = ∞ , μ∗ (∅) = 0 ,

(3) M1 ⊂ M2 =⇒ μ∗ (M1 ) ≤ μ∗ (M2 ) ,


7
∞ 

(4) μ∗ ( Mk ) ≤ μ∗ (Mk ) f ür beliebige Mk ⊂ Ω
k=1 k=1

(Subadditivität, vgl. 6.4).

In der Regel ist μ∗ nicht einmal endlich additiv: Ist der Rand einer Menge A
zu ausgefranst, so kann es Mengen M geben mit

μ∗ (M ) < μ∗ (M ∩ A) + μ∗ (M \ A) .
7 Konstruktion von Maßen durch Fortsetzung 501

(Die Figur soll diese Situation andeu-


ten.)
.
Die folgende Definition kennzeichnet
messbare Mengen A durch die Gutar-
tigkeit ihres Randes, formuliert mit Hil-
fe der additiven Zerlegbarkeit von Test-
mengen M durch A und deren Komple- M
ment:

(b) Definition. Eine Menge A ⊂ Ω


heißt μ–messbar, wenn A
. .
μ∗ (M ) = μ∗ (M ∩ A) + μ∗ (M \ A)
für alle M ⊂ Ω .
(c) Die μ–messbaren Mengen bilden eine R umfassende σ–Algebra A. Setzen
wir ein σ–endliches Prämaß μ auf die σ–Algebra A fort durch die Vorschrift

μ(A) := μ∗ (A) f ür A ∈ A ,

so entsteht ein σ–endliches Maß μ.


(d) Jede andere Fortsetzung eines σ–endlichen Prämaßes μ zu einem Maß
stimmt auf σ(R) mit der in (c) definierten Fortsetzung überein.

Bemerkungen. Wir wenden den Fortsetzungssatz nur auf Prämaße auf dem
Ê
Mengenring Rn an. Dieser erzeugt die σ–Algebra B( n ) der Borelmengen (vgl.
Ê
5.4). Die oben definierte σ–Algebra A kann größer als B( n ) sein: Beim Dirac-
ÈÊ
schen Prämaß auf R1 ergibt sich z.B. A = ( ); für den elementargeometri-
schen Inhalt und für die Normalverteilung auf R1 besteht A aus den Lebesgue–
messbaren Mengen (Abschnitt 8). Für Wahrscheinlichkeitsmaße auf Êwählen
wir, auch im Hinblick auf die Eindeutigkeit der Fortsetzung, als gemeinsamen
Definitionsbereich immer die Borelalgebra B.

7.3 Nullmengen, vollständige Maße


(a) Für das nach 7.2 konstruierte Maß μ gilt: Hat N ⊂ Ω das äußere Maß Null,
so ist jede Menge A ⊂ N μ–messbar mit μ(A) = 0. Denn aus den Eigenschaften
(3), (4) von μ∗ folgt für beliebige Mengen M ⊂ Ω
μ∗ (M ∩ N ) ≤ μ∗ (N ) = 0 , μ∗ (M \ N ) ≤ μ∗ (M ) ,
also
μ∗ (M ) ≤ μ∗ (M ∩ N ) + μ∗ (M \ N ) ≤ μ∗ (M ) ,
so dass überall das Gleichheitszeichen stehen muss. Dies bedeutet nach 7.2 (b),
dass N μ–messbar ist. Für A ⊂ N gilt μ∗ (A) ≤ μ∗ (N ) = 0, so dass auch A
μ–messbar ist mit μ(A) = 0.
502 § 19 Maß und Wahrscheinlichkeit

(b) Sei (Ω, A, μ) ein beliebiger Maßraum. Eine Menge N ∈ A mit μ(N ) = 0
heißt μ–Nullmenge .
Das Maß μ heißt vollständig, wenn für jede μ–Nullmenge auch alle Teilmengen
zu A gehören (und daher μ–Nullmengen sind).
Nach (a) ist die in 7.2 konstruierte Fortsetzung (Ω, A, μ) eines Prämaßes voll-
ständig. Schränken wir es (wie bei Wahrscheinlichkeitsmaßen üblich) auf die
Borelmengen ein, so kann die Vollständigkeit verloren gehen.

(c) μ–Nullmengen können sehr groß sein: Für diskrete Verteilungen μ mit
supp μ = {x0 , x1 , . . .} ist Ê
\ {x0 , x1 , . . .} eine μ–Nullmenge.

(d) Satz. Die Vereinigung und der Durchschnitt höchstens abzählbar vieler μ–
Nullmengen sind jeweils wieder μ–Nullmengen.
Denn nach 5.1 sind die Vereinigung V und der Durchschnitt D höchstens abzähl-
bar vieler μ–messbarer Mengen wieder μ–messbar. Für V ergibt sich die Null-
mengeneigenschaft aus der Subadditivität 6.4. Weiter folgt aus D ⊂ N und
μ(N ) = 0 auch μ(D) ≤ μ(N ) = 0.

8 Das Lebesgue–Maß
8.1 Fortsetzung des Lebesgueschen Prämaßes
(a) Die endlichen Vereinigungen halboffener Quader ]a, b] bilden zusammen
mit der leeren Menge einen Mengenring Rn . Das Lebesgue–Maß V n wird wie
folgt eingeführt:
Wir setzen V n (∅) := 0 und für jede nichtleere Menge M ∈ Rn

N
V n (M ) := V n (Ik ) ,
k=1
falls
7
N
M = Ik mit paarweise disjunkten Quadern Ik = ]ak , bk ].
k=1

Das macht Sinn, d.h. die rechte Seite hängt nicht von der Art der Zerlegung ab.
Dies ergibt sich wie in Bd. 1, § 23 : 1.
Hiermit erhalten wir ein endlich–additives Maß V n auf Rn . Zum Nachweis der
Prämaßeigenschaft genügt es daher zu zeigen: Aus
7

I = ]a, b] = Ik mit paarweise disjunkten Ik = ]ak , bk ]
k=1
folgt


V n (I) = V n (Ik ) .
k=1
8 Das Lebesgue–Maß 503

Die Ungleichung
 

N N
V n (Ik ) = V n (I k ) ≤ V n (I) = V n (I) für N ∈
k=1 k=1

erhalten wir wie in Bd. 1, § 23 : 1 aus einer Rasterung von I durch Einziehen
aller an I1 , . . . , IN beteiligten Randhyperebenen. Zu zeigen bleibt


V n (I) ≤ V n (Ik ) .
k=1

Hierzu wählen wir zu vorgegebenem ε > 0 einen kompakten Quader K ⊂ I mit


V n (I) ≤ V n (K) + ε und offene Quader Jk mit
ε
Ik ⊂ Jk , V n (Jk ) < V n (Ik ) + k (k = 1, 2, . . .) .
2
Da K von den Jk überdeckt wird, gibt es nach dem Überdeckungssatz von
7
 mit K ⊂
M
Heine–Borel ein M ∈ Jk . Wie in 6.4 (a) erhalten wir
k=1

M 

V n (I) < V n (K) + ε ≤ V n (Jk ) + ε < V n (Ik ) + 2ε
k=1 k=1

für jedes ε > 0.


Die σ–Endlichkeit von V n ergibt sich mittels Ausschöpfung von n durch die Ê
Quader Qk = {x = (x1 , . . . , xn ) | −k < xi ≤ k für i = 1, . . . , n} ∈ Rn .
(b) Wir fassen zusammen: Durch Fortsetzung des elementaren Volumens von
Quadern mit Hilfe des Verfahrens von Carathéodory in 7.2 erhalten wir ein
vollständiges Maß auf einer die Borelmengen enthaltenden σ–Algebra Ln .
Wir nennen dieses das Lebesgue–Maß und bezeichnen es wahlweise mit V n
oder λn , im Fall n = 1 auch mit λ.
(c) Das Lebesgue–Maß ist translationsinvariant:
V n (a + M ) = V n (M ) für M ∈ Ln .
Denn aus der Translationsinvarianz des Lebesgueschen Prämaßes folgt die des
äußeren Lebesgueschen Maßes ÜA .
(d) Nicht alle Teilmengen des Ê n
sind Lebesgue–messbar.
Siehe Barner–Flohr [141] 15.2 (Stichwort Vitali–Mengen“).

8.2 Die klassische Definition des Lebesgue–Maßes
In § 8 wurde eine elementare Definition der Lebesgue–Messbarkeit und des Le-
besgue–Maßes gegeben, wie sie in den meisten Analysis–Büchern zu finden ist.
Die Äquivalenz zu der in 8.1 gegebenen maßtheoretischen Definition ergibt sich
aus dem folgenden Satz, dessen Beweis in Elstrodt [117] Satz II.7.4 ausgeführt
ist.
504 § 19 Maß und Wahrscheinlichkeit

Ê
Satz. (a) Eine Menge M ⊂ n ist genau dann Lebesgue–messbar im Sinne
von 8.1, wenn es zu jedem ε > 0 eine offene Menge Ω und eine abgeschlossene
Menge A gibt mit
A⊂M ⊂Ω und V n (Ω \ A) < ε .
Im Fall V n (M ) < ∞ gilt
V n (M ) = inf { V n (Ω) | Ω offen, M ⊂ Ω }.

(b) Zu jeder Lebesgue–messbaren Menge M gibt es Borelmengen F und G mit

F ⊂ M ⊂ G , V n (G \ F ) = 0 , V n (F ) = V n (M ) = V n (G) .

Aus (b) und 7.2 (d) folgt, dass das Lebesgue–Maß die einzige Fortsetzung des
n–dimensionalen Volumens von Quadern auf die σ–Algebra Ln ist.

9 Wahrscheinlichkeitsmaße auf Ê
9.1 Allgemeines

Ê
(a) Nach den Bemerkungen 7.2 verstehen wir unter einem Wahrscheinlich-
keitsmaß auf (im Folgenden Verteilung genannt)eine auf den Borelmen-
gen in Ê definierte Mengenfunktion μ mit
(W1 ) μ(A) ≥ 0 für alle A ∈ B ,

Ê
(W2 ) μ( ) = 1 ,
7
∞ 

(W3 ) μ( Ak ) = μ(Ak ) für paarweise disjunkte Ak ∈ B.
k=1 k=1

Wie in 1.7 (b) folgt die endliche Additivität und daraus für A, B ∈ B

μ( Ê \ A) = 1 − μ(A) ,
A ⊂ B =⇒ μ(B \ A) = μ(B) − μ(A) , also μ(A) ≤ μ(B) ,

μ(A ∪ B) = μ(A) + μ(B) − μ(A ∩ B) .

Weiter gelten die Stetigkeitsaussagen 6.3 und die Subadditivität 6.4; die Vor-
aussetzung μ(B1 ) < ∞ in 6.3 (b) ist immer erfüllt.

(b) Sei μ die Verteilung einer Zufallsgröße X (d.h. μ(B) = P {X ∈ B | für B ∈


Ê
B}). Dann heißt a ∈ ein möglicher Messwert für X, wenn

μ(]a − ε, a + ε]) > 0 für alle ε > 0 .

Beachten Sie, dass für Verteilungen mit Dichten ein einzelner Messwert die
Wahrscheinlichkeit Null hat. Ist μ eine diskrete Verteilung mit dem Träger
supp μ = {x0 , x1 , . . . }, so sind x0 , x1 , . . . genau die möglichen Messwerte.
9 Wahrscheinlichkeitsmaße auf Ê 505

(c) Mischung von Wahrscheinlichkeitsmaßen. Sind pk ≥ 0 Zahlen mit



Ê, so liefert

pk = 1 und μ1 , μ2 , . . . Wahrscheinlichkeitsmaße auf
k=1


μ(A) := pk μk (A) für A ∈ B
k=1

Ê, bezeichnet mit

ein Wahrscheinlichkeitsmaß auf μ= pk μk .
k=1

Die Eigenschaften (W1 ),(W2 ) sind evident; (W3 ) folgt aus dem großen Umord-
nungssatz Bd. 1, § 7 : 6.6 ÜA .

9.2 Die Verteilungsfunktion


Für eine Verteilung μ auf Ê
definieren wir die Verteilungsfunktion F durch
Verteilung!einer Zufallsgröße
F (x) := μ(] − ∞, x]) für x ∈ . Ê
Beispiele. (i) Für das Dirac–Maß δa (vgl. 1.6 (b)) ist F = χ[a,∞[ .
(ii) Für ein Bernoulli–Experiment mit Erfolgswahrscheinlichkeit p ist die Ver-
teilung μ = (1 − p) δ0 + p δ1 (siehe 9.1 (c)).
ÜA : Skizzieren Sie die zugehörige Verteilungsfunktion F .

(iii) Für die standardisierte Normalverteilung 4.1 erhalten wir


x
1 1 2
F (x) = Φ(x) = √ e− 2 t dt .

−∞

Satz. Die Verteilungsfunktion F : Ê → [0, 1] hat die Eigenschaften


(a) F ist monoton wachsend,
(b) F ist rechtsseitig stetig,
(c) lim F (x) = 0, lim F (x) = 1.
x→−∞ x→∞

Ferner existiert der linksseitige Grenzwert F (a−) an jeder Stelle a ∈ Ê, und es


gilt
(d) μ(]a, b]) = F (b) − F (a) für a < b,
(e) μ({a}) = F (a) − F (a−),
(f) μ([a, b]) = F (b) − F (a−).

Beweis.
(a) Für a < b gilt ]−∞, a] ⊂ ]−∞, b], also μ(]−∞, a]) ≤ μ(]−∞, b]).
Unter (g) zeigen wir die Existenz der einseitigen Grenzwerte F (a+), F (a−) für
a∈ Êsowie der Grenzwerte lim F (x) , lim F (x).
x→∞ x→−∞
506 § 19 Maß und Wahrscheinlichkeit

(b) Für Bn = ]−∞, an ] gilt B1 ⊃ B2 ⊃ . . . , also folgt nach 6.3 (b)


-

F (a) = μ(]−∞, a]) = μ( Bn ) = lim μ(Bn ) = lim F (an ) = F (a+) .
n=1 n→∞ n→∞

-

(c) Für Cn = ]−∞, −n] gilt C1 ⊃ C2 ⊃ . . . und Cn = ∅ , somit
n=1
-

lim F (x) = lim F (−n) = lim μ(Cn ) = μ( Cn ) = 0
x→−∞ n→∞ n→∞ n=1

nach 6.3 (b); entsprechend folgt lim F (x) = 1 aus 6.3 (a) ÜA .
x→∞

(d) F (b) − F (a) = μ(]−∞, b] \ ]−∞, a]) = μ(]a, b]) für a < b.
  -

(f) Für Bn = a− 1
n
,b gilt B1 ⊃ B2 ⊃ . . . und Bn = [a, b], also
n=1
μ([a, b]) = lim μ(]a − 1
n
, b]) = F (b) − F (a−). (e) ist ein Spezialfall von (f).
n→∞

(g) Lemma. Ist F : Ê → Ê monoton und beschränkt, so existieren die Grenz-


werte
F (a+) = lim F (x) , F (a−) = lim F (x) , lim F (x) , lim F (x) .
x→a+ x→a− x→∞ x→−∞

Denn sei o.B.d.A. F monoton wachsend und an = a + n1 . Dann existiert s :=


lim F (an ). Zu gegebenem ε > 0 wählen wir ein m mit 0 < F (am ) − s < ε und
haben dann |F (x) − s| = F (x) − s < ε für 0 < x − a < am − a. Die Existenz
des linksseitigen Grenzwerts F (a−) und die Existenz der übrigen Grenzwerte
folgen analog mit an = a − n1 bzw. an = n bzw. an = −n ÜA . 2

9.3 Die zu einer Verteilungsfunktion gehörige Verteilung


Satz. Jede monoton wachsende, rechtsseitig stetige Funktion F : → [0, 1] Ê
mit lim F (x) = 0, lim F (x) = 1 ist die Verteilungsfunktion einer durch
x→−∞ x→+∞
F eindeutig bestimmten Verteilung μ, gegeben mittels Fortsetzung des durch

μ(]a, b]) := F (b) − F (a)

auf dem Mengenring R1 definierten endlichen Prämaßes gemäß 7.2.

Beweis.
Entscheidende Voraussetzung des Fortsetzungssatzes 7.2 ist die Prämaßeigen-
schaft. Dazu genügt es, zu zeigen:
Ist I = ]a, b] die Vereinigung abzählbar vieler, paarweise disjunkter Mengen
Ri ∈ R1 , so gilt


μ(I) = μ(Ri ) .
k=1
9 Wahrscheinlichkeitsmaße auf Ê 507

Wir können jedes Ri als Vereinigung endlich vieler paarweise disjunkter In-
tervalle des Typs ]α, β] darstellen und erhalten so insgesamt abzählbar viele,
paarweise disjunkte Intervalle Ik = ]ak , bk ], deren Vereinigung I ist. Zu zeigen
bleibt


μ(I) = μ(Ik ) .
k=1

(a) Von endlich vielen Intervallen I1 , . . . , IN dürfen wir, ggf. nach Umnume-
rierung, voraussetzen
a ≤ a 1 < b1 ≤ a 2 < b 2 ≤ · · · < bN ≤ b .
Aufgrund der Monotonie von F erhalten wir

N 
N
μ(Ik ) = (F (bk ) − F (ak ))
k=1 k=1

N−1
≤ (F (ak+1 − F (ak )) + F (bN ) − F (aN )
k=1

= F (bN ) − F (a1 ) ≤ F (b) − F (a) = μ(I) .

Es folgt die Konvergenz der Reihe




μ(Ik ) ≤ μ(I) .
k=1



(b) Zu zeigen ist μ(I) ≤ μ(Ik ).
k=1

Sei ε > 0 vorgegeben. Aufgrund der rechtsseitigen Stetigkeit von F gibt es


– ein Intervall J = ]c, b] mit a < c < b und μ(I) < μ(J) + ε ,
– Intervalle Jk = ]ak , ck ] mit ck > bk und μ(Jk ) − μ(Ik ) < ε 2−k (k = 1, 2, . . . ).
Dann gilt
◦ ◦
[c, b] = J ⊂ I , Ik ⊂ Jk =: Ωk .
Nach dem Überdeckungssatz von Heine–Borel gibt es ein M ∈  mit
7
M 7
M
J ⊂ [c, b] ⊂ Ωk ⊂ Jk .
k=1 k=1
Es folgt

M 
M
μ(I) < μ(J) + ε ≤ μ(Jk ) + ε ≤ μ(Ik ) + 2ε
k=1 k=1


≤ μ(Ik ) + 2ε für jedes ε > 0 . 2
k=1
508 § 20 Integration bezüglich eines Maßes μ

§ 20 Integration bezüglich eines Maßes μ


1 Das Konzept des μ–Integrals
(a) In diesem Paragraphen verfolgen wir vor allem zwei Ziele,
• die Grundlagen für das Lebesgue–Integral bereitzustellen und
• für ein allgemeines Wahrscheinlichkeitsmaß
 μ, aufgefasst als Verteilung einer
Zufallsgröße X, das μ–Integral f dμ und damit Erwartungswert, Varianz von
Ê
X und den Erwartungswert der transformierten Zufallsgröße f (X) zu definieren.
Beide Aufgaben lassen sich gemeinsam unter dem Dach der Integrationstheo-
rie bezüglich eines Maßes μ behandeln. Diese legen wir gleich weit genug an,
um auch für andere Themen wie Momente allgemeiner Massenverteilungen und
klassische Wahrscheinlichkeitstheorie offen zu sein.

(b) Ausgangspunkt ist ein beliebiger Maßraum (Ω, A, μ) mit einem σ–endlichen
Maß μ, vgl. § 19 : 6. Die Mengen A ∈ A nennen wir μ–messbar oder kurz
messbar. Die Verbindung zwischen Maß und Integral wird über die Beziehung

(∗) χA dμ := μ(A) für A ∈ A mit μ(A) < ∞
Ω

hergestellt. Für das Lebesgue–Maß ergibt sich schon hier eine erhebliche Erwei-
terung des Integralbegriffs von Bd. 1, § 23, z.B. ist Ê χ dλ = 0.
Für eine Elementarfunktion ϕ der Form

N
ϕ = ak χAk ,
k=1

wobei die Ak paarweise disjunkte messbare Mengen endlichen Maßes sind, de-
finieren wir
 
N
ϕ dμ := ak μ(Ak )
Ω k=1

und zeigen in Abschnitt 2, dass dieses Integral linear und monoton ist.

(c) Wir definieren nun das Integral f dμ für beschränkte reellwertige Funk-
Ω
tionen f auf Ω, von denen wir nur voraussetzen, dass das Urbild f −1 (I) beliebi-
ger Intervalle I zu A gehört. Solche Funktionen nennen wir messbar, Näheres
dazu in Abschnitt 3. Einfachheitshalber setzen wir zunächst μ(Ω) < ∞ voraus.

Satz. Zu jeder messbaren Funktion f : Ω → [−M, M ] gibt es eine Folge von


Elementarfunktionen ϕ1 , ϕ2 , . . . mit

−M χΩ ≤ ϕ1 ≤ ϕ2 ≤ . . . ≤ f ,
2 Das μ–Integral für Elementarfunktionen 509

die auf Ω gleichmäßig gegen f konver-


gieren. Wegen
M
 
ϕ1 dμ ≤ ϕ2 dμ ≤ . . . ≤ M μ(Ω)
Ω Ω
f

existiert ak
 
f dμ := lim ϕn dμ .
n→∞
Ω Ω

Beweis. ω
Für n ∈ 
sei N := 2n . Wir untertei-
len [−M, M ] durch die äquidistanten
Teilpunkte
2M
ak := −M + k
N
a1
(k = 0, . . . , N ) in N paarweise dis-
−M
junkte Teilintervalle I0 = [a0 , a1 ] und
Ik = ]ak , ak+1 ] für k = 1, . . . , N − 1.

Da f messbar ist, sind Ak := f −1 (Ik ) zu A gehörige, paarweise disjunkte


Mengen, deren Vereinigung Ω ist. Nach Konstruktion ist

N−1
ϕn := ak χAk
k=0

eine Elementarfunktion mit ϕn ≤ f und f − ϕn ∞ ≤ 2M/N = M · 21−n .


Bei Übergang von n zu n + 1 werden die Ik durch die neu hinzukommenden
Teilpunkte halbiert, und es ergibt sich ϕn ≤ ϕn+1 . (Machen Sie eine Skizze!) 2

Die Unabhängigkeit der Integraldefinition von der approximierenden Folge (ϕn )


und die Ausdehnung der Integraldefinition auf unbeschränkte messbare Funk-
tionen f und nicht endliche Maße μ behandeln wir in Abschnitt 4.

2 Das μ–Integral für Elementarfunktionen


2.1 Elementarfunktionen
(a) Sei im folgenden Ω = ∅ und A eine σ–Algebra auf Ω. Die Mengen aus A
heißen messbar. Eine Funktion ϕ : Ω → Ê
heißt Elementarfunktion, wenn
sie eine Linearkombination

M
ϕ = ai χAi
i=1
charakteristischer Funktionen messbarer Mengen ist.
510 § 20 Integration bezüglich eines Maßes μ

Definitionsgemäß bilden also die Elementarfunktionen einen Vektorraum über


Ê . Spezialfälle sind charakteristische Funktionen χA mit A ∈ A. Dabei setzen
wir χ∅ = 0 . Beachten Sie im folgenden, dass ÜA
χA∩B = χA · χB = min{χA , χB } ,
χΩ\A = 1 − χA ,
χA∪B = max {χA , χB } und
χA∪B = χA + χB falls A ∩ B = ∅ .

(b) Jede Elementarfunktion ϕ besitzt eine disjunkte Darstellung



N
ϕ = bk χBk mit paarweise disjunkten messbaren Bk .
k=1

7
N
Diese kann so gewählt werden, dass Bk = Ω ÜA , vgl. Bd. 1, § 23 : 1.3.
k=1


N
Für Treppenfunktionen ϕ = ck χIk bedeutet disjunkte Darstellung“ hier,
k=1

anders als in Bd. 1, § 23 : 1.3, dass die Quader Ik paarweise disjunkt sind. Hier-
durch wird der Möglichkeit Rechnung getragen, dass Teile von Quaderrändern
positives Maß haben können.

Der Träger supp ϕ einer Elementarfunktion ϕ ist, abweichend von § 10 : 1.1,


definiert als {ω ∈ Ω | ϕ(ω) = 0}, kurz supp ϕ := {ϕ = 0}. Für die oben
wiedergegebene disjunkte Darstellung von ϕ ist supp ϕ die Vereinigung aller
Bk mit bk = 0, also messbar. Aus der disjunkten Darstellbarkeit ergibt sich:
Mit ϕ sind auch |ϕ|, ϕ+ , ϕ− Elementarfunktionen, ebenso f ◦ ϕ für jede auf
ϕ(Ω) erklärte Funktion f .

(c) Für je zwei Elementarfunktionen ϕ, ψ gibt es eine gemeinsame disjunkte


Darstellung

N 
N
ϕ = bk χBk , ψ = ck χBk .
k=1 k=1

Daher sind neben aϕ + bψ (a, b ∈ Ê) auch


ϕ · ψ , max{ϕ, ψ} und min{ϕ, ψ}
Elementarfunktionen.
Der Beweis ergibt sich wie in Bd. 1, § 23 : 1.3.

(d) Für zwei Elementarfunktionen ϕ, ψ sind die Mengen

{ϕ = ψ} = supp (ϕ − ψ) und {ϕ > ψ} = supp (ϕ − ψ)+


2 Das μ–Integral für Elementarfunktionen 511

messbare Mengen. Wir definieren Gleichheit μ–fast überall durch


ϕ = ψ μ–f.ü. : ⇐⇒ μ({ϕ = ψ}) = 0 ,
ϕ ≤ ψ μ–f.ü. : ⇐⇒ μ({ϕ > ψ}) = 0 .


N
Für jede disjunkte Darstellung ϕ = bk χBk gilt offenbar
k=1

ϕ = 0 μ–f.ü. ⇐⇒ bk = 0 für alle Bk mit μ(Bk ) = 0 .

2.2 Das μ–Integral für Elementarfunktionen


Eine Elementarfunktion ϕ heißt μ–integrierbar, wenn μ(supp ϕ) < ∞. Für
μ–integrierbare Funktionen ϕ in disjunkter Darstellung

N
ϕ = bk χBk
k=1

setzen wir
  
N
ϕ dμ = ϕ(ω) dμ(ω) := bk μ(Bk ) .
Ω Ω k=1

Dass diese Definition Sinn macht, d.h. dass die rechte Seite für jede disjunkte
Darstellung denselben endlichen Wert hat, sehen wir wie folgt ein. Wegen Bk ⊂
supp ϕ für k = 1, . . . , N ist die rechte Seite endlich. Gegeben seien zwei disjunkte
Darstellungen

M 
N 7
M 7
N
ϕ = ai χAi = bk χBk mit Ai = Bk = Ω .
i=1 k=1 i=1 k=1

Dann sind Ai , Bk Vereinigungen paarweise disjunkter messbarer Mengen,


7
N 7
M
Ai = Ai ∩ Bk , Bk = Ai ∩ Bk , somit
k=1 i=1

N 
M
χAi = χAi ∩Bk , χBk = χAi ∩Bk und daraus
k=1 i=1

M 
 N 
M 
N
ai χAi ∩Bk = ϕ = bk χAi ∩Bk .
i=1 k=1 i=1 k=1

Es folgt ai = bk , falls μ(Ai ∩Bk ) > 0, und damit wegen der endlichen Additivität

M 
M 
N 
N 
M
ai μ(Ai ) = ai μ(Ai ∩ Bk ) = bk μ(Ai ∩ Bk )
i=1 i=1 k=1 k=1 i=1


N
= bk μ(Bk ) .
k=1
512 § 20 Integration bezüglich eines Maßes μ

2.3 Eigenschaften des μ–Integrals für Elementarfunktionen


(a) Die μ–integrierbaren Elementarfunktionen bilden einen mit E (μ) bezeich-
Ê
neten Vektorraum über . Für ϕ, ψ ∈ E (μ) und a, b ∈ gilt Ê
  
(aϕ + bψ) dμ = a ϕ dμ + b ψ dμ .
Ω Ω Ω

Daher gilt auch für nicht disjunkte Darstellungen von ϕ ∈ E(μ)



M  
M
ϕ = ai χAi =⇒ ϕ dμ = ai μ(Ai ) .
i=1 Ω i=1

(b) Für ϕ, ψ ∈ E(μ) gilt


 
ϕ ≤ ψ μ–f.ü. =⇒ ϕ dμ ≤ ψ dμ .
Ω Ω

(c) Mit ϕ gehört auch |ϕ| zu E (μ), und es gilt


  
 ϕ dμ  ≤ |ϕ| dμ .
Ω Ω
 
(d) Aus ϕ ∈ E (μ) und ψ = ϕ μ–f.ü. folgt ψ ∈ E (μ) und ϕ dμ = ψ dμ .
Ω Ω

(e) Aus |ϕ| dμ = 0 folgt ϕ = 0 μ–f.ü.
Ω

Beweis als ÜA : Die Aussagen (a), (b), (d) ergeben sich aus einer gemeinsamen
disjunkten Darstellung. Für (d) und (e) ist 2.1 (d) zu beachten. 2

2.4 Beispiele
Ê
(a) Treppenfunktionen im n sind spezielle Elementarfunktionen, die bezüg-
lich des Lebesgue–Maßes λn = V n integrierbar sind. Aus 2.3 (a) ergibt sich
 
ϕ dV n = ϕ(x) dn x ,
Ên Ên
wobei die rechte Seite im herkömmlichen Sinn zu verstehen ist (Bd. 1, § 23 : 1.4).

(b) Das Dirac–Maß δa . Für Borelmengen B ⊂ Ê n


definieren wir
(
1, falls a ∈ B
δa (B) =
0 sonst.

Für jede Elementarfunktion ϕ auf Ω = Ên


bezüglich A = B( Ê ) gilt
n
ÜA

ϕ dδa = ϕ(a) .
Ên
2 Das μ–Integral für Elementarfunktionen 513

Um die Punktauswertung ϕ → ϕ(a) als Integral aufzufassen, ist es also unnötig,


eine Dirac–Funktion“ δ ins Spiel zu bringen mit


ϕ(a) = δ(x − a) ϕ(x) dn x .
Ê n

(c) Diskrete Verteilungen. Seien x0 , x1 , . . . abzählbar viele verschiedene




reelle Zahlen und p1 , p2 , . . . nichtnegative Zahlen mit pk = 1. Für Borel-
mengen B ⊂ Ê sei k=0

 

μ(B) = pk = pk χB (xk ) .
xk ∈B k=0

Nach der Definition § 19 : 9.1 (c) ist also




μ = p k δx k .
k=0

Wegen der Endlichkeit von μ ist jede Elementarfunktion ϕ μ–integrierbar, und


es gilt
 

ϕ dμ = ϕ(xk ) pk ,
Ê k=0

wobei die Reihe absolut konvergiert.


Es zeigt sich später, dass diese Formel für alle μ–integrierbaren Funktionen ϕ
gilt. Insbesondere sind Erwartungswert μ / und Varianz V (μ), falls sie existieren,
als μ–Integrale darstellbar:
 
/=
μ x dμ(x) , V (μ) = /)2 dμ(x) .
(x − μ
Ê Ê
Beweis.

N 7
N
Sei ϕ = bi χBi eine disjunkte Darstellung mit Bi = Ω. Dann gilt
i=1 i=1

 
N 
N 
∞ 
∞ 
N
ϕ dμ = bi μ(Bi ) = bi pk χBi (xk ) = pk bi χBi (xk ) .
Ê i=1 i=1 k=0 k=0 i=1

Dabei ist

ϕ(xk ) falls xk ∈ Bi ,
bi χBi (xk ) =
0 sonst.
514 § 20 Integration bezüglich eines Maßes μ

Da jedes xk in genau einer der Mengen Bi liegt folgt


N
bi χBi (xk ) = ϕ(xk ) für k = 1, 2, . . .
i=1

und damit die Behauptung. Die absolute Konvergenz der Reihe folgt wegen
| ϕ(xk ) pk | ≤ ϕ∞ pk aus dem Majorantenkriterium.

3 Messbare Funktionen
3.1 Definitionen, Bezeichnungen
(a) Gegeben sei eine σ–Algebra A auf einer nichtleeren Menge Ω. Eine Funktion
Ê
f : Ω → heißt messbar (genauer A–messbar), wenn für jedes Intervall I das
Urbild f −1 (I) zu A gehört, vgl. 1 (c).
Eine komplexwertige Funktion heißt messbar, wenn Real– und Imaginärteil
messbar sind.

(b) Für Funktionen f : Ω → Ê führen wir folgende Bezeichnungen ein:


{f ∈ B} := {ω ∈ Ω | f (ω) ∈ B} = f −1 (B) ,
{f ≤ β} := {ω ∈ Ω | f (ω) ≤ β} = f −1 (] − ∞, β]) ,
{α < f ≤ β} := {ω ∈ Ω | α < f (ω) ≤ β} ,
entsprechend {f = α}, {f > α} usw.

3.2 Charakterisierungen messbarer Funktionen


Satz. Für eine Funktion f : Ω → Ê sind folgende Aussagen äquivalent:
(a) f ist A–messbar,
(b) {f ≤ β} ∈ A für jedes β ∈ Ê,
(c) {f ≥ α} ∈ A für jedes α ∈ Ê,
(d) {f ∈ I} ∈ A für jedes Intervall I eines speziellen Typs,
(e) {f ∈ B} ∈ A für jede Borelmenge B ⊂ Ê,
(f) {f ∈ U } ∈ A für jede offene Menge U ⊂ Ê.

Beweis.
Für eine beliebige Funktion f : Ω → Ê
ist Σ := {M ⊂ | f −1 (M ) ∈ A} eine Ê
Ê Ê Ê
σ–Algebra auf . Denn es gilt f ( ) = Ω, f −1 ( \ M ) = Ω \ f −1 (M ), sowie
−1

7
∞ 7
∞ -
∞ -

f −1 ( Ai ) = f −1 (Ai ) , f −1 ( Bj ) = f −1 (Bj )
i=1 i=1 j=1 j=1

für beliebige Teilmengen Ai , Bj von Ê ÜA .


3 Messbare Funktionen 515

Enthält Σ alle Intervalle eines der in (a) bis (d) genannten Typen, so enthält Σ
nach § 19 : 5.4 alle Borelmengen. Auch aus (f) folgt (e): Enthält Σ alle offenen
Mengen, so enthält Σ alle Intervalle vom Typ ]α, β[. Umgekehrt folgen aus (e)
alle übrigen Aussagen. 2

3.3 Beispiele, Folgerungen


(a) Elementarfunktionen sind messbar.

N 7
N
Denn für ϕ = bk χBk mit paarweise disjunkten Bk ∈ A und Ω = Bk
7
k=1 k=1
gilt ϕ−1 (I) = Bk ∈ A für jedes Intervall I.
bk ∈I

Ê
(b) Jede auf einer Borelmenge Ω ⊂ n stetige Funktion f : Ω → Ê ist Borel–
messbar (d.h. B(Ω)–messbar) und Lebesgue–messbar.
Denn für f ∈ C(Ω) gilt {f ≤ β} = Ω ∩ {f ≤ β} für alle β ∈ ÜA . Die Ê
Behauptung folgt aus 3.2 (b), da abgeschlossene Mengen Borelmengen und somit
auch Lebesgue–messbar sind.

(c) Mit f ist auch −f messbar, da in 3.2 die Bedingungen (a), (b), (c) äqui-
valent sind.

(d) Mit f : Ω → Ê ist auch αf + β für α, β ∈ Ê messbar ÜA .

(e) Die Hintereinanderausführung messbarer Funktionen ist messbar : Sei A ei-


ne σ–Algebra auf Ω, B eine σ–Algebra auf Ω ; f : Ω → Ê
sei B–messbar und
g −1 (B) ∈ A für alle B ∈ B. Dann folgt nach 3.2 (e) die A–Messbarkeit von
f ◦ g.

(f) Mit f sind auch f+ , f− und |f | messbar. Denn {f+ ≤ β} = ∅ für β < 0,
und {f+ ≤ β} = {f ≤ β} für β ≥ 0. Entsprechend für f− . Schließlich gilt
{|f | ≤ β} = ∅ für β < 0 und {|f | ≤ β} = {f ≤ β} ∩ {−f ≤ β} für β ≥ 0.

3.4 Supremum und Limes messbarer Funktionenfolgen


(a) Für eine Folge von Funktionen fn : Ω → Ê sagen wir, dass
g := sup {fn | n ∈ Æ} existiert,

wenn für jedes ω ∈ Ω die Folge (fn (ω)) nach oben beschränkt ist, also ein
mit g(ω) bezeichnetes Supremum besitzt. Entsprechend soll die Aussage h =
Æ
inf{fn | n ∈ } existiert“ verstanden werden.

Æ
Satz. Existiert g = sup { fn | n ∈ } für eine Folge messbarer Funktionen
Ê Æ
fn : Ω → , so ist g messbar. Existiert h = inf{fn | n ∈ }, so ist h messbar.
516 § 20 Integration bezüglich eines Maßes μ

Beweis.
-

(i) Es gilt {g ≤ β} = {fn ≤ β} ÜA . Mit den Mengen {fn ≤ β} gehört
n=1
auch ihr Durchschnitt zu A. Also ist g nach 3.2 (b) messbar.
-

(ii) Die zweite Behauptung folgt aus {h ≥ α} = {fn ≥ α} ÜA und aus
n=1
3.2 (c). 2

(b) Satz. Konvergieren messbare Funktionen fn : Ω → Ê


punktweise gegen
eine Funktion f , d.h. fn (ω) → f (ω) für alle ω ∈ Ω, so ist f messbar.
Der Beweis stützt sich auf folgendes

Lemma. Der Grenzwert a einer konvergenten reellen Zahlenfolge (an ) lässt sich
darstellen durch
a = inf sup am .
n∈ m≥n

Aus diesem ergibt sich die Behauptung des Satzes mit am = fm (ω), gn (ω) =
Æ
sup{fm (ω) | m ≥ n} und f (ω) = inf{gn (ω) | n ∈ } mit Hilfe von (a).

Zum Beweis des Lemmas beachten wir, dass konvergente Folgen beschränkt
sind. Also existieren die Suprema
bn := sup { am | m ≥ n} für n = 1, 2, . . . .
Die Folge (bn ) fällt monoton und ist durch inf{am | m ∈ Æ} nach unten be-
schränkt, also existiert b := lim bn = inf{bn | n ∈ }.
n→∞
Æ
Wegen bn ≥ an gilt b = lim bn ≥ lim an = a.
n→∞ n→∞

Zu gegebenem ε > 0 gibt es ein nε mit am < a + ε für m ≥ nε . Es folgt


b ≤ bn = inf{ am | m ≥ n} < a + ε für n ≥ nε .
Für ε → 0 erhalten wir b ≤ a, also insgesamt a = b. 2

3.5 Approximation messbarer Funktionen durch Elementarfunktio-


nen
Eine Funktion f : Ω → Ê
heißt positiv ( f ≥ 0 ) wenn f (ω) ≥ 0 für alle
ω ∈ Ω. Wir definieren f ≤ g durch g − f ≥ 0. Eine Funktionenfolge (fn ) heißt
aufsteigend, wenn fn ≤ fn+1 für n = 1, 2, . . . .
Ausgangspunkt für die Definition des μ–Integrals ist der folgende
Satz. (a) Jede beschränkte messbare Funktion f : Ω → Ê ist gleichmäßiger
Limes einer aufsteigenden Folge von Elementarfunktionen.
3 Messbare Funktionen 517

(b) Für einen σ–endlichen Maßraum (Ω, A, μ) ist jede positive messbare Funk-
tion f auf Ω punktweiser Limes einer aufsteigenden Folge μ–integrierbarer,
positiver Elementarfunktionen.
(c) Folgerung. Eine Funktion f : Ω → Ê
ist genau dann messbar, wenn sie
punktweiser Limes einer Folge von Elementarfunktionen ist.

Beweis.
(a) wurde in Abschnitt 1 gezeigt. Die dortige Voraussetzung μ(Ω) < ∞ sollte
nur die μ–Integrierbarkeit der approximierenden Elementarfunktionen sichern.
Diese sind nach Konstruktion positiv, wenn f positiv ist.
(b) Wegen der σ–Endlichkeit von μ gibt es Mengen Ωn ∈ A mit μ(Ωn ) < ∞,
7

so dass Ω1 ⊂ Ω2 ⊂ . . . und Ω = Ωn . Für die Mengen
n=1

Bn := Ωn ∩ {f ≤ n} ∈ A
7

gilt ebenfalls μ(Bn ) < ∞, B1 ⊂ B2 ⊂ . . . und Ω = Bn . Die Funktionen
n=1

fn := f χBn
sind positiv und aufgrund der Bedingung 3.2 (c) messbar:
{fn ≥ α} = Ω für α ≤ 0 und

{fn ≥ α} = Bn ∩ {f ≥ α} für α > 0 ,

denn für α > 0 gilt {fn ≥ α} ⊂ Bn , und auf Bn gilt fn (ω) = f (ω). Nach (a)
gibt es Elementarfunktionen ψn mit
1 χ
0 ≤ ψn ≤ fn ≤ ψn + Ω.
n
Wegen supp ψn ⊂ Ωn sind die ψn und damit auch die ϕn = sup{ψ1 , . . . , ψn }
μ–integrierbare Elementarfunktionen, und es gilt
0 ≤ ϕ1 ≤ ϕ2 ≤ . . . ≤ f .
Zu jedem ω ∈ Ω gibt es ein N ∈ Æ mit ω ∈ BN . Dann gilt auch ω ∈ Bn für
n ≥ N , also
1
0 ≤ f (ω) − ϕn (ω) ≤ f (ω) − ψn (ω) ≤ → 0 für n → ∞ .
n
(c) Elementarfunktionen sind messbar, also ist nach 3.4 (b) auch jeder punkt-
weise Limes von Elementarfunktionen messbar. Ist umgekehrt f : Ω → Ê
messbar, so sind auch f+ , f− messbar, also nach (b) punktweise Limites (μ–
integrierbarer) Elementarfunktionen. 2
518 § 20 Integration bezüglich eines Maßes μ

3.6 Weitere Eigenschaften messbarer Funktionen


(a) Die komplexwertigen messbaren Funktionen bilden einen Vektorraum. Mit
f, g ist auch f · g messbar. Setzen wir für eine messbare Funktion f : Ω →
(
1/f (ω) falls f (ω) = 0
h(ω) :=
0 sonst ,

so ist h messbar.

Beweis.
Seien f, g : Ω → messbar. Nach 3.5 (c) gibt es dann Elementarfunktionen
ϕn , ψn mit ϕn → f , ψn → g punktweise auf Ω. Nach 3.5 (c) sind dann auch

αf + βg = lim (αϕn + βψn ) und f · g = lim ϕn · ψn


n→∞ n→∞

messbar. Da die Menge {f = 0} = {f > 0} ∪ {f < 0} messbar ist, ergibt sich


auch die Messbarkeit von h nach den Kriterien 3.2 (b), (c) ÜA .
Die Übertragung auf komplexwertige Funktion sei den Lesern als ÜA über-
lassen. 2

(b) Fast überall konvergierende Folgen messbarer Funktionen. Eine Folge mess-
barer Funktionen fn : Ω → 
heißt konvergent μ–f.ü., wenn es eine μ–
Nullmenge N gibt, so dass die Folge (fn (ω)) für alle ω ∈ Ω \ N konvergiert. In
diesem Fall ist durch
(
lim fn (ω) für ω ∈ Ω \ N ,
f (ω) := n→∞
0 für ω ∈ N

eine messbare Funktion f gegeben, denn die Folge fn · χΩ\N konvergiert überall
gegen f . Wir schreiben hierfür f = lim fn μ–f.ü.
n→∞

(c) Fast überall differenzierbare Funktionen. Sei f auf dem Intervall I messbar
und fast überall differenzierbar, d.h. es gebe eine Lebesgue–Nullmenge N , so
dass f  (x) für alle x ∈ I \ N existiert. Definieren wir f  (x) := 0 für x ∈ N ,
so erhalten wir eine (Lebesgue–)messbare Funktion f  : I → . Wir zeigen
dies für Intervalle I = ]a, b[. Da d(x) := 12 dist (x, ∂I) stetig ist, sind durch

n
fn (x) = d(x) f (x + d(x)
n
) − f (x) für x ∈ I \ N bzw. fn (x) = 0 für x ∈ N
messbare Funktionen fn : I → gegeben mit fn (x) → f  (x) für alle x ∈ I.
Den Beweis für andere Intervalltypen überlassen wir den Lesern als ÜA .
Entsprechend definieren wir partielle Ableitungen fast überall.
4 Das μ–Integral 519

(d) Zusammenfassung. Durch Anwendung algebraischer Operationen, durch


Hintereinanderausführung, durch Supremumsbildung und durch Grenzübergänge
entstehen aus messbaren Funktionen wieder messbare. Nicht messbare Funktio-
nen lassen sich nicht konstruieren.
Ê
Dass es auch Funktionen auf dem n gibt, die nicht Lebesgue–messbar sind,
liegt an der Existenz nicht Lebesgue–messbarer Mengen. (Der Beweis hierfür
erfordert nichtkonstruktive Mittel, vgl. Barner–Flohr [141] 15.2.)
Ê
Ist V ⊂ n nicht Lebesgue–messbar, so gilt dies auch für V c = n \ V . Dann Ê
ist f := χV − χV c nicht Lebesgue–messbar wegen {f ≥ 1} = V . Dagegen sind
|f | und damit auch |f |2 messbar.
Aus der Messbarkeit von |f | darf nicht auf die Messbarkeit von f geschlossen
werden.

4 Das μ–Integral
4.1 Das μ–Integral für positive messbare Funktionen
Durch (Ω, A, μ) sei ein σ–endliches Maß μ gegeben. Dann gibt es nach 3.5 zu
Ê
jeder A–messbaren Funktion f : Ω → + eine aufsteigende Folge positiver
μ–integrierbarer Elementarfunktionen ϕn , die auf Ω punktweise gegen f kon-
vergieren. Jede solche Folge nennen wir integraldefinierend
 für f . Ist die nach
2.3 monoton wachsende Folge der μ–Integrale ϕn dμ nach oben beschränkt,
Ω
so heißt f μ–integrierbar, und das μ–Integral von f ist definiert durch
 
f dμ := lim ϕn dμ .
n→∞
Ω Ω

Ist f nicht μ–integrierbar, so schreiben wir f dμ = ∞ .
Ω
Die Wahl der integraldefinierenden Folge (ϕn ) spielt dabei keine Rolle. Denn
für jede andere integraldefinierende Folge (ψn ) für f gilt
ϕm (ω) ≤ lim ψn (ω) = f (ω) , ψm (ω) ≤ lim ϕn (ω) = f (ω)
n→∞ n→∞

für alle m ∈  und alle ω ∈ Ω. Mit dem nachfolgenden Lemma folgt


   
ϕm dμ ≤ lim ψn dμ , ψm dμ ≤ lim ϕn dμ ;
n→∞ n→∞
Ω Ω Ω Ω

daraus ergibt sich für m → ∞ die Gleichheit der Grenzwerte beider Integralfol-
gen bzw. deren simultane Divergenz.

Lemma. Seien ψ, ϕ1 , ϕ2 , . . . positive, μ–integrierbare Elementarfunktionen


mit 0 ≤ ϕ1 ≤ ϕ2 ≤ . . . ,
ψ(ω) ≤ lim ϕn (ω) für alle ω ∈ Ω .
n→∞
520 § 20 Integration bezüglich eines Maßes μ

Dann gilt
 
ψ dμ ≤ lim ϕn dμ ,
n→∞
Ω Ω

wobei diese Ungleichung auch als erfüllt gilt, wenn lim ϕn dμ = ∞.
n→∞
Ω

Beweis.
Für ψ = 0 ist nichts zu beweisen; sei also ψ = 0. Wir definieren

P := {ψ > 0} , α := min{ψ(ω) | ω ∈ P } , β := max{ψ(ω) | ω ∈ P } .

Da ψ messbar und μ–integrierbar ist, gilt P ∈ A und μ(P ) < ∞, ferner gilt
0 < α ≤ β. Sei ε ∈ ]0, α[ vorgegeben. Dann gehören die Mengen

An = {ϕn ≥ ψ − ε} ∩ P und Bn := P \ An
7

zu A. Ferner gilt A1 ⊂ A2 ⊂ . . . und P = An nach Voraussetzung. Aus
n=1
§ 19 : 6.3 folgt

μ(P ) = lim μ(An ) , lim μ(Bn ) = μ(P ) − lim μ(An ) = 0 .


n→∞ n→∞ n→∞

Nach Definition der An und wegen ϕn ≥ 0 gilt

ϕn ≥ (ψ − ε) χAn ,
also
ϕn + (ψ − ε) χBn ≥ (ψ − ε) χP = ψ − ε χP
und daraus
ϕn + (β − ε) χBn + ε χP ≥ ϕn + (ψ − ε) χBn + ε χP ≥ ψ .
Es folgt
 
ψ dμ ≤ ϕn dμ + (β − ε) μ(Bn ) + ε μ(P ) und für n → ∞ ,
Ω Ω
  
ψ dμ ≤ sup ϕn dμ  n ∈   + ε μ(P ) für jedes ε > 0 . 2
Ω Ω

4.2 Das μ–Integral für komplexwertige Funktionen


(a) Eine messbare Funktion f : Ω → Ê
heißt μ–integrierbar, wenn f+ und
f− beide μ–integrierbar sind. Wir definieren in diesem Fall
  
f dμ := f+ dμ − f− dμ .
Ω Ω Ω
4 Das μ–Integral 521

(b) Eine komplexwertige messbare Funktion f auf Ω heißt μ–integrierbar,


wenn u = Re f und v = Im f beide μ–integrierbar sind. Wir setzen dann
  
f dμ := u dμ + i v dμ .
Ω Ω Ω
 
(c) Statt f dμ schreiben wir auch f (ω) dμ(ω) bzw.
Ω Ω
 
f (x) dμ(x) , falls Ω ⊂ Ê und f (x) dμ(x) , falls Ω ⊂ Ê n
.
Ω Ω

4.3 Elementare Eigenschaften des μ–Integrals


(a) Die komplexwertigen μ–integrierbaren Funktionen auf Ω bilden einen –
Vektorraum, bezeichnet mit L1 (Ω, μ). Für f, g ∈ L1 (Ω, μ) und α, β ∈ gilt
  
(αf + βg) dμ = α f dμ + β g dμ .
Ω Ω Ω

(b) Für reellwertige f, g ∈ L1 (Ω, μ) gilt


 
f ≤ g =⇒ f dμ ≤ g dμ .
Ω Ω

(c) Mit f ist auch |f | μ–integrierbar, und es gilt


  
 f dμ  ≤ |f | dμ .
Ω Ω

Bemerkungen. (i) In den späteren Anwendungen gehört zum Maß μ immer


eine kanonische σ–Algebra A, daher erübrigt sich die genauere Kennzeichnung
L1 (Ω, A, μ).
(ii) Statt L1 (Ω, V n ) schreiben wir L1 (Ω).

Beweis.
 
Wir verwenden die Abkürzung f für f dμ, L1 für L1 (Ω, μ) und L1+ für
Ω
{f ∈ L1 | f ≥ 0}.
(a) Unmittelbar aus der Definition 4.1 und der Linearität des μ–Integrals für
Elementarfunktionen folgt

f, g ∈ L1+ , α, β ∈ + =⇒ αf + βg ∈ L1+ und
(1)   
(αf + βg) = α f +β g.

Wir betrachten zunächst nur reellwertige Funktionen f, g und zeigen als erstes
 
(2) f ∈ L1 , α ∈  =⇒ αf ∈ L1 und αf = α f.
522 § 20 Integration bezüglich eines Maßes μ

  
Für f ∈ L1 gilt definitionsgemäß f+ , f− ∈ L1+ und f = f+ − f− . Für
α ≥ 0 folgt

αf+ , αf− ∈ L1+ , αf = αf+ − αf− ∈ L1 und mit (1)


       
αf = αf+ − αf− = α f+ − α f− = α f+ − f− = α f.

Für α < 0 gilt (αf )+ = |α|f− ∈ L1+ , (αf )− = |α|f+ ∈ L1+ und somit
αf = |α|f− − |α|f+ ∈ L1 sowie mit (1)
      
αf = |α|f− − |α|f+ = |α|( f− − f+ ) = −|α| f =α f.

Als nächstes zeigen wir für reellwertige f, g


  
(3) f, g ∈ L1 =⇒ f + g ∈ L1 und (f + g) = f+ g.

Hierzu schreiben wir F := f + g in der Form

F = u−v mit u = f+ + g+ , v = f− + g− .

Nach (1) gilt u, v ∈ L1+ und


     
(4) u = f+ + g+ , v = f− + g− .

Wir betrachten integraldefinierende Folgen

(ϕn ) für u , (ψn ) für v , (Φn ) für F+ , (Ψn ) für F− .

Durch

ξn := min{ϕn , Φn } , ηn := min{ψn , Ψn }

erhalten wir aufsteigende Folgen (ξn ), (ηn ) von L1+ –Elementarfunktionen. We-
gen F+ ≤ u, F− ≤ v gilt punktweise

F+ = lim ξn = sup, {ξn | n ∈


n→∞
} , F− = lim ηn = sup, {ηn | n ∈
n→∞
} ,
ferner
     
ξn ≤ ϕn ≤ u, ηn ≤ ψn ≤ v.

Aus der Definition 4.1 folgt F+ , F− ∈ L1+ , und aus (1) erhalten wir
     
(5) F+ + v = (F+ + v) = (F− + u) = F− + u.

Mit Hilfe von (4), (5) ergibt sich schließlich


     
(f + g) = F = F+ − F− = u− v
     
= f+ + g+ − f− − g− = f+ g.
4 Das μ–Integral 523

Daraus und aus (2) folgt (a) für reelle Funktionen und α, β ∈ . Die Über-Ê
tragung von (a) ins Komplexe bereitet nunmehr keine Schwierigkeiten ÜA .

(b) 
Sind f,g reellwertige
 L1 –Funktionen mit f ≤ g, so gilt h := g − f ∈ L1+
und h = g − f nach (a). Wegen h ∈ L1+ gilt h ≥ 0 nach 4.1.

(c) Für reellwertige f ∈ L1 gilt definitionsgemäß f+ , f− ∈ L1+ . Nach (a) folgt


|f | = f+ + f− ∈ L1+ und
       
 f  =  f+ − f−  ≤ f+ + f− = |f | .

Für komplexwerige Funktionen f ∈ L1 ergibt sich die μ–Integrierbarkeit von |f |


erst später mittels des Majorantenkriteriums. Unter Vorwegnahme von |f | ∈ L1+
setzen wir f = r eiϕ und erhalten mit (a), 4.2 (b) und dem Vorangehenden
     
 f  = r = Re e−iϕ f = Re e−iϕ f = Re (e−iϕ f )
 −iϕ 
≤ |e f| = |f | . 2

4.4 Die Rolle von μ–Nullmengen für die Integration


(a) Eine Eigenschaft E(ω) wie f (ω) = g(ω), f (ω) ≤ g(ω) f (ω) = lim fn (ω)
n→∞
heißt μ–fast überall erfüllt, wenn es eine μ–Nullmenge N gibt, so dass E(ω)
für alle ω ∈ Ω \ N besteht. Wir verwenden die Schreibweisen

f = g μ–f.ü., f ≤ g μ–f.ü., f = lim fn μ–f.ü. usw.


n→∞

Beachten Sie: E(ω) μ–fast überall bedeutet beim Lebesgue–Maß μ = V n (wie


bei jedem vollständigen Maß), dass die Ausnahmemenge { ω | E(ω) gilt nicht}
eine μ–Nullmenge ist. Fast überall (f.ü.) steht für V n –fast überall.

(b) Satz. Ist f : Ω → μ–integrierbar, g : Ω → messbar und f = g μ–f.ü.,


so ist auch g μ–integrierbar, und es gilt
 
g dμ = f dμ .
Ω Ω

Sind f, g ∈ L1 (Ω, μ) reellwertig, so gilt


 
f ≤ g μ–f.ü. =⇒ f dμ ≤ g dμ .
Ω Ω

Beweis.
(i) Wir zeigen zunächst: Ist h messbar und h = 0 μ–f.ü., so gilt

h ∈ L1 (Ω, μ) und h dμ = 0 .
Ω
524 § 20 Integration bezüglich eines Maßes μ

Im Fall h ≥ 0 folgt dies aus der Definition 4.1, denn für jede
 μ–integrierbare
Elementarfunktion ϕ mit 0 ≤ ϕ ≤ h gilt ϕ = 0 μ–f.ü., also ϕ dμ = 0.
Ω

Für reellwertige messbare h mit h = 0 μ–f.ü. gilt auch h+ = 0 μ–f.ü. und h− = 0


μ–f.ü., woraus nach dem Vorangehenden die μ–Integrierbarkeit von h+ , h− und
das Verschwinden deren μ–Integrale folgt.
Im allgemeinen Fall h = u + iv folgt aus h = 0 μ–f.ü. auch u = 0 μ–f.ü. und
v = 0 μ–f.ü. (und umgekehrt).
(ii) Sei f ∈ L1 (Ω), g messbar und N eine μ–Nullmenge mit f (ω) = g(ω) für
ω ∈ Ω \ N . Dann gilt g = f + (g − f ) · χN ; dabei ist h := (g − f )χN eine messbare
Funktion mit h = 0 μ–f.ü.. Nach (i) und 4.3 (a) folgt die μ–Integrierbarkeit von
g und die Gleichheit der μ–Integrale von f und von g.
(iii) Für die reellwertigen Funktionen f, g ∈ L1 (Ω, μ) sei f ≤ g μ–f.ü.. Dann
gibt es eine μ–Nullmenge N mit f (ω) ≤ g(ω) auf Ω \ N . Wir setzen

M := Ω \ N , F := f · χM , G := g · χM .

Dann gilt F = f μ–f.ü., G = g μ–f.ü. und F (ω) ≤ G(ω) für alle ω ∈ Ω. Nach
(ii) folgt F, G ∈ L1 (Ω, μ), und aus 4.3 (b) ergibt sich
   
f dμ = F dμ ≤ G dμ = g dμ . 2
Ω Ω Ω Ω

4.5 Das Majorantenkriterium


Satz. Besitzt eine messbare Funktion f : Ω → eine μ–Majorante g, das ist
eine μ–integrierbare Funktion g : Ω → + mit Ê
| f (ω) | ≤ g(ω) μ–f.ü.,

so ist auch f μ–integrierbar, und es gilt


  
 f dμ  ≤ g dμ .
Ω Ω

Dies ist das Hauptkriterium für μ–Integrierbarkeit. Typische Anwen-


dungssituationen sind:
(i) f ist Lebesgue–messbar und besitzt eine stetige V n –Majorante g. Für ste-
tige Funktionen lässt sich die Lebesgue–Integrierbarkeit nach den Kriterien von
Bd. 1, § 23 feststellen, Näheres in 5.5.
(ii) Ω hat endliches Maß und |f | ≤ C μ–f.ü. mit einer Konstanten C. Dann ist
 
g = C · χΩ eine μ–Majorante und  f dμ  ≤ C μ(Ω).
Ω
5 Vertauschbarkeit von Limes und Integral 525

Bemerkung. Aus dem Majorantenkriterium folgt:


Ist f messbar und |f | μ–integrierbar, so ist auch f μ–integrierbar. Allein die
μ–Integrierbarkeit von |f | impliziert nicht die Messbarkeit von f , vgl. 3.6 (d).

Beweis.
(i) Besitzt f eine μ–Majorante g ∈ L1 (Ω, μ), so dürfen wir annehmen, dass
|f (ω)| ≤ g(ω) für alle ω ∈ Ω, denn Nullsetzen von f auf einer μ–Nullmenge
berührt weder die Integrierbarkeit noch das Integral.
(ii) Wir setzen zunächst voraus, dass f messbar ist und dass 0 ≤ f ≤ g gilt mit

C = g dμ < ∞ .
Ω

Nach 4.1 gibt es integraldefinierende Folgen (ϕn ) für f , (ψn ) für g. Wegen

g(ω) = sup {ψn (ω) | n ∈ } ≥ f (ω) ≥ ϕ m (ω) für alle ω ∈ Ω

sind die Voraussetzungen des Lemmas in 4.1 erfüllt, und wir erhalten
 

ϕm dμ ≤ sup ψn dμ  n ∈   =  g dμ = C .
Ω Ω Ω

Aus der Definition 4.1 folgt für die μ–Integrierbarkeit von f und f dμ ≤ C.
Ω

(iii) Ist f reellwertig und messbar mit μ–Majorante g, so ist g auch eine μ–
Majorante für f+ und für f− , also sind diese Funktionen und somit auf f und
|f | μ–integrierbar. Die Integralabschätzung folgt aus 4.3 (b).
(iv) Hat die komplexwertige messbare Funktion f = u + iv die μ–Majorante g,
so ist g auch eine μ–Majorante für die Funktionen u, v; nach (iii) sind diese und
damit auch f μ–integrierbar. Die Integralabschätzung folgt nach 4.3 (c). 2

5 Vertauschbarkeit von Limes und Integral


5.1 Der Satz von der monotonen Konvergenz (Satz von Beppo Levi)
Ist (fn ) eine aufsteigende Folge
 μ–integrierbarer, reellwertiger Funktionen und
ist die Folge der Integrale fn dμ nach oben beschränkt, so gibt es eine μ–
Ê mit
Ω
integrierbare Funktion f : Ω →
f = lim fn μ–f.ü.
n→∞

und
 
f dμ = lim fn dμ .
n→∞
Ω Ω

Dabei ist die Ausnahmemenge { ω ∈ Ω | fn (ω) divergiert } eine μ–Nullmenge.


526 § 20 Integration bezüglich eines Maßes μ

Folgerungen.
(a) Sind die Funktionen uk : Ω →
∞ 
Ê + (k = 0, 1, . . .) μ–integrierbar und kon-
 

vergiert die Reihe uk dμ , so konvergiert die Reihe uk μ–f.ü. gegen
k=0 Ω k=0
eine μ–integrierbare Funktion u, und es gilt
 ∞ 

u dμ = uk dμ .
Ω k=0 Ω

(b) Ist f μ–integrierbar und |f | dμ = 0, so ist f = 0 μ–f.ü., d.h. die Aus-
Ω
nahmemenge {f = 0} ist eine μ–Nullmenge.

Beweis.
(a) Wegen der Linearität und Monotonie
 des μ–Integrals dürfen wir o.B.d.A.
voraussetzen, dass fn ≥ 0 und 0 ≤ fn dμ ≤ C für alle n ∈ . 
Ω

(b) Konvergenz μ–f.ü.. Sei N = {ω ∈ Ω | (fn (ω)) divergiert}. Da die Folge


(fn (ω)) monoton wächst, gilt ω ∈ N genau dann, wenn es zu jedem m ∈ 
ein n ∈ 
gibt, mit fn (ω) ≥ m. Also gilt
-
∞ 7

N = {fn ≥ m} ∈ A ,
m=1 n=1

denn wegen der Messbarkeit der fn gilt An,m := {fn ≥ m} ∈ A, somit auch
7
∞ -

Bm = An,m ∈ A und N = Bm ∈ A .
n=1 m=1

Wegen fn ≥ 0 gilt m χAn,m ≤ fn , daher nach 4.3 (b)


 C
m μ(An,m ) ≤ fn dμ ≤ C , d.h. μ(An,m ) ≤ .
Ω
m

7

Aus An,m ⊂ An+1,m und Bm = An,m folgt nach § 19 : 6.3 (a)
n=1

C
μ(Bm ) = lim μ(An,m ) ≤ für m = 1, 2, . . . ,
n→∞ m
-

insbesondere μ(B1 ) < ∞. Wegen B1 ⊃ B2 ⊃ . . . und N = Bm ergibt
m=1
§ 19 : 6.3 (b)

μ(N ) = lim μ(Bm ) = 0 .


m→∞
5 Vertauschbarkeit von Limes und Integral 527

(c) Die Grenzfunktion f . Nach 3.6 (b) ist durch


(
lim fn (ω) für ω ∈ M := Ω \ N,
f (ω) := n→∞
0 für ω ∈ N

eine messbare Funktion f ≥ 0 gegeben, die punktweiser Limes der Funktionen


gn := fn · χM ist. Für letztere gilt g1 ≤ g2 ≤ . . . ≤ f und nach 4.4
 
gn ∈ L1 (Ω, μ) , gn dμ = fn dμ (n ∈ ) .
Ω Ω

(d) Seien (ϕn,m )m integraldefinierende Folgen für gn (n = 1, 2, . . .). Dann


gilt ϕn,m ≥ 0, ϕn,m (ω) = 0 für ω ∈ N . Wir betrachten die positiven, μ–
integrierbaren Elementarfunktionen

ψm := max {ϕ1,m , . . . , ϕm,m } .

Wegen 0 ≤ ϕk,m ≤ ϕk,m+1 ≤ gk ≤ gm für k ≤ m erhalten wir

ϕn,m ≤ ψm für n ≤ m, ψm ≤ ψm+1 und ψm ≤ gm , also

gm = sup ϕn,m ≤ sup ψm ≤ sup gm = f .


m m m

Da die gn punktweise gegen f konvergieren, folgt

f = sup ψm = lim ψm .
m m→∞

Wegen ψm ≤ gm gilt ferner


  
ψm ≤ gm = fm ≤ C .
Ω Ω Ω

Nach 4.1 folgt die μ–Integrierbarkeit von f und


   
f dμ = lim ψn dμ ≤ lim gn dμ = lim fn dμ ,
n→∞ n→∞ n→∞
Ω Ω Ω Ω
 
wobei sich die Existenz des letzteren Grenzwerts aus fn dμ ≤ fn+1 dμ ≤ C
Ω Ω
ergibt. Umgekehrt gilt gn ≤ f , also
    
fn dμ = gn dμ ≤ f dμ , somit lim fn dμ ≤ f dμ .
n→∞
Ω Ω Ω Ω Ω

Damit ist der Satz von der monotonen Konvergenz bewiesen.


Die Folgerung (a) ergibt sich unmittelbar ÜA .
528 § 20 Integration bezüglich eines Maßes μ

Für die Folgerung (b) beachten wir, dass N := { ω ∈ Ω | |f (ω)| > 0 } wegen
der Messbarkeit von |f| zu A gehört. Die Funktionen fn := n |f | bilden eine
aufsteigende Folge mit fn dμ = 0, und es gilt
Ω

N = { ω ∈ Ω | (fn (ω)) konvergiert nicht } .

Nach dem Satz von Beppo Levi folgt μ(N ) = 0. 2

5.2 Der Satz von der majorisierten Konvergenz (Satz von Lebesgue)
Haben die messbaren Funktionen fn : Ω → eine gemeinsame μ–Majorante
g und konvergieren sie auf Ω punktweise gegen eine Funktion f , so ist f (wie
auch die fn ) μ–integrierbar, und es gilt
 
f dμ = lim fn dμ .
n→∞
Ω Ω

Bemerkungen. (a) Die μ–Integrierbarkeit der fn folgt aus 4.5.


(b) Die Voraussetzung der punktweisen Konvergenz kann durch die schwächere
Bedingung fn → f μ–f.ü. ersetzt werden ÜA , vgl. 3.6 (b), 4.4.

Beweis.
Nach Voraussetzung gibt es μ–Nullmengen Nn mit | fn (ω) | ≤ g(ω) für alle
7

ω ∈ Ω \ Nn . Dann ist auch N = Nn eine μ–Nullmenge, vgl. § 19 : 7.3 (d),
n=1
und wir erhalten

| fn (ω) | ≤ g(ω) und | f (ω) | = lim | fn (ω) | ≤ g(ω) für alle ω ∈ Ω \ N .


n→∞

Da f als punktweiser Limes der fn messbar ist (vgl. 3.4 (b)), folgt die μ–Inte-
grierbarkeit von f aus dem Majorantenkriterium 4.5.
Wir betrachten die Funktionen un := |f − fn |. Wegen |un | ≤ 2g sind diese
μ–integrierbar, und nach 3.4 (a) sind durch gm := sup{un | n ≥ m} messbare
Funktionen gegeben mit 0 ≤ gm ≤ 2g. Nach 4.5 folgt die μ–Integrierbarkeit
der gm . Ferner bilden die gm eine absteigende und damit die hm := −gm eine
aufsteigende Folge μ–integrierbarer Funktionen mit hm ≤ 0. Aus dem Lemma
in 3.4 (b) entnehmen wir

0 = lim un (ω) = inf{gm (ω) | m ∈


n→∞
} = lim gm (ω) für alle ω ∈ Ω ,
m→∞

also auch lim hm (ω) = 0 für alle ω ∈ Ω. Aus dem Satz von Beppo Levi folgt
m→∞
 
lim hm dμ = 0 , also auch lim gm dμ = 0 .
m→∞ m→∞
Ω Ω
5 Vertauschbarkeit von Limes und Integral 529

Wegen |un | ≤ gn folgt daher


     
 f dμ − fn dμ  =  (f − fn ) dμ  ≤ un dμ
Ω Ω Ω Ω

≤ gn dμ → 0 für n → ∞. 2
Ω

5.3 Weiteres zur Vertauschbarkeit von Limes und Integral


(a) Konvergieren die μ–integrierbaren Funktionen fn punktweise gegen f , so ist
f nach 3.4 messbar. Damit f auch μ–integrierbar ist, bedarf es nach 4.3 (c) und
4.5 einer μ–Majorante für f . Dies reicht jedoch nicht aus, um die Vertauschbar-
keit von Limes und μ–Integral zu garantieren, selbst wenn die fn gleichmäßig ge-
gen f konvergieren. Ein Gegenbeispiel erhalten wir durch die gleichmäßig gegen
f = 0 konvergierenden Elementarfunktionen fn = n1 χ[0,n] und das Lebesgue–
Ê
Integral auf .

(b) Ist μ ein endliches Maß, so gilt der kleine Satz von Lebesgue: Kon-
vergieren die beschränkten messbaren Funktionen auf Ω gleichmäßig gegen f ,
so folgt die μ–Integrierbarkeit von f und die Vertauschbarkeit von Limes und
μ–Integral ( ÜA , beachten Sie 4.5 (ii)).

5.4 Integration über Teilbereiche


(a) Sei f ∈ L1 (Ω, μ), und B = ∅ gehöre zum Definitionsbereich A von μ. Dann
gilt f χB ∈ L1 (Ω, μ) nach dem Majorantenkriterium. Wir definieren
 
f dμ := f χB dμ .
B Ω

(b) B = {A ∈ A | A ⊂ B} ist eine σ–Algebra auf B, und die Einschränkung


ν von μ auf B ist ein σ–endliches Maß ÜA . Für jede A–messbare Funktion
f : Ω → ist die Einschränkung g = f B von f auf B B–messbar ÜA .
Genau dann gilt f χB ∈ L1 (Ω, μ), wenn g ∈ L1 (B, ν). In diesem Fall ist
 
g dν = f χB dμ .
B Ω

ÜA : Zeigen Sie dies zunächst für Elementarfunktionen und dann mit Hilfe des
Satzes von Beppo Levi für positive messbare Funktionen. Der Rest folgt aus
4.2.

(c) Setzen wir eine B–messbare Funktion u : B → zu einer Funktion u .:Ω→


mit u.(ω) = 0 für ω ∈ Ω \ B fort, so gilt u ∈ L1 (B, ν) ⇐⇒ u
. ∈ L1 (Ω, μ) und
im Fall der Integrierbarkeit ( ÜA )
 
. dμ =
u u dν .
Ω B
530 § 20 Integration bezüglich eines Maßes μ

5.5 Zum Lebesgue–Integral


Als ersten Spezialfall der allgemeinen Integrationstheorie besprechen wir das
Ê
Lebesgue–Integral über Teilmengen des n . Für n ≥ 2 bezeichnen wir es wahl-
weise mit
   
f dV n , f dλn , f (x) dn x, f dn x.
Ω Ω Ω Ω

Ê
Dabei ist Ω eine Lebesgue–messbare Teilmenge des n , und der Definitionsbe-
reich A des Lebesgue–Maßes V n = λn besteht aus den Lebesgue–messbaren
Teilmengen von Ω, vgl. § 19 : 8.
Für n = 1 und Intervalle I ⊂ Ê verwenden wir die Bezeichnungen
 
f dλ bzw. f (x) dx .
I I

Die Bezeichnungen fast überall (f.ü.), integrierbar, L1 (Ω), Majorante


beziehen sich stets auf das Lebesgue–Integral, stehen also für V n –f.ü., V n –
integrierbar, L1 (Ω, λn ) und V n –Majorante. In diesem Rahmen bedeutet Messbar-
keit von Mengen bzw. Funktionen die V n – bzw. Ln –Messbarkeit.
Die wichtigsten Eigenschaften des Lebesgue–Integrals sind in § 8, Abschnitt 1
zusammengestellt; inzwischen wurden die meisten Beweise nachgetragen (Aus-
nahme: Sätze von Fubini, Tonelli und Transformationssatz).
Wir halten nochmals fest: Für die Fälle, dass Ω ein kompakter Quader, eine
offene Menge oder eine gutberandete kompakte Menge ist, folgt aus der Inte-
grierbarkeit im herkömmlichen Sinn (Bd. 1, § 23 : 2.1,4.2,7.5) die Integrierbarkeit
im Lebesgueschen Sinn, und das Lebesgue–Integral ist gleich dem herkömmli-
chen. Für kompakte Quader und offene Mengen wurde dies in § 8 : 1.6 gezeigt; für
gutberandete kompakte Mengen folgt dies daraus, dass jede Jordan–Nullmenge
eine V n –Nullmenge ist.

6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê


Als Definitionsbereich für Wahrscheinlichkeitsmaße (Verteilungen) μ auf wäh- Ê
len wir den Bemerkungen § 19 : 7.2 gemäß immer die Borel–Algebra B, vgl.
§ 19 : 5.3,5.4. In diesem Rahmen steht Messbarkeit für B–Messbarkeit; diese zieht
die Lebesgue–Messbarkeit nach sich.
Nach § 19 : 9.2, 9.3 sind Verteilungen μ durch ihre Verteilungsfunktion, d.h.
durch F (x) = μ(] − ∞, x]) festgelegt. Dies ist zunächst eine reine Existenzaus-
sage, daher ist auch das zugehörige μ–Integral zunächst ein abstrakter Begriff.
Für zwei wichtige Spezialfälle werden wir jetzt das μ–Integral konkret angeben.
Für allgemeine Maße μ werden wir das μ–Integral stetiger Funktionen in 6.2
wenigstens näherungsweise bestimmen.
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê 531

6.1 Beispiele
(a) Diskrete Wahrscheinlichkeitsmaße. Für B ∈ B sei
 

μ(B) = pk = pk χB (xk ) ;
xk ∈B k=0

dabei seien x0 , x1 , . . . abzählbar viele verschiedene reelle Zahlen, p0 , p1 , . . . ≥ 0




und pk = 1.
k=0

Satz. Für messbare Funktionen f : Ê→ existiert das μ–Integral


 

f dμ = f (xk ) pk
Ê k=0

genau dann, wenn die Reihe absolut konvergiert. Beim Dirac–Maß δa gilt

f dδa = f (a)
Ê
für jede messbare Funktionen f :  → .

Beweis.
Nach 2.4 (c) ist jede Elementarfunktion ϕ μ–integrierbar, wobei die Reihe
 

ϕ dμ = ϕ(xk ) pk
Ê k=0

absolut konvergiert.
Wir betrachten zunächst eine messbare Funktion f ≥ 0 und eine integraldefi-
nierende Folge (ϕn ) für f . Für diese gilt


N 
N
ϕn (xk ) pk ≤ f (xk ) pk für n, N ∈  .
k=0 k=0

Besitzen die Partialsummen der rechten Seite ein Supremum C, so folgt

 
N 

ϕn dμ = lim ϕn (xk ) pk ≤ C = f (xk ) pk
Ê N→∞ k=0 k=0

und damit nach 4.1 die μ–Integrierbarkeit von f sowie


  

f dμ = lim ϕn dμ ≤ f (xk ) pk .
Ê n→∞
Ê k=0
532 § 20 Integration bezüglich eines Maßes μ


Existiert umgekehrt I = f dμ, so gilt für jede integraldefinierende Folge (ϕn )
Ê

N 
ϕn (xk ) pk ≤ ϕn dμ ≤ I
k=0 Ê
und somit auch

N 
N
f (xk ) pk = lim ϕn (xk ) pk ≤ I .
k=0 n→∞ k=0

Es folgt die Konvergenz von



∞ 
f (xk ) pk ≤ I = f dμ .
k=0 Ê
Für beliebige messbare Funktionen f ist nach 4.3 (c) und 4.5 die μ–Integrier-
barkeit äquivalent zur μ–Integrierbarkeit von |f |. Die Formel für das μ–Integral
ergibt sich durch Zerlegung von f gemäß 4.2. 2

(b) Wahrscheinlichkeitsmaße
 mit Dichte. Sei : Ê→Ê + integrierbar
und dλ = 1. Dann ist durch
Ê
 
μ(B) := dλ = χB dλ für B ∈ B
B Ê
ein Wahrscheinlichkeitsmaß μ auf Ê gegeben.
Eine messbare Funktion f : → Ê
ist genau dann μ–integrierbar, wenn f
Lebesgue–integrierbar ist. In diesem Fall gilt
 
f dμ = f dλ .
Ê Ê
Bemerkung. Offenbar hat μ die Eigenschaft, dass jede (Lebesgue–)Nullmenge
auch eine μ–Nullmenge ist. Umgekehrt gibt es zu jedem Wahrscheinlichkeitsmaß
μ auf  mit dieser Eigenschaft eine integrierbare Funktion ≥ 0 mit Integral
1, so dass

μ(B) = dλ
B

(Satz von Radon–Nykodym, vgl. Bauer [115], 17.8).

Beweis.
(i) Jede Borelmenge B ist Lebesgue–messbar. Nach dem Majorantenkriterium
ist χB also Lebesgue–integrierbar, und aus den Eigenschaften des Integrals
folgt 0 ≤ μ(B) ≤ μ() = 1. Ist A die Vereinigung der paarweise disjunkten
Borelmengen A1 , A2 , . . . , so gilt: Die
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê 533



uk := χAk , u := χA = uk
k=1

sind integrierbare Funktionen; die Reihe konvergiert punktweise, wobei für jedes
x∈ Ê höchstens ein Reihenglied von Null verschieden ist, und schließlich gilt
N 
 
uk dλ ≤ u dλ .
k=1 Ê Ê
Nach der Reihenversion 5.1 (a) des Satzes von der monotonen Konvergenz er-
halten wir
 ∞ 
 

μ(A) = u dλ = uk dλ = μ(Ak ) .
Ê k=1 Ê k=1

(ii) Für Mengen B ∈ B mit λ(B) = 0 gilt χB = 0 f.ü., also μ(B) = 0.


(iii) Die Formel
 
f dμ = f dλ
Ê Ê
gilt nach Definition von μ für charakteristische Funktionen f = χB mit B ∈ B.
Wegen der Linearität von μ–Integral und Lebesgue–Integral gilt sie daher auch
für Elementarfunktionen bezüglich B.
Die Behauptung über die Integrierbarkeit und die Formel für das Integral ergibt
sich für positive messbare Funktionen f nach 4.1, da eine Folge (ϕn ) genau dann
μ–integraldefinierend für f ist, wenn ( ϕn ) (Lebesgue–)integraldefinierend für
f ist ÜA . Die Übertragung auf beliebige messbare Funktionen f geschieht
wie im Beweis (a). 2

6.2 Riemann–Stieltjes–Summen und μ–Integral


Der folgende Satz gestattet es, μ–Integrale approximativ zu berechnen. Dar-
überhinaus spielt er eine Schlüsselrolle für die wahrscheinlichkeitstheoretische
Interpretation des Hilbertraumformalismus der Quantenmechanik.

Riemann–Stieltjes–Summen. Sei f : → Ê
stetig und μ eine beliebige
Verteilung mit Verteilungsfunktion F . Ein System Z = { x0 , . . . , xN } heißt
Einteilung von [a, b], wenn

x0 < a ≤ x1 < . . . < xN = b .

Für solche Einteilungen Z definieren wir

δ(Z) := max { xk − xk−1 | k = 1, . . . , N }


534 § 20 Integration bezüglich eines Maßes μ

und die zugehörige Riemann–Stieltjes–Summe durch



N
R(f, Z) := f (xk ) (F (xk ) − F (xk−1 )) .
k=1

Satz. Für jede Folge von Einteilungen Zn von [a, b] mit δ(Zn ) → 0 gilt
b
f dμ = lim R(f, Zn ) .
n→∞
a

Beweis.
(i) R(f, Z) ist das μ–Integral der Elementarfunktion ϕ in disjunkter Darstellung

N
ϕ(f, Z) = f (xk ) χIk mit Ik = ]xk−1 , xk ] .
k=1

(ii) Seien Zn Einteilungen mit δ(Zn ) → 0, := sup{ δ(Zn ) | n ∈ } und ϕn := 


ϕ(f, Zn ). Wir setzen f0 (x) := f (x) für x ∈ [a, b], f0 (x) := 0 sonst und zeigen
die punktweise Konvergenz ϕn → f0 auf [a − , b] :
Wegen der gleichmäßigen Stetigkeit von f auf [a, b] folgt ϕn → f gleichmäßig
auf [a, b]. Für a − ≤ x < a gilt ϕn (x) = 0 = f0 (x) , sobald δ(Zn ) < a − x.
(iii) Es gilt | ϕn (x) | ≤ C := max{|f (x)| | a ≤ x ≤ b}. Somit besitzen die ϕn
die gemeinsame μ–Majorante C χ[a−,b] , und der Satz von der majorisierten
Konvergenz ergibt für n → ∞
 b b b
R(f, Zn ) = ϕn dμ = ϕn dμ → f0 dμ = f dμ 2
Ê a− a− a

Bemerkungen. (a) Die Aussage des Satzes verliert ihre Allgemeingültigkeit,


wenn wir nur Zerlegungen

Z : a = x0 < x1 < . . . < xN = b

zugrundelegen. ÜA : Welche Verteilungen werden hierdurch ausgeschlossen?

(b) Durch den Satz erklärt sich die häufig anzutreffende Bezeichnungsweise
b b
f (x) dF (x) für f dμ .
a a

Für Wahrscheinlichkeitsmaße mit Dichte ist die Verteilungsfunktion F nach


dem Hauptsatz § 8 : 3.2 absolutstetig mit F  = f.ü.. Hier ist also
b b
f (x) dF (x) = f (x) F  (x) dx .
a a
6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê 535

6.3 Erwartungswert und Streuung reeller Verteilungen


Für eine Verteilung μ definieren wir Erwartungswert E(μ) und Varianz V (μ)
durch

+∞ +∞ 
/ :=
E(μ) = μ x dμ(x) , V (μ) := /)2 dμ(x) ,
(x − μ
−∞ −∞

falls diese Integrale existieren. Hinreichend für die Existenz beider Integrale ist
die μ–Integrierbarkeit von x2 ÜA . Nach 6.1 (a),(b) entspricht dies für diskrete
Verteilungen und Verteilungen mit Dichten den Definitionen in § 19.
Die Streuung (Standardabweichung) σ(μ) definieren wir durch
σ(μ) := V (μ) .

6.4 Der Erwartungswert einer transformierten Zufallsgröße


(a) Wir interpretieren ein Wahrscheinlichkeitsmaß μ auf Ê
als Verteilung der
möglichen Werte einer Zufallsgröße X. Für eine messbare Funktion f : → Ê Ê
ist die transformierte Zufallsgröße f (X) dadurch definiert, dass jedem zufälligen
Beobachtungswert x für X der Wert f (x) zugeordnet wird. Die Verteilung μf
der Beobachtungswerte für f (X) ist gegeben durch

μf (B) = μ(f −1 (B)) = μ({f ∈ B}) .

Dass ν := μf ein Wahrscheinlichkeitsmaß ist, lässt sich leicht nachprüfen ÜA .

Satz. Der Erwartungswert E(f (X)) existiert genau dann, wenn f μ–integrier-
bar ist. In diesem Fall gilt

E(f (X)) = f dμ .
Ê

/)2 ), falls
Insbesondere ist V (X) = E((X − μ x2 dμ(x) konvergiert.
Ê
Der Beweis ergibt sich aus dem folgenden
(b) Transformationssatz für Bildmaße. Sei (Ω, A, μ) ein σ–endlicher Maß-
raum und B eine σ–Algebra auf Ω . Ferner sei f : Ω → Ω eine A–B–messbare
Funktion, d.h. f −1 (B) ∈ A für alle B ∈ B. Dann ist durch

μf (B) := μ(f −1 (B)) für B ∈ B

ein σ–endliches Maß μf auf B gegeben, das Bildmaß von μ unter f .


Für eine B–messbare Funktion u : Ω → gilt
 
u dμf = u ◦ f dμ , falls eines dieser Integrale existiert.
Ω Ω
536 § 20 Integration bezüglich eines Maßes μ

Bemerkungen. (i) Ist μ ein Wahrscheinlichkeitsmaß, so auch μf .


(ii) Die Behauptung des Satzes (a) folgt mit u(x) = x, Ω = Ω = Ê, A = B.
Ê
(iii) Ist f ein Diffeomorphismus zwischen zwei Gebieten Ω, Ω ⊂ n und ist
μ(B) = | det f  | χB dV n , so ist V n das Bildmaß von μ unter f . Auf diesem
Ω
Sachverhalt beruht der Transformationssatz für das Lebesgue–Integral § 8 : 1.9.

Beweis des Transformationssatzes.


(1) Wir überlassen den Nachweis, dass μf ein σ–endliches Maß ist, den Lesern
als ÜA .
(2) Sei B ∈ B, A = f −1 (B) und ϕ = χB . Dann gilt μf (B) = μ(A) und
ϕ ◦ f = χA . Im Fall μ(A) < ∞ ist
 
(∗) ϕ dμf = μf (B) = μ(A) = ϕ ◦ f dμ ,
Ω Ω

andernfalls existiert keines der beiden Integrale.



N
(3) Für eine Elementarfunktion ϕ = bk χBk mit paarweise disjunkten Bk ∈
k=1

N
B ist ϕ ◦ f = bk χAk mit Ak = f −1 (Bk ) eine Elementarfunktion bezüglich
k=1
(Ω, A). Sie ist nach (2) genau dann μ–integrierbar, wenn ϕ μf –integrierbar ist.
In diesem Fall gilt (∗) wegen der Linearität der Integrale.
Ê
(4) Für eine B–messbare Funktion u : Ω → + sei (ϕn ) eine μf –integralde-
finierende Folge. Dann bilden die (ϕn ◦ f ) nach (3) eine μ–integraldefinierende

Folge für u ◦ f . Ferner ist die Beschränktheit der Folge ϕn dμf äquivalent
 Ω
zur Beschränktheit der Folge ϕn ◦ f dμ . Somit folgt die Behauptung für u
Ω
nach der Integraldefinition 4.1.
(5) Für beliebige B–messbare Funktionen u ergibt sich die Behauptung wie im
Beweis 6.1 (a). 2

6.5* Der Begriff Zufallsvariable


Wir wollen kurz erläutern, warum wir hier von Zufallsgrößen und nicht, wie in
der klassischen Wahrscheinlichkeitstheorie üblich, von Zufallsvariablen sprechen.
Eine Funktion X : Ω → Êauf einem Wahrscheinlichkeitsraum (Ω, A, p) heißt
Zufallsvariable, wenn sie A–B–messbar ist: X −1 (B) ∈ A für jede Borelmenge
B. Die Verteilung μ von X ist definiert als das Bildmaß von p unter X:

μ(B) := p(X −1 (B)) = p({X ∈ B}) .


6 Das μ–Integral für Wahrscheinlichkeitsmaße auf Ê 537

Ausgangspunkt für die klassische Wahrscheinlichkeitstheorie ist, dass alle in ei-


nem Problemzusammenhang auftretenden Zufallsgrößen eine gemeiname Quelle
des Zufalls haben, d.h. dass sie sich durch Zufallsvariable auf einem und dem-
selben Wahrscheinlichkeitsraum (Ω, A, p) beschreiben lassen.
Für zwei Zufallsvariable X, Y hat dies folgende Konsequenzen:
(i) Existenz einer gemeinsamen Verteilung. Die Wahrscheinlichkeit

ν(A × B) := p(X −1 (A) ∩ Y −1 (B)) = P ({X ∈ A und Y ∈ B})

lässt sich zu einem Wahrscheinlichkeitsmaß ν auf B( Ê ) fortsetzen, zu deuten


2

als Verteilung der Wertepaare (x, y) für X, Y .

(ii) Die Linearität des Erwartungswerts. Mit X, Y : Ω → Ê ist auch αX + βY


eine Zufallsvariable, und es gilt

E(αX + βY ) = αE(X) + βE(Y ) ,

falls E(X) und E(Y ) existieren. Dies ergibt sich aus der Darstellung des Erwar-
tungswerts als p–Integral: Existiert E(X), so gilt
 
E(X) = x dμ(x) = X dp
Ê Ω

nach dem Transformationssatz für das Bildmaß μ von p unter X.


Die Annahme einer gemeinsamen Verteilung zweier Zufallsgrößen X, Y bedeu-
tet, dass es von der Sache her und hinsichtlich der empirischen Überprüfbarkeit
Sinn macht, von der Wahrscheinlichkeit

P (X ∈ A und Y ∈ B)

zu sprechen.
Eine solche Annahme ist in der Quantenmechanik nur in Ausnahmefällen ge-
rechtfertigt (kompatible Observable, siehe § 25 : 4.6). Gemeinsame Messung“

zweier Observabler X, Y wie Ort und Impuls setzt voraus, dass die Messwerte
x für X und y für Y paarweise anfallen. Geschieht dies in kurzen zeitlichen
Abständen, so hängen die Messergebnisse in der Regel von der Reihenfolge ab:
Eine Messung für X kann den Zustand des Systems und damit die Bedingungen
für die nachfolgende Messung von Y empfindlich beeinflussen. Die Ergebnisse
x, y können ganz anders verteilt sein als die Ergebnisse y, x einer Messung erst
Y , dann X. Auch bei gleichzeitiger (simultaner) Messung“, sofern überhaupt

realisierbar, bleibt das Problem der Nichtkommutativität bestehen.
Für den Aufbau der klassischen Wahrscheinlichkeitstheorie und ihre Anwendun-
gen in der Statistik ist der Begriff der Zufallsvariablen dagegen zentral. Hierzu
verweisen wir u.a. auf Bauer [115], Krengel [121] und Renyi [123].
538 § 20 Integration bezüglich eines Maßes μ

7 Lp –Räume und ihre Eigenschaften


7.1 Die Räume Lp (Ω, μ) für 1 ≤ p < ∞
(a) Sei Ω eine nichtleere Menge und μ ein Maß auf Ω mit Definitionsbereich
A ( A = B für reelle Verteilungen, A = Ln für das Lebesgue–Maß λn , vgl.
§ 19 : 8.1 (b)). Für 1 ≤ p < ∞ definieren wir
  
Lp (Ω, μ) := f :Ω→  f messbar und |f |p μ–integrierbar .

Beachten Sie: Aus der μ–Integrierbarkeit von |f |p folgt nicht die Messbarkeit
(genauer: A–Messbarkeit) von f , vgl. 3.6 (d).

Satz. Lp (Ω, μ) ist ein Vektorraum. Für f, g ∈ Lp (Ω, μ) gilt


 1/p  1/p  1/p
|f + g|p dμ ≤ |f |p dμ + |g|p dμ .
Ω Ω Ω

Für f ∈ Lp (Ω, μ) und g ∈ Lq (Ω, μ) mit 1


p
+ 1
q
= 1 gilt f g ∈ L1 (Ω, μ) und
  1/p  1/q
|f g| dμ ≤ |f |p dμ · |g|q dμ .
Ω Ω Ω

Der Beweis ergibt sich wörtlich wie in § 8, Abschnitt 2 mit Hilfe der Unglei-
chungen von Hölder und Minkowski sowie dem Majorantenkriterium.
 1/p
(b) Durch f p := |f |p dμ ist eine Halbnorm auf Lp (Ω, μ) gegeben:
Ω
αf p = |α| · f p und f + gp ≤ f p + gp . Aus f p = 0 folgt dagegen nur
f = 0 μ–f.ü., vgl. 5.1 (b). Um eine Norm zu erhalten, erzwingen wir die positive
Definitheit, indem wir alle μ–f.ü. gleichen Lp –Funktionen identifizieren. Den
so vergröberten Raum Lp (Ω, μ) bezeichnen wir mit Lp (Ω, μ). Lesen Sie hierzu
die unter § 8 : 2.1 gemachten Bemerkungen! Als Resümee ergibt sich: Lp (Ω, μ)
besteht genau genommen aus Klassen

u = [f ] := { g | g = f μ–f.ü.}

μ–fast überall gleicher Lp –Funktionen. Für alle geometrischen und topologi-


schen Betrachtungen in Lp (Ω, μ) als normiertem Raum ist es gleichgültig, mit
welchem Vertreter einer Klasse gerechnet wird; insoweit dürfen wir von Lp –
Funktionen statt von Klassen sprechen.
Die Bemerkungen § 8 : 2.1 ergänzen wir wie folgt: Vom Funktionswert u(ω) einer
Lp –Funktion u zu sprechen macht auch dann Sinn, wenn μ({ω}) > 0.
Für ein Wahrscheinlichkeitsmaß μ mit endlichem Träger {x0 , . . . , xn−1 }, d.h.

n−1
pk = μ({xk }) > 0 für k = 0, . . . , n − 1, pk = 1 ist Lp ( , μ) isomorph zu


k=0
n
, versehen mit einer passenden Norm ÜA .
7 Lp –Räume und ihre Eigenschaften 539

7.2 Die Vollständigkeit der Lp –Räume


Satz. Zu jeder Cauchy–Folge (un ) in Lp (Ω, μ) gibt es ein u ∈ Lp (Ω, μ) mit

u − un p → 0 für n → ∞ .

Darüberhinaus gibt es eine Teilfolge (unk )k mit u = lim unk μ–f.ü..


k→∞

Beweis.
(a) Da (un ) eine Cauchy–Folge ist, gibt es eine Teilfolge (unk )k mit
 
unk+1 − unk  < 2−k (k = 1, 2, . . .) .
p

(b) Weil Lp (Ω, μ) ein Vektorraum ist, der mit u auch |u| enthält, sind mit

n
vk := unk+1 − unk auch sn := |vk |
k=1

Lp –Funktionen. Aus der Dreiecksungleichung folgt



n 
n
sn p ≤ vk p < 2−k < 1 .
k=1 k=1

Nach dem Satz von der monotonen Konvergenz gibt es daher eine μ–integrier-
bare Funktion h ≥ 0 und eine μ–Nullmenge N mit

(1) h(ω) = lim spn (ω) für alle ω ∈ Ω \ N .


n→∞

Durch Nullsetzen der beteiligten Funktionen auf N können wir erreichen, dass
(1) für alle ω ∈ Ω gilt.
Für s := h1/p gilt dann s ∈ Lp (Ω, μ) und


(2) s(ω) = lim sn (ω) = |vk (ω)| für alle ω ∈ Ω.
n→∞ k=1

(c) Als Folgerung ergibt sich für k ≥ ν


   k 
 unk+1 − unν  =   vn  ≤  |vn | = s ,

(3)
n=ν n=1

und nach dem Majorantenkriterium für Reihen folgt aus (2) die Existenz des
punktweisen Limes

∞  
k
(4) u := un1 + vn = lim un1 + vn = lim unk+1 .
n=1 k→∞ n=1 k→∞

Aus (4) und (3) folgt |u| ≤ |un1 | + |s|, also u ∈ Lp (Ω, μ).
540 § 20 Integration bezüglich eines Maßes μ

(d) Nach (3) gilt


 
| u − unν |p = lim  unk+1 − unν  ≤ s ,
p
k→∞

und aus (4) folgt

lim | u − unν |p = 0 .
ν→∞

Der Satz von der majorisierten Konvergenz ergibt daher



| u − unν |p dμ → 0 für ν → ∞ .
Ω

Konvergiert eine Teilfolge einer Cauchy–Folge (un ) gegen u, so auch die Folge
(un ) selbst (Bd. 1, § 21 : 5.1). 2

7.3 Der Banachraum L∞ (Ω, μ)


(a) Eine messbare Funktion f : Ω → heißt μ–wesentlich beschränkt, in
Zeichen f ∈ L∞ (Ω, μ), wenn es eine Konstante C gibt mit

| f (ω) | ≤ C μ–f.ü.

Wörtlich wie in § 8 : 2.4 erhalten wir: Für f ∈ L∞ (Ω, μ) existiert


  
f ∞ := min C∈ +
 | f (ω) | ≤ C μ–f.ü. .

(b) Den Raum L∞ (Ω, μ) erhalten wir aus L∞ (Ω, μ), indem wir wie in 7.1 alle
μ–f.ü. gleichen Funktionen identifizieren.

Satz. (L∞ (Ω, μ),  · ∞ ) ist ein Banachraum.

Beweis.
(i) Die positive Definitheit der Norm haben wir durch die Klassenbildung (b)
erzwungen. Offenbar gilt αf ∞ = |α| · f ∞ für f ∈ L∞ (Ω, μ), α ∈ . 

Zu f, g ∈ L (Ω, μ) gibt es μ–Nullmengen N1 , N2 mit

| f (ω) | ≤ f ∞ für ω ∈ Ω \ N1 , | g(ω) | ≤ g∞ für ω ∈ Ω \ N2 .

Für die μ–Nullmenge N = N1 ∪ N2 folgt

| f (ω) + g(ω) | ≤ | f (ω) | + | g(ω) | ≤ f ∞ +, g∞

für ω ∈ Ω \ N , d.h. μ–fast überall. Nach (a) folgt f + g ∈ L∞ (Ω, μ) und


f + g∞ ≤ f ∞ + g∞ . Mit der Dreiecksungleichung nach unten folgt aus
f = g μ–f.ü., dass f ∞ = g∞ .
7 Lp –Räume und ihre Eigenschaften 541

(ii) Gegeben sei eine Cauchy–Folge in L∞ (Ω, μ), repräsentiert durch L∞ –


Funktionen un . Dann gibt es zu jedem k ∈ 
ein nk ∈ 
und μ–Nullmengen
N (k, m, n) mit
1
(∗) | um (ω) − un (ω) | < für m > n > nk
k
und ω ∈ N (k, m, n). Die Vereinigung N aller N (k, m, n) ist ebenfalls eine μ–
Nullmenge, und (∗) gilt für alle ω ∈ Ω \ N . Dies bedeutet, dass (un (ω)) eine
Cauchy–Folge in ist für alle ω ∈ Ω \ N . Durch

lim un (ω) für ω ∈ N ,
n→∞
u(ω) :=
0 für ω ∈ N

ist eine messbare Funktion gegeben mit


1
| u(ω) − un (ω) | = lim | um (ω) − un (ω) | ≤ für n > nk
m→∞ k
und ω ∈ Ω \ N . Es folgt u − un ∈ L∞ (Ω, μ), also auch
1
u = u − un + un ∈ L∞ (Ω, μ) und u − un ∞ ≤ für n > nk . 2
k

7.4 Beziehungen zwischen L1 , L2 und L∞


(a) Es gilt L1 (Ω, μ) ∩ L∞ (Ω, μ) ⊂ L2 (Ω, μ).
(b) Für endliche Maße, z.B. Wahrscheinlichkeitsmaße oder das Lebesgue–Maß
auf Mengen Ω endlichen Volumens, gilt

L∞ (Ω, μ) ⊂ L2 (Ω, μ) ⊂ L1 (Ω, μ) .

(c) Für offene Mengen Ω ⊂ n mit V n (Ω) = ∞ ist keiner der Räume L1 (Ω),
L2 (Ω), L∞ (Ω) in einem der anderen enthalten.

Beweis.
(a) Für u ∈ L1 (Ω, μ) ∩ L∞ (Ω, μ) ist u∞ · u eine μ–Majorante für |u|2 .
(b) Sei μ(Ω) < ∞. Dann gilt χΩ ∈ L1 (Ω, μ) ∩ L2 (Ω, μ). Für u ∈ L∞ (Ω, μ) ist
u2∞ · χΩ eine μ–Majorante für |u|2 . Für u ∈ L2 (Ω, μ) ist u = u · χΩ ∈ L1 (Ω, μ)
nach 7.1 (a).
(c) soll hier nicht bewiesen werden. Hierzu als
ÜA Zeigen Sie mit Hilfe geeigneter stetiger Funktionen, dass (c) für Ω = >0
richtig ist und dass die Inklusionen (b) für das Lebesgue–Maß auf ]0, 1[ echt
sind. 2
542 § 20 Integration bezüglich eines Maßes μ

8 Dichte Teilräume und Separabilität


8.1 Übersicht
Vorkenntnisse für den letzten Teil dieses Paragraphen: Testfunktionen § 10 : 1,
§ 10 : 2, § 10 : 3.
Für die Theorie von Differentialoperatoren ist es wesentlich, dass der Raum
C∞
c (Ω) der Testfunktionen auf Ω für 1 ≤ p < ∞ ein dichter Teilraum von
Lp (Ω) ist. Vor allem für die Hilbertraumtheorie benötigen wir die Separabilität
Ê
von Lp (Ω) und von Lp ( , μ) für Wahrscheinlichkeitsmaße μ. Grundlegend für
beides ist, dass die Treppenfunktionen in diesen Räumen dicht liegen.
Bekanntlich heißt eine Teilmenge M eines normierten Raumes (V,  · ) dicht
in V , wenn M = V . Die Relation B ⊂ A bedeutet, dass jedes u ∈ B Limes
einer geeigneten Folge aus A ist. Die folgenden Sätze stützen sich auf das
Lemma. (a) Aus B ⊂ A und B = V für Teilmengen A, B von V folgt A = V.
Mehrmalige Anwendung von (a) ergibt folgende Schlusskette:
Aus A1 = V , Ak ⊂ Ak+1 für k = 1, . . . , N folgt Ak = V für k = 1, . . . , N .
(b) Ist U ein Teilraum von V mit M ⊂ U , so ist auch Span M ⊂ U .
Beweis. (a) Aus B ⊂ A folgt V = B ⊂ A ⊂ V und damit überall das
Gleichheitszeichen.

N
(b) Seien m1 , . . . , mN ∈ M und w = αk mk . Wegen mk ∈ U gibt es zu
k=1
gegebenem ε > 0 Vektoren uk ∈ U mit |αk | · uk − mk  < ε/2k (1 ≤ k ≤ N ).
 
N 
Es folgt  w − αk uk  < ε . 2
k=1

8.2 Approximation von Lp -Funktionen durch Elementarfunktionen


Ê
(a) Sei Ω ⊂ N offen und μ entweder ein Wahrscheinlichkeitsmaß auf Ω oder
das Lebesgue–Maß auf Ω . Die
 folgenden Ergebnisse gelten auch für Maße μ
mit stetiger Dichte: μ(B) = f dV n für Lebesgue–messbare Mengen B ⊂ Ω .
B
In jedem Fall gilt μ(K) < ∞ für kompakte Mengen K ⊂ Ω.
(b) Lemma. Unter der Voraussetzung (a) gilt für u ∈ Lp (Ω, μ):
Zu jedem ε > 0 gibt es eine kompakte Menge K ⊂ Ω mit
  
|u|p dμ − |u|p dμ = |u − u χK |p dμ < ε ;
Ω K Ω

ferner gibt es eine Elementarfunktion ϕ mit supp ϕ ⊂ K und


u − ϕp < 2ε .

Für K kann eine endliche Vereinigung kompakter Quader gewählt werden.


8 Dichte Teilräume und Separabilität 543

Beweis.
7

(a) Sei u ∈ Lp (Ω, μ). Für eine Quaderzerlegung Ω = Ik (Bd. 1, § 23 : 4.1)
k=1
setzen wir
7
n
Kn := Ik und Bn := {x ∈ Kn | |u(x)| ≤ n} .
k=1

Für die messbaren Funktionen un := u χBn gilt dann


|un | ≤ |u| , |u − un |p ≤ |u|p ,
also un , u − un ∈ Lp (Ω, μ). Ferner gilt
lim un (x) = u(x) für alle x ∈ Ω ,
n→∞

denn zu x ∈ Ω gibt es ein m mit x ∈ Bm ; dann ist un (x) = u(x) für n ≥ m.


Nach dem Satz von der majorisierten Konvergenz folgt lim u − un p = 0.
n→∞
Wegen der Stetigkeit der p–Norm erhalten wir insbesondere für n → ∞
   
|u|p dμ − |u|p dμ = |u|p dμ − |un |p dμ → 0 .
Ω Kn Ω Ω

(b) Wir wählen ein un mit u − un p < ε. Nach 3.5 (a) gibt es eine Folge
von auf Kn lebenden Elementarfunktionen ϕk mit |ϕk | ≤ n und ϕk → un
gleichmäßig auf Kn . Daraus folgt
un − ϕk p < ε und u − ϕk p < 2ε für genügend großes k. 2

8.3 Approximation von Lp –Funktionen durch Treppenfunktionen


Unter der Voraussetzung 8.2 (a) liegen die Treppenfunktionen dicht in Lp (Ω, μ),
falls Ω offen oder ein kompakter Quader ist.

Beweis.
Wegen 8.2 (b) und 8.1 (a) genügt es, für kompakte Quader I ⊂ Ω folgendes zu
zeigen:
Ist B ⊂ I eine μ–messbare Menge, so ist χB Lp –Limes einer Folge von Trep-
penfunktionen. Wir müssen dies sogar nur für Borelmengen B zeigen, denn zu
jeder Lebesgue–messbaren Menge A ⊂ I gibt es eine Borelmenge B ⊂ I mit
χA = χB f.ü., siehe § 19 : 8.2 (b).
Sei also I ⊂ Ω ein kompakter Quader. Wir nennen eine Menge A ⊂ Ê N
gut,
wenn es Treppenfunktionen ϕn auf I gibt mit

(∗) 0 ≤ ϕn ≤ 1 und χA∩I − ϕn p → 0 für n → ∞ .

Jede solche Folge (ϕn ) nennen wir geeignet für A.


544 § 20 Integration bezüglich eines Maßes μ

Offenbar sind alle Quader gut. Bilden daher die guten Mengen eine σ–Algebra,
so sind nach § 19 : 5.4 alle Borelmengen B gut, d.h. χB∩I ist Lp –Limes von
Treppenfunktionen auf I.
Ist A gut und (ϕn ) geeignet für A, so bilden die ψn = χI − ϕn eine geeignete
Ê
Folge für C := N \ A, denn χC∩I − ψn = ϕn − χA∩I ÜA und 0 ≤ ψn ≤ 1.
Sind (ϕn ), (ψn ) geeignete Folgen für die guten Mengen A, B, so ist (ϕn · ψn )
eine geeignete Folge für A ∩ B ( ÜA , beachten Sie χA∩B∩I = χA · χB · χI ).
7

Seien A1 , A2 , . . . paarweise disjunkte gute Mengen und A := Ak . Wir setzen
k=1
n
f := χA∩I , fk := χAk ∩I und sn := fk .
k=1
Es gilt
 
|f − sn |p dμ = (f − sn ) dμ
I I

n
= μ(A ∩ I) − μ(Ak ∩ I) → 0 für n → ∞ .

Æ mit f − s
k=1
Zu gegebenem ε > 0 gibt es daher ein m ∈ n p < ε für n > m.
Da die Ak gut sind, gibt es Treppenfunktionen ψk auf I mit
0 ≤ ψk ≤ 1 , fk − ψk  < 2−k (k = 1, . . . , n) .
Dann ist
 
n 
ϕn = min χI , ψk
k=1

eine Treppenfunktion auf I mit 0 ≤ ϕn ≤ 1 und sn − ϕn p < ε. Es folgt


f − ϕn  < 2ε für n > m. Somit bilden die ϕn eine geeignete Folge für A. 2

8.4 Die Separabilität von Lp –Räumen


Ein normierter Raum (V,  · ) heißt separabel, wenn es eine abzählbare Menge
A ⊂ V gibt mit A = V .
Satz. Für die in 8.2 (a) genannten Maße μ und 1 ≤ p < ∞ ist der Raum
Ê
Lp (Ω, μ) separabel, falls Ω ⊂ N offen oder ein kompakter Quader ist.

Beweis.

n
Es sei A die abzählbare Menge aller Treppenfunktionen ψ = rk χRk mit
Æ
k=1
n ∈ , rationalen rk und rationalen Koordinaten der Eckpunkte jedes der
Quader Rk und von Ω, falls Ω ein kompakter Quader ist).

N
Eine beliebige Treppenfunktion ϕ = ck χIk ändern wir wie folgt zu einer
k=1
rationalen Treppenfunktion ab: Wir vergrößern jeden Quader Ik zu einem ähn-
8 Dichte Teilräume und Separabilität 545

lichen Quader Rk ⊂ Ω mit rationalen Eckdaten und mit μ(Rk ) − μ(Ik ) < ε,
was wegen der Stetigkeitseigenschaft § 19 : 6.3 (b) von μ möglich ist.
Ferner ersetzen wir jedes ck durch ein rk ∈ mit |ck − rk | < ε. Auf diese Weise

N
erhalten wir eine Treppenfunktion ψ = rk χRk ∈ A mit ϕ − ψp < C ε
k=1
mit einer nur von ϕ abhängigen Konstanten C ÜA .
p
Nach 8.3 folgt A = L (Ω, μ). 2

8.5 Weitere dichte Teilräume von Lp –Räumen


(a) C∞
c (Ω) liegt für 1 ≤ p < ∞ dicht in L (Ω) .
p

(b) Ist μ ein Wahrscheinlichkeitsmaß auf Ê und 1 ≤ p < ∞, so liegt C (Ê) ∞

Ê
c
dicht in Lp ( , μ) .
(c) Gibt es zusätzlich eine kompakte Menge K ⊂ Ê mit μ(K) = 1, so liegen
Ê
die Polynome dicht in Lp ( , μ) = Lp (K, μ) .

Beweis.
(a) wurde in § 10 : 3.3 gezeigt.
(b) Wir zeigen zunächst, dass die stetigen Funktionen mit kompaktem Träger
Ê Ê
dicht in Lp ( , μ) liegen. Da die Treppenfunktionen in Lp ( , μ) dicht liegen,
genügt es, charakteristische Funktionen beschränkter Intervalle im Lp –Sinn
durch stetige Funktionen mit kompaktem Träger zu approximieren. Dabei ist
in Betracht zu ziehen, dass Intervallränder positives Maß haben können. Daher
sind Fallunterscheidungen nötig.
(i) Sei f = χ[a,b] . Für die links skizzierten Funktionen fn gilt |f − fn | ≤ 1, also
    
|f − fn |p dμ ≤ μ({f = fn }) = μ a− 1
,a + μ b, b + 1
→ 0
Ê
n n

für n → ∞ nach § 19 : 6.3 (b).

fn gn
1 1

a− 1 a b b+ 1 a a+ 1 b− 1 b
n n n n

(ii) Sei g = χ]a,b[ . Für die rechts skizzierten Funktionen gn gilt entsprechend
    
|g − gn |p dμ ≤ μ({g = gn }) = μ a, a + 1
+ μ b− 1
,b → 0
Ê
n n
546 § 20 Integration bezüglich eines Maßes μ

für n → ∞, ebenfalls nach § 19 : 6.3 (b). Die Fälle ]a, b], und [a, b[ überlassen wir
den Lesern als ÜA .
Nach § 10 : 3.2 gibt es zu jeder stetigen Funktion f mit kompaktem Träger
K ⊂ Ê Testfunktionen ϕn , die gleichmäßig gegen f konvergieren. Da μ ein
Wahrscheinlichkeitsmaß ist, folgt f − ϕn p → 0 nach dem kleinen Satz von
Lebesgue 5.3 (b).
Ê
(c) Für f ∈ C0 ( ) gibt es nach dem Approximationssatz von Weierstraß Po-
lynome pn , die auf K gleichmäßig gegen f konvergieren. Nach dem kleinen Satz
Ê
von Lebesgue 5.3 (b) folgt wegen μ( \ K) = 0
 
|f − pn |p dμ = |f − pn |p dμ → 0 für n → ∞ . 2
Ê K
547

§ 21 Spektrum und Funktionalkalkül beschränkter


symmetrischer Operatoren
Vorkenntnisse : Hilberträume (§ 9), Maß, Wahrscheinlichkeit, μ–Integral (§ 19,
§ 20).

1 Beschränkte Operatoren und Operatornorm


1.1 Vorbemerkungen
Unser Ziel ist die Entwicklung einer Spektraltheorie für selbstadjungierte Ope-
ratoren im Hilbertraum. Dabei soll insbesondere auf deren Bedeutung für die
Quantenmechanik eingegangen werden; wir verweisen hierzu auf die in § 18 auf-
geworfenen Fragen. Wir gehen in zwei Schritten vor: In § 21 und § 22 analy-
sieren wir beschränkte symmetrische Operatoren; anschließend gehen wir zu
unbeschränkten selbstadjungierten Operatoren über. Die leitende Idee dabei
ist, dass sich eine unbeschränkte Observable aus beschränkten aufbauen lässt
(Zerlegung nach beschränkten Messbereichen).
Das Symbol H steht im folgenden für einen separablen Hilbertraum über ;
dabei heißt H separabel, wenn es eine abzählbare Menge M ⊂ H gibt mit
M = H , vgl. § 8 : 2.6. Nach § 9 : 4.8 ist H dann isomorph zum Hilbertschen
Folgenraum 2 = 2 ( ) oder zu einem n .
Auch für die im Folgenden auftretenden Vektorräume, insbesondere für Räume
von Operatoren, legen wir immer den Körper zugrunde.

1.2 Beschränktheit und Stetigkeit


Ein linearer Operator T : V1 → V2 zwischen normierten Räumen (V1 ,  · 1 )
und (V2 ,  · 2 ) heißt beschränkt, wenn das Bild der Einheitskugel unter T
beschränkt ist, d.h. wenn es eine Konstante C ≥ 0 gibt mit

T u2 ≤ C für alle u ∈ V1 mit u1 ≤ 1 .

Äquivalent hierzu ist die Bedingung ÜA

T u2 ≤ C u1 für alle u ∈ V1 .

Jede Zahl C mit dieser Eigenschaft heißt eine Normschranke für T .


Hat V1 endliche Dimension, so ist jeder lineare Operator T : V1 → V2 be-
schränkt, Näheres hierzu in 2.8. Ist V1 unendlichdimensional, so gilt dies nicht.
Als Beispiel betrachten wir den Ableitungsoperator

T : C1 [0, 1] → C0 [0, 1] , u → u ,

wobei beide Räume mit der Supremumsnorm  · ∞ versehen sind. Für un (x) =
xn gilt dann un ∞ = 1 und T un ∞ = n.
548 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Satz. Für lineare Operatoren T : V1 → V2 sind folgende Aussagen äquivalent:


(a) T ist beschränkt,
(b) T ist in jedem Punkt u ∈ V1 stetig,
(c) T ist im Nullpunkt stetig.
Beweis.
Ist T im Nullpunkt stetig, so gibt es zu ε = 1 ein δ > 0 mit
v1 < δ =⇒ T v2 < 1 .
Für u1 ≤ 1 und v = δ
2
u folgt T u2 = 2
δ
T v2 < 2
δ
. Also hat T die
Normschranke C = 2/δ.
Gilt T u2 ≤ C u1 für alle u ∈ V1 , so ist T in jedem Punkt u ∈ V1 stetig:
Aus u = lim un folgt
n→∞

T u − T un 2 = T (u − un )2 ≤ C u − un 1 → 0 für n → ∞ . 2

1.3 Die Operatornorm


(a) Satz. Auf dem Vektorraum L (V1 , V2 ) der beschränkten linearen Operato-
ren T : V1 → V2 ist durch
T  := sup { T u2 | u1 ≤ 1 } = sup { T u2 | u1 = 1 }
eine Norm gegeben. Diese ist die kleinste Normschranke, d.h. es gilt
T u2 ≤ T  · u1 für alle u ∈ V1 und
T u2 ≤ C u1 für alle u ∈ V1 =⇒ T  ≤ C .

Beweis.
Die beiden letzten Behauptungen folgen leicht aus der Definition von T  ÜA .
Offenbar gilt T  = 0 ⇐⇒ T = 0 und αT  = |α| · T  ÜA .
Für S, T ∈ L (V1 , V2 ) gilt
(S + T )u2 = Su + T u2 ≤ Su2 + T u2 ≤ (S + T ) u1 ,
also ist S + T  Normschranke für S + T . Es folgt S + T  ≤ S + T . 2

(b) Für beschränkte lineare Operatoren T : V1 → V2 , S : V2 → V3 gilt


ST  ≤ S · T  .
Denn für u ∈ V1 gilt nach Definition von ST
ST u3 = S(T u)3 ≤ S · T u2 ≤ S · T  · u1 .
Da ST  die kleinste Normschranke für ST ist, folgt ST  ≤ S · T .
1 Beschränkte Operatoren und Operatornorm 549

Beispiele für beschränkte Operatoren und Operatornormen bzw. Normschran-


ken folgen in Abschnitt 2.

1.4 Die Vollständigkeit von L (V1 , V2 )


Satz. L (V1 , V2 ) mit der Operatornorm ist vollständig, also ein Banachraum,
falls (V2 ,  · 2 ) ein Banachraum ist.

Beweis.
Sei (Tn ) eine Cauchy–Folge in L (V1 , V2 ), d.h. zu jedem ε > 0 gebe es ein nε
mit
Tm − Tn  < ε für m > n > nε .
Für u ∈ V1 folgt
(∗) Tm u − Tn u2 = (Tm − Tn )u2 ≤ Tm − Tn  · u1 ≤ ε u1
für m > n > nε , also ist (Tn u) eine Cauchy–Folge in V2 . Somit existiert
T u := lim Tn u
n→∞

für jedes u ∈ V1 . Nach den Rechenregeln für konvergente Folgen ist T linear.
Aus (∗) folgt für m → ∞
(T − Tn )u2 = lim Tm u − Tn u2 ≤ ε u1 ,
m→∞

also
T − Tn  ≤ ε für n > nε .
Mit T − Tn ist auch T = T − Tn + Tn beschränkt. 2

1.5 Die Banach–Algebra L (H )


Wir bezeichnen den Raum der beschränkten linearen Operatoren T : H → H
auf einem Hilbertraum H mit L (H ). Nach 1.4 ist L (H ) ein Banachraum
bezüglich der Operatornorm. L (H ) ist eine Banachalgebra, darunter verste-
hen wir einen Banachraum über , in dem neben den Vektorraumoperationen
noch eine multiplikativ geschriebene Verknüpfung definiert ist, mit den Eigen-
schaften
R(ST ) = (RS)T, R(S + T ) = RS + RT,
(αS)(βT ) = αβST für α, β ∈ und ST  ≤ S · T  .

Im Fall dim H = 1, d.h. H = Span {u} mit u = 0 ist L (H ) = ÜA .


In mehrdimensionalen Hilberträumen gibt es immer nicht kommutierende Ope-
ratoren S, T , d.h. solche mit ST = T S.
550 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Nachweis als ÜA : Betrachten Sie Operatoren, welche einen zweidimensionalen


Teilraum in sich überführen und den Orthogonalraum fest lassen.
Für dim H ≥ 2 ist L (H ) also eine nichtkommutative Banachalgebra mit
Eins, d.h. einem neutralen Element ½ der Multiplikation.
Kommutative Banachalgebren mit Eins sind L∞ (Ω, μ) und C(K) für eine kom-
pakte Menge K, jeweils mit der Supremumsnorm und der üblichen Multipli-
kation von Funktionen. Eine kommutative Banachalgebra ohne Eins ist der
Schwartzraum S unter der Supremumsnorm.

2 Beispiele
n
2.1 Die Spektralnorm auf L ( )
Sei A eine komplexe n × n–Matrix und T : x → Ax die zugehörige lineare
Abbildung. Dann gilt

T  = λmax , wo λmax der größte Eigenwert von A∗A ist.

Denn die Matrix A∗A ist symmetrisch und positiv, also gilt nach dem Rayleigh–
Prinzip Bd. 1, § 20 : 4.1
     
T 2 = max Ax2  x = 1 = max x, A∗Ax  x = 1 = λmax .

2.2 Lineare Funktionale


Nach dem Darstellungssatz von Riesz–Fréchet § 9 : 2.8 besitzt jedes lineare Funk-
tional auf einem Hilbertraum H , d.h. jede stetige lineare Funktion L : H →
die Form

Lu = v , u für u ∈ H

mit eindeutig bestimmtem v ∈ H , und es gilt


  
L = max |Lu|  u = 1 = v .

2.3 Rechts– und Linksshift auf 2


Auf dem Hilbertschen Folgenraum 2 (vgl. § 9 : 1.4) betrachten wir den
Rechtsshift R : x = (x1 , x2 , x3 , . . .) −→ (0, x1 , x2 , . . .)
und den
Linksshift L : x = (x1 , x2 , x3 , . . .) −→ (x2 , x3 , . . .) .
Wegen Rx = x gilt R = 1. Mit Lx ≤ x folgt L ≤ 1. Andererseits
gilt L = sup{Lx | x = 1} ≥ Le2  = e1  = 1, also insgesamt L = 1.
2 Beispiele 551

2.4 Unendliche Matrizen


(a) Jedem beschränkten Operator T auf 2 ordnen wir wie folgt eine Doppel-
folge (unendliche Matrix) (amn )n,m∈ zu. Für x = (x1 , x2 , . . .) sei Ln x =
en , T x die n–te Komponente von T x. Dann ist Ln ein lineares Funktional
auf 2 , denn die Cauchy–Schwarzsche Ungleichung ergibt
| Ln x | ≤ T x ≤ T  · x .
Nach 2.1 gibt es einen eindeutig bestimmten Vektor y (n) = (an1 , an2 , . . .) ∈ 2
mit
  

Ln x = y (n) , x = anm xm ,
m=1

und es gilt y (n)  = Ln  ≤ T .


(b) Wollen wir umgekehrt für eine Doppelfolge (amn ) durch
 
∞ 

(∗) T x := a1m xm , a2m xm , . . .
m=1 m=1

einen beschränkten Operator T auf 2 definieren, so muss es nach (a) für y (n) =


(an1 , an2 , . . .) eine Konstante C geben mit y (n) 2 = |anm |2 ≤ C. Diese
m=1
(1)
Bedingung reicht aber nicht aus, wie das Beispiel y = y (2) = . . . zeigt.


Verlangen wir zusätzlich die Konvergenz der Reihe y (n) 2 =: s2 , so liefert
n=1
(∗) einen beschränkten Operator T mir T  ≤ s.
( ÜA , verwenden Sie die Cauchy–Schwarzsche Ungleichung.)

2.5 Integraloperatoren
Sei Ω ein Gebiet des Ê n
und G : Ω × Ω → eine messbare Funktion, für
welche die Integrale
 
F (x) := |G(x, y)|2 dn y und S 2 := F (x) dn x
Ω Ω

konvergieren. Dann ist durch



(T u)(x) := G(x, y) u(y) dn y
Ω

ein beschränkter Operator T auf L2 (Ω) gegeben mit T  ≤ S. Denn da die


Funktion Gx : y → G(x, y) zu L2 (Ω) gehört, existiert (T u)(x) = Gx , u , und
nach der Cauchy–Schwarzschen Ungleichung gilt
 
| (T u)(x) |2 ≤ | G(x, y) |2 dn y · | u(y) |2 dn y = F (x) u2 ,
Ω Ω

also gilt T u ∈ L2 (Ω) und T u ≤ S u.


552 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Bemerkung. Es genügt, die Konvergenz des Integrals für F (x) fast überall
vorauszusetzen. Wie üblich wird im Fall der Divergenz des Integrals F (x) := 0
gesetzt. Nach dem Satz von Tonelli § 8 : 1.8 folgt G ∈ L2 (Ω × Ω).

2.6 Multiplikatoren auf 2


Eine ganz besondere Rolle für die Operatorentheorie auf 2 spielen die Multi-
plikatoren

Ma : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) ,

wobei a = (a1 , a2 , . . . ) eine komplexe Zahlenfolge ist. Diese entsprechen unend-


lichen Diagonalmatrizen anm = δnm an , vgl. 2.4.

Satz. Die Vorschrift Ma liefert genau dann eine lineare Abbildung


Ma : 2 → 2 ,
d.h. Ma x ∈ 2 für alle x ∈ 2 , wenn die Folge a = (a1 , a2 , . . . ) beschränkt ist.
In diesem Fall ist der Operator Ma beschränkt, und es gilt
  
Ma  = sup | an |  n ∈  .

Beweis.
(a) Sei (an ) unbeschränkt. Zur Konstruktion eines x ∈ 2 mit Ma x ∈ 2 wählen
wir eine Teilfolge (ank )k mit |ank | > k für k = 1, 2, . . . und setzen



1
x := enk .
k
k=1

Dann gilt x ∈ 2 , x2 = π 2 /6, aber Ma x ∈ 2 , da unendlich viele Komponen-


ten von Ma x betragsmäßig größer als 1 sind.

(b) Sei (an ) beschränkt und s := sup{|an | | n ∈ }. Für x = (x , x , . . . ) ∈ 


1 2
2

gilt dann |an xn | ≤ s · |xn |, also Ma x ∈ 2 und

Ma x2 ≤ s2 x2 .

Somit ist s eine Normschranke für Ma . Dass s die kleinste Normschranke für
Ma und damit die Operatornorm Ma  ist, ergibt sich wie folgt: Für t < s gibt
es ein n ∈  mit t < |an | ≤ s. Es folgt

Ma  = sup { Ma x | x = 1} ≥ Ma en  = |an | > t ,

also ist t keine Normschranke. 2


2 Beispiele 553

2.7 Multiplikatoren auf L2 (Ω, μ)


Wir betrachten H = L2 (Ω, μ) für einen σ–endlichen Maßraum (Ω, A, μ). Sei
v:Ω→ eine A–messbare Funktion. Dann gilt in Analogie zu 2.6 der
Satz. Die Vorschrift

Mv : u → v · u

liefert genau dann einen linearen Operator auf L2 (Ω, μ) (d.h. genau dann gilt
v · u ∈ L2 (Ω, μ) für alle u ∈ L2 (Ω, μ)), wenn v ∈ L∞ (Ω, μ).
In diesem Fall ist der Multiplikator Mv beschränkt, und es gilt

Mv  = v∞ .

Bemerkungen. (i) Für μ–f.ü. gleiche L∞ –Funktionen v, w gilt Mv = Mw .


Nach § 20 : 7.3 erhalten wir den Raum L∞ (Ω, μ), indem wir alle μ–f.ü. glei-
chen Funktionen im Sinne von § 20 : 7.1 identifizieren. Daher liefert die Zuord-
nung v → Mv einen isometrischen Isomorphismus zwischen L∞ (Ω, μ) und
den beschränkten Multiplikatoren auf L2 (Ω, μ). Im Folgenden repräsentieren
wir ein Element von L∞ (Ω, μ) immer durch eine L∞ –Funktion v : Ω → mit
|v(w)| ≤ v∞ = Mv  für alle w ∈ Ω.
(ii) Beschränkte Multiplikatoren stellen das Analogon zu unendlichen Diago-
nalmatrizen dar, vgl. 2.6. Ihre Bedeutung liegt darin, dass sich jeder beschränkte
symmetrische Operator T auf einem separablen Hilbertraum H in folgendem
Sinn diagonalisieren lässt: Es gibt ein Wahrscheinlichkeitsmaß μ auf , eine Ê
Ê
reellwertige Funktion v ∈ L∞ ( , μ) und eine unitäre Abbildung U : H →
Ê
L2 ( , μ) mit

T = U −1 Mv U (§ 22 : 3.6).

In der Quantenmechanik werden beschränkte Potentiale v durch beschränkte


Multiplikatoren Mv beschrieben, vgl. § 18 : 4.3.

Beweis.
(a) Sei v ∈ L∞ (Ω, μ). Dann sind die Bn := {ω ∈ Ω | n ≤ |v(ω)| < n + 1}
messbare, paarweise disjunkte Mengen mit μ(Bn ) > 0 für unendlich viele n,
denn andernfalls gäbe es ein N ∈ Æ
mit |v(ω)| ≤ N μ–f.ü.
Wir wählen eine Folge (nk )k mit μ(Bnk ) > 0 (k ∈ Æ). Da μ σ–endlich ist, gibt
es Mengen Ak ∈ A mit Ak ⊂ Bk und

(∗) 0 < ck := μ(Ak ) < ∞ , k ≤ nk ≤ |v(ω)| für ω ∈ Ak .

Die Ak sind ebenfalls paarweise disjunkt. Die Elementarfunktionen


1 χ
uk := Ak
k ck
554 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren


n
sind paarweise orthogonal mit uk  = 1
k
. Ferner existiert für sn := uk
k=1


u(ω) := lim sn (ω) = uk (ω) für jedes ω ∈ Ω ,
n→∞ k=1

denn in der Reihe ist höchstens ein Glied von Null verschieden.

∞ 

Andererseits konvergiert nach § 9 : 4.2 (b) mit 1
k2
die Orthogonalreihe uk
k=1 k=1
im Quadratmittel, und nach § 20 : 7.2 konvergiert eine Teilfolge von (sn ) punkt-


weise μ–f.ü. Somit gilt u = uk im L2 –Sinne. Wegen 0 ≤ sn (ω) ≤ u(ω) und
k=1
|v(ω)| ≥ k für ω ∈ Ak gilt für alle ω ∈ Ω

n
1 χ
| v(ω) | · | u(ω) | ≥ | v(ω) | · | sn (ω) | ≥ Ak (ω)
ck
k=1

und daher
 
n
| v · sn |2 dμ ≥ c−2
k μ(Ak ) = n .
Ω k=1

Also kann v · u nicht zu L2 (Ω, μ) gehören.

(b) Sei v ∈ L∞ (Ω, μ) und C := v∞ . Für u ∈ L2 (Ω, μ) gilt dann

| v · u |2 ≤ C 2 |u|2 μ–f.ü.

Nach dem Majorantenkriterium § 20 : 4.5 folgt v · u ∈ L2 (Ω, μ) sowie v · u ≤


C u. Damit ist C eine Normschranke für Mv : u → v · u.
Sei ε > 0 gegeben. Dann hat B = {|v| > C − ε} positives Maß. Wegen der σ–
Endlichkeit von μ gibt es eine Menge A ∈ A mit A ⊂ B und 0 < μ(A) < ∞.
Für u := μ(A)−1/2 χA gilt dann

u ∈ L2 (Ω, μ) , u = 1 und | u · v | ≥ (C − ε) | u | ,

also v · u ≥ C − ε. Es folgt Mv  ≥ C − ε für jedes ε > 0. 2

2.8 Operatoren auf endlichdimensionalen normierten Räumen


Satz. Ist (V,  ·  ) ein normierter Raum über und B = (v1 , . . . , vn ) eine
Basis für V mit v1  = . . . = vn  = 1, so ist die Koordinatenabbildung

T :V → n
, u = x1 v1 + . . . + un vn → x = (x1 , . . . , xn )

bijektiv und stetig mit stetiger Umkehrabbildung T −1 .


2 Beispiele 555

Folgerungen. (a) Jeder endlichdimensionale normierte Raum V ist vollstän-


dig, und jede beschränkte, abgeschlossene Teilmenge von V ist kompakt.
(b) Jeder lineare Operator S : V → V ist beschränkt.

Beweis.
Auf n wählen wir die Norm x1 := |x1 | + . . . + |xn |.
Für u = x1 v1 + . . . + xn vn gilt dann nach der Dreiecksungleichung

u ≤ |x1 | + . . . + |xn | = T u1 .

Dies zeigt die Beschränktheit von T −1 und T −1  ≤ 1.


Daher ist die Menge K := {u ∈ V | T u1 = 1} als Bild der kompakten Menge
S := {x ∈ n | x1 = 1} unter T −1 kompakt. Da die Norm stetig ist, existiert
:= min{u | u ∈ K}. Aus = 0 würde 0 ∈ K, also 0 = T 0 ∈ S folgen.
Somit gilt > 0, d.h.

T u1 = 1 =⇒ u ≥ > 0.


−1
Daraus folgt leicht, dass T beschränkt ist mit Normschranke ÜA .

Folgerung (a): Wegen u ≤ T u1 ≤ −1 u führen die Operatoren T und
T −1 konvergente Folgen in konvergente Folgen über und beschränkte Mengen
in beschränkte Mengen.
Folgerung (b): Für einen linearen Operator S : V → V ist der Operator
A = T ST −1 : n → n nach 2.1 stetig, also ist auch S = T −1AT stetig. 2

2.9 Der Fortsetzungssatz


Sei U ein dichter Teilraum des Banachraums V , und der Operator A : U → V
sei linear und beschränkt: Au ≤ C ·u für u ∈ U . Dann lässt sich A zu einem
eindeutig bestimmten beschränkten linearen Operator A : V → V fortsetzen. Für
diesen gilt
  
 A  = sup Au  u ∈ U, u ≤ 1 .

Beweis in § 10 : 5.1.

2.10 Die Fouriertransformation und der Paritätsoperator auf L2 ( Ê)


n

Wir rekapitulieren die Ergebnisse von § 12, Abschnitt 3. Der Schwartzraum


Ê
S ( n ) der schnellfallenden Funktionen auf n
Ê Ê
ist dicht in L2 ( n). Für ei-
Ê
ne Funktion u ∈ S ( n) ist die Fouriertransformierte u Ê
/ ∈ S ( n) definiert
durch

/(y) := (2π)−n/2
u e−i x , y  u(x) dn y .
Ên
556 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

/ und durch
Durch die Fouriertransformation F : u → u
(Su)(x) := u(−x)
sind unitäre Operatoren
F : S( Ê)n
→ S( Ê n
), S : S( Ê n
) → S( Ê)
n

gegeben mit S −1 = S und F −1 = SF 2 .


Nach 2.9 lassen sich F, S zu beschränkten Operatoren auf L2 ( n) fortsetzen, Ê
die wir wieder mit F, S bezeichnen. In § 12 : 4.2 wurde dargelegt, dass auch die
Fortsetzungen unitär sind und den Identitäten F −1 = SF 2 , S −1 = S genügen.
Ê Ê
/ gilt nur für u ∈ L1 ( n ) ∩ L2 ( n ), aber i.A. nicht
Die Integraldarstellung für u
2
Ê
für u ∈ L ( ); Näheres hierzu in § 12 : 4.2. S wird in der Quantenmechanik
n

der der Paritätsoperator auf n genannt. Ê


3 Die C*–Algebra L (H )
3.1 Invertierbare Operatoren
(a) Der Satz von der stetigen Inversen. Ist ein linearer Operator T : V1 → V2
zwischen Banachräumen V1 , V2 stetig und bijektiv, so ist auch T −1 stetig.
Den (schwierigen) Beweis finden Sie in Hirzebruch–Scharlau [127] § 9 und
in Reed–Simon [130] III.5.
Für einen Operator T ∈ L (H ) sind daher folgende Aussagen äquivalent:
(i) T : H → H ist bijektiv (Invertierbarkeit im Sinne der linearen Algebra),
(ii) es gibt einen Operator S ∈ L (H ) mit T S = ST = ½ (Invertierbarkeit in
der Banachalgebra L (H )).
Wir sprechen im Folgenden schlicht von Invertierbarkeit in L (H ), kurz von
Invertierbarkeit.
(b) Sind T1 , T2 ∈ L (H ) invertierbar, so auch T1 T2 , und es gilt
(T1 T2 )−1 = T2−1 T1−1 .
In unendlichdimensionalen Hilberträumen folgt (anders als in endlichdimensio-
nalen) aus der Invertierbarkeit von T1 T2 weder die Invertierbarkeit von T1 oder
T2 noch die Invertierbarkeit von T2 T1 .
Beispiel. Für den Rechtsshift R und den Linksshift L in 2 (vgl. 2.3) gilt
LR = ½, RL : (x1 , x2 , x3 , . . . ) −→ (0, x2 , x3 , . . . ) .
Hier ist LR invertierbar, RL ist aber weder surjektiv noch injektiv. R ist
injektiv, aber nicht surjektiv; L ist surjektiv, aber nicht injektiv.
(c) Ist für einen Operator T ∈ L (H ) eine Potenz T m invertierbar ( m =
2, 3, . . . ), so ist T selbst invertierbar ÜA .
3 Die C*–Algebra L (H ) 557

Nach (b) existiert dann (T n )−1 = (T −1 )n für alle n ∈ .


Für die Potenzen T 0 := , T −n := (T n )−1 besteht die Gruppeneigenschaft
T m+n = T m T n = T n T m für alle m, n ∈  .

3.2 Der adjungierte Operator


Satz. Zu jedem Operator T ∈ L (H ) gibt es einen eindeutig bestimmten Ope-
rator T ∗ ∈ L (H ) mit
v , T u = T ∗v , u für u, v ∈ H .
T ∗ heißt der zu T adjungierte Operator oder die Adjungierte von T .

Beweis.
Für jeden festen Vektor v ∈ H ist durch Lv u := v , T u ein lineares Funk-
tional Lv : H →  gegeben: |Lv u| ≤ v · T u ≤ (v · T ) · u.
Nach 2.2 gibt es einen eindeutig besimmten, mit T ∗ v bezeichneten Vektor mit
v , T u = Lv u = T ∗ v , u für alle u ∈ H .
T ∗ : H → H ist linear wegen
T ∗ (α1 v1 + α2 v2 ) , u = α1 v2 + α2 v2 , T u
= α1 v1 , T u + α2 v2 , T u
= α1 T ∗ v1 , u + α2 T ∗ v2 , u
= α1 T ∗ v1 , u + α2 T ∗ v2 , u
= α1 T ∗ v1 + α2 T ∗ v2 , u
für alle u ∈ H . Die Behauptung folgt mit dem üblichen Schluss
w1 , u = w2 , u für alle u ∈ H =⇒ w1 = w2 .

T ist beschränkt, denn nach 2.2 gilt
  
T ∗ v = Lv  = max | v , T u |  u = 1
  
≤ sup v · T u  u = 1 = v · T  ,

also ist T  eine Normschranke für T ∗ . 2

3.3 Rechenregeln für die Adjungierte, L (H ) als C*–Algebra


(a) Für S, T ∈ L (H ) gilt
(1) T ∗∗ = T ,
(2) (αS + βT )∗ = αS ∗ + βT ∗ ,
558 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

(3) (ST )∗ = T ∗ S ∗ ,
(4) T ∗  = T ,
(5) T ∗ T  = T 2 .

(b) L (H ) ist also eine Banachalgebra mit Eins (vgl. 1.5), auf der eine bijektive
Abbildung T → T ∗ erklärt ist, die (1) involutorisch, (2) antilinear, (4) isome-
trisch ist, die Bedingung (3) (ST )∗ = T ∗ S ∗ erfüllt und die C*–Eigenschaft (5)
besitzt. Eine solche Struktur heißt C*–Algebra mit Eins.
Weitere Beispiele für C*–Algebren mit Eins sind L∞ (Ω, μ) und C(K) für eine
kompakte Menge K, jeweils mit der Supremumsnorm und mit f ∗ := f .
(c) Mit T ∈ L (H ) ist auch T ∗ invertierbar, und es gilt
(T ∗ )−1 = (T −1 )∗ .

(d) Bemerkung. Gilt für eine Abbildung S : H → H


v , T u = Sv , u für alle u, v ∈ H ,

so folgt S = T , siehe Beweis 3.2.

Beweis.
(a) Die Eigenschaften (1), (2), (3) ergeben sich nach dem Prinzip (d) durch
einfaches Nachrechnen ÜA .
(4) Aus dem Beweis 3.2 entnehmen wir T ∗  ≤ T . Mit Hilfe von (1) ergibt
sich daraus T  = (T ∗ )∗  ≤ T ∗ .
(5) Aus (4) und 1.2 (b) folgt T ∗ T  ≤ T ∗  · T  = T 2 . Die umgekehrte
Ungleichung T 2 ≤ T ∗ T  folgt aus
T u2 = T u , T u = u , T ∗ T u ≤ u · T ∗ T u ≤ T ∗ T  · u2 .

(c) Offenbar gilt ½∗ = ½. Nach Definition von (T −1 )∗ für invertierbae T gilt


v , ½u = v, T −1
Tu = (T −1 ∗
) v , Tu = T ∗ (T −1 )∗ v , u
für alle u, v ∈ H , also T ∗ (T −1 )∗ = ½∗ = ½. Entsprechend folgt (T −1 )∗ T ∗ = ½
∗ ∗ −1
ÜA . Also ist T invertierbar und (T ) = (T −1 )∗ . 2

3.4 Beispiele
(a) Symmetrische Operatoren. Die Bedingung T ∗ = T bedeutet
v, Tu = Tv, u für alle u, v ∈ H .
Operatoren T ∈ L (H ) mit dieser Eigenschaft heißen symmetrisch, in man-
chen Lehrbüchern auch hermitesch. Zu den symmetrischen Operatoren gehö-
ren nach § 9 : 2.6 (b) die orthogonalen Projektoren.
3 Die C*–Algebra L (H ) 559

(b) Für den Linksshift L und den Rechtsshift R auf 2 (vgl. 2.3) bestehen die
Beziehungen L∗ = R und R∗ = L. Denn für x = (x1 , x2 , . . .) und y = (y1 , y2 , . . .)
gilt

∞ 

y , Rx = yk xk−1 = y k+1 xk = Ly , x ,
k=2 k=1


∞ 

y , Lx = yk xk+1 = yk−1 xk = Ry , x .
k=1 k=2

(c) Sei a = (a1 , a2 , . . .) eine beschränkte Folge und a = (a1 , a2 , . . .). Für den
in 2.6 definierten Multiplikator Ma gilt dann Ma∗ = Ma ÜA .

(d) Sei v ∈ L∞ (Ω, μ). Dann gilt Mv ∗ = Mv , vgl. 2.7.

(e) Für den in 2.5 definierten Integraloperator T ist



(T ∗ v)(x) = G(y, x) v(y) dn y .
Ω

Denn nach dem Satz von Fubini–Tonelli (§ 8 : 1.8) gilt für v, u ∈ L2 (Ω)
  
v, Tu = v(y) G(y, x) u(x) dn x dn y
Ω Ω

  
= u(x) G(y, x) v(y) dn y dn x .
Ω Ω

(f) Der Operator des unbestimmten Integrals. Für u ∈ H := L2 [0, 1] setzen


wir
x
(T u)(x) := u(t) dt .
0

Aufgabe. (i) Zeigen Sie: T ∈ L (H ) und T  ≤ 1/ 2. (Verwenden Sie die
Cauchy–Schwarzsche Ungleichung.)
(ii) Bestimmen Sie T ∗ .

(g) Sei H ein Hilbertraum. Ein Operator U : H → H ist genau dann unitär,
d.h. bijektiv und isometrisch, wenn U ∗ = U −1 ÜA .

3.5 Kern und Bild von T und T ∗


Satz. Für beschränkte lineare Operatoren T auf einem Hilbertraum H gilt
(a) Kern T ∗ = (Bild T )⊥ ,
(b) (Kern T ∗ )⊥ = Bild T .
(c) Bild T muss nicht abgeschlossen sein.
560 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Beweis.
Wegen der Stetigkeit von T und T ∗ sind Kern T und Kern T ∗ abgeschlossen.
(a) Für v ∈ Kern T ∗ gilt 0 = T ∗ v , u = v , T u , also v ∈ (Bild T )⊥ . Für
v ∈ (Bild T )⊥ gilt umgekehrt 0 = v , T u = T ∗ v , u für alle u ∈ H . Für
u = T ∗ v ergibt sich insbesondere T ∗ v = 0, also v ∈ Kern T ∗ .
(b) Aus (a) ergibt sich mit § 9 : 2.5 (b): (Kern T ∗ )⊥ = (Bild T )⊥⊥ = Bild T .
(c) Als Beispiel wählen wir den Multiplikator Ma in 2 mit a = (1, 21 , 13 , . . . ).
Nach § 9 : 1.4 (b) liegt der Teilraum 20 = Span {e1 , e2 , . . . } aller abbrechenden

N
Folgen (x1 , . . . , xN , 0, 0, . . . ) dicht in 2 . Für y = yk ek ∈ 20 gilt y = Ma x

N k=1
mit x = k yk ek . Es folgt 20 ⊂ Bild Ma , also ist Bild Ma dicht in 2 . Es ist
k=1
aber a ∈ Bild Ma , somit gilt Bild Ma = 2 = Bild Ma . 2

3.6 Formen und Operatoren, positive Operatoren


(a) Sei U ein Teilraum des Hilbertraums H . Eine Funktion Q : U × U → 
heißt Sesquilinearform (kurz Form) auf U , wenn folgendes gilt:
u → Q(v, u) ist linear
v → Q(v, u) ist antilinear, d.h.
Q(α1 v1 + α2 v2 , u) = α1 Q(v1 , u) + α2 Q(v2 , u) .

Beispiele. (i) Q(v, u) := v , Au für jeden linearen Operator A : U → H .


A muss nicht beschränkt sein. Beispiel: H = L2 ( ), U = S , Au = −u .
(ii) Quadratische Formen auf U . Eine Funktion Q : U × U → heißt 
quadratische Form auf U , wenn u → Q(v, u) linear ist und wenn Q(u, v) =
Q(v, u) gilt. Dann ist Q eine Form mit Q(u, u) ∈ für u ∈ U .
Eine Form Q auf U heißt beschränkt mit Formschranke C, wenn

| Q(v, u) | ≤ C v · u auf U.

Für T ∈ L (H ) liefert Q(v, u) := v , T u eine beschränkte Form auf H mit


Formschranke T .

(b) Die Polarisierungsgleichung. Für eine Sesquilinearform Q auf U gilt


1

Q(v, u) = 4 Q(u + v, u + v) − Q(u − v, u − v)
i

+ 4 Q(u + iv, u + iv) − Q(u − iv, u − iv) .

Damit ist die Form Q schon durch die Werte Q(u, u) für u ∈ U eindeutig
bestimmt.
3 Die C*–Algebra L (H ) 561

Beweis durch Ausnützen der Sesquilinearität als ÜA .

Für lineare Operatoren A : U → H folgt


   
v , Au = 1
4
u + v , A(u + v) − u − v , A(u − v)
i
   
+ 4 u + iv , A(u + iv) − u − iv , A(u − iv) .

Im Fall U = H ist A durch die Werte u , Au auf U festgelegt. Das ergibt


sich aus dem Fundamentallemma § 9 : 3.2 ÜA .

Satz. Sei U ein Teilraum des Hilbertraums H und A : U → H ein linearer,


nicht notwendig beschränkter Operator. Genau dann erfüllt A die Symmetrie-
bedingung

v , Au = Av , u für u, v ∈ U ,

wenn u , Au auf U reellwertig ist.


Denn aus der Symmetriebedingung folgt u , Au = Au , u = u , Au für
u ∈ U . Ist umgekehrt u , Au reellwertig auf U , so folgt aus der Polarisierungs-
gleichung Re u , Av = Re v , Au und Im u , Av = −Im v , Au , also

Av , u = u , Av = v , Au für u, v ∈ V . 2

(c) Satz. Für jeden Operator T ∈ L (H ) ist durch Q(v, u) := v , T u eine


beschränkte Form auf H mit Formschranke T  gegeben. Umgekehrt gibt es
zu jeder beschränkten Form Q auf H genau einen Operator T ∈ L (H ) mit
Q(v, u) = v , T u für alle u, v ∈ H . Jede Formschranke für Q ist eine Norm-
schranke für T .
Beschränkten quadratischen Formen Q entsprechen auf diese Weise beschränkte
symmetrische Operatoren T . Diese sind durch die Werte u , T u für u ∈ H
eindeutig bestimmt.

Beweis.
Die erste Behauptung ist leicht einzusehen, vgl. (a).
Für eine beschränkte Form Q auf H mit Formschranke C liefert

Lv u := Q(v, u)

ein lineares Funktional auf H , denn es gilt | Lv u | ≤ (C · v) · u. Nach 2.2
gibt es daher einen mit Sv bezeichneten Vektor, so dass

Q(v, u) = Lv u = Sv , u ;

ferner gilt Sv = Lv  ≤ C · v.


562 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Aus der Antilinearität von Q folgt, dass S linear ist ÜA . Somit gilt S ∈ L (H )
und S ≤ C. Der Operator T := S ∗ leistet das Gewünschte.
Schließlich gilt Q(v, u) = Q(u, v) ⇐⇒ v , T u = u , T v = T v , u . 2

(d) Positive Operatoren. Ein Operator T ∈ L (H ) heißt positiv (T ≥ 0),


wenn

u , T u ≥ 0 für alle u ∈ H

und positiv definit (T > 0) wenn u , T u > 0 für alle u ∈ H mit u = 0.


Nach (b) sind positive Operatoren S, T ∈ L (H ) symmetrisch.
Für symmetrische S, T ∈ L (H ) schreiben wir S ≤ T , falls T − S ≥ 0. Zwei
Operatoren müssen in diesem Sinn nicht vergleichbar sein. Es gilt

R ≤ S , S ≤ T =⇒ R ≤ T ,

S ≤ T , T ≤ S =⇒ S = T .

Das Erste ist klar. Aus S ≤ T, T ≤ S folgt zunächst


 
u , (S − T )u = 0 für alle u ∈ H und dann S − T = 0 nach (c).

Für positive Operatoren gilt die Cauchy–Schwarzsche Ungleichung


 
 v , T u 2 ≤ v , T v u, T u .

Denn für Tn := T + n1 ½ gilt Tn > 0, also liefert v , Tn u ein Skalarprodukt auf


H und erfüllt die Cauchy–Schwarzsche Ungleichung
 
 v , Tn u  2 ≤ v , Tn v u , Tn u .

Die Behauptung folgt für n → ∞ ÜA . 2

4 Konvergenz von Operatoren


4.1 Konvergenzbegriffe auf L (H )
(a) Für beschränkte Operatoren T, T1 , T2 , . . . auf einem Hilbertraum H defi-
nieren wir die Normkonvergenz (gleichmäßige Konvergenz, Konvergenz
in der Operatornorm) Tn → T durch

lim Tn = T : ⇐⇒ T − Tn  → 0 für alle n → ∞ .


n→∞

s
Die starke (punktweise) Konvergenz Tn −→ T ist definiert durch

s–lim Tn = T : ⇐⇒ lim Tn u = T u für alle u ∈ H


n→∞ n→∞
4 Konvergenz von Operatoren 563

w
und die schwache Konvergenz Tn −→ T durch

w–lim Tn = T : ⇐⇒ lim v , Tn u = v , T u für alle u, v ∈ H .


n→∞ n→∞

In der Literatur finden Sie häufig die Bezeichnungen stop–lim für s–lim (von
strong operator limit) und wop–lim für w–lim (von weak operator limit).

(b) Genau dann gilt w–lim Tn = T , wenn


n→∞

lim u , Tn u = u , T u für alle u ∈ H .


n→∞

Das folgt unmittelbar aus der Polarisierungsgleichung 3.6 (a).


In der Quantenmechanik bedeutet schwache Konvergenz bedeutet Konvergenz
der Erwartungswerte, vgl. § 18 : 4.4.

4.2 Beziehungen zwischen den Konvergenzbegriffen


s
(a) Tn → T =⇒ Tn −→ T ,
s w
(b) Tn −→ T =⇒ Tn −→ T .
(c) Für endlichdimensionale Hilberträume fallen alle diese Konvergenzbegriffe
zusammen.
(d) Für unendlichdimensionale Hilberträume handelt es sich um drei verschie-
dene Arten von Konvergenz.

Beweis.
(a) T − Tn  → 0 =⇒ T u − Tn u = (T − Tn )u ≤ T − Tn  · u → 0.
s
(b) Tn −→ T =⇒ | v , T u − v , Tn u | = | v , T u − Tn u |
≤ v · T u − Tn u → 0 .
(c) Da jeder N –dimensionale Hilbertraum über nach § 9 : 1.2 isomorph zu
N
ist, müssen wir nur zeigen: Für lineare Abbildungen T, Tn : N → N
folgt aus schwacher Konvergenz die Normkonvergenz. Für die Matrizen
 (n)
MK (Tn ) = An = aik und MK (T ) = A = (aik )
w
folgt aus Tn −→ T
(n)
aik = ei , An ek → ei , Aek = aik für n → ∞ .

Daraus ergibt sich


 (n)
T − Tn 2 ≤ A − An 22 = |aik − aik |2 → 0 für n → ∞. 2
i,k
564 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

(d) Nach § 9 : 4.8 ist jeder separable, unendlichdimensionale Hilbertraum iso-


morph zu 2 ; es genügt also, Gegenbeipiele in 2 zu finden. Dass aus starker
Konvergenz nicht die Normkonvergenz folgt, zeigen die iterierten Linksshifts
Tn = Ln : x = (x1 , x2 , . . .) → (xn+1 , xn+2 , . . . ) , vgl. 2.3.

∞ 
n
s
Wegen Tn x2 = |xk |2 = x − | xk |2 → 0 für n → ∞ gilt Tn −→ 0.
k=n+1 k=1
Für m > n erhalten wir
Tm − Tn  ≥ (Tm − Tn ) em  = em−n  = 1 ,
also bilden die Tn keine Cauchy–Folge in der Operatornorm. Eine schwach, aber
nicht stark konvergente Folge von Operatoren bilden die iterierten Rechtsshifts
Tn = Rn , vgl. 2.3:
Für x = (x1 , x2 , . . . ) und y = (y1 , y2 , . . . ) gilt
   ∞   
 y , Tn x  =   yn+k xk  ≤ x

1/2
|yk |2 → 0
k=1 k=n+1

für n → ∞, also Tn −→ 0.
w

Schon die Folge (Tn e1 ) = (en+1 ) kann nicht konvergieren, denn



Tm e1 − Tn e1  = em+1 − en+1  = 2 für m > n . 2

4.3 Der Satz von der gleichmäßigen Beschränktheit


Eine Folge von Operatoren Tn : V1 → V2 zwischen normierten Räumen heißt
punktweise beschränkt, wenn die Folge (Tn u) für jedes u ∈ V1 beschränkt
ist. Die Folge heißt normbeschränkt, wenn die Folge (Tn ) beschränkt ist.
Satz. Jede punktweise beschränkte Folge stetiger Operatoren Tn : V1 → V2 auf
einem Banachraum V1 ist normbeschränkt.
Den nichttrivialen Beweis finden Sie in Hirzebruch–Scharlau [127] § 8 und
Reed–Simon [130, I] III.9.
Eine Folge von Operatoren Tn ∈ L (H ) heißt schwach beschränkt, wenn es zu
je zwei Vektoren u, v ∈ H eine Zahl c(u, v) gibt mit | v , Tn u | ≤ c(u, v) für
n = 1, 2, . . . .
Folgerung. Jede schwach beschränkte Folge von Operatoren Tn ∈ L (H ) ist
normbeschränkt.
Beweis.
Für festes v ∈ H sind durch Ln u = v , Tn u = Tn∗ v , u lineare Funktionale

Ln gegeben mit |Ln u| ≤ c(u, v) =: k(u) für n ∈ . Aus der punktweisen
Beschränktheit der Ln folgt Normbeschränktheit, d.h. Ln  = Tn∗ v ≤ c(v)
für n = 1, 2, . . . mit einer Zahl c(v). Somit sind die Tn∗ punktweise beschränkt,
also normbeschränkt: Tn  = Tn∗  ≤ C mit passendem C. 2
4 Konvergenz von Operatoren 565

4.4 Rechenregeln für konvergente Folgen und Reihen


(a) Aus der gleichmäßigen/starken/schwachen Konvergenz Sn → S, Tn → T
folgt jeweils die entsprechende Konvergenz der Linearkombinationen
αSn + βTn → αS + βT .
(b) Aus der gleichmäßigen/starken/schwachen Konvergenz Tn → T folgt je-
weils die entsprechende Konvergenz
STn → ST und Tn S → T S für S ∈ L (H ) .
(c) Für Normkonvergenz/starke Konvergenz gilt jeweils die Implikation
Sn → S , Tn → T =⇒ Sn Tn → ST .
(d) Für Normkonvergenz/schwache Konvergenz gilt jeweils
Tn → T =⇒ Tn∗ → T ∗ .
(e) Die gleichmäßige/starke/schwache Konvergenz von Reihen in L (H ) defi-
nieren wir in naheliegender Weise durch

∞ 
n
S = Ak ⇐⇒ Sn := Ak → S für n → ∞ .
k=0 k=0

Aus (a) und (b) ergibt sich



∞ 
∞ 

S = Ak , T ∈ L (H ) =⇒ T S = T Ak und ST = Ak T .
k=0 k=0 k=0

w w w
(f) Aus Sn −→ S und Tn −→ T folgt nicht Sn Tn −→ ST .
(g) Aus Tn −→ T folgt nicht Tn∗ −→ T ∗ .
s s

Beweis.
(a), (b) und (d) als ÜA .
s
(c) Wegen der punktweisen Konvergenz Sn −→ S gibt es nach 4.3 eine Kon-

stante C mit Sn  ≤ C für alle n ∈ . Die Behauptung über die Normkonver-
genz folgt aus
Sn Tn − ST  = (Sn − S)T + Sn (Tn − T )

≤ Sn − S · T  + C · Tn − T  .
Zum Beweis der Aussage über punktweise Konvergenz fixieren wir u ∈ H und
erhalten entsprechend
Sn Tn u − ST u ≤ Sn T u − ST u + Sn (Tn u − T u)

≤ Sn (T u) − S(T u) + C · Tn u − T u → 0 für n → ∞ .


566 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

(f) Betrachten Sie die iterierten Shifts Sn = Ln , Tn = Rn auf 2 , vgl. 4.2 (d).
(g) Für Tn = Ln gilt Tn∗ = Rn , vgl. 3.4 (b) und 3.3 (3). Aus dem Beispiel zu
4.2 (d) entnehmen wir, dass die Tn stark konvergieren, die Tn∗ aber nicht. 2

4.5 Der Satz von der monotonen Konvergenz


(a) Konvergenz schwacher Cauchy–Folgen. Eine Folge von Operatoren
Tn ∈ L (H ) konvergiert genau dann schwach gegen einen Operator T ∈ L (H ),
wenn die Folge der Skalarprodukte ( u , Tn u ) für jedes u ∈ H eine Cauchy–
Folge in ist.

Beweis.
Sei ( u , Tn u ) für jedes u ∈ H eine Cauchy–Folge. Aus der Polarisierungs-
gleichung 3.6 (b) folgt: Für u, v ∈ H ist ( v , Tn u ) eine Cauchy–Folge, also
existiert
Q(v, u) := lim v , Tn u .
n→∞

Nach der Folgerung 4.3 gibt es ein Konstante C mit Tn  ≤ C für alle n ∈ , 
also gilt |Q(v, u)| ≤ C ·v·u. Nach 3.6 (c) gibt es einen Operator T ∈ L (H )
mit
lim v , Tn u = Q(v, u) = v , T u für u, v ∈ H . 2
n→∞

(b) Satz von der monotonen Konvergenz. Jede absteigende Folge positiver
Operatoren Tn ∈ L (H ) konvergiert stark gegen einen positiven Operator T ∈
L (H ).

Beweis.
(i) Schwache Konvergenz. Es gelte T1 ≥ T2 ≥ · · · ≥ 0. Dann existiert nach
dem Monotoniekriterium für reelle Folgen lim u , Tn u für alle u ∈ H . Nach
n→∞
(a) gibt es daher einen Operator T ∈ L (H ) mit

T = w–lim Tn ,
n→∞

und es gilt Tn ≥ T ≥ 0 für n = 1, 2, . . . .


(ii) Starke Konvergenz. Wir setzen B := Tn − T und v := Bu = (Tn − T )u für
ein festes u ∈ H . Anwendung der Cauchy–Schwarzschen Ungleichung 3.6 (d)
auf B ≥ 0 ergibt

(Tn − T )u4 = | (Tn − T )u , (Tn − T )u |2 = | v , Bu |2


≤ v , Bv · u , Bu
4 Konvergenz von Operatoren 567

= v , (Tn − T )v · u , Bu
≤ v , (T1 − T )v · u , Bu
≤ T1 − T  · v2 · u , Bu
= T1 − T  · (Tn − T )u2 u , Bu ,
also
(Tn − T )u2 ≤ T1 − T  · u , (Tn − T )u → 0 für n → ∞ . 2

4.6 Konvergenz von Multiplikatoren auf L2 (Ω, μ)


(a) Normkonvergenz. Eine Folge von Multiplikatoren Mvn ist genau dann norm-
konvergent, wenn die vn eine Cauchy–Folge in L∞ (Ω, μ) bilden. Da der Raum
L∞ (Ω, μ) vollständig ist, gibt es dann ein v ∈ L∞ (Ω, μ) mit

Mv − Mvn  = v − vn ∞ → 0 für n → ∞ .

Das folgt unmittelbar aus Mv  = v∞ , vgl. 2.7.

(b) Monotone Konvergenz. Ist (vn ) eine monoton fallende Folge von positiven
Funktionen in L∞ (Ω, μ), so existiert der Grenzwert

v(ω) = lim vn (ω) für alle ω ∈ Ω,


n→∞

und es gilt v ∈ L∞ (Ω, μ) sowie

Mv = s–lim Mvn .
n→∞

Dass die Mvn stark gegen einen Operator T ≥ 0 konvergieren, ergibt sich wegen
Mv1 ≥ Mv2 ≥ · · · ≥ 0 aus 4.5 (b). Die Gleichung T = Mv ist eine Folge des
Satzes von der monotonen Konvergenz für μ–Integrale: Für u ∈ H bilden die
fn := |vn · u − v · u|2 = |vn − v|2 · |u|2 eine absteigende Folge μ–integrierbarer
Funktionen mit lim fn (ω) = 0 für alle ω ∈ Ω. Daraus folgt
n→∞

vn · u − v · u2 = fn dμ → 0 für n → ∞ .
Ω

4.7 Starke Konvergenz orthogonaler Projektoren


Konvergieren die orthogonalen Projektoren Pn stark gegen einen Operator P ,
so ist auch P ein orthogonaler Projektor.
Vertauschen die Pn mit einem Operator T ∈ L (H ), Pn T = T Pn , so vertauscht
auch P mit T .
Beweis als ÜA unter Beachtung von § 9 : 2.6.
568 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

5 Das Spektrum beschränkter Operatoren


5.1 Spektrum und Resolvente
(a) Das Spektrum ist für die Theorie beschränkter und unbeschränkter Opera-
toren ein zentraler Begriff. Dass ein in der Optik gebräuchliches Wort Namens-
geber für einen mathematischen Begriff wurde, ist kein Zufall, siehe 5.7. Wird
eine quantenmechanische Observable durch einen beschränkten symmetrischen
Operator (allgemeiner durch einen selbstadjungierten Operator) dargestellt, so
erweist sich das Spektrum im mathematischen Sinn als die Menge der möglichen
Messwerte dieser Observablen, vgl. § 18 : 3.3 und § 25 : 4.4.
Vereinbarung. Im Folgenden schreiben wir
T − λ , λ − T für T − λ½ , λ½ − T .
(b) Definition. Das Spektrum σ(T ) eines Operators T ∈ L (H ) ist definiert
als die Menge
  
σ(T ) := λ∈  T − λ ist nicht invertierbar .
Beachten Sie, dass nach 3.1 der Operator T − λ : H → H genau dann bijektiv
ist, wenn er eine stetige Inverse besitzt. In 6.3 zeigen wir σ(T ) = ∅.
Das Komplement des Spektrums,
  
(T ) := \ σ(T ) = λ∈  T − λ ist invertierbar ,
heißt Resolventenmenge von T . Für λ ∈ (T ) heißt
R(λ, T ) := (λ − T )−1 = − (T − λ)−1 ∈ L (H )
die Resolvente von T zum Wert λ.
(c) Einteilung des Spektrums. Das Spektrum von T zerfällt in drei disjunk-
te Mengen: Das Punktspektrum (Eigenwertspektrum)
  
σp (T ) := λ∈  T − λ ist nicht injektiv ,
das kontinuierliche Spektrum
  
σc (T ) := λ ∈ σ(T )  T − λ ist injektiv, Bild (T − λ) ist dicht in H
und das Restspektrum
  
σc (T ) := λ∈  T − λ ist injektiv, Bild (T − λ) = H
(d) Bemerkungen. (i) Ist H endlichdimensional, so besteht das Spektrum
eines Operators T ∈ L (H ) nur aus Eigenwerten, denn T − λ : H → H ist
genau dann bijektiv, wenn T − λ injektiv ist. Im unendlichdimensionalen Fall
gibt es dagegen Operatoren mit rein kontinuierlichem Spektrum; dies ergibt sich
in 5.3, Bemerkung (iii).
5 Das Spektrum beschränkter Operatoren 569

(ii) Die Bezeichnungen Punktspektrum und kontinuierliches Spektrum sind


nicht wörtlich zu nehmen. Es gibt Operatoren, deren Punktspektrum ein Gebiet
ist und Operatoren, deren kontinuierliches Spektrum aus isolierten Punkten be-
steht (Beispiele in 5.6 und 5.2). Die Wortwahl kontinuierlich“ erklärt sich aus

Eigenschaften der Spektralschar (§ 22 : 1.5, 1.6).
(iii) In der Literatur wird auch der Begriff Residualspektrum verwendet, teils
für das Restspektrum, teils in der Bedeutung { λ ∈ | Bild (T − λ) = H }.
(e) Aufgaben. Zeigen Sie:
(i) σ(½) = σp (½) = {1}, σ(0) = σp (0) = {0},
(ii) λ ∈ σ(T ) ⇐⇒ λ − λ0 ∈ σ(T − λ0 ),
(iii) λ ∈ σ(T ) =⇒ λ2 ∈ σ(T 2 ).

5.2 Das Spektrum von Multiplikatoren in 2


Sei a = (a1 , a2 , . . . ) eine beschränkte Folge komplexer Zahlen und
Ma : 2 → 2 , x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) .
Nach 2.6 gilt Ma ∈ L (2 ) und Ma  = a∞ = sup{|an | | n ∈ Æ}.

Satz. σp (Ma ) = {an | n ∈ Æ}, σr (Ma ) = ∅, σ(Ma ) = σp (Ma ) .

Beweis.
(i) Die Eigenwertgleichung Ma x = λx für x = (x1 , x2 , . . . ) ∈ 2 ist äquivalent
zu (an − λ)xn = 0 für n = 1, 2, . . . .
Ist λ = an für alle n ∈ Æ, so besitzen diese Gleichungen nur die triviale Lösung
x1 = x2 = . . . = 0. Jedes an ist Eigenwert mit zugehörigem Eigenvektor en .
Also gilt σp (Ma ) = {an | n ∈ Æ}.
(ii) Es sei nun λ ∈ σp (Ma ). Dann ist Ma − λ injektiv, und es gilt

λ ∈ (Ma ) ⇐⇒ Ma − λ : 2 → 2 ist surjektiv.

Zur Bestimmung von (Ma ) haben wir also die universelle Lösbarkeit der Glei-
chung (Ma − λ) x = y für gegebenes y = (y1 , y2 , . . . ) ∈ 2 zu untersuchen.
Diese besagt für die Koordinaten
yn
(an − λ) xn = yn , d.h. xn = für n = 1, 2, . . . .
an − λ
Es stellt sich die Frage, ob der hierdurch eindeutig bestimmte Koordinatenvektor
x = (x1 , x2 , . . . ) immer zu 2 gehört, d.h. ob der Multiplikator Mb mit b =
((a1 − λ)−1 , (a2 − λ)−1 , . . . ) jedem y ∈ 2 ein x = Mb y = (Ma − λ)−1 y ∈ 2
zuordnet. Nach 2.6 ist das genau dann der Fall, wenn die Folge b beschränkt ist,
d.h. wenn λ ∈ {an | n ∈ Æ} .
570 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

en
(iii) Für λ ∈ σp (Ma ) hat die Gleichung (Ma − λ)x = en die Lösung x = .
an − λ
Somit umfaßt Bild (Ma − λ) die in  dichte Menge Span {e1 , e2 , . . . }. Es folgt
2

σr (Ma ) = ∅. 2

5.3 Das Spektrum beschränkter Multiplikatoren in L2 (Ω, μ)


Für eine Funktion v ∈ L∞ (Ω, μ) ist durch Mv u := v ·u nach 2.7 ein beschränk-
ter Operator Mv auf H = L2 (Ω, μ) gegeben mit Mv  = v∞ . Wir setzen
wie in § 20 : 3.1
{v ≤ c} := {ω ∈ Ω | v(ω) ≤ c} ,
{|v − λ| < ε} := {ω | |v(ω) − λ| < ε} usw.

Satz. (a) λ ∈ σ(Mv ) ⇐⇒ μ({|v − λ| < ε}) > 0 für alle ε > 0,
(b) λ ∈ σp (Mv ) ⇐⇒ μ({v = λ}) > 0,
(c) σr (Mv ) = ∅,
(d) μ({v ∈ (Mv )}) = 0,
1
(e) Für λ ∈ (Mv ) ist R(λ, Mv ) der Multiplikator Mg mit g := .
λ−v
Bemerkungen. (i) Zwei μ–f.ü. gleiche L∞ –Funktionen sind im L∞ –Sinn gleich
und definieren denselben Multiplikator. In Hinblick auf (d) können wir den
Multiplikator Mv durch eine L∞ –Funktion v mit v(ω) ∈ σ(Mv ) für alle ω ∈ Ω
repräsentieren.
(ii) Die Aussage (a) drücken wir so aus: σ(Mv ) ist der essentielle Wertevorrat
von v.
(iii) Für den Operator Mx auf L2 [a, b], d.h. den Operator Mv mit v(x) = x, gilt
σ(Mx ) = σc (Mx ) = [a, b]. Denn aus (a) folgt σ(Mx ) = [a, b] ÜA . Aus (b) und
(c) folgt σp (Mx ) = ∅, σr (Mx ) = ∅.
Bei quantenmechanischen Modellrechnungen wird Mx als Ortsoperator eines in
das Intervall [a, b] eingesperrten Teilchens verwendet.
Beweis.
(b) Die Eigenwertgleichung Mv u = λu ist für u ∈ L2 (Ω, μ) äquivalent zur
Gleichung (v − λ)u = 0 μ–f.ü. Ist μ({v = λ}) = 0, so folgt aus Mv u = λu also
u = 0 μ–f.ü., somit kann λ kein Eigenwert von Mv sein.
Ist M := {v = λ} keine μ–Nullmenge, so gibt es wegen der σ–Endlichkeit von
μ eine Menge B ⊂ M mit 0 < μ(B) < ∞. Dann ist χB ein Eigenvektor zum
Eigenwert λ; außerdem gilt μ({|v − λ| < ε}) ≥ μ({v = λ}) > 0 für jedes ε > 0.
(a) und (e): Für λ ∈ σp (Mv ) setzen wir
 1
λ−v(ω)
für v(ω) = λ ,
g(ω) :=
0 auf der μ–Nullmenge {v = λ} .
5 Das Spektrum beschränkter Operatoren 571

Dann ist g μ–messbar, und für messbare Funktionen u, w gilt

(λ − Mv )u = w ⇐⇒ u = g · w .

Die Gleichung (λ − Mv )u = w ist also genau dann universell und eindeutig


lösbar, wenn g · w ∈ L2 (Ω, μ) für alle w ∈ L2 (Ω, μ). Nach 2.7 ist das äquivalent
zu g ∈ L∞ (Ω, μ). In diesem Fall ist R(λ, Mv ) = Mg . Wir haben also

λ ∈ σ(Mv ) \ σp (Mv ) ⇐⇒ g ∈ L∞ (Ω, μ) ⇐⇒


 1
  
Bε = |g| > ε = |v − λ| < ε hat positives Maß für alle ε > 0.
  
(d) Für Bn := λ ∈  μ({|v − λ| < 1 }) = 0 gilt nach (a)
n

7

Bn ⊂ (Mv ) und (Mv ) = Bn .
n=1

Wir zeigen μ({v ∈ Bn }) = 0. Sei λ0 ∈ Bn und |λ − λ0 | < 1/2n. Dann gilt


   
|v − λ| < 1/2n ⊂ |v − λ0 | < 1/n , also μ( {|v − λ| < 1/2n }) = 0 .

Zu jedem λ0 ∈ Bn ist also μ({v ∈ K1/2n (λ0 )}) = 0. Da Bn durch abzählbar


viele Kreise K1/2n (λ0 ) überdeckt wird, folgt μ({v ∈ Bn }) = 0 und somit auch

7

μ( v ∈ (Mv ) ) ≤ μ ( { v ∈ Bn } ) = 0 .
n=1

(c) ergibt sich als einfache Folgerung des folgenden Satzes 5.4. 2

5.4 Spektrum und Resolvente von T ∗


Das Spektrum von T ∈ L (H ) korrespondiert auf folgende Weise mit dem
Spektrum von T ∗ :
(a) λ ∈ σ(T ) ⇐⇒ λ ∈ σ(T ∗) ,
(b) λ ∈ σc (T ) ⇐⇒ λ ∈ σc (T ∗ ) ,
(c) λ ∈ σr (T ) =⇒ λ ∈ σp (T ∗ ) ,
(d) Für λ ∈ (T ) gilt λ ∈ (T ∗ ) und R(λ, T ∗ ) = R(λ, T )∗ .

Bemerkungen.
(i) Für λ ∈ σp (T ) kann jeder der Fälle λ ∈ σp (T ∗ ), λ ∈ σr (T ∗ ) eintreten, s.u.
(ii) Aus (c) folgt, dass Multiplikatoren auf L2 (Ω, μ) kein Restspektrum besitzen
( ÜA , beachten Sie Mv∗ = Mv ).
572 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Beweis.
Grundlage ist der Satz 3.5 zusammen mit den Rechenregeln 3.3 für Adjungierte.
(a) und (d). Nach 3.3 (2) gilt (λ − T )∗ = λ − T ∗ . Mit 3.3 (c) folgt
λ ∈ (T ) ⇐⇒ λ − T ist invertierbar
⇐⇒ (λ − T ∗ )−1 = ((λ − T )−1 )∗ existiert ⇐⇒ λ ∈ (T ∗ ) .
Für (b) und (c) stützen wir uns auf die nach 3.5 (b) geltende Beziehung
(∗) Kern (T ∗ − λ)⊥ = Bild (T − λ)
sowie auf den Zerlegungssatz § 9 : 2.4.
(c) Sei λ ∈ σr (T ), also Bild (T − λ) = H . Nach (∗) und dem Zerlegungssatz
folgt Kern (T ∗ − λ) = {0}, d.h. λ ∈ σp (T ∗ ).
(b) Sei λ ∈ σc (T ). Aus (a) folgt λ ∈ σ(T ∗ ). Wir schließen die Fälle λ ∈ σr (T ∗ )
und λ ∈ σp (T ∗ ) aus: Im Fall λ ∈ σp (T ∗ ) wäre nach (∗) und dem Zerlegungssatz
Bild (T − λ) = H im Widerspruch zu λ ∈ σc (T ). Im Fall λ ∈ σr (T ∗ ) würde
nach (c) folgen λ = λ ∈ σp (T ∗∗ ) = σp (T ).
Zu Bemerkung (i): In endlichdimensionalen Räumen folgt aus λ ∈ σp (T ) immer
λ ∈ σ(T ∗ ) = σp (T ∗ ). Im unendlichdimensionalen Fall gilt das nicht: Für den
Linksshift L im 2 gilt 0 ∈ σp (L) wegen Le1 = 0. Für L∗ = R ist 0 kein
Eigenwert, da R eine Isometrie ist. Wegen Bild R ⊥ e1 ist daher 0 ∈ σr (L∗ ). 2

5.5 Das approximative Eigenwertspektrum


Eine Zahl λ ∈ heißt approximativer Eigenwert des Operators T ∈ L (H ),
wenn es eine Folge (un ) gibt mit
un  = 1 , T un − λun → 0 für n → ∞ .
Die un heißen approximative Eigenvektoren von T zum Wert λ. Die Ge-
samtheit σapp (T ) der approximativen Eigenwerte wird approximatives Ei-
genwertspektrum oder approximatives Punktspektrum von T genannt.
Approximative Eigenwerte gehören zum Spektrum.
Denn würde R(λ, T ) existieren, so folgte aus vn := λun − T un → 0 für n → ∞
mit un  = 1 auch un = R(λ, T ) vn → 0 für n → ∞, im Widerspruch zu
un  = 1.
Satz. Das approximative Eigenwertspektrum umfaßt das Eigenwertspektrum,
das kontinuierliche Spektrum und den Rand des Spektrums.
Bemerkungen. Das approximative Punktspektrum kann auch Teile des Rest-
spektrums enthalten; ein Beispiel wird in 5.6 (b) gegeben. Beispiele dieser Art
sind allerdings eher pathologisch. Unser Interesse richtet sich in diesem Paragra-
phen auf Operatoren mit leerem Restspektrum, für die also das Spektrum nur
5 Das Spektrum beschränkter Operatoren 573

aus approximativen Eigenwerten besteht. Dies gilt insbesondere für beschränkte


symmetrische Operatoren. Bei unbeschränkten symmetrischen Operatoren, auf
die sich die vorangehenden Begriffe übertragen lassen, liegen die Dinge etwas
komplizierter.
ÜA Zeigen Sie: |λ| > T  =⇒ λ ∈ σapp (T ) (Dreiecksungleichung nach unten).
Allgemein gilt |λ| ≤ T  für λ ∈ σ(T ), wie in Abschnitt 6 gezeigt wird.
Beweis.
(a) Gilt T u = λu, u = 1, so erhalten wir durch un = u approximative Eigen-
vektoren.
(b) Sei λ ∈ σc (T ), also T − λ injektiv und W := Bild (T − λ) dicht in H .
Wir betrachten den linearen Operator S : W → H , w → (λ − T )−1 w.
Angenommen S ist beschränkt, Sw ≤ C für alle w ∈ W mit w ≤ 1.
Dann lässt sich S nach 2.9 zu einem beschränkten Operator S ∈ L (H ) mit
Normschranke C fortsetzen. Für u = lim wn mit wn ∈ W gilt dann Su =
n→∞
lim Swn . Daraus folgt S(λ−T ) = (λ−T )S = ½, also λ ∈ (T ) und S = R(λ, T )
n→∞
im Widerspruch zu λ ∈ σc (T ). Somit ist S unbeschränkt: Es gibt eine Folge (wn )
mit wn  = 1 und Swn  → ∞. Für un := Swn /Swn  gilt dann un  = 1
und (λ − T )un = wn /Swn  → 0 für n → ∞.
(c) Wir nehmen vorweg, dass σ(T ) nach 6.3 abgeschlossen ist. Sei λ ∈ ∂σ(T ).
Dann gilt λ ∈ σ(T ), und es gibt Zahlen n ∈ (T ) mit λ = lim n . Wegen der
n→∞
Bijektivität von n − T gibt es zu jedem u ∈ H eindeutig bestimmte Vektoren
vn ∈ H mit
(∗) u = ( n − T )vn = (λ − T )vn + ( n − λ)vn .
Zwei Fälle sind denkbar:
(I) Für jedes u ∈ H ist die so definierte Folge (vn ) beschränkt;
(II) Es gibt ein u ∈ H , so dass die zugeordnete Folge (vn ) unbeschränkt ist.
Im Fall (I) folgt jeweils ( n − λ)vn → 0, mit (∗) also u = lim (λ − T )vn ∈
n→∞
Bild (T − λ) für jeden Vektor u ∈ H . Es folgt λ ∈ σp (T ) oder λ ∈ σc (T ),
insgesamt λ ∈ σapp (T ) nach (a) und (b).
Im Fall (II) setzen wir cn := vn . Für un := vn /cn gilt dann un  = 1,
( n − λ)un  = | n − λ| → 0. Da nach (∗) die Folge (( n − T )vn ) beschränkt
ist, erhalten wir

(λ − T )un  = ( n − T )un + (λ − n )un 

1
≤ ( n − T )vn  + |λ − n| → 0 für n → ∞ ,
cn
somit λ ∈ σapp (T ). 2
574 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

5.6 Aufgaben. (a) Spektrum von Rechts– und Linksshift. Zeigen Sie

σ(L) = σ(R) = K1 (0) = {λ ∈ | |λ| ≤ 1} ,

σp (R) = ∅ , σr (R) = K1 (0) ,

σp (L) = K1 (0) , σ(L) = σapp (L) .

Das Punktspektrum von L besteht also nicht aus isolierten Punkten.


Anleitung: Zeigen Sie unter Verwendung der Sätze 5.4, 5.5 (einschließlich der
ÜA in 5.5) der Reihe nach: σp (R) = ∅, σr (L) = ∅, σ(L) = σapp (L) ⊂ K1 (0),
σ(R) ⊂ K1 (0), σp (L) = K1 (0) = σr (R), ∂σ(L) = {λ ∈ | |λ| = 1}.

(b) Zeigen Sie für den Operator

T : 2 → 2 , x = (x1 , x2 , x3 , . . . ) −→ (0, x1 , 12 x2 , 13 x3 , . . . ) ,

dass 0 ∈ σapp (T ) ∩ σr (T ).

5.7 Zur Namensgeschichte


Die Gelehrten des islamischen Kulturkreises, insbesondere Alhazen (Ibn Al–
Haytham, um 1000), bezeichneten in ihren Untersuchungen zur Optik das Pris-
menspektrum mit aš–šabah. (Phänomen, Erscheinung, Gestalt, auch Geist, Ge-
spenst, Schrägbild). Von den Übersetzern des Mittelalters wurde dies durch das
lateinische Wort spectrum (für Erscheinung, Schemen, Gesicht) wiedergegeben.
Mit der Entwicklung der Spektralanalyse (Wollaston 1802, Bunsen und
Kirchhoff 1859) entstanden Wortverbindungen wie Spektrallinien, Banden-
spektrum, Emissions– und Absorptionsspektrum. Um 1900 wurde auch im Zu-
sammenhang mit akustischen und mechanischen Schwingungsproblemen von
Spektren gesprochen. So heißt es bei W. Wirtinger (Mathematische Annalen
1897): In der Ausdrucksweise der Optik würde also die Schwingung einer un-

endlich langen Saite im Allgemeinen einem Bandenspektrum entsprechen.“ Und
etwas später: Die Intervalle für λ schließen sich nun lückenlos aneinander, das

Bandenspektrum wird zum continuirlichen Spektrum.“
In seiner vierten Mitteilung über Grundzüge einer allgemeinen Theorie der

linearen Integralgleichungen“ definiert Hilbert 1906: Die Gesamtheit dieser

n Eigenwerte heiße das Spektrum der Form Kn“. Mit Bezug auf quadratische
2
Formen im Folgenraum  sagt er an späterer Stelle: Die Gesamtheit der Stel-

len λ1 , λ2 , . . . werde das Punktspektrum oder diskontinuirliche Spektrum der
Form K genannt.“ Anschließend führt Hilbert das Streckenspektrum oder

kontinuirliche Spektrum“ ein.
6 Analytizität der Resolvente, Folgerungen für das Spektrum 575

In einem Aufsatz über Naturerkennen und Logik“ schreibt Hilbert 1930: In


” ”
neuster Zeit häufen sich die Fälle, daß gerade die wichtigsten im Mittelpunkt des
Interesses der Mathematik stehenden mathematischen Theorien zugleich die in
der Physik benötigten sind. Ich hatte die Theorie der unendlich vielen Variablen
aus rein mathematischem Interesse entwickelt und dabei sogar die Bezeichnung
Spektralanalyse angewandt, ohne ahnen zu können, daß diese einmal später in
dem wirklichen Spektrum der Physik realisiert werden würde.“
Dies klingt einigermaßen erstaunlich aus dem Munde eines Gelehrten, der wie
kaum ein anderer die mathematisch–naturwissenschaftliche Diskussion seiner
Zeit überblickte und anregte, der in seinen Mitteilungen“ ausführlich auf die

Bedeutung seiner Methode für die mathematische Physik eingegangen war und
der sehr wahrscheinlich die Arbeit von Wirtinger kannte.

6 Analytizität der Resolvente, Folgerungen für das Spektrum


6.1 Die Neumannsche Reihe
Satz. Aus T  < 1 folgt die Invertierbarkeit von 1−T und die Normkonvergenz
der Reihenentwicklung


(1 − T )−1 = Tk .
k=0


Dasselbe ergibt sich unter der schwächeren Voraussetzung T k  < ∞.
k=0

Beweis.


Aus T  < 1 und T k  ≤ T k folgt die Konvergenz der Reihe T k .
k=0

n
Wir setzen letzteres voraus und betrachten Sn := T k . Wegen
k=0
 
m  
m
Sm − Sn  =  Tk  ≤ T k  für m > n
k=n+1 k=n+1

ist (Sn ) eine Cauchy–Folge in der Operatornorm. Für den nach 2.1 existierenden
Normlimes S = lim Sn gilt
n→∞

(1 − T )S − (1 − T )Sn  = (1 − T )(S − Sn ) ≤ 1 − T  · S − Sn  → 0


für n → ∞. Daraus folgt, da (T n+1 ) eine Nullfolge ist,
(1 − T )S = lim (1 − T )Sn = lim (1 − T )(1 + T + · · · + T n )
n→∞ n→∞

= lim (1 − T n+1 ) = ½.
n→∞

Entsprechend erhalten wir S(1 − T ) = ½ ÜA . 2


576 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

6.2 Reihenentwicklungen der Resolvente


Satz. (a) Für |λ| > T  gilt λ ∈ (T ) und


1
R(λ, T ) = Tk
λk+1
k=0

im Sinne der Normkonvergenz.


(b) Für λ0 ∈ (T ) und r = R(λ0 , T )−1 gilt Kr (λ0 ) ⊂ (T ).
Für |λ − λ0 | < r erhalten wir die normkonvergente Potenzreihenentwicklung


R(λ, T ) = (λ0 − λ)k R(λ0 , T )k+1 .
k=0

(c) Insbesondere ist für beliebige u, v ∈ H durch f (λ) := v , R(λ, T )u eine


auf der offenen Menge (T ) holomorphe Funktion f gegeben mit lim f (λ) = 0 .
|λ|→∞

Beweis.
(a) Für |λ| > T  und A := λ−1 T gilt A < 1. Nach 6.1 existiert daher
(1−A)−1 = λ·(λ−T )−1 = λ R(λ, T ) und ist gegeben durch die normkonvergente
Reihe

∞ 

λ R(λ, T ) = (1 − A)−1 = Ak = λ−k T k .
k=0 k=0

(b) Wegen (λ0 − T )R(λ0 , T ) = ½ ist R(λ0 , T ) > 0.


Für |λ − λ0 | < r := R(λ0 , T )−1 setzen wir B := (λ0 − λ)R(λ0 , T ). Dann gilt
B ∈ L (H ) und
(1 − B)(λ0 − T ) = (1 − (λ0 − λ)R(λ0 , T ))(λ0 − T )
(1)
= λ0 − T − (λ0 − λ) = λ − T .
Nach Wahl von λ gilt ferner B < 1, also ist 1 − B nach 6.1 invertierbar, und
(1 − B)−1 ist gegeben durch die normkonvergente Reihe


(2) (1 − B)−1 = Bk .
k=0

Aus (1) und 3.1 (b) erhalten wir daher die Existenz von
(3) R(λ, T ) = R(λ0 , T ) (1 − B)−1 für |λ − λ0 | < r .
Die Reihendarstellung für R(λ, T ) ergibt sich aus (3),(2) und der Definition von
B nach der Regel 4.4 (e):

∞ 

R(λ, T ) = R(λ0 , T ) B k = (λ0 − λ)k R(λ0 , T )k+1
k=0 k=0
6 Analytizität der Resolvente, Folgerungen für das Spektrum 577

für |λ − λ0 | < r. Damit folgt die Offenheit von (T ) ⊂ .

(c) Aus der Normkonvergenz der Reihe für R(λ, T ) folgt nach 4.2 die schwache
Konvergenz, somit erhalten wir für die Funktion f (λ) = v , R(λ, T )u die Po-
tenzreihenentwicklung

∞  
f (λ) = (−1)k v , R(λ0 , T )k+1 u (λ − λ0 )k für |λ − λ0 | < r ,
k=0

d.h. f ist analytisch und somit holomorph in der nach (b) offenen Menge (T ).

Für |λ| > T  gilt nach (a) λ ∈ (T ) und


 1  1 k  ≤ 1 lim  |λ|−k T k =
n n
1
R(λ, T ) = lim  T .
n→∞ λ k=0 λk |λ| n→∞ k=0 |λ| − T 

Hieraus folgt lim R(λ, T ) = 0 und damit auch


|λ|→∞

lim v , R(λ, T )u = 0 . 2
|λ|→∞

6.3 Die Existenz von Spektralwerten


Satz. Das Spektrum σ(T ) eines Operators T ∈ L (H ) ist nichtleer, kompakt
und liegt in der abgeschlossenen Kreisscheibe mit Radius T .

Beweis.
Nach 6.2 ist (T ) offen, und für |λ| > T  gilt λ ∈ (T ). Zu zeigen bleibt,
dass σ(T ) = ∅. Angenommen (T ) = . Dann ist für beliebige u, v ∈ H
durch f (λ) := v , R(λ, T )u nach 6.2 (c) eine auf ganz definierte holomor-
phe, d.h. ganze Funktion f gegeben. Wegen lim f (λ) = 0 ist f beschränkt.
|λ|→∞
Nach dem Satz von Liouville (Bd. 1, § 27 : 6.3) ist f konstant, also f = 0. Aus
v , R(λ, T )u = 0 für alle u, v ∈ H folgt R(λ, T ) = 0 für alle λ ∈ im
Widerspruch zu R(λ, T )(λ − T ) = . 2

Wir definieren den Spektralradius von T durch


  
r(T ) := max |λ|  λ ∈ σ(T ) .

Es gilt demnach r(T ) ≤ T . Für symmetrische Operatoren T zeigen wir in 6.5,


dass r(T ) = T . In 6.4 (b) wird ein Operator T mit r(T ) < T  angegeben.

6.4 Aufgaben
(a) Zeigen Sie mit Hilfe von 5.2, dass es zu jeder kompakten Menge K ⊂ 
einen beschränkten Operator T auf 2 gibt mit σ(T ) = K.
578 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

(b) Das Spektrum des Operators des unbestimmten Integrals.


Für u ∈ L2 [0, 1] sei
x
(T u)(x) := u(t) dt , vgl. 3.4 (f) .
0

Zeigen Sie per Induktion mit Hilfe der Cauchy–Schwarzschen Ungleichung


 n  n
 (T u)(x) 2 ≤ x u2 .
n!
Folgern Sie daraus mit Hilfe der letzten Aussagen von 6.1 die Existenz von
 −1
1 1
(λ − T )−1 = 1− T für alle λ = 0.
λ λ
Es ist also σ(T ) = {0}, insbesondere 0 = r(T ) < T .
Warum gilt 0 ∈ σc (T )?

6.5 Das Spektrum symmetrischer Operatoren


(a) Für einen Operator T ∈ L (H ) sind folgende Bedingungen äquivalent:
(1) v, Tu = Tv, u für u, v ∈ H (Symmetrie),

(2) T = T,
(3) u, T u ∈ Ê für alle u ∈ H , vgl. 3.6 (b).

Wir notieren für symmetrische T ∈ L (H ) und für λ = α + iβ ∈


 
(T − λ)u2 ≥ |β|2 u2 .

Dies folgt aus der Symmetrie von T − α für α ∈  durch Ausmultiplizieren:

(T − λ)u , (T − λ)u = (T − α)u − iβu , (T − α)u − iβu


= (T − α)u2 + iβ u , (T − α)u − iβ (T − α)u , u + |β|2 · u2 .

(b) Satz. Symmetrische Operatoren T ∈ L (H ) haben ein reelles Spektrum.


Alle Spektralwerte sind approximative Eigenwerte.
Für den Spektralradius gilt r(T ) = T , also gehört wenigstens eine der Zahlen
T , −T  zum Spektrum von T .

Beweis.
(i) Alle Eigenwerte von T sind reell: Aus T u = λu, u = 1 folgt

λ = λ u , u = u , λu = u , T u ∈  .
6 Analytizität der Resolvente, Folgerungen für das Spektrum 579

(ii) Daher hat T kein Restspektrum, denn für λ ∈ σr (T ) folgt nach 5.4, dass
Ê
λ ∈ σp (T ∗ ) = σp (T ), also λ ∈ und damit λ ∈ σp (T ), ein Widerspruch.
(iii) Nach 5.5 folgt σ(T ) = σapp (T ). Für λ ∈ Ê gilt nach (a)
(T − λ)u ≥ | Im λ | u ,

also kann λ nicht zu σapp (T ) = σ(T ) gehören.


(iv) Für := T  = sup{T u | u = 1} gibt es Vektoren un ∈ H mit

un  = 1 , T u1  ≤ T u2  ≤ . . . , lim T un  = .
n→∞

Für diese gilt wegen der Symmetrie von T


 
(T 2 − 2
) un 2 = (T 2 − 2
) un , (T 2 − 2
) un

= T 2 un 2 − 2 2
un , T 2 un + 4

= T (T un )2 − 2 2 T un 2 + 4

≤ T 2 T un 2 − 2 2 T un 2 + 4
→ 0 für n → ∞ .

Somit gilt 2 = T 2 ∈ σapp (T 2 ), d.h. T 2 − 2 = (T − )(T + ) ist nicht


invertierbar. Dann können T + , T − nicht beide invertierbar sein (vgl.
3.1 (b)), also gilt − ∈ σ(T ) oder ∈ σ(T ). 2

(c) Satz. Für symmetrische Operatoren T ∈ L (H ) gilt


  
T  = sup | u , T u |  u = 1 .

Beweis.
Wegen | u , T u | ≤ u · T u ≤ T  · u2 gilt
  
s := sup | u , T u |  u = 1 ≤ T  .

Nach (b) gibt es ein λ ∈ σ(T ) = σapp (T ) mit |λ| = T . Da es un ∈ H gibt


mit un  = 1 und T un − λun → 0 für n → ∞, ergibt sich

| un , (T − λ)un | ≤ un  · T un − λun  → 0 für n → ∞ ,

also λ = lim un , T un und somit


n→∞

T  = |λ| = lim | un , T un | ≤ s . 2
n→∞
580 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

7 Der Funktionalkalkül für symmetrische Operatoren


In diesem Abschnitt geht es darum, für einen symmetrischen Operator T ∈
L (H ) den Operator f (T ) zu definieren, wobei zunächst stetige Funktionen
Ê
f : → und später auch charakteristische Funktionen f = χ]−∞,λ] betrach-
ten werden. Die Bedeutung dieses Funktionalkalküls soll durch zwei Beispiele
beleuchtet werden:
Für einen symmetrischen Operator H ∈ L (H ) liefert
u(t) = e−iHt ϕ
eine Lösung des Problems
u̇(t) = − iHu(t) , u(0) = ϕ ,
vgl. § 18 : 3.1. Für eλ = χ]−∞,λ] und u = 1 ist durch
F (λ) := u , eλ (T )u
eine Verteilungsfunktion gegeben und damit die Möglichkeit einer wahrschein-
lichkeitstheoretischen Interpretation des Operatorenkalküls eröffnet.
Das Spektrum von T spielt dabei eine wesentliche Rolle: Es zeigt sich, dass f (T )
nur von den Werten von f auf σ(T ) abhängt.

7.1 Einsetzen symmetrischer Operatoren in Polynome


Für symmetrische Operatoren T ∈ L (H ) und p(x) = a0 + a1 x + . . . + an xn
setzen wir
p(T ) = a0 + a1 T + . . . + an T n .
(Nach der Vereinbarung 5.1 steht a0 für a0 ·  = a0 T 0 .) Dann gilt ÜA

(a) (αp + βq)(T ) = αp(T ) + βq(T ) für α, β ∈ ,


(b) (p · q)(T ) = p(T ) · q(T ) = q(T ) · p(T ),
(c) p(T )∗ = p(T ) mit p(x) := a0 + a1 x + . . . + an xn .

7.2 Der spektrale Abbildungssatz für Polynome


Satz. Für symmetrische Operatoren T ∈ L (H ) gilt
(a) σ(p(T )) = σapp (p(T )) = p(σ(T )), d.h.
μ ∈ σ(p(T )) ⇐⇒ μ ∈ σapp (p(T ))
⇐⇒ es gibt ein λ ∈ σ(T ) mit μ = p(λ).
(b) σp (p(T )) = p(σp (T )), falls p nicht konstant ist. Dabei ist jeder Eigenvektor
von T auch Eigenvektor von p(T ).
  
(c) p(T ) = max | p(λ) |  λ ∈ σ(T ) .
(d) p(T ) = q(T ), falls p und q auf σ(T ) übereinstimmen.
7 Der Funktionalkalkül für symmetrische Operatoren 581

Beweis.
Wir betrachten zunächst konstante Polynome p(x) = a0 . Für solche hat p(T ) =
a0 ½ ein einpunktiges Spektrum: σ(p(T )) = σp (p(T )) = {a0 }. Jeder Vektor u = 0
ist Eigenvektor von p(T ) zum Eigenwert a0 . Nach 6.3 ist σ(T ) nicht leer. Für
alle λ ∈ σ(T ) gilt p(λ) = a0 . Schließlich ist p(T ) = |a0 | = |p(λ)| für alle
λ ∈ σ(T ).
Für den Rest des Beweises setzen wir Grad (p) = n ≥ 1 voraus:

p(x) = a0 + . . . + an xn , n ≥ 1 , an = 0 .

(a) Zu jeder Zahl μ ∈ gibt es Zahlen λ1 , . . . , λn ∈ , so dass

(1) p(x) − μ = an · (x − λ1 ) · · · (x − λn ) , (an = 0) .

Aus 7.1 folgt

(2) p(T ) − μ = an (T − λ1 ) · · · (T − λn ) .

Da das Produkt invertierbarer Operatoren nach 3.1 (b) invertierbar ist, ergibt
sich daraus

μ ∈ σ(p(T )) =⇒ λk ∈ σ(T ) für wenigstens ein k;

dabei ist p(λk ) = μ.


Sei umgekehrt λ ∈ σ(T ) und μ = p(λ). Dann gibt es ein Polynom q mit

(3) p(x) − μ = (x − λ)q(x) , also p(T ) − μ = q(T )(T − λ) .

Wegen σ(T ) = σapp (T ) (vgl. 6.5 (b)) gibt es Vektoren un ∈ H mit

un  = 1 , (T − λ)un → 0 für n → ∞ . Aus (3) folgt

(4) (p(T ) − μ)un = q(T )(T − λ)un → 0 für n → ∞ ,

da q(T ) stetig ist. Somit haben wir

λ ∈ σ(T ) = σapp (T ) =⇒ p(λ) ∈ σapp (p(T )) .

(b) Sei T u = λu mit u = 1 und μ = p(λ). Aus (4) mit un = u folgt

(p(T ) − μ)u = q(T )(T − λ)u = 0 .

Somit ist u Eigenvektor von p(T ) zum Eigenwert μ.


Sei umgekehrt p(T )v = μ · v mit v = 0. Wir verwenden die Darstellungen (1),
(2) und erhalten

(T − λ1 ) · · · (T − λn )v = 0 .
582 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Für w := (T − λn )v gilt entweder w = 0, dann ist λn ∈ σp (T ), oder es gilt


w = 0 und (T − λ1 ) · · · (T − λn−1 )w = 0. Auf diese Weise fortfahrend erhalten
wir schließlich ein u = 0 und ein k mit (T − λk )u = 0, d.h. λk ∈ σp (T ). Also ist
μ = p(λ) mit einem geeigneten λ ∈ σp (T ).
(c) Für λ ∈ Ê und das in 7.1 (c) definierte Polynom p gilt p(λ)p(λ) = |p(λ)| . 2

Nach 7.1 gilt


(p · p)(T ) = p(T ) · p(T ) = p(T )∗ · p(T ) ,
also ist (p · p)(T ) symmetrisch und positiv, vgl. 3.3 (3). Aus (a) und den Sätzen
6.5 (b) und (c) folgt daher
     
max |p(λ)|2  λ ∈ σ(T ) = max (p · p)(λ)  λ ∈ σ(T )
  
= max μ  μ ∈ σ((pp)(T )) = sup { u , (pp)(T )u | u = 1}
  
= sup { u , p(T )∗ p(T )u | u = 1} = sup p(T )u2  u = 1

= p(T )2 . 2

7.3 Der Funktionalkalkül für stetige Funktionen


(a) Satz. Zu jedem symmetrischen Operator T ∈ L (H ) und jeder stetigen
Ê
Funktion f : → gibt es einen Operator f (T ) mit folgender Eigenschaft:
Ist [a, b] ein beliebiges kompaktes Intervall mit σ(T ) ⊂ [a, b] und (pn ) eine auf
[a, b] gleichmäßig gegen f konvergierende Folge von Polynomen, so gilt
f (T ) = lim pn (T )
n→∞

im Normsinn. Dieser Operator hängt nur von den Werten von f auf σ(T ) ab:
    
f (T )  = max |f (λ)|  λ ∈ σ(T ) .

Beweis.
Sei σ(T ) ⊂ [a, b]. Nach dem Weierstraßschen Approximationssatz § 6 : 2.9 gibt
es Polynome pn , die auf [a, b] gleichmäßig gegen f konvergieren. Nach 7.2 (c)
gilt
    
pm (T ) − pn (T )  = max | pm (λ) − pn (λ) |  λ ∈ σ(T ) ,

also bilden die pn (T ) eine Cauchy–Folge im Raum L (H ). Da dieser vollständig


ist, existiert der Normlimes S := lim pn (T ).
n→∞

Ist σ(T ) ⊂ [c, d] und konvergieren die Polynome qn auf [c, d] gleichmäßig gegen
f , so existiert entsprechend der Normlimes lim qn (T ). Nach 7.2 (c) gilt
n→∞
    
pn (T ) − qn (T )  = max | pn (λ) − qn (λ) |  λ ∈ σ(T ) → 0
7 Der Funktionalkalkül für symmetrische Operatoren 583

für n → ∞, somit lim pn (T ) = lim qn (T ).


n→∞ n→∞

Mit der Abkürzung u∞ = max {|u(λ)| | λ ∈ σ(T )} erhalten wir wegen der
Stetigkeit der Norm aus 7.3 (a)

f (T ) = lim pn (T ) = lim pn ∞ = f ∞ . 2


n→∞ n→∞

(b) Für die Definition von f (T ) erweist es sich im Nachhinein als unnötig, die
Stetigkeit von f auf ganz Ê
zu verlangen; es kommt nur auf die Einschränkung
von f auf σ(T ) an. Umgekehrt lässt sich jede stetige Funktion f : σ(T ) →
zu einer stetigen Funktion F :  → mit gleicher Supremumsnorm fortsetzen
(Satz von Tietze–Uryson § 10 : 5.3). Dies berechtigt uns zu folgender
Definition. Für f ∈ C(σ(T )) setzen wir f (T ) := F (T ), wobei F :  → eine
beliebige stetige Fortsetzung von f ist. In diesem Fall definieren wir
F ∞ = f ∞ := sup {|f (λ) | λ ∈ σ(T ) }.

7.4 Eigenschaften des Funktionalkalküls für stetige Funktionen


(a) Für f ∈ C(σ(T )) gilt
  
f (T ) = f ∞ := max | f (λ) |  λ ∈ σ(T ) und

f (T )∗ = f (T ) .

Ist f also reellwertig auf σ(T ), so ist f (T ) symmetrisch.

(b) Für f, g ∈ C(σ(T )) gilt

(αf + βg)(T ) = αf (T ) + βg(T ) (α, β ∈ ),

(f · g)(T ) = f (T )g(T ) = g(T )f (T ) .

Die erste Aussage (a) wurde in 7.3 bewiesen; die restlichen Aussagen ergeben
sich aus den entsprechenden Eigenschaften 7.1 des polynomialen Funktional-
kalküls durch Grenzübergang ÜA .

(c) Zusammenfassung. Der Normabschluss von Span {, T, T 2 , . . .},

C∗ (T ) := {p(T ) | p ist Polynom} ,

ist eine kommutative C∗ –Algebra und als solche isomorph zu (C(σ(T )),  · ∞ ):
Die Einsetzungsabbildung E : C(σ(T )) → C∗ (T ), f → f (T ) ist bijektiv und hat
die Eigenschaften (a), (b). Insbesondere ist also
  
C∗ (T ) = f (T )  f ∈ C(σ(T )) .
584 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Die einzige über das Vorangehende hinausgehende Behauptung,

C∗ (T ) = {f (T ) | f ∈ C(σ(T ))} ,

ist folgendermaßen einzusehen. Zu jedem Operator S ∈ C∗ (T ) gibt es Polynome


pn mit S = lim pn (T ). Wegen pm (T ) − pn (T ) = pm − pn ∞ ist (pn ) ein
n→∞
Cauchy–Folge in C(σ(T )), konvergiert also gleichmäßig gegen eine Funktion
f ∈ C(σ(T )). Definitionsgemäß ist f (T ) = lim pn (T ) = S.
n→∞

(d) Aufgabe. Für jeden Operator R ∈ L (H ) mit RT = T R gilt RS = SR


für alle S ∈ C∗ (T ).

7.5 Der spektrale Abbildungssatz


Für symmetrische Operatoren T ∈ L (H ) und f ∈ C(σ(T )) gilt
(a) σ(f (T )) = σapp (f (T )) = f (σ(T )).
(b) T u = λu =⇒ f (T )u = f (λ)u .
(c) un  = 1 , (T − λ)un → 0 =⇒ f (T )un − f (λ)un → 0 .
(d) Für μ ∈ (f (T )) gilt R(μ, f (T )) = g(T ) mit g = 1
μ−f
∈ C(σ(T )).

Bemerkung. Die für Polynome f gültige Beziehung σp (f (T )) = f (σp (T ))


überträgt sich nicht; ein Gegenbeispiel wird in 7.6 (b) gegeben.

Beweis.
(i) σ(f (T )) ⊂ f (σ(T )): Für μ ∈ f (σ(T )) ist g(λ) := 1/(μ − f (λ)) stetig auf
σ(T ). Somit ist der Operator g(T ) definiert, und aus 7.4 (b) ergibt sich

(μ − f (T ))g(T ) = g(T )(μ − f (T )) = ½.

Damit gilt:
μ ∈ f (σ(T )) =⇒ μ ∈ (f (T )) und die Aussage (d) über R(μ, f (T )).

(ii) f (σ(T )) ⊂ σapp (f (T )): Sei μ = f (λ) mit λ ∈ σ(T ). Wegen σ(T ) = σapp (T )
gibt es approximative Eigenvektoren un mit un  = 1 und (T − λ)un → 0. Aus
dem Beweisteil (4) von 7.2 entnehmen wir

(1) (p(T ) − p(λ))un → 0

für jedes nichtkonstante Polynom p; für konstante Polynome gilt dies trivialer-
weise ebenso. Zum Nachweis von (f (T ) − f (λ))un → 0 fixieren wir zu vorgebe-
nem ε > 0 ein Polynom p mit

(2) f − p∞ = f (T ) − p(T ) < ε .


7 Der Funktionalkalkül für symmetrische Operatoren 585

Für dieses Polynom gibt es aufgrund von (1) ein nε mit

(3) (p(T ) − p(λ))un  < ε für n > nε .

Aus (2) und (3) folgt für n > nε

(f (T ) − f (λ))un 

= (f (T ) − p(T ))un + (p(T ) − p(λ))un + (p(λ) − f (λ))un 

≤ f (T ) − p(T ) + (p(T ) − p(λ))un  + | p(λ) − f (λ) | < 3ε .

Aus (i) und (ii) folgt (a), (c) und (d). Der Aussage (b) folgt aus (c) mit un =
u/u (n = 1, 2, . . .). 2

7.6 Der stetige Funktionalkalkül für Multiplikatoren


(a) Multiplikatoren in 2 . Sei a = (a1 , a2 , . . . ) eine beschränkte Folge reeller
Zahlen und T = Ma der Multiplikator

T : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . ) .

Nach 3.4 (c) ist T symmetrisch, und aus 5.2 folgt

σ(T ) = {an | n ∈ }.


Aufgaben. (i) Zeigen Sie

f (T )x = (f (a1 ) x1 , f (a2 ) x2 , . . . )

zunächst für Polynome f und dann für Funktionen f ∈ C(σ(T )).


(ii) Was bedeutet f ∈ C(σ(T )) für T = Ma mit a = (1, 12 , 13 , . . . ) ?

(b) Multiplikatoren in L2 (Ω, μ). Für eine reellwertige Funktion v ∈ L∞ (Ω, μ)


sei Mv : u → v · u. Nach 3.4 (d) ist Mv symmetrisch, und nach 5.3 ist σ(Mv )
der essentielle Wertebereich von v; ferner dürfen wir v(Ω) ⊂ σ(Mv ) annehmen.

Aufgaben. (i) Zeigen Sie

f (Mv ) = Mf ◦v

zunächst für Polynome f und dann mit Hilfe des kleinen Satzes von Lebesgue
für f ∈ C(σ(Mv )).
(ii) Für den Multiplikator Mx auf L2 [a, b] ist σp (Mx ) = ∅, vgl. die Bemerkung
5.3 (iii). Geben Sie ein f ∈ C(σ(Mx )) an mit σp (f (Mx )) = ∅.
586 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

7.7 Spektralzerlegung und Funktionalkalkül bei endlichem Spektrum


(a) Wir betrachten einen symmetrischen Operator T auf einem n–dimensio-
nalen Hilbertraum H . Bekanntlich gibt es eine Orthonormalbasis B für H
aus Eigenvektoren zu reellen Eigenwerten λk von T , also σ(T ) = σp (T ) =
{λ1 , . . . , λm }. Dann bilden alle zum Eigenwert λk gehörigen Eigenvektoren aus
B eine Orthonormalbasis für den Eigenraum Nk = Kern (T − λk ). Bezeichnen
wir den orthogonalen Projektor auf diesen Eigenraum mit Pk , so gilt ÜA

(1) P1 + . . . + Pm = ½,

(2) T = λ1 P1 + . . . + λm Pm (Spektralzerlegung von T ),

(3) Pi Pk = Pk Pi = δik Pk .

(b) Diese Formeln lassen sich auch mit Hilfe des Funktionalkalküls beweisen;
dabei wird nur die Endlichkeit des Spektrums verwendet, nicht die Vorausset-
zung dim H < ∞.

Satz. Hat ein symmetrischer Operator T ∈ L (H ) ein endliches Spektrum,

σ(T ) = {λ1 , . . . , λm } ,

so besteht dieses aus Eigenwerten. Für die orthogonalen Projektoren Pk auf die
paarweise orthogonalen Eigenräume Nk = Kern (T − λk ) gelten dann die Iden-
titäten (1),(2),(3).

Beweis.
Auf der endlichen Menge σ(T ) = {λ1 , . . . , λm } ist jede Funktion f : σ(T ) →
stetig. Wir betrachten für k = 1, . . . , m die Funktion fk : σ(T ) → , die auf
λk den Wert 1 annimmt und auf den übrigen Spektralwerten Null ist. Für diese
Funktionen gilt

(1 ) f1 (x) + . . . + fm (x) = 1 auf σ(T ) ,

(2 ) σ(T ) = λ1 f1 + . . . + λm fm

(3 ) fi · fk = δik fk .

Für die Operatoren Pk := fk (T ) folgen nach 7.4 unmittelbar die Formeln


(1), (2), (3). Ferner folgt Pk2 = Pk und die Symmetrie jedes Pk , da fk reell-
wertig ist. Nach § 9 : 2.6 ist Pk ein orthogonaler Projektor, und nach 7.4 (a) gilt
Pk  = fk ∞ = 1. Also ist Nk = Bild Pk = {0}.
7 Der Funktionalkalkül für symmetrische Operatoren 587

Aus (2 ), (1 ) folgt weiter T Pk = Pk T = λk Pk . Daher gilt

u ∈ Nk =⇒ Pk u = u =⇒ T u = T Pk u = λk Pk u = λk u .

Wegen Nk = {0} ist daher λk ein Eigenwert von T . Nach 7.5 (b) gilt

T u = λk u =⇒ Pk u = fk (T )u = fk (λk )u = u =⇒ u ∈ Nk .

Somit ist Nk der Eigenraum Kern (T − λk ). Ferner gilt für i = k


u ∈ Ni , v ∈ Nk =⇒
u, v = Pi u , Pk v = u , Pi Pk u = u , 0 = 0 . 2

(c) Der Funktionalkalkül. Aus den Identitäten (1)–(3) folgt per Induktion

T k = λk1 P1 + . . . + λkm Pm für k = 0, 1, 2, . . . (T 0 := ½) .

Daraus ergibt sich für Polynome p

p(T ) = p(λ1 ) P1 + . . . + p(λm ) Pm .

Zu jeder Funktion f ∈ C(σ(T )) gibt es ein eindeutig bestimmtes Interpolations-


polynom p mit

f (λk ) = p(λk ) für k = 1, . . . , m, Grad (pk ) ≤ m − 1

(Bd. 1, § 16 : 5). Aus 7.3 (a) folgt

f (T ) = f (λ1 ) P1 + . . . + f (λm ) Pm .

Da P1 , . . . , Pm wegen Pi Pk = 0 für i = k linear unabhängig sind, ist C∗(T )


ein Vektorraum der Dimension m.

(d) Aufgaben. (i) Sei P ein orthogonaler Projektor mit P = 0, P = ½.


Bestimmen Sie σ(P ) und f (P ) für f ∈ C(σ(P )).
(ii) Für x ∈ n sei T x = e , x e mit e = (1, 1, . . . , 1). Bestimmen Sie die
Matrix A = MK (T ) und deren Eigenwerte (vgl. Bd. 1, § 18 : 4.4). Geben Sie
f (T ) für f ∈ C(σ(T )) an.

7.8 Die von einem beschränkten symmetrischen Operator erzeugte


unitäre Gruppe
(a) Für einen symmetrischen Operator T ∈ L (H ) und t ∈  sei

U (t) := e−itT , d.h. U (t) := ft (T ) mit ft (x) = e−ixt .

Dann hat die Schar {U (t)} die Gruppeneigenschaft

U (s + t) = U (s) U (t) = U (t) U (s) für s, t ∈  , U (0) = .


588 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Ferner sind die U (t) unitäre Operatoren mit

U (t)∗ = U (t)−1 = U (−t) (t ∈ Ê) .


Beweis als ÜA mit Hilfe von 7.4.

(b) Es gilt U̇ (t) = − i T U (t) = −i U (t)T im Normsinn, d.h.


  
lim 
h→0
1
h

U (t + h) − U (t) + i T U (t) = 0 für alle t ∈ Ê.
Beweis als ÜA : Zeigen Sie für h = 0
     
1  1 
 U (t + h) − U (t) + iT U (t)  =  U (h) − ½ + iT  ≤ | h | · T 2
h h

durch Taylorentwicklung von cos(hx), sin(hx) mit Restglied zweiter Ordnung


und unter Verwendung von f (T ) = f ∞ , T  = r(T ).

(c) Eine Funktion u : I → H auf einem offenen Intervall I heißt differen-


zierbar im Hilbertraumsinn mit Ableitung u̇ = v, wenn
  
1 
lim  u(t + h) − u(t) − v(t)  = 0 für alle t ∈ I .
h→0 h

Ist u : I → H differenzierbar im Hilbertraumsinn, so ist u stetig.


Sind u, v : I → H differenzierbar im Hilbertraumsinn, so ist die reellwertige
Funktion t → u(t) , v(t) im gewöhnlichen Sinn differenzierbar mit

d
u(t) , v(t) = u̇(t) , v(t) + u(t) , v̇(t) (Produktregel).
dt

Beweis als ÜA . Beweisen und verwenden Sie die Stetigkeit des Skalarprodukts
in beiden Variablen: un → u, vn → v =⇒ un , vn → u , v .

(d) Satz. Zu jedem vorgegebenen Vektor u0 ∈ H gibt es eine eindeutig be-


stimmte Lösung des Cauchy–Problems im Hilbertraumsinn

u̇(t) = − i T u(t) , u(0) = u0 .

Diese ist gegeben durch u(t) = U (t) u0 = e−itT u0 .


Beweis als ÜA in folgenden Schritten:
(i) Aus (b) folgt, dass U (t)u0 eine Lösung liefert.
(ii) Sei v eine für |t| ≤ δ, δ > 0 definierte Lösung. Betrachten Sie die Funktion
w(t) := U (−t) v(t) und zeigen Sie h , w(t) = h , u0 für jeden Vektor h ∈ H .
8 Positive Operatoren und Zerlegung von Operatoren 589

8 Positive Operatoren und Zerlegung von Operatoren


8.1 Das Spektrum positiver Operatoren
Ein Operator T ∈ L (H ) heißt positiv (in Zeichen T ≥ 0), wenn u, T u ≥ 0
für alle u ∈ H gilt.
Positive Operatoren sind symmetrisch vgl. 3.6 (d).
(a) Beispiele. Für jeden Operator T ∈ L (H ) ist T ∗ T positiv.
Ist T symmetrisch und f : σ(T ) → Ê + stetig, so ist f (T ) positiv.
Für f, g ∈ C(σ(T )) mit f ≤ g gilt also f (T ) ≤ g(T ).
Ersteres folgt aus u , T ∗ T u = T u , T u ≥ 0.

Für f ∈ C(σ(T )) mit f ≥ 0 ist g = f stetig und reellwertig auf σ(T ). Daher
ist g(T ) ein symmetrischer Operator, und wegen f = g 2 gilt
f (T ) = g 2 (T ) = g(T )∗g(T ) ≥ 0 .

(b) Satz. Ein symmetrischer Operator T ∈ L (H ) ist genau dann positiv,


Ê
wenn σ(T ) ⊂ + .
Beweis.
Ê √
Ist T symmetrisch und σ(T ) ⊂ +, so ist w(x) = x stetig auf σ(T ). Wie in
(a) ergibt sich T = w(T ) ≥ 0. Außerdem gilt T
2 1/2
:= w(T ) ≥ 0.
Sei umgekehrt T ≥ 0. Wegen der Symmetrie von T ist σ(T ) = σapp (T ) ⊂ Ê
nach 6.5 (b). Für λ < 0 und u = 1 gilt
T u − λu2 = T u2 − 2λ u , T u + |λ|2 ≥ |λ|2 > 0 ,
also λ ∈ σapp (T ), was die Behauptung σ(T ) = σapp (T ) ⊂ Ê + liefert. 2

8.2 Die Quadratwurzel eines positiven Operators


Für jeden positiven Operator T ∈ L (H ) gibt es genau einen positiven Operator
S ∈ L (H ) mit S 2 = T , nämlich S = T 1/2 ∈ C*(T ).

Beweis.
(a) Für S := T 1/2 gilt 0 ≤ S ∈ C*(T ) und S 2 = T nach dem Beweis 8.1 (b).
(b) Sei R ∈ L (H ) ein positiver Operator mit R2 = T . Dann gilt RT = R3 =
T R, also RS = SR nach 7.4 (d). Es folgt (S − R)(S + R) = S 2 − R2 = 0. Für
A := (S − R)S(S − R) und B := (S − R)R(S − R) gilt A ≥ 0, B ≥ 0 ÜA und

A + B = (S − R)(S + R)(S − R) = 0 .

Wir haben also 0 ≤ A, B ≤ A + B ≤ 0. Nach 3.6 (d) folgt A = B = 0. Daraus


erhalten wir (S − R)3 = A − B = 0. Der spektrale Abbildungssatz 7.5 liefert
σ(S − T ) = {0}. Mit 6.5 (b) folgt S − T  = 0, also S = T . 2
590 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

8.3 Betrag und Polarzerlegung von Operatoren


(a) Für T ∈ L (H ) setzen wir |T | := (T ∗ T )1/2 , vgl. 8.1 (a), 8.2. Dann gilt
0 ≤ |T | ∈ C*(T ),  |T |  = T  und Kern |T | = Kern T , denn
 
T u2 = u , T ∗ T u = u , |T |2 u = |T |u , |T |u =  |T |u 2 .
(b) Satz. Zu jedem Operator T ∈ L (H ) gibt es einen eindeutig bestimmten
Operator U ∈ L (H ) mit
T = U |T | , Kern U = Kern T (Polarzerlegung von T ) .
U ist eine partielle Isometrie: Die Einschränkung
U : Bild |T | → Bild T
ist bijektiv und isometrisch.

Beweis.
Für einen Operator U mit den behaupteten Eigenschaften gilt notwendigerweise

(∗) U (|T |u) = T u .

Umgekehrt lässt sich durch (∗) ein Operator U : Bild |T | → Bild T definieren.
Die Vorschrift U (|T |u) := T u macht Sinn: Aus |T |u = |T |v folgt u − v ∈
Kern |T | = Kern T , also T u = T v. Daher ist

U : Bild |T | → Bild T , |T |u → T u

bijektiv und isometrisch wegen  |T |u2 = T u2 . Nach 2.9 lässt sich U zu einer
bijektiven und isometrischen Abbildung

U : Bild |T | → Bild T

fortsetzen.
Da |T | symmetrisch ist, gilt Bild |T | = Kern |T |⊥ = Kern T ⊥ nach 3.5, also

H = Bild |T | ⊕ Kern T

nach dem Zerlegungssatz § 9 : 2.4. Definieren wir also U v := 0 für v ∈ Kern T ,


so ist ein Operator der gewünschten Art konstruiert. 2

8.4 Aufgaben
1 0
(a) Auf H = 2
seien S : x → 0
0
0
x und T : x → 0
1
0
x. Geben Sie |S|
und |T | an. Zeigen Sie, dass weder |ST | = |S| |T | noch |S + T | ≤ |S| + |T | gilt.
(b) Geben Sie die Polarzerlegung von T an.
(c) Zeigen Sie: Jeder Operator T ∈ L (H ) lässt sich darstellen als
9 Erweiterung des Funktionalkalküls 591

1
T = S1 + iS2 , wobei S1 := 2 (T + T ∗ ) , S2 := i
2 (T ∗ − T )
symmetrische Operatoren sind.
(d) Zeigen Sie: Für symmetrische Operatoren T mit T  ≤ 1 gilt 0 ≤ T 2 ≤ ½,
und
U1 := T + i(1 − T 2 )1/2 , U2 := T − i(1 − T 2 )1/2
sind unitäre Operatoren.
Folgerung aus (c) und (d): Jeder Operator T ∈ L (H ) ist Linearkombination
von vier unitären Operatoren.

9 Erweiterung des Funktionalkalküls


9.1 Die Funktionenklasse F
Mit F bezeichnen wir die Klasse al-
ler Funktionen f : Ê Ê
→ + , welche
punktweiser Limes einer absteigenden
Folge beschränkter stetiger Funktionen 1
Ê Ê
fn : → + sind. fn
Das für uns wichtigste Beispiel ist die
charakteristische Funktion des Inter-
valls ] − ∞, λ] , λ λ+ 1
n

eλ := χ]−∞,λ] ,
die durch die nebenstehend skizzzierte Folge fn approximiert wird. Unmittelbar
aus der Definition ergibt sich
f, g ∈ F =⇒ f · g ∈ F und αf + βg ∈ F für α, β ≥ 0 .
Die Funktionen f ∈ F sind an jeder Stelle x0 nach oben halbstetig: Zu jedem
ε > 0 gibt es ein δ > 0, so dass
f (x) < f (x0 ) + ε für |x − x0 | < δ .
Daraus folgt, dass f auf jeder kompakten Teilmenge K ⊂ Ê
ein Maximum an-
nimmt. Die Beweise dieser beiden für das Folgende unerheblichen Eigenschaften
seien den Lesern als ÜA überlassen.
Zum Beweis benötigen wir folgendes

Lemma. Seien f = lim fn , g = lim gn , wobei (fn ) und (gn ) jeweils absteigen-
n→∞ n→∞
de Folgen beschränkter, stetiger und positiver Funktionen sind.
Ist K ⊂ Ê kompakt und f (x) ≤ g(x) auf K, so gibt es zu jedem n ∈ Æ ein
Æ
M ∈ , so dass
1
fm (x) < gn (x) + n für m > M und x ∈ K.
592 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

Beweis.
Wir fixieren n und betrachten einen Punkt y ∈ K. Zu diesem gibt es wegen
lim fk (y) = f (y) < g(y) + n1 ≤ gn (y) + n1 ein k = k(y) mit
k→∞
1
fk (y) < gn (y) + n .
Da fk , gn stetig sind, gilt diese Ungleichung auch in einer Umgebung U (y) von
y. Nach dem Überdeckungssatz von Heine–Borel (Bd. 1, § 21 : 6.3) wird K von
endlich vielen solcher Umgebungen überdeckt: K ⊂ U (y1 ) ∪ · · · ∪ U (yN ). Für
M := max{k(y1 ), . . . , k(yN )} gilt dann wegen des Absteigens der Folge (fn )
1
fm (x) < gn (x) + n für x ∈ K und alle m > M . 2

9.2 Der Funktionalkalkül für die Klasse F


Satz. Es sei T ∈ L (H ) symmetrisch und f ∈ F. Für jede absteigende Folge
beschränkter stetiger Funktionen fn : Ê Ê
→ + mit f = lim fn konvergiert
n→∞
dann die Folge der Operatoren fn (T ) stark gegen einen nur von f abhängenden
positiven beschränkten Operator, den wir mit f (T ) bezeichnen. Dieser hängt nur
von den Werten von f auf σ(T ) ab.

Beweis.
(a) Nach 8.1 (a) folgt aus der Ungleichung 0 ≤ fn+1 ≤ fn , dass die Operatoren
fn (T ) positiv sind und dass
0 ≤ fn+1 (T ) ≤ fn (T ) für n = 1, 2, . . . .
Aus dem Satz von der monotonen Konvergenz 4.5 folgt die Existenz von
S := s–lim fn (T ) ≥ 0 .
n→∞

(b) Sei (gn ) eine absteigende Folge beschränkter, positiver, stetiger Funktionen,
deren Limes g auf σ(T ) mit f übereinstimmt. Nach dem Lemma 9.1 gibt es zu
jedem n ∈  ein M ∈  mit
1
0 ≤ fm (x) < gn (x) + n für m > M und x ∈ σ(T ) .
Nach 8.1 (a) folgt
1
0 ≤ fm (T ) ≤ gn (T ) + n für m > M,
also
1
u , Su = lim u , fm (T )u ≤ u , gn (T )u + n u2 .
m→∞

Für den nach (a) existierenden s–lim gn (T ) =: R folgt S ≤ R. Durch Vertau-


n→∞
schung der Rollen von (fn ) und (gn ) erhalten wir ebenso R ≤ S und damit
R = S nach 3.6 (d). 2
9 Erweiterung des Funktionalkalküls 593

9.3 Eigenschaften des erweiterten Funktionalkalküls


Für f, g ∈ F gilt
(a) (αf + β g)(T ) = αf (T ) + β g(T ), falls α, β ≥ 0,

(b) (f · g)(T ) = f (T ) · g(T ) = g(T ) · f (T ),

(c) f (λ) ≤ g(λ) für λ ∈ σ(T ) =⇒ f (T ) ≤ g(T ),


  
(d) f (T ) ≤ f ∞ = sup |f (λ)|  λ ∈ σ(T ) ,

(e) f (T ) − g(T ) ≤ f − g∞ := sup {|f (λ) − g(λ)| | λ ∈ σ(T )}.

Bemerkung. Dass in (d) der Fall <“ eintreten kann und dass sich der spek-

trale Abbildungssatz nicht übertragen lässt, zeigt das Beispiel in 9.4 (b).

Beweis.
Sei f = lim fn , g = lim gn punktweise auf
n→∞ n→∞
Ê, wobei (f
n ), (gn ) absteigende
Folgen beschränkter, positiver, stetiger Funktionen sind. Dann sind auch die
Folgen (αfn + β gn ), (fn · gn ) absteigend mit Grenzwerten

αf + β g = lim (αfn + β gn ) , f · g = lim fn · gn .


n→∞ n→∞

Die Rechenregeln (a),(b) ergeben sich daraus mit Hilfe der Rechenregeln 4.4 für
starke Konvergenz; (c) ergibt sich aus dem Beweis 9.2 (b).
Zu zeigen bleibt (e); (d) folgt daraus mit g = 0.
Sei M := f − g∞ . Dann gilt

f ≤ g + M , g ≤ f + M in σ(T ) , also mit (c)

f (T ) ≤ g(T ) + M , g(T ) ≤ f (T ) + M .

Es folgt für u = 1

| u , (f (T ) − g(T ))u | = | u , f (T )u − u , g(T )u | ≤ M .

Wegen f (T ) ≥ 0, g(T ) ≥ 0 ist f (T ) − g(T ) symmetrisch. Aus 6.5 (c) folgt


  
f (T ) − g(T ) = sup | u , (f (T ) − g(T ))u |  u = 1 ≤ M. 2

9.4 Der erweiterte Funktionalkalkül für Multiplikatoren


(a) Für eine beschränkte reelle Folge a = (a1 , a2 , . . . ) und den Multiplikator

Ma : (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . )
594 § 21 Spektrum und Funktionalkalkül symmetrischer Operatoren

auf 2 ist f (Ma ) für f ∈ F gegeben durch

f (Ma ) : (x1 , x2 , . . .) −→ (f (a1 ) x1 , f (a2 ) x2 , . . . ) .

Beweis.
Sei f = lim fn mit einer absteigenden Folge beschränkter, stetiger Funktionen
Ê Ê
n→∞
fn : → + . Dann gilt 0 ≤ f (λ) ≤ f1 (λ) ≤ C mit einer Konstanten C, also
ist der Multiplikator

S : (x1 , x2 , . . . ) −→ (f (a1 ) x1 , f (a2 ) x2 , . . . )

beschränkt und positiv.


Zu zeigen ist S = s–lim fn (Ma ). Hierzu fixieren wir x = (x1 , x2 , . . . ) ∈ 2 . Sei
n→∞
ε > 0 vorgegeben und

C2 |xk |2 < ε2 .
k=N+1

Nach 7.6 gilt fn (Ma )x = (fn (a1 )x1 , fn (a2 )x2 , . . .), und nach Voraussetzung gilt
0 ≤ fn (ak ) − f (ak ) ≤ f1 (ak ) − f (ak ) ≤ C. Es folgt


N
fn (Ma )x − Sx2 < (fn (ak ) − f (ak ))2 |xk |2 + ε2 .
k=1

Nach Definition von f (Ma ) folgt wegen lim fn (ak ) = f (ak )


n→∞

f (Ma )x − Sx = lim fn (Ma )x − Sx ≤ ε für jedes ε > 0. 2


n→∞

(b) Beispiel. Für


a = (1, 12 , 13 , . . . ) und f = e0 = χ]−∞,0] ∈ F

gilt σ(Ma ) = {0, 1, 12 , 13 , . . . } nach 5.2. Wegen f (0) = 1 und f ( n1 ) = 0 ist f


nicht stetig auf σ(Ma ). Aus (a) ergibt sich f (Ma ) = 0. Also gilt

0 = f (Ma ) < f ∞ = 1 und σ(f (Ma )) = {0} = f (σ(Ma )) = {0, 1}.

In diesem Beispiel sind folgende Eigenschaften des Funktionalkalküls mit steti-


gen Funktionen verletzt:
– Injektivität der Einsetzungsabbildung f → f (T ),
– Normisomorphie f (T ) = f ∞ = max{|f (λ)| | λ ∈ σ(T )},
– spektraler Abbildungssatz f (σ(T )) = σ(f (T )).
9 Erweiterung des Funktionalkalküls 595

(c) Für den Multiplikator Mv : u → v · u auf L2 (Ω, μ) mit v ∈ L∞ (Ω, μ) gilt


f (Mv ) = Mf ◦v für alle f ∈ F .

Beweis.
Sei f = lim fn mit einer absteigenden Folge beschränkter, stetiger Funktionen
Ê Ê
n→∞
fn : → + . Wegen 0 ≤ f ≤ f1 und der Beschränktheit von f1 gilt dann
f ◦ v ∈ L∞ (Ω, μ). Aus 7.6 (b) entnehmen wir fn (Mv ) = Mfn ◦v . Aus
f1 ◦ v ≥ f2 ◦ v ≥ . . . ≥ 0 und f ◦ v = lim fn ◦ v
n→∞

folgt die Behauptung mit 4.6 (b). 2

(d) Beispiel. Sei v : [a, b] → Ê stetig und nicht konstant. Für den Multipli-
kator Mv auf L2 [a, b] ist σ(Mv ) der essentielle Wertebereich von v, vgl. 5.3.
Da v stetig ist und wir das Lebesgue–Maß zugrundegelegt haben, gilt ÜA
σ(Mv ) = v([a, b]) ,
also ist σ(Mv ) ein kompaktes Intervall mit nichtleerem Innern. Nach 9.1 gilt
eλ := χ]−∞,0] ∈ F .
Für Eλ := eλ (Mv ) erhalten wir aus (c)
Eλ = Meλ ◦v .
Für innere Punkte λ von σ(Mv ) gilt offenbar 0 = Eλ = ½, und wegen e2λ = eλ
ist Eλ ein nichttrivialer orthogonaler Projektor mit σ(Eλ ) = {0, 1}, vgl. 7.7 (d).
Damit haben wir einen beschränkten symmetrischen Operator T , für den der
erweiterte Funktionalkalkül aus der C*–Algebra C*(T ) hinausführt. Denn nach
7.4 (c) besteht C*(Mv ) aus allen Operatoren g(Mv ) mit g ∈ C(σ(Mv )), und nach
7.6 (b) ist g(Mv ) = Mg◦v wieder ein Multiplikator mit einer stetigen Funktion.
Dessen Spektrum ist aber nach den Ausführungen oben immer ein Intervall.
596 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

§ 22 Der Spektralsatz für beschränkte symmetrische


Operatoren

1 Spektralzerlegung und Spektralsatz


1.1 Die Spektralschar
Im folgenden sei T ein beschränkter symmetrischer Operator auf einem separab-
len Hilbertraum H . Gemäß § 21 : 9.1 definieren wir für λ ∈ Ê
Eλ := eλ (T ) mit eλ = χ]−∞,λ] .
Die hierdurch gegebene Spektralschar {Eλ | λ ∈ Ê} von T hat folgende Eigen-
schaften:
(a) Eλ ist ein orthogonaler Projektor für jedes λ ∈ Ê.
(b) Für λ ≤ μ gilt Eλ ≤ Eμ und Eλ Eμ = Eμ Eλ = Eλ .
(c) Die Spektralschar ist stark rechtsseitig stetig: Eλ = s–lim Eμ für λ ∈
μ→λ+
Ê.
(d) Eλ = 0 für λ < min σ(T ), Eλ = ½ für λ ≥ max σ(T ).

Bemerkung. Für λ ≤ μ ist Eμ − Eλ ein orthogonaler Projektor.

Beweis.
(a) Definitionsgemäß gilt Eλ ≥ 0 (§ 21 : 9.2). Aus e2λ = eλ folgt Eλ2 = Eλ
(§ 21 : 9.3 (b)). Also ist Eλ ein orthogonaler Projektor (§ 9 : 2.6).
(b) Für λ ≤ μ gilt eλ eμ = eλ und eλ ≤ eμ , somit Eλ Eμ = Eμ Eλ = Eλ und
Eλ ≤ Eμ nach § 21 : 9.3 (b), (c). Es folgt:
Für λ ≤ μ ist Eμ − Eλ ein orthogonaler Projektor, denn Eμ − Eλ ist symme-
trisch, und nach dem Vorangehenden gilt
(Eμ − Eλ )(Eμ − Eλ ) = Eμ2 − Eλ Eμ − Eμ Eλ + Eλ2
= Eμ − 2Eλ + Eλ = Eμ − Eλ .

(c) Die nebenstehend skizzierten ste-


tigen Funktionen fn ≥ 0 bilden eine
absteigende Folge mit
1
eλ = lim fn .
n→∞ fn
Nach § 21 : 9.2 gilt daher
Eλ = s–lim fn (T ) .
1 2
n→∞ λ λ+ n λ+ n

Für λ < μ < λ + ist Pμ := Eμ − Eλ


1
n
ein orthogonaler Projektor,
1 Spektralzerlegung und Spektralsatz 597

und wegen eλ ≤ eμ ≤ fn gilt Eλ ≤ Eμ ≤ fn (T ), also

0 ≤ Pμ ≤ fn (T ) − Eλ .
Es folgt

Pμ u2 = Pμ u , Pμ u = u , Pμ u ≤ u , (fn (T ) − Eλ )u .

Daher gilt Eμ u − Eλ u ≤ u fn (T )u − Eλ u für λ<μ<λ+ 1


n
.
(d) Für λ < min σ(T ) ergibt sich Eλ  ≤ sup {eλ (x) | x ∈ σ(T )} = 0 aus
§ 21 : 9.3 (d), und für λ ≥ max σ(T ) gilt nach § 21 : 9.3 (e)
  
½ − Eλ  ≤ sup 1 − eλ (x)  x ∈ σ(T ) = 0. 2

(e) Satz. An jeder Stelle λ ∈ Ê existiert der linksseitige starke Limes


Eλ− := s–lim Eμ ,
μ→λ−

und dieser ist ein mit der Spektralschar vertauschender orthogonaler Projektor.

Beweis.
Die Projektoren Pn = Eλ − Eλ−1/n bilden nach (b) eine absteigende Folge
positiver Operatoren. Nach dem Satz § 21 : 4.5 von der monotonen Konvergenz
existiert daher Pλ := s–lim Pn . Wir definieren
n→∞

Eλ− := Eλ − Pλ = s–lim Eλ−1/n .


n→∞

Dass Pλ und Eλ− orthogonale Projektoren sind, die mit allen Eν vertauschen,
ergibt sich aus § 21 : 4.7. Sei λ− n1 < μ < λ. Es ist leicht zu sehen, dass Eλ− −Eμ
ein orthogonaler Projektor ist. Wegen Eλ− − Eμ ≤ Eλ− − Eλ− 1 = Pn − Pλ
n
folgt
(Eλ− − Eμ )u2 = u , (Eλ− − Eμ )u ≤ u , (Pn − Pλ )u .
Da die rechte Seite eine Nullfolge ist, ergibt sich die Behauptung (e). 2

1.2 Spektralmaße
Für jeden Vektor u ∈ H mit u = 1 ist durch

F (λ) = u , Eλ u = Eλ u2

eine Verteilungsfunktion gegeben. Nach § 19 : 9.3 gibt es ein eindeutig bestimmtes


Wahrscheinlichkeitsmaß μu auf Ê
mit
μu (]a, b]) = F (b) − F (a) = u , (Eb − Ea )u = (Eb − Ea )u2 .
Wir nennen μu das zum Zustandsvektor u gehörige Spektralmaß für T . Es
Ê
gilt supp μu ⊂ σ(T ), d.h. \ σ(T ) ist eine μu –Nullmenge.
598 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Bemerkung. Aus Satz 1.1 (e) und § 19 : 9.2 erhalten wir

μu ([a, b]) = F (b) − F (a−) = u , (Eb − Ea− )u ,

μu ({λ}) = F (λ) − F (λ−) = u , (Eλ − Eλ− )u .

Beweis.
(a) Aus 1.1 folgt, dass F monoton wächst und dass F (λ) = 0 für λ < σ(T ),
F (λ) = 1 für λ ≥ σ(T ). Da aus starker Konvergenz von Operatoren die schwache
folgt, ist F rechtsseitig stetig. Also ist F eine Verteilungsfunktion und bestimmt
nach § 19 : 9.3 ein Wahrscheinlichkeitsmaß μu auf den Borelmengen in . Ê
Ê
(b) Ω = \ σ(T ) ist offen, also Vereinigung abzählbar vieler kompakter Inter-
valle [a, b] (Bd. 1, § 23 : 4.1). Für jedes solche Intervall gilt dist ([a, b] , σ(T )) > 0,
also gibt es ein c < a mit [c, b] ⊂ Ω. Dann ist eb (x) − ec (x) = 0 für x ∈ σ(T ),
also Eb − Ec = 0 und somit

μu ([a, b]) ≤ μu (]c, b]) = F (b) − F (c) = u , (Eb − Ec )u = 0 .

Daher ist Ω als abzählbare Vereinigung von μu –Nullmengen eine μu –Null-


menge. 2

1.3 Spektralzerlegung beschränkter symmetrischer Operatoren


(a) Für einen symmetrischen Operator T ∈ L (H ) mit σ(T ) ⊂ [a, b], eine auf
[a, b] stetige Funktion f und eine zu [a, b] passende Einteilung
Z = {x0 , . . . , xN } mit x0 < a < x1 < . . . < xN = b
definieren wir
δ(Z) := max{xk − xk−1 | k = 1, . . . , N }
und

N 
S(f, Z) := f (xk ) Exk − Exk−1 ;
k=1

dabei ist {Eλ | λ ∈ Ê} die Spektralschar von T .


(b) Spektralzerlegungssatz. Unter den Voraussetzungen und mit den Be-
zeichnungen (a) gilt im Sinne der Normkonvergenz
f (T ) = lim S(f, Zn )
n→∞

für jede Folge von Einteilungen Zn mit lim δ(Zn ) = 0. Wir schreiben hierfür
n→∞


b
f (T ) = f (λ) dEλ .
a
1 Spektralzerlegung und Spektralsatz 599

Insbesondere gilt
b
T = λ dEλ .
a

Beweis.
(i) Sei zunächst f ≥ 0. Wir dürfen annehmen, dass f auf ganz Ê
stetig und
beschränkt ist. Für jede Einteilung Z gemäß (a) gilt im Sinne von § 21 : 9.1, 9.2

S(f, Z) = g(T ) − h(T )


mit

N
g := f (xk ) exk ∈ F ,
k=1


N
h := f (xk ) exk−1 ∈ F ,
k=1

f +h ∈ F.

Aus § 21 : 9.3 (e) folgt

(1) f (T ) − S(f, Z) = (f + h)(T ) − g(T ) ≤ f + h − g∞ .

Dabei ist

(2) f (x)+h(x)−g(x) = f (x)−f (xk ) für xk−1 < x ≤ xk (k = 1, . . . , N ) .

Seien Zn Einteilungen mit δ(Zn ) → 0 und := sup{δ(Zn ) | n ∈ }. Da f auf 


[a − , b] gleichmäßig stetig ist, gibt es nach (1), (2) zu vorgegebenem ε > 0 ein
δ > 0 mit δ ≤ und f (T ) − S(f, Zn ) < ε, falls δ(Zn ) < δ.
(ii) Für komplexwertige stetige Funktionen f = u + iv wenden wir (i) auf u+ ,
u− , v+ , v− an und erhalten die Behauptung mit Hilfe der Dreiecksungleichung
ÜA . 2

1.4 Der Spektralsatz


(a) Satz. Sei T ∈ L (H ) symmetrisch und f ∈ C(σ(T )). Dann gilt

u , f (T ) u = f dμu
σ(T )

für jeden Vektor u ∈ H mit u = 1. Dabei ist μu das in 1.2 definierte Spek-
/u = E(μu ) und die Varianz
tralmaß. Insbesondere gilt für den Erwartungswert μ
V (μu )

/u = u , T u ,
E(μu ) = μ /u ) u .
V (μu ) = (T − μ
2
600 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Beweis.
Wir setzen f stetig auf Ê
fort. Die Art der Fortsetzung
 spielt dabei für f (T )
keine Rolle (§ 21 : 7.3); ebensowenig beeinflußt sie f dμu , da μu nach 1.2 auf
σ(T ) lebt. Sei σ(T ) ⊂ [a, b] und Z eine Einteilung der in 1.3 (a) beschriebenen
Art. Dann gilt für u = 1 und F (λ) = u , Eλ u

N  
u , S(f, Z) u = f (xk ) u , (Exk − Exk−1 ) u
k=1
(∗)
N
= f (xk ) (F (xk ) − F (xk−1 )) .
k=1

Die rechte Seite ist eine Riemann–Stieltjes Summe für


b
f dμu ,
a

vgl. § 20 : 6.2. Wir setzen in (∗) Zerlegungen Zn ein mit δ(Zn ) → 0 und erhalten
aus § 20 : 6.2 und 1.3 (aus Normkonvergenz folgt schwache)
b 
u , f (T ) u = lim u , S(f, Zn ) u = f dμu = f dμu .
n→∞
a σ(T )

Die Formeln für E(μu ) und V (μu ) ergeben sich für f (x) = x beziehungsweise
/u )2 .
für f (x) = (x − μ 2

(b) Ein Grundpostulat der Quantenmechanik (vgl. § 18 : 4). Für eine auf ein
quantenmechanisches System mit Systemhilbertraum H bezogene Observable
sei der Bereich der möglichen Messwerte beschränkt. Dann wird diese durch
einen beschränkten symmetrischen Operator T auf H dargestellt. Für jeden
Vektorzustand | u u | des Systems bilden die Beobachtungswerte der Obser-
vablen eine Zufallsgröße X mit Verteilung μu und Erwartungswert X /=μ /u =
u, T u .
Daraus ergibt sich folgende Deutung des Funktionalkalküls : Ist f : → Ê Ê
stetig, so hat die transformierte Zufallsgröße f (X) nach § 20 : 6.4 und nach (a)
den Erwartungswert

f dμu = u , f (T )u ,

wobei f (T ) symmetrisch ist. Nach § 21 : 3.6 (c) ist ein symmetrischer Operator
durch die zugehörige quadratische Form eindeutig bestimmt, d.h. eine quan-
tenmechanische Observable ist durch ihre Erwartungswerte in allen denkbaren
Vektorzuständen festgelegt. Somit beschreibt f (T ) diejenige Observable, die aus
der durch T beschriebenen Observablen durch die Messtransformation x → f (x)
hervorgeht.
Weitere Anmerkungen zur Quantenmechanik folgen in 1.6.
1 Spektralzerlegung und Spektralsatz 601

1.5 Spektrum und Wachstumsstellen der Spektralschar


Wir erinnern an die Definition von Eλ und Eλ− in 1.1.
Satz. Für die Spektralschar { Eλ | λ ∈ Ê} eines symmetrischen Operators
T ∈ L (H ) gilt:
(a) λ ∈ σ(T ) ⇐⇒ Eλ+ε − Eλ−ε = 0 für jedes ε > 0λ heißt dann eine
Wachstumsstelle der Spektralschar.
(b) λ ∈ σp (T ) ⇐⇒ Eλ − Eλ− = 0, d.h. λ ist eine Sprungstelle der Spek-
tralschar. Dann ist Qλ := Eλ − Eλ− der orthogonale
Projektor auf den Eigenraum Kern (T − λ).
(c) λ ∈ σc (T ) ⇐⇒ λ ist eine Stelle kontinuierlichen Wachstums der
Spektralschar, d.h. eine Wachstumsstelle, aber keine
Sprungstelle.

Beweis.
Grundlegend für das Folgende sind die Sachverhalte:
(1) μu (]λ − ε, λ + ε]) = u , (Eλ+ε − Eλ−ε )u für u = 1 , vgl. 1.2,
(2) σ(T ) = σapp (T ) , vgl. § 21 : 6.5, und

(3) T u − λu2 = (x − λ)2 dμu (x) für λ ∈ Ê, u = 1 .
Ê
Letzteres folgt aus dem Spektralsatz 1.4, da T − λ symmetrisch ist:
(T − λ) u , (T − λ) u = u , (T − λ)2 u = u , f (T ) u
mit f (x) = (x − λ) .
2

(a) Nach der Bemerkung 1.1 ist Pε := Eλ+ε −Eλ−ε ein orthogonaler Projektor.
Gibt es ein ε > 0 mit Pε = 0, so folgt aus (1) für u = 1
μu (]λ − ε, λ + ε]) = u , Pε u = 0 .
Daher gilt (x − λ)2 ≥ ε2 μu –f.ü., und aus (3) folgt
T u − λu2 ≥ ε2
für alle u ∈ H mit u = 1. Daher kann λ nicht zu σapp (T ) = σ(T ) gehören.
Im Fall Pε = 0 gibt es ein v ∈ H mit Pε v = 0. Für u := Pε v/Pε v gilt dann
u = 1, Pε u = u und somit nach (1)
(4) μu (]λ − ε, λ + ε]) = u , Pε u = u , u = 1 .
Daher gilt (x − λ)2 ≤ ε2 μu –f.ü., und aus (3) folgt
T u − λu2 ≤ ε2 .
602 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Gilt daher Pε = 0 für alle ε > 0, so finden wir zu ε = n1 jeweils einen Vektor
un ∈ H mit un  = 1 und T un − λun  ≤ n1 . Ist also λ eine Wachstumsstelle
der Spektralschar, so gilt λ ∈ σapp (T ).

(b) Sei Qλ := Eλ − Eλ− . Nach 1.1 (e) ist Qλ ein mit allen Eν vertauschender
orthogonaler Projektor. Für u = 1 ergibt (1) wegen der Stetigkeitseigenschaft
von μu (§ 19 : 6.3)
 
Qλ u2 = u , Qλ u = lim u , (Eλ − Eλ−1/n )u
n→∞

= lim μu (]λ − 1
n
, λ]) = μu ({λ}) .
n→∞

Für u = 1 gilt also


u ∈ Bild Qλ ⇐⇒ u = Qλ u
(5) ⇐⇒ μu ({λ}) = Qλ u2 = 1
⇐⇒ μu = δλ .
Aus μu = δλ folgt mit (3) und § 20 : 6.1 (a)
 
T u − λu2 = (x − λ)2 dμu = (x − λ)2 dδλ = 0 ,
Ê Ê
also T u = λu. Umgekehrt folgt aus T u = λu, u = 1 mit (3)

0 = (x − λ)2 dμu ,
Ê
also x = λ μu –f.ü. und damit μu = δλ , d.h. u ∈ Bild Qλ . 2

1.6 Spektrum und mögliche Messwerte


Eine beschränkte Observable sei durch einen symmetrischen Operator T auf ei-
nem Hilbertraum H dargestellt. Die Werteverteilung der Observablen im Vek-
torzustand | u u | ist nach 1.4 (b) durch μu gegeben.
Satz. (a) Genau dann fällt ein Wert λ als scharfer Messwert für T in einem
geeigneten Zustand | u u | an (d.h. μu = δλ ), wenn λ ein Eigenwert von T
und u ein zugehöriger Eigenvektor ist.
(b) Alle übrigen Spektralwerte λ lassen sich beliebig genau messen: Zu jedem
ε > 0 gibt es einen Zustandsvektor u mit
μu (]λ − ε, λ + ε]) = 1 ,
d.h. alle Beobachtungswerte für T im Zustand | u u | liegen in ]λ − ε, λ + ε].
(c) Ist λ ∈ σ(T ), so gibt es ein ε > 0, so dass für jeden Zustand | u u|
μu (]λ − ε, λ + ε]) = 0
gilt
2 Beispiele 603

Beweis.
(a) folgt unmittelbar aus dem Beweisteil (b) von 1.5, Gleichung (5).
(b) folgt aus 1.5 (a) und dem zugehörigen Beweis (Gleichung (4)).
(c) Für λ ∈ (T ) gibt es nach 1.5 (a) und dem zugehörigen Beweis ein ε > 0,
so dass μu (]λ − ε, λ + ε]) = 0 für jeden Zustandsvektor u. 2

(d) Die Aussage (b) lässt sich wie folgt verschärfen:


Das Spektrum von T ist die Menge der möglichen Messwerte für T im Sinne
von § 19 : 9.1 (b): Zu jedem λ ∈ σ(T ) gibt es einen Zustand mit zugehörigem
Spektralmaß μ, so dass

μ(]λ − ε, λ + ε]) > 0 für jedes ε > 0 .

Hierzu muss jedoch der allgemeine Zustandsbegriff zugrundegelegt werden, siehe


6.4. Der Beweis wird in § 25 : 4.4 gegeben.

2 Beispiele
2.1 Operatoren mit endlichem Spektrum
Hat ein symmetrischer Operator T ∈ L (H ) ein endliches Spektrum σ(T ) =
{λ1 , . . . , λm } mit λ1 < . . . < λm , so gilt nach § 21 : 7.7 für jede auf σ(T ) definierte
Funktion f
f (T ) = f (λ1 ) P1 + . . . + f (λm ) Pm ;
dabei ist Pk für k = 1, . . . , m der orthogonale Projektor auf den Eigenraum
Kern (T − λk ). Insbesondere ist die Spektralschar von T gegeben durch

Eλ = eλ (λ1 ) P1 + . . . + eλ (λm ) Pm = Pk .
λk ≤λ

Aus 1.6 (b) folgt



Eλ− = Pk .
λk <λ

Für u = 1 ist die Verteilungsfunktion des Spektralmaßes μu



F (λ) = u , Eλ u = u , Pk u ,
λk ≤λ

also gilt
 
μu (B) = u , Pk u = Pk u2
λk ∈B λk ∈B

für jede Borelmenge B, d.h. μu ist das diskrete Wahrscheinlichkeitsmaß



m
μu = Pk u2 δλk .
k=1
604 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

2.2 Orthogonale Projektoren und Ja/Nein–Experimente


Für einen orthogonalen Projektor P mit 0 = P = ½ gilt σ(P ) = {0, 1}. Der
Eigenraum zum Eigenwert 0 ist Kern P = Bild (1 − P ); der Eigenraum zum
Eigenwert 1 ist {u ∈ H | P u = u} = Bild P . Somit erhalten wir aus 2.1 für
u = 1

μu = u − P u2 δ0 + P u2 δ1 .

Dies ist eine Bernoulli–Verteilung mit Erfolgswahrscheinlichkeit P u2 ; das zu-


gehörige Ja/Nein–Experiment zielt auf die Frage P u = u ?“. Als Beispiel be-

Ê
trachten wir im Einteilchenhilbertraum H = L2 ( 3) den Orthogonalprojektor
P : u → u χΩ ; dabei ist Ω ein Raumgebiet. Die Frage Teilchen in Ω ?“ wird

mit Wahrscheinlichkeit

P u2 = |u|2 d3 V
Ω

bejaht.

2.3 Multiplikatoren in L2 (Ω, μ)


Die Spektralschar des Multiplikators Mv mit v ∈ L∞ (Ω, μ) ist nach § 21 : 9.4 (c)
gegeben durch

Eλ = eλ (Mv ) = Meλ ◦v ;

dabei ist eλ ◦ v die charakteristische Funktion der Menge {v ≤ λ}, vgl. § 20 : 3.1.
Sei u = 1. Die Verteilungsfunktion F des Spektralmaßes μu ergibt sich durch

F (λ) = u , Eλ u = u , eλ◦v u = |u|2 dμ .
{v≤λ}

Daher gilt für Intervalle I = ]a, b]



(1) μu (I) = |u|2 dμ .
v −1 (I)

Auf den μ–messbaren Mengen A ⊂ Ω ist durch ν(A) := |u|2 dμ ein Wahr-
A
scheinlichkeitsmaß gegeben; wir bezeichnen es mit ν = |u|2 μ. Aus (1) folgt nach
dem Fortsetzungssatz von Carathéodory (§ 19 : 7.2):

μu ist das Bildmaß von ν = |u|2 μ unter v ,

vgl. § 20 : 6.4. Für f ∈ C(σ(Mv )) gilt nach dem Spektralsatz unter Beachtung
von f (Mv ) = Mf ◦v
  
(2) u , f (Mv )u L2 = f ◦ v |u|2 dμ = f ◦ v dν = f dμu .
Ω Ω σ(Mv )
3 Diagonalisierung beschränkter symmetrischer Operatoren 605

Da nach § 21 : 5.3 angenommen werden darf, dass v(Ω) ⊂ σ(Mv ) gilt, wobei
σ(Mv ) \ v(Ω) eine μ–Nullmenge ist ÜA , folgt aus (2)
 
f ◦ v dν = f dμu .
Ω v(Ω)

Dies entspricht der Aussage des Transformationssatzes für Bildmaße § 20 : 6.4 (b).

3 Diagonalisierung beschränkter symmetrischer Operatoren


3.1 Nichtentartete Spektren und zyklische Vektoren
(a) Charakterisierung nichtentarteter Spektren in endlichdimensionalen Hil-
berträumen. Für einen symmetrischen Operator T auf einem n–dimensionalen
Hilbertraum H gilt nach § 21 : 7.7
(1) T = λ1 P1 + . . . + λm Pm ;
dabei sind λ1 < . . . < λm die verschiedenen Eigenwerte von T und Pk die
orthogonalen Projektoren auf die Eigenräume Kern (T − λk ) für k = 1, . . . , m.
Ferner gilt für Polynome p und für a ∈ H nach § 21 : 7.7
(2) p(T )a = p(λ1 ) P1 a + . . . + p(λm ) Pm a ∈ Span {P1 a, . . . , Pm a} .
Das Spektrum von T heißt nichtentartet, wenn m = n gilt, d.h. wenn alle
Eigenwerte von T einfach und die zugehörigen Eigenräume eindimensional sind.
Aus (2) erhalten wir im Fall dim H < ∞ das folgende Kriterium:

Satz. Genau dann ist σ(T ) nichtentartet, wenn es ein a ∈ H gibt mit
{ p(T ) a | p Polynom } = H .

Beweis.
Ist σ(T ) entartet, also m < n, so folgt aus (2) für jeden Vektor a ∈ H die
Ungleichung dim{p(T ) a | p Polynom} ≤ m < n .
Ist σ(T ) nichtentartet, so gibt es eine Orthonormalbasis (v1 , . . . , vn ) für H
mit T vk = λk vk (k = 1, . . . , n), wobei λ1 < . . . < λn . Wir setzen a :=
v1 + . . . + vn . Wegen Pk a = vk , a vk = vk folgt aus (2)
p(T )a = p(λ1 ) v1 + . . . + p(λn ) vn .
Für einen beliebigen Vektor u = x1 v1 + . . . + xn vn ∈ H sei p das Inter-
polationspolynom mit p(λ1 ) = x1 , . . . , p(λn ) = xn . Dann gilt p(T ) a = u.
2

(b) Multiplikatoren in 2 . Für eine beschränkte reelle Folge λ = (λ1 , λ2 , . . .)


betrachten wir den Multiplikator
Mλ : (x1 , x2 , . . . ) −→ (λ1 x1 , λ2 x2 , . . . )
in  . Das Spektrum von Mλ heißt nichtentartet, wenn λm = λn für m = n.
2
606 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Satz. Genau dann ist σ(Mλ ) nichtentartet, wenn es ein a ∈ 2 gibt mit

Z(a) := { p(Mλ ) a | p Polynom } = 2 .

Beweis.
Nach § 21 : 7.6 (a) gilt für Polynome p und für a = (a1 , a2 , . . . ) ∈ 2

(∗) p(Mλ )a = (p(λ1 )a1 , p(λ2 )a2 , . . . ) .

(i) Sei Z(a) = 2 . Dann kann keine Koordinate von a Null sein, denn im Fall
an = 0 ist en ⊥ p(T )a für jedes Polynom p. Ferner muss λm = λn für n = m
gelten, denn andernfalls ist p(λm ) = p(λn ) und somit an em − am en ein zu Z(a)
orthogonaler Vektor. Also ist σ(Mλ ) nichtentartet.
(ii) Ist σ(Mλ ) nichtentartet und a = (a1 , a2 , . . .) ∈ 2 ein beliebiger Vektor
mit nichtverschwindenden Koordinaten, so gilt Z(a) = 2 . Denn zu gegebenem
Einheitsvektor em gibt es für jedes n ≥ m ein Interpolationspolynom p = pn
mit
1
p(λm ) = , p(λk ) = 0 für k ≤ n , k = m .
am
Aus (∗) folgt mit p∞ = sup { | p(λk ) | | k = 1, 2, . . .}


∞ 

p(Ma ) a − em 2 = | p(λk ) |2 | ak |2 ≤ p2∞ |ak |2 → 0
k=n+1 k=n+1

für n → ∞. Somit gilt em ∈ Z(a) für m = 1, 2, . . . . Es folgt 2 = Z(a), da


20 = Span {e1 , e2 , . . .} dicht in 2 ist. 2

(c) Definition. Es sei T ∈ L (H ) ein symmetrischer Operator. Ein Vektor


a ∈ H heißt zyklischer Vektor für T , wenn {a, T a, T 2 a, . . .} eine in H dichte
Menge ist, d.h. wenn

{p(T )a | p Polynom} = H .

Das Spektrum von T heißt nichtentartet, wenn es einen zyklischen Vektor für
T gibt.

(d) Beispiele. (i) Der Multiplikator Mx := Mv mit v(x) = x auf L2 [−1, 1]


hat ein nichtentartetes Spektrum: Nach § 21 : 3.6 (b) gilt

p(Mx ) = Mp für Polynome p.

Für die konstante Funktion a = 1 ist also Mp a = p. Da die Polynome dicht in


L2 [−1, 1] liegen, ist a ein zyklischer Vektor für Mx .
3 Diagonalisierung beschränkter symmetrischer Operatoren 607

(ii) Das Spektrum des Multiplikators Mx2 ist dagegen entartet. Zum Nachweis
betrachten wir den durch (Su)(x) = u(−x) gegebenen unitären Operator S
auf L2 [−1, 1]. Wegen SMx2 = Mx2 S und S 2 = S gilt Sp(Mx2 )S = Sp(Mx2 )
für jedes Polynom p. Angenommen, es gibt einen zyklischen Vektor a für Mx2 .
Dann gilt für u ∈ L2 [−1, 1] und jedes Polynom p

 p(Mx2 ) a − u  =  Sp(Mx2 )Sa − Su  =  p(Mx2 )Sa − u  .

Mit Hilfe der Dreiecksungleichung folgt, dass 12 (a + Sa) ebenfalls ein zyklischer
Vektor ist. Wir dürfen also gleich annehmen, dass a gerade ist: Sa = a. Wählen
wir nun u(x) := xa(x), so kann es keine Polynomfolge (pn ) geben mit
1
 pn (Mx2 ) a − u 2 = | pn (x2 ) − x |2 | a(x) |2 dx → 0 für n → ∞
−1

im Widerspruch dazu, dass a zyklisch sein sollte.

3.2 Multiplikatordarstellung bei nichtentartetem Spektrum


Der symmetrische Operator T ∈ L (H ) besitze einen zyklischen Vektor a mit
a = 1, und μ = μa sei das zu a gehörige Spektralmaß. Dann gibt es eine
unitäre Abbildung
U : H → L2 (σ(T ), μ)
T
mit H - H
−1
T = U Mx U .
U 6 −1
U
Dabei ist Mx der Multiplikator Mv mit
v(x) = x. ?
Dieses Ergebnis ist eine Verallgemeine- L2 (σ, μ) - L2 (σ, μ)
rung der Diagonalisierbarkeit symme- Mx
trischer Matrizen, vgl. die Bemerkung
in § 21 : 2.7.

Beweis.
(a) Konstruktion der unitären Abbildung U : H → L2 := L2 (σ(T ), μ) mit
μ = μa . Wir bezeichnen im Folgenden die Norm in L2 mit  2 . Für Polynome
p gilt nach dem Spektralsatz und nach § 21 : 7.1 (c)
    
(∗) p(T ) a2 = a , p(T ) p(T ) a = a , |p|2 (T ) a = |p|2 dμ ,
σ(T )

d.h.  p(T ) a  = p2 .


Sei u ∈ H vorgegeben. Da a ein zyklischer Vektor ist, gibt es Polynome pn mit
pn (T )a − u → 0 für u → ∞. Insbesondere ist (pn (T )a) eine Cauchy–Folge
in H . Nach (∗) ist (pn ) eine Cauchy–Folge in L2 , also gibt es ein f ∈ L2 mit
608 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

pn − f 2 → 0. Für jede andere Polynomfolge (qn ) mit qn (T )a − u → 0 folgt


aus (∗) pn − qn 2 = pn (T )a − qn (T )a → 0 für n → ∞. Also ist f durch u
eindeutig bestimmt. Wir definieren

U u := L2 -lim pn , falls pn (T )a → u .
n→∞

Es gilt U u2 = lim pn 2 = lim pn (T )a = u wegen der Stetigkeit der
n→∞ n→∞
Normen. Offenbar ist U a = 1. Die Linearität von U ist leicht einzusehen ÜA .

(b) U ist surjektiv. Sei g ∈ L2 . Nach § 20 : 8.5 (c) gibt es Polynome qn mit
g = L2 -lim qn . Nach (∗) existiert w := lim qn (T )a, und nach Konstruktion
n→∞ n→∞
von U ist dann U w = g.

(c) Darstellung von T . Für jedes Polynom p gilt T p(T ) = p(T ) T = q(T )
mit q(x) = x p(x). Sei u = lim pn (T ) a mit Polynomen pn . Da T stetig ist, gilt
n→∞

T u = lim T pn (T ) a = lim qn (T ) a mit qn (x) = x pn (x) .


n→∞ n→∞

Daher ist U T u = L2 -lim qn . Für f := L2 -lim pn gilt


n→∞ n→∞

 
| Mx f − qn |2 dμ = x2 | f (x) − pn (x) |2 dμ(x) ≤ T 2 f − pn 22
σ(T ) σ(T )

 
wegen σ(T ) ∈ −T , T  . Es folgt

U T u = L2 -lim qn = Mx f = Mx U u ,
n→∞

also T u = U −1 Mx U u. 2

3.3 Zyklische Teilräume und Teildarstellungen


(a) Für einen symmetrischen Operator T ∈ L (H ) und für 0 = a ∈ H heißt

Z(a) := {a, T a, T 2 a, . . .} = { p(T ) a | p Polynom }

der von a erzeugte zyklische Teilraum für T .


Z(a) und der Orthogonalraum Z(a)⊥ sind T –invariant.
Das Erste folgt aus der Stetigkeit von T ÜA , das Zweite aus der Symmetrie
von T , denn allgemein gilt:
Ist T ∈ L (H ) symmetrisch und V ein T –invarianter Teilraum von H , so ist
V ⊥ ein abgeschlossener T –invarianter Teilraum ÜA .
3 Diagonalisierung beschränkter symmetrischer Operatoren 609

(b) Für die Einschränkung T0 von T auf H 0 := Z(a) mit a = 1 ist a ein
zyklischer Vektor. Da T0 symmetrisch ist, gilt ÜA

σ(T0 ) = σapp (T0 ) ⊂ σapp (T ) = σ(T ) .

Daher gibt es nach 3.2 ein auf σ(T ) lebendes Wahrscheinlichkeitsmaß μ0 und
Ê
eine unitäre Abbildung U0 : H 0 → L2 ( , μ0 ) mit

T0 = U0−1 Mx U0 .

(c) Hat T ein entartetes Spektrum, so zerlegen wir H in mehrere zyklische


Teilräume. Um die gemäß (b) zugehörigen Teildarstellungen voneinander zu
trennen, führen wir Translationen im Argument nach folgendem Muster durch:
Für ein auf σ(T ) lebendes Wahrscheinlichkeitsmaß μ0 und für τ = 0 setzen wir

μ(B) := μ0 (B − τ ) für B ∈ B .

Dann ist μ ein auf S := σ(T ) + τ lebendes Wahrscheinlichkeitsmaß, deswei-


Ê Ê
teren ist L2 ( , μ) ist unitär isomorph zu L2 ( , μ0 ): Ordnen wir der Funk-
Ê
tion f ∈ L2 ( , μ0 ) die durch
 2 g(x) :=  f (x − τ ) gegebene Funktion g zu,
Ê
so gilt g ∈ L2 ( , μ) und |g| dμ = |f |2 dμ0 . Dies gilt offenbar zunächst
Ê Ê
für g = χB ÜA , damit für Elementarfunktionen und dann auch allgemein,
da die Elementarfunktionen nach § 20 : 8.2 dicht im L2 liegen. Jeder Funktion
Ê
Mx f ∈ L2 ( , μ0 ) wird dabei die Funktion x → (x − τ )g(x) zugeordnet.
Somit vermittelt (U f )(x) = f (x − τ ) für f ∈ H 0 = L2 (σ(T ), μ0 ) eine unitäre
Abbildung

U : H 0 → L2 (S, μ) mit Mx = U −1 Mv U, wobei v(x) = x − τ .

3.4 Multiplikatordarstellung bei einfach entartetem Spektrum


(a) Das Spektrum eines symmetrischen Operators T ∈ L (H ) heißt einfach
entartet, wenn es Vektoren a1 , a2 ∈ H gibt mit a1  = a2  = 1 und

H = Z(a1 ) ⊕ Z(a2 ) , Z(a2 ) ⊥ Z(a1 ) .

(b) Satz. Hat ein symmetrischer Ope-


rator T ∈ L (H ) ein einfach entar-
tetes Spektrum, so gibt es ein Wahr-
Ê
scheinlichkeitsmaß μ auf , eine Zick-
σ(T ) σ(T ) + τ
zackfunktion v der nebenstehend skiz-
zierten Art und eine unitäre Abbildung
Ê
U : H → L2 ( , μ) mit
−1
T = U Mv U .
610 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Beweis.
Im Fall T = 0 ist nach Voraussetzung dim H = 2 ÜA , also H isomorph zu
Ê
L2 ( , μ) mit μ := 12 (δ0 + δ1 ). Sei also T = 0, c := T  > 0 und τ := 4c.
Nach 3.3 sind H 1 := Z(a1 ) und H 2 := Z(a2 ) abgeschlossene T –invariante
Teilräume von H .
Für k = 1, 2 bezeichnen wir mit Tk die Einschränkungen von T auf H k . Ferner
seien S1 = σ(T ), S2 = σ(T ) + τ . Dann gilt S1 ∩ S2 = ∅. Nach 3.3 gibt es für
k = 1, 2 Wahrscheinlichkeitsmaße μk mit Träger in Sk und unitäre Abbildungen
Ê
Uk : H k → L2 ( , μk ), so dass

Tk = Uk−1 Mv Uk ,

wobei v die oben eingeführte Zackenfunktion ist.


Das Wahrscheinlichkeitsmaß μ := 12 (μ1 +μ2 ) lebt auf S1 ∪S2 , und jede Funktion
Ê
f ∈ L2 ( , μ) lässt sich in der Form

f = f1 + f2 mit Ê
fk = f χSk ∈ L2 ( , μk ) = L2 (Sk , μk )

darstellen, dabei ist


   
(∗) |f |2 dμ = 1
|f1 |2 dμ1 + 1
|f2 |2 dμ2 , f 1 f2 dμ = 0 .
Ê Ê
2 2
S1 S2

Ê Ê
Umgekehrt: Für f1 ∈ L2 ( , μ1 ), f2 ∈ L2 ( , μ2 ) ist f = f1 + f2 ∈ L2 ( , μ), und Ê
es gelten die Gleichungen (∗), denn fk = fk χSk μk –f.ü.
Für u ∈ H gibt es nach dem Zerlegungssatz eindeutig bestimmte Vektoren
u1 , u2 mit
u = u1 + u2 , u1 ∈ H 1 , u2 ∈ H 2 .

Dabei gilt u2 = u1 2 + u2 2 . Setzen wir daher


√ √
U u := 2 U1 u1 + 2 U2 u2

Ê
so ist U : H → L2 ( , μ) unitär:

Für f1 := U1 u1 , f2 := U2 u2 , f := f1 + f2 gilt also U u = 2f und
 
u2 = u1 2 + u2 2 = |f1 |2 dμ1 + |f2 |2 dμ2
Ê Ê
(∗) 
= 2 |f |2 dμ = U u2 .
Ê
Ferner ist T u = T1 u1 + T2 u2 , also
√ √ √
U T u = 2(U1 T1 u1 + U2 T2 u2 ) = 2 v (f1 + f2 ) = v 2f = v U u. 2
3 Diagonalisierung beschränkter symmetrischer Operatoren 611

3.5 Direkte Summen in H und direkte Zerlegung von H


(a) Satz. Seien H 1 , H 2 , . . . abgeschlossene, paarweise zueinander orthogo-
nale Teilräume von H ( dim H = ∞) und P1 , P2 , . . . die zugehörigen orthogo-
nalen Projektoren. Dann konvergiert für jeden Vektor u ∈ H die Reihe


P u := Pk u
k=1

und liefert einen orthogonalen Projektor P . Für den abgeschlossenen Teilraum


V = Bild P gilt


v ∈ V ⇐⇒ v2 = Pk v2 .
k=1

Jeder Vektor v ∈ V besitzt eine eindeutig bestimmte Zerlegung




v = vk mit vk ∈ H k (k = 1, 2, . . .) ;
k=1

diese ist gegeben durch vk = Pk v für k = 1, 2, . . . .


V heißt die direkte Summe der H k , bezeichnet mit
?

V = Hk.
k=1

Gilt H k = {0} für k > N , so schreiben wir V = H 1 ⊕ · · · ⊕ H N .


Im wichtigsten Fall V = H ergibt sich eine direkte Zerlegung von H :
?

H = Hk bzw. H = H1 ⊕ ··· ⊕ HN .
k=1

Beweis.
Durch Ausmultiplizieren ergeben sich wegen u , Pk u = Pk u , u = Pk u2
und wegen Pk u ⊥ P u für k =  die Gleichungen
 
n 2 
n
(1)  u− Pk u  = u2 − Pk u2 ,
k=1 k=1
 
m 2 
m
(2)  Pk u  = Pk u2 .
k=n+1 k=n+1



Aus (1) folgt Pk u2 ≤ u2 , aus (2) dann die Konvergenz der Reihe
k=1


P u := Pk u für alle u ∈ H .
k=1

P ist symmetrisch als starker Limes symmetrischer Operatoren; außerdem gilt



n
2 
n
P 2 = P wegen Pk = Pk . Also ist P der orthogonale Projektor auf
k=1 k=1
einen abgeschlossenen Teilraum V . Aus (1) folgt
612 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren


∞ 

v∈V ⇐⇒ v = P v ⇐⇒ v = Pk v ⇐⇒ v2 = Pk v2 ,
k=1 k=1

insbesondere die Existenz von Vektoren vk ∈ H k , (k = 1, 2, . . . ) mit




(3) v = vk .
k=1

Umgekehrt folgt für v ∈ V aus dem Bestehen einer Zerlegung (3), dass


Pi v = Pi vk = Pi vi = vi (i = 1, 2, . . .) . 2
k=1

(b) Satz. Zu jedem symmetrischen Operator T ∈ L (H ) gibt es eine direkte


Zerlegung von H in höchstens abzählbar viele zyklische Teilräume für T .

Beweis.
Da H separabel ist, gibt es eine abzählbare Menge M = {u1 , u2 , . . . } mit
M = H , ui = uj für i = j und u1 = 0 . Wir setzen

a1 := u1 −1 u1 und H 1 := Z(a1 ) .

Im Fall M ⊂ H 1 gilt H = M ⊂ H 1 = H 1 . Andernfalls existiert

m1 = min { k ∈ |u k ∈ H 1 } .

Mit dem orthogonalen Projektor P1 auf H 1 definieren wir

a2 := um1 − P1 um1 −1 (um1 − P1 um1 ) und H 2 := Z(a2 ) .

Dann gilt a2 ⊥ H 1 , und daher H 2 ⊥ H 1 :


Für h1 ∈ H 1 h2 ∈ H 2 gibt es es Polynome pn mit h2 = lim pn (T ) a2 . Da
n→∞
H 1 nach 3.3 T –invariant ist, gilt

h1 , h2 = lim h1 , pn (T )a2 = lim pn (T )h1 , a2 = 0


n→∞ n→∞

wegen pn (T ) h1 ∈ H 1 .
Im Fall M ⊂ H 1 ⊕ H 2 gilt H = M ⊂ H 1 ⊕ H 2 = H 1 ⊕ H 2 . Andernfalls
betrachten wir den orthogonalen Projektor Q = P1 + P2 auf H 1 ⊕ H 2 und

setzen m2 := min { k ∈ | uk ∈ H 1 ⊕ H 2 },

a3 := um2 − Qum2 −1 (um2 − Qum2 ) , H 3 := Z(a3 ) .

Wie oben folgt H 3 ⊥ H 1 ⊕ H 2 , also H 3 ⊥ H 1 , H 2 ÜA .


So fahren wir fort. Bricht das Verfahren nicht ab, so betrachten wir V :=
?
∞ ?
n
H k . Nach Konstruktion gilt un ∈ H k , also M ⊂ V . Es folgt
k=1 k=1
H = M ⊂ V = V. 2
3 Diagonalisierung beschränkter symmetrischer Operatoren 613

3.6 Die Multiplikatordarstellung im allgemeinen Fall


Satz. Zu jedem symmetrischen Operator T ∈ L (H ) gibt es
Ê → [ − T  , T  ] ,
eine stetige, periodische Funktion v :
ein Wahrscheinlichkeitsmaß μ auf Ê und
eine unitäre Abbildung U : H → L (Ê, μ) mit
2

T = U −1 Mv U .

Beweis.
Ê
Im Fall T = 0 wählen wir ein Wahrscheinlichkeitsmaß μ, für welches L2 ( , μ)
isomorph zu H ist (z.B. eine diskrete Verteilung)und setzen v := 0.
Sei also T = 0, c := T  und τ := 4c. Wir setzen die durch

v(x) := c − | c − x | für − c ≤ x ≤ 3c

definierte Funktion zu einer τ –periodischen Funktion fort:

−c c 4c 8c x

Nach 3.5 (b) gibt es eine direkte Zerlegung von H in zyklische Teilräume für
T:
@
N
@

H = Z(ak ) oder H = Z(ak ) .


k=1 k=1
Wir betrachten nur den zweiten Fall; bei endlich vielen direkten Summanden
verläuft die Argumentation ähnlich, vgl. 3.4.
Wir verschaffen uns abzählbar viele Kopien Sk = σ(T )+τ (k −1) des Spektrums
von T (in der Figur durch fette Striche bzw. Punkte angedeutet). Nach 3.3 gibt
es für k = 1, 2, . . . auf Sk lebende Wahrscheinlichkeitsmaße μk und unitäre
Ê
Abbildungen Uk : Z(ak ) → L2 ( , μk ), so dass die Einschränkungen Tk von T
auf Z(ak ) dargestellt werden können durch

Tk = Uk−1 Mv Uk .
614 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren



Nun setzen wir μ := 2−k μk . Wie in 3.4 erhalten wir
k=1


Ê Ê

f ∈ L2 ( , μ) ⇐⇒ f = fk mit fk ∈ L2 ( , μk ) ,
k=1

wobei jeweils fk (x) = 0 außerhalb von Sk gilt, so dass die Reihe für jedes x ∈ Ê
höchstens ein von Null verschiedenes Glied besitzt. Es gilt dann
 
∞ 
|f |2 dμ = 2−k |fk |2 dμk .
Ê k=1 Ê


Für u = uk mit uk ∈ Z(ak ) definieren wir f := U u durch
k=1


Æ) .

f = fk mit fk := 2k/2 gk , gk = Uk uk (k ∈
k=1

Ê
Nach dem oben Gesagten ist U : H → L2 ( , μ) surjektiv. Die Isometrie von
U und die Behauptung T = U −1 Mv U ergeben sich wie in 3.4. 2

3.7 Der Funktionalkalkül für beschränkte messbare Funktionen


(a) Unitär äquivalente Operatoren. Zwei Operatoren T ∈ L (H ) und
S ∈ L (H  ) werden unitär äquivalent genannt, wenn es eine unitäre Abbildung
U : H → H  gibt mit
T = U −1 S U .

Sei dies der Fall. Da unter unitären Abbildungen die lineare Struktur sowie
Normen und Skalarprodukte unverändert bleiben, ergibt sich

T  = S , T ∗ = U −1 S ∗ U , T ≥ 0 ⇐⇒ S ≥ 0 ,

σ(T ) = σ(S) , σapp (T ) = σapp (S) , σp (T ) = σp (S) , σc (T ) = σc (S) .

Ferner gilt T 2 = U −1 SU U −1 S U = U −1 S 2 U und entsprechend

T k = U −1 S k U für k ∈ Æ 0 .

Falls S, T symmetrisch sind, folgt daraus

f (T ) = U −1 f (S) U

zunächst für Polynome f und daher wegen der Konvergenztreue von U, U −1


auch für f ∈ F. Insbesondere gilt für die Spektralscharen {Eλ (T ) | λ ∈ } von Ê
Ê
T , {Eλ (S) | λ ∈ } von S,

Eλ (T ) = U −1 Eλ (S) U .
3 Diagonalisierung beschränkter symmetrischer Operatoren 615

Für u = 1 und u := U u folgt die Gleichheit der Spektralmaße μu bezüglich


T und νu bezüglich S.

(b) Satz. Es sei T ∈ L (H ) ein symmetrischer Operator mit einer Multipli-


katordarstellung

T = U −1 Mv U ,

Ê
wobei U : H → L2 ( , μ) eine unitäre Abbildung, μ ein Wahrscheinlichkeits-
maß auf Ê Ê
und und v : → σ(T ) eine stetige Funktion ist.
Dann ist für jede messbare, auf σ(T ) stetige Funktion f : → durch Ê
f (T ) := U −1 Mf ◦v U

ein Operator f (T ) ∈ L (H ) definiert, d.h. für jede Multiplikatordarstellung der


oben beschriebenen Art ergibt sich derselbe Operator.
f (T ) ist schwacher Limes von Operatoren aus der von T erzeugten C*–Algebra
C*(T ).

Beweis.
(i) Für u ∈ H mit u = 1 sei w := U u ∈ L2 (, μ). Dann folgt aus
dem Spektralsatz 1.4 und den Folgerungen 2.3 für Multiplikatoren nach den
Überlegungen in (a)
 
(∗) u , g(T )u H = g μu = (g ◦ v) |w|2 dμ = Uu , g(Mv )U u L2
Ê Ê
für jede auf σ(T ) stetige Funktion g.
(ii) Es genügt, reellwertige, auf σ(T ) beschränkte Funktionen f zu betrachten.
Für solche ist f ◦ v beschränkt und reellwertig. Der Operator F := U −1 Mf ◦v U
ist daher nach (a) ebenso wie Mf ◦v beschränkt und symmetrisch.

Da f μu –integrierbar
 ist, gibt es nach § 20 : 8.5 (b) stetige Funktionen gn mit
f dμu = lim gn dμu . Aus (∗) folgt, dass die Operatoren gn (T ) ∈ C*(T )
Ê n→∞
Ê
schwach gegen einen Operator S ∈ L (H ) konvergieren, für welchen gilt
 
u , Su = lim u , gn (T )u = lim gn dμ = f dμu
n→∞ n→∞
Ê Ê

= (f ◦ v) |w|2 dμ = w , Mf ◦v w L2 .
Ê
Da ein symmetrische Operator F nach § 21 : 3.6 (c) durch seine quadratische
Form festgelegt ist, folgt S := U −1 Mf ◦v U = F , wobei S nur von f und T ,
nicht aber von der Multiplikatordarstellung abhängt. 2
616 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

3.8 Vertauschbarkeit beschränkter symmetrischer Operatoren


(a) Satz (v. Neumann). Sind zwei symmetrische Operatoren S, T ∈ L (H )
vertauschbar (ST = T S), so gibt es einen symmetrischen Operator A ∈ L (H )
und beschränkte messbare Funktionen g, h : → Ê Ê mit
S = g(A) , T = h(A) ,
Hat T zusätzlich ein nichtentartetes Spektrum, so gibt es eine beschränkte messba-
re Funktion f mit
S = f (T ) .

Beachten Sie die Bemerkungen 1.4 (b) zur physikalischen Interpretation.


Den komplizierten Beweis der ersten Aussage finden Sie in Riesz–Nagy [131],
Abschnitt 130. Auf dem verbandstheoretischen Zugang zur Quantenmechanik
basiert ein kürzerer Beweis von Varadarajan, vgl. Jauch [136] 6–7.
Relativ einfach ist der Beweis der zweiten Behauptung:
Nach 3.2 und den Bemerkungen 3.7 (a) dürfen wir annehmen, dass
Ê
T = Mx auf L2 ( , μ) ,
wobei μ das zur konstanten Funktion a = 1 gehörige Spektralmaß für Mx ist,
siehe Beweis zu 3.2 (a). Vertauscht S mit T und setzen wir
v = ½, f = Sa,
so ergibt sich der Reihe nach
Sv = ST a = T Sa = vf ,
Sv 2 = ST 2 a = T 2 Sa = v 2 f ,
allgemein Sv n = v nf und daher Sp = pf für alle Polynome p. Da die Polynome
gleichmäßig dicht in C(σ(T )) liegen und C(σ(T )) eine dichte Teilmenge von
L2 (Ê, μ) ist, gibt es zu jedem u ∈ L2 (Ê, μ) ein Folge von Polynomen pn mit
pn → u und Spn = pn f → Su für n → ∞ .
Nach § 20 : 7.2 gibt es eine wieder mit (pn ) bezeichnete Teilfolge dieser Polynom-
folge, die μ–f.ü. konvergiert. Daher gilt
(Su)(x) = lim pn (x) f (x) = u(x) f (x) μ–f.ü.
n→∞

Es folgt
Su = f u = Mf u = Mf ◦v u = f (T )u
für alle u ∈ L2 (Ê, μ) und nach § 21 : 2.7 daher f ∈ L∞ (Ê, μ). 2
4 Spektralzerlegung kompakter symmetrischer Operatoren 617

(b) Für symmetrische Operatoren S, T ∈ L (H ) heißt


[S, T ] := ST − T S
der Kommutator. Für einen Zustandsvektor u ∈ H (u = 1) seien
Eu (S) = u , Su , Eu (T ) = u , T u
die Erwartungswerte bezüglich S, T ; die zugehörigen Varianzen seien
Vu (S) = (S − Eu (S))u2 , Vu (T ) = (T − Eu (T ))u2 .
Dann gilt folgende Unschärferelation:
 
Vu (S) Vu (T ) ≥ 1  u , [S, T ] u 2 .
4

Beweis als ÜA : Betrachten Sie zur Vereinfachung der Rechnung die Operato-
ren
A := S − Eu (S) , B := T − Eu (T )
und bestimmen Sie zunächst Eu (A), Eu (B), Vu (A), Vu (B).

Bemerkung. Auf den ersten Blick scheint hiermit die Heisenbergsche Unschärfe-
relation bewiesen. Es zeigt sich aber, dass die kanonische Vertauschungsrelation
[S, T ] = − i h̄ nicht durch beschränkte symmetrische Operatoren S, T erfüllt
werden kann (§ 23 : 1.2). Die Rechnung war dennoch nicht umsonst; sie lässt sich
ohne weiteres auf unbeschränkte selbstadjungierte Operatoren wie z.B. Orts–
und Impulsoperator übertragen.

4 Spektralzerlegung kompakter symmetrischer Operatoren


4.1 Kompakte Operatoren
(a) Ein linearer Operator T : H → H heißt kompakt (vollstetig), wenn
es zu jeder beschränkten Folge (un ) eine Teilfolge (unk )k gibt, für welche die
Bildfolge (T unk ) konvergiert. Dies ist gleichbedeutend damit, dass es zu jeder
beschränkten Menge B ⊂ H eine kompakte Menge K ⊂ H gibt mit T (B) ⊂ K
ÜA .

Kompakte Operatoren sind beschränkt ÜA .

(b) Operatoren endlichen Rangs, d.h. Operatoren T ∈ L (H ) mit end-


lichdimensionalem Bildraum sind kompakt.
Denn für un  ≤ C gilt T un ∈ {w ∈ Bild T | w ≤ T  C} =: K. Wegen
dim Bild T < ∞ ist K kompakt, vgl. § 21 : 2.8. Somit enthält die Bildfolge (T un )
eine konvergente Teilfolge.
618 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Lemma. Genau dann ist T von endlichem Rang, wenn es ein N ∈  und Vek-
toren u1 , . . . , uN , v1 , . . . , vN gibt mit

N
Tu = uk , u vk für alle u ∈ H .
k=1

In Bracket–Schreibweise lautet diese Gleichung



N
T = | vk uk | mit | vk uk | : u → uk , u vk ,
k=1

vgl. § 9 : 2.8.

Beweis.
Jeder so dargestellte Operator ist offenbar stetig und von endlichem Rang. Ist
umgekehrt (v1 , . . . , vN ) eine ONB für Bild T und T ∈ L (H ), so gilt

N 
N
Tu = vk , T u vk = T ∗ vk , u vk , also
k=1 k=1


N
T = | T ∗ vk vk | . 2
k=1

(c) Die Identität ist genau dann kompakt, wenn H endlichdimensional ist.
Denn im Fall dim H = N ist nach (b) kompakt. Ist H unendlichdimensional

und v1 , v2 , . . . ein abzählbares ONS, so gilt vm − vn  = 2 für m = n, also
kann (vn ) keine konvergente Teilfolge enthalten.

(d) Weitere Beispiele folgen in 4.3.

4.2 Das C*–Ideal K (H )


Satz. Die kompakten Operatoren bilden eine C*–Unteralgebra K (H ) von
L (H ) mit der Eigenschaft T ∈ K (H ) =⇒ ST, T S ∈ K (H ) für alle
S ∈ L (H ). Das bedeutet im Einzelnen:
(a) Die kompakten Operatoren bilden einen Vektorraum.
(b) Der Limes einer normkonvergenten Folge kompakter Operatoren ist kom-
pakt.
(c) Für T ∈ K (H ) und S ∈ L (H ) sind ST und T S kompakt.
(d) Mit T ist auch T ∗ kompakt.

Beweis.
(a) Seien S, T ∈ L (H ) kompakt und (un ) eine beschränkte Folge. Dann gibt
es eine Teilfolge (unk )k , für die (Sunk )k konvergiert und davon eine mit (vm )
bezeichnete Teilfolge, für die auch (T vm ) und damit (αSvm +βT vm ) für α, β ∈ 
konvergiert.
4 Spektralzerlegung kompakter symmetrischer Operatoren 619

(b) Wir betrachten eine Folge von Operatoren Tn ∈ K (H ), die bezüglich der
Operatornorm eine Cauchy–Folge bilden. Nach § 21 : 1.4 gibt es einen Operator
T ∈ L (H ) mit T − Tn  → 0 .
Sei (uk ) eine beschränkte Folge, o.B.d.A. uk  ≤ 1 für k = 1, 2, . . . . Dann gibt
es eine mit (u1,k ) bezeichnete Teilfolge, für die (T1 u1,k ) konvergiert. Davon gibt
es eine mit (u2,k ) bezeichnete Teilfolge, für die auch (T2 u2,k ) konvergiert. So
fortfahrend erhalten wir ein Schema von zeilenweise notierten Teilfolgen

u1,1 u1,2 u1,3 ···


u2,1 u2,2 u2,3 ···
.. .. .. ..
. . . .
..
un,1 un,2 un,3 .
.. .. ..
. . .

mit folgenden Eigenschaften:


(i) Jede Zeile beschreibt eine Teilfolge aller vorausgehenden Zeilenfolgen,
(ii) für jedes n ∈  konvergieren die Folgen (T u 1 n,k )k , . . . , (Tn un,k )k .

Wir bezeichnen die Diagonalfolge (un,n ) mit vn . Da vn in jeder der vorange-


henden Zeilen auftritt, ist (vn ) eine Teilfolge der ursprünglichen Folge (uk ) und
(vn )n≥m eine Teilfolge von (um,k )k . Daher konvergiert die Folge (Tm vn )n für
jedes m ∈ .
Wir zeigen die Konvergenz der Folge (T vn ) durch ein 3ε–Argument: Sei ε > 0

gegeben. Wir fixieren ein m ∈ mit T − Tm  < ε. Wegen der Konvergenz der
Folge (Tm vn )n gibt es ein nε mit

Tm vk − Tm vn  < ε für k > n > nε .

Wegen vn  ≤ 1 folgt für k > n > nε

T vk − T vn  = (T − Tm )vk + (Tm vk − Tm vn ) + (Tm − T )vn 


≤ 2 T − Tm  + Tm vk − Tm vn  < 3ε .

(c) folgt direkt aus der Definition 4.1 (a) und der Stetigkeit von S ÜA .
(d) Nach (c) ist T T ∗ kompakt. Sei un  ≤ C für n ∈ . Dann gibt es eine 
wieder mit (un ) bezeichneten Teilfolge, für die (T T ∗un ) konvergiert. Die Folge
(T ∗ un ) ist eine Cauchy–Folge wegen

T ∗ um − T ∗ un 2 = um − un , T T ∗(um − un )

≤ 2 C T T ∗ um − T T ∗ un  . 2
620 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

4.3 Beispiele
(a) Der Multiplikator Ma : (x1 , x2 , . . . ) → (a1 x1 , a2 x2 , . . . ) in 2 ist genau
dann kompakt, wenn (an ) eine Nullfolge ist.

Beweis.
(i) Sei (an ) keine Nullfolge. Dann gibt es ein ε > 0 mit |an | ≥ ε für unendlich

viele n ∈ , also gibt es eine Teilfolge (ank )k mit |ank | ≥ ε für alle k ∈ . Für 
die Einheitsvektoren uk := enk gilt uk  = 1 und

Ma uk − Ma um 2 = | ank |2 + | anm |2 ≥ 2ε2 ,

also kann die Bildfolge (Ma uk ) keine Cauchy–Folge enthalten.


(ii) Sei (an ) eine Nullfolge. Die Operatoren

Tn : (x1 , x2 , . . .) → (a1 x1 , . . . , an xn , 0, 0, . . .)

sind von endlichem Rang, also nach 4.1 (b) kompakt. Sei ε > 0 gegeben und nε
so gewählt, dass |ak | < ε für k > nε . Dann gilt


Ma x − Tn x2 = |ak |2 |xk |2 ≤ ε2 x2 für n > nε ,
k=n+1

also Ma − Tn  ≤ ε für n > nε . Nach 4.2 (b) ist Ma kompakt. 2

(b) Integraloperatoren vom Hilbert–Schmidt–Typ. Sei Ω ein Gebiet des


n

und G : Ω × Ω → eine messbare Funktion, für welche die Integrale
 
F (x) := |G(x, y)|2 dn y und S 2 := F (x) dn x
Ω Ω

konvergieren. Nach § 21 : 2.5 ist durch



(T u)(x) := G(x, y)u(y) dn y
Ω

ein beschränkter Operator T auf H = L2 (Ω) mit T  ≤ S gegeben.

Satz. T ist kompakt.

Beweis.
Nach dem Satz von Tonelli § 8 : 1.8 gilt G ∈ L2 (Ω × Ω). Nach § 20 : 8.3 gibt es
daher eine Folge von Treppenfunktionen ϕm auf Ω × Ω mit
 
(∗)  G(x, y) − ϕm (x, y) 2 dn x dn y → 0 für m → ∞ .
Ω×Ω
4 Spektralzerlegung kompakter symmetrischer Operatoren 621

Jede Treppenfunktion ϕm auf Ω hat die Form


N
ϕm (x, y) = ck χIk (x) χJk (y) f.ü. ,
k=1

wo Ik , Jk kompakte Intervalle in Ω sind. Wir betrachten den zugehörigen Inte-


graloperator Tm , gegeben durch

(Tm u)(x) := ϕm (x, y) u(y) dn y .
Ω

Mit dem Skalarprodukt ., . auf L2 (Ω) gilt


N
Tm u = χJk , u ck χIk ,
k=1

also ist jeder der Operatoren Tm von endlichem Rang und somit kompakt. Aus
(∗) folgt T − Tm  → 0 für m → ∞, also ist auch T kompakt nach 4.2 (b). 2

4.4 Das Spektrum kompakter symmetrischer Operatoren


Satz. Für einen kompakten symmetrischen Operator T auf einem unendlichdi-
mensionalen Hilbertraum H gilt:
(a) 0 ∈ σ(T ).
(b) Jeder von 0 verschiedene Spektralwert λ ist ein Eigenwert endlicher Viel-
fachheit, d.h. dim Kern (T − λ) < ∞.
(c) Ist T nicht von endlichem Rang, so bilden die von Null verschiedenen Ei-
genwerte von T eine Nullfolge und umgekehrt.

Beweis.
(a) Im Fall 0 ∈ (T ) hätte T eine stetige Inverse. Nach 4.2 (c) wäre dann
½ = T −1 T kompakt im Widerspruch zu 4.1 (c). Somit gilt 0 ∈ σ(T ).
(b) Sei 0 = λ ∈ σ(T ). Da T symmetrisch ist, gilt σ(T ) = σapp (T ), also gibt es
Vektoren un ∈ H mit un  = 1 und T un − λun → 0 für n → ∞. Wir wählen
diese Folge gleich so, dass die Bildfolge (T un ) konvergiert. Wegen λ = 0 und
T un − λun → 0 existiert dann
1
v := lim T un = lim un ,
n→∞ λ n→∞

und es gilt v = lim un  = 1. Da T stetig ist, folgt


n→∞

λv = lim T un = T v , also λ ∈ σp (T ) .
n→∞
622 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Wäre Kern (T − λ) unendlichdimensional, so gäbe es ein ONS v1 , v2 , . . . mit


T vn = λvn (n = 1, 2, . . .). Wegen

T vm − T vn 2 = |λ|2 vm − vn 2 = 2 |λ|2 für m = n

könnte die Folge (T vn ) keine konvergente Teilfolge besitzen.


(c) Besitzt T nur endlich viele von Null verschiedene Eigenwerte λ1 , . . . , λm ,
so gilt nach § 21 : 7.7

T = λ1 P1 + . . . + λm Pm ,

wobei die Pk die orthogonalen Projektoren auf die (nach (b) endlichdimen-
sionalen) Eigenräume Kern (T − λk ) sind. Somit gilt dim Bild T < ∞. Ist al-
so T nicht von endlichem Rang, so gibt es eine Folge von Eigenwerten λn
mit |λ1 | ≥ |λ2 | ≥ . . . und ein ONS v1 , v2 , . . . zugehöriger Eigenvektoren:
T vn = λn vn für n = 1, 2, . . . . Wir können diese gleich so auswählen, dass die
Folge (T vn ) konvergiert. Aus der Abschätzung

T vm − T vn 2 = λm vm − λn vn 2 = |λm |2 + |λn |2 ≥ 2 |λn |2

für n > m entnehmen wir, dass (T un ) nur eine Cauchy–Folge sein kann, wenn
λn → 0 für n → ∞.
Bilden die Eigenwerte λ = 0 von T eine Nullfolge, so müssen es abzählbar viele
sein, und die zugehörigen Eigenvektoren liefern ein abzählbares ONS in Bild T .
2

4.5 Der Spektralsatz für kompakte symmetrische Operatoren


Satz (Hilbert 1904, Schmidt 1907) Sei T ∈ L (H ) kompakt, symmetrisch
und nicht von endlichem Rang. Dann gibt es ein abzählbares ONS v1 , v2 , . . .
aus Eigenvektoren von T und zugehörige, von Null verschiedene Eigenwerte λk
mit folgenden Eigenschaften:
(a) |λ1 | ≥ |λ2 | ≥ . . . , lim λn = 0 .
n→∞


(b) T u = λk vk , u vk gilt für jeden Vektor u ∈ H , d.h. v1 , v2 , . . . ist ein
k=1
vollständiges ONS für Bild T .

(c) Die Eigenwerte λk ergeben sich nach dem Rayleigh–Prinzip


    
|λ1 | = max | u , T u |  u = 1 =  v1 , T v1  ,
  
|λn+1 | = max | u , T u |  u = 1, u ⊥ v1 , . . . , vn
 
=  vn+1 , T vn+1  für n = 1, 2, . . . .
4 Spektralzerlegung kompakter symmetrischer Operatoren 623

(d) Weiter gilt


  
|λ1 | = max T u  u = 1 = T v1  ,
  
|λn+1 | = max T u  u = 1 , u ⊥ v1 , . . . , vn = T vn+1 
für n = 1, 2, . . . .

Bemerkungen.
(i) Hierbei ergeben sich alle von Null verschiedenen Eigenwerte von T nach
dem Rayleigh–Prinzip (c),(d).
(ii) Ist λ = 0 kein Eigenwert von T , so ist v1 , v2 , . . . ein vollständiges ONS für
H . Denn es gilt Bild T = Kern T ⊥ = H , und Span {v1 , v2 , . . .} liegt dicht in
Bild T , also auch in H . Beachten Sie, dass in diesem Fall Bild T = H ist, da
0 ∈ σc (T ) nach 4.4 (a).
Ist λ = 0 ein Eigenwert von T , so kann der Eigenraum Kern T unendlichdi-
mensional sein (Beispiel Ma auf 2 mit a = (1, 0, 12 , 0, 13 , . . . ). Nehmen wir zu
v1 , v2 , . . . eine ONB bzw. ein vollständiges ONS u1 , u2 , . . . für Kern T hinzu, so
erhalten wir nach geeigneter Durchnummerierung insgesamt ein vollständiges
ONS für H , Näheres in 4.6.
(iii) Die Existenz der in (c), (d) angegebenen Maxima liegt nicht auf der Hand,
denn nach Voraussetzung gilt dim H = ∞, also ist {u ∈ H | u = 1} nicht
kompakt.
Beweis.
(i) Nach Voraussetzung ist T = 0. Aus § 21 : 6.5 (b),(c) entnehmen wir:
  
T  = sup u , T u  u = 1 > 0,

und T  oder −T  gehören zum Spektrum von T . Nach 4.4 (b) gibt es also
einen Eigenwert λ1 von T und einen zugehörigen Eigenvektor v1 mit v1  = 1
und
     
|λ1 | = T  = sup T u  u = 1 = sup u , T u  u = 1 .

Wegen |λ1 | = | v1 , T v1 | = T v1  kann sup jeweils durch max ersetzt werden.


(ii) Die restlichen Behauptungen (c),(d) ergeben sich durch Induktion. Ist
v1 , . . . , vn ein ONS mit T vk = λk vk für k = 1, . . . , n, so setzen wir

Vn := Span {v1 , . . . , vn } , H n := Vn⊥ .

Offenbar ist Vn ein T –invarianter Teilraum, also ist H n ein T –invarianter, abge-
schlossener Teilraum von H , vgl. 3.3 (a). Wir betrachten die Einschränkung Tn
von T auf H n . Nach Voraussetzung gilt Tn = 0, denn sonst wäre H n ⊂ Kern T ,
624 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

also Bild T = Kern T ⊥ ⊂ H ⊥ n = Vn . Mit T ist auch Tn kompakt und symme-


trisch. Wie in (i) erhalten wir die Existenz eines Eigenwerts λn+1 und eines
zugehörigen Eigenvektors vn+1 von Tn (und damit auch von T ) mit
  
|λn+1 | = max  u , T u   u = 1 , u ∈ H n
  
= max T u  u = 1 , u ∈ H n = Tn  .

(iii) Daraus ergibt sich die Behauptung (a): Sei u ∈ H und



n
un := u − vk , u vk = u − Pn u ,
k=1

wo Pn der orthogonale Projektor auf Vn ist. Dann gilt un ∈ H n = (Bild Pn )⊥


und u2 = un 2 + Pn u2 ≥ un 2 , also

T un  = Tn un  ≤ Tn  · un  ≤ |λn+1 | · u → 0 für n → ∞,

da (λn ) eine Nullfolge ist. Nach Definition der un folgt



n 
n
T u = lim vk , u T vk = lim λk vk , u vk .
n→∞ k=1 n→∞ k=1

Zu Bemerkung (i). Sei T u = λu, u = 0, λ = 0. Dann gilt u = 1


λ
T u ∈ Bild T .


Da v1 , v2 , . . . ein vollständiges ONS für Bild T ist, folgt u = vk , u vk .
k=1
Daher gilt aufgrund des Entwicklungssatzes (b)


0 = T u − λu = (λk − λ) vk , u vk .
k=1

Wegen u = 0 gibt es ein m mit vm , u = 0, also λ = λm . 2

4.6 Darstellungen kompakter symmetrischer Operatoren


(a) Satz. Ein linearer Operator T : H → H auf einem unendlichdimensio-
nalen Hilbertraum H ist genau dann kompakt und symmetrisch, wenn es ein
vollständiges ONS v1 , v2 , . . . für H und eine reelle Nullfolge (λn ) gibt, so dass


T = λk | vk vk |
k=1

im Normsinn gilt. Dabei ist | vk vk | der Projektor u → vk , u vk .


Mit der unitären Abbildung U : H → 2 , u → ( v1 , u , v2 , u , . . . ) ist also

T = U −1 Mλ U ;
4 Spektralzerlegung kompakter symmetrischer Operatoren 625

dabei ist Mλ der Multiplikator (x1 , x2 , . . . ) → (λ1 x1 , λ2 x2 , . . . ) auf 2 .


Für jede Funktion f : σ(T ) → mit lim f (λn ) = f (0) ist daher
n→∞



f (T ) = f (λk ) | vk vk | .
k=1

Beweis.
(i) Für jedes ONS v1 , v2 , . . . und jede reelle Nullfolge (λn ) sind


n
Tn := λk | vk vk |
k=1

symmetrische Operatoren endlichen Rangs, insbesondere kompakt. Bilden diese


eine Cauchy–Folge in der Operatornorm, so ist ihr Normlimes T kompakt und
symmetrisch.
(ii) Sei T kompakt und symmetrisch. Dann gilt H = Kern T ⊕ Bild T , wobei
Kern T und Bild T = Kern T ⊥ beide T –invariant sind, vgl. 3.3 (a).
Ist T von endlichem Rang, so gibt es nach Bd. 1, § 20 : 3 eine ONB (v1 , . . . , vm )
für Bild T , bestehend aus Eigenvektoren zu von Null verschiedenen Eigenwer-
ten λ1 , . . . , λm . Wir ergänzen diese durch ein vollständiges abzählbares ONS
vm+1 , vm+2 , . . . für Kern T zu einem vollständigen ONS v1 , v2 , . . . für H und
setzen λk := 0 für k > m.
Sei T nicht von endlichem Rang. Im Fall Kern T = {0} folgt die Behauptung
aus 4.5, Bemerkung (ii). Andernfalls gibt es ein (endliches oder abzählbares)
vollständiges ONS u1 , u2 , . . . für Kern T und ein vollständiges ONS w1 , w2 , . . .

für Bild T aus Eigenvektoren, T wk = μk wk (k ∈ ), wobei |μ1 | ≥ |μ2 | ≥ . . . .
Im Fall dim Kern T = m setzen wir

vk := uk , λk := 0 für k = 1, . . . , m ,

vm+k := wk , λm+k := μk für k ≥ m .

Im Fall dim Kern T = ∞ setzen wir

v2k−1 := wk , λ2k−1 := μk ,

v2k := uk , λ2k := 0 für k = 1, 2, . . . .

In jedem Fall ist dann v1 , v2 , . . . ein vollständiges ONS für H aus Eigenvektoren,
und die zugehörigen Eigenwerte bilden eine reelle Nullfolge. Für u ∈ H gilt also



u= vk , u vk ,
k=1
626 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

und wegen der Stetigkeit von T



∞ 

Tu = vk , u T vk = λk vk , u vk .
k=1 k=1

Definieren wir die Operatoren Tn wie oben, so folgt aus der Besselschen Unglei-
chung


 (T − Tn ) u 2 = |λk |2 | vk , u |2 ≤ max {|λk |2 | k > n} u2 ,
k=n+1

also
T − Tn  → 0 für n → ∞ .

Die letzte Behauptung des Satzes folgt aus § 21 : 7.6 (a): Gilt lim f (λn ) = f (0),
n→∞
so ist f stetig auf σ(T ) = {(0, λ1 , λ2 , . . . )}, also ist nach den Bemerkungen
3.7 (a)
f (T ) = U −1 Mf ◦λ U
mit
Mf ◦λ = (x1 , x2 , . . . ) −→ (f (λ1 ) x1 , f (λ2 )x2 , . . . ) . 2

(b) Spektralzerlegung positiver kompakter Operatoren. Für einen posi-


tiven kompakten Operator T ordnen wir die von Null verschiedenen Eigenwerte
der Größe nach:
μ1 > μ2 > . . . > 0 ,
und bezeichnen die orthogonalen Projektoren auf die Eigenräume Kern (T − μk )
mit Pk (k = 1, 2, . . . ). Nach 4.5 ist dann

T = μk Pk
k

eine endliche Summe oder eine normkonvergente Reihe. Da die Funktionen


eλ = χ]−∞,λ] für alle λ = 0 stetig auf σ(T ) sind ÜA , erhalten wir aus (a)
die Spektralschar auf folgende Weise: Wir setzen μ0 = 0 und bezeichnen den
orthogonalen Projektor auf Kern T mit P0 . Dann gilt wegen E0 = lim Eλ
λ→0+
ÜA

Eλ = Pk für alle λ ∈ Ê.
μk ≤λ

Für einen Vektor u ∈ H mit u = 1 ist dann das Spektralmaß



μu = Pk u2 δμk
k≥0

ein diskretes Wahrscheinlichkeitsmaß.


5 Anwendung auf Rand–Eigenwertprobleme 627

5 Anwendung auf Rand–Eigenwertprobleme


5.1 Umkehrung des Hamilton Operators eines in ]0, 1[ eingesperrten
Teilchens
(a) Für eine gegebene Funktion f ∈ C [0, 1] besitzt das Randwertproblem

(∗) −u = f , u(0) = u(1) = 0

eine eindeutig bestimmte Lösung u ∈ C2 [0, 1], gegeben durch


(
1 t(1 − x) für t ≤ x,
u(x) = G(x, t) f (t) dt mit G(x, t) =
0 x(1 − t) für t ≥ x.

Diese Lösungsformel lässt sich wie folgt gewinnen: Für eine Lösung u von (∗)
gilt
x t
u(x) = u (t) dt mit u (t) = u (0) − f (s) ds .
0 0

Daraus ergibt sich durch partielle Integration wegen u(0) = u(1) = 0

x t
u(x) = u (0) x − 1 f (s) ds dt
0 0
(1)
x x
= u (0) x − (x − 1) f (t) dt + (t − 1) f (t) dt .
0 0

1
Wegen u(1) = 0 folgt u (0) = (1 − t) f (t) dt. Setzen wir dies in (1) ein, so
0
erhalten wir nach passender Umstellung ÜA

x 1 1
(2) u(x) = (1 − x) t f (t) dt + x (1 − t) f (t) dt = G(x, t) f (t) dt .
0 x 0

Erfüllt u umgekehrt die Gleichung (2) mit f ∈ C [0, 1], so folgt offenbar u(0) =
u(1) = 0. Differentiation ergibt zunächst

x 1
(3) u (x) = − t f (t) dt + (1 − t) f (t) dt ,
0 x

woraus die C2 –Differenzierbarkeit von u und u = −f folgt ÜA .

(b) Im Hinblick auf die im nächsten Paragraphen behandelte Theorie unbe-


schränkter Operatoren geben wir diesem Ergebnis eine andere Fassung. Sei
  
C20 [0, 1] := u ∈ C2 [0, 1]  u(0) = u(1) = 0 .
628 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Da dieser Raum die Testfunktionen mit Träger in ]0, 1[ umfaßt, liegt er nach
§ 20 : 8.5 dicht in L2 [0, 1]. Für u ∈ C20 [0, 1] sei

H0 u := − u .

Dann ist H0 : C20 [0, 1] → C [0, 1] bijektiv, und für f ∈ C [0, 1] gilt

1
H0 u = f ⇐⇒ u = T f mit (T f )(x) := G(x, t) f (t) dt .
0

(c) Der Operator T ist für alle f ∈ L2 [0, 1] definiert. Bevor wir seine Eigen-
schaften analysieren, setzen wir den Operator H0 auf einen größeren Definiti-
onsbereich fort. Hierzu berufen wir uns auf den Begriff der Absolutstetigkeit
(§ 8 : 3.1) und auf den verallgemeinerten Hauptsatz § 8 : 3.2. Sei
  
D(H) := u ∈ C1 [0, 1]  u absolutstetig, u ∈ L2 [0, 1], u(0) = u(1)

und Hu := −u für u ∈ D(H). Der hierdurch definierte Operator H (genauer


1
2
H ) dient als Hamilton–Operator eines in ]0, 1[ eingesperrten Teilchens. Dieser
ist unbeschränkt, denn für

vn (x) := √1 sin(πnx)
2

gilt vn  = 1, Hvn  = π 2 n2 .

(d) Satz. T ist ein kompakter symmetrischer Operator auf L2 [0, 1] mit folgen-
den Eigenschaften:
T ist injektiv,
Bild T = D(H) ,
der Operator H besitzt also die kompakte Inverse T .
Ferner gilt

1 1
T f 2∞ ≤ |f (x)|2 dx für f ∈ L2 [0, 1],
48 0

d.h. für jede in L2 [0, 1] konvergente Folge (fn ) ist die Bildfolge (T fn ) gleich-
mäßig konvergent.

Beweis.
(i) Die Kompaktheit von T folgt aus 4.3 (b), da G auf [0, 1] × [0, 1] stetig ist.
Wegen G(t, x) = G(x, t) für 0 ≤ x, t ≤ 1 ÜA ist T symmetrisch (§ 21 : 3.4 (e)).
5 Anwendung auf Rand–Eigenwertprobleme 629

(ii) Sei u = T f mit f ∈ L2 [0, 1]. Dann folgt aus (2) nach dem Hauptsatz § 8 : 3.2
aufgrund derselben Rechnung wie oben u(0) = u(1) = 0 und

x 1
(3) u (x) = − t f (t) dt + (1 − t) f (t) dt f.ü.
0 x

Wiederum nach dem Hauptsatz folgen die Absolutstetigkeit von u und daher die
C1 –Differenzierbarkeit von u als unbestimmtem Integral von u . Differentiation
von (3) ergibt u = −f f.ü., d.h. u ∈ L2 [0, 1].
Aus T f = 0 folgt insbesondere f = −(T f ) = 0 f.ü.
(iii) Für u ∈ D(H) und f := −u ∈ L2 [0, 1] ergibt sich die Formel (1), d.h.
u = T f , wie in (a) mittels des Hauptsatzes und partieller Integration (vgl.
§ 8 : 3.3).
(iv) Für u = T f gilt nach der Cauchy–Schwarzschen Ungleichung

1 1 1 1
|u(x)|2 ≤ G(x, t)2 dt |f (t)|2 dt , dabei ist G(x, t)2 dt ≤
0 0 0
48

für alle x ∈ [0, 1]. Ferner gilt T  ≤ 2 1


90
ÜA . 2

(e) Bemerkung. In § 9 : 4.5 (b) wurde gezeigt, dass durch vn (x) = 2 sin(πnx)
2
(n = 1, 2, . . .) ein vollständiges ONS für L [0, 1] gegeben ist. Aus dem Satz (d)
ergibt sich ein weiterer Beweis dieses Sachverhalts. Da 0 nach (d) kein Eigenwert
von T ist, gibt es nach 4.5, Bemerkung (ii) ein vollständiges ONS für L2 [0, 1]
aus Eigenvektoren v ∈ L2 [0, 1] zu Eigenwerten λ = 0 von T . Für solche gilt
v = T (v/λ) ∈ Bild T = D(H), insbesondere v ∈ C [0, 1]. Nach (a) folgt dann
sogar v ∈ C20 [0, 1] und

v  + λv = 0 , v(0) = v(1) = 0 .

Die einzigen Lösungen dieses Eigenwertproblems ergeben sich aber bekanntlich


durch λ = π 2 n2 , v = c vn mit geeignetem n ∈ 
und einer Konstanten c = 0.

5.2* Die inhomogene schwingende Saite


(a) Separationsansatz und Eigenwertproblem. Eine elastische, an den
Enden eingespannte Saite der Länge 1 mit der stetigen Massendichte > 0
unter der Spannung σ möge kleine Transversalschwingungen in der x, u–Ebene
ausführen. Für die Auslenkung u(x, t) aus der Ruhelage an der Stelle x ∈ [0, 1]
zur Zeit t ergeben sich wie in § 1 : 2 die Wellengleichung und die Einspannbedin-
gungen

∂ 2 u(x, t) ∂ 2 u(x, t)
(1) p(x) = , u(0, t) = u(1, t) = 0 ,
∂t2 ∂x2
630 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

dabei ist p(x) = (x)/σ stetig und strikt positiv. Gegeben seien ein Anfangs-
profil f und eine Anfangsgeschwindigkeit g. Wir fragen nach der Existenz und
Eindeutigkeit einer Lösung u von (1) mit den Anfangsbedingungen
∂u
(2) u(x, 0) = f (x) , (x, 0) = g(x) .
∂t
Die Separationsmethode zur Lösung dieses Problems besteht darin, wie in § 6
zunächst alle Produktlösungen u(x, t) = v(x) w(t) von (1) zu bestimmen (ste-
hende Wellen) und dann zu zeigen, dass sich die Lösung von (1), (2) als Super-


position u(x, t) = vk (x) wk (t) von Produktlösungen ergibt.
k=1
Für die Produktlösungen erhalten wir in gewohnter Weise die Bedingungen
(∗) −v  (x) = λ p(x) v(x) , v(0) = v(1) = 0
und w (t) + λw(t) = 0 mit einer passenden Konstanten λ. Durch partielle
1 1
Integration ergibt sich aus (∗) λ p |v|2 = |v  |2 , also λ > 0 für v = 0.
0 0

(b) Das Eigenwertproblem (∗) für 0 = v ∈ C2 [0, 1] ist nach 5.1 äquivalent zur
Integralgleichung
1
v(x) = λ G(x, t) p(t) v(t) dt (0 ≤ x ≤ 1) .
0

Wir schreiben diese in der Form


1 1
(∗∗) Sv = μ v mit μ= , (Sv)(x) := G(x, t) p(t) v(t) dt .
λ 0

(c) Satz. S ist ein kompakter symmetrischer Operator auf dem Hilbertraum
H = L2 [0, 1] mit dem Skalarprodukt
1
u, v p := u(x) v(x) p(x) dx .
0

Es gibt ein vollständiges ONS v1 , v2 , . . . für H aus Eigenfunktionen von S und


zugehörige Eigenwerte μ1 > μ2 > . . . > 0 mit folgenden Eigenschaften:
Die vk sind reellwertige C2 –Funktionen mit
 
1
−vk = λk p vk λk = μk , vk (0) = vk (1) = 0 .

Für die Eigenwerte besteht die Identität



∞ 1 1
μ2k = G(x, t)2 p(x) p(t) dx dt .
k=1 0 0
5 Anwendung auf Rand–Eigenwertprobleme 631

Beweis.
(i) Nach Voraussetzung 0 < p ∈ C [0, 1] gibt es Zahlen 0 < p0 < p1 mit
1
p0 |u(x)|2 dx = p0 u2 ≤ u2p ≤ p1 u2 ,
0

also sind die gewöhnliche L2 –Norm und die Norm  . p äquivalent. Daraus folgt
die Vollständigkeit von H und die Kompaktheit von S, denn es gilt Su = T (pu)
mit dem kompakten Operator T von 5.1. Die Symmetrie von S folgt aus

u , Sv p = u , pT pv = pu , T pv = T pu , pv = Su , pv = Su , v p .

(ii) 0 ist kein Eigenwert von S : Sv = T (pv) = 0 =⇒ pv = 0 =⇒ v = 0 f.ü.


nach 5.1 (d). Aus Sv = μv, 0 = v ∈ H , μ = 0 folgt nach 5.1 (b) zunächst, dass
v = μ−1 T (pv) stetig ist mit v(0) = v(1) = 0. Nach 5.1 (a) ist v dann sogar eine
C2 –Lösung des Rand–Eigenwertproblems (∗) mit λ = 1/μ > 0.
(iii) Für zwei reellwertige Lösungen u, v von (∗) ist die Wronski–Determinante

W (x) = u(x) v  (x) − u (x) v(x)

konstant und verschwindet daher wegen der Randbedingungen identisch. Daher


sind u, v linear abhängig, vgl. § 4 : 2.2. Da für jede komplexwertige Lösung (∗)
auch Real– und Imaginärteil Lösungen von (∗) liefern, sind die Eigenräume von
S eindimensional und werden von reellwertigen Funktionen aufgespannt.
(iv) Aus (ii) und (iii) und 4.5, Bemerkung (ii) ergibt sich die Existenz eines
vollständigen ONS v1 , v2 , . . . der oben angegebenen Art für H .


Für Gx (t) := G(x, t) gilt Gx ∈ H und damit Gx = vk , Gx p vk im
k=1
Hilbertraumsinn für jedes feste x ∈ [0, 1]. Dabei ist
1
vk , Gx p = G(x, t) p(t) vk (t) dt = (Svk )(x) = μk vk (x) .
0

Aus der Parsevalschen Gleichung folgt somit


1 

G(x, t)2 p(t) dt = Gx 2p = μ2k vk (x)2 für 0 ≤ x ≤ 1 .
0 k=1

Nach dem Satz von Beppo Levi ist die gliedweise Integration dieser Reihe erlaubt
und ergibt
1  1 
∞ 1 

G(x, t)2 p(t) dt p(x) dx = μ2k vk2 (x) p(x) dx = μ2k . 2
0 0 k=1 0 k=1

Als Folgerung erhalten wir den


632 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

(d) Entwicklungssatz. Jede Funktion u ∈ C20 [0, 1] besitzt die für 0 ≤ x ≤ 1


gleichmäßig konvergente Reihenentwicklung


u(x) = vk , u p vk (x) .
k=1

Beweis.
Nach 5.1 (a) gilt u = T (−u ) = Sf mit f := −u /p ∈ H . Mit dem im Satz
genannten ONS v1 , v2 , . . . erhalten wir die Entwicklung


f = vk , f p vk
k=1

in H . Wegen der nach 5.1 (b) bestehenden Abschätzung

Sw2∞ = T (pw)2∞ ≤ 1
48
p2∞ w2p

führt S jede in H konvergente Reihenentwicklung in eine gleichmäßig konver-


gente Reihenentwicklung über, also konvergiert die Reihe


u = Sf = vk , f p Svk
k=1

gleichmäßig in [0, 1]. Die Behauptung ergibt sich nun aus


vk , f p Svk = vk , f p μk vk = μk vk , f p vk
= Svk , f p vk = vk , Sf p vk
= vk , u p vk . 2

(e) Aufgabe. Zeigen Sie, dass jede Lösung u des Randwertproblems (1) der
inhomogenen schwingenden Saite Superposition von Produktlösungen ist:


u(x, t) = wk (t) vk (x) , wobei ẅk + λk wk = 0 .
k=1

Anleitung: Wenden Sie auf ut : x → u(x, t) den Entwicklungssatz (d) an und


untersuchen Sie wk (t) = vk , ut p in Analogie zu § 6 : 3.1.

(f) Aufgabe. Seien f = S 3 f0 , g = S 3 g0 mit f0 , g0 ∈ L2 [0, 1]. Zeigen Sie, dass


dann das Anfangs–Randwertproblem (1), (2) eine Lösung besitzt.
Anleitung: Gehen Sie analog zu § 6 : 3.2 vor: Reihenansatz gemäß (e) mit

wk (t) = αk cos λk t + βk sin λk t , αk = vk , f p , βk = μk vk , g p ,
und Nachweis der zweimaligen gliedweisen Differenzierbarkeit der Reihe für u.
Beachten Sie dabei, dass nach 5.1 (b) vk ∞ ≤ λk c mit einer Konstanten c gilt


und dass die Reihe μ2k konvergiert.
k=1
6 Der allgemeine Zustandsbegriff 633

6 Der allgemeine Zustandsbegriff


6.1 Die Spurklasse
(a) Sei T ein symmetrischer Operator auf einem n–dimensionalen Hilbertraum
H , A = (ϕ1 , . . . , ϕn ) eine ONB für H und A = (aik ) = MA (T ) die Koeffi-
zientenmatrix von T . Ferner sei B = (v1 , . . . , vn ) ein ONB aus Eigenvektoren
von T zu den Eigenwerten λk = vk , T vk (k = 1, . . . , n).
Dann gilt bekanntlich aik = ϕi , T ϕk und

n 
n 
n 
n
Spur A = akk = ϕk , T ϕk = λk = vk , T vk .
k=1 k=1 k=1 k=1

Wir verallgemeinern dieses Ergebnis auf unendlichdimensionale Hilberträume,


wobei geeignete Voraussetzungen über die Konvergenz der an die Stelle der
Summen tretenden Reihen zu machen sind.
(b) Ein Operator T ∈ L (H ) heißt Spurklasse–Operator, wenn es ein voll-
ständiges ONS ϕ1 , ϕ2 , . . . für H gibt mit

ϕk , |T | ϕk < ∞.
k

Dabei ist |T | := (T ∗ T )1/2 , vgl. § 21 : 8.3 (a). Die Gesamtheit T (H ) der Spur-
klasse–Operatoren auf H wird die Spurklasse (trace class) genannt.
Hat H endliche Dimension, so gehört jeder Operator T : H → H zur Spur-
klasse. Unser Interesse gilt im Folgenden den positiven Spurklasse–Operatoren
auf unendlichdimensionalen Hilberträumen H .

Beispiel. Ist T ∈ L (H ) kompakt und positiv, so gibt es ein vollständiges


ONS v1 , v2 , . . . aus Eigenvektoren und zugehörige Eigenwerte λ1 , λ2 , . . . . We-
gen vk , T vk = λk ≥ 0 gehört T sicher dann zur Spurklasse, wenn


λk < ∞ .
k=1

Satz. Spurklasseoperatoren sind kompakt. Ist T ein ein positiver Spurklasse-


operator, so hat die Spur


tr (T ) := ϕk , T ϕk
k=1

von T für jedes vollständige ONS ϕ1 , ϕ2 , . . . denselben Wert.


Ist insbesondere v1 , v2 , . . . ein vollständiges ONS aus Eigenvektoren von T mit
zugehörigen Eigenwerten λk = vk , T vk , . . . , so gilt


tr (T ) = λk .
k=1

Die entsprechenden Aussagen für dim H < ∞ wurden unter (a) aufgeführt.
634 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Beweis.
(i) Es genügt, die Kompaktheit positiver Spurklasseoperatoren zu zeigen, denn
mit T ist definitionsgemäß auch |T | ein Spurklasseoperator. Ist |T | kompakt, so
auch T wegen der Polardarstellung T = U |T |, vgl. § 21 : 8.3. Wir betrachten
im Folgenden neben T ≥ 0 die positive Quadratwurzel T 1/2 (§ 21 : 8.2) und
beachten, dass
v , T u = v , T 1/2 T 1/2 u = T 1/2 v , T 1/2 u ,
insbesondere

u , T u = T 1/2 u2 .

Sei dim H = ∞, 0 ≤ T ∈ T (H ) und ϕ1 , ϕ2 , . . . ein vollständiges ONS für H


mit

∞ 

ϕk , T ϕk = T 1/2 ϕk 2 < ∞ .
k=1 k=1

Durch

n
Tn u := ϕk , T u ϕk
k=1

sind Operatoren endlichen Rangs gegeben. Mit der Parsevalschen Gleichung und
der Cauchy–Schwarzschen Ungleichung erhalten wir für u ≤ 1


T u − Tn u2 = | ϕk , T u |2
k=n+1


= | T 1/2 ϕk , T 1/2 u |2
k=n+1


≤ T 1/2 u2 T 1/2 ϕk 2
k=n+1
∞
≤ T 1/2 2 ϕk , T ϕk u2 ,
k=n+1

also gilt lim T − Tn  = 0, und T ist nach 4.2 (b) kompakt.


n→∞

(ii) Somit gibt es ein vollständiges ONS v1 , v2 , . . . aus Eigenvektoren von T mit
zugehörigen Eigenwerten λ1 ≥ λ2 ≥ . . . . Aus den Darstellungen

∞ 

ϕk = vn , ϕk vn , T ϕk = vn , T ϕk vn
n=1
n=0
folgt mit der allgemeinen Parsevalschen Gleichung § 9 : 4.4 (c)

∞ 

ϕk , T ϕk = vn , ϕk vn , T ϕk = vn , ϕk T vn , ϕk
n=1 n=1
(1) 

= λn | vn , ϕk |2 .
n=1
6 Der allgemeine Zustandsbegriff 635

Da nach der Parsevalschen Gleichung die Reihe




(2) | vn , ϕk |2 = vn 2 = 1
k=1


konvergiert und wegen der vorausgesetzten Konvergenz der Reihe ϕk , T ϕk
k=1
erhalten wir aus dem großen Umordnungssatz Bd. 1, § 7 : 6.6

∞ ∞  
 ∞
ϕk , T ϕk = λn | vn , ϕk |2
k=1 k=1 n=1
(3) 
∞ ∞ 
∞ 

= λn | vn , ϕk |2 = λn vn 2 = λn ,
n=1 k=1 n=1 n=1

insbesondere die Konvergenz der letzten Reihe.


(iii) Ist ψ1 , ψ2 , . . . ein anderes vollständiges ONS für H , so gelten die Glei-


chungen (1), (2) mit ψk statt ϕk . Da λn konvergiert, erhalten wir mit (2)
n=1
die Konvergenz der Reihen

∞ ∞  
 ∞ ∞  
 ∞
λn = λn | vn , ψk |2 = λn | vn , ψk |2
n=1 n=1 k=1 k=1 n=1

nach dem großen Umordnungssatz. Aufgrund von (1) mit ψk statt ϕk folgt die
Konvergenz der Reihe

∞ 
∞ 

ψk , T ψk = λn = ϕk , T ϕk .
k=1 n=1 k=1

Im Fall dim H < ∞ sind die Reihen durch endliche Summen zu ersetzen. 2

6.2 Der allgemeine Spurbegriff


Satz. Für einen positiven Spurklasseoperator T und einen Operator A ∈ L (H )
hat die Spur

tr (AT ) := ϕn , AT ϕn
n
für jedes vollständige ONS ϕ1 , ϕ2 , . . . denselben endlichen Wert. Insbesondere
gilt

tr (AT ) = λk vk , Avk
k

für jede nach 4.6 (a) und 6.1 bestehende Darstellung T = λk | vk vk | . Für
k
den Projektor T = | ϕ ϕ | auf Span {ϕ} mit ϕ = 1 ergibt sich insbesondere

tr (AT ) = ϕ , Aϕ für A ∈ L (H ) .
636 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

Beweis.
Da T nach 6.1 kompakt ist, gibt es nach 4.6 (a) ein vollständiges Orthonor-
malsystem vk (k = 1, 2,. . . ) aus Eigenvektoren von T zu den Eigenwerten
λk = vk , T vk , wobei λk = tr (T ) < ∞.
k
Sei ϕ1 , ϕ2 , . . . ein beliebiges vollständiges ONS. Dann gilt für n = 1, 2, . . .
  
T ϕn = vk , T ϕn vk = T vk , ϕn vk = λk vk , ϕn vk .
k k k

Da A stetig ist folgt



AT ϕn = λk vk , ϕn Avk ,
k

und wegen der Stetigkeit des Skalarprodukts ergibt sich daraus



(1) ϕn , AT ϕn = λk ϕn , vk ϕn , Avk .
k

Die Parsevalsche Gleichung § 9 : 4.4 liefert die absolute Konvergenz der Reihe

(2) vk , Avk = ϕn , vk ϕn , Avk .
n

Wegen | λk vk , Avk | ≤ |λk | Avk  ≤ |λk | A konvergiert die Reihe



s := λk vk , Avk
k

absolut. Aus dem großen Umordnungssatz folgt mit (2) und (1)
(2)    
s = λk ϕn , vk ϕn , Avk = λk ϕn , vk ϕn , Avk
k n n k
(1) 
= ϕn , AT ϕn im Sinne absoluter Konvergenz.
n

Ist ϕ = 1 und T = | ϕ ϕ |, so ergänzen wir ϕ1 := ϕ zu einem vollständigen


ONS ϕ1 , ϕ2 , . . . für H . Wegen T ϕ1 = T ϕ = ϕ und T ϕn = 0 für n ≥ 2 folgt
nach dem Vorangehenden

tr (AT ) = ϕn , AT ϕn = ϕ1 , AT ϕ1 = ϕ , Aϕ . 2
n

Bemerkung. Die Spurklasse T (H ) ist bezüglich der Spurnorm T 1 = tr (|T |)


ein Banachraum. Jedes stetige lineare Funktional L auf (T (H ),  1 ) hat die
Form

L(T ) = tr (AT ) für T ∈ T (H )

mit einem geeigneten Operator A ∈ L (H ).


Für den Beweis verweisen wir auf Reed–Simon [130] VI.6.
6 Der allgemeine Zustandsbegriff 637

6.3 Zusammensetzen zweier Vektorzustände


(a) Im folgenden seien ϕ, ψ ∈ H linear unabhängige Vektoren mit ϕ =
ψ = 1. Wir betrachten eine Linearkombination η = α ϕ + β ψ mit η = 1.
Der Zustand Pη = | η η | wird kohärente Überlagerung der Zustände Pϕ , Pψ
genannt.

(b) Eine Gesamtheit heißt echtes statistisches Gemisch der durch ϕ, ψ beschrie-
benen Gesamtheiten, wenn ihre Teilchen mit einer Wahrscheinlichkeit p > 0 im
Zustand Pϕ und mit Wahrscheinlichkeit q = 1−p > 0 im Zustand Pψ präpariert
sind.
Eine illustrative Diskussion der physikalischen Bedeutung und der Abgrenzung
dieser Begriffe gegeneinander finden Sie in Cohen–Tannoudji [157] Ch. III E.
Wir betrachten eine beschränkte Observable, beschrieben durch einen symme-
trischen Operator A ∈ L (H ). Sind μϕ , μψ die zugehörigen Spektralmaße und
/ϕ , μ
μ /ψ deren Erwartungswerte, so ist es naheliegend, die Verteilung μ der Be-
obachtungswerte der Observablen A im statistischen Gemisch in der Form

μ := p μϕ + q μψ

anzusetzen mit Erwartungswert

(∗) / = pμ
μ /ϕ + q μ
/ψ = p ϕ , Aϕ + q ψ , Aψ .
Aus der letzten Formel entnehmen wir: Echte statistische Gemische sind keine
Vektorzustände, insbesondere keine kohärenten Überlagerungen. Denn es gibt
keinen Vektor η mit η = 1, so dass μ/η = p μ
/ϕ + q μ
/ψ , d.h.
η , Aη = p ϕ , Aϕ + q ψ , Aψ

für jede beschränkte Observable A gilt ( ÜA , betrachten Sie A = Pη ).

(c) Dem Zustand des oben genannten statistischen Gemischs soll ein Operator
W so zugeordnet werden, dass sich Vektorzustände Pϕ = | ϕ ϕ | als Spezialfall
unterordnen. Dies soll vor allem die Formel für die Erwartungswerte betreffen.
Dazu beachten wir, dass Pϕ = | ϕ ϕ | ein positiver Spurklasseoperator mit
Spur 1 ist und dass nach 6.2

/ϕ = ϕ , Aϕ = tr (APϕ )
μ

für jede Observable A gilt.


Der Ansatz

W := p | ϕ ϕ| + q |ψ ψ|

zur Beschreibung des Zustands unseres statistischen Gemischs leistet das Ge-
wünschte:
638 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

(d) Satz. W = p | ϕ ϕ| + q |ψ ψ | ist ein positiver Spurklasseoperator mit


der Eigenschaft
tr (AW ) = p ϕ , Aϕ + q ψ , Aψ /ϕ + q μ
= pμ /ψ
für alle symmetrischen Operatoren A ∈ L (H ). Für A = ½ gilt insbesondere
tr W = 1 .

Beweis.
Aus W u = p ϕ , u ϕ + q ψ , u ψ folgt dim Bild W = 2 und
u , W u = p | ϕ , u |2 + q | ψ , u |2 ≥ 0 .
Als positiver Operator endlichen Rangs gehört W also zur Spurklasse T und ist
insbesondere kompakt. Also gibt es eine ONB v1 , v2 für Bild W und zugehörige
Eigenwerte λ1 > λ2 > 0 mit
W = λ1 | v1 v1 | + λ2 | v2 v2 | .
Wir ergänzen v1 , v2 durch ein vollständiges ONS v3 , v4 , . . . von Kern W zu
einem vollständigen ONS v1 , v2 , . . . für H . Nach 6.2 gilt für A ∈ L (H )

tr (AW ) = v1 , AW v1 + v2 , AW v2

= v1 , A(p ϕ , v1 ϕ + q ψ , v1 ψ) + v2 , A(p ϕ , v2 ϕ + q ψ , v2 ψ)

= p ( ϕ , v1 v1 , Aϕ + ϕ , v2 v2 , Aϕ )

+ q ( ψ , v1 v1 , Aψ + ψ , v2 v2 , Aψ )

= p ϕ , Aϕ + q ψ , Aψ

nach der Parsevalschen Gleichung § 9 : 4.4 (c). Für A = ½ folgt

tr T = p ϕ , ϕ + q ψ , ψ = p +q = 1. 2

6.4 Der allgemeine Zustandsbegriff


(a) Der Zustand eines quantenmechanischen Systems mit Systemhilbertraum
H wird durch einen positiven Spurklasseoperator W mit tr W = 1 (Dichte-
operator) beschrieben. Nach 4.6 besitzt jeder Dichteoperator eine Darstellung

dim H
W = pk | vk vk | ,
k=1

wobei v1 , v2 , . . . ein vollständiges ONS für H aus Eigenvektoren von W zu den


Ê
Eigenwerten p1 , p2 , . . . ∈ + ist sowie (nach 6.1)

pk = 1 = tr W .
k
6 Der allgemeine Zustandsbegriff 639

Ist eine Observable durch einen symmetrischen Operator A ∈ L (H ) beschrie-


ben und sind μv1 , μv2 , . . . die zugehörigen Spektralmaße, so deuten wir deren
Konvexkombination

μ = μW := pk μvk
k

als die Verteilung der Beobachtungswerte für A im Zustand W . Demgemäß ist


 
/=
μ /vk =
pk μ pk vk , Avk = tr (AW ) .
k k

(b) Satz. Seien u1 , u2 , . . . beliebige Vektoren der Norm 1 und c1 , c2 , . . . nicht-




negative Zahlen mit cn = 1. Dann ist durch die normkonvergente Reihe
n=1


W := cn | un un |
n=1

ein Dichteoperator gegeben.

Beweis.
Für den Projektor Pn = | un un | vom Rang 1 gilt Pn  = 1. Für die Par-

m 
m+k
tialsummen Sm = cn | un un | ist daher Sm+k − Sm  ≤ cn .
n=1 n=m+1

Somit ist W nach 4.2 (b) kompakt.


Wegen Pn ϕ = un , ϕ un gilt W ≥ 0, denn

∞ 

ϕ, W ϕ = cn ϕ , un un , ϕ = cn | un , ϕ |2 ≥ 0 .
n=1 n=1

Für jedes vollständige ONS ϕ1 , ϕ2 , . . . folgt mit dem Umordnungssatz und der
Parsevalschen Gleichung

∞ 
∞ 
∞ 

ϕk , W ϕk = cn | un , ϕk |2 = cn un 2
k=1 n=1 k=1 n=1
∞
= cn = 1 . 2
n=1

(c) Bemerkungen. (i) Durch die Überlegungen 6.3 wurde der allgemeine Zu-
standsbegriff allenfalls plausibel gemacht. Dass der Ansatz 6.4 vom Grundla-
genstandpunkt aus zwingend ist, wurde 1953 von Gleason gezeigt, Näheres
dazu in Mackey [137] 2–2.
(ii)Die Frage, ob alle Dichteoperatoren möglichen Zuständen eines konkreten
quantenmechanischen Systems entsprechen, soll uns hier nicht beschäftigen. Wir
kommen in § 25 : 4.7, 4.8 darauf zurück.
640 § 22 Der Spektralsatz für beschränkte symmetrische Operatoren

6.5 Ideale Messungen


Gegeben sei ein symmetrischer Operator A mit nichtentartetem diskreten Spek-
trum, den wir in der Form

A = λk Pk mit Pk = | ϕk ϕk |
k

darstellen; dabei ist ϕ1 , ϕ2 , . . . ein vollständiges ONS, die λk sind paarweise



verschieden und σ(A) = {λk | k ∈ } . Ob die Folge (λk ) beschränkt ist (wie
bisher immer angenommen) oder unbeschränkt sein darf wie in den nächsten
Paragraphen, ist dabei unerheblich.
Führen wir für die durch A beschriebene Observable eine Messung durch, so
bedeutet dies einen Eingriff ins System und bewirkt im allgemeinen eine Zu-
standsänderung. Wir studieren dies zunächst für den einfachsten Fall eines Vek-
torzustands W = | ψ ψ | mit ψ = 1. Da die Spektralschar nur Sprungstellen
besitzt und nach 1.5 an den Stellen λk um Pk springt, erhalten wir für das
Spektralmaß
 
μψ = Pk ψ2 δλk = | ϕk , ψ |2 δλk .
k k

Dies bedeutet, dass λ1 , λ2 , . . . die einzigen möglichen Messwerte sind und dass
im Zustand W = | ψ ψ | der Messwert λk mit Wahrscheinlichkeit Pk ψ2
anfällt.
Das Reduktionsprinzip der Quantenmechanik besagt, dass sich das System
nach Messung eines Eigenwerts λk in einem Eigenzustand befindet. Demnach
muss das System dann im Zustand Pk sein, da die Eigenräume eindimensional
sind, und der Zustand kann sich bei nochmaliger Messung nicht mehr ändern.
Wir drücken die Wahrscheinlichkeit Pk ψ2 , im Zustand W = | ψ ψ | den Wert
λk zu beobachten, auf andere Weise aus. Nach 6.1 gilt

Pk ψ2 = ψ , Pk ψ = tr (Pk W ) .

Sei nun das System vor der Messung im gemischten Zustand



W = pn | ψn ψn |
n

mit p1 , p2 , . . . ∈ Ê +, pk = 1 und einem vollständigen ONS ψ1 , ψ2 , . . . . Für
k
das zum Zustand W und zur Observablen A gehörige Spektralmaß μ gilt dann
nach 6.4 und der Rechnung oben
   
μ = pn μψn = pn Pk ψn 2 δλk = pn Pk ψn 2 δλ k
n n k k n
 
= pn ψn , Pk ψn δλ k = tr (Pk W ) δλk ,
k n k
6 Der allgemeine Zustandsbegriff 641

d.h. der Wert λk hat auch hier die Wahrscheinlichkeit tr (Pk W ). Daher haben
wir den Zustand W  nach der Messung anzusetzen als

W = tr (Pk W ) Pk .
k

Um diese Gleichung umzuformen, testen wir den Operator tr (Pk W )Pk mit dem
ONS ϕ1 , ϕ2 , . . . . Wir erhalten tr (Pk W ) Pk ϕi = 0 für k = i und

tr (Pk W )Pk ϕk = tr (Pk W ) ϕk = pn ψn , Pk ψn ϕk
 n
= pn ψn , ϕk ϕk , ψn ϕk
n

= ϕk , pn ψn , ϕk ψn ϕk
n
= ϕk , W ϕk ϕk = Pk W ϕk = Pk W Pk ϕk .

Wegen Pk W Pk ϕi = 0 für i = k gilt somit



(∗) W = Pk W Pk .
k

Unabhängig von den oben gemachten Annahmen heißt eine Messung ideal, wenn
für den Zustand W vor der Messung und den Zustand W  nach der Messung
eine Formel der Bauart (∗) gilt, wobei die Pk orthogonale Projektoren sind mit
Pi Pk = δik Pk . Für solche folgt aus (∗) wegen der Stetigkeit der Projektoren und
aus Pi Pk = δik Pk ÜA : Der Zustand

W  = Pi W  Pi
i

nach einer nochmaligen Messung der Observablen A ist wieder W  .


Zur Diskussion des Messprozesses bei entarteten oder kontinuierlichen Spektren
aus physikalischer Sicht verweisen wir auf Cohen–Tannoudji [157] Ch. III E.
642 § 23 Unbeschränkte Operatoren

§ 23 Unbeschränkte Operatoren
Vorkenntnisse. Maß und Integral (§ 19, § 20), Spektraltheorie beschränkter sym-
metrischer Operatoren (§ 21, § 22), Testfunktionen und Glättung von Funktio-
Ê
nen (§ 10), Fouriertransformation auf S ( n ) (§ 12 : 3). Einige Beispiele und
Sätze beziehen sich auf die Theorie des Laplace–Operators auf Gebieten des
Ê n
und erfordern zusätzliche, separat ausgewiesene Vorkenntnisse; diese können
von nur an der Quantenmechanik interessierten Lesern übergangen werden.

1 Definitionen und Beispiele


1.1 Orts– und Impulsoperator auf dem Schwartzraum S
Wir realisieren die Heisenbergsche Vertauschungsrelation AB − BA = − i½
(h̄ = 1 gesetzt) durch das Operatorenpaar
P, Q : S → S , P u := −i u , Q u := x · u für u ∈ S
auf dem Schwartz–Raum S = S (Ê) der schnellfallenden Funktionen; dabei
steht x · u für die Funktion x → x · u(x).
Diese Operatoren erfüllen in der Tat die Vertauschungsrelation
P Q − QP = −i ½S ,
denn für u ∈ S gilt
d
(P Q u)(x) = −i (x u(x)) = − i u(x) − i x u (x) = − i u(x) + (QP u)(x).
dx
Dass Q als Ortsoperator und P als Impulsoperator eines spinlosen Teilchens mit
einem Freiheitsgrad aufgefasst werden, wurde in § 18 : 4.5* plausibel gemacht;
was P anbetrifft, geben wir in § 25 (4.1 (d) und 3.5 (a)) eine tiefergehende Be-
gründung.
Wir notieren einige typische Eigenschaften dieser Operatoren:
(a) Der Definitionsbereich S ist ein dichter Teilraum von H = L2 (Ê).
(b) P und Q sind symmetrisch:
u, P v = P u, v , u , Qv = Qu , v für alle u, v ∈ S .
(c) P und Q sind unbeschränkt.
(e) P und Q besitzen symmetrische Fortsetzungen.
Nachweis der Eigenschaften (a)–(e):
c (Ê) ⊂ S .
(a) folgt aus § 20 : 8.5 (a) und C∞
(b) Es gilt

+∞ 
+∞
u , Qv = u(x) x v(x) dx = x u(x) v(x) dx = Qu , v ,
−∞ −∞
1 Definitionen und Beispiele 643

und partielle Integration ergibt


  
u, P v = −i u v  dx = i u v dx = −iu v dx = P u , v .
Ê Ê Ê
2
(c) Für un (x) := (2n/π)1/4 e−nx gilt un  = 1, P un 2 = un  = n
2
ÜA ,
/n  = 1, Qu
also u /n 2 = n nach § 12 : 3.
(d) Eine Fortsetzung Q : D → H des Ortsoperators Q : S → H erhalten wir

+∞
durch Qu = x·u auf D = {u ∈ H | |x·u(x)|2 dx < ∞ }. Der Impulsoperator
−∞
P lässt sich durch P u = −i u auf den Teilraum

Ê Ê
W1 ( ) = { u ∈ L2 ( ) | u absolutstetig, u ∈ L2 ( ) } Ê
fortsetzen, vgl. § 8 : 3.1, 3.2. Wir zeigen später, dass die so definierten Fortset-
zungen maximal symmetrisch sind, d.h. ihrerseits keine echten symmetrischen
Fortsetzungen besitzen.

1.2 Vertauschungsrelation und unbeschränkte Operatoren


Typisch für die Quantenmechanik ist das Auftreten von Observablenpaaren,
welche die kanonische Vertauschungsrelation AB − BA = −i½ erfüllen. Die
dieser Relation genügenden Operatoren P und Q erwiesen sich als unbeschränkt.
Dass die Vertauschungsrelation prinzipiell nicht durch beschränkte Operatoren,
insbesondere nicht durch n × n–Matrizen erfüllbar ist, besagt der
Satz von Wintner (1929). Für beschränkte Operatoren A, B auf einem nor-
mierten Raum kann die Gleichung AB − BA = α½ nur für α = 0 gelten.
Beweis nach Wielandt (1949).
Aus AB − BA = α½ folgt
A2 B − BA2 = A(AB − BA) + (AB − BA)A = 2αA ,
A3 B − BA3 = A(A2 B − BA2 ) + (AB − BA)A2 = 3αA2
und entsprechend durch Induktion
An B − BAn = n α An−1 für alle n ∈ Æ.
Daraus ergibt sich
n · |α| · An−1  ≤ An−1 AB + BA An−1  ≤ 2 A · B · An−1  .
Im Fall An = 0 für alle n ∈ Æ folgt n |α| ≤ 2A · B für alle n ∈ Æ, also
α = 0.
Andernfalls gibt es ein m ∈ Æ mit Am = 0 und Am−1 = 0 . Daraus ergibt sich
mαAm−1 = Am B − BAm = 0, also ebenfalls α = 0. 2
644 § 23 Unbeschränkte Operatoren

1.3 Lineare Operatoren


(a) Ein linearer Operator auf einem Hilbertraum H ist ein Paar A =
(D, L), bestehend aus einem dichten Teilraum D von H und einer linearen
Abbildung

L:D→H .

Gleichheit zweier Operatoren A1 = (D1 , L1 ) und A2 = (D2 , L2 ) bedeutet im


Folgenden in erster Linie Gleichheit der Definitionsbereiche und dann natürlich
auch der Operationsvorschriften:

D1 = D2 und L1 u = L2 u für alle u ∈ D1 = D2 .

Dass der Definitionsbereich eine entscheidende Rolle spielen wird, hat folgenden
Grund: Dieselbe Operationsvorschrift L (z.B. u → − Δu ) kann je nach Defini-
tionsbereich Operatoren mit ganz verschiedenen Eigenschaften liefern, wie wir
in den folgenden Beispielen vorführen.
Meist werden wir bequemlichkeitshalber dem in der Literatur üblichen, nicht
ganz konsequenten Sprachgebrauch folgen: Ein linearer Operator A ist gegeben
durch seinen Definitionsbereich D(A) und die Vorschrift

A : D(A) → H , u → Au .

Von besonderem Interesse sind symmetrische Operatoren A, gekennzeichnet


durch
u , Av = Au , v für u, v ∈ D(A) .

(b) Beispiele. Auf H = L2 [a, b] betrachten wir die Operatoren A0 , A1 , A2 , A3


mit der Operationsvorschrift
L = − Δ : u → −u
und den Definitionsbereichen
D(A0 ) = C∞
c (]a, b[),
 
D(A1 ) = C20 [a, b] := u ∈ C2 [a, b] | u(a) = u(b) = 0 ,
 
D(A2 ) = C2per [a, b] := u ∈ C2 [a, b] | u(a) = eiϕ u(b) , u (a) = eiϕ u (b)
mit einer festen Zahl ϕ ∈ Ê,
D(A3 ) = C2 [a, b] .

A0 heißt der minimale Laplace–Operator auf [a, b], A1 ist im Wesentlichen


der Hamilton–Operator eines in ]a, b[ eingesperrten Teilchens mit einem Frei-
heitsgrad und A2 tritt im Zusammenhang mit periodischen Bewegungen bzw.
1 Definitionen und Beispiele 645

Bewegungen eines Teilchens in einer Raumrichtung eines Kristallgitters auf. A3


hat keine physikalische Bedeutung.
Wir machen uns zunächst klar, dass A0 , A1 , A2 , A3 lineare Operatoren sind.
Hierzu ist zu zeigen, dass sie dicht definiert, d.h. dass ihre Definitionsberei-
che dicht in H sind. Dies folgt für A0 aus § 20 : 8.5 (a) und für die anderen
Operatoren wegen D(A0 ) ⊂ D(Ak ) für k = 1, 2, 3.
Die Operatoren A1 , A2 , A3 sind zwar Fortsetzungen von A0 , unterscheiden sich
aber in folgenden Punkten:
A0 und A1 sind injektiv, Kern A2 = { u ∈ D(A2 ) | u = 0 } ist für ϕ = 0
eindimensional, und Kern A3 ist zweidimensional.
A0 , A1 und A2 sind symmetrisch ( ÜA , zweimalige partielle Integration).
A3 ist nicht symmetrisch ( ÜA , betrachten Sie u(x) = 1, v(x) = x2 ).
Weitere wesentliche Unterschiede zwischen A1 und A2 werden in 3.6 (a) disku-
tiert.
(c) Wir betrachten im Folgenden mehrfach den Raum
H × H = { (u1 , u2 ) | u1 , u2 ∈ H }
mit der Vektorraumoperation
α(u1 , u2 ) + β(v1 , v2 ) = (αu1 + βv1 , αu2 + βv2 ).
Ausgestattet mit dem Skalarprodukt
(u1 , u2 ) , (v1 , v2 ) H ×H := u1 , v1 + u2 , v2
und der zugehörigen Norm
 1/2
(u1 , u2 )H ×H = u1 2 + u2 2
ist H × H ein Hilbertraum ÜA .
Der Graph G(A) eines Operators A,
G(A) := {(u, Au) | u ∈ D(A)} ,
ist offenbar ein Teilraum von H × H .
Zwei Operatoren A, B sind genau dann gleich, wenn ihre Graphen als Mengen
gleich sind : G(A) = G(B).

1.4 Fortsetzung von Operatoren


(a) Ein Operator A2 = (D2 , L2 ) heißt eine Fortsetzung des Operators A1 =
(D1 , L1 ), wenn D1 ⊂ D2 und L2 u = L1 u für u ∈ D1 gilt. Für die Graphen
bedeutet dies G(A1 ) ⊂ G(A2 ). Wir schreiben hierfür kurz
A1 ⊂ A2 .
646 § 23 Unbeschränkte Operatoren

Für die in 1.3 (b) beschriebenen Operatoren gilt A0 ⊂ A1 , A2 ⊂ A3 . Dagegen


gilt weder A1 ⊂ A2 noch A2 ⊂ A1 ÜA .

(b) Ist ein Operator A = (D, L) beschränkt, so besitzt er eine eindeutig be-
stimmte Fortsetzung zu einem beschränkten Operator A ∈ L (H ), vgl. § 21 : 2.9.
Unbeschränkte Operatoren lassen sich dagegen auf verschiedene Weise fortset-
zen, vgl. 1.3 (b).

(c) Von besonderem Interesse sind symmetrische Fortsetzungen symmetrischer


Operatoren. Ohne Beweis sei mitgeteilt, dass jeder symmetrische Operator A
mindestens eine maximal symmetrische Fortsetzung B besitzt, d.h. es gibt
wenigstens einen symmetrischen Operator B, der seinerseits keine echte symme-
trische Fortsetzung besitzt, siehe Reed-Simon [130, II] X.3, Riesz–Nagy [131]
Nr. 123.
Ein unbeschränkter Operator lässt sich nicht zu einem auf dem ganzen Raum
H definierten symmetrischen Operator fortsetzen. Das besagt der

Satz von Hellinger und Toeplitz (1910). Ein symmetrischer Operator A mit
D(A) = H ist beschränkt.

Beweis.
Angenommen, A : H → H ist symmetrisch und unbeschränkt. Dann gibt es
Vektoren vn ∈ H mit vn  = 1 und Avn  → ∞. Wir betrachten die Folge
von linearen Funktionalen

Ln : u → Avn , u = vn , Au .

Wegen |Ln u| ≤ vn  · Au = Au sind diese punktweise beschränkt, also
normbeschränkt (§ 21 : 4.3). Mit Ln  = Avn  → ∞ für n → ∞ ergibt sich
ein Widerspruch. 2

1.5 Unbeschränkte Multiplikatoren


(a) Multiplikatoren im 2 . Für jede komplexe Zahlenfolge a = (a1 , a2 , . . . )
ist durch
  
∞ 
D(Ma ) := x = (x1 , x2 , . . . ) ∈ 2  |ak |2 · |xk |2 < ∞ ,
k=1

Ma : x = (x1 , x2 , . . . ) −→ (a1 x1 , a2 x2 , . . . )

ein linearer Operator Ma definiert, denn D(Ma ) enthält offensichtlich den in


2 dichten Teilraum 20 = Span {e1 , e2 , . . . } .
Dieser Operator ist nach § 21 : 2.6 genau dann überall definiert und damit be-
schränkt, wenn die Folge (an ) beschränkt ist.
2 Abgeschlossene Operatoren 647

(b) Multiplikatoren in L2 (Ω, μ). Sei (Ω, A, μ) ein σ–endlicher Maßraum


und v : Ω → eine beliebige A–messbare Funktion. Dann ist durch
 
D(Mv ) := u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)
und die Vorschrift u → v · u ein linearer Operator Mv auf L2 (Ω, μ) definiert.
Nach § 21 : 2.7 ist dieser genau dann unbeschränkt, wenn v ∈ L∞ (Ω, μ).
Dass D(Mv ) dicht in L2 (Ω, μ) liegt, ergibt sich wie folgt: Für n = 1, 2, . . . ist
    
Bn := |v| ≤ n = ω ∈ Ω  |v(ω)| ≤ n ∈ A.
Für eine gegebene Funktion u ∈ L2 (Ω, μ) und un := u · χBn gilt
|un |2 ≤ |u|2 und | v · un |2 ≤ n2 |u|2 ,
also un , v · un ∈ L2 (Ω, μ) und somit un ∈ D(Mv ). Nach Konstruktion besitzt
die Funktionenfolge (|u − un |2 ) die Majorante |u|2 und konvergiert punktweise
gegen Null. Daher gilt u − un 2 → 0 nach dem Satz von der majorisierten
Konvergenz § 20 : 5.2. 2

2 Abgeschlossene Operatoren
2.1 Der Abschluss eines symmetrischen Operators
(a) Im folgenden stellen wir lineare Operatoren in der vereinfachten Form
A : D(A) → H , u → Au
dar, siehe 1.3 (a). Für einen symmetrischen Operator A mit Definitionsbereich
D(A) konstruieren wir eine Fortsetzung A durch Grenzübergang:
Wir legen den Definitionsbereich D(A) fest durch
(
Es gibt eine Folge (un ) in D(A) mit u = lim un ,
u ∈ D(A) : ⇐⇒ n→∞
für welche die Folge (Aun ) konvergiert.
Für u ∈ D(A) und eine Folge (un ) der genannten Art setzen wir
Au := lim Aun .
n→∞

Satz. Durch diese Vorschrift ist eine symmetrische Fortsetzung A von A defi-
niert. Der Graph von A ist der Abschluss des Graphen von A in H × H .
Wir nennen A den Abschluss von A. Durch Abschließung entstandene Ope-
ratoren haben ausgezeichnete Eigenschaften, die wir in 2.2 diskutieren. Weitere
Anmerkungen folgen in 2.3, Beispiele werden in Abschnitt 3 gegeben.
Beweis.
(i) Wohldefiniertheit von A. Seien (un ), (vn ) Folgen in D(A), so dass
u = lim un = lim vn , g = lim Aun , h = lim Avn
n→∞ n→∞ n→∞ n→∞
existieren.
648 § 23 Unbeschränkte Operatoren

Zu zeigen ist g = h. Nach dem Fundamentallemma § 9 : 3.2 genügt es nachzu-


weisen, dass g − h orthogonal zu dem in H dichten Teilraum D(A) ist.
Sei v ∈ D(A). Wegen der Symmetrie von A, der Stetigkeit des Skalarprodukts
und wegen lim (un − vn ) = 0 ergibt sich
n→∞

v , g − h = lim v , A(un − vn ) = lim Av , un − vn = 0.


n→∞ n→∞

(ii) Die Linearität und die Symmetrie von A folgen direkt aus der Definition
von A und der Stetigkeit des Skalarprodukts ÜA .
(iii) A ist eine Fortsetzung von A und daher dicht definiert, denn für u ∈ D(A)
hat die konstante Folge un = u die Eigenschaften lim un = u, lim Aun = Au.
n→∞ n→∞
Es folgt u ∈ D(A) und Au = Au.
(iv) G(A) ist der Abschluss von G(A) in H × H . Dies liegt daran, dass eine
Folge (un , vn ) in H × H genau dann gegen (u, v) konvergiert, wenn un → u
und vn → v in H . Daher gilt (u, v) ∈ G(A) genau dann, wenn es eine Folge
(un ) in D(A) gibt mit un → u, Aun → v für n → ∞. Dies heißt aber gerade
u ∈ D(A) und v = Au, d.h. (u, v) ∈ G(A). 2

(b) Ein Operator A heißt abschließbar, wenn folgendes gilt: Sind (un ), (vn )
Folgen in D(A) mit demselben Limes u und konvergieren die Folgen (Aun ),
(Avn ), so ist lim Aun = lim Avn . Wir können dann den Abschluss A wie
n→∞ n→∞
oben definieren:

Es gibt eine Folge (un ) in D(A)
u ∈ D(A) , Au = v : ⇐⇒
mit u = lim un , v = lim Aun .
n→∞ n→∞

Wie in (a) folgt: G(A) ist der Abschluss von G(A) in H × H .


Nicht jeder Operator ist abschließbar.
Das zeigt das folgende Beispiel: Sei H = L2 [0, 2] und 0 = h ∈ H . Für v ∈
D(A) := C[0, 2] sei Av := v(0) h. Für die Funktion u := χ[0,1] ∈ H \ D(A)
gibt es stetige Funktionen un , vn mit lim un = u = lim vn und un (0) = 1,
n→∞ n→∞
vn (0) = 0 ( ÜA , Skizze). Für diese gilt Aun = h, Avn = 0 = h.

Der Beweis der folgenden Aussagen sei den Lesern zur Einübung der Begriffe
nahegelegt.
(c) Für abschließbare Operatoren gilt
A ⊂ B =⇒ A ⊂ B .
(d) Sei A abschließbar und T ein beschränkter Operator. Wir definieren A + T
durch
(A + T ) u := A u + T u für u ∈ D(A + T ) := D(A) .
2 Abgeschlossene Operatoren 649

Dann ist A + T abschließbar, und es gilt

A+T = A+T , D(A + T ) = D(A) .


Insbesondere ist für jeden symmetrischen Operator A und für λ ∈ der auf
D(A) definierte Operator A − λ : u → Au − λu abschließbar mit

A − λ = A − λ.

2.2 Abgeschlossene Operatoren und Graphennorm


(a) Ein Operator A heißt abgeschlossen, wenn der Graph von A in H × H
abgeschlossen ist, d.h. wenn folgendes gilt:
Existieren für eine Folge (un ) in D(A) die Limites u = lim un , v = lim Aun ,
n→∞ n→∞
so folgt u ∈ D(A) und Au = v.

(b) Beispiele. (i) Für einen abschließbaren Operator A ist A abgeschlossen,


da G(A) = G(A) abgeschlossen in H × H ist.
(ii) Jeder Operator T ∈ L (H ) ist abgeschlossen.
(iii) Die in 1.5 (b) definierten Multiplikatoren Mv sind abgeschlossen.
Denn sei (un ) eine Folge in D(Mv ), für welche die Grenzwerte

u = lim un , w = lim Mv un = lim v un


n→∞ n→∞ n→∞

existieren. Nach § 20 : 7.2 gibt es eine Teilfolge (unk )k mit

u(ω) = lim unk (ω) μ–f.ü. , w(ω) = lim v(ω) unk (ω) μ–f.ü.
k→∞ k→∞

Es folgt v(ω) u(ω) = lim v(ω) unk (ω) = w(ω) μ–f.ü., d.h. u ∈ L2 (Ω, μ), v u =
k→∞
w ∈ L2 (Ω, μ) und damit u ∈ D(Mv ), w = Mv u.
(iv) ÜA Zeigen Sie: Die in 1.5 (a) definierten Multiplikatoren auf 2 sind ab-
geschlossen.

(c) Für einen Operator A : D(A) → H ist durch

u, v A := u , v + Au , Av

offensichtlich ein Skalarprodukt auf D(A) gegeben. Die zugehörige Norm  · A


heißt die Graphennorm von A.
Satz. Bezüglich dieser Norm ist A ein stetiger Operator, genauer:

T : (D(A),  · A ) → (H ,  · ) , u → Au

ist stetig mit T  ≤ 1 und T  = 1, falls A unbeschränkt ist ÜA .


650 § 23 Unbeschränkte Operatoren

(d) Satz. Ein Operator A ist genau dann abgeschlossen, wenn D(A) bezüglich
des zur Graphennorm gehörigen Skalarprodukts ein Hilbertraum ist.
Ein abgeschlossener Operator vermittelt also eine beschränkte lineare Abbildung
zwischen den Hilberträumen (D(A),  · A ) und (H ,  · ).

Beweis.
Wir bezeichnen das Skalarprodukt in H × H mit · , · H ×H und die zu-
gehörige Norm mit  · H ×H . Offenbar ist die Abbildung

U : (D(A),  · A ) → (G(A),  · H ×H ) , u → (u, Au)

bijektiv und wegen der Linearität von A linear. Nach Definition der Graphen-
norm ist sie ferner isometrisch, also insgesamt unitär. Somit ist (D(A),  · A )
genau dann vollständig, wenn (G(A),  · H ×H ) vollständig, d.h. abgeschlossen
in H × H ist, vgl. § 9 : 2.1. 2

(e) Folgerung. Ist ein abgeschlossener Operator

A : D(A) → H

bijektiv, so ist A−1 : H → D(A) beschränkt, d.h. A−1 ∈ L (H ).


Diese Folgerung bildet die Grundlage für die Übertragung der Sätze über Spek-
trum und Resolvente auf abgeschlossene unbeschränkte Operatoren, Näheres in
Abschnitt 5.

Beweis.
Nach dem Satz § 21 : 3.1 (a) über stetige Inverse gibt es eine Konstante C ≥ 0
mit
 −1 
A u ≤ C u
A

für alle u ∈ H . (Beachten Sie, dass Bild A−1 = D(A).) Es folgt


 −1 2    
A u ≤ A−1 u2 + u2 = A−1 u2 ≤ C 2 u2
A

für alle u ∈ H . 2

2.3 Gene abgeschlossener Operatoren


(a) Sei A ein abgeschlossener Operator. Jeder Operator B mit B = A heißt
ein Gen für A; sein Definitionsbereich D(B) heißt Genbereich (engl. core =
Kern, Kernstück) für A.
Zwei Operatoren B, C heißen wesentlich gleich, wenn sie abschließbar sind
und wenn B = C gilt.
3 Der Abschluss gewöhnlicher Differentialoperatoren 651

Folgende Aussagen über einen Operator B sind äquivalent:


(i) B ist ein Gen für den abgeschlossenen Operator A,
(ii) G(A) ist der Abschluss von G(B) in H × H ,
(iii) B ⊂ A und D(B) liegt dicht in D(A) bezüglich der Graphennorm  · A .
Dies ergibt sich aus dem Vorangehenden.

(b) Bemerkungen. Die Namensgebung ist in der Literatur nicht einheitlich.


Die von uns getroffene Wortwahl soll ausdrücken, dass ein Gen eines abgeschlos-
senen Operators bereits alle wesentlichen Informationen über diesen enthält.
Im folgenden werden Kriterien entwickelt, die es gestatten, anhand geeigneter
Gene auf Eigenschaften des Abschlusses zu schließen.
Im Allgemeinen ist die explizite Bestimmung des Abschlusses eines konkret ge-
gebenen Operators schwierig, wenn überhaupt möglich; denken Sie etwa an den
Ê
Laplace–Operator −Δ auf einem Gebiet Ω des n mit dem natürlichen Defi-
nitionsbereich {u ∈ C2 (Ω) ∩ C(Ω) | u = 0 auf ∂Ω}. Für die Anwendung von
Hilbertraummethoden auf Differentialgleichungen und für die mathematischen
Grundlagen der Quantenmechanik genügt zunächst allein die Existenz des Ab-
schlusses, um die Lösbarkeit bestimmter Gleichungen zu garantieren. Erst wenn
spezielle Eigenschaften dieser Lösungen gefragt sind, z.B. Differenzierbarkeits-
eigenschaften im klassischen Sinn, muss der Definitionsbereich des Abschlusses
genauer untersucht werden. Hierfür gibt es eine ganze Industrie (Theorie der
Sobolew–Räume, Regularitätstheorie, siehe § 14, Abschnitt 6).
Für eine Reihe gewöhnlicher Differentialoperatoren lässt sich der Abschluss ex-
plizit bestimmen. Wir führen dies im nächsten Abschnitt aus, um Beispielma-
terial auch für die nachfolgenden Begriffe zur Verfügung zu haben. Wie schon
oben bemerkt wurde, ist die Bestimmung solcher Abschlüsse für den Fortgang
der Theorie nicht unbedingt erforderlich.

3 Der Abschluss gewöhnlicher Differentialoperatoren


3.1 Der Raum W1 [a, b]
Satz. Für jedes kompakte Intervall [a, b] ist der Raum
  
W1 [a, b] := u ∈ L2 [a, b]  u ist absolutstetig, u ∈ L2 [a, b] ,
versehen mit dem Skalarprodukt
  b b
u, v 1 = u , v + u , v  = u v dλ + u v  dλ ,
a a
ein Hilbertraum.
Die Konvergenz u − un 1 → 0 impliziert die gleichmäßige Konvergenz un → u
auf [a, b].
Der Raum C∞ [a, b] liegt bezüglich der Norm  · 1 dicht in W1 [a, b].
652 § 23 Unbeschränkte Operatoren

Folgerung. Die Räume C∞ [a, b] und C1 [a, b] sind Genbereiche für den abge-
schlossenen Operator
A : u → −iu mit D(A) = W1 [a, b] .

Beweis.
(a) Sei (un ) eine Cauchy–Folge in W1 [a, b]. Wegen
um − un 21 = um − un 2 + um − un 2
sind (un ), (un ) Cauchy–Folgen in L2 [a, b] , also gibt es Funktionen u, v ∈
L2 [a, b] mit
un → u , un → v im Quadratmittel.

Nach dem Hauptsatz § 8 : 3.2 gilt


x
(∗) un (x) − un (a) = un dλ .
a

Für
x x
fn (x ) := un (x) − un (a) = un dλ , f (x) := v dλ
a a
gilt
 x  b
| f (x) − fn (x) | =  (v − un ) dλ  ≤ 1 · | v − un | dλ
a a

≤ b − a · v − un 
nach der Cauchy–Schwarzschen Ungleichung, also gilt fn → f gleichmäßig auf
[a, b]. Es folgt fn → f im Quadratmittel, also

un (a) · χ[a,b] = un − fn → u − f im Quadratmittel.

Dies ist nur möglich, wenn α := lim un (a) existiert.


n→∞

Damit haben wir die gleichmäßige Konvergenz un (x) → α + f (x) auf [a, b], also
mit (∗)
x
u(x) − α = lim fn (x) = v dλ .
n→∞
a

Nach dem Hauptsatz folgt die Absolutstetigkeit von u, α = u(a) und u = v.


Damit gilt u ∈ W1 [a, b] und un (x) → u(a) + f (x) = u(x) gleichmäßig auf [a, b].
Da daraus u − un  → 0 folgt und wegen un − v = un − u  → 0 ergibt
sich
u − un 1 → 0 für n → ∞ .
3 Der Abschluss gewöhnlicher Differentialoperatoren 653

(b) Für u ∈ W1 [a, b] gilt u ∈ L2 [a, b], also gibt es nach § 20 : 8.5 (a) Funktionen
ψn ∈ C∞ 
c (]a, b[) mit u − ψn  → 0. Wir setzen
x
ϕn (x) := u(a) + ψn dλ .
a
x
Dann gilt ϕn ∈ C∞ [a, b] sowie ϕn (x) → u(a) + u dλ = u(x) gleichmäßig auf
a
[a, b] und somit u − ϕn 1 → 0 nach denselben Schlüssen wie oben.

(c) Die Norm  · 1 ist die Graphennorm von A : u → −iu auf W1 [a, b],
daher ist A abgeschlossen nach 2.2 (d). Da C∞ [a, b] und damit auch C1 [a, b]
bezüglich dieser Norm dicht in D(A) liegen, folgen die übrigen Behauptungen
aus 2.3 (a). 2

3.2 Symmetrische Differentialoperatoren 1. Ordnung auf [a, b]


Der durch D(A) = W1 [a, b], Au = −iu definierte Operator ist also abgeschlos-
sen, aber nicht symmetrisch. Denn für u, v ∈ D(A) ergibt sich durch partielle
Integration gemäß § 8 : 3.3

(∗) u , Av − Au , v = i u(b) v(b) − u(a) v(a) ,

und für u(x) = x − a, v(x) = 1 ist die rechte Seite von Null verschieden.
Um einen symmetrischen Operator B mit der Vorschrift u → −iu zu erhalten,
muss der Definitionsbereich von A eingeschränkt werden, z.B. durch Randbe-
dingungen. Als notwendige Bedingung für die Symmetrie von B ergibt sich aus
(∗) u(b) v(b) = u(a) v(a) für u, v ∈ D(B), insbesondere |u(a)| = |u(b)| für
u ∈ D(B). Existiert daher ein u ∈ D(A) mit u(b) = 0, so gibt es ein ϕ ∈ mit Ê
u(a) = eiϕ u(b) und damit auch v(a) = eiϕ v(b) für alle v ∈ D(B). Andernfalls
gilt u(a) = u(b) = 0 für alle u ∈ D(B).
Soll also der Operator A allein durch Randbedingungen zu einem symmetrischen
Operator eingeschränkt werden, so müssen diese entweder von der Form u(a) =
u(b) = 0 oder von der periodischen Form u(a) = eiϕ u(b) sein.

Satz. (a) Der Operator A0 : u → −iu auf


  
D(A0 ) = W01 [a, b] := u ∈ W1 [a, b]  u(a) = u(b) = 0

ist symmetrisch und abgeschlossen. Ein Genbereich für A0 ist C∞


c (]a, b[).

(b) Der Operator A0 besitzt unendlich viele symmetrische abgeschlossene Fort-


setzungen: Für jede Zahl ϕ ∈ ]−π, π] ist der Operator Pper : u → −iu mit
  
D(Pper ) = Dϕ := u ∈ W1 [a, b]  u(a) = eiϕ u(b)

symmetrisch und abgeschlossen mit Genbereich {u ∈ C∞ [a, b] | u(a) = eiϕ u(b)}.


654 § 23 Unbeschränkte Operatoren

Bemerkungen. Dies sind die einzigen abgeschlossenen symmetrischen, in A


enthaltenen Fortsetzungen von A0 , denn eine Fortsetzung kann nur durch Ab-
schwächung der an D(A0 ) gestellten Bedingungen, also der Randbedingungen
geschehen. Hierfür kommen nach den oben angestellten Überlegungen nur noch
die periodischen in Frage. In § 24 zeigen wir, dass jeder der Operatoren Pper
maximal symmetrisch ist. Eine ausführliche Diskussion der Fortsetzungen von
A0 finden Sie in Reed–Simon [130, II] X.1, example 1.

Beweis.
(i) Symmetrie und Abgeschlossenheit. Die Symmetrie der Operatoren A0 , Pper
folgt unmittelbar aus (∗). Ist (un ) eine Folge in D(A0 ) (bzw. D(Pper )), für welche
u = lim un , v = lim un im L2 –Sinn existieren, so folgt nach 3.1 erstens
n→∞ n→∞
u ∈ W1 [a, b], u = v und zweitens u(a) = u(b) = 0 (bzw. u(a) = eiϕ u(b)), da
die un gleichmäßig gegen u konvergieren.

(ii) Wegen C∞ ∞
c (]a, b[) ⊂ D(A0 ) ist der Abschluss von Cc (]a, b[) bezüglich der
Graphennorm von A0 in der diesbezüglich abgeschlossenen Menge D(A0 ) ent-
halten. Wir konstruieren zu gegebener Funktion u ∈ D(A0 ) Testfunktionen ϕn
mit u − ϕn 2 + u − ϕn  = u − ϕn A0 → 0 für n → ∞.
2

Da C∞ ∞
c (]a, b[) in L [a, b] dicht ist, gibt es Funktionen ψn ∈ Cc (]a, b[) mit
2

   b
u − ψn 2 = |u − ψn |2 dλ → 0 .
a

Mit der Cauchy–Schwarzschen Ungleichung ergibt sich die gleichmäßige Kon-


vergenz
 x   x  √
 u(x) − ψn dλ  =  (u − ψn ) dλ  ≤ b − a u − ψn  → 0
a a

b
für n → ∞ ; für cn := ψn dλ folgt insbesondere lim cn = u(b) = 0.
n→∞
a

Durch
x
Ψn (x) = ψn dλ
a

sind C∞ –Funktionen gegeben, die in einer rechtsseitigen Umgebung von a ver-


schwinden und in einer linksseitigen Umgebung von b konstant gleich cn sind.
Sind alle Ψn Testfunktionen, so setzen wir ϕn := Ψn und erhalten u − ϕn  →
0. Andernfalls wählen wir ein Ψm mit Ψm (b) = 0, setzen η := Ψm /Ψm (b) und
definieren

ϕn := Ψn − cn η ∈ C∞
c (]a, b[) .
3 Der Abschluss gewöhnlicher Differentialoperatoren 655

Mit den Ψn konvergieren auch die ϕn gleichmäßig und damit im L2 –Sinn gegen
u, und es gilt u − ϕn  ≤ u − ψn  + |cn | · η   → 0 für n → ∞.
 sich aus der Tatsache, dass Pper als Genbereich
Der Rest des Beweises ergibt
die Klasse { u ∈ C∞ [a, b]  u(a) = eiϕ u(b) } besitzt (Nachweis als nachfolgende
Aufgabe). 2

(c) Aufgabe. Zeigen Sie auf ähnliche Weise wie oben, dass
  
u ∈ C∞ [a, b]  u(a) = eiϕ u(b) ein Genbereich für Pper ist.

3.3 Die Sobolew–Räume W1 ( Ê +) und W1 ( Ê)


Satz. Für jedes der Intervalle I =

Ê + bzw. I = Ê ist
 
1
W (I) := u ∈ L (I)  u ist absolutstetig, u ∈ L2 (I)
2

ein Hilbertraum mit dem Skalarprodukt


 
u, v 1 = u , v + u , v  = u v dλ + u v  dλ .
I I
Für u ∈ W1 (I) gilt lim u(x) = 0 und
|x|→∞

u∞ ≤ u1 ,

also impliziert die Konvergenz u − un 1 → 0 die gleichmäßige Konvergenz


un → u auf I.
Der Raum C∞ Ê
c ( ) liegt bezüglich der Norm  · 1 dicht in W ( ).
1
Ê
Beweis.
(a) Sei (un ) eine Cauchy–Folge in (W1 (I),  · 1 ). Dann sind (un ), (un ) Cau-
chy–Folgen in (L2 (I),  · ), also gibt es Funktionen u, v ∈ L2 (I) mit
u − un  → 0 , v − un  → 0 für n → ∞ .
Für jedes kompakte Intervall J ⊂ I ist (un ) auch eine Cauchy–Folge in W1 (J).
Aus 3.1 erhalten wir daher die Absolutstetigkeit von u und u = v auf jedem
kompakten Intervall, somit u = v ∈ L2 (I) und
u − un  → 0 , u − un  → 0 .
(b) Es bleibt zu zeigen, dass u absolutstetig auf ganz I ist und im Unendli-
chen verschwindet. Wir betrachten hierzu der Einfachheit halber I = + . Nach Ê
§ 8 : 3.1 und dem Hauptsatz § 8 : 3.2 gilt
x x
|u(x)|2 = |u(0)|2 + ( u · u) dλ = |u(0)|2 + ( u · u + u · u ) dλ
0 0

für alle x ≥ 0. Somit existiert


lim |u(x)|2 = |u(0)|2 + u , u + u , u .
x→∞
656 § 23 Unbeschränkte Operatoren

Ê
Wegen u ∈ L2 ( +) muss dieser Limes Null sein. Zum Nachweis der Absolut-
Ê
stetigkeit von u auf + gemäß der Definition § 8 : 3.1 wählen wir zu gegebenem
ε > 0 ein R > 0 mit |u(x)| < ε für x > R und nützen die Absolutstetigkeit von
u auf [0, R] aus ÜA .
Für I = Ê argumentieren wir entsprechend.
(c) Wie in (b) erhalten wir für u ∈ W1 (I)
x
|u(x)|2 = |u(y)|2 + ( u  · u + u · u ) dλ .
y

Für y → ∞ ergibt sich nach (b) und der Cauchy–Schwarzschen Ungleichung


 ∞ 
|u(x)|2 =  ( u  · u + u · u ) dλ  ≤ 2 · u · u  ≤ u2 + u 2
x

für alle x ∈ I, somit u∞ ≤ u1 .


Ê
(d) Sei u ∈ W1 ( ) und ε > 0 vorgegeben. Wir wählen ein R > 0 mit
 
|u(x)| ≤ ε für |x| ≥ R und |u|2 + |u |2 dλ < ε2 .
|x|≥R

Für

⎪ u(x) für −R ≤ x ≤ R,

⎨ u(R) (R + 1 − x) für R < x < R + 1,
v(x) :=

⎪ u(−R) (x + R + 1) für −R − 1 < x < −R,

0 sonst

Ê
gilt dann ÜA v ∈ W1 ( ) und u − v1 < 3 · 2 · ε. (Beachten Sie, dass
|u(x) − v(x)| ≤ 2ε und |u (x) − v  (x)| ≤ |u (x)| + ε für R < |x| < R + 1.) Nach
3.2 (b) gibt es eine auf ]−R −1, R +1[ lebende Testfunktion ϕ mit v − ϕ1 < ε.
Für diese gilt dann u − ϕ1 < 6ε. 2

3.4 Der Impulsoperator auf W1 ( Ê)


Ê
(a) Der auf W1 ( ) definierte Operator P : u → −iu ist abgeschlossen und
symmetrisch. Genbereiche für P sind C∞ Ê
c ( ) und S (vgl. 1.1).

P heißt der (maximal definierte) Impulsoperator auf . Dieser dient zur Ê


Beschreibung des Impulses eines längs einer Geraden frei beweglichen Teilchens.

Ê Ê
(b) Der durch D(A) := W01 ( +) = {u ∈ W1 ( +) | u(0) = 0} und Au = − iu
für u ∈ D(A) gegebene Differentialoperator A ist ebenfalls abgeschlossen und
symmetrisch; ein Genbereich ist C∞
c ( >0 ). Ê
Wie wir später sehen werden, entspricht diesem keine quantenmechanische Ob-
servable.
3 Der Abschluss gewöhnlicher Differentialoperatoren 657

Beweis.
(a) Die Graphennorm von P ist gegeben durch u2P = u2 + u 2 . Nach 3.3
liegt C∞ Ê 1
c ( ) bezüglich dieser Norm dicht in W ( ). Ê
Wegen C∞ Ê Ê
) ⊂ S ⊂ W ( ) ist daher auch S ein Genbereich für P . Da der
c (
1

auf S definierte Impulsoperator nach 1.1 symmetrisch ist, gilt dies nach 2.1
auch für den Abschluss.

(b) Die Symmetrie von A ergibt sich durch partielle Integration wegen der
Randbedingungen u(a) = 0 und lim u(x) = 0 für u ∈ D(A) ÜA .
x→∞

Ist (un ) eine Cauchy–Folge in (D(A),  · A ), so gibt es nach 3.3 ein u ∈ W1 ( +) Ê


Ê
mit lim u − un 1 = 0. Da (un ) auf + gleichmäßig konvergiert, folgt u(0) =
Ê
n→∞
lim un (0) = 0, also u ∈ D(A). Dass C∞
c ( >0 ) ein Genbereich ist, ergibt sich
n→∞
wie im Beweis 3.3 (c) ÜA . 2

3.5 Der Hamilton–Operator eines in ]a, b[ eingesperrten Teilchens


(a) Der Laplace–Operator
− Δ : u → − u
mit Definitionsbereich

D(−Δ) = { u ∈ W01 [a, b] | u ∈ W1 [a, b] }


= { u ∈ C1 [a, b] | u ∈ W1 [a, b] , u(a) = u(b) = 0 }

ist abgeschlossen und symmetrisch.

(b) Ein Genbereich für − Δ ist C20 [a, b] = { u ∈ C2 [a, b] | u(a) = u(b) = 0 }.
Der Operator H := − 21 Δ wird als Hamilton–Operator eines in ]a, b[ einge-
sperrten Teilchens mit einem Freiheitsgrad aufgefasst (h̄ = m = 1).

Beweis.
(a) Wir lassen den Vorfaktor 12 außer Acht und bezeichnen den Operator − Δ
mit H. Partielle Integration und die Cauchy–Schwarzsche Ungleichung ergeben
b b
|u |2 dλ = [ u u ]a − u u dλ = − u , u ≤ u · u  ,
b

a a

also
1

(∗) u 2 ≤ u · u  ≤ 2 u2 + u 2 .

Ist daher (un ) eine Cauchy–Folge in (D(H),  · H ), so ist (un ) eine Cauchy–
Folge in (W01 [a, b] ,  · 1 ) und (un ) eine Cauchy–Folge in (W1 [a, b] ,  · 1 ).
658 § 23 Unbeschränkte Operatoren

Nach 3.1 und 3.2 (a) gibt es daher Funktionen u ∈ W01 [a, b], v ∈ W1 [a, b] mit
u − un 1 → 0, v − un 1 → 0 für n → ∞. Da dann insbesondere (u − un ),
(v − un ), (v  − un ) Nullfolgen sind, folgt v = u und u − un H → 0 für
n → ∞.
Die Symmetrie von H erhalten wir durch zweimalige partielle Integration ÜA .

(b) Wir dürfen uns auf das Intervall [0, 1] beziehen, der allgemeine Fall kann
per Substitution auf diesen speziellen zurückgeführt werden ÜA . Für den in
§ 22 : 5.1 eingeführten Integraloperator T gilt

T : L2 [0, 1] → D(H) , T H = ½D(H) , HT = ½ .

Für u ∈ D(H) gibt es Testfunktionen ψn mit Hu − ψn  → 0 für n → ∞.


Nach § 22 : 5.1 gilt ϕn := −T ψn ∈ C20 [a, b] und ϕn = ψn . Da T stetig ist, folgt
ϕn = −T ψn → −T u = u für n → ∞ ,
insgesamt
u − ϕn 2H = u − ϕn 2 + u − ϕn 2 → 0 für n → ∞ . 2

3.6 Weitere Energieoperatoren für einen Freiheitsgrad


(a) Für eine feste Zahl ϕ ∈ Ê
betrachten wir den in 3.2 (c) eingeführten Ope-
rator Pper auf dem Definitionsbereich Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)}
und setzen
2
Hper := Pper : u → − u auf

D(Hper ) := { u ∈ Dϕ | u ∈ Dϕ } .

Der Operator Hper ist symmetrisch und abgeschlossen. Ein Genbereich für Hper
ist
  
u ∈ C2 [a, b]  u(a) = eiϕ u(b), u (a) = eiϕ u (b) .

Für ϕ = 0 beschreibt 12 Hper die kinetische Energie einer periodischen Bewe-


gung (h̄ = m = 1). Der Phasenfaktor eiϕ wird eingeführt, um die kinetische
Energie der Bewegung eines Teilchens in einer Raumrichtung eines Kristallgit-
ters zu beschreiben. Der zugehörige Impulsoperator ist jeweils Pper .

Bemerkung. Für den Hamilton–Operator H von 3.5 gibt es keinen symmetri-


schen Operator P der Form u → − i u auf einem passenden Definitionsbereich,
so dass H = P 2 gilt ( ÜA mit Hilfe von 3.2). Dies führt auf die Frage, wie
der Impulsoperator eines (etwa in einer Ionenfalle) eingesperrten Teilchens zu
definieren ist und weist auf die Grenzen der Modellannahme unendlich hoher
Potentialwälle in a und b hin.
4 Der adjungierte Operator 659

Beweis als ÜA :


Verfahren Sie analog zum Beweis 3.5 (a), verwenden Sie das Ergebnis von 3.2 (b).

(b) Für den in 3.4 behandelten Impulsoperator P definieren wir

− Δ = P 2 : u → − u mit

Ê Ê
D(−Δ) = W2 ( ) := {u ∈ W1 ( ) | P u = − i u ∈ W1 ( )} . Ê
Dieser Operator ist abgeschlossen und symmetrisch; Genbereiche sind der Raum
C∞ Ê
c ( ) und der Schwartzraum S . Dies ergibt sich wie oben ÜA .

Der Operator W0 = 12 P 2 wird als Hamilton–Operator eines in einer Raum-


richtung ohne Einfluß eines Potentials bewegten, spinlosen Teilchens aufgefasst
( h̄ = m = 1).

4 Der adjungierte Operator


4.1 Definition und Anmerkungen
(a) Definition. Für einen linearen Operator A : D(A) → H definieren wir
die Adjungierte A∗ durch
(
Es gibt ein w ∈ H mit v , Au = w , u
v ∈ D(A∗ ) : ⇐⇒
für alle u ∈ D(A).
Wir setzen dann
A∗ v := w .
Die Adjungierte ist also gekennzeichnet durch

v , Au = A∗ v , u für u ∈ D(A) , v ∈ D(A∗ ) .

Dass w = A∗ v durch v eindeutig bestimmt ist, folgt aus dem Fundamentallemma


§ 9 : 3.2. Es ist leicht einzusehen ÜA , dass D(A∗ ) ein Teilraum von H ist und
A∗ : D(A∗ ) → H linear, vgl. § 21 : 3.2.

(b) Genau dann gilt v ∈ D(A∗ ), wenn die Linearform

D(A) → , u → v , Au

auf D(A) beschränkt ist und somit zu einem linearen Funktional u → w , u


auf H fortgesetzt werden kann.

(c) Satz. Genau dann ist A∗ ein linearer Operator, d.h. dicht definiert, wenn
A abschließbar ist, vgl. 2.1 (b).
A∗ heißt dann der zu A adjungierte Operator.
660 § 23 Unbeschränkte Operatoren

Dass aus D(A∗ ) = H die Abschließbarkeit von A folgt, ergibt sich wie im
Beweisteil (i) von 2.1 mit der Abänderung v , A(un − vn ) = A∗ v , un − vn
an Stelle von v , A(un − vn ) = Av , un − vn ÜA .
Die Umkehrung: A abschließbar =⇒ A∗ dicht definiert ergibt sich in 4.4 (c).

Als Beispiel eines linearen Operators, für den A∗ nicht dicht definiert ist,
wählen wir
A : C[0, 2] → L2 [0, 2] , u → u(0)h mit 0 = h ∈ L2 [0, 2] ,
vgl. 2.1 (b). Hier gilt v , Au = u(0) v , h . Nach (b) gehört v genau dann zu
D(A∗ ), wenn u → u(0) v , h beschränkt ist. Für un (x) = n + 12 · (1 − x)n
gilt un  = 1 und un (0) → ∞ für n → ∞, also v ∈ D(A∗ ) nur, falls v ⊥ h.
Es folgt D(A∗ ) ⊂ {h}⊥ .

(d) Ein linearer Operator A ist genau dann symmetrisch, wenn A ⊂ A∗ .


Denn die Symmetriebedingung

v , Au = Av , u für v ∈ D(A) und alle u ∈ D(A)

ist äquivalent zu D(A) ⊂ D(A∗ ) und A∗ v = Av für v ∈ D(A).

(e) Beispiele. (i) Für Multiplikatoren Mv auf L2 (Ω, μ) gilt Mv∗ = Mv ÜA .
2
(ii) Für Multiplikatoren Ma auf  gilt entsprechend Ma∗ = Ma ÜA .

4.2 Elementare Eigenschaften der Adjungierten


(a) B ⊂ A =⇒ A∗ ⊂ B ∗ .
(b) A∗ ist abgeschlossen.
(c) Ist A abschließbar, so gilt A∗ = A∗ ,
dabei steht A∗ für (A)∗ .
Zur Bestimmung von A∗ ist also die Kenntnis von A unnötig.
(d) (A + T )∗ = A∗ + T ∗ für T ∈ L (H ), insbesondere (A − λ)∗ = A∗ − λ.
Dabei ist A + T für T ∈ L (H ) hier wie im Folgenden definiert durch

A + T : D(A) → H , u → Au + T u .

Beweis.
(a) folgt direkt aus der Definition ÜA .
(b) Existieren für eine Folge (vn ) in D(A∗ ) die Grenzwerte v = lim vn und
n→∞
w = lim A∗ vn , so folgt für alle u ∈ D(A)
n→∞
4 Der adjungierte Operator 661

v , Au = lim vn , Au = lim A∗ vn , v = w, u .
n→∞ n→∞

Das bedeutet v ∈ D(A∗ ) und A∗ v = w.


(c) Wegen A ⊂ A folgt A∗ ⊂ A∗ nach (a). Zu zeigen bleibt A∗ ⊂ A∗ . Seien
v ∈ D(A∗ ), u ∈ D(A). Dann gibt es eine Folge (un ) in D(A) mit u = lim un ,
n→∞
Au = lim Aun . Daher erhalten wir
n→∞

v , Au = lim v , Aun = lim A∗ v , un = A∗ v , u .


n→∞ n→∞

Das bedeutet v ∈ D(A∗ ) und A∗ v = A∗ v.


(d) als einfache ÜA . 2

4.3 Selbstadjungiertheit und Symmetrie


(a) Ein linearer Operator A heißt selbstadjungiert, wenn A∗ = A gilt. Als
Observable abgeschlossener quantenmechanischer Systeme kommen nur selbst-
adjungierte Operatoren in Frage; Näheres hierzu in § 25 : 4.1.
Nach 4.1 (b) sind reelle Multiplikatoren selbstadjungiert.
In der Physikliteratur wird statt selbstadjungiert häufig der Begriff hermitesch
verwendet, wobei unklar bleibt, ob hiermit nicht symmetrisch gemeint ist.
Hierzu notieren wir zunächst:
Selbstadjungierte Operatoren sind symmetrisch und abgeschlossen.
Das Erste folgt aus 4.1 (d), das Zweite aus 4.2 (b).
Die Umkehrung gilt nicht, wie das folgende Beispiel zeigt.
(b) Beispiel. Nach 3.2 (a) ist der (hier anders bezeichnete) Operator
A : W01 [a, b] → L2 [a, b] , u → −iu
symmetrisch und abgeschlossen. Wir zeigen im Folgenden, dass A∗ der Operator
B : W1 [a, b] → L2 [a, b] , u → −iu
mit B = B, Kern B = Kern A ist. Somit ist A nicht selbstadjungiert.
Für v ∈ D(B) und u ∈ D(A) erhalten wir mittels partieller Integration
b b b
v , Au = −i v u dλ = i v  u dλ = (− i v  ) u dλ = Bv , u ,
a a a

also v ∈ D(A∗ ) und A∗ v = Bv. Somit gilt B ⊂ A∗ .


Sei umgekehrt v ∈ D(A∗ ) und h := A∗ v. Wir setzen
x
w(x) := h(t) dt .
a
662 § 23 Unbeschränkte Operatoren

Wegen h ∈ L2 [a, b] ⊂ L1 [a, b] ist w absolutstetig und w = h ∈ L2 [a, b], somit


w ∈ D(B). Für u ∈ D(A) ergibt partielle Integration
h, u = w , u = − w , u = iw , − i u = i w , Au .

Es folgt v , Au = A v , u = h , u = iw , Au , d.h. v−iw ist orthogonal
zu Bild A. Aufgrund des nachfolgenden Lemmas muss v − iw dann gleich einer
Konstanten c sein, also v = c + iw ∈ D(B) und
A∗ v = h = w = i(c − v) = −iv  = Bv .
Somit ist auch A∗ ⊂ B.
Hilbertsches Lemma. Eine Funktion f ∈ L2 [a, b] ist genau dann orthogonal
zu Bild A = {u | u ∈ W1 [a, b]}, wenn sie konstant ist.
Beweis.
(i) Ist f = c konstant, so gilt
f , u = c (u(b) − u(a)) = 0 für alle u ∈ D(A) .
x
(ii) Sei umgekehrt f ⊥ Bild A, d := 1 , f und u(x) := f dλ − d x−a
b−a
.
a
Dann gilt u ∈ D(A) und u (x) = f (x) − c mit c := d/(b − a). Nach (i) ist
f − c = u orthogonal zur konstanten Funktion c, und nach Voraussetzung gilt
f , f − c = f , u = 0. Es folgt
f − c2 = f − c , f − c = f , f − c − c , f − c = 0 . 2

4.4 Der Graph des adjungierten Operators


(a) In diesem Unterabschnitt betrachten wir Teilräume V des Hilbertraums
H × H mit dem Skalarprodukt (u1 , u2 ), (v1 , v2 ) H ×H = u1 , v1 + u2 , v2 .
Unter V ist der Abschluss von V in der Norm  · H ×H und unter V ⊥ ist das
orthogonale Komplement von V in H × H zu verstehen. Die Abbildung
U : H ×H →H ×H ,
H
(u1 , u2 ) → (u2 , −u1 ) (u1 , u2 )
ist unitär ÜA . Daher gilt

U (V ) = U (V)⊥

und
U (V) = U (V) = U (V)⊥⊥
H
= U (V ⊥ )⊥
für jeden Teilraum V von H × H , vgl. (u2 , −u1 )
§ 9 : 2.5.
4 Der adjungierte Operator 663

(b) Satz. Zwischen dem Graphen G(A) eines linearen Operators A und dem
Graphen G(A∗ ) seiner Adjungierten besteht die Beziehung
G(A∗ ) = U (G(A))⊥ = U (G(A)⊥ ) .

Denn es gilt
(v, w) ∈ G(A∗ ) ⇐⇒ v , Au = w , u für alle u ∈ D(A)
⇐⇒ 0 = v , Au + w , −u = (v, w) , (Au, −u) H ×H

= (v, w) , U (u, Au) H ×H für alle u ∈ D(A)

⇐⇒ (v, w) ⊥ U (G(A)) . 2

(c) Folgerung. Für abschließbare Operatoren A ist A∗ ein linearer Operator


(d.h. dicht definiert), und es gilt
A∗∗ := (A∗ )∗ = A .

Beweis.
(i) Nach (a) und 2.1 (b) gilt

(∗) G(A∗ )⊥ = (U (G(A)⊥ ))⊥ = U (G(A)⊥⊥ ) = U (G(A)) = U (G(A)) .


Angenommen, D(A∗ ) ist nicht dicht in H . Dann gibt es ein w ∈ H mit w = 0
und w , v = 0 für alle v ∈ D(A∗ ). Es folgt
(w, 0) , (v, A∗ v) H ×H = w, v = 0

für alle v ∈ D(A∗ ) und somit nach (∗) (w, 0) ∈ G(A∗ )⊥ = U (G(A)). Daher gilt
(0, w) = U −1 (w, 0) ∈ G(A) im Widerspruch zu A0 = 0.

(ii) Offenbar ist U 2 = −½H ×H , also U 2 (V ) = V für Teilräume V von H × H .


Somit ergibt sich aus (b) und aus (∗)
G(A∗∗ ) = U (G(A∗ )⊥ ) = U (U (G(A))) = G(A) . 2

4.5 Kerne und Bildräume von A und A∗


Für lineare Operatoren A : D(A) → H seien wie immer
Kern A := { u ∈ D(A) | Au = 0 } und Bild A := { Au | u ∈ D(A) } ,
entsprechend Kern A∗ und Bild A∗ .
Satz. (a) Kern A∗ = (Bild A)⊥ .
(b) (Kern A∗ )⊥ = Bild A.
(c) Für abgeschlossene Operatoren A ist Kern A = (Bild A∗ )⊥ ein abgeschlos-
sener Teilraum von H .
664 § 23 Unbeschränkte Operatoren

Beweis.
(a) Kern A∗ ⊂ (Bild A)⊥ : Für v ∈ Kern A∗ und u ∈ D(A) gilt

v , Au = A∗ v , u = 0 , u = 0 .

Ist umgekehrt v ∈ (Bild A)⊥ , so gilt für alle u ∈ D(A)

v , Au = 0 = 0 , u ,

somit v ∈ D(A∗ ) und A∗ v = 0, d.h. v ∈ Kern A∗ nach Definition von A∗ .


(b) Daraus folgt mit § 9 : 2.5

(Kern A∗ )⊥ = (Bild A)⊥⊥ = Bild A .

(c) Für abgeschlossene Operatoren A gilt A∗∗ = A nach 4.4 (c), also mit (a)

(Bild A∗ )⊥ = Kern A∗∗ = Kern A . 2

5 Spektrum und Resolvente


5.1 Definition und Anmerkungen
(a) Für einen abgeschlossenen Operator A definieren wir die Resolventen-
menge (A) und die Resolvente R(λ, A) durch
λ ∈ (A) ⇐⇒ λ − A : D(A) → H besitzt eine stetige Inverse R(λ, A) .
Aus 2.2 (e) entnehmen wir

λ ∈ (A) ⇐⇒ (A − λ) : D(A) → H ist bijektiv .

Das Spektrum σ(A) von A ist definiert als

σ(A) := \ (A) = {λ ∈ | A − λ : D(A) → H ist nicht bijektiv}.

(b) Bemerkungen. (i) Gibt es für einen linearen Operator ein λ ∈ , so


dass λ − A : D(A) → H eine Inverse R(λ, A) ∈ L (H ) besitzt, so ist A
abgeschlossen.
Denn sei (un ) eine Folge in D(A), für die u = lim un und v = lim Aun
n→∞ n→∞
existieren. Dann gilt λu − v = lim (λ − A)un , und wegen der Stetigkeit von
n→∞
R(λ, A) folgt
u = lim un = lim R(λ, A)(λ − A)un = R(λ, A)(λu − v) ∈ D(A) ,
n→∞ n→∞

(λ − A)u = lim (λ − A)un = λu − v ,


n→∞

somit Au = v.
5 Spektrum und Resolvente 665

Daher macht der Begriff des Spektrums nur für abgeschlossene Operatoren Sinn;
gleichwohl schreiben wir für abschließbare (z.B. symmetrische) Operatoren A
manchmal σ(A) statt σ(A).
(ii) Das Spektrum eines unbeschränkten abgeschlossenen Operators kann leer
sein.
Als Beispiel betrachten wir A : u → − iu auf
  
D(A) := u ∈ W1 [a, b]  u(a) = 0 .

Die Abgeschlossenheit von A ergibt sich wie im Beweis 3.2 (a) ÜA . Für beliebige
λ ∈ ist A − λ injektiv, denn aus Au − λu = 0 mit u ∈ D(A) folgt, dass
u = iλu ∈ C [a, b], also u(x) = u(a)eiλ(x−a) und somit u = 0 wegen u(a) = 0.
A − λ : D(A) → L2 [a, b] ist surjektiv, denn für f ∈ L2 [a, b] ist die Gleichung
Au−λu = f äquivalent zu u −iλu = if , u(a) = 0. Es ist leicht nachzurechnen,
dass die Variation–der–Konstanten–Formel
x
u(x) = ieiλx f (t) e−iλt dt
a

eine Lösung u ∈ D(A) liefert. Somit gilt (A) = .

5.2 Einteilung des Spektrums


(a) Jeder Spektralwert eines abgeschlossenen Operators A gehört zu genau
einer der folgenden Mengen, dem Punktspektrum (Eigenwertspektrum)

σp (A) := { λ ∈ | A − λ ist nicht injektiv} ,

dem kontinuierlichen Spektrum

σc (A) := { λ ∈ σ(A) | A − λ ist injektiv, Bild (A − λ) ist dicht in H } ,

oder dem Restspektrum

σr (A) := { λ ∈ | A − λ ist injektiv, Bild (A − λ) = H } .

Für λ ∈ σc (A) ist

(A − λ)−1 : Bild (A − λ) → D(A)

ein unbeschränkter und abgeschlossener linearer Operator ( ÜA , beachten Sie


dass A − λ nach 2.1 (d) abgeschlossen ist).
Unbeschränkte symmetrische Operatoren können, anders als beschränkte sym-
metrische, ein nichtleeres Restspektrum haben, vgl. 6.3 (b).
666 § 23 Unbeschränkte Operatoren

(b) Eine Zahl λ ∈ heißt approximativer Eigenwert, wenn es eine Folge


(un ) in D(A) gibt mit
un  = 1 , Aun − λun → 0 für n → ∞ .
Die approximativen Eigenwerte bilden das approximative Punktspektrum
σapp (A).
Satz. Das approximative Punktspektrum ist eine Teilmenge des Spektrums. Es
umfasst das Punktspektrum und das kontinuierliche Spektrum.
Beweis.
(i) Für die Folge (un ) in D(A) mit un  = 1 sei lim (λ − A)un = 0. Hätte
n→∞
λ − A eine stetige Inverse R(λ, A), so würde ein Widerspruch folgen:
un = R(λ, A)(λ − A)un → 0 für n → ∞ .
(ii) Es ist einfach zu sehen, dass σp (A) ⊂ σapp (A) ÜA .
(iii) Sei λ ∈ σc (A) und w ∈ Bild (A − λ). Da Bild (A − λ) dicht in H ist, gibt es
eine Folge (vn ) in D(A) mit wn := (A − λ)vn → w für n → ∞. Die Folge (vn )
kann nicht konvergieren, denn aus
vn → v , (A − λ)vn → w
würde wegen der Abgeschlossenheit von A − λ folgen, dass v in D(A) liegt und
(A − λ)v = w gilt.
Da (vn ) keine Cauchy–Folge ist, gibt es ein ε > 0, zu dem kein N ∈  existiert
mit vm − vn  < ε für m > n > N . Daher gibt es Teilfolgen (ak ), (bk ) von (vn )
mit ak − bk  ≥ ε für k = 1, 2, . . . sowie
lim (A − λ)ak = w = lim (A − λ)bk .
k→∞ k→∞

Für uk := (ak − bk )/ak − bk  gilt dann uk ∈ D(A), uk  = 1 und


   
(A − λ)uk  ≤ ε−1 (A − λ)ak − (A − λ)bk  → 0 für k → ∞ . 2

5.3 Das Spektrum des adjungierten Operators


(a) Satz. Ist A : D(A) → H abgeschlossen und bijektiv, so ist mit A auch A∗
stetig invertierbar, und es gilt
(A∗ )−1 = (A−1 )∗ .

Denn nach 4.5 ist dann A∗ injektiv. Für T := A−1 ∈ L (H ), h ∈ H gilt ferner
h , u = h , T Au = T ∗ h , Au für u ∈ D(A) ,
somit T h ∈ D(A ) und A T h = h für alle h ∈ H . Somit ist A∗ auch surjektiv,
∗ ∗ ∗ ∗

und es gilt (A∗ )−1 h = T ∗ h = (A−1 )∗ h für alle h ∈ H .


5 Spektrum und Resolvente 667

(b) Folgerungen. Für abgeschlossene Operatoren A gilt


λ ∈ σ(A) ⇐⇒ λ ∈ σ(A∗ ) ,
λ ∈ σc (A) ⇐⇒ λ ∈ σc (A∗ ) ,
λ ∈ σr (A) =⇒ λ ∈ σp (A∗ ) ,
λ ∈ σr (A∗ ) =⇒ λ ∈ σp (A) .

Beweis als ÜA mit Hilfe von (a), A − λ = A − λ, A∗∗ = A und 4.5.

5.4 Beispiele und Aufgaben


(a) Wir betrachten die in 4.3 (b) untersuchten abgeschlossenen Operatoren
A : D(A) := W01 [a, b] → L2 [a, b] , u → −iu ,
B : D(B) := W1 [a, b] → L2 [a, b] , u → −iu ,
Nach 4.3 (b) ist B = A∗ und aus 4.4 (c) folgt B ∗ = A∗∗ = A. Es gilt

(∗) u ∈ Kern (B − λ) ⇐⇒ u = iλu ∈ C [a, b] ⇐⇒ u(x) = c eiλx

mit einer geeigneten Konstanten c. Somit haben wir

σp (B) = , Kern (B − λ) = Span {fλ } mit fλ (x) = eiλx .

Aus 4.5 folgt Bild (A − λ) = {fλ }⊥ für alle λ ∈ und damit

σ(A) = σr (A) = ,

denn in (∗) wird c = 0, falls u(a) = 0 gilt, woraus σp (A) = ∅ folgt.

(b) Aufgabe. Zeigen Sie für den auf Dϕ = {u ∈ W1 [a, b] | u(a) = eiϕ u(b)}
definierten Impulsoperator P := Pper
&  '
2πn − ϕ 
σ(P ) = σp (P ) =  n∈ ,
b−a
indem Sie zunächst σp (P ) bestimmen und dann zeigen, dass für λ ∈ σp (P ) und
beliebiges f ∈ L2 [a, b] die Gleichung P u − λu = f immer eine Lösung u ∈ Dϕ
der Form
 x
u(x) = eiλx c + i f (t) e−iλt dt
a

mit einer passenden Konstanten c besitzt.

(c) Der Operator H : u → − u auf D(H) = {u ∈ C10 [0, 1] | u ∈ W1 [0, 1]} ist
symmetrisch und abgeschlossen, vgl. 3.5. Sein Spektrum ist gegeben durch

σ(H) = σp (H) = {π 2 n2 | n ∈ } .
668 § 23 Unbeschränkte Operatoren

Denn aus § 22 : 5.1 entnehmen wir, dass H eine kompakte, symmetrische Inverse
T = H −1 : L2 [0, 1] → D(H)
besitzt mit
σp (T ) = { 1/π 2 n2 | n ∈ } , σ(T ) = σ (T ) ∪ {0} ,
p

und dass σp (H) = { π n 2 2


| n ∈ } . Insbesondere ist 0 ∈ (H), und zu zeigen
bleibt λ ∈ (H) für alle λ = 0 mit λ ∈ σp (H). Für diese λ ist die Gleichung
Hu − λu = f äquivalent zu μu − T u = μT f mit μ = 1/λ, und diese besitzt
wegen μ ∈ σ(T ) für jede Funktion f ∈ L2 [0, 1] eine eindeutig bestimmte
Lösung u ∈ Bild T = D(H).

5.5 Das Spektrum von Multiplikatoren


(a) Für eine Folge a = (a1 , a2 , . . . ) setzen wir

  
∞ 
D(Ma ) := x = (x1 , x2 , . . . ) ∈ 2  | ak xk |2 < ∞
k=1

und
Ma x = (a1 x1 , a2 x2 , . . . ) für x = (x1 , x2 , . . .) ∈ 2 .

Dann gilt wie für beschränkte Multiplikatoren

σp (Ma ) = { an | n ∈ }, σ(Ma ) = σp (Ma ) , σr (Ma ) = ∅ .

Dies ergibt sich wörtlich wie in § 21 : 5.2; der dort gegebene Beweis macht an
keiner Stelle von der Beschränktheit von Ma Gebrauch.
ÜA : Prüfen Sie das nach.

(b) Für einen unbeschränkten Multiplikator Mv : u → v · u mit Definitionsbe-


reich {u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)} gilt wie für beschränkte Multiplikatoren
λ ∈ σ(Mv ) ⇐⇒ μ({|v − λ| < ε}) > 0 für alle ε > 0 ,
λ ∈ σp (Mv ) ⇐⇒ μ({v = λ}) > 0 ,
σ(Mv ) = σapp (Mv ) ,
σr (Mv ) = ∅ .
Ferner ist μ({v ∈ σ(Mv )}) = 0, so dass wir annehmen dürfen

v(ω) ∈ σ(Mv ) für alle ω ∈ Ω , insbesondere ist σ(Mv ) = ∅ .

Das ergibt sich wörtlich wie in § 21 : 5.3 ÜA .


5 Spektrum und Resolvente 669

(c) Demnach gilt für den Ortsoperator Q = Mx auf L2 ( ) Ê ÜA

σ(Q) = σc (Q) = Ê.
Genbereiche für Q sind C∞ Ê
c ( ) bzw. der Schwartzraum S ( ). Ê
(d) Für den Multiplikator Mv : v → v u mit der Funktion v(x) := x2 und
Ê
dem Definitionsbereich D(Mv ) = {u ∈ L2 ( n ) | v u ∈ L2 ( n)} giltÊ
σ(Mv ) = σc (Mv ) = Ê +.

Genbereiche für Mv sind C∞


c ( Ê ) und der Schwartzraum
n
S( Ê ).
n

Beweis.
Die Behauptungen über die Genbereiche für Mv (v(x) = x bzw. v(x) = x2 )
ergeben sich wie folgt: Für u ∈ D(Mv ) gilt (i + v) u ∈ L2 (= L2 ( ) bzw. Ê
Ê
L2 ( n )). Nach § 20 : 8.5 gibt es Testfunktionen ψn mit (i + v)u = L2 -lim ψn .
n→∞
Dann sind auch ϕn := ψn /(i + v) Testfunktionen mit (i + v) ϕn → (i + v) u
und (da v reellwertig ist)
|ψn − (i + v) u|
|ϕn − u| = ≤ |ψn − (i + v) u| ,
|i + v|
also u = L2 -lim ϕn , und wegen (i + v) u = L2 -lim (i + v) ϕn ergibt sich auch
n→∞ n→∞
v u = L2 -lim v ϕn
n→∞

Die Behauptung (d) folgt aus (b): Die Mengen {v = λ} sind entweder leer oder
einpunktig oder Sphären, also Lebesgue–Nullmengen. Daher ist σp (Mv ) leer.
Ê
Für λ ∈ + und ε > 0 ist {|v − λ| < ε} nichtleer und offen, somit von
Ê
positivem Lebesgue–Maß. Für λ ∈ + besitzt die Gleichung v u − λu = w für
Ê
jedes w ∈ L2 ( n ) die eindeutige Lösung
w
u := ∈ D(Mv ) ,
v−λ
Ê
denn wegen |u| ≤ dist (λ, + )−1 |w| gilt u ∈ L2 ( Ên
) und daher auch (v−λ)u =
Ê
w ∈ L2 ( n), also u ∈ D(Mv − λ) = D(Mv ). 2

5.6 Die Analytizität der Resolvente


(a) Die Resolventenmenge eines abgeschlossenen Operators A ist offen: Für
λ0 ∈ (A) und alle λ ∈ mit |λ − λ0 | < R(λ0 , A)−1 gilt λ ∈ (A) und


R(λ, A) = (λ0 − λ)k R(λ0 , A)k+1 im Normsinn.
k=0

Das Spektrum σ(A) ist also abgeschlossen.


670 § 23 Unbeschränkte Operatoren

(b) Für λ, μ ∈ (A) besteht die Resolventengleichung

R(λ, A) − R(μ, A) = (μ − λ)R(λ, A)R(μ, A) = (μ − λ)R(μ, A)R(λ, A) .

Beweis.
(a) Sei R0 := R(λ0 , A) und |λ−λ0 |·R0  < 1. Dann konvergiert nach § 21 : 6.1
die Neumannsche Reihe

∞ 
n
S := (λ0 − λ)k R0k+1 = lim Sn mit Sn := (λ0 − λ)k R0k+1
k=0 n→∞ k=0

im Normsinn. Zu zeigen ist, dass S die Inverse von λ − A ist, d.h.

(i) S : H → D(A) , (λ − A)S = ½, (ii) S(λ − A) = ½D(A) .

Den Beweis in § 21 : 6.2 müssen wir dahingehend modifizieren, dass an die Stelle
der dort vorausgesetzten Stetigkeit die Abgeschlossenheit tritt.
Zu (i): Sei u ∈ H und vn := Sn u. Es gilt Bild R0k ⊂ D(A) für k = 1, 2, . . .
wegen Bild R0 = D(A), also
(1) vn ∈ D(A) , lim vn = Su .
n→∞

Aus (λ0 − A)R0 = ½ erhalten wir


(λ − A ) vn = (λ − λ0 ) vn + (λ0 − A) vn
= (λ − λ0 )Sn u + (λ0 − A)Sn u

n 
n
= − (λ0 − λ)k+1 R0k+1 u + (λ0 − λ)k R0k u
k=1 k=1
= u − (λ0 − λ)n+1 R0n+1 u .
 
Mit der Abschätzung (λ0 − λ)n+1 R0n+1 u ≤ (|λ0 − λ| · R0 )n+1 u folgt

(2) lim (λ − A) vn = u .
n→∞

Aus (1) und (2) folgt Su ∈ D(A) und (λ − A)Su = u, da A abgeschlossen ist.

Zu (ii): Für u ∈ D(A) ergibt sich wie oben ÜA

Sn (λ − A) u = Sn ((λ0 − A) u + (λ − λ0 ) u) = u − (λ0 − λ)n+1 R0n+1 u ,


d.h.
Sn (λ − A)u → u für n → ∞ .
Wegen der Normkonvergenz Sn → S gilt also
u = lim Sn (λ − A) u = S(λ − A) u für u ∈ D(A) .
n→∞
6 Zur praktischen Bestimmung des Spektrums 671

(b) Die Resolventengleichung folgt aus der Identität

R(λ, A) = R(λ, A)(μ − A)R(μ, A) für λ, μ ∈ (A) ÜA . 2

6 Zur praktischen Bestimmung des Spektrums


6.1 Ein Kriterium für die Invertierbarkeit des Abschlusses
Für viele symmetrische, nicht abgeschlossene Operatoren A können Aussagen
über das Spektrum von A gemacht werden, ohne dass der Abschluss A bestimmt
werden muss. Grundlage dafür sind die folgenden Sätze.

(a) Lemma. Für abschließbare Operatoren A und für λ ∈ gilt ÜA

Bild (A − λ) ⊂ Bild (A − λ) .

Hiernach gehört λ zum Punktspektrum oder zum Restspektrum von A, wenn


Bild (A − λ) nicht dicht in H liegt.

(b) Satz. Ist A abschließbar und gibt es eine Konstante > 0 mit

(∗) Au − λu ≥ u für u ∈ D(A) ,

so gilt

Bild (A − λ) = Bild (A − λ) .

Daher gehört λ genau dann zur Resolventenmenge von A, wenn Bild (A − λ)


dicht in H ist und die Bedingung (∗) erfüllt ist.
In diesem Fall ergibt sich die Resolvente R(λ, A) durch stetige Fortsetzung des
beschränkten, dicht definierten und bijektiven Operators

(λ − A)−1 : Bild (A − λ) → D(A)

mit Normschranke 1/ , und es gilt Au − λu ≥ u für u ∈ D(A).

Beweis.
(i) Wir zeigen zunächst Bild (A − λ) ⊂ Bild (A − λ).
Ist h = lim (Aun − λun ) mit un ∈ D(A) für n ∈
n→∞
, so folgt aus (∗), dass (u
n)

eine Cauchy–Folge ist. Für u = lim un gilt dann


n→∞

lim Aun = h + λu ,
n→∞

also u ∈ D(A) und Au = h + λu, somit h = (A − λ)u ∈ Bild (A − λ). Mit


Lemma (a) ergibt sich die erste Behauptung.
672 § 23 Unbeschränkte Operatoren

(ii) Für λ ∈ (A) gilt daher H = Bild (A − λ) = Bild (A − λ) und


     
u = R(λ, A)(λ − A)u ≤ R(λ, A) · Au − λu

für u ∈ D(A), d.h. (∗) ist erfüllt mit := R(λ, A)−1 > 0.
(iii) Ist (∗) mit > 0 erfüllt, so folgt Au − λu ≥ · u für u ∈ D(A) ÜA ,
somit ist A − λ injektiv. Ist zusätzlich Bild (A − λ) dicht in H , so folgt aus
(b), dass A − λ surjektiv ist und daher λ ∈ (A).
(iv) Ferner ist dann T = (λ − A)−1 : Bild (A − λ) → D(A) dicht definiert und
beschränkt mit Normschranke 1/ . Nach dem Fortsetzungssatz § 21 : 2.9 lässt
sich T zu einem Operator T ∈ L (H ) mit Normschranke 1/ fortsetzen.
Für u ∈ D(A) gibt es eine Folge (un ) in D(A) mit u = lim un , Au = lim Aun ,
n→∞ n→∞
somit (λ − A)u = lim (λ − A)un . Wegen der Stetigkeit von T folgt
n→∞

T (λ − A)u = lim T (λ − A)un = lim T (λ − A)un = lim un = u ,


n→∞ n→∞ n→∞

somit T (λ − A) = ½D(A) . Andererseits gilt R(λ, A)(λ − A) = ½D(A) .


Wegen der Surjektivität von λ − A folgt T = R(λ, A). 2

6.2 Das Spektrum symmetrischer Operatoren


Ê
(a) Für symmetrische Operatoren A gilt σapp (A) ⊂ , insbesondere sind alle
Eigenwerte reell. Nichtreelle Spektralwerte gehören somit immer zum Restspek-
trum.
Dies folgt unmittelbar aus der Abschätzung
 
Au − λu ≥ | Im λ | · u für u ∈ D(A) ,

die sich wie in § 21 : 6.5 (a) ergibt.

(b) Ein unbeschränkter symmetrischer Operator kann ein nichtleeres Restspek-


trum besitzen, wie das Beispiel 6.3 (b) zeigt.
Für beschränkte symmetrische Operatoren T ist das Restspektrum leer. Das
ergibt sich unter Verwendung von T ∗ = T wie folgt:
λ ∈ σr (T ) =⇒ λ ∈ σp (T ∗ ) = σp (T ) =⇒ λ ∈ Ê =⇒ λ = λ ∈ σp (T ).
Hiervon lässt sich für unbeschränkte symmetrische Operatoren A der Schluss
λ ∈ σr (A) =⇒ λ ∈ σp (A∗ )
übernehmen, denn aus 4.5 folgt Kern (A∗ − λ) = Bild (A − λ)⊥ . Doch nur im
Fall A∗ = A kommt wie oben ein Widerspruch zustande.
6 Zur praktischen Bestimmung des Spektrums 673

(c) Folgerung. Für selbstadjungierte Operatoren A gilt σ(A) = σapp (A) ⊂ Ê.


(d) Aus 6.1 und der Abschätzung (a) ergibt sich der
Satz. Für einen symmetrischen Operator A gehört λ genau dann zur Resolven-
tenmenge von A, wenn Bild (A − λ) dicht in H ist und wenn es ein >0
gibt mit

Au − λu ≥ u für u ∈ D(A) .

Für nichtreelle λ ist die letzte Bedingung automatisch erfüllt ( = |Im λ|), somit
gehört λ ∈ \  genau dann zum Spektrum (und zwar zum Restspektrum) von
A, wenn Bild (A − λ) nicht dicht in H ist.

6.3 Beispiele
(a) Der Laplace–Operator auf dem Ê n

Wir bezeichnen den Schwartzraum S (n ) im Folgenden kurz mit S und be-
trachten den Laplace–Operator
L : S → S , u → − Δu .
Satz. L ist symmetrisch mit σ(L) = σapp (L) = +.

Beweis.
/ unitär, und
Nach § 12 : 3.3 ist die Fouriertransformation F : S → S , u → u
es gilt
:
− Δu(y) /(y) für u ∈ S und y ∈ n ,
= y2 u
d.h.
(1) L = F −1 AF ,
wobei A die Einschränkung des Multiplikators My2 auf S ist. Es folgt
(2) / − λu
Lu − λu = w ⇐⇒ Au /= w
/ für u, w ∈ S und
(3) / − λu
Lu − λu2 = Au /2 für u ∈ S .
Wir zeigen zunächst, dass σ(L) ⊂ + . Sei λ ∈ + , also := dist (λ, + ) > 0.
Für u ∈ S folgt aus (3) wegen | y2 − λ | ≥
(4) / − λu
Lu − λu = Au / ≥ / =
u u .
Für eine gegebene Funktion w ∈ S ist die Gleichung Lu − λu = w für u ∈ S
nach (2) äquivalent zur Gleichung
/(y) = (y2 − λ)−1 w(y)
u / (y ∈ n ) .
Es ist leicht zu sehen, dass im Fall λ ∈ + hierdurch eine Funktion u
/∈ S
definiert ist. Für u := F −1 u
/ gilt somit u ∈ S und Lu − λu = w.
674 § 23 Unbeschränkte Operatoren

Ê
Daher umfasst Bild (L − λ) den in H = L2 ( n) dichten Teilraum S . Aus (4)
Ê
und 6.2 (d) folgt λ ∈ (L). Somit haben wir gezeigt: λ ∈ + =⇒ λ ∈ (L),
Ê
d.h. σ(L) ⊂ + .
Wir zeigen nun
Ê + ⊂ σc (L) = σapp (L) = σapp (A) = σc (A).
Ê
Seien λ ∈ + und ε > 0 vorgegeben. Wir wählen eine Funktion ϕ ∈ C∞
c ( ) Ê
mit supp ϕ ⊂ ]λ − ε, λ + ε[ und setzen
v(x) := c ϕ(x2 ) ,
wobei wir die Konstante c > 0 so wählen, dass v = 1. Dann gilt v ∈ C∞
c ( Ê n
)
und v(x) = 0 für | x2 − λ | ≥ ε, somit |Av − λv| ≤ ε|v|, also
Av − λv ≤ ε .
Für ε = 1/n erhalten wir auf diese Weise Funktionen vn ∈ S mit vn  = 1,
Avn − λvn  ≤ 1/n. Für un := F −1 vn gilt dann un ∈ S , un  = 1 und
Lun − λun  ≤ 1/n wegen (4). Somit gilt λ ∈ σapp (A) und λ ∈ σapp (L). Nach
5.5 (b) ist σ(A) = σapp (A) = σc (A). 2

Bei diesem und den folgenden Beispielen geht es vor allem darum, zu Demon-
strationszwecken das Spektrum eines abgeschlossenen symmetrischen Operators
allein mit Hilfe eines Gens zu bestimmen.
(b) Der Operator u → − iu auf der Halbgeraden
Für den durch
D(A) := {u ∈ C1 ( Ê +) ∩ L2 ( Ê+) | u(0) = 0, u ∈ L2 ( Ê+)},

Au = − iu
definierten, symmetrischen Operator A gilt
σ(A) = {λ ∈ | Im λ ≤ 0} , λ ∈ σr (A) für Im λ < 0 .

Beweis.
Wegen C∞c (>0 ) ⊂ D(A) ist A dicht definiert. Die Symmetrie von A ergibt sich
durch partielle Integration ÜA .

Wir betrachten die Gleichung Au − λu = v für v ∈ C1 (+ ) ∩ L2 (+ ). Nach


Wahl von D(A) ist diese äquivalent zum inhomogenen linearen AWP
(1) u − iλu = iv , u(0) = 0 , u ∈ C1 (+ )
mit der Zusatzbedingung u ∈ L2 (+). Für jede Lösung u ∈ L2 (+ ) von (1)
gilt dann auch u = iλu + iv ∈ L2 (+), also u ∈ D(A).
Die Gleichung (1) ist für u ∈ D(A) äquivalent zu
6 Zur praktischen Bestimmung des Spektrums 675

x
(2) u(x) = i eiλx v(t) e−iλt dt
0

(Variation der Konstanten).


Wir setzen g(x) := eiλx , h(x) := e−iλx .
Für Im λ = ω > 0 gilt |g(x)| = e−ωx , |h(x)| = eωx , insbesondere g ∈ L2 ( Ê
+).

Wählen wir v ∈ C∞
c ( Ê >0 ) mit supp v ⊂ ]0, R[ , so folgt aus (2)
 R
|u(x)| ≤ e−ωx |v(t)| eωt dt für x ≥ R ,
0

somit liefert (2) eine Lösung u ∈ D(A) von Au − λu = v. In diesem Fall umfasst
Ê
Bild (A − λ) die in L2 ( + ) dichte Menge C∞ Ê
c ( >0 ). Aus 6.2 (d) folgt λ ∈ (A).

Im Fall Im λ = −ω < 0 gilt |g(x)| = e ωx


≥ 1, somit g ∈ L2 ( Ê
+ ), aber h ∈
Ê
L2 ( + ).
Aus (2) folgt
 x   x 
|u(x)| = eωx  v(t) h(t) dt  ≥  v(t) h(t) dt  .
0 0

Daher kann u nur dann zu L ( 2


Ê+) gehören, wenn


v(t) h(t) dt = 0 ,
0

also v ⊥ h. Daher ist in diesem Fall Bild (A − λ) nicht dicht in L2 ( +). Es Ê


folgt λ ∈ σr (A) aus 6.2 (d). Im Fall ω = 0 ergibt sich λ ∈ σ(A) wegen der
Abgeschlossenheit des Spektrums. 2

(c) Das Spektrum des Impulsoperators auf Ê


Die Fouriertransformation u → u / liefert eine unitäre Abbildung des Schwartz-
raums S der schnellfallenden Funktionen auf sich (§ 12 : 3.1, 3.4). Für u ∈ D(A)
:
:= S sei Au := − iu. Dann gilt Au(y) = y·u /(y) (§ 12 : 3.3), d.h. der Operator
A ist unitär äquivalent zum Multiplikator My mit Definitionsbereich S . Nach
5.5 (c) ist dessen Abschluss der Ortsoperator Q, und es ist σ(Q) = σapp (Q) = . Ê
Also gilt für den Impulsoperator P = A ebenfalls
σ(P ) = σapp (P ) = Ê.
Für dieses Ergebnis war die Kenntnis des genauen Definitionsbereichs von P =
A nicht erforderlich (D(P ) = W1 ( ) nach 3.4 (a)).Ê
676 § 24 Selbstadjungierte Operatoren

§ 24 Selbstadjungierte und wesentlich selbstadjungier-


te Operatoren

1 Charakterisierung selbstadjungierter Operatoren


1.1 Selbstadjungiertheit und maximale Symmetrie
(a) Ein Operator A heißt selbstadjungiert, wenn A = A∗ gilt. Die Bedeutung
selbstadjungierter Operatoren für die Quantenmechanik wurde in § 18 : 3.1 (b)
schon kurz angesprochen; mehr hierzu folgt in § 25 : 4. Ihre Rolle in der Analysis,
insbesondere der Differentialgleichungstheorie ergibt sich aus der Existenz einer
Spektralzerlegung (Abschnitt 3 und § 25 : 1.4), dem Spektralsatz und dem Satz
von Stone (§ 25 : 3.2, 3.4).
In diesem Paragraphen sollen Kriterien aufgestellt werden, die es gestatten, aus
Eigenschaften eines symmetrischen Operators A auf die Selbstadjungiertheit
von A zu schließen, ohne A explizit bestimmen zu müssen. Hierzu stellen wir
zunächst Bedingungen für die Selbstadjungiertheit eines Operators auf.
In § 23 : 4.3 wurde festgestellt, dass selbstadjungierte Operatoren symmetrisch
und abgeschlossen sind. Darüberhinaus gilt der folgende

(b) Satz. Selbstadjungierte Operatoren sind maximal symmetrisch: Ist A selbst-


adjungiert und B eine symmetrische Fortsetzung von A, so gilt B = A.
Mit Hilfe dieses Satzes kann die Gleichheit zweier selbstadjungierter Operatoren
nachgewiesen werden.

Beweis.
Nach Voraussetzung gilt A = A∗ und A ⊂ B ⊂ B ∗ . Mit § 23 : 4.2 (a) folgt
B ⊂ B ∗ ⊂ A∗ = A ⊂ B , also A = B . 2

Nicht jeder maximal symmetrische Operator ist selbstadjungiert.


Ê
Nach § 23 : 6.3 (b) ist der auf W01 ( +) definierte Operator A : u → − iu abge-
schlossen und symmetrisch, und es gilt i ∈ (A), also ist A−i : D(A) → L2 ( + )Ê
bijektiv. Für eine echte symmetrische Fortsetzung B von A wäre B − i zwar
surjektiv, aber nicht mehr injektiv und somit i ∈ σp (B), was nicht sein kann
Ê
(§ 23 : 6.2 (a)). A ist nicht selbstadjungiert, denn D(A∗ ) umfaßt W1 ( ), wie sich
leicht durch partielle Integration ergibt.

1.2 Das Spektrum selbstadjungierter Operatoren


Satz. Ein abgeschlossener symmetrischer Operator A ist genau dann selbstad-
jungiert, wenn sein Spektrum reell ist. Es ist dann σ(A) = σapp (A).
1 Charakterisierung selbstadjungierter Operatoren 677

Beweis.
(a) Sei A = A∗ . Dann ist A abgeschlossen und symmetrisch, ferner σ(A) ⊂ Ê
nach § 23 : 6.2 (c).

Ê
(b) Sei A symmetrisch und abgeschlossen mit σ(A) ⊂ . Wegen A ⊂ A∗ bleibt
zu zeigen, dass A∗ ⊂ A. Wir fixieren ein λ ∈ \ . Dann ist nach Voraussetzung
λ, λ ∈ (A), also ist
(1) A − λ : D(A) → H surjektiv,

(2) Bild (A − λ) = H (sogar Bild (A − λ) = H ).

Sei v ∈ D(A∗ ). Dann gibt es nach (1) ein u ∈ D(A) mit


(3) (A − λ) u = (A∗ − λ) v .

Wegen A ⊂ A∗ folgt (A∗ − λ) u = (A∗ − λ) v, also mit § 23 : 4.5


u − v ∈ Kern (A∗ − λ) = Kern (A − λ)∗ = Bild (A − λ)⊥ = {0}
aufgrund von (2). Somit gilt v = u ∈ D(A), und aus (3) folgt A∗ v = Au = Av.
Dies zeigt A∗ ⊂ A. 2

Folgerung. Gibt es für einen symmetrischen Operator A eine Zahl λ ∈ mit



Bild (A − λ) ⊂ Bild (A − λ) und Bild (A − λ) = H ,
so ist A selbstadjungiert und damit auch abgeschlossen.
Ist insbesondere A symmetrisch und Bild (A − λ) = H für ein λ ∈ , so ist A
selbstadjungiert.
Dies ergibt eine nochmalige Durchsicht des Beweises (b); andere als die genann-
ten Voraussetzungen werden nicht benötigt.

1.3 Die Hauptkriterien für Selbstadjungiertheit


Für einen symmetrischen Operator A sind folgende Aussagen äquivalent:
(a) A ist selbstadjungiert.
(b) A ist abgeschlossen und σ(A) ⊂ .
(c) A + i und A − i sind surjektiv.
(d) A − λ und A − λ sind surjektiv für mindestens ein λ ∈ .
Beweis.
(a) ⇐⇒ (b) nach 1.2.
(b) =⇒ (c) =⇒ (d) nach der Definition von σ(A) und ρ(A).
(d) =⇒ (a) nach der Folgerung von 1.2, denn im Fall Bild (A − λ) = H
gilt natürlich Bild (A∗ − λ) ⊂ Bild (A − λ). 2
678 § 24 Selbstadjungierte Operatoren

(e) Folgerung. Ein symmetrischer Operator A ist genau dann selbstadjun-


giert, wenn er abgeschlossen ist und
Kern (A∗ − λ) = Kern (A∗ − λ) = {0} für ein λ ∈ \
gilt.
Ist A selbstadjungiert, so besteht diese Beziehung für alle λ ∈ \ .

Beweis.
(i) Ist A selbstadjungiert, so ist A abgeschlossen und σ(A) ⊂ . Für alle

λ ∈ \ gilt dann λ, λ ∈ (A), somit wegen A = A∗
Kern (A∗ − λ) = Kern (A − λ) = {0} = Kern (A − λ) = Kern (A∗ − λ) .

(ii) Sei A symmetrisch und abgeschlossen, und es existiere ein λ ∈ \ mit 


Kern (A∗ − λ) = Kern (A∗ − λ) = {0}. Nach § 23 : 4.5 (b) und 6.1 (b) folgt

Bild (A − λ) = Bild (A − λ) = {0}⊥ = H = Bild (A − λ)


= Bild (A − λ).
Somit ist A selbstadjungiert nach dem Kriterium 1.3 (d). 2

1.4 Beispiele selbstadjungierter Operatoren


(a) Reelle Multiplikatoren. Für eine μ–messbare Funktion v : Ω → ist
der Multiplikator

Mv : u → v · u mit D(Mv ) = {u ∈ L2 (Ω, μ) | v · u ∈ L2 (Ω, μ)}

selbstadjungiert. Das folgt aus Mv∗ = Mv = Mv , vgl. § 23 : 4.1 (e).


Entsprechend folgt die Selbstadjungiertheit des Multiplikators Ma auf 2 mit
einer reellen Zahlenfolge a = (a1 , a2 , . . . ).
Ein anderer, die Kenntnis von Ma∗ nicht voraussetzender Nachweis der Selbst-
adjungiertheit stützt sich auf 1.3 (c): Ma ist offenbar symmetrisch. Für y =
(y1 , y2 , . . . ) ∈ 2 und x = (x1 , x2 , . . . ) mit xk = yk /(ak ± i) gilt |xk | ≤ |yk |,
somit x ∈ 2 und (Ma ± i) x = y.

(b) Impulsoperatoren.
(i) Der auf W1 ( ) definierte Impulsoperator P : u → − iu eines geradlinig
bewegten Teilchens ist nach 1.2 und § 23 : 6.3 (c) selbstadjungiert.
(ii) Der auf Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} definierte Impulsoperator
Pper := u → − iu ist selbstadjungiert. Wir können dies aus 1.3 (b) folgern,
indem wir die in § 23 : 3.2 bewiesene Abgeschlossenheit heranziehen und das
Ergebnis der Aufgabe § 23 : 5.4 (b) verwenden: σ(Pper ) = σp (Pper ) ⊂ .
Direkter führt das Kriterium 1.3 (c) zum Ziel: Für f ∈ L2 [a, b] liefert
1 Charakterisierung selbstadjungierter Operatoren 679

 x
u(x) := e±x c + i f (t) e∓t dt
a
eine absolutstetige Lösung der DG u = ±u + if , d.h. der Gleichung
Pper u ± iu = f .
Es ist leicht zu sehen, dass α := e±a − eiϕ e±b für a = b von Null verschieden
b
ist. Legen wir c durch α · c = ieiϕ e±b f (t) e∓t dt fest, so erfüllt u die Rand-
a
bedingung u(a) = eiϕ u(b) ÜA .

(c) Der Hamilton–Operator H eines in ]a, b[ eingesperrten Teilchens mit


  
D(H) := u ∈ C10 [0, 1]  u ∈ W1 [0, 1] , Hu = − 1
2 u für u ∈ D(H)
ist aufgrund des Kriteriums 1.3 (b) selbstadjungiert, denn nach § 23 : 5.4 (c) ist
u → −u auf D(H) symmetrisch mit reellem Spektrum.

1.5 Die Selbstadjungiertheit von A∗A


Satz. Für jeden abgeschlossenen Operator A ist A∗A mit
D(A∗A) := { u ∈ D(A) | Au ∈ D(A∗ ) }
selbstadjungiert.
Für jeden selbstadjungierten Operator A ist somit A2 selbstadjungiert.
Bemerkung. Für einen linearen Operator A ist {u ∈ D(A) | Au ∈ D(A∗ )} i.A.
kein dichter Teilraum von H , also A∗A nicht notwendig ein linearer Operator.

Beweis.
(a) Für u, v ∈ D(A∗A) gilt A∗Au , v = Au , Av = u , A∗Av , also ist A∗A
ein symmetrischer Operator, falls D(A∗A) dicht in H ist.
(b) Wir zeigen, dass sich jeder Vektor h ∈ H in der Form h = u + A∗Au mit
u ∈ D(A∗A) darstellen lässt. Nach § 23 : 2.2 (a) ist G(A) = {(u, Au) | u ∈ D(A)}
und damit auch U (G(A)) := {(Au, −u) | u ∈ D(A)} abgeschlossen in H × H .
Nach § 23 : 4.4 ist
G(A∗ ) = U (G(A))⊥ (Orthogonalität in H × H )
ebenfalls abgeschlossen in H × H . Nach dem Zerlegungssatz § 9 : 2.4 lässt sich
daher jedes Paar (0, −h) ∈ H × H in der Form
(0, −h) = (v, A∗ v) + (Au, −u) mit u ∈ D(A) , v ∈ D(A∗ )
darstellen. Dann gelten die Gleichungen
0 = v + Au , h = u − A∗ v .
680 § 24 Selbstadjungierte Operatoren

Aus diesen folgt Au = −v ∈ D(A∗ ) und h = u + A∗Au.


(c) D(A∗A) ist dicht in H : Sei h ⊥ D(A∗A) und u ∈ D(A∗A) ⊂ D(A) so
gewählt, dass h = u + A∗Au. Dann folgt mit (a)
0 = h , u = u2 + Au2 , also u = 0 und somit h = 0 .
(d) Nun folgt die Selbstadjungiertheit von A∗A aus dem Kriterium 1.3 (d) mit
λ = λ = −1, da A∗A + 1 nach (b) surjektiv ist. 2

2 Wesentlich selbstadjungierte Operatoren


2.1 Definition und Beispiele
(a) Die Zielsetzung dieses Abschnitts wird am besten durch ein Beispiel ver-
deutlicht. Die Energie eines freien, spinlosen Teilchens im Raum soll, wie je-
de Observable der Quantenmechanik, durch einen selbstadjungierten Operator
H beschrieben werden. Unter Vernachlässigung physikalischer Konstanten wird
Ê
H := − 12 Δ gesetzt, wobei −Δ der auf S ( n ) definierte Laplace–Operator ist.
Die direkte Anwendung eines der Kriterien 1.3 wäre für n > 1 relativ schwierig,
Ê
dies würde Kenntnisse über den Sobolew–Raum D(Δ) = W2 ( n) vorausset-
zen. Wir nützen daher das Kriterium 1.3 (b) indirekt aus, indem wir uns nur auf
Ê
die Eigenschaften des Gens − Δ auf S ( n) stützen. Die entsprechenden Rech-
nungen wurden in § 23 : 6.3 (a) durchgeführt mit dem Ergebnis σ(− Δ) = + . Ê
Offenbar gilt auch σ(H) = 12 σ(−Δ) = + . Ê
(b) Ein symmetrischer Operator A heißt wesentlich selbstadjungiert, wenn

sein Abschluss A selbstadjungiert ist, d.h. wenn A = A = A∗ , vgl. § 23 : 4.2 (c).
Ein Operator A ist genau dann wesentlich selbstadjungier, wenn A ⊂ A∗ ⊂ A .
Denn A ⊂ A∗ bedeutet Symmetrie, und aus dieser folgt nach der Folgerung
∗ ∗∗
§ 23 : 4.4 (c) A = A∗∗ ⊂ A∗ . Aus A∗ ⊂ A ergibt sich dann A = A = A.

(c) Beispiele.
Ê
(i) Der auf S ( n) definierte Laplace–Operator u → − Δu ist nach (a) we-
sentlich selbstadjungiert.
(ii) Der Operator Pϕ : u → − iu mit D(Pϕ ) = {u ∈ C∞ [a, b] | u(a) =
eiϕ u(b)} ist wesentlich selbstadjungiert. Denn nach § 23 : 3.2 (b) ist sein Ab-
schluss der auf Dϕ = {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} definierte Impulsoperator
u → −iu , und dieser ist nach 1.4 (b) selbstadjungiert.
(iii) Der auf C20 [a, b] = {u ∈ C2 [a, b] | u(a) = u(b) = 0} definierte Laplace–
Operator u → −u ist wesentlich selbstadjungiert, vgl. § 23 : 3.5 und § 23 : 5.4 (c).
Ê
(iv) Der auf dem Schwartzraum S ( n) eingeschränkte Multiplikator Mv mit
v(x) = x2 ist nach § 23 : 5.5 (d) ein Gen für den maximal definierten Multipli-
kator Mv , dessen Selbstadjungiertheit in 1.4 (a) festgestellt wurde.
2 Wesentlich selbstadjungierte Operatoren 681

2.2 Kriterien für wesentliche Selbstadjungiertheit


Für einen symmetrischen Operator A sind die folgenden Aussagen äquivalent:
(a) A ist wesentlich selbstadjungiert.
(b) Bild (A − i) und Bild (A + i) sind dicht in H .
(c) Es gibt eine Zahl λ ∈ und ein > 0, so dass A − λ, A − λ dichtes Bild
haben und dass

Au − λu ≥ u , Au − λu ≥ u für u ∈ D(A) .


∗ ∗
(d) Kern (A + i) = Kern (A − i) = {0}.

Bemerkungen. (i) Nach § 23 : 6.1 (b) ist die Bedingung (c) äquivalent zu
λ, λ ∈ (A). Für nichtreelle λ gilt Au − λu ≥ |Im λ| · u für u ∈ D(A),
vgl. § 23 : 6.2, also ist für nichtreelle λ die Bedingung (c) schon dann erfüllt,
wenn Bild (A − λ) und Bild (A − λ) dicht in H sind.
(ii) Ist A wesentlich selbstadjungiert, so ist die Bedingung (c) für alle nichtre-
ellen λ erfüllt, denn nach 1.3 (b) gilt σ(A) ⊂ .

Beweis.
(a) =⇒ (b). Ist A selbstadjungiert, so gilt σ(A) ⊂ , also Bild (A − λ) =
H für alle nichtreellen λ. Nach § 23 : 6.1 (a) folgt Bild (A − λ) = H für alle

λ ∈ \ , insbesondere für λ = ±i.
(b) =⇒ (c) mit λ = i nach Bemerkung (i).
(c) =⇒ (a). Nach Bemerkung (i) folgt aus (c) die Existenz einer Zahl λ
mit λ, λ ∈ (A), woraus Bild (A − λ) = Bild (A − λ) = H folgt. Somit ist A
selbstadjungiert aufgrund von 1.3 (d).
(a) ⇐⇒ (d) nach dem Kriterium 1.3 (e), denn nach § 23 : 2.1 (d), § 23 : 4.2 (c)
gilt (A ± i)∗ = (A ± i)∗ = (A ± i)∗ . 2

2.3 Halbbeschränkte Operatoren


Ein linearer Operator A heißt positiv (A ≥ 0), wenn

u , Au ≥ 0 für u ∈ D(A)

und halbbeschränkt mit unterer Schranke , wenn A − positiv ist, d.h.


wenn

u , Au ≥ u2 für u ∈ D(A) .

Wegen u , Au ∈ für u ∈ D(A) sind halbbeschränkte Operatoren symme-


trisch (Polarisierungsgleichung § 21 : 3.6 (b)). Aus A − ≥ 0 folgt A − ≥ 0
ÜA .
682 § 24 Selbstadjungierte Operatoren

Satz. (a) Ist A halbbeschränkt mit unterer Schranke , so gilt


Au − λu ≥ ( − λ) u für λ < .
(b) Gibt es daher ein λ0 < , so dass Bild (A − λ0 ) dicht in H ist, so ist A
wesentlich selbstadjungiert und σ(A) ⊂ [ , ∞[ .
Für alle λ < ist dann R(λ, A) die Fortsetzung des beschränkten, dicht defi-
nierten Operators (λ − A)−1 : Bild (A − λ) → D(A).
(c) Andernfalls gilt λ ∈ σr (A) für alle λ < , und A besitzt unendlich viele
selbstadjungierte Fortsetzungen.

Beweis.
(a) B := A − ist symmetrisch mit B ≥ 0. Für u ∈ D(A), λ < ρ gilt somit
Au − λu2 = Bu + ( − λ)u , Bu + ( − λ)u
= Bu2 + 2( − λ) u , Bu + ( − λ)2 u2
≥ ( − λ)2 u2 .
(b) Die wesentlich Selbstadjungiertheit von A folgt unmittelbar aus dem Krite-
rium 2.2 (c). Die Aussage über die Resolvente folgt aus § 23 : 6.1. Aufgrund von
(a) schließen wir: λ < =⇒ λ ∈ σapp (A) = σ(A), vgl. 1.2.
(c) Tritt der Fall (b) nicht ein, so gilt λ ∈ σr (A) für alle λ < , denn für λ <
ist λ ∈ σp (A) nach (a). Für den Beweis der Fortsetzbarkeit und Einzelheiten
hierzu verweisen wir auf Riesz–Nagy [131] Nr. 122–125 und Reed-Simon [130,
II] Ch. X (Stichworte Defektindizes“, Friedrichs–Erweiterung“). 2
” ”
Beispiel. Der Operator B : W01 [a, b] → L2 [a, b], u → −iu ist symmetrisch
und abgeschlossen, aber nicht selbstadjungiert (§ 23 : 4.3). Setzen wir B auf den
Definitionsbereich Dϕ := {u ∈ W1 [a, b] | u(a) = eiϕ u(b)} fort, so entsteht nach
1.4 (b) jeweils ein selbstadjungierter Operator Bϕ : u → −iu . Somit besitzt
der Operator A = B 2 ≥ 0 die nach 1.5 selbstadjungierten Fortsetzungen Bϕ2 .

3 Symmetrische Operatoren mit diskretem Spektrum


3.1 Wesentliche Selbstadjungiertheit und Spektralzerlegung
In einer Reihe von Anwendungen sind folgende Bedingungen erfüllt:
(a) A ist ein symmetrischer Operator auf einem unendlichdimensionalen Hil-
bertraum.
(b) Es gibt ein vollständiges ONS v1 , v2 , . . . für H , bestehend aus Eigenvek-
toren von A.
(c) Die zugehörigen Eigenwerte λk = vk , Avk bilden eine monoton wach-
sende Folge reeller Zahlen mit lim λk = ∞.
k→∞
3 Symmetrische Operatoren mit diskretem Spektrum 683

Satz. Unter diesen Voraussetzungen ist A wesentlich selbstadjungiert und halb-


beschränkt mit unterer Schranke λ1 .
Der Abschluss A und sein Spektrum sind gegeben durch


u ∈ D(A) ⇐⇒ λ2k | vk , u |2 < ∞ ,
k=1

∞ 

Au = λk vk , u vk = vk , u Avk für u ∈ D(A) ,
k=1 k=1

σ(A) = σp (A) = {λn | n ∈ } .


Die Eigenräume Kern (A − λk ) = Kern (A − λk ) haben endliche Dimension.

Ein Operator A mit den Eigenschaften (a), (b), (c) heißt ein symmetrischer
Operator mit diskretem Spektrum.

Beweis.
Sei u ∈ D(A). Da v1 , v2 , . . . ein vollständiges ONS ist mit Avk = Avk = λk vk
und wegen der Symmetrie von A ergibt sich mit der Parsevalschen Gleichung

∞ 
∞ 

Au = vk , Au vk = Avk , u vk = λk vk , u vk ,
k=1 k=1 k=1


λ2k | vk , u |2 = Au2 < ∞ .
k=1


Konvergiert umgekehrt λ2k | vk , u |2 , so gibt es wegen der Isomorphie von
k=1
H und 2 ein v ∈ H mit

n
v = lim sn , sn := λk vk , u vk .
n→∞ k=1

n
Für un := vk , u vk gilt dann un ∈ D(A), u = lim un und sn = Aun → v.
k=1 n→∞

Es folgt u ∈ D(A) und Au = v.


Mit der unitären Abbildung
U : H → 2 , u → ( v1 , u , v2 , u , . . .)

drückt sich dies wie folgt aus:

A = U −1 Mλ U ;

dabei ist Mλ der maximal definierte, nach 1.4 (a) selbstadjungierte Multiplikator

Mλ : (x1 , x2 , . . .) −→ (λ1 x1 , λ2 x2 , . . . )
684 § 24 Selbstadjungierte Operatoren

auf 2 . Da U die Hilbertraumstruktur überträgt, ist A ebenfalls selbstadjun-


giert, und es gilt σ(A) = σ(Mλ ), σp (A) = σp (Mλ ). Aus § 23 : 5.5 (a) entnehmen

wir σ(Mλ ) = σp (Mλ ) = {λk | k ∈ }, denn wegen lim λk = ∞ ist die Menge

k→∞
{λk | k ∈ } abgeschlossen, und jedes λn kommt in der Folge (λk ) nur endlich
oft vor. Insbesondere ist dim Kern (A − λn ) = dim Kern (Mλ − λn ) endlich.
Aus der Reihendarstellung für Au folgt schließlich

u , Au ≥ λ1 u2 für u ∈ D(A). 2

Folgerungen.
(a) Unter den obengenannten Vorausetzungen ist (A − λ)−1 für λ < λ1 kom-
pakt und positiv definit.

(b) Ist umgekehrt T kompakt und positiv definit, so ist A = T −1 : Bild T → H


ein positiver, abgeschlossener Operator mit diskretem Spektrum und 0 ∈ σp (A).

Beweis.
(a) Wegen σ(A) ⊂ [λ1 , ∞[ gilt für λ < λ1 : λ ∈ (A), also T := (A − λ)−1 ∈
L (H ). Daher ist jeder Vektor u ∈ H von der Form u = (A−λ)v mit v ∈ D(A).
Für u = 0 gilt v = 0, somit

u, T u = (A − λ)v , v = v , (A − λ)v ≥ (λ1 − λ) v2 > 0 .

Wegen vk = T (A−λ)vk = (λk −λ)T vk für k = 1, 2, . . . gibt es ein vollständiges


ONS aus Eigenvektoren von T , und die zugehörigen Eigenwerte (λk − λ)−1
bilden eine Nullfolge. Daher ist T kompakt nach § 22 : 4.6.

(b) Nach § 22 : 4.6 gibt es ein vollständiges ONS v1 , v2 , . . . für H und eine
monoton fallende Nullfolge (μn ) mit T vk = μk vk (k = 1, 2, . . . ). Aus AT = ½
folgt vk = μk Avk , also Avk = λk vk mit λk := 1/μk für k = 1, 2, . . . .
Zu jedem u ∈ D(A) gibt es ein v ∈ H mit u = T v. Für u = 0 folgt v = 0 ,
also Au = AT v = v = 0 sowie

u , Au = T v , v > 0 .

Sei u = lim un mit un ∈ D(A) für n = 1, 2, . . . , und v = lim Aun existiere.


n→∞ n→∞
Da es Vektoren vn gibt mit un = T vn für n ∈ Æ, gilt

vn = Aun → v für n → ∞ und T vn = un → u für n → ∞ .

Da T stetig ist, folgt T v = u, also u ∈ D(A) und Au = v. 2


3 Symmetrische Operatoren mit diskretem Spektrum 685

3.2 Operatoren mit diskretem Spektrum und unitäre Gruppen


Satz. Sei A ein selbstadjungierter Operator mit diskretem Spektrum, d.h. A
genüge den Bedingungen 3.1 und sei abgeschlossen. Dann besitzt das Cauchy–
Problem

(∗) ϕ̇t = − i A ϕt , ϕ0 ∈ D(A) vorgegeben

eine eindeutig bestimmte Lösung t → ϕt im Hilbertraumsinn, d.h. im Sinne


von
 1 
lim  (ϕt+h − ϕt ) + i Aϕt  = 0 .
h→0 h
Diese existiert für alle t ∈ Ê und ist gegeben durch
∞
(∗∗) ϕt = e−iλk t vk , ϕ0 vk = U (t)ϕ0 , wobei
k=1



U (t)u := e−iλk t vk , u vk .
k=1

Die U (t) : H → H sind unitäre Operatoren mit der Gruppeneigenschaft

U (s + t) = U (s) U (t) = U (t) U (s) für s, t ∈ Ê, U (0) = ½,


U (t)∗ = U (−t) = U (t)−1 für t ∈ Ê .

Ferner gilt lim U (s)u = U (t)u für alle u ∈ H , t ∈ Ê.


s→t

Beweis.
(a) Eindeutigkeit. Für jede Lösung ϕt der Gleichung ϕ̇t = − i A ϕt gilt


ϕt = vk , ϕt vk ∈ D(A) .
k=1

Die Differenzierbarkeit im Hilbertraumsinn hat zur Folge, dass die Fourierkoef-


fizienten ck (t) := vk , ϕt im gewöhnlichen Sinn differenzierbar sind mit

ċk (t) = vk , ϕ̇t = − i vk , Aϕt = − i Avk , ϕt = − i λk ck (t) ,

also ck (t) = ck (0) e−iλk t = vk , ϕ0 e−iλk t für k ∈ Æ. Es folgt (∗∗).

(b) Die Operatoren U (t). Wegen der Isomorphie von H und 2 folgt
∞ 
  

(1)  e−iλk t vk , u 2 = | vk , u |2 = u2
k=1 k=1

und somit die Konvergenz der folgenden Reihe


686 § 24 Selbstadjungierte Operatoren



(2) U (t) u = e−iλk t vk , u vk
k=1

sowie die Isometriebedingung U (t)u = u für alle u ∈ H . Aus der Darstel-
lung (2) folgt ferner

vk , U (s + t) u = e−iλk s e−iλk t vk , u = e−iλk s vk , U (t) u


= vk , U (s)U (t) u

für k = 1, 2, . . . und somit U (s + t) u = U (s)U (t) u für s, t ∈ . Offenbar gilt Ê


U (0) = ½. Es folgt U (−t)U (t) = U (t)U (−t) = U (0) = ½, und damit existiert
U (t)−1 = U (−t) für alle t ∈ Ê. Da U (t) unitär ist, folgt U (t)∗ = U (t)−1 ÜA .

(c) Existenz einer Lösung. Für gegebenes ϕ0 ∈ D(A) sei ϕt := U (t) ϕ0 gemäß
(2) bzw. (∗∗) definiert. Nach (1) und 3.1 konvergiert die Reihe

∞ 
∞   

λ2k  e−iλk t vk , ϕ0  =
2
(3) λ2k | vk , ϕt |2 = λ2k | vk , ϕ0 |2 ,
k=1 k=1 k=1

also gilt ϕt ∈ D(A) für alle t ∈ Ê . Aus (∗∗) erhalten wir

| vk , ϕt+h − ϕt + i h Aϕt | = | vk , ϕt+h − ϕt + Avk , i h ϕt |


  
= | vk , ϕt+h − ϕt + ihλk ϕt | =  e−iλk t e−iλk h − 1 + i λk h vk , ϕ0 
 
=  e− i λk h − 1 + i λk h  · | vk , ϕ0 | = | f (λk h) | · | vk , ϕ0 |

mit f (x) = e−ix − 1 + ix. Wir setzen g(x) := f (x)/x für x = 0 und g(0) := 0 .
Dann ist g : Ê → Ê+ stetig und beschränkt ÜA , es gilt also |g(x)| ≤ C
für x ∈ Ê mit eine Konstanten C. Nach der Parsevalschen Gleichung folgt für
h = 0
 2
1  1 

 (ϕt+h − ϕt ) + iAϕt  = 2 |f (λk h)|2 | vk , ϕ0 |2
h h k=1
(4)

∞ 

= λ2k |g(λk h)|2 | vk , ϕ0 |2 ≤ C 2 λ2k | vk , ϕ0 |2 .
k=1 k=1

Die letzte Reihe liefert eine von h unabhängige Majorante für die vorletzte,
die somit aufgrund gleichmäßiger Konvergenz eine für alle h stetige, für h = 0
verschwindende Funktion darstellt. Die Behauptung ϕ̇t = −iAϕt folgt aus (4)
für h → 0.

(d) Stetigkeit von t → U (t) u. Sei u ∈ H . Wegen

(U (t + h) − U (t)) u = U (t)(U (h) − ½) u = U (h) u − u

ist nur zu zeigen, dass


3 Symmetrische Operatoren mit diskretem Spektrum 687

∞ 
 2
U (h) u − u2 =  e−iλk h − 1  · | vk , ϕ0 |2 → 0 für h → 0 .
k=1

 
Das folgt wie oben aus  e−ix − 1  = |f (x) − ix| ≤ (1 + C) |x| ÜA . 2

3.3 Die Schrödinger–Gleichung für ein in ]0, 1[ eingesperrtes Teilchen


Wir betrachten den durch Hu = − 12 u auf D(H) = C20 [0, 1] definierten Ope-

rator H. Durch vk (x) := 2 sin(πkx) für k = 1, 2, . . . ist nach § 22 : 5.1 (e) ein
vollständiges ONS für H := L2 [0, 1] gegeben mit
1
Hvk = 2 π 2 k2 vk (k = 1, 2, . . . ) ,

somit ist H ein positiv definiter Operator mit diskretem Spektrum.


Das Schrödingersche Anfangswertproblem auf ]0, 1[ × Ê,
∂ϕ(x, t) i ∂ 2 ϕ(x, t)
(1) = , ϕ(x, 0) = ϕ0 (x) ,
∂t 2 ∂x2
schreiben wir in der Form

(1 ) ϕ̇t = − i Hϕt mit ϕt (x) := ϕ(x, t) .

Die Hilbertraumlösung mit ϕ0 ∈ D(H) ist nach 3.2 gegeben durch



∞ 1 2 2
(2) ϕt = e− 2 iπ k t
vk , ϕ0 vk .
k=1

Setzen wir zusätzlich ϕ0 ∈ D(H 2 ) voraus, so gilt


    1
vk , H 2 ϕ0 = H 2 vk , ϕ0 = 4 π 4 k4 vk , ϕ0 ,
 
also | vk , ϕ0 | ≤ ck k−4 mit ck := 4 π −4 | vk , H 2 ϕ0 | ≤ 4π −4 H 2 ϕ0 . Daher
konvergiert die Reihe

∞ 2
k2 t/2
(2 ) ϕ(x, t) = e−iπ vk , ϕ0 vk (x)
k=1

Ê
gleichmäßig auf , und die gliedweise einmal nach t bzw. zweimal nach x dif-
ferenzierte Reihe besitzen die Majorante

π 2  ck



√ mit |ck |2 < ∞ .
2 k=1 k2 k=1

Somit liefern (2) bzw. (2 ) eine Lösung von (1) im klassischen Sinn.
688 § 24 Selbstadjungierte Operatoren

3.4 Der quantenmechanische harmonische Oszillator


(a) In der klassischen Mechanik ist die Hamilton–Funktion eines Teilchens mit
einem Freiheitsgrad, das sich unter dem Einfluss einer linear von der Ortskoordi-
nate abhängigen Rückstellkraft (Hookesches Gesetz) bewegt, nach Umskalierung
gegeben durch
1 1
h(q, p) = 2 p2 + 2 q2 .

(b) In der Quantenmechanik beschreiben wir die Zeitentwicklung der Wellen-


funktion eines Teilchens mit einem Freiheitsgrad unter dem Einfluss des Poten-
tials v(q) = 12 q 2 durch die Schrödinger–Gleichung
(∗) ϕ̇t = − iHϕt
mit dem Hamilton–Operator
1 1
H = 2 P2 + 2 Q2 ;
dabei ist P : u → −iu der Impulsoperator und Q = Mx der Ortsoperator,
vgl. § 23 : 1.1. Es gilt also
1 1
(Hu)(x) = − 2 u (x) + 2 x2 u(x).

Als Definitionsbereich für H wählen wir einfachheitshalber den Schwartzraum


S.

(c) H : S → S ist ein symmetrischer Operator mit diskretem Spektrum.


Denn für die Hermite–Funktionen hn gilt nach § 12 : 5.2

(1) −hn (x) + x2 hn (x) = (2n + 1)hn (x) , also Hhn = n + 1
2
hn

für n = 0, 1, 2, . . ., und die hn bilden ein vollständiges ONS für H = L2 ( ). Ê


Nach 3.2 ist die Hilbertraumlösung von (∗) mit vorgegebenem Anfangszustand
ϕ0 ∈ S gegeben durch

∞ 1
ϕt = e−i(n+ 2 )t hn , ϕ0 hn .
n=0

Ähnlich wie in 3.3 ergibt sich, dass wegen ϕ0 ∈ S die Reihe



∞ 1
(2) ϕ(x, t) = e−i(n+ 2 )t hn , ϕ0 hn (x)
n=0

gliedweise einmal nach t und zweimal nach x differenzierbar ist und damit die
klassische Lösung der Schrödinger–Gleichung
2
(3) i ∂ϕ(x,t)
∂t
= − 1 ∂ ϕ(x,t)
2 ∂x2
+ 1
2
x2 ϕ(x, t) , ϕ(x, 0) = ϕ0 (x)

liefert:
3 Symmetrische Operatoren mit diskretem Spektrum 689

Beweisskizze.
Wegen ϕ0 ∈ D(H k ) für k ∈  gilt
     1 k
hn , H k ϕ0 = H k hn , ϕ0 = n+ 2
hn , ϕ0 .

Daher gibt es für jedes k ∈  √ | hn , ϕ0 | ≤ ck n


eine Konstante ck mit −k
für
n = 1, 2, . . . . Es lässt sich zeigen, dass |hn (x)| ≤ 2 4 n und |hn (x)| ≤ 8(n + 1)
für n ∈ .
Daher ist die Gleichung (2) einmal gliedweise nach x differenzierbar, und die
einmal nach x abgeleitete Reihe konvergiert gleichmäßig auf ganz . Aus der Ê
Differentialgleichung der hn folgt für |x| ≤ R
 √ 
|hn (x)| ≤ R2 + 2n + 1 |hn (x)| ≤ 2 4
n R2 + 2n + 1 ,


x2 |hn (x)| ≤ 2R2 4
n.

Daher lässt sich die Gleichung (2) zweimal gliedweise nach x differenzieren,
denn die zweimal gliedweise abgeleitete Reihe konvergiert gleichmäßig in jedem
kompakten Intervall. Die gliedweise Differenzierbarkeit der Reihe (2) nach t ist
unproblematisch. 2

3.5* Formen und selbstadjungierte Operatoren


(a) Sei V ein dichter Teilraum des Hilbertraums H und Q eine auf V definierte
quadratische Form, vgl. § 21 : 3.6. Diese heißt positiv, wenn Q(u, u) ≥ 0 für
alle u ∈ V . Für positive Formen Q ist durch

u, v Q = Q(u, v) + u , v

ein Skalarprodukt auf V gegeben. Die Form Q heißt abgeschlossen, wenn


(V, · , · Q ) ein Hilbertraum ist.

Ê
(b) Beispiel. Sei Ω ⊂ n ein beschränktes Gebiet, H = L2 (Ω) und V =
W01 (Ω), vgl. § 14 : 6.2 (b). Für u ∈ V liefert

Q(u, v) = ∇u , ∇v dV n
Ω

eine abgeschlossene, positiv definite quadratische Form (§ 14 : 6.2 (c)), und die
Normen

uQ = ( u , u Q)
1/2
und uV = Q(u, u)1/2

sind zueinander äquivalent (§ 14 : 6.2 (d)).


690 § 24 Selbstadjungierte Operatoren

(c) Satz. Für jede positive abgeschlossene Form Q auf V ist durch

D(A) := { u ∈ V | v → Q(u, v) ist stetig auf V }


= { u ∈ V | Q(u, v) = f , v gilt für ein f ∈ H und alle v ∈ V } ,

Au := f

ein selbstadjungierter Operator A mit


Au , v = Q(u, v) für u ∈ D(A), v ∈ V
definiert.
Im Fall des Laplace–Operators für auf ∂Ω verschwindende Funktionen ist A die
in § 15 : 1.2 (c) eingeführte Fortsetzung. Nach § 15 : 1.2 (a) hat diese ein diskretes
Spektrum.

Beweis.
(i) Für u ∈ D(A) lässt sich v → Q(u, v) zu einem linearen Funktional auf H
fortsetzen; daher gibt es ein eindeutig bestimmtes f ∈ H mit Q(u, v) = f , v
für alle v ∈ V . Wir definieren A durch die Vorschrift Au := f . Dann gilt

Au , u = f , u = Q(u, u) ≥ 0 für alle u ∈ D(A),

also ist A positiv, insbesondere symmetrisch, vgl. § 21 : 3.6.


(ii) Wir zeigen, dass A + 1 surjektiv ist. Für ein gegebenes h ∈ H gilt
| h , v | ≤ h · v ≤ h · vQ , also ist v → h , v stetig auf (V,  · Q ) .
Somit gibt es ein u ∈ V mit

h, v = u, v Q = u , v + Q(u, v) für alle v ∈ V .

Da v → Q(u, v) = h − u , v stetig auf H ist, folgt u ∈ D(A) und Au = h−u,


d.h. (A + 1)u = h.
(iii) Wir zeigen, dass A ein linearer Operator, d.h. dicht definiert ist. Dann ist
A selbstadjungiert nach 1.3 (d).
Erster Schritt: D(A) ist dicht in V bezüglich  · Q . Angenommen, es gibt ein
v ∈ V mit u , v Q = 0 für alle u ∈ D(A). Da es ein u ∈ D(A) gibt mit
(A + 1)u = v, folgt nach Definition von A

v, v = Au + u , v = Q(u, v) + u , v = u, v Q = 0,

also v = 0 .
Zweiter Schritt: Ist also w ∈ V gegeben, so gibt eine Folge (un ) in D(A) mit
w − un Q → 0. Dann gilt auch w − un  ≤ w − un Q → 0. Somit liegt D(A)
bezüglich der Norm  ·  dicht in V und damit auch in H . 2
4 Störung wesentlich selbstadjungierter Operatoren 691

4 Störung wesentlich selbstadjungierter Operatoren


4.1 Problemstellung, Schrödinger–Operatoren
(a) Für ein Gebiet Ω des Ê n
betrachten wir das Problem

(∗) ϕ̇t = − i H ϕt , ϕ0 ∈ D(H) ,

wobei der Operator H auf D(H) ⊂ L2 (Ω) gegeben ist durch

Hu = − 21 Δu + v · u mit einer messbaren Funktion v : Ω → Ê.


Dieses Problem hat genau dann für alle ϕ0 ∈ D(H) eine eindeutig bestimmte,
für alle t ∈Ê definierte Lösung ϕt , wenn H selbstadjungiert ist. Das ergibt
sich aus dem Satz von Stone § 25 : 3.4. In diesem Fall heißt H ein Schrödinger–
Operator und (∗) die zugehörige Schrödinger–Gleichung.
1
Wir lassen im folgenden bequemlichkeitshalber den Vorfaktor 2
weg und schrei-
ben

H = A+B mit A = − Δ , B = Mv .

Dabei soll A eine selbstadjungierte Fortsetzung des Laplace–Operators sein, also


Ê
der Abschluss des auf S ( n) definierten Laplace–Operators für Ω = n (vgl. Ê
2.1 (c) (i)) oder der Abschluss des auf C20 (Ω) definierten Laplace–Operators,
vgl. 3.5*. Da reelle Multiplikatoren nach 1.4 (a) selbstadjungiert sind, werden
wir auf folgende Frage geführt:
Seien A, B selbstadjungiert. Unter welchen Voraussetzungen ist die Summe

A + B : D(A) ∩ D(B) → H , u → Au + Bu

selbstadjungiert?

(b) Als erstes erhebt sich die Frage, ob A + B ein linearer Operator, d.h. dicht
definiert ist. Ist z.B. A der Operator

Ê Ê
u → − u auf D(A) = W2 ( ) := { u ∈ W1 ( ) | u ∈ W1 ( ) } Ê
Ê
und die Funktion v ∈ L1 ( ) über kein offenes Intervall ]a, b[ quadratinte-
grierbar, so ist D(A) ∩ D(Mv ) = {0 }, denn dann ist |v u|2 für keine Funktion
Ê
0 = u ∈ W2 ( ) integrierbar ÜA . Eine solche Funktion v erhalten wir durch



1 1
v(x) := ϕ(x − rk ) mit ϕ(0) = 0 , ϕ(x) = e−|x| für x = 0 ,
2k |x|
k=1

wenn die rk alle rationalen Zahlen durchlaufen ( ÜA , Satz von Beppo Levi).
692 § 24 Selbstadjungierte Operatoren

(c) Der Definitionsbereich von A + B ist sicher dann dicht in H , wenn D(A) ⊂
D(B) gilt. Auch dann folgt aus der Selbstadjungiertheit von A, B nicht die
Selbstadjungiertheit von A + B. Ein Gegenbeispiel wird in 4.3, Bemerkung (iii)
gegeben.

(d) Da wir in der Regel die Bestimmung des Abschlusses wesentlich selbst-
adjungierter Operatoren vermeiden wollen, ist folgendes Problem von großer
praktischer Bedeutung:
Seien A, B wesentlich selbstadjungiert mit D(A) ⊂ D(B). Gesucht sind hinrei-
chende Kriterien für die wesentliche Selbstadjungiertheit von A + B.

4.2 Kleine Störungen


(a) Seien A, B symmetrische Operatoren mit D(A) ⊂ D(B). Der Operator B
heißt A–beschränkt, wenn es Zahlen a, b ∈ + gibt mit Ê
(∗) Bu ≤ a Au + b u für alle u ∈ D(A) .

Lässt sich dabei a < 1 wählen, so heißt B eine kleine Störung von A.
Gibt es zu jedem a ∈ ]0, 1] ein b ≥ 0 mit (∗), so heißt B eine unendlich kleine
Störung von A.

(b) Genau dann ist ein symmetrischer Operator B eine kleine Störung des
symmetrischen Operators A mit D(A) ⊂ D(B), wenn es Konstanten α, β gibt
mit

(∗∗) 0 ≤ α < 1 , β ≥ 0 , Bu2 ≤ α Au2 + β u2 für alle u ∈ D(A) .

Aus √
(∗) folgt (∗∗) mit α = β und geeignetem β > b. Aus (∗∗) folgt (∗) mit
a = α und geeignetem b ÜA .

(c) Beispiele. (i) Ist A symmetrisch und B beschränkt und symmetrisch, so


ist B eine unendlich kleine Störung von A (a = 0 bzw. α = 0).
 
(ii) Für u ∈ D(A) = u ∈ W01 [a, b] | u ∈ W1 [a, b] sei Au = −u , und für
u ∈ D(B) = W01 [a, b] sei Bu = −iu . Dann ist B eine unendlich kleine Störung
von A: Denn A ist selbstadjungiert, B ist symmetrisch mit D(A) ⊂ D(B), und
für u ∈ D(A) gilt

b b
u , Au = − u u dλ = |u |2 dλ = Bu2 ,
a a

also
 1
2
Bu2 = u , Au ≤ Au · u ≤ α Au + u

für beliebige α ∈ ]0, 1[.
4 Störung wesentlich selbstadjungierter Operatoren 693

4.3 Der Satz von Kato–Rellich


Für jede kleine symmetrische Störung B eines selbstadjungierten Operators A
ist die Summe A + B : D(A) → H selbstadjungiert.

Bemerkungen. (i) B muß weder selbstadjungiert noch abgeschlossen sein.


(ii) Der Satz geht auf Rellich (1939) zurück. Eine Reihe von Verallgemei-
nerungen und Anwendungen wurden von Kato [128] 1966 angegeben; Anwen-
dungsbeispiele folgen in 4.5, 4.6.
(iii) Für die in 4.2 zuletzt angegebenen Operatoren A, B ist demnach
C := −A + B : D(A) → L2 [a, b] , u → u − iu
selbstadjungiert, denn nach 1.4 (a) sind A und damit auch −A selbstadjungiert.
Dies Beispiel zeigt auch, dass die Summe zweier selbstadjungierter Operatoren
i.A. nicht selbstadjungiert ist: B = A + C : D(A) → L2 [a, b], u → −iu ist nach
§ 23 : 3.2 (a), 4.3 (a) weder abgeschlossen noch wesentlich selbstadjungiert.

Beweis.
(a) Da A + B symmetrisch ist, genügt es nach 1.3 (d) zu zeigen, dass es ein
t > 0 gibt, so dass A+B +it, A+B −it surjektiv sind. Wir betrachten zunächst
A + B + it für t > 0. Da A selbstadjungiert ist, ist A + it stetig invertierbar.
Aus der Gleichung
(A + it)u2 = Au2 + t2 u2 für u ∈ D(A)
folgt
 
(1) (A + it)−1  ≤ 1 und
t
(2) Au ≤ (A + it)u für u ∈ D(A) .

Zu gegebenem v ∈ H gibt es genau ein u ∈ D(A) mit v = (A + it)u. Aus (2)


folgt
 
(3) A(A + it)−1 v  = Au ≤ (A + it)u = v .

Daher ist A(A + it)−1 beschränkt mit Normschranke 1.

(b) Für den symmetrischen Operator B gibt es nach Voraussetzung Zahlen a, b


mit 0 ≤ a < 1, b ≥ 0 und Bu ≤ a Au + b u für u ∈ D(A). Für v ∈ H
gilt (A + it)−1 v ∈ D(A) ⊂ D(B). Daher folgt mit (3) und (1)
       
(4) B(A + it)−1 v  ≤ a A(A + it)−1 v  + b (A + it)−1 v  ≤ a + b v .
t
Somit ist ½ + B(A + it) −1
für a + b/t < 1 stetig invertierbar (§ 21 : 6.1).
694 § 24 Selbstadjungierte Operatoren

(c) Ist also v ∈ H vorgegeben, so gibt es ein w ∈ H mit


v = w + B(A + it)−1 w .
Da A + it surjektiv ist, gibt es ein u ∈ D(A) mit w = (A + it)u, also
v = (½ + B(A + it)−1 )(A + it)u = (A + it + B)u .

(d) Die Surjektivität von A − it + B folgt wie oben, indem überall A + it durch
A − it ersetzt wird. 2

4.4 Kriterien für die wesentliche Selbstadjungiertheit


Satz. (a) Für jede kleine symmetrische Störung B eines wesentlich selbstad-
jungierten Operators A ist A + B wesentlich selbstadjungiert.

(b) Es gilt dann

D(A + B) = D(A) ⊂ D(B) und A + B = A + B.

Im Fall D(A) ⊂ D(B) gilt darüberhinaus A + B = A + B.


Bemerkung. Die Aussage (b) gilt für jede kleine symmetrische Störung B eines
beliebigen symmetrischen Operators A, wie der folgende Beweis zeigt.

(c) Satz von Wüst (1971). Sei A selbstadjungiert und B ein symmetrischer
Operator mit D(A) ⊂ D(B). Gibt es eine Zahl b ≥ 0 mit
Bu ≤ Au + bu für alle u ∈ D(A) ,
so ist A + B wesentlich selbstadjungiert auf jedem Genbereich für A.
Den Beweis von (c) finden Sie in Reed-Simon [130, II] Thm.X.14.

Beweis.
(b) Nach Voraussetzung ist D(A) ⊂ D(B), und es gibt Zahlen a, b mit a < 1,
Ê
b ∈ + und
(1) Bu ≤ a Au + b u für u ∈ D(A).
Für u ∈ D(A + B) := D(A) folgt

Au = (A + B)u − Bu ≤ (A + B)u + a Au + b u , also

1 b
(2) Au ≤ (A + B)u + u .
1−a 1−a
Mit A, B ist auch A + B symmetrisch, also abschließbar. Wir zeigen zunächst

D(A) ⊂ D(B) , D(A) ⊂ D(A + B) und
(i)
(A + B)u = Au + Bu für u ∈ D(A).
4 Störung wesentlich selbstadjungierter Operatoren 695

Sei u ∈ D(A), also u = lim un und Au = lim Aun mit einer Folge (un ) in
n→∞ n→∞
D(A). Nach (1), angewandt auf um − un , ist (Bun ) eine Cauchy–Folge, somit
gilt u ∈ D(B), Bu = lim Bun . Da lim (Aun + Bun ) = Au + Bu existiert,
n→∞ n→∞
folgt u ∈ D(A + B) und (A + B)u = Au + Bu.
Im Fall D(A) ⊂ D(B) gilt zusätzlich u ∈ D(B), also Bu = Bu und somit
(A + B)u = Au + Bu.

(ii) Die Inklusion D(A + B) ⊂ D(A) ergibt sich analog mit Hilfe von (2): Für
u ∈ D(A + B) gibt es eine Folge (un ) in D(A + B) = D(A) mit un → u
und Aun + Bun → (A + B)u. Aus (2) folgt, dass die Folge (Aun ) konvergiert,
somit u ∈ D(A). Dann konvergiert auch die Folge (Bun ), und wir erhalten
(A + B)u = lim (Aun + Bun ) = Au + Bu; im Fall D(A) ⊂ D(B) wieder
n→∞
Bu = Bu.

(a) Ist A wesentlich selbstadjungiert und B eine symmetrische Störung mit (1),
so gilt also D(A + B) = D(A) ⊂ D(B), A + B = A + B.
Für u ∈ D(A), u = lim un , Au = lim Aun mit un ∈ D(A) folgt aus den
n→∞ n→∞
Überlegungen (i), dass u ∈ D(B) und Bu = lim Bun . Aus (1) erhalten wir
n→∞

Bu ≤ a Au + b u .

Somit ist B eine kleine symmetrische Störung von A, und die Behauptung folgt
aus 4.3. 2

(d) Folgerung. Ist A abgeschlossen und B eine kleine Störung von A, so ist
A + B mit dem Definitionsbereich D(A) abgeschlossen.
Denn im Beweisteil (b) wurde von der Symmetrie kein Gebrauch gemacht, und
wegen der Voraussetzung D(A) = D(A) ⊂ D(B) folgt A + B = A+B = A+B.

4.5 Anwendung auf Hu = − u + v · u


Ê Ê Ê Ê
Sei v ∈ L2 ( ) + L∞ ( ), d.h. v = f + g mit f ∈ L2 ( ) und g ∈ L∞ ( ). Dann
ist der Operator

− Δ + Mv : u → − u + v · u mit Definitionsbereich S

wesentlich selbstadjungiert, und sein Abschluss

H : u → − u + v · u mit Definitionsbereich W2 ( ) Ê


ist ein Schrödinger–Operator.

Ê Ê Ê
Hierbei ist W2 ( ) = {u ∈ W1 ( ) | u ∈ W1 ( )} = D(P 2 ).
696 § 24 Selbstadjungierte Operatoren

Beispiel. Durch v(x) = |x|−1/4 für x = 0 ist ein Potential gegeben, das über
[−1, 1] quadratintegrierbar und für |x| ≥ 1 beschränkt ist. Daher erfüllt v die
Voraussetzung des Satzes mit f := v χ[−1,1] , g = v − f .

Beweis.
(a) Es gilt − Δ + Mv = A + B mit A = − Δ + Mf und dem beschränkten
Operator B = Mg . Falls A wesentlich selbstadjungiert ist, gilt dies auch für
A+B, denn B ist eine (nach 4.2 (c) unendlich) kleine Störung von A mit D(A) ⊂
Ê
D(B) = L2 ( ), somit folgen die wesentliche Selbstadjungiertheit von A+B und
die Beziehung A + B = A + B aus 4.4. Wir dürfen daher g ignorieren und von
Ê
vornherein v = f ∈ L2 := L2 ( ) annehmen.

(b) Nach 2.1 (c) (i) ist der auf S definierte Operator − Δ wesentlich selbstad-
jungiert.

(c) Wir zeigen zunächst, dass D(−Δ) ⊂ D(Mv ). Hierzu genügt es wegen v ∈
L2 zu zeigen, dass alle Funktionen u ∈ D(−Δ) beschränkt sind.
Für u ∈ S gilt
x
(1) | u(x) |2 = u(x) u(x) = (u u + u u) dλ ≤ 2 u · u  .
−∞

Ferner folgt für u ∈ S durch partielle Integration u , −u = u , u , also

(2) u 2 ≤ u · u  .

Aus (1) und (2) ergibt sich


(
2 u2 , falls u  ≤ u ,
(3) u2∞ ≤ 2 u3/2 · u 1/2 ≤
2 u · u  sonst.
In jedem Fall gilt

u2∞ ≤ 2 u2 + u 2 = 2 u2Δ für u ∈ S .

Für u ∈ D(−Δ) gibt es schnellfallende Funktionen un mit u − un Δ → 0. Es


folgt u − un ∞ → 0, also
√ √
u∞ = lim un ∞ ≤ 2 lim un Δ = 2 uΔ .
n→∞ n→∞

(d) Mv ist eine unendlich kleine Störung von −Δ. Denn für u ∈ S und jede
Zahl a ∈ ]0, 1[ folgt aus (3) durch Fallunterscheidung ÜA
a 2
2
u v2 ≤ u2∞ · v2 ≤ u  + u v2 . 2
2 a
4 Störung wesentlich selbstadjungierter Operatoren 697

4.6 Beispiele für Schrödinger–Operatoren auf L2 ( Ê)


3

Satz (Kato 1951). Der auf S ( Ê ) definierte Operator


3

− Δ + Mv : u → − Δu + v · u

ist für jedes Potential v ∈ L2 ( Ê ) + L (Ê )


3 ∞ 3
wesentlich selbstadjungiert.

Das wichtigste Beispiel ist das durch


v(x) := 1/x für x = 0, v(0) = 0
gegebene Coulomb–Potential: Mit der charakteristischen Funktion ϕ der Ein-
heitskugel K1 (0) und mit f := v · ϕ, g := v · (1 − ϕ) gilt
v = f + g , wobei g ∈ L∞ ( Ê)
3
und f ∈ L2 ( Ê ),3
f 2 = 4π 2 ,
vgl. Bd. 1, § 23 : 8.3.

Beweis.
(a) Es genügt, den Operator − Δ + Mv mit v ∈ L2 ( Ê ) zu betrachten, wie am
3

Beginn des Beweises 4.5 dargelegt wurde.


Ê
(b) Nach 2.1 (c) (i) ist der auf S ( 3 ) definierte Laplace–Operator wesentlich
Ê
selbstadjungiert. Ferner gilt S ( 3 ) ⊂ D(Mv ), denn für u ∈ S gilt
|u · v| ≤ u∞ |v| , somit u · v ∈ L2 := L2 ( Ê ).3

(c) Für r(x) := x gehört (1 + r 2 )−1 zu L2 (§ 20 : 7.3). Wir setzen


(1) K := (2π)−3/2 , L := (1 + r 2 )−1  = (1 + r 2 )−1 L2 .

(d) Sei ϕ ∈ S := S ( Ê ). Nach § 12 : 3.4 gilt


3


ϕ(x) = K /(y) ei x , y  d3 y .
ϕ
Ê3
Es folgt

(2) /1 = K
ϕ∞ ≤ K ϕ /| dV 3 .

Ê3
/ ∈ S ⊂ L2 folgt mit der Cauchy–Schwarzschen Ungleichung
Wegen (1 + r 2 ) ϕ
  
(3) /1 =
ϕ /| dV 3 ≤ L  (1 + r2 ) ϕ
(1 + r 2 )−1 (1 + r 2 ) |ϕ / .
Ê3
Nach dem Multiplikations– und Ableitungssatz § 12 : 3.3 gilt

/= ϕ
(1 + r 2 ) ϕ : = (ϕ − Δϕ) /.
/ − Δϕ
Wegen der Isometrie der Fouriertransformation ist also
 
(4)  (1 + r2 ) ϕ
/  =  ϕ − Δϕ  ≤ ϕ + Δϕ .
698 § 24 Selbstadjungierte Operatoren

Aus (2), (3), (4) erhalten wir somit für ϕ ∈ S mit der Graphennorm  . Δ
√ 1 √
(5) ϕ∞ ≤ KL (ϕ + Δϕ) ≤ 2KL(ϕ2 + Δϕ2 ) 2 = 2 KL ϕΔ .

Für u ∈ D(−Δ) gibt es Funktionen ϕn aus S mit u − ϕn Δ → 0 . Es folgt



u − ϕn ∞ → 0 , also mit C := ( 2KL)1/2

(5 ) u∞ ≤ lim ϕn ∞ ≤ C lim ϕn Δ = C uΔ .


n→∞ n→∞

Also gilt D(−Δ) ⊂ D(Mv ), denn u v ∈ L2 für u ∈ D(−Δ).


(e) Wir zeigen abschließend, dass Mv eine unendlich kleine Störung von − Δ
ist. Sei u ∈ S = D(−Δ) und ϕt (y) := t3 u /(ty) mit t > 0. Wegen ϕt ∈ L1 ( 3 ) Ê
folgt aus dem Transformationssatz für Integrale ÜA
/1 , ϕt  = t3/2 u
ϕt 1 = u / = t3/2 u
und
r 2 ϕt  = t−1/2 r 2 u
/ = t−1/2 Δu
;
wegen Δ /.
u = − r2 u
Aus (3) ergibt sich also, da ϕt eine Fouriertransformierte ist,
 
(6) /1 = ϕt 1 ≤ L ϕt  + r2 ϕt  = L t−1/2 Δu + t3/2 u .
u
Aus (2) mit u statt ϕ erhalten wir schließlich
v · u ≤ u∞ · v ≤ at Δu + bt u

mit at := K Lv t−1/2 und bt ∈ Ê +. Hierbei kann at beliebig klein gewählt


werden. 2

4.7 Weitere Störungssätze


Ê Ê
Die Potentiale v ∈ L2 ( 3 ) + L∞ ( 3) sind nicht die einzigen, welche Schrödin-
ger–Operatoren liefern. Für das Studium von Wechselwirkungspotentialen und
Ê
von Schrödinger–Operatoren im n sind eine ganze Reihe weiterer Störungssätze
entwickelt worden. Wir verweisen hierzu auf Reed-Simon [130, II] Ch. X.2 und
Kato [128].
699

§ 25 Der Spektralsatz und der Satz von Stone


1 Spektralzerlegung und Funktionalkalkül selbstadjungierter
Operatoren
1.1 Übersicht
In § 22 wurde der Spektralsatz für beschränkte symmetrische
 Operatoren T
in drei Versionen formuliert:
 Spektralzerlegung T = λ dE λ , Erwartungswert–
Formel u , f (T )u = f dμu und Multiplikatordarstellung T = U −1 Mv U .
Grundlage dafür war der zuvor entwickelte Funktionalkalkül.
In diesem Abschnitt werden entsprechende Ergebnisse für unbeschränkte selbst-
adjungierte Operatoren A auf einem Hilbertraum H gewonnen, doch in anderer
Reihenfolge. Ausgangspunkt ist eine Multiplikatordarstellung für A, deren Exi-
stenz sich im Fall σ(A) = Ê relativ einfach beweisen lässt. Für Multiplikatoren
Mv bietet sich die im folgenden entwickelte Methode der Zurückführung auf
spektrale Teilräume in natürlicher und anschaulicher Weise an. Wir schildern
zunächst Vorgehen und Ergebnisse; die Beweise werden dann in Abschnitt 2
zusammengefasst.
Ein Ziel dieses Paragraphen ist die Begründung des Funktionalkalküls und
dessen wahrscheinlichkeitstheoretische Deutung durch den Spektralsatz. Der
Kalkül des Einsetzens von A in Funktionen gestattet die Übertragung von
Lösungsformeln für gewöhnliche Differentialgleichungen auf partielle. Insbeson-
dere sichert er die Existenz und Eindeutigkeit einer für alle t ∈ Ê definierten
Hilbertraumlösung des Cauchy–Problems ϕ̇t = −iAϕt , ϕ0 ∈ D(A) in der Form
ϕt = e−iAt ϕ0 , was die entscheidende Eigenschaft ist, welche die selbstadjungier-
ten Operatoren A vor den symmetrischen auszeichnet. Dies besagt der Satz 3.4
von Stone.
Am Ende dieses Paragraphen diskutieren wir einige Konsequenzen der Hilber-
traumtheorie für die physikalische Interpretation: Verteilung der Messwerte,
Heisenbergsche Unschärferelation, die Rolle des Spektrums als Menge der mögli-
chen Messwerte einer Observablen A und die Bedeutung der Vertauschbarkeit
von Observablen.

1.2 Multiplikatordarstellung selbstadjungierter Operatoren


(a) Ist A ein selbstadjungierter Operator auf einem Hilbertraum H , so gibt es
Ê
ein Wahrscheinlichkeitsmaß μ auf , eine messbare Funktion v : → Ê Ê und
Ê
eine unitäre Abbildung U : H → L2 ( , μ) mit

A = U −1 Mv U .

Die Funktion v kann dabei so gewählt werden, dass ihr Wertevorrat v( ) im Ê


Spektrum von A liegt und die Menge ihrer Unstetigkeitsstellen in einer diskreten
μ–Nullmenge N = {nδ | n ∈ } mit δ > 0.
700 § 25 Der Spektralsatz und der Satz von Stone

Beweis.
Wir betrachten zunächst nur den am meisten interessierenden Fall σ(A) = , Ê
der z.B. bei halbbeschränkten Operatoren vorliegt. Wir können dann ∈ so Ê
wählen, dass die Resolvente R( , A) existiert und wegen ∈ Êsymmetrisch
ist. Nach § 22 : 3.6 gibt es ein Wahrscheinlichkeitsmaß μ auf Ê
, eine stetige,
Ê
periodische Sägezahnfunktion w : → σ(R( , A)) und eine unitäre Abbildung
Ê
U : H → L2 ( , μ) mit

R( , A) = U −1 Mw U .

Da 0 kein Eigenwert von R( , A) ist, gilt für die äquidistante Nullstellenmenge


N von w nach § 21 : 5.3 (b) μ(N ) = μ({w = 0}) = 0. Wir setzen

⎨ − 1
falls w(x) = 0 ,
v(x) := w(x)

ν für x ∈ N

mit einer beliebigen Zahl ν ∈ σ(Mv ).


Mit dem Operator Mv ist auch der Operator

B := U −1 Mv U

selbstadjungiert, was sich z.B. aus dem Kriterium § 24 : 1.3 (c) ergibt.
Wir zeigen A = B. Da selbstadjungierte Operatoren maximal symmetrisch sind
(§ 23 : 1.2), genügt hierzu der Nachweis von A ⊂ B.
Sei u ∈ D(A). Dann gibt es ein h ∈ H mit u = R( , A)h. Für f := U u und
g := U h gilt f = w · g ∈ D(Mv ), somit u ∈ D(B) und

( − B)u = U −1 (( − v)f ) = U −1 g = h = ( − A)u . 2

Für Operatoren A mit σ(A) = Ê wird der Beweis in 2.6 nachgetragen.


(b) Die unitäre Äquivalenz A = U −1 Mv U gestattet es, die Spektralzerlegung
und den Spektralsatz in anschaulicher Weise auf die Analyse unbeschränkter
Multiplikatoren zurückzuführen. Aus den Ergebnissen von § 23 : 5.5 über deren
Spektrum und den allgemeinen Ausführungen § 9 : 1.3 über unitäre Äquivalenz
ergibt sich z.B. ÜA
  
σ(A) = σ(Mv ) = Ê  μ({|v − λ| < ε}) > 0
λ∈ für alle ε > 0 ,
  
σ (A) = σ (M ) = λ ∈ Ê  μ({v = λ}) > 0 ,
p p v

σc (A) = σc (Mv ).

Nach § 23 : 5.5 (b) dürfen wir v(x) ∈ σ(Mv ) = σ(A) für alle x ∈ Ê annehmen.
1 Spektralzerlegung und Funktionalkalkül 701

1.3 Einschränkung auf spektrale Teilräume


(a) Aus dem Vorangehenden ergibt sich, dass das Spektrum eines unbeschränk-
ten selbstadjungierten Operators A nichtleer und unbeschränkt ist. In der Quan-
tenmechanik wird das Spektrum von A als die Menge der möglichen Messwerte
für die durch A beschriebene Observable gedeutet, Näheres hierzu in 4.4.
Registrieren wir nur die in ein Intervall I = ]a, b] fallenden Werte, so ist dadurch
eine neue Observable definiert.
Diese ergibt sich in naheliegender Wei-
se aus einer Multiplikatordarstellung v
A = U −1 Mv U gemäß 1.2. Da σ(A) = b
σ(Mv ) der essentielle Wertevorrat von
v ist, können wir die nicht ins Intervall
I fallenden Werte wie folgt ausblenden.
Wir betrachten die μ–messbare Menge a

S := {a < v ≤ b} = v −1 (]a, b])


und w := χS = χI ◦ v. Durch
Ê
P f := w · f für f ∈ L2 ( , μ) x

ist ein symmetrischer Multiplikator P mit P 2 = P definiert. Daher vermittelt P


Ê
die orthogonale Projektion auf einen abgeschlossenen Teilraum VI von L2 ( , μ).
Dieser Teilraum wird durch Mv in sich übergeführt: Für g = f · χS ∈ VI gilt
Ê
|v · g| ≤ c |f | mit c := max{|a|, |b|}, also v · g ∈ L2 ( , μ) und damit g ∈ D(Mv )
Ê
sowie v · g = v · g · χS ∈ VI . Dem Teilraum VI von L2 ( , μ) entspricht in H
der spektrale Teilraum
H I := U −1 (VI ) .
H I ist abgeschlossen und A–invariant, d.h. H I ⊂ D(A) und A(H I ) ⊂ H I .
Der orthogonale Projektor PI mit H I = PI (H ) heißt der zu I gehörige Spek-
tralprojektor.
(b) Satz. Sei A ein selbstadjungierter Operator auf dem Hilbertraum H . Dann
sind für jedes beschränkte Intervall I = ]a, b] ein Spektralprojektor PI und ein
spektraler Teilraum H I definiert mit folgenden Eigenschaften:
(i) H I ist A–invariant; H I = {0}, falls σ(A) ∩ I = ∅.
(ii) Im Fall H I = {0} ist die Einschränkung AI von A auf H I ein beschränk-
ter symmetrischer Operator auf H I mit
σ(AI ) = σ(A) ∩ [a, b] , σp (AI ) = σp (A) ∩ ]a, b] .
(iii) Für jede Multiplikatordarstellung A = U −1 Mv U von A gilt
PI = U −1 Mw U mit w = χI ◦ v .
(iv) Jeder A–invariante Teilraum liegt in einem spektralen Teilraum H I .
702 § 25 Der Spektralsatz und der Satz von Stone

Die Aussage (i) ergibt sich aus (a), die anderen anschaulich plausiblen Behaup-
tungen werden in 2.1, 2.2 bewiesen. Beachten Sie, dass die H I , PI nach (iii)
wohldefiniert sind, d.h. nicht von der Multiplikatordarstellung abhängen.
1.4 Der Spektralzerlegungssatz
(a) Jeder unbeschränkte selbstadjungierte Operator A lässt sich auf folgende
Weise aus beschränkten symmetrischen Anteilen aufbauen:
7
Für n ∈ seien In = ]αn , αn+1 ] nichtleere Intervalle mit n∈
In =  , z.B.
In = ]n, n + 1]. Wir betrachten die für die In gemäß 1.3 definierten Spektralpro-
jektoren Pn = PIn und die zugehörigen spektralen Teilräume H n = Pn (H ).
Dann gilt
@
+∞

H = Hn ,
n=−∞
d.h. die H n sind paarweise zueinander orthogonal, und jeder Vektor u ∈ H
besitzt eine eindeutige Darstellung

+∞
u = un mit un := Pn u ∈ H n .
n=−∞

Wegen der A–Invarianz der H n vertauscht A mit allen Spektralprojektoren:


Pn APn = APn und Pn Au = APn u für u ∈ D(A). Es gilt

+∞
u ∈ D(A) ⇐⇒ APn u2 < ∞ ,
n=−∞

+∞
Au = APn u für u ∈ D(A) .
n=−∞

Für jedes Intervall In mit σ(A) ∩ In = ∅ ist die Einschränkung An von A auf
H n ein beschränkter symmetrischer Operator mit
σ(An ) = σ(A) ∩ In , σp (An ) = σp (A) ∩ In .

Der mit Hilfe einer Multiplikatordarstellung leicht zu führende Beweis wird in


2.3 gegeben.

Aus der A–Invarianz der H n folgt für u ∈ H n , dass Ak u für k = 1, 2, . . .


definiert ist und wieder zu H n gehört.
(b) Satz. Durch

+∞
Ak = Ak Pn , d.h.
n=−∞

+∞
u ∈ D(Ak ) ⇐⇒ Ak Pn u2 < ∞ ,
n=−∞
+∞
Ak u = Ak Pn u für u ∈ D(Ak ) ,
n=−∞

sind selbstadjungierte Operatoren Ak (k = 1, 2, . . .) gegeben.


1 Spektralzerlegung und Funktionalkalkül 703

Die Selbstadjungiertheit der Operatoren Ak folgt aus einer Multiplikatordarstel-


lung A = U −1 Mv U wegen Ak = U −1 Mvk U oder ergibt sich aus dem folgenden
Lemma (c). Der Rest folgt aus (a).

(c) Damit steht einer Definition des selbstadjungierten Operators p(A) für re-
elle Polynome p nichts mehr im Wege. Für die Definition eines allgemeinen
Funktionalkalküls in 1.5 benötigen wir das folgende
Lemma. Auf jedem spektralen Teilraum H n = {0} sei ein beschränkter symme-
trischer Operator Bn : H n → H n gegeben. Dann ist durch
 
u ∈ D(B) : ⇐⇒ Bn Pn u2 < ∞ , Bu := Bn Pn u für u ∈ D(B)
n∈ n∈

(Summation nur über die n ∈ mit H n = {0}) ein selbstadjungierter Operator


B definiert.
Beweis.
Es ist leicht zu sehen, dass B symmetrisch ist. Wir wenden das Kriterium
§ 24 : 1.3 (c) an.

Sei v = vn ∈ H mit vn = Pn v. Wegen i ∈ σ(Bn ) gibt es im Fall H n = {0}
n∈
Vektoren un ∈ H n mit (Bn − i)un = vn . Im Fall H n = {0} setzen wir un = 0.
Wegen vn 2 = (Bn − i)un 2 = Bn un 2 + un 2 konvergieren die Reihen
   
un 2 , u := un , Bn un 2 , Bn un = iu + v.
n∈ n∈ Hn ={0} Hn ={0}

Somit gilt u ∈ D(B) und (B − i)u = v. Analog folgt die Surjektivität von B + i.
2
1.5 Der Funktionalkalkül
(a) Definition. Sei A ein unbeschränkter selbstadjungierter Operator, ferner
sei f :  →  stetig oder gehöre zur Klasse F aller Funktionen f :  → + , die
punktweiser Limes einer absteigenden Folge beschränkter stetiger Funktionen
fn :  → + sind 7 (vgl. § 21 : 9.2). Wie in 1.4 seien In = ]αn , αn+1 ] beschränkte
Intervalle mit n∈ In =  , Pn die nach 1.3 für die Intervalle In definierten
Spektralprojektionen und H n = Bild Pn die zugehörigen spektralen Teilräume.
Für H n = {0} ist die Einschränkung An von A auf H n beschränkt und sym-
metrisch, also ist f (An ) für f ∈ C() nach § 21 : 7.3 bzw. für f ∈ F nach
§ 21 : 9.2 erklärt. Wir definieren f (A) durch

u ∈ D(f (A)) : ⇐⇒ f (An )Pn u2 < ∞ und
n∈

f (A)u = f (An )Pn u für u ∈ D(A) ;
n∈

dabei ist nur über die n ∈ mit σ(A) ∩ In = ∅ zu summieren.


Nach 1.4 (c) ist f (A) selbstadjungiert, falls f reellwertig ist.
704 § 25 Der Spektralsatz und der Satz von Stone

(b) Satz. Für stetige Funktionen f : Ê→ bzw. für f ∈ F und jede Multi-
plikatordarstellung A = U −1 Mv U von A ist

f (A) = U −1 Mf ◦v U .

Daher ist f (A) abgeschlossen für unbeschränkte stetige Funktionen f : →


und beschränkt für beschränkte Funktionen f ∈ C() bzw. für f ∈ F.
Den Beweis von (b) führen wir in 2.4 (b). Auf den Spezialfall f = eλ = χ]−∞,λ]
gehen wir in 1.7 ein.

(c) Zu jeder messbaren Funktion f :  → gibt es einen abgeschlossenen


Operator f (A) mit der Eigenschaft

f (A) = U −1 Mf ◦v U für jede Multiplikatordarstellung A = U −1 Mv U .

Der Beweis folgt als Anmerkung zum Beweis des Spektralsatzes in 1.8.

1.6 Eigenschaften des Funktionalkalküls für beschränkte stetige


Funktionen
Mit Cb () bezeichnen wir den Vektorraum der beschränkten stetigen Funktio-
nen f :  → . Für f ∈ Cb () gilt
(a) f (A) ∈ L (H ), f (A) = f ∞ := sup{|f (λ)| | λ ∈ σ(A)},

(b) f (A) = f (A),
(c) f (A) ≥ 0, falls f (λ) ≥ 0 für λ ∈ σ(A).
Für f, g ∈ Cb () ergibt sich
(d) (αf + βg)(A) = αf (A) + βg(A),
(e) (f g)(A) = f (A) g(A ) = g(A)f (A).
Dies folgt unmittelbar aus 1.5 (b) und den entsprechenden Eigenschaften von
Multiplikatoren ÜA .

1.7 Spektralschar und Spektralmaß


(a) Nach 1.5 ist für einen selbstadjungierten Operator A und f ∈ F ein be-
schränkter symmetrischer Operator f (A) ≥ 0 erklärt mit f (A) = U −1 Mf ◦v U
für jede Multiplikatordarstellung A = U −1 Mv U . Aus der Multiplikatordarstel-
lung folgt unmittelbar für f, g ∈ F:
(f g)(A) = f (A)g(A) = g(A)f (A) ,
f (A) − g(A) ≤ f − g∞ ,
f ≤ g =⇒ f (A) ≤ g(A) .
1 Spektralzerlegung und Funktionalkalkül 705

(b) Wir definieren die Spektralschar {Eλ | λ ∈ Ê} von A durch


Eλ = eλ (A) mit eλ = χ]−∞,λ] ∈ F .

Die Einschränkung von Eλ auf einen spektralen Teilraum H I = {0} mit einem
Intervall I = ]αn , αn+1 ] ist nach 1.5 (a) die Spektralschar der Einschränkung
AI von A auf H I .
Satz. Die Eλ sind symmetrische Projektoren mit folgenden Eigenschaften:
(i) λ ≤ μ =⇒ Eλ ≤ Eμ und Eλ = Eλ Eμ = Eμ Eλ .
(ii) Eλ = s–lim Eμ ; ferner existiert Eλ− := s–lim Eμ .
μ→λ+ μ→λ−

(iii) s–lim Eλ = 0 , s–lim Eλ = .


λ→−∞ λ→∞

(iv) Eλ = U −1 Meλ ◦v U für jede Multiplikatordarstellung A = U −1 Mv U .


(v) Für jedes Intervall I = ]a, b] ist Eb − Ea der Projektor PI auf den spek-
tralen Teilraum H I .
Der Beweis wird in 2.5 gegeben.
(c) Spektralmaße. Für u = 1 ist wegen der Eigenschaften (i), (ii), (iii) der
Spektralschar durch
F (λ) = u , Eλ u = Eλ u2
eine Verteilungsfunktion F gegeben. Das nach § 19 : 9.3 durch F bestimmte
Wahrscheinlichkeitsmaß auf  bezeichnen wir mit μu . In der Quantenmecha-
nik liefert μu die Verteilung der Messwerte der durch A beschriebenen Obser-
vablen A für ein System im Zustand | u u |.
Für einen selbstadjungierten Multiplikator Mv auf L2 (, μ) gilt

μu (B) = |u|2 dμ
v −1 (B)

für jede Borelmenge B, vgl. § 22 : 2.3.

1.8 Spektralsatz und Erwartungswerte


(a) Der Spektralsatz. Seien A ein selbstadjungierter Operator auf einem se-
parablen Hilbertraum H , f :  →  stetig und u = 1. Dann gilt

u ∈ D(f (A)) ⇐⇒ |f |2 dμu < ∞ und
Ê

u , f (A)u = f dμu für u ∈ D(f (A)) .
Ê
Hierbei ist μu das zu u gehörige Spektralmaß bezüglich A, vgl. 1.7 (c).
Durch die obengenannten Eigenschaften ist dieses und damit die Spektralschar
eindeutig bestimmt.
706 § 25 Der Spektralsatz und der Satz von Stone

(b) Für u ∈ D(A) existieren insbesondere Erwartungswert und Varianz von


μu ,

/u =
E(μu ) = μ x dμu (x) = u , Au ,
Ê

V (μu ) = /u )2 dμu (x) = (A − μ
(x − μ /u )u2 .
Ê
(c) Aus (a) ergibt sich folgende Deutung des Funktionalkalküls für die Quan-
tenmechanik: Beschreibt A eine Observable, so beschreibt f (A) die durch Trans-
formation x → f (x) der Messwerte x für A hervorgehende Observable. Dies
wurde bereits in § 22 : 1.4 begründet.

Beweis.
(i) Der einfachste Beweis beruht auf dem Transformationssatz für Bildmaße
§ 20 : 6.4. Da nach Definition des Funktionalkalküls u , f (A)u invariant unter
unitären Transformationen ist, dürfen wir annehmen, dass A ein Multiplikator
Ê
Mv auf einem L2 ( , μ) ist. Nach 1.7 (c) gilt dann für u = 1 und I = ]a, b]

μu (I) = u , (χI ◦ v) · u = |u|2 dμ .
v −1 (I)

Für das durch ν(B) = |u|2 dμ gegebene Wahrscheinlichkeitsmaß ν ist also
B
μu (I) = ν(v −1 (I)). Wie in § 22 : 2.3 ergibt sich mit Hilfe des Fortsetzungssatzes
§ 19 : 7.2, dass μu das Bildmaß von ν unter v ist.
Nach dem Transformationssatz für Bildmaße folgt
  
f (Mv )u2 = |(f ◦ v) · u|2 dμ = |f ◦ v|2 dν = |f |2 dμu ,
Ê Ê Ê
falls einer dieser Terme Sinn macht. In diesem Fall gilt wegen L1 ( , μu ) ⊂ Ê
Ê Ê Ê
L2 ( , μu ) und L1 ( , ν) ⊂ L2 ( , ν) ebenfalls nach dem Transformationssatz
  
u , f (Mv )u = (f ◦ v) · |u|2 dμ = f ◦ v dν = f dμu .
Ê Ê Ê
(ii) Charakterisierung der Spektralschar. Seien {Eλ | λ ∈ }, {Fλ | λ ∈ } zwei Ê Ê
Spektralscharen und μu , νu die jeweils zugehörigen Spektralmaße für u = 1
derart, dass
 
(∗) f dμu = u , f (A)u = f dνu
Ê Ê
Ê
für alle f ∈ Cb ( ) und alle u ∈ H mit u = 1.
Nach dem Satz von Beppo Levi folgt (∗) auch für alle f ∈ F, insbesondere
 
u , Eλ u = μu (] − ∞, λ]) = eλ dμu = eλ dνu = νu (] − ∞, λ]) = u , Fλ u
Ê Ê
1 Spektralzerlegung und Funktionalkalkül 707

Ê
und damit Eλ = Fλ für alle λ ∈ . Da Wahrscheinlichkeitsmaße durch ihre
Verteilungsfunktionen eindeutig bestimmt sind, folgt μu = νu für alle u ∈ H
mit u = 1. 2

Bemerkung. Auf Grund dieser Betrachtungen ergibt sich die in 1.5 (c) behaup-
tete Eindeutigkeit des Funktionalkalküls für messbare Funktionen f : → . Ê
Sei A = U −1 Mv U mit einem unitären Operator U : H → L2 (, μ). Für
u = 1 und w = U u ist μu eindeutig bestimmt durch
 
u , f (A)u = (f ◦ v) |w|2 dμ = f dμu für f ∈ F.
Ê Ê
Sei nun f :  → eine messbare Funktion und B := U −1 Mf ◦v U . Dann folgt
wie in (i) für u ∈ D(B) , d.h. (f ◦ v) w ∈ L2 (, μ) die Beziehung
 
u , Bu H = U −1 w , U −1 U BU −1 w H
= w , Mf ◦v w L2
 
= (f ◦ v) |w|2 dμ = f dμu .
Ê Ê
Die rechte Seite hängt nur von u und f ab. Da Mf ◦v und damit auch B dicht
definiert sind, ist B durch die quadratische Form u , Bu H festgelegt.

1.9 Weiteres zu Erwartungswert und Varianz


(a) Die Heisenbergsche Unschärferelation. Für selbstadjungierte Opera-
toren A, B und für u ∈ D(A) ∩ D(B) mit u = 1 seien

Eu (A) := u , Au , Eu (B) := u , Bu ,

Vu (A) := (A − Eu (A))u2 , Vu (B) := (B − Eu (B))u2 .

Dann ergibt sich nach der Anleitung § 22 : 3.8 (b)


1
Vu (A) Vu (B) ≥ 4 | Au , Bu − Bu , Au |2 für u ∈ D(A) ∩ D(B).

Stehen die Operatoren A, B in der kanonischen Vertauschungsrelation

[A, B] = AB − BA = −i h̄ D

mit dem in H dichten Definitionsbereich

D := {u ∈ D(A) ∩ D(B) | Au ∈ D(B), Bu ∈ D(A)}

des Kommutators [A, B], so folgt die Heisenbergsche Unschärferelation


1
Vu (A) Vu (B) ≥ 4 h̄ .
708 § 25 Der Spektralsatz und der Satz von Stone

(b) Erwartungswerte in allgemeinen Zuständen. Nach § 22 : 6.4 werden


allgemeine Zustände durch Spurklasseoperatoren

W = pk | vk vk |
k

mit einem vollständigen ONS v1 , v2 , . . . für H und Zahlen pk ∈ Ê + mit



pk = 1
k

beschrieben. W heißt zulässig für den selbstadjungierten Operator A, wenn alle


vk zu D(A) gehören. In diesem Fall gilt für das zu W gehörige Spektralmaß

μW := pk μvk
k

bezüglich A ÜA

/W = tr (AW ) :=
E(μW ) = μ pk vk , Avk ,
k

V (μW ) = /W ) vk 2 ,
pk (A − μ
k

vgl. § 22 : 6.4. Aus der letzten Beziehung folgt, dass die Heisenbergsche Un-
schärferelation auch für allgemeine Zustände gilt ÜA .
Ê
Ferner ergibt sich mit Hilfe von § 22 : 1.6 (a): Genau dann ist λ ∈ ein scharfer
Messwert für die Observable A im Zustand W , wenn λ ein Eigenwert von A ist
und Bild W ⊂ Kern (A − λ) ÜA .

2 Ausführung der Beweise für 1.3 – 1.7


2.1 Spektrum der Einschränkung auf einen spektralen Teilraum
Es genügt, die Behauptungen (i) und (ii) von 1.3 (b) für einen Multiplikator
Ê Ê
A = Mv auf L2 ( , μ) mit μ( ) = 1 zu beweisen, wobei wir nach 1.2 (a)
voraussetzen dürfen, dass v( ) ⊂ σ(A). Ê
Seien I = ]a, b], w := χI ◦ v und P = Mw der Orthogonalprojektor auf den
Teilraum V = Bild P .
(i) Im Fall σ(A) ∩ I = ∅ ist v(x) ∈ I für alle x ∈ Ê, somit gilt w = 0, P = 0,
V = {0}.
(ii) Sei V = {0}. Die Einschränkung von A = Mv auf V bezeichnen wir mit
T : V → V, u → v · u.
T ist beschränkt und symmetrisch. Wir zeigen
σ(T ) = σ(A) ∩ I und σp (T ) = σp (A) ∩ I.
2 Ausführung der Beweise für 1.3 – 1.7 709

Da Eigenvektoren bzw. approximative Eigenvektoren von T auch solche von A


sind, gilt
σ(T ) = σapp (T ) ⊂ σapp (A) = σ(A) und σp (T ) ⊂ σp (A) .
Für λ ∈ [a, b], ρ = dist (λ, [a, b]) > 0 gilt (T − λ)u = (v − λ)u ≥ ρ u für
u ∈ V , also λ ∈ σapp (T ). Somit haben wir σ(T ) ⊂ σ(A) ∩ [a, b] .
Wir zeigen σ(A)∩ ]a, b[ ⊂ σ(T ), woraus wegen der Abgeschlossenheit der Spek-
tren σ(A)∩[a, b] ⊂ σ(T ) folgt. Sei also λ ∈ σ(A)∩ ]a, b[ . Für In := [λ− n1 , λ+ n1 ]
folgt dann nach § 23 : 5.5, dass Bn := v −1 (In ) positives Maß hat. Für In ⊂
]a, b[ gilt dann un := χBn · μ(Bn )−1/2 ∈ V, un  = 1 und T un − λun  =
(v − λ)un  ≤ 1/n .
Nach § 23 : 5.5 (b) ist λ genau dann Eigenwert von A = Mv , wenn {v = λ} =
v −1 (λ) positives Maß hat. In diesem Fall ist uλ = χ{v=λ} zugehörige Eigenfunk-
tion von A. Für a < λ ≤ b gehört uλ zu V , also gilt σp (A)∩I ⊂ σp (T ). Schließlich
ist a ∈ σp (T ), denn für u ∈ V gilt T u − λu = 0 ⇐⇒ (v − λ)u = 0 ⇐⇒ u = 0 .
Die Aussagen (i) und (ii) übertragen sich auf jeden zu Mv unitär äquivalenten
Operator. 2

2.2 Zur Definition der spektralen Teilräume


(a) Mv –invariante Teilräume. Sei V ein abgeschlossener, Mv –invarianter
Ê
Teilraum von L2 ( , μ) : u ∈ V =⇒ v · u ∈ V . Wir betrachten die Ein-
schränkung T = Mv |V von Mv auf V . Da T auf ganz V definiert ist, gilt nach
dem Satz von Hellinger–Toeplitz § 23 : 1.4 (c):
T : V → V, u → v · u ist ein beschränkter symmetrischer Operator..
Daher ist f (T ) für Funktionen f ∈ C(σ(T )) definiert sowie für Funktionen der
Ê Ê
Klasse F der Funktionen f : → + , die punktweiser Limes einer absteigenden
Folge stetiger, beschränkter Funktionen sind. Erwartungsgemäß gilt
Ê
Lemma. Sei V = {0} ein Mv –invarianter Teilraum von L2 ( , μ) und T die
Einschränkung von Mv auf V . Dann ist f (T ) für f ∈ C(σ(T )) bzw. für f ∈ F
die Einschränkung des Multiplikators Mf ◦v auf V :
(∗) f (T )u = (f ◦ v) · u für u ∈ V.

Insbesondere ist die Spektralschar {Fλ | λ ∈ Ê} von T gegeben durch


Fλ · u = (eλ ◦ v) · u für u ∈ V.

Beweis.
V ist invariant unter Mv2 , Mv3 , . . . ; für u ∈ V und jedes Polynom p ist also
p(v) · u ∈ V . Nach Definition des Funktionalkalküls für f ∈ C(σ(T )) und mit
Hilfe des kleinen Satzes von Lebesgue ergibt sich (∗) für f ∈ C(σ(T )) wie in
§ 21 : 7.6 (b). Für f ∈ F folgt (∗) wie in § 21 : 9.4 (c) mit Hilfe des Satzes von
Beppo Levi. 2
710 § 25 Der Spektralsatz und der Satz von Stone

Folgerung. Ist I = ]a, b] ein beschränktes Intervall mit σ(T ) ⊂ I, σp (T ) ⊂ I,


so ist V ein Teilraum des in 1.3 (a) definierten spektralen Teilraums VI ,

VI = Bild P, P = Mw mit w = χI ◦ v .

Denn für die Spektralschar {Fλ | λ ∈ Ê} von T gilt nach § 22 : 1.2, 1.5
Fλ = 0V für λ ≤ a (wegen a ∈ σp (T )) und Fλ = ½V für λ ≥ b .

Für u ∈ V folgt

u = (Fb − Fa )u = (eb ◦ v − ea ◦ v) · u = (χI ◦ v) · u ∈ VI .

Bemerkung. Nicht jeder Mv –invarianter Teilrauum ist ein spektraler. Dies zeigt
das Beispiel v(x) = x2 , V = {u ∈ L2 (Ê, μ) | u(x) = 0 für x ≤ 0} mit der
Normalverteilung μ.

(b) Eindeutige Bestimmtheit der spektralen Teilräume. Sei A ein selbst-


adjungierter Operator auf einem Hilbertraum H . Dann gibt es zu jedem be-
schränkten Intervall I = ]a, b] einen abgeschlossenen A–invarianten Teilraum
H I mit folgender Eigenschaft:
Für jede Darstellung A = U −1 Mv U von A als Multiplikator auf L2 (Ê, μ) ist

H I = U −1 (VI ) mit VI = { (χI ◦ v)u | u ∈ L2 (Ê, μ) } .

Beweis.
Es genügt den Fall zu betrachten, dass A ein Multiplikator Mv auf einem
L2 (Ê, ν) mit einer reellen Verteilung ν ist und dass es eine unitäre Abbildung
U : L2 (Ê, ν) → L2 (Ê, μ) gibt mit A = U −1 Mv U . Für u ∈ L2 (Ê, ν) gilt dann

U Au = (U w) · u = v · (U u) .

Für I = ]a, b] seien

PI der Multiplikator mit χI ◦ v auf L2 (Ê, μ) , VI = Bild (PI ) ,


QI der Multiplikator mit χI ◦ w auf L2 (Ê, ν) , WI = Bild (QI ) .

Zu zeigen ist WI = U −1 (VI ). Sei W  := U −1 (VI ).


Für die Einschränkung T von Mv auf VI gilt σ(T ) ⊂ I, σp (T ) ⊂ I. Für u ∈ W 
ist U u ∈ VI , also U Au = v · (U u) ∈ VI und daher Au ∈ W  . Somit ist W 
A–invariant, und die Einschränkung S von A auf W  ist unitär äquivalent zu T ,
insbesondere ist σ(S) ⊂ I, σp (S) ⊂ I. Nach 2.2 (a), angewandt auf Mw , folgt
W  ⊂ WI . Durch Vertauschung der Rollen von v und w ergibt sich entsprechend
U W I ⊂ VI . 2
2 Ausführung der Beweise für 1.3 – 1.7 711

2.3 Beweis des Spektralzerlegungssatzes 1.4


Nach dem Vorangehenden gilt für jede Darstellung A = U −1 Mv U von A als
Ê
Multiplikator Mv auf einem L2 ( , μ) , dass H I = U −1 Vn mit
Ê
Vn = { (χIn ◦ v) · f | f ∈ L2 ( , μ) } .
Für hn ∈ Vn , hm ∈ Vm mit m = n ist hn · hm = 0, also gilt Vn ⊥ Vm
und entsprechend H n ⊥ H m für m = n. Für n ∈ sei hn die orthogonale
Projektion von h ∈ L2 (, μ) auf Vn . Dann gilt

|h(x)|2 = |hn (x)|2 für jedes x ∈  ,
n∈
da die Reihe jeweils höchstens ein von Null verschiedenes Glied enthält. Mit
dem Satz von Beppo Levi folgt
 
h2 = hn 2 , also h = hn im Hilbertraumsinn,
n∈ n∈
d.h. im Quadratmittel, vgl. § 25 : 4.2 (a). Anwendung von U −1 ergibt als erstes
Ergebnis
@

H = Hn ,
n=−∞


d.h. jedes u ∈ H besitzt die Zerlegung u = un mit un = Pn u ∈ H n .
n=−∞

Wir können nun zum Operator A auf H zurückkehren. Für u ∈ D(A) und
h ∈ H gilt wegen Pn h ∈ D(A) und weil Pn APn beschränkt und symmetrisch
ist
h , Pn Au = APn h , u = Pn APn h , u = h , Pn APn u
= h , APn u für u ∈ D(A) ,
somit
Pn APn = APn und Pn Au = APn u für u ∈ D(A) .
Für u ∈ D(A) konvergiert daher nach dem oben Bewiesenen die Orthogonalrei-
he
 
Au = Pn Au = APn u ,
n∈ n∈

und deren Konvergenz ist äquivalent zu APn 2 < ∞ , vgl. § 9 : 4.2 (b).
n∈
Existiert umgekehrt
 
m 
m
w = Pn Au = lim APn u = lim A Pn u ,
n∈ m→∞ n=−m m→∞ n=−m

m
so folgt aus u = lim Pn u und der Abgeschlossenheit von A, dass u ∈
m→∞ n=−m

D(A) und Au = w. Die Aussagen über die An wurden in 2.1 bewiesen. 2


712 § 25 Der Spektralsatz und der Satz von Stone

2.4 Zum Funktionalkalkül



(a) Für die Definition 1.5 (a) beachten wir, dass f (An )Pn u eine Orthogo-
n∈
nalreihe ist (s.o.).
Ê
(b) Sei A = U −1 Mv U mit dem Multiplikator Mv auf L2 ( , μ). Da f (T ) für
beschränkte, symmetrische Operatoren Stop–Limes von Operatoren p(T ) (p
Polynom) ist, geht f (An ) unter U in f (Mn ) über, wo Mn die Einschränkung
von Mv auf Vn = U (H n ) ist. Nach 2.2 (a) ist Mn un = (f ◦ v) · un für un ∈ Vn .
Zu zeigen ist daher nur f (Mv ) = Mf ◦v . Da beide Operatoren
 selbstadjungiert
und daher maximal symmetrisch sind, bleibt für u = un mit un ∈ Vn zu
n∈
zeigen:
u ∈ D(Mf ◦v ) =⇒ u ∈ D(f (Mv )) ,
 
f (Mv )u = f (Mn )un = (f ◦ v) · un = (f ◦ v) · u .
n∈ n∈

Hierfür beachten wir, dass die un = (χIn ◦ v) · u paarweise disjunkte Träger



m
haben. Für die Partialsummen sm = un der Orthogonalreihe für u gilt
n=−m
daher

m
|sm (x)|2 = |un (x)|2 ≤ |u(x)|2 , |u(x) − sm (x)|2 ≤ |u(x)|2 .
n=−m

Es folgt

m 
m
f (Mn )un 2 = (f ◦ v) · un 2 ≤ (f ◦ v) · u2 ,
n=−m n=−m

m
(f ◦ v) · u − (f ◦ v) · un 2 = (f ◦ v)(u − sm )2 → 0 für m → ∞ ,
n=−m

letzteres nach dem Satz von Lebesgue mit der Majorante |(f ◦ v) · u|2 . 2

2.5 Zur Spektralschar


Die Aussage (i) von 1.7 (b) folgt aus Eλ Eμ = Eλ für λ ≤ μ, (ii) ergibt sich
durch Einschränkung von Eλ auf einen spektralen Teilraum H I mit λ ∈ I,
(iv) folgt nach 1.5 (b).
Für die Intervalle In = ]n, n + 1] betrachten
 wiir die zugehörigen spektralen
Teilräume H n . Wir fixieren u = un mit un ∈ H n für n ∈ . Zu ge-
n∈

m
gebenem ε > 0 gibt es ein m ∈ , so dass sm := un die Ungleichung
n=−m
u − sm  < ε erfüllt. Für λ ≤ −m gilt Eλ = 0, falls |n| ≤ m. Es folgt
Eλ u = Eλ u − Eλ sm  ≤ u − sm  < ε , für λ ≤ −m .
2 Ausführung der Beweise für 1.3 – 1.7 713

Im Fall λ ≥ m gilt Eλ un = un , falls |n| ≤ m und somit Eλ sm = sm , also

Eλ u − u = Eλ u − Eλ sm + Eλ sm − u
≤ Eλ u − Eλ sm  + sm − u < 2ε für λ ≥ m .

Es genügt, die Behauptung (v) für Multiplikatoren Mv zu nachzuweisen. Für


diese ist Eλ = Meλ ◦v , also Eb − Ea nach 1.3 der Projektor auf VI .

2.6* Multiplikatordarstellung im allgemeinen Fall


(a) Der Satz über die Multiplikatordarstellung eines selbstadjungierten Ope-
rators A wurde in 1.2 nur für den Fall σ(A) = Ê
bewiesen. Der folgende Be-
weis erfasst auch den Fall σ(A) = Ê
und beruht auf folgender Idee: Angenom-
men A = Mv . Dann ist der Operator T := f (A) mit der bijektiven Funktion
Ê
f : → ]−1, 1[ , x → x · (1 + x2 )−1/2 beschränkt und symmetrisch, und mit der
Umkehrfunktion g : y → y · (1 − y 2 )−1/2 von f gilt A = g(T ). Wir konstruieren
im folgenden einen beschränkten symmetrischen Operator T mit A = g(T ).

(b) Nach § 24 : 1.5 und § 24 : 2.3 ist ½+A2 ein selbstadjungierter, halbbeschränk-
ter Operator mit unterer Schranke 1, also σ(½ + A2 ) ⊂ [1, ∞[. Daher ist

R = (½ + A2 )−1

beschränkt und symmetrisch mit 0 ∈ σp (R), 0 ≤ R ≤ ½, R ≤ 1 ÜA .


Ferner gilt Ru ∈ D(A ) für alle u ∈ H , (½ + A )R = ½H , R(½ + A ) = ½D(A2 ) .
2 2 2

(c) Der Operator S := AR ist beschränkt und symmetrisch mit

RS = SR , R2 + S 2 = R , S ≤ 1 .

Zum Nachweis zeigen wir zunächst, dass

(1) ARu = RAu für u ∈ D(A) .

Dazu beachten wir, dass i, −i ∈ (A) und (A+i)(A−i) = ½ +A2 = (A−i)(A+i),


somit R(A + i) = (A − i)−1 = (A + i)R. Für u ∈ D(A) erhalten wir daher

RAu = R(A + i)u − iRu = (A − i)−1 u − iRu = (A + i)Ru − iRu = ARu .

Daraus ergibt sich wegen Ru ∈ D(A) für alle u ∈ H

(2) SRu = AR2 u = RARu = RSu .

Wegen Bild R ⊂ D(A) erhalten wir ferner für alle u ∈ H

(3) (R2 + S 2 )u = R2 u + ARARu = R2 u + A2 R2 u = (½ + A2 )R2 u = Ru .


714 § 25 Der Spektralsatz und der Satz von Stone

S ist überall definiert und symmetrisch: Für u ∈ D(A) und v ∈ H gilt mit (1)

(4) u , Sv = u , AR v = A u , R v = RA u , v = AR u , v = S u , v .

Schließlich erhalten wir S ≤ 1 aus R ≤ ½ und aus (3):

(5) Su2 = u , S 2 u ≤ u , (R2 + S 2 )u = u , Ru ≤ 1 für u ≤ 1 .

(d) Der Operator R1/2 ist beschränkt, symmetrisch und injektiv. Ferner gilt
Bild R1/2 ⊂ D(A).
Die Injektivität ergibt sich wie folgt: R1/2 u = 0 =⇒ Ru = R1/2 R1/2 u = 0
=⇒ u = 0 wegen 0 ∈ σp (R).
Wegen Bild R1/2 = (Kern R1/2 )⊥ = H gibt es zu jedem h ∈ H Vektoren un
mit h = lim R1/2 un , also R1/2 h = lim Run . Aus (5) ergibt sich
n→∞ n→∞

     
S um − Sun 2 ≤ um − un , R(um − un ) = R1/2 (um − un )2 ,

also existiert lim Sun = lim ARun . Wegen der Abgeschlossenheit von A folgt
n→∞ n→∞

R 1/2
h ∈ D(A) und AR1/2 h = lim ARun = lim Sun .
n→∞ n→∞

(e) Durch T := AR1/2 ist ein symmetrischer Operator T ∈ L (H ) definiert


mit

R = 1 − T2 , S = AR = T (1 − T 2 )1/2 , σ(T ) ⊂ [−1, 1] , 1 ∈ σp (T ) .

Denn nach (d) ist T überall definiert. Aus (1) folgt für u ∈ D(A)

(6) f (R)Au = Af (R)u

zunächst für f (x) = xn und daher auch für Polynome f . Da A abgeschlossen


ist, gilt (6) für alle auf σ(R) ⊂ [0, 1] stetigen Funktionen. Für u ∈ D(A), v ∈ H
folgt

u , T v = u , AR1/2 v = R1/2 Au , v = AR1/2 u , v = T u , v .

Da D(A) dicht in H ist, folgt die Symmetrie von T .



Aus (6) mit f (x) = x folgt T 2 = AR1/2 AR1/2 = A2 R = (1+A2 )R−R = 1−R,
also

R1/2 = (1 − T 2 )1/2 , S = AR = AR1/2 R1/2 = T (1 − T 2 )1/2 .

Aus dem spektralen Abbildungssatz folgt σ(T 2 ) = 1−σ(R) ⊂ [0, 1], also σ(T ) ⊂
[−1, 1]. Aus T u = u folgt T 2 u = u, also Ru = 0 und damit u = 0 nach (b).
3 Selbstadjungierte Operatoren und unitäre Gruppen 715

(f) Die Multiplikatordarstellung. Nach § 22 : 3.6 gibt es ein Wahrscheinlichkeits-


Ê
maß μ auf , eine Sägezahnfunktion w : Ê
→ [−1, 1] und eine unitäre Abbil-
Ê
dung U : H → L2 ( , μ) mit T = U −1 Mw U . Wegen 1 ∈ σp (T ) gilt w(x) ∈
[−1, 1[ μ–f.ü. Durch Abänderung von w auf einer μ–Nullmenge erreichen wir
Ê Ê
w(x) ⊂ [−1, 1[ für alle x ∈ . Dann ist w auf \ {4n + 1 | n ∈ } periodisch
und stetig. Wir definieren
w
T/ := U T U −1 , R
/ := U R U −1 , S/ := U S U −1 , A
/ := U A U −1 , v := √ .
1 − w2
Nach § 21 : 7.6 gilt

T/ = Mw , / = M1−w2 ,
R / = M √ 2.
S w 1−w

Zum Nachweis von A / = Mv , d.h. A = U −1 Mv U , genügt es zu zeigen, dass


Mv ⊂ A,/ da beide Operator maximal symmetrisch sind (§ 24 : 1.1 (b)).
Sei also f ∈ D(Mv ) und Mn := {1 − w2 ≥ 1/n2 } für n ∈ . Für fn := f χMn
und gn := (1 − w2 )−1 fn gilt
|fn | ≤ |f |, |f − fn | ≤ |f |, |gn | ≤ n2 |f |, |vfn | ≤ |vf |, |v(f − fn )| ≤ |vf |,
7
ferner fn → f , vfn → vf punktweise auf = Mn .
n∈ 
Aus dem Satz von Lebesgue erhalten wir f − fn  → 0, vf − vfn  → 0.
Andererseits gilt wegen gn ∈ L2 (, μ) und Bild R ⊂ D(A)
/ gn ∈ D(A)
fn = (1 − w2 )gn = R / und
/ n = A/ Rg
Af / n = Sg
/ n = vfn → vf in L2 (, μ) .
/ abgeschlossen ist, folgt f ∈ D(A)
Da A / und Af
/ = vf . Somit ist A = U −1 Mv U .
2

3 Selbstadjungierte Operatoren und unitäre Gruppen


3.1 Die von einem selbstadjungierten Operator erzeugte unitäre Ein-
parametergruppe
Für einen selbstadjungierten Operator A ist durch
U (t) := e−iAt = ft (A) mit ft (x) = e−ixt (t ∈ )
eine stark stetige Einparametergruppe von unitären Operatoren gegeben:
U (s + t) = U (s)U (t) = U (t)U (s) , U (0) = ,
∗ −1
U (t) = U (−t) = U (t) ,
U (t) = s–lim U (t + h) .
h→0

Denn aus den Eigenschaften 1.6 des Funktionalkalküls für beschränkte stetige
Funktionen folgt U (0) = f0 (A) = 1(A) = ,
716 § 25 Der Spektralsatz und der Satz von Stone

U (s + t) = fs+t (A) = (fs ft )(A) = fs (A)ft (A) = U (s)U (t) ,

U (t)∗ = f t (A) = f−t (A) =, U (−t) ,

½ = U (0) = U (t − t) = U (t)U (−t) .

Für u = 1 ergibt sich aus dem Spektralsatz


   
 U (t + h) − U (t) u2 = | ft+h − ft |2 dμu = | fh − 1 |2 dμu → 0
Ê Ê
für h → 0 nach dem Satz von Lebesgue, denn

lim (fh (x) − 1) = 0 und |fh (x) − 1| ≤ 2 für alle x ∈


h→0
Ê.
3.2 Das mit einem selbstadjungierten Operator verbundene Cauchy–
Problem
Satz. Für einen selbstadjungierten Operator A besitzt das Cauchy–Problem

u̇(t) = − iAu(t) , u(0) = u

genau dann eine Lösung t → u(t) im Hilbertraumsinn,


 1 
lim 
h→0 h
u(t + h) − u(t) + iAu(t)  = 0 für alle t ∈ Ê,
wenn u ∈ D(A). Die Lösung ist dann eindeutig bestimmt und gegeben durch

u(t) = U (t)u .
1
Zusatz. Es gilt sogar u ∈ D(A) ⇐⇒ lim U (h) − 1 u existiert.
h→0 h
Beweis.
(a) Nach den Überlegungen in § 24 : 3.2 (c) gibt es eine Konstante C mit
 
(∗) | fh (x) − 1 + ihx | =  e−ihx − 1 + ihx  ≤ C |hx| für alle x, h ∈ Ê.
Nach dem Spektralsatz 1.8 konvergiert für u ∈ D(A) mit u = 1 das Integral
2
x dμu (x), und es folgt für u(t) = U (t)u und h = 0
Ê
1    
 u(t + h) − u(t) + iAu(t) 2 =  1 ft+h (x) − ft (x) + ixft (x) 2 dμu (x)
Ê
h h

 1 
=  fh (x) − 1 + ix 2 dμu (x) → 0 für h → 0 und alle t ∈ Ê.
Ê
h

Dies ergibt sich aus dem Satz von Lebesgue, denn nach (∗) hat der Integrand
im letzten Integral die μu –Majorante C 2 x2 und den punktweisen Limes 0.
3 Selbstadjungierte Operatoren und unitäre Gruppen 717

(b) Zum Beweis des Zusatzes definieren wir einen Operator B durch

u ∈ D(B) ⇐⇒ lim 1
U (h)u − u existiert und
h→0 h

Bu = lim i
h
U (h)u − u für u ∈ D(B) .
h→0

Nach (a) gilt A ⊂ B. Zu zeigen ist, dass B symmetrisch ist. Dann folgt A = B,
da nach § 24 : 1.1 (b) selbstadjungierte Operatoren maximal symmetrisch sind.
In der Tat gilt für u, v ∈ D(B) wegen U (h)∗ = U (−h)
  1 
v , Bu = i lim v , 1
h
(U (h) − 1)u = i lim h
(U (−h) − 1)v , u
h→0 h→0
1 
= − i lim k
(U (k) − 1)v , u = Bv , u .
k→0

(c) Eindeutigkeit. Für eine Lösung t → v(t) des Cauchy–Problems v̇(t) =


−iAv(t), v(0) = u setzen wir w(t) := U (−t)v(t) und erhalten wie in § 21 : 7.7
ÜA
d
dt
h , w(t) = h , ẇ(t) = 0 für alle t ∈ Ê,
somit ẇ(t) = 0 und daraus u = w(t) = U (−t)v(t) für alle t ∈ Ê. 2

3.3 Beispiele
(a) Selbstadjungierte Operatoren mit diskretem Spektrum. Hierfür
wird auf § 24 : 3.2 verwiesen.

(b) Für den Ortsoperator Q = Mx und für f ∈ Cb ( ) ist f (Q) = Mf nach Ê


§ 21 : 7.6. Somit ist U (t) = e−itQ der Multiplikator mit e−itx :

U (t)u : x → e−itx u(x) .

ÜA Rechnen Sie für ut (x) = e−itx u(x) nach, dass entsprechend dem Zusatz
3.2
 1   2
lim  (uh − u) + iQu  = 0 ⇐⇒ x |u(x)|2 dx < ∞ .
h→0 h Ê
(c) Impulsoperator und Translationsgruppe. Für die Fouriertransforma-
tion F0 : S → S , u → u / und die Einschränkung P0 von P und Q0 von Q
auf S gilt P0 = F0−1 Q0 F0 nach § 12 : 3.3. Für die Fouriertransformation F auf
Ê
L2 ( ) folgt P = F −1 QF ÜA . Nach 1.5 (b) ist daher

(∗) e−itP = F −1 e−itQ F .

Für u ∈ S sei ut := e−itP u. Mit (b) und (∗) folgt u /t (y) = e−ity u
/(y) ÜA .
Der Umkehrsatz für die Fouriertransformation liefert
718 § 25 Der Spektralsatz und der Satz von Stone

1 +∞  −ity 1 +∞ 
ut (x) = √ e /(y) eixy dy = √
u /(y) ei(x−t)y dy = u(x − t)
u
2π −∞ 2π −∞

für u ∈ S . Da e−itP stetig ist und die Translation im Argument eine Isometrie,
gilt diese Beziehung für alle u ∈ L2 ( ). Ê
(d) Ein anderer Zugang. Sei t → ut (x) = ϕ(x, t) eine klassische Lösung des
Ê
AWP u̇t = −iP ut , u0 = u, d.h. es sei ϕ ∈ C1 ( 2). Dann erfüllt ϕ die Wellen-
gleichung ∂ϕ + ∂ϕ = 0 . Daher gilt dtd
ϕ(t, t + c) = 0 für t, c ∈ . Es folgt Ê
∂t ∂x
Ê
ϕ(t, t+c) = ϕ(0, c) = u(0) für t, c ∈ und daher ϕ(x, t) = u(x−t) für x, t ∈ . Ê
Definieren wir nun ut (x) := u(x − t) für u ∈ D(P ) = W ( ), so erhalten wir 1
Ê
 
lim  h1 (uh − u) + iP u  = 0
h→0

ÜA /t (y) = e−iyt u


. Zeigen Sie u /(y) und wenden Sie (b) an.

3.4 Der Satz von Stone


Satz (M.H. Stone 1932). Zu jeder unitären stark stetigen Einparametergruppe
Ê
{ U (t) | t ∈ } auf H gibt es einen eindeutig bestimmten selbstadjungierten
Ê
Operator A mit U (t) = e−itA für t ∈ . Dieser ist gegeben durch
1
u ∈ D(A) ⇐⇒ Au := i lim (U (t)u − u) existiert,
t→0 t

vgl. den Zusatz 3.2.


Der Operator A heißt Generator der Einparametergruppe. Auf die Bedeutung
dieses Satzes für die Quantenmechanik gehen wir in 4.1 (a) kurz ein. Der Beweis
beruht auf mehreren Lemmata, die auch von eigenem Interesse sind.
(a) Integration stetiger Funktionen mit Werten im Hilbertraum
Lemma. Zu jeder stetigen Funktion u : [a, b] → H gibt einen eindeutig bestimm-
ten Vektor h ∈ H mit
b
(1) h, v = a
u(t) , v dt für alle v ∈ H .
b
Wir bezeichnen diesen mit h = a
u(t) dt. Per Definition gilt also
 b  b
(2) a
u(t) dt , v = a
u(t) , v dt .
Das so definierte Integral hat die Eigenschaften
 b  
(3)  u(t) dt  ≤ b u(t) dt ,
a a


b+s b
(4) u(τ − s) dτ = a
u(t) dt .
a+s
3 Selbstadjungierte Operatoren und unitäre Gruppen 719

Bemerkung. Zur Festlegung von h genügt es, dass (1) bzw. (2) für alle v aus
einem dichten Teilraum von H gilt ÜA .

Beweis.
Die Funktion t → u(t) ist stetig, ebenso die Funktion t → u(t) , v für belie-
bige v ∈ H . Mit der Cauchy–Schwarzschen Ungleichung ergibt sich
 b  b  b
 u(t) , v dt  ≤ a  u(t) , v  dt ≤ v a u(t) dt .
a
b
Daher liefert Lv := a u(t) , v dt ein lineares Funktional auf H mit Norm-
b
schranke a u(t) dt und bestimmt somit einen Vektor h ∈ H mit Lv =
b
h , v für alle v ∈ H . Für diesen gilt h = L ≤ a u(t) dt; das ist die
Abschätzung (3). Die Beziehung (4) ist leicht einzusehen ÜA .
(b) Eine verallgemeinerte Fouriertransformation
Für jede stetige Funktion ϕ : [a, b] → und für jeden Vektor u ∈ H ist die
hilbertraumwertige Funktion t → ϕ(t)U (t)u stetig ÜA . Für Testfunktionen
ϕ ∈ C∞ Ê
c ( ) dürfen wir daher definieren

+∞ b
(5) [ϕ, u] := ϕ(t)U (t)u dt = ϕ(t)U (t)u dt , falls supp ϕ ⊂ [a, b] .
−∞ a

Beispiel. Für die vom Ortsoperator Q = Mx auf L2 ( ) erzeugte unitäre Ê


Gruppe ist U (t)u die Funktion x → e−itx u(x). Für u ∈ L2 ( ) und supp ϕ ⊂ Ê
Ê
[a, b] ist die Funktion [ϕ, u] ∈ L2 ( ) nach (a) und (5) festgelegt durch
b
v , [ϕ, u] = v , ϕ(t)U (t)u dt für v ∈ S .
a

Für u ∈ S ergibt sich durch Vertauschung der Integrationsreihenfolge


b  +∞

v , [ϕ, u] = v(x) ϕ(t) e−ixt u(x) dx dt
a −∞
+∞   b
= v(x) u(x) e−ixt ϕ(t) dt dx
−∞ a
√ 
+∞  √ 
= 2π /(x) dt =
v(x) u(x) ϕ v, /u ,
2π ϕ
−∞
also

[ϕ, u] = /u .
2π ϕ
√ √
Es folgt [ϕ, u] ∈ S und Q[ϕ, u] = /u =
2π Q ϕ 2π P:ϕ u = −i[ϕ , u] für
u ∈ S.
Entsprechend ergibt sich im folgenden: Ist { U (t) | t ∈ } eine stark stetige Ê
unitäre Gruppe und [ϕ, u] gemäß (5) definiert, so ergibt sich der gesuchte Ge-
nerator A aus A[ϕ, u] = −i [ϕ , u].
720 § 25 Der Spektralsatz und der Satz von Stone

(c) Lemma. D := Span {[ϕ, u] | ϕ ∈ C∞ Ê


c ( ), u ∈ H } ist ein dichter Teilraum
von H , welcher unter der Gruppe {U (t) | t ∈ } invariant ist, Ê
U (t)[ϕ, u] = [ϕ, U (t)u] ∈ D für alle t ∈ Ê.
Weiter gilt
1
lim (U (s) − 1)[ϕ, u] = [−ϕ , u] .
s→0 s

Setzen wir die Vorschrift


A[ϕ, u] := −i [ϕ , u]
linear auf D fort, so erhalten wir einen symmetrischen Operator A auf D.
Beweis.
(i) Seien u ∈ H und ε > 0. Dann gibt es ein δ > 0 mit U (t)u − u ≤ ε für

Ê
|t| ≤ δ. Für den Standardbuckel jδ ∈ Cc ( ) mit jδ ≥ 0, supp jδ = [−δ, δ],
jδ dλ = 1 (vgl. § 10 : 1.2) setzen wir uδ := [jδ , u] und erhalten aus (3) wegen
Ê 
jδ (t) u dt = u
|t|≤δ

die Ungleichung
 δ  δ
u − uδ  =  jδ (t)(u − U (t)u) dt  ≤ jδ (t) u − U (t)u dt ≤ ε .
−δ −δ

(ii) Die Beziehung U (t)[ϕ, u] = [ϕ, U (t)u] erhalten wir aus der Integraldefiniti-
on (1),(2): Sei supp ϕ ⊂ [a, b] und v ∈ H beliebig. Dann gilt
 b 
U (t)[ϕ, u] , v = [ϕ, u] , U (−t)v = ϕ(s) U (s)u ds , U (−t)v
a
b b
= ϕ(s)U (s)u , U (−t)v ds = ϕ(s) U (t)U (s)u , v ds
a a
 b 
= ϕ(s) U (s)U (t)u ds , v = [ϕ, U (t)u] , v .
a

(iii) Insbesondere gilt (U (s) − 1)[ϕ, u] = [ϕ, (U (s) − 1)u], also für s = 0
1 
1 +∞
(U (s) − 1)[ϕ, u] = ϕ(t)U (t)(U (s) − 1)u dt
s s −∞

1 +∞ (4)  ϕ(τ − s) − ϕ(τ )
+∞
= ϕ(t)(U (s + t) − U (t))u dt = U (τ )u dτ .
s −∞ −∞
s
Da supp ϕ kompakt ist, gilt lim 1s (ϕ(τ − s) − ϕ(τ )) = −ϕ (τ ) gleichmäßig auf
Ê. Mit Hilfe der Integralabschätzung (3) erhalten wir
s→0
ÜA

1
lim (U (s) − 1)[ϕ, u] = [−ϕ , u] .
s→0 s
3 Selbstadjungierte Operatoren und unitäre Gruppen 721

(iv) Für ϕ, ψ ∈ C∞ Ê 
c ( ), u, v ∈ H und A[ϕ, u] := −i [ϕ , u] folgt
 
A[ϕ, u] , [ψ, v] = lim − si (U (s) − 1)[ϕ, u] , [ψ, v]
s→0
 
= lim [ϕ, u] , si (U (−s) − 1)[ψ, v] = [ϕ, u] , −i[ψ  , v]
s→0

= [ϕ, u] , A[ψ, v] .
Diese Symmetrieeigenschaft überträgt sich auf alle Linearkombinationen von
Vektoren der Form [ϕ, u], [ψ, v] und damit auf D. 2
(d) Lemma. Der Operator A ist wesentlich selbstadjungiert.
Nach dem Kriterium § 24 : 2.2 (d) ist Kern (A∗ + i) = Kern (A∗ − i) = {0}
zu zeigen. Sei also v ∈ Kern (A∗ − i), d.h.. A∗ v = iv. Dann ergibt sich für
h := [ϕ, u] ∈ D mit Hilfe des Lemmas (c)
d
0 1 (c)
0 1
U (s)−1 U(s)−1
v , U (t)h = lim v , s U (t) h = lim v, s [ϕ, U (t) u]
dt s→0 s→0

(c) (c)
= v , −iA [ϕ, U (t) u] = − v , iAU (t) h = − A∗ v , iU (t) h

= − iv , i(U (t) h = − v , U (t) h


und somit v , U (t)h = e−t v , h . Da v , U (t)h beschränkt ist, folgt ein Wi-
derspruch für t → −∞, falls nicht v , h = 0. Damit ist v orthogonal zum in
H dichten Teilraum D, also v = 0. Entsprechend folgt Kern (A∗ + i) = {0}.
(e) Lemma. Der Abschluss A ist Generator der Gruppe {U (t) | t ∈ Ê}.
−itA
Denn da A selbstadjungiert ist, liefert V (t) = e eine stark stetige unitäre
Einparametergruppe. Für diese gilt nach 3.2 mit h = [ϕ, u] ∈ D
d
 
dt v , V (t)h = −i v , AV (t)h .
Da D invariant unter U (t) ist und in D(A) enthalten, folgt nach der Rechnung
in (d)
d
 
dt v , U (t)h = −i v , AU (t)h = −i v , AU (t)h .
Für w(t) = v , U (t)h − v , V (t)h ist also ẇ = 0 und w(0) = 0, somit w = 0.
Nach dem Fundamentallemma folgt U (t)h = V (t)h für alle h ∈ D und wegen
der Stetigkeit der Operatoren U (t), V (t) dann auch für alle h ∈ H .
(f) Lemma. Der Operator A ist eindeutig bestimmt.
Denn sind A, B selbstadjungierte Operatoren mit e−itA = e−itB für alle t ∈ , Ê
so folgt nach dem Zusatz zu 3.2 zunächst D(A) = D(B) und daher für alle
u ∈ D(A) = D(B)
1  −itA 
−iAu = lim e − 1 u = lim e−itB − 1 u = −iBu . 2
t→0 t t→0
722 § 25 Der Spektralsatz und der Satz von Stone

3.5 Aufgaben
Ê
(a) Impulsoperator und Translationsgruppe. Sei v ∈ 3, v = 1 und P u :=
Ê
−i ∇u , v für u ∈ S ( 3 ). Dann ergibt sich wie in 3.3 (c) ÜA

(e−itP u)(x) = u(x − tv) .

(b) Das Cauchy–Problem für den Operator u → −iu auf W01 ( +). Durch Ê
Ê
Au = −iu für u ∈ W01 ( + ) ist ein abgeschlossener und symmetrischer, aber
nicht selbstadjungierter Operator gegeben, vgl. § 23 : 6.3 (b). Nach dem Satz von
Stone kann das Cauchy–Problem

(∗∗) u̇t = −iAut , u0 = u ∈ W01 ( Ê +)

Ê definierte, durch u eindeutig bestimmte Lösung mit u  =


keine für alle t ∈
Ê besitzen.
t
u für alle t ∈
Rechnen Sie in Analogie zum Vorgehen in 3.3 (d) nach, dass jede klassische
Lösung der DG (∗∗) konstant längs jeder Geraden mit der Gleichung t = x + c
ist (Skizze). Zeigen Sie für u ∈ C∞ Ê
c ( >0 ):

(i) Das Problem (∗∗) besitzt für t > 0 unendlich viele klassische Lösungen.
(ii) Für t < 0 ist die Lösung von (∗∗) durch Vorgabe von u eindeutig bestimmt;
für die Lösung fällt ut  für t → −∞ monoton gegen Null.
(iii) Der Operator −A erzeugt eine Kontraktionshalbgruppe: Die Lösung des
Cauchy–Problems u̇t = iAut für t ≥ 0, u0 = u ist von der Form ut = V (t)u mit
V (s + t) = V (s)V (t) = V (t)V (s) für s, t ∈ Ê+,

V (t) ≤ 1 , s–lim V (t) = 0 .


t→∞

(c) Drehimpulsoperatoren. Für k = 1, 2, 3 seien Dk (t) die Matrizen der Drehung


Ê
im 3 um die xk –Achse mit Drehwinkel t. Zeigen Sie:
(i) Durch Uk (t)u : x → u(Dk−1 (t)x) sind unitäre Einparametergruppen
Ê Ê
{Uk (t) | t ∈ } auf L2 ( 3 ) gegeben.
(ii) Bestimmen Sie Ak u = i lim
t→0
1
t
(Uk (t)u − u) für u ∈ S ( Ê ).
3

4 Hilbertraumtheorie und Quantenmechanik


Wir fassen die Hauptergebnisse dieses Kapitels unter dem Aspekt ihrer Bedeu-
tung für die Quantenmechanik zusammen. Dabei müssen wir den Standpunkt
der von Primas so genannten Pionier–Quantenmechanik beziehen; der heu-
tige Diskussionsstand (vgl. Jauch [136], Mackey [137], Primas [139]) erfordert
weitergehende mathematische Hilfsmittel. Bemerkungen hierzu folgen in 4.7.
4 Hilbertraumtheorie und Quantenmechanik 723

4.1 Observable
(a) Zur Beschreibung eines quantenmechanischen Systems wird zunächst ein
Systemhilbertraum H zugrundegelegt; einfache Beispiele wurden in § 18 : 4.1
angegeben. Observable werden prinzipiell durch selbstadjungierte, i.A. unbe-
schränkte Operatoren A auf einem in H dichten Definitionsbereich D(A) be-
schrieben. Wir fassen im folgenden die Gründe hierfür zusammen.
(b) Warum unbeschränkte Operatoren?
Beschränkte Operatoren A, B können niemals die Heisenbergsche Vertausch-
ungsrelation AB −BA = −i½ erfüllen (§ 23 : 1.2). Ein unbeschränkter symmetri-
scher Operator kann nicht auf dem ganzen Hilbertraum definiert sein (§ 23 : 1.4).
(c) Warum selbstadjungierte Operatoren?
Die Deutung von u , Au als Erwartungswert und die Forderung nach reel-
len Erwartungswerten führen zunächst auf die Symmetrie von A (§ 21 : 3.6 (b)).
In 4.4 führen wir aus, dass das Spektrum einer Observablen die Menge der
möglichen Messwerte ist. Die Forderung nach reellen Messwerten führt nach
§ 24 : 1.2 auf selbstadjungierte Operatoren. Nicht jeder abgeschlossene symme-
trische Operator ist selbstadjungiert (§ 23 : 4.3, 6.3 (b)).
Der tiefere Grund, warum wir nur selbstadjungierte Operatoren betrachten, liegt
darin, dass sie die einzigen sind, welche unitäre Einparametergruppen erzeugen
(3.1 und 3.4). Für einen Hamilton–Operator H bedeutet dies, dass zu einem
gegebenen Anfangszustand | ϕ ϕ | mit ϕ ∈ D(H), ϕ = 1 das Schrödinger–
Problem
u̇t = −iHut , u0 = ϕ
eine eindeutig bestimmte, für alle Zeiten definierte Lösung t → ut besitzt, gege-
ben durch ut = U (t)u mit den unitären Abbildungen U (t) = e−itH . Wegen der
Gruppeneigenschaft der U (t) ist die Zeitentwicklung t → ut deterministisch,
d.h. jeder Zustandsvektor ut0 legt alle anderen ut fest. Da H mit allen U (t) ver-
tauscht, sind die Erwartungswerte konstant: ut , Hut = ϕ , Hϕ für t ∈ . Ê
(d) Quantisierung klassisch–mechanischer Observablen.
Ist ein System der klassischen Mechanik invariant unter einer Einparameter–
Untergruppe der Galilei–Gruppe, so besitzt es nach dem Noetherschen Satz
eine Erhaltungsgröße: Invarianz unter Zeitverschiebungen führt auf Erhaltung
der Gesamtenergie, Translationsinvarianz in einer Richtung bedeutet Erhaltung
der Impulskomponente in dieser Richtung, Rotationssymmetrie bezüglich einer
festen Achse bedeutet Erhaltung des Drehimpulses bezüglich dieser Achse usw.
Näheres hierzu in Band 3, § 4 : 3.4.
In speziellen Fällen ergibt sich die Quantisierung dieser Erhaltungsgröße aus
einer Darstellung der Einparametergruppe auf dem Systemhilbertraum. Wir
betrachten den einfachsten Fall eines spinlosen Teilchens im Raum unter dem
Einfluß eines Potentials und setzen die Invarianz des Systems unter einer räum-
724 § 25 Der Spektralsatz und der Satz von Stone

Ê
lichen Einparametergruppe {τt | t ∈ } voraus, wobei jede der Transforma-
tionen τt zu SO3 gehört. Die zugehörige klassische Erhaltungsgröße sei a. Nach
dem Transformationssatz für Integrale ist durch
(U (t)u)(x) := u(τt−1 (x))
Ê
eine stark stetige Einparametergruppe unitärer Operatoren auf L2 ( 3 ) gegeben,
und wir ordnen der klassischen Observablen a den nach 3.4 beschriebenen selbst-
adjungierten Operator A mit U (t) = e−itA zu, vgl. 3.3 (c) sowie 3.5 (a),(c). Diese
Betrachtungen lassen sich leicht auf ein N –Teilchen–System mit Systemhilber-
Ê
traum 3N übertragen. Genaueres zur kanonischen Quantisierung klassisch–
mechanischer Observablen finden Sie in Mackey [137] 2-3, 2-4 und in Primas
[139] 3.3.
(e) Orthogonalprojektoren.
Einem Ja/Nein–Experiment wird ein symmetrischer Operator P ∈ L (H ) mit
P 2 = P zugeordnet. Jedem Vektor ϕ ∈ H mit ϕ = 1 entpricht dabei eine
Bernoulli–Verteilung mit Erfolgswahrscheinlichkeit P ϕ2 , vgl. § 22 : 2.2.
Von besonderer Wichtigkeit sind die einem selbstadjungierten Operator A und
den Intervallen I = ]a, b] zugeordneten Spektralprojektoren PI = χI (A), vgl.
1.3 (b). Wir interpretieren PI ϕ2 als Wahrscheinlichkeit, dass die Messwerte
der Observablen A im Zustand | ϕ ϕ | (siehe 4.2) ins Intervall I fallen.
Jeder selbstadjungierte Operator A lässt sich nach dem Spektralzerlegungssatz
1.4 mit Hilfe der Spektralprojektoren Pn = χ]n,n+1] (A) in beschränkte Anteile
Pn APn zerlegen.
(f) Funktionalkalkül.
Ê Ê
Für Observable A und messbare Funktionen f : → wurde in 1.5 ein selbst-
adjungierter Operator f (A) definiert. Wir deuten f (A) als diejenige Observable,
die den Messwerten x für A jeweils den Wert f (x) zuordnet (indirekte Messung
oder Umskalierung der Messwerte).

4.2 Zustände
(a) Der Zustand eines quantenmechanischen Systems mit Systemhilbertraum
H wird durch einen Dichteoperator

W = pk | ϕk ϕk |
k

. ein vollständiges ONS für H und p1 , p2 , . . .


beschrieben; dabei ist ϕ1 , ϕ2 , . .
sind nichtnegative Zahlen mit pk = 1, vgl. § 22 : 6.4. Im Fall dim H = ∞
k
ist die Reihe für W normkonvergent.

(b) Einen Spezialfall bilden die Vektorzustände


|ϕ ϕ | : u → ϕ, u ϕ
4 Hilbertraumtheorie und Quantenmechanik 725

mit ϕ = 1. Offenbar gilt | cϕ cϕ | = | ϕ ϕ | für |c| = 1; deshalb ist


| eiωt ϕ eiωt ϕ | als Zustand zeitunabhängig.

4.3 Die Verteilung der Beobachtungswerte


(a) Zu jedem selbstadjungierten Operator A und jedem Vektor ϕ ∈ H mit
ϕ = 1 ist nach 1.7 ein Wahrscheinlichkeitsmaß μϕ mit Verteilungsfunktion
F (λ) = ϕ , Eλ ϕ definiert; dabei ist Eλ = eλ (A). Wir deuten μϕ als Verteilung
der Beobachtungswerte für die durch A beschriebene Observable im Zustand
| ϕ ϕ |. Für ϕ ∈ D(A) existieren nach 1.8 (b)

E(μϕ ) = ϕ , Aϕ , V (μϕ ) = Aϕ − E(μϕ )ϕ2 .

(b) Legen wir die Interpretation 4.1 (d) des Funktionalkalküls zugrunde, so
ist diese Deutung des Spektralmaßes zwangsläufig! Bezeichnen wir nämlich für
einen Zustand | ϕ ϕ | die zu A gehörige Verteilung der Beobachtungswerte mit
μϕ , die zu f (A) gehörige Verteilung mit νϕ , so muss nach der Interpretation
4.1 (d) gelten

νϕ (B) = μϕ (f −1 (B)) für B ∈ B ,

Ê
d.h. νϕ ist das Bildmaß von μϕ unter f . Für f ∈ Cb ( ) folgt nach dem Trans-
formationssatz für Bildmaße § 20 : 6.4 und dem Spektralsatz 1.8

E(νϕ ) = f dμϕ = ϕ , f (A)ϕ ,
Ê
und nach 1.8 (a) ist μϕ hierdurch eindeutig bestimmt.
(c) Die Verteilung μW der Beobachtungswerte für A im gemischten Zustand

W = pk | ϕk ϕk |
k

mit einem vollständigen ONS ϕ1 , ϕ2 , . . . ist gegeben durch



μW = pk μϕk .
k

Ist I = ]a, b] und P = PI = Eb −Ea der Orthogonalprojektor auf den spektralen


Teilraum H I , so gilt nach 6.2

μW (I) = pk ϕk , P ϕk = tr (P W ) .
k

Diese Formel gestattet die Charakterisierung von μW ohne Rückgriff auf die
Darstellung von W .
Gehören alle ϕk zum Definitionsbereich von A, so gilt ÜA
 
E(μW ) = tr (AW ) = pk E(μϕk ) , V (μW ) = pk V (μϕk ) .
k k
726 § 25 Der Spektralsatz und der Satz von Stone

4.4 Spektrum und mögliche Messwerte


(a) Eine Zahl λ heißt möglicher Messwert einer Zufallsgröße X mit Vertei-
lung μ, wenn Spektrum!und mögliche Messwerte

μ(]λ − ε, λ + ε]) > 0 für alle ε > 0 .

(b) Satz. Genau dann gilt λ ∈ σ(A), wenn es einen Zustand W gibt mit

μW (]λ − ε, λ + ε]) > 0 für alle ε > 0 .

Beweis.
Ê
(i) Wir fixieren ein λ ∈ . Für ε > 0 sei Pε := Eλ+ε − Eλ−ε der Ortho-
gonalprojektor auf den zum Intervall Iε = ]λ − ε, λ + ε] gehörigen spektralen
Teilraum H ε = Bild Pε , vgl. 1.7 (b) (v).

(ii) Im Fall λ ∈ σ(A) gibt es wegen σ(A) = σ(A) ein ε > 0 mit σ(A) ∩ Iε = ∅.
Nach 1.3 (b) folgt H ε = {0}, Pε = 0 und somit μϕ (Iε ) = ϕ , Pε ϕ = 0 für
ϕ = 1. Es folgt μW (Iε ) = 0 für jeden Dichteoperator W .

(iii) Im Fall λ ∈ σ(A) gilt Pε = 0 für jedes ε > 0. Dies gilt nach § 22 : 1.5 für
jede Einschränkung AI von A auf einen spektralen Teilraum und daher wegen
1.3 (b) auch für A selbst. Für jeden Zustandsvektor ϕ (ϕ = 1) in H ε ist
Pε ϕ = ϕ, also

μϕ (]λ − ε, λ + ε]) = ϕ , Pε ϕ = ϕ , ϕ = 1 ,

d.h. für den Zustand | ϕ ϕ | liegen alle Messwerte in ]λ − ε, λ + ε].

(iv) Wir betrachten für n ∈ 


die Intervalle In = ]λ − n1 , λ + n1 ] und die
zugehörigen Spektralprojektoren Pn auf die spektralen Teilräume H n . Aus
Eλ Eμ = Eλ für λ ≤ μ folgt Pm Pn = Pn für m ≤ n , d.h. aus Pn u = u
folgt Pm u = u für m ≤ n .
Sei nun u1 , u2 , . . . eine Folge von Vektoren mit un  = 1, un = P un .
Dann ist


W := cn | un un | mit cn := 2−n
n=1
√ 
ein Dichteoperator (§ 22 : 6.4 (b)). Für vn := cn un ist W := | vn vn | ,
n
also

∞ 

Wϕ = vn , ϕ vn , ϕ , Pm W ϕ = Pm ϕ , W ϕ = vn , ϕ Pm ϕ , vn .
n=1 n=1

Nach 4.3 (c) ist μW (Im ) = tr (Pm W ). Mit der Parsevalschen Gleichung für
vollständige ONS ϕ1 , ϕ2 , . . . folgt
4 Hilbertraumtheorie und Quantenmechanik 727


∞ 

tr (Pm W ) = vn , ϕk Pm ϕk , vn
k=1 n=1

∞ ∞ 
= vn , ϕk Pm vn , ϕk
n=1 k=1
∞
= vn , Pm vn
n=1

m−1 
∞ 

= vn , Pm vn + vn 2 ≥ 2−n > 0
n=1 n=m n=m

wegen Pm ≥ 0 und Pm vn = vn für n ≥ m.


Somit ist μW ( ]λ − 1
m
,λ + 1
m
]) > 0 für alle m ∈ . 2

4.5 Scharfe und unscharfe Messungen


(a) Ein Spektralwert λ der Observablen A tritt genau dann als scharfer
Messwert auf, d.h. μW = δλ für einen geeigneten Zustand W , wenn λ ein
Eigenwert von A ist.
Denn ist

W = pk | ϕk ϕk |
k
ein für A zulässiger Zustand, d.h. gehören alle ϕk zu D(A), so gilt nach 4.3 (c)

/W =
E(μW ) = μ pk ϕk , Aϕk ,
 k
V (μW ) = /W ϕk  ,
pk Aϕk − μ
2

/W
also V (μW ) = 0 genau dann, wenn mit λ := μ
pk > 0 ⇐⇒ Aϕk = λϕk .
Ist λ ein einfacher Eigenwert von A, so ist W ein Bindungszustand ( = Eigen-
zustand).
(b) Ist ein Spektralwert λ von A kein Eigenwert, so gibt es nach 4.4 (b) (ii)
zu jedem ε > 0 einen Vektorzustand | ϕ ϕ | mit μϕ (]λ − ε, λ + ε]) = 1, also
E(μϕ ) ∈ ]λ − ε, λ + ε] und V (μϕ ) < 2ε.

4.6 Kompatible Observable


Zwei Observable A, B heißen kompatibel, wenn es im Prinzip möglich ist, die
Beobachtungswerte für A und B simultan beliebig genau zu messen, d.h. wenn
es zu jedem Paar von Werten λ1 ∈ σ(A), λ2 ∈ σ(B) und jedem ε > 0 einen
Zustand W gibt, so dass das zu A gehörige Spektralmaß μW auf ]λ1 − ε, λ1 + ε]
lebt und das zu B gehörige Spektralmaß νW auf ]λ2 − ε, λ2 + ε].
Nach Prugovecki [140] Chapter IV, 1.2, 1.3 gilt für zwei kompatible Observable
Ê
A, B, dass die Spektralscharen {Eλ (A) | λ ∈ } von A und {Eλ (B) | λ ∈ } Ê
728 § 25 Der Spektralsatz und der Satz von Stone

Ê
von B vertauschen: Eλ (A)Eμ (B) = Eμ (B)Eλ (A) für alle λ, μ ∈ . Daraus folgt
wiederum die Existenz einer Observablen C und zweier messbarer Funktionen
Ê Ê
f, g : → mit A = f (C), B = g(C), vgl. Riesz–Nagy [131] 130.
Zu jedem symmetrischen Operator A ∈ L (H ) gibt es im Fall dim H ≥ 2
einen symmetrischen Operator B ∈ L (H ) mit AB = BA ÜA .

4.7 Kritik der Pionier–Quantenmechanik


Wir stützen uns hier auf die ausführliche Übersicht von Primas [139] über die
historische Entwicklung der Pionier–Quantenmechanik, verschiedene Interpre-
tationen und die Diskussion darüber.
Zusammengefasst ergeben sich folgende Kritikpunkte:
– Die Pionier–Quantenmechanik ist unvereinbar mit der klassischen Mechanik,
wenn auch formale Analogien bestehen.
– Beim Konzept der Quantisierung ist die Pionier–Quantenmechanik über ad–
hoc–Regeln wie Korrespondenzprinzip h̄ → 0 oder Plausibilitätsbetrachtun-
gen wie in 4.1 (d) nicht wesentlich hinausgekommen.
– Die Pionier–Quantenmechanik bietet keine umfassende Theorie der moleku-
laren Materie (Thermodynamik, Chemie); eine solche muss makroskopische
Observable vorsehen.
– Die Beschreibung des Messprozesses im Rahmen der Theorie ist mit wis-
senschaftstheoretisch schwer zu akzeptierenden Annahmen verbunden. Das
von Neumannsche Reduktionspostulat führt in letzter Konsequenz dazu, das
Bewusstsein des Beobachters ins Spiel zu bringen und verträgt sich dadurch
schlecht mit der Vorstellung einer unabhängig vom Bewusstsein existierenden
realen physikalischen Welt.
Bei der Messung quantenmechanischer Observabler findet in der Regel eine In-
teraktion statt zwischen den interessierenden Mikroobjekten, beschreibbar im
Formalismus der Quantenmechanik und dem Messapparat, dessen Wirkungswei-
se durch die klassische Physik beschrieben wird. Die Beschreibung der Gesamtsi-
tuation durch eine umfassende Theorie muss daher auch klassische Eigenschaf-
ten wie Masse, Ladung und Temperatur erfassen. Klassische makroskopische
Observable müssen mit allen in Betracht kommenden Observablen kompatibel
und damit vertauschbar sein, vgl. 4.6. Werden alle selbstadjungierten Operato-
ren des Systemhilbertraums als Observable zugelassen (v. Neumannsche Irredu-
zibilitätsannahme), so gibt es keine nichttriviale klassische Observable, da nur
Vielfache der Identität mit L (H ) vertauschen.
Ebensowenig können alle Vektoren des Systemhilbertraums Zustände beschrei-
ben, d.h. das Superpositionsprinzip gilt nicht uneingeschränkt. Vielmehr gibt
es Auswahlregeln (Wick, Wightman, Wigner 1952). Beispielsweise führt die
Invarianz unter Galilei–Transformationen und das Massenerhaltungsgesetz auf
Bargmanns Superauswahlregel (1954).
4 Hilbertraumtheorie und Quantenmechanik 729

4.8 Axiomatische Grundlegung der neueren Quantenmechanik


Die Pionier–Quantenmechanik kann nur einfache Situationen zutreffend be-
schreiben. Von den verschiedenen Ansätzen, eine umfassende Quantenmechanik
axiomatisch aufzubauen, skizzieren wir den von Mackey gewählten Zugang
(Mackey [137], Chap. 2):
Jedem System wird eine Observablenmenge A, ein Zustandsmenge Z und eine
Funktion p : A × Z × B → [0, 1] zugrundegelegt. Dabei wird folgendes verlangt:
I. μA,ω : B → p(A, ω, B) ist für jede Observable A und jeden Zustand ω
ein Wahrscheinlichkeitsmaß; p(A, ω, B) gibt die Wahrscheinlichkeit an, dass im
Zustand ω ein Messwert für A in die Borelmenge B ⊂ fällt. Ê
II. Aus p(A, ω, B) = p(A , ω, B) für alle ω ∈ Z, B ∈ B folgt A = A ; aus


p(A, ω, B) = p(A, ω  , B) für alle A ∈ A, B ∈ B folgt ω = ω  .


III. Zu jeder Observablen A und jeder messbaren Funktion f : → Ê Ê
gibt es
eine Observable A ∈ A mit p(A , ω, B) = p(A, ω, f −1 (B)) für alle ω ∈ Z und
alle B ∈ B, d.h. p(A , ω, B) ist die Wahrscheinlichkeit, dass im Zustand ω für
einen Messwert x von A der Messwert f (x) in die Menge B fällt. Die Observable
A wird mit f (A) bezeichnet.
IV. Zu je abzählbar vielen Zuständen ω1 , ω2 , . . . und Zahlen p1 , p2 , . . . ≥ 0 mit


pk = 1 gibt es einen Zustand ω ∈ Z mit
k=1


p(A, ω, B) = pk p(A, ωk , B) für alle A ∈ A, B ∈ B .
k=0

Die weiteren Axiome betreffen die sogenannten questions (Ja/Nein–Fragen, Pro-


positionen), dies sind Observable Q, für die μQ,ω eine Bernoulli–Verteilung mit
Erfolgswahrscheinlichkeit mω (Q) = p(Q, ω, {1}) ist. Sie werden zum Fragenver-
band Q zusammengefasst. Es zeigt sich
Q ∈ Q =⇒ Q2 = Q und 1 − Q ∈ Q vgl. III..
Mit der Festlegung Q1 ≤ Q2 : ⇐⇒ mω (Q1 ) ≤ mω (Q2 ) für alle ω ∈ Z ergibt
sich eine Ordnungsrelation, die der von Orthogonalprojektoren entspricht. Zwei
Fragen Q1 , Q2 heißen unvereinbar, wenn Q1 ≤ 1−Q2 ⇐⇒ mω (Q1 )+mω (Q2 ) ≤
1 für alle ω ∈ Z. Unvereinbare Fragen können nicht simultan mit Ja beantwortet
werden.
Spezialfälle sind die Fragen Messwert der Observablen A in B ?“, gegeben durch
χB (A). ”

V. Zu je abzählbar vielen paarweise unvereinbaren Q1 , Q2 , . . . ∈ Q gibt es ein




Q ∈ Q mit der Eigenschaft mω (Q) = mω (Qk ) für alle ω ∈ Z, d.h. eine Frage
k=1
Q, die genau dann bejaht wird, wenn wenigstens ein Qk bejaht wird.
730 § 25 Der Spektralsatz und der Satz von Stone

VI. Sei jeder Borelmenge B eine Frage QB zugeordnet, und es gelte


Q∅ = 0 , QÊ = ½ ,
QB1 und QB2 sind unvereinbar für B1 ∩ B2 = ∅ ,
7
∞ 

aus B = Bk mit paarweise disjunkten Bk ∈ B folgt QB = QBk .
k=1 k=1

Dann gibt es eine Observable A ∈ A mit QB = χB (A) für alle B ∈ B.


VII. Zu jedem Q ∈ Q mit Q = 0 gibt es ein ω ∈ Z mit mω (Q) = 1, d.h.
μQ,ω = δ1 .. (Bei Mackey ist dies Axiom VIII.) Das Axiom VII bei Mackey
lässt sich grob so formulieren:
VIII. Es gibt eine äquivalente Darstellung von A und Z auf einem separablen
Hilbertraum H derart, dass A aus den symmetrischen Operatoren einer Unter-
algebra von L (H ) besteht, Z aus einer Teilmenge der Dichteoperatoren und
μA,ω das in 4.3 (c) beschriebene Spektralmaß ist.
Die Pionier–Quantenmechanik ordnet sich dieser Axiomatik unter, indem für Z
die Menge aller Dichteoperatoren und für A die Menge aller symmetrischen Ope-
ratoren A ∈ L (H ) gewählt werden. (Unbeschränkte selbstadjungierte Opera-
toren sind durch die Folge ihrer spektralen Anteile gegeben.)
Die klassische statistische Mechanik ordnet sich wie folgt ein: Zustände sind die
Wahrscheinlichkeitsmaße ω auf dem Phasenraum Φ, Observable sind messbare
Ê
Funktionen A : Φ → , und p ist definiert durch
p(A, ω, B) = ω(A−1 (B)) .
Dann ist f (A) die Funktion f ◦A, und Fragen sind durch zweiwertige Funktionen
q : Φ → {0, 1} gegeben, eindeutig bestimmt durch die Menge q −1 ({1}).
Die Punktmechanik ergibt sich durch Spezialisierung der Zustandsmenge: Zu-
stände werden durch Dirac–Maße auf dem Phasenraum beschrieben.
Für die Einbeziehung der Thermodynamik und der Chemie sei auf Primas [139]
verwiesen.

Die neuere Quantenmechanik bedient sich der Theorie der C*–Algebren. Hierfür
ist die in diesem Kapitel entwickelte Operatorentheorie ein Grundbaustein, nicht
zuletzt weil wichtige Observablenalgebren Darstellungen als Unteralgebren ei-
nes passenden L (H ) besitzen. In echten Unteralgebren A von L (H ) kann es
Operatoren geben, die mit A vertauschen; somit leuchtet ein, dass die Berück-
sichtigung von Superauswahlregeln und die entsprechende Einschränkung der
zulässigen Observablenmenge die Einbeziehung makroskopischer Observabler
ermöglicht. Für den operatoralgebraischen Zugang zur Quantenmechanik ver-
weisen wir auf Primas [139] Ch. 4.
Namen und Lebensdaten
d’Alembert, Jean Baptiste Le Rond Fermat, Pierre de (1607–1665)
(1717–1783) Fourier, Jean Baptiste Joseph
Alhazen (Ibn Al–Haytham) (1768–1830)
(965–1040?) Fredholm, Erik Ivar (1866–1927)
Banach, Stefan (1892–1945)
Friedrichs, Kurt Otto (1901–1982)
Bendixson, Ivar (1861–1935)
Frobenius, Kurt Otto Georg
Bernoulli, Jakob (1655–1705) (1849–1917)
Bernoulli, Johann (1667–1748) Fubini, Guido (1879–1943)
Bernoulli, Daniel (1700–1782) Gauss, Carl Friedrich (1777–1855)
Bessel, Friedrich Wilhelm Green, George (1793–1841)
(1784–1846)
Gronwall, Thomas Hakon
Borel, Emile (1871–1956) (1877–1932)
Born, Max (1882–1970) Hadamard, Jacques (1865–1963)
Browder, Felix, E. (*1927) Hamilton, Sir William Rowan
Carathéodory, Constantin (1805–1865)
(1873–1950) Hankel, Hermann (1839–1873)
Cauchy, Augustin–Louis (1789–1857) Heaviside, Oliver (1850–1925)
Christoffel, Elwin Bruno Heisenberg, Werner (1901–1976)
(1829–1900)
Hellinger, Ernst (1883–1950)
Clairaut, Alexis Claude (1717–1765)
Hermite, Charles (1822–1901)
Courant, Richard (1888–1972)
Hilbert, David (1862–1943)
Darboux, Jean Gaston (1842–1917)
Hölder, Otto (1859–1937)
Dirac, Paul Adrien Maurice
(1902–1984) Hopf, Eberhard (1902–1983)
Dirichlet, Gustav Peter Lejeune Hugoniot, Pierre Henri (1851–1887)
(1805–1859) Huygens, Christiaan (1629–1695)
du Bois–Reymond, Paul (1831–1889) Jacobi, Carl Gustav (1804–1851)
Duhamel, Jean Marie Constant Jordan, Pascual (1902–1980)
(1797–1872)
Kato, Tosio (1917–1999)
Einstein, Albert (1879–1955)
Kelvin (Thomson), Lord William
Euler, Leonard (1707–1783) (1824–1907)
Faraday, Michael (1791–1867) Kolmogorow, Andrej Nikolajewitsch
Fischer, Ernst (1875–1959) (1903–1987)

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4, © Springer Fachmedien Wiesbaden 2014
Namen und Lebensdaten 733

Korn, Arthur (1870–1945) Perron, Oskar (1880–1975)


Ladyzhenskaja, Olga Alexandrowa Picard, Emile (1856–1941)
(1922–2004)
Planchérel, Michel (1885–1967)
Lagrange, Joseph Louis (1736–1813)
Planck, Max (1858–1947)
Laguerre, Edmond (1834–1886)
Poincaré, Henri (1854–1912)
Laplace, Pierre Simon (1749–1827)
Poisson, Siméon–Denis (1781–1840)
Lebesgue, Henri (1875–1941)
Rayleigh, Lord John William Strutt
Legendre, Adrien Marie (1752–1833) (1842–1919)
Levi, Beppo (1875–1961) Rellich, Franz (1906–1955)
Lichtenstein, Leon (1878–1933)
Riesz, Friedrich (1880–1956)
Lindelöf, Ernst Leonard (1870–1946)
Rodrigues, Olinde (1794–1851)
Liouville, Joseph (1809–1882)
Schmidt, Erhard (1876–1959)
Lipschitz, Rudolph Otto Sigismund
(1832–1903) Schrödinger, Erwin (1887–1961)

Ljapunow, Alexander Michailowitsch Schwartz, Laurent (1915–2002)


(1856–1918) Schwarz, Hermann Amandus
Maxwell, James Clerk (1831–1879) (1843–1921)
Milgram, Arthur Norton (1912–1961) Sobolew, Sergei Lwowitsch
(1908–1989)
Minkowski, Hermann (1864–1909)
Sommerfeld, Arnold (1868–1951)
Moivre, Abraham de (1667–1754)
Stokes, Sir Georg Gabriel
Monge, Gaspard (1746–1818)
(1819–1903)
Morrey, Charles Bradfield
(1907–1984) Stone, Marshall Harvey (1903–1989)

Navier, Claude Louis Marie Henri Sturm, Charles (1803–1855)


(1785–1836) Toeplitz, Otto (1881–1940)
Neumann, Carl Gottfried (1832–1925) Tonelli, Leonida (1885–1946)
Neumann, Johann von (1903–1957) Tschebyschew, Pafnuti Lwowitsch
Newton, Isaac (1643–1727) (1821–1894)
Nirenberg, Louis (*1925) Weierstraß, Karl (1815–1897)
Pauli, Wolfgang (1900–1958) Weyl, Hermann (1885–1955)
Parseval, Marc Antoine (1755–1836) Zaremba, Stanislaw (1863–1942)
Literaturverzeichnis
Methoden der Mathematischen Physik
[1] Arfken, G.B., Weber, H.J.: Mathematical Methods for Physicists. Academic
Press 2005.
[2] Courant, R., Hilbert, D.: Methoden der Mathematischen Physik I. Springer
1968.
[3] Courant, R., Hilbert, D.: Methoden der Mathematischen Physik II. Springer
1968.
[4] Dautray, R., Lions, J.L.: Mathematical Analysis and Numerical Methods for
Science and Technology 1–6 . Springer 2000.
[5] Frank, P., von Mises, R.: Die Differential– und Integralgleichungen der Me-
chanik und Physik I, II . Nachdruck Dover und Vieweg 1967.
[6] Goldhorn, K.H., Heinz, H.P., Kraus, M.: Moderne mathematische Methoden
der Physik 1,2 . Springer 2009/10.

Gewöhnliche Differentialgleichungen, Dynamische Systeme


Einführende Werke
[7] Arrowsmith, D.K., Place, C.M.: Dynamical systems. Differential equations,
maps and chaotic behaviour . Chapman and Hall 1992.
[8] Birkhoff, G., Rota, G.C.: Ordinary Differential Equations. Wiley 1989.
[9] Heuser, H.: Gewöhnliche Differentialgleichungen. Springer 2009.
[10] Hirsch, M.W., Smale, S., Devaney, R.: Differential Equations, Dynamical
Systems, and an Introduction to Chaos. Elsevier 2003.
[11] Miller, R.K., Michel, A.N.: Ordinary Differential Equations. Acad. Press
1982.
[12] Walter, W.: Gewöhnliche Differentialgleichungen. Springer 1993.

Weiterführende Werke
[13] Amann, H.: Gewöhnliche Differentialgleichungen. de Gruyter 1995.
[14] Arnold, V.I.: Gewöhnliche Differentialgleichungen. Springer 1979.
[15] Arrowsmith, D.K., Place, C.M.: An Introduction to Dynamical Systems.
Cambridge Univ. Press 1990.
[16] Chicone, C.: Ordinary Differential Equations with Applications. Springer 2006.
[17] Coddington, E.A., Levinson, N.: Theory of Ordinary Differential Equations.
Mc Graw–Hill 1955.
[18] Hahn, W.: Stabilty of Motion. Springer 1967.
[19] Hale, J.: Ordinary Differential Equations. Wiley–Interscience 1969/R. Krieger
Publ. Co. 1980.
[20] Hartman, P.: Ordinary Differential Equations. Birkhäuser 1982.
[21] Hille, E.: Lectures on Ordinary Differential Equations. Addison–Wesley Publ.
Comp. 1969.

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4, © Springer Fachmedien Wiesbaden 2014
Literaturverzeichnis 735

[22] Kamke, E.: Differentialgleichungen. Lösungsmethoden und Lösungen 1, 2 .


Teubner 1983.
[23] Knobloch, H.W., Kappel, F.: Gewöhnliche Differentialgleichungen. Teubner
1974.
[24] Palis, J., de Melo, W.: Geometric Theory of Dynamical Systems. Springer
1982.
[25] Perko, L.: Differential Equations and Dynamical Systems. Springer 2001.

Verzweigung, Attraktoren
[26] Berry, M.V.: Regular and Irregular Motion, in Topics in Nonlinear Dynamics.
(Jorna, Ed.). Americ. Inst. Phys. 1978, p. 16–121.
[27] Chow, S.N., Hale, J.: Methods of Bifurcation Theory. Springer 1982.
[28] Guckenheimer, J., Holmes, P.: Nonlinear Oscillations, Dynamical Systems,
and Bifurcations of Vectorfields. Springer 2002.
[29] Hale, J., Kociak, H.: Dynamics and Bifurcation. Springer 1991.
[30] Kielhöfer, H.: Methods of Bifurcation Theory. An Introduction with Applica-
tions to PDEs. Springer 2010.
[31] Moser, J.: Stable and Random Motion in Dynamical Systems. Princeton
Univ. Press 1973.
siehe auch [70]

Fourieranalysis, Distributionen, Integraltransformationen


[32] Bochner, S.: Vorlesungen über Fouriersche Integrale. Akad. Verlagsgesellschaft
1932 / repr. Chelsea 1949.
[33] Daubechies, I.: Ten Lectures on Wavelets. Soc. Indust. Appl. Math. 1992.
[34] Dym, H., Mc Kean, H.P.: Fourier Series and Integrals. Acad. Press 1972.
[35] Folland, G.B.: Fourier Analysis and its Applications. Wadsworth and
Brooks/Cole 1992.
[36] Friedlander, F.G.: Introduction to the Theory of Distributions. Cambridge
Univ. Press 1998.
[37] Gasquet, C., Witomski, P.: Fourier Analysis with Applications. Springer 1999.
[38] Gelfand, I.M., Schilow, G.E.: Verallgemeinerte Funktionen (Distributionen)
I–IV . Deutscher Verlag der Wissenschaften 1960–64.
[39] Gónzalez–Velasco, E.A.: Fourier Analysis and Boundary Value Problems.
Acad. Press 1995.
[40] Hardy, G.H., Rogosinski, W.W.: Fourier Series. MacMillan Comp. 1944.
[41] Schempp, W., Dreseler, B.: Einführung in die harmonische Analyse. Teubner
1980.
[42] Schwartz, L.: Mathematics for the Physical Sciences. Hermann/Addison–
Wesley 1966.
[43] Stein, E.M., Weiss, G.: Introduction to Fourier Analysis on Euclidean Spaces.
Princeton Univ. Press 1971.
736 Literaturverzeichnis

[44] Temple, G.: Theories and Applications of Generalized Functions. J. London


Math. Soc. 28 (1953) 134–148 .
[45] Widder, D.V.: The Laplace–Transform. Acad. Press 1975.
[46] Zygmund, A.: Trigonometric Series. Cambridge Univ. Press 2002.
siehe auch [2], [4, 2], [56], [91, I]

Partielle Differentialgleichungen
Einführende Werke
[47] Garabedian, P.R.: Partial Differential Equations. Wiley 1964.
[48] Hellwig, G.: Partielle Differentialgleichungen. Teubner 1960.
[49] John, F.: Partial Differential Equations. Springer 1993.
[50] Leis, R.: Vorlesungen über partielle Differentialgleichungen 2. Ordnung . Bibl.
Inst. 1967.
[51] Michlin, S.G.: Partielle Differentialgleichungen in der Mathematischen Physik .
Verlag Harri Deutsch 1978.
[52] Protter, M.H., Weinberger, H.F.: Maximum Principles in Differential Equa-
tions. Prentice–Hall 1967 / repr. Springer 1984.
[53] Strauss, W.A.: Partielle Differentialgleichungen. Eine Einführung. Vieweg
1995.
[54] Tychonoff, A.N., Samarski, A.A.: Differentialgleichungen der Mathemati-
schen Physik . Deutscher Verlag der Wissenschaften 1959.
[55] Weinberger, H.F.: A First Course in Partial Differential Equations. Blaisdell
Publ. Comp. 1965 / repr. Dover.
[56] Wladimirow, W.S.: Gleichungen der Mathematischen Physik . Deutscher Ver-
lag der Wissenschaften 1972.
[57] Zauderer, E.: Partial Differential Equations of Applied Mathematics. Wiley
2006.
siehe auch [3], [22, 2].

Weiterführende Werke
[58] Bers, L., John, F., Schechter, M.: Partial Differential Equations. Interscience
Publ. 1964 / repr. Amer. Math. Soc.
[59] Dibenedetto, E.: Partial Differential Equations. Birkhäuser 2010.
[60] Evans, L.C.: Partial Differential Equations. Amer. Math. Soc. 2010.
[61] Folland, G.B.: Introduction to Partial Differential Equations. Princeton Univ.
Press 1976.
[62] Friedman, A.: Partial Differential Equations. Holt, Rinehart and Winston 1969.
[63] Hörmander, L.: The Analysis of Partial Differential Operators I–IV . Springer
2003–09.
[64] Jost, J.: Partial Differential Equations. Springer 2013.
[65] Ladyzhenskaya, O.A.: Boundary Value Problems of Mathematical Physics.
Springer 1985.
Literaturverzeichnis 737

[66] Lions, J.L., Magenes, E.: Non–homogenous Boundary Value Problem and Ap-
plications I . Springer 1972/73.
[67] Rauch, J.: Partial Differential Equations. Springer 1991.
[68] Sobolew, S. L.: Einige Anwendungen der Funktionalanalysis auf Gleichungen
der Mathematischen Physik . Akademie–Verlag 1964.
[69] Taylor, M. E.: Partial Differential Equations I–III . Springer 1996.
[70] Temam, R.: Infinite–Dimensional Dynamical Systems in Mechanics and Phy-
sics. Springer 1997.
[71] Treves, F.: Basic Linear Partial Differential Equations . Academic Press 1975.
[72] Wloka, J.: Partielle Differentialgleichungen. Teubner 1982.
[73] Zeidler, E.: Nonlinear Functional Analysis with Applications I–IV . Springer
1985–90.
siehe auch [3], [4, 1], [4, 5], [4, 6]

Elliptische und parabolische Differentialgleichungen


[74] Chavel, I.: Eigenvalues in Riemannian Geometry. Academic Press 1984.
[75] Dacorogna, B.: Direct Methods in the Calculus of Variations. Springer 1989.
[76] Egorov, Y., Kondratiev, V.: On Spectral Theory of Elliptic Operators.
Birkhäuser 1996.
[77] Eidelman, S.D., Zhitarashu, N.V.: Parabolic boundary problems. Birkhäuser
1998.
[78] Friedman, A.: Partial Differential Equations of Parabolic Type. Prentice–Hall
1964.
[79] Gilbarg, D., Trudinger, N.S.: Elliptic Differential Equations of Second Order .
Springer 2001.
[80] Grisvard, P.: Elliptic Problems in Nonsmooth Domains. Pitman 1985.
[81] Krylow, N.V.: Lectures on Elliptic and Parabolic Equations in Hölder Spaces.
Amer. Math. Soc. 1996.
[82] Ladyzhenskaya, O.A., Uraltseva, N.N.: Linear and Quasilinear Elliptic
Equations. Acad. Press 1968.
[83] Ladyzhenskaya, O.A., Solonnikov, V.A., Uraltseva, N.N.: Linear and Qua-
silinear Equations of Parabolic Type. Acad. Press 1968 / repr. Amer. Math. Soc..
[84] Lichtenstein, L.: Neuere Entwicklung der Potentialtheorie. Konforme Abbil-
dung. Encykl. der Math. Wiss. Bd. II.3.1, 177–377. Teubner 1919.
[85] Lieberman, G.M.: Second Order Parabolic Equations. World Scient. Publ. 1996.
[86] Nazarov, S.A., Plamenevsky, B.A.: Elliptic Problems in Domains with Pie-
cewise Smooth Boundaries. de Gruyter 2011.
siehe auch [3], [4, 1], [4, 4]
738 Literaturverzeichnis

Hyperbolische Gleichungen, Wellenausbreitung


[87] Cakoni, F., Colton, D.: Qualitative Methods in Inverse Scattering Theory .
Springer 2006.
[88] Colton, D., Kress, R.: Integral Equation Methods in Scattering Theory. Wiley
1983.
[89] Dafermos, C.M.: Hyperbolic Conservation Laws in Continuum Physics. Sprin-
ger 2010.
[90] Hadamard, J.: Leçons sur la propagation des ondes et les équations de
l’hydrodynamique. Hermann 1903.
[91] Hörmander, L.: Nonlinear Hyperbolic Differential Equations. Springer 1997.
[92] Jackson, J.D.: Classical Electrodynamics. Wiley 1998.
[93] Jeffrey, A., Taniuti, T.: Nonlinear Wave Propagation. Acad. Press 1966.
[94] John, F.: Nonlinear Wave Equations, Formation of Singularities. Amer. Math.
Soc. 1990.
[95] Kichenassamy, S.: Nonlinear Wave Equations. Marcel Dekker 1996.
[96] Kato, T.: The Cauchy Problem for Quasi–Linear Symmetric Hyperbolic Sy-
stems. Arch. Rat. Mech. Anal. 58 (1975) 181–205 .
[97] Lax, P.: Hyperbolic Systems of Conservation Laws and the Mathematical Theo-
ry of Shock Waves. SIAM 1973.
[98] Leis, R.: Initial Boundary Value Problems in Mathematical Physics. Teubner /
Wiley 1986.
[99] Racke, R.: Lectures on Nonlinear Evolution Equations. Vieweg 1992.
[100] Sogge, C. D..: Lectures on Nonlinear Wave Equations. Internat. Press 1995.
[101] Taniuti, T., Nishihara, K.: Nonlinear Waves. Pitman 1983.
[102] Toda, M.: Nonlinear Waves and Solitons. Kluwer Acad. Publ. 1989.
[103] Whitham, C.B.: Linear and Nonlinear Waves. Wiley 1974.
[104] Wilcox, C.H.: Scattering Theory for the d’Alembert Equations in Exterior Do-
mains. Springer 1975.
siehe auch [3]

Spezielle Funktionen der Mathematischen Physik,


Entwicklung nach Eigenfunktionen
Spezielle Funktionen der mathematischen Physik
[105] Hobson, E.W.: The Theory of Spherical and Ellipsoidal Harmonics. Chelsea
Publishing Comp. 1931.
[106] Lebedev, N.N.: Special Functions and their Applications. Prentice–Hall 1965.
[107] Lense, J.: Reihenentwicklungen in der Mathematischen Physik . de Gruyter
1953.
[108] Sansone, G.: Orthogonal Functions. Interscience Publ. 1959.
[109] Szegö, G.: Orthogonal Polynomials. Amer. Math. Soc. 1939.
[110] Watson, G.N.: A Treatise on the Theory of Bessel Functions. Cambridge
Univ. Press 1944.
siehe auch [1], [2], [4, 2], [4, 3]
Literaturverzeichnis 739

Entwicklung nach Eigenfunktionen


[111] Jörgens, K., Rellich, F.: Eigenwerttheorie gewöhnlicher Differentialgleichun-
gen. Springer 1976.
[112] Levitan, B.M., Sargsjan, I.S.: Introduction to Spectral Theory. Amer. Math.
Soc. 1975.
[113] Titchmarsh, E.C.: Eigenfunction Expansions I, II . Clarendon Press 1962/58.
[114] Yosida, K.: Lectures on Differential and Integral Equations. Interscience Publ.
1960.
siehe auch [2], [9], [17]

Wahrscheinlichkeit, Maß, Integral


[115] Bauer, H.: Wahrscheinlichkeitstheorie. de Gruyter 2011.
[116] Behnken, K., Neuhaus, G.: Grundkurs Stochastik . Teubner 1984.
[117] Elstrodt, J.: Maß– und Integrationstheorie. Springer 2011.
[118] Floret, K.: Maß– und Integrationstheorie. Teubner 1981.
[119] Freudenthal, H.: Wahrscheinlichkeit und Statistik . Oldenbourg 1963.
[120] Halmos, P.R.: Measure Theory. Van Nostrand 1950.
[121] Krengel, U.: Einführung in die Wahrscheinlichkeitstheorie und Statistik .
Vieweg 2005.
[122] Lang, S.: Analysis II . Addison–Wesley 1973.
[123] Renyi, A.: Wahrscheinlichkeitsrechnung mit einem Anhang über Informations-
theorie. Deutscher Verlag der Wissenschaften 1962.
siehe auch [122], [140].

Funktionalanalysis, Operatoren im Hilbertraum


Lineare Operatoren im Hilbertraum
[124] Achieser, N.L., Glasmann, I.M.: Theorie der linearen Operatoren im Hilbert-
raum. Akademie–Verlag 1968.
[125] Edmunds, D.E., Evans, W.D.: Spectral Theory and Differential Operators. Cla-
rendon Press 1987.
[126] Faris, W.G.: Self–adjoint Operators. Springer 1975.
[127] Hirzebruch, F., Scharlau, W.: Einführung in die Funktionalanalysis. Bibl.
Inst. 1971.
[128] Kato, T.: Perturbation Theory of Linear Operators. Springer 1966.
[129] Neumark, M.A.: Lineare Differentialoperatoren. Akademie–Verlag 1967.
[130] Reed, M., Simon, B.: Methods of Modern Physics I–IV . Acad. Press 1972–75.
[131] Riesz, F., Nagy, B.Sz.: Vorlesungen über Funktionalanalysis. Verlag Harri
Deutsch 1982.
siehe auch [4, 2], [4, 3]
740 Literaturverzeichnis

Sobolew–Räume
[132] Adams, R.A.: Sobolev Spaces. Acad. Press 2003.
[133] Brezis, H.: Analyse fonctionelle. Théorie et applications. Masson 1983.
[134] Kufner, A. et al.: Function Spaces. Noordhoff Int. Pub. & Academia 1977.
[135] Ziemer, W.P.: Weakly Differentiable Functions. Springer 1989.
siehe auch [4, 2]

Mathematische Grundlagen der Quantenmechanik


[136] Jauch, J.M.: Mathematical Foundations of Quantum Mechanics. Addison–
Wesley 1988.
[137] Mackey, G.W.: The Mathematical Foundations of Quantum Mechanics. Ben-
jamin 1963.
[138] von Neumann, J.: Mathematische Grundlagen der Quantenmechanik . Springer
1932/1996.
[139] Primas, H.: Chemistry, Quantum Mechanics and Reductionism. Springer 1981.
[140] Prugovečki, E.: Quantum Mechanics in Hilbert Space. Acad. Press 1981.
siehe auch [4, 3]

Lineare Algebra, Analysis, Topologie


[141] Barner, M., Flohr, F.: Analysis II . de Gruyter 1995.
[142] Bröcker, T., Jänich, K.: Einführung in die Differentialtopologie. Springer
1990.
[143] Cigler, J., Reichel, H.–C.: Topologie. Bibl. Inst. 1978.
[144] Dugundji, J.: Topology. Allyn and Bacon 1965.
[145] Fischer, G.: Lineare Algebra. Springer 2012.
[146] Fleming, W.: Functions of Several Variables. Springer 1977.
[147] Forster, O.: Analysis 3 . Springer 2012.
[148] Heuser, H.: Lehrbuch der Analysis 2 . Springer 2008.
[149] Jänich, K.: Vektoranalysis. Springer 1972.
[150] Königsberger, K.: Analysis 2 . Springer 2004.

Geometrische Optik und Hamiltonsche Mechanik


[151] Arnold, V.I.: Mathematical Methods of Classical Mechanics. Springer 1997.
[152] Giaquinta, M., Hildebrandt, S.: Calculus of Variations I, II . Springer 2004.
[153] Rund, H.: The Hamilton–Jacobi–Theory in the Calculus of Variations. Van
Nostrand 1966.
siehe auch [3]
Literaturverzeichnis 741

Theoretische Physik
Gesamtdarstellungen
[154] Feynman, R.P., Leighton, R.B., Sands, M.: The Feynman Lectures on Physics
I–III . Addison–Wesley Publ. Comp. 1964.
[155] Landau, L.D., Lifschitz, E.M.: Lehrbuch der Theoretischen Physik 1–10 . Ver-
lag Harri Deutsch 1986–2004.
[156] Sommerfeld, A.: Vorlesungen über Theoretische Physik I–VI . Akad. Verlags-
gesellschaft 1962–68.

Quantenmechanik
[157] Cohen–Tannoudji, C., Diu, B., Laloë, F.: Quantenmechanik 1,2 . de Gruyter
2009.
[158] Bohm, A.: Quantum Mechanics: Foundations and Applications. Springer 1986.
[159] Dirac, P.A.M.: The Principles of Quantum Mechanics. Clarendon Press 1974.
[160] d’Espagnat, B.: Conceptual Foundations of Quantum Mechanics. Benjamin
1971.
[161] Fick, E.: Einführung in die Grundlagen der Quantentheorie. Akad. Verlagsge-
sellschaft 1968.
[162] Messiah, A.: Quantenmechanik 1,2 . de Gruyter 1991/2010.
[163] Primas, H., Müller–Herold, U.: Elementare Quantenchemie. Teubner 1990.
siehe auch [139],
[154, III]

Numerik
Numerische Mathematik
[164] Freund, R.W., Hoppe, R.H.W.: Stoer/Bulirsch: Numerische Mathematik 1/2 .
Springer 2007/2011.
[165] Deuflhard, P., Hohmann, A.: Numerische Mathematik 1 . de Gruyter 2008.
[166] Hanke–Bourgeois, M.: Grundlagen der numerischen Mathematik und des wis-
senschaftlichen Rechnens. Springer 2009.
[167] Quarteroni, A., Sacco, R., Salieri, F.: Numerische Mathematik 1,2. Springer
2002.
[168] Strang, G.: Introduction to applied Mathematics. Wellesley–Cambridge Press
1986.
[169] Strang, G.: Wissenschaftliches Rechnen. Springer 2010.

Matrizennumerik
[170] Golub, G.H., van Loan, C.F.: Matrix Computations. John Hopkins Univ. Press
1996.
[171] Saad, Y.: Numerical Methods for Large Eigenvalue Problems. SIAM 2011.
[172] Saad, Y.: Iterative Methods for Sparse Linear Systems. SIAM 2003.
[173] Varga, R.S.: Matrix Iterative Analysis. Springer 2000.
[174] Young, D.M.: Iterative Solution of Large Linear Systems. Acad. Press 1971 /
repr. Dover.
742 Literaturverzeichnis

Numerik von Differentialgleichungen


[175] Rylander, T., Ingelström, P., Bondeson, A.: Computational electromagne-
tics. Springer 2013.
[176] Bossavit, A.: Computational electromagnetism. Variational formulations, com-
plementary, edge elements. Acad. Press 1998.
[177] Braess, D.: Finite Elemente. Springer 2013.
[178] Deuflhard, P., Bornemann, F.: Numerische Mathematik 2 . de Gruyter 2013.
[179] Deuflhard, P., Weiser, M.: Adaptive Lösung partieller Differentialgleichun-
gen. de Gruyter 2011.
[180] Grossmann, C., Roos, H.G.: Numerische Behandlung partieller Differential-
gleichungen. Vieweg+Teubner 2005.
[181] Hackbusch, W.: Theorie und Numerik elliptischer Differentialgleichungen.
Teubner 1986.
[182] Hackbusch, W.: Integralgleichungen. Teubner 1989.
[183] Hairer, E., Nørsett, S.P., Wanner, G.: Solving Ordinary Differential Equa-
tions I . Springer 1993.
[184] Hairer, E., Wanner, G.: Solving Ordinary Differential Equations II . Springer
1996.
[185] Hairer, E., Lubich, C., Wanner, G.: Geometric numerical integration.
Structure–preserving algorithms for ordinary differential equations. Springer
2006.
[186] Knabner, P., Angermann, L.: Numerical methods for Elliptic and Parabolic
Partial Differential Equations. Springer 2003.
[187] Brenner, S.C., Scott, L.R.: The Mathematical Theory of Finite Element Me-
thods. Springer 2008.
[188] Ciarlet, P.G.: The Finite Element Method for Elliptic Problems. North-
Holland Publishing Co. 1978.
[189] Dziuk, G.: Theorie und Numerik partieller Differentialgleichungen. de Gruyter
2010.
[190] Kröner, D.: Numerical Schemes for Conservation Laws. Wiley 1997.
[191] Raviart, P.A., Thomas, J.M.: Introduction à l’analyse numérique des
équations aux dérivées partielles. Mason 1983.
siehe auch [4, 4] [4, 6]

Geschichte
[192] Bemelmans, J., Hildebrandt, S., von Wahl, W.: Partielle Differentialglei-
chungen und Variationsrechnung. Ein Jahrhundert Mathematik 1890–1990,
Festschrift zum Jubiläum der DMV. (Fischer, Hirzebruch, Scharlau, Törnig,
Hrsg.), pp.149–230. Vieweg 1990.
[193] Burkhardt, H.: Entwicklungen nach oscillierenden Functionen und Integration
der Differentialgleichungen der mathematischen Physik . Jahresber. DMV 10
(1908), pp.1–1804.
[194] Burkhardt, H., Meyer, W.F.: Potentialtheorie. Encykl. der Math. Wiss.
Bd. II.1, pp.464–503. Teubner 1900.
Literaturverzeichnis 743

[195] Hellinger, E.: Hilberts Arbeiten über Integralgleichungen und unendliche


Gleichungssysteme. David Hilbert, Gesammelte Abhandlungen III, pp.94–145.
Springer 1970.
[196] Hund, F.: Geschichte der Quantentheorie. Bibl. Inst. 1975.
[197] Kline, M.: Mathematical Thought from Ancient to Modern Times. Oxford Univ.
Press 1972.
[198] Leis, R.: Zur Entwicklung der angewandten Analysis und mathematischen Phy-
sik in den letzten 100 Jahren. Ein Jahrhundert Mathematik 1890–1990, Fest-
schrift zum Jubiläum der DMV. (Fischer, Hirzebruch, Scharlau, Törnig, Hrsg.),
pp.491–535. Vieweg 1990.
[199] Lützen, J.: The Solution of Partial Differential Equations by Separation of
Variables. A Historical Survey. Studies in the History of Mathematics (Phillips,
Ed.). The Math. Association of America 1987.
[200] Ter Haar, D.: The Old Quantum Theory. Pergamon Press 1967.
[201] Szabó, I.: Geschichte der mechanischen Prinzipien. Birkhäuser 1979.
[202] Van Der Waerden, B.L.: Sources of Quantum Mechanics. Dover 1967.
siehe auch [9]

Handbücher, Tabellenwerke
[203] Abramovitz, M., Stegun, I.A. (Eds.): Handbook of Mathematical Functions.
Dover 1970.
[204] Doetsch, G.: Handbuch der Laplace–Transformation 1–3 . Birkhäuser 1971–73.
[205] Erdelyi, A., Magnus, W., Oberhettinger, F., Tricomi, F.G.: Higher Tran-
scendental Functions 1–3 . Mc Graw–Hill Book Comp. 1953, Krieger Publ. Co.
1981.
[206] Gradshsteyn, I.S., Ryzhik, I.M.: Table of Integrals, Series, and Products.
Acad. Press 1994.
[207] Jahnke, E., Emde, F., Lösch, F.: Tafeln höherer Funktionen. Teubner 1966.
[208] Jeffrey, A.: Tables of Integrals, Series and Products. Academic Press 2008.
[209] Magnus, W., Oberhettinger, F., Soni, R.P.: Formulas and Theorems for the
Special Functions of Mathematical Physics. Springer 1966.
[210] Zeidler, E. (Hrsg.): Springer–Taschenbuch der Mathematik. Springer 2013.
Symbole und Abkürzungen
DG, 28 Ã
2 , 2 ( ), 223
AWP, 28, 401, 429 20 , 224
Dy f , 30 U ⊥ , 225
Lip , 31 U ⊥⊥ , 226, 228
ϕ(x, ξ, η ), 37 V ⊕ W , 227
J(ξ, η ), 37 supp u, 242
t → ϕ(t, η ), 40 Ckc (Ω), C∞
c (Ω), 242
J(η ), 40 u ∗ v (Faltung), 244
Y (x, ξ), 55 Ta M (Tangentialraum), 264
etA , 58 Ck (M ), 264
p(T ), 60 Am (M ), Am (K), 267
L (V ), 60 L∗ , 275, 277
Æ0, 75 C1n (Ω), 277
P , Pm (Legendre–Funktionen), 88 /
u(x), 286
Ln , Lm
n (Laguerre–Polynome), 91 Pk , Qk , 287
Jν , J−ν (Bessel–Funktionen), 94 Ê
S = S ( n ), 292
D , D  , 307
(1) (2)
Hν , Hν (Hankel–Funktionen), 95
Nν , Yν (Neumann–Funktionen), 95 δ, δa (Dirac–Distribution), 307
(λ)n , 95 ∂ α T (Distributionen), 312
S
J(η ), 98 ϕk −→ ϕ, 319
ϕ(t, η ), 98 Ê
S  = S  ( n ), 319
Ωf , 98 T/, 322
∂f V (x), 121 Γx , 330
Ck (Ω), 133, 255 C1g (Ω), 359
PC [a, b], 139 ∂i u, 362
PC1 [a, b], 139 W1 (Ω), W1 (I), 362, 368
∇x , ∇z , ∇p , ∇q , 184 W01 (Ω), 363
f.ü., 204, 523, 530 H1 (Ω), 366
L1 (Ω), 207, 530 H10 (Ω), 366
L2 (Ω), 212 Wk (Ω), 367
L2 (Ω), 213 →, 369
Lp (Ω), 215, 242 jν,k (Nullstellen der Besselfunkt.), 385
u∞ , 217, 583 ΔS 2 , ΔM , 390, 393
L∞ (Ω), 217, 242 Y m (Kugelfunktionen), 397
L1loc (Ω), 217, 242 H (Wärmeleitungsoperator), 401
H , 221, 547 ARWP, 401, 430

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4, © Springer Fachmedien Wiesbaden 2014
Symbole und Abkürzungen 745

uC0 (I,H ) , 416 w–lim Tn , 563


n→∞
L2 (J, H ), 417 T − λ, λ − T , 568
uL2 (J,H ) , 417 (T ), (A), 568, 664
Wk (J, H ), 418 R(λ, T ), 568
¡ (d’Alembert–Operator), 429 σ(T ), σ(A), 568, 664
x, 429 σp (T ), σp (A), 568, 665
∇, 429 σc (T ), σc (A), 568, 665
Sr (x), 444 σr (T ), σr (A), 568, 665

− u do, 444 σapp (T ), σapp (A), 572, 666
| ϕ  ϕ |, 473, 618 p(T ), f (T ), 580, 582
μu , /
/ μϕ , 475 C∗ (T ), 583
P (X = x), P (X ∈ A), 478, 479, 480 e−itT , 587
b(n, p), 479 T 1/2 , 589
δa (Dirac–Maß), 481 | T |, 590
/ 483
X, F, 591
σ(K) (σ–Algebren), 494 Eλ (Spektralschar), 596, 705
B( Ên ), 494 μu (Spektralmaß), 597, 705
]a, b], 495 Z(a), 606
Ln , V n , 503 L2 -lim , 608
n→∞
λ, λn (Lebesgue–Maß), 503 ?

H k , 611
μ–f.ü., 511, 523 k=1
{f ∈ B}, {f ≤ β}, {α < f ≤ β}, 514 tr (T ), tr (AT ), 633, 635
f = lim fn μ–f.ü., 518 P, Q, 642
 n→∞
D(A), 644
f dμ, 519, 520
Ω C20 [a, b], 644
L1 (Ω, μ), L1 (Ω), 521 H × H , 645
Lp (Ω, μ), 538 G(A) (Graph von A), 645
L∞ (Ω, μ), 540 A ⊂ B (Operatoren), 645
T , 548 A (Operatoren), 647
L (H ), 549  · A , 649
Ma , 552, 646 W01 [a, b], 653
Mv , 553, 647 W1 (I), 655
T ∗ , 557 W10 ( Ê+ ), 656
T ≥ 0, T > 0, A ≥ 0, 562 A∗ , 659
T ≥ 0, T > 0, A ≥ 0, 681 R(λ, A), 664
S ≤ T , 562 f (A), 703
lim Tn , 562
n→∞
Ê
Cb ( ), 704
s–lim Tn , 562 e−iAt , 715
n→∞
Index
abgeschlossener Operator, 649 Binomialverteilung, 478
Ableitung Borelmengen, 494
schwache, 361 Brennpunkt (char. Projektion), 176
abschließbarer Operator, 648
Abschluss eines Operators, 647 Ck –Differenzierbarkeit auf Ω, 255
abschnittsweis glatt, 140 Cr –berandet, 273
absolutstetig, 219 Cauchy–Problem, 172, 401
Adjungierte, 659 Cauchy–Schwarzsche Ungleichung
adjungierter Operator, 557, 659 für positive Operatoren, 562
d’Alembert Cayley–Hamilton, 65
Lösungsformel, 152, 442 Cetaev (Instabilitätssatz), 123
Reduktionsverfahren, 72 Charakteristik, 174, 185
Saitenschwingung, 177 Charakteristikenmethode, 186
d’Alembert–Operator, 429 charakteristische DG, 174, 184
Anfangs–Randwertproblem charakteristische Gleichung, 83
schwingende Saite, 134 charakteristische Hyperfläche, 433
Wärmeleitungsgleichung, 401 charakteristische Projektion, 174, 185
Wellengleichung, 453 charakteristische Umgebung, 175
Anfangswertproblem, 28
Dichteoperator, 638
als Integralgleichung, 30
Differentialgleichung
für DG n–ter Ordnung, 29
explizite, 28
für die Wärmeleitungsgl., 401
implizite, 28
in Fixpunktform, 30
implizite 1. Ordnung, 183
approximatives Punktspektrum, 572,
quasilineare 1. Ordnung, 172
666
Differentialgleichungssysteme
asymptotisch stabil, 117
1. Ordnung, 199
Atlas, 262
Dirac–Distribution, 307, 309
attraktiv, 117
Dirac–Maß, 481, 512
Außenraum, 326
direkte Summe, 62, 611
Autonome Systeme, 31, 40, 98 Dirichlet
avanciertes Potential, 453 Satz von, 140
Dirichlet–Integral, 359
Banachraum, 215 Dirichlet–Problem, 20, 164, 325
Beobachtungswert Dirichletsches Eigenwertproblem, 372
möglicher, 504, 602, 699, 726 disjunkte Darstellung, 510
Bernoulli–Experiment, 477 diskrete Verteilung, 481
beschränkter Operator, 547 diskretes Spektrum, 683
Bessel–Funktionen, 94, 384 diskretes Wahrscheinlichkeitsmaß, 481
Besselsche DG, 71, 93 dissipativ, 103
Besselsche Ungleichung, 236 Distribution, 307
Betrag eines Operators, 590 Ableitung, 312
Bicharakteristik, 438 reguläre, 307
Bildmaß, 535 singuläre, 308

H. Fischer, H. Kaul, Mathematik für Physiker Band 2,


DOI 10.1007/978-3-658-00477-4, © Springer Fachmedien Wiesbaden 2014
Index 747

temperierte, 319 Fourierintegral, 295


Drehimpulsoperatoren, 722 Fourierkoeffizienten, 139
Duhamelsches Prinzip verallgemeinerte, 235
Wärmeleitungsgleichung, 414 Fourierreihe, 139, 236, 372
Wellengleichung, 451 Fouriertransformation
Ê
auf S  ( n ), 322
Eikonalgleichung, 192, 195 Ê
auf S ( n ), 294
Einbettungssatz Ê
auf L2 ( n ), 298
von Morrey–Sobolew, 369 Ê
auf L1 ( n ), 286
Eindeutigkeitssatz Fouriertransformierte, 286
für gewöhnliche DG, 34 Frobenius–Methode, 81
eingesperrtes Teilchen, 627, 657, 687 Fundamentallemma, 233
Elementarfunktionen, 205, 509 der Variationsrechnung, 252
Energie (Wellengleichung), 431 Fundamentalmatrix, 44, 55
Energieerhaltungssatz, 102, 432 Fundamentalsystem, 44, 55, 68
Erhaltungsgröße, 102 Funktional
erstes Integral, 102, 124 lineares, stetiges, 230
Erwartungswert, 470, 474, 475, 483, 706, Funktionalkalkül
708 allgemeiner, 614, 615, 704
transformierter Zufallsgrößen, 484, für F, 703
535 für die Klasse F , 592
erzeugende Funktion, 76 für Polynome, 580
erzeugte σ–Algebra, 494 für stetige Funktionen, 582, 703
Eulersche DG, 73, 81
Eulersche DG (Strömungsmechanik), Gauß–Verteilung, 490
22 Gaußscher Integralsatz, 273
Existenz– und Eindeutigkeitssatz Gen, 650
gewöhnliche DG, 37 Genbereich, 650
partielle DG 1. Ordnung, 187 Gesetz der großen Zahl, 489
quasilineares Cauchy–Problem, 175 Gibbsches Phänomen, 141
explizite DG n–ter Ordnung, 28 Glättung, 246
explizite Differentialgleichung, 28 Gleichgewichtspunkt, 100
asymptotisch stabiler, 117
Faltung, 244 attraktiver, 117
Faltungssatz, 292, 296 hyperbolischer, 104
fast überall, 204, 523 instabiler, 117
μ–fast überall, 523 stabiler, 117
Fixpunktform einer DG, 30 globaler Fluß, 131
Fluß Gramsche Determinante, 265, 279
globaler, 131 Gramsche Matrix, 265, 279
Flußabbildung, 128 Graph eines Operators, 645
formal adjungierter Differentialopera- Graphennorm, 649
tor, 275, 277 Greensche Formeln
Formen und Operatoren, 560, 689 verallgemeinerte, 277
für autonome Systeme, 40 Greensche Funktion
fur Prämaße, 500 erster Art, 333
748 Index

zweiter Art, 333, 354 Integralgleichung, 358


Greensche Identitäten, 275 Integralkurven, 100, 438
Grenzwertsatz Integraloperatoren, 357, 551
de Moivre–Laplace, 490 Integration
zentraler, 491 auf Untermannigf., 266
Gronwallsches Lemma, 33 partielle, 220, 274
Grundlösung, 315 invariant
Laplace–Operator, 330 unter einem Fluß, 131
Wärmeleitung, 403 invarianter Teilraum, 701
Invarianz des Laplace–Operators unter
Höldersche Ungleichung, 216 Bewegungen, 327
halbbeschränkter Operator, 681 Invertierbarkeit in L (H ), 556
Halbfluß, 131 Isomorphiesatz für Hilberträume, 240
Hamilton–Cayley, 65 Isomorphismus
Hamilton–Funktion, 102, 191 unitärer, 222
Hamilton–Operator, 473, 657
Hamiltonsches System, 102, 124 Jordansche Normalform, 66
Hankel–Funktionen, 95
harmonische Funktionen, 164, 327 kanonischen Gleichungen, 192
harmonischer Oszillator (QM), 688 Karte, 259
Harnacksche Ungleichung, 171 Kegelbedingung, äussere, 350
Hauptsatz (Lebesgue), 220 Kelvin–Transformation, 343
Heisenbergsche Unschärferelation, 707 klassische Lösung, 304
Hermite–Funktionen, 300, 688 kleine Störung, 692
Hermite–Polynome, 77, 300 Knickstelle, 139
Hermitesche DG, 71, 77, 300 Kommutator, 617
Hilbertraum, 221 kompakte Operatoren, 358, 617, 684
Hilbertraumisomorphismus, 222 kompatible Observable, 727
Hilbertscher Folgenraum, 223 kontinuierliches Spektrum, 568, 665
Hilbertsches Lemma, 254 Konvergenz
Huygenssches Prinzip μ–f.ü., 518
geometrische Optik, 193 im Distributionensinn, 309
Wellengleichung, 448 im Quadratmittel, 214
hyperbolischer Gleichgewichtspunkt, 104 in der Operatornorm, 562
hypergeometrische DG, 97 schwache, 563
starke, 562
ideale Messungen, 640 Koordinatentransformation, 261, 279
implizite Differentialgleichung, 28 Kosinusreihe, 146
Impulsoperatoren, 287, 473, 475, 642, kritischer Punkt (Vektorfeld), 100
656, 675, 678, 717 Kugelfunktionen, 384
Indexgleichung, 83
Innenraum, 326 L2 –Funktion, 213
instabil, 117 Lp –Raume, 215
Integral Lösung
erstes, 102 maximale, 37
integraldefinierende Folge, 519 Lagrange–Funktion, 191
Index 749

Lagrange–Identitat, 72 maximale Lösung, 37


Laguerre–Polynome, 91 Maximumprinzip
zugeordnete, 91 Dirichlet–Problem, 170
Laguerresche DG, 90 für holomorphe Funktionen, 340
Laplace–Beltrami–Operator, 393 Laplace–Operator, 327
Laplace–Gleichung, 20, 326 strenges, 327, 339, 407
Laplace–Operator, 325, 326, 690 subharmonische Funktionen, 339
Ê
auf dem n , 680 Wärmeleitung, 161, 404, 405
Ê
auf dem n , 673 Maxwellsche Gleichungen, 20
in Kugelkoordinaten, 280, 391 meßbar
in Polarkoordinaten, 164 Lebesgue–, 203
Lebesgue meßbare Funktionen, 205, 514, 519
Satz von, 528 meßbare Menge, 496, 508
Lebesgue–Integral, 206, 530 Meßwert
Lebesgue–Maß, 203, 503 möglicher, 504, 602, 699, 726
Legendre–Funktionen Messung
zugeordnete, 88, 393 ideale, 640
Legendre–Polynome, 76, 239, 393 scharfe, 602, 727
Legendresche DG, 71 Minimalpolynom, 61
allgemeine, 87 Minkowskische Ungleichung, 216
Leibnizregel, 245 Mischung von Wahrscheinlichkeitsma-
Lemma von du Bois–Reymond, 252 ßen, 505
linear beschränkte Systeme, 42 Mittelwerteigenschaft
lineare DG harmonischer Funktionen, 338
n–ter Ordnung, 67 μ–Integral, 511, 519, 520
mit konstanten Koeffizienten, 68 μ–integrierbar, 519
lineare Systeme μ–Majorante, 524
gewöhnlicher DGn, 31, 55 μ–Nullmenge, 502
komplexe Lösungen, 59 Multiindex, 244
konstante Koeffizienten, 58 Multiplikatordarstellung, 607, 613, 699
linearisierte DG, 48 Multiplikatoren
Linearisierungssatz auf 2 , 552, 646
von Grobman–Hartman, 104 auf L2 (Ω, μ), 553, 647
Linksshift, 550
Lipschitz–Bedingung, 31 Navier–Stokes–Gleichungen, 22
Ljapunow–Funktion, 121 Neumann–Problem, 20, 159, 325
lokalintegrierbar, 217 für Außenräume, 354
für Innenräume, 353
Maß, 496 Neumann–Funktionen, 95
σ–endliches, 496 Neumannsche Reihe, 575
endliches, 496 Neumannsches Eigenwertproblem, 373
Majorantenkriterium, 524 Newton–Potential, 330
majorisierte Konvergenz, 528 nichtentartetes Spektrum, 605, 606
Mannigfaltigkeit Normalgebiet, 273
orientierbare, 263 Normalverteilung, 491
maximal symmetrisch, 646 Normkonvergenz (Operatoren), 562
750 Index

Normschranke, 547 Fehlerabschätzung, 36


Nullmenge, 204 Plancksches Wirkungsquantum, 465
Poincaré–Ungleichung, 363
Oberflächeninhalt, 267 Poisson–
Observable, 473, 723 Gleichung, 20, 326
kompatible, 727 Integral, 167, 336
ONS, Orthonormalsystem, 233 Kern, 167, 336
vollständiges, 236, 237 Verteilung, 479
Operator Poissonsche Darstellungsformel (Wel-
abgeschlossener, 649 lengleichung), 447
abschließbarer, 648 Polarisierungsgleichung
adjungierter, 557, 659 für Formen, 560
beschränkter, 547 für Operatoren, 561
halbbeschränkter, 681 Polarzerlegung, 590
kompakter, 358, 617, 684 polynomial beschränkt, 293
linearer, 644 positive Operatoren, 562, 589
mit diskretem Spektrum, 683 Potential
positiver, 562, 589 der doppelten Schicht, 353, 355
selbstadjungierter, 661, 676 der einfachen Schicht, 353, 355
symmetrischer, 558, 644 Potentialtheorie, 355
von endlichem Rang, 617 P ,Q–Gesetz, 287, 294
wesentlich selbstadjungierter, 680 Prämaß, 499
Orbit, 100 Projektor
orientierbare Mannigfaltigkeit, 263 orthogonaler, 228
Orientierung, 263 Punktspektrum, 568, 665
orthogonale Projektion, 226
orthogonaler Projektor, 228 quadratische Form, 560
Orthogonalreihe, 234 Quantisierung, 473, 722, 723
Orthonormalsystem, 233 quasilineare DG, 172
Ortsoperatoren, 287, 473, 475, 642, 717 quasilineare DG 1. Ordnung, 172

Parameterintegrale, 210 Radon–Nykodym, 532


Parametertransformation, 261 Randwertproblem
Parameterumgebung, 259 erstes, 325
Parametrisierung zweites, 325
einer Untermannigf., 259 Rayleigh–Prinzip, 377, 622
Parseval–Plancherel–Formel, 298 Rechtsshift, 550
Parsevalsche Gleichung, 236 regulär im Unendlichen, 344
partielle Integration, 220, 274 regulärer Randpunkt, 272
Pendel, 103, 116, 130 Regularisierung, 246
periodische Standardfortsetzung, 140 Regularitätssatz (Dirichlet–Problem),
Phasenbild, 101 370
Phasenportrait, 101 relative Häufigkeit, 481
Phasenraum, 100 Rellichscher Auswahlsatz, 364
Picard–Iterierte, 34 Resolvente, 568, 576, 664, 669
Picard–Lindelöf, 34 Resolventenmenge, 568, 664
Index 751

Restspektrum, 568, 665 selbstadjungierte Operatoren, 661, 676


retardiertes Potential, 452 selbstadjungierter Differentialoperator,
Riemann–Stieltjes–Summen, 533 275
Riesz–Fréchet separabler Raum, 218, 544
Darstellungssatz, 231 Separationsmethode, 70, 134, 150
Rodrigues–Formel, 76, 78, 91 Sesquilinearform, 560
σ–Additivität, 203, 482, 496
Satz von σ–Algebra, 203, 493
Beppo Levi (monotone Konver- erzeugte, 494
genz), 208, 525 singuläre DG 2. Ordnung, 14
Cayley–Hamilton, 65 Singularitäten
der gleichmäßigen Beschränktheit, schwache, 80, 437
564 Sinusreihe, 146
der monotonen Konvergenz, 525, Sobolew–Räume, 362
566 spektraler Abbildungssatz, 580, 584
Dirichlet, 140 spektraler Teilraum, 701
Fischer–Riesz, 214, 539 Spektralmaß, 597, 705, 708
Fubini, 211
Spektralprojektor, 701
Hellinger und Toeplitz, 646
Spektralsatz
Hilbert–Schmidt, 622
beschränkte symm. Op., 599
Kato–Rellich, 693
kompakte symm. Op., 622
Lebesgue (kleiner), 529
selbstadjungierte Op., 705
Lebesgue (majorisierte Konvergenz),
Spektralschar, 596, 705
208, 528
Spektralzerlegung, 598, 702
Radon–Nykodym, 532
Spektrum, 568, 664
Stone, 718
approximatives Punkt–, 572, 666
Tietze–Uryson, 256
diskretes, 683
Tonelli, 212
scharfe Messung, 602, 727 in der Physik, 470, 574
schnellfallende Funktionen, 292 kontinuierliches, 568, 665
Schrödinger–Gleichung, 24, 467, 687 nichtentartetes, 605, 606
Schrödinger–Operator, 691, 697 Punkt–, 568, 665
schwach meßbar, 416 Rest–, 568, 665
schwache Ableitung, 361 und mögliche Messwerte, 726
schwache Konvergenz, 563 sphärisches Mittel, 444
schwache Lösung, 303 spherical harmonics, 384
Dirichlet–Problem, 365, 370 Sprungstelle, 139
Wellengleichung, 455 Spur, 633, 635
schwache Losung Spurklasse, 633
Wärmeleitungsgleichung, 420 Störung, kleine, 692
schwache Singularitäten stückweis glatt, 139
lineare DG 2. Ordng., 80 stückweis stetig, 139
Stoßwellen, 436 stabil, 117
Schwartz–Raum, 292 Stabilitätssatz
schwingende Saite, 15, 133, 148 Eigenwertkriterium, 118
inhomogene, 629 Ljapunow, 122
752 Index

Standardabweichung, 486 Vektor


Standardvoraussetzung für GDG, 30 zyklischer, 606
starke Konvergenz, 562 vertauschbare Operatoren, 616, 730
stationärer Punkt (Vektorfeld), 100 Verteilung, 504
statistisches Gemisch, 637, 639 der Beobachtungswerte, 725
Stetigkeit von Maßen, 497 diskrete, 480
Stoßwelle einer Zufallsgröße, 478, 480, 504
schwache, 436 mit Dichte, 490, 491, 532
Streuung, 486, 535 und Verteilungsfunktion, 506
Sturm–Liouville–Form, 71 Verteilungsfunktion, 505
Subadditivität von Maßen, 498 vollständiges ONS, 236, 237
subharmonisch, 339 Vollständigkeit von Lp (Ω, μ), 539
Summe Volumenpotential, 352, 355
direkte, 611
Superpositionsprinzip, 148 Wärmeleitungsgleichung, 19, 401
support, 242 Wärmeleitungskern, 403
symmetrischer Operator, 558, 644 Wärmeleitungsproblem
im Draht, 156
Tangentialraum, 264 in der Kreisscheibe, 164
Teilraum Wahrscheinlichkeitsmaß, 497, 504
A–invarianter, 701 Wahrscheinlichkeitsraum, 497
temperierte Distribution, 319 Weierstraßscher Approx.satz, 148
Testfunktion, 242 Wellenfronten und Strahlen, 441
Tietze–Uryson, 256 Wellenfunktion, 467
Träger, 242, 510 Wellengleichung, 18, 442, 449
Transformationssatz avanciertes Potential, 453
für Bildmaße, 535 inhomogene, 154, 451
Transformationssatz für Integrale, 212 retardiertes Potential, 452
Transversalitätsbedingung, 187 wesentlich selbstadjungiert, 680
Tschebyschewsche Ungleichung, 487 Wirkungsquantum, 465
Tschetajew (Instabilitätssatz), 123 Wronski–Determinante, 56, 68

Umgebung Zerlegungssatz
charakteristische, 175 für Hilberträume, 227
Umkehrsatz (Fouriertransformation), 292, Minimalpolynom, 62
294, 296 Zufallsgröße
unitär äquivalente Operatoren, 222, 614 diskret verteilte, 480
unitäre Abbildung, 221 allgemeine, 504, 536
unitäre Gruppe, 468, 587, 685 Zufallsvariable, 536
unitärer Isomorphismus, 222 Zustand, 466, 472, 724
unitare Gruppe, 715 Zustandsvektor, 472
Ê
Untermannigfaltigkeiten des n , 257 zwiebelweise Integration, 270
zyklischer Teilraum, 608
Varianz, 486, 535, 706, 708 zyklischer Vektor, 606
Variation der Konstanten, 57
Variationsgleichung, 48

Das könnte Ihnen auch gefallen