Sie sind auf Seite 1von 228

Mathematische Methoden der Physik, Teil I

Prof. A. Wipf
Theoretisch-Physikalisches-Institut
Friedrich-Schiller-Universität, Max Wien Platz 1
07743 Jena

4. Auflage, SS 2005
1. Auflage, WS 1997/1998

Hinweise auf Tippfehler und andere Unzulänglichkeiten sind willkommen


(per email an: wipf@tpi.uni-jena.de)
Inhaltsverzeichnis

1 Einführung, Literatur 4

2 Differentialgleichungen 6

2.1 Lineare Systeme mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . 6

2.1.1 Die allgemeine (formale) Lösung . . . . . . . . . . . . . . . . . . . . . 7

2.1.2 Wichtige Spezialfälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.3 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . 13

2.2 Lineare Systeme mit variablen Koeffizienten . . . . . . . . . . . . . . . . . . . 14

2.2.1 Formale Lösung durch Dysonreihe . . . . . . . . . . . . . . . . . . . . 15

2.2.2 Inhomogene lineare Differentialgleichungen . . . . . . . . . . . . . . . 16

2.3 Nichtlineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.1 Einige einfache und exakt lösbare nichtlineare DG . . . . . . . . . . . 19

2.3.2 Räuber-Beute Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.3 Stabilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.4 Liapunov Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.5 Lineare Stabilität bedingt Stabilität . . . . . . . . . . . . . . . . . . . 24

2.4 Periodische Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.4.1 Mathieusche Differentialgleichung, Blochwellen und Stabilität . . . . . 28

2.4.2 Feigenbaumbifurkation . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1
Inhaltsverzeichnis Inhaltsverzeichnis 2

3 Spezielle Funktionen 33

3.1 Die Legendresche Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Orthogonale Polynome in Hilberträumen . . . . . . . . . . . . . . . . . . . . . 38

3.2.1 Zugeordnete Legendrefunktionen oder Kugelfunktionen . . . . . . . . 41

3.3 Der Satz von Fuchs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4 Integraltransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.5 Besselfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.6 Hypergeometrische Differentialgleichung . . . . . . . . . . . . . . . . . . . . . 53

4 Gruppen 55

4.1 Beispiele von Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.1 Endliche Gruppen, SN : . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.2 Liesche Gruppen, SU (2) . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2 Elemente der Gruppentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.1 Untergruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.2 Konjugationsklassen: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5 Darstellungen 65

5.1 Äquivalenz von Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2 Reduzibilität von Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.3 Mittelbildung und Haarsches Maß . . . . . . . . . . . . . . . . . . . . . . . . 70

5.3.1 Mittelbildung für kompakte Lie-Gruppen . . . . . . . . . . . . . . . . 71

5.3.2 Unitäre und orthogonale Gruppen . . . . . . . . . . . . . . . . . . . . 73

5.4 Klassenfunktionen und Charaktere . . . . . . . . . . . . . . . . . . . . . . . . 75

5.4.1 Tensorprodukt von Darstellungen . . . . . . . . . . . . . . . . . . . . . 76

5.5 Lemma von Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.5.1 Orthogonalitätsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . 83

————————————
A. Wipf, Mathematische Methoden der Physik
Inhaltsverzeichnis Inhaltsverzeichnis 3

5.6 Alle Darstellungen einer endlichen Gruppe . . . . . . . . . . . . . . . . . . . . 87

5.7 Die Charakterenmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.8 Die Charakteren von kompakten Lie-Gruppen . . . . . . . . . . . . . . . . . . 91

5.8.1 Die Charakter von U (1): . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.8.2 Die Charakter von SU (2) . . . . . . . . . . . . . . . . . . . . . . . . . 92

6 Lie-Algebren 96

6.1 Die Lie-Algebra su(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2 Lie-Algebren von Lie-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.3 Die Lie-Algebra von SU (3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.4 Darstellungen von Lie-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6.5 Wurzeln eine Lie-Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6.6 Gewichte einer Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 1

Einführung, Literatur

Diese Vorlesung richtet sich an Studenten im fünften Semester. Sie sollen hier die für das
Verständnis der Physikvorlesungen notwendigen mathematischen Werkzeuge vertiefen. Die
Vorlesung besteht aus vier Kapiteln:

• Differentialgleichungen und spezielle Funktionen (Wipf)


• Symmetrien und Liegruppen/Liealgebren (Wipf)
• Stochastische Prozesse (Neugebauer)
• Einführung in wahrscheinlichkeitstheoretische Methoden (Neugebauer).

Dieses Skript enthält die ersten beiden Kapitel (Teil 1) der Vorlesung. Folgende Literatur
kann für diesen Teil empfohlen werden:

Methoden der Mathematische Physik:

R. Courant und D. Hilbert, Methoden der Mathematischen Physik I und II; 2. Auflage,
Heidelberger Taschenbücher, Springer 1968
W.I. Smirnov, Lehrgang der Höheren Mathematik, VEB Deutscher Verlag der Wissen-
schaften 1963-71
H. Fischer und H. Kaul, Mathematik für Physiker, Teubner Studienbücher, 1998
H. Margenau und G.M. Murphy, Die Mathematik für Physik und Chemie, Teubner
1964

Gewöhnliche Differentialgleichungen, spezielle Funktionen:

W. Walter, Gewöhnliche Differentialgleichungen – Eine Einführung –, Heidelberger Ta-


schenbücher, Springer 1993

4
Kapitel 1. Einführung, Literatur 5

E. Kamke, Differentialgleichungen, Lösungsmethoden und Lösungen, 7. Auflage, Akademi-


sche Verlagsgesellschaft, Geest & Portig, K.G., Leipzig 1961
V.I. Arnold, Gewöhnliche Differentialgleichungen, Springer 1980
V.I. Arnold, Geometrical Methods in the Theory of Ordinary Differential Equations,
Springer 1983
M.W. Hirsch und S. Smale, Differential Equations, Dynamical Systems and Linear Al-
gebra, Academic Press 1974
H. Stephani, Differentialgleichungen, Spektrum 1994
M. Abramovitz und I.A. Stegun, Handbook of Mathematical Functions, Dover 1970
A. Erdelyi, W. Magnus, F. Oberhettinger und F.G. Tricomi, Higher Transcenden-
tal Functions I-III, Mc Graw-Hill Book Comp. 1953

Liegruppen, Liealgebren und Darstellungen:

H. Georgi, Lie Algebras in Particle Physics, Reading, Benjamin 1982


M. Hamermesh, Group Theory and its Application to Physical Problems, Dover 1989
V. Heine, Group Theory in Quantum Mechanics, Dover 1993
W. Ludwig und C. Falter, Symmetries in Physics: Group Theory Applied to Physial
Problems, Springer 1996
E. Wigner, Group Theory and its Application to the Quantum Mechanics of Atomic Spec-
tra, Academic Press 1959
J. Tits, Liesche Gruppen und Algebren, Springer 1992
H. Weyl, Gruppentheorie und Quantenmechanik, Hirzel-Verlag, 1928
M. Wagner, Gruppentheoretische Methoden in der Physik, Vieweg 1998

————————————
A. Wipf, Mathematische Methoden der Physik
Mathematische Methoden der Physik, Teil I

Prof. A. Wipf
Theoretisch-Physikalisches-Institut
Friedrich-Schiller-Universität, Max Wien Platz 1
07743 Jena

4. Auflage, SS 2005
1. Auflage, WS 1997/1998

Hinweise auf Tippfehler und andere Unzulänglichkeiten sind willkommen


(per email an: wipf@tpi.uni-jena.de)
Inhaltsverzeichnis

1 Einführung, Literatur 4

2 Differentialgleichungen 6

2.1 Lineare Systeme mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . 6

2.1.1 Die allgemeine (formale) Lösung . . . . . . . . . . . . . . . . . . . . . 7

2.1.2 Wichtige Spezialfälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.3 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . . . . 13

2.2 Lineare Systeme mit variablen Koeffizienten . . . . . . . . . . . . . . . . . . . 14

2.2.1 Formale Lösung durch Dysonreihe . . . . . . . . . . . . . . . . . . . . 15

2.2.2 Inhomogene lineare Differentialgleichungen . . . . . . . . . . . . . . . 16

2.3 Nichtlineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.1 Einige einfache und exakt lösbare nichtlineare DG . . . . . . . . . . . 19

2.3.2 Räuber-Beute Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.3 Stabilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.4 Liapunov Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.5 Lineare Stabilität bedingt Stabilität . . . . . . . . . . . . . . . . . . . 24

2.4 Periodische Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.4.1 Mathieusche Differentialgleichung, Blochwellen und Stabilität . . . . . 28

2.4.2 Feigenbaumbifurkation . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1
Inhaltsverzeichnis Inhaltsverzeichnis 2

3 Spezielle Funktionen 33

3.1 Die Legendresche Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Orthogonale Polynome in Hilberträumen . . . . . . . . . . . . . . . . . . . . . 38

3.2.1 Zugeordnete Legendrefunktionen oder Kugelfunktionen . . . . . . . . 41

3.3 Der Satz von Fuchs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4 Integraltransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.5 Besselfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.6 Hypergeometrische Differentialgleichung . . . . . . . . . . . . . . . . . . . . . 53

4 Gruppen 55

4.1 Beispiele von Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.1 Endliche Gruppen, SN : . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.2 Liesche Gruppen, SU (2) . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2 Elemente der Gruppentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.1 Untergruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.2 Konjugationsklassen: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5 Darstellungen 65

5.1 Äquivalenz von Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2 Reduzibilität von Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.3 Mittelbildung und Haarsches Maß . . . . . . . . . . . . . . . . . . . . . . . . 70

5.3.1 Mittelbildung für kompakte Lie-Gruppen . . . . . . . . . . . . . . . . 71

5.3.2 Unitäre und orthogonale Gruppen . . . . . . . . . . . . . . . . . . . . 73

5.4 Klassenfunktionen und Charaktere . . . . . . . . . . . . . . . . . . . . . . . . 75

5.4.1 Tensorprodukt von Darstellungen . . . . . . . . . . . . . . . . . . . . . 76

5.5 Lemma von Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.5.1 Orthogonalitätsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . 83

————————————
A. Wipf, Mathematische Methoden der Physik
Inhaltsverzeichnis Inhaltsverzeichnis 3

5.6 Alle Darstellungen einer endlichen Gruppe . . . . . . . . . . . . . . . . . . . . 87

5.7 Die Charakterenmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.8 Die Charakteren von kompakten Lie-Gruppen . . . . . . . . . . . . . . . . . . 91

5.8.1 Die Charakter von U (1): . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.8.2 Die Charakter von SU (2) . . . . . . . . . . . . . . . . . . . . . . . . . 92

6 Lie-Algebren 96

6.1 Die Lie-Algebra su(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2 Lie-Algebren von Lie-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.3 Die Lie-Algebra von SU (3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.4 Darstellungen von Lie-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6.5 Wurzeln eine Lie-Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6.6 Gewichte einer Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 1

Einführung, Literatur

Diese Vorlesung richtet sich an Studenten im fünften Semester. Sie sollen hier die für das
Verständnis der Physikvorlesungen notwendigen mathematischen Werkzeuge vertiefen. Die
Vorlesung besteht aus vier Kapiteln:

• Differentialgleichungen und spezielle Funktionen (Wipf)


• Symmetrien und Liegruppen/Liealgebren (Wipf)
• Stochastische Prozesse (Neugebauer)
• Einführung in wahrscheinlichkeitstheoretische Methoden (Neugebauer).

Dieses Skript enthält die ersten beiden Kapitel (Teil 1) der Vorlesung. Folgende Literatur
kann für diesen Teil empfohlen werden:

Methoden der Mathematische Physik:

R. Courant und D. Hilbert, Methoden der Mathematischen Physik I und II; 2. Auflage,
Heidelberger Taschenbücher, Springer 1968
W.I. Smirnov, Lehrgang der Höheren Mathematik, VEB Deutscher Verlag der Wissen-
schaften 1963-71
H. Fischer und H. Kaul, Mathematik für Physiker, Teubner Studienbücher, 1998
H. Margenau und G.M. Murphy, Die Mathematik für Physik und Chemie, Teubner
1964

Gewöhnliche Differentialgleichungen, spezielle Funktionen:

W. Walter, Gewöhnliche Differentialgleichungen – Eine Einführung –, Heidelberger Ta-


schenbücher, Springer 1993

4
Kapitel 1. Einführung, Literatur 5

E. Kamke, Differentialgleichungen, Lösungsmethoden und Lösungen, 7. Auflage, Akademi-


sche Verlagsgesellschaft, Geest & Portig, K.G., Leipzig 1961
V.I. Arnold, Gewöhnliche Differentialgleichungen, Springer 1980
V.I. Arnold, Geometrical Methods in the Theory of Ordinary Differential Equations,
Springer 1983
M.W. Hirsch und S. Smale, Differential Equations, Dynamical Systems and Linear Al-
gebra, Academic Press 1974
H. Stephani, Differentialgleichungen, Spektrum 1994
M. Abramovitz und I.A. Stegun, Handbook of Mathematical Functions, Dover 1970
A. Erdelyi, W. Magnus, F. Oberhettinger und F.G. Tricomi, Higher Transcenden-
tal Functions I-III, Mc Graw-Hill Book Comp. 1953

Liegruppen, Liealgebren und Darstellungen:

H. Georgi, Lie Algebras in Particle Physics, Reading, Benjamin 1982


M. Hamermesh, Group Theory and its Application to Physical Problems, Dover 1989
V. Heine, Group Theory in Quantum Mechanics, Dover 1993
W. Ludwig und C. Falter, Symmetries in Physics: Group Theory Applied to Physial
Problems, Springer 1996
E. Wigner, Group Theory and its Application to the Quantum Mechanics of Atomic Spec-
tra, Academic Press 1959
J. Tits, Liesche Gruppen und Algebren, Springer 1992
H. Weyl, Gruppentheorie und Quantenmechanik, Hirzel-Verlag, 1928
M. Wagner, Gruppentheoretische Methoden in der Physik, Vieweg 1998

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2

Differentialgleichungen

2.1 Lineare Systeme mit konstanten Koeffizienten

Systeme von Differentialgleichungen

ẇ1 = a11 w1 + a12 w2 + . . . + a1n wn


ẇ2 = a21 w1 + a22 w2 + . . . + a2n wn
.. .. ⇐⇒ ẇ = Aw (2.1)
. .
ẇn = an1 w1 + an2 w2 + . . . + ann wn

mit konstantem Koeffizienten aij treten in vielen Problemen auf. Einfache Ratengleichun-
gen, Hamiltonsche Bewegungsgleichungen oder Schrödingergleichungen (mit endlich vielen
Freiheitsgraden) sind Beispiele dafür. Die kovariante Form der Bewegungsgleichung für ein
relativistisches Teilchen im äußeren elektromagnetischen Feld,

duµ e µ ν
= F u , (2.2)
dτ mc ν
wobei m die Masse, τ die Eigenzeit, uµ = ẋµ = γ(c, ~v ) die Vierer-Geschwindigkeit des
Teilchen und
0 E1 E2 E3
 
E 0 B3 −B2 
F µν =  1
E2 −B3 0 B1

E3 B2 −B1 0

~ B)
der Feldstärketensor ist, ist für konstantes (E, ~ eine Differentialgleichungssystem mit kon-

6
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 7

stanten Koeffizienten. Auch bei der Untersuchung von einparametrigen Untergruppen von
Lie-Gruppen werden wir diesen einfachen Differentialgleichungen wieder begegnen.

Eine Lösung des Systems

ẇ = Aw, w ∈ V, A ∈ L(V ), (2.3)

wobei V ein n-dimensionaler Vektorraum mit Skalarprodukt ist (z.B. V = Rn oder V = C n ),


ist durch die Angabe des Anfangswertes

w(0) = w0 ∈ V (2.4)

eindeutig bestimmt. Da es n linear unabhängige Vektoren w(0) gibt und Linearkombinatio-


nen von Lösungen wieder Lösungen sind, gibt es n unabhängige Lösungen.

2.1.1 Die allgemeine (formale) Lösung

Bei der Lösungssuche wollen wir benutzen, daß w(t) genau dann eine Lösung von (2.3,2.4)
ist, wenn es die Integralgleichung

Zt
w(t) = w0 + A w(t1 )dt1 (2.5)
0

löst. Diese Integralgleichung lösen wir nun iterativ. In der nullten Näherung ist w0 (t) = w0 .
Dies setzen wir in der rechten Seite in (2.5) ein und erhalten die erste Näherung
Zt
w1 (t) = w0 + Aw0 dt1 = w0 + A w0 t.
0

Nun benutzen wir w1 (t) in der rechten Seite in (2.5) und erhalten die zweite Näherung
Zt
1
w2 (t) = w0 + A w1 (t1 )dt1 = w0 + A w0 t + A2 w0 .
2
0

Nach n Iterationen finden wir


n
X tp
wn (t) = Ap w0 .
p=0
p!

Wir wollen uns nun davon überzeugen, daß die rechte Seite konvergiert. Dazu erinnern wir
uns daran, daß L(V ), versehen mit der Norm
kAk = max |Aw|, |w| = (w, w)1/2 ,
|w|=1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 8

ein vollständiger Vektorraum ist. Wegen

kA + Bk = max |(A + B)w| ≤ max(|Aw| + |Bw|) ≤ max |Aw| + max |Bw|

erfüllt die Norm die Schwartzsche Ungleichung

kA + Bk ≤ kAk + kBk (2.6)

und aus der Definition der Norm folgt auch (|w| = 1)

|ABw| = |A(Bw)| ≤ kAk |Bw| ≤ kAk kBk =⇒ kABk ≤ kAk kBk , kAp k ≤ kAkp .

Damit ist
∞ p
X t
Ap = etA
0
p!

eine absolut konvergente Reihe für jeden linearen Operator A. Also konvergiert wn (t) gegen
die Lösung

∞ p
X t
w(t) = Ap w0 ≡ eAt w(0). (2.7)
0
p!

Durch direktes Nachrechnen kann man sich auch davon überzeugen, daß w(t) = exp(tA)w(0)
die Differentialgleichung (2.3) löst1 . Wir sehen auch, daß w(t) eine in t analytische Funktion
ist. In anderen Koordinaten w̃, die mit den w linear zusammenhängen,

w̃1 = s11 w1 + s12 w2 + . . . + s1n wn


w̃2 = s21 w1 + s22 w2 + . . . + s2n wn
.. .. ⇐⇒ w̃ = Sw, (2.8)
. .
w̃n = sn1 w1 + sn2 w2 + . . . + snn wn

wobei S eine reguläre Matrix ist, det S 6= 0, sieht das Differentialgleichungssystem folgen-
dermassen aus:

w̃˙ = S ẇ = SAw = SAS −1 w̃ = Dw̃.

Damit ist die Lösung in den w̃-Koordinaten

w̃(t) = eDt w̃(0), D = SAS −1 . (2.9)

1 Zeige, das (2.7) die Differentialgleichung (2.3) löst.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 9

2.1.2 Wichtige Spezialfälle

Wir wollen jetzt einige wichtige Spezialfälle diskutieren.

V = C n und A diagonalisierbar: In der linearen Algebra zeigt man, daß eine Matrix B (im
Komplexen) diagonalisierbar ist, wenn die Nullstellen λi des charakteristischen Polynoms

p(λ, B) = det(λ − B) = λn − Sp (B)λn−1 + . . . + (−)n det B


(2.10)
= (λ − λ1 )(λ − λ2 ) · · · (λ − λn )

verschieden sind. Sind also die Nullstellen des Polynoms p(λ, A) verschieden, dann können
wir eine Matrix S finden, so daß SAS −1 = D diagonal ist, D =diag(λ1 , . . . , λn ). In den
w̃-Koordinaten ist die Lösung dann einfach

w̃(t) = eDt w̃(0) ⇐⇒ w̃i (t) = eλi t w̃i (0), i = 1, . . . , n. (2.11)

Da die w̃i vollständig entkoppeln, genügt es das Verhalten einer Komponente w̃i = w̃ zu
betrachten. Zerlegen wir w̃ in Real- und Imaginärteil, w̃ = u + iv, so schreibt sich die Lösung
wie
    
u(t) tℜλ cos tℑλ − sin tℑλ u(0)
=e .
v(t) sin tℑλ cos tℑλ v(0)
Wir wollen die qualitativ verschiedenen Möglichkeiten etwas näher anschauen: Verschwindet
der Imaginärteil des Eigenwertes, dann ist der Fixpunkt w = 0 für λ > 0 ein Quelle und
für λ < 0 eine Senke. Im ersten Fall ist w = 0 ein instabiler, im zweiten Fall ein stabiler
Fixpunkt der Differentialgleichung. Ist der Eigenwert dagegen rein imaginär, dann ist w = 0
ein Zentrum. Die Lösungen w(t) sind periodisch mit derselben Periode und rotieren um den
Fixpunkt. Ist ℜλ > 0 und ℑλ 6= 0 dann liegt ein auslaufender Strudel und für ℜλ < 0 ein
einlaufender Strudel vor.

Haben alle Eigenwerte λi einen negativen Realteil, dann ist w = 0 ein stabiler Fixpunkt.
Sind alle Realteile positiv, dann ist w = 0 ein instabiler Fixpunkt. Die Punkte w(t) laufen
dann von der Lösung w = 0 weg.

V = C n , A beliebig

Hat das charakteristische Polynom P (λ, A) von A mehrfache Nullstellen, dann ist A im
Allgemeinen nicht diagonalisierbar. Das charakteristische Polynom hat dann die Form
r
Y
p(λ, A) = det(λ − A) = λ − λk )nk ,
k=1

wobei λ1 , . . . , λr die verschiedenen Nullstellen von p sind und die nk > 0 ihre Vielfachheiten.
Wir definieren die verallgemeinerten Eigenräume von A zu den λk als die Unterräume

Vk = Kern A − λk )nk ⊂ V.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 10

Abbildung 2.1: Senke, Quelle, Zentrum und Strudel

Ein Vektor w ist also genau in Vk falls (A − λk )nk w = 0 ist. Offensichtlich ist mit w auch
Aw in Vk . Damit ist A : Vk → Vk . Nun gilt folgender Satz:

Satz: Sei A ∈ L(V ), wobei V ein komplexer Vektorraum ist. Dann ist V die direkte Summe
der verallgemeinerten Eigenräume Vk und dimVk = nk .

Wir wollen sehen, was diese Zerlegung impliziert. Wir nehmen zuerst an, daß das charakte-
ristische Polynom von A nur eine Nullstelle λ der Vielfachheit n hat und setzen

A = λ + N ≡ D + N.

Offensichtlich gilt [D, N ] = 0 und D ist diagonal in jeder Basis. Wegen (A − λ) = N ist Kern
N n = V und damit ist N nilpotent, N n = 0. Also gilt
n−1
X Np p
etA = etλ t .
p=0
p!

Daher kann das System ẇ = Aw leicht gelöst werden.

Beispiel: Sei

ẇ1 = w1 − w2 , ẇ2 = w1 + 3w2 . (2.12)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 11

Die zugehörige Matrix A hat das charakteristische Polynom (λ − 2)2 . Damit gilt
     
1 −1 2 0 −1 −1
A= = + = λ + N.
1 3 0 2 1 1

Man rechnet leicht nach, daß in der Tat N 2 = 0 ist, so daß


 
1 − t −t
etA = e2t 1 + tN = e2t

t 1+t

und damit lautet die allgemeine Lösung der Differentialgleichung (2.12)

w1 (t) = e2t (1 − t)w1 (0) − tw2 (0)




w2 (t) = e2t tw1 (0) + (1 + t)w2 (0) .




Im allgemeinen Fall von mehr als einer Nullstelle von p(λ, A) setzten wir Ak = A|Vk . Jedes
Ak hat nur einen Eigenwert und damit gilt

Ak = Dk + Nk , Dk , Nk ∈ L(Vk ), [Dk , Nk ] = 0, Nknk = 0.

Damit gilt der

Satz: Jeder lineare Operator in A ∈ L(C n ) hat die Zerlegung

A = D + N, D = D1 ⊕ . . . ⊕ Dr , N = N1 ⊕ . . . ⊕ Nk .

Es gilt [D, N ] = 0, N nilpotent und D diagonalisierbar. Man kann zeigen, daß A die Ope-
ratoren D und N eindeutig bestimmt.

Beispiel: Es sei

 
−1 1 −2
A =  0 −1 4  =⇒ p(λ, A) = (λ + 1)2 (λ − 1). (2.13)
0 0 1

Damit hat A den zweifachen Eigenwert −1 und den einfachen Eigenwert 1. Wegen
   
0 0 0 −2 1 −2
(A + 1)2 =  0 0 8  und (A − 1) =  0 −2 4 
0 0 4 0 0 0

sind die verallgemeinerten Eigenräume

V1 = span{ẽ1 = e1 , ẽ2 = e2 } und V2 = span{ẽ3 = 2e2 + e3 }.


−1
Setzen wir wi ei = w̃i ẽi wobei ẽi = Sji ej , so ist w̃ = Sw und damit geht ẇ = Aw über in
 
1 0 0
w̃˙ = (SAS −1 )w̃ = Ãw̃, wobei S =  0 1 −2 
0 0 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 12

ist. Nach unserem allgemeinem Theorem ist


     
−1 1 0 −1 0 0 0 1 0
à =  0 −1 0  =  0 −1 0  +  0 0 0  = D̃ + Ñ
0 0 1 0 0 1 0 0 0

die Summe eines diagonalen und nilpotenten Operators. Wir schließen, daß
   
−1 0 0 0 1 −2
A = D + N =  0 −1 4  +  0 0 0  , [D, N ] = 0, N 2 = 0.
0 0 1 0 0 0

Um exp(tA) zu berechnen, benutzen wir, daß


 −t
te−t −2te−t

e
etA S −1 età S = S −1 etD̃ e−t 2(et − e−t )  .

= 1 + tÑ S =  0
0 0 et

Damit wäre auch die Differentialgleichung mit Matrix A in (2.13) gelöst.

V = Rn und allgemeines A: Jeden linearen Operator A ∈ L(Rn ) können als linearen


Operator auf L(C n ) auffassen. Dort hat er die Eigenschaft Ā = A. In C n können wir obiges
Resultat anwenden:

A = D + N =⇒ Ā = A = D̄ + N̄ .

Da aber die (D, N )-Zerlegung eindeutig ist, schließen wir, daß D̄ = D und N̄ = N ist. A
kann also in ein reelles und im Komplexen diagonalisierbares D und ein reelles nilpotentes
N zerlegt werden. Dann gibt es eine reelle Basis in Rn , so daß
 
a −b
 
D = diag λ1 , . . . , λr , D(λr+1 ), . . . , D(λs ) , D(λ) = , λ = a + ib,
b a

wobei λ1 , . . . , λr die reellen Eigenwerte von A und λr+1 , . . . , λs die komplexen Eigenwerte
sind. exp(tD) ist einfach zu berechnen, da
 
cos tb − sin tb
etD(λ) = eta
sin tb cos tb

ist.

Übung: Berechne etA für die Matrix

0 −1 0 0
 
1 0 0 0 
A=
0 0 0 −1

2 0 1 0

mit p(λ, A) = 1 + 2λ2 + λ4 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 13

A antihermitesch oder antisymmetrisch: Ein für die Physik wichtiger Spezialfall ist
gegeben, wenn A antihermitesch ist, A† = −A. In diesem Falle kann A mit einer unitären
Matrix S diagonalisiert werden (da iA hermitesch ist) und alle Eigenwerte sind rein imaginär.
Damit ist auch exp(Dt) unitär und

w(t) = eAt w(0) = S −1 eDt Sw(0) = U (t)w(0), U (t) unitär.

Es sei nun V = Rn und A antisymmetrisch, At = −A. Wegen


d   
w(t), w(t) = Aw(t), w(t) + w(t), Aw(t) = 0
dt
ist |w(t)| = |w(0)|. Damit ist R(t) = exp(tA) eine längenerhaltende lineare Abbildung, also
eine Drehung. Aus (2.10) folgern wir für eine beliebiges B, daß
X Y
tr (B) = λi und det B = λi ,

so daß für beliebige Operatoren B die nützliche Identität

log det(B) = tr log(B) (2.14)

folgt. Insbesondere ist


 
det exp(tA) = exp ttr A = 1

und damit ist R(t) eine eigentliche Drehung, det(R) = 1.

2.1.3 Lineare Differentialgleichungen höherer Ordnung

Wir betrachten eine Differentialgleichung höherer Ordnung,

u(n) + a1 u(n−1) + . . . + an−1 u̇ + an u = 0. (2.15)

Hier soll u eine reell- oder komplexwertige Funktion sein und u(n) bezeichnet die n’te Ab-
leitung nach t. Nun führen wir neue Variablen gemäß

w1 = u w2 = ẇ1 . . . wn = ẇn−1

ein. Dann ist die Differentialgleichung (2.15) äquivalent zum System

0 1 0 ... 0
 
.
.. 
 0 0 1


 . .
ẇ = Aw, A =  .. .. .

 0 
 0 0 ... 0 1 
−an −an−1 −an−2 ... −a1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 14

Das charakteristische Polynom von A ist

p(λ, A) = λn + a1 λn−1 + . . . + an .

Mit obigen Resultaten kann man nun zum Beispiel für

ü + au̇ + bu = 0 (2.16)

Folgendes zeigen:

Es seien λ1 , λ2 die Nullstellen des Polynoms λ2 + aλ + b. Dann ist jede Lösung der Differen-
tialgleichung (2.16) von einem der folgenden 3 Typen:

λ1 6= λ2 ∈ R : u(t) = C1 eλ1 t + C2 eλ2 t


λ1 = λ2 = λ ∈ R : u(t) = C1 eλt + C2 teλt
u(t) = eat C1 cos vt + C2 sin vt .

λ1 = λ̄2 = a + ib, b 6= 0 :

Ist im ersten Fall λ1 λ2 > 0, so liegt eine Quelle oder eine Senke (bzw. ein Knoten) vor, ist
λ1 λ2 < 0 dann ein Sattelpunkt. Im zweiten Fall ist w = 0 ein uneigentlicher Knoten und im
letzten Fall ein Zentrum (2.2).

Abbildung 2.2: Sattelpunkt, uneigentlicher Knoten und Knoten.

2.2 Lineare Systeme mit variablen Koeffizienten

Wir wollen jetzt zulassen, daß die Koeffizienten in (2.1) zeitabhängig sind. Auch in diesem
Falle ist das Differentialgleichungssystem zusammen mit der Anfangsbedingung äquivalent
zur Integralgleichung

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 15

Zt
w(t) = w(0) + A(t1 )w(t1 )dt1 . (2.17)
0

2.2.1 Formale Lösung durch Dysonreihe

Genau wie früher lösen wir diese Integralgleichung mit sukzessiver Approximation. Als nullte
Näherung wählen wir wieder x0 = x(0). Nun erhalten wir

 Zt Zt Zt1
w(t) = 1 + dt1 A(t1 ) + dt1 dt2 A(t1 )A(t2 )
0 0 0
(2.18)
Zt Zt1 Zt2 
+ dt1 dt2 dt3 A(t1 )A(t2 )A(t3 ) + . . . w(0).
0 0 0

Dies kann mit Einführung des zeitgeordneten Produktes noch etwas eleganter geschrieben
werden. Es sei
 
T A(t1 ) · · · A(tn ) = A(tπ(1) ) · · · A(tπ(n) ), wobei tπ(1) ≥ · · · ≥ tπ(n)

das zeitgeordnete Produkt von (A(t1 )A(t2 ) · · · A(tn ). Der Operator T der chronologischen
Ordnung verändert also die Reihenfolge der Operatoren, so daß der Operator zur spätesten 
Zeit links steht und der zur frühesten Zeit rechts. Offensichtlich ist T A(t1 ) · · · A(tn ) sym-
metrisch in t1 , . . . , tn . In (2.18) sind die auftretenden Operatoren schon zeitgeordnet, deshalb
können wir die auftretenden Produkte von Operatoren durch die zeitgeordneten Produkte
ersetzen. Benutzen wir noch, daß
Zt Zt Zt1 tZ
n−1

dt1 . . . dtn f (t1 , . . . , tn ) = n! dt1 dt2 . . . dtn f (t1 , . . . , tn )


0 0 0 0

für jede symmetrische Funktion f , so folgt unmittelbar

Zt Zt
h 1  
w(t) = 1 + dt1 A(t1 ) + dt1 dt2 T A(t1 )A(t2 )
2!
0 0
(2.19)
Zt
1   i
+ dt1 dt2 dt3 T A(t1 )A(t2 )A(t3 ) + . . . w(0).
3!
0

Wir können hier T aus der Summe ’herausziehen’ und finden schlußendlich die kompakte
Formel

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 16

∞ Zt
hX 1 i
w(t) = U (t, 0)w(0), U (t, 0) = T dt1 . . . dtn A(t1 ) · · · A(tn ) . (2.20)
n=0
n!
0

Diese Reihenentwicklung für U (t, 0) ist diejenige der Exponentialfunktion und deshalb schreibt
man oft formal
 Zt 
U (t, 0) = T exp A(s)ds .
0

Man soll hier die Exponentialfunktion entwickeln und auf jeden Term den Zeitordnungsope-
rator T anwenden.

Statt den Anfangwert w(0) zur Zeit t = 0 vorzugeben, könnten wir dies auch zu jeder anderen
Zeit t0 machen. Dann lautet die Lösung der Differentialgleichung mit diesem Anfangswert
 Rt 
w(t) = U (t, t0 )w(t0 ) wobei U (t, t0 ) = T exp A(s)ds
t0
d
dt U (t, t0 ) = A(t)U (t, t0 ), U (t0 , t0 ) = 1.
Wegen
w(t) = U (t, s)w(s) = U (t, s)U (s, t0 )w(t0 ) = U (t, t0 )w(t0 )
und der Eindeutigkeit der Lösung, ist
U (t, s)U (s, t0 ) = U (t, t0 ) =⇒ U −1 (t, t0 ) = U (t0 , t).
Die U (t, s) bilden eine einparametrige Gruppe von Transformationen.

2.2.2 Inhomogene lineare Differentialgleichungen

Wir suchen die Lösungen der inhomogenen Differentialgleichung

ẇ = A(t)w + B(t). (2.21)

Wir setzten
 Zt 
w(t) = U (t)f (t), U (t) = T exp A(s)ds .
0

Wegen ẇ = Aw + U f˙ ≡ Aw + B muß offensichtlich f˙ = U −1 B gelten, bzw.


Zt
f (t) = U −1 (s)B(s)ds + K
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 17

mit konstantem K. Damit lautet die allgemeine Lösung der inhomogenen Differentialglei-
chung (2.21)

 Zt 
w(t) = U (t) U −1 (s)B(s)ds + w(0) . (2.22)
0

Beispiel: Die Bewegungsgleichung eines harmonischen Oszillators unter dem Einfluß einer
äußeren Kraft F ist

ü(t) + ω 2 u(t) = f (t),

wobei wir die Masse m = 1 gesetzt haben. Diese Gleichung ist äquivalent zu
   
0 1 0
ẇ = Aw + B, A= , B(t) =
−ω 2 0 f (t)

Wegen A2 = −ω 2 findet man

ω 2 t2 ω 2 t3 1
 
cos ωt sin ωt
U (t) = etA = 1 + tA − − A − ... = ω .
2! 3! −ω sin ωt cos ωt

Damit lautet die Lösung der Differentialgleichung

 Zt 
− ω1 sin ωs
 
At
w(t) = e f (s) + w(0) .
cos ωs
0

Nach einer kurzen Rechnung ergibt sich

Zt
sin ωt 1
u(t) = w1 (t) = u(0) cos ωt + u̇(0) + sin ω(t − s)f (s),
ω ω
0

als allgemeine Lösung für u. Dabei sind w1 (0) = u(0) und w2 (0) = u̇(0) die anfängliche
Position und Geschwindigkeit des Oszillators. Ist f (t) = sin αt, α 6= ω, d.h. ist die äußere
Kraft nicht in Resonanz mit den Eigenschwingungen des harmonischen Oszillators, dann ist
1 sin αt + sin ωt sin αt − sin ωt
u(t) = w1 (t) = u(0) cos ωt + u̇(0) sin ωt + − .
ω 2(α + ω)ω 2(α − ω)ω

Diese Lösung ist für alle Zeiten beschränkt. Der harmonische Oszillator ist stabil unter der
Störung. Im Resonanzfall f = sin ωt ist die Lösung
1 sin ωt t
u(t) = u(0) cos ωt + u̇(0) sin ωt + 2
− cos ωt.
ω 2ω 2ω
Wegen des Resonanzterms ∼ t cos ωt wächst die Amplitude an. Der Oszillator ist instabil.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 18

2.3 Nichtlineare Differentialgleichungen

Es sei G ein offenes und zusammenhängendes Gebiet im Rn und w ∈ G. Gegeben sei eine
Funktion

f : R × G −→ Rn
(t, w) −→ f (t, w).

Wir wollen allgemeine Differentialgleichungssysteme der Form

ẇ = f (t, w) mit w(t0 ) = w0 ∈ G (2.23)

studieren. Wie im linearen Fall ist diese Differentialgleichung, zusammen mit der Anfangs-
bedingung, äquivalent zur Integralgleichung

Zt
w(t) = w0 + f (s, w(s))ds. (2.24)
t0

Wir wollen voraussetzen, daß f in R × G stetig ist und stetig differenzierbar in G. Statt stetig
differenzierbar kann man auch die etwas schwächere Lipschitzbedingung fordern:

|f (t, w) − f (t, w̃)| ≤ L|w − w̃| auf G.

Mit diesen Voraussetzungen kann man zeigen, daß die Abbildung


Zt

w −→ T (w), T (w) (t) = w0 + f (s, w(s))ds
t0

auf der Menge der stetigen Funktionen w : [t0 , t] → Rn für genügend kleine t − t0 einen
Fixpunkt hat. Solch ein Fixpunkt löst die Differentialgleichung (2.23). Auf diesem Wege
gelangt man zu folgendem Existenz- und Eindeutigkeitssatz:

Satz: Unter den obigen Voraussetzungen hat das System (2.23) lokal genau eine Lösung: Es
gibt ein Intervall (t1 , t2 ) ∋ t0 und genau eine differenzierbare Funktion w : (t1 , t2 ) → G, so
daß (2.23) für t ∈ (t1 , t2 ) gilt.

Aufgrund dieses Existenz und Eindeutigkeitsatzes gibt es genau eine Lösungsfunktion w =


L(t, t0 , w0 ), wobei L(t0 , t0 , w0 ) = w0 ist. Im autonomen Fall ist f zeitunabhängig und jede
Anfangszeit ist so gut wie jede andere. Nur die Zeitdifferenz t − t0 ist von Bedeutung. Des-
halb braucht man t0 nicht zu schreiben. Die Kurve L(t, w0 ) ist für feste Anfangsbedingung
eine partikuläre Lösungskurve (Trajektorie) der Differentialgleichung. Für festes t ist die
Abbildung

w0 −→ L(t, w0 )

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 19

der Fluß. Wegen

L(t + s, w0 ) = L(t, L(s, w0 )) ist Lt+s = Lt ◦ Ls

und der Fluß Lt eine 1-parametrige Gruppe. Wegen der Eindeutigkeit der Lösungen geht
durch jeden Punkt ∈ G genau eine Lösungskurve.

2.3.1 Einige einfache und exakt lösbare nichtlineare DG

In seltenen Fällen kann man eine nichtlineare DG explizit lösen. Hier einige Beispiele:

Bernoullische DG: Ein Beispiel für eine lösbare Gleichung ist die Bernoullische DG

ẇ = a(t)w + b(t)wα , α 6= 1.

Ersetzt man w durch v = w1−α dann geht diese nämlich in die lineare DG

v̇ = β a(t)v + b(t) , β =1−α

über. Mit den Resultaten des letzten Kapitels ist dann

 Zt  Zt
v(t) = U (t) β U −1 (s)b(s)ds + v(0) ,

wobei U (t) = exp β a(s)ds .
0 0

Die Riccatische DG

ẇ = a(t)w + b(t)w2 + c(t),

ist allgemein lösbar, wenn man eine spezielle Lösung w∗ (t) kennt. Dazu setzen wir w =
w∗ + 1/v. Benutzen wir, daß w∗ die DG erfüllt, so ist w genau dann eine Lösung, wenn

−v̇ = (a + 2bw∗ )v + b

ist. Zum Beispiel ist w∗ = 2 eine spezielle Lösung der logistischen Gleichung ẇ = w − w2 + 2.
Damit lautet die Gleichung für v
1
ke3t − 1 .

v̇ = 3v + 1 =⇒ v =
3
Damit ist die allgemeine Lösung der logistischen Gleichung
3
w =2+ .
ke3t −1
Das nächste Beispiel ist nicht mehr analytisch lösbar.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 20

2.3.2 Räuber-Beute Problem

Es sei w1 die Anzahl Beutetiere und w2 die Anzahl Räuber. Als Modell für die Änderung
der Spezies nehmen wir
ẇ1 = aw1 − cw1 w2
, a, b, c, d > 0
ẇ2 = −bw2 + dw1 w2
Ohne Räuber würde die Anzahl Beutetiere exponentiell zunehmen und ohne Beutetiere
würde die Anzahl Räuber wegen Nahrungmangel exponentiell abnehmen. In der Tat,
 at   
e 0
w(t) = und w(t) =
0 e−bt
sind spezielle Lösungen der Differentialgleichung. Wegen dem Eindeutigkeitssatz kann des-
halb keine Lösung die Achse w1 = 0 bzw. w2 = 0 schneiden.

Die quadratischen Terme modellieren die Abnahme der Beutetiere weil diese von den Räubern
gefressen werden und die Zunahme der Räuber weil diese Nahrung finden. Qualitativ kann
man die Lösungen diskutieren indem man das Vektorfeld
 
aw1 − cw1 w2
f (w) = in ẇ = f (w)
−bw2 + dw1 w2
betrachtet (siehe Figur (2.3)). Zum Beispiel ist es interessant zu wissen, ob es eine Gleich-
gewichtslösung gibt wobei f (w) = 0 und damit ẇ = 0 ist, und wenn ja, ob diese stabil oder
instabil ist. Das Räuber-Beute-Modell hat zwei Gleichgewichtslösungen, nämlich
   
(1) 0 (2) b/d
w = und w = .
0 a/c
Die linearisierten Gleichungen in der Nähe der Fixpunkte haben die Form w ∼ (∇f )(w(i) )w =
A(i) w. Man findet
   
(1) a 0 (2) 0 −bc/d
A = und A = .
0 −b ad/c 0
Offensichtlich ist der Ursprung in der linearisierten Gleichung ein Sattelpunkt und damit
instabil und der zweite Fixpunkt ein Zentrum und damit stabil. Diese Verhalten gilt auch für
die exakten Lösungen des nichtlinearen Problems. Das Gleichgewicht mit b/d Beutetieren
und a/c Räuber ist ein stabiles Gleichgewicht. Viele dieser Eigenschaften kann man schon
aus dem Vektorfeld f (w) in (2.3) ablesen. Die anschauliche Vektorfeldmethode funktioniert
allerdings nur schön bei autonomen Systemen für die f nicht explizit von der Zeit abhängt.
Für nicht-autonome Systeme ändert sich das Vektorfeld f mit der Zeit.

2.3.3 Stabilität

Es sei w∗ (t) eine Lösung von (2.23). Wir wollen Lösungen in der Nähe von w∗ studieren,
d.h. wir setzen
w = w∗ (t) + η.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 21

w2 stabiler Fixpunkt

w1

instabiler Fixpunkt

Abbildung 2.3: Vektorfeld für Räuber-Beute Problem (a = b = c = d = 1)

Dann ist
η̇ = ẇ − ẇ∗ (t) = f (t, w) − f (t, w∗ (t)) = f (t, w∗ (t) + η) − f (t, w∗ (t))
X ∂fi
t, w∗ (t) ηj + r(t, η) = A(t)η + r(t, η).

= j
ij
∂w

Vernachlässigen wir den Restterm r(t, η) dann lautet die linearisierte Gleichung für die
Störung

∂fi
t, w∗ (t) .

η̇ = A(t)η mit Aij (t) = (2.25)
∂wj

Eine Lösung w(t, t0 , w0∗ ) heißt stabil (im Sinne von Liapunov) falls es zu jedem ǫ > 0 ein
δ > 0 gibt, so daß für |w0 − w0∗ | < δ

1) w(t, t0 , w0 ) für t0 ≤ t < ∞ existiert,

2) |w(t, t0 , w0 ) − w(t, t0 , w0∗ )| < ǫ für alle t0 ≤ t < ∞ ist.

Eine Lösung heißt asymptotisch stabil, wenn zusätzlich

3) |w(t, t0 , w0 ) − w(t, t0 , w0∗ )| −→ 0 für t −→ ∞ gilt.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 22

-1
-1 0 1 2

Abbildung 2.4: Die Lösungskurven für das Räuber-Beute-Modell (a = b = c = d = 1)

2.3.4 Liapunov Funktionen

Wir wollen zunächst ein autonomes System betrachten,

ẇ = f (w) mit f (0) = 0. (2.26)

Dann ist w = 0 eine Gleichgewichtslösung des autonomen Differentialgleichungssystems.


In dieser Situation gibt es ein hilfreiches Kriterium von Liapunov für die Stabilität des
Fixpunktes w = 0. Dazu brauchen wir den Begriff der Liapunov-Funktion für das System
(2.26):

Eine Funktion V : U → R auf einer Umgebung U von w = 0 heißt Liapunov-Funktion


bezüglich (2.26) falls

1. ∇V auf U stetig ist,


2. V (0) = 0 und V > 0 auf U − {0}
3. ∇V · f ≤ 0 auf U − {0}

gelten. Nun gilt der folgende

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 23

ε
δ w ( t,t 0 ,w*)
0

w *0

w0
w ( t, t 0,w0 )

δ w ( t,t 0,w*)
0
ε (t) 0
w 0*

w0 w ( t, t 0 ,w0 )

Abbildung 2.5: Stabile und asymptotisch stabile Lösungen

Satz: Existiert eine Liapunov-Funktion für (2.26), dann ist w = 0 eine stabile Lösung des
Systems. Ist ∇V · f < 0 in U − {0} dann ist w = 0 asymptotisch stabil.

Dieses Theorem von Liapunov kann angewandt werden ohne die Differentialgleichung zu
lösen. Anderseits gibt es keine systematische Methode um eine Liapunov-Funktion zu finden.
Für mechanische Systeme ist die Energie eines benachbarten Systems ein guter Kandidat
für diese Funktion. Für thermodynamische Systeme ist die negative Entropiefunktion eine
Liapunovfunktion.

Beweis: Es sei ǫ so klein gewählt, daß die Kugel Kǫ mit Radius ǫ in U liege. Es sei α das
Minimum von V auf der Kugeloberfläche,

α = min V (w) > 0.


|w|=ǫ

Es sei weiter
α
M := {w|V (w) ≤ } ∩ Kǫ
2
und M ′ die Zusammenhangskomponente von M die w = 0 enthält. Wähle nun ein δ > 0, so
daß Kδ ⊂ M ′ . Es seien nun w(t, w0 ) eine Lösung mit w0 ∈ Kδ . Nach der zweiten Eigenschaft
der Liapunov Funktion ist
d 
V w(t, w0 ) = ∇V · ẇ = ∇V · f ≤ 0.
dt

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 24

Daraus folgt, daß V w(t, w0 ) ≤ α/2 ist, und damit ist w(t, w0 ) in M ′ wegen der Stetigkeit


der Lösung. Daraus folgt dann, daß w(t, w0 ) ∈ Kǫ , woraus die Behauptung folgt.

w2

f
w(t)
w1
V

Abbildung 2.6: Liapunov Funktion für ẇ = f (w).

Beispiel: Wir betrachten den harmonischen Oszillator mit Reibung,


ẍ + h(x, ẋ)ẋ + x = 0, h(x, ẋ) ≥ 0.
Mit w1 = x und w2 = ẋ ist dies äquivalent zu
 
w2
ẇ = f (w), f= .
−h(w)w2 − w1
Die Energie für den Oszillator ohne Reibung, V = w12 + w22 ist eine Liapunov Funktion. Dazu
müssen wir nur die dritte Bedingung nachprüfen:
 dV dV 
(∇V · f ) = f1 + f2 = −2h(w)w22 ≤ 0.
dw1 dw2
Damit ist auch die dritte Bedingung erfüllt. Diese bedeutet auch, daß ∇V · ẇ ≤ 0 ist. Längs
der Bahnen w(t) nimmt also die Liapunov-Funktion, in unserem Beispiel also die Energie des
reibungsfreien Vergleichsystems, ab. Das Pendel spiralt in den Gleichgewichtpunkt w = 0
hinein.

2.3.5 Lineare Stabilität bedingt Stabilität

Wir wollen noch einen zweiten, wichtigen Satz behandeln.

Satz: Es sei ẇ = f (w) mit f (0) = 0 ein autonomes System. Weiter sei f (w) = Aw +
r(w), A = (∇f )(0), wobei die Realteile der Eigenwerte von A alle kleiner als −c < 0 seien.
Dann gibt es eine Umgebung U ⊂ G von w = 0 so daß

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 25

i) w(t, w0 ) definiert ist und in U bleibt für alle w0 ∈ U, t > 0.

ii) Es gilt
|w(t, w0 )| < ae−ct |w0 |
für alle w0 ∈ U, t ≥ 0. Speziell gilt w(t, w0 ) → 0 für t → ∞ für alle w0 ∈ U .

Dieser Satz besagt also, daß der Fixpunkt attraktiv ist falls er bezüglich der linearisierten
Differentialgleichung attraktiv ist.

Es gilt in gewissem Sinne auch die Umkehrung: Hat ein Eigenwert von A einen positive
Realteil, dann ist der Fixpunkt instabil. Liegt ein Eigenwert auf der imaginären Achse,
dann muß man die Methode der Zentrumsmannigfaltigkeiten anwenden.

Um zu entscheiden, ob alle Nullstellen von p(λ, A) negative Realteil haben kann man das
Kriterium von Routh-Hurwitz benutzen:

Kriterium von Routh-Hurwitz: Alle Nullstellen des Polynoms


an λn + an−1 λn−1 + . . . + a1 λ = 0 = 0
mit reellen Koeffizienten ak und an > 0 liegen genau dann in der linken offenen Halbebene
von C wenn die Determinanten der Untermatrizen
a1 a0 0 0 ... 0
 
 
  a1 a0 0  a3 a2 a1 a0 . . . 0 
a1 a0
a1 , det ,  a3 a2 a1  . . . 
 ... .. 
a3 a2 . 
0 0 a3
a2n−1 a2n−2 a2n−3 . . . . . . an
(am = 0 für m > n) positiv sind. Die Form der Matrizen wird ersichtlich, wenn man die
Diagonale betrachtet.

Beispiel: Der Gleichgewichtspunkt w = 0 der Differentialgleichung


ẅ + 2ẇ + w = wn , n = 2, 3, . . .
ist asymptotisch stabil.

Beweis des Satzes: Die allgemeine Lösung der linearisierten Gleichung ist U (t)w(0) und ist
die Summe von Termen tk exp(λi t). Damit gibt es Konstanten γ, λ > 0 so daß
|U (t)w0 | ≤ γe−λt |w0 |
für alle positiven t. Nun wollen wir den Einfluß des Restterms r(w) = o(w) abschätzen. Zu
jedem χ > 0 gibt es ein ρ > 0 so daß
|w| < ρ =⇒ |r(w)| < χ · |w|.
Wie im linearen Fall ist die Differentialgleichung zusammen mit der Anfangsbedingung äqui-
valent zu der Integralgleichung
Zt
 
w(t, w0 ) = U (t)w0 + U (t − s)r w(s, w0 ) ds.
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 26

Wir schätzen ab:


Zt Zt
|U (t − s)r w(s, w0 ) |ds ≤ γe−λt |w0 | + γχ e−λ(t−s) |w(s, w0 )|ds.
 
|w(t, w0 )| ≤ |U (t)w0 | +
0 0

Setzen wir y(t) = exp(λt)|w(t, w0 )| dann schreibt sich diese Ungleichung auch
Zt
y(t) ≤ c1 + c2 y(s)ds, c1 = γ|w0 |, c2 = γχ.
0

Offensichtlich ist y(t) kleiner oder gleich


Zt
Y (t) ≡ c1 + c2 y(s)ds.
0

Wegen

d Ẏ y
Ẏ = c2 y ist log Y = = c2 ≤ c2 .
dt Y Y
Damit ist

log Y (t) ≤ c2 t + log Y (0) bzw. Y (t) ≤ c1 ec2 t .

Wir haben damit das Lemma von Cronwall bewiesen:

Lemma (Cronwall) Falls


Zt
y(t) ≤ c1 + c2 y(s)ds dann ist y(t) ≤ c1 ec2 t .
0

Damit haben wir gezeigt, daß

|w(t, w0 )| ≤ γ|w0 |e(γχ−λ)t

gilt. Nun ist es einfach einzusehen, daß die Lösung stabil ist. Nun wählen wir χ so klein, daß
γχ − λ negativ ist. Dies bedeutet eine Wahl von ρ. Als nächstes sei |w0 | < δ = ǫ/γ. Dann ist
offensichtlich |w(t, w0 )| < ǫ für alle t und strebt in der Tat gegen den Fixpunkt w = 0 für
große t. Damit streben Lösungen, die in der Nähe des Fixpunktes starten für große Zeiten
in den Fixpunkt. Der Fixpunkt w = 0 ist asymptotisch stabil.

2.4 Periodische Systeme

Gegeben sei ein System

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 27

ẇ = f (t, w) = A(t)w + r(t, w) mit periodischem f :


(2.27)
A(t + T ) = A(t), r(t + T, w) = r(t, w)

und wir wollen annehmen, daß

r(t, w) = o(|w|) gleichmäßig in t.

Also ist w = 0 eine Lösung der Differentialgleichung. Es sei nun w = L(t, t0 , w0 ) die Lösung
die zur Zeit t0 bei w0 startet. Für die Stabilitätsuntersuchung von periodischen Systemen
definiert man die

Def: Poincare Abbildung:

P : w0 −→ L(T, 0, w0 ).

Wegen

w-Raum w-Raum w-Raum

P(w 0) = w(T,w 0 )

w0

periodische Lösung w (t.0)

Abbildung 2.7: Poincare Abbildung P : w0 → P (w0 ).

L(2T, 0, w0 ) = L(2T, T, L(T, 0, w0 )) = L(T, 0, L(T, 0, w0 )) = (P ◦ P )(w0 )

und der entsprechenden Relation für 2T → nT (Induktion) hat man die wichtige Eigenschaft

L(nT, 0, w0 ) = P n (w0 ), n = 0, 1, 2, . . . (2.28)

Da w = 0 eine Lösung der Differentialgleichung ist, ist P (0) = 0. Wir wollen P um 0


entwickeln:

P (w0 ) = (∇P )(0) · w0 + g(w0 ) ≡ M w0 + g(w0 ).

Die Matrix M ist die Monodromie-Matrix und die Eigenwerte von M sind die Floquet-
Multiplikatoren. Es stellt sich nun die Frage wie man M berechnet und was M über die
Stabilität der Bahn w = 0 besagt.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 28

Um M zu bestimmen, stellen wir uns vor, daß w(t, w0 ) eine Lösung des periodischen Systems
ist,
∂w 
(t, w0 ) = A(t)w(t, w0 ) + r t, w(t, w0 )
∂t
und variieren die anfängliche Position w0 in dieser Gleichung. Wir differenzieren nach w0
und setzen dann w0 = 0:
∂ ∂w ∂w ∂r  ∂w
(t, 0) = A(t) (t, 0) + t, w(t, 0) (t, 0).
∂t ∂w0 ∂w0 ∂w ∂w0
Da w(t, 0) = 0 ist und die Ableitung von r an der Stelle w = 0 verschwindet, folgt

∂ ∂w
U (t) = A(t)U (t) wobei U (t) = (t, 0) =⇒ U (0) = 1. (2.29)
∂t ∂w0
Anderseits ist
∂P ∂w
P (w0 ) = w(T, w0 ) =⇒ (0) = (T, 0) = U (T )
∂w0 ∂w0
woraus folgt, daß die Monodromiematrix gerade U zur Zeit T ist. Die lineare Differenti-
algleichung (2.29) haben wir bereits im vorletzten Kapitel (formal) gelöst. Damit finden
wir

 Zt 
M = U (T, 0), wobei U (t, 0) = T exp A(s)ds . (2.30)
0

2.4.1 Mathieusche Differentialgleichung, Blochwellen und Stabilität

Die Mathieusche Differentialgleichung (r = 0) wird gewöhnlich in der Form

ẅ + (a + 16b cos 2t)w = 0

geschrieben; a und b sind Konstanten. Dies ist eine lineare DG mit


 
0 1
A= .
−a − 16b cos 2t 0

Die allgemeine Lösung der Differentialgleichung ist w(t) = U (t, 0)w0 , wenn w(0) = w0 die
Anfangsbedingung ist. Wegen

U (t + π, 0) = U (t + π, π)U (π, 0) = U (t + π, π)M.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 29

Nun ist aber


π+t
Z Zt
   
U (t + π, π) = T exp A(s)ds = T exp A(s)ds = U (t, 0),
π 0

wobei wir benutzten, daß A(π + s) = A(s), und damit ist

U (t + nπ, 0) = U (t, 0)M n

Offensichtlich hat die Mathieusche DG eine periodische Lösung, wenn w(π) = M w(0) = w(0)
für mindestens ein w(0) gilt, d.h. wenn die Monodromie-Matrix M einen Eigenvektor mit
Eigenwert 1 hat. Im Allgemeinen kann man nicht erwarten eine periodische Lösung zu finden,
wenn nicht die Konstante a bestimmten Beschränkungen unterliegt. Es stellt sich heraus,
daß a eine komplizierte Funktion von b sein muß, wenn die Lösung periodisch sein soll.

Wir wollen annehmen, daß die Monodromiematrix M eines linearen Differentialgleichungs-


systems mit periodischen Koeffizienten diagonalisierbar sei. Die Nullstellen des charakteri-
stischen Polynoms seien {λi }. Es sei
−t/T
w̃i (t) = λi wi (t) =⇒ w̃i (T ) = λ−1 −1
i wi (T ) = λi M w̃i (0).

Dann hat λ−1 i M einen Eigenvektor mit Eigenwert 1 und der entsprechende Eigenvektor
w̃i (0) = wi (0) ist der Startpunkt einer periodischen Lösung w̃i (t). Damit hat die Differenti-
algleichung Lösungen der Form
t/T
wi (t) = λi w̃i (t), w̃i periodisch.

Die Mathieusche Differentialgleichung ist invariant unter t → −t. Deshalb ist w(t) =
λ−t/π w̃(−t) die zweite unabhängige Lösung. Damit hat man diese Differentialgleichung im
Prinzip gelöst. Dieses Ergebnis ist als Satz von Floquet bekannt.

Eine wichtige Anwendung dieses Ergebnisses ist die Schrödingergleichung in einem periodi-
schen Kristall. Die Schrödingergleichung
d2 ψ
+ [A + V (x)]ψ = 0,
dx2
wobei A eine Konstante und V eine periodische Funktion mit V (x + l) = V (x) ist, hat
Lösungen der Gestalt

ψ = eikx v(x), v periodisch.

Dies wird verschiedentlich als Satz von Bloch bezeichnet. Die Lösungen sind die Blochwellen.

Im nichtlinearen Fall löst eine Lösung von (2.27) die Integralgleichung

 Zt 
w(t) = U (t) U −1 (s)r(s, w(s))ds + w(0) , U (t) = U (t, 0),
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 30

so daß
ZT
w(T ) = M w(0) + M U −1 (s)r(s, w(s))ds.
0

Mit ähnlichen Methoden wie beim Beweis der asymptotischen Stabilität von linear stabilen
Systemen kann die Stabilität von w0 → P n w0 untersucht werden. Man findet das

Lemma: Liegen alle Eigenwerte der Monodromie-Matrix M innerhalb des Einheitskreises


(|λk | < 1) und ist det M > 0, dann ist der Fixpunkt w = 0 bezüglich P n asymptotisch
stabil.

2.4.2 Feigenbaumbifurkation

Statt des Beweises diskutieren wir ein illustratives Beispiel, nämlich die Feigenbaumbifur-
kation. Es sei

P (w) = 4λw(1 − w)

eine Poincareabbildung mit λ ≤ 1. Diese nicht-monotone Abbildung bildet das Intervall [0, 1]
auf sich ab. Sie hat die periodischen Bahnen
1
w = 0 und w =1− = w1 ,

da beides Fixpunkte von P sind. Die zweite Bahn existiert nur für λ ≥ λ1 = 1/4 (für kleinere
λ’s läge sie außerhalb des Intervalls [0, 1]). Wegen P ′ = 4λ(1 − 2w) ist

P ′ (0) = 4λ und P ′ (1 − 1/4λ) = 2 − 4λ.

Wir haben damit die folgende Situation:

1) Für festes 0 < λ < λ1 besitzt das System genau einen Fixpunkt w = 0. Dieser ist stabil,
weil |P ′ (0)| < 1 gilt.

2) Für festes λ mit λ1 < λ < λ2 = 3/4 besitzt das System zwei Fixpunkte w = 0 und
w = w1 , wobei w = 0 instabil und w = w1 stabil ist.

Nun wollen wir untersuchen was passiert, wenn λ > λ2 ist.

3) Für festes λ mit λ2 < λ < λ3 besitzt das System eine periodische Bewegung der Periode
2T zwischen den Punkten w21 und w22 . Die Stabilität dieser periodischen Bewegung folgt
daraus, daß diese Punkte stabile Fixpunkte der iterierten Poincare-Abbildung P 2 ist: Wegen
P (w21 ) = w22 und P (w22 ) = w21 gilt offensichtlich

P 2 (w21 ) = P (w22 ) = w21 und P 2 (w22 ) = P (w21 ) = w22 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 31

P(w) P(w)

w PQ w

P 2 (w)

instabiler
Fixpunkt

stabiler
Fixpunkt

P Q w

Abbildung 2.8: Feigenbaum-Bifurkation

Natürlich sind die Fixpunkte von P auch Fixpunkte der iterierten Abbildung P 2 . Diese
Fixpunkte von P und P 2 , nämlich w = 0 und w = w1 , sind instabil.

Bei weiterer Vergrößerung von λ werden die stabilen Fixpunkte von P 2 instabil und es
entstehen Bewegungen der Periode 2T von P 2 , d.h. Bewegungen der Periode 4T von P ,
usw.

Wir haben also gesehen, daß ein Attraktor (stabiler Fixpunkt) der Periode T geht bei λ =
3/4 in einen Attraktor der Periode 2T über. Für P sind dies zwei oszillierende Werte w21
und w22 , für P 2 entspricht dieser Orbit einem Fixpunkt. Überschreitet λ den Wert λ3 , so
wird der Fixpunkt von P 2 instabil. Die entsprechende Bahn der Periode 2T wird zu einer
oszillierenden Bahn, einer Bahn der Periode 4T , usw. Das Interessante an der Feigenbaum
Bifurkation ist, daß der Grenzwert
λn+1 − λn
lim = δ ∼ 4.6692
n→∞ λn+2 − λn+1

eine universelle Konstante ist: Für eine große Klasse von Iterationsverfahren auf [0, 1] tritt
bei Übergängen zum Chaos mit Periodenverdopplung dieselbe Konstante δ auf. Für λ >
λc = 0.892486417967 . . . tritt ein im Wesentlichen chaotisches Verhalten auf. Unabhängig
von der Wahl von w0 ist die Reihe w0 , P (w0 ), P 2 (w0 ), . . . ’chaotisch’: Für einige Startwerte
w0 sind die Orbits P n (w0 ) aperiodisch, d.h. konvergieren gegen keinen endlichen Attraktor.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 32

Für die meisten Startwerte sind die Orbits periodisch. Aber die Perioden sind so groß, daß
sie kaum sichtbar sind. Weiterhin führen nahe beieinander liegende Startwerte zu völlig
unterschiedlichen Orbits. Dies wurde zum erstenmal von P.J. Myrberg in den frühen 60’ern
festgestellt. Etwa 10 Jahre später haben Metropolis, Stein und Stein die Resultate auf andere
Abbildungen [0, 1] → [0, 1] verallgemeinert.

p
8

p
3

p
2

p1

Abbildung 2.9: Feigenbaum-Bifurkation

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2

Differentialgleichungen

2.1 Lineare Systeme mit konstanten Koeffizienten

Systeme von Differentialgleichungen

ẇ1 = a11 w1 + a12 w2 + . . . + a1n wn


ẇ2 = a21 w1 + a22 w2 + . . . + a2n wn
.. .. ⇐⇒ ẇ = Aw (2.1)
. .
ẇn = an1 w1 + an2 w2 + . . . + ann wn

mit konstantem Koeffizienten aij treten in vielen Problemen auf. Einfache Ratengleichun-
gen, Hamiltonsche Bewegungsgleichungen oder Schrödingergleichungen (mit endlich vielen
Freiheitsgraden) sind Beispiele dafür. Die kovariante Form der Bewegungsgleichung für ein
relativistisches Teilchen im äußeren elektromagnetischen Feld,

duµ e µ ν
= F u , (2.2)
dτ mc ν
wobei m die Masse, τ die Eigenzeit, uµ = ẋµ = γ(c, ~v ) die Vierer-Geschwindigkeit des
Teilchen und
0 E1 E2 E3
 
E 0 B3 −B2 
F µν =  1
E2 −B3 0 B1

E3 B2 −B1 0

~ B)
der Feldstärketensor ist, ist für konstantes (E, ~ eine Differentialgleichungssystem mit kon-

6
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 7

stanten Koeffizienten. Auch bei der Untersuchung von einparametrigen Untergruppen von
Lie-Gruppen werden wir diesen einfachen Differentialgleichungen wieder begegnen.

Eine Lösung des Systems

ẇ = Aw, w ∈ V, A ∈ L(V ), (2.3)

wobei V ein n-dimensionaler Vektorraum mit Skalarprodukt ist (z.B. V = Rn oder V = C n ),


ist durch die Angabe des Anfangswertes

w(0) = w0 ∈ V (2.4)

eindeutig bestimmt. Da es n linear unabhängige Vektoren w(0) gibt und Linearkombinatio-


nen von Lösungen wieder Lösungen sind, gibt es n unabhängige Lösungen.

2.1.1 Die allgemeine (formale) Lösung

Bei der Lösungssuche wollen wir benutzen, daß w(t) genau dann eine Lösung von (2.3,2.4)
ist, wenn es die Integralgleichung

Zt
w(t) = w0 + A w(t1 )dt1 (2.5)
0

löst. Diese Integralgleichung lösen wir nun iterativ. In der nullten Näherung ist w0 (t) = w0 .
Dies setzen wir in der rechten Seite in (2.5) ein und erhalten die erste Näherung
Zt
w1 (t) = w0 + Aw0 dt1 = w0 + A w0 t.
0

Nun benutzen wir w1 (t) in der rechten Seite in (2.5) und erhalten die zweite Näherung
Zt
1
w2 (t) = w0 + A w1 (t1 )dt1 = w0 + A w0 t + A2 w0 .
2
0

Nach n Iterationen finden wir


n
X tp
wn (t) = Ap w0 .
p=0
p!

Wir wollen uns nun davon überzeugen, daß die rechte Seite konvergiert. Dazu erinnern wir
uns daran, daß L(V ), versehen mit der Norm
kAk = max |Aw|, |w| = (w, w)1/2 ,
|w|=1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 8

ein vollständiger Vektorraum ist. Wegen

kA + Bk = max |(A + B)w| ≤ max(|Aw| + |Bw|) ≤ max |Aw| + max |Bw|

erfüllt die Norm die Schwartzsche Ungleichung

kA + Bk ≤ kAk + kBk (2.6)

und aus der Definition der Norm folgt auch (|w| = 1)

|ABw| = |A(Bw)| ≤ kAk |Bw| ≤ kAk kBk =⇒ kABk ≤ kAk kBk , kAp k ≤ kAkp .

Damit ist
∞ p
X t
Ap = etA
0
p!

eine absolut konvergente Reihe für jeden linearen Operator A. Also konvergiert wn (t) gegen
die Lösung

∞ p
X t
w(t) = Ap w0 ≡ eAt w(0). (2.7)
0
p!

Durch direktes Nachrechnen kann man sich auch davon überzeugen, daß w(t) = exp(tA)w(0)
die Differentialgleichung (2.3) löst1 . Wir sehen auch, daß w(t) eine in t analytische Funktion
ist. In anderen Koordinaten w̃, die mit den w linear zusammenhängen,

w̃1 = s11 w1 + s12 w2 + . . . + s1n wn


w̃2 = s21 w1 + s22 w2 + . . . + s2n wn
.. .. ⇐⇒ w̃ = Sw, (2.8)
. .
w̃n = sn1 w1 + sn2 w2 + . . . + snn wn

wobei S eine reguläre Matrix ist, det S 6= 0, sieht das Differentialgleichungssystem folgen-
dermassen aus:

w̃˙ = S ẇ = SAw = SAS −1 w̃ = Dw̃.

Damit ist die Lösung in den w̃-Koordinaten

w̃(t) = eDt w̃(0), D = SAS −1 . (2.9)

1 Zeige, das (2.7) die Differentialgleichung (2.3) löst.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 9

2.1.2 Wichtige Spezialfälle

Wir wollen jetzt einige wichtige Spezialfälle diskutieren.

V = C n und A diagonalisierbar: In der linearen Algebra zeigt man, daß eine Matrix B (im
Komplexen) diagonalisierbar ist, wenn die Nullstellen λi des charakteristischen Polynoms

p(λ, B) = det(λ − B) = λn − Sp (B)λn−1 + . . . + (−)n det B


(2.10)
= (λ − λ1 )(λ − λ2 ) · · · (λ − λn )

verschieden sind. Sind also die Nullstellen des Polynoms p(λ, A) verschieden, dann können
wir eine Matrix S finden, so daß SAS −1 = D diagonal ist, D =diag(λ1 , . . . , λn ). In den
w̃-Koordinaten ist die Lösung dann einfach

w̃(t) = eDt w̃(0) ⇐⇒ w̃i (t) = eλi t w̃i (0), i = 1, . . . , n. (2.11)

Da die w̃i vollständig entkoppeln, genügt es das Verhalten einer Komponente w̃i = w̃ zu
betrachten. Zerlegen wir w̃ in Real- und Imaginärteil, w̃ = u + iv, so schreibt sich die Lösung
wie
    
u(t) tℜλ cos tℑλ − sin tℑλ u(0)
=e .
v(t) sin tℑλ cos tℑλ v(0)
Wir wollen die qualitativ verschiedenen Möglichkeiten etwas näher anschauen: Verschwindet
der Imaginärteil des Eigenwertes, dann ist der Fixpunkt w = 0 für λ > 0 ein Quelle und
für λ < 0 eine Senke. Im ersten Fall ist w = 0 ein instabiler, im zweiten Fall ein stabiler
Fixpunkt der Differentialgleichung. Ist der Eigenwert dagegen rein imaginär, dann ist w = 0
ein Zentrum. Die Lösungen w(t) sind periodisch mit derselben Periode und rotieren um den
Fixpunkt. Ist ℜλ > 0 und ℑλ 6= 0 dann liegt ein auslaufender Strudel und für ℜλ < 0 ein
einlaufender Strudel vor.

Haben alle Eigenwerte λi einen negativen Realteil, dann ist w = 0 ein stabiler Fixpunkt.
Sind alle Realteile positiv, dann ist w = 0 ein instabiler Fixpunkt. Die Punkte w(t) laufen
dann von der Lösung w = 0 weg.

V = C n , A beliebig

Hat das charakteristische Polynom P (λ, A) von A mehrfache Nullstellen, dann ist A im
Allgemeinen nicht diagonalisierbar. Das charakteristische Polynom hat dann die Form
r
Y
p(λ, A) = det(λ − A) = λ − λk )nk ,
k=1

wobei λ1 , . . . , λr die verschiedenen Nullstellen von p sind und die nk > 0 ihre Vielfachheiten.
Wir definieren die verallgemeinerten Eigenräume von A zu den λk als die Unterräume

Vk = Kern A − λk )nk ⊂ V.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 10

Abbildung 2.1: Senke, Quelle, Zentrum und Strudel

Ein Vektor w ist also genau in Vk falls (A − λk )nk w = 0 ist. Offensichtlich ist mit w auch
Aw in Vk . Damit ist A : Vk → Vk . Nun gilt folgender Satz:

Satz: Sei A ∈ L(V ), wobei V ein komplexer Vektorraum ist. Dann ist V die direkte Summe
der verallgemeinerten Eigenräume Vk und dimVk = nk .

Wir wollen sehen, was diese Zerlegung impliziert. Wir nehmen zuerst an, daß das charakte-
ristische Polynom von A nur eine Nullstelle λ der Vielfachheit n hat und setzen

A = λ + N ≡ D + N.

Offensichtlich gilt [D, N ] = 0 und D ist diagonal in jeder Basis. Wegen (A − λ) = N ist Kern
N n = V und damit ist N nilpotent, N n = 0. Also gilt
n−1
X Np p
etA = etλ t .
p=0
p!

Daher kann das System ẇ = Aw leicht gelöst werden.

Beispiel: Sei

ẇ1 = w1 − w2 , ẇ2 = w1 + 3w2 . (2.12)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 11

Die zugehörige Matrix A hat das charakteristische Polynom (λ − 2)2 . Damit gilt
     
1 −1 2 0 −1 −1
A= = + = λ + N.
1 3 0 2 1 1

Man rechnet leicht nach, daß in der Tat N 2 = 0 ist, so daß


 
1 − t −t
etA = e2t 1 + tN = e2t

t 1+t

und damit lautet die allgemeine Lösung der Differentialgleichung (2.12)

w1 (t) = e2t (1 − t)w1 (0) − tw2 (0)




w2 (t) = e2t tw1 (0) + (1 + t)w2 (0) .




Im allgemeinen Fall von mehr als einer Nullstelle von p(λ, A) setzten wir Ak = A|Vk . Jedes
Ak hat nur einen Eigenwert und damit gilt

Ak = Dk + Nk , Dk , Nk ∈ L(Vk ), [Dk , Nk ] = 0, Nknk = 0.

Damit gilt der

Satz: Jeder lineare Operator in A ∈ L(C n ) hat die Zerlegung

A = D + N, D = D1 ⊕ . . . ⊕ Dr , N = N1 ⊕ . . . ⊕ Nk .

Es gilt [D, N ] = 0, N nilpotent und D diagonalisierbar. Man kann zeigen, daß A die Ope-
ratoren D und N eindeutig bestimmt.

Beispiel: Es sei

 
−1 1 −2
A =  0 −1 4  =⇒ p(λ, A) = (λ + 1)2 (λ − 1). (2.13)
0 0 1

Damit hat A den zweifachen Eigenwert −1 und den einfachen Eigenwert 1. Wegen
   
0 0 0 −2 1 −2
(A + 1)2 =  0 0 8  und (A − 1) =  0 −2 4 
0 0 4 0 0 0

sind die verallgemeinerten Eigenräume

V1 = span{ẽ1 = e1 , ẽ2 = e2 } und V2 = span{ẽ3 = 2e2 + e3 }.


−1
Setzen wir wi ei = w̃i ẽi wobei ẽi = Sji ej , so ist w̃ = Sw und damit geht ẇ = Aw über in
 
1 0 0
w̃˙ = (SAS −1 )w̃ = Ãw̃, wobei S =  0 1 −2 
0 0 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 12

ist. Nach unserem allgemeinem Theorem ist


     
−1 1 0 −1 0 0 0 1 0
à =  0 −1 0  =  0 −1 0  +  0 0 0  = D̃ + Ñ
0 0 1 0 0 1 0 0 0

die Summe eines diagonalen und nilpotenten Operators. Wir schließen, daß
   
−1 0 0 0 1 −2
A = D + N =  0 −1 4  +  0 0 0  , [D, N ] = 0, N 2 = 0.
0 0 1 0 0 0

Um exp(tA) zu berechnen, benutzen wir, daß


 −t
te−t −2te−t

e
etA S −1 età S = S −1 etD̃ e−t 2(et − e−t )  .

= 1 + tÑ S =  0
0 0 et

Damit wäre auch die Differentialgleichung mit Matrix A in (2.13) gelöst.

V = Rn und allgemeines A: Jeden linearen Operator A ∈ L(Rn ) können als linearen


Operator auf L(C n ) auffassen. Dort hat er die Eigenschaft Ā = A. In C n können wir obiges
Resultat anwenden:

A = D + N =⇒ Ā = A = D̄ + N̄ .

Da aber die (D, N )-Zerlegung eindeutig ist, schließen wir, daß D̄ = D und N̄ = N ist. A
kann also in ein reelles und im Komplexen diagonalisierbares D und ein reelles nilpotentes
N zerlegt werden. Dann gibt es eine reelle Basis in Rn , so daß
 
a −b
 
D = diag λ1 , . . . , λr , D(λr+1 ), . . . , D(λs ) , D(λ) = , λ = a + ib,
b a

wobei λ1 , . . . , λr die reellen Eigenwerte von A und λr+1 , . . . , λs die komplexen Eigenwerte
sind. exp(tD) ist einfach zu berechnen, da
 
cos tb − sin tb
etD(λ) = eta
sin tb cos tb

ist.

Übung: Berechne etA für die Matrix

0 −1 0 0
 
1 0 0 0 
A=
0 0 0 −1

2 0 1 0

mit p(λ, A) = 1 + 2λ2 + λ4 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.1. Lineare Systeme mit konstanten Koeffizienten 13

A antihermitesch oder antisymmetrisch: Ein für die Physik wichtiger Spezialfall ist
gegeben, wenn A antihermitesch ist, A† = −A. In diesem Falle kann A mit einer unitären
Matrix S diagonalisiert werden (da iA hermitesch ist) und alle Eigenwerte sind rein imaginär.
Damit ist auch exp(Dt) unitär und

w(t) = eAt w(0) = S −1 eDt Sw(0) = U (t)w(0), U (t) unitär.

Es sei nun V = Rn und A antisymmetrisch, At = −A. Wegen


d   
w(t), w(t) = Aw(t), w(t) + w(t), Aw(t) = 0
dt
ist |w(t)| = |w(0)|. Damit ist R(t) = exp(tA) eine längenerhaltende lineare Abbildung, also
eine Drehung. Aus (2.10) folgern wir für eine beliebiges B, daß
X Y
tr (B) = λi und det B = λi ,

so daß für beliebige Operatoren B die nützliche Identität

log det(B) = tr log(B) (2.14)

folgt. Insbesondere ist


 
det exp(tA) = exp ttr A = 1

und damit ist R(t) eine eigentliche Drehung, det(R) = 1.

2.1.3 Lineare Differentialgleichungen höherer Ordnung

Wir betrachten eine Differentialgleichung höherer Ordnung,

u(n) + a1 u(n−1) + . . . + an−1 u̇ + an u = 0. (2.15)

Hier soll u eine reell- oder komplexwertige Funktion sein und u(n) bezeichnet die n’te Ab-
leitung nach t. Nun führen wir neue Variablen gemäß

w1 = u w2 = ẇ1 . . . wn = ẇn−1

ein. Dann ist die Differentialgleichung (2.15) äquivalent zum System

0 1 0 ... 0
 
.
.. 
 0 0 1


 . .
ẇ = Aw, A =  .. .. .

 0 
 0 0 ... 0 1 
−an −an−1 −an−2 ... −a1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 14

Das charakteristische Polynom von A ist

p(λ, A) = λn + a1 λn−1 + . . . + an .

Mit obigen Resultaten kann man nun zum Beispiel für

ü + au̇ + bu = 0 (2.16)

Folgendes zeigen:

Es seien λ1 , λ2 die Nullstellen des Polynoms λ2 + aλ + b. Dann ist jede Lösung der Differen-
tialgleichung (2.16) von einem der folgenden 3 Typen:

λ1 6= λ2 ∈ R : u(t) = C1 eλ1 t + C2 eλ2 t


λ1 = λ2 = λ ∈ R : u(t) = C1 eλt + C2 teλt
u(t) = eat C1 cos vt + C2 sin vt .

λ1 = λ̄2 = a + ib, b 6= 0 :

Ist im ersten Fall λ1 λ2 > 0, so liegt eine Quelle oder eine Senke (bzw. ein Knoten) vor, ist
λ1 λ2 < 0 dann ein Sattelpunkt. Im zweiten Fall ist w = 0 ein uneigentlicher Knoten und im
letzten Fall ein Zentrum (2.2).

Abbildung 2.2: Sattelpunkt, uneigentlicher Knoten und Knoten.

2.2 Lineare Systeme mit variablen Koeffizienten

Wir wollen jetzt zulassen, daß die Koeffizienten in (2.1) zeitabhängig sind. Auch in diesem
Falle ist das Differentialgleichungssystem zusammen mit der Anfangsbedingung äquivalent
zur Integralgleichung

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 15

Zt
w(t) = w(0) + A(t1 )w(t1 )dt1 . (2.17)
0

2.2.1 Formale Lösung durch Dysonreihe

Genau wie früher lösen wir diese Integralgleichung mit sukzessiver Approximation. Als nullte
Näherung wählen wir wieder x0 = x(0). Nun erhalten wir

 Zt Zt Zt1
w(t) = 1 + dt1 A(t1 ) + dt1 dt2 A(t1 )A(t2 )
0 0 0
(2.18)
Zt Zt1 Zt2 
+ dt1 dt2 dt3 A(t1 )A(t2 )A(t3 ) + . . . w(0).
0 0 0

Dies kann mit Einführung des zeitgeordneten Produktes noch etwas eleganter geschrieben
werden. Es sei
 
T A(t1 ) · · · A(tn ) = A(tπ(1) ) · · · A(tπ(n) ), wobei tπ(1) ≥ · · · ≥ tπ(n)

das zeitgeordnete Produkt von (A(t1 )A(t2 ) · · · A(tn ). Der Operator T der chronologischen
Ordnung verändert also die Reihenfolge der Operatoren, so daß der Operator zur spätesten 
Zeit links steht und der zur frühesten Zeit rechts. Offensichtlich ist T A(t1 ) · · · A(tn ) sym-
metrisch in t1 , . . . , tn . In (2.18) sind die auftretenden Operatoren schon zeitgeordnet, deshalb
können wir die auftretenden Produkte von Operatoren durch die zeitgeordneten Produkte
ersetzen. Benutzen wir noch, daß
Zt Zt Zt1 tZ
n−1

dt1 . . . dtn f (t1 , . . . , tn ) = n! dt1 dt2 . . . dtn f (t1 , . . . , tn )


0 0 0 0

für jede symmetrische Funktion f , so folgt unmittelbar

Zt Zt
h 1  
w(t) = 1 + dt1 A(t1 ) + dt1 dt2 T A(t1 )A(t2 )
2!
0 0
(2.19)
Zt
1   i
+ dt1 dt2 dt3 T A(t1 )A(t2 )A(t3 ) + . . . w(0).
3!
0

Wir können hier T aus der Summe ’herausziehen’ und finden schlußendlich die kompakte
Formel

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 16

∞ Zt
hX 1 i
w(t) = U (t, 0)w(0), U (t, 0) = T dt1 . . . dtn A(t1 ) · · · A(tn ) . (2.20)
n=0
n!
0

Diese Reihenentwicklung für U (t, 0) ist diejenige der Exponentialfunktion und deshalb schreibt
man oft formal
 Zt 
U (t, 0) = T exp A(s)ds .
0

Man soll hier die Exponentialfunktion entwickeln und auf jeden Term den Zeitordnungsope-
rator T anwenden.

Statt den Anfangwert w(0) zur Zeit t = 0 vorzugeben, könnten wir dies auch zu jeder anderen
Zeit t0 machen. Dann lautet die Lösung der Differentialgleichung mit diesem Anfangswert
 Rt 
w(t) = U (t, t0 )w(t0 ) wobei U (t, t0 ) = T exp A(s)ds
t0
d
dt U (t, t0 ) = A(t)U (t, t0 ), U (t0 , t0 ) = 1.
Wegen
w(t) = U (t, s)w(s) = U (t, s)U (s, t0 )w(t0 ) = U (t, t0 )w(t0 )
und der Eindeutigkeit der Lösung, ist
U (t, s)U (s, t0 ) = U (t, t0 ) =⇒ U −1 (t, t0 ) = U (t0 , t).
Die U (t, s) bilden eine einparametrige Gruppe von Transformationen.

2.2.2 Inhomogene lineare Differentialgleichungen

Wir suchen die Lösungen der inhomogenen Differentialgleichung

ẇ = A(t)w + B(t). (2.21)

Wir setzten
 Zt 
w(t) = U (t)f (t), U (t) = T exp A(s)ds .
0

Wegen ẇ = Aw + U f˙ ≡ Aw + B muß offensichtlich f˙ = U −1 B gelten, bzw.


Zt
f (t) = U −1 (s)B(s)ds + K
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.2. Lineare Systeme mit variablen Koeffizienten 17

mit konstantem K. Damit lautet die allgemeine Lösung der inhomogenen Differentialglei-
chung (2.21)

 Zt 
w(t) = U (t) U −1 (s)B(s)ds + w(0) . (2.22)
0

Beispiel: Die Bewegungsgleichung eines harmonischen Oszillators unter dem Einfluß einer
äußeren Kraft F ist

ü(t) + ω 2 u(t) = f (t),

wobei wir die Masse m = 1 gesetzt haben. Diese Gleichung ist äquivalent zu
   
0 1 0
ẇ = Aw + B, A= , B(t) =
−ω 2 0 f (t)

Wegen A2 = −ω 2 findet man

ω 2 t2 ω 2 t3 1
 
cos ωt sin ωt
U (t) = etA = 1 + tA − − A − ... = ω .
2! 3! −ω sin ωt cos ωt

Damit lautet die Lösung der Differentialgleichung

 Zt 
− ω1 sin ωs
 
At
w(t) = e f (s) + w(0) .
cos ωs
0

Nach einer kurzen Rechnung ergibt sich

Zt
sin ωt 1
u(t) = w1 (t) = u(0) cos ωt + u̇(0) + sin ω(t − s)f (s),
ω ω
0

als allgemeine Lösung für u. Dabei sind w1 (0) = u(0) und w2 (0) = u̇(0) die anfängliche
Position und Geschwindigkeit des Oszillators. Ist f (t) = sin αt, α 6= ω, d.h. ist die äußere
Kraft nicht in Resonanz mit den Eigenschwingungen des harmonischen Oszillators, dann ist
1 sin αt + sin ωt sin αt − sin ωt
u(t) = w1 (t) = u(0) cos ωt + u̇(0) sin ωt + − .
ω 2(α + ω)ω 2(α − ω)ω

Diese Lösung ist für alle Zeiten beschränkt. Der harmonische Oszillator ist stabil unter der
Störung. Im Resonanzfall f = sin ωt ist die Lösung
1 sin ωt t
u(t) = u(0) cos ωt + u̇(0) sin ωt + 2
− cos ωt.
ω 2ω 2ω
Wegen des Resonanzterms ∼ t cos ωt wächst die Amplitude an. Der Oszillator ist instabil.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 18

2.3 Nichtlineare Differentialgleichungen

Es sei G ein offenes und zusammenhängendes Gebiet im Rn und w ∈ G. Gegeben sei eine
Funktion

f : R × G −→ Rn
(t, w) −→ f (t, w).

Wir wollen allgemeine Differentialgleichungssysteme der Form

ẇ = f (t, w) mit w(t0 ) = w0 ∈ G (2.23)

studieren. Wie im linearen Fall ist diese Differentialgleichung, zusammen mit der Anfangs-
bedingung, äquivalent zur Integralgleichung

Zt
w(t) = w0 + f (s, w(s))ds. (2.24)
t0

Wir wollen voraussetzen, daß f in R × G stetig ist und stetig differenzierbar in G. Statt stetig
differenzierbar kann man auch die etwas schwächere Lipschitzbedingung fordern:

|f (t, w) − f (t, w̃)| ≤ L|w − w̃| auf G.

Mit diesen Voraussetzungen kann man zeigen, daß die Abbildung


Zt

w −→ T (w), T (w) (t) = w0 + f (s, w(s))ds
t0

auf der Menge der stetigen Funktionen w : [t0 , t] → Rn für genügend kleine t − t0 einen
Fixpunkt hat. Solch ein Fixpunkt löst die Differentialgleichung (2.23). Auf diesem Wege
gelangt man zu folgendem Existenz- und Eindeutigkeitssatz:

Satz: Unter den obigen Voraussetzungen hat das System (2.23) lokal genau eine Lösung: Es
gibt ein Intervall (t1 , t2 ) ∋ t0 und genau eine differenzierbare Funktion w : (t1 , t2 ) → G, so
daß (2.23) für t ∈ (t1 , t2 ) gilt.

Aufgrund dieses Existenz und Eindeutigkeitsatzes gibt es genau eine Lösungsfunktion w =


L(t, t0 , w0 ), wobei L(t0 , t0 , w0 ) = w0 ist. Im autonomen Fall ist f zeitunabhängig und jede
Anfangszeit ist so gut wie jede andere. Nur die Zeitdifferenz t − t0 ist von Bedeutung. Des-
halb braucht man t0 nicht zu schreiben. Die Kurve L(t, w0 ) ist für feste Anfangsbedingung
eine partikuläre Lösungskurve (Trajektorie) der Differentialgleichung. Für festes t ist die
Abbildung

w0 −→ L(t, w0 )

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 19

der Fluß. Wegen

L(t + s, w0 ) = L(t, L(s, w0 )) ist Lt+s = Lt ◦ Ls

und der Fluß Lt eine 1-parametrige Gruppe. Wegen der Eindeutigkeit der Lösungen geht
durch jeden Punkt ∈ G genau eine Lösungskurve.

2.3.1 Einige einfache und exakt lösbare nichtlineare DG

In seltenen Fällen kann man eine nichtlineare DG explizit lösen. Hier einige Beispiele:

Bernoullische DG: Ein Beispiel für eine lösbare Gleichung ist die Bernoullische DG

ẇ = a(t)w + b(t)wα , α 6= 1.

Ersetzt man w durch v = w1−α dann geht diese nämlich in die lineare DG

v̇ = β a(t)v + b(t) , β =1−α

über. Mit den Resultaten des letzten Kapitels ist dann

 Zt  Zt
v(t) = U (t) β U −1 (s)b(s)ds + v(0) ,

wobei U (t) = exp β a(s)ds .
0 0

Die Riccatische DG

ẇ = a(t)w + b(t)w2 + c(t),

ist allgemein lösbar, wenn man eine spezielle Lösung w∗ (t) kennt. Dazu setzen wir w =
w∗ + 1/v. Benutzen wir, daß w∗ die DG erfüllt, so ist w genau dann eine Lösung, wenn

−v̇ = (a + 2bw∗ )v + b

ist. Zum Beispiel ist w∗ = 2 eine spezielle Lösung der logistischen Gleichung ẇ = w − w2 + 2.
Damit lautet die Gleichung für v
1
ke3t − 1 .

v̇ = 3v + 1 =⇒ v =
3
Damit ist die allgemeine Lösung der logistischen Gleichung
3
w =2+ .
ke3t −1
Das nächste Beispiel ist nicht mehr analytisch lösbar.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 20

2.3.2 Räuber-Beute Problem

Es sei w1 die Anzahl Beutetiere und w2 die Anzahl Räuber. Als Modell für die Änderung
der Spezies nehmen wir
ẇ1 = aw1 − cw1 w2
, a, b, c, d > 0
ẇ2 = −bw2 + dw1 w2
Ohne Räuber würde die Anzahl Beutetiere exponentiell zunehmen und ohne Beutetiere
würde die Anzahl Räuber wegen Nahrungmangel exponentiell abnehmen. In der Tat,
 at   
e 0
w(t) = und w(t) =
0 e−bt
sind spezielle Lösungen der Differentialgleichung. Wegen dem Eindeutigkeitssatz kann des-
halb keine Lösung die Achse w1 = 0 bzw. w2 = 0 schneiden.

Die quadratischen Terme modellieren die Abnahme der Beutetiere weil diese von den Räubern
gefressen werden und die Zunahme der Räuber weil diese Nahrung finden. Qualitativ kann
man die Lösungen diskutieren indem man das Vektorfeld
 
aw1 − cw1 w2
f (w) = in ẇ = f (w)
−bw2 + dw1 w2
betrachtet (siehe Figur (2.3)). Zum Beispiel ist es interessant zu wissen, ob es eine Gleich-
gewichtslösung gibt wobei f (w) = 0 und damit ẇ = 0 ist, und wenn ja, ob diese stabil oder
instabil ist. Das Räuber-Beute-Modell hat zwei Gleichgewichtslösungen, nämlich
   
(1) 0 (2) b/d
w = und w = .
0 a/c
Die linearisierten Gleichungen in der Nähe der Fixpunkte haben die Form w ∼ (∇f )(w(i) )w =
A(i) w. Man findet
   
(1) a 0 (2) 0 −bc/d
A = und A = .
0 −b ad/c 0
Offensichtlich ist der Ursprung in der linearisierten Gleichung ein Sattelpunkt und damit
instabil und der zweite Fixpunkt ein Zentrum und damit stabil. Diese Verhalten gilt auch für
die exakten Lösungen des nichtlinearen Problems. Das Gleichgewicht mit b/d Beutetieren
und a/c Räuber ist ein stabiles Gleichgewicht. Viele dieser Eigenschaften kann man schon
aus dem Vektorfeld f (w) in (2.3) ablesen. Die anschauliche Vektorfeldmethode funktioniert
allerdings nur schön bei autonomen Systemen für die f nicht explizit von der Zeit abhängt.
Für nicht-autonome Systeme ändert sich das Vektorfeld f mit der Zeit.

2.3.3 Stabilität

Es sei w∗ (t) eine Lösung von (2.23). Wir wollen Lösungen in der Nähe von w∗ studieren,
d.h. wir setzen
w = w∗ (t) + η.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 21

w2 stabiler Fixpunkt

w1

instabiler Fixpunkt

Abbildung 2.3: Vektorfeld für Räuber-Beute Problem (a = b = c = d = 1)

Dann ist
η̇ = ẇ − ẇ∗ (t) = f (t, w) − f (t, w∗ (t)) = f (t, w∗ (t) + η) − f (t, w∗ (t))
X ∂fi
t, w∗ (t) ηj + r(t, η) = A(t)η + r(t, η).

= j
ij
∂w

Vernachlässigen wir den Restterm r(t, η) dann lautet die linearisierte Gleichung für die
Störung

∂fi
t, w∗ (t) .

η̇ = A(t)η mit Aij (t) = (2.25)
∂wj

Eine Lösung w(t, t0 , w0∗ ) heißt stabil (im Sinne von Liapunov) falls es zu jedem ǫ > 0 ein
δ > 0 gibt, so daß für |w0 − w0∗ | < δ

1) w(t, t0 , w0 ) für t0 ≤ t < ∞ existiert,

2) |w(t, t0 , w0 ) − w(t, t0 , w0∗ )| < ǫ für alle t0 ≤ t < ∞ ist.

Eine Lösung heißt asymptotisch stabil, wenn zusätzlich

3) |w(t, t0 , w0 ) − w(t, t0 , w0∗ )| −→ 0 für t −→ ∞ gilt.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 22

-1
-1 0 1 2

Abbildung 2.4: Die Lösungskurven für das Räuber-Beute-Modell (a = b = c = d = 1)

2.3.4 Liapunov Funktionen

Wir wollen zunächst ein autonomes System betrachten,

ẇ = f (w) mit f (0) = 0. (2.26)

Dann ist w = 0 eine Gleichgewichtslösung des autonomen Differentialgleichungssystems.


In dieser Situation gibt es ein hilfreiches Kriterium von Liapunov für die Stabilität des
Fixpunktes w = 0. Dazu brauchen wir den Begriff der Liapunov-Funktion für das System
(2.26):

Eine Funktion V : U → R auf einer Umgebung U von w = 0 heißt Liapunov-Funktion


bezüglich (2.26) falls

1. ∇V auf U stetig ist,


2. V (0) = 0 und V > 0 auf U − {0}
3. ∇V · f ≤ 0 auf U − {0}

gelten. Nun gilt der folgende

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 23

ε
δ w ( t,t 0 ,w*)
0

w *0

w0
w ( t, t 0,w0 )

δ w ( t,t 0,w*)
0
ε (t) 0
w 0*

w0 w ( t, t 0 ,w0 )

Abbildung 2.5: Stabile und asymptotisch stabile Lösungen

Satz: Existiert eine Liapunov-Funktion für (2.26), dann ist w = 0 eine stabile Lösung des
Systems. Ist ∇V · f < 0 in U − {0} dann ist w = 0 asymptotisch stabil.

Dieses Theorem von Liapunov kann angewandt werden ohne die Differentialgleichung zu
lösen. Anderseits gibt es keine systematische Methode um eine Liapunov-Funktion zu finden.
Für mechanische Systeme ist die Energie eines benachbarten Systems ein guter Kandidat
für diese Funktion. Für thermodynamische Systeme ist die negative Entropiefunktion eine
Liapunovfunktion.

Beweis: Es sei ǫ so klein gewählt, daß die Kugel Kǫ mit Radius ǫ in U liege. Es sei α das
Minimum von V auf der Kugeloberfläche,

α = min V (w) > 0.


|w|=ǫ

Es sei weiter
α
M := {w|V (w) ≤ } ∩ Kǫ
2
und M ′ die Zusammenhangskomponente von M die w = 0 enthält. Wähle nun ein δ > 0, so
daß Kδ ⊂ M ′ . Es seien nun w(t, w0 ) eine Lösung mit w0 ∈ Kδ . Nach der zweiten Eigenschaft
der Liapunov Funktion ist
d 
V w(t, w0 ) = ∇V · ẇ = ∇V · f ≤ 0.
dt

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 24

Daraus folgt, daß V w(t, w0 ) ≤ α/2 ist, und damit ist w(t, w0 ) in M ′ wegen der Stetigkeit


der Lösung. Daraus folgt dann, daß w(t, w0 ) ∈ Kǫ , woraus die Behauptung folgt.

w2

f
w(t)
w1
V

Abbildung 2.6: Liapunov Funktion für ẇ = f (w).

Beispiel: Wir betrachten den harmonischen Oszillator mit Reibung,


ẍ + h(x, ẋ)ẋ + x = 0, h(x, ẋ) ≥ 0.
Mit w1 = x und w2 = ẋ ist dies äquivalent zu
 
w2
ẇ = f (w), f= .
−h(w)w2 − w1
Die Energie für den Oszillator ohne Reibung, V = w12 + w22 ist eine Liapunov Funktion. Dazu
müssen wir nur die dritte Bedingung nachprüfen:
 dV dV 
(∇V · f ) = f1 + f2 = −2h(w)w22 ≤ 0.
dw1 dw2
Damit ist auch die dritte Bedingung erfüllt. Diese bedeutet auch, daß ∇V · ẇ ≤ 0 ist. Längs
der Bahnen w(t) nimmt also die Liapunov-Funktion, in unserem Beispiel also die Energie des
reibungsfreien Vergleichsystems, ab. Das Pendel spiralt in den Gleichgewichtpunkt w = 0
hinein.

2.3.5 Lineare Stabilität bedingt Stabilität

Wir wollen noch einen zweiten, wichtigen Satz behandeln.

Satz: Es sei ẇ = f (w) mit f (0) = 0 ein autonomes System. Weiter sei f (w) = Aw +
r(w), A = (∇f )(0), wobei die Realteile der Eigenwerte von A alle kleiner als −c < 0 seien.
Dann gibt es eine Umgebung U ⊂ G von w = 0 so daß

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.3. Nichtlineare Differentialgleichungen 25

i) w(t, w0 ) definiert ist und in U bleibt für alle w0 ∈ U, t > 0.

ii) Es gilt
|w(t, w0 )| < ae−ct |w0 |
für alle w0 ∈ U, t ≥ 0. Speziell gilt w(t, w0 ) → 0 für t → ∞ für alle w0 ∈ U .

Dieser Satz besagt also, daß der Fixpunkt attraktiv ist falls er bezüglich der linearisierten
Differentialgleichung attraktiv ist.

Es gilt in gewissem Sinne auch die Umkehrung: Hat ein Eigenwert von A einen positive
Realteil, dann ist der Fixpunkt instabil. Liegt ein Eigenwert auf der imaginären Achse,
dann muß man die Methode der Zentrumsmannigfaltigkeiten anwenden.

Um zu entscheiden, ob alle Nullstellen von p(λ, A) negative Realteil haben kann man das
Kriterium von Routh-Hurwitz benutzen:

Kriterium von Routh-Hurwitz: Alle Nullstellen des Polynoms


an λn + an−1 λn−1 + . . . + a1 λ = 0 = 0
mit reellen Koeffizienten ak und an > 0 liegen genau dann in der linken offenen Halbebene
von C wenn die Determinanten der Untermatrizen
a1 a0 0 0 ... 0
 
 
  a1 a0 0  a3 a2 a1 a0 . . . 0 
a1 a0
a1 , det ,  a3 a2 a1  . . . 
 ... .. 
a3 a2 . 
0 0 a3
a2n−1 a2n−2 a2n−3 . . . . . . an
(am = 0 für m > n) positiv sind. Die Form der Matrizen wird ersichtlich, wenn man die
Diagonale betrachtet.

Beispiel: Der Gleichgewichtspunkt w = 0 der Differentialgleichung


ẅ + 2ẇ + w = wn , n = 2, 3, . . .
ist asymptotisch stabil.

Beweis des Satzes: Die allgemeine Lösung der linearisierten Gleichung ist U (t)w(0) und ist
die Summe von Termen tk exp(λi t). Damit gibt es Konstanten γ, λ > 0 so daß
|U (t)w0 | ≤ γe−λt |w0 |
für alle positiven t. Nun wollen wir den Einfluß des Restterms r(w) = o(w) abschätzen. Zu
jedem χ > 0 gibt es ein ρ > 0 so daß
|w| < ρ =⇒ |r(w)| < χ · |w|.
Wie im linearen Fall ist die Differentialgleichung zusammen mit der Anfangsbedingung äqui-
valent zu der Integralgleichung
Zt
 
w(t, w0 ) = U (t)w0 + U (t − s)r w(s, w0 ) ds.
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 26

Wir schätzen ab:


Zt Zt
|U (t − s)r w(s, w0 ) |ds ≤ γe−λt |w0 | + γχ e−λ(t−s) |w(s, w0 )|ds.
 
|w(t, w0 )| ≤ |U (t)w0 | +
0 0

Setzen wir y(t) = exp(λt)|w(t, w0 )| dann schreibt sich diese Ungleichung auch
Zt
y(t) ≤ c1 + c2 y(s)ds, c1 = γ|w0 |, c2 = γχ.
0

Offensichtlich ist y(t) kleiner oder gleich


Zt
Y (t) ≡ c1 + c2 y(s)ds.
0

Wegen

d Ẏ y
Ẏ = c2 y ist log Y = = c2 ≤ c2 .
dt Y Y
Damit ist

log Y (t) ≤ c2 t + log Y (0) bzw. Y (t) ≤ c1 ec2 t .

Wir haben damit das Lemma von Cronwall bewiesen:

Lemma (Cronwall) Falls


Zt
y(t) ≤ c1 + c2 y(s)ds dann ist y(t) ≤ c1 ec2 t .
0

Damit haben wir gezeigt, daß

|w(t, w0 )| ≤ γ|w0 |e(γχ−λ)t

gilt. Nun ist es einfach einzusehen, daß die Lösung stabil ist. Nun wählen wir χ so klein, daß
γχ − λ negativ ist. Dies bedeutet eine Wahl von ρ. Als nächstes sei |w0 | < δ = ǫ/γ. Dann ist
offensichtlich |w(t, w0 )| < ǫ für alle t und strebt in der Tat gegen den Fixpunkt w = 0 für
große t. Damit streben Lösungen, die in der Nähe des Fixpunktes starten für große Zeiten
in den Fixpunkt. Der Fixpunkt w = 0 ist asymptotisch stabil.

2.4 Periodische Systeme

Gegeben sei ein System

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 27

ẇ = f (t, w) = A(t)w + r(t, w) mit periodischem f :


(2.27)
A(t + T ) = A(t), r(t + T, w) = r(t, w)

und wir wollen annehmen, daß

r(t, w) = o(|w|) gleichmäßig in t.

Also ist w = 0 eine Lösung der Differentialgleichung. Es sei nun w = L(t, t0 , w0 ) die Lösung
die zur Zeit t0 bei w0 startet. Für die Stabilitätsuntersuchung von periodischen Systemen
definiert man die

Def: Poincare Abbildung:

P : w0 −→ L(T, 0, w0 ).

Wegen

w-Raum w-Raum w-Raum

P(w 0) = w(T,w 0 )

w0

periodische Lösung w (t.0)

Abbildung 2.7: Poincare Abbildung P : w0 → P (w0 ).

L(2T, 0, w0 ) = L(2T, T, L(T, 0, w0 )) = L(T, 0, L(T, 0, w0 )) = (P ◦ P )(w0 )

und der entsprechenden Relation für 2T → nT (Induktion) hat man die wichtige Eigenschaft

L(nT, 0, w0 ) = P n (w0 ), n = 0, 1, 2, . . . (2.28)

Da w = 0 eine Lösung der Differentialgleichung ist, ist P (0) = 0. Wir wollen P um 0


entwickeln:

P (w0 ) = (∇P )(0) · w0 + g(w0 ) ≡ M w0 + g(w0 ).

Die Matrix M ist die Monodromie-Matrix und die Eigenwerte von M sind die Floquet-
Multiplikatoren. Es stellt sich nun die Frage wie man M berechnet und was M über die
Stabilität der Bahn w = 0 besagt.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 28

Um M zu bestimmen, stellen wir uns vor, daß w(t, w0 ) eine Lösung des periodischen Systems
ist,
∂w 
(t, w0 ) = A(t)w(t, w0 ) + r t, w(t, w0 )
∂t
und variieren die anfängliche Position w0 in dieser Gleichung. Wir differenzieren nach w0
und setzen dann w0 = 0:
∂ ∂w ∂w ∂r  ∂w
(t, 0) = A(t) (t, 0) + t, w(t, 0) (t, 0).
∂t ∂w0 ∂w0 ∂w ∂w0
Da w(t, 0) = 0 ist und die Ableitung von r an der Stelle w = 0 verschwindet, folgt

∂ ∂w
U (t) = A(t)U (t) wobei U (t) = (t, 0) =⇒ U (0) = 1. (2.29)
∂t ∂w0
Anderseits ist
∂P ∂w
P (w0 ) = w(T, w0 ) =⇒ (0) = (T, 0) = U (T )
∂w0 ∂w0
woraus folgt, daß die Monodromiematrix gerade U zur Zeit T ist. Die lineare Differenti-
algleichung (2.29) haben wir bereits im vorletzten Kapitel (formal) gelöst. Damit finden
wir

 Zt 
M = U (T, 0), wobei U (t, 0) = T exp A(s)ds . (2.30)
0

2.4.1 Mathieusche Differentialgleichung, Blochwellen und Stabilität

Die Mathieusche Differentialgleichung (r = 0) wird gewöhnlich in der Form

ẅ + (a + 16b cos 2t)w = 0

geschrieben; a und b sind Konstanten. Dies ist eine lineare DG mit


 
0 1
A= .
−a − 16b cos 2t 0

Die allgemeine Lösung der Differentialgleichung ist w(t) = U (t, 0)w0 , wenn w(0) = w0 die
Anfangsbedingung ist. Wegen

U (t + π, 0) = U (t + π, π)U (π, 0) = U (t + π, π)M.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 29

Nun ist aber


π+t
Z Zt
   
U (t + π, π) = T exp A(s)ds = T exp A(s)ds = U (t, 0),
π 0

wobei wir benutzten, daß A(π + s) = A(s), und damit ist

U (t + nπ, 0) = U (t, 0)M n

Offensichtlich hat die Mathieusche DG eine periodische Lösung, wenn w(π) = M w(0) = w(0)
für mindestens ein w(0) gilt, d.h. wenn die Monodromie-Matrix M einen Eigenvektor mit
Eigenwert 1 hat. Im Allgemeinen kann man nicht erwarten eine periodische Lösung zu finden,
wenn nicht die Konstante a bestimmten Beschränkungen unterliegt. Es stellt sich heraus,
daß a eine komplizierte Funktion von b sein muß, wenn die Lösung periodisch sein soll.

Wir wollen annehmen, daß die Monodromiematrix M eines linearen Differentialgleichungs-


systems mit periodischen Koeffizienten diagonalisierbar sei. Die Nullstellen des charakteri-
stischen Polynoms seien {λi }. Es sei
−t/T
w̃i (t) = λi wi (t) =⇒ w̃i (T ) = λ−1 −1
i wi (T ) = λi M w̃i (0).

Dann hat λ−1 i M einen Eigenvektor mit Eigenwert 1 und der entsprechende Eigenvektor
w̃i (0) = wi (0) ist der Startpunkt einer periodischen Lösung w̃i (t). Damit hat die Differenti-
algleichung Lösungen der Form
t/T
wi (t) = λi w̃i (t), w̃i periodisch.

Die Mathieusche Differentialgleichung ist invariant unter t → −t. Deshalb ist w(t) =
λ−t/π w̃(−t) die zweite unabhängige Lösung. Damit hat man diese Differentialgleichung im
Prinzip gelöst. Dieses Ergebnis ist als Satz von Floquet bekannt.

Eine wichtige Anwendung dieses Ergebnisses ist die Schrödingergleichung in einem periodi-
schen Kristall. Die Schrödingergleichung
d2 ψ
+ [A + V (x)]ψ = 0,
dx2
wobei A eine Konstante und V eine periodische Funktion mit V (x + l) = V (x) ist, hat
Lösungen der Gestalt

ψ = eikx v(x), v periodisch.

Dies wird verschiedentlich als Satz von Bloch bezeichnet. Die Lösungen sind die Blochwellen.

Im nichtlinearen Fall löst eine Lösung von (2.27) die Integralgleichung

 Zt 
w(t) = U (t) U −1 (s)r(s, w(s))ds + w(0) , U (t) = U (t, 0),
0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 30

so daß
ZT
w(T ) = M w(0) + M U −1 (s)r(s, w(s))ds.
0

Mit ähnlichen Methoden wie beim Beweis der asymptotischen Stabilität von linear stabilen
Systemen kann die Stabilität von w0 → P n w0 untersucht werden. Man findet das

Lemma: Liegen alle Eigenwerte der Monodromie-Matrix M innerhalb des Einheitskreises


(|λk | < 1) und ist det M > 0, dann ist der Fixpunkt w = 0 bezüglich P n asymptotisch
stabil.

2.4.2 Feigenbaumbifurkation

Statt des Beweises diskutieren wir ein illustratives Beispiel, nämlich die Feigenbaumbifur-
kation. Es sei

P (w) = 4λw(1 − w)

eine Poincareabbildung mit λ ≤ 1. Diese nicht-monotone Abbildung bildet das Intervall [0, 1]
auf sich ab. Sie hat die periodischen Bahnen
1
w = 0 und w =1− = w1 ,

da beides Fixpunkte von P sind. Die zweite Bahn existiert nur für λ ≥ λ1 = 1/4 (für kleinere
λ’s läge sie außerhalb des Intervalls [0, 1]). Wegen P ′ = 4λ(1 − 2w) ist

P ′ (0) = 4λ und P ′ (1 − 1/4λ) = 2 − 4λ.

Wir haben damit die folgende Situation:

1) Für festes 0 < λ < λ1 besitzt das System genau einen Fixpunkt w = 0. Dieser ist stabil,
weil |P ′ (0)| < 1 gilt.

2) Für festes λ mit λ1 < λ < λ2 = 3/4 besitzt das System zwei Fixpunkte w = 0 und
w = w1 , wobei w = 0 instabil und w = w1 stabil ist.

Nun wollen wir untersuchen was passiert, wenn λ > λ2 ist.

3) Für festes λ mit λ2 < λ < λ3 besitzt das System eine periodische Bewegung der Periode
2T zwischen den Punkten w21 und w22 . Die Stabilität dieser periodischen Bewegung folgt
daraus, daß diese Punkte stabile Fixpunkte der iterierten Poincare-Abbildung P 2 ist: Wegen
P (w21 ) = w22 und P (w22 ) = w21 gilt offensichtlich

P 2 (w21 ) = P (w22 ) = w21 und P 2 (w22 ) = P (w21 ) = w22 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 31

P(w) P(w)

w PQ w

P 2 (w)

instabiler
Fixpunkt

stabiler
Fixpunkt

P Q w

Abbildung 2.8: Feigenbaum-Bifurkation

Natürlich sind die Fixpunkte von P auch Fixpunkte der iterierten Abbildung P 2 . Diese
Fixpunkte von P und P 2 , nämlich w = 0 und w = w1 , sind instabil.

Bei weiterer Vergrößerung von λ werden die stabilen Fixpunkte von P 2 instabil und es
entstehen Bewegungen der Periode 2T von P 2 , d.h. Bewegungen der Periode 4T von P ,
usw.

Wir haben also gesehen, daß ein Attraktor (stabiler Fixpunkt) der Periode T geht bei λ =
3/4 in einen Attraktor der Periode 2T über. Für P sind dies zwei oszillierende Werte w21
und w22 , für P 2 entspricht dieser Orbit einem Fixpunkt. Überschreitet λ den Wert λ3 , so
wird der Fixpunkt von P 2 instabil. Die entsprechende Bahn der Periode 2T wird zu einer
oszillierenden Bahn, einer Bahn der Periode 4T , usw. Das Interessante an der Feigenbaum
Bifurkation ist, daß der Grenzwert
λn+1 − λn
lim = δ ∼ 4.6692
n→∞ λn+2 − λn+1

eine universelle Konstante ist: Für eine große Klasse von Iterationsverfahren auf [0, 1] tritt
bei Übergängen zum Chaos mit Periodenverdopplung dieselbe Konstante δ auf. Für λ >
λc = 0.892486417967 . . . tritt ein im Wesentlichen chaotisches Verhalten auf. Unabhängig
von der Wahl von w0 ist die Reihe w0 , P (w0 ), P 2 (w0 ), . . . ’chaotisch’: Für einige Startwerte
w0 sind die Orbits P n (w0 ) aperiodisch, d.h. konvergieren gegen keinen endlichen Attraktor.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 2. Differentialgleichungen 2.4. Periodische Systeme 32

Für die meisten Startwerte sind die Orbits periodisch. Aber die Perioden sind so groß, daß
sie kaum sichtbar sind. Weiterhin führen nahe beieinander liegende Startwerte zu völlig
unterschiedlichen Orbits. Dies wurde zum erstenmal von P.J. Myrberg in den frühen 60’ern
festgestellt. Etwa 10 Jahre später haben Metropolis, Stein und Stein die Resultate auf andere
Abbildungen [0, 1] → [0, 1] verallgemeinert.

p
8

p
3

p
2

p1

Abbildung 2.9: Feigenbaum-Bifurkation

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3

Spezielle Funktionen

In diesem Kapitel untersuchen wir die für die QM wichtigen Differentialgleichungen

w′′ + p(x)w′ + q(x)w = 0, (3.1)

etwas genauer. Mit Hinblick auf die Anwendungen bezeichnen wir im Folgenden die un-
abhängige Variable mit x anstatt mit t. Die Koeffizientenfunktionen p und q können dabei
Singularitäten aufweisen.

3.1 Die Legendresche Differentialgleichung

Eine DG von besonderem Interesse ist die Legendresche Differentialgleichung

(1 − x2 )w′′ − 2xw′ + l(l + 1)w = 0, (3.2)

wobei l eine Konstante ist. Offensichtlich haben die Koeffizientenfunktionen p = −2x/(1−x2 )


und q = l(l + 1)/(1 − x2 ) bei x = ±1 einfache Pole. Wir versuchen eine Lösung in Form
einer formalen Potenzreihe in x zu finden. Ist α die niedrigste vorkommende Potenz, dann
hat die Reihe die Form


X
α
w=x an xn , a0 6= 0. (3.3)
0

Wir nehmen an die Reihe konvergiert (dies kann hinterher überprüft werden), so daß (3.3)

33
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 34

gliedweise differenziert werden darf. Einsetzen von (3.3) in (3.2) ergibt


X X 
an (α + n)(α + n − 1)xα+n−2 = an (α + n)(α + n + 1) − l(l + 1) xα+n .

n n

Dies ist nur möglich wenn der Koeffizient jeder Potenz von x verschwindet. Da n ≥ 0 ist,
kommen als niedrigste Potenzen α−2 und α−1 vor, und zwar nur auf der linken Seite. Also
muß
a0 α(α − 1) = 0 und α(α + 1)a1 = 0
gelten. Dies sind die sogenannten Bestimmungleichungen. Da a0 6= 0 vorausgesetzt wurde,
implizieren diese
α = 0 oder α = 1.
Der Koeffizientvergleich bringt an+2 mit an folgendermassen in Verbindung
(α + n)(α + n + 1) − l(l + 1)
an+2 = an .
(α + n + 1)(α + n + 2)
Für α = 0 kann man a0 und a1 beliebig vorgeben und findet
n(n + 1) − l(l + 1)
an+2 = an , n = 0, 1, 2, . . .
(n + 1)(n + 2)
mit den Lösungen
(−)r l(l−2) · · · (l−2r+2) · (l+1)(l+3) · · · (l+2r−1)
a2r = αr a0 = a0
(2r)!
(−)r (l−1)(l−3) · · · (l−2r+1) · (l+2)(l+4) · · · (l+2r)
a2r+1 = βr a 1 = a1 .
(2r+1)!
Für α = 1 muß a1 = 0 gelten und es treten nur gerade Potenzen in der Reihenentwicklung
auf. Für ein willkürlich vorgegebenes a0 findet man für α = 1
(n + 1)(n + 2) − l(l + 1)
an+2 = an , n = 0, 2, 4, . . .
(n + 2)(n + 3)
mit der Lösung
a2r = βr a0 .
Es ergeben sich die folgenden Potenzreihenentwicklungen: Für α = 0:

X X
w = a0 αr x2r und w = a1 x βr x2r
(3.4)
r=0,... r=0,...

und für α = 1:
X
w = a0 x βr x2r .
r=0,...

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 35

Diese letzte Lösung ist gleich dem a1 -Anteil der ersten Lösung. Es genügt daher, den Fall
α = 0 zu untersuchen. Wegen
an+2
−→ 1 für n −→ ∞
an
sind die obigen Reihen absolut konvergent für |x| < 1. Die Reihen definieren analytische
Funktionen innerhalb des Einheitskreises.

Es ist auch möglich Lösungen außerhalb des Einheitskreises zu finden. Dazu machen wir den
Reihenansatz

X an
w = xα .
0
xn

Setzen wir in die Differentialgleichung ein, so finden wir


  a1 
0 = xα α(α + 1) − l(l + 1) a0 + (α − 1)α − l(l + 1)
 
x
X∞   1
 
+ (α−n−2)(α−n−1) − l(l + 1) an+2 − (α−n)(α−n−1)an n+2
n=0
x

Die Bestimmungsgleichungen ergeben sich nach Nullsetzen der Koeffizienten der höchsten
beiden Potenzen:

[α(α + 1) − l(l + 1)]a0 = 0 und [(α − 1)α − l(l + 1)]a1 = 0.

Da wir a0 6= 0 voraussetzen, muß

α=l oder α = −(l + 1)

gelten und damit muß a1 verschwinden. Die Rekursionsrelationen sind


(α − n)(α − n − 1)
an+2 = an .
(α − n − 2)(α − n − 1) − l(l + 1)
Für α = l und α = −l − 1 vereinfachen sich diese zu
(l − n)(l − n − 1) (l + n + 1)(l + n + 2)
an+2 = an resp. an+2 = an .
(n + 2)(n − 2l + 1) (n + 2)(n + 2l + 3)
Damit sind die beiden Potenzreihenentwicklungen

 X (l−2r+1)(l−2r+2) · · · (l−1)l 
w = xl 1 + (−1)r x−2r a0
r=1,...
2r · · · 2 · (2l−2r+1) · · · (2l−3)(2l−1)
(3.5)
 X (l+1) · · · (l+2r) 
w = x−l−1 1+ x−2r a0
r=1,···
2 · 4 · · · 2r(2l+3)(2l+5) · · · (2l+2r+1)

Diese Reihen konvergieren absolut für |x| > 1 und definieren dort analytische Funktionen.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 36

Wir verfügen nun über zwei Arten von Lösungen der Legendreschen DG: Die Reihen (3.4)
konvergieren innerhalb des Einheitskreises und die Reihen (3.5) außerhalb. Für bestimmte
l können diese Reihen zu Polynomen werden. Die Reihe (3.4a) bricht ab für positive gerade
oder negative ungerade l. Im ersten Fall, l = 2k löst dann das Polynom
 l(l + 1) 2 l(l − 2) · · · 2 · (l + 1) · · · (2l − 1) l 
w =a 1− x + . . . + (−1)l/2 x
2! l!
die DG. Für diese l bricht aber auch die Reihe (3.5a) ab und wird zum Polynom
 l(l − 1) −2 l! 
w = axl 1 − x + . . . + (−1)l/2 x−l .
2(2l − 1) l(l − 2) . . . 2 · (l + 1) · · · (2l − 1)
Diese beiden Lösungen werden identisch, wenn man die zweite mit dem konstanten Faktor
l(l − 2) · · · 2 · (l + 1) . . . (2l − 1)
(−1)l/2
l!
multipliziert. Die partikulären Lösungen (3.4a) und (3.5a) sind also gleich für gerade positive
l. Ist l ungerade und negativ zeigt ein Vergleich, daß (3.4a) und (3.5b) identisch sind.

Die Reihe (3.4b) bricht ab wenn l ungerade und positiv oder gerade und negativ ist. Ist l
ungerade und positiv, so ergibt sich aus (3.4b)
 (l−1)(l+2) 3 l−1 (l−1)(l−3) · · · 2 · (l+2) · · · (2l−1)

w =a x− x + . . . + (−1) 2 xl
3! l!
während (3.5a) zu
 l(l−1) −2 l−1 l! 
w = axl 1 − x + . . . + (−1) 2 x−l+1
2(2l−1) 2 · 4 · (l−1) · (l+2) · · · (2l−1)
wird. Diese beiden Polynome sind aber bis auf einen Faktor identisch. Ist l gerade und
negativ, so geht (3.4b) in (3.5b) über.

Die Lösungen (3.5) sind in der mathematischen Physik von großer Bedeutung. Setzt man
die Konstante in a0 in (3.5a) gleich
(2l)! (2l − 1)(2l − 3) · · · 1
=
2l (l!)2 l!
so heißt das sich ergebende Polynom l-ten Grades Legendrepolynom:

(2l − 1)!!xl  l(l−1) −2 l(l−1)(l−2)(l−3) −4 


Pl (x) = 1− x + x − ··· . (3.6)
l! 2(2l−1) 2 · 4(2l−1)(2l−3)

Die Reihe ist bis zum konstanten Glied herab fortzusetzen. Anderseits bezeichnet man (3.5b)
mit der Konstanten
2l (l!)2
a0 = , l ∈ N,
(2l + 1)!

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 37

mit Ql . Es ist eine unendliche Reihe:

l!x−l−1  (l+1)(l+2) −2 (l+1)(l+2)(l+3)(l+4) −4 


Ql = 1+ x + x + ... (3.7)
(2l + 1)!! 2(2l+3) (2 · 4)(2l+3)(2l+5)

Wir fassen zusammen:

Ist l ein ganze positive Zahl, so ist (3.6) ein Polynom und (3.7) eine unendliche Reihe. Die
allgemeine Lösung der Legendreschen DG ist eine Linearkombination von Pl und Ql .

Ist l eine negative Zahl, so wird Pl eine unendliche Reihe und (3.7) ein Polynom. Die allge-
meine Lösung ist wiederum eine Linearkombination der beiden.

Bei fast allen Anwendungen ist die Variable x der Cosinus eines Winkels x = cos θ; diese
Werte schließen x = ±1 ein. Wir haben gesehen, daß Lösungen die für x = ±1 regulär
sind, nur für ganzzahlige l auftreten. Dann können wir uns auf die Lösungen Pl und Ql
beschränken, da sich alle anderen Lösungen auf diese reduzieren. Überdies bemerkt man,
daß die Lösung (3.5b) mit −(l + 1) anstelle von l gerade (3.5a) ist. Also können wir l ≥ 0
annehmen und behalten nur noch (3.6) als reguläre Lösungen. In physikalischen Problemen
ist Pl (cos θ) die einzige Lösung der Legendreschen DG von praktischem Interesse. Die tiefsten
Legendrepolynome sind:

P0 = 1, P1 = x, P2 = (3x2 − 1)/2
(3.8)
P3 = (5x3 − 3x)/2, P4 = (35x4 − 30x2 + 3)/8.

Der Vollständigkeit wegen gebe ich noch die tiefsten Q′ s an:


1 x 1 3x
Q0 = v(x), Q1 =v(x) − 1, Q2 = P2 (x)v(x) −
2 2 2 2
1+x
wo v(x) = log ist.
1−x
Erzeugende Funktion

Die Legendrepolynome können durch Ableiten von einfachen Polynomen erzeugt werden:

1 dl 2
P0 (x) = 1, Pl (x) = (x − 1)l .
2l l! dxl
Beweis: Wir differenzieren die Gleichung

(x2 − 1)u′ = 2lxu (3.9)

(l + 1)-mal nach x. Unter Benutzung von


n  (n−2) (2)
(u · v)(n) = u(n) v + nu(n−1) v ′ + u v + ...
2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 38

Pn
1
P0

P1

P2
0 x
1
P3
P4

-0.5
0

Abbildung 3.1: Die Legendrepolynome Pl für l = 0, 1, 2, 3, 4.

ergibt sich
(x2 − 1)u(l+2) + 2x(l + 1)u(l+1) + l(l + 1)u(l) = 2lxu(l+1) + 2l(l + 1)u(l)
beziehungsweise die Legendresche Differentialgleichung für u(l) :
(x2 − 1)u(l+2) + 2xu(l+1) − l(l + 1)u(l) = 0.
Nun erfüllt aber gerade u = (x2 − 1)l die Gleichung (3.9). Setzen wir noch w = u(l) /2l l!,
dann löst w die Legendresche Differentialgleichung.

3.2 Orthogonale Polynome in Hilberträumen

Wir wollen nun beweisen, daß die Legendrepolynome eine Orthogonalsystem auf dem Raum
der stetigen Funktionen von [−1, 1] nach R bzw. C bilden. Die Funktionen f : [−1, 1] → C
bilden einen linearen Raum. Als inneres Produkt wählen wir

Z1
(f, g) = f¯(x)g(x)dx. (3.10)
−1

Dies ist in der Tat ein Skalarprodukt:


Es ist linear im ersten Argument und antilinear im zweiten Argument,
(f, α1 g1 + α2 g2 ) = α1 (f, g1 ) + α2 (f, g2 ) und (f, g) = (g, f ),

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 39

und es ist positiv

(f, f ) ≥ 0 und (f, f ) = 0 nur falls f = 0.

Zwei Funktionen f, g (Vektoren in diesem unendlich dimensionalen Funktionenraum) sind


orthogonal, falls (f, g) = 0 ist. Die Länge oder Norm einer Funktion ist

kf k = (f, f )1/2 .

Also ist der Raum der stetigen Funktionen [−1, 1] → C ein sogenannter normierter Raum.
Der Abstand zwischen zwei Funktionen ist

d(f, g) = kf − gk.

Ist der Raum bezüglich dieser Metrik vollständig, so heißt er Hilbertraum: Ein Hilber-
traum ist ein linearer Raum, der bezüglich der über das innere Produkt induzierten Me-
trik vollständig ist. In einem Hilbertraum konvergieren zum Beispiel alle Cauchy-Folgen
gegen ein Element des Hilbertraumes. Ist H ein Raum mit Skalarprodukt, dann gelten die
Ungleichungen

Satz:

|(f, g)| ≤ kf k kgk und kf + gk ≤ kf k + kgk.

Weiterhin ist

kgk ≤ kλf + gk für alle λ ∈ C

genau dann, wenn (f, g) = 0 ist.

Beweis: Sei α = (f, g). Eine einfache Rechnung zeigt, daß

0 ≤ kλf + gk2 = |λ|2 kf k2 + 2ℜ(ᾱλ) + kgk2 . (3.11)

Damit gilt die letzte Aussage im Satz für α = 0. Ist f = 0, dann sind die erste und letzte
Behauptung trivial erfüllt. Sei nun f 6= 0. Wir setzen λ = −α/kf k2. Mit diesem λ wird
(3.11) zu

|α|2
0 ≤ kλf + gk2 = kgk2 − .
kf k2
Dies beweist die erste Ungleichung und zeigt, daß die dritte Behauptung nur für α = 0
gelten kann. Die zweite Ungleichung im Satz folgt aus der ersten (man quadriere die zweite
Ungleichung).

Der Raum der stetigen Funktionen auf [−1, 1] ist bezüglich der von (3.10) induzierten Norm
nicht vollständig. Man kann in aber vervollständigen. Der etwas größere Raum wird mit

L2 ([−1, 1])

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 40

bezeichnet.

In der Physik treten oft Polynome oder allgemeiner Funktionensysteme auf (zum Beispiel
die Hermite-Polynome) die orthogonal bezüglich eines gewichteten L2 Raumes sind. Das
Skalarprodukt ist dann
Z
(f, g) = ρ(x)f¯(x)g(x)dn x, ρ(x) > 0.
M

Das Integrationsgebiet M ⊂ Rn kann ein endliches oder unendliches Gebiet sein. Die Dichte
ρ muß eine positive Funktion sein. Die Vervollständigung des Funktionenraumes bezüglich
der von (., .) induzierten Norm ist L2 (M, ρ). Das Skalarprodukt und die zugehörige Norm
erfüllen alle obigen Eigenschaften.

Orthogonalität der Legendrepolynome

Die Legendrepolynome sind orthogonal in L2 ([0, 1]). Dies ist einfach zu beweisen. Dazu
schreiben wir die Legendresche Differentialgleichung wie folgt:

d d
Aw = l(l + 1)w, A=− (1 − x2 ) . (3.12)
dx dx
Allgemein ist der zu A adjungierte Operator A wie folgt definiert:

(f, Ag) = (A† f, g).

Für einen symmetrischen Operator ist A = A† . Für den Differentialoperator A in (3.12) gilt
nun
Z1 Z
(f, Ag) = f¯Ag = −(1 − x2 )(f¯g ′ − f¯′ g)|1−1 + Af g = (Af, g),
−1

wobei wir annahmen, daß f und g bei x = ±1 regulär sind, so daß die Oberflächenterme
verschwinden. Für Funktionenräume deren Elemente bei x = ±1 regulär sind, ist also A in
(3.12) symmetrisch. Insbesondere gilt

(APk , Pl ) = k(k + 1)(Pk , Pl ) = (Pk , APl ) = l(l + 1)(Pk , Pl ).

Für l 6= k muß also (Pl , Pk ) = 0 gelten. Deshalb sind die Legendrepolynome orthogonal
zueinander. Es verbleibt noch, die Norm von Pl zu bestimmen. Mit
Z  l
d 2 2
l
(1 − x2 )l = 4l (l!)2
dx 2l + 1
−1

findet man, daß


2 2
(Pl , Pl ) = und damit (Pk , Pl ) = δkl .
2l + 1 2l + 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.3. Der Satz von Fuchs 41

3.2.1 Zugeordnete Legendrefunktionen oder Kugelfunktionen

Bei der Behandlung von wasserstoffähnlichen Atomen in der QM wird man auf die DG

 m2 
(1 − x2 )w′′ − 2xw′ + l(l + 1) − w=0 (3.13)
1 − x2
geführt, wobei l und m ganzzahlig sind. Es erfülle Pl die Legendresche Differentialgleichung
(3.2), dann erfüllt die Helmholtzsche Funktion

(m) dm
Pl = Pl
dxm
die DG
 d d  
(m)
(1 − x2 ) 2 − 2(m + 1)x + l(l + 1) − m(m + 1) Pl = 0.
dx dx
Man braucht nur die Legendresche DG m-mal zu differenzieren. Wir setzen nun
(m) (m)
Pl (x) = (1 − x2 )−m/2 yl (x).
(m)
und bestimmen durch Einsetzen diejenige DG, der yl genügt. Man findet die DG (3.13)
und damit lösen die

(m) dm
yl (x) = (1 − x2 )m/2 Pl (x) (3.14)
dxm
(m)
die DG (3.13). Die Funktion yl ist als zugeordnete Legendreschefunktion oder als zuge-
(m)
ordnete Kugelfunktion bekannt. Die Helmholtz-Funktion Pl ist ein Polynom vom Grad
l − m. Die zugeordnete Legendrefunktion ist ein Polynom form Grad l.

3.3 Der Satz von Fuchs

Wir wollen die Frage beantworten, wann die Lösungen einer Differentialgleichung in eine
Potenzreihe entwickelt werden können. Zur Vorbereitung betrachten wir die DG
w
w′′ + c
xm
= 0, m∈ . Z
Setzen wir die Reihenentwicklung xα an xn mit a0 6= 0 ein, so finden wir
P

X X
an (n + α)(n + α − 1)xn+α−2 + c an xn+α−m = 0.

Für m > 2 erscheint die niedrigste Potenz ∼ xα−m im zweiten Term. Der entsprechende
Koeffizient a0 muß deshalb verschwinden. Für m = 2 muß a0 α2 − α + c) = 0 gelten. Die

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.3. Der Satz von Fuchs 42

an , n > 0 müssen verschwinden, und die allgemeine Lösung ist


r
1
+β 1
−β 1
w = c1 x 2 + c2 x 2 , β= − c, m = 2.
4
Es gibt als immer zwei Potenzlösungen. Eine davon kann bei x = 0 singulär werden. Für
m < 2 kann die Rekursionsformel gelöst werden und führt auf eine konvergente und nicht-
triviale Lösung:
c
α ∈ {0, 1}, an+2 = − an+m .
(n + 2 + α)(n + α + 1)

Die entsprechende Reihe ist konvergent für alle x und definiert eine analytische Funktion.

Ein zweites instruktives Beispiel ist die Gleichung

w′
w′′ + c =0
xm
welche zu
X X
an (n + α)(n + α − 1)xn+α−2 + c an (n + α)xn+α−1−m = 0

führt. Für m > 1 muß a0 α, und damit α, verschwinden. Die Rekursrelation ist

an+m−1 1 n(n − 1)
=− .
an c n+m−1
Die Reihe hat verschwindenden Konvergenzradius und es gibt keine Lösung die eine Potenz-
reihenentwicklung hat. Für m = 1 ist die allgemeine Lösung eine Linearkombination von
w = 1 und w = x1−c . Für m < 1 folgt

can+m (n + m)
α ∈ {0, 1}, an+1 = − .
(n + α)(n + α + 1)

Dies definiert wiederum eine analytische Funktion. Die Gleichungen

w w′
w′′ + c und w′′ + c
x3 x2
besitzen einen singulären Punkt in x = 0, was die Ursache für das Versagen der Reihen-
entwicklung ist. Im Falle der Legendreschen DG haben die Funktionen p und q einfache
Pole an den Stellen x = ±1, weshalb die erhaltene allgemeine Lösung diese beiden Punkte
auslässt. In den eben betrachteten Gleichungen ist x = 0 ein singulärer Punkt. Ob Lösungen
eine (konvergente) Potenzreihenentwicklung an einer singulären Stelle zulassen hängt offen-
sichtlich vom Divergenzgrad von p und q ab. Wir geben noch ein drittes Beispiel, um den
Sachverhalt zu illustrieren. Die Lösung der Gleichung

w′ w
w′′ + − 2 =0
x x

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.4. Integraltransformationen 43

kann in der Form xα an xn entwickelt werden. Man findet für die allgemeine Lösung
P

a0
w= + a2 x.
x
Es gibt eine bei x = 0 reguläre und eine divergente Lösung. Welche Singularitäten von p, q
noch eine Integration durch Reihen in der Umgebung des singulären Punktes erlauben wird
durch den Satz von Fuchs geklärt:

Satz: Wenn die DG


w′′ + pw′ + qw = 0
in x = x0 einen singulären Punkt besitzt, so gibt es dennoch eine konvergente Potenzrei-
henentwicklung der Lösung in x = x0 (eventuell mit endlich vielen negativen Potenzen) falls
(x − x0 )p(x) und (x − x0 )2 q(x) endlich bleiben für x → x0 .

Singuläre Punkte welche die Voraussetzungen des Fuchsschen Satzes erfüllen heißen außer-
wesentliche Singularitäten der DG; alle übrigen heißen wesentlich. Eine DG, die in der ganzen
komplexen Ebene keine wesentlichen Singularitäten besitzt, heißt eine DG vom Fuchsschen
Typ. Selbst wenn x0 eine außerwesentliche Singularität ist, braucht man bei der Integra-
tion der DG durch Reihen nicht zwei unabhängige Lösungen zu erhalten. Man kann zwei
unabhängige Lösungen der Form
X X
w1 = (x − x0 )α1 an (x − x0 )n und w2 = (x − x0 )α2 bn (x − x0 )n

immer dann erhalten, wenn die beiden Wurzeln α1 und α2 der bestimmenden Gleichung sich
nicht um eine ganze Zahl unterscheiden.

3.4 Integraltransformationen

Es sei eine Differentialgleichung


Lw + λw = 0
gegeben, wobei L ein Differentialoperator ist. Statt w(z) führen wir eine neue Funktion v(ζ)
der komplexen Variablen ζ durch eine Gleichung

Z
w(z) = K(z, ζ)v(ζ)dζ
(3.15)
C

ein, wobei der Transformationskern K(z, ζ) in jeder der beiden Variablen analytisch sein
soll. Der Integrationsweg C in der komplexen ζ-Ebene wird jeweils geeignet zu bestimmen
sein. Die Differentialgleichung geht über in
Z

LK + λK v(ζ)dζ = 0,
C

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 44

wobei sich der Operator L auf die Variable z bezieht. Nun soll K die partielle Differential-
gleichung
LK = AK,
erfüllen, wobei A nur auf die Variable ζ wirkt, so folgt
Z Z
AK + λK v(ζ)dζ = K(z, ζ) A† v + λv dζ = 0.
 

C C

Der Weg C ist hier so zu wählen, daß die Randterme verschwinden. Falls die partielle DG
LK = AK, für deren Wahl man Spielraum hat, und die transformierte DG

A† v + λv = 0 (3.16)

explizit gelöst werden können, so erhält man mit dieser Methode die Lösung w(z) in der
angegebenen Integralform.

In der Analysis treten solche Integraltransformationen in verschiedener Gestalt auf. Für den
Kerne
K(z, ζ) = ezζ , K(z, ζ) = eizζ und K(z, ζ) = (z − ζ)α
sind dies die Transformation von Laplace und Euler. Im Folgenden werden wir Integraltrans-
formationen für mehrere Differentialgleichungen diskutieren.

3.5 Besselfunktionen

Wir beginnen mit der für die QM wichtigen Besselschen Differentialgleichung. Dies ist die
folgende Differentialgleichung
z 2 w′′ + zw′ + (z 2 − λ2 )w = Lw − λ2 w = 0, λ = konstant.
Sie ist eine Gleichung vom Fuchsschen Typ mit einer außerwesentlichen Singularität bei
z = 0. Da z = 0 eine Stelle der Bestimmtheit der Gleichung ist, kann dort ihre Lösung in
eine Potenzreihe entwickelt werden. Man findet
an
(α2 − λ2 )a0 = 0, ((α + 1)2 − λ2 )a1 = 0, an+2 = 2 .
λ − (n + 2 + α)2
Offensichtlich ist α = ±λ und a1 = 0. Für α = λ findet man
 z2 z4 
w = a0 z λ 1 − + + ···
2(2λ + 2) 2 · 4(2λ + 2)(2λ + 4)
und für α = −λ
 z2 z4 
w = a0 z −λ 1 + + + ··· .
2(2λ − 2) 2 · 4(2λ − 2)(2λ − 4)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 45

Diese Lösung geht aus der ersten durch die Ersetzung λ → −λ hervor. Setzen wir
1
a0 = ,
2λ Γ(λ + 1)
dann nennt man den sich ergebenden Ausdruck

X (−)n z λ+2n
Jλ (z) =
n=0
Γ(n + 1)Γ(n + λ + 1) 2

Besselfunktion vom Grade λ.

0.8

0.6

0.4

0.2

0 2 4 6 8
x

-0.2

-0.4

Die Besselfunktionen vom Grade = 0,1,2,3.

Die vollständige Lösung der Besselschen Differentialgleichung (λ nicht ganzzahlig) ist also

w = aJλ (z) + bJ−λ (z). (3.17)

Die Jλ sind die Besselfunktionen der Ordnung λ.

Für λ = l ∈ {1, 2, . . .} ist


X (−)n z 2n−l
J−l (z) = ,
n!(n − l)! 2
n=l,l+1,...

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 46

wobei wir
1
lim =0 für n = l − 1, l − 2, . . .
λ→−l Γ(n + λ + 1)

benutzten. Setzten wir m = n − l so finden wir


X (−)m+l z 2m+l
J−l (z) = = (−)l Jl (z).
m=0,1,...
(m + l)!m! 2

Für ganzzahlige λ sind also Jλ und J−λ linear abhängig.

Integraltransformation
R
Setzen wir w = Kvdζ so folgt
Z
z 2 Kzz + zKz + z 2 K − λ2 K)v(ζ)dζ = 0.
C

Wir fordern nun, daß

LK = z 2 Kzz + zKz + z 2 K = −Kζζ = AK

gilt, mit der in der ganzen z und ζ-Ebene regulären Lösung

K(z, ζ) = e±iz sin ζ .

Die Besselsche DG geht über in


Z
Kζζ + λ2 K v(ζ)dζ = 0


oder, wie man nach partieller Integration erkennt, in


d
Z Z
K(z, ζ) v ′′ + λ2 v dζ − Kv ′ − Kζ v dζ = 0.
 

C C

Die transformierte DG v ′′ + λ2 v = 0 hat die Lösungen exp(±iλζ). Nun müssen wir noch
den Integrationsweg C geeignet wählen damit die Oberflächenterme verschwinden. Auf den
senkrechten Abschnitten der in Abb. 3.2 mit C1 und C2 bezeichneten Wege ist wegen sin(ζ =
ξ + iη) = sin ξ cos(iη) + sin(iη) cos ξ gleich

sin ζ = sin ξ cosh η + i cos ξ sinh η = −i sinh |η|

und damit der Realteil von

−iz sin ζ = −z sinh |η| gleich − ℜ(z) sinh |η|,

also negativ für ℜ(z) > 0. Setzen wir K(z, ζ) = exp(−iz sin ζ) so strebt auf C1 und C2 der
Zusatzterm Kv ′ − Kζ v beiderseits gegen Null, und wir erhalten in den Integralen

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 47

− π +i π+ i

8
ζ ζ

C2
C1

sin ζ = - i sinh η sin ζ = - i sinh η

o o π
−π

sin ζ = i sinh η sin ζ = i sinh η

-i -i
8

Abbildung 3.2: Integrationswege in der komplexen ζ-Ebene

1 1
Z Z
Hλ1 (z) = − e−iz sin ζ+iλζ dζ und Hλ2 (z) = − e−iz sin ζ+iλζ dζ
π π (3.18)
C1 C2

zwei Lösungen der Besselschen DG, die sogenannten Hankelfunktionen. Man sieht leicht, daß
diese Integrale für ℜ(z) > 0 konvergieren.

Für die analytische Fortsetzung zu ℜ(z) ≤ 0 deformieren wir den Integrationsweg C1 . Wir
setzen
λ = a + ib, ζ = ξ + iη, z = x + iy
dann sind der Real- und Imaginärteil der Funktion
f (ζ) = −iz sin ζ + iλζ
im Exponenten
ℜf (ζ) = y sin ξ cosh η + x cos ξ sinh η − bξ − aη
ℑf (ζ) = −x sin ξ cosh η + y cos ξ sinh η + aξ − bη.
Jetzt wählen wir für die senkrechten Teile des Weges C1 statt der Abszissen 0 und −π die
Abszissen ξ0 und −π − ξ0 . Wegen
1 |η| 
ℜf (ζ) ∼ e y sin ξ0 − x cos ξ0 + O(|η|) für |η| → ∞
2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 48

ist das Integral


Z
ef (ζ) dζ
C1

für solche z konvergent, für welche


y sin ξ0 − x cos ξ0 < 0
ist. Vergrößert man nun ξ0 , dann dreht sich die Halbebene auf welcher das Integral kon-
111111
000000
000000
111111
000000
111111
000000
111111 11111111111111
00000000000000
ξ =0 000000
111111 00000000000000
11111111111111
ξ 0 = π/4
0 000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111

ξ = 3 π /4
11111111111111
00000000000000 ξ = π /2
00000000000000
11111111111111
0 0
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111 1111111111111
0000000000000
00000000000000
11111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111

Abbildung 3.3: Deformation des Integrationsweges in der Integraltransformation

vergiert und eine in z analytische Funktion definiert, um den Punkt z = 0. Zum Beispiel,
definiert das Integral mit ξ0 = 0 eine analytische Funktion in der Halbebenen ℜz > 0 und
das Integral mit ξ0 = π/2 eine analytische Funktion in der Halbebene ℑz < 0. Die Viertele-
bene mit ℜz > 0 und ℑz < 0 liegt in beiden Halbebenen. Auf dieser Viertelebene stimmen
die beiden Integrale aber überein. Sind C1 (0) und C1 (π/2) die beiden Integrationswege mit
ξ0 = 0 und ξ0 = π/2, so gilt
Z Z
ef (ζ) dζ = ef (ζ) dζ
C1 (0) C1 (π/2)

für ℜz > 0 und ℑz < 0, da der eine Weg so in den anderen deformiert werden kann, ohne daß
die Randterme beitragen. Lassen wir also ξ0 in geeigneter Weise eine unbeschränkte Folge

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 49

positive oder negative Werte durchlaufen, so entsteht nach und nach das gesamte analytische
Gebilde der Funktion Hλ1 (z), nämlich eine Riemannsche Fläche, die im Nullpunkt einen
Verzweigungspunkt mit von λ abhängiger Ordnung besitzt (siehe Abb. 3.3).

Für ξ0 = −π/2 verschwindet der waagerechte Bestandteil des Integrationsweges, und wir
erhalten

Z∞
e−iπλ/2
Hλ1 (z) = eiz cosh η−λη dη (3.19)

−∞

welches die Funktion in der oberen Halbebene ℑz > 0 darstellt. Lassen wir im Sektor

δ ≤ arg z ≤ π − δ

ins Unendliche wachsen, so strebt der Integrand auf dem ganzen Integrationsweg gegen Null.
Ähnlich argumentiert man, daß H2λ (z) gegen Null strebt, wenn z im Sektor

π + δ ≤ arg z ≤ 2π − δ

ins Unendliche wächst. Damit haben wir bewiesen, daß

Lemma Die Hankelfunktionen erfüllen

Hλ1 (z) −→ 0 für |z| → ∞, δ ≤ arg(z) ≤ π − δ


Hλ2 (z) −→ 0 für |z| → ∞, π + δ ≤ arg(z) ≤ 2π − δ.

Man kann leicht zeigen, daß Hλ1 auf der negativen und Hλ2 auf der positiven imaginären
Achse mit |z| → ∞ über alle Grenzen wachsen. Damit müssen Hλ1 , Hλ2 linear unabhängige
Lösungen der Besselschen Differentialgleichung sein.

Um die Hankel- mit den Besselfunktionen in Verbindung zu bringen, bemerken wir, daß für
reelle λ und reelle z die Lösungen Hλ1 und Hλ2 konjugiert komplex zueinander sind.

Ersetzen wir in der Darstellung


1
Z
Hλ1 (z) = − eiz sin ζ−iλζ dζ,
π
C̄1

wobei C̄1 das Spiegelbild von C1 an der reellen Achse ist, ζ durch −ζ, so folgt
1
Z
Hλ1 (z) = e−iz sin ζ+iλζ dζ.
π
−C̄1

Da −C̄1 gleich dem im negativen Sinne durchlaufenen Wege C2 ist, so wird


1
Z
1
Hλ (z) = − e−iz sin ζ+iλζ dζ = Hλ2 (z),
π
C2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 50

η η η
ζ −ζ

ξ ξ

Abbildung 3.4: Die verschiedenen Integrationswege.

was zu beweisen war. Hλi (z) und H−λi


(z) erfüllen dieselbe Differentialgleichung, die ja nur
λ enthält. Deshalb müssen diese 4 Funktionen linear abhängig sein. Da Hλi (z) und H−λ
2 i
(z)
dasselbe asymptotische Verhalten zeigen, liegt die Vermutung nahe, daß sie abhängig sind.
Um dies zu beweisen ersetzt man in der Integraldarstellung
1
Z
1
H−λ (z) = − e−iz sin ζ−iλζ dζ
π
C1

ζ durch −ζ − π. Dann ist

eiπλ
Z
1
H−λ (z) = e−iz sin ζ+iλζ dζ.
π
C̃1

Aber da C̃1 gleich das im negative Sinn durchlaufene C1 ist, haben wir gezeigt, daß
1
H−λ (z) = eiλπ Hλ1 (z)

gilt. Analog beweist man, daß


2
H−λ (z) = e−iλπ Hλ2 (z)

Damit sind
1 1 1
Hλ (z) + Hλ2 (z) und Nλ (z) = Hλ1 (z) − Hλ2 (z)
 
Jλ (z) =
2 2i
Lösungen der Besselgleichungen, welche für reelle λ und z reell sind und welche
    
J−λ (z) cos πλ − sin πλ Jλ (z)
=
N−λ (z) sin πλ cos πλ Nλ (z)

erfüllen. Es sind die Besselschen und Neumannschen Funktionen vom Index λ.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 51

Integraldarstellung der Besselschen Funktionen

Addieren wir Hλ1 und Hλ2 , so heben sich die auf der imaginären Achse laufenden Integrati-
onswege in Abb.(3.2). Wir erhalten also in für ℜ(z) > 0 die folgende Darstellung für Jλ :

1
Z
Jλ (z) = − e−iz sin ζ+iλζ dζ, ℜz > 0,
2π (3.20)
C

wobei C der in Abb. 3.2 gekennzeichnete Weg ist.

Ist nun λ eine ganze Zahl, so heben sich wegen der Periodizität des Integranden die Integrale

−π+ i π+ i
8

8
Weg C

0
−π π

Abbildung 3.5: Integrationsweg für Besselfunktionen.

über die senkrechten Abschnitte von C weg und es ergibt sich

Zπ Zπ
1 iz sin ζ−inζ 1 
Jn (z) = e dζ = cos z sin ζ − nζ dζ. (3.21)
2π π
−π 0

Wir sehen, daß die Besselschen Funktionen mit ganzzahligem Index ganze Funktionen auf
C sind. Die Darstellung (3.21) zeigt, daß Jn (z) der nte Fourierkoeffizient in der Fourierent-
wicklung von

X
eiz sin ζ = Jn (z)einζ
−∞

nach ζ ist. Beachten wir noch, daß J−n (z) = (−)n Jn (z) ist, so erhalten wir

X
cos(z sin ζ) = J0 + 2 J2n (z) cos 2nζ
1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 52


X
sin(z sin ζ) = 2 J2n−1 (z) sin(2n − 1)ζ,
1

und speziell für ζ = π/2


cos(z) = J0 − 2J2 + 2J4 (z) − . . . , sin(z) = 2J1 (z) − 2J3 (z) + . . . .
Wir geben schlußendlich noch eine zweite Integraldarstellung der Besselfunktionen an, die
auf eine nützliche Rekursionsformel für die Besselfunktionen mit ganzzahligem Index führt.
Es sei

- C
8

-1 1

-
8

-i

Abbildung 3.6: Der Integrationsweg C̃ in der komplexen ζ-Ebene.

1 1
ζ̃ = e−iζ , so daß sin ζ = ζ̃ − .
2i ζ̃
Dann geht (3.20) über in

z 1
1 e 2 (ζ− ζ )
Z
Jλ (z) = dζ, (3.22)
2πi ζ λ+1

wobei wir ζ̃ wieder mit ζ bezeichneten. Der neue Integrationsweg C̃ ist in Abb. 3.6 dargestellt.
Wegen
z 1
d e 2 (ζ− ζ ) hz 1 1  λ i z2 (ζ− ζ1 )
Z Z
0 = dζ = dζ + − e
dζ ζ λ+1 2 ζλ ζ λ+2 ζ λ+1
C̃ C̃
ergeben sich die wichtigen Rekursionsrelationen

Jλ−1 (z) + Jλ+1 (z) =
Jλ (z).
z
Diese gelten nicht nur für die Besselfunktionen, sondern auch für beide Hankelfunktionen.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.6. Hypergeometrische Differentialgleichung 53

3.6 Hypergeometrische Differentialgleichung

Dies ist die Differentialgleichung

(z 2 − z)w′′ + (1 + a + b)z − c w′ + abw = 0.


 
(3.23)

Die Parameter a, b und c sind Konstanten, c wird als nicht ganzzahlig vorausgesetzt. Die
Gleichung hat außerwesentliche Singularitäten in 0, 1 und ∞. Die Bestimmungsgleichung für
die Entwicklung um z = 0 lautet

α(α − 1) + αc = 0.

Also ist α = 0 oder α = 1 − c. Die Rekursionsrelation lautet


(α + n + a)(α + n + b)
an+1 = an .
(α + n + 1)(α + n + c)

Für α = 0 vereinfacht sich diese zu


(a + n)(b + n)
an+1 = an
(n + 1)(n + c)

und damit erhalten wir für α = 0 folgende Lösung:

 ab a(a + 1)b(b + 1) 2 a(a + 1)(a + 2)b(b + 1)(b + 2) 3 


w =A 1+ z+ z + z + ··· . (3.24)
1·c 2! · c(c + 1) 3! · c(c + 1)(c + 2)

Die Reihe in den Klammern heißt hypergeometrische Reihe. Sie konvergiert innerhalb des
Einheitskreises. Für a = 1 und b = c wird sie zur gewöhnlichen geometrischen Reihe; daher
ihr Name. Man bezeichnet die Reihe mit F (a, b, c; z). Damit ist die partikuläre Lösung
w = AF (a, b, c; z).
Für α = 1 − c lautet die die Rekursionsformel
(a − c + n + 1)(b − c + n + 1)
an+1 = an .
(n + 1)(n + 2 − c)

Benutzt man die neuen Konstanten a′ = a − c + 1, b′ = b − c + 1 und c′ = 2 − c, so entsteht

(a′ + n)(b′ + n)
an+1 = an ,
(n + 1)(n + c′ )

also dieselbe Rekursionsrelation wie für α = 0. Die entsprechende partikuläre Lösung ist
daher

w = Bz 1−c F (a − c + 1, b − c + 1, 2 − c; z).

Damit ergibt sich folgende allgemeine Lösung der hypergeometrischen Differentialgleichung:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.6. Hypergeometrische Differentialgleichung 54

w = AF (a, b, c; z) + Bz 1−c F (a − c + 1, b − c + 1, 2 − c; z). (3.25)

Die obige Reihendarstellung für F konvergiert innerhalb des Einheitskreises. Wir überlassen
es einer Übungsaufgabe, zu zeigen, daß
1−ξ
Pl (ξ) = F (l + 1, −l, 1; )
2
die Legendreschen Polynome sind. Die hypergeometrische Reihe ist ein Polynom, falls a oder
b negativ ganz oder 0 sind.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3

Spezielle Funktionen

In diesem Kapitel untersuchen wir die für die QM wichtigen Differentialgleichungen

w′′ + p(x)w′ + q(x)w = 0, (3.1)

etwas genauer. Mit Hinblick auf die Anwendungen bezeichnen wir im Folgenden die un-
abhängige Variable mit x anstatt mit t. Die Koeffizientenfunktionen p und q können dabei
Singularitäten aufweisen.

3.1 Die Legendresche Differentialgleichung

Eine DG von besonderem Interesse ist die Legendresche Differentialgleichung

(1 − x2 )w′′ − 2xw′ + l(l + 1)w = 0, (3.2)

wobei l eine Konstante ist. Offensichtlich haben die Koeffizientenfunktionen p = −2x/(1−x2 )


und q = l(l + 1)/(1 − x2 ) bei x = ±1 einfache Pole. Wir versuchen eine Lösung in Form
einer formalen Potenzreihe in x zu finden. Ist α die niedrigste vorkommende Potenz, dann
hat die Reihe die Form


X
α
w=x an xn , a0 6= 0. (3.3)
0

Wir nehmen an die Reihe konvergiert (dies kann hinterher überprüft werden), so daß (3.3)

33
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 34

gliedweise differenziert werden darf. Einsetzen von (3.3) in (3.2) ergibt


X X 
an (α + n)(α + n − 1)xα+n−2 = an (α + n)(α + n + 1) − l(l + 1) xα+n .

n n

Dies ist nur möglich wenn der Koeffizient jeder Potenz von x verschwindet. Da n ≥ 0 ist,
kommen als niedrigste Potenzen α−2 und α−1 vor, und zwar nur auf der linken Seite. Also
muß
a0 α(α − 1) = 0 und α(α + 1)a1 = 0
gelten. Dies sind die sogenannten Bestimmungleichungen. Da a0 6= 0 vorausgesetzt wurde,
implizieren diese
α = 0 oder α = 1.
Der Koeffizientvergleich bringt an+2 mit an folgendermassen in Verbindung
(α + n)(α + n + 1) − l(l + 1)
an+2 = an .
(α + n + 1)(α + n + 2)
Für α = 0 kann man a0 und a1 beliebig vorgeben und findet
n(n + 1) − l(l + 1)
an+2 = an , n = 0, 1, 2, . . .
(n + 1)(n + 2)
mit den Lösungen
(−)r l(l−2) · · · (l−2r+2) · (l+1)(l+3) · · · (l+2r−1)
a2r = αr a0 = a0
(2r)!
(−)r (l−1)(l−3) · · · (l−2r+1) · (l+2)(l+4) · · · (l+2r)
a2r+1 = βr a 1 = a1 .
(2r+1)!
Für α = 1 muß a1 = 0 gelten und es treten nur gerade Potenzen in der Reihenentwicklung
auf. Für ein willkürlich vorgegebenes a0 findet man für α = 1
(n + 1)(n + 2) − l(l + 1)
an+2 = an , n = 0, 2, 4, . . .
(n + 2)(n + 3)
mit der Lösung
a2r = βr a0 .
Es ergeben sich die folgenden Potenzreihenentwicklungen: Für α = 0:

X X
w = a0 αr x2r und w = a1 x βr x2r
(3.4)
r=0,... r=0,...

und für α = 1:
X
w = a0 x βr x2r .
r=0,...

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 35

Diese letzte Lösung ist gleich dem a1 -Anteil der ersten Lösung. Es genügt daher, den Fall
α = 0 zu untersuchen. Wegen
an+2
−→ 1 für n −→ ∞
an
sind die obigen Reihen absolut konvergent für |x| < 1. Die Reihen definieren analytische
Funktionen innerhalb des Einheitskreises.

Es ist auch möglich Lösungen außerhalb des Einheitskreises zu finden. Dazu machen wir den
Reihenansatz

X an
w = xα .
0
xn

Setzen wir in die Differentialgleichung ein, so finden wir


  a1 
0 = xα α(α + 1) − l(l + 1) a0 + (α − 1)α − l(l + 1)
 
x
X∞   1
 
+ (α−n−2)(α−n−1) − l(l + 1) an+2 − (α−n)(α−n−1)an n+2
n=0
x

Die Bestimmungsgleichungen ergeben sich nach Nullsetzen der Koeffizienten der höchsten
beiden Potenzen:

[α(α + 1) − l(l + 1)]a0 = 0 und [(α − 1)α − l(l + 1)]a1 = 0.

Da wir a0 6= 0 voraussetzen, muß

α=l oder α = −(l + 1)

gelten und damit muß a1 verschwinden. Die Rekursionsrelationen sind


(α − n)(α − n − 1)
an+2 = an .
(α − n − 2)(α − n − 1) − l(l + 1)
Für α = l und α = −l − 1 vereinfachen sich diese zu
(l − n)(l − n − 1) (l + n + 1)(l + n + 2)
an+2 = an resp. an+2 = an .
(n + 2)(n − 2l + 1) (n + 2)(n + 2l + 3)
Damit sind die beiden Potenzreihenentwicklungen

 X (l−2r+1)(l−2r+2) · · · (l−1)l 
w = xl 1 + (−1)r x−2r a0
r=1,...
2r · · · 2 · (2l−2r+1) · · · (2l−3)(2l−1)
(3.5)
 X (l+1) · · · (l+2r) 
w = x−l−1 1+ x−2r a0
r=1,···
2 · 4 · · · 2r(2l+3)(2l+5) · · · (2l+2r+1)

Diese Reihen konvergieren absolut für |x| > 1 und definieren dort analytische Funktionen.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 36

Wir verfügen nun über zwei Arten von Lösungen der Legendreschen DG: Die Reihen (3.4)
konvergieren innerhalb des Einheitskreises und die Reihen (3.5) außerhalb. Für bestimmte
l können diese Reihen zu Polynomen werden. Die Reihe (3.4a) bricht ab für positive gerade
oder negative ungerade l. Im ersten Fall, l = 2k löst dann das Polynom
 l(l + 1) 2 l(l − 2) · · · 2 · (l + 1) · · · (2l − 1) l 
w =a 1− x + . . . + (−1)l/2 x
2! l!
die DG. Für diese l bricht aber auch die Reihe (3.5a) ab und wird zum Polynom
 l(l − 1) −2 l! 
w = axl 1 − x + . . . + (−1)l/2 x−l .
2(2l − 1) l(l − 2) . . . 2 · (l + 1) · · · (2l − 1)
Diese beiden Lösungen werden identisch, wenn man die zweite mit dem konstanten Faktor
l(l − 2) · · · 2 · (l + 1) . . . (2l − 1)
(−1)l/2
l!
multipliziert. Die partikulären Lösungen (3.4a) und (3.5a) sind also gleich für gerade positive
l. Ist l ungerade und negativ zeigt ein Vergleich, daß (3.4a) und (3.5b) identisch sind.

Die Reihe (3.4b) bricht ab wenn l ungerade und positiv oder gerade und negativ ist. Ist l
ungerade und positiv, so ergibt sich aus (3.4b)
(l−1)(l+2) 3 l−1 (l−1)(l−3) · · · 2 · (l+2) · · · (2l−1)
 
w =a x− x + . . . + (−1) 2 xl
3! l!
während (3.5a) zu
 l(l−1) −2 l−1 l! 
w = axl 1 − x + . . . + (−1) 2 x−l+1
2(2l−1) 2 · 4 · (l−1) · (l+2) · · · (2l−1)
wird. Diese beiden Polynome sind aber bis auf einen Faktor identisch. Ist l gerade und
negativ, so geht (3.4b) in (3.5b) über.

Die Lösungen (3.5) sind in der mathematischen Physik von großer Bedeutung. Setzt man
die Konstante in a0 in (3.5a) gleich
(2l)! (2l − 1)(2l − 3) · · · 1
=
2l (l!)2 l!
so heißt das sich ergebende Polynom l-ten Grades Legendrepolynom:

(2l − 1)!!xl  l(l−1) −2 l(l−1)(l−2)(l−3) −4 


Pl (x) = 1− x + x − ··· . (3.6)
l! 2(2l−1) 2 · 4(2l−1)(2l−3)

Die Reihe ist bis zum konstanten Glied herab fortzusetzen. Anderseits bezeichnet man (3.5b)
mit der Konstanten
2l (l!)2
a0 = , l ∈ N,
(2l + 1)!

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.1. Die Legendresche Differentialgleichung 37

mit Ql . Es ist eine unendliche Reihe:

l!x−l−1  (l+1)(l+2) −2 (l+1)(l+2)(l+3)(l+4) −4 


Ql = 1+ x + x + ... (3.7)
(2l + 1)!! 2(2l+3) (2 · 4)(2l+3)(2l+5)

Wir fassen zusammen:

Ist l ein ganze positive Zahl, so ist (3.6) ein Polynom und (3.7) eine unendliche Reihe. Die
allgemeine Lösung der Legendreschen DG ist eine Linearkombination von Pl und Ql .

Ist l eine negative Zahl, so wird Pl eine unendliche Reihe und (3.7) ein Polynom. Die allge-
meine Lösung ist wiederum eine Linearkombination der beiden.

Bei fast allen Anwendungen ist die Variable x der Cosinus eines Winkels x = cos θ; diese
Werte schließen x = ±1 ein. Wir haben gesehen, daß Lösungen die für x = ±1 regulär
sind, nur für ganzzahlige l auftreten. Dann können wir uns auf die Lösungen Pl und Ql
beschränken, da sich alle anderen Lösungen auf diese reduzieren. Überdies bemerkt man,
daß die Lösung (3.5b) mit −(l + 1) anstelle von l gerade (3.5a) ist. Also können wir l ≥ 0
annehmen und behalten nur noch (3.6) als reguläre Lösungen. In physikalischen Problemen
ist Pl (cos θ) die einzige Lösung der Legendreschen DG von praktischem Interesse. Die tiefsten
Legendrepolynome sind:

P0 = 1, P1 = x, P2 = (3x2 − 1)/2
(3.8)
P3 = (5x3 − 3x)/2, P4 = (35x4 − 30x2 + 3)/8.

Der Vollständigkeit wegen gebe ich noch die tiefsten Q′ s an:


1 x 1 3x
Q0 = v(x), Q1 =v(x) − 1, Q2 = P2 (x)v(x) −
2 2 2 2
1+x
wo v(x) = log ist.
1−x
Erzeugende Funktion

Die Legendrepolynome können durch Ableiten von einfachen Polynomen erzeugt werden:

1 dl 2
P0 (x) = 1, Pl (x) = (x − 1)l .
2l l! dxl
Beweis: Wir differenzieren die Gleichung

(x2 − 1)u′ = 2lxu (3.9)

(l + 1)-mal nach x. Unter Benutzung von


n  (n−2) (2)
(u · v)(n) = u(n) v + nu(n−1) v ′ + u v + ...
2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 38

Pn
1
P0

P1

P2
0 x
1
P3
P4

-0.5
0

Abbildung 3.1: Die Legendrepolynome Pl für l = 0, 1, 2, 3, 4.

ergibt sich
(x2 − 1)u(l+2) + 2x(l + 1)u(l+1) + l(l + 1)u(l) = 2lxu(l+1) + 2l(l + 1)u(l)
beziehungsweise die Legendresche Differentialgleichung für u(l) :
(x2 − 1)u(l+2) + 2xu(l+1) − l(l + 1)u(l) = 0.
Nun erfüllt aber gerade u = (x2 − 1)l die Gleichung (3.9). Setzen wir noch w = u(l) /2l l!,
dann löst w die Legendresche Differentialgleichung.

3.2 Orthogonale Polynome in Hilberträumen

Wir wollen nun beweisen, daß die Legendrepolynome eine Orthogonalsystem auf dem Raum
der stetigen Funktionen von [−1, 1] nach R bzw. C bilden. Die Funktionen f : [−1, 1] → C
bilden einen linearen Raum. Als inneres Produkt wählen wir

Z1
(f, g) = f¯(x)g(x)dx. (3.10)
−1

Dies ist in der Tat ein Skalarprodukt:


Es ist linear im ersten Argument und antilinear im zweiten Argument,
(f, α1 g1 + α2 g2 ) = α1 (f, g1 ) + α2 (f, g2 ) und (f, g) = (g, f ),

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 39

und es ist positiv

(f, f ) ≥ 0 und (f, f ) = 0 nur falls f = 0.

Zwei Funktionen f, g (Vektoren in diesem unendlich dimensionalen Funktionenraum) sind


orthogonal, falls (f, g) = 0 ist. Die Länge oder Norm einer Funktion ist

kf k = (f, f )1/2 .

Also ist der Raum der stetigen Funktionen [−1, 1] → C ein sogenannter normierter Raum.
Der Abstand zwischen zwei Funktionen ist

d(f, g) = kf − gk.

Ist der Raum bezüglich dieser Metrik vollständig, so heißt er Hilbertraum: Ein Hilber-
traum ist ein linearer Raum, der bezüglich der über das innere Produkt induzierten Me-
trik vollständig ist. In einem Hilbertraum konvergieren zum Beispiel alle Cauchy-Folgen
gegen ein Element des Hilbertraumes. Ist H ein Raum mit Skalarprodukt, dann gelten die
Ungleichungen

Satz:

|(f, g)| ≤ kf k kgk und kf + gk ≤ kf k + kgk.

Weiterhin ist

kgk ≤ kλf + gk für alle λ∈C

genau dann, wenn (f, g) = 0 ist.

Beweis: Sei α = (f, g). Eine einfache Rechnung zeigt, daß

0 ≤ kλf + gk2 = |λ|2 kf k2 + 2ℜ(ᾱλ) + kgk2 . (3.11)

Damit gilt die letzte Aussage im Satz für α = 0. Ist f = 0, dann sind die erste und letzte
Behauptung trivial erfüllt. Sei nun f 6= 0. Wir setzen λ = −α/kf k2. Mit diesem λ wird
(3.11) zu

|α|2
0 ≤ kλf + gk2 = kgk2 − .
kf k2
Dies beweist die erste Ungleichung und zeigt, daß die dritte Behauptung nur für α = 0
gelten kann. Die zweite Ungleichung im Satz folgt aus der ersten (man quadriere die zweite
Ungleichung).

Der Raum der stetigen Funktionen auf [−1, 1] ist bezüglich der von (3.10) induzierten Norm
nicht vollständig. Man kann in aber vervollständigen. Der etwas größere Raum wird mit

L2 ([−1, 1])

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.2. Orthogonale Polynome in Hilberträumen 40

bezeichnet.

In der Physik treten oft Polynome oder allgemeiner Funktionensysteme auf (zum Beispiel
die Hermite-Polynome) die orthogonal bezüglich eines gewichteten L2 Raumes sind. Das
Skalarprodukt ist dann
Z
(f, g) = ρ(x)f¯(x)g(x)dn x, ρ(x) > 0.
M

Das Integrationsgebiet M ⊂ Rn kann ein endliches oder unendliches Gebiet sein. Die Dichte
ρ muß eine positive Funktion sein. Die Vervollständigung des Funktionenraumes bezüglich
der von (., .) induzierten Norm ist L2 (M, ρ). Das Skalarprodukt und die zugehörige Norm
erfüllen alle obigen Eigenschaften.

Orthogonalität der Legendrepolynome

Die Legendrepolynome sind orthogonal in L2 ([0, 1]). Dies ist einfach zu beweisen. Dazu
schreiben wir die Legendresche Differentialgleichung wie folgt:

d d
Aw = l(l + 1)w, A=− (1 − x2 ) . (3.12)
dx dx
Allgemein ist der zu A adjungierte Operator A wie folgt definiert:

(f, Ag) = (A† f, g).

Für einen symmetrischen Operator ist A = A† . Für den Differentialoperator A in (3.12) gilt
nun
Z1 Z
(f, Ag) = f¯Ag = −(1 − x2 )(f¯g ′ − f¯′ g)|1−1 + Af g = (Af, g),
−1

wobei wir annahmen, daß f und g bei x = ±1 regulär sind, so daß die Oberflächenterme
verschwinden. Für Funktionenräume deren Elemente bei x = ±1 regulär sind, ist also A in
(3.12) symmetrisch. Insbesondere gilt

(APk , Pl ) = k(k + 1)(Pk , Pl ) = (Pk , APl ) = l(l + 1)(Pk , Pl ).

Für l 6= k muß also (Pl , Pk ) = 0 gelten. Deshalb sind die Legendrepolynome orthogonal
zueinander. Es verbleibt noch, die Norm von Pl zu bestimmen. Mit
Z  l
d 2 2
l
(1 − x2 )l = 4l (l!)2
dx 2l + 1
−1

findet man, daß


2 2
(Pl , Pl ) = und damit (Pk , Pl ) = δkl .
2l + 1 2l + 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.3. Der Satz von Fuchs 41

3.2.1 Zugeordnete Legendrefunktionen oder Kugelfunktionen

Bei der Behandlung von wasserstoffähnlichen Atomen in der QM wird man auf die DG

 m2 
(1 − x2 )w′′ − 2xw′ + l(l + 1) − w=0 (3.13)
1 − x2
geführt, wobei l und m ganzzahlig sind. Es erfülle Pl die Legendresche Differentialgleichung
(3.2), dann erfüllt die Helmholtzsche Funktion

(m) dm
Pl = Pl
dxm
die DG
 d d  
(m)
(1 − x2 ) 2 − 2(m + 1)x + l(l + 1) − m(m + 1) Pl = 0.
dx dx
Man braucht nur die Legendresche DG m-mal zu differenzieren. Wir setzen nun
(m) (m)
Pl (x) = (1 − x2 )−m/2 yl (x).
(m)
und bestimmen durch Einsetzen diejenige DG, der yl genügt. Man findet die DG (3.13)
und damit lösen die

(m) dm
yl (x) = (1 − x2 )m/2 Pl (x) (3.14)
dxm
(m)
die DG (3.13). Die Funktion yl ist als zugeordnete Legendreschefunktion oder als zuge-
(m)
ordnete Kugelfunktion bekannt. Die Helmholtz-Funktion Pl ist ein Polynom vom Grad
l − m. Die zugeordnete Legendrefunktion ist ein Polynom form Grad l.

3.3 Der Satz von Fuchs

Wir wollen die Frage beantworten, wann die Lösungen einer Differentialgleichung in eine
Potenzreihe entwickelt werden können. Zur Vorbereitung betrachten wir die DG
w
w′′ + c
= 0, m ∈ Z.
xm
Setzen wir die Reihenentwicklung xα an xn mit a0 6= 0 ein, so finden wir
P

X X
an (n + α)(n + α − 1)xn+α−2 + c an xn+α−m = 0.

Für m > 2 erscheint die niedrigste Potenz ∼ xα−m im zweiten Term. Der entsprechende
Koeffizient a0 muß deshalb verschwinden. Für m = 2 muß a0 α2 − α + c) = 0 gelten. Die

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.3. Der Satz von Fuchs 42

an , n > 0 müssen verschwinden, und die allgemeine Lösung ist


r
1
+β 1
−β 1
w = c1 x 2 + c2 x 2 , β= − c, m = 2.
4
Es gibt als immer zwei Potenzlösungen. Eine davon kann bei x = 0 singulär werden. Für
m < 2 kann die Rekursionsformel gelöst werden und führt auf eine konvergente und nicht-
triviale Lösung:
c
α ∈ {0, 1}, an+2 = − an+m .
(n + 2 + α)(n + α + 1)

Die entsprechende Reihe ist konvergent für alle x und definiert eine analytische Funktion.

Ein zweites instruktives Beispiel ist die Gleichung

w′
w′′ + c =0
xm
welche zu
X X
an (n + α)(n + α − 1)xn+α−2 + c an (n + α)xn+α−1−m = 0

führt. Für m > 1 muß a0 α, und damit α, verschwinden. Die Rekursrelation ist

an+m−1 1 n(n − 1)
=− .
an c n+m−1
Die Reihe hat verschwindenden Konvergenzradius und es gibt keine Lösung die eine Potenz-
reihenentwicklung hat. Für m = 1 ist die allgemeine Lösung eine Linearkombination von
w = 1 und w = x1−c . Für m < 1 folgt

can+m (n + m)
α ∈ {0, 1}, an+1 = − .
(n + α)(n + α + 1)

Dies definiert wiederum eine analytische Funktion. Die Gleichungen

w w′
w′′ + c und w′′ + c
x3 x2
besitzen einen singulären Punkt in x = 0, was die Ursache für das Versagen der Reihen-
entwicklung ist. Im Falle der Legendreschen DG haben die Funktionen p und q einfache
Pole an den Stellen x = ±1, weshalb die erhaltene allgemeine Lösung diese beiden Punkte
auslässt. In den eben betrachteten Gleichungen ist x = 0 ein singulärer Punkt. Ob Lösungen
eine (konvergente) Potenzreihenentwicklung an einer singulären Stelle zulassen hängt offen-
sichtlich vom Divergenzgrad von p und q ab. Wir geben noch ein drittes Beispiel, um den
Sachverhalt zu illustrieren. Die Lösung der Gleichung

w′ w
w′′ + − 2 =0
x x

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.4. Integraltransformationen 43

kann in der Form xα an xn entwickelt werden. Man findet für die allgemeine Lösung
P

a0
w= + a2 x.
x
Es gibt eine bei x = 0 reguläre und eine divergente Lösung. Welche Singularitäten von p, q
noch eine Integration durch Reihen in der Umgebung des singulären Punktes erlauben wird
durch den Satz von Fuchs geklärt:

Satz: Wenn die DG


w′′ + pw′ + qw = 0
in x = x0 einen singulären Punkt besitzt, so gibt es dennoch eine konvergente Potenzrei-
henentwicklung der Lösung in x = x0 (eventuell mit endlich vielen negativen Potenzen) falls
(x − x0 )p(x) und (x − x0 )2 q(x) endlich bleiben für x → x0 .

Singuläre Punkte welche die Voraussetzungen des Fuchsschen Satzes erfüllen heißen außer-
wesentliche Singularitäten der DG; alle übrigen heißen wesentlich. Eine DG, die in der ganzen
komplexen Ebene keine wesentlichen Singularitäten besitzt, heißt eine DG vom Fuchsschen
Typ. Selbst wenn x0 eine außerwesentliche Singularität ist, braucht man bei der Integra-
tion der DG durch Reihen nicht zwei unabhängige Lösungen zu erhalten. Man kann zwei
unabhängige Lösungen der Form
X X
w1 = (x − x0 )α1 an (x − x0 )n und w2 = (x − x0 )α2 bn (x − x0 )n

immer dann erhalten, wenn die beiden Wurzeln α1 und α2 der bestimmenden Gleichung sich
nicht um eine ganze Zahl unterscheiden.

3.4 Integraltransformationen

Es sei eine Differentialgleichung


Lw + λw = 0
gegeben, wobei L ein Differentialoperator ist. Statt w(z) führen wir eine neue Funktion v(ζ)
der komplexen Variablen ζ durch eine Gleichung

Z
w(z) = K(z, ζ)v(ζ)dζ
(3.15)
C

ein, wobei der Transformationskern K(z, ζ) in jeder der beiden Variablen analytisch sein
soll. Der Integrationsweg C in der komplexen ζ-Ebene wird jeweils geeignet zu bestimmen
sein. Die Differentialgleichung geht über in
Z

LK + λK v(ζ)dζ = 0,
C

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 44

wobei sich der Operator L auf die Variable z bezieht. Nun soll K die partielle Differential-
gleichung
LK = AK,
erfüllen, wobei A nur auf die Variable ζ wirkt, so folgt
Z Z
AK + λK v(ζ)dζ = K(z, ζ) A† v + λv dζ = 0.
 

C C

Der Weg C ist hier so zu wählen, daß die Randterme verschwinden. Falls die partielle DG
LK = AK, für deren Wahl man Spielraum hat, und die transformierte DG

A† v + λv = 0 (3.16)

explizit gelöst werden können, so erhält man mit dieser Methode die Lösung w(z) in der
angegebenen Integralform.

In der Analysis treten solche Integraltransformationen in verschiedener Gestalt auf. Für den
Kerne
K(z, ζ) = ezζ , K(z, ζ) = eizζ und K(z, ζ) = (z − ζ)α
sind dies die Transformation von Laplace und Euler. Im Folgenden werden wir Integraltrans-
formationen für mehrere Differentialgleichungen diskutieren.

3.5 Besselfunktionen

Wir beginnen mit der für die QM wichtigen Besselschen Differentialgleichung. Dies ist die
folgende Differentialgleichung
z 2 w′′ + zw′ + (z 2 − λ2 )w = Lw − λ2 w = 0, λ = konstant.
Sie ist eine Gleichung vom Fuchsschen Typ mit einer außerwesentlichen Singularität bei
z = 0. Da z = 0 eine Stelle der Bestimmtheit der Gleichung ist, kann dort ihre Lösung in
eine Potenzreihe entwickelt werden. Man findet
an
(α2 − λ2 )a0 = 0, ((α + 1)2 − λ2 )a1 = 0, an+2 = 2 .
λ − (n + 2 + α)2
Offensichtlich ist α = ±λ und a1 = 0. Für α = λ findet man
 z2 z4 
w = a0 z λ 1 − + + ···
2(2λ + 2) 2 · 4(2λ + 2)(2λ + 4)
und für α = −λ
 z2 z4 
w = a0 z −λ 1 + + + ··· .
2(2λ − 2) 2 · 4(2λ − 2)(2λ − 4)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 45

Diese Lösung geht aus der ersten durch die Ersetzung λ → −λ hervor. Setzen wir
1
a0 = ,
2λ Γ(λ + 1)
dann nennt man den sich ergebenden Ausdruck

X (−)n z λ+2n
Jλ (z) =
n=0
Γ(n + 1)Γ(n + λ + 1) 2

Besselfunktion vom Grade λ.

0.8

0.6

0.4

0.2

0 2 4 6 8
x

-0.2

-0.4

Die Besselfunktionen vom Grade = 0,1,2,3.

Die vollständige Lösung der Besselschen Differentialgleichung (λ nicht ganzzahlig) ist also

w = aJλ (z) + bJ−λ (z). (3.17)

Die Jλ sind die Besselfunktionen der Ordnung λ.

Für λ = l ∈ {1, 2, . . .} ist


X (−)n z 2n−l
J−l (z) = ,
n!(n − l)! 2
n=l,l+1,...

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 46

wobei wir
1
lim =0 für n = l − 1, l − 2, . . .
λ→−l Γ(n + λ + 1)

benutzten. Setzten wir m = n − l so finden wir


X (−)m+l z 2m+l
J−l (z) = = (−)l Jl (z).
m=0,1,...
(m + l)!m! 2

Für ganzzahlige λ sind also Jλ und J−λ linear abhängig.

Integraltransformation
R
Setzen wir w = Kvdζ so folgt
Z
z 2 Kzz + zKz + z 2 K − λ2 K)v(ζ)dζ = 0.
C

Wir fordern nun, daß

LK = z 2 Kzz + zKz + z 2 K = −Kζζ = AK

gilt, mit der in der ganzen z und ζ-Ebene regulären Lösung

K(z, ζ) = e±iz sin ζ .

Die Besselsche DG geht über in


Z
Kζζ + λ2 K v(ζ)dζ = 0


oder, wie man nach partieller Integration erkennt, in


d
Z Z
K(z, ζ) v ′′ + λ2 v dζ − Kv ′ − Kζ v dζ = 0.
 

C C

Die transformierte DG v ′′ + λ2 v = 0 hat die Lösungen exp(±iλζ). Nun müssen wir noch
den Integrationsweg C geeignet wählen damit die Oberflächenterme verschwinden. Auf den
senkrechten Abschnitten der in Abb. 3.2 mit C1 und C2 bezeichneten Wege ist wegen sin(ζ =
ξ + iη) = sin ξ cos(iη) + sin(iη) cos ξ gleich

sin ζ = sin ξ cosh η + i cos ξ sinh η = −i sinh |η|

und damit der Realteil von

−iz sin ζ = −z sinh |η| gleich − ℜ(z) sinh |η|,

also negativ für ℜ(z) > 0. Setzen wir K(z, ζ) = exp(−iz sin ζ) so strebt auf C1 und C2 der
Zusatzterm Kv ′ − Kζ v beiderseits gegen Null, und wir erhalten in den Integralen

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 47

− π +i π+ i

8
ζ ζ

C2
C1

sin ζ = - i sinh η sin ζ = - i sinh η

o o π
−π

sin ζ = i sinh η sin ζ = i sinh η

-i -i
8

Abbildung 3.2: Integrationswege in der komplexen ζ-Ebene

1 1
Z Z
Hλ1 (z) = − e−iz sin ζ+iλζ dζ und Hλ2 (z) = − e−iz sin ζ+iλζ dζ
π π (3.18)
C1 C2

zwei Lösungen der Besselschen DG, die sogenannten Hankelfunktionen. Man sieht leicht, daß
diese Integrale für ℜ(z) > 0 konvergieren.

Für die analytische Fortsetzung zu ℜ(z) ≤ 0 deformieren wir den Integrationsweg C1 . Wir
setzen
λ = a + ib, ζ = ξ + iη, z = x + iy
dann sind der Real- und Imaginärteil der Funktion
f (ζ) = −iz sin ζ + iλζ
im Exponenten
ℜf (ζ) = y sin ξ cosh η + x cos ξ sinh η − bξ − aη
ℑf (ζ) = −x sin ξ cosh η + y cos ξ sinh η + aξ − bη.
Jetzt wählen wir für die senkrechten Teile des Weges C1 statt der Abszissen 0 und −π die
Abszissen ξ0 und −π − ξ0 . Wegen
1 |η| 
ℜf (ζ) ∼ e y sin ξ0 − x cos ξ0 + O(|η|) für |η| → ∞
2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 48

ist das Integral


Z
ef (ζ) dζ
C1

für solche z konvergent, für welche


y sin ξ0 − x cos ξ0 < 0
ist. Vergrößert man nun ξ0 , dann dreht sich die Halbebene auf welcher das Integral kon-
111111
000000
000000
111111
000000
111111 11111111111111
00000000000000
ξ =0 000000
111111
000000
111111 00000000000000
11111111111111
ξ 0 = π/4
000000
111111 00000000000000
11111111111111
0
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
000000
111111 00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111

ξ = 3 π /4
11111111111111
00000000000000 ξ = π /2
00000000000000
11111111111111
0 0
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111 1111111111111
0000000000000
0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
0000000000000
1111111111111
00000000000000
11111111111111 0000000000000
1111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111
00000000000000
11111111111111

Abbildung 3.3: Deformation des Integrationsweges in der Integraltransformation

vergiert und eine in z analytische Funktion definiert, um den Punkt z = 0. Zum Beispiel,
definiert das Integral mit ξ0 = 0 eine analytische Funktion in der Halbebenen ℜz > 0 und
das Integral mit ξ0 = π/2 eine analytische Funktion in der Halbebene ℑz < 0. Die Viertele-
bene mit ℜz > 0 und ℑz < 0 liegt in beiden Halbebenen. Auf dieser Viertelebene stimmen
die beiden Integrale aber überein. Sind C1 (0) und C1 (π/2) die beiden Integrationswege mit
ξ0 = 0 und ξ0 = π/2, so gilt
Z Z
ef (ζ) dζ = ef (ζ) dζ
C1 (0) C1 (π/2)

für ℜz > 0 und ℑz < 0, da der eine Weg so in den anderen deformiert werden kann, ohne daß
die Randterme beitragen. Lassen wir also ξ0 in geeigneter Weise eine unbeschränkte Folge

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 49

positive oder negative Werte durchlaufen, so entsteht nach und nach das gesamte analytische
Gebilde der Funktion Hλ1 (z), nämlich eine Riemannsche Fläche, die im Nullpunkt einen
Verzweigungspunkt mit von λ abhängiger Ordnung besitzt (siehe Abb. 3.3).

Für ξ0 = −π/2 verschwindet der waagerechte Bestandteil des Integrationsweges, und wir
erhalten

Z∞
e−iπλ/2
Hλ1 (z) = eiz cosh η−λη dη (3.19)

−∞

welches die Funktion in der oberen Halbebene ℑz > 0 darstellt. Lassen wir im Sektor

δ ≤ arg z ≤ π − δ

ins Unendliche wachsen, so strebt der Integrand auf dem ganzen Integrationsweg gegen Null.
Ähnlich argumentiert man, daß H2λ (z) gegen Null strebt, wenn z im Sektor

π + δ ≤ arg z ≤ 2π − δ

ins Unendliche wächst. Damit haben wir bewiesen, daß

Lemma Die Hankelfunktionen erfüllen

Hλ1 (z) −→ 0 für |z| → ∞, δ ≤ arg(z) ≤ π − δ


Hλ2 (z) −→ 0 für |z| → ∞, π + δ ≤ arg(z) ≤ 2π − δ.

Man kann leicht zeigen, daß Hλ1 auf der negativen und Hλ2 auf der positiven imaginären
Achse mit |z| → ∞ über alle Grenzen wachsen. Damit müssen Hλ1 , Hλ2 linear unabhängige
Lösungen der Besselschen Differentialgleichung sein.

Um die Hankel- mit den Besselfunktionen in Verbindung zu bringen, bemerken wir, daß für
reelle λ und reelle z die Lösungen Hλ1 und Hλ2 konjugiert komplex zueinander sind.

Ersetzen wir in der Darstellung


1
Z
Hλ1 (z) = − eiz sin ζ−iλζ dζ,
π
C̄1

wobei C̄1 das Spiegelbild von C1 an der reellen Achse ist, ζ durch −ζ, so folgt
1
Z
Hλ1 (z) = e−iz sin ζ+iλζ dζ.
π
−C̄1

Da −C̄1 gleich dem im negativen Sinne durchlaufenen Wege C2 ist, so wird


1
Z
1
Hλ (z) = − e−iz sin ζ+iλζ dζ = Hλ2 (z),
π
C2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 50

η η η
ζ −ζ

ξ ξ

Abbildung 3.4: Die verschiedenen Integrationswege.

was zu beweisen war. Hλi (z) und H−λi


(z) erfüllen dieselbe Differentialgleichung, die ja nur
λ enthält. Deshalb müssen diese 4 Funktionen linear abhängig sein. Da Hλi (z) und H−λ
2 i
(z)
dasselbe asymptotische Verhalten zeigen, liegt die Vermutung nahe, daß sie abhängig sind.
Um dies zu beweisen ersetzt man in der Integraldarstellung
1
Z
1
H−λ (z) = − e−iz sin ζ−iλζ dζ
π
C1

ζ durch −ζ − π. Dann ist

eiπλ
Z
1
H−λ (z) = e−iz sin ζ+iλζ dζ.
π
C̃1

Aber da C̃1 gleich das im negative Sinn durchlaufene C1 ist, haben wir gezeigt, daß
1
H−λ (z) = eiλπ Hλ1 (z)

gilt. Analog beweist man, daß


2
H−λ (z) = e−iλπ Hλ2 (z)

Damit sind
1 1 1
Hλ (z) + Hλ2 (z) und Nλ (z) = Hλ1 (z) − Hλ2 (z)
 
Jλ (z) =
2 2i
Lösungen der Besselgleichungen, welche für reelle λ und z reell sind und welche
    
J−λ (z) cos πλ − sin πλ Jλ (z)
=
N−λ (z) sin πλ cos πλ Nλ (z)

erfüllen. Es sind die Besselschen und Neumannschen Funktionen vom Index λ.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 51

Integraldarstellung der Besselschen Funktionen

Addieren wir Hλ1 und Hλ2 , so heben sich die auf der imaginären Achse laufenden Integrati-
onswege in Abb.(3.2). Wir erhalten also in für ℜ(z) > 0 die folgende Darstellung für Jλ :

1
Z
Jλ (z) = − e−iz sin ζ+iλζ dζ, ℜz > 0,
2π (3.20)
C

wobei C der in Abb. 3.2 gekennzeichnete Weg ist.

Ist nun λ eine ganze Zahl, so heben sich wegen der Periodizität des Integranden die Integrale

−π+ i π+ i
8

8
Weg C

0
−π π

Abbildung 3.5: Integrationsweg für Besselfunktionen.

über die senkrechten Abschnitte von C weg und es ergibt sich

Zπ Zπ
1 iz sin ζ−inζ 1 
Jn (z) = e dζ = cos z sin ζ − nζ dζ. (3.21)
2π π
−π 0

Wir sehen, daß die Besselschen Funktionen mit ganzzahligem Index ganze Funktionen auf
C sind. Die Darstellung (3.21) zeigt, daß Jn (z) der nte Fourierkoeffizient in der Fourierent-
wicklung von

X
eiz sin ζ = Jn (z)einζ
−∞

nach ζ ist. Beachten wir noch, daß J−n (z) = (−)n Jn (z) ist, so erhalten wir

X
cos(z sin ζ) = J0 + 2 J2n (z) cos 2nζ
1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.5. Besselfunktionen 52


X
sin(z sin ζ) = 2 J2n−1 (z) sin(2n − 1)ζ,
1

und speziell für ζ = π/2


cos(z) = J0 − 2J2 + 2J4 (z) − . . . , sin(z) = 2J1 (z) − 2J3 (z) + . . . .
Wir geben schlußendlich noch eine zweite Integraldarstellung der Besselfunktionen an, die
auf eine nützliche Rekursionsformel für die Besselfunktionen mit ganzzahligem Index führt.
Es sei

- C
8

-1 1

-
8

-i

Abbildung 3.6: Der Integrationsweg C̃ in der komplexen ζ-Ebene.

1 1
ζ̃ = e−iζ , so daß sin ζ = ζ̃ − .
2i ζ̃
Dann geht (3.20) über in

z 1
1 e 2 (ζ− ζ )
Z
Jλ (z) = dζ, (3.22)
2πi ζ λ+1

wobei wir ζ̃ wieder mit ζ bezeichneten. Der neue Integrationsweg C̃ ist in Abb. 3.6 dargestellt.
Wegen
z 1
d e 2 (ζ− ζ ) hz 1 1  λ i z2 (ζ− ζ1 )
Z Z
0 = dζ = dζ + − e
dζ ζ λ+1 2 ζλ ζ λ+2 ζ λ+1
C̃ C̃
ergeben sich die wichtigen Rekursionsrelationen

Jλ−1 (z) + Jλ+1 (z) =
Jλ (z).
z
Diese gelten nicht nur für die Besselfunktionen, sondern auch für beide Hankelfunktionen.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.6. Hypergeometrische Differentialgleichung 53

3.6 Hypergeometrische Differentialgleichung

Dies ist die Differentialgleichung

(z 2 − z)w′′ + (1 + a + b)z − c w′ + abw = 0.


 
(3.23)

Die Parameter a, b und c sind Konstanten, c wird als nicht ganzzahlig vorausgesetzt. Die
Gleichung hat außerwesentliche Singularitäten in 0, 1 und ∞. Die Bestimmungsgleichung für
die Entwicklung um z = 0 lautet

α(α − 1) + αc = 0.

Also ist α = 0 oder α = 1 − c. Die Rekursionsrelation lautet


(α + n + a)(α + n + b)
an+1 = an .
(α + n + 1)(α + n + c)

Für α = 0 vereinfacht sich diese zu


(a + n)(b + n)
an+1 = an
(n + 1)(n + c)

und damit erhalten wir für α = 0 folgende Lösung:

 ab a(a + 1)b(b + 1) 2 a(a + 1)(a + 2)b(b + 1)(b + 2) 3 


w =A 1+ z+ z + z + ··· . (3.24)
1·c 2! · c(c + 1) 3! · c(c + 1)(c + 2)

Die Reihe in den Klammern heißt hypergeometrische Reihe. Sie konvergiert innerhalb des
Einheitskreises. Für a = 1 und b = c wird sie zur gewöhnlichen geometrischen Reihe; daher
ihr Name. Man bezeichnet die Reihe mit F (a, b, c; z). Damit ist die partikuläre Lösung
w = AF (a, b, c; z).
Für α = 1 − c lautet die die Rekursionsformel
(a − c + n + 1)(b − c + n + 1)
an+1 = an .
(n + 1)(n + 2 − c)

Benutzt man die neuen Konstanten a′ = a − c + 1, b′ = b − c + 1 und c′ = 2 − c, so entsteht

(a′ + n)(b′ + n)
an+1 = an ,
(n + 1)(n + c′ )

also dieselbe Rekursionsrelation wie für α = 0. Die entsprechende partikuläre Lösung ist
daher

w = Bz 1−c F (a − c + 1, b − c + 1, 2 − c; z).

Damit ergibt sich folgende allgemeine Lösung der hypergeometrischen Differentialgleichung:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 3. Spezielle Funktionen 3.6. Hypergeometrische Differentialgleichung 54

w = AF (a, b, c; z) + Bz 1−c F (a − c + 1, b − c + 1, 2 − c; z). (3.25)

Die obige Reihendarstellung für F konvergiert innerhalb des Einheitskreises. Wir überlassen
es einer Übungsaufgabe, zu zeigen, daß
1−ξ
Pl (ξ) = F (l + 1, −l, 1; )
2
die Legendreschen Polynome sind. Die hypergeometrische Reihe ist ein Polynom, falls a oder
b negativ ganz oder 0 sind.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4

Gruppen

Die Gruppentheorie ist eine rein mathematische Disziplin ziemlich abstrakter Art. Ihre große
Bedeutung für die Physik erhält sie erst, wenn man mit ihr den Begriff der Symmetrie ver-
bindet. Die im Folgenden zu behandelnde Gruppen- und Darstellungstheorie wurde in den
letzten Jahrzehnten das alltägliche Instrument der Festkörper-, Kern- und Elementarteil-
chenphysiker. Zum Beispiel versucht man in der modernen Theorie der Elementarteilchen
mit Hilfe von Symmetriebetrachtungen möglichst viele Eigenschaften der ‘elementarsten
Bausteine’ zu erklären ohne die den Wechselwirkungen zugrunde liegenden Dynamiken zu
lösen. Die Grundlagen der Gruppentheorie wurden in erster Linie von Evariste Galois
(1811-1832) im Alter von 21 Jahren niedergelegt. Er untersuchte die Lösbarkeit der Glei-
chungen mit einer Unbekannten n-ten Grades mit konstanten Koeffizienten durch Radikale.
Mit Einführung des Gruppenbegriffes gelang ihm die Entscheidung dieses uralten Problems.
Die Gruppentheorie ist heute ein wesentlicher Bestandteil der physikalischen Forschung.
Hermann Weyl, der schon früh die Relevanz dieser Theorie für die Physik erkannte,
schreibt dazu1 :

Symmetrie, ob man ihre Bedeutung weit oder eng faßt, ist eine Idee, vermöge derer der
Mensch durch Jahrtausende seiner Geschichte versucht hat, Ordnung, Schönheit und Voll-
kommenheit zu begreifen und zu schaffen.

Wegen des großen Umfangs habe ich eine (natürlich subjektive) Auswahl getroffen. Viele
Beweise fehlen völlig oder werden nur skizziert. Der aufmerksame Zuhörer sollte aber am
Ende dieses Kapitels in der Lage sein, einfache gruppentheoretische Probleme, wie sie etwa
in der Quantenmechanik, Molekülphysik, Festkörperphysik oder Teilchenphysik auftreten,
selbständig zu lösen.

In meinem Skript um zur Vorlesung Gruppentheoretische Methoden der Physik finden Sie
eine ausgewählte Liste von Büchern, Skripten und algebraische Computerprogrammen zur
1 H. Weyl, Symmetrie, Birkhäuser, Basel (1955).

55
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 56

Gruppen- und Darstellungstheorie. Wir erinnern zuerst an den Begriff einer Gruppe:

Definition: Eine Gruppe G besteht aus einer Menge von Elementen {g1 , g2 , . . .} die vier
grundlegende Postulate erfüllen:

1. Durch eine Multiplikation G × G → G, {g1 , g2 } → g1 g2 ∈ G ist jedem Paar g1 , g2


eindeutig ein Element g1 g2 der Gruppe zugeordnet. Im allgemeinen ist

g1 g2 6= g2 g1 .

2. Diese Multiplikation ist assoziativ : g1 (g2 g3 ) = (g1 g2 )g3 .


3. Es existiert ein Einselement e ∈ G mit der Eigenschaft eg = ge = g für jedes Element
g der Gruppe.
4. Für jedes Element g existiert das inverse Element g −1 ∈ G, so daß gg −1 = g −1 g = e.

Die wohl einfachste Gruppe bilden die ganzen Zahlen mit der Addition als Verknüpfungsge-
setz. Die Null ist das Einselement und das Inverse von a ist −a. Bezüglich der Multiplikation
von Zahlen bildet diese Menge aber keine Gruppe (0 hat kein Inverses).

4.1 Beispiele von Gruppen

Es gibt endliche, diskret-unendliche und kontinuierliche Gruppen. Die einfachsten und für
uns Physiker zugleich wichtigsten Gruppen sollen hier kurz vorgestellt werden. Bei der
Einführung der wichtigsten gruppentheoretischen Begriffe können wir auf die hier vorge-
stellten Gruppen zurückgreifen.

4.1.1 Endliche Gruppen, SN :

Die wichtigsten endlichen Gruppen sind die symmetrischen Gruppen SN , oft auch Permuta-
tionsgruppen genannt. Die Elemente von SN sind die Permutationen von N Symbolen. Für
3 Elemente sind dies die Transformationen
     
1 2 3 1 2 3 1 2 3
e = , a= , b = a2 = ,
1 2 3 2 3 1 3 1 2
     
1 2 3 1 2 3 1 2 3
c = , d = ca = f = cb = .
1 3 2 3 2 1 2 1 3

Dabei bedeutet ca zuerst a und dann c ausführen. Zum Beispiel ist


   
1 2 3 1 2 3
ca = 6 ac =
=
3 2 1 2 1 3

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 57

1
b

T (f ) T (d)

T (a)
b b
2 3

T (c)

Abbildung 4.1: Die Wirkung der Drehung T (a) und Spiegelungen T (c), T (d) und T (f ) auf
die Ecken eine gleichseitigen Dreiecks.

und die Gruppe SN ist nicht Abelsch. SN hat N ! Elemente. Wir können S3 als Transfor-
mationsgruppe auf V = R darstellen. Die Wirkungsmenge von S3 seien die Ecken eines
2

gleichseitigen Dreiecks. Dabei sei T (a) die Drehung um 1200 und T (c) die Spiegelung an der
Vertikalen. Die Deckoperation sind in der folgenden Abbildung dargestellt:

Gruppentafel: Für kleine endliche Gruppen ist es oft sinnvoll, eine sogenannte Gruppentafel
zu erstellen um sich eine Übersicht über die Gruppenstruktur erhalten. Die folgende Tabelle
zeigt eine derartige Gruppentafel:

e g2 g3 ... gn ...
e e g2 g3 ... gn ...
g2 g2 g22 g2 g3 ... g2 gn ...
g3 g3 g3 g2 g32 ... g3 gn ...
.. .. .. .. .. ..
. . . . ... . .
gm gm gm g2 gm g3 . . . gm gn ...
.. .. .. .. ..
. . . . ... . ...

In jeder Reihe und Spalte der Gruppentafel muss jedes Element der Gruppe genau einmal
auftreten. Denn aus ggp = ggq folgt nach Multiplikation mit g −1 von links, daß gp = gq sein
muss. Analog kann gp g nur gq g sein falls gp = gq ist.

Die Ordnung |G| einer Gruppe G ist die Zahl der Elemente der Gruppe. Zum Beispiel ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 58

|S3 | = 3! = 6 und die Multiplikationstabelle dieser Gruppe ist wie folgt:

S3 e a b c d f
e e a b c d f
a a b e f c d
b b e a d f c
c c d f e a b
d d f c b e a
f f c d a b e

Die ausgezeichnete Rolle der Permutationsgruppen ist in dem Theorem von Cayley be-
gründet. Nach diesem Theorem ist jede Gruppe der Ordnung N eine Untergruppe der Per-
mutationsgruppe SN .

4.1.2 Liesche Gruppen, SU(2)

Während die endlichen oder diskreten Gruppen in der Festkörper und Molekülphysik von
Interesse sind, spielen in der Quantenmechanik und Teilchenphysik vorwiegend die kontinu-
ierlichen Lie-Gruppen eine wichtig Rolle. Im Allgemeinen definiert man:

Definition: Eine Lie-Gruppe G ist eine Gruppe, die zugleich eine differenzierbare Mannig-
faltigkeit ist, derart daß die Multiplikation

G × G −→ G, (g1 , g2 ) −→ g1 g2

und die Inversenbildung

G −→ G, g −→ g −1

jeweils stetige und differenzierbare Abbildungen sind.


n
Eine n-dimensionale Mannigfaltigkeit kann lokal mit einer offenen Menge des R identifiziert
werden (siehe die einschlägigen Lehrbücher über Differentialgeometrie). Wir werden diese
Begriffe für die Gruppe SU (2) illustrieren. Diese Lie-Gruppe ist die wichtigste Gruppe in
der Quantenmechanik. Die quantenmechanischer Zustände mit festem Drehimpuls bilden
eine irreduzible Darstellung der quantenmechanischen Drehgruppe SU (2).
2
Die Elemente g ∈ SU (2) lassen das Skalarprodukt (x, y) = x̄1 y1 + x̄2 y2 auf C invariant:
(gx, gy) = (x, y). Sie erfüllen g † g = gg † = 1 und det g = 1. Da die Zeilen von g unitär
orthogonal sein müssen, ist
 
a b
g= .
−λb̄ λā

Die Orthogonalität der Kolonnen fordert |λ| = 1. Die Determinantenbedingung lautet dann
λ(aā + bb̄) = 1, woraus λ = 1 und aā + bb̄ = 1 resultiert. Also ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 59

 
a b
n o
SU (2) = g = mit aā + bb̄ = 1 . (4.1)
−b̄ ā

Die Zuordnung
n X o
α = (ℜa, ℑa, ℜb, ℑb)| α2i = 1 −→ SU (2)

ist bijektiv.
α0
α = (1, 0, 0, 0)
b

S3

α = (−1, 0, 0, 0)

Abbildung 4.2: Die Gruppe SU (2) kann mit S 3 identifiziert werden.

Die Lie-Gruppe SU (2) kann also mit der 3-dimensionalen Sphäre S 3 identifiziert werden
(siehe Abb. 4.2). Die Sphäre kann aber nicht stetig auf eine offene Umgebung in R abgebil-
3

det werden. Aber man kann mittels der stereographischen Projektionen φ± vom Süd- bzw.
Nordpol die nördliche und südliche Hemisphäre auf eine offene Menge des R abbilden
3

φ± : H± −→ φ± (H± ).

Auf dem Überlapp H+ ∩ H− hat man die Gruppe SU (2) auf zwei Arten beschreiben (siehe
Abb. 4.3)

H+ ∩ H− ∋ p −→ x = φ+ (p) bzw. x̃ = φ− (p).

Die Koordinatentransformation

x = H+ (p) −→ x̃ = H− (p)

ist differenzierbar, wie man sich leicht überzeugt. Auch die Gruppenmultiplikation ist eine
differenzierbare Abbildung, so daß SU (2) in der Tat eine Lie-Gruppe ist.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 60

H+
nördl. Hemisphäre
S n = H+ ∪ H−

p
b

p b
H+ ∩ H−
südl. Hemisphäre
H−

Abbildung 4.3: Die Gruppe SU (2) kann mit zwei Karten überdeckt werden.

4.2 Elemente der Gruppentheorie

Wir führen nun die für uns wichtigsten Begriffe der Gruppentheorie ein und illustrieren diese
anhand der endlichen Permuationsgruppen und der Lie-Gruppe SU (2).

4.2.1 Untergruppen

Als Untergruppe von G bezeichnet man eine Untermenge H die unter der Multiplikation
in G abgeschlossen ist und eine Gruppe bildet. Das Einselement e ∈ G muss immer in H
liegen.

Die zyklische Gruppe CN als Untergruppe der Permutationsgruppen SN : Zum Beispiel


bilden die zyklischen Vertauschungen e, a, b eine Untergruppe von S3 , d.h. eine echte Teil-
menge die bezüglich der Verknüpfung abgeschlossen ist. Diese Untergruppe ist gerade die
zyklische Gruppe C3 der Ordnung 3. Allgemeiner besteht die zyklische Gruppe CN aus den
Elementen
CN = {e = a0 , a, a2 , a3 , . . . aN −1 |aN = e}.
Die Ordnung der Gruppe ist offensichtlich N . Wegen an aN −n = e hat jedes Gruppenelement
ein Inverses. Die zyklische Gruppe ist kommutativ,
an am = am an .
Damit ist CN eine Abelsche Untergruppe der Permutationsgruppe SN . Wir können an als
zyklische Vertauschung von N Elementen oder äquivalent dazu als Drehung in der Ebene
um den Winkel 2nπ/N realisieren. Zum Beispiel für S3
     
1 2 3 1 2 3 2 1 2 3
e= , a= =⇒ a = , a3 = e.
1 2 3 2 3 1 3 1 2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 61

In der Tat, es gibt nur eine Gruppe der Ordnung 3 und zwei Gruppen der Ordnung 4.

Die Gruppe U(1) tritt als Untergruppe von SU (2) auf. Die Elemente von U (1) sind die
diagonalen Matrizen in SU (2),

eiλ
n 
0
o
−it |t ∈ [0, 2π) ⊂ SU (2). (4.2)
0 e

Wir dürfen die beiden Diagonalelemente getrennt betrachten und erhalten die Gruppe

U (1) = {g(t) = eit |0 ≤ t < 2π}. (4.3)

Die Transformation g(t) transformiert z in eit z, d.h. dreht die komplexen Zahlen mit Winkel
t um den Ursprung. Die Gruppe ist Abelsch und isomorph zur Addition der reellen Zahlen

eiα z
eiα

α
α z

S 1 ≈ U (1)

Abbildung 4.4: Die Gruppe U (1) kann mit S 1 identifiziert werden.

modulo 2π,

g(t1 ) · g(t2 ) = ei(t1 +t2 ) = g(t1 + t2 ) = g(t2 ) · g(t1 ), g(t + 2π) = g(t), (4.4)

d.h. U (1) ist isomorph zum Kreis S 1 . Die Abelsche Gruppe U (1) ist in gewissem Sinne der
Grenzfall U (1) ∼ limN →∞ CN .

4.2.2 Konjugationsklassen:

Um diese Klassen einzuführen benötigen wir die

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 62

Definition: Zwei Elemente a, b ∈ G heißen zueinander konjugiert, a ∼ b, wenn es ein g ∈ G


gibt, so daß
gag −1 = b.
Offensichtlich gelten
a ∼ a, a ∼ b =⇒ b ∼ a, und a ∼ b, b ∼ c =⇒ a ∼ c.
Die letzte Eigenschaft folgt aus:
b = gag −1 , c = g̃bg̃ −1 =⇒ c = g̃(gag −1 )g̃ −1 = (g̃g)a(g̃g)−1 .
Aus diesen Eigenschaften folgt unmittelbar, daß wir jede Gruppe eindeutig in disjunkte
Klassen Ki zerlegen können. Zwei Klassen haben entweder kein gemeinsames Element oder
sie sind gleich. Die Konjugationsklasse eines Elementes a,

Ka = {gag −1|g ∈ G}, (4.5)

enthält immer das Element a. Die Elemente einer Klasse sind zueinander konjugiert, gKi g −1 =
Ki und das Einselement bildet immer eine Klasse für sich. Zum Beispiel hat S3 die drei Klas-
sen,

S3 = {Ke , Ka , Kc } = {{e}, {a, b}, {c, d, f }}, (4.6)

und hat die Permutationsgruppe |S3 | = 1 + 2 + 3 Elemente.

Die Anzahl Elemente der Konjugationsklasse Ki sei n(Ki ). Demnach gilt

X
n(Ki ) = Ord(G).
(4.7)
i

Satz: Die Anzahl Elemente n(Ki ) der Konjugationsklasse Ki ist ein Teiler der Anzahl der
Gruppenelemente. Ist |G| eine Primzahl, dann ist G Abelsch.

Beweis des Satzes: Die zweite Aussage folgt sofort aus der Ersten. Ist nämlich die Gruppen-
ordnung eine Primzahl, dann ist nach der ersten Aussage des Satzes die Anzahl Elemente
jeder Konjugationsklasse gleich 1. Also bildet jedes Element eine Klasse für sich, d.h. es ist
gag −1 = a oder ag = ga für zwei beliebige Gruppenelemente g und a. Also ist G Abelsch.
Um die erste Aussage zu beweisen braucht es einiger Vorbemerkungen. Es sei H ⊂ G eine
beliebige Untergruppe von G. Wir bilden die Restklassen (Nebenklassen) modulo H:
a∼
˙ b falls a−1 b ∈ H ⇐⇒ a ∼
˙ b falls b ∈ aH.
2
Dies definiert eine Äquivalenzrelation
a∼
˙ a, a∼
˙ b ⇔ b∼
˙ a, a∼
˙ b, b ∼
˙ c ⇒ a∼
˙ c.
2 Die Äquivalent ∼
˙ sollte nicht mit der obigen vermittels der Konjugation eingeführten Äquivalenz ∼
verwechselt werden!

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 63

Nun zerlegen wir die die Gruppe in disjunkte Restklassen modulo H,

eH, aH, a′ H, . . . .

Zwei Restklassen haben entweder kein gemeinsames Element, oder sie sind gleich. Offen-
sichtlich ist aH = bH genau dann wenn a ∼
˙ b und weiterhin ist |aH| = |H|. Deshalb gilt

Lemma: Der Index j = |G|/|H| der Untergruppe H von G ist immer eine natürliche Zahl.

Nun betrachten wir spezielle Untergruppen in G. Für jedes a ∈ G definieren wir den Nor-
malisator (Stabilisator) Na von a gemäß

Na = {g ∈ G|gag −1 = a} ⊂ G. (4.8)

Offensichtlich liegen e und a immer im Normalisator von a. Wie man leicht nachrechnet ist
Na eine Untergruppe von G und entsprechend ist |G|/|Na | eine natürliche Zahl für jedes
a ∈ G. Nun ist

g1 ag1−1 = gag −1 ⇔ g −1 g1 ∈ Na ⇔ g1 ∈ gNa .

Also

g1 ag1−1 6= gag −1 ⇐⇒ g1 ∈
/ gNa .

Die Anzahl Elemente in der Konjugationsklasse von a ist also gleich der Anzahl Nebenklassen
des Normalisators Na von a, d.h. |Ka | = j(Na ). Damit wäre der erste Teil des Satzes ebenfalls
bewiesen.

Wie sieht das für S3 aus? Die Normalisatoren

Ne = G, Na = Nb = C3 , Nc = {e, c}, Nd = {e, d} und Nf = {e, f } (4.9)

haben 6, 3 oder 2 Elemente. Man sieht hier explizit, daß diese Zahlen die Ordnung 6 der
Gruppe teilen. Die Indexe der Normalisatoren sind

j(Ne ) = 1, j(Na ) = j(Nb ) = 2, und j(Nc ) = j(Nd ) = j(Nf ) = 3, (4.10)

und stimmen mit der Anzahl Elemente der Konjugationsklassen Ki in (4.6) überein.

Nun wollen wir noch die Frage beantworten, wann zwei Elemente in SU (2) konjugiert sind.
In der linearen Algebra beweist man, daß jede unitäre Matrix vermittels einer unitären
Matrix diagonalisiert werden kann. Deshalb ist
 iλ   iλ 
e 1 0 e 2 0
g1 ∼ und g2 ∼ ,
0 e−iλ1 0 e−iλ2

wobei die exp(±iλi ) die Eigenwerte von gi sind. Daher ist g1 ∼ g2 falls sie dieselben Eigen-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 64

werte haben. In der Tat kommt es wegen


 iλ   −iλ 
e 0 e 0
(iσ1 )−1 (iσ1 ) = , iσ1 ∈ SU (2),
0 e−iλ 0 eiλ

nicht auf die Reihenfolge der Eigenwerte an. Deshalb gilt

g1 ∼ g2 ⇐⇒ Sp g1 = Sp g2 . (4.11)

Die Spur ist konstant auf jeder Konjugationsklasse, sie ist eine sogenannte Klassenfunktion.
Elemente aus verschiedenen Konjugationsklassen haben verschiedene Spuren.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4

Gruppen

Die Gruppentheorie ist eine rein mathematische Disziplin ziemlich abstrakter Art. Ihre große
Bedeutung für die Physik erhält sie erst, wenn man mit ihr den Begriff der Symmetrie ver-
bindet. Die im Folgenden zu behandelnde Gruppen- und Darstellungstheorie wurde in den
letzten Jahrzehnten das alltägliche Instrument der Festkörper-, Kern- und Elementarteil-
chenphysiker. Zum Beispiel versucht man in der modernen Theorie der Elementarteilchen
mit Hilfe von Symmetriebetrachtungen möglichst viele Eigenschaften der ‘elementarsten
Bausteine’ zu erklären ohne die den Wechselwirkungen zugrunde liegenden Dynamiken zu
lösen. Die Grundlagen der Gruppentheorie wurden in erster Linie von Evariste Galois
(1811-1832) im Alter von 21 Jahren niedergelegt. Er untersuchte die Lösbarkeit der Glei-
chungen mit einer Unbekannten n-ten Grades mit konstanten Koeffizienten durch Radikale.
Mit Einführung des Gruppenbegriffes gelang ihm die Entscheidung dieses uralten Problems.
Die Gruppentheorie ist heute ein wesentlicher Bestandteil der physikalischen Forschung.
Hermann Weyl, der schon früh die Relevanz dieser Theorie für die Physik erkannte,
schreibt dazu1 :

Symmetrie, ob man ihre Bedeutung weit oder eng faßt, ist eine Idee, vermöge derer der
Mensch durch Jahrtausende seiner Geschichte versucht hat, Ordnung, Schönheit und Voll-
kommenheit zu begreifen und zu schaffen.

Wegen des großen Umfangs habe ich eine (natürlich subjektive) Auswahl getroffen. Viele
Beweise fehlen völlig oder werden nur skizziert. Der aufmerksame Zuhörer sollte aber am
Ende dieses Kapitels in der Lage sein, einfache gruppentheoretische Probleme, wie sie etwa
in der Quantenmechanik, Molekülphysik, Festkörperphysik oder Teilchenphysik auftreten,
selbständig zu lösen.

In meinem Skript um zur Vorlesung Gruppentheoretische Methoden der Physik finden Sie
eine ausgewählte Liste von Büchern, Skripten und algebraische Computerprogrammen zur
1 H. Weyl, Symmetrie, Birkhäuser, Basel (1955).

55
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 56

Gruppen- und Darstellungstheorie. Wir erinnern zuerst an den Begriff einer Gruppe:

Definition: Eine Gruppe G besteht aus einer Menge von Elementen {g1 , g2 , . . .} die vier
grundlegende Postulate erfüllen:

1. Durch eine Multiplikation G × G → G, {g1 , g2 } → g1 g2 ∈ G ist jedem Paar g1 , g2


eindeutig ein Element g1 g2 der Gruppe zugeordnet. Im allgemeinen ist

g1 g2 6= g2 g1 .

2. Diese Multiplikation ist assoziativ : g1 (g2 g3 ) = (g1 g2 )g3 .


3. Es existiert ein Einselement e ∈ G mit der Eigenschaft eg = ge = g für jedes Element
g der Gruppe.
4. Für jedes Element g existiert das inverse Element g −1 ∈ G, so daß gg −1 = g −1 g = e.

Die wohl einfachste Gruppe bilden die ganzen Zahlen mit der Addition als Verknüpfungsge-
setz. Die Null ist das Einselement und das Inverse von a ist −a. Bezüglich der Multiplikation
von Zahlen bildet diese Menge aber keine Gruppe (0 hat kein Inverses).

4.1 Beispiele von Gruppen

Es gibt endliche, diskret-unendliche und kontinuierliche Gruppen. Die einfachsten und für
uns Physiker zugleich wichtigsten Gruppen sollen hier kurz vorgestellt werden. Bei der
Einführung der wichtigsten gruppentheoretischen Begriffe können wir auf die hier vorge-
stellten Gruppen zurückgreifen.

4.1.1 Endliche Gruppen, SN :

Die wichtigsten endlichen Gruppen sind die symmetrischen Gruppen SN , oft auch Permuta-
tionsgruppen genannt. Die Elemente von SN sind die Permutationen von N Symbolen. Für
3 Elemente sind dies die Transformationen
     
1 2 3 1 2 3 1 2 3
e = , a= , b = a2 = ,
1 2 3 2 3 1 3 1 2
     
1 2 3 1 2 3 1 2 3
c = , d = ca = f = cb = .
1 3 2 3 2 1 2 1 3

Dabei bedeutet ca zuerst a und dann c ausführen. Zum Beispiel ist


   
1 2 3 1 2 3
ca = 6 ac =
=
3 2 1 2 1 3

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 57

1
b

T (f ) T (d)

T (a)
b b
2 3

T (c)

Abbildung 4.1: Die Wirkung der Drehung T (a) und Spiegelungen T (c), T (d) und T (f ) auf
die Ecken eine gleichseitigen Dreiecks.

und die Gruppe SN ist nicht Abelsch. SN hat N ! Elemente. Wir können S3 als Transfor-
2
mationsgruppe auf V = R darstellen. Die Wirkungsmenge von S3 seien die Ecken eines
gleichseitigen Dreiecks. Dabei sei T (a) die Drehung um 1200 und T (c) die Spiegelung an der
Vertikalen. Die Deckoperation sind in der folgenden Abbildung dargestellt:

Gruppentafel: Für kleine endliche Gruppen ist es oft sinnvoll, eine sogenannte Gruppentafel
zu erstellen um sich eine Übersicht über die Gruppenstruktur erhalten. Die folgende Tabelle
zeigt eine derartige Gruppentafel:

e g2 g3 ... gn ...
e e g2 g3 ... gn ...
g2 g2 g22 g2 g3 ... g2 gn ...
g3 g3 g3 g2 g32 ... g3 gn ...
.. .. .. .. .. ..
. . . . ... . .
gm gm gm g2 gm g3 . . . gm gn ...
.. .. .. .. ..
. . . . ... . ...

In jeder Reihe und Spalte der Gruppentafel muss jedes Element der Gruppe genau einmal
auftreten. Denn aus ggp = ggq folgt nach Multiplikation mit g −1 von links, daß gp = gq sein
muss. Analog kann gp g nur gq g sein falls gp = gq ist.

Die Ordnung |G| einer Gruppe G ist die Zahl der Elemente der Gruppe. Zum Beispiel ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 58

|S3 | = 3! = 6 und die Multiplikationstabelle dieser Gruppe ist wie folgt:

S3 e a b c d f
e e a b c d f
a a b e f c d
b b e a d f c
c c d f e a b
d d f c b e a
f f c d a b e

Die ausgezeichnete Rolle der Permutationsgruppen ist in dem Theorem von Cayley be-
gründet. Nach diesem Theorem ist jede Gruppe der Ordnung N eine Untergruppe der Per-
mutationsgruppe SN .

4.1.2 Liesche Gruppen, SU(2)

Während die endlichen oder diskreten Gruppen in der Festkörper und Molekülphysik von
Interesse sind, spielen in der Quantenmechanik und Teilchenphysik vorwiegend die kontinu-
ierlichen Lie-Gruppen eine wichtig Rolle. Im Allgemeinen definiert man:

Definition: Eine Lie-Gruppe G ist eine Gruppe, die zugleich eine differenzierbare Mannig-
faltigkeit ist, derart daß die Multiplikation

G × G −→ G, (g1 , g2 ) −→ g1 g2

und die Inversenbildung

G −→ G, g −→ g −1

jeweils stetige und differenzierbare Abbildungen sind.


n
Eine n-dimensionale Mannigfaltigkeit kann lokal mit einer offenen Menge des R identifiziert
werden (siehe die einschlägigen Lehrbücher über Differentialgeometrie). Wir werden diese
Begriffe für die Gruppe SU (2) illustrieren. Diese Lie-Gruppe ist die wichtigste Gruppe in
der Quantenmechanik. Die quantenmechanischer Zustände mit festem Drehimpuls bilden
eine irreduzible Darstellung der quantenmechanischen Drehgruppe SU (2).
2
Die Elemente g ∈ SU (2) lassen das Skalarprodukt (x, y) = x̄1 y1 + x̄2 y2 auf C invariant:
(gx, gy) = (x, y). Sie erfüllen g † g = gg † = 1 und det g = 1. Da die Zeilen von g unitär
orthogonal sein müssen, ist
 
a b
g= .
−λb̄ λā

Die Orthogonalität der Kolonnen fordert |λ| = 1. Die Determinantenbedingung lautet dann
λ(aā + bb̄) = 1, woraus λ = 1 und aā + bb̄ = 1 resultiert. Also ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.1. Beispiele von Gruppen 59

 
a b
n o
SU (2) = g = mit aā + bb̄ = 1 . (4.1)
−b̄ ā

Die Zuordnung
n X o
α = (ℜa, ℑa, ℜb, ℑb)| α2i = 1 −→ SU (2)

ist bijektiv.
α0
α = (1, 0, 0, 0)
b

S3

α = (−1, 0, 0, 0)

Abbildung 4.2: Die Gruppe SU (2) kann mit S 3 identifiziert werden.

Die Lie-Gruppe SU (2) kann also mit der 3-dimensionalen Sphäre S 3 identifiziert werden
3
(siehe Abb. 4.2). Die Sphäre kann aber nicht stetig auf eine offene Umgebung in R abgebil-
det werden. Aber man kann mittels der stereographischen Projektionen φ± vom Süd- bzw.
3
Nordpol die nördliche und südliche Hemisphäre auf eine offene Menge des R abbilden

φ± : H± −→ φ± (H± ).

Auf dem Überlapp H+ ∩ H− hat man die Gruppe SU (2) auf zwei Arten beschreiben (siehe
Abb. 4.3)

H+ ∩ H− ∋ p −→ x = φ+ (p) bzw. x̃ = φ− (p).

Die Koordinatentransformation

x = H+ (p) −→ x̃ = H− (p)

ist differenzierbar, wie man sich leicht überzeugt. Auch die Gruppenmultiplikation ist eine
differenzierbare Abbildung, so daß SU (2) in der Tat eine Lie-Gruppe ist.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 60

H+
nördl. Hemisphäre
S n = H+ ∪ H−

p
b

p b
H+ ∩ H−
südl. Hemisphäre
H−

Abbildung 4.3: Die Gruppe SU (2) kann mit zwei Karten überdeckt werden.

4.2 Elemente der Gruppentheorie

Wir führen nun die für uns wichtigsten Begriffe der Gruppentheorie ein und illustrieren diese
anhand der endlichen Permuationsgruppen und der Lie-Gruppe SU (2).

4.2.1 Untergruppen

Als Untergruppe von G bezeichnet man eine Untermenge H die unter der Multiplikation
in G abgeschlossen ist und eine Gruppe bildet. Das Einselement e ∈ G muss immer in H
liegen.

Die zyklische Gruppe CN als Untergruppe der Permutationsgruppen SN : Zum Beispiel


bilden die zyklischen Vertauschungen e, a, b eine Untergruppe von S3 , d.h. eine echte Teil-
menge die bezüglich der Verknüpfung abgeschlossen ist. Diese Untergruppe ist gerade die
zyklische Gruppe C3 der Ordnung 3. Allgemeiner besteht die zyklische Gruppe CN aus den
Elementen
CN = {e = a0 , a, a2 , a3 , . . . aN −1 |aN = e}.
Die Ordnung der Gruppe ist offensichtlich N . Wegen an aN −n = e hat jedes Gruppenelement
ein Inverses. Die zyklische Gruppe ist kommutativ,
an am = am an .
Damit ist CN eine Abelsche Untergruppe der Permutationsgruppe SN . Wir können an als
zyklische Vertauschung von N Elementen oder äquivalent dazu als Drehung in der Ebene
um den Winkel 2nπ/N realisieren. Zum Beispiel für S3
     
1 2 3 1 2 3 2 1 2 3
e= , a= =⇒ a = , a3 = e.
1 2 3 2 3 1 3 1 2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 61

In der Tat, es gibt nur eine Gruppe der Ordnung 3 und zwei Gruppen der Ordnung 4.

Die Gruppe U(1) tritt als Untergruppe von SU (2) auf. Die Elemente von U (1) sind die
diagonalen Matrizen in SU (2),

eiλ
n 
0
o
−it |t ∈ [0, 2π) ⊂ SU (2). (4.2)
0 e

Wir dürfen die beiden Diagonalelemente getrennt betrachten und erhalten die Gruppe

U (1) = {g(t) = eit |0 ≤ t < 2π}. (4.3)

Die Transformation g(t) transformiert z in eit z, d.h. dreht die komplexen Zahlen mit Winkel
t um den Ursprung. Die Gruppe ist Abelsch und isomorph zur Addition der reellen Zahlen

eiα z
eiα

α
α z

S 1 ≈ U (1)

Abbildung 4.4: Die Gruppe U (1) kann mit S 1 identifiziert werden.

modulo 2π,

g(t1 ) · g(t2 ) = ei(t1 +t2 ) = g(t1 + t2 ) = g(t2 ) · g(t1 ), g(t + 2π) = g(t), (4.4)

d.h. U (1) ist isomorph zum Kreis S 1 . Die Abelsche Gruppe U (1) ist in gewissem Sinne der
Grenzfall U (1) ∼ limN →∞ CN .

4.2.2 Konjugationsklassen:

Um diese Klassen einzuführen benötigen wir die

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 62

Definition: Zwei Elemente a, b ∈ G heißen zueinander konjugiert, a ∼ b, wenn es ein g ∈ G


gibt, so daß
gag −1 = b.
Offensichtlich gelten
a ∼ a, a ∼ b =⇒ b ∼ a, und a ∼ b, b ∼ c =⇒ a ∼ c.
Die letzte Eigenschaft folgt aus:
b = gag −1 , c = g̃bg̃ −1 =⇒ c = g̃(gag −1 )g̃ −1 = (g̃g)a(g̃g)−1 .
Aus diesen Eigenschaften folgt unmittelbar, daß wir jede Gruppe eindeutig in disjunkte
Klassen Ki zerlegen können. Zwei Klassen haben entweder kein gemeinsames Element oder
sie sind gleich. Die Konjugationsklasse eines Elementes a,

Ka = {gag −1|g ∈ G}, (4.5)

enthält immer das Element a. Die Elemente einer Klasse sind zueinander konjugiert, gKi g −1 =
Ki und das Einselement bildet immer eine Klasse für sich. Zum Beispiel hat S3 die drei Klas-
sen,

S3 = {Ke , Ka , Kc } = {{e}, {a, b}, {c, d, f }}, (4.6)

und hat die Permutationsgruppe |S3 | = 1 + 2 + 3 Elemente.

Die Anzahl Elemente der Konjugationsklasse Ki sei n(Ki ). Demnach gilt

X
n(Ki ) = Ord(G).
(4.7)
i

Satz: Die Anzahl Elemente n(Ki ) der Konjugationsklasse Ki ist ein Teiler der Anzahl der
Gruppenelemente. Ist |G| eine Primzahl, dann ist G Abelsch.

Beweis des Satzes: Die zweite Aussage folgt sofort aus der Ersten. Ist nämlich die Gruppen-
ordnung eine Primzahl, dann ist nach der ersten Aussage des Satzes die Anzahl Elemente
jeder Konjugationsklasse gleich 1. Also bildet jedes Element eine Klasse für sich, d.h. es ist
gag −1 = a oder ag = ga für zwei beliebige Gruppenelemente g und a. Also ist G Abelsch.
Um die erste Aussage zu beweisen braucht es einiger Vorbemerkungen. Es sei H ⊂ G eine
beliebige Untergruppe von G. Wir bilden die Restklassen (Nebenklassen) modulo H:
a∼
˙ b falls a−1 b ∈ H ⇐⇒ a ∼
˙ b falls b ∈ aH.
2
Dies definiert eine Äquivalenzrelation
a∼
˙ a, a∼
˙ b ⇔ b∼
˙ a, a∼
˙ b, b ∼
˙ c ⇒ a∼
˙ c.
2 Die Äquivalent ∼
˙ sollte nicht mit der obigen vermittels der Konjugation eingeführten Äquivalenz ∼
verwechselt werden!

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 63

Nun zerlegen wir die die Gruppe in disjunkte Restklassen modulo H,

eH, aH, a′ H, . . . .

Zwei Restklassen haben entweder kein gemeinsames Element, oder sie sind gleich. Offen-
sichtlich ist aH = bH genau dann wenn a ∼
˙ b und weiterhin ist |aH| = |H|. Deshalb gilt

Lemma: Der Index j = |G|/|H| der Untergruppe H von G ist immer eine natürliche Zahl.

Nun betrachten wir spezielle Untergruppen in G. Für jedes a ∈ G definieren wir den Nor-
malisator (Stabilisator) Na von a gemäß

Na = {g ∈ G|gag −1 = a} ⊂ G. (4.8)

Offensichtlich liegen e und a immer im Normalisator von a. Wie man leicht nachrechnet ist
Na eine Untergruppe von G und entsprechend ist |G|/|Na | eine natürliche Zahl für jedes
a ∈ G. Nun ist

g1 ag1−1 = gag −1 ⇔ g −1 g1 ∈ Na ⇔ g1 ∈ gNa .

Also

g1 ag1−1 6= gag −1 ⇐⇒ g1 ∈
/ gNa .

Die Anzahl Elemente in der Konjugationsklasse von a ist also gleich der Anzahl Nebenklassen
des Normalisators Na von a, d.h. |Ka | = j(Na ). Damit wäre der erste Teil des Satzes ebenfalls
bewiesen.

Wie sieht das für S3 aus? Die Normalisatoren

Ne = G, Na = Nb = C3 , Nc = {e, c}, Nd = {e, d} und Nf = {e, f } (4.9)

haben 6, 3 oder 2 Elemente. Man sieht hier explizit, daß diese Zahlen die Ordnung 6 der
Gruppe teilen. Die Indexe der Normalisatoren sind

j(Ne ) = 1, j(Na ) = j(Nb ) = 2, und j(Nc ) = j(Nd ) = j(Nf ) = 3, (4.10)

und stimmen mit der Anzahl Elemente der Konjugationsklassen Ki in (4.6) überein.

Nun wollen wir noch die Frage beantworten, wann zwei Elemente in SU (2) konjugiert sind.
In der linearen Algebra beweist man, daß jede unitäre Matrix vermittels einer unitären
Matrix diagonalisiert werden kann. Deshalb ist
 iλ   iλ 
e 1 0 e 2 0
g1 ∼ und g2 ∼ ,
0 e−iλ1 0 e−iλ2

wobei die exp(±iλi ) die Eigenwerte von gi sind. Daher ist g1 ∼ g2 falls sie dieselben Eigen-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 4. Gruppen 4.2. Elemente der Gruppentheorie 64

werte haben. In der Tat kommt es wegen


 iλ   −iλ 
e 0 e 0
(iσ1 )−1 (iσ1 ) = , iσ1 ∈ SU (2),
0 e−iλ 0 eiλ

nicht auf die Reihenfolge der Eigenwerte an. Deshalb gilt

g1 ∼ g2 ⇐⇒ Sp g1 = Sp g2 . (4.11)

Die Spur ist konstant auf jeder Konjugationsklasse, sie ist eine sogenannte Klassenfunktion.
Elemente aus verschiedenen Konjugationsklassen haben verschiedene Spuren.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5

Darstellungen

In der Physik treten Gruppen vorwiegend über ihre Darstellungen in Erscheinung. Eine
Darstellung einer Gruppe ordnet jedem Gruppenelement eine lineare Transformation T auf
einem Vektorraum V zu:

T : G −→ L(V )
(5.1)
g −→ T (g).

Dabei soll T die Gruppenstruktur respektieren,

T (e) = 1, T (g1 g2 ) = T (g1 )T (g2 ) =⇒ T (g −1 ) = T −1 (g), (5.2)

was bedeutet, dass die Abbildung T ein Gruppenhomomorphismus von G in die Gruppe
L(V ) der linearen und invertierbaren Abbildungen V → V ist. Es gibt immer die triviale
Darstellung, die allen Elementen der Gruppe die identische Abbildung zuordnet. Der andere
Extremfall sind die treuen Darstellungen, für die T (g1 ) = T (g2 ) nur für g1 = g2 möglich
ist. Für eine treue Darstellung ist das Urbild der identischen Abbildung nur das neutrale
Element e. Als Dimension einer Darstellung bezeichnet man die Dimension des Vektorraums
V . Nach Wahl einer Basis in V werden die T (g) zu Matrizen.

Wegen der Darstellungseigenschaft genügt es, die T (g) für die erzeugenden Gruppenelemente
zu kennen. Zum Beispiel wird die Permutationsgruppe S3 von a und c erzeugt, da

b = a2 , e = a3 , d = ca und f = ca2 .

Wir haben früher a als Drehung um 2π/3 und c als Spiegelung dargestellt, siehe Abbildung
(4.1). Wir wählen eine kartesische Basis in R und ordnen den Drehungen und Spiegelungen
2

Matrizen zu. Die Kolonnen der Matrizen sind die Bilder der Basisvektoren:

65
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 66

cos 1200 − sin 1200


   
−1 0
T (a) = , T (c) = . (5.3)
sin 1200 cos 1200 0 1

Dies ist eine treue Darstellung von S3 und wir bezeichnen sie mit T2 . Daneben gibt es auch
noch die Einsdarstellung T11 :

T11 (a) = T11 (c) = 1 =⇒ T11 (G) = 1 (5.4)

und die alternierende Darstellung T12 :

T2 T2
T12 (a) = 1, T12 (c) = −1 =⇒ e, a, b −→
1
1, 1
c, d, g −→ −1. (5.5)

Die alternierende Darstellung ist gerade die Determinante der Darstellungsmatrizen in (5.3).
Den geraden Permutationen (Drehungen) ordnet sie eine 1 und den ungeraden Permutatio-
nen (Spiegelungen) eine −1 zu.

Allgemein gilt: ist T (g) eine beliebige Darstellung von G, dann ist T ′ (g) = det T (g) eine
1-dimensionale Darstellung:

T ′ (g1 g2 ) = det T (g1 g2 ) = det T (g1 )T (g2 ) = det T (g1 ) det T (g2 ) = T ′ (g1 )T ′ (g2 ),

und T ′ (e) = det 1 = 1. Darstellungsmatrizen, welche dieselben linearen Abbildungen bezüglich


verschiedener Basen beschreiben, sollten identifiziert werden und diese Identifikation führt
auf den Begriff von äquivalenten Darstellungen.

5.1 Äquivalenz von Darstellungen

Wir wechseln das Koordinatensystem zur Darstellung von S3 als Gruppe der Drehungen
und Spiegelungen. Der Übergang von der alten Basis {ei } zur neuen Basis {fi } werde durch
eine lineare Transformation S geleistet,

ei = S ji fj , (5.6)

wobei wie die Einsteinsche Summenkonvention benutzten, nach der über doppelt vorkom-
mende Indexe summiert wird. Es sei xi ei = y i fi ein beliebiger Vektor mit Koordinaten
xi bezüglich der alten Basis und Koordinaten y i bezüglich der neuen Basis. Diese hängen
folgendermaßen zusammen,

y i = S ij xj , xi = (S −1 )ij y j . (5.7)

Bezüglich der Basis ei haben die T (g) die Komponenten T (g)ij , d.h.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 67

e2

f2
y2 b

x2 b b

e1
b
b x1
y1

f1

Abbildung 5.1: Äquivalenz zweier Darstellungen

i
x −→ T (g)x , (T (g)x ) = T (g)ij xj . (5.8)

Dann gilt
y = S x −→ ST (g)S −1 y ≡ T̃ (g)y .
Wie erwartet, gehen die Darstellungsmatrizen T̃ (g) bezüglich der Basis fi durch eine Ähn-
lichkeitstransformation aus denen bezüglich der Basis ei hervor,

T̃ (g) = ST (g)S −1 . (5.9)

Weiterhin, wegen
T̃ (g1 )T̃ (g2 ) = ST (g1 )S −1 ST (g2 )S −1 = ST (g1 )T (g2 )S −1
= ST (g1 g2 )S −1 = T̃ (g1 g2 )
ist g → T̃ (g) genauso eine Darstellung der Gruppe wie g → T (g). Diese beiden Darstellungen
heißen äquivalent. Zwei äquivalente Darstellungen sind wirklich dieselben Darstellungen und
sollten identifiziert werden. Ist umgekehrt eine Darstellung gegeben, dann können wir immer
unendlich viele äquivalente Darstellungen der Form ST (g)S −1 angeben. Bei der Klassifizie-
rung von Darstellungen kann es sich also nur um diejenige von inäquivalenten Darstellungen
handeln, also Darstellungen die nicht über eine Ähnlichkeitstransformation auseinander her-
vorgehen.

Wir geben jetzt noch eine dreidimensionale Darstellung von S3 an. Es sei ei eine kartesische
Basis von R . Auf diese Elemente wirke die Permutationsgruppe. Unter a wird e1 in e2 , e2
3

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 68

in e3 und e3 in e1 abgebildet. Dies ist eine Drehung um die Achse e1 + e2 + e3 mit 1200 und
damit eine lineare Transformation in R . T3 (c) vertauscht e2 und e3 und ist eine Spiegelung
3

an der Ebene aufgespannt durch e1 und e2 + e3 . Man erhält

   
0 0 1 1 0 0
T3 (a) =  1 0 0 und T3 (c) =  0 0 1. (5.10)
0 1 0 0 1 0

Die restlichen {T (g)} können aus der Multiplikationstabelle, die ja wegen der Darstellungs-

e3 e3

T (a) T (c)

e2 e2

e1 e1

Abbildung 5.2: Dreidimensionale natürliche Darstellung von S3

eigenschaft dieselbe wie diejenige der {g} ist, abgelesen werden. Die T (g) sind orthogonal
und unimodular.

Damit haben wir folgende Darstellungen der Gruppe S3 gewonnen: die Einsdarstellung T11 ,
die alternierende Darstellung T21 , die zweidimensionale treue Darstellung T2 und dreidimen-
sionale, natürliche Darstellung T3 .

Natürliche Darstellung:
Unter der Drehung T3 (a) und Spiegelung T3 (c), und damit unter allen Transformationen

T3 (g) ist der eindimensionale Unterraum, aufgespannt durch f1 = (e1 +e2 +e3 )/ 3 invariant.
Wir ergänzen f1 folgendermaßen zu einer orthonormierten Basis
1 1 1
f1 = √ (e1 + e2 + e3 ), f2 = √ (e2 − e3 ), f3 = √ (−2e1 + e2 + e3 ).
3 2 6
Die Basiselemente f2 und f3 liegen in der Ebene senkrecht zur Drehachse. Die explizite Form

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.2. Reduzibilität von Darstellungen 69

der Transformationsmatrix in fi = (S −1 )ji ej lautet


√ 
√2 √0 −2
1
S −1 = √  √2 √3 1  =⇒ S = (S −1 )t .
6 2 − 3 1

Bezüglich der neuen Basis haben die Darstellungsmatrizen T̃3 (g) = ST3 (g)S −1 die Form
   
2 0 √0 1 0 0
1
T̃3 (a) = −1 − 3  und T̃3 (c) =  0 −1 0  .
0 √
2
0 3 −1 0 0 1

Neben dem von f1 aufgespannten eindimensionalen Unterraum lassen die T3 (g) auch den da-
zu senkrechten 2-dimensionalen Unterraum, aufgespannt durch {f2 , f3 }, invariant. Auf dem
ersten Unterraum ist T3 die Einsdarstellung und auf dem zweiten Unterraum die Darstel-
lung T2 . Man sagt, die Darstellung ist reduzibel. Eine Darstellung T heißt irreduzibel, falls
V keinen echten Teilraum hat, der unter T invariant ist. T2 ist offensichtlich irreduzibel.

Formalisiert: Der dreidimensioale Darstellungsraum V3 von T3 zerfällt in zwei orthogonale


Teilräume der Dimensionen 1 und 2, V = V1 ⊕ V2 . Diese Teilräume sind invariant unter T3 ,
d.h. T3 : V1 → V1 und T3 : V2 → V2 . Auf V1 ist T3 gleich T11 und auf V2 gleich T2 . Man
schreibt

T3 = T11 + T2 , dim T3 = dim T11 + dim T2 .

5.2 Reduzibilität von Darstellungen

Es sei T eine n-dimensionale Darstellung einer beliebigen Gruppe G (endlich oder unendlich)
auf V . Sei V1 ein m-dimensionaler echter invarianter Teilraum von V , d.h. jede lineare
Transformation T (g) bildet jeden Vektor aus V1 wieder auf einen Vektor in V1 ab. Wird das
Koordinatensystem so gewählt, daß die ersten m Basisvektoren V1 aufspannen, so haben die
Darstellungsmatrizen die Form
 
T1 (g) H(g)
g −→ T (g) = ,
0 T2 (g)

wobei T1 eine m×m und T2 eine (n−m)×(n−m) Matrix ist. Eine Darstellung heißt reduzibel,
falls ein echter invarianter Teilraum von V existiert. Eine nicht reduzible Darstellung heißt
irreduzibel.

Ist speziell H(g) = 0 für alle Gruppenelemente, so zerfällt die Darstellung T in die Darstel-
lungen T1 und T2 ,
 
T1 (g) 0
g −→ .
0 T2 (g)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 70

Man schreibt T = T1 + T2 . Dieses Verfahren lässt sich möglicherweise fortsetzen, so daß die
darstellenden Matrizen in einem geeigneten Koordinatensystem weiter zerfallen:

 T (g) 0 0 ... 0 
1
 0 T2 (g) 0 ... 0 
g −→ 
 .. .. .. . (5.11)
. . .

0 0 0 . . . Tk (g)

Die Zerlegung bricht ab, wenn in keinem der invarianten Teilräume V1 , . . . , Vk eine weiterer
echter invarianter Teilraum existiert.

Definition: Eine Darstellung, die irreduzibel ist oder in lauter irreduzible Darstellungen
zerfällt, heißt vollreduzibel.

Es existieren unendliche Gruppen, die nicht vollreduzibel sind, d.h. es existieren Darstellun-
gen für welche H(g) nicht verschwindet. Aber wir haben den folgenden

Satz: Jede unitäre Darstellung auf einem Vektorraum mit Skalarprodukt ist vollreduzibel.

Beweis: Ist T irreduzibel, so ist nichts zu beweisen. Sei also V1 eine echter invarianter Teil-
raum von V und W = V1⊥ das unitär-orthogonale Komplement von V1 ,

W = {w ∈ V |(w, V1 ) = 0}.

V1 und W spannen V auf. Jeder Vektor v ∈ V läßt sich auf eindeutige Weise als Summe von
v1 ∈ V1 und w ∈ W schreiben, v = v1 + w. Nun ist

(T (g)w, v1 ) = (w, T † (g)v1 ) = (w, T (g −1 )v1 ) = 0

für alle g ∈ G, da T (g −1 )v1 nach Voraussetzung in V1 liegt. Damit liegt mit w auch T (g)w
im Unterraum W . Ist also V1 ein invarianter Teilraum einer unitären Darstellung, so ist dies
auch dessen Komplement W . Diese Verfahren kann nun fortgesetzt werden, falls ein echter
invarianter Teilraum von W existiert. Schließlich erhält man eine Zerfällung der Darstellung
in lauter irreduzible Bestandteile.

5.3 Mittelbildung und Haarsches Maß

Für jede endliche Gruppe G existiert eine Mittelung. Es sei f : G → C eine komplexwertige
Funktion auf G. Wir definieren den Mittelwert M(f ) von f durch

1 X
M(f ) = f (g). (5.12)
|G|
g∈G

Die folgenden Eigenschaften der Mittelwertbildung evident:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 71

1. linear: M(αf + βg) = αM(f1 ) + βM(f2 ) für alle α, β ∈ C .


2. positiv: Falls f (g) ≥ 0 reell ⇒ M(f ) ≥ 0 und nur = 0, falls f ≡ 0.
3. normiert: falls f (g) = 1 dann ist M(f ) = 1.
4. invariant gegenüber Translationen der Gruppe, d.h. ist f˜(g) = f (g̃g), dann ist

1 X 1 X
M(f˜) = f (g̃g) = f (g̃g) = M(f ). (5.13)
|G| |G|
g∈G g̃g∈G

Ein Mittelwert mit diesen vier Eigenschaften existiert auch für kompakte Lie-Gruppen.

5.3.1 Mittelbildung für kompakte Lie-Gruppen

Jede kompakte Lie-Gruppe hat eine invariante Mittelbildung. Dies folgt aus dem folgenden

Satz: Zu jeder kompakten Lie-Gruppe gibt es ein bis auf eine multiplikative Konstante
eindeutiges positives Haar-Integral M : C0 (G) → C , das links-und rechtsinvariant ist.

Links- und rechtsinvariant bedeutet, daß

Z
 
M(f ) ≡ dµ(g)f (g) = M f ◦ lg̃ = M f ◦ rg̃ ,
(5.14)
G

wobei lg̃ (g) = g̃g und rg̃ (g) = gg̃ (g̃ fest) die Links- bzw. Rechtstranslationen sind. Das
Haar-Maß dµ(g) existiert auch für allgemeinere lokalkompakte Gruppen. Dann ist es aber
im Allgemeinen entweder nur links- oder nur rechtsinvariant. Die Integration einer komplex-
wertigen Funktion mit dem Haar-Maß ist offensichtlich eine Mittelbildung.
Die einfachste kompakte Gruppe U (1) hat die Mittelbildung

Z2π Z2π
1 1
g(t) = eit = g(t + 2π).

M(f ) = dtf g(t) = dt f (t), (5.15)
2π 2π
t=0 0

M erfüllt alle Eigenschaften einer Mittelbildung: Die Linearität, Positivität und Normiert-
heit sind evident und wegen

Z2π Z2π
1  1
M(f ◦ lg̃ ) = dtf g(t̃ )g(t) = dtf (g(t̃ + t)) = M(f )
2π 2π
t=0 t=0

ist die Mittelbildung auch translationsinvariant.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 72

Wie sieht nun das invariante Haar-Maß für SU (2) aus. Dazu überlegen wir, was die Grup-
penoperation g → lg̃ (g) auf der Gruppenmannifaltigkeit S 3 geometrisch bedeutet. Dazu
parametrisieren wir die Gruppenelemente gemäß
   
α0 + iα1 α2 + iα3 β0 + iβ1 β2 + iβ3
g= , g̃ =
−α2 + iα3 α0 − iα1 −β2 + iβ3 β0 − iβ1

mit |α| = |β| = 1. Dann ist g → lg̃ (g) gegeben durch

α0 β0 −β1 −β2 −β3 α0


    
 α1   β1 β0 −β3 β2   α1 
  = α −→ O(β)α =   . (5.16)
α2 β2 β3 β0 −β1 α2
α3 β3 −β2 β1 β0 α3
P 2
Wegen βj = 1 ist O(β) orthogonal, Ot O = 1, und damit ist O(β)α eine Drehung von
α. Nun ist die (induzierte) Volumenform auf S 3 drehinvariant und damit invariant unter
Linkstranslationen (und Rechtstranslationen). Normieren wir die Volumenform auf 1, dann
erhalten wir das eindeutige Haar-Maß auf SU (2) ∼ S 3 . Wir parametrisieren die Punkte
auf SU (2) ∼ S 3 gemäß

α0 cos θ
   
 α1   sin θ cos ψ 
 =
α2 sin θ sin ψ cos ϕ

α3 sin θ sin ψ cos ϕ

beziehungsweise

sin θ sin ψeiϕ


 
cos θ + i sin θ cos ψ
g(α) = , (5.17)
− sin θ sin ψe−iϕ cos θ − i sin θ cos ψ

wobei die Winkel folgende Wertebereiche haben,

0 < θ < π, 0<ψ<π und 0 < ϕ < 2π. (5.18)

In diesen Koordinaten ist das Volumenelement gegeben durch

1
dµ = sin2 θ · sin ψdθdψdϕ. (5.19)
2π 2
Für die unitären Matrizen (5.17) ist Sp g = 2 cos θ. Wegen det g = 1 sind deshalb die
Eigenwerte dieser Matrizen eiθ und e−iθ .

Es sei nun f (g) = f (θ, ψ, ϕ) eine beliebige Klassenfunktion. Klassenfunktionen sind konstant
auf Konjugationsklassen, f (aga−1 ) = f (g). Nun kann aber jede unitäre Matrix mit einer
unitären Matrix diagonalisiert werden, d.h. für jedes g gibt es ein a, so daß

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 73

eiθ
 
0
aga−1 = , θ ∈ (0, π). (5.20)
0 e−iθ

Deshalb hängen Klassenfunktionen nur von θ und nicht von ψ, ϕ ab, sind 2π-periodisch und
wegen
   iθ    −iθ 
0 1 e 0 0 −1 e 0
=
−1 0 0 e−iθ 1 0 0 eiθ

gerade in θ:


f Klassenfunktion ⇐⇒ f g(θ, ψ, φ) = f (θ) = f (−θ) = f (θ + 2π). (5.21)

Für eine Klassenfunktion ist


1 2
Z
M(f (g)) = sin2 θ · sin ψ · f (θ) dθdψdϕ = f (θ) sin2 θ dθ. (5.22)
2π 2 π
0

Das induzierte Maß

2
dµred = sin2 θ dθ (5.23)
π
heißt reduziertes Haar-Maß von SU (2).

5.3.2 Unitäre und orthogonale Gruppen

In der Darstellungstheorie spielen die Darstellungen durch orthogonale oder unitäre Matrizen
eine wichtige Rolle. Eine komplexe n × n Matrix U heißt unitär, falls U † U = U U † = 1 ist.
n
Sei C der komplexe Vektorraum mit Skalarprodukt

n
X
(x, y) = x̄i yi . (5.24)
1

Die unitären Matrizen sind diejenigen Matrizen, die das Skalarprodukt invariant lassen,

(U x, U y) = (U † U x, y) = (x, U † U y) = (x, y). (5.25)

Ausgeschrieben in Komponenten:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 74

X X
Ūki Ukj = Uik Ūjk = δij .
(5.26)
k k

Die Zeilen und Spalten von unitären Matrizen sind zueinander unitär orthogonal. Lassen
U1 und U2 das Skalarprodukt invariant, dann auch U1 U2 und U2 U1 . Die Einheitsmatrix ist
offensichtlich auch unitär. Schlussendlich ist auch U † = U −1 unitär. Also bilden die unitären
Matrizen ein Gruppe

U (n) = {U ∈ L(C )|U † U = U U † = 1}.


n
(5.27)

Eine orthogonale Matrix R ist reell und unitär und erfüllt daher Rt R = RRt = 1. Die
orthogonalen Matrizen bilden folgende Untergruppe von U (n):

n
O(n) = {R ∈ L(R )|Rt R = RRt = 1}. (5.28)

Die obigen Darstellungen T von S3 sind alle orthogonal, d.h. alle Darstellungsmatrizen T (g)
sind orthogonal. Wegen
1 = det(U U † ) = det U det U † = det U det U
ist die Determinante einer unitären Matrix eine Phase. Diejenigen unitären Matrizen mit
det U = 1 bilden eine Untergruppe von U (n), die spezielle unitäre Gruppe,

SU (n) = {U ∈ U (n)| det U = 1}. (5.29)

Die Determinante einer orthogonalen Matrix ist eine reelle Phase, also ±1. Die Untergruppe
der Matrizen mit det R = 1 heißt spezielle orthogonale Gruppe,

SO(n) = {R ∈ O(n)| det R = 1.}. (5.30)

Nun haben wir den wichtigen

Satz: Jede Darstellung einer Gruppe mit Mittelbildung ist zu einer unitären Darstellung
äquivalent.

In anderen Worten: Wir können in V immer eine Basis finden, bezüglich der die Matrizen
T (g) unitär sind.

Beweis: Die dem Beweise zugrunde liegende Idee der Summation über die Gruppe geht auf
Hurwitz zurück. Wir bilden die quadratische Form
n o
h(x) = M T (g)x, T (g)x = x, M T † (g)T (g) x = (x, Qx).
 

Als Summe von positiven und hermiteschen Formen ist diese Form ist positiv und hermitesch,
h(x 6= 0) > 0 und Q = Q† ,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 75

und invariant
   
h(T (g̃)x) = M T (g)T (g̃)x, T (g)T (g̃)x = M T (gg̃)x, T (gg̃)x = h(x)

wegen der Translationsinvarianz der Mittelbildung. Nun benutzen wir noch, daß für jede
positive hermitesche Form h(x) ein Koordinatensystem existiert, so daß h in die Einheitsform
übergeht,
X
h(y) = ȳi yi .

In diesem neuen Koordinatensystem geht unsere Darstellung über in eine äquivalente, welche
die hermitesche Einheitsform für alle darstellenden Matrizen invariant läßt; also sind diese
unitär.

5.4 Klassenfunktionen und Charaktere

Jede Darstellung einer Gruppe mit Mittelbildung ist vollreduzibel. Für endliche oder kom-
pakte Lie-Gruppen gibt es eine Mittelbildung und jede Darstellung ist vollreduzibel. Wir
wollen im Folgenden immer annehmen, daß G eine Gruppe mit Mittelbildung sei.

Sei nun f (g) eine Klassenfunktion, d.h eine Funktion die für alle Elemente der gleichen
Konjugationsklasse

g ∼ g̃ ⇐⇒ g̃ = aga−1 , a, g, g̃ ∈ G

denselben Wert annimmt,

f (g) = f (aga−1 ). (5.31)


T
Zu jeder endlich-dimensionalen Darstellung G → L(V ) gehört die komplexwertigen Klas-
senfunktion

χT (g) = Sp T (g). (5.32)

Sie heißt Charakter der Darstellung T . Wegen

χT (aga−1 ) = Sp T (aga−1 ) = Sp T (a)T (g)T −1(a) = Sp T (g) = χT (g),

wobei wir Sp T1 T2 = Sp T2 T1 benutzten, sind die χT Klassenfunktionen. Die Charakteren


haben die folgenden Eigenschaften:

• Äquivalente Darstellungen haben denselben Charakter. Dies folgt unmittelbar aus


Sp T̃ (g) = Sp ST (g)S −1 = Sp T (g).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 76

• Die Dimension der Darstellung, oft auch Grad genannt, ist χT (e). Dies ist offensicht-
lich, da T (e) = 1 ist.
• Zerfällt eine Darstellung, so gilt dies auch für ihren Charakter:

T = T1 + T2 + . . . + Tk =⇒ χT = χT1 + . . . + χTk . (5.33)

Diese Eigenschaft folgt unmittelbar aus der Tatsache, daß es eine Basis gibt bezüglich
der die T (g) blockdiagonal sind,
 T (g) 0 0 ... 0 
1
 0 T2 (g) 0 ... 0
ST (g)S −1

=
 .. .. .. ,
. . .

0 0 0 . . . Tk (g)

und dass die Spur eine Klassenfunktion ist.


• Für jede Darstellung T mit Mittelbildung gilt: χT (g −1 ) = χT (g).
Beweis: Wir dürfen annehmen, daß die T (g) unitär sind. Dann gilt

χT (g −1 ) = Sp T (g −1 ) = Sp T −1 (g) = Sp T † (g) = Sp T (g) = χT (g).

Es folgt dann unmittelbar, dass für jede Gruppe G mit Mittelbildung und der Eigen-
schaft, daß jedes Element zu seinem Inversen ähnlich ist (d.h. für jedes g ∈ G existiert
ein a ∈ G mit g −1 = aga−1 ) die Charakteren reellwertige Klassenfunktionen sind.

5.4.1 Tensorprodukt von Darstellungen

Es seien T und T̃ zwei Darstellungen einer Gruppe G der Dimensionen n und ñ. Wir wählen
Basen in diesen Räumen und charakterisieren Vektoren durch ihre Koordinatentupel. Dann
transformiert ein Vektor x in V und ein Vektor y in Ṽ gemäß

x −→ T (g)x und y −→ T̃ (g)y . (5.34)

Nun bilden wir den zweistufigen Tensor t mit Komponenten tip = xi yp . Diese Komponenten
transformieren wie folgt,

n X
X ñ   X
tip = xi yp −→ T (g)ij T̃ (g)pq xj yq = T (g)ij T̃ (g)pq tjq . (5.35)
j=1 q=1

Dies ist eine lineare Transformation der n · ñ Tensorkomponenten tip von t. Diese Tensoren

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 77

bilden eine n · ñ-dimensionalen Vektorraum V × Ṽ und die Matrizen T (g)ij T̃ (g)pq sind die
Komponenten der Tensordarstellung

T × T̃ : V × Ṽ −→ V × Ṽ . (5.36)

Für explizite Rechnungen ist es nützlich eine Konvention für die Numerierung der Kompo-
nenten t zu treffen. Wegen

 x ′y ′ 
T11 T̃ T12 T̃ ... T1n T̃ x1 y
  
1
 x2′y   T21 T̃

T22 T̃ ... T2n T̃   x2 y 
 . = . .. ..   . , (5.37)
 .   .. . .   .. 
.
xn′ y ′ Tn1 T̃ Tn2 T̃ . . . Tnn T̃ xn y

gehen die Darstellungsmatrizen T (g) ⊗ T̃ (g) der Darstellung T × T̃ auf einfache Weise aus
denen der Darstellungen T und T̃ hervor: Man multipliziere jedes Matrixelement von T (g)
mit der Matrix T̃ (g). Aus der obigen Form von T ⊗ T̃ folgt unmittelbar, daß

  X
χT ×T̃ = Sp T ⊗ T̃ = Tii Sp T̃ = Sp T Sp T̃ = χT · χT̃ . (5.38)

Wir üben dies am Beispiel des Tensorproduktes der Darstellung T2 von S3 mit sich selber:
 √   
1 √ −1 − 3 −1 0
T (a) = , T (c) = .
2 3 −1 0 1

Also haben Darstellungsmatrizen der 4-dimensionalen Darstellung T2 × T2 folgende Form:


√ √
1 3 3 √3
 

1  −√3 1 −3 √3 
(T ⊗ T )(a) =
4 − 3 −3 1 3
 
√ √
3 − 3 − 3 1
1 0 0 0
 
 0 −1 0 0 
(T ⊗ T )(c) =  .
0 0 −1 0
0 0 0 1
Wir sehen, daß in der Tat

χT2 ×T2 (a) = 1 = χT2 (a)χT2 (a) und χT2 ×T2 (c) = 0 = χT2 (c)χT2 (c)

ist. Wir haben damit für S3 die folgende Charakterentabelle:

χT11 χT12 χT2 χT3 χT2 ×T2


Ke 1 1 2 3 4
Ka 1 1 −1 0 1
Kc 1 −1 0 1 0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 78

Da T3 = T2 + T11 ist auch χT3 = χT2 + χT11 . Falls nun T2 × T2 reduzibel (und damit voll-
reduzibel) ist, muß es eine Summe der niedrig-dimensionalen Darstellungen T11 , T12 und T2
sein. Die Summe der Dimensionen der dabei auftretenden Darstellungen in der Zerlegung
von T2 × T2 muß gleich 4 sein. Aus der Charaktertabelle sehen wir, daß nur

T2 × T2 = T2 + T11 + T12

in Frage kommt. Dies ist auch die richtige Antwort. Um dies einzusehen müssen wir noch
etwas mehr über den Zusammenhang zwischen Charakteren und Darstellungen wissen.

Diedergruppen: Die Diedergruppe Dn besteht aus den möglichen Deckbewegungen eines


regulären n-Ecks. Betrachten wir D6 etwas genauer: Die Drehungen a, a2 , a3 , a4 , a5 und

b2 c1
2b b
1 b b

e2 e1

a
3 b e3 e6
b
6 b b

e4 e5
b b b b
4 5

Abbildung 5.3: Die Erzeugenden der Diedergruppe D6 .

a6 = e bilden eine Untergruppe von D6 . Diese Untergruppe ist gerade die Abelsche zyklische
Gruppe C6 der Ordnung 6. Dann gibt es noch die Spiegelungen bi vom Typus b und die
Spiegelungen ci vom Typus c (siehe Abb.5.3). Die Gruppe besteht also aus 12 Elementen.
Wir ordnen die Elemente gemäß

{e, a, a2 , a3 , a4 , a5 , b1 , b2 , b3 , c1 , c2 , c3 }.

Wie man aus der Abbildung leicht entnimmt, gelten zum Beispiel

ab1 = c1 , ac1 = b2 , ab2 = c2 , ac2 = b3 , ab3 = c3 , ac3 = b1


b 1 a = c3 , c1 a = b 1 , b 2 a = c1 , c2 a = b 2 , b 3 a = c2 , c3 a = b 3 .

Die Multiplikationstabelle ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 79

e a a2 a3 a4 a5 b1 b2 b3 c1 c2 c3
e e a a2 a3 a4 a5 b1 b2 b2 c1 c2 c3
a a a2 a3 a4 a5 e c1 c2 c3 b2 b3 b1
a2 a2 a3 a4 a5 e a b2 b3 b1 c2 c3 c1
a3 a3 a4 a5 e a a2 c2 c3 c1 b3 b1 b2
a4 a4 a5 e a a2 a3 b3 b1 b2 c3 c1 c2
a5 a5 e a a2 a3 a4 c3 c1 c2 b1 b2 b3
b1 b1 c3 b3 c2 b2 c1 e a4 a2 a5 a3 a
b2 b2 c1 b1 c3 b3 c2 a2 e a4 a a5 a3
b3 b3 c2 b2 c1 b1 c3 a4 a2 e a3 a a5
c1 c1 b1 c3 b3 c2 b2 a a5 a3 e a4 a2
c2 c2 b2 c1 b1 c3 b3 a3 a a5 a2 e a4
c3 c3 b3 c2 b2 c1 b1 a5 a3 a a4 a2 e

Wir sehen, daß die Gruppenelement a und b1 die Diedergruppe erzeugen. Deshalb genügt
es, die Darstellungen der erzeugenden Elemente zu notieren.

Sind die Ecken des 6-Ecks die C − H’s des Benzols, so hat Hückel als Modell-Hamilton-
Operator

0 1 0 0 0 1
 
1 0 1 0 0 0
0 1 0 1 0 0
 
H∼ (5.39)
0 0 1 0 1 0

0 0 0 1 0 1
 
1 0 0 0 1 0

vorgeschlagen: Die Energie ist gleich der Summe der Nachbarwerte. Bis auf ein Vielfaches
der Identität ist H die diskretisierte zweite Ableitung. Offensichtlich vertauscht H mit allen
Symmetrietransformationen des 6-Ecks, d.h. mit den Darstellungen der Diedergruppe D6 .
Nun wollen wir zuerst einige spezielle Darstellungen untersuchen. Später werden wir alle
Darstellungen von D6 konstruieren.

Natürlich gibt es die Einsdarstellung T11 und die alternierende Darstellung T12 die a → 1
und b1 → −1 zuordnet. Um eine 6-dimensionale Darstellung zu konstruieren, belegen wir
die Eckpunkte des 6-Ecks mit 1, . . . , 6 und Vektoren e1 , . . . e6 . Dann dreht T (a) den Vektor
ei in den Vektor ei+1 , wobei e7 ≡ e1 ist. Also ist

0 0 0 0 0 1
 
1 0 0 0 0 0
0 1 0 0 0 0
 
T (a) =  . (5.40)
0 0 1 0 0 0
0 0 0 1 0 0
 
0 0 0 0 1 0

Die Spiegelung T (b1 ) vertauscht e1 und e6 etc, so daß

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 80

0 0 0 0 0 1 1 0 0 0 0 0
   
0 0 0 0 1 0 0 0 0 0 0 1
0 0 0 1 0 0 0 0 0 0 1 0
   
T (b1 ) =   =⇒ T (c1 ) =  . (5.41)
0 0 1 0 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 1 0 0 0
   
1 0 0 0 0 0 0 1 0 0 0 0

Offensichtlich ist Spur jeder dieser Permutationsmatrizen gleich der Anzahl Fixelemente.

Ausreduktion: Der Unterraum aufgespannt durch e1 + . . . + e6 ist invariant unter Dre-


hungen und Spiegelungen. Die Darstellung auf diesem eindimensionalen Unterraum ist die
Einsdarstellung T11 . Der Vektor x = e1 − e2 + e3 − e4 + e5 − e6 geht unter a und un-
ter b1 in −x über. Also definiert x einen zweiten invarianten Teilraum mit Darstellung
T (a) = T (b1 ) = −1 und dieser trägt eine eindimensionale Darstellung T12 .

Seien nun
y = 2e1 + e2 − e3 − 2e4 − e5 + e6 und z = e1 + 2e2 + e3 − e4 − 2e5 − e6 .
Dann gilt:
T (a) : y → y − z , z → −y T (b1 ) : y → y , z → y − z.
Also ist der von y und z aufgespannte Unterraum invariant und trägt eine 2-dimensionale
Darstellung T21 . Diese ist äquivalent zur Darstellung die man erhält, wenn man die Deckbe-
wegungen in einem elementaren Koordinatensystem beschreibt.

5.5 Lemma von Schur

Das Lemma von Schur: Es seien T1 , T2 zwei irreduzible Darstellungen einer Gruppe G
vorgegeben. Die entsprechenden Darstellungsmatrizen T1 (g) und T2 (g) wirken in den Vek-
torräumen V1 und V2 der Dimensionen n1 und n2 . Es sei weiterhin
H : V1 −→ V2
eine lineare Abbildung, so daß gilt

HT1 (g) = T2 (g)H, ∀g ∈ G. (5.42)

Dann ist entweder:

1. H = 0 oder (im ausschließenden Sinn)


2. n1 = n2 , H nicht singulär und T2 (g) = HT1 (g)H −1 für alle g ∈ G. Mit anderen Wor-
ten: die Darstellungen T1 und T2 sind zueinander äquivalent und H ist die vermittelnde
Koordinatentransformation.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 81

Die beim Schurschen Lemmas vorliegende Situation ist in der folgenden Abbildung skiz-
ziert.

H
V1 V2

T1 (g) T2 (g)
H
V1 V2

Abbildung 5.4: HT1 (g) und T2 (g)H sollen dieselbe Abbildung sein.

Beweis des Lemmas von Schur: Es sei H(V1 ) ⊂ V2 das Bild von V1 unter H. Nach Voraus-
setzung gilt:

T2 H(V1 ) = HT1 (V1 ) = H(V1 ),

da die irreduzible Darstellung T1 keinen echten invarianten Teilraum von V1 hat. Also ist
H(V1 ) ⊂ V2 ein invarianter Teilraum unter T2 . Da T2 nach Voraussetzung irreduzibel ist,
existieren keine echten invarianten Teilräume von V2 . Es folgt also

1. 1. Alternative: Es ist H(V1 ) = 0. Dies führt zur ersten Behauptung des Lemmas.
2. 2. Alternative: Es ist H(V1 ) = V2 . Dann muß die Dimension von V1 mindestens so groß
wie diejenige von V2 sein, n1 ≥ n2 . Wir führen den Kern der Abbildung H ein. Nach
Voraussetzung gilt offenbar
 
HT1 Kern(H) = T2 H Kern(H) = ∅.

Also bilden die T1 den Kern von H in sich ab, und Kern(H) ist ein invarianter Teilraum
von T1 . Da T1 irreduzibel ist, ist entweder Kern(H) = V1 oder Kern(H) = 0. Den ersten
Fall haben wir schon abgehandelt und es verbleibt Kern(H) = 0. Daraus folgt n2 ≥ n1 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 82

Wir schließen, daß H eine reguläre quadratische Matrix sein muß. Damit gilt wegen
der Voraussetzung des Lemmas:

HT1 (g)H −1 = T2 (g), ∀g ∈ G.

Beachte, daß das Schursche Lemma für reelle und komplexe Darstellungsräume V1 , V2
gilt.

Wir wollen zwei für die Physik wichtige Schlussfolgerungen aus diesem Lemma ziehen.

Korollar: Es sei T eine irreduzible Darstellung einer Gruppe G auf eine Vektorraum V . Der
lineare Operator H vertausche mit allen darstellenden Matrizen: HT (g) = T (g)H, ∀g ∈ G.
Dann ist die Matrix H ein Vielfaches der Identität.

Beweis: Sei λ ein Eigenwert von H (eine Nullstelle des charakteristischen Polynoms von
H). Mit H vertauscht auch H − λ mit den T (g). Da det(H − λ) = 0 ist, kommt nur die 1.
Alternative im Lemma von Schur zum Zug: Also ist H − λ = 0 und damit H = λ.

Korollar: Es sei T eine Darstellung von G auf dem n-dimensionalen Vektorraum V . Die
Darstellung zerfalle in lauter irreduzible, paarweise inäquivalente Darstellungen,

T = T1 + T2 + . . . + Tm .

Die Matrix H : V → V einer linearen Abbildung vertausche mit allen T (g):

[H, T (g)] = 0, ∀g ∈ G.

Dann sind die zu den irreduziblen Darstellungen gehörenden invarianten Teilräume Ei-
genräume des linearen Operators H.

Beweis für m = 2 des Korollars: In einem geeigneten Koordinatensystem haben die T (g)
die Gestalt
 
T1 (g) 0
T (g) = .
0 T2 (g)

In Anlehnung schreiben wir H in Blockmatrix-Form


 
H1 Q 1
H= .
Q 2 H2

Nach Voraussetzung gilt


   
T 1 H1 T 1 Q1 H1 T 1 Q1 T 2
=
T 2 Q2 T 2 H2 Q2 T 1 H2 T 2

also insbesondere

[T1 (g), H1 ] = 0 und [T2 (g), H2 ] = 0.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 83

Nach dem vorherigen Korollar müssen damit H1 und H2 auf den Darstellungsräumen V1
und V2 der irreduziblen Darstellungen T1 und T2 proportional zur Identität sein:

Hi = λi auf Vi , i = 1, 2

Anderseits gilt

T1 (g)Q1 = Q1 T2 (g) und T2 (g)Q2 = Q2 T1 (g), ∀g ∈ G.

Da die beiden Darstellungen als inäquivalent vorausgesetzt wurden, kann die 2. Alternativen
des Schurschen Lemmas nicht eintreten. Somit folgt Q1 = Q2 = 0. Also sind die beiden
Darstellungsräume V1 und V2 Eigenräume von H mit Eigenwerten λ1 und λ2 .

5.5.1 Orthogonalitätsrelationen

Sei G eine Gruppe mit Mittelbildung. Die komplexwertigen Funktionen {f : G → C } bilden


einen linearen Raum und die Mittelbildung definiert ein Skalarprodukt auf diesem Raum,

(f1 , f2 ) = M f¯1 · f2 .

(5.43)

Für jede endliche Gruppe G definiert dies einen endlich-dimensionalen Vektorraum mit
Skalarprodukt. Ist {g1 , . . . , gh } eine Liste aller Elemente von G, dann bilden zum Beispiel
die Funktionen {f1 , . . . , fh }, definiert durch


|G|1/2 für g = gi
fi (g) = (5.44)
0 6 gi
für g =

eine orthonormierte Basis des Vektorraums. Für kontinuierliche Lie-Gruppen stellt sich die
Frage nach der Vollständigkeit des Funktionenraums. Das Skalarprodukt

Z
(f1 , f2 ) = dµ(g)f¯1 (g)f (g) (5.45)
G

definiert eine Norm und damit einen Abstandsbegriff auf dem betrachteten Funktionenraum.
Nun vervollständigt man diesen Raum bezüglich der von der Norm definierten Metrik. Dieser
Raum heisst L2 (G, dµ) und spielt in der Quantenmechnik eine herausragende Rolle. Jede
Cauchy-Folge in L2 (G, dµ) konvergiert gegen eine Funktion in L2 (G, dµ). Im Folgenden
werden über die Theorie der Charakteren eine orthonormierte Basis der Klassenfunktionen
in L2 (G, dµ) konsturieren.

Es seien Ti : g → Ti (g), i = 1, 2 zwei irreduzible Darstellungen der Dimensionen ni und


U : V1 → V2 eine Rechteck-Matrix so, daß T2 U T1−1 definiert ist. Wir betrachten die Matrix

H = M T2 (g)U T1−1 (g) .




————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 84

Dabei ist unter der Mittelbildung von Matrizen das Mitteln über die einzelnen Matrixele-
mente zu verstehen. Diese definieren komplexwertige Funktionen

g −→ T2 (g)U T1−1 (g) pj .




Weiter sei

T̃1 = T1 (g̃) und T̃2 = T2 (g̃)

wobei g̃ ∈ G ein festes Element ist, zwei darstellende Matrizen. Wegen der Invarianz des
Mittelwertes folgt:
   
H T̃1 = M T2 (g)U T1−1 (g)T̃1 = T̃2 M T̃2−1 T2 (g)U T1−1 (g)T̃1
= T̃2 M T2 (g̃ −1 g)U T1−1 (g̃ −1 g) = T̃2 M T2 (g)U T1−1 (g) .
 

Also haben wir

HT1 (g̃) = T2 (g̃)H, ∀g̃ ∈ G.

Damit kann das Lemma von Schur anwendet werden:

1. Alternative: T1 und T2 sind nicht äquivalent.

In diesem Fall ist H = 0 und damit


 
X
M T2 (g)pq Uqi T1−1 (g)ij  = 0.
qi

Wir wählen für U speziell eine Rechtecksmatrix, die nur an der Stelle (q, i) eine 1 enthält
und sonst Nullen. Für dieses U folgt

M T2 (g)pq T1 (g)−1

ij = 0 (keine Summe).

Jetzt wählen wir noch p = q, i = j und summieren über p und i. Dann ergibt sich

M Sp T2 Sp T1−1 = 0.


Da (für unitäre T ) Sp T −1 = Sp T̄ ist, folgt schließlich

(χT1 , χT2 ) = M (χ̄T1 χT2 ) = 0, T1 , T2 inäquivalent und irreduzibel. (5.46)

Wir haben wir den folgenden wichtigen

Satz: Die Charaktere χT1 und χT2 von 2 inäquivalenten irreduziblen Darstellungen einer
Gruppe mit invarianter Mittelbildung sind unitär orthogonal bezüglich der Mittelbildung.

2. Alternative: Die beiden n-dimensionalen Darstellungen T1 und T2 sind äquivalent.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 85

Nach Wahl eines angepassten Koordinatensystems ist T1 = T2 = T . Somit ist T (g̃)H =


HT (g̃) für alle g̃ ∈ G und nach obigem Korollar ist H = λ1. Wegen

Sp H = nλ = Sp M T U T −1 = M Sp [T U T −1] = Sp U,
 

wobei wir M(1) = 1 benutzen, ist nλ = Sp U und damit

 
X
−1  Sp U
Hiq = M  Tij Ujp Tpq = δiq . (5.47)
jp
n

Die Elemente der quadratische Matrix U sollen nun alle verschwinden, bis auf Ujp = 1. Für
diesen Spezialfall folgt:

−1
 Sp U 1
Hiq = M Tij Tpq = δiq = δjp δiq .
n n
Nun setzen wir i = j, p = q und summieren über i und p. Dies führt zum

Satz: Der Charakter jeder irreduziblen Darstellung einer


 Gruppe mit invarianter Mittelbil-
dung hat die Norm 1 bezüglich Mittelbildung, M χ̄T χT = (χT , χT ) = 1.

Offensichtlich sind die Charakteren orthonormale Elemente im Raum der Klassenfunktionen


in L2 (G, dµ).

Es sei T eine beliebige Darstellung der Gruppe G mit Mittelbildung, d.h. sie kann als Summe
von irreduziblen Darstellungen geschrieben werden,

m
X
T = ci T i . (5.48)
i=1

Zueinander äquivalente Darstellungen können als gleich betrachtet werden. 2T2 bedeutet
dann, daß die irreduzible Darstellung T2 in der Zerlegung von T zweimal vorkommt. Die
T1 , . . . , Tm sei ein Liste aller möglichen irreduziblen Darstellung der betreffenden Gruppe.
Offensichtlich ist

χT (g) = c1 χT1 (g) + . . . + cm χTm (g). (5.49)

Nun gilt

(χTi , χT ) = M (χ̄Ti · χT ) = ci (5.50)

und wir haben das folgende Resultat gewonnen:

Satz [Ausreduktionsformel]: Die irreduziblen Darstellung Ti tritt in einerP Darstellung T


einer Gruppe mit Mittelbildung genau ci = (χi , χT )-mal auf und (χT , χT ) = |ci |2 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 86

Wir wollen noch zwei Schlussfolgerungen ziehen:

Satz: Zwei beliebige Darstellungen einer Gruppe mit Mittelbildung sind genau dann äquiva-
lent, wenn ihre Charaktere gleich sind.

Sind zwei Darstellungen äquivalent, dann haben sie offensichtlich den gleichen Charakter.
Die Umkehrung ist etwas schwieriger zu beweisen. Dazu brauchen wir das folgende

Lemma: Aus den Spuren der Matrizen einer Darstellung lassen sich die charakteristischen
Polynome dieser Matrizen berechnen.

Seien λ1 , . . . , λn die Eigenwerte der darstellenden Matrix T = T (g). Jeder Eigenwert sei so oft
aufgeführt, wie seine algebraische Vielfachheit beträgt. Für das charakteristische Polynom
gilt:

deg(λ − T ) = (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) = λn − s1 λn−1 + . . . + (−)n sn

wobei die Koeffizienten die folgenden elementarsymmetrischen Funktionen der Eigenwerte


sind:
X X
s1 = λj , s2 = λi λj
i6=j
X
s3 = λi λj λk , . . . , sn = λ1 λ2 · · · λn .
i6=j6=k

Anderseits sind mit T auch T 2 = T (g 2 ), . . . , T n = T (g n ) darstellende Matrizen. Die Spuren


sind durch folgende Potenzsummen gegeben:
X p
σp = Sp T p = λi .
i

Mit Hilfe der Newtonschen Formeln kann gezeigt werden, daß jedes symmetrische Polynom
eindeutig als Polynom von Potenzsummen dargestellt werden kann. In unserem Fall ist
1 2  1 3 
s1 = σ1 , s2 = σ − σ2 , s3 = σ − 3σ1 σ2 + 2σ3 , . . .
2 1 2 1
Wir sehen also: Haben zwei Darstellungen T1 und T2 dieselben Charakteren, d.h. dieselben
σp , dann haben die darstellenden Matrizen T1 (g) und T2 (g) identische charakteristische
Polynome für alle g ∈ G. Dann sind diese ähnlich und damit sind T1 und T2 äquivalente
Darstellungen.

Lemma: Jede irreduzible Darstellung T : g → T (g) einer Abelschen Gruppe hat die Di-
mension 1.

Sei T̃ = T (g̃) eine beliebige, aber feste Matrix der Darstellung T . Da G Abelsch ist, gilt:
T (g)T̃ = T̃ T (g) für alle g ∈ G. Nach obigem Korollar muß also T̃ = λ1 sein. Somit sind alle
darstellenden Matrizen diagonal. Dann kann die Darstellung nur irreduzibel sein, wenn sie
die Dimension 1 hat.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.6. Alle Darstellungen einer endlichen Gruppe 87

5.6 Alle Darstellungen einer endlichen Gruppe

Wir wollen zuerst einmal untersuchen, wie viele inäquivalente irreduzible Darstellungen eine
endliche Gruppe haben kann. Wir erinnern uns daran, daß die Charakteren Klassenfunktio-
nen, d.h. auf den Ähnlichkeitsklassen von G konstant sind. Offensichtlich kann es höchstens
so viele Charaktere geben wie die Gruppe Klassen hat. Wir werden sehen, daß die Anzahl
inäquivalente irreduzible Charaktere genau mit der Anzahl Klassen übereinstimmt. Dazu
die führen wir die sogenannte reguläre Darstellung der endlichen Gruppe G ein.

Die reguläre Darstellung einer Gruppe der Ordnung h erhält man, indem jedem Gruppen-
element auf 1 − 1-deutige Art ein Grundvektor in R zugewiesen wird. Jedem g ordnet
h

man eine h × h-Matrix Treg (g) zu, die diese Grundvektoren gemäß Multiplikationstabelle
permutieren.

Bei Multiplikation der Gruppenelemente mit g̃ 6= e bleibt kein Element fest:

g̃g 6= g ∀g ∈ G.

Somit gilt für den Charakter der regulären Darstellung

h ≡ |G| falls g = e
n
χreg (g) = (5.51)
0 sonst.
Zurück zur Diedergruppe D6 : Die reguläre Darstellung der Diedergruppe D6 liefert für
die erzeugenden Elemente

0 0 0 0 0 1 0 0 0 0 0 0
 
1 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0
 
0 0 1 0 0 0 0 0 0 0 0 0
 
0 0 0 1 0 0 0 0 0 0 0 0
 
0 0 0 0 1 0 0 0 0 0 0 0
 
Treg (a) = 
0 0 0 0 0 0 0 0 0 0 0 1

0 0 0 0 0 0 0 0 0 1 0 0
 
0 0 0 0 0 0 0 0 0 0 1 0
 
0 0 0 0 0 0 1 0 0 0 0 0
 
0 0 0 0 0 0 0 1 0 0 0 0
 
0 0 0 0 0 0 0 0 1 0 0 0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.6. Alle Darstellungen einer endlichen Gruppe 88

und
0 0 0 0 0 0 1 0 0 0 0 0
 
0 0 0 0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 1 0 0 0
 
0 0 0 0 0 0 0 0 0 0 1 0
 
0 0 0 0 0 0 0 1 0 0 0 0
 
0 0 0 0 0 0 0 0 0 1 0 0
 
Treg (b1 ) = 
1 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 1 0 0 0 0 0 0 0
 
0 0 1 0 0 0 0 0 0 0 0 0
 
0 0 0 0 0 1 0 0 0 0 0 0
 
0 0 0 1 0 0 0 0 0 0 0 0
 
0 1 0 0 0 0 0 0 0 0 0 0
2
Man sieht sofort, daß Treg (b1 ) = 1 ist, wie von der Darstellungseigenschaft gefordert.

Was sind nun die irreduziblen Darstellungen. Wie immer gibt es die eindimensionale Eins-
darstellung T11 die jedem Gruppenelement eine 1 zuordnet und die alternierende Darstellung,
die den Drehungen eine 1 und den Spiegelungen eine −1 zuordnet. Sei nun χj der Charakter
einer beliebigen irreduziblen Darstellung von G der Dimension nj . Wegen (5.51) ergibt die
Ausreduktionsformel für die Vielfachheit cj , mit der Tj in Treg auftritt:

1X 1
cj = (χ̄j , χreg ) = χ̄j (g) · χreg (g) = χ̄j (e) · χreg (e).
h h
g∈G

Mit χj (e) = nj und χreg (e) = h ergibt sich der

Satz: Jede irreduzible Darstellung Tj der Dimension nj kommt in der regulären Darstellung
Treg genau nj mal vor:
k
X X
Treg = nj Tj =⇒ h = |G| = n2j . (5.52)
j=1

Angewandt auf D6 ,
k
X k
X k
X
12 = n2j = 12 + 12 + 22 + n2j = 6 + n2j ,
1 4 4

wobei wir benutzten, daß D6 mindestens zwei eindimensionale Darstellungen und eine zwei-
dimensionale Darstellung hat. Damit kann D6 zusätzlich zu diesen bekannte Darstellungen
nur entweder 6 zusätzliche eindimensionale, oder eine zweidimensionale und 2 eindimen-
sionale irreduzible Darstellungen haben. Wir werden schlussendlich noch zeigen, daß das
Letztere der Fall ist.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.7. Die Charakterenmatrix 89

5.7 Die Charakterenmatrix

Es sei G eine beliebige endliche Gruppe der Ordnung h. G habe k Ähnlichkeitsklassen. Wir
wollen die Ähnlichkeitsklassen der symmetrischen Gruppe Sn betrachten, da jede endliche
Gruppe der Ordnung n isomorph zu einer echten Untergruppe der symmetrischen Gruppe
Sn ist. Es ist zweckmäßig, die Zyklenschreibweise für Permutationen einzuführen. Beispiel
 
1 2 3 4 5 6
S6 ∋ g = ∼ (1 4 6)(3 5)(2).
4 2 5 6 3 1

Man ordnet die Zyklen nach abnehmender Länge an. Offensichtlich ist jede Permutation ein
Produkt von elementfremden Zyklen und die Zerlegung einer Permutation in Zyklen ist, bis
auf die Reihenfolge gleich langer Zyklen, eindeutig.

Zwei Permutationen von n Objekten heißen vom gleichen Typus, wenn in beiden Permuta-
tionen Zyklen der Länge l genau gleich oft auftreten. Zum Beispiel die Elemente

(1 3 8)(4 5)(2 6)(7) und (1 4 6)(3 5)(7 8)(2) (5.53)

aus S8 sind vom gleichen Typus. Für jede Permutation g aus Sn sei nun αj , j = 1, 2, . . . , n
die Anzahl Zyklen der Länge j in der Zerlegung von g in Zyklen. Für die Permutationen in
(5.53)

α1 = 1, α2 = 2, α3 = 1, α4 = α5 = . . . = α8 = 0.

Ohne Beweis notieren wir den

Satz: Die Anzahl Permutationen vom Typus (α1 , α2 , . . . , αn ) ist


n!
n .
Q
αj ! · j αj (5.54)
1

Beispiel: die Klassentabelle von S4 ist


Nr. Partitionen Typus Anz.Zykl. Anz.Perm.
α4 α3 α2 α1
1) 4=4 (....) 1 0 0 0 6
2) 4=3+1 (...)(.) 0 1 0 1 8
3) 4=2+2 (..)(..) 0 0 2 0 3
4) 4=2+1+1 (..)(.)(.) 0 0 1 2 6
5) 4=1+1+1+1 (.)(.)(.)(.) 0 0 0 4 1

Es sei nun

g = (1 4 6)(3 5)(2) und a = (1 3 5 2 6)(4)


−1
⇒a = (3 1 6 2 5)(4).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.7. Die Charakterenmatrix 90

Nun wollen wir aga−1 bestimmen:


ga−1 = ( 3 4 6 2)(5)(1), aga−1 = ( 3 4 1)(2 5)(6).
Also ist aga−1 vom selben Typus wie g. Allgemein gilt

Satz: Zwei Permutationen g, g̃ der symmetrischen Gruppe Sn sind genau dann zueinander
ähnlich, g̃ = aga−1 , wenn sie vom gleichen Typus sind. Damit haben alle Permutationen
vom selben Typus denselben Charakter. Die Anzahl Ähnlichkeitsklassen ist gleich der Anzahl
der geordneten Partitionen von n.

Aus der Charakterentabelle


Klassen (1) (2) ... ... (k)
Ordnung d.Kl. h1 h2 ... ... hk
χ1 1 1 ... ... 1
χ2 χ2 (1) χ2 (2) ... ... χ2 (k)
.. .. .. ..
. . . ... ... .
χj χj (1) χj (2) ... ... χj (k)

können wir die sogenannte Charakterenmatrix konstruieren


Klassen (1) (2) ... ... (k)
Ordnung d.Kl. h1 h2 ... ... hk
q q q
h1 h2 hk
χ1 h ·1 h ·1 ... ... h 1
q q q
h1 h2 hk
χ2 h · χ2 (1) h · χ2 (2) ... ... h · χ2 (k)
.. .. .. ..
. .q .q ... ... .q
h1 h2 hk
χj h · χj (1) h · χj (2) ... ... h · χj (k)

Die Faktoren wurden gerade so eingeführt, daß die Zeilen der Charakterenmatrix unitär-
orthogonal zueinander sind:
k
1X
hℓ χ̄p (ℓ) · χq (ℓ) = (χp , χq ) = δpq .
h
ℓ=1

Aus dieser Tatsache folgt, daß die Anzahl zueinander inäquivalenter irreduzibler Darstellun-
gen j kleiner gleich der Anzahl k von Äquivalenzklassen sein muß.

Nun kann man mit ähnlichen Methoden wie oben noch beweisen, daß
j
X
χ̄p (g)χp (g̃) = 0
p=1

falls g und g̃ zu verschiedenen Ähnlichkeitsklassen gehören. Damit sind auch die Kolonnen
der Charakterenmatrix unitär-orthogonal zueinander und die Matrix ist quadratisch und
unitär. Damit haben wir den wichtigen

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 91

Satz: Es gibt genau so viele irreduzible Darstellungen einer endlichen Gruppe, wie es Äqui-
valenzklassen gibt. Jede Klassenfunktion ist eine Linearkombination der orthonormierten
Charakteren.

Beispiel: S4 hat 5 Äquivalenzklassen und damit 5 irreduzible Darstellungen. Wegen


5
X
n2i = 24
i=1

und der Existenz der Eins- und alternierenden Darstellung, ist nur

(n1 , n2 , n3 , n4 , n5 ) = (1, 1, 2, 3, 3)

möglich. Es gibt also neben den zwei eindimensionalen noch eine zweidimensionale und zwei
dreidimensionale irreduzible Darstellung.

Die Diedergruppe D6 hat 12 Elemente und 6 Ähnlichkeitsklassen. Also gibt es 4 eindimen-


sionale und 2 zweidimensionale irreduzible Darstellungen.

Für jede Abelsche Gruppe ist aga−1 = g und damit gibt es so viele Klassen wie die Gruppe
Elemente hat. Wegen
j
X
h= n2i und j = h,
i=1

müssen alle ni = 1 sein. Wir sehen (wie schon früher), daß alle Darstellungen einer Abelschen
Gruppe eindimensional sein müssen.

5.8 Die Charakteren von kompakten Lie-Gruppen

In den wenigen verbleibenden Stunden wollen wir die wichtigsten gruppentheoretischen


Werkzeuge bereitstellen die für ein Verständnis von kontinuierlichen Symmetrien in der
Physik notwendig sind. Wir beginnen mit der einfachsten kompakten Lie-Gruppe.

5.8.1 Die Charakter von U(1):

Diese Gruppe ist Abelsch, und wegen aga−1 = g bildet jedes Element eine Äquivalenzklasse.
Daher sind alle Funktionen f : U (1) → C , d.h. 2π-periodische Funktionen f (t) = f (g(t)),
automatisch Klassenfunktionen.

Alle irreduziblen Darstellungen sind eindimensional und in einer adaptierten Basis unitär.
Also hat jede Darstellung die Form

T (g(t)) = eih(t) , g(t) = et , h(t) ∈ R ,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 92

und die Darstellungseigenschaft impliziert


eih(0) = eih(2π) = 1 und eih(t1 +t2 ) = ei(h(t1 )+h(t2 )) .
Also ist h(t) ein lineare Funktion mit h(t + 2π) = h(t) + n. Damit haben die irreduziblen
Darstellungen die Form

Tn : eit −→ T (eit ) = eint , n = 0, ±1, ±2, . . . . (5.55)

Da Sp (T (g(t)) = T (g(t)) = exp(int) sind die Charakteren der irreduziblen Darstellungen


der Gruppe U (1)

χn (t) = χTn (t) = eint . (5.56)

Diese sind in der Tat unitär-orthogonal bezüglich der Mittelbildung,

1
Z
(χn , χm ) = dt e−int eimt = δnm , (5.57)

wie es nach der allgemeinen Theorie über die Charakteren von Gruppen mit Mittelbildung
sein muß. Jede Klassenfunktion f (t), d.h. 2π-periodische Funktion, kann nach der Theorie
der Fourier-Reihen nach ebenen Wellen entwickelt werden. Also haben wir genau dieselbe
Situation wie für endliche Gruppen: Jede Klassenfunktion f (t) kann als Linearkombination
der unitär-orthogonalen Charakteren geschrieben werden,

1
X Z
f (t) = cn χn (t), cn = e−int f (t) = (χj , f ) . (5.58)
n

Die Fourier-Analyse ist also ein Spezialfall der Theorie der Charakteren. In der Tat, es
gilt der folgende

Satz von Peter und Weyl: Zu jeder kontinuierlichen Gruppe G mit Mittelbildung existie-
ren unendlich viele Charaktere, welche ein vollständiges orthogonales Funktionensystem auf
den Klassenfunktionen in L2 (G) bilden.

Es gibt noch eine allgemeinere Version des Theorems von Peter und Weyl. Danach bilden
die Matrixelemente aller irreduziblen Darstellungen einer kontinuierlichen Gruppe mit Mit-
telbildung eine othogonale Basis im Hilbert-Raum L2 (G, dµ). Im Folgenden werden wir ein
vollständiges und orthonormiertes System von Klassenfunktionen für SU (2) konstruieren.

5.8.2 Die Charakter von SU(2)

In diesem Abschnitt konstruieren wir alle Charakteren der quantenmechanischen Drehgrup-


pe. Der Charakter der Einsdarstellung T0 und der zweidimensionalen definierenden Darstel-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 93

lung T 21 in (5.17) sind

χ0 (θ) = 1 und χ 12 (θ) = 2 cos θ = eiθ + e−iθ . (5.59)

Dies sind die einzigen ein- und zweidimensionalen Darstellungen von SU (2) (siehe unten).
Mit den Integrationsformeln

π π
Z Z Z
sin2 θ = , sin2 θ cos2 θ = und sin2 θ cos θ = 0, (5.60)
2 8
wobei jeweils von θ = 0 bis π integriert wird, findet man für deren Skalarprodukte

(χ0 , χ0 ) = (χ 21 , χ 12 ) = 1 und (χ0 , χ 12 ) = 0, (5.61)

in Einklang mit der allgemeinen Theorie. Wir erinnern an das Skalarprodukt für zwei Klas-
senfunktionen auf SU (2),

2
Z
(f1 , f2 ) = dθ sin2 θ f¯1 (θ)f2 (θ). (5.62)
π
Um die nächste irreduzible Darstellung zu gewinnen, betrachten wir die 4-dimensionale
Tensorprodukt-Darstellung
T 12 × T 21 mit χ 21 × 12 (θ) = χ 12 (θ) · χ 12 (θ) = e2iθ + 2 + e−2iθ .
Offensichtlich ist
   
χ0 , χ 21 × 12 = 1 und χ 12 , χ 21 × 12 = 0,
so daß das Tensorprodukt die Einsdarstellung einmal enthält. Also gilt

T 21 × T 21 = T0 ⊕ T1 , χ1 (θ) = e2iθ + 1 + e−2iθ . (5.63)

Da (χ1 , χ1 ) = 1 ist, ist T1 eine 3-dimensionale irreduzible Darstellung Wie wir sehen werden
ist es eine wohlbekannte Matrixgruppe, nämlich die 3-dimensionale Drehgruppe SO(3). Um
dies einzusehen, schauen wir uns die Tensordarstellung T 21 × T 21 etwas genauer an. Unter T 12
gehen x und y in g x und g y über, so daß
 2
x1 y1 a ab ba b2 x1 y1
   
 x1 y2   −ab̄ aā −bb̄ bā   x1 y2 
 −→  .
x2 y1 −b̄a −b̄b āa āb x2 y1
 
x2 y2 b̄2 −b̄ā −āb̄ ā2 x2 y2
Benutzen wir statt xi yy die symmetrische bzw. antisymmetrischen Kombinationen
 
1 1
Y00 = √ (x1 y2 − x2 y1 ) , (Y11 , Y10 , Y1−1 ) = x1 y1 , √ (x1 y2 − x2 y1 ), x2 y2
2 2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 94

dann findet man das folgende Transformationsverhalten

Y00 1 0 0 0 Y00
    

 Y11  0 a2
√ 2ab √b2   Y11 
 −→  . (5.64)
Y10 0 − 2ab̄ aā√− bb̄ 2bā Y10
 
Y1−1 0 b̄2 − 2āb̄ ā2 Y1−1

Der eindimensionale invariante Unterraum wird also von der antisymmetrischen Kombinati-
on Y00 aufgespannt und der dreidimensionale von den symmetrischen Kombinationen Y1m .
Setzen wir schlussendlich noch

 
1 1
(X1 , X2 , X3 ) = √ (Y11 − Y1−1 ), √ (Y11 + Y1−1 ), Y10 , (5.65)
2 i 2
dann sieht die dreidimensionale Darstellung folgendermaßen aus

X −→ (e , X )e + e ∧ X sin 2θ − e ∧ (e ∧ X ) cos 2θ = R(2θ, e )X , (5.66)

wobei θ der Winkel in der Parametrisierung (5.17) und


 
sin ψ cos(π + ϕ)
e
=  sin ψ sin(π + ϕ) 
cos ψ
ein Einheitsvektor ist. Dies ist gerade eine Drehung von X e
um die Achse mit Winkel 2θ.
3 3
Die Matrixelemente von R sind reell und damit kann R als Transformation auf R ⊂ C
angesehen werden. Damit ist g → R(g) ∈ SO(3) eine irreduzible Darstellung von SU (2)
3
durch 3-dimensionale Drehungen im R . Beachte, daß R(g) = R(−g), d.h. daß g → R(g)
keine treue Darstellung ist.

Nun kann man weiterfahren und T1 × T 21 mit Charakter

χ1× 12 = χ1 · χ 21 = e3iθ + 2eiθ + 2e−iθ + e−3iθ = χ 21 + χ 32

ausreduzieren. Offensichtlich enthält diese Tensordarstellung die Darstellung T 21 genau ein-


mal. Da (χ 32 , χ 32 ) = 1 ist, zerfällt T1 × T 21 in die irreduzible Darstellung T 12 und eine 4-
dimensionale irreduzible Darstellung T 23 . Ähnlich gewinnt man auch T2 , T 52 usf. Man findet
die Charakteren

j
X sin(2j + 1)θ 1 3
χj = e2inθ = , j = 0, , 1, , . . . . (5.67)
n=−j
sin θ 2 2

Wegen χj (e) = 2j + 1 ist

dim Tj = 2j + 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 95

und mit der Integrationsformel


π
sin(2j + 1)θ sin(2j ′ + 1)θ dθ = δjj′ (5.68)
2
0

sind diese Darstellungen irreduzibel und inäquivalent. Die halbganze Quantenzahl j charak-
terisiert in der Quantenmechanik den Spin. Da

lim χj (π − ǫ) = (2j + 1)(−)2j = (−)2j χ(0)


ǫ→0

sind die Darstellungen mit ganzzahligen Spin j untreu,

Tj (−e) = (−)2j 12j+1 . (5.69)

Jede Klassenfunktion f (θ) ∈ L2 (SU (2)) kann nach Peter und Weyl als Linearkombination
der Charakteren geschrieben werden

sin(2j + 1)θ 2
X Z
f (θ) = cj , cj = sin2 θ χj (θ)f (θ)dθ. (5.70)
j
sin θ π

Dass die Charakteren χj ein vollständiges Funktionensystem auf dem Hilbert-Raum

 
2
L2 [0, π], sin2 θdθ (5.71)
π

der Klassenfunktionen von SU (2) bilden, kann auch anderweitig eingesehen werden. Dies
zeigt dann posteriori, daß die Spin-j Darstellungen Tj alle irreduziblen Darstellungen von
SU (2) sind.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5

Darstellungen

In der Physik treten Gruppen vorwiegend über ihre Darstellungen in Erscheinung. Eine
Darstellung einer Gruppe ordnet jedem Gruppenelement eine lineare Transformation T auf
einem Vektorraum V zu:

T : G −→ L(V )
(5.1)
g −→ T (g).

Dabei soll T die Gruppenstruktur respektieren,

T (e) = 1, T (g1 g2 ) = T (g1 )T (g2 ) =⇒ T (g −1 ) = T −1 (g), (5.2)

was bedeutet, dass die Abbildung T ein Gruppenhomomorphismus von G in die Gruppe
L(V ) der linearen und invertierbaren Abbildungen V → V ist. Es gibt immer die triviale
Darstellung, die allen Elementen der Gruppe die identische Abbildung zuordnet. Der andere
Extremfall sind die treuen Darstellungen, für die T (g1 ) = T (g2 ) nur für g1 = g2 möglich
ist. Für eine treue Darstellung ist das Urbild der identischen Abbildung nur das neutrale
Element e. Als Dimension einer Darstellung bezeichnet man die Dimension des Vektorraums
V . Nach Wahl einer Basis in V werden die T (g) zu Matrizen.

Wegen der Darstellungseigenschaft genügt es, die T (g) für die erzeugenden Gruppenelemente
zu kennen. Zum Beispiel wird die Permutationsgruppe S3 von a und c erzeugt, da

b = a2 , e = a3 , d = ca und f = ca2 .

Wir haben früher a als Drehung um 2π/3 und c als Spiegelung dargestellt, siehe Abbildung
2
(4.1). Wir wählen eine kartesische Basis in R und ordnen den Drehungen und Spiegelungen
Matrizen zu. Die Kolonnen der Matrizen sind die Bilder der Basisvektoren:

65
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 66

cos 1200 − sin 1200


   
−1 0
T (a) = , T (c) = . (5.3)
sin 1200 cos 1200 0 1

Dies ist eine treue Darstellung von S3 und wir bezeichnen sie mit T2 . Daneben gibt es auch
noch die Einsdarstellung T11 :

T11 (a) = T11 (c) = 1 =⇒ T11 (G) = 1 (5.4)

und die alternierende Darstellung T12 :

T2 T2
T12 (a) = 1, T12 (c) = −1 =⇒ e, a, b −→
1
1, 1
c, d, g −→ −1. (5.5)

Die alternierende Darstellung ist gerade die Determinante der Darstellungsmatrizen in (5.3).
Den geraden Permutationen (Drehungen) ordnet sie eine 1 und den ungeraden Permutatio-
nen (Spiegelungen) eine −1 zu.

Allgemein gilt: ist T (g) eine beliebige Darstellung von G, dann ist T ′ (g) = det T (g) eine
1-dimensionale Darstellung:

T ′ (g1 g2 ) = det T (g1 g2 ) = det T (g1 )T (g2 ) = det T (g1 ) det T (g2 ) = T ′ (g1 )T ′ (g2 ),

und T ′ (e) = det 1 = 1. Darstellungsmatrizen, welche dieselben linearen Abbildungen bezüglich


verschiedener Basen beschreiben, sollten identifiziert werden und diese Identifikation führt
auf den Begriff von äquivalenten Darstellungen.

5.1 Äquivalenz von Darstellungen

Wir wechseln das Koordinatensystem zur Darstellung von S3 als Gruppe der Drehungen
e
und Spiegelungen. Der Übergang von der alten Basis { i } zur neuen Basis { i } werde durch f
eine lineare Transformation S geleistet,

ei = S ji fj , (5.6)

wobei wie die Einsteinsche Summenkonvention benutzten, nach der über doppelt vorkom-
e f
mende Indexe summiert wird. Es sei xi i = y i i ein beliebiger Vektor mit Koordinaten
xi bezüglich der alten Basis und Koordinaten y i bezüglich der neuen Basis. Diese hängen
folgendermaßen zusammen,

y i = S ij xj , xi = (S −1 )ij y j . (5.7)

Bezüglich der Basis ei haben die T (g) die Komponenten T (g)ij , d.h.
————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 67

e2
f2
y2 b

x2 b b

b
e1
b x1
y1

f1

Abbildung 5.1: Äquivalenz zweier Darstellungen

x −→ T (g)x , xi
(T (g) ) = T (g)ij xj . (5.8)

Dann gilt
y = S x −→ ST (g)S −1y ≡ T̃ (g)y .
Wie erwartet, gehen die Darstellungsmatrizen T̃ (g) bezüglich der Basis fi durch eine Ähn-
lichkeitstransformation aus denen bezüglich der Basis i hervor, e
T̃ (g) = ST (g)S −1 . (5.9)

Weiterhin, wegen
T̃ (g1 )T̃ (g2 ) = ST (g1 )S −1 ST (g2 )S −1 = ST (g1 )T (g2 )S −1
= ST (g1 g2 )S −1 = T̃ (g1 g2 )
ist g → T̃ (g) genauso eine Darstellung der Gruppe wie g → T (g). Diese beiden Darstellungen
heißen äquivalent. Zwei äquivalente Darstellungen sind wirklich dieselben Darstellungen und
sollten identifiziert werden. Ist umgekehrt eine Darstellung gegeben, dann können wir immer
unendlich viele äquivalente Darstellungen der Form ST (g)S −1 angeben. Bei der Klassifizie-
rung von Darstellungen kann es sich also nur um diejenige von inäquivalenten Darstellungen
handeln, also Darstellungen die nicht über eine Ähnlichkeitstransformation auseinander her-
vorgehen.

e
Wir geben jetzt noch eine dreidimensionale Darstellung von S3 an. Es sei i eine kartesische
3
Basis von R . Auf diese Elemente wirke die Permutationsgruppe. Unter a wird 1 in 2 , 2 e e e
————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.1. Äquivalenz von Darstellungen 68

e e e
in 3 und 3 in 1 abgebildet. Dies ist eine Drehung um die Achse e1 + e2 + e3 mit 1200 und
3
damit eine lineare Transformation in R . T3 (c) vertauscht 2 und e e3 und ist eine Spiegelung
e e e
an der Ebene aufgespannt durch 1 und 2 + 3 . Man erhält

   
0 0 1 1 0 0
T3 (a) =  1 0 0 und T3 (c) =  0 0 1. (5.10)
0 1 0 0 1 0

Die restlichen {T (g)} können aus der Multiplikationstabelle, die ja wegen der Darstellungs-

e3 e3
T (a) T (c)

e2 e2

e1 e1

Abbildung 5.2: Dreidimensionale natürliche Darstellung von S3

eigenschaft dieselbe wie diejenige der {g} ist, abgelesen werden. Die T (g) sind orthogonal
und unimodular.

Damit haben wir folgende Darstellungen der Gruppe S3 gewonnen: die Einsdarstellung T11 ,
die alternierende Darstellung T21 , die zweidimensionale treue Darstellung T2 und dreidimen-
sionale, natürliche Darstellung T3 .

Natürliche Darstellung:
Unter der Drehung T3 (a) und Spiegelung T3 (c), und damit unter allen Transformationen
f e e e

T3 (g) ist der eindimensionale Unterraum, aufgespannt durch 1 = ( 1 + 2 + 3 )/ 3 invariant.
f
Wir ergänzen 1 folgendermaßen zu einer orthonormierten Basis

f1 = √13 (e1 + e2 + e3), f2 = √12 (e2 − e3), f3 = √16 (−2e1 + e2 + e3 ).


Die Basiselemente f2 und f3 liegen in der Ebene senkrecht zur Drehachse. Die explizite Form

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.2. Reduzibilität von Darstellungen 69

der Transformationsmatrix in fi = (S −1 )jiej lautet


√ 
2 √0 −2
1 √
S −1 = √ 2 3 1  =⇒ S = (S −1 )t .
6 √2 −√3 1

Bezüglich der neuen Basis haben die Darstellungsmatrizen T̃3 (g) = ST3 (g)S −1 die Form
   
2 0 √0 1 0 0
1
T̃3 (a) = −1 − 3  und T̃3 (c) =  0 −1 0  .
0 √
2
0 3 −1 0 0 1

f
Neben dem von 1 aufgespannten eindimensionalen Unterraum lassen die T3 (g) auch den da-
f f
zu senkrechten 2-dimensionalen Unterraum, aufgespannt durch { 2 , 3 }, invariant. Auf dem
ersten Unterraum ist T3 die Einsdarstellung und auf dem zweiten Unterraum die Darstel-
lung T2 . Man sagt, die Darstellung ist reduzibel. Eine Darstellung T heißt irreduzibel, falls
V keinen echten Teilraum hat, der unter T invariant ist. T2 ist offensichtlich irreduzibel.

Formalisiert: Der dreidimensioale Darstellungsraum V3 von T3 zerfällt in zwei orthogonale


Teilräume der Dimensionen 1 und 2, V = V1 ⊕ V2 . Diese Teilräume sind invariant unter T3 ,
d.h. T3 : V1 → V1 und T3 : V2 → V2 . Auf V1 ist T3 gleich T11 und auf V2 gleich T2 . Man
schreibt

T3 = T11 + T2 , dim T3 = dim T11 + dim T2 .

5.2 Reduzibilität von Darstellungen

Es sei T eine n-dimensionale Darstellung einer beliebigen Gruppe G (endlich oder unendlich)
auf V . Sei V1 ein m-dimensionaler echter invarianter Teilraum von V , d.h. jede lineare
Transformation T (g) bildet jeden Vektor aus V1 wieder auf einen Vektor in V1 ab. Wird das
Koordinatensystem so gewählt, daß die ersten m Basisvektoren V1 aufspannen, so haben die
Darstellungsmatrizen die Form
 
T1 (g) H(g)
g −→ T (g) = ,
0 T2 (g)

wobei T1 eine m×m und T2 eine (n−m)×(n−m) Matrix ist. Eine Darstellung heißt reduzibel,
falls ein echter invarianter Teilraum von V existiert. Eine nicht reduzible Darstellung heißt
irreduzibel.

Ist speziell H(g) = 0 für alle Gruppenelemente, so zerfällt die Darstellung T in die Darstel-
lungen T1 und T2 ,
 
T1 (g) 0
g −→ .
0 T2 (g)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 70

Man schreibt T = T1 + T2 . Dieses Verfahren lässt sich möglicherweise fortsetzen, so daß die
darstellenden Matrizen in einem geeigneten Koordinatensystem weiter zerfallen:

 T (g) 0 0 ... 0 
1
 0 T2 (g) 0 ... 0 
g −→ 
 .. .. .. . (5.11)
. . .

0 0 0 . . . Tk (g)

Die Zerlegung bricht ab, wenn in keinem der invarianten Teilräume V1 , . . . , Vk eine weiterer
echter invarianter Teilraum existiert.

Definition: Eine Darstellung, die irreduzibel ist oder in lauter irreduzible Darstellungen
zerfällt, heißt vollreduzibel.

Es existieren unendliche Gruppen, die nicht vollreduzibel sind, d.h. es existieren Darstellun-
gen für welche H(g) nicht verschwindet. Aber wir haben den folgenden

Satz: Jede unitäre Darstellung auf einem Vektorraum mit Skalarprodukt ist vollreduzibel.

Beweis: Ist T irreduzibel, so ist nichts zu beweisen. Sei also V1 eine echter invarianter Teil-
raum von V und W = V1⊥ das unitär-orthogonale Komplement von V1 ,

W = {w ∈ V |(w, V1 ) = 0}.

V1 und W spannen V auf. Jeder Vektor v ∈ V läßt sich auf eindeutige Weise als Summe von
v1 ∈ V1 und w ∈ W schreiben, v = v1 + w. Nun ist

(T (g)w, v1 ) = (w, T † (g)v1 ) = (w, T (g −1 )v1 ) = 0

für alle g ∈ G, da T (g −1 )v1 nach Voraussetzung in V1 liegt. Damit liegt mit w auch T (g)w
im Unterraum W . Ist also V1 ein invarianter Teilraum einer unitären Darstellung, so ist dies
auch dessen Komplement W . Diese Verfahren kann nun fortgesetzt werden, falls ein echter
invarianter Teilraum von W existiert. Schließlich erhält man eine Zerfällung der Darstellung
in lauter irreduzible Bestandteile.

5.3 Mittelbildung und Haarsches Maß

Für jede endliche Gruppe G existiert eine Mittelung. Es sei f : G → C eine komplexwertige
Funktion auf G. Wir definieren den Mittelwert M(f ) von f durch

1 X
M(f ) = f (g). (5.12)
|G|
g∈G

Die folgenden Eigenschaften der Mittelwertbildung evident:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 71

1. linear: M(αf + βg) = αM(f1 ) + βM(f2 ) für alle α, β ∈ C .


2. positiv: Falls f (g) ≥ 0 reell ⇒ M(f ) ≥ 0 und nur = 0, falls f ≡ 0.
3. normiert: falls f (g) = 1 dann ist M(f ) = 1.
4. invariant gegenüber Translationen der Gruppe, d.h. ist f˜(g) = f (g̃g), dann ist

1 X 1 X
M(f˜) = f (g̃g) = f (g̃g) = M(f ). (5.13)
|G| |G|
g∈G g̃g∈G

Ein Mittelwert mit diesen vier Eigenschaften existiert auch für kompakte Lie-Gruppen.

5.3.1 Mittelbildung für kompakte Lie-Gruppen

Jede kompakte Lie-Gruppe hat eine invariante Mittelbildung. Dies folgt aus dem folgenden

Satz: Zu jeder kompakten Lie-Gruppe gibt es ein bis auf eine multiplikative Konstante
eindeutiges positives Haar-Integral M : C0 (G) → C , das links-und rechtsinvariant ist.

Links- und rechtsinvariant bedeutet, daß

Z
 
M(f ) ≡ dµ(g)f (g) = M f ◦ lg̃ = M f ◦ rg̃ ,
(5.14)
G

wobei lg̃ (g) = g̃g und rg̃ (g) = gg̃ (g̃ fest) die Links- bzw. Rechtstranslationen sind. Das
Haar-Maß dµ(g) existiert auch für allgemeinere lokalkompakte Gruppen. Dann ist es aber
im Allgemeinen entweder nur links- oder nur rechtsinvariant. Die Integration einer komplex-
wertigen Funktion mit dem Haar-Maß ist offensichtlich eine Mittelbildung.
Die einfachste kompakte Gruppe U (1) hat die Mittelbildung

Z2π Z2π
1 1
g(t) = eit = g(t + 2π).

M(f ) = dtf g(t) = dt f (t), (5.15)
2π 2π
t=0 0

M erfüllt alle Eigenschaften einer Mittelbildung: Die Linearität, Positivität und Normiert-
heit sind evident und wegen

Z2π Z2π
1  1
M(f ◦ lg̃ ) = dtf g(t̃ )g(t) = dtf (g(t̃ + t)) = M(f )
2π 2π
t=0 t=0

ist die Mittelbildung auch translationsinvariant.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 72

Wie sieht nun das invariante Haar-Maß für SU (2) aus. Dazu überlegen wir, was die Grup-
penoperation g → lg̃ (g) auf der Gruppenmannifaltigkeit S 3 geometrisch bedeutet. Dazu
parametrisieren wir die Gruppenelemente gemäß
   
α0 + iα1 α2 + iα3 β0 + iβ1 β2 + iβ3
g= , g̃ =
−α2 + iα3 α0 − iα1 −β2 + iβ3 β0 − iβ1

mit |α| = |β| = 1. Dann ist g → lg̃ (g) gegeben durch

α0 β0 −β1 −β2 −β3 α0


    
 α1   β1 β0 −β3 β2   α1 
  = α −→ O(β)α =   . (5.16)
α2 β2 β3 β0 −β1 α2
α3 β3 −β2 β1 β0 α3
P 2
Wegen βj = 1 ist O(β) orthogonal, Ot O = 1, und damit ist O(β)α eine Drehung von
α. Nun ist die (induzierte) Volumenform auf S 3 drehinvariant und damit invariant unter
Linkstranslationen (und Rechtstranslationen). Normieren wir die Volumenform auf 1, dann
erhalten wir das eindeutige Haar-Maß auf SU (2) ∼ S 3 . Wir parametrisieren die Punkte
auf SU (2) ∼ S 3 gemäß

α0 cos θ
   
 α1   sin θ cos ψ 
 =
α2 sin θ sin ψ cos ϕ

α3 sin θ sin ψ cos ϕ

beziehungsweise

sin θ sin ψeiϕ


 
cos θ + i sin θ cos ψ
g(α) = , (5.17)
− sin θ sin ψe−iϕ cos θ − i sin θ cos ψ

wobei die Winkel folgende Wertebereiche haben,

0 < θ < π, 0<ψ<π und 0 < ϕ < 2π. (5.18)

In diesen Koordinaten ist das Volumenelement gegeben durch

1
dµ = sin2 θ · sin ψdθdψdϕ. (5.19)
2π 2
Für die unitären Matrizen (5.17) ist Sp g = 2 cos θ. Wegen det g = 1 sind deshalb die
Eigenwerte dieser Matrizen eiθ und e−iθ .

Es sei nun f (g) = f (θ, ψ, ϕ) eine beliebige Klassenfunktion. Klassenfunktionen sind konstant
auf Konjugationsklassen, f (aga−1 ) = f (g). Nun kann aber jede unitäre Matrix mit einer
unitären Matrix diagonalisiert werden, d.h. für jedes g gibt es ein a, so daß

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 73

eiθ
 
0
aga−1 = , θ ∈ (0, π). (5.20)
0 e−iθ

Deshalb hängen Klassenfunktionen nur von θ und nicht von ψ, ϕ ab, sind 2π-periodisch und
wegen
   iθ    −iθ 
0 1 e 0 0 −1 e 0
=
−1 0 0 e−iθ 1 0 0 eiθ

gerade in θ:


f Klassenfunktion ⇐⇒ f g(θ, ψ, φ) = f (θ) = f (−θ) = f (θ + 2π). (5.21)

Für eine Klassenfunktion ist


1 2
Z
M(f (g)) = sin2 θ · sin ψ · f (θ) dθdψdϕ = f (θ) sin2 θ dθ. (5.22)
2π 2 π
0

Das induzierte Maß

2
dµred = sin2 θ dθ (5.23)
π
heißt reduziertes Haar-Maß von SU (2).

5.3.2 Unitäre und orthogonale Gruppen

In der Darstellungstheorie spielen die Darstellungen durch orthogonale oder unitäre Matrizen
eine wichtige Rolle. Eine komplexe n × n Matrix U heißt unitär, falls U † U = U U † = 1 ist.
n
Sei C der komplexe Vektorraum mit Skalarprodukt

n
X
(x, y) = x̄i yi . (5.24)
1

Die unitären Matrizen sind diejenigen Matrizen, die das Skalarprodukt invariant lassen,

(U x, U y) = (U † U x, y) = (x, U † U y) = (x, y). (5.25)

Ausgeschrieben in Komponenten:

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.3. Mittelbildung und Haarsches Maß 74

X X
Ūki Ukj = Uik Ūjk = δij .
(5.26)
k k

Die Zeilen und Spalten von unitären Matrizen sind zueinander unitär orthogonal. Lassen
U1 und U2 das Skalarprodukt invariant, dann auch U1 U2 und U2 U1 . Die Einheitsmatrix ist
offensichtlich auch unitär. Schlussendlich ist auch U † = U −1 unitär. Also bilden die unitären
Matrizen ein Gruppe

U (n) = {U ∈ L(C )|U † U = U U † = 1}.


n
(5.27)

Eine orthogonale Matrix R ist reell und unitär und erfüllt daher Rt R = RRt = 1. Die
orthogonalen Matrizen bilden folgende Untergruppe von U (n):

n
O(n) = {R ∈ L(R )|Rt R = RRt = 1}. (5.28)

Die obigen Darstellungen T von S3 sind alle orthogonal, d.h. alle Darstellungsmatrizen T (g)
sind orthogonal. Wegen
1 = det(U U † ) = det U det U † = det U det U
ist die Determinante einer unitären Matrix eine Phase. Diejenigen unitären Matrizen mit
det U = 1 bilden eine Untergruppe von U (n), die spezielle unitäre Gruppe,

SU (n) = {U ∈ U (n)| det U = 1}. (5.29)

Die Determinante einer orthogonalen Matrix ist eine reelle Phase, also ±1. Die Untergruppe
der Matrizen mit det R = 1 heißt spezielle orthogonale Gruppe,

SO(n) = {R ∈ O(n)| det R = 1.}. (5.30)

Nun haben wir den wichtigen

Satz: Jede Darstellung einer Gruppe mit Mittelbildung ist zu einer unitären Darstellung
äquivalent.

In anderen Worten: Wir können in V immer eine Basis finden, bezüglich der die Matrizen
T (g) unitär sind.

Beweis: Die dem Beweise zugrunde liegende Idee der Summation über die Gruppe geht auf
Hurwitz zurück. Wir bilden die quadratische Form
n o
h(x) = M T (g)x, T (g)x = x, M T † (g)T (g) x = (x, Qx).
 

Als Summe von positiven und hermiteschen Formen ist diese Form ist positiv und hermitesch,
h(x 6= 0) > 0 und Q = Q† ,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 75

und invariant
   
h(T (g̃)x) = M T (g)T (g̃)x, T (g)T (g̃)x = M T (gg̃)x, T (gg̃)x = h(x)

wegen der Translationsinvarianz der Mittelbildung. Nun benutzen wir noch, daß für jede
positive hermitesche Form h(x) ein Koordinatensystem existiert, so daß h in die Einheitsform
übergeht,
X
h(y) = ȳi yi .

In diesem neuen Koordinatensystem geht unsere Darstellung über in eine äquivalente, welche
die hermitesche Einheitsform für alle darstellenden Matrizen invariant läßt; also sind diese
unitär.

5.4 Klassenfunktionen und Charaktere

Jede Darstellung einer Gruppe mit Mittelbildung ist vollreduzibel. Für endliche oder kom-
pakte Lie-Gruppen gibt es eine Mittelbildung und jede Darstellung ist vollreduzibel. Wir
wollen im Folgenden immer annehmen, daß G eine Gruppe mit Mittelbildung sei.

Sei nun f (g) eine Klassenfunktion, d.h eine Funktion die für alle Elemente der gleichen
Konjugationsklasse

g ∼ g̃ ⇐⇒ g̃ = aga−1 , a, g, g̃ ∈ G

denselben Wert annimmt,

f (g) = f (aga−1 ). (5.31)


T
Zu jeder endlich-dimensionalen Darstellung G → L(V ) gehört die komplexwertigen Klas-
senfunktion

χT (g) = Sp T (g). (5.32)

Sie heißt Charakter der Darstellung T . Wegen

χT (aga−1 ) = Sp T (aga−1 ) = Sp T (a)T (g)T −1(a) = Sp T (g) = χT (g),

wobei wir Sp T1 T2 = Sp T2 T1 benutzten, sind die χT Klassenfunktionen. Die Charakteren


haben die folgenden Eigenschaften:

• Äquivalente Darstellungen haben denselben Charakter. Dies folgt unmittelbar aus


Sp T̃ (g) = Sp ST (g)S −1 = Sp T (g).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 76

• Die Dimension der Darstellung, oft auch Grad genannt, ist χT (e). Dies ist offensicht-
lich, da T (e) = 1 ist.
• Zerfällt eine Darstellung, so gilt dies auch für ihren Charakter:

T = T1 + T2 + . . . + Tk =⇒ χT = χT1 + . . . + χTk . (5.33)

Diese Eigenschaft folgt unmittelbar aus der Tatsache, daß es eine Basis gibt bezüglich
der die T (g) blockdiagonal sind,
 T (g) 0 0 ... 0 
1
 0 T2 (g) 0 ... 0
ST (g)S −1

=
 .. .. .. ,
. . .

0 0 0 . . . Tk (g)

und dass die Spur eine Klassenfunktion ist.


• Für jede Darstellung T mit Mittelbildung gilt: χT (g −1 ) = χT (g).
Beweis: Wir dürfen annehmen, daß die T (g) unitär sind. Dann gilt

χT (g −1 ) = Sp T (g −1 ) = Sp T −1 (g) = Sp T † (g) = Sp T (g) = χT (g).

Es folgt dann unmittelbar, dass für jede Gruppe G mit Mittelbildung und der Eigen-
schaft, daß jedes Element zu seinem Inversen ähnlich ist (d.h. für jedes g ∈ G existiert
ein a ∈ G mit g −1 = aga−1 ) die Charakteren reellwertige Klassenfunktionen sind.

5.4.1 Tensorprodukt von Darstellungen

Es seien T und T̃ zwei Darstellungen einer Gruppe G der Dimensionen n und ñ. Wir wählen
Basen in diesen Räumen und charakterisieren Vektoren durch ihre Koordinatentupel. Dann
x y
transformiert ein Vektor in V und ein Vektor in Ṽ gemäß

x −→ T (g)x und y −→ T̃ (g)y . (5.34)

Nun bilden wir den zweistufigen Tensor t mit Komponenten tip = xi yp . Diese Komponenten
transformieren wie folgt,

n X
X ñ   X
tip = xi yp −→ T (g)ij T̃ (g)pq xj yq = T (g)ij T̃ (g)pq tjq . (5.35)
j=1 q=1

Dies ist eine lineare Transformation der n · ñ Tensorkomponenten tip von t. Diese Tensoren

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 77

bilden eine n · ñ-dimensionalen Vektorraum V × Ṽ und die Matrizen T (g)ij T̃ (g)pq sind die
Komponenten der Tensordarstellung

T × T̃ : V × Ṽ −→ V × Ṽ . (5.36)

Für explizite Rechnungen ist es nützlich eine Konvention für die Numerierung der Kompo-
nenten t zu treffen. Wegen

 x′ y ′′  
T11 T̃ T12 T̃ ... T1n T̃

x1 y
y  y
1
 x2′  T21 T̃ T22 T̃ ... T2n T̃   x2
 =  ... .. ..  ,
 ..    .  (5.37)

. . .   ..
xn′ y′ Tn1 T̃ Tn2 T̃ . . . Tnn T̃ xn y
gehen die Darstellungsmatrizen T (g) ⊗ T̃ (g) der Darstellung T × T̃ auf einfache Weise aus
denen der Darstellungen T und T̃ hervor: Man multipliziere jedes Matrixelement von T (g)
mit der Matrix T̃ (g). Aus der obigen Form von T ⊗ T̃ folgt unmittelbar, daß

  X
χT ×T̃ = Sp T ⊗ T̃ = Tii Sp T̃ = Sp T Sp T̃ = χT · χT̃ . (5.38)

Wir üben dies am Beispiel des Tensorproduktes der Darstellung T2 von S3 mit sich selber:
 √   
1 √ −1 − 3 −1 0
T (a) = , T (c) = .
2 3 −1 0 1

Also haben Darstellungsmatrizen der 4-dimensionalen Darstellung T2 × T2 folgende Form:


√ √
1 3 3 √3
 

1  −√3 1 −3 √3 
(T ⊗ T )(a) =
4 − 3 −3 1 3
 
√ √
3 − 3 − 3 1
1 0 0 0
 
 0 −1 0 0 
(T ⊗ T )(c) =  .
0 0 −1 0
0 0 0 1
Wir sehen, daß in der Tat

χT2 ×T2 (a) = 1 = χT2 (a)χT2 (a) und χT2 ×T2 (c) = 0 = χT2 (c)χT2 (c)

ist. Wir haben damit für S3 die folgende Charakterentabelle:

χT11 χT12 χT2 χT3 χT2 ×T2


Ke 1 1 2 3 4
Ka 1 1 −1 0 1
Kc 1 −1 0 1 0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 78

Da T3 = T2 + T11 ist auch χT3 = χT2 + χT11 . Falls nun T2 × T2 reduzibel (und damit voll-
reduzibel) ist, muß es eine Summe der niedrig-dimensionalen Darstellungen T11 , T12 und T2
sein. Die Summe der Dimensionen der dabei auftretenden Darstellungen in der Zerlegung
von T2 × T2 muß gleich 4 sein. Aus der Charaktertabelle sehen wir, daß nur

T2 × T2 = T2 + T11 + T12

in Frage kommt. Dies ist auch die richtige Antwort. Um dies einzusehen müssen wir noch
etwas mehr über den Zusammenhang zwischen Charakteren und Darstellungen wissen.

Diedergruppen: Die Diedergruppe Dn besteht aus den möglichen Deckbewegungen eines


regulären n-Ecks. Betrachten wir D6 etwas genauer: Die Drehungen a, a2 , a3 , a4 , a5 und

b2 c1
2b b
1 b b

e2 e1
a
3b e3 e6 b
6 b b

e4 e5
b b b b
4 5

Abbildung 5.3: Die Erzeugenden der Diedergruppe D6 .

a6 = e bilden eine Untergruppe von D6 . Diese Untergruppe ist gerade die Abelsche zyklische
Gruppe C6 der Ordnung 6. Dann gibt es noch die Spiegelungen bi vom Typus b und die
Spiegelungen ci vom Typus c (siehe Abb.5.3). Die Gruppe besteht also aus 12 Elementen.
Wir ordnen die Elemente gemäß

{e, a, a2 , a3 , a4 , a5 , b1 , b2 , b3 , c1 , c2 , c3 }.

Wie man aus der Abbildung leicht entnimmt, gelten zum Beispiel

ab1 = c1 , ac1 = b2 , ab2 = c2 , ac2 = b3 , ab3 = c3 , ac3 = b1


b 1 a = c3 , c1 a = b 1 , b 2 a = c1 , c2 a = b 2 , b 3 a = c2 , c3 a = b 3 .

Die Multiplikationstabelle ist

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.4. Klassenfunktionen und Charaktere 79

e a a2 a3 a4 a5 b1 b2 b3 c1 c2 c3
e e a a2 a3 a4 a5 b1 b2 b2 c1 c2 c3
a a a2 a3 a4 a5 e c1 c2 c3 b2 b3 b1
a2 a2 a3 a4 a5 e a b2 b3 b1 c2 c3 c1
a3 a3 a4 a5 e a a2 c2 c3 c1 b3 b1 b2
a4 a4 a5 e a a2 a3 b3 b1 b2 c3 c1 c2
a5 a5 e a a2 a3 a4 c3 c1 c2 b1 b2 b3
b1 b1 c3 b3 c2 b2 c1 e a4 a2 a5 a3 a
b2 b2 c1 b1 c3 b3 c2 a2 e a4 a a5 a3
b3 b3 c2 b2 c1 b1 c3 a4 a2 e a3 a a5
c1 c1 b1 c3 b3 c2 b2 a a5 a3 e a4 a2
c2 c2 b2 c1 b1 c3 b3 a3 a a5 a2 e a4
c3 c3 b3 c2 b2 c1 b1 a5 a3 a a4 a2 e

Wir sehen, daß die Gruppenelement a und b1 die Diedergruppe erzeugen. Deshalb genügt
es, die Darstellungen der erzeugenden Elemente zu notieren.

Sind die Ecken des 6-Ecks die C − H’s des Benzols, so hat Hückel als Modell-Hamilton-
Operator

0 1 0 0 0 1
 
1 0 1 0 0 0
0 1 0 1 0 0
 
H∼ (5.39)
0 0 1 0 1 0

0 0 0 1 0 1
 
1 0 0 0 1 0

vorgeschlagen: Die Energie ist gleich der Summe der Nachbarwerte. Bis auf ein Vielfaches
der Identität ist H die diskretisierte zweite Ableitung. Offensichtlich vertauscht H mit allen
Symmetrietransformationen des 6-Ecks, d.h. mit den Darstellungen der Diedergruppe D6 .
Nun wollen wir zuerst einige spezielle Darstellungen untersuchen. Später werden wir alle
Darstellungen von D6 konstruieren.

Natürlich gibt es die Einsdarstellung T11 und die alternierende Darstellung T12 die a → 1
und b1 → −1 zuordnet. Um eine 6-dimensionale Darstellung zu konstruieren, belegen wir
e e
die Eckpunkte des 6-Ecks mit 1, . . . , 6 und Vektoren 1 , . . . 6 . Dann dreht T (a) den Vektor
e e e e
i in den Vektor i+1 , wobei 7 ≡ 1 ist. Also ist

0 0 0 0 0 1
 
1 0 0 0 0 0
0 1 0 0 0 0
 
T (a) =  . (5.40)
0 0 1 0 0 0
0 0 0 1 0 0
 
0 0 0 0 1 0

Die Spiegelung T (b1 ) vertauscht e1 und e6 etc, so daß


————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 80

0 0 0 0 0 1 1 0 0 0 0 0
   
0 0 0 0 1 0 0 0 0 0 0 1
0 0 0 1 0 0 0 0 0 0 1 0
   
T (b1 ) =   =⇒ T (c1 ) =  . (5.41)
0 0 1 0 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 1 0 0 0
   
1 0 0 0 0 0 0 1 0 0 0 0

Offensichtlich ist Spur jeder dieser Permutationsmatrizen gleich der Anzahl Fixelemente.

e e
Ausreduktion: Der Unterraum aufgespannt durch 1 + . . . + 6 ist invariant unter Dre-
hungen und Spiegelungen. Die Darstellung auf diesem eindimensionalen Unterraum ist die
Einsdarstellung T11 . Der Vektor x e e e e e
= 1 − 2 + 3 − 4 + 5 − 6 geht unter a und un- e
x
ter b1 in − über. Also definiert x
einen zweiten invarianten Teilraum mit Darstellung
T (a) = T (b1 ) = −1 und dieser trägt eine eindimensionale Darstellung T12 .

Seien nun
y = 2e1 + e2 − e3 − 2e4 − e5 + e6 und z = e1 + 2e2 + e3 − e4 − 2e5 − e6 .
Dann gilt:
y → y − z , z → −y T (b1) : y → y , z → y − z .
T (a) :
Also ist der von y und z aufgespannte Unterraum invariant und trägt eine 2-dimensionale
1
Darstellung T2 . Diese ist äquivalent zur Darstellung die man erhält, wenn man die Deckbe-
wegungen in einem elementaren Koordinatensystem beschreibt.

5.5 Lemma von Schur

Das Lemma von Schur: Es seien T1 , T2 zwei irreduzible Darstellungen einer Gruppe G
vorgegeben. Die entsprechenden Darstellungsmatrizen T1 (g) und T2 (g) wirken in den Vek-
torräumen V1 und V2 der Dimensionen n1 und n2 . Es sei weiterhin
H : V1 −→ V2
eine lineare Abbildung, so daß gilt

HT1 (g) = T2 (g)H, ∀g ∈ G. (5.42)

Dann ist entweder:

1. H = 0 oder (im ausschließenden Sinn)


2. n1 = n2 , H nicht singulär und T2 (g) = HT1 (g)H −1 für alle g ∈ G. Mit anderen Wor-
ten: die Darstellungen T1 und T2 sind zueinander äquivalent und H ist die vermittelnde
Koordinatentransformation.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 81

Die beim Schurschen Lemmas vorliegende Situation ist in der folgenden Abbildung skiz-
ziert.

H
V1 V2

T1 (g) T2 (g)
H
V1 V2

Abbildung 5.4: HT1 (g) und T2 (g)H sollen dieselbe Abbildung sein.

Beweis des Lemmas von Schur: Es sei H(V1 ) ⊂ V2 das Bild von V1 unter H. Nach Voraus-
setzung gilt:

T2 H(V1 ) = HT1 (V1 ) = H(V1 ),

da die irreduzible Darstellung T1 keinen echten invarianten Teilraum von V1 hat. Also ist
H(V1 ) ⊂ V2 ein invarianter Teilraum unter T2 . Da T2 nach Voraussetzung irreduzibel ist,
existieren keine echten invarianten Teilräume von V2 . Es folgt also

1. 1. Alternative: Es ist H(V1 ) = 0. Dies führt zur ersten Behauptung des Lemmas.
2. 2. Alternative: Es ist H(V1 ) = V2 . Dann muß die Dimension von V1 mindestens so groß
wie diejenige von V2 sein, n1 ≥ n2 . Wir führen den Kern der Abbildung H ein. Nach
Voraussetzung gilt offenbar
 
HT1 Kern(H) = T2 H Kern(H) = ∅.

Also bilden die T1 den Kern von H in sich ab, und Kern(H) ist ein invarianter Teilraum
von T1 . Da T1 irreduzibel ist, ist entweder Kern(H) = V1 oder Kern(H) = 0. Den ersten
Fall haben wir schon abgehandelt und es verbleibt Kern(H) = 0. Daraus folgt n2 ≥ n1 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 82

Wir schließen, daß H eine reguläre quadratische Matrix sein muß. Damit gilt wegen
der Voraussetzung des Lemmas:

HT1 (g)H −1 = T2 (g), ∀g ∈ G.

Beachte, daß das Schursche Lemma für reelle und komplexe Darstellungsräume V1 , V2
gilt.

Wir wollen zwei für die Physik wichtige Schlussfolgerungen aus diesem Lemma ziehen.

Korollar: Es sei T eine irreduzible Darstellung einer Gruppe G auf eine Vektorraum V . Der
lineare Operator H vertausche mit allen darstellenden Matrizen: HT (g) = T (g)H, ∀g ∈ G.
Dann ist die Matrix H ein Vielfaches der Identität.

Beweis: Sei λ ein Eigenwert von H (eine Nullstelle des charakteristischen Polynoms von
H). Mit H vertauscht auch H − λ mit den T (g). Da det(H − λ) = 0 ist, kommt nur die 1.
Alternative im Lemma von Schur zum Zug: Also ist H − λ = 0 und damit H = λ.

Korollar: Es sei T eine Darstellung von G auf dem n-dimensionalen Vektorraum V . Die
Darstellung zerfalle in lauter irreduzible, paarweise inäquivalente Darstellungen,

T = T1 + T2 + . . . + Tm .

Die Matrix H : V → V einer linearen Abbildung vertausche mit allen T (g):

[H, T (g)] = 0, ∀g ∈ G.

Dann sind die zu den irreduziblen Darstellungen gehörenden invarianten Teilräume Ei-
genräume des linearen Operators H.

Beweis für m = 2 des Korollars: In einem geeigneten Koordinatensystem haben die T (g)
die Gestalt
 
T1 (g) 0
T (g) = .
0 T2 (g)

In Anlehnung schreiben wir H in Blockmatrix-Form


 
H1 Q 1
H= .
Q 2 H2

Nach Voraussetzung gilt


   
T 1 H1 T 1 Q1 H1 T 1 Q1 T 2
=
T 2 Q2 T 2 H2 Q2 T 1 H2 T 2

also insbesondere

[T1 (g), H1 ] = 0 und [T2 (g), H2 ] = 0.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 83

Nach dem vorherigen Korollar müssen damit H1 und H2 auf den Darstellungsräumen V1
und V2 der irreduziblen Darstellungen T1 und T2 proportional zur Identität sein:

Hi = λi auf Vi , i = 1, 2

Anderseits gilt

T1 (g)Q1 = Q1 T2 (g) und T2 (g)Q2 = Q2 T1 (g), ∀g ∈ G.

Da die beiden Darstellungen als inäquivalent vorausgesetzt wurden, kann die 2. Alternativen
des Schurschen Lemmas nicht eintreten. Somit folgt Q1 = Q2 = 0. Also sind die beiden
Darstellungsräume V1 und V2 Eigenräume von H mit Eigenwerten λ1 und λ2 .

5.5.1 Orthogonalitätsrelationen

Sei G eine Gruppe mit Mittelbildung. Die komplexwertigen Funktionen {f : G → C } bilden


einen linearen Raum und die Mittelbildung definiert ein Skalarprodukt auf diesem Raum,

(f1 , f2 ) = M f¯1 · f2 .

(5.43)

Für jede endliche Gruppe G definiert dies einen endlich-dimensionalen Vektorraum mit
Skalarprodukt. Ist {g1 , . . . , gh } eine Liste aller Elemente von G, dann bilden zum Beispiel
die Funktionen {f1 , . . . , fh }, definiert durch


|G|1/2 für g = gi
fi (g) = (5.44)
0 6 gi
für g =

eine orthonormierte Basis des Vektorraums. Für kontinuierliche Lie-Gruppen stellt sich die
Frage nach der Vollständigkeit des Funktionenraums. Das Skalarprodukt

Z
(f1 , f2 ) = dµ(g)f¯1 (g)f (g) (5.45)
G

definiert eine Norm und damit einen Abstandsbegriff auf dem betrachteten Funktionenraum.
Nun vervollständigt man diesen Raum bezüglich der von der Norm definierten Metrik. Dieser
Raum heisst L2 (G, dµ) und spielt in der Quantenmechnik eine herausragende Rolle. Jede
Cauchy-Folge in L2 (G, dµ) konvergiert gegen eine Funktion in L2 (G, dµ). Im Folgenden
werden über die Theorie der Charakteren eine orthonormierte Basis der Klassenfunktionen
in L2 (G, dµ) konsturieren.

Es seien Ti : g → Ti (g), i = 1, 2 zwei irreduzible Darstellungen der Dimensionen ni und


U : V1 → V2 eine Rechteck-Matrix so, daß T2 U T1−1 definiert ist. Wir betrachten die Matrix

H = M T2 (g)U T1−1 (g) .




————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 84

Dabei ist unter der Mittelbildung von Matrizen das Mitteln über die einzelnen Matrixele-
mente zu verstehen. Diese definieren komplexwertige Funktionen

g −→ T2 (g)U T1−1 (g) pj .




Weiter sei

T̃1 = T1 (g̃) und T̃2 = T2 (g̃)

wobei g̃ ∈ G ein festes Element ist, zwei darstellende Matrizen. Wegen der Invarianz des
Mittelwertes folgt:
   
H T̃1 = M T2 (g)U T1−1 (g)T̃1 = T̃2 M T̃2−1 T2 (g)U T1−1 (g)T̃1
= T̃2 M T2 (g̃ −1 g)U T1−1 (g̃ −1 g) = T̃2 M T2 (g)U T1−1 (g) .
 

Also haben wir

HT1 (g̃) = T2 (g̃)H, ∀g̃ ∈ G.

Damit kann das Lemma von Schur anwendet werden:

1. Alternative: T1 und T2 sind nicht äquivalent.

In diesem Fall ist H = 0 und damit


 
X
M T2 (g)pq Uqi T1−1 (g)ij  = 0.
qi

Wir wählen für U speziell eine Rechtecksmatrix, die nur an der Stelle (q, i) eine 1 enthält
und sonst Nullen. Für dieses U folgt

M T2 (g)pq T1 (g)−1

ij = 0 (keine Summe).

Jetzt wählen wir noch p = q, i = j und summieren über p und i. Dann ergibt sich

M Sp T2 Sp T1−1 = 0.


Da (für unitäre T ) Sp T −1 = Sp T̄ ist, folgt schließlich

(χT1 , χT2 ) = M (χ̄T1 χT2 ) = 0, T1 , T2 inäquivalent und irreduzibel. (5.46)

Wir haben wir den folgenden wichtigen

Satz: Die Charaktere χT1 und χT2 von 2 inäquivalenten irreduziblen Darstellungen einer
Gruppe mit invarianter Mittelbildung sind unitär orthogonal bezüglich der Mittelbildung.

2. Alternative: Die beiden n-dimensionalen Darstellungen T1 und T2 sind äquivalent.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 85

Nach Wahl eines angepassten Koordinatensystems ist T1 = T2 = T . Somit ist T (g̃)H =


HT (g̃) für alle g̃ ∈ G und nach obigem Korollar ist H = λ1. Wegen

Sp H = nλ = Sp M T U T −1 = M Sp [T U T −1] = Sp U,
 

wobei wir M(1) = 1 benutzen, ist nλ = Sp U und damit

 
X
−1  Sp U
Hiq = M  Tij Ujp Tpq = δiq . (5.47)
jp
n

Die Elemente der quadratische Matrix U sollen nun alle verschwinden, bis auf Ujp = 1. Für
diesen Spezialfall folgt:

−1
 Sp U 1
Hiq = M Tij Tpq = δiq = δjp δiq .
n n
Nun setzen wir i = j, p = q und summieren über i und p. Dies führt zum

Satz: Der Charakter jeder irreduziblen Darstellung einer


 Gruppe mit invarianter Mittelbil-
dung hat die Norm 1 bezüglich Mittelbildung, M χ̄T χT = (χT , χT ) = 1.

Offensichtlich sind die Charakteren orthonormale Elemente im Raum der Klassenfunktionen


in L2 (G, dµ).

Es sei T eine beliebige Darstellung der Gruppe G mit Mittelbildung, d.h. sie kann als Summe
von irreduziblen Darstellungen geschrieben werden,

m
X
T = ci T i . (5.48)
i=1

Zueinander äquivalente Darstellungen können als gleich betrachtet werden. 2T2 bedeutet
dann, daß die irreduzible Darstellung T2 in der Zerlegung von T zweimal vorkommt. Die
T1 , . . . , Tm sei ein Liste aller möglichen irreduziblen Darstellung der betreffenden Gruppe.
Offensichtlich ist

χT (g) = c1 χT1 (g) + . . . + cm χTm (g). (5.49)

Nun gilt

(χTi , χT ) = M (χ̄Ti · χT ) = ci (5.50)

und wir haben das folgende Resultat gewonnen:

Satz [Ausreduktionsformel]: Die irreduziblen Darstellung Ti tritt in einerP Darstellung T


einer Gruppe mit Mittelbildung genau ci = (χi , χT )-mal auf und (χT , χT ) = |ci |2 .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.5. Lemma von Schur 86

Wir wollen noch zwei Schlussfolgerungen ziehen:

Satz: Zwei beliebige Darstellungen einer Gruppe mit Mittelbildung sind genau dann äquiva-
lent, wenn ihre Charaktere gleich sind.

Sind zwei Darstellungen äquivalent, dann haben sie offensichtlich den gleichen Charakter.
Die Umkehrung ist etwas schwieriger zu beweisen. Dazu brauchen wir das folgende

Lemma: Aus den Spuren der Matrizen einer Darstellung lassen sich die charakteristischen
Polynome dieser Matrizen berechnen.

Seien λ1 , . . . , λn die Eigenwerte der darstellenden Matrix T = T (g). Jeder Eigenwert sei so oft
aufgeführt, wie seine algebraische Vielfachheit beträgt. Für das charakteristische Polynom
gilt:

deg(λ − T ) = (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) = λn − s1 λn−1 + . . . + (−)n sn

wobei die Koeffizienten die folgenden elementarsymmetrischen Funktionen der Eigenwerte


sind:
X X
s1 = λj , s2 = λi λj
i6=j
X
s3 = λi λj λk , . . . , sn = λ1 λ2 · · · λn .
i6=j6=k

Anderseits sind mit T auch T 2 = T (g 2 ), . . . , T n = T (g n ) darstellende Matrizen. Die Spuren


sind durch folgende Potenzsummen gegeben:
X p
σp = Sp T p = λi .
i

Mit Hilfe der Newtonschen Formeln kann gezeigt werden, daß jedes symmetrische Polynom
eindeutig als Polynom von Potenzsummen dargestellt werden kann. In unserem Fall ist
1 2  1 3 
s1 = σ1 , s2 = σ − σ2 , s3 = σ − 3σ1 σ2 + 2σ3 , . . .
2 1 2 1
Wir sehen also: Haben zwei Darstellungen T1 und T2 dieselben Charakteren, d.h. dieselben
σp , dann haben die darstellenden Matrizen T1 (g) und T2 (g) identische charakteristische
Polynome für alle g ∈ G. Dann sind diese ähnlich und damit sind T1 und T2 äquivalente
Darstellungen.

Lemma: Jede irreduzible Darstellung T : g → T (g) einer Abelschen Gruppe hat die Di-
mension 1.

Sei T̃ = T (g̃) eine beliebige, aber feste Matrix der Darstellung T . Da G Abelsch ist, gilt:
T (g)T̃ = T̃ T (g) für alle g ∈ G. Nach obigem Korollar muß also T̃ = λ1 sein. Somit sind alle
darstellenden Matrizen diagonal. Dann kann die Darstellung nur irreduzibel sein, wenn sie
die Dimension 1 hat.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.6. Alle Darstellungen einer endlichen Gruppe 87

5.6 Alle Darstellungen einer endlichen Gruppe

Wir wollen zuerst einmal untersuchen, wie viele inäquivalente irreduzible Darstellungen eine
endliche Gruppe haben kann. Wir erinnern uns daran, daß die Charakteren Klassenfunktio-
nen, d.h. auf den Ähnlichkeitsklassen von G konstant sind. Offensichtlich kann es höchstens
so viele Charaktere geben wie die Gruppe Klassen hat. Wir werden sehen, daß die Anzahl
inäquivalente irreduzible Charaktere genau mit der Anzahl Klassen übereinstimmt. Dazu
die führen wir die sogenannte reguläre Darstellung der endlichen Gruppe G ein.

Die reguläre Darstellung einer Gruppe der Ordnung h erhält man, indem jedem Gruppen-
h
element auf 1 − 1-deutige Art ein Grundvektor in R zugewiesen wird. Jedem g ordnet
man eine h × h-Matrix Treg (g) zu, die diese Grundvektoren gemäß Multiplikationstabelle
permutieren.

Bei Multiplikation der Gruppenelemente mit g̃ 6= e bleibt kein Element fest:

g̃g 6= g ∀g ∈ G.

Somit gilt für den Charakter der regulären Darstellung

h ≡ |G| falls g = e
n
χreg (g) = (5.51)
0 sonst.
Zurück zur Diedergruppe D6 : Die reguläre Darstellung der Diedergruppe D6 liefert für
die erzeugenden Elemente

0 0 0 0 0 1 0 0 0 0 0 0
 
1 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0
 
0 0 1 0 0 0 0 0 0 0 0 0
 
0 0 0 1 0 0 0 0 0 0 0 0
 
0 0 0 0 1 0 0 0 0 0 0 0
 
Treg (a) = 
0 0 0 0 0 0 0 0 0 0 0 1

0 0 0 0 0 0 0 0 0 1 0 0
 
0 0 0 0 0 0 0 0 0 0 1 0
 
0 0 0 0 0 0 1 0 0 0 0 0
 
0 0 0 0 0 0 0 1 0 0 0 0
 
0 0 0 0 0 0 0 0 1 0 0 0

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.6. Alle Darstellungen einer endlichen Gruppe 88

und
0 0 0 0 0 0 1 0 0 0 0 0
 
0 0 0 0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 1 0 0 0
 
0 0 0 0 0 0 0 0 0 0 1 0
 
0 0 0 0 0 0 0 1 0 0 0 0
 
0 0 0 0 0 0 0 0 0 1 0 0
 
Treg (b1 ) = 
1 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 1 0 0 0 0 0 0 0
 
0 0 1 0 0 0 0 0 0 0 0 0
 
0 0 0 0 0 1 0 0 0 0 0 0
 
0 0 0 1 0 0 0 0 0 0 0 0
 
0 1 0 0 0 0 0 0 0 0 0 0
2
Man sieht sofort, daß Treg (b1 ) = 1 ist, wie von der Darstellungseigenschaft gefordert.

Was sind nun die irreduziblen Darstellungen. Wie immer gibt es die eindimensionale Eins-
darstellung T11 die jedem Gruppenelement eine 1 zuordnet und die alternierende Darstellung,
die den Drehungen eine 1 und den Spiegelungen eine −1 zuordnet. Sei nun χj der Charakter
einer beliebigen irreduziblen Darstellung von G der Dimension nj . Wegen (5.51) ergibt die
Ausreduktionsformel für die Vielfachheit cj , mit der Tj in Treg auftritt:

1X 1
cj = (χ̄j , χreg ) = χ̄j (g) · χreg (g) = χ̄j (e) · χreg (e).
h h
g∈G

Mit χj (e) = nj und χreg (e) = h ergibt sich der

Satz: Jede irreduzible Darstellung Tj der Dimension nj kommt in der regulären Darstellung
Treg genau nj mal vor:
k
X X
Treg = nj Tj =⇒ h = |G| = n2j . (5.52)
j=1

Angewandt auf D6 ,
k
X k
X k
X
12 = n2j = 12 + 12 + 22 + n2j = 6 + n2j ,
1 4 4

wobei wir benutzten, daß D6 mindestens zwei eindimensionale Darstellungen und eine zwei-
dimensionale Darstellung hat. Damit kann D6 zusätzlich zu diesen bekannte Darstellungen
nur entweder 6 zusätzliche eindimensionale, oder eine zweidimensionale und 2 eindimen-
sionale irreduzible Darstellungen haben. Wir werden schlussendlich noch zeigen, daß das
Letztere der Fall ist.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.7. Die Charakterenmatrix 89

5.7 Die Charakterenmatrix

Es sei G eine beliebige endliche Gruppe der Ordnung h. G habe k Ähnlichkeitsklassen. Wir
wollen die Ähnlichkeitsklassen der symmetrischen Gruppe Sn betrachten, da jede endliche
Gruppe der Ordnung n isomorph zu einer echten Untergruppe der symmetrischen Gruppe
Sn ist. Es ist zweckmäßig, die Zyklenschreibweise für Permutationen einzuführen. Beispiel
 
1 2 3 4 5 6
S6 ∋ g = ∼ (1 4 6)(3 5)(2).
4 2 5 6 3 1

Man ordnet die Zyklen nach abnehmender Länge an. Offensichtlich ist jede Permutation ein
Produkt von elementfremden Zyklen und die Zerlegung einer Permutation in Zyklen ist, bis
auf die Reihenfolge gleich langer Zyklen, eindeutig.

Zwei Permutationen von n Objekten heißen vom gleichen Typus, wenn in beiden Permuta-
tionen Zyklen der Länge l genau gleich oft auftreten. Zum Beispiel die Elemente

(1 3 8)(4 5)(2 6)(7) und (1 4 6)(3 5)(7 8)(2) (5.53)

aus S8 sind vom gleichen Typus. Für jede Permutation g aus Sn sei nun αj , j = 1, 2, . . . , n
die Anzahl Zyklen der Länge j in der Zerlegung von g in Zyklen. Für die Permutationen in
(5.53)

α1 = 1, α2 = 2, α3 = 1, α4 = α5 = . . . = α8 = 0.

Ohne Beweis notieren wir den

Satz: Die Anzahl Permutationen vom Typus (α1 , α2 , . . . , αn ) ist


n!
n .
Q
αj ! · j αj (5.54)
1

Beispiel: die Klassentabelle von S4 ist


Nr. Partitionen Typus Anz.Zykl. Anz.Perm.
α4 α3 α2 α1
1) 4=4 (....) 1 0 0 0 6
2) 4=3+1 (...)(.) 0 1 0 1 8
3) 4=2+2 (..)(..) 0 0 2 0 3
4) 4=2+1+1 (..)(.)(.) 0 0 1 2 6
5) 4=1+1+1+1 (.)(.)(.)(.) 0 0 0 4 1

Es sei nun

g = (1 4 6)(3 5)(2) und a = (1 3 5 2 6)(4)


−1
⇒a = (3 1 6 2 5)(4).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.7. Die Charakterenmatrix 90

Nun wollen wir aga−1 bestimmen:


ga−1 = ( 3 4 6 2)(5)(1), aga−1 = ( 3 4 1)(2 5)(6).
Also ist aga−1 vom selben Typus wie g. Allgemein gilt

Satz: Zwei Permutationen g, g̃ der symmetrischen Gruppe Sn sind genau dann zueinander
ähnlich, g̃ = aga−1 , wenn sie vom gleichen Typus sind. Damit haben alle Permutationen
vom selben Typus denselben Charakter. Die Anzahl Ähnlichkeitsklassen ist gleich der Anzahl
der geordneten Partitionen von n.

Aus der Charakterentabelle


Klassen (1) (2) ... ... (k)
Ordnung d.Kl. h1 h2 ... ... hk
χ1 1 1 ... ... 1
χ2 χ2 (1) χ2 (2) ... ... χ2 (k)
.. .. .. ..
. . . ... ... .
χj χj (1) χj (2) ... ... χj (k)

können wir die sogenannte Charakterenmatrix konstruieren


Klassen (1) (2) ... ... (k)
Ordnung d.Kl. h1 h2 ... ... hk
q q q
h1 h2 hk
χ1 h ·1 h ·1 ... ... h 1
q q q
h1 h2 hk
χ2 h · χ2 (1) h · χ2 (2) ... ... h · χ2 (k)
.. .. .. ..
. .q .q ... ... .q
h1 h2 hk
χj h · χj (1) h · χj (2) ... ... h · χj (k)

Die Faktoren wurden gerade so eingeführt, daß die Zeilen der Charakterenmatrix unitär-
orthogonal zueinander sind:
k
1X
hℓ χ̄p (ℓ) · χq (ℓ) = (χp , χq ) = δpq .
h
ℓ=1

Aus dieser Tatsache folgt, daß die Anzahl zueinander inäquivalenter irreduzibler Darstellun-
gen j kleiner gleich der Anzahl k von Äquivalenzklassen sein muß.

Nun kann man mit ähnlichen Methoden wie oben noch beweisen, daß
j
X
χ̄p (g)χp (g̃) = 0
p=1

falls g und g̃ zu verschiedenen Ähnlichkeitsklassen gehören. Damit sind auch die Kolonnen
der Charakterenmatrix unitär-orthogonal zueinander und die Matrix ist quadratisch und
unitär. Damit haben wir den wichtigen

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 91

Satz: Es gibt genau so viele irreduzible Darstellungen einer endlichen Gruppe, wie es Äqui-
valenzklassen gibt. Jede Klassenfunktion ist eine Linearkombination der orthonormierten
Charakteren.

Beispiel: S4 hat 5 Äquivalenzklassen und damit 5 irreduzible Darstellungen. Wegen


5
X
n2i = 24
i=1

und der Existenz der Eins- und alternierenden Darstellung, ist nur

(n1 , n2 , n3 , n4 , n5 ) = (1, 1, 2, 3, 3)

möglich. Es gibt also neben den zwei eindimensionalen noch eine zweidimensionale und zwei
dreidimensionale irreduzible Darstellung.

Die Diedergruppe D6 hat 12 Elemente und 6 Ähnlichkeitsklassen. Also gibt es 4 eindimen-


sionale und 2 zweidimensionale irreduzible Darstellungen.

Für jede Abelsche Gruppe ist aga−1 = g und damit gibt es so viele Klassen wie die Gruppe
Elemente hat. Wegen
j
X
h= n2i und j = h,
i=1

müssen alle ni = 1 sein. Wir sehen (wie schon früher), daß alle Darstellungen einer Abelschen
Gruppe eindimensional sein müssen.

5.8 Die Charakteren von kompakten Lie-Gruppen

In den wenigen verbleibenden Stunden wollen wir die wichtigsten gruppentheoretischen


Werkzeuge bereitstellen die für ein Verständnis von kontinuierlichen Symmetrien in der
Physik notwendig sind. Wir beginnen mit der einfachsten kompakten Lie-Gruppe.

5.8.1 Die Charakter von U(1):

Diese Gruppe ist Abelsch, und wegen aga−1 = g bildet jedes Element eine Äquivalenzklasse.
Daher sind alle Funktionen f : U (1) → C , d.h. 2π-periodische Funktionen f (t) = f (g(t)),
automatisch Klassenfunktionen.

Alle irreduziblen Darstellungen sind eindimensional und in einer adaptierten Basis unitär.
Also hat jede Darstellung die Form

T (g(t)) = eih(t) , g(t) = et , h(t) ∈ R ,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 92

und die Darstellungseigenschaft impliziert


eih(0) = eih(2π) = 1 und eih(t1 +t2 ) = ei(h(t1 )+h(t2 )) .
Also ist h(t) ein lineare Funktion mit h(t + 2π) = h(t) + n. Damit haben die irreduziblen
Darstellungen die Form

Tn : eit −→ T (eit ) = eint , n = 0, ±1, ±2, . . . . (5.55)

Da Sp (T (g(t)) = T (g(t)) = exp(int) sind die Charakteren der irreduziblen Darstellungen


der Gruppe U (1)

χn (t) = χTn (t) = eint . (5.56)

Diese sind in der Tat unitär-orthogonal bezüglich der Mittelbildung,

1
Z
(χn , χm ) = dt e−int eimt = δnm , (5.57)

wie es nach der allgemeinen Theorie über die Charakteren von Gruppen mit Mittelbildung
sein muß. Jede Klassenfunktion f (t), d.h. 2π-periodische Funktion, kann nach der Theorie
der Fourier-Reihen nach ebenen Wellen entwickelt werden. Also haben wir genau dieselbe
Situation wie für endliche Gruppen: Jede Klassenfunktion f (t) kann als Linearkombination
der unitär-orthogonalen Charakteren geschrieben werden,

1
X Z
f (t) = cn χn (t), cn = e−int f (t) = (χj , f ) . (5.58)
n

Die Fourier-Analyse ist also ein Spezialfall der Theorie der Charakteren. In der Tat, es
gilt der folgende

Satz von Peter und Weyl: Zu jeder kontinuierlichen Gruppe G mit Mittelbildung existie-
ren unendlich viele Charaktere, welche ein vollständiges orthogonales Funktionensystem auf
den Klassenfunktionen in L2 (G) bilden.

Es gibt noch eine allgemeinere Version des Theorems von Peter und Weyl. Danach bilden
die Matrixelemente aller irreduziblen Darstellungen einer kontinuierlichen Gruppe mit Mit-
telbildung eine othogonale Basis im Hilbert-Raum L2 (G, dµ). Im Folgenden werden wir ein
vollständiges und orthonormiertes System von Klassenfunktionen für SU (2) konstruieren.

5.8.2 Die Charakter von SU(2)

In diesem Abschnitt konstruieren wir alle Charakteren der quantenmechanischen Drehgrup-


pe. Der Charakter der Einsdarstellung T0 und der zweidimensionalen definierenden Darstel-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 93

lung T 21 in (5.17) sind

χ0 (θ) = 1 und χ 12 (θ) = 2 cos θ = eiθ + e−iθ . (5.59)

Dies sind die einzigen ein- und zweidimensionalen Darstellungen von SU (2) (siehe unten).
Mit den Integrationsformeln

π π
Z Z Z
sin2 θ = , sin2 θ cos2 θ = und sin2 θ cos θ = 0, (5.60)
2 8
wobei jeweils von θ = 0 bis π integriert wird, findet man für deren Skalarprodukte

(χ0 , χ0 ) = (χ 21 , χ 12 ) = 1 und (χ0 , χ 12 ) = 0, (5.61)

in Einklang mit der allgemeinen Theorie. Wir erinnern an das Skalarprodukt für zwei Klas-
senfunktionen auf SU (2),

2
Z
(f1 , f2 ) = dθ sin2 θ f¯1 (θ)f2 (θ). (5.62)
π
Um die nächste irreduzible Darstellung zu gewinnen, betrachten wir die 4-dimensionale
Tensorprodukt-Darstellung
T 12 × T 21 mit χ 21 × 12 (θ) = χ 12 (θ) · χ 12 (θ) = e2iθ + 2 + e−2iθ .
Offensichtlich ist
   
χ0 , χ 21 × 12 = 1 und χ 12 , χ 21 × 12 = 0,
so daß das Tensorprodukt die Einsdarstellung einmal enthält. Also gilt

T 21 × T 21 = T0 ⊕ T1 , χ1 (θ) = e2iθ + 1 + e−2iθ . (5.63)

Da (χ1 , χ1 ) = 1 ist, ist T1 eine 3-dimensionale irreduzible Darstellung Wie wir sehen werden
ist es eine wohlbekannte Matrixgruppe, nämlich die 3-dimensionale Drehgruppe SO(3). Um
dies einzusehen, schauen wir uns die Tensordarstellung T 21 × T 21 etwas genauer an. Unter T 12
x y x
gehen und in g und g über, so daß y
 2
x1 y1 a ab ba b2 x1 y1
   
 x1 y2   −ab̄ aā −bb̄ bā   x1 y2 
 −→  .
x2 y1 −b̄a −b̄b āa āb x2 y1
 
x2 y2 b̄2 −b̄ā −āb̄ ā2 x2 y2
Benutzen wir statt xi yy die symmetrische bzw. antisymmetrischen Kombinationen
 
1 1
Y00 = √ (x1 y2 − x2 y1 ) , (Y11 , Y10 , Y1−1 ) = x1 y1 , √ (x1 y2 − x2 y1 ), x2 y2
2 2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 94

dann findet man das folgende Transformationsverhalten

Y00 1 0 0 0 Y00
    

 Y11  0 a2
√ 2ab √b2   Y11 
 −→  . (5.64)
Y10 0 − 2ab̄ aā√− bb̄ 2bā Y10
 
Y1−1 0 b̄2 − 2āb̄ ā2 Y1−1

Der eindimensionale invariante Unterraum wird also von der antisymmetrischen Kombinati-
on Y00 aufgespannt und der dreidimensionale von den symmetrischen Kombinationen Y1m .
Setzen wir schlussendlich noch

 
1 1
(X1 , X2 , X3 ) = √ (Y11 − Y1−1 ), √ (Y11 + Y1−1 ), Y10 , (5.65)
2 i 2
dann sieht die dreidimensionale Darstellung folgendermaßen aus

X −→ (e , X )e + e ∧ X sin 2θ − e ∧ (e ∧ X ) cos 2θ = R(2θ, e )X , (5.66)

wobei θ der Winkel in der Parametrisierung (5.17) und


 
sin ψ cos(π + ϕ)
e
=  sin ψ sin(π + ϕ) 
cos ψ
ein Einheitsvektor ist. Dies ist gerade eine Drehung von X e
um die Achse mit Winkel 2θ.
3 3
Die Matrixelemente von R sind reell und damit kann R als Transformation auf R ⊂ C
angesehen werden. Damit ist g → R(g) ∈ SO(3) eine irreduzible Darstellung von SU (2)
3
durch 3-dimensionale Drehungen im R . Beachte, daß R(g) = R(−g), d.h. daß g → R(g)
keine treue Darstellung ist.

Nun kann man weiterfahren und T1 × T 21 mit Charakter

χ1× 12 = χ1 · χ 21 = e3iθ + 2eiθ + 2e−iθ + e−3iθ = χ 21 + χ 32

ausreduzieren. Offensichtlich enthält diese Tensordarstellung die Darstellung T 21 genau ein-


mal. Da (χ 32 , χ 32 ) = 1 ist, zerfällt T1 × T 21 in die irreduzible Darstellung T 12 und eine 4-
dimensionale irreduzible Darstellung T 23 . Ähnlich gewinnt man auch T2 , T 52 usf. Man findet
die Charakteren

j
X sin(2j + 1)θ 1 3
χj = e2inθ = , j = 0, , 1, , . . . . (5.67)
n=−j
sin θ 2 2

Wegen χj (e) = 2j + 1 ist

dim Tj = 2j + 1

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 5. Darstellungen 5.8. Die Charakteren von kompakten Lie-Gruppen 95

und mit der Integrationsformel


π
sin(2j + 1)θ sin(2j ′ + 1)θ dθ = δjj ′ (5.68)
2
0

sind diese Darstellungen irreduzibel und inäquivalent. Die halbganze Quantenzahl j charak-
terisiert in der Quantenmechanik den Spin. Da

lim χj (π − ǫ) = (2j + 1)(−)2j = (−)2j χ(0)


ǫ→0

sind die Darstellungen mit ganzzahligen Spin j untreu,

Tj (−e) = (−)2j 12j+1 . (5.69)

Jede Klassenfunktion f (θ) ∈ L2 (SU (2)) kann nach Peter und Weyl als Linearkombination
der Charakteren geschrieben werden

sin(2j + 1)θ 2
X Z
f (θ) = cj , cj = sin2 θ χj (θ)f (θ)dθ. (5.70)
j
sin θ π

Dass die Charakteren χj ein vollständiges Funktionensystem auf dem Hilbert-Raum

 
2
L2 [0, π], sin2 θdθ (5.71)
π

der Klassenfunktionen von SU (2) bilden, kann auch anderweitig eingesehen werden. Dies
zeigt dann posteriori, daß die Spin-j Darstellungen Tj alle irreduziblen Darstellungen von
SU (2) sind.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6

Lie-Algebren

Dieses Kapitel soll eine Einführung in die Theorie der Lie-Algebren und deren Darstellungen
geben. Beispiele von Lie-Algebren sind weitverbreitet. Das bekannteste Beispiel einer Lie-
Algebra ist wohl der Vektorraum R mit dem Vektorprodukt als Multiplikation: es gelten
3

die Identitäten

a ∧ a = 0 sowie (a ∧ b ) ∧ + (b ∧ ) ∧ a + ( ∧ a ) ∧ b = 0.
Sie kennen die Darstellungstheorie aus der Theorie des Drehimpulses in der Quantenmecha-
nik. Weiter sind Lie-Algebren bereits in der Mechanik anzutreffen: die Poisson-Klammer
in der Hamiltonschen Mechanik versieht den Raum der C ∞ -Phasenraumfunktionen mit
der Struktur einer Lie-Algebra (sogar einer Poisson-Algebra). Lie-Algebren treten in der
Physik meist als infinitesimale Symmetrieoperationen auf. Aus der Klassifikation dieser Dar-
stellungen kann man deshalb Strukturaussagen über die Lösungen der zugrundeliegenden
Dynamik machen. So sind zum Beispiel die Elementarteilchen Elemente der Multipletts von
Eichsymmetrie-Algebren.

Wir betrachten hier eine n-dimensionale Lie-Gruppe G und identifizieren den Tangential-
raum am Einselement e als Lie-Algebra der Gruppe. Es sei also U eine Koordinatenumge-
bung von e und α = (α1 , . . . , αn ) lokale Koordinaten in einer Karte von U . Das Einselement
sei durch die Wahl

g(α = 0) = e (6.1) {lieal2}

ausgezeichnet. Man kann nun um g = e im Koordinatenraum entwickeln, also eine Taylor-


reihe für die Gruppenelemente in einer Umgebung des Einselement ansetzen,

93
Kapitel 6. Lie-Algebren 6.1. Die Lie-Algebra su(2) 94

n
X ∂g(α)
g(α) = g(0) + αi + O(α2 ). (6.2) {lieal4}
∂αi α=0

i=1

Die ersten Ableitungen beschreiben die Struktur der Gruppe nahe der Einheit. Man definiert
mit ihrer Hilfe die Generatoren oder infinitesimalen Erzeugenden der Lie-Gruppe,

∂g(α)
Xi ≡ , so dass g(α) = e + αi Xi + O(α2 ). (6.3) {lieal6}
∂αi α=0

Zum Beispiel ist die Erzeugende X1 tangential zur Koordinatenkurve g(α1 , 0, . . . , 0) durch
die Gruppen-Eins. Ist nun α(t) eine Kurve mit α(0) = 0 in der gewählten Karte, dann
beschreibt g(α(t)) ≡ g(t) eine Kurve auf der Gruppe mit g(0) = e und es gilt

dg(t) ∂g(α)
X= = α̇i (0) = Xi α̇i (0). (6.4) {lieal8}
dt 0 ∂αi α=0

Wählt man für α(t) die i’te Koordinatenlinie, dann ist X = Xi . Also sind die infinitesimalen
Erzeugenden tangential an den Kurven durch e an der Stelle e und die Menge aller Erzeugen-
den ist gleich dem Tangentialraum Te (G) an der Gruppen-Eins. Die Anzahl unabhängiger
Generatoren ist gleich der Zahl der unabhängigen reellen Parameter der Lie-Gruppe, also
gleich ihrer Dimension. Die Generatoren einer Matrixgruppe sind ebenfalls Matrizen.

6.1 Die Lie-Algebra su(2)

Zur Einstimmung betrachten wir die nicht-Abelsche Lie-Gruppe SU (2). Es seien also g(t)
2-dimensionale Matrizen mit g(t)g † (t) = 12 . Die Ableitung dieser Bedingung nach t an der
Stelle t = 0 führt auf folgende Bedingung an die Generatoren X = ġ(0):

ġ(0) g † (0) + g(0)ġ † (0) = X + X † = 0.

Deshalb sind die Erzeugenden der unitären Gruppe 2-dimensionale antihermiteschen Matri-
zen. Die Elemente aus SU (2) haben zusätzlich die Eigenschaft det g(t) = 1. Es ergibt sich
mit Hilfe der bekannten Formel

d
log det g = Sp g −1 ġ

(6.5) {lieal10}
dt
deshalb die Zusatzbedingung Sp X = 0. Die Menge der Generatoren von SU (2) wird mit
su(2) bezeichnet,

su(2) = {X ∈ Mat(2, C )|X = −X † , Sp X = 0}. (6.6) {lieal12}

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.1. Die Lie-Algebra su(2) 95

Sie bildet offensichtlich einen linearen Raum. Neben jeder Linearkombination ist aber auch
der Kommutator zweier Elemente aus su(2) wieder in su(2), wie man leicht beweist:

[X1 , X2 ]† = X2 X1 − X1 X2 = −[X1 , X2 ]
Sp [X1 , X2 ] = Sp (X1 X2 ) − Sp (X2 X1 ) = 0.

Die erzeugenden Elemente bilden eine Lie-Algebra:

Definition [Lie-Algebra]: Eine Lie-Algebra g ist ein K-Vektorraum versehen mit einer
bilinearen Abbildung ( Lie-Klammer)

[ , ] : g × g −→ g

mit den beiden Eigenschaften:

1. [X, X] = 0 für alle X ∈ g (d.h. die Klammer ist alternierend),


2. [X, [Y, Z]] + [X, [Y, Z]] + [X, [Y, Z]] = 0 für alle X, Y, Z ∈ g ( Jacobi-Identität).

Aus der ersten Eigenschaft folgt, dass die Lie-Klammer antisymmetrisch ist,

0 = [X + Y, X + Y ] = [X, Y ] + [Y, X] =⇒ [X, Y ] = −[Y, X]. (6.7) {lieal14}

Führen wir ein Basis X1 , . . . , Xn im n-dimensionalen Vektorraum g ein, dann ist der Kom-
mutator zweier Basiselemente eine Linearkombination der Basiselemente,

[Xi , Xj ] = fijk Xk . (6.8) {lieal15}

Die Konstanten fijk = −fjik heissen Strukturkonstanten der Lie-Algebra g.

Wir kehren zu SU (2) zurück. Jedes Element der Lie-Algebra su(2) ist eine Linearkombina-
tion der drei spurlosen und hermiteschen Pauli-Matrizen,

v ∈R .
3
X ∈ su(2) ⇐⇒ X = iv σ,

Mit (v σ)2 = v 2 1, wobei v den Betrag von v bezeichnet, folgt

exp(X) = exp(iv σ) = cos v σ0 + i sin v v̂ σ. (6.9) {lieal16}

Setzen wir in dieser Formel

cos v + iv̂3 sin v = a und sin v (iv̂1 − v̂2 ) = b,

dann ist exp(X) genau die SU (2)-Matrix in (4.1). Die Bedingung |a|2 + |b|2 = 1 ist für
unsere Parametrisierung automatisch erfüllt. Also kann jede SU (2)-Matrix als Exponent
einer anti-hermiteschen und spurlosen Matrix geschrieben werden,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.2. Lie-Algebren von Lie-Gruppen 96

X ∈ su(2) =⇒ g = exp(X) ∈ SU (2) (6.10) {lieal18}

Im gewissen Sinn gilt auch die Umkehrung: Mit X liegt auch tX im linearen Raum su(2) und
g(t) = exp(tX) ist eine einparametrige Kurve auf der Gruppe mit g(0) = e. Die Ableitung
nach t an der Stelle 0 liegt dann in der Lie-Algebra

dg(t)
g = exp(tX) ∈ su(2) =⇒ X = ∈ su(2). (6.11) {lieal20}
dt t=0
Für die quantenmechanische Drehgruppe besteht also ein einfacher Zusammenhang zwischen
Lie-Gruppe und Lie-Algebra. Dies gilt auch für allgemeinere Lie-Gruppen und dies wollen
wir im folgenden Abschnitt einsehen.

6.2 Lie-Algebren von Lie-Gruppen

Wir zeigen nun, dass die infinitesimalen Erzeugenden

d
X= g(t) t=0 = ġ(0), g(0) = e, (6.12) {lieal24}
dt
eine Lie-Algebra bilden. Dazu betrachten wir zwei Kurven g1 (t) und g2 (t) die für t =
0 durch e gehen und an dieser Stelle die Tangentialvektoren X1 und X2 besitzen. Dann
ist auch g(α1 t)g(α2 t) eine derartige Kurve für beliebige reelle Konstanten α1 und α2 mit
Tangentialvektor
d
(g1 (α1 t)g2 (α2 t)) t=0 = α1 X1 + α2 X2
dt
und die infinitesimalen Erzeugenden bilden einen linearen Raum g. Wegen
d
g1 g2 (t)g1−1 t=0 = g1 X2 g1−1

dt
ist für beliebige g ∈ G mit X auch gXg −1 in diesem Raum. Die Abbildung

Ad : g −→ g, Ad(g)X = gXg −1 (6.13) {lieal26}

ist ein Darstellung der Gruppe auf dem linearen Raum g, da für alle X ∈ g gilt

Ad (g1 g2 ) X = g1 g2 Xg2−1 g1−1 = g1 (Ad(g2 )X) g1−1 = Ad(g1 )Ad(g2 )X

und Ad(e)X = X. Diese Darstellung existiert für jede Lie-Gruppe und sie heißt adjungierte
Darstellung von G. Die Dimension dieser Darstellung ist gleich der Dimension der Gruppe.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.2. Lie-Algebren von Lie-Gruppen 97

Also beschreibt g1 (t)X2 g −1 (t) eine Kurve im linearen Raum g. Der Tangentialvektor
d
g1 (t)X2 g1−1 (t) t=0 = [X1 , X2 ],

dt
muss dann ebenfalls im linearen Raum g liegen. Also liegen mit X1 und X2 auch deren
Kommutator [X1 , X2 ] in g. Der Kommutator ist bilinear und antisymmetrisch und erfüllt
die Jacobi-Identität-Identität

[X, [Y, Z]] + zyklisch = 0. (6.14) {8}

Damit definieren die infinitesimalen Erzeugenden einer Lie-Gruppe G eine Lie-Algebra g.


Wir diskutieren nun die Lie-Algebren der klassischen Lie-Gruppen.

Die Lie-Algebra sl(n, K) der Gruppe SL(n, K):


Wir betrachten eine Kurve g(t) in SL(n, K) mit g(0) = 1n . Die Bedingung det g(t) = 1
impliziert für die infinitesimale Erzeugende X = ġ(0) die algebraische Bedingung Sp X = 0.
Deshalb enthält die Lie-Algebra die spurlosen Matrizen,

sl(n, K) = {X ∈ Mat(n, K)|Sp X = 0} . (6.15) {lsn1}

Die Dimension der Lie-Algebra ist gleich der Dimension der Lie-Gruppe

dim SL(n, C ) = 2n2 − 1 und dim SL(n, R ) = n2 − 1. (6.16) {lsn3}

Die Gruppe SL(2, C ) der Dimension 6 ist die Überlagerung der Lorentz-Gruppe und spielt
eine herausragende Rolle in der Theorie der Spinorfelder.

Die Lie-Algebra so(n) der Gruppe SO(n):


Jetzt betrachten wir eine Kurve R(t) in der Gruppe O(n). Die differenzierbare Kurve wird
wegen R(0) = 1 für alle t in der zusammenhängenden Untergruppe SO(n) ⊂ O(n) liegen.
Eine Erzeugende X = Ṙ(0) erfüllt die Bedingungen
d
RT (t)R(t) t=0 = X T + X.

0=
dt
Also ist die Lie-Algebra von SO(n) die Menge der antisymmetrischen reellen Matrizen,

so(n) = X ∈ Mat(n, R )|X = −X T



(6.17) {son1}

Diese Gruppe und ihre Lie-Algebra haben die Dimension

n(n − 1)
dim(SO(n)) = . (6.18) {son3}
2
Die Gruppen SO(3) der Drehungen im Euklidschen Raum und die Gruppe SO(4) der Lor-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.3. Die Lie-Algebra von SU (3) 98

entz-Transformationen in Euklidschen Feldtheorien treten als Raum- bzw. als Raumzeit-


Symmetrien auf.
Die Lie-Algebra u(n) der Gruppe U (n):
Aus der Bedingung U † (t)U (t) = 1 und U (0) = 1 folgt für X = U̇ (0) die Bedingung
X † + X = 0. Daher ist die Lie-Algebra der unitären Gruppen

u(n) = X ∈ Mat(n, C )|X = −X †



(6.19) {un1}

die Menge aller antihermiteschen komplexen n×n-Matrizen. Entsprechend ist die Dimension
der Gruppe

dim U (n) = n2 . (6.20) {un3}

Die Eichsymmetrie der elektroschwachen Wechselwirkung ist die Gruppe U (2) modulo einer
kleinen diskreten Untergruppe.
Die Lie-Algebra su(n) der Gruppe SU (n):
Diese bestehen aus allen Erzeugenden von U (n) die verschwindende Spur haben,

su(n) = {X ∈ u(n)|Sp X = 0} . (6.21) {un5}

Die Dimensionen sind

dim SU (n) = n2 − 1. (6.22) {un7}

Den Spezialfall n = 2 führt auf die quantenmechanische Drehgruppe der Dimension 3. Sie
wurde im letzten Abschnitt ausführlich behandelt.

Die Lie-Algebra sp(2n, K) der Gruppe Sp(2n, K):


Leiten wir die definierende Bedingung M T JM = J mit M = M (t) nach t ab, so finden wir
für die Erzeugenden X = Ṁ (0) die Bedingung

sp(2n, K) = X ∈ Mat(2n, K)|X T J + JX = 0 .



(6.23) {sp2n1}

Damit haben wir die Lie-Algebren aller klassischen Lie-Gruppen charakterisiert. Man kann
die Dimensionen dieser Lie-Algebra leicht bestimmen und überlasse Ihnen diese Rechnung.

6.3 Die Lie-Algebra von SU (3)

Die 8-dimensionale Gruppe SU (3) und ihre Lie-Algebra spielen eine wichtige Rolle in der
Elementarteilchenphysik und soll hier etwas näher untersucht werden. Die 8 Erzeugenden Xi
sind antihermitesche und spurlose Matrizen 3 × 3-Matrizen. In der physikalischen Literatur

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.3. Die Lie-Algebra von SU (3) 99

ist es üblich, anstelle der antihermiteschen Erzeugenden Xi die hermiteschen ’Erzeugenden’


Ti = iXi zu verwenden, da die Ti zu Observablen werden. Die hermiteschen Erzeugenden
erfüllen Kommutationsrelationen

[Ti , Tj ] = ifijk Tk (6.24) {sud1}

mit reellen Strukturkonstanten. Für jede kompakte Lie-Algebra sind die Strukturkonstanten
vollständig antisymmetrisch in i, j, k. Als Basis wählen wir die Gell-mann Matrizen λi in

1
Ti = λi . (6.25) {sud3}
2
Diese spurlosen hermiteschen 3 × 3-Matrizen haben die Form
     
0 1 0 0 −i 0 1 0 0
λ1 =  1 0 0  λ2 =  i 0 0  λ3 =  0 −1 0 
0 0 0 0 0 0 0 0 0
     
0 0 1 0 0 −i 0 0 0
λ4 =  0 0 0  λ5 =  0 0 0  λ6 =  0 0 1
1 0 0 i 0 0 0 1 0
   
0 0 0 1 0 0
1
λ7 =  0 0 −i  λ8 = √  0 1 0  .
0 i 0 3 0 0 −2

Die Matrizen sind orthogonal bezüglich das durch die Spur definierte Skalarprodukt,
(λi , λj ) ≡ Sp λ†i λj = 2δij ,
und für die Strukturkonstanten in
[λi , λj ] = 2ifijk λk
findet man

ijk 123 147 156 246 257 345 367 458 678
√ √ (6.26) {sud5}
1 3 3
fijk 1 2 − 21 1
2
1
2
1
2 − 21 2 2

Nun stellt sich die Frage, wieviele der Erzeugenden simultan diagonalisiert werden können,
oder äquivalent dazu, was die maximale Anzahl kommutierender Basiselemente ist. Diese
wichtige Zahl nennt man den Rang r der Gruppe. Ein maximaler Satz kommutierender
Basiselemente spannen die Cartan Unteralgebra von g auf. Der Rang r der Gruppe ist
dann gerade die Dimension der Cartan Unteralgebra. Der Rang von SU (N ) ist N − 1. Das
heißt, für SU (3) gibt es genau zwei Erzeugende die miteinander kommutieren. Üblicherweise
wählt man die zwei diagonalen Matrizen λ3 und λ8 als Basis der Cartan Unteralgebra. Es
gibt keine weitere (linear unabhängige) hermitesche und spurlose Matrix, die mit diesen zwei
Erzeugenden kommutiert.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.4. Darstellungen von Lie-Algebren 100

6.4 Darstellungen von Lie-Algebren

Eine n-dimensionale Darstellung ist ein Gruppenhomomorphismus von G in eine Untergrup-


pe der invertierbaren n × n Matrizen. Jede derartige Darstellung definiert eine Lie-Algebra
Homomorphismus von g in eine Unter-Lie-Algebra der n × n Matrizen. Wie dieser Zusam-
menhang genauer aussieht, wollen wir im Folgenden untersuchen. Es sei also g → T (g) eine
Darstellung von G. Wir definieren die Elemente der von T induzierten Darstellung T∗ der
Lie-Algebra gemäß

d
T∗ (X) = T (g(t))|t=0 , wobei ġ(0) = X (6.27) {ind1}
dt
ist. Aus der Darstellungseigenschaft der T folgt nun, daß T∗ linear ist und daß die T∗ (X)
dieselben Kommutationregeln wie die X erfüllen. Die Linearität ist einfach zu beweisen:

d
T∗ (α1 X1 + α2 X2 ) = T (g1 (α1 t)g2 (α2 t)) |t=0
dt
d   d (6.28) {ind3}
= T g1 (α1 t) |t=0 T g2 (0) + T ((g1 (0)) g2 (α2 t)) |t=0
dt dt
= α1 T∗ (X1 ) + α2 T∗ (X2 ).

Die Darstellungseigenschaft folgt aus

d
T∗ (g1 X2 g1−1 ) = T g1 g2 (t)g1−1 |t=0 = T (g1 )T∗ (X2 )T −1 (g1 )

(6.29) {ind5}
dt
und der Eigenschaft, daß T∗ linear ist, so daß
d
T (g1 (t))T∗ (X2 )T −1 (g1 (t)) |t=0 = [T∗ (X1 ), T∗ (X2 )] = T∗ ([X1 , X2 ])

dt
ist. Die Eigenschaft


[T∗ (X1 ), T∗ (X2 )] = T∗ [X1 , X2 ] , ∀X1 , X2 (6.30) {ind7}

bedeutet, daß die T∗ (X) dieselbe Lie-Algebra bilden wie die infinitesimalen Erzeugenden
X der Gruppe G. Es kommt nicht darauf an ob wir zuerst den Kommutator von X1 und
X2 berechnen und dann dessen Bild unter der induzierten Darstellung T∗ , oder ob wir
zuerst die Bilder von X1 und X2 berechnen und danach deren Kommutator. Der Gruppen-
Homomorphismus induziert eine Lie-Algebra Homomorphismus.

Wir wenden dies nun auf g in (5.17) an, für welches (t wird zu θ)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.4. Darstellungen von Lie-Algebren 101

sin ψeiϕ
 
d i cos ψ
X= g|θ=0 = (6.31) {ind9}
dθ − sin ψe−iϕ −i cos ψ

ist. Für die dreidimensionale Darstellung in (5.64) findet man dann



2 sin ψeiϕ
 
√ i cos ψ −iϕ √ 0 iϕ
T∗ (X) =  − 2 sin ψe √ 0 −iϕ 2 sin ψe  .
0 − 2 sin ψe −i cos ψ
Nach dem Basiswechsel (5.65) zur (reellen) Darstellung (5.66) erhält man die äquivalente
Darstellung

 
0 − cos ψ 2 sin ψ cos ϕ
T∗ (X) =  cos ψ 0 2 sin ψ sin ϕ  . (6.32) {ind11}
−2 sin ψ cos ϕ −2 sin ψ sin ϕ 0

Die infinitesimalen Erzeugenden der Darstellung (5.66) sind also die reellen antisymmetri-
schen 3 × 3 Matrizen. Dies muß so sein, denn einerseits ist

d d
T∗ (X) = T (g(θ, ψ, ϕ)) |θ=0 = R(θ, ψ, ϕ)|θ=0 (6.33) {ind13}
dθ dθ
und anderseits
d
RRt =⇒ T∗ (X) + T∗t (X) = 0.

0=

Jede irreduzible Darstellung einer Gruppe ist eine irreduzible Darstellung der Lie-Algebra
zugeordnet und (beinahe) umgekehrt. In der Physik konstruiert man oft die Darstellungen
einer Gruppe indem man die Darstellungen der zugehörigen Lie-Algebra studiert.

Nun können wir auf jeder Lie-Algebra g ein Skalarprodukt definieren1 :

(X, Y ) = Sp X † Y = −Sp XY. (6.34) {ind15}

Dieses Skalarprodukt ist invariant unter der adjungierten Darstellung,

(Ad(g)X, Ad(g)Y ) = −Sp gXg −1 gY g −1 = (X, Y ), (6.35) {ind17}

wobei wir die Invarianz der Spur bei zyklischer Vertauschung der Argumente benutzten.
Man sagt kurz, das Skalarprodukt ist Ad-invariant.

Nun wollen wir noch die ’Treuheit’ der adjungierten Darstellung untersuchen. Dazu müssen
wir bestimmen wieviele Gruppenelement auf dasselbe Ad(g) abgebildet werden:
Ad(g1 )X = Ad(g2 )X ⇐⇒ Ad(g2−1 g1 )X = X, ∀X ∈ G.
1 für allgemeine Lie-Gruppe ist dies die Killingform

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 102

Die Frage ist also, wieviele Gruppenelemente g gibt es, sodaß

gXg −1 = X für alle X. (6.36) {ind19}

Wir erinnern uns daran, dass das Zentrum von G diejenigen Elemente enthält, die mit allen
anderen Elementen kommutieren,

Z = {z|zg = gz ∀ g ∈ G} ⊂ G. (6.37) {ind21}

Das Zentrum ist eine Abelsche Untergruppe. Offensichtlich ist


d d
zXz −1 = zg(s)z −1 |t=0 = g(t)|t=0 = X.

dt dt
Tatsächlich sind die Zentrumselemente die einzigen Elemente mit dieser Eigenschaft und

Ad(g1 ) = Ad(g2 ) ⇐⇒ g2 = g1 z, z ∈ Z. (6.38) {ind23}

Das Zentrum von SU (2) besteht aus {e, −e}. Die adjungierte Darstellung SU (2) → SO(3)
bildet g und −g in die gleichen Drehungen ab.

Alle Darstellungen Tj von SU (2) gewinnt man indem man die definierende Darstellung T 21
(auch fundamentale Darstellung genannt) genügend oft mit sich tensoriert. Zum Beispiel ist
die adjungierte Darstellung T1 enthalten in

T 21 × T 21 = T1 + T0 .

Die Dimension der Darstellung Tj ist 2j +1. In der Quantenmechanik werden die Darstellun-
gen von SU (2) mit Hilfe des Auf- und Absteigeoperator in der komplexifizierten Lie-Algebra,

1
σ± = (σ1 ± iσ2 ) mit [σ3 , σ± ] = ±σ± , (6.39) {ind27}
2
konstruiert. Diese Konstruktion mit Hilfe von Leiteroperatoren kann für allgemeine kom-
pakte (halbeinfache) Lie-Algebren verallgemeinert werden.

6.5 Wurzeln eine Lie-Algebra

Wir verallgemeinern die Konstruktion der Auf- und Absteigeoperatoren auf beliebige Lie-
Algebren. Es seien Hi , i = 1, . . . r eine Basis einer Cartan-Unteralgebra, also einer ma-
ximalen Unteralgebra von kommutierenden Generatoren. Nun erweitern wir die Hi durch
komplexe Kombinationen Eα der Xi , so dass

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 103

[Hi , Eα ] = αi Eα , 1 ≤ i ≤ r. (6.40) {wurz1}

Der reelle r-dimensionale Vektor α heißt Wurzel von g und Eα ist der zur Wurzel α gehörige
Stufenoperator. Man kann zeigen, dass es zu jeder Wurzel (bis auf Vielfaches) nur einen
Stufenoperator gibt. Wegen

Hi Eα − Eα Hi = αi Eα −→ Eα† Hi − Hi Eα† = αi Eα† (6.41) {wurz3}

ist mit α auch −α eine Wurzelvektor und der entsprechende Stufenoperator ist E−α = Eα† .
Die Menge der Wurzeln bezeichnen wir mit Φ. Die Anzahl Wurzeln ist

|Φ| = Dim G − Rang G. (6.42) {wurz5}

Zum Beispiel hat SU (3) 8 − 2 = 6 Wurzeln. Wegen der Jakobi-Identität ist

[Hi , [Eα , Eβ ]] = −[Eβ , [Hi , Eα ]] − [Eα , [Eβ , Hi ]] = (αi + βi )[Eα , Eβ ],

so dass mit α, β auch α + β eine Wurzel ist, falls Eα+β ∼ [Eα , Eβ ] nicht verschwindet.
Schlußendlich kommutiert [Eα , E−α ] mit den Hi und muß in der Cartan-Unteralgebra
liegen, also eine Linearkombination der Hi sein, [Eα , E−α ] = βi Hi . Nun ist aber

Sp Hi [Eα , E−α ] = Sp E−α [Hi , Eα ] = αi Sp (E−α Eα ) = Sp Hi βj Hj = βi Sp Hi2 .

Nun können wir die Stufenoperatoren so normieren, dass wir schlußendlich folgende Kom-
mutationregeln haben

ǫ(α, β)Eα+β falls α + β eine Wurzel ist


(
[Eα , Eβ ] = 2α · H/α2 ≡ Hα falls α = −β ist (6.43) {wurz7}
0 sonst.
Man kann die antisymmetrischen ǫ(α, β) gleich ±1 wählen. Für jede Wurzel α bilden

{I+ , I− , I3 } ∼ Eα , E−α , 2α · H/α2



(6.44) {wurz9}

eine su(2) Unteralgebra (in der komplexen Basis) mit den bekannte su(2)-Kommutationsregeln

[I+ , I− ] = I3 , [I3 , I± ] = ±I± , . (6.45) {wurz11}

Nun erinnern wir uns daran, dass in jeder unitären Darstellung die Eigenwerte von I3 , dass
heißt von Hα halbganz sein müssen. Wegen

2α · β
[Hα , Eβ ] = Eβ (6.46) {wurz13}
α2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 104

sind die Eigenwerte dieses Operators in der adjungierten Darstellung gleich 2(α, β)/α2 und
wir schließen, dass

2(α, β)
α2
∈ Z für alle Wurzeln α, β ∈ Φ. (6.47) {wurz15}

Mit H1 = λ3 und H2 = λ8 hat man für SU (3) folgende Wurzeln und Stufenoperatoren:
α(1) = (2, 0), Eα(1) = X1 + iX2

α(2) = (−1, 3), Eα(2) = X7 + iX7

α(3) = (1, 3), Eα(3) = X4 + iX5 .
Ausgeschrieben sieht dies folgendermassen aus
   
0 1 0 1 0 0
Eα(1) =  0 0 0  Hα(1) =  0 −1 0 
0 0 0 0 0 0
   
0 0 0 0 0 0
Eα(2) =  0 0 1  Hα(2) =  0 1 0 
0 0 0 0 0 −1
   
0 0 1 1 0 0
Hα(3) =  0 0 0  Hα(3) =  0 0 0 .
0 0 0 0 0 −1
Die Wurzeln einer Lie-Algebra spannen ein Rang(G)-dimensionales Wurzelgitter auf. Die
folgende Abbildung enthält der unitären Gruppe SU (3).

Die Weyl-Reflektionen sind Automorphismen auf dem Wurzelgitter. Sei


σα (s) = eiπs(Eα +E−α )/2 ∈ G.
Dann findet man (die dritte Ableitung ist proportional zur ersten)
(β, α)
σα (s)Hβ σα−1 (s) = Hβ + (Hα cos(πs) − i(Eα − E−α ) sin πs − Hα ) .
β2
Setzen wir σα = σα (1) dann finden wir die Identität

(β, α)
σα Hβ σα−1 = Hβ − 2 Hα . (6.48) {wurz17}
β2

Wegen Hβ = 2(β, H)/β 2 ist diese äquivalent zu

(β, α)
β −→ β − 2 α. (6.49) {wurz19}
α2
Dies ist aber gerade die Reflektion σα (β) von β an der Ebene senkrecht zur Wurzel α. Nun

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 105

Weyl
reflektion
α(3) α(2)
b b

−α(1) α(1)

erste Weyl-
kammer

−α(2) −α(3)

weyl
Abbildung 6.1: Das Wurzelgitter von SU (3).

konjugieren wir die Gleichung

(σα (β), γ)
[σα Hβ σα−1 , Eγ ] = [Hσα (β) , Eγ ] = 2 Eγ ,
β2

wobei wir benutzten, dass die Spiegelung σα längenerhaltend ist, mit σα−1 . Spiegelungen sind
symmetrische Operationen und deshalb erhalten wir

(β, σα (γ)) −1
[Hβ , σα−1 Eγ σα ] = 2 σα Eγ σα .
β2
Dies beweist, dass das Wurzelgitter unter den Spiegelungen senkrecht zu allen Wurzeln in
sich übergeht: Für jedes Paar von Wurzeln α, β ist

(α, β)
σα (β) = β − 2 α (6.50) {wurz21}
α2
wieder eine Wurzel. Jede dieser Spiegelungen permutiert die Wurzeln in Φ. Diese Spiegelun-
gen nennt man die Weyl-Reflektionen. Sie bilden die endliche Weyl-Gruppe W (G). In der
Abbildung (6.1) sind die Spiegelungsebenen und eine Reflektion eingezeichnet.

Im Allgemeinen ist die Anzahl Wurzeln grösser als der Rang der Gruppe, so dass diese linear
abhängig sind. Deshalb ist es sinnvoll eine Basis

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 106


∆ = α(1) , . . . , α(r) (6.51) {wurz23}

auszuwählen, so dass jede Wurzel eine Linearkombination dieser einfachen Wurzeln ist. Man
kann eine Basis wählen, so dass

r
X
α= ni α(i) (6.52) {wurz25}
i=1

wobei alle Koeffizienten ni ∈ Z entweder ganzzahlig nichtnegativ (ni ≥ 0) oder ganzzahlig


nichtpositiv (ni ≤ 0) sind. Im ersten Fall heißt α positiv, im zweiten negativ. Sind nur ein
Satz einfacher Wurzeln bekannt, dann kann man durch Weyl-Reflektionen der einfachen
Wurzeln das gesamte Wurzelsystem rekonstruieren.

6.6 Gewichte einer Darstellung

Wir betrachten eine endlichdimensionale Darstellung T der Gruppe G auf einem Vektorraum
V . Da die T∗ (Hi ) miteinander vertauschen, können wir sie gleichzeitig diagonalisieren,

T∗ (Hi )|µi = µi |µi. (6.53) {gew1}

Der r-dimensionale Vektor µ = (µ1 , . . . , µr ) heißt Gewichtsvektor. Da die

Hα , Eα , E−α und damit T∗ (Hα ), T∗ (Eα ), T∗ (E−α ) (6.54) {gew3}

eine su(2)-Unteralgebra von G aufspannen, muß wegen

2(µ, α)
T∗ (Hα )|µi = |µi (6.55) {gew5}
α2
der Eigenwert auf der rechten Seite eine ganze Zahl sein,

2(α, µ)
α2
∈ Z für alle Wurzeln α ∈ Φ. (6.56) {gew7}

Diese Bedingung definiert das Gewichtsgitter von g. Weiterhin zerfallen die Eigenzustände
|µi in Multipletts unter der Wirkung von Hα , E±α . Wegen

σβ Hα σβ−1 = Hσβ (α) , σβ E±α σβ−1 = E±σβ (α)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 107

gilt nämlich2
2(α, µ)
σβ Hα |µi = σβ |µi = Hσβ (α) σβ |µi.
α2
Setzen wir σβ (α) = δ und benutzen, dass σβ unitär ist, dann folgt


2 δ, σβ (µ)
Hδ σβ |µi = σβ |µi (6.57) {gew9}
δ2
für alle Wurzeln und Gewichte. Damit werden die Gewichte einer Darstellung unter den
Weyl-Reflektionen ineinander abgebildet.

Es genügt die Forderung (6.56) für eine Basis von Wurzeln zu fordern, da alle Wurzeln durch
Weylreflektionen aus diesen einfachen Wurzeln gewonnen werden können. Entsprechend
können wir im Gewichtsgitter eine Basis von fundamentalen Gewichten, definiert durch

(λ(i) , α(j) )
2 = δij , 1 ≤ i, j ≤ r (6.58) {gew11}
α2(j)

einführen. Jedes Gewicht ist eine integrale Linearkombination der fundamentalen Gewichte,

r
Z.
X
λ= ni λ(i) , ni ∈ (6.59) {gew13}
1

Sind alle ganze Zahlen ni ≥ 0, dann heißt λ dominantes Gewicht. Offensichtlich ist ein
Gewicht λ dominant genau dann wenn


α(i) , λ ≥ 0, 1≤i≤r (6.60) {gew15}

gilt. Jedes Gewicht kann mit einer Weyl-Reflektion in ein eindeutiges dominantes Gewicht
abgebildet werden. Für SU (3) sind die fundamentalen Gewichte
√   
1 3 2 0
λ(1) = √ und λ(2) = √ .
3 1 3 1
In jeder endlichdimensionalen Darstellung von G können wir einen Zustand |µi mit höchstem
Gewicht finden, so dass

r
X
hρ|µi am grössten ist, wo ρ = λ(i) (6.61) {gew17}
1

eine spezielles dominantes Gewicht ist. Das Skalarprodukt hρ|αi ist positiv für positive α
2 Im Folgenden schreiben wir wieder Hα und σα anstelle von U∗ (Hα ) und U (σα ).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 108

und negativ für negative α. Man kann zeigen, dass ρ die halbe Summe der positiven Wurzeln
ist. Ein Zustand mit höchstem Gewicht wird von allen Eα , α > 0 annihiliert,

Eα |µi = 0, α > 0. (6.62) {gew19}

Wäre dem nicht so, dann hätte dieser Zustand Gewicht µ + α und wäre grösser als µ. Zu
jedem dominanten Gewicht µ gibt es eine eindeutige irreduzible Darstellung. Sie besteht aus
Zuständen der Form

E−β1 E−β2 · · · E−βm |µi, βi > 0. (6.63) {gew21}

Wenden wir diese Resultate auf SU (3) an. Die Gewichte


√   √   
1 3 1 − 3 −2 0
λ(1) = √ , λ(1) −α(1) = √ und λ(1) −α(3) = √
3 1 3 1 3 1
bilden eine 3-dimensionale Darstellung mit höchsten Gewicht µ3 = λ(1) . Dies ist gerade die
fundamentale Darstellung mit Eigenvektoren
|µ3 i ∼ e1 , |µ3 − α(1) i = e2 und |µ3 − α(3) i = e3 .
Nun gibt es auch noch eine weitere drei-dimensionale Darstellung mit höchsten Gewicht
µ3̄ = λ(2) , nämlich
  √  √ 
2 0 1 3 −1 3
µ3̄ = √ , µ3̄ −α(2) = √ und µ3̄ −α(3) = √ .
3 1 3 −1 3 1
Bis auf Permutationen können wir die Eigenwerte der zu dieser Darstellung gehörenden
T∗ (Hi ), i = 1, 2 ablesen. Folgende Matrizen haben diese Eigenwerte (die Matrizen sind
immer nur bis auf Äquivalent bestimmt)

T∗ (H1 ) = −H1 und T∗ (H2 ) = −H2 . (6.64) {gew23}

Die zugehörigen Eigenvektoren sind


     
0 0 1
|µ3̄ i =  0  , |µ3̄ −α(2) i =  1  , |µ3̄ −α(3) i =  0  .
1 0 0
Die zugehörigen Stufenoperatoren haben die Form

T∗ (Eα ) = −Eαt . (6.65) {gew25}

Dies sind genau die Erzeugenden der komplex konjugierten Darstellung


T : g −→ ḡ.
Dies ist leicht einzusehen:
ġ(0) = X =⇒ T∗ (X) = ḡ˙ (0) = X̄ = (X † )t = −X t .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 109

Tensorprodukt von Darstellungen: Es seine T1 und T2 zwei Darstellungen auf den


Darstellungsräumen V1 und V2 . Dann ist die Tensorprodukt-Darstellung

T = T1 ⊗ T2 : g −→ T1 (g) ⊗ T2 (g) (6.66) {tensors1}

auf V1 × V2 im Allgemeinen reduzibel, auch wenn die Darstellungen Ti irreduzibel waren.


Die induzierte Darstellung der Lie-Algebra ist

d
T1 (g(t)) ⊗ T2 (g(t)) t=0 = T∗1 (X) ⊗ 1 + 1 ⊗ T∗2 (X).

T∗ (X) = (6.67) {tensors3}
dt
Sind |µi i höchsten Gewichte der Darstellungen Ti , dann ist |µ1 i ⊗ |µ2 i ein höchstes Gewicht
der Tensordarstellung.

Schauen wir uns die Tensordarstellung 3 × 3̄ von SU (3) etwas genauer an.

Weylreflektionen

α2

λ2
λ1

α1

3 simple roots

3 3x3=8+1
weightsu3
Abbildung 6.2: Gewichtsgitter von SU (3).

Die 9 Gewichte der Tensordarstellung 3 × 3̄ sind die Summen der Gewichte der Faktoren,

{λ3×3̄ } = {λ3(i) + λ3̄(j) , i, j = 1, 2, 3}.



Das höchste Gewicht ist µ3×3̄ = µ3 + µ3̄ = (1, 3). Diese Gewichte sind in der Figur

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 110

6.2 eingezeichnet. Nun wollen noch bestimmen, was die irreduziblen Bestandteile dieser 9-
dimensionalen Darstellung ist. Sei vi wj die 9 Komponenten eines Vektors im Tensorprodukt
der Darstellungsräume von 3 und 3̄. Unter der Tensordarstellung transformieren diese wie

vi wj −→ gip ḡjq vp wq ⇐⇒ A −→ gAg † = gAg −1 , Aij = vi wj .

Da aber

tr A −→ tr gAg −1 = tr A (6.68) {tensors5}


P
ist, ist tr A = vi wi ein eindimensionaler invarianter Unterraum der Tensorproduktdar-
stellung. Auf dem Unterraum senkrecht dazu, d.h. auf denjenigen A mit tr A = 0, ist (6.68)
genau die adjungierte Darstellung. Als gilt

3 × 3̄ = 1 ⊕ 8, 8 = adjungierte Darstellung.

Eine allgemeine irreduzible Darstellung von SU (3) wir durch Angabe zweier positiver ganzer
Zahlen charakterisiert. Zerlegt man das höchste Gewicht µ in die fundamentalen Gewichte,

µ = nµ3 + mµ3̄ ,

dann charakterisieren (m, n) die Darstellung.

(m, n) (0, 0) (0, 1) (1, 0) (0, 2) (2, 0) (1, 1) (0, 3) (3, 0) (1, 2) (2, 1)

Dimension 1 3 3̄ 6 6̄ 8 = 8̄ 10 1̄0 15 ¯
15

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6

Lie-Algebren

Dieses Kapitel soll eine Einführung in die Theorie der Lie-Algebren und deren Darstellungen
geben. Beispiele von Lie-Algebren sind weitverbreitet. Das bekannteste Beispiel einer Lie-
3
Algebra ist wohl der Vektorraum R mit dem Vektorprodukt als Multiplikation: es gelten
die Identitäten

a ∧ a = 0 sowie (a ∧ b ) ∧ + (b ∧ ) ∧ a + ( ∧ a ) ∧ b = 0.
Sie kennen die Darstellungstheorie aus der Theorie des Drehimpulses in der Quantenmecha-
nik. Weiter sind Lie-Algebren bereits in der Mechanik anzutreffen: die Poisson-Klammer
in der Hamiltonschen Mechanik versieht den Raum der C ∞ -Phasenraumfunktionen mit
der Struktur einer Lie-Algebra (sogar einer Poisson-Algebra). Lie-Algebren treten in der
Physik meist als infinitesimale Symmetrieoperationen auf. Aus der Klassifikation dieser Dar-
stellungen kann man deshalb Strukturaussagen über die Lösungen der zugrundeliegenden
Dynamik machen. So sind zum Beispiel die Elementarteilchen Elemente der Multipletts von
Eichsymmetrie-Algebren.

Wir betrachten hier eine n-dimensionale Lie-Gruppe G und identifizieren den Tangential-
raum am Einselement e als Lie-Algebra der Gruppe. Es sei also U eine Koordinatenumge-
bung von e und α = (α1 , . . . , αn ) lokale Koordinaten in einer Karte von U . Das Einselement
sei durch die Wahl

g(α = 0) = e (6.1) {lieal2}

ausgezeichnet. Man kann nun um g = e im Koordinatenraum entwickeln, also eine Taylor-


reihe für die Gruppenelemente in einer Umgebung des Einselement ansetzen,

93
Kapitel 6. Lie-Algebren 6.1. Die Lie-Algebra su(2) 94

n
X ∂g(α)
g(α) = g(0) + αi + O(α2 ). (6.2) {lieal4}
∂αi α=0

i=1

Die ersten Ableitungen beschreiben die Struktur der Gruppe nahe der Einheit. Man definiert
mit ihrer Hilfe die Generatoren oder infinitesimalen Erzeugenden der Lie-Gruppe,

∂g(α)
Xi ≡ , so dass g(α) = e + αi Xi + O(α2 ). (6.3) {lieal6}
∂αi α=0

Zum Beispiel ist die Erzeugende X1 tangential zur Koordinatenkurve g(α1 , 0, . . . , 0) durch
die Gruppen-Eins. Ist nun α(t) eine Kurve mit α(0) = 0 in der gewählten Karte, dann
beschreibt g(α(t)) ≡ g(t) eine Kurve auf der Gruppe mit g(0) = e und es gilt

dg(t) ∂g(α)
X= = α̇i (0) = Xi α̇i (0). (6.4) {lieal8}
dt 0 ∂αi α=0

Wählt man für α(t) die i’te Koordinatenlinie, dann ist X = Xi . Also sind die infinitesimalen
Erzeugenden tangential an den Kurven durch e an der Stelle e und die Menge aller Erzeugen-
den ist gleich dem Tangentialraum Te (G) an der Gruppen-Eins. Die Anzahl unabhängiger
Generatoren ist gleich der Zahl der unabhängigen reellen Parameter der Lie-Gruppe, also
gleich ihrer Dimension. Die Generatoren einer Matrixgruppe sind ebenfalls Matrizen.

6.1 Die Lie-Algebra su(2)

Zur Einstimmung betrachten wir die nicht-Abelsche Lie-Gruppe SU (2). Es seien also g(t)
2-dimensionale Matrizen mit g(t)g † (t) = 12 . Die Ableitung dieser Bedingung nach t an der
Stelle t = 0 führt auf folgende Bedingung an die Generatoren X = ġ(0):

ġ(0) g † (0) + g(0)ġ † (0) = X + X † = 0.

Deshalb sind die Erzeugenden der unitären Gruppe 2-dimensionale antihermiteschen Matri-
zen. Die Elemente aus SU (2) haben zusätzlich die Eigenschaft det g(t) = 1. Es ergibt sich
mit Hilfe der bekannten Formel

d
log det g = Sp g −1 ġ

(6.5) {lieal10}
dt
deshalb die Zusatzbedingung Sp X = 0. Die Menge der Generatoren von SU (2) wird mit
su(2) bezeichnet,

su(2) = {X ∈ Mat(2, C )|X = −X † , Sp X = 0}. (6.6) {lieal12}

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.1. Die Lie-Algebra su(2) 95

Sie bildet offensichtlich einen linearen Raum. Neben jeder Linearkombination ist aber auch
der Kommutator zweier Elemente aus su(2) wieder in su(2), wie man leicht beweist:

[X1 , X2 ]† = X2 X1 − X1 X2 = −[X1 , X2 ]
Sp [X1 , X2 ] = Sp (X1 X2 ) − Sp (X2 X1 ) = 0.

Die erzeugenden Elemente bilden eine Lie-Algebra:

Definition [Lie-Algebra]: Eine Lie-Algebra g ist ein K-Vektorraum versehen mit einer
bilinearen Abbildung ( Lie-Klammer)

[ , ] : g × g −→ g

mit den beiden Eigenschaften:

1. [X, X] = 0 für alle X ∈ g (d.h. die Klammer ist alternierend),


2. [X, [Y, Z]] + [X, [Y, Z]] + [X, [Y, Z]] = 0 für alle X, Y, Z ∈ g ( Jacobi-Identität).

Aus der ersten Eigenschaft folgt, dass die Lie-Klammer antisymmetrisch ist,

0 = [X + Y, X + Y ] = [X, Y ] + [Y, X] =⇒ [X, Y ] = −[Y, X]. (6.7) {lieal14}

Führen wir ein Basis X1 , . . . , Xn im n-dimensionalen Vektorraum g ein, dann ist der Kom-
mutator zweier Basiselemente eine Linearkombination der Basiselemente,

[Xi , Xj ] = fijk Xk . (6.8) {lieal15}

Die Konstanten fijk = −fjik heissen Strukturkonstanten der Lie-Algebra g.

Wir kehren zu SU (2) zurück. Jedes Element der Lie-Algebra su(2) ist eine Linearkombina-
tion der drei spurlosen und hermiteschen Pauli-Matrizen,

X ∈ su(2) ⇐⇒ X = iv σ, v ∈ R 3.
Mit (v σ)2 = v 2 1, wobei v den Betrag von v bezeichnet, folgt

exp(X) = exp(iv σ) = cos v σ0 + i sin v v̂ σ. (6.9) {lieal16}

Setzen wir in dieser Formel

cos v + iv̂3 sin v = a und sin v (iv̂1 − v̂2 ) = b,

dann ist exp(X) genau die SU (2)-Matrix in (4.1). Die Bedingung |a|2 + |b|2 = 1 ist für
unsere Parametrisierung automatisch erfüllt. Also kann jede SU (2)-Matrix als Exponent
einer anti-hermiteschen und spurlosen Matrix geschrieben werden,

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.2. Lie-Algebren von Lie-Gruppen 96

X ∈ su(2) =⇒ g = exp(X) ∈ SU (2) (6.10) {lieal18}

Im gewissen Sinn gilt auch die Umkehrung: Mit X liegt auch tX im linearen Raum su(2) und
g(t) = exp(tX) ist eine einparametrige Kurve auf der Gruppe mit g(0) = e. Die Ableitung
nach t an der Stelle 0 liegt dann in der Lie-Algebra

dg(t)
g = exp(tX) ∈ su(2) =⇒ X = ∈ su(2). (6.11) {lieal20}
dt t=0
Für die quantenmechanische Drehgruppe besteht also ein einfacher Zusammenhang zwischen
Lie-Gruppe und Lie-Algebra. Dies gilt auch für allgemeinere Lie-Gruppen und dies wollen
wir im folgenden Abschnitt einsehen.

6.2 Lie-Algebren von Lie-Gruppen

Wir zeigen nun, dass die infinitesimalen Erzeugenden

d
X= g(t) t=0 = ġ(0), g(0) = e, (6.12) {lieal24}
dt
eine Lie-Algebra bilden. Dazu betrachten wir zwei Kurven g1 (t) und g2 (t) die für t =
0 durch e gehen und an dieser Stelle die Tangentialvektoren X1 und X2 besitzen. Dann
ist auch g(α1 t)g(α2 t) eine derartige Kurve für beliebige reelle Konstanten α1 und α2 mit
Tangentialvektor
d
(g1 (α1 t)g2 (α2 t)) t=0 = α1 X1 + α2 X2
dt
und die infinitesimalen Erzeugenden bilden einen linearen Raum g. Wegen
d
g1 g2 (t)g1−1 t=0 = g1 X2 g1−1

dt
ist für beliebige g ∈ G mit X auch gXg −1 in diesem Raum. Die Abbildung

Ad : g −→ g, Ad(g)X = gXg −1 (6.13) {lieal26}

ist ein Darstellung der Gruppe auf dem linearen Raum g, da für alle X ∈ g gilt

Ad (g1 g2 ) X = g1 g2 Xg2−1 g1−1 = g1 (Ad(g2 )X) g1−1 = Ad(g1 )Ad(g2 )X

und Ad(e)X = X. Diese Darstellung existiert für jede Lie-Gruppe und sie heißt adjungierte
Darstellung von G. Die Dimension dieser Darstellung ist gleich der Dimension der Gruppe.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.2. Lie-Algebren von Lie-Gruppen 97

Also beschreibt g1 (t)X2 g −1 (t) eine Kurve im linearen Raum g. Der Tangentialvektor
d
g1 (t)X2 g1−1 (t) t=0 = [X1 , X2 ],

dt
muss dann ebenfalls im linearen Raum g liegen. Also liegen mit X1 und X2 auch deren
Kommutator [X1 , X2 ] in g. Der Kommutator ist bilinear und antisymmetrisch und erfüllt
die Jacobi-Identität-Identität

[X, [Y, Z]] + zyklisch = 0. (6.14) {8}

Damit definieren die infinitesimalen Erzeugenden einer Lie-Gruppe G eine Lie-Algebra g.


Wir diskutieren nun die Lie-Algebren der klassischen Lie-Gruppen.

Die Lie-Algebra sl(n, K) der Gruppe SL(n, K):


Wir betrachten eine Kurve g(t) in SL(n, K) mit g(0) = 1n . Die Bedingung det g(t) = 1
impliziert für die infinitesimale Erzeugende X = ġ(0) die algebraische Bedingung Sp X = 0.
Deshalb enthält die Lie-Algebra die spurlosen Matrizen,

sl(n, K) = {X ∈ Mat(n, K)|Sp X = 0} . (6.15) {lsn1}

Die Dimension der Lie-Algebra ist gleich der Dimension der Lie-Gruppe

dim SL(n, C ) = 2n2 − 1 und dim SL(n, R ) = n2 − 1. (6.16) {lsn3}

Die Gruppe SL(2, C ) der Dimension 6 ist die Überlagerung der Lorentz-Gruppe und spielt
eine herausragende Rolle in der Theorie der Spinorfelder.

Die Lie-Algebra so(n) der Gruppe SO(n):


Jetzt betrachten wir eine Kurve R(t) in der Gruppe O(n). Die differenzierbare Kurve wird
wegen R(0) = 1 für alle t in der zusammenhängenden Untergruppe SO(n) ⊂ O(n) liegen.
Eine Erzeugende X = Ṙ(0) erfüllt die Bedingungen
d
RT (t)R(t) t=0 = X T + X.

0=
dt
Also ist die Lie-Algebra von SO(n) die Menge der antisymmetrischen reellen Matrizen,

so(n) = X ∈ Mat(n, R )|X = −X T



(6.17) {son1}

Diese Gruppe und ihre Lie-Algebra haben die Dimension

n(n − 1)
dim(SO(n)) = . (6.18) {son3}
2
Die Gruppen SO(3) der Drehungen im Euklidschen Raum und die Gruppe SO(4) der Lor-

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.3. Die Lie-Algebra von SU (3) 98

entz-Transformationen in Euklidschen Feldtheorien treten als Raum- bzw. als Raumzeit-


Symmetrien auf.
Die Lie-Algebra u(n) der Gruppe U (n):
Aus der Bedingung U † (t)U (t) = 1 und U (0) = 1 folgt für X = U̇ (0) die Bedingung
X † + X = 0. Daher ist die Lie-Algebra der unitären Gruppen

u(n) = X ∈ Mat(n, C )|X = −X †



(6.19) {un1}

die Menge aller antihermiteschen komplexen n×n-Matrizen. Entsprechend ist die Dimension
der Gruppe

dim U (n) = n2 . (6.20) {un3}

Die Eichsymmetrie der elektroschwachen Wechselwirkung ist die Gruppe U (2) modulo einer
kleinen diskreten Untergruppe.
Die Lie-Algebra su(n) der Gruppe SU (n):
Diese bestehen aus allen Erzeugenden von U (n) die verschwindende Spur haben,

su(n) = {X ∈ u(n)|Sp X = 0} . (6.21) {un5}

Die Dimensionen sind

dim SU (n) = n2 − 1. (6.22) {un7}

Den Spezialfall n = 2 führt auf die quantenmechanische Drehgruppe der Dimension 3. Sie
wurde im letzten Abschnitt ausführlich behandelt.

Die Lie-Algebra sp(2n, K) der Gruppe Sp(2n, K):


Leiten wir die definierende Bedingung M T JM = J mit M = M (t) nach t ab, so finden wir
für die Erzeugenden X = Ṁ (0) die Bedingung

sp(2n, K) = X ∈ Mat(2n, K)|X T J + JX = 0 .



(6.23) {sp2n1}

Damit haben wir die Lie-Algebren aller klassischen Lie-Gruppen charakterisiert. Man kann
die Dimensionen dieser Lie-Algebra leicht bestimmen und überlasse Ihnen diese Rechnung.

6.3 Die Lie-Algebra von SU (3)

Die 8-dimensionale Gruppe SU (3) und ihre Lie-Algebra spielen eine wichtige Rolle in der
Elementarteilchenphysik und soll hier etwas näher untersucht werden. Die 8 Erzeugenden Xi
sind antihermitesche und spurlose Matrizen 3 × 3-Matrizen. In der physikalischen Literatur

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.3. Die Lie-Algebra von SU (3) 99

ist es üblich, anstelle der antihermiteschen Erzeugenden Xi die hermiteschen ’Erzeugenden’


Ti = iXi zu verwenden, da die Ti zu Observablen werden. Die hermiteschen Erzeugenden
erfüllen Kommutationsrelationen

[Ti , Tj ] = ifijk Tk (6.24) {sud1}

mit reellen Strukturkonstanten. Für jede kompakte Lie-Algebra sind die Strukturkonstanten
vollständig antisymmetrisch in i, j, k. Als Basis wählen wir die Gell-mann Matrizen λi in

1
Ti = λi . (6.25) {sud3}
2
Diese spurlosen hermiteschen 3 × 3-Matrizen haben die Form
     
0 1 0 0 −i 0 1 0 0
λ1 =  1 0 0  λ2 =  i 0 0  λ3 =  0 −1 0 
0 0 0 0 0 0 0 0 0
     
0 0 1 0 0 −i 0 0 0
λ4 =  0 0 0  λ5 =  0 0 0  λ6 =  0 0 1
1 0 0 i 0 0 0 1 0
   
0 0 0 1 0 0
1
λ7 =  0 0 −i  λ8 = √  0 1 0  .
0 i 0 3 0 0 −2

Die Matrizen sind orthogonal bezüglich das durch die Spur definierte Skalarprodukt,
(λi , λj ) ≡ Sp λ†i λj = 2δij ,
und für die Strukturkonstanten in
[λi , λj ] = 2ifijk λk
findet man

ijk 123 147 156 246 257 345 367 458 678
√ √ (6.26) {sud5}
1 3 3
fijk 1 2 − 21 1
2
1
2
1
2 − 21 2 2

Nun stellt sich die Frage, wieviele der Erzeugenden simultan diagonalisiert werden können,
oder äquivalent dazu, was die maximale Anzahl kommutierender Basiselemente ist. Diese
wichtige Zahl nennt man den Rang r der Gruppe. Ein maximaler Satz kommutierender
Basiselemente spannen die Cartan Unteralgebra von g auf. Der Rang r der Gruppe ist
dann gerade die Dimension der Cartan Unteralgebra. Der Rang von SU (N ) ist N − 1. Das
heißt, für SU (3) gibt es genau zwei Erzeugende die miteinander kommutieren. Üblicherweise
wählt man die zwei diagonalen Matrizen λ3 und λ8 als Basis der Cartan Unteralgebra. Es
gibt keine weitere (linear unabhängige) hermitesche und spurlose Matrix, die mit diesen zwei
Erzeugenden kommutiert.

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.4. Darstellungen von Lie-Algebren 100

6.4 Darstellungen von Lie-Algebren

Eine n-dimensionale Darstellung ist ein Gruppenhomomorphismus von G in eine Untergrup-


pe der invertierbaren n × n Matrizen. Jede derartige Darstellung definiert eine Lie-Algebra
Homomorphismus von g in eine Unter-Lie-Algebra der n × n Matrizen. Wie dieser Zusam-
menhang genauer aussieht, wollen wir im Folgenden untersuchen. Es sei also g → T (g) eine
Darstellung von G. Wir definieren die Elemente der von T induzierten Darstellung T∗ der
Lie-Algebra gemäß

d
T∗ (X) = T (g(t))|t=0 , wobei ġ(0) = X (6.27) {ind1}
dt
ist. Aus der Darstellungseigenschaft der T folgt nun, daß T∗ linear ist und daß die T∗ (X)
dieselben Kommutationregeln wie die X erfüllen. Die Linearität ist einfach zu beweisen:

d
T∗ (α1 X1 + α2 X2 ) = T (g1 (α1 t)g2 (α2 t)) |t=0
dt
d   d (6.28) {ind3}
= T g1 (α1 t) |t=0 T g2 (0) + T ((g1 (0)) g2 (α2 t)) |t=0
dt dt
= α1 T∗ (X1 ) + α2 T∗ (X2 ).

Die Darstellungseigenschaft folgt aus

d
T∗ (g1 X2 g1−1 ) = T g1 g2 (t)g1−1 |t=0 = T (g1 )T∗ (X2 )T −1 (g1 )

(6.29) {ind5}
dt
und der Eigenschaft, daß T∗ linear ist, so daß
d
T (g1 (t))T∗ (X2 )T −1 (g1 (t)) |t=0 = [T∗ (X1 ), T∗ (X2 )] = T∗ ([X1 , X2 ])

dt
ist. Die Eigenschaft


[T∗ (X1 ), T∗ (X2 )] = T∗ [X1 , X2 ] , ∀X1 , X2 (6.30) {ind7}

bedeutet, daß die T∗ (X) dieselbe Lie-Algebra bilden wie die infinitesimalen Erzeugenden
X der Gruppe G. Es kommt nicht darauf an ob wir zuerst den Kommutator von X1 und
X2 berechnen und dann dessen Bild unter der induzierten Darstellung T∗ , oder ob wir
zuerst die Bilder von X1 und X2 berechnen und danach deren Kommutator. Der Gruppen-
Homomorphismus induziert eine Lie-Algebra Homomorphismus.

Wir wenden dies nun auf g in (5.17) an, für welches (t wird zu θ)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.4. Darstellungen von Lie-Algebren 101

sin ψeiϕ
 
d i cos ψ
X= g|θ=0 = (6.31) {ind9}
dθ − sin ψe−iϕ −i cos ψ

ist. Für die dreidimensionale Darstellung in (5.64) findet man dann



2 sin ψeiϕ
 
√ i cos ψ −iϕ √ 0 iϕ
T∗ (X) =  − 2 sin ψe √ 0 −iϕ 2 sin ψe  .
0 − 2 sin ψe −i cos ψ
Nach dem Basiswechsel (5.65) zur (reellen) Darstellung (5.66) erhält man die äquivalente
Darstellung

 
0 − cos ψ 2 sin ψ cos ϕ
T∗ (X) =  cos ψ 0 2 sin ψ sin ϕ  . (6.32) {ind11}
−2 sin ψ cos ϕ −2 sin ψ sin ϕ 0

Die infinitesimalen Erzeugenden der Darstellung (5.66) sind also die reellen antisymmetri-
schen 3 × 3 Matrizen. Dies muß so sein, denn einerseits ist

d d
T∗ (X) = T (g(θ, ψ, ϕ)) |θ=0 = R(θ, ψ, ϕ)|θ=0 (6.33) {ind13}
dθ dθ
und anderseits
d
RRt =⇒ T∗ (X) + T∗t (X) = 0.

0=

Jede irreduzible Darstellung einer Gruppe ist eine irreduzible Darstellung der Lie-Algebra
zugeordnet und (beinahe) umgekehrt. In der Physik konstruiert man oft die Darstellungen
einer Gruppe indem man die Darstellungen der zugehörigen Lie-Algebra studiert.

Nun können wir auf jeder Lie-Algebra g ein Skalarprodukt definieren1 :

(X, Y ) = Sp X † Y = −Sp XY. (6.34) {ind15}

Dieses Skalarprodukt ist invariant unter der adjungierten Darstellung,

(Ad(g)X, Ad(g)Y ) = −Sp gXg −1 gY g −1 = (X, Y ), (6.35) {ind17}

wobei wir die Invarianz der Spur bei zyklischer Vertauschung der Argumente benutzten.
Man sagt kurz, das Skalarprodukt ist Ad-invariant.

Nun wollen wir noch die ’Treuheit’ der adjungierten Darstellung untersuchen. Dazu müssen
wir bestimmen wieviele Gruppenelement auf dasselbe Ad(g) abgebildet werden:
Ad(g1 )X = Ad(g2 )X ⇐⇒ Ad(g2−1 g1 )X = X, ∀X ∈ G.
1 für allgemeine Lie-Gruppe ist dies die Killingform

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 102

Die Frage ist also, wieviele Gruppenelemente g gibt es, sodaß

gXg −1 = X für alle X. (6.36) {ind19}

Wir erinnern uns daran, dass das Zentrum von G diejenigen Elemente enthält, die mit allen
anderen Elementen kommutieren,

Z = {z|zg = gz ∀ g ∈ G} ⊂ G. (6.37) {ind21}

Das Zentrum ist eine Abelsche Untergruppe. Offensichtlich ist


d d
zXz −1 = zg(s)z −1 |t=0 = g(t)|t=0 = X.

dt dt
Tatsächlich sind die Zentrumselemente die einzigen Elemente mit dieser Eigenschaft und

Ad(g1 ) = Ad(g2 ) ⇐⇒ g2 = g1 z, z ∈ Z. (6.38) {ind23}

Das Zentrum von SU (2) besteht aus {e, −e}. Die adjungierte Darstellung SU (2) → SO(3)
bildet g und −g in die gleichen Drehungen ab.

Alle Darstellungen Tj von SU (2) gewinnt man indem man die definierende Darstellung T 21
(auch fundamentale Darstellung genannt) genügend oft mit sich tensoriert. Zum Beispiel ist
die adjungierte Darstellung T1 enthalten in

T 21 × T 21 = T1 + T0 .

Die Dimension der Darstellung Tj ist 2j +1. In der Quantenmechanik werden die Darstellun-
gen von SU (2) mit Hilfe des Auf- und Absteigeoperator in der komplexifizierten Lie-Algebra,

1
σ± = (σ1 ± iσ2 ) mit [σ3 , σ± ] = ±σ± , (6.39) {ind27}
2
konstruiert. Diese Konstruktion mit Hilfe von Leiteroperatoren kann für allgemeine kom-
pakte (halbeinfache) Lie-Algebren verallgemeinert werden.

6.5 Wurzeln eine Lie-Algebra

Wir verallgemeinern die Konstruktion der Auf- und Absteigeoperatoren auf beliebige Lie-
Algebren. Es seien Hi , i = 1, . . . r eine Basis einer Cartan-Unteralgebra, also einer ma-
ximalen Unteralgebra von kommutierenden Generatoren. Nun erweitern wir die Hi durch
komplexe Kombinationen Eα der Xi , so dass

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 103

[Hi , Eα ] = αi Eα , 1 ≤ i ≤ r. (6.40) {wurz1}

Der reelle r-dimensionale Vektor α heißt Wurzel von g und Eα ist der zur Wurzel α gehörige
Stufenoperator. Man kann zeigen, dass es zu jeder Wurzel (bis auf Vielfaches) nur einen
Stufenoperator gibt. Wegen

Hi Eα − Eα Hi = αi Eα −→ Eα† Hi − Hi Eα† = αi Eα† (6.41) {wurz3}

ist mit α auch −α eine Wurzelvektor und der entsprechende Stufenoperator ist E−α = Eα† .
Die Menge der Wurzeln bezeichnen wir mit Φ. Die Anzahl Wurzeln ist

|Φ| = Dim G − Rang G. (6.42) {wurz5}

Zum Beispiel hat SU (3) 8 − 2 = 6 Wurzeln. Wegen der Jakobi-Identität ist

[Hi , [Eα , Eβ ]] = −[Eβ , [Hi , Eα ]] − [Eα , [Eβ , Hi ]] = (αi + βi )[Eα , Eβ ],

so dass mit α, β auch α + β eine Wurzel ist, falls Eα+β ∼ [Eα , Eβ ] nicht verschwindet.
Schlußendlich kommutiert [Eα , E−α ] mit den Hi und muß in der Cartan-Unteralgebra
liegen, also eine Linearkombination der Hi sein, [Eα , E−α ] = βi Hi . Nun ist aber

Sp Hi [Eα , E−α ] = Sp E−α [Hi , Eα ] = αi Sp (E−α Eα ) = Sp Hi βj Hj = βi Sp Hi2 .

Nun können wir die Stufenoperatoren so normieren, dass wir schlußendlich folgende Kom-
mutationregeln haben

ǫ(α, β)Eα+β falls α + β eine Wurzel ist


(
[Eα , Eβ ] = 2α · H/α2 ≡ Hα falls α = −β ist (6.43) {wurz7}
0 sonst.
Man kann die antisymmetrischen ǫ(α, β) gleich ±1 wählen. Für jede Wurzel α bilden

{I+ , I− , I3 } ∼ Eα , E−α , 2α · H/α2



(6.44) {wurz9}

eine su(2) Unteralgebra (in der komplexen Basis) mit den bekannte su(2)-Kommutationsregeln

[I+ , I− ] = I3 , [I3 , I± ] = ±I± , . (6.45) {wurz11}

Nun erinnern wir uns daran, dass in jeder unitären Darstellung die Eigenwerte von I3 , dass
heißt von Hα halbganz sein müssen. Wegen

2α · β
[Hα , Eβ ] = Eβ (6.46) {wurz13}
α2

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 104

sind die Eigenwerte dieses Operators in der adjungierten Darstellung gleich 2(α, β)/α2 und
wir schließen, dass

2(α, β)
∈ Z für alle Wurzeln α, β ∈ Φ. (6.47) {wurz15}
α2
Mit H1 = λ3 und H2 = λ8 hat man für SU (3) folgende Wurzeln und Stufenoperatoren:
α(1) = (2, 0), Eα(1) = X1 + iX2

α(2) = (−1, 3), Eα(2) = X7 + iX7

α(3) = (1, 3), Eα(3) = X4 + iX5 .
Ausgeschrieben sieht dies folgendermassen aus
   
0 1 0 1 0 0
Eα(1) =  0 0 0  Hα(1) =  0 −1 0 
0 0 0 0 0 0
   
0 0 0 0 0 0
Eα(2) =  0 0 1  Hα(2) =  0 1 0 
0 0 0 0 0 −1
   
0 0 1 1 0 0
Hα(3) =  0 0 0  Hα(3) =  0 0 0 .
0 0 0 0 0 −1
Die Wurzeln einer Lie-Algebra spannen ein Rang(G)-dimensionales Wurzelgitter auf. Die
folgende Abbildung enthält der unitären Gruppe SU (3).

Die Weyl-Reflektionen sind Automorphismen auf dem Wurzelgitter. Sei


σα (s) = eiπs(Eα +E−α )/2 ∈ G.
Dann findet man (die dritte Ableitung ist proportional zur ersten)
(β, α)
σα (s)Hβ σα−1 (s) = Hβ + (Hα cos(πs) − i(Eα − E−α ) sin πs − Hα ) .
β2
Setzen wir σα = σα (1) dann finden wir die Identität

(β, α)
σα Hβ σα−1 = Hβ − 2 Hα . (6.48) {wurz17}
β2

Wegen Hβ = 2(β, H)/β 2 ist diese äquivalent zu

(β, α)
β −→ β − 2 α. (6.49) {wurz19}
α2
Dies ist aber gerade die Reflektion σα (β) von β an der Ebene senkrecht zur Wurzel α. Nun

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.5. Wurzeln eine Lie-Algebra 105

Weyl
reflektion
α(3) α(2)
b b

−α(1) α(1)

erste Weyl-
kammer

−α(2) −α(3)

weyl
Abbildung 6.1: Das Wurzelgitter von SU (3).

konjugieren wir die Gleichung

(σα (β), γ)
[σα Hβ σα−1 , Eγ ] = [Hσα (β) , Eγ ] = 2 Eγ ,
β2

wobei wir benutzten, dass die Spiegelung σα längenerhaltend ist, mit σα−1 . Spiegelungen sind
symmetrische Operationen und deshalb erhalten wir

(β, σα (γ)) −1
[Hβ , σα−1 Eγ σα ] = 2 σα Eγ σα .
β2
Dies beweist, dass das Wurzelgitter unter den Spiegelungen senkrecht zu allen Wurzeln in
sich übergeht: Für jedes Paar von Wurzeln α, β ist

(α, β)
σα (β) = β − 2 α (6.50) {wurz21}
α2
wieder eine Wurzel. Jede dieser Spiegelungen permutiert die Wurzeln in Φ. Diese Spiegelun-
gen nennt man die Weyl-Reflektionen. Sie bilden die endliche Weyl-Gruppe W (G). In der
Abbildung (6.1) sind die Spiegelungsebenen und eine Reflektion eingezeichnet.

Im Allgemeinen ist die Anzahl Wurzeln grösser als der Rang der Gruppe, so dass diese linear
abhängig sind. Deshalb ist es sinnvoll eine Basis

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 106


∆ = α(1) , . . . , α(r) (6.51) {wurz23}

auszuwählen, so dass jede Wurzel eine Linearkombination dieser einfachen Wurzeln ist. Man
kann eine Basis wählen, so dass

r
X
α= ni α(i) (6.52) {wurz25}
i=1

wobei alle Koeffizienten ni ∈ Z entweder ganzzahlig nichtnegativ (ni ≥ 0) oder ganzzahlig


nichtpositiv (ni ≤ 0) sind. Im ersten Fall heißt α positiv, im zweiten negativ. Sind nur ein
Satz einfacher Wurzeln bekannt, dann kann man durch Weyl-Reflektionen der einfachen
Wurzeln das gesamte Wurzelsystem rekonstruieren.

6.6 Gewichte einer Darstellung

Wir betrachten eine endlichdimensionale Darstellung T der Gruppe G auf einem Vektorraum
V . Da die T∗ (Hi ) miteinander vertauschen, können wir sie gleichzeitig diagonalisieren,

T∗ (Hi )|µi = µi |µi. (6.53) {gew1}

Der r-dimensionale Vektor µ = (µ1 , . . . , µr ) heißt Gewichtsvektor. Da die

Hα , Eα , E−α und damit T∗ (Hα ), T∗ (Eα ), T∗ (E−α ) (6.54) {gew3}

eine su(2)-Unteralgebra von G aufspannen, muß wegen

2(µ, α)
T∗ (Hα )|µi = |µi (6.55) {gew5}
α2
der Eigenwert auf der rechten Seite eine ganze Zahl sein,

2(α, µ)
∈ Z für alle Wurzeln α ∈ Φ. (6.56) {gew7}
α2
Diese Bedingung definiert das Gewichtsgitter von g. Weiterhin zerfallen die Eigenzustände
|µi in Multipletts unter der Wirkung von Hα , E±α . Wegen

σβ Hα σβ−1 = Hσβ (α) , σβ E±α σβ−1 = E±σβ (α)

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 107

gilt nämlich2
2(α, µ)
σβ Hα |µi = σβ |µi = Hσβ (α) σβ |µi.
α2
Setzen wir σβ (α) = δ und benutzen, dass σβ unitär ist, dann folgt


2 δ, σβ (µ)
Hδ σβ |µi = σβ |µi (6.57) {gew9}
δ2
für alle Wurzeln und Gewichte. Damit werden die Gewichte einer Darstellung unter den
Weyl-Reflektionen ineinander abgebildet.

Es genügt die Forderung (6.56) für eine Basis von Wurzeln zu fordern, da alle Wurzeln durch
Weylreflektionen aus diesen einfachen Wurzeln gewonnen werden können. Entsprechend
können wir im Gewichtsgitter eine Basis von fundamentalen Gewichten, definiert durch

(λ(i) , α(j) )
2 = δij , 1 ≤ i, j ≤ r (6.58) {gew11}
α2(j)

einführen. Jedes Gewicht ist eine integrale Linearkombination der fundamentalen Gewichte,

r
ni ∈ Z.
X
λ= ni λ(i) , (6.59) {gew13}
1

Sind alle ganze Zahlen ni ≥ 0, dann heißt λ dominantes Gewicht. Offensichtlich ist ein
Gewicht λ dominant genau dann wenn


α(i) , λ ≥ 0, 1≤i≤r (6.60) {gew15}

gilt. Jedes Gewicht kann mit einer Weyl-Reflektion in ein eindeutiges dominantes Gewicht
abgebildet werden. Für SU (3) sind die fundamentalen Gewichte
√   
1 3 2 0
λ(1) = √ und λ(2) = √ .
3 1 3 1
In jeder endlichdimensionalen Darstellung von G können wir einen Zustand |µi mit höchstem
Gewicht finden, so dass

r
X
hρ|µi am grössten ist, wo ρ = λ(i) (6.61) {gew17}
1

eine spezielles dominantes Gewicht ist. Das Skalarprodukt hρ|αi ist positiv für positive α
2 Im Folgenden schreiben wir wieder Hα und σα anstelle von U∗ (Hα ) und U (σα ).

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 108

und negativ für negative α. Man kann zeigen, dass ρ die halbe Summe der positiven Wurzeln
ist. Ein Zustand mit höchstem Gewicht wird von allen Eα , α > 0 annihiliert,

Eα |µi = 0, α > 0. (6.62) {gew19}

Wäre dem nicht so, dann hätte dieser Zustand Gewicht µ + α und wäre grösser als µ. Zu
jedem dominanten Gewicht µ gibt es eine eindeutige irreduzible Darstellung. Sie besteht aus
Zuständen der Form

E−β1 E−β2 · · · E−βm |µi, βi > 0. (6.63) {gew21}

Wenden wir diese Resultate auf SU (3) an. Die Gewichte


√   √   
1 3 1 − 3 −2 0
λ(1) = √ , λ(1) −α(1) = √ und λ(1) −α(3) = √
3 1 3 1 3 1
bilden eine 3-dimensionale Darstellung mit höchsten Gewicht µ3 = λ(1) . Dies ist gerade die
fundamentale Darstellung mit Eigenvektoren
|µ3 i ∼ e1 , |µ3 − α(1) i = e2 und |µ3 − α(3) i = e3 .
Nun gibt es auch noch eine weitere drei-dimensionale Darstellung mit höchsten Gewicht
µ3̄ = λ(2) , nämlich
  √  √ 
2 0 1 3 −1 3
µ3̄ = √ , µ3̄ −α(2) = √ und µ3̄ −α(3) = √ .
3 1 3 −1 3 1
Bis auf Permutationen können wir die Eigenwerte der zu dieser Darstellung gehörenden
T∗ (Hi ), i = 1, 2 ablesen. Folgende Matrizen haben diese Eigenwerte (die Matrizen sind
immer nur bis auf Äquivalent bestimmt)

T∗ (H1 ) = −H1 und T∗ (H2 ) = −H2 . (6.64) {gew23}

Die zugehörigen Eigenvektoren sind


     
0 0 1
|µ3̄ i =  0  , |µ3̄ −α(2) i =  1  , |µ3̄ −α(3) i =  0  .
1 0 0
Die zugehörigen Stufenoperatoren haben die Form

T∗ (Eα ) = −Eαt . (6.65) {gew25}

Dies sind genau die Erzeugenden der komplex konjugierten Darstellung


T : g −→ ḡ.
Dies ist leicht einzusehen:
ġ(0) = X =⇒ T∗ (X) = ḡ˙ (0) = X̄ = (X † )t = −X t .

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 109

Tensorprodukt von Darstellungen: Es seine T1 und T2 zwei Darstellungen auf den


Darstellungsräumen V1 und V2 . Dann ist die Tensorprodukt-Darstellung

T = T1 ⊗ T2 : g −→ T1 (g) ⊗ T2 (g) (6.66) {tensors1}

auf V1 × V2 im Allgemeinen reduzibel, auch wenn die Darstellungen Ti irreduzibel waren.


Die induzierte Darstellung der Lie-Algebra ist

d
T1 (g(t)) ⊗ T2 (g(t)) t=0 = T∗1 (X) ⊗ 1 + 1 ⊗ T∗2 (X).

T∗ (X) = (6.67) {tensors3}
dt
Sind |µi i höchsten Gewichte der Darstellungen Ti , dann ist |µ1 i ⊗ |µ2 i ein höchstes Gewicht
der Tensordarstellung.

Schauen wir uns die Tensordarstellung 3 × 3̄ von SU (3) etwas genauer an.

Weylreflektionen

α2

λ2
λ1

α1

3 simple roots

3 3x3=8+1
weightsu3
Abbildung 6.2: Gewichtsgitter von SU (3).

Die 9 Gewichte der Tensordarstellung 3 × 3̄ sind die Summen der Gewichte der Faktoren,

{λ3×3̄ } = {λ3(i) + λ3̄(j) , i, j = 1, 2, 3}.



Das höchste Gewicht ist µ3×3̄ = µ3 + µ3̄ = (1, 3). Diese Gewichte sind in der Figur

————————————
A. Wipf, Mathematische Methoden der Physik
Kapitel 6. Lie-Algebren 6.6. Gewichte einer Darstellung 110

6.2 eingezeichnet. Nun wollen noch bestimmen, was die irreduziblen Bestandteile dieser 9-
dimensionalen Darstellung ist. Sei vi wj die 9 Komponenten eines Vektors im Tensorprodukt
der Darstellungsräume von 3 und 3̄. Unter der Tensordarstellung transformieren diese wie

vi wj −→ gip ḡjq vp wq ⇐⇒ A −→ gAg † = gAg −1 , Aij = vi wj .

Da aber

tr A −→ tr gAg −1 = tr A (6.68) {tensors5}


P
ist, ist tr A = vi wi ein eindimensionaler invarianter Unterraum der Tensorproduktdar-
stellung. Auf dem Unterraum senkrecht dazu, d.h. auf denjenigen A mit tr A = 0, ist (6.68)
genau die adjungierte Darstellung. Als gilt

3 × 3̄ = 1 ⊕ 8, 8 = adjungierte Darstellung.

Eine allgemeine irreduzible Darstellung von SU (3) wir durch Angabe zweier positiver ganzer
Zahlen charakterisiert. Zerlegt man das höchste Gewicht µ in die fundamentalen Gewichte,

µ = nµ3 + mµ3̄ ,

dann charakterisieren (m, n) die Darstellung.

(m, n) (0, 0) (0, 1) (1, 0) (0, 2) (2, 0) (1, 1) (0, 3) (3, 0) (1, 2) (2, 1)

Dimension 1 3 3̄ 6 6̄ 8 = 8̄ 10 1̄0 15 ¯
15

————————————
A. Wipf, Mathematische Methoden der Physik