Sie sind auf Seite 1von 272

Skriptum zur Vorlesung

Einführung in die Physikalischen


Rechenmethoden I + II

Univ. Prof. Dr. Christoph Dellago

Universität Wien
Fakultät für Physik
Institut für Experimentalphysik
Boltzmanngasse 5, 1090 Wien
christoph.dellago@univie.ac.at
http://comp-phys.univie.ac.at
Literatur

Lehrbücher
- George Arfken, Mathematical Methods for Physicists, Academic Press, San Diego (1985).
- Siegfried Großmann, Mathematischer Einführungskurs für die Physik, Teubner, Stuttgart
(1974).
- Sadri Hassani, Mathematical Methods for Students of Physics and Related Fields, Springer-
Verlag, New York (2000).
- Helmuth Horvath, Rechenmethoden und ihre Anwendungen in Physik und Chemie, Biblio-
graphisches Institut, Mannheim, Wien, Zürich (1977).
- May-Britt Kallenrode, Rechenmethoden der Physik, Springer-Verlag, Berlin (2003).
- Klaus Weltner, Mathematik für Physiker I und II, Springer-Verlag, Berlin (2001).
- Helmut Fischer und Helmut Kaul, Mathematik für Physiker, Teubner, Stuttgart (1988).
- Gerhard Berendt und Evelyn Weimar, Mathematik für Physiker, Physik-Verlag, Weinheim
(1979).

Formelsammlungen
- Johann Rast (Heinrich Netz), Formeln der Mathematik, Carl Hanser Verlag, München, Wien
(1983).
- Hans-Jochen Bartsch, Taschenbuch Mathematischer Formeln, Fachbuchverlag Leipzig (2004).
- Ilja N. Bronstein, Konstantin A. Semendjajew, Gerhard Musiol, Taschenbuch der Mathema-
tik, Verlag Harri Deutsch, Frankfurt am Main (2000).

Web-Ressourcen
- http://mathworld.wolfram.com
- http://www.mathe-online.at

3
4
Inhaltsverzeichnis

I Einführung in die Physikalischen Rechenmethoden I 9


1 Funktionen 11
1.1 Der Funktionsbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Darstellung von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1 Analytische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.2 Funktionstafel (Wertetabelle) . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.3 Graphische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Eigenschaften von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1 Definitionsbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.2 Nullstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.3 Gerade und ungerade Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.4 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.5 Grenzwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.7 Singularitäten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4 Neue Funktionen aus alten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.1 Verkettung von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.2 Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5 Wichtige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.5.1 Lineare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.5.2 Potenzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5.3 Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.5.4 Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.5.5 Winkelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.6 Arcusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.5.7 Hyperbolische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5.8 Areafunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2 Vektoren 35
2.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2 Koordinatensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.1 Kartesische Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.3 Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2.4 Kugelkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.3 Vektoralgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.1 Gleiche, inverse und parallele Vektoren . . . . . . . . . . . . . . . . . . . . . 44
2.3.2 Vektoraddition und -subtraktion . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3.3 Multiplikation eines Vektors mit einem Skalar . . . . . . . . . . . . . . . . . 47
2.4 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.3 Komponentenweise Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5
6 INHALTSVERZEICHNIS

2.5 Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.5.3 Komponentenweise Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.5.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6 Spatprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6.2 Komponentenweise Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.6.3 Rechenregeln und Anwendung . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.7 Mehrfachprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.8 Anwendungsbeispiele für Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.8.1 Strömung durch eine Fläche . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.8.2 Rotation eines Körpers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.8.3 Volumen einer Einheitszelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

3 Differentiation 67
3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3 Wichtige Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4 Differentiationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.2 Summenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.3 Produktregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.4 Quotientenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.5 Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.6 Umkehrregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6 Maxima und Minima von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.7 Differentiation von Funktionen in Parameterform . . . . . . . . . . . . . . . . . . . 74
3.8 Differentiation von Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.9 Partielle Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.9.1 Funktionen mehrerer Variabler . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.9.2 Partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.9.3 Anstieg einer impliziten Funktion . . . . . . . . . . . . . . . . . . . . . . . . 81

4 Integration 83
4.1 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.4 Zusammenhang zwischen bestimmtem und unbestimmtem Integral . . . . . . . . . 89
4.5 Rechenregeln für das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . 93
4.6 Grundregeln des Integrierens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.6.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.6.2 Summenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.6.3 Substitutionsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.6.4 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.7 Rotationskörper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.8 Berechnung von Bogenlängen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.9 Mittelwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.10 Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.10.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.10.2 Berechnung von Doppelintegralen . . . . . . . . . . . . . . . . . . . . . . . . 110
4.10.3 Doppelintegrale in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . 114
4.11 Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.11.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.11.2 Berechnung von Dreifachintegralen . . . . . . . . . . . . . . . . . . . . . . . 118
INHALTSVERZEICHNIS 7

4.11.3 Dreifachintegrale in Zylinder- und Kugelkoordinaten . . . . . . . . . . . . . 120


4.12 Integration von vektorwertigen Funktionen . . . . . . . . . . . . . . . . . . . . . . 121

II Einführung in die Physikalischen Rechenmethoden II 123


5 Komplexe Zahlen 125
5.1 Definition und Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.2 Rechenregeln für komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl . . . . . . . . . 128
5.2.3 Komplex konjugierte Zahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.2.4 Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.2.5 Division . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.3 Die Exponentialform von komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . 132
5.3.1 Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.3.2 Polardarstellung von komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 134
5.3.3 Umkehrung der Eulerschen Formel . . . . . . . . . . . . . . . . . . . . . . . 134
5.3.4 Additionstheoreme für Winkelfunktionen . . . . . . . . . . . . . . . . . . . 135
5.3.5 Komplexe Zahlen als Exponenten . . . . . . . . . . . . . . . . . . . . . . . . 135
5.4 Potenzieren und komplexe Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.5 Darstellung von Kurven mit komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 139

6 Fehlerrechnung 141
6.1 Systematische und statistische Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . 141
6.2 Mittelwert und Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
6.3 Verteilungen und Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.3.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.3.2 Momente einer Verteilung, Erwartungswert . . . . . . . . . . . . . . . . . . 149
6.3.3 x und s2 als Schätzer für µ und σ 2 . . . . . . . . . . . . . . . . . . . . . . . 151
6.3.4 Fehler des Mittelwerts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.3.5 Die Gaußsche Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.6 Verteilung diskreter Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
6.3.7 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.4 Fehlerfortpflanzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
6.4.1 Fortpflanzung von Maximalfehlern . . . . . . . . . . . . . . . . . . . . . . . 159
6.4.2 Fortpflanzung statistischer Kennwerte . . . . . . . . . . . . . . . . . . . . . 160
6.5 Ausgleichsrechnung (Fitten) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

7 Differentiation von Feldern: grad, div und rot 167


7.1 Felder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.1.1 Skalarfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.1.2 Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.2 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.2.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.2.3 Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.2.4 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.3 Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
7.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
7.3.2 Anschauliche Interpretation als lokale Quellstärke . . . . . . . . . . . . . . . 174
7.3.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
7.4 Laplace-Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.5 Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.5.2 Anschauliche Interpretation als lokale Wirbelstärke . . . . . . . . . . . . . . 179
8 INHALTSVERZEICHNIS

7.5.3 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182


7.5.4 Wirbelfreie und quellenfreie Felder . . . . . . . . . . . . . . . . . . . . . . . 183
7.6 Zusammenfassung Nabla-Operator ∇ . . . . . . . . . . . . . . . . . . . . . . . . . . 184

8 Integration von Feldern: Kurven- und Flächenintegrale 187


8.1 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
8.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
8.1.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
8.1.3 Berechnungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.1.4 Kurvenintegrale über Gradientenfelder . . . . . . . . . . . . . . . . . . . . . 194
8.2 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
8.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
8.2.2 Darstellung der Fläche und des Flächenelements . . . . . . . . . . . . . . . 200
8.2.3 Das Flächenelement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.2.4 Berechnung des Oberflächenintegrals . . . . . . . . . . . . . . . . . . . . . . 204
8.3 Der Integralsatz von Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
8.3.1 Integraldarstellung der Divergenz . . . . . . . . . . . . . . . . . . . . . . . . 206
8.3.2 Formulierung und Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes . . . . . . . . . . . . . 212
8.3.4 Die Sätze von Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
8.4 Der Integralsatz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.4.1 Integraldarstellung der Rotation . . . . . . . . . . . . . . . . . . . . . . . . 217
8.4.2 Formulierung und Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 220
8.4.3 Bedeutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
8.4.4 Das Vektorpotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

9 Differentialgleichungen 227
9.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
9.2 Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.2.1 Differentialgleichungen mit separierbaren Variablen . . . . . . . . . . . . . . 230
9.2.2 Homogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . . . . . 235
9.2.3 Inhomogene lineare Differentialgleichung . . . . . . . . . . . . . . . . . . . . 237
9.3 Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . 246
9.3.1 Homogene Differentialgleichung mit konstanten Koeffizienten . . . . . . . . 246
9.3.2 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
9.3.3 Die gedämpfte Schwingung . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
9.3.4 Die inhomogene lineare Diffgl. 2. Ordnung mit konstanten Koeffizienten . . 256

10 Die Taylorreihe 261


10.1 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
10.2 Entwicklung einer Funktion in eine Taylorreihe . . . . . . . . . . . . . . . . . . . . 263
10.3 Allgemeine Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
10.4 Abgebrochene Taylorreihenentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . 266
10.5 Fehlerabschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
Teil I

Einführung in die Physikalischen


Rechenmethoden I

9
Kapitel 1

Funktionen

1.1 Der Funktionsbegriff

In der Physik (und in den Naturwissenschaften im Allgemeinen) arbeiten wir mit Größen, die ent-
weder konstant sind (d.h. sie nehmen wie die Lichtgeschwindigkeit oder die Erdbeschleunigung nur
bestimmte, fixe Werte an) oder eine ganze Fülle von Werten annehmen können. Wir unterschei-
den deshalb zwischen Konstanten und Variablen (z.B. verstrichene Zeit, Länge eines Objekts,
Position eines Objekts, Temperatur eines gewissen Materials, Druck eines Gases, etc.).

Um physikalische Zusammenhänge zu verstehen, betrachten wir oft eine Variable in Abhängigkeit


einer anderen Variablen. So könnten wir zum Beispiel daran interessiert sein, wie sich der Druck
p eines in einem bestimmten Volumen V eingeschlossenen Gases verhält, wenn dessen Temperatur
T verändert wird. Für jede Temperatur T herrscht im Gas ein bestimmter Druck p. In anderen
Worten: der Druck p ändert sich mit der Temperatur T . Zur Beschreibung solcher Zusammenhänge
zwischen Variablen benutzen wir Funktionen.

Definition: Eine Funktion f (x) ordnet jedem Element x des Definitionsbereichs D eindeutig ein
Element y des Wertebereichs W zu (siehe Abb. 1.1).

Abbildung 1.1: Die Funktion f (x) mit Definitionsbereich D und Wertebereich W .

Wir sagen dann, dass wir y als Funktion von x betrachten. In unserem Beispiel mit dem Gas
betrachten wir etwa den Druck p als Funktion der Temperatur T und schreiben p(T ). Wichtig
ist hier, dass die Zuordnung eindeutig ist. Das heißt, dass jedem Wert x genau ein Wert y
zugeordnet wird (sonst ist f (x) keine Funktion) (siehe Abb. 1.2). Es ist also nicht erlaubt, einem
Element des Definitionsbereichs zwei oder mehr Elemente des Wertebereichs zuzuordnen. Hingegen
darf sehr wohl ein Element des Wertebereichs mehreren Werten des Definitionsbereichs angehören.
Auch muss nicht jedes Element
√ des Wertebereichs vom Definitionsbereich aus erreicht werden. Die
Wurzelfunktion f (x) = ± x ist daher beispielsweise keine echte Funktion, da sowohl der negative
als auch der positive Wert der Wurzel zulässig sind. Betrachtet man hingegen nur den positiven
oder den negativen Zweig der “Wurzelfunktion”, sind alle geforderten Eigenschaften erfüllt.

Die Funktion f (x) ist also eine Zuordnungsvorschrift. Dabei wird x als unabhängige Variable

11
12 1 Funktionen

Abbildung 1.2: Nur eine eindeutige Zuordnung ist eine Funktion.

oder Argument (auch Stelle) bezeichnet und y als abhängige Variable oder Funktionswert.

Man kann die Zuordnung auch schreiben als


f
x−
→y oder f : x 7→ y. (1.1)

Dies bedeutet, dass die Funktion f dem Wert x einen Wert y zuordnet. Diese Notation werden
Sie jedoch kaum in Physikbüchern finden. Oft wird in der Physik auch der Definitionsbereich
nicht explizit erwähnt. Dieser ergibt sich meistens aus dem Zusammenhang. Funktionen werden
auch Abbildungen genannt und man sagt “x wird auf y abgebildet”. Die Notation f (x) für eine
Funktion ist eigentlich ungenau, denn genau genommen bezeichnet f (x) den Funktionswert an der
Stelle x und nicht die Zuordnungsvorschrift. Diese Schreibweise ist jedoch sehr praktisch und wird
daher in der Physik gerne benutzt.

1.2 Darstellung von Funktionen

Funktionen lassen sich auf verschiedene Weisen darstellen, wie wir im Folgenden besprechen werden.

1.2.1 Analytische Darstellung

In der analytischen Darstellung wird die Zuordnungsvorschrift als Gleichung (Funktionsglei-


chung) in einer von drei Formen angegeben:

• Explizite Darstellung: y = f (x)


Die Funktion ist nach einer Variablen aufgelöst und der Wert y kann für ein bestimmtes
Argument x sofort berechnet werden, zum Beispiel y = x2 . In diesem Fall haben wir eine
Rechenvorschrift, mit der wir f (x) direkt aus x ermitteln können.
• Implizite Darstellung: F (x, y) = 0
Die Funktion ist nicht nach einer der beiden Variablen aufgelöst. Ein Beispiel ist die Gleichung
eines Kreises mit Radius 1 um den Ursprung: x2 + y 2 − 1 = 0. In vielen Fällen ist es möglich,
2 2
die implizite
√ Darstellung in
√ eine explizite zu verwandeln, zum Beispiel (x + y − 1 = 0) →
2 2
y1 = 1 − x und y2 = − 1 − x . Diese Verwandlung von impliziter zu expliziter Form ist
jedoch nicht immer möglich.
• Parameterdarstellung:
Bei dieser Form der Darstellung werden beide Variablen (sowohl das Argument als auch der
Funktionswert) als Funktion einer Hilfsvariablen t ausgedrückt:

x = x(t), (1.2)
y = y(t). (1.3)
1 Funktionen 13

Abbildung 1.3: Wurfparabel für horizontale Anfangsgeschwindigkeit.

Die Hilfsvariable, hier t, wird auch als Parameter bezeichnet.


Betrachten wir zum Beispiel die Bahnkurve eines im Erdschwerefeld in horizontaler Richtung
geworfenen Objekts (siehe Abb. 1.3). Dabei können wir versuchen, die vertikale Lage y als
Funktion der horizontalen Entfernung x anzugeben, also y = f (x). In diesem Fall ist es
jedoch einfacher, zunächst sowohl x als auch y als Funktion der Zeit t auszudrücken. Unter
Vernachlässigung der Reibung gilt:
x = v0 t, (1.4)
g
y = − t2 . (1.5)
2
Die Gleichungen (1.4) und (1.5) sind die Parameterdarstellung der in Abb. 1.3 abgebildeten
Wurfparabel. Dabei ist v0 die Anfangsgeschwindigkeit in x-Richtung und g die Erdbe-
schleunigung. Der Anfangspunkt liegt im Ursprung: x(0) = 0 und y(0) = 0. Durch die obige
Vorschrift erhalten wir für jedes t ein Paar (x(t), y(t)).
Durch Auflösen der ersten Gleichung nach t und Einsetzen in die zweite Gleichung erhalten
wir die explizite Form der Wurfparabel:
 2
g x g
y=− = − 2 x2 . (1.6)
2 v0 2v0

1.2.2 Funktionstafel (Wertetabelle)

Hier werden Paare von unabhängigen und abhängigen Variablen in tabellarischer Form dargestellt,
zum Beispiel:

x 0 1 2 3 4 5 ...
y 0 -1 -4 -9 -16 -25 ...

(Diese Daten ergeben sich für das obige Beispiel im Falle g/2v02 = 1.) Die tabellarische Darstel-
lung wird häufig für empirisch bestimmte Messdaten verwendet oder wenn es auf den genauen
Zahlenwert ankommt.

1.2.3 Graphische Darstellung

Funktionen lassen sich in der graphischen Darstellungsart besonders gut veranschaulichen. Dabei
werden die Wertepaare der Funktion in einem rechtwinkligen (kartesischen) Koordinatensystem
als Funktionsgraph dargestellt (siehe Abb. 1.4). Üblicherweise wird auf der horizontalen Achse
der x-Wert und auf der vertikalen Achse der y-Wert aufgetragen. Die x-Achse wird auch Abszisse
und die y-Achse Ordinate genannt.
14 1 Funktionen

Abbildung 1.4: Graph einer Funktion in einem kartesischen Koordinatensystem.

1.3 Eigenschaften von Funktionen

In diesem Abschnitt fassen wir einige wichtige Eigenschaften von Funktionen zusammen.

1.3.1 Definitionsbereich

Der Definitionsbereich besteht aus der Menge aller Argumente, für welche die Funktion definiert
ist. In dieser Vorlesung werden wir vor allem verschiedene Intervalle der reellen Zahlen R als
Definitionsbereich betrachten. Dabei unterscheiden wir offene Intervalle

(a, b) = {x ∈ R|a < x < b}, (1.7)

welche die Endpunkte a und b nicht enthalten, und geschlossene Intervalle

[a, b] = {x ∈ R|a ≤ x ≤ b}, (1.8)

welche die Endpunkte a und b enthalten. Oft können Funktionen nur für einen recht eingeschränk-

ten Definitionsbereich definiert werden. Zum Beispiel kann bei der Funktion y = 1 − x2 das
Argument nur Werte im Intervall −1 ≤ x ≤ 1 annehmen. Für reelle Werte außerhalb dieses Be-
reichs ist das Argument der Wurzel negativ und der Funktionswert somit nicht reell. Falls wir
nur reelle Funktionswerte betrachten wollen, müssen wir den Definitionsbereich auf |x| ≤ 1 ein-
schränken (Grenzen mit eingeschlossen).Wir schreiben dafür auch x ∈ [−1, 1]. Oft schließen wir
auch einzelne Punkte aus dem Definitionsbereich aus. Zum Beispiel ist die Funktion f (x) = 1/x
für den Definitionsbereich R\{0} (das sind die reellen Zahlen ohne die Null) definiert.

1.3.2 Nullstellen

Eine Funktion y = f (x) besitzt an der Stelle x0 eine Nullstelle, falls f (x0 ) = 0. Zum Beispiel
besitzt die Funktion f (x) = x2 − 1 an den Stellen x1 = −1 und x2 = 1 Nullstellen.

1.3.3 Gerade und ungerade Funktionen

Eine Funktion mit symmetrischem Definitionsbereich heißt gerade (siehe Abb. 1.5), falls gilt

f (x) = f (−x). (1.9)


1 Funktionen 15

Eine Funktion heißt ungerade (siehe Abb. 1.6), falls

f (x) = −f (−x). (1.10)

Anschaulich ist eine gerade Funktion spiegelsymmetrisch (achsensymmetrisch) zur y-Achse; eine
ungerade Funktion ist punktsymmetrisch zum Ursprung.

Abbildung 1.5: Gerade Funktionen. Abbildung 1.6: Ungerade Funktionen.

1.3.4 Monotonie

Es seien x1 und x2 zwei beliebige Werte aus dem Definitionsbereich (x1 , x2 ∈ D) einer Funktion
f (x), die der Bedingung x1 < x2 genügen. Dann heißt die Funktion:

• monoton wachsend, falls f (x1 ) ≤ f (x2 ),

• streng monoton wachsend, falls f (x1 ) < f (x2 ),

• monoton fallend, falls f (x1 ) ≥ f (x2 ),

• streng monoton fallend, falls f (x1 ) > f (x2 ).

Abbildung 1.7: Monotonieeigenschaften von Funktionen.

1.3.5 Grenzwert

Eine Funktion y = f (x) sei in einer Umgebung von x0 definiert. Gilt dann für jede im Definitions-
bereich der Funktion liegende und gegen x0 konvergente Zahlenfolge {xn } mit xn 6= x0

lim f (xn ) = g, (1.11)


n→∞
16 1 Funktionen

so heißt g der Grenzwert von y = f (x) an der Stelle x0 :

lim f (x) = g. (1.12)


x→x0

Eine Folge ist dabei eine Abbildung mit den natürlichen Zahlen N = {0, 1, 2, 3, . . .} als Definiti-
onsbereich. (Für die genaue Definition einer Folge siehe Kapitel 10.) Ein Beispiel einer Folge ist
1, 1/2, 1/3, 1/4, . . .. Diese Folge nähert sich dem Wert 0. Damit der Grenzwert einer Funktion f (x)
an der Stelle x0 existiert, darf es also nicht darauf ankommen, auf welche Weise man sich dem
Punkt x0 nähert.

Abbildung 1.8: An der Stelle x1 besitzt die Funktion einen Grenzwert, an der Stelle x2 nicht.

Beispiel:

Gesucht ist
x2
lim . (1.13)
x→∞ x2 + x + 1

Wir dividieren zunächst Zähler und Nenner durch x2 :

x2 1
lim = lim . (1.14)
x→∞ x2 + x + 1 x→∞ 1 + 1/x + 1/x2

Da sowohl 1/x als 1/x2 für x → ∞ gegen 0 gehen, erhalten wir:

x2
lim = 1. (1.15)
x→∞ x2 +x+1

1.3.6 Stetigkeit

Abbildung 1.9: Diese Funktion hat an der Stelle x0 eine Unstetigkeitsstelle.


1 Funktionen 17

Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion y = f (x) heißt an der
Stelle x0 stetig, wenn der Grenzwert der Funktion an dieser Stelle existiert und mit dem dortigen
Funktionswert übereinstimmt:

lim f (x) = f (x0 ). (1.16)


x→x0

Anschaulich kann man Stetigkeit folgendermaßen verstehen: Zeichnet man einen Graphen, kann
es vorkommen, dass die Funktion einen Sprung aufweist (die in Abb. 1.9 dargestellte Funktion
etwa hat bei x0 einen Sprung). In der Nähe von x0 kann man x-Werte finden, die sich nur wenig
voneinander unterscheiden (z.B. ein Punkt knapp links und ein Punkt knapp rechts von x0 ), deren
y-Werte sich aber um einen großen Betrag voneinander unterscheiden. Nähert man sich x0 von
links (ohne x0 genau zu erreichen), erhält man einen anderen Funktionswert, als wenn man das
von rechts tut, d.h. limx→x0− f (x) 6= limx→x0+ f (x). An der Stelle x0 ist die Funktion nicht stetig.
Eine Unstetigkeitsstelle dieser Art bezeichnet man auch als Sprungstelle.

Beispiel:

Die Funktion
(
|x| +1 falls x > 0
f (x) = = sign x = (1.17)
x −1 falls x < 0

hat an der Stelle x = 0 eine Unstetigkeitsstelle (siehe Abb. 1.10).

Abbildung 1.10: Die Funktion f (x) = |x|/x = sign x.

Knickstellen, bei denen sich die Steigung einer Funktion unstetig ändert, können auch in stetigen
Funktionen auftreten.

Beispiel:

Die Funktion

|x| −1 ≤ x ≤ ∞
y= (1.18)
1 x < −1

hat Knickstellen bei x = −1 und x = 0, ist aber überall stetig. (Die erste Ableitung ist jedoch an
den Stellen x = −1 und x = 0 unstetig.)

1.3.7 Singularitäten

Stellen, in deren unmittelbarer Umgebung die Funktionswerte über alle Grenzen hinaus fallen oder
wachsen, heißen Singularitäten oder Unendlichkeitsstellen der Funktion. Diese Stellen sind
ebenfalls Unstetigkeitsstellen.
18 1 Funktionen

Abbildung 1.11: Eine stetige Funktion mit Knickstellen.

Beispiel:

Die Funktion y = 1/x wächst bei Annäherung an x = 0 über alle Grenzen:

1
lim = ∞, (1.19)
x→0+ x
1
lim = −∞. (1.20)
x→0− x

An dieser Stelle hat die Funktion eine Singularität.

Abbildung 1.12: Die Funktion f (x) = 1/x hat an der Stelle x = 0 eine Singularität.

1.4 Neue Funktionen aus alten

Durch Addition, Subtraktion, Multiplikation und Division kann man aus alten Funktionen neue
definieren. Zum Beispiel: h(x) = f (x) + g(x) oder h(x) = f (x) · g(x). Dabei muss natürlich auf
einen passenden Definitionsbereich geachtet werden. In den beiden nächsten Abschnitten werden
wir zwei weitere wichtige Arten kennen lernen, um aus alten Funktionen neue zu definieren.

1.4.1 Verkettung von Funktionen

Gegeben seien zwei Funktionen f (x) und g(x). Die Funktion f (x) ordnet einer Zahl x eine Zahl z
zu: z = f (x). Die Zahl z wird dann als unabhängige Variable für die Funktion g verwendet. Dadurch
wird der Zahl z eine Zahl y zugeordnet: y = g(z). Durch die Hintereinanderanwendung von f
1 Funktionen 19

und g wird der Zahl x eine Zahl y zugeordnet:

y = g(z) = g(f (x)) (1.21)


x → f (x) → g(f (x)). (1.22)

Die Variable z ist nur als Zwischenergebnis interessant, kann also wegfallen. Für die verkettete
(oder auch zusammengesetzte) Funktion schreibt man auch

y = (g ◦ f )(x). (1.23)

Beispiel:

Die Funktionen
f (x) = x2 und g(x) = sin(x) (1.24)
ergeben zusammengesetzt
g(f (x)) = (g ◦ f )(x) = sin(x2 ). (1.25)

Die Verkettung (oder Zusammensetzung) von Funktionen ist im Allgemeinen nicht kommutativ:

(g ◦ f )(x) 6= (f ◦ g)(x). (1.26)

Das heißt, bei der Verkettung von Funktionen kommt es auf die Reihenfolge an.

Beispiel:

Gegeben seien die beiden Funktionen

f (x) = 1 + x und g(x) = 1/x. (1.27)

Während die Zusammensetzung g ◦ f


1
g(f (x)) = (1.28)
1+x
ergibt, erhält man für die Zusammensetzung f ◦ g
1
f (g(x)) = 1 + . (1.29)
x

1.4.2 Umkehrfunktion

Häufig ist es notwendig, für einen gegebenen Wert der abhängigen Variablen den Wert der un-
abhängigen Variablen zu bestimmen. Betrachten wir zum Beispiel den Flächeninhalt y = x2 eines
Quadrats mit Seitenlänge x (siehe Abb. 1.13).

Abbildung 1.13: Flächeninhalt y eines Quadrats mit Seitenlänge x.


20 1 Funktionen


Aus der Fläche können wir natürlich die Kantenlänge x = y bestimmen. Hier haben wir die

Funktion y = f (x) = x2 für x ≥ 0 umgekehrt zu x = f −1 (y) = y. Die Funktion x = f −1 (y)
ist die Umkehrfunktion (oder inverse Funktion) von y = f (x). Dabei haben Argument und
Funktionswert die Rollen vertauscht. Gewissermaßen ermittelt die Umkehrfunktion, woher der
Funktionswert f gekommen ist. In der Umkehrfunktion f −1 (y) ist nun y die unabhängige Variable.
Da wir die unabhängige Variable meistens mit x bezeichnen, nennen wir y in x um und erhalten
folgendes Paar von Funktion und Umkehrfunktion: f (x) und f −1 (x).

Abbildung 1.14: Funktion y = f (x). Abbildung 1.15: Umkehrfunktion x = f −1 (y).

Setzt man eine Funktion mit ihrer Umkehrfunktion zusammen, so wird das Argument x auf sich
selbst abgebildet:

(f ◦ f −1 )(x) = (f −1 ◦ f )(x) = f −1 (f (x)) = x. (1.30)


Als weiteres Beispiel bestimmen wir die Umkehrfunktion der Funktion y = 1 − 4x2 :
p
y = 1 − 4x2 , für D = [0, 1/2] (1.31)
2 2
y = 1 − 4x , (1.32)
4x2 = 1 − y2, (1.33)
1p
x = 1 − y2 y ∈ [0, 1]. (1.34)
2
Somit gilt:
p 1p
f (x) = 1 − 4x2 ; f −1 (x) = 1 − x2 . (1.35)
2

Der Zusammenhang zwischen Funktion und Umkehrfunktion ist in Abb. 1.16 graphisch dargestellt.

Abbildung 1.16: Aus der Funktion f (x) erhalten wir durch Spiegelung an der 45◦ -Geraden die
Umkehrfunktion f −1 (y).
1 Funktionen 21

Natürlich können wir eine Funktion nur umkehren, wenn jedem Element y aus dem Wertebereich
genau ein Wert x aus dem Definitionsbereich zugeordnet ist. Wenn, wie in Abb. 1.17 dargestellt,
mehrere Werte aus dem Definitionsbereich (hier x1 und x2 ) auf denselben Wert des Wertebereichs
(hier y1 ) abgebildet werden, können wir die Funktion nicht umkehren, da wir für Punkt y1 nicht
wissen, welches Argument wir nehmen sollen. Anders gesagt: Eine Funktion y = f (x) ist um-
kehrbar, wenn aus x1 6= x2 stets f (x1 ) 6= f (x2 ) folgt. Falls dies nicht gilt, kann durch geeignete
Einschränkung des Definitionsbereichs die Umkehrung einer solchen Funktion doch ermöglicht wer-
den. Zum Beispiel besitzt die Funktion f (x) = x2 mit D = R für +x und −x jeweils den selben
Funktionswert und ist somit nicht umkehrbar. Schränken wir den Definitionsbereich jedoch auf
D = {x ∈ R|x ≥ 0} ein, ist die Funktion umkehrbar.

Eine Funktion, für die aus x1 6= x2 stets f (x1 ) 6= f (x2 ) folgt, nennt man injektiv. Falls für alle
Werte y im Wertebereich ein Argument x existiert, sodass f (x) = y, ist die Funktion surjektiv.
Eine sowohl injektive als auch surjektive Funktion nennt man bijektiv und genau diese Funktionen
sind umkehrbar.

Abbildung 1.17: Eine Funktion, bei der mehrere Argumente denselben Funktionswert besitzen, ist
nicht umkehrbar.

Wir halten zusammenfassend fest:

• Jede streng monoton wachsende oder fallende Funktion ist umkehrbar.


• Bei der Umkehrung einer Funktion werden der Definitionsbereich und der (gegebenenfalls
passend eingeschränkte) Wertebereich vertauscht.
• Analytisch erhält man die Umkehrfunktion durch Auflösen nach der unabhängigen Variablen
und anschließendes formales Vertauschen der beiden Variablen.
• Graphisch ergibt sich die Umkehrfunktion durch Spiegelung an der 45◦ -Geraden.

1.5 Wichtige Funktionen

Im Folgenden werden wir einige in der Physik wichtige Funktionen kurz in Erinnerung rufen.
Die Auswahl ist aus Platzgründen sehr beschränkt und so sei der Leser für eine vollständigere
Behandlung auf die in der Literaturliste angeführten Nachschlagewerke verwiesen. Eine Fülle von
Informationen über eine Vielzahl von Funktionen (und über Mathematik im Allgemeinen) sind auf
der Webseite http://mathworld.wolfram.com verfügbar.

1.5.1 Lineare Funktionen

Bei der linearen Funktion (eigentlich affine Funktion)

f (x) = kx + b (1.36)

hängt der Funktionswert in einfacher Potenz, d.h. linear vom Argument ab. Die lineare Funktion
besitzt zwei Parameter, k und b. Die Bedeutung dieser beiden Parameter wird in der graphischen
22 1 Funktionen

Darstellung der Funktion als eine Gerade klar (siehe Abb. 1.18). Der Parameter k ist dabei die Stei-
gung der Geraden und der Parameter b ihr Schnittpunkt mit der y-Achse. Der Definitionsbereich
umfasst die gesamte x-Achse und der Wertebereich die gesamte y-Achse (für k 6= 0).

Abbildung 1.18: Die linear Funktion y = kx + b.

Die lineare Funktion f (x) = kx + b ist für k 6= 0 im gesamten Definitionsbereich (reelle Zahlen)
streng monoton und daher umkehrbar. Auch die Umkehrfunktion einer linearen Funktion ist eine
lineare Funktion: x = y/k − b/k. Lineare Funktionen werden häufig für “Fits” verwendet (siehe
Kapitel 6). Die identische Funktion y = x und die konstante Funktion y = b sind Spezialfälle
der linearen Funktion.

1.5.2 Potenzfunktionen

Die Potenz xn ist das Produkt von n gleichen Faktoren:


xn = x
| · x · x{z· · · · · x} . (1.37)
n−mal

Hier werden x die Basis und n der Exponent genannt.

Rechenregeln für Potenzen:


x0 = 1, (1.38)
xn · xm = xn+m , (1.39)
xn
= xn−m , (1.40)
xm
n m
(x ) = xnm . (1.41)
Dabei sind n und m beliebige ganze Zahlen.

Die Regel x0 = 1 ergibt sich aus der Beobachtung, dass sich durch Division durch x der Exponent
in xn um 1 verringert: xn /x = xn−1 . Für n = 1 gilt also x/x = x1−1 = x0 = 1. Analog folgt auch,
dass 1/x = x−1 oder allgemein: 1/xn = x−n . Die anderen Rechenregeln ergeben sich aus ähnlichen
Überlegungen. Zum Beispiel:
xn · xm = |x · x {z · · · · · x} = xn+m
· · · · · x} · |x · x {z (1.42)
n−mal m−mal

und
· · · · · xm} = xnm .
(xn )m = |xm · xm{z (1.43)
n−mal

Durch Addition von Potenzen erhält man die Potenzfunktion (oder ganz rationale Funktion):
n
X
f (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn = ai xi , (1.44)
i=0
1 Funktionen 23

wobei die Koeffizienten ai beliebige reelle Zahlen sind. Die Potenzfunktion aus der obigen Glei-
chung wird auch Polynom n-ten Grades genannt (falls an 6= 0). Dabei ist n die höchste vor-
kommende Potenz.

Beispiele:

• Potenzfunktion 2. Grades f (x) = a0 + a1 x + a2 x2 (mit a2 6= 0),

• Potenzfunktion 3. Grades f (x) = a0 + a1 x + a2 x2 + a3 x3 (mit a3 6= 0).

Der Definitionsbereich der Potenzfunktion umfasst die gesamte x-Achse, −∞ < x < ∞ und die
Funktion ist überall stetig. Für x → ±∞ divergiert die Funktion nach −∞ oder +∞.

Abbildung 1.19: Beispiele für Potenzfunktionen unterschiedlichen Grades.

Gebrochen rationale Funktionen lassen sich als Quotient zweier ganz rationaler Funktionen
darstellen:
Pn
ai xi
f (x) = Pi=0
m i
. (1.45)
i=0 bi x

Der Definitionsbereich ist −∞ < x < ∞. Die Nullstellen des Nenners, an denen die Funktion
divergiert, sind jedoch davon ausgeschlossen.

Die Wurzelfunktion f (x) = ± x ist die Umkehrfunktion der Potenzfunktion f (x) = x2 . Da
die Quadrate von x und −x identisch sind, (x)2 = (−x)2 (siehe Abb. 1.20), ist die Quadratwurzel
24 1 Funktionen

Abbildung 1.20: Für jeden Wert y0 auf der Ordinate gibt es für die Quadratfunktion y = x2 zwei
Werte auf der Abszisse.

√ √
nicht eindeutig und die beiden Zweige f (x) = + x und f (x) =√− x müssen getrennt voneinander
behandelt werden. Für die Quadratwurzel schreiben wir auch x = x1/2 .

Die Wurzelfunktion lässt sich auch für beliebige Exponenten n verallgemeinern. Für die Potenz-
funktion

f (x) = xn (1.46)

definieren wir die n-te Wurzel als die entsprechende Umkehrfunktion

x1/n = f −1 (x). (1.47)

Die Schreibweise der Wurzelfunktion mit Hilfe des Exponenten erlaubt die Anwendung der Re-
chenregeln für Potenzen, z. B. (x1/n )1/m = x1/(nm) .

Es gibt auch die Zusammensetzung von Potenzfunktion und Wurzelfunktion:

f (x) = (xn )1/m = xn/m . (1.48)

Auch dafür gelten die Rechenregeln für Potenzen.

1.5.3 Exponentialfunktion

Die Exponentialfunktion und ihre Umkehrung, die Logarithmusfunktion, sind transzendente


Funktionen, d.h. sie lassen sich nicht als endliche Kombination von algebraischen Termen dar-
stellen (sehr wohl aber durch unendliche Reihen).

Die allgemeine Form der Exponentialfunktion lautet:

f (x) = ax . (1.49)

Dabei ist die reelle positive Zahl a die Basis und x der Exponent. Die Bedeutung von ax für
rationale Exponenten haben wir bereits im letzten Abschnitt kennen gelernt. Für irrationale Ex-
ponenten x, also für jene x-Werte, die sich nicht durch einen Bruch darstellen lassen, können wir x
beliebig genau durch einen solchen Bruch annähern und somit ax beliebig genau durch Verkettung
von Potenz- und Wurzelfunktion erhalten.

Exakt ist die Exponentialfunktion für die Basis e über eine Potenzreihe mit unendlich vielen
Gliedern definiert:
x2 x3 x4
ex = 1 + x + + + + ··· (1.50)
2! 3! 4!
1 Funktionen 25

(Im Kapitel 10 werden wir mehr über Potenzreihen erfahren.) Dabei ist e die Eulersche Zahl,
e = 2.718281828 . . ., eine der wichtigsten Zahlen der Mathematik.

Eine alternative Definition ist über den Grenzwert


 x k
ex = lim 1+ (1.51)
k→∞ k

möglich.

Wichtige Spezialfälle sind die Exponentialfunktionen mit Basis 10 und e:

f (x) = 10x , (1.52)


f (x) = ex . (1.53)

Die Exponentialfunktion mit Basis e schreiben wir auch oft als

f (x) = exp(x). (1.54)

Der Definitionsbereich der Exponentialfunktion umfasst die gesamte reelle Achse, −∞ < x < ∞
und der Wertebereich besteht aus allen positiven reellen Zahlen, 0 < y < ∞ (falls a 6= 1). Die
Exponentialfunktion ax ist überall stetig. Für a > 1 ist sie streng monoton wachsend und für a < 1
streng monoton fallend (siehe Abb. 1.21). Die Exponentialfunktion für a > 1 wächst für positive
x stärker an als jede Potenzfunktion, d. h.

ax
lim =∞ für alle n ∈ N. (1.55)
x→∞ xn

Abbildung 1.21: Die Exponentialfunktion ax für a > 1 (links) und 0 < a < 1 (rechts).

Für die Exponentialfunktion gelten folgende Rechenregeln:

a0 = 1, (1.56)
1
a−x = , (1.57)
ax
x y xy
(a ) = a , (1.58)
ax ay = ax+y , (1.59)
ax
= ax−y . (1.60)
ay
(1.61)

Diese Rechenregeln folgen aus den Rechenregeln für die Potenz- und Wurzelfunktion.
26 1 Funktionen

1.5.4 Logarithmus

Die Umkehrfunktion der Exponentialfunktion ist der Logarithmus (wir erhalten ihn graphisch
durch Spiegelung der Exponentialfunktion an der 45◦ -Geraden). Zu verschiedenen Basen a der
Exponentialfunktion gibt es auch unterschiedliche Logarithmen. Wir bezeichnen den Logarithmus
zur Basis a der Zahl x als

loga (x). (1.62)

Der Logarithmus der Zahl x zur Basis a ist also jene Zahl, mit der man a potenzieren muss, um x
zu erhalten:
y = loga (x) ⇔ ay = x. (1.63)
Folgende Exponentialfunktionen und zugehörige Logarithmen werden in der Physik besonders
häufig verwendet:

y = ax loga (y) = x (1.64)


y = 10x log10 (y) = log(y) = x dekadischer Logarithmus (1.65)
y = ex loge (y) = ln(y) = x natürlicher Logarithmus (1.66)

Abbildung 1.22: Die Logarithmusfunktion loga (x) für verschiedene Basen a.

Für alle Basen a folgt aus a0 = 1, dass loga 1 = 0. Der Definitionsbereich der Exponentialfunktion
erstreckt sich über alle positiven reellen Zahlen, 0 < x < ∞, und der Wertebereich ist −∞ < y < ∞.

Für die Logarithmusfunktion gelten folgende Rechenregeln:

loga (1) = 0, (1.67)


 
1
loga = − loga (x), (1.68)
x
loga (x)z = z loga (x), (1.69)
loga (x · y) = loga (x) + loga (y), (1.70)
 
x
loga = loga (x) − loga (y). (1.71)
y

Diese Rechenregeln folgen aus den Rechenregeln für die Exponentialfunktion. Zum Beispiel:
   
1 1 
loga = loga log x
= loga a− loga x = − loga x, (1.72)
x a a
1 Funktionen 27

oder:  
loga (xy) = loga aloga x · aloga y = loga aloga x+loga y = loga x + loga y. (1.73)
Auf ähnliche Weise erhalten wir
 
loga (xz ) = loga (aloga x )z = loga az loga x = z loga x. (1.74)

Die Logarithmusfunktion wächst für a > 1 langsamer als jede beliebige Potenz von x, d.h.

loga (x)
lim =0 für alle n ∈ N. (1.75)
x→∞ xn
Wie die Exponentialfunktion lässt sich auch der Logarithmus von einer Basis in eine andere um-
formen:
 
loga (x) = loga blogb (x) = logb (x) · loga (b), (1.76)
loga (x)
logb (x) = , (1.77)
loga (b)
logb (x)
loga (x) = . (1.78)
logb (a)

Mit Hilfe der Logarithmusfunktion lässt sich die Exponentialfunktion zu einer beliebigen Basis a
in eine auf der Eulerschen Zahl e beruhende Darstellungsform umwandeln:
x x
ax = eln a = ex ln a = eln(a ) . (1.79)

Für eine beliebige Basis b gilt:


x x
ax = blogb a = bx logb a = blogb (a ) . (1.80)

1.5.5 Winkelfunktionen

Die Winkelfunktionen (trigonometrische Funktionen) sind ebenfalls transzendente Funktionen.


Zur Definition dieser Funktion ist es sehr zweckmäßig, Winkel im Bogenmaß anzugeben. Da-
zu zeichnen wir zunächst einen Kreis mit Radius 1 durch den Scheitel des Winkels, den wir im
Bogenmaß ausdrücken wollen (siehe Abb. 1.23).

Abbildung 1.23: Das Bogenmaß des Winkels α ist die Bogenlänge b, die vom Winkel am Einheits-
kreis (Radius=1) begrenzt wird.

Die Länge des Kreisbogens zwischen den Winkelschenkeln ist das Bogenmaß dieses Winkels. Der
volle Kreis hat einen Umfang von 2π und der zugehörige Winkel beträgt daher im Bogenmaß 2π.
Zwischen dem üblichen Gradmaß und dem Bogenmaß gilt daher die Beziehung:

Bogenmaß = Gradmaß × 2π/360. (1.81)


28 1 Funktionen

Abbildung 1.24: Verschiedene Winkel in Gradmaß und in Bogenmaß.

Die trigonometrischen Funktionen lassen sich geometrisch sehr anschaulich am Einheitskreis de-
finieren. Eine exakte Definition dieser Funktionen erfolgt jedoch durch Potenzreihen. Auf diese
exakte Definition wollen wir hier jedoch verzichten. Die Winkelfunktionen setzen den Winkel α
mit verschiedenen Längen in Beziehung (siehe Abb. 1.25).

Abbildung 1.25: Definition der Winkelfunktionen für den Winkel α am Einheitskreis (Radius=1).

Mit Hilfe des in Abb. 1.25 dargestellten rechtwinkligen Dreiecks lassen sich geometrisch folgende
Funktionen des Winkels α definieren:

Sinus: sin α = Gegenkathete / Hypotenuse


Kosinus: cos α = Ankathete / Hypotenuse
Tangens: tan α =Gegenkathete / Ankathete
Kotanges: cot α =Ankathete / Gegenkathete

Tragen wir sin(α) und cos(α) als Funktion von α in einem kartesischen Koordinatensystem auf, er-
halten wir die in Abbildung 1.26 dargestellten Funktionsgraphen. Während der Sinus eine ungerade
Funktion ist,

sin(x) = − sin(−x), (1.82)

ist der Kosinus gerade,

cos(−x) = cos(x). (1.83)


1 Funktionen 29

Nachdem der Winkel α die Werte 0 bis 2π durchlaufen hat, zeigen die Funktionen wieder dieselben
Werte wie vorher, d.h. die Funktionen sind periodisch mit der Periode 2π:

sin(x + 2πn) = sin(x) (1.84)


cos(x + 2πn) = cos(x), (1.85)

wobei n eine ganze Zahl ist. Die Werte von Sinus und Kosinus schwanken zwischen -1 und +1.

Abbildung 1.26: Sinus und Kosinus.

Der Tangens und der Kotangens sind ebenfalls periodische Funktionen, haben aber eine Peri-
odenlänge von π statt 2π (siehe Abb. 1.27). Sowohl der Tangens als auch der Kotangens sind
ungerade Funktionen:

tan(x) = − tan(−x), (1.86)


cot(x) = − cot(−x). (1.87)
π 3π
Die Tangensfunktion tan α ist singulär bei α = 2, 2 ,... und die Kotangensfunktion cot α bei
α = 0, π, 2π, . . . .

Abbildung 1.27: Tangens (links) und Kotangens (rechts).

Winkelfunktionen können ineinander umgewandelt werden. Zum Beispiel gelten folgende Beziehun-
gen, die man leicht durch Anwendung des Satzes von Pythagoras auf das in Abb. 1.25 dargestellte
rechtwinklige Dreieck ableiten kann (sin2 α + cos2 α = 1):
p
sin α = 1 − cos2 α, (1.88)
tan α
sin α = √ , (1.89)
1 + tan2 α
1
tan α = . (1.90)
cot α
Weitere Formeln zur Umformung trigonometrischer Funktionen sowie die Werte der Winkelfunktion
an besonderen Stellen können den gängigen Formelsammlungen entnommen werden.
30 1 Funktionen

Äußerst wichtig sind zudem die Additionstheoreme für die Winkelfunktionen:

sin(α + β) = sin α cos β + cos α sin β, (1.91)


cos(α + β) = cos α cos β − sin α sin β. (1.92)

Diese Ausdrücke kann man zur Umformung von trigonometrischen Ausdrücken verwenden. So
können wir zum Beispiel folgende Vereinfachung durchführen:

x)
cos x (1 − tan2 x) cos x (1 − tan2 x) cos x (1 + tan x) −
(1 tan
= = x)
tan x (cot x − 1) (1 − tan x)  −
(1 tan
 
sin x
= cos x 1 + = cos x + sin x
cos x
 π 
= sin x + + sin x
 2
π π  π π
= sin x + + + sin x − +
 4 4 4 4 
π π π π
= sin x + cos + sin cos x + (1.93)
 4 4 4  π 4
π  π  π
+ sin x + cos − + sin − cos x +
4 4 4 4
1  π 1 
π


x +
2 
= √ sin x + + √cos
2 4 4

+ π

1  π 1  
+ √ sin x + − √cos  x
2 4 2 4
2  π √  π
= √ sin x + = 2 sin x + .
2 4 4

Die Winkelfunktionen hängen eng mit der Exponentialfunktion zusammen. Dieser Zusammenhang
ist durch die Eulersche Formel gegeben (eiϕ = cos ϕ+i sin ϕ), die wir im Kapitel 5 näher behandeln
werden.

1.5.6 Arcusfunktionen

Oft kennen wir beispielsweise den Sinus eines Winkels und möchten daraus den Winkel selbst
bestimmen. Dies können wir mit der Umkehrfunktion des Sinus, dem Arcussinus tun:

x = arcsin y (y = sin x). (1.94)

Die Bezeichnung Arcussinus stammt von arcus ab, der lateinischen Bezeichnung für Bogen (wir
bestimmen ja das “Bogenmaß” des Winkels aus dem Sinus). Da jetzt y die unabhängige Variable
ist, benennen wir sie um in x:

y = arcsin x. (1.95)

Der Definitionsbereich des Arcussinus ist −1 ≤ x ≤ 1. Da ein bestimmter Wert der Winkelfunk-
tionen durch eine Vielzahl von Winkeln erzeugt wird (siehe Abb. 1.28), muss der Wertebereich auf
einen gewissen Bereich eingeschränkt werden. Wir beschränken den Wertebereich so, dass jeder
Wert des Sinus genau einmal angenommen wird. Damit erreichen wir eine eindeutige Zuordnung.
Der zugeordnete Wert heißt Hauptwert. Der Hauptwert ist jener Wert y, der mit x = sin(y) kon-
sistent ist und den kleinsten Absolutwert |y| besitzt. Für y = arcsin(x) gilt also ein Wertebereich
von − π2 ≤ y ≤ π2 (siehe Abb. 1.29). Analog verfährt man mit arccos, arctan und arccot.
1 Funktionen 31

Abbildung 1.28: Die Sinusfunktion nimmt einen bestimmten Funktionswert an verschiedenen Stel-
len an.

Abbildung 1.29: Arcussinus und Arcuskosinus.

Die folgende Tabelle enthält die Definitionsbereiche D und Wertebereiche W der Arcusfunktionen:

Funktion D W
arcsin [−1, +1] [− π2 , π2 ]
arccos [−1, +1] [0, π]
arctan [−∞, +∞] [− π2 , π2 ]
arccot [−∞, +∞] [0, π]

Alternative Schreibweisen für die Arcusfunktionen sind:

arcsin(x) = sin−1 (x) = asin(x),


arccos(x) = cos−1 (x) = acos(x),
arctan(x) = tan−1 (x) = atan(x),
arccot(x) = cot−1 (x) = acot(x).

Die Arcusfunktionen werden auch zyklometrische Funktionen genannt. Für die Arcusfunktio-
nen gibt es zahlreiche nützliche Beziehungen, die Sie bei Bedarf den gängigen Formelsammlungen
entnehmen können.
32 1 Funktionen

Abbildung 1.30: Arcustangens und Arcuskotangens.

1.5.7 Hyperbolische Funktionen

Während die trigonometrischen Funktionen durch den Schnitt einer Geraden mit einem Kreis er-
zeugt werden können, werden die hyperbolischen
√ Funktionen durch den Schnitt mit den Hyper-
belästen der Einheitshyperbel y = ± x2 − 1 erzeugt. Die Funktionen werden aber nicht angegeben
als Funktion des Steigungswinkels wie bei den trigonometrischen Funktionen,
√ sondern als Funktion
der von den Geraden mit Steigung g und −g und der Hyperbel y = ± x2 − 1 eingeschlossenen
Fläche A. Die geometrische Bedeutung der hyperbolischen Funktionen sinh und cosh ist in Abb.
1.31 dargestellt.

Abbildung 1.31: Geometrische Interpretation der hyperbolischen Funktionen sinh und cosh.

Analog zu den trigonometrischen Funktionen Sinus, Kosinus, Tangens und Kotangens können auch
1 Funktionen 33

die entsprechenden hyperbolischen Funktionen definiert werden:

Sinus hyperbolicus sinh(x),


Cosinus hyperbolicus cosh(x),
Tangens hyperbolicus tanh(x) = sinh(x)/ cosh(x),
Cotangens hyperbolicus coth(x) = 1/ tanh(x).

Die Funktionsgraphen der wichtigsten dieser Funktionen sind in Abb. 1.32 und 1.33 dargestellt.

Abbildung 1.32: Die hyperbolischen Funktio- Abbildung 1.33: Die hyperbolischen Funktio-
nen sinh and cosh. nen tanh and coth.

Wichtige Zusammenhänge zwischen den hyperbolischen Funktionen lassen sich aus der Gleichung

sinh2 (x) = cosh2 (x) − 1 (1.96)

ableiten.

Die Hyperbelfunktionen lassen sich mit Hilfe der Exponentialfunktion ausdrücken:

ex − e−x
sinh x = , (1.97)
2
ex + e−x
cosh x = , (1.98)
2
ex − e−x
tanh x = , (1.99)
ex + e−x
ex + e−x
coth x = . (1.100)
ex − e−x

Hyperbolische und trigonometrische Funktionen können in der komplexen Ebene als gleich-
wertige Funktionen dargestellt werden. Durch Verwendung imaginärer Argumente werden die
Funktionen ineinander übergeführt. Diesen Zusammenhang werden wir im Kapitel 5 näher behan-
deln.

1.5.8 Areafunktionen

Die inversen Hyperbelfunktionen werden als Areafunktionen bezeichnet. (Der Name kommt daher,
dass wir die eingeschlossene Fläche A, also lateinisch “area”, erhalten, wenn wir die hyperbolischen
Funktionen umkehren.)
34 1 Funktionen

Abbildung 1.34: Die Areafunktionen Arsinh und Arcosh (links) sowie Artanh und Arcoth (rechts).

Die Areafunktionen können mit Hilfe von Logarithmen ausgedrückt werden:


p
Arsinh(x) = ln(x + x2 + 1), (1.101)
p
Arcosh(x) = ln(x + x2 − 1), (1.102)
1 1+x
Artanh(x) = ln , (1.103)
2 1−x
1 x+1
Arcoth(x) = ln . (1.104)
2 x−1
Diese Formeln erhält man durch direkte Umkehrung der hyperbolischen Funktionen. Zusam-
menhänge zwischen den verschiedenen Areafunktionen können den gängigen Formelsammlungen
entnommen werden.
Kapitel 2

Vektoren

2.1 Grundlagen

In der Physik ist es oft notwendig, von gewissen Größen nicht nur deren Betrag, sondern auch
deren Richtung zu kennen. Wenn wir mit dem Fahrrad irgendwohin fahren, ist unsere Bewe-
gungsrichtung genau so wichtig wie der Betrag unserer Geschwindigkeit. Solche Größen nennt
man Vektoren. Beispiele für Vektoren sind: Kraft, Geschwindigkeit, Beschleunigung, Feldstärke,
Flächenelement, Impuls und Dipolmoment. Größen, die keine Richtung besitzen, nennen wir Ska-
lare. Dazu zählen: Zeit, Masse, Volumen, Dichte, elektrische Ladung und Energie. Wir definieren
also Vektoren wie folgt:

Definition: Ein Vektor ist eine gerichtete Größe. Er wird durch eine Richtung und eine Länge
(einen Betrag) beschrieben.

Im Folgenden werden wir Vektoren durch einen Pfeil kennzeichnen, zum Beispiel F~ und ~v . Häufig
werden Vektoren aber auch im Fettdruck angegeben, zum Beispiel F und v.

Bei einer physikalischen Vektorgröße gehört zur vollständigen Beschreibung auch die Angabe einer
Maßeinheit. Der Betrag besteht aus Maßzahl und Einheit. Kräfte messen wir zum Beispiel in
der Einheit Newton (abgekürzt N): |F~1 | = F1 = 100N. Hier haben wir den Betrag eines Vektors,
also dessen Länge, mit Hilfe von senkrechten Strichen ausgedrückt.

Graphisch können wir Vektoren als Pfeile darstellen mit Länge und Richtung (siehe Abb. 2.1).

Abbildung 2.1: Ein Vektor ~r lässt sich als Pfeil in einem rechtwinkligen Koordinatensystem dar-
stellen. In diesem zweidimensionalen Beispiel hat der Vektor ~r die Komponenten ∆x und ∆y:
~r = (∆x, ∆y). Der Vektor ist durch Angabe des Anfangspunktes Q und des Endpunktes P eindeu-
tig festgelegt.

35
36 2 Vektoren

Ein Vektor lässt sich auch durch Angabe von Anfangspunkt Q und Endpunkt P eindeutig festlegen.
−−→
Dann schreiben wir QP .

Wenn wir als Anfangspunkt Q den Ursprung (0, 0, 0) des Koordinatensystems wählen (siehe Abb.
2.2 für den 2-dimensionalen Fall), so kann der Ortsvektor ~r des Punktes P = P (x, y, z) in
kartesischen Koordinaten geschrieben werden als

~r = (x, y, z). (2.1)

Oft finden wir auch die Notation

~r = (rx , ry , rz ). (2.2)

Abbildung 2.2: Falls wir als Ausgangspunkt Q den Ursprung wählen, können wir ~r als den Orts-
vektor des Punktes P = (x, y) deuten.

Der Ortsvektor ~r gibt die Lage des Punktes P relativ zum Ursprung an.

Abbildung 2.3: Der Verschiebungsvektor ~r = ~r2 − ~r1 ist der Verbindungsvektor zwischen Punkt P1
mit Ortsvektor ~r1 und Punkt P2 mit Ortsvektor ~r2 .

Vektoren können auch Verschiebungen beschreiben. Der Verschiebungsvektor zwischen den


Punkten P1 und P2 ist die Differenz der Ortsvektoren ~r1 und ~r2 der Punkte P1 und P2 :

~r = ~r2 − ~r1 . (2.3)

Was genau die Differenz zweier Vektoren bedeutet, werden wir später sehen.

Hier ist es wichtig anzumerken, dass in der graphischen Darstellung Pfeile mit gleicher Richtung
und gleichem Betrag aber unterschiedlichen Ausgangspunkten zum selben Vektor gehören. Ein
graphisch dargestellter Pfeil ist also nur einer von vielen Repräsentanten eines Vektors (siehe Abb.
2.4).

Von besonderer Bedeutung sind der Nullvektor und der Einheitsvektor:

Nullvektor: ~0, |~0| = 0, hat Länge Null und keine Richtung.


2 Vektoren 37

Abbildung 2.4: Pfeile, welche durch Parallelverschiebung ineinander übergeführt werden können,
also gleichen Betrag und gleiche Richtung besitzen, gehören zum selben Vektor.

Einheitsvektor: ~e, |~e| = 1, hat Länge 1, wird verwendet, um Richtungen anzugeben


(z. B. Einheitsvektoren ~ex , ~ey , ~ez entlang der Achsen eines kartesischen Koordinatensy-
stems). Einheitsvektoren werden auch als normiert bezeichnet.

2.2 Koordinatensysteme

Vektoren können auf verschiedene Weise dargestellt werden. Bisher haben wir dazu kartesische
Koordinaten verwendet. Bei gewissen Problemen sind andere Koordinatensysteme, die die Sym-
metrien des Problems auf natürliche Weise berücksichtigen, oft günstiger (z.B. Kugelkoordinaten,
Zylinderkoordinaten). Im Folgenden werden wir kurz die Darstellung von Vektoren in verschiedenen
Koordinatensystemen besprechen.

2.2.1 Kartesische Koordinaten

Unter einem kartesischen Koordinatensystem versteht man rechtwinklige Koordinatensyste-


me, die wir bereits zur Darstellung von Funktionen verwendet haben (siehe Abb. 2.5). Die Achsen
eines kartesischen Koordinatensystems stehen senkrecht aufeinander. Kartesische Koordinatensy-
steme können für beliebig viele Dimensionen definiert werden. Abbildung 2.5 zeigt ein zweidimen-
sionales und ein dreidimensionales Beispiel.

Mit Hilfe der Einheitsvektoren ~ex , ~ey und ~ez (auch Basisvektoren genannt) in Richtung der Koor-
dinatenachsen können wir den Ortsvektor ~r auch darstellen als so genannte Linearkombination:

~r = (x, y, z) = (rx , ry , rz ) = x~ex + y~ey + z~ez . (2.4)

In kartesischen Koordinaten ergibt sich der Betrag (Länge) des Vektors aus dem Satz von Pytha-
goras:
p q
r = |~r| = x2 + y 2 = rx2 + ry2 , (2.5)
p q
r = |~r| = x2 + y 2 + z 2 = rx2 + ry2 + rz2 . (2.6)

Der Einheitsvektor ~er in Richtung eines bestimmten Vektors ~r 6= 0 ergibt sich durch Division
des Vektors durch seinen Betrag:
~r
~er = . (2.7)
|~r|
Dadurch erhält der Einheitsvektor ~er die Länge 1.
38 2 Vektoren

Abbildung 2.5: Zweidimensionales (2d) und dreidimensionales (3d) kartesisches Koordinatensy-


stem. Die Einheitsvektoren ~ex , ~ey und ~ez zeigen in Richtung der Koordinatenachsen. Die Achsen
des dreidimensionalen Koordinatensystems bilden ein so genanntes “Rechtssystem”, das wir weiter
unten genauer besprechen werden.

Beispiel:

~r = (3, 4, 5) = 3~ex + 4~ey − 5~ez , (2.8)


p √ √
r = |~r| = 3 + 4 + (−5)2 = 9 + 16 + 25 = 50.
2 2 (2.9)

Einheitsvektor:
 
3
~r 1  
~er = = √  4 . (2.10)
|~r| 50
−5

2.2.2 Polarkoordinaten

Anstelle der x- und y-Koordinate eines Punktes P in der Ebene können wir seine Lage auch durch
seine Entfernung r vom Ursprung und durch den Winkel ϕ, den die Verbindungslinie vom Punkt
zum Ursprung mit der x-Achse einschließt, angeben (siehe Abb. 2.6). Dabei wird der Winkel
ϕ gegen den Uhrzeigersinn bestimmt. Der Abstand r und der Winkel ϕ sind die so genannten
Polarkoordinaten des Punktes P (und seines Ortsvektors ~r).

Abbildung 2.6: Polarkoordinaten r und ϕ des Vektors ~r.

Wie aus Abb. 2.6 ersichtlich ergeben sich die kartesischen Koordinaten wie folgt aus den Polarko-
2 Vektoren 39

ordinaten:

x = r cos ϕ, (2.11)
y = r sin ϕ. (2.12)

Umgekehrt kommen wir durch


p
r = x2 + y 2 r>0 (2.13)
y 
ϕ = arctan 0 ≤ ϕ < 2π (2.14)
x
von kartesischen zu Polarkoordinaten.

Polarkoordinaten bilden ein so genanntes krummliniges Koordinatensystem (siehe Abb. 2.7).

Abbildung 2.7: Durch Angabe von r und ϕ definieren wir einen Punkt in der Ebene. Die durch
r = const definierten Kurven sind Kreise um den Ursprung und ϕ = const definiert vom Ursprung
ausgehende Halbgeraden.

Beispiel:
!
3
P = (3, −4) ⇒ Ortsvektor ~r = (2.15)
−4
p √
r = |~r| = 32 + 42 = 25 = 5 (2.16)
 
−4
ϕ = arctan = −53◦ (die Umkehrung des tan ist nicht eindeutig). (2.17)
3

Im Kapitel 1.1 haben wir Kurven (Funktionsgraphen) in kartesischen Koordinaten dargestellt.


Wir können das aber auch in Polarkoordinaten tun, indem wir den Abstand r vom Ursprung als
Funktion des Winkels darstellen, zum Beispiel
1
r(ϕ) = √ . (2.18)
cos 2ϕ
Durch Einsetzen dieser Gleichung in die Formel zur Umrechnung von Polarkoordinaten in kartesi-
sche Koordinaten erhalten wir die Kurve in Parameterform mit ϕ als Parameter:
cos ϕ
x = r cos ϕ = √ , (2.19)
cos 2ϕ
sin ϕ
y = r sin ϕ = √ . (2.20)
cos 2ϕ
40 2 Vektoren


Abbildung 2.8: In Polarkoordinaten kann die Hyperbel durch r = 1/ cos 2ϕ ausgedrückt werden.

Wir wollen nun den Parameter ϕ eliminieren. Dazu stellen wir fest, dass cos 2ϕ = cos2 ϕ − sin2 ϕ
und erhalten
cos ϕ
x = p , (2.21)
cos2 ϕ − sin2 ϕ
sin ϕ
y = p . (2.22)
cos2 ϕ − sin2 ϕ
Quadrieren ergibt

cos2 ϕ
x2 = , (2.23)
cos2 ϕ − sin2 ϕ
sin2 ϕ
y2 = . (2.24)
cos2 ϕ − sin2 ϕ

Wenn wir nun y 2 von x2 subtrahieren, erhalten wir:

cos2 ϕ sin2 ϕ cos2 ϕ − sin2 ϕ


x2 − y 2 = − = = 1. (2.25)
cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ cos2 ϕ − sin2 ϕ
Dies ist die Kurvengleichung für eine Hyperbel
p
x2 − y 2 = 1, y=± x2 − 1. (2.26)

Eine der ersten Anwendungen von ebenen Polarkoordinaten, die Ihnen im 1. Semester begegnen
wird, ist die Kreisbewegung. Im Allgemeinen beschrieben wird die Bewegung eines Objektes
durch Angabe seines Ortes als Funktion der Zeit:

~r = ~r(t). (2.27)

Ein zweidimensionales Beispiel einer dadurch entstehenden Bahnkurve ist in Abb. 2.9 dargestellt.

Bei einer Kreisbewegung bewegt sich das Objekt (durch einen Punkt dargestellt) auf einer Kreis-
bahn (siehe Abb. 2.10).

Um die Kreisbewegung zu beschreiben, suchen wir die kartesischen Koordinaten x(t) und y(t)
als Funktion der Zeit t. Dies lässt sich in Polarkoordinaten sehr einfach bewerkstelligen. Bei einer
2 Vektoren 41

Abbildung 2.9: Bahnkurve (auch Trajektorie genannt) eines Punktes, der sich in der Ebene
bewegt.

Abbildung 2.10: Kreisbewegung eines Punktes in der Ebene.

gleichförmigen Kreisbewegung ist der Abstand vom Ursprung konstant, d. h. r = const. Der Winkel
aber ändert sich mit der Zeit. Da die Bewegung gleichförmig ist, wächst der Winkel linear mit der
Zeit:

ϕ(t) = ωt. (2.28)

Dabei ist ω die so genannte Winkelgeschwindigkeit, die in unserem Fall konstant ist.

In kartesischen Koordinaten können wir dann die Bewegung beschreiben durch:

x = r cos(ϕ(t)) = r cos ωt, (2.29)


y = r sin(ϕ(t)) = r sin ωt. (2.30)

Sowohl die x- als auch die y-Koordinate des Punktes ändern sich auf nicht triviale Weise mit der
Zeit. Hier haben wir ausgenutzt, dass sich das Problem durch Wahl eines geeigneten Koordinaten-
systems wesentlich vereinfacht.

Beispiel: Zykloide

Als weiteres Beispiel suchen wir nach der Kurve, die ein Punkt eines auf einer Ebene rollenden
Rades beschreibt (siehe Abb. 2.11). Wir nehmen an, dass zu Beginn der Punkt im Ursprung ist.
42 2 Vektoren

Abbildung 2.11: Ein Punkt auf einem rollenden Rad beschreibt eine Zykloide.

Nachdem sich das Rad um den Winkel ϕ gedreht hat, hat sein Mittelpunkt die Strecke ϕr zurück-
gelegt. Der Punkt ist in x-Richtung jedoch um r sin ϕ zurückgeblieben:

x = ϕ · r − r sin ϕ. (2.31)

Für die y-Koordinate des Punktes gilt

y = r − r cos ϕ. (2.32)

Die Bahnkurve in kartesischen Koordinaten ergibt sich also durch Addition von linearer Bewegung
und Kreisbewegung.

2.2.3 Zylinderkoordinaten

Durch ebene Polarkoordinaten können wir einen Punkt in der xy-Ebene definieren. Wenn wir zu
diesen Koordinaten noch eine z-Koordinate hinzufügen, legen wir damit einen Punkt im Raum
fest. Diese Koordinaten nennen wir die Zylinderkoordinaten ρ, ϕ und z (siehe Abb. 2.12). Hier
verwenden wir ρ statt r für die Länge der Projektion des Vektors ~r in die xy-Ebene, um diese
Länge vom Betrag des Ortsvektors ~r zu unterscheiden.

Durch ρ =const, ϕ =const und z =const werden folgende Flächen definiert:

ϕ = const: Halbebene durch z-Achse,


ρ = const: Zylinder mit der z-Achse als Rotationsachse,
z = const: Ebene normal zur z-Achse.

Aus bekannten Zylinderkoordinaten lassen sich die kartesischen Koordinaten bestimmen:

x = ρ cos ϕ, (2.33)
y = ρ sin ϕ, (2.34)
z = z. (2.35)

Umgekehrt gilt:
p
ρ = x2 + y 2 , (2.36)
y
ϕ = arctan , (2.37)
x
z = z. (2.38)
2 Vektoren 43

Abbildung 2.12: Zylinderkoordinaten.

Zylinderkoordinaten sind bei Situationen sinnvoll, bei denen die betrachteten Größen rotations-
symmetrisch bezüglich einer Achse sind, z.B. das Magnetfeld um einen stromdurchflossenen Draht
oder das Trägheitsmoment eines Zylinders.

2.2.4 Kugelkoordinaten

In Kugelkoordinaten stellen wir die Lage eines Punktes mit Ortsvektor ~r durch seinen Abstand r =
|~r| vom Ursprung sowie zwei Winkel ϕ (Azimut) und ϑ (Elevation) dar. Dabei ist ϑ der Winkel
zwischen dem Ortsvektor ~r und der positiven z-Achse. ϑ ist ähnlich der geographischen Breite (die
geographische Breite ist jedoch am Äquator identisch 0, während ϑ am Nordpol verschwindet) und
ϕ entspricht der geographischen Länge. Der Winkel ϕ ist der Winkel zwischen der Projektion von
~r in die xy-Ebene und der positiven x-Achse. Die Geometrie der Kugelkoordinaten ist in Abb. 2.13
dargestellt.

Die Kugelkoordinaten r, ϕ und ϑ haben folgende Wertebereiche:


0 ≤ r, (2.39)
0 ≤ ϕ < 2π, (2.40)
0 ≤ ϑ ≤ π. (2.41)
Kugelkoordinaten können durch folgende Ausdrücke in kartesische Koordinaten umgewandelt wer-
den. Am einfachsten ist der Ausdruck für die z-Koordinate:
z = r cos ϑ. (2.42)
Die x- und y-Koordinaten schreiben wir zunächst als
x = ρ cos ϕ, (2.43)
y = ρ sin ϕ. (2.44)
Da aber ρ = r sin ϑ ist, erhalten wir schließlich
x = r sin ϑ cos ϕ, (2.45)
y = r sin ϑ sin ϕ, (2.46)
z = r cos ϑ. (2.47)
44 2 Vektoren

Abbildung 2.13: Kugelkoordinaten.

Aus den kartesischen Koordinaten können die Kugelkoordinaten durch


p
r = x2 + y 2 + z 2 , (2.48)
p ! !
x2 + y 2 z
ϑ = arctan = arccos p , (2.49)
z x2 + y 2 + z 2
y
ϕ = arctan (2.50)
x
bestimmt werden.

Durch r =const, ϕ =const und ϑ =const werden folgende Flächen definiert:

r = const: Kugeln um den Ursprung,


ϕ = const: Halbebenen durch z-Achse,
ϑ = const: Kegel um z-Achse mit Ursprung als Spitze.

2.3 Vektoralgebra

Wir befassen uns als nächstes mit den Rechenregeln für Vektoren in kartesischen Koordinaten.

2.3.1 Gleiche, inverse und parallele Vektoren


• Zwei Vektoren sind gleich, ~a = ~b, wenn sie in Betrag und Richtung übereinstimmen.

• Zwei Vektoren ~a und ~b sind invers, wenn sie denselben Betrag besitzen aber entgegengesetzte
Richtung, das heißt ~a = −~b.

• Zwei Vektoren sind parallel (oder genauer: gleichsinnig parallel), ~a||~b, wenn sie gleiche Rich-
tung haben. Das heißt, ~a = λ~b mit λ > 0. Wenn die beiden Vektoren die entgegengesetzte
2 Vektoren 45

Richtung haben, nennt man sie antiparallel (oder gegensinnig parallel). In diesem Fall ist
~a = λ~b mit λ < 0.

Der zu Vektor ~a gehörende Gegenvektor (oder inverse Vektor) −~a besitzt den gleichen Betrag aber
entgegengesetzte Richtung. Komponentenweise können wir den inversen Vektor schreiben als
   
ax −ax
   
~a =  ay  , −~a =  −ay  . (2.51)
az −az

2.3.2 Vektoraddition und -subtraktion

Abbildung 2.14: Vektoraddition.

Die Addition zweier Vektoren ~a und ~b,


~c = ~a + ~b, (2.52)
kann graphisch durch Aneinanderhängen erfolgen. Dazu verschieben wir den Vektor ~b parallel und
hängen seinen Anfangspunkt an den Endpunkt von ~a. Der Summenvektor ~c ist dann der Vektor vom
Anfangspunkt von ~a zum Endpunkt des verschobenen Vektors ~b. Dies ist in Abb. 2.14 graphisch
dargestellt.

In kartesischen Koordinaten erfolgt die Addition zweier Vektoren komponentenweise:


       
ax bx ax + b x cx
~c = ~a + ~b =  ay  +  by  =  ay + by  =  cy  .
       
(2.53)
az bz az + b z cz
In der Darstellung mit Einheitsvektoren gilt für die Addition:
~c = ~a + ~b = ax~ex + ay ~ey + az ~ez + bx~ex + by~ey + bz~ez
= (ax + bx )~ex + (ay + by )~ey + (az + bz )~ez (2.54)
= cx~ex + cy~ey + cz ~ez .
Der Nullvektor
 
0
~0 =  
 0  (2.55)
0
46 2 Vektoren

ist das neutrale Element der Addition. Das heißt, dass die Addition des Nullvektors zu einem
beliebigen Vektor diesen nicht verändert:

~a + ~0 = ~a. (2.56)

Das inverse Element der Vektoraddition ist:


 
−ax
 
− ~a =  −ay  . (2.57)
−az

Addition eines Vektors und seines inversen Elements ergibt den Nullvektor:
   
ax − ax 0
    ~
~a + (−~a) =  ay − ay  =  0  = 0. (2.58)
az − az 0

Abbildung 2.15: Der Vektor ~b wird vom Vektor ~a subtrahiert, indem der inverse Vektor −~b zum
Vektor ~a addiert wird.

Die Subtraktion eines Vektors ~b vom Vektor ~a ergibt sich aus der Addition des inversen Elements:
 
ax − b x
~a − ~b = ~a + (−~b) =  ay − by  .
 
(2.59)
az − b z

Die Vektorsubtraktion ist in Abb. 2.15 graphisch dargestellt.

Weiters gelten das Kommutativgesetz

~a + ~b = ~b + ~a (2.60)

und das Assoziativgesetz

(~a + ~b) + ~c = ~a + (~b + ~c) = ~a + ~b + ~c. (2.61)


2 Vektoren 47

2.3.3 Multiplikation eines Vektors mit einem Skalar

Die Multiplikation eines Vektors ~a mit einem Skalar α kann als eine α-fach hintereinander aus-
geführte Verschiebung um ~a aufgefasst werden. Damit kann man sie auf eine wiederholte Addition
zurückführen, z.B.

~a + ~a = 2~a, (2.62)
~a + ~a + ~a = 3~a. (2.63)

Graphisch (siehe Abb. 2.16) erkennt man, dass dabei die Richtung des Vektors erhalten bleibt, sich
seine Länge jedoch ändert.

Abbildung 2.16: Multiplikation eines Vektors mit einem Skalar (hier ist der Skalar gleich 3).
Während durch die Multiplikation die Richtung des Vektors unverändert bleibt, hat sich seine
Länge um den Faktor 3 verändert.

In kartesischen Koordinaten erfolgt die Multiplikation mit einem Skalar komponentenweise


 
αax
 
α~a =  αay  . (2.64)
αaz

Für den Betrag von ~b = α~a gilt:


q q
|~b| = |α~a| = (αax )2 + (αay )2 + (αaz )2 = α2 (a2x + a2y + a2z ) = |α||~a|. (2.65)

Die Division eines Vektor durch einen Skalar λ entspricht der Multiplikation des Vektors mit dem
Skalar µ = 1/λ.

Weiters gelten für die Multiplikation eines Vektors mit einem Skalar die Distributivgesetze

α(~a + ~b) = α~a + α~b (2.66)

und

(α + β)~a = α~a + β~a (2.67)

sowie das Assoziativgesetz

α(β~a) = (αβ)~a = αβ~a. (2.68)


48 2 Vektoren

2.4 Skalarprodukt

2.4.1 Definition

Das Skalarprodukt (innere Produkt) zweier Vektoren ~a und ~b ist die Zahl

c = ~a · ~b = |~a||~b| cos α. (2.69)

Dabei sind |~a| und |~b| die Beträge von ~a und ~b, und α ist der von ihnen eingeschlossene Winkel
(siehe Abb. 2.17). Für das Skalarprodukt verwendet man auch (vor allem in der Quantenmechanik)
die so genannte Bra-und-Ket-Notation h~a · ~bi oder h~a|~bi.

Abbildung 2.17: Das Skalarprodukt von ~a und ~b ist c = |~a||~b| cos α.

Geometrisch betrachtet ist das Skalarprodukt das Produkt des Betrages von ~a mit dem Betrag des
Anteils von ~b in Richtung ~a (siehe Abb. 2.17). (Natürlich könnte man auch sagen: das Skalarprodukt
ist das Produkt des Betrages von ~b mit dem Betrag des Anteils von ~a in Richtung ~b.)

2.4.2 Rechenregeln

Für das Skalarprodukt gelten das Kommutativgesetz

~a · ~b = ~b · ~a, (2.70)

das Assoziativgesetz

(λ~a) · ~b = λ(~a · ~b) = ~a · (λ~b) = λ~a · ~b, (2.71)

und das Distributivgesetz

~a · (~b + ~c) = ~a · ~b + ~a · ~c. (2.72)

Im Folgenden werden wir diese Rechenregeln aus der geometrischen Definition des Skalarproduktes
ableiten. Zunächst halten wir fest, dass die Definition (2.69) bezüglich einer Vertauschung von ~a
und ~b symmetrisch ist, d. h. eine Vertauschung von ~a und ~b ändert das Skalarprodukt nicht.
Infolgedessen gilt das Kommutativgesetz:

~a · ~b = ~b · ~a. (2.73)

Weiters beobachten wir, dass die Multiplikation des Vektors ~a mit einem positiven Skalar λ auf
das Skalarprodukt folgende Wirkung hat (siehe Abb. 2.18a):

(λ~a) · ~b = |λ~a||~b| cos α = λ|~a||~b| cos α. (2.74)


2 Vektoren 49

Abbildung 2.18: (a) Durch Multiplikation des Vektors ~a mit einem positiven Skalar λ ändert sich
nur die Länge des Vektors, aber nicht der eingeschlossen Winkel α. (b) Multiplizieren wir ~a mit
einem negativen Skalar, ändert sich der eingeschlossene Winkel von α auf π − α.

Ist λ negativ, müssen wir berücksichtigen, dass der eingeschlossene Winkel sich von α auf (π − α)
ändert (siehe Abb. 2.18b):

(λ~a) · ~b = |λ~a||~b| cos(π − α) = |λ||~a||~b|(− cos α) = λ|~a||~b| cos α. (2.75)


Somit haben wir in beiden Fällen:
(λ~a) · ~b = λ(~a · ~b). (2.76)
Aufgrund der Kommutativität erhalten wir auch
~a · (λ~b) = λ(~a · ~b). (2.77)
Wir fassen diese Ergebnisse im Assoziativgesetz zusammen:
(α~a) · ~b = α(~a · ~b) = ~a · (α~b) = α~a · ~b. (2.78)

Abbildung 2.19: Skalarprodukt des Vektors ~a mit der Summe ~b + ~c.

Schließlich betrachten wir das Skalarprodukt eines Vektors ~a mit der Summe ~b + ~c der Vektoren ~b
und ~c. Wie man in Abb. 2.19 sehen kann, ist die Projektion d′ = |~b+~c| cos α des Summenvektors ~b+~c
auf den Vektor ~a gleich der Summe der Projektionen b′ = |~b| cos β und c′ = |~c| cos γ der Vektoren
~b und ~c auf den Vektor ~a. (Dies gilt sowohl in zwei als auch in drei Dimensionen.) Folglich gilt:

~a · (~b + ~c) = |~a||~b + ~c| cos α = |~a|d′ = |~a|(b′ + c′ ) (2.79)


= |~a|(|~b| cos β + |~c| cos γ) (2.80)
= |~a||~b| cos β + |~a||~c| cos γ = ~a · ~b + ~a · ~c. (2.81)
Diese Eigenschaft ist das Distributivgesetz:
~a · (~b + ~c) = ~a · ~b + ~a · ~c. (2.82)
50 2 Vektoren

2.4.3 Komponentenweise Darstellung

In kartesischen Koordinaten ist das Skalarprodukt gegeben durch:


   
ax bx
~a · ~b =  ay  ·  by  = ax bx + ay by + az bz .
   
(2.83)
az bz

Durch diese Gleichung besitzen wir eine einfache Vorschrift, um das Skalarprodukt zu berechnen.
Von ihrer Gültigkeit kann man sich leicht in der Darstellung mit Basisvektoren überzeugen:

~a · ~b = (ax~ex + ay ~ey + az ~ez ) · (bx~ex + by ~ey + bz ~ez )


= ax bx (~ex · ~ex ) + ax by (~ex · ~ey ) + ax bz (~ex · ~ez )
(2.84)
+ ay bx (~ey · ~ex ) + ay by (~ey · ~ey ) + ay bz (~ey · ~ez )
+ az bx (~ez · ~ex ) + az by (~ez · ~ey ) + az bz (~ez · ~ez ),

wobei wir das Distributivgesetz verwendet haben. Da die Einheitsvektoren ~ex , ~ey und ~ez definiti-
onsgemäß Länge eins besitzen,

~ex · ~ex = ~ey · ~ey = ~ez · ~ez = 1, (2.85)

und aufeinander senkrecht stehen,

~ei · ~ej = 0 für i 6= j, (2.86)

gilt

~a · ~b = ax bx + ay by + az bz . (2.87)

2.4.4 Anwendungen

Das Skalarprodukt findet vielfältige Verwendung. So können wir beispielsweise den Betrag eines
Vektors ~a mit Hilfe des Skalarprodukts berechnen:

~a · ~a = |~a| · |~a| cos α
| {z } = |~
a | · |~
a | ⇒ |~
a | = ~a · ~a. (2.88)
=1

Mit dem Skalarprodukt können wir Vektoren auf Orthogonalität prüfen. Falls der Vektor ~a auf
den Vektor ~b senkrecht steht (d.h., wenn sie orthogonal sind, ~a ⊥ ~b), ist der Winkel α ein rechter
Winkel, α = π2 , und cos α = 0. Also gilt:

~a · ~b = |~a| · |~b| cos α = 0. (2.89)

Da cos α nur für rechte Winkel verschwindet, haben wir

~a · ~b = 0 ⇔ ~a ⊥ ~b. (2.90)

Beispiel:
   
1 4
   
 6  ·  2  = 4 + 12 − 16 = 0. (2.91)
4 −4
2 Vektoren 51

Man kann das Skalarprodukt auch dazu verwenden, um den Winkel zwischen zwei Vektoren ~a und
~b zu bestimmen. Aus

~a · ~b = |~a||~b| cos α (2.92)


folgt nämlich
!
~a · ~b
α = arccos . (2.93)
|~a| · |~b|

Der Winkel zwischen der Koordinatenachse mit Einheitsvektor ~ei und einem Vektor ~a ist
~a · ~ei ai
cos αi = = . (2.94)
|~a| |~a|
Dabei ist ai die Komponente des Vektors ~a in Richtung des Einheitsvektors ~ei .

Ferner gilt:
cos2 αx + cos2 αy + cos2 αz = 1, (2.95)
wobei αx , αy und αz die Winkel sind, die der Vektor ~a mit der x-, y- und z-Achse einschließt.
Wegen | cos ϕ| ≤ 1 ergibt sich aus der Definition des Skalarpodukts die Cauchy-Schwarzsche
Ungleichung:
|~a · ~b| ≤ |~a||~b|. (2.96)
Das Gleichheitszeichen gilt bei Parallelität beziehungsweise Antiparallelität, da in diesem Fall
| cos α| = 1.

Abbildung 2.20: Der Kosinussatz c2 = a2 + b2 − 2ab cos α setzt die Seiten eines Dreiecks mit einem
der Winkel in Beziehung.

Mit Hilfe des Skalarprodukts können wir auch den so genannten Kosinussatz herleiten. Betrachten
wir dazu das Dreieck, das von den Vektoren ~a, ~b, und ~c = ~a − ~b begrenzt wird (siehe Abb. 2.20).
Das Skalarprodukt von ~c mit sich selbst ergibt |~c|2 = ~c ·~c = (~a −~b)·(~a −~b) = ~a ·~a − 2~a ·~b +~b ·~b. Unter
Verwendung der Schreibweise a = |~a|, b = |~b| und c = |~c| lässt sich der Kosinussatz ausdrücken als:

c2 = a2 + b2 − 2ab cos α. (2.97)


Für ein rechtwinkliges Dreieck, also α = π/2, ist das der Pythagoräische Lehrsatz.

Wir wollen nun die Projektion eines Vektors auf einen anderen näher betrachten. In Abb. 2.21
ist ~ba die Projektion des Vektors ~b auf den Vektor ~a. Man kann ~ba auch als die Komponente von ~b
in Richtung von ~a auffassen.

Für den Betrag der Projektion gilt


|~ba | = |~b| cos ϕ. (2.98)

Wegen ~a · ~b = |~a||~b| cos ϕ haben wir cos ϕ = (~a · ~b)/(|~a||~b|) und somit

~a · ~b
|~ba | = = ~ea · ~b. (2.99)
|~a|
52 2 Vektoren

Abbildung 2.21: Projektion ~ba des Vektors ~b auf den Vektor ~a.

Da ~ba die selbe Richtung hat wie ~a, muss gelten:

~ba ~a
= |~ba |~ea = |~ba |
|~a|
!
~a · ~b
= · ~a. (2.100)
|~a|2

Abbildung 2.22: Die Kraft F~ leistet durch Verschiebung eines Objektes um den Vektor ~s die Arbeit
W = F~ · ~s.

Eine Anwendung, in dem die Projektion eines Vektors auf einen anderen benötigt wird, ist die
Berechnung der entlang eines geradlinigen Weges ~s durch die konstante Kraft F~ geleisteten Arbeit
(siehe Abb. 2.22). Da nur die Kraftkomponente F~s in Richtung des Verschiebungsvektors Arbeit
leistet, gilt
W = |F~s ||~s|. (2.101)

Hier haben wir die aus der Mechanik bekannte Beziehung Arbeit = Kraft × Weg (oder genauer:
Arbeit = Kraftkomponente in Wegrichtung × zurückgelegtem Weg) verwendet. Der Vektor F~s ist
die Projektion der Kraft F~ auf den Verschiebungsvektor ~s. Unter Verwendung der obigen Formeln
für den Betrag der Projektion erhalten wir

F~ · ~s
W = |F~s ||~s| = · |~s| = F~ · ~s. (2.102)
|~s|

Beispiel:

Ein Massenpunkt wird von einer konstanten Kraft F~ = (−10N, 2N, 5N) von P1 = (0m, −1m, −4m)
nach P2 = (−1m, 5m, −3m) verschoben. Wir messen hier Abstände in Metern (m) und Kräfte in
Newton (N). Welche Arbeit wird dabei verrichtet und wie groß ist der Winkel zwischen F~ und dem
Verschiebungsvektor?
2 Vektoren 53

Der Massenpunkt wird um den Vektor


     
−1m 0m −1m
−−−→      
~s = P1 P2 =  5m  −  −1m  =  6m  (2.103)
−3m −4m 1m

verschoben. Dadurch leistet die Kraft die Arbeit


   
−10N −1m
W = F~ · ~s = 
   
2N  ·  6m  = (10 + 12 + 5)Nm = 27Nm. (2.104)
5N 1m

Die Beträge der Verschiebung und der Kraft sind


√ √
|~s| = 38m und |F~ | = 129N, (2.105)

sodass der Winkel zwischen Kraft und Verschiebungsvektor gegeben ist durch:

F~ · ~s 27Nm
ϕ = arccos = arccos √ = arccos 0.386 = 67.32◦ . (2.106)
|F~ ||~s| 129 · 38Nm

2.5 Vektorprodukt

2.5.1 Definition

Das äußere Produkt (auch Kreuzprodukt oder Vektorprodukt) zweier Vektoren ~a und ~b,
geschrieben als

~c = ~a × ~b, (2.107)

ist ein Vektor mit Betrag

|~c| = |~a||~b| sin α, (2.108)

wobei α der von den Vektoren ~a und ~b eingeschlossene Winkel ist. Der Vektor ~c ist orthogonal
sowohl zu ~a als auch zu ~b und zwar so, dass ~a, ~b und ~c ein Rechtssystem bilden (siehe Abb. 2.23).

Abbildung 2.23: Das Vektorprodukt ~c = ~a×~b Abbildung 2.24: Die “rechte-Hand-Regel” ist
steht sowohl auf ~a als auch auf ~b senkrecht. eine Merkhilfe für die Richtung des äußeren
Zusammen bilden die Vektoren ein Rechts- Vektorprodukts.
system.
54 2 Vektoren

Abbildung 2.25: Die “gekrümmte-Hand- Abbildung 2.26: Die Schraubenregel.


Regel”.

In einem Rechtssystem stehen die Vektoren ~a, ~b, ~c zueinander wie Daumen, Zeigefinger und Mit-
telfinger der gespreizten rechten Hand (rechte-Hand-Regel, siehe Abb. 2.24). Als Alternative dazu
können Sie sich die gekrümmte rechte Hand vorstellen. Wenn die gekrümmten Finger in die Rich-
tung weisen, in der man ~a am schnellsten in ~b überführen kann, zeigt der Daumen in Richtung
~c = ~a × ~b (siehe Abb. 2.25). Sie können sich auch eine Schraube vorstellen, mit der Sie ~a nach ~b
drehen (siehe Abb. 2.26). Dann bewegt sich die Schraube in Richtung von ~c = ~a × ~b.

Als dreidimensionales kartesisches Koordinatensystem wird meistens ein Rechtssystem verwen-


det. Ein Linkssystem wird analog definiert. Vertauschen von ~a und ~b macht ein Rechtssystem zu
einem Linkssystem.

Abbildung 2.27: Der Betrag des Vektorprodukts ~a × ~b ist gleich der Fläche des von den Vektoren
~a und ~b aufgespannten Parallelogramms.

Anschaulich lässt sich der Betrag des Vektorprodukts ~a × ~b als die Fläche des von den Vektoren ~a
und ~b aufgespannten Parallelogramms betrachten (siehe Abb. 2.27):

A = |~a|h
= |~a||~b| sin α
= |~a × ~b|. (2.109)

Wir können somit das Vektorprodukt verwenden, um die Fläche des Parallelogramms zu berechnen,
das von zwei Vektoren aufgespannt wird.

2.5.2 Rechenregeln

Für das Vektorprodukt gelten die folgenden Rechenregeln:

• Im Unterschied zum Skalarprodukt ist das Vektorprodukt nicht kommutativ. Das heißt, dass
es beim Vektorprodukt auf die Reihenfolge ankommt. Anschaulich ist das klar, denn wenn
die Vektoren ~a, ~b und ~a × ~b ein Rechtssystem bilden, dann müssen die Vektoren ~a, ~b und ~b ×~a
2 Vektoren 55

ein Linkssystem bilden (siehe Abb. 2.28). Bei Vertauschung der Multiplikanden weist das
Vektorprodukt also in die entgegengesetzte Richtung. Es gilt das Antikommutativgesetz:

~a × ~b = −(~b × ~a). (2.110)

• Assoziativgesetz für Multiplikation mit einem Skalar α:

(α~a) × ~b = α(~a × ~b) = ~a × (α~b) = α~a × ~b. (2.111)

• Distributivgesetz:

~a × (~b + ~c) = ~a × ~b + ~a × ~c. (2.112)

Wir wollen diese Rechenregeln nun aus der Definition des Vektorprodukts ableiten. Das Antikom-
mutativgesetz ~a × ~b = −(~b × ~a) folgt direkt aus der “rechten-Hand-Regel”: durch Vertauschen von
~a und ~b kehrt sich die Richtung des Vektorprodukts einfach um.

Betrachten wir nun, was passiert, wenn wir einen der beiden Vektoren, sagen wir ~a, mit einer
positiven Zahl λ multiplizieren (siehe Abb. 2.29). Da sich durch Multiplikation mit λ die Länge der
Grundlinie um einen Faktor λ ändert, erhalten wir für die Fläche A′ des von ~b und λ~a aufgespannten
Parallelogramms:
A′ = |λ~a||~b| sin α = λ|~a||~b| sin α = λA. (2.113)
Hier ist A die Fläche des von ~a und ~b aufgespannten Parallelogramms. Das heißt,

|(λ~a) × ~b| = λ|~a × ~b| = |λ(~a × ~b)|. (2.114)

Da ~a und λ~a die selbe Richtung haben, sind (λa)×~b und ~a ×~b und somit auch λ(~a ×~b) parallel. Der
Vektor (λa) × ~b stimmt also sowohl im Betrag als auch in der Richtung mit dem Vektor λ(~a × ~b)
überein. Diese beiden Vektoren sind deshalb gleich:

(λ~a) × ~b = λ(~a × ~b). (2.115)

Falls λ negativ ist, müssen wir berücksichtigen, dass λ~a und ~a zueinander antiparallel sind und
deshalb der Winkel zwischen λ~a und ~b zu π − α wird (siehe Abb. 2.30). In diesem Fall ist die Fläche
A′ gegeben durch:
A′ = |λ~a||~b| sin(π − α) = |λ||~a||~b| sin α = |λ|A. (2.116)
Das heißt,
|(λ~a) × ~b| = |λ||~a × ~b| = |λ(~a × ~b)|. (2.117)
Aus der rechten-Hand-Regel folgt nun, dass (λ~a) × ~b und ~a × ~b antiparallel sind. Somit hat (λ~a) × ~b
jedoch die selbe Richtung wie λ(~a × ~b) (vergessen wir nicht, dass wir gerade den Fall λ < 0

Abbildung 2.28: Während die Vektoren ~a, ~b und ~a ×~b ein Rechtssystem bilden, spannen die Vektoren
~a, ~b und ~b × ~a ein Linkssystem auf.
56 2 Vektoren

Abbildung 2.29: Durch Multiplikation des Vektors ~a mit dem positiven Skalar λ ändert sich die
Grundlinie des aufgespannten Parallelogramms um den Faktor λ.

betrachten). Der Vektor (λ~a) × ~b stimmt auch in diesem Fall mit dem Vektor λ(~a × ~b) sowohl in
Länge als auch im Betrag überein, sodass allgemein gilt:

(λ~a) × ~b = λ(~a × ~b). (2.118)

Analoge Überlegungen führen auf


~a × (λ~b) = λ(~a × ~b) (2.119)
und wir können schreiben:
(λ~a) × ~b = ~a × (λ~b) = λ(~a × ~b). (2.120)

Es bleibt uns noch zu zeigen, dass ~a × (~b + ~c) = ~a × ~b + ~a × ~c. Um dies zu tun, wollen wir die
Komponenten von ~a × (~b + ~c) sowie von ~a × ~b und ~a × ~c explizit bestimmen. Wir wählen dazu ein
Koordinatensystem, dessen z-Achse in Richtung des Vektors ~a zeigt, das heißt
 
0
 
~a =  0  . (2.121)
az

Die Vektoren ~b = (bx , by , bz ) und ~c = (cx , cy , cz ) sind jedoch beliebig. Durch die spezielle Wahl des
Koordinatensystems schränken wir die Gültigkeit der nachfolgenden Überlegungen nicht ein.

Wir definieren nun den neuen Vektor ~b′ = (bx , by , 0), den wir aus ~b erhalten, indem wir dessen
z-Komponente durch 0 ersetzen. Der Vektor ~b′ ist die Projektion von ~b in die xy-Ebene. Wie

Abbildung 2.30: Durch Multiplikation des Vektors ~a mit dem negativen Skalar λ ändert sich der
eingeschlossene Winkel von α auf π − α.
2 Vektoren 57

Abbildung 2.31: Die von ~a und ~b sowie von ~a und ~b′ aufgespannten Parallelogramme haben den
selben Flächeninhalt.

aus Abb. 2.31 ersichtlich ist, haben die Parallelogramme, welche von ~a und ~b sowie von ~a und ~b′
aufgespannt werden, den selben Flächeninhalt. Beide besitzen nämlich die selbe Grundlinie, |~a|,
und die selbe Höhe, |~b| sin α = |~b′ |. Somit gilt

|~a × ~b| = |~a × ~b′ |. (2.122)

Der Vektor ~a × ~b, der in der xy-Ebene liegt, steht normal sowohl auf ~b als auch auf ~b′ . Da auch
~a × ~b′ auf ~b′ normal steht und in der xy-Ebene liegt, bedeutet dies, dass ~a × ~b und ~a × ~b′ die selbe
Richtung haben. Da sie auch im Betrag übereinstimmen (siehe Gleichung (2.122)), sind sie gleich:

~a × ~b = ~a × ~b′ . (2.123)

Zum Vektor ~b′ = (bx , by , 0) bilden wir nun den Vektor ~b′′ = (−by , bx , 0). Durch Bildung des Ska-
larprodukts können wir leicht feststellen, dass der Vektor ~b′′ sowohl auf ~a als auch auf ~b′ normal
steht. Aus der rechten-Hand-Regel folgt, dass ~b′′ genau die Richtung von ~a × ~b′ und somit auch
von ~a × ~b besitzt. Wenn wir nun den Vektor ~b′′ mit |~a| multiplizieren, erhalten wir einen Vektor,
der sowohl in der Richtung als auch im Betrag mit ~a × ~b übereinstimmt:

|(−|~a|by , |~a|bx , 0)| = |~a||~b′ | = |~a × ~b′ | = |~a × ~b|. (2.124)

Somit gilt:
 
−|~a|by
~a × ~b =  |~a|bx  .
 
(2.125)
0

Analoge Überlegungen führen auf


 
−|~a|cy
 
~a × ~c =  |~a|cx  (2.126)
0

und
 
−|~a|(by + cy )
~a × (~b + ~c) =  |~a|(bx + cx )  .
 
(2.127)
0
58 2 Vektoren

Durch komponentenweisen Vergleich der Vektoren erhalten wir das Distributivgesetz für das Vek-
torprodukt:
     
−|~a|(by + cy ) −|~a|cy −|~a|cy
~a × (~b + ~c) =  |~a|(bx + cx )  =  |~a|cx  +  |~a|cx  = ~a × ~b + ~a × ~c.
     
(2.128)
0 0 0

2.5.3 Komponentenweise Darstellung

In kartesischen Koordinaten kann das Vektorprodukt komponentenweise ausgedrückt werden als:


     
ax bx ay b z − az b y
~a × ~b =  ay  ×  by  =  az bx − ax bz  .
     
(2.129)
az bz ax b y − ay b x

Dies kann man sich klar machen, indem man ~a und ~b mit Hilfe der Einheitsvektoren darstellt und
das Distributivgesetz ausnutzt:

~a × ~b = (ax~ex + ay ~ey + az ~ez ) × (bx~ex + by ~ey + bz ~ez )


= ax bx (~ex × ~ex ) + ax by (~ex × ~ey ) + ax bz (~ex × ~ez )
(2.130)
+ ay bx (~ey × ~ex ) + ay by (~ey × ~ey ) + ay bz (~ey × ~ez )
+ az bx (~ez × ~ex ) + az by (~ez × ~ey ) + az bz (~ez × ~ez ).

Da

~ei × ~ei = 0 (der Vektor ~ei ist parallel zu sich selbst) (2.131)

und die Einheitsvektoren ~ex , ~ey und ~ez ein Rechtssystem bilden und somit gilt

~ex × ~ey = ~ez , ~ey × ~ex = −~ez , (2.132)


~ey × ~ez = ~ex , ~ez × ~ey = −~ex , (2.133)
~ez × ~ex = ~ey , ~ex × ~ez = −~ey , (2.134)

erhalten wir schließlich

~a × ~b = ax by~ez − ax bz ~ey − ay bx~ez + ay bz~ex + az bx~ey − az by~ex


(2.135)
= (ay bz − az by )~ex + (az bx − ax bz )~ey + (ax by − ay bx )~ez ,

was genau der komponentenweisen Darstellung entspricht, die wir weiter oben angeführt haben.

Leichter merken kann man sich die Bildung des Kreuzprodukts folgendermaßen: Zur Berechnung
der x-Komponente decken wir auf der linken Seite der Gleichung
     
ax bx ay b z − az b y
     
 ay  ×  b y  =  az b x − ax b z  (2.136)
az bz ax b y − ay b x

zunächst die x-Zeile ab und multiplizieren kreuzweise: (links oben × rechts unten) minus (links
unten × rechts oben). Für die y-Komponente des Kreuzprodukts gehen wir analog vor und decken
die y-Zeile ab und berechnen wieder (links oben × rechts unten) minus (links unten × rechts oben),
wobei wir uns aber das gesamte Schema nach unten durch Kopien der oberen beiden Zeilen ergänzt
denken. Für die z-Komponente decken wir schließlich die z-Zeile ab und verfahren analog.
2 Vektoren 59

2.5.4 Anwendungen

Durch Berechnung des Vektorprodukts kann man prüfen, ob zwei Vektoren parallel zueinander
sind. Wenn ~a parallel zu ~b ist (und infolgedessen der eingeschlossene Winkel α verschwindet oder
π beträgt), ist sin α = 0 und das Vektorprodukt verschwindet:
~a × ~b = ~0 ⇔ ~a||~b. (2.137)

Eine weitere wichtige Anwendung des Vektorprodukts besteht in der Konstruktion eines Vektors,
der auf zwei gegebene Vektoren ~a und ~b normal stehen soll.

Beispiel:
   
1 3
 
~a =  2  ~b = 
 4 

(2.138)
3 5
       
1 3 2·5−3·4 −2
~c = ~a × ~b =  2  ×  4  =  3 · 3 − 1 · 5  =  4 
       
(2.139)
3 5 1·4−2·3 −2
√ √
|~a| = 1 + 4 + 9 = 14 (2.140)
√ √
|~b| = 9 + 16 + 25 = 50 (2.141)
√ √
|~a × ~b| = 4 + 16 + 4 = 24. (2.142)
Den Winkel zwischen ~a und ~b bestimmen wir folgendermaßen:

|~a × ~b| 24
sin α = =√ = 0.185 . . . (2.143)
~
|~a||b| 50 · 14
α = 10.67◦. (2.144)
Haben wir richtig gerechnet, sollten ~a und ~b zu ~a × ~b orthogonal stehen, was wir durch Berechnung
der entsprechenden Skalarprodukte prüfen können:
   
−2 1
   
~c · ~a =  4  ·  2  = −2 + 8 − 6 = 0, (2.145)
−2 3
   
−2 3
~c · ~b =  4  ·  4  = −6 + 16 − 10 = 0.
   
(2.146)
−2 5

2.6 Spatprodukt

2.6.1 Definition

Das Spatprodukt (oder gemischtes Produkt) dreier Vektoren ~a, ~b und ~c ist ein Skalar und ist
definiert als
[~a~b~c] = (~a × ~b) · ~c. (2.147)
Anschaulich ist das Spatprodukt (genauer gesagt der Betrag des Spatprodukts) das Volumen des
von den drei Vektoren ~a, ~b und ~c aufgespannten Parallelepipeds, das auch Parallelflach oder
Spat genannt wird (siehe Abb. 2.32).
60 2 Vektoren

Abbildung 2.32: Das Spatprodukt

Die geometrische Interpretation des Spatprodukts ergibt sich aus folgender Überlegung. Das Vo-
lumen V des von den drei Vektoren aufgespannten Parallelepipeds ist gegeben durch

V = A h, (2.148)

wobei A die Fläche des von ~a und ~b aufgespannten Parallelogramms und h die in Abb. 2.32
dargestellte Höhe des Parallelepipeds ist. Die Fläche A erhalten wir aus dem Vektorprodukt von ~a
und ~b,
A = |~a||~b| sin α = |~a × ~b|. (2.149)
Die Höhe h erhalten wir durch Projektion des Vektors ~c auf ~a × ~b:

h = |~c|| cos β|. (2.150)

Die Betragsstriche garantieren dabei, dass die Höhe nicht negativ wird. Einsetzen ergibt schließlich

V = A · h = |~a × ~b||~c|| cos β| = |(~a × ~b) · ~c|. (2.151)

2.6.2 Komponentenweise Darstellung

Das Spatprodukt kann mit Hilfe der Komponenten von ~a, ~b und ~c ausgedrückt werden:
     
ax bx cx
(~a × ~b) · ~c =  ay  ×  by  ·  cy 
     

az bz cz
   
ay b z − az b y cx
   
=  a z b x − a x b z  ·  cy 
ax b y − ay b x cz
= cx (ay bz − az by ) + cy (az bx − ax bz ) + cz (ax by − ay bx ). (2.152)

2.6.3 Rechenregeln und Anwendung


• Durch die Nichtkommutativität des Kreuzprodukts ist das Spatprodukt nicht kommutativ.
Das Vertauschen von zwei Vektoren ändert das Vorzeichen des Spatprodukts:

[ ~a~b~c ] = −[ ~b~a~c ]. (2.153)

• Vektoren können zyklisch vertauscht werden, ohne das Spatprodukt zu ändern:

[ ~a~b~c ] = [ ~b~c~a ] = [ ~c~a~b ], (2.154)


(~a × ~b) · ~c = (~b × ~c) · ~a = (~c × ~a) · ~b. (2.155)
2 Vektoren 61

• Aus ~a · ~b = ~b · ~a und der zyklischen Vertauschbarkeit folgt außerdem:

(~a × ~b) · ~c = ~a · (~b × ~c). (2.156)

• Das Spatprodukt kann als Determinante dargestellt werden:



a a a
x y z
[ ~a~b~c ] = bx by bz .

(2.157)

c c c
x y z

• Das Spatprodukt verschwindet, wenn die Vektoren ~a und ~b × ~c zueinander orthogonal sind.
Das ist der Fall, wenn alle Vektoren in der selben Ebene liegen, d.h. wenn sie komplanar
sind:

[ ~a~b~c ] = 0 ⇔ ~a, ~b, ~c komplanar. (2.158)

2.7 Mehrfachprodukte

Für Mehrfachprodukte gelten folgende Rechenregeln:

• Doppeltes Kreuzprodukt (bac-cab Regel)

~a × (~b × ~c) = ~b(~a · ~c) − ~c(~a · ~b). (2.159)

• Kreuzprodukt von zwei Kreuzprodukten

(~a × ~b) × (~c × d)


~ = ~c[(~a × ~b) · d]
~ − d[(~
~ a × ~b) · ~c]
= ~b[(~c × d)
~ · ~a] − ~a[(~c × d)
~ · ~b]. (2.160)

• Skalarprodukt von zwei Kreuzprodukten

(~a × ~b) · (~c × d)


~ = ~a · (~b × (~c × d))
~
= (~a · ~c)(~b · d)
~ − (~a · d)(
~ ~b · ~c). (2.161)

• Quadrat eines Kreuzprodukts

(~a × ~b)2 = |~a|2 |~b|2 − (~a · ~b)2 . (2.162)

2.8 Anwendungsbeispiele für Vektoren

2.8.1 Strömung durch eine Fläche

Stellen wir uns eine Flüssigkeit vor, die mit gleichförmiger Geschwindigkeit ~v strömt (siehe Abb.
2.33). In der Flüssigkeit denken wir uns eine ebene Fläche mit beliebigem Umriss und einem
Flächeninhalt f . Wir wollen nun den Fluss durch diese imaginäre Fläche berechnen.

Unter dem Fluss verstehen wir das pro Zeiteinheit durch die Fläche hindurch tretende Flüssigkeitsvo-
lumen. Ist die Fläche parallel zur Flussrichtung, tritt keine Flüssigkeit hindurch. In jeder anderen
Orientierung tritt Flüssigkeit hindurch. Die Orientierung der Fläche spielt also eine wesentliche
62 2 Vektoren

Abbildung 2.33: Strömung durch eine Fläche mit Flächenvektor f~.

Rolle und es genügt nicht, nur den Flächeninhalt anzugeben. Wir führen daher den Flächenvektor
f~ ein, der neben dem Flächeninhalt von f auch die Orientierung der Fläche im Raum beschreibt:

f~ ist orthogonal zur Fläche,


|f~| = f der Betrag von f~ ist gleich dem Flächeninhalt.

Zur Berechnung des Flusses betrachten wir nun alle Teilchen, die sich zum Zeitpunkt 0 in der
imaginären Fläche befinden. Nach einer Zeit t haben sich alle diese Teilchen um die Distanz

~v t (2.163)

weiterbewegt. Sie liegen jetzt auf einer Fläche, die gleich ist der um ~v t parallel verschobenen
ursprünglichen Fläche. Alle Flüssigkeitsteilchen, die in der Zeit t durch die Fläche hindurch getreten
sind, befinden sich in einem schiefen Zylinder. Das Volumen des Zylinders ist Grundfläche f mal
Höhe h:

V = f h. (2.164)

Um die Höhe h zu bestimmen, berechnen wir die Projektion von ~v · t auf f~


!
f~
h = (~v t)f = ~v t · . (2.165)
f

Das Volumen ist deshalb

~v · f~
V = tf = t~v · f~. (2.166)
f

Der Fluss ist gleich dem Volumen V pro Zeit t und wir erhalten schließlich

V
Fluss = = ~v · f~. (2.167)
t

Der Fluss ist also gegeben durch das Skalarprodukt von ~v und f~.

2.8.2 Rotation eines Körpers

Um die Rotation eines Körpers um eine Achse zu beschreiben, verwenden wir die Winkelge-
schwindigkeit ω. Sie gibt den Winkel in Bogenmaß an, um den sich der Körper pro Zeiteinheit
2 Vektoren 63

dreht. Um auch die Richtung der Drehachse zu berücksichtigen, führen wir den Winkelgeschwin-
digkeitsvektor ~ω ein:
~
ω ist parallel zur Rotationsachse,
|~
ω| = ω der Betrag ist gleich der Winkelgeschwindigkeit.
Die Richtung von ~
ω ist so gewählt, dass von der Spitze von ~ω aus gesehen die Rotation in positiver
Richtung, also gegen den Uhrzeigersinn, erfolgt (siehe Abb. 2.34). Wenn die gekrümmten Finger
der rechten Hand also der Rotation folgen, zeigt der Daumen in Richtung von ω ~ (siehe Abb. 2.25).

Abbildung 2.34: Die Winkelgeschwindigkeit ~ω ist so definiert, dass von der Spitze aus gesehen die
Rotation gegen den Uhrzeigersinn erfolgt.

Nun wollen wir den Winkelgeschwindigkeitsvektor ~ω benutzen, um die Momentangeschwindigkeit


eines Punktes auf einem rotierenden Körper zu ermitteln. Der Punkt bewegt sich dabei auf einer
Kreisbahn mit dem Radius r (siehe Abb. 2.35). Der pro Zeiteinheit zurückgelegte Winkel ist ω.
Daher ist die pro Zeiteinheit zurückgelegte Strecke, also die Geschwindigkeit
v = ωr. (2.168)
Zur Berechnung von v müssen wir den Radius r bestimmen. Zudem müssen wir beachten, dass ~v
parallel zur Tangente an die Kreisbahn sein muss.

Abbildung 2.35: Rotation eines Körpers um eine Achse.

All dies lässt sich durch Verwendung des Vektorprodukts sehr einfach erreichen. Es sei ~x ein
Vektor von einem beliebigen Punkt auf der Drehachse zu jenem Punkt, dessen Geschwindigkeit ~v
wir bestimmen möchten. Der Betrag v = |~v | ist dann gegeben durch:
v = ωr = ω · |~x| · sin α = |~ω × ~x|. (2.169)
Weiters ist ~
ω ×~x sowohl zu ~
ω als auch zu ~x orthogonal, sodass die Geschwindigkeit auch die richtige
Richtung hat. Mit der rechten-Hand-Regel sieht man leicht, dass der Vektor
~v = ~ω × ~x (2.170)
auch die richtige Orientierung hat.
64 2 Vektoren

2.8.3 Volumen einer Einheitszelle

Abbildung 2.36: Einheitszelle eines triklinen Kristalls.

Gegeben sei die Einheitszelle eines Kristalls, die von den Vektoren ~a, ~b und ~c aufgespannt wird. Die
Längen der Vektoren sind a = 3Å, b = 2Å, und c=2Å. (Die Längeneinheit Ångström, abgekürzt als
Å, ist im atomaren Bereich gebräuchlich. Es gilt 1Å=10−10 m.) Der Winkel zwischen den Vektoren
ist jeweils 60◦ . Wie groß ist das Volumen der Einheitszelle?

Wir wählen zunächst ein kartesisches Koordinatensystem, in dem die x-Achse parallel zum Vektor
~a ist und die y-Achse so orientiert ist, dass der Vektor ~b in der xy-Ebene liegt (wir können das
Koordinatensystem so orientieren, wie wir wollen). Dann ist

~a = (3Å, 0, 0) (2.171)

und √

~b = (2 cos α, 2 sin α, 0) = (2 1 Å, 2 3 Å, 0) = (1Å, 3Å, 0). (2.172)
2 2

Abbildung 2.37: Einheitszelle dargestellt in einem geeigneten kartesischen Koordinatensystem.

Um ~c zu finden, beachten wir, dass


ac 2
~a · ~c = ac cos 60◦ = = 3Å , (2.173)
2
~b · ~c = bc cos 60◦ = bc = 2Å2 . (2.174)
2
2 Vektoren 65

Einsetzen ergibt
   
3Å cx
    2
 0  ·  cy  = 3cx Å = 3Å (2.175)
0 cz

und somit
cx = 1Å. (2.176)
Weiteres Einsetzen ergibt
   
1Å cx √ √
 √    2 2
 3Å  ·  cy  = cx Å + 3cy Å = 1Å + 3Åcy = 2Å , (2.177)
0 cz

woraus folgt
1
cy = √ Å. (2.178)
3
Da der Betrag von ~c bekannt ist, können wir schreiben
2
c2z + c2x + c2y = 4Å . (2.179)

Daraus können wir die z-Komponente des Vektors ~c bestimmen:


r
2 21 2 8 2 8
c2z = 4Å − 1Å − Å = Å ⇒ cz = Å. (2.180)
3 3 3
Wir erhalten schließlich für den Vektor ~c:
 
1
 1 
~c =  √
 q3  Å. (2.181)

8
3

Aus den nun explizit bekannten Vektoren ~a, ~b und ~c können wir mit Hilfe des Spatprodukts das
Volumen der Einheitszelle des Kristalls berechnen:
     
3 1 1
  √   √1   3
V = (~a × ~b) · ~c =  0  ×  3  · 

 q3  Å
8
0 0 3
   
0 1
   3 √
=
 √1
 0  ·  q3
  Å = 3 8Å3 . (2.182)
√ 8

3 3 3
66 2 Vektoren
Kapitel 3

Differentiation

3.1 Grundbegriffe

Betrachten wir ein Objekt (z.B. ein Fahrzeug), das sich gleichförmig fortbewegt. Die Geschwin-
digkeit ist in diesem Fall durch die pro Zeit zurückgelegte Strecke definiert:

s2 − s1 ∆s
v= = . (3.1)
t2 − t1 ∆t

Hier ist ∆s = (s2 − s1 ) die im Zeitintervall ∆t = (t2 − t1 ) zurückgelegte Strecke. Bei gleichförmi-
ger Bewegung könnten wir die Zeiten t2 und t1 beliebig wählen und wir würden immer dasselbe
Resultat für die Geschwindigkeit v erhalten. Wenn wir die gleichförmige Bewegung in einem Raum-
zeitdiagramm graphisch darstellen, indem wir die zurückgelegte Entfernung s als Funktion der Zeit
t auftragen, erhalten wir eine Gerade, dessen Steigung die Geschwindigkeit ist (siehe Abb. 3.1).

Abbildung 3.1: Raumzeitdiagramm für ein Objekt, das sich gleichförmig, das heißt mit konstanter
Geschwindigkeit, fortbewegt.

Bei einer ungleichförmigen Bewegung ist dies jedoch anders. In diesem Fall hängt der Quotient
(s2 −s1 )/(t2 −t1 ) sehr wohl vom gewählten Intervall [t1 , t2 ] ab. (s2 −s1 )/(t2 −t1 ) ist in diesem Fall die
mittlere Geschwindigkeit im Zeitintervall [t1 , t2 ]. In der graphischen Darstellung der Entfernung
als Funktion der Zeit erhalten wir in diesem Fall eine gekrümmte Kurve, die in Abb. 3.2 beispielhaft
dargestellt ist. Die mittlere Geschwindigkeit (s2 − s1 )/(t2 − t1 ) ist die Steigung der Sekante, die
durch die Punkte (t1 , s1 ) und (t2 , s2 ) geht. Wie aus der Abbildung ersichtlich ist, würde ein anders

67
68 3 Differentiation

gewähltes Zeitintervall, sagen wir [t1 , t′2 ], eine andere Steigung der Sekante und somit eine andere
mittlere Geschwindigkeit, nämlich (s′2 − s1 )/(t′2 − t1 ), ergeben.

Abbildung 3.2: Raumzeitdiagramm für ein Objekt, das sich ungleichförmig, das heißt mit einer
sich verändernden Geschwindigkeit, fortbewegt.

Die Momentangeschwindigkeit v des Objekts zu einem bestimmten Zeitpunkt t (also die Ge-
schwindigkeit, die man etwa vom Tachometer eines Autos ablesen würde) erhalten wir, indem wir
zu sehr kleinen Zeitintervallen ∆t übergehen:

∆s
v = lim . (3.2)
∆t→0 ∆t

In diesem Grenzfall wird aus der Sekante in Abb. 3.2 die Tangente an die Raumzeitkurve und die
Geschwindgkeit v(t), die nun von der Zeit t abhängt, ist die Steigung dieser Tangente (siehe Abb.
3.3). Man nennt v(t) auch die Ableitung von s(t) an der Stelle t.

Abbildung 3.3: Im Grenzfall eines unendlich kleinen Zeitintervalls wird aus der Sekante aus Abb.
3.2 die Tangente der Kurve. Die Steigung der Tangente der Raum-Zeit-Kurve zur Zeit t′ ist die
Geschwindigkeit des Objekts zur Zeit t′ .

Um nach diesem anschaulichen Beispiel den Begriff der Ableitung formaler einzuführen, betrachten
wir zunächst den Differenzenquotienten. Der Differenzenquotient m für eine Funktion y = f (x)
ist der Quotient aus der Differenz der Funktionswerte y1 = f (x1 ) und y2 = f (x2 ) und der Differenz
der Argumente an den Stellen x1 und x2 :

∆y y2 − y1 f (x1 + ∆x) − f (x1 )


m= = = . (3.3)
∆x x2 − x1 ∆x
3 Differentiation 69

Abbildung 3.4: Der Differenzenquotient m = ∆y/∆x ist die Steigung der Sekante durch die Punkte
(x1 , f (x1 )) und (x2 , f (x2 )).

Dabei ist ∆y = y2 − y1 und ∆x = x2 − x1 . Der Differenzenquotient ist die Steigung der Sekante
durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) (siehe Abb. 3.4).

Beispiel: Der Differenzenquotient der Funktion


f (x) = 2x3 + 4x2 − 1 (3.4)
ist:
f (x + ∆x) − f (x)
m(x) =
∆x
2(x + ∆x)3 + 4(x + ∆x)2 − 1 − 2x3 − 4x2 + 1
=
∆x
2(x3 + 3x2 ∆x + 3x∆x2 + ∆x3 ) + 4(x2 + 2x∆x + ∆x2 ) − 1 − 2x3 − 4x2 + 1
=
∆x
= (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x). (3.5)

Wenn wir nun zum Grenzfall unendlich kleiner Differenzen übergehen, wird aus dem Differenzen-
quotienten der Differentialquotient (wir lassen ∆x gegen 0 gehen):
df (x) ∆f (x) f (x + ∆x) − f (x)
f ′ (x) = = lim = lim . (3.6)
dx ∆x→0 ∆x ∆x→0 ∆x
Die Notationen f ′ (x) und df (x)/dx sind äquivalent und bezeichnen beide den Differentialquotien-
ten. Der Differentialquotient f ′ (x) wird auch die Ableitung von f (x) nach x genannt. Anschaulich
ist der Differentialquotient f ′ (x) die Steigung der Tangente an den Funktionsgraphen der Funk-
tion f (x) an der Stelle x. Verläuft der Funktionsgraph steil, ist der Differentialquotient (oder die
Ableitung) groß, für eine flache Kurve ist er klein. Da sich die Steigung des Funktionsgraphen von
Ort zu Ort im Allgemeinen ändert, ist - so wie die Funktion f (x) selbst - auch ihre Ableitung f ′ (x)
von x abhängig.

Das Differential df der Funktion f (x) ist definiert als:


df (x) = f ′ (x)dx. (3.7)
Das Differential kann betrachtet werden als die infinitesimale Änderung df der Funktion f (x),
welche durch eine infinitesimale Änderung dx des Arguments x hervorgerufen wird.

Wenn die unabhängige Variable die Zeit ist, verwendet man für die 1. Ableitung auch folgende
Notation mit einem Punkt
dx(t)
ẋ(t) = . (3.8)
dt
70 3 Differentiation

Diese Notation ist vor allem in der klassischen Mechanik gebräuchlich.

Wir wollen nun für das obige Beispiel den Grenzübergang ∆x → 0 durchführen und den Differen-
tialquotienten f ′ (x) explizit berechnen. Dazu gehen wir vom Ausdruck für den Differenzenquotien-
ten aus:

∆f (x)
= (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x). (3.9)
∆x

Alle Terme, die ∆x enthalten, verschwinden bei diesem Grenzübergang und wir erhalten:

df ∆f (x)
= lim = lim (6x2 + 6x∆x + 2∆x2 + 8x + 4∆x)
dx ∆x→0∆x ∆x→0
2
= 6x + 8x. (3.10)

Durch ähnliche Überlegungen lassen sich Differentiationsregeln für die wichtigsten Funktionen ab-
leiten, die wir im nächsten Abschnitt kurz und ohne Herleitung behandeln.

3.2 Differenzierbarkeit

Eine Funktion nennt man in einem Intervall stetig differenzierbar, falls ihre Ableitung in diesem
Intervall stetig ist. Eine stetige Funktion muss nicht überall differenzierbar sein (an Knickstellen
ist die Ableitung nicht definiert, siehe Abb. 3.5).

Abbildung 3.5: Die Funktion s(t) ist im dargestellten Bereich zwar überall stetig, aber an den
Stellen t1 und t2 nicht differenzierbar. Die Ableitung ds(t)/dt ist an diesen Stellen nicht stetig.

An diesen Punkten ist die Funktion nicht differenzierbar (wir können hier keine Tangente an-
legen) und die Ableitung existiert daher nicht.
3 Differentiation 71

3.3 Wichtige Ableitungen

Die Ableitungen der wichtigsten Funktionen sind hier zusammengefasst. Weitere Ableitungen kön-
nen Sie einer Formelsammlung entnehmen oder mit den folgenden Differentiationsregeln selbst
herleiten.

f (x) f ′ (x) f (x) f ′ (x)


xn
nx n−1
arcsin x √ 1
1−x2
1
x 1 arccos x − √1−x 2

1
sin x cos x arctan x 1+x2
cos x − sin x a 0
sinh x cosh x ax a
cosh x sinh x ex ex
1
ln x x ax (ln a)ax

3.4 Differentiationsregeln

Mit Hilfe der im letzten Abschnitt angegebenen Ableitungen und der folgenden Differentiations-
regeln können wir auch komplizierte zusammengesetzte Funktionen ableiten. Gegeben seien zwei
(differenzierbare) Funktionen f (x) und g(x) und eine Konstante a.

3.4.1 Faktorregel

d df (x)
(af (x)) = a . (3.11)
dx dx

Zum Beispiel:
y = 7 cos x ⇒ y ′ = −7 sin x. (3.12)

3.4.2 Summenregel

d df (x) dg(x)
(f (x) + g(x)) = + . (3.13)
dx dx dx

Zum Beispiel:
y = 3x + sin x ⇒ y ′ = 3 + cos x. (3.14)

3.4.3 Produktregel

   
d df (x) dg(x)
(f (x) · g(x)) = · g(x) + · f (x). (3.15)
dx dx dx

Zum Beispiel:
y = x2 ex ⇒ y ′ = 2xex + x2 ex = ex x(2 + x). (3.16)
72 3 Differentiation

3.4.4 Quotientenregel

   
df (x) dg(x)

d f (x)

dx · g(x) − dx · f (x)
= . (3.17)
dx g(x) g(x)2

Zum Beispiel:
sin x cos x cos x + sin x sin x 1
y= ⇒ y′ = = . (3.18)
cos x cos2 x cos2 x

3.4.5 Kettenregel

d d df dg
(f ◦ g)(x) = f (g(x)) = f ′ (g(x)) · g ′ (x) = · . (3.19)
dx dx dg dx

Bei der Kettenregel leiten wir also die Funktion zunächst nach dem Argument ab und multiplizieren
das Resultat mit der Ableitung des Arguments nach der Variablen. Wir multiplizieren also die
“äußere Ableitung” mit der “inneren Ableitung”.

Zum Beispiel:
dy
y = sin(x2 ) f (z) = sin z ⇒ = cos x2 · 2x. (3.20)
dx
z = g(x) = x2

dy
y = sin(2x) f (z) = sin z ⇒ = cos 2x · 2. (3.21)
dx
z = g(x) = 2x

2 dy 2
y = ex f (z) = ez ⇒ = ex · 2x. (3.22)
dx
z = g(x) = x2

dy 1
y = xx = eln x·x f (z) = ez ⇒ = eln x·x ( x + ln x)
dx x
z = g(x) = ln x · x = xx (1 + ln x). (3.23)

3.4.6 Umkehrregel

Durch Verkettung einer Funktion mit ihrer Umkehrfunktion ergibt sich die Identität:

(f −1 ◦ f )(x) = f −1 (f (x)) = x. (3.24)

Wenden wir die Kettenregel auf diesen Ausdruck an, erhalten wir:
d −1
f (f (x)) = (f −1 )′ (f (x)) · f ′ (x) = 1. (3.25)
dx
Daraus folgt die praktische Umkehrregel:
1
(f −1 )′ (y) = , (3.26)
f ′ (f −1 (y))
3 Differentiation 73

wobei wir f (x) durch y ersetzt und x durch x = f −1 (y) ausgedrückt haben.

Zum Beispiel:

d 1
y = sin x, x = arcsin y ⇒ arcsin(y) = p . (3.27)
dy 1 − y2

3.5 Höhere Ableitungen


df
Wenn wir die Ableitung f ′ (x) = dx einer Funktion f (x) noch einmal nach der Variablen x ableiten,
erhalten wir die zweite Ableitung:
 
′′ d2 f d d
f (x) = 2 = f (x) . (3.28)
dx dx dx
Wir können natürlich die Funktion f (x) mehr als zweimal differenzieren. Die n-te Ableitung erhält
man durch n-maliges Differenzieren:
dn f
f (n) (x) = . (3.29)
dxn
Zum Beispiel:
f (x) = x5 , (3.30)

f (x) = 5x4 , (3.31)
f ′′ (x) = 20x3 , (3.32)
f ′′′ (x) = 60x2 , (3.33)
f (4) (x) = 120x, (3.34)
f (5) (x) = 120, (3.35)
f (6) (x) = 0, (3.36)
f (n) (x) = 0, ∀n ≥ 6. (3.37)

3.6 Maxima und Minima von Funktionen

An Punkten, wo eine differenzierbare Funktion f (x) Maxima und Minima besitzt, verschwindet
ihre Ableitung f ′ (x). Das heißt, wir können Maxima und Minima von Funktionen finden, indem
wir die Gleichung f ′ (x) = 0 lösen. Falls ein Minimum den kleinsten Wert der Funktion im ge-
samten Definitionsbereich besitzt, nennt man es globales Minimum. Ansonsten ist es ein lokales
Minimum. Globale und lokale Maxima sind analog definiert. Maxima und Minima zusammen
nennt man Extremwerte.

Maxima und Minima kann man durch Bestimmung der zweiten Ableitung an diesen Stellen un-
terscheiden (siehe Abbildungen 3.7 und 3.8). Für Minima haben wir positive Krümmung, das
heißt, f ′′ (xmin ) > 0. Für Maxima hingegen ist die Krümmung negativ, das heißt f ′′ (xmax ) < 0.

Beispiel: Zu bestimmen sind Lage und Wert der Extrema der Funktion
f (x) = (1 − x2 )2 . (3.38)
Wir bilden zunächst die erste Ableitung
f ′ (x) = −2(1 − x2 ) · 2x = −4x + 4x3 . (3.39)
74 3 Differentiation

Abbildung 3.6: Die dargestellte Funktion f (x) besitzt an den Stellen xmin und x′min jeweils Minima
und an der Stelle xmax ein Maximum. Da an der Stelle x′min die Funktion den kleinsten Wert im
gesamten Definitionsbereich annimmt, nennt man das zugehörige Minimum ein globales Minimum.

Abbildung 3.7: Die Funktion ax2 + bx + c hat für a > 0 an der Stelle xmin = −b/2a ein Minimum.
An der Stelle des Minimums hat die Funktion eine positive Krümmung, d.h f ′′ (xmin ) = 2a > 0.

Die Bedingung f ′ (x) = 0 ist an den Stellen x = −1, x = 0 und x = +1 erfüllt. Um herauszufinden,
ob die Funktion an diesen Stellen ein Maximum oder ein Minimum besitzt, berechnen wir die
zweite Ableitung
f ′′ (x) = 12x2 − 4 (3.40)
und werten sie an den Stellen der Extremwerte aus:

f ′′ (0) = −4 und f ′′ (±1) = 8. (3.41)

Die Funktion f (x) = (1 − x2 )2 hat also an den Stellen x = −1 und x = 1 jeweils ein Minimum und
an der Stelle x = 0 ein Maximum.

3.7 Differentiation von Funktionen in Parameterform

Eine Funktion sei in Parameterform gegeben:

x = x(t), (3.42)
y = y(t). (3.43)
dy
Die Ableitung y ′ = dx kann dann aus den Ableitungen nach dem Parameter t berechnet werden :
dy
dy ẏ dt
= = dx
. (3.44)
dx ẋ dt
3 Differentiation 75

Abbildung 3.8: Die Funktion ax2 + bx + c hat für a < 0 an der Stelle xmax = −b/2a ein Maximum.
An der Stelle des Maximums hat die Funktion eine negative Krümmung, d.h f ′′ (xax ) = 2a < 0.

Abbildung 3.9: Die Funktion f (x) = (1 − x2 )2 hat zwei Minima und ein Maximum.

Wir erhalten diese Beziehungen, indem wir zunächst auf y = f (x(t)) die Kettenregel anwenden,
dy df dx dy dx
= · = · . (3.45)
dt dx dt dx dt
Umformung dieser Gleichung ergibt schließlich:
dy
dy dt
= dx
. (3.46)
dx dt

Dieselben Ausdrücke können wir auch auf Funktionen anwenden, welche in Polarkoordinaten
gegeben sind. In diesem Fall betrachtet man r als Funktion von ϕ: r = r(ϕ). Wir haben dann

x = r(ϕ) · cos ϕ, (3.47)


y = r(ϕ) · sin ϕ. (3.48)

Durch Anwendung von Gleichung (3.44) erhalten wir


dy dr
dy dϕ dϕ · sin ϕ + r(ϕ) · cos ϕ
= dx
= dr
. (3.49)
dx dϕ dϕ · cos ϕ − r(ϕ) sin ϕ

Beispiel:

Für die Funktion r(ϕ) = 1/ cos 2ϕ erhalten wir durch Differentiation
 
dr 1 sin 2ϕ
= − (cos 2ϕ)−3/2 (− sin 2ϕ)2 = 3 , (3.50)
dϕ 2 (cos 2ϕ) 2
woraus folgt:
sin 2ϕ √cos ϕ
3 sin ϕ +
dy (cos 2ϕ) 2 cos 2ϕ
= sin 2ϕ
. (3.51)
dx 3 cos ϕ − √sin ϕ
(cos 2ϕ) 2 cos 2ϕ
76 3 Differentiation

Beispiel: Archimedische Spirale

Für die Funktion r(ϕ) = aϕ gilt

dr
= a, (3.52)

und somit
dy a sin ϕ + aϕ cos ϕ sin ϕ + ϕ cos ϕ
= = . (3.53)
dx a cos ϕ − aϕ sin ϕ cos ϕ − ϕ sin ϕ

3.8 Differentiation von Vektoren

Betrachten wir die Bewegung eines Massenpunktes durch den Raum. Diese Bewegung beschreiben
wir durch den Ortsvektor ~r(t) des Massenpunktes als Funktion der Zeit (siehe Abb. 3.10). Die
Bahnkurve des Massenpunktes nennen wir auch Trajektorie.

Abbildung 3.10: Trajektorie ~r(t) eines Massenpunktes. Die Geschwindigkeit ~v (t) ist die erste Ab-
leitung von ~r(t) nach der Zeit.

Wir können jetzt analog zum skalaren Fall vorgehen und eine vektorartige Geschwindigkeit ~v als
den Grenzwert
~r(t + ∆t) − ~r(t)
~v (t) = lim (3.54)
∆t→0 ∆t
definieren. Die Ableitung eines Vektors ist wiederum ein Vektor. In Komponentenschreibweise
können wir diese Grenzwertbildung ausdrücken als:
       
vx (t) lim∆t→0 x(t+∆t)−x(t)
∆t
dx
dt ẋ(t)
       
~v (t) =  vy (t)  =  lim∆t→0 y(t+∆t)−y(t)
∆t
= dy
dt
 =  ẏ(t)  . (3.55)
z(t+∆t)−z(t) dz
vz (t) lim∆t→0 ∆t dt ż(t)

Eine etwas kürzere Schreibweise dafür ist:


d
~v (t) = ~r(t) = ~r˙ (t). (3.56)
dt

Die Geschwindigkeit ~v (t) ist also die zeitliche Ableitung des Vektors ~r(t). Der Geschwindigkeits-
vektor ~v ist tangential zur Trajektorie und sein Betrag ist gleich der Geschwindigkeit in Richtung
der Trajektorie.

Beispiel: Kreisbewegung
3 Differentiation 77

Abbildung 3.11: Geschwindigkeit ~v und Beschleunigung ~a für die gleichförmige Kreisbewegung in


der Ebene.

Für die gleichförmige Kreisbewegung in der Ebene auf einer Bahn mit Radius r um den Ursprung
gilt (siehe Abb. 3.11):

x = r cos ωt, (3.57)


y = r sin ωt, (3.58)

wobei ω die Winkelgeschwindigkeit ist. Durch Differentiation erhalten wir die x- und y-Komponenten
der Geschwindigkeit:

vx = −rω sin ωt, (3.59)


vy = rω cos ωt. (3.60)

Die Beschleunigung beschreibt die zeitliche Änderung der Geschwindigkeit mit der Zeit:

d d2
~a = ~v = 2 ~r. (3.61)
dt dt
Für die Kreisbewegung erhalten wir somit

ax = −rω 2 cos ωt, (3.62)


2
ay = −rω sin ωt. (3.63)

In Vektorschreibweise ist die Beschleunigung also gegeben durch

~a = −ω 2~r. (3.64)

Für Vektoren gelten folgende Differentiationsregeln, welche man sich durch Anwendung der
weiter oben behandelten einfachen Differentiationsregeln auf die jeweiligen Ausdrücke in Kompo-
nentenschreibweise leicht überlegen kann. Hier sind die Vektoren ~a und ~b zeitabhängig: ~a = ~a(t)
und ~b = ~b(t). f (t) ist eine beliebige skalare Funktion der Zeit.

• Summenregel

d d~a d~b
(~a + ~b) = + . (3.65)
dt dt dt

• Produktregeln

– Skalar × Vektor
d df d~a
[f (t)~a] = ~a + f . (3.66)
dt dt dt
78 3 Differentiation

– Skalarprodukt

d d~a ~ d~b
(~a · ~b) = · b + ~a · . (3.67)
dt dt dt

– Kreuzprodukt

d d~a ~ d~b
(~a × ~b) = × b + ~a × . (3.68)
dt dt dt

– Spatprodukt

d d~a ~ d~b d~c


[(~a × ~b) · ~c)] = ( × b) · ~c + (~a × ) · ~c + (~a × ~b) · (3.69)
dt dt dt dt

• Quotientenregel
 
d ~a d~
a
dt f − ~a df
dt
= . (3.70)
dt f (t) f2

• Kettenregel

d~a(f (t)) d~a df


= . (3.71)
dt df dt

3.9 Partielle Differentiation

3.9.1 Funktionen mehrerer Variabler

Eine Funktion kann von mehr als einer Variablen abhängen. Zum Beispiel könnte f (x, y) das
Höhenrelief eines Gebirges darstellen. In diesem Fall gibt f (x, y) für jeden Punkt (x, y), der etwa
durch die geographische Breite x und die geographische Länge y definiert ist, die Höhe über dem
Meeresspiegel an. Im Allgemeinen versteht man unter einer Funktion von zwei unabhängigen Va-
riablen eine Vorschrift, die jedem geordneten Zahlenpaar (x, y) aus dem Definitionsbereich genau
ein Element z aus dem Wertebereich zuordnet:

z = f (x, y). (3.72)

(Diese Definition kann direkt auf eine beliebige Zahl von Argumenten übertragen werden.) So
wie eine Funktion y = f (x) in einem kartesischen Koordinatensystem einen Kurve definiert (den
Funktionsgraphen), definiert eine Funktion z = f (x, y) in einem dreidimensionalen Koordinaten-
system eine Fläche. Diese Fläche entsteht dadurch, dass jedem Punkt in der xy-Ebene eine gewisse
Höhe senkrecht zur xy-Ebene zugeordnet wird. Die Fläche besteht also aus allen Zahlentriplets
(x, y, z = f (x, y)).

Beispiel:

Die durch die Funktion

f (x, y) = y 2 − x (3.73)

definierte Fläche ist in Abb. 3.12 graphisch dargestellt. Die Funktionsfläche ist ein für fallende
Werte von x ansteigendes Tal. Für x = const erhalten wir eine Schar von Parabeln, z = y 2 − const,
und für y = const eine Schar von Geraden mit Steigung -1, z = const − x.
3 Differentiation 79

Abbildung 3.12: Darstellung der Funktion z = f (x, y) = y 2 − x in einem dreidimensionalen karte-


sischen Koordinatensystem.

3.9.2 Partielle Ableitung

Wir können nun die Funktion f (x, y) nach einer der beiden Variablen ableiten und dabei die andere
Variable als konstant betrachten:
∂f (x, y) f (x + ∆x, y) − f (x, y)
= lim (y = const). (3.74)
∂x ∆x→0 ∆x
Genauso können wir die Funktion nach y ableiten:
∂f (x, y) f (x, y + ∆y) − f (x, y)
= lim (x = const). (3.75)
∂y ∆y→0 ∆y
Solche Ableitungen nennt man partielle Ableitungen, da die Funktion nur nach einer der Varia-
blen abgeleitet wird, also nur “zum Teil”, und alle anderen Variablen festgehalten werden. Um
den Unterschied zur Differentiation einer Funktion einer einzelnen Variablen zu betonen, verwen-
den wir für die partielle Ableitung das geschwungene Delta: ∂. Alternativ zur Notation mit dem
geschwungenen Delta ∂ findet auch die folgende Schreibweise mit Indizes Verwendung:
∂f
fx = (3.76)
∂x
∂f
fy = . (3.77)
∂y

Für partielle Ableitungen gelten dieselben Rechenregeln wie für die Differentiation einer Funktion
einer einzelnen Variablen.

Beispiel:

Die Funktion
f (x, y) = xy 2 + 4x5 y + 16x (3.78)
80 3 Differentiation

kann sowohl nach x als auch nach y differenziert werden:


∂f
= y 2 + 20x4 y + 16, (3.79)
∂x
∂f
= 2xy + 4x5 . (3.80)
∂y

Durch wiederholtes partielles Ableiten lassen sich partielle Ableitungen höherer Ordnung (höhere
Ableitungen) bilden:
 
∂2f ∂ ∂f
= = fxx , (3.81)
∂x2 ∂x ∂x
 
∂2f ∂ ∂f
= = fxy , (3.82)
∂y∂x ∂y ∂x
 
∂2f ∂ ∂f
= = fyx , (3.83)
∂x∂y ∂x ∂y
 
∂2f ∂ ∂f
= = fyy . (3.84)
∂y 2 ∂y ∂y

Beispiel: Thermodynamik

In der Thermodynamik verwendet man eine weitere, leicht unterschiedliche Schreibweise für par-
tielle Ableitungen. So ist zum Beispiel die Wärmekapazität eines Körpers gegeben als
 
∂S
Cp = T , (3.85)
∂T p
wobei T die Temperatur ist, S die Entropie und p der Druck. Diese Wärmekapazität Cp ist die
Wärme, die einem Körper zugeführt (oder abgeführt) werden muss, um die Temperatur T des
Körpers um einen gewissen Betrag zu ändern und zwar bei konstantem Druck p. Der Index p
zeigt an, dass die Temperaturänderung bei konstantem Druck erfolgt.

Analog dazu gibt es auch die Wärmekapazität bei konstantem Volumen V :


 
∂S
CV = T . (3.86)
∂T V
Auch hier wird explizit angegeben, welche Variable sich ändert (T ) und welche unverändert bleibt
(V ).

Beispiel: Mechanik

Aus der potentiellen Energie U (x, y, z) kann die Kraft, die auf einen gewissen Körper wirkt, durch
partielle Ableitung berechnet werden:
 
  − ∂U
∂x
Fx  
F~ =  Fy  =  − ∂U
   
∂y
. (3.87)
 
Fz
− ∂U
∂z

Nach dem Satz von Schwarz kann bei gemischten partiellen Ableitungen die Reihenfolge der
Differentiation vertauscht werden, falls die partiellen Ableitungen stetig sind. Dies gilt auch für
partielle Ableitungen höherer Ordnung. Demnach gilt etwa:
∂2f ∂ 2f
= . (3.88)
∂x∂y ∂y∂x
3 Differentiation 81

In Analogie zum Differential lassen sich auch partielle Differentiale definieren:

∂f (x, y)
∂x f (x, y) = dx (3.89)
∂x
und
∂f (x, y)
∂y f (x, y) = dy. (3.90)
∂y

Das totale Differential (auch vollständiges Differential genannt) ergibt sich aus der Summe
der partiellen Differentiale:

∂f ∂f
df (x, y) = dx + dy. (3.91)
∂x ∂y

Das totale Differential, das in der Fehlerrechnung und in der Thermodynamik von Bedeutung ist,
gibt an, um wie viel sich die Funktion f (x, y) ändert, wenn wir ihre Argumente um dx und dy
verschieben.

3.9.3 Anstieg einer impliziten Funktion

Eine Funktion sei in impliziter Form als F (x, y) = 0 gegeben (siehe Abb. 3.13). In einem gewissen
Punkt (x, y) ist der Anstieg der Kurve dann gegeben durch:
∂F
∂x
k = − ∂F . (3.92)
∂y

Um zu verstehen, woher dieser Ausdruck kommt, betrachten wir F (x, y) als eine Funktion z =
F (x, y) von x und y. Das vollständige Differential der Funktion ist
   
∂F ∂F
dF (x, y) = dx + dy. (3.93)
∂x ∂y

Wir wissen nun, dass entlang der durch F (x, y) = 0 definierten Kurve sich F (x, y) nicht ändert
(F (x, y) ist ja auf dieser Kurve überall gleich 0). Daher ist dF = 0. Wenn wir diesen Ausdruck
dann noch durch dx dividieren, erhalten wir schließlich
∂F
dy ∂x
= − ∂F . (3.94)
dx ∂y

Abbildung 3.13: Der Anstieg (oder die Steigung) k der durch F (x, y) = 0 definierten Kurve im
Punkt (x, y) ist gegeben durch k = −(∂F/∂x)/(∂F/∂y).
82 3 Differentiation

Beispiel:

Die Gleichung

F (x, y) = x2 + y 2 − 1 = 0 (3.95)

stellt einen Kreis in der Ebene mit Mittelpunkt im Ursprung und Radius 1 dar. Die Steigung des
Kreises an der Stelle (x, y) ist gegeben durch:

dy −2x x
= =− . (3.96)
dx 2y y
(3.97)
√ √
Demnach ist die Steigung der Kreislinie im Punkt (0, 1) gleich 0, im Punkt ( 2, 2) ist sie gleich
-1 und im Punkt (1, 0) ist sie gleich −∞.
Kapitel 4

Integration

4.1 Das unbestimmte Integral

Die Integration ist die Umkehrung der Differentiation. Während wir bei der Differentiation für
eine bestimmte Funktion ihre Ableitung bestimmen, wollen wir beim Integrieren aus der Ableitung
die Funktion bestimmen. Oder, mit anderen Worten, wir wollen aus der Steigung einer Kurve
die Kurve selbst bestimmen. Dies ist eine der beiden Grundaufgaben der Integralrechnung. Die
zweite Grundaufgabe der Integralrechnung, der wir uns später zuwenden werden, besteht in der
Berechnung von Flächen unter Funktionsgraphen.

Gegeben sei also eine Funktion f (x). Zu dieser Funktion suchen wir jetzt eine andere Funktion
F (x), sodass f (x) die Ableitung von F (x) ist:

F ′ (x) = f (x). (4.1)

F (x) wird die Stammfunktion genannt. Das Auffinden der Stammfunktion wird Integration
genannt. Zum Beispiel hat die Funktion f (x) = x2 die Funktion F (x) = 31 x3 als Stammfunktion,
denn
d 1 3
x = x2 . (4.2)
dx 3

Während bei der Differentiation F (x) gegeben und f (x) = F ′ (x) gesucht ist, gilt es also bei der
Integration für eine gegebene Funktion f (x) eine Funktion F (x) zu finden, sodass F ′ (x) = f (x).
Man nennt F (x) auch das unbestimmte Integral von f (x) und schreibt:
Z Z
F (x) = f (x) dx oder F (x) = dxf (x). (4.3)

Hier ist es wichtig anzumerken, dass das unbestimmte Integral einer Funktion wiederum eine
Funktion ist.

Genauer müsste man eigentlich schreiben:


Z
F (x) = f (x) dx + C, (4.4)

wobei C die so genannte Integrationskonstante ist. Diese Konstante wird deshalb benötigt, weil
die Integration kein eindeutiger Vorgang ist. So haben z.B. die Funktionen

f (x) = x2 f ′ (x) = 2x (4.5)


2 ′
g(x) = x + 5 g (x) = 2x (4.6)

83
84 4 Integration

dieselbe Ableitung, weil eine Konstante bei der Differentiation verschwindet. Falls F (x) eine Stamm-
funktion von f (x) ist, ist F (x) + C also auch eine, denn die Ableitungen dieser beiden Funktionen
sind identisch (siehe Abb. 4.1). Außerdem ist jede beliebige Stammfunktion F̃ (x) der Gestalt
F̃ (x) = F (x) + C. Sind nämlich sowohl F (x) als auch F̃ (x) Stammfunktionen, gilt

d dF̃ dF
(F̃ (x) − F (x)) = − = f − f = 0. (4.7)
dx dx dx

Deshalb ist F̃ (x) − F (x) eine Konstante und F̃ (x) kann geschrieben werden als F̃ (x) = F (x) + C.

Abbildung 4.1: Falls die Funktion F (x) eine Stammfunktion von f (x) ist, so ist es auch eine
ganze Schar von Funktionen, die sich jeweils um eine Konstante unterscheiden. Die Gleichung
F ′ (x) = f (x) gibt für jeden Wert von x die Steigung der Tangente vor.

Die Integrationskonstante ist eine zunächst unbestimmte Konstante, die wir zur Stammfunkti-
on dazu schreiben, um diesen Sachverhalt anzudeuten. Wenn wir den Wert von F (x) an einer
einzelnen Stelle kennen, können wir daraus C bestimmen (Anfangswert, Randbedingung). Weil
durch die Differentiation Konstanten verloren gehen, können wir sie nicht mehr durch Integration
zurückgewinnen und es gibt eine unendliche Schar von Stammfunktionen, die sich nur durch
eine Konstante unterscheiden und die alle die gleiche Ableitung besitzen (siehe Abb. 4.1).

Beispiel:

Wir betrachten einen Körper, der sich mit zunehmender Geschwindigkeit v entlang einer Geraden
bewegt. Wir nehmen dabei an, dass die Geschwindigkeit linear mit der Zeit zunimmt (wir haben
es also mit einer gleichförmigen Beschleunigung zu tun):

v = at, (4.8)

wobei v = q̇ und a = v̇ und wir für die Beschleunigung den Wert a = 4m/s2 annehmen. Der in
einer Zeit t zurückgelegte Weg q(t) ist gegeben durch:
Z Z
at2
q(t) = v dt = at dt = + C. (4.9)
2

(Hier heißt unsere Variable t statt x, was natürlich völlig belanglos ist.) Nehmen wir nun an, dass
zum Zeitpunkt t = 0 der Körper schon einen Weg von 4 Metern zurückgelegt hat, also q(t = 0) = 4m
(man nennt so etwas eine Anfangsbedingung). Diese Anfangsbedingung können wir benutzen,
um die Integrationskonstante zu bestimmen:

a02
q(0) = m + C = 4m ⇒ C = 4m. (4.10)
2
4 Integration 85

Die Anfangsbedingung wählt aus der Schar aller Lösungen eine bestimmte Lösung aus.

Zusammenfassend halten wir fest:

• Zu jeder stetigen Funktion f (x) gibt es unendlich viele Stammfunktionen F (x), sodass
F ′ (x) = f (x).
• Zwei beliebige Stammfunktionen F1 (x) und F2 (x) unterscheiden sich nur durch eine Kon-
stante:
F1 (x) − F2 (x) = C. (4.11)
Wenn F (x) eine Stammfunktion ist, dann ist also auch F (x) + C eine Stammfunktion.

4.2 Wichtige unbestimmte Integrale

In der unten stehenden Tabelle sind ein paar der wichtigsten unbestimmten Integrale angeführt.
Durch Differenzieren von F (x) kann man sich leicht von der Richtigkeit dieser Beziehungen über-
zeugen.

Funktion Stammfunktion
R
f (x) F (x) = dxf (x)
a ax
1
xn n+1 x
n+1

1
x ln x
x
e ex
1 ax
eax ae
1
ax ln a a
x

sin x − cos x
cos x sin x
sinh x cosh x
cosh x sinh x

Diese Tabelle enthält nur die allerwichtigsten (und einfachsten) Integrale. Weitere Integrale können
Sie den Integraltafeln in den gängigen Formelsammlungen entnehmen oder Sie können Computer-
programme wie “Mathematica” zur Bestimmung von Integralen benutzen. Falls Sie keinen Zugang
zu “Mathematica” oder einem ähnlichen Programm haben, gehen Sie einfach mit Ihrem Browser
zu integrals.wolfram.com und tippen Sie Ihr Integral ein.

4.3 Das bestimmte Integral

Wir wenden uns nun der zweiten Grundaufgabe der Integralrechnung zu, nämlich der Berechnung
des Flächeninhalts eines Bereichs, der vom Graphen einer Funktion f (x) in einem Intervall [a, b]
mit der x-Achse eingeschlossen wird (siehe Abb. 4.2). Dieser Flächeninhalt ist das bestimmte
Integral.

Obwohl es auf den ersten Blick nicht offensichtlich ist, gibt es einen fundamentalen Zusammen-
hang zwischen der ersten Grundaufgabe der Integralrechnung, dem Auffinden einer Stammfunk-
tion F (x), und der Flächenberechnung. Im Folgenden werden wir uns mit diesem Zusammenhang
beschäftigen.
86 4 Integration

Abbildung 4.2: Die zweite Grundaufgabe der Integralrechnung besteht in der Berechnung der
Fläche Sab (schraffierter Bereich) unter dem Graphen einer Funktion f (x) im Intervall [a, b].

Um die Fläche Sab unter dem Funktionsgraphen f (x) zu berechnen, teilen wir das Intervall [a, b] auf
der x-Achse in n gleich lange Teile der Breite ∆x = (b−a)/n ein (siehe Abb. 4.3). Die äquidistanten
Endpunkte dieser Intervalle nennen wir xi . Für die Endpunkte der Intervalle gilt demnach:

xi = a + i∆x, i = 0, . . . , n. (4.12)

Wir nehmen hier der Einfachheit halber an, dass die Kurve f (x) vollständig über der x-Achse liegt.
Funktionen, die im Intervall [a, b] sowohl positive als auch negative Werte annehmen, bieten jedoch
keine wesentlichen Schwierigkeiten, wie wir später sehen werden.

Diese Einteilung des Intervalls [a, b] in n kleine Abschnitte zerlegt die Fläche Sab in n vertikale
Streifen. Die Gesamtfläche Sab ist dann gegeben durch die Summe der Flächeninhalte der einzelnen
Streifen:

Sab = s1 + s2 + s3 + · · · + sn
Xn
= si . (4.13)
i=1

Dabei ist si der Flächeninhalt des i-ten Streifens (das ist der Streifen, der zum Intervall [xi−1 , xi ]
gehört). Hier ist uns zum ersten Mal das Summenzeichen Σ (das große griechische Sigma) begeg-
net, dessen Bedeutung aus dem obigen Ausdruck klar sein sollte. Das Summenzeichen erlaubt es,
Summen (sogar unendliche) auf kompakte Weise zu schreiben.

Abbildung 4.3: Zur Berechnung der Fläche unter der Kurve von f (x) teilen wir das Intervall [a, b] in
viele kleine Teile. Die Gesamtfläche unter der Kurve ergibt sich dann aus der Summe aller schmalen
senkrechten Streifen.
4 Integration 87

Abbildung 4.4: Die Fläche eines schmalen Streifens setzt sich zusammen aus einem Rechteck mit
den Kantenlängen ∆x und f (xi ) und einem Rest εi (schraffierter Bereich).

Schauen wir uns nun die Fläche si etwas genauer an (siehe Abb. 4.4). Die Fläche des Streifens
setzt sich zusammen aus einem Rechteck mit den Kantenlängen ∆x und f (xi ) und dem Rest εi :
si = f (xi )∆x + εi . (4.14)
Das heißt:
n
X n
X n
X
Sab = si = f (xi )∆x + εi . (4.15)
i=1 i=1 i=1

Abbildung 4.5: Der schraffierte Bereich ist der Fehler, der gemacht wird, falls die Fläche der senk-
rechten Streifen durch die Fläche der Rechtecke mit Kantenlängen ∆x und f (xi ) angenähert wird.
Pn
Für eine grobe Einteilung von [a,Pb] kann der Term i=1 εi recht groß sein. Wenn wir die Einteilung
n
feiner und feiner machen, wird i=1 εi immer kleiner und die Fläche immer besser durch
n
X
Sab ≈ f (xi )∆x (4.16)
i=1

angenähert. In dieser Approximation behandelt man also die senkrechten


PStreifen als Rechtecke mit
n
Kantenlängen ∆x und f (xi ). Der Fehler, der dabei gemacht wird, ist i=1 εi (siehe Abbildungen
4.5 und 4.6).
Pn
Für unendlich kleine ∆x verschwindet schließlich i=1 εi und die Fläche Sab ist exakt durch den
Grenzwert
Xn
Sab = lim f (xi )∆x (4.17)
∆x→0
i=1
88 4 Integration

Abbildung 4.6: Für eine kleiner werdende Intervallbreite ∆ wird der Fehler, der durch die Appro-
ximation der senkrechten Streifen durch Rechtecke gemacht wird, immer kleiner.

gegeben, bei dem wir die Anzahl n der Teilintervalle unbegrenzt wachsen lassen. Diesen Grenzwert
nennen wir das bestimmte Integral über dem Intervall [a, b] und wir bezeichnen es mit:

Zb n
X
f (x)dx = lim f (xi )∆x. (4.18)
∆x→0
a i=1

R
Das Zeichen ist eine Stilisierung des Buchstabens S und soll uns daran erinnern, dass das
bestimmte Integral durch Grenzwertbildung aus einer Summe hervorgegangen ist. Der Ausdruck
f (x)dx hinter dem Integralzeichen soll an die Form f (xi )∆x der Terme in dieser Summe erinnern.
Die Variable x wird Integrationsvariable genannt.
Rb
Das bestimmte Integral a f (x)dx ist eine Zahl, im Gegensatz zum unbestimmten Integral, das
Rb
eine Funktion von x ist. Das bestimmte Integral a f (x)dx hängt nur von den Integrationsgren-
zen a und b und von der Funktion f (x) im Intervall [a, b] ab. Daher ist die genaue Bezeichnung
Rb Rb
der Integrationsvariablen belanglos. Statt a f (x)dx hätten wir genauso gut a f (z)dz schreiben
können ohne das Ergebnis zu verändern.

Wir haben bisher vorausgesetzt, dass die Funktion f (x) im gesamten Intervall [a, b] positiv ist. Das
muss jedoch nicht der Fall sein. Im allgemeinen Fall liegen einige Teile des Funktionsgraphen über
und einige Teile unter der x-Achse (siehe Abb. 4.7).

Abbildung 4.7: Bei einer Funktion, deren Graph sowohl über als auch unter der x-Achse liegt,
tragen die Flächenbereiche mit negativen Funktionswerten mit einem negativen Vorzeichen zum
Integral bei.
4 Integration 89

Wenn wir in diesem Fall das bestimmte Integral mit Hilfe von Gleichung (4.18) durch Grenzwert-
bildung berechnen, erhalten wir in den Bereichen mit negativem Funktionswert negative Beiträge
zur Summe. Auch in diesem Fall ist das bestimmte Integral

Zb
f (x)dx (4.19)
a

die Summe der Inhalte der Flächen, die von der x-Achse, dem Funktionsgraphen f (x) und der
Abszissenwerte x = a und x = b begrenzt werden. Dabei tragen die Flächen oberhalb der x-Achse
allerdings positiv und die Flächen unterhalb der x-Achse negativ zum Integral bei.

4.4 Zusammenhang zwischen bestimmtem und unbestimm-


tem Integral

Abbildung 4.8: Die Funktion f (x) begrenzt im Intervall [a, b] mit der x-Achse einen Bereich mit
Flächeninhalt Sab und im kleineren Intervall [a, x] einen Bereich mit Flächeninhalt Sax .

Gegeben sei eine Funktion f (x), die im Intervall [a, b] mit der x-Achse eine Fläche Sab eingrenzt
(siehe Abb. 4.8). Wir betrachten jetzt aber nur einen Teil der Fläche Sab , nämlich den, der von
der Funktion f (x), der x-Achse und den senkrechten Geraden durch die Abszisse a und durch
eine beweglichen Abszisse x begrenzt wird. Wir nennen diese Fläche Sax . Die Größe dieser Fläche
hängt davon ab, an welche Stelle im Intervall wir die Abszisse x legen. Wir können die Fläche Sax
ausdrücken als bestimmtes Integral der Funktion f (x) mit unterer Grenze a und oberer Grenze
x. Da wir die Buchstaben x zur Bezeichnung der oberen Grenze verwenden, verwenden wir einen
anderen Buchstaben (z.B. u) als Integrationsvariable. Die Fläche Sax ist gegeben durch:
Zx
Sax = f (u)du. (4.20)
a

Das Integral in dieser Gleichung ist ein bestimmtes Integral mit einer veränderlichen oberen Grenze
x. Das bestimmte Integral Sax ist also eine Funktion dieser Grenze x.

Als nächstes werden wir zeigen, dass Sax (betrachtet als Funktion von x) eine Stammfunktion
von f (x) ist:

d
Sax = f (x). (4.21)
dx
Dies wird den gesuchten Zusammenhang zwischen dem bestimmten Integral und dem unbestimm-
ten Integral herstellen. Um zu zeigen, dass Sax eine Stammfunktion von f (x) ist, betrachten wir
90 4 Integration

Abbildung
R x 4.9: Die Fläche des schraffierten Bereichs ist gleich der Änderung ∆Sax der Fläche
Sax = a f (x)dx aufgrund einer Änderung der oberen Grenze des Integrals von x auf x + ∆x.

die Zunahme ∆Sax von Sax durch einen Zuwachs ∆x der veränderlichen oberen Grenze x. Der
Zuwachs ∆Sax ist einfach die Größe des zusätzlichen Streifens, der durch x, x + ∆x, f (x) und die
x-Achse begrenzt wird (siehe Abb. 4.9).

Für sehr kleine ∆x ist ∆Sax gegeben durch die Fläche eines Rechtecks mit der Breite ∆x und der
Höhe f (x),

∆Sax ≈ f (x) · ∆x. (4.22)

Für ∆x → 0 strebt der Fehler, den wir in dieser Näherung machen, gegen 0 und wir erhalten aus
obiger Gleichung:
∆Sax
lim = f (x). (4.23)
∆x→0 ∆x
Die linke Seite der Gleichung ist aber genau die Definition der Ableitung von Sax nach der Varia-
blen x. Somit gilt
Zx
d d
Sax = f (u)du = f (x). (4.24)
dx dx
a

Das heißt, das bestimmte Integral der Funktion f (u) mit veränderlicher Grenze x ist eine Stamm-
funktion des Integranden. Somit haben wir den gesuchten Zusammenhang erhalten.

Durch Ausnutzung dieses Zusammenhangs können wir das bestimmte Integral

Zb
f (x)dx (4.25)
a

durch Auffinden der Stammfunktion F (x) von f (x) berechnen. Dies können wir auf folgende Weise
tun. Da wir wissen, dass Sax eine Stammfunktion von f (x) ist, kann sich die Stammfunktion F (x)
nur um eine Konstante C (Integrationskonstante) von diesem bestimmten Integral unterscheiden:
Zx
f (u)du = F (x) + C. (4.26)
a

Zu Bestimmung von C beachten wir nun, dass das Integral auf der linken Seite verschwindet, falls
die obere Grenze x mit der unteren Grenze a zusammenfällt, das heißt wenn a = x. Für x = a
4 Integration 91

erhalten wir daher:


Za
f (u)du = 0 = F (a) + C. (4.27)
a

Daraus folgt:

C = −F (a). (4.28)

Somit gilt

Zx
f (u)du = F (x) − F (a). (4.29)
a

Indem wir x = b setzen, erhalten wir schließlich

Zb
f (u)du = F (b) − F (a). (4.30)
a

Da wir jetzt den Buchstaben x nicht mehr für die obere Integrationsgrenze benötigen, können wir
natürlich auch schreiben:

Zb
f (x)dx = F (b) − F (a). (4.31)
a

Eine alternative Schreibweise dafür ist:

Zb b

f (x)dx = F (x) . (4.32)
a
a

Wir erhalten also den Wert des bestimmten Integrals aus der Differenz einer Stammfunktion des
Integranden an der oberen und unteren Integrationsgrenze. Dieses Ergebnis nennt man den Haupt-
satz der Differential- und Integralrechnung. Dieser sehr praktische Zusammenhang erspart
uns bei der Berechnung des bestimmten Integrals die schwierige Grenzwertbildung.

Beispiel:

Wir berechnen nun das bestimmte Integral der Funktion f (x) = x im Intervall [a, b] zunächst mit
Hilfe des Hauptsatzes der Differential- und Integralrechnung und dann explizit durch Einteilung des
Intervalls in schmale Unterintervalle der Breite ∆x und anschließender Grenzwertbildung ∆x → 0.
Durch Bestimmen der Stammfunktion von f (x) = x, F (x) = x2 /2, finden wir

Zb b
x2 b 2 − a2
xdx = = . (4.33)
2 a 2
a

Wir könnten alternativ dazu auch eine Summe schmaler Streifen bilden und dann ∆x gegen 0
gehen lassen:
n
X
Sab ≈ f (xi ) · ∆x. (4.34)
i=1
92 4 Integration

Für die Abszisse xi gilt xi = x0 + i∆x = a + i∆x. Daher ist f (xi ) = a + i∆x und wir haben
n
X n
X n
X
Sab ≈ (a + i∆x) · ∆x = a∆x + i∆x2
i=1 i=1 i=1
n
X n
X
= a∆x 1 + ∆x2 i
i=1 i=1
n
X
= na∆x + ∆x2 i. (4.35)
i=1

b−a
Da ∆x = n gilt
n
(b − a) (b − a)2 X
Sab ≈ na + i
n n2 i=1
(b − a)2
≈ a(b − a) + (1 + 2 + 3 + · · · + (n − 1) + n). (4.36)
n2
Die Summe aller natürlichen Zahlen von 1 bis n ist bekannt,

n(n + 1)
1 + 2 + 3 + · · · + (n − 1) + n = , (4.37)
2
und somit erhalten wir schließlich:
(b − a)2 n(n + 1)
Sab ≈ a(b − a) + ·
n2  2 
(b − a)2 1
≈ a(b − a) + · 1+ . (4.38)
2 n

Um das bestimmte Integral Sab zu berechnen, müssen wir den Grenzübergang ∆x → 0 oder
äquivalent dazu den Grenzübergang n → ∞ durchführen. Das heißt
  
(b − a)2 1
Sab = lim a(b − a) + · 1+
n→∞ 2 n
2
(b − a)
= a(b − a) +
2
2 2
=  ab − a2 +
b
−  + a
2ab
2 2 2
1 2 2
= (b − a ), (4.39)
2
was mit dem Ergebnis weiter oben übereinstimmt, jedoch weitaus komplizierter zu berechnen war
(selbst für die einfache Funktion f (x) = x).

Beispiel:

Gesucht ist die Fläche unter der Kurve y = x3 zwischen a = 0 und b = 1. Diese Fläche ist gleich
dem bestimmten Integral

Z1 1
3 x4 1
x dx = = . (4.40)
4 0 4

0
4 Integration 93


Abbildung 4.10: Die Fläche eines Viertelkreises kann durch Integration der Funktion y = r2 − x2
im Intervall [0, r] berechnet werden.

Beispiel:

Gesucht ist die Fläche eines Viertelkreises mit Radius r. Der implizite Ausdruck für einen Kreis
mit Radius r um den Ursprung,

x2 + y 2 = r2 , (4.41)

lässt sich leicht in einen expliziten Ausdruck für die Kreislinie umwandeln:
p
y = r2 − x2 . (4.42)

Die Fläche A des Viertelkreises lässt sich somit als bestimmtes Integral schreiben:
Zr p
A= r2 − x2 dx. (4.43)
0

Durch Nachschlagen in einer Formelsammlung finden wir:


Z p
xp 2 r2 x
r2 − x2 dx = r − x2 + arcsin . (4.44)
2 2 r
Das heißt
Zr p  p  r
x r2 x
A = r2 − x2 dx = r2 − x2 + arcsin
2 2 r 0
0
r2  r  r2 r2 r2 π r2 π
= arcsin − arcsin(0) = arcsin(1) = = . (4.45)
2 r 2 2 2 2 4
Die Fläche des Viertelkreises ist also r2 π/4.

4.5 Rechenregeln für das bestimmte Integral

Für das bestimmte Integral gelten folgende Rechenregeln:

• Das bestimmte Integral verschwindet, wenn die untere und obere Integrationsgrenze zusam-
menfallen:
Za
f (x)dx = 0. (4.46)
a
94 4 Integration

• Ein Integral kann in eine Summe von zwei Integralen über aneinander grenzende Intervalle
zerlegt werden:
Zc Zb Zc
f (x)dx = f (x)dx + f (x)dx. (4.47)
a a b

• Vertauschung der Integrationsgrenzen führt zur Umkehrung des Vorzeichens:


Zb Za
f (x)dx = − f (x)dx. (4.48)
a b

4.6 Grundregeln des Integrierens

Wir wollen jetzt auf Methoden zur Ermittlung der Stammfunktion (also des unbestimmten In-
tegrals) eingehen. Die folgenden Regeln ergeben sich aus den bereits besprochenen Differentiati-
onsregeln. Im Folgenden werden wir die Integrationskonstante, die wir genau genommen immer
ausdrücklich hinschreiben müssten, meistens weglassen.

4.6.1 Faktorregel

Ein konstanter Faktor kann vor das Integral gezogen werden:


Z Z
af (x)dx = a f (x)dx. (4.49)

Diese Regel ist eine direkte Umkehrung der Faktorregel für die Differentiation.

Beispiel:
3
f (x) = 4
, (4.50)
Z Zx Z Z
3 1
f (x)dx = 4
dx = 3 dx = 3 x−4 dx
x x4
 
1 −4+1
= 3 x + C = −x−3 + C
−4 + 1
1
= − 3 + C. (4.51)
x

Beispiel:
Z4 Z4   4
− 72 − 72 2
− 52
5x dx = 5 x dx = 5 − x =
5 2
2 2
   
1 1 1 1
= −2 √ −√ = −2 −√
( 4)5 25 32 16 · 2
 
1 1 1 1
= −2 − √ = √ −
32 4 2 2 2 16
√ √ !√ √ √
16 − 2 2 8− 2 2 8 2−2 4 2−1
= √ = √ √ = = . (4.52)
2 2 · 16 2 · 16 2 2 · 16 16
4 Integration 95

4.6.2 Summenregel

Das Integral einer Summe ist gleich der Summe der Integrale:
Z Z Z
[f (x) + g(x)]dx = f (x)dx + g(x)dx. (4.53)

Beispiel:

f (x) = x3 + 2x (4.54)
Z Z Z
x4 x2 x4
(x3 + 2x)dx = x3 dx + 2x dx = +2 = + x2 . (4.55)
4 2 4

4.6.3 Substitutionsmethode

Bei der Substitutionsmethode versucht man, die zu integrierende Funktion durch Einführen einer
neuen Variablen zu vereinfachen oder auf eine Form zu bringen, die in einer Formelsammlung
gefunden werden kann. Im Allgemeinen führt man in der Substitutionsmethode eine Transformation
auf eine neue Variable u = g(x) durch. Im Integral
Z
f (x)dx (4.56)

muss dazu sowohl die Funktion f (x) als auch das Differential dx transformiert werden. Für
die Transformation benötigen wir die Umkehrfunktion x = g −1 (u) der Substitutionsfunktion
u = g(x). Mit Hilfe von g und g −1 können wir die Wirkung der Variablentransformation auf die
Funktion ausdrücken als
f (x) = f (g −1 (u)). (4.57)
Das transformierte Differential bestimmen wir, indem wir den Ausdruck
du
= g ′ (x) (4.58)
dx
nach dx auflösen:
du du
dx = = ′ −1 . (4.59)
g ′ (x) g (g (u))
Somit können wir das Integral ausdrücken als
Z Z Z
du du
f (x)dx = f (g −1 (u)) ′ = f (g −1 (u)) ′ −1 . (4.60)
g (x) g (g (u))

Wenn wir die Funktion g −1 (u) umbenennen in

ϕ(u) = g −1 (u), (4.61)

können wir auch schreiben:


dx
x = ϕ(u), = ϕ′ (u) ⇒ dx = ϕ′ (u)du, (4.62)
du
und somit
Z Z
f (x)dx = f (ϕ(u))ϕ′ (u)du. (4.63)

Nach Bestimmung des unbestimmten Integrals, d.h. der Stammfunktion, in der Variablen u erhalten
wir das Integral als Funktion von x durch Rücktransformation zur ursprünglichen Variablen.
96 4 Integration

Die obigen Ausdrücke schauen zunächst beträchtlich komplizierter aus als der Ausdruck, von dem
wir ausgegangen sind. Dass es aber tatsächlich zu einer Vereinfachung kommen kann, zeigen die
folgenden Beispiele.

Beispiel: Zu berechnen ist das Integral


Z
(4 + 5x)7 dx. (4.64)

Hier könnten wir die siebente Potenz der Klammer explizit berechnen und dann Term für Term
integrieren. Einfacher ist es, eine neue Variable einzuführen:
u = 4 + 5x. (4.65)
Dann gilt du/dx = 5 und somit dx = du/5. Durch Einsetzen erhalten wir
Z Z
du 1 1 8 u8
(4 + 5x)7 dx = u7 = u = . (4.66)
5 58 40
Um zur ursprünglichen Variablen zurückzukehren, setzen wir einfach u = 4 + 5x oben ein:
Z
(4 + 5x)8
(4 + 5x)7 dx = . (4.67)
40

Beispiel:

Zu berechnen ist das Integral Z


1 p
x 6 − 3x2 dx. (4.68)
2
Hier versuchen wir es mit u = 6 − 3x2 als Substitutionsfunktion. In diesem Fall ist
du du
= −3 · 2x = −6x d.h. dx = − . (4.69)
dx 6x
Wir drücken hier das x im Nenner nicht durch u aus, sondern lassen es einfach stehen und erkennen,
dass es sich nach Einsetzen des Differentials mit einem Faktor des Integrals kürzt:
Z Z   Z
1 p 2
1 √ du 1 √
x 6 − 3x dx = x u − =− udu
2 2 6x 12
1 2 3 1 3
= − u2 = − u2 . (4.70)
12 3 18
Rücktransformation ergibt:
Z
1 p 1 3
x 6 − 3x2 dx = − (6 − 3x2 ) 2 . (4.71)
2 18
Eine so vorteilhafte Kürzung wie in diesem Beispiel ist jedoch nicht immer möglich.

Beispiel:

Wir berechnen das Integral Z


cos(ωt + ϕ)dt, (4.72)

indem wir die Substitution u = ωt + ϕ durchführen. Dann gilt


du du
=ω und somit dt = . (4.73)
dt w
Wir haben also
Z Z
du sin(u) 1
cos(ωt + ϕ)dt = cos u = = sin(ωt + ϕ). (4.74)
ω ω ω
4 Integration 97

4.6.4 Partielle Integration

Durch Anwendung der Produktregel kann das Produkt zweier Funktionen f (x) und g(x) leicht
differenziert werden:
d(f (x)g(x)) df dg
= g(x) + f (x) , (4.75)
dx dx dx
oder, etwas kürzer,

(f g)′ = f ′ g + f g ′ . (4.76)

Diese Regel kann uns bei der Integration eines Produkts zweier Funktionen behilflich sein, falls für
eine oder beide Funktionen die Stammfunktion erkennbar ist und wir also das Integral schreiben
können als:
Z
f ′ (x)g(x)dx. (4.77)

Wenn der Integrand in einer derartigen Form vorliegt, können wir die Produktregel der Differen-
tiation anwenden und erhalten:
Z Z Z
f ′ (x)g(x)dx = (f (x)g(x))′ dx − f (x)g ′ (x)dx
Z
= f (x)g(x) − f (x)g ′ (x)dx, (4.78)

wobei wir einfach ausgenützt haben, dass f (x)g(x) die Stammfunktion von (f (x)g(x))′ ist. In Wor-
ten ausgedrückt: die Stammfunktion eines Produktes ist gleich dem Produkt der Stammfunktion
der ersten Funktion mit der zweiten Funktion minus dem Integral des Produkts der Stammfunkti-
on der ersten Funktion mit derR Ableitung der zweiten Funktion. RNatürlich hat diese Prozedur nur
dann Sinn, wenn das Integral f g ′ dx einfacher als das Integral f ′ gdx ist.

Beispiel:

Zu berechnen ist das Integral Z


xex dx. (4.79)

Hier wählen wir f ′ (x) = ex (da ex einfach zu integrieren ist) und g(x) = x. Dann ist
Z Z
x x
x e
|{z} |{z} dx = e x
|{z} |{z} − ex dx = ex x − ex = ex (x − 1).
1 |{z}
|{z} (4.80)
g f′ f g g′ f

Die Wahl f ′ (x) = x und g(x) = ex wäre weniger sinnvoll gewesen, denn dann hätten wir
Z 2 Z
x x x x2
x e dx = e
|{z} 2 − ex dx (4.81)
|{z} |{z} 2 |{z}
f′ g g |{z} |{z} g′
f f

erhalten und unser Problem wäre nur schwieriger geworden, da die Funktion x2 ex nicht leichter zu
integrieren ist als die Funktion xex .

Beispiel:

Zu berechnen ist das Integral


Z
ln xdx. (4.82)
98 4 Integration

Hier ist auf den ersten Blick kein Produkt vorhanden, aber wir können den Integranden durch
Multiplikation mit 1 leicht als ein Produkt anschreiben:
Z Z
ln xdx = 1 · ln xdx. (4.83)

Wir wählen jetzt f ′ (x) = 1 und g(x) = ln x und erhalten so


Z Z Z
1
ln xdx = 1 · |{z}
ln x dx = |{z} ln x − |{z}
x |{z} x dx
|{z} x
f′ g f g f |{z}
g′
Z
= x ln x − 1dx = x ln x − x

= x(ln x − 1). (4.84)

Beispiel: Zu berechnen ist das Integral


Z
cos2 (x)dx. (4.85)

Wir wählen für dieses Beispiel f ′ (x) = cos(x) und g(x) = cos(x) und erhalten durch partielle
Integration:
Z Z Z
cos2 (x)dx = cos(x) cos(x)dx = sin(x) cos(x) + sin(x) sin(x)dx
Z
= sin(x) cos(x) + (1 − cos2 (x))dx
Z Z
= sin(x) cos(x) + 1dx − cos2 (x)dx. (4.86)
R
Das Integral 1dx = x und durch einfaches Umformen erhalten wir schließlich:
Z
1
cos2 (x)dx = [sin(x) cos(x) + x] . (4.87)
2

4.7 Rotationskörper

Rotieren wir eine durch die Funktion f (x), die beiden Abszissen a und b und die x-Achse begrenzte
Fläche um die x-Achse, so entsteht ein dreidimensionaler Rotationskörper. Zur Berechnung
seines Volumens zerteilen wir das Intervall [a, b] in n gleiche Unterintervalle der Breite ∆x =
(b−a)/n. Zu jedem dieser n Intervalle gehört nun eine dünne Scheibe mit kreisförmiger Grundfläche
und einer Dicke ∆x (siehe Abb. 4.11). Der Radius der Grundfläche im i-ten Intervall ist für sehr
kleine Dicken ∆x gleich dem Funktionswert f (xi ) an der Stelle xi = a + i∆x. Das Volumen der
Scheibe ist daher
Vi = Grundfläche × Höhe ≈ f (xi )2 π∆x. (4.88)
Durch Summation der Volumina aller dünnen Scheiben erhalten wir schließlich das Gesamtvolumen
des Rotationskörpers
n
X n
X
V = Vi ≈ f (xi )2 π∆x. (4.89)
i=1 i=1

Im Grenzwert ∆x → 0 geht dieser Ausdruck in das Integral


Zb Zb
2
V = f (x) πdx = π f (x)2 dx (4.90)
a a
4 Integration 99

Abbildung 4.11: Rotation einer durch eine Funktion f (x) und der x-Achse in einem Intervall [a, b]
begrenzten Fläche führt zu einem so genannten Rotationskörper.

über. Wir können somit das Volumen eines Rotationskörpers als bestimmtes Integral über die
Funktion f (x)2 ausdrücken.

Beispiel:

Zu berechnen ist das Volumen eines Kegels mit einer Grundfläche mit Radius r und einer Höhe
h (siehe Abb. 4.12). Die Funktion f (x) ist in diesem Fall eine Gerade durch den Ursprung mit
Steigung r/h:

r
f (x) = x. (4.91)
h

Das Volumen des Kegels ist demnach das bestimmte Integral

Zb Zh  2 h
2 r 2 πr2 x3 1 πr2 h3
V =π f (x) dx = π x dx = 2 · = . (4.92)
h h 3 0 3 h2
a 0

Somit ist das Volumen des Kegels

1 2
V = πr h. (4.93)
3

Beispiel:

Die Parabel f (x) = 9 − x2 rotiert zwischen ihren Nullstellen um die x-Achse und erzeugt dadurch
einen Rotationskörper (siehe Abb. 4.13). Zu bestimmen ist das Volumen des Rotationskörpers.

Die Nullstellen der Parabel befinden sich bei x = ±3. Das Volumen V des Rotationskörpers ist
100 4 Integration

Abbildung 4.12: Ein Kegel mit Höhe h und mit Grundflächenradius r kann als durch Rotation
einer Geraden um die x-Achse entstanden gedacht werden.

Abbildung 4.13: Durch Rotation der Parabel f (x) = 9 − x2 zwischen ihren Nullstellen um die
x-Achse entsteht ein Rotationskörper.

demnach gegeben durch:

Z3 Z3
2 2
V = π (9 − x ) dx = π (81 − 18x2 + x4 )dx
−3 −3
 3 5
3  
18x x 243
= π 81x − + = 2π 81 · 3 − 6 · 27 +
3 5 −3 5
 
243 648
= 2π 243 − 162 + = 2π · . (4.94)
5 5

Beispiel:

Zu bestimmen ist das Volumen einer Kugel mit Radius r. Wir stellen uns dazu vor, dass die
Halbkugel durch Rotation der Kurve
p
f (x) = r2 − x2 (4.95)
4 Integration 101

Abbildung 4.14: Durch Rotation eines Halbkreises um die x-Achse entsteht eine Halbkugel.

im Intervall [0, r] um die x-Achse entstanden ist (siehe Abb. 4.14). Das Volumen der Kugel ist
somit zweimal das Volumen des Rotationskörpers:
 r 
Zr Z Zr
V = 2π (r2 − x2 )dx = 2π  r2 dx − x2 dx
0 0 0
r r
x3 r3
= 2πr x − 2π = 2πr3 − 2π
2
3 3
0  0
1 4
= 2πr3 1 − = πr3 . (4.96)
3 3

4.8 Berechnung von Bogenlängen

Abbildung 4.15: Die Bogenlänge des Funktionsgraphen von f (x) kann durch Integration ermittelt
werden. Das Differential ds der Bogenlänge kann mit Hilfe des Pythagoräischen Lehrsatzes aus den
Differentialen dx und df ermittelt werden.

Gegeben sei die Funktion f (x) mit dem dazugehörige Funktionsgraphen in der xy-Ebene. Wir
wollen nun in einem bestimmten Intervall die Länge s des Funktionsgraphen von f (x) berechnen.
(Die Länge einer Kurve wird auch Bogenlänge genannt.) Dazu betrachten wir ein kleines Un-
terintervall der Länge dx, wobei wir das Differential benutzen, um anzudeuten, dass es sich hier
um infinitesimale Differenzen handelt. Das dazugehörige Differential in der y-Richtung ist gegeben
102 4 Integration

durch:

dy = f ′ (x)dx. (4.97)

Die Länge ds des von den Abszissen x und x + dx begrenzten Kurvenstücks erhalten wir durch
Anwendung des Pythagoräischen Lehrsatzes:
p
ds = dy 2 + dx2 . (4.98)

Hier haben wir ausgenutzt, dass sich die Kurve für infinitesimale dx im Intervall [x, x + dx] durch
eine Gerade approximieren lässt. Wir formen nun die obige Gleichung unter Verwendung von
Gleichung (4.97) um:
p p p
ds = dy 2 + dx2 = (f ′ (x)dx)2 + dx2 = 1 + f ′ (x)2 dx. (4.99)

Um die Gesamtlänge der Kurve zwischen x = a und x = b zu erhalten, summieren wir über alle
infinitesimalen Unterintervalle und erhalten die Bogenlänge:

Zb p
s= 1 + f ′ (x)2 dx. (4.100)
a

Beispiel:

Zu bestimmen ist der Umfang des Kreises mit Radius r. Wir berechnen
√ zunächst den Umfang des
Halbkreises. Der Halbkreis ist der Graph der Funktion f (x) = r2 − x2 und die Integrationsgren-
zen sind −r und r (siehe Abb. 4.16).


Abbildung 4.16: Der dargestellte Halbkreis ist der Graph der Funktion y = r2 − x2 im Intervall
[−r, r].

Die Ableitung von f (x) ist

1 2x x
f ′ (x) = − √ = −√ . (4.101)
2 r −x
2 2 r − x2
2

Somit ist die Bogenlänge s gegeben durch:

Zr r Zr r
x2 r2 − x2 + x2
s = 1+ dx = dx
r − x2
2 r2 − x2
−r −r
Zr Zr
r 1
= √ dx = q dx. (4.102)
r2 − x2 1−

x 2
−r −r r
4 Integration 103

Zur Lösung des Integrals substituieren wir t = x/r, das heißt dt = dx/r und dx = rdt. Hier müssen
auch die Integrationsgrenzen transformiert werden: an den Stellen x = −r und x = r hat die neue
Variable t die Werte t = −1 und t = 1. Durch die Transformation wird die Bogenlänge zu:

Z1 Z1 1
r 1
s = √ dt = r √ dt = r arcsin t
1 − t2 1 − t2 −1
−1 −1
h π  π i
= r − − = rπ. (4.103)
2 2
Der Umfang des Kreises ist dann einfach

U = 2πr. (4.104)

Für eine in Parameterform gegebene Kurve

x = x(t), (4.105)
y = y(t), (4.106)

drücken wir die Differentiale in x- und y-Richtung aus als:


 
dx
dx = dt = ẋ(t)dt, (4.107)
dt
 
dy
dy = dt = ẏ(t)dt. (4.108)
dt

Abbildung 4.17: Für eine Kurve in Parameterform, ~r = ~r(t), kann die Bogenlänge zwischen t = α
und t = β durch Integration berechnet werden.

In diesem Fall ist die infinitesimale Bogenlänge ds gegeben durch


p p p
ds = dx2 + dy 2 = ẋ(t)2 dt2 + ẏ(t)2 dt2 = ẋ(t)2 + ẏ(t)2 dt (4.109)

und die Gesamtbogenlänge ergibt sich aus der Integration über die Hilfsvariable t:

Zβ p
s= ẋ(t)2 + ẏ(t)2 dt. (4.110)
α

Die Integrationsgrenzen t = α und t = β entsprechen den Punkten, zwischen denen die Bogenlänge
berechnet werden soll (siehe Abb. 4.17).
104 4 Integration

Beispiel:

Zu berechnen ist der Umfang der in Parameterform gegebenen Ellipse


x(t) = a sin t, (4.111)
y(t) = b cos t. (4.112)
a und b sind die Halbachsen der Ellipse und wir nehmen an, dass a > b. Der Parameter t durchläuft
das Intervall [0, 2π].

Die Ableitungen von x(t) und y(t) nach t sind


ẋ = a cos t, (4.113)
ẏ = −b sin t, (4.114)
und somit kann der Umfang der Ellipse als das Vierfache der Bogenlänge im ersten Quadranten
ausgedrückt werden:
π π
Z2 p Z2 r
2 b2
s = 4 a2 cos2 t + b2 sin tdt = 4a cos2 t + 2 sin2 tdt
a
0 0
π π
Z r 2
2
Z2 s  2 
2 b 2 a − b2
= 4a 1 − sin t + 2 sin tdt = 4a 1− sin2 tdt
a a2
0 0
π
Z2 p
= 4a 1 − K 2 sin2 tdt, (4.115)
0
p
wobei wir hier die Exzentrizität K = (a2 − b2 )/a2 der Ellipse eingeführt haben. Für einen
Kreis ist K = 0 und für eine Ellipse mit a > b ist K > 0.
Rp
Das Integral 1 − K 2 sin2 t dt hat keine Lösung, die sich mit Hilfe einfacher, bekannter Funktio-
nen ausdrücken lässt. Man definiert daher einfach eine neue Funktion
Zα p
E(α, K) ≡ 1 − K 2 sin2 tdt |K| < 1. (4.116)
0

Man nennt diese Funktion ein elliptisches Integral (genauer: ein elliptisches Integral der 2. Art).
Die Funktion kann für ein bestimmtes α und ein bestimmtes K mit dem Computer ausgewertet
werden (z.B. mit Mathematica). In Abb. 4.18 ist die Funktion E(α, K) für α = π/2 als Funktion
von K dargestellt.

Mit Hilfe des elliptischen Integrals E(α, K) kann der Ellipsenumfang schließlich ausgedrückt werden
als
r !
π a2 − b 2
s = 4aE , . (4.117)
2 a2

Beispiel: Archimedische Spirale

Zu bestimmen ist die Länge der Archimedischen Spirale r = aϕ im Bereich von ϕ = 0 bis ϕ = ϑ
(siehe Abb. 4.19).

In Parameterform ist die Spirale gegeben durch


x(ϕ) = aϕ cos ϕ, (4.118)
y(ϕ) = aϕ sin ϕ. (4.119)
4 Integration 105

Abbildung 4.18: Das elliptische Integral der 2. Art E(α, K) für α = π/2 in Abhängigkeit von K.

Die Ableitungen von x(ϕ) und y(ϕ) nach dem Winkel ϕ sind

ẋ = a cos ϕ − aϕ sin ϕ, (4.120)


ẏ = a sin ϕ + aϕ cos ϕ. (4.121)

Die Bogenlänge der Spirale zwischen ϕ = 0 und ϕ = ϑ ist somit:

Zϑ p
s = (a cos ϕ − aϕ sin ϕ)2 + (a sin ϕ + aϕ cos ϕ)2 dϕ
0
Zϑ p
= a (cos ϕ − ϕ sin ϕ)2 + (sin ϕ + ϕ cos ϕ)2 dϕ
0
Zϑ q
= a 2ϕ(
cos2 ϕ − ( (ϕ
cos ((
(sin ϕ + ϕ2 sin2 ϕ + sin2 ϕ + (
2ϕ((ϕ
cos ((
(sin ϕ + ϕ2 cos2 ϕdϕ
0
Zϑ s
= a cos2 ϕ + sin2 ϕ +ϕ2 (sin2 ϕ + cos2 ϕ)dϕ
| {z } | {z }
0 =1 =1

Zϑ p i ϑ
ah p
= a 1 + ϕ2 dϕ = ϕ 1 + ϕ2 + Arsinh(ϕ)
2 0
0
a h p i
= ϑ 1 + ϑ2 + Arsinh(ϑ)
2

ah p p i
= ϑ 1 + ϑ2 + ln(ϑ + 1 + ϑ2 ) . (4.122)
2
106 4 Integration

Abbildung 4.19: Die Archimedische Spirale r = aϕ.

4.9 Mittelwerte von Funktionen

Um den Mittelwert von n Zahlen ai zu bestimmen, addiert man die Zahlen und dividiert sie durch
deren Anzahl:
a1 + a2 + a3 + · · · + an−1 + an
a= , (4.123)
n
wobei der horizontale Strich über dem a auf der linken Seite der obigen Gleichung einen Mittelwert
bedeutet. a könnte zum Beispiel der Mittelwert einer Reihe von Messdaten sein. Wir wollen nun
das zeitliche Mittel einer Funktion f (t) bestimmen. Dazu stellen wir uns vor, dass wir den Wert
der Funktion beginnend bei t = a nach Zeitschritten ∆t bestimmen. Das heißt, wir bestimmen f (t)
zuerst bei t = a und messen dann f (t) wiederholt zu den Zeitpunkten ti = a + i∆t (siehe Abb.
4.20). Durch diesen Messvorgang erhalten wir n Messwerte f (ti ), die man tabellarisch darstellen
kann als:

ti t1 t2 t3 ... tn
.
f (ti ) f (t1 ) f (t2 ) f (t3 ) ... f (tn )

Der Mittelwert aller dieser Messwerte ist


f (t1 ) + f (t2 ) + · · · + f (tn )
f= . (4.124)
n

Wir multiplizieren jetzt sowohl Zähler als auch Nenner mit ∆t


Pn
f (ti )∆t
f = i=1 . (4.125)
n · ∆t
Wir erkennen, dass für sehr kurze Zeitintervalle ∆t der Zähler übergeht in das bestimmte Integral
Rb
a
f (t)dt. Der Nenner ist einfach die Länge des gesamten Intervalls, n∆t = (b − a). Das heißt
Rb Z b
a
f (t)dt 1
f= = f (t)dt. (4.126)
(b − a) (b − a) a

In Worten kann man dies wie folgt ausdrücken: Der Mittelwert f einer Funktion im Intervall (a, b)
ist gleich dem bestimmten Integral der Funktion f (t) zwischen den Integrationsgrenzen a und b
dividiert durch die Länge des Intervalls [a, b].
4 Integration 107

Abbildung 4.20: Die Funktion f (t) wird zu äquidistanten Zeitpunkten ti bestimmt.

Natürlich gilt auch:

Z b
f (t)dt = f (b − a). (4.127)
a

Beispiel:

Durch einen Widerstand fließt ein Wechselstrom I(t) = I0 sin ωt und es fällt am Widerstand eine
Spannung U (t) = U0 sin ωt ab. Zu berechnen ist der Mittelwert der Leistung über eine Periode.

Die momentane Leistung ist Strom × Spannung, das heißt

P (t) = U (t) · I(t) = U0 I0 sin2 ωt. (4.128)

Die Länge der Periode ist T = 2π/ω. Das heißt, die mittlere Leistung ist gegeben durch (siehe
Abb. 4.21)

Z T ZT
1 1
P = P (t)dt = U0 I0 sin2 ωt dt
T 0 T
0
ZT
I0 U0
= sin2 ωt dt. (4.129)
T
0

R 1
Durch partielle Integration hatten wir weiter oben das Integral cos2 xdx = 2 (sin x cos x + x)
ermittelt. Da cos2 x = 1 − sin2 x, folgt für das Integral von sin2 x:
Z
1 x 1
sin2 x dx = x − (sin x cos x + x) = − sin x cos x. (4.130)
2 2 2

Mit der Substitution u = ωt ⇒ dt = du/ω erhalten wir


Z  
1 ωt 1
sin2 ωt dt = − sin ωt cos ωt . (4.131)
ω 2 2
108 4 Integration

Abbildung 4.21: Die durchschnittliche an einem Ohmschen Widerstand verbrauchte Leistung lässt
sich durch Integration der Leistung als Funktion der Zeit bestimmen.

und somit
  T
I0 U0 1 ωt 1
P = − sin ωt cos ωt
T ω 2 2 0
 
 1

I0 U0  ωT 2π 2π 1 
=  − sin( ω) cos( ω) −0 + sin(0) cos(0) 

ωT  2 |2 
ω {z 
ω } |2 {z }

=0 0
I0 U0
= . (4.132)
2

4.10 Doppelintegrale

So wie wir Funktionen von zwei, drei oder noch mehr Variablen differenzieren können, können wir
sie auch integrieren. Integration solcher Funktionen führt zu Mehrfachintegralen, die in der Phy-
sik sehr oft auftreten, zum Beispiel bei der Bestimmung von Volumina, Massen, Schwerpunkten,
Trägheitsmomenten, Zustandssummen usw. Mehrfachintegrale lassen sich auf die Nacheinander-
ausführung von gewöhnlichen Integralen zurückführen.

4.10.1 Definition

Bisher haben wir die durch eine Kurve begrenzte Fläche als bestimmtes Integral berechnet (siehe
Abb. 4.22):
Zb
Sab = f (x)dx. (4.133)
a

Wir wollen uns nun mit der analogen Aufgabe beschäftigen, das Volumen eines Körpers zu be-
rechnen, der von einer Fläche f (x, y), von einem Bereich A der xy-Ebene und vom vertikal bis zur
Fläche fortgesetzten Rand von A begrenzt wird (siehe Abb. 4.23). Um dieses Volumen zu bestim-
men, gehen wir ähnlich vor wie bei der Berechnung der Fläche Sab , die wir in schmale senkrechte
Streifen eingeteilt hatten. Wir teilen dazu den Bereich A in kleine Rechtecke mit Kantenlängen
∆x und ∆y ein, indem wir ein Gitter über die xy-Ebene legen (siehe Abb. 4.24).

Jedes Rechteck wird durch zwei Indizes beschrieben, einem in der x-Richtung (i) und einem in der
y-Richtung (j). In jedem Rechteck (das wir auch Zelle nennen) wählen wir einen Punkt (xi , yj ).
4 Integration 109

Abbildung 4.22: Die Fläche Sab unter einer Abbildung 4.23: Zur Bestimmung des Volu-
Kurve kann durch einfache Integration be- mens unter einer Fläche ist eine Doppelinte-
stimmt werden. gration notwendig.

Abbildung 4.24: Zur Berechnung des von ei- Abbildung 4.25: Ein Teilvolumen über ei-
ner Fläche begrenzten Volumens teilen wir nem der kleinen Rechtecke im Bereich A. Die
den Bereich A in der xy-Ebene in viele klei- Höhe des Volumens ist etwa der Funktions-
ne Rechtecke ein. wert f (xi , yi ) an der Stelle xi , yi .

Dieser Punkt kann der Mittelpunkt der Zelle sein oder irgendwo anders in der Zelle liegen (auch
am Rand). Zu jedem dieser Punkte (xi , yj ) gibt es einen Funktionswert f (xi , yj ). Das Volumen
über der Zelle, das von der Fläche f (x, y) oben begrenzt wird, ergibt sich näherungsweise aus der
Grundfläche ∆x∆y der Zelle multipliziert mit deren Höhe f (xi , yj ) (siehe Abb. 4.25):

∆V ≈ ∆x∆y · f (xi , yj ). (4.134)

Hier machen wir natürlich einen Fehler, weil dieses Teilvolumen oben nicht durch eine ebene,
horizontale Fläche begrenzt wird. Für kleiner werdende ∆x und ∆y wird dieser Fehler jedoch
immer kleiner. Durch Summation über alle Quader, deren zugehörige Punkte (xi , yj ) in A liegen,
erhalten wir schließlich annäherungsweise das gesuchte Gesamtvolumen V
XX
V ≈ f (xi , yj )∆x∆y. (4.135)
i j

Wie beim eindimensionalen Fall nähert die Summe das Volumen immer besser an, je feiner die
Einteilung der xy-Ebene gewählt wird, das heißt je kleiner ∆x und ∆y sind. Im Grenzfall ∆x → 0
und ∆y → 0 erhalten wir das exakte Volumen:
XX ZZ
V = lim lim f (xi , yj )∆x∆y = f (x, y)dxdy. (4.136)
∆x→0 ∆y→0 A
i j
110 4 Integration

Dieser Grenzwert ist das Doppelintegral der Funktion f (x, y) im Gebiet A. Das Produkt
dxdy nennt man auch das Flächenelement. Da das Gebiet A kompliziert sein kann, können wir
nicht wie im eindimensionalen Fall einfache Integrationsgrenzen angeben. Wir schreiben daher
Rb
das Gebiet A einfach unter das Doppelintegral. Wie beim Integral a f (x)dx müssen wir diesen
Grenzübergang nicht für jedes Integral neu durchführen. Statt dessen können wir die Berechnung
des Doppelintegrals auf die Berechnung einfacher Integrale zurückführen.

4.10.2 Berechnung von Doppelintegralen

Zur Berechnung eines Doppelintegrals gehen wir von der Summe


XX
V ≈ f (xi , yj )∆x∆y (4.137)
i j

aus und führen die Summation über i und j getrennt durch. Zunächst summieren wir für ein
bestimmtes i über alle möglichen Werte von j. Diese Summation entspricht der Berechnung des
Volumens einer Schicht der Dicke ∆x parallel zur yz-Ebene (siehe Abb. 4.26):
 
X
Vi =  f (xi , yj )∆y  ∆x. (4.138)
j

Abbildung 4.26: Die Summation über alle j für einen bestimmten Wert i ergibt das Volumen einer
Schicht mit der Dicke ∆x, die parallel zur yz-Ebene liegt.

Führen wir jetzt den Grenzwert ∆y → 0 durch, erhalten wir


 
b(x
Z i)
 
Vi =  f (xi , y)dy  ∆x. (4.139)
a(xi )

Dabei hängen die Integrationsgrenzen vom Ort xi ab. In der xy-Ebene wird der Integrationsbereich
A durch die zwei Kurven a(x) und b(x) begrenzt (siehe Abb. 4.27).

Hier gehen wir der Einfachheit halber davon aus, dass der Integrationsbereich nur zwei senkrechte
Tangenten besitzt. Falls das nicht der Fall ist (siehe zum Beispiel Abb. 4.28), muss man dies
berücksichtigen. Auch in diesem Fall ändert sich jedoch die prinzipielle Vorgangsweise nicht.

Das Volumen Vi aus Gleichung (4.139) entspricht dem Volumen über der schraffierten Fläche in
Abb. 4.27. Um das Gesamtvolumen zu berechnen, müssen wir noch über alle Teilvolumina Vi
4 Integration 111

Abbildung 4.27: Die Integrationsgrenzen a(x) und b(x) für die Integrationsgrenzen in y-Richtung
hängen von der x-Position ab.

Abbildung 4.28: Falls der Integrationsbereich wie hier mehr als zwei senkrechte Tangenten besitzt,
muss man die Integration in mehrere Doppelintegrale aufteilen.

summieren:
 
b(xi )
X X Z 
V ≈ Vi =  f (xi , y)dy  ∆x. (4.140)
i i
a(xi )

b(x
R i)
Dieses bestimmte Integral f (xi , y)dy auf der rechten Seite der obigen Gleichung ist eine Funk-
a(xi )
tion von xi . Die Abhängigkeit von y ist bereits verschwunden, weil wir über die Integrationsvariable
y integriert haben. Durch Bildung des Grenzübergangs ∆x → 0 erhalten wir schließlich
   
b(xi ) Zd Zb(x)
X Z   
V = lim  f (xi , y)dy  ∆x =  f (x, y)dy  dx, (4.141)
∆x→0
i c
a(xi ) a(x)

wobei wir wieder die Definition des Integrals als Grenzfall einer Summe benutzt haben. Wir haben
somit die Berechnung des Doppelintegrals auf die hintereinander ausgeführte Berechnung zweier
einfacher Integrale zurückgeführt.

Natürlich hätten wir auch die Integrationsreihenfolge umkehren können:


 
Zb d(y)
Z Zb d(y)
Z
 
V =  f (x, y)dx dy = f (x, y)dxdy. (4.142)
a c(y) a c(y)

In diesem Fall müssen wir die Integrationsgrenzen für die Integration nach x als Funktion von y
ausdrücken.
112 4 Integration

Beispiel:
RR √
Zu berechnen ist das Integral A
x + y dxdy für einen rechteckigen Bereich A, der gegeben ist
durch:

1 ≤ x ≤ 2, (4.143)
0 ≤ y ≤ 5. (4.144)

Abbildung 4.29: Integrationsbereich A.

In diesem Fall vereinfacht sich die Berechnung, weil die Integrationsgrenzen in y-Richtung nicht
von x abhängen:

ZZ Z5 Z2 Z5 2 !
√ √ 2 3
x + y dxdy = x + y dxdy = (x + y) 2 dy
A 3 x=1
0 1 0
Z5  
2 3 3
= (y + 2) 2 − (y + 1) 2 dy
3
0
5 5 !
22 5 5
= (y + 2) − (y + 1) 2
2
35 0 0
22 5 5 5

= 72 − 22 − 62 + 1
35
4  5 5 5

= 72 − 22 − 62 + 1 . (4.145)
15
Wenn wir die Integrationsreihenfolge umkehren, erhalten wir:

ZZ Z2 Z5 Z2 5 !
√ √ 2 3
x + ydxdy = x + ydydx = (x + y) 2 dx
A 3 y=0
1 0 1
Z2  
2 3 3
= (x + 5) 2 − x 2 dx
3
1
2 2 !
2 2 5 2 5
= (x + 5) 2 − x 2
3 5 1 5 1
4  5 5 5

= 72 − 22 − 62 + 1 , (4.146)
15
was mit dem oben erhaltenen Resultat übereinstimmt.
4 Integration 113

Beispiel:

Zu berechnen ist das Volumen des Kugeloktanten einer Kugel mit Radius r (siehe Abb. 4.30). Im
Unterschied zum vorherigen Beispiel müssen wir hier die x-Abhängigkeit der Integrationsgrenzen
in y berücksichtigen.

p
Abbildung 4.30: Der Kugeloktant ist im ersten Quadranten durch die Fläche z = r2 − x2 − y 2
nach oben begrenzt.

Die Kugeloberfläche im ersten Oktanten ist gegeben durch:


p
x2 + y 2 + z 2 = r2 ⇒ f (x, y) = r2 − x2 − y 2 . (4.147)
Das Volumen V8 des Kugeloktanten lässt sich somit als folgendes Doppelintegral ausdrücken:
 
Zr Z b(x)
 p 
V8 =  r2 − x2 − y 2 dy  dx. (4.148)
0 a(x)

Da die Grenzen für die Integration in y-Richtung


p
a(x) = 0 und b(x) = r2 − x2 (4.149)
sind, erhalten wir:
√ 
Zr rZ2 −x2
 p 
V8 =  dy r2 − x2 − y 2  dx. (4.150)
0 0

Aus einer Formelsammlung entnehmen wir, dass


Z p
1h p 2 yi
a2 − y 2 dy = y a − y 2 + a2 arcsin . (4.151)
2 a
Somit erhalten wir für die Integration in y-Richtung:

rZ2 −x2  √r2 −x2
p 1 p 2 y
(r2 − x2 ) − y 2 dy = y (r − x2 ) − y 2 + (r2 − x2 ) arcsin √
2 r2 − x2 0
0
1  π
= 0 + (r2 − x2 ) arcsin(1) − 0 − 0 = (r2 − x2 ). (4.152)
2 4
Einsetzen dieses Resultats und Integration in x-Richtung ergibt schließlich
Zr   r
π 2 2 π 2 x3
V8 = (r − x )dx = r x−
4 4 3 0
0
 
π r3 2 π r3 π
= r3 − = · · r3 = , (4.153)
4 3 3 4 6
114 4 Integration

sodass wir für das Kugelvolumen das erwartete Resultat


r3 π 4
V =8 = πr3 (4.154)
6 3
erhalten.

4.10.3 Doppelintegrale in Polarkoordinaten

Oft ist es leichter, den Integrationsbereich A für ein Doppelintegral in Polarkoordinaten auszu-
drücken. So ist es zum Beispiel bei Integration über einen Kreis mit Radius R einfacher,
√ den Inte-
grationsbereich durch 0 ≤ r ≤ R und 0 ≤ ϕ ≤ 2π als durch −R ≤ x ≤ R und − R 2 − x2 ≤ y ≤

R2 − x2 zu beschreiben. In Polarkoordinaten ist der Integrationsbereich also einfach ein Rechteck,
während wir in kartesischen Koordinaten mit komplizierteren Funktionen arbeiten müssen.

Um diese Vereinfachung auszunützen, können wir die Integration in Polarkoordinaten durchführen.


Dazu drücken wir zuerst die zu integrierende Funktion in Polarkoordinaten aus:

f (x, y) = f (r cos ϕ, r sin ϕ). (4.155)

Wir müssen allerdings auch das Flächenelement dxdy = dA richtig transformieren. Das Flächen-
element dA ergibt sich ja dadurch, dass wir die Variablen x und y um einen kleinen Betrag dx
bzw. dy ändern und dadurch das Flächenelement dA = dxdy erzeugen. Welches Flächenelement
entsteht aber, wenn wir ϕ um dϕ und r um dr ändern?

Abbildung 4.31: Das Flächenelement dA entsteht durch eine Änderung des Winkels ϕ um dϕ und
eine Änderung des Radius r um dr.

Dieses Flächenelement ist von gekrümmten Linien begrenzt (siehe Abb. 4.31). Für sehr kleine dϕ
und dr kann man das Flächenelement mit vernachlässigbarem Fehler als Rechteck mit Seitenlängen
dr und rdϕ betrachten (der Winkel ϕ wird in Bogenmaß angegeben). Der Flächeninhalt dieses
kleinen Rechtecks ist daher:

dA = rdϕdr. (4.156)

Somit ergibt sich für die Transformation des Integrals von kartesischen Koordinaten zu Polarkoor-
dinaten:
ZZ ZZ
f (x, y)dxdy = f (r cos ϕ, r sin ϕ)rdϕdr. (4.157)
A A′

Hier ist A der in Polarkoordinaten beschriebene Integrationsbereich.
4 Integration 115

Beispiel:

Wieder soll das Volumen des Kugeloktanten berechnet werden, diesmal allerdings unter Verwen-
dung von Polarkoordinaten. Transformation des Integrationsbereichs in der xy-Ebene nach Polar-
koordinaten ergibt:
ZZ p ZZ q
V8 = 2 2 2
R − x − y dxdy = R2 − r2 cos2 ϕ − r2 sin2 ϕrdϕdr
K K′
π  
Z2 ZR p
=  R2 − r2 rdr dϕ, (4.158)
0 0
2 2
wobei wir ausgenutzt haben, dass sin ϕ + cos ϕ = 1. Da der Integrand nicht vom Winkel ϕ
abhängt, können wir die Integration über ϕ sofort durchführen und erhalten
ZR p
π
V8 = R2 − r2 rdr. (4.159)
2
0

Um dieses Integral über r zu bestimmen, führen wir die Substitution u = R2 − r2 durch. Da


du/dr = −2r und somit dr = −du/2r, erhalten wir
Z p Z
2 2
√ du
R − r rdr = ur
−2r
3

= − u =−
21 3
2
u2
3 2 3
1 2 3
= − (R − r2 ) 2 . (4.160)
3
Einsetzen ergibt schließlich
  R 3
π 1 2 2 32 = πR ,

V8 = − (R − r ) (4.161)
2 3
0 6
was mit dem früher erhaltenen Ergebnis übereinstimmt.

Beispiel:

Wir wollen das so genannte Gaußsche Integral


Z∞
2
e−x dx (4.162)
−∞

berechnen. Dieses Integral spielt in der Wahrscheinlichkeitsrechnung und in der statistischen Me-
chanik eine wichtige Rolle.

Das Gaußsche Integral ist auf direkte Weise nicht leicht zu bestimmen, wir können es aber mit
dem folgenden Trick berechnen. Wir schreiben das Integral zunächst als
 ∞  21
Z∞ Z Z∞
2 2 2
A= e−x dx =  e−x dx e−y dy  . (4.163)
−∞ −∞ −∞

Das können wir ohne weiteres tun, weil der Name der Integrationsvariablen (x oder y) belanglos
ist. Das Produkt der beiden Integrale über x und über y können wir nun als ein Doppelintegral
über die gesamte xy-Ebene auffassen.
Z∞ Z∞ Z∞ Z∞
2 −x2 −y 2 2
+y 2 )
A = e dx · e dy = e−(x dxdy. (4.164)
−∞ −∞ −∞ −∞
116 4 Integration


Abbildung 4.32: Die Fläche unter der Gaußschen Glockenkurve exp(−x2 ) ist A = π.

Diese Darstellung erlaubt eine Transformation auf Polarkoordinaten:


Z2πZ∞ Z∞
2 2
A2 = e−r rdrdϕ = 2π e−r rdr. (4.165)
0 0 0

Hier haben wir ausgenützt, dass gilt r2 = x2 + y 2 . Der Integrand ist somit nicht mehr abhängig von
ϕ, sodass wir die Integration über ϕ gleich ausführen konnten, was einen Faktor von 2π verursacht
hat. Das noch verbleibende Integral über r ist leicht zu lösen. Wir erkennen, dass
d −r2 2
e = e−r (−2r) (4.166)
dr
und somit
 
d 1 −r2 2
− e = e−r r. (4.167)
dr 2
Durch Einsetzen erhalten wir schließlich
  ∞
2 1 −r2 1
A = 2π − e = 2π 2 (−0 + 1) = π. (4.168)
2 0

Das Gaußsche Integral ist also:


Z∞
2 √
e−x dx = π. (4.169)
−∞

4.11 Dreifachintegrale

4.11.1 Definition

Analog zum Doppelintegral können wir auch ein Dreifachintegral (oder im Allgemeinen ein n-
faches Integral) definieren und berechnen. Gegeben sei ein Gebiet B im dreidimensionalen Raum,
das von einer geschlossenen Fläche umgeben wird. Innerhalb dieses Gebiets sei eine Funktion
f (x, y, z) definiert. Als Beispiel können wir uns einen Körper mit einer räumlich nicht uniformen
Dichte ρ(x, y, z) vorstellen.

Wir können die Funktion f (x, y, z) über den Bereich B integrieren, indem wir diesen in kleine
Quader mit Kantenlängen ∆x, ∆y und ∆z einteilen. Das Volumen ∆V jedes Quaders ist

∆V = ∆x∆y∆z. (4.170)
4 Integration 117

Abbildung 4.33: Bei einer Dreifachintegration wird das Integrationsvolumen in infinitesimale Qua-
der mit Kantenlängen dx, dy und dz, so genannte Volumselemente, eingeteilt.

Wir summieren jetzt den Funktionswert f (xi , yj , zk ) in jedem Quader (z.B. im Quadermittelpunkt)
multipliziert mit dem Volumen ∆V über alle kleinen Quader:
XXX
f (xi , yj , zk )∆x∆y∆z. (4.171)
i j k

Wenn wir den Grenzwert ∆x → 0, ∆y → 0 und ∆z → 0 bilden, erhalten wir das Dreifachintegral
von f (x, y, z) über den Bereich B:
ZZZ
I= f (x, y, z)dxdydz. (4.172)
B

Das infinitesimale Volumen dV nennt man das Volumselement. Oft schreiben wir auch
ZZZ
I= f (x, y, z)dV (4.173)
B

oder noch kürzer


Z
I= f (x, y, z)dV. (4.174)
B

Für das 3d-Integral haben wir keine anschauliche Interpretation als Fläche oder Volumen, da wir
dazu in den 4d-Raum ausweichen müssten. Analog zum Doppel- und Dreifachintegral lassen sich
auch in beliebig hochdimensionalen Räumen Volumsintegrale bilden.

Beispiel:

Wir betrachten einen Körper mit einer inhomogenen Dichteverteilung, der also an unterschiedli-
chen Stellen unterschiedlich dicht ist. Denken Sie beispielsweise an den Planeten Erde, der einen
metallischen Kern mit hoher Dichte besitzt, der von mineralischen Schichten mit niedrigerer Dichte
umgeben ist. Die Dichteverteilung im Körper sei ρ(x, y, z), wobei die Dichte definiert ist als die
Masse pro Volumen:
dm(x, y, z)
ρ(x, y, z) = . (4.175)
dV
Wir wollen nun die Gesamtmasse dieses Körpers berechnen. Dazu addieren wir die Massen aller
infinitesimaler Volumselemente im Körper. Die Masse dm(x, y, z) des Volumselementes dV im
118 4 Integration

Punkt (x, y, z) ist gegeben durch:


dm(x, y, z) = ρ(x, y, z)dV. (4.176)
Durch Summation (Integration) über alle Volumselemente erhalten wir die Gesamtmasse des
Körpers:
ZZZ
M= ρ(x, y, z)dxdydz, (4.177)
B

wobei B der Bereich ist, der vom Körper ausgefüllt wird.

4.11.2 Berechnung von Dreifachintegralen

Abbildung 4.34: Der Integrationsbereich B wird durch die Flächen ψ1 (x, y) und ψ2 (x, y) begrenzt.
Die Projektion des Bereiches B in die xy-Ebene wird durch die Kurven ϕ1 (x) und ϕ2 (x) begrenzt.

Durch zum zweidimensionalen Fall analoge Überlegungen lässt sich auch das Volumsintegral auf
die Hintereinanderausführung von einfachen Integralen zurückführen (siehe Abb. 4.34). Dazu
bezeichnen wir die beiden Begrenzungskurven der Projektion des räumlichen Bereiches B in die
xy-Ebene mit y = ϕ1 (x) und y = ϕ2 (x). Die Grenzen in x-Richtung bezeichnen wir mit x1 und
x2 und die beiden Begrenzungsflächen des räumlichen Bereichs mit z = ψ1 (x, y) und z = ψ2 (x, y).
Dann kann das Dreifachintegral ausgedrückt werden als
  
ZZZ Z ϕZ2 (x) ψ2Z(x,y)
  
f (x, y, z)dxdydz = dx  dy  dzf (x, y, z) . (4.178)
B
ϕ1 (x) ψ1 (x,y)

Eine andere Integrationsreihenfolge mit passend geänderten Integrationsgrenzen ist natürlich möglich.

Beispiel:

Wir berechnen als Beispiel das Volumen eines Ellipsoids mit Halbachsen a, b und c (siehe Abb.
4.35). Das Volumen können wir berechnen, indem wir die Funktion f (x, y, z) = 1 über das Ellipsoid
integrieren:
ZZZ
V = 1 dxdydz, (4.179)

wobei das Integrationsvolumen durch die Gleichung


 x 2  y 2  z 2
+ + ≤1 (4.180)
a b c
4 Integration 119

Abbildung 4.35: Ein Ellipsoid, dessen Achsen entlang der Koordinatenachsen verlaufen.

gegeben ist. Das Volumen erhalten wir hier also einfach durch Summation aller Volumselemente,
die sich im Inneren des Ellipsoids befinden.

Die Begrenzungskurve der Projektion des Integrationsbereichs in die xy-Ebene ist für das Ellipsoid
gegeben durch
x2 y2
+ =1 (4.181)
a2 b2
und wird infolgedessen durch die beiden Funktionen
r r
x2 x2
ϕ1 (x) = −b 1 − 2 und ϕ2 (x) = b 1− (4.182)
a a2
beschrieben. Die Begrenzungsflächen im Raum folgen aus der Gleichung
x2 y2 z2
+ + =1 (4.183)
a2 b2 c2
und werden durch die Funktionen
r r
x2 y2 x2 y2
ψ1 (x, y) = −c 1− 2 − 2 und ψ2 (x, y) = c 1− 2
− 2 (4.184)
a b a b
beschrieben. In der x-Richtung wir das Ellipsoid durch die beiden Punkte
x1 = −a x2 = a (4.185)
begrenzt. Wir können nun die Integrale hintereinander ausführen, wobei wir mit dem Integral über
die Integrationsvariable z beginnen. Für das Integral über z erhalten wir mit den beiden obigen
Begrenzungsflächen:
ψ2Z(x,y) r
x2 y2
1dz = ψ2 (x, y) − ψ1 (x, y) = 2c 1− 2
− 2. (4.186)
a b
ψ1 (x,y)

Als nächstes führen wir die Integration


ϕZ2 (x) r
x2 y2
2c 1 − − dy (4.187)
a2 b2
ϕ1 (x)

über die Variable y durch. Um dieses Integral zu berechnen, führen wir zur Abkürzung den Aus-
druck A2 = 1 − x2 /a2 ein und führen die Substitution u = y/b durch. Somit ergibt sich wegen
dy = bdu:
Z r Z p
x2 y2 up 2 bA2 u
1 − 2 − 2 dy = A2 − u2 bdu = b A − u2 + arcsin , (4.188)
a b 2 2 A
120 4 Integration

R√
wobei wir das Integral A2 − u2 in der Formelsammlung nachgeschlagen haben. Einsetzen gefolgt
von einigen algebraischen Umformungen ergibt

ϕZ2 (x)s 
x2 y2
1− 2 − dy =
a b2
ϕ1 (x)
q
2
s    y
y=b 1− x
a2
by x2 y2 x2 b
arcsin q b

= 1− 2 − 2 + 1− 2
2b a b a 2 1− x2 q
x2
a2 y=−b 1− a2

r s     
x2 x2 x2 x2 b
=b 1− 2 1− 2 − 1− 2 + 1− 2 [arcsin(1) − arcsin(−1)] . (4.189)
a a a a 2
| {z }
=0

Durch Auswerten der Arkussinusfunktion an den Stellen −1 und +1 erhalten wir schließlich:
ϕZ2 (x)s   
x2 y2 x2 bπ
1− 2 − 2 dy = 1− 2 . (4.190)
a b a 2
ϕ1 (x)

Um das Volumen V zu berechnen, müssen wir noch die Integration über x durchführen. Da x als
einfaches Quadrat im Integranden vorkommt, verursacht dies keine Schwierigkeiten:
Za   Za     a
bπ x2 x2 x3
V = 2c 1 − 2 dx = cbπ 1 − 2 dx = cbπ x − 2
2 a a 3a −a
−a −a
   
2a3 2a 6−2
= cbπ 2a − 2 = cbπ 2a − = acbπ . (4.191)
3a 3 3

Das Volumen des Ellipsoids ist also


4
V = πacb. (4.192)
3

4.11.3 Dreifachintegrale in Zylinder- und Kugelkoordinaten

In manchen Fällen kann es auch vorteilhaft sein, Volumsintegrale in Zylinderkoordinaten oder in


Kugelkoordinaten zu berechnen. In Zylinderkoordinaten müssen wir beachten, dass das Vo-
lumselement wie folgt transformiert (anschaulich ergibt sich dies aus zum Doppelintegral analo-
gen Überlegungen):

dxdydz = ρdρdϕdz. (4.193)

Somit ist das Integral gegeben durch


ZZZ ZZZ
f (x, y, z)dxdydz = f (ρ cos ϕ, ρ sin ϕ, z)ρdρdϕdz, (4.194)
B B′

wobei B ′ das in Zylinderkoordinaten ausgedrückte Integrationsgebiet ist.


4 Integration 121

Beispiel: Volumen eines Zylinders


R
Wir berechnen das Volumen eines Zylinders mit Radius r und Höhe h als Integral V = dV über
das Innere des Zylinders:
Z r Z h Z 2π
V = ρdϕdzdρ
0 0 0
Z r Z h
= 2πρdhdρ
0 0
Z r
r2
= 2πhρdρ = 2πh = πr2 h. (4.195)
0 2

In Kugelkoordinaten ist das Volumselement:


dV = dxdydz = r2 dr sin ϑdϑdϕ, (4.196)
was man sich geometrisch leicht klarmachen kann. Das Integral wird zu
ZZZ ZZZ
f (x, y, z)dxdydz = f (r sin ϑ cos ϕ, r sin ϑ cos ϕ, r cos ϑ)r2 dr sin ϑdϑdϕ, (4.197)
B B′

wobei B das in Kugelkoordinaten definierte Integrationsgebiet ist.

Beispiel: Schwerpunkt einer Halbkugel

Zu bestimmen ist der Schwerpunkt einer homogenen Halbkugel mit Radius R. Im Allgemeinen ist
der Schwerpunkt eines Körpers mit homogener Dichte gegeben durch
Z
1
~rS = ~rdV. (4.198)
V V
Wir legen die Halbkugel so in ein kartesisches Koordinatensystem, dass die Schnittfläche in der
xy-Ebene liegt und sich die Halbkugel auf der Seite der positiven z-Achse befindet. Aus Symme-
triegründen muss der Schwerpunkt auf der z-Achse liegen, d. h. xS = 0 und yS = 0. Zu berechnen
bleibt die z-Komponente des Schwerpunktes. In Kugelkoordinaten haben wir:
Z
1
zS = zdV
V V
Z Z Z
1 R π/2 2π
= (r cos ϑ)r2 sin ϑdϕdϑdr
V 0 0 0
Z Z
2π R π/2 3
= r cos ϑ sin ϑdϑdr
V 0 0
Z
2π 1 R 3
= r dr
V 2 0
π R4 6π R4 3
= = 3
= R, (4.199)
V 4 4πR 4 8
wobei wir verwendet haben, dass das Volumen der Halbkugel 4πR3 /6 ist.

4.12 Integration von vektorwertigen Funktionen

Betrachten wir eine vektorwertige Funktion A(t)~ einer skalaren Variablen t, z.B. die Geschwindig-
keit ~v (t) eines Teilchens. Wir können nun ein Integral über diese Funktion definieren, indem wir
122 4 Integration

ein Intervall [ta , tb ] in die Teilintervalle [ti , ti+1 ] zerlegen und die Summe
N
X
~ i ) · ∆ti
A(t (4.200)
i=1

~
bilden. Hier besteht A(t) ~
aus drei Komponenten A(t) = (Ax (t), Ay (t), Az (t)). Da die Summe von
Vektoren komponentenweise durchgeführt wird, haben wir
 P 
X N Ax (ti ) · ∆ti
~ i ) · ∆ti = 
A(t 
P 
Ay (ti ) · ∆ti  . (4.201)
i=1 P
Az (ti ) · ∆ti

Im Grenzfall einer unendlich feinen Intervallzerlegung erhalten wir das Integral


 R 
Z Ax (t)dt
~  R 
A(t)dt =  Ay (t)dt  . (4.202)
R
Az (t)dt

Das heißt, das Integral über eine vektorwertige Funktion einer skalaren Variablen ist ein Vektor,
dessen Komponenten die Integrale der Komponentenfunktionen Ax (t), Ay (t) und Az (t) sind.

Beispiel:

Das Integral der vektorwertigen Funktion


 
t + t2
~ =
A(t)  e−6t 

(4.203)
1

sei über das Intervall [0, 1] zu berechnen. Wir führen die Integration über t komponentenweise
durch:
 
R1 2  2 1 
 (t + t )dt  t
+ t3  
Z 1  0   2 3 0  5
 R1    6
~
A(t)dt = 
 
e−6t dt  =  1   1 −6 
   − 16 e−6t 0  =  6 (1 − e )  . (4.204)
0 0  

 R1

 1
1
1 dt t|0
0
Teil II

Einführung in die Physikalischen


Rechenmethoden II

123
Kapitel 5

Komplexe Zahlen

Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Um-
kehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die Quadratwurzel
einer negativen Zahl ziehen. Für die quadratische Gleichung mit reellen Koeffizienten beispielsweise

ax2 + bx + c = 0, (5.1)
existieren die reellen Lösungen √
−b ± b2 − 4ac
x1,2 = (5.2)
2a
nur dann, wenn das Argument der Wurzel nicht negativ ist, das heißt wenn gilt b2 ≥ 4ac. Wir
können den Zahlenraum jedoch so erweitern, dass algebraische Gleichungen wie die quadratische
Gleichung (5.1) immer eine Lösung haben. Diesen erweiterten Raum nennen wir die komplexen
Zahlen und werden sehen, dass dieser Übergang von den reellen zu den komplexen Zahlen dem
Übergang von der Zahlengerade R zu der Zahlenebene R2 = R × R entspricht. Für komplexe
Zahlen lassen sich Rechenoperationen so definieren, dass alle für die Operationen mit reellen Zahlen
geltenden Gesetze in Kraft bleiben. Die reellen Zahlen sind dann als Spezialfall in den komplexen
Zahlen enthalten. Komplexe Zahlen spielen in der gesamten Physik eine äußerst wichtige Rolle
und wir werden uns im Folgenden mit der Definition und den Rechenregeln für komplexe Zahlen
beschäftigen.

5.1 Definition und Darstellung

Zur Erweiterung der reellen Zahlen führen wir imaginäre Zahlen ein. Dazu definieren wir die
imaginäre Einheit als die Zahl i, deren Quadrat -1 ergibt:

i2 = −1 (oder, mathematisch etwas salopp ausgedrückt, i = −1). (5.3)
(Die Wurzel aus einer negativen Zahl können wir eigentlich nicht ziehen. Wir tun jetzt aber “so
als ob” und wir werden sehen, dass wir damit sehr weit kommen.) Wir können jetzt formal die
Wurzel aus einer negativen Zahl ziehen, z.B.
√ p √ √ √
−5 = 5 · (−1) = 5 · −1 = 5i. (5.4)
Die Wurzel aus einer negativen reellen Zahl ist eine imaginäre Zahl. Eine imaginäre Zahl setzt
sich aus der imaginären Einheit i und einer reellen Zahl y zusammen:
yi. (5.5)
Wie die reellen Zahlen lassen sich auch die imaginären Zahlen auf einem Zahlenstrahl darstellen
(siehe Abb. 5.1).

125
126 5 Komplexe Zahlen

Abbildung 5.1: Zahlenstrahl für die imaginären Zahlen.

Höhere Potenzen der imaginären Einheit ergeben imaginäre oder reelle Zahlen:

i2 = −1, (5.6)
3 2
i = i i = −1i = −i, (5.7)
i4 = i2 i2 = −1 · −1 = 1, (5.8)
i5 = i4 · i = i, (5.9)
usw.

Die Zusammensetzung einer reellen Zahl x und einer imaginären Zahl iy (y reell) nennt man eine
komplexe Zahl:

z = x + iy. (5.10)

Solche komplexen Zahlen ergeben sich bei der Lösung quadratischer Gleichungen. Zum Beispiel
hat die Gleichung
x2 − 4x + 29 = 0 (5.11)
die komplexen Lösungen

+4 ± 16 − 4 · 29 √ √
x1,2 = = 2 ± −25 = 2 ± 5 −1 = 2 ± 5i. (5.12)
2

Die Darstellungsform z = x + iy bezeichnet man auch als Normalform oder kartesische Dar-
stellung einer komplexen Zahl. In dieser Darstellungsform nennt man

x = ℜ(z) den Realteil der komplexen Zahl z und


y = ℑ(z) den Imaginärteil.

Gebräuchlich ist auch die Notation x = Re(z) und y = Im(z). Sowohl der Realteil als auch der
Imaginärteil einer komplexen Zahl sind reelle Zahlen (obwohl die Bezeichnung Imaginärteil das
Gegenteil suggeriert).

Abbildung 5.2: Graphische Darstellung einer komplexen Zahl in der Gaußschen Zahlenebene.

Graphisch kann man komplexe Zahlen in der Gaußschen Zahlenebene darstellen (siehe Abb.
5.2). Dabei wird der Realteil ℜ(z) der komplexen Zahl z = x + iy auf der x-Achse aufgetragen
5 Komplexe Zahlen 127

und der Imaginärteil ℑ(z) auf der y-Achse (genauso wie wir es für die Komponenten eines Vektors
~r = (x, y) getan haben). Im Fall der komplexen Zahlen bezeichnen wir die x-Achse als die reelle
Achse und die y-Achse als die imaginäre Achse. Eine komplexe Zahl z entspricht also einem
Punkt P (x, y) und somit einem Ortsvektor ~r = (x, y) in der Gaußschen Zahlenebene.

Alternativ zur kartesischen Darstellung kann man für komplexe Zahlen auch die so genannte trigo-
nometrische Darstellung verwenden. In dieser Darstellung beschreiben wir die komplexe Zahl
z = x + iy durch den Winkel ϕ zwischen der reellen Achse und dem Ortsvektor ~r und dem Abstand
des Punktes P (x, y) vom Ursprung der Gaußschen Zahlenebene. Dies entspricht der Darstellung
des Punktes P (x, y) in Polarkoordinaten. Der Abstand von P (x, y) vom Ursprung, oder Betrag
|z| der komplexen Zahl, ergibt sich durch Anwendung des Satzes von Pythagoras:
p p
|z| = x2 + y 2 = ℜ2 (z) + ℑ2 (z). (5.13)

Für den Winkel ϕ, auch Phasenwinkel genannt, gilt:


y ℑ(z)
ϕ = arctan = arctan . (5.14)
x ℜ(z)
Umgekehrt lauten die Transformationsgleichungen von der trigonometrischen zur kartesischen Dar-
stellung:

ℜ(z) = x = |z| cos ϕ, (5.15)


ℑ(z) = y = |z| sin ϕ. (5.16)

Somit kann die komplexe Zahl z auch geschrieben werden als:

z = |z| cos ϕ + i|z| sin ϕ oder z = |z|(cos ϕ + i sin ϕ). (5.17)

5.2 Rechenregeln für komplexe Zahlen

Die komplexen Zahlen enthalten die reellen Zahlen als einen Spezialfall. Setzen wir nämlich in
der komplexen Zahl z = x + iy den Imaginärteil y gleich 0, erhalten wir die reelle Zahl x und
wir beschränken uns dadurch auf die reelle Achse der Gaußschen Zahlenebene. Die Rechenregeln
für komplexe Zahlen sollten also so definiert sein, dass sie für diesen Spezialfall in die üblichen
Rechenregeln für die reellen Zahlen übergehen. Wie wir im Folgenden sehen werden, lässt sich
dies erreichen, indem man einfach die üblichen algebraischen Rechenregeln anwendet und dabei
beachtet, dass i2 = −1.

Zunächst definieren wir zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 als gleich, wenn
sie sowohl in ihrem Realteil als auch in ihrem Imaginärteil übereinstimmen. Das heißt:

z1 = z2 ⇔ ℜ(z1 ) = ℜ(z2 ) und ℑ(z1 ) = ℑ(z2 ). (5.18)

Eine komplexe Zahl z = x + iy ist Null, wenn sowohl ihr Realteil als auch ihr Imaginärteil
verschwinden:

z=0 ⇔ ℜ(z) = 0 und ℑ(z) = 0. (5.19)

5.2.1 Addition und Subtraktion

Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden addiert bzw. subtrahiert, indem
man ihre reellen und imaginären Anteile jeweils getrennt voneinander addiert bzw. subtrahiert:

z1 + z2 = (x1 + x2 ) + i(y1 + y2 ), (5.20)


z1 − z2 = (x1 − x2 ) + i(y1 − y2 ). (5.21)
128 5 Komplexe Zahlen

Abbildung 5.3: Addition der komplexen Zah- Abbildung 5.4: Subtraktion der komplexen
len z1 und z2 . Zahl z2 von der komplexen Zahl z1 .

Dies entspricht der komponentenweisen Addition bzw. Subtraktion der zugehörigen Vektoren in der
Gaußschen Zahlenebene. Wie aus Abb. 5.3 ersichtlich ist, können wir graphisch die Addition und
Subtraktion von komplexen Zahlen durch passendes Aneinanderhängen der zugehörigen Vektoren
durchführen. Addition und Subtraktion von komplexen Zahlen funktionieren analog zur Addition
und Subtraktion der zugehörigen zweidimensionalen Vektoren.

Beispiel:
(4 + 3i) + (6 − 2i) = (4 + 6) + (3 + (−2))i = 10 + i, (5.22)
(4 + 3i) − (6 − 2i) = (4 − 6) + (3 − (−2))i = −2 + 5i. (5.23)

Die Addition von komplexen Zahlen ist assoziativ,


z1 + (z2 + z3 ) = (z1 + z2 ) + z3 = z1 + z2 + z3 , (5.24)
und kommutativ,
z1 + z2 = z2 + z1 . (5.25)
Weiters existiert das neutrale Element 0, sodass
z+0=z (0 = 0 + i0), (5.26)
und das inverse Element zinv , sodass
z + zinv = 0. (5.27)
Für die komplexe Zahl z = x + iy ist die inverse komplexe Zahl zinv = −z = −x − iy. Die
Subtraktion z = z1 − z2 kann also aufgefasst werden als die Addition von z1 mit dem inversen
Element der Zahl z2 , z = z1 + (−z2 ).

5.2.2 Multiplikation einer komplexen Zahl mit einer reellen Zahl

Die Multiplikation einer komplexen Zahl z mit einer reellen Zahl a kann als eine wiederholte
Addition aufgefasst werden:
az = a(x + iy) = ax + iay. (5.28)
5 Komplexe Zahlen 129

Beispiel:
2z = 2(x + iy) = 2x + 2iy. (5.29)

Diese Operation entspricht also der Multiplikation des entsprechenden Vektors in der Gaußschen
Zahlenebene mit einem Skalar (siehe Abb. 5.5).

Abbildung 5.5: Multiplikation einer komplexen Zahl mit einer reellen Zahl.

5.2.3 Komplex konjugierte Zahl

Für eine komplexe Zahl z = x + iy lässt sich durch Umkehrung des Vorzeichens des Imaginärteils
die komplex konjugierte Zahl z ∗ definieren:
z ∗ = x − iy. (5.30)
Wir verwenden auch oft die Notation z für die komplex konjugierte Zahl. Graphisch erhält man
die komplex konjugierte Zahl durch Spiegelung des zugehörigen Vektors an der reellen Achse.

Abbildung 5.6: Die komplex konjugierte Zahl z ∗ der komplexen Zahl z erhält man durch Spiegelung
von z an der reellen Achse.

Beispiel:
z = 4 + 3i, (5.31)
z∗ = 4 − 3i. (5.32)
130 5 Komplexe Zahlen

Multipliziert man eine komplexe Zahl z mit ihrer komplex konjugierten Zahl z ∗ , erhält man:

zz ∗ = (x + iy)(x − iy) = x2 − (iy)2 = x2 + y 2 = |z|2 . (5.33)

Der Betrag |z| lässt sich also ausdrücken als



|z| = zz ∗. (5.34)

Wir können auch den Realteil und den Imaginärteil einer komplexen Zahl mit Hilfe der komplex
konjugierten Zahl ausdrücken. Indem wir z ∗ zu z addieren, erhalten wir

z + z ∗ = (x + iy) + (x − iy) = 2x, (5.35)

woraus folgt
1
(z + z ∗ ).
x= (5.36)
2
Um den Imaginärteil zu bestimmen, subtrahieren wir z ∗ von z,

z − z ∗ = (x + iy) − (x − iy) = 2iy, (5.37)

und finden dadurch


1
y= (z − z ∗ ). (5.38)
2i

Ferner folgt aus den Rechenregeln für die Addition komplexer Zahlen:

(z1 + z2 )∗ = z1∗ + z2∗ . (5.39)

5.2.4 Multiplikation

Zwei komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 werden miteinander multipliziert, indem
man die Rechenregeln der Algebra anwendet und dabei beachtet, dass i2 = −1:

z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2


= (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ). (5.40)

Beispiel:

(4 + 3i)(6 − 2i) = 24 − 8i + 18i − 6i2 = 24 + 6 + (18 − 8)i = 30 + 10i. (5.41)

Die Multiplikation zweier komplexer Zahlen ist kommutativ,

z1 z2 = z2 z1 , (5.42)

assoziativ,

z1 (z2 z3 ) = (z1 z2 )z3 = z1 z2 z3 , (5.43)

und distributiv,

z1 (z2 + z3 ) = z1 z2 + z1 z3 . (5.44)

Weiters gibt es für eine komplexe Zahl z ein neutrales Element 1=1+i0,

z · 1 = z, (5.45)
5 Komplexe Zahlen 131

und, falls z 6= 0, ein inverses Element zinv , sodass

z · zinv = 1. (5.46)

Für das inverse Element der Multiplikation gilt:


1 z∗ z∗
zinv = = ∗ = 2. (5.47)
z zz |z|
Da für alle komplexen Zahlen z gilt, dass z · 0 = 0, hat 0 kein inverses Element.

Durch Anwendung der Rechenregeln für die Multiplikation von komplexen Zahlen können wir uns
leicht klar machen, dass ferner gilt:

(z1 z2 )∗ = z1∗ z2∗ (5.48)

und somit auch

(z n )∗ = (z ∗ )n . (5.49)

Dieses Resultat erhalten wir durch n-fache Anwendung von Gleichung (5.48).

5.2.5 Division

Zur Division einer komplexen Zahl z1 = x1 + iy1 durch eine komplexe Zahl z2 = x2 + iy2 erweitern
wir zunächst den Bruch mit der komplex konjugierten Zahl des Nenners:
z1 z1 · z2∗ (x1 + iy1 )(x2 − iy2 )
= = . (5.50)
z2 z2 · z2∗ (x2 + iy2 )(x2 − iy2 )
Ausmultiplizieren und Zusammenfassen der reellen und imaginären Terme ergibt:
z1 x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
= . (5.51)
z2 (x22 + y22 )
Der Nenner ist jetzt reell und nur der Zähler bleibt komplex. Daher können wir einfach die Regeln
für die Multiplikation einer komplexen Zahl mit einer reellen Zahl anwenden und erhalten:
   
z1 x1 x2 + y1 y2 y1 x2 − x1 y2
= + i . (5.52)
z2 x22 + y22 x22 + y22

Der Nenner (x22 + y22 ) ist immer eine strikt positive Zahl (x22 + y22 > 0), außer für z2 = 0. In diesem
Fall können wir die Division nicht durchführen.

Beispiel:
(4 + 3i) (4 + 3i)(6 + 2i) 24 + 8i + 18i − 6 18 + 26i
= = =
(6 − 2i) (6 − 2i)(6 + 2i) 36 + 4 40
9 13
= + i. (5.53)
20 20

Beispiel:

z = 4 + 3i, (5.54)
1 1 (4 − 3i) 4 − 3i
zinv = = = =
z 4 + 3i (4 + 3i)(4 − 3i) 16 + 9
4 3
= − i. (5.55)
25 25
132 5 Komplexe Zahlen

Wir testen jetzt, ob zinv wirklich die zu z inverse komplexe Zahl ist:
 
4 3 1 1 2
z · zinv = (4 + 3i) − i = (4 + 3i)(4 − 3i) = (4 + 32 )
25 25 25 25
16 + 9
= = 1. (5.56)
25

5.3 Die Exponentialform von komplexen Zahlen

5.3.1 Eulersche Formel

Wir haben bis jetzt nur die Grundrechnungsarten für komplexe Zahlen besprochen. Aus diesen
Grundoperationen können wir auch komplexe Funktionen f (z) von komplexen Zahlen konstruieren.
Eine solche Funktion f (z) bildet eine komplexe Zahl z in die komplexe Zahl u = f (z) ab:
f
z−
→ u. (5.57)

Zum Beispiel können wir durch Hintereinanderausführen der Multiplikation ganzzahlige Potenzen
einer komplexen Zahl bilden:

z2 = z · z, (5.58)
3
z = z · z · z, (5.59)
..
. (5.60)
n
z · · · z} .
= z| · ·{z (5.61)
n-mal

Wie wir im Kapitel 10 sehen werden, lassen sich für reelle Zahlen ganz allgemeine Funktionen
als so genannte Potenzreihen ausdrücken. Zum Beispiel können wir die Exponentialfunktion ex
ausdrücken als:
x2 x3 x4
ex = 1 + x + + + + ..., (5.62)
2! 3! 4!
wobei die so genannte Fakultät n! einer natürlichen Zahl n definiert ist als das Produkt aller
natürlichen Zahlen von 1 bis n:

n! = n(n − 1)(n − 2) . . . 3 · 2 · 1 z.B. 4! = 4 · 3 · 2 · 1 = 24. (5.63)

Die Potenzreihe in Gleichung (5.62) hat unendlich viele Terme. Weil die Terme immer kleiner
werden, kann die Summe doch gegen den endlichen Wert ex streben. Ähnlich gilt für die beiden
Winkelfunktionen sin(x) und cos(x)

x3 x5 x7
sin(x) = x − + − + ..., (5.64)
3! 5! 7!
x2 x4 x6
cos(x) = 1 − + − + .... (5.65)
2! 4! 6!
Im Allgemeinen lässt sich jede Funktion f (x) als eine Potenzreihe ausdrücken

f (x) = a0 + a1 x + a2 x2 + a3 x3 + . . . (5.66)

und wir werden im Kapitel 10 sehen, wie wir auf systematische Weise die passenden Koeffizienten
ai ermitteln können.

Die Potenzreihen für die trigonometrischen Funktionen bestehen aus den selben Termen wie die
Exponentialfunktion (jedoch jeweils nicht aus allen). Dies lässt uns schon erahnen, dass es einen
5 Komplexe Zahlen 133

Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen geben


muss. Da für komplexe Zahlen ganzzahlige Potenzen, wie wir oben gesehen haben, definiert sind,
können wir versuchen, mit Hilfe der Potenzreihe (5.62) die Exponentialfunktion für komplexe
Zahlen zu erweitern. Betrachten wir zunächst was passiert, wenn wir in (5.62) die reelle Zahl x
durch eine imaginäre Zahl iϕ ersetzen (ϕ ist dabei reell):

(iϕ)2 (iϕ)3 (iϕ)4 (iϕ)5 (iϕ)6


eiϕ = 1 + (iϕ) + + + + + ... (5.67)
2! 3! 4! 5! 6!

Durch explizite Berechnung der Potenzen der imaginären Einheit erhalten wir:

ϕ2 iϕ3 ϕ4 iϕ5 ϕ6
eiϕ = 1 + iϕ − − + + − ... (5.68)
2! 3! 4! 5! 6!

Zusammenfassung der reellen und imaginären Terme ergibt:


   
iϕ ϕ2 ϕ4 ϕ6 ϕ3 ϕ5 ϕ7
e = 1− + − + ... +i ϕ − + − + ... . (5.69)
2! 4! 6! 3! 5! 7!
| {z } | {z }
=cos ϕ =sin ϕ

Durch Vergleich mit den Potenzreihen für sin(x) und cos(x) mit reellem Argument erhalten wir:

eiϕ = cos ϕ + i sin ϕ. (5.70)

Das ist die berühmte Eulersche Formel. Für den Spezialfall ϕ = π erhalten wir die schöne Formel

eiπ + 1 = 0, (5.71)

welche die wichtigen Zahlen e, i, π, 1 und 0 miteinander verknüpft. Eine weitere interessante Bezie-
hung ist:
 π π i 2
ii = (0 + i)i = cos + i sin = (eiπ/2 )i = ei π/2 = e−π/2 . (5.72)
2 2

Ein alternativer Beweis der Eulerschen Formel lässt sich mit Hilfe eines komplexen Integrals
konstruieren, wobei wir hier nur die Idee grob skizzieren. Wir betrachten dazu die komplexe Zahl

z = cos ϑ + i sin ϑ, (5.73)

welche einen Betrag von 1 besitzt, |z| = 1. Das Differential dieser Zahl ist:

dz = (− sin ϑdϑ + i cos ϑdϑ) = (− sin ϑ + i cos ϑ)dϑ


= i(cos ϑ + i sin ϑ)dϑ = izdϑ, (5.74)

sodass wir erhalten:

dz
= idϑ. (5.75)
z

Integration auf beiden Seiten liefert (wir lösen hier eigentlich eine Differentialgleichung):

ln z = iϑ (5.76)

und somit

z = eiϑ = cos ϑ + i sin ϑ. (5.77)


134 5 Komplexe Zahlen

5.3.2 Polardarstellung von komplexen Zahlen

Die Eulersche Formel ermöglicht die so genannte Polardarstellung der komplexen Zahlen. Wie
wir weiter oben gesehen haben (siehe Gleichung (5.17)), kann eine komplexe Zahl dargestellt werden
als

z = |z|(cos ϕ + i sin ϕ). (5.78)

Unter Verwendung der Eulerschen Formel ergibt sich daraus

z = |z|eiϕ . (5.79)

Das ist die Polardarstellung der komplexen Zahl z. In dieser Darstellung ist die komplex konjugierte
Zahl einfach gegeben durch:

z ∗ = |z|e−iϕ . (5.80)

Abbildung 5.7: Multiplikation zweier komplexer Zahlen in der Polardarstellung.

In der Polardarstellung können wir durch Rechenregeln für die Exponentialfunktion die Multipli-
kation und Division von komplexen Zahlen stark vereinfachen:

z1 z2 = (|z1 |eiϕ1 )(|z2 |eiϕ2 ) = |z1 ||z2 |ei(ϕ1 +ϕ2 ) . (5.81)

Anschaulich bedeutet das, dass man zwei komplexe Zahlen miteinander multipliziert, indem man
die zugehörigen Winkel ϕ1 und ϕ2 addiert und die Beträge |z1 | und |z2 | miteinander multipliziert
(siehe Abb. 5.7). Für die Division gilt:

z1 |z1 | i(ϕ1 −ϕ2 )


= e . (5.82)
z2 |z2 |

5.3.3 Umkehrung der Eulerschen Formel

Wir wollen nun die trigonometrischen Funktionen durch die Exponentialfunktion ausdrücken. Wenn
wir ϕ durch −ϕ ersetzen, erhalten wir die zu eiϕ konjugierte komplexe Zahl:
∗
e−iϕ = cos(−ϕ) + i sin(−ϕ) = cos ϕ − i sin ϕ = eiϕ . (5.83)
5 Komplexe Zahlen 135

Durch Addition der Eulerschen Formel für eiϕ und für die komplex konjugierte Zahl e−iϕ erhalten
wir:
eiϕ = cos ϕ + i sin ϕ (5.84)
−iϕ
e = cos ϕ − i sin ϕ (5.85)

eiϕ + e−iϕ = 2 cos ϕ, (5.86)


woraus folgt
eiϕ + e−iϕ
cos ϕ = . (5.87)
2

Subtrahieren wir hingegen e−iϕ von eiϕ erhalten wir:


eiϕ = cos ϕ + i sin ϕ (5.88)
−iϕ
−e = − cos ϕ + i sin ϕ (5.89)

eiϕ − e−iϕ = 2i sin ϕ, (5.90)


woraus sich
eiϕ − e−iϕ
sin ϕ = (5.91)
2i
ergibt. Vergleich der Gleichungen (5.87) und (5.91) mit den Gleichungen (1.98) und (1.97) zeigt
den Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen.

5.3.4 Additionstheoreme für Winkelfunktionen

Die Eulersche Formel können wir auch benutzen, um die Additionstheoreme für die Winkel-
funktionen herzuleiten. Aus der Eulerschen Formel folgt:
ei(ϕ1 +ϕ2 ) = cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ). (5.92)
Gleichzeitig gilt aber auch:
ei(ϕ1 +ϕ2 ) = eiϕ1 · eiϕ2 = (cos ϕ1 + i sin ϕ1 ) · (cos ϕ2 + i sin ϕ2 )
= cos ϕ1 cos ϕ2 + i cos ϕ1 sin ϕ2 + i cos ϕ2 sin ϕ1 − sin ϕ1 sin ϕ2
= cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i(cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 ). (5.93)
Der Vergleich der Real- und Imaginärteile der beiden obigen Formeln liefert:
cos(ϕ1 + ϕ2 ) = cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 , (5.94)
sin(ϕ1 + ϕ2 ) = cos ϕ1 sin ϕ2 + cos ϕ2 sin ϕ1 . (5.95)
Diese beiden Formeln sind die Additionstheoreme für die Sinus- und die Kosinusfunktion. Weitere
Beziehungen kann man durch analoge Berechnungen für Vielfache des Winkels ϕ ableiten.

5.3.5 Komplexe Zahlen als Exponenten

Bisher haben wir nur die rein imaginäre Zahl iϕ als Argument der Exponentialfunktion betrachtet.
Für ein komplexes Argument w = x + iy erhält man
z = ew = e(x+iy) = ex eiy . (5.96)
Der Vergleich mit
z = reiϕ (5.97)
w x w
zeigt, dass der Realteil x den Betrag |e | = e der komplexen Zahl z = e bestimmt und der
Imaginärteil y den Phasenwinkel ϕ = y.
136 5 Komplexe Zahlen

5.4 Potenzieren und komplexe Wurzeln

In der kartesischen Darstellung können wir Potenzen von komplexen Zahlen einfach durch Aus-
multiplizieren berechnen:

z2 = (x + iy)2 = x2 + 2ixy + (iy)2 = x2 − y 2 + 2ixy, (5.98)


z3 = (x + iy)3 = x3 + 3ix2 y + 3x(iy)2 + (iy)3 = x3 − 3xy 2 + i(3x2 y − y 3 ). (5.99)

Im Allgemeinen brauchen wir binomische Formeln (oder das Pascalsche Dreieck), um die Koeffizi-
enten zu bestimmen.

Das Pascalsche Dreieck

1 n=0
1 1 n=1
1 2 1 n=2
1 3 3 1 n=3 (5.100)
1 4 6 4 1 n=4
1 5 10 10 5 1 n=5
.. ..
. .

In der polaren Darstellung ist das Potenzieren einfacher:


n
z n = |z|eiϕ = |z|n einϕ , (5.101)

oder, in trigonometrischer Schreibweise,

z n = [|z|(cos ϕ + i sin ϕ)]n = |z|n [cos(nϕ) + i sin(nϕ)]. (5.102)

Zur Herleitung der letzten Gleichung haben wir die Tatsache benutzt, dass
n
eiϕ = einϕ , (5.103)

woraus

(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ) (5.104)

folgt. Dieses Ergebnis nennt man die Formel von Moivre. Die n-te Potenz einer komplexen Zahl
kann man also bestimmen, indem man den n-fachen Phasenwinkel ϕ nimmt und den Betrag z, der
eine reelle Zahl ist, zur n-ten Potenz nimmt.

Auch die Umkehrung der Potenz, die komplexe Wurzel, lässt sich in der polaren Darstellung
leicht bestimmen:
√ 1 1 1 iϕ p iϕ
n
z = z n = |z|eiϕ n = |z| n e n = n |z|e n . (5.105)

In der trigonometrischen Darstellung haben wir also:


p 1
h ϕ ϕi
n
|z|(cos ϕ + i sin ϕ) = |z| n cos + i sin . (5.106)
n n

Wenn wir jedoch berücksichtigen, dass eine komplexe


√ Zahl im Phasenwinkel ϕ mit einer Periode 2π
periodisch ist, kann man zusätzliche Wurzeln n z konstruieren. Da die trigonometrischen Funktio-
nen sin ϕ und cos ϕ periodisch mit Periode 2π sind, ist dies leicht einzusehen. Zum Phasenwinkel
5 Komplexe Zahlen 137

Abbildung 5.8: Wenn wir den zu z gehörigen Vektor um 2π (oder ein Vielfaches davon) drehen,
kehrt der Vektor zu seinem Ausgangspunkt zurück.

ϕ einer komplexen Zahl z = |z|eiϕ können wir deswegen ganzzahlige Vielfache von 2π addieren,
ohne die Zahl zu verändern

z = |z|eiϕ = |z|ei(ϕ+k2π) k = 0, ±1, ±2, . . . (5.107)

Anschaulich heißt das, dass wir zum Ausgangspunkt zurückkehren, wenn wir den zugehörigen
Ortsvektor um eine (oder mehrere) ganze Umdrehung(en) weiter drehen (siehe Abb. 5.8). Das
heißt aber auch, dass
√ p q (ϕ+k2π)
1
n
z = n |z|eiϕ = n |z|ei(ϕ+k2π) = |z| n ei n . (5.108)

Daraus folgt, dass für alle k = 0, ±1, ±2, . . . die Zahl


1 (ϕ+k2π) 1 iϕ i2πk
|z| n ei n = |z| n e n + n (5.109)

eine n-te Wurzel von z ist. Wie viele verschiedene gibt es nun von diesen Zahlen? Für k = 0
erhalten wir die Wurzel
1 iϕ
z0 = |z| n e n (5.110)

und für k = 1 die Wurzel


1 iϕ i2π
z1 = |z| n e n + n . (5.111)

Das heißt, der Phasenwinkel von z1 ist um n größer als der von z0 :


ϕ1 = ϕ0 + . (5.112)
n
Wir erhalten also z1 aus z0 , indem wir den zugehörigen Vektor in der Gaußschen Zahlenebene um
ein n-tel von 2π weiter drehen. Die nächste Lösung
1 iϕ i2·2π
z2 = |z| n e n + n (5.113)

hat einen Phasenwinkel, der um 2π/n größer ist als der von z1 . Auf ähnliche Weise erhalten wir
z3 aus z2 . Nachdem wir den Zeiger n-mal um 2π/n weiter gedreht haben, sind wir wieder bei der
ursprünglichen Wurzel z0 angelangt. Es gibt also insgesamt n n-te Wurzeln einer komplexen Zahl
z:
1 ϕ 2π
zk = |z| n ei( n +k n ) k = 0, . . . , n − 1. (5.114)
138 5 Komplexe Zahlen

1
Abbildung 5.9: Die n-ten Wurzeln der komplexen Zahl z liegen auf einem Kreis mit Radius |z| n
in der Gaußschen Zahlenebene und bilden ein regelmäßiges n-Eck.

Anschaulich liegen diese n-ten Wurzeln in der Gaußschen Zahlenebene auf einem Kreis mit Radius
1
|z| n und bilden ein regelmäßiges n-Eck (siehe Abb. 5.9).

Beispiel:

Wir wollen die Wurzel



6
3 − 8i (5.115)

berechnen. Dazu drücken wir die Zahl z = 3 − 8i zunächst in Polarform aus. Da


 
p √ 8
2 2
|z| = 3 + 8 = 73 und ϕ = arctan − = −1.21, (5.116)
3

haben wir
√ −i1.21
z= 73e . (5.117)

Die komplexen 6-ten Wurzeln von 3 − 8i sind somit die 6 Zahlen


1 2π
zk = 73 12 ei(−1.21+ 6 k) mit k = 0, 1, . . . , 5. (5.118)
1
Diese Zahlen bilden ein Sechseck mit Kantenlänge 73 12 in der Gaußschen Zahlenebene.

Beispiel:

Zu berechnen sind die dritten Wurzeln von 1:



3
1. (5.119)

Im Allgemeinen sind die n n-ten Wurzeln der Zahl 1 gegeben durch:

zk = 1eik2π/n , (5.120)
5 Komplexe Zahlen 139

wobei k von 0 bis n − 1 läuft. Die drei dritten Wurzeln von 1 sind daher:
z0 = 1, (5.121)

1 3
z1 = ei2π/3 =− + i, (5.122)
2 √2
1 3
z2 = ei4π/3 =− − i. (5.123)
2 2

5.5 Darstellung von Kurven mit komplexen Zahlen

Kurven in der Gaußschen Zahlenebene können durch Gleichungen der Form


f (z) = 0 (5.124)
dargestellt werden. Dabei ist z = x + iy eine komplexe Zahl und f (z) eine Funktion dieser Zahl.
Beispielsweise ist |z| = 1 die Gleichung für einen Kreise mit Radius 1 und Mittelpunkt im Null-
punkt. Die Gleichung |z − 1| = 1 stellt einen Kreis mit Radius 1 dar, dessen Mittelpunkt bei x = 1
auf der reellen Achse liegt.

Ein komplizierteres Beispiel ist die Gleichung für eine Hyperbel in der komplexen Ebene:
||z + 1| − |z − 1|| = 1 (5.125)
Hier ist |z − 1| der Abstand des Punktes (1, 0) von z und |z + 1| ist der Abstand des Punktes
(−1, 0) von z. Die Gleichung (5.125) wird also von allen Punkten erfüllt, für die die Differenz der
Entfernung von den Punkten (1, 0) und (−1, 0) konstant gleich 1 ist. Diese Forderung definiert eine
Hyperbel.

Abbildung 5.10: Durch Verknüpfung der Abstände |z + 1| und |z − 1| lässt sich eine Hyperbel
definieren.

Analytisch folgt dies aus folgender Berechnung: Für z = x + iy ist z − 1 = (x − 1) + iy und


z + 1 = (x + 1) + iy. Somit haben wir
p p
|z + 1| = (x + 1)2 + y 2 und |z − 1| = (x − 1)2 + y 2 (5.126)
und folglich
p p
(x + 1)2 + y 2 − (x − 1)2 + y 2 = ±1. (5.127)
Umformen und anschließendes Quadrieren liefert
p 2  p 2
(x + 1)2 + y 2 = ±1 + (x − 1)2 + y 2 (5.128)
p
x2 + 2x + 1 + y 2
2 = 1 ± 2 (x − 1)2 + y 2 + (x2 − 2x + 1) + y (5.129)
140 5 Komplexe Zahlen

p
4x − 1 = ±2 (x − 1)2 + y 2 (5.130)
2 2 2
16x − 8x + 1 = 4((x − 2x + 1) + y ) (5.131)
16x2+ 1
−8x = 4x2  + 4 + 4y 2
−8x (5.132)
12x2 − 4y 2 = 3 (5.133)
4y 2 = 12x2 − 3 (5.134)
3
y2 = 3x2 − (5.135)
r 4
3
y = ± 3x2 − . (5.136)
4
Dies ist die Gleichung
√ einer Hyperbel, die sich asymptotisch zwei Geraden durch den Ursprung mit

Steigungen 3 und − 3 annähert (siehe Abb. 5.11).

q
Abbildung 5.11: Die Hyperbel y = ± 3x2 − 34 .

Beispiel:

Ein weiteres Beispiel einer mit Hilfe von komplexen Zahlen darstellbare Kurve ist die Ellipse

|z − 1| + |z + 1| = 4. (5.137)
Kapitel 6

Fehlerrechnung

6.1 Systematische und statistische Fehler

Im Experiment gemessene (oder in einer Computersimulation ermittelte) physikalische Größen


sind immer mit einem gewissen Fehler behaftet. (Um den negativen Beigeschmack des Wortes
Fehler zu vermeiden, sprechen wir auch oft von einer Abweichung oder einer Messabweichung.)
Zur Beurteilung von Messwerten ist es sehr wichtig zu wissen, wie groß diese Fehler sind. Die
Abschätzung von Fehlern ist Aufgabe der Fehlerrechnung.

Streng genommen ist die Angabe eines Messwertes ohne Angabe eines Messfehlers sinnlos. Gra-
phisch stellen wir Fehler mit Hilfe von Fehlerbalken dar (siehe Abb. 6.1).

Abbildung 6.1: Graphisch stellen wir Fehler mit Hilfe so genannter Fehlerbalken dar. Die Höhe
des Fehlerbalkens entspricht der erwarteten Größe des Fehlers. In diesem Beispiel wurde für ver-
schiedene Werte von x die Größe y experimentell bestimmt. Somit ist y fehlerbehaftet. Aus den
Messdaten können wir in diesem Beispiel lediglich schließen, dass die wahren Werte von y mit
großer Wahrscheinlichkeit irgendwo innerhalb der Fehlerbalken liegen.

Üblicherweise geben wir Messwerte in der folgenden Form an:

A ± ε. (6.1)

Hier ist A die im Experiment (oder in der Simulation) ermittelte Messgröße und ε ist der zugehörige
Messfehler. Die Schreibweise ±ε deutet an, dass die Abweichung ε sowohl positiv als auch negativ
sein kann. Zum Beispiel bedeutet

v = (600 ± 30) m/s, (6.2)

dass die gemessene Geschwindigkeit von 600 m/s mit einem wahrscheinlichen Fehler von etwa
30 m/s behaftet ist. Das heißt, der wahre Wert der Geschwindigkeit v liegt wahrscheinlich im

141
142 6 Fehlerrechnung

Intervall zwischen 570 m/s und 630 m/s. Was in diesem Zusammenhang “wahrscheinlich” heißt,
werden wir später genauer definieren. Übrigens sind Angaben wie
v = (600.125 ± 30)m/s (6.3)
nicht sehr sinnvoll, da der Messwert 600.125 mit einer viel höheren Genauigkeit angegeben wird,
als in Anbetracht des Fehlers von ± 30 m/s möglich ist. Üblicherweise sollte die letzte signifikante
Stelle in der Angabe des Messwerts von der Größenordnung des Messfehlers sein.

Fehler müssen auch berücksichtigt werden, wenn wir unterscheiden wollen, ob zwei Größen gleich
sind oder sich unterscheiden. Sind z.B. 71.5 ± 0.5 und 71.9 ± 0.3 gleich oder verschieden? Da
die Fehlerbereiche der beiden Messwerte überlappen, sind die beiden Werte nicht voneinander zu
unterscheiden. Dasselbe gilt für 60±8 und 52±7 . Hingegen sind 2.3751±0.0003 und 2.3758±0.0001
eindeutig voneinander verschieden.

Fehler in den Messwerten können im Wesentlichen zwei Ursachen haben, die eine unterschiedliche
Behandlung erfordern. Man unterscheidet zwischen systematischen und statistischen Fehlern.

Systematische Fehler sind Abweichungen, die durch Fehler in den Messinstrumenten oder im
Messverfahren selbst entstehen, z. B. durch falsche Kalibrierung der Apparatur oder durch Ände-
rung der Messbedingungen während der Messung. Solche Fehler beeinflussen die Messgröße meist
in einer bestimmten Richtung. In Computersimulationen entstehen systematische Fehler oft durch
die Anwendung von Näherungen in den zugrunde liegenden theoretischen Ausdrücken oder durch
Verwendung zu kleiner Systemgrößen. Das Erkennen und Minimieren von systematischen Fehlern
ist ein essentieller Bestandteil eines jeden Experiments.

Statistische Fehler (oder zufällige Fehler) haben ihre Ursache in verschiedenen Störeinflüssen
während der Messung, die nur schwer beeinflusst werden können. Auch wenn systematische Fehler
im Experiment weitgehend eliminiert worden sind, wird die mehrmalige Messung einer bestimm-
ten Größe nicht immer dasselbe Ergebnis liefern. Diese Abweichungen, die wir statistische Fehler
nennen, verändern den Messwert sowohl in negativer als auch in positiver Richtung.

Anschaulich können wir uns den Unterschied zwischen systematischen und statistischen Fehlern
anhand folgender Beispiele klarmachen (siehe Abb. 6.2). Wir stellen uns vor, dass wir in einer
Schießübung mehrmals auf eine Zielscheibe schießen. Dabei kann es zu folgenden Ergebnissen
kommen:

(a) Die Einschüsse liegen eng beisammen, d.h. der statistische Fehler ist klein. Die Punkte liegen
auch alle in der Nähe des Zentrums. Somit ist auch der systematische Fehler klein.
(b) Hier liegen die Punkte eng beisammen, was bedeutet, dass der statistische Fehler klein ist.
Der systematische Fehler ist groß, da die Punkte weit weg vom Zentrum liegen.
(c) Der systematische Fehler ist klein, der statistische Fehler ist groß.
(d) Beide Fehler sind groß.

Im Folgenden wollen wir uns nun hauptsächlich mit statistischen Fehlern beschäftigen. Syste-
matische Fehler, die schwieriger zu erkennen sind, werden wir nur im Zusammenhang mit der
Fehlerfortpflanzung besprechen.

Aufgaben der Fehlerrechnung:

• Wir wollen von den Messergebnissen auf den wahren Wert der gemessenen Größe schließen.
• Wir wollen die Zuverlässigkeit der Messung abschätzen.
6 Fehlerrechnung 143

Abbildung 6.2: (a) statistischer Fehler klein, systematischer Fehler klein; (b) statistischer Fehler
klein, systematischer Fehler groß; (c) statistischer Fehler groß, systematischer Fehler klein; (d)
statistischer Fehler groß, systematischer Fehler groß.

6.2 Mittelwert und Varianz

Stellen wir uns vor, dass wir die Fallbeschleunigung aus einem Fallexperiment ermitteln wollen.
Dazu wird die Fallzeit t einer Kugel mit einer Stoppuhr für eine gewisse Fallstrecke h bestimmt.
Aus h = 21 gt2 können wir dann die Fallbeschleunigung g = 2h
t2 bestimmen.

Abbildung 6.3: In einem Fallexperiment messen wir die Zeit t, die ein im Schwerefeld fallender
Körper benötigt, um die Strecke h zurückzulegen.

Um die Zuverlässigkeit der Messung zu verbessern, wiederholen wir die Messung N mal in Form
einer Messreihe. Die erhaltenen Messwerte xi nennen wir eine Stichprobe aus der Menge aller
möglichen Messungen. Da jede Messung fehlerbehaftet ist, unterscheiden sich die N Messungen
einer Stichprobe. Als beste Schätzung des unbekannten “wahren” Wertes betrachten wir den arith-
144 6 Fehlerrechnung

metischen Mittelwert der N Messwerte xi :


N
1 X
x= xi Stichprobe = {x1 , . . . , xN }. (6.4)
N i=1

Dieser Definition liegt der Gedanke zugrunde, dass statistische Abweichungen nach oben und un-
ten gleich wahrscheinlich sind und sich im Mittel deshalb ausgleichen. Je größer unsere Stichprobe
ist, umso genauer können wir durch den Mittelwert x den wahren Wert der Messgröße abschätzen.
Wir werden dies später quantitativ untersuchen.

Abbildung 6.4: (a) Kleine Streuung der Daten um den Mittelwert; (b) große Streuung der Daten
um den Mittelwert.

Zusätzlich zum Mittelwert ist es auch nützlich zu wissen, wie stark im Durchschnitt die Messwerte
vom Mittelwert abweichen. Wir könnten nun versuchen, die mittlere Abweichung der Messwerte
vom Mittelwert zu berechnen:
N N
! N
!
1 X 1 X 1 X
(xi − x) = xi − x
N i=1 N i=1 N i=1
N
!
1 X N
= xi − x = 0. (6.5)
N i=1 N
|{z}
| {z } =x
=x

Dieser Mittelwert verschwindet jedoch, weil sich die positiven und negativen Abweichungen vom
Mittelwert genau kompensieren.

Ein besseres Maß für die statistische Streuung der Messwerte ist die Varianz s2 , bei der statt der
Abweichungen die Abweichungsquadrate summiert werden:

N
1 X
s2 = (xi − x)2 . (6.6)
N i=1
| {z }
Summe der Abweichungsquadrate

Hier ist der Beitrag jedes Messwertes zur Varianz wegen des Quadrats positiv und es kommt zu
keiner Kompensation der positiven und negativen Abweichungen. Die Varianz s2 ist das mittlere
Abweichungsquadrat der Messwerte xi vom Mittelwert x.

Die Varianz hat die Dimension des Quadrats der Dimension der gemessenen Größe. Um ein Ab-
weichungsmaß mit der gleichen Dimension wie die Messgröße zu erhalten, ziehen wir die Wurzel
aus der Varianz:
v
u N
u1 X
s=t (xi − x)2 . (6.7)
N i=1

Man nennt s die Standardabweichung.


6 Fehlerrechnung 145

Wir können uns jetzt die Frage stellen, ob wir nicht einen vom arithmetischen Mittelwert verschie-
denen Bezugswert x̃ wählen können, sodass die für diesen Wert definierte Varianz
N
1 X
s2 = (xi − x̃)2 (6.8)
N i=1

kleiner wird als die bezüglich des arithmetischen Mittelwerts x.

Um diese Frage zu beantworten, minimieren wir s2 bezüglich x̃, indem wir s2 nach x̃ ableiten und
die Ableitung gleich Null setzen:

d(s2 ) 1 X !
= 2(xi − x̃)(−1) = 0. (6.9)
dx̃ N
Daraus folgt
N
X N
X N
X
(xi − x̃) = 0 ⇒ xi = x̃ = N x̃ (6.10)
i=1 i=1 i=1

und somit
N
1 X
x̃ = xi . (6.11)
N i=1

Mit anderen Worten bedeutet dies, dass der arithmetische Mittelwert x einer Stichprobe ihre
Varianz und somit auch ihre Standardabweichung minimiert.

6.3 Verteilungen und Histogramme

6.3.1 Grundlagen

Eine Stichprobe bestehend aus N Messwerten einer bestimmten Größe kann als zufällige Aus-
wahl aus der Menge aller möglichen Messwerte betrachtet werden. Diese Menge nennen wir die
Grundgesamtheit. Nun kann es sein, dass nicht alle möglichen Messwerte der Grundgesamtheit
gleich häufig vorkommen. Kleine Abweichungen vom Mittelwert sind im Allgemeinen weitaus häufi-
ger als große. Wir berücksichtigen diese Tatsache, indem wir die Grundgesamtheit statistisch mit
Hilfe von so genannten Wahrscheinlichkeitsverteilungen und Wahrscheinlichkeitsdichten
beschreiben.

Abbildung 6.5: Zur Bestimmung der Häufigkeit unterschiedlicher Messfehler teilen wir das Intervall
[a, b] in kleine Bereiche und zählen, wie viele Messwerte in jedes Intervall fallen.

Dazu verfahren wir folgendermaßen. Stellen wir uns vor, dass wir eine Größe x N mal messen und
dadurch die Messwerte xi erhalten. Wir teilen nun die x-Achse, auf die wir die Messwerte auftragen
können, in M kleine Intervalle (oder Zellen) der Breite ∆x ein und nummerieren die Intervalle mit
dem Index j (siehe Abb. 6.5). Wir nehmen weiters an, dass alle Messwerte xi im Bereich [a, b]
liegen. (Diese Einschränkung kann leicht aufgehoben werden.) Das Intervall j wird von den Werten
a + (j − 1)∆x und a + j∆x begrenzt, wobei a + M ∆x = b.
146 6 Fehlerrechnung

Wir zählen jetzt, wie viele der Messwerte in jedem der Intervalle liegen und bezeichnen die Zahl der
Messwerte im Intervall j mit n(j). Da die Gesamtanzahl der Messungen N ist, muss die Summation
von n(j) über alle Zellen
M
X
n(j) = N (6.12)
j=1

ergeben. Wenn wir n(j) graphisch darstellen, erhalten wir ein Histogramm (siehe Abb. 6.6).
Messwerte aus einem Intervall mit großem n(j) kommen häufig vor, solche mit kleinem n(j) weniger
häufig.

Abbildung 6.6: Ein Histogramm erhält man, wenn man die Anzahl n(j) der im Intervall j gezählten
Messwerte graphisch darstellt.

Indem wir die Zahlen n(j) durch die Gesamtzahl N der Messwerte dividieren,

n(j)
h(j) = , (6.13)
N
erhalten wir ein normiertes Histogramm mit den Eigenschaften
M M
X X n(j) N
h(j) = = = 1. (6.14)
j=1 j=1
N N

Die Zahl h(j) entspricht für große N der Wahrscheinlichkeit, dass ein Messwert xi im Intervall j
(also zwischen a + (j − 1)∆x und a + j∆x) liegt.

Im Grenzwert sehr kleiner Intervallgrößen ∆x können wir eine kontinuierliche Funktion f (x), die so
genannte Verteilungsdichte (oder Wahrscheinlichkeitsdichte), definieren, die in diesem Fall
die Rolle des Histogramms übernimmt. Dazu betrachten wir den Grenzübergang

n(x)
f (x) = lim lim , (6.15)
∆x→0 N →∞ N ∆x
wobei n(x) die Anzahl der Messwerte im Intervall [x, x + ∆x] ist. Hier wird durch den Grenzüber-
gang ∆x → 0 das Verhältnis n(x)/N immer kleiner (da das Intervall schrumpft). Da ∆x in der
obigen Gleichung jedoch auch im Nenner auftritt, konvergiert n(x)/N ∆x gegen einen endlichen
Wert. Die Wahrscheinlichkeitsdichte f (x) hat die Dimension [1/x].

Nach dieser Definition ist

df = f (x)dx (6.16)
6 Fehlerrechnung 147

der infinitesimale Bruchteil der Messungen, die im infinitesimalen Intervall [x, x+dx] liegen. f (x)dx
kann auch als die Wahrscheinlichkeit, einen Messwert im Intervall [x, x+dx] zu finden, interpretiert
werden. Aus der Normierung von h(j) = n(j)/N folgt, dass das Integral über die Wahrscheinlich-
keitsdichte gleich 1 ist:

Zb
f (x)dx = 1. (6.17)
a

Dies entspricht der Tatsache, dass ein Messwert irgendwo zwischen a und b liegen muss. Man
bezeichnet die Wahrscheinlichkeitsdichte deshalb als normiert. Im Gegensatz zum Histogramm
ist die Wahrscheinlichkeitsdichte eine kontinuierliche Funktion.

Abbildung 6.7: Die Warscheinlichkeitsdichte f (x) ist eine kontinuierliche Funktion, die die infini-
tesimale Wahrscheinlichkeit df = f (x)dx angibt, dass ein Messwert im infinitesimalen Intervall
[x, x + dx] liegt.

Natürlich besteht keine Notwendigkeit, uns auf ein endliches Intervall [a, b] zu beschränken und
wir können ohne weiteres den gesamten Zahlenbereich von −∞ bis +∞ betrachten. (Falls die
Wahrscheinlichkeitsdichte f (x) auf ein Intervall [a, b] beschränkt ist, kann sie auf die gesamte
Zahlengerade erweitert werden, indem man

f (x) = 0 für x < a und x > b (6.18)

setzt.)

Abbildung 6.8: Die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) dafür, einen Messwert im Intervall [x1 , x2 ]
zu finden, ist gleich der Fläche unter der Wahrscheinlichkeitsdichte f (x) zwischen x1 und x2 (schraf-
fierter Bereich).

Aus der Wahrscheinlichkeitsdichte f (x) können wir die Wahrscheinlichkeit P (x1 ≤ x ≤ x2 ) be-
148 6 Fehlerrechnung

rechnen, dass sich ein Messwert zwischen zwei beliebigen Grenzen x1 und x2 befindet:
Zx2
P (x1 ≤ x ≤ x2 ) = f (x)dx. (6.19)
x1

Wenn wir in diesem Ausdruck x1 = −∞ als untere Schranke wählen, erhalten wir die so genannte
Wahrscheinlichkeitsverteilung (oder Wahrscheinlichkeitsfunktion oder Verteilungsfunk-
tion oder Verteilung):
Zx
F (x) = f (u)du. (6.20)
−∞

F (x) ist die Wahrscheinlichkeit, einen Messwert zu finden, der kleiner oder gleich x ist.

Beispiel:

Die Maxwellsche Verteilung beschreibt die Wahrscheinlichkeitsdichte der Geschwindigkeitskom-


ponenten eines einzelnen Teilchens in einem klassischen Vielteilchensystem mit Temperatur T . Für
die x-Komponente vx der Geschwindigkeit lautet sie
r
m 1 2
f (vx ) = e− 2 βmvx β = 1/kB T. (6.21)
2πkB T
Die Geschwindigkeitskomponenten in y- und in z-Richtung haben identische Wahrscheinlichkeits-
dichten. Hier ist kB die nach dem österreichischen Physiker Ludwig Boltzmann (1844-1906) be-
nannte Boltzmannkonstante und β = 1/kB T . Diese Wahrscheinlichkeitsdichte ist normiert, das
heißt
Z
f (vx )dvx = 1. (6.22)

Allgemeine Eigenschaften der Wahrscheinlichkeitsdichte f (x) und der Wahrscheinlichkeitsvertei-


lung F (x) sind:

1. f (x) ≥ 0.
2. f (x) ist normiert, das heißt:
Z∞
f (x)dx = 1. (6.23)
−∞

3. F (x) ist monoton wachsend und eine Stammfunktion von f (x) (siehe Abb. 6.9):
F ′ (x) = f (x). (6.24)

4. F (−∞) = 0 und F (∞) = 1.


5. Die Wahrscheinlichkeit, dass die Variable x einen Wert im Intervall zwischen a und b an-
nimmt, ist:
Zb
P (a ≤ x ≤ b) = F (b) − F (a) = f (x)dx. (6.25)
a

(Genau genommen ist F (x) so definiert, dass der Wert a ausgeschlossen und der Wert b
eingeschlossen ist. Für stetige Wahrscheinlichkeitsverteilungen macht dies jedoch keinen Un-
terschied.)
6 Fehlerrechnung 149

Abbildung 6.9: Die Wahrscheinlichkeitsdichte f (x) ist die erste Ableitung der Wahrscheinlichkeits-
verteilung F (x).

6.3.2 Momente einer Verteilung, Erwartungswert

Mittelwert

Der Begriff des Mittelwerts und der Varianz lassen sich auch auf kontinuierliche Verteilungsdichten
f (x) übertragen. Betrachten wir eine Grundgesamtheit, die durch die Verteilung f (x) beschrieben
wird. Wir führen zunächst N mal eine Messung aus und erhalten die Messwerte xi . Der Mittelwert
dieser Messwerte ist
N
1 X
x= xi . (6.26)
N i=1

Wir teilen die x-Achse nun wieder in M kleine Intervalle der Breite ∆x ein und nummerieren diese
Zellen mit dem Index j. Wir zählen die Messwerte in jedem Intervall und bezeichnen diese Zahl
mit n(j). Außerdem bezeichnen wir den Mittelpunkt jeder Zelle mit x(j).

Abbildung 6.10: Bei der Berechnung von Mittelwerten aus einem Histogramm nähern wir jeden
x-Wert im Intervall j durch x(j) an.

Wenn ∆x klein ist, können wir jeden Messwert im Intervall j durch den Wert x(j) annähern. Mit
dieser Näherung können wir die Summe in Gleichung (6.26) über alle Messwerte in eine Summe
über alle M Intervalle (Zellen) umschreiben:
N M
1 X 1 X
x= xi ≈ n(j)x(j). (6.27)
N i=1 N j=1
150 6 Fehlerrechnung

Die zweite Summe geht aus der ersten Summe einfach durch Zusammenfassen der Messwerte in
der jeweils gleichen Zelle hervor. Durch Multiplikation mit ∆x und gleichzeitiger Division durch
∆x erhalten wir
M
X n(j)x(j)
x≈ ∆x. (6.28)
j=1
N ∆x

Führen wir die Grenzwerte ∆x → 0 und N → ∞ aus, verwandelt sich diese Summe in ein Integral:
Z∞
x= xf (x)dx, (6.29)
−∞

wobei wir die Definition (6.15) benutzt und den Wertebereich auf −∞ und ∞ ausgedehnt haben.
Für den Mittelwert einer Verteilungsdichte verwenden wir oft den Buchstaben µ, um ihn vom
Mittelwert x einer Stichprobe zu unterscheiden. µ ist der Mittelwert der Grundgesamtheit. (Im
Allgemeinen verwenden wir griechische Buchstaben für Eigenschaften der Grundgesamtheit und
lateinische Buchstaben für Eigenschaften von Stichproben.)

Erwartungswert

Der Mittelwert µ wird auch oft Erwartungswert E(x) von x genannt:


Z∞
E(x) = xf (x)dx = µ. (6.30)
−∞

Im Allgemeinen ist der Erwartungswert einer Größe g(x), die eine Funktion der Variablen x mit
Verteilungsdichte f (x) ist, gegeben durch:
Z∞
E[g(x)] = g(x)f (x)dx. (6.31)
−∞

Den Erwartungswert bezeichnen wir oft auch mit spitzen Klammern:

E[g(x)] = hg(x)i. (6.32)

Aus der Definition des Erwartungswertes folgt, dass der Erwartungswert einer Summe gleich der
Summe der Erwartungswerte ist:

E[g(x) + h(x)] = E[g(x)] + E[h(x)]. (6.33)

Ferner kann eine reelle Zahl α vor den Erwartungswert gezogen werden:

E[αg(x)] = αE[g(x)]. (6.34)

Varianz

Analog zum Mittelwert µ können wir für die Verteilungsdichte f (x) auch eine Varianz definieren:
Z∞
2
σ = (x − µ)2 f (x)dx. (6.35)
−∞

Wir verwenden oft auch die Schreibweise:

Var(x) = σ 2 . (6.36)
6 Fehlerrechnung 151

Die Varianz ist die mittlere quadratische Abweichung der Messwerte x vom Mittelwert µ. In anderen
Worten, die Varianz ist der Erwartungswert von (x − µ)2 , also σ 2 = E[(x − µ)2 ]. Die Wurzel aus
der Varianz ist die Standardabweichung σ.

Durch Ausmultiplizieren des Quadrats im Integranden und Verwendung obiger Rechenregeln er-
halten wir aus Gleichung (6.35) den Ausdruck
σ2 = E[(x − µ)2 ] =

= E x2 − 2E(xµ) + µ2

= E x2 − 2µ E(x) +µ2
| {z }

2
 
= E x − µ = E x2 − (E(x))2 = hx2 i − hxi2 .
2
(6.37)

Momente

Der hier auftretende Erwartungswert E(x2 ) wird das 2. Moment der Verteilungsdichte f (x)
genannt. Der Mittelwert E(x) ist das 1. Moment von f (x). Im Allgemeinen ist das n-te Moment
einer Verteilung f (x) definiert als:
Z∞
n n
E (x ) = hx i = xn f (x)dx. (6.38)
−∞

6.3.3 x und s2 als Schätzer für µ und σ 2

Die Kenngrößen µ und σ 2 der Grundgesamtheit sind meist unbekannt und können nur aufgrund
der Stichprobendaten geschätzt werden. So können wir etwa x als einen Schätzer für µ verwenden.
Das ist unter anderem dadurch gerechtfertigt, dass der Erwartungswert von x gleich µ ist
" #
1 X 1 X Nµ
E(x) = E xi = E(xi ) = = µ. (6.39)
N i N i N

Etwas anders verhält es sich mit der Varianz s2 , die wir als Schätzer für σ 2 verwenden könnten.
Der Erwartungswert der Varianz ist
" #
 1 X 1 X  
E s2 = E (xi − x)2 = E (xi − x)2
N i N i
( )
1 X 2 2

= E xi − 2xi x + x
N i
( )
1 X  X X 
= E x2i − 2 E(xi x) + E x2
N i i i
   !
1   X 1 X X 1 X 1 X 
= N E x2 − 2 E xi xj  + E xk · xl
N i
N j i
N N 
k l
 
1   2 X 1 XX 
= N E x2 − E (xi xj ) + 2 E (xk xl ) . (6.40)
N N i,j
N i

k,l

Der Erwartungswert E(xi xj ) des Produkts xi xj hängt davon ab, ob die beiden Indizes i und j
gleich sind. Für i = j gilt
E(xi xj ) = E(x2i ) = E(x2 ). (6.41)
152 6 Fehlerrechnung

Für i 6= j können wir im Falle statistisch unabhängiger xi schreiben

E(xi xj ) = E (xi ) E (xj ) = E(x)2 . (6.42)

(Zur Definition des Erwartungswertes E(xi xj ) ist es notwendig, Wahrscheinlichkeitsdichten zu


betrachten, die von zwei Variablen abhängen. Dazu verweisen wir die Leser an die einschlägige
Literatur). Durch Verwendung dieser Ausdrücke können wir vereinfachen:
  
 1   2  X  X
E s2 = N E x2 − E x2i + E (xi ) E (xj )
N  N i i6=j
 
1 X X  X 
+ 2  E x2k + E (xk ) E (xl )
N i 
k k6=l
  (6.43)
1 2
 2 2
 2
 1 2
 2

= NE x − N E x + N (N − 1)µ + N E x + N (N − 1)µ
N N N
1  
= (N − 1)E x2 − (N − 1)µ2
N
N −1  N −1 2
= E x2 − µ2 = σ
N N
und somit erhalten wir
N 
σ2 = E s2 . (6.44)
N −1
(Das selbe Ergebnis erhält man auch, wenn man den Erwartungswert E[(as2 − σ 2 )] betrachtet
und jene Konstante a bestimmt, für die dieser Erwartungswert minimal ist.) Das heißt, der Er-
wartungswert des Schätzers ist um einen Faktor NN−1 kleiner als die Varianz der Grundgesamtheit.
Für große N ist das irrelevant. Damit der Erwartungswert der Stichprobenvarianz gleich σ 2 ist,
definiert man die Varianz oft als
N
1 X
s2 = (xi − x)2 . (6.45)
N − 1 i=1

6.3.4 Fehler des Mittelwerts

Wie wir oben besprochen haben, betrachten wir den Mittelwert x einer Stichprobe von Messungen
als Schätzwert für den “wahren” Mittelwert µ, den Mittelwert der zur Grundgesamtheit gehörenden
Verteilungsdichte f (x). Da die Stichprobe jedoch nur endlich viele Werte beinhaltet, machen wir
bei so einer Schätzung immer einen gewissen Fehler. Wir wollen nun diesen Fehler abschätzen.

Abbildung 6.11: Da jede Stichprobe aus N unterschiedlichen Werten besteht, unterscheiden sich
die zugehörigen Mittelwerte xk .

Zu diesem Zwecke betrachten wir mehrere Stichproben von jeweils gleicher Größe N (das heißt,
jede Stichprobe besteht aus N Messwerten) (siehe Abb. 6.11). Jede dieser Stichproben liefert
6 Fehlerrechnung 153

einen unterschiedlichen Mittelwert xk . Für L Stichproben erhalten wir L verschiedene Mittelwerte


xk . Die durchschnittliche quadratische Abweichung dieser Mittelwerte von µ, dem Mittelwert der
Grundgesamtheit, ist:
L
1X
(xk − µ)2 . (6.46)
L
k=1

Für sehr große L wird dieser Ausdruck zu


 
σx2 = E (x − µ)2 . (6.47)
Dies ist die Varianz der aus den Stichproben der Größe N ermittelten Mittelwerte x. Die Varianz
beschreibt die Streuung der Mittelwerte, die man aus einer Vielzahl verschiedener Stichproben
erhält.

Einige algebraische Umformungen liefern:


  
σx2 = E (x − µ)2 = E x2 − 2E(xµ) + E µ2
 
X 1
= E xi xj  − 2µ E(x) +µ2
N2
i,j
| {z }

 
1 X 1 X  X
= E (xi xj ) − µ2 = 2  E x2i + E(xi )E(xj ) − µ2
N 2 i,j N i i6=j
1   
= 2
N E x2 + N (N − 1)µ2 − µ2
N
1   
= E x2 − µ2 . (6.48)
N

Wegen E x2 − µ2 = σ 2 erhalten wir also
1 2
σx2 = σ (6.49)
N
oder
σ
σx = √ , (6.50)
N
wobei σ die Standardabweichung der Grundgesamtheit ist.

Das heißt, dass die Standardabweichung des Mittelwerts umso kleiner ist, je größer die Stichprobe
ist. Durch Erhöhung der Anzahl N der unabhängigen Messungen können wir die Genauigkeit der
Messung steigern. Um den Fehler σx im Mittelwert zu halbieren, müssen wir gemäß Gleichung
(6.50) den Umfang der Stichprobe vervierfachen.

6.3.5 Die Gaußsche Normalverteilung

In allen bisherigen Betrachtungen haben wir auf keine spezifische funktionale Form der Verteilungs-
funktion Bezug genommen. Die genaue Gestalt der Verteilung hängt natürlich vom betrachteten
Messprozess ab. In vielen Fällen und unter recht allgemeinen Bedingungen folgen Messfehler jedoch
der Gaußschen Normalverteilung, benannt nach Carl Friedrich Gauß (1777-1855). Dies ist im-
mer dann der Fall, wenn statistische Fehler durch die Überlagerung sehr vieler kleiner unabhängiger
“Störfaktoren” entstehen. Mathematisch kann dies mit Hilfe des zentralen Grenzwertsatzes ge-
zeigt werden, auf den hier aus Platzgründen nicht weiter eingegangen werden kann. Die Gaußsche
Normalverteilung (auch Gaußsche Glockenkurve genannt) ist gegeben durch
1 (x−µ)2
f (x) = √ e− 2σ2 (6.51)
2πσ
154 6 Fehlerrechnung

Abbildung 6.12: Die Gaußsche Normalverteilung.

und hat die Gestalt einer Glocke mit Maximum an der Stelle µ und einer Breite von 2σ (die
Wendepunkte der Kurve liegen bei µ ± σ) (siehe Abb. 6.12).

Der Mittelwert und die Varianz der Gaußschen Normalverteilung sind


Z∞
x (x−µ)2
√ e− 2σ2 dx = µ (6.52)
2πσ
−∞

und
Z∞
(x − µ)2 − (x−µ)2
√ e 2σ2 dx = σ 2 . (6.53)
2πσ
−∞

Das heißt, die Gaußsche Normalverteilung ist durch Angabe des 1. und 2. Moments vollständig
bestimmt. Die Gaußsche Normalverteilung ist normiert,
Z∞
1 (x−µ)2
√ e− 2σ2 dx = 1 (6.54)
2πσ
−∞

und ist um µ symmetrisch, das heißt


f (µ + x) = f (µ − x). (6.55)

Die Wahrscheinlichkeit, dass ein Messwert im Bereich zwischen a und b liegt, ist durch das Integral
Zb
P (a ≤ x ≤ b) = f (x)dx (6.56)
a

gegeben. Solche Wahrscheinlichkeiten kann man auch mit Hilfe der so genannten Errorfunktion
ausdrücken, die wie folgt definiert ist:
Zx
2 2
erf(x) = √ e−t dt. (6.57)
π
0

Mit dieser Definition können wir die Wahrscheinlichkeit P (a ≤ x ≤ b) ausdrücken als:


    
1 b−µ a−µ
P (a ≤ x ≤ b) = erf √ − erf √ . (6.58)
2 2σ 2σ
6 Fehlerrechnung 155

Die Wahrscheinlichkeit, dass ein Messwert kleiner ist als a, ist gegeben durch:
  
1 a−µ
P (x ≤ a) = 1 + erf √ . (6.59)
2 2σ

Für die Gaußsche Normalverteilung (siehe Abb. 6.13) sollten wir demnach

68 % aller Messwerte im Intervall (µ ± σ),


95 % aller Messwerte im Intervall (µ ± 2σ) und
99.7 % aller Messwerte im Intervall (µ ± 3σ)

erwarten, das heißt, eine Abweichung vom Mittelwert von mehr als ±3σ ist statistisch nur etwa
alle 300 Messungen zu erwarten.

Abbildung 6.13: Die Wahrscheinlichkeit, einen Messwert im Intervall (µ ± σ) zu finden, ist 68%,
im Intervall (µ ± 2σ) ist sie 95% und im Intervall (µ ± 3σ) 99.7%.
P
Ist die Variable x gaußverteilt, so ist es auch der Mittelwert x = N1 Ni=1 xi . Sowohl die Verteilungen
von x selbst als auch die des Mittelwerts x haben einen Mittelwert von µ. Die Varianzen σ und σx
der beiden Verteilungen unterscheiden sich jedoch und sind durch

σ2
σx2 = (6.60)
N

miteinander verknüpft. Die Verteilung des Mittelwerts x ist also um den Faktor N schmäler als
die Verteilung der Variablen x selbst.

Aus der Gaußverteilung ergibt sich, dass der “wahre” Mittelwert der Verteilung

mit einer Wahrscheinlichkeit von 68 % im Intervall x ± σx ,


mit einer Wahrscheinlichkeit von 95 % im Intervall x ± 2σx und
mit einer Wahrscheinlichkeit von 99.07 % im Intervall x ± 3σx liegt.

Diese Intervalle nennt man Konfidenzintervalle oder Vertrauensintervalle.

6.3.6 Verteilung diskreter Größen

Bis jetzt haben wir uns mit der Verteilung von kontinuierlichen Größen beschäftigt. Es kann aber
in der Physik durchaus vorkommen, dass die Messgröße nur diskrete (endlich viele oder abzählbar
unendlich viele) Werte annehmen kann. Zum Beispiel kann die Anzahl der in einer gewissen Zeit
156 6 Fehlerrechnung

zerfallenden Kerne eines radioaktiven Materials nur eine ganze Zahl sein, also einen der Werte
0,1,2,... usw. annehmen. Im Falle diskreter Größe beschreiben wir die Verteilung der Messwer-
te durch die Wahrscheinlichkeitsfunktion f (xi ), welche die Wahrscheinlichkeit ist, bei einer
Messung der Größe x den Wert xi zu beobachten. Die Wahrscheinlichkeitsfunktion f (xi ) muss
normiert sein:
X
f (xi ) = 1. (6.61)
i

(Das Integral für die kontinuierliche Wahrscheinlichkeitsdichte haben wir hier also durch eine
Summe ersetzt.)

Die zugehörige Verteilungsfunktion ist


X
F (x) = f (x′ ). (6.62)
x′ ≤x

Die Verteilungsfunktion F (x) ist die Wahrscheinlichkeit, einen Messwert zu beobachten, der kleiner
oder gleich x ist. Der Mittelwert und die Varianz einer diskreten Verteilung sind gegeben durch:
X
E(x) = xi f (xi ), (6.63)
i
X
Var(x) = f (xi )(xi − µ)2 . (6.64)
i

Der Erwartungswert einer Funktion g(x) ist


X
E [g(x)] = f (xi )g(xi ). (6.65)
i

Auch für diskrete Verteilung gilt σx = σ/ N für die Standardabweichung des Mittelwerts.

Folgende Ausdrücke sind gebräuchlich:

diskret kontinuierlich
f (x) • Wahrscheinlichkeitsfunktion • Verteilungsdichte
• Dichtefunktion
• Wahrscheinlichkeitsdichte
F (x) • Verteilungsfunktion • Verteilungsfunktion
• Wahrscheinlichkeitssumme • Wahrscheinlichkeitsintegral
• Wahrscheinlichkeitsverteilung

6.3.7 Poissonverteilung

Die Anzahl von zufälligen und statistisch unabhängigen Ergebnissen, die in einem gewissen Zeit-
intervall stattfinden, folgt der Poissonverteilung. Beispiele sind die in einem Krankenhaus pro
Monat geborenen Babies, die in einer radioaktiven Substanz pro Zeiteinheit zerfallenden Atom-
kerne oder die Anzahl der Fehler pro Seite in diesem Skriptum. Die Poissonverteilung ist gegeben
durch
µx e−µ
f (x) = (für ganzzahliges x). (6.66)
x!
Wir schreiben auch oft P (n) statt f (x), um anzudeuten, dass die Poissonverteilung nur für ganz-
zahlige Werte des Arguments definiert ist (siehe Abb. 6.14).
6 Fehlerrechnung 157

Abbildung 6.14: Die Poissonverteilung für µ = 10.

Die Poissonverteilung ist normiert:


∞ ∞ ∞
X X µn e−µ X µn
P (n) = = e−µ = e−µ eµ = 1 (6.67)
n=0 n=0
n! n=0
n!
| {z }

(Da n nur diskrete Werte annimmt, haben wir hier summiert statt integriert.)

Die Poissonverteilung ist durch einen einzigen Parameter µ vollständig bestimmt. Der Parameter
µ ist der Mittelwert E(n) der Verteilung:
∞ ∞
X X µn e−µ
E(n) = nP (n) = n . (6.68)
n=0 n=0
n!

Da das erste Summenglied verschwindet, können wir schreiben:


∞ ∞ ∞ ∞
X µn e−µ X µn X µn−1 X µn
E(n) = n = e−µ = µe−µ = µe−µ = µ. (6.69)
n=1
n! n=1
(n − 1)! n=1
(n − 1)! n=0
n!
| {z }

Der Mittelwert µ ist gleich der Anzahl der Ereignisse, die im Mittel in der betrachteten Zeit
stattfinden.

Besonders interessant ist die Varianz der Poissonverteilung:

σ 2 = E(n2 ) − E(n)2 . (6.70)

Der Erwartungswert von n2 ist:


∞ ∞ ∞
X X µn e−µ X nµn−1
E(n2 ) = n2 P (n) = n2 = µe−µ . (6.71)
n=0 n=0
n! n=1
(n − 1)!

Durch Umnummerierung der Summe erhalten wir:


 
∞ X 
2 −µ
X (n + 1)µn  ∞ nµn X
−µ 

µn 
E(n ) = µe = µe  +  = µ2 + µ. (6.72)
n=0
n! n=0
n! n=0
n! 

| {z } | {z }
µeµ eµ

Daraus folgt:
σ 2 = E(n2 ) − E(n)2 = µ2 + µ − µ2 = µ. (6.73)
158 6 Fehlerrechnung

Das heißt, für die Poissonverteilung ist die Varianz gleich dem Mittelwert. Diese Formel ist sehr
wichtig zur Abschätzung des Fehlers bei Messvorgängen, bei denen wir Ereignisse zählen. Für große
µ wird die Poissonverteilung zu einer Gaußverteilung.

Beispiel:

In einer gewissen Zeit zählen wir 625 Zerfälle in einem radioaktiven Präparat. Der Fehler, den wir
durchschnittlich bei einer solchen Messung machen, ist
√ √
σ = µ ≈ 625 = 25. (6.74)

Daher ist unser Messergebnis:

625 ± 25. (6.75)

6.4 Fehlerfortpflanzung

Oft können physikalische Größen nicht direkt gemessen werden. Man bestimmt dann diese Größen,
indem man sie als Funktion von anderen Größen ausdrückt, welche messbar sind. So kann man zum
Beispiel die Dichte einer Flüssigkeit bestimmen, indem man für eine gewisse Menge an Substanz
sowohl das Volumen V als auch die Masse m misst. Die Dichte ρ ergibt sich dann aus
m
ρ= . (6.76)
V
Da sowohl die Masse m als auch das Volumen V als experimentell ermittelte Größen fehlerbe-
haftet sind, ist auch die daraus bestimmte Dichte ρ fehlerbehaftet. Man sagt, der Fehler in den
unabhängigen Größen m und V pflanzt sich auf die abhängige Größe ρ = m/V fort. Wir wollen
jetzt den Fehler in der abhängigen Größe aus den Fehlern der unabhängigen Größen bestimmen.

Im Allgemeinen betrachten wir eine Größe u, die von den N Größen x1 , x2 , . . . , xN abhängt:

u = u(x1 , x2 , . . . , xN ). (6.77)

Wir nehmen an, dass x1 bis xN experimentell bestimmte Größen sind und dass deren Statistik durch
die Verteilungsdichten f1 (x1 ), f2 (x2 ), . . . , fN (xN ) beschrieben wird. Die zugehörigen Mittelwerte
und Varianzen sind

µ1 , µ2 , . . . µN (6.78)

und

σ12 , σ22 , . . . σN
2
. (6.79)

Für jede Messgröße xi bestimmen wir nun für eine Stichprobe aus M Messungen den Mittelwert
xi . Die Standardabweichung dieser Mittelwerte ist gegeben durch (siehe Abschnitt 6.3.4):
σi
σxi = √ . (6.80)
M

Wir können nun die Größe u für die Mittelwerte xi bestimmen,

u ≡ (x1 , x2 , . . . , xN ), (6.81)

und nach dem Fehler in u fragen, der durch die Fehler σxi der Mittelwerte entsteht. Um diese
Frage zu beantworten, können wir auf zwei verschiedene Weisen vorgehen: Wir können entweder
den Maximalfehler in der abhängigen Größe u abschätzen oder die statistischen Kennwerte
der Verteilung von u ermitteln.
6 Fehlerrechnung 159

6.4.1 Fortpflanzung von Maximalfehlern

Unter der Annahme, dass die Fehler ∆xi in den unabhängigen Größen klein sind, können wir den
dadurch hervorgerufenen Fehler ∆u einfach durch Anwendung des Differentials abschätzen
N  
X ∂u
∆u ≈ ∆xi . (6.82)
i=1
∂xi

Das heißt, hier haben wir den Fehler durch das Differential angenähert, das wir in Kapitel 3
kennengelernt haben. Das Differential von u gibt an, um wie viel sich u ändert, wenn die Größen
xi um jeweils ∆xi verändert werden. So würde man etwa im Falle von systematischen Fehlern
vorgehen.

Da wir pessimistisch veranlagt sind, wollen wir den “worst case” annehmen und den Betrag des
größtmöglichen Fehlers bestimmen. Dazu nehmen wir an, dass alle Terme einen positiven Beitrag
zum Fehler in u liefern, das heißt, dass alle Fehler in die gleiche Richtung gehen und erhalten somit:
N  
X ∂u
∆u ≈
∂xi ∆xi . (6.83)

i=1

Wenn wir die Standardabweichungen σxi als Maß für die Fehler in xi benutzen, erhalten wir
N
X ∂u
∆u ≈
∂xi σxi , (6.84)

i=1

wobei die partiellen Ableitungen an der Stelle (x1 , x1 , . . . , xN ) ausgewertet werden.

Beispiel:

Betrachten wir wieder die Bestimmung der Dichte ρ aus dem gemessenen Volumen V und der
gemessenen Masse m. Wir nehmen an, dass wir sowohl das Volumen als auch die Masse in M
wiederholten Messungen bestimmt haben. Aus diesen Messreihen erhalten wir die Mittelwerte V
und m und die Varianzen s2V und s2m . Wir identifizieren diese Varianzen mit den Varianzen σV2
2
und σm der zugehörigen Grundgesamtheiten. Als Maß für die Fehler in den Mittelwerten V und
m verwenden wir
σV
σV = √ (6.85)
M
und
σm
σm = √ . (6.86)
M
Dann ist der Maximalfehler in der Dichte gegeben durch

∂ρ
· σm + ∂ρ · σ

|∆ρ| ≈
∂m ∂V V
1 m
= σm + 2 σV
V V
1 ρ
= σm + σV , (6.87)
V V
wobei wir ρ ≡ m/V verwendet haben. Der relative Fehler |∆ρ|/ρ ist also gegeben durch:

|∆ρ| σm σ
≈ + V. (6.88)
ρ m V
160 6 Fehlerrechnung

Der relative Fehler in ρ ist also die Summe der relativen Fehler in m und V .

Die Methode der Fortpflanzung der Maximalfehler kann den Fehler aber leicht überschätzen. Rea-
listischer ist es in vielen Fällen, die Wirkung der Fehler σxi auf die statistischen Kennwerte der
Verteilung von u zu betrachten.

6.4.2 Fortpflanzung statistischer Kennwerte

Wir betrachten zunächst den Fall, dass die Größe u nur von einer Variablen x abhängt, die wir
im Experiment direkt bestimmen können. Aus einer Messserie erhalten wir den Mittelwert x der
Größe x und berechnen daraus die Größe

u ≡ u(x). (6.89)

Da x als Mittelwert von fehlerbehafteten Größen selbst fehlerbehaftet ist (siehe Abschnitt 6.3.4),
wird auch u mit einem Fehler behaftet sein. Um diesen Fehler zu bestimmen, berechnen wir die
Varianz von u: h i
2
Var(u) = σu2 = E (u(x) − u(µ)) , (6.90)

wobei µ = E(x) = E(x) der Erwartungswert von x ist. Wir schreiben nun den Mittelwert x als
Summe des Erwartungswerts µ und einer kleinen Abweichung δx:

x = µ + δx. (6.91)

Unter der Annahme, dass sich der Mittelwert x nur wenig vom Erwartungswert µ unterscheidet,
dass δx also klein ist, können wir die Funktion u(x) in eine Taylorreihe um µ entwickeln (siehe
Kapitel 10) und nach dem linearen Glied abbrechen:
h i h i
E (u(x) − u(µ))2 = E (u(µ + δx) − u(µ))2
"   2 #
du
= E u(µ) + δx − u(µ)
dx
"  #  
2 2
du 2 du  
= E (δx) = E (δx)2 , (6.92)
dx dx

wobei die Ableitung


  u(x) an der Stelle x = µ bzw. als Näherung für µ an der Stelle x ausgewer-
von
tet wird. Da E (δx)2 = σx2 , erhalten wir schließlich das Gaußsche Fehlerfortpflanzungsgesetz
für den Fall einer Funktion u(x), die nur von einer einzelnen Variablen abhängt:
 2
du
σu2 = σx2 . (6.93)
dx

Als nächtes betrachten wir den Fall einer Funktion u(x, y), welche von zwei Variablen x und y
abhängt. Wir fragen nun nach dem Fehler, den wir begehen, wenn wir

u ≡ u(x, y) (6.94)

aus den Mittelwerten x und y bestimmen. Dazu berechnen wir wieder die Varianz:
h i
Var(u) = σu2 = E (u(x, y) − u(µ, ν))2 . (6.95)

Hier sind µ = E(x) = E(x) und ν = E(y) = E(y) die Erwartungswerte von x und y. Indem wir x
und y jeweils als Summe des Erwartungswerts und einer kleinen Abweichung ausdrücken, können
wir schreiben
h i
σu2 = E (u(µ + δx, ν + δy) − u(µ, ν))2 (6.96)
6 Fehlerrechnung 161

und erhalten mit einer nach den linearen Gliedern abgebrochenen Taylorreihe
"     2 #
2 ∂u ∂u
σu = E u(µ, ν) + δx + δy − u(µ, ν)
∂x ∂y
"    2 #
∂u ∂u
= E δx + δy . (6.97)
∂x ∂y

Hier müssen die partiellen Ableitungen ∂u/∂x und ∂u/∂y an der Stelle (µ, ν) ≈ (x, y) ausgewertet
werden. Ausführung des Quadrats ergibt:
 2     2
2 ∂u 2 ∂u ∂u ∂u 2
σu = E[(δx) ] + 2 E[δxδy] + E[(δy) ]. (6.98)
∂x ∂x ∂y ∂y

Für unkorrelierte Messwerte x und y gilt E[δxδy] = E[δx]E[δy] = 0 und wir erhalten schließlich
das Gaußsche Fehlerfortpflanzungsgesetz für den Fall von zwei Variablen:
 2  2
∂u ∂u
σu2 = σx2 + σy2 , (6.99)
∂x ∂y
2 2
wobei wir benutzt haben, dass σx2 = E[(δx) ] und σy2 = E[(δy) ].

Das Gaußsche Fehlerfortpflanzungsgesetz für den allgemeinen Fall einer Funktion von N Variablen,
u = u(x1 , x2 , . . . , xN ), lässt sich auf analoge Weise herleiten. Man erhält als Ergebnis:
N  2
X ∂u
σu2 = σx2i , (6.100)
i=1
∂xi

wobei σx2i die Varianzen der zugehörigen Mittelwerte x1 , x2 , . . . , xN sind. Die Standardabweichung
σu kann als Maß für den zu erwartenden Fehler in der abhängigen Größe u aufgefasst werden.

Das Gaußsche Fehlerfortpflanzungsgesetz gilt, falls

• die Varianzen σxi der Mittelwerte xi klein sind und


• die Mittelwerte xi voneinander statistisch unabhängig sind.

Beispiel:
m
Mit der Gaußschen Fehlerfortpflanzung können wir die Standardabweichung der Dichte ρ = V aus
der Standardabweichung von m und V bestimmen:
 2  2
∂ρ ∂ρ
σρ2 = σm2
+ σV2
∂m ∂V
 2  2
1 2 m
= σm + − 2 σV2 . (6.101)
V V
Für den relativen Fehler erhalten wir:
σρ2 2
σm σV2
= + (6.102)
ρ2 m2 V
2

oder
s  2
σρ  σ 2 σV
m
= + . (6.103)
ρ m V
162 6 Fehlerrechnung

Abbildung 6.15: Der durch Gaußsche Fortpflanzung berechnete Relativfehler σρ /ρ = (σm2


/m2 +
2 |∆ρ|
σV2 /V )1/2 ist kleiner als der Relativfehler ρ = σm /m + σV /V , den man durch Fortpflanzung
der Maximalfehler erhält.

Statt wie bei der Abschätzung des Maximalfehlers die relativen Fehler einfach zu addieren, addieren
wir die Quadrate der relativen Fehler und ziehen daraus die Wurzel. Durch die Anwendung der
Gaußschen Fehlerfortpflanzung erhalten wir also einen im Vergleich zum Maximalfehler kleineren
Fehler. Dies sieht man anhand der Dreiecksungleichung √leicht ein (siehe Abb. 6.15). Falls zum
Beispiel σm /m = σV /V , ist dieser Fehler um den Faktor 2 kleiner als der Maximalfehler.

Für bestimmte funktionale Zusammenhänge der abhängigen von der unabhängigen Größe erge-
ben sich besonders einfache Fälle des Gaußschen Fehlerfortpflanzungsgesetzes, die im Folgenden
angeführt sind.

Summen oder Differenzen

Für u = x + y oder u = x − y gilt

∂u ∂u
= 1 und = ±1. (6.104)
∂x ∂y

Daraus ergibt sich

σu2 = 12 σx2 + (±1)2 σy2


= σx2 + σy2 (6.105)

und somit
q
σu = σx2 + σy2 . (6.106)

Das heißt, die Varianz der abhängigen Größe ist die Summe der Varianzen der unabhängigen
Größen.

Multiplikation mit einer Konstanten

Für u = αx gilt
 2
∂u
σu2 = σx2 = α2 σx2 (6.107)
∂x

und deshalb

σu = ασx . (6.108)

Das heißt, die Standardabweichung von u ergibt sich einfach durch Multiplikation von α mit der
Standardabweichung von x.
6 Fehlerrechnung 163

Multiplikation oder Division

Für u = xy erhalten wir durch Anwendung von Gleichung (6.100)

σu2 = y 2 σx2 + x2 σy2 . (6.109)

Division durch x2 y 2 ergibt


 2
σu2 σx2 σy2  σ 2
x σy
2
= 2 + 2 = + . (6.110)
u x y x y

Das heißt, das Quadrat des relativen Fehlers in u ist die Summe der Quadrate der relativen Fehler
in x und y.

Für die Division u = x/y gilt ganz analog:


 2  2
1 x
σu2 = σx2 + σy2 . (6.111)
y y2

Nach Division durch u = x/y erhalten wir:


 2
σu2 σx2x σx2y  σ 2
xx σxy
2
= 2 + 2 = + . (6.112)
u x y x y

6.5 Ausgleichsrechnung (Fitten)

In Experimenten bestimmt man oft eine Größe y in Abhängigkeit einer anderen Größe x. Zum
Beispiel könnte in einem Experiment das Volumen V einer Flüssigkeit als Funktion der Temperatur
T gemessen werden. Als Ergebnis eines solchen Experiments erhält man für jeden der N Werte
xi der unabhängigen Größe (in unserem Beispiel die Temperatur) einen Messwert yi (in unserem
Beispiel das Volumen). Wir suchen nun nach einer Funktion f (x), die möglichst gut beschreibt,
wie y von x abhängt (siehe Abb. 6.16).

Abbildung 6.16: Ziel der Ausgleichsrechnung ist es, eine Funktion f (x) zu bestimmen, die möglichst
gut zu den Messdaten passt.

Im Idealfall hätten wir yi = f (xi ). Sowohl xi als auch yi sind im Allgemeinen fehlerbehaftet, sodass
es zu Abweichungen von dieser funktionalen Abhängigkeit kommt. Wir können jedoch verlangen,
164 6 Fehlerrechnung

dass die Abweichung der Funktionswerte f (xi ) von den gemessenen Werten möglichst klein ist.
Demzufolge suchen wir nach einer Funktion f (x), die die Summe der Abweichungsquadrate

N
X 2
χ2 = [f (xi ) − yi ] (6.113)
i

minimiert. Die dazugehörige Kurve nennt man die Ausgleichskurve. Sie ist die Kurve, die im
Sinne der kleinsten Summe der Abweichungsquadrate am besten zu den Messwerten passt. Das
Anpassen der Ausgleichskurve an die gemessenen Daten nennt man in Anlehnung an das Englische
auch “Fitten”.

Beim praktischen Fitten wird meistens eine Funktion f (x, a1 , . . . , aL ) angenommen, deren Form
entweder von der zugrunde liegenden Physik nahe gelegt wird oder aus Gründen der Einfachheit
gewählt wird. Die Funktion hängt im Allgemeinen auch von einer Reihe von freien Parametern ai
ab, die wir nun so bestimmen, dass die Summe der Abweichungsquadrate χ2 möglichst klein wird.
Wir stellen also an die freien Parameter ai die Bedingung, dass

∂ 2
χ =0 für i = 1, . . . , L. (6.114)
∂ai

Das heißt, dass χ2 bezüglich der Parameter ai ein Minimum (genauer: ein Extremum) annimmt.
Durch Lösung dieses Satzes von L Gleichungen erhalten wir die Werte für die Parameter, die den
besten “Fit” der Funktion an die Messwerte ergeben.

Lineare Regression

Die einfachste und am häufigsten verwendete Ausgleichsfunktion ist die Gerade

f (x) = ax + b, (6.115)

die von den zwei freien Parametern a (Steigung) und b (Schnittpunkt mit der y-Achse) abhängt.
Man spricht in diesem Fall von linearer Regression. Die Steigung a wird auch Regressions-
koeffizient genannt. Um die Parameter a und b zu ermitteln, setzen wir die Ableitungen von χ2
nach a und b gleich 0:

N N
∂ 2 ∂ X X
χ = (axi + b − yi )2 = 2(axi + b − yi )xi = 0 (6.116)
∂a ∂a i=1 i=1

und

N N
∂ 2 ∂ X X
χ = (axi + b − yi )2 = 2(axi + b − yi ) = 0. (6.117)
∂b ∂b i=1 i=1

Daraus erhalten wir:

N
X N
X N
X
a x2i + b xi − xi yi = 0, (6.118)
i=1 i=1 i=1
N
X N
X
a xi + N b − yi = 0. (6.119)
i=1 i=1
6 Fehlerrechnung 165

Wir definieren nun:


N
X
Sx = xi , (6.120)
i=1
N
X
Sy = yi , (6.121)
i=1
N
X
Sxx = x2i , (6.122)
i=1
N
X
Sxy = xi yi (6.123)
i=1

und schreiben die obigen Gleichungen als

aSxx + bSx − Sxy = 0, (6.124)


aSx + N b − Sy = 0. (6.125)

Durch Multiplikation von Gleichung (6.125) mit Sxx /Sx und Subtraktion der zweiten von der
ersten Gleichung erhalten wir
 
N Sxx Sxx
b Sx − − Sxy + Sy = 0, (6.126)
Sx Sx

woraus folgt:
Sy Sxx − Sx Sxy
b= . (6.127)
N Sxx − Sx2

Multiplikation von Gleichung (6.125) mit Sx /N und anschließender Subtraktion von Gleichung
(6.124) hingegen ergibt:
 
S2 Sy Sx
a Sxx − x − Sxy + =0 (6.128)
N N

und somit:
N Sxy − Sx Sy
a= . (6.129)
N Sxx − Sx2

Damit haben wir die Parameter a und b der Ausgleichsgeraden bestimmt.

Wenn wir den Fehler σi in den Messwerten berücksichtigen und die Terme in der Summe der
Abweichungsquadrate damit gewichten, ergeben sich ähnliche Ausdrücke für a und b. Statt der
linearen Funktion f (x) = ax + b können wir auch andere Funktionen an die Messdaten anpassen.
Die Gleichungen, die sich dann aus ∂χ2 /∂ai ergeben, sind jedoch schwieriger zu lösen als im linearen
Fall.
166 6 Fehlerrechnung
Kapitel 7

Differentiation von Feldern: grad,


div und rot

Im Folgenden werden wir uns mit Vektoranalysis beschäftigen. Dabei geht es um die mathe-
matische Beschreibung von Feldern im dreidimensionalen Raum. Für die Beschreibung sind die
Begriffe des Gradienten, der Rotation und der Divergenz von zentraler Bedeutung.

7.1 Felder

7.1.1 Skalarfelder

Betrachten wir als Beispiel die Atmosphäre über einem bestimmten Gebiet, sagen wir über Wien.
Es ist ein sonniger Tag und die Sonnenstrahlen erwärmen Straßen, Häuser, etc. Die Temperatur
der Luft über dem Boden hängt nur von der Beschaffenheit des Bodens ab. Während dunkler
Asphalt die Sonnenstrahlen absorbiert und dadurch die darüber liegende Luft erwärmt, bleibt die
Luft über begrünten Flächen eher kühl. Am kühlsten bleibt es in beschatteten Bereichen. Ferner
hängt die Lufttemperatur von der Höhe über dem Boden ab: je höher wir steigen, umso kühler
wird es. Durch Messung mit einem Thermometer können wir die Temperatur an jedem durch die
Koordinaten (x, y, z) beschriebenen Punkt bestimmen und erhalten

T (x, y, z). (7.1)

Da die Temperatur auch von der Tageszeit abhängt, können wir auch die Zeit t in die Variablenliste
aufnehmen:

T (x, y, z, t). (7.2)

Dies ist ein Beispiel für ein zeitabhängiges, skalares Feld. Das Feld T (x, y, z, t) heißt deshalb
skalar, weil die Temperatur T eine skalare Größe ist. Im Allgemeinen ordnet ein Skalarfeld jedem
Punkt (x, y, z) eines räumlichen (oder ebenen) Bereichs in eindeutiger Weise einen Skalar A zu
(siehe Abb. 7.1):

A(x, y, z) = A(~r). (7.3)

Das Feld A(x, y, z) kann man sich mit Hilfe der Flächen veranschaulichen, auf denen die skala-
re Größe einen konstanten Wert hat: A(x, y, z) =const. Man nennt diese Flächen Niveau- oder
Äquipotentialflächen. In der Ebene definiert die Bedingung A(x, y) =const Niveaulinien (oder

167
168 7 Differentiation von Feldern: grad, div und rot

Abbildung 7.1: Ein Skalarfeld ordnet jedem Punkt ~r in der Ebene (~r = (x, y), links) oder im Raum
(~r = (x, y, z), rechts) eine skalare Größe A(~r) zu.

Äquipotentiallinien). Solche Niveaulinien kennen wir von topographischen Karten, in denen sie
Punkte gleicher Meereshöhe verbinden, oder vom Wetterbericht, wo in der Temperaturkarte für
einen diskreten Satz von Temperaturen Punkte gleicher Temperatur durch Niveaulinien miteinan-
der verbunden sind. Ein weiteres 2D-Beispiel ist eine metallische Platte, die an einer Ecke erhitzt
und an den gegenüberliegenden Seiten gekühlt wird (siehe Abb. 7.2).

Abbildung 7.2: Eine metallische Platte wird an der rechten hinteren Ecke erwärmt und gleichzei-
tig an der linken und der vorderen Kante gekühlt. Dadurch stellt sich ein Zustand ein, bei dem
die Temperatur der Platte vom Ort abhängt. Orte gleicher Temperatur sind durch so genannte
Niveaulinien miteinander verbunden.

7.1.2 Vektorfelder

In anderen Fällen ist es notwendig, an jeder Stelle x, y, z einen Vektor zu definieren. So möchte
man beispielsweise zusätzlich zur Temperatur auch die Windgeschwindigkeit ~v als Funktion des
Ortes angeben:

~v (x, y, z). (7.4)

Da sich Windgeschwindigkeit und Windrichtung mit der Zeit ändern, können wir auch in die-
sem Fall die Zeit t in die Liste der Argumente aufnehmen und erhalten damit ein zeitabhängiges
Geschwindigkeitsfeld:

~v (x, y, z, t). (7.5)


7 Differentiation von Feldern: grad, div und rot 169

Ein solches Feld nennt man ein Vektorfeld. Im Allgemeinen ordnet ein Vektorfeld jedem Ort
(x, y, z) eines Bereichs und (falls nötig) auch jedem Zeitpunkt aus einem bestimmten Intervall
einen Vektor zu:
~ y, z) = A(~
A(x, ~ r ). (7.6)
~ y) analog definiert (siehe Abb. 7.3). Beispiele für Vektorfelder
In der Ebene ist ein Vektorfeld A(x,
sind das elektrische Feld, das magnetische Feld und das Geschwindigkeitsfeld einer strömenden
Flüssigkeit.

~ r ) zu.
Abbildung 7.3: Ein Vektorfeld ordnet jedem Punkt ~r (hier in der Ebene) einen Vektor A(~

Vektorfelder kann man mit Feldlinien veranschaulichen. Das sind Linien, für die in jedem Punkt
der dortige Feldvektor tangential zur Linie ist. Feldlinien können sich nicht schneiden, da in jedem
Punkt der Feldvektor eine eindeutige Richtung hat. Würden sich Feldlinien unter einem Winkel
schneiden, gäbe es an einem Punkt zwei verschiedene Feldvektoren, was jedoch nicht zulässig ist.
Felder, die sich zeitlich nicht ändern, nennt man stationär. Die Dichte der Feldlinien ist ein Maß
für die Stärke des Vektorfeldes.

Abbildung 7.4: Ein Vektorfeld (hier das zweidimensionale Geschwindigkeitsfeld einer Strömung um
eine Scheibe) kann mit Hilfe von Feldlinien, zu denen die Feldvektoren tangential sind, dargestellt
werden.

Einige Felder von besonderer Bedeutung sind:

• Homogene Felder:
In einem homogenen Feld hat der Feldvektor überall die gleiche Richtung und den gleichen
Betrag. Ein homogenes Feld kann geschrieben werden als
~ y, z) = (cx , cy , cz ),
A(x, (7.7)
wobei cx , cy , cz Konstanten sind.
170 7 Differentiation von Feldern: grad, div und rot

• Kugelsymmetrische Felder (Zentralfelder):

Abbildung 7.5: Ein kugelsymmetrisches Vektorfeld.

Der Feldvektor zeigt in jedem Punkt radial nach außen oder innen, also vom Ursprung weg
oder zum Ursprung hin. Der Betrag hängt nur vom Abstand r vom Zentrum ab. Ein kugel-
symmetrisches Feld lässt sich ausdrücken als:

~ r ) = A(r) ~r ,
A(~ (7.8)
r
wobei r = |~r| der Abstand des Punktes vom Ursprung ist. Beispiele für ein kugelsymmetri-
sches Feld sind das Gravitationsfeld der Erde und das elektrische Feld einer Punktladung.

• Zylinder- oder axialsymmetrische Felder:

Abbildung 7.6: Ein zylindersymmetrisches Vektorfeld.

Der Feldvektor zeigt radial von einer Achse weg und hat keine Komponente in Achsenrich-
tung. Der Betrag hängt nur vom Abstand des Punktes zur Achse ab. Ein zylindersymmetri-
sches Feld lässt sich schreiben als:

~ r ) = A(ρ)~eρ .
A(~ (7.9)

Hier ist ρ der Normalabstand zur z-Achse und ~eρ der Einheitsvektor normal zur z-Achse in
Richtung zum Punkt ~r.
7 Differentiation von Feldern: grad, div und rot 171

7.2 Gradient

7.2.1 Definition

Betrachten wir ein Skalarfeld A(x, y, z) im dreidimensionalen Raum (zum Beispiel die Temperatur
T (x, y, z) eines ungleichmäßig erwärmten Körpers). Wir fragen uns nun, wie sich die skalare Größe
A ändert, wenn wir uns vom Punkt ~r = (x, y, z) leicht wegbewegen, wenn wir also von ~r = (x, y, z)
auf ~r + d~r = (x + dx, y + dy, z + dz) übergehen. In linearer Näherung (für sehr kleine dx, dy und
dz) ist die Änderung dA in der Größe A gegeben durch

∂A ∂A ∂A
dA = dx + dy + dz. (7.10)
∂x ∂y ∂z

(Dies ist einfach das bereits bekannte totale Differential der Funktion A(x, y, z).) Wir können
die rechte Seite der obigen Gleichung als das Skalarprodukt des Vektors d~r = (dx, dy, dz) mit dem
Vektor (∂A/∂x, ∂A/∂y, ∂A/∂z) betrachten. Dieser im Allgemeinen ortsabhängige Vektor ist der
Gradient des Skalarfeldes A(x, y, z). Wir schreiben dafür
 
∂A
∂x
 ∂A 
grad A =  ∂y  = ∇A(x, y, z). (7.11)
∂A
∂z

∇A(x, y, z) nennt man auch das Gradientenfeld von A(x, y, z).

Das Symbol ∇ ist der Nabla-Operator, der in der Vektoranalysis eine zentrale Rolle einnimmt
und formal als Vektor geschrieben werden kann:
 ∂

∂x
 ∂ 
∇= ∂y . (7.12)

∂z

Der Nabla-Operator ∇ (auf Englisch auch “del” genannt) wurde zum ersten Mal vom irischen Phy-
siker William Rowan Hamilton (1805-1865) verwendet. Das Wort “Nabla” bezeichnet eine antike
Harfe und wurde vermutlich wegen der Ähnlichkeit des Symbols ∇ mit einer Harfe eingeführt.

Der Gradient des Skalarfeldes A(x, y, z) ist also ein Vektorfeld, dessen Komponenten die partiellen
Ableitungen von A(x, y, z) nach den Raumkoordinaten sind. Der Gradient von A entsteht durch
Anwendung des Nabla-Operators auf A. Man kann den Gradienten auch mit Hilfe der Basisvektoren
~ex , ~ey , ~ez ausdrücken:

∂A ∂A ∂A
grad A = ∇A = ~ex + ~ey + ~ez . (7.13)
∂x ∂y ∂z
Auch die Schreibweise
∂A
∇A = (7.14)
∂~r
wird oft verwendet.

7.2.2 Eigenschaften

Der Gradient steht senkrecht auf die Äquipotentialflächen (Niveauflächen), auf denen A = const.
Um das einzusehen, betrachten wir die Änderung dA, die durch Verschiebung des Ortsvektors
~r(x, y, z) um d~r = (dx, dy, dz) entsteht:

dA = ∇A · d~r. (7.15)
172 7 Differentiation von Feldern: grad, div und rot

Ist d~r tangential zur Niveaufläche, bleibt A konstant und wir haben:
dA = ∇A · d~r = 0. (7.16)
Das bedeutet, dass ∇A senkrecht auf die Flächen mit A = const steht. In der Ebene können wir
uns das für das Temperaturfeld T (x, y) leicht veranschaulichen: Auf diesen Linien ist T konstant.
Das heißt, wenn wir auf ihnen entlangfahren, ändert sich die Temperatur nicht. Wenn wir d~r in
Richtung einer solchen Linie wählen, muss daher für kleine d~r gelten: dA = 0. Das Differential dA
ist aber das Skalarprodukt von d~r und ∇A: dA = ∇A · d~r. Daher haben wir ∇A · d~r = 0. Somit ist
∇A orthogonal zu d~r und, da d~r tangential an die Niveaulinie ist, auch orthogonal zur Niveaulinie
selbst. Analog gilt das auch in höheren Dimensionen.

Abbildung 7.7: Der Gradient ∇A eines skalaren Feldes A(~r) (hier das Temperaturfeld von Abb.
7.2) steht normal zu den Niveaulinien des Feldes.

Der Gradient ∇A zeigt in die Richtung, in der die Funktion A(x, y, z) am schnellsten anwächst.
Man kann dies zum Beispiel mit Hilfe der Lagrangeschen Multiplikatoren beweisen, worauf
wir aber hier nicht eingehen können. Anschaulich ist dies plausibel, da wir natürlich am schnellsten
von einer Niveaulinie (oder Niveaufläche) zur nächsten kommen, wenn wir uns senkrecht dazu, also
in Richtung des Gradienten, bewegen. (Denken Sie zum Beispiel an die Höhenschichtenlinien auf
einer Wanderkarte.) Der negative Gradient zeigt in die Richtung der schnellsten Abnahme der
Funktion A(x, y, z). Der Betrag des Gradienten ist die Steigung (oder Ableitung) der Funktion
in der Richtung ihres stärksten Zuwachses.

Beispiel:

Betrachten wir das Gravitationspotential, das von einer Masse M im Ursprung erzeugt wird:
GM GM
u(x, y, z) = − p =− . (7.17)
2 2
x +y +z 2 r

Hier ist r der Abstand einer Probemasse m vom Ursprung und mu(x, y, z) ist die potentielle Ener-
gie dieser Probemasse. G ist die Gravitationskonstante. Der Gradient des Gravitationspotentials
lautet:
 

∂u
 − 21 2 GM 3 · 2x
∂x
 (x +y 2 +z 2 ) 2 
 ∂u   1 GM 

∇u =  ∂y  = −  2 2 2 2 32
 · 2y 

(x +y +z )
∂u  1 GM

∂z − 2 2 2 2 3 · 2z
(x +y +z ) 2
   
x x
GM   GM   GM
= 3 ·  y  = 3  y  = 2 ~er . (7.18)
2 2 2
(x + y + z ) 2 r r
z z

Die Äquipotentialflächen dieses Feldes sind konzentrische Kugeln und ∇u ist orthogonal zur ent-
sprechenden Kugeloberfläche. Die Kraft auf die Probemasse m
GM m
F~ (~r) = −m∇u = − 2 ~er (7.19)
r
7 Differentiation von Feldern: grad, div und rot 173

zeigt zum Ursprung und ist somit attraktiv.

Beispiel:

Das Feld

u(x, y) = x2 + y 2 (7.20)

hat den Gradienten


! !
∂u
∂x 2x
∇u = ∂u
= . (7.21)
∂y 2y

7.2.3 Richtungsableitung

Die Ableitung der Funktion A(x, y, z) in Richtung eines beliebigen Vektors ~a lässt sich ebenfalls
mit Hilfe des Gradienten ausdrücken:

~a
∇A(x, y, z) · = ∇A · ~ea . (7.22)
|~a|

Die Größe nennt man die Richtungsableitung in Richtung des Vektors ~a. Man erhält sie durch
Projektion des Gradienten ∇A auf den normierten Richtungsvektor ~ea = |~~aa| . Die Richtungsablei-
tung ist in Richtung des Gradienten am größten.

7.2.4 Rechenregeln

Für den Gradienten gelten folgende Rechenregeln:

• Für ein konstantes Feld A(~r) = c folgt: ∇A = 0,


• Summenregel: ∇(A + B) = ∇A + ∇B,
• Faktorregel: ∇(αA) = α∇A,
• Produktregel: ∇(AB) = A∇B + B∇A.

Diese Regeln folgen aus den Regeln für die partielle Differentiation.

Zusammenfassend halten wir fest:

• Der Gradient von A(~r) ist ein Vektor (eigentlich ein Vektorfeld), dessen Kompo-
nenten die partiellen Ableitungen nach den Koordinaten sind.
• Der Gradient entsteht durch Anwendung des Nabla-Operators auf A(~r).
• ∇A steht orthogonal zu den Niveauflächen.
• ∇A zeigt in Richtung des stärksten Zuwachses von A(~r).
• ∇A · ~ea = ∇A · (~a/|~a|) ist die Richtungsableitung von A in Richtung von ~a.
174 7 Differentiation von Feldern: grad, div und rot

7.3 Divergenz

7.3.1 Definition

Die Divergenz eines Vektorfeldes beschreibt die Quellstärke eines Feldes. Im Falle des elektrischen
Feldes zum Beispiel verknüpft die Divergenz das elektrische Feld mit dessen Quellen, also mit den
Ladungen. Formal definiert man die Divergenz divA ~ eines Vektorfeldes A(~
~ r ) als das Skalarprodukt
des Nabla-Operators mit dem Feld:

~ = ∇·A
~= ∂Ax ∂Ay ∂Az
divA + + . (7.23)
∂x ∂y ∂z

Die Divergenz eines Vektorfeldes ist ein skalares Feld. (Ganz im Gegensatz zum Gradienten, der
aus einem Skalarfeld ein Vektorfeld macht.)

Beispiel:

Die Divergenz des Vektorfeldes

 
x2 y
~ r) = 
A(~  zxy 

(7.24)
x2 + y 2

ist

~ = ∇·A
~= ∂(x2 y) ∂(zyx) ∂(x2 + y 2 )
divA + + = 2xy + zx = x(2y + z). (7.25)
∂x ∂y ∂z

7.3.2 Anschauliche Interpretation als lokale Quellstärke

Ein anschauliches Verständnis der Divergenz können wir durch folgende Überlegung erreichen. Be-
trachten wir eine strömende Flüssigkeit, deren räumliche Strömung durch das Geschwindigkeitsfeld

 
vx (x, y, z)
 
~v (x, y, z) =  vy (x, y, z)  (7.26)
vz (x, y, z)

beschrieben wird. Wir wollen nun die Flüssigkeitsmenge berechnen, welche pro Zeiteinheit in ein
kleines Volumen um den willkürlich gewählten Punkt P (x, y, z) eintritt, beziehungsweise aus diesem
Volumen austritt (siehe Abb. 7.8).

Dieses infinitesimale Volumen wird durch ebene Seitenflächen begrenzt, die parallel zu den Ko-
ordinatenebenen liegen. Die Seitenlängen des dadurch entstehenden Quaders sind in x-, y- und
z-Richtung jeweils dx, dy und dz. Der Punkt P (x, y, z) liegt im Mittelpunkt des Quaders, das heißt
die Seitenflächen haben einen Abstand von dx/2 beziehungsweise dy/2 und dz/2 vom Punkt P . Zu
jeder Seitenfläche definieren wir einen Flächenvektor, dessen Betrag gleich dem Flächeninhalt der
jeweiligen Seitenfläche ist. Die Flächenvektoren stehen senkrecht auf die jeweiligen Seitenflächen
7 Differentiation von Feldern: grad, div und rot 175

Abbildung 7.8: Ein kleines quaderförmiges Volumen um Punkt P mit Flächenvektoren f~1 , f~2 , f~3 ,
f~4 , f~5 und f~6 . Am Punkt P = (x, y, z) herrscht die Geschwindigkeit v(x, y, z) vor.

und zeigen nach außen. Diese in Abb. 7.8 eingezeichneten Flächenvektoren sind:
 
dydz
f~1 =  0  = −f~2 ,
 
(7.27)
0
 
0
f~3 =  dzdx  = −f~4 ,
 
(7.28)
0
 
0
f~5 =  0  = −f~6 .
 
(7.29)
dxdy

Wir bestimmen nun die Flüssigkeitsmenge, die pro Zeiteinheit durch die Seitenwände des Quaders
strömt (also den Fluss). Wie wir früher bereits gesehen haben, ist der Fluss durch eine Fläche
gleich dem Skalarprodukt des Geschwindigkeitsvektors mit dem Flächenvektor. Wenn wir für jede
Fläche den Geschwindigkeitsvektor in der Mitte der Fläche nehmen, ergibt sich zum Beispiel für
die Seitenfläche mit dem Flächenvektor f~1 der Fluss:

dx
f~1 · ~v (x + , y, z). (7.30)
2

Dabei ist ~v (x+ dx


2 , y, z) der Geschwindigkeitsvektor in der Mitte der Fläche mit dem Flächenvektor
f1 . Durch Verwendung der Komponentendarstellung des Vektors f~1 ergibt sich für den Fluss
~

dx
vx (x + , y, z)dydz. (7.31)
2

Auf ähnliche Weise erhalten wir für die gegenüberliegende Seitenfläche mit dem Vektor f~2 einen
Fluss von

dx
− vx (x − , y, z)dydz. (7.32)
2
176 7 Differentiation von Feldern: grad, div und rot

Für die Flüsse durch die anderen Flächen erhalten wir jeweils:

dy
f~3 : vy (x, y + , z)dxdz, (7.33)
2
dy
f~4 : −vy (x, y − , z)dxdz, (7.34)
2
dz
f~5 : vz (x, y, z + )dxdy, (7.35)
2
dz
f~6 : −vz (x, y, z − )dxdy. (7.36)
2

Die Änderung der Flüssigkeitsmenge in unserem kleinen Quader ergibt sich aus den Flüssigkeits-
mengen, die in den Quader hinein oder aus dem Quader heraus fließen. Durch Addition der Flüssig-
keitsmengen, die durch die einzelnen Flächen fließen, erhalten wir den Verlust oder den Überschuss
an Flüssigkeit, der pro Zeiteinheit für unser kleines Volumen zu verzeichnen ist:
 
dx dx
vx (x + , y, z) − vx (x − , y, z) dydz
2 2
 
dy dy
+ vy (x, y + , z) − vy (x, y − , z) dxdz
2 2
 
dz dz
+ vz (x, y, z + ) − vz (x, y, z − ) dxdy. (7.37)
2 2

Wir multiplizieren und dividieren nun den ersten dieser drei Terme mit dx, den zweiten mit dy
und den dritten mit dz:
dx dx
vx (x + 2 , y, z) − vx (x − 2 , y, z)
dxdydz
dx
dy dy
vy (x, y + 2 , z)− vy (x, y − 2 , z)
+ dxdydz
dy
vz (x, y, z + dz dz
2 ) − vz (x, y, z − 2 )
+ dxdydz. (7.38)
dz
Für kleine Kantenlängen werden aus den drei Quotienten im obigen Ausdruck partielle Ableitungen
und wir erhalten:
 
∂vx ∂vy ∂vz ∂vx ∂vy ∂vz
dV + dV + dV = + + dV. (7.39)
∂x ∂y ∂z ∂x ∂y ∂z

Mit Hilfe der Divergenz können wir diesen Ausdruck schreiben als:

div ~v dV = (∇ · ~v )dV. (7.40)

Die zeitliche Änderung der Flüssigkeitsmenge in unserem Quader ist also durch das Produkt
der Divergenz des Strömungsfeldes mit dem infinitesimalen Volumen dV gegeben. Die Divergenz
beschreibt also den Gewinn oder Verlust an Flüssigkeit pro Zeiteinheit in einem kleinen Volums-
element dV um (x, y, z). Für eine inkompressible Flüssigkeit ist die Flüssigkeitsmenge im Volumen
natürlich konstant. Für eine kompressible Flüssigkeit hingegen kann diese Menge fluktuieren und
∇ · ~v kann verschieden von 0 sein. (Genau genommen müssen wir hier ∇(ρ~v ) statt ∇v betrachten.)

Falls div ~v > 0, überwiegt der Abfluss. Das heißt, es fließt mehr Flüssigkeit aus dem Volumen
heraus als in das Volumen hinein. Man sagt in diesem Fall, dass sich im Volumen dV eine Quelle
befindet. Falls hingegen div ~v < 0, überwiegt der Zufluss und es fließt eine größere Flüssigkeits-
menge in das Volumen dV hinein als aus dem Volumen dV heraus. Im Volumen dV befindet sich
dann eine Senke. Für div ~v = 0 halten sich Zufluss und Abfluss genau die Waage und man sagt,
das Feld ist in diesem Punkt quellenfrei.
7 Differentiation von Feldern: grad, div und rot 177

Die Divergenz divA~ eines Feldes A ~ wird auch als dessen lokale Quellstärke bezeichnet. Die
Divergenz ist eine lokale Größe, die sich von einem Punkt zum anderen verändern kann. Die
~ des Vektorfeldes A
Divergenz div A ~ ist selbst ein Skalarfeld.

Beispiel:

Betrachten wir die Kraft F~ auf eine Masse m im Gravitationsfeld, das durch die Masse M im
Ursprung erzeugt wird (siehe Abb. 7.9):
 
x
GM m 
F~ = − 3  y  .

(7.41)
r
z

Die Divergenz des Gravitationsfeldes ist


∂Fx ∂Fy ∂Fz
divF~ = ∇ · F~ = + + . (7.42)
∂x ∂y ∂z
Die partielle Ableitung der x-Komponente der Kraft nach der Koordinate x ist
∂Fx ∂ x
= −GM m
∂x ∂x (x2 + y 2 + z 2 ) 23
3 1
(x2 + y 2 + z 2 ) 2 − x 23 (x2 + y 2 + z 2 ) 2 · 2x
= −GM m
(x2 + y 2 + z 2 )3
3 1
(x2 + y 2 + z 2 ) 2 − 3x2 (x2 + y 2 + z 2 ) 2
= −GM m
(x2 + y 2 + z 2 )3
3 2
r − 3x r
= −GM m . (7.43)
r6
Auf ähnliche Weise erhalten wir:
∂Fy r3 − 3y 2 r ∂Fz r3 − 3z 2 r
= −GM m und = −GM m . (7.44)
∂y r6 ∂z r6
Durch Addieren dieser drei partiellen Ableitungen ergibt sich
3r3 − 3(x2 + y 2 + z 2 )r 3r3 − 3r3
div F~ = −GM m = −GM m = 0. (7.45)
r6 r6
Das Gravitationsfeld ist also überall, wo es definiert ist (für r 6= 0), quellenfrei. Über den Ur-
sprung, also den Punkt (0,0,0), können wir hier keine Aussage machen, da in diesem Punkt das
Feld F~ divergiert. Eine mathematisch weiterführende Betrachtung zeigt jedoch, dass das Gravitati-
onsfeld genau im Ursprung eine punktförmige Quelle besitzt, die durch eine δ-Funktion dargestellt
werden kann. Überall sonst ist das Gravitationsfeld quellenfrei, da wir ja keine zusätzliche Masse
betrachtet haben.

Beispiel:
~ y, z) = (xy 2 , z 2 + y 2 , 12xyz 3 ). Die Divergenz dieses Feldes ist:
Gegeben sei das Feld A(x,

~ = ∂Ax + ∂Ay + ∂Az = y 2 + 2y + 36xyz 2.


div A (7.46)
∂x ∂y ∂z

7.3.3 Rechenregeln

Für die Divergenz gelten folgende Rechenregeln:


178 7 Differentiation von Feldern: grad, div und rot

Abbildung 7.9: Die Kraft F~ auf eine Masse m im Gravitationsfeld der Masse M im Ursprung.

~ y, z) = ~c gilt:
• Für ein konstantes Feld A(x,

~ = 0.
div A (7.47)

• Summenregel:

~ + B)
div (A ~ ~ + B)
= ∇ · (A ~ = ∇·A
~+∇·B
~
~ + div B.
= div A ~ (7.48)

• Faktorregel:

~ = αdiv A.
div (αA) ~ (7.49)

~
• Produktregel für das Produkt eines Skalarfeldes A mit einem Vektorfeld B:

~
div (AB) ~ = A(∇ · B)
= ∇ · (AB) ~ +B~ · ∇A
~ +B
= A div B ~ · grad A. (7.50)

Diese Beziehung lässt sich leicht durch explizites Ausführen der partiellen Differentiation verstehen:

~ ∂ABx ∂ABy ∂ABz


∇ · (AB) = + +
∂x ∂y ∂z
∂A ∂Bx ∂A ∂By ∂A ∂Bz
= Bx +A + By +A + Bz +A
∂x ∂x ∂y ∂y ∂z ∂z
 
∂A ∂A ∂A ∂Bx ∂By ∂Bz
= Bx + By + Bz +A + +
∂x ∂y ∂z ∂x ∂y ∂z
| {z } | {z }
~
B·∇A ~
A∇·B

= ~ · ∇A + A∇ · B
B ~ =B
~ · grad A + A div B.
~ (7.51)

7.4 Laplace-Operator

Wenn wir den Gradienten eines Skalarfeldes A bilden, erhalten wir das Vektorfeld
 
∂A ∂A ∂A
grad A = ∇A = , , . (7.52)
∂x ∂y ∂z
7 Differentiation von Feldern: grad, div und rot 179

Wenden wir nun den Nabla-Operator auf dieses Vektorfeld an (wir bilden also dessen Divergenz),
erhalten wir
 
∂A
∂x
 ∂A  ∂2A ∂2A ∂2A
div grad A = ∇ · (∇A) = ∇ ·  = + + . (7.53)
∂y ∂x2 ∂y 2 ∂z 2
∂A
∂z

Wir schreiben dafür auch

div grad A = ∇2 A = ∆A (7.54)


2 2 2
∂ ∂ ∂
und nennen den Operator ∆ = ∂x 2 + ∂y 2 + ∂z 2 den Laplace-Operator. Der Laplace-Operator

ist ein Differentialoperator, der zum Beispiel in der Poissongleichung vorkommt, welche das von
einer Ladungsverteilung erzeugte elektrische Potential beschreibt.

7.5 Rotation

7.5.1 Definition

~ r ) können wir auch das


Neben dem Skalarprodukt des Nabla-Operators mit dem Vektorfeld A(~
~ bilden und erhalten dadurch die Rotation (Englisch: curl ) von A:
Vektorprodukt von ∇ und A ~

 ∂
    ∂Az ∂Ay

∂x Ax ∂y − ∂z
~ r) = ∇ × A
~= ∂     ∂Ax ∂Az

rot A(~  ∂y  ×  Ay  = 
 ∂z − ∂x
.
 (7.55)
∂ ∂Ay ∂Ax
∂z
Az ∂x − ∂y

~ des Vektorfeldes A
Die Rotation rot A ~ ist selbst ein Vektorfeld. Man nennt dieses Feld auch Wir-
belfeld.

7.5.2 Anschauliche Interpretation als lokale Wirbelstärke

Zur anschaulichen Interpretation der Rotation (als lokale Wirbelstärke) betrachten wir ein kon-
kretes Beispiel. Wir stellen uns eine Flüssigkeit vor, in der ein Wirbel vorhanden ist. Von oben
betrachtet sind die Feldlinien des zugehörigen Geschwindigkeitsfeldes konzentrische Kreise um den
Ursprung (siehe Abb. 7.10).

Die Geschwindigkeit ~v der Flüssigkeit am Ort ~r sei gegeben durch (siehe Abschnitt 2.8.2)

~v (~r) = ~ω × ~r. (7.56)

wobei ~ω ein Winkelgeschwindigkeitsvektor mit Betrag |~ω | = ω ist und normal zur Zeichenebene
steht sowie zum Betrachter hin zeigt. Gemäß Gleichung (7.56) ist die Geschwindigkeit ~v (~r) senk-
recht auf ~r und ~
ω und liegt deshalb in der Zeichenebene. Für alle Entfernungen vom Mittelpunkt
bewegt sich die Flüssigkeit mit derselben Winkelgeschwindigkeit ω um den Ursprung. Man nennt
so einen Wirbel einen homogenen Wirbel mit der Drehachse durch den Ursprung. Je großer ω
ist, umso schneller dreht sich der Wirbel (umso stärker ist er also).

Die Rotation dieses Strömungsfeldes ist gemäß der Definition in Gleichung (7.55) gegeben durch:

rot ~v (~r) = ∇ × ~v (~r) = ∇ × (~ω × ~r). (7.57)


180 7 Differentiation von Feldern: grad, div und rot

Abbildung 7.10: Geschwindigkeitsfeld ~v = ~ω × ~r einer rotierenden Flüssigkeit.

Falls wir die z-Achse in Richtung ω


~ legen, haben wir
     
0 x −ωy
     
~ × ~r =  0  ×  y  =  ωx 
ω (7.58)
ω z 0

und deshalb
     

−ωy ∂x −ωy
   ∂   
rot ~v (~r) = ∇ ×  ωx  =  ∂y  ×  ωx 
0 ∂ 0
∂z
   

− ∂z (ωx) 0
 ∂   
=  − ∂z (ωy)  =  0 , (7.59)
∂ ∂
∂x ωx + ∂y ωy 2ω

das heißt, die Rotation von diesem speziellen Strömungsfeld ist gleich dem doppelten Winkelge-
schwindigkeitsvektor ω
~:

rot ~v = 2~ω. (7.60)

Wir können die Rotation von ~v also sowohl nach Richtung als auch nach Größe als eine lokale
Wirbelstärke auffassen. Man nennt daher rot A(~ ~ r ) auch das Wirbelfeld von A(~ ~ r ). In unserem
Beispiel ist rot ~v konstant, im Allgemeinen ändert sich aber die Rotation rot ~v von Ort zu Ort.

Zur weiteren Veranschaulichung der Rotation betrachten wir eine inhomogene Strömung, in der
die Strömungsgeschwindigkeit ~v (~r) vom Ort abhängt. Die in Abb. 7.11 dargestellte Strömung
beispielsweise hat ein Geschwindigkeitsprofil, bei dem die Geschwindigkeit in x-Richtung linear
mit der y-Koordinate zunimmt, das heißt, die Strömungsgeschwindigkeit ist oben höher als unten.

Wir stellen uns nun einen kleinen Quader vor, der mit der Strömung mitschwimmt (etwa einen
kleinen Holzblock, der in einem Bach mit der Strömung mittreibt) (siehe Abb. 7.12).

Aus der Perspektive des Quaders, also in einem mitbewegten Bezugssystem, bewegt sich die Flüssig-
keit oberhalb und unterhalb des Quaders in entgegengesetzte Richtung und verursacht dadurch eine
Drehung des Quaders (siehe Abb. 7.13).
7 Differentiation von Feldern: grad, div und rot 181

Abbildung 7.11: Geschwindigkeitsfeld einer Strömung mit linearem Geschwindigkeitsprofil.

Abbildung 7.12: Mitschwimmendes Objekt in der Strömung von Abb. 7.11.

Wie schnell rotiert nun dieser Quader? Unter der Annahme, dass die Translation des Quaders
mit der an seinem Mittelpunkt vorherrschenden Geschwindigkeit ~v (x, y) erfolgt und die oberen
und unteren Seitenflächen sich mit der Strömung mitbewegen, ist die Winkelgeschwindigkeit des
Quaders gegeben durch
h    i
vx x, y + dy2 − vx x, y − dy
2
ω= , (7.61)
dy
wobei dy die Kantenlänge des Quaders in y-Richtung ist. Für kleine Quader gilt also
∂vx
ω= . (7.62)
∂y
Für eine solche Strömung, in der die x-Komponente der Geschwindigkeit linear von der y-Komponente
abhängt (man nennt eine solche Strömung eine Scherströmung mit linearem Geschwindigkeitspro-
fil),
vx = γy, (7.63)
vy = 0, (7.64)
vz = 0, (7.65)
erhalten wir für die Winkelgeschwindigkeit des Quaders ω = ∂v
∂y = γ. Die Konstante γ beschreibt
x

dabei den Anstieg des Geschwindigkeitsprofils. Die Rotation dieses Geschwindigkeitsfeldes ist folg-
lich:
 ∂       
∂x γy 0 0
 ∂       
rot ~v = ∇ × ~v =  ∂y  ×  0  =  0  =  0  = −~ω. (7.66)
∂ 0 −γ −ω
∂z

Auch hier ist also die Rotation ein Maß für die lokale Wirbelstärke. (Das Minuszeichen haben wir
hier, weil die Rotation in der xy-Ebene in mathematisch negativer Richtung erfolgt.) Die Rotation
beschreibt also, wie ein kleines Teilchen rotiert, das mit der Strömung mittreibt.
~ r ) nennt man an der Stelle ~r wirbelfrei, wenn rot A
Ein Feld A(~ ~ an der Stelle ~r verschwindet.

Beispiel:

Wir betrachten wieder das Schwerefeld


 
x
GM m
F~ = −
 
3 ·  y . (7.67)
2 2 2
(x + y + z ) 2
z
182 7 Differentiation von Feldern: grad, div und rot

Abbildung 7.13: Geschwindigkeitsfeld der Strömung von Abb. 7.11 aus der Perspektive des mit-
schwimmenden Objekt.

Die Rotation dieses Feldes ist


 
∂Fz ∂Fy
∂y − ∂z
 
rot F~ = ∇ × F~ = 

∂Fx
∂z − ∂Fz
∂x
.
 (7.68)
∂Fy ∂Fx
∂x − ∂y

Die partielle Ableitung ∂Fz /∂y ist gegeben durch:


 
∂Fz ∂ z 2y 3
= −GM m 3 = −GM mz 5 −
∂y ∂y (x + y + z ) 2
2 2 2 (x + y 2 + z 2 ) 2
2 2
3GM mzy 3GM mzy
= 5 = . (7.69)
(x2 + y 2 + z 2 ) 2 r5

Allgemein gilt
∂Fα 3GM mαβ
= für α, β = x, y, z und α 6= β. (7.70)
∂β r5
Das heißt aber, dass
∂Fα ∂Fβ
= . (7.71)
∂β ∂α
Infolgedessen verschwinden alle Komponenten der Rotation in Gleichung (7.68):
 
0
rot F~ =  0  = ~0.
 
(7.72)
0

Das Gravitationsfeld ist also wirbelfrei (so wie alle radialen (kugelsymmetrischen) Vektorfelder).

7.5.3 Rechenregeln

Für die Rotation gelten folgende Rechenregeln:

~ r ) = ~c gilt:
• Für ein konstantes Feld A(~
~ = 0.
rot A (7.73)

• Summenregel:
~ + B)
rot (A ~ ~ + rot B.
= rot A ~ (7.74)

• Faktorregel:
~ = α(∇ × A)
∇ × (αA) ~ ~ = αrot A).
(rot αA ~ (7.75)
7 Differentiation von Feldern: grad, div und rot 183

• Produktregel für Produkt aus Skalar- und Vektorfeld:

~
rot (AB) = ~ + grad A × B.
A rot B ~ (7.76)

Diese Regeln ergeben sich einfach durch Anwendung der Regeln für die partielle Differentiation.
Insbesondere haben wir für die letzte Regel:
   

∂x ABx
~
rot (AB) = ∇ × (AB) ~ = 
 

 ×  ABy 

∂y
∂ ABz
∂z
 
∂ ∂
(ABz ) − ∂z (ABy )
 ∂y 
=  ∂ (AB ) − ∂ (AB ) 
 ∂z x ∂x z 
∂ ∂
∂x (ABy ) − ∂y (ABx )
 
∂A ∂Bz ∂A ∂By
· B z + A − · By − A
 ∂y ∂y ∂z ∂z 
=  ∂A · B + A ∂Bx − ∂A · B − A ∂Bz 
 ∂z x ∂z ∂x z ∂x 
∂A ∂By ∂A ∂Bx
∂x · By + A ∂x − ∂y · Bx − A ∂y
   
∂A ∂A ∂Bz ∂B
· Bz − ∂z · By A ∂y − A ∂zy
 ∂y   
=  ∂A · B − ∂A · B  +  A ∂Bx − A ∂Bz 
 ∂z x ∂x z   ∂z ∂x 
∂By
∂A
∂x · By − ∂A
∂y · Bx A ∂x − A ∂B
∂y
x

= ~ + A(∇ × B)
∇A × B ~ = grad A × B
~ + A rot B.
~ (7.77)

Da die Rotation eines Vektorfeldes wieder ein Vektorfeld ist, können wir auch die Rotation eines
Wirbelfeldes bilden:

~ = ∇ × (∇ × A).
rot (rot A) ~ (7.78)

Nach einigen algebraischen Umformungen findet man

~ = ∇(∇ · A)
∇ × (∇ × A) ~ − ∆A
~ (7.79)

oder, anders ausgedrückt,

~ = grad (divA)
rot (rot A) ~ − div grad A,
~ (7.80)

wobei die Anwendung des Laplace-Operators auf ein Vektorfeld wieder komponentenweise definiert
ist.

7.5.4 Wirbelfreie und quellenfreie Felder


• Ein Gradientenfeld
 
∂A ∂A ∂A
∇A = , , (7.81)
∂x ∂y ∂z

ist nach dem Satz von Schwarz wirbelfrei:


     
∂ ∂A ∂2A ∂2 A
∂x ∂x ∂y∂z − ∂z∂y
 ∂   ∂A   ∂2A ∂2 A

∇ × ∇A =  ∂y × ∂y =
 ∂z∂x − ∂x∂z
 = 0.
 (7.82)
∂ ∂A ∂2A ∂2A
∂z ∂z ∂x∂y − ∂y∂x
184 7 Differentiation von Feldern: grad, div und rot

Umgekehrt gilt auch, dass man in einem einfach zusammenhängenden Gebiet (das ist ein Ge-
~ als Gradienten eines Skalarfeldes ϕ darstellen
biet ohne “Löcher”) jedes wirbelfreie Feld B
kann:
~ =0
∇×B ⇒ es existiert ein Skalarfeld ϕ sodass : ~ = ∇ϕ.
B (7.83)

Das Skalarfeld ϕ ist nur bis auf eine Konstante bestimmt, da

∇(ϕ + C) = ∇ϕ. (7.84)

Dieser Zusammenhang wird in Abschnitt 8.4.3 ausführlich diskutiert.

• Ein Wirbelfeld

     ∂Az ∂Ay

∂ −
∂x Ax ∂y ∂z
~= ∂     ∂Ax ∂Az

∇×A  ∂y  ×  Ay  = 
 ∂z − ∂x

 (7.85)
∂ ∂Ay ∂Ax
∂z
Az ∂x − ∂y

ist quellenfrei:

~ = ∂ 2 Az ∂ 2 Ay ∂ 2 Ax ∂ 2 Az ∂ 2 Ay ∂ 2 Ax
∇ · (∇ × A) − + − + − = 0. (7.86)
∂x∂y ∂x∂z ∂y∂z ∂y∂x ∂z∂x ∂z∂y

~ als die Rotation eines anderen


Es kann gezeigt werden, dass das quellenfreie Feld B
~
Vekorfeldes A dargestellt werden kann:
~ =0
divB ⇒ ~ sodass B
es existiert ein Vektorfeld A ~ = ∇ × A.
~ (7.87)

~ wird das Vektorpotential genannt. Es ist nur bis auf den Gradienten eines Skalarfeldes
A
bestimmt:
~ = ∇ × (A
∇×A ~ + grad χ). (7.88)

Der Gradient grad χ ist die so genannte Eichung von A. ~ Die Eichung trägt nicht zum
Wirbelfeld bei und kann deshalb benutzt werden, um Nebenbedingungen zu erfüllen. In
Abschnitt 8.4.4 werden wir uns näher mit dem Vektorpotential beschäftigen.

7.6 Zusammenfassung Nabla-Operator ∇

Der Nabla-Operator ist ein Differentialoperator, der auf Felder angewandt wird. Je nach Feldart
entstehen durch unterschiedliche Anwendung des Nabla-Operators verschiedene Felder:

Gradient: ∇A(~r) (Richtung und Betrag des stärksten Anstiegs),


Divergenz: ~ r)
∇ · A(~ (Quellstärke),
Rotation: ~ r)
∇ × A(~ (Wirbelstärke).

Durch Anwendung der Rechenregeln kann man zeigen:

• Gradientenfelder sind wirbelfrei: ∇ × (∇A) = 0.


~ = 0.
• Wirbelfelder sind quellenfrei: ∇ · (∇ × A)
7 Differentiation von Feldern: grad, div und rot 185

~ können als Gradient eines Skalarfeldes ϕ dargestellt werden:


• Wirbelfreie Felder A
~ = ∇ϕ
A ~ = 0.
falls ∇ × A (7.89)

~ können als Rotation eines anderen Vektorfeldes B


• Quellenfreie Felder A ~ dargestellt werden:

~ = ∇×B
A ~ falls ~ = 0.
∇·A (7.90)

Die zweifache Anwendung des Nabla-Operators ergibt den Laplace-Operator

∂2A ∂2A ∂2A


∇ · (∇A) = + + . (7.91)
∂x2 ∂y 2 ∂z 2
Weiters gelten die folgenden Rechenregeln:

∇(A~ × B)
~ = ~ ·∇×A
B ~−A ~ · ∇ × B,
~ (7.92)
~ ~
∇ × (A × B) = ~ · ∇)A
(B ~ − B(∇
~ ~ − (A
· A) ~ · ∇)B
~ + A(∇
~ ~
· B), (7.93)
~ =
∇ × (∇ × A) ~ − ∆A.
∇(∇A) ~ (7.94)
186 7 Differentiation von Feldern: grad, div und rot
Kapitel 8

Integration von Feldern: Kurven-


und Flächenintegrale

Im Kapitel 2 haben wir gesehen, dass wir die bei der Verschiebung eines Körpers verrichtete
Arbeit mit Hilfe des Skalarproduktes der angewendeten Kraft F~ und der vektoriellen Verschiebung
~r ausdrücken können:

W = F~ · ~r. (8.1)

Wenn wir jedoch den Körper nicht auf einer geraden Linie bewegen beziehungsweise die Kraft
entlang des Weges nicht konstant ist, können wir diesen einfachen Ausdruck nicht mehr verwenden
(siehe Abb. 8.1). Das wäre etwa bei einem auf einem kurvigen Gleis gezogenen Fahrzeug oder
einer Seilbahn der Fall. Wenn wir die gesamte Strecke jedoch in kleine, annähernd gerade Stücke
zerlegen, können wir die in jedem kleinen Intervall verrichtete Arbeit mit Hilfe von Gleichung (8.1)
berechnen.

Abbildung 8.1: Verschiebung eines Körpers entlang eines geradlinigen (links) und eines gekrümmten
Weges (rechts).

Die Gesamtarbeit ergibt sich dann aus der Summe aller Arbeiten in den Teilstücken. Im Grenzfall
unendlich kleiner Intervalle wird diese Prozedur exakt und führt uns auf den Begriff des Kur-
venintegrals. Auf ähnliche Weise können wir zum Beispiel auch den Fluss durch eine gekrümmte
Fläche als Summe der Flüsse durch viele kleine, annähernd ebene Flächenelemente ausdrücken und
gelangen so zum Flächenintegral. Wir werden ferner sehen, wie diese Integrale durch die Sätze
von Stokes und Gauß mit der Rotation und Divergenz von Vektorfeldern zusammenhängen.

187
188 8 Integration von Feldern: Kurven- und Flächenintegrale

8.1 Kurvenintegrale

8.1.1 Definition

Ein wichtiges Beispiel für ein Kurvenintegral ergibt sich bei der Berechnung der Arbeit, die geleistet
wird, wenn ein Körper in einem Kraftfeld entlang einer gegebenen Kurve verschoben wird. Wir
betrachten ein Kraftfeld F~ (~r), zum Beispiel das Gravitationsfeld, das die Kraft beschreibt, die im
Punkt ~r auf einen Körper wirkt. Wir stellen uns nun vor, dass in diesem Kraftfeld der Körper auf
einer vorgegebenen Kurve C vom Punkt ~ra zum Punkt ~rb verschoben wird (siehe Abb. 8.2).

Abbildung 8.2: Ein Körper wird im Kraftfeld F~ (~r) entlang eines gekrümmten Weges von ~ra nach
~rb verschoben.

An jedem Punkt entlang dieses Weges herrscht eine bestimmte Kraft F~ , die Arbeit verrichtet. Zur
Berechnung dieser Arbeit können wir nun nicht den Ausdruck W = F~ · ~s aus Kapitel 2 verwenden,
weil sich die Kraft sowohl in Betrag als auch in Richtung entlang des Weges ändern kann und der
Weg im Allgemeinen nicht geradlinig ist. Um die gesamte Arbeit zu ermitteln, die bei Verschiebung
des Körpers von ~ra nach ~rb geleistet wird, zerlegen wir den Weg C in N kleine, gerade Stücke ∆~ri ,
die sich aus den Differenzen ∆~ri = ~ri+1 − ~ri , i = 0, . . . N − 1 auf der Kurve liegender Punkte ~ri
ergeben (siehe Abb. 8.3). Durch Wahl einer genügend großen Zahl N kann die Kurve C durch die
geraden Segmente ∆~ri beliebig gut angenähert werden.

Abbildung 8.3: Durch Zerlegen des Weges in viele kurze und annähernd gerade Teilstücke ∆~ri
können wir die geleistete Arbeit als ein Wegintegral ausdrücken.

Für eine genügend feine Zerlegung, das heißt, für genügend kleine Kurventeilstücke ∆~ri , können
wir die Kraft F~ in jedem Teilstück als konstant betrachten. Daher kann die im Teilstück i geleistete
Arbeit ∆Wi als das bekannte Skalarprodukt der Kraft F~ (~ri ) am Ort ~ri mit der kleinen Verschiebung
∆~ri geschrieben werden:

∆Wi = F~ (~ri ) · ∆~ri . (8.2)

Die insgesamt geleistete Arbeit ist die Summe der in den Teilstücken geleisteten Arbeiten ∆Wi
N
X −1 N
X −1
W ≈ ∆Wi = F~ (~ri ) · ∆~ri . (8.3)
i=0 i=0

Im Grenzwert unendlich kleiner (und unendlich vieler) Wegstücke ∆~ri erhalten wir den exakten
8 Integration von Feldern: Kurven- und Flächenintegrale 189

Wert der im Kraftfeld F~ (~r) auf dem vorgegebenen Weg geleisteten Arbeit:
N
X −1 Z
W = lim F~ (~ri ) · ∆~ri = F~ (~r) · d~r. (8.4)
N →∞ C
i=0

Wir nennen dies das Kurvenintegral (oder Linienintegral) des Vektorfeldes F~ längs der Raum-
kurve C. (Wir können das Kurvenintegral für ein beliebiges Vektorfeld definieren, nicht nur für die
Kraft F~ .) Oft schreibt man für das Kurvenintegral auch:

Z~rb Z~rb
W = F~ (~r) · d~r oder W = F~ (~r) · d~r. (8.5)
~
ra ~
ra ,C

Abbildung 8.4: Bei einem geschlossenen Weg C sind Ausgangspunkt ~ra und Endpunkt ~rb identisch:
~ra = ~rb .

Falls ~ra = ~rb , die Kurve C also geschlossen ist (siehe Abb. 8.4), schreibt man für das Integral
I
F~ (~r) · d~r = Zc (8.6)
C

und nennt es die Zirkulation von F~ entlang C oder auch das geschlossene Kurvenintegral
oder Ringintegral.

8.1.2 Eigenschaften

Da im oben definierten Kurvenintegral der Ausdruck, über den integriert wird, ein Skalarprodukt
ist, ist das Kurvenintegral selbst auch ein Skalar.

Wenn man bei einem Kurvenintegral den Integrationsweg umkehrt (also den Integrationsweg in
umgekehrter Richtung durchläuft), ändert sich das Vorzeichen des Integrals
Z Z
F~ (~r) · d~r = − F~ (~r) · d~r, (8.7)
C −C

wobei −C den in umgekehrter Richtung durchlaufenen Integrationsweg bezeichnet. Diese Eigen-


schaft folgt daraus, dass bei einer Umkehrung des Integrationsweges alle ∆~ri ihr Vorzeichen wech-
seln und somit das Kurvenintegral selbst auch sein Vorzeichen wechselt.

Abbildung 8.5: Der Weg C besteht aus den beiden Teilwegen C1 und C2 .
190 8 Integration von Feldern: Kurven- und Flächenintegrale

Ferner ist das Kurvenintegral additiv, das heißt das Kurvenintegral über einem aus zwei Teilstücken
C1 und C2 bestehenden Weg C ist die Summe der Kurvenintegrale über C1 und C2 :
Z Z Z
F~ (~r) · d~r = F~ (~r) · d~r + F~ (~r) · d~r. (8.8)
C C1 C2

Wenn also die Zirkulation ZC entlang eines geschlossenen Weges C verschwindet, sind die Kur-
venintegrale entlang der beiden Kurven C1 und C2 , die die beiden Punkte ~ra und ~rb miteinander
verbinden, gleich (siehe Abb. 8.6):
I Z Z Z Z
ZC = F~ (~r) · d~r = F~ (~r) · d~r + F~ (~r) · d~r = F~ (~r) · d~r − F~ (~r) · d~r. (8.9)
C C1 −C2 C1 C2

Da aber ZC = 0, folgt:
Z Z
F~ (~r) · d~r = F~ (~r) · d~r. (8.10)
C1 C2

Abbildung 8.6: Die Punkte ~ra und ~rb liegen auf einer geschlossenen Kurve. Man kann sowohl über
die Kurve C1 als auch über die Kurve C2 von ~ra nach ~rb gelangen.

8.1.3 Berechnungsverfahren

Um Kurvenintegrale auszuwerten, führen wir sie auf gewöhnliche Integrale zurück. Falls die Kurve
C in Parameterform gegeben ist, das heißt, falls der Ortsvektor
 
x(t)
 
~r(t) =  y(t)  (8.11)
z(t)

als Funktion eines Parameters t im Bereich ta ≤ t ≤ tb gegeben ist, können wir das Kurvenintegral
in ein einfaches Integral über den Parameter t verwandeln. In diesem Fall entspricht jeder Punkt
~ri in der Zerlegung der Kurve einem bestimmten Parameterwert ti . Die beiden Randpunkte der
Kurve, ~ra und ~rb , erhalten wir für die Parameterwerte ta und tb :

~ra = ~r(ta ) und ~rb = ~r(tb ). (8.12)

Jedes gerade Teilstück ∆~ri = ~ri+1 − ~ri entspricht dann einem Teilintervall ∆ti = ti+1 − ti des
Parameters. In der Summe in Gleichung (8.3) dividieren und multiplizieren wir nun jeden Term
mit ∆ti und erhalten dadurch:
N −1 N −1
X X ∆~ri
W ≈ F~ (~ri ) · ∆~ri = F~ (~ri ) · ∆ti . (8.13)
i=0 i=0
∆ti
8 Integration von Feldern: Kurven- und Flächenintegrale 191

Im Grenzfall N → ∞ wird aus ∆~ri /∆ti die Ableitung des Ortsvektors nach dem Parameter t:

∆~ri d~r(t)
lim = . (8.14)
N →∞ ∆ti dt
Damit wird das Linienintegral zu

Ztb  
d~r
W = F~ (~r(t)) · dt. (8.15)
dt
ta

Dieses Integral ist ein gewöhnliches Integral, dessen Integrand, der Skalar F~ (~r(t)) · (d~r/dt), eine
Funktion des Parameters t ist. Dabei beinhaltet der Vektor d~r(t)/dt, der in jedem Punkt tangen-
tial zur Kurve ist, die Information über den Verlauf der Kurve (siehe Abb. 8.7). (Wenn man den
Vektor d~r(t)/dt normiert, erhält man den Tangentialvektor ~t = (d~r (t)/dt)/|d~r(t)/dt|.) Falls t die
Zeit ist, ist d~r(t)/dt = ~v (t) die Geschwindigkeit des Körpers, der sich gemäß ~r(t) entlang C bewegt.

Abbildung 8.7: Der Geschwindigkeitsvektor d~r(t)/dt ist tangential zur Kurve ~r(t).

Aus dieser Darstellung des Linienintegrals ergibt sich folgendes Rezept zur Berechnung von Li-
nienintegralen in Parameterform:

1. Zunächst drücken wir den Feldvektor F~ (~r) durch Einsetzen der parameterabhängigen Koor-
dinaten x(t), y(t) und z(t) als Funktion des Parameters t aus.

2. Dann differenzieren wir den Vektor ~r(t) nach t und bilden das Skalarprodukt F~ (~r(t))·(d~r/dt).

3. Schließlich integrieren wir dieses Skalarprodukt, das nur mehr eine Funktion von t ist, in den
Grenzen von ta bis tb .

Beispiel:

Wir bestimmen das Integral des Feldes F~ (x, y) = (2x + y, x) entlang der in Parameterform gege-
benen Kurve ~r(t) = (t, t2 ) (das ist eine Parabel) zwischen den Punkten, die zu den Parametern
ta = 0 und tb = 1 gehören. Die Kurve beginnt im Ursprung, ~r(ta = 0) = (0, 0), und endet im
Punkt ~r(tb = 1) = (1, 1). Der Feldvektor als Funktion von t ist gegeben durch:
! !
2
2x(t) + y(t) 2t + t
F~ (x(t), y(t)) = = . (8.16)
x(t) t

Ableitung des Ortsvektors nach t liefert


!
d~r 1
= (8.17)
dt 2t
192 8 Integration von Feldern: Kurven- und Flächenintegrale

Abbildung 8.8: Eine Kraft F~ (~r) verrichtet Arbeit entlang einer Parabel.

und somit
! !
d~r 2t + t2 1
F~ · = · = 2t + t2 + 2t2 = 2t + 3t2 . (8.18)
dt t 2t

Das Kurvenintegral ist deshalb gegeben als:


Z Ztb   Z1 1
d~r 2t2 3t3
F~ (~r) · d~r = F~ · dt = 2
(2t + 3t )dt = + = 1 + 1 = 2. (8.19)
C dt 2 3 0
ta 0

Falls die Integrationskurve C nicht in Parameterform vorliegt, können wir folgendermaßen vorge-
hen. In der Summe in Gleichung (8.3) lässt sich jedes Teilstück und der dazugehörige Vektor F~ (~ri )
in Komponenten zerlegen:

∆~ri = ∆xi~ex + ∆yi~ey + ∆zi~ez (8.20)

und

F~ (~ri ) = Fx (~ri )~ex + Fy (~ri )~ey + Fz (~ri )~ez . (8.21)

Das Skalarprodukt F~ (~ri ) · ∆~ri können wir somit schreiben als

F~ (~ri ) · ∆~ri = Fx (~ri )∆xi + Fy (~ri )∆yi + Fz (~ri )∆zi (8.22)

und die Summe in Gleichung (8.3) besteht somit aus drei Termen, die zu den drei Koordinaten-
richtungen gehören:
X X X
W ≈ Fx (~ri )∆xi + Fy (~ri )∆yi + Fz (~ri )∆zi . (8.23)

Im Grenzwert einer unendlich feinen Zerlegung des Integrationsweges in Teilstücke erhalten wir
daraus die Summe dreier gewöhnlicher Integrale:
Zxb Zyb Zzb
W = Fx (~r)dx + Fy (~r)dy + Fz (~r)dz
xa ya za
Zxb Zyb Zzb
= Fx (x, y, z)dx + Fy (x, y, z)dy + Fz (x, y, z)dz. (8.24)
xa ya za

Das Problem ist hier, dass die Integranden von allen drei Variablen x, y und z abhängen und nicht
nur von der jeweiligen Integrationsvariablen. Betrachten wir zum Beispiel das erste Integral. Hier
8 Integration von Feldern: Kurven- und Flächenintegrale 193

Abbildung
R 8.9: Räumliche Kurve und ihre Projektion in die xy-Ebene. Bei der Berechnung von
Fx (~r)dx müssen sowohl y als auch z als Funktion von x ausgedrückt werden.

gehören zu jedem x-Wert auch wohldefinierte Werte von y und z (siehe Abb. 8.9). Diese hängen
von der Gestalt der Integrationskurve ab. Falls wir nun y und z mit Hilfe der Kurve als Funktion
von x ausdrücken, erhalten wir für das erste Integral
Zxb
Fx (x, y(x), z(x))dx, (8.25)
xa

ein gewöhnliches Integral über x. (Falls wir y und z aus Eindeutigkeitsgründen nicht als Funktion
von x ausdrücken können, zerlegen wir die Integrationskurve in Teilbereiche, sodass dies möglich
ist.)

Mit den anderen beiden Integralen verfahren wir analog und erhalten schließlich
Zxb Zyb Zzb
W = Fx (x)dx + Fy (y)dy + Fz (z)dz, (8.26)
xa ya za

wobei Fx (x) = Fx (x, y(x), z(x)), Fy (y) = Fy (x(y), y, z(y)) und Fz (z) = Fz (x(z), y(z), z). Die
Information über die Gestalt der Kurve C ist nun in den Funktionen Fx (x), Fy (y) und Fz (z)
enthalten.

Beispiel:

Wir berechnen wieder das Kurvenintegral aus dem letzten Beispiel. Hier war

F~ (x, y) = (2x + y, x) (8.27)

und die Kurve war gegeben durch ~r(t) = (t, t2 ) oder, in nichtparametrischer Form, durch y = x2 .
Für das Kurvenintegral haben wir also:
Zxb Zyb
W = Fx (x, y)dx + Fy (x, y)dy, (8.28)
xa ya

wobei gemäß Angabe xa = ya = 0 und xb = yb = 1. Da wir mit y = x2 keine Eindeutig-


keitsprobleme haben, können wir im ersten Term y und im zweiten Term x durch die jeweilige
194 8 Integration von Feldern: Kurven- und Flächenintegrale

Integrationsvariable ausdrücken:
Zxb Zyb
2 √
W = Fx (x, x )dx + Fy ( y, y)dy. (8.29)
xa ya

Unter Berücksichtigung von F~ (x, y) = (Fx (x, y), Fy (x, y)) = (2x + y, x) erhalten wir

Z1 Z1   1 1
2 √ 2x2 x3 + 2 y 23 = 1 + 1 + 2 = 2,

W = (2x + x )dx + ydy = + (8.30)
2 3
0 3
0 3 3
0 0

was mit dem Resultat aus dem vorherigen Beispiel, bei dem eine Parameterdarstellung der Kurve
verwendet wurde, übereinstimmt.

8.1.4 Kurvenintegrale über Gradientenfelder


R
Kurvenintegrale der Form C F~ (~r) · d~r hängen im Allgemeinen sowohl vom Vektorfeld F~ als auch
von der Integrationskurve C ab (insbesondere von deren Anfangs- und Endpunkt). Unter gewissen
R
Umständen kann es jedoch vorkommen, dass das Kurvenintegral C F~ (~r) · d~r nur vom Kraftfeld
selbst und den Endpunkten ~ra und ~rb abhängt, nicht aber von der Form des Weges, der ~ra und ~rb
verbindet. Wir wollen uns in diesem Abschnitt mit der Frage beschäftigen, unter welchen Bedin-
gungen dies der Fall ist.

Als Beispiel betrachten wir das Linienintegral im Kraftfeld F~ (~r) = 2~r = (2x, 2y, 2z) und verbinden
den Anfangspunkt ~ra = (0, 0, 0) mit dem Endpunkt ~rb = (1, 1, 1) durch drei unterschiedliche
Kurven C1 , C2 und C3 (siehe Abb. 8.10):

C1 : Gerade von (0,0,0) nach (1,1,1),


C2 : Polygonzug (0, 0, 0) → (1, 0, 0) → (1, 1, 0) → (1, 1, 1),
C3 : Parabelbogen von (0,0,0) nach (1,1,1).

Für die Kurve C1 ist die Parameterdarstellung

d~r
~r(t) = (t, t, t) also ist = (1, 1, 1) und ta = 0, tb = 1. (8.31)
dt
Das Kurvenintegral lautet somit
   
Z Z1 2t 1 Z1 1
6t2
F~ (~r) · d~r =
   
 2t  ·  1  dt = 6tdt = = 3. (8.32)
C2 2 0
0 2t 1 0

Entlang der Kurve C2 erhalten wir

Z Z1 Z1 Z1 1
2x2
F~ (~r) · d~r = 2xdx + 2ydy + 2zdz =3 = 3. (8.33)
C2 2 0
0 0 0
| {z } | {z } | {z }
r(x)=(x,0,0)
~ r(y)=(1,y,0)
~ r(z)=(1,1,z)
~
x als Parameter y als Parameter z als Parameter

d~
r
Die Parabel C3 ist in Parameterform gegeben durch: ~r(t) = (t, t, t2 ), d. h. dt = (1, 1, 2t) und somit
8 Integration von Feldern: Kurven- und Flächenintegrale 195

Abbildung 8.10: (a) Integrationsweg C1 , (b) Integrationsweg C2 und (c) Integrationsweg C3 .

gilt
   
Z Z1 2t 1 Z1
F~ (~r) · d~r  2t  ·  1  dt = (4t + 4t3 )dt
   
=
C3
0 2t2 2t 0
1
4t2 4t4
= + = 2 + 1 = 3. (8.34)
2 4 0

Das heißt, für alle drei Wege C1 , C2 und C3 erhalten wir den selben Wert für das Kurvenintegral.

Es stellt sich nun die Frage, ob auch für andere Wege das Kurvenintegral dasselbe ist. Die Antwort
auf diese Frage ist ja, denn wir können das Integral schreiben als:
Z Z Z ~rb

F~ (~r) · d~r = 2~r · d~r = d(~r 2 ) = ~r 2
C C C ~
ra
= ~rb2 − ~ra2 = 3. (8.35)

Hier kommt es also nur auf den Anfangspunkt ~ra und den Endpunkt ~rb der Kurve an. Für das
spezielle Vektorfeld F~ (~r) = 2~r ist also offensichtlich das Kurvenintegral unabhängig vom Weg.
Welche Bedingung erfüllen Kraftfelder, für die das der Fall ist?

Um diese wichtige Frage zu beantworten, gehen wir zunächst davon aus, dass ein bestimmtes
~ r ) die Eigenschaft besitzt, dass das Kurvenintegral nicht von der Form der Kurve C
Vektorfeld A(~
abhängt sondern nur von den beiden Punkten ~ra und ~rb , die von der Kurve C verbunden werden.
Wir stellen uns also vor, dass es viele verschiedene Wege C1 , C2 , C3 , usw. gibt (siehe Abb. 8.11),
die alle von ~ra nach ~rb verlaufen und alle das gleiche Kurvenintegral liefern, dessen Wert wir φ
nennen:
Z Z
φ= ~ r ) · d~r =
A(~ ~ r ) · d~r = . . . .
A(~ (8.36)
C1 C2

Obwohl das Kurvenintegral φ nicht von der Form der Kurve abhängt, hängt es sehr wohl von dessen
Anfangs- und Endpunkt ab. Wir wollen uns nun überlegen, wie genau φ von ~ra und ~rb abhängt.
Es genügt dabei, die Abhängigkeit vom Endpunkt ~rb zu betrachten. Wenn wir die Abhängigkeit
vom Ausgangspunkt ermitteln wollen, drehen wir einfach die Richtung der Wege um und machen
so Endpunkte zu Anfangspunkten.

Der Einfachheit halber nennen wir den Endpunkt der Wege jetzt ~r (statt ~rb ) und betrachten die
Abhängigkeit von φ von ~r, wobei wir den Anfangspunkt ~ra festhalten:

Z~r
φ(~r) = ~ q ) · d~q.
A(~ (8.37)
~
ra
196 8 Integration von Feldern: Kurven- und Flächenintegrale

Abbildung 8.11: Alle Integrationswege (C1 , C2 , C3 und C4 ) verbinden ~ra mit ~rb und führen zum
R
~ r ) · d~r.
selben Kurvenintegral Ci A(~

Hier haben wir die Integrationsvariable in ~q umgetauft, um Verwechslungen zu vermeiden. (Der


Name einer Integrationsvariablen spielt keine Rolle, sollte sich jedoch von den Namen der anderen
Variablen unterscheiden.)

Abbildung 8.12: Durch Verschiebung des Kurvenendpunktes von ~r nach ~r + ∆~r ändert sich die
~ r ) · ∆~r.
Funktion φ(~r) näherungsweise um ∆φ(~r) = A(~

Um herauszufinden, wie genau φ(~r) von ~r abhängt, verschieben wir ~r um einen kleinen Vektor ∆~r
(siehe Abb. 8.12). Wie ändert sich nun φ(~r), wenn wir den Endpunkt von ~r nach ~r +∆~r verschieben?
Falls der Weg C2 von ~ra nach ~r + ∆~r nicht durch ~r geht, können wir ihn so verbiegen, dass er
das tut. Laut Voraussetzung ändert das ja nicht den Wert φ(~r + ∆~r), weil das Kurvenintegral
unabhängig von der Form des Weges ist.

Wir können jetzt φ(~r + ∆~r) ausdrücken als Summe von zwei Kurvenintegralen, nämlich einem von
~ra bis ~r entlang C2′ und einem von ~r nach ~r + ∆~r entlang C2′′ :
Z Z ~
rZ
+∆~
r

φ(~r + ∆~r) = ~ q ) · d~q =


A(~ ~ q ) · d~q +
A(~ ~ q ) · d~q.
A(~ (8.38)
C2 C2′
~
r,C2′′

Das erste Integral auf der rechten Seite ist jedoch gleich φ(~r) (laut Voraussetzung spielt es ja keine
Rolle, ob wir über C1 oder C2′ integrieren). Somit erhalten wir
~
rZ+∆~
r

φ(~r + ∆~r) = φ(~r) + ~ q ) · d~q.


A(~ (8.39)
~
r

~ r ) nicht entlang der kurzen Strecke von ~r nach


Falls ∆~r sehr klein ist, ändert sich der Vektor A(~
8 Integration von Feldern: Kurven- und Flächenintegrale 197

~r + ∆~r. Also können wir in diesem Fall das Integral in der obigen Gleichung annähern durch
~ r ) · ∆~r und wir erhalten schließlich:
A(~

~ r ) · ∆~r.
φ(~r + ∆~r) − φ(~r) ≈ A(~ (8.40)

Die linke Seite ist aber (für ∆~r → 0) das totale Differential φ der Funktion φ(~r), das wir als

dφ = grad φ · d~r (8.41)

ausdrücken können. Im Limes kleiner Verschiebungen d~r gilt also


~ r ) · d~r = grad φ · d~r.
A(~ (8.42)

Da diese Beziehung für jede beliebige Verschiebung d~r gilt, folgt schließlich
~ r ).
grad φ(~r) = A(~ (8.43)

Wenn also das Kurvenintegral über ein Vektorfeld A ~ nur vom Anfangs- und Endpunkt des Weges,
nicht aber von der Form des Weges abhängt, dann ist das Vektorfeld durch den Gradienten eines
skalaren Feldes darstellbar. Das heißt, es existiert in diesem Fall ein geeignetes skalares Feld φ(~r),
das bis auf eine additive Konstante bestimmt ist, sodass A ~ = grad φ. Die Wahl der Konstanten ist
der Wahl des Anfangspunktes ~ra äquivalent.

Die Darstellbarkeit eines Vektorfeldes als Gradient eines skalaren Feldes ist also eine notwendige
Bedingung für die Unabhängigkeit des Kurvenintegrals von der Form des Weges. Bemerkenswer-
terweise ist es auch eine hinreichende Bedingung. Wenn nämlich das Vektorfeld A ~ als Gradient
eines skalaren Feldes dargestellt werden kann, das heißt, wenn A ~ = grad φ, dann gilt für das
Kurvenintegral:

Z~rb Z~rb Z~rb


~ r ) · d~r =
A(~ grad φ · d~r = dφ = φ(~rb ) − φ(~ra ). (8.44)
~
ra ,C ~
ra ,C ~
ra ,C

Das Integral hängt somit nur vom Anfangs- und vom Endpunkt ab.

Wir erhalten also folgenden Satz:


~ r ) sind genau dann (und nur dann) vom Weg unabhängig,
Kurvenintegrale über ein Vektorfeld A(~
wenn eine Funktion φ(~r) existiert, sodass A ~ = grad φ. Legt man φ an einer Stelle ~ra fest, ist φ
eindeutig bestimmmt.

Die Funktion φ wird Potential genannt (in der Physik bezeichnet man meistens −φ als das
~ nennt man
Potential. Die potentielle Energie in der Mechanik ist ein Beispiel dafür.). Das Feld A
auch ein konservatives Vektorfeld. Wie man einem Vektorfeld A ~ ansehen kann, ob wir es als
Gradientenfeld darstellen können, werden wir im Abschnitt 8.4 sehen.

Aus dem obigen Satz folgt, dass genau dann geschlossene Kurvenintegrale über das Vektorfeld A ~
verschwinden, wenn sich das Vektorfeld ~ als Gradient eines skalaren Feldes φ darstellen lässt.
A
H
~ r ) · d~r kann nämlich durch Wahl zweier beliebiger Punkte ~ra und ~rb auf der
Das Ringintegral C A(~
Kurve C in zwei Teile zerlegt werden, die den Wegen C1 und C2 entsprechen (siehe Abb. 8.13):
I Z Z
~ r ) · d~r =
A(~ ~ r ) · d~r +
A(~ ~ r ) · d~r.
A(~ (8.45)
C C1 C2

Wir durchlaufen nun C2 in entgegengesetzter Richtung und drehen damit das Vorzeichen des
zweiten Integrals um:
I Z Z
~ r ) · d~r =
A(~ ~ r ) · d~r −
A(~ ~ r ) · d~r.
A(~ (8.46)
C C1 −C2
198 8 Integration von Feldern: Kurven- und Flächenintegrale

Abbildung 8.13: Durch Wahl zweier Punkte ~ra und ~rb zerlegen wir das Ringintegral in zwei Linien-
integrale entlang C1 und C2 .

Da aber C1 und −C2 Anfangs- und Endpunkt gemeinsam haben und laut Voraussetzung das
Kurvenintegral über A~ nicht von der Form des Weges abhängt, sind die beiden Integrale auf der
rechten Seite der obigen Gleichung gleich. Demzufolge verschwindet das Ringintegral:
I
~ r ) · d~r = 0.
A(~ (8.47)
C

8.2 Oberflächenintegrale

8.2.1 Definition

Im Kapitel 2 haben wir gesehen, dass wir das pro Zeiteinheit durch eine Fläche strömende Flüssig-
keitsvolumen, also den Fluss, als Skalarprodukt des die Strömung beschreibenden Geschwindig-
keitsvektors ~v und des Flächenvektors f~ darstellen können (siehe Abb. 8.14):
φ = Fluss = f~ · ~v . (8.48)
Dabei sind wir davon ausgegangen, dass die Fläche eben ist und der Geschwindigkeitsvektor ~v
nicht vom Ort abhängt (ein solches Vektorfeld nennt man homogen).

Abbildung 8.14: Homogenene Strömung Abbildung 8.15: Inhomogene Strömung


durch eine ebene Fläche mit Flächenvektor durch eine gekrümmte Fläche.
f~.

Wie können wir nun dieses Ergebnis auf eine beliebige, räumlich (und möglicherweise zeitlich)
veränderliche Strömung durch eine gekrümmte Fläche verallgemeinern (siehe Abb. 8.15)? In diesem
8 Integration von Feldern: Kurven- und Flächenintegrale 199

Fall wird die Strömungsgeschwindigkeit durch ein Vektorfeld ~v (~r) beschrieben und die Fläche F
kann nicht durch einen einzelnen Flächenvektor dargestellt werden. Um den Fluss durch diese
(wirkliche oder gedachte) Fläche F zu berechnen, gehen wir in Analogie zum Kurvenintegral vor,
bei dem wir eine Kurve in kleine Teilstücke ∆~ri eingeteilt haben, und zerlegen die Fläche F
in viele kleine Teilstücke, die wir durch ebene Flächenstücke ∆fi , die so genannten Facetten,
approximieren (siehe Abb. 8.16). In der Praxis benötigen wir natürlich eine analytische Darstellung
dieser Facetten. Hier wollen wir zunächst jedoch nur davon ausgehen, dass wir eine solche Zerlegung
in Facetten durchführen können, ohne auf ihre spezifische analytische Darstellung einzugehen.

Für jede der Facetten, die wir mit dem Index i nummerieren, definieren wir nun einen Flächenvektor
∆f~(~ri ), dessen Betrag gleich dem Flächeninhalt der Facette um den Punkt ~ri ist und der normal
auf diese Facette steht. Der Punkt ~ri ist ein beliebiger Punkt im Inneren der i-ten Facette.

Abbildung 8.16: Zerlegung der Fläche F in kleine Facetten mit Flächenvektoren ∆f~i .

Wir wählen die Facetten so klein, dass das Vektorfeld innerhalb jeder Facette näherungsweise
konstant ist. Das heißt, innerhalb der Facette um ~ri mit dem Flächenvektor ∆f~(~ri ) ist das Vek-
torfeld konstant und gleich ~v (~ri ). Wir können nun den Fluss durch das Flächenelement ∆fi als
Skalarprodukt berechnen:
∆φi = ~v (~ri ) · ∆f~(~ri ). (8.49)
Der Gesamtfluss φ durch die Fläche F ergibt sich als Summe aller Teilflüsse:
N
X
φ≈ ~v (~ri ) · ∆f~(~ri ). (8.50)
i=1

Im Limes unendlich vieler (N → ∞) und unendlich kleiner Facetten wird aus dieser Summe ein
Flächenintegral:
N
X Z
φ = lim ~
~v (~ri ) · ∆f (~ri ) = ~v (~r) · df~(~r). (8.51)
N →∞ F
i=1

~ r ) definiert werden (nicht nur für ein Strömungs-


Flächenintegrale können für beliebige Vektorfelder A(~
feld ~v (~r)):
Z Z Z Z
φ= ~ r ) · df~(~r) =
A(~ Ax dfx + Ay dfy + Az dfz . (8.52)
F F F F

Oft ist es notwendig, ein Flächenintegral über einer geschlossenen Fläche F (zum Beispiel die
Oberfläche einer Kugel) zu berechnen. Wir bezeichnen ein solches Integral mit
I
~ · df~
A (8.53)
F

und definieren die Flächennormalen üblicherweise so, dass sie aus dem geschlossenen Gebiet her-
auszeigen.
200 8 Integration von Feldern: Kurven- und Flächenintegrale

8.2.2 Darstellung der Fläche und des Flächenelements

In der praktischen Berechnung von Oberflächenintegralen ist es notwendig, eine analytische Dar-
stellung der Fläche im Raum zu wählen. In kartesischen Koordinaten können wir, wie wir
bereits früher gesehen haben, Flächen im Raum darstellen, indem wir jedem Punkt der xy-Ebene
eine z-Koordinate zuordnen, z = z(x, y) (siehe Abb. 8.17). Die Fläche F besteht dann aus den
Punkten (x, y, z(x, y)), wobei x und y aus einem bestimmten Definitionsbereich D der xy-Ebene
stammen (nämlich der Projektion der Fläche F in die xy-Ebene).

Abbildung 8.17: Die Fläche F wird durch die Abbildung 8.18: Da zu einem Punkt (x, y)
Funktion z = z(x, y) beschrieben. in der xy-Ebene mehr als ein Punkt auf der
Fläche existiert, muss die Fläche in die zwei
Teilflächen F1 und F2 zerlegt werden.

Falls es zu einem Punkt (x, y) mehr als einen z-Wert gibt (siehe Abb. 8.18), muss die Fläche in
mehrere Teilflächen Fi zerlegt werden.

Beispiel:

Abbildung 8.19: Die Oberfläche der Kugel besteht aus den zwei Halbkugeln F1 und F2 .

In kartesischen Koordinaten kann die Oberfläche einer Kugel mit Radius R und Mittelpunkt im
Ursprung durch die zwei Teilflächen F1 mit positiven z-Werten und F2 mit negativen z-Werten
dargestellt werden (siehe Abb. 8.19):
p
F1 : (x, y, + R2 − (x2 + y 2 )), (8.54)
p
F2 : (x, y, − R2 − (x2 + y 2 )). (8.55)
8 Integration von Feldern: Kurven- und Flächenintegrale 201

Der Definitionsbereich in der xy-Ebene ist hier ein Kreis mit Radius R und Mittelpunkt im Ur-
sprung.

Bis jetzt haben wir x und y als die freien Parameter gewählt. Wir könnten aber Flächen genauso
gut mit (y, z) oder (x, z) als freien Parameter wählen. Allgemeiner können wir eine Fläche F durch
einen Ortsvektor ~r(u, v) beschreiben, der von zwei Parametern u und v abhängt:
 
x(u, v)
 
~r = ~r(u, v) =  y(u, v)  . (8.56)
z(u, v)

Im Falle der kartesischen Darstellung gilt u = x, v = y (falls x und y als Parameter verwendet
werden). Diese allgemeine Parameterdarstellung ist analog zur Parameterdarstellung einer Kurve.
Da eine Kurve im Raum jedoch ein eindimensionales Objekt ist, genügt in diesem Fall ein einziger
Parameter.

Abbildung 8.20: Auf der Mantelfläche eines Zylinders mit Radius ρ = R können die Zylinderkoor-
dinaten ϕ und z beliebige Werte annehmen.

Oberflächenintegrale werden einfacher, wenn ein Koordinatensystem mit geeigneter Symmetrie


gewählt wird. Wollen wir zum Beispiel die Oberfläche eines unendlich langen Zylinders beschreiben,
sind Zylinderkoordinaten (ϕ, ρ, z) zweckmäßig (siehe Kapitel 2). Für die Mantelfläche eines
Zylinders mit Radius R gilt (siehe Abb. 8.20):

ρ = const = R, ϕ, z beliebig (0 ≤ ϕ < 2π, −∞ < z < ∞). (8.57)

Hier spielen ϕ und z die Rolle der Parameter u und v. Die Fläche wird von einem Netz aus so ge-
nannten Parameterlinien überdeckt, auf denen ϕ beziehungsweise z konstante Werte annehmen.

Ein weiteres Beispiel ist die Darstellung der Kugeloberfläche in den Kugelkoordinaten (r, ϑ, ϕ)
(siehe Kapitel 2). Die Oberfläche einer Kugel mit Radius R ist definiert durch (siehe Abb. 8.21):

r = const = R, ϕ, ϑ beliebig in (0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π). (8.58)

Hier werden Orte auf der Kugeloberfläche durch Angabe der beiden Parameter ϕ und ϑ definiert.
Die Parameterlinien sind die Längen- und Breitengrade.
202 8 Integration von Feldern: Kurven- und Flächenintegrale

Abbildung 8.21: Auf der Oberfläche einer Kugel mit Radius r = R können die Kugelkoordinaten
ϕ und ϑ beliebige Werte annehmen.

8.2.3 Das Flächenelement

Neben einer analytischen Darstellung der Oberfläche ist zur Berechnung von Oberflächenintegralen
auch die Darstellung des Oberflächenelements df~ der Fläche F notwendig. Dann kann das Ober-
flächenintegral auf ein gewöhnliches Doppelintegral zurückgeführt werden. In kartesischen Koordi-
naten können wir die Fläche F in kleine Facetten zerlegen, indem wir zum Beispiel die Projektion
D von F auf die xy-Ebene in kleine Rechtecke der Kantenlänge ∆x und ∆y einteilen (siehe Abb.
8.22).

Abbildung 8.22: Das Flächenelement ∆f~ der Oberfläche F ist gegenüber der z-Achse um den
Winkel α geneigt.

Durch die Wahl kleiner Rechtecke kann die Projektion D beliebig genau durch Rechtecke an-
genähert werden. Die Zerlegung der Projektion in kleine Rechtecke erzeugt auch eine Zerlegung
der Fläche F in kleine Facetten mit Fläche ∆f . Da diese Facetten gegenüber der xy-Ebene geneigt
sein können, unterscheidet sich der Flächeninhalt der Facetten im Allgemeinen vom Flächenin-
halt der Rechtecke in der xy-Ebene. Diese Neigung muss in der Ermittlung der Flächenelemente
berücksichtigt werden. Für die Projektion eines Flächenelements mit dem Flächenvektor ∆f~ auf
die xy-Ebene gilt (wir werden später sehen, wie wir die Richtung von ∆f~ ermitteln können):

∆f~ · ~ez = ∆x∆y. (8.59)


8 Integration von Feldern: Kurven- und Flächenintegrale 203

Falls die Facette horizontal ist, ist ∆f~ parallel zur z-Achse und ∆f~ · ~ez = ∆f (~ez ist der Ein-
heitsvektor in z-Richtung). Der Flächeninhalt des Flächenelements ist in diesem Fall gleich dem
Flächeninhalt seiner Projektion. Schließt ∆f~ jedoch mit der z-Achse den Winkel α ein, ist die
Projektion in die xy-Ebene flächenmäßig kleiner als das Flächenelement.

Abbildung 8.23: Die Fläche der Projektion des Flächenelements ist gegenüber der Fläche des
Flächenelements um den Faktor cos α vermindert.

Die Fläche der Projektion ist um den Faktor cos α gegenüber der Fläche des Flächenelements
verringert (siehe Abb. 8.23) und daher gilt:
∆f cos α = ∆x∆y, (8.60)
| {z }
∆f~·~
ez

was wegen ∆f~ · ~ez = ∆f cos α genau der vorherigen Gleichung entspricht. Das heißt, für ein
bestimmtes Rechteck um den Punkt (x, y) in der xy-Ebene ist die Fläche des zugehörigen Flächen-
elements gegeben durch
∆x∆y ∆x∆y
∆f = = , (8.61)
cos α ~n(x, y, z(x, y)) · ~ez
wobei ~n = ∆f~/∆f der Einheitsnormalenvektor auf das Flächenelement im Punkt (x, y, z(x, y)) ist.

Wir müssen nun noch den Normalenvektor ~n(x, y, z(x, y)) bestimmen. Dazu benutzen wir die
Tatsache, dass der Gradient einer Funktion g(x, y, z) normal auf die durch g(x, y, z) =const defi-
nierten Niveauflächen steht. Wir können nun die Fläche F , die aus den Punkten (x, y, z = f (x, y))
(wir haben hier die Funktion f eingeführt, um die Variable z von der Funktion z(x, y) zu unter-
scheiden) besteht, auffassen als eine Niveaufläche der Funktion
g(x, y, z) = z − f (x, y). (8.62)
Die Fläche F ist nämlich wegen z = f (x, y) genau jene Niveaufläche von g, für die gilt:
g(x, y, z) = 0. (8.63)
Der Normalenvektor ~n im Punkt (x, y, z(x, y)) ist also gegeben durch
grad g ∇g
~n = = . (8.64)
|grad g| |∇g|
Der Gradient ∇g lautet
 ∂g
  
∂x − ∂f
∂x
 ∂g   ∂f 
∇g =  ∂y  =  − ∂y  (8.65)
∂g
∂z 1
und somit erhalten wir für den Normalenvektor
 
− ∂f
∂x
1  ∂f 
~n = r  2  2  − ∂y  . (8.66)
1 + ∂f
∂x + ∂f
∂y 1
204 8 Integration von Feldern: Kurven- und Flächenintegrale

Mit Hilfe dieses Normalenvektors können wir nun den Flächenvektor ∆f~ ausdrücken als


− ∂f
∂x
∆x∆y ∆x∆y 1
∆f~ =
 ∂f 
~n = 1
r  2  2  − ∂y 
~n · ~ez
1 + ∂f + ∂f
q
2 ∂f 2
1+( ∂f
∂x ) +( ∂y ) 1
∂x ∂y
 ∂f 
− ∂x
 ∂f 
= ∆x∆y  − ∂y  . (8.67)
1

Wir haben jetzt alle Elemente, die wir zur Berechnung des Flächenintegrals in kartesischen Koor-
dinaten benötigen. Dies wollen wir im nächsten Abschnitt tun. In anderen Koordinatensystemen
müssen auch die Ausdrücke für das Flächenelement entsprechend geändert werden.

8.2.4 Berechnung des Oberflächenintegrals

Im letzten Abschnitt haben wir uns mit den Zutaten für die praktische Berechnung von Ober-
flächenintegralen beschäftigt. In diesem Abschnitt wollen wir diese Zutaten verwenden, um das
Oberflächenintegral auf ein gewöhnliches Doppelintegral in kartesischen Koordinaten zurückzu-
führen. Falls die Berechnung nicht mit kartesischen Koordinaten x und y als Parameter sondern
mit den allgemeinen Parametern u und v durchgeführt werden soll, muss das Flächenelement auf
geeignete Weise transformiert werden. Auf diesen allgemeineren Fall können wir hier jedoch nicht
eingehen und die Leserin/der Leser sei dafür auf die weiterführende Literatur verwiesen.

Im Limes unendlich kleiner Rechtecke wird aus dem Flächenelement ∆f~ das infinitesimale Flächen-
element
 ∂f 
− ∂x
~  ∂f 
df =  − ∂y  dxdy. (8.68)
1

Einsetzen in den Ausdruck für das Oberflächenintegral ergibt

 ∂f

Z Z − ∂x
~ r ) · df~ =
A(~ ~ y, z(x, y)) · 
A(x,  − ∂f

dxdy. (8.69)
∂y 
F D
1

Wir haben somit das Oberflächenintegral über die Fläche F in ein Doppelintegral über den Bereich
D (Projektion von F ) in der xy-Ebene verwandelt. Wir wollen diesen Ausdruck nun anhand eines
Beispiels erläutern.

Beispiel:
~ r ) = (x3 , y 3 , z 3 ) über die durch z =
Zu berechnen sei das Oberflächenintegral des Vektorfeldes A(~
2 2
f (x, y) = x + y dargestellte Fläche und zwar in den Grenzen −1 ≤ x ≤ 1 und −1 ≤ y ≤ 1. Die
Fläche ist ein abgeschnittenes Rotationsparaboloid (siehe Abb. 8.24).

Die partiellen Ableitungen von f (x, y) nach x und y sind:

∂f ∂f
= 2x und = 2y. (8.70)
∂x ∂y
8 Integration von Feldern: Kurven- und Flächenintegrale 205

Abbildung 8.24: Rotationsparaboloid über einem quadratischen Bereich.

Folglich ergibt sich für das Integral

   
Z Z1 Z1 x3 −2x
~ · df~ =
A

 y3
  
 ·  −2y  dxdy
F
−1 −1 (x2 + y 2 )3 1
Z1 Z1
 
= −2x4 − 2y 4 + (x2 + y 2 )3 dxdy
−1 −1
Z1 Z1
 
= 2 −2x4 − 2y 4 + x6 + 3x4 y 2 + 3x2 y 4 + y 6 dxdy
−1 0
Z1   1
2x5 4 x7 3x5 2 3x3 4 6

= 2 − − 2y x + + y + y + y x dy
5 7 5 3 0
−1
Z1  
2 4 1 3 2 4 6
= 2 − − 2y + + y + y + y dy
5 7 5
−1
Z1  
4 2 6
= 2 − − 4y 4 + + y 2 + 2y 4 + 2y 6 dy
5 7 5
0
Z1     1
18 6 2 4 6 18 6 3 2 5 2 7
= 2 − + y − 2y + 2y dy = 2 − y + y − y + y
35 5 35 3·5 5 7 0
0
 
18 2 2 2 2 · 18 4 36 − 20 16
= 2 − + − + =− + =− =− . (8.71)
35 5 5 7 35 7 35 35

In manchen Fällen ist es zweckmäßig, die Integration nicht in einem kartesischen Koordinaten-
system, sondern in einem anderen Koordinatensystem durchzuführen. In diesem Fall ist auf eine
korrekte Definition der Flächenelemente zu achten, auf die wir hier jedoch nicht näher eingehen
können.
206 8 Integration von Feldern: Kurven- und Flächenintegrale

8.3 Der Integralsatz von Gauß

Der Integralsatz von Gauß stellt einen Zusammenhang her zwischen dem Oberflächenintegral über
ein Vektorfeld und dem Volumensintegral über die Divergenz eines Vektorfeldes. Dieser Satz erlaubt
nicht nur eine anschauliche Interpretation der Divergenz, sondern ermöglicht auch sehr praktische
Umformungen von Integralen. Zum Beispiel können wir den Gaußschen Integralsatz dazu benutzen,
um die partielle Integration aus Kapitel 4 auf Vektorintegrale zu verallgemeinern.

8.3.1 Integraldarstellung der Divergenz

Wir haben im Abschnitt 7.3.2 in Kapitel 7 bereits gesehen, dass der Gesamtfluss durch die Ober-
fläche eines kleinen Quaders an der Stelle ~r(x, y, z) mit den Kantenlängen ∆x, ∆y und ∆z im
Strömungsfeld ~j(~r) gegeben ist durch
div ~j(~r)∆x∆y∆z = div ~j(~r)∆V. (8.72)
~ r ) und bilden das Oberflächenintegral
Wir betrachten nun ein allgemeines Vektorfeld A(~
I
~ · df~
A (8.73)
∆F

über die geschlossene Oberfläche ∆F eines kleinen Volumens ∆V . Falls das kleine Volumen ein Qua-
der mit Kantenlänge ∆x, ∆y und ∆z ist (siehe Abb. 8.25), können wir dieses Oberflächenintegral
einfach aus den Oberflächenintegralen über die sechs Seitenflächen des Quaders zusammensetzen:
I X6 Z
~ ~
A · df = ~ · df~.
A (8.74)
∆F i=1 ∆fi

Abbildung 8.25: Quader mit Volumen ∆x∆y∆z und Seitenflächen ∆f~1 , ∆f~2 , ∆f~3 , ∆f~4 , ∆f~5 und
∆f~6 .

Im Limes eines immer kleiner werdenden Quaders können wir diese Integrale leicht nach dem
Muster von Kapitel 4 lösen. Die Annahme, dass das Vektorfeld auf den kleinen Seitenflächen des
Quaders konstant ist und dass sich das Feld im Quader nur linear ändert, führt uns zu
I
A~ · df~ ≈ div A(~
~ r )∆V, (8.75)
∆F

wobei ∆V = ∆x∆y∆z. Im Limes ∆x → 0, ∆y → 0, ∆z → 0 wird diese Beziehung exakt und wir


erhalten nach Division durch ∆V
I
1 ~ · df~ = div A(~
~ r ).
lim A (8.76)
∆V →0 ∆V ∆F
8 Integration von Feldern: Kurven- und Flächenintegrale 207

In diesem Grenzübergang haben wir ~r, den Mittelpunkt des Quaders, konstant gehalten. (Hier geht
natürlich nicht nur ∆V gegen 0, sondern auch der größte Durchmesser des kleinen Quaders.)

Diese Beziehung kann als Definition der Divergenz aufgefasst werden. Sie gilt nicht nur für eine
Folge von kleiner werdenden Quadern, sondern für jede Folge geschlossener, glatter Flächen, die
sich in diesem Grenzprozess auf den Punkt ~r zusammenziehen. Diese Definition ist sogar dann
~ r ) nicht differenzierbar ist. Falls dies aber der Fall ist, gilt natürlich die Beziehung
gültig, wenn A(~
aus Kapitel 7:
I
1 ~ r ) = ∂Ax + ∂Ay + ∂Az .
~ · df~ = div A(~
lim A (8.77)
∆V →0 ∆V ∆F ∂x ∂y ∂z
Diese Integraldarstellung können wir nun benutzen, um den Integralsatz von Gauß herzuleiten.

8.3.2 Formulierung und Herleitung

Aus der Integraldarstellung der Divergenz wissen wir, dass für ein kleines, quaderförmiges Volumen
∆V1 an der Stelle ~r1 gilt
I
1 ~ · df~ = div A(~
~ r1 ),
A (8.78)
∆V1
F (∆V1 )

wobei sich das Oberflächenintegral über die geschlossene Fläche F (∆V1 ) dieses Volumselements
erstreckt. Wir stellen uns nun vor, dass wir an dieses kleine Volumen ∆V1 ein weiteres quaderförmi-
ges Volumen ∆V2 legen, das mit dem ersten Volumen eine Seitenfläche gemeinsam hat (siehe Abb.
8.26).

Abbildung 8.26: An der Fläche S berühren sich die beiden Volumselemente V1 und V2 . Die Flächen-
(1) (2)
elemente ∆f~S und ∆f~S sind einander entgegengesetzt.

Für dieses zweite Volumen gilt natürlich genauso


I
1 ~ · df~ = div A(~
~ r2 ),
A (8.79)
∆V2
F (∆V2 )

wobei diesmal die Integration über die Oberfläche F (∆V2 ) des kleinen Volumens ∆V2 erfolgt. Somit
erhalten wir durch Addition:
I I
~ · df~ +
A ~ · df~ = div A(~
A ~ r1 )∆V1 + div A(~
~ r2 )∆V2 . (8.80)
F (∆V1 ) F (∆V2 )

Die linke Seite ist die Summe zweier Oberflächenintegrale, wobei in jedem Oberflächenintegral
alle Seitenflächen der beiden quaderförmigen Bereiche einen Beitrag leisten. Da die Trennfläche S
208 8 Integration von Feldern: Kurven- und Flächenintegrale

beiden Oberflächen gemeinsam ist, gibt es in jedem der Oberflächenintegrale einen Beitrag, der
vom Fluss durch diese Seitenfläche stammt. Bezeichnen wir den Feldvektor in der Mitte dieser
~ rS ), ist der Beitrag zum Oberflächenintegral über F (∆V1 ) gegeben durch
Fläche mit A(~
~ rS ) · df~(1)
A(~ (8.81)
S

und der Beitrag zum Oberflächenintegral über F (∆V2 ) gleich


~ rS ) · df~(2) .
A(~ (8.82)
S

Da wir vereinbart haben, dass die Flächennormalvektoren stets nach außen gerichtet sind, zeigen
(1) (2)
df~S und df~S in entgegengesetzte Richtung. Im Betrag sind sie aber gleich (weil sie zur gleichen
Fläche gehören) und so gilt
(1) (2)
df~S = −df~S . (8.83)
Die beiden Beiträge (8.81) und (8.82) heben einander genau auf
~ rS ) · df~(1) + A(~
A(~ ~ rS ) · df~(1) = 0.
~ rS ) · df~(1) − A(~
~ rS ) · df~(2) = A(~ (8.84)
S S S S

Die gemeinsame Trennfläche S liefert also in der Summe auf der linken Seite der Gleichung keinen
Beitrag. Übrig bleiben also nun die Beiträge der Außenseiten F (∆V1 + ∆V2 ) des kombinierten
Volumens ∆V1 + ∆V2 :
I I I
~ · df~ +
A A~ · df~ = A~ · df~. (8.85)
F (∆V1 ) F (∆V2 ) F (∆V1 +∆V2 )

Dieser Ausdruck gilt übrigens nicht nur für infinitesimale Volumina, sondern ganz allgemein für
die Summe zweier Volumina V1 + V2 , welche eine, möglicherweise gekrümmte, Berührungsfläche S
haben (siehe Abb. 8.27). Auch in diesem Fall heben sich die beiden Beiträge der Fläche S zum
Oberflächenintegral über V1 und V2 genau auf, da in jedem Punkt die zugehörigen Normalvektoren
den gleichen Betrag aber entgegengesetzte Richtung besitzen.

Abbildung 8.27: In der Summe der Oberflächenintegrale über die Oberflächen, die die Volumina
V1 und V2 umschließen, heben sich die Beiträge, die von der Berührungsfläche S stammen, exakt
auf.

Wir können nun diese Prozeduren beliebig oft wiederholen und stets neue Quader ∆V3 , ∆V4 , ∆V5 ,
usw. an die bereits vorhandenen anfügen. Dabei heben sich die Beiträge der gemeinsamen Flächen
immer auf und übrig bleibt nur das Oberflächenintegral über die Einhüllende F (∆V1 + ∆V2 + . . . )
aller N Teilvolumina ∆Vi :
I I I I
~ ~
A · df + ~ ~
A · df + · · · + ~ ~
A · df = ~ · df~.
A (8.86)
F (∆V1 ) F (∆V2 ) F (∆VN ) F (∆V1 +···+∆VN )

Mit Hilfe des Summenzeichens können wir dies kompakter ausdrücken als:
N
X I I
~ · df~ =
A A~ · df~. (8.87)
i=1 P
F (∆Vi ) F( i ∆Vi )
8 Integration von Feldern: Kurven- und Flächenintegrale 209

Abbildung 8.28: Zerlegung eines Volumens in kleine Quader.

Wir
P können nun jedes Volumen V beliebig genau mit Hilfe kleiner Quader ∆Vi annähern, V ≈
i ∆Vi . Das Integral auf der rechten Seite von Gleichung (8.87) wird dann zu einem Oberflächen-
integral über die Oberfläche von V . Drücken wir zusätzlich auf der linken Seite dieser Gleichung
die Oberflächenintegrale über die Teilvolumina mit Hilfe von Gleichung (8.76) durch die lokale
Quellenstärke aus, erhalten wir
I N
X I N
X
~ · df~ ≈
A ~ · df~ ≈
A ~ ri ) · ∆Vi .
div A(~ (8.88)
i=1 i=1
F (V ) F (∆Vi )

Im Grenzwert infinitesimal kleiner Teilvolumina wird aus der Summe in dieser Gleichung ein Vo-
lumsintegral über V :
I Z
A~ · df~ = ~ dV.
div A (8.89)
V
F (V )

Dies ist der Integralsatz von Gauß, der auch oft Satz von Gauß-Ostrogradski genannt wird,
weil er von diesen beiden Mathematikern unabhängig voneinander gefunden wurde.

In Worten lässt sich der Integralsatz von Gauß ausdrücken als: Das Oberflächenintegral eines
~ über eine geschlossene Fläche F mit nach außen gerichteten Flächennormalen ist
Vektorfeldes A
gleich dem Volumsintegral über die Divergenz des Vektorfeldes im Volumen V, das von der Fläche
F eingeschlossen wird.

Der Satz von Gauß verknüpft also die Quellen und Senken eines Feldes im Inneren eines Volumens
mit den Eigenschaften des Feldes auf der Oberfläche des Volumens. Anwendung findet der Satz
von Gauß zum Beispiel in der Elektrostatik und Elektrodynamik sowie bei der Kontinuitätsglei-
chung für erhaltene Größen (z.B. Energie, Impuls, Masse).

Beispiel:

Um die Nützlichkeit des Satzes von Gauß zu demonstrieren, berechnen wir das Oberflächenintegral
~ r ) = ~r über die Oberfläche F eines Würfels mit Volumen V . Mit Hilfe des Satzes
O für das Feld A(~
von Gauß können wir umformen:
I Z
O= A~ · df~ = ~ dV.
div A (8.90)
F V

~ = ~r haben wir div A


Für A ~= ∂x
+ ∂y
+ ∂z
= 3 und somit
∂x ∂y ∂z
Z Z
O= ~ dV =
div A 3dV = 3V. (8.91)
V V

Interessanterweise geht hier die Form des Volumens nicht in die Lösung ein. Für eine Kugel oder
einen Zylinder mit demselben Rauminhalt ergibt sich also genau dasselbe Oberflächenintegral.
210 8 Integration von Feldern: Kurven- und Flächenintegrale

Beispiel:
~ durch eine geschlossene Oberfläche F gilt laut dem Satz
Für den Fluss eines Wirbelfeldes rot A
von Gauß
I Z
~ · df~ =
rot A ~ dV.
div (rot A) (8.92)
F V

~ = 0, bedeutet dies
Da Wirbelfelder quellenfrei sind, div (rot A)
I Z
~ ~
rot A · df = 0 dV = 0. (8.93)
F V

~ durch eine geschlossene Oberfläche für


Somit verschwindet der Gesamtfluss eines Wirbelfeldes rot A
~
ein beliebiges Vektorfeld A. Anschaulich bedeutet dies, dass Wirbel entweder ganz in V verlaufen
oder an einer Stelle genauso viele ein- wie an einer anderen Stelle austreten. (Dies folgt, wie wir
sehen werden, auch aus dem Satz von Stokes.)

Beispiel:

Wir wollen nun den Satz von Gauß verifizieren, indem wir für das Vektorfeld A(~~ r ) = (x3 , y 3 , z 3 )
H
~ ~
sowohl das Oberflächenintegral A · df über die Oberfläche einer Kugel mit Radius R als auch das
R
Volumsintegral V div A ~ dV über diese Kugel berechnen (siehe Abb. 8.29).

~ r ) auf der Halbkugel mit Radius R.


Abbildung 8.29: Vektorfeld A(~

Wir berechnen zunächst das Oberflächenintegral. Aus Symmetriegründen genügt es, das Integral
nur für eine Halbkugel, also zum Beispiel für z ≥ 0, zu berechnen. Das Integral über die Kugel ist
dann einfach
p zweimal das Integral über die Halbkugel. Die Flächengleichung für die Halbkugel ist
z(x, y) = R2 − (x2 + y 2 ). Der Normalenvektor ~n auf die Fläche zeigt für eine Kugel genau vom
Ursprung weg:
 
x
1  
~n = p  y . (8.94)
x2 + y 2 + z 2
z

Folglich ist das Flächenelement gegeben durch:


 
x
dxdy 1
df~ =

· ~n =  y  dxdy. (8.95)
~n · ~ez z
z
8 Integration von Feldern: Kurven- und Flächenintegrale 211

Das Oberflächenintegral lässt sich also schreiben als


   
Z ZZ x3 x
~ · df~ = 1 3   
A  y  ·  y  dxdy
F z
x2 +y 2 ≤R2 z3 z
ZZ 4 4 4
x +y +z
= dxdy, (8.96)
z
x2 +y 2 ≤R2

wobei sich der Integrationsbereich in der xy-Ebene über den Kreis mit Radius R erstreckt. In
diesem Ausdruck ist z als Funktion von x und y zu betrachten, z = z(x, y). Durch Einsetzen der
Flächengleichung für z(x, y) erhalten wir
Z ZZ
~ · df~ = x4 + y 4 + (R2 − (x2 + y 2 ))2
A p dxdy. (8.97)
F R2 − (x2 + y 2 )
x2 +y 2 ≤R2

Dieses Integral berechnen wir zweckmäßigerweise in Polarkoordinaten:


Z Z2πZR
~ · df~ = r4 (sin4 ϕ + cos4 ϕ) + (R2 − r2 )2
A √ rdϕdr
F R2 − r 2
0 0
Z2πZR  
r4 (sin4 ϕ + cos4 ϕ) 2 2 23
= √ + (R − r ) rdϕdr
R2 − r 2
0 0
Z2πZR ZR
r5 (sin4 ϕ + cos4 ϕ) 3
= √ dϕdr + 2π (R2 − r2 ) 2 rdr
R2 − r 2
0 0 0
ZR Z2π ZR
r5 4 3
= √ dr (sin ϕ + cos ϕ)dϕ + 2π (R2 − r2 ) 2 rdr.
4
(8.98)
R2− r2
0 0 0
R 5 √
Das Integral √ r 1
dr ergibt laut Integraltafel − 15 R2 − r2 (3r4 + 4r2 R2 + 8R4 ) und somit gilt
R2 −r 2

ZR R
r5 1p 2 4 2 2

4 R 8R5
√ dr = − 2
R − r (3r + 4r R + 8R ) = 8R4 = . (8.99)
R2 − r 2 15 0 15 15
0
R 2π
Das Integral 0 (sin4 ϕ + cos4 ϕ)dϕ ergibt
Z2π   2π
3ϕ sin(4ϕ) 3π
(sin4 ϕ + cos4 ϕ)dϕ = + = 2 . (8.100)
4 16 0
0

Schließlich erhalten wir für das letzte Integral:


ZR R
2 23 21 2
2 52 1
(R − r ) rdr = − (R − r ) = R5 .
2
(8.101)
52 0 5
0

Das Oberflächenintegral wird somit zu


Z 5 5
 
A~ · df~ = 8R 3π + 2πR = 4π + 2π R5 = 6π R5 . (8.102)
F 15 2 5 5 5 5
Für die ganze Kugel ist das Oberflächenintegral also gegeben durch:
Z
~ · df~ = 12π R5 .
A (8.103)
F 5
212 8 Integration von Feldern: Kurven- und Flächenintegrale

Wir berechnen nun auch das Volumsintegral über die Divergenz des Vektorfeldes über die ganze
Kugel:
Z Z  3 
~ ∂x ∂y 3 ∂z 3
div AdV = + + dV
V V ∂x ∂y ∂z
Z
= 3 (x2 + y 2 + z 2 )dV. (8.104)
V

Wir transformieren auf Kugelkoordinaten und beachten dabei, dass das Volumselement zu r2 sin ϑdϑdϕdr
wird:
Z Z2πZπ ZR
~
div AdV = 3 r2 r2 sin ϑdϑdϕdr
V
0 0 0
ZR Zπ
4
= 3 · 2π r dr · sin ϑdϑ
0 0
  R
5
π
r
= 3 · 2π · (− cos ϑ)
5
0

0
6π 5 12π 5
= R (− cos(+π) + cos 0) = R . (8.105)
5 5
R
~ · df~
Wie wegen des Integralsatzes von Gauß zu erwarten war, liefern das Oberflächenintegral F A
R
~
und das Volumsintegral V div AdV genau dasselbe Ergebnis. Allerdings ist in diesem Fall das
Volumsintegral bedeutend einfacher zu berechnen als das Oberflächenintegral.

8.3.3 Partielle Integration mit Hilfe des Gaußschen Satzes

Erinnern wir uns zunächst daran, dass bei der partiellen Integration in einer Dimension ein Integral
in ein anderes (hoffentlich einfacheres) Integral verwandelt wird:

Zb b Zb


f (x)g (x)dx = f (x)g(x) − f ′ (x)g(x)dx. (8.106)
a
a a

Die partielle Integration beruht auf der Produktregel der Differentiation, (f g)′ = f ′ g + f g ′ . Wir
können Gleichung (8.106) auch umformen zu:

Zb Zb b


f (x)g (x)dx + f ′ (x)g(x)dx = f (x)g(x) . (8.107)
a
a a

Hier haben wir also das Integral über eine Ableitung verknüpft mit dem Wert der Funktion an den
Rändern (in einer Dimension sind das einfach die Endpunkte) des Integrationsintervalls.

Der Satz von Gauß leistet das Analoge für Volumsintegrale. Dieser Analogie folgend können wir die
Methode der partiellen Integration auf Volumsintegrale übertragen, falls der Integrand ein Produkt
aus einem Feld ψ mit dem Gradienten eines anderen Feldes ist,
Z Z
ψ(~r)grad ϕ(~r)dV = ψ(~r)∇ϕ(~r)dV. (8.108)
V V

Da der Gradient ein Vektor ist, hat auch das Integral über ψ∇ϕ Vektorcharakter. Im Allgemei-
nen kann man natürlich Volumsintegrale statt über skalare Felder auch über Vektorfelder
bilden. Da Integrale als Grenzwerte von Summen definiert sind und Vektoren komponentenweise
8 Integration von Feldern: Kurven- und Flächenintegrale 213

~ r ) ein Vektor, dessen Komponenten


addiert werden, ist das Volumsintegral eines Vektorfeldes A(~
die Volumsintegrale über die Komponenten des Feldes A ~ sind:
 R 
Z A x (~
r )dV
~ r )dV =  RV 
A(~  V Ay (~r)dV  . (8.109)
V R
V Az (~r )dV
~ S eines
Ein Beispiel für ein solches Integral ergibt sich bei der Berechnung des Schwerpunktes R
Körpers mit Massenverteilung ρ(~r):
R
R~ S = RV ~rρ(~r)dV . (8.110)
V
ρ(~r)dV

Wir kehren nach diesem kurzen Einschub über vektorwertige Volumsintegrale zurück zum Integral
in Gleichung (8.108). Aus dem Abschnitt 7.2 über den Gradienten im Kapitel 7 kennen wir die
Produktregel
∇(ψϕ) = ϕ∇ψ + ψ∇ϕ. (8.111)
Somit gilt
Z Z Z
ψ(~r)∇ϕ(~r)dV = ∇(ψϕ)dV − ϕ(~r)∇ψ(~r)dV. (8.112)
V V V

Das erste Integral auf der rechten Seite dieser Gleichung kann wie folgt umgeformt werden. Für
~ r ) = ~aφ(~r) mit einem konstanten Vektor ~a und einem Skalarfeld φ(~r)
das spezielle Vektorfeld A(~
folgt nämlich aus dem Satz von Gauß:
I I I Z
~ · df~ =
A ~aφ(~r) · df~ = ~a · φ(~r)df~ = div (~aφ(~r))dV. (8.113)
F (V ) F (V ) F (V ) V

Da aber
∂ax φ ∂ay φ ∂az φ
div (~aφ(~r)) = + +
∂x ∂y ∂z
∂φ ∂φ ∂φ
= ax + ay + az = ~a · grad φ, (8.114)
∂x ∂y ∂z
folgt daraus
I Z
~a · φ(~r) df~ = ~a · grad φ dV. (8.115)
F (V ) V

Da dies für beliebige Vektoren ~a gilt, erhalten wir schließlich die Vektorgleichung:
I Z Z
~
φ(~r) df = grad φ dV = ∇φ dV. (8.116)
F (V ) V V

Während auf der linken Seite dieser Gleichung der Vektorcharakter des Integrals vom Flächenele-
ment stammt, kommt er auf der rechten Seite vom Gradienten, der ja ein Vektor ist. Die obige
Gleichung ist der Gaußsche Integralsatz für skalare Felder.

Durch Anwendung dieses Satzes mit φ = ϕψ erhalten wir aus Gleichung (8.112)
Z I Z
ψ(~r)∇ϕ(~r) dV = ~
ψ(~r)ϕ(~r) df − ϕ(~r)∇ψ(~r) dV. (8.117)
V F (V ) V

Diese Gleichung ist analog zur partiellen Integration in einer Dimension (siehe auch Gleichung
(4.78) bzw. Gleichung (8.106)): die Ableitung wird von einer Funktion (ϕ) zur anderen (ψ) über-
gewälzt. Zusätzlich haben wir einen Oberflächenterm erhalten. Da dieser zusätzliche Term im Un-
terschied zum eindimensionalen Fall noch als Integral (wenn auch als Oberflächenintegral) dasteht,
214 8 Integration von Feldern: Kurven- und Flächenintegrale

ist der Ausdruck partielle (also teilweise) Integration hier wohl etwas übertrieben. Nichtsdestotrotz
kann Gleichung (8.117) in vielen Situationen sehr nützlich sein.

Falls auf der Oberfläche des Integrationsvolumens mindestens eine der skalaren Funktionen ϕ(~r)
oder ψ(~r) verschwindet, nimmt (8.117) eine besonders einfache Form an. Dann verschwindet
nämlich das Oberflächenintegral und wir erhalten:
Z Z
ψ(~r)∇ϕ(~r)dV = − ϕ(~r)∇ψ(~r)dV. (8.118)
V V

Bei Anwendung dieses sehr praktischen Ausdrucks muss jedoch sorgfältig darauf geachtet werden,
dass entweder ϕ(~r) oder ψ(~r) auf der Oberfläche wirklich verschwindet.

Ein ähnliches Ergebnis erhalten wir, wenn wir die Produktregel für die Divergenz eines Produkts
aus einem Skalar- und einem Vektorfeld ausnutzen,
~ r )) = A
∇ · (ϕ(~r)A(~ ~ · ∇ϕ + ϕ∇ · A.
~ (8.119)
R
Für das Volumsintegral ϕ∇ · A~ dV erhalten wir damit nämlich
V
Z Z Z
~ dV =
ϕ∇ · A ~ dV −
∇ · (ϕA) ~ · ∇ϕ dV.
A (8.120)
V V V

~ können wir nun mit Hilfe des Satzes von Gauß in


Das Volumsintegral über die Divergenz ∇ · (ϕA)
ein Oberflächenintegral verwandeln:
Z I Z
~ dV =
ϕ∇ · A ϕA~ · df~ − ~ · ∇ϕ dV
A (8.121)
V F V

oder, äquivalent dazu,


Z I Z
~ · ∇ϕ dV =
A ~ · df~ −
ϕA ~ dV.
ϕ∇ · A (8.122)
V F V

Falls das Oberflächenintegral verschwindet, wird dieser Ausdruck für die partielle Integration be-
sonders einfach:
Z Z
~
A · ∇ϕ dV = − ~ dV.
ϕ∇ · A (8.123)
V V

Zwei weitere praktische Ausdrücke lassen sich aus dem Satz von Gauß ableiten. Diese sind als
Sätze von Green bekannt.

8.3.4 Die Sätze von Green

Gegeben seien zwei skalare Felder ψ und ϕ. Für diese Felder betrachten wir jetzt das Volumsintegral
Z
(ϕ∆ψ − ψ∆ϕ)dV, (8.124)
V

wobei ∆ = ∇ · ∇ der Laplace-Operator ist. Partielle Integration beider Terme mit Hilfe von
Gleichung (8.121) liefert
Z Z
(ϕ∆ψ − ψ∆ϕ) dV = (ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV
V V
I Z
= (ϕ∇ψ − ψ∇ϕ) df~ − (∇ϕ · ∇ψ − ∇ψ · ∇ϕ) dV. (8.125)
F V

Das Volumsintegral auf der rechten Seite verschwindet aber und wir erhalten
Z I
(ϕ∇ · ∇ψ − ψ∇ · ∇ϕ) dV = (ϕ∇ψ − ψ∇ϕ) df~. (8.126)
V F
8 Integration von Feldern: Kurven- und Flächenintegrale 215

Dies ist der 2. Satz von Green. (Diese Nomenklatur ist nicht ganz einheitlich. Die Sätze werden
oft unterschiedlich nummeriert.) Er wurde von George Green bewiesen, kann jedoch als Spezialfall
des Satzes von Gauß betrachtet werden.
~ ein
Der 1. Satz von Green ergibt sich aus Gleichung (8.121) für den Fall, dass das Vektorfeld A
~ = ∇ψ. Einsetzen in Gleichung (8.121) ergibt
Gradientenfeld ist: A
Z I Z
ϕ∇ · ∇ψ dV = ϕ∇ψ · df~ − ∇ϕ · ∇ψ dV (8.127)
V F V

oder
Z I Z
ϕ∆ψ dV = ϕ∇ψ · df~ − ∇ϕ · ∇ψ dV. (8.128)
V F V

Weitere praktische Formeln, die man auf ähnliche Weise ableiten kann, sind:
Z Z I
~
A × ∇ϕ dV = ~
ϕ∇ × A dV + ϕA ~ × df~, (8.129)
V V F

was auf der Produktregel ∇ × (ϕA)~ = ϕ∇ × A~ + ∇ϕ × A~ beruht, und


Z Z I
~ ·∇×A
B ~ dV = A~ ·∇×B ~ dV + (A ~ · df~,
~ × B) (8.130)
V V F

~ × B)
was aus div (A ~ =B
~ ·∇×A
~−A
~ ·∇×B
~ folgt.

Beispiel:

Die Diffusion eines Teilchens im Raum (siehe Abb. 8.30) wird durch die Diffusionsgleichung

∂ρ
= D∆ρ (8.131)
∂t
beschrieben, wobei ρ(~r, t) die Wahrscheinlichkeit beschreibt, das Teilchen zum Zeitpunkt t am Ort
~r = (x, y, z) zu finden unter der Bedingung, dass es zum Zeitpunkt t = 0 im Ursprung (~r = 0) war.

Abbildung 8.30: Bahnkurve eines diffundierenden Teilchens in der Ebene.

Für t = 0 ist die Dichte ρ(~r, t = 0) also durch eine δ-Funktion gegeben, da wir wissen, dass sich
das Teilchen genau im Usprung befindet:

ρ(~r, 0) = δ(~r). (8.132)


216 8 Integration von Feldern: Kurven- und Flächenintegrale

Da das Teilchen vom ursprünglichen Ort weg diffundiert, wird die Dichte ρ immer breiter. Aus Sym-
metriegründen verschwindet der mittlere Aufenthaltsort des Teilchens bei wiederholter Durchführung
des Diffusionsexperiments:
Z
h~ri = ρ(~r)~r dV = 0, (8.133)

wobei die Dichte ρ(~r) so definiert ist, dass sie normiert ist. Das heißt
Z
ρ(~r) dV = 1. (8.134)

Das mittlere Abweichungsquadrat


Z
h~r 2 i = ρ(~r, t)~r 2 dV (8.135)

ist jedoch von Null verschieden und wächst mit der Zeit. Um dieses zeitliche Anwachsen quantitativ
zu bestimmen, bilden wir die Ableitung von h~r 2 i nach der Zeit:
Z
∂ 2 ∂
h~r i = ρ(~r, t)~r 2 dV. (8.136)
∂t ∂t
Indem wir die Diffusionsgleichung ausnutzen, erhalten wir dann:
Z
∂ 2
h~r i = D ∆ρ(~r, t)~r 2 dV
∂t
Z
= D ∇ · (∇ρ(~r, t))~r 2 dV. (8.137)

Anwendung des 1. Greenschen Satzes (Gleichung (8.128)) ergibt:


Z Z I
∆ρ(~r, t)~r 2 dV = − ∇~r 2 · ∇ρ dV + ~r 2 ∇ρ(~r, t) · df~. (8.138)
F

Im Unendlichen verschwindet jedoch ρ und auch ∇ρ für beliebige endliche Zeiten t. Deshalb erhalten
wir
Z Z
∆ρ(~r, t)~r dV = − ∇~r 2 · ∇ρ dV.
2
(8.139)

Der Gradient von ~r 2 lässt sich leicht auswerten,

∇~r 2 = 2~r (8.140)

und folglich gilt


Z Z
∇~r 2 · ∇ρ dV = 2 ~r · ∇ρ dV. (8.141)

Nochmalige partielle Integration nach Gleichung (8.122) liefert


Z Z I
~r · ∇ρ dV = − ρ(∇ · ~r)dV + ρ~r · df~. (8.142)
F

Der Oberflächenterm verschwindet wieder und die Divergenz von ~r ist


∂x ∂y ∂z
∇ · ~r = + + = 3. (8.143)
∂x ∂y ∂z
R
Da ρ nach Voraussetzung normiert ist, ρ(~r) = 1, gilt
Z Z
ρ(∇ · ~r) dV = 3 ρ dV = 3 (8.144)
8 Integration von Feldern: Kurven- und Flächenintegrale 217

und wir erhalten schließlich


∂ 2
h~r i = D · 2 · 3 = 6D. (8.145)
∂t
Integration nach der Zeit ergibt

h~r 2 i = 6Dt. (8.146)

Dies ist die berühmte Einstein-Beziehung, der zufolge bei der Diffusion der mittlere quadratische
Abstand vom Ausgangspunkt linear mit der Zeit wächst.

8.4 Der Integralsatz von Stokes

Der Integralsatz von Stokes stellt einen Zusammenhang her zwischen dem Oberflächenintegral
des Wirbelfeldes eines Vektorfeldes und dem Kurvenintegral des Feldes entlang des Randes der
Oberfläche.

8.4.1 Integraldarstellung der Rotation

Wir haben in Abschnitt 8.1.4 gesehen, dass unter gewissen Umständen Kurvenintegrale über Vek-
torfelder vom Weg unabhängig sind (nämlich genau dann, wenn sich das Vektorfeld als Gradient
eines Skalarfeldes darstellen lässt). In diesem Fall verschwindet das Kurvenintegral über jede be-
liebige geschlossene Kurve C:
I
~ · d~r = 0.
A (8.147)
C

Es gibt jedoch auch Felder, für die


H das Kurvenintegral längs geschlossener Kurven, also die Zir-
kulation, nicht verschwindet, C A ~ · d~r 6= 0. Solche Felder nennt man Wirbelfelder. So kann
beispielsweise ein zeitlich veränderliches Magnetfeld B ~ ein ringförmiges elektrisches Feld E
~ erzeu-
gen (siehe Abb. 8.31).

Abbildung 8.31: Elektrisches Wirbelfeld E.~ Unterschiedliche Integrationswege (etwa C1 , C2 und


R
~ · d~r.
C3 ) führen zu unterschiedlichen Wegintegralen C E

Wir bewegen in diesem elektrischen Feld nun eine Ladung vom Punkt P1 zum HPunkt P2 und
~ · d~r längs
wollen dies auf 3 verschiedenen Wegen tun: C1 , C2 und C3 . Das Kurvenintegral C E
~ immer in Richtung des Weges zeigt und deshalb
des Weges C1 ist positiv, da das Vektorfeld E
218 8 Integration von Feldern: Kurven- und Flächenintegrale

immer E~ · d~r > 0 gilt. Das Kurvenintegral längs C2 hingegen ist negativ, da das Feld immer der
Bewegungsrichtung entgegengesetzt ist, E ~ · d~r < 0. Auf der Kurve C3 steht das Feld immer genau
H
senkrecht auf die Bewegungsrichtung. Somit gilt E ~ · d~r = 0 und das Kurvenintegral ~
C3 E · d~
r
verschwindet. In diesem Fall wird keine Arbeit geleistet.

Da diese Kurvenintegrale nicht wegunabhängig sind, verschwindet die Zirkulation für dieses Vek-
torfeld im Allgemeinen nicht. Zum Beispiel ist
I I
~
E · d~r > 0 und ~ · d~r < 0.
E (8.148)
C1 −C3 C2 −C1

Hier bezeichnet C1 − C3 den Weg, der aus C1 in Vorwärtsrichtung und C3 in Rückwärtsrichtung


besteht. Der Weg C2 − C1 ist auf analoge Weise definiert. Offensichtlich verschwinden Kurvenin-
tegrale über geschlossene Kurven genau dann nicht, wenn das Vektorfeld geschlossene Feldlinien,
also Wirbel, besitzt. Wir haben aber in Kapitel 7 (Abschnitt 7.55) plausibel gemacht, dass die
Rotation ∇ × A ~ als Maß für die lokale Wirbelstärke betrachtet werden kann. Wir wollen nun sehen,
ob wir die Zirkulation über ein Vektorfeld, die ja ebenfalls von der Stärke der Wirbel abhängt, mit
der Rotation in Verbindung bringen können.

Abbildung 8.32: Die Umrandung des Flächenelements mit dem Flächenvektor ∆f~ besteht aus den
Kurvensegmenten C1 , C2 , C3 und C4 .

Dazu betrachten wir das Kurvenintegral über eine kleine geschlossene Kurve, die eine kleine Fläche
∆f mit Flächenvektor ∆f~ umrandet. Der Einfachheit halber nehmen wir an, dass die Fläche in
der xy-Ebene liegt, also ∆f~ in Richtung der z-Achse zeigt (siehe Abb. 8.32). Wir bezeichnen die
H
Umrandung dieses Rechtecks mit Cz . Das Kurvenintegral Cz A(~ ~ r ) · d~r entlang der Umrandung
des Rechtecks besteht aus den vier Beiträgen entlang der Rechteckseiten. Zur Berechnung dieses
Integrals wollen wir annehmen, dass die Seiten des Rechtecks so kurz sind, dass sich der Feldvektor
~ r ) entlang der Kanten nicht ändert. Dann ist der Beitrag der Kante C1 gegeben durch
A(~
 
A~ x, y − ∆y , z · ∆~r, (8.149)
2
~ y − ∆y , z) der Feldvektor im Mittel-
wobei ~r = (x, y, z) der Mittelpunkt des Rechtecks ist und A(x, 2
punkt der Kante C1 . Die Verschiebung ∆~r hat jedoch die Länge ∆x und die Richtung ~ex = (1, 0, 0).
Damit erhalten wir für den Beitrag der Rechteckseite C1 zum Integral
   
~ ∆y ∆y
A x, y − , z · ~ex ∆x = Ax x, y − , z ∆x. (8.150)
2 2
Auf ähnliche Weise erhalten wir für den Beitrag entlang Kante C3
   
~ ∆y ∆y
A x, y + , z · ∆~r = −Ax x, y + , z ∆x. (8.151)
2 2
Dabei haben wir berücksichtigt, dass das Kurvenelement ∆~r für diese Kante in die negative x-
Richtung zeigt. Durch analoge Überlegungen erhalten wir die Beiträge der Kanten C2 und C4 zum
Kurvenintegral:
   
∆x ∆x
C2 : Ay x + , y, z ∆y und C4 : −Ay x − , y, z ∆y. (8.152)
2 2
8 Integration von Feldern: Kurven- und Flächenintegrale 219

Durch Addition dieser vier Beiträge erhalten wir das Kurvenintegral längs der (geschlossenen)
Umrandung des Rechtecks:
I    
~ · d~r = Ax x, y − ∆y , z ∆x − Ax x, y + ∆y , z ∆x
A
Cz 2 2
    (8.153)
∆x ∆x
+ Ay x + , y, z ∆y − Ay x − , y, z ∆y.
2 2
Die Erweiterung der ersten beiden Terme der rechten Seite dieser Gleichung mit ∆y und der letzten
beiden Terme mit ∆x liefert
   
I Ax x, y + ∆y
2 , z − A x x, y − ∆y
2 , z
~ · d~r = −
A ∆x∆y
Cz ∆y (8.154)
 
Ay x + ∆x2 , y, z − Ay x − ∆x
2 , y, z
+ ∆x∆y.
∆x
Im Limes kleiner ∆x und ∆y (also im Limes ∆f → 0) werden diese Differenzenquotienten zu
partiellen Ableitungen und wir erhalten nach Division durch ∆x∆y = ∆f
I
1 ~ · d~r = ∂Ay − ∂Ax .
lim A (8.155)
∆f →0 ∆f C ∂x ∂y
z

Die rechte Seite dieser Gleichung ist jedoch nichts anderes als die z-Komponente der Rotation
     ∂A ∂Ay

∂ z

∂x A x ∂y ∂z 
~= ∂ ·   ∂Ax ∂Az 
∇×A  ∂y   Ay  =   ∂z − ∂x  (8.156)
∂ ∂Ay ∂Ax
∂z
Az ∂x − ∂y

~ r ). Wir können also schreiben


des Vektorfeldes A(~
I
1 ~ · d~r = (rot A)
~ z,
lim A (8.157)
∆f →0 ∆f C
z

wobei wir die z-Komponente der Rotation rot A ~ mit (rot A)


~ z bezeichnet haben. Wenn wir unser
kleines Rechteck nicht in die xy-Ebene sondern in die yz-Ebene oder in die xz-Ebene legen, erhalten
wir auf analoge Weise die x- beziehungsweise die y-Komponente der Rotation:
I
1 ~ · d~r = ∂Az − ∂Ay = (rot A)~ x
lim A (8.158)
∆f →0 ∆f C ∂y ∂z
x

beziehungsweise
I
1 ~ · d~r = ∂Ax − ∂Az = (rot A)
~ y.
lim A (8.159)
∆f →0 ∆f Cy ∂z ∂x

Für eine allgemein orientierte Fläche, deren Flächennormale in Richtung des Einheitsvektors ~n
zeigt,

∆f~ = |∆f~| · ~n = ∆f~n, (8.160)

gilt
I
1 ~ · d~r = ~n · rot A
~ = ~n · ∇ × A.
~
lim A (8.161)
∆f →0 ∆f C

Die Rotation ist also die Flächendichte der Zirkulation (Zirkulation pro Fläche), die auch als
H
Wirbelstärke bezeichnet wird. Für eine kleine Fläche ∆f~ haben wir also C A ~ · ∆f~.
~ · d~r = rot A
Dieser Ausdruck kann auch als Definition der Rotation eines Vektorfeldes aufgefasst werden, die
auch dann sinnvoll bleibt, wenn das Feld nicht differenzierbar ist.
220 8 Integration von Feldern: Kurven- und Flächenintegrale

8.4.2 Formulierung und Herleitung

~ r ) einen Zusammenhang zwischen dem


Der Stokessche Satz stellt für ein beliebiges Vektorfeld A(~
Oberflächenintegral über eine im Allgemeinen gekrümmte Fläche F und dem Kurvenintegral längs
des Randes C dieser beliebig großen und beliebig geformten Fläche her (siehe Abb. 8.33). Wie
wir schon bei der Diskussion des Oberflächenintegrals gesehen haben, können wir die gesamte
Oberfläche F näherungsweise durch N ebene Teilflächen ∆fi mit Flächenvektoren ∆f~i darstellen.
Wir bezeichnen die Umrandung des Flächenelements ∆fi mit Ci .

Abbildung 8.33: Die von der Kurve C umrandete Fläche F wird in kleine Facetten mit Flächen-
vektoren ∆f~i zerlegt.

Wir bilden nun für ein kleines Flächenelement ∆f1 am Punkt ~r1 (siehe Abb. 8.34) das Kurvenin-
tegral längs seiner Umrandung, das für eine kleine Fläche geschrieben werden kann als
I
~ · d~r = rot A
A ~ · ∆f~1 . (8.162)
C1

Wir legen dann um einen benachbarten Punkt ~r2 eine weitere Fläche ∆f2 und zwar so, dass die
Flächen ∆f1 und ∆f2 einen Teil ihrer Berandung gemeinsam haben. Die Flächenvektoren ∆f~1 und
∆f~2 sind im Allgemeinen nicht parallel zueinander.

Abbildung 8.34: Zwei benachbarte Facetten mit Flächenvektoren ∆f~1 und ∆f~2 und Umrandungen
C1 und C2 .

Wenn wir die Linienintegrale entlang der beiden Kurven C1 und C2 addieren, heben sich die beiden
Beiträge des gemeinsamen Randteiles genau auf, weil dieser Teil von C1 und C2 in entgegengesetzter
Richtung umlaufen wird. Was übrig bleibt ist das Kurvenintegral über die Einhüllende C1+2 der
aus ∆f1 und ∆f2 bestehenden Gesamtfläche:
I I I
~
A · d~r + ~
A · d~r = A~ · d~r. (8.163)
C1 C2 C1+2

Andererseits gilt wegen Gleichung (8.162) aber auch


I I
~ · d~r +
A ~ r1 ) · ∆f~1 + rot A(~
~ · d~r = rot A(~
A ~ r2 ) · ∆f~2 (8.164)
C1 C2

und somit
I
~ r1 ) · ∆f~1 + rot A(~
~ · d~r = rot A(~
A ~ r2 ) · ∆f~2 . (8.165)
C1+2
8 Integration von Feldern: Kurven- und Flächenintegrale 221

Wir können diese Prozedur durch Hinzufügen weiterer Facetten ∆fi nun wiederholen, bis die
gesamte Fläche F ausgefüllt ist. Bei jedem dieser Schritte bleibt beim Linienintegral nur jener Teil
übrig, der von der äußeren Berandung der Fläche stammt (siehe Abb. 8.35).

Abbildung 8.35: In der Summe der Kurvenintegrale über die Umrandungen der Teilflächen kürzen
sich alle Beiträge außer die, die vom äußeren Rand der Gesamtfläche stammen.

Die Summe aller Kurvenintegrale über die Umrandung Ci der Teilflächen wird also zum Kurven-
integral über die Einhüllende C1+2+···+N aller N Flächenelemente. Wir erhalten also
I X
~ · d~r =
A ~ ri ) · ∆f~i .
rot A(~ (8.166)
C1+2+···+N i

Im Limes N → ∞, also für immer kleiner werdende Flächenelemente, strebt C1+···+N gegen die
Randkurve C der Fläche F und die Summe auf der rechten Seite wird zum Oberflächenintegral:
I Z
~ · d~r =
A ~ · df~.
rot A (8.167)
C F

Dies ist der Stokessche Integralsatz.

In Worten lautet der Stokessche Integralsatz:


~ r ) und eine Fläche F ist das Oberflächenintegral über das zugehörige Wir-
Für ein Vektorfeld A(~
belfeld gleich dem Kurvenintegral über das Vektorfeld längs der Berandung C der Fläche F .

Beispiel:
H
Als Beispiel für den Satz von Stokes berechnen wir das Ringintegral ~ · d~r des Vektorfeldes
A
C
 
−3y
~ r) = 
A(~  3x

 (8.168)
1
längs eines Kreises in der xy-Ebene mit Mittelpunkt im Ursprung und Radius r (siehe Abb. 8.36).

Aus dem Satz von Stokes folgt, dass


I Z
~ · d~r =
A ~ · df~,
rot A (8.169)
C F

wobei F eine beliebige glatte Fläche ist, deren Rand der Kreis ist, längs dessen das Kurvenintegral
berechnet werden soll. Da die Fläche F beliebig ist, wählen wir einfach die ebene Kreisfläche. Das
Oberflächenelement ist demnach df~ = ~ez dxdy unabhängig vom Ort. Die Rotation des Vektorfeldes
~ ist
A
         

−3y ∂x −3y 0−0 0
   ∂       
rot  3x  =  ∂y  ×  3x  =  0 − 0  =  0  . (8.170)
1 ∂ 1 3+3 6
∂z
222 8 Integration von Feldern: Kurven- und Flächenintegrale

Abbildung 8.36: Flächenelement in einem Kreis in der Ebene. Die Flächenvektoren df~ stehen
normal auf die xy-Ebene.

Das Oberflächenintegral wird deshalb zu


   
Z ZZ 0 0
~ · df~ =
rot A
   
 0  ·  0  dxdy
F x2 +y 2 ≤r 2
6 1
ZZ
= 6 dxdy = 6πr2 . (8.171)
x2 +y 2 ≤r 2

Natürlich hätten wir auch das Kurvenintegral direkt auswerten können. Für den Kreis bietet sich
die Parametrisierung
 
r cos t
 
~r(t) =  r sin t  mit 0 ≤ t ≤ 2π (8.172)
0
an. Der Tangentenvektor ist folglich gegeben durch:
 
−r sin t
d~r  
=  r cos t  . (8.173)
dt
0
Das Kurvenintegral wird mit dieser Parametrisierung zu
   
I Z2π −3r sin t −r sin t
~ · d~r =
A
   
 3r cos t  ·  r cos t  dt
C
0 1 0
Z2π Z2π
2 2 2 2
= 3r (sin t + cos t)dt = 3r dt = 6r2 π. (8.174)
0 0

Das Kurvenintegral ist in diesem Fall nicht viel schwerer zu berechnen als das Oberflächenintegral.
Aus dem Oberflächenintegral sehen wir aber, dass in diesem Fall für jede Kurve in der Ebene das
Integral nur von der Größe der eingeschlossenen Fläche abhängt.

8.4.3 Bedeutung

Aus dem Satz von Stokes folgt, dass das Oberflächenintegral eines Wirbelfeldes ∇ × A ~ über
eine geschlossene Oberfläche F verschwindet. Wir können uns nämlich vorstellen, dass eine ge-
schlossene Fläche entsteht, wenn wir die Randkurve C wie bei einem Beutel auf einen Punkt
8 Integration von Feldern: Kurven- und Flächenintegrale 223

zusammenziehen (siehe Abb. 8.37). Die Länge des Randes ist dann 0 und somit verschwindet auch
das Kuvenintegral
I
~ · d~r = 0.
A (8.175)
C

Wegen des Satzes von Stokes muss deshalb auch das Oberflächenintegral
I
~ · df~
rot A (8.176)
F

über die geschlossene Oberfläche verschwinden.

Abbildung 8.37: Wenn sich die Umrandung C auf einen Punkt zusammenzieht, wird die Fläche F
zu einer geschlossenen Fläche.

Aus dem Satz von Stokes folgt weiters,


R dass alle Flächen F1 , F2 , . . . mit demselben Rand C auch
dasselbe Oberflächenintegral F rot A ~ · df~ liefern.

Schließlich erlaubt es uns der Satz von Stokes, die Frage nach der Wegunabhängigkeit von
Kurvenintegralen noch einmal aufzugreifen. Wir haben ja schon früher gesehen, dass die Wegun-
abhängigkeit von Integralen äquivalent zum Verschwinden
H von Kurvenintegralen längs geschlosse-
ner Kurven ist. Wenn wir nun annehmen, dass C A ~ · d~r = 0 für beliebige geschlossene Kurven gilt,
muss dies auch für Kurven um sehr kleine Flächen gelten. Dann gilt jedoch
I
A ~ · df~ = 0.
~ · d~r = rot A (8.177)
C

Da dies gemäß Annahme für beliebige (aber sehr kleine) Flächen gelten muss, finden wir, dass die
Rotation verschwindet. Verschwindet also das Kurvenintegral für beliebige Kurven, verschwindet
auch die Rotation:
I
A~ · d~r = 0 für alle geschlossenen Wege C ⇒ rot A ~ = 0. (8.178)
C

Umgekehrt folgt aus dem Stokesschen Satz, dass das Kurvenintegral längs geschlossener Kurven
verschwindet, wenn die Rotation gleich 0 ist:
I Z
~
A · d~r = ~ · df~ = 0.
rot A (8.179)
C F

Das heißt, dass rot A ~ = 0 eine sowohl notwendige als auch hinreichende Bedingung für die
Wegunabhängigkeit von Kurvenintegralen ist. Um festzustellen, ob Kurvenintegrale wegunabhängig
sind, genügt es also zu prüfen, ob die Rotation des Vektorfeldes verschwindet.

Zusammenfassend halten wir fest, dass folgende Aussagen äquivalent sind:


R
• Das Kurvenintegral ~ r ) · d~r ist wegunabhängig.
A(~
C
H
• Das Kurvenintegral ~ r ) · d~r über jede geschlossene Kurve C verschwindet.
A(~
C
224 8 Integration von Feldern: Kurven- und Flächenintegrale

~ der Gradient von φ ist, A


• Es existiert ein skalares Feld φ, sodass das Vektorfeld A ~ = grad φ.
~
Die Funktion φ wird Potential genannt und das Vektorfeld A konservativ.
~ des Vektorfeldes A
• Die Rotation rot A ~ verschwindet.

(Die Frage, ob das Integrationsgebiet einfach zusammenhängend ist oder nicht, haben wir in allen
Überlegungen vernachlässigt. Der interessierte Leser sei in diesem Punkt auf die weiterführende
Literatur verwiesen.)

8.4.4 Das Vektorpotential

Falls rot A~ = 0, können wir ein Skalarfeld φ definieren, sodass dessen Gradient gleich dem Vek-
~
torfeld A ist: A~ = grad φ. Es stellt sich nun die Frage (zum Beispiel im Zusammenhang mit
magnetischen Feldern), ob wir auch ein Feld B, ~ dessen Divergenz verschwindet (div B ~ = 0), als
Ableitung eines Feldes darstellen können.

Im Falle der Darstellung eines wirbelfreien Feldes als Gradientenfeld kann man von der Beobach-
tung ausgehen, dass die Rotation eines Gradientenfeldes verschwindet,

rot (grad φ) = 0. (8.180)

Dies legt die Vermutung nahe, dass ein wirbelfreies Feld E~ als Gradient eines Skalarfeldes ausge-
drückt werden kann. Wie wir ja jetzt wissen, kann man das tatsächlich tun. Nun gibt es die analoge
Identität
~ = 0,
div (rot A) (8.181)

die besagt, dass Wirbelfelder quellenfrei sind. Ganz analog zum obigen Fall scheint dieses Ergebnis
die Vermutung nahe zu legen, dass ein quellenfreies Feld B ~ (div B~ = 0) als Rotation eines anderen
~ ~ ~
Vektorfeldes A geschrieben werden könnte: B = rot A. Diese Vermutung kann durch explizite Kon-
~ für ein quellenfreies Feld B
struktion eines Vektorfeldes A ~ bestätigt werden. Ein solches Vektorfeld
~
A wird Vektorpotential genannt.
~ = rot A,
Falls B ~ muss für die Komponenten von A
~ gelten:

∂Az ∂Ay ∂Ax ∂Az ∂Ay ∂Ax


Bx = − , By = − , Bz = − . (8.182)
∂y ∂z ∂z ∂x ∂x ∂y

Da wir zu jedem Vektorpotential A~ den Gradienten einer skalaren Funktion χ addieren können,
~ = rot A
ohne die Beziehung B ~ zu stören,

~ = rot A
B ~ = rot A ~ + grad χ),
~ + rot (grad χ) = rot (A (8.183)
| {z }
=0

~ eine gewisse Freiheit. Um A


haben wir in der Wahl von A ~ eindeutig zu bestimmen, müssen noch
Nebenbedingungen gewählt werden. Man nennt dies die Eichung von A. ~

Wir nutzen nun diese Eichmöglichkeit und versuchen den Ansatz Az = 0. Dann haben wir

∂Ay ∂Ax
Bx = − und By = . (8.184)
∂z ∂z
Integration nach z liefert:
Zz
Ay = − Bx (x, y, z ′ )dz ′ (8.185)
za
8 Integration von Feldern: Kurven- und Flächenintegrale 225

und
Zz
Ax = By (x, y, z ′ )dz ′ + f (x, y). (8.186)
za

Hier ist f (x, y) eine Integrationskonstante, auf die wir für Ay wegen der Eichmöglichkeit verzichtet
haben. Um die dritte Gleichung zu lösen, setzen wir Ax und Ay ein und erhalten:
∂Ay ∂Ax
Bz = −
∂x ∂y
Zz Zz
∂Bx ′ ′ ∂By ∂f
= − (x, y, z )dz − (x, y, z ′ )dz ′ −
∂x ∂y ∂y
za za
Zz  
∂Bx ∂By ∂f
= − (x, y, z ′ ) + (x, y, z ′ ) dz ′ − . (8.187)
∂x ∂y ∂y
za

~ quellenfrei ist. Demnach gilt:


Wir wissen aber, dass B

~ = ∂Bx + ∂By + ∂Bz = 0


div B (8.188)
∂x ∂y ∂z
und somit
∂Bx ∂By ∂Bz
+ =− . (8.189)
∂x ∂y ∂z

Wenn wir dieses Ergebnis in Gleichung (8.187) einsetzen, ergibt sich


Zz  
∂Bz ′ ∂f
Bz (x, y, z) = (x, y, z ) dz ′ − . (8.190)
∂z ′ ∂y
za

Wir können das Integral ausführen und erhalten

Bz
(x, 
y, Bz
z) =  (x, 
y, z) − Bz (x, y, za ) −
∂f
. (8.191)
 ∂y
Das heißt,
∂f
= −Bz (x, y, za ). (8.192)
∂y
Integration liefert schließlich:
Zy
f (x, y) = − Bz (x, y ′ , za )dy ′ . (8.193)
ya

~
Somit ist folgendes Feld ein Vektorpotential für B:
Zz Zy
′ ′
Ax (x, y, z) = By (x, y, z )dz − Bz (x, y ′ , za )dy ′ , (8.194)
za ya
Zz
Ay (x, y, z) = − Bx (x, y, z ′ )dz ′ , (8.195)
za
Az (x, y, z) = 0. (8.196)
~ impliziert also die Existenz eines Vektorpotentials A,
Die Quellenfreiheit eines Feldes B ~ sodass
~ = rot A.
B ~
226 8 Integration von Feldern: Kurven- und Flächenintegrale
Kapitel 9

Differentialgleichungen

9.1 Grundbegriffe

Beziehungen zwischen Variablen werden in der Physik oft durch Gleichungen beschrieben, welche
Ableitungen enthalten. Ein Beispiel für eine solche Gleichung ist die Newtonsche Bewegungsglei-
chung
2
d ~r
F~ = m~a = m 2 , (9.1)
dt
welche die Dynamik eines Objektes der Masse m unter Einwirkung der Kraft F~ beschreibt. Die
Kraft F~ , die auf den Körper wirkt, kann konstant oder eine Funktion des Ortes sein. Durch Lösung
dieser Gleichung erhält man den Ort ~r(t) des Objekts als Funktion der Zeit. Die Lösung der
Gleichung F = m~r¨ ist also keine Zahl sondern eine Funktion.

Eine Gleichung, die eine oder mehrere Ableitungen einer gesuchten Funktion y(x) enthält, nennt
man eine Differentialgleichung. Wenn die höchste Ableitung von y(x), die in der Gleichung
auftritt, die n-te Ableitung y (n) (x) ist, hat man es mit einer Differentialgleichung n-ter Ord-
nung zu tun. Natürlich kann eine Differentialgleichung n-ter Ordnung auch Ableitungen niedrige-
rer Ordnung beinhalten sowie von der Funktion y(x) selbst und der Variablen x abhängen. Eine
Differentialgleichung, bei der die Funktion y(x) nur von einer einzigen Variablen x und den Ablei-
tungen dieser Funktion nach x abhängt, nennt man eine gewöhnliche Differentialgleichung. Im
Gegensatz dazu ist eine partielle Differentialgleichung eine Bestimmungsgleichung für eine Funk-
tion y(x1 , x2 , . . . , xn ), die von mehreren Variablen und den partiellen Ableitungen der Funktion
abhängt. Auch in diesem Fall bezieht sich die Ordnung der Gleichung auf die höchste vorkommende
partielle Ableitung.

Die allgemeine Form einer gewöhnlichen Differentialgleichung für die Funktion y(x) ist:

F (x, y, y ′ , y ′′ , y ′′′ , . . . , y (n) ) = 0. (9.2)

Hier haben wir die Differentialgleichung in impliziter Form dargestellt. Falls wir sie nach der
höchsten Ableitung auflösen können, ergibt sich in expliziter Form

y (n) = f (x, y, . . . , y (n−1) ). (9.3)

Beispiele für gewöhnliche Differentialgleichungen sind

y ′′ + y = 0, (9.4)
(y ′ )2 + xy = 0, (9.5)
sin x · y ′ + y 2 = 0. (9.6)

227
228 9 Differentialgleichungen

Eine Funktion y(x) bezeichnen wir als Lösung einer gegebenen Differentialgleichung, falls y(x)
diese Gleichung erfüllt. Eine Funktion, die die Differentialgleichung löst, wird auch ein Integral
der Differentialgleichung genannt und das Finden einer solchen Lösung wird auch Integrieren
genannt.

Betrachten wir zum Beispiel die Differentialgleichung

y ′′ = −y. (9.7)

Da für die Funktion y(x) = sin x gilt, dass y ′ = cos x und y ′′ = − sin x = −y, ist y = sin x eine
Lösung dieser Differentialgleichung. Es gibt für diese Differentialgleichung jedoch mehr als eine
Lösung. So wird sie auch von y = 3 sin x oder allgemeiner von y = A sin x erfüllt. Weiters ist
die Funktion y(x) = cos x wegen y ′ = − sin x und y ′′ = − cos x = −y eine Lösung. Genauso löst
y = 7 cos x oder allgemeiner y = B cos x die Gleichung. Aus den beiden Lösungen A sin x und
B cos x können wir durch Addition eine allgemeine Lösung konstruieren:

y(x) = A sin x + B cos x. (9.8)

Für beliebige Konstanten A und B löst y(x) die Differentialgleichung y ′′ = −y. Die Differential-
gleichung hat also eine unendliche Anzahl von Lösungen. Da A und B beliebig gewählt werden
können, sprechen wir hier von einer zweiparametrigen Lösungsschar. Für eine Differentialgleich-
ung n-ter Ordnung hat eine solche allgemeine Lösung n frei wählbare Parameter.

Durch zusätzliche Bedingungen, welche die Werte der Parameter festsetzen, erhält man aus der
allgemeinen Lösung eine Partikulärlösung (oder spezielle Lösung). Wenn man beispielsweise
weiß, dass für das obige Beispiel y am Ort x = 0 den Wert 0 besitzt, folgt:

y(0) = A sin(0) +B cos(0) = B = 0. (9.9)


| {z } | {z }
=0 =1

Der Wert der ersten Ableitung am Ort x = 0 legt dann auch noch den Parameter A fest

y ′ (0) = A cos(0) −B sin(0) = A. (9.10)


| {z } | {z }
=1 =0

Wenn wir zum Beispiel wissen, dass y ′ (0) = 1 ist, folgt A = 1. Die so genannten Anfangsbedin-
gungen y(0) = 0 und y ′ (0) = 1 legen also die Parameter A = 1 und B = 0 fest und führen so auf
die Partikulärlösung

y(x) = sin x. (9.11)

Für eine allgemeine Lösung y(x) einer Differentialgleichung n-ter Ordnung werden die n Parameter
durch Angabe des Funktionswertes y(x0 ) und der Werte der (n − 1) Ableitungen y ′ (x0 ), y ′′ (x0 ),
. . . , y (n−1) (x0 ) an einer Stelle x0 festgelegt. In diesem Fall spricht man von einem Anfangswert-
problem oder einer Anfangswertaufgabe. Diese Bezeichnungsweise stammt natürlich von der
Betrachtung einer Variablen y(t) als Funktion der Zeit t. Die Anfangsbedingungen y(t0 ), y ′ (t0 ),
. . . , y (n−1) (t0 ) beschreiben den Zustand des Systems zum Zeitpunkt t0 . Die Partikulärlösung be-
schreibt dann die zeitliche Entwicklung des Systems ausgehend von diesen Anfangsbedingungen.

Alternativ dazu können wir die Parameter der allgemeinen Lösung auch durch Angabe der Funk-
tionswerte y(x) an n verschiedenen Stellen x1 , x2 , . . . , xn festlegen. Die Funktionswerte an diesen
Stellen werden Randwerte oder Randbedingungen genannt und man spricht in diesem Fall von
einem Randwertproblem oder einer Randwertaufgabe.

Im obigen Beispiel können wir etwa verlangen, dass y(x) an den Stellen x1 = 0 und x2 = π/2 die
Werte y(x1 = 0) = 0 und y(x2 = π/2) = 2 besitzt. Diese Randbedingungen können wir durch
9 Differentialgleichungen 229

Wahl der Parameter A und B erfüllen:

A sin(0) +B cos(0) = 0 ⇒ B = 0, (9.12)


| {z } | {z }
=0 =1
A sin( π2 ) +B cos( π2 ) = 2 ⇒ A = 2. (9.13)
| {z } | {z }
=1 =0

Die Partikulärlösung unter diesen Randbedingungen ist also

y(x) = 2 sin x. (9.14)

Zur analytischen Lösung von Differentialgleichungen gibt es kein allgemein gültiges Rezept. Es gibt
aber einige wichtige gewöhnliche Differentialgleichungen, die wir lösen können. Diese Differential-
gleichungen wollen wir im Folgenden diskutieren. Falls für eine gewöhnliche Differentialgleichung
keine analytische Lösung existiert, kann man numerische Methoden verwenden, um Lösungen
mit beliebiger Genauigkeit zu erhalten. Zur numerischen Integration von Differentialgleichun-
gen existiert eine Vielzahl von Methoden, bei denen die Differentialgleichungen üblicherweise in
kleinen Schritten gelöst werden.

9.2 Differentialgleichungen erster Ordnung

Differentialgleichungen erster Ordnung enthalten nur die gesuchte Funktion y(x) selbst und ihre
erste Ableitung y ′ (x):

F (x, y, y ′ ) = 0 (9.15)

oder nach y ′ aufgelöst

y ′ = f (x, y). (9.16)

Beispiele dafür sind



y ′ = xy, sin(y ′ + x) cos y = x und y′ = y. (9.17)

In dieser Form gibt die Differentialgleichung für jeden Punkt in der xy-Ebene eine Richtung (Stei-
gung) vor. Damit y(x) eine Lösung der Differentialgleichung ist, muss ihr Graph diesen Richtungen
in jedem Punkt folgen (siehe Abb. 9.1). Anschaulich ist klar, dass das Richtungsfeld y ′ = f (x, y) für
eine bestimmte Anfangsbedingung (x0 , y0 ) die Lösung der Differentialgleichung eindeutig festlegt.

Im einfachsten Fall hängt die rechte Seite der Gleichung nicht von y ab und wir erhalten die
Differentialgleichung
dy
y ′ = f (x) oder = f (x). (9.18)
dx
Diese Differentialgleichung ist uns schon früher begegnet (im Kapitel über die Integration), nur
haben wir sie damals nicht als Differentialgleichung bezeichnet. Das Auffinden einer Funktion y(x),
sodass ihre Ableitung dy/dx gleich einer gegebenen Funktion f (x) ist, ist nämlich die Hauptaufgabe
der Integralrechnung: Finde eine Funktion F (x) (die so genannte Stammfunktion), sodass für ihre
Ableitung F ′ (x) = f (x) gilt. Die Lösung y(x) der Differentialgleichung (9.18) ist nichts anderes
als die Stammfunktion von f (x). Daher lautet die allgemeine Lösung der Differentialgleichung
(9.18)
Z
y(x) = f (x)dx + C, (9.19)
R
wobei hier f (x)dx das unbestimmte Integral ist, das von der Variablen x abhängt.
230 9 Differentialgleichungen

Abbildung 9.1: Eine Differentialgleichung der Form y ′ = f (x, y) gibt an jedem Punkt (x, y) die
Steigung y ′ vor. Die Lösungen der Differentialgleichung müssen tangential zu diesem Richtungsfeld
sein. Durch Angabe der Anfangsbedingungen (x0 , y0 ) wählt man aus der Schar der möglichen
Lösungen eine bestimmte Lösung aus.

Die Integrationskonstante C ist hier der freie Parameter, der erst durch die Wahl der Anfangsbedin-
gung (oder Randbedingung) festgelegt wird. Betrachten wir zum Beispiel die Differentialgleichung
dy
= x. (9.20)
dx
Die allgemeine Lösung dieser Gleichung ist y(x) = x2 /2 + C. Durch Ableitung von y(x) = x2 /2 + C
nach x können wir explizit überprüfen, dass diese Funktion die Differentialgleichung tatsächlich
erfüllt. Die Randbedingung y(0) = 1 legt die Konstante C fest:

02
+C =1 ⇒ C = 1. (9.21)
2

Eine gewöhnliche Differentialgleichung erster Ordnung hat auch im allgemeinen Fall eine Lösungs-
schar, die einen freien Parameter c besitzt: y = y(x, c). Um diesen freien Parameter c festzusetzen,
genügt für die Differentialgleichung erster Ordnung eine einzelne Anfangs- oder Randbedingung.

Im Folgenden werden wir einige Differentialgleichungen erster Ordnung behandeln, die einfach
genug sind, dass wir sie leicht analytisch lösen können.

9.2.1 Differentialgleichungen mit separierbaren Variablen

Wenn sich eine Differentialgleichung erster Ordnung in der Form


dy
= f (x)g(y) (9.22)
dx
schreiben lässt, können wir sie auf einfache Weise lösen. Da die rechte Seite ein Produkt von zwei
Funktionen ist, deren eine nur von x und die andere nur von y abhängt, können wir die Gleichung
in der Form
dy
= f (x)dx (9.23)
g(y)
schreiben. Dabei haben wir die ursprüngliche Gleichung so umgeformt, dass die rechte Seite nur von
y abhängt und die linke Seite nur von x. Wir haben die Variablen also separiert (d.h. getrennt).
9 Differentialgleichungen 231

Aus diesem Grund bezeichnet man Differentialgleichungen der Form y ′ = f (x)g(y) als Differential-
gleichung mit separierbaren Variablen. Aus dieser Gleichung für die beiden Differentiale folgt, dass
sich die zugehörigen unbestimmten Integrale nur um eine willkürliche Konstante C unterscheiden
können:
Z Z
dy
= f (x)dx + C. (9.24)
g(y)

Nach Integration beider Seiten und Auflösung der Gleichung nach y erhält man die allgemeine
Lösung der Differentialgleichung mit dem freien Parameter C in expliziter Form. Falls sich die
erhaltene Gleichung nicht nach y auflösen lässt, ist die Lösung in impliziter Form gegeben.

Mathematisch etwas exakter lassen sich Differentialgleichungen mit separierbaren Variablen wie
folgt behandeln. Zunächst bestimmen wir die Nullstellen y1 , y2 , . . . der Funktion g(y). Durch
Einsetzen in die Differentialgleichung erkennen wir, dass die konstanten Funktionen y(x) = y1 ,
y(x) = y2 , etc. Lösungen sind.

Als nächstes betrachten wir die Differentialgleichung in den nullstellenfreien Intervallen zwischen
den Nullstellen. Da in diesen Intervallen g(y) 6= 0, können wir die Differentialgleichung umformen
zu:
y′
= f (x). (9.25)
g(y)
Wir definieren nun die Funktion Φ(y) als die Stammfunktion von 1/g(y) und die Funktion F (x)
als die Stammfunktion von f (x). Da in den betrachteten Intervallen φ′ (x) = 1/g(x) nullstellenfrei
ist, d. h. Φ streng monoton fallend oder wachsend ist, existiert hier die Umkehrfunktion Φ−1 von
Φ. Durch Einsetzen in die Differentialgleichung können wir verifizieren, dass

y(x) = Φ−1 (F (x) + C) (9.26)

die Differentialgleichung löst:

y ′ (x) = (Φ−1 )′ (F (x) + C)F ′ (x)


f (x) f (x)
= = ′ = f (x)g(y), (9.27)
Φ′ (Φ−1 (F (x) + C)) Φ (y)

wobei wir die Differentiationsregel (3.26) für die Umkehrfunktion verwendet haben. C ist hier
wieder eine beliebige Integrationskonstante, die durch Wahl der Anfangsbedingungen festgelegt
wird.

Beispiel:

Gegeben sei die Differentialgleichung xy ′ + y = 0. Wir können diese Gleichung umformen zu

dy dx
=− . (9.28)
y x

Integration auf beiden Seiten ergibt:

ln y = − ln x + C. (9.29)

Wir wenden nun auf beide Seiten der Gleichung die Exponentialfunktion an und erhalten

eln y = e− ln x+C = e− ln x · eC . (9.30)

Somit gilt
α
y= , (9.31)
x
232 9 Differentialgleichungen

wobei wir die Konstante eC in α umbenannt haben. Die allgemeine Lösung ist also die einpara-
metrige Kurvenschar y = α/x. Eine Anfangsbedingung (z. B. y(1) = α/1 = 2) setzt den freien
Parameter fest (hier auf α = 2).

Beispiel: Barometrische Höhenformel

Als weiteres Beispiel wollen wir die Abhängigkeit des Luftdrucks von der Höhe in einer isothermen
Atmosphäre betrachten. Dazu müssen wir zunächst eine geeignete Differentialgleichung aufstellen
und sie danach auch lösen. (In den meisten Fällen ist das Aufstellen einer Gleichung der einfachere
Schritt als die anschließende Lösung der Gleichung.)

Der Luftdruck an einem bestimmten Ort wird durch das Gewicht der Luftsäule bestimmt, die
sich über diesem Ort befindet. Wenn wir uns nach oben bewegen, wird die Luftmenge, die auf
einer bestimmten Fläche lastet, immer kleiner. Daher nimmt der Luftdruck mit der Höhe ab. Um
herauszufinden, auf welche Weise der Luftdruck von der Höhe abhängt, betrachten wir eine dünne
Luftschicht, die parallel zum Boden ist und sich in der Höhe z befindet (siehe Abb. 9.2). (Wir
messen die Höhe z bezüglich des Bodens, den wir in die xy-Ebene legen.)

Abbildung 9.2: Der Druck an der Oberseite der Luftschicht mit der Dicke dz unterscheidet sich
vom Druck an der Unterseite um das Gewicht pro Flächeneinheit der Luftschicht selbst.

An der Unterseite dieser Schicht, also bei der Höhe z, herrscht der Druck p(z). Auf ihrer Oberseite
ist der Druck leicht verschieden: p(z + dz) = p(z) + dp. Wir stellen uns jetzt vor, dass wir aus dieser
Schicht einen dünnen Quader mit der Grundfläche A herausschneiden. Dieser Quader enthält die
Masse ρ(z)dV = ρ(z)Adz an Luft, wobei hier dV = Adz das Volumen des Quaders ist. Der
Druckunterschied zwischen der Höhe z und z + dz ist auf das Gewicht der Luftmassen in dieser
Schicht zurückzuführen. Das Gewicht gρ(z)Adz der Luft im Quader wirkt auf die Fläche A. Die
Druckdifferenz dp ergibt sich aus dieser Kraft dividiert durch die Fläche A (Druck ist Kraft pro
Fläche):
gρ(z)Adz
dp = − = −gρ(z)dz. (9.32)
A
Das negative Vorzeichen ist notwendig, weil der Druck mit der Höhe abnimmt.

Wir benötigen jetzt noch einen Ausdruck für die Dichte ρ der Luft. Die Dichte eines Gases hängt
natürlich von den äußeren Bedingungen wie Temperatur und Druck ab. Wir nehmen hier an, dass
wir die Luft als ideales Gas behandeln können. Für ein ideales Gas wird der Zusammenhang
zwischen Druck p, Volumen V und Temperatur T durch die Zustandsgleichung
pV = N kB T (9.33)
beschrieben. Dabei ist N die Anzahl der Gasmoleküle und kB ist die so genannte Boltzmannkon-
stante. Der Druck eines idealen Gases ist demnach gegeben durch:
N kB T
p= . (9.34)
V
9 Differentialgleichungen 233

Die rechte Seite dieser Gleichung hängt von der Teilchendichte N/V ab. Da wir jedoch an der
Abhängigkeit des Druckes von der Massendichte ρ = M/V interessiert sind (M ist hier die
Gesamtmasse des Gases im Volumen V ), multiplizieren wir Zähler und Nenner auf der rechten
Seite der obigen Gleichung mit der Masse m eines individuellen Gasteilchens:
N mkB T M kB T kB T
p= = =ρ . (9.35)
Vm V m m
Hier haben wir ausgenutzt, dass die Gesamtmasse M gleich der Masse m einzelner Teilchen mul-
tipliziert mit der Anzahl N der Teilchen ist. Wir können die Dichte ρ somit ausdrücken als
pm
ρ= . (9.36)
kB T
Diese Beziehung setzen wir nun in Gleichung (9.32) ein und erhalten
gm
dp = −gρdz = − pdz. (9.37)
kB T

Diese Gleichung haben wir mit Hilfe von physikalischen Überlegungen aufgestellt. Was nun folgt
ist die mathematische Lösung dieser Gleichung.

Wir können die Variablen p und z separieren:


dp gm
=− dz. (9.38)
p kB T
Integration ergibt (unter der Annahme einer isothermen Atmosphäre, das heißt unter der Annahme,
dass die Temperatur T nicht von der Höhe z abhängt und somit gm/kB T konstant ist):
gm
ln p = − z+C (9.39)
kB T
oder durch Anwendung der Exponentialfunktion auf beiden Seiten:
 
gm
p = exp − z exp{C}. (9.40)
kB T

Die Konstante K ≡ exp{C} ermitteln wir, indem wir verlangen, dass bei z = 0 der Druck einen
bestimmten p0 Wert annehmen muss:
 
gm
p(0) = exp − 0 exp{C} = exp{C} = p0 . (9.41)
kB T

Somit erhalten wir schließlich die barometrische Höhenformel:


 
gm
p = p0 exp − z . (9.42)
kB T

Beispiel: Kompression eines idealen Gases

Stellen wir uns ein Rohr mit der Querschnittsfläche A vor, das auf einer Seite von einem beweglichen
Kolben und auf der anderen Seite von einer unbeweglichen Wand abgeschlossen wird (siehe Abb.
9.3).

Das eingeschlossene Volumen sei mit einem idealen Gas gefüllt, das der Zustandsgleichung

pV = N kB T (9.43)

gehorcht. Da im Gas ein gewisser Druck p vorherrscht, wirkt auf den Kolben eine Kraft F = Ap,
die den Kolben nach außen drückt. Wenn wir das Gas nun komprimieren wollen, indem wir den
234 9 Differentialgleichungen

Abbildung 9.3: Ein beweglicher Kolben leistet Arbeit gegen den Druck eines Gases in einem Zy-
linder.

Kolben in das Rohr schieben, verrichten wir gegen diese Kraft Arbeit. Wir wollen bestimmen,
welche Arbeit aufgebracht werden muss, um das Volumen von seinem ursprünglichen Wert V0 auf
ein kleineres Volumen zu verringern. Dazu betrachten wir zunächst die Arbeit dW , die geleistet
wird, wenn wir den Abstand x des Kolbens von der fixen Wand um einen kleinen Betrag dx
verringern. Diese kleine Arbeit dW ergibt sich aus dem Produkt von Weg und Kraft
dW = −F dx = −pAdx. (9.44)
Bei einer Kompression ist die Verschiebung dx negativ. Da die gegen die (positive) Kraft F gelei-
stete Arbeit jedoch positiv sein soll, haben wir in der obigen Gleichung ein negatives Vorzeichen.
Durch die Verschiebung des Kolbens ändert sich das eingeschlossene Volumen um
dV = Adx. (9.45)
Wir können daher in Gleichung (9.44) Adx durch dV ersetzen:
dW = −pdV. (9.46)
Da sich durch die Kompression nicht nur das Volumen verändert sondern auch der Druck, müssen
wir nun den Druck p als Funktion des Volumens V ausdrücken. Aus der Zustandsgleichung des
idealen Gases folgt:
N kB T
p= . (9.47)
V
Einsetzen in Gleichung (9.46) ergibt:
N kB T
dW = − dV. (9.48)
V
Wenn wir die Kompression isotherm durchführen, das heißt, wenn die Temperatur des Gases
durch Kontakt des Rohres mit einem Wärmebad konstant gehalten wird (dazu muss die Rohr-
wand natürlich wärmeleitend sein), ergibt die Integration:
W = −N kB T ln V + C. (9.49)
Dies ist die allgemeine Lösung der Differentialgleichung. Um eine passende Partikulärlösung zu
erhalten, bemerken wir, dass zu Beginn des Prozesses noch keine Arbeit geleistet wurde. Wir
verlangen also
W (V0 ) = −N kB T ln V0 + C = 0. (9.50)
Somit erhalten wir für die Konstante C:
C = N kB T ln V0 . (9.51)
Die geleistete Arbeit ist demnach gegeben durch:
 
V0
W = N kB T ln V0 − N kB T ln V = N kB T ln . (9.52)
V
9 Differentialgleichungen 235

9.2.2 Homogene lineare Differentialgleichung

Eine allgemeine Differentialgleichung n-ter Ordnung F (x, y, y ′ , y ′′ , . . . , y (n) ) nennt man linear,
wenn die Funktion y und alle ihre n Ableitungen maximal in der 1. Potenz und nicht als Produkt
auftreten:
n
X
ai (x)y (i) = g(x), (9.53)
i=0

wobei wir hier die Konvention benutzen, dass y (0) = y.

Beispiele für lineare Differentialgleichungen sind:

y ′′ + ay ′ + by = 0, (9.54)
y ′ + sin x = 0, (9.55)
y ′′ + xy ′ − cos x = 0. (9.56)

Hingegen sind die folgenden Differentialgleichungen nichtlinear:

y ′′2 + y ′ = 0 (zweite Potenz), (9.57)


xy ′ y = 0 (Produkt). (9.58)

Eine lineare Differentialgleichung 1. Ordnung hat die allgemeine Form

y ′ + f (x)y = g(x). (9.59)

Die Funktion g(x) wird als Störterm oder Störfunktion bezeichnet. Falls der Störterm fehlt,
haben wir es mit einer homogenen Differentialgleichung zu tun; falls ein Störterm existiert, nennt
man die Differentialgleichung inhomogen.

Die allgemeine homogene lineare Differentialgleichung 1. Ordnung hat die Form

y ′ + f (x)y = 0. (9.60)

Diese Gleichung können wir durch Trennung der Variablen lösen:

dy
= −f (x)dx. (9.61)
y

Integration ergibt die allgemeine Lösung


Z
ln y = − f (x)dx + C (9.62)

oder anders ausgedrückt


 Z   Z 
y = exp − f (x)dx exp{C} = K exp − f (x)dx , (9.63)

wobei wir die Konstante exp{C} in K umbenannt haben.

Beispiel: Radioaktiver Zerfall

Durch radioaktiven Zerfall können sich Atomkerne in andere Typen verwandeln. Wir wollen nun
untersuchen, wie sich durch radioaktiven Zerfall die Anzahl der Atome der Ausgangssubstanz in
einer radioaktiven Substanz mit der Zeit ändert. Da der Zerfall eines Atoms unabhängig von den
Zerfällen der anderen Atome ist, zerfallen in einer doppelt so großen Menge von Atomen auch
236 9 Differentialgleichungen

doppelt so viele Atome. Die Zahl dN der in einem kurzen Zeitintervall dt in einer radioaktiven
Substanz zerfallenden Atome ist somit proportional zur Gesamtzahl N der vorhandenen Atome:
dN = −λN dt. (9.64)
Wir wählen hier ein negatives Vorzeichen, weil durch jeden Zerfall die Anzahl N der noch nicht zer-
fallenen Atome abnimmt. Die Proportionalitätskonstate λ, die Zerfallskonstante genannt wird,
hängt vom Atomtyp ab. λ besitzt die Dimension 1/Zeit. Durch Separation der Variablen erhalten
wir
dN
= −λdt. (9.65)
N
Integration liefert
ln N = −λt + C (9.66)
oder
N (t) = e−λt+C = Ke−λt . (9.67)
Die Randbedingung N (0) = N0 (Atomanzahl zum Zeitpunkt t = 0) setzt die Konstante K fest:
N (0) = Ke−λ0 = K = N0 . (9.68)
Das Zerfallsgesetz lautet also
N (t) = N0 e−λt . (9.69)
Die Anzahl der noch nicht zerfallenen Atome nimmt demnach exponentiell mit der Zeit ab (siehe
Abb. 9.4). Nach der Zeit τ1/2 = ln 2/λ ist noch die Hälfte der ursprünglich vorhandenen Atome
übrig. Man nennt diese Zeit die Halbwertszeit.

Abbildung 9.4: Die Anzahl der noch nicht zerfallenen Atome einer radioaktiven Substanz nimmt
mit der Zeit exponentiell ab. Nach der Halbwertszeit τ1/2 sind nur noch die Hälfte der Atome übrig.

Beispiel: Exponentielles Wachstum

Betrachten wir eine Population von Individuen, die sich vermehren können (z.B Bakterien in ei-
ner Nährlösung). Falls die Ressourcen nicht knapp sind, ist die Zunahme der Individuenanzahl
proportional zur Individuenanzahl selbst:
dN = λN dt. (9.70)
Die Proportionalitätskonstante λ ist die Vermehrungsrate. Die Differentialgleichung (9.70) un-
terscheidet sich nur im Vorzeichen vor der Proportionalitätskonstanten von der Differentialgleich-
ung (9.64) im vorherigen Beispiel. Derselbe Lösungsweg führt uns in diesem Fall zu
N (t) = N0 eλt . (9.71)
9 Differentialgleichungen 237

Die Populationsgröße nimmt exponentiell (also explosionsartig) zu. Für biologische Systeme kann
ein solches Wachstum natürlich nur weitergehen, bis die Ressourcen sich verknappen. Dann wird
λ schrumpfen und das Wachstum verlangsamen.

Beispiel: Bewegung mit Reibung

Wir betrachten einen Körper der Masse m, der sich unter dem Einfluss einer Reibungskraft entlang
einer Geraden bewegt. Die Bewegung des Körpers wird durch die Newtonsche Bewegungsgleichung

F = mv̇ (9.72)

beschrieben, wobei F die Kraft auf den Körper und v seine Geschwindigkeit ist. Die Kraft setzen
wir als proportional zur Geschwindigkeit und als der Bewegungsrichtung entgegengesetzt an:

F = −γv. (9.73)

(Für einen kugelförmigen Körper mit Radius R in einer Flüssigkeit mit der Zähigkeit η gilt etwa für
niedrige Geschwindigkeiten das Stokessche Reibungsgesetz: F = −6πηRv.) In der obigen Gleichung
ist γ die so genannte Reibungskonstante. Einsetzen dieses Ausdrucks in die Bewegungsgleichung
ergibt: