Sie sind auf Seite 1von 476

Oliver Deiser

Grundzüge der
Höheren Mathematik
Zahlen, Funktionen, Vektoren und Matrizen

für Caroline, Thalia und Larina


Inhalt

Vo r w o r t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1. Abschnitt Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1. Logik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Elemente der Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Junktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Wahrheitstafeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Das Wahrheitstafelverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Quantoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Quantorenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2. Mengen und Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Mengen und ihre Elemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Die Komprehension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Die Russell-Zermelo-Antinomie . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Geordnete Paare und Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . 33
Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

© Oliver Deiser Grundzüge der Höheren Mathematik


2 Inhalt

3. Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Der anschauliche Funktionsbegriff . . . . . . . . . . . . . . . . . . . . . . . . 42
Der mengentheoretische Funktionsbegriff . . . . . . . . . . . . . . . . . . 43
Darstellungen und Interpretationen . . . . . . . . . . . . . . . . . . . . . . . 44
Abbildungseigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Die Komposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Umkehrfunktion und Einschränkung . . . . . . . . . . . . . . . . . . . . . . 48
Bild und Urbild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Verschiedene Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4. Natürliche Zahlen und Induktion . . . . . . . . . . . . . . . . . . . . . . . . 59


Anschauliches Zählen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Die Dedekind-Peano-Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Arithmetik und Ordnung auf den natürlichen Zahlen . . . . . . . . . 63
Induktionsbeweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Die Gauß-Summe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Das Prinzip vom kleinsten Element . . . . . . . . . . . . . . . . . . . . . . . 67
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5. Rationale und reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73


Der naive Zahlbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Zahlen auf einer Linie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Die Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Die rationalen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Die Existenz irrationaler Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Suprema und Infima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Das Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Endliche und unendliche Dezimalbrüche . . . . . . . . . . . . . . . . . . . 82
Unendliche Dezimaldarstellungen . . . . . . . . . . . . . . . . . . . . . . . . 83
Exkurs: Endliche Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6. Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Die reelle Ebene als Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Der Körper der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 93
Die geometrische Deutung der Multiplikation . . . . . . . . . . . . . . . 94
Imaginärteil, Realteil und Betrag . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Die komplexe Konjugation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . 99
Die Darstellung komplexer Funktionen . . . . . . . . . . . . . . . . . . . . 101
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Grundzüge der Höheren Mathematik © Oliver Deiser


Inhalt 3

2 . A b s c h n i t t G r u n d b e g r i f f e d e r A n a l y s i s . . . . . . . . . . . . . . 111

1. Die elementaren Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113


Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Nullstellen von Polynomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Exponentialfunktionen und Logarithmen . . . . . . . . . . . . . . . . . . . 120
Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 123
Die Arkusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
2. Folgen und ihre Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Unendliche Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Grenzwerte von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Der Nachweis der Konvergenz und Divergenz . . . . . . . . . . . . . . . 141
Epsilon-Umgebungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Uneigentliche Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Die Limesregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Konvergenzkriterien für Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . 145
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3. Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Unendliche Reihen und ihre Partialsummen . . . . . . . . . . . . . . . . 154
Die harmonische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Die geometrischen Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
Konvergenzkriterien für Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Die Exponentialreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

4. Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Die Folgenstetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
Die Umgebungsstetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Der Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Der Extremwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

3 . A b s c h n i t t A b l e i t u n g e n u n d I n t e g r a l e . . . . . . . . . . . . . . . 183

1. Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
Grenzwerte für Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
Tangenten und lineare Approximation . . . . . . . . . . . . . . . . . . . . . 188
Die Ableitung als Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

© Oliver Deiser Grundzüge der Höheren Mathematik


4 Inhalt

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

2. Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
Die Berechnung von Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . 197
Die Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
Die Ableitung der Exponentialfunktion . . . . . . . . . . . . . . . . . . . . 199
Allgemeine Exponentialfunktionen und Logarithmen . . . . . . . . . 200
Ableitung von Kosinus und Sinus . . . . . . . . . . . . . . . . . . . . . . . . . 201
Ableitungen der elementaren Funktionen . . . . . . . . . . . . . . . . . . . 202
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

3. Die Taylor-Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210


Schmiegeparabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
Taylor-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Darstellung der gesamten Funktion als Taylor-Reihe . . . . . . . . . . 214
Teilweise Darstellung als Taylor-Reihe . . . . . . . . . . . . . . . . . . . . . 215
Darstellung als Taylor-Reihe nur im Entwicklungspunkt . . . . . . . 216
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

4. Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
Riemann-Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Integrierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
Elementare Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . . . 229
Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . 231
Die Existenz von Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . 232
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
Das Integral als Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

5. Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Die Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . 243
Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Die Substitutionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Nichtelementare Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . 252
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

Grundzüge der Höheren Mathematik © Oliver Deiser


Inhalt 5

4 . A b s c h n i t t Ve k t o r e n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

1. Reelle und komplexe Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . 264


Vektoren im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Spezielle Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
Die Vektoraddition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
Die Skalarmultiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
Komplexe Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

2. Norm und Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276


Die Euklidische Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Die Dreiecksungleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
Der Euklidische Abstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
Das Euklidische Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
Die Binomischen Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
Die Ungleichung von Cauchy-Schwarz . . . . . . . . . . . . . . . . . . . . 282
Norm und Skalarprodukt im Komplexen . . . . . . . . . . . . . . . . . . . 283
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

3. Winkel und Projektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290


Der Kosinussatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Die Winkelformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
Orthogonalität und Kollinearität . . . . . . . . . . . . . . . . . . . . . . . . . . 293
Die Projektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
Höhere Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301

4. Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
Der Spann eines Vektors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
Die Translation einer Menge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Affine Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
Der Schnitt zweier Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
Der Abstand eines Punktes von einer Geraden . . . . . . . . . . . . . . . 306
Geraden als algebraische Kurven ersten Grades . . . . . . . . . . . . . . 307
Algebraische Kurven zweiten Grades . . . . . . . . . . . . . . . . . . . . . . 308
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

5. Ebenen und Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314


Der Spann zweier Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
Affine Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
Eigenschaften des Kreuzprodukts . . . . . . . . . . . . . . . . . . . . . . . . . 318
Norm und Richtung des Kreuzprodukts . . . . . . . . . . . . . . . . . . . . 319
Ebenen als algebraische Flächen ersten Grades . . . . . . . . . . . . . . 320

© Oliver Deiser Grundzüge der Höheren Mathematik


6 Inhalt

Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325

6. Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326


Spann und Linearkombinationen . . . . . . . . . . . . . . . . . . . . . . . . . 327
Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
Lineare Unabhängigkeit in der Ebene und im Raum . . . . . . . . . . 329
Eine Charakterisierung über den Spann . . . . . . . . . . . . . . . . . . . . 330
Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
Koordinatenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
Komplexe Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339

5. Abschnitt Matrizen und


L i n e a r e G l e i c h u n g s s y s t e m e . . . . . . . . . . . . . . 341

1. Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
Matrizen und ihre Einträge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
Die Addition von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
Skalarmultiplikation und Vektorraumstruktur . . . . . . . . . . . . . . . 346
Das Matrix-Vektor-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
Das Produkt zweier Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
Eigenschaften des Matrizenprodukts . . . . . . . . . . . . . . . . . . . . . . . 348
Die Transposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
Komplexe Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355

2. Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356


Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
Darstellende Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
Beispiel 1: Rotations-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
Beispiel 2: Projektions-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . 360
Die Multiplikation als Verknüpfung von Abbildungen . . . . . . . . . 361
Komplexe lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367

3. Inverse Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368


Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
Invertierbarkeit für Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
Inversenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
Kriterien für die Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 372
Ein Invertierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
Komplexe Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379

Grundzüge der Höheren Mathematik © Oliver Deiser


Inhalt 7

4. Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380


Lineare Systeme und ihre Lösungen . . . . . . . . . . . . . . . . . . . . . . . 381
Typische Fälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
Eindeutig lösbare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
Koordinatenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
Die allgemeine Struktur des Lösungsraums . . . . . . . . . . . . . . . . . 385
Matrizen in Zeilenstufenform . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
Das Eliminationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
Ein Beispiel zum Eliminationsverfahren . . . . . . . . . . . . . . . . . . . . 388
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393

5. Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
Determinanten für 2 × 2 und 3 × 3-Matrizen . . . . . . . . . . . . . . . . . 395
Das Vorzeichen der Determinante . . . . . . . . . . . . . . . . . . . . . . . . 396
Permutationen und ihre Vorzeichen . . . . . . . . . . . . . . . . . . . . . . . 397
Allgemeine Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
Eigenschaften von Determinanten . . . . . . . . . . . . . . . . . . . . . . . . 399
Effektive Berechnung von Determinanten . . . . . . . . . . . . . . . . . . 400
Komplexe Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407

6. Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408
Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
Elementare Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
Das charakteristische Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . 411
Eigenwerte in der Euklidischen Ebene . . . . . . . . . . . . . . . . . . . . . 412
Eigenwerte im dreidimensionalen Euklidischen Raum . . . . . . . . 413
Diagonalisierbarkeit und Spektralsatz . . . . . . . . . . . . . . . . . . . . . . 414
Komplexe Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421

6 . A b s c h n i t t M e h r d i m e n s i o n a l e A n a l y s i s . . . . . . . . . . . . . . 423

1. Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
Vektorwertige reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 425
Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
Tangentialvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
Die Länge einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
Beispiele zur Längenberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . 429
Die Länge eines Funktionsgraphen . . . . . . . . . . . . . . . . . . . . . . . . 430
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435

2. Mehrdimensionale Differentialrechnung . . . . . . . . . . . . . . . . . . 436


Mehrdimensionale Definitionsbereiche . . . . . . . . . . . . . . . . . . . . 437
Visualisierungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439

© Oliver Deiser Grundzüge der Höheren Mathematik


8 Inhalt

Partielle Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440


Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
Die Jakobi-Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444
Das Gradientenfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
Der Nabla-Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451

3. Mehrdimensionale Integration . . . . . . . . . . . . . . . . . . . . . . . . . . 452


Mehrdimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
Volumenberechnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
Integration in ebenen Polarkoordinaten . . . . . . . . . . . . . . . . . . . . 456
Anwendung: Die Gaußsche Glockenkurve . . . . . . . . . . . . . . . . . 457
Integration in räumlichen Polarkoordinaten . . . . . . . . . . . . . . . . . 459
Inhalte von Rotationsflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
Lösungen zu den Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467

A n h ä n g e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469

1. Notationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471

2. Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471

Grundzüge der Höheren Mathematik © Oliver Deiser


Vorwort

Das Buch gibt eine kompakte und allgemein zugängliche Darstellung mathema-
tischer Begriffe, Ergebnisse, Methoden und Denkweisen im Anschluss an das
Abiturwissen. Es strebt keine systematische Darstellung und Beweisvollständig-
keit an, versucht aber dennoch, die charakteristischen Merkmale der Mathema-
tik zu wahren und zu übermitteln. Wir behandeln:
(1) Grundlagen (Logik, Mengen, Relationen, Funktionen) und das Zahl-
system von den natürlichen Zahlen (einschließlich der vollständigen
Induktion) bis zu komplexen Zahlen
(2) Grundbegriffe der Analysis (elementare Funktionen, Folgen, Reihen,
Stetigkeit)
(3) Ableitungen und Integrale (Differenzierbarkeit, Differentialrechnung,
Taylor-Entwicklung, Riemann-Summen, Integrierbarkeit, Integralrech-
nung)
(4) reelle Vektoren und Elemente der analytischen Geometrie
(5) Matrizen und lineare Gleichungssysteme
(6) ausgewählte Themen der mehrdimensionalen Analysis
Durch viele Abbildungen und zahlreiche Übungen mit ausführlichen Lösungen
eignet sich der Text auch zum Selbststudium.

München, 18. Dezember 2020

Oliver Deiser

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Abschnitt

Grundlagen

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Logik

Wir beginnen mit logischen Grundlagen: Zunächst betrachten wir Junktoren


wie
nicht, und, oder, impliziert, genau dann wenn,
die Aussagen miteinander verbinden. Die Bedeutung der Junktoren lässt sich
mit den Wahrheitswerten „wahr“ und „falsch“ beschreiben. Mit Hilfe des
Wahrheitstafelverfahrens können wir den Wahrheitsgehalt beliebiger zusam-
mengesetzter Aussagen analysieren. Für die Mathematik genügt die Aussagen-
logik jedoch nicht. Wir brauchen zusätzlich Quantoren wie
für alle, es gibt (mindestens) ein,
mit denen wir im Zusammenspiel mit Variablen und Junktoren All- und Exis-
tenzaussagen über Objekte mit bestimmten Eigenschaften formulieren können
(Prädikatenlogik). Wir geben exemplarisch einige Übersetzungen umgangs-
sprachlicher Formulierungen in die Quantorensprache an und stellen die wich-
tigsten Quantorenregeln zusammen.

Schlüsselbegriffe
Junktoren (Negation, Konjunktion, Disjunktion, Implikation, Äquivalenz)
Wahrheitstafelverfahren
Tautologie, Erfüllbarkeit
Quantoren (Allquantor, Existenzquantor)
Quantorenregeln (insbesondere Verneinungsregeln)

© Oliver Deiser Grundzüge der Höheren Mathematik


14 1. Abschnitt Grundlagen

Elemente der Mathematik

Die Mathematik führt Beweise: Sie gewinnt Sätze, indem sie logische Schluss-
regeln auf Axiome oder bereits bewiesene Sätze anwendet. Um diese Ergebnisse
übersichtlich zu formulieren, fasst sie wichtige Begriffe in der Form von Defin-
itionen zusammen. Wir betrachten ein einfaches Beispiel zur Illustration:

Satz (Produkt ungerader Zahlen)


Das Produkt zweier ungerader natürlicher Zahlen ist ungerade.

Dieses Ergebnis lässt sich durch Beispiele wie 5 ⋅ 7 = 35, 3 ⋅ 11 = 33 erläutern,


aber nicht beweisen. Um einen Beweis führen zu können, müssen wir wissen, was
das Produkt zweier natürlicher Zahlen ist und was „ungerade“ bedeutet. Wir set-
zen das Produkt samt den zugehörigen Rechenregeln als bekannt voraus. Der
Begriff „ungerade“ lässt sich so definieren:

Definition (ungerade natürliche Zahl)


Eine natürliche Zahl n heißt ungerade, wenn es eine natürliche Zahl c gibt
mit n = 2c + 1.

Jetzt können wir den Beweis führen:

Beweis
Seien n, m zwei beliebige ungerade Zahlen. Nach Definition gibt es
natürliche Zahlen c und d mit n = 2c + 1 und m = 2d + 1. Dann gilt
n m = (2c + 1)(2d + 1) = 4cd + 2c + 2d + 1 = 2(2cd + c + d) + 1.
Wir setzen k = 2cd + c + d. Dann gilt n m = 2k + 1. Dies zeigt, dass n m
ungerade ist.

Ohne genaue Definitionen können wir nichts beweisen, da wir nicht wissen,
was wir im Beweis verwenden dürfen. Ohne Beweise wissen wir nicht, ob unsere
Sätze nur wahrscheinlich oder mutmaßlich gelten. Unser Beweis hat zudem ei-
nen rechnerischen Gehalt: Er bestimmt den Quotienten k = cd + c + d der Divi-
sion von n m durch 2 aus den Quotienten c und d von n bzw. m.
Beweisen gilt als schwierig und darf vielleicht sogar als „hohe Kunst“ bezeich-
net werden. Nur wenigen Menschen gelingt es, wichtige neue Ergebnisse zu be-
weisen. Und wir müssen nicht immer die Beweise bereits bewiesener Sätze ken-
nen, um sie anwenden zu können. Aber die Mathematik verliert ihre Identität,
wenn man ihr das nimmt, was sie vor allen anderen Wissenschaften auszeichnet:
Größtmögliche Genauigkeit, logische Strenge, systematischer Aufbau, axioma-
tische Fundierung, Freude am Argumentieren. Je nach Zielgruppe wird man bei
der Lehre diese Merkmale anders berücksichtigen. Das ist immer möglich, ohne
die Mathematik zu verbiegen.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 15

Junktoren

Junktoren verbinden mathematische Aussagen. In der Mathematik werden vor


allem die folgenden fünf Junktoren verwendet:

Junktor Name Ausdruck Lesart

¬ Negation ¬A nicht A, non A


∧ Konjunktion A∧B A und B
∨ Disjunktion A∨B A oder B
→ Implikation A→B A impliziert B
aus A folgt B
wenn A so B
A ist hinreichend für B
B ist notwendig für A
A zieht B nach sich
↔ Äquivalenz A↔B A genau dann, wenn B
A ist äquivalent zu B

Die Negation ist einstellig. Sie wirkt auf eine Aussage A und liefert ihre Ver-
neinung ¬ A. Die vier anderen Junktoren sind zweistellig.
Die Disjunktion wird in der Mathematik im nicht ausschließlichen Sinn ver-
wendet, sodass A ∨ B bedeutet: „A oder B (oder beide)“. Ein „exklusives oder“
(Kontravalenz) können wir so einführen:
A ∨˙ B wird definiert als (A ∨ B) ∧ ¬ (A ∧ B) [ gelesen: „entweder A oder B“ ]
In dieser Weise lassen sich viele neue Junktoren mit Hilfe der alten einführen.
Wenden wir Junktoren mehrfach an, so setzen wir Klammern, um deutlich zu
machen, auf welche Aussagen sich die Junktoren beziehen. Zum Beispiel ist
(A ∧ B) ∨ C zu unterschieden von A ∧ (B ∨ C)
Um Klammern zu sparen, vereinbaren wir:

Bindungsstärke der Junktoren


¬, ∧, ∨, →, ↔ (von stark bindend nach schwach bindend geordnet)

Beispiele
(1) A ∧ B ↔ ¬ C ∨ D ist die Aussage (A ∧ B) ↔ ((¬C) ∨ D)
(2) A ∧ B ∨ (C → D ↔ E) ist die Aussage (A ∧ B) ∨ ((C → D) ↔ E)

Wir können uns die Junktoren als Magnete verschiedener Stärke vorstellen,
um uns die Struktur von Aussagen zu veranschaulichen. Die Negation ist der
stärkste Magnet, die Äquivalenz der schwächste.

© Oliver Deiser Grundzüge der Höheren Mathematik


16 1. Abschnitt Grundlagen

Wahrheitstafeln

Die Semantik (Bedeutung) der Junktoren lässt sich mit Hilfe von Wahrheitsta-
feln illustrieren. Die beteiligten Aussagen A,B,C, … werden mit den Wahrheits-
werten „w“ und „f “ für „wahr“ bzw. „falsch“ belegt (alternativ können wir auch 1
und 0 verwenden). Die Junktoren verändern dann die Wahrheitswerte gemäß
der folgenden Tafeln:

¬ A A ∧ B A ∨ B

f w w w w w w w

w f w f f w w f

f f w f w w

f f f f f f

A → B A ↔ B

w w w w w w

w f f w f f

f w w f f w

f w f f w f

Beispiele und Bemerkungen


(1) Hat A den Wahrheitswert w, so hat ¬ A den Wert f. Die Negation lässt
sich als „flip“ der Wahrheitswerte auffassen.
(2) Haben A und B die Werte w, so hat auch A ∨ B den Wert w. Dieser
Eintrag in der ersten Zeile der Tafel zeigt, dass die Disjunktion wie
schon oben bemerkt nicht exklusiv verwendet wird.
(3) Eine Implikation A → B hat genau dann den Wert f, wenn die
Voraussetzung oder Prämisse A wahr und die Konklusion B falsch ist. Ist A
falsch, so ist die Implikation A → B wahr, unabhängig vom Wahrheits-
wert von B. Aus etwas Falschem folgt Beliebiges:
„Wenn 0 gleich 1 ist, so ist 2 gerade.“
„Wenn 0 gleich 1 ist, so ist 2 ungerade.“
Beide Implikationen sind wahr. Ihre Voraussetzungen sind falsch.
(4) Eine Äquivalenz A ↔ B ist wahr, wenn die Wahrheitswerte von A und
B übereinstimmen. Bei unterschiedlichen Werten ist sie falsch.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 17

Das Wahrheitstafelverfahren

Aus den Wahrheitstafeln für die Junktoren lassen sich Wahrheitstafeln für zu-
sammengesetzte Aussagen berechnen. Sie zeigen, unter welchen wahr-falsch-
Belegungen die Aussage wahr bzw. falsch ist:

Beispiele
(1) A → B ↔ B → A

w w w w w w w

w f f f f w w

f w w f w f f

f w f w f w f

1 3 2

(2) A → B ↔ ¬ A ∨ B

w w w w f w w w

w f f w f w f f

f w w w w f w w

f w f w w f w f

1 4 2 3

Die Zahlen in der letzten Zeile geben an, in welcher Reihenfolge die Spalten
der Tafel berechnet werden. In Beispiel (1) ergeben sich 1 und 2 aus den Tafeln
für die Implikation. Die Spalte 3 erhalten wir, indem wir die Tafel für die Äquiva-
lenz auf die Spalten 1 und 2 anwenden.
Die letzte gefüllte Spalte heißt die Ergebnisspalte der Tafel. Die Berechnung
zeigt, dass A → B ↔ B → A bei der Belegung „A wahr, B falsch“ falsch ist.
Ist die Ergebnisspalte einer Wahrheitstafel durchgehend mit „w“ gefüllt, so
heißt die Aussage allgemeingültig oder eine Tautologie. Gibt es mindestes ein „w“,
so heißt die Aussage erfüllbar. Erfüllbare Aussagen sind manchmal wahr, Tauto-
logien immer. Die Aussage in Beispiel (1) ist erfüllbar (unter zwei Belegungen),
die Aussage in Beispiel (2) ist eine Tautologie.
Die Tautologie (2) zeigt, dass wir den Junktor → mit Hilfe von ¬ und ∧ defi-
nieren könnten: A → B ist äquivalent zu ¬ A ∨ B. „Rabe impliziert schwarz“ ist
mathematisch äquivalent zu „kein Rabe oder schwarz“.

© Oliver Deiser Grundzüge der Höheren Mathematik


18 1. Abschnitt Grundlagen

Quantoren

Um gehaltvolle mathematische Aussagen bilden zu können, brauchen wir ne-


ben den Junktoren noch Quantoren und zugehörige Variablen. Die beiden wich-
tigsten Quantoren der Mathematik sind:

Zeichen Name Ausdruck Lesart

∀ Allquantor ∀x A(x) für alle/jedes x gilt A(x)

∃ Existenzquantor ∃x A(x) es gibt/existiert


(mindestens) ein x mit A(x)

So wie A ∨ B „mindestens eines“ bedeutet, so bedeutet ∃x A(x), dass es minde-


stens ein x gibt mit der Eigenschaft A(x). Manchmal ist auch der eindeutige Exi-
stenzquantor ∃! nützlich:
∃!x A(x) es gibt/existiert genau ein x mit A(x)
Wir können ihn mit Hilfe der beiden anderen Quantoren einführen:
∃!x A(x) wird definiert durch ∃x ∀y (A(x) ↔ x = y)
Wir betrachten einige Beispiele zur Verwendung der Quantoren.

Beispiele
In den Beispielen (1) − (3) beziehen sich die Quantoren auf natürliche
Zahlen, in den Beispielen (4) − (6) auf reelle Zahlen.
(1) „n ist eine gerade Zahl“:
∃k 2k = n
(2) „p ist eine Primzahl“ (oder kurz: „p ist prim“):
p ≥ 2 ∧ ∀n,m (n ⋅ m = p → n = 1 ∨ m = 1) [ mit „∀n,m“ = „∀n ∀m“ ]
(3) „Es gibt unendlich viele Primzahlen:
∀n ∃p (p ≥ n ∧ „p ist prim“) [ mit „p ist prim“ wie in (2)]
(4) „Die Funktion f : R → R besitzt ein Nullstelle“:
∃x f(x) = 0
(5) „Die Funktion f : R → R besitzt ein globales Maximum“:
∃x0 ∀x f(x0 ) ≥ f(x)
(6) „Die Funktion f : R → R besitzt bei x0 ein lokales Maximum“:
∃ε > 0 ∀x (|x − x0 | < ε → f(x0 ) ≥ f(x))

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 19

Quantorenregeln

Wir stellen die wichtigsten Regeln für Quantoren zusammen. Grundsätzlich


gilt: Quantoren binden stärker als Junktoren: ∀x A(x) ∧ B(x) ist (∀x A(x)) ∧ B(x)
und zu unterscheiden von ∀x (A(x) ∧ B(x)).

Verneinungsregeln
∀x A(x) ↔ ¬ ∃x ¬ A(x), ∃x A(x) ↔ ¬ ∀x ¬ A(x)
¬ ∀x A(x) ↔ ∃x ¬ A(x), ¬ ∃x A(x) ↔ ∀x ¬ A(x)
¬ ∀x ∃y A(x, y) ↔ ∃x ∀y ¬ A(x, y), ¬ ∃x ∀y A(x, y) ↔ ∀x ∃y ¬ A(x, y)

Vertauschungsregeln
∀x ∀y A(x, y) ↔ ∀y ∀x A(x, y) [ wir schreiben kurz ∀x, y A(x, y) ]
∃x ∃y A(x, y) ↔ ∃y ∃x A(x, y) [ wir schreiben kurz ∃x,y A(x, y) ]
∃x ∀y A(x, y) → ∀y ∃x A(x, y)

Regeln für die Konjunktion und Disjunktion


∀x (A(x) ∧ B(x)) ↔ ∀x A(x) ∧ ∀x B(x)
∃x (A(x) ∨ B(x)) ↔ ∃x A(x) ∨ ∃x B(x)
∀x A(x) ∨ ∀x B(x) → ∀x (A(x) ∨ B(x))
∃x (A(x) ∧ B(x)) → ∃x A(x) ∧ ∃x B(x)

Regeln für die Implikation


∀x (A(x) → B(x)) → ∀x A(x) → ∀x B(x)
∃x (A(x) → B(x)) ↔ ∀x A(x) → ∃x B(x)

Umgangssprachliche Beispiele können diese Regeln verdeutlichen. Für die


dritte Vertauschungsregel betrachten wir etwa: „Es gibt einen, der jede Aufgabe
lösen kann.“ und „Für jede Aufgabe gibt es einen, der diese Aufgabe lösen kann“.
Die erste Aussage ist stärker als die zweite.
Die Verneinungsregeln lassen sich so beschreiben: Wir können eine Negation
über eine Gruppe von Quantoren ziehen, müssen dabei aber alle All- und Exis-
tenzquantoren gegeneinander austauschen.
Quantoren stehen vor der Aussage, auf die sie sich beziehen. Um der Um-
gangssprache gerecht zu werden, vereinbaren wir, dass Allquantoren für einfache
Aussagen auch nach der Aussage in der Form „für alle“ stehen dürfen, etwa in
„Es gilt x + 1 > x für alle x P R.“ Korrekter ist „Für alle x P R gilt x + 1 > x“ oder
„∀xPR x + 1 > x“. Doppelpunkte der Form „∀x:“ sind nicht nötig. Zur Verdeut-
lichung des Wirkungsbereichs können wir Klammern setzen.

© Oliver Deiser Grundzüge der Höheren Mathematik


20 1. Abschnitt Grundlagen

Übungen

Übung 1
Erstellen Sie eine Wahrheitstafel für die Aussage
A → B ↔ ¬B → ¬A
Welcher Typ Aussage liegt vor? Illustrieren Sie die Aussage durch ein
mathematisches und ein umgangssprachliches Beispiel.

Übung 2
Wir haben gezeigt, dass A → B ↔ ¬ A ∨ B eine Tautologie ist. Diese
Äquivalenz zeigt, dass sich der Junktor → mit Hilfe der Junktoren ¬, ∨
definieren lässt. Definieren Sie in analoger Weise
(a) den Junktor ∨ mit Hilfe der Junktoren ¬, ∧,
(b) den Junktor ∧ mit Hilfe der Junktoren ¬, ∨,
(c) den Junktor ↔ mit Hilfe der Junktoren ∧, →.
Überprüfen Sie Ihre Definitionen jeweils durch eine Wahrheitstafel.

Übung 3
Geben Sie Aussagen A, B, C an mit den beiden Eigenschaften:
(1) Die Aussagen A ∧ B, A ∧ C, B ∧ C sind erfüllbar.
(2) Die Aussage A ∧ B ∧ C ist nicht erfüllbar.
(Die Aussagen A, B, C können dabei mathematische oder umgangssprachli-
che Aussagen sein oder auch nur aus Aussagensymbolen A1 , A2 , …
aufgebaut sein.) Begründen Sie, dass Ihre Aussagen die Eigenschaften (1)
und (2) haben.

Übung 4
Sie stehen vor zwei Türen. Hinter der einen Tür ist ein Schatz, hinter der
anderen eine Ziege. Zwischen den beiden Türen sitzt ein allwissender
logisch gebildeter Zwerg. Der Zwerg hat die Eigenschaft, stets zu lügen
oder stets die Wahrheit zu sagen. Sie dürfen dem Zwerg genau eine
aussagenlogische Ja-Nein-Frage stellen, um zu erfahren, wo der Schatz ist.
Welche Frage stellen Sie? Begründen Sie, dass Sie durch die Ja-Nein-
Antwort auf Ihre Frage ermitteln können, wo der Schatz ist (unabhängig
davon, ob er links oder rechts ist und ob der Zwerg lügt oder die Wahrheit
sagt).
Ein Beispiel für eine Frage, die Sie stellen könnten, ist: „Ist der Schatz links
und bist Du ein Lügner?“

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 21

Lösungen zu den Übungen

Übung 1
Erstellen Sie eine Wahrheitstafel für die Aussage
A → B ↔ ¬B → ¬A
Welcher Typ Aussage liegt vor? Illustrieren Sie die Aussage durch ein
mathematisches und ein umgangssprachliches Beispiel.

Lösung zu Übung 1

A → B ↔ ¬ B → ¬ A

w w w w f w w f w

w f f w w f f f w

f w w w f w w w f

f w f w w f w w f

1 5 2 4 3

Die Ergebnisspalte 5 ist durchgängig mit „w“ gefüllt. Die Aussage ist also
eine Tautologie. Sie ist als Kontrapositionsgesetz bekannt.

mathematisches Beispiel: Für eine reelle Funktion f : R → R betrachten wir


die Aussagen:
A = „f ist differenzierbar.“
B = „f ist stetig.“
Die folgenden Aussagen sind äquivalent:
A → B = „Wenn f differenzierbar ist, so ist f stetig.“
¬ B → ¬ A = „Wenn f nicht stetig ist, so ist f nicht differenzierbar.“

umgangssprachliches Beispiel: Wir betrachten die Aussagen:


A = „Ich habe gut geschlafen.“
B = „Ich bin gut gelaunt.“
Die folgenden Aussagen sind äquivalent (mit „schlecht“ = „nicht gut“):
A → B = „Wenn ich gut geschlafen habe, bin ich gut gelaunt.“
¬B → ¬A = „Wenn ich schlecht gelaunt bin, habe ich schlecht geschlafen.“

© Oliver Deiser Grundzüge der Höheren Mathematik


22 1. Abschnitt Grundlagen

Übung 2
Wir haben gezeigt, dass A → B ↔ ¬ A ∨ B eine Tautologie ist. Diese
Äquivalenz zeigt, dass sich der Junktor → mit Hilfe der Junktoren ¬, ∨
definieren lässt. Definieren Sie in analoger Weise
(a) den Junktor ∨ mit Hilfe der Junktoren ¬, ∧,
(b) den Junktor ∧ mit Hilfe der Junktoren ¬, ∨,
(c) den Junktor ↔ mit Hilfe der Junktoren ∧, →.
Überprüfen Sie Ihre Definitionen jeweils durch eine Wahrheitstafel.

Lösung zu Übung 2
zu (a):
Wir definieren A ∨ B durch ¬ (¬ A ∧ ¬ B). Dies ergibt die Wahrheits-
tafel für die Disjunktion:

¬ (¬ A ∧ ¬ B)

w f w f f w

w f w f w f

w w f f f w

f w f w w f

4 1 3 2

zu (b):
Wir definieren A ∧ B durch ¬ (¬ A ∨ ¬ B). Dies ergibt die Wahrheits-
tafel für die Konjunktion:

¬ (¬ A ∨ ¬ B)

w f w f f w

f f w w w f

f w f w f w

f w f w w f

4 1 3 2

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 23

zu (c):
Wir definieren A ↔ B durch (A → B) ∧ (B → A). Dies ergibt die
Wahrheitstafel für die Äquivalenz:

(A → B) ∧ (B → A)

w w w w w w w

w f f f f w w

f w w f w f f

f w f w f w f

1 3 2

© Oliver Deiser Grundzüge der Höheren Mathematik


24 1. Abschnitt Grundlagen

Übung 3
Geben Sie Aussagen A, B, C an mit den beiden Eigenschaften:
(1) Die Aussagen A ∧ B, A ∧ C, B ∧ C sind erfüllbar.
(2) Die Aussage A ∧ B ∧ C ist nicht erfüllbar.
(Die Aussagen A, B, C können dabei mathematische oder umgangssprachli-
che Aussagen sein oder auch nur aus Aussagensymbolen A1 , A2 , …
aufgebaut sein.) Begründen Sie, dass Ihre Aussagen die Eigenschaften (1)
und (2) haben.

Lösung zu Übung 3
Gesucht sind drei Aussagen, die paarweise erfüllbar sind, aber nicht alle
zusammen. Wir betrachten hierzu die mit drei Aussagensymbolen A1 , A2
und A3 gebildeten Aussagen:
A = A1 ∧ (¬ A2 ∨ ¬ A3 )
B = A2 ∧ (¬ A1 ∨ ¬ A3 )
C = A3 ∧ (¬ A1 ∨ ¬ A2 )
Jede der Aussagen fordert, dass eines der Aussagensymbole wahr ist,
mindestens eines der beiden anderen aber falsch. Damit sind A, B, C wie
gewünscht:
Die Belegung A1 : w, A2 : w, A3 : f zeigt, dass A ∧ B erfüllbar ist.
Die Belegung A1 : w, A2 : f, A3 : w zeigt, dass A ∧ C erfüllbar ist.
Die Belegung A1 : f, A2 : w, A3 : w zeigt, dass B ∧ C erfüllbar ist.
Dagegen ist A ∧ B ∧ C nicht erfüllbar. Denn ist A ∧ B wahr, so sind A1 und
A2 wahr, sodass C falsch ist. (Dies lässt sich auch anhand einer Wahrheitsta-
fel mit acht Zeilen überprüfen.)

Die Aussagensymbole lassen sich nun durch mathematische oder umgangs-


sprachliche Aussagen ersetzen. Etwa:
A1 = „Montag regnet es.“
A2 = „Dienstag regnet es.“
A3 = „Mittwoch regnet es.“
Dann gilt (mit „es ist schön“ = „es regnet nicht“):
A = „Montag regnet es, aber Dienstag oder Mittwoch ist es schön.“
B = „Dienstag regnet es, aber Montag oder Mittwoch ist es schön.“
C = „Mittwoch regnet es, aber Montag oder Dienstag ist es schön.“
Die drei Aussagen sind paarweise erfüllbar, aber nicht alle zusammen.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Logik 25

Übung 4
Sie stehen vor zwei Türen. Hinter der einen Tür ist ein Schatz, hinter der
anderen eine Ziege. Zwischen den beiden Türen sitzt ein allwissender
logisch gebildeter Zwerg. Der Zwerg hat die Eigenschaft, stets zu lügen
oder stets die Wahrheit zu sagen. Sie dürfen dem Zwerg genau eine
aussagenlogische Ja-Nein-Frage stellen, um zu erfahren, wo der Schatz ist.
Welche Frage stellen Sie? Begründen Sie, dass Sie durch die Ja-Nein-
Antwort auf Ihre Frage ermitteln können, wo der Schatz ist (unabhängig
davon, ob er links oder rechts ist und ob der Zwerg lügt oder die Wahrheit
sagt).
Ein Beispiel für eine Frage, die Sie stellen könnten, ist: „Ist der Schatz links
und bist Du ein Lügner?“

Lösung zu Übung 4
Wir stellen die Frage:
„Lügst Du genau dann, wenn der Schatz links ist?“
Wir betrachten vier Fälle:
1. Fall: Der Zwerg lügt und der Schatz ist links.
Die korrekte Antwort auf die Frage ist „ja“ (die Wahrheitswerte der
beiden durch die Äquivalenz verbundenen Aussagen stimmen überein).
Nachdem der Zwerg lügt, antwortet er mit „nein“.
2. Fall: Der Zwerg lügt und der Schatz ist rechts.
Die korrekte Antwort auf die Frage ist „nein“ (die Wahrheitswerte sind
verschieden). Nachdem der Zwerg lügt, antwortet er mit „ja“.
3. Fall: Der Zwerg sagt die Wahrheit und der Schatz ist links.
Die korrekte Antwort auf die Frage ist „nein“ (die Wahrheitswerte sind
verschieden). Nachdem der Zwerg die Wahrheit sagt, antwortet er mit
„nein“.
4. Fall: Der Zwerg sagt die Wahrheit und der Schatz ist rechts.
Die korrekte Antwort auf die Frage ist „ja“ (die Wahrheitswerte
stimmen überein). Nachdem der Zwerg die Wahrheit sagt, antwortet er
mit „ja“.
Damit wissen wir: Antwortet der Zwerg auf unsere Frage mit „ja“, so ist der
Schatz rechts. Antwortet er dagegen mit „nein“, so ist der Schatz links.

Bemerkung: Auch die Frage


„Bist Du entweder ein Lügner oder ist der Schatz links?“
führt zum Ziel (mit einem „exklusiven oder“ ∨˙ , das den Wahrheitswert
f besitzt, wenn beide verbundenen Aussagen den Wert w haben). Da
¬(A ↔ B) ↔ (A ∨˙ B) eine Tautologie ist, ist die zweite Frage äquivalent
zur Verneinung der ersten.

© Oliver Deiser Grundzüge der Höheren Mathematik


2. Mengen und Relationen

Die Mengenlehre stellt der Mathematik im Zusammenspiel mit der mathemati-


schen Logik eine universelle Sprache zur Verfügung. Mengen sind überall. In
diesem Kapitel versammeln wir einige Grundlagen. Dabei gehen wir auch auf die
Widersprüche der uneingeschränkten Mengenbildung ein (Russell-Zermelo-
Antinomie). Als Beispiel für die Weite und Flexibilität des Mengenbegriffs zei-
gen wir, wie wir geordnete Paare und weiter Relationen mit Hilfe von Mengen
einführen können.

Schlüsselbegriffe
Menge, Element, Teilmenge, Obermenge
Komprehension (Mengenbildung über Eigenschaften)
Mengenoperationen, Potenzmenge
geordnetes Paar, Kreuzprodukt
Relation

© Oliver Deiser Grundzüge der Höheren Mathematik


28 1. Abschnitt Grundlagen

Mengen und ihre Elemente

Georg Cantor, der Begründer der modernen Mengenlehre, schreibt 1895:


„Unter einer ‚Menge‘ verstehen wir jede Zusammenfassung M von bestimmten
wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens
(welche die ‚Elemente‘ von M genannt werden) zu einem Ganzen.“

Nach den Maßstäben der Mathematik ist dies keine Definition, sondern eine an-
schauliche Beschreibung. Irgendwo müssen wir aber anfangen, sodass undefi-
nierte Grundbegriffe unvermeidlich sind. Dank der logischen Grundlagenfor-
schung des 20.Jahrhunderts ist es heute möglich, „Menge“ und „Element“ durch
ein formales Axiomensystem zu beschreiben und damit der Mathematik ein trag-
fähiges Fundament zur Verfügung zu stellen. Für unsere Zwecke genügt eine
naive Beschreibung vollkommen: Bestimmte Objekte bilden zusammengenom-
men ein neues Objekt. Das neue Objekt nennen wir eine Menge und die Objekte,
die die Menge bilden, heißen ihre Elemente. Wir vereinbaren:

Extensionalitätsprinzip
Zwei Mengen sind genau dann gleich, wenn sie dieselben Elemente besitzen.

Insbesondere gilt:
(1) In Mengen kommt es nicht auf die Reihenfolge der Elemente an.
(2) In Mengen gibt es keine Wiederholungen von Elementen.

Notation
Ist a ein Element der Menge A, so schreiben wir
aPA (Elementbeziehung, Epsilon-Relation)
Andernfalls schreiben wir a ¸ A.

Definition (Teilmenge, Obermenge)


Seien A, B Mengen. Dann heißt A eine Teilmenge von B, in Zeichen A ⊆ B,
falls jedes Element von A ein Element von B ist. Gilt zusätzlich A ≠ B, so
heißt A eine echte Teilmenge von B, in Zeichen A ⊂ B. Ist A eine (echte)
Teilmenge von B, so nennen wir B eine (echte) Obermenge von A, in Zeichen
B ⊇ A bzw. B ⊃ A.

Die Wahl der Zeichen erinnert an die Zeichen ≤, <, ≥, > für Zahlen.
Das Extensionalitätsprinzip können wir nun so formulieren:

Extensionalitätsprinzip, Umformulierung
Für alle Mengen A, B gilt: A = B genau dann, wenn A ⊆ B und B ⊆ A.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 29

Die Komprehension

Definition (Komprehension)
Ein Ausdruck A = { a | %(a) } bedeutet:
A ist die Menge aller Objekte a mit der Eigenschaft %(a).

Die folgenden Aussagen sind nach Definition gleichwertig:


(1) A = { a | %(a) }.
(2) Für alle a gilt: a P A genau dann, wenn %(a).
Endliche Mengenbildungen können wir als Komprehensionen auffassen. Für
alle Objekte a1 , …, an setzen wir:
∅ = {} = {a|a≠a} (leere Menge)
{a} = {x|x=a} (Einermenge)
{ a, b } = { x | x = a oder x = b } (Paarmenge)
{ a1 , …, an } = { x | x = a1 oder … oder x = an } (Aufzählung)

Ein weiterer wichtiger Spezialfall ist:

Aussonderung aus einer Menge


Wir schreiben auch { a P A | %(a) } statt { a | a P A und %(a) }.

Anschaulich sondern wir in { a P A | %(a) } aus einer vorliegenden Menge A alle


Elemente aus, auf die die Eigenschaft % zutrifft. Wir erhalten so eine Teilmenge
von A.

Beispiele
(1) Die Menge { 1 } enthält genau ein Element. nämlich die 1. Analoges
gilt für { 0 }. Es gilt 0 ≠ { 0 }, { } ≠ { 0 }, 1 ≠ { 1 }.
(2) Die Menge { 1, 2 } enthält genau die Elemente 1 und 2. Nach dem
Extensionalitätsprinzip gilt
{ 1, 2 } = { 2, 1 } = { 1, 2, 1 } = { 1, 1, 1, 2, 1, 2 } = …
(3) Sei N die Menge der natürlichen Zahlen (in diesem Buch immer
einschließlich der 0). Dann ist die Aussonderung
G = { n P N | es gibt ein k P N mit 2k = n }
die Menge der geraden Zahlen. Die ungeraden Zahlen erhalten wir
mit Hilfe von G durch die Aussonderung
U = { n P N | n ¸ G }.

© Oliver Deiser Grundzüge der Höheren Mathematik


30 1. Abschnitt Grundlagen

Die Russell-Zermelo-Antinomie

Es stellt sich die Frage, ob wir die Komprehension immer durchführen kön-
nen:
Existiert für jede Eigenschaft %(a) die Menge A = { a | %(a) } ?
Die folgende berühmte Überlegung zeigt, dass die Antwort negativ ist:

Die Russell-Zermelo-Antinomie
Wir betrachten die folgende Eigenschaft:
%(A) = „A ist eine Menge, die sich selbst nicht als Element enthält“.
Dann gibt es keine Menge R mit
R = { A | %(A) } = { A | A ist eine Menge mit A ¸ A }.
Denn für jede Menge A gilt A P R genau dann, wenn A ¸ A. Wir nehmen
nun an, dass R eine Menge ist. Dann erhalten wir für A = R, dass R P R
genau dann gilt, wenn R ¸ R. Dieser Widerspruch zeigt, dass R keine
Menge ist. Die Zusammenfassung aller Mengen, die sich selbst nicht als
Element enthalten, ist aus rein logischen Gründen keine Menge.

Durch umgangssprachliche Beispiele können wir die merkwürdige Eigen-


schaft „A¸A“ illustrieren: Die Menge aller Vorstellungen ist selbst eine Vorstel-
lung, sodass sie sich selbst als Element enthält. Das Gleiche gilt für die Allmenge,
also die Menge aller Mengen. „Übliche“ Mengen wie die leere Menge, die Paar-
menge { 1, 2 } oder die unendliche Menge der natürlichen Zahlen enthalten sich
aber nicht selbst als Element. Damit darf die Eigenschaft „A ¸ A“ als Regelfall
gelten. Unsere Überlegung zeigt, dass die Zusammenfassung aller regulären
Mengen zu einem Ganzen im Sinne von Cantor nicht möglich ist. Sie wäre als
Menge sowohl regulär als auch irregulär, was nicht sein kann. Bertrand Russell
hat die Antinomie mit Hilfe eines Dorfbarbiers popularisiert: Dieser Barbier be-
hauptet, genau den Bewohnern seines Dorfes die Haare zu schneiden, die sich
die Haare nicht selbst schneiden. Ein solcher Barbier gerät bei der Frage, ob er
sich selbst die Haare schneidet, in unauflösbare Widersprüche. Das Fazit lautet:
Es kann keinen solchen Barbier geben. Er kann nicht leisten, was er verspricht.
Zum Glück tauchen derartige Probleme bei den Mengen, die im mathemati-
schen Alltag gebraucht werden, nicht auf. Wir können die Komprehension
A = { a | %(a) }
in aller Regel ohne Probleme durchführen, d. h. von einer Eigenschaft %(a) aus-
gehend die Menge A = { a | %(a) } bilden und mit A als Objekt so umgehen wie mit
allen anderen Objekten der Mathematik. Speziell gilt dies für die Aussonderung:
Die Bildung von Teilmengen der Form { a P A | %(a) } ist immer möglich. In der
axiomatischen Mengenlehre wird dies durch ein eigenes Axiom garantiert.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 31

Mengenoperationen

Definition (Mengenoperationen)
Seien A, B Mengen. Dann setzen wir:
A ∩ B = { a | a P A und a P B} (Durchschnitt)
A ∪ B = { a | a P A oder a P B} (Vereinigung)
A − B = A \ B = { a | a P A und a ¸ B} (Differenz)
A = M − A für eine feste Grundmenge M ⊇ A
c
(relatives Komplement)
A ∆ B = (A − B) ∪ (B − A) (symmetrische Differenz)

Beispiele
Seien A = { 1, 2, 3 }, B = { 2, 4, 6 }, M = { 1, 2, 3, 4, 5, 6 }. Dann gilt
A ∩ B = { 2 }, A ∪ B = { 1, 2, 3, 4, 6 } = M − { 5 }, Ac = { 4, 5, 6 } (bzgl. M)

Die Operationen können wir durch Venn-Diagramme veranschaulichen. Wir


zeichnen A und B als sich überlappende Kreise oder andere geometrische For-
men und markieren das Ergebnis der Operation. Für den Durchschnitt ergibt
sich beispielsweise der Überlappungsbereich zweier Kreise.

Definition (Potenzmenge)
Sei A eine Menge. Dann setzen wir
P(A) = { B | B ⊆ A }.
Die Menge P(A) heißt die Potenzmenge von A.

Beispiel
P(∅) = { ∅ }, P({ 0 }) = { ∅, { 0 } }, P({ 1, 2 }) = { ∅, { 1 }, { 2 }, { 1, 2 } }.

Die Potenzmenge ist ein Beispiel für ein Mengensystem:

Definition (Mengensystem)
Eine Menge M heißt Mengensystem, falls jedes Element von M eine Menge ist.

Definition (Durchschnitt, Vereinigung für Mengensysteme)


Sei M ein Mengensystem. Dann setzen wir:
>M = { a | für alle A P M ist a P A }, falls M ≠ ∅
ÍM = { a | es gibt ein A P M mit a P A }

Beispiel
Sei M = { { 1, 2, 4 }, { 1, 3 } }. Dann gilt > M = { 1 }, Í M = { 1, 2, 3, 4 }.

© Oliver Deiser Grundzüge der Höheren Mathematik


32 1. Abschnitt Grundlagen

Ein Venn-Diagramm zur Illustration der Operation


(A ∩ B) − C ∪ (B ∩ C) − A ∪ (A ∩ C) − B
Hier vereinigen wir die drei Farbinseln. Die Operation ist äquivalent zu
(A ∩ (B ∪ C)) ∪ (B ∩ C)) − (A ∩ B ∩ C)
Die Vereinigung erzeugt den gesamten Überlappungsbereich der Mengen.
Anschließend entfernen wir den gemeinsamen Schnitt.
Die dargestellte Menge lässt sich auch schreiben als
( a | a kommt in genau zwei der drei Mengen A, B, C als Element vor }

Wir stellen einige Rechenregeln für Mengenoperationen zusammen. Der Le-


ser möge sich einige von ihnen durch Venn-Diagramme veranschaulichen. Für
eine Komplementbildung relativ zu M ist es günstig, die Mengenkreise in einen
rechteckigen Rahmen einzuzeichnen, der die Grundmenge M darstellt.

(A ∪ B)c = Ac ∩ Bc de Morgansche Regeln


A ∩ (B ∩ C) = (A ∩ B) ∩ C Assoziativgesetze
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A ∩ B = B ∩ A, A ∪ B = B ∪ A Kommutativgesetze
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) Distributivgesetze
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A − B = A − (B ∩ A) = A ∩ Bc Differenzenregeln
A − (B − C) = (A − B) ∪ (A ∩ C)
(A − B) − C = A − (B ∪ C)
A ∆ (B ∆ C) = (A ∆ B) ∆ C Regeln für ∆
A∆B = B∆A

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 33

Geordnete Paare und Kreuzprodukt

Für alle a, b gilt { a, b } = { b, a } nach dem Extensionalitätsprinzip. Oft wollen


wir die Reihenfolge berücksichtigen und ein Objekt
(a, b) = „das geordnete Paar von a und b“
bilden, etwa (1, 3) in einem Koordinatensystem. Die Paarbildung soll erfüllen:
(#) Für alle a, b, c, d gilt: (a, b) = (c, d) genau dann, wenn a = c und b = d.
Wir könnten geordnete Paare als Grundbegriff ansehen. Eleganter ist es, sie auf
den ungeordneten Mengenbegriff zurückzuführen. Dies ist wie folgt möglich:

Definition (Kuratowski-Paar)
Für alle a, b ist das geordnete Paar (a, b) von a und b definiert durch
(a, b) = { { a }, { a, b } }.

Die genaue Form der Definition ist für das Folgende nicht wichtig. Entschei-
dend ist, dass (#) gilt, was leicht nachzuweisen ist.

Definition (Kreuzprodukt)
Seien A, B Mengen. Dann setzen wir
A × B = { (a, b) | a P A und b P B }.
Die Menge A × B heißt das Kreuzprodukt oder kartesische Produkt der
Mengen A und B.

Für jede Menge A können wir die folgenden Potenzen erklären:


A1 = A, A2 = A × A, A3 = A2 × A = (A × A) × A, und allgemein
An + 1 = An × A für alle natürlichen Zahlen n ≥ 1.
Wir schreiben (a, b, c) statt ((a, b), c) und nennen (a, b, c) ein Tripel. Analoges gilt
für Quadrupel (a, b, c, d) und allgemeine n-Tupel (a1 , …, an ).

Beispiele
(1) { 1, 2 } × { } = { }
(2) { 1, 2 } × { 3 } = { (1, 3), (2, 3) }
(3) { 1, 2 } × { 2, 3 } = { (1, 2), (1, 3), (2, 2), (2, 3) }
(4) { 1, 2, 3, 4, 5, 6 } 5 = { (a1 , …, a5 ) | ai P { 1, …, 6 } für i = 1, …, 5 }
Diese Menge eignet sich für die Modellierung eines fünffachen Wurfs
eines Würfels. Sie besitzt genau 7776 Elemente (mit 65 = 7776). Analog
ist { 0, 1 }10 ein geeigneter Ergebnisraum eines 10-fachen Münzwurfs.

© Oliver Deiser Grundzüge der Höheren Mathematik


34 1. Abschnitt Grundlagen

Relationen

Definition (Relation)
Eine Menge R heißt eine (zweistellige) Relation, falls jedes Element von R
ein geordnetes Paar ist. Gilt R ⊆ A2 für eine Relation R und eine Menge A,
so heißt R eine Relation auf der Menge A.

Notation
Statt (a, b) P R schreiben wir oft a R b.

Diese sogenannte Infix-Notation entspricht der vertrauten Form a ≤ b für die


Relation „kleiner oder gleich“ auf den reellen Zahlen.

Beispiele
(1) Die Menge R = { (1, 1), (1, 2), (1, 3), (2, 1), (3, 2) } ist eine Relation auf
der Menge A = { 1, 2, 3 }. Es gilt
1 R 1, 1 R 2, 1 R 3, 2 R 1, 3 R 2, nicht(3 R 1), nicht(2 R 2) usw.
(2) Die Relation ≤ auf der Menge { 1, 2, 3 } lautet:
≤ = { (1, 1), (1, 2), (1, 3), (2, 2), (2, 3), (3, 3) }.
Sie hat genau 6 Elemente. Die Relation < auf { 1, 2, 3 } hat dagegen
nur drei Elemente. Es gilt < = { (1, 2), (1, 3), (2, 3) }.
(3) Sei A eine Menge. Dann definiert der Teilmengenbegriff eine Relation
auf der Potenzmenge von A, die sogenannte Inklusion auf P(A). Wir
bezeichnen sie wieder mit ⊆. Für A = { 1, 2, 3, 4, 5, 6 } gilt zum Beispiel
{ } ⊆ { 1 }, { 1, 2, 4 } ⊆ { 1, 2, 3, 4, 5 }, B ⊆ { 1, …, 6 } für alle B ⊆ A.

Wir betrachten fünf grundlegende Eigenschaften einer Relation:

Definition (Eigenschaften von Relationen)


Sei R eine Relation auf A. Dann heißt R
reflexiv (auf A), falls ∀a P A a R a
irreflexiv, falls ∀a P A ¬ (a R a)
symmetrisch, falls ∀a, b P A (a R b → b R a)
antisymmetrisch, falls ∀a, b P A (a R b ∧ b R a → a = b)
transitiv, falls ∀a, b, c P A (a R b ∧ b R c → a R c)

Kettennotation
Ist R transitiv, so schreiben wir auch a R b R c statt a R b und b R c.
Allgemeiner verwenden wir endliche Ketten der Form a1 R a2 R … R an .

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 35

Beispiele
(1) Die Relation ≤ auf den natürlichen Zahlen ist reflexiv, antisymmetrisch
und transitiv. Das Gleiche gilt für die Inklusion ⊆ der Potenzmenge
der natürlichen Zahlen. Es gilt ∅ ⊆ { 1 } ⊆ { 1, 4 } ⊆ { 1, 2, 4, 6 }.
(2) Sei m eine natürliche Zahl größergleich 1. Zwei ganze Zahlen a, b
heißen kongruent modulo m, falls a − b durch m teilbar ist. In Zeichen
schreiben wir a ;m b oder a ; b mod(m). Es gilt zum Beispiel 6 ;5 11
und 4 ;3 − 2. Die Kongruenz modulo m ist reflexiv, symmetrisch und
transitiv. In Kettennotation gilt etwa −5 ; −2 ; 1 ; 4 ; 7 mod(3).

Eine Relation R auf einer nichtleeren endlichen Menge A können wir durch
einen Graphen visualisieren: Wir zeichnen die Elemente von A als benannte
Punkte und die Elemente von R als Pfeile zwischen den Punkten. Das Paar (A, R)
heißt ein gerichteter Graph. Jedes Element von A nennen wir eine Ecke und jedes
Element von R eine gerichtete Kante des Graphen.

Darstellung der Relation


R = { (1, 1), (1, 2), (2, 3), (3, 2), (3, 4), (4, 5), (5, 3), (5, 4) }
auf A = { 1, 2, 3, 4, 5 } als gerichteter Graph.

Anschauliche Beschreibung der fünf Grundeigenschaften


reflexiv: Jede Ecke hat eine Schlinge (einen Pfeil von sich zu sich selbst).
irreflexiv: Der Graph hat keine Schlingen.
symmetrisch: Pfeile treten stets als Doppelpfeile in beiden Richtungen auf.
Derartige Doppelpfeile werden der Übersichtlichkeit halber oft durch
eine Linie (ungerichtete Kante) ersetzt.
antisymmetrisch: Doppelpfeile gibt es nur als Schlingen. Es kann Schlingen
geben oder nicht.
transitiv: Jede Pfeilfolge entspricht einem Pfeil.

© Oliver Deiser Grundzüge der Höheren Mathematik


36 1. Abschnitt Grundlagen

Übungen

Übung 1
Sind die beiden folgenden Mengen gleich? Begründen Sie Ihre Antwort.
A = { 1, 2, { { 2, 1 } }, { 1, 2, { 2 } }, { 1 } }
B = { { 2, { 2 }, 1 }, { 1 }, { { 2, 2, 1 } }, { { 1, 2 } }, 2, 1 }

Übung 2
Für alle Mengen A, B, C gilt:
(1) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
(2) (A − B) − C = A − (B ∪ C).
Illustrieren Sie die beiden Identitäten jeweils durch ein beschriftetes Venn-
Diagramm mit einer kurzen Erklärung.

Übung 3
(a) Sei A = { 1, 2, 3, 4 }. Listen Sie die Elemente der Potenzmenge P(A)
von A auf. Achten Sie dabei auf eine übersichtliche und systemati-
sche Darstellung.
(b) Sei nun An = { 1, …, n } mit einer beliebigen natürlichen Zahl n. Wie
viele Elemente besitzt P(An ) in Abhängigkeit von n? Begründen Sie
Ihre Antwort. Stimmt Ihre Formel auch für den Fall n = 0 mit A0 = ∅?

Übung 4
Geben Sie (ohne Begründung) an, welche der fünf Eigenschaften
reflexiv, irreflexiv, symmetrisch, antisymmetrisch, transitiv
auf die folgenden Relationen zutreffen und welche nicht. Geben Sie für die
nicht zutreffenden Eigenschaften Gegenbeispiele an.
(a) die Gleichheit auf der Menge { 1, 2, 3 }
(b) die Kleiner-Relation < auf den ganzen Zahlen Z
(c) die echte Obermengen-Relation ⊃ auf P({ 1, 2, 3 })
(d) die Teilbarkeitsrelation | auf den ganzen Zahlen Z mit:
a | b genau dann, wenn a ist ein Teiler von b
Dabei heißt eine ganze Zahl a ein Teiler einer ganzen Zahl b, wenn es
eine ganze Zahl c gibt mit a c = b.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 37

Lösungen zu den Übungen

Übung 1
Sind die beiden folgenden Mengen gleich? Begründen Sie Ihre Antwort.
A = { 1, 2, { { 2, 1 } }, { 1, 2, { 2 } }, { 1 } }
B = { { 2, { 2 }, 1 }, { 1 }, { { 2, 2, 1 } }, { { 1, 2 } }, 2, 1 }

Lösung zu Übung 1
Die Mengen A und B sind gleich. Hierzu beobachten wir, dass beide
Mengen sowohl die 1 als auch die 2 als Element enthalten. Das Gleiche gilt
für die Einermenge { 1 }. Weiter gilt nach dem Extensionalitätsprinzip:
{ { 2, 1 } } = { { 1, 2 } } (da { 2, 1 } = { 1, 2 })
{ 1, 2, { 2 } } = { 2, { 2 }, 1 }
Die Mengen auf der linken Seite sind Elemente von A, die Mengen auf der
rechten Seite sind Elemente von B. Schließlich gilt für die Menge B, dass
{ { 2, 2, 1 } } = { { 1, 2 } } (da { 2, 2, 1 } = { 1, 2 }),
sodass in der Angabe der Elemente von B eine Menge doppelt aufgezählt
wird. Insgesamt haben beide Mengen genau 5 Elemente:
A = B = { 1, 2, { 1 }, { { 1, 2 } }, { 1, 2, { 2 } } }.

Bemerkung
Wir schreiben auch |A| für die Anzahl der Elemente einer Menge A
(Mächtigkeit oder Kardinalität von A). Ist A eine Menge der Form
A = { a1 , …, an },
so gilt 1 ≤ |A| ≤ n. Der Fall |A| < n ist möglich. Sind die Elemente
a1 , …, an paarweise verschieden, so gilt |A| = n. Gleichungen liefern
Beispiele für das Zusammenfallen von Elementen. Sind

− b ± £b2 − 4ac
x1,2 =
2a
die Lösungen einer quadratischen Gleichung
a x2 + bx + c = 0,
so hat die Lösungsmenge L = { x1 , x2 } der Gleichung nur ein Element,
wenn die Diskriminante b2 − 4ac gleich 0 ist. Wir sprechen dann auch
von einer doppelten Nullstelle oder einer Nullstelle der algebraischen
Vielfachheit 2. In diesem Fall gilt L = { x1 , x2 } = { x1 } = { x2 }. Multimen-
gen, die Wiederholungen von Elementen berücksichtigen, werden in
der Mathematik eher selten verwendet.

© Oliver Deiser Grundzüge der Höheren Mathematik


38 1. Abschnitt Grundlagen

Übung 2
Für alle Mengen A, B, C gilt:
(1) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
(2) (A − B) − C = A − (B ∪ C).
Illustrieren Sie die beiden Identitäten jeweils durch ein beschriftetes Venn-
Diagramm mit einer kurzen Erklärung.

Lösung zu Übung 2
zu (1):

Venn-Diagramm zu (1): Wir können zuerst B und C vereinigen und die Vereinigung
mit A schneiden. Oder wir schneiden zuerst A mit B, dann A mit C und vereinigen
anschließend die beiden Schnitte. Beide Wege ergeben dieselbe Menge.

zu (2):

Venn-Diagramm zu (2): Wir können A zweimal reduzieren, indem wir zuerst B


und dann C von der Menge A wegnehmen. Oder wir subtrahieren die
Vereinigung von B und C von A. Beide Wege ergeben dieselbe Menge.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Mengen und Relationen 39

Übung 3
(a) Sei A = { 1, 2, 3, 4 }. Listen Sie die Elemente der Potenzmenge P(A)
von A auf. Achten Sie dabei auf eine übersichtliche und systemati-
sche Darstellung.
(b) Sei nun An = { 1, …, n } mit einer beliebigen natürlichen Zahl n. Wie
viele Elemente besitzt P(An ) in Abhängigkeit von n? Begründen Sie
Ihre Antwort. Stimmt Ihre Formel auch für den Fall n = 0 mit A0 = ∅?

Lösung zu Übung 3
zu (a):
Wir listen die Elemente von P(A) (also die Teilmengen der Menge A)
nach ihrer Größe:
Teilmengen mit keinem Element:
{}
Teilmengen mit genau einem Element:
{ 1 }, { 2 }, { 3 }, { 4 }
Teilmengen mit genau zwei Elementen:
{ 1, 2 }, { 1, 3 }, { 1, 4 }, { 2, 3 }, { 2, 4 }, { 3, 4 }
Teilmengen mit genau drei Elementen:
{ 2, 3, 4 }, { 1, 3, 4 }, { 1, 2, 4 }, { 1, 2, 3 }
Teilmengen mit genau vier Elementen:
{ 1, 2, 3, 4 }
Insgesamt ergeben sich
1 + 4 + 6 + 4 + 1 = 16
Elemente.

zu (b):
Für jedes n ≥ 1 hat die Menge P({ 1, …, n }) genau 2n Elemente.
Begründung: Sei n ≥ 1 gegeben. Eine Teilmenge A von { 1, …, n }
entsteht, indem wir für jedes i = 1, …, n entscheiden, ob wir i in A
mitaufnehmen oder nicht (zwei Möglichkeiten). Jede Teilmenge kann so
erhalten werden und je zwei verschiedene Kombinationsmöglichkeiten
führen zu zwei verschiedenen Teilmengen. Damit gilt
|P(A)| = 2 ⋅ … ⋅ 2 (mit n Faktoren) = 2n ,
wobei wieder |M| die Anzahl der Elemente einer endlichen Menge M
bezeichnet. Die Formel stimmt wegen P(∅) = { ∅ } und 20 = 1 auch für
den Sonderfall n = 0.

© Oliver Deiser Grundzüge der Höheren Mathematik


40 1. Abschnitt Grundlagen

Übung 4
Geben Sie (ohne Begründung) an, welche der fünf Eigenschaften
reflexiv, irreflexiv, symmetrisch, antisymmetrisch, transitiv
auf die folgenden Relationen zutreffen und welche nicht. Geben Sie für die
nicht zutreffenden Eigenschaften Gegenbeispiele an.
(a) die Gleichheit auf der Menge { 1, 2, 3 }
(b) die Kleiner-Relation < auf den ganzen Zahlen Z
(c) die echte Obermengen-Relation ⊃ auf P({ 1, 2, 3 })
(d) die Teilbarkeitsrelation | auf den ganzen Zahlen Z mit:
a | b genau dann, wenn a ist ein Teiler von b
Dabei heißt eine ganze Zahl a ein Teiler einer ganzen Zahl b, wenn es
eine ganze Zahl c gibt mit a c = b.

Lösung zu Übung 4
zu (a):
Die Gleichheit (Identität) auf { 1, 2, 3 } ist reflexiv, symmetrisch,
antisymmetrisch und transitiv.
Es gilt 1 = 1, sodass die Relation nicht irreflexiv ist.

zu (b):
Die <-Relation auf Z ist irreflexiv, antisymmetrisch und transitiv.
Es gilt nicht 0 < 0, sodass die Relation nicht reflexiv ist.
Es gilt 0 < 1, aber nicht 1 < 0, sodass die Relation nicht symmetrisch ist.

zu (c):
Die ⊃-Relation auf P({ 1, 2, 3 }) ist irreflexiv, antisymmetrisch und
transitiv.
Es gilt nicht { 1 } ⊃ { 1 }, sodass die Relation nicht reflexiv ist.
Es gilt { 1 } ⊃ ∅, aber nicht ∅ ⊃ { 1 }, sodass die Relation nicht symme-
trisch ist.

zu (d):
Die Teilbarkeitsrelation auf Z ist reflexiv und transitiv.
Es gilt 1|1, sodass die Relation nicht irreflexiv ist.
Es gilt 1|2, aber nicht 2|1, sodass die Relation nicht symmetrisch ist.
Es gilt −2|2 und 2|−2, aber 2 ≠ −2, sodass die Relation nicht antisym-
metrisch ist.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen

Funktionen sind wie Mengen universelle Objekte der Mathematik. Der mathe-
matische Funktionsbegriff ist sehr viel weiter und bedeutsamer als der durch
reelle Terme allzu stark geprägte Funktionsbegriff der Schule. Entscheidend ist
die eindeutige Zuordnung, die es erlaubt, von einer Stelle zum Funktionswert
überzugehen. Wir diskutieren diese Grundidee zunächst informal in Analogie
zum Mengenbegriff. Anschließend reichen wir eine präzise mengentheoreti-
sche Definition nach. Eine Funktion können wir einfach als rechtseindeutige
Relation auffassen. Weiter besprechen wir allgemeine Abbildungseigenschaf-
ten, die Komposition, Umkehrfunktionen und Einschränkungen.

Schlüsselbegriffe
Funktion, Abbildung
Notationen: f : A → B, f(a) = b
Stelle, Wert
Abbildungseigenschaften: injektiv, surjektiv, bijektiv
Komposition (Verknüpfung)
Umkehrfunktion
Einschränkung
Bild und Urbild

© Oliver Deiser Grundzüge der Höheren Mathematik


42 1. Abschnitt Grundlagen

Der anschauliche Funktionsbegriff

Im Stil der Beschreibung des Mengenbegriffs durch Cantor können wir auch
Funktionen umgangssprachlich einführen:
„Unter einer ‚Funktion‘ verstehen wir eine Zuordnung f, die jedem Element a
einer bestimmten Menge A (dem Definitionsbereich von f ) ein eindeutiges Ele-
ment b einer Menge B (einem Wertevorrat) zuweist. Wird einem a durch f das
Element b zugeordnet, so nennen wir b den ‚Wert‘ von f an der ‚Stelle‘ a. In Zei-
chen drücken wir dies durch f(a) = b aus [ gelesen: f von a ist gleich b] .“
Erneut liegt keine echte Definition vor: Bei der Cantorschen Beschreibung
des Mengenbegriffs wird nicht genau erklärt, was eine „Zusammenfassung“ ist.
Ebenso wenig wird nun erklärt, was eine „Zuordnung“ ist. Dennoch überträgt
die Beschreibung wichtige Aspekte, allen voran die Eindeutigkeit, die es erlaubt,
zu einer a den Funktionswert f(a) zu bilden. Weiter ist der Begriff sehr allgemein
gefasst, es ist nirgendwo von Termen die Rede, die die Zuordnung herstellen.
Der Definitionsbereich und der Wertevorrat können beliebige Mengen sein.
Funktionen sind keineswegs auf Zahlen beschränkt. Die Mengen A und B kön-
nen auch Mengensysteme oder Mengen von Funktionen sein.
Im Gegensatz zum Mengenbegriff können wir den Funktionsbegriff leicht
präzisieren. Bevor wir dies tun, vereinbaren wir:

Notationen und Sprechweisen


Die Schreibweise f : A → B [ gelesen: f von A nach B ] bedeutet:
(a) f ist eine Funktion.
(b) Die Menge A ist der Definitionsbereich von f, d. h. f(a) ist genau
dann definiert, wenn a P A.
(c) Die Menge B ist ein Wertevorrat von f, d. h. für alle a P A ist f(a) P B.
Wir sagen, dass f eine Funktion auf der Menge A ist und Werte in der
Menge B annimmt. Vor allem in geometrischen Kontexten nennen wir eine
Funktion auch gleichwertig eine Abbildung und eine Stelle a P A einen
Punkt. Wir sagen, dass der Wert b P B durch f angenommen wird, wenn es
ein a P A gibt mit f(a) = b. Gilt f(a) = b, so heißt b auch das Bild von a unter f
und weiter a ein Urbild von b unter f.

Bemerkung zum Wertevorrat


Ein Wertevorrat ist bei uns im Gegensatz zum Definitionsbereich nicht
eindeutig bestimmt. Ist f : A → B und C ⊇ B, so können wir auch f : A → C
schreiben. Viele Mathematiker nehmen (vor allem bei Abbildungen) einen
Wertevorrat B als eindeutig vorgegeben an, er gehört zu f fest mit dazu.
Beide Konventionen sind sinnvoll, unsere (in der Mengenlehre bevorzugte)
Version ist hinsichtlich der Präzisierung des Begriffs etwas einfacher.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 43

Der mengentheoretische Funktionsbegriff

Wir hatten bereits Relationen als Mengen eingeführt. Damit ist es nun leicht
möglich, Funktionen exakt zu definieren. Die Idee ist, eine Funktion f : A → B
mit ihrem Graphen
Graph(f ) = { (a, b) | a P A und f(a) = b }
zu identifizieren.

Definition (Funktion)
Eine Relation f heißt eine Funktion, falls gilt:
∀a, b, c ((a, b) P f ∧ (a, c) P f → b = c) (Rechtseindeutigkeit)
Statt (a, b) P f schreiben wir oft f(a) = b. Weiter setzen wir
dom(f ) = Def(f ) = { a | ∃b f(a) = b } (domain, Definitionsbereich)
rng(f ) = f [ A ] = { f(a) | a P dom(f ) } (range, Wertebereich)

Wir übernehmen alle oben eingeführten Notationen und Sprechweisen (Stelle,


Wert, Abbildung, Punkt, …). Die Schreibweise f : A → B bedeutet:
(a) f ist eine Funktion, (b) dom(f ) = A, (c) rng(f) ⊆ B.
Jede Obermenge des Wertebereichs rng(f ) kann als ein Wertevorrat dienen. Ist
f : A → B, so gilt f ⊆ A × B. Wie beabsichtigt gilt
f = { (a, b) | a P Def(f ) und f(a) = b } = Graph(f ).
Der formale Funktionsbegriff ist vollkommen statisch: Jede Dynamik, die
von a zu f(a) „führt“ oder a in f(a) „umrechnet“, ist verschwunden. Eine Funk-
tion arbeitet nicht, sie ruht als Menge. Die klassischen dynamischen Anschau-
ungen bleiben natürlich wertvoll. Ziel ist eine Präzisierung, die es vermeidet,
Funktionen mit undefinierten Begriffen zu erklären.

Beispiele
(1) Sei f = { (1, 2), (2, 3), (3, 1) }. Dann ist f eine Funktion der Form
f : { 1, 2, 3 } → { 1, 2, 3 }. Es gilt f(1) = 2, f(2) = 3, f(3) = 1.
(2) Auch g = { (1, 2), (2, 3), (3, 2) } ist eine Funktion der Form
g : { 1, 2, 3 } → { 1, 2, 3 }. Hier gilt g(1) = g(3) = 2 und g(2) = 3.
(3) Die Relation R = { (1, 2), (2, 3), (1, 3) } ist keine Funktion. Die
Rechtseindeutigkeit ist verletzt, da R mit (1, 2), (1, 3) zwei Paare mit
gleicher erster, aber verschiedener zweiter Komponente enthält.
(4) Sei h = { (n, (n, n + 1)) | n ist eine natürliche Zahl }. Dann ist h eine
Funktion der Form h : N → N2 . Es gilt h(n) = (n, n + 1) für alle n.

© Oliver Deiser Grundzüge der Höheren Mathematik


44 1. Abschnitt Grundlagen

Darstellungen und Interpretationen

Es gibt zahlreiche Möglichkeiten, Funktionen zu interpretieren und sie zu ver-


anschaulichen. Wir diskutieren einige davon.

1. Tabellen

Eine endliche Funktion können wir als zweizeilige (alternativ: zweispaltige)


Tabelle angeben, bei der in der ersten Zeile die Stellen (ohne Wiederholungen)
und in der zweiten Zeile die zugehörigen Werte stehen. In der ersten Zeile kön-
nen Einträge nicht mehrfach vorkommen, in der zweiten schon. Der Übergang
von a zu f(a) entspricht dem Nachschlagen in der Tabelle an der Stelle a. Funktio-
nen mit einem unendlichen Definitionsbereich können wir als Idealisierung die-
ser endlichen Tabellen ansehen.

2. Mengendiagramme

Eine Funktion f : A → B können wir uns veranschaulichen, indem wir A und


B zweidimensional als Mengen (etwa Kreise oder Ellipsen) zeichnen und zwi-
schen den Stellen und Werten Pfeile eintragen. Diese Diagramme eignen sich in
abstrakter Form gut zur Erklärung des allgemeinen Funktionsbegriffs.

3. Reelle Funktionen

Eine reelle Funktion ist eine Funktion der Form f : P → R mit P ⊆ R (P steht
für Punktmenge). Diesen Funktionstyp können wir in der bekannten Weise vi-
sualisieren, indem wir den Graphen von f in ein zweidimensionales Koordina-
tensystem einzeichnen. Mit Hilfe von dreidimensionalen Darstellungen sind
auch Visualisierungen von Funktionen der Form f : P → R mit P ⊆ R2 möglich.

4. Vektorfelder

Funktionen der Form f : R2 → R2 lassen sich trotz der insgesamt vier beteilig-
ten Dimensionen darstellen, indem wir für ausgewählte Punkte p P R2 den Vek-
tor f(p) an der Stelle p anheften (als Pfeil einzeichnen). Analoges gilt für Funktio-
nen f : R3 → R3 . Der Leser denke etwa an Strömungs- oder Kraftfelder.

5. Gerichtete Graphen

Ist A eine nichtleere endliche Menge und f : A → A, so können wir f (wie jede
Relation auf A) durch einen gerichteten Graphen darstellen. Wir zeichnen wie-
der die Elemente von A als benannte Punkte und tragen für jedes a P A einen
Pfeil von a nach f(a) ein. In der Sprache der Graphentheorie ist jeder solche Pfeil
eine gerichtete Kante, die eine Ecke a mit der Ecke f(a) verbindet.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 45

6. Termauswertung und Algorithmen

Wird f durch einen Term oder allgemeiner irgendeine algorithmische Vor-


schrift definiert, so können wir uns f als Computerprogramm einer bestimmten
Programmiersprache vorstellen, das für einen Input a nach endlichen vielen Re-
chenschritten einen eindeutigen Output f(a) berechnet. Der Funktionsbegriff
der Mathematik ist allgemeiner. Funktionen müssen nicht algorithmisch bere-
chenbar sein, entscheidend ist eine eindeutige Zuordnung.

7. Farben

Eine Funktion f : A → B können wir als eine (konkrete oder abstrakte) Einfär-
bung der Elemente von A ansehen. Ein Element a P A erhält die Farbe f(a) P B.
Der Wertevorrat B ist bei dieser Interpretation ein Farbkasten. Eine zweiwertige
Funktion f : [ 0, 1 ]2 → { 0, 1 } können wir zum Beispiel als Schwarz-Weiß-Fär-
bung des Einheitsquadrats interpretieren und entsprechend als „Foto“ darstel-
len. Diese Sichtweise ist nicht nur in der Kombinatorik prominent, sondern auch
in der Analysis bei der Visualisierung komplexer Funktionen mit Farbkreisen.

8. Dynamische Darstellungen

Mit Hilfe von Computern können wir Funktionen interaktiv darstellen.


Durch verschiebbare Regler lässt sich vor allem der parameterabhängige Verlauf
von Funktionsgraphen anschaulich verfolgen.

Beispiel
a 1 2 3 4 5 6 7 8 9 10
f(a) 2 3 5 5 6 2 7 9 2 7

Darstellung einer Funktion f : { 1, …, 10 } → { 1, …, 10 } als Tabelle und als


gerichteter Graph. Von jeder Ecke geht genau ein Pfeil aus.

© Oliver Deiser Grundzüge der Höheren Mathematik


46 1. Abschnitt Grundlagen

Abbildungseigenschaften

Von großer Bedeutung sind die folgenden allgemeinen Eigenschaften:

Definition (injektiv, surjektiv, bijektiv)


Sei f : A → B. Dann heißt f
(a) injektiv, falls ∀a, b P A (f(a) = f(b) → a = b)
(b) surjektiv (nach B), falls ∀b P B ∃a P A f(a) = b
(c) bijektiv (nach B), falls f injektiv und surjektiv ist.

Bemerkung
Eine Funktion f ist (als Graph) injektiv oder nicht. Für „surjektiv“ und
„bijektiv“ ist ein Wertevorrat B erforderlich. Ist f in der Form f : A → B
angegeben, so können wir den Zusatz „nach B“ weglassen.

Anschaulich bedeuten diese Begriffe:


injektiv Kein Wert wird mehrfach angenommen (Linkseindeutigkeit)
surjektiv Jeder Wert des betrachteten Wertevorrats B wird angenommen
bijektiv Vollständige Paarung der Elemente von A und B
Ist f : R → R eine Funktion auf den reellen Zahlen, so haben die drei Begriffe
zusätzlich die folgende anschauliche Bedeutung für den in der x-y-Ebene darge-
stellten Funktionsgraphen von f:
injektiv Jede Waagrechte schneidet f höchstens einmal
surjektiv Jede Waagrechte schneidet f mindestens einmal
bijektiv Jede Waagrechte schneidet f genau einmal

Beispiele
(1) Die Funktion f : R → R mit f(x) = x2 für alle x P R ist weder injektiv
noch surjektiv.
(2) Die Funktion f : R → R mit f(x) = x3 für alle x P R ist bijektiv.
(3) Die Funktion f : R2 → R mit f(x, y) = x für alle (x, y) P R2 ist surjektiv,
aber nicht injektiv.
(4) Sei A eine Menge. Dann ist f : A → P(A) mit f(a) = { a } für alle a P A
injektiv, aber nicht surjektiv ({ } P P(A) liegt nicht im Wertebereich).
(5) Eine Bijektion der Form f : A → A heißt auch eine Permutation auf A.
Für A = { 1, 2, 3 } gibt es genau sechs Permutationen. Eine davon ist
f = { (1, 2), (2, 3), (3, 1) }.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 47

Die Komposition

Zwei Funktionen können wir nacheinander anwenden, wenn die Werte der er-
sten Funktion Stellen der zweiten Funktion sind:

Definition (Komposition, Verknüpfung)


Seien f : A → B und g : B → C. Dann heißt die Funktion h : A → C mit
h(a) = g(f(a)) für alle a P A
die Komposition oder Verknüpfung von f und g. In Zeichen schreiben wir
h = g + f [ gelesen: „g nach f “ ]

Mengentheoretisch können wir g + f definieren durch


g + f = { (a, g(f(a)) | a P A }.
Wichtig ist, dass in g + f zuerst f und dann g angewendet wird. Im Allgemeinen
ist f + g gar nicht definiert, wenn g + f definiert ist. Aber auch wenn beide Kompo-
sitionen möglich sind, ist die Reihenfolge wichtig:

Beispiel
Seien f, g : R → R mit f(x) = x2 und g(x) = x + 1 für alle x P R. Dann gilt für
alle x P R:
(g + f ) (x) = g(f(x)) = x2 + 1
(f + g) (x) = f(g(x)) = (x + 1)2 = x2 + 2x + 1
Die beiden Kompositionen stimmen nur am Nullpunkt überein. Es gilt
g + f ≠ f + g. Die Komposition ist im Allgemeinen nicht kommutativ.

Dagegen gilt:

Satz (Assoziativität der Komposition)


Seien f : A → B, g : B → C, h : C → D. Dann gilt h + (g + f) = (h + g) + f.

Beweis
Die Kompositionen h + (g + f) und (h + g) + f sind Funktionen mit dem
Definitionsbereich A. Für alle a P A gilt
(h + (g + f )) (a) = h((g + f ) (a)) = h(g(f(a))) = (h + g) (f(a)) = ((h + g) + f ) (a).
Dies zeigt die Behauptung.

Wir können wie also wie bei allen assoziativen Operationen Klammern weg-
lassen und kurz h + g + f schreiben.

© Oliver Deiser Grundzüge der Höheren Mathematik


48 1. Abschnitt Grundlagen

Umkehrfunktion und Einschränkung

Definition (Umkehrfunktion)
Sei f : A → B injektiv, und sei C = f [ A ] = { f(a) | a P A } der Wertebereich
von f. Dann heißt die Funktion g : C → A mit
g(b) = „das eindeutige a P A mit f(a) = b“ für alle b P C
die Umkehrfunktion von f. In Zeichen schreiben wir g = f − 1 [ gelesen: „f
hoch minus 1“ ].

Es gilt f − 1 = { (b, a) | (a, b) P f }. Die Injektivität (Linkseindeutigkeit) von f


führt zur Rechtseindeutigkeit der Umkehrrelation. Die Umkehrfunktion rekon-
struiert die Stelle aus dem Wert. Für diese Rekonstruktion ist die Injektivität ent-
scheidend. Wichtig nicht nur in diesem Zusammenhang ist:

Definition (Identität)
Sei A eine Menge. Dann heißt die Funktion idA : A → A mit idA (a) = a für
alle a P A die Identität auf A.

Ist f : A → B injektiv, so gilt f − 1 (f (a)) = a für alle a P A. Damit ist f − 1 + f = idA .


Analog ist f + f − 1 = idC mit C = f [ A ].
Ist f nicht injektiv, so können wir eine „Pseudoumkehrfunktion“ durch eine
Verkleinerung des Definitionsbereichs erhalten. Wir definieren allgemein:

Definition (Einschränkung)
Sei f : A → B, und sei C ⊆ A. Dann heißt die Funktion g : C → B mit
g(a) = f(a) für alle a P C
die Einschränkung von f auf C. In Zeichen schreiben wir g = f |C [gelesen:
„f eingeschränkt auf C“].

Es gilt f|C = { (a, b) P f | a P C }. Das Paradebeispiel für eine Einschränkung ist:

Beispiel: Konstruktion der Quadratwurzelfunktion


Sei sq : R → R mit sq(x) = x2 für alle x P R (mit sq für square). Die Funktion
ist nicht injektiv, da sq(−1) = sq(1). Wir müssen sie also einschränken, um
sie wenigstens teilweise umkehren zu können. Sei C = R+0 = { x P R | x ≥ 0 }.
Dann ist sq|C injektiv (rechter Ast der Einheitsparabel). Wir setzen
sqrt = (sq|C)−1 [ mit sqrt für square root].
Die Funktion sqrt : R+0 → R heißt die reelle Quadratwurzelfunktion. Wir
schreiben wie üblich auch £x anstelle von sqrt(x). Es gilt
sq(sqrt(x)) = £x
2
= x für alle x ≥ 0, sqrt(sq(x)) = £x2 = |x| für alle xPR.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 49

Bild und Urbild

Definition (Bild und Urbild)


Sei f : A → B. Dann setzen wir
f [ X ] = { f(a) | a P X } für alle X ⊆ A,
f − 1 [ Y ] = { a P A | f(a) P Y } für alle Y ⊆ B.
Die Menge f [ X ] heißt das Bild von X unter f. Analog heißt f − 1 [ Y ] das
Urbild von Y unter f.

Bemerkung
(1) Das Urbild f − 1 [ Y ] ist für jede Funktion f : A → B und jede Teilmenge
Y ⊆ B definiert. Es ist nicht erforderlich, dass f injektiv ist.
(2) Das Bild f [ A ] des gesamten Definitionsbereichs ist der Wertebereich
von f (im Allgemeinen eine echte Teilmenge des angegebenen
Wertevorrats B). Diese Notation hatten wir oben schon verwendet.
(3) In der Literatur ist auch die Notation f(X) anstelle von f[ X ] zu finden.
Die Bild-Operation wird hier als eine Funktion von P(A) nach P(B)
aufgefasst, die nicht ganz ungefährlich wieder mit f bezeichnet wird.

Anschaulich sammeln wir in f [ X ] alle Funktionswerte auf, deren Stellen in X


liegen. Dynamisch gesprochen schicken wir die Menge X durch die Funktion f.
Die Bezeichnung als „Bild“ ist besonders suggestiv, wenn wir an geometrische
Abbildungen denken, etwa die Projektion eines Objekts an eine Wand. Bei der
Bildung des Urbildes f − 1 [ Y ] suchen wir dagegen alle Stellen, deren Werte unter
f in Y landen.

Beispiele
Für die Quadratfunktion sq : R → R gilt:
(1) sq[ X ] = [ 0, 4 ] für X = [ 0, 2 ], [ −2, 0 ], [ −2, 2 ]
(2) sq−1 [ Y ] = [ −2, 2 ] für Y = [ 0, 4 ]
(3) sq−1 [ Y ] = ∅ für alle Y ⊆ ] −∞, 0 [

Urbilder haben bessere Eigenschaften als Bilder. Beispielsweise gilt stets


f −1
[ Y1 ∩ Y2 ] = f − 1 [ Y1 ] ∩ f − 1 [ Y2 ].
Dagegen gilt am Allgemeinen lediglich
f [ X1 ∩ X2 ] ⊆ f [ X1 ] ∩ f [ X2 ].
Beispiel (1) zeigt, dass die andere Inklusion nicht gelten muss.

© Oliver Deiser Grundzüge der Höheren Mathematik


50 1. Abschnitt Grundlagen

Verschiedene Bemerkungen

Der Begriffe der Funktion ist für die Mathematik so bedeutsam, dass wir noch
einige Bemerkungen in freier Form anschließen möchten.

Sprechweise: Bereich
Die Bezeichnung als Wertebereich (alle Werte) entspricht dem Definitions-
bereich (alle Stellen). Ein Wertevorrat ist eine Obermenge des Wertebe-
reichs.

Zur Schreibweise f(a) = b


Ein Ausdruck „f(a) = b“ bedeutet, dass a ein Element des Definitionsbe-
reichs von f ist und dass f an der Stelle a den Wert b annimmt. Mengenthe-
oretisch ist f(a) = b äquivalent zu (a, b) P f. Ein Ausdruck „f(a) ist nicht
definiert“ bedeutet, dass a ¸ Def(f ).

Die polnische Notation


Statt f(a) können wir auch fa schreiben, etwa log x statt log(x) oder sin α
statt sin(α). Das Weglassen von Klammern bei Funktionen ist als polnische
Notation bekannt.

Die Postfix-Notation
In (g + f ) (a) = g(f(a)) wird die rechts stehende Funktion zuerst angewendet,
was unnatürlich erscheint. Einige Mathematiker schreiben deswegen (a)f
oder klammernfrei af (Postfix-Notation, inverse polnische Notation). Hier liest
sich die Komposition in der Form afg statt gfa.

Wertevorrat als Teil der Funktion


Nach unserer Definition sind zwei Funktionen f und g genau dann gleich,
wenn { (a, f(a)) | a P Def(f) } = { (a, g(a)) | a P Def(g) }, d. h. wenn
(1) Def(f ) = Def(g) (2) ∀a P Def(f ) f(a) = g(a)
Nimmt man einen Wertevorrat als festen Bestandteil mit dazu, so ist eine
Funktion ein Paar der Form f = (Graph(f ), B) (mit Graph(f ) wie bei uns; der
Definitionsbereich ist durch den Graphen festgelegt). Nun sind zwei
Funktionen (Graph(f ), B), (Graph(g), C) genau dann gleich, wenn neben
(1) und (2) auch B = C gilt. In diesem Text gilt für den Sinus zum Beispiel
sin : R → [ −1, 1 ] und sin : R → R.
Bei der anderen Konvention ist sin1 = (Graph(sin), [ −1, 1 ]) verschieden von
sin2 = (Graph(sin), R) und weiter sin1 surjektiv, sin2 nicht. Wir können
dagegen nicht sagen „sin ist surjektiv“, da „surjektiv“ einen Wertevorrat
voraussetzt. Wir sagen: Die Funktion sin : R → [ −1, 1 ] ist surjektiv, die
Funktion sin : R → R ist nicht surjektiv.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 51

Die leere Menge als Funktion


Die leere Menge { } ist eine rechtseindeutige Relation und damit eine
Funktion. Wir können { } : { } → { } schreiben. Diese Konvention ist auch im
Hinblick auf Anzahlformeln sinnvoll: Hat eine endliche Menge A genau n
Elemente, so gibt es genau nn Funktionen von A nach A. Die Formel stimmt
auch für n = 0 mit 00 = 1, wenn wir die leere Menge als Funktion zulassen.

Runde Klammern für das Bild


Ist f : A → B, so ist die Schreibweise f(X) anstelle von f[ X ] problematisch,
wenn eine Teilmenge von A ein Element von A ist. Sei f : { 1, 2, { 1, 2 } } mit
f(1) = 1, f(2) = 2, f({ 1, 2 }) = 1 + 2 = 3. Dann ist f [ { 1, 2 } ] = { 1, 2 }, während
f({ 1, 2 }) = 3. Da diese Situation in der Analysis selten vorkommt, ist die
Notation f(X) für das Bild in der Regel ungefährlich.

Terme
Ein Term wie x2 oder 1/y in einer Variablen x bzw. y ist keine Funktion,
sondern ein syntaktischer Ausdruck. In der Analysis können wir zur
Vereinfachung der Sprechweise vereinbaren, einen Term mit der durch ihn
definierten Funktion mit maximalem Definitionsbereich zu identifizieren.
Wir kommen später darauf zurück.

Die Notation der Umkehrfunktion


Die Umkehrfunktion f − 1 : rng(f ) → A von f : A → B ist genau dann
definiert, wenn f injektiv ist. Dagegen ist das Urbild f − 1 [ Y ] = { a | f(a) P Y }
immer erklärt. Die unglückliche Notation ergibt sich aus der Bezeichnung
R−1 = { (b, a) | (a, b) P R } der Umkehrrelation einer beliebigen Relation R.
Damit existiert f − 1 stets als Relation (als Umkehrrelation der Relation f ),
aber nur bei Injektivität von f liegt eine Funktion vor.

Exponenten bei Funktionen


In der Analysis gilt x−1 = 1/x für alle x reellen Zahlen x ≠ 0, während die
Umkehrfunktion f − 1 von f im Allgemeinen nichts mit 1/f zu tun hat. Der
Sinn des Exponenten ist aus dem Kontext zu erschließen. Algebraisch ist
f 2 = f + f für eine Funktion f : A → A, in der Analysis bedeutet sin2 (x) in der
Regel (sin(x))2 und nicht sin(sin(x)).

Vom Wert einer Definition


Die Präzisierung des Funktionsbegriffs ist ein Paradebeispiel für eine
mengentheoretische Interpretation eines mathematischen Schlüsselbegriffs.
Unsere Anschauungen werden durch eine derartige Definition keineswegs
überflüssig. Eine Definition schützt uns davor, von unseren Anschauungen
abhängig zu werden und uns über sie zu streiten. Sie kann die Anschauung
verbessern, indem sie sie spiegelt. Sie ist ein demokratischer Akt, der das
Wesentliche, das alle teilen, ins Zentrum rückt. Das Gleiche gilt für das
Zahlsystem und den Grenzwertbegriff der Analysis.

© Oliver Deiser Grundzüge der Höheren Mathematik


52 1. Abschnitt Grundlagen

Übungen

Übung 1
Sei f : R → R mit f(x) = x3 für alle x P R. Bestimmen Sie die folgenden
Funktionen:
(a) g = f + f + f + f.
(b) h = f − 1 + f − 1 + f + f.

Übung 2
Geben Sie (ohne Begründung) an, welche der Abbildungseigenschaften
„injektiv, surjektiv, bijektiv“ auf die folgenden Funktionen zutreffen und
welche nicht. Geben Sie für die nicht zutreffenden Eigenschaften Gegen-
beispiele an.
(a) f : R → R mit f(x) = x3 − 1 für alle x P R.
(b) g : R → R mit g(x) = x3 − x für alle x P R.
(c) h : Z × Z → Z mit h(a, b) = a(a − b) für alle (a, b) P Z2 .
(d) k : N* → P(N*) mit k(n) = { p | p ist ein Primteiler von n }
alle n ≥ 1, wobei N* = N − { 0 } = { 1, 2, 3, … } die Menge der
positiven natürlichen Zahlen ist.

Übung 3
Eine Funktion f : R → R heißt streng monoton steigend, falls gilt:
∀a, b P R (a < b → f(a) < f(b)).
Analog heißt f : R → R streng monoton fallend, falls gilt:
∀a, b P R (a < b → f(a) > f(b)).
Welche der folgenden Implikationen gelten allgemein (d. h. für alle
f : R → R) und welche nicht? Geben Sie Gegenbeispiele für die nicht
gültigen Implikationen an.
(a) f ist streng monoton fallend oder streng monoton steigend
impliziert f ist injektiv.
(b) f ist streng monoton fallend oder streng monoton steigend
impliziert f ist surjektiv.
(c) f ist bijektiv impliziert f ist streng monoton fallend oder streng
monoton steigend.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 53

Übung 4
Geben Sie eine Funktion f : R → R an mit den Eigenschaften:
(a) f + f = f.
(b) f ist nicht die Identität auf R, d. h. es gibt ein x P R mit f(x) ≠ x.
(c) Der Wertebereich f [ R ] ist unendlich.
Weisen Sie nach, dass f die geforderten Eigenschaften besitzt. Kann eine
Funktion f mit diesen Eigenschaften injektiv sein? Begründen Sie Ihre
Antwort.

© Oliver Deiser Grundzüge der Höheren Mathematik


54 1. Abschnitt Grundlagen

Lösungen zu den Übungen

Übung 1
Sei f : R → R mit f(x) = x3 für alle x P R. Bestimmen Sie die folgenden
Funktionen:
(a) g = f + f + f + f.
(b) h = f − 1 + f − 1 + f + f.

Lösung zu Übung 1
zu (a):
Es gilt
g(x) = x81 für alle x P R.
Denn sei x P R beliebig. Dann gilt nach den Potenzregeln
g(x) = f (f (f (f (x)))) = (((x3 )3 )3 )3 = ((x9 )3 )3 = (x27 )3 = x81 .

zu (b):
Es gilt h = idR , d. h.
h(x) = x für alle x P R.
Denn für alle x P R gilt f − 1 (x) = x1/3 . Ist nun x P R beliebig, so gilt
h(x) = f − 1 (f − 1 (f (f (x))) = ((x3 )3 )1/3 )1/3 = ((x9 )1/3 )1/3 = (x3 )1/3 = x.
Alternativ können wir so argumentieren (ohne die Definition von f zu
verwenden): Nach Definition der Umkehrfunktion gilt f − 1 + f = idR .
Nach Assoziativität der Komposition können wir beliebig Klammern
setzen. Damit ist
h = f −1 + f −1 + f + f
= f − 1 + (f − 1 + f) + f
= f − 1 + idR + f
= f −1 + f
= idR .
Dabei haben wir die Neutralität der Identität verwendet: Für jede
Funktion g : R → R gilt
g + idR = g = idR + g.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 55

Übung 2
Geben Sie (ohne Begründung) an, welche der Abbildungseigenschaften
„injektiv, surjektiv, bijektiv“ auf die folgenden Funktionen zutreffen und
welche nicht. Geben Sie für die nicht zutreffenden Eigenschaften Gegen-
beispiele an.
(a) f : R → R mit f(x) = x3 − 1 für alle x P R.
(b) g : R → R mit g(x) = x3 − x für alle x P R.
(c) h : Z × Z → Z mit h(a, b) = a(a − b) für alle (a, b) P Z2 .
(d) k : N* → P(N*) mit k(n) = { p | p ist ein Primteiler von n }
alle n ≥ 1, wobei N* = N − { 0 } = { 1, 2, 3, … } die Menge der
positiven natürlichen Zahlen ist.

Lösung zu Übung 2
zu (a):
Die Funktion f ist injektiv, surjektiv und bijektiv.
zu (b):
Die Funktion g ist surjektiv, aber nicht injektiv und nicht bijektiv. Es gilt
g(x) = x3 − x = x(x2 − 1) = x (x + 1) (x − 1) für alle x P R.
Damit gilt
g(0) = g(−1) = g(1) = 0.
Dies zeigt, dass g nicht injektiv und damit insbesondere nicht bijektiv
ist.
zu (c):
Die Funktion h ist surjektiv, aber nicht injektiv und nicht bijektiv. Es gilt
h(0, b) = 0 (0 − b) = 0 für alle b P Z.
Damit wird der Wert 0 von h unendlich oft angenommen, sodass h
nicht injektiv und damit auch nicht bijektiv ist.
zu (d):
Die Funktion k hat keine der drei Eigenschaften injektiv, surjektiv und
bijektiv. Es gilt
k(2n ) = { 2 } für alle n ≥ 1
sodass k nicht injektiv und damit nicht bijektiv ist. Weiter liegt zum
Beispiel die Einermenge { 4 } P P(N*) nicht im Wertebereich von k,
sodass k nicht surjektiv ist.

© Oliver Deiser Grundzüge der Höheren Mathematik


56 1. Abschnitt Grundlagen

-50 -36 -24 -14 -6 0 4 6 6 4 0

-45 -32 -21 -12 -5 0 3 4 3 0 -5

-40 -28 -18 -10 -4 0 2 2 0 -4 -10

-35 -24 -15 -8 -3 0 1 0 -3 -8 -15

-30 -20 -12 -6 -2 0 0 -2 -6 -12 -20

-25 -16 -9 -4 -1 0 -1 -4 -9 -16 -25

-20 -12 -6 -2 0 0 -2 -6 -12 -20 -30

-15 -8 -3 0 1 0 -3 -8 -15 -24 -35

-10 -4 0 2 2 0 -4 -10 -18 -28 -40

-5 0 3 4 3 0 -5 -12 -21 -32 -45

0 4 6 6 4 0 -6 -14 -24 -36 -50

Gitter-Darstellung der Funktion h : Z2 → Z mit h(a, b) = a (b − a) für alle (a, b) P Z2 .


Die Funktion ist surjektiv (Spalte a = 1), aber nicht injektiv (Spalte a = 0).

Einige Werte von k : N* → P(N*) mit k(n) = { p | p ist ein Primteiler von n }:

n k(n)
1 {}
2 {2}
3 {3}
4 {2}
5 {5}
6 { 2, 3 }
7 {7}
8 {2}
9 {3}
10 { 2, 5 }
11 { 11 }
12 { 2, 3 }

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Funktionen 57

Übung 3
Eine Funktion f : R → R heißt streng monoton steigend, falls gilt:
∀a, b P R (a < b → f(a) < f(b)).
Analog heißt f : R → R streng monoton fallend, falls gilt:
∀a, b P R (a < b → f(a) > f(b)).
Welche der folgenden Implikationen gelten allgemein (d. h. für alle
f : R → R) und welche nicht? Geben Sie Gegenbeispiele für die nicht
gültigen Implikationen an.
(a) f ist streng monoton fallend oder streng monoton steigend
impliziert f ist injektiv.
(b) f ist streng monoton fallend oder streng monoton steigend
impliziert f ist surjektiv.
(c) f ist bijektiv impliziert f ist streng monoton fallend oder streng
monoton steigend.

Lösung zu Übung 3
zu (a): Die Implikation ist gültig.
zu (b): Die Implikation ist im Allgemeinen nicht gültig. Als Gegenbeispiel
betrachten wir die Funktion f : R → R mit
f(x) = x für x < 0, f(x) = x + 1 für x ≥ 0.
Die Funktion f ist streng monoton steigend, aber nicht surjektiv, da die
Elemente des Intervalls [ 0, 1 [ nicht angenommen werden.
Es gibt auch stetige Gegenbeispiele: Der Arkus-Tangens arctan : R → R
ist streng monoton steigend, nimmt aber nur Werte in ] −π/2, π/2 [ an.
zu (c): Die Implikation ist im Allgemeinen nicht gültig. Als Gegenbeispiel
betrachten wir die Funktion f : R → R mit
f(x) = 1/x für x ≠ 0, f(0) = 0.
Die Funktion f ist die Einheitshyperbel auf R* = R − { 0 }. Dort nimmt
sie die Null nicht, jeden anderen Werte aber genau einmal an. Wegen
f(0) = 0 ist f also bijektiv. Wegen
f(0) = 0 < 1 = f(1) mit 0 < 1
ist f nicht streng monoton fallend. Wegen
f(1) = 1 > 1/2 = f(2) mit 1 < 2
ist f nicht streng monoton steigend.
Hier gibt es keine stetigen Gegenbeispiele. Dies lässt sich mit dem
Zwischenwertsatz zeigen, den wir später diskutieren.

© Oliver Deiser Grundzüge der Höheren Mathematik


58 1. Abschnitt Grundlagen

Übung 4
Geben Sie eine Funktion f : R → R an mit den Eigenschaften:
(a) f + f = f.
(b) f ist nicht die Identität auf R, d. h. es gibt ein x P R mit f(x) ≠ x.
(c) Der Wertebereich f [ R ] ist unendlich.
Weisen Sie nach, dass f die geforderten Eigenschaften besitzt. Kann eine
Funktion f mit diesen Eigenschaften injektiv sein? Begründen Sie Ihre
Antwort.

Lösung zu Übung 4
Wir definieren f : R → R durch
f(x) =  x  für alle x P R, wobei
 x  = „die größte ganze Zahl a mit a ≤ x“ für alle x P R.
Die Funktion f ist die Abrundungsfunktion auf R. Zum Beispiel gilt
f(3) = f(3,5) = f(3,823) = 3
Die Funktion f hat die gewünschten Eigenschaften:
zu (a):
Zweimaliges Abrunden ist identisch mit einmaligem Abrunden. Die
zweite Anwendung von f ändert den Wert nicht mehr. Formal:
Sei x P R beliebig, und sei a = f(x). Nach Definition von f gilt a P Z und
damit f(a) = a. Damit ist
f(f(x)) = f(a) = a = f(x).
zu (b):
Es gilt f(1/2) = 0, sodass f nicht die Identität auf R ist.
zu (c):
Für alle a P Z gilt f(a) = a. Damit nimmt f jede ganze Zahl als Wert an,
sodass der Wertebereich von f unendlich ist. Genauer gilt f [ R ] = Z, da
jeder Wert von f nach Definition ganzzahlig ist.
zur Injektivität:
Eine Funktion f : R → R mit den Eigenschaften (a) und (b) kann nicht
injektiv sein. Zum Beweis betrachten wir ein x P R mit f(x) ≠ x. Ein
derartiges x existiert, da f nicht die Identität ist. Wir setzen y = f(x).
Dann gilt y ≠ x. Nach (a) ist
f(y) = f (f (x)) = f(x) = y.
Also gilt f(x) = f(y) mit x ≠ y, sodass f nicht injektiv ist.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion

Ausgehend von einer anschaulichen Beschreibung des schrittweisen Zählens ge-


langen wir zu einer Axiomatisierung der natürlichen Zahlen. Im Zentrum steht
die vollständige Induktion: Gilt eine Eigenschaft für die Null und vererbt sie sich
von einer Zahl stets auf ihren Nachfolger, so gilt sie für alle natürlichen Zahlen.
Wir diskutieren die allgemeine Struktur eines induktiven Beweises und betrach-
ten die exemplarische Gauß-Summe. Weiter formulieren wir das verwandte
Prinzip vom kleinsten Element, das ebenfalls geeignet ist, eine Eigenschaft für
alle natürlichen Zahlen nachzuweisen.

Schlüsselbegriffe
Anfangselement, Nachfolgerbildung
Zählreihe, Dedekind-Peano-Axiome
vollständige Induktion (Satz und Anwendung)
Gauß-Summe
Prinzip vom kleinsten Element

© Oliver Deiser Grundzüge der Höheren Mathematik


60 1. Abschnitt Grundlagen

Anschauliches Zählen

Die natürlichen Zahlen bilden eine einseitige unendliche Folge der Form

In dieser Darstellung haben wir die vertraute Dezimaldarstellung verwendet.


Wir könnten auch Dualdarstellungen verwenden (mit einem Index 2):

Die Wahl der Anfangs


In diesem Text gilt die Null als natürliche Zahl. In der Zahlentheorie
beginnt man oft bei der Eins. Die alten Griechen haben das Zählen bei der
Zwei begonnen: Die Eins galt als Einheit, aus der Zahlen gebildet werden,
nicht aber als Zahl. Dass die Null oder die Eins eine natürliche Zahl ist,
lässt sich nicht beweisen. Wir müssen den Begriff „natürliche Zahl” erst
definieren. Hierzu müssen wir uns einigen, wo wir anfangen.

Wenn wir von den Namen der Zahlen ganz absehen erhalten wir:

Wichtige Merkmale dieser Abstraktion sind:


(A1) Es gibt ein Anfangselement (im Diagramm links).
(A2) Es gibt eine Nachfolgerbildung (Pfeile im Diagramm).
(A3) Die Nachfolgerbildung ist injektiv: Verschiedene Zahlen ha-
ben verschiedene Nachfolger.
(A4) Das Anfangselement ist kein Nachfolger einer Zahl.
(A5) Die Nachfolgerbildung erreicht ausgehend vom Anfangsele-
ment jedes andere Element der Reihe.

Diese Merkmale führen uns zu einer axiomatischen Beschreibung der natürli-


chen Zahlen:

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 61

Die Dedekind-Peano-Axiome

Definition (Zählreihe, Struktur der natürlichen Zahlen)


Seien N eine Menge, S : N → N und a P N. Dann heißt (N, S, a) eine
Zählreihe oder Struktur der natürlichen Zahlen, falls gilt:
(D1) Die Funktion S ist injektiv.
(D2) Das Element a liegt nicht im Wertebereich von S.
(D3) Sei %(n) eine Eigenschaft. Es gelte:
(a) %(a) (b) ∀n (%(n) → %(S(n))
Dann gilt %(n) für alle n P N.

Das Element a heißt das Anfangselement und die Funktion S die Nachfolger-
funktion der Zählreihe. Gilt S(n) = m, so heißt m der Nachfolger von n und
weiter n der Vorgänger von m.

Die Aussagen (D1) − (D3) sind die Dedekind-Peano-Axiome für die natürlichen
Zahlen. Speziell heißt (D3) das Induktionsaxiom ( für Eigenschaften).

Diskussion der Axiome


Die beiden ersten Axiome sind unproblematisch. Das ausgezeichnete
Element a ist das linke Element unserer Diagramme, die Nachfolgerfunk-
tion S entspricht den Pfeilen, die beim Anfangselement beginnen und
endlos weiter führen ohne Schleifen zu bilden. Das Induktionsaxiom ist
schwieriger. Es ist der Versuch, die Anschauung (A5) umzusetzen: Fangen
wir beim Anfangselement an, so erreichen wir jede andere Zahl, wenn wir
hinreichend oft Nachfolger bilden. Dies lässt sich nicht leicht formalisie-
ren, da wir für „hinreichend oft“ bereits die natürlichen Zahlen brauchen.
Der anscheinend bestmögliche Ersatz für (A5) ist:
Gilt eine Eigenschaft für das Anfangselement und vererbt sie sich von jeder
Zahl n auf ihren Nachfolger S(n), so gilt die Eigenschaft für alle Zahlen.
Das Induktionsaxiom ist die formale Version dieser Anschauung.

Teilmengen statt Eigenschaften


Anstelle von Eigenschaften für N können wir äquivalent auch Teilmengen
von N verwenden. Das Induktionsaxiom lautet dann:
(D3)′ Sei X ⊆ N. Es gelte
(a) a P X (b) ∀n (n P X → S(n) P X)
Dann gilt X = N.

© Oliver Deiser Grundzüge der Höheren Mathematik


62 1. Abschnitt Grundlagen

Die natürlichen Zahlen

Existenz und Eindeutigkeit einer Zählreihe


Mit Hilfe der Axiome der Mengenlehre lässt sich zeigen, dass es bis auf die
Namen der Elemente genau eine Zählreihe gibt. Wir wählen eine im
Wesentlichen eindeutige Zählreihe und notieren sie in der Form (N, S, 0)
oder kurz als N. Die Elemente von N heißen natürliche Zahlen.

Wir formulieren die Dedekind-Peano-Axiome noch etwas freundlicher:

Das erste Axiom


Je zwei verschiedene natürliche Zahlen haben verschiedene Nachfolger.

Das zweite Axiom


Das Anfangselement 0 ist kein Nachfolger einer natürlichen Zahl.

Das dritte Axiom (Induktionsaxiom für Eigenschaften)


Gilt eine Eigenschaft % für die 0 und impliziert die Gültigkeit von % für n
stets die Gültigkeit von % für S(n), so gilt % für alle natürlichen Zahlen.

Zahldarstellungen
Wir setzen
1 = S(0), 2 = S(1) = S(S(0)), 3 = S(2), …, 10 = S(9), 11 = S(10), …
Dass wir das Dezimalsystem bevorzugen, ist eine Konvention. Prinzipiell
ist jedes Notationssystem gleichberechtigt. Rechnerisch sind manche
Systeme anderen überlegen (der Leser denke etwa an das römische System),
weswegen sie sich durchsetzen, wenn das Rechnen wichtig ist. In jedem Fall
ist die Bezeichnung vom Objekt zu unterscheiden. Aus mathematischer
Sicht ist die 2 der zweifache Nachfolger des Anfangselements 0.

Welche Zählreihe wählen wir aus?


Es wäre prinzipiell nicht nötig, konkret zu werden, da alles Weitere aus den
Axiomen abgeleitet wird. Dennoch ist es interessant (und vielleicht auch
didaktisch hilfreich), dass sich in der Mengenlehre eine konkrete Zählreihe
besonders bewährt hat. Für diese kanonische Zählreihe gilt 0 = ∅ und
S(n) = n ∪ { n } für alle n P N ( John von Neumann Nachfolgerbildung)
Damit erhalten wir
0 = { }, 1 = S(0) = 0 ∪ { 0 } = { 0 }, 2 = S(1) = 1 ∪ { 1 } = { 0, 1 },
S(n) = n ∪ { n } = { 0, …, n } für alle n P N.
Kurz: Jede natürliche Zahl ist identisch mit der Menge ihrer Vorgänger.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 63

Arithmetik und Ordnung auf den natürlichen Zahlen

Bislang können wir nur Nachfolger bilden. Die Arithmetik auf den natürli-
chen Zahlen lässt sich mit Hilfe von Rekursion einführen. Bei dieser Definitions-
form definieren wir zunächst ein Objekt F(0). Weiter definieren wir für alle n ein
Objekt F(S(n)) unter Verwendung von F(n) (oder allgemeiner F(0), …, F(n)).

Rekursive Definition der Addition


Sei m P N. Wir definieren rekursiv:
m + 0 = m, m + S(n) = S(m + n) für alle n P N.

Beispiel
Es gilt 2 + 2 = 2 + S(1) = S(2 + 1) = S(3) = 4. Weiter gilt
n + 1 = n + S(0) = S(n + 0) = S(n) für alle n P N.

Rekursive Definition der Multiplikation


Für alle m P N setzen wir:
m ⋅ 0 = 0, m ⋅ S(n) = m ⋅ n + m für alle n P N.
Die Form ist durch m ⋅ S(n) = m ⋅ (n + 1) und das Distributivgesetz
motiviert. Wir lassen Malpunkte oft weg und schreiben kurz m n statt m ⋅ n.

Mit Hilfe des Induktionsaxioms lassen sich alle Rechengesetze nachweisen:


∀n,m,k (n + m) + k = n + (m + k) (Assoziativgesetz für die Addition)
∀n,m n + m = m + n (Kommutativgesetz für die Addition)
∀n,m,k (n m) k = n (m k) (Assoziativgesetz für die Multiplikation)
∀n,m n m = m n (Kommutativgesetz für die Multiplikation)
∀n,m,k n (m + k) = nm + n k (Distributivgesetz)
Analog können wir die Exponentiation rekursiv durch m0 = 1, mn + 1 = mn ⋅ m
einführen und die Potenzregeln zeigen.
Die Ordnung lässt sich vergleichsweise leicht definieren:

Definition der Ordnung


Wir setzen für alle natürlichen Zahlen n, m:
n ≤ m, falls ∃k n + k = m.
Die Relation ≤ ist reflexiv, antisymmetrisch und transitiv. Zudem gilt:
∀n, m (n ≤ m ∨ m ≤ n) (Vergleichbarkeit)

© Oliver Deiser Grundzüge der Höheren Mathematik


64 1. Abschnitt Grundlagen

Induktionsbeweise

Aussagen über die natürlichen Zahlen sind oftmals Allaussagen der Form
(+) Für alle natürlichen Zahlen n gilt die Eigenschaft %(n).
Jede derartige Aussage können wir, wenn sie beweisbar ist, mit Hilfe vollständi-
ger Induktion beweisen. Ein solcher Beweis hat zwei Schritte:

Struktur eines induktiven Beweises


Induktionsanfang n = 0:
Wir zeigen %(0).
Induktionsschritt von n nach n + 1:
Es gelte %(n) für eine natürliche Zahl n (Induktionsvoraussetzung). Wir
zeigen %(n + 1) unter Verwendung der Induktionsvoraussetzung %(n).

Gelingt uns die Durchführung dieser beiden Schritte, so wissen wir nach dem In-
duktionsaxiom, dass jede natürliche Zahl die Eigenschaft % besitzt:

Induktionsbeweise und Induktionsaxiom


Wir betrachten das Induktionsaxiom für die Eigenschaft % in der folgenden
kompakten Form:
%(0) ∧ ∀n (%(n) → %(n + 1)) → ∀n %(n).
Diese Aussage hat die Form A ∧ B → C mit
A = %(0), B = ∀n (%(n) → %(n + 1)), C = ∀n %(n).
Der Induktionsanfang zeigt A. Der Induktionsschritt zeigt B. Da A ∧ B → C
nach dem Induktionsaxiom gilt, ergibt sich C. Diese logische Überlegung
zeigt, dass eine Induktion zwei Teile hat (und nicht etwa drei, wie es oft zu
finden ist: die Induktionsvoraussetzung ist Teil des Induktionsschritts). Der
Induktionsschritt besteht im Nachweis von
B = ∀n (%(n) → %(n + 1)).
Die Aussage B ist eine Allaussage. Zu ihrem Beweis betrachten wir ein
beliebiges n P N. Nun müssen wir zeigen:
%(n) → %(n + 1)
Diese Aussage über n hat die Form einer Implikation. Wir nehmen also
%(n) an (Induktionsvoraussetzung, kurz I.V.) und versuchen, %(n + 1) zu
beweisen (Induktionsbehauptung, Ziel des Induktionsschritts).

Der Beweis von %(n + 1) mit Hilfe von %(n) ist in der Regel die einzige Schwie-
rigkeit eines induktiven Beweises. Der Rest ist äußere Form, an die man sich na-
türlich erst einmal gewöhnen muss. Wir betrachten ein klassisches Beispiel:

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 65

Die Gauß-Summe

Satz (Gauß-Summe)
Für alle natürlichen Zahlen n gilt:
n (n + 1)
∑ k≤n k = (wobei ∑ k ≤ n k = 0 + 1 + 2 + … + n)
2

Beweis
Wir zeigen die Aussage durch vollständige Induktion nach n ≥ 0.
Induktionsanfang n = 0: Es gilt
∑ k ≤ 0 k = 0 = 0 (0 + 1)/2.
Induktionsschritt von n nach n + 1:
Es gelte ∑ k ≤ n k = n (n + 1)/2 (Induktionsvoraussetzung I.V.). Wir zeigen:
(n + 1)(n + 2)
∑ k ≤ n+1 k = .
2
Es gilt:
∑ k ≤ n+1 k = n + 1 + ∑ k ≤ n k
n (n + 1) n
= I.V. n + 1 + = (n + 1) ( 1 + )
2 2
2+n (n + 1)(n + 2)
= (n + 1) ( )= .
2 2
1
Wichtige Aspekte eines induktiven Beweises
Es ist alleine schon aus Gründen der Lesbarkeit wichtig, die Struktur eines
Induktionsbeweises einzuhalten:
(1) Induktionsvariable angeben: Manche Aussagen haben mehrere Variable
(wie zum Beispiel das Kommutativgesetz). Es muss klar werden,
wonach die Induktion geführt wird.
(2) Induktionsanfang angeben: Oft beginnen wir bei 0, manchmal aber auch
bei 1 oder allgemein bei n0 , wenn wir zeigen wollen, dass eine Aussage
für alle n ≥ n0 gilt.
(3) Induktionsschritt angeben: Der Standardschritt führt von n nach n + 1.
Aber auch ein Schritt von n − 1 nach n ist möglich und manchmal
vorteilhaft.
(4) Induktionsvoraussetzung angeben: Die Induktionsvoraussetzung sollte
explizit notiert werden. Es ist guter Stil, ihre Verwendung im Folgen-
den kenntlich zu machen, etwa durch „nach I.V. gilt“.

© Oliver Deiser Grundzüge der Höheren Mathematik


66 1. Abschnitt Grundlagen

Wir führen den Induktionsschritt zur Illustration noch einmal von n − 1 nach
n durch:

Beweis der Gauß-Summenformel, Variante


… (wie oben)
Induktionsschritt von n − 1 nach n:
Es gelte ∑ k ≤ n − 1 k = (n − 1)n/2 (I.V.). Wir zeigen:
n(n + 1)
∑k ≤ n k = .
2
Es gilt
(n − 1) n n−1
∑ k ≤ n k = n + ∑ k ≤ n − 1 k = I.V. n + = n (1 + )
2 2
2+n−1 n (n + 1)
= n( ) = .
2 2

Für Formeln wie die Gauß-Summe besteht der Induktionsschritt im Wesent-


lich aus Termumformungen unter Verwendung der Induktionsvoraussetzung:
Die linke Seite wird durch mehrere Rechenschritte in die rechte Seite umge-
formt. Hierzu kann es hilfreich sein, das Ziel des Induktionsschritt konkret anzu-
geben (im Beweis in der Form „Wir zeigen, dass …“). Diese Angabe verdeutlicht
die Form, die wir durch die Termumformung anstreben.

Zur Entdeckung der Summenformel


Wie kommt man auf die Summenformel von Gauß? Der Induktionsbeweis
gibt keine Auskunft. Eine Möglichkeit ist, die ersten Summen auszurechnen:
0 = 0, 0 + 1 = 1, 0 + 1 + 2 = 3, 0 + 1 + 2 + 3 = 6, 0 + 1 + 2 + 3 + 4 = 10, …
Es ergibt sich die Folge
0, 1, 3, 6, 10, 15, 21, 28, …
Verdoppeln liefert 0, 2, 6, 12, 20, 30, 42, 56, … Nun lässt sich die Formel
n(n + 1) raten und eine Halbierung liefert die Gauß-Summe. Eine Alterna-
tive, in einer Summe wie
0 + 1 + 2 + … + 98 + 99 + 100
zu beobachten, dass sich die Summanden paarweise zu 100 addieren, wenn
wir sie von vorne und hinten zusammenfassen. Es gibt 50 + 1/2 derartige
Paare (0 + 100, …, 49 + 51; die 50 in der Mitte bleibt alleine), sodass
101
∑ k ≤ 100 k = 100 ⋅ .
2
Eine Verallgemeinerung führt zur Summenformel n(n + 1)/2. Diese „Gauß-
Methode“ liefert einen alternativen Beweis der Formel. Es muss also nicht
immer Induktion sein − eine clevere Idee reicht auch.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 67

Das Prinzip vom kleinsten Element

Der folgende Satz bringt eine weitere wichtige Struktureigenschaft der Ord-
nung der natürlichen Zahlen zum Ausdruck:

Satz (Prinzip vom kleinsten Element)


Sei A ⊆ N nichtleer. Dann besitzt A ein kleinstes Element, d. h.
∃n* P A ∀n P A n* ≤ n.

Beweis
Für alle n sei
An = A ∩ { 0, …, n }. (Anfangsstück von A bis einschließlich n)
Wir zeigen durch Induktion nach n ≥ 0:
(+) Ist An ≠ ∅, so hat An ein kleinstes Element.
Induktionsanfang n = 0:
Ist A0 = A ∩ { 0 } ≠ ∅, so ist offenbar 0 das kleinste Element von A0 .
Induktionsschritt von n nach n + 1:
Es gelte An + 1 ≠ ∅. Ist An ≠ ∅, so besitzt An nach Induktionsvorausset-
zung ein kleinstes Element, und dieses ist auch das kleinste Element von
An + 1 . Ist andernfalls An = ∅, so ist An + 1 = { n + 1 }, und dann ist n + 1 das
kleinste Element von An + 1 .
Sei nun n P A beliebig. Dann ist An + 1 ≠ ∅, sodass An + 1 nach (+) ein
kleinstes Element n* besitzt. Dann ist n* das kleinste Element von A.

Das Ergebnis wird manchmal auch das Prinzip vom kleinsten Verbrecher oder
kleinsten Gegenbeispiel genannt: Gibt es zu einer Eigenschaft %(n) ein Gegenbei-
spiel, so gibt es ein kleinstes Gegenbeispiel. Zum Beweis betrachten wir die
Menge A = { n P N | ¬ %(n) }. Ist A ≠ ∅, so ist das kleinste Element von A das
kleinste Gegenbeispiel für die Eigenschaft %.
Als Beispiel für eine Anwendung des Prinzips betrachten wir:

Satz (Existenz von Primteilern)


Jede natürliche Zahl n ≥ 2 besitzt einen Primteiler.

Beweis
Annahme nicht. Dann gibt es eine kleinste natürliche Zahl n* ≥ 2, die keinen
Primteiler besitzt. Dann ist n* nicht prim, da sonst n* ein Primteiler von n*
wäre. Also gibt es k, m ≥ 2 mit k m = n*. Dann ist aber k ≥ 2 und k < n*.
Nach minimaler Wahl von n* besitzt k einen Primteiler p. Nach Transitivi-
tät der Teilbarkeit ist k ein Primteiler von n*, Widerspruch.

© Oliver Deiser Grundzüge der Höheren Mathematik


68 1. Abschnitt Grundlagen

Übungen

Übung 1
Zeigen Sie mit Hilfe vollständiger Induktion:
Für alle n ≥ 1 gilt ∑ 1 ≤ k ≤ n (2k − 1) = n2 .

Übung 2
Illustrieren Sie die für alle n ≥ 1 gültige Summenformel
∑ 1 ≤ k ≤ n (2k − 1) = n2
aus Übung 1 durch ein Diagramm, sodass ein visueller Beweis der Formel
entsteht.

Übung 3
(a) Geben Sie alle zweielementigen Teilmengen von { 1, …, n } für
n = 2, 3, 4 in Form einer Tabelle an.
(b) Zeigen Sie mit Hilfe vollständiger Induktion, dass für alle n ≥ 2 gilt:
n (n − 1)
Es gibt genau zweielementige Teilmengen von { 1, …, n }.
2
(c) Begründen Sie die Anzahlformel in (b) durch eine kombinatorische
Argumentation, d.h. geben Sie eine begründete Antwort auf die Frage:
„Wieviele Möglichkeiten gibt es, zwei Elemente aus { 1, …, n }
auszuwählen?“

Übung 4
Zeigen Sie mit Hilfe vollständiger Induktion:
n (n + 1) (2n + 1)
Für alle natürlichen Zahlen n ≥ 0 gilt ∑ k ≤ n k2 = .
6

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 69

Lösungen zu den Übungen

Übung 1
Zeigen Sie mit Hilfe vollständiger Induktion:
Für alle n ≥ 1 gilt ∑ 1 ≤ k ≤ n (2k − 1) = n2 .

Lösung zu Übung 1
Wir beweisen die Aussage durch vollständige Induktion nach n ≥ 1.
Induktionsanfang n = 1:
Die linke Seite berechnet sich für n = 1 zu
∑ 1 ≤ k ≤ 1 (2k − 1) = 2 ⋅ 1 − 1 = 2 − 1 = 1.
Die rechte Seite berechnet sich für n = 1 zu
n2 = 12 = 1.
Beide Seiten stimmen überein.
Kürzer können wir auch so argumentieren: Für n = 1 gilt
∑ 1 ≤ k ≤ n (2k − 1) = ∑ 1 ≤ k ≤ 1 (2k − 1) = 2 ⋅ 1 − 1 = 2 − 1 = 1 = 12 = n2 .
Induktionsschritt von n nach n + 1:
Es gelte:

∑ 1 ≤ k ≤ n (2k − 1) = n2 (Induktionsvoraussetzung I.V.)


Wir zeigen:

(+) ∑ 1 ≤ k ≤ n + 1 (2k − 1) = (n + 1)n2

Zum Beweis formen wir die linke Seite von (+) mit Hilfe der Indukti-
onsvoraussetzung in die rechte Seite um. Es gilt:

∑ 1 ≤ k ≤ n+1 (2k − 1) = ∑ 1 ≤ k ≤ n (2k − 1) + (2(n + 1) − 1)


=I. V. n2 + (2(n + 1) − 1)

= n2 + 2n + 2 − 1

= n2 + 2n + 1

= (n + 1)2

© Oliver Deiser Grundzüge der Höheren Mathematik


70 1. Abschnitt Grundlagen

Übung 2
Illustrieren Sie die für alle n ≥ 1 gültige Summenformel
∑ 1 ≤ k ≤ n (2k − 1) = n2
aus Übung 1 durch ein Diagramm, sodass ein visueller Beweis der Formel
entsteht.

Lösung zu Übung 2
Die Formel besagt, dass wir die Quadratzahlen durchlaufen, wenn wir die
ungeraden Zahlen
1, 3, 5, 7, …
aufsummieren. Wir stellen Quadratzahlen geometrisch mit Hilfe von
Zählsteinen dar, um dies zu visualisieren:

1 + 3 + 5 + 7 + 9 + 11 + 13 + 15

Wir fügen schrittweise 1, 3, 5, …, 2n − 1, … Zählsteine hinzu, die wir winkelförmig


anordnen. Dabei entstehen Quadrate mit 1, 4, 9, …, n2 , … Zählsteinen.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Natürliche Zahlen und Induktion 71

Übung 3
(a) Geben Sie alle zweielementigen Teilmengen von { 1, …, n } für
n = 2, 3, 4 in Form einer Tabelle an.
(b) Zeigen Sie mit Hilfe vollständiger Induktion, dass für alle n ≥ 2 gilt:
Es gibt genau n(n − 1)/2 zweielementige Teilmengen von { 1, …, n }.
(c) Begründen Sie die Anzahlformel in (b) durch eine kombinatorische
Argumentation, d.h. geben Sie eine begründete Antwort auf die Frage:
„Wieviele Möglichkeiten gibt es, zwei Elemente aus { 1, …, n }
auszuwählen?“

Lösung zu Übung 3
zu (a):
n = 2: { 1, 2 }
n = 3: { 1, 2 }, { 1, 3 }, { 2, 3 }
n = 4: { 1, 2 }, { 1, 3 }, { 1, 4 }, { 2, 3 }, { 2, 4 }, { 3, 4 }

zu (b):
Induktionsanfang n = 2: Für n = 2 gibt es genau eine zweielementige
Teilmenge von { 1, 2 } (nämlich die Menge selbst). Für n = 2 gilt
n(n − 1)/2 = 1, sodass die Anzahlformel für n = 2 richtig ist.
Induktionsschritt von n nach n + 1: Es gebe genau n(n − 1)/2 zweielemen-
tige Teilmengen von { 1, …, n } (Induktionsvoraussetzung I.V.). Wir
zeigen, dass es genau (n + 1)n/2 zweielementige Teilmengen von
{ 1, …, n + 1 } gibt. Hierzu beobachten wir:
(i) Jede zweielementige Teilmenge von { 1, …, n } ist eine solche
von { 1, …, n + 1 }.
(ii) Die anderen zweielementigen Teilmengen von { 1, …, n + 1 }
sind von der Form { k, n + 1 } für k = 1, …, n.
Nach Induktionsvoraussetzung gibt es genau n(n − 1)/2 Teilmengen
wie in (i). Weiter gibt es genau n Teilmengen wie in (ii). Damit
berechnet sich die Zahl dieser Teilmengen zu
n (n − 1) n2 − n + 2n n2 + n (n + 1) n
+ n = = = .
2 2 2 2
zu (c):
Sei n ≥ 2. Dann gibt es genau n(n − 1) geordnete Paare (a, b) mit a ≠ b
und a, b P { 1, …, n }. Denn für die erste Position haben wir n und für
die zweite Position n − 1 Möglichkeiten. Weiter gibt es n(n − 1)/2
derartige (a, b) mit a < b (da mit (a, b) immer auch (b, a) ein Paar ist).
Die Anzahl der geordneten Paare (a, b) mit a < b entspricht genau den
ungeordneten Paarmengen { a, b } mit a ≠ b.

© Oliver Deiser Grundzüge der Höheren Mathematik


72 1. Abschnitt Grundlagen

Übung 4
Zeigen Sie mit Hilfe vollständiger Induktion:
n (n + 1) (2n + 1)
Für alle natürlichen Zahlen n ≥ 0 gilt ∑ k ≤ n k2 = .
6

Lösung zu Übung 4
Um die Notation zu vereinfachen (Vermeidung von Brüchen), zeigen wir
die äquivalente Aussage:

(#) Für alle natürlichen Zahlen n ≥ 0 gilt 6 ∑ k ≤ n k2 = n (n + 1) (2n + 1).

Wir beweisen (#) durch vollständige Induktion nach n ≥ 0.

Induktionsanfang n = 0:
Für n = 0 gilt
6 ∑ k ≤ n k2 = 6 ∑ k ≤ 0 k2 = 6 ⋅ 02 = 0 = 0 ⋅ 1 ⋅ 1 = n (n + 1) (2n + 1).

Induktionsschritt von n nach n + 1:


Es gelte

6 ∑ k ≤ n k2 = n (n + 1) (2n + 1) (Induktionsvoraussetzung).

Wir zeigen, dass

6 ∑ k ≤ n + 1 k2 = (n + 1) (n + 2) (2n + 3) (mit 2(n + 1) + 1 = 2n + 3)).

Es gilt:

6 ∑ k ≤ n+1 k2 = 6 ∑ k ≤ n k2 + 6 (n + 1)2

=I.V. n(n+1)(2n+1) + 6(n+1)2

= (n+ 1) ( n (2n+ 1) + 6 (n + 1) )

= (n + 1) (2n2 + n + 6n + 6)

= (n + 1) (2n2 + 7n + 6)

= (n+1)(n+2)(2n+3)

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen

Nach unserer Untersuchung der natürlichen Zahlen betrachten wir nun die ra-
tionalen und reellen Zahlen. Eine Auflistung wichtiger Rechengesetze führt uns
zum Begriff des angeordneten Zahlkörpers und zu einer axiomatischen Beschrei-
bung der rationalen Zahlen als kleinster angeordneter Körper. Die Irrationalität
der Quadratwurzel aus 2 motiviert das Vollständigkeitsaxiom, das die Existenz
kleinster oberer Schranken für nichtleere beschränkte Zahlmengen garantiert.
Damit wird der wesentliche Unterschied zwischen den rationalen Zahlen und
den reellen Zahlen durch ein einziges für die Analysis sehr bedeutsames Axiom
prägnant formuliert. Als Anwendung besprechen wir endliche und unendliche
Dezimaldarstellungen, sodass wir am Ende die reellen Zahlen in einer vertrauten
Form wiedergefunden haben.

Schlüsselbegriffe
Körperaxiome, Anordnungsaxiome
Q als kleinster angeordneter Körper
Irrationale Zahlen (speziell £2)
obere und untere Schranke, Supremum und Infimum
Vollständigkeitsaxiom
endliche und unendliche Dezimaldarstellungen

© Oliver Deiser Grundzüge der Höheren Mathematik


74 1. Abschnitt Grundlagen

Der naive Zahlbegriff

Wichtige Mengen des Zahlsystems sind:


N = { 0, 1, 2, 3, … } (natürliche Zahlen)
Z = { …, −3, −2, −1, 0, 1, 2, 3, … } (ganze Zahlen)
Q = { a/b | a, b P Z, b ≠ 0 } (rationale Zahlen)
R = { ± n,d1 d2 d3 … | n P N, di P { 0, …, 9 } für alle i ≥ 1 } (reelle Zahlen)
Eigenschaften des Zahlsystems
(1) Die Zahlen unterliegen den Grundrechenarten der Addition,
Subtraktion, Multiplikation und Division. Durch den Schritt von N
nach Z erhalten wir eine freie Subtraktion, durch den Schritt von Z
nach Q eine freie Division, bei der nur die Division durch Null
ausgeschlossen ist. Auf den reellen Zahlen lässt sich eine Exponentia-
tion ax erklären, bei der lediglich gefordert wird, dass die Basis a positiv
ist. Der Exponent kann eine beliebige reelle Zahl sein.
(2) Eine rationale Zahl a/b können wir kürzen, indem wir den Zähler a
und den Nenner b durch den größten gemeinsamen Teiler von a und b
dividieren. Dadurch erhalten wir eindeutige Bruchdarstellungen.
(3) Rationale Zahlen lassen sich als endliche oder periodische unendliche
Dezimalbrüche schreiben, sodass Q ⊆ R. Reelle Zahlen, die nicht
rational sind, heißen irrational. Die irrationalen Zahlen entsprechen
den unendlichen nichtperiodischen Dezimalbrüchen.
(4) Auf den Zahlen besteht eine Ordnung, in der je zwei Zahlen vergleich-
bar sind. In N besitzt jede Zahl einen eindeutigen Nachfolger, in Z
zudem einen eindeutigen Vorgänger. Die rationalen Zahlen sind dicht
geordnet, d. h. zwischen je zwei rationalen Zahlen liegt eine weitere
rationale Zahl (etwa das arithmetische Mittel der beiden Zahlen). Das
Gleiche gilt für die reellen Zahlen.
(5) Die Zahlen lassen sich den Punkten einer Linie zuordnen, die dadurch
zu einer Zahlengeraden wird. Die reellen Zahlen bilden im Gegensatz
zu den rationalen Zahlen ein lückenloses Kontinuum, in dem die in der
Analysis benötigten Grenzübergänge durchgeführt werden können.

Diese Punkte fassen das aus der Schule bekannte Wissen zusammen. Die „Hö-
here Mathematik“ des Zahlsystems besteht in der mengentheoretischen Kon-
struktion und der axiomatischen Charakterisierung der Zahlen. Sie ist, wie wir
für die natürlichen Zahlen schon gesehen haben, vergleichsweise komplex. Alles
auszuführen braucht viel Raum und Zeit. Wir begnügen uns hier mit einem
Überblick, der wichtige Aspekte herausgreift.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 75

Zahlen auf einer Linie

Wir beginnen mit einer anschaulichen Überlegung. Auf einer beidseitig un-
endlichen Linie lässt sich ein Nullpunkt 0 und eine Einheit 1 markieren. Durch
Vervielfachung der Strecke von 0 nach 1 erhalten wir die Punkte 2, 3, 4, … Durch
Spiegelung dieser Punkte am Nullpunkt ergeben sich die Punkte −1, −2, −3, …
Wir identifizieren Punkte mit Zahlen und setzen
Z = { …, −3, −2, −1, 0, 1, 2, 3, … }.
Nun halbieren wir die Strecke von 0 nach 1. Den Punkt 1/2 vervielfachen wir
ganzzahlig (d. h. nach links und nach rechts), sodass wir die Punkte
…, −n/2, …, −3/2, − 2/2, −1/2, 0, 1/2, 2/2, 3/2, …, n/2, …
erhalten, die zum Teil mit alten Punkten zusammenfallen. Allgemein können wir
den Punkt 1/m für alle natürlichen Zahlen m ≥ 2 bilden (indem wir die Strecke
von 0 nach 1 in m gleichlange Teile teilen) und ganzzahlig vervielfachen. Dies lie-
fert Punkte der Form
a/b mit a P Z, b P N* (wobei wieder N* = N − { 0 }).
Erneut fallen Punkte zusammen. Es gilt
a/b = c/d genau dann, wenn ad = bc.
Mit den so konstruierten Punkten können wir rechnen:
a c ad bc ad + bc
+ = + = ,
b d bd bd bd
a c 1 1 1 ac
⋅ = a⋅c⋅ ⋅ = ac ⋅ = .
b d b d bd bd
Weiter können wir die Punkte vergleichen. Es gilt
a c
< genau dann, wenn ad < bc.
b d
Die erzeugten Punkte nennen wir rationale Zahlen. Wir setzen
Q = { a/b | a P Z, b P N* }.
Zusammen mit der Arithmetik und Ordnung ergibt sich der angeordnete Körper
(Q, +, ⋅, 0, 1, <) der rationalen Zahlen. Wie für N stellen sich zwei Fragen:
(1) Wie können wir Q genau definieren? (Konstruktionsproblem)
(2) Wie lässt sich Q axiomatisch eindeutig (bis auf die Namen der Elemente)
beschreiben? (Charakterisierungsproblem)
Diesen Fragen wollen wir nun nachgehen.

© Oliver Deiser Grundzüge der Höheren Mathematik


76 1. Abschnitt Grundlagen

Die Körperaxiome

Sei K eine Menge, für die eine Addition + und eine Multiplikation ⋅ erklärt ist.
Weiter seien 0, 1 ausgezeichnete Elemente von K. Dann heißt (K, +, ⋅, 0, 1) oder
kurz K ein Körper, falls für alle a, b, c P K die folgenden Körperaxiome gelten:

(K1) a + (b + c) = (a + b) + c Assoziativgesetz für +


(K2) a+0 = a Neutralität von 0 bzgl. +
(K3) ∃a′ a + a′ = 0 Existenz von Inversen für +
(K4) a+b = b+a Kommutativgesetz für +
(K5) a ⋅ (b ⋅ c) = (a ⋅ b) ⋅ c Assoziativgesetz für ⋅
(K6) a⋅1 = a Neutralität von 1 bzgl. ⋅
(K7) a ≠ 0 → ∃a′ a ⋅ a′ = 1 Existenz von Inversen für ⋅
(K8) a⋅b = b⋅a Kommutativgesetz für ⋅
(K9) a ⋅ (b + c) = (a ⋅ b) + (a ⋅ c) Distributivgesetz
(K10) 0 ≠ 1 Verschiedenheit von 0 und 1

Ist auf K eine Relation < erklärt, so heißt (K, +, ⋅, 0, 1, <) ein angeordneter Körper,
falls zusätzlich für alle a, b, c P K die folgenden Anordnungsaxiome gelten:

(K11) ¬ (a < a) Irreflexivität


(K12) a<b∧b<c → a<c Transitivität
(K13) a<b ∨ a=b ∨ b<a Vergleichbarkeit
(K14) a<b → a+c<b+c Addition und Ordnung
(K15) 0 < a ∧ 0 < b → 0 < a⋅b Multiplikation und Ordnung

Einführung einer Subtraktion und Division


Wir schreiben −a für das eindeutige a′ mit a + a′ = 0 und 1/a für das
eindeutige a′ mit a ⋅ a′ = 1 (falls a ≠ 0). Weiter setzen wir a − b = a + (−b) und
a/b = a ⋅ b−1 (für b ≠ 0).

Die fünfzehn Axiome sind die Quintessenz des Rechnens auf einer Zahlenge-
raden. Alle Rechengesetze lassen sich aus diesen Axiomen ableiten: Die Rechen-
regeln für Brüche, die binomischen Formeln, die Regeln für den Umgang mit
Ungleichungen usw. Das ist ein langwieriges Unterfangen, das wir hier nicht
durchführen wollen. Aber die Axiome gehören zum Kulturgut der Mathematik.
Sie sind zuerst von Richard Dedekind in der zweiten Hälfte des 19. Jahrhunderts
formuliert worden.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 77

Die rationalen Zahlen

Zu den wichtigsten Ergebnissen über das Zahlsystem gehört:

Satz (Charakterisierung der rationalen Zahlen)


Es gibt einen bis auf die Namen der Zahlen eindeutig bestimmten kleinsten
angeordneten Körper. Er umfasst die ganzen Zahlen und wir können jedes
seiner Elemente q in der Form q = a/b = a ⋅ b−1 mit a, b P Z, b ≠ 0, schreiben.

Beweisskizze
Wir definieren zunächst einen angeordneten Körper Q, indem wir auf der
Menge der Brüche die übliche Addition, Multiplikation und Ordnung
einführen (gemäß den Formeln in „Zahlen auf einer Linie“). Einen Bruch
können wir formal als Paar (a, b) P Z × (Z − { 0 }) auffassen, wobei wir Paare
(a, b), (c, d) mit ad = bc miteinander identifizieren (sodass zum Beispiel die
Paare (1, 2), (3, 6) und (−5, −10) jeweils den Bruch Einhalb repräsentieren).
Wir weisen nun nach, dass die Axiome (K1) − (K15) gelten. Zudem hat
jedes Element q des Körpers Q die gewünschte Form a/b = a ⋅ b−1 .
Ist nun K irgendein angeordneter Körper, so setzen wir
2 = 1 + 1, 3 = 1 + 1 + 1 = 2 + 1, …
wobei wir die 1 des Körpers verwenden. Aus den Anordnungsaxiomen
folgt, dass 0 < 1 < 2 < 3 < … Damit können wir N ⊆ K annehmen. Da
additive Inverse existieren, sind −1, −2, −3, … in K, sodass wir Z ⊆ K
annehmen können. Für alle a, b P Z mit b ≠ 0 ist a/b = a ⋅ b−1 in K definiert,
sodass wir annehmen können, dass der Körper Q in K enthalten ist.

Den im Wesentlichen eindeutigen Körper des Satzes nennen wir den ange-
ordneten Körper der rationalen Zahlen. Wir bezeichnen ihn mit (Q, +, ⋅, 0, 1, <)
oder kurz mit Q. Konkret können wir Q wie im Beweis definieren. Es gilt
Q = { a/b | a, b P Z, b ≠ 0 } mit a/b = a ⋅ b−1 .
Unsere axiomatische Beschreibung der rationalen Zahlen lautet in Kurzform:
Die rationalen Zahlen sind der kleinste angeordnete Körper.
Wie die rationalen Zahlen konstruiert werden ist im mathematischen Alltag un-
wesentlich (der Leser vergleiche die Konstruktion von N nach von Neumann).
Sobald die Existenz gesichert ist, sind die Struktureigenschaften entscheidend,
die in den Axiomen (K1) − (K15) zusammengefasst werden. Eine rationale Zahl
lässt sich damit ebenso gut als Paar ganzer Zahlen auffassen wie als Vielfaches ei-
nes Punktes 1/m auf einer Linie. Es gibt wie bei N eine ausgezeichnete Konstruk-
tion, bei der zum Beispiel 5/3 = 10/6 = { (a, b) P Z2 | b ≠ 0 und 5b = 3a } oder mit
gekürzten Repräsentanten 5/3 = 10/6 = (5, 3) P Z2 gilt.

© Oliver Deiser Grundzüge der Höheren Mathematik


78 1. Abschnitt Grundlagen

Die Existenz irrationaler Zahlen

Anschaulich scheinen die rationalen Zahlen eine beidseitig unendliche Linie


vollständig mit Punkten auszufüllen. Dass der Schein trügt, zeigt der folgende
Satz. Er zählt seit seiner Entdeckung durch die alten Griechen zu den wichtig-
sten Ergebnissen der Mathematik.

Satz (Irrationalität der Quadratwurzel aus 2)


Es gibt keine rationale Zahl q mit q2 = 2.

Wir zeigen vorab ein zahlentheoretisches Ergebnis:

Satz (Verdopplung von Quadratzahlen)


Das Doppelte einer Quadratzahl ist keine Quadratzahl, d .h:
Für a, b P N* gilt 2a2 ≠ b2 .

Beweis
Seien a, b P N*. Wir betrachten die Primfaktorzerlegungen von a und b:
a = 2d1 ⋅ 3d2 ⋅ 5d3 ⋅ … mit Exponenten di ≥ 0
b = 2e1 ⋅ 3e2 ⋅ 5e3 ⋅ … mit Exponenten ei ≥ 0
Dann gilt nach den Potenzregeln:
a2 = 22d1 ⋅ 32d2 ⋅ 52d3 ⋅ … (Verdopplung der Exponenten)
2
b = 2 2e1
⋅3 2e2
⋅5
2e3
⋅… (Verdopplung der Exponenten)
2 a2 = 22d1 + 1 ⋅ 32d2 ⋅ 52d3 ⋅ … (Erhöhung des 2-Exponenten um 1)
Die Zahl b hat einen geraden 2-Exponenten, die Zahl 2a2 einen ungera-
2

den. Aufgrund der Eindeutigkeit der Primfaktorzerlegung sind diese


Zahlen also verschieden.

Beweis der Irrationalität der Quadratwurzel aus 2


Annahme doch. Dann gibt es a, b P N* mit (b/a)2 = 2. Dann gilt
2a2 = b2 ,
im Widerspruch zum vorangehenden Satz.

Mit dem gleichen Argument lässt sich zeigen, dass die Zahlen 3, 5, 6 keine ra-
tionalen Quadratwurzeln besitzen. Allgemein gilt dies für alle natürlichen Zah-
len, die keine Quadratzahlen sind. Weiter ist die dritte Wurzel aus 2 irrational,
d.h. es gibt kein q P Q mit q3 = 2 (wir diskutieren dies in den Übungen). Mit wei-
tergehenden Argumenten lässt sich beweisen, dass auch prominente Zahlen wie
die Eulersche Zahl e und die Kreiszahl π irrational sind.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 79

Suprema und Infima

Unsere Überlegungen zeigen, dass die rationalen Zahlen kein gutes Modell
für ein Linearkontinuum bilden: Sie lassen wichtige Größen aus. Die Quadrat-
wurzel aus 2 ist nach dem Satz des Pythagoras die Länge der Diagonalen des Ein-
heitsquadrats, die Zahl π ist die Hälfte des Umfangs eines Einheitskreises. Diese
und viele weitere Größen liegen nicht in Q. Die Funktion f : Q → Q mit
f(q) = q2 − 2 für alle q P Q
besitzt keine Nullstelle in Q, obwohl sie stetig ist und sowohl negative als auch
positive Werte annimmt. Wir müssen also unsere Axiome erweitern, um die in Q
„fehlenden“ Zahlen sicherzustellen. Überraschenderweise ist dies durch ein ein-
ziges Axiom möglich. Wir definieren hierzu:

Definition (obere und untere Schranke)


Sei K ein angeordneter Körper, und seien X ⊆ K, s P K.
(1) s heißt obere Schranke von X, in Zeichen X ≤ s, falls x ≤ s für alle x P X.
(2) X heißt nach oben beschränkt, falls eine obere Schranke von X existiert.
(3) s heißt Supremum von X, in Zeichen s = sup(X), falls s eine obere
Schranke von X ist und für jede obere Schranke s′ von X gilt, dass s ≤ s′.
Analog sind die Begriffe untere Schranke, nach unten beschränkt und Infimum
(größte untere Schranke) definiert.

Wir betrachten einige Beispiele in Q. Dabei verwenden wir die Intervalle


[ a, b ] = { c | a ≤ c ≤ b }, [ a, b [ = { c | a ≤ c < b },
] a, b ] = { c | a < c ≤ b }, ] a, b [ = { c | a < c < b },
die sich für jede Ordnung definieren lassen.

Beispiele in den rationalen Zahlen


(1) Die Zahl 2 ist eine obere Schranke des Intervalls [ 0, 1 ]. Die Menge N
ist nach oben unbeschränkt und nach unten beschränkt (etwa durch 0).

(2) Für X = [ 0, 1 ], [ 0, 1 [, ] 0, 1 ], ] 0, 1 [ gilt jeweils inf(X) = 0, sup(X) = 1.


Ein Supremum oder Infimum kann der Menge angehören oder nicht.

(3) Für X = [ 0, 1 ] ∪ { 2 } gilt inf(X) = 0, sup(X) = 2.

(4) Für X = { 1/n | n P N* } gilt inf(X) = 0, sup(X) = 1.

(5) Für X = { q ≥ 0 | q2 ≤ 2 } ⊆ Q gilt inf(X) = 0 und X ≤ 2. X besitzt


aufgrund der Irrationalität der Wurzel aus 2 kein Supremum in Q.

© Oliver Deiser Grundzüge der Höheren Mathematik


80 1. Abschnitt Grundlagen

Anschauliche Bildung eines Supremums und Infimums


Wir betrachten eine beschränkte nichtleere Menge X in einem angeordne-
ten Körper K. Weitere seien s eine obere und t eine untere Schranke von X.

t X s

Wir versuchen nun, die Schranke s soweit nach links zu verschieben, bis sie
die Menge X berührt. Existiert dieser Berührpunkt, so ist er das Supremum
von X. Existiert er nicht, so können wir die Schranke immer noch weiter nach
links verschieben, ohne in die Menge X einzutreten. Analoges gilt für die Ver-
schiebung der unteren Schranke t nach rechts zur Bildung des Infimums.
Die Menge X ist im Allgemeinen kein Intervall. Durch Auffüllen der Menge
X können wir aber immer annehmen, dass ein Intervall vorliegt: Ist
Y = X ∪ { c P K | es gibt a, b P X mit a < c < b },
so ist die Menge Y ein Intervall (d. h. sie enthält mit je zwei Punkten a und b
alle Punkte zwischen a und b). Im Fall der Existenz gilt sup(X) = sup(Y) und
inf(X) = inf(Y).

Irrationalität der Wurzel aus 2


Die Irrationalität der Quadratwurzel aus 2 führt zu einer Lücke in Q (dem
Fehlen eines Supremums):
2

X
-3 -2 -1 1 2 3

-1

-2

Die Menge X = { q P Q | q2 < 2 } hat kein Supremum und kein Infimum in Q. Die
Funktion f : Q → Q mit f(q) = q2 − 2 hat keine Nullstellen.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 81

Das Vollständigkeitsaxiom

Wir können nun unser letztes Axiom formulieren, das die Lücken der rationa-
len Zahlen schließt:

(K16) Jede nichtleere und nach oben beschränkte lineare Vollständigkeit


Teilmenge von K besitzt ein Supremum in K.

Ein angeordneter Körper K heißt vollständig, falls er das Axiom (K16) erfüllt.
Man kann zeigen:

Satz (Charakterisierung der reellen Zahlen)


Es gibt einen bis auf die Namen der Elemente eindeutig bestimmten
vollständig angeordneten Körper.

Wir wählen einen im Wesentlichen eindeutigen derartigen Körper und be-


zeichnen ihn mit (R, +, ⋅, 0, 1, <) oder kurz R. Er heißt Körper der reellen Zahlen.
In R können wir wie in Q rechnen, es gelten alle vertrauten Rechenregeln. Der
Körper R enthält aber wesentlich mehr Zahlen als Q. Er hat sich als Modell für
ein arithmetisches Linearkontinuum und damit als Grundlage der Analysis be-
währt.
Könnte es nicht noch mehr Zahlen auf einer Linie geben? In der Geschichte
der Analysis ist häufig von infinitesimalen Größen die Rede. Die Disziplin wird
auch als Infinitesimalrechnung bezeichnet und sie verwendet bis heute Bezeich-
nung wie „dx“ und „dx/dy“ für unendlich kleine Größen. Das Vollständigkeits-
axiom schließt derartige Größen aus, denn es impliziert den folgenden Satz:

Satz (Archimedisches Axiom)


Seien x, y > 0. Dann gibt es ein n P N mit n x > y.

Bemerkung
Es gibt äquivalente Charakterisierungen der reellen Zahlen, in denen die
Aussage des Satzes als Axiom verwendet wird. Dies erklärt die traditionelle
Bezeichnung als Axiom.

Für den Spezialfall x = 1 zeigt das Archimedische Axiom, dass N nach oben
unbeschränkt in R ist. Damit gibt es keine unendlich kleinen positiven Größen,
d. h. Zahlen x mit 0 < x < 1/n für alle n P N*. Denn sonst wäre n < 1/x für alle
n ≥ 1, also 1/x eine obere Schranke für N. Es gilt also inf({ 1/n | n ≥ 1 }) = 0.
Es ist eine gewisse Ironie der Geschichte, dass die Infinitesimalrechnung ohne
infinitesimale Größen auskommt. Der Körper R genügt. Im 20. Jahrhundert ist
es gelungen, nichtarchimedische Körper zu konstruieren, in denen sich eine
echte infinitesimale Analysis betreiben lässt (die sog. Nichtstandard-Analysis). Das
lineare Vollständigkeitsaxiom gilt in diesen Körpern nicht.

© Oliver Deiser Grundzüge der Höheren Mathematik


82 1. Abschnitt Grundlagen

Endliche und unendliche Dezimalbrüche

Als Anwendung des Vollständigkeitsaxioms besprechen wir unendliche Dezi-


malbrüche. Zunächst erinnern wir an:

Definition (endlicher Dezimalbruch)


Seien n P N und d1 , …, dk P { 0, …, 9 }. Dann definieren wir den endlichen
Dezimalbruch n,d1 … dk P Q durch
d1 d2 dk
n,d1 … dk = n + + + … + .
10 100 10k

Bei festem n sind alle Dezimalbrüche der Form n, d1 …dk nach oben be-
schränkt durch n + 1. Damit können wir definieren:

Definition (unendlicher Dezimalbruch)


Seien n P N und d1 , d2 , d3 , … eine unendliche Folge mit di P { 0, …, 9 } für
alle i. Dann definieren wir den unendlichen Dezimalbruch n,d1 d2 d3 … P R
durch
n,d1 d2 d3 … = sup k ≥ 1 n,d1 … dk ( = sup({ n,d1 … dk | k ≥ 1 })).

Ein unendlicher Dezimalbruch ist nach Definition das Supremum einer be-
stimmten beschränkten nichtleeren Menge rationaler Zahlen. Dieses Supre-
mum kann rational sein oder nicht. Es gilt:

Satz (Charakterisierung der rationalen Zahlen über Dezimalbrüche)


Ein unendlicher Dezimalbruch n,d1 d2 d3 … ist genau dann rational, wenn
die Folge d1 , d2 , d3 , … seiner Dezimalziffern periodisch ist, d. h. es gibt ein
k ≥ 0 und e1 , …, em mit
n,d1 d2 d3 … = n,d1 …dk e1 …em = n,d1 …dk e1 …em e1 …em e1 …em …

Damit lassen sich spielerisch irrationale Zahlen konstruieren:

Beispiele
Die folgenden reellen Zahlen sind nichtperiodisch und damit irrational:
(1) 0,101001000100001… mit immer größere werden Nullblöcken
(2) 0,01001100011100001111…
(3) 0,123456789112233445566778899…

Erst die genaue Definition eines unendlichen Dezimalbruchs erlaubt es, Aus-
sagen wie 0,999… = 1 zu erklären und zu beweisen (vgl. die Übungen).

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 83

Unendliche Dezimaldarstellungen

Wir haben gesehen, dass jeder unendliche Dezimalbruch eine reelle Zahl defi-
niert. Umgekehrt gilt:

Satz (reelle Zahlen als unendliche Dezimalbrüche)


Sei x P R mit x ≥ 0. Dann gibt es ein n P N und eine Folge d1 , d2 , d3 , … mit
di P { 0, …, 9 } für alle i ≥ 1 derart, dass
x = n,d1 d2 d3 ….

Beweisskizze
Sei n die größte natürliche Zahl kleinergleich x (d. h. n =  x  ). Wir
definieren d1 , d2 , d3 , … rekursiv durch Bestapproximation von unten:
d1 = „das größte d P { 0, …, 9 } mit n, d ≤ x“,
dk + 1 = „das größte d P { 0, …, 9 } mit n, d1 … dk d ≤ x“ für alle k ≥ 1.
Dann gilt x = supk ≥ 1 n, d1 … dk = n,d1 d2 d3 …

Wir nennen x = n, d1 d2 d3 … eine (unendliche) Dezimaldarstellung von x. Nach


dem Satz gilt:
R = { ± n,d1 d2 d3 … | n P N, di P { 0, …, 9 } für alle i ≥ 1 }.
Damit haben wir die vertraute Form der reellen Zahlen wiedergefunden. Wich-
tig ist dabei:

Satz (Ein- oder Zweideutigkeit der Dezimaldarstellung)


Sei x P R mit x ≥ 0. Dann gilt:
(1) Ist x irrational, so ist die Dezimaldarstellung von x eindeutig.
(2) Ist x rational, so gibt es genau eine oder genau zwei Dezimaldarstellun-
gen von x. Gibt es zwei Darstellungen, so hat die eine die Periode 9
und die andere die Periode 0 (sodass x ein endlicher Dezimalbruch ist).
(3) Ist x ≠ 0 und x = n/m gekürzt mit m ≥ 1, so hat x genau dann zwei
unendliche Dezimaldarstellungen, wenn m nur die Primfaktoren 2 und
5 besitzt, also von der Form 2d 5e ist mit Exponenten d,e ≥ 0.

Beispiele
(1) Die Darstellung der irrationalen Zahl 0,0100100010000… ist eindeutig.
(2) Die Darstellung 0,090909… der rationalen Zahl 1/11 ist eindeutig.
(3) Die rationale Zahl 1/4 besitzt die beiden Dezimaldarstellungen
1/4 = 0,25 = 0,25000…, 1/4 = 0,25 = 0,24999…

© Oliver Deiser Grundzüge der Höheren Mathematik


84 1. Abschnitt Grundlagen

Exkurs: Endliche Körper

Q und R sind unendliche Körper. Die Körperaxiome (K1) − (K10) lassen sich
erstaunlicherweise bereits mit zwei Zahlen erfüllen: Setzen wir
0+0 = 0 0+1 = 1 1+0 = 1 1+1 = 0
0⋅0 = 0 0 ⋅ 1 = 0 1⋅0 = 0 1 ⋅ 1 = 1,
so erfüllt die Menge { 0, 1 } die Körperaxiome (K1) − (K10). Es gibt also einen
Körper mit genau 2 Elementen. Allgemeiner gilt dies für jede Primzahl p mit der
Menge { 0, …, p − 1 } und den Operationen
a + b = „der Rest r P { 0, …, π − 1 } von a + b bei Division durch p“,
a ⋅ b = „der Rest r P { 0, …, p − 1 } von a ⋅ b bei Division durch p“.
Die so entstehenden Körper heißen die Restklassenkörper modulo p (wobei wir hier
die üblichen Restklassen der Einfachheit halber durch Reste in { 0, …, p − 1 } er-
setzt haben).

Beispiele
(1) Für p = 2 fallen die Rest-Operationen auf { 0, 1 } mit denen der obigen
Tabelle zusammen. Es gilt zum Beispiel 1 + 1 = 0, da die Zahl 2 den
Rest 0 bei Division durch 2 besitzt.
(2) Für die Primzahl p = 7 gilt zum Beispiel 3 ⋅ 5 = 1, da 3 ⋅ 5 = 15 und 15
den Rest 1 bei Division durch 7 besitzt. In diesem Zahlkörper sind also
die 3 und die 5 invers zueinander, d. h. es gilt 3−1 = 5 und 5−1 = 3.
Weiter gilt beispielsweise
3 ⋅ 3 = 2, 3 ⋅ 6 = 4, 4 ⋅ 6 = 3, 3 + 3 = 6, 4 + 4 = 1, 5 + 5 = 3.
(3) Es ist wesentlich, dass p eine Primzahl ist. Auf der Menge { 0, …, 5 }
mit Resten bei Division durch 6 ergeben die Operationen keinen
Körper. Für die 2 gibt es beispielsweise kein Inverses, da
2 ⋅ 0 = 0, 2 ⋅ 1 = 2, 2 ⋅ 2 = 4, 2 ⋅ 3 = 0, 2 ⋅ 4 = 2, 2 ⋅ 5 = 4.

Das „Rechnen mit Resten“ ist zuerst von Gauß systematisch untersucht wor-
den. Es ist heute ein klassischer Bestandteil der Zahlentheorie.
Auf den Restklassenkörpern können wir keine Ordnung mit den Eigenschaf-
ten (K11) − (K15) einführen. Für p = 2 gilt 1 + 1 = 0, für p = 3 gilt 1 + 1 + 1 = 0 usw.
Dieses Aufsummieren der 1 zur 0 ist mit den Anordnungsaxiomen nicht verein-
bar, da diese implizieren, dass
0 < 1 < 1+1 < 1+1+1 < …

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 85

Übungen

Übung 1
Für alle x P R definieren wir rekursiv:
x0 = 1, xn + 1 = xn ⋅ x für alle n P N.
Zeigen Sie mit Hilfe vollständiger Induktion:
Für alle x P R und alle natürlichen Zahlen n, m ≥ 0 gilt:
(a) xm ⋅ xn = xm + n
(b) (xm )n = xm n

Übung 2
Welche der folgenden Aussagen sind für alle reelle Zahlen x, y gültig und
welche nicht? Begründen Sie Ihre Antworten.
(a) Sind x, y rational, so ist x ⋅ y rational.
(b) Sind x, y irrational, so ist x ⋅ y irrational.
(c) Sind x, y irrational, so ist x + y irrational.
(d) Ist x rational und y irrational, so ist x ⋅ y irrational.

Übung 3
Zeigen Sie, dass 3 £2 irrational ist.
[ Hinweis: Orientieren Sie sich an unserem Beweis der Irrationalität von
£2.]

Übung 4
Betrachten Sie die folgende Aussage:
„0,999… kann nicht gleich 1 sein, da zur 1 immer noch etwas fehlt.“
Welche Fehlvorstellung kommt hier zum Ausdruck? Wie lässt sich diese
Vorstellung korrigieren?

© Oliver Deiser Grundzüge der Höheren Mathematik


86 1. Abschnitt Grundlagen

Lösungen zu den Übungen

Übung 1
Für alle x P R definieren wir rekursiv:
x0 = 1, xn + 1 = xn ⋅ x für alle n P N.
Zeigen Sie mit Hilfe vollständiger Induktion:
Für alle x P R und alle natürlichen Zahlen n, m ≥ 0 gilt:
(a) xm ⋅ xn = xm + n
(b) (xm )n = xm n

Lösung zu Übung 1
zu (a):
Sei m P N beliebig. Wir zeigen durch vollständige Induktion über n ≥ 0:
(+) Für alle x P R gilt xm ⋅ xn = xm + n .
Induktionsanfang n = 0: Sei x P R. Dann gilt
xm x0 = xm 1 = xm = xm + 0 .
Induktionsschritt von n nach n + 1: Es gelte
xm xn = xm + n (Induktionsvoraussetzung).
Dann gilt nach Definition der Potenz und den Assoziativgesetzen für
die Multiplikation und Addition:
xm xn + 1 = xm (xn x) = (xm xn ) x = I. V. xm + n x = x(m + n) + 1 = xm + (n + 1) .

zu (b):
Sei m P N beliebig. Wir zeigen durch vollständige Induktion über n ≥ 0:
(++) Für alle x P R gilt (xm )n = xm n .
Induktionsanfang n = 0: Sei x P R. Dann gilt
(xm )0 = 1 = x0 = xm 0 .
Induktionsschritt von n nach n + 1: Es gelte
(xm )n = xm n (Induktionsvoraussetzung).
Dann gilt nach Definition der Potenz und (a):
(xm )n + 1 = (xm )n xm = I.V. (xm n ) xm = (a) xm n + m x = xm (n + 1) .

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 87

Übung 2
Welche der folgenden Aussagen sind für alle reelle Zahlen x, y gültig und
welche nicht? Begründen Sie Ihre Antworten.
(a) Sind x, y rational, so ist x ⋅ y rational.
(b) Sind x, y irrational, so ist x ⋅ y irrational.
(c) Sind x, y irrational, so ist x + y irrational.
(d) Ist x rational und y irrational, so ist x ⋅ y irrational.

Lösung zu Übung 2
zu (a):
Die Aussage ist gültig. Ist x = a/b und y = c/d mit a, c P Z und
b, d P Z*, so gilt x y = (ac)/(bd) mit ac P Z und bd P Z*.

zu (b):
Die Aussage ist nicht gültig. Für ein Gegenbeispiel setzen wir
x = y = £2.
Dann sind x und y irrational, aber x y ist rational, da x y = 2.

zu (c):
Die Aussage ist nicht gültig. Für ein Gegenbeispiel setzen wir
x = £2, y = −£2.
Dann sind x und y irrational, aber x + y ist rational, da x + y = 0.

zu (d):
Die Aussage ist nicht gültig. Für ein Gegenbeispiel setzen wir
x = 0, y = £2.
Dann ist x rational und y irrational, aber x y ist rational, da x y = 0.
Bemerkung
Fordern wir in der Aussage x ≠ 0, so ist die Aussage gültig. Denn sind
x = a/b mit a, b P Z* und y irrational, so ist
a
xy = y.
b
Wegen a ≠ 0 ist dann
b
y = (x y).
a
Wäre also das Produkt x y rational, so wäre nach Teil (a) auch y
rational. Dies zeigt:
Ist x rational, x ≠ 0, und y irrational, so ist x ⋅ y irrational.

© Oliver Deiser Grundzüge der Höheren Mathematik


88 1. Abschnitt Grundlagen

Übung 3
Zeigen Sie, dass 3 £2 irrational ist.
[ Hinweis: Orientieren Sie sich an unserem Beweis der Irrationalität von
£2.]

Lösung zu Übung 3
Wir zeigen vorab: Das Doppelte einer Kubikzahl ist keine Kubikzahl, d .h.:
(+) Für alle a, b P N* gilt 2a3 ≠ b3 .
Beweis von (+):
Seien a, b P N* mit den Primfaktorzerlegungen
a = 2d1 ⋅ 3d2 ⋅ 5d3 ⋅ … mit Exponenten di ≥ 0
b = 2e1 ⋅ 3e2 ⋅ 5e3 ⋅ … mit Exponenten ei ≥ 0
Dann gilt nach den Potenzregeln:
a3 = 23d1 ⋅ 33d2 ⋅ 53d3 ⋅ … (Verdreifachung der Exponenten)
b3 = 23e1 ⋅ 33e2 ⋅ 53e3 ⋅ … (Verdreifachung der Exponenten)
2 a3 = 23d1 + 1 ⋅ 32d2 ⋅ 53d3 ⋅ … (Erhöhung des 2-Exponenten um 1)
Der 2-Exponent von b3 ist durch 3 teilbar, der 2-Exponent von 2a3 hat
den Rest 1 bei Division durch 3. Damit sind diese Exponenten verschie-
den. Nach der Eindeutigkeit der Primfaktorzerlegung gilt also 2a3 ≠ b3 .

Annahme, die reelle Zahl 3 £2 ist rational. Dann gibt es a, b P N* mit


3 b
£2 = .
a
Nach Definition der dritten Wurzel gilt 2a3 = b3 , im Widerspruch zu (+).

Bemerkung
Die Argumentation lässt sich vielfach variieren. Sie zeigt zum Beispiel,
dass die Wurzeln
4 5 3 5 6
£2, £2, £3, £3, £6, £5

irrational sind. Allgemein zeigt sie für alle natürlichen Zahlen n, m ≥ 2:

Ist n keine m-te Potenz einer natürlichen Zahl, so ist m £n irrational.

Der Leser überlege sich explizit, an welcher Stelle der Beweis für
Zahlen wie £9 oder 3 £27 scheitert.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Rationale und reelle Zahlen 89

Übung 4
Betrachten Sie die folgende Aussage:
„0,999… kann nicht gleich 1 sein, da zur 1 immer noch etwas fehlt.“
Welche Fehlvorstellung kommt hier zum Ausdruck? Wie lässt sich diese
Vorstellung korrigieren?

Lösung zu Übung 4
Die Formulierung „immer noch etwas fehlt“ beruht auf der Fehlvorstel-
lung, dass die reelle Zahl 0,999… nicht „fertig“ ist sondern in einem
zeitlichen oder räumlichen Sinne wächst und die 1 deswegen nie ganz
erreicht. Um diese Vorstellung zu korrigieren, betrachten wir die Defini-
tion der Zahl 0,999… Nach unserer Definition eines unendlichen Dezimal-
bruchs gilt
0,999… = supn ≥ 1 0,9…9 (mit n Ziffern 9)
Das Supremum auf der rechten Seite ist gleich 1 und damit ist der
unendliche Dezimalbruch 0,999… identisch mit 1.

Bemerkung 1: Dass das Supremum der Menge


X = { 0,9…9 (mit n Ziffern 9) | n ≥ 1 } = { 1 − 1/10n | n ≥ 1 }
gleich 1 ist, lässt sich so einsehen: Die 1 ist eine obere Schranke von X,
da alle endlichen Dezimalbrüche 0,9…9 kleiner als 1 sind. Ist nun
s < 1, so ist s keine obere Schranke von X, da s < 0,9…9 gilt, wenn wir
hinreichend viele Neunen bilden. Dies zeigt, dass sup(X) = 1. Sehr klar
wird der Nachweis durch die Rechnung
0,999… = supn ≥ 1 (1 − 1/10n ) = 1 − infn ≥ 1 1/10n = 1 − 0 = 1,
wobei für infn ≥ 1 1/10n = 0 das Archimedische Axiom verwendet wird.

Bemerkung 2: Gleichwertig lässt sich der Grenzwertbegriff verwenden, da


aufgrund der Monotonie der endlichen Dezimalbrüche gilt, dass
n, d1 d2 d3 … = supk ≥ 1 n,d1 …dk = limk →∞ n,d1 … dk .
Wir kommen im zweiten Abschnitt darauf zurück.

Wie immer ist es in der Mathematik wichtig, genau zu fragen, wie die
Objekte, die wir untersuchen, definiert sind. Anschauungen sind bedeut-
sam, aber auf Definitionen beruhende Beweise sind die letzte Instanz.
Genaue Definitionen, präzise formulierte Sätze und entsprechende Beweise
helfen dem Verständnis. Jeder Versuch, formale Genauigkeit zu vermeiden,
erweist sich in der Mathematik früher oder später als falscher Freund. Wir
können mit Suprema und Grenzwerten rechnen, ohne genau zu wissen, was
ein Supremum oder Grenzwert ist. Aber ein begriffliches Verständnispro-
blem lässt sich nicht klären, solange ein Nebel über dem Begriff liegt.

© Oliver Deiser Grundzüge der Höheren Mathematik


6. Komplexe Zahlen

Wir erweitern den Körper R der reellen Zahlen zum Körper C der komplexen
Zahlen. Völlig neu und auf den ersten Blick vielleicht irritierend ist die Exis-
tenz einer imaginären Einheit i mit der Eigenschaft i 2 = −1. Die komplexen
Zahlen lassen sich überraschend einfach und anschaulich als Zahlenebene ein-
führen, sodass C = R × R = R2 . In der Zahlenebene entspricht die Addition der
Vektoraddition, die Multiplikation involviert Drehungen und die imaginäre
Einheit i ist der zweite Einheitsvektor (0, 1). Nach einer Zusammenstellung
grundlegender Eigenschaften des neuen Zahlkörpers formulieren wir den Fun-
damentalsatz der Algebra und illustrieren ihn durch die komplexen Einheits-
wurzeln. Den Abschluss bildet ein visueller Exkurs über die graphische Dar-
stellung komplexer Funktion mit Hilfe von Farbdiagrammen.

Schlüsselbegriffe
Körper der komplexen Zahlen
imaginäre Einheit
geometrische Multiplikationsregel
Realteil, Imaginärteil, komplexe Konjugation
Polarkoordinaten
Fundamentalsatz der Algebra
komplexe Einheitswurzeln

© Oliver Deiser Grundzüge der Höheren Mathematik


92 1. Abschnitt Grundlagen

Die reelle Ebene als Körper

Die reellen Zahlen R bilden einen Körper. Wir fragen, ob wir auch die Ebene
R2 = R × R = { (x, y) | x,y P R } mit einer Addition und Multiplikation so ausstat-
ten können, dass ein Körper entsteht.

Die Addition
Als Addition bietet sich die Vektoraddition an. Setzen wir
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) für alle (x1 , y1 ), (x2 , y2 ) P R2 ,
so gelten die Axiome (K1) − (K4), wenn wir als neutrales Element der
Addition den Nullvektor 0 = (0, 0) wählen.

Die Multiplikation
Die Multiplikation ist schwieriger zu definieren. Ein guter Ausgangspunkt
ist die skalare Multiplikation eines Vektors der Ebene mit einer reellen
Zahl. Wir identifizieren x P R mit (x, 0) P R2 und fordern
(x, 0) ⋅ (x1 , y1 ) = x (x1 , y1 ) = (x x1 , x y1 ) für alle x P R, (x1 , y1 ) P R2 .
Dann gilt für alle (x, y) P R2 :
(x, y) = (x, 0) + (0, y) = x + y (0, 1) = x + y e2 ,
mit dem zweiten kanonischen Basisvektor e2 = (0, 1). Traditionell wird
dieser Vektor in diesem Kontext mit i bezeichnet. Mit
i = e2 = (0, 1)
ergibt sich unter Verwendung des Kommutativgesetzes, dass
(x, y) = x + y e2 = x + y i = x + i y für alle (x, y) P R2 .
Aufgrund des Distributivgesetzes muss für alle (x1 , y1 ), (x2 , y2 ) P R2 gelten:
(x1 , y1 ) ⋅ (x2 , y2 ) = (x1 + i y1 ) ⋅ (x2 + i y2 )
= x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2
= x1 x2 + i2 y1 y2 + i (x1 y2 + y1 x2 ).
Diese Rechnung zeigt, dass die gesuchte Fortsetzung der Skalarmultiplika-
tion vollständig durch den Wert i2 = (0, 1) ⋅ (0, 1) bestimmt ist. Die
natürlichen Kandidaten sind i2 = 1 und i2 = −1. Die Wahl von i2 = −1
erweist sich (wie man nachrechnen muss!) als geeignet. Damit erhalten wir:
(x1 , y1 ) ⋅ (x2 , y2 ) = x1 x2 − y1 y2 + i (x1 y2 + x2 y1 ) = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ).

Diese Überlegungen motivieren die folgende Definition, die zu den bedeut-


samsten Konstruktionen der Mathematik gehört:

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 93

Der Körper der komplexen Zahlen

Definition (komplexe Zahlen, imaginäre Einheit)


Wir setzen
C = R2 = { (x, y) | x, y P R }.
Jedes Element z von C heißt eine komplexe Zahl. Für alle komplexen Zahlen
z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir:
z1 + z2 = (x1 + x2 , y1 + y2 ), (komplexe Addition)
z1 ⋅ z2 = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ), (komplexe Multiplikation)
mit der reellen Addition und Multiplikation auf der rechten Seite. Weiter
setzen wir 0 = (0, 0), 1 = (1, 0), i = (0, 1). Die komplexe Zahl i heißt die
imaginäre Einheit.

Wir nennen C auch die Gaußsche Zahlenebene. Jede komplexe Zahl ist ein Ele-
ment der Ebene. Wir sind es gewohnt, Elemente der Ebene als Punkte oder Vek-
toren anzusehen. Dies bleibt erhalten, aber nun kommt ein neuer wesentlicher
Aspekt hinzu: Die Elemente der Ebene sind nun auch Zahlen, mit denen wir so
rechnen können wie mit rationalen und reellen Zahlen. Der Nachweis der Kör-
peraxiome (K1) − (K10) zeigt:

Satz (Körper der komplexen Zahlen)


(C, +, ⋅, 0, 1) ist ein Körper.

Durch unsere Identifikation von x P R mit (x, 0) P C ist jede reelle Zahl auch eine
komplexe Zahl. Damit gilt
N ⊆ Z ⊆ Q ⊆ R ⊆ C
Wir haben das Zahlsystem also noch einmal erweitert. Die alles dominierende
neue Zahl ist die imaginäre Einheit mit ihrer Eigenschaft
i2 = −1.
Das ist vollkommen neu. In den reellen Zahlen sind alle Quadrate größergleich
Null. In den komplexen Zahlen hat die Gleichung z2 = −1 zwei Lösungen, näm-
lich i und −i. In diesem Sinne gilt
i = £−1.
Diese Lesart ist der Grund für die seltsame Wortwahl imaginär. Eine Wurzel aus
−1 galt lange als eine nur vorgestellte und damit imaginäre Größe. Die Mathe-
matiker hatten entdeckt, dass sie mit £−1 Gleichungen dritten und höheren
Grades lösen konnten. Erst Gauß hat diese Zahlen entmystifiziert. Als Elemente
der Ebene, die wir vor uns sehen können, sind sie ebenso real wie R.

© Oliver Deiser Grundzüge der Höheren Mathematik


94 1. Abschnitt Grundlagen

Die geometrische Deutung der Multiplikation

Die Addition zweier komplexer Zahlen z1 und z2 hat als Vektoraddition eine
sehr anschauliche Bedeutung: Wir fügen z2 an den Vektor z1 an und erhalten so
die Summe z1 + z2 . Die Multiplikation
z1 ⋅ z2 = (x1 x2 − y1 y2 , x1 y2 + y1 x2 )
ist zunächst nicht besonders anschaulich. Überraschenderweise besitzt auch sie
eine einfache geometrische Interpretation. Hierzu beobachten wir, dass
i 2 = i ⋅ i = −1, i3 = (−1) ⋅ i = −i, i4 = (−i) ⋅ i = 1.
Die Potenzen von i durchlaufen also die Einheitsvektoren auf den Koordinaten-
achsen gegen den Uhrzeigersinn. Allgemein gilt für alle (x, y) P C:
(x, y) ⋅ i = (x, y) ⋅ (0, 1) = (x ⋅ 0 − y ⋅ 1, x ⋅ 1 + y ⋅ 0) = (−y, x).
Der Vektor (−y, x) ist der um den Winkel π/2 gegen den Uhrzeigersinn gedrehte
Vektor (x, y). Für alle komplexen Zahlen z gilt also:
i z = z i = „die Drehung von z um π/2 gegen den Uhrzeigersinn“.
Damit haben wir den Drehaspekt der komplexen Multiplikation entdeckt. Da
die Skalarmultiplikation erhalten bleibt, ist folgende allgemeine Regel vielleicht
nicht mehr überraschend:

Satz (Geometrische Multiplikationsregel)


Zwei komplexe Zahlen werden als Vektoren der Ebene multipliziert, indem
ihre Längen multipliziert und ihre (mit der positiven x-Achse eingeschlos-
senen und gegen den Uhrzeigersinn gemessenen) Winkel addiert werden.

Beweis
Auf R2 definieren wir + als Vektoraddition und eine Multiplikation p gemäß
der Multiplikationsregel des Satzes. Die Körperaxiome lassen sich leicht
nachweisen, sodass (R2 , +, p, 0, 1) ein Körper ist. Für alle x P R und z P R2
ist x p z die Skalarmultiplikation von z mit x. Weiter gilt i2 = i p i = −1. Nach
unseren obigen Überlegungen ist ein Körper durch diese Eigenschaften
eindeutig bestimmt, sodass unser Körper identisch mit C ist. Insbesondere
ist also p die komplexe Multiplikation.

Der Beweis ist ein Paradebeispiel für die Stärke einer Charakterisierung: Sie
erlaubt uns, zwei Operationen als gleich zu erkennen. Die komplexen Zahlen
lassen sich durch „übliche Rechenregeln plus i2 = −1“ charakterisieren. Sowohl
die algebraische als auch die geometrische Multiplikation erfüllen diese Eigen-
schaft, sodass sie zusammenfallen. Ohne diese Hilfe ist eine trigonometrische
Gymnastik nötig, um die geometrische Multiplikationsregel zu beweisen.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 95

z1

z2

-4 -2 2 4

-2
z1 z2

-4

Die Multiplikation komplexer Zahlen:


Wir multiplizieren die Längen und addieren die Winkel

Eigenschaften der komplexen Multiplikation


(1) Liegen z und w auf dem Einheitskreis, so liegt auch das Produkt z w
auf dem Einheitskreis.
(2) Zur Bildung von z2 quadrieren wir die Länge von z und verdoppeln
den Winkel. Analoges gilt für z3 , z4 , …, zn , …
(3) Sind alle Komponenten von z und w ganzzahlig, so gilt dies auch für
für das Produkt z w. (Dies ergibt sich direkt aus der algebraischen
Definition des Produkts, für die geometrische Multiplikationsregel ist
diese Eigenschaften nicht unmittelbar klar.) Eine analoge Aussage gilt
für rationale Komponenten.
(4) Das Produkt zweier komplexer Zahlen im ersten Quadranten liegt im
ersten oder zweiten Quadranten. (Dies lässt sich sowohl aus der
algebraischen Definition als auch aus der geometrischen Multiplikati-
onsregel ablesen.)
(5) Ein Produkt z w ist genau dann reell, wenn sich die Winkel von z und
w zu 0 oder π addieren.

© Oliver Deiser Grundzüge der Höheren Mathematik


96 1. Abschnitt Grundlagen

Imaginärteil, Realteil und Betrag

Definition (Real- und Imaginärteil, rein imaginär)


Sei z = (x, y) P C. Dann setzen wir:
Re(z) = x, Im(z) = y.
Die reellen Zahlen Re(z) und Im(z) heißen der Realteil bzw. der Imaginärteil
von z. Eine komplexe Zahl z heißt rein imaginär, falls Re(z) = 0.

Der Realteil und der Imaginärteil einer komplexen Zahl sind Elemente von R.
Für alle z = (x, y) P C gilt
z = (x, y) = x + i y = Re(z) + i Im(z) (Standarddarstellung)

Beispiele
(1) Sei z = (2, −1) = 2 − i. Dann gilt Re(z) = 2 und Im(z) = −1.
(2) Es gilt Re(i) = 0 und Im(i) = 1.
(3) Die komplexen Zahlen z mit Re(z) = Im(z) sind genau die Zahlen auf
der Winkelhalbierende der Ebene.

Definition (Betrag einer komplexen Zahl)


Sei z P C. Dann setzen wir

|z| = £Re(z)2 + Im(z)2.


Die reelle Zahl |z| heißt der Betrag von z.

Der Betrag einer komplexen Zahl z ist die Euklidische Länge des Vektors z.
Die Menge { z P C | |z| = 1 } ist der Einheitskreis der Ebene. Es gelten die fol-
genden Eigenschaften:

Satz (Eigenschaften des Betrags)


Für alle z, w P C gilt:
(a) |z| = 0 genau dann, wenn z = 0,
(b) |z + w| ≤ |z| + |w|, (Dreiecksungleichung)
(c) |z w| = |z| |w|. (Produktregel)

Die Dreiecksungleichung entspricht der geometrischen Tatsache, dass die


Diagonale eines Parallelogramms kleinergleich der Summe der Längen zweier
benachbarter Seiten ist. Die dritte Eigenschaft folgt direkt aus der geometri-
schen Multiplikationsregel. Denn nach dieser Regel ist die Länge eines Produkts
das Produkt der Längen der Faktoren.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 97

Die komplexe Konjugation

Eine sehr nützliche und häufig verwendete Funktion auf C ist:

Definition (komplexe Konjugation)


Sei z P C. Dann setzen wir:
z = z* = Re(z) − i Im(z).
Die komplexe Zahl z heißt die (komplex) Konjugierte von z.

Geometrisch können wir die komplexe Konjugation als Spiegelung des Vek-
tors z an der x-Achse auffassen.

Beispiele
(1) Es gilt 2 + i3 = 2 − i 3. In Vektornotation gilt (2, 3) = (2, −3).
(2) Es gilt z = z genau dann, wenn z reell ist, d. h. wenn Im(z) = 0.
(3) Es gilt i = −i.

Nützlich sind:

Satz (Konjugationsformeln)
Für alle z, w P C gilt:

(a) z + w = z + w, zw = z w

(b) |z|2 = z ⋅ z
z + z z − z
(c) Re(z) = , Im(z) =
2 2i
z
(d) z−1 = , falls z ≠ 0 (Inversenformel)
|z|2

Die Aussagen lassen sich sowohl algebraisch als auch mit Hilfe der geometri-
schen Multiplikationsregel einsehen. Wir diskutieren dies in den Übungen.

Beispiele
(1) Es gilt i−1 = −i. Dies lässt sich durch die Formel (d) mit i = − i und
|i| = 1 oder natürlich durch Nachrechnen einsehen: i ⋅ (−i) = − i2 = 1.
(2) Für z = 1 + i 2 gilt |z|2 = 1 + 4 = 5. Damit gilt nach der Inversenformel:
1 2
z−1 = − i .
5 5

© Oliver Deiser Grundzüge der Höheren Mathematik


98 1. Abschnitt Grundlagen

Polarkoordinaten

Ebene Polarkoordinaten
Einen Vektor der Ebene können wir in Polarkoordinaten der Form (r, ϕ)
angeben. Die erste Koordinate gibt seine euklidische Länge an, die zweite
den modulo 2π eindeutigen Winkel, den der Vektor mit der x-Achse
einschließt (gegen den Uhrzeigersinn). Dem Nullpunkt werden oft keine
Polarkoordinaten zugewiesen, wir können aber (0, 0) zulassen. Zur
Verdeutlichung schreiben wir (r, ϕ)polar statt (r, ϕ). Wir identifizieren
Vielfache von 2π, sodass (r, ϕ)polar = (r, ϕ + k2π)polar für alle k P Z.

Beispiele
(1) (1, 1) = (£2, π/4)polar
(2) (0, −3) = (3, 3π/2)polar = (3, −π/2)polar

Umrechnung der Koordinaten


Kartesische Koordinaten (x, y) lassen sich in Polarkoordinaten (r, ϕ) durch
r = £x2 + y2 , ϕ = arctan2 (x, y)
umrechnen. Dabei ist arctan2 : R2 → ] −π, π ] eine zweistellige Version des
Arkustangens, die den Quadranten von (x, y) berücksichtigt. Es gilt:

x>0

{
arctan(y/x) falls
arctan(y/x) + sgn(y) π falls x < 0, y ≠ 0
arctan2 (x, y) =
π falls x < 0, y = 0
sgn(y) π/2 falls x = 0, y ≠ 0.

Dabei gibt sgn(y) P { −1, 0, 1 } das Vorzeichen von y an. Umgekehrt führen
die Formeln
x = r cos(ϕ), y = r sin(ϕ)
von Polarkoordinaten (r, ϕ) zu kartesischen Koordinaten (x, y).

Für eine komplexe Zahl z = (r, ϕ)polar heißt der Winkel ϕ auch das Argument
von z, in Zeichen ϕ = arg(z). Modulo 2π ist also arg(z) = arctan2 (Re(z), Im(z)).

Geometrische Multiplikationsregel in Polarkoordinaten


Für alle z1 , z2 P C gilt
z1 ⋅ z2 = ( |z1 | |z2 |, arg(z1 ) + arg(z2 ) )polar .

In Polarkoordinaten gilt für z = (r, ϕ) zum Beispiel


i z = (1, π/2) ⋅ (r, ϕ) = (r, ϕ + π/2) (Drehung um π/2)

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 99

Der Fundamentalsatz der Algebra

In den reellen Zahlen besitzt die Gleichung x2 + 1 = 0 keine Lösung. In den


komplexen Zahlen hat z2 + 1 = 0 die Lösungen z1/2 = ± i. Allgemein besitzt jede
quadratische Gleichung
a z2 + b z + c = 0
mit Koeffizienten a, b, c P C, a ≠ 0, immer zwei (nicht notwendig verschiedene)
komplexe Lösungen. Sie lassen sich mit der Mitternachtsformel berechnen.
Diese Formel lässt sich durch quadratische Ergänzung beweisen und hierfür
werden nur die Körperaxiome verwendet. Damit gilt also

− b ± £b2 − 4ac
z1,2 = ,
2a
wobei wir hier unter £u irgendeine komplexe Zahl w verstehen mit w2 = u. Die
zweite derartige Zahl ist dann −w. Ganz allgemein gilt:

Satz (Fundamentalsatz der Algebra)


Sei an zn + … + a1 z + a0 = 0 eine algebraische Gleichung mit Koeffizienten
a0 , …, an P C, an ≠ 0. Dann gibt es w1 , …, wn P C mit
an zn + … + a1 z + a0 = an (z − w1 ) ⋅ (z − w2 ) ⋅ … ⋅ (z − wn ).
Die Gleichung wird also genau durch w1 , …, wn gelöst.

Zum Beweis des Satzes werden analytische Methoden verwendet. Ein rein al-
gebraischer Beweis ist nicht bekannt. Ein wichtiger Spezialfall des Fundamental-
satzes lässt sich jedoch überraschend leicht einsehen:

Satz (Lösungen von zn = 1)


Sei n ≥ 1. Dann sind die Zahlen wk = (1, k 2π/n)polar mit k = 0, …, n − 1 genau
die komplexen Lösungen der Gleichung zn = 1.

Beweis
Polar gilt wk n = (1n , n k2π/n) = (1, k2π) = (1, 0) = 1, sodass wk n = 1 für alle
k = 0, …, n − 1. Die Zahlen w0 , …, wn − 1 sind paarweise verschieden. Die
Gleichung zn = 1 kann nicht mehr als n Lösungen haben, sodass alle
Lösungen gefunden sind.

Definition (komplexe Einheitswurzeln)


Die Zahlen w0 , …, wn −1 des Satzes heißen die n-ten komplexen Einheitswurzeln.

Die n-ten Einheitswurzeln bilden ein regelmäßiges n-Eck im Einheitskreis,


dem der Punkt (1, 0) angehört.

© Oliver Deiser Grundzüge der Höheren Mathematik


100 1. Abschnitt Grundlagen

1.0
w1

w2
0.5

w0
-1.0 -0.5 0.5 1.0

-0.5

w3

-1.0
w4

Die fünften Einheitswurzeln bilden Pentagon im Einheitskreis. Es gilt


w1 2 = w2 , w1 3 = w3 , w1 4 = w4 , w1 5 = w0 = 1
w2 2 = w4 , w2 3 = w1 , w2 4 = w3 , w2 5 = w0 = 1
w3 2 = w1 , w2 3 = w4 , w2 4 = w2 , w2 5 = w0 = 1
w4 2 = w3 , w2 3 = w2 , w2 4 = w1 , w2 5 = w0 = 1
Allgemein ist wk wm = wr , wobei r der Rest von k + m bei Division durch 5 ist.

w2
1.0

w1

w3 0.5

w0
-1.0 -0.5 0.5 1.0

w4 -0.5

w6
-1.0
w5

Aanlog bilden die siebten Einheitswurzeln ein Heptagon.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 101

Die Darstellung komplexer Funktionen

Eine reelle Funktion f : R → R können wir durch einen Plot ihres Graphen in
der x-y-Ebene visualisieren. Für eine komplexe Funktion f : C → C ist eine Visu-
alisierung nicht mehr so einfach, da wegen C = R2 insgesamt vier Dimensionen
beteiligt sind. Wie schon im Kapitel über Funktionen geschildert, können wir f
als Vektorfeld darstellen, indem wir an jeden Punkt z den Vektor f(z) anheften.
Übersichtlichere Ergebnisse liefert aber meistens:

Die Farbkreismethode (color wheel method, domain coloring)


Wir ordnen jeder komplexen Zahl z eine eindeutige Farbe zu. Hierzu
überdecken wir die Ebene mit einem Farbkreis, dessen Farben zum
Nullpunkt hin immer intensiver werden, für große Radien aber verblassen.
Der Nullpunkt selbst ist schwarz. Eine Funktion f : C → C visualisieren
wir, indem wir jeden Punkt z der Ebene mit der Farbe f(z) einfärben.

Wir betrachten einige Beispiele.

-1

-2

-3
-3 -2 -1 0 1 2 3

Der Farbkreis der Visualisierung mit einem polaren Koordinatengitter. Er entspricht


der Darstellung der Identität, d. h. der Funktion f : C → C mit f(z) = z für alle z P C.
Jede komplexe Zahl wird mit einer winkelabhängigen Farbe und radiusabhängigen
Intensität eingefärbt. Die folgenden Diagramme zeigen neben dem Farbverlauf auch
die Verformung des polaren Gitters durch die betrachtete Funktion.

© Oliver Deiser Grundzüge der Höheren Mathematik


102 1. Abschnitt Grundlagen

-1

-2

-3
-3 -2 -1 0 1 2 3

Die Funktion f : C → C mit f(z) = i z (Drehung um π/2 gegen den Uhrzeigersinn).


Der Farbkreis der Identität wird um π/2 im Uhrzeigersinn gedreht.

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Die Funktion f : C* → C mit f(z) = 1/z = z/|z|2 für z ≠ 0. Die Farben des Farbkreises
sind an der x-Achse gespiegelt und ihre Intesität ist quadratisch invertiert.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 103

-1

-2
-2 -1 0 1 2

Die Quadratfunktion sq : C → C mit sq(z) = z2 . Die Winkelverdopplung beim


Übergang von z zu z2 bewirkt den doppelten Durchlauf des Farbspektrums.

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Die Funktion f : C → C mit f(z) = z3 − 1. Die drei Nullstellen (schwarze Punkte) sind
die dritten Einheitswurzeln. Sie bilden ein gleichseitiges Dreieck im Einheitskreis.

© Oliver Deiser Grundzüge der Höheren Mathematik


104 1. Abschnitt Grundlagen

1.5

1.0

0.5

0.0

-0.5

-1.0

-1.5
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Die Funktion f : C → C mit f(z) = z3 − i z2 + z − i = (z − i)2 (z + i).


Sie besitzt eine doppelte Nullstelle bei i und eine einfache Nullstelle bei −i.

10

-5

-10
-10 -5 0 5 10

Die Wurzelfunktion sqrt : C → C mit Winkeln in ] −π/2, π/2 ].


Für z = (r, ϕ)polar mit ϕ P ] −π, π ] gilt sqrt(z) = (£r, ϕ/2)polar .

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 105

Übungen

Übung 1
Schreiben Sie die folgenden komplexen Zahlen in der Standardform x + iy
mit x, y P R:
1 1 + 2i
(a) i8 , (b) (1 + i)2 , (c) , (d) .
1+i 2 − 6i

Übung 2
Zeigen Sie (wahlweise in kartesischen Koordinaten oder in Polarkoordina-
ten), dass für alle z P C gilt:
z + z z − z
(a) Re(z) = , Im(z) = ,
2 2i

(b) |z|2 = z z,

z
(c) z− 1 = , falls z ≠ 0.
|z|2

Übung 3
Geben Sie alle komplexen Lösungen der Gleichung z5 = i sowohl in
kartesischen als auch in Polarkoordinaten an. Zeichnen Sie die Lösungen in
der Gaußschen Zahlenebene.

Übung 4
Sei u P C. Weiter seien r = |u| und

falls Im(u) ≥ 0,
σ =
{ 1
−1 falls Im(u) < 0.

Wir setzen:
s s
r − Re(u)
w1/2 = ± ( r + Re(u)
2
+ iσ
2 )
Zeigen Sie, dass w1 und w2 die komplexen Quadratwurzeln von u sind, d. h.
dass gilt: w1 2 = w2 2 = u.

© Oliver Deiser Grundzüge der Höheren Mathematik


106 1. Abschnitt Grundlagen

Lösungen zu den Übungen

Übung 1
Schreiben Sie die folgenden komplexen Zahlen in der Standardform x + iy
mit x, y P R:
1 1 + 2i
(a) i8 , (b) (1 + i)2 , (c) , (d) .
1+i 2 − 6i

Lösung zu Übung 1
zu (a):
Mit i2 = −1 gilt

i8 = (i2 )4 = (−1)4 = 1 = 1 + i 0.

zu (b): Es gilt

(1 + i)2 = 1 + 2i + i2 = 1 + 2i − 1 = 0 + i2.

Bemerkung 1
Die binomische Formel (a + b)2 = a2 + 2ab + b2 gilt in jedem Körper
K. Sie ergibt sich aus dem Distributivgesetz und den Kommutativge-
setzen. Für alle a, b P K gilt
(a + b)(a + b) = (a + b)a + (a + b)b = a2 + ba + ab + b2 = a2 + 2ab + b2 .
Analoges gilt für die anderen binomischen Formeln.
Bemerkung 2
Dass (1 + i)2 = 2i gilt, lässt sich auch leicht geometrisch einsehen:
Der Vektor 1 + i hat die Länge £2 und den Winkel π/4. Damit hat
(1 + i)2 die Länge 2 und den Winkel π/2.

zu (c): Es gilt

1 1−i 1−i 1−i 1 1


= = = = − i.
1+i (1 + i)(1 − i) 1 − i2 2 2 2

zu (d): Es gilt

1 + 2i (1 + 2i)(2 + 6i) 2 + 6i + 4i + 12i2


= =
2 − 6i (2 − 6i)(2 + 6i) 4 − 36 i2
−10 + 10i 1 1
= = − + i.
40 4 4

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 107

Übung 2
Zeigen Sie (wahlweise in kartesischen Koordinaten oder in Polarkoordina-
ten), dass für alle z P C gilt:
z + z z − z
(a) Re(z) = , Im(z) = ,
2 2i

(b) |z|2 = z z,

z
(c) z− 1 = , falls z ≠ 0.
|z|2

Lösung zu Übung 2
zu (a):
Sei z = x + iy P C. Dann gilt

z + z = x + iy + x − iy = 2x = 2 Re(z),

z − z = x + iy − (x − iy) = x + iy − x + iy = 2iy = 2i Im(z).

Die Division durch 2 bzw. durch 2i zeigt die Behauptung.

zu (b):
Sei z = (r, ϕ)polar . Dann gilt in Polarkoordinaten

z z = (r, ϕ) (r, −ϕ) = (r2 , ϕ − ϕ) = (r2 , 0) = r2 = |z|2 .

zu (c):
Sei z P C mit z ≠ 0. Dann gilt nach (c):
z zz |z|2
z = = = 1.
|z|2 |z|2 |z|2
Dies zeigt, dass die komplexe Zahl z/|z|2 multiplikativ invers zu z ist,
d. h. es gilt
z
z− 1 = .
|z|2

© Oliver Deiser Grundzüge der Höheren Mathematik


108 1. Abschnitt Grundlagen

Übung 3
Geben Sie alle komplexen Lösungen der Gleichung z5 = i sowohl in
kartesischen als auch in Polarkoordinaten an. Zeichnen Sie die Lösungen in
der Gaußschen Zahlenebene.

Lösung zu Übung 3
Wir wissen, dass die Lösungen von z5 = 1 ein Pentagon im Einheitskreis
bilden, dem der Punkt 1 = (1, 0) angehört (fünfte Einheitswurzeln). Um die
Lösungen von z5 = i zu finden, argumentieren wir so:
Eine komplexe Zahl w = (r, ϕ)polar ist genau dann eine Lösung von z5 = i, wenn
w5 = (r5 , 5ϕ)polar = (1, π/2)polar [ mit i = (1, π/2)polar ].
Dies ist genau dann der Fall, wenn gilt:
(a) r = 1, d. h. w liegt auf dem Einheitskreis
(b) 5ϕ ist modulo 2π gleich π/2, d. h. es gilt 5ϕ = π/2 + k2π für ein k P Z
Die Lösungen lassen sich nun ablesen. Sie lauten:
wk = (1, k2π/5 + π/10)polar
= ( cos(k2π/5 + π/10), sin(k2π + π/10) ) mit k = 0, …, 4
Geometrisch ergeben sie ein Pentagon im Einheitskreis, dem der Punkt i
angehört (wobei i = w1 ).

w1
1.0

0.5

w2 w0

-1.0 -0.5 0.5 1.0

-0.5

w3 w4
-1.0

Die Lösungen von z5 = i bilden ein Pentagon im Einheitskreis. Die fünften


Einheitswurzeln sind um den Winkel π/10 gegen den Uhrzeigersinn gedreht.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Komplexe Zahlen 109

Übung 4
Sei u P C. Weiter seien r = |u| und

falls Im(u) ≥ 0,
σ =
{ 1
−1 falls Im(u) < 0.

Wir setzen:
s s
r − Re(u)
w1/2 = ± ( r + Re(u)
2
+ iσ
2 )
Zeigen Sie, dass w1 und w2 die komplexen Quadratwurzeln von u sind, d. h.
dass gilt: w1 2 = w2 2 = u.

Lösung zu Übung 4
Für eine komplexe Zahl z = x + iy gilt
z2 = x2 + 2ixy + i2 y2 = x2 − y2 + 2i xy.
Damit erhalten wir (mit σ2 = 1), dass

r + Re(u) r − Re(u)
w1 2 = − σ2 + i σ £(r + Re(u)) (r − Re(u))
2 2
= Re(u) + i σ £r2 − Re(u)2 (Satz des Pythagoras)

= Re(u) + i σ £Im(u)2

= Re(u) + i σ |Im(u)| (Definition von σ)

= Re(u) + i Im(u) = u.

Weiter ist

w2 2 = (−w1 )2 = w1 2 = u.

Bemerkung
Wir verwenden hier die für alle x P R gültige Formel
£x2 = |x| (Formel vom nichtvergessenen Betrag)
Die Beträge zu vergessen führt für ein negatives x zu einem falschen
Vorzeichen. Für x = −2 gilt

£x2 = £(−2)2 = £4 = 2 = − x = |x|.


Diese Überlegung erklärt die Konstante σ: Es gilt σ |Im(u)| = Im(u).
Die Multiplikation mit σ stellt das Vorzeichen wieder her.

© Oliver Deiser Grundzüge der Höheren Mathematik


2. Abschnitt

Grundbegriffe der Analysis

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Die elementaren Funktionen

Wir betrachten grundlegende reelle Funktionen der Form f : R → R oder allge-


meiner f : P → R mit einer Teilmenge P der reellen Zahlen. Mit Hilfe der Addi-
tion, Subtraktion und Multiplikation können wir Polynome wie
x, x2 + 1, x5 − 2x2 − 1
in einer reellen Variablen x definieren. Lassen wir die Division zu, so ergeben
sich rationale Funktionen wie etwa
1/x, (x + 1)/(x − 1), (x2 + 1)/(x3 + 2x − 1).
Durch Einschränkung und Bildung der Umkehrfunktion erhalten wir Wurzel-
funktionen wie
3
£x, £x + 1, x3 /£(x2 − 1).
Fügen wir noch die Exponentialfunktionen und die trigonometrischen Funktio-
nen samt ihren Umkehrfunktionen hinzu, so erhalten wir beispielsweise die
Funktionen
2 cos(x + π/4), sin(x)/x, log(arctan(1/x2 ) + π).
Die beschriebenen Funktionen heißen die elementaren reellen Funktionen. Sie sind
aus der Schule prinzipiell gut bekannt, sodass wir uns hier auf einen knappen
Überblick und einige exemplarische Überlegungen beschränken können.

Schlüsselbegriffe
Reelle Funktion
Polynom
rationale Funktion
Exponentialfunktionen, Logarithmen
trigonometrische Funktionen, Arkusfunktionen

© Oliver Deiser Grundzüge der Höheren Mathematik


114 2. Abschnitt Grundbegriffe der Analysis

Reelle Funktionen

Definition (reelle Funktion)


Eine Funktion der Form f : P → R mit P ⊆ R heißt eine reelle Funktion.

Viele reelle Funktionen sind durch einen Term in einer Variablen definiert,
der durch die wiederholte Verknüpfung von Grundfunktionen entsteht.

Beispiele
(1) Beispiele für Terme in den vier Grundrechenarten sind
x2 + 1, y3 + 2y + 1, 1/(2z + 1)3 (mit den Variablen x, y bzw. z).
(2) Die Terme
£sin(x2 ) + 1, sin(y2 + π/4), 2z − 1
verwenden neben den Grundrechenarten weitere Funktionen wie die
Wurzel, die Sinusfunktion oder die Exponentiation zur Basis 2.

Terme lassen sich für bestimmte Stellen eindeutig auswerten und führen da-
durch zu Funktionen. So definiert (oder erzeugt) zum Beispiel der Term 1/x2 die
Funktion f : R* → R mit f(x) = 1/x2 für alle x P R*, wobei R* = R − { 0 }. Ein Term
ist ein syntaktischer Ausdruck und keine Funktion. Um jedoch die Sprechweise
zu vereinfachen, vereinbaren wir:

Terme als Funktionen


Wird ein reeller Term als Funktion behandelt, so ist diese Funktion die
reelle Funktion mit maximalem Definitionsbereich, die durch diesen Term
definiert wird. Alternativ können wir auch den Definitionsbereich konkret
angeben.

Beispiele
(1) Die Funktion x2 ist die reelle Funktion sq : R → R mit
sq(x) = x2 für alle x P R.
Damit können wir zum Beispiel sagen: „Die Funktion x2 ist nicht
injektiv.“ Oder genauer: „Die Funktion x2 auf R ist nicht injektiv.“
(2) Die Funktion x2 auf [ 0, ∞ [ ist die reelle Funktion f : [ 0, ∞ [ → R mit
f(x) = x2 für alle x ≥ 0. Es gilt also f = sq|[ 0, ∞ [. Die Funktion x2 auf
[ 0, ∞ [ ist injektiv.
(3) Die Funktion 1/x ist die Einheitshyperbel f : R* → R mit f(x) = 1/x für
alle x ≠ 0. Die Funktion 1/x ist im Nullpunkt nicht definiert.
(4) Die Funktion 1/x auf ] −∞, 0 [ ist der linke Ast der Einheitshyperbel.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 115

Polynome

Definition (Polynome, Koeffizienten, Leitkoeffizient, normiert, Grad)


Seien a0 , …, an P R. Dann heißt die Funktion f : R → R mit
f(x) = an xn + an − 1 xn − 1 + … + a0 für alle x P R
das (reelle) Polynom mit den Koeffizienten a0 , …, an . Ist an ≠ 0, so heißt n der
Grad und an der Leitkoeffizient des Polynoms. Gilt an = 1, so heißt das
Polynom normiert. Sind alle Koeffizienten gleich 0, so heißt f das Nullpoly-
nom. Dem Nullpolynom ordnen wir den symbolischen Grad −∞ zu.

Wir schreiben auch deg(f ) für den Grad von f. Es gilt deg(f ) P N ∪ { −∞ }.

Konstante Polynome
Ein Polynom der Form f(x) = c heißt ein konstantes Polynom. Ist c = 0, so gilt
deg(f) = −∞. Andernfalls ist deg(f ) = 0.

Geraden
Ein Polynom der Form g(x) = ax + b heißt eine Gerade mit Steigung a und
Nullwert b. Ein Polynom g ist genau dann eine Gerade, wenn deg(g) ≤ 1.

Parabeln
Ein Polynom der Form f(x) = ax2 + bx + c mit a ≠ 0 heißt eine Parabel mit
Öffnung a, Nullpunktssteigung b und Nullwert c. Ein Polynom f ist genau
dann eine Parabel, wenn deg(f ) = 2.

Monome
Ein Polynom der Form xn heißt ein Monom. Ein Monom xn ist normiert
und hat den Grad n. Für n ≥ 2 ist die Umkehrfunktion von xn die n-te
Wurzelfunktion x1/n . Sie ist auf R (falls n ungerade) oder auf [ 0, ∞ [ (falls n
gerade) definiert.

Steigungsform einer Geraden


Für alle a, x0 , y0 P R ist g(x) = a(x − x0 ) + y0 eine Gerade. Sie hat die Steigung
a und verläuft durch den Punkt (x0 , y0 ), da g(x0 ) = 0 + y0 = y0 . Diese Form
der Geradendarstellung nennen wir Steigungsform. Sie spielt in der Analysis
eine wichtige Rolle bei der Berechnung von Tangenten.

Die Steigungsform können wir anschaulich beschreiben: Wir starten mit der
Geraden ax durch den Nullpunkt. Nun verschieben wir diese Gerade um x0
entlang der x-Achse und erhalten a(x − x0 ). Die Verschiebung um y0 entlang der
y-Achse ergibt a(x − x0 ) + y0 .
Für je zwei Punkte (x0 , y0 ) und (x1 , y1 ) mit x0 ≠ x1 gibt es genau eine Gerade
durch diese Punkte. Wir setzen hierzu a = (y1 − y0 )/(x1 − x0 ) in der Steigungsform.

© Oliver Deiser Grundzüge der Höheren Mathematik


116 2. Abschnitt Grundbegriffe der Analysis

Nullstellen von Polynomen

Von besonderem Interesse sind die Nullstellen eines Polynoms. Sie entspre-
chen den Lösungen einer Gleichung der Form
an xn + an − 1 xn − 1 + … + a0 = 0

Nullstellen einer Geraden


Ein konstantes Polynom der Form f(x) = c hat entweder keine Nullstelle
(Fall c ≠ 0) oder unendlich viele Nullstellen (Fall c = 0). Eine Gerade
f(x) = ax + b mit a ≠ 0 hat die eindeutige Nullstelle x1 = −b/a.

Nullstellen einer Parabel


Sei f(x) = ax2 + bx + c eine Parabel. Dann gilt
f(x) = ax2 + bx + c = a(x2 + bx/a) + c
= a( x2 + bx/a + b2 /(4a2 ) − b2 /(4a2 ) ) + c
= a(x + b/(2a))2 + c − b2 /(4a).
Diese quadratische Ergänzung überführt die Parabel in die Scheitelform
a(x − x0 )2 + y0 mit x0 = −b/2a, y0 = c − b2 /(4a). Wir erhalten

−b ± £b2 − 4ac
x1/2 = x0 ± £− y0 /a = (Mitternachtsformel)
2a
für die Nullstellen von f. Es gibt genau dann eine Nullstelle, wenn die
Diskriminante d = b2 − 4ac größergleich 0 ist. Ist d > 0, so gilt x1 ≠ x2 . Im
Fall d = 0 sprechen wir von einer doppelten Nullstelle.

Es gibt allgemeine Lösungsformeln für Polynome vom Grad 3 und 4, nicht


aber für Polynome ab dem Grad 5. Hier müssen numerische Methoden zur ap-
proximativen Berechnung einer Nullstelle verwendet werden. Allgemein gilt:

Satz (Abspalten einer Nullstelle)


Sei f ein Polynom vom Grad n ≥ 1, und sei x0 eine Nullstelle von f. Dann
gibt es ein Polynom g mit deg(g) = n − 1 und
f(x) = (x − x0 ) g(x) für alle x P R (Abspalten der Nullstelle x0 )

Beweis
Die Polynomdivision von f durch x − x0 liefert die Form f(x) = g(x)(x − x0 ) + c.
Durch Einsetzen von x0 erhalten wir wegen f(x0 ) = 0, dass c = 0.

Wiederholtes Abspalten zeigt, dass ein Polynom vom Grad n ≥ 1 höchstens n


Nullstellen besitzen kann. Im Idealfall ergibt sich eine Zerlegung in Linearfakto-
ren der Form f(x) = an (x − x1 ) …(x − xn ) für alle x P R.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 117

100

50

-4 -2 2 4

-50

-100

x (x + 1)

(x - 2) x (x + 1) - 30

(x - 2) x (x + 1) (x + 3) + 20

(x - 4) (x - 2) x (x + 1) (x + 3) - 10

Einige Polynome mit Grad 2, 3, 4 und 5.

Zur Kontrolle ihres Verlaufs wurden die Polynome aus Linearfaktoren und
y-Verschiebungen aufgebaut. In Standardform lauten die Polynome der Reihe nach
x2 + x
x3 − x2 − 2x − 30
x4 + 2x3 − 5x2 − 6x + 20
x5 − 2x4 − 13x3 + 14x2 + 24x − 10
Alle Polynome sind normiert. Sie haben zwei, eine, keine bzw. fünf reelle Nullstellen.

© Oliver Deiser Grundzüge der Höheren Mathematik


118 2. Abschnitt Grundbegriffe der Analysis

Rationale Funktionen

Teilen wir zwei Polynome durcheinander, so erhalten wir eine rationale Funk-
tion:

Definition (rationale Funktion)


Seien f, g : R → R reelle Polynome, g ≠ 0. Dann heißt h = f/g mit
h(x) = f(x)/g(x) für alle x P R mit g(x) ≠ 0 die durch f und g definierte (reelle)
rationale Funktion. Die Nullstellen von g heißen die Definitionslücken von f/g.

Eine rationale Funktion f/g ist genau an den Nullstellen des Nennerpolynoms
nicht definiert. Das Verhalten von f/g in der Nähe einer solchen Nullstelle x0
hängt davon ab, ob x0 auch eine Nullstelle des Zählerpolynom ist. Hierzu be-
trachten wir:

Kürzen einer rationalen Funktion


Durch Abspalten aller gemeinsamen Nullstellen von f und g und streichen
der entsprechenden Linearfaktoren erhalten wir Funktionen f * und g * mit
(a) f(x)/g(x) = f *(x)/g*(x) für alle x P R mit g(x) ≠ 0.
(b) Es gibt kein x P R mit f *(x) = g*(x) = 0.
Wir nennen (f/g)* = f */g* die gekürzte rationale Funktion f/g.

Der Definitionsbereich von (f/g)* kann um endlich viele Punkte größer sein als
der von f/g. Diese Punkte heißen die stetig hebbaren Definitionslücken von f/g.
Die verbleibenden Definitionslücken sind die Polstellen von f/g.

Beispiel
Sei f(x) = x + 1 und g(x) = x2 − 1. Wegen g(x) = (x + 1) (x − 1) hat f/g die
Definitionslücken 1 und −1. Wir können den gemeinsamen Linearfaktor
x + 1 kürzen und erhalten f *(x) = 1 und g*(x) = x − 1. Dies ergibt die
gekürzte Funktion f */g* mit f *(x)/g*(x) = 1/(x − 1) für alle x ≠ 1. Diese
Funktion ist an der Stelle −1 definiert und sie hat dort den Wert −1/2. Die
verbleibende Definitionslücke 1 ist eine Polstelle.

Wir identifizieren oft f/g mit (f/g)*. Mit den Funktionen f und g wie im Bei-
spiel schreiben wir etwa
f(x) x+1 x+1 1 f *(x)
= = = =
g(x) x2 − 1 (x + 1)(x − 1) x−1 g*(x)

In Funktionsplots entspricht diese Identifikation dem stillschweigenden Schlie-


ßen der Löcher des Graphen.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 119

30

20
h

10

-20 -10 10 20

-10

k -20

-30

Das Diagramm zeigt die rationale Funktion h = f/g mit

f(x) x3 − x2 − 2x − 8
h(x) = =
g(x) x2 + 2x − 24
Aus der Zerlegung des Nenners

g(x) = x2 + 2x − 24 = (x − 4)(x + 6)

in Linearfaktoren ergeben sich die Polstellen 4 und −6 von h (die Nullstellen des
Nenners sind keine Nullstellen des Zählers). Eine Polynomdivision ergibt

28x − 80
h(x) = x − 3 + 2
x + 2x − 24
Der Quotient x − 3 ist die im Diagramm eingezeichnete schräge Asymptote k von h.

© Oliver Deiser Grundzüge der Höheren Mathematik


120 2. Abschnitt Grundbegriffe der Analysis

Exponentialfunktionen und Logarithmen

In den reellen Zahlen lässt sich eine Potenz ax für a > 0 und x P R einführen.
Es existieren auch gewisse Potenzen für negative Basen. So gilt etwa (−2)3 = −8
oder (−27)1/3 = −3. Im Allgemeinen ist es aber wichtig, dass die Basis positiv ist,
und wir konzentrieren uns auf diesen Fall.
Es gibt verschiedene äquivalente Möglichkeiten, ax zu erklären.

Erster Weg: Rationale Exponenten und stetige Fortsetzung


Sei a > 0. Wir definieren zunächst an/m als die m-te Wurzel aus an für alle
n P Z, m P N*. Damit ist aq für alle rationalen Zahlen q definiert. Für
irrationale Exponenten x erklären wir nun ax durch
ax = supq < x, q P Q aq , falls a ≥ 1,
ax = inf q < x, q P Q aq , falls 0 < a < 1.

Zweiter Weg: Verwendung der Exponentialfunktion zur Basis e


Wir nehmen an, dass die Exponentialfunktion exp : R → R zur Basis
e = exp(1) und ihre Umkehrfunktion log : ] 0, ∞ [ → R bekannt sind.
Ist nun a > 0, so setzen wir
ax = exp(x log(a)) für alle x P R.
Speziell ist ex = exp(x log(e)) = exp(x) mit e = exp(1).

Eine Basis a lässt sich wegen ax = exp(x log(a)) = ex log(a) immer in die Basis e
überführen. Exemplarisch zeigen wir:

Gewinnung einer Potenzregel


Sei a > 0. Dann gilt für alle x, y P R:
(ax )y = exp(x log(a))y
= exp(y log(exp(x log(a))))
= exp(y x log(a)) = ax y .

Es gilt 1x = 1 für alle x. Für a ≠ 1 ist ax monoton steigend oder monoton fallend,
sodass wir die Umkehrfunktion bilden können.

Definition (allgemeine Exponentialfunktionen und Logarithmen)


Wir nennen expa : R → R mit
expa (x) = ax = ex log(a) für alle x P R
die Exponentialfunktion zur Basis a. Für a ≠ 1 sei loga : ] 0, ∞ [ → R die
Umkehrfunktion von expa . Sie heißt der Logarithmus zur Basis a.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 121

Exp

Log

-3 -2 -1 1 2 3 4

-2

-4

Exponentialfunktion und Logarithmus (zur Basis e). Eingezeichnet sind zudem die
Geraden x + 1 und x − 1. Den Verlauf der allgemeinen Exponentialfunktionen und
Logarithmen diskutieren wir in den Übungen.

© Oliver Deiser Grundzüge der Höheren Mathematik


122 2. Abschnitt Grundbegriffe der Analysis

Rechenregeln für Exponentialfunktionen und Logarithmen

Satz (Eigenschaften der Exponentialfunktionen und Logarithmen)


Unter der Voraussetzung der Definiertheit der Ausdrücke gilt:

(1) a0 = expa (0) = 1, a1 = expa (1) = a (Grundwerte)

(2) ax + y = expa (x + y) = expa (x) expa (y) = ax ay (Additionstheorem)

ax − y = expa (x − y) = expa (x)/expa (y) = ax /ay

(3) ax y = expa (x y) = expexpa(x) (y) = (ax )y

(4) log a (1) = 0, log a (a) = 1 (Grundwerte)

(5) log a (xy) = log a (x) + log a (y) (Multiplikationstheorem)

log a (x/y) = log a (x) − log a (y)

(6) log a (bx ) = log a (expb (x)) = x log a (b)

(7) alogb(x) = expa (logb (x)) = xlogb (a)

Wir hatten oben schon festgestellt, dass wir eine Potenz ax durch Übergang zu
x log(a)
e in eine Potenz zur Basis e verwandeln können. Allgemein besteht zwi-
schen Basen a, b > 0 mit b ≠ 1 der Zusammenhang
ax = ex log(a) = ex log(a)/log(b) log(b) = bx log(a)/log(b) . (Basiswechsel)
Für die Logarithmen ergibt sich:

Satz (Basiswechsel für Logarithmen)


Unter der Voraussetzung der Definiertheit der Ausdrücke gilt:
log(x) log b (x)
(1) log a (x) = = (Basiswechsel für Logarithmen)
log(a) log b (a)

(2) log a (x) = − log 1/a (x) (Invertierung der Basis)

(3) log a (b) log b (a) = 1

Beispiele
(1) Für alle x, y > 0 gilt:

log(x + y) = log( x (1 + y/x) ) = log(x) + log(1 + y/x)

(2) Für alle x > 0 gilt:


log 2 (x) log 2 (x) log 2 (x) 1
log 8 (x) = = = = log 2 (x)
log 2 (8) log 2 (23 ) 3 log 2 (2) 3

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 123

Die trigonometrischen Funktionen

Die trigonometrischen Funktionen tauchen bei der Untersuchung von Drei-


ecken auf. Folgende Sicht liefert die Funktionen für beliebige Stellen:

Definition (Kosinus und Sinus als Koordinatenfunktionen am Einheitskreis)


Sei α P R, und sei P der Punkt auf dem Einheitskreis K = { (x, y) | x2 + y2 = 1 }
mit dem Winkel α (im Bogenmaß, gegen den Uhrzeigersinn). Dann setzen wir
cos(α) = „die x-Koordinate von P“,
sin(α) = „die y-Koordinate von P“.
Die so definierten Funktion cos, sin : R → R heißen die Kosinusfunktion
bzw. Sinusfunktion.

1
P
K

sin( )

-1 1
cos( )

-1

Kosinus und Sinus als Koordinatenfunktionen für Punkte P des Einheitskreises K:


P = (cos(α), sin(α))
mit Winkeln im Bogenmaß (gegen den Uhrzeigersinn)

Kosinus und Sinus sind bei diesem Zugang definiert als die Funktionen, die
Polarkoordinaten (1, α) in kartesische Koordinaten (x, y) überführen. Dyna-
misch interpretiert sind sie die Koordinatenfunktionen eines Punktes, der sich
auf dem Einheitskreis mit der gleichmäßigen Winkelgeschwindigkeit 1 gegen
den Uhrzeigersinn bewegt.

© Oliver Deiser Grundzüge der Höheren Mathematik


124 2. Abschnitt Grundbegriffe der Analysis

Beispiele
(1) Für α = π/2 gilt P = (0, 1), sodass cos(π/2) = 0 und sin(π/2) = 1. Für
α = − π/2 gilt P = (0, −1), sodass cos(−π/2) = 0 und sin(−π/2) = −1.
(2) Sei α P R. Dann gilt (1, α)polar = (1, α + 2π)polar . Folglich ist
cos(α) = cos(α + 2π) und sin(α) = sin(α + 2π).
(3) Die Addition von π zu α entspricht einer Spiegelung am Nullpunkt. Es
gilt also cos(α + π) = − cos(α), sin(α + π) = − sin(α) für alle α P R.
(4) Nach Pythagoras gilt cos2 (α) + sin2 (α) = 1 für alle α P R.
(5) Die Nullstellen des Sinus sind die ganzzahligen Vielfachen von π. Die
Nullstellen des Kosinus sind um π/2 verschoben.

Die klassische Bedeutung für Dreiecke ergibt sich durch den Strahlensatz. Sei
ABC ein rechtwinkliges Dreieck mit einem rechten Winkel bei C. Wir dürfen
annehmen: A ist der Nullpunkt, C liegt auf der positiven x-Achse, B liegt im er-
sten Quadranten. Ist nun B = (c, α)polar , so gilt a = c sin(α) und b = c cos(α) nach
dem Strahlensatz.

1 c

P c sin( )

sin( )

cos( )

A 1 c cos( ) C

Kosinus und Sinus für rechtwinklige Dreiecke: Die Katheten des rechtwinkligen
Dreiecks ABC haben nach dem Strahlensatz die Längen a = c sin(α) und b = c cos(α).

Wir definieren:

Definition (Tangens und Kotangens)


Die Tangensfunktion tan und die Kotangensfunktion cot sind definiert durch
tan = sin/cos und cot = cos/sin.

Die Definitionsbereiche sind wie bei den rationalen Funktionen maximal ge-
wählt. Der Tangens hat bei den Nullstellen des Kosinus Pole, der Kotangens bei
den Nullstellen des Sinus.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 125

1.0

0.5

cos

-3 -2 - 2 3 sin

-0.5

-1.0

Kosinus und Sinus

tan

-2 - 2 cot

-2

-4

-6

Tangens und Kotangens

© Oliver Deiser Grundzüge der Höheren Mathematik


126 2. Abschnitt Grundbegriffe der Analysis

Zahlreiche trigonometrische Größen lassen sich anhand einer Figur visuali-


sieren, die durch einen Winkel α und den Einheitskreis K im ersten Quadranten
erzeugt wird:

K F

B
D

E
A C I

Der Winkel α bei A = (0, 0) liefert die Punkte


B = (cos(α), sin(α)), C = (cos(α), 0), D = (0, sin(α))
Die anderen Punkte ergeben sich durch das Anlegen von Tangenten durch die
Punkte B = (cos(α), sin(α)), E = (1, 0), F = (0, 1) an den Kreis K. Mit dem Kom-
plementärwinkel β = π/2 − α gilt:

(1) AC = cos(α) = sin(β) = DB

(2) CB = sin(α) = cos(β) = AD

(3) EG = tan(α) = cot(β) = BI

(4) FH = cot(α) = tan(β) = B J


1 1
(5) AG = = = AI
cos(α) sin(β)
1 1
(6) AH = = = AJ
sin(α) cos(β)

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 127

Die Additionstheoreme

Für die trigonometrischen Funktionen gibt es umfangreiche Formelsamm-


lungen. Wir diskutieren hier exemplarisch:

Satz (Additionstheoreme für Kosinus und Sinus)


Seien α, β P R. Dann gilt:
cos(α + β) = cos(α) cos(β) − sin(α) sin(β) (Additionstheorem des Kosinus)
sin(α + β) = sin(α) cos(β) + cos(α) sin(β) (Additionstheorem des Sinus)

Beim Beweis der Additionstheoreme ist der Zugang über den Einheitskreis
von großem Vorteil. Anhand von rechtwinkligen Dreiecken lassen sich die For-
meln nur mühsam zeigen. Mit Hilfe der komplexen Multiplikation und ihrer
geometrischen Deutung ist der Beweis sehr einfach:

Beweis
Mit der Multiplikation in C gilt:
(cosα, sinα) (cos β, sinβ) = (cosα cosβ − sinα sinβ, sinα cosβ + cosα sinβ).
Nach der geometrischen Multiplikationsregel hat das Produkt auf der
linken Seite die Länge 1 und den Winkel α + β. Nach Definition des
Kosinus und Sinus gilt also
(cosα, sinα) (cos β, sinβ) = (cos(α + β), sin(α + β)).
Durch den Vergleich von Real- und Imaginärteil ergeben sich die Behaup-
tungen.

Für den Spezialfall α = β erhalten wir:

Korollar (Verdopplungsformeln für Kosinus und Sinus)


Sei α P R. Dann gilt:
cos(2α) = cos(α)2 − sin(α)2 , sin(2α) = 2 sin(α) cos(α).

Die Verdopplungsformel mit α = 2(α/2) und der Satz des Pythagoras liefert:
cos(α) = cos(α/2)2 − sin(α/2)2 = cos(α/2)2 − (1 − cos(α/2)2 ) = 2cos(α/2)2 − 1.
Analoge Überlegungen gelten wir für den Sinus. Auflösen nach cos(α/2)2 und
sin(α/2)2 liefert:

Korollar (Halbwinkelformeln für Kosinus und Sinus)


Sei α P R. Dann gilt:
1 + cos(α) 1 − cos(α)
cos(α/2)2 = , sin(α/2)2 = .
2 2

© Oliver Deiser Grundzüge der Höheren Mathematik


128 2. Abschnitt Grundbegriffe der Analysis

Die Arkusfunktionen

Um Umkehrfunktionen bilden zu können, müssen wir die nicht injektiven tri-


gonometrischen Funktionen geeignet einschränken. Wir definieren:
sin0 = sin | [− π/2, π/2] cos0 = cos | [ 0, π ]
tan0 = tan | ]− π/2, π/2 [ cot0 = cot | ] 0, π [
Damit können wir einführen:

Definition (Arkusfunktionen)
Die Arkusfunktionen arccos, arcsin, arctan und arccot sind definiert als die
Umkehrfunktionen von cos0 , sin0 , tan0 bzw. cot0 .

Funktion Definitionsbereich Wertebereich

arccos [ −1, 1 ] [ 0, π ]

arcsin [ −1, 1 ] [ − π/2, π/2 ]

arccot R ] 0, π [

arctan R ] − π/2, π/2 [

Die Funktionen arccot und arctan haben die bemerkenswerte Eigenschaft, die
reellen Zahlen bijektiv auf ein beschränktes Intervall abzubilden.
Die Bezeichnung geht auf das Lateinische „arcus“ für „Bogen“ zurück. Die
Funktionen arccos und arcsin berechnen Bogenlängen. Der Kosinus berechnet
die x-Koordinate eines Punktes P = (1, α)polar auf dem Einheitskreis. Da die
Punkte P = (1, α)polar und Q = (1, −α)polar die gleiche x-Koordinate besitzen, ist die
Rekonstruktion der Bogenlänge α aus der x-Koordinate nur möglich, wenn wir
uns auf einen bestimmten Winkelbereich beschränken. Für den Arkuskosinus
bietet sich [ 0, π ] an. Analoges gilt für den Arkussinus mit [ −π/2, π/2 ].

Zusammenspiel mit Pythagoras


Sei x P [ −1, 1 ]. Wenden wir den Sinus auf arccos(x) an, so erhalten wir
£1 − x2 nach dem Satz des Pythagoras: Die Punkte (0, 0), (x, 0) und
(x, sin(arccos(x))) bilden ein rechtwinkliges Dreieck mit Hypotenuse 1.
Allgemein gilt
sin(arccos(x)) = cos(arcsin(x)) = £1 − x2 für alle x P [ −1, 1 ].

Winkelberechnung mit Hilfe des Arkustangens


Ist g : R → R eine Gerade mit der Steigung a P R, so berechnet sich der
Winkel α P ] π/2, π/2 [, den die Gerade mit der x-Achse einschließt, zu
α = arctan(a).

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 129

3
4

arccos
4
arcsin

-1.0 -0.5 0.5 1.0

-4

-2

Arkuskosinus und Arkussinus

3
4

arctan
4
arccot

-10 -5 5 10

-4

-2

Arkustangens und Arkuskotangens

© Oliver Deiser Grundzüge der Höheren Mathematik


130 2. Abschnitt Grundbegriffe der Analysis

Übungen

Übung 1
Seien b, c P R, und sei f : R → R die Parabel mit
f(x) = x2 + bx + c für alle x P R.
Weiter seien x1 , x2 P R die (nicht notwendig verschiedenen) Nullstellen
von f. Zeigen Sie:
b = −(x1 + x2 ), c = x1 x2 .

Übung 2
Skizzieren Sie die Graphen der Exponentialfunktionen expa : R → R für
reelle Basen a > 0, sodass der qualitative Verlauf der Funktionen in
Abhängigkeit von der Basis a deutlich wird.

Übung 3
Für alle α P R gilt:
cos(α + π/2) = − sin(α), sin(α + π/2) = cos(α).
Begründen Sie die beiden Formeln am Einheitskreis mit Hilfe eines
Diagramms. Wie lassen sie sich mit Hilfe der imaginären Einheit i gewinnen?

Übung 4
Bestimmen Sie jeweils alle x P R mit:
(a) sin(arcsin(x)) = x,
(b) arcsin(sin(x)) = x.
Begründen Sie Ihre Aussagen und geben Sie instruktive Gegenbeispiele an.
Zeichnen Sie ein Diagramm zur Illustration von (b).

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 131

Lösungen zu den Übungen

Übung 1
Seien b, c P R, und sei f : R → R die Parabel mit
f(x) = x2 + bx + c für alle x P R.
Weiter seien x1 , x2 P R die (nicht notwendig verschiedenen) Nullstellen
von f. Zeigen Sie:
b = −(x1 + x2 ), c = x1 x2 .

Lösung zu Übung 1
Wir diskutieren zwei verschiedene Methoden.
Verwendung der Lösungsformel
Nach der Mitternachtsformel gilt (mit a = 1), dass
2 x1,2 = −b ± w, wobei w = £b2 − 4c.
Folglich ist
2(x1 + x2 ) = −b + w + (−b) − w = −2b
4 x1 x2 = (−b + w)(−b − w) = b2 − w2 = b2 − (b2 − 4c) = 4c.
Division durch −2 bzw. 4 liefert die Behauptung.
Koeffizientenvergleich
Da sich Nullstellen von einem Polynom abspalten lassen, gilt
x2 + bx + c = (x − x1 ) (x − x2 ) für alle x P R.
Ausmuliplizieren der rechten Seite ergibt
(+) x2 + bx + c = x2 − (x1 + x2 ) x + x1 x2 für alle x P R.
Durch Koeffizientenvergleich erhalten wir
b = −(x1 + x2 ), c = x1 x2 .
Bemerkung: Gültigkeit in allen Körpern
Der allgemeine Koeffizientenvergleich für Polynome ist hier nicht
vermeidbar: Einsetzen von x = 0 in (+) zeigt, dass
c = x1 x2
Einsetzen von x = 1 liefert
1 + b + c = 1 − (x1 + x2 ) 1 + x1 x2 ,
Aus c = x1 x2 erhalten wir b = −(x1 + x2 ). Dieser Beweis verwendet keine
Eigenschaften von R, sondern nur die Körperaxiome. Damit gelten die
Formeln in jedem Körper. Sie sind als die Formeln von Vieta bekannt.

© Oliver Deiser Grundzüge der Höheren Mathematik


132 2. Abschnitt Grundbegriffe der Analysis

Übung 2
Skizzieren Sie die Graphen der Exponentialfunktionen expa : R → R für
reelle Basen a > 0, sodass der qualitative Verlauf der Funktionen in
Abhängigkeit von der Basis a deutlich wird.

Lösung zu Übung 2

1 1 1
2x x
10x 10x x
2x
8

4
2 x 3 x

3 2

1x

-3 -2 -1 0 1 2 3

Die Exponentialfunktionen ax für a = 1, 3/2, 2, e, 10 und die Inversen dieser Basen

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Die elementaren Funktionen 133

Übung 3
Für alle α P R gilt:
cos(α + π/2) = − sin(α), sin(α + π/2) = cos(α).
Begründen Sie die beiden Formeln am Einheitskreis mit Hilfe eines
Diagramms. Wie lassen sie sich mit Hilfe der imaginären Einheit i gewinnen?

Lösung zu Übung 3
Sei α P R beliebig. Drehen wir den Punkt P = (cos α, sin α) des Einheits-
kreises um π/2 gegen den Uhrzeigersinn, so erhalten wir nach der
Drehformel den Punkt Q = (−sin α, cos α). Nach Definition des Kosinus
und Sinus gilt Q = (cos(α + π/2), sin(α + π/2)). Durch Koordinatenvergleich
ergeben sich die beiden Formeln.

1 P = (x, y)

Q = (-y, x)
sin( )

cos( )
/2

-1 -sin( ) cos( ) 1

-1

Durch die Drehung um π/2 wird P = (x, y) = (cos α, sin α) zu


Q = (−y, x) = (−sin α, cos α). Andererseits ist Q = (cos(α + π/2), sin(α + π/2)).

Verwendung der imaginären Einheit


Die Multiplikation einer komplexen Zahl z mit i entspricht einer Dre-
hung um π/2 gegen den Uhrzeigersinn. Damit gilt für alle α P R:
(−sinα, cos α) = i (cos α, sin α) = i (1, α)polar = (1, α + π/2)polar
= (cos(α + π/2), sin(α + π/2))
Erneut liefert der Koordinatenvergleich (hier: Vergleich von Realteil und
Imaginärteil) die Behauptung.

© Oliver Deiser Grundzüge der Höheren Mathematik


134 2. Abschnitt Grundbegriffe der Analysis

Übung 4
Bestimmen Sie jeweils alle x P R mit:
(a) sin(arcsin(x)) = x,
(b) arcsin(sin(x)) = x.
Begründen Sie Ihre Aussagen und geben Sie instruktive Gegenbeispiele an.
Zeichnen Sie ein Diagramm zur Illustration von (b).

Lösung zu Übung 4
zu (a): Für alle x P R gilt:
sin(arcsin(x)) = x genau dann, wenn x P [ −1, 1 ]
Der Definitionsbereich des Arkussinus ist das Intervall [ −1, 1 ], sodass
arcsin(x) außerhalb des Intervalls [ −1, 1 ] nicht definiert ist. Allgemein
gilt: Ist f − 1 : B → A die Umkehrfunktion von f : A → B, so gilt
f(f − 1 (x)) = x für alle x P B. Aus arcsin = sin0 −1 mit sin0 = sin|[ π/2, π/2 ]
folgt die Behauptung.
zu (b): Für alle x P R gilt:
arcsin(sin(x)) = x genau dann, wenn x P [ −π/2, π/2 ]
Die linke Seite ist für alle x P R definiert. Da der Arkussinus nur
Werte in [ −π/2, π/2 ] annimmt, kann die Aussage außerhalb des
Intervalls [ −π/2, π/2 ] nicht gelten. Allgemein gilt: Ist f − 1 : B → A die
Umkehrfunktion von f : A → B, so gilt f − 1 (f(x)) = x für alle x P A.
Wie in (a) folgt die Behauptung aus arcsin = sin0 −1 .
Gegenbeispiele
sin(arcsin(2)) ist nicht definiert
arcsin(sin(x)) = π − x für alle x P [ π/2, 3π/2 ]
arcsin(sin(x)) = x − 2π für alle x P [ 3π/2, 5π/2 ]
arcsin(sin(x)) = −x − π für alle x P [ −3π/2, π/2 ]
arcsin(sin(x)) = x + 2π für alle x P [ −5π/2, −3π/2 ]

5 3 3 5
-3 - -2 - - - 2 3
2 2 2 2 2 2
-
4

-
2

Die Funktion arcsin(sin(x)) auf R. Nur auf [ −π/2, π/2 ] ist sie die Identität.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte

Wir präzisieren den Grenzwertbegriff für reelle Folgen (xn )n P N mit Hilfe der
Epsilon-Definition. Dadurch sind Konvergenzaussagen der Form
limn → ∞ xn = x mit einem Grenzwert x P R
und weiter die symbolischen Konvergenzen
limn → ∞ xn = ∞, limn → ∞ xn = −∞
exakt definiert. Der Grenzwertbegriff für Folgen darf als der Grundbegriff der
Analysis bezeichnet werden. Mit seiner Hilfe können unendliche Summen, die
Stetigkeit von Funktionen, Grenzwerte von Funktionen und damit Differential-
quotienten und schließlich auch Integrale eingeführt werden.

Schlüsselbegriffe
unendliche Folge
Konvergenz, Divergenz, Grenzwert
Limesnotation
uneigentliche Konvergenz gegen ∞ oder −∞
Limesregeln
Cauchy-Folge

© Oliver Deiser Grundzüge der Höheren Mathematik


136 2. Abschnitt Grundbegriffe der Analysis

Unendliche Folgen

Definition (Folgen)
Eine Funktion der Form f : N → M heißt eine (unendliche) Folge in der
Menge M. Für alle n P N heißt f(n) das n-te Glied der Folge.

Die Folgennotation
Eine Folge f : N → M notieren wir oft in der Indexform f = (xn )n P N mit
xn = f(n) für alle n P N. Wir schreiben auch (x0 , x1 , x2 , …) oder x0 , x1 , x2 , …
anstelle von (xn )n P N .

In der Indexnotation muss ein Funktionszeichen wie f, g, h usw. nicht mehr er-
wähnt werden. Mehrere Folgen geben wir als (xn )nPN , (yn )nPN , (zn )nPN , … an. Je
nach Kontext ist es auch günstig, eine Folge mit dem Index 1 zu beginnen. Sie hat
dann die Index-Form (xn )n ≥ 1 (und die Funktionsform f : N* → M).

Beispiele
(1) Sei f : N → R mit f(n) = 2n für alle n. Dann ist f eine Folge in R, die wir
in der Form (2n )n P N , (1, 2, 4, …, 2n , …) oder 1, 2, 4, …, 2n , … notieren
können.
(2) Wir definieren eine reelle Folge, d. h. eine Folge in R, (xn )n P N durch
xn = −1n für alle n. Es gilt also (xn )n P N = (−1n )n P N . In Pünktchenform
lautet die Folge 1, −1, 1, −1, 1, −1, …
(3) Eine konstante Folge ist eine Folge der Form c, c, c, …

Visualisierung reeller Folgen


Eine reelle Folge (xn )n P N können wir wie jede reelle Funktion plotten,
indem wir die Punkte (n, xn ) für einige n in der Ebene markieren. Alternativ
können wir einige Folgenglieder xn auf einer Zahlengeraden markieren und
die entsprechenden Indizes angeben. Für die Folge 1, −1, 1, −1, … springt
die erste Darstellung auf der y-Achse zwischen 1 und −1 hin und her,
während bei der zweiten Darstellung nur die zwei Punkte 1 und −1 auf der
x-Achse markiert und mit geraden bzw. ungeraden Indizes versehen sind.

Definition (Teilfolge)
Seien (xn )n P N und (yn )n P N Folgen. Dann heißt (yn )n P N eine Teilfolge von
(xn )n P N , falls es eine streng monoton wachsende Folge n0 , n1 , n2 , … in N
gibt mit (y0 , y1 , y2 , …) = (xn0 , xn1 , xn2 , …).

Beispiel
Die Folgen 1, 1, 1, … und −1, −1, −1, … sind Teilfolgen von 1, −1, 1, −1, …
Die Folge 1, 3, 5, … der ungeraden Zahlen ist eine Teilfolge von 0, 1, 2, 3, …
Dagegen ist 1, 0, 3, 2, 5, 4, … ist keine Teilfolge von 0, 1, 2, 3, …, n, …

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 137

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

-1

-2

Visualisierung einer reellen Folge (xn )n P N in der x-y-Ebene.


Wir zeichnen die Punkte (n, xn ) für einige n in ein Diagramm ein.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

-1

-2

Visualisierung der Folge ((−1)n )n P N

x2 n + 1 x2 n

-2 -1 0 1 2

Darstellung der Folge ((−1)n )n P N durch Punkte auf der reellen Zahlengeraden. Alle
Glieder mit ungeraden Indizes sind −1, alle Glieder mit geraden Indizes sind 1.

© Oliver Deiser Grundzüge der Höheren Mathematik


138 2. Abschnitt Grundbegriffe der Analysis

Grenzwerte von Folgen

Der anschauliche Grenzwertbegriff


(1/2n )n P N strebt gegen 0, (2n )n P N strebt gegen ∞, ((−1)n )n P N strebt gegen
nichts. Statt „strebt gegen“ sagen wir auch „konvergiert“ und den Wert des
Strebens nennen wir auch den Limes oder Grenzwert der Folge. Gibt es
keinen Grenzwert, so sagen wir, die Folge sei „divergent“.

Diese Anschauung wollen wir nun präzisieren. Ohne eine solche Präzisierung
lassen sich keine Beweise führen. Eine rein anschauliche Beschreibung lässt Fra-
gen offen und kann zu falschen Vorstellungen führen (etwa zeitlichen Interpreta-
tionen wie „unendlich lange“ oder Formulierungen wie „der Grenzwert wird nie
erreicht“). Der Leser vergleiche hierzu auch die Übungen.
Unsere anschauliche Formulierung lässt sich nicht direkt in die Sprache der
Mathematik übersetzen. Besser ist:
„Eine reelle Folge (xn )nPN konvergiert gegen eine reelle Zahl x, wenn sie von
jedem noch so kleinen Intervall der Form ]x−ε, x+ε[ eingefangen wird.“
Noch genauer (ohne „einfangen“):
„Eine reelle Folge (xn )n P N konvergiert gegen eine reelle Zahl x, wenn für
jedes noch so kleine Intervall der Form ]x − ε, x + ε[ gilt: Alle bis auf höch-
stens endlich viele Folgenglieder liegen in diesem Intervall.“
Nach diesen Vorbereitungen können wir eine präzise Definition angeben:

Definition (konvergent, Grenzwert, divergent)


Sei (xn )n P N eine Folge in R. Dann heißt die Folge konvergent, falls es ein
x P R gibt mit
(+) ∀ε > 0 ∃n0 ∀n ≥ n0 xn P ] x − ε, x + ε [ . (Konvergenzbedingung für x)
In diesem Fall heißt x Grenzwert oder Limes der Folge. Gibt es kein solches
x, so heißt die Folge divergent.

Eine Folge kann nicht gegen zwei verschiedene x und x′ konvergieren. Denn
ist ε = |x − x′|/2, so müssten fast alle Folgenglieder sowohl in ] x − ε, x + ε [ als
auch in ] x′ − ε, x′ + ε [ liegen. Dies kann nicht sein, da die beiden Intervalle dis-
junkt sind (ihr Durchschnitt ist leer). Damit ist ein Grenzwert im Fall der Exi-
stenz eindeutig bestimmt.

Limesnotation
Ist (xn )n P N konvergent gegen x, so schreiben wir
x = limn P N xn , x = limn → ∞ xn oder kurz x = limn xn .

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 139

x+
x
x-

n0

Visualisierung des Grenzwerts x einer reellen Folge (xn )n P N :


Für jedes ε > 0 liegen alle Folgenglieder ab einer Stelle n0 im ε-Streifen um x.
Die Stelle n0 hängt von ε ab:
Je kleiner ε ist, desto größer muss in der Regel n0 gewählt werden.

x+
x
x-

n0 n

Visualisierung der Divergenz einer Folge (xn )n P N :


Für jedes x P R gibt es ein ε > 0, sodass die Folge immer wieder aus dem ε-Streifen um
x ausbricht: Für alle n0 gibt es ein n ≥ n0 mit xn ¸ ] x − ε, x + ε [.

Analog lässt sich die Visualisierung einer Folge durch Punkte auf einer Zah-
lengeraden verwenden, um die Konvergenz oder Divergenz zu illustrieren. An
die Stelle der ε-Streifen treten ε-Intervalle.

© Oliver Deiser Grundzüge der Höheren Mathematik


140 2. Abschnitt Grundbegriffe der Analysis

Der Nachweis der Konvergenz und Divergenz

Um zu zeigen, dass eine Folge (xn )n P N konvergiert, müssen wir ein x P R fin-
den und für dieses x die Konvergenzbedingung
∀ε > 0 ∃n0 ∀n ≥ n0 xn P ] x − ε, x + ε [
nachweisen. Äquivalent ist die Formulierung
∀ε > 0 ∃n0 ∀n ≥ n0 |xn − x| < ε (Konvergenzbedingung für x, Abstandsform)
Denn für jedes y P R gilt y P ] x − ε, x + ε [ genau dann, wenn |y − x| < ε. Welche
Version man verwendet, ist Geschmackssache. Je nach Art der Folge kann die
eine Form einfacher erscheinen als die andere.

Exemplarischer Nachweis einer Konvergenz


Wir zeigen, dass
limn ≥ 1 (1 + 1/n) = 1.
Sei hierzu ε > 0. Nach dem Archimedischen Axiom gibt es ein n0 mit
n0 ε > 1. Dann gilt 1/n0 < ε und weiter 1/n < ε für alle n ≥ n0 . Folglich gilt
1 + 1/n P ] 1, 1 + 1/ε [ ⊆ ] 1 − ε, 1 + ε [ für alle n ≥ n0 .
Dies zeigt die Behauptung.

Zum Nachweis der Divergenz einer Folge (xn )n P N müssen wir für ein belie-
bige x P R die Negation der Konvergenzbedingung nachweisen, also
¬ ∀ε > 0 ∃n0 ∀n ≥ n0 xn P ] x − ε, x + ε [ .
Die Verneinungsregeln für Quantoren ergeben:
∃ε > 0 ∀n0 ∃n ≥ n0 xn ¸ ] x − ε, x + ε [. (Divergenzbedingung für x)
Äquivalent hierzu ist
∃ε > 0 ∀n0 ∃n ≥ n0 |xn − x| ≥ ε (Divergenzbedingung für x, Abstandsform)

Exemplarischer Nachweis einer Divergenz


Wir zeigen, dass 1, −1, 1, −1, … divergiert. Sei hierzu x P R beliebig.
Wir zeigen die Divergenzbedingung für x. Hierzu setzen wir ε = 1.
Sei n0 P N beliebig. Dann gilt
{ 1, −1 } = { xn0 , xn0 + 1 }.
Das offene Intervall I = ] x − ε, x + ε [ hat die Länge 2, sodass es keine zwei
Zahlen mit Abstand 2 enthalten kann. Damit gilt 1 ¸ I oder −1 ¸ I, sodass
n = n0 oder n = n0 + 1 die Divergenzbedingung erfüllt.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 141

Epsilon-Umgebungen

Die Intervalle der Form ] x − ε, x + ε [ verdienen einen eigenen Begriff:

Definition (Epsilon-Umgebung)
Seien x P R und ε > 0. Dann heißt
Uε (x) = ] x − ε, x + ε [ = { y P R | |x − y| < ε }
die (offene) Epsilon-Umgebung von x.

Beispiele
(1) U1 (0) = ] −1, 1 [, U1 (x) = ] x − 1, x + 1 [ für alle x P R.
(2) Für alle a < b in R gilt:
] a, b [ = Uε (x) mit ε = (b − a)/2 und x = a + ε = (a + b)/2.
Jedes Intervall ] a, b [ ist eine Umgebung seines Mittelpunkts.

Die Konvergenzbedingung für x lautet nun:


(+) ∀ε > 0 ∃n0 ∀n ≥ n0 xn P Uε (x) (Konvergenzbedingung für x)

Konvergenz in den komplexen Zahlen und Euklidischen Räumen


Sobald Umgebungen eines Punktes definiert sind, lässt sich mit (+) die
Konvergenz von Folgen erklären. Insbesondere erhalten wir den Konver-
genzbegriff für Folgen in C und allgemeiner in den Räumen Rd einer
beliebigen Dimension d ≥ 1: Für alle d ≥ 1 und x P Rd setzen wir
Uε (x) = { y P Rd | „der Euklidische Abstand von y und x ist kleiner als ε“ }.
In R2 = C sind diese Umgebungen offene Kreisscheiben, im R3 offene Kugeln.
Damit ist „limn xn = x“ für Folgen (xn )nP N in Rd und x P Rd , d ≥ 1, erklärt.

Nützlich ist die folgende Sprechweise:

Definition (fast alle, schließlich)


Sei %(n) eine Eigenschaft. Wir sagen, dass %(n) für fast alle natürlichen
Zahlen oder schließlich gilt, wenn { n P N | ¬ %(n) } endlich ist.

Damit können wir die Konvergenz einer Folge (xn )nPN gegen x ebenso präzise
wie anschaulich formulieren. Sie bedeutet:
Für alle ε > 0 liegen fast alle Glieder der Folge in Uε (x).
Oder wieder etwas salopp:
Jede ε-Umgebung von x fängt die Folge schließlich ein.

© Oliver Deiser Grundzüge der Höheren Mathematik


142 2. Abschnitt Grundbegriffe der Analysis

Uneigentliche Konvergenz

Wir zeigen vorab:

Satz (konvergente Folgen sind beschränkt)


Sei (xn )n P N eine konvergente Folge in R. Dann ist die Folge beschränkt,
d. h. es gibt ein s P R mit:
|xn | ≤ s für alle n P N.

Beweis
Sei limn xn = x. Dann gibt es ein n0 derart, dass xn P ] x − 1, x + 1 [ für alle
n ≥ n0 . Wir setzen
s = max({ |x0 |, …, |xn0 − 1 |, |x| + 1 }).
Dann ist (xn )n P N beschränkt durch s.

Die Beschränktheit ist also notwendig für die Konvergenz. Sie ist nicht hinrei-
chend: Die Folge 0, 1, 0, 1, … ist beschränkt, aber nicht konvergent.
Die Folgen 0, 1, 2, 3, … und 1, −1, 2, −2, 3, −3, … sind unbeschränkt und damit
divergent. Die erste Folge strebt anschaulich gegen ∞, die zweite nicht. Um ein
anschauliches „Streben gegen unendlich“ zu behandeln, führen wir folgende Va-
riante der Konvergenz ein:

Definition (uneigentliche Konvergenz)


Eine Folge (xn )n P N in R heißt uneigentlich konvergent gegen ∞, falls gilt:
∀s > 0 ∃n0 ∀n ≥ n0 xn > s
Analog heißt (xn )n P N heißt uneigentlich konvergent gegen −∞, falls gilt:
∀s > 0 ∃n0 ∀n ≥ n0 xn < −s
Wir schreiben dann limn xn = ∞ bzw. limn xn = −∞.

Die Aussage limn xn = ∞ bedeutet, dass die Folge schließlich über jeder noch
großen Schranke s liegt. Analoges gilt für limn xn = −∞. An die Stelle der Umge-
bungen Uε (x) = ] x − ε, x + ε [ treten die unbeschränkten Intervalle ] s, ∞ [ bzw.
] −∞, −s [.

Beispiele
(1) limn n = limn 2n = ∞, limn −n = limn −2n = −∞.
(2) Die Folge 0, 1, 0, 2, 0, 3, 0, 4, … konvergiert weder eigentlich noch
uneigentlich. Sie besitzt die konvergente Teilfolge 0, 0, 0, … und die
uneigentlich konvergente Teilfolge 1, 2, 3, …

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 143

Die Limesregeln

Sehr nützlich für Grenzwertberechnungen sind:

Satz (Limesregeln)
Seien (xn )n P N und (yn )n P N konvergente reelle Folgen. Dann gilt:
(a) lim n (x n ± yn ) = lim n x n ± lim n yn ,
(b) lim n (c x n ) = c lim n x n für alle c P R,
(c) lim n (x n yn ) = lim n x n lim n yn ,
(d)
xn lim n xn
lim n ( yn
) =
lim n yn
, falls yn ≠ 0 für alle n und limn yn ≠ 0.

Die Regeln lassen sich mit einiger Mühe durch Überprüfung der Konvergenz-
bedingung nachweisen.

Beispiele
(1) Es gilt

limn (1 + 1/n) = limn 1 + limn 1/n = 1 + 0 = 1.

(2) Es gelte limn xn = x. Dann gilt

limn xn 2 = limn (xn xn ) = limn xn limn xn = x x = x2 .

Allgemeiner gilt

limn xn k = xk = (limn xn )k für alle k ≥ 1.

(3) Für alle natürlichen Zahlen k ≥ 1 gilt

limn (1 + 1/n)k = ( limn (1 + 1/n) )k = 1k = 1.

(4) Es gilt
n 1 1 1
limn = = = = 1.
n+1 limn (n + 1)/n limn (1 + 1/n) 1

(5) Es gilt

2n2 − 3n + 2 3 2
limn
n2
(
= limn 2 −
n
+ 2
n
)
3 2
= limn 2 − limn + limn = 2 + 0 + 0 = 2.
n n2

© Oliver Deiser Grundzüge der Höheren Mathematik


144 2. Abschnitt Grundbegriffe der Analysis

Konvergenzkriterien für Folgen

Da reelle Folgen Funktionen sind, sind die Monotonie-Begriffe definiert.


Eine Folge (xn )nPN ist monoton steigend, falls xn+1 ≥ xn für alle n gilt. Gilt stärker
xn+ 1 > xn für alle n, so ist sie streng monoton steigend. Für monotone Folgen gibt
es ein einfaches Konvergenzkriterium:

Satz (Konvergenzkriterium für monotone Folgen)


Eine monoton steigende Folge (xn )n P N konvergiert genau dann, wenn sie
beschränkt ist. In diesem Fall gilt
limn xn = supn xn (= sup({ xn | n P N }).
Analoges gilt für monoton fallende Folgen mit limn xn = infn xn .

Der Beweis besteht im Nachweis der Konvergenzbedingung.

Beispiel
Sei m,d1 d2 d3 … ein unendlicher Dezimalbruch. Nach Definition gilt

m,d1 d2 d3 … = supn ≥ 1 m, d1 … dn .

Die Folge (m,d1 …dn )n ≥ 1 der Näherungsbrüche ist monoton steigend und
beschränkt durch m + 1. Folglich ist

m,d1 d2 d3 … = limn≥ 1 m, d1 … dn .

Wann konvergiert eine beliebige reelle Folge? Zum Nachweis der Konver-
genzbedingung müssen wir einen Grenzwert bereits kennen oder „raten“. Es
gibt jedoch eine Charakterisierung der Konvergenz, die einen Grenzwert nicht
erwähnt. Hierzu definieren wir:

Definition (Cauchy-Folge)
Eine reelle Folge (xn )n P N heißt eine Cauchy-Folge, falls gilt:
∀ε > 0 ∃n0 ∀n,k ≥ n0 |xn − xk | < ε. (Cauchy-Bedingung)

Die Bedingung besagt, dass sich die Folgenglieder derart verdichten, dass sie
schließlich nur noch beliebig wenig voneinander abweichen. Man kann mit Hilfe
des Vollständigkeitsaxioms zeigen:

Satz (Charakterisierung der konvergenten Folgen)


Sei (xn )n P N eine Folge in R. Dann sind äquivalent:
(a) (xn )n P N konvergiert.
(b) (xn )n P N ist eine Cauchy-Folge.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 145

Übungen

Übung 1
Visualisieren Sie die Konvergenz der Folge (xn )n ≥ 1 mit xn = 1 − 1/n für alle
n ≥ 1 sowohl durch ein Diagramm in der x-y-Ebene als auch durch ein
Diagramm auf der x-Achse.

Übung 2
Zeigen Sie durch Nachweis der Konvergenz- bzw. Divergenzbedingung:
(a) Sei c P R. Dann konvergiert die konstante Folge (c)n P N gegen c.
(b) Die Folge 1, 1/2, 1, 1/4, 1, 1/8, 1, 1/16, … divergiert.

Übung 3
Wir betrachten die folgende Aussage:
„Die Konvergenz einer Folge (xn )n P N gegen x bedeutet anschaulich, dass
die Folgenglieder xn dem x beliebig nahe kommen, ohne x je zu erreichen.“
Diskutieren Sie, zu welchen Fehlinterpretationen des Grenzwertbegriffs
diese Aussage führen kann. Formulieren Sie zudem eine entsprechend
verbesserte Version der Aussage.

Übung 4
Sei a > 0. Wir definieren eine Folge (xn )n P N rekursiv durch
1 a
x0 = a, xn + 1 = ( xn + ) für alle n ≥ 0.
2 xn
(a) Berechnen Sie x1 , x2 und x3 für a = 2. Vergleichen Sie die Werte
numerisch mit £2.
(b) Man kann zeigen, dass x1 ≥ x2 ≥ … ≥ xn ≥ … ≥ 0, sodass
x = limn xn = inf n ≥ 1 xn
existiert. Zeigen Sie unter Verwendung der Limesregeln, dass
x = £a.
[ Hinweis: Verwenden Sie, dass limn xn = limn xn + 1 . ]

© Oliver Deiser Grundzüge der Höheren Mathematik


146 2. Abschnitt Grundbegriffe der Analysis

Lösungen zu den Übungen

Übung 1
Visualisieren Sie die Konvergenz der Folge (xn )n ≥ 1 mit xn = 1 − 1/n für alle
n ≥ 1 sowohl durch ein Diagramm in der x-y-Ebene als auch durch ein
Diagramm auf der x-Achse.

Lösung zu Übung 1
Es gilt
limn xn = limn (1 − 1/n) = 1.
Dies können wir in den beiden Arten wie folgt visualisieren:

1.5

x+
1
x-

0.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Visualisierung des Grenzwerts 1 der Folge (1 − 1/n)n ≥ 1 in der x-y-Ebene

x1 x2 x3 ...

0 0.25 0.5 0.75 1.25 1.5


1- 1 1+

Visualisierung des Grenzwerts 1 der Folge (1 − 1/n)n ≥ 1 auf x-Achse

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 147

Übung 2
Zeigen Sie durch Nachweis der Konvergenz- bzw. Divergenzbedingung:
(a) Sei c P R. Dann konvergiert die konstante Folge (c)n P N gegen c.
(b) Die Folge 1, 1/2, 1, 1/4, 1, 1/8, 1, 1/16, … divergiert.

Lösung zu Übung 2
zu (a):
Wir zeigen die Konvergenzbedingung für c:
∀ε > 0 ∃n0 ∀n ≥ n0 xn P ] c − ε, c + ε [
Sie hierzu ε > 0 beliebig. Wir setzen n0 = 0. Dann gilt für alle n ≥ n0 :
xn = c P ] c − ε, c + ε [.
Dies zeigt, dass limn xn = c.
Bemerkung
Die Beweisidee ist: Jedes offene Intervall, das den konstanten Wert c
der Folge enthält, fängt die gesamte Folge ein. Für jedes ε ist der
Index n0 = 0 geeignet.
zu (b):
Sei x P R beliebig. Wir zeigen die Divergenzbedingung für x:
∃ε > 0 ∀n0 ∃n ≥ n0 xn ¸ ] x − ε, x + ε [
Wir setzen hierzu ε = 1/4. Sei n0 beliebig. Dann gilt
xn0 ¸ ] x − ε, x + ε [ oder xn0 + 1 ¸ ] x − ε, x + ε [.
Denn es gibt ein k ≥ 1 mit { xn0 , xn0 + 1 } = { 1, 1/2k }, sodass die Glieder xn0
und xn0 + 1 der Folge einen Abstand größergleich 1/2 voneinander
besitzen. Das offene Intervall ] x − ε, x + ε [ hat die Länge 1/2, sodass es
nicht beide Glieder xn0 und xn0 + 1 enthalten kann. Dies zeigt die
Divergenzbedingung für x.
Bemerkung
Die Beweisidee ist: Je zwei aufeinander folgende Glieder der Folge
haben mindestens den Abstand 1/2 voneinander. Damit können wir
den Beweis der Divergenz von 1, −1, 1, −1, … als Grundlage
nehmen und entsprechend anpassen.

© Oliver Deiser Grundzüge der Höheren Mathematik


148 2. Abschnitt Grundbegriffe der Analysis

Übung 3
Wir betrachten die folgende Aussage:
„Die Konvergenz einer Folge (xn )n P N gegen x bedeutet anschaulich, dass
die Folgenglieder xn dem x beliebig nahe kommen, ohne x je zu erreichen.“
Diskutieren Sie, zu welchen Fehlinterpretationen des Grenzwertbegriffs
diese Aussage führen kann. Formulieren Sie zudem eine entsprechend
verbesserte Version der Aussage.

Lösung zu Übung 3
Die Aussage lässt zwei Interpretationen zu, die nicht mit unserer Grenz-
wertdefinition vereinbar sind:
„ohne x je zu erreichen“
Die konstante Folge
1, 1, 1, …
konvergiert nach unserer Definition gegen 1 (vgl. Aufgabe 1). Sie
erreicht damit ihren Grenzwert an jeder Stelle. Analoges gilt für die
Folge 1/2, 0, 1/4, 0, 1/8, 0, … Hier wird der Grenzwert 0 von jedem
zweiten Glied erreicht.
Eine mögliche Interpretation der Aussage lautet also:
„Alle Folgenglieder einer konvergenten Folge müssen sich vom
Grenzwert der Folge unterscheiden.“
„die xn kommen dem x beliebig nahe“
Die Folge
1, 1/2, 1, 1/4, 1, 1/8, 1, 1/16, …
divergiert nach unserer Definition (vgl. wieder Aufgabe 1). Sie kommt
aber anschaulich sowohl der 1 als auch der 0 beliebig nahe, da ihre
Teilfolgen
1, 1, 1, … bzw. 1/2, 1/4, 1/8, …
gegen 1 bzw. 0 konvergieren.
Eine mögliche Interpretation der Aussage lautet also:
„Es gibt eine Teilfolge, die die Konvergenzbedingung für x erfüllt.“
Bemerkung: Einen Grenzwert einer Teilfolge nennt man einen
Häufungspunkt der Folge. Durch die Aussage wird der Unterschied
zwischen Grenzwerten und Häufungspunkten verwischt.
Verbesserung
„Die Konvergenz einer Folge (xn )n P N gegen x bedeutet anschaulich,
dass die Folgenglieder xn dem x beliebig nahe kommen und auch
beliebig nahe bei x bleiben. Sie können mit x zusammenfallen.“

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Folgen und ihre Grenzwerte 149

Übung 4
Sei a > 0. Wir definieren eine Folge (xn )n P N rekursiv durch
1 a
x0 = a, xn + 1 = ( xn + ) für alle n ≥ 0.
2 xn
(a) Berechnen Sie x1 , x2 und x3 für a = 2. Vergleichen Sie die Werte
numerisch mit £2.
(b) Man kann zeigen, dass x1 ≥ x2 ≥ … ≥ xn ≥ … ≥ 0, sodass
x = limn xn = inf n ≥ 1 xn
existiert. Zeigen Sie unter Verwendung der Limesregeln, dass
x = £a.
[ Hinweis: Verwenden Sie, dass limn xn = limn xn + 1 . ]

Lösung zu Übung 4
zu (a):
Es gilt £2 = 1,414213562373095… Eine Berechnung liefert die
folgenden Werte:

n xn xn als Dezimalbruch xn − £2 (gerundet)

0 2 2 0,5858

1 3/2 1,5 0,08579

2 17/12 1,416 0,002453

3 577/4082 1,41421568627450980392 0,000002124

zu (b):
Nach dem Hinweis und den Limesregeln gilt

1 a 1 a
x = limn xn = limn xn + 1 = limn ( xn + ) = ( x + ).
2 xn 2 x
Damit gilt 2x = x + a/x. Auflösen nach x ergibt
x2 = a.
Also ist x = £a oder x = − £a. Aus x ≥ 0 ergibt sich x = £a.

© Oliver Deiser Grundzüge der Höheren Mathematik


3. Unendliche Reihen

Wir betrachten unendliche Summen reeller Zahlen der Form


x0 + x1 + x2 + … + xn + …,
sogenannte unendliche Reihen. Eine solche Reihe lässt sich als Folge s0 , s1 , s2 , …
ihrer Partialsummen
sn = x 0 + … + x n
auffassen, sodass wir keinen weiteren Grenzwertbegriff einführen müssen. Die
divergente harmonische Reihe, die manchmal konvergenten geometrischen Rei-
hen und die immer konvergenten Exponentialreihen bilden die drei wichtigsten
Beispiele. In knapper Form besprechen wir die klassischen Konvergenzkriterien,
die sich oft (aber nicht immer) anwenden lassen, um zu ermitteln, ob eine Reihe
konvergiert oder nicht. Aus dem Quotientenkriterium ergibt sich insbesondere
die Konvergenz der Exponentialreihen.

Schlüsselbegriffe
unendliche Reihe
Partialsumme
Leibniz-Kriterium, Majorantenkriterium, Quotientenkriterium
harmonische Reihe, geometrische Reihen, Exponentialreihen

© Oliver Deiser Grundzüge der Höheren Mathematik


152 2. Abschnitt Grundbegriffe der Analysis

Unendliche Reihen und ihre Partialsummen

In der Analysis tauchen sehr häufig unendliche Summen der Form


(+) x0 + x1 + x2 + … + xn + … mit xn P R für alle n P N
auf. Um sie zu definieren, führen wir sie auf Folgen zurück. Anschaulich berech-
nen wir eine Summe (+) schrittweise, indem wir ihre Partialsummen
s0 = x0 , s1 = x0 + x1 , s2 = x0 + x1 + x2 , s3 = x0 + x1 + x2 + x3 , …
berechnen. Die Idee ist nun, eine unendliche Summe mit der Folge ihrer Partial-
summen zu identifizieren und den Grenzwert der Partialsummen zu betrachten.

Definition (Partialsumme, unendliche Reihe, Summe, Wert)


Sei (x n )n P N eine reelle Folge. Für alle n P N sei
sn = ∑ k ≤ n xn = x0 + … + xn . (n-te Partialsumme)
Wir setzen
∑ n P N x n = (sn )n P N (unendliche Reihe mit Summanden xn )
Im Fall der Konvergenz der Folge (sn )n P N setzen wir
∑ n P N x n = limn sn . (Summe, Wert der Reihe)

Notation
Wir beginnen eine Summation oft auch bei 1 statt 0, sodass die Reihe die
Form ∑ n ≥ 1 xn besitzt. Neben ∑ n P N x n verwenden wir gleichbedeutend

∑ n = 0 x n , ∑ n ≥ 0 x n , ∑ n x n , x0 + x1 + x2 + … + xn + …

Es ist üblich, das Summen-Zeichen ∑ sowohl für die Reihe als auch für ihren
Grenzwert zu verwenden. Aus dem Kontext wird klar, was gemeint ist.

Beispiele
(1) Wir betrachten die Reihe ∑ n ≥ 1 1/2n . In der Bedeutung als Folge gilt
∑ n≥ 1 1/2n = (sn )n≥1 = (1/2, 1/2 + 1/4, 1/2 + 1/4 + 1/8, …)
= (1/2, 3/4, 7/8, 15/16, …)
In der Bedeutung als Grenzwert gilt ∑ n ≥ 1 1/2n = limn sn = 1.
(2) Die Reihe ∑ n (−1)n divergiert. Denn es gilt (sn )n P N = (1, 0, 1, 0, 1, 0, …)
und diese Folge ist divergent. Dies zeigt erneut die Wichtigkeit von
Definitionen. Das arithmetische Mittel 1/2 der Partialsummen sn ist ein
sinnvoller Kandidat für den Wert der Reihe. Nach unserer Definition
ist die Reihe divergent. Es gibt eine umfassendere Konvergenzdefini-
tion (Cesàro-Mittel), bei der die Reihe tatsächlich den Wert 1/2 besitzt.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 153

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

-1

-2

-3

-4

Das Diagramm zeigt die ersten Glieder einer reellen Folge (xn )n P N (blaue Punkte) und
die entsprechenden Partialsummen der unendlichen Reihe ∑ n xn (gelbe Punkte).

Wir betrachten einige Eigenschaften des Diagramms:


(1) Wie für jede Folge gilt s0 = x0 . Wegen s5 = 0 gilt s6 = x6 und wegen s9 = 0
gilt x10 = s10 .
(2) Wegen x3 = x4 = 0 gilt s2 = s3 = s4 .
(3) Wegen x11 , …, x15 > 0 ist s10 < s11 < … < s15 .

1.0

0.8

0.6

0.4

0.2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Wie oben für die Folge (xn )n ≥ 1 mit xn = 1/2n für n ≥ 1

© Oliver Deiser Grundzüge der Höheren Mathematik


154 2. Abschnitt Grundbegriffe der Analysis

Die harmonische Reihe

Definition (harmonische Reihe)


Die harmonische Reihe ist die Reihe ∑ n ≥ 1 1/n.

Satz (Uneigentliche Konvergenz der harmonischen Reihe)


Die harmonische Reihe konvergiert uneigentlich gegen ∞.

Beweis
Wir fassen die Summanden ab 1/2 in Blöcken der Länge 1, 2, 4, 8, …
zusammen. Dann gilt

1 + 1/2 + 1/3 + … = 1 + 1/2 + (1/3 + 1/4) + (1/5 + 1/6 + 1/7 + 1/8) + …

≥ 1 + 1/2 + 2/4 + 4/8 + …

≥ 1/2 + 1/2 + 1/2 + …

= ∞.

Die harmonische Reihe wächst sehr langsam. Eine numerische Berechnung


offenbart einen engen Zusammenhang mit der Logarithmusfunktion:

log +
4

log

10 20 30 40 50

Die ersten Partialsummen der harmonischen Reihe ∑ n ≥ 1 1/n (gelbe Punkte)


im Vergleich mit der Logarithmusfunktion log : ] 0, ∞ [ → R.
Man kann zeigen, dass es ein γ P R gibt mit limn sn − log(n) = γ.
Für diese sog. Euler-Mascheroni-Konstante γ gilt numerisch
γ = 0,577215664901532860606512090082402431042…

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 155

Die geometrischen Reihen

Definition (geometrische Reihen)


Sei q P R. Dann heißt ∑ n P N qn die geometrische Reihe für q.

Satz (Konvergenz und Divergenz der geometrischen Reihen)


Für alle q P R mit |q| < 1 konvergiert die Reihe und es gilt
1
∑ n qn = .
1−q
Für alle q P R mit |q| ≥ 1 divergiert die Reihe.

Beweis
Sei q P R beliebig. Dann gilt für alle n, dass

1 − qn + 1
sn = 1 + q + q2 + … + qn = (geometrische Summenformel)
1−q
(vgl. die Übungen). Ist |q| < 1, so gilt limn qn + 1 = 0. In diesem Fall ist also

1−0 1
∑ n qn = limn sn = = .
1−q 1−q
Ist |q| ≥ 1 so gilt |qn | ≥ 1 für alle n, sodass die Summanden der Reihe
keine Nullfolge bilden. Folglich divergiert die Reihe (vgl. die Übungen).

Beispiele
(1) Es gilt ∑ n (1/2)n = 1 + 1/2 + 1/4 + 1/8 + … = 1/(1 − 1/2) = 2.

(2) Es gilt ∑ n (− 1/3)n = 1 − 1/3 + 1/9 − 1/27 + … = 1/(1 + 1/3)) = 3/4.

(3) Es gilt ∑ n 1n = 1 + 1 + 1 + … = ∞. Die Reihe ist divergent (sie


konvergiert uneigentlich).

(4) Die Reihe ∑ n (−1)n = 1 − 1 + 1 − 1 + … ist divergent.

Varianten
Sei q P ] −1, 1 [ . Starten wir die Summation mit dem Index 1, so erhalten wir:
1 1 − (1 − q) q
∑ n ≥ 1 qn = ∑ n ≥ 0 qn − q0 = −1 = = .
1−q 1−q 1−q
Für q = a/b mit b ≠ 0 und |a/b| < 1 gilt

1 b a/b a
∑ n ≥ 0 (a/b)n = = , ∑ n ≥ 1 (a/b)n = = .
1 − a/b b−a 1 − a/b b−a

© Oliver Deiser Grundzüge der Höheren Mathematik


156 2. Abschnitt Grundbegriffe der Analysis

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Die ersten Summanden und Partialsummen der geometrischen Reihe ∑ n qn


für q = 4/5. Der Wert der Reihe ist 1/(1 − 4/5) = 5.

1.0

0.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

-0.5

-1.0

Die ersten Summanden und Partialsummen der geometrischen Reihe ∑ n qn


für q = −4/5. Der Wert der Reihe ist 1/(1 + 4/5) = 5/9.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 157

Konvergenzkriterien für Reihen

Da eine Reihe ∑ n xn die Folge (sn )nPN ihrer Partialsummen ist, können wir alle
Methoden und Kriterien für Folgen verwenden, um eine Reihe auf ihre Konver-
genz hin zu untersuchen. Daneben gibt speziell auf Reihen zugeschnittene Kri-
terien. Wir geben die drei wichtigsten an.

Satz (Leibniz-Kriterium für alternierende Reihen)


Sei (xn )n P N eine monoton fallende Folge reeller Zahlen mit limn xn = 0.
Dann konvergiert

∑ n (−1)n xn = x0 − x1 + x2 − x3 + …

Beweisskizze
Aufgrund der alternierenden Vorzeichen und der Monotonie von (xn )n P N
ist (s2n )n P N monoton fallend und (s2n + 1 )n P N monoton steigend. Da (xn )n P N
eine Nullfolge ist, gilt limn sn = infn s2n = supn s2n + 1 .

Beispiel
Nach dem Kriterium konvergiert die alternierende harmonische Reihe
1 1 1 1
∑ n ≥ 1 (−1)n − 1 = 1 − + − + …
n 2 3 4
Erst mit weitergehenden Methoden lässt sich der Wert bestimmen: Er
berechnet sich zu log(2).

1.0

0.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

-0.5

Die ersten Summanden und Partialsummen der alternierenden


harmonischen Reihe. Der Wert der Reihe ist
log(2) = 0,69314718055994530941…

© Oliver Deiser Grundzüge der Höheren Mathematik


158 2. Abschnitt Grundbegriffe der Analysis

Anschaulich klar ist:

Satz (Majoranten-Kriterium)
Sei ∑ n yn eine konvergente Reihe positiver reeller Zahlen. Weiter seien
(xn )n P N eine reelle Folge und n0 P N derart, dass
(+) |xn | ≤ yn für alle n ≥ n0 .
Dann konvergiert ∑ n xn . Ist n0 = 0, so gilt |∑ n xn | ≤ ∑ n |xn | ≤ ∑ n yn .

Beweisskizze
Wir zeigen mit Hilfe der Konvergenz von ∑ n yn und (+), dass die Folge
(sn )n P N der Partialsummen von ∑ n xn eine Cauchy-Folge ist.

Sind (xn )nPN und (yn )nPN wie im Satz, so sagen wir auch, dass die Reihe (xn )nPN
ab dem Index n0 durch (yn )n P N majorisiert wird.
Aus dem Majorantenkriterium und der Konvergenz der geometrischen Reihe
ergibt sich:

Satz (Quotienten-Kriterium)
Sei ∑ n xn eine unendliche Reihe mit xn ≠ 0 für alle n. Es gebe ein q P ] 0, 1 [
und ein n0 P N mit der Eigenschaft
xn + 1
(+)
| xn |≤q für alle n ≥ n0 .

Dann konvergiert ∑ n xn .

Beweisskizze
Ist q wie im Satz, so wird die Reihe ∑ n xn ab n0 durch die konvergente
Reihe |xn0 | ∑ n qn majorisiert. Aus dem Majorantenkriterium folgt die
Konvergenz.

Bemerkung: Zur Rolle von q


Es ist wichtig, dass es ein festes q < 1 mit der Eigenschaft (+) gibt. Es reicht
nicht, dass die Beträge der Quotienten im Betrag kleiner als 1 sind. Dies
zeigt die divergente harmonische Reihe. Hier gilt:
xn + 1 1/(n + 1) n
| xn |= 1/n
=
n+1
< 1 für alle n ≥ 1.

Die Abschätzung 999/1000 statt 1 auf der rechten Seite würde für das
Quotientenkriterium genügen. Eine 1 reicht nicht. Die geometrische Reihe
∑ n 1n divergiert, sodass wir keine konvergente Majorante von ∑ n xn
erhalten. Allgemein gilt: Konvergieren die Beträge der Quotienten
monoton steigend gegen 1, so ist das Kriterium nicht anwendbar. In diesem
Fall kann Divergenz oder Konvergenz vorliegen: Die Reihe ∑ n 1/n ist ein
Beispiel für Divergenz, die Reihe ∑ n 1/n2 eines für Konvergenz.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 159

Die Exponentialreihen

Die wichtigsten Reihen der Analysis sind:

Definition (Exponentialreihen)
Sei x P R. Dann heißt die Reihe ∑ n P N xn /n! die Exponentialreihe für x.

Satz (Konvergenz der Exponentialreihen)


Sei x P R. Dann konvergiert ∑ n xn /n! gegen exp(x).

Beweis
Sei x P R beliebig. Weiter sei n0 P N mit n0 ≥ 2|x|. Dann gilt

xn + 1 /(n + 1)! |x| 1


| xn /n! |= n+1

2
für alle n ≥ n0 .

Damit konvergiert die Exponentialreihe für x nach dem Quotientenkrite-


rium (mit q = 1/2).
Der Nachweis der Übereinstimmung mit exp(x) hängt davon ab, wie die
Exponentialfunktion eingeführt wird. Oft wird exp(x) durch die Reihe
∑ n xn /n! definiert, sodass nichts weiter zu zeigen ist. Alle Eigenschaften der
Exponentialfunktion werden dann aus der Exponentialreihe gewonnen.

Für alle x P R gilt also


xn x2 x3 xn
exp(x) = ex = ∑ n = 1 + x + + + … + + …
n! 2 6 n!
Die Konvergenz ist sehr schnell, sodass sich die Reihen zur effektiven numeri-
schen Berechnung eignen.

Berechnung der Eulerschen Zahl


Für x = 1 erhalten wir
1 1 1 1
e = exp(1) = ∑ n = 1 + 1 + + + … + + …
n! 2 6 n!
Die ersten Partialsummen für e sind
1, 2, 5/2, 8/3, 65/24, 163/60, 1957/720, 685/252, 109601/40320
In gerundeten Dezimalzahlen erhalten wir
1; 2; 2,5; 2,66667; 2,70833; 2,71667; 2,71806; 2,71825; 2,71828
Genauer gilt
e = 2,71828182845904523536028747135266249775724709369996…

© Oliver Deiser Grundzüge der Höheren Mathematik


160 2. Abschnitt Grundbegriffe der Analysis

2.5

2.0

1.5

1.0

0.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Die ersten Summanden und Partialsummen der Reihe ∑ n 1/n!


Der Wert der Reihe ist die Eulersche Zahl e

2.5

2.0

1.5

1.0

0.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Auch die Folge (xn )n ≥ 1 mit xn = (1 + 1/n)n konvergiert gegen e.


Die Konvergenz ist deutlich langsamer als die von ∑ n 1/n!

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 161

Übungen

Übung 1
Sei ∑ n xn eine konvergente unendliche Reihe. Zeigen Sie, dass die
Summanden eine Nullfolge bilden, d. h. es gilt
limn xn = 0.

Übung 2
Zeigen Sie, dass für alle z P C mit z ≠ 1 und alle n P N gilt:
1 − zn + 1
∑ 0 ≤ k ≤ n zk = .
1−z

Übung 3
1
Wir betrachten die Reihe ∑ n ≥ 1 .
n(n + 1)
(a) Berechnen Sie die Partialsummen s1 , …, s4 dieser Reihe.
(b) Formulieren Sie eine allgemeine Formel für die Partialsummen sn
der Reihe.
(c) Beweisen Sie Ihre Formel durch Induktion.
(d) Bestimmen Sie den Wert der Reihe.

Übung 4
Welche der folgenden Implikationen gelten für alle reellen unendlichen
Reihen ∑ n ≥ 1 xn ? Begründen Sie Ihre Antworten.

(a) Gilt xn > 0 für alle n ≥ 1, so gilt ∑ n ≥ 1 xn = ∞.

(b) Gilt xn ≥ 1/n für alle n ≥ 1, so gilt ∑ n ≥ 1 xn = ∞.

© Oliver Deiser Grundzüge der Höheren Mathematik


162 2. Abschnitt Grundbegriffe der Analysis

Lösungen zu den Übungen

Übung 1
Sei ∑ n xn eine konvergente unendliche Reihe. Zeigen Sie, dass die
Summanden eine Nullfolge bilden, d. h. es gilt
limn xn = 0.

Lösung zu Übung 1
Wir geben zwei verschiedene Argumente.

Verwendung der Limesregeln


Nach Voraussetzung konvergiert die Folge (sn )n P N der Partialsummen
der Reihe ∑ n xn . Wie für jede konvergente Folge ändert die Verschie-
bung um 1 den Grenzwert nicht, sodass

(+) limn sn = limn sn − 1 (mit s−1 = 0).

Für alle n P N gilt xn = sn − sn − 1 nach Definition der Partialsummen.


Nach den Limesregeln und (+) gilt also
limn xn = limn (sn − sn − 1 ) = limn sn − limn sn − 1 = 0.

Epsilon-Argument mit Dreiecksungleichung


Sei ε > 0 beliebig. Sei x = ∑ n xn = limn sn der Wert der Reihe. Dann gibt
ein n0 , sodass gilt:

|sn − x| < ε/2 für alle n ≥ n0 .

Damit gilt für alle n > n0 unter Verwendung der Dreiecksungleichung:

|xn| = |sn − sn − 1 |

= |sn − x + x − sn − 1|
≤ |sn − x| + |x − sn − 1|
< ε/2 + ε/2 = ε.

Dies zeigt, dass limn |xn | = 0. Folglich gilt auch limn xn = 0.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 163

Übung 2
Zeigen Sie, dass für alle z P C mit z ≠ 1 und alle n P N gilt:
1 − zn + 1
∑ 0 ≤ k ≤ n zk = .
1−z

Lösung zu Übung 2
Wir diskutieren drei verschiedene Argumente.

Vollständige Induktion
Sei z P C mit z ≠ 1. Wir zeigen die Summenformel für z durch
vollständige Induktion nach n ≥ 0.
Induktionsanfang n = 0:
Es gilt
1 − z0 + 1
∑ 0 ≤ k ≤ 0 zk = 1 = .
1−z

Induktionsschritt von n − 1 nach n ( für n ≥ 1):


Es gelte
1 − zn
∑ 0 ≤ k ≤ n − 1 zk = 1 = (Induktionsvoraussetzung)
1−z
Dann gilt
1 − zn
∑ 0 ≤ k ≤ n zk = ∑ 0 ≤ k ≤ n − 1 zk + zn =I.V. + zn =
1−z
1 − zn zn (1 − z) 1 − zn + 1
= + = .
1−z 1−z 1−z

Bildung einer Teleskopsumme


Seien z P C und n P N. Dann gilt
(1 − z)(1 + z + z2 + … + zn ) = 1 − z + z − z2 + z2 ± … − zn + zn − zn + 1
= 1 − zn + 1
Alle Summanden bis auf den ersten und letzten heben sich paarweise
auf. Ist z ≠ 1, so können wir durch 1 − z dividieren. Dies zeigt die
Behauptung.

Polynomdivision
Sei n ≥ 0. Dann besitzt das komplexe Polynom 1 − zn + 1 eine Nullstelle
bei 1. Die Polynomdivision von 1 − zn + 1 durch 1 − z liefert das Polynom
1 + … + zn (Abspalten der Nullstelle). Dies zeigt die Formel.

© Oliver Deiser Grundzüge der Höheren Mathematik


164 2. Abschnitt Grundbegriffe der Analysis

Übung 3
1
Wir betrachten die Reihe ∑ n ≥ 1 .
n(n + 1)
(a) Berechnen Sie die Partialsummen s1 , …, s4 dieser Reihe.
(b) Formulieren Sie eine allgemeine Formel für die Partialsummen sn
der Reihe.
(c) Beweisen Sie Ihre Formel durch Induktion.
(d) Bestimmen Sie den Wert der Reihe.

Lösung zu Übung 3
zu (a): Als unendliche Summe notiert lautet die Reihe:
1 1 1 1 1 1
+ + + + + + …
2 6 12 20 30 42
Die ersten Partialsummen berechnen sich zu
1 1 1 4 2
s1 = , s2 = + = = ,
2 2 6 6 3
2 1 9 3 3 1 16 4
s3 = + = = , s4 = + = = ,
3 12 12 4 4 20 20 5

zu (b): Für alle n ≥ 1 gilt:


1 n
sn = ∑ k ≤ n =
n(n + 1) n+1

zu (c): Wir zeigen die Formel in (b) durch Induktion nach n ≥ 1.


Induktionsanfang n = 1: Es gilt s1 = 1/2 = 1/(1 + 1).
Induktionsschritt von n nach n + 1:
Es gelte sn = n/(n + 1) (Induktionsvoraussetzung). Dann gilt
1 n 1
sn+1 = sn + = I. V. +
(n + 1)(n + 2) n+1 (n + 1)(n + 2)
n (n + 2) + 1 n2 + 2n + 1
= =
(n + 1) (n + 2) (n + 1) (n + 2)
(n + 1)2 (n + 1)
= = .
(n + 1) (n + 2) (n + 2)

zu (d): Es gilt
1 n
∑n ≥ 1 = limn sn = limn = 1.
n (n + 1) n+1

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Unendliche Reihen 165

Übung 4
Welche der folgenden Implikationen gelten für alle reellen unendlichen
Reihen ∑ n ≥ 1 xn ? Begründen Sie Ihre Antworten.

(a) Gilt xn > 0 für alle n ≥ 1, so gilt ∑ n ≥ 1 xn = ∞.

(b) Gilt xn ≥ 1/n für alle n ≥ 1, so gilt ∑ n ≥ 1 xn = ∞.

Lösung zu Übung 4
zu (a):
Die Implikation ist nicht für alle Reihen gültig. Für ein Gegenbeispiel
betrachten wir die Reihe ∑ n ≥ 1 xn mit xn = 1/2n für alle n ≥ 1, also die
geometrische Reihe für q = 1/2 ab 1. Dann gilt xn > 0 für alle n ≥ 1, aber
1 1 1 1
∑ n ≥ 1 xn = + + + … + + … = 1 < ∞.
2 4 8 2n

zu (b):
Die Implikation ist für alle Reihen gültig. Gilt xn ≥ 1/n für alle n ≥ 1, so
sind alle Partialsummen der Reihe ∑ n ≥ 1 xn größergleich den entspre-
chenden Partialsummen der harmonischen Reihe ∑ n ≥ 1 1/n. Damit gilt

∑ n ≥ 1 xn = limn ∑ 1 ≤ k ≤ n xk ≥ limn ∑ 1 ≤ k ≤ n 1/n = ∞.

© Oliver Deiser Grundzüge der Höheren Mathematik


4. Stetigkeit

Die Stetigkeit einer Funktion zählt zu den Grundbegriffen der modernen Ma-
thematik. Wir präzisieren die Anschauungen
Die Funktion macht keine Sprünge
Die Funktionswerte ändern sich wenig, wenn sich die Stellen hinreichend wenig ändern
durch zwei äquivalente Definitionen (Folgenstetigkeit und Umgebungsstetig-
keit). Anschauliche, aber nicht leicht zu beweisende Hauptsätze über stetige
Funktionen sind der Zwischenwertsatz und der Extremwertsatz (Annahme von
Maximum und Minimum).

Schlüsselbegriffe
Folgenstetigkeit
Unstetigkeit erster und zweiter Art
Umgebungsstetigkeit
Zwischenwertsatz
Extremwertsatz

© Oliver Deiser Grundzüge der Höheren Mathematik


168 2. Abschnitt Grundbegriffe der Analysis

Die Folgenstetigkeit

Anschaulich besagt die Stetigkeit einer reellen Funktion:


Die Funktion macht keine Sprünge.
Etwas genauer können wir das Nichtspringen an einer Stelle p des Definitions-
bereichs von f so formulieren:
Strebt x gegen p, so streben die Funktionswerte f(x) gegen f(p).
Mit Hilfe des Grenzwertbegriffs für Folgen gelangen wir zu einer genauen Defi-
nition:

Definition (Folgenstetigkeit)
Sei f : P → R, und sei p P P. Dann heißt f folgenstetig an der Stelle p, falls gilt:
Für alle Folgen (xn )n P N in P mit limn xn = p gilt limn f(xn ) = f(p).
Andernfalls heißt f folgenunstetig an der Stelle p. Wir nennen f folgenstetig,
falls f folgenstetig für alle p P P ist.

Bevor wir zu Beispielen und Gegenbeispielen kommen, betrachten wir drei


wichtige Aspekte.

Punktweise Begriffsbildung
Die Stetigkeit ist ein Beispiel für einen lokalen Begriff. Die Eigenschaft wird
zunächst für eine Stelle betrachtet. Gilt sie für alle Punkte des Definitions-
bereichs, so kommt sie der ganzen Funktion zu. Die Differenzierbarkeit ist
ein weiteres Beispiel hierfür, die Integrierbarkeit dagegen nicht.

Stetigkeit ist nur innerhalb des Definitionsbereichs erklärt


Die Stetigkeit ist nur für Stellen des Definitionsbereichs von f definiert. Ist
f : R* → R die Funktion mit f(x) = 1/x für alle x ≠ 0, so ist f weder stetig
noch unstetig im Nullpunkt, da f dort gar nicht definiert ist.

Vertauschbarkeit von Funktionsanwendung und Grenzwertbildung


In Kurzfassung besagt die Stetigkeit von f:
limn f(xn ) = f(limn xn )

Vertauschbarkeit von Operationen ist ein Grundmotiv der Mathematik. Der


Leser denke an Rechenregeln wir £x ⋅ y = £x ⋅ £y. Diese Regel besagt, dass die
Anwendung der Wurzelfunktion und die Multiplikation vertauschbar sind. Bei-
spiele für Grenzwerte haben wir in den Limesregeln kennengelernt, etwa
limn (c xn ) = c limn xn oder allgemeiner limn (xn ⋅ yn ) = limn xn ⋅ limn yn .

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 169

f(p) f(p)
f(x2 )

f(x1 )

f(x0 )

x0 x1 x2 p

Zur Folgenstetigkeit einer Funktion f an einer Stelle p ihres Definitionsbereichs:


Aus limn xn = p folgt stets limn f(xn ) = f(p)
Grenzwertbildung und Funktionsanwendung sind vertauschbar: limn f(xn ) = f(limn xn )).

f(p)
f(p)

f(x0 ) f(x1 ) f(x2 )

x0 x1 x2 p

Zur Folgenunstetigkeit von f bei p: Es gibt eine gegen p konvergente Folge (xn )n P N von
Stellen, deren Funktionswerte nicht gegen f(p) konvergieren. Ein Sprungstelle wie im
Diagramm ist ein Beispiel für diese Situation.

© Oliver Deiser Grundzüge der Höheren Mathematik


170 2. Abschnitt Grundbegriffe der Analysis

Beispiele
(1) Die Funktion abs : R → R mit abs(x) = |x| für alle x P R ist stetig. Der
„Knick“ im Nullpunkt ist unproblematisch für die Stetigkeit.
(2) Die Funktionen x, x2 , £x, 1/x, exp, log, sin, cos, … sind stetig (an allen
Stellen ihrer Definitionsbereiche). Allgemeiner kann man zeigen, dass
jede elementare Funktion stetig ist.
(3) Die Funktion f : R → R mit f(x) = 0 für x < 0 und f(x) = 1 für x ≥ 0 ist
unstetig im Nullpunkt und stetig sonst. Das Gleiche gilt für die
(dreiwertige) Vorzeichenfunktion sgn : R → R mit sgn(x) = −1 für x < 0,
sgn(0) = 0 und sgn(x) = 1 für x > 0.
(4) Ist P ⊆ R endlich, so ist jede Funktion f : P → R stetig. Denn jede
konvergente Folge in P ist schließlich konstant, und für diese Folgen
ist die Stetigkeitsbedingung immer erfüllt. Das Gleiche gilt für
Funktionen der Form f : N → R oder f : Z → R.

Nachweis der Stetigkeit an einer Stelle p


Wollen wir zeigen, dass eine Funktion f : P → R an der Stelle p stetig ist, so
betrachten wir eine beliebige Folge (xn )n P N in P, die gegen p konvergiert.
Wir zeigen nun, dass limn f(xn ) = f(p). Hierzu überprüfen wir die Konver-
genzbedingung für Folgen, d. h. wir zeigen:
∀ε > 0 ∃n0 ∀n ≥ n0 |f(xn ) − f(p)| < ε.

Nachweis der Unstetigkeit an einer Stelle p


Wollen wir zeigen, dass eine Funktion f : P → R an der Stelle p unstetig ist,
so müssen wir eine gegen p konvergente Folge (xn )n P N in P finden, die eine
der beiden folgenden Eigenschaften erfüllt:
(1) Der Limes von (f(xn ))n P N existiert, aber er ist von f(p) verschieden.
(2) Der Limes von (f(xn ))n P N existiert nicht.

Wir können die Unstetigkeit in zwei Typen unterteilen: Gibt es eine gegen p
konvergente Folge (xn )n P N in P ∩ ] −∞, p [ (links von p) oder P ∩ ] p, ∞ [ (rechts
von p), sodass limn f(pn ) nicht existiert, so heißt p eine Unstetigkeitsstelle zweiter
Art. Andernfalls heißt p eine Unstetigkeitsstelle erster Art.

Beispiele
(1) Die Vorzeichenfunktion sgn : R → R hat eine Unstetigkeit erster Art
bei 0. Allgemein gilt dies für jeden einfachen Sprung.
(2) Die Funktion f : R → R mit f(x) = sin(1/x), f(0) = 0 hat eine Unstetig-
keit zweiter Art im Nullpunkt. Dies ist typisch für stark oszillierende
Funktionen. Die Schwingungen verdichten sich bei 0, sodass wir eine
gegen 0 konvergente Folge von Stellen finden können, deren Werte
zwischen 1 und −1 springen. Wir diskutieren dies in den Übungen.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 171

Die Umgebungsstetigkeit

Es gibt eine zweite Formulierung der Stetigkeit, die der folgenden Anschau-
ung entspricht:
Die Funktionswerte ändern sich wenig, wenn sich die Stellen hinreichend wenig
ändern.

Definition (Umgebungsstetigkeit)
Sei f : P → R, und sei p P P. Dann heißt f umgebungsstetig oder ε-δ-stetig an
der Stelle p, falls gilt:
∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε) (ε-δ-Bedingung)
Andernfalls heißt f umgebungsunstetig an der Stelle p. Wir nennen f
umgebungsstetig, falls f umgebungsstetig für alle p P P ist.

Äquivalenz der beiden Stetigkeitsbegriffe


Man kann zeigen, dass die beiden Stetigkeitsbegriffe äquivalent sind. Für
jede Funktion und jedes Stelle p gilt: f ist genau dann folgenstetig bei p,
wenn f umgebungsstetig bei p ist. Wir sprechen deswegen kurz von
Stetigkeit bzw. Unstetigkeit.

Verlauf im Rechteck
Zur Erläuterung der Definition betrachten wir ein (klein gedachtes) ε und
das Intervall J = ] f(p) − ε, f(p) + ε [ auf der y-Achse. Unser ε lebt also auf der
y-Achse. Nun müssen wir ein (von ε abhängiges) δ > 0 finden, sodass alle
Stellen in I = ] x − δ, x + δ [ durch f nach J abgebildet werden (δ lebt auf der
x-Achse). Der Funktionsgraph von f verläuft auf I im Rechteck I × J mit
dem Mittelpunkt (p, f(p)).

Beispiel
Wir betrachten die Gerade f : R → R mit f(x) = 10x und zeigen die Umge-
bungsstetigkeit von f im Nullpunkt. Sei hierzu ε > 0 beliebig. Wir setzen
δ = ε/10.
Dann gilt für alle x P ] −δ, δ [ = ] −ε/10, ε/10 [, dass f(x) P ] −ε, ε [ (denn f
verzehnfacht die Stellen). Also ist f umgebungsstetig im Nullpunkt. Dieses
einfache Beispiel illustriert die Abhängigkeit der Größe δ von ε. Grob
gesprochen gilt: Je kleiner ε ist und je stärker sich die Funktion f in kleinen
Umgebungen von p verändert, desto kleiner müssen wir δ wählen.
Konstante Funktionen sind Extrembeispiele: Hier ist jedes δ geeignet. Für
eine Funktion wie die Exponentialfunktion exp benötigen wir dagegen für
ein großes positives p und ε = 1 ein winziges δ > 0, um den Graphen von
exp an der Stelle p in ein ε-δ-Rechteck zu zwingen.

© Oliver Deiser Grundzüge der Höheren Mathematik


172 2. Abschnitt Grundbegriffe der Analysis

f(p)+

f(p) 2

f(p)-

f 2

p- p p+

Zur Umgebungsstetigkeit von f bei p: Für jedes ε > 0 existiert ein δ > 0, sodass f im
Intervall ] p − δ, p + δ [ ganz innerhalb des durch δ und ε definierten Rechtecks mit
Mittelpunkt (p, f(p)) verläuft. Die Größe δ wird in Abhängigkeit von ε gewählt. Ist δ
geeignet, so ist auch jede kleinere positive Größe δ′ geeignet.

2
f(p)+

f(p) 2

f(p)-

p- p p+

Zur Umgebungsunstetigkeit von f bei p: Es gibt ein ε > 0, sodass die Funktion für jedes
noch so kleine δ > 0 aus dem durch δ und ε definierten Rechteck ausbricht. Im
Diagramm liegt f links von p nicht im Rechteck, wie klein δ auch gewählt wird.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 173

Der Zwischenwertsatz

Satz (Zwischenwertsatz)
Sei f : [ a, b ] → R stetig. Dann nimmt f jeden Wert zwischen f(a) und f(b) an.

Um diesen Satz zu beweisen, genügt es zu zeigen:

Satz (Nullstellensatz)
Sei g : [ a, b ] → R stetig und g(a) und g(b) haben verschiedene Vorzeichen,
d. h. sgn(g(a)) ≠ sgn(g(b)). Dann besitzt g eine Nullstelle.

Beweis des Zwischenwertsatzes mit Hilfe des Nullstellensatzes


Sei c eine reelle Zahl zwischen f(a) und f(b). Weiter sei g : [ a, b ] → R die
Funktion mit g(x) = f(x) − c für alle x. Dann ist g stetig und g(a) und g(b)
haben verschiedene Vorzeichen. Nach dem Nullstellensatz gibt es ein x mit
g(x) = 0. Dann gilt f(x) = g(x) + c = 0 + c = c, sodass die Funktion f den Wert
c annimmt.

Der Nullstellensatz lässt sich durch Intervallschachtelung elegant beweisen:

Beweis des Nullstellensatzes


Ein Teilintervall [ c, d ] von [ a, b ] heißt gut (für diesen Beweis), falls g(c) und
g(d) verschiedene Vorzeichen haben. Wir konstruieren eine Intervall-
schachtelung I0 ⊇ I1 ⊇ I2 ⊇ … ⊇ In ⊇ … guter Intervalle rekursiv wie folgt:
Zunächst sei I0 = [ a, b ]. Im Rekursionsschritt von n nach n + 1 halbieren wir
das Intervall In in zwei gleichlange Teilintervalle J1 und J2 . Ist J1 gut, so
setzen wir In + 1 = J1 . Andernfalls ist J2 gut und wir setzen In + 1 = J2 .
Sei p das eindeutige Element im Durchschnitt aller Intervalle. Weiter seien
(xn )n P N und (yn )n P N die Folgen der linken bzw. rechten Intervallgrenzen.
Dann gilt limn xn = limn yn = p. Da g an der Stelle p stetig ist, gilt
(+) limn g(xn ) = g(p) = limn g(yn ).
Da alle Intervalle gut sind, haben g(xn ) und g(yn ) für alle n verschiedene
Vorzeichen. Damit gilt g(p) = 0 in (+) (denn im Fall g(p) ≠ 0 hätten alle
g(xn ), g(yn ) ab einem Index n0 das gleiche Vorzeichen). Also ist p eine
Nullstelle von g.

Bisektionsverfahren zur approximativen Nullstellenberechnung


Aus dem Beweis gewinnen wir ein effektives Berechnungsverfahren:
Zunächst wissen wir, dass eine Nullstelle in [ a, b ] existiert. Nach n
Bisektionen des Intervalls haben wir ein Intervall In gefunden, das eine
Nullstelle enthält. Die Länge dieses Intervalls ist (b − a)/2n , sodass wir
bereits nach wenigen Schritten eine Nullstelle sehr gut eingrenzen können.

© Oliver Deiser Grundzüge der Höheren Mathematik


174 2. Abschnitt Grundbegriffe der Analysis

Beispiel
Wir betrachten die stetige Funktion f : [ 0, 1 ] → R mit
f(x) = sin(5x) + 1/3 cos(18x) + 1/10 für alle x P [ 0, 1 ].
Es gilt f(0) > 0 und f(1) < 0, sodass f eine Nullstelle besitzt.

1.5

1.0

f
0.5

0.2 0.4 0.6 0.8 1.0

-0.5

-1.0

Approximation einer Nullstelle mit Hilfe des Bisektionsverfahrens

Das Bisektionsverfahren liefert ausgehend von I0 = [ 0, 1 ] die Intervalle


I1 = [1/2, 1] I2 = [ 1/2, 3/4 ]
I3 = [5/8, 3/4] I4 = [ 11/16, 3/4 ]
I5 = [11/16, 23/32] I6 = [ 45/64, 23/32 ]
I7 = [91/128, 23/32] I8 = [ 91/128, 183/256 ]
I9 = [365/512, 183/256] I10 = [ 731/1024, 183/256 ]
An den Intervallgrenzen hat die Funktion unterschiedliche Vorzeichen. Mit
gerundeten Werten gilt
f(731/1024) = 0,00523332 f(183/256) = −0,000891473
Nach 20 Bisektionen erhalten wir
I20 = [ a20 , b20 ] = [ 749419/1048576, 187355/262144 ]
und die gerundeten Werte
f(a20 ) = 5,24154 ⋅ 10−6 , f(b20 ) = −7,7043 ⋅ 10−7 .

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 175

Der Extremwertsatz

Satz (Extremwertsatz von Weierstraß)


Sei f : [ a, b ] → R stetig. Dann nimmt die Funktion f ihr Maximum an, d. h.
es es gibt ein p P [ a, b ] mit
f(x) ≤ f(p) für alle x P [ a, b ].
Analog nimmt f ihr Minimum an.

Der Satz ist etwas schwieriger zu beweisen als der Zwischenwertsatz. Nützlich
hierzu ist folgender für sich interessante Satz:

Satz (Existenz konvergenter Teilfolgen, Satz von Bolzano-Weierstraß)


Jede beschränkte Folge (xn )n P N in R besitzt eine konvergente Teilfolge.

Beweis
Da die Folge beschränkt ist, gibt es ein Intervall [ a, b ], das alle Folgenglie-
der enthält. Wir bilden eine Intervallschachtelung, indem wir das Intervall
wiederholt in zwei gleichlange Teile teilen und dabei immer einen Teil
wählen, der immer noch unendlich viele Folgenglieder enthält. Nun
konstruieren wir eine Teilfolge der Folge derart, dass für alle n das n-te
Glied dieser Folge im n-ten konstruierten Intervall liegt. Dann konvergiert
diese Teilfolge gegen den Punkt im Durchschnitt aller Intervalle.

Damit können wir den Extremwertsatz zeigen:

Beweis des Extremwertsatzes


Wir zeigen, dass das Maximum angenommen wird. Der Beweis für das
Minimum ist analog (oder ergibt sich durch Betrachtung von −f). Wir
setzen
s = sup({ f(x) | x P [ a, b ] }) ≤ ∞.
Dann gibt es eine monoton steigende Folge (f(xn ))n P N von Funktionswer-
ten, die gegen s konvergiert. Die Folge (xn )n P N der Stellen ist eine Folge in
[ a, b ]. Nach dem Satz von Bolzano-Weierstraß gibt es eine konvergente
Teilfolge (yn )n P N von (xn )n P N . Sei p = limn yn . Dann gilt p P [ a, b ] und
s = limn f(yn ) = f(limn yn ) = f(p).
Damit ist s < ∞ und f nimmt ihr Maximum an der Stelle p an.

Der Beweis des Satzes führt nicht unmittelbar zu einem Berechnungsverfah-


ren. Im nächsten Kapitel werden wir sehen, wie wir − unter stärkeren Vorausset-
zungen an die Funktion − Maxima und Minima mit Methoden der Differential-
rechnung bestimmen können.

© Oliver Deiser Grundzüge der Höheren Mathematik


176 2. Abschnitt Grundbegriffe der Analysis

Übungen

Übung 1
Sei f : R → R die Funktion mit

x≠0
f(x) =
{ sin(1/x)
0
falls
falls x=0

(a) Skizzieren Sie die Funktion f.


(b) Geben Sie eine Nullfolge (xn )n P N in ] 0, ∞ [ an derart, dass limn f(xn )
nicht existiert (und also f unstetig zweiter Art bei 0 ist).

Übung 2
Weisen Sie sowohl mit Hilfe der Folgenstetigkeit als auch mit Hilfe der
Umgebungsstetigkeit nach, dass die Vorzeichenfunktion sgn : R → R mit
sgn(x) = −1 für x < 0, sgn(0) = 0, sgn(x) = 1 für x > 0
im Nullpunkt unstetig ist.

Übung 3
(a) Wir definieren f : R → R durch
f(x) = 1, falls x rational,
f(x) = 0, falls x irrational.
(b) Wir definieren g : R → R durch
g(x) = x, falls x rational,
g(x) = − x, falls x irrational.
An welchen Stellen sind die Funktionen f und g stetig bzw. unstetig? Von
welcher Art sind die Unstegigkeitsstellen? Begründen Sie Ihre Antworten.

Übung 4
Zeigen Sie, dass die Voraussetzungen der Abgeschlossenheit und Be-
schränktheit des Definitionsbereichs und die der Stetigkeit wesentlich für
die Gültigkeit des Extremwertsatzes sind, indem Sie Funktionen f, g, h
angeben, die ihr Maximum nicht annehmen und die folgende Form haben:
(a) f : ] 0, 1 [ → R ist stetig
(b) g : [ 0, ∞ [ → R ist stetig.
(c) h : [ −1, 1 ] → R ist an genau einer Stelle unstetig.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 177

Lösungen zu den Übungen

Übung 1
Sei f : R → R die Funktion mit

x≠0
f(x) =
{ sin(1/x)
0
falls
falls x=0

(a) Skizzieren Sie die Funktion f.


(b) Geben Sie eine Nullfolge (xn )n P N in ] 0, ∞ [ an derart, dass limn f(xn )
nicht existiert (und also f unstetig zweiter Art bei 0 ist).

Lösung zu Übung 1
zu (a):
1.0

0.5

-3 -2 -1 1 2 3

-0.5

-1.0

Die Funktion f : R → R. Die Nullstelle bei 0 ist im Diagramm aufgrund der


starken Oszillation der Funktion nicht sichtbar.

zu (b): Sei x > 0. Dann gilt f(x) = 1 genau dann, wenn es ein a P N gibt mit
1/x = π/2 + a 2π, d. h. wenn
1 2
x = =
π/2 + a 2 π (4a + 1) π
Analog gilt f(x) = −1, wenn es ein a P N gibt mit
1 2
x = =
3/2π + a 2 π (4a + 3) π
Wir definieren also x0 , x1 , x2 , x3 , …, xn , … als die Folge
2 2 2 2 2
, , , , …, , …
π 3π 5π 7π (2n + 1)π
Dann ist f(x0 ), f(x1 ), f(x2 ), … die divergente Folge 1, −1, 1, −1, …

© Oliver Deiser Grundzüge der Höheren Mathematik


178 2. Abschnitt Grundbegriffe der Analysis

Übung 2
Weisen Sie sowohl mit Hilfe der Folgenstetigkeit als auch mit Hilfe der
Umgebungsstetigkeit nach, dass die Vorzeichenfunktion sgn : R → R mit
sgn(x) = −1 für x < 0, sgn(0) = 0, sgn(x) = 1 für x > 0
im Nullpunkt unstetig ist.

Lösung zu Übung 2
Nachweis mit Hilfe der Folgenstetigkeit
Die Folgenstetigkeit an der Stelle 0 lautet für sgn:
(1) Für alle Folgen (xn )n P N mit limn xn = 0 gilt limn sgn(xn ) = sgn(0).
Wegen sgn(0) = 0 erhalten wir:
(2) Für alle Folgen (xn )n P N mit limn xn = 0 gilt limn sgn(xn ) = 0.
Die Verneinung dieser Aussage (Unstetigkeit im Nullpunkt) ist
(3) Es gibt eine Folge (xn )n P N mit limn xn = 0 und limn sgn(xn ) ≠ 0.
Zum Beweis dieser Aussage betrachten wir die Folge (1/n)n ≥ 1 . Dann gilt
limn 1/n = 0,
limn sgn(1/n) = limn 1 = 1 ≠ 0.

Nachweis mit Hilfe der Umgebungsstetigkeit


Die ε-δ-Stetigkeit an der Stelle 0 lautet für sgn:
(1) ∀ε > 0 ∃δ > 0 ∀x (|x − 0| < δ → |sgn(x) − sgn(0)| < ε.
Wegen sgn(0) = 0 erhalten wir:
(2) ∀ε > 0 ∃δ > 0 ∀x (|x| < δ → |sgn(x) | < ε).
Die Verneinung dieser Aussage (Unstetigkeit im Nullpunkt) ist
(3) ∃ε > 0 ∀δ > 0 ∃x (|x| < δ ∧ |sgn(x)| ≥ ε).
Zum Beweis dieser Aussage betrachten wir ε = 1. Ist nun δ > 0 beliebig,
so sei x = δ/2. Dann ist |x| < δ und |sgn(x)| = 1 ≥ ε.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Stetigkeit 179

Übung 3
(a) Wir definieren f : R → R durch
f(x) = 1, falls x rational,
f(x) = 0, falls x irrational.
(b) Wir definieren g : R → R durch
g(x) = x, falls x rational,
g(x) = − x, falls x irrational.
An welchen Stellen sind die Funktionen f und g stetig bzw. unstetig? Von
welcher Art sind die Unstegigkeitsstellen? Begründen Sie Ihre Antworten.

Lösung zu Übung 3
zu (a):
Die Funktion f ist an allen Stellen unstetig. Jede Stelle ist eine
Unstetigkeitsstelle zweiter Art. Um dies einzusehen betrachten wir ein
beliebiges p P R. Da in jedem Intervall der Form ] p − ε, p [, ε > 0 sowohl
rationale als auch irrationale Zahlen liegen, gibt es eine monoton
steigende Folge (xn )n P N mit
(1) limn xn = p,
(2) xn ist rational für alle geraden n,
(3) xn ist irrational für alle ungeraden n.
Dann gilt ((f(xn ))n P N = (1, 0, 1, 0, 1, 0, …), sodass die Folge nicht
konvergiert. Diese zeigt die Unstetigkeit zweiter Art an der Stelle p.
zu (b):
Die Funktion g ist im Nullpunkt stetig, an allen anderen Stellen aber
unstetig. Alle Unstetigkeitsstellen sind zweiter Art. Für die Stetigkeit im
Nullpunkt betrachten wir eine Nullfolge (xn )n P N . Dann gilt
limn |g(xn )| = limn |xn | = 0.
Damit ist (|g(xn )|)n P N und folglich auch (g(xn ))n P N eine Nullfolge.
Wegen g(0) = 0 ist also g stetig bei 0.
Für die Unstetigkeit sei p ≠ 0 beliebig und (xn )n P N wie in (a). Dann gilt
limn g(x2n ) = limn x2n = p,
limn g(x2n + 1 ) = limn − x2n + 1 = −p.
Wegen p ≠ 0 sind die beiden Grenzwerte verschieden. Damit ist
g(xn )n P N divergent (da jede Teilfolge einer konvergenten Folge gegen
den gleichen Grenzwert konvergiert). Dies zeigt die Unstetigkeit
zweiter Art an der Stelle p.

© Oliver Deiser Grundzüge der Höheren Mathematik


180 2. Abschnitt Grundbegriffe der Analysis

Übung 4
Zeigen Sie, dass die Voraussetzungen der Abgeschlossenheit und Be-
schränktheit des Definitionsbereichs und die der Stetigkeit wesentlich für
die Gültigkeit des Extremwertsatzes sind. Geben Sie hierzu Funktionen
f, g, h an, deren Wertebereich kein Maximum besitzt und die folgende Form
haben:
(a) f : ] 0, 1 [ → R ist stetig.
(b) g : [ 0, ∞ [ → R ist stetig.
(c) h : [ −1, 1 ] → R ist an genau einer Stelle unstetig.

Lösung zu Übung 4
zu (a):
Wir definieren f als die Identität auf dem offenen Intervall ] 0, 1 [, sodass
f(x) = x für alle x P ] 0, 1 [. Dann ist f stetig und der Wertebereich ] 0, 1 [
von f besitzt kein Maximum.
zu (b):
Wir definieren g als die Identität auf dem Intervall [ 0, ∞ [, sodass f(x) = x
für alle x ≥ 0. Dann ist g stetig und der Wertebereich [ 0, ∞ [ von g besitzt
kein Maximum.
zu (c):
Wir definieren h : [ −1, 1 ] → R durch
h(x) = −|x| für x P [ −1, 1 ] mit x ≠ 0,
h(0) = −1
Dann ist h genau an der Stelle 0 unstetig. Der Wertebereich [ −1, 0 [ von
h besitzt kein Maximum.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Abschnitt

Ableitungen und Integrale

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Differenzierbarkeit

Durch je zwei Punkte eines Funktionsgraphen können wir eine eindeutige Ge-
rade legen, eine sogenannte Sekante der Funktion. Je näher die Punkte beieinan-
der liegen, desto ähnlicher wird − unter gewissen Voraussetzungen − die Sekante
der Funktion im betrachteten kleinen Ausschnitt. Halten wir einen Punkt fest, so
gelangen wir durch einen Grenzübergang zum Begriff der Differenzierbarkeit
einer Funktion an einer Stelle. Die Güte der lokalen Ersetzung einer Funktion
durch eine Tangente formulieren wir im Approximationssatz. In einem knappen
Überblick stellen wir wichtige Ergebnisse der Kurvendiskussion zusammen. Sie
zeigen, wie sich der Verlauf einer differenzierbaren Funktion mit Hilfe ihrer Ab-
leitungen analysieren lässt.

Schlüsselbegriffe
Differenzenquotient
Differenzierbarkeit, Ableitung
Tangente
linearer Approximationssatz
Kurvendiskussion (Monotonie, kritische Punkte, lokale Extrema)

© Oliver Deiser Grundzüge der Höheren Mathematik


184 3. Abschnitt Ableitungen und Integrale

Grenzwerte für Funktionen

Die Differenzierbarkeit ist eine Verstärkung der Stetigkeit. Wie die Stetigkeit
ist sie ein lokaler Begriff. Anschaulich bedeutet die Differenzierbarkeit einer
Funktion f : P → an einer Stelle p ihres Definitionsbereichs:
Die Funktion hat an der Stelle p keinen Knick
Genauer:
Die Funktion lässt sich an der Stelle p durch eine Gerade approximieren.
Zur Präzisierung benötigen wir einen Grenzwertbegriff für Funktionen. Er-
neut lässt er sich auf den Grenzwertbegriff für Folgen zurückführen:

Notation: Grenzwerte für Funktionen


Seien f : P → R und a, p P R. Ein Ausdruck limx →p f(x) = a bedeutet:
(1) Es gibt eine Folge (xn )n P N in P mit limn xn = p.
(2) Für jede Folge (xn )n P N in P mit limn xn = p gilt limn f(xn ) = a.
Allgemeiner lassen wir auch symbolische Stellen p = ± ∞ und Werte a = ± ∞
zu. Oft sind auch zusätzliche Bedingungen nützlich, vor allem
limx ↓ p f(x) = limx → p, x > p f(x), limx ↑ p f(x) = limx → p, x < p f(x)
für die Annäherung von oben bzw. unten an p.

Stellen im Definitionsbereich und am Rand


Die Bedingung (1) ist immer erfüllt, wenn p P P. Sie ist aber auch erfüllt,
wenn p ein Grenzpunkt von P ist (und dies ist der interessantere Fall).
So gilt die erste Bedingung etwa für P = ] 0, 1 [ und p = 0, 1/2, 1. Gilt
limx → p f(x) = a für ein p P P, so ist notwendig a = f(p) (da die konstante
Folge (p)n P N in P ist). In diesem Fall ist also f stetig in p.

Beispiele
(1) limx →0 x2 = 0 = 02
x2 − 1 (x + 1) (x − 1)
(2) limx → −1 = limx → −1 = limx → −1 (x − 1) = −2.
x+1 x+1
(3) limx ↓ 0 1/x = limx → 0, x > 0 1/x = ∞

limx ↑ 0 1/x = limx → 0, x < 0 1/x = −∞

limx ↓ 0 log(x) = −∞, limx ↑ 0 log(x) ist nicht erklärt

(4) limx → ∞ 1/x = 0, limx → ∞ £x = ∞

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Differenzierbarkeit 185

Differentialquotienten

Definition (Differentialquotient, Ableitung, Differenzierbarkeit)


Sei f : P → R, und sei p P R. Existiert
f(x) − f(p)
a = limx →p P R,
x−p
so heißt f differenzierbar an der Stelle p und a die Ableitung oder der
Differentialquotient von f an der Stelle p.

Wir betrachten drei Aspekte genauer:

1. Differenzenquotienten
Ist x P P mit x ≠ p, so heißt
f(x) − f(p)
a(x, p) =
x−p
der Differenzenquotient von f an den Stellen p, x. Dieser Wert ist die
Steigung der Geraden, die durch die Punkte (p, f(p)) und (x, f(x)) verläuft.

2. Grenzübergang zu Differentialquotienten
Im Fall der Existenz ist die Ableitung von f an der Stelle p der Grenzwert
der Differenzenquotienten:
f ′(p) = limx →p a(x, p).
Anschaulich lässt sich f ′(p) als die Steigung von f an der Stelle p deuten.
Der Differenzenquotient a(x, p) ist als Funktion in x an der Stelle p nicht
definiert. Hier verwenden wir, dass in limx → p a(x, p) die Stelle p nicht im
Definitionsbereich liegen muss. Die Differenzierbarkeit besagt, dass sich
a(x, p) stetig im Punkt p fortsetzen lässt (durch die Setzung a(p, p) = f ′(p)).

3. Stetigkeit ist notwendig, aber nicht hinreichend für Differenzierbarkeit


Der Nenner x − p in
f(x) − f(p)
limx → p
x−p
konvergiert gegen 0. Damit der Grenzwert in R existiert, ist es notwendig,
dass der Zähler gegen 0 konvergiert. Also muss
limx →p f(x) = f(p)
gelten, d. h. f muss stetig in p sein. Ist f stetig in p, so ist der Grenzwert
lima → p a(x, p) vom Typ „0/0“, sodass seine Existenz keineswegs selbstver-
ständlich ist. Die Betragsfunktion abs : R → R mit abs(x) = |x| für alle
x P R ist stetig, aber nicht differenzierbar bei 0 (vgl. die Übungen).

© Oliver Deiser Grundzüge der Höheren Mathematik


186 3. Abschnitt Ableitungen und Integrale

Beispiele
(1) Sei f : R → R eine konstante Funktion mit konstantem Wert c P R.
Weiter sei p P R. Dann gilt
f(x) − f(p) c−c
f ′(p) = limx → p = limx → p = limx →p 0 = 0.
x−p x−p

(2) Für die Identität id : R → R mit id(x) = x und p P R gilt:


id(x) − id(p) x−p
id′(p) = limx → p = limx → p = limx →p 1 = 1.
x−p x−p

(3) Für die Einheitsparabel sq : R → R mit sq(x) = x2 und p P R gilt:


sq(x) − sq(p) x2 − p2
sq′(p) = limx → p = limx → p
x−p x−p
(x + p)(x − p)
= limx → p = limx →p (x + p) = 2p.
x−p

Äquivalente h-Formulierung des Grenzwerts


Setzen wir h = x − p, so gilt x = h + p und „x → p“ ist äquivalent zu „h → 0“.
Damit erhalten wir
f(x) − f(p) f(p + h) − f(p)
f ′(p) = limx →p = limh →0 .
x−p h

Welche Form besser ist, ist kontextabhängig und letztendlich Geschmackssache.

Beispiel
Für die Einheitsparabel und p P R lautet die Berechnung der Ableitung mit
Hilfe der der h-Formulierung
sq(p + h) − sq(p) (p + h)2 − p2
sq′(p) = limh → 0 = limh → 0
h h
p2 + 2ph + h2 − p2
= limh → 0 = limh → 0 (2p + h) = 2p.
h

Notation
Sei f : P → R differenzierbar in p P P. Dann schreiben wir
d df(x) df(x)
f ′(p) = Df (p) = f(x) = = (p)
dx x=p dx x=p dx

Die Notation df(x)/dx ist eine „infinitesimale Version“ der Delta-Notation


∆f(x)/∆x für Differenzenquotienten: Änderung der Werte geteilt durch
Änderung der Stellen. Die Notation ist den reellen Zahlen symbolisch,
df(x)/dx ist kein Quotient zweier Elemente von R.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Differenzierbarkeit 187

Tangenten und lineare Approximation

Definition (Tangente)
Sei f : P → R differenzierbar in p P P. Dann heißt die Gerade g : R → R mit
g(x) = f(p) + f ′(p) (x − p) für alle x P R
die Tangente von f an der Stelle p.

Die Zahl a = f ′(p) können wir als „Kürzel“ oder „Code“ für die Tangente von
f an der Stelle p ansehen.

Grundidee der Differentialrechnung


Ersetze eine Funktion f lokal durch eine einfachere Funktion.

Die einfachste Approximation ist, f durch die konstante Funktion f(p) zu erset-
zen. Dies ist aber in der Regel zu ungenau. Die Tangente ist schon deutlich bes-
ser. Die Güte der Approximation beschreibt:

Satz (linearer Approximationssatz)


Sei f : P → R differenzierbar an der Stelle p mit Tangente g : R → R.
Weiter sei r : P → R mit r(x) = f(x) − g(x) für alle x P P. Dann gilt:
(1) f(x) = g(x) + r(x) für alle x P P.
r(x)
(2) limx → p = 0.
x−p

Beweis
Aussage (1) gilt nach Definition von r. Für (2) rechnen wir:
r(x) f(x) − (f(p) + f ′(p)(x − p))
limx →p = limx → p
x−p x−p
f(x) − f(p)
= limx → p − f ′(p) = f ′(p) − f ′(p) = 0.
x−p

Der Satz kann lässt sich so interpretieren:

Tangente plus kleiner Rest


In der Nähe von p ist f ihre Tangente plus ein kleiner Rest. Die Restfunk-
tion r(x) konvergiert schneller als linear gegen 0, wenn x gegen p konvergiert
(Aussage (2) des Satzes). Wir schreiben auch
f(x) = g(x) + o(x − p) für x → p (Landau-Notation)
wobei der symbolische Term o(x − p) für den „kleinen Rest“ wie im Satz
steht, also für eine Funktion r : P → R mit limx → p r(x)/(x − p) = 0.

© Oliver Deiser Grundzüge der Höheren Mathematik


188 3. Abschnitt Ableitungen und Integrale

Die Ableitung als Funktion

Bislang haben wir die Ableitung einer Funktion lokal betrachtet. Nun fassen
wir alle Ableitungen zu einer Funktion zusammen.

Definition (Differenzierbarkeit, erste und zweite Ableitung)


Eine Funktion f : P → R heißt differenzierbar, wenn f an allen Stellen p P P
differenzierbar ist. In diesem Fall heißt f ′ : P → R die erste Ableitung von f.
Ist f ′ stetig, so heißt f stetig differenzierbar. Ist f ′ differenzierbar, so heißt
f ″ : P → R mit f ″ = (f ′)′ die zweite Ableitung von f.

Interpretation der ersten und zweiten Ableitung


(1) Die erste Ableitung gibt an jeder Stelle die Steigung von f an.
(2) Die zweite Ableitung ist ein Maß für die Krümmung von f, entspricht
ihr aber nicht direkt. Die Funktion x2 hat beispielsweise eine konstante
zweite Ableitung, aber keine konstante Krümmung. Es gilt: Ist f ″
positiv, so ist f linksgekrümmt (wie x2 ), andernfalls ist f rechtsge-
krümmt (wie −x2 ).
(3) Unter einer physikalischen Interpretation, bei der wir eine zeitliche
Variable t betrachten, gilt: f ′(t) ist die Geschwindigkeit eines sich
gemäß f(t) auf der x-Achse bewegenden Teilchens zur Zeit t , f ″(t)
seine Beschleunigung zur Zeit t.

Der anschauliche Krümmungsbegriff lässt sich leicht präzisieren: Eine auf ei-
nem Intervall I definierte Funktion f : I → R heißt linksgekrümmt oder konvex,
falls f zwischen je zwei Stellen unterhalb der durch die Stellen definierten Gera-
den liegt. Weiter heißt f rechtsgekrümmt oder konkav, falls −f linksgekrümmt ist.
Die Funktion x2 und ex sind konvex, die Funktionen £x und log(x) dagegen kon-
kav. Die Sinusfunktion ist konkav auf [ 0, π ] und konvex auf [ π, 2π ].

Definition (höhere Ableitungen)


Sei f : P → R. Wir setzen f (0) = f und definieren rekursiv solange möglich
die höheren Ableitungen von f durch
f (n + 1) = (f (n) )′ für alle n P N,
Existiert f (n) für alle n P N, so heißt f glatt.

Die Ableitungsfolge von f lautet also


f (0) = f , f ′ = f (1) , f ″ = f (2) , f ″′ = f (3) , …, f (n) , …
Die runden Klammern unterschieden die Ableitung von der Potenz.
Unter der physikalischen Interpretation können wir die dritte Ableitung f (3) (t)
als „Ruck“ interpretieren (lokale Änderung der Beschleunigung).

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Differenzierbarkeit 189

Kurvendiskussion

Eine Funktion lässt sich mit Hilfe ihrer Ableitungen analysieren. Wir fassen
die wichtigsten Ergebnisse der sog. Kurvendiskussion zusammen. Im Folgenden
bezeichnet I ein beliebiges reelles Intervall. Weiter schreiben wir „f > 0“, wenn
„f(x) > 0 für alle Stellen x“ gilt. Analoges gilt für ≥, < und ≤. Grundlegend ist:

Satz (Monotoniesatz)
Sei f : I → R differenzierbar. Dann gilt:
(a) f ′ ≥ 0 genau dann, wenn f ist monoton steigend.
(b) f ′ ≤ 0 genau dann, wenn f ist monoton fallend.
(c) f ′ > 0 impliziert f ist streng monoton steigend.
(d) f ′ < 0 impliziert f ist streng monoton fallend.

Wir sagen, dass f bei p einen Hochpunkt oder ein lokales Maximum besitzt, falls
es ein ε > 0 gibt mit f(p) ≥ f(x) für alle x P Uε (p) ∩ P. Gilt „>“ für x ≠ p statt „≥“,
so heißt der Hochpunkt strikt. Analog ist ein Tiefpunkt (lokales Minimum) defi-
niert. Ein Hoch- oder Tiefpunkt heißt auch ein lokales Extremum.
Ein p heißt kritischer Punkt oder kurz kritisch für f, falls f ′(p) = 0. Kritische
Punkte sind Kandidaten für lokale Extrema:

Satz (notwendiges Kriterium für lokale Extrema)


Sei f : I → R differenzierbar, und sei p P I kein Randpunkt von I. Dann
gilt: Hat f bei p ein lokales Extremum, so ist p kritisch.

Die Funktion x3 und p = 0 zeigen, dass ein kritischer Punkt keinem Extremum
entsprechen muss. Hinreichend für einen Hochpunkt ist ein Vorzeichenwechsel
der ersten Ableitung oder eine von Null verschiedene zweite Ableitung:

Satz (Extremwertbestimmung mit Hilfe der ersten Ableitung)


Sei f : I → R differenzierbar, und sei p P I kritisch für f. Dann gilt:
(a) Wechselt f ′ bei p das Vorzeichen von Plus (größer 0) nach Minus
(kleiner 0), so hat f bei p einen strikten Hochpunkt.
(b) Wechselt f ′ bei p das Vorzeichen von Minus nach Plus, so hat f bei p
einen strikten Tiefpunkt.

Satz (Extremwertbestimmung mit Hilfe der zweiten Ableitung)


Sei f : I → R zweimal differenzierbar und p P I kritisch für f. Dann gilt:
(a) Ist f ″(p) < 0, so hat f bei p einen strikten Hochpunkt.
(b) Ist f ″(p) > 0, so hat f bei p einen strikten Tiefpunkt.

© Oliver Deiser Grundzüge der Höheren Mathematik


190 3. Abschnitt Ableitungen und Integrale

Übungen

Übung 1
Sei abs : R → R die Betragsfunktion, d. h. es gilt abs(x) = |x| für alle x P R.
Zeigen Sie, dass die Funktion abs im Nullpunkt nicht differenzierbar ist.

Übung 2
Sei n P N* beliebig. Weiter sei f : R → R definiert durch f(x) = xn für alle
x P R. Schließlich sei p P R. Zeigen Sie durch Berechnung des Differential-
quotienten, dass
f ′(p) = n pn − 1 .

Übung 3
Sei f : P → R. Weiter sei g : R → R eine Gerade durch den Punkt (p, f(p)).
Für die Differenzfunktion r : P → R mit r(x) = f(x) − g(x) für alle x P P
gelte:
r(x)
(+) limx → p = 0.
x−p

(a) Zeigen Sie, dass f an der Stelle p differenzierbar ist und identifizie-
ren Sie die Ableitung f ′(p).
(b) Zeigen Sie, dass die schwächere Konvergenz limx → p r(x) = 0 statt (+)
im Allgemeinen nicht hinreichend für die Differenzierbarkeit von f
an der Stelle p ist.

Übung 4
Geben Sie eine Funktion f : R → R an mit den folgenden Eigenschaften:
(a) f ist differenzierbar.
(b) Die Funktion f ′ : R → R ist im Nullpunkt nicht differenzierbar.
Skizzieren Sie zudem f und f ′.
[ Hinweis: Definieren Sie f durch eine geeignete Fallunterscheidung. ]

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Differenzierbarkeit 191

Lösungen zu den Übungen

Übung 1
Sei abs : R → R die Betragsfunktion, d. h. es gilt abs(x) = |x| für alle x P R.
Zeigen Sie, dass die Funktion abs im Nullpunkt nicht differenzierbar ist.

Lösung zu Übung 1
Sei p = 0. Wir zeigen, dass der Differentialquotient
abs(x) − abs(p)
limx →p
x−p
nicht existiert. Nach Definition von abs und p ist also zu zeigen, dass
|x|
limx →0
x
nicht existiert. Nach Definition des Grenzwerts für Funktionen genügt es,
eine Folge (xn )n P N anzugeben mit
(1) limn →∞ xn = 0
(2) limn →∞ |xn |/xn existiert nicht.
Wir setzen hierzu xn = (−1)n /2n für alle n. Dann konvergiert die Folge
gegen 0, sodass (1) gilt. Für alle n entspricht das Vorzeichen von xn der
Parität von n. Es gilt
|xn | xn
= = 1 für alle geraden n,
xn xn
|xn | xn
= − = −1 für alle ungeraden n.
xn xn
Damit ist (|xn |/xn )n P N die divergente Folge 1, −1, 1, −1, …. Dies zeigt (2).

Bemerkung
Alternativ können wir so argumentieren: Es gilt

limx ↓0 |x|/x = 1, limx ↑0 |x|/x = −1.

Denn für jede beliebige von oben gegen 0 konvergente Folge (xn )n P N ist
der Quotient |xn |/x konstant gleich 1, während er für jede von unten
gegen 0 konvergente Folge konstant gleich −1 ist. Der rechts- und
linksseitige Grenzwert ist verschieden, sodass der Grenzwert nicht
existiert. Diese Überlegung zeigt, dass die Betragsfunktion im Null-
punkt immerhin noch eine rechts- und linksseitige Ableitung besitzt.

© Oliver Deiser Grundzüge der Höheren Mathematik


192 3. Abschnitt Ableitungen und Integrale

Übung 2
Sei n P N* beliebig. Weiter sei f : R → R definiert durch f(x) = xn für alle
x P R. Schließlich sei p P R. Zeigen Sie durch Berechnung des Differential-
quotienten, dass
f ′(p) = n pn − 1 .

Lösung zu Übung 2
Bei der Diskussion der geometrischen Reihe hatten wir die geometrische
Summe
1 − pn
1 + p + p2 + … + pn − 1 =
1−p
kennengelernt. Eine Verallgemeinerung ist die für alle x P R gültige
Formel
xn − pn
(+) xn − 1 + p xn − 2 + … + pn − 2 x + pn − 1 =
x−p
Diese Formel erhalten wir wieder durch Polynomdivision (p ist eine
Nullstelle von xn − pn ) oder direkt durch Ausmultiplizieren von

(xn − 1 + p xn − 2 + … + pn − 2 x + pn − 1 ) (x − p).

beweisen (Teleskop-Summe). Die geometrische Summe entspricht dem


Spezialfall x = 1.
Mit (+) erhalten wir:

f(x) − f(p) xn − pn
limx → p = limx →p
x−p x−p

= limx → p ( xn − 1 + p xn − 2 + … + pn − 2 x + pn − 1 )

= pn − 1 + p pn − 2 + … + pn − 2 p + pn − 1 = n pn − 1 .

Dies zeigt, dass f ′(p) = n pn − 1 .

Bemerkung
Wir können das Ergebnis in der Form
d n
x = n pn − 1
dx x=p

notieren. Da die Formel für alle p P R gültig ist, erhalten wir


d n
x = n xn − 1 (Ableitungsregel für Monome)
dx

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Differenzierbarkeit 193

Übung 3
Sei f : P → R. Weiter sei g : R → R eine Gerade durch den Punkt (p, f(p)).
Für die Differenzfunktion r : P → R mit r(x) = f(x) − g(x) für alle x P P
gelte:
r(x)
(+) limx → p = 0.
x−p

(a) Zeigen Sie, dass f an der Stelle p differenzierbar ist und identifizie-
ren Sie die Ableitung f ′(p).
(b) Zeigen Sie, dass die schwächere Konvergenz limx → p r(x) = 0 statt (+)
im Allgemeinen nicht hinreichend für die Differenzierbarkeit von f
an der Stelle p ist.

Lösung zu Übung 3
zu (a):
Da eine Gerade durch den Punkt (p, f(p)) durch ihre Steigung eindeutig
bestimmt ist, gibt es ein eindeutiges a P R mit
g(x) = a (x − p) + f(p) für alle x P R.
Damit gilt für alle x P R:
r(x) = f(x) − g(x) = f(x) − a(x − p) − f(p),
f(x) − f(p) = r(x) + a(x − p).
Unter Verwendung von (+) erhalten wir, dass

f(x) − f(p) r(x) − a(x − p)


limx → p = limx → p
x−p x−p
r(x) a(x − p)
= limx → p + limx → p = 0 + a = a.
x−p x−p
Dies zeigt, dass f an der Stelle p differenzierbar ist. Weiter gilt f ′(p) = a
mit der Steigung a der Geraden g. Die Gerade g ist damit die Tangente
von f an der Stelle p.
zu (b):
Für ein Gegenbeispiel betrachten wir die Betragsfunktion abs : R → R,
die Stelle p = 0 und die Nullgerade g mit g(x) = 0 für alle x. Dann
verläuft g durch den Punkt (0, abs(0)) und es gilt r = abs, sodass
limx → 0 r(x) = limx → 0 abs(x) = 0.
Aber die Funktion abs ist an der Stelle 0 nicht differenzierbar.

© Oliver Deiser Grundzüge der Höheren Mathematik


194 3. Abschnitt Ableitungen und Integrale

Übung 4
Geben Sie eine Funktion f : R → R an mit den folgenden Eigenschaften:
(a) f ist differenzierbar.
(b) Die Funktion f ′ : R → R ist im Nullpunkt nicht differenzierbar.
Skizzieren Sie zudem f und f ′.
[ Hinweis: Definieren Sie f durch eine geeignete Fallunterscheidung. ]

Lösung zu Übung 4
Wir definieren f : R → R durch
f(x) = −x2 für x < 0, f(x) = x3 für x ≥ 0.
Dann ist f differenzierbar. Es gilt
f ′(x) = −2x für x < 0, f ′(x) = 3x2 für x ≥ 0.
Speziell ist f ′(0) = 0. Die Funktion f ′ ist aber im Nullpunkt nicht differen-
zierbar. Ähnlich wie die Betragsfunktion weist sie dort einen Knick auf.

5
f'

2 f

-1.0 -0.5 0.5 1.0

-1

Die differenzierbare Funktion f und ihre nicht mehr überall differenzierbare


Ableitung f ′

Bemerkung
Analog lässt sich für jedes n ≥ 1 eine Funktion angeben, deren n-te
Ableitung f (n) im Nullpunkt nicht differenzierbar ist. Durch mehrfaches
Differenzieren können „verborgene Unregelmäßigkeiten“ ans Licht
kommen, die sich als Knick einer höheren Ableitung äußern.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung

Wir geben allgemeine Regeln an, mit denen wir die Summen, Produkte, Quoti-
enten, Kompositionen und Umkehrfunktionen differenzierbarer Funktionen
ableiten können. Weiter bestimmen wir die Ableitungen von Grundfunktionen
wie exp, log, cos, sin, … Insgesamt ergibt sich ein systematischer Kalkül des Dif-
ferenzierens für elementare Funktionen.

Schlüsselbegriffe
Ableitungsregeln
Linearität, Produktregel, Quotientenregel, Kettenregel, Umkehrfunktion
gliedweises Differenzieren der Exponentialreihe
Charakterisierung der Exponentialfunktion
Methoden zur Bestimmung der Ableitungen des Kosinus und Sinus

© Oliver Deiser Grundzüge der Höheren Mathematik


196 3. Abschnitt Ableitungen und Integrale

Die Berechnung von Ableitungen

Um die Differenzierbarkeit einer reellen Funktion f : P → R nachzuweisen,


müssen wir für jeden Punkt p P P zeigen, dass der Differentialquotient

f(x) − f(p) f(p + h) − f(p)


limx → p = limh → 0
x−p h
existiert. Für einfache Funktionen ist dies leicht möglich. So hatten wir beispiels-
weise gezeigt:

d d d 2
c = 0 für alle x P R, x = 1, x = 2x.
dx dx dx
Allgemeiner gilt (vgl. die Übungen des letzten Kapitels):

d n
x = n xn − 1 für alle n ≥ 1 (Ableitungsregel für Monome)
dx
Der Beweis beruht auf der Polynomdivision

xn − pn
= xn − 1 + p xn − 2 + … + p n − 2 x + p n − 1 .
x−p
Die Differenzenquotienten werden bei festem p durch ein Polynom vom Grad
n − 1 berechnet. Dies erklärt die Verminderung des Exponenten um 1.
Eine weitere wichtige elementare Ableitung ist

d 1 1 d −1
= − , d. h. x = − x−2 ,
dx x x2 dx
in Erweiterung der Ableitungsregel für Monome: Der Exponent erscheint als
Faktor und wird um 1 erniedrigt. Zum Beweis sei p P R* beliebig. Dann gilt

1/x − 1/p (p − x)/(xp) 1 1


limx → p = limx → p = limx → p − = − .
x−p x−p xp p2

Viele weitere Beispiele ließen sich anfügen. Auf Dauer ist es aber wünschens-
wert, einen Kalkül für die Berechnung von Ableitungen zur Verfügung zu haben,
der es erlaubt, jede Funktion gemäß ihrem Aufbau systematisch abzuleiten. Ein
solcher Kalkül existiert in einer sehr erfreulichen Form: Alle elementaren Funk-
tionen lassen sich ableiten, ohne numerische Methoden zu verwenden und ohne
neue Funktionen einführen zu müssen (das wird bei der Integration ganz anders
sein!). Weiter entfällt die Berechnung von Differentialquotienten vollständig,
sobald die grundlegenden Ableitungen und die allgemeinen Ableitungsregeln
einmal da sind. Diesen Kalkül des Differenzierens wollen wir nun vorstellen.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 197

Die Ableitungsregeln

Satz (Ableitungsregeln)
Seien f, g differenzierbar. Weiter seien a, b P R. Dann sind auch die
Funktionen
a f + b g, f g, f/g, g + f, f − 1
differenzierbar (sofern sie überhaupt definiert sind). Für die Ableitungen
dieser Funktionen gilt an allen Stellen x ihres Definitionsbereichs:

(a) (a f + b g)′(x) = a f ′(x) + b g′(x), (Linearität)

(b) (f g)′(x) = f ′(x) g(x) + f(x) g′(x), (Produktregel)

f ′(x) g(x) − g′(x) f(x)


(c) (f/g)′(x) = , (Quotientenregel)
g2 (x)
(d) (g + f )′(x) = g′(f(x)) ⋅ f ′(x), (Kettenregel)

1
(e) (f − 1 )′ (f(x)) = , falls f ′(x) ≠ 0. (Ableitung der Umkehrfunktion)
f ′(x)

Die Regeln werden durch Berechnung der Differentialquotienten beweisen.


Besonders elegant ist hier die Landau-Notation. Schreiben wir
f(x) = f(p) + f ′(p)(x − p) + o(x − p), g(x) = g(p) + g′(p)(x − p) + o(x − p),
so zeigt ein Ausmultiplizieren des Produkts, dass
f(x) g(x) = f(p) g(p) + (f ′(p) g(p) + f(p) g′(p))(x − p) + o(x − p),
wobei im kleinen Rest „o“ sechs der neun Summanden zusammengefasst sind.
Aus dem zweiten Summanden können wir die Ableitung von f g an der Stelle p
ablesen. In dieser Weise lässt sich die Form der Produktregel letztendlich sehr
einfach durch das Distributivgesetz erklären.

Nachdifferenzieren
Die Multiplikation von g′(f(x)) mit f ′(x) nennen wir auch Nachdifferenzieren:
Um g′(f(x)) zu berechnen setzen wir y = f(x) in die Ableitung g′(y) von g(y)
ein und Multiplizieren dies mit f ′(x).

Beispiel
Nach Linearität und der Kettenregel gilt:
d d
(x2 + x + 1)3 = 3 (x2 + x + 1)2 (x2 + x + 1) = 3(x2 + x + 1) (2x + 1).
dx dx
Die Berechnung erspart uns das Ausmultiplizieren von (x2 + x + 1)3 .

© Oliver Deiser Grundzüge der Höheren Mathematik


198 3. Abschnitt Ableitungen und Integrale

Die Ableitung der Exponentialfunktion

Sie x P R beliebig. Dann gilt


x2 x3 x4 x5 xn
exp(x) = 1 + x + + + + + … = ∑n
2 6 4! 5! n!
Behandeln wir diese unendliche Reihe wie ein Polynom, so erhalten wir
x2 x3 x4
exp′(x) = 0 + 1 + x + + + + …
2 6 4!
xn − 1 xn − 1 xn
= ∑ n≥1 n = ∑ n≥1 = ∑n = exp(x).
n! (n − 1)! n!

Man kann zeigen, dass gliedweises Differenzieren dieser Art korrekt ist. Die Sum-
manden der Exponentialreihe verschieben sich beim Ableiten um eine Position
nach links, sodass sich die Reihe selbst reproduziert. Diese Eigenart lässt sich
auch verwenden, um die Exponentialreihe zu motivieren: Sie ist gerade so ge-
macht, dass das gliedweise Differenzieren die Reihe unverändert lässt. Die Fa-
kultäten im Nenner gleichen die Faktoren aus, die beim Differenzieren der Mo-
nome xn entstehen. Die wohl besten Motivationen der Exponentialfunktion zur
Basis e benötigen die Differentialrechnung, was ein didaktisches Problem dar-
stellt, wenn die Funktion vor der Differentialrechnung eingeführt wird.
Auf dieser Grundlage können wir nun zeigen:

Satz (Charakterisierung der Exponentialfunktion)


Die Exponentialfunktion exp : R → R (zur Basis e = exp(1)) ist die
eindeutige differenzierbare Funktion f : R → R mit den Eigenschaften
f ′ = f, f(0) = 1

Beweis
Es gilt exp(0) = 1 und gliedweises Differenzieren zeigt, dass exp′ = exp gilt.
Zum Beweis der Eindeutigkeit sei f : R → R eine Funktion mit f ′ = f und
f(0) = 1. Da exp(x) > 0 für alle x P R gilt, ist f/exp auf ganz R definiert. Nach
der Quotientenregel gilt

f exp(x) f ′(x) − f(x) exp(x) exp(x) f(x) − f(x) exp(x)


( )′(x) = = = 0.
exp exp(x)2 exp(x)2

Da genau die konstanten Funktionen die Ableitung 0 besitzen (was man


beweisen muss), gibt es ein c P R mit
f(x)/exp(x) = c für alle x P R.
Wegen f(1) = exp(1) ist c = 1, sodass f(x) = exp(x) für alle x P R.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 199

Allgemeine Exponentialfunktionen und Logarithmen

Mit Hilfe der Ableitungsregel für die Umkehrfunktion können wir die Ablei-
tung des Logarithmus log : ] 0, ∞ [ → R bestimmen. Sei hierzu p > 0 beliebig.
Dann gibt es ein eindeutiges q mit p = exp(q). Wegen log = exp−1 gilt
1 1 1
log′(p) = log′(exp(q)) = = = .
exp′(q) exp(q) p
Als Ableitungsfunktion des Logarithmus log zur Basis e ergibt sich also der
rechte Ast der Hyperbel:
d 1
log(x) = auf ] 0, ∞ [.
dx x
Es ist bemerkenswert, dass der Logarithmus eine rationale Funktion als Ablei-
tung besitzt.

Beliebige positive Basen

Um die Ableitung einer Exponentialfunktion zu einer beliebigen Basis a > 0 zu


bestimmen, verwenden wir, dass
ax = ex log(a) = exp(x log(a)) für alle x P R.
Nach der Kettenregel gilt auf ganz R:
d x d d
a = exp(x log(a)) = exp′(x log(a)) (x log(a))
dx dx dx
= exp(x log(a)) log(a) = log(a) ax .

Für einen allgemeinen Logarithmus loga ergibt sich wie oben für log, dass
d 1
loga (x) = .
dx log(a) x
Potenzfunktionen

Für eine Potenzfunktion der Form x a mit x P ] 0, ∞ [ und einem beliebigen


reellen Exponenten a erhalten wir
d d d a
xa = exp(a log(x)) = exp(a log(x)) a log(x) = x a = a x a − 1.
dx dx dx x
Dies verallgemeinert die Ableitungsregel d/dx xn = n xn−1 für Monome vom Grad
n ≥ 1. Weiter ergibt sich ohne Mühe auch
d d 1 −1/2 1
£x = x 1/2 = x = .
dx dx 2 2 £x

© Oliver Deiser Grundzüge der Höheren Mathematik


200 3. Abschnitt Ableitungen und Integrale

Ableitung von Kosinus und Sinus

Die Differentialquotienten des Kosinus und Sinus sind nicht leicht zu berech-
nen. Wir betrachten drei Zugänge:

Betrachtung der Funktionsgraphen


Die Kosinusfunktion besitzt Hoch- und Tiefpunkte bei allen ganzzahligen
Vielfachen von π, sodass cos′(kπ) = 0 für alle k P Z. Damit kommen
Funktionen der Form c sin(x) als Ableitung des Kosinus in Frage. Ein Blick
auf den graphischen Verlauf legt c = −1 nahe, sodass wir die Hypothese
cos′ = −sin aufstellen. Aus den Formeln
sin(x) = cos(π/2 − x), cos(x) = sin(π/2 − x)
erhalten wir dann, dass
d d
sin(x) = cos(π/2 − x) = − sin(π/2 − x) ⋅ (−1) = sin(π/2 − x) = cos(x).
dx dx

Dynamische Interpretation
Ein Punkt, der sich auf dem Einheitskreis K gegen den Uhrzeigersinn mit
Start bei (1, 0) und Winkelgeschwindigkeit 1 bewegt, hat zur Zeit t die
Koordinaten P(t) = (cos(t), sin(t)). Der Vektor P′(t) = (cos′(t), sin′(t)) ist die
Geschwindigkeit des Punktes zur Zeit t. Dieser Vektor ist der um π/2 gegen
den Uhrzeigersinn gedrehte Vektor P(t). Da (x, y) bei einer derartigen
Drehung in (−y, x) übergeht, erhalten wir
(cos′(t), sin′(t)) = (− sin′(t), cos(t)) für alle t P R.
Ein Koordinatenvergleich zeigt, dass cos′ = − sin und sin′ = cos.

Beweis mit Hilfe des Additionstheorems


Auch die zweite Argumentation, so bestechend sie ist, ersetzt keinen
Beweis. Ein solcher kann in zwei Schritten wie folgt erfolgen:
1. Ableitung des Sinus im Nullpunkt
Wir zeigen, dass limx ↓ 0 sin(x)/x = 1. Hierzu weisen wir die geometrische
Anschauung nach, dass sich sin(x) vom Bogen x für kleine Winkel x
kaum unterscheidet. Damit gilt limx ↓ 0 sin(0 + h)/h = 1, woraus wir
sin′(0) = 1 gewinnen.
2. Ableitung des Sinus an einer beliebigen Stelle
Für alle x,y R gilt sin(x + y) = sin(x) cos(y) + cos(y) sin(x) (Additionstheo-
rem). Damit lässt sich der Differentialquotient
sin′(x) = limh →0 (sin(x + h) − sin(x))/h = cos(x)
berechnen. Wie oben folgt durch ein π/2-Argument, dass cos′ = − sin.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 201

Ableitungen der elementaren Funktionen

Weitere Ableitungen erhalten wir mit Hilfe der Ableitungsregeln und trigo-
nometrischer Formeln. Beispielsweise gilt

d 1 1
arcsin(x) = = für alle x P ] −1, 1 [.
dx cos(arcsin(x)) £1 − x2
Hier verwenden wir, dass cos2 (α) + sin2 (α) = 1 für alle α (Satz des Pythagoras).
Damit gilt für alle x P ] −1, 1 [
cos2 (arcsin(x)) + sin2 (arcsin(x)) = 1, sodass
cos2 (arcsin(x)) = 1 − x2 > 0.
Wurzelziehen liefert die Ableitungsformel für den Arkussinus.
Wir stellen grundlegende Ableitungen tabellarisch zusammen. Zusammen
mit den Ableitungsregeln erhalten wir wie gewünscht einen Kalkül, mit dem wir
die Ableitung einer beliebigen elementaren Funktion vergleichsweise leicht be-
rechnen können.

d d
ax = log(a) ax xa = a xa − 1
dx dx

d 1 d logx (a)
loga (x) = log x (a) = −
dx x log(a) dx x log(x)

d d
sin(x) = cos(x) cos(x) = − sin(x)
dx dx

d 1 d 1
tan(x) = cot(x) = −
dx cos2 (x) dx sin2 (x)

d 1 sin(x) d 1 cos(x)
= = −
dx cos(x) cos2 (x) dx sin(x) sin2 (x)

d 1 d 1
arcsin(x) = arccos(x) = −
dx £1 − x2 dx £1 − x2

d 1 d 1
arctan(x) = arccot(x) = −
dx 1 + x2 dx 1 + x2

© Oliver Deiser Grundzüge der Höheren Mathematik


202 3. Abschnitt Ableitungen und Integrale

Übungen

Übung 1
Berechnen Sie die folgenden Ableitungen:

(1) d/dx log(log(x))

(2) d/dx log(|x|)

(3) d/dx x x

Geben Sie zudem jeweils an, für welche x P R die Ableitungen gelten.

Übung 2
(a) Zeigen Sie, dass
1
cos2 (arctan(x)) = für alle x P R.
1 + x2
(b) Berechnen Sie die Ableitungen arctan′, arctan″ und arctan(3) mit
Hilfe der Ableitungsregeln und Teilaufgabe (a).
(c) Skizzieren Sie arctan und die berechneten Ableitungen in einem
Diagramm.

Übung 3
Zeigen Sie die Ableitungsregel
d n
x = n xn − 1
dx
durch Induktion nach n ≥ 1 und Verwendung der Produktregel.

Übung 4
Zeigen Sie die Ableitungsregel
d 1
£x =
dx 2£x
mit Hilfe der Produktregel. Dabei dürfen Sie die Differenzierbarkeit der
Wurzelfunktion auf ] 0, ∞ [ voraussetzen.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 203

Lösungen zu den Übungen

Übung 1
Berechnen Sie die folgenden Ableitungen:

(1) d/dx log(log(x))

(2) d/dx log(|x|)

(3) d/dx x x

Geben Sie zudem jeweils an, für welche x P R die Ableitungen gelten.

Lösung zu Übung 1
zu (a):
Die Funktion log(log(x)) ist auf ] 1, ∞ [ definiert und dort nach der
Kettenregel differenzierbar. Für alle x > 1 gilt
d 1 d 1
log(log(x)) = log(x) = .
dx log(x) dx x log(x)

zu (b):
Die Funktion log(|x|) ist auf R* definiert. Für x > 0 gilt log(|x|) = log(x)
und für x < 0 gilt log(|x|) = log(− x). Damit erhalten wir
d d 1
log(|x|) = log(x) = für x > 0,
dx dx x
und nach der Kettenregel

d d 1 1
log(|x|) = log(− x) = (−1) = für x < 0,
dx dx −x x
Damit gilt also d/dx log(|x|) = 1/x für alle x ≠ 0.

zu (c):
Es gilt
x x = exp(x log(x)) für alle x > 0.
Nach der Ketten- und Produktregel gilt für alle x > 0:
d x d
x = exp(x log(x))
dx dx
d
= exp(x log(x)) (x log(x))
dx
= xx (1 log(x) + x/x) = (log(x) + 1) xx .

© Oliver Deiser Grundzüge der Höheren Mathematik


204 3. Abschnitt Ableitungen und Integrale

Übung 2
(a) Zeigen Sie, dass
1
cos2 (arctan(x)) = für alle x P R.
1 + x2
(b) Berechnen Sie die Ableitungen arctan′, arctan″ und arctan(3) .
Verwenden Sie dabei die Ableitung tan′(x) = 1/cos2 (x), Teilaufgabe (a)
und die Ableitungsregeln.
(c) Skizzieren Sie arctan, arctan′ und arctan″ in einem Diagramm.

Lösung zu Übung 2
zu (a):
Sei x P R. Wir setzen y = arctan(x). Dann gilt x = tan(y) und
sin2 (y) 1 − cos2 (y) 1
x2 = tan2 (y) = = = − 1.
cos2 (y) cos2 (y) cos2 (y)
Umformen liefert
1
cos2 (y) = .
x2 + 1
Mit y = arctan(x) ergibt sich die Behauptung.
zu (b):
Die Ableitungsregel für die Umkehrfunktion, tan′ = 1/cos2 und (a)
liefern, dass für alle x P R gilt:
1 1
arctan′(x) = = cos2 (arctan(x)) = .
tan′(arctan(x)) 1 + x2

Die weiteren Ableitungen können wir mit Hilfe der Ableitungsregeln


berechnen. Wir erhalten:
d 2x
arctan″(x) = (1 + x2 )−1 = − (1 + x2 )−2 2x = −
dx (1 + x2 )2

d 2x
arctan(3) (x) = −
dx (1 + x2 )2

2(1 + x2 )2 − 2x (2(1 + x2 ) 2x)


= −
(1 + x2 )4

6x2 − 2
=
(1 + x2 )3

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 205

zu (c):

arctan(x)

arctan'(x)

-6 -4 -2 2 4 6

arctan''(x)

-
4

-
2

Der Arkustangens und seine beiden ersten Ableitungen

© Oliver Deiser Grundzüge der Höheren Mathematik


206 3. Abschnitt Ableitungen und Integrale

Übung 3
Zeigen Sie die Ableitungsregel
d n
x = n xn − 1
dx
durch Induktion nach n ≥ 1 und Verwendung der Produktregel.

Lösung zu Übung 3
Induktionsanfang n = 1:
Es gilt
d
x = 1 = x0 = 1 ⋅ x1 − 1 .
dx

Induktionsschritt von n nach n + 1:


Es gelte

d n
x = n xn − 1 (Induktionsvoraussetzung).
dx
Dann gilt nach der Produktregel
d n+1 d d n d
x = (xn x) = ( x ) x + xn x
dx dx dx dx

= I.V. n xn − 1 x + xn 1 = n xn + xn = (n + 1) xn .

Bemerkung
Die Differenzierbarkeit der Monome xn für n ≥ 2 wird hier nicht
vorausgesetzt, sondern mit bewiesen. Denn nach der Produktregel ist
mit f und g auch das Produkt f g differenzierbar. Damit folgt aus der
Differenzierbarkeit von xn und x die Differenzierbarkeit von xn + 1 für alle
n ≥ 1. Die Differenzierbarkeit von x wird als bekannt vorausgesetzt.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Differentialrechnung 207

Übung 4
Zeigen Sie die Ableitungsregel
d 1
£x =
dx 2£x
mit Hilfe der Produktregel. Dabei dürfen Sie die Differenzierbarkeit der
Wurzelfunktion auf ] 0, ∞ [ voraussetzen.

Lösung zu Übung 4
Es gilt
x = £x £x für alle x > 0.
Nach der Produktregel gilt also
d
1 = x
dx
d
= ( £x £x )
dx
d d
= ( )
£x £x + £x £x
dx dx
d
= 2 £x £x.
dx
Division durch 2 £x zeigt die Behauptung.

Bemerkung
Diese Argumentation liefert diesmal nur die Formel für die Ableitung
der Wurzelfunktion. Die Differenzierbarkeit der Wurzelfunktion auf
] 0, ∞ [ muss bereits bekannt sein, damit wir die Produktregel auf £x £x
anwenden können.

© Oliver Deiser Grundzüge der Höheren Mathematik


3. Die Taylor-Entwicklung

Eine Funktion wird an einer differenzierbaren Stelle durch ihre Tangente appro-
ximiert. Wir verbessern diese Approximation in mehreren Schritten. Zunächst
betrachten wir Parabeln zur Approximation, danach Polynome beliebigen Gra-
des. Diese sogenannten Taylor-Polynome führen uns durch einen Grenzüber-
gang schließlich zu den unendlichen Taylor-Reihen. Sie stellen ihre Funktion in
wichtigen Fällen perfekt dar, werfen zugleich aber auch viele Konvergenzfragen
auf.

Schlüsselbegriffe
Tangente, Schmiegeparabel
Taylor-Polynome
Taylor-Reihen
Kosinus-Reihe, Sinus-Reihe, Logarithmus-Reihe, Arkustangens-Reihe
Gegenbeispiel von Cauchy

© Oliver Deiser Grundzüge der Höheren Mathematik


210 3. Abschnitt Ableitungen und Integrale

Schmiegeparabeln

Ist f : P → R differenzierbar in p P P und g : R → R ihre dortige Tangente,


d. h. g(x) = f(p) + f ′(p)(x − p) für alle x P R, so gilt
f(x) = g(x) + o(x − p) für x → p.
Diese Situation hatten wir durch „Tangente plus kleiner Rest“ zusammengefasst.
Der symbolisch durch o(x − p) ausgedrückte Rest steht für eine Funktion r mit
limx → p r(x)/(x − p) = 0 („schneller als linear gegen 0“).
Wir wollen nun die Approximation verbessern. Für die Tangente g gilt:
(1) g(p) = f(p) (Übereinstimmung am Entwicklungspunkt p)
(2) g′(p) = f ′(p) (Übereinstimmung der ersten Ableitungen bei p)
Eine natürliche Idee ist es, auch die zweiten Ableitungen zur Übereinstimmung
bringen. Wir definieren:

Definition (Schmiegeparabel)
Sei f : P → R zweimal differenzierbar bei p P P. Dann heißt h : R → R mit
f ″(p)
h(x) = f(p) + f ′(p) (x − p) + (x − p)2 für alle x P R
2
die Schmiegeparabel von f an der Stelle p.

Der Faktor 1/2 im quadratischen Term gleich den Faktor 2 aus, der beim Diffe-
renzieren von h entsteht. Wie gewünscht gilt
(1) f(p) = h(p), (2) f ′(p) = h′(p), (3) f ″(p) = h″(p).
Um die Approximation zu beschreiben, verwenden wir wieder die Landau-No-
tation: o((x − p)2 ) steht bei einer Konvergenz von x gegen p für eine Funktion r
mit limx → p r(x)/(x − p)2 = 0 („schneller als quadratisch gegen 0“). Es gilt:

Satz (quadratischer Approximationssatz)


Ist h die Schmiegeparabel von f : P → R bei p, so gilt
f(x) = h(x) + o((x − p)2 ) für x → p.

Beispiele
(1) Es gilt cos′(0) = 0 und cos″(0) = −1. Die Schmiegeparabel h : R → R
des Kosinus an der Stelle 0 ist also gegeben durch
h(x) = 1 + 0 (x − 0) − 1/2 (x − 0)2 = 1 − x2 /2 für alle x P R.
(2) Ist f ″(p) = 0, so fällt die Schmiegeparabel mit der Tangente zusammen,
sodass in diesem Fall keine echte Parabel vorliegt. Die Sinusfunktion
und p = 0 ist ein Beispiel hierfür.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 211

Taylor-Polynome

Der Leser kann an dieser Stelle wahrscheinlich raten, wie es weitergeht: Wir
können auch die dritten, vierten, fünften, … Ableitungen an einer bestimmten
Stelle zur Übereinstimmung bringen, um unsere Approximationen weiter zu
verbessern.

Definition (Taylor-Polynome)
Sei f : P → R n-mal differenzierbar bei p P P. Dann ist das Taylor-Polynom
T np f : R → R der Ordnung n von f im Entwicklungspunkt p definiert durch

f ″(p) f (n) (p)


T np f(x) = f(p) + f ′(p) (x − p) + (x − p)2 + … + (x − p)n
2! n!
f (k) (p)
= ∑k ≤ n (x − p)k für alle x P R.
k!

Nach Konstruktion stimmen die ersten n Ableitungen von f und T np f bei p


überein. Ist f (n) (p) ≠ 0, so ist T np f ein Polynom n-ten Grades, andernfalls ist der
Grad kleiner als n. Die n+1-Ableitung von T np f ist immer die Nullfunktion.

Beispiele
T 00 f (x) = f(p) (konstante Approximation)

T 10 f (x) = f(p) + f ′(p)(x − p) (Tangente)


f ″(p)
T 20 f (x) = f(p) + f ′(p)(x − p) + (x − p)2 (Schmiegeparabel)
2
f ″(p) f (3) (p)
T 30 f (x) = f(p) + f ′(p)(x − p) + (x − p)2 + (x − p)3 (Ordnung 3)
2 6

Wir schreiben o((x − p)n ) bei einer Konvergenz von x gegen p für eine Funk-
tion r mit limx → p r(x)/(x − p)n = 0. Es gilt:

Satz (Satz von Peano)


Sei f : P → R n-mal differenzierbar an der Stelle p P P. Dann gilt:
f(x) = T np f (x) + o((x − p)n ) für x → p.

Das Taylor-Polynom T np f ist unter allen Polynomen mit Grad kleinergleich


n die bestmögliche Approximation an f an der Stelle p. Es ist durch die ersten
n Ableitungen von f an der Stelle p eindeutig bestimmt. Ein winziger Aus-
schnitt von f um p legt bereits alle Taylor-Polynome fest. Vernachlässigen wir
den Fehler o((x − p)n ), so enthält dieser Ausschnitt die Zukunft und Vergangen-
heit der Funktion.

© Oliver Deiser Grundzüge der Höheren Mathematik


212 3. Abschnitt Ableitungen und Integrale

Taylor-Reihen

Wir haben bislang Taylor-Polynome einer beliebigen Ordnung n betrachtet.


Nun gehen wir noch einen Schritt weiter und bilden unendliche Reihen.

Definition (Taylor-Reihe)
Sei f : P → R beliebig oft differenzierbar an der Stelle p P P. Dann ist die
Taylor-Reihe T p f von f im Entwicklungspunkt p definiert durch
f ″(p) f (n) (p)
T p f(x) = f(p) + f ′(p)(x − p) + (x − p)2 + … + (x − p)n + …
2 n!
f (n) (p)
= ∑n (x − p)n für alle x P R.
n!

Neu im Vergleich zu den bisherigen Konstruktionen ist:

Das Konvergenzproblem
Die Taylor-Polynome hatten wir in der Form T np f : R → R notiert. Eine
Taylor-Reihe können wir im Allgemeinen nicht mehr als Funktion von R
nach R schreiben. Durch die Bildung einer unendlichen Summe stellt sich
für jedes x P R die Frage der Konvergenz von T p f (x). Der Leser vergleiche
die geometrische Reihe ∑ n xn , die nur im Intervall ] −1, 1 [ konvergiert.
Eine Taylor-Reihe ist damit zunächst nur eine von x abhängige unendliche
Reihe (eine Folge von Partialsummen) und noch keine reelle Funktion. Wir
nennen die Menge
K = Kf, p = { x P R | T p f (x) konvergiert }
den Konvergenzbereich der Taylor-Reihe für f im Entwicklungspunkt p. Die
Reihe T p f (x) lässt sich nun als Funktion von K nach R auffassen. Der
Punkt p liegt immer im Konvergenzbereich der Reihe, da T p f (p) = f(p).
Alles Weitere muss von Fall zu Fall untersucht werden.

Das Ziel der Reihen-Entwicklung ist, eine Funktion in einer möglichst gro-
ßen Umgebung des Entwicklungspunkts als Potenzreihe der Form ∑ n an (x − p) xn
darzustellen, d. h. für viele x eine exakte Übereinstimmung T p f (x) = f(x) zu errei-
chen, ohne jeden noch so kleinen Fehler. Die Restfunktion soll die Nullfunktion
sein.
Wenn es überhaupt eine Darstellung von f als Potenzreihe (als „unendliches
Polynom“) gibt, so muss es die Taylor-Reihe sein. Denn durch gliedweises Diffe-
renzieren ergibt sich, dass die Koeffizienten an die Form f (n) (p)/n! haben. Damit
verfolgen wir den richtigen Ansatz.
Im Idealfall lässt sich die gesamte Funktion als Potenzreihe (gleichwertig: Tay-
lor-Reihe) darstellen. Wir betrachten hierzu einige Beispiele.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 213

Darstellung der gesamten Funktion als Taylor-Reihe

Die Taylor-Reihe der Exponentialfunktion


Für alle n ≥ 0 gilt exp(n) (0) = exp(0) = 1. Damit gilt für alle x P R:
1 xn
T0 exp (x) = ∑ n (x − 0)n = ∑ n = exp(x)
n! n!
Die Taylor-Reihe der Exponentialfunktion im Punkt 0 ist also identisch
mit der Exponentialreihe. Auch für alle anderen Entwicklungspunkte
ergibt sich die Exponentialfunktion. Für p = 1 gilt beispielsweise
expn (1) = exp(1) = e für alle n und wir erhalten
e
T1 exp(x) = ∑ n (x − 1)n = exp(x) für alle x P R.
n!

Die Taylor-Reihen des Kosinus und Sinus


Die Ableitungsfolge (cos(n) (0))n P N des Kosinus im Nullpunkt ist die
periodische Folge 1, 0, −1, 0, 1, 0, −1, 0, … Damit gilt für alle x P R:
x2 x4 x2n
T0 cos (x) = 1 − + ± … = ∑ n (−1)n .
2 4 (2n)!
Analog gilt
x3 x5 x2n + 1
T0 sin (x) = x − + ± … = ∑ n (−1)n + 1 .
3! 5! (2n + 1)!
Man kann zeigen, dass diese Taylor-Reihen überall den Kosinus bzw. Sinus
darstellen. Gleiches gilt für alle anderen Entwicklungspunkte.

Wir halten fest:

Satz (Kosinus-Reihe und Sinus-Reihe)


Für alle x P R gilt:
x2n
cos (x) = ∑ n (−1)n (Kosinus-Reihe)
(2n)!

x2n + 1
sin (x) = ∑ n (−1)n + 1 ((Sinus-Reihe).
(2n + 1)!

Diese Reihen eignen sich zur effektiven Berechnung der Funktionen.


Sowohl der Kosinus als auch der Sinus erfüllt die Differentialgleichung f ″ = − f.
Es ist instruktiv, sich diese Eigenschaft durch gliedweises Differenzieren der Rei-
hendarstellung vor Augen zu führen, in Analogie zur Eigenschaft f ′ = f für die Ex-
ponentialreihe. Wir diskutieren dies in den Übungen.

© Oliver Deiser Grundzüge der Höheren Mathematik


214 3. Abschnitt Ableitungen und Integrale

Teilweise Darstellung als Taylor-Reihe

Wir betrachten nun prominente Funktionen, bei denen die Taylor-Reihe


nicht mehr überall, aber immerhin noch in einer gewissen Umgebung des Ent-
wicklungspunkts konvergiert.

Die geometrische Reihe als Taylor-Reihe


Sei f : R − { 1 } → R mit f(x) = 1/(1 − x) für alle x ≠ 1. Für alle x ≠ 1 gilt

1 2! n!
f ′(x) = , f ″(x) = , …, f (n) (x) = , …
(1 − x)2 (1 − x)3 (1 − x)n + 1
Damit ist f (n) (0) = n! für alle n P N, sodass

n! n
T0 f = ∑ n x = ∑ n xn .
n!
Die Taylor-Reihe von f im Entwicklungspunkt p = 0 ist also (wie es aus
Eindeutigkeitsgründen sein muss) die geometrische Reihe. Der Konver-
genzbereich ist lediglich ] −1, 1 [, obwohl f auf R − { 1 } definiert ist.

Die Taylor-Reihe des Logarithmus


Eine Induktion nach n ≥ 1 zeigt, dass
1
log(n) (x) = (−1)n − 1 (n − 1)! für alle x > 0.
xn
Für p = 1 berechnet sich die Taylor-Reihe des Logarithmus also zu

(−1)n − 1
T1 log (x) = ∑ n ≥ 1 (x − 1)n für alle x P R.
n
Der Konvergenzbereich ist, wie man zeigen kann, das Intervall ] 0, 2 ]. Dort
(und nur dort) stellt die Reihe den Logarithmus dar. Für x = 1 erhalten wir:
1 1 1
log 2 = 1 − + − + … (log(2)-Reihe)
2 3 4

Die Taylor-Reihe des Arkustangens


Die Taylor-Reihe des Arkustangens berechnet sich für p = 0 zu
x3 x5 x2n + 1
T0 arctan (x) = x − + − … = ∑ n (−1)n .
3 5 2n + 1
Der Konvergenzbereich ist [ −1, 1 ]. Für x = 1 ergibt sich mit arctan(1) = π/4:
π 1 1 1
= 1 − + − + … (Leibniz-Reihe)
4 3 5 7

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 215

Darstellung als Taylor-Reihe nur im Entwicklungspunkt

Wir betrachten zwei Extremfälle:

Das Gegenbeispiel von Cauchy


Sei f : R → R definiert durch
2
e−1/x falls x ≠ 0,
f(x) =
{ 0 falls x = 0.

Die Funktion ist im Nullpunkt extrem flach: Es gilt f (n) (0) = 0 für alle n.
Folglich ist T0 f die Nullfunktion. Wir erhalten hier:
(1) Die Taylor-Reihe von f konvergiert auf ganz R.
(2) Die Taylor-Reihe von f stimmt nur im Entwicklungspunkt mit f
überein.

Maximal divergente Taylor-Reihen


Der Satz von Peano-Borel besagt, dass es für jede Folge (cn )n P N in R eine
glatte Funktion f : R → R gibt mit f (n) (0) = cn für alle n. Setzen wir zum
Beispiel cn = n! 2 , so erhalten eine Funktion f : R → R mit der Taylor-Reihe
T0 f (x) = ∑ n n! xn . Hier gilt:
(1) Die Taylor-Reihe von f konvergiert nur im Entwicklungspunkt.
(2) Die Taylor-Reihe von f stimmt nur im Entwicklungspunkt mit f
überein.

Der Versuch, eine glatte reelle Funktion als „unendliches Polynom“ darzustel-
len, gelingt oft, aber eben nicht immer! Allgemein kann man zeigen:
(1) Der Konvergenzbereich einer Taylor-Reihe ist ein Intervall um den
Entwicklungspunkt p der Form
] p − r, p + r [, [ p − r, r + r ], ] p − r, p + r ], [ p − r, p + r [
mit dem sogenannten Konvergenzradius r ≤ ∞. Im Fall r = ∞ ist K = R. Der
Extremfall K = [ p, p ] = { p } mit r = 0 ist möglich.
(2) Hat f an einer Stelle x0 eine Polstelle, so ist r ≤ |x0 − p|. Gleiches gilt für
Pole der Ableitungen. Eine Taylor-Reihe kann also keine „kritischen
Stellen“ überwinden. Beispiele sind der Logarithmus mit einem Pol bei 0
und die Quadratwurzelfunktion mit einem Pol der Ableitung bei 0. Für
p = 1 ergibt sich hier r ≤ 1, für p = 2 ist r ≤ 2 usw. Dass die Taylor-Reihe
des Arkustangens für p = 0 einen überraschend kleinen Konvergenzradius
besitzt, wird erst in der komplexen Analysis klar. Dort weist der Arkustan-
gens eine Polstelle bei i auf, sodass r ≤ |i − 0| = 1.

© Oliver Deiser Grundzüge der Höheren Mathematik


216 3. Abschnitt Ableitungen und Integrale

Übungen

Übung 1
(a) Berechnen Sie die Taylor-Polynome der Ordnung 1, 2 und 3 der
Funktion sqrt : [ 0, ∞ [ → R mit sqrt(x) = £x für alle x ≥ 0 im
Entwicklungspunkt p = 1.
(b) Skizzieren Sie sqrt und die berechneten Taylor-Polynome in einem
Diagramm.

Übung 2
Sei f : R → R definiert durch
f(x) = 2 x4 − 3 x3 + x2 − x + 2 für alle x P R.
Bringen Sie das Polynom f durch Taylor-Entwicklung im Entwicklungs-
punkt 1 in die Form
f(x) = a4 (x − 1)4 + a3 (x − 1)3 + a2 (x − 1)2 + a1 (x − 1) + a0 für alle x P R.

Übung 3
(a) Zeigen Sie durch gliedweises Differenzieren der Kosinus- und
Sinusreihe, dass
cos′ = − sin und sin′ = cos.
(b) Folgern Sie, dass cos″ = − cos und sin″ = − sin.
(c) Geben Sie weitere Beispiele für Funktionen f : R → R an, die die
Differentialgleichung f ″ = − f erfüllen.

Übung 4
Zeigen Sie durch Induktion nach n ≥ 1, dass
1
log(n) (x) = (−1)n − 1 (n − 1)! für alle x > 0.
xn

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 217

Lösungen zu den Übungen

Übung 1
(a) Berechnen Sie die Taylor-Polynome der Ordnung 1, 2 und 3 der
Funktion sqrt : [ 0, ∞ [ → R mit sqrt(x) = £x für alle x ≥ 0 im
Entwicklungspunkt p = 1.
(b) Skizzieren Sie sqrt und die berechneten Taylor-Polynome in einem
Diagramm.

Lösung zu Übung 1
zu (a):
Die ersten Ableitungen von sqrt berechnen sich zu

sqrt(0) (x) = £x = x1/2

1 1 − 1/2
sqrt(1) (x) = = x
2£x 2
1 1 − 3/2
sqrt(2) (x) = − = − x
4 x3/2 4
3 3 − 5/2
sqrt(3) (x) = = x
8 x5/2 8

Die Auswertung am Entwicklungspunkt ergibt die Werte

sqrt(1) = 1

sqrt(1) (1) = 1/2

sqrt(2) (1) = − 1/4

sqrt(3) (1) = 3/8

Damit erhalten wir die Taylor-Polynome

x−1
T11 (x) = 1 +
2
x−1 (x − 1)2
T21 (x) = 1 + −
2 8
x−1 (x − 1)2 (x − 1)3
T31 (x) = 1 + − +
2 8 16

© Oliver Deiser Grundzüge der Höheren Mathematik


218 3. Abschnitt Ableitungen und Integrale

zu (b):

4
f3 (x)

f1 (x)
3

sqrt(x)

f2 (x)

-1 1 2 3 4 5

-1

Die Quadratwurzelfunktion sqrt und ihre Taylor-Polynome f1 , f2 , f3 der


Ordnungen 1, 2, 3 im Entwicklungspunkt 1

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 219

Übung 2
Sei f : R → R definiert durch
f(x) = 2 x4 − 3 x3 + x2 − x + 2 für alle x P R.
Bringen Sie das Polynom f durch Taylor-Entwicklung im Entwicklungs-
punkt 1 in die Form
f(x) = a4 (x − 1)4 + a3 (x − 1)3 + a2 (x − 1)2 + a1 (x − 1) + a0 für alle x P R.

Lösung zu Übung 2
Die Ableitungen von f berechnen sich zu

f (0) (x) = 2 x4 − 3 x3 + x2 − x + 2
f (1) (x) = 8 x3 − 9 x2 + 2 x − 1
f (2) (x) = 24 x2 − 18 x + 2
f (3) (x) = 48 x − 18
f (4) (x) = 48
f (n) (x) = 0 für alle n ≥ 5.

Die Auswertung der Ableitungen an der Stelle 1 ergibt:

f (0) (1) = 2 − 3 + 1 − 1 + 2 = 1
f (1) (1) = 8 − 9 + 2 − 1 = 0
f (2) (1) = 24 − 18 + 2 = 8
f (3) (1) = 48 − 18 = 30
f (4) (1) = 48
f (n) (1) = 0 für alle n ≥ 5.

Damit erhalten wir

48 30 8
f(x) = (x − 1)4 + (x − 1)3 + (x − 1)2 + 0 (x − 1) + 1
24 6 2

= 2 (x − 1)4 + 5 (x − 1)3 + 4 (x − 1)2 + 0 (x − 1) + 1

Bemerkung
Mit dieser Methode können wir für alle p, q P R ein Polynom der
Form ∑ k ≤ n ak (x − p)k in die Form ∑ k ≤ n bk (x − q)k bringen (ohne
Ausmultiplizieren). Sind alle Koeffizienten ak ganzzahlig, so gilt dies
auch für alle bk .

© Oliver Deiser Grundzüge der Höheren Mathematik


220 3. Abschnitt Ableitungen und Integrale

Übung 3
(a) Zeigen Sie durch gliedweises Differenzieren der Kosinus- und
Sinusreihe, dass
cos′ = − sin und sin′ = cos.
(b) Folgern Sie, dass cos″ = − cos und sin″ = − sin.
(c) Geben Sie weitere Beispiele für Funktionen f : R → R an, die die
Differentialgleichung f ″ = − f erfüllen.

Lösung zu Übung 3
Für alle x P R gilt:
x2n x2n + 1
cos (x) = ∑ n (−1)n , sin (x) = ∑ n (−1)n + 1
(2n)! (2n + 1)!

zu (a): Gliedweises Differenzieren der Kosinus-Reihe ergibt


d d x2n x2n− 1
cos(x) = ∑ n (−1)n = ∑ n ≥ 1 (−1)n 2n
dx dx (2n)! (2n)!
x2n− 1 x2n + 1
= ∑ n ≥ 1 (−1)n = ∑ n ≥ 0 (−1)n + 1
(2n − 1)! (2n + 1)!
x2n + 1
= − ∑ n ≥ 0 (−1)n = − sin(x).
(2n + 1)!
Für den Sinus argumentieren wir zur Illustration in Pünktchenform:
d d x3 x5 x7
dx
sin(x) =
dx
( x −
3!
+
5!

7!
± … )
x2 x4 x6
= 1 − 2 + 5 − 7 ± …
3! 5! 7!
x2 x4 x6
= 1 − + − ± … = cos(x)
2! 4! 6!

zu (b): Aus (a) folgt cos″ = (− sin)′ = − sin′ = − cos, sin″ = cos′ = − sin.

zu (c): Nach Linearität der Ableitungen erfüllt auch sin(x) + cos(x) die
Gleichung f ″ = f. Das Gleiche gilt für jede Linearkombination
(+) a sin(x) + b cos(x) mit a, b P R beliebig.
Auch die Funktionen
(++) c cos(x + d), c sin(x + d) mit c, d P R beliebig
sind Lösungen der Gleichung f ″ = f. Diese Funktionen sind andere
Darstellungsformen der Funktionen in (+).

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Die Taylor-Entwicklung 221

Übung 4
Zeigen Sie durch Induktion nach n ≥ 1, dass
1
log(n) (x) = (−1)n − 1 (n − 1)! für alle x > 0.
xn

Lösung zu Übung 4
Induktionsanfang n = 1:
Für x > 0 gilt
d 1 1
log(x) = = (−1)1 − 1 (1 − 1)! .
dx x x1

Induktionsschritt von n nach n + 1:


Es gelte
1
log(n) (x) = (−1)n − 1 (n − 1)! für alle x > 0 (Induktionsvoraussetzung).
xn
Dann gilt für x > 0:
d
log(n+1) (x) = log(n) (x)
dx
d 1
= I. V. (−1)n − 1 (n − 1)! n
dx x
d 1
= (−1)n − 1 (n − 1)! (− n) n + 1
dx x
d 1
= (−1)n n! n + 1
dx x

© Oliver Deiser Grundzüge der Höheren Mathematik


4. Integration

Wir motivieren das Integral einer Funktion f : [ a, b ] → R als den signierten In-
halt der Fläche zwischen f und x-Achse. Zur Approximation verwenden wir Rie-
mann-Summen mit Stützstellen, die sich zur effektiven numerischen Approxi-
mation des Integrals eignen. Im Hauptsatz der Differential- und Integralrech-
nung sehen wir, wie sich ein Integral durch die Auswertung „obere Grenze minus
untere Grenze“ mit Hilfe einer Stammfunktion des Integranden einfach bestim-
men lässt. Damit erweisen sich die Differentiation und die Integration als invers
zueinander. Nach der Einführung uneigentlicher Integrale diskutieren wir die
wichtige Interpretation des Integrals als Mittelwert.

Schlüsselbegriffe
Riemann-Summe (mit Partition, Stützstellen, Zerlegungspunkten)
Riemann-Integral
Dirichlet-Sprungfunktion
Stammfunktion
Hauptsatz der Integral- und Differentialrechnung
Uneigentliche Integrale
Integral als Mittelwert

© Oliver Deiser Grundzüge der Höheren Mathematik


224 3. Abschnitt Ableitungen und Integrale

Riemann-Summen

Wir betrachten im Folgenden ein beschränktes abgeschlossenes reelles Inter-


vall [a, b] mit a < b und eine Funktion f : [a, b] → R. Wir möchten die Fläche be-
rechnen, die f mit der x-Achse einschließt. Diese Fläche ist signiert (vorzeichen-
behaftet). Flächenanteile unterhalb der x-Achse zählen negativ. Um diesen si-
gnierten Flächeninhalt zu erklären, folgen wir dem Grundprinzip der Analysis:
Approximation und Grenzübergang. Zur Approximation verwenden wir Recht-
ecksflächen, die sich einfach berechnen lassen.

Definition (Partition, Stützstelle, Zerlegungspunkt, Feinheit)


Sei n ≥ 1. Eine Partition des Intervalls [ a, b ] der Länge n ist eine endliche
Folge p = (tk , xk )k < n reeller Zahlen der Form
a = t0 ≤ x0 ≤ t1 ≤ x1 ≤ … ≤ tn − 1 ≤ xn − 1 ≤ b
Wir nennen die tk die Zerlegungspunkte und die xk die Stützstellen der
Partition. Schließlich setzen wir tn = b und nennen
δ(p) = max k < n (tk + 1 − tk )
die Feinheit der Partition.

Die Zerlegungspunkte können in [ a, b ] frei gewählt werden und die Stützstel-


len xk liegen frei innerhalb der Zerlegungsintervalle [ tk , tk + 1 ]. Die Länge einer
Partition entspricht der Anzahl der Teilintervalle. Nützlich sind:

Grundtypen von Partitionen


Sind alle Intervalle [ tk , tk + 1 ] einer Partition der Länge n gleichlang, d. h. gilt
b−a
tk = a + k für alle k ≤ n
n
so heißt die Partition äquidistant. Gilt xk = tk für alle k < n, so hat die
Partition linksseitige Stützstellen. Gilt xk = (tk + tk + 1 )/2 für alle k < n, so hat
sie mittige Stützstellen. Gilt xk = tk + 1 für alle k < n, so hat sie rechtsseitige
Stützstellen.

Jede Partition von [ a, b ] führt zu einer Approximation an die signierte Fläche


einer Funktion f : [ a, b ] → R:

Definition (Riemann-Summe)
Seien f : [ a, b ] → R und p = (tk , xk )k < n eine Partition von [ a, b ]. Dann heißt
∑ p f = ∑ k < n f(xk ) (tk + 1 − tk )
die Riemann-Summe von f bzgl. p.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 225

Beispiel für eine Partition


Wir betrachten das Intervall [ 0, 10 ] und die äquidistante Partition p der
Länge 10 mit mittigen Stützstellen. Hier gilt

t0 = 0, x0 = 1/2, t1 = 1, x1 = 3/2, …, t9 = 9, x9 = 9 1/2, t10 = 10.

Die Zerlegungsintervalle der Partition sind


[ 0, 1 ], [ 1, 2 ], … [ 9, 10 ].
Die Stützstellen sind die Mittelpunkte der Intervalle. Die Feinheit der
Partition ist 1.

Beispiel für eine Riemann-Summe


Sei f : [ 0, 10 ] → R die Funktion mit f(x) = x2 . Für die Partition p aus dem
vorangehenden Beispiel erhalten wir die Riemann-Summe

∑ p f = ∑ k < 10 f(xk ) (tk + 1 − tk )


= ∑ k < 10 (k + 1/2)2 1 = ∑ k < 10 (k2 + k + 1/4) = 665/2.

Mit denselben Zerlegungspunkten, aber linksseitigen Stützstellen ergibt sich

∑ p f = ∑ k < 10 k2 = 285
Bei rechtsseitigen Stützstellen erhalten wir

∑ p f = ∑ k < 10 (k + 1)2 = 385

t0 x0 t1 x1 t2 x2 t3 x3 t4 x4 t5

Die Riemann-Summe einer Funktion f. Die zugrunde gelegte Partition hat die Länge 5.
Von den fünft signierten Rechtecksflächen sind drei positiv und zwei negativ.

© Oliver Deiser Grundzüge der Höheren Mathematik


226 3. Abschnitt Ableitungen und Integrale

Das Riemann-Integral

Je feiner eine Partition p ist, desto genauer entspricht in der Regel die Rie-
mann-Summe ∑ p f der anschaulichen signierten Fläche von f. Dies motiviert
den folgenden Grenzübergang:

Definition (Riemann-Integral)
Eine Funktion f : [ a, b ] → R heißt Riemann-integrierbar oder kurz integrier-
bar mit Integral c, falls gilt

limδ(p) →0 ∑ p f = c,
d. h. für jede Folge (pn )n P N von Partitionen von [ a, b ] mit limn δ(pn ) = 0 gilt
limn ∑ pn f = c.

Notationen und Sprechweisen


Ist f : [ a, b ] → R Riemann-integrierbar mit Integral c, so schreiben wir
b b
* f = * f(x) dx = I ba (f ) = c [ gelesen: Integral von a nach b über f ]
a a
Die Funktion f nennen wir den Integranden und [ a, b ] das Integrations-
Intervall. Eine Funktion mit einem größeren Definitionsbereich schränken
wir in einem Integral automatisch auf das Integrationsintervall ein.

Wahl einer Partitionsfolge


Die Integrierbarkeit fordert, dass der Limes der Riemann-Summen für alle
Partitionsfolgen mit limn δ(pn ) = 0 gegen denselben Wert c konvergiert.
Wissen wir, dass f integrierbar ist, so können wir eine derartige Folge
verwenden, etwa äquidistante Partitionen mit linksseitigen Stützstellen. Für
ein integrierbares f : [ a, b ] → R mit der Intervall-Länge , = b − a gilt also:
b , ,
* f = limn ≥ 1 ∑ k < n f ( a + k ) .
a n n

Numerische Approximation
Die einfachen Summenformeln
k, , (k+1/2), , (k+1), ,
∑ k < n f (a + ) , ∑ k < n f (a + ) , ∑ k < n f (a + )
n n n n n n
für linksseitige, mittige bzw. rechte Stützstellen lassen sich zur numerischen
Berechnung von Integralen verwenden. Sie stellen keine ausgereifte
Methode dar, da sie den Verlauf von f nicht berücksichtigen. Oszilliert f bei
x0 stark, so ist es vorteilhaft, in der Nähe von x0 viele kleine Intervalle zu
platzieren. Ist f bei x1 sehr flach, so genügen dort wenige Intervalle. In der
Numerik spielen derartige adaptive Methoden eine wichtige Rolle.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 227

Integrierbare Funktionen

Die Integrierbarkeit lässt sich für viele Funktionen nachweisen:

Satz (Umfang der integrierbaren Funktionen)


(1) Jede stetige Funktion ist integrierbar. Insbesondere ist jede elemen-
tare Funktion auf jedem Intervall [ a, b ] ihres Definitionsbereichs
integrierbar.
(2) Jede monotone Funktion ist integrierbar.

Eine monotone Funktion kann sehr viele Sprungstellen besitzen. Die inte-
grierbaren Funktionen umfassen damit auch viele unstetige Funktionen. Der
Satz lässt sich zudem noch erweitern: Auch stückweise stetige oder monotone
Funktionen sind integrierbar. Ein Beispiel für eine nicht-integrierbare Funktion
ist gar nicht so leicht zu finden. Die folgende Funktion ist wie die Betragsfunk-
tion der Differentialrechnung die Königin unter den Gegenbeispielen:

Definition (Dirichlet-Sprungfunktion)
Die Dirichlet-Sprungfunktion auf [ 0, 1 ] ist die Funktion f : [ 0, 1 ] → R mit:
f(x) = 1 für x rational, f(x) = 0 für x irrational.

In jedem reellen Intervall [ a, b ] mit a < b liegen sowohl rationale als auch irra-
tionale Zahlen. Damit nimmt die Funktion in jedem derartigen Intervall sowohl
den Wert 0 als auch den Wert 1 an. Sie ist überall unstetig.

Satz (Nichtintegrierbarkeit der Sprungfunktion)


Die Dirichlet-Sprungfunktion f : [ 0, 1 ] → R ist nicht Riemann-integrierbar.

Beweis
Sei p eine Partition von [ 0, 1 ] der Länge n mit ausschließlich rationalen
Stützstellen. Dann gilt f(xk ) = 1 für alle k. Damit ist
∑ k < n f(xk ) (tk + 1 − tk ) = ∑ k < n 1 (tk + 1 − tk ) = ∑ k < n (tk + 1 − tk ) = 1.
Ist dagegen q eine Partition von [ 0, 1 ] der Länge n mit ausschließlich
irrationalen Stützstellen, so gilt
∑ k < n f(xk ) (tk + 1 − tk ) = ∑ k < n 0 (tk + 1 − tk ) = 0.
Da es derartige Partitionen p und q beliebig kleiner Feinheit δ > 0 gibt
(jedes nichttriviale Intervall enthält rationale und irrationale Zahlen), kann
der Grenzwert limδ(pn ) → 0 ∑ p f nicht existieren. Also ist f nicht Riemann-
integrierbar.

© Oliver Deiser Grundzüge der Höheren Mathematik


228 3. Abschnitt Ableitungen und Integrale

Elementare Eigenschaften des Integrals

Wir versammeln einige Eigenschaften des Integrals. Hierzu vereinbaren wir:

Rückwärtsintegral
Ist f : [ a, b ] → R integrierbar, so setzen wir
a b
* f = − * f (Rückwärtsintegral)
b a

Satz (Eigenschaften des Integrals)


Für alle integrierbaren Funktionen f, g : [ a, b ] → R, alle c, d, t P R und alle
s P [ a, b ] gilt:
b
(1) * c dx = c (b − a) (konstante Integrale)
a

b b b
(2) * c f(x) + d g(x) dx = c * f(x) dx + d * g(x) dx (Linearität)
a a a

b b
(3) * f(x) dx ≤ * g(x) dx, falls f(x) ≤ g(x) für alle x (Monotonie)
a a

b s b
(4) * f(x) dx = * f(x) dx + * f(x) dx (Aufspaltung)
a a s

b b+c
(5) * f(x) dx = * f(x − c) dx (Translation)
a a+c

b −a
(6) * f(x) dx = * f(−x) dx (Spiegelung)
a −b

Beweisskizze
Die Eigenschaften sind für Riemann-Summen leicht einzusehen. So gilt
zum Beispiel für jede Partition p = (tk , xk )k < n von [ a, b ]:

∑ p cf + dg = ∑ k < n (c f(xk ) + d g(xk )) (tk + 1 − tk )

= ∑ k < n c f(xk ) (tk + 1 − tk ) + ∑ k < n d g(xk ) (tk + 1 − tk )

= ∑ p c f + ∑ p d g = c ∑ p f + d ∑ p g.

Durch einen Grenzübergang übertragen sich die Eigenschaften von


Riemann-Summen auf Integrale.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 229

Der Hauptsatz der Differential- und Integralrechnung

Integrale lassen sich bislang nur sehr mühsam berechnen. Das ändert sich
grundlegend durch den Hauptsatz der Differential- und Integralrechnung.
Hierzu definieren wir allgemein für reelle Funktionen:

Definition (Stammfunktion)
Sei f : P → R. Eine Funktion F : P → R heißt eine Stammfunktion von f,
falls F′ = f.

Ist F eine Stammfunktion von f, so gilt dies auch für F + c mit einer beliebigen
Konstanten c P R. Sind F und G Stammfunktionen, so gilt
(F − G)′ = F′ − G′ = f − f = 0,
sodass F − G konstant ist. Kurz:
Eine Stammfunktion ist bis auf eine Konstante eindeutig bestimmt.
Damit können wir nun formulieren:

Satz (Hauptsatz der Differential- und Integralrechnung, HdI)


Sei f : [ a, b ] → R integrierbar, und sei F eine Stammfunktion von f.
Dann gilt
b
* f = F(b) − F(a).
a

Nur für sehr einfache Funktionen lässt sich eine Stammfunktion raten oder
leicht finden. Integrieren ist schwieriger als Differenzieren. Wir werden aber im
nächsten Kapitel Integrationsregeln kennenlernen, mit deren Hilfe wir viele In-
tegrale mehr oder weniger leicht berechnen können.

Die Auswertungsnotation
Wir setzen
b b b b
F = F = F(x) = F(x) = F(b) − F(a).
a a a a

Zur Verdeutlichung schreiben wir die Grenzen auch in der Form „x = a“


bzw. „x = b“.

Damit können wir den Hauptsatz kurz so formulieren:


b x=b b d x=b
* f(x) dx = F(x)
x=a
oder * dx
F(x) dx = F(x)
x=a
.
a a

Differenzieren und Integrieren sind in diesem Sinne invers zueinander.

© Oliver Deiser Grundzüge der Höheren Mathematik


230 3. Abschnitt Ableitungen und Integrale

Beispiele
(1) Für alle a, b P R (auch für b < a) gilt
b x5 x=b
b 5 − a5
* x4 dx =
5 x=a
=
5
.
a

(2) 2 1 2
* x
dx = log(x)
1
= log(2) − log(1) = log 2.
1

(3) 1 1 1 π
* 1 + x2
dx = arctan(x)
0
= arctan 1 − arctan 0 =
4
.
0

Zum Beweis des Hauptsatzes

Der Hauptsatzes ist nicht leicht zu beweisen. Seine Gültigkeit lässt sich wie
folgt plausibel machen. Die erste Argumentation kommt einem Beweis nahe.

Argumentation mit Riemann-Summen


Sei p = (tk , xk )k < n eine sehr feine Partition von [ a, b ]. Mit der Notation ,
für „ungefähr gleich“ gilt:
b
* f , ∑ p f = ∑ k < n f(xk ) (tk + 1 − tk )
a

= ∑ k < n F′(xk ) (tk + 1 − tk )

F(tk + 1 ) − F(tk )
, ∑k < n (tk + 1 − tk )
tk + 1 − tk

= ∑ k < n (F(tk + 1 ) − F(tk )) = F(tn + 1 ) − F(t0 ) = F(b) − F(a).

Die letzte Summe ist eine Teleskop-Summe. Nur der erste und letzte
Summand bleiben übrig, alle anderen haben sich auf.

Argumentation mit infinitesimalen Größen


Wir interpretieren das Integral als Summe von infinitesimalen Rechtecks-
flächen f(x) ⋅ dx und die Ableitung als infinitesimalen Quotienten dF(x)/dx.
Dann können wir dx bei der Integration kürzen:
b b b dF(x)
* f(x) dx = * F′(x) dx = * dx
dx
a a a
b
= * dF(x) = F(b) − F(a).
a
Im letzten Schritt haben wir eine „infinitesimale Teleskop-Summe“
berechnet.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 231

Die Existenz von Stammfunktionen

Der Hauptsatz erlaubt es, Integrale mit Hilfe einer Stammfunktion zu berech-
nen. Der folgende ebenso bedeutsame Satz zeigt, dass sich Stammfunktionen mit
Hilfe von Integration konstruieren lassen:

Satz (Hauptsatz der Differential- und Integralrechnung, Teil 2)


Sei f : [ a, b ] → R stetig. Weiter sei s P [ a, b ], und es sei Fs : [ a, b ] → R
definiert durch
x
Fs (x) = * f(t) dt für alle x P [ a, b ].
s
Dann ist Fs eine Stammfunktion von f.

Es gilt Fs (s) = 0 und F′ = f. Die Funktion F wie im Satz heißt auch die Integral-
funktion oder von f zum Startwert oder zur unteren Grenze s. Sie lässt sich für alle
integrierbaren Funktionen definieren. Ein Knick von f (wie bei der Betragsfunk-
tion) wird bei der Bildung der Integralfunktion geglättet. Eine einfache Sprung-
stelle von f (wie bei einer Treppenfunktion) führt zu einem Knick in der Integral-
funktion. Dies illustriert die Voraussetzung der Stetigkeit von f im Satz.

Gewinnung des ersten Teils des Hauptsatzes für stetige Funktionen


Sei f : [ a, b ] → R stetig, und sei Fa : [ a, b ] → R die Integralfunktion von f
zum Startwert a. Weiter sei F : [ a, b ] → R irgendeine Stammfunktion von
f. Dann gibt es ein c P R mit Fa = F + c. Damit gilt
b
* f(x) dx = Fa (b) − Fa (a) = F(b) + c − (F(a) + c) = F(b) − F(a).
a
Der zweite Teil des Hauptsatzes enthält also den ersten, wenn wir uns auf
stetige Funktionen beschränken.

Zu den Voraussetzungen des Hauptsatzes


Im ersten Hauptsatz setzen wir die Integrierbarkeit und die Existenz einer
Stammfunktion von f voraus. Im zweiten Teil fordern wir die Stetigkeit von
f und gewinnen eine Stammfunktion von f. Damit ist „f ist stetig“ die
„gute“ (aber nicht notwendige) Voraussetzung für die Integration.
Insgesamt sind die Zusammenhänge recht subtil:
(1) Es gibt eine differenzierbare Funktion F : [ a, b ] → R, deren Ableitung
f nicht integrierbar ist (f ist notwendig unstetig).
(2) Es gibt eine nicht stetige integrierbare Funktion g : [ a, b ] → R, die
eine Stammfunktion G : [ a, b ] → R besitzt.
Beispiele sind stark oszillierende Funktionen wie F, G: [ 0, 1] → R mit
F(x) = x2 sin(1/x2 ), G(x) = x2 sin(1/x) für x ≠ 0, F(0) = G(0) = 0.

© Oliver Deiser Grundzüge der Höheren Mathematik


232 3. Abschnitt Ableitungen und Integrale

Uneigentliche Integrale

Bisher sind alle Funktionen auf Intervallen der Form [ a, b ] definiert. Wir be-
trachten nun auch Definitionsbereiche der Form ] −∞, b ], [ a, ∞ [ und ] −∞, ∞ [.

Uneigentliche Integrale
Für eine reelle Funktion f mit einem unbeschränkten Definitionsintervall
setzen wir im Fall der Existenz:
∞ b b b
* f = limb →∞ * f, * f = lima → −∞ * f
a a −∞ a
und weiter
∞ ∞ 0
* f = * f + * f.
−∞ 0 −∞

Ähnlich können wir halboffene und offene Definitionsbereiche behandelt, wie


sie zum Beispiel bei Polstellen auftreten. Ist f : [ a, b [ → R, so setzen wir im Fall
der Existenz
b c
* f = lim c ↑ b * f.
a a
Analog wird das uneigentliche Integral für eine Funktion f : ] a, b ] → R erklärt.
Durch Wahl einer Zwischenstelle s P ]a, b[ erhalten wir schließlich auch ein un-
eigentliches Integral für Funktionen der Form f : ] a, b [ → R:
b s b
* f = * f + * f.
a a s
In allen Fällen gilt: Ein Integral von a bis b ist nur dann erklärt, wenn f auf je-
dem inneren Teilintervall [ c, d ] von ] a, b [ definiert ist. Das Integral lässt sich er-
weitern, um zum Beispiel auch über Polstellen hinweg integrieren zu können.
Wir begnügen uns hier mit dieser Form.

Beispiel
1 1
* log x = lima ↓ 0 * log x dx
0 a
x=1
= lima → 0 x(log(x) − 1)
x=a

= −1 − lima →0 a (log(a) − 1) = −1 − 0 = −1.

Der Logarithmus schließt also im Intervall ] 0, 1 ] mit der x-Achse eine


unbeschränkte Fläche mit einem endlichen (negativen) Flächeninhalt ein.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 233

Das Integral als Mittelwert

Neben der geometrisch sehr anschaulichen Interpretation als signierter Flä-


cheninhalt lässt sich ein Integral auch als Mittelwert auffassen. Diese Sicht ist in
den Naturwissenschaften und der Technik vorherrschend, innerhalb der Mathe-
matik treffen wir sie auch in der Wahrscheinlichkeitstheorie bei der Berechnung
von Erwartungswerten von Zufallsvariablen an.
Um von den signierten Flächen zu den Mittelwerten zu gelangen, betrachten
wir zunächst eine auf dem Einheitsintervall definierte integrierbare Funktion
f : [ 0, 1 ] → R. Ist c das Integral von f, so haben f und die konstante Funktion auf
[ 0, 1 ] mit Wert c dasselbe Integral:
1 1
* f(x) dx = * c dx = c.
0 0

Wir nennen c den Mittelwert von f. Ist f : [ a, b ] → R integrierbar, so heißt allge-


meiner

1 b
M(f ) =
b−a
* f(x) dx
a

der Mittelwert von f. Er berechnet sich nach der Formel „Integral durch Inter-
vall-Länge“. Die konstante 1-Funktion auf [ a, b ] hat den Mittelwert 1.
Damit ist zum Beispiel

1 b
M(f ) =
b−a
* f(t) dt
a

die Durchschnittstemperatur eines Körpers, der zur Zeit t P [ a, b ] die Tempera-


tur f(t) besitzt. Die Situation ist vergleichbar mit der Interpretation der Ablei-
tung: Geometrische Steigungen können physikalische Geschwindigkeiten und
vieles andere mehr sein. Die Interpretation fundamentaler Begriffe ist vielfältig.
Beim Differenzieren geht es aber immer um die lokale Änderung, beim Integrie-
ren um das globale Aufsammeln von Funktionswerten.

© Oliver Deiser Grundzüge der Höheren Mathematik


234 3. Abschnitt Ableitungen und Integrale

Übungen

Übung 1
Sei f : [ 0, 1 ] → R mit f(x) = x für alle x P [ 0, 1 ]. Für alle n ≥ 1 sei pn die
äquidistante Partition von [ 0, 1 ] der Länge n mit linksseitigen Stützstellen.
(a) Erstellen Sie ein Diagramm, das die Situation übersichtlich darstellt.
(b) Berechnen Sie die Riemann-Summen ∑ pn f für alle n ≥ 1.
(c) Zeigen Sie, dass limn ∑ pn f = 1/2.

Übung 2
Sei b > 0 und f : [ −b, b ] → R integrierbar. Zeigen Sie mit Hilfe der
elementaren Eigenschaften des Integrals:
(a) Ist f gerade. d. h. f(x) = f(−x) für alle x, so gilt
b b
* f(x) dx = 2 * f(x) dx.
−b 0
(b) Ist f ungerade. d. h. f(−x) = − f(x) für alle x, so gilt
b
* f(x) dx = 0.
−b

Übung 3
Seien f, F : [ −1, 1 ] → R die Funktionen mit
1
f(x) = £1 − x2 , F(x) =
2
(
x £1 − x2 + arcsin(x) ) für alle x P [−1, 1 ].

(a) Zeigen Sie, dass F eine Stammfunktion von f ist.


b
(b) Berechnen Sie * f mit Hilfe des Hauptsatzes.
a
(c) Welcher Wert ergibt sich für die Fläche eines Einheitskreises?
Begründen Sie Ihre Antwort.

Übung 4
Sei f : [ −1, 1 ] → R mit f(x) = £1 − x2 für alle x P [ −1, 1 ] (vgl. die vorange-
hende Übung). Berechnen Sie mit Hilfe eines Taschenrechners oder
Computers einige aussagekräftige Riemann-Summen von f in numerischer
Form. Vergleichen Sie die Ergebnisse mit dem exakten Ergebnis. Geben
Sie Ihre Berechnungen in einer Tabelle an.
[ Für die Riemann-Summen können Sie je nach verfügbaren Hilfsmitteln
zum Beispiel die äquidistanten Partitionen von [ −1, 1 ] mit mittigen oder
linksseitigen Stützstellen der Längen 10, 20, 50, 100 und 1000 verwenden. ]

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 235

Lösungen zu den Übungen

Übung 1
Sei f : [ 0, 1 ] → R mit f(x) = x für alle x P [ 0, 1 ]. Für alle n ≥ 1 sei pn die
äquidistante Partition von [ 0, 1 ] der Länge n mit linksseitigen Stützstellen.
(a) Erstellen Sie ein Diagramm, das die Situation übersichtlich darstellt.
(b) Berechnen Sie die Riemann-Summen ∑ pn f für alle n ≥ 1.
(c) Zeigen Sie, dass limn ∑ pn f = 1/2.

Lösung zu Übung 1
zu (a):
1.0

0.8

0.6 f

0.4

0.2

0.2 0.4 0.6 0.8 1.0

Eine äquidistante Riemann-Summe mit linksseitigen Stützstellen für f.

zu (b): Sei n ≥ 1. Wir verwenden die Formel


k, ,
∑ pn f = ∑ k < n f ( a + ) .
n n
Mit a = 0, , = 1 und f(x) = x für alle x P [ 0, 1 ] und der Gauß-Summe
0 + 1 + … + (n − 1) = (n − 1) n/2 ergibt sich:
k 1 1
∑ pn f = ∑ k < n = ∑k < n k
n n n2
1 (n − 1) n n2 − n 1 1
= = = − .
n2 2 2n2 2 2n

zu (c): Aus den Werten für die Riemann-Summen in (b) erhalten wir
1 1 1
limn ∑ pn f = limn ( − ) = .
2 2n 2

© Oliver Deiser Grundzüge der Höheren Mathematik


236 3. Abschnitt Ableitungen und Integrale

Übung 2
Sei b > 0 und f : [ −b, b ] → R integrierbar. Zeigen Sie mit Hilfe der
elementaren Eigenschaften des Integrals:
(a) Ist f gerade. d. h. f(x) = f(−x) für alle x, so gilt
b b
* f(x) dx = 2 * f(x) dx.
−b 0
(b) Ist f ungerade. d. h. f(−x) = − f(x) für alle x, so gilt
b
* f(x) dx = 0.
−b

Lösung zu Übung 2
zu (a):
Sei f : [− b, b ] → R gerade. Dann gilt:
b 0 b
* f(x) dx = * f(x) dx + * f(x) dx
−b −b 0
−(−b) b
= * f(− x) dx + * f(x) dx
−0 0
b b b
= * f(x) dx + * f(x) dx = 2 * f(x) dx.
0 0 0

Dabei haben wir verwendet: Aufspaltung (bei 0), Spiegelung (x geht


über in −x) und die Voraussetzung „f ist gerade“.
zu (b):
Sei f : [− b, b ] → R ungerade. Dann gilt:
b 0 b
* f(x) dx = * f(x) dx + * f(x) dx
−b −b 0
−(−b) b
= * f(− x) dx + * f(x) dx
−0 0
b b
= * − f(x) dx + * f(x) dx
0 0
b b
= * − f(x) + f(x) dx = * 0 dx = 0.
0 0

Dabei haben wir verwendet: Aufspaltung (bei 0), Spiegelung (x geht


über in −x), die Voraussetzung „f ist ungerade“, Linearität, Integral über
konstante Funktionen.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Integration 237

Übung 3
Seien f, F : [ −1, 1 ] → R die Funktionen mit
1
f(x) = £1 − x2 , F(x) =
2
(
x £1 − x2 + arcsin(x) ) für alle x P [−1, 1 ].

(a) Zeigen Sie, dass F eine Stammfunktion von f ist.


b
(b) Berechnen Sie * f mit Hilfe des Hauptsatzes.
a
(c) Welcher Wert ergibt sich für die Fläche eines Einheitskreises?
Begründen Sie Ihre Antwort.

Lösung zu Übung 3
zu (a):
Es gilt:
d 1 d d
dx
F(x) =
2
( dx
x £1 − x2 +
dx
arcsin(x) )
1 − 2x 1
= ( 1 £1 − x2 + x + )
2 2 £1 − x 2
£1 − x2
1 1 − x2 − x2 + 1 1 − x2
= = = £ 1 − x2
2 £1 − x2 £1 − x2
zu (b):
Nach dem Hauptsatz und (a) gilt
1 b
* f(x) dx = F(x)
a
= F(1) − F(−1)
−1
1
= ( arcsin(1) − arcsin(−1) )
2
1 π −π π
= ( 2

2
) =
2
.
2
zu (c):
Die Funktion f stellt die obere Hälfte der Einheitskreislinie
K = { (x, y) P R2 | x2 + y2 = 1 }
dar. Denn für alle (x, y) P R2 gilt (x, y) P K genau dann, wenn

y = ± £1 − x2 = ± f(x), x P [ −1, 1 ].

Aus Symmetriegründen ist die Fläche des Einheitskreises das Doppelte


des Integrals π/2 von f. Damit ergibt sich die Fläche π.

© Oliver Deiser Grundzüge der Höheren Mathematik


238 3. Abschnitt Ableitungen und Integrale

Übung 4
Sei f : [ −1, 1 ] → R mit f(x) = £1 − x2 für alle x P [ −1, 1 ] (vgl. die vorange-
hende Übung). Berechnen Sie mit Hilfe eines Taschenrechners oder
Computers einige aussagekräftige Riemann-Summen von f in numerischer
Form. Vergleichen Sie die Ergebnisse mit dem exakten Ergebnis. Geben
Sie Ihre Berechnungen in einer Tabelle an.
[ Für die Riemann-Summen können Sie je nach verfügbaren Hilfsmitteln
zum Beispiel die äquidistanten Partitionen von [ −1, 1 ] mit mittigen oder
linksseitigen Stützstellen der Längen 10, 20, 50, 100 und 1000 verwenden. ]

Lösung zu Übung 4
Wir verwenden die Formel (vgl. „Numerische Approximationen“)

(k + 1/2) , ,
rn = ∑ k < n f ( a + )
n n
für äquidistante Riemann-Summen mit mittigen Stützstellen, wobei a = −1,
, = 1 − (−1) = 2 und n die Länge der Partition bezeichnet. Eine Computer-
berechnung liefert die folgenden gerundeten Ergebnisse:

n rn rn − π/2

10 1,58599 0,0151976

20 1,57621 0,00540939

50 1,57217 0,00137403

100 1,57128 0,000486449

1000 1,57081 0,0000154016

Verwenden wir linksseitige Stützstellen (mit k , statt (k + 1/2), im Zähler),


so ergeben sich für die Riemann-Summen sn die Werte:

n sn sn − π/2

10 1,51852 −0,0522719

20 1,55226 −0,0185372

50 1,5661 −0,00469817

100 1,56913 −0,00166207

1000 1,57074 −0,0000525883

Mittige Stützstellen liefern deutlich bessere Approximationen.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln

Wir stellen verschiedene Methoden vor, mit denen sich Stammfunktionen be-
rechnen und damit Integrale lösen lassen. Rationale Integranden können wir
durch Partialbruchzerlegung so umformen, dass sie sich leicht integrieren las-
sen. Die Produktregel und die Kettenregel führen zu den beiden vielleicht
wichtigsten Integrationstechniken der partiellen Integration und der Substitu-
tion. Damit lassen sich viele Integrale (oft recht trickreich) bestimmen.
Schließlich gibt es aber auch elementare Funktionen, bei denen alle Rechen-
künste versagen: Sie besitzen keine elementare Stammfunktion und führen zur
Einführung neuer Funktionen.

Schlüsselbegriffe
Unbestimmtes Integral
Partialbruchzerlegung
Partielle Integration
Substitutionsregel
Substitution in Leibniz-Notation
Nichtelementare Integrale

© Oliver Deiser Grundzüge der Höheren Mathematik


240 3. Abschnitt Ableitungen und Integrale

Unbestimmte Integrale

Notation
Sei f : [ a, b ] → R integrierbar und f besitze eine Stammfunktion
F : [ a, b ] → R. Dann schreiben wir

*f = * f(x) dx = I(f ) = „irgendeine Stammfunktion von f “.

Wir nennen I(f) auch das unbestimmte Integral von f. Allgemeiner lassen wir
beliebige Intervalle als Definitionsbereich von f zu, sofern f (wie bei der
uneigentlichen Integrierbarkeit) auf jedem Teilintervall [ a, b ] ihres
Definitionsbereichs integrierbar ist.

Bemerkung
Eine Stammfunktion ist nur bis auf eine Konstante eindeutig bestimmt. Die
Notation ist für mathematische Verhältnisse recht schludrig. Das Gleiche
gilt für die „+ c“-Variante. Formal korrekt müssten wir
I(f ) = { F | F ist eine Stammfunktion von f }
setzen oder anstelle der Gleichheit mit einer Äquivalenzschreibweise F , G
arbeiten, die bedeutet, dass F − G eine konstante Funktion ist. Die
Notation führt aber in der Regel nicht zu Fehlern. Bei der Auswertung
„obere Grenze minus untere Grenze“ spielt die Konstante keine Rolle.

Nach Definition gilt

(* f ) ′ = f, * f′ = f, d.h. D(I(f )) = f = I(D(f )).

Mit dem Hauptsatz erhalten wir für alle [ a, b ] ⊆ Def(f ):


b x=b b
* f(x) dx = ( * f(x) dx ) x=a
= (* f ) a
= F(b) − F(a) mit F′ = f.
a

Beispiele
(1) * 1 dx = x, * 1 dx = x+c für alle c P R.

(2) * sin(x) dx = − cos(x), * cos(x) dx = sin(x)

(3) * 1/x dx = log(x) auf ] 0, ∞ [ , * 1/x dx = log(−x) auf ] −∞, 0 [ .

Dies lässt sich zusammenfassen in der Form

* 1/x dx = log(|x|) für Definitionsintervalle ohne 0.

In Zweifelsfällen geben wir das Definitionsintervall an.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 241

Die Integration rationaler Funktionen

Die Integration von Polynomen ist aufgrund der Linearität des Integrals und
xn + 1
* xn dx =
n+1
für alle n P N Integration von Monomen

unproblematisch. Die ersten Schwierigkeiten tauchen bei den rationalen Funk-


tionen auf. Eine rationale Funktion besitzt im Allgemeinen keine rationale
Stammfunktion. Prominent sind hier
1 1
* x
dx = log(|x|), * 1 + x2
= arctan(x).

Eine wichtige Technik bei der Integration rationaler Funktionen ist die Parti-
albruchzerlegung, mit deren Hilfe eine rationale Funktion durch additives Ab-
spalten ihrer Pole als Summe einfacher zu integrierender Funktionen dargestellt
werden kann. Wir betrachten einige typische Beispiele (vgl. auch die Übungen).

Beispiel: Einfacher Pol


Wir suchen reelle Zahlen a, b mit
1 a b a(x + 1) + bx (a + b)x + a
= + = = .
x (x + 1) x x+1 x(x + 1) x(x + 1)
Durch Koeffizientenvergleich erhalten wir das Gleichungssystem
a + b = 0, a = 1. Die eindeutige Lösung ist a = 1, b = −1, sodass
1 1 −1
* x (x + 1)
dx = * x
dx + * x+1
dx = log(|x|) − log(|x + 1|).

10

5
f

-3 -2 -1 1 2 3
F

-5

-10

Die Funktionen f, F mit f(x) = 1/(x(x + 1)), F(x) = log(|x| − log(|x + 1|) für x ¸ { −1, 0 }

© Oliver Deiser Grundzüge der Höheren Mathematik


242 3. Abschnitt Ableitungen und Integrale

Beispiel: Mehrfacher Pol


Wir suchen reelle Zahlen a, b, c mit
x2 + 1 a b c
= + +
(x − 1)3 (x − 1)3 (x − 1)2 x−1
a + b (x − 1) + c (x − 1)2 cx2 + (b − 2c) x + a − b + c
= =
(x − 1)3 (x − 1)3
Ein Koeffizientenvergleich in

cx2 + (b − 2c)x + a − b + c = x2 + 0x + 1.

ergibt c = 1 und weiter a = b = 2. Damit ist

x2 + 1 2 2 1
* (x − 1)3
dx = * (x − 1)3
dx + * (x − 1)2
dx + * x−1
dx

1 2
= − − + log(|x − 1|).
(x − 1)2 (x − 1)

15

10

5
f

-2 2 4 6

-5 F

-10

-15

-20

Die Funktionen f, F : R − { 1 } → R mit


2
x +1 1 2
f(x) = , F(x) = − − + log(|x − 1|)
(x − 1)3 (x − 1)2 (x − 1)

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 243

Partielle Integration

Jede Differentiationsregel führt durch Umkehrung zu einer Integrationsregel.


In diesem Abschnitt betrachten wir dies am Beispiel der Produktregel. Vorab
vereinbaren wir:

Konvention
Im Folgenden seien I, J ein beliebige reelle Intervalle.

Seien nun f,g : I → R stetig differenzierbare Funktionen. Nach der Produktre-


gel gilt

(f g)′ = f ′ g + f g′.

Da die beteiligten Funktionen stetig sind, können wir links und rechts die unbe-
stimmten Integrale bilden:

* (f g)′ = * ( f ′ g + fg′ ).

Nach Definition des unbestimmten Integrals und Linearität erhalten wir:

fg = * f ′ g + * f g′.
Wir halten diese Formel in einer leicht umgestellten Form fest:

Satz (partielle Integration)


Seien f, g : I → R stetig differenzierbar. Dann gilt:

(a) *f′ g = fg − * f g′,


b b b
(b) * f′g = fg
a
− * f g′ für alle a, b P I.
a a

Anwendung der partiellen Integration


Wir möchten das Integral des Produkts zweier Funktionen berechnen. Von
einem Faktor kennen wir eine Stammfunktion, sodass wir das Produkt in
der Form f ′g schreiben können (die bekannte Stammfunktion ist dann f ).
Mit Hilfe der partiellen Integration können wir nun die Ableitung auf den
anderen Faktor abwälzen und f g′ an Stelle von f ′ g integrieren.

Vorzeichen beachten
Viele Rechenfehler bei der partiellen Integration entstehen durch die
Missachtung des negativen Vorzeichens. Es ist empfehlenswert, nach jeder
Anwendung zu überprüfen, ob das Vorzeichen nach dem Abwälzen der
Ableitung korrekt ist.

© Oliver Deiser Grundzüge der Höheren Mathematik


244 3. Abschnitt Ableitungen und Integrale

Beispiel: Einschieben der Eins


Sei g : I → R stetig differenzierbar. Dann gilt
g(x) = 1 g(x) für alle x P I.
Die Identität auf I ist eine Stammfunktion der 1, sodass
d d
g(x) = 1 g(x) = ( x ) g(x) = x g(x)
dx dx
Mit dieser Methode können wir Funktionen den Logarithmus integrieren.
Für das Intervall I = ] 0, ∞ [ gilt:

* log(x) dx = * 1 log(x) dx
d
= *( dx
x ) log(x) dx

d
= x log(x) − *x( dx
log(x) ) dx

1
= x log(x) − *x x
dx

= x log(x) − * 1 dx
= x log(x) − x = x (log(x) − 1).

Beispiel: Einschieben der Eins und logarithmische Ableitung


Der Arkustangens lässt sich mit der gleichen Methode integrieren. Dabei
ist ein zusätzlicher Trick nötig. Auf R gilt:

* arctan(x) dx = * 1 arctan(x) dx
1
= x arctan(x) − *x 1 + x2
dx

1 2x
= x arctan(x) −
2
* 1 + x2
dx

1
= x arctan(x) − log(1 + x2 ).
2
Die Stammfunktion log(1 + x2 ) ergibt sich hier aus der logarithmischen
Ableitung
d f ′(x)
log(f(x))′ = .
dx f(x)
Im vorliegenden Fall ist f(x) = 1 + x2 und f ′(x) = 2x.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 245

Beispiel: Partielle Integration und trigonometrische Formeln


Die partielle Integration bietet sich für Integranden der Form f 2 an, wenn
eine Stammfunktion von f bekannt ist. Hier sind beide Faktoren gleich.
Auf R gilt zum Beispiel:
d
* cos2(x) dx = * cos(x) cos(x) dx = *( dx
sin(x) ) cos(x) dx

d
= sin(x) cos(x) − * sin(x) ( dx
cos(x) ) dx

= sin(x) cos(x) + * sin2(x) dx.


Wir addieren nun das Integral von cos2 (x) auf beiden Seiten und erhalten
zusammen mit dem Satz des Pythagoras:

2 * cos2(x) dx = sin(x) cos(x) + * sin2(x) dx + * cos2(x) dx


= sin(x) cos(x) + * sin2(x) dx + cos2(x) dx
= sin(x) cos(x) + * 1 dx = sin(x) cos(x) + x.

Folglich ist
1
* cos2(x) dx =
2
(
sin(x) cos(x) + x . )
Beispiel: Auslöschen von Polynomen
Ist einer der Faktoren eines Produkts ein Polynom, so können wir dieses
Polynom durch mehrfaches Abwälzen der Ableitung auslöschen. Auf R gilt
zum Beispiel

* ex x3 dx = ex x3 − 3 * ex x2 dx

= ex x3 − 3 ( ex x2 − 2 * ex x dx )

= ex x3 − 3 ex x2 + 6 * ex x dx

= ex x3 − 3 ex x2 + 6 ( ex x − * ex dx )
= ex x3 − 3 ex x2 + 6 ex x − 6 ex

= ex (x3 − 3x2 + 6x − 6)

Allgemein lässt sich so das Integral von ex xn für beliebige n P N berechnen.

© Oliver Deiser Grundzüge der Höheren Mathematik


246 3. Abschnitt Ableitungen und Integrale

Die Substitutionsregel

Die Umkehrung der Kettenregel liefert:

Satz (Substitutionsregel)
Seien f : J → R stetig und s : I → J stetig differenzierbar. Dann gilt

(a) * (f + s) s′ = ( *f) + s,
b s(b)
(b) * (f + s) s′ = * f für alle a, b P I.
a s(a)

Beweis
Sei F : J → R eine Stammfunktion von f. Nach der Kettenregel gilt
(F + s)′ = (F′ + s) ⋅ s′ = (f + s) ⋅ s′, sodass

(*f ) + s = F+s = * (f + s) ⋅ s′.


Sind nun a, b P I beliebig, so gilt:
b b s(b) s(b)
* (f + s) s′ = F + s
a
= F
s(a)
= * f
a s(a)

Der Buchstabe „s“ steht für „Substitutionsfunktion“. Vorstellung ist, dass s ein
Intervall I stetig in ein Intervall J überführt (dehnt, staucht, umkehrt).

Beispiele
(1) Für I = J = R gilt mit f(x) = cos(x), s(x) = x2 :

* cos(x2) 2x dx = sin(x2 )

(2) Für I = J = R gilt mit f(x) = 1/2 (1 + x2 )1/2 , s(x) = x2 :


x 1
* dx = * (2x) dx = £1 + x2
£1 + x 2
2 £1 + x 2

(3) Für f : ] 0, ∞ [ → R mit f(x) = 1/x und s : I → ] 0, ∞ [ gilt:


s′(x)
* s(x)
dx = log(s(x))

Diesen Fall der Substitutionsregel hatten wir oben bei der logarithmi-
schen Ableitung bereits kennengelernt.

In diesen Beispielen ist die Substitutionsfunktion ablesbar. Oft ist dies nicht
der Fall. Eine Substitutionsfunktion muss dann erst eingeführt werden:

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 247

Einführen einer Substitution


Gesucht ist eine Stammfunktion von f : J → R. Wir führen nun eine
geeignet gewählte bijektive Substitutionsfunktion s : I → J ein, sodass

*f = ( * (f + s) s′ ) + s− 1 (Anwendung von s−1 auf beiden Seiten von (a))

Nun lösen wir das Integral auf der rechten Seite. Die erhaltene Funktion
auf I verknüpfen wir mit s−1 : J → I (Rücksubstitution). Dies liefert das
gesuchte Integral von f auf J.

Bei der praktischen Durchführung ist es üblich, die Leibniz-Notation zu ver-


wenden und Terme in voneinander abhängigen Variablen zu manipulieren:

Einführung einer Substitution in der Leibniz-Notation


Gegeben ist eine als Term in einer Variablen x vorliegende Funktion f(x),
die wir bestimmt oder unbestimmt integrieren möchten. Wir setzen
x = s(t)
für einen stetig differenzierbaren Funktionsterm s in einer neuen Variablen t.
Auf einem Intervall I für t muss f(s(t)) definiert sein. Aus
dx ds(t)
= = s′(t)
dt dt
ergibt sich durch formales Umformen

dx = ds(t) = s′(t) dt.

Damit gilt (in Termen in x links und t rechts):

* f(x) dx = * f(s(t)) ds(t) = * f(s(t)) s′(t) dt mit x = s(t)

Nun bestimmen wir das Integral auf der rechten Seite (zum Beispiel durch
partielle Integration oder weitere Substitutionen). Dies liefert einen Term
F(t) in der Variablen t. Diesen Term können wir zur Berechnung bestimm-
ter Integrale von f verwenden:
−1
x=b t = s (b) t = s−1 (b)
* f(x) dx = * −1
f(s(t)) s′(t) dt = F(t)
t = s−1 (a)
x=a t = s (a)

Die Funktion s muss dabei nicht injektiv sein, in den Grenzen können wir
beliebige Urbilder von a und b einsetzen. Ist s injektiv (und dies ist in der
Regel der Fall), so liefert das Einsetzen von
t = s−1 (x) (Rücksubstitution)
−1
in den Term F(t) einen Term F(s (x)) in x. Dieser Term definiert eine
Stammfunktion von f auf dem Wertebereich von s.

© Oliver Deiser Grundzüge der Höheren Mathematik


248 3. Abschnitt Ableitungen und Integrale

Konvention
Oft arbeiten wir mit Variablen x, t, u, …, die über Funktionsterme
voneinander abhängen, etwa
x = sin(t), t = arcsin(x) für x P [ −1, 1 ],
dx = d sin(t) = cos(t) dt,
dt = d arcsin(x) = (1 − x2 )−1/2 dx für x P ] −1, 1 [.
Ein Funktionszeichen für die Substitutionsfunktion s taucht gar nicht mehr
auf. Die Variablen x und t werden als Funktionen x = x(t), t = t(x) aufgefasst.

Probleme beim Integrieren werden wegsubstituiert. Wir betrachten einige


Beispiele.

Beispiel: Lineare Substitutionen


Seien c, d reelle Zahlen mit c ≠ 0. Mit
x = c t + d, dx = c dt
gilt unter der Voraussetzung der Definiertheit:

* f(x) dx = * f(c t + d) c dt mit Funktionstermen in x und t.

In bestimmter Form erhalten wir mit t = (x − d)/c:


x=b t = (b − d)/c
* f(x) dx = * f(c t + d) c dt.
x =a t =(a − d)/c

Konkret gilt beispielsweise:

1 1 1 log(t) 1
(1) * 2x + 1
dx = * t 2
dt =
2
=
2
log(2x + 1)

mit t = 2x + 1, x = (t − 1)/2, dx = dt/2 auf ] −1/2, ∞ [

(2) * cos(x/2 − 1) dx = * cos(t) 2dt = 2 sin(t) = 2 sin(x/2 − 1)

mit t = x/2 − 1, x = 2t + 1, dx = 2dt auf ganz R

1 1 t3 (3x + 1)3
(3) * (3x + 1)2 dx = * t2 3
dt =
3 3
=
9
mit t = 3x + 1, x = t/3 − 1, dx = dt/3 auf ganz R

Diese einfachen Integrale lassen sich natürlich auch raten. Die Durchfüh-
rung der Substitution dient der Illustration der Leibniz-Notation.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 249

Beispiel: Das Kreisintegral


Sei r > 0. Die Funktion f : [ −r, r ] → R mit
f(x) = £r2 − x2 für alle x P [ −r, r ]
stellt die obere Hälfte des zentrischen Kreises Kr mit Radius r der Ebene
dar. Zur Berechnung des Integrals von f verwenden wir die Substitution
x = r sin(t), t = arcsin(x/r), dx = r cos(t) dt mit t P [ −π/2, π/2 ].
Anschaulich durchläuft f(t) die obere Hälfte des Kreises nun im Winkel
t P [ −π/2, π/2 ] und nicht mehr entlang des Intervalls [ −r, r ] der x-Achse.
Mit dieser Substitution können wir das Integral berechnen:

* f(x) dx = * £r2 − x2 dx

= * £r2 − r2 sin2(t) r cos(t) dt (r ≥ 0)

= r2 * £1 − sin2(t) cos(t) dt

= r2 * £cos2(t) cos(t) dt

= r2 * |cos(t)| cos(t) dt (cos(t) ≥ 0 für t P [−π/2, π/2 ])

= r2 * cos2(t) dt (vgl. partielle Integration oben)

cos(t) sin(t) + t
= r2 (Rücksubstitution)
2
r2
=
2 (cos(arcsin( xr )) x
r
+ arcsin
x
r
( ))
r2 x x
=
2 ( £1 − x /r2 2
r
+ arcsin
r
( ))
1
=
2 ( x £r − x
2 2
+ r2 arcsin ( xr ) ) .
Die Auswertung an den Grenzen a = −r und b = r ergibt
r 1 2 1 2 π −π r2 π
* f(x) dx =
2
r ( arcsin(1) − arcsin(−1) ) =
2
r (
2

2
) =
2
.
−r
Damit ist r2 π die Fläche von Kr . Mit Hilfe unserer Stammfunktion können
wir auch Kreisflächenabschnitte auf [ a, b ] ⊆ [ −r, r ] berechnen.

© Oliver Deiser Grundzüge der Höheren Mathematik


250 3. Abschnitt Ableitungen und Integrale

Beispiel: Mehrfache Substitution


Mit den Substitutionen
t = 1 + x2 , dt = 2x dx,
u = log(t), du = dt/t
gilt:
2x
* (1 + x ) (1 + log(1 + x2 ))2
2
dx

1
= * t (1 + log(t))2
dt

1
= * t (1 + log(t))2
dt

1
= * (1 + u)2
du

1
= −
1+u
1
= −
1 + log(t)
1
= −
1 + log(1 + x2 )

Natürlich können wir hier auch in einem Schritt

1
v = log(1 + x2 ), dv = 2x dx
1 + x2
substituieren. Oft wird aber zuerst eine Substitution durchgeführt, dann
eine partielle Integration, dann wieder eine Substitution usw. Um zu
Stammfunktionen zu gelangen, müssen wir am Ende mehrfach rücksubsti-
tuieren.

Allgemeine Prinzipien beim Substituieren


(1) Mehrfach auftretende Ausdrücke durch eine Substitution vereinfa-
chen.
(2) Nach Ableitungen suchen, die auf ein Nachdifferenzieren hindeuten.
(3) Zu trigonometrischen Funktionen übergehen und trigonometrische
Formeln verwenden. Umgekehrt kann es aber auch sinnvoll sein,
trigonometrische Funktionen zu entfernen.
(4) Techniken kombinieren (Partialbruchzerlegung, partielle Integration).

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 251

Nichtelementare Stammfunktionen

Jede differenzierbare elementare Funktion besitzt eine elementare Ableitung.


Dies ist für die Integration nicht richtig: Es gibt elementare Funktionen, die
keine elementare Stammfunktion besitzen. Beispielsweise sind die vergleichs-
weise einfach wirkenden Integrale
sin(x) 1
* x
, * sin(x2) dx, * log(x)
dx, * £1 − sin2(x)/4 dx
innerhalb der elementaren Funktionen nicht lösbar. Wir finden mit unseren In-
tegrationsregeln keine Stammfunktion, und das liegt weder an den Regeln noch
an uns: Die elementaren Funktionen sind nicht reichhaltig genug. So wie die In-
tegration von 1/x und 1/(1 + x2 ) aus den rationalen Funktionen hinausführt, so
führt die Integration von
sin(x)/x, sin(x2 ), 1/log(x), £1 − sin2 (x)/4
und vielen weiteren Funktionen aus den elementaren Funktionen hinaus. Das
Gleiche gilt für das Integral über die Gaußsche Glockenkurve:
2
* e−x /2 dx
Die Integration gibt damit Anlass zur Betrachtung neuer Funktionen. So ist das
Gaußsche Fehlerintegral F : R → R definiert durch
x 2
F(x) = * e−t /2 dt für alle x P R.
0
Zur Berechnung werden numerische Methoden verwendet. Den Grenzwert
limx → ∞ F(x) = π/2
werden wir im Abschnitt über mehrdimensionale Analysis bestimmen.

© Oliver Deiser Grundzüge der Höheren Mathematik


252 3. Abschnitt Ableitungen und Integrale

Übungen

Übung 1
Bestimmen Sie durch Partialbruchzerlegung:
−x + 2
(a) * x (x + 1)(x + 2)
dx

2x2 2x2 a bx + c
(b) * (x + 1) (x2 + 1)
dx ( Ansatz: 2
(x + 1) (x + 1)
=
x+1
+ 2
x +1
)
Übung 2
Bestimmen Sie durch Anwendung der Integrationsregeln:
log(x)
(a) * x
dx

(b) * x log(x) dx
(c) * log2(x) dx
(d) * £x log(x) dx
Übung 3
Bestimmen Sie durch Anwendung der Integrationsregeln:

(a) * x £1 − x2 dx
1
(b) * dx
£1 − x2
x
(c) * dx
£1 − x4

Übung 4
Seien a, b P R mit b > 0. Bestimmen Sie durch Anwendung der Integrati-
onsregeln:

1 − a ex
* 1 + b ex
dx

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 253

Lösungen zu den Übungen

Übung 1
Bestimmen Sie durch Partialbruchzerlegung:
−x + 2
(a) * x (x + 1)(x + 2)
dx

x2 + x + 4 x2 + x + 4 a bx+c
(b) * (x + 1) (x2 + 1)
dx ( Ansatz: (x + 1) (x2 + 1)
=
x+1
+ 2
x +1
)

Lösung zu Übung 1
zu (a):
Für alle a, b, c P R gilt:
a b c a(x + 1)(x + 2) + b x (x + 2) + c x (x + 1)
+ + = .
x x+1 x+2 x(x + 1)(x + 2)

Der Zähler auf der rechten Seite berechnet sich zu


(a + b + c)x2 + (3a + 2b + c)x + 2a
Ein Koeffizientenvergleich mit 0x2 − x + 2 liefert
a + b + c = 0, 3a + 2b + c = −1, 2a = 2.
Dieses Gleichungssystem in a, b, c hat die eindeutige Lösung
a = 1, b = −3, c = 2.
Es ergibt sich also die Partialbruchzerlegung
−x + 2 1 3 2
= − + .
x (x + 1)(x + 2) x x+1 x+2

Wir erhalten:

−x + 2 1 3 2
* x (x + 1)(x + 2)
dx = * x
dx − * x+1
dx + * x+2
dx

= log(|x|) − 3 log(|1 + x|) + 2 log(|x + 2|)

© Oliver Deiser Grundzüge der Höheren Mathematik


254 3. Abschnitt Ableitungen und Integrale

zu (b):
Für alle a, b, c P R gilt:
a bx + c a(x2 + 1) + (bx + c)(x + 1)
+ 2 = .
x+1 x +1 (x + 1) (x2 + 1)
Der Zähler auf der rechten Seite berechnet sich zu
(a + b)x2 + (b + c)x + a + c
Ein Koeffizientenvergleich mit x2 + x + 4 liefert
a + b = 1, b + c = 1, a + c = 4.
Dieses Gleichungssystem in a, b, c hat die eindeutige Lösung
a = 2, b = −1, c = 2.
Es ergibt sich also die Partialbruchzerlegung
x2 + x + 4 2 −x + 2
= +
(x + 1) (x2 + 1) x+1 x2 + 1

Damit erhalten wir:

x2 + x + 4 2 x−1
* (x + 1) (x2 + 1)
dx = * x+1
+ 2
x +1
dx

2 x 2
= * x+1
dx − * 1 + x2
dx + * 1 + x2
dx

2 1 2x 2
= * x+1
dx −
2
* 1 + x2
dx + * 1 + x2
dx

1
= 2 log(|1 + x|) − log(x2 + 1) + 2 arctan(x).
2

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 255

Übung 2
Bestimmen Sie durch Anwendung der Integrationsregeln:
log(x)
(a) * x
dx

(b) * x log(x) dx
(c) * log2(x) dx
(d) * £x log(x) dx

Lösung zu Übung 2
zu (a):
Nach der Substitutionsregel gilt:

log(x) d log2 (x)


* x
dx = * log(x) dx
log(x) dx =
2
Alternativ können wir partielle Integration verwenden:

log(x) d log(x)
* x
dx = * log(x) dx
log(x) dx = log2 (x) − * x
dx

Addition des Integrals auf beiden Seiten und Division durch 2 liefert
erneut log2 (x)/2 als Stammfunktion.

zu (b):
Wir verwenden partielle Integration:
d x2
* x log(x) dx = *( dx 2
) log(x) dx

x2 log(x) x2 1
=
2
− * 2 x
dx

x2 log(x) x
=
2
− * 2
dx

x2 log(x) x2
= −
2 4

x2 1
= ( log(x) − )
2 2

© Oliver Deiser Grundzüge der Höheren Mathematik


256 3. Abschnitt Ableitungen und Integrale

zu (c):
Wir verwenden partielle Integration sowie das bereits berechnete
unbestimmte Integral x (log(x) − 1) von log(x):

* log2(x) dx = * 1 log2(x) dx
1
= x log2 (x) − * 2 x log(x) x
dx

= x log2 (x) − 2 * log(x) dx

= x log2 (x) − 2 x (log(x) − 1)

zu (d):
Wir verwenden partielle Integration:
d 2 3/2
* £x log(x) dx = *( dx 3
x ) log(x) dx

2 3/2 2 3/2 1
=
3
x log(x) − * 3
x
x
dx

2 3/2 2
=
3
x log(x) −
3
* x1/2 dx
2 3/2 2 2 3/2
= x log(x) − x
3 3 3
2 3/2
= x ( 3 log(x) − 2 )
9

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 257

Übung 3
Bestimmen Sie durch Anwendung der Integrationsregeln:

(a) * x £1 − x2 dx
1
(b) * dx
£1 − x2
x
(c) * dx
£1 − x4

Lösung zu Übung 3
zu (a):
Wir verwenden die Substitution
t = 1 − x2 , dt = − 2xdx
Damit erhalten wir:
1
* x £1 − x2 dx = − * £t dt
2
1 2 3/2 1
= − t = − (1 − x2 )3/2 .
2 3 3

zu (b):
Wir wissen nach den Ableitungsregeln, dass
d 1
arcsin(x) =
dx £1 − x2
Ohne Kenntnis dieser Ableitung können wir die Substitution
x = sin(t), dx = cos t dt, t = arcsin(x) für x P ] −1, 1 [, t P ] −π/2, π/2 [
verwenden:
1 1
* dx = * cos(t) dt
£1 − x 2
£1 − sin2 (t)
cos(t)
= * |cos(t)|
dt

= * 1 dt = t = arcsin(x).

Dabei verwenden wir, dass cos(t) > 0 für alle t P ] −π/2, π/2 [, sodass wir
die Beträge nach dem Wurzelziehen weglassen können.

© Oliver Deiser Grundzüge der Höheren Mathematik


258 3. Abschnitt Ableitungen und Integrale

zu (c):
Wir verwenden die Substitution
t = x2 , dt = 2x dx
Damit erhalten wir unter Verwendung des Integrals in (b):
x 1 dt
* dx = *
£1 − x 4 2 £1 − t2
1 1
= arcsin(t) = arcsin(x2 ).
2 2

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Integrationsregeln 259

Übung 4
Seien a, b P R mit b > 0. Bestimmen Sie durch Anwendung der Integrati-
onsregeln:

1 − a ex
* 1 + b ex
dx

Lösung zu Übung 4
Wir verwenden die Substitutionen
dt
t = ex , dt = ex dx, dx = ,
t
du
u = 1 + b ex , du = b ex dx, ex dx =
b
Weiter benutzen wir die Partialbruchzerlegung

1 1 b
= − .
t (1 + b t) t 1 + bt

Damit erhalten wir:

1 − a ex 1 1
* 1 + b ex
dx = * 1 + bex
dx − a *
1 + b ex
ex dx

1 a 1
= * t (1 + bt)
dt −
b
* u
du

1 b a 1
= * t
dt − * 1 + bt
dt −
b
* u
du

a
= log(t) − log(1 + bt) − log(u)
b

a
= log(ex ) − log(1 + b ex ) − log(1 + b ex )
b

a
= x − log(1 + b ex ) ( 1 + )
b

a+b
= x − log(1 + b ex )
b

© Oliver Deiser Grundzüge der Höheren Mathematik


4. Abschnitt

Vektoren

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Reelle und komplexe Vektoren

Wir betrachten in diesem Kapitel reelle und komplexe Vektoren einer beliebigen
natürlichen Dimension n ≥ 1. Ein reeller Vektor der Dimension n ist ein Tupel
der Form
v = (v1 , v2 , …, vn )
mit reellen Zahlen v1 , …, vn (den Komponenten des Vektors v). All diese Vek-
toren zusammengenommen bilden den reellen Vektorraum Rn . Formal ist ein
reeller Vektor also einfach eine Liste reeller Zahlen einer bestimmten Länge.
In den wichtigen Fällen n = 2 (Ebene R2 = R × R) und n = 3 (dreidimensionaler
Raum R3 = R × R × R) können wir uns reelle Vektoren als Punkte oder Pfeile
vorstellen und sie in dieser Weise anschaulich darstellen. Die Pfeildarstellung
entspricht der physikalischen Vorstellung eines Vektors als einer gerichteten
Größe, die durch eine Länge und eine Richtung bestimmt ist. Unabhängig von
einer geometrischen Vorstellung können wir mit Vektoren einer beliebigen Di-
mension rechnen. Wir können sie addieren, subtrahieren und in skalarer Form
multiplizieren. Lassen wir allgemeiner komplexe Komponenten zu, so gelan-
gen wir zu den komplexen Vektorräumen Cn .

Schlüsselbegriffe
Vektor, Komponente, Dimension
Vektoren als Pfeile in der Ebene und im Raum
Vektoraddition, Inverses, Vektorsubtraktion
Skalarmultiplikation
komplexe Vektoren

© Oliver Deiser Grundzüge der Höheren Mathematik


264 4. Abschnitt Vektoren

Vektoren im Rn

Definition (die Vektorräume Rn , n-dimensionaler reeller Vektor)


Sei n ≥ 1. Dann setzen wir
Rn = { (v1 , …, vn ) | v1 , …, vn P R } [ gelesen R hoch n ].
Die Elemente des Rn heißen n-dimensionale reelle Vektoren oder reelle
Vektoren der Länge oder Dimension n. Ist v = (v1 , …, vn ) P Rn , so heißen die
reellen Zahlen v1 , …, vn die Komponenten oder Einträge des Vektors v.

Beispiele
(1) (0, 1), (4, −1), (8, 8) sind Vektoren des Vektorraums R2 .
(2) (1, 2, 3), (−1, 0, 0), (1, 1, 1) sind Vektoren des Vektorraums R3 .
(3) Sei v = (2, 0, 1, 5). Der Vektor v hat die Dimension 4. Seine dritte
Komponente ist 1.

Anschauliche Interpretation
Für die Dimensionen n = 2 und n = 3 können wir Vektoren sowohl durch
Punkte als auch durch Pfeile darstellen. Die Darstellung als Pfeil kommt
der Vorstellung eines Vektors als „gerichteter Größe“ besonders entgegen.
Der Vektor v wird dargestellt durch einen Pfeil, der vom Ursprung zum
Punkt v führt. Weiter nennen wir jeden Pfeil der Ebene oder des Raumes,
der aus diesem Pfeil durch eine Parallelverschiebung hervorgeht, einen
Repräsentanten des Vektors v. Oft ist es nützlich, zwischen Vektoren und
ihren Repräsentanten nicht zu unterscheiden. Ist v = (1, 2) , so können wir
in einem Diagramm zum Beispiel auch den Pfeil von (2, 1) nach (3, 3) mit v
bezeichnen. Analoges gilt für den Pfeil von (−1, −1) nach (0, 1) und
allgemein für den Pfeil von einem Punkt (x, y) zum Punkt (x + 1, y + 2).

Bemerkungen
(1) Wir notieren Vektoren ohne Pfeile oder Striche.
(2) Bevorzugt verwenden wir die Zeichen v, w, u für Vektoren. Ist v ein
Vektor, so ist v1 seine erste Komponente, v2 seine zweite usw. Damit
gilt für eine gegebene Dimension n zum Beispiel
v = (v1 , …, vn ), w = (w1 , …, wn ), u = (u1 , …, un ).
(3) Vektoren der Ebene R2 und des Raumes R3 notieren wir auch in der Form
v = (x, y) bzw. v = (x, y, z).
Wir können aber immer auch v = (v1 , v2 ) bzw. v = (v1 , v2 , v3 ) schreiben.
(4) Den Raum R1 identifizieren wir mit R, sodass zum Beispiel (4) = 4.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Reelle und komplexe Vektoren 265

Spezielle Vektoren

Wir betrachten einige besonders ausgezeichnete Vektoren. Wir beginnen mit:

Definition (Nullvektor)
Sei n ≥ 1. Der Vektor 0 = (0, …, 0) P Rn heißt der Nullvektor oder
Nullpunkt des Rn .

Zur Verdeutlichung können wir auch 0 für den Nullvektor schreiben, um den
Vektor von der reellen Zahl 0 zu unterscheiden. In der Regel ist aber aus dem
Kontext heraus klar, ob wir mit der 0 einen Vektor oder eine Zahl bezeichnen.
Eine wichtige Rolle spielen:

Definition (kanonische Einheitsvektoren)


Sei n ≥ 1. Die Vektoren
e1 = (1, 0, …, 0), e2 = (0, 1, 0, …, 0), …, en = (0, …, 0, 1)
heißen die kanonischen Einheitsvektoren oder die kanonischen Basisvektoren
des Rn .

Die kanonischen Basisvektoren haben also genau eine 1-Komponente und an-
sonsten nur Nulleinträge.

Anschauliche Interpretation
Für die Dimensionen n = 2 und n = 3 ist der Nullvektor anschaulich der
Koordinatenursprung der Ebene R2 bzw. des Raumes R3 . Dieser Vektor hat
im Gegensatz zu allen anderen Vektoren keine anschauliche Richtung und
wir zeichnen ihn als Punkt und nicht als Pfeil. Die Einheitsvektoren liegen
auf den Koordinatenachsen und zeigen jeweils zur Markierung 1 auf diesen
Achsen. Alle Abschnitte des ganzzahligen Koordinatengitters sind
Repräsentanten der Einheitsvektoren.

© Oliver Deiser Grundzüge der Höheren Mathematik


266 4. Abschnitt Vektoren

Die Vektoraddition

Vektoren lassen sich in natürlicher Weise addieren und subtrahieren:

Definition (Vektoraddition, additives Inverses, Vektorsubtraktion)


Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :
v + w = (v1 + w1 , …, vn + wn ) (Vektoraddition)
−v = (− v1 , …, − vn ) (Inversenbildung)
v − w = v + (−w) = (v1 − w1 , …, vn − wn ) (Vektorsubtraktion)

Beispiele
(1, 2, 3) + (1, 2, −1) = (2, 4, 2)
(1, 2, 3) − (1, 2, −1) = (0, 0, 4)
e1 + e2 + e3 = (1, 0, 0) + (0, 1, 0) + (0, 0, 1) = (1, 1, 1)

Anschauliche Interpretation
In den Dimensionen n = 2 und n = 3 entspricht die Vektoraddition dem
Aneinanderfügen zweier Pfeile. Das Inverse −v erhalten wir durch
Spiegelung von v am Nullpunkt. Weiter wird der Vektor v − w repräsentiert
durch einen Pfeil von der Spitze von w zur Spitze von v.

Durch Nachrechnen zeigen wir:

Satz (Eigenschaften der Vektoraddition)


Sei n ≥ 1. Dann gilt für alle v, w, u P Rn :
v + (w + u) = (v + w) + u (Assoziativität)
v + 0 = 0 + v = v (Neutralität des Nullvektors)
v + (− v) = (− v) + v = 0 (additive Inverse)
v + w = w + v (Kommutativität)

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Reelle und komplexe Vektoren 267

Die Skalarmultiplikation

Reelle Vektoren lassen sich mit einer reellen Zahl multiplizieren:

Definition (Skalarmultiplikation)
Sei n ≥ 1. Dann setzen wir für alle λ P R und alle v P Rn :
λ v = (λ v1 , …, λ vn ) [ gelesen: λ mal v, Skalarprodukt λ mal v ].
Wir nennen λ v die Multiplikation des Vektors v mit dem Skalar λ.

Wir verwenden bevorzugt griechische Buchstaben für Skalare.

Beispiele
(1) 2 (1, 2, 1) = (2, 4, 2)
(2) (−1) (4, −1, 2, 0, 0) = (−4, 1, −2, 0, 0)
(3) Für alle λ P R gilt λ0 = 0 (mit dem Nullvektor 0).
(4) Sei n ≥ 1, λ P R und i P { 1, …, n }. Dann gilt für den Einheitsvektor ei :
λ ei = λ (0, …, 0, 1, 0, …, 0) = (0, …, 0, λ, 0, …, 0).
Dabei stehen 1 und λ an der Stelle i.
(5) Für alle n ≥ 1 und v P Rn gilt
v = (v1 , …, vn )
= (v1 , 0, …, 0) + (0, v2 , 0, …, 0) + … + (0, …, 0, vn )
= v1 (1, 0, …, 0) + v2 (0, 1, 0, …, 0) + … + vn (0, …, 0, 1)
= v1 e1 + v2 e2 + … + vn en .

Die Darstellung
v = v1 e1 + v2 e2 + … + vn en .
eines Vektors v als Linearkombination der kanonischen Einheitsvektoren wird
häufig gebraucht. Die Skalare der Einheitsvektoren sind die Komponenten des
Vektors.

Anschauliche Interpretation
In den Dimensionen n = 2 und n = 3 bewirkt eine Skalierung mit λ > 1
anschaulich eine Streckung und eine Skalierung mit 0 < λ < 1 eine
Stauchung des Vektors v. Bei einem negativen Skalar erfolgt zusätzlich eine
Spiegelung am Nullpunkt.

© Oliver Deiser Grundzüge der Höheren Mathematik


268 4. Abschnitt Vektoren

Aus der Definition folgt leicht:

Satz (Eigenschaften der Skalarmultiplikation)


Sei n ≥ 1. Dann gilt für alle λ, µ P R und alle v, w P Rn :
(a) 1 v = v
(b) λ (µ v) = (λ µ) v
(c) λ (v + w) = λ v + λ w
(d) (λ + µ) v = λ v + µ v

Komplexe Vektoren

Analog zu den reellen Vektoren können wir komplexe Vektoren definieren.


Die Komponenten dieser Vektoren sind nun komplexe Zahlen. Ansonsten blei-
ben die Definitionen und Begriffsbildungen gleich. Wir geben sie im Überblick
noch einmal an:

Cn = { (v1 , …, vn ) | v1 , …, vn P C } (komplexe Vektoren der Dimension n)


v + w = (v1 + w1 , …, vn + wn ) (Vektoraddition)
−v = (− v1 , …, − vn ) (Inversenbildung)
v − w = v + (−w) = (v1 − w1 , …, vn − wn ) (Vektorsubtraktion)
λ v = (λ v1 , …, λ vn ) (mit λ P C) (Skalarmultiplikation)

Es gelten alle der oben betrachteten Eigenschaften.

Beispiele
(1) (i, i) + (1, i) = (1 + i, 2i)

(2) − (1, i) = (−1, − i),

(3) 3(1, i, 1 + i) = (3, 3i, 3 + 3i)

(4) i (i, 1 + i) = (i2 , i + i2 ) = (−1, −1 + i)

Nehmen wir wie üblich R ⊆ C an, so gilt Rn ⊆ Cn für alle n ≥ 1. Damit sind die
komplexen Vektoren einer Dimension n also eine Obermenge der reellen Vekto-
ren dieser Dimension.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Reelle und komplexe Vektoren 269

Übungen

Übung 1
Berechnen Sie:
(a) die Vektoraddition (1, 2, 3) + (4, 5, 6) im R3
(b) das additiv Inverse von (1, −1, 1, −1) im R4
(c) die Skalarmultiplikation (1 + i) (1 + i, 1 − 2i, i, 0, 1) im C5

Übung 2
Sei n ≥ 1. Zeigen Sie, dass für alle v, w, u P Rn gilt:
(a) v + (w + u) = (v + w) + u (Assoziativität)
(b) v + 0 = 0 + v = v (Neutralität des Nullvektors)
(c) v + (− v) = (− v) + v = 0 (additive Inverse)
(d) v + w = w + v (Kommutativität)

Übung 3
Wir betrachten die Dimension n = 2 (Euklidische Ebene). Illustrieren Sie
für diese Dimension
(a) die Vektoraddition
(b) die Vektorsubtraktion
(c) die Skalarmultiplikation
durch je eine beschriftete Skizze.

Übung 4
Erläutern Sie die Eigenschaften
(a) 1 v = v
(b) λ (µ v) = (λ µ) v
(c) λ (v + w) = λ v + λ w
(d) (λ + µ) v = λ v + µ v
des Skalarprodukts für den Vektorraum R3 durch je ein instruktives
konkretes Beispiel.

© Oliver Deiser Grundzüge der Höheren Mathematik


270 4. Abschnitt Vektoren

Lösungen zu den Übungen

Übung 1
Berechnen Sie:
(a) die Vektoraddition (1, 2, 3) + (4, 5, 6) im R3
(b) das additiv Inverse von (1, −1, 1, −1) im R4
(c) die Skalarmultiplikation (1 + i) (1 + i, 1 − 2i, i, 0, 1) im C5

Lösung zu Übung 1
zu (a):
Es gilt

(1, 2, 3) + (4, 5, 6) = (1 + 4, 2 + 5, 3 + 6) = (5, 7, 9).

zu (b):
Das additiv Inverse von (1, −1, 1, −1) ist −(1, −1, 1, −1). Es gilt

−(1, −1, 1, −1) = (−1, − (−1), −1, − (−1)) = (−1, 1, −1, 1).

zu (c):
Es gilt

(1 + i) (1 + i, 1 − 2i, i, 0, 1)

= ((1 + i)2 , (1 + i) (1 − 2i), (1 + i) i, (1 + i) 0, (1 + i) 1)

= (1 + 2i + i2 , 1 − 2i + i − 2i2 , i + i2 , 0, 1 + i)

= (1 + 2i − 1, 1 − i + 2, i − 1, 0, 1 + i)

= (2i, 3 − i, −1 + i, 0, 1 + i).

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Reelle und komplexe Vektoren 271

Übung 2
Sei n ≥ 1. Zeigen Sie, dass für alle v, w, u P Rn gilt:
(a) v + (w + u) = (v + w) + u (Assoziativität)
(b) v + 0 = 0 + v = v (Neutralität des Nullvektors)
(c) v + (− v) = (− v) + v = 0 (additive Inverse)
(d) v + w = w + v (Kommutativität)

Lösung zu Übung 2
Seien v, w, u P Rn beliebig.

zu (a): Es gilt

v + (w + u) = (v1 , …, vn ) + ((w1 , …, wn ) + (u1 , …, un ))

= (v1 , …, vn ) + (w1 + u1 , …, wn + un )

= (v1 + w1 + u1 , …, vn + wn + un )

= (v1 + w1 , …, vn + wn ) + (u1 , …, un )

= (v + w) + u.

zu (b): Es gilt
v + 0 = (v1 , …, vn ) + (0, …, 0)

= (v1 + 0, …, vn + 0) = (v1 , …, vn ) = v.

Analog gilt 0 + v = v.

zu (c): Es gilt

v + (−v) = (v1 , …, vn ) + (−v1 , …, −vn )

= (v1 − v1 , …, vn − vn ) = (0, …, 0) = 0.

(−v) + v = (− v1 , …, − vn ) + (v1 , …, vn )

= (− v1 + v1 , …, − vn + vn ) = (0, …, 0) = 0.

zu (d): Es gilt

v + w = (v1 , …, vn ) + (w1 , …, wn )

= (v1 + w1 , …, vn + wn )

= (w1 + v1 , …, wn + vn )

= w + v.

© Oliver Deiser Grundzüge der Höheren Mathematik


272 4. Abschnitt Vektoren

Übung 3
Wir betrachten die Dimension n = 2 (Euklidische Ebene). Illustrieren Sie
für diese Dimension
(a) die Vektoraddition
(b) die Vektorsubtraktion
(c) die Skalarmultiplikation
durch je eine beschriftete Skizze.

Lösung zu Übung 3

v+w

Die Summe v + w zweier Vektoren v und w. Der Vektor v + w bildet


eine Diagonale des von v und w aufgespannten Parallelogramms.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Reelle und komplexe Vektoren 273

v+w

v-w

-w

Die Differenz v − w zweier Vektoren v und w. Es gilt v − w = v + (−w).


Der Differenzvektor zeigt von der Spitze von w zur Spitze von v. Er bildet wie
v + w eine Diagonale des von v und w aufgespannten Parallelogramms.

Zwei Skalierungen eines Vektors v. Es gilt λ > 1 und −1 < µ < 0.

© Oliver Deiser Grundzüge der Höheren Mathematik


274 4. Abschnitt Vektoren

Übung 4
Erläutern Sie die Eigenschaften
(a) 1 v = v
(b) λ (µ v) = (λ µ) v
(c) λ (v + w) = λ v + λ w
(d) (λ + µ) v = λ v + µ v
des Skalarprodukts für den Vektorraum R3 durch je ein instruktives
konkretes Beispiel.

Lösung zu Übung 4
zu (a):
Sei v = (1, −2, 4). Dann gilt

1 v = 1 (1, −2, 4) = (1 ⋅ 1, 1 ⋅ (−2), 1 ⋅ 4) = (1, −2, 4) = v.

zu (b):
Seien v = (1, 0, − 2), λ = 2, µ = −1. Dann gilt

λ (µ v) = 2 ((−1) v) = 2 ((−1) (1, 0, −2)) = 2 (−1, 0, 2) = (−2, 0, 4),

(λµ) v) = (2 ⋅ (−1)) v) = (−2) v = (−2) (1, 0, −2) = (−2, 0, 4).

Beide Vektoren stimmen überein.

zu (c):
Seien λ = 2, v = (1, 0, 2), w = (1, −1, 0). Dann gilt

λ (v + w) = 2 ((1, 0, 2) + (1, −1, 0)) = 2 (2, −1, 2) = (4, −2, 4),

λ v + λ w = 2 (1, 0, 2) + 2 (1, −1, 0) = (2, 0, 4) + (2, −2, 0) = (4, −2, 4).

Beide Vektoren stimmen überein.

zu (d):
Seien λ = 2, µ = −3, v = (1, 0, −3). Dann gilt

(λ + µ) v = (2 + (−3)) (1, 0, −3) = (−1) (1, 0, −3) = (−1, 0, 3),

λv + µv = 2 (1, 0, −3) + (−3) (1, 0, −3)

= (2, 0, −6) + (−3, 0, 9) = (−1, 0, 3).

Beide Vektoren stimmen überein.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt

Wir setzen unsere Untersuchung von reellen und komplexen Vektoren fort, wo-
bei der Schwerpunkt wieder bei den reellen Vektoren liegt. Der Satz des Pytha-
goras motiviert die allgemeine Definition der Länge oder Norm eines Vektors
im Rn . Weiter führen wir das Euklidische Skalarprodukt in algebraischer Form
ein. Mit der Ungleichung von Cauchy-Schwarz lernen wir eine der wichtigsten
Ungleichungen der Mathematik kennen.

Schlüsselbegriffe
Euklidische Norm (Länge)
Dreiecksungleichung
Abstand
Euklidisches Skalarprodukt
Binomische Formeln
Ungleichung von Cauchy-Schwarz
Norm, Abstand und Skalarprodukt im Komplexen

© Oliver Deiser Grundzüge der Höheren Mathematik


276 4. Abschnitt Vektoren

Die Euklidische Norm

Der Satz des Pythagoras motiviert:

Definition (Euklidische Norm bzw. Länge, Normierung)


Sei n ≥ 1. Dann setzen wir für alle v P Rn :
i v i = £v1 2 + … + vn 2 .
Die reelle Zahl i v i [ gelesen: Norm von n ] heißt die Euklidische Norm oder
Länge des Vektors v. Ein Vektor v heißt normiert, falls i v i = 1.

Der Doppelstrich wird verwendet, um die Norm eines Vektors vom Betrag ei-
ner Zahl zu unterscheiden.

Wichtig
In jeder Dimension n ≥ 1 wird die Quadratwurzel und nicht etwa die n-te
Wurzel verwendet. Für n = 1 gilt i v i = £v2 = |v|.

Zur Illustration betrachten wir einen Einheitswürfel im R3 mit den gegen-


überliegenden Ecken 0 = (0, 0, 0) und (1, 1, 1). Nach dem Satz des Pythagoras be-
rechnet sich die Länge der Strecke von (0, 0, 0) nach (1, 1, 0) in der x-y-Ebene zu
£12 + 12 = £2.
Erneut nach Pythagoras hat die Strecke von (0, 0, 0) nach (1, 1, 1) die Länge
££2 2 + 12 = £2 + 1 = £3.
Hier wird überall die Quadratwurzel verwendet, nicht die dritte Wurzel.

Beispiele
(1) i (3, 4) i = £9 + 16 = £25 = 5
(2) i (1, 1, 1) i = £1 + 1 + 1 = £3 (vgl. obige Berechnung)
(3) i (0, 0, 1, 0, 0) i = £0 + 0 + 1 + 0 + 0 = £1 = 1
(4) (cos α, sin α) P R2 ist normiert für alle α P R. Denn für alle α P R ist
(cos α, sin α) ein Punkt auf dem Einheitskreis, sodass cos2 α + sin2 α = 1.

Die folgenden Eigenschaften sind leicht nachzuweisen:

Satz (Eigenschaften der Euklidischen Norm)


Sei n ≥ 1. Dann gilt für alle λ P R und alle v P Rn :
(a) i v i = 0 genau dann, wenn v = 0
(b) i λ v i = |λ| i v i

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 277

Die Dreiecksungleichung

Nicht mehr so leicht zu zeigen ist:

Satz (Dreiecksungleichung)
Sei n ≥ 1. Dann gilt für alle v, w P Rn :

iv + wi ≤ ivi + iwi (Dreiecksungleichung)

Anschauliche Interpretation
In den Dimensionen n = 2 und n = 3 ist die Ungleichung einleuchtend, da
die kürzeste Verbindung zwischen zwei Punkten eine Gerade ist.

Beweis
Wir zeigen zunächst die folgende Hilfsaussage:
(+) 2 x y ≤ x2 + y2 für alle x, y P R.
Beweis von (+)
Seien x, y P R beliebig. Dann gilt 0 ≤ (x − y)2 = x2 − 2xy + y2 . Durch
Addition von −2xy auf beiden Seiten ergibt sich die Behauptung.
Seien nun v, w P Rn beliebig. Dann ergibt eine n-fache Anwendung von (+):

(
2 v1 w1 + … + vn wn ) = 2 v1 w1 + … + 2 vn wn

≤ v1 2 + w1 2 + … + vn 2 + wn 2 = i v i 2 + i w i 2 .

Die Dreiecksungleichung ist klar für v = 0 oder w = 0. Wir nehmen also an,
dass v, w ≠ 0. Wir setzen v̂ = i v i −1 v, ŵ = i w i −1 w. Dann sind v̂ und ŵ
normiert. Nach dem bereits Gezeigten gilt
(
2 v̂1 ŵ1 + … + v̂n ŵn ) ≤ i v̂ i 2 + i ŵ i 2 = 1 + 1 = 2.

Eine Division durch 2 und die Multiplikation mit i v i i w i liefert:

(♦) v1 w1 + … + vn wn ≤ i v i i w i.

Damit erhalten wir nun:

iv + wi 2 = i (v1 + w1 , …, vn + wn ) i 2

= (v1 + w1 )2 + … + (vn + wn )2

(
= i v i 2 + i w i 2 + 2 v1 w1 + … + vn wn )
≤ ivi2 + iwi2 + 2 ivi iwi = ( i v i + i w i ) 2.
Durch Wurzelziehen erhalten wir die Dreiecksungleichung.

© Oliver Deiser Grundzüge der Höheren Mathematik


278 4. Abschnitt Vektoren

Der Euklidische Abstand

Mit Hilfe der Norm können wir den Abstand zweier Punkte einführen:

Definition (Abstand)
Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :
d(v, w) = i v − w i
Die reelle Zahl d(v, w) heißt der Euklidische Abstand von v und w.

Nach Definition gilt für alle n ≥ 1 und alle v, w P Rn :

d(v, 0) = i v i

d(v, w) = £(v1 − w1 )2 + … + (vn − wn )2

Weiter gilt:

Satz (Eigenschaften des Abstands)


Sei n ≥ 1. Dann gilt für alle v, w, u P Rn :
(a) d(v, w) = 0 genau dann, wenn v = w
(b) d(v, w) = d(w, v) (Symmetrie)
(c) d(v, u) ≤ d(v, w) + d(w, u) (Dreiecksungleichung)

Beweis
Seien v, w, u P Rn beliebig.
zu (a): Es gilt die folgende Äquivalenzenkette:
d(v, w) = 0 genau dann, wenn i v − w i = 0
genau dann, wenn v − w = 0 genau dann, wenn v = w.
zu (b): Es gilt
d(v, w) = i v − w i = i w − v i = d(w, v).
zu (c): Nach der Dreiecksungleichung für die Norm gilt
d(v, u) = i v − u i
= iv + 0 − ui
= i(v − w) + (w − u) i
≤ i v − w i + i w − u i = d(v, w) + d(w, u).

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 279

Das Euklidische Skalarprodukt

Definition (Euklidisches Skalarprodukt)


Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :

〈v, w〉 = v1 w1 + … + vn wn .

Die reelle Zahl 〈v, w〉 heißt das Euklidische Skalarprodukt oder auch das
kanonische Skalarprodukt der Vektoren v und w.

Neben 〈v, w〉 sind auch die Notationen v • w (Malpunkt-Notation) und 〈v | w〉


(Dirac-Notation) üblich. Wir verwenden bevorzugt 〈v, w〉.

Warnung
Das Skalarprodukt ordnet zwei Vektoren eine reelle Zahl (einen Skalar) zu.
Das Ergebnis der Operation ist immer ein Skalar.

Beispiele
〈(1, −1, 0), (3, 2, 1)〉 = 1 ⋅ 3 + (−1) ⋅ 2 + 0 ⋅ 1 = 3 − 2 + 0 = 1
〈(1, −1, 0), (0, 0, 0, 0)〉 = 1 ⋅ 0 + (−1) ⋅ 0 + 0 ⋅ 0 = 0

Satz (Skalarprodukt und Norm)


Für alle v P Rn gilt:
i v i 2 = 〈v, v〉.

Beweis
Sei v P Rn . Dann gilt i v i 2 = v1 2 + … + vn 2 = 〈v, v〉.

Nützliche und einfach zu zeigende Rechenregeln sind:

Satz (Eigenschaften des Euklidischen Skalarprodukts)


Sei n ≥ 1. Dann gilt für alle λ P R und alle v, w, v′, w′ P Rn :
(i) 〈v + λ v′, w〉 = 〈v, w〉 + λ 〈v′, w〉
〈v, w + λ w′〉 = 〈v, w〉 + λ 〈v, w′〉 (Bilinearität)
(ii) 〈v, w〉 = 〈w, v〉 (Symmetrie)
(iii) 〈v, v〉 > 0 für alle v ≠ 0 (positive Definitheit)

Diese Regeln zeigen, dass das Skalarprodukt in der Tat die Eigenschaften eines
Produkts besitzt. In der Malpunkt-Notation lautet die erste Eigenschaft
(v + λ v′) • w = v • w + λ(v′ • w), v • (w + λ w′) = v • w + λ(v • w′)

© Oliver Deiser Grundzüge der Höheren Mathematik


280 4. Abschnitt Vektoren

Die Binomischen Formeln

Satz (Binomische Formeln)


Sei n ≥ 1. Dann gilt für alle v, w P Rn :

(1) i v + w i 2 = i v i 2 + i w i 2 + 2 〈v, w〉

(2) i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉

(3) 〈v + w , v − w〉 = i v i 2 − i w i 2

Beweis
Seien v, w P Rn . Dann gilt:

iv + wi 2 = 〈v + w, v + w〉

= 〈v, v + w〉 + 〈w, v + w〉

= 〈v, v〉 + 〈v, w〉 + 〈w, v〉 + 〈w, w〉

= 〈v, v〉 + 〈v, w〉 + 〈v, w〉 + 〈w, w〉

= 〈v, v〉 + 2 〈v, w〉 + 〈w, w〉

= i v i 2 + i w i 2 + 2 〈v, w〉.

Die anderen Formeln werden analog bewiesen.

Analogie zu den reellen Binomischen Formeln


In der Malpunkt-Notation können wir die Formeln wegen i v i 2 = v • v so
notieren:

(v + w) • (v + w) = v • v + 2(v • w) + w • w.

(v − w) • (v − w) = v • v − 2(v • w) + w • w.

(v + w) • (v − w) = v • v − w • w.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 281

Die Ungleichung von Cauchy-Schwarz

Zwischen dem Skalarprodukt und der Norm besteht folgende sehr wichtige
Ungleichung:

Satz (Ungleichung von Cauchy-Schwarz)


Sei n ≥ 1. Dann gilt für alle v, w P Rn :

|〈v, w〉| ≤ i v i i w i.

Beweis
Seien v, w P Rn . Wir wissen schon (vgl. den Beweis der Dreiecksunglei-
chung oben), dass
(♦) 〈v, w〉 = v1 w1 + … + vn wn ≤ i v i i w i.
Dies zeigt die Ungleichung im Fall 〈v, w〉 ≥ 0. Ist 〈v, w〉 < 0, so gilt
〈−v, w〉 = − 〈v, w〉 > 0
und nach dem bereits Gezeigten gilt

|〈v, w〉| = 〈−v, w〉 ≤ i −v i i w i = i v i i w i.

Eine anschauliche Interpretation des Skalarprodukts für die Dimensionen


n = 2 und n = 3 diskutieren wir im nächsten Kapitel. Dadurch wird auch die Un-
gleichung von Cauchy-Schwarz einleuchtend.

© Oliver Deiser Grundzüge der Höheren Mathematik


282 4. Abschnitt Vektoren

Norm und Skalarprodukt im Komplexen

Sei n ≥ 1. Wir können die für den Rn eingeführten Begriffe wieder auf den
komplexen Vektorraum Cn erweitern. Die Norm oder Länge sowie den Abstand
definieren wir für alle v, w P Cn durch

i v i = £|v1 |2 + … + |vn |2 (Norm von v)

d(v, w) = i v − w i (Abstand von v und w)

Warnung
Die Beträge in der Definition der Norm sind wesentlich. Für alle komple-
xen Zahlen z ist |z| eine nichtnegative reelle Zahl, während z2 im
Allgemeinen einen von Null verschiedenen Imaginärteil besitzt.

Die Norm eines komplexen Vektors ist immer reellwertig. Die Wurzel wird
auf eine reelle Zahl angewendet (die Summe der Quadrate der Längen der Kom-
ponenten des Vektors). Für eine reelle Zahl x gilt x2 = |x|2 , sodass wir bei der
reellen Norm auf die Beträge verzichten können.
Für die komplexe Norm gilt erneut die Dreiecksungleichung
iv + wi ≤ ivi + iwi für alle v, w P Cn .

Konjugation beim komplexen Skalarprodukt

Sei wieder n ≥ 1. Für das komplexe Skalarprodukt im Cn streben wir erneut die
Eigenschaft
i v i = 〈v, v〉 für alle v P Cn
an. Um dies zu erreichen, setzen wir die komplexe Konjugation ein, die wir durch
z = Re(z) − i Im(z) für alle z P C
definiert hatten. Für alle v, w P Cn setzen wir:
〈v, w〉 = v1 w1 + … + vn wn .
Die komplexe Zahl 〈v, w〉 heißt das kanonische Skalarprodukt der Vektoren v und
w. Für alle v P Cn gilt wie gewünscht
〈v, v〉 = v1 v1 + … + vn vn = |v1 |2 + … + |vn |2 = i v i 2 .
Da x = x für alle reellen Zahlen x gilt, setzt das komplexe Skalarprodukt das reelle
Skalarprodukt fort. Es gilt erneut die Ungleichung von Cauchy-Schwarz, d. h.

|〈v, w〉| ≤ i v i i w i für alle v, w P Cn .

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 283

Übungen

Übung 1
Berechnen Sie
(a) die Norm i (1, −1, 1, −1, 1) i im R5
(b) das Skalarprodukt 〈(1, 2, 1, 0), (−1, 3, −4, 8) 〉 im R4
(c) den Abstand d((2 + i, i), (i, 1 − i)) im C2
(d) das Skalarprodukt 〈(1, 1 + i), (1 − i, 1 + i) 〉 im C2

Übung 2
Illustrieren Sie die Dreiecksungleichung für die Dimension n = 2 durch
eine beschriftete Skizze.

Übung 3
Sei n ≥ 1. Zeigen Sie, dass für alle Vektoren v, w des Rn gilt:

(a) i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉

(b) 〈v + w, v − w〉 = i v i 2 − i w i 2

(c) 4 〈v, w〉 = i v + w i 2 − i v − w i 2

Übung 4
Erläutern Sie die Ungleichung von Cauchy-Schwarz durch konkrete
Beispiele für die Dimension n = 2. Dabei soll deutlich werden, dass sowohl
der Fall „<“ mit geringer bzw. großer Abweichung als auch der Fall „=“ in
der Ungleichung auftreten kann.

© Oliver Deiser Grundzüge der Höheren Mathematik


284 4. Abschnitt Vektoren

Lösungen zu den Übungen

Übung 1
Berechnen Sie
(a) die Norm i (1, −1, 1, −1, 1) i im R5
(b) das Skalarprodukt 〈(1, 2, 1, 0), (−1, 3, −4, 8) 〉 im R4
(c) den Abstand d((2 + i, i), (i, 1 − i)) im C2
(d) das Skalarprodukt 〈(1, 1 + i), (1 − i, 1 + i) 〉 im C2

Lösung zu Übung 1
zu (a): Es gilt

i (1, −1, 1, −1, 1) i 2 = 12 + (−1)2 + 12 + −12 + 12 = 5

Damit ist die Norm des Vektors gleich £5.


Bemerkung: Oft ist es günstig, zunächst das Quadrat einer Norm zu
berechnen, um Wurzeln zu vermeiden. Dadurch wird die Berechnung
übersichtlicher. Gleiches gilt für die Berechnung von Abständen.
zu (b): Es gilt

〈(1, 2, 1, 0), (−1, 3, −4, 8) 〉 = −1 + 6 − 4 + 0 = 1.

zu (c): Es gilt
d((2 + i, i), (i, 1 − i)) 2 = |2 + i − i|2 + |i − (1 − i)|2
= 4 + |2i − 1|2
= 4 + 4 + 1 = 9.
Damit ist der Abstand gleich 3.

zu (d): Es gilt
〈(1, 1 + i), (1 − i, 1 + i) 〉 = (1 − i) + (1 + i)2

= 1 − i + 1 + 2i + i2

= 1 − i + 1 + 2i − 1

= 1 + i.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 285

Übung 2
Illustrieren Sie die Dreiecksungleichung für die Dimension n = 2 durch
eine beschriftete Skizze.

Lösung zu Übung 2

v+w

w
v+w

w
v

Zur Dreiecksungleichung
ivi + iwi ≥ iv + wi
Die Summe der Längen von v und w ist größergleich der Länge von v + w

© Oliver Deiser Grundzüge der Höheren Mathematik


286 4. Abschnitt Vektoren

Übung 3
Sei n ≥ 1. Zeigen Sie, dass für alle Vektoren v, w des Rn gilt:

(a) i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉

(b) 〈v + w, v − w〉 = i v i 2 − i w i 2

(c) 4 〈v, w〉 = i v + w i 2 − i v − w i 2

Lösung zu Übung 3
Seien v, w P Rn beliebig.
zu (a): Es gilt

iv − wi 2 = 〈v − w, v − w〉

= 〈v, v − w〉 + 〈−w, v − w〉

= 〈v, v〉 + 〈v, −w〉 + 〈−w, v〉 + 〈−w, −w〉

= 〈v, v〉 − 〈v, w〉 − 〈v, w〉 + 〈w, w〉

= 〈v, v〉 − 2 〈v, w〉 + 〈w, w〉

= i v i 2 + i w i 2 − 2 〈v, w〉

zu (b): Es gilt

〈v + w, v − w〉 = 〈v, v − w〉 + 〈w, v − w〉

= 〈v, v〉 + 〈v, − w〉 + 〈w, v〉 + 〈w, − w〉

= 〈v, v〉 − 〈v, w〉 + 〈v, w〉 − 〈w, w〉

= 〈v, v〉 − 〈w, w〉

= ivi2 − iwi2

zu (c): Es gilt

i v + w i 2 = 〈v, v〉 + 〈w, w〉 + 2〈v, w〉

i v − w i 2 = 〈v, v〉 + 〈w, w〉 − 2〈v, w〉

Damit ist

i v + w i 2 − i v − w i 2 = 4 〈v, w〉

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Norm und Skalarprodukt 287

Übung 4
Erläutern Sie die Ungleichung von Cauchy-Schwarz durch konkrete
Beispiele für die Dimension n = 2. Dabei soll deutlich werden, dass sowohl
der Fall „<“ mit geringer bzw. großer Abweichung als auch der Fall „=“ in
der Ungleichung auftreten kann.

Lösung zu Übung 4
Beispiele für eine strikte Ungleichung
(1) Sei v = (1, 2), w = (1, 3). Dann gilt:
〈(1, 2), (1, 3)〉 = 1 + 6 = 7
i (1, 2) i = £1 + 4 = £5, i (1, 3) i = £1 + 9 = £10
Damit ist |〈v, w〉| = 7 und i v i i w i = £50. Es gilt
7 = £49 < £50 < 71/10 = 7,1
Die Ungleichung ist strikt mit geringer Abweichung.
(2) Sei v = (1, 2), w = (−2, 1). Dann gilt:
〈(1, 2), (−2, 1)〉 = −2 + 2 = 0
i (1, 2) i = £1 + 4 = £5, i (−2, 1) i = £4 + 1 = £5
Damit ist |〈v, w〉| = 0 und i v i i w i = 5. Die Ungleichung ist strikt
mit großer Abweichung. Hier liegt der Extremfall eines verschwin-
denden Skalarprodukts vor. Das Produkt zweier Normen ist immer
positiv, wenn die Vektoren ungleich dem Nullvektor sind. Für das
Skalarprodukt gilt dies nicht.
Beispiele für Gleichheit
(1) Sei v = w = (1, 2). Dann gilt
〈(1, 2), (1, 2)〉 = 1 + 4 = 5
i (1, 2) i = £5.
Damit ist |〈v, w〉| = 5 = i v i i w i, sodass Gleichheit gilt. Allgemein
gilt Gleichheit, wenn v = w.

(2) Sei v = (1, 2), w = (−2, −4). Dann gilt


〈(1, 2), (−2, −4)〉 = −2 − 8 = −10
i (1, 2) i = £5, i (−2, −4) i = £4 + 16 = £20 = 2 £5.
Damit ist |〈v, w〉| = 10 = i v i i w i, sodass Gleichheit gilt.
Allgemein gilt Gleichheit, wenn w ein skalares Vielfaches von v
ist. Der Fall v = w ist ein Spezialfall hiervon.

© Oliver Deiser Grundzüge der Höheren Mathematik


3. Winkel und Projektion

Im Zentrum dieses Kapitels steht die Euklidische Ebene


R2 = R × R = { (x, y) | x, y P R }
Wir diskutieren eine anschauliche geometrische Interpretation des Skalarpro-
dukts, die es uns erlaubt, in einfacher Weise den Winkel zwischen zwei Vektoren
zu messen. Als eine Anwendung besprechen wir die orthogonale Projektion eines
Vektors auf einen anderen. Abschließend verallgemeinern wir die Ergebnisse auf
den Rn .

Schlüsselbegriffe
Kosinussatz
Winkelformel
Orthogonalität und Kollinearität
Projektion

© Oliver Deiser Grundzüge der Höheren Mathematik


290 4. Abschnitt Vektoren

Der Kosinussatz

Wir haben das Skalarprodukt zweier Vektoren des Rn algebraisch als Summe
der Produkte der Komponenten eingeführt. Für die Ebene R2 gilt:
〈v, w〉 = x1 x2 + y1 y2 für alle v = (x1 , y1 ), w = (x2 , y2 ) P R2 .
Um diese Größe geometrisch zu interpretieren, ist folgende Verallgemeinerung
des Satzes von Pythagoras hilfreich:

Satz (Kosinussatz)
In einem Dreieck ABC mit Seiten a, b, c und Winkeln α, β, γ gilt:
a2 = b2 + c2 − 2 cos(α) b c. (Kosinussatz)

Beweis
Wir betrachten zuerst den Fall α < π/2 mit einem spitzen Winkel bei der
Ecke A. Dann zerlegt die Höhe des Dreiecks ABC bei C die Strecke AB in
zwei Strecken der Längen c1 und c2 . Es gilt c1 + c2 = c.

b a

c1 c2
A B
c

Nach dem Satz des Pythagoras gilt b2 = c1 2 + h2 , a2 = c2 2 + h2 , sodass


b2 − c1 2 = h2 = a2 − c2 2 = a2 − (c − c1 )2 = a2 − c2 + 2cc1 − c1 2 .
Mit c1 = b cos(α) erhalten wir
a2 = b2 + c2 − 2c c1 = b2 + c2 − 2cos(α) b c.
Im Fall α = π/2 und cos(α) = 0 geht der Satz in den Satz des Pythagoras über.
Der Fall α > π/2 wird ähnlich bewiesen (Übung).

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Winkel und Projektion 291

Die Winkelformel

Definition (eingeschlossener Winkel)


Seien v, w P R2 mit v, w ≠ 0. Dann setzen wir
](v, w) = „der von v und w eingeschlossene Winkel in [ 0, π ]“.

Der Winkel ](v, w) hat keine Orientierung. Es gilt ](v, w) = ](w, v).
Mit Hilfe des Skalarprodukts können wir den eingeschlossenen Winkel zweier
Vektoren überraschend einfach berechnen. Nützlich hierzu ist:

Definition (Normierung)
Sie n ≥ 1. Für alle v P Rn mit v ≠ 0 setzen wir v̂ = i v i −1 v. Ist v = 0, so setzen
wir v̂ = 0. Der Vektor v̂ [ gelesen: v Hut oder v Dach ] heißt die Normierung
von v. Analog wird v̂ für v P Cn definiert.

Es gilt i v̂ i = 1 = 〈v̂, v̂〉 für alle v ≠ 0. Ist w = λ v mit λ > 0, so gilt ŵ = v̂. Ist λ < 0,
so gilt ŵ = − v̂. Für die Dimension n = 2 gilt: Die Hut-Operation bildet einen Vek-
tor unter Wahrung seiner Richtung auf den Einheitskreis ab. Der Nullpunkt
bleibt unbewegt.

Satz (Winkelformel)
Seien v, w P R2 von 0 verschieden, und sei ϕ = ](v, w). Dann gilt:
〈v, w〉
cos ϕ = 〈v̂, ŵ〉 = , ϕ = arccos(〈v̂, ŵ〉). (Winkelformel)
iviiwi

Beweis
Wir betrachten das Dreieck mit den Ecken A = 0, B = w und C = v. Dann
gilt mit den üblichen Bezeichnungen:
(1) a = i v − w i, b = i v i, c = i w i
(2) α = ](v, w) = ϕ
Nach dem Kosinussatz gilt
a2 = b2 + c2 − 2 cos(α) b c.
Nach (1) gilt also
i v − w i 2 = iv i 2 + i w i 2 − 2 cos(ϕ) iv i i w i.
Die zweite binomische Formel für das Skalarprodukt liefert
i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉.
Damit erhalten wir wie gewünscht, dass cos(ϕ) i v i i w i = 〈v, w〉.

© Oliver Deiser Grundzüge der Höheren Mathematik


292 4. Abschnitt Vektoren

Orthogonalität und Kollinearität

Die Winkelformel motiviert:

Definition (orthogonal, aufeinander senkrecht stehen)


Seien v, w P R2 . Wir sagen, dass v und w orthogonal sind oder aufeinander
senkrecht stehen, falls 〈v, w〉 = 0.

Definition (kollinear, parallel, antiparallel)


Seien v, w P R2 . Wir nennen die Vektoren v und w
kollinear, falls |〈v, w〉| = i v i i w i,

parallel, falls 〈v, w〉 = i v i i w i,

antiparallel, falls 〈v, w〉 = − i v i i w i.

Nach der Winkelformel gelten für alle v, w P R2 mit v, w ≠ 0 und ϕ = ](v, w)


folgende Äquivalenzen:
v,w sind orthogonal genau dann, wenn ϕ = π/2
v,w sind kollinear genau dann, wenn ϕ = 0 oder ϕ = π
v,w sind parallel genau dann, wenn ϕ=0
v,w sind antiparallel genau dann, wenn ϕ=π
Zwei Vektoren sind genau dann kollinear, wenn einer der Vektoren ein skalares
Vielfaches des anderen ist. Ist ein derartiger Skalar positiv, so sind die Vektoren
parallel. Ist er negativ, so sind die Vektoren antiparallel. Genau für kollineare
Vektoren wird die Ungleichung von Cauchy-Schwarz zu einer Gleichung.

Beispiele
(1) Die Vektoren (1, 2) und (−2, 1) sind orthogonal, da
〈(1, 2), (−2, 1)〉 = − 2 + 2 = 0.
(2) Die Vektoren (1, 2) und (2, 4) sind kollinear und genauer parallel, da
der zweite Vektor ein skalares Vielfaches des ersten mit einem
positiven Skalar ist (sodass ](v, w) = 0). Alternativ können wir auch
rechnen:
〈(1, 2), (2, 4)〉 = 2 + 8 = 10,
i (1, 2) i i (2, 4) i = £5 £20 = £100 = 10.
(3) Der Nullvektor ist nach Definition orthogonal und kollinear zu jeden
Vektor v (obwohl der Winkel zwischen v und 0 nicht erklärt ist).

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Winkel und Projektion 293

Die Projektion

Als Anwendung der Winkelformel betrachten wir die Projektion eines Vektors
v auf einen Vektor u: Der Projektionsvektor w soll auf der von u erzeugten Gera-
den liegen. Seine Länge soll derart sein, dass er mit dem Nullpunkt und v ein
rechtwinkliges Dreieck bildet:

Der Vektor w ist die Projektion des Vektors v auf den Vektor u. Das aus 0, v und w
gebildete Dreieck besitzt einen rechten Winkel bei w. Der Differenzvektor
r = w − v markiert die kürzeste Strecke von v zur von u erzeugten Geraden.

Zur Berechnung von w betrachten zwei von 0 verschiedene Vektoren v und u der
Ebene. Sei α = ](v, u). Wir nehmen zunächst an, dass α ≤ π/2. Dann gilt
i w i = cos(α) i v i = 〈v, ŵ〉 = 〈v, û〉.
wobei wir die Winkelformel cos α = 〈v̂, ŵ〉 und ŵ = û verwenden. Damit gilt
w = i w i û = 〈v, û〉 û.
Im Fall α > π/2 ist cos(α) < 0, i wi = − cos(α) iv i = − 〈v, û〉 und w = − i wi û. Wir
erhalten also die gleiche Formel für w. Diese Überlegungen motivieren:

Definition (orthogonale Projektion)


Wir setzen für alle u, v P R2 :
pru (v) = 〈û, v〉 û. (Projektionsformel)
2
Der Vektor pru (v) P R heißt die (orthogonale) Projektion des Vektors v auf
den Vektor u.

© Oliver Deiser Grundzüge der Höheren Mathematik


294 4. Abschnitt Vektoren

Es ist bemerkenswert, dass in der Projektionsformel nur das Skalarprodukt


und die Norm verwendet wird und keine trigonometrische Funktion.

Merkhilfe zur Projektionsformel


(1) Die Projektion von v auf u ist unabhängig von der Länge von u. Damit
geht û in die Formel ein und nicht u.
(2) Die Projektion von λv auf u ist das λ-fache der Projektion von v auf u.
Damit geht v in die Formel ein und nicht v̂.

Die Projektion ist für alle Vektoren definiert, auch für die Sonderfälle v = 0 und
u = 0. Für v = 0 oder u = 0 ist pru (v) = 0. Für u ≠ 0 gilt
〈u, v〉
pru (v) = 〈û, v〉 û = u.
iui2

Beispiel
Seien v = (2, 4) und u = (1, 1). Dann gilt i u i = £2 und
pru (v) = i u i −2 〈u, v〉 u = (2 + 4)/2 u = 3 (1, 1) = (3, 3).

Unsere Konstruktion zeigt:

Satz (Eigenschaften der Projektion)


Für alle u, v P R2 gilt:
(a) u und pru (v) sind kollinear.
(b) u und v − pru (v) sind orthogonal.

Die zweite Aussage des Satzes rechtfertigt die Bezeichnung als „orthogonale
Projektion“: Der Differenzvektor v − pru (v) steht senkrecht auf u (und damit
auch auf pru (v)).
Der Satz lässt sich auch direkt ohne trigonometrische Vorüberlegungen be-
weisen. Die Recheneigenschaften des Skalarprodukt reichen aus:

Zweiter Beweis mit Hilfe der Eigenschaften des Skalarprodukts


zu (a): Nach Definition ist pru (v) ein skalares Vielfaches von û und damit
von u.

zu (b): Es gilt
〈u, v − pru (v)〉 = 〈u, v〉 − 〈u, pru (v)〉

= 〈u, v〉 − 〈u, 〈û, v〉 û〉

= 〈u, v〉 − 〈û, v〉 〈u, û〉

= 〈u, v〉 − 〈u, v〉 〈û, û〉 = 0.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Winkel und Projektion 295

Höhere Dimensionen

Wir haben uns hier auf den anschaulichen Fall der Euklidischen Ebene R2
konzentriert. Die Definitionen und Ergebnisse bleiben unverändert für die Vek-
torräume Rn mit einer beliebigen Dimension n ≥ 1 gültig. Für alle n ≥ 1 und alle
v, w P Rn gilt:
〈v, w〉
cos(ϕ) = 〈v̂, ŵ〉 = , ϕ = arccos(〈v̂, ŵ〉)
iviiwi

Oft wird diese Formel sogar zur Definition des zwischen zwei Vektoren des Rn
eingeschlossenen Winkels verwendet. Für die Dimensionen n > 3 ist ja im Ge-
gensatz zu den Dimension n = 2 und n = 3 elementargeometrisch nicht mehr klar,
was dieser Winkel überhaupt sein soll.
Die Definitionen „orthogonal, kollinear, parallel, antiparallel“ können unver-
ändert übernommen werden. Das Gleiche gilt für die Projektion
pru (v) = 〈û, v〉 û.
Sie erzeugt in jeder Dimension ein skalares Vielfaches von u, und der Differenz-
vektor v − pru (u) steht immer senkrecht auf u. Unser zweiter Beweis verwendet
nur allgemeine Eigenschaften des Skalarprodukts und kann deswegen übernom-
men werden.

© Oliver Deiser Grundzüge der Höheren Mathematik


296 4. Abschnitt Vektoren

Übungen

Übung 1
Berechnen Sie in der Ebene R2 bzw. im Raum R3 :
(a) den Winkel zwischen den Vektoren (1, 2) und (−1, 3)
(b) die Projektion des Vektors (1, 2) auf den Vektor (1, 3)
(c) die Projektion des Vektors (1, 3) auf den Vektor (1, 2)
(d) den Winkel zwischen den Vektoren (1, 1, 1) und (−1, 1, −1)

Übung 2
Beweisen Sie den Kosinussatz für ein Dreieck ABC mit einem stumpfen
Winkel α > π/2 in Analogie zum Beweis für den Fall α < π/2. Erstellen Sie
hierzu ein Diagramm.

Übung 3
Seien P = (x1 , y1 ), Q = (x2 , y2 ) zwei Punkte der Ebene mit P ≠ Q. Sei G die
Gerade durch P und Q. Geben Sie Vektoren w und u der Ebene an derart,
dass
G = { w + λu | λ P R }.
Weisen Sie explizit nach, dass P und Q in der Menge { w + λu | λ P R }
enthalten sind.

Übung 4
Seien v = (v1 , v2 ), w = (w1 , w2 ) P R2 . Sei P das durch v und w aufgespannte
Parallelogramm, d. h.
P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2 .
Zeigen Sie, dass für den Flächeninhalt A von P gilt:
A = |v1 w2 − v2 w1 |.
[ Hinweis: Berechnen Sie A durch „Grundseite mal Höhe“. Die Grundseite
ist durch den Vektor v gegeben und die Höhe durch w − prv (w). Damit ist
A = i v i ⋅ i w − prv (w) i
Ausrechnen liefert die gewünschte Formel. ]

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Winkel und Projektion 297

Lösungen zu den Übungen

Übung 1
Berechnen Sie in der Ebene R2 bzw. im Raum R3 :
(a) den Winkel zwischen den Vektoren (1, 2) und (−1, 3)
(b) die Projektion des Vektors (1, 2) auf den Vektor (1, 3)
(c) die Projektion des Vektors (1, 3) auf den Vektor (1, 2)
(d) den Winkel zwischen den Vektoren (1, 1, 1) und (−1, 1, −1)

Lösung zu Übung 1
zu (a): Seien v = (1, 2), w = (−1, 3) und ϕ = ](v, w). Dann gilt
〈v, w〉 5 5 1
cos(ϕ) = = = = .
iviiwi £5 £10 5£2 £2

Damit gilt
1 π
ϕ = arccos( ) = .
£2 4

zu (b): Seien v = (1, 2) und u = (1, 3). Dann gilt i u i 2 = 10 und

〈u, v〉 7
pru (v) = u = u = (7/10, 21/10).
iui2 10

zu (c): Seien v = (1, 3) und u = (1, 2). Dann gilt i u i 2 = 5 und

〈u, v〉 7
pru (v) = u = u = (7/5, 14/5).
iui2 5

zu (d): Seien v = (1, 1, 1), w = (−1, 1, −1) und ϕ = ](v, w). Dann gilt

〈v, w〉 −1 1
cos(ϕ) = = = − .
iviiwi £3 £3 3

Damit gilt
1
ϕ = arccos( − ) = 1,91…
3

© Oliver Deiser Grundzüge der Höheren Mathematik


298 4. Abschnitt Vektoren

Übung 2
Beweisen Sie den Kosinussatz für ein Dreieck ABC mit einem stumpfen
Winkel α > π/2 in Analogie zum Beweis für den Fall α < π/2. Erstellen Sie
hierzu ein Diagramm.

Lösung zu Übung 2
Wir betrachten ein Dreieck ABC mit einem stumpfen Winkel α bei A.
Dann liegt der Fußpunkt D der Höhe des Dreiecks ABC bei C außerhalb
des Dreiecks. Sei d die Länge der Strecke DA.
C

b a
h

B
D d A c

Die Dreiecke DAC und DBC sind rechtwinklig. Nach dem Satz es Pythago-
ras gilt

b2 = d2 + h2 ,

a2 = (c + d)2 + h2 .

Damit gilt
b2 − d2 = h2 = a2 − (c + d)2 = a2 − c2 − 2cd − d2 .
Mit d = b cos(π − α) = − b cos(α) erhalten wir
a2 = b2 + c2 + 2c d = b2 + c2 − 2cos(α) b c.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Winkel und Projektion 299

Übung 3
Seien P = (x1 , y1 ), Q = (x2 , y2 ) zwei Punkte der Ebene mit P ≠ Q. Sei G die
Gerade durch P und Q. Geben Sie Vektoren w und u der Ebene an derart,
dass
G = { w + λu | λ P R }.
Weisen Sie explizit nach, dass P und Q in der Menge { w + λu | λ P R }
enthalten sind.

Lösung zu Übung 3
Wir setzen
w = P = (x1 , y1 ),
u = Q − P = (x2 − x1 , y2 − y1 ).
Dann gilt
G = { w + λu | λ P R } = { (x1 , y1 ) + λ(x2 − x1 , y2 − y1 ) | λ P R }.
Die Wahl von λ = 0 zeigt, dass
P = w = w − 0u
ein Element von { w + λu | λ P R } ist. Wählen wir λ = 1, so erhalten wir,
dass auch der Punkt
Q = P + (Q − P) = w + u = w + 1 u
in der Menge { w + λu | λ P R } enthalten ist.

© Oliver Deiser Grundzüge der Höheren Mathematik


300 4. Abschnitt Vektoren

Übung 4
Seien v = (v1 , v2 ), w = (w1 , w2 ) P R2 . Sei P das durch v und w aufgespannte
Parallelogramm, d. h.
P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2 .
Zeigen Sie, dass für den Flächeninhalt A von P gilt:
A = |v1 w2 − v2 w1 |.

Lösung zu Übung 4
Wir berechnen die Fläche von P durch die Formel „Grundseite mal Höhe“.
Die Grundseite wird durch den Vektor v gegeben, die Höhe durch den
Vektor w − prv (w). Nach dem Satz des Pythagoras und der Projektionsfor-
mel prv (w) = 〈v̂, w〉 v̂ gilt

i w − prv (w) i 2 = i w i 2 − i prv (w) i 2 = i w i 2 − 〈 v̂, w〉 2 .

Damit gilt

A2 = i v i 2 ⋅ i w − prv (w) i 2

= i v i 2 ⋅ i w i 2 − i v i 2 〈v̂, w〉 2

= i v i 2 ⋅ i w i 2 − 〈v, w〉 2

= (v1 2 + v2 2 ) (w1 2 + w2 2 ) − (v1 w1 + v2 w2 )2

= (v1 w1 )2 + (v1 w2 )2 + (v2 w1 )2 + (v2 w2 )2 − (v1 w1 )2 − 2w1 v1 w2 v2 − (v2 w2 )2

= (v1 w2 )2 − 2v1 w1 v2 w2 + (v2 w1 )2

= (v1 w2 − v2 w1 )2 .

Dabei haben wir die Definitionen der Norm und des Skalarprodukts sowie
das Distributivgesetz und die binomischen Formeln für reelle Zahlen
verwendet. Durch Wurzelziehen erhalten wir die Behauptung (die
Betragsstriche ergeben sich aus der Formel £x2 = |x|).

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden

Wir untersuchen in diesem Kapitel Geraden in den Vektorräumen Rn , die wir


allgemein in Punkt-Richtungsform
w + span(u) = w + { λ u | λ P R } = { w + λu | λ P R }
darstellen. Der Schwerpunkt liegt dabei auf der Dimension n = 2. Mit Hilfe des
Skalarprodukts zeigen wir, dass die Geraden der Ebene genau die Lösungsmen-
gen von algebraischen Gleichungen der Form
ax + by + c = 0
in den reellen Variablen x und y sind.

Schlüsselbegriffe
Spann
Translation
Affine Gerade
Darstellungsformen für Geraden
Algebraische Kurve

© Oliver Deiser Grundzüge der Höheren Mathematik


302 4. Abschnitt Vektoren

Der Spann eines Vektors

Definition (Spann eines Vektors)


Sei n ≥ 1, und sei u P Rn . Dann heißt die Menge
span(u) = { λ u | λ P R } ⊆ Rn
der Spann oder das Erzeugnis des Vektors u. Für alle λ P R heißt λu der
zum Parameter λ gehörige Vektor von span(u).

Die Menge span(u) besteht aus alle skalaren Vielfachen von u. Ist u = 0, so ist
span(u) = { 0 }. Andernfalls ist span(u) eine Gerade durch den Nullpunkt.

Beispiele
(1) span((1, 2)) = { λ (1, 2) | λ P R } = { (λ, 2λ) | λ P R }
(2) span((0, 1)) = { λ (0, 1) | λ P R } = { (0, λ) | λ P R } (y-Achse)
(3) span((1, 2, −1)) = { λ (1, 2, −1) | λ P R } = { (λ, 2λ, − λ) | λ P R }
(4) span(0) = span((0, …, 0)) = { λ 0 } | λ P R } = { 0 }

Die Translation einer Menge

Um auch Geraden zu erhalten, die nicht durch den Nullpunkt verlaufen, füh-
ren wir eine Operation zur Verschiebung ein. Wir definieren allgemein für belie-
bige Mengen:

Definition (Translation)
Sei n ≥ 1, und seien w P Rn und U ⊆ Rn . Dann heißt
w+U = {w+u|uPU}
die Translation oder Verschiebung der Menge U um den Vektor w.

Beispiel
(1) Im R3 seien w = (1, −1, 0) und U = { (1, 2, 3), (1, 0, −1) }. Dann gilt
w + U = { w + (1, 2, 3), w + (1, 0, −1) } = { (2, 1, 3), (2, −1, −1) }.
(2) In der Ebene R2 sei K = { v | i v i = 3 } der Kreis mit Mittelpunkt 0 und
Radius 3. Dann ist (1, 2) + K der Kreis der Ebene mit Radius 3 und
Mittelpunkt (1, 2).
(3) Ist U = ∅, so ist w + U = ∅. Ist U = { 0 }, so ist w + U = { w }. Ist U = { u },
so ist w + U = { w + u }. Ist U = { u1 , u2 }, so ist w + U = { w + u1 , w + u2 }.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden 303

Affine Geraden

Definition (affine Gerade)


Sei n ≥ 1. Eine Menge G ⊆ Rn heißt eine affine Gerade, falls sie von der Form
G = w + span(u) mit u ≠ 0
ist. Wir nennen w einen Aufsatzpunkt und u einen Richtungsvektor von G.

Anschaulich entsteht eine affine Gerade durch die Verschiebung einer Gera-
den span(u) durch den Nullpunkt um einen Vektor w. Der Translationsvektor w
wird dabei zum Aufsatzpunkt, die Richtung u bleibt gleich. Es gilt
G = w + span(u) = { w + λu | λ P R }
= { (w1 + λu1 , …, wn + λun ) | λ P R }.
Aufsatzpunkt und Richtungsvektor einer affinen Geraden G = w + span(u) sind
nicht eindeutig bestimmt. Für alle w′ P w + span(u) und alle α P R mit α ≠ 0 gilt
w + span(u) = w′ + span(αu).
Jeder Punkt der Geraden kann als Aufsatzpunkt dienen und jede Skalierung des
Richtungsvektors erhält die Gerade, wenn der verwendete Skalar von 0 verschie-
den ist.

Beispiel
Für die zur x-Achse parallele affine Gerade G durch den Punkt (0, 2) gilt
G = (0, 2) + span(e1 ) = (1, 2) + span(e1 ) = (−7, 2) + span(3e1 )
In Parameterdarstellung können wir schreiben
G = { (0, 2) + λ(1, 0) | λ P R } = { (λ, 2) | λ P R }.

Parametrisierte Geraden, Halbgeraden und Strecken durch zwei Punkte


Sei n ≥ 1, und seien v, w P Rn mit v ≠ w. Weiter sei u = v − w. Dann haben
wir die folgenden Darstellungen der durch v und w definieren Geraden,
Halbgeraden und Strecke:
{ w + λu | λ P R } (Gerade durch v und w)
{ w + λu | λ ≥ 0 } (Halbgerade oder Strahl von w in Richtung u)
{ w − λu | λ ≥ 0 } (Halbgerade oder Strahl von w in Richtung − u)
{ w + λu | λ P [ 0, 1 ] } (Strecke von w nach v)
Speziell ist w + u/2 = (w + v)/2 der Mittelpunkt der Strecke von w nach v.

© Oliver Deiser Grundzüge der Höheren Mathematik


304 4. Abschnitt Vektoren

Der Schnitt zweier Geraden

Wir betrachten zwei affine Geraden


G = w + span(u) = { w + λu | λ P R }
H = w′ + span(u′) = { w′ + µu′ | µ P R }.
der Ebene. Anschaulich ist klar: Sind die Richtungsvektoren u und u′ kollinear, so
sind die Geraden entweder identisch (also G = H) oder disjunkt (d.h. G ∩ H = ∅).
Sind u und v′ nicht kollinear, so besitzen die beiden Geraden genau einen
Schnittpunkt v* (d. h. es gilt G ∩ H = { v* }). Rechnerisch erhalten wir dies durch
das Lösen des Gleichungssystems
w + λ u = w′ + µ u′
in den reellen Unbekannten λ und µ. Das System besteht aus den beiden Glei-
chungen
w1 + λ u1 = w′1 + µ u′1
w2 + λ u2 = w′2 + µ u′2
Wir können es in der äquivalenten Form
u1 λ − u′1 µ = w′1 − w1
u2 λ − u′2 µ = w′2 − w2
notieren. Das System kann wie üblich durch Elimination gelöst werden.

Beispiel
Seien
G = w + span(u) = (1, 2) + span((1, 1)),
H = w′ + span(u′) = (0, 3) + span((2, −1)).
Es gilt w′ − w = (0, 3) − (1, 2) = (−1, 1). Wir lösen das Gleichungssystem
λ − 2µ = −1
λ + µ = 1
Subtraktion der ersten Gleichung von der zweiten ergibt 3µ = 2, sodass
µ = 2/3. Einsetzen in die zweite Gleichung liefert λ = 1 − µ = 1/3. Der
Schnittpunkt der Geraden G und H ist also
(1, 2) + 1/3 (1, 1) = (4/3, 7/3) = (0, 3) + 2/3 (2, −1).

In einer beliebigen Dimension n verfahren wir analog. Nun liegen n Glei-


chungen in zwei Unbekannten λ und µ vor. Typischerweise ist ein derartiges
Gleichungssystem für n ≥ 3 also nicht lösbar.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden 305

Der Abstand eines Punktes von einer Geraden

Den Abstand zweier Punkte v, u P R haben wir durch d(v, u) = iv − ui definiert.


Durch eine „Suche nach dem kürzesten Weg“ können wir den Abstand eines
Punktes von einer Menge einführen:

Definition (Abstand zwischen Punkt und Menge)


Sei n ≥ 1, und seien v P Rn und U ⊆ Rn nichtleer. Dann heißt
d(v, U) = infu P U d(v, u)
der Abstand des Vektors v von der Menge U.

Beispiele
(1) Ist U = { u }, so ist d(v, U) = d(v, u). Ist U = { u1 , u2 }, so ist
d(v, U) = inf({ d(v, u1 ), d(v, u2 }) = min({ d(v, u1 ), d(v, u2 ) }).
(2) Ist v = (0, 1) und U = { (λ, 0) | λ > 0 } der positive Teil der x-Achse, so
ist d(v, U) = 1. Das Infimum der Definition ist hier kein Minimum.

Mit Hilfe der Projektion können wir eine Formel für den Abstand eines Punk-
tes v von einer Geraden G = w + span(u) angeben:

Satz (Berechnungsformel für den Abstand)


Sei n ≥ 1, und seien v P Rn und G = w + span(u) eine affine Gerade im Rn .
Dann gilt
s
d(v, G) = i v − w i 2 − 〈û, v − w〉2 .

Beweis
Der Abstand bleibt gleich, wenn wir den Vektor v und die Gerade G jeweils
um −w verschieben. Die Verschiebung von G um −w ist die Gerade span(u).
Es gilt also

d(v, G) = d(v − w, span(u)).

Sei v* = v − w. Der Wert auf der rechten Seite ist die Länge der kürzesten
Strecke von v* zur Geraden span(u), also die Länge des Vektors v* − pru (v*).
Nach dem Satz des Pythagoras gilt

i v* − pru (v*) i 2 = i v* i 2 − i pru (v*) i 2 = i v* i 2 − 〈û, v*〉2 ≥ 0.

Durch Wurzelziehen ergibt sich die Behauptung.

© Oliver Deiser Grundzüge der Höheren Mathematik


306 4. Abschnitt Vektoren

Geraden als algebraische Kurven ersten Grades

Definition (algebraische Kurve ersten Grades)


Eine Menge A ⊆ R2 heißt eine algebraische Kurve ersten Grades, falls es
a, b, c P R gibt mit (a, b) ≠ 0 und
A = { (x, y) P R2 | ax + by + c = 0 }.

Wir zeigen, dass die affinen Geraden genau die algebraischen Kurven ersten
Grades sind. Hierzu beobachten wir: Ist H = span(u) eine Gerade durch 0 und ist
u ⊥ = (−u2 , u1 ) [ gelesen: u senkrecht ]
der um π/2 gegen den Uhrzeigersinn gedrehte Vektor u, so besteht die Gerade H
aus allen Vektoren, die auf u ⊥ senkrecht stehen. Es gilt also
H = { v P R2 | 〈u ⊥ , v〉 = 0 }
= { (x, y) P R2 | −u2 x + u1 y = 0 } (Orthogonaldarstellung von H)
Sei nun G = w + H, und sei v P R2 . Dann gilt v P G genau dann, wenn v − w P H,
d. h. wenn 〈u ⊥ , v − w〉 = 0. Wir setzen
c = − 〈u ⊥ , w〉.
Dann gilt
G = { v P R2 | 〈u ⊥ , v − w〉 = 0 } = { v P R2 | 〈u ⊥ , v〉 − 〈u ⊥ , w〉 = 0 }
= { v P R2 | 〈u ⊥ , v〉 + c = 0 } = { (x, y) P R2 | −u2 x + u1 y + c = 0 }.
Insgesamt erhalten wir:

Satz (affine Geraden als algebraische Kurven)


Die affinen Geraden der Ebene R2 sind genau die algebraischen Kurven
ersten Grades. Die Geraden durch 0 entsprechen dabei den algebraischen
Kurven mit dem Parameter c = 0. Genauer gilt:
(1) Ist G = w + span(u) eine affine Gerade und (a, b) = u ⊥ = (−u2 , u1 ), so gilt
G = { (x, y) P R2 | ax + by − 〈(a, b), w〉 = 0 }.
(2) Ist A = { (x, y) P R2 | ax + by + c = 0 } eine algebraische Kurve ersten
Grades und w P A beliebig, so gilt
A = w + span((b, −a)).
Ist a ≠ 0, so ist w = (−c/a, 0) P A. Ist b ≠ 0, so ist w = (0, −c/b) P A.

Der Satz erlaubt es, eine affine Gerade effektiv in eine algebraische Kurve um-
zurechnen und umgekehrt. Das Skalarprodukt spielt dabei eine entscheidende
Rolle.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden 307

Algebraische Kurven zweiten Grades

Definition (algebraische Kurve zweiten Grades)


Eine Menge A ⊆ R2 heißt eine algebraische Kurve zweiten Grades, falls es
a, b, c, d, e, f P R gibt mit (a, b, c) ≠ 0 und
A = { (x, y) P R2 | ax2 + by2 + cxy + dx + ey + f = 0 }.

Im Gegensatz zu den Kurven ersten Grades gehen nun auch Potenzen in x, y


des Gesamtgrads zwei ein. Wir erhalten sechs Terme x2 , y2 , xy, x, y, 1 (= x0 y0 ) und
damit sechs Parameter a, b, c, d, e, f. Die Bedingung (a, b, c) ≠ 0 garantiert, dass
keine Gleichung ersten Grades vorliegt.
Die Kurven zweiten Grades lassen sich wie die Kurven ersten Grades klassifi-
zieren: Sie sind genau die Kegelschnitte der Ebene, also Ellipsen, Parabeln und
Hyperbeln. Der Nachweis dieser Übereinstimmung ist nicht mehr so einfach.
Wir begnügen uns hier mit einigen instruktiven Beispielen.

Beispiele
x2 + y2 − 1 = 0 Einheitskreis
(x − x0 )2 + (y − y0 )2 − r2 = 0 Kreis mit Radius r und Mittelpunkt (x0 , y0 )
2 2 2
x /a + y /b − 1 = 0 2
Ellipse mit Halbachsen a, b > 0
x2 − y = 0 Einheitsparabel
2 2
x −y −1 = 0 Einheitshyperbel
xy − 1 = 0 Hyperbel
10

-5

-10
-10 -5 0 5 10

Beispiele für algebraische Kurven zweiten Grades:


x − y + xy − 1 = 0 (blau), −x2 − y2 + xy − 6y + 2 = 0 (gelb), x2 + 3x − 2y = 0 (grün)
2 2

© Oliver Deiser Grundzüge der Höheren Mathematik


308 4. Abschnitt Vektoren

Übungen

Übung 1
Wir betrachten die Ebene R2 . Berechnen Sie
(a) den Durchschnitt G ∩ H der Geraden
G = (1, 3) + span((1, 2))
H = (1, −3) + span((−2, 1))
(b) den Abstand von (3, 4) zur affinen Geraden G = (1, 2) + span((1, −2))
(c) die Darstellung der affinen Geraden
G = (1, 2) + span((−1, 1))
durch eine algebraische Kurve A = { (x, y) P R2 | ax + by + c = 0 }
(d) die Darstellung der algebraischen Kurve
A = { (x, y) P R2 | 2x − 3y + 1 = 0 }
durch eine affine Gerade G = w + span(u)

Übung 2
Wir betrachten den Vektorraum R3 . Seien v = (1, 3, 5) und w = (−1, −1, 0).
Geben Sie die folgenden Mengen in parametrisierter Form an:
(a) die Gerade durch w und v
(b) die bei w beginnende Halbgerade durch w und v
(c) die bei v beginnende Halbgerade durch v und w
(d) die Strecke von w nach v

Übung 3
Sei n ≥ 1, und sei G = w + span(u) eine Gerade im Rn . Weiter seien v′, w′
zwei verschiedene Punkte von G, und es sei u′ = v′ − w′. Zeigen Sie:
G = w′ + span(u′).
Folgern Sie, dass es für je zwei verschiedene Punkte des Rn genau eine
Gerade durch diese Punkte gibt.

Übung 4
Erstellen Sie ein beschriftetes und kommentiertes Diagramm, das die
geometrische Bedeutung der Parameter a, b, c einer algebraischen Kurve
A = { (x, y) P R2 | ax + by + c = 0 }
illustriert. Erklären Sie Ihr Diagramm durch einen ergänzenden Text.

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden 309

Lösungen zu den Übungen

Übung 1
Wir betrachten die Ebene R2 . Berechnen Sie
(a) den Durchschnitt G ∩ H der Geraden
G = (1, 3) + span((1, 2)) und H = (1, −3) + span((−2, 1))
(b) den Abstand von (3, 4) zur affinen Geraden G = (1, 2) + span((1, −2))
(c) die Darstellung der Geraden
G = (1, 2) + span((−1, 1))
durch eine algebraische Kurve A = { (x, y) P R2 | ax + by + c = 0 }
(d) die Darstellung der algebraischen Kurve
A = { (x, y) P R2 | 2x − 3y + 1 = 0 }
durch eine affine Gerade G = w + span(u)

Lösung zu Übung 1
zu (a): Wir lösen (1, 3) + λ (1, 2) = (1, −3) + µ (−2, 1) in λ, µ P R. Aus
(1 + λ, 3 + 2λ) = (1 − 2µ, −3 + µ) erhalten wir durch Koordinatenver-
gleich 1 + λ = 1 − 2µ, 3 + 2λ = −3 + µ und damit das Gleichungssystem
(I) λ + 2µ = 0
(II) 2λ − µ = −6
Die Operation (II) − 2(I) liefert −5µ = −6, sodass µ = 6/5. Einsetzen in (I)
ergibt λ = −2µ = −12/5. Damit ist G ∩ H = { v* } mit
v* = (1, 3) − 12/5(1, 2) = −1/5 (7, 9) = (1, −3) + 6/5(−2, 1).

zu (b): Mit v = (3, 4), w = (1, 2), u = (1, − 2), v* = v − w = (2, 2) ist
〈u, v*〉2 4 36
d(v, G)2 = i v* i 2 − 〈û, v*〉2 = i v* i 2 − = 8 − = .
iui2 5 5
Also gilt d(v, G) = 6/£5 (, 2,68).

zu (c): Mit w = (1, 2), u = (−1, 1) und u ⊥ = (−1, −1) gilt


G = { (x, y) P R2 | −u2 x + u1 y − 〈u ⊥ , w〉 = 0 }
= { (x, y) P R2 | −x − y + 3 = 0 }.

zu (d): Mit a = 2, b = −3 und c = 1 gilt


A = (−c/a, 0) + span((−b, a)) = (−1/2, 0) + span((3, 2)).

© Oliver Deiser Grundzüge der Höheren Mathematik


310 4. Abschnitt Vektoren

Übung 2
Wir betrachten den Vektorraum R3 . Seien v = (1, 3, 5) und w = (−1, −1, 0).
Geben Sie die folgenden Mengen in parametrisierter Form an:
(a) die Gerade durch w und v
(b) die bei w beginnende Halbgerade durch w und v
(c) die bei v beginnende Halbgerade durch v und w
(d) die Strecke von w nach v

Lösung zu Übung 2
Wir setzen

u = v − w = (2, 4, 5),

u′ = w − v = − u = (−2, −4, −5).

zu (a): Gerade durch w und v:

{ w + λu | λ P R } = { (−1, −1, 0) + λ(2, 4, 5) | λ P R }

zu (b): Bei w beginnende Halbgerade durch w und v:

{ w + λu | λ ≥ 0 } = { (−1, −1, 0) + λ(2, 4, 5) | λ ≥ 0 }

zu (c): Bei v beginnende Halbgerade durch v und w:

{ v + λu′ | λ ≥ 0 } = { (1, 3, 5) − λ(2, 4, 5) | λ ≥ 0 }

zu (d): Strecke von w nach v:

{ w + λu | λ P [ 0, 1 ] } = { (−1, −1, 0) + λ(2, 4, 5) | λ P [ 0, 1 ] }

Grundzüge der Höheren Mathematik © Oliver Deiser


4. Geraden 311

Übung 3
Sei n ≥ 1, und sei G = w + span(u) eine Gerade im Rn . Weiter seien v′, w′
zwei verschiedene Punkte von G, und es sei u′ = v′ − w′. Zeigen Sie:
G = w′ + span(u′).
Folgern Sie, dass es für je zwei verschiedene Punkte des Rn genau eine
Gerade durch diese Punkte gibt.

Lösung zu Übung 3
Wegen v′, w′ P G gibt es α, β P R mit
w′ = w + α u
v′ = w + β u.
Wegen w′ ≠ u′ ist α ≠ β. Weiter gilt
u′ = v′ − w′ = (β − α) u.
Sei G′ = w′ + span(u′). Wir zeigen, dass G = G′. Sei hierzu λ P R beliebig.
Dann gilt
w′ + λ u′ = w + α u + λ (β − α) u = w + (α + λ(β − α)) u P G
λ−α
w + λ u = w′ − α u + λ u = w′ + (λ − α) u = w′ + u′ P G′,
β−α

mit β − α ≠ 0. Dies zeigt, dass G′ ⊆ G und G ⊆ G′. Also gilt G = G′.


Zum Zusatz:
Sind v′, w′ zwei verschiedene Punkte des Rn , so ist
G′ = w′ + span(v′ − w′)
eine Gerade durch w′ und v′. Dies zeigt die Existenz. Ist G = w + span(u)
eine weitere Gerade durch diese Punkte, so gilt G = G′ nach dem
Gezeigten. Dies zeigt die Eindeutigkeit.

© Oliver Deiser Grundzüge der Höheren Mathematik


312 4. Abschnitt Vektoren

Übung 4
Zeichnen Sie ein Diagramm, das die geometrische Bedeutung der Parame-
ter a, b, c einer algebraischen Kurve
A = { (x, y) P R2 | ax + by + c = 0 }
illustriert. Erklären Sie Ihr Diagramm durch einen ergänzenden Text.

Lösung zu Übung 4
Die Menge
A = { (x, y) P R2 | ax + by + c = 0 }
ist eine affine Gerade:

(a, b) A

w
(b, -a)
w0

Der Vektor (a, b) steht senkrecht auf dem Richtungsvektor (−b, a) der Gera-
den. Der Parameter c gibt die Verschiebung der Geraden an. Nach unseren
Überlegungen gilt
c = − 〈(a, b), w〉 für alle w P A.
Für den zu (a, b) kollinearen Vektor w0 P A wie im Diagramm erhalten wir
speziell
|c|
i w0 i =
i (a, b) i

Für c < 0 ist 〈(a, b), w0 〉 > 0 und damit w0 parallel zu (a, b). Ist c > 0, so ist
w0 antiparallel zu (a, b). Für c = 0 ist w0 = 0. Ist (a, b) normiert, ist |c| der
Betrag der Verschiebung.
Durch Division der Gleichung können wir immer erreichen, dass (a, b) nor-
miert ist. In diesem Fall gibt dann der dritte Parameter c die Verschiebung
der Geraden entlang (a, b) an.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt

Nach unserer Untersuchung der Geraden diskutieren wir nun in analoger Weise
Ebenen in den Vektorräumen Rn . Dabei steht die Dimension n = 3 im Mittel-
punkt. Eine Besonderheit des dreidimensionalen Raumes ist das Kreuzprodukt,
das es uns erlaubt, zu zwei Vektoren einen Vektor zu konstruieren, der auf beiden
Vektoren senkrecht steht.

Schlüsselbegriffe
Span (für zwei Vektoren)
Affine Ebene
Kreuzprodukt
Algebraische Fläche ersten Grades
Orthogonaldarstellung

© Oliver Deiser Grundzüge der Höheren Mathematik


314 4. Abschnitt Vektoren

Der Spann zweier Vektoren

Definition (Spann zweier Vektoren)


Sei n ≥ 1, und seien u, w P Rn . Dann heißt die Menge
span(u, w) = { λ u + µ w | λ, µ P R } ⊆ Rn
der Spann oder das Erzeugnis von u und w.

Im Gegensatz zum Spann eines Vektors sind nun zwei Vektoren und damit
zwei Skalare beteiligt. Dadurch sind zweidimensionale Erzeugnisse möglich.

Beispiele
(1) In der Ebene R2 gilt mit e1 = (1, 0), e2 = (0, 1):
span(e1 , e2 ) = { λ e1 + µ e2 | λ, µ P R } = { (λ, µ) | λ, µ P R } = R2 .
(2) Im dreidimensionalen Raum R3 gilt mit e1 = (1, 0, 0), e2 = (0, 1, 0):
span(e1 , e2 ) = { λ e1 + µ e2 | λ, µ P R } = { (λ, µ, 0) | λ, µ P R },
sodass der Spann der Vektoren e1 und e2 die x-y-Ebene ist. Analog ist
span(e1 , e3 ) die x-z-Ebene und span(e2 , e3 ) die y-z-Ebene.

Wir sammeln einige leicht nachzuweisende Eigenschaften:

Satz (Eigenschaften des Spanns zweier Vektoren)


Sei n ≥ 1, und seien u, w P Rn . Dann gilt:
(1) 0 P span(u, w).
(2) span(u, w) = span(w, u).
(3) span(u) ∪ span(w) ⊆ span(u, w).
(4) Sind u, w kollinear und u, w ≠ 0, so gilt span(u, w) = span(u) = span(w).
(5) Ist w = 0, so gilt span(u, w) = span(u).
(6) Ist u = w = 0, so gilt span(u, w) = { 0 }.

Beweis
Wir zeigen exemplarisch (4). Seien also u, w kollinear mit u, w ≠ 0. Dann
gibt es ein α P R mit w = αu. Für alle λ, µ P R gilt
λu + µw = λu + µα u = (λ + µα)u P span(u).
Damit ist span(u, w) ⊆ span(u) und nach (3) also span(u, w) = span(u). Der
Beweis von span(u, w) = span(w) wird analog geführt.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt 315

Affine Ebenen

Definition (affine Ebene)


Sei n ≥ 1. Eine Menge E ⊆ Rn heißt eine affine Ebene, falls sie von der Form
E = w + span(u1 , u2 ), u1 , u2 nicht kollinear
ist. Wir nennen w einen Aufsatzpunkt und u1 , u2 Richtungsvektoren von E.

Eine affine Ebene entsteht also aus dem Spann zweier nicht kollinearer Vekto-
ren durch eine Translation um einen Vektor w. Es gilt
E = w + span(u1 , u2 ) = { w + λu1 + µu2 | λ, µ P R }.
Wie für die Geraden sind Aufsatzpunkt und Richtungsvektoren einer affinen
Ebene nicht eindeutig bestimmt.

Satz (affine Ebene durch drei Punkte)


Sei n ≥ 1, und seien w1 , w2 , w3 P Rn drei Punkte, die nicht auf einer
gemeinsamen Geraden liegen. Dann gibt es genau eine affine Ebene E
durch w1 , w2 , w3 . Diese Ebene ist gegeben durch
E = w1 + span(w2 − w1 , w3 − w1 ).

Beweis
Seien u1 = w2 − w1 , u2 = w3 − w1 . Nach Voraussetzung sind u1 , u2 nicht
kollinear, sodass
E = w1 + span(w2 − w1 , w3 − w1 ) = w1 + span(u1 , u2 )
eine affine Ebene ist. Es gilt
E = { w1 + λ(w2 − w1 ) + µ(w3 − w1 ) | λ, µ P R }.
Die Wahl von λ = µ = 0 zeigt, dass w1 P E. Setzen wir λ = 1 und µ = 0, so
erhalten wir w2 P E. Mit λ = 0 und µ = 1 ist schließlich auch w3 P E. Damit
ist E eine affine Ebene durch w1 , w2 , w3 .
Die Eindeutigkeit kann in Analogie zum Beweis des Satzes gezeigt werden,
dass es durch zwei verschiedene Punkte des Rn genau eine Gerade gibt (vgl.
die Übungen im letzten Kapitel).

Beispiel
Im R4 seien w1 = (1, 0, 1, 0), w2 = (1, 1, 1, 1), w3 = (1, −1, 2, 1). Dann ist
E = w1 + span((0, 1, 0, 1), (0, −1, 1, 1))
die eindeutige Ebene des R4 durch w1 , w2 , w3 .

© Oliver Deiser Grundzüge der Höheren Mathematik


316 4. Abschnitt Vektoren

Das Kreuzprodukt

Wir betrachten nun den dreidimensionalen Raum R3 sowie zwei Vektoren v


und w dieses Raumes, die wir in der Koordinaten-Form
v = (x1 , y1 , z1 ), w = (x2 , y2 , z2 )
notieren. Sind die Vektoren nicht kollinear, so spannen sie eine Ebene durch den
Nullpunkt auf, und es ist anschaulich klar, dass es genau eine Gerade durch den
Nullpunkt gibt, die auf dieser Ebene senkrecht steht. Um diese Gerade zu fin-
den, suchen wir einen Vektor u ≠ 0, der sowohl auf v als auch auf w senkrecht
steht. Es soll also gelten, dass 〈u, v〉 = 〈u, w〉 = 0. Diese Bedingung lässt sich als li-
neares Gleichungssystem formulieren:
(I) u1 x1 + u2 y1 + u3 z1 = 0
(II) u1 x2 + u2 y2 + u3 z2 = 0
Dieses System besteht aus zwei Gleichungen und drei reellen Unbestimmten
u1 ,u2 ,u3 . Die sechs Koeffizienten x1,2 , y1,2 , z1,2 des Systems sind die Koordinaten
der gegebenen Vektoren v und w. Mit einer Lösung u ist auch jedes skalare Viel-
fache λu von u eine Lösung des Systems. Wir verzichten hier auf eine Durchfüh-
rung der Lösung und geben das Ergebnis an. Hierzu definieren wir:

Definition (Kreuzprodukt)
Für alle v, w P R3 setzen wir (mit Spaltennotation für die Vektoren)
x1 x2 y 1 z2 − y 2 z1
v × w = y1 × y2 = x2 z1 − x1 z2 .
z1 z2 x1 y2 − x2 y1

Der Vektor v × w P R3 heißt das Kreuzprodukt oder Vektorprodukt von v und w.

Wichtig
Das Kreuzprodukt ist eine Besonderheit der Dimension n = 3. Es erzeugt
zu je zwei Vektoren des R3 einen Vektor des R3 . In jede Koordinate von
v × w gehen die vier anderen Koordinaten von v und w „kreuzweise“ ein.

Das Kreuzprodukt u = v × w ist, wie wir gleich sehen werden, eine Lösung des
Systems (I), (II). Die Lösungsmenge des Systems ist damit span(v × w).

Beispiele
(1) e1 × e2 = (1, 0, 0) × (0, 1, 0) = (0, 0, 1) = e3
(2) e2 × e1 = (0, 1, 0) × (1, 0, 0) = (0, 0, −1) = − e3
(3) (1, 1, 2) × (2, 1, 0) = (0 − 2, 4 − 0, 1 − 2) = (−2, 4, −1)

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt 317

Eigenschaften des Kreuzprodukts

Satz (Eigenschaften des Kreuzprodukts)


Für alle v, w, u P R3 und λ P R gilt:
(a) 〈v × w, v〉 = 〈v × w, w〉 = 0 (Orthogonalität)
(b) v × w = − (w × v) (Antikommutativität)
(c) (λv) × w = λ (v × w), (v + u) × w = v × w + u × w
v × (λw) = λ (v × w), v × (w + u) = v × w + v × u (Bilinearität)
(d) v × v = 0 (Alternation)
(e) v × (w × u) = 〈v, u〉 w − 〈v, w〉 u (Grassmann-Identität)
(f ) v × (w × u) + u × (v × w) + w × (u × v) = 0 (Jacobi-Identität)
(g) i v × w i = i v i i w i − 〈v, w〉
2 2 2 2
(Lagrange-Identität)

Die Eigenschaften ergeben sich durch Nachrechnen (wobei die letzten drei et-
was aufwendiger zu beweisen sind). Die erste Eigenschaft besagt, dass v × w eine
Lösung unseres Gleichungssystems (I), (II) ist. Nach der Lagrange-Identität ist
v × w vom Nullvektor verschieden, wenn die Vektoren v und w nicht kollinear
sind (denn sind v und w kollinear, so ist 〈v, w〉2 = i v i 2 i w i2 ). Damit erhalten wir:

Korollar (orthogonale Gerade einer Ebene durch 0)


Sei E = span(v, w) eine Ebene im R3 durch den Nullpunkt. Dann gilt:
span(v × w) = { u P R2 | u steht senkrecht auf allen Vektoren von E }.

Das Kreuzprodukt ist nicht kommutativ. Vertauschen wir die Reihenfolge, so


ändert sich das Vorzeichen. Auch die Assoziativität ist verletzt:

Beispiel
Seien v = (1, 1, 2), w = (2, 1, 1) und u = (1, 0, 2). Dann gilt:
v × (w × u) = (1, 1, 2) × (2, −3, −1) = (5, 5, −5)
(v × w) × u = (−1, 3, −1) × (1, 0, 2) = (6, 1, −3)
Das Kreuzprodukt ist also, im Gegensatz zu vielen anderen Operationen in
der Mathematik, nicht assoziativ.

Aufgrund der Bilinearität ist distributives Ausmultiplizieren möglich:


v × w = (v1 e1 + v2 e2 + v3 e3 ) × (w1 e1 + w2 e2 + w3 e3 ) = ∑ 1 ≤ i,j ≤ 3 vi wj (ei × ej ).
Damit ist das Kreuzprodukt durch die Werte ei × ej eindeutig festgelegt.

© Oliver Deiser Grundzüge der Höheren Mathematik


318 4. Abschnitt Vektoren

Norm und Richtung des Kreuzprodukts

Wir wissen, dass v × w senkrecht auf v und w steht. Nun untersuchen wir die
die Länge und Richtung des Kreuzprodukts genauer.

Satz (Norm des Kreuzprodukts)


Für alle v, w P R3 ist i v × w i der Flächeninhalt des von v und w aufgespann-
ten Parallelogramms
P = { λ v + µ w | λ, µ P [ 0, 1 ] }.
Für v, w ≠ 0 gilt also
i v × w i = i v i i w i sin(ϕ) mit ϕ = ](v, w) P [ 0, π ].

Beweis
Gilt v = 0 oder w = 0, so ist v × w der Nullvektor mit Länge 0, und die
Fläche von P ist ebenfalls gleich 0. Seien also v, w ≠ 0 und ϕ = ](v, w),
sodass sin ϕ ≥ 0. Nach der Lagrange-Identität und der Winkelformel gilt

iv × wi 2 = i v i 2 i w i 2 − 〈v, w〉2

= iv i 2 iw i 2 − cos2 ϕ i v i 2 iw i 2

= i v i 2 i wi 2 (1 − cos2 ϕ) = iv i 2 i w i 2 sin2 ϕ.

Die Fläche von P berechnet sich elementargeometrisch nach der Formel


„Grundseite mal Höhe“ zu i v i i w i sin ϕ. Dies zeigt die Behauptung.

Die Richtung des Kreuzprodukts können wir mit einigen Verrenkungen er-
mitteln durch:

Rechte-Hand-Regel
Zeigt v in Richtung des Daumens und w in Richtung des Zeigefingers der
rechten Hand, so zeigt v × w in Richtung des Mittelfingers der rechten
Hand, wenn dieser senkrecht auf Daumen und Zeigefinger steht. Die
Vektoren v, w und v × w bilden damit ein Rechtssystem. Analog bilden die
Vektoren v, w und w × v ein Linkssystem (mit w × v = − v × w).

Diese Regel lässt sich daumenfrei mit Hilfe von Rotationen mathematisch
exakt formulieren und beweisen. Uns genügt die anschauliche Formulierung.

Beispiele
Der Leser überprüfe die Richtungen mit Hilfe der Rechten-Hand-Regel:
e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 , e2 × e1 = −e3 , e3 × e2 = −e1 , e1 × e3 = −e2 .

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt 319

Ebenen als algebraische Flächen ersten Grades

Im letzten Kapitel hatten wir gesehen, dass die affinen Geraden der Ebene ge-
nau den algebraischen Kurven ersten Grades entsprechen. Wir formulieren nun
ein analoges Resultat für die Ebenen im dreidimensionalen Raum.

Definition (algebraische Fläche ersten Grades)


Eine Menge A ⊆ R3 heißt eine algebraische Fläche ersten Grades, falls es
a, b, c, d P R gibt mit (a, b, c) ≠ 0 und
A = { (x, y, z) P R3 | ax + by + cz + d = 0 }.

Ist A wie in der Definition, so gilt


A = { (x, y, z) P R3 | 〈(a, b, c), (x, y, z)〉 = −d }.
Die Menge A besteht also aus allen Punkten des Raumes, deren Skalarprodukt
mit dem Vektor (a, b, c) den konstanten Wert −d besitzt. Wir erhalten:

Satz (affine Ebenen als algebraische Flächen)


Die affinen Ebenen des R3 sind genau die algebraischen Flächen ersten
Grades. Die Ebenen durch 0 entsprechen dabei den algebraischen Flächen
mit dem Parameter d = 0. Genauer gilt:
(1) Ist E = w + span(u1 , u2 ) eine affine Ebene und (a, b, c) = u1 × u2 , so gilt
E = { (x, y, z) P R2 | ax + by + cz − 〈(a, b, c), w〉 = 0 }
(2) Ist A = { (x, y, z) | ax + by + cz + d = 0 } eine algebraische Fläche, so gilt
A = w + span(u1 , u2 ),
wobei w P A beliebig ist und u1 , u2 zwei nicht kollineare Vektoren sind,
die senkrecht auf (a, b, c) stehen.

Konkret sind in (2) geeignet:


w = (−d/a, 0, 0) u1 = (c, 0, −a) u2 = (b, −a, 0) falls a ≠ 0
w = (0, −d/b, 0) u1 = (0, c, −b) u2 = (−b, a, 0) falls b ≠ 0
w = (0, 0, −d/c) u1 = (0, −c, b) u2 = (−c, 0, a) falls c ≠ 0
Die Formel d = −〈(a, b, c), w〉 für den Parameter d lässt sich leicht einsehen:
Soll die Ebene E durch die Gleichung ax + by + cz = −d definiert werden, so
muss wegen w P E gelten, dass 〈(a, b, c), w〉 = aw1 + bw2 + cw3 = −d.
Die Darstellung einer Ebene E ⊆ R3 durch 0 in der Form
E = { (x, y, z) P R3 | ax + by + cz = 0 }
nennen wir auch eine Orthogonaldarstellung von E.

© Oliver Deiser Grundzüge der Höheren Mathematik


320 4. Abschnitt Vektoren

Übungen

Übung 1
Berechnen Sie:
(a) (1, 0, 1) × (1, 1, 1), (1, 2, 3) × (−1, 2, −3)
(b) den Flächeninhalt A des von den Punkten (1, 0, 1), (2, 2, 3) und
(3, 4, 4) gebildeten Dreiecks im R3
(c) die Darstellung der affinen Ebene
E = (1, 1, 2) + span((1, 0, 1), (2, 2, −1))
durch eine algebraische Fläche
A = { (x, y, z) P R3 | ax + by + cz + d = 0 }
(d) die Darstellung der algebraischen Fläche
A = { (x, y, z) P R3 | x + y − 2z + 3 = 0 }
durch eine affine Ebene E = w + span(u1 , u2 )

Übung 2
Seien v, w, u P R3 . Wir betrachten den von v, w, u aufgespannten Spat
P = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P [ 0, 1 ] } ⊆ R3
Zeichnen Sie ein Diagramm zur Illustration von P und begründen Sie
damit die Formel
V(P) = |〈v × w, u〉|
für das Volumen von P.

Übung 3
Seien v = (x1 , y1 , z1 ), w = (x2 , y2 , z2 ) P R3 . Zeigen Sie:
(a) 〈v × w, v〉 = 0
(b) v × w = − (w × v)
(c) v × v = 0

Übung 4
Seien E = w + span(u1 , u2 ), E′ = w′ + span(u1 ′, u2 ′) zwei affine Ebenen des
R3 , und sei u = (u1 × u2 ) × (u1 ′ × u2 ′) ≠ 0. Welche anschauliche geometrische
Bedeutung hat u? Begründen Sie Ihre Antwort.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt 321

Lösungen zu den Übungen

Übung 1
Berechnen Sie:
(a) (1, 0, 1) × (1, 1, 1), (1, 2, 3) × (−1, 2, −3)
(b) den Flächeninhalt A des von den Punkten (1, 0, 1), (2, 2, 3) und
(3, 4, 4) gebildeten Dreiecks im R3
(c) die Darstellung der affinen Ebene
E = (1, 1, 2) + span((1, 0, 1), (2, 2, −1))
durch eine algebraische Fläche
A = { (x, y, z) P R3 | ax + by + cz + d = 0 }
(d) die Darstellung der algebraischen Fläche
A = { (x, y, z) P R3 | x + y − 2z + 3 = 0 }
durch eine affine Ebene E = w + span(u1 , u2 )

Lösung zu Übung 1
zu (a): Es gilt
(1, 0, 1) × (1, 1, 1) = (−1, 0, 1), (1, 2, 3) × (−1, 2, −3) = (−12, 0, 4).
zu (b): Der Flächeninhalt ist die Hälfte des Flächeninhalts des von den
Vektoren v = (2, 2, 3) − (1, 0, 1) und w = (3, 4, 4) − (1, 0, 1) aufgespann-
ten Parallelogramms, sodass A = i v × w i/2. Es gilt
v × w = (1, 2, 2) × (2, 4, 3) = (−2, 1, 0)
A = i v × w i/2 = £5/2.

zu (c): Wir setzen


(a, b, c) = (1, 0, 1) × (2, 2, −1) = (−2, 3, 2),
− d = 〈(−2, 3, 2), (1, 1, 2)〉 = 5.
Dann gilt
E = { (x, y, z) P R3 | −2x + 3y + 2z − 5 = 0 }.

zu (d): Mit (a, b, c) = (1, 1, −2), d = 3 setzen wir


w = (−d/a, 0, 0) = (−3, 0, 0),
u1 = (c, 0, −a) = (−2, 0, −1), u2 = (b, −a, 0) = (1, −1, 0).
Dann gilt A = w + span(u1 , u2 ).

© Oliver Deiser Grundzüge der Höheren Mathematik


322 4. Abschnitt Vektoren

Übung 2
Seien v, w, u P R3 . Wir betrachten den von v, w, u aufgespannten Spat
P = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P [ 0, 1 ] } ⊆ R3
Zeichnen Sie ein Diagramm zur Illustration der Menge P und begründen
Sie damit die Formel
V(P) = |〈v × w, u〉|
für das Volumen von P.

Lösung zu Übung 2

Die Grundfläche g des Spats ist der Inhalt des von v und w aufgespannten
Parallelogramms, sodass
g = i v × w i.
Ist g = 0, so ist die Formel klar (mit V(P) = 0). Sei also g ≠ 0. Dann ist
prv × w (u) = 1/g2 〈v × w, u〉 (v × w)
der auf der Grundfläche senkrecht stehende Höhenvektor des Spats, sodass

h = |〈v × w, u〉|
g
seine Höhe ist. Damit erhalten wir
V(P) = g h = |〈v × w, u〉|.

Grundzüge der Höheren Mathematik © Oliver Deiser


5. Ebenen und Kreuzprodukt 323

Übung 3
Seien v = (x1 , y1 , z1 ), w = (x2 , y2 , z2 ) P R3 . Zeigen Sie:
(a) 〈v × w, v〉 = 0
(b) v × w = − (w × v)
(c) v × v = 0

Lösung zu Übung 3
zu (a): Es gilt

v × w = (y1 z2 − y2 z1 , x2 z1 − x1 z2 , x1 y2 − x2 y1 )

〈v, v × w〉 = x1 (y1 z2 − y2 z1 ) + y1 (x2 z1 − x1 z2 ) + z1 (x1 y2 − x2 y1 )

= x1 y1 z2 − x1 y2 z1 + y1 x2 z1 − y1 x1 z2 + z1 x1 y2 − z1 x2 y1

= 0 + 0 + 0 = 0.

Die sechs Summanden in der zweiten Zeile haben sich paarweise auf.

zu (b): Es gilt

〈v × w〉 = (y1 z2 − y2 z1 , x2 z1 − x1 z2 , x1 y2 − x2 y1 )

− 〈w × v〉 = − (y2 z1 − y1 z2 , x1 z2 − x2 z1 , x2 y1 − x1 y2 )
= (y1 z2 − y2 z1 , x2 z1 − x1 z2 , x1 y2 − x2 y1 ).

Die beiden Vektoren stimmen überein. (Bemerkung: Der Vektor w × v


geht aus v × w durch einen Tausch der Indizes 1 und 2 hervor.)

zu (c): Es gilt

v × v = (y1 z1 − y1 z1 , x1 z1 − x1 z1 , x1 y1 − x1 y1 ) = (0, 0, 0) = 0.

© Oliver Deiser Grundzüge der Höheren Mathematik


324 4. Abschnitt Vektoren

Übung 4
Seien E = w + span(u1 , u2 ), E′ = w′ + span(u1 ′, u2 ′) zwei affine Ebenen des
R3 , und sei u = (u1 × u2 ) × (u1 ′ × u2 ′) ≠ 0. Welche anschauliche geometrische
Bedeutung hat u? Begründen Sie Ihre Antwort.

Lösung zu Übung 4
Der Vektor u ist der Richtungsvektor der Schnittgeraden der beiden
Ebenen, d. h. es gilt
E1 ∩ E2 = w* + span(u),
wobei w* P E1 ∩ E2 beliebig ist.
Begründung
Der Vektor u steht senkrecht auf u1 × u2 , sodass u P span(u1 , u2 ).
Analog gilt u P span(u1 ′, u2 ′). Nach Voraussetzung ist u ≠ 0, sodass
span(u1 , u2 ) ≠ span(u1 ′, u2 ′) und
span(u1 , u2 ) ∩ span(u1 ′, u2 ′) = span(u).
Ist nun w* P E1 ∩ E2 , so gilt
E1 ∩ E2 = (w* + span(u1 , u2 )) ∩ (w* + span(u1 ′, u2 ′))
= w* + (span(u1 , u2 ) ∩ span(u1 ′, u2 ′))
= w* + span(u).

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit

In diesem Kapitel diskutieren wir wichtige Grundbegriffe der allgemeinen


Vektorraumtheorie für die reellen und komplexen Räume Rn und Cn . Im Zen-
trum steht die lineare Unabhängigkeit von Vektoren v1 , …, vk . Sie besagt, dass
sich keiner der Vektoren v1 , …, vk als Linearkombination der anderen darstel-
len lässt. Lassen sich alle Vektoren des Raumes darstellen, so sprechen wir von
einem Erzeugendensystem. Die Kombination „linear unabhängig“ und „erzeu-
gend“ führt uns zum Begriff einer Basis. Mit Hilfe einer Basis können wir jeden
Vektor des Raumes eindeutig darstellen. Dadurch entsteht ein (im Allgemeinen
schiefwinkliges und nicht normiertes) Koordinatensystem des Vektorraumes.

Schlüsselbegriffe
Spann (allgemein)
Linearkombination
Lineare Unabhängigkeit
Basis
Koordinatenvektor

© Oliver Deiser Grundzüge der Höheren Mathematik


326 4. Abschnitt Vektoren

Spann und Linearkombinationen

Wir verallgemeinern zunächst den Begriff des Spanns, den wir bislang für ei-
nen und zwei Vektoren betrachtet hatten, auf endlich viele Vektoren:

Definition (Spann, Linearkombination)


Seien v1 , …, vk P Rn . Dann heißt die Menge
span(v1 , …, vk ) = { λ1 v1 + … + λk vk | λ1 , …, λk P R } ⊆ Rn
der Spann oder das Erzeugnis von v1 , …, vk . Jeden Vektor
λ1 v1 + … + λk vk
des Spanns nennen wir auch eine Linearkombination von v1 , …, vk .

Beispiele
(1) Im R4 gilt
(2, −2, −3, −1) = 2 (1, 2, 0, 1) + 0 (1, −1, 2, 0) − 3 (0, 2, 1, 1).
Der Vektor (2, −2, −3, −1) ist also eine Linearkombination der
Vektoren (1, 2, 0, 1), (1, −1, 2, 0), (0, 2, 1, 1).
(2) Im R6 gilt
span(e1 , e3 , e6 ) = { (λ1 , 0, λ2 , 0, 0, λ3 ) | λ1 , λ2 , λ3 P R }, wobei
e1 = (1, 0, 0, 0, 0, 0), e3 = (0, 0, 1, 0, 0, 0), e6 = (0, 0, 0, 0, 0, 1).

Ist { w1 , …, wr } ⊆ { v1 , …, vk }, so gilt span(w1 , …, wr ) ⊆ span(v1 , …, vk ). Die


Inklusion ist hier im Allgemeinen nicht echt, da zum Beispiel span(v, v) = span(v)
und span(v, w, v + w) = span(v, w).
Leicht nachzuweisen ist:

Satz (Eigenschaften des Spanns)


Seien v1 , …, vk P Rn , und sei U = span(v1 , …, vk ). Dann gilt für alle u, w P U
und λ P R:
(a) 0 P U
(b) λu P U
(c) u + w P U

Der Spann ist also abgeschlossen unter der Skalierung und Addition zweier
Vektoren: Diese Operationen führen nicht aus dem Spann heraus. Allgemeiner
ergibt sich, dass jede Linearkombination von Vektoren des Spanns wieder im
Spann liegt.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 327

Lineare Unabhängigkeit

Definition (linear unabhängig)


Seien v1 , …, vk P Rn . Dann heißt (v1 , …, vk ) linear unabhängig, falls für alle
λ1 , …, λk P R gilt:
λ1 v1 + … + λk vk = 0 impliziert λ1 = … = λk = 0.
Andernfalls heißt (v1 , …, vk ) linear abhängig.

Die immer mögliche Linearkombination


0 = 0 v1 + … + 0 vk
nennen wir auch die triviale Darstellung des Nullvektors. Die Bedingung der
Definition der linearen Unabhängigkeit besagt, dass sich der Nullvektor nur
trivial mit Hilfe der Vektoren v1 , …, vk darstellen lässt.
Statt „(v1 , …, vk ) ist linear unabhängig“ sagen wir auch „v1 , …, vk sind linear
unabhängig“, um die Sprechweise zu vereinfachen. Die lineare Unabhängigkeit
kommt aber nicht jedem betrachteten Vektor zu (wie bei „n1 , …, nk sind gerade
Zahlen“), sondern sie ist eine Eigenschaft der Vektoren als Ganzes.

Beispiele
(1) In der Ebene R2 gilt
2 (1, 4) + (−1) (2, 8) = 2 (1, 4) − (2, 8) = 0.
Der Nullvektor lässt sich also mit Hilfe von (1, 4) und (2, 8) nichttrivial
darstellen. Die beiden Vektoren sind linear abhängig.
(2) Die Vektoren (1, 1), (0, 1) der Ebene R2 sind linear unabhängig. Denn
sind λ, µ P R mit
0 = λ (1, 1) + µ (0, 1) = (λ, λ + µ),
so gilt λ = 0 und λ + µ = 0, so dass λ = µ = 0.
(3) Im R3 gilt
(0, 3, −9) + 3 (1, 0, 2) − 3 (1, 1, −1) = 0
Die Vektoren (0, 3, −9), (1, 0, 2), (1, 1, −1) sind also linear abhängig.
(4) Sind v1 , …, vk P Rn und gilt v1 = 0, so sind v1 , …, vk linear abhängig.
Denn wegen v1 = 0 ist
1 v1 + 0 v2 + … + 0 vk = 0
eine nichttriviale Nulldarstellung. Allgemein sind Vektoren v1 , …, vk
linear abhängig, wenn mindestens einer der beteiligten Vektoren der
Nullvektor ist. Der Nullvektor selbst ist linear abhängig.

© Oliver Deiser Grundzüge der Höheren Mathematik


328 4. Abschnitt Vektoren

Lineare Unabhängigkeit in der Ebene und im Raum

Für die Ebene gilt die folgende anschauliche und nicht schwer zu beweisende
Charakterisierung:

Satz (lineare Unabhängigkeit in der Ebene)


Für alle v1 , v2 , v3 P R2 gilt:
(1) v1 ist genau dann linear unabhängig, wenn v1 ≠ 0.
(2) v1 , v2 sind genau dann linear unabhängig, wenn v1 , v2 nicht auf einer
gemeinsamen Geraden durch den Nullpunkt liegen (d. h. v1 , v2 sind
nicht kollinear).
(3) v1 , v2 , v3 sind linear abhängig.

Das analoge Ergebnis für den dreidimensionalen Raum lautet:

Satz (lineare Unabhängigkeit im dreidimensionalen Raum)


Für alle v1 , v2 , v3 , v4 P R3 gilt:
(1) v1 ist genau dann linear unabhängig, wenn v1 ≠ 0.
(2) v1 , v2 sind genau dann linear unabhängig, wenn v1 , v2 nicht auf einer
gemeinsamen Geraden durch den Nullpunkt liegen (d. h. v1 , v2 sind
nicht kollinear).
(3) v1 , v2 , v3 sind genau dann linear unabhängig, wenn v1 , v2 , v3 nicht in
einer gemeinsamen Ebene durch den Nullpunkt liegen.
(4) v1 , v2 , v3 , v4 sind linear abhängig.

Anschaulich formuliert sind also k Vektoren in der Ebene oder im dreidimen-


sionalen Raum genau dann linear unabhängig, wenn ihr Spann ein geometri-
sches Gebilde der Dimension k ist. Drei Vektoren des R2 und vier Vektoren des
R3 sind immer linear abhängig. Allgemeiner gilt, dass n+1 Vektoren des Rn linear
abhängig sind.

Beispiel
Sei E = w + span(u1 , u2 ) eine affine Ebene im R3 . Nach Definition sind
u1 , u2 linear unabhängig. Die drei beteiligten Vektoren w, u1 , u2 sind genau
dann linear unabhängig, wenn der Nullpunkt nicht in der Ebene liegt. Es
gilt zum Beispiel
(1, 1, 1) + span((1, 1, 0), (0, 0, 1)) = 0 + span((1, 1, 0), (0, 0, 1))
= span((1, 1, 0), (0, 0, 1)).
Die Vektoren (1, 1, 1), (1, 1, 0), (0, 0, 1) sind linear abhängig.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 329

Eine Charakterisierung über den Spann

Die Definition über die triviale Nulldarstellung ist algebraisch elegant, ein-
fach und in Beweisen leicht zu handhaben. Etwas anschaulicher ist aber vielleicht
die folgende Formulierung der linearen Unabhängigkeit:
„Keiner der Vektoren kann mit Hilfe der anderen Vektoren dargestellt werden.“
Der folgende Satz besagt, dass diese Anschauung korrekt ist:

Satz (lineare Unabhängigkeit und Spann)


Seien v1 , …, vk P Rn . Dann sind äquivalent:
(a) v1 , …, vk sind linear unabhängig.
(b) Kein Vektor vi liegt im Spann der übrigen Vektoren.

Beweis
(a) impliziert (b):
Wir führen den Beweis indirekt (d. h. wir zeigen non(b) impliziert
non(a)). Liegt v1 im Spann von v2 , …, vk , so gibt es λ2 , …, λk P R mit
v1 = λ2 v2 + … + λk vk .
Dann ist
− v1 + λ2 v2 + … + λk vk = 0
eine nichttriviale Nulldarstellung, sodass v1 , …, vk linear abhängig sind.
Analoges gilt, wenn ein anderer Vektor im Spann der übrigen liegt.
(b) impliziert (a):
Wir führen den Beweis wieder indirekt. Sei also
λ1 v1 + … + λk vk = 0
eine nichttriviale Nulldarstellung. Dann ist einer der Koeffizienten λi
von Null verschieden. Ist λ1 ≠ 0, so gilt
−λ2 −λk
v1 = v2 + … + vk .
λ1 λ1
Also liegt v1 im Spann von v2 , …, vk . Analoges gilt, wenn ein anderer
Skalar ungleich 0 ist.

Vektoren v1 , …, vk sind nach dem Satz genau dann linear unabhängig, wenn
das Streichen eines beliebigen Vektors den Spann verkleinert. Die lineare Unab-
hängigkeit von v1 , …, vk können wir damit kurz so formulieren:
Jeder Vektor ist wichtig.

© Oliver Deiser Grundzüge der Höheren Mathematik


330 4. Abschnitt Vektoren

Basen

Der Spann von Vektoren ist im Allgemeinen eine echte Teilmenge des Rau-
mes. Er kann aber auch der ganze Raum sein:

Definition (erzeugend)
Seien v1 , …, vk P Rn . Dann heißt (v1 , …, vk ) erzeugend oder ein Erzeugen-
densystem, falls span(v1 , …, vk ) = Rn .

Wie bei der linearen Unabhängigkeit sagen wir auch: „v1 , …, vk sind erzeugend“.
Einer der wichtigsten Begriffe der Vektorraumtheorie ist:

Definition (Basis)
Seien v1 , …, vk P Rn . Dann heißt (v1 , … vk ) eine Basis des Rn , falls gilt:
(a) v1 , …, vk sind linear unabhängig.
(b) v1 , …, vk sind erzeugend.

Beispiel
(1) (e1 , …, en ) ist eine Basis des Rn (die sog. kanonische Basis oder Standard-
basis).
(2) Die Vektoren (1, 0), (1, 1) bilden eine Basis im R2 .
(3) Ist α ≠ 0, so bilden die Vektoren (1, 0, 0), (0, 1, 0) und (0, 0, α) eine
Basis im R3 .

Die kanonische Basis hat besonders gute Eigenschaften: Die Vektoren sind
normiert und sie stehen paarweise senkrecht aufeinander. Eine solche Basis
nennt man auch eine Orthonormalbasis. Im Allgemeinen können Basisvektoren
aber eine beliebige positive Länge haben und jeden von 0 und π verschiedenen
Winkel miteinander einschließen.
Wie erwartet kann man zeigen:

Satz (Länge einer Basis)


Sei n ≥ 1. Dann besteht jede Basis des Rn aus genau n Vektoren. Weiter gilt:
(1) Je n linear unabhängige Vektoren v1 , …, vn des Rn bilden eine Basis.
(2) Je n erzeugende Vektoren v1 , …, vn des Rn bilden eine Basis.

Wollen wir also zeigen, dass n gegebene Vektoren des Rn eine Basis bilden, so
genügt der Nachweis der linearen Unabhängigkeit oder alternativ der Nachweis,
dass die Vektoren den Rn erzeugen. Die zweite Eigenschaft ist automatisch rich-
tig. Hierzu ist es wesentlich, dass die Anzahl der Vektoren mit der Dimension des
Raumes übereinstimmt.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 331

Koordinatenvektoren

Die kanonische Basis e1 , …, en des Rn erzeugt ein Koordinatengitter, mit dem


wir jeden Vektor messen können. Allgemeiner gilt dies für jede Basis:

Definition (Koordinatenvektor)
Sei (v1 , …, vn ) eine Basis des Rn . Weiter seien u P Rn und λ1 , …, λn P R
mit
u = λ1 v1 + … + λn vn .
Dann heißt der Vektor (λ1 , …, λn ) P Rn der Koordinatenvektor von u bzgl. der
Basis (v1 , …, vn ) des Rn .

Ein Koordinatenvektor ist eindeutig bestimmt. Denn ist


u = λ1 v1 + … + λn vn und u = µ1 v1 + … + µn vn , so gilt
0 = u − u = (λ1 − µ1 ) v1 + … + (λn − µn ) vn .
Da v1 , …, vn linear unabhängig sind, ist diese Nulldarstellung trivial, d. h. es gilt
λi = µi für alle i = 1, …, n.

Beispiel
(1) Der Koordinatenvektor von v P R3 bzgl. (e1 , e2 , e3 ) ist v selbst. Denn
es gilt v = (v1 , v2 , v3 ) = v1 e1 + v2 e2 + v3 e3 .
(2) Es gilt (1, −2) = 3(1, 0) − 2(1, 1). Damit ist (3, −2) der Koordinatenvek-
tor von (1, −2) bzgl. der durch (1, 0), (1, 1) gebildeten Basis.

Berechnung des Koordinatenvektors


Sind ein Vektor u und eine Basis (v1 , …, vn ) des Rn gegeben, so finden wir den
Koordinatenvektor von u bzgl. dieser Basis durch das Lösen eines linearen
Gleichungssystems mit n Gleichungen und n Unbekannten λ1 , …, λn :
λ1 v11 + λ2 v12 + … + λn v1n = u1
λ1 v21 + λ2 v22 + … + λn v2n = u2

λ1 vn1 + λ2 vn2 + … + λn vnn = un
Dabei gilt
v1 = (v11 , …, v1n ), …, vn = (vn1 , …, vnn ) und u = (u1 , …, un ).
Die Lösung eines solchen Gleichungssystem mit Hilfe von Matrizen
besprechen wir im folgenden Kapitel.

© Oliver Deiser Grundzüge der Höheren Mathematik


332 4. Abschnitt Vektoren

Komplexe Vektorräume

Die neuen Begriffe können unverändert für die komplexen Vektorräume Cn


übernommen werden. Sowohl die Einträge der Vektoren als auch die Skalare
sind nun komplexe Zahlen. Je n linear unabhängige (alternativ: erzeugende)
Vektoren v1 , …, vn des Cn bilden eine Basis des Cn . Jeder Vektor u des Cn hat
einen eindeutigen Koordinatenvektor bzgl. einer Basis (v1 , …, vn ) des Cn . Der
Koordinatenvektor ist wieder ein Vektor des Cn .
Fassen wir wie üblich einen Vektorraum Rn als einen Teilraum des Cn auf, so
sind linear unabhängige Vektoren des Rn auch linear unabhängig in Cn . Um dies
einzusehen, nehmen wir an, dass
0 = λ1 v1 + … + λk vk mit λ1 , …, λk P C, v1 , …, vk P Rn .
Dann gilt
0 = Re(λ1 ) v1 + … + Re(λk ) vk
0 = Im(λ1 ) v1 + … + Im(λk ) vk
mit reellen Skalaren. Sind v1 , …, vk linear unabhängig im Rn , so gilt
Re(λi ) = Im(λi ) = 0 für alle i = 1, …, n,
sodass alle λi gleich 0 sind. Dies zeigt, dass die Vektoren v1 , …, vk auch linear un-
abhängig in Cn sind. Insbesondere ist jede Basis des Rn auch eine Basis des Cn .
Daneben besitzt der Cn viele weitere Basen aus Vektoren mit komplexen Einträ-
gen.

Beispiele
(1) Die Basis ((1, 0), (1, 1)) der Ebene R2 ist auch eine Basis des komplexen
Vektorraumes C2 . Für jeden Vektor (z, w) P C2 gilt
(z, w) = z e1 + w e2 .
(2) Die Vektoren (1, 0), (0, i) bilden ebenfalls eine Basis des komplexen
Vektorraumes C2 . Für jeden Vektor (z, w) P C2 gilt
(z, w) = z (1, 0) − iw (0, i).
Damit ist (z, −iw) der Koordinatenvektor von (z, w) bzgl. der Basis
((1, 0), (0, i)).

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 333

Übungen

Übung 1
Berechnen Sie:
(a) eine nichttriviale Nulldarstellung für die Vektoren
v1 = (1, 2), v2 = (−1, 1), v3 = (3, 4)
der Ebene R2
(b) den Koordinatenvektor des Vektors (10, 10) bzgl. der durch die
Vektoren v1 = (1, 2) und v2 = (2, −1) gebildeten Basis der Ebene R2
(c) den Koordinatenvektor des Vektors (i, 2i) bzgl. der durch die
Vektoren v1 = (1, 2 + i) und v2 = (0, i) gebildeten Basis des C2

Übung 2
Seien v1 , …, vk P Rn . Weiter sei U = span(v1 , …, vk ). Zeigen Sie, dass für
alle u, w P U und λ P R gilt:
(a) 0 P U
(b) λu P U
(c) u + w P U

Übung 3
Illustrieren Sie das durch die Vektoren v1 = (1, 0) und v2 = (1, 1) erzeugte
Koordinatensystem der Ebene R2 durch ein Diagramm. Tragen Sie zudem
zwei Vektoren u und w ein und geben Sie die Koordinatenvektoren von u
und w bzgl. der Basis (v1 , v2 ) an.

Übung 4
Geben Sie eine Basis (v1 , v2 ) des R2 an mit den Eigenschaften:
(a) Die Vektoren der Basis sind normiert, d. h. es gilt
i v1 i = i v2 i = 1.
(b) Die Vektoren der Basis stehen senkrecht aufeinander, d. h.
v1 und v2 sind orthogonal.
(c) Die Basis enthält keine kanonischen Basisvektoren, d. h. es gilt
{ v1 , v2 } ∩ { e1 , e2 } = ∅.
Weisen Sie die Eigenschaften (a) und (b) kurz nach.

© Oliver Deiser Grundzüge der Höheren Mathematik


334 4. Abschnitt Vektoren

Lösungen zu den Übungen

Übung 1
Berechnen Sie:
(a) eine nichttriviale Nulldarstellung für die Vektoren v1 = (1, 2),
v2 = (−1, 1), v3 = (3, 4) der Ebene R2
(b) den Koordinatenvektor des Vektors (10, 10) bzgl. der durch die
Vektoren v1 = (1, 2) und v2 = (2, −1) gebildeten Basis der Ebene R2
(c) den Koordinatenvektor des Vektors (i, 2i) bzgl. der durch die
Vektoren v1 = (1, 2 + i) und v2 = (0, i) gebildeten Basis des C2

Lösung zu Übung 1
zu (a): Wir suchen λ1 , λ2 , λ3 P R mit (λ1 , λ2 , λ3 ) ≠ 0 und
λ1 (1, 2) + λ2 (−1, 1) + λ3 (3, 4) = 0.
Gesucht ist also eine nichttriviale Lösung des Gleichungssystems
λ1 − λ2 + 3λ3 = 0
2λ1 + λ2 + 4λ3 = 0
in den reellen Unbestimmten λ1 , λ2 , λ3 . Wir setzen λ3 = 1 und lösen
λ1 − λ2 = −3
2λ1 + λ2 = −4
Subtraktion des Zweifachen der ersten Gleichung von der zweiten
liefert 3λ2 = 2, sodass λ2 = 2/3. Einsetzen in die erste Gleichung ergibt
λ1 = 2/3 − 3 = − 7/3. Also ist λ1 = −7/3, λ2 = 2/3, λ3 = 1 wie gewünscht.
zu (b): Wir suchen λ, µ P R mit λ (1, 2) + µ(2, −1) = (10, 10), d. h.
λ + 2µ = 10
2λ − µ = 10
Subtraktion des Zweifachen der ersten Gleichung von der zweiten
liefert −5µ = −10, sodass µ = 2. Einsetzen in die erste Gleichung ergibt
λ = 10 − 2µ = 6. Also ist (6, 2) der gesuchte Koordinatenvektor.

zu (c): Wir suchen λ, µ P C mit λ(1, 2 + i) + µ(0, i) = (i, 2i), d. h.


λ + 0µ = i (sodass λ = i)
(2 + i)λ + iµ = 2i
Einsetzen von λ = i in die zweite Gleichung ergibt iµ = 2i − (2 + i)i = −i2 = 1,
sodass µ = 1/i = −i. Damit ist (i, −i) der gesuchte Koordinatenvektor.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 335

Übung 2
Seien v1 , …, vk P Rn . Weiter sei U = span(v1 , …, vk ). Zeigen Sie, dass für
alle u, w P U und λ P R gilt:
(a) 0 P U
(b) λu P U
(c) u + w P U

Lösung zu Übung 2
zu (a):
Es gilt
0 = 0 v1 + … + 0 vk P U.
zu (b):
Seien u P U und λ P R. Wegen u P U gibt es λ1 , …, λk P R mit
u = λ1 v1 + … + λk vk .
Dann gilt
λu = λ(λ1 v1 + … + λk vk ) = (λλ1 ) v1 + … + (λ λk ) vk P U.

zu (c): Seien u, w P U. Dann gibt es λ1 , …, λk P R und µ1 , … µk P R mit


u = λ1 v1 + … + λk vk ,
w = µ1 v1 + … + µk vk .
Dann gilt
u + w = λ1 v1 + … + λk vk + µ1 v1 + … + µk vk

= (λ1 + µ1 ) v1 + … + (λk + µk ) vk P U.

Bemerkung:
Bei dieser Argumentation verwenden wir unter anderem:
(i) die Abgeschlossenheit der Skalare unter Addition und Multipli-
kation
(ii) das Kommutativgesetz der Vektoraddition
(iii) das Distributivgesetz für die Skalarmultiplikation
(iv) die Eigenschaften 0v = 0 und λ(µv) = (λµ)v der Skalarmultiplika-
tion

© Oliver Deiser Grundzüge der Höheren Mathematik


336 4. Abschnitt Vektoren

Übung 3
Illustrieren Sie das durch die Vektoren v1 = (1, 0) und v2 = (1, 1) erzeugte
Koordinatensystem der Ebene R2 durch ein Diagramm. Tragen Sie zudem
zwei Vektoren u und w ein und geben Sie die Koordinatenvektoren von u
und w bzgl. der Basis (v1 , v2 ) an.

Lösung zu Übung 3

u
2

v2
1

v1

-2 -1 1 2 3 4 5

-1
w

-2

-3

Die Vektoren v1 und v2 erzeugen ein schiefwinkliges Koordinatenssystem.


Der Vektor u = (4, 2) hat in diesem System die Koordinaten (2, 2), der Vektor
w = (3, −1) hat die Koordinaten (4, −1). Die Koordinaten lassen sich aus dem
Diagramm mit Hilfe des Koordinatengitters ohne Rechnung ablesen.

Grundzüge der Höheren Mathematik © Oliver Deiser


6. Lineare Unabhängigkeit 337

Übung 4
Geben Sie eine Basis (v1 , v2 ) des R2 an mit den Eigenschaften:
(a) Die Vektoren der Basis sind normiert, d. h. es gilt
i v1 i = i v2 i = 1.
(b) Die Vektoren der Basis stehen senkrecht aufeinander, d. h.
v1 und v2 sind orthogonal.
(c) Die Basis enthält keine kanonischen Basisvektoren, d. h. es gilt
{ v1 , v2 } ∩ { e1 , e2 } = ∅.
Weisen Sie die Eigenschaften (a) und (b) kurz nach.

Lösung zu Übung 4
Wir drehen die kanonische Basis (e1 , e2 ) um π/4 gegen den Uhrzeigersinn.
Dies ergibt nach dem Satz des Pythagoras die Vektoren

v1 = λ(1, 1), v2 = λ(−1, 1) mit λ = 1/£2.

Die Vektoren v1 , v2 bilden eine Basis mit den gewünschten Eigenschaften.

zu (a): Es gilt

i v1 i = |λ| £12 + 12 = λ £2 = 1,

i v2 i = |λ| £(−1)2 + 12 = λ £2 = 1.

Dies zeigt, dass die Vektoren v1 und v2 normiert sind.

zu (b): Es gilt

〈v1 , v2 〉 = λ2 (1 ⋅ (−1) + 1 ⋅ 1) = λ2 ⋅ 0 = 0.

Dies zeigt, dass die Vektoren v1 und v2 orthogonal sind.

© Oliver Deiser Grundzüge der Höheren Mathematik


5. Abschnitt

Matrizen und
Lineare Gleichungssysteme

© Oliver Deiser Grundzüge der Höheren Mathematik


1. Matrizen

Eine Matrix ist eine Tabelle von Zahlen mit einer bestimmten Anzahl von Zeilen
und Spalten. Wie Vektoren tauchen Matrizen in der Mathematik an vielen Stel-
len auf. Sie eignen sich unter anderem
(1) zur Beschreibung linearer Abbildungen
(2) zur Lösung von linearen Gleichungssystemen
(3) zur Darstellung von Graphen in der diskreten Mathematik
(4) zur Behandlung von stochastischen Prozessen in der Wahrscheinlichkeits-
theorie
Wir konzentrieren uns hier auf die beiden ersten Aspekte. Bevor wir zu den An-
wendungen kommen, führen wir arithmetische Operationen ein, die es uns er-
lauben, mit Matrizen so zu rechnen wie mit Vektoren. Als eine ganz neuartige
Operation kommt die Multiplikation von Matrizen hinzu.

Schlüsselbegriffe
Matrix
Zeilenvektor, Spaltenvektor
Addition und Skalarmultiplikation für Matrizen
Matrix-Vektor-Produkt
Matrizenprodukt

© Oliver Deiser Grundzüge der Höheren Mathematik


342 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Matrizen und ihre Einträge

Definition (reelle Matrix)


Seien m, n ≥ 1. Eine doppelt indizierte Folge (ai,j )1 ≤ i ≤ m, 1 ≤ j ≤ n reeller Zahlen
heißt eine reelle m × n-Matrix mit den Einträgen ai,j . Wir setzen
Rm × n = { A | A ist eine reelle m × n-Matrix }.

Anschaulich formuliert ist eine Matrix ein rechteckiges Gebilde aus Zahlen. Ist
A P Rm × n , so sagen wir auch, dass A die Dimension m × n besitzt. Wir schreiben

a1,1 a1,2 … a1,n


a2,1 a2,2 … a2,n
A = = (ai,j )1 ≤ i ≤ m, 1 ≤ j ≤ n = (ai, j )i,j .
… … … …
am,1 am,2 … am,n

Die Matrix A hat m Zeilen und n Spalten. Bei einem Eintrag ai,j ist i ein Zeilenin-
dex und j ein Spaltenindex. Wir schreiben auch kurz aij statt ai, j . Die Vektoren
(a11 , …, a1n ), …, (am1 , …, amn ) P Rn
heißen die Zeilenvektoren von A. Analog heißen
(a11 , …, am1 ), …, (a1n , …, amn ) P Rm
die Spaltenvektoren von A. Umgekehrt können wir m Vektoren des Rn bzw. n
Vektoren des Rm verwenden, um eine Matrix zu bilden:

Notation: Strichpunkt und Komma


Sind v1 , …, vm P Rn , so ist A = (v1 , …, vm ) die Matrix mit den Zeilenvekto-
ren v1 , …, vm . Sind w1 , …, wn P Rm , so ist A = (w1 ; …; wn ) die Matrix mit
den Spalten w1 , …, wn .

Beispiele
1 2
( (1, 2), (3, 4) ) = ( (1, 3); (2, 4) ) = P R2 × 2
3 4

1 2 3
( (1, 2, 3), (4, 5, 6) ) = ( (1, 4); (2, 5); (3, 6) ) = P R2 × 3
4 5 6

1 2
( (1, 2), (3, 4), (5, 6) ) = ( (1, 3, 5); (2, 4, 6) ) = 3 4 P R3 × 2
5 6

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 343

Spezielle Matrizen

Nullmatrix
Die Nullmatrix des Rm × n ist die eindeutige Matrix A P Rm × n mit aij = 0 für
alle i, j. Wir bezeichnen sie mit 0.

Diagonalmatrizen
Ist A P Rm × n , so heißen die Einträge a11 , …, akk mit k = min(n, m) die
Diagonaleinträge von A. Der Vektor (a11 , …, akk ) P Rk heißt die (Haupt-)
Diagonale von A. Eine Matrix A heißt eine Diagonalmatrix, wenn alle
Einträge außerhalb der Diagonalen gleich 0 sind.

Obere und untere Dreiecksmatrizen


Eine Matrix A heißt eine obere Dreiecksmatrix, falls aij = 0 für alle i > j gilt,
d. h. alle Einträge unterhalb der Hauptdiagonalen sind Null. Analog heißt A
eine untere Dreiecksmatrix, falls aij = 0 für alle j > i gilt. In diesem Fall sind
alle Einträge oberhalb der Hauptdiagonalen gleich Null.

Quadratische Matrizen, Einheitsmatrizen


Eine Matrix A heißt quadratisch, wenn sie genauso viele Zeilen wie Spalten
besitzt, d. h., es gibt ein n mit A P Rn × n . Wir setzen
spur(A) = a11 + … + ann (Spur von A)
Für alle d1 , …, dn P R bezeichnen wir mit Diag(d1 , …, dn ) die Diagonalma-
trix des Rn × n mit der Hauptdiagonalen (d1 , …, dn ). Wir setzen
En = Diag(1, …, 1)
und nennen En die Einheitsmatrix des Rn × n .

Symmetrische Matrizen
Eine quadratische Matrix A heißt symmetrisch, falls aij = aji für alle i, j gilt.
Anders formuliert: Die Matrix A bleibt gleich, wenn sie an ihrer Hauptdia-
gonalen gespiegelt wird.

Beispiele
Wir betrachten
3 0 0 1 −1 0 3 0 0 4
A = 0 −2 0 , B = −1 0 1 , C = 0 1 1 0 .
0 0 1 0 1 2 0 0 0 1
Es gilt A = Diag(3, −2, 1) und spur(A) = 3 − 2 + 1 = 2. Die Matrix B ist
symmetrisch und besitzt die Hauptdiagonale (1, 0, 2) mit Spur 3. Die
Matrix C ist eine obere Dreiecksmatrix mit der Hauptdiagonalen (3, 1, 0).

© Oliver Deiser Grundzüge der Höheren Mathematik


344 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Die Addition von Matrizen

Matrizen können wie Vektoren addiert werden:

Definition (Addition von Matrizen)


Seien A, B P Rm × n . Dann setzen wir
A + B = (ai j + bi j )i j P Rm × n .
Die Matrix A + B heißt die Summe der Matrizen A und B.

Wichtig
Die Addition zweier Matrizen kann nur durchgeführt werden, wenn die
beteiligten Matrizen dieselbe Dimension aufweisen. Wir können keine
2 × 3-Matrix zu einer 3 × 2-Matrix addieren.

Für alle Matrizen A, B, C P Rm × n gilt:


(A + B) + C = A + (B + C) (Assoziativgesetz)
A + B = B + A (Kommutativgesetz)

Definition (additiv Inverses, Subtraktion)


Seien A, B P Rm × n . Dann setzen wir
− A = (−aij )i j (additiv Inverses von A)
A − B = A + (−B) (Differenz von A und B)

Für alle Matrizen A, B P Rm × n gilt


A + 0 = A = 0 + A
A − A = −A + A = 0
A − B = (aij − bij )i j

Beispiele
1 2 3 1 0 −1 2 2 2
+ =
3 0 1 0 1 −1 3 1 0

1 2 1 −1 0 3
3 0 − 2 0 = 1 0
3 1 1 2 2 −1

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 345

Skalarmultiplikation und Vektorraumstruktur

Eine Skalarmultiplikation ist für Matrizen ebenfalls möglich:

Definition (Skalarmultiplikation einer Matrix)


Seien A P Rm × n und λ P R. Dann setzen wir
λA = (λ ai j )i j P Rm × n .
Die Matrix λA heißt das Ergebnis der Skalarmultiplikation von A mit dem
Skalar λ.

Wie bei den Vektoren stehen die Skalare immer links (also λ A und nicht A λ).

Beispiele
1 2 −3 0 3 6 −9 0
3 =
3 0 1 −1 9 0 3 −3

1 −2 −1 2 1 −2
(−1) = = −
−3 0 3 0 −3 0

Es gelten alle von den Vektorräumen Rn vertrauten Rechengesetze. Für alle


λ, µ P R und alle A, B P Rm × n gilt zum Beispiel
λ (A + B) = λA + λB, λ (µ A) = (λµ) A
Kurz:
Mit Matrizen können wir rechnen wie mit Vektoren.

Definition (Matrizenräume)
Seien m, n ≥ 1. Dann heißt die Menge Rm × n mit der Addition und Skalar-
multiplikation von Matrizen der reelle Vektorraum der m × n-Matrizen.

Die Matrizenräume sind prinzipiell nichts Neues: Schreiben wir eine Matrix
A P Rm × n „flach“ als Vektor
(a11 , …, a1n , a21 , …, a2n , …, am1 , …, amn ) P Rm ⋅ n ,
so fallen die Addition und Skalarmultiplikation von Matrizen mit den Operatio-
nen für Vektoren zusammen. In diesem Sinne können wir den Vektorraum Rm× n
sogar mit dem Vektorraum Rm ⋅ n identifizieren. Die zweidimensionale Struktur
der Matrizen haben wir bislang nicht wirklich benutzt! Das ändert sich grundle-
gend für die nun folgenden Operationen: Das Matrix-Vektor-Produkt und die
Multiplikation von Matrizen verwenden die rechteckige Form.

© Oliver Deiser Grundzüge der Höheren Mathematik


346 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Das Matrix-Vektor-Produkt

Wir notieren reelle Vektoren des Rm im Folgenden oft als Spaltenvektoren:


v1
v = (v1 , …, vm ) = … P Rm .
vm
Erneut bedeutet ein Komma also den Beginn einer neuen Zeile. Einen Vektor
des Rm können wir so als eine Matrix des Rm× 1 auffassen (mit m Zeilen und einer
Spalte). Damit gilt Rm ⊆ Rm × 1 .

Definition (Matrix-Vektor-Produkt)
Seien A P Rm × n und v P Rn . Dann setzen wir

a11 … a1n v1 a11 v1 + … + a1n vn


a21 … a2n v2 a21 v1 + … + a2n vn
Av = = P Rm .
… … …
am1 … amn vn am1 v1 + … + amn vn

Der Vektor A v P Rm heißt das Matrix-Vektor-Produkt von A mit v.

Die Bildung des Matrix-Vektor-Produkts lässt sich durch

Zeile mal Spalte

veranschaulichen: Das Ergebnis Av ist ein als Spaltenvektor notierter Vektor des
Rm . Die Einträge dieses Vektors sind die Skalarprodukte der Zeilenvektoren von
A mit dem Vektor v.

Wichtig
Eine m × n-Matrix kann nur mit einem Vektor des Rn multipliziert werden.
Wir starten im Rn , wenden A an und landen im Rm . Eine Matrix A P Rm × n
lässt sich damit als eine Abbildung von Rn nach Rm auffassen: Einem Vektor
v P Rn wird der Vektor Av P Rm zugeordnet. Wir diskutieren diese sehr
wichtige Sichtweise im nächsten Kapitel genauer.

Beispiel

1
1 2 3 1+4−3 2
2 = = P R2 .
3 0 1 3+0−1 2
−1

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 347

Das Produkt zweier Matrizen

Durch wiederholte Bildung des Matrix-Vektor-Produkts können wir eine


Multiplikation für Matrizen einführen:

Definition (Produkt zweier Matrizen)


Seien A P Rm × r , B = (b1 ; …; bn ) P Rr × n . Dann setzen wir

A⋅B = ( Ab1 ; Ab2 ; … ; Abn ).

Die Matrix A ⋅ B P Rm × n heißt das Produkt der Matrizen A und B.

Wir wenden also die Matrix A nacheinander auf die Spaltenvektoren b1 , …, bn


von B an. Die Matrix-Vektor-Produkte Ab1 , …, Abn des Rm schreiben wir als
Spalten in eine Matrix. Wir erhalten so das Produkt A ⋅ B.
Wir schreiben auch kurz AB statt A ⋅ B. Ist C = A ⋅ B mit A,B wie im Satz, so gilt
für alle Einträge cij von C, dass

cij = ai1 b1j + … + air brj = ∑ 1 ≤ k ≤ r aik bk j (Formel für die Produkt-Einträge)

Insgesamt sind m ⋅ n Einträge durch „Zeile mal Spalte“ zu berechnen.

Beispiele
(1) Ein Produkt AB mit A P R2 × 3 , B P R3 × 4 :

1 2 3 1
1 2 0 1 4 1 1
0 1 −1 0 =
0 −1 3 3 −4 7 24
1 −1 2 8

Der Eintrag c23 = 7 des Produkts C = AB ergibt sich beispielsweise so:


c23 = „zweite Zeile mal dritte Spalte“ = 0 ⋅ 3 + (−1)(−1) + 3 ⋅ 2 = 7.
(2) Die allgemeine Form des Produkts zweier 2 × 2-Matrizen lautet:

a b a′ b′ a a′ + b c′ a b′ + b d′
⋅ =
c d c′ d′ c a′ + d c′ c b′ + d d′

Wichtig: Dimensionen müssen passen


Das Produkt AB ist genau dann definiert, wenn die Anzahl der Spalten von
A mit der Anzahl der Zeilen von B übereinstimmt. Gleichwertig: Die
Dimension der Zeilenvektoren von A ist gleich der Dimension der
Spaltenvektoren von B. Für A P Rm × r , B P Rr × n gilt AB P Rm × n , die
mittlere Dimension geht nicht in das Ergebnis ein.

© Oliver Deiser Grundzüge der Höheren Mathematik


348 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Eigenschaften des Matrizenprodukts

Für alle Matrizen A, B, C gilt bei definierter Produktbildung:


(A B) C = A (BC) (Assoziativgesetz)
A(B + C) = AB + AC, (A + B)C = AC + BC (Distributivgesetze)
Dies lässt sich mit einiger Mühe direkt nachrechnen. Das Kommutativgesetz ist
dagegen bereits für 2 × 2-Matrizen im Allgemeinen nicht richtig:

Beispiel
1 1 1 0 2 1 1 0 1 1 1 1
= , =
0 1 1 1 1 1 1 1 0 1 1 2

Der quadratische Fall ist für die Multiplikation besonders ausgezeichnet: Für
alle A, B P Rn × n ist sowohl AB als auch BA definiert und es gilt AB, BA P Rn × n .
Die Multiplikation kann im Rn × n immer ausgeführt werden und ergibt wieder
ein Element des Rn × n . Die Einheitsmatrix En ist neutral für die Multiplikation im
Rn × n , d. h. es gilt
A En = A = En A für alle A P Rn × n (Neutralität der Einheitsmatrix)

Die Transposition

Definition (transponierte Matrix)


Sei A = (a1 ; a2 ; …; an ) P Rm × n . Dann setzen wir
At = (a1 , …, an ) P R n × m
Die Matrix At heißt die zu A transponierte Matrix.

Die Transposition einer Matrix lässt sich anschaulich durch die Spiegelung an
der Hauptdiagonalen beschreiben. Die Zeilen- und Spaltenzahl wird dadurch
vertauscht. Ist A quadratisch, so gilt dies auch für At . Eine Matrix A P Rn × n ist ge-
nau dann symmetrisch, wenn A = At . Für alle A P Rm × n gilt (At )t = A.

Beispiel
Für A = ((1, 2); (1, 3); (4, 5)) P R2 × 3 gilt At = ((1, 2), (1, 3), (4, 5)) P R3 × 2 :
1 2
1 1 4 t
A = , A = 1 3
2 3 5
4 5

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 349

Komplexe Matrizen

Die Matrizentheorie lässt sich leicht ins Komplexe verallgemeinern: Die Ein-
träge einer Matrix sind nun komplexe Zahlen. Die Addition, Skalarmultiplika-
tion, das Matrix-Vektor-Produkt und das Produkt zweier Matrizen werden wie
für reelle Matrizen definiert. Wir erhalten dadurch die komplexen Vektorräume
Cm × n . Für alle n, m ≥ 1 gilt Rm × n ⊆ Cm × n .

Beispiele
1 2+i i 1 i −i 2 2 + i2 0
+ =
2i 0 1−i 1 0 i 1 + i2 0 1

1 2+i i i −1 + i2 −1
i =
2i 0 1−i −2 0 1+i

1 i 1 i
=
i 1+i 1+i 3i

1 i 1 3i i 1 + i5
=
i 1+i 1+i 2−i 3i i

© Oliver Deiser Grundzüge der Höheren Mathematik


350 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übungen

Übung 1
Berechnen Sie alle möglichen Produkte (mit zwei Faktoren), die sich mit
den folgenden Matrizen bilden lassen:
1 2 −1 1 0
1 2 1 2 1
A = , B = 0 −1 1 , C = , D = 1 1
3 1 3 1 1
1 0 1 2 1

Übung 2
Wir betrachten die (2 × 2)-Matrix

0 1
A = .
1 0

Zeichnen Sie ein Diagramm, das die geometrische Bedeutung des Matrix-
Vektor-Produkts Av für Vektoren v P R2 anschaulich macht. Berechnen Sie
zudem A2 = A A und deuten Sie das Ergebnis geometrisch.

Übung 3
Wir betrachten die (2 × 2)-Matrix

0 −1
A = .
1 0

Finden Sie eine Formel für die Potenzen An von A, wobei A0 = E2 und
An + 1 = An A für alle n ≥ 0. Wie lässt sich diese Formel geometrisch deuten?

Übung 4
Wir betrachten die 5 × 5-Matrix

1 0 0 0 0
0 0 0 0 1
P = 0 0 1 0 0 .
0 0 0 1 0
0 1 0 0 0

Welche Wirkung hat die Multiplikation mit P von links bzw. rechts an eine
Matrix A P R5 × 5 ? Illustrieren Sie Ihre Antwort durch ein instruktives
Beispiel.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 351

Lösungen zu den Übungen

Übung 1
Berechnen Sie alle möglichen Produkte (mit zwei Faktoren), die sich mit
den folgenden Matrizen bilden lassen:
1 2 −1 1 0
1 2 1 2 1
A = , B = 0 −1 1 , C = , D = 1 1
3 1 3 1 1
1 0 1 2 1

Lösung zu Übung 1
Aufgrund der Dimensionen sind die acht Produkte
A2 , AC, B2 , BD, CB, CD, DA, DC
möglich. Es gilt

7 4 7 4 3
A2 = , AC =
6 7 6 7 4

0 0 0 1 1
B2 = 1 1 0 , BD = 1 0
2 2 0 3 1

2 0 2 5 3
CB = , CD =
4 5 −1 6 2

1 2 1 2 1
DA = 4 3 , DC = 4 3 2
5 5 5 5 3

© Oliver Deiser Grundzüge der Höheren Mathematik


352 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übung 2
Wir betrachten die (2 × 2)-Matrix

0 1
A = .
1 0

Zeichnen Sie ein Diagramm, das die geometrische Bedeutung des Matrix-
Vektor-Produkts Av für Vektoren v P R2 anschaulich macht. Berechnen Sie
zudem A2 = A A und deuten Sie das Ergebnis geometrisch.

Lösung zu Übung 2

Av
x

w = Aw

y v

y x

Für alle v = (x, y) P R2 gilt

0 1 x y
Av = =
1 0 y x

Der Vektor Av ist der an der Winkelhalbierenden gespiegelte Vektor v.

Es gilt

0 1 0 1 1 0
A2 = A A = = = E2 .
1 0 1 0 0 1

Die Matrix A2 entspricht einer doppelten Spiegelung an der Winkelhalbie-


renden und damit der Identität.

Grundzüge der Höheren Mathematik © Oliver Deiser


1. Matrizen 353

Übung 3
Wir betrachten die (2 × 2)-Matrix

0 −1
A = .
1 0

Finden Sie eine Formel für die Potenzen An von A, wobei A0 = E2 und
An + 1 = An A für alle n ≥ 0. Wie lässt sich diese Formel geometrisch deuten?

Lösung zu Übung 3
Es gilt

1 0 0 −1 −1 0 0 1
A0 = A1 = A2 = A3 =
0 1 1 0 0 −1 −1 0

A4 = A0 , A5 = A1 , A6 = A2 , A7 = A3 , …

Die Folge der Potenzen ist periodisch mit der Periodenlänge 4. Zudem gilt

A0 = E2 , A2 = − E2 , A3 = − A.

Damit erhalten wir die für alle n ≥ 1 gültige Formel:

A4n = E2
A4n + 1 = A
A4n + 2 = − E2
A4n + 3 = − A

geometrische Interpretation
Zur geometrischen Interpretation betrachten wir einen Vektor v = (x, y)
der Ebene. Dann gilt

0 −1 x −y
Av = =
1 0 y x

Der Vektor (−y, x) ist der um π/2 gegen den Uhrzeigersinn gedrehte
Vektor (x, y). Die Matrix A bewirkt also eine Drehung um π/2 gegen
den Uhrzeigersinn. Zwei Drehungen entsprechen der Spiegelung −E2
am Nullpunkt, drei Drehungen der Drehung −A um π/2 im Uhrzeiger-
sinn. Je vier Drehungen ergeben die Identität.

© Oliver Deiser Grundzüge der Höheren Mathematik


354 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übung 4
Wir betrachten die 5 × 5-Matrix

1 0 0 0 0
0 0 0 0 1
P = 0 0 1 0 0 .
0 0 0 1 0
0 1 0 0 0

Welche Wirkung hat die Multiplikation mit P von links bzw. rechts an eine
Matrix A P R5 × 5 ? Illustrieren Sie Ihre Antwort durch ein instruktives
Beispiel.

Lösung zu Übung 4
Es gilt:
(a) Die Multiplikation mit P von links an A vertauscht die zweite und
fünfte Zeile von A (Zeilentransposition).
(b) Die Multiplikation mit P von rechts an A vertauscht die zweite und
fünfte Spalte von A (Spaltentransposition).

Beispielsweise gilt

1 0 0 0 0 1 2 3 4 5 1 2 3 4 5
0 0 0 0 1 6 7 8 9 10 21 22 23 24 25
0 0 1 0 0 11 12 13 14 15 = 11 12 13 14 15
0 0 0 1 0 16 17 18 19 20 16 17 18 19 20
0 1 0 0 0 21 22 23 24 25 6 7 8 9 10

1 2 3 4 5 1 0 0 0 0 1 5 3 4 2
6 7 8 9 10 0 0 0 0 1 6 10 8 9 7
11 12 13 14 15 0 0 1 0 0 = 11 15 13 14 12
16 17 18 19 20 0 0 0 1 0 16 20 18 19 17
21 22 23 24 25 0 1 0 0 0 21 25 23 24 22

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen

Wir hatten schon gesehen, dass eine m×n-Matrix A über das Vektorprodukt eine
Abbildung des Vektorraumes Rn in den Vektorraum Rm erzeugt: Einem Vektor
v P Rn wird der Vektor Av P Rm zugeordnet. Wir zeigen nun, dass die durch Ma-
trizen erzeugten Abbildungen genau die linearen Abbildungen sind. Wichtige
Beispiele liefern die Rotationen und Projektionen, die wir mit Hilfe von Matri-
zen darstellen.

Schlüsselbegriffe
Lineare Abbildung
Darstellende Matrix
Rotations-Matrix
Projektions-Matrix
Matrizenmultiplikation als Komposition

© Oliver Deiser Grundzüge der Höheren Mathematik


356 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Lineare Abbildungen

Definition (lineare Abbildung)


Eine Abbildung f : Rn → Rm heißt linear, falls für alle v, w P Rn und alle
λ, µ P R gilt:
f(λ v + µ w) = λ f(v) + µ f(w) (Linearitätsbedingung)

Charakteristisch ist das „Reinziehen“ von f. Gilt


f(v + w) = f(v) + f(w)
für alle v, w P Rn , so sagen wir auch, dass f die Vektoraddition erhält oder respek-
tiert. Wir können im Rn zuerst v + w bilden und dann f anwenden. Oder wir kön-
nen zuerst f(v) und f(w) bilden und dann diese Vektoren im Rm addieren. Erhält
f die Vektoraddition, so erzeugen beide Wege das gleiche Ergebnis. Analoges gilt
für die Skalarmultiplikation: Gilt
f(λv) = λf(v)
für alle λ P R und v P Rn , so können wir zuerst skalieren und dann f anwenden
oder umgekehrt erst f anwenden und dann skalieren. Die Linearitätsbedingung
der Definition besagt, dass sowohl die Vektoraddition als auch die Skalarmulti-
plikation unter f erhalten bleiben.
Jede Matrix liefert ein Beispiel für eine lineare Abbildung:

Satz (Matrizen als lineare Abbildungen)


Sei A P Rm × n . Dann ist die Abbildung, die einen Vektor v P Rn auf den
Vektor Av P Rm abbildet, eine lineare Abbildung des Rn in den Rm .

Beweis
Seien v, w P Rn und λ, µ P R. Wir zeigen:
A(λv + µw) = λ Av + µ Aw.
Hierzu genügt es zu zeigen, dass jede Komponente des linken Vektors mit
der entsprechenden Komponente des rechten Vektors übereinstimmt. Sei
also i P { 1, …, m }. Dann gilt nach Definition des Matrix-Vektor-Produkts
und der Vektoroperationen:
(A(λv + µw)) i = ∑ 1 ≤ k ≤ n aik (λvk + µwk )
= λ ∑ 1 ≤ k ≤ n aik vk + µ ∑ 1 ≤ k ≤ n aik wk = λ (Av)i + µ(Aw)i

Matrizen als lineare Abbildungen


Aufgrund des Satzes fassen wir eine Matrix auch als lineare Abbildung auf
und schreiben entsprechend A : Rn → Rm für A P Rm × n . Genauer sollten
wir von der durch A erzeugten linearen Abbildung sprechen.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen 357

Darstellende Matrizen

Jede Matrix A P Rm × n ist ein Beispiel für eine lineare Abbildung des Rn in den
m
R . Wir zeigen, dass es keine weiteren Beispiele gibt. Hierzu definieren wir:

Definition (darstellende Matrix)


Sei f : Rn → Rm linear. Dann heißt die m × n-Matrix
A = ( f(e1 ); …; f(en ) )
die darstellende Matrix von f.

Bildung der darstellenden Matrix


Um die darstellende Matrix einer linearen Abbildung zu bestimmen,
berechnen wir zunächst alle Bilder der kanonischen Basisvektoren unter f.
Nun schreiben wir diese Vektoren f(e1 ), …, f(en ) als Spalten in eine Matrix.
Wir erhalten so die darstellende Matrix von f. Kurz:
Die Spaltenvektoren sind die Bilder der Basisvektoren.

Für eine beliebige Matrix B P Rm × n gilt nach „Zeile mal Spalte“:


B ei = „die i-te Spalte von B“ für alle i = 1, …, n.
Ist A die darstellende Matrix von f, so gilt
A ei = „die i-te Spalte von A“ = f(ei ) für alle i = 1, …, n.
Diese Beobachtung verwenden wir im Beweis des folgenden Satzes, der die Be-
zeichnung als „darstellende Matrix“ erklärt:

Satz (Darstellungssatz)
Sei f : Rn → Rm linear, und sei A die darstellende Matrix von f. Dann gilt
f(v) = A v für alle v P Rn .

Beweis
Sei v P Rn . Dann gilt
f(v) = f(v1 e1 + … + vn en )
= v1 f(e1 ) + … + vn f(en )
= v1 A e1 + … + vn A en
= A(v1 e1 + … + vn en ) = Av

Fassen wir eine Matrix als lineare Abbildung auf, so ist eine lineare Abbildung
f mit ihrer darstellenden Matrix A identisch. Damit haben wir gezeigt:
Die linearen Abbildungen sind genau die Matrizen.

© Oliver Deiser Grundzüge der Höheren Mathematik


358 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Beispiel 1: Rotations-Matrizen

Ein ebenso instruktives wie wichtiges Beispiel für darstellende Matrizen sind
die Rotations-Matrizen der Ebene (auch Dreh-Matrizen genannt). Wir be-
trachten die Abbildung rotϕ : R2 → R2 , die einen Vektor der Ebene um den
Winkel ϕ gegen den Uhrzeigersinn dreht. Diese Abbildung ist linear. Um die
darstellende Matrix zu berechnen, müssen wir die Bilder der kanonischen Ba-
sisvektoren e1 = (1, 0) und e2 = (0, 1) unter dieser Abbildung berechnen. Drehen
wir den Vektor e1 um den Winkel ϕ, so erhalten wir
rotϕ (e1 ) = (cos ϕ, sin ϕ)
Drehen wir e2 um ϕ, so erhalten wir
rotϕ (e2 ) = (−sin ϕ, cos ϕ).
Der zweite Vektor steht nach wie vor senkrecht auf dem ersten. Wir können ihn
auch direkt mit Hilfe der Regel „(x, y) wird bei der Drehung um π/2 zu (−y, x)“ aus
dem ersten gewinnen. Die beiden gedrehten Basisvektoren schreiben wir nun als
Spalten in eine 2 × 2-Matrix:

Definition (Rotations-Matrix in der Ebene)


Sei ϕ P R. Dann heißt die 2 × 2-Matrix
cos ϕ − sin ϕ
A =
sin ϕ cos ϕ
die Rotations-Matrix zum Winkel ϕ.

Für jeden Vektor v P R2 ist der Vektor Av P R2 das Ergebnis der Drehung von
v um den Winkel ϕ gegen den Uhrzeigersinn.

Beispiel
Wir berechnen die Drehung des Vektors (2, 1) um den Winkel π/4 gegen
den Uhrzeigersinn. Nach dem Satz des Pythagoras gilt
cos(π/4) = sin(π/4) = 1/£2
Damit berechnet sich der gedrehte Vektor zu

cos(π/4) − sin(π/4) 2 1/£2 −1/£2 2


=
sin(π/4) cos(π/4) 1 1/£2 1/£2 1

1 1 −1 2 1 1
= =
£2 1 1 1 £2 3

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen 359

Beispiel 2: Projektions-Matrizen

Sei u P R2 normiert. Dann ist die orthogonale Projektion pru ; R2 → R2 mit


pru (v) = 〈u, v〉 u für alle v P R2
linear. Um die darstellende Matrix dieser Abbildung zu bestimmen, berechnen
wir wieder die Bilder der Basisvektoren. Es gilt
pru (e1 ) = 〈u, e1 〉 u = u1 u = u1 (u1 , u2 ) = (u1 2 , u1 u2 ),
pru (e2 ) = 〈u, e2 〉 u = u2 u = u2 (u1 , u2 ) = (u1 u2 , u2 2 ).
Diese beiden Vektoren schreiben wir erneut als Spalten in eine Matrix:

Definition (Projektions-Matrix in der Ebene)


Sei u P R2 normiert. Dann heißt die 2 × 2-Matrix
u1 2 u1 u2
A =
u1 u2 u2 2
die Projektions-Matrix zum Vektor u.

Für jeden Vektor v P R2 ist der Vektor Av P R2 das Ergebnis der orthogonalen
Projektion von v auf die von u erzeugte Gerade. Die Voraussetzung „u ist nor-
miert“ ist keine Einschränkung, da die Normierung eines Vektors u ≠ 0 die
Projektion auf u unverändert lässt.
Eine Projektionsmatrix A ist symmetrisch, da a12 = a21 . Für die Hauptdiago-
nale (u1 2 , u2 2 ) von A gilt
u1 2 + u2 2 = i u i 2 = 1,
sodass spur(A) = 1.

Beispiel
Wir betrachten die Gerade G durch 0 und (3, 4). Der Vektor (3, 4) hat die
Länge 5, sodass u = (3/5, 4/5) der normierte Vektor der gleichen Richtung
ist. Die Projektions-Matrix für u lautet

1 9 12
A =
25 12 16

Für den Vektor v = (3, −1) berechnet sich damit die Projektion von v auf die
Gerade G zu

1 9 12 3 1 15 1 3
A = = =
25 12 16 −1 25 20 5 4

© Oliver Deiser Grundzüge der Höheren Mathematik


360 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Die Multiplikation als Verknüpfung von Abbildungen

Wir haben gezeigt, dass die linearen Abbildungen genau den Matrizen ent-
sprechen. Diese Entsprechung wird noch verstärkt durch:

Satz (Matrizenmultiplikation und Verknüpfung)


Seien f : Rn → Rr und g : Rr → Rm lineare Abbildungen, und seien A bzw. B
ihre darstellenden Matrizen. Dann ist BA die darstellende Matrix von g + f.

Beweis
Es gilt
(g + f )(e1 ) = g(f(e1 )) = g(Ae1 ) = B(Ae1 ) = (BA)e1 .
Damit ist die erste Spalte der Matrix BA das Bild von e1 unter g + f.
Analoges gilt für e2 , …, en . Dies zeigt, das BA die Abbildung g + f darstellt.

Als eine Anwendung geben wir einen verblüffenden (und einfachen) Beweis
der Additionstheoreme für den Kosinus und Sinus:

Satz (Additionstheoreme für Kosinus und Sinus)


Für alle α, β P R gilt:
cos(α + β) = cos α cos β − sin α sin β (Additionstheorem des Kosinus)
sin(α + β) = sin α cos β + cos α sin β (Additionstheorem des Sinus)

Beweis
Seien α, β P R. Die Rotationsmatrizen für α, β und α + β lauten
cos α − sin α cos β − sin β cos(α+β) − sin(α+β)
A= , B= , C=
sin α cos α sin β cos β sin(α+β) cos(α+β)
Nach dem obigen Satz gilt AB = C . Denn eine Rotation um β gefolgt von
einer Rotation um α ist eine Rotation um α + β. (Analog gilt BA = C und
damit AB = BA.) Das Produkt von A und B berechnet sich zu

cos α − sin α cos β − sin β


AB =
sin α cos α sin β cos β

cos α cos β − sin α sin β −cos α sin β − sin α cos β


=
sin α cos β + cos α sin β − sin α sin β + cos α cos β

Aus dem Vergleich der Einträge von AB mit der Matrix C erhalten wir die
Behauptung.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen 361

Komplexe lineare Abbildungen

Alle Begriffe und Ergebnisse lassen sich wieder auf die komplexen Vektor-
räume übertragen. Eine Abbildung f : Cn → Cm ist linear, falls für alle v, w P Cn
und alle λ, µ P C gilt:
f(λ v + µ w) = λ f(v) + µ f(w) (Linearitätsbedingung)
Die linearen Abbildungen entsprechen erneut den Matrizen. Ist f : Cn → Cm
linear, so ist die spaltenweise gefüllte Matrix
A = ( f(e1 ) ; … ; f(en ) ) P Cn × m
die darstellende Matrix von f, d. h. es gilt f(v) = Av für alle v P Cn .

Beispiel
Sei f : C2 → C2 die lineare Abbildung mit
f((z, w)) = (iz, z + iw) für alle z, w P C.
Die Bilder der kanonischen Basisvektoren unter f berechnen sich zu
f(e1 ) = f((1, 0)) = (i, 1)
f(e2 ) = f((0, 1)) = (0, i).
Damit ist

i 0
A = ( f(e1 ); f(e2 ) ) = P C2 × 2
1 i

die darstellende Matrix von f.

© Oliver Deiser Grundzüge der Höheren Mathematik


362 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übungen

Übung 1
Bestimmen Sie (ohne Begründung) die darstellenden Matrizen der
folgenden linearen Abbildungen der reellen Ebene. Vereinfachen Sie die
Matrizen so weit als möglich.
(a) Die Skalierung eines Vektors um den Skalar λ P R.
(b) Die Spiegelung eines Vektors an der Winkelhalbierenden.
(c) Zunächst drehen wir einen Vektor gegen den Uhrzeigersinn um π/3.
Danach skalieren ihn mit dem Faktor 4. Anschließend projizieren
wir ihn senkrecht auf die Winkelhalbierende.

Übung 2
Wir betrachten die reelle 2 × 2-Matrix
3 1
A =
1 2
Visualisieren Sie die durch A erzeugte lineare Abbildung der Ebene durch
ein Diagramm: Tragen Sie die Bilder der Basisvektoren und das durch sie
erzeugte Koordinatengitter ein. Skizzieren Sie zudem das Bild { Av | ivi = 1 }
des Einheitskreises unter A.

Übung 3
Seien u, w P R2 normiert, und seien A, B P R2 × 2 die zugehörigen Projekti-
ons-Matrizen. Zeigen Sie, dass AB genau dann die Nullmatrix ist, wenn u
und w senkrecht aufeinander stehen.

Übung 4
Welche der folgenden Abbildungen sind linear und welche nicht? Geben
Sie im positiven Fall die darstellende Matrix und im negativen Fall eine
kurze Begründung oder ein Gegenbeispiel an.
(a) Die Abbildung f : R3 → R2 mit
f(x, y, z) = (x, y z) für alle (x, y, z) P R3 .
(b) Die Abbildung f : R → R3 mit
f(x) = (x, 2x, 3x) für alle x P R.
(c) Die Abbildung f : R2 → R2 mit
f(x, y) = 2(x, y) + (1, 1) für alle (x, y) P R2 .
(d) Die Abbildung f : C → C mit
f(z) = z für alle z P C.

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen 363

Lösungen zu den Übungen

Übung 1
Bestimmen Sie (ohne Begründung) die darstellenden Matrizen der
folgenden linearen Abbildungen der reellen Ebene. Vereinfachen Sie die
Matrizen so weit als möglich.
(a) Die Skalierung eines Vektors um den Skalar λ P R.
(b) Die Spiegelung eines Vektors an der Winkelhalbierenden.
(c) Zunächst drehen wir einen Vektor gegen den Uhrzeigersinn um π/3.
Danach skalieren ihn mit dem Faktor 4. Anschließend projizieren
wir ihn senkrecht auf die Winkelhalbierende.

Lösung zu Übung 1
zu (a):
λ 0
Es gilt A = = λ E2 mit A(x, y) = (λx, λy) = λ (x, y)
0 λ

zu (b):
0 1
Es gilt A = mit A (x, y) = (y, x)
1 0

zu (c): Es gilt cos(π/3) = 1/2, sin(π/3) = £3/2. Für die Projektion verwen-
den wir den normierten Vektor u = (1/£2, 1/£2). Damit berechnet sich
die darstellende Matrix zu

1/2 1/2 4 0 1/2 −£3/2


1/2 1/2 0 4 £3/2 1/2

1 1 1 1 1 0 1 −£3
= ⋅4⋅
2 2 1 1 0 1 £3 1

1 1 1 −£3
=
1 1 £3 1

1 + £3 1 − £3
=
1 + £3 1 − £3

© Oliver Deiser Grundzüge der Höheren Mathematik


364 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übung 2
Wir betrachten die reelle 2 × 2-Matrix
3 1
A =
1 2
Visualisieren Sie die durch A erzeugte lineare Abbildung der Ebene durch
ein Diagramm: Tragen Sie die Bilder der Basisvektoren und das durch sie
erzeugte Koordinatengitter ein. Skizzieren Sie zudem das Bild { Av | ivi = 1 }
des Einheitskreises unter A.

Lösung zu Übung 2

Ae2
2

Ae1

-6 -4 -2 2 4 6

-2

-4

-6

Die Bilder Ae1 = (3, 1) und Ae2 = (1, 2) der Basisvektoren erzeugen ein
Koordinatensystem. Jeder Vektor (x, y) P R2 wird durch A auf
A(x, y) = A(xe1 + ye2 ) = x Ae1 + y Ae2
abgebildet. A(x, y) hat die Koordinaten (x, y) im neuen System.
Der Einheitskreis wird durch A zu einer Ellipse. Der Ellipse gehören die Punkte
±A e1 und ±A e2 an. Die Halbachsen der Ellipse werden nicht durch Ae1 und Ae2
markiert (sie sind nicht leicht auszurechnen).

Grundzüge der Höheren Mathematik © Oliver Deiser


2. Lineare Abbildungen 365

Übung 3
Seien u, w P R2 normiert, und seien A, B P R2 × 2 die zugehörigen Projekti-
ons-Matrizen. Zeigen Sie, dass AB genau dann die Nullmatrix ist, wenn u
und w senkrecht aufeinander stehen.

Lösung zu Übung 3
Es gilt

u1 2 u1 u2 w1 2 w1 w2
A = 2
, B = .
u1 u2 u2 w1 w2 w2 2

Das Produkt der beiden Matrizen berechnet sich zu:

u1 2 w1 2 + u1 u2 w1 w2 u1 2 w1 w2 + u1 u2 w2 2
AB =
u1 u2 w1 2 + u2 2 w1 w2 u1 u2 w1 w2 + u2 2 w2 2

u1 w1 (u1 w1 + u2 w2 ) u1 w2 (u1 w1 + u2 w2 )
=
u2 w1 (u1 w1 + u2 w2 ) u2 w2 (u1 w1 + u2 w2 )

u1 w1 u1 w2
= 〈u, w〉 C mit C = .
u2 w1 u2 w2

Stehen u und w senkrecht aufeinander, so ist 〈u, w〉 = 0 und damit AB = 0.


Ist umgekehrt AB = 0, so ist 〈u, w〉 = 0 oder C = 0. Im ersten Fall stehen v
und w senkrecht aufeinander. Im zweiten Fall sind alle Einträge von C
gleich 0, d. h. es gilt
u1 w1 = u1 w2 = u2 w1 = u2 w2 = 0.
Dies ist nur möglich, wenn u = 0 oder v = 0 (denn andernfalls gibt es i,j mit
ui ≠ 0 und wj ≠ 0, und dann ist ui wj ≠ 0). Da u und v nach Voraussetzung
normiert sind, kann der Fall C = 0 also nicht eintreten. Dies zeigt die
Äquivalenz.

© Oliver Deiser Grundzüge der Höheren Mathematik


366 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übung 4
Welche der folgenden Abbildungen sind linear und welche nicht? Geben
Sie im positiven Fall die darstellende Matrix und im negativen Fall eine
kurze Begründung oder ein Gegenbeispiel an.
(a) Die Abbildung f : R3 → R2 mit
f(x, y, z) = (x, y z) für alle (x, y, z) P R3 .
(b) Die Abbildung f : R → R3 mit
f(x) = (x, 2x, 3x) für alle x P R.
(c) Die Abbildung f : R2 → R2 mit
f(x, y) = 2(x, y) + (1, 1) für alle (x, y) P R2 .
(d) Die Abbildung f : C → C mit
f(z) = z für alle z P C.

Lösung zu Übung 4
zu (a): Die Abbildung ist nicht linear.
Gegenbeispiel:
f(2(1, 1, 1)) = f((2, 2, 2)) = (2, 2 ⋅ 2) = (2, 4)
2 f((1, 1, 1)) = 2 (1, 1 ⋅ 1) = (2, 2)

zu (b): Die Abbildung ist linear. Die darstellende Matrix ist


1
A = 2 P R3 × 1
3

zu (c): Die Abbildung ist nicht linear.


Begründung:
Jede lineare Abbildung bildet den Nullvektor auf den Nullvektor ab. Für
die Abbildung f gilt aber f(0) = (1, 1) ≠ 0.

zu (d): Die Abbildung ist nicht linear.


Gegenbeispiel:
f(i 1) = f(i) = − i
i f(1) = i 1 = i
Also respektiert f die komplexe Skalarmultiplikation nicht. (Die
Abbildung f erhält dagegen die Vektoraddition in C und die Multiplika-
tion mit reellen Skalaren.)

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Inverse Matrizen

Wir betrachten quadratische Matrizen einer bestimmten Dimension n ≥ 1. Sind


A, B P Rn × n , so gilt auch A B P Rn × n , d. h. die Matrizen-Multiplikation ist eine
Operation auf dem Rn × n . Wie für jede Operation stellt sich die Frage nach der
Inversenbildung: Gibt es für eine Matrix A P Rn × n eine Matrix B P Rn × n derart,
dass AB = En = BA? Falls ja, so nennen wir A invertierbar und B invers zu A. Wir
diskutieren allgemeine Rechenregeln, verschiedene Kriterien der Invertierbar-
keit und stellen ein effektives Verfahren zur Berechnung des Inversen einer Ma-
trix vor.

Schlüsselbegriffe
Inverses einer Matrix
Inversenregeln
Invertierbarkeitskriterien
Algorithmische Berechnung des Inversen

© Oliver Deiser Grundzüge der Höheren Mathematik


368 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Invertierbarkeit

Eine mathematische Operation wie die Addition, Multiplikation von Zahlen


oder die Komposition von Abbildungen verknüpft zwei Objekte und erzeugt da-
durch ein drittes Objekt des gleichen Typs. Oft gibt es ein neutrales Element wie
die 0, 1 oder die Identität, die bei der Operation nichts ändert. In diesem Fall
können wir nach der Existenz von Inversen fragen: Gibt es für ein gegebenes Ob-
jekt a ein Objekt b, sodass a verknüpft mit b und b verknüpft mit a das neutrale
Element ergibt? Bezeichnen wir die Operation mit p und das neutrale Element
mit e, so sind a und b invers zueinander, wenn gilt:
apb = e = bpa (allgemeine Form inverser Elemente)

Beispiele
(1) Addition in R oder C : Neutral ist die 0. Für jedes a ist −a invers zu a.
Es gilt a + (−a) = 0 = (−a) + a = 0.
(2) Multiplikation in R: Neutral ist die 1. Für jedes a ≠ 0 ist 1/a invers zu a.
Es gilt a ⋅ 1/a = 1 = 1/a ⋅ a. Die Null besitzt kein Inverses bzgl. der
Multiplikation.
(3) Addition im Rn oder Cn : Neutral ist der Nullvektor 0. Für alle
Vektoren v ist −v invers zu v. Es gilt v + (−v) = 0 = (−v) + v.
(4) Addition von Matrizen im Rm × n oder Cm × n : Neutral ist die Nullmatrix.
Für alle Matrizen A ist −A invers zu A. Es gilt A + (−A) = 0 = (−A) + A.
(5) Punktweise Addition von Funktionen von R nach R: Neutral ist die
Nullfunktion. Für alle f ist −f invers zu f. Es gilt f + (−f ) = 0 = (−f ) + f.
(6) Punktweise Multiplikation von Funktionen von R nach R: Neutral ist
die konstante Eins-Funktion. Eine Funktion f : R → R ist genau dann
invertierbar, wenn f(x) ≠ 0 für alle x P R. In diesem Fall ist 1/f invers
zu f. Es gilt f ⋅ (1/f ) = 1 = f ⋅ (1/f ).
(7) Komposition von Abbildungen von einer Menge M nach M: Neutral
ist die Identität id : M → M mit id(a) = a für alle a P M. Denn es gilt
f + id = f = id + f für alle f : M → M. Ist f : M → M bijektiv, so ist die
Umkehrabbildung f − 1 : M → M invers zu f, da f + f − 1 = id = f − 1 + f.
Ist f : M → M keine Bijektion, so besitzt f kein Inverses.

Die Beispiele zeigen, dass Inverse für Operationen mit einem multiplikativen
Charakter nicht immer existieren. Die Ausnahmerolle der Null für die multipli-
kativen Inversen in den reellen Zahlen ist das bekannteste Beispiel hierfür. Die
Bedingung „f : M → M ist bijektiv“ für Abbildungen ist sehr stark, sodass nur be-
sonders „gute“ Abbildungen ein Inverses besitzen. Das Gleiche gilt, wie wir nun
sehen werden, für Matrizen − die wir ja auch als Abbildungen auffassen können.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Inverse Matrizen 369

Invertierbarkeit für Matrizen

Definition (invertierbar, Inverses für Matrizen, singulär)


Sei A P Rn × n . Dann heißt A invertierbar, wenn eine Matrix B P Rn × n
existiert mit
AB = En = BA.
Die Matrix B heißt dann ein Inverses von A, und die Matrizen A und B
heißen invers zueinander. Ist A nicht invertierbar, so heißt A singulär.

Wichtig: Quadratische Matrizen


Die Invertierbarkeit ist nur für quadratische Matrizen definiert. Nur dann
ist AB = En = BA möglich.

Beispiele
(1) Für alle n ist die Einheitsmatrix En invertierbar und invers zu sich
selbst. Denn es gilt En En = En .
(2) Sei A = ((1, 2), (3, 4)) P R2 × 2 . Dann ist A invertierbar und die Matrix
B = ((−2, 1), (3/2, −1/2)) ist invers zu A, da

1 2 −2 1 1 0 −2 1 1 2
= =
3 4 3/2 −1/2 0 1 3/2 −1/2 3 4

(3) Sei Aϕ die Rotations-Matrix für den Winkel ϕ. Dann ist A invertierbar
und die Rotations-Matrix A−ϕ um den Winkel −ϕ ist invers zu A.
(4) Die Matrix A = ((1, 0), (0, 0)) des R2 × 2 ist singulär. Denn ist
B = ((a, b), (c, d)), so gilt

1 0 a b a b
= ≠ E2 .
0 0 c d 0 0

(5) Allgemein gilt: Hat A P Rn × n eine Nullzeile, so ist A singulär. Denn ist
B P Rn × n beliebig, so entsteht durch „Zeile mal Spalte“ im Produkt AB
eine Nullzeile, sodass AB ≠ E2 . Analoges gilt für Nullspalten: Hat A
eine Nullspalte, so hat BA eine Nullspalte, sodass BA ≠ En .

Die Beispiele werfen die folgenden Fragen auf:


(1) Welche Matrizen sind invertierbar und welche sind singulär?
(2) Wie berechnen wir im Fall der Existenz eine inverse Matrix?
Diesen Fragen werden wir im Folgenden nachgehen. Zunächst betrachten wir
noch einige allgemeine Eigenschaften invertierbarer Matrizen.

© Oliver Deiser Grundzüge der Höheren Mathematik


370 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Inversenregeln

Satz (Eindeutigkeit des Inversen)


Sei A P Rn × n invertierbar. Dann gibt es genau ein B P Rn × n mit
AB = En = BA.

Beweis
Seien B, C invers zu A. Dann gilt B = B En = B (A C) = (B A) C = En C = C.

Notation
Das eindeutig bestimmte Inverse einer Matrix A bezeichnen wir mit A−1 .

Die Bruchnotation 1/A ist für Matrizen nicht üblich. Nach Definition des In-
versen gilt A A−1 = En = A−1 A.

Satz (Inversenregeln)
Seien A, B P Rn × n invertierbar. Dann sind auch A−1 und AB invertierbar.
Weiter gilt:
(a) (A−1 )−1 = A,
(b) (A B)−1 = B−1 A−1 .

Beweis
zu (a): Sei B = A−1 . Da B invers zu A ist, gilt AB = En = BA. Nach Defini-
tion des Inversen ist A invers zu B, sodass A = B−1 = (A−1 )−1 .
zu (b): Es gilt
(B−1 A−1 ) (AB) = B−1 A−1 A B = B−1 En B = B−1 B = En .
Analog ist (AB)(B−1 A−1 ) = En . Also ist B−1 A−1 invers zu AB.

Wichtig: Reihenfolge beachten


In der Regel (AB)−1 = B−1 A−1 ist die Umkehrung der Reihenfolge wichtig.
Im Allgemeinen ist (AB)−1 ≠ A−1 B−1 (vgl. die Übungen).

Nützlich ist:

Satz (einseitige Überprüfung)


Sei A P Rn × n invertierbar. Weiter sei B P Rn × n mit BA = En oder AB = En .
Dann ist B = A−1 .

Beweis
Ist BA = En , so gilt B = B En = B A A−1 = En A−1 = A−1 . Der Fall AB = En ist
analog.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Inverse Matrizen 371

Kriterien für die Invertierbarkeit

Wir haben gesehen, dass wir eine Matrix auch als eine lineare Abbildung auf-
fassen können. Die Invertierbarkeit entspricht dabei der Bildung der Umkehr-
abbildung:

Satz (Invertierbarkeit und Bijektivität)


Sei A P Rn × n . Dann sind äquivalent:
(a) A ist invertierbar.
(b) A : Rn → Rn ist bijektiv.
In diesem Fall ist A−1 die Umkehrabbildung von A.

Beweis
Eine Abbildung f : Rn → Rn ist genau dann bijektiv, wenn es eine Abbil-
dung g : Rn → Rn gibt mit f + g = id = g + f. Da die Matrizenmultiplikation
der Komposition von Abbildungen und die Identität der Einheitsmatrix
entspricht, folgt die Behauptung.

Der Satz zeigt, dass die Invertierbarkeit einer quadratischen Matrix eine be-
sondere Eigenschaft ist. Die Matrix muss als Abbildung bijektiv sein.

Beispiele
(1) Rotationen sind bijektiv. Also ist eine Rotations-Matrix invertierbar.
(2) Projektionen sind nicht injektiv. Also ist eine Projektions-Matrix
singulär.

Es gibt eine Vielzahl von weiteren Kriterien. Ohne Beweis geben wir an:

Satz (Invertierbarkeitskriterien)
Sei A P Rn × n . Dann sind äquivalent:
(a) A ist invertierbar.
(b) A : Rn → Rn ist injektiv.
(c) A : Rn → Rn ist surjektiv.
(d) Die Zeilenvektoren von A sind linear unabhängig.
(e) Die Spaltenvektoren von A sind linear unabhängig.
(f ) Die Zeilenvektoren von A sind erzeugend.
(g) Die Spaltenvektoren von A sind erzeugend.

© Oliver Deiser Grundzüge der Höheren Mathematik


372 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Ein Invertierungsverfahren

Wir stellen nun ein effektives Verfahren vor, das eine Matrix A P Rn auf Inver-
tierbarkeit überprüft und im positiven Fall A−1 berechnet. Das Verfahren ver-
wendet die folgenden elementaren Zeilenoperationen:
(Z1) Multiplikation einer Zeile mit einem Skalar λ.
(Z2) Addition des λ-Fachen einer Zeile zu einer anderen Zeile.

Invertierungverfahren für Matrizen


Gegeben sei A P Rn × n . Wir setzen A0 = A. Durch Anwendung von (Z1)
und (Z2) versuchen wir, A schrittweise in die Einheitsmatrix En zu
überführen. Wir erzeugen so Matrizen A0 , …, Ak . Parallel wenden wir
dieselben Zeilenoperationen auf B0 = En an und erzeugen so Matrizen
B0 , …, Bk . Hat ein Ai eine Nullzeile, so stoppen wir mit Ergebnis „A ist
singulär“. Erreichen wir Ak = En , so geben wir Bk als Ergebnis aus.

Beispiel: Invertierung einer Matrix


1 1 0 1 0 0 1 1 0 1 0 0
A0 = 1 0 1 0 1 0 = B0 A4 = 0 −1 0 0 −1 1 = B4
1 −1 1 0 0 1 0 0 −1 1 −2 1

1 1 0 1 0 0 1 0 0 1 −1 1
A1 = 0 −1 1 −1 1 0 = B1 A5 = 0 −1 0 0 −1 1 = B5
1 −1 1 0 0 1 0 0 −1 1 −2 1

1 1 0 1 0 0 1 0 0 1 −1 1
A2 = 0 −1 1 −1 1 0 = B2 A6 = 0 1 0 0 1 −1 = B6
0 −2 1 −1 0 1 0 0 −1 1 −2 1

1 1 0 1 0 0 1 0 0 1 −1 1
A3 = 0 −1 1 −1 1 0 = B3 A7 = 0 1 0 0 1 −1 = B7
0 0 −1 1 −2 1 0 0 1 −1 2 −1

Wir geben B7 als Ergebnis aus.

Warum ist dieses Verfahren korrekt? Die verwendeten elementaren Zeilen-


operationen lassen sich durch invertierbare Matrizen L1 , …, Lk beschreiben, die
wir von links an A multiplizieren (vgl. die Übungen). Erhalten wir
Lk … L1 A = Ak = En ,
so ist Lk … L1 invers zu A und A−1 = Lk … L1 = Lk … L1 B0 = Bk . Erzeugen wir da-
gegen eine Nullzeile, so ist Lk … L1 A singulär und damit A singulär.

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Inverse Matrizen 373

Komplexe Matrizen

Alle Begriffe lassen sich unverändert auf komplexe Matrizen übertragen. Die
Inversenregeln und Invertierbarkeitskriterien bleiben gültig. Auch das Invertie-
rungsverfahren kann übernommen werden, wobei wir nun mit komplexen Skala-
ren λ P C in den Zeilenoperationen operieren.

Beispiel
Wir betrachten die komplexen Matrizen

i 1 −1 1
A = , B = P C2 × 2 .
1+i 1 1+i −i

Es gilt AB = E2 = BA. Damit ist A invertierbar und B = A−1 . Effektiv lässt


sich B durch das Invertierungsverfahren finden oder alternativ durch eine
allgemeine Invertierungsformel für (2 × 2)-Matrizen. Wir diskutieren beide
Möglichkeiten in den Übungen.

© Oliver Deiser Grundzüge der Höheren Mathematik


374 5. Abschnitt Matrizen und Lineare Gleichungssysteme

Übungen

Übung 1
Wenden Sie das Invertierungsverfahren auf die folgenden Matrizen an:

(a) 1 1 −1
A = −2 1 −3 P R3 × 3
8 −1 7

(b) i 1
A = P C2 × 2
1+i 1

Übung 2
Sei A = ((a, b), (c, d)) P R2 × 2 . Zeigen Sie:
(1) Ist ad − bc ≠ 0, so ist A invertierbar mit

1 d −b
A−1 = (Invertierungsformel für 2 × 2-Matrizen)
ad − bc −c a

(2) Ist ad − bc = 0, so ist A singulär.

Die Formel ist auch für komplexe (2 × 2)-Matrizen gültig. Wenden Sie sie
auf die komplexe (2 × 2)-Matrix in Übung 1 an.

Übung 3
Sei n ≥ 1. Weiter seien i, j P { 1, …, n } mit i ≠ j und λ P R.
(a) Geben Sie Matrizen B, C P Rn × n an, sodass für alle A P Rn × n gilt:
B A = „Multiplikation der i-ten Zeile von A mit λ.“
C A = „Addition des λ-Fachen der Zeile i von A zur Zeile j von A“.
(b) Geben Sie instruktive Beispiele für B und C an.
(c) Was bewirkt die Multiplikation AB bzw. AC von rechts?

Übung 4
Geben Sie invertierbare Matrizen A, B P R2 × 2 an mit den Eigenschaften:
(a) Alle Einträge von A, B, A−1 , B−1 sind ganze Zahlen.
(b) (AB)−1 ≠ A−1 B−1 .
Berechnen Sie zum Nachweis die Matrizen A−1 , B−1 , (AB)−1 , A−1 B−1 .

Grundzüge der Höheren Mathematik © Oliver Deiser


3. Inverse Matrizen 375

Lösungen zu den Übungen

Übung 1
Wenden Sie das Invertierungsverfahren auf die folgenden Matrizen an:

(a) 1 1 −1
A = −2 1 −3 P R3 × 3
8 −1 7

(b) i 1
A = P C2 × 2
1+i 1

Lösung zu Übung 1
zu (a):
1 1 −1 1 0 0 1 1 −1 1 0 0
A0 = −2 1 −3 0 1 0 = B0 A2 = 0 3 −5 2 1 0 = B2
8 −1 7 0 0 1 0 −9 15 −8 0 1

1 1 −1 1 0 0 1 1 −1 1 0 0
A1 = 0 3 −5 2 1 0 = B1 A3 = 0 3 −5 2 1 0 = B3
8 −1 7 0 0 1 0 0 0 −2 3 1

A3 hat eine Nullzeile. Die Matrix A ist singulär.

zu (b):

i 1 1 0 1 0