Sie sind auf Seite 1von 214

Mathematik fu

r Ingenieure II
Sommersemester 2006

Vorlesungsskript
Institut fur Angewandte Mathematik

FriedrichAlexanderUniversit
at ErlangenNu
rnberg

Inhaltsverzeichnis
6 Grenzwerte und Stetigkeit

6.1

Grenzwerte reeller Funktionen Vorbetrachtung . . . . . . . . . . . . .

6.2

Definition des Grenzwertes einfache Regeln . . . . . . . . . . . . . . .

6.3

Uneigentliche Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . .

10

6.4

Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

6.5

Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . . .

25

6.6

Kompakte Mengen und Stetigkeit . . . . . . . . . . . . . . . . . . . . .

30

6.7

Algorithmische Losung von Gleichungen I

. . . . . . . . . . . . . . . .

36

6.8

Umkehrfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

6.9

Stetigkeitsmae . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

7 Grundlagen der Differentialrechnung

48

7.1

Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

48

7.2

Ableitung und Verkn


upfung . . . . . . . . . . . . . . . . . . . . . . . .

53

7.3

Hohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

59

7.4

Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

7.5

Taylor-Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

7.6

1. Anwendung: Extremwertprobleme . . . . . . . . . . . . . . . . . . .

72

7.7

2. Anwendung: Berechnung unbestimmter Ausdr


ucke lHospital-Regel 77

7.8

Approximation von Funktionen I . . . . . . . . . . . . . . . . . . . . .

81

7.9

Fehlerfortpflanzung und Kondition . . . . . . . . . . . . . . . . . . . .

87

7.10 Numerische Differentiation . . . . . . . . . . . . . . . . . . . . . . . . .

90

7.11 Algorithmische Losung von Gleichungen II . . . . . . . . . . . . . . . .

96

7.12 Ableitungen von vektorwertigen Funktionen u


ber R . . . . . . . . . . . 100

8 Integration

108

8.1

Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . 108

8.2

Homogene lineare DGl mit konstanten Koeffizienten . . . . . . . . . . . 113

8.3

Ansatzverfahren zur Losung von inhomogenen linearen DGl mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

8.4

Stammfunktion und Integral . . . . . . . . . . . . . . . . . . . . . . . . 126

8.5

Integrationsregeln Technik des Integrierens . . . . . . . . . . . . . . . 130

8.6

Punktweise und gleichmaige Konvergenz von Funktionen . . . . . . . . 145

8.7

Allgemeine Integralbegriffe:
Regel-Integral und Riemann-Integral . . . . . . . . . . . . . . . . . . . 149

8.8

Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

8.9

Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

8.10 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . 174


9 Darstellung und Approximation von Funktionen

181

9.1

Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

9.2

Reihen von Funktionen und Potenzreihen . . . . . . . . . . . . . . . . . 190

9.3

Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

10 Fourier-Analyse

204

Grenzwerte und Stetigkeit

6.1

Grenzwerte reeller Funktionen Vorbetrachtung

Definition 6.1
Eine Abbildung f : Df R mit = Df R heit reelle Funktion.
BSP. 6.1

fu
r reelle Funktionen:

1) Df = N. Dann heit f Folge. Man schreibt

1
f statt f (n), z.B. fn = 2 .
n
n

2) f (x) = x1 mit Df = R \ {0}


(Kenntnis der Darstellung elementarer Funktionen wird vorausgesetzt!)
f (x)
3
2
1
3

1
1

2
3
Abbildung 1: f (x) = x1 .
Im Folgenden werden wir Funktionen betrachten mit kontinuierlichem Definiti
onsbereich, d.h. ohne isolierte Punkte. Dies entspricht Intervallen und Vereini
gungen solcher Intervalle, siehe Definition von beschrankten und unbeschrankten
Intervallen im Abschnitt 2.5, Teil I. Die Folgen aus Beispiel 1) werden also im
Anschluss noch nicht betrachtet. Auf Folgen kommen wir spater und ausf
uhrlich
in Kapitel 9 zur
uck.

3) f (x) =

x + 10
maximaler Definitionsbereich
x2 1

Df = [10, )\{1, 1} = [10, 1)


(1, 1)

(1, )
Art von Intervallen:
beschrankt
beschrankt
unbeschrankt
halboffen
offen
halboffen
Wenn Df nicht angegeben, ist stets der maximale Definitionsbereich anzunehmen!)
Grenzwerte Vorbetrachtung:
1) f : R R mit f (x) = (x 2) + sign(x 2), f (2) = 0.

Uns interessieren die Punkte P1 und P2 . Wir wollen spater prazise definieren:
bei P1 :

lim f (x) = 1

rechtsseitiger Grenzwert

x2+

(gelesen x gegen 2 von rechts)


linksseitiger Grenzwert

lim f (x) = 1

bei P2 :

x2

(gelesen x gegen 2 von links)


f (x)

f (x)

9
8

P1

x
2 1
1

P2

3 2 1

Abbildung 2: Links: f (x) = (x 2) + sign(x 2) aus 1); Rechts: f (x) = x2 aus 2).
2) f (x) = x2 f
ur x R,

lim f (x) = lim f (x) = 9.

x3+

x3

Definition 6.2 Ist a = lim f (x) = lim (x) so heit a der Grenzwert von
xx0 +

xx0

f bei x, geschrieben a =: limxx0 f (x).

1
.
3) f : (1, 1) R mit f (x) = x+1
1
/ Df !), lim gibt es nicht (in R)!
Hier ist lim f (x) = 2 (Beachte +1
x1+

x1

f (x)
f (x)
6

1
x

4
3

1
1

3
x

Abbildung 3: Links: f (x) =


Wir wollen hier definieren:

1
x+1

lim

x(1)+

aus 3); Rechts: f (x) =

1
x

1 aus 4).

f (x) = +, d.h. der uneigentliche Grenz-

wert ist keine Zahl, sondern schildert nur das Grenzverhalten.


4) f (x) = x1 1.
Entsprechend wollen wir definieren (uneigentliche Grenzwerte):
lim f (x) = 1

x+

lim f (x) = 1

sin x f
ur x 0
5) f (x) =
1
sin
f
ur x > 0
x

lim f (x) =

x0+

lim f (x) = .

x0

lim f (x) = 0, lim f (x) existiert nicht, lim f (x) = 0, lim f (x) existiert nicht.

x0

x+

x0+

Damit sind alle eigentlichen und uneigentlichen Grenzwerte anschaulich erlautert. Wir
m
ussen diese anschaulichen Vorstellungen nun nur noch mathematisch prazisieren:

f (x)
1

x
2

1
Abbildung 4: Die Funktion f aus 5).

6.2

Definition des Grenzwertes einfache Regeln

Die Definition des Grenzwertes a = lim f (x) m


usste folgendes prazisieren:
xx0

f (x) unterscheidet sich beliebig wenig von a, falls x nur dicht genug an x0 ist.
Definition 6.3 Sei = Df R und f : Df R sei eine reelle Funktion, x0 R.

lim f (x)

xx0 +
lim f (x)
wenn zu jedem > 0 ein > 0 existiert,
a=
xx0

lim f (x)
xx0

0 < x x0 <
so dass fur alle x mit
0 < x0 x < gilt: x Df und |f (x) a| <

0 < |x0 x| <


Bezeichnet man

U (x0 ) := {x R| |x x0 | < }
als (offene) -Umgebung von x0 , kann man Definition 6.3
als: Zu jedem > 0 existiert ein > 0, so dass

(6.1)
lim f (x) auch schreiben

xx0

U (x0 )\{x0 } Df und f [U (x0 )[{x0 }] U f (x0 ) .


Ist x0 Df , kann nat
urlich auch auf das \{x0 }verzichtet werden.

Analog kann man einseitige Umgebungen definieren.

(6.2)

Bemerkung: Rechte bzw. linke Grenzwerte kann man nur in solchen Punkten x0
untersuchen, f
ur die eine rechts- bzw. linksseitige Umgebung ganz im Definitionsbereich
liegt! x0 braucht aber nicht aus Df zu stammen. Genauer ist der Grenzwert moglich
f
ur x0 D f , den Abschluss von Df (hier wird noch etwas mehr gefordert). Ist Df wie
hier eine Vereinigung von Intervallen, so entspricht Df Df der gleichen Vereinigung,
bei der (halb-)offene Intervalle durch abgeschlossene ersetzt werden.
BSP. 6.2
Df = (, 1) [2, 3)

D f = (, 1] [2, 3]
Der Begriff wird klar am Grenzwertspiel.

Spielmaterial: f : D R, x0 D, a R und zwei Spieler X, Y ;


Spielregel:
1) Zuerst wahlt Y Kistenhohe 2 > 0
2) Danach wahlt X die Kistenbreite 2 > 0.
3) Spielende: X hat gewonnen, wenn der Graph von f nicht oben oder unten aus der
Kiste mit dem Mittelpunkt (x0 , a) R2 , d.h. aus (x0 , x0 + ) (a , a + )
springt (vgl. Abb. 5).

(x0 , a)

Abbildung 5: Die Umgebung.


BSP. 6.3

f (x) = x2 ,

x0 = 2,

a = 4.

X u
berlegt sich folgende Strategie: Wenn Y > 0 wahlt, nehme ich = 5 , hochstens
aber = 1. Nun gilt namlich

|x2 4| = |x + 2||x 2| 5|x 2| < 5 = ,


5

d. h. mit dieser Strategie gewinnt X immer.


Satz 6.4 a = lim f (x), falls X im Grenzwertspiel immer gewinnen kann.
xx0

Wie legt sich X seine Strategie zurecht, d.h. wie findet er = () :


|f (x) a|
<
<
<
so vergroern,
dass neuer Ausdruck
f
ur x x0 noch 0 geht
BSP. 6.4

<

<

<

muss nach |x x0 |
aufgelost werden konnen

f : R \ {0} R mit

1
1
=
signx|x|
=
sign
x
1
+
x2
x2
x2
Vermutung: lim f (x) = 1 und lim f (x) = 1.
f (x) = x 1 +
x0+

1+

1
= sign x 1 + x2 .
2
x

x0

Wir untersuchen: F
ur x 0+, d.h. x > 0:
|f (x) 1| = | +

1 + x2 1| =

x2
x2

< f
ur 0 < x < 2 = .
<
2
1 + 1 + x2
f (x)
3
2
1
x

1
1

2
3
Abbildung 6: f aus Bsp. 6.4.
Bemerkung: Sicher hangt von und von x0 ab (und von f !) !

Folgerung 6.5
1) Die Grenzwerte sind eindeutig, falls sie existieren.
2) lim f (x) = a falls |f (x) a| < K fur |x x0 | < (), wenn K nicht von
xx0

und abhangt.

Beweis von 1):


Seien f1 = f2 verschiedene Grenzwerte von f bei x0 . Zu := |f1 f2 |/4 > 0 existiert
also ein 1 > 0 und ein 2 > 0, so dass
f
ur |x x0 | < 1 gilt: |f (x) f1 | < ,

f
ur |x x0 | < 2 gilt: |f (x) f2 | < ,

also
|f1 f2 | = |f1 f (x) + f (x) f2 |

|f (x) f1 | + |f (x) f2 | < +

f
ur |x x0 | < min(1 , 2 ), d.h.:
|f1 f2 | < 2 = |f1 f2 |/2 : W !

Definition 6.6 Sei f : D R.


M heit obere Schranke von f, falls f (x) M fur alle x D.
M heit untere Schranke von f, falls f (x) M fur alle x D.
M heit Schranke von f,
falls |f (x)| M fur alle x D.
Gibt es obere und untere Schranken, so heit f beschr
ankt.
(Diese Schranken sind sicher nicht eindeutig. Ist z. B. M1 < M2 und M1 obere
Schranke, so auch M2 . Problem: Gibt es kleinste obere Schranke?)
Folgerung 6.7 Ist lim f (x) = a f in der Nahe von x0 beschrankt.
xx0

In der Nahe von x0 heit hier und spater: Es gibt ein > 0, so dass die geforderte

Eigenschaft f
ur |x x0 | < gilt.
z. B. f (x) = x2 ist auf R nicht beschrankt, aber in der Nahe jedes Punktes.
1
f (x) = ist in der Nahe von 0 nicht beschrankt.
x

Beweis der Folgerung 6.7: Setze M = |a| + 1 und = (1) (oder ein anderes, fest
gewahltes > 0). Dann ist
|f (x)| = |f (x) a + a|

|f (x) a| + |a|

M f
ur |x x0 | < (1).

Satz 6.8 Rechenregeln: (Vertraglichkeit von lim mit algebraischen Operationen)


Sei
Dann gilt:

F = lim f (x), G = lim g(x).


xx0

xx0

lim [f (x) + g(x)] = F + G,

xx0

lim [f (x) g(x)] = F G,

xx0

lim [f (x) g(x)] = F G,

xx0

lim

xx0

Beweis:

F
f (x)
= , falls G = 0.
g(x)
G

|f (x) g(x) F G| = |f (x)(g(x) G) + G(f (x) F )|

= |f (x)| |g(x) G| + |G| |f (x) F | M + |G| = (M + |G|) = K


Dabei ist M eine Schranke von f nahe bei x0 , d.h. f
ur |x x0 | < .
F
ur |x x0 | < Min(F (), G (), ) folgt also die Behauptung mit der obigen
Folgerung 1).
Analoges gilt f
ur die einseitigen Grenzwerte, wobei dann z.B. in der N
ahe von x0 f
ur
den rechtsseitigen Grenzwert bedeutet:
0 < x x0 < f
ur ein > 0.

BSP. 6.5

f (x) =

x2 + |x| sign(x + 1)
sign x

0+01
=1
1
1+1+1
= 3
lim f (x) =
x(1)
1

f
ur x = 0
0+01
= 1
+1
1+11
lim f (x) =
= 1
x(1)+
1

lim f (x) =

lim f (x) =

x0

x0+

Satz 6.9 Rechenregeln: (Vertraglichkeit von lim mit Ungleichungen)

1) f (x)

A in der Nahe von x0

2) f (x)

g(x) in der Nahe von x0

lim f (x) A entsprechend fur

xx0

xx0

lim f (x) lim g(x).

xx0

xx0

3) ( Entfuhrungsprinzip) f (x) g(x) h(x) in der Nahe von x0

lim f (x) = lim h(x) lim g(x) existiert und a = lim g(x).
xx0

xx0

und

a =

xx0

Beweisskizze zu 1): Indirekt:


Annahme
f := lim f (x) > A.
xx0

f +
andererseits

f
f

einerseits

x0 x0 x0 +

Abbildung 7: Widerspruch in 1).


Beweis zu 2): Neue Funktion h(x) := f (x) g(x), d.h. 1) mit A = 0.
lim h(x) 0, aber lim h(x) = lim f (x) lim g(x) nach den Rechenregeln.

xx0

xx0

xx0

xx0

Beweis zu 3) Wenn lim g(x) als existent bekannt ist, kann einfach 2) angewendet
xx0

werden und liefert


a

lim g(x),

lim g(x)

xx0

xx0

a.

Um die Existenz von lim g(x) auch einzusehen, kann direkt mit der Definition arguxx0

mentiert werden.
|g(x) a|

|g(x) f (x) + f (x) h(x) + h(x) a|

|g(x) f (x) + |f (x) h(x)| + f


ur |h(x) a|
xx0

2 (h(x) f (x)) + |h(x) a|


0

h
g
a

x0
Abbildung 8: Skizze zum Entf
uhrungsprinzip.
BSP. 6.6
1) F
ur f : (0, 1] R mit f (x) = 2 x 1 f (x) < 2 hat man
lim f (x) = 1

x1

lim f (x) = 2.

x0+

2) Offenbar gilt (vgl. Abb. 9):


sin x

f
ur 0 < x <
cos x
2

1
1
cos x
> >
sin x
x
sin x
sin x
sin x
1>
> cos x 1 f
ur x 0+ lim
= 1.
x0+ x
x
0 < sin x < x <

sin x
= 1, also
x0 x

Entsprechend zeigt man lim

sin x
=1.
x0 x
lim

6.3

Uneigentliche Grenzwerte

Wir wollen nun die in 6.1 vorgestellten


te lim und lim f = definieren.
x

Definition 6.10 Sei a R, f : D R.


lim f (x) = a,

10

uneigentlichen

Grenzwer-

sin x

sin x/ cos x

cos x

Abbildung 9: sin x und cos x.


f

x
N()
Abbildung 10: Zur Definition des uneigentlichen Grenzwerts.
falls zu jedem > 0 ein N() R existiert, so dass fur x > N() gilt: x Df und
|f (x) a| < .
lim f (x) = a (x < N() statt x > N()).

Entsprechend definiert man

Die Existenz etwa von lim f (x) erfordert also ein K R, so dass (K, ) D.
x

Man kann sich bei x (bzw. bei x ) auf N() N beschranken.


BSP. 6.7

Vermutung:

f (x) =

x2
1 + x2

=1

1
1 + x2

lim f (x) = 1.

Dies gilt, da
|f (x) 1| = |

1
1
1
x2
1| =
< 2 < f
ur |x| >
2
2
x +1
1+x
x

11

Abbildung 11: f aus Bsp. 6.7


1
|f (x) 1| < f
ur x > N() =

1
|f (x) 1| < f
ur x <

lim f (x) = 1

lim f (x) = 1

Definition 6.11
lim f (x) = +

xx0 +

falls zu jedem > 0 ein () existiert mit f (x) >


Entsprechend definiert man
lim f (x) = ,

xx0 +

fur x x0 < .

lim f (x) = , lim f (x) = u.s.w.

xx0

x0

Abbildung 12: limxx0+ f (x) = +.


Nochmals: ist keine Zahl, sondern definiert nur ein gewisses Grenzverhalten.
BSP. 6.8

12

1
f
ur x = x0 .
x x0
lim f (x) = , lim f (x) = , lim f (x) = lim f (x) = 0.

1) f (x) =
xx0 +

xx0

2) f (x) = x3 lim f (x) =


x

lim f (x) = .

f (x)

f (x)
3
2
1
x0

1
1

2
3
Abbildung 13: Links: f aus 1); Rechts: f (x) = x3 .
Satz 6.12 Rechenregeln: Fur
in Abschnitt 6.2 bzgl. / .

lim f (x) = a = gelten die gleichen Regeln wie

Neue Regeln kommen hinzu, wenn lim = gilt:


Sei lim f = a R, lim g = lim h = jeweils beim gleichen Grenzubergang (d.h.
x x0 oder x oder x ), dann gilt
1) lim(g f ) = ( a + = )

2) lim f g = , falls a > 0 ( a = )

3) lim g h = ( = )

a
f
= 0)
4) lim = 0 (

g
= )
5) lim = , falls a > 0 (

f
a

13

Bemerkung:
1) 1) und 4) gelten auch, wenn lim f nicht existiert, f aber beschrankt bleibt
beim Grenz
ubergang.
0
, .
0
Diese Grenzwerte konnen nicht aus den Grenzwerten der einzelnen Funktionen
erschlossen werden.

2) Es fehlen Rechenregeln f
ur , 0,

BSP. 6.9
sin 1/x
= 0, da der Zahler beschrankt ist und der Nenner den Grenzwert
x0 1 + 1/x
hat.

1) lim

x2 x
1 1/x
= lim
=1
2
x x + x
x 1 + 1/x

2) lim

3) Seien an , . . . , al , bm , . . . , bk R, an = 0 = bm f
ur n, m N0 .
an xn + an1 xn1 + . . . al xl
:
x bm xm + bm1 xm1 . . . ak xk

Betrachte lim

am xnm + an1 xnm1 +


an xn + an1 xn1 . . .
=
lim
lim
x
x bm xm + bm1 xm1 . . .
bm + bm1 1/x +

0 falls m > n

an
f
ur m < n

sign
=
bm

an f
ur n = m,
bm
da der Zahler immer den Grenzwert bm hat.

6.4

Stetigkeit

Definition 6.13 Sei D R nicht leer, f : D R heit stetig in x0 D, falls gilt:


lim f (x) existiert und lim f (x) = f (x0 ) f heit stetig, falls f in allen x D
xx0

stetig ist.

xx0

Bemerkung:

14

1) lim

xx0

ist durch links- oder rechtsseitigen lim zu ersetzen, falls x0 am Rande

des Definitionsbereiches liegt.


2) Da insbesondere lim x = x0 , bedeutet also Stetigkeit, Vertauschbarkeit von lim
xx0

und Funktionsauswertung.
3) Ausgeschrieben bedeutet also stetig in x0 D .
F
ur alle > 0 existiert ein > 0, so dass f
ur x mit |x x0 | < gilt:
x D und |f (x) f (x0 )| <

(6.3)

Bemerkung: Hat der Definitionsbereich einen isolierten Punkt, z. B. Df =

[a, b] {c} mit c > b, so kann f in x0 = c nie stetig sein, da f


ur kleine > 0
Punkte mit 0 < |x x0 | < nicht mehr Df erf
ullen. (siehe Definition 6.1)
Modifiziert man Def. 6.1 zu
f
ur alle x Df mit |x x0 | < gilt: |f (x) a| < ,

dann ist jedes f in einem isolierten Punkt c stetig und dies ist im Wesentlichen der
einzige Unterschied zwischen den Definitionen.
BSP. 6.10
1) f (x) = c |f (x) f (x0 )| = 0 < f
ur > 0 beliebig f ist stetig.
2) f (x) = x |f (x) f (x0 )| = |x x0 | < f
ur |x x0 | < = f ist stetig.
3) |x| ist stetig, da ||a| |b||

|a b| aus der Dreiecksungleichung folgt.

4) f (x) = sign x ist unstetig bei x0 = 0, da:


lim f (x) = 1 lim f (x) = 1 und f (0) = 0.
xx0 +

xx0

Bemerkung: Den Graphen der Funktion ist die Stetigkeit oder Unstetigkeit meist
anzusehen ( zeichenbar ohne abzusetzen), nur kann man diese Vorstellungen nicht als

Definition fassen.
Beachte: sign x = unstetig und zeichenbar, sin x1 ist auf (0, ) stetig, nicht

zeichenbar .

Satz 6.14 Sind f : Df R, g : Dg R stetig, so ist f +


g auch stetig auf
f
Df Dg , ebenfalls
dort, wo g(x) = 0. Ist f (Df ) Dg , so ist g f (x) (d.h.
g
g(f (x))) ist ebenfalls stetig.

15

f (x)
1
x
3

1
1

Abbildung 14: f (x) = sign x aus Bsp. 6.10: Sprung.

Beweis: Die ersten 4 Falle folgen direkt aus der Vertraglichkeit von Limes und algebraischen Operationen. Wir beweisen nur den letzten Fall, f
ur den
aus
lim f (x) = f (x0 ) ,
lim g(y) = g(f (x0))
xx0

yf (x0 )

zu folgern ist:
lim g(f (x)) = g(f (x0)).

xx0

Sei > 0, dann existiert > 0, so dass f


ur

0 < |y f (x0 )| < gilt: y Dg und |g(y) g(f (x0 ))| < .
Zu existiert aber > 0, so dass f
ur
0 < |x x0 | < gilt: x Df und |f (x) f (x0 )| < , also auch f (x) Dg und
|g(f (x)) g(f (x0))| < , wie behauptet.

Bemerkung: z. B. lim f
x0

sin x
x

=f

sin x
x0 x
lim

= f (1) f
ur stetige f ,

dagegen lim sign(x2 ) = lim 1 = 1 aber sign lim x2 = sign 0 = 0,


x0+

x0+

x0+

d.h. f
ur unstetige f mu obiger Satz nicht gelten.
Mit Hilfe des obigen Satzes kann man nun viele stetige Funktionen angeben. Zuvor
jedoch:
Typen von Unstetigkeitsstellen:
I. f hat bei x0 einen Sprung, falls

lim

xx0 +

aber.
Z. B. sign x bei x0 = 0.

lim

xx0

gilt, beide Limiten existieren

II. f hat bei x0 eine hebbare Unstetigkeit, falls f (x0 ) = lim f, der lim aber
xx0

existiert.
Z. B. (sign x)2 bei x0 = 0.

III. f hat bei x0 eine Lu


/ Df , aber lim f (x) existiert. Durch f (x0 ) :=
cke, wenn x0
xx0

lim f kann man f bei x0 stetig erg


anzen.

xx0

16

f (x)

f (x)

Abbildung 15: Links: Sprung (Typ I); Rechts: hebbare Unstetigkeit (Typ II).
(x 1)2 (2x + 1)
ist nicht definiert f
ur x = 5, x = 1.
(x 1)2 (x 5)
2x + 1
3
lim f (x) = , aber lim f (x) = lim
=
x5+
x1
x1 x 5
4
3
!
f ist in x0 = 1 durch f (x) = stetig erganzbar.
4

Z. B. f (x) =

IV. f hat bei x0 einen Pol, falls lim f (x) = .


Z. B. f (x) =

1
(xx0 )n

xx0

N hat Pol bei x = x0 .


f (x)

f (x)

x0 = 1

3
Abbildung 16: Links: L
ucke (Typ III); Rechts: Pol (Typ IV).

17

x
3

Definition 6.15 Ein Pol bei x0 heit Pol nter Ordnung, falls
lim (x x0 )n f (x) existiert und weder gleich 0 noch ist.
xx0

3x 2
hat bei x = 1 einen Pol 6. Ordnung.
(x 1)6
f (x) = 1/ sin x hat bei x = 0 einen Pol 1. Ordnung, da lim xf (x) = 1
x0
Es gibt noch Unstetigkeitsstellen, die nicht von Typ IIV sind, aber im Allgemeinen
nicht klassifiziert werden.
Z. B. f (x) = sin 1/x hat bei x = 0 eine oszilierende Unstetigkeit

Z. B. f (x) =

Abbildung 17: Oszillierende Unstetigkeit von f (x) = sin 1/x.


Dagegen ist f (x) = x sin 1/x mit f (0) = 0 stetig denn |f (x) f (0)| = |x|| sin 1/x| <
|x| < f
ur |x 0| < =
BSP. 6.11

Stetige Funktionen:

1) Polynome sind stetige Funktionen, denn wir haben gezeigt, dass c, x stetig sind
und damit nach obigem Satz auch c0 + c1 x, c0 + c1 x + c2 x2 u.s.w.
Funktionsverlauf ist hinlanglich bekannt.
n

Sei P (x) =
k=0

n 1 an = 0

lim P (x) = (sign an )

lim P (x) =

ak xk

sign (an ) falls n = 2l


sign (an ) falls n = 2l + 1

f
ur ein l N

P (x)
mit Polynomen P und Q sind stetig dort,
Q(x)
wo Q(x) = 0 nach obigem Satz.

2) Rationale Funktion R(x) =

18

Bsp.:
R(x) =

2(x 1)2 (x 4)(x 6)3


.
(x 2)(x 5)2 x3
R(x)
10
8
6
4
2
x

10 8

2
2

10

4
6
8
10
Abbildung 18: Die rationale Funktion R aus Bsp. 6.11,2).
Die Funktion R ist stetig f
ur x = 0, 2, 5 und

lim R(x) = 2.

Beachte: An Nullstellen und Polen geraden Grades findet kein Vorzeichenwechsel statt, im Gegensatz zu solchen ungeraden Grades.
3) Trigonometrische Funktionen (werden als bekannt vorausgesetzt, siehe
Abb. 19). Wir werden spater die Funktionen sin x, cos x noch exakt definieren.
Dann werden sie auch als stetig entlarvt.
Mit sin x, cos x definiert man sich weitere trigonometrische Funktionen (Abb. 20).
Definition 6.16
tan x =

sin x

fur x = k +
cos x
2

19

cot x =

cos x
fur x = k, k Z
sin x

Abbildung 19: Die trigonometrischen Funktionen sin x und cos x.


4
3
2
1
3

1
2
3
4
5

4
3
2
1

1
2
3
4
5

Abbildung 20: Die trigonometrischen Funktionen tan x und cot x.


4) Exponentialfunktion: Spater wird die Funktion ex = exp(x) exakt definiert
und als stetig erkannt (s. Abb. 21). Die Funktion ist vertafelt und implementiert
in allen Taschenrechnern.
Es gilt: e1 = e = 2, 71 . . . = Eulersche Zahl R,
/ Q, (Definition spater)

em/n = ( n e)m f
en = e e . . . e,
ur n, m N.
nmal

Damit kennt man ex f


ur x Q.
0
Insbesondere e = 1.
Wegen der Stetigkeit ist damit ex f
ur alle x R festgelegt.
Bemerkung:

1. Durch die Gleichung y = exp(x) wird f


ur ein beliebiges y R ein eindeutiges
x R festgelegt (spater), bezeichnet mit
x = ln(y)
((nat
urlicher) Logarithmus von y).

20

8
6
4
2
x
6

Abbildung 21: Die Exponentialfunktion ex .


2. Mit 1. ist auch die Definition einer allgemeinen Potenz zur Basis a
R, a > 0, moglich durch
ax := e(ln(a)x) f
ur x R.
F
ur x Q stimmt dieses u
berein mit:

am/n = ( n a)m

3. Der Vorteil der Funktion ex gegen


uber ax f
ur a = e wird spater klar:
x
x
(e ) = e .
Benutzt wurde oben:
Satz 6.17 Sind f und g stetig und f (x) = g(x) fur x Q f (x) =
g(x) x R.
Beweis: Es reicht zu zeigen: sei f : R R stetig und f (q) = 0 f
ur alle q Q,
dann ist auch f (x) = 0 f
ur alle x R.
Sei x R, > 0 beliebig. Es reicht zu zeigen: |f (x)| < . Zu > 0 existiert ein
> 0, so dass f
ur r R mit |x r| < gilt |f (x) f (r)| < .
Es gibt ein (sogar unendlich viele) r Q mit |x r| < (),
also |f (x)| = |f (x) f (r)| < .
Die Eigenschaft gilt also f
ur alle A R, die () erf
ullen, also (in R) dicht sind.
Kurzer Exkurs ins Komplexe: Polynome und rationale Funktionen sind im
Komplexen genauso definiert.
Auerdem ist ei = cos + i sin f
ur R als symbolische Schreibweise

21

eingef
uhrt. Spater wird nach einer einheitlichen Definition von exp(z) f
ur z C
dies als Aussage folgen f
ur z = i, R und f
ur diese komplexe Exponentialfunktion gelten die gleichen Regeln wie im Reellen, zum Beispiel:
ez1 +z2 = ez1 ez2 , ez =

1
.
ez

Die komplexe Exponentialfunktion hat keine Nullstellen.


Wir konnen daher nun allgemein ohne Widerspruch definieren:
Definition 6.18 ez := exp(x + iy) := ex eiy = ex (cos y + i sin y) fur x, y
R bzw. z = x + iy C.
Wir konnen auch sin, cos im Komplexen definieren:
Dazu setzen wir die Beziehungen f
ur R

1 i
(e ei )
2i
1 i
(e + ei )
cos =
2
sin =

f
ur z C fort:
Definition 6.19
1 iz
(e eiz )
2i
1
cos z = cos(x + iy) = (eiz + eiz )
2
fur x, y R bzw. z = x + iy C.
sin z = sin(x + iy) =

Es gelten entsprechende Rechenregeln: z. B.


sin2 z + cos2 z = 1
sin(z1 + z2 ) = sin z1 cos z1 + cos z1 sin z2 .
Weiter im Reellen:
5) Hyperbelfunktionen (Abb. 22):
Definition 6.20 Es wird definiert fur x R:
sinh x := 1/2(ex ex )
sinushyperbolikus

x
x
cosh x := 1/2(e + e )
cosinushyperbolikus
x
cosh x
sinh
coth x =
.
entsprechend tanh x =
cosh x
sinh x

22

Nat
urlich sind sinh x, cosh x stetig.
Da cosh x = 0 f
ur alle x R, ist auch tanh x stetig in R.
sinh x = 0 f
ur ex = ex , was nur f
ur x = 0 gilt. Also ist coth x stetig f
ur x = 0.
f (x)

f (x)

cosh(x)
cotanh(x)
1
1 x
e
2

x
tanh(x)

sinh(x)

Abbildung 22: Die Hyperbelfunktionen.


Warum die Bezeichnung sinus hyperbolikus u.s.w.?
Es gelten entsprechende Rechengesetze wie f
ur die trigonomentrischen Funktionen:
sinh(x) = sinh x
sin(x) = sin x
cos(x) = cos(x)
cosh(x) = cosh(x)
2
2
cos x + sin x = 1
cosh2 x sinh2 x = 1
sin(x + y) = sin x cos y + cos x sin y sinh(x + y) = sinh x cosh y + cosh x sinh y
Beweis: Durch Nachrechnen; z. B. cosh2 x sinh2 x = 14 (ex + ex )2 14 (ex ex )2 = 1
weitere Formeln siehe Formelsammlung.
Der Zusammenhang sin sinh wird noch klarer im Komplexen:
Definition 6.21

1
sinh z := (ez ez )
2
1
cosh z := (ez + ez )
2

23

fur z C

Folgerung 6.22
cos z = cosh(iz)

sin z = i sinh(iz)

Jetzt lassen sich die Ahnlichkeiten


in den Rechengesetzen verstehen. Der innere Zusammenhang der trigometrischen und hyperbolischen Funktion ist in der Wirklichkeit
materialisiert:
schwach ged
ampfte Schwingung y(t) = Aekt cos t und
stark ged
ampfte Schwingung y(t) = Aekt cosh t (s. Abb. 23).
f (x)
f (x)

Abbildung 23: Schwach und stark gedampfte Schwingung.


Ausblick: Stetigkeit fu
r allgemeine Funktionen
Die Begriffe Grenzwert und Stetigkeit lassen sich immer dann definieren, wenn eine
Abstandsmessung vorliegt und damit nahe bei x0 bzw. nahe bei f (x0 ) gefasst
werden kann.
Auf C = R2 ist der Abstand von z1 und z2 die Lange |.| von z1 z1 . |.| wiederum ist
die Euklidische Lange (Norm):
|z| =

x2 + y 2 f
ur z = x + iy C.

Damit u
ur Funktionen f : D C mit
bertragt sich die Formulierung (6.3) wortlich f
D C und mit entsprechender Interpretation von Umgebungen U (z0 ) nach (6.1) (als
Kreise in R2 um z0 auch (6.2)).
Sind angemessen (V, ||.||V ), (W, ||.||W ) normierte Vektorraume und f : D W mit
D V , so ist in (6.3) zu ersetzen
||x x0 ||V < bzw. ||f (x) f (x0 )||W < .
Insbesondere konnen also V bzw. W Rn bzw. Rm sein. Eine mogliche Norm ist die
Euklidische Norm.

Eine Anderung
der Norm durch Umskalierung (||x|| statt ||x|| f
ur ein festes > 0)
andert den konkreten Wert zu , nicht aber die (Un-)Stetigkeit an einer Stelle.

24

Kann es prinzipiell verschiedene Normen geben, so dass eine Abbildung von stetig zu unstetig wechselt? Wir werden spater sehen, dass dies bei endlich-dimensionalen
Vektorraumen nicht moglich ist, wohl aber bei unendlich-dimensionalen (etwa Funktionenraumen).

6.5

Eigenschaften stetiger Funktionen

Satz 6.23 Sei Df R, nicht leer, f : Df R, x0 Df . f sei stetig in x0 und


f (x0 ) > 0. Dann gibt es ein > 0, sodass f (x) > 0 fur |x x0 | < .
Beweis: Setze = f (x0 ) und wahle = () aus Stetigkeitsdefinition.
f (x0 )

f (x)

b
a

x0

Abbildung 24: Links: Umgebung mit f (x) > 0 (Satz 6.23), rechts: Existenz mindestens
einer Nullstelle f () = 0 (Satz 6.25).

Folgerung 6.24 Sei f (x0 ) > a, dann gibt es ein > 0 mit f (x) > a fur |x x0 | <
d. h. f (x) > a in der Nahe von x0.

BSP. 6.12
Wer stetig wachst und noch nicht an die Decke stot, kann noch weiter
wachsen ohne anzustoen.
Satz 6.25 Sei f stetig auf [a, b] und f (a) > 0, f (b) < 0 (oder umgekehrt). Dann gibt
es mindestens ein (a, b) mit f () = 0.
Bemerkung:
1) muss nicht eindeutig sein.

25

2) F
ur unstetige f gilt dieser Satz nicht.
Bsp.: f (x) = sign x + 21 auf [1, 1] (Abb. 25, links) hat keine Nullstelle, obwohl
f (1) < 0, f (1) > 0.
3) Ist f nur auf [a, b] Q definiert, muss dieser Satz auch nicht gelten:
Bsp.: f (x) = x2 2 auf [0, 2] (Abb. 25, rechts). Dann gilt: f (0) = 2 < 0, f (2) =

2 > 0, aber f (x) = 0 f


ur x = = 2 Q. Daher wird man beim Beweis des
obigen Satzes das benutzen m
ussen, wodurch sich Q und R unterscheiden: das
DedekindSchnittAxiom.
f (x)

f (x)

x
1

1
2

Abbildung 25: Links: f (x) = sign x + 21 ; Rechts: f (x) = x2 2.


Beweis:
Wir definieren einen Dedekindschen Schnitt U, O in R :
U = (, a] {x [a, b]|f (y) > 0 f
ur alle y [a, b] und y x} , O = R \ U,
dann U O = , U O = R und f
ur u U, o O gilt u o, denn:
Ist o > b, dann ist u o klar, f
ur o [a, b] folgt aus u > o f
ur ein Paar von u und o:
f (y) > 0 f
ur
f (y) > 0 f
ur

y [a, b], y u, also


y [a, b], y o : W !

Aus Satz 6.23 folgt: U hat kein Maximum, denn ware m = max U, dann f (y) > 0 f
ur
alle y [a, b], y m. Nach Satz 6.23 ist aber auch f
ur ein > 0
f (z) > 0 f
ur m z < m + und so auch z U : W !
Also muss O sein Infimum als Minimum annehmen.

26

Annahme:
f () < 0 nach Satz 6.23 kann nicht Minimum von O sein im Widerspruch zu
oben.
f () > 0 U, da auch f (y) > 0 f
ur y [a, b] und y gilt. Andernfalls gabe es
ein o O mit o < im Widerspruch zu oben. U ist aber schon ausgeschlossen.
Also bleibt nur:
f () = 0.

Folgerung 6.26
stelle, weil

1. Polynome ungeraden Grades haben mindestens eine reelle Nulllim a2n+1 x2n+1 + . . . = sign(a2n+1 ).

2.

Zwischenwertsatz Ist f stetig auf [a, b] und f (a) < c < f (b), dann gibt es

ein (a, b) mit f () = c.


f (x)
f (b)
c
f (a)
a

Abbildung 26: Existenz eines Zwischenwerts mit f () = c.


BSP. 6.13
Ein Zug braucht f
ur 200 km 4 Stunden (Durchschnittsgeschwindigkeit
v = 50 km/h).
Gibt es einen Zeitraum von einer Stunde in der er genau 50 km zur
uckgelegt hat?
Sei s(t) die zur
uckgelegte Strecke bis zur Zeit t, wobei t in h gemessen wird, s(t) in
km. Also s(0) = 0, s(4) = 200.
Es sei f (t) = s(t + 1) s(t) f
ur 0 t 3.
Annahme: F
ur alle t [0, 3] gilt f (t) > 50, also insbesondere f
ur t = 1, 2, 3 und so
s(4) = f (3) + f (2) + f (1) + f (0) > 200, ein Widerspruch zu f (t) > 50. Ebenso kann
f (t) < 50 f
ur alle t [0, 3] nicht gelten.
Also: f (t) 50 wechselt das Vorzeichen in [0, 3] und so gibt es ein t0 [0, 3] mit
f (t0 ) = 50.
Dies setzt voraus, dass s eine stetige Funktion der Zeit ist!

27

Folgerung 6.27 Ist I ein Intervall und f : I R stetig, so ist f (I) ebenfalls ein
Intervall.
Beweis: Ein Intervall I R (alle Varianten moglich) ist gerade durch:
a, b I c I f
ur alle c (a, b)

(6.4)

gekennzeichnet (I ist konvex).


Seien also f (x), f (y) f [I] und z f (x), f (b) (oBdA. f (x) < f (y)), dann existiert
nach dem Zwischensatz ein (x, y) (oBdA. x < y), d.h. I mit z = f (), also
z f [I].

BSP. 6.14
1
f [(0, 1]] = [1, ).
x
f : (0, 1) R mit f (x) = 7 f ((0, 1)) = {7} = [7, 7].
f : (0, 1] R , f (x) =

Man sieht, dass die Offenheitvon Intervallen durch stetige Abbildungen nicht u
ber
tragen wird (wohl aber die Abgeschlossenheit!)

Zuvor sollen einige neue Begriffe f


ur Zahlenmengen wiederholt werden:
Bezeichnung: Sei = T R eine Teilmenge.
a R heisst obere Schranke von T , falls a x f
ur alle x T ,
a T heisst Maximum von T , falls a x f
ur alle x T ,
a R heit obere Grenze oder Supremum, falls a die kleinste obere Schranke ist
(geschrieben a = sup T ).
Entsprechend definiert man:
Minimum bzw. untere Schranke bzw. untere Grenze = Infimum (inf T ).
Ein Maximum ist also eine obere Schranke, die zur Menge gehort. Eine aquivalente
Formulierung f
ur sup T ist:
Sei a obere Schranke von T .
a = sup T F
ur alle > 0 gibt es ein x T, so dass x > a .
BSP. 6.15

(6.5)

T = (1, 1] max T = 1 = sup T, min T ex. nicht, aber inf T = 1.

28

Satz 6.28 Sei T R.


1) Existiert max T , so ist max T = sup T , ist sup T T , dann max T = sup T .
2) Jede nach oben beschrankte Menge T besitzt ein Supremum.
3) Die Aussagen 1), 2) gelten analog fur nach unten beschrankte Mengen.
Beweis:
1) ist klar. 2) O = {x R|x ist obere Schranke von T } und R \ O definieren einen
Dedekindschen Schnitt, da f
ur u R \ O, o O gilt:
Es existiert ein x T mit x > u, aber auch x o, so dass u o.

(6.6)

R \ O hat kein Maximum, denn wegen (6.6) ist mit u R \ O auch z.B. das groere
1
(x + u) R \ O.
2
Also hat O ein Minimum, das gerade sup T darstellt.

Bezeichnung: Maximum, Supremum u.s.w. wird auch fu


r Funktionen definiert,
und zwar dadurch dass als T der Wertebereich gewahlt wird, also z.B. f
ur f : D R,
D R,
sup f := sup f (x) := sup{f (x)|x D}
xD

Bemerkung: Die obigen Begriffe konnen auch allgemein auf einer geordneten Menge
eingef
uhrt werden. Die Aussage 2) ist aber eine Spezialitat von R, da das Dedekindsche Schnittaxiom eingeht. Z.B. ist in Q {x Q|x2 2} zwar nach oben beschrankt,
hat aber kein Supremum.
Satz 6.29 Seien a, b R, a < b, I = [a, b] und f : I R stetig. Dann gilt:
1) f ist beschrankt.
2) f besitzt mindestens ein Maximum und ein Minimum.
3) f (I) ist das abgeschlossene Intervall [min f, max f ].
Beweis: 1),2): spater;
3) folgt aus 2).

Bemerkung: Die Abgeschlossenheit des Intervalls I ist notwendig,


z. B. f : [0, 1] R
f (x) = x2
max f = 1 min f = 0
aber f : (0, 1] R

f (x) = x2

hat kein Minimum

29

Bemerkung: Man betrachte die Funktion


f (x) = sin

1
f
ur x = 0, f (x) = 0.
x

Sie ist unstetig und l


asst trotzdem keinen Zwischenwert aus d.h. f
ur beliebige

a < b gilt f
ur f (a) < c < f (b): Es gibt ein (a, b) mit f () = c.

6.6

Kompakte Mengen und Stetigkeit

Nach Satz 6.29 hat ein beschranktes abgeschlossenes Intervall I = [a, b] eine wesentliche
Eigenschaft. Dies ist die Kompaktheit dieser Menge. Am einfachsten kann dieser Begriff
u
uhrt werden.
ber konvergente Folgen eingef
Definition 6.30 Sei (an )nN eine Folge in R, a R. (an ) heit konvergent gegen
a (fur n ), geschrieben als
an a fur n oder
a = lim an ,
n

wenn zu jedem > 0 ein N() N existiert, so dass fur n > N() gilt: |an a| < .
Dies entspricht also im Wesentlichen Def. 6.10. Daher gelten die Eindeutigkeit von
Grenzwerten und die Rechenregeln (Vertraglichkeit mit algebraischen Operationen und
Ordnung) hier entsprechend.
Analog gilt:
Satz 6.31 Sei (an )n eine konvergente Folge, dann ist (an ) beschrankt.
Beweis: Zu = 1 existiert N N, so dass mit a := lim an
n

|an |

1 + |a| f
ur n > N gilt.

Somit ist M := max{1 + |a|, |a1 |, . . . , |aN |} eine mogliche Schranke.


Besonders einfach lasst sich die Konvergenz bei monotonen Folgen klaren, wobei
Definition 6.32 Sei (an )n Folge in R.

30

1) (an )n heit monoton wachsend [fallend], wenn


an+1

[ ] an fur alle n N

gilt.
Gilt immer > [<], so heit die Folge streng monoton wachsend [fallend].
2) (an )n heit nach oben [unten] beschr
ankt, wenn
{an | n N} nach oben [unten] beschrankt ist,
bzw. beschr
ankt, wenn beides gilt.
Dann gilt:
Satz 6.33 Sei (an )n Folge in R, monoton wachsend und nach oben beschrankt. Dann
gilt
an a := sup ak fur n .
kN

Beweis: Sei > 0. Da a keine obere Schranke der an sein kann, existiert ein
N() N mit
aN () > a
und so f
ur n > N():
a+>a
bzw.

an > aN () > a
|an a| < .

Bemerkung: Ist (an )n etwa eine Folge in Q, so gilt die gleiche Aussage, aber mit a R
und i.a. nicht a Q.
Jede Folge enthalt unendliche verschiedene Teilfolgen, wobei
Definition 6.34 Sei (nk )kN eine streng monoton wachsende Folge in N, sei (an )nN
eine Folge in R.
(ank )kN heit eine Teilfolge von (an )nN .

31

Jede Teilfolge einer konvergenten Folge konvergiert gegen den gleichen Grenzwert

(Ubung),
dagegen kann eine nicht konvergente Folge konvergente Teilfolgen besitzen.
BSP. 6.16
an := (1)n
ist nicht konvergent, aber
nk := 2k :
ank 1 f
ur k ,
nk := 2k + 1 : ank 1 f
ur k .
Stetigkeit kann auch u
ber Folgenkonvergenz charakterisiert werden:
Satz 6.35 Sei f : D R, D R nicht leer, x0 D.
f ist in x0 stetig Es gibt eine (einseitige) Umgebung von x0 in D und fur alle Folgen
(xn )n in D mit xn x0 fur n gilt:
f (xn ) f (x0 ) fur n ,
(Folgenstetigkeit in x0 ).

Beweis: Ubung
Die Richtung zeigt man durch Kontraposition, in dem man f
ur f , das in x0 nicht

stetig ist eine Folge (xn )n D konstruiert, so dass


xn x0 f
ur n

aber f (xn ) f (x0 ) f


ur n nicht gilt.

Kompakte Mengen sind allgemein definiert durch


Definition 6.36 Sei K R.
1) K heit abgeschlossen, wenn jede Folge (an )n mit an K fur alle n N
(jede Folge in K), die konvergiert, a := lim an , auch a K erfullt (in K
n

konvergiert).

2) K heit kompakt, wenn jede Folge in K eine Teilfolge besitzt, die in K konvergiert.
Bemerkung:
1) Kompakte Mengen sind abgeschlossen.

32

2) Abgeschlossene Intervalle, R, , [a, ) f


ur a R sind abgeschlossen.
3) Offene Intervalle sind nicht abgeschlossen.
4) R und [a, ) sind nicht kompakt.
5) Eine abgeschlossene, nach oben [unten] beschrankte Menge T R hat ein Maximum [Minimum], da nach Satz 6.28 sup T existiert. Immer gibt es dazu eine
Folge (xn )n mit xn T und
sup T

1
< xn
n

sup T, also

xn sup T f
ur n
und somit sup T T, sup T = max T .
Diese Topologie-Begriffe werden erganzt durch
Definition 6.37 Sei A R.
1) A heit offen, wenn R \ A abgeschlossen ist.
2) x R heit H
aufungspunkt (HP ) von A, falls eine Folge (xn ) in A existiert
mit x = lim xn .
n

3) A := A {x R | x ist HP von A} heit Abschluss von A.


4)
A := A \ {x A | x ist HP von R \ A} heit inverser Kern von A.
5) A := A R \ A heit der Rand von A.
Einige unmittelbare Folgerungen sind
Satz 6.38

1) A ist abgeschlossen A = A.
2) A ist offen A =
A.
3) x A x ist HP von A und HP von R\A.

33

BSP. 6.17
A = [a, b)

A = [a, b],

A = (a, b),

A = {a, b}

Alle obigen (Topologie-)Begriffe konnen auf einem Raum mit Abstandsmessung, also
inbesondere einem normierten Raum definiert werden und haben die obigen Eigenschaften. Dies gibt also f
ur (Rn , ||.||), wobei ||.|| z. B. die Euklidische Norm ist, aber
auch f
ur (C[a, b], ||.||), z. B. mit der Maximumnorm.
Kompaktheit wird durch eine stetige Abbildung bewahrt:
Satz 6.39 Sei K D R, K kompakt, f : D K stetig, dann ist f [K] kompakt.
Beweis: Sei (yn )n eine Folge in f [K]. Zu yn existiert ein xn K mit f (xn ) = yn .
(xn )n besitzt eine in K konvergente Teilfolge:
xnk x K f
ur k
und so nach Satz 6.35 auch
ynk := f (xnk ) f (x) f [K] f
ur k .

Welche Mengen sind kompakt? Weiterhin zur Abgeschlossenheit ist die Beschranktheit
von K notwendig. Andernfalls gibt es etwa zu n N
xn K mit xn+1

xn

n,

was keine konvergente Teilfolge enthalten kann. In R (und auch Rn bzw. endlichdimensionalen Raumen, aber nicht in unendlich-dimensionalen Raumen) charakterisieren diese beiden Eigenschaften schon die Kompaktheit:
Satz 6.40 (Bolzano-Weierstra)
Sei K R abgeschlossen und beschrankt, dann ist K kompakt.
Beweis:
Zu zeigen ist: Sei (xn )n eine Folge in K, also beschrankt, dann hat (xn )n eine konvergente Teilfolge.
Wegen der Abgeschlossenheit folgt auch x := lim xn K.
n

Seien a < b so, dass K [a, b] und setze

1
a1 := a, b1 := b und f
ur n = 1, 2 . . . : c := (an + bn ).
2

34

Falls {n|xn [ak , c]} unendlich ist, dann


ak+1 := ak ,
bk+1 := c,
sonst ak+1 := c, bk+1 := c.
F
ur die so definierten Folgen (ak )k , (bk )k gilt
(ak )k ist monoton wachsend
(bk )k ist monoton fallend
ak

(6.7)

bk f
ur alle k N

(d.h. sie bilden eine Intervallschachtelung).


Da auch ak

b bzw. a

bk f
ur k N, folgt nach Satz ??
ak a := sup ak
kN

bk b := inf bk
kN

f
ur k .
Weiter ist
1
(bk ak ), d.h.
2
k1
1
0 f
ur k
= (b a)
2

bk+1 ak+1 =
bk ak
woraus folgt:

a = b.
Die gew
unschte Teilfolge kann nun folgendermaen ausgewahlt werden:
n1 := 1 und f
ur k = 2, . . . wahle nk > nk1 ,
so dass
xnk [ak , bk ].
Dies geht, da [ak , bk ] unendlich viele Folgenglieder enthalt. Mit a = lim ak = lim bk
k

gilt auch xnk a f


ur k .

Also ist I = [a, b] eine kompakte Menge und somit f


ur ein stetiges f auch f [I] kompakt.
Dies impliziert Satz 6.29 1) und auch 2) nach Bemerkung 5), S. 33. Das Intervallschachtelungsprinzip gilt allgemein:

35

Satz 6.41 Seien (xn )n , (yn )n Folgen in R, so dass gilt


(xn )n ist monoton wachsend,
(yn )n ist monoton fallend,
xn

yn fur alle n N.

Dann:
x := sup xn

y := inf yn
nN

nN

xn x, yn y fur n .
Gilt (yn xn ) 0 fur n , dann ist x = y und es gilt die Einschlieung
|x xn |

yn xn

|x yn |

6.7

yn xn .

Algorithmische L
osung von Gleichungen I

Der Beweis von Satz 6.25 ist ein reiner Existenzbeweis, der keine Nullstelle angibt.
Ein konstruktiver Beweis dagegen gibt einen Algorithmus an zur Bestimmung einer
Losung. Dieser kann aus endlich vielen elementaren Operationen(wie das Gausche
Eliminationsverfahren), oder aber aus im Prinzip unendlich vielen bestehen (iteratives
Verfahren), d.h. es definiert eine Folge. Um dennoch nach endlich vielen Schritten eine
Naherungslosung zu haben, ist deren Konvergenz notig.
Ein iteratives Verfahren zur Bestimmung einer Nullstelle nach Satz 6.25 ist das
Bisektionsverfahren:
Definierte Folgen (xn ), (yn ) durch
x1 := a,

y1 := b

und rekursiv f
ur k N : := 21 (xk + yk ).
Ist f () = 0, dann Abbruch:
:= .
Ist f () < 0, dann xk+1 := , yk+1 := yk .
Ist f () > 0, dann xk+1 := xk , yk+1 := .
(xn )n ist monoton wachsend, (yn )n monoton fallend, wegen
xn

yn f
ur alle n N

36

sind die Folgen auch beschrankt und somit nach Satz 6.40 bzw. Satz 6.41
xn x := sup xn
nN

yn y := inf yn
nN

f
ur n .
Es ist auch
x = y,
da f
ur die Differenzfolge zn := yn xn
gilt:

1
1
zk+1 = (yk zk ) = zk
2
2

und so
zn = (b a)

1
2

n1

0 f
ur n .

Wegen der Stetigkeit von f gilt also nach Satz 6.35


f (x) =
f (x) =

lim f (xn )

lim f (yn )

und so f (x) = 0, d.h. = x ist eine mogliche Losung.

Ein moglicher Pseudocode soweit ist


Eingabe a, b R
while
(f ( := 21 (a + b)) = 0)
If
f () > 0

do
then a :=
else b :=

end
Selbst bei exakter Ausf
uhrung (s.u.) wird i.A. das Verfahren nicht nach endlich vielen
Schritten abbrechen. Ob es praktisch ist, entscheidet
Die Durchf
uhrbarkeit und der Aufwand f
ur einen Iterationsschritt (hier Addition,
Multiplikation, Auswertung von f (!))

37

Die Anzahl der Iterationsschritte, die notig sind, um einen Fehler (hier |xn |
oder |yn |) kleiner als eine Genauigkeit > 0 (Eingabe) zu garantieren,
1
bzw. die Anzahl der Schritte, um den Fehler um einen festen Faktor (z. B. 10
) zu
reduzieren.
Ist nur Konvergenz von z. B. xn gesichert, kann u
ber den zweiten Punkt a priori (d.h.
vor einem tatsachlichen Computerlauf) nichts ausgesagt werden. Hier ist wegen der
einschlieenden Intervallschachtelung die Situation besser:
|xn , |yn |

(b a)

1
2

n1

so dass f
ur eine gew
unschte Genauigkeit I > 0 ein n N mit
1
2

(b a)

n1

hinreichend ist (worst case (bei exakter Arithmetik)). Dies bedeutet hier (Rechnen mit
ln s.u.)
ln ba
I
n
+ 1 = N(I ).
ln(2)
F
ur I = 10k , k N, etwa hat N(I ) die Form
N(k) = A + Bk
mit konstanten A, B > 0, so dass f
ur die Verbesserung der Genauigkeit um eine Dezimalstelle eine feste Anzahl B von zusatzlichen Iterationsschritten notig ist. Ob dies
akzeptabel ist, hangt von der Groe von B ab, oft gibt es schneller konvergente
Verfahren. Der Vorteil hier liegt in der Einschlieung
xn

yn ,

(6.8)

die a posteriori (wahrend des Computerlaufs) (bei exakter Arithmetik) die Schranke
yn xn garantiert.
Ein moglicher Pseudocode soweit ist
Eingabe a, b R, I > 0, n := 1
and
while f ( := 12 (a + b) = 0)
begin
n := n + 1
If
f () > 0
then a :=
else b :=
end
end

38

N(I )

bzw. mit der while-Zeile, ohne Indexzahlung


while f

1
:= (a + b)) = 0))
2

(b a)

and

I .

Ist bei einem Verfahren zur Losung von f (x) = 0 eine Einschlieung nicht garantiert,
sondern nur eine konvergierende Folge, dann kann die Genauigkeit nur indirekt u
ber
die Groe des Defekts abgeschatzt werden, d. h. u
ber die Forderung
|f (xn )|

I .

Welche Genauigkeit dies f


ur die Losung, d. h.
|xn |

bedeutet, hangt vom Ma der Stetigkeit von f 1 (Existenz in der Nahe von y = 0
vorausgesetzt) ab. Je nachdem welche Fehlerverstarkung zu erwarten ist, spricht man
von gut oder schlecht konditionierten Problemen (Abb. 27).
y

y
f
f
x

Abbildung 27: Links: gut konditioniertes Problem, rechts: schlecht konditioniert.


Hinreichend schlecht konditionierte Probleme konnen u
berhaupt nicht numerisch gelost
werden (!): s.u. Die f
ur eine Iteration notige Auswertung von f wird. i.a. nur approximativ moglich sein, d.h. durch Berechnung eines Naherungswerts f Q (genauer
f M, die Menge der Maschinenzahlen) (wieder durch eine Iteration z. B. ), so dass
|f (x) f|

(6.9)

bestenfalls f
ur f in der Groenordnung der Maschinengenauigkeit. I.a. wird also die
approximierende Folge xn mit Fehlern zu xn gestort sein, hier beim Bisektionsverfahren
ist es zumindestens die Abfrage f () > 0. Ist etwa f () > 0, aber f() f < 0, so
wird im Verfahren falsch entschieden und die Einschlieung geht verloren. Die Abfrage
f () = 0 auf Abbruch ist also nicht sinnvoll, sondern sollte durch
|f ()|

39

ersetzt werden. Bei Abbruch hangt dann aber i.a. die Groe der Losung von der Kondition ab. Aber auch wenn f nur durch Elementaroperationen realisiert werden kann,

liegt i.a. wegen M = Q ein Darstellungsfehler vor, d.h. nur x M mit


|x x|

z ,

wobei z der Maschinengenauigkeit entspricht. Also ist Stetigkeit von f notig, um


u
berhaupt f naherungsweise auswerten zu konnen.
|f (x) f| = |f f (
x)| + |f (
x) f (x)|
f + (z ) =: f ,

d. h. der Pseudocode sollte eher beginnen mit


while

6.8

f ( := 21 (a + b)) f

(b a) I .

and

Umkehrfunktionen

Die Bijektivitat, d.h. die Existenz einer Umkehrabbildung f 1 , ist schwer zu u


ufen
berpr
in komplizierten Fallen. Bei stetigen Funktionen hat man ein einfaches Kriterium. Dazu
zunachst
Definition 6.42 f : Df R mit Df R heit monoton wachsend, wenn fur
alle x > y gilt f (x) f (y).
f heit streng monoton wachsend, wenn fur x > y stets f (x) > f (y) gilt. Entsprechend definiert man: (streng) monoton fallend und (streng) monoton.

f (x)

f (x)

x
Abbildung 28: Links: Monoton wachsende Funktion, aber nicht streng, rechts: strenge
Monotonie.
Z.B.: f (x) = x3 ist streng monoton wachsend, f (x) = sign(x) ist monoton wachsend.

40

x2

sin x

3
2
1
x
2

Abbildung 29: Monotoniebereiche von f (x) = x2 : [, 0] und [0, +] (links) und von
f (x) = sin x: [ 2 + k, + 2 + k], k Z (rechts).
Ist f nicht monoton, so kann man Df meist in Monotoniebereiche zerlegen, in denen
f monoton ist, s. Abb. 29.
Sei nun im Folgenden I ein Intervall.
Satz 6.43 Sei f : I R stetig. Dann gilt:
f ist streng monoton f ist injektiv

Es gibt eine Umkehrfunktion f 1 : f (I) Df .

f 1 ist dann auch stetig.


Bemerkung: Das erste und das zweite gilt f
ur alle Funktionen f.

Das erste dagegen nur f


ur stetige f .

Beweis: : Annahme: f ist injektiv und nicht streng monoton, dann gibt es

(o.B.d.A) x0 < x1 < x2 , mit f (x0 ) < f (x1 ) und f (x1 ) > f (x2 ) > f (x0 ).
Dann existiert nach dem Zwischenwertsatz ein x (x0 , x1 ), mit f (
x) = f (x2 ) (vgl.
Abb. 30), im Widerspruch zur Injektivitat.
Sei f o.B.d.A. streng monoton wachsend, dann gilt f
ur > 0 :
f 1 [(f (x ), f (x + ))] = (x , x + ).
Sei := min(f (x) f (x ), f (x + ) f (x)) > 0, dann
f 1 [(f (x) , f (x) + )] f 1 [(f (x ), f (x + ))] = (x , x + ).

Bemerkung:

41

f (
x) = f (x2 )

x0

x1

x2

Abbildung 30: Zum Widerspruch zur Injektivitat von f .


1) Ist f nicht stetig, so folgt aus der Injektivitat nicht die Monotonie, vgl. Abb. 31
links.
2) Der Graph der Umkehrfunktion von f entsteht durch Spiegelung des Graphen
von f an den 450 Geraden (weil f 1 (f (x)) = x gelten muss), vgl. Abb. 31 Mitte
und rechts.
3) Ist f nicht monoton, so ist f in Monotonitatsbereichen umkehrbar.
f (x)

f (x)

f 1 (f (x)) = x

x
f (x)

f 1 (x)

f (x)

Abbildung 31: Links: Injektives, aber nicht monotones f , Mitte und rechts: Graph der
Umkehrfunktion, Spiegelung an y = x.
BSP. 6.18
1) f (x) = xn und n ungerade: f ist streng monoton f 1 (x) = signx n |x|,
vgl. Abb. 32 links.
2) f (x) = xn und n gerade: Monotoniebereiche [0, ) und (, 0]

auf [0, ) : f 1 (x) = n x,

auf (, 0] : f 1 (x) = n x,
vgl. Abb. 32 rechts.

42

Bemerkung: xn ,

x und deren Verbindung mit +, , , : und Hintereinander-

ausf
uhrung heien algebraische Funktionen. Z. B. f (x) =

x3

x2 + 5 x1

3) Die Exponentialfunktion f (x) = ex ist streng monoton steigend auf R. mit


f (R) = R+ (Beweis spater).
f (x)

f (x)
xn

xn

|x| n

sign(x)|x| n
x

x
1

|x| n
Abbildung 32: Funktionsgraphen mit Umkehrfunktion von xn mit n ungerade (links)
und n gerade (rechts).
Definition 6.44 Ist f (x) = ex , so heit
ln f : R+ R mit ln x := ln(x) := f 1 (x)
natu
rlicher Logarithmus.
Folgerung:
a) ln x ist stetig.
b) lim (ln x) =
x0+

lim ln x = .

c) ln(x y) = ln x + ln y f
ur x > 0, y > 0.

d) eln x = x,

ln ey = y, f
ur x > 0.

4) Mit ln lassen sich neue stetige Funktionen definieren:


Definition 6.45 f (x) = ax := ex ln a fur a > 0 a = 1
ax ist streng monoton es gibt eine stetige Umkehrfunktion und

log x = f 1 (x) ( Logarithmus zur Basis a)

43

f (x)
4
ex

3
2

ln(x)

x
2

1
1

2
Abbildung 33: Exponentialfunktion ex und nat
urlicher Logarithmus ln(x).
Einige Rechenregeln (Schulstoff):
a

log b b log c =a log c ,

log c =

f (x)
4

log c
u.s.w.
log b
f (x)

ax

ax 4

a>1

2
a

log x

0<a<1

1
x

1
1

x
2

1
1

2
a

log x

Abbildung 34: Allgemeine Potenzfunktionen mit Umkehrfunktion.


5) Die trigonometrischen Funktionen sind nicht monoton.
Beschrankt man sich auf Monotoniebereiche, so kann man Umkehrfunktionen
definieren:

44

arccos(x)
arccos(x)

-1

x
cos(x)
-1

cos(x)

Abbildung 35: Trigonometrische Funktionen und Umkehrfunktion: sin(x) und cos(x).

tan(x)

cot(x)

arccot(x)

arctan(x)
x

Abbildung 36: Trigonometrische Funktionen und Umkehrfunktion: tan(x) und cot(x).


6) Umkehrfunktionen der Hyperbelfunktionen Areafunktionen

Wegen
y = sinh x = 21 (ex ex ) 12 (ex )2 (ex )y 21 = 0 ex = y + y 2 + 1
x = ln(y + y 2 + 1) folgt die geschlossene Darstellung area sinh x =

ln(x + x2 + 1) f
ur x R. Entsprechendes gilt f
ur die anderen Areafunktionen.

area cosh x = ln(x + x2 1),


1+x
area tanh x = 12 ln 1x
,
1+x
area coth x = 12 ln x1
,

f
ur x 1
f
ur x (1, 1)
f
ur x (, 1) (1, )

7) Alle Verbindungen von xn , ex , trigonometrischen Funktionen und deren Umkehrungen bilden die sogenannten elementaren Funktionen.

45

sinh(x)

cosh(x)

areasinh(x)
x
areacosh(x)
1
x
1
Abbildung 37: Die Hyperbelfunktionen und ihre Umkehrfunktionen: cosh(x) und
sinh(x).
areatanh(x)
tanh(x)

cotanh(x)

areacotanh(x)
x

Abbildung 38: Die Hyperbelfunktionen und ihre Umkehrfunktionen: tanh(x) und


cotanh(x).

6.9

Stetigkeitsmae

Stetigkeit ist ein rein qualitativer Begriff, gerade aber bei der Fehlerfortpflanzung in
numerischen Verfahren ist es wichtig zu wissen, wie stetig eine Funktion ist. Das Ma
der Stetigkeit, d.h. die schlechteste Wahl von > 0 zu > 0 ist i.A. abhangig von f
und der Stelle x0 , ist das letztere nicht der Fall spricht man von
Definition 6.46 Sei 0 = Df R, f : Df R in allen x Df stetig. f heit
gleichm
aig stetig (auf Df ), wenn zu jedem > 0 ein > 0 existiert, so dass fur
alle x, y Df mit |x y| gilt:
|f (x) f (y)|

46

(6.10)

Die Wahl ist also unabhangig von x Df moglich, in der Derfinition statt
< ist irrelevant und konnte auch durch < ersetzt werden bzw. umgekehrt in den
vorigen Stetigkeitsdefinitionen.
Es gilt:
Satz 6.47 Sei Df R kompakt, f : Df R auf Df stetig. Dann ist f gleichmaig
stetig.
Beweis: Durch Widerspruch sofort aus der Definition.

Durch (6.10) wird also i. A. (nicht eindeutig) eine Abbildung


h : R+ R+ , h() := , h() 0 f
ur 0
definiert. Falls wir annehmen, dass h stetig und strikt monoton wachsend ist, existiert
auch
S() := h1 () von R+ nach R+
und ist stetig und strikt monoton wachsend, S() 0 f
ur 0. Dann
|f (x) f (y)| S(|x y|)

(6.11)

Die Funktion S beschreibt also die Fehlerverst


arkung durch .
BSP. 6.19

1) f : R+ R+ , f (x) = x2
f ist nicht gleichmaig stetig, d.h. die Beziehung wird f
ur wachsendes x
immer schlechter, es gibt auch keine Funktion S mit (6.11). Andernfalls folgte
f
ur xn := n + n1 , yn := n
|xn yn | =

1
n

S(|xn yn |) 0, aber

|f (xn ) f (yn )| = |xn yn ||xn + yn | = 2n +

1
n

1
n

=2+

1
n2

2.

2) f : [a, b] R, f (x) = x2
F
ur S() := L mit L := 2 max(|a|, |b|) gilt
|f (x) f (y)| = |x + y||x y| L|x y| = S(|x y|).
Im Beispiel folgt also auf eine kompakte Menge bzw. in der Nahe eines Punkts
x0 die besonders u
berschaubare Fehlerverstarkung maximal um einen Faktor L,
f ist dort:

47

Definition 6.48 Sei 0 = Df R, f : Df R


f heit auf Df Lipschitz-stetig, wenn ein L > 0, eine Lipschitzkonstante so
gewahlt werden kann, dass
|f (x) f (y) L|x y| fur alle x, y Df .
f heit lokal Lipschitz-stetig auf Df , wenn f in der Nahe jedes x Df Lipschitzstetig ist.
Ist L < 1 moglich, heit f kontraktiv.
Lipschitz-stetige Funktionen sind gleichmaig stetig, jede (stetig) differenzierbare Funktion ist (i.A. aber nur) lokal Lipschitz-stetig.
F
ur die Fehlerverstarkung (beim Losen von f (x) = 0 also bei f 1 ) ist eine moglichst
kleine Lipschitz-Konstante w
unschenswert. Das ist auch auf kompakten Mengen nicht
immer moglich.
BSP. 6.20
f : [0, 1] R, f (x) = x1/2
f ist nicht Lipschitz-stetig und erf
ullt (6.11) bestenfalls mit zum Beispiel
1
S() := 1/2 .
2

7
7.1

Grundlagen der Differentialrechnung


Ableitung

Definition 7.1 Sei Df R, f : Df R. f heit in x0 Df differenzierbar, falls


1
lim (f (x0 + h) f (x0 )) = a R
h0 h
existiert. f heit differenzierbar, falls f in allen x0 Df differenzierbar ist.

df
=: Df
dx x=x0
x=x0
heit Ableitung von f bei x0 . Ist f differenzierbar, so heit f : Df R
Ableitung von f .
a =: f (x0 ) =:

df
dx

x=x0

= lim

xx0

f (x) f (x0 )
f
= lim
xx0 x
x x0

mit der Kurzschreibweise f := f (x) f (x0 ), x := x x0 (wenn die Wahl von x0


klar ist) heit auch Differentialquotient.

48

Bemerkung
1) Nach Folgerung 6.5 ist f (x0 ), falls existent, eindeutig.
2) Nach Definition 6.3 erfordert die Differenzierbarkeit in x0 also die Existenz einer
Umgebung U (x0 ) in Df . Existiert nur eine einseitige Umgebung (f
ur x0 A),
dann ist die Definition auf den entsprechenden einseitigen Grenzwert abzuschwachen.
f
x0 x

3) lim

df
dx

heit nicht, dass lim f = df, lim x = dx; vielmehr gilt


x0

x0

lim f = lim x = 0, (f
ur stetiges f ).

x0

x0

df
df und dx sind im obigen Sinne nicht definiert als Zahlen, sondern nur dx
R.
Wir konnen df und dx spater deuten. (Es sind dann aber auch dann keine
unendlich kleinen Zahlen!)

Historisch geht diese Begriffsbildung auf Leibniz und Newton zur


uck.

nte

a) Leibniz:
te

Ta
n

ge

an
Sek

f
= Sekantensteigung
x
f
df
= lim
dx xx0 x
= Tangentensteigung

)f

)x
x0

x0+)x

b) n Newton

49

t = Zeit: s(t) = Weg


s(t) s(t0 )
=
t t0
Durchschnittsgeschwindigkeit im
Zeitraum [t0 , t]

f=0

f>0

f<0

s(t) s(t0 )
= s(t
0 ) = Mott0
t t0
mentangeschwindigkeit.
lim

Eine auch f
ur Funktionen auf Rn (und allgemeiner) zu fassende aquivalente Definition
ergibt sich aus
Satz 7.2 Seien 0 = Df R, f : Df R, x0 Df , so dass eine (einseitige)
Umgebung von x0 in Df existiert.
Dann sind aquivalent:
a) f ist in x0 differenzierbar.
b) Es gibt a R und eine in x0 stetige Funktion R mit R(x0 ) = 0, so dass gilt:
f (x) = f (x0 ) + a(x x0 ) + R(x)(x x0 ).

(7.1)

a und R sind durch (7.1) eindeutig bestimmt.


c) Es gibt eine in x0 stetige Funktion S, so dass gilt
f (x) = f (x0 ) + S(x)(x x0 ).

(7.2)

S ist durch (7.2) eindeutig bestimmt.


Bei Gultigkeit einer der Aussagen (und damit aller) ist
f (x0 ) = a = S(x0 ).
Beweis: a) b):
Damit (7.1) gilt, muss f
ur x = x0 R definiert sein durch
R(x) :=

f (x) f (x0 )
a.
x x0

Wahlt man a := f (x0 ) und R(x0 ) := 0, so ist R in x0 stetig nach Definition 7.1. F
ur
die Eindeutigkeit von a und R ist zu zeigen:
0 = a(x x0 ) + R(x)(x x0 ) f
ur x Df ,

50

(7.3)

wobei R in x0 stetig und R(x0 ) = 0 kann nur durch a = 0, R 0 erf


ullt werden:
F
ur x = x0 folgt:
0 = a + R(x)
und so mit x x0 : a = 0, also auch R 0.
b) c):
Setze S(x) := a + R(x)
F
ur die Eindeutigkeit betrachte die Situation
0 = S(x)(x x0 )
also f
ur x = x0 : 0 = S(x) und wegen der Stetigkeit in x0 auch S 0.
c) a) Nach (7.2) gilt f
ur x = x0 :
f (x) f (x0 )
= S(x)
x x0
und so

f (x)f (x0 )
xx0

S(x0 ) f
ur x x0 .

Nahe bei x0 ist also f in h = x x0 durch die affine Funktion g(h) := f (x0 ) + a h (mit
:= R(x)h
g(0) = f (x0 ) und Steigung a) so gut approximierbar, dass f
ur den Fehler R
0 , h)
R(x
0 f
ur h 0.
h

(7.4)

0 , h) = o(h) f
R(x
ur h 0.

(7.5)

Man sagt auch:


(sprich: ist klein o von h)
Differenzierbarkeit bedeutet also, lokal (d.h. nahe bei x0 ) mit einem gewissen Fehler
einen nichtlinearen durch einen linearen Zusammenhang ersetzen zu konnen.
BSP. 7.1

1) Uber
Definition 7.1:
f (x) = c
1
lim (f (x + h) f (x)) = 0 f 0 d. h. (c) = 0
h0 h

2) Uber
Satz 7.2:
f (x) = xn f
ur n N

51

f (x) = xn = (x0 + h)n


n

f (x) =
k=0

f
ur h = x x0 , also

n
x0 nk hk
k
n

= x0 +
k=1

n
x0 nk hk1 h
k

Also gilt (7.2) mit


n

n
x0 nk (x x0 )k1, d.h. f (x0 ) = S(x0 ) = n x0 n1 .
k

S(x) =
k=1

(7.6)

Hier wird also f sogar exakt durch ein Polynom n-ten Grades in h dargestellt,
wobei die Steigung des linearen Terms gerade f (x0 ) und die hoheren Terme R(x)h
ergeben. Diese Situation gilt approximativ auch bei hoherer Differenzierbarkeit
(s.u.: Taylor-Polynom).
3)

d sin x
dx

x=0

= lim

x0

.
cos x

x=0

= lim

x0

cos x 1
=?
x

1 cos x
r 2 sin2 x
x2 sin2 x
0<
=
<
x
x
x
2
sin x
= 1
x
d cos x
cos x 1

= lim
=0
dx x=0 x0
x

sin x
x

sin x 0
d cos x
= 1;
x0
dx

1-cos x

Damit erhalten wir die Ableitung von sin an einer Stelle x0 u


ber Satz 7.2 durch
das Additionstheorem:
sin x = sin x0 cos h + cos x0 sin h
= sin x0 + cos x0

cos h 1
sin h
+ sin x0
h
h

wobei h := x x0 .
Also: = sin x0 + S(x)h,
und f
ur x x0 , d.h. h 0 gilt wegen lim

h0

sin h
h

= 1, lim

S(x) cos x0 ,

52

h0

cos h1
h

h,

=0:

so dass sin f
ur alle x R differenzierbar ist und
(sin x) = cos x f
ur alle x R.

(7.7)

(cos x) = sin x f
ur alle x R.

(7.8)

Ebenso zeigt man:


eh 1
h0 h

4) f (x) = ex . Wir zeigen spater f (0) = lim

= 1 und daraus folgt

f (x) = lim h1 (ex+h ex ) = ex lim h1 (eh 1) = ex , also:


h0

h0

(ex )

= ex

5) f (x) = |x|.

f
ur alle x R.
1
lim (|h| 0) = 1.
h0 h

lim (|h| 0) = +1,

h0+

Also: f ist bei x = 0 nicht ifferenzierbar,

f
ur x = 0 ist f (x) = sign x.

Die Berechnung von f auf Grund der Definition ist sehr m


uhsam. Man benotigt Rechenregeln.

7.2

Ableitung und Verknu


pfung

Satz 7.3 f sei differenzierbar in x0 , dann ist f stetig in x0 .


d. h. Stetigkeit ist notwenig fur Differenzierbarkeit.
Beweis: folgt sofort aus (7.2)

Satz 7.4 Seien f und g differenzierbar in x0 , c R konstant. Dann sind cf, f g, f g


differenzierbar in x0 . fg ist differenzierbar in x0 , falls g(x0 ) = 0. Es gilt
(cf )

= cf

(f g) = f g
f
( )
g

(f g) = f g + f g

(P roduktregel)

gf f g
g2
(Quotientenregel)

Beweis: (z. B. Produktregel)


Nach Satz 7.2 gibt es in x0 stetige Sf und Sg , so dass
f (x) = f (x0 ) + Sf (x)(x x0 )

53

g(x) = g(x0 ) + Sg (x)(x x0 )


und damit:
f (x)g(x) = f (x0 )g(x0 ) + Sf (x)g(x0 ) + f (x0 )Sg (x) + Sf (x)Sg (x)(x x0 ) (x x0 )
= f (x0 )g(x0 ) + Sf g (x)(x x0 )
wobei Sf g nach den Rechenregeln f
ur stetige Funktionen in x0 stetig ist und
Sf g (x0 ) = f (x0 )g(x) + f (x0 )g (x0 ).
F
ur die Quotientenregel muss nur die Aussage f
ur f 1, f 0 gezeigt werden, da
die allgemeine Aussage dann aus der Produktregel folgt. Hierf
ur betrachten wir nach
Definition 7.1:

1
g

(g(x0 + h) g(x0 ))
g
= 2 (x0 )
h0
hg(x0 + h)g(x0 )
g
(7.9)

1
1

g(x0 + h) g(x0 )

1
h0 h

(x0 ) = lim

= lim

Aus der Differenzierbarkeit von g folgt die Stetigkeit und damit ist mit g(x) auch
g(x + h) = 0 f
ur kleine h, der Grenzwert existiert und ist wie angegeben.

BSP. 7.2
sin x
cos x

1) (tan x) =
ebenso:
(cot x) =
2) (ex ) =

cos2 x + sin2 x
=
f
ur x = k+ und f
ur alle k Z,
2
2
cos x
cos x
2

1
f
ur x = k.
sin2 x

1
ex

(cosh x) =

= ex
1 x
(e + ex )
2

1
= (ex ex ) = sinh x,
2

ebenso:
(sinh x) = cosh x
1
(tanh x) =
cosh2 x
1
(coth x) =
sinh2 x

54

Satz 7.5 (Kettenregel)


Sei f : Df R g : Dg R und f (Df ) Dg g f : Df R.
Ist f in x0 Df und g in f (x0 ) differenzierbar, so ist g f in x0
differenzierbar und es gilt
(g(f (x))) = g (f (x))f (x) .
Beweis:
Es gibt in x0 stetiges Sf und in f (x0 ) stetiges Sg , so dass
f (x) = f (x0 ) + Sf (x)(x x0 )
g(y) = g f (x0 + Sg (y) y f (x0 )
Also f
ur y = f (x):
g f (x)

= (g f )(x0 ) + Sg f (x0 ) + Sf (x)(x x0 )


= (g f )(x0 ) + Sgf (x)(x x0 )

f (x) f (x0 )
x x0

(x x0 )

wobei Sgf in x0 stetig ist mit

Sgf (x0 ) = g f (x0 ) f (x0 )


wie behauptet.

Bemerkung:

1) Alle obigen Satze gelten auch f


ur mehrfache Verkn
upfungen also:
(f g h) = f gh + f g h + f gh.

(f (g(h(x))) = f (g(h(x)))g (h(x))h (x).

2) Die Regel g1 = gg2 kann auch aus


geschlossen werden.
BSP. 7.3
1) (esin x ) = esin x cos x
2) (cos x3 ) = sin x3 3x2

55

1
x

= x12 f
ur x = 0 und der Kettenregel

3) (sin(sin x)) = cos(sin x) cos x


4) sin(esin x ) = cos(esin x ) esin x cos x
5) (ax ) = (ex ln a ) = ln a ex ln a = ax ln a
Um (ln x) berechnen zu konnen, benotigen wir den folgenden
Satz 7.6 Sei I R ein Intervall
1) f sei streng monoton und stetig auf I und differenzierbar in x0 I und es sei
f (x0 ) = 0.
1
Dann ist f 1 in f (x0 ) differenzierbar und (f 1) (f (x0 )) =
.
f (x0 )
2) Ist f : I R differenzierbar und f (x) = 0 fur alle x I,
dann ist f streng monoton und es gilt fur f 1 :

f 1 (f (x)) =

1
1
1
f
u
r
x

I,
d.h.
(f
)
(y)
=
fur y f [I].
f (x)
f (f 1 (y))

Beweis: Nach Satz 6.43 existiert f 1 auf J := f [I], einem Intervall und ist stetig.
Sei x = f (y) J, d.h. y = f 1 (x) I.
Aus x x0 folgt wegen der Stetigkeit von f 1 : y = f 1 (x) y0 = f 1 (x0 ) und so
lim

xx0

also gilt 1).

1
1
y y0
(f 1 (x) f 1 (x0 )) = lim
=
,
yy0 f (y) f (y0 )
x x0
f (y0 )

F
ur 2) ist nur die strenge Monotonie von f zu zeigen. Diese wiederum folgt mit Satz
6.43 aus der Injektivitat von f wegen der Stetigkeit von f . Die Injektivitat folgt aus dem
Mittelwertsatz (spater: Folgerung 7.10). Gibt es namlich x, y I, x < y und f (x) =
f (y), dann ist auch f
ur ein (x, y) : f ()(y x) = f (y) f (x) = 0, also f () = 0.
Wegen der Monotonie gilt dann zwingend
f (x) > 0 f
ur alle x I oder < .

BSP. 7.4

(Ableitung der inversen Funktionen) (y = f 1 (x))

56


1) ( n x) =

1
1
1
=
=
n
n

n1
(y )
ny
n( x)n1
1
ur x > 0.
d. h (x1/n ) = x1/n1 f
n

2) (ln x) =

1
1
1
1
= y = ln x =
y

(e )
e
e
x

f
ur x > 0.

3) (xa ) = (ea ln x ) = ea ln x a(ln x) = xa a


in Verallgemeinerung von 1).

1
= a xa1 f
ur x > 0, a = 0,
x

x
4) (xx ) = (ex ln x ) = ex ln x (1 ln x + ) = xx (1 + ln x).
x
5) (arctan x) =

1
1
1
= cos2 y =
=
.
2
2
1/ cos y
1 + tan y
1 + x2

6) (arcsin x) =

1
1
=
=

(sin y)
cos y

ebenso (arccos x) =
7) (Artanh x) =

1
2

1 sin y

1
f
ur |x| 1.
1 x2

1
f
ur |x| 1.
1 x2

1
1
1
.
=
=
2
2
1 x2
1/ cosh y
1 tanh y

8) Sei f (x) = x + ex f (0) = 1 und f (x) = 1 + ex > 0 f ist streng monoton


wachsend f 1 existiert und f 1 (1) = 0 (f 1 ) (1) = f 1(0) = 21 .
Es kann also sein, dass eine Umkehrabbildung nicht geschlossen (formelmaig) angegeben werden kann, ihre Ableitung aber schon.
Einige Arten von Nichtdifferenzierbarkeit bei x0 .

1.

Unstetigkeit
x0

Knick
d.h. linksseitige Ableitung lim
existiert,
rechtseitige Ableitung lim

2.
x0

stiert,
aber lim = lim .
h0

h0+

57

1
(f (x0 + h) f (x0 ))
h0 h

1
(f (x0 + h) f (x0 ))
h0+ h

exi-

Spitze lim (f (x0 + h) f (x0 )) = +


h0+

3.

z. B. hat f (x) =

x0

|x| eine Spitze bei x0 = 0

4. Man betrachte:
1

0.5

0.03

0.02

0.01

0.01

0.02

0.03

1
f (x) = sin
x
unstetig

0.5

1
0.03

0.02

0.01

0.03

0.02

0.01

0.01

0.02

0.03

1
f (x) = x sin
x
stetig, aber nicht differenzierbar

0.01

0.02

0.0008

0.0006

0.0004

0.0002

1
x
differenzierbar aber f unstetig

f (x) = x2 sin
0.03

0.02

0.01
0.0002

0.01

0.02

0.03

0.0004

0.0006

0.0008

Wir betrachten die letzte Funktion genauer:

58

1
, f (0) = 0 stetig auf R
x
1
1
f
ur x = 0 nach obigen Regeln.
f (x) = 2x sin cos
x
x
1
nicht differenzierbar und die
F
ur x = 0 ist sin
x
Kettenregel darf nicht angewendet werden.
f (x) = x2 sin

1
1
f (0) = lim (f (x) f (0)) = lim x sin = 0
x0 x
x0
x
f ist differenzierbar auf ganz R und es gilt

0 f
ur x = 0

f (x) =
1
1
2x sin cos f
ur x = 0
x
x
da lim f (x) nicht existiert f ist unstetig.
x0

7.3

H
ohere Ableitungen

Existiert f auf einer Menge D, so kann auch diese Funktion differenzierbar sein und
so f := (f ) existieren und entsprechend f := (f ) usw.
Definition 7.7 Durch f (0) := f, f (n+1) := (f (n) ) wird die nte Ableitung f (n)
einer Funktion erklart (n N), sofern sie existiert.
Bezeichnung:
f (n) =:

dn
f .
dxn

f heit nmal stetig differenzierbar, falls f, f , . . . , f (n1) , f (n) existieren und auch
stetig sind. Der so definierte Funktionenraum fur D R ist
C n (D) = {f : D R | f ist nmal stetig differenzierbar}.
Bei D = [a, b] schreibt man kurz C n [a, b].
Falls die Wahl von D klar ist, etwa als ganz R, schreibt man auch kurz C n := C n (D).
C (D) := {f : D R | f ist nmal (stetig) differenzierbar fur alle n N}
sind die unendlich oft (stetig) differenzierbaren Funktionen.

59

Nur die Stetigkeit der hochsten Ableitung ist eine Zusatzforderung, sonst folgt sie aus
der Existenz der hoheren Ableitung.
Z. B.: f (x) = x2 sin

1
C , denn f ist nicht stetig, sin x C .
x

BSP. 7.5

n (m)

1) (x )

n!
xnm
(n m)!
=
n!

f
ur n > m,
f
ur n = m,
f
ur n < m.

2) F
ur Polynome Pn (x) = an xn + . . . + a0 gilt:
(Pn )(n+1) = 0 .

7.4

Mittelwertsatz

Definition 7.8 f : Df R mit = Df R. f hat bei Df ein


relatives Maximum, falls f () maximal in der Nahe von (d. h. falls ein
> 0 existiert, so dass f () maximal ist auf Df ( , +)). Entsprechend definiert
man relatives Minimum und relativer Extremwert.
Satz 7.9 Sei f : (a, b) R differenzierbar und habe in (a, b) ein relatives
Extremum f () = 0.
Bemerkung:
1) f () = 0 ist also ein notwendiges Kriterium f
ur ein relatives Extremum im
Inneren des Definitionsintervalls.
2) In einem Randpunkt gilt f () = 0 i.a. nicht. Ist z. B. = a relatives Minimum,
so gilt dort nur f () 0. Eine allgemeine Form der notwendigen Bedingung f
ur
ein differenzierbares f : I R (I ein beliebiges Intervall) und z. B. ein relatives
Minimum in I ist
f ()(x )

0 f
ur alle I.

60

(7.10)

Beweis: Sei o. B. d. A. bei ein relatives Maximum

f (x) f ()
f
=
x
x

0 f
ur x > 0
0 f
ur x < 0

in der Nahe von .

Diese Ungleichungen gelten auch im Grenzwert, also gilt im Grenzwert =.

Folgerung 7.10
1) (Satz von Rolle) Ist f : [a, b] R stetig und auf (a, b)
f (a) = f (b), dann gibt es (a, b) mit f () = 0.

differenzierbar und

>

Beweis: Nach Satz 6.29 nimmt f in [a, b] Maximum und Minimum an. Eins
davon muss in (a, b) liegen, da sonst nur f c f
ur ein c R moglich ist (wo jedes
(a, b) gewahlt werden kann) und so folgt die Behauptung mit Satz 7.9.
Beachte: Am Rand braucht f nicht differenzierbar zu sein, (siehe Skizze).
ist nicht immer eindeutig.
2) (Mittelwertsatz (MWS)) Sei f stetig auf [a, b] und differenzierbar auf (a, b),
f (a) f (b)
= f ().
dann gibt es (a, b) mit
ab
f (b) f (a)
Beweis: Wende Satz von Rolle auf g(x) = f (x)
(x a) f (a) an,
ba
f
ur das g(a) = g(b) = 0 gilt.

Anschaulich:
Es gibt einen Punkt im Inneren, wo Tangentensteigung mit
Sekantensteigung auf [a, b] u
bereinstimmt.

f(b)-f(a)

b-a
a

>

Andere Form des Mittelwertsatzes:

61

Unter obigen Voraussetzungen gilt f


ur x [a, b], h R so, dass x + h [a, b]:

a) f (x + h) = f (x) + f ()h
f
ur ein x, x + h

oder b) f (x)
= f (a) + f ()(x a)
f
ur ein
a, x

oder c) f (x)
= f (a) + f (a + (x a))(x a) f
ur ein
0 < < 1.
Dabei ist f
ur a, b R, a = b, a, b = (a, b) f
ur a < b und a, b = (b, a) f
ur b < a. Ist

also auch f stetig in x0 f


ur x0 [a, b], so ist mit
S(x) := f (x0 ) + v(x)(x x0 )
eine explizite Form f
ur S aus Satz 7.2 gefunden (v(x) deutet an, dass ein geeignetes

v (0, 1) ausgewahlt wird). Der Satz sagt nicht aus, wo dieses liegt, trotzdem kann
man ihn anwenden:
Absch
atzung (in Form a) und b))
BSP. 7.6
1
f
ur 0, x
1 + 2
x

< arctan x < x


1 + x2

1
< arctan x < 2 3 = 0, 2679

4
= 0, 2589 f
ur ein < 0, 0089

=
0, 2617 . . . =
12

1) f (x) = arctan x = arctan 0 +


f
ur x > 0

f
ur x = 2 3

arctan(2 3)
exakt

2) Ist |f ()| M f
ur (a, b), dann folgt f
ur
x, y [a, b] f
ur ein x, y
|f (x) f (y)| = |f ()||x y|

M|x y|,

d.h. f ist dort, wo f beschrankt ist,


Lipschitz-stetig. Eine stetig differenzierbare
Funktion ist also immer lokal Lipschitz-stetig
(i.a. nicht global).

x0-h

x0

x0+h

>
Monotonie: Ist f (x) (<)
0 f
ur alle x I, dann ist f streng monoton wachsend (fallend) auf I.

Beweis:

f (x) f (y)
= f () > 0 f (x) > f (y) f
ur x > y .
xy

BSP. 7.7

62

1) (ln x) =

1
ln x ist streng monoton wachsend.
x

2) (ex ) = ex ex ist streng monoton wachsend.


3) P (x) = x9 + 3x5 + 3x4 + x 8 hat mindestens eine Nullstelle.
P (x) = 9x8 + 15x4 + 9x2 + 1 > 0 f
ur alle x R P hat genau eine Nullstelle,
da P streng monoton wachsend.
Satz 7.11
Sei D = I ein Intervall, dann gilt:
1) Aus f 0 in I folgt f c fur ein c R.
2) Aus f g in I folgt f g + c fur ein c R.
Beweis:
1) Annahme: Es gibt x, y I mit f (x) f (y) = 0, dann folgt
f () = 0: Widerspruch.

f (x) f (y)
=
xy

2) f g (f g) 0 f g c.

Ist D z. B. die Vereinigung zweier disjunkter Intervalle, so kann bei 1) f auf jedem
Teilintervall verschiedene Werte annehmen.
BSP. 7.8
1+x
1
f
ur x = 1 f (x) = . . . =
= (arctan x)
1x
1 + x2
1+x
= arctan x + ci f
ur x Ii , I1 = (, 1), I2 = (1, )
arctan
1x
!

Im Intervall (, 1) : f (0) = = 0 + c f (x) = arctan x +


4
4
!
Im Intervall (1, ) : lim f (x) = arctan(1) =
= + c.
x
4
2
3
f (x) = arctan x
4
Andere Formulierung von Satz 7.11:
f (x) = arctan

Die Differentialgleichung f (x) = 0 f


ur x R hat die allgemeine Losung
f (x) = c f
ur c R beliebig.

63

Satz 7.12 Die Differentialgleichung f (x) = kf (x) (x R, k R) hat die allgemeine


Losung f (x) = cekx c R beliebig.
g
g ekx g gkekx
=
0

= c.
Beweis: Sei g = kg kx =
e
e2kx
ekx
Die Konstanten in den Losungen der Differentialgleichung bestimmt man meistens aus
einer Anfangsbedingung:
Das ist eine Forderung der Art f (x0 ) = y0 f
ur vorgelegte x0 , y0 .

BSP. 7.9

fu
r Anfangswertprobleme:

1) Gesucht f (x) mit


f 0

f
f (3) =
4
4
2) (Kernzerfall) Die Zahl der unzerfallenen Teilchen einer radioaktiven Substanz
betragt N(t) (t = Zeit). Zur Startzeit enthalt die Substanz N(0) = N0 Teilchen.
Zerfallgesetz: N = kN (k = Zerfallszahl)
Gesucht N(t).
N = kN
N(t) = N0 ekt .
Anfangswertproblem:
N(0) = N0
Verallgemeinerter Mittelwertsatz: f und g seien auf [a, b] stetig und auf (a, b)
stetig differenzierbar. Weiter sei g (x) = 0 f
ur alle x (a, b).
Dann gibt es ein (a, b) mit

f (b) f (a)
f ()
=
.
g(b) g(a)
g ()

Beweis: Da g stetig ist auf (a, b) gilt g (x) > 0 f


ur alle x (a, b) oder g (x) < 0 f
ur
alle x (a, b). In beiden Fallen ist g(a) = g(b). Setze
h(x) := f (x) g(x)

f (b) f (a)
.
g(b) g(a)

Der Satz von Rolle ist auf h anwendbar, da h(a) = h(b), und liefert ein (a, b) mit
0 = h () = f () g ()
also die Behauptung.

f (b) f (a)
,
f (b) g(a)

Bemerkung: Der verallgemeinerte Mittelwertsatz wird fast nur f


ur Beweise benotigt.

64

7.5

Taylor-Formel

Gegeben sei f : Df R differenzierbar. a Df .


Nach Satz 7.2 bedeutet das gerade eine sehr gute Approximation von f in der Nahe
von a durch eine Gerade
T1 (x) = f (a) + f (a)(x a) .

Mit dem Ubereinstimmen


von Funktionswert und Ableitung sind gerade die Freiheitsgrade einer Gerade aufgebraucht. F
ur Funktionen mit mehr Freiheitsgraden kann
man eventuell eine bessere lokale Approximation erwarten in dem folgenden Sinn:
Problem: Gesucht ist eine Gerade T1 (x), die den Graph von f bei f (a) ber
uhrt.

T1(x)
df
f(x)

)x
a

Definition 7.13 Sei n N0 . Die Funktionen f und g seien in x0 n-mal differenzierbar. f und g beru
hren sich in x0 mit (mindestens) der Ordnung n

falls
f (k) (x0 ) = g (k) (x0 ) fur k = 0, 1, . . . , n.
Funktionen, die sich schneiden (f (x0 ) = g(x0 )) ber
uhren sich also (mindestens) mit
Ordnung 0. Die Tangente ist die eindeutige (s.u.) Gerade, die eine differenzierbare
Funktion mit Ordnung 1 ber
uhrt.
BSP. 7.10
in x0 = 0

sin x, cos x
x
sin x,
2

keine Ber
uhrung
Ber
uhrung, 0-ter Ordnung (schneiden)

65

f = cos x,
g = cosh x,

f = sin x,
g = sinh x,

f = sin x,
g = + sinh x,

f = cos x
g = cosh x

f, g haben Ber
uhrung maximal 2. Ordnung und sie haben eine solche bei x = 0.
Die Tangente T1 (x) = f (a)+f (a)(xa) ber
uhrt f bei a mit mindestens 1. Ordnung.
Definition 7.14 Ein Polynom Tn (x) n-ter Ordnung heit Taylorpolynom von f
um x0 , falls sich f und Tn (x) in x0 mit mindestens n-ter Ordnung beruhren. Die
Tangente T1 (x) = f (a) + f (a)(x a) ist also Taylorpolynom 1. Grades von f um
x0 = a.
Satz 7.15 Ist f in x0 n-mal differenzierbar, so existiert genau ein Taylorpolynom
Tn (x) um x0 und es gilt:
n

Tn (x) =
k=0

1 (k)
f (x0 )(x x0 )k
k!

Beweis:
n

Ansatz: Tn =
k=0

ak (x x0 )k , dann Tn

Tn ist also Taylorpolynom am =

(m)

(x0 ) = m! am f
ur m = 0, . . . , n.

1 (m)
f (x0 ) f
ur alle m = 0, . . . , n.
m!

BSP. 7.11
1) (sin x)(2m) |x=0 = 0,

(sin x)2m+1 |x=0 = (1)m

Das Taylorpolynom um x0 = 0 von sin x ist also:


n

Tn (x) =
k=0

1
k!

sin(k) (0)(x 0)k , also:

T1 (x) = x

T2 (x) = T1 (x), da (sin x) |x=0 = 0


T3 = x 3!1 x3
T4 = T3 usw.
und z. B.:
T9 = x

1 3 1 5
1
1
x + x x7 + x9 .
3!
5!
7!
9!

2) f (x) = ln x f
ur x > 0
Gesucht ist das Taylorpolynom Tn (x) um x0 = 1 .
f =

1
1
1
f = 2 f = +1 2 2
x
x
x

66

und allgemein
f (k) = (1)k (k 1)!xk

f (1) = (1)k (k 1)!


n

Tn (x) =

k=0

1 k
f (1)(x 1)k =
k!

k=1

(1) k+1
(x 1)k
k

1
1
1
1
1
=
(x 1) (x 1)2 + (x 1)3 (x 1)4 . . . (x 1)n .
1!
2
3
4
n
3) f (x) = Pn (x) :
Dann ist Tn = Pn , aber i.a. liegt ein Polynom vor in der Darstellung
n

ak xk

Pn (x) =
k=0

(d.h. Entwicklung um x0 = 0), nicht in der Darstellung


n

Tn (x) =
k=0

k (x x0 )k

(k)

Pn (x0 )
konnen durch fortgesetzte Anwendung
k!
des Hornerschemas (vollst
andiges Hornerschema) bestimmt werden. Nach
Teil I der Vorlesung, Abschnitt 3.4 bestimmt das Hornerschema 0 = Pn (x0 )
durch
(Entwicklung um x0 ). Die k =

bn1 : = an
for k = n 1(1)0, do

(7.11)

bk1 : = ak + x0 bk
und Pn (x0 ) = b1 .

Weiter wird der Linearfaktor (x x0 ) abgespalten, indem gilt


n1

bk xk

Pn (x) =
k=0

(x x0 ) + 0 ,

so dass durch Anwendung von (7.11) auf n 1 statt n, b0 , . . . , bn1 statt


a0 , . . . , an1 schlielich c1 bestimmt wird usw.
Bei Handrechnung baut man folgendes Schema auf:

67

x0
..
.

an
+
0
bn1
+
0
cn2
..
.

an1
+
x0 bn1
bn2
+
x0 cn2
cn3
..
.

n1

x0

h0
+
0
n

x0

...

a0
+
x0 b0
0

...
. . . b0
+
. . . x0 c0
. . . 1
.
..
. . . ..
.

BSP. 7.12
P (x) = 3x3 4x2 + 5x 7,
T (x) um x0 = 2 :
T (x) = 3(x 2)3 + 14(x 2)2 + 25(x 2) + 11.
3

4
6

2
6

8 [25]

[14]

[3]

5
4

7
18

9 [11]
16

= P (2)

P (2)
1!

P (2)
2!

P (2)
3!

68

Wir hatten auch schon die Taylorentwicklung von xn benutzt in der Form
n
n

x = (x0 + (x x0 )) =

k=0

nk
n
x0 (x x0 )k .
k

Bemerkung: Man hat die Vorstellung, dass das Taylorpolynom Tn (x) bei x0 von
allen Polynomen n-ten Grades die Funktion f (x) in der Nahe von x0 am besten
annahert. Das ist aber nur der Fall, wenn man am bestenals Ber
uhrung moglichst

hoher Ordnung deutet. Will man einen moglichst kleinen Fehler |f (x) Pn (x)|
haben in einem vorgelegten Intervall um x0 , so gibt es meistens bessere Polynome
(aber schwerer zu finden!) z. B.
T1

G = Approximation von f mit


kleinerem Fehler max |f Pn |

G
f

x0-*

x0

x0+*

Wie gro ist die Abweichung f (x) Tn (x) f


ur das Taylorpolynom? Dazu der
Satz 7.16 (Taylorformel) Sei f auf [a, x] (bzw. [x, a])n-mal stetig differenzierbar,
dann gilt fur das Taylorpolynom T um x0 = a : Sei Rn (x) := f (x) Tn (x), d.h. der
Fehler des nten Taylorpolynoms, dann gilt:
1) Rn (x) = o(|x a|n ) fur x a .
2) Ist f auf a, x (n + 1)mal differenzierbar, dann hat man
Rn (x) =

1
f (n+1) ()(x a)n+1 (Lagrange-Restglied)
(n + 1)!

fur ein a, x .
Bemerkung:

69

1) Aussage 1) f
ur n = 1 ist gerade der Differentiationsbegriff.
Aussage 2) sagt verscharfend, wenn f (n+1) auf (a, b) beschrankt ist (durch M):
|f (n1) ()|
Rn (x)
=
|x a|
|x a|n
(n + 1)!

statt nur

M
|x a|
(n + 1)!

Rn (x)
0 f
ur x a .
|x a|n

2) Es gibt noch andere Restgliedformeln (z. B. von Cauchy, Schlomilch). Spater


lernen wir noch ein Integral-Restglied kennen. Das Lagrange-Restglied hat die
gleiche Struktur wie die Summanden des Taylorpolynoms Tn (x).
3) Es wird nicht gesagt, wie man findet, man kann aber (wie beim Mittelwertsatz)
obige Formel zur Fehlerabschatzung benutzen.
Beweis: Der Beweis von 1) lasst sich (nicht ganz einfach) auf den Satz von Rolle
zur
uckf
uhren.
Zu 2):
Sei b a, x beliebig, fest, dann:
Setze g(x) = (b x)n+1 g () = (n + 1)(b )n f
ur R,
n 1
F (x) =
f (k) (x)(b x)k F (b) = f (b), F (a) = Tn (b) .
k=0 k!
F ist differenzierbar und
n

F (x) =
k=0

1
1 (k+1)
f
(x)(b x)k
f (k) (x)(b x)k1
k!
(k 1)!
k=1

1
f (n+1) (x)(b x)n
(n + 1)!
1
f (n+1) ()(b )n .
Also: F () =
(n + 1)!
=

Nach dem verallgemeinerten Mittelwertsatz gibt es ein a, b , so dass:


F (b) F (a)
F ()
=
.
g(b) g(a)
g ()
g(b) g(a)
F ()
Also: F (b) = F (a) +
g ()
Wir setzen nun b = x f (x) = Tn (x) +
BSP. 7.13

70

(x a)n+1 1 (n+1)
f
()(x )n
(n + 1)(x )n n!

1) (Vordiplomsaufgabe)
Bestimme T2 um a = 1 f
ur f (x) = (1 + x2 ) arctan x
Bestimme Restglied R2 und eine Fehlerabschatzung f
ur |x 1| < = 0, 1.
Losung:

f (1) = + 1
2

f (1) = + 1
2

f (x) = (1 + x2 ) arctan x

f (1) =

f (x) = 1 + 2x arctan x
2x
f (x) = 2 arctan x +
1 + x2
4
f (x) =
(1 + x2 )2
T2 (x) =

1
2+ 2 2
1
+
+ 1 (x1)+
+ 1 (x1)2 =
x +
2 1! 2
2! 2
4
4

4
1
(x 1)3 mit x, 1
6 (1 + 2 )2
(0, 1)3
2 (x 1)3
<
< 0, 00036
|R2 | =
3 |1 + 2 |2
(1 + 0, 92)2

R2 =

2) Im Beispiel 7.11 wurde schon gezeigt:


n

(1)k

sin x =
k=0

x2k+1
+ R2n+2 (x)
(2k + 1)!

(7.12)

3) Entwicklung von f (x) = cos x um x0 = 0 :


f (2m) (x) = (1)m cos x, f (2m+1) (x) = (1)m+1 sin x.
Also

(1)k

cos x =
k=0

x2k
+ R2n+1 (x)
(2k)!

und zum Beispiel


T4 (x) = T5 (x) = 1
R5 =

x2 x4
+ , und f
ur R4 = R5 :
2!
4!

1
( cos )x6 .
6!

Gib einen Bereich |x| < so an, dass |Rn | < = 104!

|Rn | 6!1 |x|6 < f


ur |x| < 6 720 = 0, 645 36, 95.

71

(7.13)

4) Entwicklung von f (x) = ex um x0 = 0 liefert wegen f (n) = f :


n
x

e =
k=0

xk
+ Rn (x) .
k!

(7.14)

Probleme fu
ater:
r sp
1) Wird Rn kleiner, wenn n groer wird? (Nicht immer, aber in den wichtigen
Fallen ja.)
2) Gilt Rn 0 f
ur n ?

7.6

1. Anwendung: Extremwertprobleme

Die Begriffe relatives und absolutes Extremum sind schon erortert worden.
Definition 7.17 f sei genugend oft differenzierbar
f hat Flachpunkt bei c, wenn f (c) = 0.
f hat Wendepunkt bei c, wenn f ein relatives Extremum bei c hat.
f hat einen Sattelpunkt bei c, falls f bei c einen Wendepunkt, der auch
Flachpunkt ist, besitzt.

Flachpunkte
Satz 7.18 Sei f genugend oft differenzierbar und c liege im Inneren des Definitionsbereichs von f :
f hat ein relatives Extremum bei c f (c) = 0 (Flachpunkt),
f hat Wendepunkt bei c f (c) = 0.
Beachte: Dieser Satz gibt nur hinreichende Bedingungen f
ur Extremwerte an:
BSP. 7.14

72

aber kein Extremwert


(Sattelpunkt)

Relative Extrema sind also zu suchen:


a) unter den Nullstellen von f ,
b) an Stellen, wo f nicht differenzierbar ist,
c) am Rande vom Definitionsbereich.

Absolute Extrema findet man unter den relativen Extrema. Man mu aber pr
ufen, ob
diese absoluten Extrema auch existieren:
BSP. 7.15
1) f : (a, b) R
kein absolutes Maximum

2) f : R R
keine absoluten Extrema !

BSP. 7.16
sinh x2
tanh x2
=
,
f (x) =
[cosh x2 ]3/2
cosh x2
dann f (x) = 0 f
ur x = 0 und

lim f (x) = 0 .

f (x) =

2x
1
1

sinh2 x2
2
5/2
[cosh x ]
2

73


Flachpunkte bei x1,2 = areasinh 2 und x3 = 0.

x1,2 = ln

2+

3 = 1, 14 . . . , da areasinh x = ln(x +

x2 + 1) f (x1,2 ) = 3, 8.

Da f = 0 f
ur x = x1,2,3 f ist zwischen den Flachpunkten monoton und wir konnen
den Graphen zeichnen.

Bemerkung: Die Ermittlung des Verlaufs des Funktionsgraphen besonders bzgl. der
Lage der Extremwerte und Wendepunkte bezeichnet man als Kurvendiskussion.
Beim letzten Beispiel wurde die Art der Flachpunkte durch den globalen Kurvenverlauf eindeutig festgelegt. Man kann die Art nat
urlich auch durch alleinige Betrachtung einer (beliebig) kleinen Umgebung des Flachpunktes untersuchen.
BSP. 7.17
1) f (x) = (cos x)8 : f (x) = 8 sin x(cos x)7 = 0 f
ur x = 0 (und weitere Flachpunkte). Da f (0) = 1 und f (x) 1 liegt ein (globales) Maximum bei x = 0 vor.
2) f (x) = (sin x)7 : f (x) = 7 cos x(sin x)6 : Flachpunkt bei x = 0.
f (0) = 0, f (0 + ) > 0, f (0 ) < 0 f
ur kleine > 0. Also liegt ein Sattelpunkt
bei x = 0 vor.
Wenn diese Verfahren nicht gut anwendbar sind, hilft haufig:
Satz 7.19 (Typ von Flachpunkten) Sei f (c) = 0 und
f (k) (c) = 0 fur

k = 1, . . . , n

f (n+1) (c) = 0 und f (n+1)

stetig in der Nahe von c,

dann gilt f
ur den Flachpunkt bei c:
Ist n + 1 ungerade, dann liegt ein Sattelpunkt bei c vor.
Ist n + 1 gerade, dann liegt ein relatives Extremum bei c und zwar ein Maximum, wenn
f (n+1) (c) < 0, ein Minimum, wenn f (n+1) (c) > 0.

74

Beweis:
1
1
f (n+1) () (x c)n+1 = f (c) +
f (n+1) ()(x c)n+1 mit
(n + 1)!
(n + 1)!
1
f (n+1) ()(x c)n+1 . F
ur x und damit in der
c, x , also: f (x) f (c) =
(n + 1)!
Nahe von c ist signf (n+1) () = signf (n+1) (c). Taylorentwicklung von f liefert
f (x) = Tn (x) +

n1

f (x) =
k=0

mit c, x

1
f (k + 1)(e)
+ f (n+1) ()(x c)n
k!
n!

1 (n+1)
f
()(x c)n
n!

und damit
signf (x) = signf (x) = signf (n+1) ()
= signf (n+1) (c)
f
ur x nahe bei c. F
ur ungerades n + 1 hat also f ein relatives Extremum bei x = c.
F
ur gerades n + 1 gilt
f (x) f (c) =

1
|f n+1()| signf (n+1) (c)|x c|n+1
(n + 1)!

und so folgt die zweite Behauptung.

BSP. 7.18
1) Satz 7.19 beinhaltet insbesondere das hinreichende Kriterium:
<
Sind f (c) = 0, f (c) (>) 0, dann hat f bei c ein relatives Maximum (Minimum).
Wenn die Ableitung von Produkten an einer Stelle x0 berechnet werden soll, wo
einer der Faktoren verschwindet, kann dies bei z. B. f (x0 ) = 0 wegen
(f g) (x0 ) = f (x0 )g(x0 ) + f (x0 )g (x0 )
= f (x0 )g(x0 )
dadurch erfolgen, dass nur der verschwindende Faktor differenziert wird. Das wird
im Folgenden angewandt:
2) f (x) = ln(5 + sin2 x + cos x) f (x) =

75

1
!
(2 cos x 1) sin x = 0
[5 + sin x + cos x]
2

Flachpunkte bei x = k und x =


f (k) = cos x

+ 2k f
ur k Z
3

2 cos x 1
|x=k > 0
[5 + sin2 x + cos x]

Minimum bei x = k nach Satz 7.19


f

sin x

+ 2k = 2 sin x
3
[ 5 + sin2 x + cos x]

Maximum bei x =
3) f (x) = (1 cos x)2

<0
x=

+2k
3

+ 2k nach Satz 7.19


3

f (x) = 2 sin x(1 cos x) = 0 f


ur x = k und k Z

f (x) = 2 cos x2 cos2 x+2 sin2 x, also

f (2k) = 0 und

f ((2k+1)) = 4

Maxima bei x = (2k + 1)


f (x) = 2 sin x + 8 sin x cos x, also

f (2k) = 0

f (4) (x) = 2 cos x + 8 cos2 x 8 sin2 x f (4) (x)(2k) = 6 > 0


Minima bei x = 2k.
Die Art der Flachpunkte hatte man sich auch schneller u
berlegen konnen:
0 f (x) 4, f (2k) = 0, f ((2k + 1)) = 4
Maxima bei (2k + 1) und Minima bei 2k.
Bemerkung: Das Verfahren des letzten Satzes versagt sicher, wenn f nicht gen
ugend
oft differenzierbar ist. Aber auch beliebig oft differenzierbare Funktionen lassen sich
nicht immer mit diesem Verfahren untersuchen.
f

Sei

f (x) =

e1/x
0

f
ur

x=0

f
ur

x=0.

Man kann zeigen, dass f auch bei x = 0 beliebig oft differenzierbar ist.
Es gilt aber f (k) (0) = 0 f
ur alle k N.
Der Satz 7.19 ist nicht anzuwenden. Insbesondere gilt f
ur das Taylorpolynom um x0 = 0
Tn (x) 0

f
ur alle n N .

Der Fehler Rn wird also f


ur groere n hier nicht kleiner.
Dieses Beispiel ist allerdings sehr konstruiert. (Es ist das einfachste dieser Art.)

76

Zur 2. Ableitung f :

f ist ein Ma f
ur die Anderung
von f . Man sagt, eine Kurve ist stark gekru
mmt,

wenn f sich schnell andert (entsprechend schwach gekr


ummt).

schwach
stark
gekrmmt

f als Kr
ummung zu bezeichnen ist allerdings nicht g
unstig, weil dann z. B. der Kreis

2
ummung aufweist, was unserer
f (x) = 1 x in jedem Punkt eine verschiedene Kr
1
Vorstellung von Kr
ummung widerspricht f =
. Spater zeigen wir, dass
(1 x2 )3/2
f
den Anforderungen des Begriffs Kr
ummung gen
ugt.
der Ausdruck :=
(1 + f 2 )3/2
Wir definieren aber:
f ist positiv gekru
mmt, wo

f > 0

f ist negativ gekru


mmt, wo f < 0 .
Tassenregel

f<0

f>0

Die Begriffe Konkav, Konvex sind wenig hilfreich und werden nicht verwendet.

7.7

2. Anwendung: Berechnung unbestimmter Ausdru


cke
lHospital-Regel

BSP. 7.19
1) f (x) =

sin x
x

lim f (x) =?, da der Grenzwert vom Typ

x0

77

0
ist.
0

2)
Anfangswertproblem fur Stromstarke I(t):
gegeben Wecheselstromwiderstande L, R und
Spannung U. Bestimme I(t) aus:
LI + RI = U

I(0) = 0

R
t
U
Losung: I(t) = 1 e L
R

lim I(t) = ??

R0

Uber
Grenzwerte gibt Auskunft der
0
Satz 7.20 (lHospital-Regel)
1)

f, g seien stetig in der Nahe von x = a und differenzierbar dort fur x = a und
g (x) = 0, g(a) = f (a) = 0.

f
f
= lim falls der rechte Grenzwert existiert oder ist .
xa g
xa g

Dann gilt: lim


2)

Man kann in 1) auch lim zulassen, wenn lim f (x) = lim g(x) = 0 gilt.
x

Beweis:

f (x)
f (x) f (a)
f ()
=
=
g(x)
g(x) g(a)
g ()

f
ur ein x, a nach dem verallgemeinerten Mittelwertsatz. F
ur x a gilt a
und die Behauptung folgt.

BSP. 7.20
1) lim

x0

cos x
sin x lH
= lim
=1.
x0
x
1

t Rt
R
e L
1 e L t lH
U
2) lim U
= U lim L
= t.
R0
R0
R
1
L

78

3) lim

x0

1
sin x
cos x
cos x 1 lH
= lim
= lim
= .
2
x0 2x
x0
x
2
2

F
ur die unbestimmte Ausdru
gilt die lHospital-Regel entsprecke der Art

chend.

BSP. 7.21
(ln x)2 lH
4 ln x lH
2

(ln x)2
lim
= lim
=
= 2 lim = 0
1) lim arctan x
x0
x
2 x
2 x x
x
x
x

oder . . . =
2

2) lim

ln x
lim
x 4 x

lH

1/x
lim 1 3 = 0.
2 x

4x 4

1 + cos x ?
x + sin x ?
= lim
=
x sin x x 1 cos x

lim

sin x
= 1 : falsch
sin x

Das zweite Gleichheitszeichen ist falsch, da zwar 1 cos x bzw. 1 + cos x f


ur
x gegen keinen endlichen Grenzwert konvergieren, aber auch nicht gegen
, vielmehr gilt:
sin x
x + sin x
x = 1.
lim
= lim
sin x
x x sin x
x
1
x
1+

0
Weitere Unbestimmte Ausdr
ucke lassen sich auf die Falle zur
uckf
uhren.
0
Sei lim f = lim g = 0, lim h = 1, lim F = lim G = .
0

lim f G = lim

1/f

oder = lim

f
0
= .
1/G 0

BSP. 7.22

lim (tan x) x
x 2
2

2
= lim
x 2 cot x
x

79

1
= 1
= lim
1/ sin2 x
x
2

lim(F G) = lim F

G
F

G
= 1 lim(F G) =
F
G
) Falls lim = 1 0

) Falls lim

BSP. 7.23

2
1

x sin x

1) lim

x0

1
1 2x = .
x0 x
sin x

= lim

2)

lim (cosh x sinh x) = lim cosh x(1 tanh x) = lim

1/ cosh2 x

lim

1
cosh x

1
ist klar, weil cosh x sinh x = ex !
2

=0

1 tanh x
=
1/ cosh x

sinh x

00

lim f g = lim eg ln f = e0

lim F g = lim eg ln F = e0

lim hG = lim eG ln h = e0

In diesen 3 Fallen berechnet man also zunachst den ln des Grenzwertes.


BSP. 7.24
1) G = lim

1+

lim x ln 1 +

1
x

1
x

( 1)

ln 1 +
= lim

1
x

= lim

1/x

x0+

ln G = 1 G = e1 = e.
1

2) G = lim x ln(ex 1)
x0+

( 00)

80

ln(1 + x) lH
1/(1 + x)
= lim
=1
x0+
x
1

ln x
lH
= lim
x
x0
ln(e 1)

lim

x0+

G = e1 = e.
(3 + 2etan x )
3) G = lim

ex 1 lH
1/x
ex
=
lim
=1
=
lim
ex
x0
x0 ex (x + 1)
xex
ex 1

2x

( 0) .

x 2

lim ( 2x) ln(3 + 2etan x ) = lim


( 2x) [tan x + ln (3e tan x + 2)] =

( 2x) tan x
lim

x 2

x 2

lim

x 2

7.8

2x lH
= lim

x
cot x
2

2
= 2 G = e2 .
1
2
sin x

Approximation von Funktionen I

Z. B. zur (naherungsweisen) Auswertung auf dem Computer m


ussen fast alle Funktionen durch einfache Funktionen approximiert werden. Moglichst einfach heit
dabei:
kann durch endlich viele Parameter identifiziert und gespeichert werden,
kann durch elementare Operationen ausgewertet werden.
Es kommen also in Frage
Polynome (mit festem Grad n)
rationale Funktionen (mit festem Zahler- und Nennergrad)
Funktionen gewisser Glattheit, die auf einer vorgegebenen Intervallunterteilung
Polynome festen Grades sind (polynomiale Splinefunktionen).
Der mittlere Fall ist schwierig, da diese Funktionen keinen Vektorraum bilden. Wir
beschranken uns vorerst auf
Pn1 = Pn1 (R) ,
d.h. einen n-dimensionalen Vektorraum. Die n Freiheitsgrade konnen nun unterschiedlich genutzt werden zur Approximation einer Funktion f , die aus C[a, b] vorausgesetzt

81

wird. Ist f hinreichend glatt (f C n1 [a, b]), so kann bei gewahlter Entwicklungsstelle
x0 (a, b) als Approximation
n1

(x) =
k=0

f (k) (x0 )
(x x0 )k
k!

(7.15)

gewahlt werden. F
ur f C n [a, b] und x nahe bei x0 ist eine (gute) Approximation
von f , u
ute global noch nichts bekannt ist.
ber deren G
F
ur eine gewahlte Basis 1 , . . . , n von Pn1 sind also die eindeutigen a1 , . . . , an R
mit
n
(f ) =

ai i
i=1

zu bestimmen. Es soll versucht werden, die ai , i = 1, . . . , n durch n (lineare) Bedingungen eindeutig festzulegen. Anstatt alle Forderungen in x0 zu stellen wie bei (7.15),
konnen sie auch auf verschiedene Knoten oder Stu
tzstellen
a

x1 < x2 < . . . < xk

verteilt werden. Wir betrachten nur k = n und dann liegt die Bedingung nahe:
(xi , a1 , . . . , an ) = f (xi ), i = 1, . . . , n .
Eine solche Problemstellung (allgemein bei Vorgabe von Funktionswerten yi, i =
1, . . . , n) nennt man (Lagrange-) Interpolationsaufgabe.
Gesucht sind also Parameter ai , i = 1, . . . , n, so dass
n

ai i (xj ) = yj

(7.16)

i=1

d.h. a = (a1 , . . . , an )T Rn ist Losung des Gleichungssystems


Aa = y
mit A = (j (xi ))ij ,

y = (yi )i .

(7.17)

Besonders einfach wird die Bestimmung der ai , wenn die gewahlte Basis
j (xi ) = ij f
ur i, j = 1, . . . , n

(7.18)

erf
ullt, da dann (A = I und)
ai = yi,

i = 1, . . . , n .

82

(7.19)

Solche Basisfunktionen sind gegeben durch


i (x) = i1 (x) ,
wobei

j (x) :=
i=0
i=j

i = 1, . . . , n + 1 ,

(x xi )

i=0
i=j

(xj xi ),

j = 0, . . . , n .

(7.20)

Wie gut das Interpolationspolynom eine Funktion f bei Wahl yi = f (xi ) approximiert,
sagt
Satz 7.21 Sei f C[a, b], und seien xi [a, b], i = 1, . . . , n, paarweise verschiedene
Knoten. Dann gilt fur das durch p(xi ) = f (xi ), i = 1, . . . , n, eindeutig bestimmte
Polynom p Pn1 :
Zu jedem x [a, b] existiert ein = (x) aus dem kleinsten Intervall I(x, x1 , . . . , xn ),
das alle xi und x enthalt, so dass
f (x) p(x) =

w(x) (n)
f () ,
n!
n

wobei

w(x) =

(x xi ) = x +

i=1

(7.21)

n1

ai x .
i=0

Beweis: F
ur x = xi , i = 1, . . . , n, ist die Aussage trivial.
F
ur festes x = xi betrachten wir die Funktion
h(z) := w(x) (f (z) p(z)) w(z) (f (x) p(x)) .

(7.22)

Dieses h besitzt in I(x, x1 , . . . , xn ) wenigstens die n + 1 Nullstellen x, x1 , . . . , xn . Nach


dem Satz von Rolle besitzt h dort wenigstens n Nullstellen, h wenigstens n 1 Nullstellen, u.s.w. . Schlielich hat h(n) mindestens eine Nullstelle I(x, x0 , . . . , xn ).
Wegen p Pn1 erhalt man aus (7.22):
0 = h(n) () = w(x) f (n) () 0 w (n) () (f (x) p(x)) .
=n!

Hieraus folgt die Behauptung.

Aus Satz 7.21 erhalt man eine Abschatzung f


ur die G
ute der Approximation durch das
Interpolationspolynom:
f p

:= max |f (x) p(x)|


x[a,b]

83

K(f )
w
n!

wobei K(f ) = f (n)


flussbar ist.

und der Wert von w

durch Wahl der St


utzstellen beein-

Dies sagt leider nicht, dass die Folge der Interpolationspolynome f


ur wachsende Anzahl
der Knoten eine gute Art ist, eine Funktion zu approximieren. F
ur wachsende n und
unangepasste Wahl der xi wird das Interpolationspolynom zwischen den St
utzstellen
immer starker ausschwingen. Eine einfache Alternative bietet die Interpolation mit
Polygonz
ugen, d.h. mit linearen Splines 1. Grades.
S1 () := f C[a, b] : f |[xi1,xi ] P1 , i = 1, . . . , n

Ist f C[a, b], so gibt es offenbar genau ein s S1 () mit f (xi ) = s(xi ), i = 0, . . . , n,
und dieses s erhalt man, indem man f in jedem Teilintervall [xi1 , xi ] durch eine lineare
Funktion interpoliert:
s(x) =

1
(f (xi )(x xi1 ) + f (xi1 )(xi x)) ,
xi xi1

x [xi1 , xi ] .

Wir betrachten eine Folge von Zerlegungen


k = xk0 = a < xk1 < . . . < xkk = b
mit
k :=

max xki+1 xki 0 ,

i=0,...,k1

um zu pr
ufen, ob und wie gut eine Funktion f
ur k approximiert wird.
Wir betrachten ein f C[a, b] und fixieren eine Zerlegung k , deren Index wir im
folgenden weglassen.
An einer Stelle x [xi1 , xi ] gilt f
ur den interpolierenden linearen Spline s:
s(x) = f (xi1 )

xi x
x xi1
+ f (xi )
xi xi1
xi xi1
=:

f
ur ein [0, 1] ,

=1

f (x) = f (x) + f (x)(1 )

|f (x) s(x)| |f (x) f (xi1 )| + |f (x) f (xi )| (1 ) .

f ist gleichmaig stetig nach Satz 6.47. Daher gibt es zu gegebenem > 0 ein > 0
mit
|x y| |f (x) f (y)| .

84


Somit folgt aus
|f (x) s(x)| ( + (1 )) =
und damit
f s

Wir haben also gezeigt:


F
ur beliebiges f C[a, b] und > 0 gibt es ein > 0 mit

f s

(7.23)

Daraus folgt schlielich


s = s(k) f

in

f
ur k .

Ist f C 2 [a, b], so erhalten wir aus Satz 7.21 sofort f


ur x [xi1 , xi ]

1
(x xi1 )(x xi ) f () ,
2
1
|f (x) s(x)|
(xi xi1 )2 |f ()| ,
8
woraus schlielich folgt
1 2
f .
f s
8
f (x) s(x) =

[xi1 , xi ]

Ahnlich
wie bei der Lagrangeschen Interpolation konnen wir s darstellen als
n

s(x) =

fi i (x) ,
i=0

mit den Basisfunktionen

x1 x

,
x

x
1
0
0 (x) :=

0
,

x xi1

xi xi1

xi+1 x
i (x) :=

xi+1 xi

x xn1

xn xn1
n (x) :=

x [x0 , x1 ]

x [a, b]

x
/ [x0 , x1 ]
,

x [xi1 , xi ]

x [xi , xi+1 ]

x
/ [xi1 , xi+1 ]
,
,

x [xn1 , xn ]
x
/ [xn1 , xn ]

85

i = 1, . . . , n 1 ,

Die angegebenen i heien Hutfunktionen (engl. hat functions). Sie besitzen einen
lokalen Trager [xi1 , xi+1 ]. Will man also s an einer Stelle x (xi1 , xi ) auswerten, so
hat man wegen j (x) = 0 f
ur j = i, i 1 nur i1 (x) und i (x) zu berechnen (anders
als bei den j (x)).
Zur Auswertung eines allgemeinen Interpolationspolynoms ist der Algorithmus von
Neville n
utzlich. Damit kann man den Wert des Interpolationspolynoms an einer Stelle
x berechnen, ohne das Polynom selbst zu berechnen.
Bei gegebenen St
utzpunkten (xi , yi ), i = 0, . . . , n, bezeichnen wir mit pi0 ...ik Pk das
eindeutige Polynom mit pi0 ...ik (xij ) = yij , j = 0, . . . , k. Dann gilt die Rekursionsformel
a)
b)

pi (x) = yi
(x xi0 )pi1 ...ik (x) (x xik )pi0 ...ik1 (x)
xik xi0

pi0 ...ik (x) =

(7.24)

a) ist trivial. Zum Beweis von b) bezeichnen wir mit q die rechte Seite von b) und
urlich ist grad q k. Ferner
zeigen, dass q die Eigenschaften von pi0 ...ik besitzt. Nat
haben wir nach Definition von pi1 ...ik und pi0 ...ik1 :
q(xi0 ) = pi0 ...ik1 (xi0 ) = yi0
q(xik ) = pi1 ...ik (xik ) = yik
und f
ur j = 1, . . . , k 1:
q(xij ) =

(xij xi0 )yij (xij xik )yij


= yij .
xik xi0

Wegen der Eindeutigkeit der Polynominterpolation folgt daher


q = pi0 ...ik .

Der Algorithmus von Neville besteht darin, mit Hilfe von a) und b) das folgende symmetrische Tableau, das die Werte der interpolierenden Polynome pi,i+1,...,i+k an der
festen Stelle x enthalt, aufzustellen.
Zur Abk
urzung schreiben wir Pi,k = pik,ik+1,...,i (x) f
ur i k:
x0

y0 = P00

x1

y1 = P10

x2

y2 = P20

x3

y3 = P30

x4

y4 = P40

P11

P21
P31
P41

P22

P32
P42

86

P43

P33

P44

Aus a), b) ergeben sich die Rekursionsformeln


a)

Pi0 := yi
(x xik )Pi,k1 (x xi )Pi1,k1
xi xik
Pi,k1 Pi1,k1
= Pi,k1 +
,
1 k i , i = 1, 2, . . . .
xxik

1
xxi

b) Pi,k :=

(7.25)

Speziell f
ur x = 0 wird die Rekursion a), b) spater in sogenannten Extrapolationsalgorithmen angewendet. In diesem Spezialfall erhalt man
a) Pi0 := yi
b) Pik := Pi,k1 +

7.9

Pi,k1 Pi1,k1
,
xik
1
xi

1 k i , i = 1, 2, . . . .

(7.26)

Fehlerfortpflanzung und Kondition

Ein algorithmisch zu losendes (oder zu approximierendes) Problem kann man auffassen


als Auswertung einer Abbildung
f :U X Y ,

(7.27)

wobei X, Y Vektorraume, U X.
BSP. 7.25
Auflosung linearer Gleichungssysteme.
n
Sei X = Y = R , f (b) = A1 b
oder X = Rn,n Rn , Y = Rn , f (A, b) = A1 b. (Beachte den Unterschied !)
Unsere Analysishilfsmittel reichen im Moment nur f
ur den Fall X = R, Y = R
n
(und damit auch Y = R f
ur ein n N). Selbst wenn f exakt ausgewertet werden
konnte, liegen immer Fehler im Argument vor, die durch Messung oder durch Rundung
in die endliche Zahldarstellung entstanden sind (unvermeidbare Eingangsfehler). Zu
betrachten sind also Eingabemengen zu einer exakten Eingabe x X der Form
E = {
x X | x x

x 1}

bei einem relativen Fehlerniveau bzw.


E = {
x X | x x
bei einem absoluten Fehlerniveau .

87

(7.28)

Hier und im folgenden sind

1,

fest gewahlte Normen auf X bzw. Y .

Es ist also notig, die Groe, d.h. den Durchmesser von f [E] abhangig von
abschatzen zu konnen, um u
berhaupt ein Problem mit fehlerbehafteten Daten approximativ losen zu konnen. f mu also stetig sein. In diesem Fall heit ein Problem
korrekt gestellt, ansonsten schlecht gestellt. Beachte, da in der Formulierung als Auswertung einer Abbildung schon Existenz und Eindeutigkeit einer Losung vorausgesetzt
werden (hier liegen weitere mogliche Ursachen der Schlechtgestelltheit!). Um auch qualitativ die Kleinheit von f [E] in Abhangigkeit von abschatzen zu konnen, fordern wir
verscharfend:
Definition 7.22 Das Problem (f, x) heit korrekt (oder wohl) gestellt (engl.: wellposed) auf X X, wenn ein Labs > 0 existiert (Labs hangt i.a. auch von x ab) mit
f (x) f (
x)

Labs x x

fur alle x X ,

(7.29)

ansonsten schlecht gestellt (illposed).


Ist (f, x) korrekt gestellt, so sei Labs () die minimale (Lipschitz)Konstante in (7.29).
Sind x = 0, f (x) = 0, so existiert auch ein Lrel > 0 mit
f (x) f (
x)
f (x) 2

Lrel

x x
x 1

(x) .
fur alle x B

(7.30)

Lrel () bezeichne die minimale Konstante in (7.30).


Wir beschranken uns auf X = Y = R und setzen die stetige Differenzierbarkeit von f
voraus. F
ur X = B (x) := (x , x + ) ist also nach dem Mittelwertsatz (Folgerung
7.10)

bzw.
f
ur f (x) = 0.

Labs () = max {|f ()| | B (x)}


|x|
Lrel ()
Labs ()
|f (x)|

Wir betrachten nur eine linearisierte Fehlertheorie in folgendem Sinn:


Definition 7.23 Das Problem (f, x) hat die absolute Kondition
abs := lim Labs ()
0

und die relative Kondition


rel := lim Lrel () .
0

(f, x) heit gut konditioniert oder gutartig, falls abs klein, schlecht konditioniert
oder bosartig, falls abs gro ist.

88

Damit gilt in obigem Spezialfall


abs = |f (x)|
rel =

(7.31)

|x|
|f (x)| .
|f (x)|

Betrachten wir als Problem das Auffinden einer c-Stelle einer Funktion F : R R,
d.h. die Bestimmung von y R mit
F (y) = c .

(7.32)

Wenn diese eindeutig existiert, dann kann als algorithmisch zu losendes Problem
f := F 1 , auszuwerten bei x = c, mit der Losung y des Problems als Funktionswert,
aufgefasst werden und so
abs = |f (c)| =
bzw.

rel =

1
|F (y)|

(7.33)

|c|
1
.

|y| |F (y)|

Wenn F an der Losung also sehr flach ist, ist die Kondition des Problems sehr schlecht
und kann durch keinen Auflosungsalgorithmus verbessert werden. Schlechte Kondition
kann sogar schon bei den Elementaroperationen, namlich der Addition (!) auftreten.
Setzt man f
ur ein fest gewahltes a R (bzw. a M)
f (b) := a + b ,
dann ist f linear, die linearisierte Fehlertheorie also exakt und
rel =

|b|
.
|a + b|

(7.34)

F
ur b mit verschiedenem Vorzeichen von a, aber |a| |b|, ist also |a + b| sehr klein
und so rel sehr gro. Diese Ausl
oschung fu
hrender Ziffern ist auf jeden Fall zu
vermeiden.
I.a. ist es notig, eine Naherung f
ur f (x) algorithmisch durch die Abfolge (sehr vieler)
Elementaroperationen zu bestimmen, d.h. f ist nicht exakt auswertbar und statt
dessen kann nur eine gestorte Abbildung ausgewertet werden: Statt f (x) wird f(
x)
berechnet.
Betrachte wieder die Bestimmung einer c-Stelle (7.32): Ist rel zu gro, kann y durch
kein Verfahren sinnvoll bestimmt werden.

89

Ist das Problem gut konditioniert, kann immer noch der Algorithmus schlecht konditioniert sein, indem er die Kondition des Problems verschlechtert, sonst heit er stabil.
Betrachte eine quadratische Gleichung, d.h.
F (y) = ay 2 + by + c
und es gelte |4ac| < b2 , d.h. F hat zwei reelle Nullstellen, von deren die groere y
bestimmt werden soll, also
f (0) = F 1 (0) = y
(7.35)
und
abs =
Es ist

1
1
=
.

|F (
y|
|2a
y + b|

1
(b + sign(b) b2 4ac) .
(7.36)
2a
Ist nun |4ac| sehr viel kleiner als b2 , dann ist y nahe bei 0. Ist a > 0 nicht zu gro
und |b| hinreichend gro, dann ist das Problem selbst also gut konditioniert. Die Auswertung von (7.36) ist aber schlecht konditioniert, da dabei Ausloschung stattfindet.
b
Eine Alternative ist das Bisektionsverfahren zum Beispiel auf dem Intervall 4a
,1
b
b

f
ur b > 0, c < 0. Dort gilt F (y) > F 4a = 2 , eine groe Zahl, und so ist die einzig
fragliche Entscheidung F (y) > f nicht kritisch, das Bisektionsverfahren also stabil.
Einfacher erhalt man einen stabilen Algorithmus durch
y =

y =

1
(b sign(b)
2a

b2 4ac)
(7.37)

c
.
y y =
a

7.10

Numerische Differentiation

Kann man f
ur eine differenzierbare Funktion f die Ableitung f nicht geschlossen angeben oder ist dieser Ausdruck f
ur eine Auswertung zu kompliziert, so ist die folgende

Approximation an f (x) naheliegend


Dh + f (x) :=

f (x + h) f (x)
h

(7.38)

(vorw
artsgenommener Differenzenquotient) f
ur ein kleines h. Bei exakter Arithmetik in R und exakten Werten f (x+h), f (x), (, h) ist die Approximation nat
urlich so
gut wie gew
unscht, wenn nur h klein genug gewahlt wird. Wie klein h gewahlt werden

90

muss f
ur ein Fehlerniveau > 0, sagt die folgende Konvergenzordnung f
ur f C 2 (aus
der Taylorentwicklung Satz 7.16 folgend)
Dh + f (x) = f (x) +

f ()
h
2

(7.39)

f
ur ein < x, x + h >, wenn also eine Schranke M f
ur f bekannt ist, muss nur
2
M
h < bzw. h <
2
M
sichergestellt werden.
Sind aber f (x) und f (x + h) fehlerbehaftet (allein schon wegen der Darstellung in M),
dann findet in (7.38) f
ur kleine h durch Ausl
oschung Fehlerverstarkung statt mit
dem Faktor (siehe(7.34))
f (x)
f (x + h)
bzw.
,
f (x + h) f (x)
f (x + h) f (x)
d.h. jeweils etwa mit
f (x)
.
hf (x)
Sind also die f -Werte mit einem relativen Fehler behaftet, so wird dieser schlimmstenfalls verstarkt zu
2f (x)
=: e1 (h, ) .
hf (x)
Hinzu kommt der relative Approximationsfehler (Diskretisierungsfehler) nach
(7.39) von etwa
f (x)h
=: e2 (h) ,
2f (x)
so dass der gesamte relative Fehler sich abschatzen lasst durch
e(h, ) := e1 (h, ) + e2 (h) .
Dabei ist eine untere Schranke von fest vorgegeben (mindestens durch die Maschinengenauigkeit), h ist frei wahlbar. e ist in h f
ur festes nicht monoton gegen 0 fallend
f
ur h 0+ (wie e2 (h)), vielmehr gilt (!)
e(h, ) f
ur h 0
und e hat ein Minimum bei
h=

4f (x)
f (x)

91

1/2

(7.40)

F
ur kleine h ist also der Diskretisierungsfehler klein, aber die Fehlerverstarkung gro,
f
ur groe h ist es umgekehrt, so dass ein Kompromiss gewahlt werden muss. Aus (7.40)
leitet sich die Regel
h 1/2
(7.41)
ab (also nie h 0 !). Hintergrund ist die Tatsache, dass die lineare Abbildung
f f
auf C 1 in der Maximumsnorm nicht stetig ist, die Differentation ist in diesem Sinn also
schlechtgestellt. Die Diskretisierung mit festem h stellt eine Regularisierung,
d.h. die naherungsweise Ersetzung durch ein gutgestelltes, gutkonditioniertes Problem
dar.
F
ur die Wahl (7.40) lasst sich e (scharf) abschatzen durch
e , C1/2 K1/2
bei vorgegebener Konstante C, mit einer f -abhangigen Konstanten K.
Ein gutgestelltes Problem (vgl. Def. 7.22) hat dagegen ein Fehlerverhalten wie
L
(wobei L bei guter Kondition nicht zu gro ist). Das folgende Zahlenbeispiel vergleicht
das Fehlerverhalten
) L
) L1/2
= 108

mit
mit

) L = 106

1/2
3
) L = 10

L = 102
L = 10

5 signifikante Stellen
2 signifikante Stellen

= 1016 ) L = 1014
13 signifikante Stellen
1/2
7
) L = 10
6 signifikante Stellen

Auch die Wahl eines besser approximierenden Differenzenquotienten andert diese Situation nicht prinzipiell.
Sei
f (x + h) f (x h)
,
(7.42)
Dh f (x) :=
2h
der zentrale Differenzenquotient, dann folgt aus der Taylorentwicklung f
ur f C 3
Dh f (x) = f (x) +

f (+ ) f ( )
h2
3

92

(7.43)

f
ur + , < x, x h > .
e1 (h, ) bleibt also, e2 (h) ist entsprechend zu ersetzen, so dass die Minimierung von e
in h f
ur festes die Regel
h 1/3
(> 1/2 , da besseres Approximationsverhalten von (7.42)) und die Fehlerabschatzung
e , C1/3 K2/3
erbringt. Im obigen Beispiel ist (L = 10)
= 108 ) L2/3 = 104,67 4 signifikante Stellen
= 1016 ) L2/3 = 1010 10 signifikante Stellen
Wenn Schranken K f
ur f bzw. f bekannt sind, folgt f
ur den Fehler
|Dh + f (x) f (x)| Kh

(7.44)

|Dh f (x) f (x)| Kh2

(7.45)

Dies nennt man Konvergenzordnungsabsch


atzung. Sie gibt an, wie sich der Fehler
schlechtestenfalls verhalt. Sie gibt nicht an, wie sich der Fehler verhalt, wenn man die
f
uhrende h-Potenz (h bzw. h2 )herausnimmt. Dies macht eine Fehlerentwicklung, die
hier sofort aus der Taylor-Entwicklung folgt.
Satz 7.24 Sei f C 2n+2 [a, b] fur ein n N, sei h > 0, dann gibt es < x, xh >,
so dass
n

Dh f (x) = f (x) +
k=1

f (2k+1) (x) 2k 1 (2n+2)


(+ ) f (2n+2) ( ) h2n+1
h + f
(2k + 1)!
2

(7.46)

Beweis:
Taylorentwicklung liefert
n

f (x h) = f (x) f (x)h
n

+
k=1

k=1

f (2k+1) (x) 2k+1


h
(2k + 1)!

f (2k) (x) 2k f (2n+2) ( ) 2n+2


h +
h
(2k)!
(2n + 2)!

Liegt eine solche Fehlerentwicklung vor, kann durch Extrapolation ein Verfahren
hoher Konvergenzordnung definiert werden.
Allgemein sei lim F (h) f
ur eine Funktion F gesucht. Der Aufwand zur Berechnung
h0+

93

von F (h) wachst meist mit h 0+ stark an; auerdem setzen Rundungsfehlereinfl
usse
eine Grenze, wie klein man h wahlen kann. Oft hat man aber Kenntnis, wie sich F (h)
lim F (h) f
ur h 0+ verhalt; es sei etwa:

h0+

F (h) = 0 + 1 hp + O(hr ) ,

r>p>0

(7.47)

wobei f
ur 1 nur die Existenz, nicht der Wert bekannt sein muss.
Wertet man F f
ur zwei Werte, etwa h und qh (q > 1) aus, so folgt
F (qh) = 0 + 1 hp q p + O(hr ) ,
und aus (7.47)
q p F (h) = q p 0 + 1 hp q p + O(hr ) ,
also erhalten wir durch Subtraktion der beiden Gleichungen
lim F (h) = 0 =

h0+

q p F (h) F (qh)
+ O(hr ) .
qp 1

(7.48)

Aus der Naherung pter Ordnung (7.47) ist also eine Naherung rter Ordnung geworden. Dieses Vorgehen nennt man (Richardson) Extrapolation. Ist eine weitergehende
Entwicklung nach Potenzen von h als in (7.47) bekannt, so kann das Vorgehen wiederholt werden.
Bemerkung: Zur Erklarung der Bezeichnung Extrapolation u
berlege man sich:
Bestimmt man zu F und den Knoten h und qh das Interpolationspolynom p(x) =

0 +
1 xp , so ist der Wert von p an der Stelle 0
/ [h, qh] (Extrapolation !) gerade
gleich der aus (7.48) ablesbaren Naherung f
ur lim F (h).
h0+

Wir wenden nun die Extrapolation auf die Differentiation mit dem zentralen Differenzenquotienten an:
Vernachlassigt man bei der Entwicklung von Dhi f (x) in (7.46) das Restglied, so lat
sich Dhi f (x) als ein Polynom in h2 auffassen, das f
ur h = 0 den Wert 0 = f (x) liefert.
Dies legt zur Bestimmung von 0 die RichardsonExtrapolation nahe:
Bestimme zu verschiedenen Schrittweiten h0 , . . . , hm > 0 die zugehorigen zentralen
Differenzen Dhi f (x), i = 0, . . . , m. Dann gibt es ein eindeutiges Polynom p Pm (in
h2 ) mit p(hi ) = Dhi f (x), i = 0, . . . , m. p(0) dient als verbesserte Naherung f
ur f (x).
Da nicht p als Funktion von h2 gesucht ist, sondern nur der Wert p(0), bietet sich der
NevilleAlgorithmus f
ur diese Aufgabe an.

94

Sei h0 := b a, hi := h0 /ni , ni < ni+1 , i = 1, . . . , m, und Di0 := Dhi f (x). Ferner sei
ik (h) dasjenige Polynom vom Grade k in h2 , f
f
ur 1 k i m D
ur das gilt
ik (hj ) = Dj0 ,
D

j = i k, i k + 1, . . . , i .

ik (0) nach dem NevilleAlgorithmus


Dann gilt f
ur die extrapolierten Werte Dik := D
Dik = Di,k1 +

Di,k1 Di1,k1
hik
hi

1kim.

(7.49)

Dieses Verfahren wurde erstmals (f


ur numerische Integration) von Romberg (1955)
vorgeschlagen f
ur die speziellen Schrittweiten hi = h0 2i . Es vereinfacht sich dann zu
(vgl. auch (7.48))
Dik =

4k Di,k1 Di1,k1
4k 1

(Rombergverfahren) .

(7.50)

Man erhalt das folgende Schema von Naherungswerten f


ur f (x):
D00

D11

D22
D10

D
21
D33

D20
D32

D31

D30
Hat man (etwa durch Extrapolation) ein Verfahren k-ter Fehlerordnung f
ur die numeriche Differentiationen, so hat e2 (h) in der Fehlerdarstellung die Form
e2 (h) = Lhk ,
so dass die Minimierung in h f
ur festes die Regel
h 1/(k+1)
und die Fehlerabschatzung
e , C1/(k+1) k/(k+1)
ergibt, so dass man f
ur groe k (Glattheit von f vorausgesetzt) fast das Verhalten
eines gut gestellten Problems erhalt, aber nur f
ur sehr groes h(!).

95

7.11

Algorithmische L
osung von Gleichungen II

Ob ein iteratives Verfahren wie das Bisektionsverfahren zum Bestimmen einer Nullstelle
einer Funktion f (siehe Abschnitt 6.7) effizient ist, entscheidet
der Aufwand f
ur einen Iterationsschritt
die Anzahl der Iterationsschritte f
ur eine gew
unschte Fehlerreduktion.
Der letzte Punkt wird bestimmt durch die Konvergenzordnung des Verfahrens, wobei
Definition 7.25 Eine gegen x R konvergente Folge (x(n) ) hat Konvergenzordnung mindestens p 1, wenn ein C 0, 0 C < 1 bei p = 1, existiert, so dass
|x(n+1) x| C|x(n) x|p .

(7.51)

p = 1: lineare, p = 2: quadratische Konvergenz.


(x(n) ) heit superlinear konvergent, wenn Cn 0, Cn 0 fur n existieren
mit
|x(n+1) x| Cn |x(n) x| .
Einen Hinweis auf entsprechende Konvergenz erhalt man durch
x(n+1) x(n) C x(n) x(n1)
bzw.

x(n+1) x(n) Cn x(n) x(n1) .

(7.52)

Lineare Konvergenz: Fehlerreduktion in einem Schritt um Faktor C, d.h. f


ur 1 signifil
kante Stelle sind ca. l 1/ log10 C Schritte notwendig (C 1/10).
In diesem Sinn ist das Bisektionsverfahren linear konvergent mit C = 21 , d.h. f
ur eine
signifikante Stelle sind etwa 3 4 Iterationen notig. Hat man dagegen ein quadratisch
konvergentes Verfahren, z. B. mit C = 10, so kann eine Fehlerhistorie wie folgt aussehen:
n
0
1
2
3
4

Fehler
102
103
105
109
1017

96

Wahrend aber aus (7.51) f


ur p = 1 (wegen C < 1) die Konvergenz folgt, ist f
ur p > 1
(0)
dies (bei beliebigem C > 0) erst f
ur eine gewisse Kleinheit von |x x| der Fall, d.h.
die Konvergenz folgt nur lokal, wobei
Definition 7.26 Sei (x(n) )n die von einem Iterationsverfahren zum Startwert x(0) erzeugte Folge fur ein Problem mit Losung x. Das Verfahren konvergiert global, wenn
(x(n) )n fur alle x(0) R gegen x konvergiert. Das Verfahren konvergiert lokal,
wenn eine Umgebung (x , x + ) (der Einzugsbereich) existiert, so dass x(n)
fur |x x(0) | < gegen x konvergiert.
Das Bisektionsverfahren ist also linear und global konvergent. Verfahren mit hoherer
Konvergenzordnung sind oft nur lokal, so dass abgewogen oder kombiniert werden muss
(s.u.) Ein allgemeiner Ansatz konnte sein:
Sei x(0) eine Naherung der Nullstelle. Eine (bessere) Naherung ist evtl. erhaltlich durch
Ersetze f durch eine einfache Funktion g, die f in der Nahe von x(0) approximiert
und deren Nullstelle zu bestimmen ist.
Bestimme x(1) als Losung von g(x) = 0.
Beim Newtonverfahren ist die Differenzierbarkeit von f vorausgesetzt, man wahlt f
ur
g die Tangente, d.h.
g(x) = f (x(0) ) + f (x(0) )(x x(0) ) ,
(7.53)

Idee des NewtonVerfahrens im R1


Also wird x(1) unter der Voraussetzung f (x(0) ) = 0 durch
g(x) = 0 x(1) := x(0)

97

f (x(0) )
f (x(0) )

(7.54)

bzw. allgemein (wenn f (x(n) ) = 0)


f (x(n) )
f (x(n) )

x(n+1) := x(n)

(7.55)

bestimmt, d.h. die Iteration hat die Form


x(n+1) := (x(n) ) ,

(7.56)

f (x)
f (x)

(7.57)

wobei hier
(x) := x

und der Definitionsbereich von so gewahlt sei, dass dort f keine Nullstelle habe. Eine Iteration der Form (7.56) mit einem allgemeinen, stetigen nennt man
Fixpunktiteration, da, falls konvergent, x(n) gegen ein x konvergiert mit
x = (x) ,

(7.58)

einen Fixpunkt von .


Bei der Wahl (7.57) folgt daraus (wegen vorausgesetztem f (x) = 0)
f (x) = 0
wie gew
unscht. Eine Fixpunktiteration daf
ur konnte aber auch mit
(x) := f (x) x

(7.59)

angesetzt werden. Hinreichende Bedingung f


ur die Konvergenz(ordnung) einer Fixpunktiteration liefert
Satz 7.27 Sei U R offen, : U R stetig, die Folge (x(n) ) zu gegebenem x(0) U
definiert durch x(n+1) := (x(n) ), und es gebe x U und C, p mit p 1, C 0 und
C < 1 fur p = 1, so dass gilt:
(x) x C x x

fur alle x U .

(7.60)

Dann ist fur x(0) nahe bei x die durch definierte Iteration wohldefiniert fur x(0) nahe
bei x und konvergiert mit Konvergenzordnung mindestens p gegen x und x ist Fixpunkt
von .
Beweis: Wahle W = Br (
x) = (
x r, x + r) U, wobei r > 0 so klein ist, dass W U
und
Cr p1 =: k < 1 .

98

Ist x(n) W, dann ist wegen


x(n+1) x = (x(n) ) x C x(n) x

< Crp < r

auch x(n+1) W , d.h. f


ur x(0) W gilt x(n) W f
ur alle n N und ist insbesondere
wohldefiniert. Weiter gilt
d(n+1) := x(n+1) x C x(n) x

< C rp1 x(n) x = k d(n) ,

d.h. d(n) k n d(0) 0 f


ur n und so
x(n) x f
ur n
und damit auch
x = lim x(n+1) = lim (x(n) ) = (
x) .
n

Satz 7.28 Sei U R offen, auf U p-mal stetig differenzierbar und x U ein
Fixpunkt von .
Ist (
x) = 0, | (
x)| < 1 fur p = 1 bzw. (
x) = . . . = (p1) (
x) = 0, (p) (
x) = 0 fur
p > 1, dann ist die durch definierte Iteration lokal gegen x konvergent, genau mit
Konvergenzordnung p.
Beweis: Taylorentwicklung von um x : F
ur x U : gilt:
(x) = (
x) +

(p) ()
(x x)p
p!

mit (x, x) ,

=
x

und bei p = 1 gilt: | ()| < 1 f


ur |x
x| hinreichend klein. Also existiert eine Umgebung
p
W von x mit |(x) x| C|x x| und C < 1 f
ur p = 1, f
ur alle x W. Nach Satz
7.27 folgt also die Behauptung.

Eine auf (7.59) basierende Iteration ist also nur in dem seltenen Fall (
x sei eine Nullstelle
von f )
|f (
x) 1| < 1
lokal und linear konvergent, quadratisch nur f
ur f (
x) = 1. Dagegen gilt f
ur das NewtonVerfahren
Satz 7.29 Sei f C 3 (R) und x eine einfache Nullstelle von f (d.h. f (
x) = 0). Dann
ist das Newtonverfahren lokal gegen x konvergent, mindestens mit Ordnung 2.

99

Divergenz des NewtonVerfahrens im R1


Beweis: Es existiert eine offene Umgebung V von x, so dass f (x) = 0 f
ur alle x V ,
d.h. nach (7.55) ist wohldefiniert und stetig auf V , und x ist Fixpunkt von . Nach
Satz 7.28 reicht es (
x) = 0 zu zeigen:
(x) = 1

f (x)
f (x)2 f (x)f (x)
=
f
(x)
= 0 f
ur x = x
f (x)2
f (x)2

und existiert stetig, da f C 3 .

Vereinfachende Varianten sind das Sekanten-Verfahren (ersetzt f (x(n) ) durch f (x(n) )


f (x(n1) )/(x(n) x(n1) ) mit reduzierter Konvergenzordnung oder die Methode der
Regula falsi, die auch eine Einschlieung liefert.
Hybride Verfahren kopppeln die globale Konvergenz z.B. des Sekanten-Verfahrens mit
z.B. dem Newton-Verfahren oder ableitungsfreien Varianten mit Konvergenzordnung
(n)
(n)
p > 1 : Dabei wird bei Vorliegen eines die Nullstelle einschlieenden Intervalls [xl , xr ]
probeweise ein Schritt mit dem Verfahren hoherer Ordnung versucht und akzeptiert
(n+1)
(n+1)
als xl
oder xr
falls das Intervall nicht verlassen wird. Andernfalls wird auf das
Verfahren 1. Ordnung zur
uckgegriffen.

7.12

Ableitungen von vektorwertigen Funktionen u


ber R

Wir betrachten Funktionen f: Df


Rn
f1 (t)
..
mit = Df R und f (t) = .

z. B.

fn (t)

cos t

sin t t [0, 2]
f (t) =
h
t
2

100

Bemerkung:
1) Haufig bezeichnet man die Variable mit t statt x

wie oben.

2) Wird t als Zeit gedeutet, so beschreibt f eine

Bewegung auf einer Raumkurve im Rn .


e3

obiges Beispiel:

e2

Schraubenlinie
e1

Da man das Bild der Abbildung als Ortsvektor auffassen will, schreibt man besser
x(t) statt f(t) also:

cos t

sin t t [0, 2]
Schraubenlinie der Ganghohe h: x(t) =
h
t
2
(m)

Sei (x(m) )m eine Folge in Rn mit Komponenten xi

R, d.h.

(m)

x(m) = (x1 , . . . , xn(m) )T ,


dann ist das Konvergenzverhalten von (x(m) )m z.B. in der Euklidischen Norm ||.||2
durch das Konvergenzverhalten in R der Komponentenfolgen gegeben, da

(m)

x(m) x in ||.||2 f
ur m xi

xi f
ur m und alle i = 1, , n (7.61)

wobei x = (x1 , . . . , xm )T .
Diese Aussage gilt sogar bzgl. einer beliebigen Norm auf Rn , so dass diese sich hinsichtlich von Konvergenzverhalten (der erzeugten Topologie) nicht unterscheiden
(spater).
Also ist auch

lim f1 (t)
tt0 .

..
lim f (t) =

tt0
lim fn (t)
tt0

und somit auch

101

Satz 7.30 Seien Df = 0, Df R, f = (fi )i=1, ,n : Df Rn , t0 Df .


Dann gilt: f ist stetig in t0 fi ist stetig in t0 fur alle i = 1, . . . , n.
Definition 7.31 Fur Ableitungen nach t (besonders dann, wenn t=Zeit) schreibt
man hochgestellten Punkt, also
d
=:
dt
Definition 7.32 f heit stetig, differenzierbar,
nentenfunktionen diese Eigenschaft haben.

d
f
dt 1

f := ... =
d
f
dt n

C n [a, b] u.s.w. wenn die Kompo


f1
..
.

fn

falls diese Ableitungen existieren, ebenso fusw. und


(m)
f1
m
d

f := ...
dtm
(m)
fn

(d. h. man leitet f komponentenweise ab.)


BSP. 7.26

h
Schraubenlinie x(.) C [0, 2], da cos t, sin t, 2
t C [0, 2] .

Satz 7.2 u
bertragt sich sofort:
Satz 7.33 Seien = Df R, f : Df Rn , t0 Df , so dass eine (einseitige)
Umgebung von t0 in Df existiert.
Dann sind aquivalent:
a) f ist in t0 differenzierbar.
b) Es gibt v Rn und eine in t0 stetige Funktion R mit R(t0 ) = 0, so dass gilt:
f (t) = f (t0 ) + (t t0 )v + R(t)(t t0 )
v und R sind durch (7.62) eindeutig bestimmt.

102

(7.62)

c) Es gibt eine in t0 stetige Funktion S, so dass gilt


f (t) = f (t0 ) + S(t)(t t0 )

(7.63)

S ist durch (7.63) eindeutig bestimmt.


Bei Gultigkeit einer der Aussagen (und damit aller) ist

d
f(t0 )
dt

= v = S(t0 ).

Differenzierbarkeit heit also weiterhin Approximierbarkeit durch eine affin-lineare


Funktion g : R Rn ,

g(t) = (t t0 )f (t0 )
mit einem Fehler von o(t t0 ).

sin t
cos t

BSP. 7.27
Schraubenlinie: x = cos t , x = sin t , u.s.w.
n
0
2
x ist der komponentenweise Grenzwert f
Anschauliche Deutung von x:
ur t
0 des Ausdrucks:

x1 (t + t) x1 (t)
1
1 .

(x(t + t) x(t))
s=
..
=
t
t
xn (t + t) xn (t)

x(t+h)

Im Grenzwert t 0 geht s in
einen Vektor u
ber, der tangial an
der beschriebenen Raumkurve in
x(t) liegt.

x(t)

Ist x(t) eine Bewegung (d. h. t =Zeit), so heit

v(t) := x(t)
: Geschwindigkeitsvektor

103

: Beschleunigungsvektor
b(t) := x(t)
Ein Geschwindigkeitsvektor v(t) = 0 kann immer zerlegt werden in
v(t) := ||v(t)||2

R,

die absolute Geschwindigkeit, und


t(t) :=

1
v(t) ,
v(t)

den Tangenteneinheitsvektor.
BSP. 7.28

e3

cos t2
x(t) = sin t2
t

e2

Schraubenlinie mit nach oben enger werdender Ganghohe.

e1
Geschwindigkeitsvektor =

2t sin t2

v = x = 2t cos t2 = 1 + 4t2
v
1

2t sin t2
1
2t cos t2 .

1 + 4t2
1
t

Beschleunigungsvektor =

2 sin t2 4t2 cos t2


b = v = x = 2 cos t2 4t2 sin t2 .
0

Wir wollen b in Tangential- und Normalanteil zerlegen, d. h.


b = t + n mit n t = 0, ||n|| = 1 b t = =
b=

1
1
(b t)
t +
1 + 4t2
||b t||

TangentialNormalanteil

104

1
4t
1 + 4t2

Folgerung 7.34
Ist ||x(t)||2 = const, dann: x und x(t) stehen senkrecht aufeinander (im Euklidischen
.
Skalarprodukt), kurz: x (t)x(t), denn aus ||x||2 = const folgt x x = const und so:
.
2x x = 0.
Das lat sich anschaulich deuten:
) Bei ||x(t)||2 = const liegt x(t) auf einer Kugel, daher ist der Geschwindigkeits.
vektor x tangential zur Kugel d. h. senkrecht zu x(t).
.

) Ist x(t) die Geschwindigkeit, also


x(t) die Beschleunigung, so hat
||x|| = const zur Folge: Die Beschleunigung hat nur eine Normalkomponente.
Fortsetzung in Ing. Math. III in Raumkurven .

Matrixwertige Funktionen u
ber R.
Wir betrachten M : DM R(m,n) = DM R. Alles oben Gesagte gilt hier
entsprechend, da R(m,n) nur Rmn in anderer Anordnung ist (R(m,n) isomorph zu Rmn ).
BSP. 7.29
M(t) =

cos t sin t
sin t cos t

M =

sin t cos t
cos t sin t

Es gelten Produkt- und Kettenregeln entsprechend, z.B.


(M R) = M R + M R
.
(M f ) = M f + M f
Folgerung 7.35 Ist Q(t) orthogonal f
ur alle t, dann:
T sind antisymmetrisch, denn aus:
QT Q und QQ
T + QQ T = 0 QQ
T = QQ T = (QQ
T )T .
QQT = Id QQ
T =
obiges Beispiel: MM

sin t
cos t
cos t sin t

105

cos t sin t
sin t
cos t

0 1
1 0

BSP. 7.30
Durch x(t) = Q(t)x0 wird eine Raumdrehung beschrieben, wenn Q(t)
orthogonal f
ur alle t ist. Wegen
||x(t)||2 = ||Q(t)x0 ||2 = ||x0 ||2 = const

steht also x(t)


senkrecht auf x(t).
Dann:

0 = QQ
T Qx0 = QQ
T x(t) .
x(t)
= Qx
T , die Spinmatrix, jedem OrtsvekAlso ordnet die antisymmetrische Matrix A = QQ
tor den Geschwindigkeitsvektor zu. Nach (???) wird Ax durch einen axialen Vektor w
dargestellt:
Ax = x f
ur alle x R2 .
Der so zugeordnete Vektor heit Vektor der Winkelgeschwindigkeit, d.h.
x = Ax = x .
Komplexwertige Funktionen u
ber R.
Wir betrachten Funktionen w : Dw C mit = Dw R
BSP. 7.31
w(t) = et cos t + iet sin t
Wegen der eineindeutigen Zuordnung C R2 in der Gau-Zahlenebene gilt alles
oben f
ur F : R R2 gesagte auch hier.
F
ur das Beispiel gilt also:
w(t)

= et (cos t sin t) + iet (sin t + cos t) .


i

anschauliche Deutung von w:

w(t) beschreibt wieder eine Kurve in C( R2 u


ber GauZahlenebene) w = Tangente an
w(t).

.
w(t)

w(t)

106

obiges Beispiel: w/w

(cos t sin t) + i(sin t + cos t)


=1+i
cos t + i sin t

w = (1 + i)w d. h. = (w,
w) = const =
w(t) beschreibt eine logorithmische Spirale

.
w

i
"

.
4

"
w

.
w

einige Rechenregeln:
(w1 w2 ) =
w

(w1 w2 )
w1
w2

(et )

w 1 w 2

w 1 w2 + w1 w 2

w2 w 1 w1 w 2
(w2 )2

= et f
ur C

Beweis:
Nur die letzte Regel ist nicht trivial:
, R, also:
Sei = + i,
(et ) = [et cos t + iet sin t] =
et ( cos t sin t) + iet ( sin t + cos t)
= ( + i)et (cos t + i sin t) = et

BSP. 7.32
Bestimme duch den Ansatz w(t) = et
Losungen der Differentialgleichung w 2w + 2w = 0
Ansatz in Differentialgleichung:

107

et (2 2 + 2) = 0 2 2 + 2 = 0
= 1i
Losungen w1 = e(1+i)t und w2 = e(1i)t
Spater zeigen wir, dass die allgemeine Losung dieser Differentialgleichung
w = c1 e(1+i)t + c2 e(1i)t mit beliebigen c1 , c2 C ist.
Definition 7.36 Partielle Ableitungen
Haufig tauchen in einer Funktion Parameter auf:
BSP. 7.33
f (x, ) = x = mit Parameter f
ur x > 0
Wenn diese Parameter variieren, kann man alle anderen Variablen festhalten und
nach diesen Parametern differenzieren. In diesem Fall nennt man die Ableitungen
partielle Ableitungen und schreibt

lim

x0

lim

f (x + x, ) f (x)
f
= :
= fx
x
x
f
f (x, + ) f (x, )
= :
= f

falls diese Grenzwerte existieren. F


ur das obige Beispiel gilt:
f
f
= x1
= f = x ln x
x

Entsprechend hohere Ableitungen:


2f
2f
2
=
f
=
(

1)x
= fx = x1 ln x
xx
x2
x
Hier seien nur die Bezeichnungen vorgestellt. Wir gehen auf diese Dinge spater ein.

8
8.1

Integration
Lineare Differentialgleichungen

Vorl
aufige Erkl
arung einer Differentialgleichung:

108

Gesucht ist eine Funktion f (x), die mit ihren Ableitungen eine vorgegebene Gleichung
F (x, f, f , . . . f (n) ) 0
erf
ullt,
z. B. jedes Polynom nten Grades Pn erf
ullt die Differentialgleichung f (n+1) (x) 0.
Ist andererseits f C n+1 (a, b) eine Losung auf (a, b), so zeigt das Lagrange-Restglied
der Taylor-Entwicklung (Satz 7.16), dass f ein Polynom n-ten Grades auf (a, b) ist.
1) (ekx ) = kekx . Also ist ekx eine Losung der Differentialgleichung
f = kf (x).

(8.1)

F
ur k > 0 beschreibt (8.1) Wachstum (z. B. einer Population) proportional zur
vorhandenen Groe bzw. Konstanz der Zunahme relativ zur vorhandenen Groe
(f /f = k), was zu exponentiellem Wachstum f
uhrt. F
ur k < 0 beschreibt
(8.1) analog exponentiellen Abbau.
(Spater zeigen wir: cekx mit c R beliebig ist die einzige Losung.)
2) F
ur die Auslenkung eines Massenpunktes aus einer Ruhelage in die Position x(t)
gilt nach dem Newtonschen Gesetz
Masse Beschleunigung = Kraft.
Ist die Kraft etwa bei einer Feder nach dem Hookeschen Gesetz proportional zu
x(t), erhalt man also
= kx(t)
m x(t)
bzw. durch Umskalierung
f + f = 0 .

(8.2)

Diese Gleichung wird von sin x und cos x und damit von jeder Linearkombination
gelost.
Spater zeigen wir: Die allgemeine Losung dieser Gleichung, d.h. jede Losung hat
die Gestalt:
f (x) = C1 cos x + C2 sin x, C1 , C2 beliebig.
Diese Gleichung wird spater als Schwingungsgleichung interpretiert und verallgemeinert.

109

3) Kettenlinie y(x) = a cos h

x
erf
ullt
a
ay =

1 + (y )2

y(0) = a, y (0) = 0
(Beweis durch Nachrechnen)
Wir wollen uns beschaftigen mit folgendem
Problem: Zu gegebenen ai (x), f (x) bestimme man alle y(x), die der linearen DGl
n-ter Ordnung
an (x)y (n) + an1 (x)y (n1) + + a1 (x)y (x) + a0 (x)y = f (x)

(8.3)

gen
ugen.
Die Beispiele 1) und 2), nicht aber 3) sind Spezialfalle von (8.3).
BSP. 8.1

Gesucht y(x) mit


(1 x)y + xy y = 5.

Bemerkung:
1) Spezialfall ist das Auffinden der Stammfunktion: zu gegebenen f ist gesucht
y(x) mit y (x) = f (x).
2) Das Problem ist nicht immer durch elementare Funktionen y(x) losbar, auch
wenn die ai (x) und f (x) elementar sind.
Umformung des Problems in die Vektorraumsprache:
Definition 8.1
d
dn
D :=
, D 0 := 1 , D n := n
dx
dx
n

L=
k=0

ak (x)D k heit linearer Differentialoperator n-ten Grades, wenn an (x) 0.

Welche Funktionen werden von L in welche abgebildet ?

110

Folgerung 8.2
Sind die ak C 0 so ist L =

n
k=0

ak (x)D k : C n C 0 .

Beweis:
L(y1 + y2 ) = Ly1 + Ly2 ist klar.
Obiges Beispiel 8.1: L = (1 x)D 2 + xD + 1 : C 2 C 0 linear.
Lineare Differentialgleichung n-ter Ordnung: Gesucht y C n mit Ly = f f
ur
0
vorgegebene ak , f C (d.h. stetig), an = 0.
Nach der Theorie der linearen Abbildungen konnen wir folgendes sagen:
Satz 8.3

1) Die Losungen N(L) der homogenen DGl Ly = 0 bilden einen VR.

2) Ist y eine (sogenannte partikul


are) Losung der inhomogenen DGl Ly = f, so
ist
y = y + N(L)
die Menge aller Losungen dieser Gleichung.
Was lat sich u
ber die Dimension von N(L) sagen ?
In Ingenieur-Mathematik III zeigen wir folgenden
n

Satz 8.4 Sei L =


k=1

ak (x)D k ein Differentialoperator, an 1, ak , f C 0 (D). Der

Definitionsbereich D der ak und f sei ein Intervall und x0 sei innerer Punkt von D.
Dann gilt:
1) Es gibt genau n linear unabhangige Losungen yi C n , die Ly = 0 erfullen und in
der Nahe von x0 definiert sind, d.h. die allgemeine L
osung der homogenen
DGl Ly = 0 lat sich schreiben als
y h = c1 y 1 + + cn y n ,

ci K beliebig

2) Die allgemeine L
osung der inhomogenen DGl Ly = f existiert, d.h.
eine partikulare Losung y, soda
y = y + c1 y1 + . . . + cn yn
yh

die allgemeine Losung von Ly = f ist.

111

Obiges Beispiel 8.1:


1 y +

x
1
5
y
y=
() f
ur x > 1 oder f
ur x < 1 stetig.
1x
1x
1x

Man pr
ufe leicht nach, dass y1 = x und y2 = ex Losungen der homogenen Gleichung
sind. (Wie gefunden ? Kein Verfahren im allgemeinen !)
yh = c1 x + c2 ex allgemeine der homogenen Gleichungen
y(x) = 5 erf
ullt sicher die DGl
y = 5 + c1 x + c2 ex allgemeine L
osung von ().
Satz 8.5 Unter den Voraussetzungen des vorigen Satzes genau eine Losung des
Anfangswertproblems: Gesucht y(x) mit
L(y) = f
y(x0 ) = y0
y (x0 ) = y1
y (n1) (x0 ) = yn1

fur vorgegebene yi

d.h. man kann die Konstanten ci der allgemeinen Losung so bestimmen (eindeutig),
dass die Forderungen y (k) (x0 ) = yk fur k = 0, 1, . . . , n 1 erfullt ist.
Am obigen Beispiel: Bestimme y(x) so, dass
1
5
x
y
y=
1x
1x
1x
y(0) = 5
y +

y (0) = 1
gilt:
Allgemeine Losung: y = 5 + c1 x + c2 ex
y(0) = 5 5 + c2 e0 = 5 c2 = 0

y (0) = 1 c1 + c2 e0 = 1 c1 = 1

Losung des Anfangswertproblems: y = 5 + x.


Bemerkung:
1) In Ingenieur-Mathematik III behandeln wir diese Problematik genauer. Weil der
wichtige in Kapitel 8.2 und 8.3 behandelte Spezialfall aber sogar ohne Kenntnis der Integralrechnung gelost werden kann ziehen wir diese Betrachtungen vor
(Schwingungsgleichung!).

112

2) Obige Erorterungen geben keine Losungsverfahren. Dazu lat sich sagen:


a) Zu Ly = f im allgemeinen kein Losungsverfahren.
b) Kennt man alle Losungen von Ly = 0, so gibt es ein Losungsverfahren f
ur
Ly = f (Ingenieur-Mathematik III Variation der Konstanten).
c) F
ur den Spezialfall ak =const geben wir in Kapitel 8.2 ein Losungsverfahren
von Ly = 0 an.

8.2
A)

Homogene lineare DGl mit konstanten Koeffizienten


Der komplexe Fall
n

Sei L =
k=0

ak D k , ak C (!) konstant, an = 0. Wir suchen die allgemeine Losung

y : R C mit Ly = 0.
Spezialf
alle:
1) L = 0 y = c1 .
2) L = D n y = c1 + c2 x + c3 x2 + + cn xn1 = Pn1 .
3) L = (D ) ( d.h. Ly = y y = 0) y = c1 ex .
4) L = (D )n =

n
k=0

n
k

nk D k . y(x) =?

Man beachte bei 4), dass man Differentialoperatoren mit konstanten Koeffizienten
ak wie Polynome multiplizieren kann, speziell ist diese Verkn
upfung kommutativ, da
f
ur , C, f
ur y : D C, D C, y differenzierbar auf D, gilt
( + D)y = y + y = y + y = (D + )y
und analog
+ = +
D + D = D + D
(D) = (D)
=
D(D) = (D)(D) = D 2

113

und analog Assoziativ- und Distributivgesetze, z.B.


D(D + D) = D 2 + D 2 .
Das gilt alles nicht f
ur nichtkonstante ak (x)!
Z.B. (xD 1)(sin xD + 1) = x cos xD + x sin xD 2 + xD sin xD 1,
(sin xD + 1)(xD 1) = sin xD + x sin xD 2 sin xD + xD 1.

Nun ist (D )(yex ) = y ex + yex yex = (Dy)ex und damit allgemein


(D )n (yex ) = (D n y)ex
(D )n (Pn1 es ) = (D n Pn1 )ex = 0 mit einem Polynom (n 1)ten Grades Pn1
ist allgemeine Losung von
(D )n y = 0

Z.B.
y + 6y + 12y + 8y = 0 (=
(D + 2)3 y = 0) hat die allgemeine Losung
y = (c1 + c2 x + c3 x2 )e2x . Nun kann man sehr einfach den allgemeinen Fall losen:

Definition 8.6
n

Pn () =

ak k heit charakteristisches Polynom zu L =

ak D k (oder zur DGl

n=0

k=0

Ly = f ).
BSP. 8.2
L = D 3 D 2 + D 1 bzw. die DGl y y + y y = 0 hat das charakteristische
Polynom P3 = 3 2 + 1. In Ingenieur-Mathematik I haben wir gelernt, dass man
Pn () in Linearfaktoren zerlegen kann, d.h.
Pn () = an ( 1 )k1 ( 2 )k2 . . .

mit

mit k C !

i = k f
ur i = k

ki = n

Obiges Beispiel: P3 = ( 1)(2 + 1) = ( 1)( i)( + i).


Damit hat man eine entsprechende Zerlegung fu
r L:
L = an (D 1 )k1 (D 2 )k2 . . .
Obiges Beispiel: L = (D 1)(D i)(D + i).
Ist (D 1 )k1 y1 = 0 Ly1 = an (D 2 )k2 . . . (D 1 )k1 y1 = 0 d.h. die Losungen
=0

114

der Gleichung (D i )ki y = 0 sind auch Losungen von Ly = 0, denn die Faktoren
(D i )ki konnen beliebig angeordnet werden:
Ly = an . . . (D i )ki yi .
Man rechnet nun leicht nach, dass die Losungen von (D i )ki y = 0 zu verschiedenen
i linear unabhangig sind.
Folgerung 8.7
Die linear unabhangigen Losungen der DGl
(D i )ki y = 0
liefern linear unabhangige Losungen von Ly = 0. Damit ergibt sich f
ur eine Losung
von Ly = 0 folgendes
L
osungsschema: Gesucht allgemeine Losung von
n

ak y (k) = 0,

Ly =

an = 0 ak C .

k=0
n

ak k = Pn () auf.

a) Stelle das charakteristische Polynom


k=0

b) Bestimme die Nullstellen i von Pn () und damit die Zerlegung


Pn () = an ( 1 )k1 ( 2 )k2 . . . i C.
c) Zu jeder ki -fachen Nullstelle i gehoren die linear unabhangigen Losungen
ei x , xei x , x2 ei x . . . x(ki 1) ei x .
n

d) Die allgemeine Losung von Ly ist y =

ci yi mit den linear abhangigen yi aus


i=1

c) und ci C beliebig.
BSP. 8.3

1) y y + y y = 0 P () = 3 2 + 1 = 0 1 = 1, 2,3 = i
P () = ( 1)( i)( + i)
y = c1 ex + c2 eix + c3 eix ,

ci C beliebig.

115

2) y (7) + y (6) + 3y (5) + 3y (4) + 3y (3) + 3y (2) + y + y = 0


P7 () = 7 + 6 + 35 + 34 + 33 + 32 + + 1 = ( + 1)(6 + 34 + 32 + 1)
= ( + 1)(2 + 1)3 = ( + 1)( i)3 ( + i)3

y = c1 ex + (c2 + c3 x + c4 x2 )eix + (c5 + c6 x + c7 x2 )eix


Man sieht, die ganze Problematik steckt in der Auffindung der Nullstellen von Pn () !
n

B)

Der reelle Fall: Sei L =


k=0

an D k , an = 0, ak R !

Wir suchen die allgemeine reelle Losung y : R R. Sei Pn () = an ( 1 )k1 . . . das


charakteristische Polynom. Da die ak reell sind, wissen wir aus Ingenieur-Mathematik
I, dass mit i
/ R auch i Nullstelle von Pn () ist. Hat man nun eine komplexe Losung
y des reellen Problems Ly = 0,
also y =
und so y

Re y + i Im y mit Re y, Im y : R R

= (Re y) + i (Im y)

und auch (y) = (Re y) i (Im y) = (y )


und schlielich f
ur a R

ay (n) = ay (n) = a(y)(n)

also auch bei reellen Koeffizienten a0 , . . . , an


(Ly) = Ly
und so ist auch y eine Losung von Ly = 0.
Damit ist auch Re y = 12 (y + y) und Im y = 2i1 (y y) eine Losung von Ly = 0
und man rechnet nach, dass die Real- und Imaginarteile der komplexen Losungen von
Ly = 0 einen Satz von n linear unabhangigen Losungen liefern. Die komplexe Losung
f
ur = + i C
ex = ex eix = ex cos x + i ex sin x
liefert also die reellen Losungen
ex cos x und ex sin x
und analog mit einem polynomialen Vorfaktor.
L
osungsschema:

116

a) und b) wie im komplexen Fall.


c) Zu den ki -fachen reellen Nullstellen i gehoren die linear unabhangigen Losungen
ei x , xei x , . . . , xki 1 ei x .
Zu den km -fachen komplexen Nullstellen m = m im gehoren
em x cos m x, em x sin m x
xem x cos n x, xem x sin m x
..
.
xkm 1 em x cos m x, xkm 1 em x sin m x .
d) Wie im komplexen Fall, ci R beliebig.
BSP. 8.4
1) y y + y y = 0 P () = 3 2 + 1 = ( 1)( i)( + i)
y = c1 ex + c2 cos x + c3 sin x

2) y (7) + y (6) + 3y (5) + 3y (4) + 3y (3) + 3y (2) + y + y = 0


P () = ( + 1)( i)3 ( + i)3

y = c1 ex + (c2 + c3 x + c4 x2 ) cos x + (c5 + c6 x + c7 ) sin x


3) y (4) 8y + 32y 64y + 64y = 0

P () = 4 83 + 322 64 + 64 = (2 4 + 8)2 = ( (2 + 2i))2 ( (2 2i))2


y = e2x cos 2x(c1 + c2 x) + e2x sin 2x(c3 + c4 x)

Wir untersuchen nun den physikalisch interessanten Spezialfall der


Schwingungsgleichung: (Freie Schwingung).
Gesucht y(x) mit

..

a y +b + cy = 0
mit a > 0, b, c 0 .
Diese DGl taucht bei vielen praktischen Problemen auf:

117

mechanischer Schwinger:
..
m x= bx cx
mit m = Masse x = Auslenkung

a)

c = Federkonstante
b = Dampfung
Elektrischer Reihenschwingkreis
..
1
L I +RI + I = 0
C
mit I = Stromstarke
L = Induktivitat
C = Kapazitat
R = Ohmscher Widerstand

R
Widerstand
~U

b)

L
Spule

C Kondensator
..

Losung von a y +by + cy = 0 (reelle Losung)


charakt. Polynom P () = a2 + b + c = 0
1,2

b
=
2a

b
2a

c
a

b
Abklingkonstante
2a
c
Kenn-Frequenz
0 =
a
1,2 = 2 02

mit :=

1. Fall Aperiodischer Kriechfall: > 0 (starke Dampfung)


1 = 2 R und 1 , 2 < 0 !
2 2
2 2
y(t) = c1 e(+ 0 )t + c2 e( 0 )t , c1 ,2 C beliebig
2 2
2 2
andere Darstellung y = et c1 e+ 0 t + c2 e 0 t und bei anderer Wahl der
Konstanten:
y = et d1 cosh

2 02 t + d2 sinh

2 02 t

Die ci bzw. di bestimmt man durch die Anfangsbedingungen


y(0) = y0

y(0)

= y1 .

118

Da 1 < 0 und 2 < 0 lim y(t) = 0.


t
Man u
berlegt folgenden Kurvenverlauf

I
II

f
ur

y1 > 0

II

f
ur

y1 < y0 ( +

III

f
ur

y1 > y0 ( +

III
2. Fall

Ged
ampfte Schwingung: 0 < < 0
1,2 = 0 i mit d =

02 2 = Eigenfrequenz

y(t) = et (c1 cos 0 t + c2 sin 0 t) .


Aus den Anfangsbedingungen berechnet man die ci
y(0)

+ y(0)
y(t) = et y(0) cos 0 t +
sin 0 t .
0
Andere Form:
y(t) = Aet cos(0 t + )
mit Amplitude A = c21 + c22
c2
.
und Nullphase = arctan
c1
y

3. Fall

Aperiodischer Grenzfall = 0 > 0

1 = 2 =

y(t) = (c1 + c2 t)et


Kurvenverlauf ahnlich dem 1. Fall.
Man kann diesen Fall auch erhalten als Grenzwert:
lim der Falle 1 und 2.

4. Fall

Unged
ampfte Schwingung: = 0

119

2 02)
2 02)

y(t) = c1 cos 0 t + c2 sin 0 t = A cos(0 t + ) A, wie im 2. Fall.


y

Was geschieht, wenn man die Schwingung durch Krafte erregt, wenn z.B. bei dem
mechanischen Schwingen eine Zusatzkraft f (t) hinzutritt, d.h.
..

m x= bx cy + f (t) .
Das f
uhrt auf eine inhomogene lineare DGl mit konstanten Koeffizienten, die wir im
folgenden Abschnitt behandeln.

8.3

Ansatzverfahren zur L
osung von inhomogenen linearen
DGl mit konstanten Koeffizienten

Die inhomogene Form der Evolutionsgleichung 8.1


y(x) ky(x) = g(x)
kann mit der Variation der Konstanten gelost werden und ergibt als partikulare
Losung
x

ek(xs) g(s)ds .

y(x) =

(8.4)

Um zu u
ufen, dass (8.4) eine Losung ist, sind Kenntnisse u
berpr
ber das Integral und
sein Zusammenspiel mit der Integration notig (siehe Abschnitt 8.4 ff.).
x

y (x) = ek(xx) g(x) +


0

d k(xs)
e
g(s)ds
dx

ek(xs) g(s)ds

= g(x) + k
0

= g(x) + ky(x)
Die allgemeine Losung ist also
x

y(x) = Cekx +

ek(xs) g(s)ds .
0

120

Wegen

x0

y(x0 ) = Cekx0 +

ek(x0 s) g(s)ds

ist f
ur die eindeutige Losung mit
y(x0 ) = y0
C so zu wahlen, dass
x
k(xx0 )

y(x) = e

ek(xs) g(s)ds .

y0 +
x0

F
ur allgemeine lineare Differentialoperatoren und konstante Koeffizienten kann f
ur spezielle Formen von g ein direkter Ansatz gemacht werden.
n

Wir betrachten also Ly = f mit L =


k=0

ak D k , an = 0, ak K, f : R K.

Wir wissen aus 8.1, dass die allgemeine Losung gegeben ist durch
y.
y = c1 y1 + . . . + cn yn +
Losung von Ly=0
Wie findet man eine partikulare Losung y von Ly = f ? In Ing. Math. III lernen wir ein
allgemeines Verfahren kennen, wie man aus der Kenntnis der y1 , . . . , yn ein y konstruiert
(Variation der Konstanten, geht auch f
ur DGl mit nichtkonstanten Koeffizienten).
Zunachst bemerken wir eins: ist L
y1 = f1 und L
y2 = f2 L(
y1 + c
y2 ) = f1 + cf2 .
Folgerung 8.8
Eine Losung y von Ly = f1 + f2 + . . . + fm findet man, in dem man L
yi = fi lost; dann
ist y = y1 + . . . + ym .
Wir geben nun ein Verfahren an, wie man partikul
are Lo
sungen fu
r spezielle
Inhomogenit
aten findet: Man beobachtet, dass gewisse Funktionentypen sich bei
Anwendung von L reproduzieren, wie z.B.
Pn (x),

a cos x + b sin x,

Pn (x)ex u.s.w. .

Wir konnen hoffen, dass wir umgekehrt bei Inhomogenitaten dieses Types auch partikulare Losungen des selben Typs finden werden. Daher macht man f
ur diesen Typ
einen Ansatz des gleichen Typs mit unbestimmten Koeffizienten; durch Einsetzen in
die DGl bestimmt man die Koeffizienten.
A)

Der komplexe Fall


n

Sei L =
k=0

ak D k , ak C , P () =

n
k=0

ak k = an ( 1 )k1 ( 2 )k2 . . . , sei das

charakteristische Polynom.
Wir betrachten die DGl Ly = aex , C.

121

Satz 8.9
1) Ist nicht Nullstelle von P (), so liefert der Ansatz y = Aex eine partikulare
Losung von Ly = aex .
2) Ist eine k-fache 0-Stelle von P (), so liefert der Ansatz y = Axk ex eine partikulare Losung (d.h. A lat sich geeignet bestimmen).
Beweis:
!

1) L
y = LAex = AP ()ex = aex
a
liefert eine Losung (P () = 0 ist erf
ullt).
A=
P ()
2) Ist k-fache 0-Stelle von P () = Q()( )k mit Q() = 0
LAxk ex = AQ(D)(D )k xk ex
!
= AQ(D)(D k xk )ex = A k!Q()ex = aex
a
A=
liefert das Gew
unschte.
Q()k!
Ebenso zeigt man f
ur DGl Ly = Qm (x)ex mit Qm = Polynom.

Satz 8.10
1) Ist keine 0-Stelle von P (), so liefert der Ansatz y = Sm (x)ex eine Losung
von Ly = Qm ex .
2) Ist eine k-fache 0-Stelle von P (), so liefert der Ansatz y = xk Sm (x)ex eine
Losung.
(Sm (x) ist ein Polynom vom gleichen Grade wie Qm mit unbestimmten Koeffizienten).
Bemerkung:
1) Dieser Ansatz gilt auch f
ur = 0, d.h. f
ur DGl des Typs Ly = Qm (x).
2) Liegt bei den obigen Fallen der Fall P () = 0 vor, so spricht man von Resonanzfall. (siehe Schwingungsgleichung)

122

BSP. 8.5
y IV 2y + 2y 2y + y = 3ex + 2xex x2
P () = ( 1)2 ( + i)( i) = ( 1)2 (2 + 1)
F
ur Ly = f1 = ex machen wir den Ansatz y1 = Aex denn (P (1) = 0)
3
3
L
y1 = Aex (1 + 2 + 2 + 2 + 1) = 8Aex = 3ex A = y1 = ex .
8
8
F
ur Ly = f2 = x2 machen wir den Ansatz y2 = (Ax2 + Bx + C) (keine Resonanz, da
P (0) = 0).
L
y2 = 4A 4Ax 2B + Ax2 + Bx + C = Ax2 + (B 4A)x + 4A 2B + C = x2
!
A = 1, B = 4, C = 4 y2 = x2 4x 4
F
ur Ly = f3 = 2xex machen wir den Ansatz y3 = x2 (Ax + B)ex = (Ax3 + Bx2 )ex
(weil = 1 doppelte Nullstelle von P () ist).
L
y3 = ex (Ax3 + Bx2 + 4(3Ax2 + 2Bx) + 6(6Ax + 2B) + 4(6A)
2ex (Ax3 + Bx2 + 3(3Ax2 + 2Bx) + 3(6Ax + 2B) + (6A))
+2ex (Ax3 + Bx2 + 2(3Ax2 + 2Bx) + (6Ax + 2B))
2ex (Ax3 + Bx2 + (3Ax2 + 2Bx)
+ex (Ax3 + Bx2 ))
= ex (2(6Ax + 2B) + 2(6A)) = ex (12Ax + 4B + 12A) = 2xex
1
1 3 1 2 x
1
B=
y3 =
x x e
A=
6
2
6
2
Hier rechnet man schneller so:
L
y3 = (D 2 + 1)(D 1)2 (Ax3 + Bx2 )ex = (D 2 + 1)(6Ax + 2B)ex
= ex (6Ax + 2B + 2(6A) + 6Ax + 2B) = ex (12Ax + 4B + 12A)
u.s.w. wie oben.
Damit haben wir die allgemeine Losung
1
1
3
y = (c1 +c2 x)ex +c3 eix +c4 eix + ex x2 4x4+ x3 x2 ex ,
8
6
2
n

B)

Der reelle Fall: Sei L =


k=0

ci C beliebig.

ak D k , ak R

Die in A gefundenen Ansatze gelten hier nat


urlich auch.
obiges Beispiel:
3
y = (c1 + c2 x)ex + c3 cos x + c4 sin x + ex x2 4x 4 +
8

1 3 1 2 x
x x e .
6
2

Da f
ur komplexe Losungen y von Ly = f mit reellen L und f gilt: Re y und Im y sind
auch Losungen, so konnen wir obige Ansatze sicher entsprechend verwenden, wenn
f =Realteil oder Imaginarteil obiger Inhomogenitaten ist, also f
ur Inhomogenitaten

123

des Typs ex cos x, sin x u.s.w. Damit erhalten wir folgende Ansatztabelle f
ur
Ly = f, charakteristisches Polynom P () :
Inhomogenitat f

Ansatz

Resonanz k-fach

aex

Aex

k-fache 0-Stelle von P

Qm (x)ex

Sm (x)ex

k-fache 0-Stelle von P

Qm (x)

Sm (x)

0 k-fache 0-Stelle von P

ex (a cos x + b sin x)

ex (A cos x + B sin x)

a cos x + b sin x

A cos x + B sin x

m sin x ex (Sm cos x + Sm sin x)


ex (Qm (x) cos x + Q

i k-fache 0-Stelle von P


i k-fache 0-Stelle von P
i k-fache 0-Stelle von P

Liegt k-fache Resonanz vor, muss der Ansatz mit xk multipliziert werden.
Beachte: Es ist klar, dass man im Ansatz immer sin und cos Summanden ansetzen muss, auch wenn die Inhomogenitat nur einen der Ausdr
ucke enthalt, d.h.
2x
2x
. . . = 3e cos 3x y = e (A cos 3x + B sin 3x).
BSP. 8.6
y IV 8y + 32y 64y + 64y = cos x xe2x cos 2x
P () = ( (2 + 2i))2 ( (2 2i))2
f1 = cos x Ansatz: y1 = A cos x + B sin x (0 i keine Nullstelle vonP )
!
L
y1 = (A + 8B 32A + 64B + 64A) cos x + (B 8A 32B 64A) sin x = cos x
33A + 72B

= 1

72A 31B = 0

A=

31
,
5184

B=

72
5184

72
31
cos x +
sin x
5184
5184
f2 = xe2x cos x Ansatz: y2 = x2 e2x [(Ax + B) cos 2x + (Cx + D) sin 2x] weil Doppelresonanz vorliegt: 2 2i ist 2-fache Nullstelle von P .
Die Bestimmung von A, B, C, D ist hier etwas m
uhsam.
Allgemeine Losung:
y1 =

y = [(c1 + c2 x) cos 2x + (c3 + c4 x) sin 2x]e2x

31
72
cos x +
sin x + y2 .
5184
5184

Wichtigstes Beispiel: Erzwungene Schwingung


..

Wir betrachten die DGl a x +bx + cx = F (t) a, b > 0 die inhomogene Schwingungsgleichung.

124

Die homogene Losung xh hatten wir bereits in 8.2 bestimmt. F


ur b > 0 galt > 0 und
wir hatten in diesem Fall lim x(t) = 0.
t

Da sich die allgemeine Losung zu x(t) = xh + x(t) bestimmt, sieht man: nach einer
gewissen Zeit (Einschwingzeit) ist y(t) = y(t) (station
are L
osung). Man sagt:
die Eigenschwingung klingt ab, x(t) wird durch die Erregung F (t) bestimmt. Wir
untersuchen den Fall der
periodischen Erregung: F (t) = Fm cos t .
Da f
ur die Nullstellen des charakteristischen Polynoms galt:
2 02

1,2 =

ist f
ur > 0, i niemals Nullstelle Ansatz f
ur x(t),
x(t) = A cos t + B sin t
oder was gleichwertig ist
x = A cos(t + )

stationare Losung .

Einsetzen in die DGl ergibt:


A=

Fm
a

(02

2 )2 + (2)2

= arctan

2
.
02

Man sieht: x(t) schwingt mit der durch F (t) vorgegebenen Frequenz .
Die Abhangigkeit der Amplitude A und Phasenverschiebung von nennt man FreFm
= x f
ur = 0
quenzgang. xstat =
c

_A

-R

xstat
e

ine

kle

ne

gro

i
kle

_B
2

e
gro

_
T
T0

125

_
T
T0

Man sieht A wird maximal, bei der Resonanzfrequenz r = 02 2 2 f


ur kleine
wird die Spitze bei r immer hoher und scharfer. (Resonanzunfall)
lim(r ) =

Im Fall b = 0 = 0 Nullstellen des CharakterPolynoms bei 1,2 = 0 i.


In diesem Fall klingt die Eigenschwingung xn nicht ab.
F
ur = 0 liegt der Resonanzfall vor und wir erhalten eine partikulare Losung x(t) =
t A cos(t + ).
Man sieht : F
ur groe Zeiten gibt es beliebig groe Werte f
ur x(t). Das entspricht der

Uberlegung lim A(2 ) = !


0

8.4

Stammfunktion und Integral

Sei I R ein Intervall, f C 0 (I, R) wir betrachten die DGl: Gesucht F C 1 (I, R)
mit
F = f
(8.5)
Z.B. F = cos F = sin x + c
Definition 8.11 F heit Stammfunktion von f , wenn (8.5) erfullt ist; die allgemeine Losung von (8.5) heit unbestimmtes Integral von f , geschrieben f dx.
Eine Stammfunktion ist nicht eindeutig (s.u.).

BSP. 8.7
sin x 3 ist Stammfunktion von cos x,

das unbestimmte Integral von cos x ist

cos xdx = sin x + c, c R beliebig.

Existenzsatz: Ist f C 0 , dann gibt es eine Stammfunktion (siehe 8.7)


Eindeutigkeitssatz:
Sind F1 und F2 Stammfunktionen von f F2 F1 = const. = c .
Folgerung 8.12 aus der Definition 8.11:

f dx = f ,

f dx = f + c.

Bemerkung: Die von Leibniz stammende Bezeichnung hat hier symbolischen Charakter. In 8.7 wird die Bezeichnung klar.
BSP. 8.8

126

7x6 dx = x7 + c,
ex dx = ex + c.
Beweis dieser Beispiele durch differenzieren.
1
x ax
Z.B. x arctan xa dx = (x2 + a2 ) arctan
+c
2
a
2
F

Beweis: F = x arctan xa + 12 (x2 + a2 )

1
2
1+( x
a)

1
a

a
2

= x arctan xa .

Trotz Formelsammlung benotigt man die Technik des Integrierens:


a) Um zu zeigen, wie man auf die Formeln kommt.
b) Um beliebige Integrale auf die vertafelten zur
uckzuf
uhren.

Bemerkung: Es gibt elementare Funktionen, die keine elementaren Stammfunktionen


x
2
besitzen. (z.B. ex dx, sinx x dx, ex dx ist keine elementare Funktion.)
en

elementare Funktion

ier

z
ren

fe

dif
elementare Funktion

integrieren

nichtelementare
Funktion

Wir benotigen also auch numerische Integrationsverfahren. (siehe 8.10)


Definition 8.13
Ist
b
a
b

f dx = F (x) + c , so bezeichnen wir mit:

f dx := F (b) F (a) =: F (x) |ba das bestimmte Integral.


f (x)dx ist eindeutig unabhangig von der Konstanten in der Stammfunktion.

BSP. 8.9

sin dx = cos |0 = 1 + 1 = 2 .

Weitere Bezeichnungen:
b

f (x) dx
a

x = Integrationsvariable
a = untere Integrationsgrenze
b = obere Integrationsgrenze.

127

Folgerung 8.14
b

1)
a

b
b

2)

+
a

=
a

b
x

d
3)
dx

.
b

d
f (t)dt = f (x) ,
dx

f (t)dt = f (x) .
x

f (t)dt ist Losung des Anfangswertproblems F = f, F (a) = 0.

4) F (x) =
a

5)
x

F = f
F (a) = F0
gerades f .

F (x) = F0 +

f (t)dt . Also
a

f (x)dx =
a

f (x)dx f
ur un0

6) Ist f (x) = f (x), dann

f (x)dx = 0.
a

F ist Stammfunktion zu f , wie


a

also F (x) = C +

f (t)dt ,

f (t)dt und F0 = C + 0 aus der Anfangsbedingung.


a

Also
a

f (x)dx =

f (x)dx f
ur ungerades f .
0

f (x)dx = 2

Ist f (x) = f (x), dann


0

Also

f (x)dx =
a

f (x)dx.
0

f (x)dx f
ur gerades f .
0

128

Beweis zu 6)
Sei f (x) = f (x) und F (x) eine Stammfunktion, dann
(F (x)) = F (x) = f (x) = f (x) und so ist F (x) auch Stammfunktion und
damit:
F (x) = F (x) + c. Einsetzen von x = 0 zeigt c = 0, d.h. F (x) = F (x) und so
a

f dx = F (a) F (a) = 0 und auch die zweite Formulierung.


a

Analog folgt f
ur eine Stammfunktion F
(F (x)) = f (x) = f (x) ,
also ist F (x) auch Stammfunktion, d.h.
F (x) = F (x) + c ,
also
c = 2F (0)
und somit
F (0) F (x) = F (x) F (0) .
Das ist f
ur x = a die zweite Behauptung und so auch die erste.

Alternativ zu unbestimmtes Integral = Umkehrung der Differentiation kann man

von der Motivation ausgehen bestimmtes Integral = Flachenmessung (f


ur f
0,

zwischen y = 0 und y = f (x), x [a, b]).


Es gilt ja:
b

cdx = c(b a) (Rechteck)

1
xdx = (b2 a2 )
2

129

1
= (a + b)(b a) halbes Trapez
2

(r 2 x2 )1/2 dx werden wir spater berechnen (f


ur r > 0).
0

8.5

Integrationsregeln Technik des Integrierens

Integrationsregeln gewinnt man durch Integration von Differentiationsregeln.


Sei F = f, G = g
1. Aus (F + G) = f + g
(f + g)dx =

f dx +

gdx

entsprechend f
ur bestimmte Integrale

,
a

d.h.

ist ein linearer Operator.

BSP. 8.10
(a)

1
(3 cos x x6 )dx = 3 sin x x7 + c .
7
n

n
i

(b)

ai

ai x dx =
i=0

i=0

1 i+1
x +c .
i+1

2. Ansatzverfahren:
F
ur spezielle f gehen die Ansatze aus 8.3
z.B.

ex x2 dx = ex (Ax2 + Bx + C) =: F in die DGL F = ex x2 eingesetzt


!

ex (Ax2 + (B + 2A)x + (C + B)) = ex x2


2
2
1
A= , B= 2 , C= 3

2
x2 2x
x 2
x
2 + 3 +c .

e x dx = e

130

3.

1
f f dx = f 2 + c
2

1 2
(f ) = f f
2

(arctan x)

BSP. 8.11
4. (ln |f |) =

x2

1
1
dx = (arctan x)2 + c .
+1
2

f
dx = ln(|f |) + c f
ur f mit f (x) = 0 f
ur x Df .
f

BSP. 8.12
(a)

(x 1)dx
1
= ln |x2 2x + 5| + c .
2
x 2x + 5
2

(b)

1
dx = ln | arctan x| + c .
(arctan x)(x2 + 1)

5. (xf ) = xf + f

xf dx

f dx = xf

Diese Regel wendet man an, wenn

xf dx einfacher zu berechnen ist, als

f dx.

BSP. 8.13
(a)

arctan xdx = x arctan x

1
x
dx = arctan x ln(1 + x2 ) + c .
2
1+x
2
x
dx = x ln x x + c .
x

(b) I1 :=

ln xdx = x ln x

(c) In :=

(ln x)n dx = x(ln x)n n

(ln x)n1 dx = x(ln x)n nIn1 .

Das ist eine Rekursionsformel f


ur In , die z.B. aufgelost ergibt f
ur n = 4 :
(ln x)4 dx = x(ln x)4 4x(ln x)3 + 4 3x(ln x)2 4 3 2x ln x + 4 3 2x + c .
6. Die letzten Regeln waren Spezialfalle der folgenden Regel
(f g) = f g + g f
Folgerung 8.15

f dx =

f gdx = f g
1f dx = xf

131

g f dx (Partielle Integration)

xf dx (Regel 5).

Beachte: Man muss f und g so wahlen, dass

g f einfacher wird.

BSP. 8.14
()

xe2x dx =

(a)

gral

1 2 2x
x e 2
2

1 2 2x
x e dx, das ist schwerer als das Ausgangsinte2

f = x f = 21 x2
g = e2x g = 2ex

()

besser:
()

xe2x dx =

1 2x
xe
2

1
1 e2x dx = e2x
2

+c .

1
f = e2x f = e2x
2
g = x g = 1

()

x cosh x dx = x sinh x

(b)

1
1
x
2
4

1 sinh xdx = x sinh x cosh x + c

obige Regel kann auch mehrfach angewendet werden:


x2 sinh xdx = x2 cosh x

z.B.

= x2 cosh x 2x sinh x

2x cosh x
2 sinh xdx

= x2 cosh x 2x sinh x + 2 cosh x + c .


Durch partielle Integration versucht man die Integrale zu vereinfachen. Damit
kann man haufig Rekursionsformeln herstellen.
BSP. 8.15
In =

xn cosh xdx = xn sinh x n

xn1 sinh xdx

= xn sinh x n xn1 cosh x (n 1)

xn2 cosh xdx

In = xn sinh x nxn1 cosh x + n(n 1)In2 ,


I0 = sinh x + c ,
I1 = x sinh x cosh x + c .

Man gewinnt machmal auch Rekursionsformeln, durch folgende Uberf


uhrung:
In1

partielle

Integration

132

In .

Man lost dann einfach nach In auf !


BSP. 8.16
dx
x
=
+ (n 1)
(x2 + 1)n1
(x2 + 1)n1
x
+ 2(n 1)In1 2(n 1)
=
2
(x + 1)n1

In1 =

2x2
dx
(x2 + 1)n
dx
,
2
(x + 1)n
=In
2

da 2(n 1)(In1 In ) = 2(n 1)


dx
folgt:
+ 1)n
1
2n 3
x
=
+
In1
2n 2 (x2 + 1)n1 2n 2
dx
= arctan x + c .
=
1 + x2

F
ur In =
In
I1

(xn

x
.
+ 1)n

(x2

f
ur n 2 .

Man gewinnt manchmal auch Rekursionsformeln, durch die Uberf


uhrung
I

partielle

Integration

I .

Man lost nach I auf! (Wenn es geht!)


BSP. 8.17
(a) I

1
b
eax cos bx dx = eax cos bx +
a
a

1 ax
b 1 ax
b
e cos bx +
e
sin
bx

a
a a
a

eax sin bx dx

eax cos bx dx

b2
1
1
I 1 + 2 = eax cos bx + 2 beax sin bx + c
a
a
a
1
eax (a cos bx + b sin bx) + c .
I= 2
a + b2

cos2 xdx = cos sin x +

(b) I =

cos2 xdx
I

133

()

sin2 xdx = cos x sin x cos x sin x +

I = I (Das wussten wir schon vorher.)


()

Besser bei =: cos x sin x +

(1 cos2 x)dx = x + cos sin x I

1
I = (x + cos x sin x) + c .
2

7. Nun integrieren wir die Kettenregel: F ((t)) =

dF
((t))(t)
= f (t)(t),

also
d

Substitutionsregel
Seien f C 0 , C 1 und f ((t)) definiert, dann gilt:
f dx|x=(t) =

f ((t))(t)dt

oder f
ur bestimmte Integrale:
(t2 )

t2

f ((t))(t)dt

f (x)dx =
(t1 )

t1

oder, falls invertierbar ist,


1 (b)

f (x)dx =
a

f ((t)(t)dt

1 (a)
( )

Beweis: etwa der 2. Form: Sei g( ) =

f (x)dx,
(t1 )

h( ) =

f ((t))(t)dt

t1

d
g( ) = f (( ))(
)
d
d
Andererseits
h( ) = f (( ))(
), also g = h und g(t1 ) = h(t1 ) = 0 und damit
d
h g.

Bemerkung: Meist verwendet man obige Regeln von rechts nach links, d.h. man
f
uhrt Integrale des rechten Typs auf den linken zur
uck. Eine Argumentgruppe
muss also zu einer neuen Variable zusammengefasst werden:
u = (x) ,

so dass (x) als Faktor im Integranden auftritt, was zur Ersetzung (formal) von
du
= (x) .
(x)dx durch du f
uhrt wegen
dx
Man kann die Regeln verschieden anwenden:
BSP. 8.18

134

(a) I =
0

x
() 1

dx =
2
2
2
r +x

2r 2
r2

du
2
= u|2r
=
r(
2 1) f
ur r > 0 .
2
r
u

f (x) = r 2 + x2 = u
2xdx = du

()

oder gleich

(x) = r 2 + x2 = u

2xdx
()

= du
2 x2+ r 2
2r

1du = r( 2 1) .
I=
r

F
ur das unbestimmte Integral substituiere man den Schluss zur
uck;
x
du
1

=
obiges Beispiel: I =
dx =
2
u
r 2 + x2

u=(x)=r 2 +x2
=
u+c
r 2 + x2 + c
(b)

e
[(ln x)2
1

()

()

2 ln x]dx =

1 2
(u
0

2u)eu du = eu (u2 4u + 4)|10 = e 4 .

f (x) = ln x = u
1
dx = du dx = xdu = eu du
x

Hier trat u nicht als Faktor auf, lasst sich aber leicht durch u ausdr
ucken!
Das gleiche Integral wie in (a) lasst sich (etwas umstandlich) auch mittels
einer Transformation berechnen, bei der nur die Umkehrfunktion konkret
ist:
Arsinh 1
Arsinh 1
r
xdx
sinh t r cosh t
()

(c)
dt = r
sinh tdt =
=
r cosh t
r 2 + x2
0
0
0

2 Arsinh 1
Arsinh
1
= r( 2 1) .
r cosh t|0
= r 1 + sinh t|0
()

x = r sinh t =: x(t) = 1 (t)


dx = r cosh t dt

Hier muss also x(t) invertierbar sein

und
r 2 + x2 = r 2 (1 + sinh2 t)
= r 2 cosh2 t .
8. Integration von Umkehrfunktionen

135

Sei f 1 C 1
f 1 (x)dx = xf 1 (x)
bzw.

f 1 (x)dx|x=f (t) = tf (t)

f (t)dt|t=f 1 (x)

f (t)dt

f (b)

oder als bestimmtes Integral

(x)dx +

f (a)

f (t)dt = bf (b) af (a) .

Beweis: Wir setzen x = f (t), also dx = f dt und somit:


f 1 (x)dx =

tf(t) dt = tf (t)

f (t) dt = xf 1 (x)

f (t)dt|t=f 1 (x) .

BSP. 8.19
(a)

arcsin xdx = x arcsin x


x arcsin x +

sin ydy|y=arcsin x =

1 sin2 y|y=arcsin x + c = x arcsin x +

1 x2 + c .

(b) Sei f (x) := x + ex + f (x) = 1 + ex > 0


Also ist f streng monoton wachsend und somit existiert f 1 und es gilt:
f 1 (1) = 0 und f 1 (1 + e) = 1 .
Es kann das Integral von f 1 bestimmt werden, ohne dass ein geschlossener
Ausdruck daf
ur vorliegt, hier am Beispiel:
1+e
1

f 1 (t) dt = tf (t)|10

1
0

1
3
f (t) dt = 1 + e ( t2 + et )|10 = .
2
2

Die Integrationsregel kann auch geometrisch gedeutet werden, z.B. f


ur
0 a b, 0 f (a) f (b) :

136

f(b)
2

f(a)

=4
1

a
1

z.B. f
ur a

b, 0

f (a)

b
2

= 4

f (b) :

2a

f(b)
- 2b

=4

f(a)

=- 3

b
1 + 2a +

2b = 4

Komplexe Integrale:
F
ur f : R C mit f (x) = u(x) + iv(x), f stetig definieren wir entsprechend:
f dx =

udx + i

vdx

BSP. 8.20
1.

1
(t2 + i sin t)dt = t3 i cos t + c ,
3

2.

ex dx =

3.

1 x
e +c,

f
ur C !

1
(x + )n+1 + c ,
n+1
Hier ist jeweils c C.
(x + )n dx =

137

f
ur n Z , n = 1 .

Folgerung 8.16

Ref dx = Re f dx,

Imf dx = Im

f dx .

Manchmal ist es vorteilhaft, eine reelle Funktion als Real- oder Imaginarteil einer komplexen Funktion zu sehen und die Integration im Komplexen durchzuf
uhren:
BSP. 8.21
1
e(a+ib)x + c
a + ib
1
1
Re e(a+ib)x (a ib) + c = 2
eax (a cos bx + b sin bx) + c f
ur c C ,
= 2
2
2
a +b
a +b
1
da wegen z z = |z|2
z 1 = 2 z gilt f
ur z C .
|z|
eax cos bxdx =

Re e(a+ib)x dx = Re

Integration rationaler Funktionen

P (x)
dx, P, Q Polynome
Q(x)
1. Schritt: Falls grad P grad Q kann man durchdividieren und erhalt
P
S(x)
= T (x) +
mit grad S(x) < grad Q(x) .
Q
Q(x)
Die Integration des Polynoms T (x) ist einfach, wir gehen also im Folgenden davon aus,
dass
grad P < grad Q .
2. Schritt: Zerlege Q in Linearfaktoren:
Q = an (x x1 )k1 (x x2 )k2 mit den Nullstellen xi C :

P
P
=
.
k
Q
an (x x1 ) 1 (x x2 )k2

Nun machen wir eine Zwischen


uberlegung:
Lemma 8.17 Sei C eine k-fache Nullstelle von Q, d.h. Q = (x )k Q(x)

mit Q()
= 0. Dann gibt es eindeutige A C, P Polynom mit Grad hochstens
min (grad Q, grad P) 1, so dass

138

P
P
A
.
=
+
k
Q
(x )
(x )k1Q
Es ist A =

()

P ()
(Methode zur Berechnung der A).

Q()
P ()

AQ P |x= = 0 AQ P = (x )P | .
Q()
Dividieren durch Q ergibt:

Beweis: Sei A =

A
P ()
P
P
zu A =

existiert ein P eindeutig.


k
k1

(x )
Q
Q()
(x ) Q
Aus () folgt
P = AQ + P (x ) und somit

P () = AQ(), also notwendigerweise


A = P ()/Q() .

Wendet man dieses Abspaltungsverfahren fortlaufend auf


man:

P
(x )k1 Q

an, so erhalt

Satz 8.18 (Partialbruchzerlegung (PBZ) im Komplexen): Es gibt eindeutige


Aik C mit
P
A11
A12
A1k1
A21
A22
=
+
++
+
+
+ ... .
2
k
1
Q
(x 1 ) (x 1 )
(x 1 )
(x 2 ) (x 2 )2
Nach dieser Zerlegung konnen wir
P
dx ,
Q
im Komplexen berechnen,
denn es gilt f
ur = + i C:

139

A
A
dx =
+ c f
ur n = 1 ,
n
(x )
(n 1)(x )n1
A
x
1
x
+ const,
dx = A
dx = A
ln |x |2 + i arctan
2
(x )
|x + |
2

1
x
x + i
da
dx =
dx =
dx =: I1 + i I2 + const
2
(x )
|x |
(x )2 + 2
d
2(x )
1
ln((x )2 + 2 ) =
und I1 = ln |x |2 , da
2
dx
(x 2 ) + 2
x
I2 = arctan
, da

1
1
x

d
=
arctan
= 2
.
2
dx

+ (x )2
x
1+

Nun ist man im Allgemeinen an reellen Integralen interessiert. F


ur reelle P, Q gilt
obige Zerlegung nat
urlich auch, wir konnen aber auch rein reell rechnen:
so dass Q
Hat Q eine nicht reelle Nullstelle = + i mit = 0, dann auch ,
folgenden Faktor enthalt:
= x2 2x + (2 + 2 ) =: x2 + bx + c,
(x )(x )
wobei b2 4c = 4 2 < 0 .
Satz 8.19 (Partialbruchzerlegung im Reellen)
Sei Q(x) = a(x x1 )k1 (x x2 )k2 . . . (x2 + b1 x + c1 )m1 (x2 + b2 + c2 )m2 . . . mit b2i 4ci < 0
(d.h. quadratische Terme irreduzibel).
Dann gibt es eindeutige Aik , Bik , Cik C mit
A11
A12
A1k1
A22
P
=
+
+ +
+
+ +
2
k1
Q
(x x1 ) (x x1 )
(x x1 )
(x x2 )
B11 x + C11
B12 x + C12
B1m x + C1m1
B21 x + C21
+ 2
+ ...+ 2 1
+
+ ... .
2
m
+ b1 x + C1 ) (x + b1 x + c1 )
(x + b1 x + c1 ) 1 (x2 + b2 x + c2 )

(x2

Mit dieser Zerlegung konnen wir auch

P
dx im Reellen berechnen, da f
ur die TeilinQ

140

tegrale gilt:
dx
1
=
+ c f
ur n = 2, 3, . . .
n
(x x1 )
(n 1)(x x1 )n1
dx
= ln |x x1 | + c
(x x1 )
A
2x + b
Ax + B
bA
dx =
dx + B
2
k
2
k
2
(x + bx + c)
2
(x + bx + c)
2
(b 4c < 0!)
A
bA
=
Ik f
ur k > 1
+ B
2
k1
2(k 1)(x + bx + c)
2

(x2

dx
+ bx + c)k

und f
ur k = 1

A
bA
Ax + B
dx = ln |x2 + bx + c| + B
+ bx + c
2
2

x2
mit

Ik =
I1 =

(x2
x2

I1

dx
2x + b
2(2k 3)
= 2
+
Ik1
k
k1
2
+ bx + c)
(x + bx + c) (k 1)(4c b ) (k 1)(4c b2 )

2
dx
2x + b
=
arctan
+ const.
+ bx + c
4c b2
4c b2

(Formeln pr
ufe man durch Differenzieren).
f
ur
d
dx

:=

4c b2

2x + b
arctan

2
1
1
2
=
=
2 = 2
2
2 x + bx + c
(2x + b)
+ 2x + b
1+ 2

und deutlich aufwandiger f


ur die erste Formel.
Den Beweis von Satz 8.19 benutzt Lemma 8.17 f
ur die reellen Nullstellen und analog
f
ur die komplexen Nullstellen.
Lemma 8.20 Sei = + i C eine k-fache Nullstelle mit = 0 von Q, einem
reellen Polynom, d.h.
Q(x) = (x2 + bx + c)k Q(x)
mit Q() = 0, b = 2, c = 2 + 2 , also b2 4c < 0, dann gibt es eindeutige
B, C R und ein Polynom P , so dass
P
P
Bx + C
,
= 2
+
k
Q
(x + bx + c)
(x2 + bx + c)k1 Q

141

namlich B = Im

P ()
Q()

1
, C = Re

P ()
Q()

B .

Man sieht: die Hauptarbeit steckt in der Berechnung der Aik , Bik , Cik .
Dazu:
1. Methode: Man setzt die PBZ mit unbestimmten Koeffizienten an. Bringt alles
auf den Hauptnenner und macht Koeffizientenvergleich.
2. Methode: Bestimme zuerst Aiki (Koeffizienten bei h
ochster Nennerpotenz), die
berechneten Terme bringe man nach links.
Am Beispiel wird alles klar.
R(x) =

Ansatz:

2x4 + 2x3 2x2 + 2x 3


P
2x5 2x4 + 2x3 4x2 + 2x 3
=
2
+
=
2
+
.
x5 x4
Q
(x 1)x2 (x2 + x + 1)
P
A
B
C
Dx + E
= 2+ +
+ 2
.
Q
x
x
(x 1) x + x + 1

1. Methode:
A(x 1)(x2 + x + 1) + Bx(x 1)(x2 + x + 1) + Cx2 (x2 + x + 1) + (Dx + E)x2 (x 1)
P
=
Q
Q
=

x4 (B + C + D) + x3 (A + C D + E) + x2 (. . .)
Q

u.s.w. dann Koeffizientenvergleich:


B + C + D = 2
A+C D+E =2
2. Methode:
P
3
A = x2 |x=0 =
=3,
Q
1

C=

u.s.w.

P
(x 1)|x=1 = 1
Q

B
Dx + E
P
3
1
+ 2
= 2 +
=
x
x +x+1
Q x
(x 1)

142

2
x4 x2 + 2x
P
() (x + x + 2)
.
=
=

x2 (x 1)(x2 + x + 1)
x(x2 + x + 1)
Q

() hier hat man eine Probe: es muss durch x und (x 1) gek


urzt werden konnen.
B=

P
Dx + E
2
x2 + x
x+1
P
x|x=0 = 2 2
= + =
= 2
2

x
x +x+1
x(x + x + 1)
x +x+1
Q
Q

3
2
1
x+1
P
= 2
+ 2
Q
x
x (x 1) x + x + 1
3
1
1 2
2x + 1
R(x) = 2 ln |x| ln |x 1| + ln(x2 + x + 1) + arctan
+c .
x
2
2 3
3

Rationalisierung:
Nach obigem u
berzeugenden Erfolg bei der Iteration von rationalen Funktionen R(x),

versuchen wir die Uberf


uhrung:

andere Integrale

1)

geeignete

Substitution

rationale Integrale

R(ex )dx
Substitution ex = u dx =

1
du .
u

BSP. 8.22
5e2x 11ex
dx =
e2x 5ex + 6
=

5u2 11u
du
(u2 5u + 6)u
5u 11
du =
(u 2)(u 3)

4
1
du
+
(u 2) (u 3)

= ln |u 2| + 4 ln |u 3| = ln |ex 2| + ln(ex 3)4 + c


= ln(ex 3)4 |ex 2| + c .
2)

R(sinh x, cosh x)dx.


Die Funktionen sinh und cosh durch ex ausdr
ucken und dann wie 1).

143

3)

R(sin x, cos x)dx


Substitution: tan
BSP. 8.23
dx
5 + 4 cos x

x
=u
2

sin x =

cos x =

1 u2
1 + u2

dx =

2du
u2 + 9

2 du

2
x
1
arctan
tan
3
3
2

2u
1 + u2

(1 +

u2 )

1u
5+4
1 + u2

2du
.
1 + u2

2
u
arctan
3
3

4) Spezialfall von 3):


R(sin x) cos x dx

sin x = u

cos x dx = du

R(cos x) sin x dx

cos x = u

sin x dx = du .

5) Ein wichtiger Typ:

R(x, x2 + a2 )dx

R(x, x2 a2 )dx

R(x, a2 x2 )dx

x = a sinh t

= a cosh t

dx = a cosh dt

x = a cosh t

= a| sinh t|

dx = a sinh tdt

x = a sin t

= a| cos t|

dx = a cos tdt .

BSP. 8.24
0

I=
2

dx

3 x2 2x(5 + 2 3 x2 2x)

3 x2 2x = (x + 1)2 + 4 ,
1

I=

(x + 1) = ,

dx = d

d
4 2 (5 + 2 4 2 )

= 2 sin t,

= 2 cos t,

d = 2 cos t dt


1 1
, also t ,
und so cos t > 0
sin t ,
2 2
6 6

144

/6

2 cos t
dt =
2 cos t(5 + 4 cos t)

I=
/6

/6
/6

dt
.
(5 + 4 cos t)

Also nach vorigem Beispiel:


2
I = arctan
3

8.6

t
1
tan
3
2

/6

=
/6

4
arctan
3

1
tan
3
12

4
1
.
arctan
3
6+3 3

Punktweise und gleichm


aige Konvergenz von Funktionen

Zur Vorbereitung eines allgemeinen Integralbegriffes (8.7) und der Darstellung von
Funktionen durch (Potenz-)Reihen (Kapitel 9.2) sollen verschiedene Approximationsmae f
ur Funktionen betrachtet werden.
Sei f : D R eine Funktion f
ur = D R. Betrachtet man f (x) f
ur ein x R
isoliert, so kann man eine vereinfachte, approximative Darstellung von f (x) durch

eine reelle Folge (fnx )n bekommen mit


fnx f (x) f
ur n .
Geht dies f
ur alle x D, so erhalt man eine Folge von Funktionen (fn )n , fn (x) := fnx
f
ur x D, n N, so dass
fn (x) f (x) f
ur n und alle x D

(8.6)

bzw. ausf
uhrlich:
F
ur alle > 0, f
ur alle x D existiert N (x) N, so dass gilt:
n

N (x) |fn (x) f (x)|

(8.7)

Definition 8.21 Seien = D R, f, fn : D R Funktionen; (fn )n konvergiert


punktweise gegen f auf D, wenn (8.6) bzw. (8.7) gilt. f heit dann punktweiser
Grenzwert von fn .
BSP. 8.25
fn : [0, 1] R, fn (x) := xn
f : [0, 1] R, f (x) :=

0
1

f
ur 0 x < 1 ,
f
ur x = 1 .

Dann fn f f
ur n auf [0, 1] punktweise. Inbesondere kann also bei punktweiser
Konvergenz die Stetigkeit verloren gehen. Das liegt beim obigen Beispiel daran, dass

145

f
ur x < 1, aber nahe bei 1 das N (x)Verhaltnis immer schlechter wird. Ist das
nicht der Fall, kann man also zu > 0 N N unabhangig von x D, d.h. gleichmaig
wahlen. Gilt also:
F
ur alle x D, f
ur alle > 0 existiert N N, so dass gilt
n

N |fn (x) f (x)|

(8.8)

so
Definition 8.22 Seien = D R, f, fn : D R Funktionen; (fn )n konvergiert
gleichm
aig gegen f auf D, wenn (8.8) gilt. f heit dann gleichm
aiger Grenzwert von fn .
Anschaulich bedeutet gleichmaige Konvergenz, dass fn ab N() in einem -Schlauch

um f liegt.

g
F(x)
g

fn(x)
x

Es gilt also
gleichmaige Konvergenz punktweise Konvergenz,
aber nicht umgekehrt.
Bei gleichmaiger Konvergenz ist fn f zumindestens f
ur n
N und ein N N
beschrankt (z.B. N = N f
ur = 1), also lasst sich (8.8) auch schreiben als:
F
ur alle > 0 existiert N N, so dass gilt:
n

N fn f

146

(8.9)

Dabei ist f
ur den RVektorraum
B(D) := {f : D R f beschrankt }

(8.10)

durch
f

:= sup{|f (t)| t D}

eine Norm auf B(D) definiert die Supremums-Norm oder Unendlich-Norm.


Also:
Sind fn , f B(D), so gilt:
fn f f
ur n gleichmaig auf D fn f

0 f
ur n .

(8.11)

Gleichmaige Konvergenz und Konvergenz bez


uglich . in dem Funktionenraum
B(D) sind also das Gleiche.

Die Tatsache D R ist nirgens benutzt worden, so dass D f


ur die obigen Uberlegungen
durch eine beliebige Menge ersetzt werden kann.
BSP. 8.26
| x2 fn (x)|

fn (x) = x2 +
=

1
n

sin(nx) x2

| n1 sin(nx)|

<

1
n

<

f
ur

>

N()

x
g

fn(x)

g
Bei gleichmaiger Konvergenz bleibt die Stetigkeit erhalten.
Satz 8.23 Sei = D R.
Der gleichmaige Grenzwert stetiger Funktionen auf D ist stetig.
Beweis: Seien x0 , x D.
|f (x0 ) f (x)|

|f (x0 ) fn (x0 )| + |fn (x0 ) fn (x)| + |fn (x) f (x)| =: A1 + A2 + A3

147

Sei > 0, dann existiert N() N mit


n N() F
ur alle y D : |f (y) fn (y)| <

also auch A1 < 3 , A3 <

fN () ist in x0 stetig, also existiert > 0, so dass


x D, |x0 x| < |fN () (x0 ) fN () (x)| <
und so auch A2 <

Also: x D, |x0 x| < |f (x0 ) f (x)| < .

Bei gleichmaiger Konvergenz gilt also die Vertauschbarkeit


lim lim fn (x) = lim lim fn (x) ,

xx0 n

(8.12)

n xx0

nicht aber bei punktweiser Konvergenz:


Beim Beispiel fn (x) = xn und x0 = 1 ergibt sich in (8.12) links: 0, aber rechts 1.
Da Differenzierbarkeit die stetige Fortsetzbarkeit des Differenzenquotienten bedeutet,
folgt:
Satz 8.24 Seien fn : [a, b] R differenzierbar und gleichmaig konvergent gegen
eine Funktion f . Ist auch fn gleichmaig konvergent gegen eine Funktion g, so ist f
differenzierbar und
f = g auf [a, b] .
Beweis: Sei x0 [a, b] .
Noch Voraussetzung ist
Fn (x) :=

fn (x)fn (x0 )
xx0
fn (x0 )

f
ur x = x0
stetig auf [a, b] .
f
ur x = x0

Nach dem Mittelwertsatz (Folg. 7.10 auf Seite 61) gibt es zu x [a, b] ein (x) x, x0 ,
so dass
Fn (x) = fn ((x)) .
Zu > 0 gibt es also N() N, so dass

|Fn (x) Fm (x)| = |fn ((x)) fm


((x))| < f
ur n, m

N() ,

(8.13)

wegen der gleichmaigen Konvergenz der fn . Die Cauchy-Folgen (Fn (x))n haben also
einen Grenzwert F (x) R f
ur alle x [a, b] und f
ur die Funktion F : [a, b] R gilt:

148

Fn F
(m in (8.13))

gleichmaig auf [a, b] f


ur n .

Insbesondere ist
F (x0 ) = lim Fn (x0 ) = lim fn (x0 ) .
n

Nach Satz 8.23 ist also F stetig.


Also:
F (x0 ) =
=

lim F (x)

xx0
x[a,b]

lim

xx0

lim

fn (x)fn (x0 )
xx0

(o.B.d.A. x = x0 )
=
=

lim 1
xx0 xx0
lim 1
xx0 xx0

lim fn (x) lim fn (x0 )

(f (x) f (x0 )) ,

wof
ur die punktweise Konvergenz von fn (y) f
ur y [a, b] reicht.
Also: f ist differenzierbar in x0 und
f (x0 ) = F (x0 )
=

lim fn (x0 ) = g(x0 ) .

Bemerkung: F
ur fn hatte nur die punktweise Konvergenz an einer Stelle y [a, b]
vorausgesetzt werden m
ussen, die gleichmaige Konvergenz folgt dann automatisch aus
den anderen Voraussetzungen. Unter den Voraussetzungen von Satz 8.24 gilt also die
Vertauschbarkeit von gleichmaigem Limes und Ableitung
lim fn (x)

8.7

= lim fn (x) .
n

(8.14)

Allgemeine Integralbegriffe:
Regel-Integral und Riemann-Integral

In Kapitel 8.1 wurden unbestimmte Integrale zu Funktionen f als Losungen der Differentialgleichung
F = f
(8.15)

149

definiert und daraus das bestimmte Integral


b

f (t)dt = F (b) F (a)


a

erhalten. Welche Funktionen f (


uber die behandelten Beispiele hinaus) unbestimmte
und damit auch bestimmte Integrale zulassen, blieb unklar. Wenn andererseits f
ur
b
a, b D das bestimmte Integral a f (t)dt existiert, ist mit
x

F (x) := +

f (t)dt
a

f
ur x D

(8.16)

eine Losung von (8.15) gegeben (diejenige mit F (a) = ), so dass es reicht eine Abbildung
I : R[a, b] R
auf einem moglichst groen Raum von Funktionen f : [a, b] R zu definieren, so
dass I(f ) mit dem Integralbegriff f
ur die elementaren Funktionen u
bereinstimmt. I(f )
soll den Flacheninhalt u
ber dem Graphen von f gewichtet messen, d.h. mit negativem
Gewicht f
ur f (x) < 0. Alternativ kann man auch sagen, dass der Weg von a nach b
mit dem Gewicht f (x) belegt wird. Es muss also auf jeden Fall gelten:
Forderung 1:

F
a

c dx = c (b a) f
ur a, b, c R .

(8.17)

Weiter sollte auch gelten aufgrund der Flacheninterpretation:


Sei f R[a, b], a < c < b.
Forderung 2:
Dann ist auch
f|[a,c] R[a, c] ,
f|[c,b] R[c, b]

und

f dx =
a

f dx +
a

f dx .
c

150

(8.18)

Damit liegt das Integral f


ur eine Treppenfunktion schon fest.
Definition 8.25
1) Seien a, b R, a < b, n N .
: a = x0 < x1 < . . . < xn = b heit eine Zerlegung von [a, b] mit der Feinheit
:=

max xi+1 xi

i=0,...,n1

2) f : [a, b] R heit Treppenfunktion auf [a, b], wenn es eine Zerlegung von
[a, b] gibt und dazu f0 , . . . , fn1 R, so dass
f (x) = fi fur xi < x < xi+1 und i = 0, . . . , n 1 .
Eine Treppenfunktion ist also st
uckweise konstant analog zu den st
uckweise linearen
Elementen von S1 (). Der zu S1 () analoge Funktionenraum ist f
ur eine Zerlegung
T () := {f : [a, b] R f ist Treppenfunktion auf } .
Analog zu S1 () ist T () ndimensional, wenn
: a = x0 < x1 < . . . < xn = b ,
mit den Basisfunktionen
i (x) =

1 xi < x < xi+1


0 sonst .

Wenn nun beliebige Zerlegungen (beliebiger Langen) zugelassen werden, entsteht ein
unendlichdimensionaler Raum

T [a, b] := {f f T () f
ur eine Zerlegung } ,
der Raum der Treppenfunktionen.
Aus Forderung 1 und 2 folgt notwendigerweise
Satz 8.26 Sei f T [a, b] und : a = x0 < x1 < . . . < xn = b eine Zerlegung zu f ,
dann gilt notwendig:
n1

I(f ) =
i=0

fi (xi+1 xi ) .

151

(8.19)

f0

a=x0

x1

fn-1

f2

f1

F
x2

xn-1

xn=b

Die Form (8.19) ist widerspruchsfrei, denn es gilt


Satz 8.27 Sei f T [a, b] und j : a = xj0 < xj1 < . . . xjnj = b fur j = 1, 2 jeweils eine
Zerlegung zu f , so dass
f (x) = fij fur xji < x < xji+1 und i = 0, . . . , nj 1 ,
dann gilt
n1 1

fi1 (x1i+1

i=0

x1i )

n2 1
i=0

fi2 (x2i+1 x2i ) .

Da man zwei Zerlegungen zu einer dritten, feineren mischen kann, und auch die

Funktionswerte auf den gemeinsamen Teilintervallen notwendigerweise gleich sind, reduziert sich die obige Aussage darauf, dass in eine Zerlegung zusatzliche, unnotige

Zwischenpunkte eingezogen werden d


urfen.
Mit (8.19) ist also schon das Integral eindeutig f
ur T [a, b] definiert und wird dort
zur Unterscheidung I(f ) genannt. Es geht also darum, I auf eine moglichst groe
Obermenge von T [a, b] unter Erhaltung seiner Eigenschaften fortzusetzen.
Diese sind:
Satz 8.28 Das Funktional I auf T [a, b] ist
1) linear:
T (f + g) = T (f ) + T (g) ,
T (f ) = T (f )

fur f, g T [a, b], R .

2) positiv, d.h.
f (x)

0 fur alle x [a, b] T (f )

bzw. kurz:
f

0 T (f )

152

0.

3) Die Forderung 2 ist erfullt.


Beweis:
1) Die zweite Aussage folgt sofort:
n1

i=0

n1

fi (xi+1 xi ) =

i=0

fi (xi+1 xi ) .

Die zweite braucht wieder eine gemeinsame Zerlegung und folgt dann analog.
2) klar wegen fi
n1

i=0

0 f
ur i = 0, . . . , n 1

fi (xi+1 xi )

3) Es ist also zu zeigen f


ur f T [a, b] :
f|[a,c] T [a, c] und f|[c,b] T [c, b] ,
was sich durch Aufnahme von x = c in die Zerlegung bewerkstelligen lasst:
: a = x0 < x1 < . . . < xn = b wird zu
1 : a = x0 < x1 < . . . x = c und
2 : c = x < . . . < xn = b, Zerlegungen von [a, c] und [c, b] und so auch
b

f dx .

f dx +

f dx =

Aus Linearitat und Positivitat folgen allgemein weitere Eigenschaften:


Satz 8.29 Sei R ein Teilraum von B[a, b] und I : R R linear und positiv, dann gilt
auch:
1) I ist monoton, d.h. f

g T (f )

T (g)

fur f, g R.

2) Ist mit f R auch |f | R, dann


|I(f )|
dabei ist |f |(x) := |f (x)| .

153

I(|f |)

3) Gehoren auch die konstanten Funktionen zu R, dann


|I(f )|

I( f

Beweis:
Zu 1):
f

g f (x) g(x) f
ur alle x [a, b]
(g f )(x) 0 f
ur alle x [a, b]
gf 0

Also: I(g) I(f ) = I(g f )

Zu 2):
f

1)

|f | I(f )

I(|f |) |I(f )|

I(|f |) .

Zu 3)
f

2)
|I(f )|

I( f

Satz 8.29 ist speziell anwendbar auf das IntegralFunktional I auf T [a, b] und liefert
dort
|I(f )| I( f ) = (b a) f .
(8.20)
Da I linear ist, bedeutet also (8.20), dass I auf T [a, b] (sogar Lipschitz)stetig ist ,
|I(f ) I(g)| = |I(f g)|
wenn T [a, b] mit .

(b a) f g

als Norm versehen wird.

Allgemein gilt, dass I linear und stetig auf


R[a, b] := {f : [a, b] R | Es existiert eine Folge (fn )n in T [a, b], so dass
f fn

0 f
ur n }

(8.21)

fortgesetzt werden kann.


In den topologischen Begriffen von Abschnitt 6.6 ist R[a, b] der Abschluss bzgl. .
von T [a, b] in B[a, b].
Es gilt namlich allgemein:
Satz 8.30 Sei (X, . ) ein normierter Raum, T X ein Teilraum und
R := {x Es existiert eine Folge (xn )n in T mit xn x 0 fur n }.

154

Sei I : T R linear und erfulle


|I(x)|

fur alle x T .

C x

(8.22)

Dann gibt es eine eindeutige Fortsetzung I : R X, die auch linear ist und (8.22)
erfullt.
Beweis:
Sei x R, d.h. (xn )n eine Folge in T mit
xn x f
ur x .
Wegen
|I(xn ) I(xm )| = |I(xn xm )|

C xn xm

ist (I(xn ))n eine Cauchy-Folge in R, also existiert lim I(xn ).


n

Setze:
I(x) := lim I(xn ) .
n

(8.23)

I ist so wohldefiniert, denn ist (yn )n eine andere Folge in T mit yn x f


ur n ,

so lasst sich daraus ein zn x kombinieren mit (xn )n , (yn )n als Teilfolgen also:
lim I(xn ) = lim I(zn ) = lim I(yn ) .

I ist weiterhin linear, etwa


xn , yn R, xn x, yn y xn + yn x + y
I(xn + yn ) I(x + y)
f
ur n .
I(xn ) + I(yn ) I(x) + I(y)
Also: I(x + y) = I(x) + I(y)
und auch (8.22) bleibt erhalten:
|I(xn )|

I(x)

C xn

f
ur n
C x ,

da in jeder Norm (die umgekehrte Dreiecksungleichung) gilt:


x y

xy ,

d.h. x x von X nach R ist stetig.

155

Die Eindeutigkeit folgt aus (8.23) und der Stetigkeit.

Satz 8.30 auf das Integralfunktional auf T [a, b] liefert eine Integraldefinition auf R[a, b],
das RegelIntegral, mit folgenden Eigenschaften:
Satz 8.31 Das Funktional I : R[a, b] R, das RegelIntegral, das durch eindeutige
lineare und stetige Fortsetzung von I auf T [a, b] entsteht, hat folgende Eigenschaften:
1) I ist linear.
2) |I(f )|
3) f

(b a) f

0 I(f )

fur alle f R[a, b] .

0 fur f T [a, b] .

4) f ist monoton.
5) |I(f )|

I(|f |) fur f T [a, b] .

Beweis:
1) und 2) folgt aus Satz 8.30. Zu 3) sei f R[a, b] mit f
fn f 0 f
ur n .
Sei > 0 beliebig, fest, dann ist fn + 0 f
ur n
um f liegt. Also aus Satz 8.28 f
ur n N():

0 und fn T [a, b] mit

N(), da fn dann im Schlauch

I(fn ) + (b a) = I(fn ) + I()


= I(fn + )

0.

Damit gilt auch


I(f ) = lim I(fn )
n

(b a)

und da > 0 beliebig, auch I(f )


0. Daraus folgt 4) (Monotonie) wegen Satz 8.29
und entsprechend auch 5), da mit f R[a, b] auch
|f | R[a, b]

(8.24)

gilt.
Ist namlich (fn )n eine Folge in T [a, b] mit fn f
fn (x)| |f (x)
also

|fn | |f |

fn f

|fn (x) f (x)|

0.

0 f
ur n , dann auch
fn f

156

Ab jetzt schreiben wir wieder


a

f dx statt I(f ) f
ur f R[a, b].

Inbesondere bedeutet also 2) die Stetigkeit von I auf R[a, b], gilt also:
f, fn R[a, b] (nicht notwendig fn T [a, b]) und fn f f
ur n gleichmaig, dann
auch
b

f dx f
ur n ,

fn dx
a

d.h. lim und

sind vertauschbar:
b

fn dx

lim fn dx = lim

(8.25)

und schlielich
Satz 8.32 Das RegelIntegral erfullt Forderung 2, d.h. fur f R[a, b] gilt:
Fur a < c < b:
f|[a,c] R[a, c], f|[c,b] R[c, b]
und

f dx =
a

f dx +
a

f dx .
c

Beweis:
Aus Satz 8.28 3) durch Approximation mit Treppenfunktionen.

Es bleibt die Frage, ob gen


ugend viele Funktionen integrierbar sind.
Satz 8.33 Die stetigen Funktionen auf [a, b] sind (Regel)integrierbar:
C[a, b] R[a, b] .
Beweis:
Sei n N. Dann ist zu f C[a, b] ein fn T [a, b] anzugeben, so dass
f fn

1
.
n

Da f nach Satz 6.47 auf [a, b] gleichmaig stetig ist, gibt es ein > 0, so dass f
ur alle
x, y [a, b]
1
.
|x y| |f (x) f (y)|
n

157


Man wahle eine Zerlegung so, dass

und setze
x < xi+1 , i = 0, . . . , n 1

fn (x) : = f (xi ) f
ur xi
fn (b) : = f (b) ,

(8.26)

(zum Beispiel), dann gilt f


ur x [a, b) :
Es gibt j {0, . . . , n} mit xj

x < xj+1 und so

|f (x) fn (x)| = |f (x) f (xj )|


wegen |x xj |

1
n

(Vergleiche den Beweis von (???).

Bemerkung
1) Mit Satz 8.33 gilt auch:
Ist f st
uckweise stetig auf [a, b], dann ist f auch (Regel)integrierbar. Dabei
bedeutet stu
ckweise stetig, dass es eine Zerlegung gibt, so dass f auf den
Teilintervallen (xi , xi+1 ) stetig ist und auf [xi , xi+1 ] stetig fortsetzbar ist.
2) Ist f nur auf (a, b) stetig, aber noch beschrankt, dann gilt:
b

lim

0
a+

f dx existiert

(8.27)

und so kann gesetzt werden


b

f dx := lim

0
a+

f dx .

F
ur unbeschrankte Integranden f wird dies in Kapitel 8.9 verallgemeinert.
Der Grenzwert in (8.27) existiert, da |f | M f
ur ein M 0 und so
f +M

0 auf [a, b] .

I :=

f +Mdx ist dann wohldefiniert und nach Satz 8.32, 8.31 3) monoton wachsend
a+

und beschrankt durch (b a)2M, also konvergent und so auch


b

f dx = I (b a 2)M .
a+

158

BSP. 8.27
sign (sin x) ist integrabel auf allen [a, b].
1
sin ist integrabel auf [1, 1].
x
1
sin x1 ist in obigem Sinne nicht integrabel (weil unbeschrankt).
x
b

Die Klasse der Regelintegrierbaren Funktionen ist also sehr gro. Beachte aber:

f dx
a

existiert nicht in obigem Sinne, wenn f unbeschrankt ist. (siehe 8.9 Uneigentliche
Integrale.)
Satz 8.34 (Mittelwertsatz der Integralrechnung): Sei a < b. Ist f stetig auf
[a, b], dann gibt es ein (a, b) mit
b

f (x)dx = f ()(b a) .
a

Beweis:
Da f stetig, gibt es nach Satz 6.29
x1 mit f (x1 ) = M = Max f und
x2 mit f (x2 ) = m = Min f .
b

Also: m(b a) =

m dx

f dx

M dx = M(b a) m

Nach dem Zwischenwertsatz gibt es ein x1 , x2 mit f () =

Definition 8.35 f =

1
ba

1
ba

1
ba

b
a

f dx M .

f dx.
a

f dx heit Mittelwert von f auf [a, b].


a

Warum gelten f
ur das Regelintegral und die Stammfunktion gleiche Rechenregeln,
b

warum verwenden wir das gleiche Symbol

?
a

159

Satz 8.36 (Hauptsatz der Infinitesimalrechnung):


Sei f C 0 [a, b]. Sei F (x) =

x
a

f (x)dt fur x [a, b].

Dann gilt F (x) = f (x) fur x [a, b], d.h. F ist Stammfunktion von f .
Beweis:
x+h
1
f
h0 h x

F (x) = lim h1 (F (x + h) F (x)) = lim


h0

dx = lim h1 f ()h
h0

= lim f () f
ur ein = (x) x, x + h
h0

= f (x), da f
ur h 0 auch (x) x gilt.

Folgerung:
1) Man kann Flachenberechnungen durch Aufsuchen von Stammfunktionen
durchf
uhren.
b

2) Umgekehrt hat jede stetige Funktion eine Stammfunktion. Man kann

f dx
a

durch Flachenmessung bestimmen. (Darauf beruhen die Naherungsformeln zur


Integralberechnung, siehe 8.10)
Wegen 2) kann man mit Hilfe der Integrale differenzierbare Funktionen
definieren:

Rationale Funktionen

elementare Funktionen

Als Beispiel soll eine Moglichkeit gezeigt werden, die Exponentialfunktion einzuf
uhren
durch Einf
uhrung von ln:
Definition 8.37

ln x :=
1

ln(1) = 0 und (ln x) =

1
x

1
dt fur x (0, )
t

160

xy

ln(x y) =

1
dt =
t
1

xy

1
dt = ln x +
t

1
dt +
t
x

1
du = ln x + ln y ,
u

x, y > 0. (8.28)

u=1

Da (ln x) > 0 gibt es die Umkehrfunktion von ln x.


Es ist

lim ln(x) = lim

x
1

1
dt =
t

(wird in Abschnitt 8.9 gezeigt) und


1

lim ln(x) = lim

x0

1
dt =
t

(ebenso), so dass die Umkehrfunktion von ln auf R definiert ist (mit (0, ) als Wertebereich). Sie wird mit exp(x) bzw. ex bezeichnet. Sie ist stetig differenzierbar und
(ex ) =

1
= ex f
ur x R
x
ln (e )

nach Satz 7.6.


Wegen (8.28) gilt
ex+y = ex ey f
ur x, y R .
Ebenso:
x

Definition 8.38 arctan x :=


0

1
dt
1+t2

elementare Funktionen

u.s.w.

nicht elementare Funktionen

BSP. 8.28
Definition 8.39 Fehlerfunktion (Errorfunction):
x

2
erf f (x) =

et dt .
0

161

erf (0) = 0, erf (x) = 2 ex .


Der Faktor 2 erreicht, dass lim erf(x) = 1 (siehe spater)
x

Elliptische Integrale

1. Gattung

F (k, ) =
0

2. Gattung

E(k, ) =
0

3. Gattung

(h, k, ) =

dt
1k 2 sin2 t

1 k 2 sin2 tdt,
dt

2
0 (1+h sin t)

0<k<1.

1k 2 sin2 t

Diese Funktionen sind wie die Elementarfunktionen vertafelt und in Computern implementiert.

8.8

Anwendungen

1. Fl
acheninhalt:

Flacheninalt F = (f g)dx
a

F =
0

2. Fl
achenmoment und Schwerpunkt:

162

x2 x3
(x x )dx =

2
3

=
0

1
6

x (f g)dx

Moment Mx =
a

Flache
b

Moment My =
a

1
(f + g)(f g)dx
2
b

1
=
2

(f 2 g 2 )dx
a

obiges Beispiel:
1

x3 x4

x(x x )dx =
3
4

Mx =
0

My =

1
2

(x2 x4 )dx =

1
2

=
0

x
x

3
5

1
12
.

=
0

1
15

F
ur den Schwerpunkt S = (xS , yS ) muss gelten F xS = Mx , F yS = My

xS =

obiges Beispiel: xS =

Mx
;
F

yS =

My
F

2
1
, yS =
2
5

3. Volumenberechnung:
Schnittflache x-Achse
Flacheninhalt q(x)

q(x)

Volumen V =

q(x)dx
a

(Cavalieri-Prinzip)
a

Spezialf
alle: Rotationsk
orper
Rotation um x-Achse

163

(f-g)dx
f
f

q(x) = (f 2 g 2 )

g
a

(f 2 g 2 )dx

Vx =
a

Rotation um y-Achse

x(f g)dx

Vy = 2
a

obiges Beispiel:
1

(x2 x4 )dx =

Vx =
0

2
15

Vy = 2
0

x(x x2 )dx =

Aus den Formeln ersieht man:


Vx = 2My = 2F yS
Vy = 2Mx = 2F xS
Guldin-Regel: Volumen des Rotationskorpers = Flache mal Schwerpunktsweg.
4. Volumenmoment und Schwerpunkt:
b

Mx =
q(x)

Mx
V
Bei Rotationskorpern liegt der
Schwerpunkt auf der Drehachse.

xS =

xq(x)dx

164

x(x2 x4 )dx =

obiges Beispiel: Mx =
0

=
xS =
12
12Vx
8
yS = zS = 0

5. Tr
agheitsmoment:

m=Masse

Tragheitsmoment = max2

Bei Rotationsk
orpern:

Bei Rotation von y-Achse

(f-g)dx

x3 (f g)dx

= 2

hier ist = (x) die Dichte


g

Bei Rotation um x-Achse

=
2

(f 4 g 4 )dx
a

obiges Beispiel: Vy =

Masse m = f
ur = const.
6
6
1

x3 (x x2 )dx = 2

= 2

1 1

5 6

2
2
= m.
30
5

6. Taylorformel: Integrales Restglied:


n

f (x) =
k=0

1 (k)
f (a)(x a)k + Rn
k!

mit

1
Rn =

n!

(x t)n f (n+1) (t)dt


a

Beweis: Durch n-fache partielle Integration im Restglied.


Bemerkung: Diese Restgliedabschatzung scheint besser, weil keine unbestimmbare
Stelle auftaucht wie beim Lagrange-Restglied. Die exakte Integrierung bei Rn
w
urde aber das triviale Ergebnis Rn = f (x)
ergeben. Man kann diese Formel
also nur wieder zur Abschatzung benutzen!
Beispiel:

165

ex =
k=0

1 k
x + Rn
k!

|Rn |

mit

Rn =

(x t)n et dt

1
n!
0

1 x
e
n!

(x t)n dt =

1
ex xn+1
(n + 1)!

f
ur x > 0

nach Lagrange: |Rn | =

8.9

1
1
e xn+1
ex xn+1
(n + 1)
(n + 1)!

Uneigentliche Integrale

Aus der Definition des Riemann-Integrals ergibt sich, dass folgende bestimmte Integrale
im Riemann-Sinne nicht definiert sind:
(A)

Unbeschr
anktes Integrationsintervall:

f (x) dx

z. B. mochte man haben:

ex dx = ex

= 0 (1) = 1.

(B) Unbeschr
ankte Funktionen am Intervallende: a f (x) dx
f
ur die die Stammfunktion auf (a, b) stetig erganzbar ist in x = a und x = b mochte
man berechnen als:

dx = 2 1 x
1x

= 2.
0

Obige Integrale heien uneigentliche Integrale und werden eingef


uhrt durch folgende
Definition 8.40

(A): Sei f : [a, ) R, und

f dx moge existieren fur alle R a.


a

166

f heit uneigentlich integrabel auf [a, ), falls

f dx := lim

f dx

existiert in R.
b

(B): Sei f : [a, b) R und lim f = ,

f dx moge existieren fur alle > 0

xb

f heit uneigentlich integrabel auf [a, b], falls


b

f dx := lim
0
>0

f dx
a

existiert in R.
Existiert bei (A) oder (B) der Grenzwert und ist aus {+, }, so wird dies z.B. im
Fall (A) mit Grenzwert kurz bezeichnet mit

f dx = .

Bemerkung: Entsprechend ist


teren Integralgrenze a.

definiert und

bei Unbeschranktheit an der una

BSP. 8.29

1. F
ur = 1 :
1

dx
= ln x
x

1
dx
= lim
x+1

R 1
x

dx
konvergiert in R f
ur > 1.
x

167

1
1

f
ur

>1

f
ur

<1

dx
1
= lim
x1

1
x

2. F
ur = 1:
0
1

dx
= ln x
x

1
0

1
=
1

f
ur

<1

f
ur

>1

1
ist auf (0, 1] integrabel genau dann, wenn < 1. Analoges gilt
x
1
f
ur f (x) =
auf (b, c] f
ur b < c.
(x b)

1
f
ur
a<1
1 x
x
ln a
=
a
3.
a dx =

ln a 1

f
ur
a1
1
Also f (x) =

4.

sin x dx existiert nicht.


1

Kann man etwas u


ber die Konvergenz des uneigentlichen Integrals aussagen, ohne die
Stammfunktionen zu kennen?

BSP. 8.30

Ist

sign(cos x)
dx konvergent?
x2

Definition 8.41 (A):


R

integrabel ist und

f heit absolut integrabel auf [a, ), falls |f | auf [a, )

f dx existiert fur alle R > a. Entsprechend lautet die Definition


a

im Fall (B).
Satz 8.42 Ist f absolut integrabel, so ist f auch integrabel (in beiden Fallen (A) und
(B)) und

|f | dx bei (A)

f dx
a

|f | dx bei (B).

f dx

bzw.

168

Beweis: Sehr technisch, wird hier unterdr


uckt!

Zu Beispiel 8.30:

Da

sign(cos x)
dx =
x2

dx
= 1. Also existiert
x2

Wir werden spater ein Beispiel finden

absolut integrabel.

sign(cos x)
dx in R.
x2

sin x
dx , das integrabel ist, aber nicht
x

Satz 8.43 (Vergleichskriterium)


Sei 0 f (x) g(x) , f, g, integrabel auf [a, R] fur alle R > 0 .

(A):

Ist g auf [a, ) integrabel, dann ist auch f auf [a, ) integrabel und

f dx

gdx .

Entsprechendes gilt fur den Fall (B).


x

Beweis: F (x) =

f (t) dt wachst monoton und ist beschrankt durch


a

gdx.
a

Also existiert lim F (x) in R und


x

f dx = lim F (x)

gdx .

Mit diesem Kriterium kann man also die absolute Konvergenz nachweisen: Man sucht

zu f eine Majorante g mit |f (x)| g(x), so dass

gdx noch existiert.


a

BSP. 8.31

1)
Da

I=
1
cos x
x2

cos x
dx.
x2

1
x2

und

1
x2

auf [1, ) integrabel ist, ist auch

169

cos x
x2

dort (sogar absolut)

integrabel.

2)

I=

2
2cos
x
x

dx.

Da

2
2cos
x
x

>

1
x

und

1
x

divergent I divergiert.

Meist vergleicht man mit den Funktionen

A
.
x

Folgerung 8.44
A
ur ein > 1 und x > R
A) a) Ist |f (x)| f
x
A
b) Ist f (x) > f
ur ein A > 0 und x > R
x

|f |dx (auch

f dx nicht.

A
f
ur ein < 1, x in der Nahe von b
B) a) Ist |f (x)| <
(x b)
A
b) Ist f (x) >
f
ur alle x in der Nahe von b
xb

lim x |f | = 0 f
ur ein > 1

|f |dx

b)

lim x|f | = 0

|f |dx nicht
b

B) a)

lim(x b) |f | = 0 f
ur ein < 1

xb

b)

lim(x b)|f | = 0 ;

xb

|f |dx nicht.

BSP. 8.32

170

|f |dx .

f dx nicht.

Haufig schreibt man diese Bedingungen in der Grenzwertform:

A) a)

f dx).

|f |dx .

1) I =
1

sin x
dx existiert f
ur > 1
x
ex
dx, f
ur 2.
( sin x)

2) I =
0

x
=0
sin x( sin x)2

lim x|f | = 1 lim

x0+

x0

I divergiert f
ur 2
1
x

= 0 f
ur > da < 2 lasst sich

x0
x0 (sin x) ( sin x)2
2

finden I f
ur < 2.
ein mit 1 > >
2

Sei < 2 : lim x |f | = lim

Der folgende Satz zeigt Konvergenz, auch wenn keine absolute Konvergenz vorliegt:
x

Satz 8.45 Sei f stetig fur alle x a > 0, F (x) =

f dx. Fur x a sei F (x)


a

beschrankt, d.h. |F (x)| C. Dann konvergiert

f (x)
dx fur > 0.
x

Beweis:

F (x)
f
dx
=
x
x

+
a

F (x)
F (x)
dx
=
+
x+1
R

F
x+1

dx

das letzte Integral konvergiert, weil


C
F (x)

und
x+1
x+1

dx
x+1

C
F (R)

R
R

0 Behauptung.

BSP. 8.33

I=
x

sin x
sin x
dx. Dieses Integral ist nur bei uneigentlich
ist stetig bei x = 0. Da
x
x

sin x dx beschrankt ist.


a

sin x
dx ,
x

ebenso

sin x
dx.
x

171

Im Bronstein sind auf S. 117 ff. uneigentliche Integrale angegeben.


Mehrfach uneigentliche Integrale: Wir meinen solche Typen:
(1)

(2)

(3)

(4)

Diese sind definiert, wenn man die einzelnen Grenz


ubergange getrennt ausf
uhren
kann. Z.B.

172

(1) I1 =

a
R

(2) I2 =

f dx

f dx + lim

lim

+ lim

lim

R
c
b

0
a+
c

+ lim

(3) I3 = lim

c
c

0
a+
b

+ lim

(4) I4 = lim

0
c+

BSP. 8.34

1. I =

1
dx divergiert stets.
x

2. I =
0

cos x
dx konvergiert nach letztem Satz,
x

1
cos x
cos x
dx konvergiert, weil
< und
x
x
x

cos x dx beschrankt ist.

weil

cos x
dx. Wir spalten auf:
x

1
dx konvergiert. Damit konvergiert I.
x
0

Fehlerabsch
atzung: Wie gro ist der Abschneidefehler F =

f dx. Wenn wir abschatzen konnen |f | <

Offenbar ist F =

|F |

|f |dx
R

1
A
A
dx
=
x
1 x1

=
R

A
.
( 1)R1

BSP. 8.35

Bestimme R so, dass F =


0

sin x
dx
x2

sin x
dx < = 105 .
2
x

173

A
, >1
x

1
1
sin x
2 F
< .
2
x
x
R
1
ullt.
F
ur R > = 105 ist die obige Forderung also erf

8.10

Numerische Integration

Es gibt integrierbare Funktionen, f


ur die keine Stammfunktionen in geschlossener Form
existieren, so dass
b

f dt oder auch
a

f dt
a

naherungsweise numerisch bestimmt werden m


ussen. Also kann damit auch die Differentialgleichung
y (t) = f (t) und y(a) =
naherungsweise gelost werden. Die Methoden lassen sich auch erweitern auf allgemeine,
nichtlineare Anfangswertaufgaben (skalar oder vektoriell)
y (t) = f (y(t), (t)) und y(a) = ,

(8.29)

die die linearen Anfangswertaufgben von Kapitel 8.1 bis 8.3 verallgemeinern.
Ist f stetig auf [a, b], dann zeigt der Beweis von Satz 8.33:
Wahle Zerlegungen n : a = xn0 < xn1 < . . . < xnn = b, so dass
n :=

max (xni+1 xni ) 0 f


ur n .

i=0,...,n1

(8.30)

Wahlt man dann beliebig, feste in [xni , xni+1 ] und damit eine Treppenfunktion fn
durch
fn |(xn ,xn ) = f (in ) ,
i

i+1

so konvergiert diese gleichmaig gegen f und damit gilt nach Satz 8.29 2) auch f
ur den
Integralnaherungswert
n1

In := I(fn ) =
i=0

f (in )(xni+1 xni )

(8.31)

In

f dx

(b a) f fn

0 f
ur n .

(8.32)

Der Fehler ist also umso kleiner, je besser fn f (gleichmaig) approximiert. Dies kann
dadurch auch gesteuert werden, dass |xni+1 xni | dort klein gewahlt wird, wo f sich stark

174

verandert alternativ zur Standardwahl der Zerlegung als


aquidistante Zerlegung
mit
n + a, i = 0, . . . , n
xni = i
n : = (b a) .

n
In diesem Fall und allgemein lasst sich die Approximationsg
ute abschatzen, wenn f
Lipschitzstetig auf [a, b] mit Lipschitzkonstante L, also etwa stetig differenzierbar ist.
Dann ist auf [xni , xni+1 ] :
|f (i) f (x)|

L|i x|

L(xni+1 xni )

und damit nach (8.32)


b

In

n .
(b a)L

f dx

(8.33)

Es liegt also Konvergenz 1. Ordnung vor, indem sich der Fehler (mindestens) halbiert, wenn hn halbiert, also der Aufwand verdoppelt wird.
Mogliche Wahlen von in sind:
in = xni :
linksseitige Rechtecksregel
n
n
i = xi+1 : rechtsseitige Rechtecksregel
.
in = 21 xni + xn+1
i
Eine verbesserte Approximation auf [xni , xni+1 ] ist zu erwarten, wenn fn nicht konstant,
sondern linear gewahlt wird, etwa durch
fn P 1 [xni , xni+1 ] mit

fn (xni ) = f (xni )
fn (xni+1 ) = f (xni+1 ) ,

d.h. als Lagrange-Interpolierende. fn wird durch die Interpolationsbedingungen stetig


und stellt den interpolierenden linearen Spline dar.
F
ur den Fehler gilt nach (7.23) ff.:
f fn

1 2
(n ) f
8

sofern f C 2 [a, b] und damit nach (8.32)


b

In

f dx

1
(b a) f
8

175

(n )

(8.34)

Damit ist hier die Naherung:


xn
i+1

n1

fn dx

In = I(fn ) =
i=0 xn
i
n1

xn
i+1

f (xni )n + (1 n )f (xni+1 )dx

=
i=0 xn
i

mit

xni+1 x
= n
xi+1 xni
n

und so

n1

In =
i=0

1
f (xni ) + f (xni+1 ) ,
2

xni+1 xni

(8.35)

die zusammengesetzte Trapezregel.


F
ur aquidistante Zerlegungen vereinfacht sich dies zu
In

=
2

n1

f (xni ) + f (xni+1 )
i=0
n1

n f (xn ) + 2
=
0

f (xni ) + f (xnn )

(8.36)

i=1

Falls f glatt genug ist, kann ein weiterer Genauigkeitsgewinn dadurch erhofft werden,
ur ein k N approxidass f auf [xni , xni+1 ] nicht durch fn P 1 , sondern durch fn Pk f
miert wird. Soll fn wieder durch LagrangeInterpolation bestimmt werden, m
ussen also
n
n
n
in [xi , xi+1 ] k + 1 Interpolationsknoten xi,j , j = 0, . . . , k spezifiziert werden. Diese
sollen aquidistant (in eventuell allgemeinen Elementen [xni , xni+1 ]) gewahlt werden
xni,j := xni + j

xni+1 xni
, j = 0, . . . , k .
k

Nach Satz ??? kann die Approximationsg


ute abgeschatzt werden durch
(f fn )|[xni,xni+1 ]

f (k+1) n
w
(k + 1)!

falls f C k+1 [a, b], wobei auf [xni , xni+1 ] :


k
n

w (x) =
j=0

(x xni,j )

176

und so
|w n (x)|
und damit
f fn
und so

f (k+1) k+1
(n )
(k + 1)!

In,k

k+1 )
(
n

(xni+1 xni )k+1

ba
f (k+1)
(k + 1)!

f dx

(n )

k+1

(8.37)

mit der Naherungsformel


b

In,k :=

fn dx ,
a

wobei

fn| [xni , xni+1 ]

Pk die LagrangeInterpolierende an den Knoten xni,j darstellt.

Mit Mehraufwand kann die alternative Abschatzung


b

In,k

ba
k

f dx

C f (l)

(8.38)

f
ur C > 0 und ein l = l(k) N gezeigt werden.
In,k heit kte zusammengesetzte Newton-C
otes Formel (k = 1: Zusammen
gesetzte Trapezregel). Die Aquidistanz der Interpolationsknoten, die f
ur (8.37) keine
Rolle spielt, f
uhrt zu einer einfachen Darstellung von In,k :
n
Nach (???) lasst sich fn auf [xni , xn+1
] durch die LagrangeBasisPolynome li,j
,j =
i
0, . . . , k, darstellen, d.h.
n1

xn
i+1

n1

xn
i+1

k
n
f (xni,j )li,j
dx

fn dx =

In,k =

i=0 xn
i

i=0 xn
i
n1

j=0

k
(n,k)

i,j f (xni,j ) .

(8.39)

i=0 j=0

In,k hat also die einfache Form einer Linearkombination von Funktionswerten u
ber alle
Interpolationsknoten, wie im Spezialfall k = 1 in (8.35) und (8.36) mit den Gewichten
xn
i+1
(n,k)

i,j

n
li,j
dx .

=
xn
i

177

Im Fall aqidistanter Interpolationsknoten sind die Gewichte tatsachlich unabhangig


von a und b und xni (und nat
urlich f ):
Betrachte die Variablentransformation auf [xni , xni+1 ]:
x = xni + t(xni+1 xni ) ,
d.h. t [0, 1] und
k
n
li,j
(x)

x xni,l
=
xni,j xni,l

=
l=0
l=j

l=0
l=j

kt l
jl

und so
1
(n,k)
i,j

(xni+1

=
0

xni )
l=0
l=j

mit

k
(k)
j

(xni+1

In,k =
l=0

:=
0

und so

xn xni (k)
kt l
dt = i+1
j
jl
k

l=0
l=j

1
xni )
k

tl
dt
jl
k
(k)

j f (xni,j ) .

(8.40)

j=0

Dabei bezieht sich die erste Summe auf die Zerlegung, die zweite auf die Interpolationsknoten im Element [xni , xni+1 ] .
Es kann nun auf zwei verschiedene Arten versucht werden, die Genauigkeit der Naherungsformel zu steigern:
1. Option: k fest, n gro ( hMethode)

2. Option: n fest, d.h. feste Zerlegung, k gro ( kMethode) .

Dies ergibt insbesondere f


ur = {a, b} die (klassischen) NewtonC
otesFormeln
k = 2: SimpsonRegel ,
k = 3: 38 Regel .
n garantiert, ist auch
Wahrend (8.37) f
ur die 1. Option Konvergenzordnung k + 1 in
aus (8.38) die Konvergenz f
ur k unklar. Tatsachlich ergeben sich f
ur k 8 auch
negative Gewichte, so dass Ausloschung entsteht und die NewtonCotesFormeln nicht
mehr brauchbar sind. Die Grundgenauigkeit sollte also durch eine hinreichend feine

Zerlegung sichergestellt werden, ist aber auf einem Element [xni , xni+1 ] f glatt, kann es
sich lohnen, dort hoheres k zu wahlen. Solche Kombinationen heien hkMethoden.

178

Wir kommen zur


uck zur zusammengesetzten Trapezregel
n1

h
Th (f ) :=
2
wobei h :=

ba
n

f (a) + 2

f (xi ) + f (b)

i=1

und xi = a + ih.

Analog zum Satz ??? gilt auch hier nicht nur die Fehlerabschatzung (namlich (8.34)),
sondern auch (viel schwieriger zu beweisen) eine Fehlerentwicklung
Satz 8.46 (EulerMacLaurinsche Summenformel)
Seien f C 2m [a, b], n N gegeben und h := ba
. Dann gilt
n
b

f (x) dx = Th (f )
a

k=1

h2k
B2k f (2k1) (b) f (2k1) (a) + O(h2m )
(2k)!

fur

h 0+ .

Dabei sind B2k Bernoullische Zahlen.


Analog zu Abschnitt 7.10 kann also eine RichardsonExtrapolation mit dem Neville
Algorithmus durchgef
uhrt werden. Die Werte Tik werden mit dem Schema (7.49) bzw.
(7.50) berechnet, wobei Dh (f ) f
ur Th (f ) auszutauschen ist.
Wenn f gen
ugend glatt ist und speziell f
ur periodische f (siehe Darstellung in Satz ???)
kann also ein Verfahren beliebig hoher Ordnung erzeugt werden. Im Gegensatz zur numerischen Differentiation bleibt diese Ordnung voll erhalten, da die Integralberechnung
eine stetige Operation ist.
Wendet man die Naherungsformeln auf die Anfangswertaufgabe (8.29) in der aquivalenten Form
ti+1

f (y(t), (t))dt +

y(ti+1) =

a
ti+1

f (y(t), (t))dt + y(ti )

=
ti

f
ur gewahlte ZeitPunkte

t0 = a < t1 < t2 . . .

an, so kann man Naherungen yi f


ur y(ti) durch Ersetzen des Integrals durch eine Quadraturformel bestimmen.

179

Immer sollte gelten:


y0 = .
Wenn dann yi bekannt ist, kann yi+1 bestimmt werden durch
yi+1 = (ti+1 ti )f (yi, ti ) + yi

(8.41)

(durch Anwendung der linksseitigen Rechtecksregel auf das Integral) (explizites Eulerverfahren). Hier kann also yi+1 direkt aus yi (durch Auswertung) bestimmt werden.
Nimmt man stattdessen die rechtsseitige Rechtecksregel erhalt man
yi+1 = (ti+1 ti )f (yi+1 , ti+1 ) + yi ,

(8.42)

das implizite EulerVerfahren. Hier muss eine (skalare) Gleichung zur Bestimmung
von yi+1 gelost werden (etwa mit dem NewtonVerfahren). Nimmt man schlielich die
Trapezregel, so erhalt man
1
yi+1 = (ti+1 ti ) (f (yi, ti ) + f (yi+1 , ti+1 )) + yi
2
das Crank-Nicolson-Verfahren.

180

(8.43)

Darstellung und Approximation von Funktionen

In Abschnitt 6.6 sind die wichtigsten Eigenschaften reeller Zahlenfolgen besprochen


worden. Solange nicht auf die Ordnung auf R (wie in Satz ???) zur
uckgegriffen wird,
sind die dortigen Aussagen auch richtig f
ur Folgen in C oder allgemeiner f
ur Folgen
n
in R (versehen z.B. mit der Euklidischen Lange). Zur Darstellung von Funktionen
werden spezielle Folgen gebraucht, die hier gleich f
ur R oder C, d.h. K betrachtet
werden sollen, wenn nicht anders erwahnt.

9.1

Unendliche Reihen

Definition 9.1 Sei (an )n eine K-Folge.


n

Die Folge sn =

ak heit Reihe mit den Reihengliedern an .


k=1

Die sn heien Partialsummen der Reihe.


Konvergiert sn s, so schreibt man s =

an .

n=1

Eigentlich gibt es nur zwei Reihentypen, wo man die Partialsummen sn


berechnen kann und

als Grenzwert lim sn bestimmt wird:


n

qk =

1) Geometrische Reihe: sn =
k=0

a) sn ist divergent f
ur |q|
b)

qk =

k=0

1
1q

explizit

1q n+1
1q

, dann:

f
ur |q| < 1 .
n

2) Teleskopreihe: sn =
k=1

1
k(k+1)

=
k=1

k=1

1
k

1
k(k+1)

1
k+1

=1

1
n+1

, also:

=1 .

Man u
berlege sich, dass es Reihen gibt, die man ahnlich behandeln kann.
n

Folgerung 9.2 Reihen sind spezielle Folgen und umgekehrt an =

(ak ak1 ) + a0 .

k=1

Damit erhalt man:

181

Satz 9.3
1) Konvergieren

k=1

(an + bn ) =

n=0

2)

an und

n=1

bn , so auch fur K

k=1

an +

n=0

an + bn und

k=1

bn .

n=0

an konvergiert
m

Fur alle > 0 existiert ein N() N, mit

an < fur n, m > N()


k=n

(Cauchy-Kriterium).
3) Sind die an > 0, so gilt:

n=1

an konvergiert

n=1

an M fur alle N .

4) Lasst man endlich viele Reihenglieder weg, so andert sich das Konvergenzverhalten nicht, aber gegebenenfalls der Grenzwert nach

n=1

an =

an +
n=1

an .

n=k+1

Wenn es also nur um Konvergenz geht, wird im Folgenden der Startindex weggelassen:

an bzw. davon ausgegangen, dass er gleich gewahlt wird.

Uber
die Erkenntnisse der Folgentheorie hinaus gibt es noch Konvergenzkriterien
durch Betrachtung der Reihenglieder.
Nach Cauchy-Kriterium gilt:
Ist

an konvergent

k=n

ak = | an | 0 .

Das formuliert man haufig als


Divergenzkriterium:

an konvergent an 0
oder:

Gilt an 0 nicht
an divergent.
BSP. 9.1
1)

1+

1 n
n

ist divergent, weil 1 +

1 n
n

182

e = 0.

2)

1
(harmonische
n

1
Reihe):
0 keine Aussage aus den Divergenzn
kriterien. (Die Reihe ist aber divergent, siehe unten).

Definition 9.4

an heit alternierende Reihe, falls an R und sign(an ) = sign(an+1 ) .

Satz 9.5 (Leibnizkriterien fu


r alternierende Reihen)
Sei

an eine alternierende Reihe und gelte |an | 0 monoton.

an konvergiert.

Fur den Fehler RN =

| RN |

an gilt:

n=N +1

| aN +1 | , sign RN = sign aN +1

a2

Beweis:

a4
s1

s4

s3

s2

s0

a3
a1

O.B.d.A. sei a1 < 0, d.h. a2 > 0, a3 < 0, . . ., dann:


a2n+1 , also s2n+2

s2n+2 = s2n + a2n+1 + a2n+2 und 0 < a2n+2

s2n f
ur n N

und analog
s2n+1
s2n1 f
ur n N und s2n+1 s2n = a2n+1 0 f
ur n , also bilden
An := s2n und Bn = sn+1 eine Intervallschachtelung, die nach Satz ??? gegen ein
s konvergiert. Damit ist s auch der Grenzwert aus der aus An und Bn abwechselnd
zusammengesetzten Folge, d.h. von (sn ). Die Fehlerabschatzung ergibt sich wie folgt:
M

an = aN +1 + aN +2 + aN +3 + . . . aM
n=N +1

und o.B.d.A. N ungerade, d.h. aN +1 > 0, dann


M

an

aN +1 ,

n=N +1

da die Paare in der Summe jeweils nichtnegativ sind, eventuell mit aM


0 (falls
M N ungerade), die nach aN +1 folgenden Paare in der Summe jeweils nicht positiv
sind, eventuell mit aM 0 (falls M N gerade). Also auch

an

n=N +1

183

aN +1 .


BSP. 9.2
1) Die alternierende harmonische Reihe: 1 12 + 13 14 + 51 61 + . . .
konvergiert ( ln 2 wie wir zeigen werden) und:

0<

2N

(1)n+1

n=1

1
1
1

(1)n+1 <
.
n n=1
n
2N + 1

2) Die Leibnizreihe: 1 13 + 15 71 + . . . konvergiert (


werden).

wie wir spater zeigen

F
ur nicht alternierende Reihen hat man kein so einfaches Kriterium und Fehlerabschatzung.
Definition 9.6
Satz 9.7 Ist

an heit absolut konvergent, falls

|an | konvergent, dann ist auch

|an | konvergiert.

an konvergent.

Beweis:
m

Nach Cauchy-Kriterium: |

k=n

ak |

k=n

| ak | < f
ur n, m > N().

BSP. 9.3
1)

1
konvergiert, weil
(1) n n(n+1)

n=1

2)

1
n(n+1)

konvergiert.

(1) n n1 konvergiert (siehe oben), aber nicht absolut, denn

1
n

ist divergent.

Bemerkung: Die Konvergenz ohne absolute Konvergenz lasst sich schwer zeigen
( bedingte Konvergenz ), hochstens mit dem Leibnizkriterium. Solche Reihen ha
ben unangenehme Eigenschaften z. B. kann man durch Umordnen der Reihenglieder
jeden Grenzwert oder auch Divergenz erzielen.
Aus Satz 9.3 folgt sofort:
Satz 9.8

an konvergiert absolut

| an | beschrankt fur N N.

184

Satz 9.9 (Integralkriterium) Sei f (x)


Dann gilt:

n=0

0 fur x

0, stetig und monoton fallend.

f (n) existiert

f (x)dx existiert
0

und die Werte sind gleich.


Beweis:
N

f (k) <
k=1

N 1

f (x)dx <

f (k).

(9.1)

k=0

Existenz ist also sowohl bei Reihe bzw. Integral aquivalent zur Beschranktheit von
N

f (k) bzw.
k=0

f dx
0

x
0

und diese sind wieder aquivalent zueinander nach obiger Abschatzung, die auch die
Gleichheit der Grenzwerte f
ur N
impliziert.

Folgerung 9.10 Fehlerschatzung: Unter den Voraussetzungen des obigen Satzes gilt
bei Konvergenz:

f (x) dx

f (k)

f (N + 1) +

k=N +1

f (x) dx .
N +1

Beweis:

f (k) =

k=N +1

N +1

f dx

f (k) + f (N + 1)
k=0

N +1

f dx

f dx + f (N + 1)
0

nach (9.1) und analog

k=N +1

f dx

f (k) =
0

f dx .

f (k)
k=0

BSP. 9.4

185

1)

dx
x

ist divergent f
ur 1 und konvergent f
ur > 1, also:

1
n

ist divergent f
ur 1 ( = 1 harmonische Reihe) und konvergent f
ur

> 1.
2) Sei

S=

N
1
.
Gesucht
N,
mit
|
S

|<
2
n=1
n=1 n

S
f
ur

1
n2

<

1
(N +1)2

N +1
N +1

1
1
< 2 ( 1 + 4 1).
N +1

3
F
ur N > 2 1+4+1
1 4
4

1
dx
x2

1
(N +1)2

1 gilt |

Satz 9.11 (Vergleichskriterium) Sei ak bk 0


) Falls
(

ak konvergiert, so konvergiert

ak heit Majorante von

) Falls

bk divergiert

bk heit Minorante von

ak

1
N +1

<

| < .

fur fast alle k.

bk auch

bk ) .
divergiert (erst recht!)
ak ) .

Beweis:
n

ak

bk

ak

bk beschrankt, also konvergiert die monoton

wachsende Folge.
n

bk , also ist

ak

BSP. 9.5

53 sin n+cos n
2

n (n 1)

ak unbeschrankt und somit divergent.

konvergiert absolut, da |an |

5+3+1
n2 (nn/2)

an

konvergiert.
Meistens vergleicht man mit der geometrischen Reihe:
Satz 9.12 (Wurzelkriterium) :

| an | konvergiert, falls eines der aquivalenten Kriterien erfullt ist:


) Es existiert ein 0 < q < 1 mit | an | q n fur fast alle n N .

186

18
n3

und

18
n3

) Es existiert ein 0 < q < 1 mit

| an | q < 1 fur fast alle n N .

) lim n | an | < 1 .
Das Kriterium ist also nicht erf
ullt, wenn
lim n |an |

1.

Im Fall lim n |an | = 1 kann man allgemein nichts aussagen.


BSP. 9.6
1
: Divergenz und lim n |an | = 1
n
1
=
: Konvergenz (s.u.) und lim n |an | = 1 .
n2

an =
an
Aber:

Ist lim n |an | > 1, dann divergiert


nk

|an |, da f
ur unendlich viele nk N gilt:

|ank |

und so
|ank |

f
ur ein > 1
1

ur k
nk 1 f

und somit kann (an )n keine Nullfolge sein.


Satz 9.13 (Quotientenkriterium) :
Sei an = 0 fur fast alle n N.

| an | ist konvergent, falls eines der aquivalenten Kriterien erfullt ist:


)

an+1
an

) lim

q < 1 fur fast alle n

an+1
an

<1.

| an | ist divergent, falls

lim

an+1
an

> 1.

Im Fall lim

an+1
an

= 1 zeigen die obigen Beispiele, dass keine allgemeine Aussage gilt.

187

BSP. 9.7
1)

n2
n
. Quotientenkriterium:
n+1
n
n n
n
1 n
f
ur fast
= (1+11 )n
n+1
2
n

an mit an =

| an | =

alle n N, da 1 +

1 n
n

e > 2,

also gilt Konvergenz.


Analog ergibt sich Konvergenz auch mit dem Wurzelkriterium:
lim

1
1 n
n (1+ n )

|an | = lim

2)

n=0
n

1
e

<1.

xn
.
n!

|an | = x

an+1
an

n
n!

xn+1 n!
(n+1) ! xn

??

(x)
(n+1)

0 f
ur alle x C, also Konvergenz f
ur alle x nach

dem Quotientenkriterium.
Bemerkung: Es gilt:
Ist das Quotientenkriterium erf
ullt, dann auch das Wurzelkriterium, da
an+1
an

n=1

|an |

Daher gilt nach letztem Beispiel


3)

q n f
ur fast alle n

q |an |

q f
ur fast alle n N .

n! .

1
.
n2
n

denn lim

|an | =
n

1
1,
n nn

n = lim x1/x = lim e1/x ln x = e0 = 1 .


x

Hier versagen also Wurzel- und Vergleichskriterium; das gilt auch bei der Untersuchung von Reihen des Typs

A
.
n

Daher sollte man, wenn diese Kriterien

versagen, immer versuchen, die vorgelegten Reihen mit

A
n

zu vergleichen.

Fehlersch
atzung:
Hat man f
ur eine vorgelegte Reihe
Abbruchfehler:

|an | eine Majorante

an

an =

N +1

188

an

N +1

bn .

bn , so gilt f
ur den

Speziell:
) Ist 0 |an | < q n f
ur ein 0 < q < 1, dann:

an

N +1

q N +1
.

1q

ur ein > 1, dann liegt Konvergenz vor und nach dem


) Ist 0 an nA f
Integralkriterium

n+1

BSP. 9.8

1
N +
1
1
+
=
.

1
(N + 1)
( 1) (N + 1)
( 1)(N + 1)

an

2
n n
n+1

konvergiert nach dem Quotientenkriterium mit q =


n2

n
n+1

N +1

1
2

N +1

1
1
=
1 1/2
2

1
2

(s.o).

nach ) .

Will man einen Fehler < erreichen, so muss man bis N >
Ohne Beweis zitieren wir hier den wichtigen

ln
ln 0.5

summieren.

Satz 9.14
a) Absolut konvergente Reihen konnen beliebig umsortiert werden, ohne dass sich
der Reihenwert andert.
N

b) Ist eine Doppelreihe absolut konvergent (d. h.


i,k=0

|aik | ist beschrankt), so liefert

jede Summationsreihenfolge den gleichen Summenwert:


z. B.
S=

i=0

k=0

aik

k=0

i=0

aik

a(ik)k .

i=0 k=0

c) Absolut konvergente Reihen multipliziert man wie Polynome, d. h.

i=0

ai

k=0

bk =

k,i=0

ai bk =

i=0 k=0

189

aik bk (Cauchy-Produkt).

Bemerkung: F
ur nicht absolut konvergente Reihen, wie z. B. (1)n n1 gilt Satz 9.14
a) nicht. Wenn man z. B. erst die Glieder mit geradem Index summiert, divergiert die
Reihe.
BSP. 9.9
Es ergibt sich wieder eine Gelegenheit, die Funktion exp(x) = ex (f
ur x C sogar)
zu definieren als: ex =

n=0
0

xn
n!

, da die Reihe nach obigem Beispiel f


ur alle x C

konvergiert. Weiter gilt: e = 1 und ex ey = exy f


ur alle x, y C, da
ex ey =
=
=

i=0

i=0

i=0

xi

i!
1
i!

k=0
i

k=0

yk
=
k!

i=0 k=0

xik y k
k!(i k)!

i!
xik y k =
(i k)!k!

i=0

1
i!

k=0

i ik k
x y
k

1
(x + y)i = ex+y .
i!

Um alle definierenden Eigenschaften zu verifizieren, fehlt also noch


1
(ex )|x=0 = lim (eh 1)
h0 h

hn1
= lim
h0
n!
n=1
!

= 1.
Das ist klar, wenn Grenzwert und Reihe vertauschbar sind. Das wird in Satz ??? klar
werden.

9.2

Reihen von Funktionen und Potenzreihen

fn : D R sei eine Folge von Funktionen, im Folgenden speziell eine Partialsummenfolge.


Definition 9.15
Konvergenzbereich: ={x D| fn (x) konvergiert} D.
BSP. 9.10

190

1) fn (x) = xn (Folge)
ur x = 1

1 f
n

lim x =
0 f
ur |x| < 1
n

divergent sonst

Konvergenzbereich : (1, 1]

f2
f3
-1

1
f1

2)

xn =

n=0

1
mit Konvergenzbereich | x| < 1.
1x

Wir betrachten Potenzreihen


P (x) =

k=0

ak (x b)k f
ur x C, wobei ak C, b C.

b heit Entwicklungspunkt der Reihe.


Sicher konvergiert diese Reihe f
ur x = b.
Das Wurzelkriterium liefert Konvergenz f
ur lim n |an | |x b|n = lim n |an ||x b| < 1 ,
1
.
d.h. Konvergenz f
ur|x b| <
n
lim |an |
1
Entsprechend folgt Divergenz f
ur |x b| >
.
n
lim |an |
Daraus folgt der

Satz 9.16 Potenzreihen P (x) =

n=0

ak (x b)n (ak , b, x C) konvergieren absolut

fur |x b| < R und divergieren fur |x b| > R mit dem Konvergenzradius


R=

lim

191

|an |

Die Falle R = 0 und R = sind entsprechend eingeschlossen.


Die Menge {x K |x b| < R}, die also fur R ein offenes Intervall und fur C einen
Kreis (ohne Rand) darstellt, heit Konvergenzbereich.

R=

xn
mit > 0

n=1 n

BSP. 9.11

=1
lim n
Reihe konvergiert absolut f
ur | x| < 1 und divergiert f
ur | x| > 1 .
Wir betrachten nur x R. Dann hat der Konvergenzbereich die Randpunkte x =
1, 1 :
x =

: Reihe konvergent, falls < 1 ,

x = 1

: Reihe konvergent, falls > 0 .

Bemerkung: Uber
die Konvergenz bei |x b| = R sagt der Satz nichts aus. Man
kann zeigen, dass es im Komplexen mindestens einen Punkt auf dem Kreis |x b| = R
gibt, wo die Reihe divergiert.

Im Reellen muss man die Punkte xb = R gesondert bzgl. Konvergenz untersuchen.


Problem: Welche der Eigenschaften wie Stetigkeit, Differenzierbarkeit u.s.w. u
bertra

fn (x)? Gilt (lim fn (x)) = lim fn (x) ?


gen sich von fn (x) auf lim fn (x) und
Wie in Abschnitt 8.6 ausgef
uhrt, reicht daf
ur gleichmaige Konvergenz der Reihen.
Satz 9.17 WeierstraKriterium:

fn (x) konvergiert gleichmaig, falls ck | fn (x)| existiert mit

Beweis:

192

ck konvergent.

A)

k=1

fn (x) konvergiert punktweise (absolut) f


ur alle x D.

Cauchykriterium:
m

k=n

|fk (x)|

k=n

also existiert
f (x) :=

ck 0 f
ur n, m ,

fn (x) f
ur x D .

n=1
n

B)

fk konvergiert gleichmaig auf D gegen f .


k=1

k=1

fk (x) f (x)

fk (x) = lim

k=n+1

fk (x)
k=n+1
l

lim

k=n+1

und ein solches N() existiert, da

|fk (x)|

ck =

lim

k=n+1

ck < f
ur n

N() ,

k=n+1

ck konvergiert.

k=1

BSP. 9.12
F (x) =

(1)n+1

n=1

1
sin(2n 1)x
(2n 1)2
fn

4 1
1
4

und
|fn |
2
(2n 1)
n2

1
konvergiert
n2

fn (x) konvergiert. gleichmaig f


ur alle x R.

(In Ing. Math III ( Fourierreihen) zeigen wir

F (x) =
F(x)

-B

-1

Satz 9.18 Potenzreihen

n=0

an (x b) konvergieren gleichmaig fur | x b|

jedes < R, wobei R der Konvergenzradius ist.

193

fur

Beweis:
R+
, f
ur | x b |
2
| ak (x b)k | = | ak | | x b |k < ak k

Sei =

und
ak k
konvergiert, also Behauptung nach Weierstra
Kriterium.

"

Satz 9.19

1) Seien die fn (x) stetig und

fn (x) = F (x) gleichmaig konvergent

n=1

F (x) ist auch stetig.

2) Seien die fn (x) integrabel auf [a, b] und

fn (x) konvergiere auf [a, b]

n=1

gleichmaig. Dann gilt:


b

fn (x)dx =

n=0

fn (x)dx

n=0 a

und

F (x) =

fn (x) .

n=1

3) Die fn (x) seien in [a, b] differenzierbar. Wenn

fn (x) gleichmaig kon-

n=1

vergiert dann gilt: F ist differenzierbar auf [a, b] und

F (x) =

fn (x)

n=1

fn (x) .

n=1

Beachte: Bei 3) muss die gleichmaige Konvergenz der abgeleiteten Reihe u


uft
berpr
werden.
Beweis: Folgt aus den Satzen ??? f
ur Folgen, angewendet auf die Partialsummenfolge
n

1) fn stetig

k=1

fk stetig

fn stetig .

n=1

194

3)
n

Fn : =
k=1
n

Fn : =
k=1

fk
fk

fn gleichmaig

n=1

fn gleichmaig .

n=1

BSP. 9.13
1) F (x) =

(1)n+1

n=1

1
sin(2n

1)x
=
fn (x) .
(2n 1)2
n=1

Wir haben gesehen, dass diese Reihe gleichmaig konvergiert, F (x) ist stetig.
x

1
F (l)dt = G(x) =
(1)n+1
(2n 1)2
n=1
4

fn

Es muss F

Aber:

n=1

(1)n+1

(1)n+1

sin(2n 1)x dx

1
(1 cos(2n 1)x)
(2n 1)3

cos(2n 1)x
konvergiert nicht gleichmaig.
(2n 1)

fn nicht gelten.

2) Obige Reihe f
ur G und die Reihe der Ableitungen
gn = fn konvergieren
gleichmaig G = F (das ist klar, da G durch Integration gewonnen wurde).
n

3) sn (x) =

(kekx (k 1)e(k1)x )x =

k=1

Gliedweise Integration Fn =
0
x

lim sn (x)dx.
0

nx
enx2

0.

1
1
f
ur x = 0
nx2 n
)
sn (x)dx = (1 e
2
0 f
2
ur x = 0

Das liegt daran, dass die Konvergenz nicht gleichmaig ist.


Es gilt:
2

Also wird Rn

Rn (x) = | s (x) sn (x)| = n | x | enx .


=

n beliebig gro!

195

9.3

Potenzreihen

Wir betrachten P (x) =


R=

1
limn

n=0
|an |

an (x b)n an , b, x R mit Konvergenzradius

. Wir wissen: P konvergiert gleichmaig f


ur | x b | < R mit

< R beliebig. Damit gilt als Folgerung des letzten Satzes:


Satz 9.20
1) P (x) ist stetig fur | x b | < R.

2) P (x) =

n=0

nan (x b)n1 fur |x b| < R.

P ist unendlich oft differenzierbar fur |x b| < R.


x

3)

P dx =

n=0

1
a (x
n n

b)n+1 fur | x b | < R.

Beweis: Man muss nur noch zeigen, dass die Reihen f


ur P und
Konvergenzradius R haben.

Da aber lim n n = 1 folgt z.B. f


ur P :
n

Zu 1) gibt es noch einen Zusatz:

P dx auch den
0

1
limn n |nan |

limn

n n |an |

=R

Satz 9.21 (Abelscher Grenzwertsatz) Ist P (x) fur x = b+R (bzw. x = bR) noch
konvergent, so ist P (x) auch noch stetig bei x = b + R (bzw. x = b R), d.h. etwa
P (b + R) = lim

xb+R n=0

an (x b)n .

BSP. 9.14
1)

1
1+x

(1)n xn f
ur |x| < 1

n=0
x

1
dx
1+x

= ln(1 + x) =

n=0

x2
2

x3
3

(1)n n+1
x
n+1
x4
4

+ ...

f
ur |x| < 1
.

Da die Reihe f
ur x = +1 noch konvergiert (nach dem LeibnizKriterium), folgt

n=0

(1)n
n+1

= 1 12 + 13 41 + . . . = ln 2 = 0, 693147 . . . nach dem Abelschen

Grenzwertsatz.

196

2) 1 13 + 15 71 + . . . =?
F
ur | x | < 1 :

1
1+x2

(1)n x2n , also

n=0
x

1
dx = arctan x =
1 + x2

n=0

(1)n 2n+1
x
.
2n + 1

Da diese Reihe noch f


ur x = 1 konvergiert analog zu 1), folgt ebenso:

n=0

(1)n
2n+1

= 1 31 + 51 17 . . . = arctan 1 =

= 0, 785398 . . ..

Wegen der g
unstigen Eigenschaften von Potenzreihen benutzt man sie haufig zur Definition von Funktionen, z.B.
Definition 9.22 ez :=

n=0

1 n
z ,
n!

sin z :=

zC .

n=0

(1)n+1 2n+1
z
, zC.
(n + 1)!
x

Integralsinus:

Si(x) :=

sin x
dx : =
x

n=0

(1)n+1 x2n+1
.
(2n + 1)!(2n + 1)

Man kann hier alle Eigenschaften aus der Definition nachweisen!


z. B. (ex ) =

n=1

1
n!

nxn1 =

n=1

1
xn1
(n1)!

= ex u.s.w.

Insbesondere sind die so definierten Funktionen im Konvergenzbereich unendlich oft


differenzierbar. Das schliet die letzte L
ucke bei der Definition von exp u
ber die obige
Reihe.
Wir haben noch drei Probleme, die miteinander zusammenhangen.
a) Wie kommt man zu den Potenzreihen von Funktionen, wenn man sie nicht damit
definiert und man nicht durch Integration bekannter Reihen darauf kommt, wie
oben beim arctan?
b) Gibt es u
berhaupt die Potenzreihe einer Funktion? Ist sie eindeutig bei vorgegebenem Entwicklungspunkt?
c) Was entsteht, wenn man bei Taylorpolynomen lim Tn (x) bildet?
n

197

Zu Frage c) ist das Folgende sofort klar:


Satz 9.23 Sei f in der Nahe von b beliebig oft differenzierbar, d.h. (f C (b
, b + ) fur ein > 0). Dann gilt:
N

f (x) =
n=0

1 (n)
f (b)(x b)n + RN = TN (x) + RN
n!

und das Restglied RN erfullt die Darstellung (7.16) .


Diese Taylorpolynome seien so, dass
T (x) = lim TN (x) =
N

n=0

1 (n)
f (b)(x
n!

b)n existiert.

Dann gilt:
lim RN (x) = 0 f (x) = T (x) .

T heit dann die Taylorentwicklung bzw. die Taylorreihe von f .


Bemerkung: Es gibt Funktionen f C , die sich nicht in eine Taylorreihe entwickeln
lassen, z. B. e1/x

um a = 0, da

e1/x

(n)

x=0

= 0 f
ur alle n, d.h. T (x) 0.

Definition 9.24 f heit analytisch in D K, wenn f in D in eine Potenzreihe


entwickelbar ist.
C := {analytische Funktionen} also:
C0 C1 . . . C C .
BSP. 9.15
(cos x)(2n)

= (1)n cos x (cos x)(2n) |x=0

= (1)n

(cos x)(2n+1) = (1)n sin x (cos x)(2n+1) |x=0 =


N

Also: cos x =

0.

2n

x
(1)n (2n)!
+ R2N

n=0

mit R2N =
|R2N |
cos x =

1
(1)N
(2N +1)!

x2N+1
(2N +1)!

n=0

sin()x2N +1 f
ur ein 0, x , also:

0 f
ur N und so

1
(1)n (2n)!
x2n , x R.

198

Damit muss auch der Konvergenzradius R = sein, wie auch direkt nachgepr
uft
werden kann, allgemein:
Konvergiert eine Taylorreihe um x = b f
ur x K mit |x b| r, etwa dadurch, dass
RN (x) 0 f
ur diese x, so definiert sie als Potenzreihe auf |x b| < R mit R r eine
analytische Funktion, die im Fall RN (x) 0 mit f u
bereinstimmt. Dies muss also
auch u
uft werden, wenn der Konvergenzradius klar ist oder anders bestimmt
berpr
wurde.
Zu Frage b):

Sei P (x) =

n=0

an (x b)n f
ur |x b| < R.

Dann gilt notwendigerweise:


P (n) (b) = n!an , d.h. an =

1 (n)
P (b) .
n!

Daraus folgt:
Satz 9.25
1) Potenzreihen stellen ihre eigene Taylorreihe dar.
2) Potenzreihen sind eindeutig, d. h. aus

n=0

an (x b) =

n=0

bn (x b)n in der Nahe von b folgt

an = bn fur alle n N .
BSP. 9.16
F
ur x > 1 betrachte f (x) = (1 + x) f
ur R, dann:
f (n) (x)
f (n) (0)

= ( 1) . . . ( n + 1)(1 + x)n , also


= ( 1) . . . ( n + 1) und so

(1 + x) =
mit Rn

(1)...(n+1) n
x
n!

n=0
(1)...(N )
(1
(N +1)!

+ RN

+ )N 1 xN +1 f
ur ein 0, x .
N

Man kann man zeigen: RN (x) 0 f


ur |x| < 1.

199

Definition 9.26

:=

(1)...(n+1)
n!

fur R .

Also gilt die Taylorentwicklung

(1 + x) =

n=0

xn fur |x| < 1 .

Bemerkung:
1) F
ur N bricht die Reihe ab bei n = und geht in die Binomische Formel
u
ber.
2) Trotz dieses Zusammenhangs von Potenzreihenentwicklung und Taylorformel verwendet man diese Taylorformel selten zur Reihenberechnung, weil man im Allgemeinen f (n) (b) nicht f
ur beliebige n berechnen kann.
Dann f
uhren haufig folgende Verfahren zum Ziele:
Algebraische Operationen: Seien

P (x) =

n=0

Q(x) =

n=0

an (x b)n mit Konvergenzradius R.

bn (x b)n mit Konvergenzradius R.

Dann sind folgende Funktionen auch Potenzreihen:

: P (x) Q(x) =

: P (x) Q(x) =

(an bn )(x b)n mit Konvergenzradius min(R, R)

n=0

n=0

k=0

ak bnk xn mit Konvergenzradius min(R, R)

gleichmaig und damit absolut


Hier geht ein, dass P und Q f
ur |x b| < min(R, R)
konvergieren und somit auch die Doppelreihe P Q, die nach dem CauchyProdukt

n,k=0

n=0

k=0

an,k =

ak,nk

bestimmt werden kann.

BSP. 9.17

2 sin x cos x = 2
= 2

k,n=0

n=0

(1)k 2k
(1)n
x2n+1
x =2
(2n + 1)!
(2k)!
n=0

(1)n
(2n + 1)!

k=0

2n + 1 2n+1
x
=
2k

= sin 2x f
ur x K .

: Sei Q(b) = 0 .

200

k=0

n=0

(1)nk (1)k
x2n2k+1 x 2k
(2n 2k + 1)!(2k)!

(1)n
2 22n x2n+1
(2n + 1)!

P (x)
nahe bei x = b unendlich oft differenzierbar. Es ist nicht klar, ob
Dann ist S(x) = Q(x)
S auch analytisch ist. Man kann aber den Ansatz

S(x) =

k=0

Sk (x b)k

machen und versuchen Sk und den Konvergenzradius durch Einsetzen in die Gleichung
P (x) = S(x) Q(x) durch eine Rekursionsvorschrift f
ur die Sk zu bestimmen.
BSP. 9.18
Da tan(x)) = tan(x) treten bei einer Entwicklung um x = 0 nur ungerade Glieder
auf:

sin x
!
.
Sk x2k+1 =
tan x =
cos x
k=0
Dort wo S absolut konvergiert, gilt:

sin x =

n=0

1
(1)n (2n+1)!
x2n+1 =

k,n=0

Sk x2k+1 (1)
x2n =
(2n)!

n=0

k=0

(1)nk
(2n2k)!

Sk x2n+1 .

Wegen der Eindeutigkeit ergibt der Koeffizientenvergleich:


n1

Sn =

S0 = 1,
S1 =

1
3!

S2 =

1
5!

2!1

1
4!

k=0

(1)nk
S
(2n2k)! k

(1)n
(2n+1)!

1
3

1 21

1
3

2
15

u.s.w. .

Falls es also eine Potenzreihendarstellung von tan gibt, so lautet diese:


2 5
17 7
22n (22n 1)Bn 2n1
1 3
x ...+
x
+ ...
tan x = x + x + x +
3
15
315
(2n)!
Dabei sind die Bn die Bernoulli-Zahlen.
Der Konvergenzradius ist hochstens R 2 , wegen der Nullstelle von cos bei x = 2 .
Allgemein kann bei einer Potenzreihenentwicklung von S der Konvergenzbereich
hochstens bis zu den Nullstellen von Q gehen.
Auf weitere Operationen, wie Ineinandereinsetzen von Potenzreihen und Verschiebung
des Entwicklungspunktes soll hier nicht eingegangen werden.
Bemerkung: Obige algebraische Operationen gelten nat
urlich genauso f
ur komplexe
Reihen.
Anwendungen der Potenzreihen

201

Haufig ersetzt man Funktionen durch ihre abgebrochenen Potenzreihen. Man schreibt
3
z. B. sin x x x6 .
Wir wollen das etwas prazisieren:
Ersetzt man f (x) durch das Taylorpolynom Tn (x), so spricht man von n-ter N
aherung in der Nahe des Entwicklungspunktes. Solche Naherungen sind sicher nur in der
Nahe des Entwicklungspunktes gut. Haufig kennzeichnet man diese Naherungen mit
Hilfe von Landau-Symbolen.
Definition 9.27
f (x) = o(xn )

f (x) = O(xn )

falls
falls

lim f (x)
n = 0 ( klein

x0 x
f (x)
beschrankt in
xn

o von xn)
der Nahe von x = 0 ( gro O von xn) .

BSP. 9.19
sin x = x

x3
+ O(x5 )
6

cos x = 1

x2
+ O(x4 ) .
2

=x

x3
+ o(x4 )
6

Allgemein folgt aus der Lagrangeschen Restglieddarstellung (Satz 7.16) f


ur ein f
N +1
C
(D) mit beschrankter (N + 1)ter Ableitung auf D:
N

f (x) =
n=0

1 (n)
f (b) (x
n!

b)n + O((x b)N +1 ) f


ur x D.

o, O ersparen die P
unktchenschreibweise sin x = x

x3
6

+ x5 (. . .) .

BSP. 9.20
1) Krummung einer Kurve y = y(x)

K = (1+yy 2 ) 3 = y (1 23 (y )2 + O(y 4)).


2

F
ur kleine Steigungen y gilt also:
3
K y y (y )2 .
2
In der Mechanik wird folgende Beziehung hergeleitet:
E J K(x) = M(x) = Biegemoment .

202

Dabei sind E = Elastizitatsmodul, J = Flachentragheitsmoment Materialgroen


M(x)
= y + O(|y |2 )
EJ

.
2 cos x+x2 2
xo x(sin xx)

2) lim

= lim

2x2 + x4!2 +O(x6 )+x2 2


3
x( x3! +O(x5 ))

xo

= lim

x0

1
+O(x2 )
12
1
6 +O(x2 )

= 12 .

Integration mit Potenzreihen

BSP. 9.21

Darstellung der Fehlerfunktion


x

2
erf(x) =

t2

e
0

2
=

2
dt =

n=0

n=0

(1)n 2n
x dx
n!

(1)n
x2n+1 f
ur x R .
n!(2n + 1)

Diese Darstellung konvergiert sehr schnell.


BSP. 9.22

Bogenlange der Ellipse:

a cos t
f
ur t [, ].
b sin t
O.B.d.A.
sei b 2 a. Dann ist
x = a2 sin t + b2 cos2 t = b 1 2 sin2 t mit
2
2
der numerischen Exzentrizitat := b ba .

Ellipse: x(t) =

Somit gilt f
ur die

1 2 sin2 t dt .

Bogenlange L = b

Dies ist ein sog. elliptisches Integral, das nicht geschlossen dargestellt werden kann.
F
ur kleine (a b) entwickeln wir den Integranten in eine Reihe bzgl. 2 sin2 t:

L = 2b

1 12 2 sin2 t

L = 2b 1 41 2

3 4

64

1 4
sin4
34
5
256

13 6

246

175
16384

sin6 t

135 8
sin8
2468

8 + O(10 ) .

203

t + O(10) dt.

Geodaten verwenden diese Naherung bis O(8) in folgender Form:


L= 3

a+b
a b + O(8) ,
2

denn es gilt:

1 4
8
320
= b 1+ 21 = b 1 41 2 64
256
6 16384
8 + O(10)

6 4
14 6
616 8
256
16384
+ O(10 )
und ab = b 4 1 2 = b 1 41 2 64

3
und somit: (3 a+b
ab) L = 2b 16384
8 + O(10) .
2
a+b
2

Eine sehr einfache Formel hat sich also f


ur kleine als hochgenaue Approximation
herausgestellt.

10

Fourier-Analyse

Eine recht allgemeine periodische Funktion kann durch eine Reihe von sin- und cosFunktionen verschiedener Frequenz, also von Grund- und ihren Oberschwingungen dargestellt werden, wenn der Konvergenzbegriff richtig gewahlt wird.
Eine Funkton f : R R hat die Periode T > 0, wenn
f (x + T ) = f (x) f
ur alle x R
Mit T ist auch nT Periode f
ur n N, andererseits hat ein stetiges periodisches f eine
minimale Periode Tmin > 0, so dass jede andere ein Vielfaches davon ist. Ein periodisches f muss man also nur auf einem beliebigen Intervall [a, a + T ] f
ur ein a R
kennen. Die Frequenz einer periodischen Funktion ist = 1/T , gibt also an, wie
viele Schwingungen (= Periodendurchlaufe) pro x-Einheit (i.A. als Zeit zu interpretieren) stattfinden.
Ist eine Funktion (nur) auf z.B. [0, T ] gegeben, kann sie direkt durch (direkte Fortsetzung)
f (t) := f (t kT ) f
ur kT t (k + 1)T, k Z,
T -periodisch auf R fortgesetzt werden.
Nur wenn f (0) = f (T ), kann diese Funktion stetig sein. Dies kann man z.B. durch die
gerade Fortsetzung von f von [0, T /2] auf [0, T ] erzeugen:
f (T t) = f (t) f
ur t [0, T /2].
Dies gibt aber mit der direkten Fortsetzung zusammen i.A. ein anderes f : R R.

204

Abbildung
Wir betrachten Funktionen der Periodenlange 2, da jede Periodenlange T > 0 darauf
durch die Variablentransformation x 2
x transformiert werden kann.
T
Sei also f : R C (vorerst) stetig und 2 -periodisch. Wir fassen also auch reellwertige
f als komplexwertig auf, was vereinheitlichend wirkt. Die Funktion f soll dargestellt
werden als Reihe bzgl. der Funktionen
fn (x) := exp(i n x),
als

f (x) =

k=

bk +

k=1

k=0

k=

n Z,

ak fk (x) mit ak C.

bk ist als Kurzschreibweise von

x [0, 2],

(10.1)

(10.2)

bk zu verstehen.

Der Konvergenzbegriff in (10.2) ist noch offen.


Wegen fn (x) = z n mit z = exp(ix) kann das fn als komplexes Monom, komponiert mit
x exp(ix), interpretiert werden, die x R mit jedem x + k 2, k Z, identifiziert
und so der 2-Periodizitat Rechnung tragt. Daher heien auch die Partialsummen
n

sn :=

ck fn (x),
k=n

ak C.

(10.3)

trigonometrische Polynome.
Bei der Konvergenz in (10.2) betrachten wir nun die von sn aus (10.3), also nur den
Hauptwert. Da wir immer nur absolute Konvergenz betrachten, hat dies keinen
Einfluss.
Alternativ lat sich (10.2) bzw. (10.3) auch in sin- und cos-Funktionen schreiben:
n

ck cos(n x) + i sin(n x)

sn =
k=n

co +
k=1
n

(ck + ck ) cos(n x) + i(ck ck ) sin(n x)

ao
+
ak cos(n x) + bk sin(n x)
2
k=1

mit ak = ck + ck , bk = i(ck ck ) f
ur k N0 .
Wir werden spater ck so (notwendigerweise) ansetzen, dass f
ur f : R R gilt
ck = ck

f
ur k N0

205

(10.4)

und daher ak = 2 Re ck , bk = 2 Im ck R. (10.4) ist also die reelle Form eines trigonometrischen Polynoms (10.2) bzw. die entsprechende reelle Form die trigonometrische
Reihe.
Es ist hilfreich auf C[0, 2] das Skalarprodukt
2

f, g :=

f (t)g(t)dt
0

zu betrachten, das die Norm


2

||f || := f, f

1/2

=
0

|f (t)|2 dt

1/2

(10.5)

erzeugt, d.h. die Norm zur Konvergenz im quadratischen Mittel ||.||2 (jetzt f
ur
komplexwertige Funktionen). Bez
uglich ., . > erf
ullt die Ansatzfunktion fn
2

fn , fm

ei(nm)x dx

(10.6)

2 f
ur n = m
0 f
ur n = m

d.h. sie sind orthogonal bez


uglich ., . .
Wenn (10.2) im Sinne von ||.||2 konvergiert, d.h.
||f sn ||2 0

f
ur n ,

f, fn fn die n-te Partialsumme darstellt, so folgt

wobei sn =
k=n

Satz 10.1 Gilt (10.2) im Sinne von ||.||2, so ist fur alle n Z
1
an =
2

f (t) exp(int)dt

(10.7)

der n-te Fourierkoeffizient.


Vorbemerkung:
Ein Skalarprodukt und die erzeugte Norm in einem Vektorraum X hangen zusammen
u
ber die Cauchy-Schwarzsche Ungleichung
| x, y | ||x|| ||y||

206

f
ur alle x, y X.

Also ist die lineare Abbildung von X nach C, x x, y f


ur festes y X, stetig. Also
kann ein Grenzwert bzw. ||.|| aus dem Skalarprodukt herausgezogen werden : Wenn
xn x f
ur n bzgl. ||.||, dann
lim xn , y = x, y f
ur y X.

Beweis von Satz 10.1:


Sei f =

f, fm =

bzgl. ||.||2, dann

an fn

n=1

an fn , fm =

n=1

Also: am =

1
2

f, fm =

an fn , fm = am 2
n=1
2
1
f (t) exp(imt)dt
2
0

nach (10.6).

Da wegen ||f ||2

||f ||dt = 2||f || aus gleichmaiger Konvergenz auch Konver-

genz im quadratischen Mittel folgt, gilt Satz 10.1 auch bei gleichmaiger Konvergenz.
Die Konvergenzbegriffe hangen also folgendermaen zusammen:
= punktweise Konvergenz
gleichmaige Konvergenz
= Konvergenz im quadratischen Mittel
(= punktweise Konvergenz einer Teilfolge
bis auf eine Ausnahmemenge)
Die Stetigkeit von f hat f
ur Satz 10.1 keine Rolle gespielt, es muss nur
t |f (t)|2
auf [0, 2] integrierbar sein (im Lebesgue-Sinn). Der Vektorraum dieser Funktion wird
mit
L2 [0, 2]
bezeichnet (die quadratintegrierbaren Funktionen auf [0, 2]). Solange es also
nicht um punktweise oder gleichmaige Konvergenz geht, darf auch
f L2 [0, 2]
sein.
F
ur eine Funktion f ( L2 [0, 2]) wird mit
1
an (f ) :=
2

f (t) exp(int)dt
0

207

der n-te Fourierkoeffizient bezeichnet.


Die Fourier-Reihe

an (f ) exp(int)

i=

konvergiert immer bzgl. ||.||2 und stellt so f dar (ohne Beweis). Einen Hinweis darauf gibt die folgende Minimaleigenschaft der n-ten Partialsumme sn im Raum der
trigonometrischen Poynome n-ten Grades
n

Tn [0, 2] := {f |f (x) =

f
ur ck C}

ck exp(inx)
k=n

Satz 10.2 Sei f L2 [0, 2]. Dann ist die n-te Partialsumme der Fourier-Reihe die
Orthogonalprojektion von f auf Tn [0, 2] bzgl. ||.||2 ,
d.h.
||f sn ||2 ||f g||2 fur alle g Tn [0, 2].
Beweis:
Wegen sn =

n
k=n

f,fk
fk ,fk

fk folgt dies aus Satz ??? (1. Semester)

Weiter gilt:
||f sn ||22 =

f sn , f sn = ||f ||22 2 Re f, sn + ||sn ||22


n

= ||f ||22 +
n

k=n

f, fk
fk ,
fk , fk

l=n

f, fl
f, fk
fl 2 Re f,
fk
fl , fl
f
k , fk
k=n
n

= ||f ||22 +

| f, fk |2
| f, fk |2
2
fk , fk
fk , fk
k=n
k=n
n

||f ||22

| f, fk |2
,
f
k , fk
k=n

und so

Satz 10.3 (Besselsche Ungleichung, Parsevalsche Identitat, Riemannsches Lemma)


Sei f L2 [0, 2], dann gilt:

n=

| f,fn |2
fn ,fn

existiert und

| f, fn |2
||f ||22.
f
,
f
n n
n=

208

(10.8)

Insbesondere gilt also


| f, fn |2
0
fn , fn

fur n

Wenn die n-te Partialsumme sn bzgl. ||.||2 gegen f konvergiert (ohne Beweis: gilt), dann
besteht in (10.8) sogar Gleichheit.
Der Zwischenstand ist also:
Sei

2 := {(an )n (an )n Folge und

versehen mit der Norm ||(an )n ||2 :=

n=

|an |2 konvergiert},

(10.9)

1/2

n=

|an |2

Die Abbildung
F :

L2 [0, 2] 2

f (cn )n mit cn :=

f (t) exp(int)dt f
ur n Z

(10.10)

ist linear, stetig mit ||F (f )||2 ||f ||2 und im Falle der Parsevalschen Identitat sogar
||F (f )||2 = ||f ||2.

(10.11)

Damit ist F injektiv und sogar eine Bijektion, die die Norm erhalt, eine Isometrie. Der

Ubergang
von f (dem Phasenraum) zu (cn ) nach (10.10) (in dem Frequenzraum)
n

erfogt also ohne Infomationsverlust.


Insbesondere gilt

Satz 10.4 (Eindeutigkeit durch die Fourierkoeffizienten).


Sind die Fourierkoeffizienten gleich, d.h.
an (f ) = an (g)

fur alle n Z

und f, g L2 [0, 2], dann gilt


f =g

in L2 [0, 2]

(Im Sinne von ||f g||2 = 0 : gleich bis auf eine Menge vom Lebesgue-Ma 0).

209

Schwieriger ist die Frage nach punktweiser oder gleichmaiger Konvergenz der Fourierreihe von f (gegen f ).
Es gibt nahmlich stetige Funktionen, bei denen die Fourierreihe in keinem Punkt x
konvegiert. Sei f im Folgenden vorerst allgemein, d.h. auf [0, 2] integrierbar ( und auf
R 2-periodisch). Dann lasst sich sn (ohne Beweis) schreiben als

1
sn (x) =
2

Dn (t)f (x t)dt

(10.12)

wobei der Dirichletsche Kern Dn definiert ist auch f


ur n N0 :

sin (n+1 2 )t
f
ur t = 2k, k Z
sin( 2 t)
Dn (t) =

2N + 1
f
ur t = 2k f
ur ein k Z

sn ist also eine Faltung aus f und Dn , wobei sich Dn bei t = 0 konzentriert, was
auf (punktweise) Konvergenz hindeutet, aber nicht Dn (t) 0 erf
ullt.
Abbildung
Betrachtet man statt sn das (gleitende) arithmetische Mittel (Cesaro-Mittel)
1
n :=
n+1

si ,

(10.13)

i=0

dann u
bertragt sich in (10.12) das Mittel auf Dn :
1
n (t) =
2

mit
1
kn (t) =
n+1

Di (t) =
i=0

kn (t)f (x t)dt

1 1cos (n+1)t
n+1
1cos t

n+1

f
ur t = 2k, k Z

(10.14)
f
ur t = 2k f
ur ein k Z

(ohne Beweis), den Fej


erschen Kern.
Dann ist (ohne Beweis):

kn (t) 0 f.a. t R,
1
2

kn (t)dt = 1,

kn (t)
woraus folgt

2
(n + 1)(1 cos )

210

(10.15)
f
ur |t|

Satz 10.5 (von Fejer)


Ist f stetig auf [a, b], so konvergiert n gleichmaig auf [a, b] gegen f . Insbesondere
konvergiert n (x) in jedem Stetigkeitspunkt x von f gegenf (x).
An Sprungstellen gilt:
Satz 10.6 Hat f in x eine Sprungstelle, d.h. die einseitigen Grenzwerte f (x+) und
f (x) existieren, so konvergiert n (x) gegen
1
f (x+) + f (x) .
2
Dies klart noch nicht die Konvergenz der eigentlichen Fouriereihe, d.h. der sn :
Satz 10.7 Die Aussagen von Satz 10.5 und 10.6 gelten auch fur sn (punktweise und
gleichmaige Konvergenz der Fourierreihe), wenn etwa f 2-periodisch und stuckweise
stetig differenzierbar ist.

211