Sie sind auf Seite 1von 45

Mathematik 12

C. Weindorf
29. April 2021

Inhaltsverzeichnis
1 Integralrechnung 3
1.1 Flächenberechnung mithilfe der Unter- und Obersumme . . . . . . . . . . . . . . 3
1.1.1 Die Obersumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Die Untersumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Berechnung von Unter- und Obersumme . . . . . . . . . . . . . . . . . . 4
1.1.4 Grenzwert von Unter- und Obersumme . . . . . . . . . . . . . . . . . . . 6
1.2 Das Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Das Integral als Flächenbilanz . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Die Integralfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Der Hauptsatz der Differential- und Integralrechnung (HDI) . . . . . . . . . . . 14
1.4.1 Berechnung bestimmter Integrale mithilfe des HDI . . . . . . . . . . . . 15
1.4.2 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . 16
1.5 Das uneigentliche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1 Unbeschränkter Integrationsbereich (uneigentliches Integral erster Ordnung) 17
1.5.2 Integration über eine Singularität (uneigentliches Integral zweiter Ordnung) 18
1.6 Von mehreren Graphen berandete Flächen . . . . . . . . . . . . . . . . . . . . . 19
1.7 *Die partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.8 Anwendungen der Differential- und Integralrechnung . . . . . . . . . . . . . . . 24
1.8.1 Anwendungen der Differentialrechnung . . . . . . . . . . . . . . . . . . . 24
1.8.2 Anwendungen der Integralrechnung . . . . . . . . . . . . . . . . . . . . . 25
1.8.3 Beipiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2 Stochastik II 29
2.1 Zufallsgröße und Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . 29
2.2 Erwartungswert einer Zufallsgröße . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 Varianz und Standartabweichung . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Bernoulli-Experiment und Bernoulli-Kette . . . . . . . . . . . . . . . . . . . . . 32
2.4.1 Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.2 Wahrscheinlichkeit der Bernoulli-Kette . . . . . . . . . . . . . . . . . . . 34
2.5 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.1 Kumulative Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.2 *Beweis zu den Eigenschaften der Binomialverteilung . . . . . . . . . . . 35
2.6 Testen von Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3 Geometrie II 37
3.1 Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Gegenseitige Lage zweier Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . 37

1
3.3 Linear unabhängige Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Geometrische Deutung für zwei Vektoren . . . . . . . . . . . . . . . . . . 38
3.3.2 Geometrische Deutung für drei Vektoren . . . . . . . . . . . . . . . . . . 39
3.4 Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.5 Abstandsbetrachtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5.1 Abstand Punkt-Gerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5.2 Abstand Punkt-Ebene – Die Hesse’sche Normalenform . . . . . . . . . . 42
3.5.3 Abstand windschiefer Geraden (nicht im Abi 2021) . . . . . . . . . . . . 44
3.5.4 Abstand paralleler Geraden und Ebenen . . . . . . . . . . . . . . . . . . 44
3.6 Symmetrie und Spiegelungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2
1 Integralrechnung
Die Integralrechnung ist das Gegenstück zur Differentialrechnung. Neben den zahlreichen inner-
mathematischen Anwendungen ist sie enorm wichtig für die naturwissenschaftlichen Disziplinen.
Insbesondere die Physik wäre ohne die Integralrechnung nicht denkbar, da sie es z.B. ermöglicht,
auch zeitlich nicht konstante Systeme quantitativ zu untersuchen und vorhersagen zu treffen.

1.1 Flächenberechnung mithilfe der Unter- und Obersumme


In diesem Kapitel geht es darum, die Fläche unter dem Graphen einer Funktion zu berechnen.
Als Beispiel betrachten wir die Parabel y = x2 und wollen wissen, welchen Flächeninhalt die
Parabel im Intervall [0; 2] mit der x-Achse einschließt.
y
4

−2 −1 1 2 x

Dies scheint auf den ersten Blick keine leichte Aufgabe, da die bekannten Flächenformeln – mit
Ausnahme der Kreisformel – allesamt geradlinig begrenzte Flächen voraussetzen. Aber genau aus
diesem Gedanken rührt die folgende, auf Riemann zurückgehende Idee her: Wie approximieren
(annähern) die gesuchte Fläche durch eine gewisse Anzahl von Rechtecken. Dies kann man
natürlich auf viele verschiedene Arten tun, doch es haben sich zwei Arten als besonders günstig
erwiesen – die sogenannten Ober- und Untersummen.

1.1.1 Die Obersumme


Bei der Obersumme wird die betrachtete Fläche in gleich breite, vertikale Streifen zerlegt.
Die Höhe dieser Streifen wird so gewählt, dass die Funktionswerte im jeweiligen Intervall stets
kleiner oder gleich der Höhe sind. Die Streifen approximieren die Fläche also „von oben“. Die
Streifen haben zusammengenommen einen größeren Flächeninhalt wie die betrachtete Fläche.
y
4

−2 −1 1 2 x

3
In obiger Skizze wurde die Fläche in vier Streifen unterteilt. Jeder dieser Streifen hat folglich
die Breite ∆x = 42 . Da der Graph in [0; 2] monoton steigend ist, ergibt sich die Höhe aus dem
Funktionswert am rechten Rand des jeweiligen Streifens. Der Wert der Obersumme O4 ist
daher:

O4 = ∆x · h0 + ∆x · h1 + ∆x · h2 + ∆x · h3
h i
= ∆x · f (0,5) + f (1) + f (1,5) + f (2)
h i
= 0,5 · 0,25 + 1 + 2,25 + 4 = 3,75

1.1.2 Die Untersumme


Bei der Untersumme geht man genau gleich vor wie bei der Obersumme, nur, dass man das
Flächenstuck „von unten “ annähert. Die Streifen werden so gewählt, dass sie gerade noch unter
den Graphen passen. Im Beispiel der monoton wachsenden Funktion wird die Höhe der Streifen
somit vom Funktionswert am linken Rand bestimmt.
y
4

−2 −1 1 2 x

Das Intervall [0; 2] wurde wieder in vier Streifen unterteilt. Der erste Streifen hat wegen f (0) = 0
lediglich die Höhe Null, weshalb er nicht sichtbar ist. Den Wert der Untersumme U4 können
wir wie folgt berechnen:
h i
U4 = ∆x · f (0) + f (1) + f (0,5) + f (1,5)
h i
= 0,5 · 0 + 0,25 + 1 + 2,25 = 1,75

1.1.3 Berechnung von Unter- und Obersumme


Wenn man die verherigen Ergebnisse vergleicht, sieht man eine große Diskrepanz. Diese war
auch zu erwarten, denn die Obersumme O4 liefert offensichtlich einen viel zu großen und die
Untersumme U4 einen viel zu kleinen Wert. Ganz umsnst war die Arbeit jedoch nicht, denn
nun wissen wir, dass der tatsächliche Wert der Fläche unter dem Graphen irgendwo zwischen
1,75 und 3,75 liegt. Sicher ist Ihnen bereits klar, wie wir den exakten Wert präziser ermitteln
können.
Was wäre, wenn wir das Intervall nicht nur in vier, sondern sagen wir in 20 Teile zerlegen
würden?

4
y y
4 4

2 2

−2 −1 1 2 x −2 −1 1 2 x
Nun sind die Streifen lediglich 20
2
= 0,1 Längeneinheiten breit. Änderungen im Verlauf von Gf
können somit deutlich besser berücksichtigt werden. Das hat zur Folge, dass die Ober- und
Untersummen O20 bzw. U20 die Fläche um einiges besser approximieren. Auch deren Differenz
wird sich verringern, sodass wir den tatsächlichen Wert sehr viel besser eingrenzen können.
Der Preis ist jedoch, dass man im Verglich zu O4 bzw. U4 nicht nur vier Summanden aufaddie-
ren muss, sondern 20. Für die Obersumme brauchen wir wieder die Funktionswert am rechten
Rand. Die Höhe des ersten Streifens ist deshalb f (0,1). Der letzte Streifen hat die Höhe f (2)
h i
O20 = 0,1 · f (0,1) + f (0,2) + f (0,3) + ... + f (1,9) + f (2) = 2,47

Bei der Untersumme beginnen wir mit der Höhe f (0) und enden mit f (1,9). Die Höhen sind
gegenüber der Obersumme um eine Streifenbreite nach links verschoben.
h i
U20 = 0,1 · f (0) + f (0,1) + f (0,2) + ... + f (1,8) + f (1,9) = 2,87

Man sieht, dass die Ergebnisse schon deutlich näher beisammen liegen. Der tatsächliche Wert
muss somit zwischen 2,47 und 2,87 liegen.
Wenn wir es noch genauer wissen wollen, müssen wir „nur“ die Anzahl der Streifen erhöhen.
Das impliziert aber einen immensen Rechenaufwand. Natürlich kann mit dem Computer auch
Summen mit vielen Tausend Summanden in Sekundenschnelle berechnen. Sie müssen dem Com-
puter aber sagen, was er berechnen soll, und wenn Sie die Summe wie oben händisch eintippen,
haben Sie letztlich nichts gewonnen. Deshalb sehen wir uns jetzt an, wie man die Berechnung
von O20 und U20 in der Programmiersprache Python umsetzten könnte. Dazu benutzen wir eine
sogenannte for-Schleife. Bei einer Schleife wird ein festgelegter Parameter (hier k) von einem
Startwert schrittweise um eins erhöht, bis er den Endwert erreicht hat. In jeder dieser Iteratio-
nen erfolgt eine Berechnung, in welcher der aktuelle Wert von k einfließen kann. Der Code für
die Untersumme lautet wie folgt. Die Grünen Passagen sind Kommentare und gehören nicht
zum Code.
def f(x): ’’’Funktion f gibt das Quadrat von x aus ("**"="hoch")’’’
return(x**2)
b = 2 ’’’Obere Grenze des Intervalls, untere ist fest bei 0’’’
n = 20 ’’’Anzahl der Streifen’’’
deltaX = b/n ’’’Streifenbreite deltaX = Intervalllaenge/n’’’
Summe = 0 ’’’Variable, die am Ende zur Untersumme wird’’’
for k in range(0,n): ’’’Beginn der Schleife; range(0,n) = {0;1;2;...;n-1}’’’
Summe = Summe + deltaX * f( deltaX * k )
print("Untersumme = "+ str(Summe)) ’’’Ausgabe des Ergebnisses’’’

5
Die eigentliche Berechnung erfolgt innerhalb der for-Schleife in der Zeile
Summe = Summe + deltaX * f( deltaX * k ).
Diese zugegebenermaßen unmathematische Schreibweise bedeutet folgendes: Der neue Wert der
Variable Summe ist der alte Wert + deltaX*f(deltaX*k). Dabei ist deltaX*f(deltaX*k) nichts
anderes als der Flächeninhalt des k-ten Streifens: deltaX ist die Breite und weil sich der linke
Rand bei deltaX*k befindet ist f(deltaX*k) die zugehörige Höhe.

Der Code für die Obersumme unterscheidet sich nur an einer Stelle: Für die Höhe müssen wir
f nicht mehr am linken, sondern am rechten Rand des Streifens auswerten. Der rechte Rand
des 0-ten Streifens ist bei deltaX. Beim ersten und zweiten ist er bei deltaX*2 bzw. deltaX*3.
Der rechte Rand des k-ten Streifens ist somit bei deltaX*(k+1).
Summe = 0
for k in range(0,n):
Summe = Summe + deltaX * f( deltaX * (k+1) )
print("Obersumme = "+ str(Summe))

Fühlen Sie sich aufgefordert auf die Seite https://repl.it/languages/python3 zu gehen und den
Code selbst auszuprobieren (Ins mittlere Feld eintippen und anschließend auf „Run“). Hierbei
können Sie alles mögliche Verändern: Das Intervall, die Anzahl der Streifen und sogar eine ande-
re Funktion eintippen. Diese muss jedoch im Intervall [0; b] monoton wachsend sein. Falls sie eine
e-Fumktion verwenden wollen, müssen Sie from math import e in der ersten Zeile ergänzen.
Wenn Sie beide Codes untereinander eintippen, dann werden beide Summen für die eingestellten
Parameter berechnet und ausgegeben. Beobachten Sie, wie sich diese insbesondere mit steigen-
dem n verändern.

1.1.4 Grenzwert von Unter- und Obersumme


Trotz der hohen Rechenleistung kommt jeder Computer irgendwann an seine Grenzen. Es ist
schlicht nicht möglich, durch eine endliche Anzahl von Streifen den exakten Wert des Flächenin-
halts zu bestimmen. Egal wie viele Steifen es sind, die Obersumme wird immer einen zu großen
Wert liefern und die Untersumme einen zu kleinen. Es wird daher immer ein Spielraum bleiben,
indem der genaue Wert anzusiedeln ist.
Der Menschlich Verstand ist aber zu mehr in der Lage als ein Computer. Wir können die Anzahl
der Streifen in Gedanken gegen unendlich gehen lassen! In diesem Grenzfall werden die Werte
von Un und On (in der Regel) identisch sein, sodass wir den genauen Flächeninhalt vorhersagen
können.

Beispiel 1
Als erstes Beispiel wählen wir eine einfache Funktion, z.B. die Gerade mit f (x) = 0,5x + 1, und
bestimmen den exakten Wert des Flächeninhalts unter dem Graphen im Intervall [0,2].

6
y
4

−2 −1 1 2 x

Die Wahl einer so einfachen Funktion hat zwei Vorteile: Einerseits ist die Rechnung einfacher
als bei der Parabel und andererseits können wir das exakte Ergebnis mit elementarer Geometrie
(z.B. Trapezformel) berechnen: A = 12 (2 + 1) · 2 = 3. Hierdurch lässt sich das folgende Grenz-
wertverfahren überprüfen.
Wir zerlegen die Fläche nun in Gedanken in n Streifen. Dann ist jeder Streifen ∆x = n2 Län-
geneinheiten breit. Der linke Rand des k-ten Streifens (Zählung beginnt bei k = 0) ist dann bei
∆x · k, sodass die zugehörige Höhe f (∆x · k) beträgt. Wenn wir bei Null beginnen, dann hat
der letzte Streifen den Index k = (n − 1). Mithilfe des Summenzeichens ergibt sich:
n−1 n−1   n−1  
Un = | {z· k} ) =
∆x · f ( ∆x ·k = · 0,5 · ·k+1
X X X
2 2 2 2
|{z} n
·f n n n
k=0 Breite linker Rand k=0 k=0
| {z }
Höhe

n−1
X  n−1 n−1
= ·k+ = ·k+
X X
2 2 2 2
n2 n n2 n
k=0 k=0 k=0

Die zweite Summe enthält kein k im Argument, das heißt es wird immer der gleiche Wert 2
n
addiert, und das genau n mal (0 bis n − 1 sind n Schritte).
n−1
= ·n=2
X
2 2
n n
k=0

Die erste Summe ist etwas kompliziertet, da die Summanden von k abhängen. Zunächst enthält
jeder Summand den Faktor n22 , sodass wir diesen Ausklammern und vor das Summenzeichen
schreiben können.
n−1 n−1
·k = (1)
X X
2 2
n2 n2
· k
k=0 k=0

Zu Berechnen ist also nur die Summe über k von k = 0 bis k = n − 1. Hierfür gibt es eine
nützlich Formel:
n
k = n2 (n + 1) (2)
X

k=0

Diese lässt sich am besten an einem Beispiel nachvollziehen: Für n = 100 müssen wir alle Zahlen
von 1 bis 100 aufsummieren. Anstatt der Reihe nach vorzugehen, sortieren wir die Summanden
zu Paaren: 1 + 100, 2 + 99, 3 + 98 usw. bis zum letzten Paar 50 + 51. Insgesamt erhalten wir

7
50 = n2 Paare, die jeweils zusammen 101 = n + 1 ergeben. Die Summe beläuft sich somit auf
n
2
(n + 1).
Zu beachten ist jedoch, dass wir bei (1) nur bis n − 1 aufsummieren müssen, und nicht bis n.
Dies ist aber kein Problem, denn wir können im Ergebnis von (2) einfach n durch n − 1 ersetzen.
Die erste Summe in Un ist daher
n−1 n−1
·k = k= [(n − 1) + 1] =
X X
2 2 2 n−1 n−1
n2 n2
· n2
· 2 n
.
k=0 k=0

Der Gesamtterm für Un lautet somit


n−1 n−1
Un = ·k+ = + 2,
X X
2 2 n−1
n2 n n
k=0 k=0

und der Grenzwert limn→∞ Un ist wie vorhergesagt tatsächlich 1 + 2 = 3.


Nun berechnen wir noch die Obersumme O4 . Weil f monoton anwächst, müssen wir jeweils am
rechten Rand auswerten um die Höhe zu bekommen:
n−1 n−1   n−1  
On = ∆x · f (∆x · (k + 1)) = · (k + 1) = · 0,5 · · (k + 1) + 1
X X X
2 2 2 2
|{z} n
·f n n n
k=0 Breite k=0 k=0
| {z }
rechter Rand
| {z }
Höhe
n−1
X  n−1 n−1
X  n−1  
= ·k+ + = ·k+ + = k+ +
X X
2 2 2 2 2 2 2 2 2
n2 n2 n n2 n2 n n2
· n2 n
·n
k=0 k=0 k=0 k=0
 
= 2
n2
· n−1
2
[(n − 1) + 1] + 2
n2
+ 2
n
·n
= n−1
n
+ 2
n
+2

Der Grenzwert der Obersumme für n → ∞ ist demnach ebenfalls 1 + 0 + 2 = 3.

Beispiel 2
Nachdem wir unser Verfahren bestätigt sehen, widmen wir uns wider der Parabel f : x 7→ x2
(Abbildung: siehe 1.1):
n−1   n−1  2
Un = ·k =
X X
2 2 2 2
n
·f n n
· n
·k
k=0 k=0

n−1 n−1
= · k2 = k2
X X
8 8
n3 n3
·
k=0 k=0

Für die Summe über k 2 gib es eine ähnliche Formel:


n
n
k2 = (n + 1)(2n + 1)
X

k=0 6

8
Auch hier müssen wir wieder n durch n − 1 ersetzen, da wir nur bis n − 1 summieren. Für Un
ergibt sich:
n−1
8(n − 1)(2n − 1) 16n2 − 24n + 8
Un = k2 = [(n − 1) + 1][2(n − 1) + 1] = =
X
8 8 n−1
· ·
n3
k=0
n3 6
6n2 6n2
16 8
lim Un = =
n→∞ 8 3
Die Obersumme liefert denselben Wert, denn
n−1   n−1  2 n−1
On = · (k + 1) = · (k + 1) = (k + 1)2
X X X
2 2 2 2 8
n
·f n n
· n n3
·
k=0 k=0 k=0

n
16n2 + 24n + 8
= k2 = · n6 (n + 1)(2n + 1) =
X
8 8
·
n3
k=1
n3
6n2

16 8
lim On = = .
n→∞ 6 3
Der Gesuchte Flächeninhalt muss für alle n zwischen Un und On liegen. Da die Grenzwerte beider
Terme identisch sind, muss die Fläche unter der Parabel genau diesen Inhalt haben. Bezogen
auf die Schulmathematik würde theoretisch eine der beiden Summen und deren Grenzwert
ausreichen. Im allgemeinen gibt es aber Funktionen, bei denen sich die Grenzwerte von Un und
On unterscheiden. In diesem Fall ist das Verfahren nicht anwendbar.

Beispiel 3
Betrachten wir ein weiteres Beispiel, und zwar die e-Funktion f : x 7→ ex . Die obere Grenze des
Intervalls lassen wir jetzt variabel, sodass die Untersumme letztlich eine Funktion von x ist.
y

A(x)

−2 −1 1 x 2 x

n−1   n−1 x n−1  x k n−1


X  x k
Un (x) = ·k = e n ·k = =
X X X
x x x x x
n
·f n n
· n
· en n
· en
k=0 k=0 k=0 k=0

9
x
Um die verbleibende Summe zu berechnen substituieren wir z = e n .
n−1
X  x k n−1
= zk
X
en
k=0 k=0

Eine solche Summe heißt geometrische Reihe. Kürzen wir sie mit S ab. Es gilt:

S = z 0 + z 1 + z 2 + ... + z n−2 + z n−1

Wenn man S mit z multipliziert, erhält man:

z · S = z 1 + z 2 + z 3 + ... + z n−1 + z n

Im Vergleich zu S fehlt der erste Summand (z 0 = 1) und der Summand z n ist dazu gekommen.

z · S = S − 1 + zn

Diesen Zusammenhang kann man nach S auflösen.

z · S = S − 1 + zn
(z − 1)S = z n − 1
zn − 1
S=
z−1
Für Un ergibt sich insgesamt folgender Ausdruck:
 x n
n−1
X  x k x n−1
x z −1 x en − 1
n
x ex − 1
Un (x) = = zk = · = · = · x
X
x
· en · x
n
k=0 n k=0 n z−1 n en − 1 n en − 1

Da wir nun einen geschlossenen Ausdruck für Un (x) haben, wollen wir noch den Grenzwert
limn→∞ Un bestimmen. Dieser liefert dann den exakten Wert unter des Flächeninhalts unter
dem Graphen von 0 bis x. Der Ausdruck ex − 1 im Zähler enthält kein n und kann deshalb als
Faktor vor den Limes gezogen werden.
x ex − 1 x
lim Un = lim · x = (ex − 1) · lim x n
n→∞ n→∞ n n→∞ e n − 1
en − 1

Der Übersichtlichkeit halber substituieren wir im verbleibenden Grenzwert x


n
= a. Statt n → ∞
müssen wir dann a → 0 bilden.
x
a
lim x
n
= lim
n→∞ e −1
n a→0 ea −1
Da sowohl der Zähler als auch den Nenner gegen Null streben, können (bzw. müssen) wir den
Satz von L’Hospital anwenden. Dazu leiten wir Zähler und Nenner nach a ab.
a 1
lim = lim =1
a→0 ea − 1 a→0 ea

10
Der Grenzwert der Untersumme und der gesuchte Flächeninhalt ist demnach

A(x) = lim Un (x) = ex − 1 für x ≥ 0


n→∞

An dieser Stelle lohnt sich ein kleiner Plausibilitäts-Check: A(x) hat bei x = 0 eine Nullstelle,
denn e0 − 1 = 0. Dies muss auch so sein, weil im Intervall [0; 0] natürlich kein Flächeninhalt
enthalten ist.

1.2 Das Integral

Definition: Das Integral


Falls für eine Funktion f im Intervall [a; b] gilt:

lim Un = lim On < ∞,


n→∞ n→∞

dann nennt man f auf [a; b] (Riemann-)integrierbar.


Den Grenzwert limn→∞ Un = limn→∞ On nennt man das bestimmte Integral der Funk-
tion f mit den Integrationsgrenzen a und b und schreibt
Z b
f (x) dx „Integral f (x) dx von a bis b“
a

Das neue Symbol ab f (x) dx kann man wie folgt verstehen: Die Unter- und Obersumme erhält
R

man, indem man f an diskreten Werten xk auswertet (Höhen) und jeweils mit der Streifenbreite
∆x multipliziert.

U= f (xk ) · ∆x
X

Im Grenzfall unendlich vieler Streifen sind die xk -Werte nicht mehr diskret, sondern kontinuier-
lich verteilt. Jeder x-Wert im Intervall [a; b] kommt ein mal vor. Daher ersetzt man f (xk ) durch
f (x). Der Ausdruck dx steht für eine infinitesimal kleine Änderung ∆x, also die Streifenbreite
(vgl. lim∆x→0 f (x+∆x)−f
∆x
(x)
= dfdx
(x)
für den Differentialquotienten). Letztlich ersetzt man noch
das Summenzeichen durch das Integralzeichen und notiert nicht mehr die Start- und Endwerte
für den Laufindex k, sondern gleich die Grenzen des betrachteten Intervalls.

1.2.1 Das Integral als Flächenbilanz


Bisher haben wir nur Funktionen betrachtet, deren Graphen im betrachteten Intervall oberhalb
der x-Achse lagen (f (x) ≥ 0). In diesem Fall entspricht der Wert des bestimmten Integrals
a f (x) dx dem Inhalt der Fläche zwischen dem Graphen und der x-Achse im Intervall [a; b].
Rb

Was passiert aber, wenn f in [a; b] das Vorzeichen wechselt? Falls f (x) < 0 ist, ist auch das
Produkt f (x) dx < 0, sodass der Flächeninhalt all dieser Streifen negativ gewertet wird.

11
Verfahren: Das bestimmte Integral als Flächenbilanz
y
Der Wert des bestimmten Integrals ab f (x) dx ist als 1
R

Flächenbilanz im Intervall [a; b] zu interpretieren: +


Bereiche, in denen f (x) > 0 ist werden positiv ge-
wertet und Bereiche mit f (x) < 0 werden negativ ge- 1− 2 3 x
wertet. −1
Sucht man den gesamten Flächeninhalt zwischen Gf und der x-Achse, so muss man über
den Betrag von f integrieren:
y
1
Z b + +
A= |f (x)| dx
a 1 2 3 x
−1
In der Praxis ist der Betrag jedoch eher unpraktisch. Stattdessen sollte man vorher un-
tersuchen, in welchen Teilintervallen f positiv bzw. negativ ist.
Beispiel: Falls f bei x0 mit a < x0 < b einen Vorzeichenwechsel von Plus nach Minus hat,
erhält man den Flächeninhalt zwischen Gf und der x-Achse wie folgt:
Z x0 Z b Z x0 Z b
A= f (x) dx +| f (x) dx | = f (x) dx − f (x) dx
a x0 a x0
| {z }
<0

1.2.2 Integrationsregeln
Weiterhin gelten für das bestimmte Integral die folgenden Rechenregeln:

Satz: Integrationsregeln
Seien a < b < c, λ ∈ R und f auf [a; c] integrierbar. Dann gilt:
Z b Z b
Faktorregel λ · f (x) dx = λ · f (x) dx
a a
Z b Z b Z b
Summenregel [f (x) + g(x)] dx = f (x) dx + g(x) dx
a a a
Z c Z b Z c
Additivität f (x) dx = f (x) dx + f (x) dx
a a b
Z b Z a
Umkehr der Integrationsrichtung f (x) dx = − f (x) dx
Z aa b

Identische Integrationsgrenzen f (x) dx = 0


a

12
Arbeitsauftrag
Beantworten Sie folgende Verständnisfragen:

a) Weshalb sind ab |f (x)| dx und | ab f (x) dx | im Allgemeinen nicht dasselbe? Unter


R R

welcher Voraussetzung sind die Ausdrücke äquivalent?

b) Geben Sie zwei Funktionen an mit f (x) dx = 0.


Ra
−a

c) Geben Sie an, für welche a, b ∈ R das bestimmte Integral sin(x) dx gleich Null
Rb
a
ist.

Lösung:
a) |f (x)| dx ≥ | ab f (x) dx |, da letzteres den Betrag der Flächenbilanz berechnet. Beim
Rb R
a
ersten Integral werden alle Flächenstücke positiv gewertet. Die Gleichheit gilt, wenn f in
[a; b] keinen VZW hat.

b) Z.B. alle zum Ursprung punktsymmetrischen Funktionen.

c) a ∈ R und b = a + 2πk mit k ∈ Z

1.3 Die Integralfunktion

Definition: Integralfunktion
Für eine integrierbare Funktion f und a ∈ R ist die Integralfunktion Ia definiert als das
Integral über f von der festen unteren Grenze a bis zur veränderlichen oberen Grenze x.
y
Z x
Ia : x 7→ f (t) dt
a
bzw. Ia (x)
Z x
Ia (x) = f (t) dt
a a x x

Die Integralfunktion hat mindestens eine Nullstelle, nämlich dann, wenn die obere
gleich der unteren Grenze ist:
Z a
Ia (a) = f (t) dt = 0
a

Beachte: Die Funktionsvariable der Integralfunktion ist die obere Grenze x.


Die Variable t ist lediglich eine Hilfsvariable, über die integriert wird (Integrationsvaria-
ble). Sie hat keinen festen Wert und man kann auch nichts für sie einsetzen. Sie durchläuft
während der Integration alle Werte von a bis x (verschiedene Streifen; vgl. k bei der Un-
tersumme).

13
1.4 Der Hauptsatz der Differential- und Integralrechnung (HDI)
Der HDI ist einer der zentralen Sätze der Mathematik. Er verknüpft die Integralrechnung mit
der Differentialrechnung und erleichtert die Berechnung von Integralen erheblich.

Satz: HDI
Sei f integrierbar und stetig und a ∈ R. Dann ist die Integralfunktion Ia mit Ia (x) =
a f (t) dt eine Stammfunktion von f und es gilt
Rx

Ia (x) = F (x) − F (a),

wobei F eine beliebige Stammfunktion von f ist.

Beweis des HDI:


Um zu zeigen, dass Ia eine Stammfunktion von f ist, müssen wir nachweisen, dass die Ableitung
von Ia gleich f ist.
Offensichtlich haben wir keine Ableitungsregel, die es uns erlauben würde, nach der oberen Gren-
ze eines Integrals abzuleiten. Folglich müssen wir auf die Definition der Ableitung zurückgreifen
– den Differentialquotienten.

Ia (x + h) − Ia (x)
Ia0 (x) = lim
h→0 h
1  Z x+h Z x 
= lim f (t) dt − f (t) dt
h→0 h a a

Aufgrund der Additivität können wir das erste Integral zerlegen. Es folgt:
1Z x Z x+h Z x 
Ia0 (x) = lim f (t) dt + f (t) dt − f (t) dt
h→0 h a x a

1 Z x+h
= lim f (t) dt
h→0 h x

Lassen wir den Limes vorerst weg und versuchen den Ausdruck abzuschätzen. Generell gilt: Der
Wert eines Integrals ist stets kleiner oder gleich dem Produkt aus der Länge des Integrations-
intervalls und dem Maximum von f auf ebendiesem Intervall. Das besagte Produkt berechnet
nämlich den Inhalt eines Rechtecks, welche die Fläche unter dem Graphen komplett überdeckt.
Umgekehrt ist das Integral stets größer oder gleich dem Inhalt des Rechtecks mit Breite (b − a)
und dem Minimum von f auf dem Intervall [a; b] als Höhe.
y y
max[a;b] f
min[a;b] f

a b x a b x

Z b Z b
f (t) dt ≤ (b − a) · max f f (t) dt ≥ (b − a) · min f
a [a;b] a [a;b]

14
Die Intervalllänge ist in unserem Fall (x + h) − x = h. Schätzen wir hiermit 1 R x+h
h x
f (t) dt nach
unten und oben ab:
1 1 Z x+h 1
· h · min f ≤ f (t) dt ≤ · h · max f
h [x;x+h] h x h [x;x+h]

1 Z x+h
min f ≤ f (t) dt ≤ max f
[x;x+h] h x [x;x+h]

Nun betrachten wir die Ungleichungskette im Grenzfall h → 0. Der Mittlere Ausdruck wird
dann zu Ia0 (x).
Wenn h gegen Null strebt, dann enthält das Intervall [x; x + h] nur noch den einen Wert x. Weil
f stetig ist, sind das Maximum und das Minumum von f auf diesem (ein-elementigen) Intervall
identisch, nämlich f (x). Die untere und die obere Schranke für Ia0 (x) sind somit gleich:

f (x) ≤ Ia0 (x) ≤ f (x)

Die Ableitung der Integralfunktion muss daher gleich f (x) sein, das heißt Ia ist eine Stamm-
funktion von f .

Jetzt bleibt nur noch die zweite Behauptung zu zeigen: Ia (x) = F (x) − F (a).
Sei F eine beliebige Stammfunktion von f . Da sich alle Stammfunktionen von f nur in einer
additiven Konstante unterscheiden, können wir Ia (x) schreiben als

Ia (x) = F (x) + c mit c ∈ R.

Weil Ia bei a eine Nullstelle haben muss, können wir die Konstante c konkret bestimmen:
!
Ia (a) = 0
F (a) + c = 0
c = −F (a)

Halten wir das Ergebnis nochmal fest:


Z x
Ia (x) = f (t) dt = F (x) − F (a)
a

1.4.1 Berechnung bestimmter Integrale mithilfe des HDI


Durch den HDI ist es nicht mehr nötig, die Unter- und Obersummen zu berechnen. Jedes
bestimmte Integral lässt sich nämlich als Funktionswert einer Integralfunktion interpretieren.

Verfahren: Bestimmtes Integral


Ein bestimmte Integral kann man berechnen, indem man die obere und die untere Grenze
des Integrals in eine beliebige Stammfunktion von f einsetzt und die Ergebnisse subtra-
hiert.
Z b b
f (x) dx = F (x) = F (b) − F (a)

a a

15
Beispielsweise gilt:
Z 2 2
x2 dx = 31 x3 = 1
· 23 − 13 · 03 = 8

0 3 3
0

Das Ergebnis kennen wir bereits aus 1.1.4. Dort konnten wir mithilfe der Grenzwerte der Unter-
und Obersumme genau denselben Wert ermitteln. Die hier vorgeführte Rechnung ist aber deut-
lich einfacher, oder? Die einzige Schwierigkeit ist, eine Stammfunktion des Integranden zu finden.

1.4.2 Das unbestimmte Integral

Definition: Unbestimmtes Integral


Ein unbestimmtes Integral ist ein Integral ohne konkrete Grenzen. Diese symbolische
Notation steht für die Menge aller Stammfunktionen des Integranden, welche sich nur in
einer Konstanten c ∈ R unterscheiden.
Z
f (x) dx = F (x) + c

1.4.3 Wichtige unbestimmte Integrale


Durch Differentiation weist man folgende unbestimmte Integrale nach:

Zum Nachschlagen: Unbestimmte Integrale


Es sei c ∈ R beliebig.
Z Z
1
x dx =
a 1
a+1
xa+1 + c a ∈ R \ {−1} dx = ln |x| + c
Z Z x
ex dx = ex + c ln(x) dx = x ln x − x + c
Z Z
sin x dx = − cos x + c cos x dx = sin x + c
Z
f 0 (x) Z
dx = ln |f (x)| + c f 0 (x)ef (x) dx = ef (x) + c
f (x)
Z Z h i
f (ax + b) dx = a1 F (ax + b) + c a 6= 0 f 0 (x)g(x) + f (x)g 0 (x) dx = f (x)g(x) + c

16
1.5 Das uneigentliche Integral
Es gibt Integrale, die sich über einen unbeschränkten Integrationsbereich erstrecken (z.B. von
−∞ bis ∞) und denen man trotzdem einen sinnvollen Wert zuordnen kann.
In ähnlicher Weise kann der Integrationsbereich eine Singularität des Integranden enthalten
(Definitionslücke mit f (x) = ±∞; z.B. Pol). Auch hier gibt es Fälle, bei denen das Integral
existiert.

Definition: Uneigentliches Integral


Sei I = [a; b] ein Intervall und f eine Funktion.

1. Sei f auf I definiert und b = ∞. Wenn das Integral


Z ∞ Z b
f (x) dx = lim f (x) dx
a b→∞ a

existiert, dann nennt man das Integral ein uneigentliches Integral 1. Ordnung.
Analoges gilt für a = −∞.

2. Sei x0 ∈ [a; b] eineRDefinitionslücke von f mit limx→x0 |f (x)| = ∞ (Singularität).


Wenn das Integral ab f (x) dx über diese Definitionslücke existiert, dann nennt man
es ein uneigentliches Integral 2. Ordnung.

In den folgenden zwei Unterpunkten werden Beispiele und Gegenbeispiele zu den uneigentlichen
Integralen aufgezeigt.

1.5.1 Unbeschränkter Integrationsbereich (uneigentliches Integral erster Ordnung)


Betrachten wir beispielsweise das Integral
Z 0 Z 0
e dx = lim
x
ex dx
−∞ a→−∞ a

Graphisch gesehen ist es nicht klar, ob der Flächeninhalt unter dem Graphen der e-Funktion
von ∞ bis 0 einen endlichen Wert annimmt. Tatsächlich ist dies eher verwunderlich, da die
einbeschriebene Fläche ja keine linksseitige Begrenzung hat.
Wertet man das Integral jedoch rechnerisch aus, so ergibt sich in der Tat ein endlicher Wert:
Z 0 Z 0 0
e dx = lim
x
ex dx = lim ex = lim (e0 − ea ) = 1 − 0 = 1
−∞ a→−∞ a a→−∞ a a→−∞

Aus diesem Grund nennt man das obige Integral ein uneigentliches Integral (erster Orn-
dung). Heuristisch lässt sich das Ergebnis so erklären: Die Fläche hat zwar keine linksseitige
Begrenzung, doch die Funktionswerte nehmen so rasant ab, dass die Bereiche nahe −∞ keinen
signifikanten Beitrag zum Flächeninhalt leisten. Wenn die Funktionswerte weniger schnell gegen
Null streben, dann divergiert das Integral (Bsp. später).
Wenn man die obere Grenze des vorherigen Integrals Variabel lasst (x), dann erkennt man die
zweite zentrale Eigenschaft der e-Funktion (neben dx e = ex ):
d x

Z x Z x x
et dt = lim et dt = lim et = lim (ex − ea ) = ex

−∞ a→−∞ a a→−∞ a a→−∞

17
Satz: Besondere Eigenschaften der Exponentialfunktion
Die zwei herausragenden Eigenschaften der e-Funktion lauten:
1. An jedem Punkt (x | ex ) des Graphen ist der Wert y
der Tangentensteigung gleich dem Funktionswert: 4
y = ex m = ex
f 0 (x) = f (x) = ex .
2
2. Für alle x ∈ R ist der Inhalt der Fläche unter Gf von A = ex
−∞ bis x gleich dem Funktionswert an der Stelle x:
4x
x
−∞ e dt = e
Rx t x −2 2

Betrachten wir nun ein Gegenbeispiel zum uneigentlichen Integral. Dazu nehmen wir eine Funkti-
on, die im unendlichen gegen Null strebt, aber weniger schnell als die e-Funktion (für x → −∞):
Z ∞
1 Z a
1 a
dx = a→∞
lim lim ln |x| = a→∞
dx = a→∞ lim (ln a − ln 1) = a→∞
lim ln a = ∞

1 x 1 x 1

Die Hyperbel f : x 7→ x1 strebt im Unendlichen nicht schnell genug gegen Null. Die Beiträge
zum Flächeninhalt für große x addieren sich nicht mehr zu einem endlichen Wert auf, sondern
lassen das Integral über alle Maßen anwachsen.

1.5.2 Integration über eine Singularität (uneigentliches Integral zweiter Ordnung)


Es folgen zwei Beispiele:

1. Wenn der Integrand einen Pol von mindestens erster Ordnung hat, dann divergiert das
Integral:
Z 1
1 Z 1
1 1
dx = lim dx = lim ln |x| = lim (ln 1 − ln a) = lim (− ln a) = ∞

0 x a→0 a x a→0 a a→0 a→0

Dies war der Nachweis für einen Pol erster Ordnung. Wenn der Pol höherer Ordnung ist,
dann strebt f (x) noch schneller gegen unendlich, weshalb das Integral erst recht divergiert.

2. Wenn f (x) zwar divergiert, aber weniger schnell als ein Pol erster Ordnung, dann konver-
giert das Integral. Bsp: x 7→ √1x
Z 1
1 Z 1
1 √ 1 √ √
√ dx = lim √ dx = lim 2 x = lim (2 1 − 2 a) = 2 − 0 = 2
0 x a→0 a x a→0 a a→0

18
1.6 Von mehreren Graphen berandete Flächen
Wenn man den Flächeninhalt zwischen zwei Graphen bestimmen möchte, kann man das durch
Differenzbildung tun: Angenommen Gf liegt im Integrationsbereich oberhalb von Gg , dann be-
rechnet man den Flächeninhalt zwischen Gf und der x-Achse und subtrahiert den Flächeninhalt
zwischen Gg und der x-Achse.
y
4
Gf
Z b Z b Z b
A= f (x) dx − g(x) dx = (f x) − g(x)) dx 2 A
Gg

a a a

4x
a
2 b

Wenn beide Graphen oberhalb der x-Achse liegen ist diese Her-
angehensweise leicht nachvollziehbar. Was aber, wenn der untere y
Graph Gg unterhalb der x-Achse liegt? Muss man die Integrale
4
dann nicht eher addieren? Gf
Die Antwort ist nein, denn das Integral berechnet die Flächenbi-
2
lanz und nicht den Flächeninhalt. Wenn Gg in [a : b] unterhalb
der x-Achse liegt, dann hat a g(x) dx einen negativen Wert.
Rb

Wenn wir diesen subtrahieren, addieren wir letztlich die Beträge a


2 b
4x
beider Integrale und somit die Flächeninhalte. Die obige Formel −2 Gg
funktioniert also auch in diesem Fall.
In der konkreten Anwendungssituation weiß man jedoch oft nicht so genau, welcher Graph oben
und welcher unten liegt. Diese Ungewissheit stellt aber kein großes Problem dar, denn wenn man
versehentlich die Lage vertauscht, dann wird das Ergebnis obiger Formel denselben Betrag ha-
ben, nur ein negatives Vorzeichen. Um auch den Fall f (x) < g(x) für alle x ∈ [a; b] abzudecken,
muss man also lediglich Betragszeichen hinzufügen:
Z b
A= (f x) − g(x)) dx


a

Ein größeres Problem ergibt sich, wenn sich die Graphen im


Integrationsbereich schneiden, also ihre relative Lage tauschen. y
Wenn wir ungeachtet dessen die Differenz f (x) − g(x) über den
4
gesamten Integrationsbereich integrieren würden, dann würde das Gf
Flächenstück mit f (x) > g(x) positiv und das andere negativ
2
gewertet werden. Das Integral würde somit eine Bilanz berechnen Gg
- nicht das, was wir wollen. Auch der außerhalb des Integrals
stehende Betrag würde an diesem Missstand nichts ändern, weil die a
2 b
4x
Bilanzbildung ja bereits im Integral stattfindet. Der Betrag würde −2
eine potentiell negative Bilanz lediglich ins positive umkehren.
Um das Problem zu lösen, müssen wir den Betrag in das Integral hineinziehen.
Z b
A= f x) − g(x) dx

a

Auf diese Weise ist der Integrand stets positiv, egal welcher der Graphen momentan oben liegt.
Alle Flächenstücke würden somit positiv gewertet und das Integral den gesuchten Flächeninhalt

19
berechnen. Man kann sich die letzte Formel auch so erklären: Der Integrand |f (x) − g(x)| stellt
den (positiven) Abstand zwischen den Graphen dar. Wenn man über alle Abstände im Intervall
[a; b] integriert, dann erhält man den Inhalt der Fläche zwischen den Graphen.
Nun ist der Betrag innerhalb des Integrals sehr unpraktisch, weil man die Stammfunktion einer
Betragsfunktion nicht so einfach angeben kann. Und um den Betrag aufzulösen, müsste man ja
wissen welches Vorzeichen der Term im Betrag hat – sprich, welcher der Graphen gerade oben
liegt. Erinnerung:

f (x) − g(x) für f (x) ≥ g(x)


(
|f (x) − g(x)| =
g(x) − f (x) für f (x) < g(x)

Aber um diese Entscheidung wollten wir uns ja gerade drücken. Viel leichter wird es, wenn man
das Intervall [a; b] in mehrere Teilintervalle aufteilt. Die Schnittpunkte der Graphen stellen die
Grenzen dieser Teilintervalle dar. Wenn Gf in einem Bereich oben liegt, dann ist der Wert des
entsprechenden Integrals positiv. Wenn Gg oben liegt, ist er negativ. Um den eingeschlossenen
Flächeninhalt zu ermitteln müssen wir nur noch die Beträge all dieser Teilintegrale bilden und
aufsummieren.

Verfahren: Flächeninhalt zwischen zwei Graphen


Seien f und g integrierbare Funktionen, deren Graphen sich an der Stelle x0 ∈]a; b[ schnei-
den. Um den Inhalt der durch die beiden Graphen und die Geraden x = a und x = b
begrenzten Fläche zu bestimmen, muss man den Integrationsbereich [a; b] in [a; x0 ] und
[x0 ; b] aufteilen. Die Summe der Beträge der Teilintegrale liefert den gesuchten Flächen-
inhalt.
Z x0 Z b
A=
(f (x) − g(x)) dx + (f (x) − g(x)) dx
a x0

Falls Gf und Gg in ]a; b[ mehrere Schnittpunkte haben, muss man den Integrationsbereich
in entsprechend viele Teilintervalle zerlegen.

1.7 *Die partielle Integration


Es gibt eine Vielzahl von Funktionen, deren Stammfunktionen mit den Standartverfahren nicht
bestimmbar sind. Hierzu gehören insbesondere Produkte von Funktionen. Durch die soge-
nannte partielle Integration lassen sich von einigen dieser Produkte Stammfunktionen ermitteln.
In gewisser Weise stellt die partielle Integration die Umkehrung der Produktregel dar. Die zu-
grunde liegende Gleichung lautet:
Z  
f 0 (x)g(x) + f (x)g 0 (x) dx = f (x)g(x)

Dies ist offenbar richtig, denn die Ableitung von f (x)g(x) ist nach der Produktregel gleich
dem Integranden auf der linken Seite. Der Übersichtlichkeit halber werden im Folgenden nur
unbestimmte Integrale betrachtet. Wir erinnern uns:
Das unbestimmte Integral ist letztlich nur eine alternative Schreibweise für die Menge aller

20
Stammfunktionen des Integranden:
Z
f (x) dx = F (x) + c

Folglich erhält man den Integranden, wenn man das unbestimmte Integral ableitet:
d
Z
f (x) dx = f (x)
dx
Die linke Seite dieser Gleichung scheint auf den ersten Blick wenig Sinn zu ergeben, da die
Variable x lediglich eine Integrationsvariable ist. Das Integral ist in dieser Form eigentlich keine
Funktion von x, sodass dessen Ableitung nach x eigentlich Null wäre. Wenn man allerdings
berücksichtigt, dass das unbestimmte Integral für eine beliebige Stammfunktion von f steht
(mit der Variable x), dann ergibt die Gleichung doch wieder Sinn. Die mathematisch saubere
Alternative wäre, dass man die Gleichung mithilfe einer Integralfunktion notiert (siehe HDI):
Z x
d
f (t) dt = f (x)
dx a

Um die Notation aber nicht unnötig zu verkomplizieren, begnügen wir uns mit dem unbestimm-
ten Integral und nehmen die Unsauberkeit an dieser Stelle hin.

Widmen wir uns erneut der ersten Gleichung und formen diese um:
Z  
f 0 (x)g(x) + f (x)g 0 (x) dx = f (x)g(x)
Z Z
f (x)g(x) dx +
0
f (x)g 0 (x) dx = f (x)g(x)
Z Z
f 0 (x)g(x) dx = f (x)g(x) − f (x)g 0 (x) dx

f ist eine Stammfunktion von f 0 . Wenn wir in obiger Formel statt f 0 (x) einfach f (x) schreiben,
dann muss f (x) zu F (x) werden. Dies führt uns zur Grundgleichung der partiellen Integration:

Satz: Partielle Integration


Seien f und g integrierbare Funktionen. Dann lässt sich das unbestimmte Integral über
das Produkt f (x)g(x) wie folgt umschreiben:
Z Z
f (x)g(x) dx = F (x)g(x) − F (x)g 0 (x) dx

In Worten bedeutet das:


„Die Aufleitung eines Faktors mal den anderen minus das Integral über die Aufleitung
des einen mal die Ableitung des anderen Faktors.“

Machen wir nochmal die Probe: Die Ableitung der rechten Seite ergibt sich aus der Produktregel

21
in Kombination mit dem HDI:
d d d
 Z  Z
F (x)g(x) − F (x)g 0 (x) dx = F (x)g(x) − F (x)g 0 (x)
dx dx dx
= f (x)g(x) + F (x)g 0 (x) − F (x)g 0 (x)
= f (x)g(x)

Die rechte Seite ist demnach eine Stammfunktion von f (x)g(x). Die Gleichung ist also korrekt.

22
Auf den ersten Blick scheint es, als würde man durch die Formel der partiellen Integration nicht
viel gewinnen, da man ein unbekanntes Integral lediglich durch ein anderes Integral ausdrückt.
Noch dazu muss man erst mal eine Stammfunktion von f finden. Der Vorteil ist jedoch, dass im
Integral auf der Rechten Seite nur noch die Ableitung der Funktion g vorkommt. Wenn g zum
Beispiel ein Polynom ist, dann reduziert sich dessen Grad durch das Ableiten um eins. In der
Regel wird das Integral hierdurch einfacher.R Das Ganze lässt sich am besten an einem Beispiel
nachvollziehen. Betrachten wir das Integral ex ·x dx. In diesem Fall ist f (x) = ex und g(x) = x.
F (x) ist somit wieder ex und g 0 (x) = 1. Mithilfe der partiellen Integration erhält man:
Z Z
PI
e · x dx = e · x −
x x
ex · 1 dx = xex − ex = ex (x − 1)

Durch Ableiten der rechten Seite verifiziert man schnell die Gültigkeit dieser Aussage.
In diesem Fall führt die partielle Integration in einem Schritt zum Ziel, da das entstehende Inte-
gral unmittelbar bestimmt werden kann. In manchen Fällen muss man die partielle Integration
aber mehrfach anwenden – so lange, bis der Grad des einen Faktors klein genug ist (i.d.R. 0,
also konstant):
Z Z
PI
x2 ex dx = x2 ex − 2xex dx
 Z 
PI
= x e − 2xe −
2 x x
2e dx = x2 ex − 2xex + 2ex = ex (x2 − 2x + 2)
x

In wieder anderen Fällen kommt man durch wiederholte partielle Integration nicht wirklich zu
einem Ende. Wenn man Glück hat, taucht aber irgendwann wieder das Integral auf, mit dem
man gestartet ist. In diesem Fall kann man die entstehende Gleichung nach dem gesuchten
Integral auflösen. Ein Beispiel:
Z Z
PI
sin x cos x dx = − cos x cos x − − cos x(− sin x) dx
Z
= − cos2 x − sin x cos x dx
Z
⇒2 sin x cos x dx = − cos2 x
Z
sin x cos x dx = − 21 cos2 x

Ein weiteres Beispiel:


Z Z
PI
ex sin x dx = ex sin x − ex cos x dx
 Z 
PI
= ex sin x − ex cos x − ex (− sin x) dx
Z
= e sin x − e cos x −
x x
ex sin x dx
Z
⇒2 ex sin x dx = ex sin x − ex cos x
Z
ex sin x dx = 21 ex (sin x − cos x)

Zum Abschluss noch die Herleitung der Stammfunktion von ln x:


Z Z Z Z
PI
ln x dx = 1 · ln x dx = x ln x − x · dx = x ln x −
1
x
1 dx = x ln x − x

23
1.8 Anwendungen der Differential- und Integralrechnung
Dieses Kapitel stellt sozusagen den krönenden Abschluss der Analysis dar, weil es die wichtigsten
Konzepte miteinander verknüpft und den Sinn der Differential- und Integralrechnung in der
realen Welt aufzeigt. Insbesondere die Physik ist ohne die Differential- und Integralrechnung
nicht vorstellbar.

1.8.1 Anwendungen der Differentialrechnung


Die Differentialrechnung beschäftigt sich mit Änderungsraten. Wir erinnern uns:

Erinnerung: Diffenrenzenquotient und mittlere Änderungsrate


Wenn man die Variable x einer Funktion f um den Wert ∆x erhöht, dann ändert sich
der Funktionswert um ∆f = f (x + ∆x) − f (x). Um die mittlere Änderungsrate von f
im Intervall [x; x + ∆x] zu erhalten, muss man die Änderung des Funktionswerts (∆f ) in
Relation zur Änderung der Funktionsvariable (∆x) betrachten (Differenzenquotient):

∆f f (x + ∆x) − f (x)
m[x;x+∆x] = =
∆x ∆x
Dieser Wert entspricht gleichzeitig der Sekantensteigung im Intervall [x; x + ∆x].

Als konkretes Beispiel betrachten wir die Geschwindigkeit v, die im Allgemeinen eine Funktion
der Zeit ist. Seit der Unterstufe kennen Sie den Zusammenhang
∆s
v= .
∆t
Diese Gleichung ist aber mit Vorsicht zu genießen, denn man muss genau wissen, was sie eigent-
lich aussagt. Stellen wir uns ein Auto vor, das aus dem Stand beschleunigt und nach ∆t = 5 s
die Strecke ∆s = 100 m zurückgelegt hat. Dann hatte das Auto keines Wegs zu jedem Zeitpunkt
die Geschwindigkeit v = ∆s∆t
= 20 ms . Beim Start hatte es vielmehr die Geschwindigkeit v(0) = 0
und nach 5 s hatte es irgendeine Maximalgeschwindigkeit, die wir nicht kennen. Was für eine
Bedeutung hat aber der Wert 20 ms ?
Er steht für die mittlere Geschwindigkeit im Zeitintervall [0 s; 5 s]. Der Vergleich mit der De-
finition des Differenzenquotienten zeigt: Wenn wir uns die zurückgelegte Wegstrecke s(t) als
Funktion der Zeit vorstellen, dann ist die mittlere Geschwindigkeit die mittlere Änderungsrate
dieser Weg-Funktion.

In vielen Anwendungen interessiert man sich aber nicht nur für die mittlere Geschwindigkeit
(allg. Änderungsrate), sondern möchte wissen, wie schnell das Auto zu einem beliebigen Zeit-
punkt war. Man sucht also die momentane Änderungsrate der Weg-Funktion s(t).
Genau hier kommt die Differentialrechnung ins Spiel:

Die momentane Änderungsrate einer Funktion f erhalten wir, indem wir beim Differenzenquo-
tient die Änderung der Funktionsvariable gegen Null gehen lassen. Statt ∆x schreiben wir dann
dx. Mit dieser infinitesimal kleinen Änderung von x geht auch eine infinitesimal kleine Änderung
von f (x) einher. Diese Änderung nennen wir dann nicht mehr ∆f , sondern df (x).

24
Erinnerung: Differentialquotient und momentane Änderungsrate
Aus einer infinitesimal kleinen Änderung dx ergibt sich eine infinitesimal kleine Ände-
rung df (x). Der Differentialquotient bzw. die Ableitung von f ist der Quotient dieser
Änderungen:

df (x) f (x + ∆x) − f (x)


f 0 (x) = = lim
dx ∆x→0 ∆x
Dieser Wert entspricht der Tangentensteigung und wird auch die momentane Ände-
rungsrate von f an der Stelle x genannt.

Zurück zum Beispiel der Geschwindigkeit. Zusammenfassend gilt:

Zusammenfassung: Mittlere und momentane Geschwindigkeit bzw. Änderungsrate


• Für die Weg-Funktion s(t) ergibt der Differenzenquotient ∆s
∆t
die mittlere Geschwin-
digkeit v̄ im Intervall ∆t.

• Der Differentialquotient v(t) = ds(t)


dt
= ṡ(t) ergibt die momentane Geschwindigkeit
zur Zeit t, wobei der Punkt über dem s für die Ableitung nach der Zeit steht.

Beide Aussagen lassen sich auf beliebe andere Kontexte und Funktionen übertragen. Man
muss lediglich den Begriff „Geschwindigkeit“ durch „Änderungsrate“ ersetzen.

Übertragen wir beispielhaft die oben getroffenen Aussagen auf die Beschleunigung a:
Der Quotient ∆v
∆t
ergibt die mittlere Beschleunigung ā im Intervall ∆t. Die Ableitung der Ge-
schwindigkeitsfunktion v̇(t) = dv(t)
dt
liefert dagegen die momentane Beschleunigung zur Zeit t,
also a(t).

1.8.2 Anwendungen der Integralrechnung


Bisher haben wir die Integralrechnung hauptsächlich genutzt, um den Inhalt von Flächen unter
Funktionsgraphen zu berechnen. Wenngleich solche Fragestellungen durchaus ihre Berechtigung
haben, wirken sie oft konstruiert und lassen den Bezug zum Alltag vermissen. Die Integralrech-
nung hat aber sehr viel mehr zu bieten, was in folgendem Abschnitt aufgezeigt werden soll.

Über den Hauptsatz der Differential- und Integralrechnung (HDI) wissen wir, dass die Inte-
gralrechnung sozusagen das Gegenstück, also die Umkehrung der Differentialrechnung darstellt.
Was das bedeutet, machen wir uns wieder am Beispiel der Geschwindigkeit klar.
Im vorherigen Abschnitt sind wir davon ausgegangen, dass wir die Weg-Funktion s(t) kennen
und die momentane Geschwindigkeit v(t) wissen möchten. Wir haben gesehen, dass wir diese
durch Ableiten erhalten. Insofern liegt es doch nahe, dass man durch die Umkehrung, also durch
aufleiten, von der Geschwindigkeitsfunktion auf die Weg-Funktion kommt. Warum das tatsäch-
lich so ist, wollen wir näher ergründen.

25
Der Einfachheit gehen wir zunächst vom eine konstanten Geschwin- v
digkeit aus. Dann ist die mittlere Geschwindigkeit v̄ = ∆s
∆t
gleich der
momentanen Geschwindigkeit für beliebige Zeiten. Die zurückgeleg-
te Wegstrecke erhalten wir in diesem einfachen Fall durch auflösen
der Gleichung:

∆s = v · ∆t
s = v · ∆t v
Dieses Produkt können wir im v-t-Diagramm veranschaulichen.
Wenn v zeitlich konstant ist, dann ist der Graph von v(t) eine
Parallele zur Zeitachse. ∆t t

Das Produkt ∆s = v ·∆t entspricht der Rechtecksfläche und somit dem Flächeninhalt unter dem
Graphen der Geschwindigkeitsfunktion. Dieser Gedankengang wird uns zu einem allgemeinen
Ausdruck für den zurückgelegten Weg führen.
Nehmen wir nun an, das die Geschwindigkeit durch eine allgemeine Funktion v(t) beschrieben
wird. Dann ist die Gleichung ∆s = v · ∆t nicht mehr gültig, denn diese setzt eine konstante Ge-
schwindigkeit voraus. Stattdessen müssen zunächst eine Näherung betrachten: Für einen kurzen
Zeitraum ∆t tun wir so, als wäre die Geschwindigkeit konstant, sodass wir einfach multiplizieren
können. Im Intervall [t0 ; t0 + ∆t] würde dann der Weg ∆s0 = v(t0 ) · ∆t zurückgelegt werden.
Das ist wohlgemerkt nur ein Näherungswert, weil v ja eigentlich nicht konstant ist. Nachdem
∆t verstrichen ist (t1 = t0 + ∆t) aktualisieren wir die Geschwindigkeit und nehmen sie im
Folgenden wieder als konstant an. Der im nächsten Intervall zurückgelegte Weg beträgt dann
∆s1 = v(t1 ) · ∆t. Diese Schritte wiederholen wir, bis wir beim gesuchten Zeitpunkt angelangt
sind.
Dem aufmerksamen Leser ist sicher klar, worauf das Ganze hinausläuft. Die Produkte s0 , s1 ,
etc. stellen genau wie oben die Inhalte von Rechtecksflächen im v-t-Diagramm dar. Der gesamte
zurückgelegte Weg ergibt sich aus der Summe ∆s0 + ∆s1 + ..., also aus der Untersumme (bzw.
Obersumme, je nach dem, ob v(t) zunimmt oder abnimmt).
v

v(t)
∆s0
∆s1
∆s2
∆s3

t0 ∆t t4 t

Wie bei der Herleitung zum Integral lassen wir auch hier ∆t gegen Null streben, um den exakten
Wert zu erhalten. Graphisch bedeutet das: Der im Intervall [t0 ; t4 ] zurückgelegte Weg ist gleich
dem Inhalt der Fläche unter dem Graphen von v(t). Die Regel für konstante Geschwindigkeit
gilt also auch für beliebige andere Geschwindigkeitsfunktionen. Wie wir den Flächeninhalt unter
Graphen berechnen, wissen wir bereits – mit dem Integral.
Um den im Intervall [0; t] zurückgelegten Weg zu berechnen, müssen wir die Geschwindigkeits-
funktion von 0 bis t integrieren. Um einen Konflikt der Variablen zu vermeiden, geben wir der

26
Integrationsvariable den Namen τ (tau). Die Variable x steht hier für den Aufenthaltsort.
Z t
∆s = x(t) − x(0) = v(τ ) dτ
0

Versuchen wir uns von der Geschwindigkeit zu lösen und die obige Gleichung zu verallgemei-
nern.
Auf der linken Seite steht der zurückgelegte Weg, also die Änderung des Aufenthaltsortes x. Das
können wir allgemein als die Änderung eines Funktionswerts bzw. eines Bestandes auffassen.
Neben dem Aufenthaltsort könnte der Bestand auch ein Guthaben, ein Füllvolumen oder die
Anzahl infizierter Personen beschreiben, um nur einige Beispiele zu nennen.
Die Gleichung besagt nun, dass die Änderung des Bestandes gleich dem Integral über die Än-
derungsrate der Bestandsfunktion ist, denn v(t) = ẋ(t).

Satz: Bestandsänderung
Die Änderung einer integrierbaren Bestandsfunktion f im Intervall [a; b] ist gleich dem
Integral über die Änderungsrate der Bestandsfunktion von a bis b.
Z b
f (b) − f (a) = f 0 (x) dx
a

Zugegebener maßen hätte man mithilfe des HDI deutlich schneller zu dieser Erkenntnis gelangen
können. Wenn man über die Ableitung f 0 integriert, dann muss man die Stammfunktion von f 0 ,
also f , an den Grenzen des Integrals auswerten. Nichts anderes besagt letztlich die Gleichung.
Trotzdem war die Herleitung nicht umsonst, denn es ist durchaus sinnvoll, sich die grundlegen-
den Konzepte noch einmal, und vor allem im Sachkontext, vor Augen zu führen.

1.8.3 Beipiele
Wozu braucht man aber dieser Gleichung? In den meisten Fällen kennt man doch die Bestands-
funktion f , oder? Dann ist f (b) − f (a) deutlich schneller berechnet als das Integral. Das stimmt
soweit, bis auf die Tatsache, dass f immer bekannt wäre. Betrachten wir wieder die Bewegung
eines Körpers (ja, schon wieder...): Wenn man in der Physik einen Bewegungsablauf mathema-
tisch beschreiben will, dann muss man von außen nach innen vorgehen. Sprich, man fängt mit
der Ursache der Bewegung an und muss sich bis zur konkreten Ortsfunktion x(t) durcharbeiten.
Nehmen wir an auf den Körper wirkt eine konstante Kraft. Dann erfährt er wegen F = m · a
eine konstante Beschleunigung. Die Beschleunigung ist die Änderungsrate der Geschwindigkeit.
Deshalb gilt:
Z t
v(t) − v(0) = a dτ
0

Der Startwert v(0) wird in der Regel mit v0 abgekürzt. Weil a konstant ist, ist das Integral
schnell ausgewertet:
h it
v(t) − v0 = aτ = at
0
v(t) = v0 + at

27
Diese Formel sollte Ihnen aus dem Physikunterricht bekannt vorkommen. Aber es geht noch
weiter. Wir wollen ja die Ortsfunktion x(t) wissen. Weil v die Änderungsrate der Ortsfunktion
ist, können wir genau so weiter machen wie bisher:
Z t
x(t) − x(0) = v(τ )dτ
0
Z t
x(t) − x0 = v0 + aτ dτ
0
h it
x(t) − x0 = v0 τ + 12 aτ 2
0
x(t) − x0 = v0 t + 1 2
2
at
x(t) = x0 + v0 t + 12 at2

Auch diese Formel haben Sie eventuell schon einmal gesehen. Machen Sie doch mal die Probe, ob
die Gleichung wirklich stimmt! Die erste Ableitung der Ortsfunktion muss die Geschwindigkeit
ergeben und die Ableitung der Geschwindigkeit (zweite Ableitung von x(t)) die Beschleunigung.

Das Beispiel sollte Ihnen klar machen: Oft ist die Bestandsfunktion nicht gegeben, sondern nur
deren erste (bzw. hier die zweite) Ableitung. Mittels der Integralrechnung kann man dann zu-
rückrechnen, was denn die eigentliche Bestandsfunktion gewesen sein muss.

Zum Abschluss noch ein komplett anderes, kurzes Beispiel: Wenn man in einen Wassertank
unten ein Loch bohrt, dann tritt das Wasser aufgrund des Tiefendrucks umso schneller aus, je
mehr Wasser noch im Tank ist. Mit der Zeit wird die Ausflussrate f also abnehmen. Man kann
zeigen, dass die Ausflussrate linear abnimmt, d.h sie startet mit einem maximalen Wert (z.B. 2
Liter pro Sekunde) und geht dann linear bis auf Null zurück. Der Term könnte zum Beispiel so
aussehen:

f (t) = 2 sl − 0,4 sl2 · t

In diesem Fall nimmt die Flussrate pro Sekunde um 0,4 Liter pro Sekunde ab. Die Frage könnte
wie folgt lauten:
Wie viel Wasser ist nach 3 s ausgeflossen? Die Integralrechnung liefert die Antwort. Wenn F
der Bestand, also die Menge an ausgeflossenem Wasser ist, dann gilt (ab jetzt ohne Einheiten):
Z 3
F (3) − F (0) = f (t)dt
o
Z 3
F (3) − F (0) = 2 − 0,4tdt
0
h i3
F (3) − 0 = 2t − 0,2t2
0
F (3) = 2 · 3 − 0,2 · 32 − 0 = 4,2

Nach drei Sekunden sind somit 4,2 l ausgeflossen.

28
2 Stochastik II
2.1 Zufallsgröße und Wahrscheinlichkeitsverteilung
Stellen wir uns ein Würfelspiel vor: Ein Würfel wird gewürfelt. Bei einer 6 bekommt der Spieler
5e und bei einer 1 muss er 2e abgeben. Bei den restlichen Ziffern passiert nichts.
Das zugrunde liegende Zufallsexperiment hat die Ergebnismenge Ω = {1; 6; weder 1 noch 6}.
Eine Zufallsgröße (auch Zufallsvariable) ist eine Funktion X : Ω → R, die jedem Element aus
Ω eine reelle Zahl zuordnet – zum Beispiel den Gewinn bzw. Verlust des Spielers: {−2; 5; 0}.
Die Wahrscheinlichkeit, mit der diese Werte auftreten, hängt von den Wahrscheinlichkeiten
der entsprechenden Ergebnisse ab: P (X = −2) = P (1) = 16 , ebenso wie P (X = 5). Der
Funktionswert X = 0 tritt dagegen häufiger auf, denn P (X = 0) = P (weder 1 noch 6) = 64 = 23 .
Die Abbildung, die jedem möglichen Wert der Zufallsgröße seine Wahrscheinlichkeit zuordnet,
nennt man Wahrscheinlichkeitsverteilung der Zufallsgröße.
Diese Zusammenhänge stellt man in der Regel tabellarisch dar:

Ergebnisse aus Ω ωi 1 6 weder 1 noch 6


Funktionswerte der Zufallsgröße xi = X(ωi ) -2e +5e 0e
Wahrscheinlichkeiten P (xi ) = P (ωi ) = pi 1
6
1
6
4
6

Die ersten beiden Zeilen bilden zusammen die Zufallsgröße X und die letzten beiden Zeilen
bilden die Wahrscheinlichkeitsverteilung von X.

Definition: Zufallsgröße und Wahrscheinlichkeitsverteilung


Sei Ω die Ergebnismenge eines Zufallsexperiments. Eine Zufallsgröße X ist eine Funktion,
die jedem ωi ∈ Ω eine reelle Zahl zuordnet: X : Ω → R, ωi 7→ X(ωi ) = xi .
Die Wahrscheinlichkeitsverteilung von X ordnet jedem xi die Wahrscheinlichkeit des zu-
gehörigen ωi zu: P (X = xi ) = P (ωi ) = pi .

ωi ∈ Ω ω1 ω2 ...
xi = X(ωi ) x1 x2 ...
pi = P (xi ) = P (ωi ) p1 p2 ...

2.2 Erwartungswert einer Zufallsgröße


Sei Ω = {ω1 ; ω2 ; ...; ωk } die Ergebnismenge eines Zufallsexperiments, auf dem eine Zufallsgröße
X definiert ist. Wenn man das Zufallsexperiment N mal durchführt und jedes mal den Wert der
Zufallsgröße notiert, dann erhält man eine Liste bestehend aus N reellen Zahlen. Den Mittelwert
dieser Zahlen würde man ermitteln, indem man die Zahlen aufsummiert und durch die Anzahl
N dividiert. Es liegt in der Natur der Sache, dass die einzelnen xi mitunter mehrfach auftreten.
Nehmen wir an, x1 ist n1 mal in der Liste enthalten, x2 n2 mal und so weiter. Dann lässt sich
der Mittelwert wie folgt notieren:

1 n1 n2 nk k
ni
(n1 x1 + n2 x2 + ... + nk xk ) = · x1 + · x2 + ... + · xk =
X
· xi
N N N N i=1 N

Es ist zu beachten, dass die Quotienten ni


N
nichts anderes sind als die relativen Häufigkeiten,
mit denen die Zahlen xi auftreten.

29
Unter dem Erwartungswert µ = E(X) der Zufallsgröße versteht man den Mittelwert, der sich
nach unendlich vielen Wiederholungen ergäbe. Das heißt, wir müssen den obigen Ausdruck
im Grenzfall N → ∞ betrachten. Hierbei kann uns das Gesetz der großen Zahlen behilflich
sein: Dieses besagt, dass die relative Häufigkeit eines Ereignisses im Grenzfall unendlich vieler
Wiederholungen gegen die Wahrscheinlichkeit des Ereignisses strebt. Das bedeutet:
k k k
ni ni
µ = E(X) = lim · xi = lim ·xi = P (xi ) · xi
X X X

i=1 N i=1 | {z N}
N →∞ N →∞
i=1
P (xi )

Definition und Satz: Erwartungswert


Der Erwartungswert µ = E(X) ist der Mittelwert einer Zufallsgröße, den man nach
unendlich vielen Wiederholungen erwarten würde.
Der Erwartungswert wird berechnet, indem man die Werte xi mit ihrer Wahrscheinlichkeit
gewichtet und anschließend aufsummiert.
n
µ = E(X) = P (x1 ) · x1 + P (x2 ) · x2 + ... + P (xn ) · xn = P (xi ) · xi
X

i=1

2.3 Varianz und Standartabweichung


Es gibt Zufallsgrößen, deren Wahrscheinlichkeitsverteilungen sehr unterschiedlich sind und die
trotzdem denselben Erwartungswert haben. Betrachten wir zwei Beispiele:
xi 2 3 4 5 6 yi 2 3 4 5 6
P (xi ) 0,05 0,2 0,5 0,2 0,05 P (yi ) 0,4 0,09 0,02 0,09 0,4
P P
1 1

08 08

06 06

04 04

02 02

2 3 4 5 6 X 2 3 4 5 6 Y
Da bei beiden Verteilungen die Werte xi bzw. yi und die Wahrscheinlichkeiten symmetrisch um
den Wert 4 herum liegen, haben die Zufallsgrößen den Erwartungswert E(X) = E(Y ) = 4. Dies
lässt sich aber auch rechnerisch bestätigen:

E(X) = 2 · 0,05 + 3 · 0,2 + 4 · 0,5 + 5 · 0,2 + 6 · 0,05 = 4


E(Y ) = 2 · 0,4 + 3 · 0,09 + 4 · 0,02 + 5 · 0,09 + 6 · 0,4 = 4

Trotzdem sind die Verteilungen komplett unterschiedlich. Während bei X die Wahrscheinlich-
keit mit zunehmendem Abstand zum Erwartungswert immer kleiner wird, ist es bei Y genau

30
anders herum. Offensichtlich gibt der Erwartungswert keine Auskunft über den tatsächlichen
Verlauf der Wahrscheinlichkeitsverteilung. Insbesondere ist der Erwartungswert keines Wegs als
der am häufigsten auftretende Wert zu verstehen, wie die Verteilung Y aufzeigt.
Die abgebildeten Wahrscheinlichkeitsverteilungen unterscheiden sich hinsichtlich ihrer Streu-
ung. Bei einer Verteilung mit geringer Streuung sind die Wahrscheinlichkeiten um den Erwar-
tungswert herum konzentriert (X). Ist die Streuung groß, dann kommen die Werte weiter weg
vom Erwartungswert häufig vor (Y ).

Nun müssen wir nur noch ein Maß für die Streuung einer Verteilung finden. Wie gesehen, geht
es bei der Streuung um den Abstand (xi − µ) vom Erwartungswert. Man könnte meinen, dass
man diese Differenzen nur noch mit P (xi ) gewichten und dann aufsummieren müsste. Dies führt
jedoch nicht weit, denn für symmetrische Verteilungen würde hierbei immer Null herauskommen.
Die eine Hälfte der Klammern hätte ein negatives und die andere ein positives Vorzeichen und
wenn die entsprechenden Wahrscheinlichkeiten gleich sind, wäre die Summe stets Null. Auf diese
Weise kann man die obigen Verteilungen also nicht unterscheiden.
Letztlich müssen wir die Vorzeichen der Differenzen (xi − µ) loswerden. Hierzu quadrieren wir
sie einfach, bevor wir gewichten und aufsummieren. Die so erhaltene Größe nennt sich die
Varianz V ar(X). Um das Quadrieren gewissermaßen wieder rückgängig zu machen, zieht man
am Schluss noch die Wurzel. Hieraus ergibt sich die Standardabweichung.

Definition: Varianz und Standardabweichung


Die Varianz V ar(X) und die Standardabweichung σ sind ein Maß für die Streuung
einer Zufallsgröße X.

Man erhält die Varianz, indem man die quadrierten Abstände (xi −µ) zum Erwartungswert
mit den Wahrscheinlichkeiten von xi gewichtet und anschließend aufsummiert.

V ar(X) = (x1 − µ)2 · P (x1 ) + (x2 − µ)2 · P (x2 ) + ... + (xn − µ)2 · P (xn )
n
= (xi − µ)2 · P (xi )
X

i=1

Die Standardabweichung ist die Wurzel aus der Varianz. Sie entspricht dem mittleren
Abstand der xi vom Erwartungswert.
q
σ= V ar(X)

31
2.4 Bernoulli-Experiment und Bernoulli-Kette

Definition: Bernoulli-Experiment
Unter einem Bernoulli-Experiment versteht man ein Zufallsexperiment mit folgenden Ei-
genschaften:

1. Es gibt nur zwei mögliche Ergebnisse mit den Wahrscheinlichkeiten p und 1 − p


(„Treffer“ bzw. „nicht Treffer“).

2. Die Wahrscheinlichkeiten der Ergebnisse bleiben bei wiederholtem Durchführen des


Experiments konstant („mit Zurücklegen“).

Definition: Bernoulli-Kette
Eine Bernoulli-Kette erhält man, indem man ein Bernoulli-Experiment n mal hinterein-
ander durchführt. Die Anzahl der dabei auftretenden Treffer wird als eine Zufallsgröße X
aufgefasst. Es gelten folgende Bezeichnungen:

n: Länge der Kette/Stichprobe


p: Trefferwahrscheinlichkeit
k: Anzahl der Treffer
Pp (X = k): Wahrscheinlichkeit, dass bei einer Stichprobenlänge n
n

und Trefferwahrscheinlichkeit p genau k Treffer auftreten

Nun sehen wir uns an, wie man die Wahrscheinlichkeit Ppn (X = k) konkret berechnen kann.
Die Grundidee ist simpel: Stellen wir uns vor, die ersten k Versuche sind alle Treffer. Die Wahr-
scheinlichkeit hierfür ist pk (k Schritte im Baumdiagramm). Da wir genau k Treffer haben
wollen, müssen noch n − k Nieten folgen, also pk · (1 − p)n−k .
Schwieriger zu verstehen ist dagegen der nächste Schritt: Die k Treffer müssen nicht zwangsläufig
alle am Anfang kommen. Noch müssen sie alle nacheinander auftreten. Jede dieser Möglichkeiten
ist aber für das Ereignis X = k günstig. Da die verschiedenen Möglichkeiten gleich wahrschein-
lich sind, müssten wir nur wissen, wie viele es sind. Dann können wir den obigen Ausdruck mit
ebendieser Anzahl multiplizieren (Summe aller günstigen Pfade). Es gilt also herauszufinden,
auf wie viele Arten man die k Treffer auf n Stellen verteilen kann. Die Antwort liefern die
sogenannten Binomialkoeffizienten.

2.4.1 Binomialkoeffizienten
Wir stellen uns die Frage, auf wie viele Arten man k ununterscheidbare Objekte auf n
Stellen verteilen kann – beispielsweise drei (gleiche) Kekse auf fünf Freunde.

Für das erste Objekt hat man n Möglichkeiten der Platzierung, da noch alle Stellen frei sind.
Für das zweite Objekt hat man dann nur noch n − 1 freie Stellen, für das dritte nur noch n − 2
und so weiter. An einem Zahlenbeispiel macht man sich klar, dass es für das letzte Objekt noch
n − k + 1 freie Stellen gibt, wenn n ≥ k.
Die Gesamtzahl der Auswahlmöglichkeiten beträgt also n · (n − 1) · (n − 2) · ... · (n − k + 1). Dieses
Produkt kann man mithilfe der Fakultät (n! = 1 · 2 · ... · n für n ∈ N und 0! = 1) kompakter

32
schreiben:
n!
n · (n − 1) · (n − 2) · ... · (n − k + 1) =
(n − k)!

Das Produkt n! im Zähler geht bis zur 1 hinunter. Wenn wir aber alle Faktoren kleiner oder
gleich n − k herauskürzen, dann bleibt nur das Produkt auf der linken Seite übrig.

Leider ist das noch nicht der Wahrheit letzter Schluss, denn die k Objekte sind nach Voraus-
setzung ununterscheidbar. Das haben wir noch nicht berücksichtigt.
Betrachten wir ein konkretes Beispiel: Beim Volleyball stehen k = 5 Spieler auf dem Feld. Es
gibt aber keine feste Aufstellung, weil die Positionen ständig durchgewechselt werden. Nehmen
wir an, der Trainer hat n = 8 Spieler in seinem Kader und möchte eine (Zufalls-)Mannschaft
zusammenstellen. Die Spieler heißen Anton, Ben, Corbinian, Dominik, Emil, Ferdinand, Gustav
und Hans (ABCDEFGH).
Für die erste Position auf dem Feld hat der Trainer acht Wahlmöglichkeiten, für die zweite sie-
ben und für die fünfte nur noch vier. Nach obiger Überlegung kann er folglich 8! 3!
= 6720 Teams
zusammenstellen. Diese Wert ist aber viel zu hoch. Angenommen er hat die Spieler ABDEH
ausgewählt. Diese Auswahl hätte er auf sehr viele Arten treffen können: Er hätte die Spieler in
der genannten Reihenfolge auswählen können, oder aber in irgendeiner anderen, z.B. HABED.
Im Zahlenwert 6720 sind all diese Möglichkeiten extra aufgezählt, da wir nicht unterschieden
haben, ob der Trainer zuerst A wählt, dann B oder erste B und danach A. Da die Positionen
der Spieler aber ununterscheidbar sind (keine Aufstellung), entsteht immer das gleiche Team.
Alle Auswahlen, bei denen die Spieler ABDEH auf dem Platz sind, sind als gleich zu bewerten
und nicht extra zu zählen. HABED, BEHAD, DHBEA und so weiter müssen alle zu einer Mög-
lichkeit, dem Team ABDEH zusammengefasst werden.
Wie viele Möglichkeiten müssen wir pro fester Spielerkombination zusammenfassen? Den
Spieler A hätte der Trainer zuerst wählen können, oder als zweiten, usw. Er hätte ihn an 5
verschiedenen Stellen seines Wahlvorgangs nominieren können; den zweiten Spieler an 4 Stellen
und so weiter. Offensichtlich verteilen wir nun fünf Spieler auf fünf Stellen in der Mannschaft.
Weil n und k hier gleich sind, gibt es für den letzten Spieler nur noch eine „Position“. Die
Mannschaft ABDEH kann man also auf 5! = 120 Arten zusammenstellen. Nochmal: Diese 120
verschiedenen Wahlmöglichkeiten sind im Term 5! 8!
= 6720 extra gezählt worden!
Das eben Gesagte gilt nicht nur für die Mannschaft ABDEH, sondern auch für alle anderen
Mannschften, z.B. GFECH. Jede dieser Mannschaften ist mit 120 Auswahlvarianten im Wert
6720 vertreten. Wenn zu jeder Mannschaft 120 Varianten gehören und es insgesamt 6720 Varian-
ten gibt, dann erhalten wir die Anzahl der Mannschaften, indem wir 6720 durch 120 dividieren.
Diese Überlegung führt uns zum Binomialkoeffizien:

Definition: Binomialkoeffizient
Der Binomialkoeffizient
n
 
n!
= „k aus n“
k (n − k)! · k!

gibt an, auf wie viele Arten man k ununterscheidbare Objekte auf n Stellen verteilen
kann.
Er kann mithilfe des Taschenrechners berechnet werden: n + nCr + k

33
2.4.2 Wahrscheinlichkeit der Bernoulli-Kette
Mithilfe der Binomialkoeffizienten können wir nun einen allgemeinen Ausdruck für die Wahr-
scheinlichkeit einer Bernoulli-Kette angeben. Wohl gemerkt, die einzige offene Fragewar
 bisher,
k
auf wie viele Arten man k Treffer auf n Stellen verteilen kann. Mit dieser Anzahl müssen
n
wir den Ausdruck pk · (1 − p)n−k multiplizieren, denn so viele Pfade führen zum Ereignis X = k.

Satz: Wahrscheinlichkeit der Bernoulli-Kette


Für die Wahrscheinlichkeit einer Bernoulli-Kette der Länge n und mit Trefferwahrschein-
lichkeit p gilt:
n
 
B(n; p; k) = Ppn (X = k) = p · (1 − p)
k n−k
·
k

2.5 Binomialverteilung

Definition: Binomialverteilung
Eine Wahrscheinlichkeitsverteilung, deren Wahrscheinlichkeiten sich aus Bernoulli-Ketten
ergeben, heißt Binomialverteilung. Demnach gilt für eine Binomialverteilung:
n
 
pk = B(n; p; k) = pk · (1 − p)n−k ·
k

Satz: Eigenschaften der Binomialverteilung


• Die Binomialverteilung ist wie jede andere Wahrscheinlichkeitsverteilung normiert:
n
B(n; p; k) = 1
X

k=0

• Für eine binomial verteilte Zufallsgröße X gilt:

Erwartungswert: E(X) = np
Varianz: V ar(X) = np(1 − p)
q
Standartabweichung: σ= np(1 − p)

2.5.1 Kumulative Binomialverteilung


Wenn man beispielsweise P0,2 1
00(X ≤ 30) händisch oder mit dem Taschenrechner berechnen
möchte, so muss man die Bernoulli-Ketten für k = 0,1, ...,30 aufsummieren. Um diesen Re-
chenaufwand zu umgehen, gibt es im stochastischen Tabellenwerk die sogenannte kumulative
Binomialverteilung F (n; p; k).

34
Definition: kumulative Binomialverteilung
Bei der kumulativen Binomialverteilung F (n; p; k) werden alle Bernoulli-Ketten B(n; p; i)
für i ≤ k aufsummiert:
k
F (n; p; k) = Ppn (X ≤ k) =
X
B(n; p; i)
i=0

k steht für die maximale Trefferanzahl, bis zu aufsummiert wird. Erhöht man
k, so kommen mehr (positive) Summanden hinzu. Bezogen auf k ist die kumulative
Binomialverteilung somit streng monoton wachsend.
Das folgende Beispiel stellt die nicht-kumulative und die kumulative Binomialverteilung
für n = 5 und p = 0,2 gegenüber:

k 0 1 2 3 4 5 k 0 1 2 3 4 5
B(k) 0,33 0,41 0,20 0,05 0,01 ≈0 F (k) 0,33 0,74 0,94 0,99 ≈1 1

B F
1 1

08 08

06 06

04 04

02 02

1 2 3 4 5 k 1 2 3 4 5 k

2.5.2 *Beweis zu den Eigenschaften der Binomialverteilung


Wenn man ein Binom (Summe aus zwei Summanden) mit einer natürlichen Zahl n potenziert,
multipliziert man der Reihe nach jeden Summanden aus der ersten Klammer mit jedem Sum-
manden aus den anderen Klammern. Betrachten wir das Beispiel n = 4:

(a + b)4 = (a + b)(a + b)(a + b)(a + b)

Den Term a3 b kann man auf die zwei abgebildeten Wege erhalten, nämlich a · a · a · b und
a · a · b · a. Ebenso sind die Wege a · b · a · a oder b · a · a · a möglich. Diese Anzahl kann man
als einen Binomialkoeffizient ausdrücken, denn letztlich verteilen wir 3 Treffer (z.B. a) auf 4
4
Stellen, und dafür gibt es = 4 Möglichkeiten. Im ausmultiplizierten Term taucht a3 b also
3
vier mal auf, weshalb sich ebendieser Vorfaktor ergibt. Vergleiche hierzu die Binomische Formel
(a + b)2 : Der Term ab taucht zwei mal auf, weil wir einen Treffer auf zwei Stellen verteilen (ab
oder ba). Die einzelnen Vorfaktoren eines Binoms ergeben sich immer aus dem entsprechenden
10
 
Binomialkoeffizient, daher auch der Name. Für n = 10 taucht der Term a b genau 7 3
= 120
7

35
mal auf. (a + b)10 ist daher ... + 120a7 b3 + ....
Ich hoffe an dieser Stelle wird klar, wie wertvoll diese Erkenntnis ist! Wie lange hätten Sie
gebraucht um (a + b)10 auszumultiplizieren und die gleichartigen Terme zusammenzufassen?
Allgemein lässt sich also feststellen:
 n 
n 0 n n 1 n−1 n 2 n−2
 
n n 0
 
(a + b) =
n
ab + ab + ab + ... + a b +
n−1 1
a b
0 1 2 n−1 n
Durch die Summenschreibweise wird das ganze kompakter:
n n
(a + b)n = ak bn−k
X

k=0 k

Mithilfe dieser wichtigen Identität lässt sich unmittelbar beweisen, dass die Binomialverteilung
normiert ist. Es muss dazu gezeigt werden, dass die Summe aller Wahrscheinlichkeiten von k = 0
bis k = n gleich 1 ergibt. Hierzu verwenden wir die obige Formel von rechts nach links mit a = p
und b = 1 − p:
n n n
B(n; p; k) = pk (1 − p)n−k = [p + (1 − p)]n = 1n = 1
X X

k=0 k=0 k

Auf ähnliche Art lassen sich die Formeln für den Erwartungswert und die Varianz der Binomi-
alverteilung nachweisen. Zu berechnen sind die Ausdrücke
n n
n k  
E(X) = k · B(n; p; k) = p (1 − p)n−k = ... = np
X X

k=0 k=0 k
n n n k
 
V ar(X) = (E(X) − k) · B(n; p; k) =
2
(np − k)2
p (1 − p)n−k = ... = np(1 − p)
X X

k=0 k=0 k

Für diese Rechnungen benötigt man jedoch noch einige geschickte Umformungen, auf die hier
nicht näher eingegangen werden soll.

2.6 Testen von Hypothesen


Im Jahrgang 2021 nicht abiturrelevant.

36
3 Geometrie II
3.1 Geraden
Definition: Geraden im Raum
Sei X ein beliebiger Punkt auf einer Geraden g. Dann kann man den Ortsvektor X
~ durch
eine Vektorkette darstellen:

g:X
~ =A
~ + λ~u mit λ ∈ R Vektorform der Gerade g

Hierbei bezeichnet A ∈ g den Aufpunkt der Gerade und ~u bezeichnet den Richtungs-
vektor der Gerade. Durch den Parameter λ ∈ R lässt sich der Richtungsvektor beliebig
skalieren, sodass man jeden einzelnen Punkt auf der Geraden erreichen kann. Z.B.:
x2 ~1
X
~u g
X~2 A

~1 = A
X ~ + 2~u (λ = 2)
~2 = A
X ~ − 0,5~u (λ = −0,5)

O x1

Für Aufpunkt A und Richtungsvektor ~u gilt:

• A ist ein beliebiger, frei wählbarer Punkt auf g.

• Die Richtung von u wird durch die Richtung der Gerade bestimmt. Die Länge von
u ist frei wählbar. Falls die Gerade g durch zwei Punkte A und B gegeben ist, ist
−→ ~
es zweckmäßig ~u = AB = B −A~ zu setzen.

3.2 Gegenseitige Lage zweier Geraden


In der Ebene gibt es drei Möglichkeiten, wie zwei Geraden zueinander orientiert sind: Sie können
alle Punkte gemeinsam haben (identische Geraden), sie können sich in einem Punkt schneiden,
oder sie sind echt parallel und haben keinen Schnittpunkt. Sobald zwei Geraden in einer Ebene
nicht parallel zueinander sind, haben sie auch einen Schnittpunkt. Im dreidimensionalen Raum
trifft diese Aussage nicht zu: Wenn sich zwei nicht parallele Geraden im Raum nicht schneiden,
dann nennt man die Geraden windschief zueinander. Betrachten wir zwei Geraden g und h
mit Aufpunkten A ~ und B ~ und Richtungsvektoren ~u und ~v .

g:X
~ =A
~ + λ~u h:X
~ =B
~ + µ~v

Bezeichnung Orientierung Anz. der Schnittpunkte


gewöhnlicher Schnittpunkt ~u ∦ ~v 1
windschief ~u ∦ ~v 0
echt parallel ~u k ~v und A ∈ /h 0
identisch ~u k ~v und A ∈ h ∞

37
3.3 Linear unabhängige Vektoren

Definition: Lineare Unabhängigkeit


Eine Menge von Vektoren {v~1 ; v~2 ; ...; v~n } nennt man linear unabhängig, wenn das
Gleichungssystem
3 Gleichungen;
a1 v~1 + a2 v~2 + ... + an v~n = ~0 für jede Komponente eine
| {z }
Linearkombination

nur die triviale Lösung (a1 ; a2 ; ...; an ) = (0; 0; ...; 0) besitzt. Wenn es eine nicht-triviale
Lösung gibt, bei der mindestens einer der Koeffizienten a1 bis an ungleich Null ist, dann
sind die Vektoren linear abhängig.

lin. unabhängig alle ai müssen Null sein Es gibt nur die triviale Lösung
lin. abhängig mind. ein ai kann ungleich Es gibt eine nicht-triviale Lösung
Null gewählt werden

• Die triviale Lösung existiert immer - unabhängig von den Vektoren v~1 bis v~n . Darum
geht es aber nicht. Entscheidend ist, ob noch eine weitere, nicht-triviale Lösung
existiert.

• Sobald einer der Vektoren v~1 bis v~n der Nullvektor ist, sind die Vektoren linear
abhängig. In diesem Fall lässt sich nämlich immer eine nicht-triviale Lösung finden.
Sei z.B. v~3 = ~0, dann ist 0 · v~1 + 0 · v~2 + a3 v~3 + 0 · v~4 + ... + 0 · v~n = ~0 für alle
beliebigen a3 ∈ R erfüllt. Das Gleichungssystem hat somit die nicht-triviale Lösung
(0; 0; 1; 0; ...; 0), wobei hier willkürlich a3 = 1 gewählt wurde.

Geometrisch liegt genau dann lineare Abhängigkeit vor, wenn es eine nicht-triviale Linearkom-
bination gibt, die als Ergebnis den Nullvektor liefert - sprich, wenn sich die Vektoren so an
einander reihen lassen, dass man wieder am Ausgangspunkt ankommt. Durch die Wahl der Ko-
effizienten a1 , a2 , ..., an können die Vektoren zuvor auf die passende Länge gebracht oder deren
Richtung umgekehrt werden.

3.3.1 Geometrische Deutung für zwei Vektoren


v~1 v~2

v~2

Diese Vektoren sind nicht linear unabhängig. Wenn man v~2 beliebig streckt und an v~1 dranhängt,
dann kann man ausschließlich die Punkte auf der gestrichelten Gerade (X ~ = v~1 + a2 v~2 ; a2 ∈ R)
erreichen. In keinem Fall kommt man wieder zum Ausgangspunkt, also dem Fuß von v~1 zurück.
Die einzige Möglichkeit wieder dorthin zurückzukommen ist, wenn man beide Vektoren auf die
Länge 0 schrumpft, also die triviale Linearkombination 0 · v~1 + 0 · v~2 bildet. Es gibt keine Mög-
lichkeit, bei der entweder a1 oder a2 ungleich Null gewählt werde könnten. Da die Gleichung
a1 v~1 + a2 v~2 = ~0 somit nur die triviale Lösung a1 = 0 und a2 = 0 besitzt, sind v~1 und v~2 linear
abhängig.

38
Wie das willkürlich gewählte Beispiel zeigt, gilt dieser Sachverhalt für alle Paare von Vektoren,
die nicht parallel (kollinear) zu einander sind. Genauer gilt folgender Satz:

Satz: Lineare (Un)abhängigkeit zweier Vektoren


Zwei Vektoren v~1 , v~2 6= ~0 sind genau dann linear abhängig, wenn sie kollinear sind. Im
Umkehrschluss sind sie genau dann linear unabhängig, wenn sie nicht kollinear sind.

Bemerkung: Kollinear = ˆ „auf einer Linie“. Die Abgrenzung zur Parallelität ist nötig, da Vek-
toren keine Lage im Raum haben und daher nicht im klassischen Sinne parallel sein können.

Beweis:
„Genau dann“ heißt, dass beide Richtungen gezeigt werden müssen - also abhängig ⇒ kollinear
und kollinear ⇒ abhängig.

1. linear abhängig ⇒ kollinear:


Wenn v~1 und v~2 linear abhängig sind, dann gibt es Koeffizienten a1 und a2 mit a1 v~1 +a2 v~2 =
~0, wobei mindestens einer der Koeffizienten nicht Null ist (nicht-triviale Lösung). Nehmen
wir an a1 ist ungleich Null. Dann ist es möglich durch a1 zu teilen:

a1 v~1 + a2 v~2 = ~0
a1 v~1 = −a2~v2
v~1 = − aa12 v~2
| {z }
λ

v~1 ist somit ein Vielfaches von v~2 und die Vektoren sind kollinear.

2. kollinear ⇒ linear abhängig:


Wenn die Vektoren kollinear sind, dann ist ein Vektor ein Vielfaches des anderen. Es gibt
somit ein λ ∈ R \ 0, sodass v~2 = λ · v~1 . Durch Umstellen erhält man

(−λ) · v~1 + 1 · v~2 = ~0.


| {z }
nicht-triviale Linearkombination

Das Gleichungssystem a1 v~1 + a2 v~2 = ~0 hat somit die nicht-triviale Lösung (−λ; 1). Die
Vektoren sind daher linear abhängig.

3.3.2 Geometrische Deutung für drei Vektoren

Satz: Lineare (Un)abhängigkeit dreier Vektoren


Drei Vektoren v~1 , v~2 , v~3 6= ~0 sind genau dann linear abhängig, wenn sie parallel zu einer
Ebene liegen (komplanar).
Sie sind linear unabhängig, wenn sie nicht in einer gemeinsamen Ebene liegen. In diesem
Fall spannen sie einen Spat auf, sodass das Spatprodukt nicht Null ist:

(v~1 × v~2 ) ◦ v~3 6= 0

39
Diesen Sachverhalt macht man sich am besten anschaulich klar. Wenn die Vektoren nämlich in
einer Ebene liegen, dann lässt sich immer eine nicht-triviale Nullsumme finden:

P v~1 v~2
v~3
v~2
O

Unser Ziel ist wohlgemerkt, durch geschicktes Skalieren und Aneinanderreihen der Vektoren
wieder zum Ursprung O zurück zu gelangen. Setzten wir zunächst ein Vielfaches von v~2 an die
Spitze von v~1 . Hiermit können wir alle Punkte auf der horizontalen, gestrichelten Gerade errei-
chen. Von diesen Punkten aus dürfen wir jetzt noch beliebig lange in Richtung von v~3 gehen.
Zeichnet man sich die Wirkungslinie von v~3 durch den Ursprung ein, dann sagt uns der Schnitt-
punkt der gestrichelten Geraden (P ), bis zu welchem Punkt wir im ersten Schritt gehen müssen,
d.h. welche Skalierung wir für v~2 wählen sollten. Fassen wir von Anfang an zusammen: Zuerst
gehen wir in Richtung v~1 (Länge 1), dann müssen wir in die Gegenrichtung von v~2 (Skalierung
−1), was uns zum Punkt P führt. Von dort aus gehen wir noch in die Gegenrichtung von v~3 ,
nur mit doppelter Länge (Skalierung −2). So landen wir nach einer kurzen Rundreise wieder im
Ursprung. Folglich haben wir eine nicht triviale Nullsumme gefunden:
P −v~2
−2v~3 v~1
1 · v~1 + (−1) · v~2 + (−2) · v~3 = ~0 v~2
O
Die Vektoren sind somit linear abhängig.

Das einzige Problem könnte sich ergeben, wenn zwei der drei Vektoren kollinear sind. Nehmen
wir an, v~3 hätte die gleiche Wirkungslinie wie v~2 . Dann wäre man mit obiger Taktik auf der
horizontalen Geraden gefangen und käme nicht zum Ursprung zurück.

v~3 v~1 v~2

v~3 v~2
O

In diesem Fall muss man lediglich die Taktik wechseln: Für die beiden kollinearen Vektoren gibt
es eine nicht-triviale Nullsumme - sie können sich gegenseitig aufheben. Die entsprechenden
Vorfaktoren sind schon mal ungleich Null. Nun hindert uns aber nichts daran, den Vorfaktor
von v~1 gleich Null zu setzten. Für lineare Abhängigkeit reicht es ja aus, wenn mindestens ein
Vorfaktor ungleich Null ist. Es müssen also nicht alle gleich Null sein. Im konkreten Beispiel ist
v~2 drei mal so lange wie v~3 . Eine nicht-triviale Nullsumme wäre dann

0 · v~1 + 1 · v~2 + 4 · v~3 = ~0

Wenn alle drei Vektoren kollinear wären, dann könnte man genau so vorgehen: Zwei Vektoren
lässt man sich gegenseitig aufheben und den dritten schrumpft man auf die Länge Null.

40
3.4 Ebenen
Während man zur Beschreibung einer Geraden einen Aufpunkt und nur einen Richtungsvektor
benötigt, braucht man zur Beschreibung von Ebenen zwei Richtungsvektoren.

41
3.5 Abstandsbetrachtungen
Unter dem Abstand zweier Objekte versteht man die Länge der kürzesten Verbindungsstrecke
der beiden Objekte. Die kürzeste Verbindungsstrecke zeichnet sich dadurch aus, dass sie senk-
recht auf die betrachteten Objekte steht, also ein Lot ist.

3.5.1 Abstand Punkt-Gerade


Gegeben ist eine Gerade g mit Richtungsvektor ~u und ein Punkt P ∈
/ g. Um den Abstand d(P ; g)
zu bestimmen, müssen wir ein Lot von P auf g fällen. Dazu untersuchen wir alle möglichen
Vektoren P~X, die von P auf einen Punkt der Geraden zeigen und finden heraus, welcher dieser
Vektoren senkrecht auf g und somit senkrecht auf ~u steht. Wenn die Gerade den Aufpunkt A
besitzt, dann muss für das Lot gelten:
−−→
P X ⊥ ~u
(X~ − P~ ) ◦ ~u = 0
(A
~ + λ~u − P~ ) ◦ ~u = 0

Dies ist eine Bestimmungsgleichung für λ; und zwar das λ, dass zum Lotfußpunkt L führt.
Konkret erhalten wir L, indem wir λ in die Geradengleichung einsetzen. Der Abstand ergibt
sich dann aus der Länge des Lots.

Verfahren: Abstand Punkt-Gerade


−−→
1. Finde heraus, welcher Verbindungsvektor P X senkrecht auf ~u steht, indem du
folgende Gleichung nach λ auflöst:
g

~
X
−−→ −−→
P X ⊥ ~u PX

(X~ − P~ ) ◦ ~u = 0
(A
~ + λ~u − P~ ) ◦ ~u = 0 Lotfußpunkt L
~ P~

2. Setze λ in g ein, um den Lotfußpunkt L zu erhalten.


−→
3. d(P, g) = |P L|

3.5.2 Abstand Punkt-Ebene – Die Hesse’sche Normalenform


Gegeben ist eine Ebene E in Normalenform und ein Punkt P ∈ / E. Auch in diesem Fall muss
ein Lot von P auf das Objekt, also die Ebene gefällt werden. Eine Möglichkeit wäre, eine zu
E senkrechte Gerade durch P aufzustellen (~u = ~n) und den Schnittpunkt der Geraden mit der
Ebene zu bestimmen. Mit der Hesse’schen Normalenform der Ebene geht es aber einfacher.

42
Definition und Satz: Hesse’sche Normalenform
Die Hesse’sche Normalenform einer Ebene eignet sich, um den Abstand der Ebene zu
beliebigen Punkten quasi direkt ablesen zu können. Man erhält sie, indem man die
Ebenengleichung normiert, d.h. durch den Betrag des Normalvektors dividiert. In den
zwei Darstellungsformen bedeutet das konkret:

E: ~n ◦ (X ~ =0
~ − A)
E: n1 x1 + n2 x2 + n3 x3 − c = 0
~n
1 EH : ◦ (X ~ =0
~ − A)
EH : (n1 x1 + n2 x2 + n3 x3 − c) = 0 |~n|
|~n|
EH : ~n0 ◦ (X ~ =0
~ − A)

Dabei bezeichnet ~n0 den Einheitsvektor in Richtung ~n. Diese Gleichungen definieren alle
Punkte der Ebene, d.h. wenn man ein X ~ ∈ E auf der linken Seite einsetzt, dann kommt
tatsächlich Null heraus. Wenn man dagegen einen Punkt P ∈ / E einsetzt, kommt ein
anderer Zahlenwert ungleich Null heraus, sodass die Gleichung nicht erfüllt ist.
Im Falle der Hesse’schen Normalenform entspricht der Betrag dieses Zahlenwerts genau
dem Abstand zwischen E und P :
1


d(E, P ) =
(p1 x1 + p2 x2 + p3 x3 − c) d(E, P ) = ~n0 ◦ (P~ − A)
~
|~
n|


Wenn das Vorzeichen des Zahlenwerts positiv ist, dann liegt P auf der Seite der Ebene, in
die auch der Normalenvektor zeigt. Andernfalls liegt P auf der entgegengesetzten Seite.

Begründung:
Letztlich kann man diese Aussage durch einfache Trigonometrie verstehen. Das Skalarprodukt
können wir mithilfe des Kosinus umschreiben:

~n0 ◦ (X ~ cos ϕ = |−
~ = |~n0 | ·|P~ − A|
~ − A) →
AP | cos ϕ
|{z}
=1

−→
Hierbei bezeichnet ϕ den Winkel zwischen AP und ~n0 . Anhand der Skizze wird klar, dass AP
die Hypotenuse im rechtwinkligen Dreieck ALP ist. Der obige Ausdruck berechnet daher die
Ankathete, also d = LP . Dies funktioniert jedoch nur, wenn der Normalenvektor die Länge 1
hat. Deshalb müssen wir zunächst die Gleichung bzw. den Normalenvektor normieren, also die
Hesse’sche Normalenform bilden.

−→
AP
ϕ
P
ϕ

~n0
L
A

43
3.5.3 Abstand windschiefer Geraden (nicht im Abi 2021)

Verfahren: Abstand windschiefer Geraden


Seien die Geraden gegeben durch

g:X
~g = A
~ + λ~u, λ ∈ R h:X
~h = B
~ + µ~v , µ ∈ R.

Die kürzeste Verbindungsstrecke zwischen windschiefen Geraden steht senkrecht auf bei-
den Geraden.

1. Löse das Gleichungssystem nach λ und µ auf:


−−−→
I: Xg Xh ◦ ~u = 0
−−−→
II : Xg Xh ◦ ~v = 0

2. Setze λ und µ in die zugehörigen Geradengleichungen ein, um die Lotfußpunkte Lg


und Lh zu erhalten.
−−−→
3. d(g, h) = |L1 L2 |

3.5.4 Abstand paralleler Geraden und Ebenen

Wähle einen beliebigen Punkt P auf g1 bzw. E1 und bestimme d(P, g2 ) bzw. d(P, E2 ).

3.6 Symmetrie und Spiegelungen

Verfahren: Spiegelung an den Koordinatenebenen (Vektoren und Punkte)


Kehre das Vorzeichen derjenigen Koordinate um, die nicht im Namen der Ebene enthalten
ist (bzw. in die der Normalenvektor der Ebene zeigt).

Objekt Spiegelebene ~n Spiegelbild


0
 
P (−1 | 3 | 2) x1 -x3 -E. ~e2 = 1 P ∗ (−1 | −3 | 2)
0
5 1 −5
     
~v = −1 x2 -x3 -E. ~e1 = 0 ~v = −1

2 0 2

44
Verfahren: Spiegelung an den Koordinatenachsen (Vektoren und Punkte)
Kehre das Vorzeichen aller Koordinaten um, die nicht im Namen der Achse enthalten
sind (bzw. deren Achsen senkrecht zur Spiegelachse stehen).

Objekt Spiegelachse Spiegelbild


P (−1 | 3 | 2) x1 -A. P ∗ (1 | −3 | −2)
5 −5
   
~v = −1 x3 -A. ~v ∗ = +1
2 2
Begründung: Jede Koordinatenachse ist in genau zwei Koordinatenebenen enthalten.
Die Spiegelung an einer Koordinatenachse ist äquivalent zur Spiegelung an diesen beiden
Ebenen hintereinander (vgl. Punktspiegelung = 2 Achsenspiegelungen in 2D).

Verfahren: Spiegelung an einer Ebene


Gegeben ist ein Punkt P und einer Ebene E mit Normalenvektor ~n.

1. Erstelle eine Lotgerade l zu E durch den Punkt P :

l:X
~ = P~ + λ · ~n, λ ∈ R

2. Berechne den Schnittpunkt von l und E (→ Lotfußpunkt L).

3. Der Spiegelpunkt ergibt sich aus den Vektorketten


−→ ~ +−→
P~ ∗ = P~ + 2 · P L oder P~ ∗ = L PL

Alternativ: Setze gleich das Doppelte von λ aus Schritt 2. in die Geradengleichung
ein, um P ∗ zu erhalten (L nicht zwingend notwendig).

Verfahren: Spiegelung an einer Geraden


Gegeben ist ein Punkt P und eine Gerade g mit Richtungsvektor ~u.
−−→ !
1. Ermittle den Fußpunkt des Lots von P auf g durch Lösen der Gleichung P Xg ◦~u = 0.

2. Der Spiegelpunkt ergibt sich aus den Vektorketten


−→ ~ +−→
P~ ∗ = P~ + 2 · P L oder P~ ∗ = L PL

Achtung: Das Verdoppeln von λ aus Schritt 2. funktioniert hier nicht, da λ die Position
von L auf der Geraden beschreibt und nicht wie man von P nach L kommt.

45

Das könnte Ihnen auch gefallen