C. Weindorf
29. April 2021
Inhaltsverzeichnis
1 Integralrechnung 3
1.1 Flächenberechnung mithilfe der Unter- und Obersumme . . . . . . . . . . . . . . 3
1.1.1 Die Obersumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Die Untersumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Berechnung von Unter- und Obersumme . . . . . . . . . . . . . . . . . . 4
1.1.4 Grenzwert von Unter- und Obersumme . . . . . . . . . . . . . . . . . . . 6
1.2 Das Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Das Integral als Flächenbilanz . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Die Integralfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Der Hauptsatz der Differential- und Integralrechnung (HDI) . . . . . . . . . . . 14
1.4.1 Berechnung bestimmter Integrale mithilfe des HDI . . . . . . . . . . . . 15
1.4.2 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Wichtige unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . 16
1.5 Das uneigentliche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1 Unbeschränkter Integrationsbereich (uneigentliches Integral erster Ordnung) 17
1.5.2 Integration über eine Singularität (uneigentliches Integral zweiter Ordnung) 18
1.6 Von mehreren Graphen berandete Flächen . . . . . . . . . . . . . . . . . . . . . 19
1.7 *Die partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.8 Anwendungen der Differential- und Integralrechnung . . . . . . . . . . . . . . . 24
1.8.1 Anwendungen der Differentialrechnung . . . . . . . . . . . . . . . . . . . 24
1.8.2 Anwendungen der Integralrechnung . . . . . . . . . . . . . . . . . . . . . 25
1.8.3 Beipiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2 Stochastik II 29
2.1 Zufallsgröße und Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . 29
2.2 Erwartungswert einer Zufallsgröße . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 Varianz und Standartabweichung . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Bernoulli-Experiment und Bernoulli-Kette . . . . . . . . . . . . . . . . . . . . . 32
2.4.1 Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.2 Wahrscheinlichkeit der Bernoulli-Kette . . . . . . . . . . . . . . . . . . . 34
2.5 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.1 Kumulative Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.2 *Beweis zu den Eigenschaften der Binomialverteilung . . . . . . . . . . . 35
2.6 Testen von Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 Geometrie II 37
3.1 Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Gegenseitige Lage zweier Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1
3.3 Linear unabhängige Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Geometrische Deutung für zwei Vektoren . . . . . . . . . . . . . . . . . . 38
3.3.2 Geometrische Deutung für drei Vektoren . . . . . . . . . . . . . . . . . . 39
3.4 Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.5 Abstandsbetrachtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5.1 Abstand Punkt-Gerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5.2 Abstand Punkt-Ebene – Die Hesse’sche Normalenform . . . . . . . . . . 42
3.5.3 Abstand windschiefer Geraden (nicht im Abi 2021) . . . . . . . . . . . . 44
3.5.4 Abstand paralleler Geraden und Ebenen . . . . . . . . . . . . . . . . . . 44
3.6 Symmetrie und Spiegelungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2
1 Integralrechnung
Die Integralrechnung ist das Gegenstück zur Differentialrechnung. Neben den zahlreichen inner-
mathematischen Anwendungen ist sie enorm wichtig für die naturwissenschaftlichen Disziplinen.
Insbesondere die Physik wäre ohne die Integralrechnung nicht denkbar, da sie es z.B. ermöglicht,
auch zeitlich nicht konstante Systeme quantitativ zu untersuchen und vorhersagen zu treffen.
−2 −1 1 2 x
Dies scheint auf den ersten Blick keine leichte Aufgabe, da die bekannten Flächenformeln – mit
Ausnahme der Kreisformel – allesamt geradlinig begrenzte Flächen voraussetzen. Aber genau aus
diesem Gedanken rührt die folgende, auf Riemann zurückgehende Idee her: Wie approximieren
(annähern) die gesuchte Fläche durch eine gewisse Anzahl von Rechtecken. Dies kann man
natürlich auf viele verschiedene Arten tun, doch es haben sich zwei Arten als besonders günstig
erwiesen – die sogenannten Ober- und Untersummen.
−2 −1 1 2 x
3
In obiger Skizze wurde die Fläche in vier Streifen unterteilt. Jeder dieser Streifen hat folglich
die Breite ∆x = 42 . Da der Graph in [0; 2] monoton steigend ist, ergibt sich die Höhe aus dem
Funktionswert am rechten Rand des jeweiligen Streifens. Der Wert der Obersumme O4 ist
daher:
O4 = ∆x · h0 + ∆x · h1 + ∆x · h2 + ∆x · h3
h i
= ∆x · f (0,5) + f (1) + f (1,5) + f (2)
h i
= 0,5 · 0,25 + 1 + 2,25 + 4 = 3,75
−2 −1 1 2 x
Das Intervall [0; 2] wurde wieder in vier Streifen unterteilt. Der erste Streifen hat wegen f (0) = 0
lediglich die Höhe Null, weshalb er nicht sichtbar ist. Den Wert der Untersumme U4 können
wir wie folgt berechnen:
h i
U4 = ∆x · f (0) + f (1) + f (0,5) + f (1,5)
h i
= 0,5 · 0 + 0,25 + 1 + 2,25 = 1,75
4
y y
4 4
2 2
−2 −1 1 2 x −2 −1 1 2 x
Nun sind die Streifen lediglich 20
2
= 0,1 Längeneinheiten breit. Änderungen im Verlauf von Gf
können somit deutlich besser berücksichtigt werden. Das hat zur Folge, dass die Ober- und
Untersummen O20 bzw. U20 die Fläche um einiges besser approximieren. Auch deren Differenz
wird sich verringern, sodass wir den tatsächlichen Wert sehr viel besser eingrenzen können.
Der Preis ist jedoch, dass man im Verglich zu O4 bzw. U4 nicht nur vier Summanden aufaddie-
ren muss, sondern 20. Für die Obersumme brauchen wir wieder die Funktionswert am rechten
Rand. Die Höhe des ersten Streifens ist deshalb f (0,1). Der letzte Streifen hat die Höhe f (2)
h i
O20 = 0,1 · f (0,1) + f (0,2) + f (0,3) + ... + f (1,9) + f (2) = 2,47
Bei der Untersumme beginnen wir mit der Höhe f (0) und enden mit f (1,9). Die Höhen sind
gegenüber der Obersumme um eine Streifenbreite nach links verschoben.
h i
U20 = 0,1 · f (0) + f (0,1) + f (0,2) + ... + f (1,8) + f (1,9) = 2,87
Man sieht, dass die Ergebnisse schon deutlich näher beisammen liegen. Der tatsächliche Wert
muss somit zwischen 2,47 und 2,87 liegen.
Wenn wir es noch genauer wissen wollen, müssen wir „nur“ die Anzahl der Streifen erhöhen.
Das impliziert aber einen immensen Rechenaufwand. Natürlich kann mit dem Computer auch
Summen mit vielen Tausend Summanden in Sekundenschnelle berechnen. Sie müssen dem Com-
puter aber sagen, was er berechnen soll, und wenn Sie die Summe wie oben händisch eintippen,
haben Sie letztlich nichts gewonnen. Deshalb sehen wir uns jetzt an, wie man die Berechnung
von O20 und U20 in der Programmiersprache Python umsetzten könnte. Dazu benutzen wir eine
sogenannte for-Schleife. Bei einer Schleife wird ein festgelegter Parameter (hier k) von einem
Startwert schrittweise um eins erhöht, bis er den Endwert erreicht hat. In jeder dieser Iteratio-
nen erfolgt eine Berechnung, in welcher der aktuelle Wert von k einfließen kann. Der Code für
die Untersumme lautet wie folgt. Die Grünen Passagen sind Kommentare und gehören nicht
zum Code.
def f(x): ’’’Funktion f gibt das Quadrat von x aus ("**"="hoch")’’’
return(x**2)
b = 2 ’’’Obere Grenze des Intervalls, untere ist fest bei 0’’’
n = 20 ’’’Anzahl der Streifen’’’
deltaX = b/n ’’’Streifenbreite deltaX = Intervalllaenge/n’’’
Summe = 0 ’’’Variable, die am Ende zur Untersumme wird’’’
for k in range(0,n): ’’’Beginn der Schleife; range(0,n) = {0;1;2;...;n-1}’’’
Summe = Summe + deltaX * f( deltaX * k )
print("Untersumme = "+ str(Summe)) ’’’Ausgabe des Ergebnisses’’’
5
Die eigentliche Berechnung erfolgt innerhalb der for-Schleife in der Zeile
Summe = Summe + deltaX * f( deltaX * k ).
Diese zugegebenermaßen unmathematische Schreibweise bedeutet folgendes: Der neue Wert der
Variable Summe ist der alte Wert + deltaX*f(deltaX*k). Dabei ist deltaX*f(deltaX*k) nichts
anderes als der Flächeninhalt des k-ten Streifens: deltaX ist die Breite und weil sich der linke
Rand bei deltaX*k befindet ist f(deltaX*k) die zugehörige Höhe.
Der Code für die Obersumme unterscheidet sich nur an einer Stelle: Für die Höhe müssen wir
f nicht mehr am linken, sondern am rechten Rand des Streifens auswerten. Der rechte Rand
des 0-ten Streifens ist bei deltaX. Beim ersten und zweiten ist er bei deltaX*2 bzw. deltaX*3.
Der rechte Rand des k-ten Streifens ist somit bei deltaX*(k+1).
Summe = 0
for k in range(0,n):
Summe = Summe + deltaX * f( deltaX * (k+1) )
print("Obersumme = "+ str(Summe))
Fühlen Sie sich aufgefordert auf die Seite https://repl.it/languages/python3 zu gehen und den
Code selbst auszuprobieren (Ins mittlere Feld eintippen und anschließend auf „Run“). Hierbei
können Sie alles mögliche Verändern: Das Intervall, die Anzahl der Streifen und sogar eine ande-
re Funktion eintippen. Diese muss jedoch im Intervall [0; b] monoton wachsend sein. Falls sie eine
e-Fumktion verwenden wollen, müssen Sie from math import e in der ersten Zeile ergänzen.
Wenn Sie beide Codes untereinander eintippen, dann werden beide Summen für die eingestellten
Parameter berechnet und ausgegeben. Beobachten Sie, wie sich diese insbesondere mit steigen-
dem n verändern.
Beispiel 1
Als erstes Beispiel wählen wir eine einfache Funktion, z.B. die Gerade mit f (x) = 0,5x + 1, und
bestimmen den exakten Wert des Flächeninhalts unter dem Graphen im Intervall [0,2].
6
y
4
−2 −1 1 2 x
Die Wahl einer so einfachen Funktion hat zwei Vorteile: Einerseits ist die Rechnung einfacher
als bei der Parabel und andererseits können wir das exakte Ergebnis mit elementarer Geometrie
(z.B. Trapezformel) berechnen: A = 12 (2 + 1) · 2 = 3. Hierdurch lässt sich das folgende Grenz-
wertverfahren überprüfen.
Wir zerlegen die Fläche nun in Gedanken in n Streifen. Dann ist jeder Streifen ∆x = n2 Län-
geneinheiten breit. Der linke Rand des k-ten Streifens (Zählung beginnt bei k = 0) ist dann bei
∆x · k, sodass die zugehörige Höhe f (∆x · k) beträgt. Wenn wir bei Null beginnen, dann hat
der letzte Streifen den Index k = (n − 1). Mithilfe des Summenzeichens ergibt sich:
n−1 n−1 n−1
Un = | {z· k} ) =
∆x · f ( ∆x ·k = · 0,5 · ·k+1
X X X
2 2 2 2
|{z} n
·f n n n
k=0 Breite linker Rand k=0 k=0
| {z }
Höhe
n−1
X n−1 n−1
= ·k+ = ·k+
X X
2 2 2 2
n2 n n2 n
k=0 k=0 k=0
Die zweite Summe enthält kein k im Argument, das heißt es wird immer der gleiche Wert 2
n
addiert, und das genau n mal (0 bis n − 1 sind n Schritte).
n−1
= ·n=2
X
2 2
n n
k=0
Die erste Summe ist etwas kompliziertet, da die Summanden von k abhängen. Zunächst enthält
jeder Summand den Faktor n22 , sodass wir diesen Ausklammern und vor das Summenzeichen
schreiben können.
n−1 n−1
·k = (1)
X X
2 2
n2 n2
· k
k=0 k=0
Zu Berechnen ist also nur die Summe über k von k = 0 bis k = n − 1. Hierfür gibt es eine
nützlich Formel:
n
k = n2 (n + 1) (2)
X
k=0
Diese lässt sich am besten an einem Beispiel nachvollziehen: Für n = 100 müssen wir alle Zahlen
von 1 bis 100 aufsummieren. Anstatt der Reihe nach vorzugehen, sortieren wir die Summanden
zu Paaren: 1 + 100, 2 + 99, 3 + 98 usw. bis zum letzten Paar 50 + 51. Insgesamt erhalten wir
7
50 = n2 Paare, die jeweils zusammen 101 = n + 1 ergeben. Die Summe beläuft sich somit auf
n
2
(n + 1).
Zu beachten ist jedoch, dass wir bei (1) nur bis n − 1 aufsummieren müssen, und nicht bis n.
Dies ist aber kein Problem, denn wir können im Ergebnis von (2) einfach n durch n − 1 ersetzen.
Die erste Summe in Un ist daher
n−1 n−1
·k = k= [(n − 1) + 1] =
X X
2 2 2 n−1 n−1
n2 n2
· n2
· 2 n
.
k=0 k=0
Beispiel 2
Nachdem wir unser Verfahren bestätigt sehen, widmen wir uns wider der Parabel f : x 7→ x2
(Abbildung: siehe 1.1):
n−1 n−1 2
Un = ·k =
X X
2 2 2 2
n
·f n n
· n
·k
k=0 k=0
n−1 n−1
= · k2 = k2
X X
8 8
n3 n3
·
k=0 k=0
k=0 6
8
Auch hier müssen wir wieder n durch n − 1 ersetzen, da wir nur bis n − 1 summieren. Für Un
ergibt sich:
n−1
8(n − 1)(2n − 1) 16n2 − 24n + 8
Un = k2 = [(n − 1) + 1][2(n − 1) + 1] = =
X
8 8 n−1
· ·
n3
k=0
n3 6
6n2 6n2
16 8
lim Un = =
n→∞ 8 3
Die Obersumme liefert denselben Wert, denn
n−1 n−1 2 n−1
On = · (k + 1) = · (k + 1) = (k + 1)2
X X X
2 2 2 2 8
n
·f n n
· n n3
·
k=0 k=0 k=0
n
16n2 + 24n + 8
= k2 = · n6 (n + 1)(2n + 1) =
X
8 8
·
n3
k=1
n3
6n2
16 8
lim On = = .
n→∞ 6 3
Der Gesuchte Flächeninhalt muss für alle n zwischen Un und On liegen. Da die Grenzwerte beider
Terme identisch sind, muss die Fläche unter der Parabel genau diesen Inhalt haben. Bezogen
auf die Schulmathematik würde theoretisch eine der beiden Summen und deren Grenzwert
ausreichen. Im allgemeinen gibt es aber Funktionen, bei denen sich die Grenzwerte von Un und
On unterscheiden. In diesem Fall ist das Verfahren nicht anwendbar.
Beispiel 3
Betrachten wir ein weiteres Beispiel, und zwar die e-Funktion f : x 7→ ex . Die obere Grenze des
Intervalls lassen wir jetzt variabel, sodass die Untersumme letztlich eine Funktion von x ist.
y
A(x)
−2 −1 1 x 2 x
9
x
Um die verbleibende Summe zu berechnen substituieren wir z = e n .
n−1
X x k n−1
= zk
X
en
k=0 k=0
Eine solche Summe heißt geometrische Reihe. Kürzen wir sie mit S ab. Es gilt:
z · S = z 1 + z 2 + z 3 + ... + z n−1 + z n
Im Vergleich zu S fehlt der erste Summand (z 0 = 1) und der Summand z n ist dazu gekommen.
z · S = S − 1 + zn
z · S = S − 1 + zn
(z − 1)S = z n − 1
zn − 1
S=
z−1
Für Un ergibt sich insgesamt folgender Ausdruck:
x n
n−1
X x k x n−1
x z −1 x en − 1
n
x ex − 1
Un (x) = = zk = · = · = · x
X
x
· en · x
n
k=0 n k=0 n z−1 n en − 1 n en − 1
Da wir nun einen geschlossenen Ausdruck für Un (x) haben, wollen wir noch den Grenzwert
limn→∞ Un bestimmen. Dieser liefert dann den exakten Wert unter des Flächeninhalts unter
dem Graphen von 0 bis x. Der Ausdruck ex − 1 im Zähler enthält kein n und kann deshalb als
Faktor vor den Limes gezogen werden.
x ex − 1 x
lim Un = lim · x = (ex − 1) · lim x n
n→∞ n→∞ n n→∞ e n − 1
en − 1
10
Der Grenzwert der Untersumme und der gesuchte Flächeninhalt ist demnach
An dieser Stelle lohnt sich ein kleiner Plausibilitäts-Check: A(x) hat bei x = 0 eine Nullstelle,
denn e0 − 1 = 0. Dies muss auch so sein, weil im Intervall [0; 0] natürlich kein Flächeninhalt
enthalten ist.
Das neue Symbol ab f (x) dx kann man wie folgt verstehen: Die Unter- und Obersumme erhält
R
man, indem man f an diskreten Werten xk auswertet (Höhen) und jeweils mit der Streifenbreite
∆x multipliziert.
U= f (xk ) · ∆x
X
Im Grenzfall unendlich vieler Streifen sind die xk -Werte nicht mehr diskret, sondern kontinuier-
lich verteilt. Jeder x-Wert im Intervall [a; b] kommt ein mal vor. Daher ersetzt man f (xk ) durch
f (x). Der Ausdruck dx steht für eine infinitesimal kleine Änderung ∆x, also die Streifenbreite
(vgl. lim∆x→0 f (x+∆x)−f
∆x
(x)
= dfdx
(x)
für den Differentialquotienten). Letztlich ersetzt man noch
das Summenzeichen durch das Integralzeichen und notiert nicht mehr die Start- und Endwerte
für den Laufindex k, sondern gleich die Grenzen des betrachteten Intervalls.
Was passiert aber, wenn f in [a; b] das Vorzeichen wechselt? Falls f (x) < 0 ist, ist auch das
Produkt f (x) dx < 0, sodass der Flächeninhalt all dieser Streifen negativ gewertet wird.
11
Verfahren: Das bestimmte Integral als Flächenbilanz
y
Der Wert des bestimmten Integrals ab f (x) dx ist als 1
R
1.2.2 Integrationsregeln
Weiterhin gelten für das bestimmte Integral die folgenden Rechenregeln:
Satz: Integrationsregeln
Seien a < b < c, λ ∈ R und f auf [a; c] integrierbar. Dann gilt:
Z b Z b
Faktorregel λ · f (x) dx = λ · f (x) dx
a a
Z b Z b Z b
Summenregel [f (x) + g(x)] dx = f (x) dx + g(x) dx
a a a
Z c Z b Z c
Additivität f (x) dx = f (x) dx + f (x) dx
a a b
Z b Z a
Umkehr der Integrationsrichtung f (x) dx = − f (x) dx
Z aa b
12
Arbeitsauftrag
Beantworten Sie folgende Verständnisfragen:
c) Geben Sie an, für welche a, b ∈ R das bestimmte Integral sin(x) dx gleich Null
Rb
a
ist.
Lösung:
a) |f (x)| dx ≥ | ab f (x) dx |, da letzteres den Betrag der Flächenbilanz berechnet. Beim
Rb R
a
ersten Integral werden alle Flächenstücke positiv gewertet. Die Gleichheit gilt, wenn f in
[a; b] keinen VZW hat.
Definition: Integralfunktion
Für eine integrierbare Funktion f und a ∈ R ist die Integralfunktion Ia definiert als das
Integral über f von der festen unteren Grenze a bis zur veränderlichen oberen Grenze x.
y
Z x
Ia : x 7→ f (t) dt
a
bzw. Ia (x)
Z x
Ia (x) = f (t) dt
a a x x
Die Integralfunktion hat mindestens eine Nullstelle, nämlich dann, wenn die obere
gleich der unteren Grenze ist:
Z a
Ia (a) = f (t) dt = 0
a
13
1.4 Der Hauptsatz der Differential- und Integralrechnung (HDI)
Der HDI ist einer der zentralen Sätze der Mathematik. Er verknüpft die Integralrechnung mit
der Differentialrechnung und erleichtert die Berechnung von Integralen erheblich.
Satz: HDI
Sei f integrierbar und stetig und a ∈ R. Dann ist die Integralfunktion Ia mit Ia (x) =
a f (t) dt eine Stammfunktion von f und es gilt
Rx
Ia (x + h) − Ia (x)
Ia0 (x) = lim
h→0 h
1 Z x+h Z x
= lim f (t) dt − f (t) dt
h→0 h a a
Aufgrund der Additivität können wir das erste Integral zerlegen. Es folgt:
1Z x Z x+h Z x
Ia0 (x) = lim f (t) dt + f (t) dt − f (t) dt
h→0 h a x a
1 Z x+h
= lim f (t) dt
h→0 h x
Lassen wir den Limes vorerst weg und versuchen den Ausdruck abzuschätzen. Generell gilt: Der
Wert eines Integrals ist stets kleiner oder gleich dem Produkt aus der Länge des Integrations-
intervalls und dem Maximum von f auf ebendiesem Intervall. Das besagte Produkt berechnet
nämlich den Inhalt eines Rechtecks, welche die Fläche unter dem Graphen komplett überdeckt.
Umgekehrt ist das Integral stets größer oder gleich dem Inhalt des Rechtecks mit Breite (b − a)
und dem Minimum von f auf dem Intervall [a; b] als Höhe.
y y
max[a;b] f
min[a;b] f
a b x a b x
Z b Z b
f (t) dt ≤ (b − a) · max f f (t) dt ≥ (b − a) · min f
a [a;b] a [a;b]
14
Die Intervalllänge ist in unserem Fall (x + h) − x = h. Schätzen wir hiermit 1 R x+h
h x
f (t) dt nach
unten und oben ab:
1 1 Z x+h 1
· h · min f ≤ f (t) dt ≤ · h · max f
h [x;x+h] h x h [x;x+h]
1 Z x+h
min f ≤ f (t) dt ≤ max f
[x;x+h] h x [x;x+h]
Nun betrachten wir die Ungleichungskette im Grenzfall h → 0. Der Mittlere Ausdruck wird
dann zu Ia0 (x).
Wenn h gegen Null strebt, dann enthält das Intervall [x; x + h] nur noch den einen Wert x. Weil
f stetig ist, sind das Maximum und das Minumum von f auf diesem (ein-elementigen) Intervall
identisch, nämlich f (x). Die untere und die obere Schranke für Ia0 (x) sind somit gleich:
Die Ableitung der Integralfunktion muss daher gleich f (x) sein, das heißt Ia ist eine Stamm-
funktion von f .
Jetzt bleibt nur noch die zweite Behauptung zu zeigen: Ia (x) = F (x) − F (a).
Sei F eine beliebige Stammfunktion von f . Da sich alle Stammfunktionen von f nur in einer
additiven Konstante unterscheiden, können wir Ia (x) schreiben als
Weil Ia bei a eine Nullstelle haben muss, können wir die Konstante c konkret bestimmen:
!
Ia (a) = 0
F (a) + c = 0
c = −F (a)
15
Beispielsweise gilt:
Z 2 2
x2 dx = 31 x3 = 1
· 23 − 13 · 03 = 8
0 3 3
0
Das Ergebnis kennen wir bereits aus 1.1.4. Dort konnten wir mithilfe der Grenzwerte der Unter-
und Obersumme genau denselben Wert ermitteln. Die hier vorgeführte Rechnung ist aber deut-
lich einfacher, oder? Die einzige Schwierigkeit ist, eine Stammfunktion des Integranden zu finden.
16
1.5 Das uneigentliche Integral
Es gibt Integrale, die sich über einen unbeschränkten Integrationsbereich erstrecken (z.B. von
−∞ bis ∞) und denen man trotzdem einen sinnvollen Wert zuordnen kann.
In ähnlicher Weise kann der Integrationsbereich eine Singularität des Integranden enthalten
(Definitionslücke mit f (x) = ±∞; z.B. Pol). Auch hier gibt es Fälle, bei denen das Integral
existiert.
existiert, dann nennt man das Integral ein uneigentliches Integral 1. Ordnung.
Analoges gilt für a = −∞.
In den folgenden zwei Unterpunkten werden Beispiele und Gegenbeispiele zu den uneigentlichen
Integralen aufgezeigt.
Graphisch gesehen ist es nicht klar, ob der Flächeninhalt unter dem Graphen der e-Funktion
von ∞ bis 0 einen endlichen Wert annimmt. Tatsächlich ist dies eher verwunderlich, da die
einbeschriebene Fläche ja keine linksseitige Begrenzung hat.
Wertet man das Integral jedoch rechnerisch aus, so ergibt sich in der Tat ein endlicher Wert:
Z 0 Z 0 0
e dx = lim
x
ex dx = lim ex = lim (e0 − ea ) = 1 − 0 = 1
−∞ a→−∞ a a→−∞ a a→−∞
Aus diesem Grund nennt man das obige Integral ein uneigentliches Integral (erster Orn-
dung). Heuristisch lässt sich das Ergebnis so erklären: Die Fläche hat zwar keine linksseitige
Begrenzung, doch die Funktionswerte nehmen so rasant ab, dass die Bereiche nahe −∞ keinen
signifikanten Beitrag zum Flächeninhalt leisten. Wenn die Funktionswerte weniger schnell gegen
Null streben, dann divergiert das Integral (Bsp. später).
Wenn man die obere Grenze des vorherigen Integrals Variabel lasst (x), dann erkennt man die
zweite zentrale Eigenschaft der e-Funktion (neben dx e = ex ):
d x
Z x Z x x
et dt = lim et dt = lim et = lim (ex − ea ) = ex
−∞ a→−∞ a a→−∞ a a→−∞
17
Satz: Besondere Eigenschaften der Exponentialfunktion
Die zwei herausragenden Eigenschaften der e-Funktion lauten:
1. An jedem Punkt (x | ex ) des Graphen ist der Wert y
der Tangentensteigung gleich dem Funktionswert: 4
y = ex m = ex
f 0 (x) = f (x) = ex .
2
2. Für alle x ∈ R ist der Inhalt der Fläche unter Gf von A = ex
−∞ bis x gleich dem Funktionswert an der Stelle x:
4x
x
−∞ e dt = e
Rx t x −2 2
Betrachten wir nun ein Gegenbeispiel zum uneigentlichen Integral. Dazu nehmen wir eine Funkti-
on, die im unendlichen gegen Null strebt, aber weniger schnell als die e-Funktion (für x → −∞):
Z ∞
1 Z a
1 a
dx = a→∞
lim lim ln |x| = a→∞
dx = a→∞ lim (ln a − ln 1) = a→∞
lim ln a = ∞
1 x 1 x 1
Die Hyperbel f : x 7→ x1 strebt im Unendlichen nicht schnell genug gegen Null. Die Beiträge
zum Flächeninhalt für große x addieren sich nicht mehr zu einem endlichen Wert auf, sondern
lassen das Integral über alle Maßen anwachsen.
1. Wenn der Integrand einen Pol von mindestens erster Ordnung hat, dann divergiert das
Integral:
Z 1
1 Z 1
1 1
dx = lim dx = lim ln |x| = lim (ln 1 − ln a) = lim (− ln a) = ∞
0 x a→0 a x a→0 a a→0 a→0
Dies war der Nachweis für einen Pol erster Ordnung. Wenn der Pol höherer Ordnung ist,
dann strebt f (x) noch schneller gegen unendlich, weshalb das Integral erst recht divergiert.
2. Wenn f (x) zwar divergiert, aber weniger schnell als ein Pol erster Ordnung, dann konver-
giert das Integral. Bsp: x 7→ √1x
Z 1
1 Z 1
1 √ 1 √ √
√ dx = lim √ dx = lim 2 x = lim (2 1 − 2 a) = 2 − 0 = 2
0 x a→0 a x a→0 a a→0
18
1.6 Von mehreren Graphen berandete Flächen
Wenn man den Flächeninhalt zwischen zwei Graphen bestimmen möchte, kann man das durch
Differenzbildung tun: Angenommen Gf liegt im Integrationsbereich oberhalb von Gg , dann be-
rechnet man den Flächeninhalt zwischen Gf und der x-Achse und subtrahiert den Flächeninhalt
zwischen Gg und der x-Achse.
y
4
Gf
Z b Z b Z b
A= f (x) dx − g(x) dx = (f x) − g(x)) dx 2 A
Gg
a a a
4x
a
2 b
Wenn beide Graphen oberhalb der x-Achse liegen ist diese Her-
angehensweise leicht nachvollziehbar. Was aber, wenn der untere y
Graph Gg unterhalb der x-Achse liegt? Muss man die Integrale
4
dann nicht eher addieren? Gf
Die Antwort ist nein, denn das Integral berechnet die Flächenbi-
2
lanz und nicht den Flächeninhalt. Wenn Gg in [a : b] unterhalb
der x-Achse liegt, dann hat a g(x) dx einen negativen Wert.
Rb
Auf diese Weise ist der Integrand stets positiv, egal welcher der Graphen momentan oben liegt.
Alle Flächenstücke würden somit positiv gewertet und das Integral den gesuchten Flächeninhalt
19
berechnen. Man kann sich die letzte Formel auch so erklären: Der Integrand |f (x) − g(x)| stellt
den (positiven) Abstand zwischen den Graphen dar. Wenn man über alle Abstände im Intervall
[a; b] integriert, dann erhält man den Inhalt der Fläche zwischen den Graphen.
Nun ist der Betrag innerhalb des Integrals sehr unpraktisch, weil man die Stammfunktion einer
Betragsfunktion nicht so einfach angeben kann. Und um den Betrag aufzulösen, müsste man ja
wissen welches Vorzeichen der Term im Betrag hat – sprich, welcher der Graphen gerade oben
liegt. Erinnerung:
Aber um diese Entscheidung wollten wir uns ja gerade drücken. Viel leichter wird es, wenn man
das Intervall [a; b] in mehrere Teilintervalle aufteilt. Die Schnittpunkte der Graphen stellen die
Grenzen dieser Teilintervalle dar. Wenn Gf in einem Bereich oben liegt, dann ist der Wert des
entsprechenden Integrals positiv. Wenn Gg oben liegt, ist er negativ. Um den eingeschlossenen
Flächeninhalt zu ermitteln müssen wir nur noch die Beträge all dieser Teilintegrale bilden und
aufsummieren.
Falls Gf und Gg in ]a; b[ mehrere Schnittpunkte haben, muss man den Integrationsbereich
in entsprechend viele Teilintervalle zerlegen.
Dies ist offenbar richtig, denn die Ableitung von f (x)g(x) ist nach der Produktregel gleich
dem Integranden auf der linken Seite. Der Übersichtlichkeit halber werden im Folgenden nur
unbestimmte Integrale betrachtet. Wir erinnern uns:
Das unbestimmte Integral ist letztlich nur eine alternative Schreibweise für die Menge aller
20
Stammfunktionen des Integranden:
Z
f (x) dx = F (x) + c
Folglich erhält man den Integranden, wenn man das unbestimmte Integral ableitet:
d
Z
f (x) dx = f (x)
dx
Die linke Seite dieser Gleichung scheint auf den ersten Blick wenig Sinn zu ergeben, da die
Variable x lediglich eine Integrationsvariable ist. Das Integral ist in dieser Form eigentlich keine
Funktion von x, sodass dessen Ableitung nach x eigentlich Null wäre. Wenn man allerdings
berücksichtigt, dass das unbestimmte Integral für eine beliebige Stammfunktion von f steht
(mit der Variable x), dann ergibt die Gleichung doch wieder Sinn. Die mathematisch saubere
Alternative wäre, dass man die Gleichung mithilfe einer Integralfunktion notiert (siehe HDI):
Z x
d
f (t) dt = f (x)
dx a
Um die Notation aber nicht unnötig zu verkomplizieren, begnügen wir uns mit dem unbestimm-
ten Integral und nehmen die Unsauberkeit an dieser Stelle hin.
Widmen wir uns erneut der ersten Gleichung und formen diese um:
Z
f 0 (x)g(x) + f (x)g 0 (x) dx = f (x)g(x)
Z Z
f (x)g(x) dx +
0
f (x)g 0 (x) dx = f (x)g(x)
Z Z
f 0 (x)g(x) dx = f (x)g(x) − f (x)g 0 (x) dx
f ist eine Stammfunktion von f 0 . Wenn wir in obiger Formel statt f 0 (x) einfach f (x) schreiben,
dann muss f (x) zu F (x) werden. Dies führt uns zur Grundgleichung der partiellen Integration:
Machen wir nochmal die Probe: Die Ableitung der rechten Seite ergibt sich aus der Produktregel
21
in Kombination mit dem HDI:
d d d
Z Z
F (x)g(x) − F (x)g 0 (x) dx = F (x)g(x) − F (x)g 0 (x)
dx dx dx
= f (x)g(x) + F (x)g 0 (x) − F (x)g 0 (x)
= f (x)g(x)
Die rechte Seite ist demnach eine Stammfunktion von f (x)g(x). Die Gleichung ist also korrekt.
22
Auf den ersten Blick scheint es, als würde man durch die Formel der partiellen Integration nicht
viel gewinnen, da man ein unbekanntes Integral lediglich durch ein anderes Integral ausdrückt.
Noch dazu muss man erst mal eine Stammfunktion von f finden. Der Vorteil ist jedoch, dass im
Integral auf der Rechten Seite nur noch die Ableitung der Funktion g vorkommt. Wenn g zum
Beispiel ein Polynom ist, dann reduziert sich dessen Grad durch das Ableiten um eins. In der
Regel wird das Integral hierdurch einfacher.R Das Ganze lässt sich am besten an einem Beispiel
nachvollziehen. Betrachten wir das Integral ex ·x dx. In diesem Fall ist f (x) = ex und g(x) = x.
F (x) ist somit wieder ex und g 0 (x) = 1. Mithilfe der partiellen Integration erhält man:
Z Z
PI
e · x dx = e · x −
x x
ex · 1 dx = xex − ex = ex (x − 1)
Durch Ableiten der rechten Seite verifiziert man schnell die Gültigkeit dieser Aussage.
In diesem Fall führt die partielle Integration in einem Schritt zum Ziel, da das entstehende Inte-
gral unmittelbar bestimmt werden kann. In manchen Fällen muss man die partielle Integration
aber mehrfach anwenden – so lange, bis der Grad des einen Faktors klein genug ist (i.d.R. 0,
also konstant):
Z Z
PI
x2 ex dx = x2 ex − 2xex dx
Z
PI
= x e − 2xe −
2 x x
2e dx = x2 ex − 2xex + 2ex = ex (x2 − 2x + 2)
x
In wieder anderen Fällen kommt man durch wiederholte partielle Integration nicht wirklich zu
einem Ende. Wenn man Glück hat, taucht aber irgendwann wieder das Integral auf, mit dem
man gestartet ist. In diesem Fall kann man die entstehende Gleichung nach dem gesuchten
Integral auflösen. Ein Beispiel:
Z Z
PI
sin x cos x dx = − cos x cos x − − cos x(− sin x) dx
Z
= − cos2 x − sin x cos x dx
Z
⇒2 sin x cos x dx = − cos2 x
Z
sin x cos x dx = − 21 cos2 x
23
1.8 Anwendungen der Differential- und Integralrechnung
Dieses Kapitel stellt sozusagen den krönenden Abschluss der Analysis dar, weil es die wichtigsten
Konzepte miteinander verknüpft und den Sinn der Differential- und Integralrechnung in der
realen Welt aufzeigt. Insbesondere die Physik ist ohne die Differential- und Integralrechnung
nicht vorstellbar.
∆f f (x + ∆x) − f (x)
m[x;x+∆x] = =
∆x ∆x
Dieser Wert entspricht gleichzeitig der Sekantensteigung im Intervall [x; x + ∆x].
Als konkretes Beispiel betrachten wir die Geschwindigkeit v, die im Allgemeinen eine Funktion
der Zeit ist. Seit der Unterstufe kennen Sie den Zusammenhang
∆s
v= .
∆t
Diese Gleichung ist aber mit Vorsicht zu genießen, denn man muss genau wissen, was sie eigent-
lich aussagt. Stellen wir uns ein Auto vor, das aus dem Stand beschleunigt und nach ∆t = 5 s
die Strecke ∆s = 100 m zurückgelegt hat. Dann hatte das Auto keines Wegs zu jedem Zeitpunkt
die Geschwindigkeit v = ∆s∆t
= 20 ms . Beim Start hatte es vielmehr die Geschwindigkeit v(0) = 0
und nach 5 s hatte es irgendeine Maximalgeschwindigkeit, die wir nicht kennen. Was für eine
Bedeutung hat aber der Wert 20 ms ?
Er steht für die mittlere Geschwindigkeit im Zeitintervall [0 s; 5 s]. Der Vergleich mit der De-
finition des Differenzenquotienten zeigt: Wenn wir uns die zurückgelegte Wegstrecke s(t) als
Funktion der Zeit vorstellen, dann ist die mittlere Geschwindigkeit die mittlere Änderungsrate
dieser Weg-Funktion.
In vielen Anwendungen interessiert man sich aber nicht nur für die mittlere Geschwindigkeit
(allg. Änderungsrate), sondern möchte wissen, wie schnell das Auto zu einem beliebigen Zeit-
punkt war. Man sucht also die momentane Änderungsrate der Weg-Funktion s(t).
Genau hier kommt die Differentialrechnung ins Spiel:
Die momentane Änderungsrate einer Funktion f erhalten wir, indem wir beim Differenzenquo-
tient die Änderung der Funktionsvariable gegen Null gehen lassen. Statt ∆x schreiben wir dann
dx. Mit dieser infinitesimal kleinen Änderung von x geht auch eine infinitesimal kleine Änderung
von f (x) einher. Diese Änderung nennen wir dann nicht mehr ∆f , sondern df (x).
24
Erinnerung: Differentialquotient und momentane Änderungsrate
Aus einer infinitesimal kleinen Änderung dx ergibt sich eine infinitesimal kleine Ände-
rung df (x). Der Differentialquotient bzw. die Ableitung von f ist der Quotient dieser
Änderungen:
Beide Aussagen lassen sich auf beliebe andere Kontexte und Funktionen übertragen. Man
muss lediglich den Begriff „Geschwindigkeit“ durch „Änderungsrate“ ersetzen.
Übertragen wir beispielhaft die oben getroffenen Aussagen auf die Beschleunigung a:
Der Quotient ∆v
∆t
ergibt die mittlere Beschleunigung ā im Intervall ∆t. Die Ableitung der Ge-
schwindigkeitsfunktion v̇(t) = dv(t)
dt
liefert dagegen die momentane Beschleunigung zur Zeit t,
also a(t).
Über den Hauptsatz der Differential- und Integralrechnung (HDI) wissen wir, dass die Inte-
gralrechnung sozusagen das Gegenstück, also die Umkehrung der Differentialrechnung darstellt.
Was das bedeutet, machen wir uns wieder am Beispiel der Geschwindigkeit klar.
Im vorherigen Abschnitt sind wir davon ausgegangen, dass wir die Weg-Funktion s(t) kennen
und die momentane Geschwindigkeit v(t) wissen möchten. Wir haben gesehen, dass wir diese
durch Ableiten erhalten. Insofern liegt es doch nahe, dass man durch die Umkehrung, also durch
aufleiten, von der Geschwindigkeitsfunktion auf die Weg-Funktion kommt. Warum das tatsäch-
lich so ist, wollen wir näher ergründen.
25
Der Einfachheit gehen wir zunächst vom eine konstanten Geschwin- v
digkeit aus. Dann ist die mittlere Geschwindigkeit v̄ = ∆s
∆t
gleich der
momentanen Geschwindigkeit für beliebige Zeiten. Die zurückgeleg-
te Wegstrecke erhalten wir in diesem einfachen Fall durch auflösen
der Gleichung:
∆s = v · ∆t
s = v · ∆t v
Dieses Produkt können wir im v-t-Diagramm veranschaulichen.
Wenn v zeitlich konstant ist, dann ist der Graph von v(t) eine
Parallele zur Zeitachse. ∆t t
Das Produkt ∆s = v ·∆t entspricht der Rechtecksfläche und somit dem Flächeninhalt unter dem
Graphen der Geschwindigkeitsfunktion. Dieser Gedankengang wird uns zu einem allgemeinen
Ausdruck für den zurückgelegten Weg führen.
Nehmen wir nun an, das die Geschwindigkeit durch eine allgemeine Funktion v(t) beschrieben
wird. Dann ist die Gleichung ∆s = v · ∆t nicht mehr gültig, denn diese setzt eine konstante Ge-
schwindigkeit voraus. Stattdessen müssen zunächst eine Näherung betrachten: Für einen kurzen
Zeitraum ∆t tun wir so, als wäre die Geschwindigkeit konstant, sodass wir einfach multiplizieren
können. Im Intervall [t0 ; t0 + ∆t] würde dann der Weg ∆s0 = v(t0 ) · ∆t zurückgelegt werden.
Das ist wohlgemerkt nur ein Näherungswert, weil v ja eigentlich nicht konstant ist. Nachdem
∆t verstrichen ist (t1 = t0 + ∆t) aktualisieren wir die Geschwindigkeit und nehmen sie im
Folgenden wieder als konstant an. Der im nächsten Intervall zurückgelegte Weg beträgt dann
∆s1 = v(t1 ) · ∆t. Diese Schritte wiederholen wir, bis wir beim gesuchten Zeitpunkt angelangt
sind.
Dem aufmerksamen Leser ist sicher klar, worauf das Ganze hinausläuft. Die Produkte s0 , s1 ,
etc. stellen genau wie oben die Inhalte von Rechtecksflächen im v-t-Diagramm dar. Der gesamte
zurückgelegte Weg ergibt sich aus der Summe ∆s0 + ∆s1 + ..., also aus der Untersumme (bzw.
Obersumme, je nach dem, ob v(t) zunimmt oder abnimmt).
v
v(t)
∆s0
∆s1
∆s2
∆s3
t0 ∆t t4 t
Wie bei der Herleitung zum Integral lassen wir auch hier ∆t gegen Null streben, um den exakten
Wert zu erhalten. Graphisch bedeutet das: Der im Intervall [t0 ; t4 ] zurückgelegte Weg ist gleich
dem Inhalt der Fläche unter dem Graphen von v(t). Die Regel für konstante Geschwindigkeit
gilt also auch für beliebige andere Geschwindigkeitsfunktionen. Wie wir den Flächeninhalt unter
Graphen berechnen, wissen wir bereits – mit dem Integral.
Um den im Intervall [0; t] zurückgelegten Weg zu berechnen, müssen wir die Geschwindigkeits-
funktion von 0 bis t integrieren. Um einen Konflikt der Variablen zu vermeiden, geben wir der
26
Integrationsvariable den Namen τ (tau). Die Variable x steht hier für den Aufenthaltsort.
Z t
∆s = x(t) − x(0) = v(τ ) dτ
0
Versuchen wir uns von der Geschwindigkeit zu lösen und die obige Gleichung zu verallgemei-
nern.
Auf der linken Seite steht der zurückgelegte Weg, also die Änderung des Aufenthaltsortes x. Das
können wir allgemein als die Änderung eines Funktionswerts bzw. eines Bestandes auffassen.
Neben dem Aufenthaltsort könnte der Bestand auch ein Guthaben, ein Füllvolumen oder die
Anzahl infizierter Personen beschreiben, um nur einige Beispiele zu nennen.
Die Gleichung besagt nun, dass die Änderung des Bestandes gleich dem Integral über die Än-
derungsrate der Bestandsfunktion ist, denn v(t) = ẋ(t).
Satz: Bestandsänderung
Die Änderung einer integrierbaren Bestandsfunktion f im Intervall [a; b] ist gleich dem
Integral über die Änderungsrate der Bestandsfunktion von a bis b.
Z b
f (b) − f (a) = f 0 (x) dx
a
Zugegebener maßen hätte man mithilfe des HDI deutlich schneller zu dieser Erkenntnis gelangen
können. Wenn man über die Ableitung f 0 integriert, dann muss man die Stammfunktion von f 0 ,
also f , an den Grenzen des Integrals auswerten. Nichts anderes besagt letztlich die Gleichung.
Trotzdem war die Herleitung nicht umsonst, denn es ist durchaus sinnvoll, sich die grundlegen-
den Konzepte noch einmal, und vor allem im Sachkontext, vor Augen zu führen.
1.8.3 Beipiele
Wozu braucht man aber dieser Gleichung? In den meisten Fällen kennt man doch die Bestands-
funktion f , oder? Dann ist f (b) − f (a) deutlich schneller berechnet als das Integral. Das stimmt
soweit, bis auf die Tatsache, dass f immer bekannt wäre. Betrachten wir wieder die Bewegung
eines Körpers (ja, schon wieder...): Wenn man in der Physik einen Bewegungsablauf mathema-
tisch beschreiben will, dann muss man von außen nach innen vorgehen. Sprich, man fängt mit
der Ursache der Bewegung an und muss sich bis zur konkreten Ortsfunktion x(t) durcharbeiten.
Nehmen wir an auf den Körper wirkt eine konstante Kraft. Dann erfährt er wegen F = m · a
eine konstante Beschleunigung. Die Beschleunigung ist die Änderungsrate der Geschwindigkeit.
Deshalb gilt:
Z t
v(t) − v(0) = a dτ
0
Der Startwert v(0) wird in der Regel mit v0 abgekürzt. Weil a konstant ist, ist das Integral
schnell ausgewertet:
h it
v(t) − v0 = aτ = at
0
v(t) = v0 + at
27
Diese Formel sollte Ihnen aus dem Physikunterricht bekannt vorkommen. Aber es geht noch
weiter. Wir wollen ja die Ortsfunktion x(t) wissen. Weil v die Änderungsrate der Ortsfunktion
ist, können wir genau so weiter machen wie bisher:
Z t
x(t) − x(0) = v(τ )dτ
0
Z t
x(t) − x0 = v0 + aτ dτ
0
h it
x(t) − x0 = v0 τ + 12 aτ 2
0
x(t) − x0 = v0 t + 1 2
2
at
x(t) = x0 + v0 t + 12 at2
Auch diese Formel haben Sie eventuell schon einmal gesehen. Machen Sie doch mal die Probe, ob
die Gleichung wirklich stimmt! Die erste Ableitung der Ortsfunktion muss die Geschwindigkeit
ergeben und die Ableitung der Geschwindigkeit (zweite Ableitung von x(t)) die Beschleunigung.
Das Beispiel sollte Ihnen klar machen: Oft ist die Bestandsfunktion nicht gegeben, sondern nur
deren erste (bzw. hier die zweite) Ableitung. Mittels der Integralrechnung kann man dann zu-
rückrechnen, was denn die eigentliche Bestandsfunktion gewesen sein muss.
Zum Abschluss noch ein komplett anderes, kurzes Beispiel: Wenn man in einen Wassertank
unten ein Loch bohrt, dann tritt das Wasser aufgrund des Tiefendrucks umso schneller aus, je
mehr Wasser noch im Tank ist. Mit der Zeit wird die Ausflussrate f also abnehmen. Man kann
zeigen, dass die Ausflussrate linear abnimmt, d.h sie startet mit einem maximalen Wert (z.B. 2
Liter pro Sekunde) und geht dann linear bis auf Null zurück. Der Term könnte zum Beispiel so
aussehen:
In diesem Fall nimmt die Flussrate pro Sekunde um 0,4 Liter pro Sekunde ab. Die Frage könnte
wie folgt lauten:
Wie viel Wasser ist nach 3 s ausgeflossen? Die Integralrechnung liefert die Antwort. Wenn F
der Bestand, also die Menge an ausgeflossenem Wasser ist, dann gilt (ab jetzt ohne Einheiten):
Z 3
F (3) − F (0) = f (t)dt
o
Z 3
F (3) − F (0) = 2 − 0,4tdt
0
h i3
F (3) − 0 = 2t − 0,2t2
0
F (3) = 2 · 3 − 0,2 · 32 − 0 = 4,2
28
2 Stochastik II
2.1 Zufallsgröße und Wahrscheinlichkeitsverteilung
Stellen wir uns ein Würfelspiel vor: Ein Würfel wird gewürfelt. Bei einer 6 bekommt der Spieler
5e und bei einer 1 muss er 2e abgeben. Bei den restlichen Ziffern passiert nichts.
Das zugrunde liegende Zufallsexperiment hat die Ergebnismenge Ω = {1; 6; weder 1 noch 6}.
Eine Zufallsgröße (auch Zufallsvariable) ist eine Funktion X : Ω → R, die jedem Element aus
Ω eine reelle Zahl zuordnet – zum Beispiel den Gewinn bzw. Verlust des Spielers: {−2; 5; 0}.
Die Wahrscheinlichkeit, mit der diese Werte auftreten, hängt von den Wahrscheinlichkeiten
der entsprechenden Ergebnisse ab: P (X = −2) = P (1) = 16 , ebenso wie P (X = 5). Der
Funktionswert X = 0 tritt dagegen häufiger auf, denn P (X = 0) = P (weder 1 noch 6) = 64 = 23 .
Die Abbildung, die jedem möglichen Wert der Zufallsgröße seine Wahrscheinlichkeit zuordnet,
nennt man Wahrscheinlichkeitsverteilung der Zufallsgröße.
Diese Zusammenhänge stellt man in der Regel tabellarisch dar:
Die ersten beiden Zeilen bilden zusammen die Zufallsgröße X und die letzten beiden Zeilen
bilden die Wahrscheinlichkeitsverteilung von X.
ωi ∈ Ω ω1 ω2 ...
xi = X(ωi ) x1 x2 ...
pi = P (xi ) = P (ωi ) p1 p2 ...
1 n1 n2 nk k
ni
(n1 x1 + n2 x2 + ... + nk xk ) = · x1 + · x2 + ... + · xk =
X
· xi
N N N N i=1 N
29
Unter dem Erwartungswert µ = E(X) der Zufallsgröße versteht man den Mittelwert, der sich
nach unendlich vielen Wiederholungen ergäbe. Das heißt, wir müssen den obigen Ausdruck
im Grenzfall N → ∞ betrachten. Hierbei kann uns das Gesetz der großen Zahlen behilflich
sein: Dieses besagt, dass die relative Häufigkeit eines Ereignisses im Grenzfall unendlich vieler
Wiederholungen gegen die Wahrscheinlichkeit des Ereignisses strebt. Das bedeutet:
k k k
ni ni
µ = E(X) = lim · xi = lim ·xi = P (xi ) · xi
X X X
i=1 N i=1 | {z N}
N →∞ N →∞
i=1
P (xi )
i=1
08 08
06 06
04 04
02 02
2 3 4 5 6 X 2 3 4 5 6 Y
Da bei beiden Verteilungen die Werte xi bzw. yi und die Wahrscheinlichkeiten symmetrisch um
den Wert 4 herum liegen, haben die Zufallsgrößen den Erwartungswert E(X) = E(Y ) = 4. Dies
lässt sich aber auch rechnerisch bestätigen:
Trotzdem sind die Verteilungen komplett unterschiedlich. Während bei X die Wahrscheinlich-
keit mit zunehmendem Abstand zum Erwartungswert immer kleiner wird, ist es bei Y genau
30
anders herum. Offensichtlich gibt der Erwartungswert keine Auskunft über den tatsächlichen
Verlauf der Wahrscheinlichkeitsverteilung. Insbesondere ist der Erwartungswert keines Wegs als
der am häufigsten auftretende Wert zu verstehen, wie die Verteilung Y aufzeigt.
Die abgebildeten Wahrscheinlichkeitsverteilungen unterscheiden sich hinsichtlich ihrer Streu-
ung. Bei einer Verteilung mit geringer Streuung sind die Wahrscheinlichkeiten um den Erwar-
tungswert herum konzentriert (X). Ist die Streuung groß, dann kommen die Werte weiter weg
vom Erwartungswert häufig vor (Y ).
Nun müssen wir nur noch ein Maß für die Streuung einer Verteilung finden. Wie gesehen, geht
es bei der Streuung um den Abstand (xi − µ) vom Erwartungswert. Man könnte meinen, dass
man diese Differenzen nur noch mit P (xi ) gewichten und dann aufsummieren müsste. Dies führt
jedoch nicht weit, denn für symmetrische Verteilungen würde hierbei immer Null herauskommen.
Die eine Hälfte der Klammern hätte ein negatives und die andere ein positives Vorzeichen und
wenn die entsprechenden Wahrscheinlichkeiten gleich sind, wäre die Summe stets Null. Auf diese
Weise kann man die obigen Verteilungen also nicht unterscheiden.
Letztlich müssen wir die Vorzeichen der Differenzen (xi − µ) loswerden. Hierzu quadrieren wir
sie einfach, bevor wir gewichten und aufsummieren. Die so erhaltene Größe nennt sich die
Varianz V ar(X). Um das Quadrieren gewissermaßen wieder rückgängig zu machen, zieht man
am Schluss noch die Wurzel. Hieraus ergibt sich die Standardabweichung.
Man erhält die Varianz, indem man die quadrierten Abstände (xi −µ) zum Erwartungswert
mit den Wahrscheinlichkeiten von xi gewichtet und anschließend aufsummiert.
V ar(X) = (x1 − µ)2 · P (x1 ) + (x2 − µ)2 · P (x2 ) + ... + (xn − µ)2 · P (xn )
n
= (xi − µ)2 · P (xi )
X
i=1
Die Standardabweichung ist die Wurzel aus der Varianz. Sie entspricht dem mittleren
Abstand der xi vom Erwartungswert.
q
σ= V ar(X)
31
2.4 Bernoulli-Experiment und Bernoulli-Kette
Definition: Bernoulli-Experiment
Unter einem Bernoulli-Experiment versteht man ein Zufallsexperiment mit folgenden Ei-
genschaften:
Definition: Bernoulli-Kette
Eine Bernoulli-Kette erhält man, indem man ein Bernoulli-Experiment n mal hinterein-
ander durchführt. Die Anzahl der dabei auftretenden Treffer wird als eine Zufallsgröße X
aufgefasst. Es gelten folgende Bezeichnungen:
Nun sehen wir uns an, wie man die Wahrscheinlichkeit Ppn (X = k) konkret berechnen kann.
Die Grundidee ist simpel: Stellen wir uns vor, die ersten k Versuche sind alle Treffer. Die Wahr-
scheinlichkeit hierfür ist pk (k Schritte im Baumdiagramm). Da wir genau k Treffer haben
wollen, müssen noch n − k Nieten folgen, also pk · (1 − p)n−k .
Schwieriger zu verstehen ist dagegen der nächste Schritt: Die k Treffer müssen nicht zwangsläufig
alle am Anfang kommen. Noch müssen sie alle nacheinander auftreten. Jede dieser Möglichkeiten
ist aber für das Ereignis X = k günstig. Da die verschiedenen Möglichkeiten gleich wahrschein-
lich sind, müssten wir nur wissen, wie viele es sind. Dann können wir den obigen Ausdruck mit
ebendieser Anzahl multiplizieren (Summe aller günstigen Pfade). Es gilt also herauszufinden,
auf wie viele Arten man die k Treffer auf n Stellen verteilen kann. Die Antwort liefern die
sogenannten Binomialkoeffizienten.
2.4.1 Binomialkoeffizienten
Wir stellen uns die Frage, auf wie viele Arten man k ununterscheidbare Objekte auf n
Stellen verteilen kann – beispielsweise drei (gleiche) Kekse auf fünf Freunde.
Für das erste Objekt hat man n Möglichkeiten der Platzierung, da noch alle Stellen frei sind.
Für das zweite Objekt hat man dann nur noch n − 1 freie Stellen, für das dritte nur noch n − 2
und so weiter. An einem Zahlenbeispiel macht man sich klar, dass es für das letzte Objekt noch
n − k + 1 freie Stellen gibt, wenn n ≥ k.
Die Gesamtzahl der Auswahlmöglichkeiten beträgt also n · (n − 1) · (n − 2) · ... · (n − k + 1). Dieses
Produkt kann man mithilfe der Fakultät (n! = 1 · 2 · ... · n für n ∈ N und 0! = 1) kompakter
32
schreiben:
n!
n · (n − 1) · (n − 2) · ... · (n − k + 1) =
(n − k)!
Das Produkt n! im Zähler geht bis zur 1 hinunter. Wenn wir aber alle Faktoren kleiner oder
gleich n − k herauskürzen, dann bleibt nur das Produkt auf der linken Seite übrig.
Leider ist das noch nicht der Wahrheit letzter Schluss, denn die k Objekte sind nach Voraus-
setzung ununterscheidbar. Das haben wir noch nicht berücksichtigt.
Betrachten wir ein konkretes Beispiel: Beim Volleyball stehen k = 5 Spieler auf dem Feld. Es
gibt aber keine feste Aufstellung, weil die Positionen ständig durchgewechselt werden. Nehmen
wir an, der Trainer hat n = 8 Spieler in seinem Kader und möchte eine (Zufalls-)Mannschaft
zusammenstellen. Die Spieler heißen Anton, Ben, Corbinian, Dominik, Emil, Ferdinand, Gustav
und Hans (ABCDEFGH).
Für die erste Position auf dem Feld hat der Trainer acht Wahlmöglichkeiten, für die zweite sie-
ben und für die fünfte nur noch vier. Nach obiger Überlegung kann er folglich 8! 3!
= 6720 Teams
zusammenstellen. Diese Wert ist aber viel zu hoch. Angenommen er hat die Spieler ABDEH
ausgewählt. Diese Auswahl hätte er auf sehr viele Arten treffen können: Er hätte die Spieler in
der genannten Reihenfolge auswählen können, oder aber in irgendeiner anderen, z.B. HABED.
Im Zahlenwert 6720 sind all diese Möglichkeiten extra aufgezählt, da wir nicht unterschieden
haben, ob der Trainer zuerst A wählt, dann B oder erste B und danach A. Da die Positionen
der Spieler aber ununterscheidbar sind (keine Aufstellung), entsteht immer das gleiche Team.
Alle Auswahlen, bei denen die Spieler ABDEH auf dem Platz sind, sind als gleich zu bewerten
und nicht extra zu zählen. HABED, BEHAD, DHBEA und so weiter müssen alle zu einer Mög-
lichkeit, dem Team ABDEH zusammengefasst werden.
Wie viele Möglichkeiten müssen wir pro fester Spielerkombination zusammenfassen? Den
Spieler A hätte der Trainer zuerst wählen können, oder als zweiten, usw. Er hätte ihn an 5
verschiedenen Stellen seines Wahlvorgangs nominieren können; den zweiten Spieler an 4 Stellen
und so weiter. Offensichtlich verteilen wir nun fünf Spieler auf fünf Stellen in der Mannschaft.
Weil n und k hier gleich sind, gibt es für den letzten Spieler nur noch eine „Position“. Die
Mannschaft ABDEH kann man also auf 5! = 120 Arten zusammenstellen. Nochmal: Diese 120
verschiedenen Wahlmöglichkeiten sind im Term 5! 8!
= 6720 extra gezählt worden!
Das eben Gesagte gilt nicht nur für die Mannschaft ABDEH, sondern auch für alle anderen
Mannschften, z.B. GFECH. Jede dieser Mannschaften ist mit 120 Auswahlvarianten im Wert
6720 vertreten. Wenn zu jeder Mannschaft 120 Varianten gehören und es insgesamt 6720 Varian-
ten gibt, dann erhalten wir die Anzahl der Mannschaften, indem wir 6720 durch 120 dividieren.
Diese Überlegung führt uns zum Binomialkoeffizien:
Definition: Binomialkoeffizient
Der Binomialkoeffizient
n
n!
= „k aus n“
k (n − k)! · k!
gibt an, auf wie viele Arten man k ununterscheidbare Objekte auf n Stellen verteilen
kann.
Er kann mithilfe des Taschenrechners berechnet werden: n + nCr + k
33
2.4.2 Wahrscheinlichkeit der Bernoulli-Kette
Mithilfe der Binomialkoeffizienten können wir nun einen allgemeinen Ausdruck für die Wahr-
scheinlichkeit einer Bernoulli-Kette angeben. Wohl gemerkt, die einzige offene Fragewar
bisher,
k
auf wie viele Arten man k Treffer auf n Stellen verteilen kann. Mit dieser Anzahl müssen
n
wir den Ausdruck pk · (1 − p)n−k multiplizieren, denn so viele Pfade führen zum Ereignis X = k.
2.5 Binomialverteilung
Definition: Binomialverteilung
Eine Wahrscheinlichkeitsverteilung, deren Wahrscheinlichkeiten sich aus Bernoulli-Ketten
ergeben, heißt Binomialverteilung. Demnach gilt für eine Binomialverteilung:
n
pk = B(n; p; k) = pk · (1 − p)n−k ·
k
k=0
Erwartungswert: E(X) = np
Varianz: V ar(X) = np(1 − p)
q
Standartabweichung: σ= np(1 − p)
34
Definition: kumulative Binomialverteilung
Bei der kumulativen Binomialverteilung F (n; p; k) werden alle Bernoulli-Ketten B(n; p; i)
für i ≤ k aufsummiert:
k
F (n; p; k) = Ppn (X ≤ k) =
X
B(n; p; i)
i=0
k steht für die maximale Trefferanzahl, bis zu aufsummiert wird. Erhöht man
k, so kommen mehr (positive) Summanden hinzu. Bezogen auf k ist die kumulative
Binomialverteilung somit streng monoton wachsend.
Das folgende Beispiel stellt die nicht-kumulative und die kumulative Binomialverteilung
für n = 5 und p = 0,2 gegenüber:
k 0 1 2 3 4 5 k 0 1 2 3 4 5
B(k) 0,33 0,41 0,20 0,05 0,01 ≈0 F (k) 0,33 0,74 0,94 0,99 ≈1 1
B F
1 1
08 08
06 06
04 04
02 02
1 2 3 4 5 k 1 2 3 4 5 k
Den Term a3 b kann man auf die zwei abgebildeten Wege erhalten, nämlich a · a · a · b und
a · a · b · a. Ebenso sind die Wege a · b · a · a oder b · a · a · a möglich. Diese Anzahl kann man
als einen Binomialkoeffizient ausdrücken, denn letztlich verteilen wir 3 Treffer (z.B. a) auf 4
4
Stellen, und dafür gibt es = 4 Möglichkeiten. Im ausmultiplizierten Term taucht a3 b also
3
vier mal auf, weshalb sich ebendieser Vorfaktor ergibt. Vergleiche hierzu die Binomische Formel
(a + b)2 : Der Term ab taucht zwei mal auf, weil wir einen Treffer auf zwei Stellen verteilen (ab
oder ba). Die einzelnen Vorfaktoren eines Binoms ergeben sich immer aus dem entsprechenden
10
Binomialkoeffizient, daher auch der Name. Für n = 10 taucht der Term a b genau 7 3
= 120
7
35
mal auf. (a + b)10 ist daher ... + 120a7 b3 + ....
Ich hoffe an dieser Stelle wird klar, wie wertvoll diese Erkenntnis ist! Wie lange hätten Sie
gebraucht um (a + b)10 auszumultiplizieren und die gleichartigen Terme zusammenzufassen?
Allgemein lässt sich also feststellen:
n
n 0 n n 1 n−1 n 2 n−2
n n 0
(a + b) =
n
ab + ab + ab + ... + a b +
n−1 1
a b
0 1 2 n−1 n
Durch die Summenschreibweise wird das ganze kompakter:
n n
(a + b)n = ak bn−k
X
k=0 k
Mithilfe dieser wichtigen Identität lässt sich unmittelbar beweisen, dass die Binomialverteilung
normiert ist. Es muss dazu gezeigt werden, dass die Summe aller Wahrscheinlichkeiten von k = 0
bis k = n gleich 1 ergibt. Hierzu verwenden wir die obige Formel von rechts nach links mit a = p
und b = 1 − p:
n n n
B(n; p; k) = pk (1 − p)n−k = [p + (1 − p)]n = 1n = 1
X X
k=0 k=0 k
Auf ähnliche Art lassen sich die Formeln für den Erwartungswert und die Varianz der Binomi-
alverteilung nachweisen. Zu berechnen sind die Ausdrücke
n n
n k
E(X) = k · B(n; p; k) = p (1 − p)n−k = ... = np
X X
k·
k=0 k=0 k
n n n k
V ar(X) = (E(X) − k) · B(n; p; k) =
2
(np − k)2
p (1 − p)n−k = ... = np(1 − p)
X X
k=0 k=0 k
Für diese Rechnungen benötigt man jedoch noch einige geschickte Umformungen, auf die hier
nicht näher eingegangen werden soll.
36
3 Geometrie II
3.1 Geraden
Definition: Geraden im Raum
Sei X ein beliebiger Punkt auf einer Geraden g. Dann kann man den Ortsvektor X
~ durch
eine Vektorkette darstellen:
g:X
~ =A
~ + λ~u mit λ ∈ R Vektorform der Gerade g
Hierbei bezeichnet A ∈ g den Aufpunkt der Gerade und ~u bezeichnet den Richtungs-
vektor der Gerade. Durch den Parameter λ ∈ R lässt sich der Richtungsvektor beliebig
skalieren, sodass man jeden einzelnen Punkt auf der Geraden erreichen kann. Z.B.:
x2 ~1
X
~u g
X~2 A
~1 = A
X ~ + 2~u (λ = 2)
~2 = A
X ~ − 0,5~u (λ = −0,5)
O x1
• Die Richtung von u wird durch die Richtung der Gerade bestimmt. Die Länge von
u ist frei wählbar. Falls die Gerade g durch zwei Punkte A und B gegeben ist, ist
−→ ~
es zweckmäßig ~u = AB = B −A~ zu setzen.
g:X
~ =A
~ + λ~u h:X
~ =B
~ + µ~v
37
3.3 Linear unabhängige Vektoren
nur die triviale Lösung (a1 ; a2 ; ...; an ) = (0; 0; ...; 0) besitzt. Wenn es eine nicht-triviale
Lösung gibt, bei der mindestens einer der Koeffizienten a1 bis an ungleich Null ist, dann
sind die Vektoren linear abhängig.
lin. unabhängig alle ai müssen Null sein Es gibt nur die triviale Lösung
lin. abhängig mind. ein ai kann ungleich Es gibt eine nicht-triviale Lösung
Null gewählt werden
• Die triviale Lösung existiert immer - unabhängig von den Vektoren v~1 bis v~n . Darum
geht es aber nicht. Entscheidend ist, ob noch eine weitere, nicht-triviale Lösung
existiert.
• Sobald einer der Vektoren v~1 bis v~n der Nullvektor ist, sind die Vektoren linear
abhängig. In diesem Fall lässt sich nämlich immer eine nicht-triviale Lösung finden.
Sei z.B. v~3 = ~0, dann ist 0 · v~1 + 0 · v~2 + a3 v~3 + 0 · v~4 + ... + 0 · v~n = ~0 für alle
beliebigen a3 ∈ R erfüllt. Das Gleichungssystem hat somit die nicht-triviale Lösung
(0; 0; 1; 0; ...; 0), wobei hier willkürlich a3 = 1 gewählt wurde.
Geometrisch liegt genau dann lineare Abhängigkeit vor, wenn es eine nicht-triviale Linearkom-
bination gibt, die als Ergebnis den Nullvektor liefert - sprich, wenn sich die Vektoren so an
einander reihen lassen, dass man wieder am Ausgangspunkt ankommt. Durch die Wahl der Ko-
effizienten a1 , a2 , ..., an können die Vektoren zuvor auf die passende Länge gebracht oder deren
Richtung umgekehrt werden.
v~2
Diese Vektoren sind nicht linear unabhängig. Wenn man v~2 beliebig streckt und an v~1 dranhängt,
dann kann man ausschließlich die Punkte auf der gestrichelten Gerade (X ~ = v~1 + a2 v~2 ; a2 ∈ R)
erreichen. In keinem Fall kommt man wieder zum Ausgangspunkt, also dem Fuß von v~1 zurück.
Die einzige Möglichkeit wieder dorthin zurückzukommen ist, wenn man beide Vektoren auf die
Länge 0 schrumpft, also die triviale Linearkombination 0 · v~1 + 0 · v~2 bildet. Es gibt keine Mög-
lichkeit, bei der entweder a1 oder a2 ungleich Null gewählt werde könnten. Da die Gleichung
a1 v~1 + a2 v~2 = ~0 somit nur die triviale Lösung a1 = 0 und a2 = 0 besitzt, sind v~1 und v~2 linear
abhängig.
38
Wie das willkürlich gewählte Beispiel zeigt, gilt dieser Sachverhalt für alle Paare von Vektoren,
die nicht parallel (kollinear) zu einander sind. Genauer gilt folgender Satz:
Bemerkung: Kollinear = ˆ „auf einer Linie“. Die Abgrenzung zur Parallelität ist nötig, da Vek-
toren keine Lage im Raum haben und daher nicht im klassischen Sinne parallel sein können.
Beweis:
„Genau dann“ heißt, dass beide Richtungen gezeigt werden müssen - also abhängig ⇒ kollinear
und kollinear ⇒ abhängig.
a1 v~1 + a2 v~2 = ~0
a1 v~1 = −a2~v2
v~1 = − aa12 v~2
| {z }
λ
v~1 ist somit ein Vielfaches von v~2 und die Vektoren sind kollinear.
Das Gleichungssystem a1 v~1 + a2 v~2 = ~0 hat somit die nicht-triviale Lösung (−λ; 1). Die
Vektoren sind daher linear abhängig.
39
Diesen Sachverhalt macht man sich am besten anschaulich klar. Wenn die Vektoren nämlich in
einer Ebene liegen, dann lässt sich immer eine nicht-triviale Nullsumme finden:
P v~1 v~2
v~3
v~2
O
Unser Ziel ist wohlgemerkt, durch geschicktes Skalieren und Aneinanderreihen der Vektoren
wieder zum Ursprung O zurück zu gelangen. Setzten wir zunächst ein Vielfaches von v~2 an die
Spitze von v~1 . Hiermit können wir alle Punkte auf der horizontalen, gestrichelten Gerade errei-
chen. Von diesen Punkten aus dürfen wir jetzt noch beliebig lange in Richtung von v~3 gehen.
Zeichnet man sich die Wirkungslinie von v~3 durch den Ursprung ein, dann sagt uns der Schnitt-
punkt der gestrichelten Geraden (P ), bis zu welchem Punkt wir im ersten Schritt gehen müssen,
d.h. welche Skalierung wir für v~2 wählen sollten. Fassen wir von Anfang an zusammen: Zuerst
gehen wir in Richtung v~1 (Länge 1), dann müssen wir in die Gegenrichtung von v~2 (Skalierung
−1), was uns zum Punkt P führt. Von dort aus gehen wir noch in die Gegenrichtung von v~3 ,
nur mit doppelter Länge (Skalierung −2). So landen wir nach einer kurzen Rundreise wieder im
Ursprung. Folglich haben wir eine nicht triviale Nullsumme gefunden:
P −v~2
−2v~3 v~1
1 · v~1 + (−1) · v~2 + (−2) · v~3 = ~0 v~2
O
Die Vektoren sind somit linear abhängig.
Das einzige Problem könnte sich ergeben, wenn zwei der drei Vektoren kollinear sind. Nehmen
wir an, v~3 hätte die gleiche Wirkungslinie wie v~2 . Dann wäre man mit obiger Taktik auf der
horizontalen Geraden gefangen und käme nicht zum Ursprung zurück.
v~3 v~2
O
In diesem Fall muss man lediglich die Taktik wechseln: Für die beiden kollinearen Vektoren gibt
es eine nicht-triviale Nullsumme - sie können sich gegenseitig aufheben. Die entsprechenden
Vorfaktoren sind schon mal ungleich Null. Nun hindert uns aber nichts daran, den Vorfaktor
von v~1 gleich Null zu setzten. Für lineare Abhängigkeit reicht es ja aus, wenn mindestens ein
Vorfaktor ungleich Null ist. Es müssen also nicht alle gleich Null sein. Im konkreten Beispiel ist
v~2 drei mal so lange wie v~3 . Eine nicht-triviale Nullsumme wäre dann
Wenn alle drei Vektoren kollinear wären, dann könnte man genau so vorgehen: Zwei Vektoren
lässt man sich gegenseitig aufheben und den dritten schrumpft man auf die Länge Null.
40
3.4 Ebenen
Während man zur Beschreibung einer Geraden einen Aufpunkt und nur einen Richtungsvektor
benötigt, braucht man zur Beschreibung von Ebenen zwei Richtungsvektoren.
41
3.5 Abstandsbetrachtungen
Unter dem Abstand zweier Objekte versteht man die Länge der kürzesten Verbindungsstrecke
der beiden Objekte. Die kürzeste Verbindungsstrecke zeichnet sich dadurch aus, dass sie senk-
recht auf die betrachteten Objekte steht, also ein Lot ist.
Dies ist eine Bestimmungsgleichung für λ; und zwar das λ, dass zum Lotfußpunkt L führt.
Konkret erhalten wir L, indem wir λ in die Geradengleichung einsetzen. Der Abstand ergibt
sich dann aus der Länge des Lots.
~
X
−−→ −−→
P X ⊥ ~u PX
(X~ − P~ ) ◦ ~u = 0
(A
~ + λ~u − P~ ) ◦ ~u = 0 Lotfußpunkt L
~ P~
42
Definition und Satz: Hesse’sche Normalenform
Die Hesse’sche Normalenform einer Ebene eignet sich, um den Abstand der Ebene zu
beliebigen Punkten quasi direkt ablesen zu können. Man erhält sie, indem man die
Ebenengleichung normiert, d.h. durch den Betrag des Normalvektors dividiert. In den
zwei Darstellungsformen bedeutet das konkret:
E: ~n ◦ (X ~ =0
~ − A)
E: n1 x1 + n2 x2 + n3 x3 − c = 0
~n
1 EH : ◦ (X ~ =0
~ − A)
EH : (n1 x1 + n2 x2 + n3 x3 − c) = 0 |~n|
|~n|
EH : ~n0 ◦ (X ~ =0
~ − A)
Dabei bezeichnet ~n0 den Einheitsvektor in Richtung ~n. Diese Gleichungen definieren alle
Punkte der Ebene, d.h. wenn man ein X ~ ∈ E auf der linken Seite einsetzt, dann kommt
tatsächlich Null heraus. Wenn man dagegen einen Punkt P ∈ / E einsetzt, kommt ein
anderer Zahlenwert ungleich Null heraus, sodass die Gleichung nicht erfüllt ist.
Im Falle der Hesse’schen Normalenform entspricht der Betrag dieses Zahlenwerts genau
dem Abstand zwischen E und P :
1
d(E, P ) =
(p1 x1 + p2 x2 + p3 x3 − c) d(E, P ) = ~n0 ◦ (P~ − A)
~
|~
n|
Wenn das Vorzeichen des Zahlenwerts positiv ist, dann liegt P auf der Seite der Ebene, in
die auch der Normalenvektor zeigt. Andernfalls liegt P auf der entgegengesetzten Seite.
Begründung:
Letztlich kann man diese Aussage durch einfache Trigonometrie verstehen. Das Skalarprodukt
können wir mithilfe des Kosinus umschreiben:
~n0 ◦ (X ~ cos ϕ = |−
~ = |~n0 | ·|P~ − A|
~ − A) →
AP | cos ϕ
|{z}
=1
−→
Hierbei bezeichnet ϕ den Winkel zwischen AP und ~n0 . Anhand der Skizze wird klar, dass AP
die Hypotenuse im rechtwinkligen Dreieck ALP ist. Der obige Ausdruck berechnet daher die
Ankathete, also d = LP . Dies funktioniert jedoch nur, wenn der Normalenvektor die Länge 1
hat. Deshalb müssen wir zunächst die Gleichung bzw. den Normalenvektor normieren, also die
Hesse’sche Normalenform bilden.
−→
AP
ϕ
P
ϕ
~n0
L
A
43
3.5.3 Abstand windschiefer Geraden (nicht im Abi 2021)
g:X
~g = A
~ + λ~u, λ ∈ R h:X
~h = B
~ + µ~v , µ ∈ R.
Die kürzeste Verbindungsstrecke zwischen windschiefen Geraden steht senkrecht auf bei-
den Geraden.
Wähle einen beliebigen Punkt P auf g1 bzw. E1 und bestimme d(P, g2 ) bzw. d(P, E2 ).
44
Verfahren: Spiegelung an den Koordinatenachsen (Vektoren und Punkte)
Kehre das Vorzeichen aller Koordinaten um, die nicht im Namen der Achse enthalten
sind (bzw. deren Achsen senkrecht zur Spiegelachse stehen).
l:X
~ = P~ + λ · ~n, λ ∈ R
Alternativ: Setze gleich das Doppelte von λ aus Schritt 2. in die Geradengleichung
ein, um P ∗ zu erhalten (L nicht zwingend notwendig).
Achtung: Das Verdoppeln von λ aus Schritt 2. funktioniert hier nicht, da λ die Position
von L auf der Geraden beschreibt und nicht wie man von P nach L kommt.
45