Beruflich Dokumente
Kultur Dokumente
Vorlesungsumdruck
J. Biermann
1 Grundbegriffe 1
1.1 Der Begriff der Menge und die reellen Zahlen . . . . . . . . . . . . . . . . 1
1.1.1 Der Begriff der Menge . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Mengendarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Standardzahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.4 Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.5 Das kartesische Produkt . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.6 Grundlegende Eigenschaften der reellen Zahlen . . . . . . . . . . . 7
1.1.7 Infimum und Supremum . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Die vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Die Summenschreibweise . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Das Prinzip der vollständigen Induktion . . . . . . . . . . . . . . 17
1.2.3 Der Binomische Lehrsatz . . . . . . . . . . . . . . . . . . . . . . . 23
1.3 Der Begriff der Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.1 Liste wichtiger Bezeichnungen bei Funktionen . . . . . . . . . . . 30
1.3.2 Das Schaubild einer reellen Funktion . . . . . . . . . . . . . . . . 31
1.3.3 Eigenschaften von Funktionen . . . . . . . . . . . . . . . . . . . . 33
1.3.3.1 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.3.3.2 Gerade – Ungerade . . . . . . . . . . . . . . . . . . . . . 34
1.3.3.3 Beschränktheit . . . . . . . . . . . . . . . . . . . . . . . 34
1.3.4 Einige grundlegende Funktionen . . . . . . . . . . . . . . . . . . . 35
1.3.4.1 Lineare Funktionen . . . . . . . . . . . . . . . . . . . . . 35
1.3.4.2 Quadratische Funktionen . . . . . . . . . . . . . . . . . 36
1.3.4.3 Potenz- und Wurzelfunktionen . . . . . . . . . . . . . . 36
1.3.4.4 Die Funktion f (x) = 1/x . . . . . . . . . . . . . . . . . . 39
1.3.4.5 Exponentialfunktion und Logarithmus . . . . . . . . . . 39
1.3.4.5.1 Rechenbeispiele mit dem Logarithmus . . . . . 42
1.3.4.5.2 Der Logarithmus zu anderen Basen . . . . . . . 44
1.3.4.6 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.1 Definition . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.2 Nullstellen und Hornerschema . . . . . . . . . . 48
1.3.4.6.3 Anzahl von Nullstellen . . . . . . . . . . . . . . 53
1.3.4.6.4 Der Fundamentalsatz der Algebra . . . . . . . . 56
1.3.4.7 Trigonometrische Funktionen und Arcusfunktionen . . . 57
1.3.4.7.1 Kreisfunktionen . . . . . . . . . . . . . . . . . . 57
1.3.4.7.2 Die Arcusfunktionen . . . . . . . . . . . . . . . 66
i
2 Lineare Gleichungssysteme und Matrizenrechnung 70
2.1 Lineare Gleichungssysteme und das Gaußsche Verfahren . . . . . . . . . . 70
2.2 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.1 Der Begriff der Matrix . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt . . . . . . . . . . . . 92
2.2.3 Quadratische Matrizen und die Umkehrmatrix . . . . . . . . . . . 101
2.2.4 Einige Matrizengruppen . . . . . . . . . . . . . . . . . . . . . . . 112
2.3 Die Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.3.1 Einführung und Definition . . . . . . . . . . . . . . . . . . . . . . 113
2.3.2 Determinante der Produktmatrix und der Transponierten . . . . . 119
2.3.3 Berechnung der Determinanten . . . . . . . . . . . . . . . . . . . 124
2.3.4 Die adjungierte Matrix . . . . . . . . . . . . . . . . . . . . . . . . 132
2.4 Der Begriff des Eigenwertes . . . . . . . . . . . . . . . . . . . . . . . . . 134
ii
4 Grundlagen der Vektorrechnung 230
4.1 Problemstellung und grundlegende Definitionen . . . . . . . . . . . . . . 230
4.2 Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
4.3 Komponentendarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
4.4 Ebenen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
4.5 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
4.6 Die Hessesche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.1 Geraden im IR2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.2 Ebenen im IR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
4.6.3 Schnittwinkel zweier Ebenen . . . . . . . . . . . . . . . . . . . . . 269
4.6.4 Abstand eines Punktes von einer Ebene . . . . . . . . . . . . . . . 270
4.6.5 Der Durchschnitt zweier Ebenen . . . . . . . . . . . . . . . . . . . 272
4.6.6 Berechnung der Hesseschen Normalform einer Ebene . . . . . . . 275
4.7 Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
Literaturverzeichnis 286
3
Kapitel 1
Grundbegriffe
Die N heißt Teilmenge der Menge M oder enthalten in der Menge M , wenn jedes
Element der Menge N auch ein Element der Menge M ist.
Beispiel: Die Menge, die aus den Zahlen von eins bis zehn besteht, ist eine Teilmenge
der Menge der Zahlen von eins bis hundert.
Als Schreibweise verwendet man:
Den Sachverhalt “N ⊂ M“ veranschaulicht man, indem man die Mengen durch Flächen
darstellt:
' $
M
N
& %
1
1.1.2 Mengendarstellungen
Aufzählung :
M = {a1 , a2 , a3 , . . . , an }
Beschreibung :
M = {x | x besitzt die Eigenschaft E}
Beispiel:
M = {1, 2, 4, 8}
M = {1, 2, 3, 4, 5, 6, 7, . . .} (= IN )
M = {x | x ∈ IN , x hat Endziffer 1}
= {1, 11, 21, . . .}
1.1.3 Standardzahlenmengen
√ π
1
−1 0 2 1 2 2 3
Die Werte fast aller zu messenden Größen sind reell, z.B. Spannung, Stromstärke, Zeit,
Länge.
Neben IR selber sind gewisse Teilmengen der reellen Zahlen sehr wichtig:
Intervalle : Seien1 a, b ∈ IR mit a < b, dann ist das offene Intervall von a und b
gegeben durch
1
“a < b“ bedeutet: a ist kleiner als b; “a ≤ b“ bedeutet: a ist kleiner als b oder gleich b; siehe später.
2
a b
I = [a, b] = {x ∈ IR | a ≤ x ≤ b}
natürliche Zahlen :
IN = {1, 2, 3, 4, 5, 6, . . .}
IN0 = {0, 1, 2, 3, 4, 5, 6, . . .}
ganze Zahlen :
ZZ = {0, ±1, ±2, ±3, ±4, ±5, ±6, . . .}
Die ganzen Zahlen liegen diskret auf der Zahlengeraden, sie besitzen den Min-
destabstand 1 voneinander.
−2 −1 0 +1 +2 +3
rationale Zahlen :
p
Q| = p ∈ ZZ , q ∈ IN = Menge der Brüche
q
= Menge der periodischen Dezimalbrüche
1 3 1 3 1 3
0 8 16 4 8 2 4 1
3
Die Menge Q| liegt dicht auf der Zahlengeraden. Das bedeutet insbesondere: Ist
x ∈ IR beliebig, so läßt sich x beliebig eng durch zwei rationale Zahlen einschach-
teln:
r1 x r2
-
IN ⊂ IN0 ⊂ ZZ ⊂ Q| ⊂ IR
I ⊂ IR
IN0 \ IN = {0} (die Menge, die nur aus der Zahl Null besteht)
ZZ \ IN = {−1, −2, −3, . . .} (die Menge der negativen Zahlen)
Q| \ ZZ = die Menge der echten Brüche
IR \ Q| = die Menge der irrationalen Zahlen
√
Die Menge der irrationalen Zahlen ist “sehr groß“. Es gilt etwa 3, π ∈ IR \ Q| .
1.1.4 Mengenoperationen
Aus zwei gegebenen Mengen A und B wird durch die folgenden Operationen jeweils eine
weitere Menge gebildet:
A B
Vereinigung A ∪ B = {x | x ∈ A oder x ∈ B}
A B
Durchschnitt A ∩ B = {x | x ∈ A und x ∈ B}
A B
Differenz A \ B = {x | x ∈ A und x 6∈ B}
2
Siehe gleich!
4
Was ist die folgende Menge?
IN \ ZZ
Da alle Elemente von IN auch in ZZ enthalten sind, handelt es sich hierbei um eine
Menge ohne Elemente. Dieses ist die sogenannte leere Menge; man bezeichnet sie durch
“∅“. Ihre formale Definition lautet:
∅ = {x | x 6= x}
Bemerkung: Neben den Zahlenmengen gibt es natürlich noch weitere Mengen; Beispiel:
{Autos}
{Einwohner Osnabrücks} ⊂ {Personen}
IR =
ˆ Gerade
Intervalle =
ˆ Strecken
=IR
ˆ
−1 1 2 3 x 4
−1
=IR
ˆ
Die waagerechte Gerade nennt man x-Achse, die senkrechte Gerade y-Achse.
5
Hierbei handelt es sich um einen Spezialfall des kartesischen Produktes; das kartesi-
sche Produkt zweier Mengen A und B ist definiert durch
A × B = {(a, b) | a ∈ A, b ∈ B}
= Menge der geordneten
Paare (a, b) mit a ∈ A
und b ∈ B
Im vorliegenden Fall hat man
IR × IR = IR2 = {(a, b) | a, b ∈ IR }
=
ˆ Ebene
M = {(x, y) ∈ IR2 | 2 ≤ x ≤ 3, 1 ≤ y ≤ 2}
= [2, 3] × [1, 2]
2
die Menge M
1
1 2 3
Definition: Sind A und B Mengen und ist R eine Teilmenge des kartesischen Produktes
dieser beiden Mengen:
R ⊂ A×B
so heißt R Relation über A und B.
Beispiel:
1. Seien A und B die Menge der Personen (A = B = {Personen}). Relationen über
A und B sind:
6
2. A = {Personen}, B = {Autos}
3. A = B = IR
Die Menge IR besitzt viele sehr bedeutsame Eigenschaften. Die grundlegensten Merk-
male der reellen Zahlen sind:
Die Körperaxiome
Je zwei reelle Zahlen a, b ∈ IR kann man mit Hilfe der Addition bzw. der Multiplika-
tion miteinander verknüpfen; Ergebnis einer solchen Operation ist wiederum eine reelle
Zahl. Die beiden Grundrechenarten Addition und Multiplikation gehorchen gewissen
Grundregeln, den sogenannten Körperaxiomen:
1. Addition
(a) Abgeschlossenheit
a, b ∈ IR =⇒ a + b ∈ IR
(b) Kommutativgesetz
a, b ∈ IR =⇒ a+b=b+a
(c) Assoziativgesetz
a, b, c ∈ IR =⇒ (a + b) + c = a + (b + c)
7
(e) inverses Element
Schreibweise: ã = −a
2. Multiplikation
(a) Abgeschlossenheit
a, b ∈ IR =⇒ a · b ∈ IR
(b) Kommutativgesetz
a, b ∈ IR =⇒ a·b=b·a
(c) Assoziativgesetz
a, b, c ∈ IR =⇒ (a·b)·c = a·(b·c)
1 = a−1
Schreibweise: ã = a
3. Distributivgesetz
a, b, c ∈ IR =⇒ a · (b + c) = a · b + a · c
Bemerkung:
• Eine nicht leere Menge, für deren Elemente die beiden Verknüpfungen “+“ und
“·“ erklärt sind, so daß die oben genannten Axiome gelten, heißt Körper. Ist nur
eine Addition mit den zugehörigen Grundregeln erklärt, so heißt die Menge (kom-
mutative) Gruppe. (Beispiel: ZZ ist eine Gruppe, nicht jedoch IN ).
Aus den Körperaxiomen leitet man alle weiteren rechnerischen Eigenschaften der reellen
Zahlen ab. Als Beispiel wird der folgende Satz bewiesen:
8
Beweis:
x · 0 = x · (0 + 0) (da Null neutral bezügl. +)
x·0 = x·0+x·0 | −x · 0 (Distributivgesetz)
0 = x·0
qed.
Man beachte, daß bei diesem Beweis nichts anderes als die Körperaxiome verwendet
wurden! Ähnlich zeige man unter anderem: Für alle x ∈ IR ist x = −(−x).
Die Anordnungsaxiome
Mit den Elementen der Menge IR kann nicht nur gerechnet werden, sie sind zusätzlich
auch angeordnet. Die Anordnung ergibt sich sofort mit Hilfe der Zahlengeraden: man
trifft für zwei Zahlen a, b ∈ IR die folgende Festlegung:
a liegt auf der Zahlengeraden links von b ⇔ a ist kleiner als b bzw. a < b
IR
−1 0 1 2
a b
Entsprechend definiert sind die übrigen Anordnungsrelationen
a ≤ b : a ist kleiner oder gleich b
a > b : a ist größer als b
a ≥ b : a ist größer oder gleich b
9
Ebenso wie für die Addition und Multiplikation bestehen Grundregeln für die Anordnun-
grelationen, die sogenannten Anordnungaxiome. Sie werden hier für “<“ formuliert,
gelten aber auch entsprechend für “≤“, “>“ und “≥“.
1.
a, b ∈ IR =⇒ es gilt genau eine der drei Beziehungen
a < b, a = b, b < a
2. Transitivität
a, b, c ∈ IR mit a < b, b < c =⇒ a<c
3.
a, b, c ∈ IR mit a < b =⇒ a+c<b+c
4.
a, b, c ∈ IR mit a < b und c > 0 =⇒ a·c<b·c
Ebenso grundlegend wie die Anordnungsaxiome selber sind die ersten Folgerungen, die
man aus ihnen zieht:
1.
a > 0 ⇔ 0 > −a
2. Eine Ungleichung kehrt sich um, wenn man sie mit einem Faktor kleiner als Null
multipliziert: Für c < 0 gilt:
3. Eine Ungleichung zwischen Zahlen größer Null kehrt sich beim Übergang zu den
Inversen um: Für a, b > 0 gilt:
4.
a>b>0
⇒ a·c > b·d
c>d>0
a2 ≥ 0
a2 > 0 ⇔ a 6= 0
10
1.
a > 0 | +(−a)
⇒ 0 > −a
2. Es gilt c < 0 ⇒ −c > 0, also folgt:
a > b | ·(−c) (> 0)
⇔ a · (−c) > b · (−c) | +(a · c + b · c)
⇔ b·c > a·c
⇔ a·c < b·c
3.
a < b | ·a−1 · b−1 (> 0)
⇔ b−1 < a−1
⇔ a−1 > b−1
4. Als Übung!
5. Als Übung!
6. Als Übung!
qed.
Der Betrag
Die reellen Zahlen besitzen eine Bewertung. Diese Bewertung wird durch den Betrag
geliefert: Man setzt für eine reelle Zahl x ∈ IR
x 0
= Abstand von x zu 0 auf der Zahlengeraden -
x für x ≥ 0
=
−x für x < 0
0 x y
-
|x − y|
11
Die Begründung dieser Aussage erhält man, wenn man x und y auf der Zahlengeraden
um −y verschiebt:
x−y y−y
0 x y
- -
|x − y| |x − y|
1.
|x| = 0 ⇔ x = 0
2.
|x − y| = 0 ⇔ x−y = 0 ⇔ x = y
3.
| − x| = |x|, |x − y| = |y − x|
4.
|x| · |y| = |x · y|
5.
= |x|
x
für y 6= 0
y |y|
|a + b| ≤ |a| + |b|
|a − b| ≤ |a| + |b|
|a − b| ≥ |a| − |b|
Das Rechnen mit Beträgen wird anhand eines wichtigen Beispiels vorgeführt. Das Er-
gebnis der Rechnung dieses Beispiels wird später oft verwendet werden. Vorgegeben
seien
a ∈ IR und ε ∈ IR mit ε > 0
12
Wie sieht dazu die folgende Menge aus?
M = {x ∈ IR | |x − a| < ε}
Der sicherste Weg, den man beim Beantworten einer solchen Frage einschlagen kann,
besteht in einer Fallunterscheidung nach dem Vorzeichen des Ausdrucks innerhalb der
Betragsstriche. Liegt das Vorzeichen des Ausdrucks innerhalb der Betragsstriche fest, so
können die Betragsstriche durch Klammern ersetzt werden (u. U. mit Voranstellen eines
Minuszeichens), und man erhält einen üblichen arithmetischen Ausdruck. In Einzelfällen
bieten sich neben der Fallunterscheidung natürlich noch weitere Berechnungsmöglich-
keiten an.
Hier lautet die Fallunterscheidung:
1. x − a ≥ 0 ⇔ |x − a| = x − a ⇔ x ≥ a
2. x − a < 0 ⇔ |x − a| = a − x ⇔ x < a
0 a−ε x a a+ε
-
die Menge M
Die Menge M bezeichnet man als ε-Umgebung von a und schreibt sie in der Form
Uε (a) (1.2)
13
1.1.7 Infimum und Supremum
K ≤ x für alle x ∈ M
K die Menge M
2. Gibt es eine Konstante L ∈ IR mit der Eigenschaft
x ≤ L für alle x ∈ M
die Menge M L
3. Gibt es Konstanten K, L ∈ IR mit der Eigenschaft
K ≤ x ≤ L für alle x ∈ M
Die Zahlen K und L heißen untere Schranke bzw. obere Schranke der Menge M .
Man beachte, daß die Schranken einer Menge nicht eindeutig bestimmt sind!.
die Menge M L1 L2
1. Die Menge M ∈ IR sei nach oben beschränkt; dann heißt die kleinste obere Schran-
ke das Supremum der Menge M . Man schreibt für das Supremum von M
sup M
2. Die Menge M ∈ IR sei nach unten beschränkt; dann heißt die größte untere
Schranke das Infimum der Menge M . Man schreibt für das Infimum von M
inf M
14
−1 0 1
Dann gilt inf M = −1 und sup M = 1. Insbesondere erkennt man: inf M 6∈ M und
sup M ∈ M .
sup M ∈ M
so heißt sup M das Maximum von M ; man schreibt für das Maximum von M :
max M
inf M ∈ M
so heißt inf M das Minimum von M ; man schreibt für das Minimum von M :
min M
Beispiel: Bei endlichen Mengen M ∈ IR sind stets max M und min M vorhanden.
Begründung: Eine endliche Menge M ∈ IR besitzt die Gestalt M = {a1 , a2 , . . . , an } mit
reellen Zahlen a1 , . . . , an . Die größte dieser Zahlen ist das Maximum, die kleinste das
Minimum von M .
Eine sehr wichtige Eigenschaft des Supremums stellt der folgende Sachverhalt dar3 :
Sei M ∈ IR nach oben beschränkt, und sei x0 = sup M . Sei weiter
x ∈ IR mit x < x0
x y
x0
M
Begründung: Gälte y ≤ x für alle y ∈ M , so wäre x eine noch kleinere obere Schranke
von M als x0 . Dieses wäre ein Widerspruch zu x0 = sup M .
3
der, entsprechend formuliert, auch für das Infimum gilt.
15
1.2 Die vollständige Induktion
1.2.1 Die Summenschreibweise
Die vollständige Induktion stellt ein Schema dar, mit dessen Hilfe man viele Aussagen im
Zusammenhang mit natürlichen Zahlen beweisen kann. Das zugrundeliegende Prinzip
ist nicht nur für die Mathematik sondern auch für die Informatik sehr bedeutsam.
Da wir die vollständige Induktion u. a. anhand von Formeln, in denen Summen vor-
kommen, kennenlernen wollen, ist es günstig, sich zuvor mit der Summenschreibweise
zu befassen.
Bei der Addition mehrerer Summanden führt man zur abkürzenden Schreibweise das
sogenannte Summenzeichen ein: Für reelle Zahlen4
a1 , a2 , . . . , an (n ∈ IN )
Beispiele:
10
X 1 1 1 1
= + + ... +
i=1
2+i 3 4 12
100
X
i = 1 + 2 + 3 + . . . + 100 (mit ai = i)
i=1
In dem Ausdruck n
X
ai
i=1
heißt der Index i Summationsindex , die Indexwerte 1 und n sind die untere - und die
obere Summationsgrenze. Man beachte, daß die untere Summationsgrenze einen anderen
ganzzahligen Wert als 1 annehmen kann. Ein häufig vorkommender Wert der unteren
Summationsgrenze ist Null. Ist der Wert der unteren Summationsgrenze größer als der
der oberen, so handelt es sich um eine leere Summe. Die leere Summe ist eine Summe
ohne Summanden, ihr wird der Wert Null zugeordnet.
Bedeutsam für den Umgang mit dem Summenzeichen sind die folgenden Regeln5 : (n, m ∈
4
Die ai sind indizierte Unbestimmte, i ist der Index, die Indexwerte sind hier 1, 2, 3, . . . , n.
5
Diese Regeln gelten entsprechend für eine beliebige untere Summationsgrenze.
16
IN , 1 ≤ m ≤ n)
n
X m
X n
X
1) ai = ai + ai (Aufteilung)
i=1 i=1 i=m+1
n
X n
X
2) λ· ai = (λ · ai ) mit λ ∈ IR (Ausmultiplizieren)
i=1 i=1
n
X n
X n
X
3) ai + bi = (ai + bi ) (gliedweise Addieren)
i=1 i=1 i=1
n
X n+l
X
4) ai = ai−l (Indexverschiebung um l ∈ ZZ )
i=1 i=1+l
Beweis: (Durch vollständige Induktion) Zunächst wird die Aussage für n = 1 gezeigt;
dieses ist der sogenannte Induktionsanfang:
Sei also n = 1; setzt man dieses in beide Seiten von (1.3) ein, so erhält man:
1
X
linke Seite = i = 1
i=1
1(1 + 1)
rechte Seite = = 1
2
Beide Seite besitzen für n = 1 denselben Wert; damit ist (1.3) für n = 1 bewiesen.
Im zweiten Schritt, dem sogenannten Induktionsschluß nimmt man an, die Behauptung
sei bereits für n − 1 bewiesen, und leitet daraus die Behauptung für n selber ab.
Man beginnt, indem man in die Formel (1.3) für n den Ausdruck n − 1 einsetzt:
n−1
X (n − 1)n
i =
i=1
2
17
Dieses ist die Induktionsvoraussetzung, von deren Richtigkeit man ausgeht und aus der
man durch zulässige Umformungsschritte die Aussage für n selber herzuleiten versucht:
n−1
X (n − 1)n
i = 2
+n
i=1
n
X (n − 1)n
⇒ i = 2 +n
i=1
(n − 1)n + 2n
= 2 = n· n+
2
1
Mit der letzten Zeile wurde die Gleichung (1.3) für den Fall n hergeleitet. qed.
Die Gleichung (1.3) ist hiermit vollständig bewiesen. Dieses wird deutlich, wenn man
das allgemeine Prinzip der vollständigen Induktion betrachtet:
Das gestellte Ziel bei der vollständigen Induktion besteht darin, eine Aussage P (n)
für alle n ∈ IN zu beweisen. Dieser Beweis wird in zwei Schritten ausgeführt: dem
Induktionsanfang und dem Induktionsschluß.
1. Man weist nach, daß die Aussage für n = 1, wahr ist, d. h. man beweist P (1).
2. Man setzt voraus, daß P (n − 1) bereits bewiesen ist ( Induktionsvoraussetzung“)
”
und leitet daraus P (n) ab (n ≥ 2), d. h. man beweist die Richtigkeit der Folgerung
P (n − 1) =⇒ P (n) für n ≥ 2.
Damit ist die Aussage für alle n ∈ IN bewiesen: für jedes feste n ≥ 2 folgt das aus der
Gültigkeit der Ableitungskette
P (1) ⇒ P (2) ⇒ · · · ⇒ P (i − 1) ⇒ P (i) ⇒ · · · ⇒ P (n)
| {z } | {z }
wurde direkt ge- diese Folgerung wur-
zeigt de gezeigt
Zur Verdeutlichung soll noch einmal klargestellt werden, warum die Aussage P (n) für
ein beliebig ausgewähltes n0 ∈ IN (d. h. P (n0 )) richtig ist:
P (n0 ) gilt, da P (n0 − 1) gilt.
P (n0 − 1) gilt, da P (n0 − 2) gilt.
P (n0 − 2) gilt, da P (n0 − 3) gilt.
usw.
18
Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang):
linke Seite = 12 = 1
1(1 + 1)(2 + 1)
rechte Seite = = 1
6
“n − 1 ⇒ n“ (Induktionsschluß): In (1.4) wird für n der Ausdruck n − 1 eingesetzt; die
so entstehende Induktionsvoraussetzung wird geeignet weiter umgeformt:
n−1
X (n − 1)n(2n − 1)
i2 = 6
+ n2
i=1
n
X (n − 1)n(2n − 1)
⇒ i2 = 6 + n2
i=1
(n − 1)n(2n − 1) + 6n2
= 6 (n ausklammern)
(n − 1)(2n − 1) + 6n
= n· 6 (ausmultiplizieren)
(2n2 + 2n) + (n + 1)
= n· 6 (n + 1 ausklammern)
(2n + 1)
= n · (n + 1) · 6
Dieses ist die zu beweisende Aussage (1.4) für den Fall n. qed.
Die vollständige Induktion ist nicht zum Nachweis von Summenformeln geeignet. Im
weiteren Verlauf der Vorlesungen wird man dazu noch mehrere Bespiele sehen. Eben-
so geben die nächsten beiden Anwendungen einen Hinweise auf die vielfältigen Ein-
satzmöglichkeiten der vollständigen Induktion.
5n + 7 (1.5)
durch 4 teilbar.
Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang): Setzt man in (1.5) n = 1 ein, so erhält man den Wert 12,
und 12 ist durch 4 teilbar. Die Behauptung ist damit für den Fall n = 1 beweisen.
“n − 1 ⇒ n“ (Induktionsschluß): Vorausgesetzt wird, daß für jedes n ≥ 2 der Ausdruck
5n−1 + 7 durch 4 teilbar ist. Zu zeigen ist dann, daß sich daraus die
ergibt. Dazu ist der Ausdruck 5n + 7 geeignet auf den Vorgängerausdruck 5n−1 + 7
19
zurückzuführen:
5n + 7 = 5 · 5n−1 + 7
= (4 + 1) · 5n−1 + 7
= 5n−1}
|4 · {z + n−1
|5 {z+ 7} (1.6)
durch 4 teilbar durch 4 teilbar nach
Induktionsvoraussetzung
Als Summe zweier durch 4 teilbarer Ausdrücke ist auch 5n + 7 durch 4 teilbar. Damit
ist alles bewiesen. qed.
Der nächste Satz, an dessen Beweis die vollständige Induktion vorgeführt werden soll,
betrifft eine sehr wichtige Größe, die sogenannte Fakultät:
Definition: Sei n ∈ IN0 ; dann heißt die Zahl
(
1 für n = 0
n! = (1.7)
1 · 2 · 3 · . . . · n für n > 0
Man beachte, daß die Werte der Fakultät sehr schnell sehr groß werden. Es ist etwa
10! = 3628800 sowie 20! = 2432902008176640000.
Die Fakultät besitzt eine sehr wichtige Deutung; dieses ist Inhalt des folgenden Satzes
Satz: Für n ∈ IN sei eine Menge mit n Elementen gegeben. Dann ist der Wert n! die
Anzahl der Möglichkeiten, die n Elemente dieser Menge anzuordnen.
a, b, c b, a, c b, c, a
a, c, b c, a, b c, b, a
a1
angeordnet werden. Somit bestehen in der Tat für diese Menge 1 = 1! Anordungsmöglich-
keiten, und die Behauptung wäre damit für den Fall n = 1 bewiesen.
“n − 1 ⇒ n“ (Induktionsschluß): Man betrachte für n ≥ 2 die Menge mit n Elementen
M = {a1 , a2 , a3 , . . . , an }
20
und dazu deren Teilmenge ohne das letzte Element
M 0 = {a1 , a2 , a3 , . . . , an−1 }
• Bei Hinzunahme des Elementes an können aus jeder einzelnen Anordung der
a1 , . . . , an−1 genau n Anordnungen der n Elmente a1 , . . . , an−1 , an gebildet wer-
den.
Geht man nämlich von einer bestenden, festen Anordnung der a1 , . . . , an−1 aus, so
gibt es n verschiedene Möglichkeiten, an in diese Anordnung einzufügen:
an an an an an an an
? w ? w ? w ? w ? r r r ? w ?
(n − 1)! · n
|{z} (1.8)
| {z }
Anzahl der Jede einzelne
Anordnungen Anordnungen
der a1 , . . . , an−1 der a1 , . . . , an−1
nach liefert
Induktions- n Anordnungen
voraussetzung der a1 , . . . , an .
= 1 · 2 · 3 · · · (n − 1) · n = n! (1.9)
| {z }
(n−1)!
Bemerkung: Es ist nicht so, daß die vollständige Induktion immer bei n = 1 beginnen
muß. Es ist auch möglich, den Induktionsanfang bei n = a mit einem beliebigen a ∈ ZZ
beginnen zu lassen. Dadurch wird dann die Richtigkeit einer Aussage P (n) für n ∈ {u |
u ∈ ZZ und u ≥ a} bewiesen. Das Schema der vollständigen Induktion wird aber in
einem solchen Fall ganz entsprechend angewandt.
6
Man müßte zur Vollständigkeit noch zeigen, daß jede Anordnung der a1 , . . . , an sich auf diese Weise
aus einer Andordnung der a1 , . . . , an−1 gewinnen läßt. Das ist aber klar!
21
In den beiden folgenden Beweisen erfolgt der Induktionsanfang nicht bei n = 1. Die
zugehörigen Aussagen dienen hier nicht nur als Beispiel für die vollständige Induktion,
sie sind auch für das Folgende sehr bedeutsam. Dazu gehört vor allen Dingen die sehr
häufig verwendete Summenformel für die endliche geometrische Reihe:
Satz: (Summenformel für die endliche geometrische Reihe) Für n ∈ IN0 und q ∈ IR
mit q 6= 1 gilt
n
X 1 − q n+1
qi = (1.10)
i=0
1−q
Beweis: (Durch vollständige Induktion) Hier wird der Induktionsanfang bei n = 0 durch-
geführt:
“n = 0“ (Induktionsanfang):
linke Seite = q 0 = 1
1 − q 0+1 1−q
rechte Seite = = = 1
1−q 1−q
“n − 1 ⇒ n“ (Induktionsschluß):
n−1
X 1 − qn
qi = 1−q
+ qn
i=0
n
X 1 − qn n 1−q
⇒ qi = 1−q + q · 1−q (Ausmultiplizieren und bei-
i=0 de Brüche zusammenfassen)
1 − q n + q n − q n+1 1 − q n+1
= 1−q = 1−q
qed.
Im nächsten Satz ist die Aussage nur für n ≥ 2 gültig, der Induktionsanfang wird bei
n = 2 durchgeführt.
(1 + a)2 = 1 + 2a + a2
> 1 + 2a
22
Die Ungleichung gilt, da in der letzten Zeile der positive Summand a2 weggelassen
wurde. Die so hergeleitete Ungleichung stellt genau die Aussage (1.11) für n = 2 dar.
“n − 1 ⇒ n“ (Induktionsschluß): Setzt man in (1.11) für n den Ausdruck n − 1 ein, so
erhält man als Induktionsvoraussetzung die Ungleichung
Wegen a > −1 ist 1 + a > 0. Multipliziert man eine Ungleichung mit einem positi-
ven Faktor, so bleibt diese gemäß der Anordnungsaxiome erhalten. Damit kann man
schließen:
(1 + a)n−1 > 1 + (n − 1)a × (1 + a)
qed.
Bemerkung: In diesem Beweis wurde zweimal die folgende Aussage verwendet: Läßt man
auf einer Seite einer Gleichung einen positiven Summanden weg, so wird diese Seite der
Gleichung kleiner als die andere. Anders ausgedrückt lautet dieses: Für x, y, z ∈ IR
mit x = y + z und z > 0 folgt x > y. Aufgabe: Leiten Sie diese Aussage aus den
Anordnungsaxiomen ab.
Frage: An welchen Stellen gingen im Beweis der Bernoullischen Ungleichung die Voraus-
setzungen a > −1 und ≥ 2 ein?
Vorbereitend für den Binomischen Satz wird der sogannate Binomialkoeffizient ein-
geführt. Er baut auf der Fakultät (siehe Seite 20) und zählt ebenso wie diese zu den
Grundbegriffen der Kombinatorik 7 .
23
Aus der Definition des Binomialkoeffizienten ergeben sich sofort einige Regeln:
n n
= = 1
0 n
n n
= = n
1 n−1
n n
=
k n−k
Bemerkung: Man erhält eine zum praktischen Rechnen geeignetere Darstellung des Bi-
nomialkoeffizienten, wenn man die Fakultät im Zähler sowie die zweite Fakultät im
Nenner ausschreibt und anschließend kürzt:
n n!
=
k k! · (n − k)!
n · (n − 1) · · · (n − k + 1) · (n − k) · (n − k − 1) · · · 1
=
k! · (n − k) · (n − k − 1) · · · 1
n · (n − 1) · · · (n − k + 1)
= (1.12)
k!
Ebenso wie die Fakultät besitzt der Binomialkoeffizient eine Bedeutung im Zusammen-
hang mit endlichen Mengen:
Ist eine Menge mit n Elementen gegeben, so gibt der Binomialkoeffizient nk an, wie viele
Möglichkeiten bestehen, aus dieser Menge eine Teilmenge von k Elementen auszuwählen.
Beispiel: Beim Samstagslotto werden aus 49 Kugeln 6 Kugeln ausgewählt. Dabei beste-
hen 49
6
Auswahlmöglichkeiten.
' $
t
t t t
t t Wie viele Möglichkeiten beste-
t t t t t
t t hen, aus 20 Elementen 5 aus-
t t
t t zuwählen?
t t t
& %
Die Deutung des Binomialkoeffizienten soll plausibilisiert werden. Dazu wird ähnlich
wie bei der Plausibilisierung der Deutung der Fakultät vorgegangen: man kann jede
k-elementige Teilmenge erzeugen, indem man aus den insgesamt n Elementen nachein-
ander k Elemente auswählt. Es soll zunächst gezählt werden, wie viele Möglichkeiten
solcher k-fachen Auswahlen aus einer n-elementigen Menge bestehen:
24
Für das erste Element bestehen n Aus-
wahlmöglichkeiten.
Für das zweite Element verbleiben n−1 Dieses ergibt soweit n·(n−1) Auswahl-
Auswahlmöglichkeiten. möglichkeiten.
Für das dritte Element verbleiben n−2 Dieses ergibt soweit n · (n − 1) · (n − 2)
Auswahlmöglichkeiten. Auswahlmöglichkeiten.
usw.
Für das k − 1-te Element verbleiben Dieses ergibt soweit
noch n − (k − 2) = n − k + 2 Auswahl- n · (n − 1) · (n − 2) · · · (n − k + 2) Aus-
möglichkeiten. wahlmöglichkeiten.
Für das k-te Element verbleiben Dieses ergibt insgesamt
schließlich n − (k − 1) = n − k + 1 Aus- n·(n−1)·(n−2) · · · (n−k+2)·(n−k−1)
wahlmöglichkeiten. Auswahlmöglichkeiten.
Nun kommen bei diesen k-fachen Auswahlen nicht nur alle k-elementigen Teilmengen
vor; es kommt unter ihnen vielmehr jede mögliche Anordnung einer jeden k-elementigen
Teilmengen vor. Damit ergibt sich:
25
Beweis:
n−1 n−1
+
k−1 k
(n − 1)! (n − 1)!
= +
(k − 1)! · (n − 1 − (k − 1))! k! · (n − 1 − k)!
(n − 1)! · k (n − 1)! · (n − k)
= +
k · (k − 1)! · (n − k)! k! · (n − k − 1)! · (n − k)
(n − 1)! · k + (n − 1)! · (n − k)
=
k! · (n − k)!
Jetzt folgt der Satz, der das Hauptziel dieses Abschnitts darstellt. Er ist eine Verallge-
meinerung der ersten Binomischen Formel:
“n − 1 ⇒ n“ (Induktionsschluß):
n−1
n−1
X n − 1 k n−1−k
· (a + b)
(a + b) = a b
k=0
k
n−1
X n−1
(a + b)n
= (a + b) · ak bn−1−k (ausmultiplizieren)
k=0
k
n−1 n−1
X n−1 k+1 n−1−k
X n − 1 k n−k
= a b + a b
k=0
k k=0
k
26
Bei der ersten dieser beiden Summen wird eine Indexverschiebung durchgeführt, indem
bei allen Summanden dieser Summe k durch k − 1 ersetzt und die beiden Indexgrenzen
entsprechend angepaßt werden:
n n−1
n
X n − 1 k n−k X n − 1 k n−k
(a + b) = a b + a b
k=1
k − 1 k=0
k
n−1 n−1
n − 1 n X n − 1 k n−k X n − 1 k n−k n−1 n
= a + a b + a b + b
n−1 k=1
k−1 k=1
k 0
| {z } | {z }
zu k=n zu k=0
Aus der ersten Summe ist der letzte, aus der zweiten der erste Summand herausgenom-
men worden. Die Indexbereiche beider Summen sind damit gleich, die beiden Summen
können zusammengefaßt werden. Man schließt weiter:
n−1
n n−1 n X n−1 n−1 k n−k n−1 n
(a + b) = a + + a b + b
n−1 k=1 |
k−1 k 0
| {z } {z } | {z }
=1=(n
n)
=(n
k)
(nach (1.13)) =1=(n
0)
n−1
n n X n k n−k n n (Alles unter ein Sum-
= a + a b + b
n k 0 menzeichen bringen.)
| {z } k=1 | {z }
zu k=n zu k=0
n
X n k n−k
= a b
k=0
k
qed.
Beispiel:
1. Sei M = {Menschen}, N = {Zeichenketten} und
f : M 7→ N mit f (x) =der vollständige Name von x“
”
Unter der Annahme, daß jeder Mensch genau einen Namen besitzt, ist f (x) eine
Funktion.
27
2. Die Temperatur T , die an einem bestimmten Ort herrscht, wird während der Zeit
von t = a bis t = b betrachtet; diese liefert eine Zuordnung
t 7→ T = f (t) für a ≤ t ≤ b
Zwischen zwei endlichen Mengen läßt sich eine Funktion folgendermaßen darstellen:
f
' $ ' $
w - w
1
w
w
XX : w
XXX
w : w
X
X
XXX
w z w
XXX
X
w
w
& % & %
M N
Bedeutsam ist bei einer Funktion, daß von jedem Element der links stehenden Menge
M genau ein Pfeil ausgeht. Bei einer Funktion f : M 7→ N ist jedoch möglich,
• daß es x1 , x2 ∈ M mit x1 6= x2 , aber
f (x1 ) = f (x2 )
gibt;
f (x) = y
f (x1 ) 6= f (x2 )
Bei einer umkehrbaren Funktion entsprechen sich alle Elemente von M und N paar-
weise (siehe Zeichnung). Die Bezeichnung umkehrbar“ wird durch den folgenden Satz
”
gerechtfertigt.
28
M f N
' $ ' $
| - |
| - |
|
|
XX
XXX
X
:
z |
XX
|
X
& % & %
:
g◦f XX
XXX
XXX
XX
' $f ' $g '
z
$
| - | - |
|
: - |
| |
: |
PP :
P PP
P
|
PP
PPP
|
P
P P
PPP P
|
PP
PP P
| q |
PP
PP
q P
& % & % & %
M N P
29
Beispiel: M = N = P = IR
f : x −→ x + 1
g : x −→ x2
g ◦ f : x −→ (x + 1)2
f : M 7→ N
x −→ f (x) Angabe der Zuordnungsvorschrift
y = f (x) Beispiel: M = N = IR , x 7→ f (x) = x3
Dmax 1
x −→
1−x
Dmax = IR \ {1}
Bemerkung: Die Funktion ist genau dann surjektiv , wenn N = f (M ), d. h. wenn die
Zielmenge gleich dem Wertebereich ist.
30
1.3.2 Das Schaubild einer reellen Funktion
Man stellt eine reelle Funktion
f : M 7→ N dabei ist M, N ⊂ IR
anschaulich dar, in dem man in der Ebene IR2 die Punkte mit den Koordinaten (x, f (x)
für x ∈ M kennzeichnet. Bei vielen Funktionen ergeben die so markierten Punkte eine
Kurve bzw. mehrere Kurvenstücke.
Beispiel: Die reelle Funktion f : IR 7→ IR sei definiert durch
(x − 2)2 1
f (x) = +
2 2
Das Schaubild dieser Funktion oberhalb des Intervalls [0, 4] ist
3
... .. f (x)
... ..
... .
2 ...
... ...
.... .
y .... ......
.... ..
..... .
. ...
.
1 ..... ...u (3, f (3)) = (3, 1)
.......
.......... ...
. .....
.
...........................
0
0 1 2 3 4
x
Anhand des Schaubildes erkennt man leicht, ob es auch wirklich eine Funktion darstellt:
Oberhalb eines jeden Punktes aus dem Definitionsbereich M ⊂ IR muß genau ein Punkt
des Schaubildes liegen.
31
2. es gibt für x > 4 kein y ∈ IR mit f (x) = y
• indem man das Schaubild von y = f (x) verwendet, dabei jedoch y als unabhängige
und x als abhängige Veränderliche auffaßt;
• oder, damit wie üblich die Achse der unabhängigen Veränderlichen die waagerechte
Achse ist, indem man die beiden Achsen durch Spiegelung an der Winkelhalbie-
renden x = y vertauscht und gleichzeitig die beiden Variablen x und y ineinander
umbenennt. Das Schaubild von f −1 ist dann genau das Spiegelbild des Schaubildes
von f .
−1
5 . f (x) .
.. . . ...
.. .. .
.. . ...
..
.. .. .
4 .. . ... .
.. ..
.. . . ...
..
... .
. ... f (x)
3
.. .
.
. ... ...
...
.........
..
. .....
...
.
. .. ...
............
.....
y ... . ...
.. .
..............
2
.. .. .....
.........
... ... ... ..................
.......................
.
..
... . ..
.
1 .......................... ......
......... .
... . .
.............. .
.. .. ...
.. .
. . ...
.
... .
.. ... ...
−1 .. . . 1 2 3 4 5
... ..
.
... . x
.. −1 ..
f : IR 7→ IR mit f (x) = x2
ist nicht umkehrbar: sie ist weder surjektiv (die negativen Zahlen werden nicht angenom-
men) noch eineindeutig (es ist etwa 1 = f (−1) = f (+1)). Um von f (x) = x2 dennoch
noch eine Umkehrfunktion zu erhalten, schränkt man sowohl den Definitionsbereich als
auch die Zielmenge von f (x) auf die Menge der nicht negativen Zahlen ein; die dadurch
entstehende Funktion
f : {x ∈ IR | x ≥ 0} 7→ {y ∈ IR | y ≥ 0}
√
x 7→ x
32
f (x) = x2
9 ... ..
.. ...
.. ..
8 .. .
... .. .
.. ..
7
... . ... .
. ..
6 ... .. ..
. .. .
5 ... .
...
.
y .
... ... .
4 . ..
... . ... √
.. f −1 (x) = x
3 ... .. ... ................
...
...
...
. .
... ... .. .....
.....
. ..
.......................
.........
2 . ... ..............
.........................
...
1 ..........
................
0 .......
0 1 2 3 4 5 6 7 8 9
x
Abbildung 1.1: Bei der Umkehrung von f (x) = x2 werden die beiden negativen Halb-
achsen weggelassen.
√
Dabei ist x die positive Quadratwurzel von x. Nunmehr besitzt f in der Tat eine Um-
kehrfunktion (die Quadratwurzelfunktion); diese ist aber nur auf dem eingeschränkten
Definitionsbereich, d.h. den nichtnegativen reellen Zahlen definiert.8 Weiterhin liegen
die Werte der Umkehrfunktion in der eingeschränkten Zielmenge der Ausgangsfunktion
f .9
33
1.3.3.2 Gerade – Ungerade
• f : IR 7→ IR heißt eine gerade Funktion, falls f (−x) = f (x) für alle x ∈ IR ist.
• f : IR 7→ IR heißt eine ungerade Funktion, falls f (−x) = −f (x) für alle x ∈ IR
ist.
1.3.3.3 Beschränktheit
Sei f : M 7→ N eine reelle Funktion. f heißt
nach oben beschränkt , falls die Bildmenge f (M ) nach oben beschränkt ist,
nach unten beschränkt , falls die Bildmenge f (M ) nach unten beschränkt ist,
beschränkt , falls die Bildmenge f (M ) beschränkt ist.
Beispiel: Eine häufig verwendete Funktion ist die sogenannte Gaußklammer einer re-
ellen Zahl x; man schreibt dafür f(x) = [x]. Die Definition der Gaußklammer lautet:
[x] ist somit die größte ganze Zahl, die kleiner oder gleich x ist. Dieses ist genau der
ganze Anteil der reellen Zahl x. Für x > 0 entspricht das dem Weglassen der Nachkom-
mastellen von x. Die Gaußklammer besitzt das folgende Schaubild:
y
d
f(x) = [x]
2 d
1 d
d x
-1 1 2 3
d -1
Man beachte, daß etwa [π] = 3, aber [−π] = −4 ist. Prüft man nun nach, welche der
oben beschrieben Eigenschaften bei der Gaußklammer erfüllt ist, so stellt man fast, daß
die Gaußklammer
34
• weder injektiv noch surjektiv und damit auf keinen Fall umkehrbar ist,
• monoton wachsend, aber nicht streng monoton wachsend ist,
• nicht monoton fallend ist,
• weder gerade noch ungerade ist
• und weder nach oben noch nach unten beschränkt ist.
Aufgabe: Man begründe diese Aussagen über die Gaußklammer.
x
Die beiden Koeffizienten besitzen eine anschauliche Bedeutung: Bei b handelt es sich um
den y-Achsenabschnitt; es ist nämlich f(0) = b.
f(x) = ax +
b
f(x1 )
∆f
f(x0 )
b ∆x
x0 x1
Der Koeffizient a stellt die konstante Steigung, d. h. den Zuwachs der Funktion im
Verhältnis zur Differenz der zugehörigen x-Werte dar. Man rechnet nämlich nach:
∆f = f(x1 ) − f(x0 ) = (ax1 + b) − (ax0 + b) = a x1 − x0 = a (1.19)
∆x x1 − x0 x1 − x0 x1 − x0
Ist b = 0, also f(x) = a x, so ist f(x) linear im engeren Sinne. Zur Abgrenzung davon
nennt man solche Funktionen im Falle b 6= 0 auch als affin-linear.
10
eine unendliche ungekrümmte Linie
35
1.3.4.2 Quadratische Funktionen
Eine quadratische Funktion ist mit Koeffizienten a, b, c ∈ R, a 6= 0 durch
f(x) = a x2 + b x + c (1.20)
gegeben.
Häufig betrachtet man normierte quadratische Funktionen. Hierbei besitzt der höchste
Koeffizient a den Wert 1. Die verbleiben Koeffizienten bezeichnet man in der Regel mit
p und q:
f(x) = x2 + p x + q (1.21)
Zum Finden der Nullstellen, d. h. zum Lösen der Gleichung f(x) = 0, verwendet man
die bekannte “p-q-Formel“:
p 1p 2
− ± p −4q (1.22)
2 2
Man setzt dazu D = p2 − 4 q. Im Falle D > 0 liefert (1.22) zwei, im Falle D = 0 eine
und im Falle D < 0 keine (reelle) Lösung.
Für die weitere Betrachtung ist eine Unterscheidung zwischen geraden und ungeraden
Exponenten n vorteilhaft. Sei zunächst n ungerade. In diesem Fall sind die Funktionen
(1.23) streng monoton wachsend; sie sind sogar injektiv und surjektiv und damit umkehr-
bar (bijektiv). Man kann dieses anhand der Schaubilder erkennen, die hier beispielhaft
für x3 und x7 gezeichnet sind:
36
2 . x7
...
..
...... x3
...
1 .
......
...
.........
... .
......................
........ .................................................................................
..................................
−1..... .......... 1
.........
......
...... −1
. ..
..
...
.
−2
Die Umkehrfunktion ist die Wurzelfunktion, die in diesem Fall für alle x ∈ R definiert
ist. Man schreibt dafür
√
f −1 (x) = n x (x ∈ R) (1.24)
Liegt ein gerader Exponent n vor, so besitzen die Potenzfunktionen Schaubilder der
Gestalt (hier beispielhaft für x2 und x6 gezeichnet):
... 1.8 . 6
... ... x
.. .
......... ...... x2
..... ...
......... 1 .
.........
... ........ ... .
... ........ ........... ...
.... .......
...... ........... ....... ...
..................... .......... . . . . . . ..............................................
......................................................
−1 1
Man erkennt unmittelbar, daß diese Funktionen weder injektiv noch surjektiv sind. Um
aber doch zumindest teilweise diese Funktion umkehren zu können, schränkt man sie
auf die nicht negativen reellen Zahlen ein. Dieses liefert die Funktionen
g : R \ {x < 0} −→ R \ {x < 0}
mit g(x) = f|{x≥0} (x) (1.25)
Die zugehörige Umkehrfunktion ist ebenfalls nur auf den nicht negativen reellen Zahlen
definiert:
Man schreibt auch dieses wieder als Wurzelfunktion, die aber jetzt – beim Vorliegen
eines geraden Exponenten – nicht für negative x-Werte definiert ist:
√
g−1 (x) = n x (x ∈ R, x ≥ 0) (1.27)
Für n = 2 ist dieses die übliche Quadratwurzel (siehe auch Seite 32); bekanntlich schreibt
man dafür nur
√ √
x = 2x (x ∈ R, x ≥ 0) (1.28)
37
Das Schaubild aller Wurzelfunktion für n ≥ 2 und x ≥ 0 ähnelt dem der Quadratwurzel:
1.5
.......
...
...
...
...............
.
.........
.
...
...
.............
.......
1
..
...
..........
....
..
.........
.
.....
..
......
....
.. ..
..
...
1 2
√
Bemerkung: Auch wenn für ungerades n die Wurzel x sowohl für positive als auch für n
negative x-Werte definiert ist, betrachtet häufig auch diese Wurzeln nur für x ≥ 0. Man
kann damit die Wurzelfunktionen einheitlich behandeln. Im Folgenden soll demgemäß
n sowohl gerade als auch ungerade sein können, und x sei stets nicht negativ.
Mit diesen Festsetzungen gelten die Gleichungen
√ n √n
n
x = x und xn = x (1.29)
sowie weiterhin
√ √ √
n
x·y = n
x· n
y (1.30)
Neben der Wurzelschreibweise ist die Potenzschreibweise mit gebrochenem Exponenten
üblich:
1 √
xn = n x (1.31)
Motiviert wird die Gleichung durch Anwendung der bekannten Regel (ak )l = ak·l :
1 n 1 n
1 n
xn = x n ·n = x n = x1 = x also: xn = x (1.32)
Jetzt muß man nur auf beiden Seiten von (1.32) die n-te Wurzel ziehen und anschließend
auf der linken Seite von (1.32) die zweite Gleichung in (1.29) verwenden.
Man erweitert (1.31) auf Potenzfunktionen mit beliebigen rationalen Exponenten. Sei
r ∈ Q zunächst eine positive rationale Zahl mit r = p/q und p, q ∈ N; dann setzt man
für x ∈ R, x ≥ 0:
√ p
f(x) = xr = q x (1.33)
oder gleichbedeutend
√
f(x) = xr = q
xp (1.34)
Ist dagegen r ∈ Q und r < 0, so setzt man r = −p/q mit wieder p, q ∈ N und definiert
für x > 0
1
f(x) = xr = √ q
(1.35)
xp
Die bekannten Regeln des Potenzierens (siehe (1.1)) gelten auch mit diesen rationalen
Exponenten:
Satz: Für x, y ∈ R+ und r, s ∈ Q gilt:
xr+s = xr · xs
(x · y)r = xr · y r (1.36)
(xr )s = xr·s
38
1.3.4.4 Die Funktion f (x) = 1/x
Hierbei handelt es sich um eine sogenannte gebrochen rationale Funktion11 Da eine
Teilung durch Null nicht möglich ist, ist diese Funktion nur für x 6= 0 definiert. Bei
x = 0 liegt eine sogenannte Polstelle vor. Ein Kennzeichen einer Polstelle besteht
darin, daß bei Annäherung von x an die Polstelle der Funktionswert f(x) gegen Plus-
oder Minusunendlich strebt:
3 ....
...
...
2 ...
...
...
....
1 ......
..........
.........................
............................................
.......................................................
−5 .................. −1 1 2 3 4 5
........
.....
...−1
...
...
...
...
...
...
.
Wie man anhand der Zeichnung erkennt, nähert sich umgekehrt der Funktionswert 1/x
beliebig stark der Null an, wenn x dem Betrage nach immer größer wird.
Aufgrund der im Abschnitt 1.3.4.3 angestellten Betrachtungen ist diese Funktion zu-
nächst nur für x ∈ Q definiert. In natürlicher Weise läßt sich die Definition auf be-
liebige x ∈ R. Dieses wird mit Mitteln der Differential- und Integralrechnung in einer
nachfolgenden Vorlesung gezeigt werden. Als Standardwert für die Basis wählt man die
Eulersche Konstante:
e ≈ 2.71828183 (1.38)
Es handelt bei e um eine irrationale Zahl; der Grund für deren Wahl als Standardbasis
einer Exponentialfunktion wird später erläutert werden. Man erhält damit die Standar-
dexponentialfunktion12 :
exp(x) = ex (1.39)
11
Eine gebrochen rationale Funktion ist ein Quotienten zweier Polynome. Solche Funktionen werden
in einer nachfolgenden Vorlesung genauer behandelt werden.
12
in der Regel einfach als Exponentialfunktion“ bezeichnet
”
39
Es gelten die üblichen Regeln der Potenzrechnung13
ex+y = ex · ey
(ex )y = ex·y
(1.40)
e−x = 1x
e
0
e = 1
12 ..
.. .
.
10
...
...
8 .. ..
.
.
.
.....
y 6 ..
......
...
4 ..
........
.
....
..
...
. .
.........
2 ..................
..
...
...
................
..........................................................................................
−3.0 −2.0 −1.0 0.0 1.0 2.0
x
• Für x gegen Minusunendlich nähert sich exp(x) beliebig stark dem Wert Null an.
Insbesondere ist exp(x) injektiv und, wenn man die Zielmenge auf R+ (die positiven
reellen Zahlen) einschränkt, auch surjektiv. Insbesondere liefert dieses eine umkehrbare
Funktion
exp : R −→ R+ (1.42)
13
Die Regel sind hier nur für die Standardbasis e formuliert, gelten aber entsprechend für andere
Basen a > 0.
40
Die zugehörige Umkehrfunktion
exp−1 : R+ −→ R (1.43)
wird logarithmus naturalis, natürlicher Logarithmus oder einfach nur als Loga-
rithmus genannt. Übliche Bezeichnungen sind
Anhand des Schaubildes des Logarithmus (siehe Abbildung 1.3) erkennt man dessen
Eigenschaften14 :
• log(x) ist nur für x > 0 definiert.
• log(1) = 0
• log(x) > 0 ⇔ x > 1
• Für x gegen Null nähert sich log(x) Minusunendlich an.
• Für x gegen Unendlich strebt auch log(x) gegen Unendlich, wobei jedoch das
Wachstum immer geringer wird.
.......
...
...
...
...
...
...
....
...
...
.........................................
.
2.0 ...................
..
...
...
...
...
........................
.
..........
..
...
...
................
1.0 ......
...
. .
.........
.....
y 0.0 .
. ....
.... 2 4 6 8 10 12
.. .
−1.0 .. x
.
...
−2.0 ..
...
..
−3.0 ..
Dabei gilt Gleichung (1.46) nur für x > 0. Diese Gleichung besagt unter anderem, daß
log(x) derjenige Exponent ist, mit dem man e potenzieren muß, um als Potenzwert x
zu erhalten.
Aus der Regel ex+y = ex ·ey (siehe (1.40)) ergibt sich das berühmte Logarithmusgesetz:
Für x, y ∈ R+ gilt:
41
Beweis:
log(x · y) = log elog(x) · elog(y) Zweimal wurde (1.46) angewandt.
= log elog(x)+log(y) nach (1.40)
= log(x) + log(y) wieder nach (1.46)
qed.
+
Ebenso wichtig sind diese Folgerungen aus dem Logarithmusgesetz: Für x, y ∈ R , u ∈ R
gilt:
x
log = log(x) − log(y) (1.48)
y
log(xu ) = u · log(x) (1.49)
qed.
Die Gleichungen (1.47), (1.48) und (1.49) rechtfertigen die große Bedeutung des Lo-
garithmus. Diese Gleichungen besagen, daß der Logarithmus eine Rechnungsart in die
nächst einfachere Rechnungsart überführt. So wird ein Produkt in eine Summen, ein
Quotient in eine Differenz und eine Potenz in ein Produkt verwandelt.
gegeben : a ∈ IR+
gesucht : n ∈ IN minimal mit 2n ≥ a (1.50)
Zum Bestimmen dieses n ∈ IN logarithmiert man beide Seiten der Ungleichung (1.50)
und verwendet (1.49) sowie die Monotonie des Logarithmus:
log(a)
n ≥ (1.52)
log(2)
15
Dieser Abschnitt wird nicht in der Vorlesung behandelt; es ist zum selbständigen Lesen vorgesehen.
42
Die kleinste natürliche Zahl n, die diese Ungleichung erfüllt, wird gesucht. Ist die rechte
Seite von (1.52) bereits in IN, so kann man
log(a)
n = (1.53)
log(2)
setzen. Andernfalls benötigt man die nächst größere natürliche Zahl; die erhält etwa
man mit Hilfe der Gaußklammer (siehe Seite 34):
log(a)
n = +1 (1.54)
log(2)
Beispielfrage: Jemand spielt ein Gewinnspiel, bei dem im Falle eines Gewinns der ein-
gesetzte Geldbetrag verdoppelt wird.
Wie oft müßte jemand hintereinander gewinnen, der mit einen Einsatz von einem Euro
beginnt und anschließend stets den bislang gewonnenen Betrag beim folgenden Spiel
wieder einsetzt, um anschließend mindestens 10 000 000 Euro zu erhalten?
Da nach jedem Spiel der Betrag verdoppelt wird, beläuft sich der Betrag nach n hinter-
einander gewonnen Spielen auf
1 · 2n (Euro)
n soll minimal gewählt werden, so daß dieser Wert mindestens 10 000 000 = 107 beträgt.
Nach (1.52) liefert dieses die Bedingung
log(107 ) 7 · log(10) · 2.3026 = 23.2535
n ≥ = = 70.69315
log(2) log(2)
Die nächst größere natürliche Zahl ist n = 24.
43
Und weiter hat man wegen zi ≤ 9
1 − 10k+1 1 − 10k+1
= 9 · = 9 · = 10k+1 − 1 < 10k+1
1 − 10 −9
⇒ a < 10k+1 (1.60)
Hieraus folgt, daß 10k+1 die kleinste Zehnerpotenz ist, die größer als a ist. Logarithmiert
man (1.61), so erhält man entsprechend wie bei (1.51)
Damit ist k die größte ganze Zahl, die kleiner oder gleich log(a)/ log(10) ist. Die erhält
man wiederum mit der Gaußklammer (siehe (1.17)). Die Anzahl der Dezimalstellen von
a ∈ IN lautet damit
log(a)
k+1 = +1 (1.63)
log(10)
log(31000 )
1000 · log(3) 1000 · 1.0986
+1 = +1 = +1
log(10) log(10) 2.3026
= [477.12] + 1 = 478
log(x)
der dekadische Logarithmus : lg(x) =
log(10)
log(x)
der Logarithmus dualis : ld (x) =
log(2)
44
1.3.4.6 Polynome
1.3.4.6.1 Definition Die Funktion
p : IR 7→ IR
Üblicherweise gibt man bei einem Polynom nur die Summanden mit von Null verschie-
denen Koeffizienten an, so wie in dem obigen Beispiel geschehen: in dem Ausdruck
sind nicht gleich, da sich die Koeffizienten an den Positionen 17 und 3 unterscheiden.
Das Polynom, dessen sämtliche Koeffizienten den Wert Null haben, heißt Nullpolynom;
man schreibt dafür einfach 0“. Das 0–te Glied, d. h. das Glied bei x0 , ist das sogenannte
”
konstante Glied.
Polynome haben in der Anwendung eine sehr große Bedeutung, unter anderem deshalb,
weil sich ihre Werte sehr leicht berechnen lassen16
Die Berechnung erfolgte durch einfaches Multiplzieren (einschl. Potenzieren) und Ad-
dieren/Subtrahieren.
Auch kann man mit Polynomen untereinander rechnen:
16
Wie man eine solche Berechnung auf besonders effektive Weise vornehmen kann, wird später gezeigt.
45
• Zwei Polynome werden addiert bzw. subtrahiert, indem ihre Koeffizienten an den
entsprechenden Gliedern addiert (subtrahiert) werden, z.B.:
(x3 + 2x + 4) · (3x2 + x + 1)
= x3 · (3x2 + x + 1) + 2x · (3x2 + x + 1) + 4 · (3x2 + x + 1)
= 3x5 + x4 + x3 + 6x3 + 2x2 + 2x + 12x2 + 4x + 4
= 3x5 + x4 + 7x3 + 14x2 + 6x + 4
Neben der Addition/Subtraktion und der Multiplikation, die als Ergebnis stets wieder
ein Polynom liefern, ist auch eine Polynomdivision vorhanden; die Polynomdivision
geht jedoch im allgemeinen nicht auf, es bleibt dann ein (Divisions-) Rest.
Die Polynomdivision erfolgt auf dieselbe Art wie die schriftliche Division zweier Dezimal-
zahlen: Man beginnt, indem man das höchste Glied des Dividenden durch das höchste
Glied des Divisiors teilt, danach erfolgt die Gegenrechnung, und die Rechnung wird mit
dem höchsten Glied des verbliebenen Dividenden fortgesetzt; z. B.:
Ein weiterer Divisionsschritt ist hier nicht möglich, 6x + 6 bleibt als Divisionsrest, also
46
Ein wichtiger Fall, in dem die Division immer aufgeht, ist der folgende:
Hilfssatz: Sei n ∈ IN und a ∈ IR , dann ist der Quotient
x n − an
x−a
stets ein (ganzes) Polynom, d. h. diese Division geht ohne Rest auf.
Beweis: Durch vollständige Induktion:
Induktionsanfang n = 1“: klar, denn
”
x 1 − a1
= 1 ist (ganzes) Polynom
x−a
Induktionsschluß (n − 1) ⇒ n“: Wir nehmen an, daß die Behauptung für den Fall n − 1
”
richtig ist, d. h. wir nehmen an, daß
xn−1 − an−1
x−a
ein (ganzes) Polynom ist; multipliziert man dieses mit x und addiert man an−1 hinzu,
so erhält man wieder ein (ganzes) Polynom:
xn−1 − an−1
x· + an−1
x−a
Eine einfache Umformung (x ausmultiplizieren und alles auf den Hauptnenner x − a
bringen) zeigt, daß dieses Polynom gleich (xn − an )/(x − a) ist:
x n − an xn−1 − an−1
= x· + an−1
x−a | x − {z
a }
ist Polynom
Somit ist auch (xn − an )/(x − a) ein Polynom; damit ist alles bewiesen.
qed
Eine Maßzahl“ für ein Polynom ist sein Grad; der Grad eines Polynoms ist der größte
”
in ihm vorkommende Exponent der Unbestimmten; bzw. genauer:
Definition: Sei
Xn
p(x) = ai xi 6= 0
i=0
ein Polynom, das nicht gleich dem Nullpolynom ist. Ist an 6= 0, so heißt n der Grad
von p(x); man schreibt dafür
grad(p(x)) = n
Bemerkung:
• Ein Polynom hat genau dann den Grad 0, wenn es ein konstantes Polynom 6= 0
ist.
• Für das Nullpolynom ist der Grad nicht definiert; aus formalen Gründen verleiht
man dem Nullpolynom häufig den Grad −∞ ( minus unendlich“).
”
47
• Ein Polynom p(x) 6= 0 heißt normiert, falls sein höchster Koeffizient gleich 1 ist;
mit anderen Worten: ist n = grad(p(x)), so ist p(x) genau dann normiert, wenn
an = 1 ist.
Wie hängt der Grad eines Produkts zweier Polynome von den beiden Faktoren ab?
Multipliziert man zwei vom Nullpolynom verschiedene Polynome miteinander, so liefert
das Produkt der beiden höchsten Glieder das höchste Glied des Produktpolynoms: hat
man
n
X
p(x) = ai x i mit an 6= 0
i=0
Xm
und q(x) = bj x j mit bm 6= 0
j=0
Der Grad des Produktes ist die Summe der Grade der Faktoren.
Beispiel:
p(x0 ) = 0 ist.
s(x) = x − x0
48
y
nom ersten Gerades, sein Schaubild ist eine
x
0 x
Bemerkenswert ist nun, daß man von einem Polynom p(x) mit p(x0 ) = 0 den Linearfak-
tor x − x0 als Faktor abspalten kann.
Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades, und sei x0 ∈ IR mit p(x0 ) =
0. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit
p(x) = (x − x0 ) · g(x)
Beweis: Geht man von der behaupteten Gleichung aus, und teilt man ihre beiden Seiten
durch x − x0 , so führt das für g(x) auf den Ansatz
p(x)
g(x) =
x − x0
Zu zeigen ist nun, daß dieser Quotient ein (ganzes) Polynom, bzw. daß p(x) ohne Rest
durch den Linearfaktor x − x0 teilbar ist. Dazu schreiben wir p(x) wieder in der Form
n
X
p(x) = ai xi
i=0
xi − xi0
x − x0
49
(ganze) Polynome; sie bleiben ganz, wenn man sie mit den ai multipliziert und aufad-
diert. Damit ist dann auch, wie behauptet, g(x) ein (ganzes) Polynom ist. Es bleibt
noch
grad(g(x)) = n − 1
zu zeigen. Wendet man dazu auf
p(x) = (x − x0 ) · g(x)
Bevor man einen Weg sucht, das Polynom g(x) effektiv ausrechnen zu können, bietet
sich eine kleine Verallgemeinerung an:
Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades mit n ≥ 1; sei weiter x0 ∈ IR
beliebig. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit
Hier wird nicht gefordert, daß x0 eine Nullstelle von p(x). Man nimmt aber eine Rückführung
auf diesen Fall vor, indem man setzt
Nun kann man den vorherigen Satz anwenden: es gibt ein Polynom n − 1-ten Grades
g(x) mit
Addiert man zu beiden Seiten der Gleichung p(x0 ), so erhält man die behauptete Aus-
sage.
Das Polynom g(x) und gleichzeitig auch der Wert p(x0 ) sollen berechnet werden. Alles,
was man bis jetzt weiß, ist grad(g(x)) = n − 1, man kann daher
n−1
X
g(x) = bi x i
i=0
50
ansetzen. Dieses setzt man in die Gleichung 1.64 ein:
n n−1
!
X X
ai xi = (x − x0 ) · b i xi + p(x0 )
i=0 i=0
Faßt man noch die beiden Summenzeichen auf der linken Seite zusammen, so liefert das
die Gleichung
n−1
X n
X
an x n + (ai + bi x0 )xi = bi−1 xi + p(x0 ) (1.65)
i=0 i=1
Dieses ist eine Gleichung zweier Polynome; zwei Polynome sind genau dann gleich, wenn
ihre entsprechenden Koeffizienten gleich sind. Wendet man das hier an, so führt Glei-
chung 1.65 auf die Koeffizientengleichungen
Damit kann man nacheinander die Koeffizienten19 bn−1 , . . . , b0 und schließlich auch den
Wert p(x0 ) berechnen. Die Berechnung folgt dabei dem Schema (dem sogenannten
Horner-Schema):
Beispiel: Gegeben seien p(x) = 2x7 + 2x3 + 1 und x0 = −2, darauf das Horner-Schema
angewandt:
2 0 0 0 2 0 0 1
−2 −4 8 −16 32 −68 136 −272
+ 2 −4 8 −16 34 −68 136 −271
Damit haben wir das Polynom g(x) aus Gleichung 1.64 berechnet:
2x7 + 2x3 + 1
= (x + 2) · (2x6 − 4x5 + 8x4 − 16x3 + 34x2 − 68x + 136) − 271
19
Wohl gemerkt: das Ziel, das Polynom g(x) zu berechnen ist erreicht, wenn die Koeffizienten von
g(x) bestimmt worden sind.
51
Insbesondere ist p(−2) = −271.
Wegen seiner gut rechnerischen Eigenschaften lohnt es sich sogar, das Horner-Schema
auch dann einzusetzen, wenn man nur an dem Funktionswert p(x0 ) interessiert ist.
anwenden:
1 −4 −5 36 −36
3 3 −3 −24 36
+ 1 −1 −8 12 0
also insbesondere p(x0 ) = 0 und genauer:
Wir wenden das Verfahren nochmal an, diesmal auf g1 (x) = x3 −x2 −8x+12 mit x0 = 2:
1 −1 −8 12
2 2 2 −12
+ 1 1 −6 0
g1 (x) = (x − 2) · (x2 + x − 6)
1 1 −6
2 2 6 also g2 (x) = (x − 2) · (x + 3)
+ 1 3 0
Der letzte Faktor g3 (x) = x + 3 = x − (−3) ist selbst ein Linearfaktor, nämlich der
mit Nullstelle −3. Eine nochmalige20 Anwendung des Verfahrens auf g3 (x) mit x0 = −3
lieferte die triviale Zerlegung
g3 (x) = (x + 3) · 1
20
aber natürlich nicht übliche
52
Der letzte Faktor g4 (x) = 1 hat als konstante Funktion 6= 0 natürlich keine Nullstellen.
erscheint der Linearfaktor x − 2 mit Exponentem 2, er war zweimal als Teiler in p(x)
enthalten. Man nennt daher x0 = 2 eine doppelte - oder zweifache Nullstelle von
p(x); allgemein:
Definition: Sei p(x) nicht das Nullpolynom und x0 ∈ IR . x0 heißt k–fache Nullstelle
oder Nullstelle der Ordnung (Vielfachheit) k von p(x), falls es ein Polynom g(x) mit
g(x0 ) 6= 0 gibt, so daß gilt
p(x) = (x − x0 )k · g(x)
Die Forderung g(x0 ) 6= 0 soll sicherstellen, daß x0 nicht sogar eine (k+1)–fache Nullstelle
von p(x) ist.
1.3.4.6.3 Anzahl von Nullstellen Wir wollen erkennen, daß ein Polynom nur eine
beschränkte Anzahl von Nullstellen besitzen kann, und wir wollen daraus eine wichtige
Folgerung ziehen.
Wir kommen dazu noch einmal auf die Beispiele (siehe Seite 52) mit dem Polynom
Bei jedem Schritt sinkt der Grad des verbleibenden Faktors gi (x) um 1. Wenn so der
Grad 0 erreicht wird, ist der verbleibende Faktor ein konstantes Polynom (6= Nullpoly-
nom), von dem ein weiterer Linearfaktor nicht mehr abgespalten werden kann. Es sind
daher nur 4 = grad(p(x)) Abspaltungen möglich.
Ein solcher Sachverhalt trifft auch bei einem beliebigen Polynom zu: Hat das Polynom
p(x) den Grad n, so kann von ihm höchstens n Mal ein Linearfaktor abgespalten werden;
nach n Abspaltungen hat der letzte verbleibende Faktor den Grad 0 und ist somit
konstant. In einem Polynom vom Grade n sind daher höchstens n Linarfaktoren als
Teiler enthalten.
Da zu jeder Nullstelle mindestens ein Linearfaktor gehört21 , folgt daraus: Das Polynom
p(x) vom Grade n hat höchstens n Nullstellen.
21
aufgrund des Satzes auf Seite 49
53
Berücksichtigt man jetzt auch noch die Vielfachheit der Nullstellen und beachtet man,
daß zu einer Nullstelle der Vielfachheit k ein genau k Mal als Teiler vorkommender
Linearfaktor gehört, so ist man auf einen der wichtigsten Sätze der Mathematik gestoßen:
Satz: Sei p(x) ein Polynom, das nicht gleich dem Nullpolynom ist. Ist n = grad(p(x)),
so hat p(x) höchstens n Nullstellen; dabei wird jede Nullstelle mit ihrer Vielfachheit
gezählt.
ist x1 notwendigerweise eine Nullstelle von g(x). Daraus folgt: als Nullstellen von p(x)
kommen neben x0 genau die Nullstellen von g(x) vor. Die Gesamtzahl (mit Vielfachheit)
der Nullstellen von g(x) ist daher beschränkt durch
k
|{z} + n − k}
| {z = n
Vielfachheit Maximalzahl der
von x0 Nullstellen von g(x)
22
Es ist nicht zwingend erforderlich, daß Sie diesen Beweis nachvollziehen.
54
qed
Offensichtlich ist grad(h(x)) ≤ n. (Höhere Potenzen als in p(x) und q(x) können in h(x)
nicht vorkommen.) Wäre nun h(x) nicht das Nullpolynom, so hätte h(x) aufgrund des
vorherigen Satzes höchstens n verschiedene Nullstellen.
h(x) besitzt jedoch n + 1 verschiedene Nullstellen:
qed
eindeutig bestimmt.
• Ein (lineares) Polynom p(x) = ax + b ist durch zwei Werte eindeutig bestimmt.
p(x) = ax2 + bx + c
q(x) ≡6 p(x)
und q(xi ) = p(xi ) für i = 1, 2, 3
55
1.3.4.6.4 Der Fundamentalsatz der Algebra Zwei schwieriger zu behandelnde
Fragen sind die folgenden:
1. Hat ein Polynom n-ten Gerades mit Vielfachheit genau n Nullstellen?
2. Wie kann man die Nullstellen eines Polynoms finden?
Zu Frage 1.: Die Antwort ist leider nein“. Beispiel: Das (berüchtigte) Polynom
”
p(x) = x2 + 1
hat keine Nullstellen, obwohl sein Grad 2 beträgt; es ist immer p(x) ≥ 1. Dieser Sachver-
halt verleitete zur Einführung der komplexen Zahlen (siehe später). Alles, was man
für (reelle) Polynome in diesem Zusammenhang weiß, ist der folgende
Satz: (Fundamentalsatz der Algebra, reelle Schreibweise) Sei p(x) ein Polynom n-ten
Grades. Dann gibt es
x1 , x2 , . . . , xl ∈ IR und Polynome g1 (x), . . . , gk (x)
mit grad(gi (x)) = 2 und gi (x) ohne Nullstelle für i = 1, . . . , k, so daß
p(x) = (x − x1 ) · · · (x − xl ) · g1 (x)g2 (x) · · · gk (x).
ist.
Der Beweis dieses Satzes ist umfangreich und schwierig, er soll hier nicht gebracht wer-
den. Auf die Aussage des Satzes werden wir jedoch später im Zusammenhang mit der
Partialbruchzerlegung und Integration gebrochen rationaler Funktionen zurückkommen.
Zu Frage 2.: Auch hier ist die Antwort nicht sehr befriedigend:
Für die Nullstellen der Polynome ersten und zweiten Grades gibt es einfache Formeln;
bei Polynomen dritten und vierten Grades existieren noch Formeln, die jedoch sehr
komplizert sind (siehe Formelsammlungen) und selten verwendet werden. Für allgemei-
ne Polynome fünften oder eines höheren Grades gibt es jedoch – wie man beweisen
kann – keine Formeln zur Berechnung ihrer Nullstellen. Man ist hier auf numerische
Lösungsverfahren24 angewiesen (siehe später).
Für den Fall eines normierten quadratischen Polynoms sei hier an die Formel zur Be-
rechnung seiner Nullstellen erinnert. Zu lösen ist die quadratische Gleichung
Quadratische Ergänzung zur
0 = x2 + ax + b Anwendung der 1. binomi-
schen Formel vornehmen!
a2 + b − a2
Jetzt die 1. binomische Formel
= x2 + 2 a
2 x + 4 4 anwenden!
2 2
= x+ a
2 + b − a4
2
⇒ x+ a
2 = 14 (a2 − 4b)
| {z }
=D
⇒ x1/2 = −a ± 1 √D für D ≥ 0
2 2
24
Numerische Lösungsverfahren verwendet man üblicherweise auch bei Gleichungen dritten und vier-
ten Grades.
56
Die Diskriminante D = a2 − 4b bestimmt die Nullstellenmenge von p(x) = x2 + ax + b:
D > 0 ⇒ 2 Nullstellen
D = 0 ⇒ 1 doppelte Nullstelle
D < 0 ⇒ keine Nullstellen
Kontrollfrage: Begründen Sie mit Hilfe der Sätze dieses Abschnitts, daß es für die
Lösungsmenge der normierten quadratischen Gleichung nur diese drei Möglichkeiten
geben kann.
0 = x4 + ax2 + b
p(x) = x4 − 4
= (x2 − 2)(x2 + 2)
√ √
= (x − 2)(x + 2)(x2 + 2)
1 ............................
...........
a ............... P = (a, b)
b .......
....
7 ........
.....
....
.... a2 + b 2 = 1
...
...
1 (Pythagoras)
...
b ... x
...
...
...
..... α ...
. ...
... ...
0 .. ..
0 a 1
57
.................. 1 .............
.... ....... ..................
..... ...
... ..
... ..... ...
...
.. . ... .. ... .. ...
.. ... .. ... .. ...
.. ... ... ... .. ...
.. ... .. ... .. ...
... . ... . ... .
.
... .. ... .
. . ..
...
−9 ... −6 −3 ... ... 3 ..... 6..
. 9
... .. ... .. ... ..
... . ... ...
... .. ... ... .. ...
.... .. .... .. .
.... .
................ ................ ................
−1
• den Winkel α zwischen der waagerechten Koordinatenachse und der Stecke zwi-
schen den Punkten (0, 0) und P bzw.
• die Länge x des Kreisbogens auf S1 zwischen den Punkten (1, 0) und P
Der Zusammenhang zwischen der Bogenlänge x und dem Winkel α ist gegeben durch
2π
x = α·
360
Dabei sind 2π und 360◦ die Maße für den vollen Kreis.
Die Koordinaten des Punktes P = (a, b) sind dabei durch die Bogenlänge x bzw. den
Winkel α eindeutig bestimmt, d. h. sie sind Funktionen von x bzw. α. Man kann daher
setzen:
P = (cos x, sin x) bzw. P = (cos α, sin α)
mit den beiden Funktionen sinus und cosinus
sin : IR 7→ IR cos : IR 7→ IR
Da ganze Kreisumläufe zum selben Punkt P führen“, folgt für jede ganze Zahl k ∈ ZZ :
”
cos(x + k · 2π) = cos x
sin(x + k · 2π) = sin x
Die beiden so definierten Funktionen sin und cos besitzen große Bedeutung in der Geo-
metrie und bei der Behandlung periodischer Vorgänge. Bei geometrischen Problemen
faßt man sie in der Regel als Funktionen des Winkels α und sonst üblicherweise als
Funktionen des Bogenmaßes x auf.
1.
sin 0 = 0 sin π
2 =1 sin π = 0
cos 0 = 1 cos π
2 =0 cos π = −1
58
.................. ..1................
...
..................
.. .. ...
... ..... ...
... .. ...
...
.. . ... ... ... ... ...
.. ... . .... . ...
.. ... ... .... ... ...
... ... .. ... .
. ...
.. ... .
. ... .. ...
. ... .. . .. ...
−9 .. −6 ... −3 .. ... 3 .. 6 ... 9
.. . ... .. ... .. ...
.. ... . ... . ...
... .. ... .. ...
.
. .... .. ..... ... .
. ....
... . .
............. . . .......
...... −1 ..........
2. Der sin ist eine ungerade, der cos ist eine gerade Funktion:
Diese Eigenschaften werden sofort anhand von Zeichnung 1.8 deutlich: Man be-
trachte dort die beiden auf dem Einheitskreis liegenden Punkte
P1 = (cos α, sin α)
P2 = (cos(−α), sin(−α))
Den zu −α gehörigen Punkt P2 erhält man auch, wenn man P1 an der x-Achse
spiegelt. Bei dieser Spiegelung bleibt der Wert der x-Koordinate unverändert, d. h.
cos(−α) = cos α; der Wert der y-Koordinate wechselt dagegen sein Vorzeichen,
d. h. sin(−α) = − sin α.
4. Für x ∈ [−π/2, π/2] ist cos x ≥ 0 (rechter Halbkreis), man kann daher die Glei-
chung cos2 x + sin2 x = 1 nach cos x auflösen und erhält eine Darstellung des cos
durch den sin:
p
cos x = 1 − sin2 x (1.69)
Für x ∈ [0, π] ist ebenso sin x ≥ 0 (oberer Halbkreis), löst man die Gleichung
cos2 x + sin2 x = 1 nach sin x auf, so folgt ähnlich wie oben
√
sin x = 1 − cos2 x (1.70)
59
Mit dem Strahlensatz erhält man in einem rechtwinkligen Dreieck:
b Gegenkathete
sin x = =
c Hypothenuse
a Ankathete
cos x = =
c Hypothenuse
*
c
b
1
sin α
α
cos α
a -
Auf diesem Wege lassen sich auch die Funktionen tangens und cotangens definieren:
sin x = Gegenkathete
tan x = cos x Ankathete
cot x = cos x Ankathete
sin x = Gegenkathete
sin π
4= 2
√1 cos π
4= 2
√1
sin π 1 cos π 1 √3
6=2 =
6 2
sin π = 1 √3 cos π 1
3 2 3=2
Man erhält diese Werte auf geometrischem Wege: man betrachtet ein gleichseitiges bzw.
ein rechtwinkliges gleichschenkliges Dreieck.
Zwischen den Werten des sin und des cos besteht neben den Gleichungen 1.69 und 1.70
ein weiterer Zusammenhang. Man erkennt diesen, indem man die in Abbildung 1.8 die
beiden auf dem Einheitskreis liegenden Punkte
P1 = (cos α, sin α)
1 1
P3 = cos(α + π), sin(α + π)
2 2
60
1 ...................... ................................. ............
........ ................ ........ ..............
.... ....... ...
.......... ............ ......
. ..
........
.
..... ..... ..... ....
....... .....
.
.....
.. ........
.. ..... ..... ..
.... ..... .....
. .... .
.....
..
.....
.. .. .
...
......
1 .....2
..... 3 ....... 4 ...... 5 ..
...6.
...... ..... .
.... .....
....... ...... ...... ...
....... ..........
.
.... ...
. ...........
.
......... . .......... .
...................................... .....................................
−1
betrachtet. P3 ist durch Drehung von P1 um 90◦ bzw. π/2 entstanden. An der Abbildung
erkennt man, daß die x-Koordinate von P3 gleich dem Negativen der y-Koordinate von
P1 ist und daß die y-Koordinate von P3 gleich der x-Koordinate von P1 . Dieses liefert
die Beziehungen
sin(x + π
2 ) = cos x Drehung um
(1.71)
cos(x + π
2 ) = − sin x
π ' 90◦
2
1.71 besagt insbesondere, daß man den cos auch durch Verschiebung des sin um π2 nach
rechts erhalten kann. Verdeutlicht wird dieses in Abbildung 1.7, in der sin und cos
gemeinsam über der Grundperiode [0, 2π] eingezeichnet sind.
Wendet man die Gleichungen 1.71 zweimal hintereinander an, so erhält man
sin(x + π) = cos(x + π 2) = − sin x
π (1.72)
cos(x + π) = − sin(x + 2 ) = − cos x
Die Gleichungen 1.72 liefern gemeinsam mit der Periodizität und den Eigenschaften
gerade/ungerade die weiteren Gleichungen
sin(π − x) = sin(−π − x) = sin x
(1.73)
cos(π − x) = cos(−π − x) = − cos x
Die Gleichungen 1.71, 1.72 und 1.73 erweisen sich bei vielen Rechnungen, in denen sin
und cos vorkommen, als sehr nützlich.
Es ist sin π = 0 und cos 12 π = 0. Daraus leiten sich mit den Formeln 1.73 die weiteren
Nullstellen ab:
Nullstellen des sin : {kπ | k ∈ ZZ }
1
Nullstellen des cos : (k + )π | k ∈ ZZ
2
61
der Gesamtwinkel:
.1
...............................
.....
...............
............ α + 12 π
................ cos α
..........
....
.........
....
...
......... .......P1
......
. .. .....
.
. ... − sin α 7
.....
P3 ......
....
....
......}
Z ...
.. Z ...
.. Z
...
...
Z
sin α ...
.. cos α Z
Z ...
.. ...
..
Z ...
..
Z
Z α
...
.. Z ........... α ...
... Z.. .... ...
Z. . ..
... S. . ..
... .
S −α ..
-1..... .
. 1
... ..
S
... .
..
S
... S − sin α . .
...
...
S
...
... S
..
....
....
S
. ....
..... .. .
....
S
..... S
..
...... S ......
....... w...
........ ......
S
......... ....
....
...........
.................-1 cos...α.................. P2
..........................
.......
62
Zum Beweis: Wir werden den Beweis geometrisch führen und zwar nur für den Spezialfall
des ersten Quadranten, d. h. nur für den Fall x, y > 0 und x + y < π/2. Wegen der
geometrischen Vorgehensweise ist es günstiger, statt des Bogenmaßes die zugehörigen
Winkel zu betrachten; dazu sei
360◦ 360◦
α = x β = y
2π 2π
Wir tragen jetzt den Winkel α und anschließend den Winkel β im Einheitskreis an, so
daß insgesamt der Winkel α + β entsteht; zusätzlich wird vom Punkte P4 = (cos(α +
β), sin(α + β)) aus die Senkrechte auf die Strecke zwischen P0 = (0, 0) und P2 =
(cos α, sin α) gezeichnet:
1 ........................................
...............
............
..........
.........
........
........P4 = (cos(α + β), sin(α + β))
.......
..L.. ...........
L .......
......
L .....
.....
αL ..... α + γ = 90◦
L
.....
L ....
....
L
....
L ....
L
c ...
...
L ...
1
L ...
...
...
L
L ..
!.... P2 = (cos α, sin α)
L
....... b
!
...
.L...L!!!
!
P . .
. ...
6 !
P ...
......γ!!! 3 ...
!
e ...
...!...
!
...
...
! !
! ! γ ...
...
! !
β !!!
!
...
..... !! d ...
....
!
! .. α .... ...
P0 a P5 b P1
1
Zu beachten ist hierbei, daß an dem Punkte P4 der Winkel α ein weiteres Mal auftaucht,
da genau α den Winkel γ zu 90◦ ergänzt.
Aus den in der Zeichnung vorhandenen rechtwinkligen Dreiecken ergeben sich nun die
folgenden sin– und cos–Werte:
63
Setzt man jetzt diese Werte geeignet ineinander ein und drückt man dabei insbesondere
alle Längen durch sin– und cos–Werte aus, so folgt:
Damit ist das Additionstheorem des cos hergeleitet; dasjenige des sin soll daraus mit
Hilfe der beiden Gleichungen (siehe Seite 61) sin x = cos(x − π/2) bzw. sin(x − π/2) =
− cos x abgeleitet werden:
qed.
Folgerungen:
a) sin 2x = 2 sin x · cos x
x+y x−y
c) sin x + sin y = 2 · sin 2 · cos 2
x+y x−y
d) cos x + cos y = 2 · cos
2 · cos 2
Zum Beweis der Folgerungen: a) und b) Man setze in die Additionstheoreme des sin
bzw. cos 2x = x + x ein. c) und d) Man setze
x+y x−y
u = und v =
2 2
und wende bei c) in den beiden Gleichungen
sin x = sin(u + v)
sin y = sin(u − v)
das Additionstheorem des sin an, addiere die beiden Gleichungen und setze für u und
v wieder die Definitionen ein. Bei d) verfahre man ebenso, indem man dabei auf die
beiden folgenden Gleichungen das Additionstheorem des cos anwendet:
cos x = cos(u + v)
cos y = cos(u − v)
Mit Hilfe der Funktionen sin und cos lassen sich viele Sätze und Formeln zur Bearbeitung
von Dreiecken herleiten. Als Beispiel folgen hier der Cosinussatz und der Sinussatz:
Satz: Seien a, b und c die drei Seiten eines Dreiecks und α, β und γ die jeweils ge-
genüberliegenden Winkel. Dann gilt
64
1. der Cosinussatz:
a2 = b2 + c2 − 2cb cos α
b2 = c2 + a2 − 2ac cos β
c2 = a2 + b2 − 2ab cos γ
2. der Sinussatz:
a b c
= =
sin α sin β sin γ
% QQ
% Q
% γ Q
a
% Q
b %
Q
Q
% Q
Q
h
% Q
% Q
Q
% Q
Q
β QQ
%
% α Q
% Q
p
c
Beweis: Es soll nur jeweils eine Gleichung hergeleitet werden, die übrigen folgen entspre-
chend. Die Bezeichnungen aus Abbildung 1.9 werden verwendet.
1. zum Cosinussatz:
p = b · cos α
h2 = b2 − p 2
h2 = a2 − (c − p)2
⇒ a2 = b2 − p2 + (c − p)2
= b2 − p2 + c2 − 2cp + p2
= b2 + c2 − 2cp die Gleichung für p einsetzen
2 2
= b + c − 2cb · cos α
2. zum Sinussatz:
h = b · sin α
h = a · sin β
⇒ a · sin β = b · sin α
a b
⇒ =
sin α sin β
65
7
cot α
1
α
cos α
7
P
1 tan α
sin α
α
0
0 1
sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
lassen sich wie in Abbildung 1.10 deuten.
Sie besitzen die Periode π:
sin(x + π) − sin x = tan x
tan(x + π) = =− cos x
cos(x + π)
cos(x + π)
cot(x + π) = =− cos x
− sin x = cot x
sin(x + π)
sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
besitzen Polstellen:
1
Polstellen des tan : (k + )π | k ∈ ZZ
2
66
.. .. ..
... ... ...
.. 12 .. ..
... ... ...
.. .. ..
... ... ...
.. 8 .. ..
... ... ...
.. .. ..
... ... ...
.. 4 .. ..
... ... ...
....
..... ....
..... ....
.....
........ ....... .......
.
...
. .
............ ...
...............
. ...
...............
.
.. .... ..
....
.−4 −3 −2 −1 ... 1 2..... 3 4
... ... ...
.. .. ..
... ... −4 ...
.. .. ..
... ... ...
.. .. ..
... ... −8 ...
.. .. ..
... ... ...
.. .. ..
... ... −12 ...
. . .
.. .. ..
2. Die Einschränkung der Funktion cos auf das abgeschlossene Intervall [0, π] liefert
eine bijektive Funktion
cos : [0, π] 7→ [−1, +1]
Die zugehörige Umkehrfunktion cos−1 ist auf dem Intervall [−1, +1] definiert, ihr
Name lautet arcus cosinus:
3. Die Einschränkung der Funktion tan auf das offene Intervall (− π2 , + π2 ) liefert eine
bijektive Funktion π π
tan : − , + 7→ IR
2 2
Die zugehörige Umkehrfunktion tan−1 ist wegen der Surjektivität des tan auf ganz
IR definiert, ihr Name lautet arcus tangens:
π π
arctan : IR 7→ − , +
2 2
Bemerkung: Man beachte, daß ausschießlich nur für x ∈ (− π2 , + π2 ) die Beziehung
x = arctan(tan x) erfüllt ist; umgekehrt gilt jedoch für alle y ∈ IR die Gleichung
y = tan(arctan y).
arccot : IR 7→ (0, π)
Als Anwendung des arctan folgt der Beweis des wichtigen Satzes
67
1 .................................
.............
..........
.........
........
.......
....... P = (u, v)
.........
.....
.....
....
....
.... δ
...
...
...
...
..
v = sin δ ....
...
...
...
...
...
...
...
... α ...
.
u = cos δ
1
Abbildung 1.12: Das gesuchte δ ist die Länge des Bogens bis P = (u, v).
68
2. Sei u 6= 0. Man nimmt dann folgenden Ansatz vor:
(a) Sei u > 0. Durch Addition oder Subtraktion eines geeigneten Vielfachen der
Periode 2π kann man erreichen, daß δ in der Grundperiode [−π, π] liegt.
Wegen
cos δ = u > 0
ist dann δ ∈ (−π/2, π/2) erfüllt25 , man kann in 1.75 den arctan anwenden
und erhält
v
δ = arctan
u
(b) Sei u < 0. Ist jetzt hier δ in der Grundperiode [0, 2π] und ist cos δ = u < 0,
so folgt wieder aus geometrischen Gründen (siehe Abbildung 1.4)
π < δ < 32 π
−π
2
⇒ −π
2 < δ−π < 2
π
tan(δ − π) = tan δ
v
= u
arctan()
⇒ v
δ − π = arctan u
+π
⇒ v + π
δ = arctan u
qed.
Zusatz: δ kann aus (−π, π] gewählt werden.
25
Dieses folgt wieder aus geometrischen Gründen, siehe Abbildung 1.4.
69
Kapitel 2
Ein (armer) Student möchte seinen Lebensstandard etwas aufbessern, indem er neben
seinem Studium arbeitet und dabei etwas Geld hinzuverdient. Ihm werden zwei Stellen
angeboten:
• eine zu einem Lohn von 20 Euro/Std aber mit einer sehr anstrengenden Arbeit,
• eine zu einem Lohn von 10 Euro/Std mit einer sehr interessanten Tätigkeit.
Der Student beschließt, jede Woche insgesamt, d. h. für sein Studium und für den
Gelderwerb, 50 Stunden zu arbeiten, und faßt dabei folgenden Vorsatz:
• Er will 400 Euro pro Woche verdienen.
• Er will für das Studium zwei Stunden mehr arbeiten als für beide Stellen zusam-
men.
Wie viel Zeit würde der Student aufgrund dieser Regeln je Woche für sein Studium
aufwenden? Mit wie vielen Stunden würde der Studenten die erste und die zweite Stelle
annehmen?
Um diese Fragen zu beantworten, findet man ein geeignete mathematisches Modell. Man
definiert dazu als erstes die (zunächst) unbekannten Größen
x1 Zeit für Stelle 1
x2 Zeit für Stelle 2 (jeweils in Stunden)
x3 Zeit für das Studium
Unter Beachtung seiner aufgestellten Regeln erhält der Student drei Gleichungen1 :
x1 + x2 + x3 = 50
20x1 + 10x2 = 400
2 + x1 + x2 = x 3 ⇔ x1 + x2 − x3 = −2
1
. . ., bei denen die Einheiten weggelassen wurden.
70
Etwas schöner“ aufgeschrieben, lautet dieses:
”
x1 + x2 + x3 = 50
20x1 + 10x2 = 400
x1 + x2 − x3 = −2
• Auflösen: Beginnend bei der letzten Zeile wird die jeweils an der Stufe stehende
Variable (siehe gleich) berechnen.
x1 #
x2
..
.
...
0 xn
Wie man gleich sehen wird, wird sich eine solche Form für das Beispiel ( armer Student“)
”
mit n = 3 ergeben. Liegt eine solche Form vor, so ist das Gleichungssystem eindeutig
lösbar , denn
• In der letzten Zeile steht genau eine Variable; der eindeutige Wert dieser letzten
Variablen kann sofort ermittelt werden.
• Jede Variable steht an einer Stufe; die Variablen xn−1 , xn−2 , . . . , x1 können so
nacheinander eindeutig berechnet werden.
1. Beispiel:2
71
Die Vertauschung 1. und 2. Zeile liefert:
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
10x1 + 2x2 + 4x3 = 1 (III) − 10 · (I)
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
−18x2 − 26x3 = −9 (III) + 2 · (II)
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
0x3 = 5
Der letzter Schritt führte zur gleichzeitigen Elimination zweier Variablen. Die sich erge-
bende letzte Gleichung kann nie erfüllt werden, denn es ist stets
0x3 6= 5
Damit folgt, daß dieses Gleichungssystem nicht erfüllbar ist; es ist unlösbar!
Allgemein gilt: Genau dann, wenn die Reduzierung mindestens eine Gleichung liefert, die
auf der linken Seite nur Nullen und auf der rechten Seite dagegen einen Wert ungleich
Null besitzt, ist das Gleichungssystem unlösbar.
72
Nun können die Lösungswerte der einzelnen Variablen, beginnend bei der letzten, nach-
einander berechnet werden
x3 = 26, x2 = 60 − 2x3 = 60 − 52 = 8
x1 = 50 − x2 − x3 = 50 − 8 − 26 = 16
Um die Lösung geeignet als ein einheitliches Objekt darstellen zu können, soll hier schon
die sogenannte Vektorschreibweise (siehe später) verwendet werden. Die Lösungswerte
der Variablen x1 , x2 , . . . , xn werden nacheinander untereinander geschrieben und mit
einem Paar runder Klammern umgeben; diese Objekte werden als Vektoren (bzw.
genau als Spaltenvektoren“) bezeichnet. Für das letzte Gleichungssystem erhält man
”
als Lösung den Vektor:
16
8
26
Insbesondere besitzt dieses Gleichungssystem eine eindeutige Lösung.
3. Beispiel
9x2 + 13x3 = 63
x1 + 2x2 + 3x3 = 14
10x1 + 2x2 + 4x3 = 14
Dieselben Reduzierungsschritte wie beim vorletzten Beispiel liefern
x1 + 2x2 + 3x3 = 14
9x2 + 13x3 = 63 (2.1)
0x3 = 0
Dieses Gleichungssystem ist lösbar, denn die letzte Gleichung ist immer erfüllt.
Aber es ist nicht eindeutig lösbar, denn
• x3 steht nicht an einer Stufe.4
• Für x3 kann ein beliebiger Wert λ ∈ IR eingesetzt werden.
Man setzt in diesem Fall x3 = λ, wobei λ eine beliege reelle Zahl sein kann, und löst
damit das reduzierte Gleichungssystem wie eben auf:
x3 = λ
x2 = 19 (63 − 13 · λ) = 7 − 13
9λ (2.2)
x1 = 14 − 2x2 − 3x3 = 14 − (14 − 26 1
9 λ) − 3λ = − 9 λ
Da ja für λ jede reelle Zahl eingesetzt werden kann, ergibt sich eine aus mehreren
möglichen Lösungen bestehende Menge; diese Lösungsmenge lautet:
− 19 λ
13
L = 7 − λ λ ∈ IR
9
λ
73
Man erkennt, daß auch hier wieder die Spaltenschreibweise verwendet wird.
Zu klären ist noch, was genau unter einer Stufe“ bzw. einer Stufenvariable“ bei einem
” ”
reduzierten Gleichungssystem zu verstehen ist:
• Eine Stufenvariable ist die erste in einer Gleichung erscheinende Variable; insbe-
sondere ist ihr Koeffizient ungleich Null bzw. nach Normierung sogar gleich eins.
Das reduzierte Gleichungssystem (2.1) enthält zwei Stufen mit den beiden Stufenvaria-
blen x1 und x2 ; dagegen ist x3 keine Stufenvariable.
• werden nur die Werte der Stufenvariablen durch das Gleichungssystem festgelegt.
Beispiel:
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
x4 − 2x5 = 1
2x4 − 4x5 = 2
Wie man erkennt, wurde hier x2 in der zweiten Gleichungen ebenfalls eliminiert; x2
erscheint an keiner Stufe und liefert einen Freiheitsgrad.
5
Eine unechte Gleichung“ bzw. Nullgleichung“ zeichnet sich dadurch aus, daß in ihr keine Varia-
” ”
blen mehr erscheint; dieses ist gleichbedeutende damit, daß alle Variablen in dieser Gleichungen den
Koeffizienten Null besitzen. Die rechte Seite einer Nullgleichung kann von Null verschieden sein.
74
Die weiteren Reduzierungsschritte: (IV)-(III)
(V)-2·(III)
liefern
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0
75
Rang und Corang sind zwei sehr wichtige Kennzahlen des linearen Gleichungssystems.
Der Rang bezeichnet die echte“ Anzahl der Gleichungen6 . Der Rang und der Corang
”
ergeben sich unmittelbar nach Reduzierung des Gleichungssystems.
Für den Rang und den Corang gelten die folgenden wichtigen Sachverhalte, die sich
ebenfalls unmittelbar aus der reduzierten Form des Gleichungssystems ergeben:
1. 0 ≤ r und 0 ≤ s ≤ n
2. ist r =n⇔s=0
⇔ alle n Variablen stehen an einer Stufe
⇔ alle n Variablen sind durch das Gleichungssystem bestimmt
⇔ keine Freiheitsgrade
⇔ nicht mehrdeutig lösbar
x1 − 3x2 + 4x3 = 8
2x1 − 6x2 + 9x3 = 20 (II)-2(I)
r = 2, n = 3 ⇒ s=n−r =1
Vorhanden ist somit ein Freiheitsgrad; dieser ist durch die nicht an einer Stufe erschei-
nenden Variablen x2 gegeben. Weiter folgt:
Zur Bestimmen der Lösungsmenge setzt man x2 = λ und löst das reduzierte Gleichungs-
system, beginnend bei der letzten Gleichung, auf:
x3 = 4
x2 = λ
x1 = 8 + 3λ − 4 · 4 = −8 + 3λ
6
Sollte jemand versuchen, ein Gleichungssystem zu erweitern, indem er einfach eine bereits vorhan-
dene Gleichung ein zweites Mal hinzufügt, so erhöht sich zwar m, die Anzahl der Gleichungen, der Rang
r bleibt jedoch unverändert.
76
Für die Lösungsmenge ergibt sich damit:
−8 + 3λ
L = λ λ ∈ IR (2.4)
4
Die in (2.5) erscheinende Addition zweier Vektoren sowie Multiplikation eines Vektors
mit einer reellen Zahl werden komponentenweise durchgeführt. Damit erhält man aus
(2.5) genau die Darstellung (2.4).
Begründung:
77
Setzt man dieses in jede einzelne Gleichung des Gleichungssystems ein, so folgt für
j = 1, . . . , m
= bj
⇒ j-te Gleichung wird erfüllt
⇒ wegen j = 1, . . . , m wird damit das Gleichungssystem
insgesamt erfüllt.
2. Umgekehrt ist nun zu zeigen, daß eine beliebige Lösung T in der Form
T = S +H
mit der speziellen Lösung S und einer geeigneten Lösung H des homogenen Sys-
tems dargestellt werden kann. Da ja die spezielle Lösung S gegeben ist bzw. fest
gewählt wurde, ergibt sich H sofort aus dem Ansatz
t1 − s1
H = T −S =
..
.
tn − sn
Zu zeigen bleibt, daß H tatsächlich Lösung des homogenen Systems ist. Einsetzen
von H in das homogene System liefert für j = 1, . . . , m in der Tat
wählen.
3. Das homogene System ist natürlich immer lösbar; es besitzt zumindest die Nulllösung
(2.8).
78
• es eine spezielle Lösung gibt und
• das zugehörige homogene System nur die Nulllösung (2.8) besitzt! Man be-
achte dazu, daß durch S = S + 0 bereits eine Lösung gegeben ist; jedes H 6= 0
würde eine weitere Lösung liefern.
Durch
L = {S + H | H ist homogene Lösung.}
wurde bereits eine erste, grobe Darstellung der Lösungsmenge eines linearen Gleichungs-
systems geliefert. Die Struktur der Lösungsmenge läßt sich aber noch genauer beschrei-
ben:
L = S + λ1 G1 + ... + λs Gs λ1 , . . . , λs ∈ IR
(2.9)
| {z }
homogene Lösung
eine spezielle Lösung des Gleichungssystems. Für i = 1, . . . , s (s ist der Corang) sind
w1,i
Gi = ... (2.11)
wn,i
H = λ1 G1 + . . . + λs Gs mit λ1 , . . . , λs ∈ IR (2.12)
besitzt8 .
Nachdem man ein lineares Gleichungssystem in die reduzierte Gestalt gebracht hat, läßt
sich die Lösungsmenge in der Form (2.9) sehr einfach berechnen. Man wählt dazu die
folgende Vorgehensweise:
Berechnung von S : Man löst das Gleichungssystem auf und setzt dabei alle Frei-
heitsgrade gleich Null; d. h. ist xi keine Stufenvariable, so wird xi = 0 gesetzt.9
8
Der Beweis wird hier nicht gebracht.
9
Man verfährt dazu entsprechend wie in (2.2); für die in (2.2) erscheinende Nichtstufenvariable x3
würde man hier x3 = 0 setzen.
10
d. h. das System mit denselben Koeffizienten, aber den rechten Seiten b1 = ... = bm = 0
79
Als Beispiel wird das Gleichungssystem (2.1) mit der reduzierten Form
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0
verwendet. Als erstes wird die spezielle Lösung S berechnet, indem für die beiden Frei-
heitsgrade x2 = x5 = 0 gesetzt wird. Das Auflösen liefert damit:
x5 = 0
x4 = 1 − (−2)x5 = 1
x3 = −2 − (−1)x4 − (−2)x5 = −2 + 1 = −1
x2 = 0
x1 = 2 − 5x2 − 3x3 − (−1)x4 − 0x5 = 2 − 0 + 3 + 1 − 0 = 6
Zur Berechnung der ersten Grundlösung setzt man x2 = 1, x5 = 0; damit liefert die
Auflösung
x5 = 0 −5
x4 = 0 1
x3 = 0 ⇒ G1 = 0
x2 = 1 0
x1 = -5 0
Zur Berechnung der zweiten Grundlösung setzt man dann x2 = 0, x5 = 1; hier liefert
die Auflösung
x5 = 1 −10
x4 = 2 0
x3 = 4 ⇒ G2 = 4
x2 = 0 2
x1 = -10 1
Die Lösungsmenge des Gleichungssystems (2.1) kann nun sehr gut dargestellt werden:
6 −5 −10
0 1 0
L =
−1
+ λ1 ·
0
+ λ 2 ·
4
λi ∈ IR
1 0 2
0 0 1
80
Wie bereits erwähnt wurde, kann an Hand des zugehörigen homogenen Gleichungssys-
tems die Eindeutigkeit der Lösung festgestellt werden; es gilt nämlich:
Ein Gleichungssystem ist genau dann höchstens eindeutig lösbar, wenn das
zugehörige homogene System nur die Lösung Null besitzt.
L = {S + 0} = {S}
Beispiel:
2x1 + 6x2 = 4 x1 + 3x2 = 2
reduziert:
x1 + 4x2 = 1 x2 = −1
Das zugehörige homogene System lautet:
2x1 + 6x2 = 0 x1 + 3x2 = 0
reduziert:
x1 4x2 = 0 x2 = 0
Die Auflösung des homogenen Gleichungssystems liefert als dessen einzige Lösung x2 =
0, x1 = −3x2 = 0. Damit folgt, daß das ursprüngliches System eindeutig lösbar ist. Die
betreffende eindeutige Lösung erhält man durch
5
x2 = −1, x1 = 2 − 3x2 = 5 ⇒ A=
−1
Sehr wichtig sind die Quadratischen Systeme; bei diesen ist n = m, also
11
Kontrollfrage: Warum ist ein homogenes System immer lösbar?
12
Diese Aussage wird bei der Polynominterpolation von großem Nutzen sein.
81
Beispiel:13
Der hier gezeigte Ausschnitt des Stra- .. ..
ßennetzes einer Stadt enthält vier Ein- .. ..
.. ..
bahnstraßen mit vier Kreuzungen je- 500 .. .. 300
.. ..
weils zweier dieser Einbahnstraßen. .. ..
200 D .. x3 .. . C 200
Eine Verkehrszählung ergab, wievie- ..................................................................................................................................................................................................
le Kraftfahrzeuge durchschnittlich pro .. ..
.. ..
Stunde auf die Kreuzungen zufahren .. ..
.. ..
bzw. diese wieder verlassen. Läßt sich .. .
.. ........
.
hieraus schließen, wieviele Kraftfahr- x4 .... ... x2
.... ..
zeuge durchschnittlich pro Stunde zwi- .. ..
schen diesen Kreuzungen verkehren? .. ..
.. ..
Diese Anzahlen seien x1 , x2 , x3 , x4 . Zwi- .. ..
.. .
schen diesen Kreuzungen und Zähl- ...................................................................................................................................................................................................
punkten gibt es keine weiteren Straßen 500 A ... x1 .. B 500
..
.. ..
Einmündungen oder Abgänge; außer- .. .. 700
900 .. ..
dem soll angenommen werden, daß es zu .. ..
.. .
keinen Staus oder dergleichen kommt.
Als Ansatz zur Bestimmung der Anzahlen x1 , x2 , x3 , x4 verwendet man:
Die Anzahl der (stündlich) auf eine Kreuzung zufahrenden Fahrzeuge muß
gleich der Anzahl der von der Kreuzung abfahrenden Fahrzeuge sein.
Das ergibt hier mit den Werten aus der Zeichnung:
Kreuzung zufahrend abfahrend
A 500 + 900 = x1 + x2
B x1 + x 2 = 700 + 500
C 200 + 300 = x2 + x3
D x3 + x 4 = 200 + 500
Man erkennt sofort, daß diese Gleichungen ein lineares Gleichungssystem mit vier Glei-
chungen und vier Unbekannten bilden. In die übliche Form umgeschrieben lautet dieses
Gleichungssystem:
x1 + x4 = 1400
x1 + x2 = 1200
(2.14)
x2 + x3 = 500
x3 + x4 = 700
Gemäß des Gaußschen Verfahrens zieht man nacheinander die erste Gleichung von der
zweiten, die zweite von der dritten, die dritte von der vierten ab und schließlich erhält
die reduzierte Form:
x1 + x4 = 1400
x2 − x4 = −200
(2.15)
x3 + x4 = 700
0 · x4 = 0
Man erkennt, der Rang ist 3, und der Corang beträgt 1. Außerdem ist das Gleichungs-
system wegen der vollständigen Nullgleichung lösbar. Die Lösungsmenge ist somit nicht
82
leer und besitzt einen Freiheitsgrad. Zur Bestimmung der Lösungsmenge bestimmt man
zunächst wie üblich eine spezielle Lösung ~x0 , indem man x4 = 0 setzt:
x4 = 0 1400
x3 = 700 − x4 −200
⇒ ~x0 = (2.16)
x2 = −200 + x4 700
x1 = 1400 − x4 0
Wie man sieht, können die Komponenten dieser speziellen Lösungsmenge ~x0 nicht die
gesuchten Anzahlen darstellen. Warum nicht?
Um die vollständige Lösungsmenge von (2.14) zu erhalten, benötigt man noch eine
Grundlösung ~x1 des zugehörigen homogenen Systems. Wie üblich setzt man dazu x4 = 1
und verwendet die reduzierte Form des zugehörigen homogenen Gleichungssystems:
x4 = 1 −1
x3 = − x4 1
⇒ ~x1 =
−1
(2.17)
x2 = + x4
x1 = − x4 1
Da die Komponenten eines Lösungsvektors Anzahlen darstellen sollen, dürfen sie nicht
negativ sein. Für den Parameter λ sind daher genau die folgenden Werte möglich:
Man erhält damit zwar keine eindeutige Lösung für die gesuchten Verkehrsflüsse. Man
hat damit aber berechnet, daß die gesuchten Anzahlen von Fahrzeugen pro Stunde in
folgenden Bereichen liegen:
1200 ≤ x1 ≤ 700
0 ≥ x2 ≥ 500
(2.20)
500 ≤ x3 ≤ 0
200 ≥ x4 ≥ 700
83
2.2 Matrizen
2.2.1 Der Begriff der Matrix
Wir kommen auf die linearen Gleichungssysteme (siehe Seite 70 ff) zurück und verfolgen
das Ziel, für diese eine geeignetere und auch kürzere Schreibweise zu finden.
Der wesentliche Bestandteil eines Gleichungssystems sind seine Koeffizienten, sie be-
stimmen Rang und Corang des Gleichungssystems. Man beginnt daher beim Aufstellen
der neuen Schreibweise bei den Koeffizienten:
Die Koeffizienten eines linearen Gleichungssystems mit m Gleichungen und n Unbekann-
ten
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
schreibt man in der Form einer sogenannten m × n–Matrix
a11 a12 . . . a1n
a21 a22 . . . a2n
A = ..
.. ..
. . .
am1 am2 . . . amn
Eine m × n–Matrix ist ein rechteckiges Zahlenschema mit m Zeilen und n Spalten.
Man bezeichnet Matrizen meist mit großen Druckbuchstaben. Kurzschreibweisen für
allgemeine Matrizen sind
A = ((aij ), i = 1 . . . m, j = 1 . . . n)
oder, falls Zeilen- und Spaltenzahl bereits festliegen, auch nur einfach A = ((aij )). Die
aij nennt man die Koeffizienten oder Einträge der Matrix.
Matrizen sind eine Verallgemeinerung der Spaltenvektoren, der Schreibweise, die man
für die Lösung von Gleichungssystemen verwendet (siehe Seite 73): Einen Spaltenvektor
wie
x1
~x = ...
xn
84
kann man als n × 1–Matrix auffassen, also als Matrix mit n Zeilen und nur einer Spalte.
Umgekehrt ist es oft günstig, eine m × n–Matrix als Zusammensetzung von n Spalten-
vektoren mit jeweils m Komponenten zu betrachten:
A = ((aij ), i = 1 . . . m, j = 1 . . . n)
= (~a1 , . . . , ~an )
a1j
mit ~aj = ... für j = 1 . . . n
amj
Der erste Index zählt hier die Komponente des Spaltenvektors, der zweite gibt an, daß
es sich um den j-ten Spaltenvektor handelt.
4 13 5
Die Menge der n–dimensionalen Spaltenvektoren wird mit IRn bezeichnet. Für Matrizen
trifft man entsprechend die
Definition: Für m, n ∈ IN ist
Die Matrix (2.23) ist demnach ein Element der Menge M4,3 (IR).
• Mm,1 (IR ) ist – wie bereits erwähnt – die Menge der einspaltigen Matrizen, sie
entspricht der Menge der m-dimensionalen Spaltenvektoren:
Mm,1 (IR) =
˜ IRm
• M1,n (IR) ist die Menge der einzeiligen Matrizen, sie entspricht der Menge der n-
dimensionalen Zeilenvektoren:
M1,n (IR) =
˜ {(a1 , . . . , an ) | ai ∈ IR }
• M1,1 (IR) ist die Menge der Matrizen mit nur einem einzigen Eintrag, sie entspricht
der Menge der reellen Zahlen:
M1,1 (IR) =
˜ IR
85
Um mit Hilfe der Matrizen zu einer einfachen Schreibweise für lineare Gleichungssysteme
zu gelangen, definiert man eine Multiplikation“ zwischen einer m×n–Matrix und einem
”
n-dimensionalen Spaltenvektor:
Definition: Seien
x1
A = ((ai,j )) ∈ Mm,n (IR) und ~x = ... ∈ IRn
xn
eine m × n–Matrix und ein n-dimensionaler Spaltenvektor, dann definiert man deren
Produkt durch
a11 . . . a1n x1
A ◦ ~x = ... .. ◦ ..
. .
am1 . . . amn xn
(2.24)
a11 x1 + a12 x2 + . . . + a1n xn
a21 x1 + a22 x2 + . . . + a2n xn
=
.. .. ..
. . .
am1 x1 + am2 x2 + . . . + amn xn
Das Symbol für diese Verknüpfung ist der Kringel ( ◦“), der auch zur Verknüpfung von
”
Funktionen (f ◦ g) verwendet wird. Verknüpft wird hier immer jeweils eine Zeile der
Matrix mit dem Spaltenvektor:
x1
(ai1 , . . . , ain ) , ... −→ ai1 x1 + ai2 x2 + . . . + ain xn ∈ IR
xn
Das Ergebnis hiervon ist eine reelle Zahl. Hat die Matrix m Zeilen, so liefert die gesam-
te Operation als Ergebnis m reelle Zahlen; diese bilden genau einen m–dimensionalen
Spaltenvektor.
Der Wertebereich der Verknüpfung ◦“ zwischen einer m × n–Matrix und einem n–
”
dimensionalen Spaltenvektor ist somit der IRm :
Jetzt braucht man nur die rechte Seite eines Gleichungssystems als m–dimensionalen
Spaltenvektor darzustellen. Dann kann man statt
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
das Gleichungssystem in der einfacheren Form
a11 . . . a1n x1 b1
.. .. ◦ .. = ..
. . . .
am1 . . . amn xn bm
86
aufschreiben, bzw. man kann die Kurzschreibweise
A ◦ ~x = ~b
verwenden. Der letzte Ausdruck ist die direkte Verallgemeinerung der Darstellung ax = b
einer einfachen Gleichung mit einer Unbekannten.
Die Matrix–Vektor–Multiplikation
a11 . . . a1n x1
A ◦ ~x = ... .. ◦ ..
. .
am1 . . . amn xn
a11 x1 + . . . + a1n xn
=
.. ..
. .
am1 x1 + . . . + amn xn
ist dabei so gefaßt worden, daß sie genau auf die linearen Gleichungssysteme paßt!
2. Geeignete Vielfache der ersten Zeile werden von den folgenden abgezogen oder zu
diesen hinzuaddiert:
1 5 3
9
0 7 0 9
0 −14 7 −18
0 −7 −7 −9
3. Die zweite Zeile wird normiert, anschließend werden geeignete Vielfache der zwei-
ten Zeile von den folgenden abgezogen oder zu diesen hinzuaddiert:
9
1 5 3
9
0 1 0
7
0 0 7 0
0 0 −7 0
87
4. Normiert man nun noch die dritte Gleichung und addiert man ihr Siebenfaches
zur letzten Gleichung, so erhält man ein reduziertes Gleichungssystem, das in
Matrizenschreibweise so aussieht:
9
1 5 3
0 1 0 x1 9
◦ x2 = 7
0 0 1 0
x3
0 0 0 0
Nachdem wir hier die Matrizen über lineare Gleichungssysteme eingeführt haben, werden
wir sie jedoch – so wie es üblich ist - weitestgehend losgelöst von den Gleichungssystemen
behandelt. Wir werden sehen, daß man Matrizen formal gut handhaben kann und werden
insbesondere die Matrizenrechnung kennenlernen.
Daß sich die Anwendungsmöglichkeit der Matrizen keinesfalls nur auf die linearen Glei-
chungssysteme beschränkt, wird durch das folgende Beispiel unterstrichen:
Beispiel: Matrizen finden Verwendung bei der Beschreibung von Graphen. Als Beispiel
betrachten wir diesen gerichteten Graphen:
v7 w k
1
5
6
w v v9
8
v1 1 PPP
P
k1 v4 PPPP
w w k
q
k4
PP
PP 2 v v6 1
2
P
6
PP PP
Pq ?
w v5
PP
PP P
v3 P! !
k3
Ein gerichteter Graph besteht aus einer Menge K von sogenannten Knoten, hier:
K = {k1 , k2 , k3 , k4 , k5 }
und eine Menge V von gerichteten Verbindungen zwischen einem Teil der Knoten, hier:
{v1 = (k4 , k1 ), v2 = (k4 , k3 ), v3 = (k3 , k4 ), v4 = (k1 , k2 ), v5 = (k3 , k2 ),
V =
v6 = (k1 , k3 ), v7 = (k5 , k1 ), v8 = (k1 , k5 ), v9 = (k2 , k5 )}
Einen gerichteten Graphen stellt etwa das Straßennetz einer Stadt dar: Straßenkreuzun-
gen und Einmündungen sind die Knoten, Straßenfahrtrichtungen bzw. Einbahnstraßen
sind die gerichteten Verbindungen.
Zur Darstellung solcher Graphen dient die sogenannte Adjazenzmatrix :
Hat ein gerichteter Graph n ∈ IN Knoten, so ist seine Adjazenzmatrix
a11 . . . a1n
A = ((aij ), i, j = 1 . . . n) = ... ..
.
an1 . . . ann
eine n × n–Matrix, sie ist definiert durch
1 falls eine Verbindung vom i-ten Knoten
aij = zum j-ten Knoten vorhanden ist
0 sonst
88
Die Adjazenzmatrix des Graphen hier lautet
0 1 1 0 1
0 0 0 0 1
A = 0 1 0 1 0 (2.25)
1 0 1 0 0
1 0 0 0 0
Die Adjazenzmatrix eines Graphen kann leicht im Rechner dargestellt und bearbeitet
werden; ausgehend von ihr kann man etwa die Zusammenhangskomponenten des Gra-
phen bestimmen.
Eine wichtige Kennzahl erbt“ die Matrix vom zugehörigen linearen Gleichungssystem:
”
Definition: Der Rang einer Matrix M , geschrieben rgM , ist der Rang eines linearen
Gleichungssystems mit Koeffizientenmatrix M .
diejenige Matrix n × m–Matrix, die man erhält, wenn man A an der Hauptdiagonalen14
spiegelt. Die Spalten von At sind dann genau die Zeilen von A:
a11 . . . a1n
a21 . . . a2n a 11 a 21 . . . a m1
t . .. ..
A = .. .. ⇒ A = ..
. . .
.
a1n a2n . . . amn
am1 . . . amn
Beispiel:
t
2 10 6
−1 2 −3 2 −1 3 4
= 10 2 1 13
3 1 2
6 −3 2 5
4 13 5
14
Die Hauptdiagonale ist die Diagonale mit den Elementen a11 , a22 , . . . .
89
Beispiel: Die Transponierte der Adjazenzmatrix (2.25) des gerichteten Graphen auf Seite
88 ist
0 0 0 1 1
1 0 1 0 0
t
A = 1 0 0 1 0
0 0 1 0 0
1 1 0 0 0
Dieses ist die Adjazenzmatrix desjenigen gerichteten Graphen, den man enthält, indem
man beim ursprünglichen Graphen alle Verbindungsrichtungen umkehrt.
Bemerkung: Bei nicht quadratischen Matrizen werden beim Transponieren Zeilen- und
Spaltenzahl vertauscht, d. h.
Definition: Eine quadratische Matrix A ∈ Mn,n (IR) heißt symmetrisch, falls sie gleich
ihrer Transponierten ist:
A = At
Eine n × n–MatrixA = ((aij )) ist genau dann symmetrisch, wenn ihre Einträge die
Gleichungen
aij = aji für alle i, j = 1 . . . n
erfüllen. Beispiel:
1 3
A = ist symmetrisch,
3 2
1 3
B = dagegen nicht.
4 2
90
eines gerichteten Graphen (siehe Seite 88) symmetrisch ist, d. h. wenn
aij = 1 ⇔ aji = 1
bzw. aij = 0 ⇔ aji = 0 gilt?
Das heißt: es gibt genau dann eine gerichtete Verbindung vom i-ten zum j-ten Knoten,
wenn es auch eine solche Verbindung in umgekehrter Richtung gibt. Ein Graph dieser
Art entspricht einem sogenannten ungerichteten Graphen.
Zwei interessante Spezialfälle beim Transponieren sind Zeilen- und Spaltenvektoren: Ein
Spaltenvektor geht in einen Zeilenvektor über und umgekehrt.
a1
~a = ... ⇔ ~a t = (a1 , . . . , an )
an
~c t = (c1 , . . . , cn ) (2.26)
ein Zeilenvektor, so ist ~c der zugehörige Spaltenvektor; dieses erkennt man, indem man
beide Seiten der Gleichung (2.26) transponiert:
c1
~c tt = (c1 , . . . , cn )t = ...
cn
und ~c tt = ~c verwendet. Ebenso verwendet man für Spaltenvektoren mitunter die beque-
mere Schreibweise ~a = (a1 , . . . , an )t“, es ist nämlich
”
a1
~a = (a1 , . . . , an )t = ...
an
Es folgt ein wichtiger Satz, der später noch plausibilisiert werden wird:
Satz: Die transponierte Matrix besitzt denselben Rang wie die ursprüngliche Matrix:
rgA = rgAt
91
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt
Zunächst lassen sich zwei Matrizen derselben Dimension addieren; das Ergebnis der
Addition ist wieder eine Matrix derselben Dimension:
Ein neutrales Element der Addition ist vorhanden, die Nullmatrix , die man üblicherweise
einfach durch 0“ bezeichnet:
”
0 ... 0
0 = ... ..
.
0 ... 0
Damit ist A + (−A) = 0. Zu beachten ist, daß man zwei Matrizen nur dann addieren
oder voneinander abziehen kann, wenn sie Elemente derselben Matrizenmenge Mm,n (IR)
sind.
Weiterhin kann man eine Matrix mit einer reellen Zahl λ ∈ IR multiplizieren; diese
Multiplikation erfolgt ebenfalls komponentenweise:
λa11 . . . λa1n
λ · A = ... ..
.
λam1 . . . λamn
Die bedeutsamste Rechenoperation für Matrizen ist das Matrizenprodukt, das zwischen
Matrizen passender Dimension erfüllt ist: Ist A ∈ Ml,m (IR) und B ∈ Mm,n (IR), so läßt
sich mit diesen Matrizen die Matrizenmultiplikation ausführen:
A◦B = C
Das Ergebnis ist eine Matrix C ∈ Ml,n (IR). Zur Bezeichnung der Matrizenmultiplikation
wird auch der Kringel ◦“ verwendet.
”
Zur Herleitung der genauen Definition des Matrizenproduktes kehren wir zu den linearen
Gleichungssystemen zurück:
B ◦ ~x = ~y (2.27)
92
Dabei sind
B ∈ Mm,n (IR), B = ((bij )),
~x ∈ IRn , ~x = (x1 , . . . , xn )t ein Spaltenvektor, bestehend aus
n Unbestimmten,
m t
~y ∈ IR , ~y = (y1 , . . . , ym ) die rechte Seite des Gleichungs-
systems, wobei hier die y1 , . . . , ym
ebenfalls Unbestimmte sein sol-
len, sie sollen sich als Lösung ei-
nes weiteren linearen Gleichungs-
systems ergeben.
Das Gleichungssystem zur Bestimmung von ~y = (y1 , . . . , ym )t sei
A ◦ ~y = d~ (2.28)
mit A = ((aij )) ∈ Ml,m (IR) und der festen rechten Seite d~ ∈ IRl .
Um direkt eine Lösung für ~x zu finden, d. h. ohne zunächst das Gleichungssystem in ~y
lösen zu müssen, setzen wir in die Gleichung (2.28) für ~y die linke Seite von (2.27) und
erhalten
A ◦ (B ◦ ~x) = d~ (2.29)
Wir wollen
• zeigen, daß (2.29) ein lineares Gleichungssystem mit n Unbekannten und l Glei-
chungen ist,
• die Koeffizientenmatrix C des Gleichungssystems (2.29) in Abhängigkeit von den
Koeffizentenmatrizen A und B der beiden ursprünglichen Gleichungssysteme be-
stimmen.
Dazu führen wir die beiden Matrix-Vektor-Multiplikationen in (2.29) explizit aus; als
erstes erfolgt die Multiplikation B ◦ ~x:
A ◦ (B ◦ ~x)
a11 . . . a1m b11 . . . b1n x1
= ... .. ◦ .. .. ◦ ..
. . . .
al1 . . . alm bm1 . . . bmn xn
n
X
b1j xj
Der rechte Faktor ist ein m-
a11 . . . a1m j=1
dimensionaler Spaltenvektor, den
.. .
. ..
= . . ◦
n . multiplizieren wir jetzt mit der
al1 . . . alm X
l × m–Matrix A.
bmj xj
j=1
m n
!
X X
a1i bij xj
i=1 j=1
=
..
(2.30)
m . !
n
X X
ali bij xj
i=1 j=1
93
Als Zwischenergebnis haben wir den l-dimensionalen Spaltenvektor mit den Komponen-
ten !
Xm X n
aki bij xj für k = 1 . . . l
i=1 j=1
erhalten. Die Komponenten dieses Vektors formen wir in einer Nebenrechnung um: für
k = 1 . . . l ist
m n
!
X X
aki bij xj
i=1 j=1
m n
!
X X
= aki bij xj Die aki wurden durch Ausmultiplizieren
i=1 j=1 in die innere Summe gezogen.
n m
!
X X
= aki bij xj Jetzt wird zuerst über j und dann über
j=1 i=1 i summiert; diese Änderung bewirkt
nur, daß Summanden in anderer Rei-
henfolge aufaddiert werden.
n m
!
X X
= aki bij xj xj wurde aus der inneren Summe her-
j=1
| i=1
{z } ausgezogen.
ckj
n
X
= ckj xj Die Koeffizienten der xj bezeichnen wir
j=1 zur Abkürzung mit ckj .
Setzt man das Ergebnis der Zwischenrechnung in (2.30) ein, so folgt für den zu berech-
nenden Ausdruck A ◦ (B ◦ ~x)
n
X
c1j xj
j=1
A ◦ (B ◦ ~x) =
..
(2.32)
n .
X
clj xj
j=1
Schaut man sich die rechte Seite der Gleichung (2.32) genau an, so stellt man fest, daß
dieses genau das Ergebnis der Multiplikation der l × n–Matrix
c11 . . . c1n
C = ... ..
.
cl1 . . . cln
94
mit dem Spaltenvektor ~x ∈ IRn ist, also hat man
c11 . . . c1n x1
A ◦ (B ◦ ~x) = ... .. ◦ ..
. .
cl1 . . . cln xn
= C ◦ ~x (2.33)
Setzt man jetzt noch (2.33) in die Gleichung (siehe Seite 93)
A ◦ (B ◦ ~x) = d~ (2.34)
ein, so wird diese Gleichung zu
C ◦ ~x = d~ (2.35)
Damit haben wir hergeleitet: Die Gleichung (2.29) bzw. (2.34) läßt sich in der Form
(2.35) schreiben und besitzt folglich die Gestalt eines linearen Gleichungssystems.
Gleichzeitig haben wir die Koeffizientenmatrix dieses Gleichungssystems berechnet, es
ist die l × n–Matrix
c11 . . . c1n
C = ... .. ∈ Ml,n (IR)
.
cl1 . . . cln
m
X
mit ckj = aki bij (2.36)
i=1
Die neue Matrix C, auf die wir gestoßen sind, hängt über die Berechnungsvorschrift
(2.36) von den beiden gegebenen Matrizen A und B ab. Diese Berechnungsvorschrift ist
das sogenannte Matrizenprodukt, dessen genaue Definition jetzt folgt:
Definition: Sei A = ((aki )) ∈ Ml,m (IR) eine l × m–Matrix und B = ((bij )) ∈ Mm,n (IR)
eine m × n–Matrix. Dann ist deren Produktmatrix
C = A◦B
die l × n–Matrix C = ((ckj )) ∈ Ml,n (IR) mit den Koeffizienten
m
X k = 1...l
ckj = aki bij für (2.37)
j = 1...n
i=1
Man beachte, daß der zweite Index der Einträge von A und der erste Index der Ein-
träge von B denselben Wertebereich durchlaufen; dieses ist auch genau der Bereich des
Summationsindex’ in (2.37).
Beispiel:
0 2
1 2 4 1·0+2·3+4·1 1·2+2·4+4·1
◦ 3 4 =
9 8 1 9·0+8·3+1·1 9·2+8·4+1·1
1 1
10 14
=
25 51
95
Wichtige Bemerkung: Die Multiplikation zweier Matrizen kann nur dann ausgeführt
werden, wenn die Dimensionen passend sind: die Spaltenzahl des linken Faktors muß
gleich der Zeilenzahl des rechten Faktors sein; also
Ml,m (IR) × Mm,n (IR) −→ Ml,n (IR)
(2.38)
A ◦ B = C
Die Produktmatrix erbt“ die Zeilenzahl vom linken und die Spaltenzahl vom rechten
”
Faktor.
Wir wollen jetzt das Matrizenprodukt A ◦ B = C noch etwas genauer betrachten und
dabei zwei weitere wichtige Schreibweisen für dieses gewinnen. Zunächst erkennt man,
daß bei der Berechnung der Koeffizienten ckj von C, also in
m
X
ckj = aki bij = ak1 b1j + . . . + akm bmj (2.39)
i=1
die k-te Zeile (ak1 , . . . , akm ) von A mit der j-ten Spalte (b1j , . . . , bmj )t von B miteinander
verknüpft werden:
b11 . . . b1j . . . b1n
.. .. ..
. . .
bm1 . . . bmj . . . bmn
↓
a11 . . . a1m
.. ..
. .
ak1 . . . akm → ckj
. ..
.. .
al1 . . . alm
Dieses führt auf eine andere Schreibweise für (2.39): Wir betrachten dazu den zweiten
Faktor B wieder als aus n Spaltenvektoren zusammengesetzt:
b1j
B = (~b1 , . . . , ~bn ) mit ~bj = ... für j = 1 . . . n
bmj
Eine ähnliche Darstellung wählen wir für den ersten Faktor A, indem wir setzen
ak1
~ak = ...
akm
96
Dann können wir die Gleichung (2.39) in der kurzen Form
b1j
ckj = (ak1 , . . . , akm ) ◦ ...
bmj
schreiben. Dieses ist nichts anderes als das Produkt einer 1 × m–Matrix mit einer m × 1–
Matrix!
Die Kurzschreibweise (2.41) für die Koeffizenten der Produktmatrix wenden wir bei der
Herleitung einer wichtigen Formel an. Diese Formel beschreibt das Zusammenspiel von
Transposition und Matrizenprodukt:
Satz: Sei A ∈ Ml,m (IR) und B ∈ Mm,n (IR). Dann ist A ◦ B definiert, und es gilt
(A ◦ B)t = B t ◦ At (2.42)
(Man beachte, daß wegen B t ∈ Mn,m (IR) und At ∈ Mm,l (IR) auch das Produkt B t ◦ At
definiert ist.)
Beweis15 : Wir schreiben A in Zeilendarstellung (siehe 2.40) und B in Spaltendarstellung:
~a1t
A = ... mit ~ak ∈ IRm
~alt
Das Produkt der beiden Matrizen A und B stellen wir mit Hilfe von (2.41) dar:
A◦B =
.. ..
. .
t ~ t ~
~al ◦ b1 . . . ~al ◦ bn
Beide Seiten dieser Gleichung werden transponiert, dazu müssen auf der rechten Seite
Zeilen und Spalten vertauscht werden:
(A ◦ B)t =
.. ..
(2.44)
. .
~a t ◦ ~bn . . . ~a t ◦ ~bn
1 l
15
Das Nachvollziehen dieses Beweises ist zwar nützlich und wird dringend empfohlen, ist aber für das
Verständnis des Folgenden nicht zwingend erforderlich.
97
Einen Eintrag dieser Matrix wollen wir etwas genau betrachten und geeignet umschrei-
ben:
m
X
~akt ◦ ~bj = aki bij Die beiden Faktoren unter dem Summenzei-
i=1 chen werden vertauscht.
m
X
= bij aki Dieses kann man als Produkt der 1 × m–
i=1 Matrix ~bjt und der m×l–Matrix ~ak auffassen.
Daß hier der gemeinsame Summationsindex
nicht in der Mitte sondern außen steht, ist ohne
Belang. Man könnte dieses durch Umbenennung
der Koeffizienten vermeiden.
= ~bjt ◦ ~ak
Dieses wird jetzt in (2.44) eingesetzt, die Einträge der dortigen Matrix bekommen dann
die Gestalt:
~b t ◦ ~a1 . . . ~b t ◦ ~al
1 1
(A ◦ B)t =
.. ..
Vergleicht man die Einträge die-
. .
~b ◦ ~a1 . . . ~b ◦ ~al
t t ser Matrix mit Gleichung (2.41),
n n
so erkennt man: diese Matrix
ist Produkt zweier Matrizen,
nämlich:
~b t
1
= ... ◦ (~a1 , . . . , ~al ) Dieses sind aber gerade die beiden
~b t Matrizen aus (2.43).
n
= B t ◦ At
qed.
98
Wir wollen untersuchen, wie eine Spalte ~cj = (c1j , . . . , c1j )t der l × n–Matrix C von A
und den Spalten von B abhängt. Für jede Spalte ~cj mit j = 1 . . . n gilt
c1j
~cj = ... Für jeden Koeffizienten clj setzen
clj wir die Darstellung aus Gleichung
(2.39) ein.
m
X
a1i bij
i=1
= ..
Ausgeschrieben ergibt dieses
.
Xm
ali bij
i=1
a11 b1j + . . . + a1m bmj
=
..
.
al1 b1j + . . . + alm bmj
Vergleicht man dieses mit der Definition der Multiplikation einer Matrix mit einem
Vektor (siehe Gleichung 2.24 auf Seite 86), dann erkennt man, daß man für den letzten
Ausdruck schreiben kann
a11 b1j + . . . + a1m bmj a11 . . . a1m b1j
.. . .. ◦ ..
= ..
. . .
al1 b1j + . . . + alm bmj al1 . . . alm bmj
= A ◦ ~bj
~cj = A ◦ ~bj
erhalten. Diese Gleichung besagt, daß die Spalten der Produktmatrix das Ergebnis der
Matrix-Vektor-Multiplikation des linken Faktors A mit den Spalten des rechten Faktors
B sind. Setzt man dieses in die Spaltendarstellung der Produktmatrix C = A ◦ B ein,
so erhält man eine wichtige Schreibweise des Matrizenproduktes:
• Das Matrix-Vektor-Produkt ist das gleiche wie das Produkt einer Matrix mit ei-
ner einspaltigen Matrix. Das Matrix-Vektor-Produkt ist daher ein Spezialfall des
Matrizenproduktes.
99
Insbesondere gelten dann alle Aussagen und Formeln des Matrizenproduktes auch für
das Matrix-Vektor-Produkt.
Die folgenden Gleichungen werden ohne Beweise16 gebracht. Sehr wichtig ist darunter
insbesondere die erste Aussage, das Assoziativgesetz:
Dann gilt:
1. Das Assoziativgesetz:
(A ◦ B) ◦ C = A ◦ (B ◦ C)
Die Reihenfolge der Ausführung spielt bei der Matrizenmutliplikation keine Rolle.
2. Das 1. Distributivgesetz:
(A1 + A2 ) ◦ B = A1 ◦ B + A2 ◦ B
3. Das 2. Distributivgesetz:
A ◦ (B1 + B2 ) = A ◦ B1 + A ◦ B2
4. Für λ ∈ IR ist
λ · (A ◦ B) = (λ · A) ◦ B = A ◦ (λ · B)
Zum Schluß dieses Abschnitts noch ein Beispiel zur Anwendung des Matrizenproduktes.
Wir betrachten wieder den gerichteten Graphen auf Seite 88 mit Adjazenzmatrix
0 1 1 0 1
0 0 0 0 1
A = 0 1 0 1 0
1 0 1 0 0
1 0 0 0 0
100
Während die Adjazenzmatrix angibt, ob eine direkte Verbindung von einem Knoten
zu einem anderen führt, gibt deren Quadrat an, wie viele Wege zwischen zwei Knoten
verlaufen, die genau über einen weiteren Knoten führen17 , genauer:
0 Kein Weg der Länge zwei führt vom i-ten
Knoten zu j-ten Knoten.
bij =
s > 0 Genau s Wege der Länge zwei führen vom
i-ten Knoten zu j-ten Knoten.
• Genau zwei Wege der Länge zwei führen vom vierten zum zweiten Knoten.
• Genau ein Weg der Länge zwei führt vom ersten zum zweiten Knoten.
• Kein Weg der Länge zwei besteht zwischen dem zweiten und dritten Knoten.
Damit wird die Matrizenmultiplikation zu einer inneren Verknüpfung der Menge Mn,n (IR):
Sie ist für alle Elemente aus Mn,n (IR) definiert, und Mn,n (IR) ist abgeschlossen bezüglich
◦“.
”
Zum Vergleich sei daran erinnert, daß die übliche Multiplikation eine innere Verknüpfung
der Menge der reellen Zahlen ist.
Betrachtet man Mn,n (IR) zusammen mit den beiden inneren Verknüpfungen +“ (der
”
komponentenweisen Addition) und ◦“, so spricht vom Matrizenring und schreibt
”
(Mn,n (IR), +, ◦)
Bezüglich der Addition gilt das auf der Seite 92 ausgeführt; insgesamt gilt: Zusammen
mit +“ ist Mn,n (IR) eine kommutative Gruppe mit der Nullmatrix als neutralem Ele-
”
ment; das negative Element einer Matrix erhält man dadurch, daß man jeden ihrer
Einträge durch dessen Negatives ersetzt.
Wir wollen uns jetzt der anderen inneren Verknüpfung ◦“ zuwenden. Zunächst gilt auch
”
hier der Satz auf Seite 100:
17
Solche Wege bezeichne man als Wege der Länge 2.
101
• ◦“ ist assoziativ, d. h.
”
A, B, C ∈ Mn,n (IR) ⇒ (A ◦ B) ◦ C = A ◦ (B ◦ C)
A, B, C ∈ Mn,n (IR) ⇒ (A + B) ◦ C = A ◦ C + B ◦ C
A ◦ (B + C) = A ◦ B + A ◦ C
• Kommutativität
• neutralem Element
• Inversenbildung
Wir gehen nacheinander diese Punkte durch. Dazu setzen wir fortan n > 1 voraus. Für
n = 1 entspricht Mn,n (IR) der Menge der reellen Zahlen (Aufgaben: Machen Sie sich
dieses klar!):
(M1,1 (IR), +, ◦) =
˜ (IR, +, ·)
Zunächst muß man feststellen, daß die Matrizenmultiplikation nicht kommutativ ist,
d. h. es gibt Matrizen A, B ∈ Mn,n (IR) mit A ◦ B 6= B ◦ A.
Beispiel:
0 1 2 0 0 1
◦ =
1 0 0 1 2 0
2 0 0 1 0 2
6= ◦ =
0 1 1 0 1 0
Ein neutrales Element zur Matrizenmultiplikation ist vorhanden; dieses ist die sogenann-
te Einheitsmatrix , bezeichnet mit E“:
”
1 0 ··· 0
0 1 ··· 0
E = .. .. . . ..
. . . .
0 0 ··· 1
Die Einheitsmatrix ist die Matrix, deren Einträge auf der Hauptdiagonalen alle gleich 1
und sonst gleich 0 sind. Die Einträge von E bezeichnet man üblicherweise mit δij :
δ11 . . . δ1n
.. .
.. mit δij = 1 für i = j
E = .
0 für i 6= j
δn1 . . . δnn
102
Eine weitere Schreibweise für die Einheitsmatrix ist die Darstellung durch Spaltenvek-
toren:
Die ~e1 , . . . , ~en bezeichnet man als die n-dimensionalen Einheitsvektoren; die Einheits-
vektoren enthalten genau eine Eins und sonst Nullen. Für n = 3 hat man beispielsweise
1 0 0
~e1 = 0 , ~e2 =
1 und ~e3 = 0
0 0 1
1 · a1 + 0 · a2 + · · · + 0 · an a1
0 · a1 + 1 · a2 + · · · + 0 · an a2
= = = ~a
.. ..
. .
0 · a1 + 0 · a2 + · · · + 1 · an an
Stellt man jetzt A in Spaltenschreibweise dar, so folgt im zweiten Schritt mit (2.45)
103
Bis jetzt wurde nur gezeigt, daß für alle A ∈ Mn,n (IR) die Gleichung
E◦A = A
gilt, d. h. es wurde nur gezeigt, daß E ein sogenanntes linksneutrales Element ist. Man
kann daraus nicht unmittelbar folgern, daß auch
A◦E = A (2.46)
B = E◦B
Dieses wenden wir auf die Matrix At (der Transponierten unserer gegebenen Matrix A)
an:
At = E ◦ At
und transponieren beide Seiten dieser Gleichung
Att = (E ◦ At )t
Wegen Att = A und E t = E folgt daraus nach Gleichung (2.42) auf Seite 97
A = (E ◦ At )t = Att ◦ E t = A ◦ E
qed.
Die Einheitsmatrix E ist ein links- und rechtsneutrales Element. Ist ein solches vorhan-
den, so stellt sich sofort die Frage nach inversen Elementen: Zu A ∈ Mn,n (IR), A 6= 0 ist
ein D ∈ Mn,n (IR) mit
A◦D = E
gesucht. Man muß jedoch sogleich feststellen, daß es – im Gegensatz zu den reellen
Zahlen – nicht zu jedem von Null verschiedenen Element ein Inverses gibt. Als Beispiel
betrachten wir
1 2
A =
3 6
Setzt man hilfsweise
3 −1
C =
3 −1
so rechnet man nach:18
C ◦A =0 (2.47)
18
Die Matrizen C und A sind auch ein Beispiel für Nullteiler. Mn,n (IR) ist also - anders als IR - nicht
nullteilerfrei.
104
Angenommen, A besitzt ein Inverses, d. h. es gibt eine Matrix D ∈ Mn,n (IR) mit A◦D =
E. Multipliziert man beide Seiten der Gleichung (2.47) von rechts mit dieser Matrix D,
so folgt
C ◦A ◦ D} = 0| {z
| {z ◦ D}
=E =0
⇒ C ◦E = C = 0
Der folgende Satz gibt an, wann eine Matrix invertierbar ist; der zweite Teil seines
Beweises weist einen Weg, zu einer gegebenen Matrix deren Inverse zu berechnen.
Satz: Sei A ∈ Mn,n (IR). Zu A gibt es genau dann eine Matrix D ∈ Mn,n (IR) mit
A◦D = E
A ◦ ~x = ~b (2.48)
vorhanden ist. Mit Hilfe der Matrix D kann man die Lösung sofort angeben: Diese
lautet:
~x = D ◦ ~b (2.49)
A ◦ ~x = A ◦ D} ◦~b
| {z
=E
= E ◦ ~b = ~b
In der Tat hat man so eine Lösung von (2.48) für eine beliebige rechte Seite ~b
gefunden. A hat folglich den Rang n.
2. Jetzt werde umgekehrt vorausgesetzt, daß rgA = n ist; zu zeigen ist nun: es gibt
ein D ∈ Mn,n (IR) mit A ◦ D = E.
Da rgA = n ist, hat ein quadratischen Gleichungssystem mit Koeffizientenmatrix
A, also
A ◦ ~x = ~b
105
den Rang n und ist für jede rechte Seite ~b lösbar (siehe wieder Seite 76 oder
Seite 81). Insbesondere lassen sich Lösungen finden, wenn man für ~b die n Spalten
der Einheitsmatrix E = (~e1 , . . . , ~en ) einsetzt; dieses liefert die n Gleichungssysteme
Sei d~j ∈ IRn jeweils die Lösung hiervon. Dann kann man schreiben
D = (d~1 , . . . , d~n )
so ist
A ◦ D = A ◦ (d~1 , . . . , d~n )
= (A ◦ d~1 , . . . , A ◦ d~n )
= (~e1 , . . . , ~en )
= E
Im zweiten Teil des Beweises wurde die inverse Matrix mit Hilfe linearer Gleichungs-
systeme gefunden. Wir kommen darauf zurück, wenn wir die Inverse einer gegebenen
Matrix explizit berechnen wollen.
Ist zu A ∈ Mn,n (IR) ein D ∈ Mn,n (IR) mit A ◦ D = E vorhanden, so schreibt man für D
A−1
und nennt A−1 die Umkehrmatrix zu A. Existiert A−1 , so nennt man A umkehrbar oder
invertierbar .
Wegen der fehlenden Kommutativität der Matrizenmultiplikation taucht hier wieder ein
Problem auf: Es ist zwar
A ◦ A−1 = E
Daraus folgt aber noch nicht, daß auch A−1 ◦ A = E ist. Wir wissen eben bis jetzt nur,
A−1 ein Rechtsinverses zu A; daß A−1 auch Linksinverses ist, ist eine der Aussagen des
folgenden Satzes.
Satz: Die Matrix A ∈ Mn,n (IR) sei umkehrbar mit Umkehrmatrix A−1 . Dann gilt
1. Die Matrix A−1 ist ebenfalls umkehrbar.
(A−1 )−1 = A
3. Es ist
A−1 ◦ A = E
106
Beweis:
1. Aufgrund des Satzes auf Seite 105 ist zum Nachweis der Umkehrbarkeit von A−1
zu zeigen, daß
rgA−1 = n
ist. Dieses ergibt sich dadurch, daß gezeigt wird, daß das homogene Gleichungs-
system mit Koeffizientenmatrix A−1
A−1 ◦ ~x = 0
nur die Lösung ~x = 0 besitzt (siehe wieder Seite 81). Sei ~x0 ∈ IRn eine beliebige
Lösung, d. h. es sei
A−1 ◦ ~x0 = 0
Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man19 :
−1
| ◦{zA } ◦~x0 = A
A ◦ 0}
| {z
=E =0
⇒ E ◦ ~x0 = 0
⇒ ~x0 = 0
Damit ist rgA−1 = n gezeigt. Die Umkehrmatrix (A−1 )−1 von A−1 existiert also
und für diese gilt
2. Zu zeigen ist jetzt: (A−1 )−1 = A. Dazu multiplizieren wir Gleichung (2.51) von
links mit A und verwenden wieder A ◦ A−1 = E:
−1 −1 −1
| ◦{zA } ◦(A )
A = A◦E
=E
⇒ E ◦ (A−1 )−1 = A
⇒ (A−1 )−1 = A
3. Als letztes ist zu zeigen: A−1 ◦ A. Dieses folgt aber sofort aus Gleichung (2.51)
zusammen mit der eben bewiesenen Gleichung (A−1 )−1 = A. qed.
Nun wissen wir, daß A−1 sowohl Links- als auch Rechtsinverses zu A ist:
A−1 ◦ A = A ◦ A−1 = E
Wir wollen jetzt ein Verfahren kennenlernen, zu A ∈ Mn,n (IR) mit rgA = n die Umkehr-
matrix A−1 zu berechnen. In dem Beweis des Satzes auf Seite 105 wurde das Verfahren
bereits beschrieben: Man muß die Gleichungssysteme
A ◦ ~x = ~ej (2.52)
19
Zur Erinnerung: 0 steht hier für den Nullvektor (0, . . . , 0). Offensichtlich ist A ◦ 0 = 0.
107
für j = 1 . . . n lösen. Dabei sind ~e1 , . . . , ~en die Spalten der Einheitsmatrix E = (~e1 , . . . , ~en ).
Sind d~1 , . . . , d~n die Lösungen der Gleichung (2.52), so ist – wie gezeigt -
Da sich die n Gleichungssysteme (2.52) nur um die rechten Seiten unterscheiden, las-
sen sie sich mit Hilfe des Gaußschen Verfahrens simultan lösen. Man schreibt dazu die
gemeinsame Koeffizientenmatrix A und die rechten Seiten nebeneinander auf:
A ~e1 ~e2 · · · ~en
bzw. ausführlicher
1 0 0
a11 . . . a1n
.. ..
0 1 0
...
. . .. .. ..
. . .
an1 . . . ann
0 0 1
Anschließend beginnt man mit dem Umformen nach dem Gaußschen Verfahren. Die
Umformungsschritte wendet man hier nicht nur auf die eine rechte Seite, sondern auf
die n rechten Seiten an. Dieses liefert die reduzierte Form der n Gleichungssysteme; sie
bekommen damit die Gestalt
1 α12 α13 . . . α1n−1 α1n
0 1 α23 . . . α2n−1 α2n
0 0 1 . . . α3n−1 α 3n
(1) (1)
· · · ~en(1)
. . . . .
. . . ... . . ~e1 ~e2
. . . . .
0 0 0 ... 1 αn−1n
..
0 0 0 . 0 1
(1) (1)
Die ~e1 , . . . , ~en sind die umgeformten rechten Seiten. Auf der gesamten Diagonalen der
reduzierten Koeffizientenmatrix müssen Einsen stehen, da ja rgA = n vorausgesetzt ist.
Stieße man hier auf Nullgleichungen, so wäre rgA < n, und man könnte die Rechnung
abbrechen, da A nicht invertierbar wäre.
Wegen der Einsen auf der Diagonalen kann man die weitere Rechnung dadurch be-
schleunigen, daß man die Gleichungssysteme noch weiter reduziert. Die Fortsetzung des
Reduktionsvorganges soll dazu führen, daß auch oberhalb der Diagonalen nur Nullen
stehen. Die Vorgehensweise dabei lautet:
Als erstes zieht man für i = 1 . . . n − 1 das αin –Fache der letzten Zeile von der i-ten
Zeile ab; dieses liefert
1 α12 α13 . . . α1n−1 0
0 1 α23 . . . α2n−1 0
0 0 1 . . . α3n−1 0 (2) (2)
. .
. . .. . . .. .. ~e1 ~e2 · · · ~en(2)
. . . . . .
0 0 0 . . . 1 0
..
0 0 0 . 0 1
Jetzt sind die Elemente der letzten Spalte außerhalb der Diagonalen alle Null. Die rech-
ten Seiten haben sich aufgrund der Zeilensubtraktionen auch weiter verändert.
108
Man verfährt jetzt so weiter, indem man – von hinten beginnend – für j = n − 1 . . . 2
und bei festem j jeweils für i = 1 . . . j − 1 das αij –Fache der j-ten Zeile von der i-ten
Zeile abzieht; dieses liefert die vollständig reduzierte Form
1 0 0 ... 0 0
0 1 0 ... 0 0
0 0 1 ... 0 0
. . . . . . .. .. f~1 f~2 · · · f~n
. . .
. . . . .
0 0 0 ... 1 0
.
0 0 0 .. 0 1
Dabei sind die f~1 , . . . , f~n die endgültig umgeformten rechten Seiten. Die Koeffizienten-
matrix ist in die Einheitsmatrix verwandelt worden. Damit kann man die vollständig
reduzierten Gleichungssysteme schreiben als
Wegen
E ◦ f~j = f~j
sind die Lösungen von (2.53) und damit auch die Lösungen von (2.52) genau die n
Spaltenvektoren f~1 , . . . , f~n . Die aus deren Zusammensetzung gebildete Matrix
D = (f~1 , . . . , f~n )
Geeignete Vielfache der ersten Zeile werden von den folgenden Zeilen abgezogen:
1 2 3
1
0
0
0 1 7 −5 1 0
0 4 29 −3 0 1
109
Das Vierfache der zweiten wird von der letzen Zeile abgezogen:
1 2 3
1
0
0
0 1 7 −5 1 0
0 0 1 17 −4 1
Jetzt setzt man die Reduzierung fort; dabei wird das 7–Fache der letzten von der zweiten
und das 3–Fache der letzten von der ersten Zeile abgezogen:
1 2 0
−50
12
−3
0 1 0 −124 29 −7
0 0 1 17 −4 1
Zum Schluß wird das Zweifache der zweiten Zeile von der ersten abgezogen:
1 0 0
198
−46
11
0 1 0
−124 29 −7
0 0 1 17 −4 1
Damit haben wir als Ergebnis unserer Berechnung erhalten:
−1
1 2 3 198 −46 11
A−1 = 5 11 22 = −124 29 −7
3 10 38 17 −4 1
A ◦ ~x = ~b
sofort lösen. Multipliziert man beide Seiten dieser (Matrizen-) Gleichung von links mit
A−1 :
−1 −1 ~
| {z◦ A} ◦~x = A ◦ b
A
=E
~x = A−1 ◦ ~b
110
Die Berechnung der Umkehrmatrix ist immer dann angezeigt, wenn ein quadratisches
Gleichungssystem mit vollem Rang mehrmals mit unterschiedlichen rechten Seiten zu
lösen ist. Hat man die Umkehrmatrix vorliegen, dann beschränkt sich der Aufwand beim
Berechnen einer Lösung auf eine einfache Multiplikation einer Matrix mit einem Vektor.
Aufgabe: Eine Diagonalmatrix ist eine n × n–Matrix, deren Einträge außerhalb der
Hauptdiagonalen alle gleich Null sind:
λ1 0
0 λ2 0
D =
. .
mit λ1 , . . . , λn ∈ IR
0 . 0
0 λn−1 0
0 λn
Zeigen Sie: D ist genau dann umkehrbar, wenn λj 6= 0 für j = 1 . . . n ist, und daß in
diesem Falle die Umkehrmatrix durch
−1
λ1 0
0 λ−1 0
2
D −1
=
. ..
0 0
−1
0 λn−1 0
0 λ−1
n
gegeben ist!
also:
(~a1 , . . . , ~an ) = (A ◦ ~e1 , . . . , A ◦ ~en )
Die letzte Gleichung gibt die Gleichheit zweier Matrizen an; da zwei Matrizen genau
dann gleich sich, wenn ihre entsprechenden Spalten gleich sind, liefert dieses
A ◦ ~ej = ~aj für j = 1 . . . n (2.54)
Diese Gleichung besagt: die Multiplikation einer Matrix mit dem j-ten Einheitsvektor
liefert die j-te Spalte der Matrix.
Jetzt werde vorausgesetzt, daß die Matrix A umkehrbar ist. Multipliziert man die Glei-
chung (2.54) von links mit A−1 , so erhält man
A−1 ◦ A ◦ ~ej = A−1 ◦ ~aj
⇒ ~ej = A−1 ◦ ~aj für j = 1 . . . n (2.55)
111
Der nächste Satz beschreibt den Zusammenhang zwischen Matrizenmultiplikation und
Inversenbildung.
Satz: Sind A, B ∈ Mn,n (IR) zwei umkehrbare Matrizen, so ist auch ihr Produkt umkehr-
bar, und die Umkehrmatrix des Produktes erhält man durch
Beweis: Man zeigt, daß B −1 ◦ A−1 die Umkehrmatrix von A ◦ B ist, indem man ganz
einfach nachrechnet, daß diese beiden Matrizen miteinander multipliziert die Einheits-
matrix ergeben:
(A ◦ B) ◦ (B −1 ◦ A−1 ) = (A ◦ B) ◦ (B −1 ◦ A−1 )
= A ◦ (B ◦ B −1 ) ◦ A−1
= A ◦ E ◦ A−1
= A ◦ A−1
= E
qed.
In Worten lautet diese Gleichung: Die Inverse der Transponierten ist die Transponierte
der Inversen.
Wegen der beiden Sätze auf Seite 112 und Seite 106 ist GL(n, IR ) bezüglich Matrizen-
multiplikation und Inversenbildung abgeschlossen. GL(n, IR ) bildet mit der Matrizen-
multiplikation eine nicht-kommutative Gruppe.
Die Menge der orthogonalen Matrizen, die sogenannte orthogonale Gruppe ist definiert
durch
O(n, IR ) = A ∈ Mn,n (IR)|A ◦ At = E
Bei einer orthogonalen Matrix ist die Umkehrmatrix gleich der Transponierten. Mit
Hilfe von Gleichung (2.42) auf Seite 97 folgt die Abgeschlossenheit der orthogonalen
Gruppe bezüglich der Matrizenmultiplikation; O(n, IR ) ist damit ebenfalls eine nicht-
kommutative Gruppe.
112
Aufgabe: Weisen Sie die Abgeschlossenheit von O(n, IR) unter ◦“ nach, d. h. zeigen Sie,
”
daß für A, B ∈ O(n, IR ) auch A ◦ B orthogonal ist, daß nämlich (A ◦ B) ◦ (A ◦ B)t = E
ist!
cos2 α + sin2 α
0 cos α sin α − sin α cos α
= 0 1 0
2 2
sin α cos α − sin α cos α 0 sin α + cos α
1 0 0
= 0 1 0 = E
0 0 1
Die Matrix U beschreibt im 3-dimensionalen Raum eine Drehung um den Winkel α mit
der y–Achse als Drehachse.
f : Mn,n (IR) 7→ IR
zu finden, die gute rechnerische Eigenschaften“ besitzt und für die gilt
”
6= 0 falls A ∈ Mn,n (IR) umkehrbar ist
f (A)
= 0 sonst
113
und dazu das Gleichungssystem
A ◦ ~x = ~b
mit der rechten Seite ~b = (b1 , b2 )t . Ausgeschrieben lautet dieses Gleichungssystem
a11 x1 + a12 x2 = b1
a21 x1 + a22 x2 = b2
Wir versuchen dieses Gleichungssystem zu lösen, indem wir hier die erste Gleichung mit
a21 und die zweite Gleichung mit a11 multiplizieren:
a11 a21 x1 + a12 a21 x2 = b1 a21
a11 a21 x1 + a11 a22 x2 = b2 a11
und anschließend die erste Gleichung von der zweiten abziehen:
a11 a21 x1 + a12 a21 x2 = b1 a21
(a a − a a ) x = b2 a11 − b1 a21
| 11 22 {z 12 21} 2
d
Man sieht leicht, daß das Gleichungssystem genau dann für jede Wahl von ~b = (b1 , b2 )t
lösbar ist und folglich den vollen Rang r = 2 besitzt, wenn d 6= 0 ist. Man setzt daher
für 2 × 2–Matrix A:
a11 a12 a11 a12
f = det = a11 a22 − a12 a21
a21 a22 a21 a22
Diese Definition der Determinanten soll nun auf Mn,n (IR) für beliebiges n ∈ IN verallge-
meinert werden. Anschließend wird gezeigt, daß die Determinante die eingangs genann-
ten Eigenschaften besitzt und wie man mit der Determinante rechnet bzw. umgeht.
Auch hier erweist es sich wieder als vorteilhaft, eine n×n–Matrix in Spaltenschreibweise
darzustellen:
A = (~a1 , . . . , ~an ) mit Spaltenvektoren ~ai ∈ IRn für i = 1, . . . , n
und die Determinante als Funktion der n Spaltenvektoren aufzufassen:
f (A) = det A = det(~a1 , . . . , ~an )
Die weitere Vorgehensweise besteht darin, daß wir zunächst einige rechnerische Eigen-
schaften, die die Determinante besitzen soll, aufführen. Diese Eigenschaften werden sich
zum einen später als nützlich erweisen, zum anderen legen sie – wie wir sehen werden –
die Definition der Determinanten eindeutig fest.
Die zu fordernden Eigenschaften sind:
1. Für die Determinante der Einheitsmatrix ist
det E = 1
2. Multipliziert man eine der Spalten ~aj mit einem reellen Faktor, so kann man diesen
Faktor aus der Determinanten herausziehen:
Für λ ∈ IR und 1 ≤ j ≤ n gilt:
det(~a1 , . . . , λ · ~aj , . . . , ~an ) = λ · det(~a1 , . . . , ~aj , . . . , ~an )
114
3. Ist eine der Spalten eine Summe, so kann man die Addition aus der Determinanten
”
herausziehen“: Hat die j-te Spalte die Gestalt ~aj = ~uj + ~vj , so gilt
4. Sind zwei Spalten der Matrix gleich, so ist der Wert ihrer Determinanten Null;
steht etwa die j-te Spalte auch an der i-ten Stelle mit i 6= j, so hat man:
5. Vertauscht man zwei Spalten, so ändert der Wert der Determinanten sein Vorzei-
chen: für i 6= j ist
Bemerkungen:
• Die erste Eigenschaft ist die sogenannte Normierung.
• Man kann zeigen, daß die beiden Eigenschaften 4) und 5) äquivalent sind; man
bezeichnet sie als Alternierend in den Spalten.
Es folgt aus den fünf Eigenschaften sofort, daß eine Matrix A, von deren Spalten eine
nur Nullen enthält, die Determinante Null besitzt: Gilt etwa für die j-te Spalte ~aj = ~0,
so ändert sich nichts, wenn man diese mit 0 multipliziert: 0 ·~aj = ~0 = ~aj , und man kann
schließen:
Hierbei wurde verwendet, daß man den Faktor 0 nach Eigenschaft 2) herausziehen kann.
Aus den Eigenschaften 2), 3) und 4) folgt gemeinsam die wichtige Regel, daß sich der
Wert der Determinanten nicht ändert, wenn man von einer Spalte das Vielfache einer
anderen abzieht; es gilt nämlich für i 6= j
115
Hier wurde als erstes die Determinante nach Eigenschaft 3) auseinandergezogen; an-
schließend wurde mit Eigenschaft 2) der Faktor −λ aus dem zweiten Summanden her-
ausgezogen; in der letzten Zeile hat die zweite Determinante wegen der doppelt vorkom-
menden Spalte ~aj nach Eigenschaft 4) den Wert Null.
Wir zeigen jetzt, daß man aus den geforderten Eigenschaften (auf Seite 114) eine Berech-
nungsvorschrift für den Wert der Determinanten einer beliebigen n × n–Matrix herleiten
kann. Wir gehen dazu schrittweise vor, beginnen im ersten Schritt mit der Determinanten
der Einheitsmatrix und erhalten nach mehreren Verallgemeinerungsschritten schließlich
eine Darstellung der Determinanten einer allgemeinen Matrix.
Im 1. Schritt stellen wir fest, daß durch die Normierungsbedingung die Determinante
der Einheitsmatrix festgelegt ist:
det E = 1
Im 2. Schritt betrachten wir solche Matrizen, deren Spalten Einheitsvektoren sind, d. h. die
in jeder Spalte jeweils genau eine Eins enthalten:
Sind unter den ~ε1 , . . . , ~εn zwei gleich, so besitzt A zwei gleiche Spalten, und nach Eigen-
schaft 4) auf Seite 114 ist det A = 0. Sind dagegen alle ~εi voneinander verschieden, so
handelt es sich bei ihnen um eine Vertauschung der Einheitsvektoren ~e1 , . . . , ~en , d. h. die
Matrix A ist aus der Einheitsmatrix durch Spaltenvertauschung hervorgegangen. Da
nach Eigenschaft 5) eine Vertauschung zweier Spalten zu einem Vorzeichenwechsel bei
der Determinanten führt, muß det A = ± det E = ±1 sein. Das Vorzeichen hängt hier
von der Anzahl der paarweisen Vertauschungen ab. Genauer gilt:
0 falls zwei der ~ε1 , . . . , ~εn gleich sind
+1 falls die ~ε1 , . . . , ~εn durch eine ge-
rade Anzahl paarweiser Vertau-
schungen aus ~e1 , . . . , ~en entstan-
det(~ε1 , ~ε2 , . . . , ~εn ) = (2.58)
den sind
−1 falls die ~ε1 , . . . , ~εn durch eine un-
gerade Anzahl paarweiser Vertau-
schungen aus ~e1 , . . . , ~en entstan-
den sind
und versuchen, deren Determinante auf Determinanten vom eben im 2. Schritt behan-
delten Typ zurückzuführen.
116
Im 3. Schritt nehmen wir uns der ersten Spalte ~a1 von A an. Wir zerlegen diese in eine
Summe aus Vielfachen der Einheitsvektoren:
a11 1 0 0
a21 0 1 0
~a1 = .. = a11 .. + a21 .. + . . . + an1 ..
. . . .
an1 0 0 1
n
X
= ai1 · ~ei (2.59)
i=1
Ist eine Spalte eine Summe, so kann nach Eigenschaft 3) auf Seite 114 die Summenbil-
dung aus der Determinanten herausgezogen werden; damit erhält man20 :
n
X
det A = det(ai1 · ~ei , ~a2 , . . . , ~an )
i=1
Hier ist jeder Summand eine Determinante, deren erste Spalte jeweils den Faktor ai1
enthält; nach Eigenschaft 2) kann dieser jeweils vor die Determinante gezogen werden:
n
X
det A = ai1 det(~ei , ~a2 , . . . , ~an ) (2.60)
i=1
Die hier erscheinenden Determinanten haben jeweils in der ersten Spalte genau eine
Eins und sonst Nullen und besitzen damit schon etwas Ähnlichkeit“ mit den bei 2.58
”
behandelten Determinanten.
Im 4. Schritt wird auf dieselbe Art die zweite Spalte zerlegt:
n
X
~a2 = aj2 · ~ej
j=1
n X
X n
= ai1 aj2 det(~ei , ~ej , ~a3 , . . . , ~an ) (2.61)
i=1 j=1
20
Bei einer mehrfachen Addition muß streng genommen die Eigenschaft 3) entsprechend mehrfach
angewandt werden.
117
In den weiteren Schritten werden die restlichen Spalten zerlegt. Führt man dieses zunächst
als Beispiel für n = 5 durch, so erhält man
n X
X n X
n X
n X
n
det A = ai1 aj2 ak3 al4 am5 det(~ei , ~ej , ~ek , ~el , ~em )
i=1 j=1 k=1 l=1 m=1
Will man dieses für ein allgemeines n ∈ IN durchführen, so tritt aber ein Problem hin-
sichtlich der Schreibweise auf: Für jede der n Spalte benötigt man in der entstehenden
Mehrfachsumme einen eigenen Index. Bei großen Werten für n reicht für deren Bezeich-
nung kein Alphabet aus. Deshalb verschafft man sich n Indizes, indem den Index i selber
indiziert; das liefert die Indizes
i1 , i2 . . . , in
Verwendet man diese Indizes in der Summe 2.61, so wird diese zu
n X
X n
det A = ai1 1 ai2 2 det(~ei1 , ~ei2 , ~a3 , . . . , ~an )
i1 =1 i2 =1
Im letzten Schritt nach Zerlegung aller Spalten gelangt man bei Verwendung dieser
Indexschreibweise zu der Darstellung
n X
X n n
X
det A = ... ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1 i2 =1 in =1
Gewöhnlich stellt man diese n-fache Summe durch ein einziges Summenzeichen dar:
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.62)
i1 =1,i2 =1,...,in =1
Die in den einzelnen Summanden erscheinenden Faktoren det(~ei1 , ~ei2 , . . . , ~ein ) sind De-
terminanten, die in jeder Spalte jeweils genau eine Eins und sonst Nullen besitzen. Die
Werte solcher Determinanten sind durch 2.58 bestimmt. Durch den Ausdruck 2.62 ist
somit der Wert der Determinanten der Matrix A festgelegt.
Bemerkenswert ist, daß die Darstellung der Determinanten 2.62 in Verbindung mit 2.58
allein aus den geforderten Eigenschaften 2.3.1 auf Seite 2.3.1 gefolgert werden konnte.
Bevor die Summe in 2.62 noch etwas genauer betrachtet wird, folgt als Beispiel die
Determinante einer 2 × 2–Matrix:
1 2 1 0 2
det = det 1 · +3· ,
3 4 0 1 4
1 2 0 2
= 1 · det + 3 · det
0 4 1 4
1 1 1 0
= 1 · 2 · det + 1 · 4 · det
0 0 0 1
| {z } | {z }
=0 =1
0 1 0 0
+ 3 · 2 · det + 3 · 4 · det
1 0 1 1
| {z } | {z }
=−1 =0
= 4 − 3 · 2 = −2
118
Führt man diese Rechnung für eine allgemeine 2 × 2–Matrix durch, so erhält man die
Formel
a b
det = ad − bc
c d
• Ein Summand ist höchstens dann von Null verschieden, wenn die zugehörigen
Werte der Indizes i1 , . . . , in alle paarweise verschieden sind. Andernfalls wären in
dem Faktor det(~ei1 , ~ei2 , . . . , ~ein ) zwei gleiche Spalten vorhanden und er wäre damit
wegen 2.58 gleich Null. Hieraus folgt insbesondere:
• Zur praktischen Berechnung der Determinanten wird die obige Darstellung nur bei
2 × 2–Matrizen verwendet. Für n × n–Matrizen mit n ≥ 2 sind zur Determinan-
tenberechnung geeignetere Verfahren vorhanden (siehe später).
Nachdem wir bisher die Determinante über ihre Grundeigenschaften (siehe Seite 114)
und ihre Darstellung 2.62 eingeführt haben, wollen wir nun
• verstehen, aus welchem Grund genau dann det A 6= 0 ist, wenn A umkehrbar ist.
Eingangs wurde von den guten rechnerischen Eigenschaften der Determinanten gespro-
chen; eine sehr bedeutsame davon ist die Verträglichkeit“ der Determinanten mit dem
”
Matrizenprodukt, beschrieben durch den folgenden
119
Satz: Für zwei Matrizen A, B ∈ Mn,n (IR) gilt
Beweis: Der Beweis verläuft ganz ähnlich wie die Herleitung der Gleichung 2.62.
Als erstes nehmen wir an, daß die Matrix B nur aus Einheitsvektoren besteht. In ge-
ringfügiger Abänderung der Schreibweise auf Seite 116 schreiben wir hier B in der Form
Dabei nimmt jeder der Indizes i1 , . . . , in einen Wert zwischen 1 und n (einschl. ) an.
Besitzen zwei dieser Indizes denselben Wert, so sind zwei Spalten von B gleich, und es
ist in diesem Fall
det B = 0
Andererseits sind in diesem Fall auch zwei Spalten der Produktmatrix A ◦ B gleich:
Schreibt man das Produkt A ◦ B in Spaltenform (siehe 2.45 auf Seite 99), so lautet es
Dazu wurde A = (~a1 , . . . , ~an ) gesetzt und Gleichung 2.54 auf Seite 111 verwendet. Haben
zwei der Indizes denselben Werte, so erscheint auf der rechten Seite der letzten Gleichung
2.64 eine Spalte zweimal; unter Verwendung Eigenschaft 4) auf Seite 114 erhält man nun
det(A ◦ B) = 0
= det A · 0
= det A · det B denn det B = 0
Im nächsten Schritt nehmen wir wieder eine Matrix B der Gestalt B = (~ei1 , . . . , ~ein ),
setzen jetzt aber voraus, daß alle Spalten voneinander verschieden sind, bzw. daß alle
Werte der Indizes i1 , . . . , in paarweise verschieden sind. Dann ist nach Gleichung 2.58
mit
s = Anzahl der paarweisen Vertauschungen zur Überführung
von (~ei1 , . . . , ~ein ) nach (~e1 , . . . , ~en )
= Anzahl der paarweisen Vertauschungen zur Überführung (2.66)
der Indexwerte (i1 , i2 . . . , in ) in die sortierte Reihenfolge
1, 2, . . . , n
Die Zahl s aus Gleichung 2.66 ist auch die Anzahl der paarweisen Vertauschungen, die
man benötigt, um (~ai1 , ~ai2 , . . . , ~ain ) in (~a1 , ~a2 , . . . , ~an ) zu überführen Mit Grundeigen-
schaft 5) (siehe Seite 114) und der obigen Gleichung 2.64 folgt dann
120
Verwendet man hier Gleichung 2.65, indem man det B für (−1)s einsetzt, so erhält man
für diesen Spezialfall von B die gewünschte Gleichung
Wie schon bei der Herleitung von 2.62 zerlegen wir die Spalten von B (siehe dazu 2.59
auf Seite 117):
n
X
~bj = bij · ~ei für j = 1, . . . , n
i=1
Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man für
j = 1, . . . , n:
n
!
X
A ◦ ~bj = A ◦ bij · ~ei Nach 2.46 kann man den Faktor A in
i=1 die Summe bis vor die ~ei hineinziehen. (2.67)
n
X
= bij · (A ◦ ~ei )
i=1
für jedes ~bj ein und verwenden für jede Spalte den eigenen Index ij :
n n n
!
X X X
det(A ◦ B) = det bi1 1 · (A ◦ ~ei1 ), bi2 2 · (A ◦ ~ei2 ), . . . , bin n · (A ◦ ~ein ) (2.68)
i1 =1 i2 =1 in =1
Ziehen wir jetzt in Gleichung 2.68 alle Summenzeichen und alle Faktoren bij j aus der
Determinanten heraus, so erhalten wir
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det(A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein ) (2.69)
i1 =1,i2 =1,...,in =1
Die Matrix (~ei1 , ~ei2 , . . . , ~ein ) besteht aus Einheitsvektoren und ist damit vom Typ der
im ersten Teil des Beweises behandelten Matrizen. Nach dem schon gezeigten ist daher
121
Faßt man die beiden letzten Gleichungen zusammen und setzt sie in Gleichung 2.69 ein,
so erhält man
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det A · det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1
Vergleicht man die Mehrfachsumme auf der rechten Seite von Gleichung 2.70 mit Glei-
chung 2.62, so bemerkt man, daß diese genau die Determinante von B ist. Damit ist in
der Tat
det(A ◦ B) = det A · det B
qed.
Folgerung: Ist A ∈ Mn,n (IR) umkehrbar, so ist det A 6= 0 und det A−1 = (det A)−1 .
Beweis: Ist A ∈ Mn,n (IR) umkehrbar, so existiert die inverse Matrix A−1 , und mit 2.63
gilt
det A · det A−1 = det(A ◦ A−1 ) = det E = 1
Ist ein Produkt von Null verschieden, so müssen alle Faktoren von Null verschieden
sein. Teilt man beide Seiten dieser Gleichung durch det A, so ergibt sich die zweite
Behauptung. qed.
Später wird noch hergeleitet, daß ebenso aus det A 6= 0 die Umkehrbarkeit von A folgt.
Satz Die Determinante einer Matrix ist gleich der Determinanten ihrer Transponierten:
det At = det A
Beweis:21 Sei
a11 . . . a1n α11 . . . α1n
A = ... .. und At = ... ..
. .
an1 . . . ann αn1 . . . αnn
Dabei ist dann
αji = aij (2.71)
Wir formen jetzt die Darstellung von det A so um, daß daraus eine Darstellung von
det At entsteht. Nach 2.62 ist zunächst
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.72)
i1 =1,i2 =1,...,in =1
Es reicht, in dieser Summe nur diejenigen Summanden zu betrachten, bei denen die
Indizes i1 , . . . , in paarweise verschiedene Werte annehmen (siehe Seite 119). In einem
solchen Summanden nehmen wir das Produkt der Einträge
ai1 1 ai2 2 . . . ain n
21
Die Kenntnis dieses Beweises ist für das Weitere nicht zwingend erforderlich.
122
und ordnen diese Faktoren nach den Werten ihrer Indizes, das Ergebnis davon ist
Dabei ist j1 , . . . , jn die entstehende Anordnung der zweiten Indizes. Sei s die Anzahl
der paarweisen Vertauschungen, die die erste Anordnung der Faktoren in die zweite
überführt. Wie man leicht sieht, ist dann s auch die Anzahl der paarweisen Vertauschun-
gen, die sowohl i1 , i2 , . . . , in in 1, 2, . . . , n als auch j1 , j2 , . . . , jn in 1, 2, . . . , n überführt.
Wegen Gleichung 2.58 ist dann insbesondere
Diese Gleichung und die neue Anordnung der Faktoren aij j setzt man in Gleichung 2.72
ein und verwendet, daß die Werte der Indizes j1 , j2 , . . . , jn die einzelnen Summanden
ebenso festlegen, wie die Indizes i1 , i2 , . . . , in . Man kann daher genauso gut über die
j1 , j2 , . . . , jn summieren. Damit wird Gleichung 2.72 zu
n
X
det A = a1j1 a2j2 . . . anjn det(~ej1 , ~ej2 , . . . , ~ejn ) (2.73)
j1 =1,j2 =1,...,jn =1
Setzt man hier für die ajij noch die Koeffizienten αij j von At ein (siehe Gleichung 2.71),
so folgt schließlich
n
X
det A = αj1 1 αj2 2 . . . αjn j det(~ej1 , ~ej2 , . . . , ~ejn ) = det At
j1 =1,j2 =1,...,jn =1
qed.
Der letzte Satz besitzt eine Folgerung, die bei der Berechnung von Determinanten nütz-
lich ist. Da nämlich durch das Transponieren Spalten in Zeilen und Zeilen in Spalten
übergehen, gelten wegen det A = det At die sich auf Spalten beziehenden Eigenschaften
auf Seite 114 und auch die Regel 2.57 ebenso für Spalten:
Folgerung: Für die Zeilen einer Determinanten gilt:
• Enthält eine Zeile einen reellen Faktor, so kann dieser vor die Determinante gezogen
werden.
• Ist eine Zeile eine Summe, so kann die Addition aus der Determinanten herausge-
zogen werden:
~at1
t t
~a1 ~a1
.
.. . . ..
. .
det ~ui + ~vi = det ~ui + det ~vit
t t t
.. .
..
.
..
.
t t
~an ~an ~atn
• Sind zwei Zeilen gleich, so ist der Wert der Determinanten Null.
123
• Zieht man einer Zeile das Vielfache einer anderen ab, so ändert sich die Determi-
nante nicht, d. h. für i ≥ j:
~at1
t
~a1
.. ..
. .
t
~ai − λ · ~atj
t
~ai
. = det ...
det
.
. (2.74)
t t
~aj ~aj
. .
.. ..
~an t
~atn
Selbstverständlich könnte man die Determinante mit Hilfe der Darstellung 2.62 berech-
nen. Es gibt aber Methoden zur Berechnung der Determinanten, die dem aus praktischen
Gründen und hinsichtlich des Rechenaufwandes vorzuziehen sind. Zwei Methoden sollen
hier vorgestellt werden: die eine beruht auf dem Gaußschen Eliminationsverfahren (siehe
Seite 71), die andere ist der sogenannte Entwicklungssatz. Beide haben als Grundlage
den folgenden
Satz: Sei A ∈ Mn,n (IR) eine Matrix, die in der ersten Spalte ab dem zweiten Eintrag nur
Nullen enthält. Eine solche Matrix A hat die Gestalt
a11 a12 . . . a1n
0
A = ..
. A1
0
Da nach Voraussetzung ai1 1 = 0 für i1 ≥ 2 ist, kann man die Summanden mit i1 ≥ 2
weglassen:
n
X
det A = a11 ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein )
i2 =1,...,in =1
124
Den Faktor a11 zieht man vor die Summe. In der Summe hat ein Summand den Wert
Null, wenn mindestens einer der Indizes i2 , . . . , in den Wert 1 hat; in diesem Fall kommt
in dem Determinantenfaktor det(~e1 , ~ei2 , . . . , ~ein ) an mindestens zwei Stellen die Spalte
~e1 vor, und er ist damit Null. Man kann daher weiter schreiben, indem man den Bereich
der Indizes bei 2 beginnen läßt
n
X
det A = a11 · ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein ) (2.75)
i2 =2,...,in =2
Nun müssen noch die Determinantenfaktoren det(~e1 , ~ei2 , . . . , ~ein ) vereinfacht werden. Da
~e1 an seiner ursprünglichen, nämlich der ersten Stelle steht, kommt es für den Wert dieser
Determinanten nur auf die ~ei2 , . . . , ~ein an; man kann daher setzen
Hierbei werden die ursprünglich n-dimensionalen Einheitsvektoren ~ei2 , . . . , ~ein als (n−1)-
dimensionale Einheitsvektoren aufgefaßt, indem ihre ersten Komponenten gestrichen
werden. Das ist ohne Probleme möglich, da wegen i2 , . . . , in ≥ 2 diese Komponenten
ohnehin den Wert Null haben. Schreibt man so Gleichung 2.75 noch einmal auf:
n
X
det A = a11 · ai2 2 . . . ain n det(~ei2 , . . . , ~ein )
i2 =2,...,in =2
so erkennt man, daß die darin erhaltene Summe genau die Determinante der Matrix A1
ist. Damit ist die Behauptung det A = a11 · det A1 gezeigt. qed.
Eine erste Folgerung dieses Satzes gibt an, wie von Matrizen eines wichtigen Typs leicht
die Determinante berechnet werden kann:
Satz: Sei A eine obere Dreiecksmatrix:
a11 a12 . . . a1n
0 a22 . . . a2n
A = ..
.. . . ..
. . . .
0 0 . . . ann
Eine obere Dreiecksmatrix ist eine Matrix, die unterhalb der Hauptdiagonalen nur Nullen
besitzt. Für eine solche Matrix A gilt:
125
Ist die Behauptung für n − 1 bewiesen, so kann man den Satz von eben anwenden:
a11 a12 . . . a1n
0 a22 . . . a2n
det A = det ..
.. . . ..
. . . .
0 0 . . . ann
a22 . . . a2n
= a11 · det ... . . . ...
0 . . . ann
Die rechts stehende Matrix ist wieder eine obere Dreiecksmatrix, ihre Spaltenzahl beträgt
n − 1. Nach Induktionsvoraussetzung besitzt sie daher die Determinante a22 · a33 · · · ann .
Setzt man dieses oben ein, so folgt die Behauptung. qed.
Beweis: Früher wurde det A = det At gezeigt (siehe Seite 122). Da die Transponierte von
A eine obere Dreiecksmatrix ist, kann man die Folgerung von eben verwenden, und es
gilt
det A = det At = a11 · a22 · · · ann
qed.
Es soll jetzt gezeigt werden, wie mit dem Gaußschen Eliminationsverfahren (siehe Sei-
te 71) auf eine sehr effektive Art und Weise die Determinante berechnet werden kann.
Die Verwendung des Gaußschen Verfahrens bietet sich an, da zwei der bei diesem Verfah-
ren anzuwendenden Zeilenoperationen den Wert der Determinanten unverändert lassen
bzw. nur zu einem Vorzeichenwechsel führen (siehe dazu Seite 123 und Gleichung 2.74):
• Zieht man von einer Zeile das Vielfache einer anderen ab, so ändert sich die De-
terminante nicht.
126
das Gaußsche Verfahren an, verzichten jetzt hier jedoch auf die sonst üblichen Normie-
rungsschritte und schreiben die so erhaltene reduzierte Form von A in der Fassung
α11 α12 . . . α1n
0 α22 . . . α2n
à = .. (2.76)
.. ... ..
. . .
0 0 . . . αnn
Abweichend zu sonst sind die Stufen der reduzierten Form durch einen von Null ver-
schiedenen Eintrag gekennzeichnet, der aber nicht notwendigerweise gleich eins ist. Hat
die Matrix den vollen Rang r = n, so verlaufen die Stufen genau auf der Diagonalen, und
es ist αii 6= 0 für i = 1, . . . , n. Ist hingegen rgA < n, so verlaufen einige Stufen oberhalb
der Hauptdiagonalen, es kommt zu mindestens einer Nullgleichung (bzw. Nullzeile), und
es ist zumindest αnn = 0.
Auf alle Fälle können wir in den beiden Fällen rgA = n und rgA < n die reduzierte Form
à von A wie in 2.76 schreiben. Da zu ihrer Herstellung auf die Normierung verzichtet
und nur die beiden oben genannten Operationen verwendet wurden, ist det A = ± det Ã.
Die reduzierte Form ist eine obere Dreiecksmatrix. Somit bietet sich jetzt zur Berechnung
von det A der Satz auf Seite 125 an:
α11 α12 . . . α1n
0 α22 . . . α2n
det A = ± det ..
.. . . .. (2.77)
. . . .
0 0 . . . αnn
= ±α11 · α22 · · · αnn
A besitzt – wie oben begründet – bis auf das Vorzeichen dieselbe Determinante wie
seine reduzierte Form. Die reduzierte Form ist eine Dreiecksmatrix, daher ist ist ihre
Determinante gleich dem Produkt ihrer Diagonalelemente. Das Vorzeichen hängt davon
ab, ob zur Herstellung der reduzierten Form eine gerade oder eine ungerade Anzahl von
Zeilenvertauschungen notwendig waren.
Bevor wir uns in einem Beispiel diese Möglichkeit zur Determinantenberechnung genauer
anschauen, bemerken wir, daß wir mit Hilfe der reduzierten Form einer Matrix den
wichtigsten Satz über Matrizen herleiten können:
Satz: Eine n × n–Matrix ist genau dann umkehrbar, wenn ihre Determinante ungleich
Null ist.
Beweis: Die Bezeichnungen von eben werden verwendet:
A ist umkehrbar ⇔ Der Rang von A beträgt n.
⇔ Die Stufen in der reduzierten Form verlaufen auf der
Hauptdiagonalen (siehe 2.76).
⇔ αii 6= 0 für i = 1, . . . , n
⇔ det A = ±α11 · α22 · · · αnn 6= 0 (siehe 2.77)
qed.
Beispiel: Wir wollen mit dem Gaußschen Verfahren die Determinante der 3 × 3–Matrix
0 2 7
A = 1 2 3
2 0 1
127
berechnen:
0 2 7
det 1 2 3
Die ersten beiden Zeilen
2 0 1 vertauschen.
1 2 3
= − det 0 2
7 Das Zweifache der ersten
2 0 1 Gleichung von der letzten
abziehen.
1 2 3
= − det 0 2 7 Das Zweifache der zweiten
0 −4 −5 Gleichung zu der letzten
hinzuzählen.
1 2 3
= − det 0 2 7 Jetzt kann das Produkt
0 0 9 der Diagonalelemente ge-
nommen werden.
= −1 · 2 · 9 = −18
Wir kommen jetzt zum Entwicklungssatz. Dieser stellt eine weitere Methode zum Be-
rechnen einer Determinanten dar und ist eine Verallgemeinerung des Satzes auf Seite
124. Dort wurde eine Determinante behandelt, die in der ersten Spalte ab dem zweiten
Eintrag nur Nullen enthält. Wir nehmen jetzt den ersten Verallgemeinerungsschritt vor,
indem wir die Determinante einer n × n–Matrix A berechnen, die in irgendeiner Spalte
nur höchstens ein von Null verschiedenes Element besitzt, und dieses Element muß nicht
notwendigerweise an der ersten Stelle stehen; A besitzt dann die Gestalt
i-Spalte
↓
a11 ... 0 ... a1n
.. .. ..
. . .
aj−1,1
... 0 ... aj−1,n
(2.78)
A = aj1 . . . aji . . . ajn ← j-te Zeile
aj+1,1 ... 0 ... aj+1,n
. .. ..
.. . .
an1 ... 0 ... ann
A besitzt in ihrer i-ten Spalte nur ein von Null verschiedenes Element, und dieses steht
dort an der j-ten Stelle. Die Matrix A soll durch Zeilen- und Spaltenvertauschung in
eine Matrix wie die auf Seite 124 verwandelt werden. Dazu wird zunächst das Element
aji in die erste Zeile gebracht, in dem die j-te Zeile mit der (j − 1)-ten Zeile, danach
mit der (j − 2)-ten und schließlich mit der 1-ten Zeile vertauscht wird. Durch insgesamt
j − 1 Zeilenvertauschungen wandert“ so die ursprüngliche j-te Zeile an die erste Stelle.
”
128
Dieses liefert wegen der j − 1 Vorzeichenwechsel der Determinanten
aj1 . . . aji . . . ajn
a11 . . . 0 ... a1n
. .. ..
.
. . .
j−1
det A = (−1) det aj−1,1 . . . 0 . . . aj−1,n
aj+1,1 . . . 0 . . . aj+1,n
. .. ..
..
. .
an1 . . . 0 ... ann
Nun soll die i-te Spalte an die erste Stelle gebracht werden, dazu wird sie, indem man
entsprechend wie vorher bei der j-ten Zeile verfährt, i − 1 Mal mit ihrer jeweiligen
vorangehenden Spalte vertauscht. Durch diese i − 1 paarweisen Vertauschungen erhält
man
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
0 a11 . . . a1,i−1 a1,i+1 . . . a1n
. .. .. .. ..
.
. . . . .
det A = (−1)j−1 (−1)i−1 det 0 aj−1,1 . . . aj−1,i−1 aj−1,i+1 . . . aj−1,n
0 aj+1,1 . . . aj+1,i−1 aj+1,i+1 . . . aj+1,n
. .. .. .. ..
.. . . . .
0 an1 . . . an,i−1 an,i+1 . . . ann
Diese Determinante hat genau die Form wie diejenige im Satz auf Seite 124. Sie soll
ebenfalls mit Hilfe einer (n − 1) × (n − 1)-Matrix dargestellt werden; dazu definieren wir
Definition: Sei eine n × n–Matrix. Dann setzt man für 1 ≤ i, j ≤ n
Aij :die (n−1)×(n−1)-Matrix, die entsteht, wenn
man bei der n × n–MatrixA die i-te Spalte
(2.79)
und die j-te Zeile22 streicht.
Uij = det Aij
Mit dieser Definition gilt aufgrund des Satzes auf Seite 124:
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
j+i
0
det A = (−1) det
..
. Aij
0
Nun kommen wir zu einer allgemeinen n × n–Matrix A und wählen von dieser die i-te
Spalte fest aus. Die i-te Spalte hat nicht notwendigerweise nur eine von Null verschiedene
Komponente, aber sie besitzt eine Summenzerlegung in Spalten, bei der jeweils alle bis
eine Komponente gleich Null sind:
a1i 0 0
a1i 0 a2i 0 n
.. X
~aj = . = .. + .. + . . . + .. = aji~ej
. . . j=1
ani
0 0 ani
129
Jetzt kann man wieder Eigenschaft 3) auf Seite 114 anwenden und bei der Berechnung
von det A die Summe in der i-ten Spalte vorziehen:
n
X
det A = det(~a1 , . . . , aji~ej , . . . , ~an )
j=1
n
X
= det(~a1 , . . . , aji~ej , . . . , ~an )
j=1
Schreibt man diese Determinante ausführlich hin und verwendet man die Bezeichnungen
aus 2.79, so kann man schließlich Gleichung 2.80 verwenden:
a11 . . . 0 . . . a1n
.. .. ..
. . .
aj−1,1 . . . 0 . . . aj−1,n
n
X
det A = det aj1 . . . aji . . . ajn
aj+1,1 . . . 0 . . . aj+1,n
j=1
. .. ..
.. . .
an1 . . . 0 . . . ann
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
n
X 0
= (−1)j+i det
..
j=1
. Aij
0
n
X
= (−1)j+i aji det Aij
j=1
n
X
= (−1)j+i aji Uij
j=1
Damit haben wir den Entwicklungssatz hergeleitet, seine genaue Formulierung lautet:
Satz: (Entwicklungssatz ) Sei A eine n × n–Matrix. Dann gilt mit den Bezeichnungen aus
2.79:
• Entwicklung nach der i-ten Spalte:
n
X
det A = (−1)j+i aji Uij (2.81)
j=1
Zum Beweis: Die Entwicklung nach einer Spalte haben wir bereits hergeleitet. Die Ent-
wicklung nach einer Zeile führt man auf die Spaltenentwicklung zurück, indem man
det At = det A verwendet. qed.
130
Durch den Entwicklungssatz wird die Berechnung einer n-reihigen Determinanten auf
die Berechnung der (n − 1) reihigen Unterdeterminanten Uij zurückgeführt. Auf die Uij
läßt sich den wieder der Entwicklungssatz anwenden, bis man bei 2 × 2–Determinanten
angekommen ist, die man direkt berechnen kann.
Beispiel: Die folgende Determinante wird mit dem Entwicklungssatz berechnet. Da die
zweite Spalte eine Null enthält, wird nach dieser entwickelt:
3 1 2
det 7 0 2
1 2 0
7 2 3 2 3 2
= −1 · det + 0 · det − 2 · det
1 0 1 0 7 2
= −1 · (7 · 0 − 2 · 1) + 0 − 2 · (3 · 2 − 7 · 2)
= 18
Zum Abschluß dieses Abschnitts folgen einige Bemerkungen zu den Verfahren zur De-
terminantenberechnung:
Entwicklungssatz: Der Nachteil besteht darin, daß ungefähr n! Multiplikationen not-
wendig sind. Man nimmt den Entwicklungssatz nur bei kleinen Dimensionen (bis
Dimension 3) oder bei Determinanten, die sehr viele Nullen enthalten. Man ent-
wickelt dann stets nach der Zeile oder Spalte, die die meisten Nullen enthält.
Gaußsches Verfahren: Diese Methode bietet sich immer an. Da die Anzahl der not-
wendigen Multiplikationen – wie man zeigen kann – von der Größenordnung n2
ist, ist für größere n das Gaußsche Verfahren von erheblich geringerem Aufwand
als der Entwicklungssatz.
Mitunter empfiehlt sich auch eine Verbindung von Entwicklungssatz und Gauß-
schem Verfahren: Enthält bei größerem n eine Zeile oder eine Spalte viele Nullen,
so entwickelt man zunächst nach dieser Spalte bzw. Zeile und wendet dann das
Gaußsche Verfahren auf die Unterdeterminanten Uij an.
Sarrus-Regel: Für 3 × 3-Matrizen gibt es noch ein Verfahren, das zwar bezüglich der
Multiplikationen noch etwas aufwendiger als der Entwicklungssatz ist, das aber
wegen seines leicht zu merkenden Schemas oft genommen wird. Man schreibt dazu
die ersten beiden Spalten der Determinanten noch einmal hinter die dritte Spalte
und bildet die Summe bzw. Differenz aus den Produkten, die aus drei auf einer
Schrägen liegenden Einträgen bestehen:
+ + +
a11 a12 a13 a11 a12
a21 a22 a23 a21 a22
a31 a32 a33 a31 a32
− − −
damit ist det A = + a11 a22 a33 + a12 a23 a31 + a13 a21 a32
− a31 a22 a13 − a32 a23 a11 − a33 a21 a12
131
2.3.4 Die adjungierte Matrix
à = ((−1)i+j Uij ) i, j = 1, . . . , n
+U11 −U12 . . . (−1)n+1 U1n
−U21 +U22 . . . (−1)n+2 U2n
=
.. .. ..
. . .
n+1 n+2 n+n
(−1) Un1 (−1) Un2 . . . (−1) Unn
Beweis: Wir rechnen die Gleichung einfach nach, indem wir die Matrizenmultiplikation
spaltenweise ausführen. Sei dazu A = (~a1 , . . . , ~an ); dann ist die i-te Spalte von à ◦ A
gerade à ◦ ~ai (siehe 2.45 auf Seite 99). Dieses Produkt rechnen wir aus, indem wir die
Definition von à einsetzen:
n
X
1+j
(−1) U1j aji
j=1
..
.
X n
i+j
(−1) Uij aji
j=1
à ◦ ~ai = .
..
X n
k+j
(−1) Ukj aji
j=1
.
..
n
X
(−1)n+j U a
nj ji
j=1
Vergleicht man dieses mit Gleichung 2.81, so stellt man fest, daß dieser Ausdruck ge-
nau die Determinante von A, entwickelt nach der i-ten Spalte, ist. Der Wert der i-ten
Komponente ist demnach gerade det A.
132
Nun betrachten wir eine k-te Komponente mit k 6= i. Der Wert einer solchen Kompo-
nente ist n
X
(−1)k+j Ukj aji
j=1
Vergleicht man dieses ebenfalls mit der Spaltenentwicklung (Gleichung 2.81), so erkennt
man hier, daß dieser Ausdruck gerade die Entwicklung der folgenden Determinanten
nach der k-ten Spalte ist:
a11 . . . a1i . . . a1,k−1 a1i a1,k+1 . . . a1i
a21 . . . a2i . . . a2,k−1 a2i a2,k+1 . . . a2i
det ..
.. .. .. .. ..
. . . . . .
an1 . . . ani . . . an,k−1 ani an,k+1 . . . ani
Dieses ist die Determinante der Matrix, die entsteht, wenn man in der Matrix A an die
Stelle der k-ten Spalte ~ak noch einmal die i-te Spalte ~ai schreibt. Diese Determinante
besitzt dann den Wert Null, da ja nach Konstruktion ihre i-te und k-te Spalte beide
gleich ~ai sind. Damit besitzt auch die obige Summe den Wert Null; da die Summe gleich
der k-ten Komponente von à ◦ ~ai ist, hat auch diese den Wert Null. Insgesamt hat man
damit für i-te Spalte von à ◦ A für i = 1, . . . , n:
0
..
.
0
à ◦ ~ai = det A ← i-te Stelle
0
.
..
0
= (det A) · ~ei
qed.
Hieraus ergibt sich eine zweite Herleitung einer Aussage, die wir bereits mit dem Gauß-
schen Satz bewiesen hatten, so wie eine weitere Möglichkeit zur Berechnung der Inversen
einer Matrix:
Folgerung: Sei det A 6= 0, dann ist A umkehrbar, und es gilt
1
A−1 = · Ã (2.83)
det A
133
Diese Art der Berechnung der Inversen empfiehlt sich nur bei 2 × 2-Matrizen; dort ist
sie allerdings recht nützlich, wie das folgende Beispiel zeigt:
Sei
1 2
A =
9 7
Dann ist
U11 −U12 7 −2
à = =
−U21 U22 −9 1
Damit ist dann
−7 2
1 −1 7 −2 11 11
A−1 = · Ã = · =
det A 11 −9 1 9 −1
11 11
Aus Gleichung 2.83 folgt insbesondere, daß bei der Berechnung der Inversen einer Matrix
die Teilung durch die Determinanten der einzige notwendige Divisionsschritt ist.
Die Gleichung 2.83 liefert weiterhin eine Lösungsformel für ein quadratisches lineares
Gleichungssystem A ◦ ~x = ~b mit vollem Rang. Geht man hier von dem Lösungsansatz
1
~x = · Ã ◦ ~b
det A
aus, so erhält man die sogenannte Cramersche Regel .
A ∈ Mn,n (IR)
betrachten. Ist ein Vektor ~x ∈ IRn gegeben, so ist das Produkt A◦~x ebenfalls ein Vektor
aus dem IRn :
x1 y1
~x = ... ∈ IRn ⇒ ~y = ... = A ◦ ~x ∈ IRn
xn yn
In der Regel hat der Vektor ~y mit dem Vektor ~x nicht mehr viel gemeinsam, er “sieht“
völlig anders aus. Interessant ist daher der Spezialfall, daß der eine der beiden Vektoren
ein Vielfaches des anderen ist. Dieses führt auf den Begriff des Eigenwertes.
Definition: Gegeben sei eine quadratische Matrix A ∈ Mn,n (IR). Eine Zahl λ ∈ IR heißt
Eigenwert der Matrix A, wenn es einen Vektor ~u ∈ IRn mit ~u 6= 0 gibt, so daß gilt
A ◦ ~u = λ · ~u (2.84)
134
Die Eigenwertgleichung 2.84 besagt, daß bei dem Eigenvektor ~u die aufwendigere Mul-
tiplikation mit der Matrix A das gleiche bewirkt, wie die einfachere komponentenweise
Multiplikation mit der reellen Zahl λ.
Man beachte, daß für einen Eigenvektor gefordert wird, daß er nicht gleich dem Null-
vektor ist. (Frage: warum?)
gegeben, so rechnet man leicht nach, daß ~u = (5, 11)t ein Eigenvektor von A ist:
929 −425 5
A ◦ ~u = ◦
2035 −931 11
−30 5
= = −6 · = −6 · ~u
−66 11
Also ist ~u Eigenvektor von A zum Eigenwert λ = −6. Kein Eigenvektor von A ist etwa
~v = (1, 1)t :
1 504
A ◦ ~v = A ◦ =
1 1104
Offensichtlich gibt es kein λ ∈ IR mit A ◦ ~v = λ~v .
Es ist aussichtslos, durch “Raten“ einen Eigenvektor zu finden. Bevor wir uns anschauen,
wie man gezielt einen Eigenvektor berechnet, soll festgestellt werden, daß die Vielfachen
eines Eigenvektors ebenfalls Eigenvektoren sind:
Satz: Die Matrix A ∈ Mn,n (IR) besitze den Eigenwert λ mit dem Eigenvektor ~u. Dann
ist für jedes c ∈ IR mit c 6= 0 auch der Vektor
c · ~u
qed.
Eigenwerte und Eigenvektoren besitzen bei vielen Problemstellungen eine große Bedeu-
tung; einen kleinen Eindruck davon soll das folgende Beispiel liefern:
Zur Beschreibung der zeitlichen Entwicklung der Altersverteilung in einer Bevölkerung
teilt man die Bevölkerung in drei Gruppen ein und stellt die Größen dieser drei Gruppen
durch einen Vektor dar:
x1 = Anzahl der jüngeren Leute
~x x 2
= Anzahl der Leute mittleren Alters
x3 = Anzahl der Rentner
135
Die Verteilung verändert sich mit der Zeit, nach einem Jahr hat man neue Anzahlen
~y = (y1 , y2 , y3 ).
Es werde nun angenommen, daß man aus Erfahrung weiß, daß sich die neuen Zahlen
auf folgendem Wege aus den alten Zahlen berechnen lassen:
Junge 80 x + 20 x + 1 x
= y1 = 100 1 100 2 100 3
19 x + 85 x
Mittlere = y2 = 100 1 100 2
1 x + 15 x + 70 x
Rentner = y3 = 100 1 100 2 100 3
Die erste Gleichung besagt, daß 80% der Jungen auch nach einem Jahr noch zu den
Jungen zählen und daß 20% der Leute mittleren Alters sowie auch 1% der Rentner sich
einmal vermehren und deren Nachwuchs zu der Gruppe der Jungen hinzukommt. Inhalt
der zweiten Gleichung ist, daß 19% der Jungen erwachsen geworden sind und zu der
mittleren Gruppe hinzukommen und daß 85% der Leute mittleren Alters auch noch
nach einem Jahr zu dieser Gruppe gehören. Entsprechend läßt sich die dritte Gleichung
deuten23
Wie man leicht erkennt, lassen sich die drei obigen Gleichungen als Produkt einer Matrix
mit einem Vektor schreiben: Setzt man
80 20 1
100 100 100
19 85
A = 100 100 0
1 15 70
100 100 100
so erhält man für die Bevölkerungsverteilung nach einem Jahr
~y = A ◦ ~x
Entsprechend erhält man für die Verteilung nach zwei Jahren, indem man diese Glei-
chung auf ~y anwendet:
A ◦ ~y = A ◦ (A ◦ ~x) = A2 ◦ ~x
Ebenso erhält man die Verteilung nach n Jahren aus An ◦ ~x.
Eine Frage, die in diesem Zusammenhang von Interesse ist, lautet: gibt es eine stabile
Bevölkerungsverteilung. Eine Bevölkerungsverteilung gilt als stabil, wenn die Größen-
verhältnisse zwischen den drei Gruppen unverändert bleiben:
x1 y1 x3 y3
= und =
x2 y2 x2 y2
y1 y2 y3
⇔ = =
x1 x2 x3
Setzt man
y1
λ =
x1
so lautet die letzte Doppelgleichung in Vektorschreibweise
y1 λx1
~y = y2 = λx2 = λ · ~x ⇔ ~y = A ◦ ~x = λ · ~x
y3 λx3
23
Es sei noch einmal darauf hingewiesen, daß es sich hier um angenommene Beispielwerte handelt!
136
Mit anderen Worten: die stabile Bevölkerungsverteilung wird durch einen Eigenvektor
der Übergangsmatrix A beschrieben.
Wie findet man einen Eigenwert mit zugehörigem Eigenvektor? Diese Frage ist das
sogenannte
Die Schwierigkeit der Gleichung 2.85 besteht darin, daß auf ihrer rechten Seite das
Produkt der Unbekannten t und ~x steht, sie ist damit nicht mehr linear. Man formt daher
die Gleichung 2.85 so um, daß eine Gleichung entsteht, in der nur noch die Unbestimmte
t erscheint. Mit Hilfe dieser Gleichung bestimmt man dann zunächst einen Wert für t.
Im ersten Schritt formt man 2.85 so um, daß auch auf der rechten Seite ein Produkt aus
einer Matrix mit einem Vektor steht; man verwendet dazu das t-fache der Einheitsma-
trix:
1 0 ··· 0 t 0 ··· 0
0 1 ··· 0 0 t ··· 0
t · E = t · .. .. . . .. = .. .. . . ..
. . . . . . . .
0 0 ··· 1 0 0 ··· t
Verwendet man weiter E ◦ ~x = ~x, so erhält man
A ◦ ~x = t · ~x = t · (E ◦ ~x) = (t · E) ◦ ~x
Jetzt faßt man alle Ausdrücke, in denen die Unbestimmte ~x erscheint, zusammen:
A ◦ ~x = (t · E) ◦ ~x (auf beiden Seiten (t · E) ◦ ~x abziehen)
⇔ (A − t · E) ◦ ~x = 0
Dabei hängt die Matrix
a11 − t a12 ··· a1n
a21 a22 − t · · · a2n
A−t·E =
.. .. .. ..
. . . .
an1 an2 ··· ann − t
vom Wert der Unbestimmten t ab.
Nimmt man jetzt für einen Moment an, man habe bereits einen Lösungswert für t
gefunden, so bestimmt man dazu einen Wert für ~x = (x1 , . . . , xn ), indem mit diesem t
die Gleichung
(A − t · E) ◦ ~x = 0 (2.86)
137
Diese Gleichung ist ein homogenes lineares Gleichungssystem. Die im Eigenwertproblem
genannte Nebenbedingung lautet ~x 6= 0. Das homogene Gleichungssystem muß daher
so beschaffen sein, daß es eine von Null verschiedene Lösung besitzt. Folglich muß der
Wert der Unbestimmten t so gewählt werden, daß gilt:
corg(A − t · E) > 0
⇔ rg(A − t · E) < n
⇔ (A − t · E) ist nicht invertierbar
⇔ det(A − t · E) = 0 (siehe den Satz auf Seite 127)
Hier kommt also die Determinante ins Spiel. Hergeleitet haben wir den
Satz: λ ∈ IR ist genau dann Eigenwert der Matrix A ∈ Mn,n (IR), wenn λ Nullstelle der
Funktion
f (t) = det(A − t · E)
ist, d. h. wenn gilt
Einen zu λ gehörigen Eigenvektor erhält man als von Null verschiedene Lösung des
homogenen Gleichungssystems
det(A − λ · E) · ~x = 0
Als nächstes soll die Funktion f (t) = det(A − t · E) genauer untersucht werden; zuvor
erhält sie einen Namen:
Definition: Die Funktion
f (t) = det(A − t · E)
heißt charakteristisches Polynom der Matrix A ∈ Mn,n (IR).
(−1)n (2.89)
138
geschrieben. Dann ist
a11 . . . a1n tδ11 . . . tδ1n
A − t · E = ... .. − .. ..
. . .
an1 . . . ann tδn1 . . . tδnn
a11 − tδ11 . . . a1n − tδ1n
=
.. ..
. .
an1 − tδn1 . . . ann − tδnn
Setzt man dieses in die Formel der Determinanten (siehe 2.62 auf Seite 118) ein, so wird
dieses zu
(aii − tδii )
Ein Produkt aus Linarfaktoren ist ein Polynom; summiert man endlich viele Ausdrücke
dieser Art auf, so erhält man wieder ein Polynom.
Damit ist gezeigt: f (t) = det(A−t·E) ist ein Polynom, und der Name charakteristisches
Polynom ist gerechtfertigt.
Das Glied mit der höchsten Potenz von t erhält man, indem man den Summanden mit
den meisten Linearfaktoren betrachtet; dieser ist genau
Der Grad des Polynoms f (t) beträgt somit n, der höchste Koeffizient ist (−1)n .
Das konstante Glied von f (t) erhält man durch Einsetzen der Null:
139
qed.
Zusammenfassend kann man feststellen, daß die Lösung des Eigenwertproblems in zwei
Schritten verläuft:
1. Man bestimmt die Nullstellen des charakteristischen Polynoms und erhält damit
die Eigenwerte der Matrix.
2. Man berechnet zu einem Eigenwert λ einen Eigenvektor, indem man eine von
Null verschiedene Lösung des homogenen linearen Gleichungssystems (A − λE) ◦ ~x
bestimmt.
t2 + 2t − 24 = 0
sind die beiden Eigenwerte von A. Ein Eigenvektor zu λ1 = −6 wurde bereits auf Seite
135 angegeben. Einen Eigenvektor zu λ2 = 4 erhält man durch Lösen des homogenen
Gleichungssystems
929−4 −425
(A − 4 · E) ◦ ~x = ◦ ~x = 0
2035 −931−4
Eine mit dem Gaußschen Verfahren reduzierte Form der Koeffizientenmatrix liefert
!
17
1 − 37
◦ ~x = 0
0 0
Eine von Null verschiedene Lösung hiervon ist ~u2 = (17, 37)t . Der gefundene Vektor ~u2
ist ein Eigenvektor zu Eigenwert λ2 = 4.
140
Beispiel: Gesucht sind alle Eigenvektoren der 3 × 3–Matrix
18 137 −15
A = 0 −5 0
20 116 −17
Das charakteristische Polynom von A stellt man am besten durch Enwickeln nach der
zweiten Zeile auf (siehe 2.82 auf Seite 130):
18−t 137 −15
det(A − t · E) = det 0 −5−t 0
20 116 −17−t
Beispiel: Wir kommen auf das Beispiel zur Bevölkerungsentwicklung auf Seite 135 zurück.
Das charakteristische Polynom der dort verwendeten Übergangsmatrix
80 20 1
100 100 100
19 85
A = 100 100 0
1 15 70
100 100 100
141
lautet
47 2 17969 281
f (t) = − t3 + t − t+
20 10000 625
Man findet folgende Eigenwerte und Eigenvektoren:
Da der aus den Bevölkerungszahlen gebildete Vektor nur positive Komponenten enthal-
ten kann, kommt als Eigenvektor, der eine stabile Bevölkerungsentwicklung beschreibt,
nur ~u2 in Frage. Um realistische Größenordnungen zu erhalten, wird ~u mit c = 30000000
multipliziert (siehe dazu den Satz auf Seite 135). Eine mögliche stabile Bevölkerungs-
verteilung wäre damit
27460000
~x = 30000000
14740000
142
Kapitel 3
Als einleitendes Beispiel soll hier ein typisches Problem aus der Kryptologie erörtert
werden. In der Kryptologie besteht die Aufgabe, eine Nachricht auf eine solche Wei-
se in eine neue Form (den Schlüsseltext“) zu überführen ( zu verschlüsseln“), daß sie
” ”
von unbefugter Seite weder gelesen noch unbemerkt verändert werden kann und an-
schließend wieder in den ursprünglichen Klartext zurücktransformiert werden kann. Das
Grundprinzip der Verschlüsselung zeigt das folgende Bild:
143
Klartext Schlüssel (optional)
- Verschlüsselung
(encryption)
plain text key
?
ursprünglicher
Klartext Schlüssel (optional)
Entschlüsselung
(decryption)
plain text key
M : die Nachricht bzw. der Klartext (plain text), in der Regel eine Zeichenkette über
einem Alphabet Σ, z. B.
Σ = {a, b, c, . . . , z} #Σ = 26
oder: Σ = {0, 1} #Σ = 2
M ∈ Σ∗ = {x1 x2 . . . xn | n ∈ IN0 , xi ∈ Σ}
144
Insbesondere muß beim Entschlüsseln mit dem korrekten Schlüssel wieder ursprüngliche
Klartext entstehen. Zusammenfassend muß somit gelten:
C = e(M, k)
=⇒ d(e(M, k), k) = M
M = d(C, k)
Es ist auch möglich, daß zum Ver- und Entschlüsseln unterschiedliche Schlüssel ver-
wendet werden. Viele übliche Verfahren arbeiten jedoch, wie hier angegeben, mit einem
einzigen Schlüssel. Man spricht daher von symmetrischen Verfahren.
Andere gängige Bezeichnungen für “(Verschlüsselungs-)Verfahren“ sind “Chiffre“ oder
“Code“.
Beispiel: Caesar-Verfahren
Dieses Verfahren wurde angeblich bereits von Julius Caesar eingesetzt. Es bietet nur
geringe Sicherheit; man erkennt an ihm aber sehr gut die Funktionsweise eines symme-
trischen Verfahrens.1
Man nimmt die übliche natürliche Zuordnung vor:
k ∈ {A, B, . . . , Z}
bzw. k ∈ {0, 1, . . . , 25}
c = e(m, k) = m + k mod 26
m = d(c, k) = c − k mod 26
= c + (26 − k) mod 26
G U T E N T A G =
ˆ 6 20 19 4 13 19 0 6
X X X X X X X X 23 23 23 23 23 23 23 23
3 17 16 1 10 16 23 3
=
ˆ
D R Q B K Q X D
1
Hier wird erstmalig die modulo-Funtion verwendet: Für a, b ∈ Z, a 6= 0 bezeichnet “a mod b“
den kleinsten nichtnegativen Divisionsrest, der bei Teilung von a durch b entsteht. In den Program-
moersprachen C, Java usw. steht dafür der Operator % ur Verfügung.
145
Die Entschlüsselung erfolgt mit 26 − k = 26 − 23 = 3=D:
ˆ
D R Q B K Q X D =
ˆ 3 17 16 1 10 16 23 3
D D D D D D D D 3 3 3 3 3 3 3 3
6 20 19 4 13 19 0 6
=
ˆ
G U T E N T A G
Eine grundlegende Voraussetzung zum Einsatz dieses oder eines heute gebräuchlichen
symmetrischen Verfahrens (wie z. B. 3DES oder AES) besteht darin, daß die beiden
Kommunikationspartner A und B sich über einen gemeinsamen Schlüssel k verständigt
haben, der nur ihnen bekannt ist und ansonsten geheim bleibt. Es bietet sich an, daß
einer der beiden Partner einen geeigneten Schlüssel zufällig erzeugt und diesem dann
dem anderen Partner mitteilt. Aber dabei tritt folgendes Problem auf:
Wie überträgt man einen Schlüssel sicher von A nach B?
'$ '$
A - B
&% &%
?
Feind
Beispiele:
• Beim Einbruch in die vom deutschen Militär im zweiten Weltkrieg verwendeten
Verschlüsselungsmaschine, der sogenannten Enigma“ wurde wesentlich der zu Be-
”
ginn einer Übertragung stattfindende Schlüsselaustausch ausgenutzt.
• Beim Heißen Draht zwischen Moskau und Washington (verschlüsselt mit dem
sogenannten Vernam-Verfahren) wird der Schlüssel für jede Sitzung unter Einsatz
großer Sicherheitsmaßnahmen getrennt mit dem Flugzeug übertragen.
Man vermutete sehr lange, daß das Problem des Schlüsselaustauschs nicht lösbar wäre.
Aber im Jahr 1976 wurde das Diffie-Hellman-Verfahren zum Schlüsselaustausch
veröffentlicht. Dessen Idee soll im Folgenden beschrieben werden. Man beachte dabei
aber, daß die folgende Beschreibung noch kein verwendungsfähiges Verfahren liefert; es
soll zunächst nur die grundsätzliche Idee deutlich werden. Weitere Ergänzungen folgen
später.
Man geht von der Idee der Einwegfunktion aus: Eine Einwegfunktion ist eine Funktion
y = f(n)
deren Wert y für ein gegebenes n leicht und schnell zu berechnen ist. Umkehrt soll
es aber praktisch unmöglich sein, bei gegebenem y ein n mit f(n) = y zu ermittelt.
Insbesondere sollte es kein systematisches Verfahren zum Bestimmen von n geben. Eine
Suche nach dem passenden Werte von n durch probeweises Einsetzen aller möglichen in
Frage kommender Werte für n sollte an zu großem Aufwand scheitern.2
2
Eine Einwegfunktion besitzt Ähnlichkeit mit einem Briefkasten: Jeder kann einen Brief einwerfen;
man kann ihn aber nur entnehmen, wenn man über den passenden Schlüssel verfügt.
146
Beim Diffie-Hellman-Verfahren definiert man als Einwegfunktion mit einem vorgegebe-
nen a ∈ IR , a > 1 die Funktion:
Zur Berechnung des Wertes der Funktion f(n) muß eine Potenz berechnet werden, was
mit Sicherheit verhältnismäßig einfach und schnell durchgeführt werden kann. Zur Be-
rechnung der Umkehrfunktion g(y) muß hingegen logarithmiert werden; die Berechnung
des Logarithmus kann auf alle Fälle als deutlich schwieriger als das Potenzieren bezeich-
net werden.
Angenommen, f(n) wäre aufgrund dieser Eigenschaften in der Tat eine Einwegfunktion,
so kann damit folgendes Schlüsselaustauschverfahren beschrieben werden:
3. Die Partner A und B denken sich jeder einen geheimen Wert aus:
A: n ∈ IN
B: m ∈ IN
4. A berechnet
y1 = an
und sendet y1 unverschlüsselt an B. Entsprechend berechnet B
y2 = am
5. A berechnet
y = y2n = (am )n = an·m
B berechnet
y = y1m = (an )m = an·m
7. (Zusatz ) y ist eine natürliche Zahl und kann folgendermaßen zum Austausch einer
verschlüsselten Nachricht benutzt werden:
147
Man beachte, daß hierbei der Schlüssel y nur den beiden Partnern A und B be-
kannt ist. Es handelt sich hier um das Verfahren von El Gamal zum Nachrichten-
austausch.
f(n) = an
Deren erstes Merkmal besteht darin, daß die Potenz an auch für sehr große n ∈ IN
(etwa n > 10100 ) sehr schnell berechnet werden kann. Natürlich kann dieses nicht durch
eine Schleife mit einzelnen Multiplikationen erfolgen. Man verwendet statt dessen einen
schnellen, auf dem Prinzip Teile und herrsche beruhenden Algorithmus, dessen Idee
lautet:
0
setze n = 2 · q + r mit q ∈ IN und r =
1
n 2q+r q 2 r
⇒ a = a = (a ) · a
⇒ Im wesentlichen ist nur noch aq zu berechnen; der
Exponent wurde halbiert.
Dieser Idee folgt folgendes rekursives Verfahren zum Potenzieren:
pot(a,n)
if(n==0) return 1
r = n%2
q = n/2 // Ganzzahldivision
y = pot(a,q)
y = y * y
if(r==1) y = y * a
return y
Wie man leicht zeigen kann, beträgt der Aufwand dieses Verfahrens ungefähr
148
Verfügt der Feind aber über eine Möglichkeit, den Logarithmus leicht zu berechnen, so
kann er folgendermaßen vorgehen:
y 1 = an | log( )
log(y1 ) = log(an )
= n · log(a) (3.4)
log(y1 )
⇒ n =
log(a)
In der Tat ist der Logarithmus3 nicht schwer zu berechnen. Bekanntlich sind Funktionen
zur Berechnung des Logarithmus in üblichen mathematischen Bibliotheken und auch Ta-
schenrechnern anzutreffen. Solche Funktionen verwenden Methoden der Analysis; einen
Ansatz dazu liefert die sogenannte Logarithmusreihe4 .
Man benötigt somit eine weitere Idee, um eine Verwendung des Logarithmus wie in (3.4)
auszuschließen und so das Diffie-Hellman-Verfahren sinnvoll einsetzen zu können.
Ein zusätzliches Problem des auf Seite 147 so beschriebenen Schlüsselaustauschverfah-
rens besteht darin, daß die beiden vertraulichen Werte n und m möglichst große Zahlen
sein sollen; andernfalls wäre ein Brechen durch Probieren“ möglich.
”
Sind aber n und m große Werte, so wären
y 1 = an , y2 = am und y = anm
so große Werte, daß damit sogar der verfügbare Speicher bei weitem nicht mehr zu deren
Darstellung ausreichte. Auch auch diesem Grunde ist eine weitere Idee erforderlich.
Der erste Teil dieser Idee besteht darin, von der Rechnung mit reellen Zahlen abzugehen
und statt dessen geeignete ganze“ (diskreten) Zahlen zu verwenden5 . Um dieses zu
”
erläutern, folgt ein Abschnitt, der eine genauere Betrachtung der ganzen Zahlen ZZ und
deren Arithmetik zum Inhalt hat.
Um dem Problem der zu großen Zahlen abzuhelfen, setzt man schließlich doch nicht
die ganzen Zahlen ein, sondern man verwendet davon abgeleitete Zahlenbereiche, deren
Elemente nicht über eine bestimmte Größe hinauswachsen können. Um dieses verste-
hen zu können, sind einige algebraische Grundlagen erforderlich, die in einem späteren
Abschnitt dieses Kapitels vermittelt werden.
Gegenstand der folgenden Betrachtung ist die Menge der ganzen Zahlen:
Mit der Addition bilden die ganzen Zahlen eine Gruppe; man bezeichnet diese Gruppe
als (ZZ , +). Für (ZZ , +) gilt:
3
log(x) bezeichnet hier wie im folgenden den natürlichen Logarithmus.
4
Die Logarithmusreihe wird in einer Nachfolgevorlesung behandelt werden.
5
Bekanntlich ist dieses für einen digitalen Rechner ohnehin passender.
149
• Das neutrale Element ist die Null: 0.
• Zu a ∈ ZZ ist das (additiv) inverse Element die zugehöre negative Zahl: −a.
Bekanntlich ist auf ZZ auch die Multiplikation definiert, und das Produkt zweier ganzer
Zahlen ist ebenfalls wieder eine ganze Zahl. Allerdings bilden ZZ und auch ZZ \ {0} mit
der Multiplikation keine Gruppe. Die Eins (1) ist zwar ein neutrales Element bezüglich
der Multiplikation; die einzigen Elemente in ZZ, die ein (multiplikativ) inverses Element
besitzen, sind jedoch nur 1 und −1.
Eine Division m : n ist für zwei ganze Zahlen m, n ∈ ZZ im Bereich von ZZ nur möglich6 ,
falls n ein sogenannter Teiler von m ist:
m = d·n (3.5)
Beispiel:
17 | 51 denn 51 = 3 · 17, also hier: d = 3
Der Teiler7 n von m heißt echter Teiler von m, wenn sowohl n 6= ±1 als auch n 6= ±m
ist. Teilt n die beiden ganzen Zahlen m1 und m2 , so teilt n auch deren Summe und
Differenz:
(3.7) kann leicht durch Ausklammern nachgewiesen werden. Ebenso leicht nachzuweisen
sind die folgenden Regeln zur Teilbarkeit:
Aufgabe: Man begründe die Aussagen (3.7), (3.8), (3.9) und (3.10).
Aufgabe: Man begründe:
n|m ⇒ n ≤ m (3.12)
6
d. h. mit Ergebnis wieder in ZZ
7
Ist n kein Teiler von m, so schreibt man n 6 |m.
150
Begründung: Wegen n|m gibt es ein d ∈ ZZ mit m = d · n. Da n und m positiv sind, ist
auch d positiv; wegen d ∈ ZZ ist sogar 1 ≤ d. Multipliziert man diese Ungleichung mit
n, so erhält man
n·1 ≤ n·d = m
Aufgabe: Man zeige, daß allgemeiner für n, m ∈ ZZ mit n 6= 0 und m 6= 0
gilt. (3.13) besagt, daß der Teiler einer ganzen Zahlen dem Betrage nach niemals größer
als diese Zahl sein kann.
F
Für ganze Zahlen ist die bedeutsame Teilung mit Rest vorhanden: Sind m, n ∈ ZZ
mit n 6= 0, so gibt es q, r ∈ ZZ mit
q ist der ganzzahlige Quotient bzw. das Ergebnis der Ganzzahldivision von m : n; r ist
der Divisionsrest. Man beachte, daß ein gültiger Rest immer einen kleineren Betrag als
der Divisor besitzen muß.
Begründung der Teilung mit Rest: Zunächst sei n > 0. Man betrachtet die folgende
Teilmenge der ganzen Zahlen:
{m − q · n | q ∈ ZZ } (3.15)
= { . . . , n − 3 · n, m − 2 · n, m − 1 · n, m, m + 1 · n, m + 2 · n, m + 3 · n, . . . }
Da für hinreichend großes q der Ausdruck m − q · n negativ und für hinreichend kleines q
positiv wird, muß diese Menge sowohl positive als auch negative Zahlen enthalten. Man
kann daher ein q ∈ ZZ finden, so daß m − q · n die kleinste nicht negative Zahl innerhalb
die Menge (3.15) ist. Für dieses q gilt dann
m − q·n ≥ 0
(3.16)
und m − (q + 1) · n < 0
m − (q + 1) · n + n < n
(3.17)
⇔ m − q·n < n
Die erste Ungleichung in (3.16) sowie die zweite Ungleichung in (3.17) liefern zusammen
0 ≤ m − q·n < n
| {z } (3.18)
=r
Damit ist 0 ≤ r < n für den Spezialfall n > 0 gezeigt. Läßt man nun für n auch negative
Werte zu, so kann man die Teilung mit Rest zunächst für den nichtnegativen Wert |n|
(den Betrag von n) durchführen. Das liefert die Darstellung
m = q1 · |n| + r (3.19)
151
mit 0 ≤ r < |n|. Sollte nun n < 0 sein, so ist in diesem Fall |n| = −n, und diese setzt
man einfach in (3.19) ein:
Setzt man jetzt in (3.20) q = −q1 , so hat man (3.14) erhalten. qed.
Bemerkung: In der Regel wird (3.14) später nur für positive ganze Zahlen n, m > 0
verwendet werden.
Aufgabe: Man zeige zu (3.14):
m, n > 0 ⇒ 0 ≤ q ≤ m (3.21)
m > 0, n > 1 ⇒ 0 ≤ q < m (3.22)
Lösung: Angenommen, es wäre q < 0. Wegen q ∈ ZZ wäre dann sogar q ≤ −1. Multipli-
ziert man diese Ungleichung mit n > 0 und addiert anschließend r, so folgt
Dieses ist ein Widerspruch zu m > 0; also muß q ≥ 0 sein. Weiter folgt:
m−r m
q·n = m − r ⇒ q = ≤ ≤ m (3.23)
n n
Damit ist (3.21) gezeigt. Ist sogar n ≥ 2, so muß die zweite Ungleichung auf der rechten
Seite von (3.23) eine strikte Ungleichung (“ < “) sein. Damit folgt (3.22).
F
Anhand des Restes r kann man die Teilbarkeit erkennen; mit den hier verwendeten
Bezeichnungen hat man nämlich:
n|m ⇔ r = 0 (3.24)
Beispiel:
50 : 8 = 6 Rest 2
⇔ 50 = 8 · 6 + 2
Die Teilung mit Rest wird sich im Späteren als sehr wichtig und grundlegend erweisen.
Bei der Programmiersprache C wird die Division mit Rest durch die beiden folgenden
Operatoren unterstützt:
• m/n: liefert den ganzzahligen Quotient von m : n, der Rest wird ohne zu runden
abgeschnitten.
152
Wie bereits bemerkt, werden zur Vereinfachung im folgenden oft nur nichtnegative ganze
Zahlen betrachtet. Die Menge der nichtnegativen ganzen Zahlen wird als IN0 bezeichnet.
Läßt man noch die Null weg, d. h. beschränkt man sich nur auf die positiven ganzen
Zahlen, so erhält man IN, die Menge der natürlichen Zahlen.
Wichtige Folgerung aus der Teilung mit Rest: Sind m, n ∈ ZZ mit n > 0, so gibt es bei
der Division von m durch n
m = q·n + r (3.25)
für den Rest r nur n Möglichkeiten. Wegen 0 ≤ r < n kann r nur die Werte
r = 0, 1, 2, . . . , n − 1 (3.26)
annehmen.
(3.26) besitzt eine wichtige Anwendung; es führt auf die bekannte Darstellung der
natürlichen Zahlen durch Stellenwertsysteme.
Satz (b-Stellenwertsystem): Vorgegeben sei die sogenannte Basis b ∈ IN mit b > 1.
Dann besitzt jede Zahl n ∈ IN0 eine eindeutige Darstellung der Form
n = z0 b0 + z1 b1 + z2 b2 + z3 b3 + . . . + zs bs (3.27)
mit 0 ≤ zi < b für i = 0, . . . , s
Dabei ist s ∈ IN0 ; s + 1 ist die Anzahl der Stellen von n. Die z0 , z1 , . . . , zs sind die
Ziffern von n.
Bemerkung:
• Am meisten verwendet wird die Basis b = 10; der Grund dafür ist sicherlich die
Verwendung der zehn Finger beim Rechnen.
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Das Oktalsystem (b = 8) wurde bei einigen Völkern schon früher verwendet; of-
fenbar rechnete man mit den Fingern, verwendete aber die Daumen nicht.
• Die von den Römern verwendete Methode zur Zahlendarstellung sind ein Beispiel
für ein Zahlensystem, das kein Stellenwertsystem ist
153
Begründung von (3.27): Verwendet wird eine verallgemeinerte vollständige Induk-
tion. Der Induktionsanfang wird mit den kleinen“ Zahlen n = 0, 1, 2, . . . , b − 1
”
durchgeführt. Schreibt man für ein solches n
n = z0 · b0 mit 0 ≤ z0 = n < b
so ist dieses bereits die gewünschte Darstellung (3.27), die offenbar eindeutig ist. Es folgt
der Induktionsschluß. Sei dazu n ∈ ZZ mit n ≥ b. Als Induktionsvoraussetzung
wird angenommen, daß die Behauptung
bereits bewiesen wurde. Man nimmt dann eine Teilung mit Rest vor:
Dann ist 0 < q < n (wegen (3.22)), und man kann auf q die Induktionsvoraussetzung
anwenden. q besitzt somit die eindeutige Darstellung
q = y0 b0 + y1 b1 + y2 b2 + . . . + yt bt (3.29)
mit 0 ≤ yi < b für i = 0, . . . , t
Multipliziert man beide Seiten von (3.29) mit b und addiert man anschließend r, so
liefert dieses zusammen mit (3.28)
n = q · b + r = r + y0 b1 + y1 b2 + y2 b3 + y3 b4 + . . . + yt bt+1 (3.30)
so erkennt man, daß (3.30) eine Stellenwertdarstellung für n der Form (3.27) ist. Diese
ist sogar eindeutig, denn q und r in (3.28) sind durch n eindeutig bestimmt. qed.
d = ggT(m, n) (3.32)
ist eine natürliche Zahl, die durch die beiden folgenden gleichwertigen Eigenschaften
festgelegt ist:
8
engl. greatest common divisor
154
1. d ∈ IN ist die größte natürliche Zahl, die sowohl ein Teiler von m als auch ein
Teiler von n ist, d. h.
d = max{a ∈ IN | a|m und a|n} (3.33)
Man beachte, daß die in (3.33) erscheinende Menge zumindest die Zahl 1 enthält
und damit nicht leer ist. Außerdem besitzt diese Menge wegen (3.13) notwendi-
gerweise ein größtes Element.
2. Die bedeutsamste Charakterisierung des größten gemeinsamen Teilers liefern die
beiden folgenden Eigenschaften; genau wenn diese erfüllt sind, ist d = ggT(m, n):
(1) d ist ein gemeinsamer Teiler von m und n, d. h. d | m und d | n.
(3.34)
(2) Sei d˜ ∈ IN beliebig mit d˜| m und d˜| n ⇒ d˜| d
Dieses bedeutet: Jeder beliebige gemeinsame Teiler von m und n ist auch ein Teiler
des größten gemeinsamen Teilers von m und n.
Beispiel: Gemeinsame Teiler von 12 und 40 sind 1 und 2, diese teilen auch 4 =
ggT(12, 40).
Der Nachweis der Gleichwertigkeit von (3.33) und (3.34) erfolgt später, da hierzu erst
noch einige Vorbereitungen erforderlich sind.
Für zahlreiche Anwendungen erweist es sich als sehr günstig, daß es ein sehr schnelles
und einfaches Verfahren zur Berechnung des größten gemeinsamen Teilers gibt; dieses
ist der sogenannte
euklidische Algorithmus
der im Folgenden hergeleitet und genauer besprochen werden soll. Es reicht, sich auf
zwei nichtnegative ganze Zahlen m, n ∈ ZZ zu beschränken9 ; ebenso setzt man zunächst
m ≥ n voraus. Die Vorgehensweise und Idee des euklidischen Algorithmus lautet damit:
(a) Ist n = 0, so setzt man einfach
ggT(m, n) = m (3.35)
Man erkennt sofort, daß (3.35) in diesem Spezialfall in Übereinstimmung zu der
Eigenschaft (3.33) ist.
(b) Ist n > 0, so nimmt man eine Teilung mit Rest vor (siehe (3.14)):
m = q·n + r mit 0 ≤ r < n (3.36)
⇔ r = m − q·n (3.37)
Für beliebiges d ∈ IN gilt dann folgende Tatsache:
d ist genau dann ein gemeinsamer Teiler von m und n,
(3.38)
wenn d auch ein gemeinsamer Teiler von n und r ist.
155
Die Begründung von (3.38) erhält man, indem man einen beliebigen gemeinsamen
Teiler d von m und n auf der rechten Seite von (3.37) ausklammert, bzw. indem
man einen beliebigen gemeinsamen Teiler d von n und r auf der rechten Seite von
(3.36) ausklammert
Hieraus folgt wiederum sofort10
n1 < n
ist.
Fährt man auf diese Weise fort, d. h. mit der schrittweisen Vereinfachung durch Teilung
mit Rest in Schritt (a), so erhält man nacheinander:
m0 = m, n0 = n, m0 = q0 · n0 + r0 (r0 < n0 )
m1 = n0 , n1 = r0 , m1 = q1 · n1 + r1 (r1 < n1 )
m2 = n1 , n2 = r1 , m2 = q2 · n2 + r2 (r2 < n2 )
.. ..
. .
mi = ni−1 , ni = ri−1 , mi = qi · ni + ri (ri < ni )
.. ..
. .
Ist ni−1 > 0 so ist 0 ≤ ri−1 < ni−1 ; beachtet man noch ni = ri−1 , so liefert dieses die
Ungleichungen
n0 > n1 > n2 > . . . > ni−1 > ni > . . . ≥ 0
Da alle ni nichtnegative ganze Zahlen sind, muß bei dieser absteigenden Kette irgend-
wann einmal die Null erreicht werden, d. h. es muß ein j ∈ IN mit
nj = 0
geben. Für das Paar (mj , nj ) kann dann Schritt (a) des Algorithmus angewandt werden.
Der Algorithmus endet damit und liefert wegen (3.40) das gewünschte Ergebnis:
156
ggT(m,n)
while (n > 0)
r = m%n
m = n
n = r
return m
Aufgabe: Begründen Sie, daß man auf die zunächst geforderte Bedingung m ≥ n (siehe
Seite 155) verzichten kann; zum Ablauf des so geschilderten euklidischen Algorithmus
kommt höchstens ein Schritt vom Typ (b) hinzu.
Der euklidische Algorithmus ist sehr schnell; sein Aufwand beträgt höchstens
2 · ld (n) + 2 (3.41)
Schleifendurchläufe. Er ist damit auch noch für sehr große Zahlen (n, m ≥ 10300 )
durchführbar.
Zur Begründung12 von (3.41) weist man nach, daß spätestens nach zwei Schritten eine
Halbierung von ni erfolgt, d. h. mit den Bezeichnungen von Seite 156 ist
1
ni+2 < · ni (3.42)
2
Zunächst gilt nach Konstruktion ebenfalls mit den Bezeichnungen von Seite 156
ni > ni+1 (= ri )
und ni = qi+1 · ni+1 + ni+2 (3.43)
|{z} |{z}
=mi+1 =ri+1
2. Es ist umgekehrt ni+1 > 12 · ni bzw. 2ni+1 > ni ; dann muß aber in (3.43) qi+1 = 1
sein, sonst erhielte man wegen qi+1 ∈ IN und ni+2 = ri+1 ≥ 0 einen Widerspruch.
Setzt man qi+1 = 1 in (3.43) ein, so folgt in der Tat wieder mit Hilfe von ni+1 > 12 ·ni
ni = ni+1 + ni+2
1 1
⇒ ni+2 = ni − ni+1 < ni − · ni = · ni
2 2
Damit ist Ungleichung (3.42) gezeigt. Wendet man die Ungleichung (3.42) mehrmals an,
so folgt für k ∈ IN:
1
ni+2k < k · ni
2
Speziell für i = 0, d. h. für n = n0 ist dann
1
n2k < ·n (3.44)
2k
12
Diese Begründung ist eine Hintergrundinformation; sie ist für das Verständnis des Folgenden nicht
notwendig.
157
Wählt man k ∈ IN mit ld (n) ≤ k < ld (n) + 1, so ist 2k ≥ n und daher
1
n2k < ·n ≤1 ⇒ n2k < 1
2k
Wegen n2k ∈ ZZ und n2k ≥ 0 muß daher n2k = 0 sein. Damit endet der Algorithmus. Er
hat bis zu seinem Ende höchstens diese 2k Schritte durchlaufen, wobei k < ld (n) + 1
ist. Damit ist (3.41) gezeigt.
F
Beispiel:
m = 4, n = 17, 4 = 0 · 17 + 4
m1 = 17, n1 = 4, 17 = 4 · 4 + 1
m2 = 4, n2 = 1, 4 = 4·1 + 0
m3 = 1, n3 = 0 ⇒ ggT(4, 17) = m3 = 1
Hier tritt die Besonderheit auf, daß die beiden Zahlen 4 und 17 keinen echten gemein-
samen Teiler besitzen. Gerade dieser Fall ist für viele Anwendungen bedeutsam, man
definiert daher:
Definition: n, m ∈ ZZ heißen teilerfremd oder zueinander prim, falls gilt
ggT(m, n) = 1 (3.45)
Bedeutsamer als der einfache“ größte gemeinsame Teiler ist häufig die Tatsache, daß
”
der größte gemeinsamer Teiler zweier Zahlen m, n ∈ ZZ in folgender Weise dargestellt
werden kann: Zu m, n ∈ IN0 gibt es stets ein Paar ganzer Zahlen a, b ∈ ZZ mit
ggT(m, n) = a · m + b · n (3.46)
Diese Aussage wird als Lemmas von Bezout bezeichnet und ist insbesondere im Falle
ggT(m, n) = 1 interessant. Zwei Zahlen m, n ∈ ZZ sind nämlich genau dann teilerfremd,
wenn es Zahlen a, b ∈ ZZ mit
gibt. Die Gültigkeit der Gleichung (3.47) folgt sofort aus dem Lemmas von Bezout. Zu
zeigen bleibt nach die Umkehrung: Besteht für m, n ∈ ZZ eine Gleichung der Form (3.47),
so sind sie teilerfremd. Das wird als Aufgabe überlassen.
Die Darstellung (3.46) wird mit einer Erweiterung des euklidischen Algorithmus
berechnet; wie beim gewöhnlichen euklidischen Algorithmus nimmt man eine Teilung
mit Rest vor (siehe Seite 156) und setzt
m0 = m, n0 = n, m0 = q0 · n0 + r0
(3.48)
m1 = n0 , n1 = r0 (r0 < n0 )
Angenommen, man hat für das Zahlenpaar (m1 , n1 ) mit n1 < n0 bereits die ggT-
Darstellung
ggT(m1 , n1 ) = a1 · m1 + b1 · n1 (3.49)
158
berechnet, so setzt man in diese die Gleichungen
m1 = n0 und n1 = m0 − q0 · n0
ggT(m, n) = a1 · m1 + b1 · n1
= a1 · n0 + b1 · (m0 − q0 · n0 )
= b1 ·m0 + (a1 − q0 · b1 ) ·n0 (3.50)
|{z} | {z }
a0 b0
= a·m + b·n
i mi ni qi ri ai bi ggT
0 61 17 3 10 −5 18 1
1 17 10 1 7 3 −5 1
2 10 7 1 3 −2 3 1
3 7 3 2 1 1 −2 1
4 3 1 3 0 0 1 1
5 1 0 1 0 1
Zunächst wurden nur die Spalten bis zur Spalte ri“ berechnet. Dazu wurde wie in (3.48)
”
die Teilung mit Rest mi = qi ·ni +ri durchgeführt sowie mi+1 = ni und ni+1 = ri gesetzt.
Wurde hier nach fünf Schritt n5 = 0 erreicht, so konnte ggT(m5 , n5 ) = ggT(m, n) = 1
gesetzt werden. Ebenso konnte a5 = 1 und b5 = 0 gesetzt werden. Danach erfolgte die
Rückrechnung mit absteigendem i, indem wie in (3.50) ai = bi+1 und bi = ai+1 − qi · bi+1
gesetzt wurde. Das Ergebnis liefert die 0-te Zeile der Tabelle:
ggT(61, 17) = −5 · 61 + 18 · 17 = 1
i mi ni qi ri ai bi ggT
0 100 34 2 32 −1 3 2
1 34 32 1 2 1 −1 2
2 32 2 16 0 0 1 2
3 2 0 1 0 2
Es folgt mit entsprechender Rechnung ein weiteres Beispiel mit etwas größeren Zahlen:
159
i mi ni qi ri ai bi ggT
0 9654321 1234569 7 1012338 8633 −67510 3
1 1234569 1012338 1 222231 −7079 8633 3
2 1012338 222231 4 123414 1554 −7079 3
3 222231 123414 1 98817 −863 1554 3
4 123414 98817 1 24597 691 −863 3
5 98817 24597 4 429 −172 691 3
6 24597 429 57 144 3 −172 3
7 429 144 2 141 −1 3 3
8 144 141 1 3 1 −1 3
9 141 3 47 0 0 1 3
10 3 0 1 0 3
Das Ergebnis wird wieder der 0-te Zeile der Tabelle entnommen:
Die dritte Zeile von (3.50) führt auf eine rekursive Fassung des erweiterten euklidischen
Algorithmus:
Der Aufwand hiervon ist wie beim einfachen euklidischen Algorithmus (siehe (3.41)). Der
Nachteil dieser Fassung ist die Verwendung der Rekursion. Will man diese vermeiden
und zu einer iterativen Fassung kommen, so benötigt man eine kleine Vorarbeit:13
Zunächst betrachtet man dazu die Rekursionsgleichungen, die die Grundlage dieser re-
kursiven Fassung des erweiterten euklidischen Algorithmus bilden:
mi = qi · ni + ri
(3.51)
mi+1 = ni ni+1 = ri
Mit (3.51) berechnet man rekursiv ganze Zahlen d, ai+1 , bi+1 mit
160
Damit berechnet man wiederum (siehe (3.50)):
ai = bi+1
(3.54)
bi = ai+1 − qi · bi+1
Jetzt erkennt man unschwer, daß sich (3.54) mit Hilfe einer Matrix schreiben läßt:
ai 0 1 ai+1
= ◦ (3.55)
bi 1 −qi bi+1
| {z }
Ai
Dabei ist qi der ganzzahlige Quotient von mi und ni aus (3.51); die vorkommende Matrix
wird Ai genannt. Für i + 1 gilt (3.55) ebenso:
ai+1 ai+2
= Ai+1 ◦
bi+1 bi+2
a a0 aj
= = A0 ◦ A1 ◦ . . . ◦ Aj ◦
b b0 bj
aj 1
mit =
bj 0
j ∈ IN ist hier gerade der Iterationsschritt, bei dem der euklidische Algorithmus endet
(siehe Seite 156). Mit Hilfe dieses iterierten Matrizenproduktes erhält man die iterative
Fassung des erweiterten euklidischen Algorithmus:
while (n > 0)
r = m%n
q = m/n
m = n
n = r
0 1
A = A ◦ 1 −q
161
Hierbei wurde verwendet, daß die erste Spalte von A gerade gleich dem Produkt A◦(1, 0)t
ist.
Beispiel: m = 4, n = 17
m = 4 n = 17 q = 0 r = 4 A = 01 1
0
m = 17 n = 4 q = 4 r = 1 A = 01 1 ◦ 0 1 = 1 −4
0 1 −4 0 1
1 −4 0 1 −4 17
m=4 n=1 q=4 r=0 A= 0 1 ◦ 1 −4 = 1 −4
a −4 17 1 −4
m=1 n=0 ⇒ = 1 −4 ◦ =
b 0 1
F
Bemerkung: Der größte gemeinsame Teiler ist auch für mehrere ganze Zahlen definiert;
er kann schrittweise berechnet werden:
Eine erste Besonderheit teilerfremder Zahlen stellt der folgende Hilfssatz dar:
Hilfssatz: Sind m, n ∈ IN teilerfremd, d. h. ist ggT(n, m) = 1, und ist c ∈ IN eine weitere
Zahl, so daß
m | c und n | c
ist, dann gilt auch
(m · n) | c (3.57)
Begründung: Da m und n teilerfremd sind, kann man von einer Darstellung nach (3.47)
ausgehen;
a·m + b·n = 1 mit a, b ∈ ZZ
Diese Gleichung multipliziert man mit c:
Nun teilt m · n beide Summanden auf der linken Seite von (3.58), denn man kann nach
(3.9), (3.10) folgern:
n | c ⇒ (n · m) | (m · c) ⇒ (n · m) | (a · m · c)
m | c ⇒ (n · m|(n · c) ⇒ (n · m) | (b · n · c)
Da m · m somit die beide Summanden auf der rechten Seite von (3.58) teilt, ist m · n
nach (3.7) auch ein Teiler der Summe und damit auch von c. qed.
162
Auf die folgende Aussage zu teilerfremden Zahlen benötigt man, wie man noch sehen
wird, sehr häufig.
Hilfssatz: Gegeben seien drei Zahlen m, n1 , n2 ∈ ZZ . Sind dann m und n1 teilerfremd
und ebenso m und n2 teilerfremd, so sind auch m und n1 · n2 teilerfremd; d. h.
Begründung: Wegen der Teilerfremdheit von m und n1 sowie von m und n2 gibt es
Darstellungen (siehe (3.47))
a1 · m + b 1 · n 1 = 1
a2 · m + b 2 · n 2 = 1
1 = (a1 m + b1 n1 ) · (a2 m + b2 n2 )
= a1 a2 m2 + a1 mb2 n2 + b1 n1 a2 m + b1 n1 b2 n2 Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 m + a1 b2 n2 + b1 n1 a2 ) ·m + b1 b2 ·n1 n2
| {z } |{z}
a b
= a · m + b · (n1 · n2 )
Damit wurde a · m + b · (n1 n2 ) = 1 gezeigt, woraus dann sofort ggT(a, (n1 n2 )) = 1) folgt
(siehe (3.47)). qed.
Zusatz: Durch vollständige Induktion zeigt man mit Hilfe von (3.59): Sind beliebig viele
Zahlen n1 , . . . , nk ∈ IN mit ggtT(m, ni ) = 1 gegeben, so ist auch
ggtT(m, n1 · n2 · . . . · nk ) = 1 (3.60)
F
Es bleibt noch zu zeigen, daß der größte gemeinsame Teiler d = ggT(m, n) zweier ganzer
Zahlen m, n ∈ ZZ durch die Eigenschaften (3.34) festgelegt ist; diese lauteten:
Auch dieses wird als Aufgabe überlassen. Hinweis: Man verwende (3.46).
3.2.3 Primzahlen
Grundlegend sind die sogenannten Primzahlen. Eine Zahl p ∈ IN mit p > 1 heißt
Primzahl, falls gilt (mit d ∈ ZZ):
Achtung: Man beachte, daß aufgrund dieser Definition die Zahl 1 keine Primzahl ist.
163
(3.62) ist die bekannte Definition der Primzahlen. Es gibt aber ein weiteres Merkmal,
welches die Primzahlen charakterisiert und bei den meisten Betrachtungen zu Primzah-
len hilfreicher als die Beschreibung (3.62) ist. Dieses ist Inhalt des folgenden wichtigen
Satzes.
Satz: Für p ∈ IN mit p > 1 gilt
p ist Primzahl
⇔ (p | (n · m) ⇒ p | n oder p | m für n, m ∈ ZZ ) (3.63)
⇔ (p 6 | n und p 6 | m ⇒ p 6 | (n · m) für n, m ∈ ZZ ) (3.64)
Dieses besagt, daß eine Primzahl, die Teiler eines Produktes zweier ganzer Zahlen ist,
bereits mindestens einen der Faktoren teilen muß. Umgekehrt besagt (3.63), daß eine
Zahl p ein Produkt ganzer Zahlen nur dann teilt, wenn sie mindestens schon einen der
Faktoren teilt, eine Primzahl sein muß.
Beweis: Gegeben sei p ∈ IN .
1. Zunächst wird angenommen, daß p die Bedingung (3.63) erfüllt; zu zeigen ist, daß
p eine Primzahl ist. Dazu führt man einen Widerspruchsbeweis.
Angenommen, p wäre keine Primzahl; dann muß es einen echten Teiler d von p
geben. Dann muß zunächst
p = d·c mit einem c ∈ ZZ
gelten. Da d ein echter Teiler von p ist, ist wegen (3.13) |d| < p. Ebenso muß dann
|c| < p sein. Ebenfalls wegen (3.13) kann dann p keinen der beiden Faktoren d und
c teilen. Andererseits teilt p das Produkt d · c, denn es ist ja
d·c = 1·p
Das ist ein Widerspruch. Also kann p keinen echten Teiler besitzen; also muß p
eine Primzahl sein.
2. Jetzt sei p eine Primzahl, die das Produkt n · m teilt. Zu zeigen ist, daß p schon
mindestens einen der beiden Faktoren teilen muß. Auch hier wird wieder ein Beweis
durch Widerspruch geführt. Dazu wird angenommen, daß p keinen der beiden
Faktoren m und n teilt. Dann müssen aber die beiden größten gemeinsamen Teiler
von p mit m sowie von p mit n gleich 1 sein. Diese sind nämlich auch Teiler der
Primzahl p; daher kommen für sie nur 1 und p selber in Frage. Da aber p ja nach
Annahme weder m noch n teilen soll, bleibt für beide größten gemeinsamen Teiler
nur der Wert 1. Nach (3.47) gibt es daher mit geeigneten a1 , b1 , a2 , b2 Darstellungen
a1 · p + b 1 · m = 1
a2 · p + b 2 · n = 1
Die beiden Gleichungen multipliziert man miteinander:
1 = (a1 p + b1 m) · (a2 p + b2 n)
= a1 a2 p2 + a1 pb2 n + b1 ma2 p + b1 mb2 n Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 p + a1 b2 n + b1 na2 ) · p + b1 b2 · (m · n) (3.65)
164
Da ja nach Voraussetzung p ein Teiler von m · n ist, teilt p beide Summanden auf
der rechten Seite von (3.65). Dann müßte p aber auch die Summe und damit 1
teilen. Wegen p > 1 ist das aber ein Widerspruch. Somit muß p mindestens einen
der Faktoren m oder n teilen. qed.
Primzahlen werden sich als grundlegend für viele Verfahren in der Kryptologie erweisen;
insbesondere werden sehr große Primzahlen benötigt. Aber auch bei vielen anderen
Betrachtungen über die ganzen Zahlen und damit verbundenen Anwendungen ist die
Berücksichtigung der Primzahlen sehr hilfreich bzw. sogar notwendig. Ursache dafür
ist der folgende Satz, der besagt, daß jede ganze Zahl m mit |m| > 1 aus Primzahlen
zusammengesetzt“ ist.
”
Satz: (eindeutige Primfaktorzerlegung) Zu jedem m ∈ ZZ \ {0} gibt es eine Darstel-
lung der Form
m = ±1 · pe11 · pe22 · . . . · pess (3.67)
Dabei ist s ∈ IN0 ; die pi sind s verschiedene Primzahlen, die jeweils einen Exponenten
ei ∈ IN besitzen. Diese Darstellung ist bis auf die Reihenfolge eindeutig.
Beweis: Dieser Beweis wird mittels verallgemeinerter vollständiger Induktion durch-
geführt. Führt Induktionsanfang betrachtet man die beiden folgenden Arten ganzer
Zahlen:
1. m = ±1
(3.68)
2. m = ±p mit einer Primzahl p
165
Beide Möglichkeiten in (3.68) sind offenbar eine Darstellung der Form (3.67) und sind
offenbar eindeutig.
Für den Induktionsschluß betrachtet man eine ganze Zahl m ∈ ZZ mit |m| > 1, die
keine Primzahl ist, und nimmt an, daß die Behauptung bereits für alle d ∈ ZZ mit
0 < |d| < |m| bewiesen ist. Dann gibt es ein Zerlegung
m = d1 · d2 (3.69)
und man kann die Induktionsvoraussetzung auf d1 und d2 anwenden. Es gibt somit
Primfaktorzerlegungen
mit Primzahlen p1 und qj sowie Exponenten ei und fj . Das liefert sofort eine Primfak-
torzerlegung von m:
Da p1 ein Teiler von m und damit des Produktes auf der rechten Seite von (3.72) ist,
muß p1 einen der Faktoren auf der rechten Seite von (3.72) teilen. Da es sich bei diesen
Faktoren (nach Auflösung der Potenzen) um die Primzahlen p̃1 , p̃2 , . . . , p̃t handelt, muß
p1 eine dieser Primzahlen teilen und damit gleich eine dieser Primzahlen seinen. Indem
man gegebenenfalls eine Umnummerierung vornimmt, kann man p1 = p̃1 annehmen.
Man kann daher die beiden Gleichungen (3.72) und (3.73) durch p1 teilen:
Dabei ist m1 = m/p1 ∈ ZZ . Wegen p1 > 1 ist dann insbesondere |m1 | < |m|. Folg-
lich sind nach Induktionsvoraussetzung die beiden Primfaktorzerlegungen (3.74) und
(3.75) gleich. Das heißt, auf den rechten Seiten von (3.73) und (3.75) kommen diesel-
ben Primzahlen mit den jeweiligen selben Exponenten vor. Dasselbe gilt dann auch für
die beiden Zerlegungen in (3.72) und (3.73), die somit ebenfalls gleich sind. Zwei be-
liebige Primfaktorzerlegungen von m sind somit gleich; damit ist die Eindeutigkeit der
Primfaktorzerlegung nachgewiesen. qed.
166
Schon seit 2300 Jahren bekannt aber erst seit ca. 40 Jahren von praktischer Bedeutung
ist der folgende
Satz von Euklid: Es gibt unendlich viele Primzahlen.14
Beweis:15 : Offensichtlich gibt es mindestens eine Primzahl (etwa = 2); die Menge der
Primzahlen ist damit nicht leer. Angenommen, deren Anzahl ist endlich und beträgt
genau k ∈ IN. Sind p1 , . . . , pk sämtliche existierende Primzahlen, so bildet man damit
die Zahl
N = p1 · p2 · . . . · p k + 1
Da mindestens ein Primzahl vorhanden ist, ist N > 1 und damit insbesondere N 6= ±1.
N muß daher mindestens einen Faktor der Gestalt pe in seiner eindeutigen Primfak-
torzerlegung besitzen; insbesondere ist dann die Primzahl p ein Teiler von N . Da die
p1 , . . . , pk alle Primzahlen sind, muß p gleich einer dieser Primzahlen sein, d. h. p = pi
mit einem i mit 1 ≤ i ≤ k. Dann ist aber offensichtlich p auch ein Teiler von p1 ·p2 ·. . .·pk .
Da p als Teiler von N gewählt wurde, ist somit
p | (N − p1 · p2 · . . . · pk ) = 1
Also folgt p|1, was nicht möglich ist. Die Annahme, es gäbe nur endlich viele Primzahlen
führt somit auf einen Widerspruch und kann nicht richtig sein. qed.
Setzt man in (3.76) nacheinander x = 10299 und x = 10300 ein, so folgt, daß in dem
Bereich von 10299 bis 10300 im Durchschnitt jede 700ste Zahl eine Primzahl ist. Dieses
ist für kryptologische Anwendungen sehr bedeutsam; in vielen Fällen werden dabei sehr
große Primzahlen benötigt.
F
Wie findet man Primzahlen?
167
– Ein einfacher Test besteht darin, daß man einen Teiler von m ∈ IN sucht.
Besitzt m einen Teiler n mit 1 < n < m, so kann m keine Primzahl sein. Es
reicht, für alle n ∈ IN mit
√
n ist ungerade und 2 < n ≤ m
zu prüfen, ob es sich um einen Teiler von m handelt. Einerseits17 einen ist
hier m ungerade kann daher keinen geraden Teiler besitzen. Andererseits muß,
wenn m ein Produktdarstellung
m = n1 · n2
√
besitzt, mindestens einer der beiden Faktoren ni kleiner oder gleich m sein.
Wäre nämlich
m = n1 · n2
eine Produktdarstellung von m mit
√
n1 > m
√
n2 > m
so folgte durch Multiplikation dieser beiden Ungleichungen
√ √
m = n1 · n2 > m· m = m
und damit m > m. Dieses ist ein Widerspruch.
Eine entsprechende Testfunktion ist:
bool primtest(m)
if (m==3) return true
if (m % 2 ==0) return false
w = sqrt(m)
n=3
while (n <= w)
if(m % n ==0) return false
n = n+2
return true
√
Der Aufwand dieses Tests beläuft sich auf m/2 Schleifendurchläufe und ist
für m ≤ 1012 gut machbar.
– Für sehr große m ∈ IN sind sehr interessante und effektive Tests vorhanden.
Aus allgemeinen Interesse sind viele Informatiker und Mathematiker damit beschäftigt
immer neuere und größerer Primzahlen zu finden. Gute Kandidaten für Primzahlen sind
die Zahlen der Form
n = 2k − 1 (3.77)
Ist n eine Primzahl, so heißt n Mersennesche Primzahl. Notwendig ist, daß k ebenfalls
eine Primzahl ist. Andernfalls wäre für k = a · b, 1 < a < k die Zahl 2a − 1 ein Teiler
von n. Die ersten Mersenneschen Primzahlen sind
3, 7, 31, 127, 8191, 131071, 524287
17
Das Lesen dieses Absatzes ist für das Verständnis des folgenden nicht zwingend erforderlich.
168
Der Fall n = 211 −1 = 2047 = 23·89 zeigt, daß nicht jede Zahl mit dieser Eigenschaft eine
Primzahl ist. Eine vor kurzem mit einigem Aufwand gefundene Mersennesche Primzahl
ist
Um das beschriebene Problem bearbeiten zu können sowie auch für viele andere An-
wendungen soll hier der sogenannte Chinesische Restsatz erläutert werden. Er wird
hier zunächst in einer stark vereinfachten Form formuliert; dieses ist ohnehin für viele
Anwendungen ausreichend.
Satz: Gegeben seien
2. u, v ∈ ZZ beliebig.
Die Reste, die sich bei Teilung von u durch m und v durch n ergeben, seien r1 bzw. r2 ,
d. h. es sei
u = q1 · m + r1 mit 0 ≤ r1 < m
(3.79)
v = q2 · n + r2 mit 0 ≤ r2 < n
Dann gibt es eine ganze Zahl w ∈ ZZ , die bei Teilung durch m bzw. durch n ebenfalls
die Reste r1 und r2 aus (3.79) liefert:
w = q̃1 · m + r1
(3.80)
w = q̃2 · n + r2
Eine Zahl w ∈ ZZ mit dieser Eigenschaft ist bis auf Vielfache von m · n eindeutig
bestimmt.
169
Bemerkung: Die Aussage (3.80) bedeutet, daß man zu vorgegebenen Werten u und v
eine ganze Zahl w finden kann, die sowohl bei Teilung durch m als auch bei Teilung
durch n jeweils denselben Rest wie u bzw. wie v ergibt. Man bezeichnet dieses als Lösen
simultaner Kongruenzen
Für die folgenden Anwendungen wird es sich wieder als sehr günstig erweisen, daß die
Berechnung der Lösung zum Chinesischen Restsatz sehr einfach ist und außerdem keinen
großen Aufwand erfordert.
Beweis und Berechnung des Chinesischen Restsatzes: Man verwendet den erweiterten
euklidischen Algorithmus (siehe (3.46)) und bestimmt mit diesem a, b ∈ ZZ mit
(3.82) liefert die Lösung zu (3.80). Mit diesem so definierten w ∈ ZZ berechnet man
nämlich in der Tat
w = v · a · m + u · (b · n) Nach (3.81) ist b · n = 1 − a · m;
dieses wird hier eingesetzt.
= v·a·m + u − u·a·m
= u + (v · a − u · a) · m Und hier kann man u = q1 ·m+r1
einsetzen (siehe (3.79)).
= q1 · m + r1 + (v · a − u · a) · m
= (q1 + v · a − u · a) ·m + r1 Dieses ist die erste Gleichung aus
(3.80).
| {z }
q̃1
w1 = q̂1 · m + r1 w1 = q̂2 · n + r2
− w = q˜1 · m + r1 − w = q˜2 · n + r2
(w1 − w) = (q̂1 − q˜1 ) · m (w1 − w) = (q̂2 − q˜2 ) · n
170
Beispiel: Zu m = 4, n = 17 sowie u = 3, v = 8 berechnet man zunächst (siehe auch
Seite 162)
1 = (−4) · 4 + 1 · 17
und setzt
w = 8 · (−16) + 3 · 17 = −77
w ist eine Lösung zu den vorgegebenen Werten bezüglich des Chinesischen Restsatzes.
Ändert man w um Vielfache von 4 · 17 = 68 ab, so bleibt w eine Lösung; als kleinste
positive Lösung erhält man damit
w = −77 + 2 · 68 = 59
Mit dem so formulierten Chinesischen Restsatz kann die Erweiterung des zu Beginn
dieses Abschnitts erläuterten Problems (siehe Seite 169) gelöst werden:
1. Zu dem gegebenen m ∈ IN bestimmt man drei natürliche Zahlen
n1 , n2 , n3 ∈ IN
2. Man berechnet
m = qi · ni + ri für i = 1, 2, 3 (3.86)
(ri , ni ) (3.87)
Die i-Person weiß zwar, daß die Gleichung (3.86) besteht; wegen (3.83) hat sie aber keine
Chance, daraus m zu ermitteln. Nun sei angenommen, die erste und die zweite Person
kommen zusammen. Sie berechnen dann mit dem Chinesischen Restsatz ein M ∈ ZZ
mit
M = q̃1 · n1 + r1
(3.88)
M = q̃2 · n2 + r2
Da der zunächst noch unbekannte Wert m die entsprechenden Gleichungen (3.86) erfüllt,
können sich nach dem Chinesischen Restsatz M und m nur um ein Vielfaches von n1 · n2
unterscheiden; d. h. es muß gelten:
171
Da weiterhin gemäß (3.84) noch 0 < m < (n1 · n2 ) bekannt ist, kann m nun bestimmt
werden: Man teilt dazu einfach M durch n1 · n2 , der Divisionsrest ist dann m.18
Beispiel: Der geheime Wert sei m = 1234. Dazu werden die drei Zahlen n1 = 41, n2 = 53
und n3 = 61 ausgewählt. Die Bedingungen (3.83), (3.84), (3.85) sind damit erfüllt. Man
führt nun die Divisionen mit Rest durch:
Keine der drei Personen kann daraus alleine den Werte n = 1234 ermitteln. Angenom-
men, die erste und die zweite Personen kommen zusammen. Sie wenden den Chinesischen
Restsatz an und berechnen damit:
22 · n1 − 17 · n2 = 1 (erweiterter euklidischer Algorithmus)
15 · 22 · n1 − 4 · 17 · n2 = 9926 (chinesischer Restsatz)
4 · n1 · n2 + 1234 = 9926 (Teilung mit Rest)
In der letzten Zeile erscheint als Divisionsrest der geheime Wert n. Jetzt kommen die
erste und die dritte Person zusammen:
3 · n1 − 2 · n3 = 1 (erweiterter euklidischer Algorithmus)
14 · 3 · n1 − 4 · 2 · n3 = 1234 (chinesischer Restsatz)
Hier erscheint sofort der geheime Wert; eine Teilung mit Rest durch n1 · n3 war nicht
mehr notwendig. Die zweite und die dritte Person berechnen zusammen:
Auch hier erscheint ohne weitere Division bereits der geheime Wert.
Auf Seite 169 wurde nur eine einfache Version des Chinesischen Restsatzes angegeben.
Der vollständige Chinesische Restsatz, der nicht nur den Fall zweier Reste sondern den
Fall einer beliebigen Anzahl von Resten behandelt, lautet:
Satz: Gegeben seien m1 , m2 , . . . , mk ∈ IN , k ≥ 2 mit
172
so gibt es ein w ∈ ZZ mit
Bemerkung: Die Bedeutung ist entsprechend wie beim einfachen Chinesischen Restsatz:
Man kann unter den gegebenen Voraussetzungen eine Zahl w finden, die bei Teilung
durch mi jeweils denselben Rest wie ui ergibt.
Zur Abkürzung sei M = m1 · m2 · . . . · mk−1 . Der Wert ŵ aus (3.93) ist dann bis auf
Vielfache von M eindeutig bestimmt. Da die m1 , m2 , . . . , mk−1 zu mk teilerfremd sind,
sind auch M und mk teilerfremd (siehe (3.60)). Setzt man jetzt noch
ŵ = q̂ · M + r̂ (3.94)
Man rechnet nun leicht nach, daß (3.92) von w erfüllt wird. Außerdem ist w bis auf
Vielfache von M · mk =m1 · m2 · . . . · mk−1 · mk eindeutig bestimmt. qed.
173
Aber man stellt fest, daß es noch weitere Bereiche gibt, bei denen entsprechende Grund-
rechenarten mit entsprechenden Rechengesetzen wie bei den ganzen Zahlen anzutreffen
sind. Ein wichtiges Beispiel dafür bildet die bekannte Menge der Polynome mit reellen
Koeffizienten; man schreibt dafür
Entscheidend kommt hinzu, daß auch hier eine Teilung mit Rest möglich ist. Diese
Teilung mit Rest verwendet den Grad eines Polynoms. Für ein Polynom
grad(p(X)) = n (3.98)
Nach ist (3.98) der Grad gerade der größte vorkommende Exponent der Unbestimmten
X in dem Polynom p(X). Damit kann die Teilung mit Rest für reelle Polynome
formuliert werden:
Satz: Seien p(X), s(X) ∈ IR[X] mit q(X) 6= 0. Dann gibt es Polynome q(X), r(X) ∈
IR [X] mit
p(X) = q(X) · s(X) + r(X) dabei ist grad(r(X)) < grad(s(X)) (3.99)
Da somit ähnliche Grundvoraussetzungen wie bei den ganzen Zahlen anzutreffen sind,
kann hier ein Großteil der Betrachtung des vorherigen Abschnitts übertragen werden.
Dazu gehören u. a. der euklidische Algorithmus sowie der Chinesische Restsatz. An
die Stelle der Primzahlen treten hier die Polynome, die sich nicht als Produkt von
Polynomen kleineren Grades schreiben lassen, wie z. B. p(X) = X + 3 oder p(X) =
X 2 + 1.
Man könnte jetzt beginnen, zahlreiche Überlegungen und Herleitungen des letzten Ab-
schnitts noch einmal für reelle Polynome und u. U. weitere Male für weitere Bereiche,
bei denen ebenfalls die entsprechenden Voraussetzungen vorliegen, durchzuführen. Bes-
ser und üblich ist jedoch eine andere Vorgehensweise:
• Im vorliegenden Fall geht man nur von der Voraussetzung aus, daß bestimmte
Grundrechenarten mit gewissen Rechenregeln vorhanden sind.19
Die angestellten Betrachtungen sind dann in gleichem Maße für alle Bereiche
gültig, die diese Voraussetzung erfüllen.
Mengen, für deren Elemente gewisse Rechenoperationen möglich sind und bei denen
zusätzlich noch gewisse Rechenregeln erfüllt werden, bezeichnet man als algebraische
Strukturen.
19
Die Teilung mit Rest wird zunächst zurückgestellt.
174
Führt man seine Betrachtung für allgemeine algebraische Strukturen durch, so bietet
das neben der Möglichkeit zur Verallgemeinerung den zusätzlichen Vorteil, daß viele
Rechnungen und Überlegungen erheblich vereinfacht werden.20
Eine Gruppe ist eine Menge G, für deren Elemente eine Verknüpfung definiert ist, für
die die folgenden Rechenregeln gelten:
1. Abgeschlossenheit
a, b ∈ G ⇒ a · b ∈ G
2. Assoziativgesetz
a, b, c ∈ G ⇒ (a · b) · c = a · (b · c)
3. neutrales Element
Es gibt ein Element 1 ∈ G
mit a · 1 = a für alle a ∈ G
4. inverses Element
a∈G ⇒ Es gibt dazu ein Element
ã ∈ G mit ã · a = 1
Schreibweise: ã = a−1
5. Ist zusätzlich noch das Kommutativgesetz erfüllt
a, b ∈ G ⇒ a · b = b · a
so spricht man von einer kommutativen Gruppe oder von einer abelschen
Gruppe.
Es ist grundsätzlich bedeutungslos und hängt vom speziellen Einzelfall ab, ob man als
Verknüpfungszeichen wie hier den Malpunkt “·“ oder das Pluszeichen “+“ verwendet.
Im letzten Fall spricht man von einer additiv geschriebenen Gruppe und bezeichnet das
neutrale Element durch Null (“0“) und das Inverse zu einem a ∈ G durch −a. In der
Regel wird jedoch der Punkt “·“ verwendet.
• (IR \ {0}, ·): die reellen Zahlen ohne die Null mit der Multiplikation
20
So läßt sich zum Beispiel durch eine allgemeinere Vorgehensweise der Beweis des Chinesischen
Restsatzes erheblich vereinfachen.
175
Wie man an diesen Beispielen erkennt, gibt es sowohl unendliche als auch endliche
Gruppen. Die letzteren werden im Späteren eine besondere Rolle spielen.
• die Menge der invertieren Matrizen der Dimension n mit der üblichen Matrizen-
multiplikation als Verknüpfung:
Aufgabe: Man weise nach, daß es sich bei den Mengen (3.100) und (3.101) tatsächlich
um Gruppen handelt.
F
Ein Ring ist eine Menge R, für deren Elemente zwei Verknüpfungen (“+“ und “·“)
definiert sind, für die die folgenden Rechenregeln gelten:
1. Addition
(a) Abgeschlossenheit
a, b ∈ R ⇒ a + b ∈ R
(b) Kommutativgesetz
a, b ∈ R ⇒ a + b = b + a
(c) Assoziativgesetz
a, b, c ∈ R ⇒ (a + b) + c = a + (b + c)
Schreibweise: ã = −a
2. Multiplikation
(a) Abgeschlossenheit
a, b ∈ R ⇒ a · b ∈ R
(b) Assoziativgesetz
a, b, c ∈ R ⇒ (a·b)·c = a·(b·c)
176
3. Distributivgesetz
a, b, c ∈ R ⇒ a · (b + c) = a · b + a · c
Besitzt der Ring bezüglich der Multiplikation ein neutrales Element:
Es gibt ein Element 1 ∈ R \ {0}
mit a·1 = a für alle a ∈ R
so spricht man von einem Ring mit Eins.
Ist die Multiplikation des Ringes kommutativ:
a, b ∈ R ⇒ a · b = b · a
so spricht man von einem kommutativen Ring
Ein Beispiel für einen nicht kommutativen Ring bilden die quadratischen reellen Ma-
trizen Mn,n (IR ) für n > 1 (Bezeichnung: Matrizenring“) mit der Addition sowie der
”
Matrizenmultiplikation:
Bemerkung: Bezüglich der Addition ist ein Ring eine kommutative Gruppe.
Bemerkung: In einem Ring kann folgendes vorkommen:
• Es kann von Null verschiedene Elemente geben, die bezüglich der Multiplikation
kein Inverses Element besitzen.
• Es kann Nullteiler geben. Das heißt, es kann Elemente a, b ∈ R mit
a·b = 0 und a, b 6= 0 (3.102)
geben.
Ein Beispiel hierfür liefert der Matrizenring Mn,n (IR ) für n > 1.
Hilfssatz: Für einen Ring R gilt
1. Für alle a ∈ R ist a · 0 = 0.
2. Ist R kommutativ mit Eins und a ∈ R invertierbar, so ist a kein Nullteiler.
Der Beweis wird als Aufgabe überlassen. Hinweis zum Beweis der zweiten Aussage: Man
gehe von der Gleichung a · b = 0 mit einem b ∈ R aus.
F
Besitzt in einem kommutativen Ring mit Eins jedes von Null verschiedenes Element
bezüglich der Multiplikation ein Inverses, so bezeichnet man den Ring als Körper.
Bekannte Körper sind
• Q| : die rationalen Zahlen
• IR : die reellen Zahlen
Im folgenden werden noch weitere Körper hergeleitet werden, die sich ebenso wie diese
drei bekannten Körper zahlreiche Anwendungen besitzen.
Bemerkung: Aufgrund des Hilfssatzes von Seite 177 ist ein Körper nullteilerfrei.
177
3.3.1.2 Endliche kommutative Gruppen
In diesem Abschnitt sei G stets eine kommutative Gruppe, die nur endlich viele Elemente
besitzt. Die Anzahl der Elemente sei stets
g = #G (3.103)
Die Anzahl der Elemente einer endlichen Gruppe wird üblicherweise als Ordnung der
Gruppe bzw. als Gruppenordnung bezeichnet. Man schreibt dafür
ord(G) (3.104)
g =1 : G = {1}
g = 2 : G = { 1, −1 }
g = 3 : G = { e, u, v }
mit der Verküpfungstabelle : · e u v
e e u v (3.105)
u u v e
v v e u
g = 4 : G = { 1, j, −1, −j } mit 1 als neutralem Element
und den Festsetzungen (−1)2 = 1, j2 = −1, (−1) · j = −j
Aufgabe: Man stelle zur eben angegebenen Gruppe mit vier Elementen die vollständige
Verknüpfungstabelle auf.
Ganz zentral bei der Behandlung endlicher Gruppen ist der folgende
Satz: Ist #G = g die Ordnung der Gruppe G, so besteht für jedes Element a ∈ G die
Gleichung.
ag = 1 (3.106)
(3.106) besagt, daß man stehts das neutrale Element der Gruppe erhält, wenn ein be-
liebiges Element der Gruppe mit der Gruppenordnung potenziert
Begründung: Sei wieder g = #G; dann läßt sich G durch eine passende Durchnumme-
rierung ihrer Elemente folgendermaßen darstellen
G = {a1 , a2 , . . . , ag }
Dabei sind die ai genau die g Elemente von G. Sei nun a ∈ G beliebig, dann ist auch
G = {a · a1 , a · a2 , . . . , a · ag }
a · ai = a · aj | · a−1
⇒ ai = aj Widerspruch, da ai 6= aj
178
Somit sind die a · a1 , a · a2 , . . . , a · ag genau g verschiedene Gruppenelemente. Folglich
müssen dieses alle Gruppenelemente sein. Weiter gilt (Trick!):
qed.
Beispiel: Man betrachte wieder die Gruppe G = {1, −1, j, −j} aus den Beispielen
in (3.105). Hier ist #G = 4, und in der Tat ist
j 4 = (j 2 )2 = (−1)2 = 1
(−1)4 = ((−1)2 )2 = 12 = 1
Wie man am Beispiel von −1 ∈ G erkennt, ist zwar wie zu erwarten,
(−1)g = 1
(−1)2 = 1
d.h. es gibt bereits einen Exponenten e ∈ N mit 1 ≤ e < g, so daß (−1)e = 1 ist.
Für eine allgemeine endliche (und kommutative) Gruppe G und ein Element a ∈ G
definiert man daher die sogenannte Ordnung von a:
Offensichtlich ist wegen (3.106) ord(a) ≤ g = #G. Darüberhinaus gilt der wichtige
Satz:
das heißt, die Ordnung eines Gruppenelements ist ein Teiler der Gruppenordnung. Zur
Begründung von (3.108) setzt man für a ∈ G
e = ord(a)
g : e = q Rest r
bzw.
g =q·e + r mit 0 ≤ r < e
179
Angenommen, e wäre kein Teiler von g, d. h. der Divisionsrest r wäre ungleich Null,
dann gelte
1 = ag (wegen (3.106))
= aq·e+r (wegen g = q · e + r)
= (ae )q ·ar (da e = ord(a))
| {z }
=1
= 1q · ar = ar
⇒ 1 = ar
Dieses ist ein Widerspruch, denn
1≤r<e
und e = ord(a) ist minimal mit e ≥ 1 und ae = 1. qed.
Beispiel: Bei der Gruppe G = {1, −1, j, −j} aus (3.105) hat man
ord(1) = 1
ord(-1) = 2
ord(j) = 4
ord(-j) = 4
Alle diese Werte sind Teiler von 4 = #G.
Ganz genauso wie den letzten Satz beweist man den folgenden
Zusatz: Seien a ∈ G mit e = ord(a) und k ∈ IN , dann gilt
ak = 1 ⇒ e|k (3.109)
Im letzten Satz wurde dieses für den Spezialfall k = g gezeigt. Dessen Beweis läßt sich
unmittelbar auf diesen Zusatz übertragen.
Bemerkung: Das kartesische Produkt zweier Gruppen ist wieder eine Gruppe. Sind G1
und G2 , so lautet deren kartesisches Produkt
G1 × G2 = {(a, b) | a ∈ G1 , b ∈ G2 } (3.110)
Dabei wird in der ersten Komponente die für die Gruppe G1 definierte Multiplikati-
on und entsprechend in der zweiten Komponente die für die zweite Gruppe definierte
Multiplikation ausgeführt. Wegen
ist (1, 1) das neutrale Elemente der Gruppe G1 × G2 ; dabei ist die Eins in der ersten
Komponente das neutrale Element von G1 , und die in der zweiten Komponente das
neutrale Elemente von G2 .
180
Beispiel: Aus den beiden Gruppen (siehe (3.105))
G1 = { 1, −1 } , G2 = { 1, j, −1, −j }
dann gilt wegen (3.105) und (3.106) für jedes Element der Gruppe
• Wurzelziehen
√
e
y
ist schwer21 und daher gut für Entschlüsselung, die nur für Befugte durchführbar
sein soll.
xe
Das Verfahren:
B kennt irgendwo her“ (siehe später) eine Möglichkeit zum Ziehen der e-ten Wurzel
”
für einen Exponenten e ∈ IN . B nennt diese Möglichkeit bzw dieses Programm k2“.
”
k2 ist Bs privater Schlüssel und wird daher geheim gehalten. k1 = e ist Bs
öffentlicher Schlüssel und wird von B veröffentlicht; jeder kann somit e lesen.
Damit ist eine sicherer Nachrichtenversand an B durch eine beliebige Person A möglich:
• A zerlegt M in Blöcke Mi (z.B. mit einer Größe von 128, 256 oder 512 Bits)
21
zumindest ohne irgendwelche Zusatzinformationen
181
• A will jeden Block Mi einzeln an B senden und faßt dabei Mi als Dualzahl auf,
also:
Mi ∈ N
• A versendet Ci an B
• B entschlüsselt Ci mit seinem geheimen Schlüssel k2 und erhält Mi :
p
Mi = d(Ci , k2 ) = e Ci
Um solche endlichen Ringe konstruieren zu können, muß als Vorbeitung zunächst der
Begriff der Äquivalenzrelation eingeführt werden.
Unter einer Relation Rel zwischen zwei Mengen A und B versteht man bekanntlich eine
Teilmenge des kartesischen Produktes:
Rel ⊂ A × B (3.113)
22
Potenzreihen werden in der Vorlesung Mathematik 2 für I“ behandelt.
23 ”
Da man zunächst noch keine speziellen Eigenschaften der ganzen Zahlen benötigt, könnten hier die
ersten Teile der Betrachtungen für einen allgemeinen kommutativen Ring mit Eins angestellt werden.
182
Beispiele:
1.
)
A = {alle Personen}
Rel = besitzt“ (3.114)
B = {alle Autos} ”
gegebene Relation.
definiert.
Wie die letzten beiden Beispiele zeigen, kann eine Relation nicht nur zwischen zwei
verschiedenen Mengen sondern auch zwischen einer Menge A und sich selber bestehen;
es handelt sich dann um eine Teilmenge von A × A.
Von besonderem Interesse sind Relationen Rel ⊂ A × A, die eine oder mehrere der
folgenden Eigenschaften aufweisen:
1. reflexiv : (x, x) ∈ Rel für alle x ∈ A
2. symmetrisch : (x, y) ⊂ Rel ⇒ (y, x) ⊂ Rel (3.117)
2. transitiv : (x, y), (y, z) ⊂ Rel ⇒ (x, z) ⊂ Rel
Definition: Eine Relation Rel ⊂ A × A mit den drei Eigenschaften (3.117) heißt Äqui-
valenzrelation über A. Man schreibt bei einer Äquivalenzrelation
x ∼ y für (x, y) ∈ Rel (3.118)
Man sagt: x ist äquivalent zu y“.
”
• hat als Quadrat“ keine Äquivalenzrelation, denn keine der drei Eigenschaften aus
”
(3.118) ist erfüllt,
• die Relation
eine Äquivalenzrelation.
183
Aufgabe: Man begründe, daß (3.119) eine Äquivalenzrelation ist.
x = {y ∈ A | x ∼ y} (3.121)
Äquivalenzklasse von x.
Die Äquivalenzrelation x enthält somit alle zu x äquivalenten Elemente.
Beispiel: Der in (3.122) genannte Geldschein ist eine Repräsentant der Menge aller 5e-
Scheine.
Satz: Ist Rel ⊂ A × A eine Äquivalenzrelation über der Menge A, so gilt mit x, y ∈ A
1. x = y ⇔ x ∼ y
2. x ∩ y 6= ∅ ⇔ x ∼ y
(3.123)
3. A ist disjunkte Vereinigung aller Äquivalenz-
klassen zu Rel.
Beweis: Aufgabe!
Eine Äquivalenzrelation bewirkt immer eine Zerlegung der betreffenden Menge. Sind
etwa nur die endlich vielen Äquivalenzklassen a1 , a2 , . . . , ak vorhanden, so ergibt
sich eine Zerlegung der Menge A der Form
184
a1 a2 a4 ··· ak
Definition: Rel sei eine Äquivalenzrelation über der Menge A. Ist dann P ⊂ A eine
Teilmenge mit den beiden folgenden Eigenschaften
1. x, x0 ∈ P ⇒ x 6∼ x0
2. A =
[
x (3.125)
x∈P
185
• ein fest gewähltes Element n ∈ Z \ {0, ±1}
Dazu sei ab jetzt die folgende Relation gegeben (mit a, b ∈ Z):
Man erkennt sofort, daß es sich bei (3.126) um eine Äquivalenzrelation handelt. Zum
Nachweis der Transitivität zeigt man:
a ∼ b, b ∼ c ⇒ n | (a − b) und n | (b − c)
⇒ n | (a − b) + (b − c)
| {z }
=a−c
⇒ n | (a − c)
⇒ a ∼ c
Der Nachweis der Symmetrie und der Reflexivität wird als Aufgabe überlassen.
a ≡ b mod n (3.127)
und sagt a ist kongruent b modulo n“. Ein zugehöriges Repräsentantensystem nennt
”
man Repräsentantensystem modulo n oder auch Restsystem modulo n.
Beispiel:
• n = 10: 5 ≡ 55 mod 10
• n = 6: 2 ≡ −10 mod 6
Beispiel: Zwei Tage sind bezüglich des Arbeitslebens und des sonstigen sozialen Lebens
gleichwertig. Das betrifft zum Beispiel Stundenpläne an einer Hochschule und Fahrpläne
bei der Eisenbahn. Numeriert man alle Tag durch – ein typischer Beginn für diese Nu-
merierung ist der 01.01.1900 – so sind in diesem Sinne zwei Tage gleichwertig, wenn sich
ihre Tagnummern um ein Vielfaches von 7 unterscheiden. Bei Tagnummern a und b ist
somit oft die Kongruenz a ≡ b mod 7 von Interesse. Die sieben Wochentage Montag“,
”
Dienstag“, . . ., Sonntag“ stellen die Äquivalenzklassen dar.
” ”
a = {b ∈ Z | a ≡ b mod n}
= {a + s · n | s ∈ Z} (3.128)
186
Die Äquivalenzklassen dieser Äquivalenzrelation werden als Restklassen bezeichnet.
Die Menge der Äquivalenzklassen der Äquivalenzrelation (3.126) wird eine große Rolle
spielen. Daher trifft man die folgende
Definition:
Menge der Restklassen der Rela-
Zn = (3.129)
tion (3.126) bezüglich n
Negatives zu a
−a denn a + −a = a + (−a) = 0 (3.135)
187
Einselement in Zn :
a ist daher zu einer der drei Zahlen 0, 1 oder 2 kongruent modulo 3. Da andererseits
diese drei Zahlen zueinander nicht kongruent modulo 3 sind, bilden sie ein Restsystem
modulo 3, also hat man mit der Bezeichnung (3.129)
ZZ3 = { 0 , 1 , 2 } (3.138)
Damit folgt etwa: Ist a ∈ ZZ nicht durch 3 teilbar, also a = 1 oder a = 2 , so ist
a2 = 1 , d. h. a2 = 1 + s · 3. Damit wurde gezeigt, daß jede Quadratzahl entweder ein
Vielfaches von 3 ist oder mit Rest 1 durch 3 teilbar ist.
ZZ10 = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } (3.140)
Welche der Restklassen aus (3.140) sind Ergebnis der folgenden Rechnungen?
• − 6 = ?
• 7 + 8 = ?
• 3 · 7 = ?
• 2 · 5 = ?
a ∼ r d. h. a ≡ r mod n (3.141)
188
Begründung: Man nimmt eine Teilung mit Rest (siehe (3.14)) vor:
0, 1, . . . , n − 1 (3.143)
Beispiel: Z6 = { 0 , 1 , 2 , 3 , 4 , 5 }
Zusammenfassend gilt:
a = b
⇔ a∼b
(3.145)
⇔ a ≡ b mod n
⇔ n|a − b
Der große Vorteil und Nutzen von Zn ergibt sich durch die folgende Tatsache:
Zn ist ein endlicher kommutativer Ring mit Eins.
Wie im Abschnitt 3.3.2 gesehen, erfolgen die Addition und die Multiplikation in Zn
repräsentantenweise.
Für kleine Werte von n lassen sich die Addition und die Multiplikation durch Ver-
knüpfungstabellen darstellen.25
25
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.
189
Beispiel: Die Verknüpfungstabellen für n = 3 lauten:
Addition:
+ 0 1 2
0 0 1 2
1 1 2 0
2 2 0 1
Multiplikation:
· 0 1 2
0 0 0 0
1 0 1 2
2 0 2 1
1 + · · · + 1} = 0
|1 + 1 + {z
n-mal
Bemerkung: Die übliche Potenzschreibweise wird entsprechend in ZZ n angewandt:
ae = ( a )e = |a · a{z· · · · a}
e-mal
Bezeichnung: Die Zuordnung, die jedem a ∈ ZZ seine Restklasse a zuweist:
a 7→ a (3.146)
heißt Restklassenabbildung.
F
Bemerkung: Neben dem kleinsten nicht negativen Restsystem (3.143) ist zusätzlich das
dem Betrage nach kleinste Restsystem von Bedeutung:
für gerades n : −n n n
2 , − 2 + 1, . . . , 0 . . . , 2 − 1
(3.147)
für ungerades n : −n − 1 n−1
2 , − 2 + 1, . . . , 0 . . . , 2
n−1
Aufgabe: Man zeige, daß es sich bei (3.147) tatsächlich um Restsysteme modulo n han-
delt.
190
Als Anwendung soll ein 16-Bit-Rechenwerk26 betrachtet werden. Werden mit einem 16-
Bit-Rechenwerk zwei zu große“ Zahlen addiert, so kann es zu einem Übertrag über
”
die 16-te Stelle hinauskommen. Dieser höchste Übertrag wird abgeschnitten und damit
beim Ergebnis ignoriert; z. B.:
11100000 00000011 =
ˆ 57347
00100000 00001110 =
ˆ 8206
1 00000000 00010001 (3.148)
↑
fällt weg
Liefert das Rechenwerk damit ein falsches Ergebnis? Nein, das Rechenwerk arbeitet
korrekt. Die Rechnungen verlaufen allerdings nicht in ZZ sondern in dem Restklassenring
Durch Abschneiden der Bits an der 17-ten und noch höheren Stellen erfolgt immer eine
Veränderung um ein Vielfachen27 von 216 . Das bedeutet für das Beispiel (3.148), (3.149)
Intern stellt dabei das Rechenwerk jede Restklasse durch ihren kleinsten nicht negativen
Repräsentanten (siehe (3.143)) dar.
Der Bediener möchte als Ergebnis jedoch keine Restklasse erhalten sondern eine ganze
Zahl. Deshalb stellt sich die Frage, in welcher Weise die intern vom Rechenwerk als
Restklassen behandeltet Werte nach außen hin dargestellt werden. Dazu bestehen für
die Restklassen zwei Deutungsmöglichkeiten:
1. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem kleinsten
nicht negativen Restsystem (3.143):
zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des kleinsten nicht negativen Restsystems (3.143) bewegt. Andernfalls kommt es
durch Überläufe zu Ergebnisverfälschungen. Insbesondere rechnet man dann nur
mit positiven Zahlen zuzüglich der Null.
26
Das Folgende kann sinngemäß auf andere Bitlängen übertragen werden.
27
Nach (3.27) besitzt die Ziffer an der 17-ten Stelle die Wertigkeit 216 , die noch höheren Ziffern
besitzen entsprechend eine noch höhere Wertigkeit der Form 216+t mit t ∈ IN .
191
2. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem betragsmäßig
kleinsten Restsystem (3.147). Für die unteren Restklassen von 0 bis 216 /2 − 1 =
215 − 1 ändert sich nicht, man identifiziert nach wie vor
0 ↔ 0
1 ↔ 1
.. (3.153)
.
215 − 1 ↔ 215 − 1
Die folgenden Restklassen von 215 − 1 bis 216 − 1 werden mit negativen Werten
identifiziert; bei Beachtung von 215 = 216 − 215 bedeutet dieses:
int -Datentypen
zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des Restsystems (3.147) bewegt. Hiermit wird das Rechnen mit negativen Zahlen
innerhalb der gegebenen Grenzen ermöglicht.
Betrachtet man mit dieser Deutung noch einmal die Rechnung (3.149), (3.151), so ist
die Restklasse von 57347 wegen 57347 ≤ 215 = 32768 als
−8189 + 8206 = 17
Beispiel: 3 wird intern durch 3 und −3 durch den zugehörigen positiven Repräsentanten
216 − 3 der Restklasse von −3 dargestellt. Das Rechenwerk liefert dann wie erwartet
3 + (216 − 3) = 216
(3.156)
≡ 0 mod 216 → 0 (geliefertes Ergebnis)
192
Auch die vom Rechenwerk durchgeführte Multiplikation ist die Multiplikation im Rest-
klassenring ZZ n mit n = 216 , denn durch Überläufe kommt es auch hier nur zum
Abschneiden der Bits ab der 17-ten Stelle, was wiederum nur eine Veränderung um ein
Vielfaches von 216 bewirkt.
Beispiel: Die Zahlen −3 und −5 werden intern durch 216 − 3 und 216 − 5 dargestellt. Die
Multiplikation erfolgt erwartungsgemäß:
3 · (216 − 5) = 3 · 216 − 15
(3.158)
≡ −15 mod 216 → −15 (geliefertes Ergebnis)
Beispiel: In dem folgenden C-Programm werden intern als 16-stellige Dualzahlen dar-
gestellte Zahlen einmal als vorzeichenlose Werte und einmal als Werte mit Vorzeichen
ausgegeben:
#include <stdio.h>
int main(){
unsigned short int a=1;
unsigned short int b=65533; // = 2^(16)-3
printf(" %hu + %hu = %hu\n",a,b, a+b);
printf(" %hd + %hd = %hd\n",a,b, a+b);
Der mit (*)“ gekennzeichnete Wert ist nicht das Ergebnis einer korrekten Ganzzahlad-
”
dition. Faßt man ihn jedoch als Ergebnis einer Addition in ZZn mit n = 216 auf, so ist er
korrekt.
Bemerkung: Die Darstellung der negativen Zahlen durch (3.154) besitzt den Vorteil, daß
jede negative Zahl intern durch eine Bitkette dargestellt wird, an deren höchsten Stelle
ein 1 steht. Da umgekehrt nach (3.153) bei den positiven Zahlen und der Null dieses Bit
Null ist, wirkt dieses Bit wie ein Vorzeichenbit.
193
3.3.2.3 Die Einheitengruppe
Der Restklassenring ZZn besitzt mit 1 , der Restklasse von 1 ein neutrales Element der
Multiplikation. Das wirft die Frage auf, ob ein Element a ∈ ZZ n \ { 0 } ein inverses
Element bezüglich der Multiplikation besitzt oder nicht.
Daß beide Fälle auftreten können, zweigt das folgende
Zn = { 0 , 1 , . . . , 9 }
7 · 3 = 7·3
= 21
⇔ 7 · 3 = 1 + 2 · 10 (3.159)
⇔ 7·3 ≡ 1 mod 10
⇔ 7·3 = 1
1 = a · 5 (3.160)
1 · 2 = a · 5 · 2
⇔ 2 = a · 10 = a · 0 = 0 (3.161)
⇔ 2 = 0
Das ist ein Widerspruch, denn offensichtlich ist 2 kein Vielfaches von 10 und daher
2 6= 0 .
Angeregt durch dieses Beispiel trifft man die folgende, hier allgemein gefaßte
Definition: Für einen Ring R mit Eins setzt man
und nennt R∗ die Einheitengruppe von R. Die Elemente von R∗ heißen Einheiten.28
28
Man beachte, daß bei dieser Definition nicht verlangt wird, daß der Ring kommutativ ist. Das
Vorhandensein der Eins ist natürlich notwendig.
194
Wie das Beispiel von eben gezeigt hat, ist
Es folgen noch einige Beispiele für Einheitengruppen bei weiteren Ringen mit Eins:
• Z∗ = {±1}
• R∗ = R \ {0}
• Menge der reellen umkehrbaren Matrizen Mn,n (IR)∗ = GL(n, IR) (siehe (3.100))
Wann ist eine Restklasse a ∈ ZZn invertierbar? Auskunft gibt der folgende
Satz: Sei a ∈ ZZn . Dann gilt
Beweis: a ist genau dann invertierbar, wenn es ein u mit a · u = 1 gibt; damit zeigt
man:
a·u = 1
⇔ a·u ∼ 1
⇔ a·u = 1+k·n
⇔ 1 = a·u−k·n
⇔ 1 = a · u + (−k) · n Man beachte: Dieses ist genau die
ggT-Darstellung von a und n.
⇔ ggT(a, n) = 1
qed.
Wie berechnet man für eine invertierbare Restklasse das inverse Element? Hierzu steht
eine sehr gute Berechnungsmethode zur Verfügung. Diese Berechnungsmethode spielt
eine wichtige Rolle bei vielen Anwendungen.
Berechnung der inversen Restklasse: Gegeben sei die Restklasse a ∈ ZZn mit a ∈ ZZ .
1. Zunächst wendet man den erweiterten Euklidischen Algorithmus (siehe Seite 3.48)
auf a und n an und erhält damit die ggT-Darstellung
(siehe (3.47)). Ist in (3.164) der größte gemeinsame Teiler größer als Eins, so
ist a nach (3.163) nicht invertierbar. Andernfalls kann man mit dem 2. Schritt
fortfahren.
2. Im Falle von ggT(a, n) = 1 weiß man, daß a invertierbar ist, und der Koeffizient
u in (3.164) liefert die inverse Restklasse:
−1
a = u mit u aus (3.164) (3.165)
195
Begründung von (3.165): Nach Annahme hat man in (3.164)
u·a + v·n = 1
⇒ u·a = 1 − v·n
⇒ u·a ≡ 1 mod n
⇒ u·a = u · a = 1
−1
⇒ u = a
qed.
ZZ∗20 =
1 , 3 , 7 , 9 , 11 , 13 , 17 , 19 (3.166)
denn dieses sind offensichtlich genau die Restklassen zu teilerfremden Resten modulo
20. Mit dem erweiterten euklidischen Algorithmus – oder falls möglich auf einfacherem
Wege – erhält man die folgenden inversen Restklassen:
−1
1 = 1 klar!
−1
3 = 7 wegen 7 · 3 + (−1) · 20 = 1
−1 −1
7 = 3 da schon 3 = 7 bekannt
−1
9 = 9 wegen 9 · 9 + (−4) · 20 = 1
−1
11 = 11 wegen (−9) · 11 + 5 · 20 = 1
und −9 = 11 , denn 11 = −9 + 20 (3.167)
−1
13 = 17 wegen (−3) · 13 + 2 · 20 = 1
und −3 = 17 , denn 17 = −3 + 20
−1 −1
17 = 13 da schon 13 = 17 bekannt
−1
19 = 19 denn wegen −1 = 19 − 20 ist 19 = −1
und zusätzlich ist −1 · −1 = (−1) · (−1) = 1
Aufgabe: In dem folgen C-Programm liefern zwei Produkte ganzer Zahlen den Wert
eins, obwohl keiner der vorkommenden Faktoren ±1 ist. Wie ist das zu erklären?
#include <stdio.h>
int main(){
unsigned short int a= 2013;
unsigned short int b=34933;
printf("%hu * %hu = %hu\n",a,b,a*b);
printf("%hd * %hd = %hd\n",a,b,a*b);
return 0;
}
---------------------------------------
196
Ausgabe :
2013 * 34933 = 1
2013 * -30603 = 1
Es gilt folgender wichtiger Sachverhalt, der auch wieder für allgemeine Ringe mit Eins
formuliert wird:
Satz: Die Einheitengruppe R∗ eines Ringe R mit Eins ist eine Gruppe.
Beweis: Zum Nachweis der Tatsache, daß die Menge der invertierbaren Elemente eines
kommutativen Ringes mit Eins eine Gruppe bilden, ist nur noch die Abgeschlossenheit
bezüglich der Verknüpfung ·“ zu zeigen. Seien dazu
”
a, b ∈ R∗
(a · b) ∈ R∗
d. h. daß auch
(a · b)
invertierbar ist. Dazu setzt man:
Dann gilt:
Die übrigen Gruppenaxiome (siehe Seite 175) sind bereits aufgrund der Ringaxiome
(siehe Seite 176) erfüllt. qed.
∗
Zusatz 1: Ist der Ring R kommutativ, so ist auch seine Einheitengruppe R kommutativ.
Zusatz 2: Ist der Ring R eine endliche Menge, so ist seine Einheitengruppe R∗ eine
endliche Gruppe.
Aus dem letzten Satz und seinen beiden Folgerungen ergibt sich der wichtige Sachverhalt:
Diese endliche Gruppe besitzt in der Kryptologie eines sehr große Bedeutung.
197
Eine bedeutende Rolle spielte bei den endlichen kommutativen Gruppen die Gruppen-
ordnung (3.104). Da die Ordnung der Gruppe ZZ∗n von n abhängt, führt man dafür eine
besondere Bezeichnung ein, man setzt:
Die Funktion in (3.169) heißt Eulersche Phi-Funktion. Es handelt sich um eine Funk-
tion, die für alle natürlichen Zahlen, die größer als eins sind, definiert ist:
ϕ : {n ∈ IN | n > 1} 7→ IN (3.170)
Beispiel:
ϕ(2)= 1 : vorhanden ist nur die invertierbare Restklasse 1
ϕ(10)= 4 : vorhanden sind die invertierbaren Restklassen 1 , 3 , 7 , 9
ϕ(11)=10 : vorhanden sind die invertierbaren Restklassen 1 , 2 , 3 , . . . , 9 , 10
Potenziert man ein Element einer endlichen kommutativen Gruppe mit der Gruppen-
ordnung, so erhält man nach (3.106) das Einselement der Gruppe. Wegen (3.169) liefert
das den wichtigen
Satz von Euler: Für a ∈ Z∗n gilt
a ϕ(n) = 1 (3.171)
Bemerkung Ist n eine Primzahl, so werden die Gleichungen (3.171) bzw. (3.172) als
kleiner Fermatscher Satz bezeichnet.
a.) n = p (Primzahl)
29
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.
198
Beispiele für Z∗n mit n = p oder n = p · q :
Für n = 12 hat man Z∗n = { 1 , 5 , 7 , 11 }; diese Gruppe besitzt die Multiplikationsta-
belle:
· 1 5 7 11
1 1 5 7 11
5 5 1 11 4
7 7 11 1 5
11 11 7 5 1
Man beachte: Der Ring Z12 enthält Nullteiler : Es ist 3 6= 0 und auch 4 6= 0; andererseits
ist jedoch 3 · 4 = 12 = 0.
Für n = 5 hat man Z∗n = { 1 , 2 , 3 , 4 }; diese Gruppe besitzt die Multiplikationstabelle:
· 1 2 3 4
1 1 2 3 4
2 2 4 1 3
3 3 1 4 2
4 4 3 2 1
1, 2, · · · , p − 1
alle teilerfremd zu p. Nach (3.163) folgt daraus, daß jede der Restklassen
1 , 2 , ..., p − 1
Da somit außer der der Null alle Elemente invertierbar sind, erhält man sofort
ϕ(p) = p − 1 (3.174)
Multipliziert man beide Seiten von (3.175) mit der Restklasse a , so erhält man eine
Gleichung, die – wie man schnell nachprüft – zusätzlich für die Restklasse 0 gültig ist:
199
Ebenso folgt aus (3.173), daß Zp sogar ein Körper ist (siehe Seite 177). Insbesondere
hat man damit
Z∗p = Zp \ { 0 } (3.177)
Fp (3.178)
Mit dem Körper Fp kann weitestgehend so verfahren werden, wie man es von den be-
kannten Körpern Q und R gewohnt ist. Das betrifft vor allem
• Behandlung linearer Gleichungssysteme
• Grundtatsachen über Polynome
• Nullteilerfreiheit
Allgemein kann gesagt werden, daß dieses alles betrifft, was unmittelbar auf den Grund-
rechenarten beruht, hingegen nicht die auf zusätzlichen Besonderheiten der reellen Zah-
len beruhende Differential- und Integralrechnung.
ˆ {w, f },
Z2 = ˆ ⊕,
+= ·=
ˆ ∧
und führt die Behandlung logischer Ausdrücke auf Rechnungen im Körper Z2 zurück.
Aufgabe: Warum ist 1010 − 1 ist durch 11 teilbar?
200
mit bekanntem l ∈ IN aber unbekanntem x gegeben, so ist die Restklasse x zu be-
rechnen. In vielen Fällen ist das leicht möglich. Genauer gilt:
Für l ∈ IN ist die l-te stets Wurzel
⇔ ggT(l, p − 1) = 1 (3.180)
ziehbar
Begründung und Vorgehensweise: Gegeben ist y = x l ; zu berechnen ist x . Man be-
rechne dazu mit dem erweiterten euklidischen Algorithmus (siehe (3.48))
u, v ∈ Z mit 1 = u · l + v · (p − 1)
x l )u · |x v·(p−1)
y u = (|{z} {z } denn x p−1 = 1 , siehe (3.175)
y =1
1
z }| {
= x u · l + v · (p − 1) = x1 = x
qed.
1 = 3 · 7 − 2 · |{z}
10
p−1
3
⇒ 7 = 7 · 7 · 7 = 7 · 49 = 7 · 5 = 35 = 2
Bemerkung: Diese Art des Wurzelziehen kommt in leicht abgewandelter Fassung auch
beim RSA-Verfahren (siehe Seite 181) vor und bildet dabei eine wichtige Grundlage.
F
Beim Ziehen der l-ten Wurzel wurde wegen der Bedingung ggT(l, p − 1) = 1 (siehe
(3.180)) der Fall einer Quadratwurzel nicht erfaßt. Da dieser jedoch bei mehreren An-
wendungen31 bedeutsam ist, soll hier auf das Ziehen einer Quadratwurzel in Z∗p kurz
eingegangen werden. Vorausgesetzt wird für das folgende, daß p Primzahl mit p 6= 2
ist.32
Von einer Restklasse a ∈ Z∗p existiert genau dann eine Quadratwurzel, wenn a ein
Quadrat in Z∗p ist. Das bedeutet,
31
u. a. bei gewissen Primzahltest, mit Erweiterung bei einem sogenannten Zero-Knowledge-Verfahren,
eine Anwendung folgt in Abschnitt 3.3.2.7.2
32
Der Fall p = 2 ist hier uninteressant; warum?
201
Als Beispiel soll die Multiplikationstabelle des Restklassenkörpers Z7 betrachtet werden.
Die Quadrate bzw. quadratischen Reste befinden sich auf den Diagonalen. Die von Null
verschiedenen Quadrate wurden unterstrichen. Wie üblich werden die Restklassen hier
wieder durch ihre kleinsten nicht negativen Repräsentanten dargestellt:
∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von Z7
Um die Quadrate in Zp genauer zu untersuchen, beachtet man zunächst, daß es sich bei
diesem Restklassenring um einen Körper handelt. Bezüglich der Quadratwurzeln liegen
dieselben Verhältnisse wie bei den bekannten Körpern Q| und IR vor. Sei etwa
a = c 2 ∈ Zp (3.182)
ein Quadrat mit der ungeraden Primzahl p, dann hat die Gleichung
X2 − a = 0 (3.183)
für a 6= 0 genau zwei Lösungen, denn sei etwa X = u eine Lösung von (3.183), dann
gilt:
0 = u2 − a = u2 − c2
= (u − c)·(u + c)
⇔ p | (u + c) · (u − c)
(3.184)
⇔ p | (u − c) oder p | (u + c) Denn p ist eine Primzahl.
(Siehe dazu (3.63).)
⇔ u − c = 0 oder u + c = 0
⇔ u = c oder u = −c
Die beiden einzigen vorhandenen Lösungen unterscheiden sich genau um das Vorzei-
chen.33
33
Alternativ hätte man in der Rechnung (3.182) die Nullteilerfreiheit des Körpers Zp ausnutzen
können: Wegen 0 = ( u − c ) · ( u + c ) muß bereits mindestens einer dieser beiden Faktoren null sein.
202
Bemerkung: Diese Tatsache, daß eine Quadratzahl höchsten zwei Quadratwurzeln besitzt
und diese sich nur um den Faktor −1 unterscheiden, ist gleicher Weise für die bekannten
Körper Q| und IR sowie für alle anderen Körper gültig. Die Rechnung (3.183) verwendet
nur die Körperaxiome (siehe Seite 177).
Wie gesehen, ist nicht jede Restklasse a ∈ Z∗p ein quadratischer Rest. Eine genauerer
Aussage liefert der folgende
Satz: Sei p eine ungerade Primzahl; dann gilt
(1) Es gibt genau (p − 1)/2 quadratische Reste in Z∗p .
(2) a ∈ Z∗p ist genau dann ein quadratischer Rest in Z∗p , falls
p−1
a 2 = 1 (3.185)
gilt.
Beweis:
zu (1): Offenbar erhält man alle quadratischen Reste in Z∗p , wenn die Elemente aus Z∗p
quadriert:
2 2 2 2
1 , 2 , 3 , . . . , (p − 1) , (3.186)
Hierbei handelt es sich um p−1 Quadrate, die nicht alle verschieden sein müssen.
Wann sind zwei der dieser quadrierten Werte gleich?
Wie in (3.184) gesehen, gilt
u2 = c2 ⇔ u = ±c (3.187)
Zwei Werte in (3.186) sind somit genau gleich, falls sie sich um das Vorzeichen
unterscheiden.
Das heißt wiederum, daß von den (p − 1) Werten in (3.186) jeweils zwei gleich
sind. In (3.186) sind somit (p − 1)/2 unterschiedliche Werte vorhanden. Dieses
sind genau die Quadrate in Z∗p , deren Anzahl damit wie behauptet (p − 1)/2
beträgt.
zu (2): Angenommen a = c 2 ist ein quadratischer Rest; dann rechnet man nach:
p−1 p−1
a 2 = ( c 2) 2
= c p−1
(3.188)
= 1 wegen (3.171) (kleiner Fermatscher Satz)
Für a ∈ Z∗p gelte jetzt umgekehrt
p−1
a 2 = 1 (3.189)
Zu zeigen bleibt: Dann ist a ein quadratischer Rest. Wegen (3.189) ist a eine
Nullstelle des Polynoms
p−1
P(X) = X 2 − 1 (3.190)
Wie aber die Rechnung in (3.188) gezeigt hat, ist jeder der (p − 1)/2 quadra-
tischen Rest eine Nullstelle von P(X). Andererseits besitzt P(X) als Polynom
(p−1)/2-ten Grades über dem Körper Zp höchstens (p−1)/2 Nullstellen. Damit
folgt:
203
• Die (p − 1)/2 quadratischen Reste sind genau alle Nullstellen von P(X).
• Ist P( a ) = 0 , so muß demgemäß a ein quadratischer Rest sein.
qed.
Da das Quadrat der linken Seite von (3.191) somit 1 ist, muß die linke Seite nach
(3.184) einen der beiden Werte 1 oder −1 besitzen. Da hier nach Voraussetzung a
kein quadratischer Rest sein soll, bleibt nur der Wert −1 .
Wie berechnet man praktisch für einen quadratischen Rest a ∈ Z∗p eine Quadratwurzel?
Hier soll dieses nur für einen Spezialfall durchgeführt werden:
Satz: Sei p eine mit Rest 3 durch 4 teilbare Primzahl, d. h. eine Primzahl der Gestalt
u2 = a (3.196)
und außerdem: u = ±c (3.197)
p+1
2 p+1
2
= c 2· 4 = c 2 = c p+1
p−1 2
= |c{z }· c (wegen 3.175)
1
= c2 = a (wegen 3.194)
204
Beispiel: Sei p = 23. Dann ist 2 ein quadratischer Rest; es ist nämlich
2
±5 = 25 = 2 + 23 = 2
Das Potenzieren von 2 mit (23 + 1)/4 = 6 liefert nun eine der beiden Quadratwurzeln:
6
2 = 64 = 64 − 3 · 23 = − 5
Bemerkung: Da, wie gesehen, das Ziehen der Quadratwurzel für quadratische Reste in
Z∗p für p ≡ 3 mod 4 recht einfach ist, beschränkt man bei Anwendungen oft auf solche
Primzahlen. Für die übrigen ungeraden Primzahlen ist ein zu (3.193) entsprechendes, al-
lerdings erheblich komplizierteres Verfahren vorhanden, der Tonelli-Shanks-Algorithmus
(siehe etwas [10]).
F
Nicht bekannt ist ein effektiver Algorithmus zum Berechnen des sogenannten diskreten
Logarithmus. Beim diskreten Logarithmus ist ein Potenzwert
y = x l ∈ Z∗p (3.198)
gegeben, wobei die Basis x bekannt, der Exponenten aber l unbekannt ist. Zu berechnen
ist nun bei Kenntnis von y und x der Exponent l ∈ N.
Dieses ist die Grundlage des Schlüsselaustauschverfahrens von Diffie-Hellman.
3.3.2.5 Anwendungen
3.3.2.5.1 Schlüsselaustausch nach Diffie-Hellman
Die Idee des Schlüsselaustauschverfahrens von Diffie-Hellman wurde bereits auf Seite 146
erläutert. Hier kann jetzt das Schema von Diffie-Hellman lautet in seiner endgültigen,
verwendungsfähigen Form dargestellt werden:
1. p ist eine fest vorgegebene oder eine fest gewählte große Primzahl (p > 2300 ); dazu
wird weiter ein a ∈ N mit 1 < a < p gewählt. p und a werden veröffentlicht.
A: l∈N
B: k∈N
3. A berechnet in Zp :
y1 = a l
und sendet y1 an B.
B berechnet in Zp :
y2 = a k
und sendet y2 an A.
34
Gerne auch als Alice und Bob bezeichnet.
205
4. A berechnet aus seinem empfangenen Wert y2
Y = y2 l = ( a k )l = a k·l
y = y1 k = ( a l )k = a k·l
Damit ist y , d. h. der kleinste positive Rest von y mod p, der gemeinsame, aber
sonst geheime Schlüssel von A und B.
Bemerkungen zum Diffie-Hellman-Schema:
• Das Patent 1997 ist abgelaufen.
3.3.2.5.2 ISBN-Prüfziffer
Jedes Buch besitzt eine sogenannte internationale Standardbuchnummer (ISBN), die
die Auflage des Buches mit allen zugehörigen Daten (Herkunftsland, Verlag usw.) ein-
deutig kennzeichnet. Die jetzt noch gültige 10-stellige ISBN
a1 a2 a3 · · · a10 (3.199)
sowie an der zehnten Stelle eine Prüfziffer a10 . Die Prüfziffer wird aus den Datenbits so
berechnet, daß stets die Kongruenz
erfüllt ist. Verwendet wird die Primzahl p = 11. Das bietet mehrere Vorteile:
• Alle Rechnungen können in dem Körper Z11 durchgeführt werden. Die Nulltei-
lerfreiheit sowie die Invertierbarkeit aller Restklassen a 6= 0 kann ausgenutzt
werden.
1 · a1 + 2 · a2 + . . . + 9 · a9 + 10 · a10 = 0 (3.202)
206
Die Gleichung (3.202) liefert sofort die Berechnungsvorschrift für die Bestimmung der
Prüfziffer aus den Datenziffern; man löst die Gleichung (3.202) nach a10 auf:
1 · a1 + 2 · a2 + . . . + 9 · a9 = − 10 · a10
= a10 (3.203)
denn : − 10 = 11 − 10 = 1
In der ISBN wird für die Restklasse a10 wieder der kleinste nicht negative Repräsentant
modulo 11 genommen (siehe (3.143)). Da aber die Rechnung (3.203) die Restklasse 10
ergeben könnte, reichen die dezimalen Ziffern hierfür nicht aus. Man verwendet daher
die zusätzliche Ziffer X“ (die römische Ziffer mit dem Wert 10). An der letzten Stelle
”
einer ISBN kann somit neben den dezimalen Ziffern auch ein X erscheinen.
Begründung: Zu (a): Angenommen, an der j-ten Stelle steht anstatt der korrekten (und
unbekannten) Ziffer aj die falsche Ziffer bj . Zum Prüfen der Korrektheit berechnet man
in Z11 die gewichtete Summe (3.202) und verwendet die vorliegende Ziffer bj . Diese
Rechnung führt zu dem folgenden Ergebnis:
s = 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10 (3.204)
= 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10
= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)
= j · b j − aj (3.205)
6= 0 für bj 6= aj
Damit wurde festgestellt, daß die Gleichung (3.202) nicht erfüllt ist. Der Einzelfehler
wurde bemerkt.
Zu (b): Ist die Position j des Einzelfehlers bekannt, so kann aus der gewichteten Summe
(3.204) sowie der vorliegenden falschen Ziffer bj die korrekte Ziffer aj berechnet werden;
indem man die Gleichung (3.205) nach aj auflöst:
−1
aj = bj − j · s (3.206)
Zu berechnen ist dabei die inverse Restklasse von j . Das erfolgt dann wie üblich mit
dem erweiterten euklidischen Algorithmus (siehe (3.164)).
207
Zu (c): Angenommen, die i-te und die j-te Ziffer seien vertauscht. Dann liefert die
Berechnung der gewichteten Summe (3.204) mit den beiden vertauschten Ziffern:
s = 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10
= 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10
= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)
= i · ( aj − ai ) + j · ( ai − aj )
= j − i · ( ai − aj ) (3.207)
6= 0 für ai 6= aj , i 6= j
Die geraden Positionen werden mit 3 und die ungeraden Positionen werden mit 1 ge-
wichtet. Einzelfehler können bemerkt und bei bekannter Position korrigiert werden.
Aufgabe: Man begründe dieses.
Aufgabe: In welchen Fällen kann eine Vertauschung zweier Ziffern bemerkt werden, in
welchen Fällen bleibt sie unentdeckt?
Bemerkung: Weitere Codes mit ähnlicher Bedingung für die Prüfziffer sind vorhanden.
Zum Beispiel verwenden einige Banken und Kreditkartenunternehmen bei ihren Konto-
nummern ein Verfahren wie bei der ISBN-13, wobei anstelle des Gewichtungsfaktors 3
der Faktor 2 genommen wird.
Aufgabe: Was sind Vor- und Nachteil des des Gewichtungsfaktors 2 gegenüber dem des
Gewichtungsfaktors 3?
208
aber je Spieltag immer nur eine Mannschaft spielfrei sein und keine Mannschaft während
der Runde zweimal oder noch häufiger spielfrei sein.
Man identifiziert die n Mannschaften35 mit den n Restklassen aus Zn :
0 , 1 , ..., n − 1
Geplant werden n Spieltage; die Spieltage werden ebenfalls mit den n Restklassen aus
Zn identifiziert.
An dem Spieltag a ∈ Zn liefert nun die folgende einfache Funktion den Gegner der
Mannschaft x ∈ Zn :
Ga ( x ) = a − x (3.209)
• Die Mannschaft x hat jede andere Mannschaft y einmal als Gegner. Setzt man
nämlich a = x + y , so liefert (3.209) für den Spieltag a :
Ga ( x ) = a − x = x + y − x = y
Ga ( y ) = a − y = a − (a − x)
= x
• Am Spieltag a bleibt genau eine Mannschaft spielfrei. Die Funktion (3.209) über-
führt nämlich genau eine Restklasse x0 in sich selber:
x0 = G a ( x0 )
⇔ x0 = a − x0
⇔ 2 · x0 = a
−1
⇔ x0 = 2 · a (3.210)
Man beachte, daß n ungerade und damit
die Restklasse 2 in Zn invertierbar ist.
Die Restklasse x0 mit G a ( x0 ) = x0 ist somit bei jedem Spieltag a durch
(3.210) eindeutig bestimmt. Alle anderen haben den durch (3.209) wohlbestimmten
Gegner G a ( x ). Nur x0 ist am Spieltag a spielfrei.
35
n braucht hier keine Primzahl zu sein; zunächst wird nur vorausgesetzt, daß n ungerade ist.
209
Nachdem der Spielplan für ungerades n aufgestellt wurde, fehlt jetzt noch ein Spielplan
für eine gerade Anzahl an Mannschaften. Diesen führt man aber auf einfache Weise auf
den eben behandelten Fall einer ungeraden Anzahl zurück.
Sei jetzt n gerade und n ≥ 4. Dann läßt man zunächst die letzte Mannschaft weg und
stellt wie eben beschrieben den Spielplan für n0 = n − 1 Mannschaften auf. Die bei
diesem Plan an jeweils einem Spieltag spielfrei bleibende Mannschaft läßt man gegen
die zunächst weggelassene letzte Mannschaft spielen.
Beispiel: Ein Spielplan für n = 10 Mannschaft wird aufgestellt. Wie beschrieben, werden
zunächst nur die ersten n0 = 9 Mannschaften beachtet. Diese und die Spieltage werden
mit den Restklassen 0 , . . . 8 ∈ Z9 identifiziert. Die letzte, zunächst nicht beachtete
Mannschaft wird als “9“ bezeichnet:
1. Spieltag 0 :
G0 0 = 0 − 0 = 0 =⇒ 0 spielt gegen 9
G0 1 = 0 − 1 = 8 =⇒ 1 spielt gegen 8
G0 2 = 0 − 2 = 7 =⇒ 2 spielt gegen 7
G0 3 = 0 − 3 = 6 =⇒ 3 spielt gegen 6
G0 4 = 0 − 4 = 5 =⇒ 4 spielt gegen 5
2. Spieltag 1 :
G1 0 = 1 − 0 = 1 =⇒ 0 spielt gegen 1
G1 2 = 1 − 2 = 8 =⇒ 2 spielt gegen 8
G1 3 = 1 − 3 = 7 =⇒ 3 spielt gegen 7
G1 4 = 1 − 4 = 6 =⇒ 4 spielt gegen 6
G1 5 = 1 − 5 = 5 =⇒ 5 spielt gegen 9
3. Spieltag 2 :
G2 0 = 2 − 0 = 2 =⇒ 0 spielt gegen 2
G2 1 = 2 − 1 = 1 =⇒ 1 spielt gegen 9
G2 3 = 2 − 3 = 8 =⇒ 3 spielt gegen 8
G2 4 = 2 − 4 = 7 =⇒ 4 spielt gegen 7
G2 5 = 2 − 5 = 6 =⇒ 5 spielt gegen 6
4. Spieltag 3 :
G3 0 = 3 − 0 = 3 =⇒ 0 spielt gegen 3
G3 1 = 3 − 1 = 2 =⇒ 1 spielt gegen 2
G3 4 = 3 − 4 = 8 =⇒ 4 spielt gegen 8
G3 5 = 3 − 5 = 7 =⇒ 5 spielt gegen 7
G3 6 = 3 − 6 = 6 =⇒ 6 spielt gegen 9
5. Spieltag 4 :
G4 0 = 4 − 0 = 4 =⇒ 0 spielt gegen 4
G4 1 = 4 − 1 = 3 =⇒ 1 spielt gegen 3
G4 2 = 4 − 2 = 2 =⇒ 2 spielt gegen 9
G4 5 = 4 − 5 = 8 =⇒ 5 spielt gegen 8
G4 6 = 4 − 6 = 7 =⇒ 6 spielt gegen 7
210
6. Spieltag 5 :
G5 0 = 5 − 0 = 5 =⇒ 0 spielt gegen 5
G5 1 = 5 − 1 = 4 =⇒ 1 spielt gegen 4
G5 2 = 5 − 2 = 3 =⇒ 2 spielt gegen 3
G5 6 = 5 − 6 = 8 =⇒ 6 spielt gegen 8
G5 7 = 5 − 7 = 7 =⇒ 7 spielt gegen 9
7. Spieltag 6 :
G6 0 = 6 − 0 = 6 =⇒ 0 spielt gegen 6
G6 1 = 6 − 1 = 5 =⇒ 1 spielt gegen 5
G6 2 = 6 − 2 = 4 =⇒ 2 spielt gegen 4
G6 3 = 6 − 3 = 3 =⇒ 3 spielt gegen 9
G6 7 = 6 − 7 = 8 =⇒ 7 spielt gegen 8
8. Spieltag 7 :
G7 0 = 7 − 0 = 7 =⇒ 0 spielt gegen 7
G7 1 = 7 − 1 = 6 =⇒ 1 spielt gegen 6
G7 2 = 7 − 2 = 5 =⇒ 2 spielt gegen 5
G7 3 = 7 − 3 = 4 =⇒ 3 spielt gegen 4
G7 8 = 7 − 8 = 8 =⇒ 7 spielt gegen 9
9. Spieltag 8 :
G8 0 = 8 − 0 = 8 =⇒ 0 spielt gegen 8
G8 1 = 8 − 1 = 7 =⇒ 1 spielt gegen 7
G8 2 = 8 − 2 = 6 =⇒ 2 spielt gegen 6
G8 3 = 8 − 3 = 5 =⇒ 3 spielt gegen 5
G8 4 = 8 − 4 = 4 =⇒ 4 spielt gegen 9
211
und damit für r ∈ Z∗n nach dem Satz auf Seite 198
• 0 · q, 1 · q, 2 · q, . . . , (p − 1) · q
Beachtet man, daß 0 = 0 · p = 0 · q hier doppelt vorkommt, so erhält man genau
q+p−1
Zahlen r mit 0 ≤ r < n, die nicht zu n = p · q teilerfremd sind. Die restlichen Zahlen r
mit 0 ≤ r < n sind gerade die zu n = p · q teilerfremden und entsprechen den Elementen
in Z∗n ; ihre Anzahl beträgt damit (wegen n = p · q = #Zn )
p · q − (q + p − 1) = (p − 1) · (q − 1)
ϕ(p · q) = (p − 1) · (q − 1) (3.214)
Insbesondere hat man damit und aufgrund von (3.171) für r ∈ Z∗n mit n = p · q die
wichtige Gleichung
r (p−1)·(q−1) = 1 (3.215)
hergeleitet.
F
Die Gleichung (3.215) ist für gewisse Anwendungen schon ausreichend. Für andere An-
wendungen ist aber eine genaue Kenntnis der Struktur der Gruppe Z∗n erforderlich. Um
die Struktur der Gruppe Z∗n für den Fall n = p · q aufzuschlüsseln bedient man sich eines
Tricks“: Man nimmt eine Rückführung von Zn auf die beiden Ringe Zp und Zq vor.
”
Man betrachtet die Menge
R = Zp × Zq = {( a , b ) | a ∈ Zp , b ∈ Zq } (3.216)
Mit der komponentenweisen Addition und Multiplikation wird diese Menge zu einem
kommutativen Ring mit
Nullelement (0, 0)
(3.217)
Einselement (1, 1)
212
Für die Inversenbildung bezüglich “·“ gilt:
1. wohldefiniert
f( a1 + a2 ) = f( a1 ) + f( a2 )
f( a1 · a2 ) = f( a1 ) · f( a2 )
(3.222)
Insbesondere gilt: f( 0 ) = ( 0 , 0 )
f( 1 ) = ( 1 , 1 )
Begründungen:
1. Wohldefiniert: Zu zeigen ist, daß der wie oben definiert Funktionswert f( a ) nicht
von der speziellen Repräsentanten a der Restklasse a abhängt.
Sei daher
a = b ⇔ n | (a − b) (beachte n = p · q)
⇒ p | (a − b) und q | (a − b)
⇒ a ≡ b mod p und a ≡ b mod q
⇒ (a, a)=(b, b)
213
Aufgabe: Vor dem Weiterlesen versuche man, dieses selber zu beweisen.
f( a ) = f( b ) ⇔ (a, a) = (b, b)
⇔ a ≡ b mod p, a ≡ b mod q
⇔ p|(a − b) und q|(a − b)
⇔ n|(a − b) wegen n = p · q mit p 6= q prim (siehe (3.57))
⇔ a ≡ b mod n ⇔ a = b
Nachzuweisen beleibt noch die Surjektivität. Hier ist zu zeigen, daß es zu jedem
Paar ( a , b ) ∈ Zp × Zq ein c ∈ Zn mit
f( c ) = ( c , c ) = ( a , b )
⇔ c ≡ a mod p und c ≡ b mod q
3. Vertauschbarkeit mit den Verknüpfungen (3.222): Dieses wird als Aufgabe über-
lassen.
Damit ist gezeigt, daß die beiden Ringe Zn und Zp × Zq strukturell gleich sind, d. h. ihr
Verhalten beim Addieren und Multiplizieren ist völlig identisch. Das heißt wiederum,
daß alle Rechnungen in Zn auf Rechnung in Zp × Zq zurückgeführt werden können.
Insbesondere folgt dann der wichtige Sachverhalt, daß die Einheitengruppen
einander entsprechen, d.h. durch die durch (3.221) definierte Funktion f( c ) umkehrbar
eindeutig ineinander überführt werden.
Begründung: Sei c ∈ Z∗n , zu ist zeigen nun: f( c ) ∈ Z∗p × Z∗q . Sei dazu c 1 ∈ Z∗n mit
c 1 · c = 1 . Seien weiter
f( c ) = ( a , b )
f( c 1 ) = ( a 1 , b 1 )
Dann folgt unter Ausnutzung der Eigenschaften der Funktion f (siehe Seite 213):
( 1 , 1 ) = f( 1 ) = f( c · c 1 ) = f( c ) · f( c 1 )
(3.223)
= ( a , b ) · ( a 1, b 1) = ( a · a 1, b · b 1)
1 = a · a1 und 1 = b · b1
gilt37
c = f −1 (( a , b )) ∈ Z∗n = Z∗pq
37
da f( c ), wie gezeigt, bijektiv ist, existiert die Umkehrfunktion f −1
214
zeigt man genauso38 . qed.
Insbesondere sind damit die Einheitengruppen Z∗pq und Z∗p × Z∗q einander strukturell
gleich, man schreibt dafür
Z∗p·q ∼
= Z∗p × Z∗q (3.224)
Üblicherweise identifiziert man sogar beide Seiten miteinander, d. h. man betrachtet sie
als gleich.
Als Anwendung von (3.224) ergibt sich, daß beide Seiten von (3.224) gleich viele Ele-
mente besitzen müssen; man gewinnt damit noch einmal das Resultat von (3.214):
ϕ(p · q) = #Z∗p·q
= #(Z∗p × Z∗q )
= #Z∗p · #Z∗q
= (p − 1) · (q − 1)
Als Übung zeige man unter der Verwendung von (3.224), daß Z∗pq (leider) nicht zyklisch
ist.
Beispiel: In der folgenden Tabelle wird die Funktion f (siehe (3.221)) für die beiden
Primzahlen p = 11 und q = 7 dargestellt. In der ersten Spalte sind die Restklassen von
Z11 und in der ersten Zeile die Restklassen von Z7 aufgeführt. Die übrigen Einträge der
Tabelle enthalten die jeweils bezüglich der Funktion f entsprechende Restklasse aus Z77 .
So erkennt man etwa, daß zu dem Restklassenpaar ( 7 , 2 ) ∈ Z11 × Z7 die Restklassen
51 ∈ Z77 gehört. (Aufgabe: Man bestätige dieses durch nachrechnen.)
ZZ7
0 1 2 3 4 5 6
0 0 22 44 66 11 33 55
1 56 1 23 45 67 12 34
2 35 57 2 24 46 68 13
3 14 36 58 3 25 47 69
4 70 15 37 59 4 26 48
ZZ11 5 49 71 16 38 60 5 27
6 28 50 72 17 39 61 6
7 7 29 51 73 18 40 62
8 63 8 30 52 74 19 41
9 42 64 9 31 53 75 20
10 21 43 65 10 32 54 76
Die Bijektivität der Funktion f läßt für den vorliegen Fall (p = 11, q = 7) ebenfalls leicht
erkennen: einerseits gehört zu jedem Paar ( a , b ) ∈ Z11 × Z7 ein Eintrag im Inneren der
Tabelle und damit eine Restklasse aus Z77 , andererseits kommt jede Restklasse aus Z77
genau einmal vor.
38
Man führe den Beweis der umgekehrten Richtung als Übung aus.
215
Bemerkung: Diese Überlegungen lassen sich gleichlautend auf zwei teilerfremde Zahlen
n1 , n2 ∈ N mit n1 , n2 ≥ 2 übertragen. Im Falle ggT(n1 , n2 ) = 1 hat man damit
Z∗n1 ·n2 ∼
= Z∗n1 × Z∗n2
Interessant ist weiterhin der Fall einer Primpotenz pk . Man zeige als Aufgabe
ϕ(pk ) = (p − 1) · pk−1
Da er für die vorliegende Anwendung von untergeordneter Bedeutung ist, soll dieser Fall
nicht weiter behandelt werden.
Stattdessen soll der Fall n = p · q, p 6= q wieder aufgegriffen werden und eine wichtige
Betrachtung angestellt werden, die auf die Grundlage des RSA-Verfahrens hinführen
wird (siehe den folgenden Abschnitt 3.3.2.7.1). Mit Hilfe der umkehrbaren Funktion
(3.221)
f: Zn → Zp × Zq
a → (a, a)
bzw. auch durch direkte Rechnung (siehe Seite 212) wurde die Gleichung (3.214)
ϕ(p · q) = (p − 1) · (q − 1) (3.226)
hergeleitet, woraus mit Hilfe der Gleichung (3.171) wiederum die wichtige Gleichung
r (p−1)·(q−1) = 1 (3.227)
folgte (siehe 3.215). Die Gleichung (3.227) gestattet, ähnlich wie in Z∗p auch in dem Ring
Z∗n die e-te Wurzel ziehen, siehe dazu Seite 200:
• Weiter sei ein Potenzwert y = x e ∈ Z∗n vorgegeben, wobei die Basis x ∈ Z∗n
unbekannt ist.
– Als erstes berechnet man mit Hilfe des erweiterten Euklidischen Algorithmus
(siehe (3.46)) zwei ganze Zahlen d, v ∈ Z mit
1 = d · e + v · (p − 1) · (q − 1)
216
– Anschließend berechnet man y d ; in der Tat gilt nämlich x = y d .
Begründung:
x e )d · x v·(p−1)·(q−1)
y d = (|{z} denn x (p−1)·(q−1) = 1
=y
(siehe (3.171), (3.227))
=1
z }| {
= x e·d+v·(p−1)·(q−1) = x 1 = x
qed.
Die hier durchgeführte Rechnung wurde schrittweise durchgeführt; besser wäre natürlich
der Einsatz eines Rechners (schnelles Potenzieren, siehe (3.1)) oder das komponenten-
weise Potenzieren unter Verwendung von ZZ77 =Z˜ Z7 × ZZ77 (siehe (3.224)) gewesen.
Angenommen, man weiß jetzt nur, daß 31 in ZZ77 eine 37-te Potenz ist, und man will
die zugehörige Basis wissen, dann zieht man aus 31 die 37-te Wurzel. Im ersten Schritt
berechnet man dazu mit dem erweiterten euklidischen Algorithmus:
1 = 13 · 37 − 8 · (6 · 10) (3.230)
=
ˆ 3 (3.232)
Hier war nicht einmal die Anwendung des chinesischen Restsatzes notwendig.
Eine weitere sehr wichtige Folgerung aus der Gleichungen (3.226) und (3.169) betrifft
die Tatsache, daß der Anteil der nicht invertierbaren Elemente in Zp·q sehr gering ist.
217
Dieser Anteil beträgt nämlich
#Zp·q − #(Zp·q )∗ p · q − (p − 1) · (q − 1)
= p·q
#Zp·q (3.233)
= p + q − p 1· q
1 1
Für zwei Primzahlen mit p, q > 2 000 000 000 ist dieser Anteil kleiner als ein Milliardens-
tel. Bei zufälliger Auswahl einer Restklasse r aus Zp·q ist daher die Wahrscheinlichkeit
außerordentlich gering, daß r nicht invertierbar ist; man kann daher davon ausgehen,
daß r ∈ (Zp·q )∗ ist39 .
3.3.2.7 Anwendungen
3.3.2.7.1 Idee und Ablauf des RSA-Verfahrens Das Verfahren von River, Sha-
mir und Adelmann, kurz RSA-Verfahren genannt, ist ein asymmetrisches Verfahren,
d. h. die beiden Schlüssel k1 und k2 sind unterschiedlich (siehe Seite 145). Die große
Bedeutung dieses Verfahren besteht darin, daß der Besitzer B der beiden Schlüssel von
beliebiger Seite her ohne besonderen Schlüsselaustausch eine vertrauliche Nachricht emp-
fangen kann:
• Der Schlüssel zum Entschlüsseln, k2 wird jedoch vertraulich gehalten. k2 ist der
private Schlüssel (private key).
• Jeder kann nun eine mit dem öffentlichen Schlüssel k1 verschlüsselte vertrauliche
Nachricht an B senden.
• Nur B kann die so verschlüsselten und an ihn gerichteten Nachrichten lesen, da nur
B den privaten Schlüssel k2 kennt und daher nur er diese Nachrichten entschlüsseln
kann.
39
Wie man später sehen wird, werden in der Tat ausschließlich sehr große Primzahlen verwendet.
218
Klartext
?
Verschlüsselung
P
i
PP
P Sender (beliebig)
PP
PP
PP
PP
?
öffentlicher Schlüssel
Geheimtext des Empfängers (k1 )
%EE
,
,D %
Feind
6
?
privater Schlüssel
Entschlüsselung
(k2 )
Klartext
Empfänger (B)
Das RSA-Verfahren ist ein Beispiel für ein public key-Verfahren. Der zu Grund liegende
Algorithmus zur Ver- und Entschlüsselung beruht auf dem Wurzelziehen in dem Rest-
klassenring Zp·q (siehe Seite 216); es folgt der genau Ablauf des Verfahrens:
1. B wählt zwei Primzahlen
p, q ∈ N mit p 6= q (3.234)
B wählt weiterhin einen Exponenten
e ∈ N mit ggT(e, (p − 1)(q − 1)) = 1 (3.235)
B setzt
n=p·q
.
2. B veröffentlicht
k1 = (n, e) (3.236)
Dieses ist Bs öffentlicher Schlüssel. Die beiden gewählten Primzahlen p und q hält
B jedoch geheim.
3. A will B eine vertrauliche Nachricht M senden, dazu
• zerlegt A die Nachricht M in k Bitblöcke mit
M = M1 , M2 , . . . , Mk mit Mi < n (3.237)
Die Bitblöcke Mi werden dabei als nicht negative Dualzahlen aufgefaßt.
219
• Anschließend berechnet A unter Verwendung des bekannt öffentlichen Schlüs-
sels (n, e) blockweise für i = 1, . . . k die Verschlüsselung durch
4. B empfängt die Ci und entschlüsselt sie. Dazu berechnet B seinen privaten Schlüs-
sel d mit Hilfe des erweiterten euklidischen Algorithmus:
1 = d · e + v · (p − 1)(q − 1) (3.239)
Wegen Mi < n ist Mi der kleinste positive Rest der durch (3.240) berechneten
Restklasse Mi ∈ Zn ; B kann daher für i = 1, . . . k den Klartextblock Mi aus (3.240)
eindeutig bestimmt und damit insgesamt die empfangene Nachricht entschlüsseln.
Wie könnte ein Brechen dieses Codes aussehen? Angenommen, ein Angreifer hat Ci
abgefangen:
• Es gibt zwar schnellere algebraische Methoden zum Teilerfinden, aber auch diese
besitzen zumindest zur Zeit noch keine ausreichende Geschwindigkeit, um den
Code in absehbarer Zeit zu brechen.
Gebrochen wurden bereits Schlüssel der Länge 430 Bits (≈ 10130 ) sowie mit großem
Aufwand auch der Länge 512 Bits (≈ 10153 ). Als Folgerung bzw. Empfehlung ergibt sich
daraus:
• Minimal 768 Bits (n ≈ 10225 ) oder 1024 Bits (n ≈ 10300 ) sollten verwendet werden.
220
• Um ganz sicher zu gehen, wähle man
Beispiel: B erzeugt ein Schlüsselpaar und wählt dazu die beiden (für die Anwendung zu
kleinen) Primzahlen p = 211 und q = 223. Damit berechnet bzw. wählt er aus:
n = p · q = 47053
ϕ(n) = (p − 1) · (q − 1) = 46620
e = 107 der gewählte öffentliche Exponent: er muß teilerfremd zu ϕ(n) sein.
1 = (−4357) · |{z}
107 + 10 · 46620
| {z }
| {z }
d e ϕ(n)
A sendet die Nachricht M = 2013 an B und verschlüsselt sie dazu mit Bs öffentlichem
Schlüssel:
40
ohne Bildübertragung
221
Teilnehmer A Teilnehmer B
rät - wirft die Münze
Welche Seite
?
liegt oben?
Z
oder K
A B
Dabei ergibt sich folgendes Problem: A kann die Münze nicht sehen, er muß sich auf B’s
Aussage verlassen. Wie kann der Teilnehmer B dem Teilnehmer A glaubhaft machen,
daß jener falsch geraten hat?
Ansatz zur Lösung • Wenn A falsch rät, so verrät er damit gleichzeitig eine geheime
dieses Problems: Information. Dadurch daß B seine Kenntnis dieser geheime
Information nachweist, beweist er, daß A falsch geraten haben
muß.
Die Zerlegung n = p · q ist damit ebenso wie beim RSA-Verfahren die vertrauliche
Information, die hier nur dem Teilnehmer A bekannt. Wie schon beim RSA-Verfahren
bemerkt, ist das Berechnen der Zerlegung der Zahl n bei dieser Größenordnung praktisch
unmöglich.
Genau dann, wenn A falsch rät, soll er mit seiner falschen Aussage die bis dahin geheime
Zerlegung n = p · q an B verraten. B soll aus A’s falscher Aussage und dem ihm bekann-
ten korrekten Ergebnis die Zerlegung berechnen können, was andernfalls ja praktisch
unmöglich wäre. Dadurch, daß er nun die Zerlegung kennt, kann B glaubhaft machen,
daß A falsch geraten hat.
Wie kann ein Verfahren so etwas ermöglichen? Grundlage ist das besondere Verhalten
beim Ziehen der Quadratwurzeln im Restklassenring ZZn mit n = p · q.
Als Beispiel werden die Multiplikationstabellen in den beiden Restklassenringen (siehe
auch Seite 202)
• ZZ7
• ZZ7·11
betrachtet. Die Quadrate (die quadratischen Reste) befinden sich auf den Diagonalen.
Die von Null verschiedenen Quadrate wurden unterstrichen:41
41
Wie üblich werden die Restklassen hier wieder durch ihre kleinsten nicht negativen Repräsentanten
dargestellt.
222
∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von ZZ7
∗ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2 0 2 4 6 8 10 12 14 1 3 5 7 9 11 13
3 0 3 6 9 12 0 3 6 9 12 0 3 6 9 12
4 0 4 8 12 1 5 9 13 2 6 10 14 3 7 11
5 0 5 10 0 5 10 0 5 10 0 5 10 0 5 10
6 0 6 12 3 9 0 6 12 3 9 0 6 12 3 9
7 0 7 14 6 13 5 12 4 11 3 10 2 9 1 8
8 0 8 1 9 2 10 3 11 4 12 5 13 6 14 7
9 0 9 3 12 6 0 9 3 12 6 0 9 3 12 6
10 0 10 5 0 10 5 0 10 5 0 10 5 0 10 5
11 0 11 7 3 14 10 6 2 13 9 5 1 12 8 4
12 0 12 9 6 3 0 12 9 6 3 0 12 9 6 3
13 0 13 11 9 7 5 3 1 14 12 10 8 6 4 2
14 0 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Multiplikationstabelle von ZZ3·5
• Bei ZZ7 erscheint jedes Quadrat in der Diagonalen genau zweimal. Das sollte nicht
weiter erstaunen, siehe dazu (3.183), (3.184).
Der erste dieser beiden Fällen wurde bereits in Abschnitt 3.3.2.4 (ab Seite 202) erläutert.
Es folgt die Betrachtung der Quadrate in ZZp·q mit den beiden ungeraden Primzahl p
und q. Sei dazu
a = c 2 ∈ ZZp·q (3.241)
X2 − a = 0 (3.242)
für a 6= 0 bis zu vier Lösungen besitzen. Diese ungewohnte Tatsache liegt daran, daß
ZZp·q kein Körper ist und nicht einmal nullteilerfrei ist42 ist. Sei etwa X = u eine Lösung
42
Aufgabe: Finden Sie mindestens zwei Nullteiler in ZZp·q .
223
von (3.242), dann gilt:
0 = u2 − a = u2 − c2
(3.243)
= (u − c)·(u + c)
Wie üblich erhält man wieder jeweils eine Lösung, wenn einer der beiden Faktoren null
ist.
Aber wenn die Gleichung (3.243) erfüllt ist, so kann man daraus nicht schließend, daß
jeder der beiden Faktoren auf der rechten Seite von (3.243) zwingend null sein muß. Es
ist zusätzlich noch möglich, daß die Faktoren Nullteiler sind.
Man erkennt, daß in der Tat vier Lösungen vorhanden sein können, wenn man die
Entsprechung (3.224) verwendet und jede Restklasse in ZZp·q wieder durch ein Restklas-
senpaar in ZZp × ZZq darstellt. Die Quadratzahl (3.241) wird dann zu
( a , a ) = ( c , c )2 = ( c 2 , c 2 ) ∈ ZZp × ZZq (3.244)
Damit lassen sich sofort vier Lösungen der Gleichung (3.242) angeben:
1. (+ c , + c )
2. (− c , − c )
p
(a, a) = (3.245)
3. (+ c , − c )
4. (− c , + c )
Durch Quadrieren sieht man sofort, daß dieses alles Lösungen von (3.242) (unter Berück-
sichtigung von (3.224)) sind. Daß diese vier Lösungen alle verschieden sein können, zeigt
das folgende
( 3 , 5 )2 = ( 9 , 25 ) = ( 2 + 7 , 3 + 2 · 11 ) = ( 2 , 3 ) (3.246)
( 2 , 3 ) eine Quadratzahl, und die Quadrate der folgenden vier Restklassenpaare ergeben
wieder ( 2 , 3 ):
(+ 3 , + 5 ), (− 3 , − 5 ), (+ 3 , − 5 ), (− 3 , + 5 ) (3.247)
Stellt man ( 2 , 3 ) mit Hilfe des chinesischen Restsatzes (siehe (3.80), (3.82)) durch eine
Restklasse in ZZ77 dar, so erhält man mit 1 = −3 · 7 + 2 · 11:
(2, 3) =
ˆ −3 · 3 · 7 + 2 · ·2 · 11 = −63 + 44 = 58 (3.248)
Ebenso werden die vier Lösungen aus (3.247) durch jeweils eine Restklasse in ZZ77 dar-
gestellt:
(+ 3 , + 5 ) =
ˆ −5 · 3 · 7 + 3 · ·2 · 11 = −105 + 66 = 38
(− 3 , − 5 ) =
ˆ +5 · 3 · 7 − 3 · ·2 · 11 = +105 − 66 = 39
(3.249)
(+ 3 , − 5 ) =
ˆ +5 · 3 · 7 + 3 · ·2 · 11 = +105 + 66 = 17
(− 3 , + 5 ) =
ˆ −5 · 3 · 7 − 3 · ·2 · 11 = −105 − 66 = 60
Wie man sieht, sind alle vier Restklassen in (3.249) unterschiedlich. Die Restklasse
(3.248) aus ZZ77 besitzt tatsächlich vier verschiedene Quadratwurzeln.
224
Wie man anhand von (3.249) und auch von (3.245) sieht, setzen sich die vier Lösungen
aus zwei Paaren zusammen, die jeweils aus zwei Lösungen bestehen. Die beiden Lösungen
eines Paares unterscheiden sich dabei nur um den Faktor −1.
Genau dieses wird beim Münzwurf per Telefon ausgenutzt. Beim Raten muß sich der
Teilnehmer A für eine von zwei Möglichkeiten entscheiden. Diese beiden Möglichkeiten
sind die Lösungspaare bzw. Paare aus Quadratwurzeln eines quadratischen Restes aus
ZZp·q .
Bevor der Ablauf des Münzwurfs per Telefon erläutert werden kann, muß noch gezeigt
werden, wie in ZZp·q aus einem quadratischen Rest die Quadratwurzeln berechnet werden
können. Dabei wird
vorausgesetzt, so daß (3.195) angewandt werden kann. Für ein Quadrat in ZZp·q
nutzt man wieder die Entsprechung (3.224), faßt a als Restklassenpaar ( a , a ) in ZZp ×
ZZp auf und zieht aus jeder Komponente einzeln nach (3.195) die Quadratwurzel:
p+1
c1 = a 4 in ZZp
q+1
(3.252)
c2 = a 4 in ZZq
(+ c1 , + c2 ), (− c1 , − c2 ), (− c1 , + c2 ), (+ c1 , − c2 )
die dann wieder mit Hilfe des Chinesischen Restsatzes zu Restklassen in ZZp·q zusammen
gesetzt werden. Nachdem man mit dem euklidischen Algorithmus 1 = s·p+t·q berechnet
hat, setzt man
u1 = c2 · s · p + c1 · t · q
u2 = −u1
(3.253)
u3 = c2 · s · p − c1 · t · q
u4 = −u3
Beispiel: n = 77 = 7 · 11
X 2 = 23
2. Setze in ZZ7
7+1
c1 = 23 4 = 232 = 4
225
3. Setze in ZZ11
11+1
c2 = 23 4 = 233 = 1
4. Es ist
1 = 2 · 11 − 3 · 7
5. Setze
u1 = +2 · 11 · 4 − 3 · 7 · 1 = 67
u2 = −u1 = −67 =
ˆ 10
u3 = +2 · 11 · 4 + 3 · 7 · 1 = 109 =
ˆ 32
u4 = −u3 = −109 =
ˆ 45
p, q > 10150
2. B:
0 < c < n
a = c · c = c2
3. A:
226
(a) kennt die Zerlegung n = p · q und kann damit nach (3.252), (3.253) die vier
Quadratwurzeln von a berechnen:
u1 u2 = −u1
u3 u4 = −u3
u1 = ±c
oder u3 = ±c
u = u1 oder u = u3
4. B: testet:
gilt x = ±c ?
X2 = a
227
Der größte gemeinsame Teiler kann schnell durch den euklidischen Algorithmus berech-
net werden.
Begründung der Gleichung
p
ggT(u + c, n) = oder
q
Zunächst gilt
andererseits gilt
c2 = a = u 2
⇒ c2 − u 2 = 0
⇒ n = p · q teilt (c2 − u2 ) = (c − u) · (c + u)
(c − u) und (c + u)
beide von genau einer der beiden Primzahlen geteilt werden. Damit folgt:
)
ggT(c + u, n) = p
oder umgekehrt
ggT(c − u, n) = q
Beispiel:
1. A:
2. B:
3. A:
228
(a) kennt die Zerlegung 77 = 7 · 11 und kann damit die vier Quadratwurzeln
von 23 berechnen (siehe vorne):
67 10 = −67
32 45 = −32
67 = ±c
oder 32 = ±c
u = 67 oder u = 32
4. B: stellt fest:
32 6= ±10
und B an A : Du hast verloren“
”
Um dieses zu beweisen, berechnet B die geheime Zerlegung 77 = p · q und sendet
diese an A:
77
q = = 11
7
Dadurch, daß A 32 geraten hat, hat B die fehlende Information zum Herausfinden der
geheimen Zerlegung 77 = 7 · 11 bekommen.
229
Kapitel 4
w Q1
Dieses Beispiel zeigt: Zur vollständigen Beschreibung einer Kraft ist die Angabe einer
Maßzahl nicht ausreichend; man benötigt zur Darstellung einer Kraft und ebenso zur
Darstellung zahlreicher anderer Größen sogenannte Vektoren.
Ein Vektor wird durch einen Pfeil veranschaulicht und durch die folgenden Angaben
festgelegt:
230
• die Länge des Pfeils, es handelt sich dabei um eine nicht negative Maßzahl;
• eine Richtung, gegeben durch den Winkel des Pfeils zur x-Achse (bzw. bei räum-
lichen Vektoren zusätzlich durch den Winkel zu z-Achse);
Länge l *
α
Üblicherweise identifiziert man einen Vektor mit seinem Pfeil und spricht somit von der
Länge, der Richtung und dem Richtungssinn eines Vektors.
Die Lage des Vektors (bzw. seines zugehörigen Pfeils) ist unerheblich; man nennt daher
die Vektoren auch ungebundene Vektoren.
Bemerkung: Ersetzt man in dem Beispiel die Ladung q des Teilchens durch −q, so
wechselt der Kraftvektor seinen Richtungssinn.
Bei der Bezeichnung von Vektoren will man eine deutliche Abgrenzung zu der Bezeich-
nung üblicher Größen vornehmen; von den unterschiedlichen Schreibweisen, die für Vek-
tornamen gebräuchlich sind, sollen hier die beiden folgenden verwendet werden:
• ein kleiner oder großer lateinischer Buchstabe mit einem darüber stehenden Pfeil:
• ein Pfeil über zwei Großbuchstaben, die den Anfangs- und Endpunkt des Vektors
darstellen:
Q
:
P~Q
P
• Kraft: F~
F~ )
• Beschleunigung: ~b (= m
• Geschwindigkeit: ~v
~ (= F~ )
• elektrische Feldstärke: E q
• Stromdichte1 : J~ oder S
~
1
Die Anzahl positiver Ladungsträger, die sich je Zeiteinheit und Flächeneinheit in eine bestimmte
Richtung bewegen.
231
Bei einigen Größen reicht zu deren Beschreibung die Angabe einer Maßzahl (einschließ-
lich Vorzeichen), man nennt diese Größen Skalare; Beispiele für skalare Größen sind:
• Masse: m
• Spannung: U
• Ladung: Q
• Energie: W
Definition: Der Betrag eines Vektors ~a ist die Länge des zugehörigen Pfeils, man schreibt
dafür ||~a|| oder auch |~a|.
Der Betrag eines Vektors ist immer eine nicht negative reelle Zahl:
||~a|| ∈ [0, ∞)
Definition: Der Nullvektor ist derjenige Vektor, bei dem Anfangs- und Endpunkt zu-
sammenfallen:
~0 = P~P
Bemerkung: Ein Vektor ist genau dann der Nullvektor, wenn er den Betrag Null besitzt:
||~x|| = 0 ⇔ ~x = ~0
Einen Einheitsvektor verwendet man insbesondere dann, wenn es nur auf die Richtung
und den Richtungssinn eines Vektors ankommt und dessen Länge unerheblich ist.
Definition: Ein Vektor heißt Ortsvektor, wenn sein Anfangspunkt im Ursprung des kar-
tesischen Koordinatensystems liegt:
y
3P
~a ~
~a = OP
O x
Bemerkung: Bei einem Ortsvektor ist dessen Lage in der Ebene bzw. im Raum eindeutig
bestimmt. Ortsvektoren unterscheiden sich damit von den ungebundenen Vektoren, bei
denen die Lage ohne Bedeutung ist.
Definition: Zwei Vektoren ~a und ~b sind genau dann gleich, wenn sie durch Parallelver-
schiebung zur Deckung gebracht werden können. Dieses ist genau dann der Fall, wenn
die beiden Vektoren bezüglich
232
• ihrer Längen,
• ihrer Richtungen
gleich sind.
~a ~b
~a ~b
~a = ~b ~a 6= ~b
Wie man erkennt, spielt bei der Gleichheit zweier Vektoren deren Lage keine Rolle.
Anders verhält es sich bei Ortsvektoren: Sind ~a und ~b Ortsvektoren, so ist genau dann
~a = ~b, wenn sie durch denselben Pfeil dargestellt werden.
Definition: (Das Negative eines Vektors) Besitzen die beiden Vektoren ~a und ~b dieselbe
Länge und dieselbe Richtung, aber entgegengesetzten Richtungssinn, so gilt
~a = −~b
Als nächstes soll ein Produkt zwischen einer reellen Zahl und einem Vektor erklärt
werden.
Definition: Sei λ ∈ IR \ {0} eine reelle Zahl und ~a ein Vektor, dann ist
λ · ~a
~a 2~a −2~a
Für diese Multiplikation gelten die beiden Regeln: (λ, µ ∈ IR , ~a ein beliebiger Vektor)
• (λ · µ) · ~a (Assoziativgesetz)
233
Mit Hilfe der Multiplikation läßt sich ein von Null verschiedener Vektor ~a durch dessen
Betrag und Richtung darstellen:
~a = a · ~n (4.1)
Dabei stellt der erste Faktor den Betrag von
~a dar: ~a, ||~a|| = a
a = ||~a||
durch
~a
~n =
||~a||
Aufgabe: Man zeige durch Nachrechnen, daß ~n tatsächlich ein Einheitsvektor ist.
Als nächstes soll die Addition zweier Vektoren erklärt werden. Zur Herleitung wird von
dem Beispiel auf Seite 230 ausgegangen.
Beispiel: Gegeben seien wieder die beiden po-
w Q2
sitiven Ladungen Q1 und Q2 mit Q2 = 2Q1
sowie das negativ geladene Teilchen mit La-
dung q.
Bezeichnet man die Kraft, die Q1 alleine auf q
ausübt, mit K ~ 1 und die, die Q2 auf q ausübt, ~1
K
mit K~ 2 , so ist die auf q wirkende Gesamtkraft -
*
~
K2 6
F~1 = K~1 + K
~2
offensichtlich die Überlagerung bzw. Summe
u
- w
der beiden Einzelkräfte: q ~1
K Q1
~ ~
F 1 = K1 + K2 ~
Trägt man den Vektor K ~ 1 noch einmal am Endpunkt von K ~ 2 an2 , so stellt man fest, daß
der Vektor F~1 = K ~ 1 +K
~ 2 vom Anfangspunkt von K~ 2 bis zum Endpunkt des verschobenen
Vektors K~ 1 verläuft.
Dieses ist genau die Regel zur Bildung der Summe zweier Vektoren ~a und ~b:
Regel: Man trage den Anfangspunkt des Vektors ~a an den Endpunkt des Vek-
tors ~b an. Der Vektor ~a + ~b verläuft dann vom Anfangspunkt von ~b bis zum
Endpunkt von ~a.
Trägt man beide Vektoren zweimal ein, einmal mit gemeinsamem Anfangs-
punkt und einmal so, daß der Anfangspunkt des einen mit dem Endpunkt des
anderen zusammenfällt, so ist ~a + ~b gerade die Diagonale des entstehenden
Parallelogrammes.
~a ~a
- -
>
>
~b
~b
~b
a + ~b a + ~b
~ ~
-
~a
2
Man beachte, daß diese Vektoren ungebundene Vektoren sind.
234
Führt man diesen Prozeß mehrfach aus, so erhält man eine Vielfachsumme; für die
Zweifachsumme ergibt sich das Bild:
Y
H ~c
HHH
HH
BMB
B
~a + ~b + ~c B
~
Bb
B
~a + ~b
B
B
B
B
-B
~a
Für die Addition zweier Vektoren gelten die folgenden Regeln (~a, ~b, ~c drei beliebige
Vektoren, λ, λ1 , λ2 ∈ IR ):
• ~a + ~b = ~b + ~a (Kommutativgesetz),
Die Vektoraddition liefert zusammen mit der skalaren Multiplikation eine sehr gute
Möglichkeit zur Darstellung einer Geraden:
Man gibt einen Ortsvektor ~a und einen ungebunden, von Null verschiedenen Vektor ~b
vor und bildet mit dem Parameter t ∈ IR die Ortsvektoren
~a + t · ~b
Durchläuft der Parameter t die reellen Zahlen, so bilden die Endpunkte der Ortsvektoren
~a + t · ~b eine Gerade. Man schreibt für die Gerade
n o
~
G = ~a + t · b | t ∈ IR (4.2)
Den Vektor ~b nennt man Richtungsvektor der Geraden. In der folgenden Zeichnung
sind die Vektoren ~a + t · ~b für t = 1.65, 3.4, −1 eingezeichnet; man erkennt, daß die
Endpunkte dieser Vektoren auf einer Geraden liegen.
235
COC OCC
C C
C C
C C
C C
C C
C C
~a + 3.4 · ~b
C C
C 3.4 · b
~
C OC
C C C
C C C
CO C C
~ ~
Cb C1.65 · b C
C C C
~a + 1.65 · ~b C C C
1C
C C
C
C −~b
C
~ a
C
-CW
O ~a − ~b
Als Beispiel für eine Anwendung der Vektoraddition soll bewiesen werden, daß sich die
Diagonalen eines Parallelogrammes halbieren.
~a -
PP
i *AK
K PP
A
A PP A
PP d~
PP
c
A ~ A
A PP A
A ~b
PP
~b A
A
P PP
P A
PP
A P PP A
A PP A
A P- P
A
O ~a
~c = ~a + ~b, ~b = ~a + d~
Damit folgt:
Bemerkung: So wie bei der Anwendung der Vektorrechnung auf geometrische Fragestel-
lung üblich, wurden in diesem Beispiel die Ortsvektoren mit ihren Endpunkten iden-
tifiziert. Man beachte dazu, daß ein Ortsvektor durch seinen Endpunkt festgelegt ist
236
und eine eineindeutige Beziehung zwischen Punkten in der Ebene3 und Ortsvektoren
besteht.
rallelogrammes. ~a
Durch zwei Punkte verläuft bekanntlich genau eine Gerade. Mit Hilfe der Vektorsubtrak-
tion läßt sich zu zwei gegebenen Punkten P und Q sehr leicht diese Gerade konstruieren.
Man stellt die Gerade in der Form (4.2) dar: Zunächst bildet man die zu den beiden
Punkten gehörigen Ortsvektoren:
~
~x = OP und ~
~y = OQ
Man wählt den einen dieser beiden Vektoren als Ortsvektor der Geraden und die Diffe-
renz der beiden Vektoren als Richtungsvektor der Geraden. Eine Darstellung der Gera-
den durch P und Q lautet damit
A
A
A
* Q
A
~y AKA
A
y − ~x
A ~
O
XXX
X
A
A
XXX
XXX A
~x XX z
XAP
A
A
G
A
A
Fragen:
1. Man überlege sich anhand eines Beispiels, daß eine Gerade mehrere Darstellungen
der Form (4.2) besitzt.
2. Warum muß bei der Geradendarstellung (4.2) vorausgesetzt werden, daß der Rich-
tungsvektor nicht der Nullvektor ist.
3
bzw. im Raum
237
4.2 Lineare Unabhängigkeit
Die beiden Vektoren ~a und ~b besitzen dieselbe
Richtung; aus diesem Grund läßt sich der ei-
ne Vektor als Vielfaches des anderen darstel-
len. Man sagt in diesem Fall: Die Vektoren ~a
⇒ ~a = λ · ~b
und ~b sind kollinear oder linear abhängig.
~a ~b
erfüllt, bei der mindestens ein λi mit λi 6= 0 vorhanden ist, so heißen ~a1 , ~a2 , . . . , ~an linear
abhängig.
Die Ausdrücke, die in der Definition der linearen Unabhängigkeit erscheinen, werden
auch an anderer Stelle häufig vorkommen; man gibt ihnen daher einen Namen:
Definition: Ein aus n ∈ IN Vektoren ~a1 , . . . , ~an und n reellen Zahlen λ1 , . . . , λn gebildeter
Ausdruck der Form
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (4.6)
238
heißt Linearkombination der ~a1 , . . . , ~an . Unter Verwendung des Summenzeichens be-
kommt eine Linearkombination die Gestalt
n
X
λi~ai
i=1
Bemerkungen:
1. Sind ~a1 , ~a2 , . . . , ~an linear abhängig, so läßt sich mindestens einer dieser Vektoren
durch die übrigen darstellen. Genauer gilt: mindestens ein Vektor läßt sich durch
eine Linearkombination der übrigen Vektoren darstellen.
Wegen der linearen Abhängigkeit der ~a1 , ~a2 , . . . , ~an besteht eine Gleichung der
Form (4.5), bei der mindestens ein Koeffizient λi von Null verschieden ist. Der
zugehörige Vektor ~ai ist dann gleich einer Linearkombination der übrigen Vektoren.
Ist beispielsweise λ1 6= 0, so ist eine Teilung durch λ1 möglich, und man kann die
Gleichung
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (λ1 6= 0)
nach ~a1 auflösen:
n
X λi
~a1 = − ~ai
i=2
λ1
2. Ein einzelner Vektor ~a ist genau linear abhängig, wenn ~a der Nullvektor ist; es gilt
nämlich:
~a 6= 0 ⇔ λ · ~a 6= 0 für alle λ 6= 0
~a = 0 ⇒ 1 · ~a = 0
3. Befindet sich unter den Vektoren ~a1 , . . . , ~an der Nullvektor, so sind diese Vektoren
linear abhängig. Ist etwa ~a1 = 0, so gilt:
Es folgt ein Beispiel für die Verwendung der linearen Unabhängigkeit: Es soll gezeigt
werden, daß sich die Seitenhalbierenden eines Dreiecks im Verhältnis 2 : 1 schneiden.
239
Die Abschnitte auf den beiden Seitenhalbierenden von den Eckpunkten bis zu deren
Schnittpunkt entsprechen den Vektoren m · ~x und n · ~y . Die Behauptung ist gezeigt,
wenn man
2
m = n =
3
hergeleitet hat. Dazu werden einige Gleichungen mit Hilfe der Zeichnung aufgestellt:
~a + ~b + ~c = 0 ⇒ ~c = −~a − ~b
1
~x = ~c + ~a
2
1
~y = ~a + ~b
2
m ~x = ~c + n ~y
In die letzte Gleichung werden für ~c, ~x und ~y die drei ersten Gleichungen eingesetzt:
1 1
−m ~a − m ~b + m ~a = −~a − ~b + n ~a + n ~b
2 2
Alle Glieder werden auf die rechte Seite dieser Gleichung gebracht, anschließend werden
die Summanden mit ~a und ~b zusammengefaßt:
−m ~b − 21 m ~a + ~a + ~b − n ~a − 21 n ~b = 0
⇒ 1 1
1 − 2 m − n ~a + 1 − 2 n − m ~b = 0
Da die beiden Vektoren ~a und ~b linear unabhängig sind, sind die Koeffizienten von ~a
und ~b in der letzten Gleichung gleich Null:
1
1 − 2m − n = 0 1 m+ n = 1
⇔ 2
1
1 − 2n − m = 0 m+ 21 n = 1
Löst man dieses lineare Gleichungssystem in den unbekannten Werten m und n, so erhält
man als eindeutige Lösung
2 2
m = und n =
3 3
Damit ist die Behauptung gezeigt.
Definition: Ist n ∈ IN0 die maximale Anzahl zueinander linear unabhängiger Vektoren,
so heißt dieses n die Dimension.
Beispiel4
240
Q
Q
In der Ebene seien zwei linear unabhängige
Q ~
c
Q
Vektoren ~a und ~b vorgegeben. Weiterhin sei ~a Q
Q
ein beliebiger Vektor ~c gegeben:
~b
:
Qs
Q
Das es sich um drei Vektoren handelt und andererseits aus Dimensionsgründen nur
höchstens zwei Vektoren voneinander linear unabhängig sein können, müssen diese drei
Vektoren linear abhängig sein, d. h. es besteht eine Gleichung
λ · ~a + µ · ~b + ν · ~c = 0
bei der mindestens einer der drei Koeffizienten λ, µ und ν von Null verschieden ist.
Insbesondere ist ν 6= 0; wäre nämlich ν = 0, so verbliebe die Gleichung
λ · ~a + µ · ~b = 0
bei der nach wie vor ein Koeffizient ungleich Null ist, d. h. λ 6= 0 oder µ 6= 0 ist; dieses
ist ein Widerspruch zur linearen Unabhängigkeit von ~a und ~b. Damit folgt:
ν 6= 0
λ µ
⇒ ~c = − · ~a + − · ~b
ν ν
Da sich ein beliebiger Vektor ~c aus der Ebene so darstellen ließ, bilden ~a und ~b zusammen
eine sogenannte Basis der Ebene.
Frage: Warum ist die Darstellung (4.7) eines Vektors durch eine Basis eindeutig?
Antwort: Angenommen, man hat zwei Darstellungen von ~c:
Da die ~ai eine Basis bilden, sind sie linear unabhängig. Die Koeffizienten in (4.8) sind
daher Null:
(λ2 − µ2 ) = 0 ⇒ λ2 = µ2 für i = 1, . . . , n
241
Es handelt sich also beide Male um dieselbe Darstellung von ~c durch die Basis (~a1 , . . . , ~an ).
Bemerkung:
maximale Länge eines linear
n = Basislänge =
unabhängigen Systems
Beispiel:
• Ebene: Basislänge=Dimension= 2.
Um dieses begründen zu können, benötigt man eine weitere Darstellung der Vektoren,
die Komponentendarstellung.
4.3 Komponentendarstellung
Um Vektoren durch ihre Komponenten darzustellen, geht man von Kartesischen Koor-
dinaten aus:
y z y
6 Ebene 6 Raum
x x
- -
Hier sollen zunächst ebene Vektoren behandelt werden. Ein Vektor ~a ist durch
• seinen Betrag a = ||~a|| und
~a = ~ =
ˆ OP ˆ Punkt P mit den Koordinaten
a1 a · cos α
= (4.9)
a2 a · sin α
242
Die Komponenten des Vektors sind die Koordinaten seines Endpunktes, wenn man ihn
als Ortsvektor darstellt.
~a
Wegen λ = −|λ| sowie cos(α + π) = − cos α
und sin(α+π) = − sin α folgt für diesen Fall: 180◦ α
a
λ~
|λ|a cos(α + π) λa1
λ · ~a = = (4.11)
|λ|a sin(α + π) λa2
Beide Fälle zusammen ergeben die komponentenweise Multiplikation. Ebenso erhält
bei der Vektoraddition die komponentenweise Addition; Man erkennt dieses anhand
der Zeichnung; zur Ausführung der Addition mit Hilfe der Parallelogrammregel (siehe
Seite 234) wurde der Vektor ~b als freier Vektor an das Ende von ~a angetragen:
a1 + b 1
a2 + b 2 a + ~b =
1 ~
7
*
a2 + b 2
a2
1
b2
~b
7
~ a
b1 a1 a1 + b 1
Bemerkung: Ein räumlicher Vektor wird durch drei Komponenten dargestellt, entspre-
chend verlaufen die Rechenverknüpfungen:
λa1 a1 + b 1
λ · ~a = λa2 ~a + ~b = a2 + b2
λa2 a3 + b 3
243
z
a cos β ~a
Die Darstellung eines ebenen Vektors durch
y
Betrag und Richtung erfolgt mit Hilfe sei-
nes Winkels mit der x-Achse. Will man einen β
räumlichen Vektor ~a auf diese Weise dar-
stellen, benötigt man zwei Winkel; außerdem
verwendet man die Projektion ~b des Vektors
β
~a auf die xy-Ebene:
* ~b
α
x
Betrag : a = ||~a||
~a gegeben durch Winkel von ~a mit der z-Achse : β
Winkel der Projektion ~b mit der x-Achse : α
Dabei besitzt die Projektion ~b als z-Komponente den Wert 0 und kann damit als ebener
Vektor auf der xy-Ebene aufgefaßt werden. Da offensichtlich (siehe Zeichnung) 0 ≤ β ≤
π ist, ist sin β ≥ 0; daher gilt
(
Betrag : a sin β = ||~a|| sin β
~b gegeben durch
Winkel mit x-Achse : α
Damit gilt
a sin β cos α
~b = a sin β sin α
0
Die beiden ersten Komponenten von ~b sind auch die ersten beiden Komponenten von ~a;
die z-Komponente von ~a lautet (siehe Zeichnung) a3 = a cos β. Damit wurde hergeleitet:
Die Komponentenschreibweise eines durch Betrag und Richtung gegebenen räumlichen
Vektors lautet:
a sin β cos α
~a = a sin β sin α
a cos β
Jetzt ist man in der Lage, zu zeigen, daß die Ebene die Dimension zwei besitzt; dazu
beweist man:
Satz: Je drei Vektoren der Ebene sind linear abhängig.
Beweis: Seien ~a = (a1 , a2 )t , ~b = (b1 , b2 )t und ~c = (c1 , c2 )t drei beliebige Vektoren der
Ebene. Zu zeigen ist: Es gibt drei Zahlen λ, µ, ν ∈ IR , von denen mindestens eine
ungleich Null ist, so daß gilt
λ · ~a + µ · ~b + ν · ~c = 0 (4.12)
Setzt man die Komponentendarstellungen der Vektoren ein, so erhält man
a1 b1 c1 0
λ· + µ· + ν· =
a2 b2 c2 0
244
Die Zusammenfassung der Vektoren auf der rechten Seite liefert:
λa1 + µb1 + νc1 0
=
λa2 + µb2 + νc2 0
Zwei Vektoren sind genau dann gleich, wenn ihre entsprechenden Komponenten gleich
sind; dieses führt auf die beiden Gleichungen:
Dieses ist ein homogenes lineares Gleichungssystem mit zwei Gleichungen und den drei
Unbestimmten λ, µ und ν; in Matrizenschreibweise lautet es:
λ
a1 b 1 c 1 0
◦ µ =
a2 b 2 c 2 0
ν
Damit besitzt dieses homogene System mindestens eine von Null verschiedene Lösung
(λ, µ, ν)t ; d. h. es gibt drei Zahlen λ, µ, ν ∈ IR , die nicht alle gleich Null sind und die
das Gleichungssystem und damit (4.12). qed.
Bemerkung: Hier wurde die gängige Methode angewandt, die lineare Unabhängigkeit
bzw. Abhängigkeit von Vektoren durch Rückführung auf ein homogenes lineares Glei-
chungssystem zu testen.
dim Ebene ≤ 2
Um zu zeigen, daß die Dimension tatsächlich zwei beträgt, gibt eine Basis der Ebene
der Länge zwei an. Eine solche Basis ist die Standardbasis, bestehend aus den beiden
Einheitsvektoren
1 0
~e1 = ~e2 =
0 1
Man zeigt leicht, daß diese beiden Vektoren linear unabhängig sind; außerdem stellen
sie jeden beliebigen Vektor der Ebene dar:
a1
= a1 · ~e1 + a2 · ~e2
a2
Auf die gleiche Art zeigt man, daß der Raum die Dimension drei besitzt. Auch hier
bilden die drei Einheitsvektoren
1 0 0
~e1 = 0 ~e2 = 1 ~e3 = 0 (4.13)
0 0 1
245
die Standardbasis. Einen beliebigen räumlichen Vektor stellt man damit durch
a1
a2 = a1 · ~e1 + a2 · ~e2 + a3 · ~e3 (4.14)
a3
dar.
Es bleibt noch zu erwähnen, wie sich der Betrag eines Vektors aus dessen Komponenten
errechnet. Man verwendet dazu den Satz des Pythagoras:
q
a2 ||~a|| = a = a21 + a22
*~
a
a
a1
Bezeichnungen:
Ebene ˜ IR2
= 2-dim. Anschauungsraum =
˜ IR3
“Raum“ = 3-dim. Anschauungsraum =
Neben der Standardbasis (4.13) sind beliebige weitere Basen vorhanden.
Beispiel: Nachzuweisen ist die lineare Unabhängigkeit der beiden Vektoren im Raum
3 9
~a = 7 und ~b = 21 (4.15)
5 17
Zu prüfen ist dazu, ob die Gleichung
λ1 ~a + λ2 ~b = 0 (4.16)
nur für λ1 = λ2 = 0 erfüllt ist. Umgeschrieben in ein homogenes lineares Gleichungssys-
tem mit den Unbestimmten λ1 , λ2 lautet diese Gleichung
3 9
λ1
7 21 ◦ = 0 (4.17)
λ2
5 17
Das Gaußsche Verfahren (erste Gleichung durch 3 teilen, das 7-fache der ersten Glei-
chung von der zweiten Gleichung und das 5-fache der ersten Gleichung von der dritten
Gleichung abziehen, die dritte Gleichung durch 2 teilen) liefert
1 3
λ1
0 0 ◦ = 0 (4.18)
λ2
0 1
246
Man erkennt, der Rang ist 2, und der Corang ist Null. Dieses homogene Gleichungs-
system besitzt daher nur die Nulllösung. In der Gleichung (4.16) ist daher in der Tat
nur λ1 = λ2 = 0 möglich, und die Vektoren ~a und ~b sind linear unabhängig. Sie bilden
aber noch keine Basis, da der Raum die Dimension 3 besitzt. Will man sie zu einer Ba-
sis ergänzen, so benötigt man einen dritten Basisvektor ~c. Da in der reduzierten Form
(4.18) in der zweiten Zeile keine 1-Stufe vorhanden ist, kann man ~c = ~e2 = (0, 1, 0)t als
dritten Basisvektor wählen. Eine Basis des Raumes bilden somit
3 9 0
~a = 7 ~
b = 21 ~c = 1 (4.19)
5 17 0
Desweiteren soll der Vektor ~u = (6, −1, 8)t durch diese Basis dargestellt werden. Zu
bestimmen sind dazu λ1 , λ2 , λ3 ∈ IR mit
λ1 ~a + λ2 ~b + λ3 ~c = ~u (4.20)
und damit weiter λ3 = −15, λ2 = −1, λ1 = 5. Das liefert die gesuchte Darstellung des
Vektors ~u durch die Basis (4.19):
3 9 0 6
5 · 7 − 21 − 15 · 1 = −1 (4.23)
5 17 0 8
247
die Ebene
~a1
3 a0 + λ~
a1 + µ~a2
:~a2
z
~
a
0
y
x
248
Um E1 ∩ E2 zu beschreiben, muß nun die Lösungsmenge des Gleichungssystems (4.27)
untersucht werden. Die Lösungsmenge hängt vom Rang des Gleichungssystems ab; für
den Rang von (4.27) gilt
Als erstes Ergebnis erhält man damit: Die Lösungsmenge des Gleichungssystems (4.27)
besteht niemals nur aus einem Element. Angewandt auf E1 ∩ E2 bedeutet dieses: zwei
Ebenen im Raum schneiden sich niemals genau in einem Punkt.
Betrachtet man die möglichen Werte für den Rang im einzelnen, so erhält man:
1. Rang = 3: In diesem Fall ist der Rang gleich der Anzahl der Gleichungen, es
gibt daher keine Nullgleichungen, und das Gleichungssystem ist sicher lösbar.
Da der Corang gleich 1 ist, ist die Lösungsmenge durch eine spezielle Lösung
(λ0 , µ0 , l0 , m0 ) und durch eine Grundlösung (λ1 , µ1 , l1 , m1 ) des zugehörigen homo-
genen Systems gegeben:
λ0 + t · λ1
µ0 + t · µ1
l0 + t · l1
mit t ∈ IR (4.28)
m0 + t · m1
Dieses ist die Darstellung einer Geraden. In diesem Fall handelt es sich bei E1 ∩
E2 somit um eine Gerade. Zu beachten ist noch, daß die Gerade einen von Null
verschiedenen Richtungsvektor λ1~a1 + µ1~a2 besitzt; dieses liegt an der linearen
Unabhängigkeit von ~a1 und ~a2 .
(a) Das Gleichungssystem ist unlösbar und damit E1 ∩ E2 = ∅. Man kann zeigen,
daß dieses genau dann der Fall ist, wenn die beiden Ebenen parallel aber
nicht gleich sind.
(b) Das Gleichungssystem ist mit 2 = (4−Rang) Grundlösungen lösbar. In diesem
Fall ist E1 ∩ E2 eine Ebene und es gilt
E1 ∩ E 2 = E1 = E2
6
Andernfalls würde man (4.28) in die Darstellung der Geraden E2 einsetzen.
249
3. Rang ≤ 1: Man kann zeigen, daß dieser Fall nicht vorkommt. Die Annahme
Rang ≤ 1 führt zu einem Widerspruch zur linearen Unabhängigkeit der beiden
Richtungsvektoren ~a1 und ~a2 bzw. der beiden Richtungsvektoren ~b1 und ~b2
Bemerkung: Das hier vorgestellte Verfahren zur Beschreibung des Durchschnitts zweier
Ebenen ist effektiv: mit ihm läßt sich der Durchschnitt zweier gegebener Ebenen konkret
berechnen.
Aufgabe: Man führe eine entsprechende Überlegung zur Untersuchung des Durchschnitts
zweier Geraden G1 ∩ G2 durch. Man verwende für ~x ∈ G1 ∩ G2 die Darstellung durch die
beiden Geradengleichungen:
und leite daraus ein Gleichungssystem für die möglichen Parameterwerte ab. Dieses Glei-
chungssystem besitzt den Rang eins oder zwei; es besteht aus zwei oder drei Gleichungen,
je nach dem ob es sich um ebene oder räumliche Geraden handelt.
F~
*
die geleistete Arbeit:
α W = ||~s|| · ||F~ || · cos α
- ~s
-
||F~ || · cos α
Dieser von den beiden Vektoren ~s und F~ abhängende Ausdruck ist nicht nur bei der
Berechnung der geleisteten Arbeit von Bedeutung. Man trifft daher die folgende
Definition: Für zwei Vektoren ~a und ~b heißt
das Skalarprodukt von ~a und ~b. Dabei ist α der Winkel zwischen den beiden Vektoren
~a und ~b:
*
~a
α
- ~b
250
Eine andere Schreibweise für das Skalarprodukt lautet: (~a, ~b):
Frage: Warum ist es für den Wert des Skalarproduktes unerheblich, ob der größere oder
der kleinere Winkel zwischen den beiden Vektoren verwendet wird?
Bemerkung: Man beachte, daß der Wert des Ausdruckes (4.29) eine reelle Zahl, d. h. ein
Skalar, ist.
Bemerkung: Ist einer der beiden Faktoren des Skalarproduktes der Nullvektor, so ist der
Wert des Skalarproduktes Null. Anders als bei dem Produkt reeller Zahlen ist es beim
Skalarprodukt jedoch möglich, daß sein Wert Null ist und trotzdem keiner seiner beiden
Faktoren gleich dem Nullvektor ist (Beispiel?).
Bemerkung: Mit Hilfe des Skalarproduktes kann nachgerechnet werden, ob zwei von Null
verschiedene Vektoren ~x und ~y aufeinander senkrecht stehen; es gilt nämlich (α ist der
Winkel zwischen ~x und ~y ):
~x⊥~y ⇔ ~x · ~y = 0
⇔ cos α = 0 (4.30)
1 3
⇔ α = π, π
2 2
Für den Nullvektor ~0 und einen beliebigen Vektors ~x liefert das Skalarprodukt den Wert
~0 · ~x = 0
Hieraus folgt: Der Nullvektor steht auf jedem beliebigen Vektor senkrecht.
In vielen Anwendung benötigt man den Anteil eines Vektors, der senkrecht auf einem
anderen Vektor steht. Es soll hergeleitet werden, wie sich dieser senkrechte Anteil
eines Vektors mit Hilfe des Skalarproduktes berechnen läßt. Zunächst muß aber geklärt
werden, was genau darunter zu verstehen ist:
Gegeben seien zwei vom Nullvektor verschiedene Vektoren ~a und ~b. Gesucht ist eine
Zerlegung des Vektors ~a in zwei Summanden:
251
Verwendet man dieses zusammen mit (4.1), so erhält man für ~a1 :
~b
~a1 = (||~a|| · cos α) ·
||~b||
~b
= (||~a|| · ||~b|| · cos α) · (erweitert mit ||~b||)
||~b||2
(~a · ~b) · ~b
=
||~b||2
Der Nenner dieses Ausdrucks soll ebenso wie der Zähler durch das Skalarprodukt aus-
gedrückt werden. Beachtet man, daß der Vektor ~b mit sich selber den Winkel 0 Grad
bildet, so liefert eine kleine Nebenrechnung
Dieses oben eingesetzt liefert die wichtige Formel für den Anteil von ~a in Richtung ~b
(~a · ~b) ~
~a1 = ·b (4.33)
(~b · ~b)
Man beachte, daß in (4.33) die Punkte für unterschiedliche Multiplikationen stehen: die
in Klammern stehenden Produkte sind Skalarprodukte; der Punkt hinter dem Bruch
bezeichnet die Multiplikation einer reellen Zahl mit einem Vektor.
Nun ist auch offensichtlich, wie man den zu ~b senkrechten von ~a berechnet; aus (4.33)
und (4.31) folgt sofort:
(~a · ~b) ~
~a2 = ~a − ~a1 = ~a − ·b (4.34)
(~b · ~b)
252
Vektoren:
a2 ~a
a1 a cos α a
~a = =
a2 a sin α
α
a1
~b = b1 b cos β
=
b2 b sin β b2 1~
b
b
β
b1
a α−β
b2 1~b
Verwendet man dieses bei der Berechnung
b des Skalarproduktes von ~a und ~b, so erhält
α
β man:
a1 b1
~a · ~b = a · b · cos(α − β) (Additionstheorem verwenden!)
= a · b · (cos α cos β + sin α sin β)
= a cos α · b cos β + a sin α · b sin β
= a1 · b1 + a2 · b2
Damit wurde gezeigt: Das Skalarprodukt kann berechnet werden, indem man die entspre-
chenden Komponenten der beiden Vektoren multipliziert und die entstehenden Produkte
addiert. Die entsprechende Formel gilt für Vektoren im IR3 :
~a · ~b = (a1 , a2 , a3 )t · (b1 , b2 , b3 )t = a1 b1 + a2 b2 + a3 b3
Die Gleichung (4.36) stellt eine Möglichkeit dar, das Skalarprodukt leicht zu berechnen;
der Cosinus wird dabei nicht mehr benötigt. Weiterhin gestattet die Gleichung (4.36),
die folgenden sehr wichtigen Recheneigenschaften des Skalarproduktes zu beweisen:
253
Satz: Sei λ ∈ IR , und seien ~a, ~a1 , ~a2 , ~b, ~b1 , ~b2 Vektoren. Dann gilt für das Skalarprodukt:
(λ~a) · ~b = λ · (~a · ~b)
~a · (λ~b) = λ · (~a · ~b)
~a · (~b1 + ~b2 ) = ~a · ~b1 + ~a · ~b2
(4.37)
(~a1 + ~a2 ) · ~b = ~a1 · ~b + ~a2 · ~b
~a · ~b = ~b · ~a
~a · ~a > 0 für ~a 6= ~0
Beweis: Durch Nachrechnen mit der Komponentendarstellung (4.36) des Skalarproduk-
tes.
Die Rechengesetze (4.37) des Skalarproduktes sollten einen an die entsprechenden Ge-
setze der reellen Zahlen erinnern: bei den beiden ersten Regeln handelt es sich um
Assoziativgesetze, bei der dritten und vierten Regeln um Distributivgesetze und bei der
vorletzten Regel um ein Kommutativgesetz. Ein Produkt, das die Rechengesetze (4.37)
erfüllt, heißt bilinear.
Wir kommen zum senkrechten Anteil zurück. Nun kann leicht nachgerechnet werden,
daß die Gleichung (4.35) erfüllt ist:
~a2 · ~b = (~a − ~a1 ) · ~b (ausmultiplizieren und für
~a1 einsetzen!)
= ~a · ~b − ~a · ~b · ~b · ~b (die erste Regel aus (4.37)
~b · ~b ~
mit λ = ~~ab··~bb ) anwenden!)
~
= ~a · ~b − ~a · b · (~b · ~b)
~b · ~b
= ~a · ~b − ~a · ~b = 0
Dieses ist gleichbedeutend mit ~b⊥~a2 . Der Vektor ~a2 verdient somit zurecht den Namen
zu ~b senkrechter Anteil von ~a.
Mit Hilfe von (4.37) kann jetzt ein bedeutsamer Satz bewiesen werden, er beinhaltet
zwei wichtige Ungleichungen:
Satz: Für zwei Vektoren ~a und ~b gilt:
|~a · ~b| ≤ ||~a|| · ||~b|| (4.38)
254
Beweis:
zu (4.38): |~a · ~b| = ||~a|| · ||~b|| · | cos α| ≤ ||~a|| · ||~b||
| {z }
≤1
zu (4.39): ||~a + ~b||2 = (~a + ~b) · (~a + ~b) vergleiche mit (4.32); aus-
multiplizieren!
= ||~a||2 + 2 · ~a · ~b + ||~b||2
Nach (4.30) liefert das Skalarprodukt eine einfache Möglichkeit, nachzurechnen, wann
zwei Vektoren aufeinander senkrecht stehen: man braucht nur die Gleichung ~x · ~y = 0
nachzuprüfen. Dieses wurde bereits im Zusammenhang mit dem senkrechten Anteil ver-
wandt (siehe (4.35)). Als weiteres Beispiel für diese Anwendung des Skalarproduktes
sowie auch für die Anwendung der Rechenregeln (4.37) soll hier ein einfacher geometri-
scher Sachverhalt nachgewiesen werden.
Es gilt nämlich: Die drei Höhen eines Dreiecks schneiden sich in einem Punkt.
Beweis dieser Aussage: Gegeben sei ein beliebiges Dreieck mit den drei Eckpunkten
A, B und C. Die Höhen durch die beiden Punkte A und B werden eingezeichnet, de-
ren Schnittpunkt werde mit S bezeichnet. Weiterhin seien die drei Vektoren von den
Eckpunkten bis zu dem Punkt S gegeben:
~
~a = AS, ~b = BS,
~ ~
~c = CS
C
S
S
S
S
S
S
Sq
q ~
~c = CS S
b S
b b
S
b S
b S
b
S
bb S
b
b S
b S
b S
b
~
~
a = AS ~b = BS
~ bb S
b S
b
b S
b S
b
bS
A B
255
Die Behauptung ist bewiesen, wenn man zeigen kann, daß die durch C und S verlaufende
Stecke die dritte Höhe des Dreiecks ist. Dieses ist gleichbedeutend damit, daß der Vektor
~c auf dem Vektor AB ~ senkrecht steht. Zu zeigen bleibt daher (siehe (4.30)):
~ = 0
~c · AB (4.40)
Weiterhin gilt, da nach Konstruktion ~a und ~b auf den Höhen durch A und B liegen:
qed.
Es folgen einige weitere nützliche Formeln, die auf dem Skalarprodukt beruhen:
Abstand zweier Punkte : Gegeben seien in der Ebene (n = 2) oder im Raum n ≥ 3
die beiden Punkte P und Q, die zugehörigen Ortsvektoren seien
P
p1 q1 >
~ = . ~ = . p~ d
p~ = OP .. und ~q = OQ .. Q
:
pn qn
~q
O
Der Abstand d zwischen ihnen ist die Länge des zugehörigen Differenzvektors, man
berechnet ihn durch (siehe dazu (4.32) und (4.36), vergleiche auch mit 4.3)
v
u n
p uX
d = ||~p − ~q|| = (~p − ~q) · (~p − ~q) = t (pi − qi )2 (4.41)
i=1
Den Winkel zwischen zwei Vektoren berechnet man mit der Darstellung (4.29)
des Skalarproduktes:
!
~a · ~b
α = arccos (4.42)
~a ||~a|| · ||~b||
*
α -~
b
256
Der Schnittwinkel zweier sich schneidender Geraden ist genau der Winkel zwi-
schen den beiden Richtungsvektoren: Sind die beiden Geraden
n o n o
~
G1 = ~a1 + t · b1 | t ∈ IR ~
und G2 = ~a2 + t · b2 | t ∈ IR
1G
!
~b1 ~b1 · ~b2
*
α = arccos (4.43)
||~b1 || · ||~b2 ||
α
-
~b2 G2
*
Gegeben sei ein Vektor ~a im Raum
durch dessen Betrag und dessen Rich-
tungswinkeln.
~a
Gesucht ist die Komponentendarstellung des Vektors ~a, was gleichbedeutend mit
dessen Basisdarstellung durch die Einheitsvektoren ist (siehe (4.13), (4.14)):
a1
~a = a2 = a1 · ~e1 + a2 · ~e2 + a3 · ~e3
a3
Zunächst beachte man, daß für das Skalarprodukt zweier Einheitsvektoren gilt
1 für i = j
~ei · ~ej = (4.44)
0 für i 6= j
Die Gleichung (4.44) ergibt sich sofort aus der Komponentendarstellung der Ein-
heitsvektoren und des Skalarproduktes. Man kann (4.44) auch nur mit (4.29) und
ohne Verwendung der Komponenten begründen: ein Einheitsvektor besitzt die
Länge ||~ei || = 1, und zwei unterschiedliche Einheitsvektoren stehen aufeinander
senkrecht.
Zur Berechnung von a1 macht man den Ansatz ~a = a1~e1 + a2~e2 + a3~e3 und multi-
pliziert7 beide Seiten dieser Gleichung mit ~e1 :
~a · ~e1 = (a1 · ~e1 + a2 · ~e2 + a3 · ~e3 ) · ~e1
= a1 · ~e1 · ~e1 + a2 · ~e2 · ~e1 + a3 · ~e3 · ~e1
| {z } | {z } | {z }
=1 =0 =0
= a1
Allgemein erhält auf diesem Wege:
ai = ~a · ~ei
(4.45)
= ||~a|| · ||~e|| · cos αi = a · cos αi
7
durch das Skalarprodukt
257
a2 ~a
~c ∈ IR3
n o (4.46)
G = ~a + t · ~b | t ∈ IR mit ~b =
6 0
Wie groß ist der Abstand zwischen dem Punkt ~c und der Geraden G?
n
o
G = ~a + t · ~b | t ∈ IR
s
~c
Zur Beantwortung dieser Frage wird zunächst einer anderen Frage nachgegangen:
Welches ist der Punkt ~x0 auf der Geraden, der zu dem gegebenen Punkt ~c den
geringsten Abstand besitzt?
~x0 n
s
o
+ t · ~b | t ∈ IR
G = ~a
s
~c
Die letzte Zeichnung legt folgenden Ansatz zum Finden des Punktes ~x0 nahe:
~u = ~x0 − ~c (4.48)
258
~b
n
~x0 :
~
o
~b
G = ~a + t · b | t ∈ IR
OC r
:
C
C
C
C
C ~ u = ~x0 − ~c
~a C
C
C
C
-C
~0
~c
Beachtet man, daß der Vektor ~u = ~x0 −~u genau dann auf der Geraden G senkrecht
steht, wenn er senkrecht auf ihrem Richtungsvektor ~b steht, so erhält man weiter
mit Hilfe des Skalarproduktes:
~x0 = ~a + t0 · ~b (4.50)
Zur Bestimmung von ~x0 ist t0 zu bestimmen. Dazu setzt man (4.50) in die Glei-
chung auf der rechten Seite von (4.49) ein:
Einsetzen des Parameterwertes (4.51) in die Darstellung (4.50) liefert als erstes
Ergebnis den zu ~c nächst gelegenen Geradenpunkt
(~a − ~c) · ~b ~
~x0 = ~a − ·b (4.52)
~b · ~b
Damit erhält man sofort den Abstand zwischen ~c und der Geraden G. Nach Defi-
nition ist dieses ist dieses gerade der Abstand zwischen ~c und ~x0 :
(~a − ~c) · ~b ~
||~x0 − ~c|| = ||~a − ~c − · b|| (4.53)
~b · ~b
Vergleicht man (4.34) mit dem Vektor auf der rechten Seite von (4.53), so sieht
man, daß dieses genau der zu ~b senkrechte Anteil von ~a − ~c ist.
Zu zeigen bleibt noch, daß der durch (4.52) berechnete Vektor ~x0 tatsächlich der
Geradenpunkt mit dem geringsten Abstand zu ~c0 ist. Bis jetzt ist nur bekannt,
daß ~u = ~x0 − ~c senkrecht auf ~b steht. Zu zeigen ist somit, daß für ein
259
die Ungleichung
||~x1 − ~c|| > ||~x0 − ~c||
⇔ ||~x1 − ~c||2 > ||~x0 − ~c||2
⇔ (~x1 − ~c) · (~x1 − ~c) > (~x0 − ~c) · (~x0 − ~c) (4.54)
erfüllt ist. Um das zu zeigen, wird zunächst beachtet, daß ~x0 und ~x1 auf G liegen
und damit die Darstellungen
~x0 = ~a + t0 · ~b ~x1 = ~a + t1 · ~b (4.55)
besitzen. Damit folgt für die Differenz dieser beiden Vektoren
~x1 − ~x0 = (t1 − t0 ) · ~b
⇒ ~x1 = ~x0 + s0 · ~b mit s0 = t1 − t0 (4.56)
Wegen ~x1 6= ~x0 ist dabei t1 6= t0 und damit s0 6= 0.
~x1
r
n o
:
G = ~a + t · ~b | t ∈ IR
~x0
s0 · ~b
t
Jetzt setzt man die die Darstellung (4.56) von ~x1 in die rechte Seite von (4.54) ein:
||~x1 − ~c||2 = (~x1 − ~c) · (~x1 − ~c)
mit binomischer Formel
= ((~x0 + s0 · ~b) − ~c) · ((~x0 + s0 · ~b) − ~c)
ausmultiplizieren
= (~x0 − ~c) · (~x0 − ~c) + 2 · s0 · (~x0 − ~c) · ~b + s20 · (~b · ~b) wegen (4.49)
| {z }
=0
260
4.6 Die Hessesche Normalform
4.6.1 Geraden im IR2
Man betrachte eine Gerade in der Ebene (IR2 ), gegeben durch die Darstellung
n o
G = ~a + t · ~b | t ∈ IR (4.59)
Die Darstellung mit Hilfe eines auf der Gerade liegenden Ortsvektors ~a, eines Rich-
tungsvektors ~b der Geraden und des reellen Parameters t heißt Parameterform oder
Parameterdarstellung der Geraden. Diese Darstellung ist u. a. dann günstig, wenn
man die Gerade bzw. einen Teil von ihr zeichnen will. Die Parameterdarstellung ist
jedoch nachteilig, wenn man etwa folgende Frage klären will:
Zunächst soll als Spezialfall eine Gerade durch den Nullpunkt betrachtet werden; sie
besitzt eine Parameterform der Gestalt
n o
G = t · ~b | t ∈ IR
261
Da bei dem Vektor ~n nur die Richtung von Bedeutung ist, wählt man für ~n einen Vektor
aus, für den neben ~n · ~b = 0 zusätzlich
||~n|| = 1
gilt. Der Vektor ~n heißt Normalenvektor oder, da er die Länge eins besitzt, auch
Normaleneinheitsvektor.
Mit der Gleichung (4.60) hat man für diesen Spezialfall eine neue Darstellungsmöglich-
keit gefunden.
Jetzt zum Fall einer Gerade in allgemeiner Lage; es sei jetzt ~0 6∈ G vorausgesetzt:
G
1
~b
n o
~a + t · ~b | t ∈ IR
G =
~a
~
0
Ebenso wie bei der Parameterform müssen auch hier die Richtung und die Lage der
Geraden festgelegt werden:
1. Die Richtung legt man ebenso wie im Spezialfall ~0 ∈ G durch einen Vektor ~n 6= 0
fest, der auf der Geraden G senkrecht steht:
BMB
~n B 1
G
B
B r
~b
B
BMB
B ~ a
~n B
B
~0
B
~n⊥~b ⇔ ~n · ~b = 0 (4.61)
||~n|| = 1 (4.62)
Nachdem damit ~n damit Richtung und Länge festliegen, bestehen für die Orien-
tierung dieses Vektors noch zwei Möglichkeiten. Um die Orientierung von ~n auch
noch festzulegen, fordert man:
262
BMB
~n B
G
~n soll vom Nullpunkt aus in Rich- B q
B
tung der Geraden zeigen B
Der Vektor mit der umgekehrten B
B−~ n
Orientierung ist −~n. BMB B
BN
~n B
B
Br
~0
~n ist der Normalenvektor der Geraden.
2. Die Lage der Gerade legt man fest, indem man
d = Abstand der Geraden vom Nullpunkt
G
A
A d
vorgibt. Dabei ist
A
A
d ∈ IR mit d ≥ 0 Ar ~
0
Nachdem man auf diese Weise Richtung und Lage der Geraden festgelegt hat, gewinnt
man daraus eine neue Geradengleichung: Dazu wird ein beliebiger Vektor
~x ∈ G
betrachtet. Der Winkel α sei dann der Winkel zwischen diesem Vektor ~x und dem
Normalenvektor ~n:
BMB
~n B
G
B r
B 7B
B B
α B d = Abstand zwischen ~0 und G
B
~x B
B
rB
B
BMB
α
~n BB
B
Bq
~0
Aus der Zeichnung ergibt sich:
d = ||~x|| · cos α
= ||~n|| · ||~x|| · cos α (wegen ||~n|| = 1)
= ~n · ~x
~n · ~x = d (4.63)
263
Man kann auch umgekehrt zeigen: Erfüllt ein ~x ∈ IR2 die Gleichung (4.63), so liegt (der
Endpunkt von) ~x auf der Geraden; d. h. für alle ~x ∈ IR2 gilt die Aussage
~n · ~x ⇒ ~x ∈ G (4.64)
Beweis8 von (4.64): Man gehe von einer Parameterdarstellung der Geraden aus:
n o
G = ~a + t · ~b | t ∈ IR (4.65)
~n · ~x = d
n 1 · x1 + n 2 · x2 = d (4.66)
Die Merkmale dieses aus einer Gleichung mit zwei Unbekannten bestehenden Gleichungs-
systems erkennt man sofort:
• Sein Rang ist 1, da wegen 1 = ||~n|| = n21 + n22 nicht beide Koeffizienten n1 und
p
• Seine Lösungsmenge ist gegeben durch eine spezielle Lösung ~x0 und eine Grundlösung
~x1 des zugehörigen homogenen Systems; sie besitzt die Gestalt
Mit Hilfe der Parameterdarstellung (4.65) lassen sich für x0 und x1 sofort Werte
angeben:
~x0 = ~a
setzen, denn
~a ∈ G ⇒ ~n · ~a = d
– Als Grundlösung des homogenen Systems kann man
~x1 = ~b
264
Damit besitzt die Lösungsmenge des Gleichungssystems (4.66) die Darstellung
Bemerkung: Man beachte, daß nur eine Gerade in der Ebene (IR2 ) eine Hessesche
Normalform (4.68) besitzt, nicht jedoch eine Gerade im Raum (IRn , n ≥ 3).
Aufgabe: Finden Sie die beiden Stellen, an denen die Voraussetzung einging, daß die
bisherigen Betrachtungen für Geraden im IR2 durchgeführt wurden.
Bemerkung: Man erkennt sofort zwei Vorteile der Hesseschen Normalform gegenüber
der Parameterform:
1. Man sieht der Hesseschen Normalform sofort an, ob die betreffende Gerade den
Nullpunkt enthält (~0 ∈ G ⇔ d = 0).
2. Sind zwei Geraden G1 , G2 ∈ IR2 mit Hesseschen Normalformen
gegeben, so sieht man diesen sofort an, ob es sich beide Male um dieselbe Gerade
handelt oder nicht. Das erste ist genau dann der Fall, wenn ~n1 = ~n2 und d1 = d2
ist. Mit Hilfe der Parameterdarstellung ist dieses nicht so einfach zu erkennen, da
eine Gerade unterschiedliche Orts- und Richtungsvektoren besitzt.
Mit Hilfe der Hesseschen Normalform können die auf Seite 261 gestellten Fragen leicht
beantwortet werden:
265
1. Liegt ein gegebener Vektor ~c ∈ IR2 auf der Geraden? Dazu prüft man einfach
durch Einsetzen, ob ~c die Gleichung
~n · ~x = d
erfüllt.
2. Liegen die beiden gegebenen Vektoren ~c, d~ ∈ IR2 auf derselben Seite der Geraden?
Hierzu ist zunächst die Frage zu klären, ob ein Vektor ~c ∈ IR2 auf derselben Seite
wie der Nullpunkt liegt9
Die Antwort der zuletzt gestellten Frage ergibt sich sofort aus der folgenden Zeichnung;
dabei ist α der Winkel zwischen dem Normalenvektor ~n und dem Vektor ~c:
XXG XXX
~c >
XXX
XXX
XXX α
XXX
XXX
~n XXX
α
XX
XX
XXX
X
XX
~0 XXX
XXX q
d
l = ||~c|| · cos α
XX
X
Anhand der Zeichnung erkennt man:
Also gilt:
Damit läßt sich nun für zwei Vektoren ~c, d~ ∈ IR2 mit ~c, d~ 6∈ G die zweite Frage beant-
worten:
266
Dieses Ergebnis kann man folgendermaßen zusammenfassen: Eine Gerade in der Ebene
G ⊂ IR2 mit Hessescher Normalform
G = {~x ∈ IR2 | ~n · ~x = d}
~n · ~x > d
~n · ~x < d
~n · ~x = d
~n
PP G
PP
PP
PP
+
P PP s
P P
PP
− PP
PP
P
Zur Umrechnung zwischen der Parameterform einer Geraden G ∈ IR2 und ihrer Hesse-
sche Normalform:
G
1
n o
~b
~
G = ~a + t · b | t ∈ IR
~a
~
0
Zu berechnen ist die Hessesche Normalform:
Der Vektor m ~ steht damit bereits senkrecht auf G, die Normierung von m
~
liefert den Normalenvektor:
m
~
~n =
||m||
~
267
(b) Berechnung von d: Da für jedes ~x ∈ G die Gleichung
d = ~n · ~x
erfüllt ist und ~n bereits berechnet wurde, reicht es, in diese Gleichung irgend-
einen Vektor ~x ∈ IR2 , von dem ~x ∈ G bekannt ist, einzusetzen. Da etwa ~a ∈ G
ist, hat man
d = ~n · ~a
Ergibt sich hierbei ein negativer Wert d < 0, so ersetzt man ~n durch −~n und d
durch −d.
KAA ~
n G
A q
A AA d
G = {~x ∈ IR2 | ~n · ~x = d} (4.69)
A
A
Aq ~
0
Zu berechnen ist eine Parameterdarstellung: Man faßt dazu wieder die Gleichung
(4.69) als lineares Gleichungssystem auf (siehe auch Seite 264):
n1 · x1 + n2 · x2 = d
Dieses Gleichungssystem ist lösbar und besitzt den Corang eins. Seine Lösungs-
menge ist durch eine spezielle Lösung und durch eine Grundlösung des zugehörigen
homogenen Systems gegeben.
Diese beiden Vektoren bilden den Orts- und den Richtungsvektor in einer Para-
meterdarstellung der Geraden.
eine Ebene im Raum (IR3 ). Zur Begründung dieser Tatsache betrachte man die in (4.70)
enthaltene Gleichung, ausgeschrieben lautet sie mit ~n = (n1 , n2 , n3 )t und ~x = (x1 , x2 , x3 ):
n1 · x1 + n2 x2 + n3 · x3 = d (4.71)
Dieses ist ein lineares Gleichungssystem mit einer Gleichung und drei Unbekannten. Es
besitzt den Rang 1 (wegen ~n 6= 0) und den Corang 2. Seine Lösungsmenge läßt durch
eine spezielle Lösung a0 sowie zwei Grundlösungen des zugehörigen homogenen Systems
darstellen:
a0 + λ · ~a1 + µ · ~a2 mit λ, µ ∈ IR
268
Dieses ist genau die Parameterdarstellung einer Ebene im IR3 (siehe 4.24); die spezielle
Lösung ~a0 ist dabei der Ortsvektor, die Grundlösungen bilden die beiden Richtungsvek-
toren.
Für die Hessesche Normalform einer Ebene E im IR3
• Der Normalenvektor steht senkrecht auf der Ebene. Dieses ist gleichbedeutend
damit, daß er auf den beiden Richtungsvektoren senkrecht steht.
~a2
Ebene E
~n
6
r~
0
• Ein Vektor ~c ∈ IR3 liegt genau dann auf der Ebenen, wenn ~c die Gleichung ~n ·~x = d
erfüllt.
• Zwei Vektoren ~c, d~ ∈ IR3 liegen genau dann auf derselben Seite der Ebene, wenn
~n · ~c − d und ~n · d~ − d
Es folgen zwei wichtige Anwendungen für die Hessesche Normalform einer Ebene:
Dabei sind ~n1 und ~n2 deren beiden Normalenvektoren. Betrachtet man die seitliche
Ansicht beider Ebenen:
269
~n2
~n1
KA
A α
A
XX
XXX A
XX
XX A
XXX A α
XXXX
E2
XXX Ebene
XXX
XXX
X
Ebene E1
so erkennt man, daß für ihren Schnittwinkel α gilt:
α = Schnittwinkel zwischen E1 und E2
= Schnittwinkel zwischen ~n1 und ~n2
= arccos(~n1 · ~n2 ) (wegen ~n1 · ~n2 = 1 · 1 · cos α)
a0 = Minimalabstand
= ||~x0 − ~c||
J J
J J
J J
J J
J r ~x0 J
J J
J J
J Ebene E J
J J
270
Damit liegt der folgende Ansatz für ~x0 auf der Hand: Der am dichtesten zu ~c liegende
Punkt ~x0 auf der Ebene ist der Schnittpunkt zwischen der Ebene und der Geraden
G = {~c + t · ~n | t ∈ IR } (4.73)
= Gerade durch ~c in Richtung des Normalenvektors ~n
Dieser Schnittpunkt ist leicht zu berechnen: Wegen ~x0 ∈ G und wegen (4.73) ist einerseits
~x0 = ~c + t0 · ~n mit einem t0 ∈ IR ; wegen ~x0 ∈ E und wegen (4.72) gilt andererseits die
Gleichung ~n · ~x0 = d. Setzt man diese beiden Gleichungen ineinander ein, so erhält als
erstes den zu ~x0 gehörigen Wert von t0 :
~n · ~x0 = d für ~x0 einsetzten
~n · (~c + t0 · ~n) = d
~n · ~c + t0 · ~|{z}
n · ~n = d
=1
⇒ t0 = d − ~n · ~c
Setzt man diesen Wert wiederum in die Geradengleichung (4.73) ein, so liefert dieses
den gesuchten Vektor ~x0 :
~x0 = ~c + t0 · ~n
= ~c + (d − ~n · ~c) · ~n (4.74)
a0 = ||~x0 − ~c||
= ||~c + (d − ~n · ~c) · ~n − ~c||
= ||(d − ~n · ~c) · ~n||
= |d − ~n · ~c| · ||~n|| = |d − ~n · ~c| (4.75)
|{z}
=1
Es muß allerdings noch gezeigt werden, daß der Abstand (4.75) tatsächlich minimal ist,
d. h. daß gilt
~x − ~c = ~x0 + ~y − ~c
= ~c + (d − ~n · ~c) · ~n − ~c
= (d − ~n · ~c) · ~n + ~y (4.77)
~n · ~y = ~n · (~x − ~x0 )
= ~n · ~x − ~n · ~x0
= d−d = 0 (4.78)
271
Damit läßt sich jetzt der Abstand ||~x − ~c|| abschätzen. Um Gleichung (4.41) anwenden
zu können, schätzt man das Quadrat des Abstands ab und verwendet dabei (4.77) sowie
(4.78):
||~x − ~c||2 = (~x − ~c) · (~x − ~c)
= ((d − ~n · ~c) · ~n + ~y ) · ((d − ~n · ~c) · ~n + ~y )
= (d − ~n · ~c)2 · ~|{z}
n · ~n + 2 · (d − ~n · ~c) · ~n · ~y + ~y · ~y
|{z}
=1 =0
= (d − ~n · ~c)2 + ~y · ~y
| {z }
x0 −~c||2
=||~
Bei der rechten Seite (4.80) handelt es sich wieder um eine lineares Gleichungssystem,
für dessen Rang gilt:
0 ≤ Rang ≤ 2 (wegen zweier Gleichungen)
Man nimmt eine Fallunterscheidung nach den möglichen Werten des Ranges vor10 .
Rang 0: Wegen ~n1 6= 0 bzw. ~n2 6= 0 tritt dieser Fall nicht auf.
Rang 1: Eine Reduzierung des Gleichungssystems (4.80) liefert in diesem Fall11 :
~n1 · ~x = d1
(4.81)
0 = β
10
Hierzu sowie für die im Folgenden verwendeten Sachverhalte über lineare Gleichungssysteme siehe
Abschnitt 2.1.
11
wobei hier zur Vereinfachung auf die Normierung der ersten Gleichung verzichtet werden kann
272
Hierbei wurde ein Vielfaches der ersten Gleichung von der zweiten Gleichung abgezogen.
Dabei wurden die Koeffizienten der zweiten Gleichung durch Subtraktion von λ · ~n1
eliminiert, wobei λ ∈ IR ein geeigneter Faktor ist. Dieses bedeutet:
mit einem λ ∈ IR gilt: ~n2 = λ · ~n1
⇒ |λ| = 1 ⇒ λ = ±1 (4.82)
Das reduzierte Gleichungssystem (4.80) läßt sich aufgrund von (4.82) somit etwas ge-
nauer darstellen:
~n1 · ~x = d1
(4.83)
0 = d2 − λ · d1 (mit λ = ±1)
Aus (4.82) folgt weiter:
Die beiden Normalenvektoren ~n1 und ~n2 sind entweder gleich (λ = 1) oder
genau entgegengesetzt (λ = −1):
~n1 = ~n2 ~n1
entweder
oder
r
r
~n2 = −~n1
In beiden Fällen ergibt sich, daß die Ebenen E1 und E2 beide auf dem Normalenvektor
~n1 senkrecht stehen.
Hieraus folgt wiederum, daß beide Ebenen E1 und E2 parallel sind. In der Seitenansicht
hat man zum Beispiel:
~n1
HH
HH
H
HH HH
H HH
HH
H HH
HH H
H E1 HHH
HH
H
H E2
~n2
Um nun als nächstes zu prüfen, ob der Durchschnitt der beiden Ebenen nicht leer ist,
schließt man:
E1 ∩ E2 6= ∅
⇔ Das Gleichungssystem (4.80) bzw. (4.81) ist lösbar.
⇔ d2 − λ · d1 = 0
⇔ d2 = λ · d1 (wegen λ = ±1) (4.84)
273
Da d1 ≥ 0 sowie d2 ≥ 0 bekannt ist, ist (4.84) weiter äquivalent zu
d1 = d2 = 0 (4.85)
oder
d1 = d2 und λ = 1 (4.86)
E1 = E2
E1 ∩ E2 = ∅ ⇔ d2 − λ · d1 6= 0 (4.87)
In diesem Fall sind beide Ebenen zwar parallel aber nicht gleich; sie schneiden sich nicht.
Rang 2: In diesem Fall schließt man
Corang = 3 − 2 = 1
⇒ Das Gleichungssystem (4.80) besitzt genau einen Freiheitsgrad,
d. h. es gibt genau eine Grundlösung ~b des zugehörigen homoge-
nen Gleichungssystems.
Mit einer speziellen Lösung ~a des Gleichungssystems (4.80) bzw. (4.81) hat man somit
die Lösungsmenge
n o
E1 ∩ E2 = ~a + t · ~b | t ∈ IR (4.88)
274
4.6.6 Berechnung der Hesseschen Normalform einer Ebene
Offen ist noch die Frage, wie man zu einer in Parameterform gegebenen Ebene
E = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR }
deren Hessesche Normalform {~n ·~x = d} berechnen12 kann. Dazu bestehen zwei Möglich-
keiten:
1. Möglichkeit : Wegen ~n⊥~a1 und ~n⊥~a2 muß
~n · ~a1 = ~n · ~a2 = 0
gelten. Man kann daher zunächst eine von Null verschiedene Lösung m
~ des homo-
genen linearen Gleichungssystems
~a1 · ~x = 0
~a2 · ~x = 0
bestimmen. Ausgeschrieben lautet dieses Gleichungssystem in Matrizenschreibwei-
se:
x1
a11 a12 a13
◦ x2 = 0
a21 a22 a23
x3
Die Normierung der gefundenen Lösung liefert den Normalenvektor:
m
~
~n =
||m||
~
Schließlich setzt man
d = ~n · ~a0 (4.89)
Sollte dieses einen negativen Wert für d ergeben, so ersetzt man ~n durch −~n und
entsprechend d durch −d.
2. Möglichkeit : Man verwendet zur Berechnung des Normalenvektors ~n das sogenann-
te Kreuzprodukt. Mit dem Kreuzprodukt können zwei Vektoren ~a und ~b aus dem
IR3 verknüpft werden; das Ergebnis ist ein weiterer, auf den beiden gegebenen Vek-
toren ~a und ~b senkrecht stehender Vektor. Die Definition des Kreuzproduktes kann
durch die Lorentzkraft motiviert werden.
Wird ein Teilchen mit der elektrischen
Ladung q in einem Magnetfelde der
~ Flußdichte B ~ bewegt und ist ~v dabei die
B
Geschwindigkeit des Teilchens, so wirkt
~
F
auf dieses Teilchen eine Kraft, die senk-
I
@
@ ~v recht zu ~v und B~ ist.
Wie man feststellen kann, gilt für die
@
@
@ α Größe dieser Kraft
@ q
||F~ || ∼ ||~v || · ||B||
~ · | sin α|
@
@
~ und ~v .
mit dem Winkel α zwischen B
12
Die umgekehrte Rechnung erfolgt durch Lösung des Gleichungssystems (4.71).
275
Insbesondere folgt, daß diese sogenannte Lorentzkraft F~ maximal ist, wenn die Be-
wegungsrichtung (gegeben durch ~v ) und die Richtung des Magnetfeldes (gegeben
~ aufeinander senkrecht stehen (α = ±π/2), sie wird Null, wenn ~v und B
durch B) ~
parallel (α = 0, π) sind. Zur Berechnung von F~ dient das üblicherweise mit ד
”
bezeichnete Kreuzprodukt:
F~ = q · ~v × B
~
~c = ~a × ~b
das Kreuz- oder Vektorprodukt von ~a und ~b, falls folgende Bedingungen erfüllt sind:
F
h
α -
~a
Man beachte, daß nach Definition (~a × ~b) ⊥ ~a sowie (~a × ~b) ⊥ ~b gilt. Weitere wichtige Ei-
genschaften des Kreuzproduktes, die zum Umgang mit demselben unbedingt erforderlich
sind, liefert der folgende Satz. Erst mit Hilfe des folgenden Satze ist es möglich, mit dem
Kreuzproduktes in ähnlich einfacher Weise wie mit dem Skalarprodukt zu rechnen.
13
Eine weitere Möglichkeit zur Darstellung der Richtung von ~c liefert die Rechtehandregel : Zeigt der
Daumen der rechten Hand in Richtung von ~a, der Zeigefinger in Richtung von ~b, so verläuft deren
Kreuzprodukt ~c = ~a × ~b in Richtung des Mittelfingers.
276
Satz: Seien ~a, ~b, ~c ∈ IR3 und λ ∈ IR beliebig. Dann gilt:
~a × ~b = −~b × ~a (4.91)
Zu (4.93):
1. Sei λ > 0. Dann wird eine Seite des durch ~a und ~b gebildeten Parallelogrammes
um den Faktor λ gestreckt oder gestaucht14 :
*
~b
- -
~a λ · ~a
= |λ| · (−~a) × ~b
Zu (4.94):
277
~b -
1
~a
7
h1
h2
~a + ~b
-
~c
Zunächst wird ~a × ~c = (~a + ~b) × ~c gezeigt. Da die beiden Höhen h1 und h2 gleich
sind, kann man schließen:
Nachdem so gezeigt wurde, daß die beiden Vektoren (~a +~b) × ~c und ~a × ~c denselben
Betrag besitzen, muß noch gezeigt werden, daß sie auch dieselbe Richtung und
dieselbe Orientierung besitzen.
~a und ~c einerseits sowie (~a + ~b) und ~c andererseits spannen dieselbe Ebene auf,
denn ~b und ~c sind linear abhängig (siehe Zeichnung). Da ~a ×~c und (~a +~b) ×~c beide
auf dieser Ebene senkrecht stehen, besitzen diese Vektoren dieselbe Richtung. Da
weiterhin die Drehungen von ~a auf ~c und von ~a +~b auf ~c in derselben Drehrichtung
verlaufen, besitzen die beiden Vektoren ~a × ~c und (~a + ~b) × ~c ebenfalls dieselbe
Orientierung. Es folgt ~a × ~c = (~a + ~b) × ~c. Damit ergibt sich schließlich wegen
(4.92)
2. Es sei ~c ⊥ ~a und ~c ⊥ ~b, d. h. ~c stehe sowohl auf ~a als auch auf ~b senkrecht. Damit
ist ebenfalls ~c ⊥ (~a + ~b). Weiterhin ist dann hier wegen (4.90)
(4.96) gilt in gleicher Weise für ~b × ~c sowie für (~a + ~b) × ~c.
278
Der Vektor ~c steht senkrecht
auf der von ~a und ~b aufge-
OCC
C
C spannten Ebene. Nach Definition des Kreuzproduktes
C~ c stehen ~a × ~c, ~b × ~c sowie (~a + ~b) × ~c
C
C ~b 1H
ebenfalls senkrecht auf ~c. Sie liegen
q
HH
C q
~ damit in derselben Ebene wie ~a und
~a + b
HH
CH
H
-
~b, nämlich in der zu ~c senkrechten
B H
B HHH
Ebene.
B ~a j
H
Da auch ~a × ~c auf ~a senkrecht steht,
B
~a × ~c B ergibt sich die Richtung von ~a × ~c
B durch eine Drehung um 90◦ in der
B~
Bb × ~ c
zu ~c senkrechten Ebene. In gleicher
B B Weise ergeben sich die Richtungen
von ~b × ~c und (~a + ~b) × ~c, nämlich
B B
B B
B B
BN ebenfalls durch entsprechende Dre-
B hungen von ~b bzw. ~a + ~b um 90◦ ,
wobei - aufgrund der Definition des
B
B
B Kreuzproduktes - die Drehrichtung
B
B
dieselbe ist.
B
B
B?
(~a + ~b) × ~c
Insgesamt unterliegen die drei Vektoren ~a × ~c, ~b × ~c und (~a + ~b) × ~c damit dersel-
ben Drehstreckung15 : einerseits ergeben sich die oben angegebenen Drehungen um
90◦ ; andererseits werden wegen (4.96) alle Vektoren mit dem selben Faktor ||~c||
multipliziert.
Nun beachtet man die Diagonale des von ~a und ~b aufgespannten Parallelogrammes;
diese ist durch ~a + ~b gegeben und wird bei der Drehstreckung in die Diagonale des
durch ~a × ~c und ~b × ~c aufgespannten Parallelogrammes, d. h. in ~a × ~c + ~b × ~c
überführt, also
~a + ~b → ~a × ~c + ~b × ~c
Andererseits ist das Ergebnis dieser Drehstreckung nach Definition ja gerade das
Kreuzprodukt von ~a + ~b mit dem Vektor ~c. Damit ist in der Tat für diesen Fall:
(~a + ~b) × ~c = ~a × ~c + ~b × ~c
3. Seien nun ~a, ~b, ~c ∈ IR3 beliebig. Dann nimmt man für ~a und ebenso für ~b eine
Aufspaltung in einen zu ~c senkrechten Anteil und einen Anteil, der parallel zu ~c
ist, vor (siehe dazu (4.33), (4.34)):
279
λ1 , λ2 ∈ IR entsprechen dem Faktor auf der rechten Seite von (4.33). Die Zerle-
gungen (4.97) führen zu einer entsprechenden Zerlegung für den Summenvektor:
qed.
Grundlegend sind die Werte des Kreuzproduktes bei den drei Einheitsvektoren ~e1 , ~e2 ,
~e3 . Da die drei Einheitsvektoren die Länge eins besitzen und paarweise aufeinander
senkrecht stehen, folgt aus der Definition des Kreuzproduktes (bzw. mit der Rechte-
handregel)16
~e1 × ~e2 = ~e3 , ~e2 × ~e3 = ~e1 , ~e3 × ~e1 = ~e2 , ~ei × ~ei = 0 (4.99)
Mit des Satzes auf Seite 277 kann aus (4.99) die Komponentendarstellung des Kreuz-
produktes gewonnen werden. Für zwei Vektoren ~a, ~b ∈ IR3 setzt man dazu
3
X 3
X
t
~a = (a1 , a2 , a3 ) = ai · ~ei , sowie ~b = (b1 , b2 , b3 )t = bi · ~ei (4.100)
i=1 i=1
16
Die ersten drei Ausdrücke in (4.99) ergeben sich genau durch eine zyklische Vertauschung der drei
Einheitsvektoren ( Rechtssystem“).
”
280
und berechnet ausgehend von (4.100)
3
!
X
~a × ~b = ai · ~ei × ~b (nach (4.100))
i=1
3
X
= ai · ~ei × ~b (nach (4.94), (4.93))
i=1
3 3
!
X X
= ai · ~ei × bj · ~ej (nach (4.100))
i=1 j=1
3 X
X 3
= ai · bj · (~ei × ~ej ) (nach (4.94), (4.93))
| {z }
i=1 j=1
= 0 für i = j
= ~e1 · (a2 · b3 − a3 · b2 )
+ ~e2 · (a3 · b1 − a1 · b3 )
+ ~e3 · (a1 · b2 − a2 · b1 )
~a × ~b = a3 · b1 − a1 · b3 (4.101)
a1 · b 2 − a2 · b 1
Als Merkregel“ für die Darstellung (4.101) des Kreuzproduktes eignet sich folgende
”
Formel, die auf der Determinanten beruht:
~e1 a1 b1
~e3 a3 b3
Die rechte Seite von (4.102) ist als formale Schreibweise aufzufassen. Die Determinante
in (4.102) ist nach der ersten Spalte zu entwickeln (siehe (2.81)). Das Ergebnis ist dann
genau die rechte Seite von (4.101).
Folgerung: Für ~a, ~b, ~c ∈ IR3 liefert die gemeinsame Anwendung des Skalarproduktes
und des Kreuzproduktes
281
Auf der rechten Seite von (4.103) steht die Determinante der aus den drei Spaltenvek-
toren ~a, ~b und ~c gebildeten Matrix.
Beweis:
c 1 a1 b 1
(Entwicklungssatz auf die
det c2 a2 b2
erste Spalte anwenden)
c 3 a3 b 3
= c1 · (a2 b3 − b2 a3 ) − c2 · (a1 b3 − b1 a3 )
+ c3 · (a1 b2 − b1 a2 )
a2 · b3 − ~a3 · b2
= (c1 , c2 , c3 ) ◦ a3 · b1 − ~a1 · b3
a1 · b2 − ~a2 · b1
Die Gleichung (4.103) führt auf eine anschauliche Deutung der dreidimensionalen De-
terminanten. Faßt man dazu die Determinante als Funktion der drei Spaltenvektoren
det(~c, ~a, ~b)
auf, so gilt:
| det(~c, ~a, ~b) | = Volumen des von den drei Vektoren ~c, ~a, ~b (4.104)
aufgespannten Parallelotops im IR3
Ein Parallelotop (auch Spat, Parallelflach oder Parallelepiped genannt) ist ein drei-
”
dimensionales Parallelogramm“:
....... ..... ..... ..... ..... ..... ..... ..... ..... ............... ...
.. ... . ... .. .. ...
. ... .
. ..
. . . ... ... ...
.. ..
........... .... .... .... .... ..... ..... ............. ..... .......... ...
...
.... .. .. ..
.... .. ..
.... ........... ..... ..... ...... ..... ..... ..... ..... ..... ..... ..........
.
~c ....... ~b ........... ... ..
.... .... ... . .. ...
.
.... ....... .
..................................................................................................... .... .
~a ..
Zur Berechnung des Volumens dieses dreidimensionalen Körpers wählt man eine seitliche
Ansicht:
A
K
A
A 6
A ~
c ~a × ~b
A
h = ||~c|| · | cos α | A α
A
A
A
A Ebene von ~a, ~b
282
Hierbei ist h die Höhe des von ~c, ~a, ~b aufgespannten Parallelotops; für dessen Volumen
gilt dann:
Der Ausdruck ~c · (~a × ~b) wird wegen (4.103), (4.104) als Spatprodukt bezeichnet.
Bemerkung: (4.105) läßt sich auf den n-dimensionalen Fall verallgemeinern; betrachtet
man das durch Vektoren ~a1 , ~a2 , . . . , ~an ∈ IRn aufgespannte n-dimensionale Parallelotops,
so kann auch dessen Volumen durch die Determinante berechnet werden:
| det(~a1 , ~a2 , . . . , ~an ) | = orientiertes Volumen des von den n Vekto- (4.105)
ren ~a1 , ~a2 , . . . , ~an aufgespannten Parallelotops
im IRn
Unter dem orientierten Volumen versteht man das vorzeichenbehaftete Volumen. Das
Vorzeichen hängt von der Reihenfolge der aufspannenden Vektoren ~a1 , ~a2 , . . . , ~an ∈ IRn
ab; bei jeder paarweisen Vertauschung erfolgt ein Vorzeichenwechsel. Das Vorzeichen des
orientierten Volumens ist dann aufgrund von (4.105) gerade gleich den Vorzeichen der
Determinanten.
Zur Berechnung des Betrages des Kreuzproduktes ~a × ~b und damit der Fläche des von
~a und ~b aufgespannten Parallelogrammes kann das Skalarprodukt verwendet werden.
Satz: Für ~a, ~b ∈ IR3 gilt:
Beweis: α sei der von ~a und ~b eingeschlossene Winkel. Dann ist nach (4.90)
Eine in vielen Fällen recht nützliche Formel für die zweifache Anwendung des Kreuz-
produktes liefert der folgende Satz.
Satz: (Entwicklungssatz für das Kreuzprodukt) Für ~a, ~b, ~c ∈ IR3 gilt:
Zur teilweisen Plausibilisierung von (4.107) kann bemerkt werden, daß der Vektor d~ =
~c × (~a × ~b) auf ~a × ~b senkrecht steht. Auf ~a × ~b stehen ebenso die beiden Vektoren ~a
und ~b senkrecht. Folglich muß d~ in der von ~a und ~b aufgespannten Ebene enthalten sein
und ist damit eine Linearkombination von ~a und ~b.
283
Zum Beweis (von (4.107)): Zunächst berechnet man (4.107) für den Spezialfall ~c = ~e1 ;
zunächst wird dabei für ~a × ~b von Darstellung (4.101) ausgegangen:
= b1 · ~a − a1 · ~b
Für ein allgemeines ~c ∈ IR3 verwendet man die Darstellung ~c = c1~e1 + c2~e2 + c3~e3 sowie
(4.108), (4.109), (4.110):
3
!
X
~c × (~a × ~b) = ci~ei × (~a × ~b)
i=1
3
X
= ~
ci · ~ei × (~a × b) (hier (4.108), (4.109), (4.110)
i=1 einsetzen)
3
X
= ci · (~b · ~ei ) · ~a − (~a · ~ei ) · ~b
i=1
3
! 3
!
X X
= (~b · ci · ~ei ) · ~a − (~a · ci · ~ei ) · ~b
i=1 i=1
qed.
Zum Abschluß dieses Abschnitts folgen noch drei Anwendungen des Skalarproduktes:
284
1. Einen Normalenvektor ~n zu einer Ebene
d. h. einen auf E senkrecht stehenden Vektor der Länge 1 erhält man als normiertes
Kreuzprodukt der beiden Richtungsvektoren:
~a1 × ~a2
~n = (4.111)
||~a1 × ~a2 ||
Der Abstand zwischen dem Punkt ~x und der Geraden G ist genau die Höhe h des
vom Richtungsvektor ~a1 und vom Vektor ~a0 − ~x (einem von ~x nach G führenden
Vektor) aufgespannten Parallelogrammes. Man erhält die Höhe h, indem man die
Parallelogrammfläche (gegeben durch das Kreuzprodukt ~a1 × (~a0 − ~x)) durch die
Länge der Grundlinie des Parallelogrammes (gegeben durch ~a1 ) teilt:
3. Ähnlich geht man bei der Berechnung des Abstands zweier Geraden
in allgemeiner Lage17 vor. Der Abstand ist gerade die Höhe d des von den bei-
den Richtungsvektoren ~a1 und ~b1 sowie dem Verbindungsvektor ~a0 − ~b0 zwischen
den beiden Geraden aufgespannten Parallelotops. Die Höhe dieses Parallelotops
berechnet man, indem man dessen Volumen (gegeben durch (4.104) bzw. durch
(4.103)) durch dessen Grundfläche (gegeben durch das Kreuzprodukt der beiden
Richtungsvektoren) teilt:
17
zweier sogenannter windschiefer Geraden“
”
285
Literaturverzeichnis
286