Mathe 1

Fakultät Ingenieurwissenschaften und Informatik
Vorlesungsumdruck
Mathematik 1 für Informatik
Version für das Wintersemester 2020
J. Biermann
Osnabrück, Juli 2018

Version vom 9. Dezember 2020
Inhaltsverzeichnis
1 Grundbegriffe 1
1.1 Der Begriff der Menge und die reellen Zahlen . . . . . . . . . . . . . . . . 1
1.1.1 Der Begriff der Menge . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Mengendarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Standardzahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.4 Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.5 Das kartesische Produkt . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.6 Grundlegende Eigenschaften der reellen Zahlen . . . . . . . . . . . 7
1.1.7 Infimum und Supremum . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Die vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Die Summenschreibweise . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Das Prinzip der vollständigen Induktion . . . . . . . . . . . . . . 17
1.2.3 Der Binomische Lehrsatz . . . . . . . . . . . . . . . . . . . . . . . 23
1.3 Der Begriff der Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.1 Liste wichtiger Bezeichnungen bei Funktionen . . . . . . . . . . . 30
1.3.2 Das Schaubild einer reellen Funktion . . . . . . . . . . . . . . . . 31
1.3.3 Eigenschaften von Funktionen . . . . . . . . . . . . . . . . . . . . 33
1.3.3.1 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.3.3.2 Gerade – Ungerade . . . . . . . . . . . . . . . . . . . . . 34
1.3.3.3 Beschränktheit . . . . . . . . . . . . . . . . . . . . . . . 34
1.3.4 Einige grundlegende Funktionen . . . . . . . . . . . . . . . . . . . 35
1.3.4.1 Lineare Funktionen . . . . . . . . . . . . . . . . . . . . . 35
1.3.4.2 Quadratische Funktionen . . . . . . . . . . . . . . . . . 36
1.3.4.3 Potenz- und Wurzelfunktionen . . . . . . . . . . . . . . 36
1.3.4.4 Die Funktion f (x) = 1/x . . . . . . . . . . . . . . . . . . 39
1.3.4.5 Exponentialfunktion und Logarithmus . . . . . . . . . . 39
1.3.4.5.1 Rechenbeispiele mit dem Logarithmus . . . . . 42
1.3.4.5.2 Der Logarithmus zu anderen Basen . . . . . . . 44
1.3.4.6 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.1 Definition . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.2 Nullstellen und Hornerschema . . . . . . . . . . 48
1.3.4.6.3 Anzahl von Nullstellen . . . . . . . . . . . . . . 53
1.3.4.6.4 Der Fundamentalsatz der Algebra . . . . . . . . 56
1.3.4.7 Trigonometrische Funktionen und Arcusfunktionen . . . 57
1.3.4.7.1 Kreisfunktionen . . . . . . . . . . . . . . . . . . 57
1.3.4.7.2 Die Arcusfunktionen . . . . . . . . . . . . . . . 66
i
2 Lineare Gleichungssysteme und Matrizenrechnung 70
2.1 Lineare Gleichungssysteme und das Gaußsche Verfahren . . . . . . . . . . 70
2.2 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.1 Der Begriff der Matrix . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt . . . . . . . . . . . . 92
2.2.3 Quadratische Matrizen und die Umkehrmatrix . . . . . . . . . . . 101
2.2.4 Einige Matrizengruppen . . . . . . . . . . . . . . . . . . . . . . . 112
2.3 Die Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.3.1 Einführung und Definition . . . . . . . . . . . . . . . . . . . . . . 113
2.3.2 Determinante der Produktmatrix und der Transponierten . . . . . 119
2.3.3 Berechnung der Determinanten . . . . . . . . . . . . . . . . . . . 124
2.3.4 Die adjungierte Matrix . . . . . . . . . . . . . . . . . . . . . . . . 132
2.4 Der Begriff des Eigenwertes . . . . . . . . . . . . . . . . . . . . . . . . . 134
3 Elemente der diskreten Mathematik 143

3.1 Ein Schlüsselaustauschverfahren als einleitendes Beispiel . . . . . . . . . 143
3.2 Arithmetik der ganzen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 149
3.2.1 Wiederholung einiger Grundlagen . . . . . . . . . . . . . . . . . . 149
Teilung mit Rest . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3.2.2 Größter gemeinsamer Teiler und euklidischer Algorithmus . . . . 154
3.2.3 Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
3.2.4 Chinesischer Restsatz . . . . . . . . . . . . . . . . . . . . . . . . . 169
3.3 Gruppen, Ringe, Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
3.3.1 Grundlegende Definition . . . . . . . . . . . . . . . . . . . . . . . 173
3.3.1.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . 173
Definition der Gruppe . . . . . . . . . . . . . . . . . . . . . 175
Definition des Ringes . . . . . . . . . . . . . . . . . . . . . 176
Definition des Körpers . . . . . . . . . . . . . . . . . . . . 177
3.3.1.2 Endliche kommutative Gruppen . . . . . . . . . . . . . . 178
3.3.2 Restklassenringe über ZZ . . . . . . . . . . . . . . . . . . . . . . . 181
3.3.2.1 Einführung und Motivation . . . . . . . . . . . . . . . . 181
Äquivalenzrelationen . . . . . . . . . . . . . . . . . . . . . 182
3.3.2.2 Weitere Bezeichnungen und Endlichkeit . . . . . . . . . 188
3.3.2.3 Die Einheitengruppe . . . . . . . . . . . . . . . . . . . . 194
Eulersche Phi-Funktion . . . . . . . . . . . . . . . . . . . . 198
3.3.2.4 Der Fall n = p . . . . . . . . . . . . . . . . . . . . . . . 199
Wurzel ziehen . . . . . . . . . . . . . . . . . . . . . . . . . 200
Quadratische Reste . . . . . . . . . . . . . . . . . . . . . . 201
Diskreter Logarithmus . . . . . . . . . . . . . . . . . . . . 205
3.3.2.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . 205
3.3.2.5.1 Schlüsselaustausch nach Diffie-Hellman . . . . . 205
3.3.2.5.2 ISBN-Prüfziffer . . . . . . . . . . . . . . . . . . 206
3.3.2.5.3 Aufstellung eines Spielplans . . . . . . . . . . . 208
3.3.2.6 Der Fall n = p · q . . . . . . . . . . . . . . . . . . . . . . 211
3.3.2.7 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . 218
3.3.2.7.1 Idee und Ablauf des RSA-Verfahrens . . . . . . 218
3.3.2.7.2 Münzwurf per Telefon . . . . . . . . . . . . . . 221
ii
4 Grundlagen der Vektorrechnung 230
4.1 Problemstellung und grundlegende Definitionen . . . . . . . . . . . . . . 230
4.2 Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
4.3 Komponentendarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
4.4 Ebenen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
4.5 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
4.6 Die Hessesche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.1 Geraden im IR2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.2 Ebenen im IR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
4.6.3 Schnittwinkel zweier Ebenen . . . . . . . . . . . . . . . . . . . . . 269
4.6.4 Abstand eines Punktes von einer Ebene . . . . . . . . . . . . . . . 270
4.6.5 Der Durchschnitt zweier Ebenen . . . . . . . . . . . . . . . . . . . 272
4.6.6 Berechnung der Hesseschen Normalform einer Ebene . . . . . . . 275
4.7 Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
Literaturverzeichnis 286
3
Kapitel 1
Grundbegriffe
1.1 Der Begriff der Menge und die reellen Zahlen

1.1.1 Der Begriff der Menge
Grundlegend für die mathematische Denk- und Sprechweise ist der Begriff der Menge.
Zu diesem Begriff läßt man am besten den Schöpfer der Mengenlehre zu Wort kommen:
Eine Menge ist die Zusammenfassung wohlunterschiedener Objekte unserer

Anschauung oder unseres Denkens zu einem Ganzen; die darin enthaltenen
Objekte heißen Elemente der Menge.
nach G. Cantor, 1895

Hierzu gehören die beiden Schreibweisen
x∈M (x ist Element der Menge M )

x 6∈ M (x ist nicht Element der Menge M )
Die N heißt Teilmenge der Menge M oder enthalten in der Menge M , wenn jedes
Element der Menge N auch ein Element der Menge M ist.
Beispiel: Die Menge, die aus den Zahlen von eins bis zehn besteht, ist eine Teilmenge
der Menge der Zahlen von eins bis hundert.
Als Schreibweise verwendet man:
N ⊂M (die Menge N ist eine Teilmenge der Menge M )
Den Sachverhalt “N ⊂ M“ veranschaulicht man, indem man die Mengen durch Flächen
darstellt:
' $
M
N

& %
1
1.1.2 Mengendarstellungen
Zur Darstellung von Mengen verwendet man die
Aufzählung :
M = {a1 , a2 , a3 , . . . , an }
Beschreibung :
M = {x | x besitzt die Eigenschaft E}
Beispiel:
M = {1, 2, 4, 8}
M = {1, 2, 3, 4, 5, 6, 7, . . .} (= IN )
M = {x | x ∈ IN , x hat Endziffer 1}
= {1, 11, 21, . . .}
1.1.3 Standardzahlenmengen
Die bedeutsamste Zahlenmenge ist
IR = Menge der reellen Zahlen

=
ˆ Punkte auf der Zahlengeraden
√ π
1
−1 0 2 1 2 2 3
Eine reelle Zahl x wird durch einen unendlichen Dezimalbruch dargestellt:
x = an an−1 . . . a1 a0 , a−1 a2 . . . mit ai ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
Die Werte fast aller zu messenden Größen sind reell, z.B. Spannung, Stromstärke, Zeit,
Länge.
Neben IR selber sind gewisse Teilmengen der reellen Zahlen sehr wichtig:
Intervalle : Seien1 a, b ∈ IR mit a < b, dann ist das offene Intervall von a und b
gegeben durch
I = (a, b) = {x ∈ IR | a < x < b}
1
“a < b“ bedeutet: a ist kleiner als b; “a ≤ b“ bedeutet: a ist kleiner als b oder gleich b; siehe später.
2
a b
Die Randpunkte a und b sind nicht Elemente des offenen Intervalls.

Das abgeschlossene Intervall lautet
I = [a, b] = {x ∈ IR | a ≤ x ≤ b}
Hier gehören die Randpunkte zum Intervall.

Weitere Intervalltypen sind:
halboffen: [a, b) = {x ∈ IR | a ≤ x < b}

(a, b] = {x ∈ IR | a < x ≤ b}
unendlich: [a, ∞) = {x ∈ IR | a ≤ x}
(a, ∞) = {x ∈ IR | a < x}
(−∞, b] = {x ∈ IR | x ≤ b}
(−∞, b) = {x ∈ IR | x < b}
positive reelle Zahlen :
IR+ = (0, ∞) = {x ∈ IR | 0 < x}
natürliche Zahlen :
IN = {1, 2, 3, 4, 5, 6, . . .}
natürliche Zahlen einschließlich der Null :
IN0 = {0, 1, 2, 3, 4, 5, 6, . . .}
ganze Zahlen :
ZZ = {0, ±1, ±2, ±3, ±4, ±5, ±6, . . .}
Die ganzen Zahlen liegen diskret auf der Zahlengeraden, sie besitzen den Min-
destabstand 1 voneinander.
−2 −1 0 +1 +2 +3
rationale Zahlen :

p
Q| = p ∈ ZZ , q ∈ IN = Menge der Brüche
q
= Menge der periodischen Dezimalbrüche
1 3 1 3 1 3
0 8 16 4 8 2 4 1
3
Die Menge Q| liegt dicht auf der Zahlengeraden. Das bedeutet insbesondere: Ist
x ∈ IR beliebig, so läßt sich x beliebig eng durch zwei rationale Zahlen einschach-
teln:
r1 x r2
-
Dieser Abstand kann beliebig klein gewählt werden.
Durch solche Einschachtelungen gewinnt man näherungsweise Darstellungen der

reellen Zahlen.
√
Beispiel: Wie man zeigen kann, ist 2 6∈ Q| ; eine recht gute Einschachtelung von
√
2 ist √
r1 = 1, 4142 < 2 < 1, 41422 = r2
Zwischen einigen der genannten Mengen bestehen Teilmengenbeziehungen:
IN ⊂ IN0 ⊂ ZZ ⊂ Q| ⊂ IR
Ebenso gilt natürlich für jedes Intervall I:
I ⊂ IR
Durch Bildung der Differenzmenge2 erhält man weitere Teilmengen von IR :
IN0 \ IN = {0} (die Menge, die nur aus der Zahl Null besteht)
ZZ \ IN = {−1, −2, −3, . . .} (die Menge der negativen Zahlen)
Q| \ ZZ = die Menge der echten Brüche
IR \ Q| = die Menge der irrationalen Zahlen
√
Die Menge der irrationalen Zahlen ist “sehr groß“. Es gilt etwa 3, π ∈ IR \ Q| .
1.1.4 Mengenoperationen
Aus zwei gegebenen Mengen A und B wird durch die folgenden Operationen jeweils eine
weitere Menge gebildet:
A B

Vereinigung A ∪ B = {x | x ∈ A oder x ∈ B}

A B

Durchschnitt A ∩ B = {x | x ∈ A und x ∈ B}

A B

Differenz A \ B = {x | x ∈ A und x 6∈ B}

2
Siehe gleich!
4
Was ist die folgende Menge?
IN \ ZZ
Da alle Elemente von IN auch in ZZ enthalten sind, handelt es sich hierbei um eine
Menge ohne Elemente. Dieses ist die sogenannte leere Menge; man bezeichnet sie durch
“∅“. Ihre formale Definition lautet:
∅ = {x | x 6= x}
Bemerkung: Neben den Zahlenmengen gibt es natürlich noch weitere Mengen; Beispiel:
{Autos}
{Einwohner Osnabrücks} ⊂ {Personen}
1.1.5 Das kartesische Produkt
Zur Darstellung eindimensionaler Objekte dienen die reellen Zahlen:
IR =
ˆ Gerade
Intervalle =
ˆ Strecken
Die Ebene stellt man durch zwei Geraden dar:
ein Punkt, dargestellt

3
y t (x, y) durch ein Paar reeller
Zahlen:
2 die Koordinaten
=IR
ˆ
−1 1 2 3 x 4
−1
Beide Achsen entspre-

−2
chen den reellen Zahlen.
=IR
ˆ
Die waagerechte Gerade nennt man x-Achse, die senkrechte Gerade y-Achse.
5
Hierbei handelt es sich um einen Spezialfall des kartesischen Produktes; das kartesi-
sche Produkt zweier Mengen A und B ist definiert durch
A × B = {(a, b) | a ∈ A, b ∈ B}
= Menge der geordneten
Paare (a, b) mit a ∈ A
und b ∈ B
Im vorliegenden Fall hat man
IR × IR = IR2 = {(a, b) | a, b ∈ IR }
=
ˆ Ebene
Beispiel: Ein kartesisches Produkt zweier Intervalle ergibt ein Viereck:
M = {(x, y) ∈ IR2 | 2 ≤ x ≤ 3, 1 ≤ y ≤ 2}
= [2, 3] × [1, 2]
2
die Menge M
1
1 2 3
Definition: Sind A und B Mengen und ist R eine Teilmenge des kartesischen Produktes
dieser beiden Mengen:
R ⊂ A×B
so heißt R Relation über A und B.
Beispiel:
1. Seien A und B die Menge der Personen (A = B = {Personen}). Relationen über
A und B sind:
R = “kennt“ = {(a, b) | a und b sind Personen, a kennt b} ⊂ A × B

R = “verheiratet“
R = “älter als“
R = “unterrichtet in Mathematik“
6
2. A = {Personen}, B = {Autos}
R = “besitzt“ = {(a, b) | a besitzt b} ⊂ A × B

R = “überfährt“ = {(a, b) | b überfährt a} ⊂ B × A
3. A = B = IR
R = “<“ = {(a, b) ∈ IR2 | a < b} (eine Anordnungsrelation)
1.1.6 Grundlegende Eigenschaften der reellen Zahlen
Die Menge IR besitzt viele sehr bedeutsame Eigenschaften. Die grundlegensten Merk-
male der reellen Zahlen sind:
• man kann mit ihnen rechnen,
• sie sind angeordnet,
• sie besitzen eine Bewertung.
Die Körperaxiome
Je zwei reelle Zahlen a, b ∈ IR kann man mit Hilfe der Addition bzw. der Multiplika-
tion miteinander verknüpfen; Ergebnis einer solchen Operation ist wiederum eine reelle
Zahl. Die beiden Grundrechenarten Addition und Multiplikation gehorchen gewissen
Grundregeln, den sogenannten Körperaxiomen:
1. Addition
(a) Abgeschlossenheit
a, b ∈ IR =⇒ a + b ∈ IR
(b) Kommutativgesetz
a, b ∈ IR =⇒ a+b=b+a
(c) Assoziativgesetz
a, b, c ∈ IR =⇒ (a + b) + c = a + (b + c)
(d) neutrales Element
es gibt ein Element 0 ∈ IR

mit a + 0 = a für alle a ∈ IR
7
(e) inverses Element
a ∈ IR =⇒ es gibt dazu ein Element

ã ∈ IR mit ã + a = 0
Schreibweise: ã = −a
2. Multiplikation
a, b ∈ IR =⇒ a · b ∈ IR
a, b ∈ IR =⇒ a·b=b·a
a, b, c ∈ IR =⇒ (a·b)·c = a·(b·c)
es gibt ein Element 1 ∈ IR

mit a·1 = a für alle a ∈ IR
a ∈ IR \ {0} =⇒ es gibt dazu ein Element

ã ∈ IR mit ã·a = 1
1 = a−1
Schreibweise: ã = a
3. Distributivgesetz
a, b, c ∈ IR =⇒ a · (b + c) = a · b + a · c
Bemerkung:
• Grundregeln, von deren Richtigkeit man ausgeht, heißen Axiome.
• Eine nicht leere Menge, für deren Elemente die beiden Verknüpfungen “+“ und
“·“ erklärt sind, so daß die oben genannten Axiome gelten, heißt Körper. Ist nur
eine Addition mit den zugehörigen Grundregeln erklärt, so heißt die Menge (kom-
mutative) Gruppe. (Beispiel: ZZ ist eine Gruppe, nicht jedoch IN ).
Aus den Körperaxiomen leitet man alle weiteren rechnerischen Eigenschaften der reellen
Zahlen ab. Als Beispiel wird der folgende Satz bewiesen:
Satz: Für alle x ∈ IR ist x · 0 = 0.
8
Beweis:
x · 0 = x · (0 + 0) (da Null neutral bezügl. +)
x·0 = x·0+x·0 | −x · 0 (Distributivgesetz)
0 = x·0
qed.
Man beachte, daß bei diesem Beweis nichts anderes als die Körperaxiome verwendet
wurden! Ähnlich zeige man unter anderem: Für alle x ∈ IR ist x = −(−x).
Üblicherweise verwendet man im Zusammenhang mit den Grundrechenarten noch die

folgenden Schreibweisen
ab = a · b (verkürzte Schreibweise der Multiplikation)
a − b = a + (−b) (Subtraktion)
a : b = a · b−1 (Division)
−1
a/b = a · b (Division)
a = a · b−1 (Division mit Bruchstrich)
b
an = a
| · a{z· · · a} (n ∈ IN ) (Potenz)
n−mal
a−n = 1 (n ∈ IN ) (Potenz mit negativem Exponenten)
an
Für die Potenz kommen die folgenden Regeln hinzu:
an · am = an+m (n, m ∈ ZZ)
a0 = 1 (1.1)
a−n = 1n (n ∈ ZZ)
a
Die Anordnungsaxiome
Mit den Elementen der Menge IR kann nicht nur gerechnet werden, sie sind zusätzlich
auch angeordnet. Die Anordnung ergibt sich sofort mit Hilfe der Zahlengeraden: man
trifft für zwei Zahlen a, b ∈ IR die folgende Festlegung:
a liegt auf der Zahlengeraden links von b ⇔ a ist kleiner als b bzw. a b : a ist größer als b
a ≥ b : a ist größer oder gleich b
9
Ebenso wie für die Addition und Multiplikation bestehen Grundregeln für die Anordnun-
grelationen, die sogenannten Anordnungaxiome. Sie werden hier für “<“ formuliert,
gelten aber auch entsprechend für “≤“, “>“ und “≥“.
Die Anordnungsaxiome lauten:
1.
a, b ∈ IR =⇒ es gilt genau eine der drei Beziehungen
a < b, a = b, b < a
2. Transitivität
a, b, c ∈ IR mit a < b, b < c =⇒ a<c
3.
a, b, c ∈ IR mit a 0 =⇒ a·c<b·c
Ebenso grundlegend wie die Anordnungsaxiome selber sind die ersten Folgerungen, die
man aus ihnen zieht:
Folgerung: Für reelle Zahlen a, b, c, d ∈ IR gilt:
1.
a > 0 ⇔ 0 > −a
2. Eine Ungleichung kehrt sich um, wenn man sie mit einem Faktor kleiner als Null
multipliziert: Für c < 0 gilt:
a b·c
3. Eine Ungleichung zwischen Zahlen größer Null kehrt sich beim Übergang zu den
Inversen um: Für a, b > 0 gilt:
a b−1
4.
a>b>0
⇒ a·c > b·d
c>d>0
5. Reelle Quadrate sind nie negativ: für alle a ∈ IR ist
a2 ≥ 0
6. Für a 6= 0 ist das Quadrat echt größer als Null:
a2 > 0 ⇔ a 6= 0
Beweis: Beim Beweis dieser Folgerungen werden ausschließlich die Anordnungsaxiome

oder bereits zuvor hergeleitete Aussagen verwendet.
10
1.
a > 0 | +(−a)
⇒ 0 > −a
2. Es gilt c < 0 ⇒ −c > 0, also folgt:
a > b | ·(−c) (> 0)
⇔ a · (−c) > b · (−c) | +(a · c + b · c)
⇔ b·c > a·c
⇔ a·c < b·c
3.
a 0)
⇔ b−1 < a−1
⇔ a−1 > b−1
4. Als Übung!
5. Als Übung!
6. Als Übung!
qed.
Der Betrag
Die reellen Zahlen besitzen eine Bewertung. Diese Bewertung wird durch den Betrag
geliefert: Man setzt für eine reelle Zahl x ∈ IR
|x| = “Betrag von x“
x 0
= Abstand von x zu 0 auf der Zahlengeraden -

x für x ≥ 0
=
−x für x < 0
= die positive der beiden Zahlen x und −x
Ebenso gilt für zwei reelle Zahlen x, y ∈ IR :
|x − y| = Abstand zwischen x und y auf der Zahlengeraden
0 x y
-
|x − y|
11
Die Begründung dieser Aussage erhält man, wenn man x und y auf der Zahlengeraden
um −y verschiebt:
Abstand zwischen x und y

= Abstand zwischen x − y und 0
= |x − y|
x−y y−y
0 x y
- -
|x − y| |x − y|
Wichtige Regeln für den Umgang mit dem Betrag sind:
1.
|x| = 0 ⇔ x = 0
2.
|x − y| = 0 ⇔ x−y = 0 ⇔ x = y
3.
| − x| = |x|, |x − y| = |y − x|
4.
|x| · |y| = |x · y|
5.
= |x|
x
für y 6= 0
y |y|
6. die bedeutsame Dreiecksungleichung:
|a + b| ≤ |a| + |b|
7. zwei Folgerungen aus der Dreiecksungleichung:
|a − b| ≤ |a| + |b|
|a − b| ≥ |a| − |b|
Das Rechnen mit Beträgen wird anhand eines wichtigen Beispiels vorgeführt. Das Er-
gebnis der Rechnung dieses Beispiels wird später oft verwendet werden. Vorgegeben
seien
a ∈ IR und ε ∈ IR mit ε > 0
12
Wie sieht dazu die folgende Menge aus?
M = {x ∈ IR | |x − a| < ε}
Der sicherste Weg, den man beim Beantworten einer solchen Frage einschlagen kann,
besteht in einer Fallunterscheidung nach dem Vorzeichen des Ausdrucks innerhalb der
Betragsstriche. Liegt das Vorzeichen des Ausdrucks innerhalb der Betragsstriche fest, so
können die Betragsstriche durch Klammern ersetzt werden (u. U. mit Voranstellen eines
Minuszeichens), und man erhält einen üblichen arithmetischen Ausdruck. In Einzelfällen
bieten sich neben der Fallunterscheidung natürlich noch weitere Berechnungsmöglich-
keiten an.
Hier lautet die Fallunterscheidung:
1. x − a ≥ 0 ⇔ |x − a| = x − a ⇔ x ≥ a
2. x − a < 0 ⇔ |x − a| = a − x ⇔ x < a
Fall 1 : |x − a| = x − a und x ≥ a, also kann man schließen:

|x − a| < ε
⇔ x−a < ε
⇔ x < a+ε
insgesamt: a ≤ x < a+ε
Fall 2 : |x − a| = a − x und x < a, also kann man schließen:

|x − a| < ε
⇔ a−x < ε
⇔ x − a > −ε
⇔ x > a−ε
insgesamt: a−ε < x < a
Die Zusammenfassung beider Fälle liefert

|x − a| < ε ⇔ a−ε < x < a+ε
Damit erhält man für die Menge das Bild:
Der Abstand zu a ist kleiner als ε.
-
0 a−ε x a a+ε
-
die Menge M
Die Menge M bezeichnet man als ε-Umgebung von a und schreibt sie in der Form
Uε (a) (1.2)
13
1.1.7 Infimum und Supremum
Definition: Sei M ∈ IR eine Teilmenge der reellen Zahlen.
1. Gibt es eine Konstante K ∈ IR mit der Eigenschaft
K ≤ x für alle x ∈ M
so heißt die Menge M nach unten beschränkt.

K die Menge M
2. Gibt es eine Konstante L ∈ IR mit der Eigenschaft
x ≤ L für alle x ∈ M
so heißt die Menge M nach oben beschränkt.

die Menge M L
3. Gibt es Konstanten K, L ∈ IR mit der Eigenschaft
K ≤ x ≤ L für alle x ∈ M
so heißt die Menge M beschränkt.
Die Zahlen K und L heißen untere Schranke bzw. obere Schranke der Menge M .
Man beachte, daß die Schranken einer Menge nicht eindeutig bestimmt sind!.

die Menge M L1 L2
Definition: (Infimum und Supremum)
1. Die Menge M ∈ IR sei nach oben beschränkt; dann heißt die kleinste obere Schran-
ke das Supremum der Menge M . Man schreibt für das Supremum von M
sup M
2. Die Menge M ∈ IR sei nach unten beschränkt; dann heißt die größte untere
Schranke das Infimum der Menge M . Man schreibt für das Infimum von M
inf M
Beispiel: Sei M = (−1, 1].
14

−1 0 1
Dann gilt inf M = −1 und sup M = 1. Insbesondere erkennt man: inf M 6∈ M und
sup M ∈ M .
Definition: (Maximum und Minimum)
1. Gilt bei der nach oben beschränkten Menge M ∈ IR
sup M ∈ M
so heißt sup M das Maximum von M ; man schreibt für das Maximum von M :
max M
2. Gilt bei der nach unten beschränkten Menge M ∈ IR
inf M ∈ M
so heißt inf M das Minimum von M ; man schreibt für das Minimum von M :
min M
Beispiel: Bei endlichen Mengen M ∈ IR sind stets max M und min M vorhanden.
Begründung: Eine endliche Menge M ∈ IR besitzt die Gestalt M = {a1 , a2 , . . . , an } mit
reellen Zahlen a1 , . . . , an . Die größte dieser Zahlen ist das Maximum, die kleinste das
Minimum von M .
Eine sehr wichtige Eigenschaft des Supremums stellt der folgende Sachverhalt dar3 :
Sei M ∈ IR nach oben beschränkt, und sei x0 = sup M . Sei weiter
x ∈ IR mit x < x0
Dann gibt es ein y ∈ M mit y > x.
x y
x0
M
Begründung: Gälte y ≤ x für alle y ∈ M , so wäre x eine noch kleinere obere Schranke
von M als x0 . Dieses wäre ein Widerspruch zu x0 = sup M .
3
der, entsprechend formuliert, auch für das Infimum gilt.
15
1.2 Die vollständige Induktion
1.2.1 Die Summenschreibweise
Die vollständige Induktion stellt ein Schema dar, mit dessen Hilfe man viele Aussagen im
Zusammenhang mit natürlichen Zahlen beweisen kann. Das zugrundeliegende Prinzip
ist nicht nur für die Mathematik sondern auch für die Informatik sehr bedeutsam.
Da wir die vollständige Induktion u. a. anhand von Formeln, in denen Summen vor-
kommen, kennenlernen wollen, ist es günstig, sich zuvor mit der Summenschreibweise
zu befassen.
Bei der Addition mehrerer Summanden führt man zur abkürzenden Schreibweise das
sogenannte Summenzeichen ein: Für reelle Zahlen4
a1 , a2 , . . . , an (n ∈ IN )
stellt man deren Summe mit Hilfe des Summenzeichens dar:

n
X
ai = a1 + a2 + . . . + an
i=1
Beispiele:
10
X 1 1 1 1
= + + ... +
i=1
2+i 3 4 12
100
X
i = 1 + 2 + 3 + . . . + 100 (mit ai = i)
i=1
In dem Ausdruck n
X
ai
i=1
heißt der Index i Summationsindex , die Indexwerte 1 und n sind die untere - und die
obere Summationsgrenze. Man beachte, daß die untere Summationsgrenze einen anderen
ganzzahligen Wert als 1 annehmen kann. Ein häufig vorkommender Wert der unteren
Summationsgrenze ist Null. Ist der Wert der unteren Summationsgrenze größer als der
der oberen, so handelt es sich um eine leere Summe. Die leere Summe ist eine Summe
ohne Summanden, ihr wird der Wert Null zugeordnet.
Bedeutsam für den Umgang mit dem Summenzeichen sind die folgenden Regeln5 : (n, m ∈
4
Die ai sind indizierte Unbestimmte, i ist der Index, die Indexwerte sind hier 1, 2, 3, . . . , n.
5
Diese Regeln gelten entsprechend für eine beliebige untere Summationsgrenze.
16
IN , 1 ≤ m ≤ n)
n
X m
X n
X
1) ai = ai + ai (Aufteilung)
i=1 i=1 i=m+1
n
X n
X
2) λ· ai = (λ · ai ) mit λ ∈ IR (Ausmultiplizieren)
i=1 i=1
n
X n
X n
X
3) ai + bi = (ai + bi ) (gliedweise Addieren)
i=1 i=1 i=1
n
X n+l
X
4) ai = ai−l (Indexverschiebung um l ∈ ZZ )
i=1 i=1+l
1.2.2 Das Prinzip der vollständigen Induktion
Um mit einem Anwendungsbeispiel der vollständigen Induktion zu beginnen, wird eine

sehr bedeutsame, auf Gauß zurückgehende Summenformel bewiesen.
Satz: Für n ∈ IN ist

n
X n(n + 1)
i = (1.3)
i=1
2
Beweis: (Durch vollständige Induktion) Zunächst wird die Aussage für n = 1 gezeigt;
dieses ist der sogenannte Induktionsanfang:
Sei also n = 1; setzt man dieses in beide Seiten von (1.3) ein, so erhält man:
1
X
linke Seite = i = 1
i=1
1(1 + 1)
rechte Seite = = 1
2
Beide Seite besitzen für n = 1 denselben Wert; damit ist (1.3) für n = 1 bewiesen.
Im zweiten Schritt, dem sogenannten Induktionsschluß nimmt man an, die Behauptung
sei bereits für n − 1 bewiesen, und leitet daraus die Behauptung für n selber ab.
Man beginnt, indem man in die Formel (1.3) für n den Ausdruck n − 1 einsetzt:
n−1
X (n − 1)n
i =
i=1
2
17
Dieses ist die Induktionsvoraussetzung, von deren Richtigkeit man ausgeht und aus der
man durch zulässige Umformungsschritte die Aussage für n selber herzuleiten versucht:
n−1
X (n − 1)n
i = 2
+n
i=1
n
X (n − 1)n
⇒ i = 2 +n
i=1
(n − 1)n + 2n
= 2 = n· n+
2
1
Mit der letzten Zeile wurde die Gleichung (1.3) für den Fall n hergeleitet. qed.
Die Gleichung (1.3) ist hiermit vollständig bewiesen. Dieses wird deutlich, wenn man
das allgemeine Prinzip der vollständigen Induktion betrachtet:
Das gestellte Ziel bei der vollständigen Induktion besteht darin, eine Aussage P (n)
für alle n ∈ IN zu beweisen. Dieser Beweis wird in zwei Schritten ausgeführt: dem
Induktionsanfang und dem Induktionsschluß.
1. Man weist nach, daß die Aussage für n = 1, wahr ist, d. h. man beweist P (1).
2. Man setzt voraus, daß P (n − 1) bereits bewiesen ist ( Induktionsvoraussetzung“)
”
und leitet daraus P (n) ab (n ≥ 2), d. h. man beweist die Richtigkeit der Folgerung
P (n − 1) =⇒ P (n) für n ≥ 2.
Damit ist die Aussage für alle n ∈ IN bewiesen: für jedes feste n ≥ 2 folgt das aus der
Gültigkeit der Ableitungskette
P (1) ⇒ P (2) ⇒ · · · ⇒ P (i − 1) ⇒ P (i) ⇒ · · · ⇒ P (n)
| {z } | {z }
wurde direkt ge- diese Folgerung wur-
zeigt de gezeigt
Zur Verdeutlichung soll noch einmal klargestellt werden, warum die Aussage P (n) für
ein beliebig ausgewähltes n0 ∈ IN (d. h. P (n0 )) richtig ist:
P (n0 ) gilt, da P (n0 − 1) gilt.
P (n0 − 1) gilt, da P (n0 − 2) gilt.
P (n0 − 2) gilt, da P (n0 − 3) gilt.
usw.
P (2) gilt, da P (1) gilt.

P (1) wurde direkt bewiesen.
Als weiteres Beispiel zeigen wir den

Satz: (Summenformel für die Quadratzahlen) Für jedes n ∈ IN ist
n
X n(n + 1)(2n + 1)
i2 = (1.4)
i=1
6
18
Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang):
linke Seite = 12 = 1
1(1 + 1)(2 + 1)
rechte Seite = = 1
6
“n − 1 ⇒ n“ (Induktionsschluß): In (1.4) wird für n der Ausdruck n − 1 eingesetzt; die
so entstehende Induktionsvoraussetzung wird geeignet weiter umgeformt:
n−1
X (n − 1)n(2n − 1)
i2 = 6
+ n2
i=1
n
X (n − 1)n(2n − 1)
⇒ i2 = 6 + n2
i=1
(n − 1)n(2n − 1) + 6n2
= 6 (n ausklammern)
(n − 1)(2n − 1) + 6n
= n· 6 (ausmultiplizieren)
(2n2 + 2n) + (n + 1)
= n· 6 (n + 1 ausklammern)
(2n + 1)
= n · (n + 1) · 6
Dieses ist die zu beweisende Aussage (1.4) für den Fall n. qed.
Die vollständige Induktion ist nicht zum Nachweis von Summenformeln geeignet. Im
weiteren Verlauf der Vorlesungen wird man dazu noch mehrere Bespiele sehen. Eben-
so geben die nächsten beiden Anwendungen einen Hinweise auf die vielfältigen Ein-
satzmöglichkeiten der vollständigen Induktion.
Satz: Für alle n ∈ IN ist die Zahl
5n + 7 (1.5)
durch 4 teilbar.
“n = 1“ (Induktionsanfang): Setzt man in (1.5) n = 1 ein, so erhält man den Wert 12,
und 12 ist durch 4 teilbar. Die Behauptung ist damit für den Fall n = 1 beweisen.
“n − 1 ⇒ n“ (Induktionsschluß): Vorausgesetzt wird, daß für jedes n ≥ 2 der Ausdruck
5n−1 + 7 durch 4 teilbar ist. Zu zeigen ist dann, daß sich daraus die
Teilbarkeit durch 4 von 5n + 7
ergibt. Dazu ist der Ausdruck 5n + 7 geeignet auf den Vorgängerausdruck 5n−1 + 7
19
zurückzuführen:
5n + 7 = 5 · 5n−1 + 7
= (4 + 1) · 5n−1 + 7
= 5n−1}
|4 · {z + n−1
|5 {z+ 7} (1.6)
durch 4 teilbar durch 4 teilbar nach
Induktionsvoraussetzung
Als Summe zweier durch 4 teilbarer Ausdrücke ist auch 5n + 7 durch 4 teilbar. Damit
ist alles bewiesen. qed.
Der nächste Satz, an dessen Beweis die vollständige Induktion vorgeführt werden soll,
betrifft eine sehr wichtige Größe, die sogenannte Fakultät:
Definition: Sei n ∈ IN0 ; dann heißt die Zahl
(
1 für n = 0
n! = (1.7)
1 · 2 · 3 · . . . · n für n > 0
die Fakultät von n. Man sagt zu n! n-Fakultät“.

”
Beispiel: 1! = 1, 2! = 1 · 2 = 2, 3! = 1 · 2 · 3 = 6, 4! = 1 · 2 · 3 · 4 = 24.
Man beachte, daß die Werte der Fakultät sehr schnell sehr groß werden. Es ist etwa
10! = 3628800 sowie 20! = 2432902008176640000.
Die Fakultät besitzt eine sehr wichtige Deutung; dieses ist Inhalt des folgenden Satzes
Satz: Für n ∈ IN sei eine Menge mit n Elementen gegeben. Dann ist der Wert n! die
Anzahl der Möglichkeiten, die n Elemente dieser Menge anzuordnen.
Vor dem Beweis folgt ein

Beispiel: Für die Elemente der Menge {a, b} bestehen 2! = 2 Anordnungen: a, b und
b, a. Für die Elemente der dreielementigen Menge {a, b, c} gibt es folgende Anord-
nungsmöglichkeiten:
a, b, c b, a, c b, c, a
a, c, b c, a, b c, b, a
Dieses sind genau 3! = 6 Anordnungen.
Beweis des Satzes: (Durch vollständige Induktion)

“n = 1“ (Induktionsanfang): Man betrachte die einelementige Menge M = {a1 }. Deren
einziges Element kann nur in der einen Form
a1
angeordnet werden. Somit bestehen in der Tat für diese Menge 1 = 1! Anordungsmöglich-
keiten, und die Behauptung wäre damit für den Fall n = 1 bewiesen.
“n − 1 ⇒ n“ (Induktionsschluß): Man betrachte für n ≥ 2 die Menge mit n Elementen
M = {a1 , a2 , a3 , . . . , an }
20
und dazu deren Teilmenge ohne das letzte Element
M 0 = {a1 , a2 , a3 , . . . , an−1 }
Jetzt kann man folgern:
• Nach Induktionsvoraussetzung besitzen die n − 1 Elemente a1 , . . . , an−1 von M 0

genau (n − 1)! Anordungsmöglichkeiten.
• Bei Hinzunahme des Elementes an können aus jeder einzelnen Anordung der
a1 , . . . , an−1 genau n Anordnungen der n Elmente a1 , . . . , an−1 , an gebildet wer-
den.
Geht man nämlich von einer bestenden, festen Anordnung der a1 , . . . , an−1 aus, so
gibt es n verschiedene Möglichkeiten, an in diese Anordnung einzufügen:
an an an an an an an
? w ? w ? w ? w ? r r r ? w ?
Position Position Position Position Position

1 2 3 4 n−1
an könnte jeweils vor das Elemente an Position 1, an Position 2, . . . bzw. an
Position n−1 gesetzt werden und zuzüglich noch hinter das letzte, d. h. an Position
n − 1 stehende Element gestellt werden. Man erkennt, daß auf die Weise aus der
ursprünglichen einen gegeben Anordnung der a1 , a2 , . . . , an−1 genau n verschiedene
Anordnung der a1 , a2 , . . . , an entstehen.6
• Damit kann die Anzahl der Anordnung der a1 , a2 , . . . , an berechnet werden:
(n − 1)! · n
|{z} (1.8)
| {z }
Anzahl der Jede einzelne
Anordnungen Anordnungen
der a1 , . . . , an−1 der a1 , . . . , an−1
nach liefert
Induktions- n Anordnungen
voraussetzung der a1 , . . . , an .
= 1 · 2 · 3 · · · (n − 1) · n = n! (1.9)
| {z }
(n−1)!
Damit die Behauptung vollständig bewiesen. qed.
Bemerkung: Es ist nicht so, daß die vollständige Induktion immer bei n = 1 beginnen
muß. Es ist auch möglich, den Induktionsanfang bei n = a mit einem beliebigen a ∈ ZZ
beginnen zu lassen. Dadurch wird dann die Richtigkeit einer Aussage P (n) für n ∈ {u |
u ∈ ZZ und u ≥ a} bewiesen. Das Schema der vollständigen Induktion wird aber in
einem solchen Fall ganz entsprechend angewandt.
6
Man müßte zur Vollständigkeit noch zeigen, daß jede Anordnung der a1 , . . . , an sich auf diese Weise
aus einer Andordnung der a1 , . . . , an−1 gewinnen läßt. Das ist aber klar!
21
In den beiden folgenden Beweisen erfolgt der Induktionsanfang nicht bei n = 1. Die
zugehörigen Aussagen dienen hier nicht nur als Beispiel für die vollständige Induktion,
sie sind auch für das Folgende sehr bedeutsam. Dazu gehört vor allen Dingen die sehr
häufig verwendete Summenformel für die endliche geometrische Reihe:
Satz: (Summenformel für die endliche geometrische Reihe) Für n ∈ IN0 und q ∈ IR
mit q 6= 1 gilt
n
X 1 − q n+1
qi = (1.10)
i=0
1−q
Beweis: (Durch vollständige Induktion) Hier wird der Induktionsanfang bei n = 0 durch-
geführt:
linke Seite = q 0 = 1
1 − q 0+1 1−q
rechte Seite = = = 1
1−q 1−q
“n − 1 ⇒ n“ (Induktionsschluß):
n−1
X 1 − qn
qi = 1−q
+ qn
i=0
n
X 1 − qn n 1−q
⇒ qi = 1−q + q · 1−q (Ausmultiplizieren und bei-
i=0 de Brüche zusammenfassen)
1 − q n + q n − q n+1 1 − q n+1
= 1−q = 1−q
qed.
Beispiel: Mit q = 2 und n = 10:

10
X 1 − 210+1
1 + 2 + 4 + 8 + . . . + 1024 = 2i = = 211 − 1 = 2047
i=0
1−2
Im nächsten Satz ist die Aussage nur für n ≥ 2 gültig, der Induktionsanfang wird bei
n = 2 durchgeführt.
Satz: (Bernoullische Ungleichung) Für n ∈ IN0 mit n ≥ 2 sowie a ∈ IR mit a 6= 0 und

a > −1 gilt
(1 + a)n > 1 + n · a (1.11)

“n = 2“ (Induktionsanfang): Die erste Binomische Formel liefert
(1 + a)2 = 1 + 2a + a2
> 1 + 2a
22
Die Ungleichung gilt, da in der letzten Zeile der positive Summand a2 weggelassen
wurde. Die so hergeleitete Ungleichung stellt genau die Aussage (1.11) für n = 2 dar.
“n − 1 ⇒ n“ (Induktionsschluß): Setzt man in (1.11) für n den Ausdruck n − 1 ein, so
erhält man als Induktionsvoraussetzung die Ungleichung
(1 + a)n−1 > 1 + (n − 1)a
Wegen a > −1 ist 1 + a > 0. Multipliziert man eine Ungleichung mit einem positi-
ven Faktor, so bleibt diese gemäß der Anordnungsaxiome erhalten. Damit kann man
schließen:

(1 + a)n−1 > 1 + (n − 1)a × (1 + a)
⇒ (1 + a)n > (1 + (n − 1)a) · (1 + a) (Ausmultiplizieren)

= 1 + (n − 1)a + a + (n − 1)a2 (Weglassen des positi-
ven Summanden
(n − 1)a2 )
> 1 + na
⇒ (1 + a)n > 1 + na
qed.
Bemerkung: In diesem Beweis wurde zweimal die folgende Aussage verwendet: Läßt man
auf einer Seite einer Gleichung einen positiven Summanden weg, so wird diese Seite der
Gleichung kleiner als die andere. Anders ausgedrückt lautet dieses: Für x, y, z ∈ IR
mit x = y + z und z > 0 folgt x > y. Aufgabe: Leiten Sie diese Aussage aus den
Anordnungsaxiomen ab.
Frage: An welchen Stellen gingen im Beweis der Bernoullischen Ungleichung die Voraus-
setzungen a > −1 und ≥ 2 ein?
1.2.3 Der Binomische Lehrsatz
Vorbereitend für den Binomischen Satz wird der sogannate Binomialkoeffizient ein-
geführt. Er baut auf der Fakultät (siehe Seite 20) und zählt ebenso wie diese zu den
Grundbegriffen der Kombinatorik 7 .
Definition: Seien n, k ∈ IN0 mit k ≤ n gegeben; dann heißt die Zahl

n n!
=
k k! · (n − k)!
der Binomialkoeffizient von n und k. Man sagt zu dem Binomialkoeffizient von n und
k: n über k“.
”
Beispiel:

5 5! 5·4·3
= = = 10
3 3! · 2! 6
7
Die Kombinatorik ist die Theorie der endlichen Mengen.
23
Aus der Definition des Binomialkoeffizienten ergeben sich sofort einige Regeln:

n n
= = 1
0 n

n n
= = n
1 n−1

n n
=
k n−k
Bemerkung: Man erhält eine zum praktischen Rechnen geeignetere Darstellung des Bi-
nomialkoeffizienten, wenn man die Fakultät im Zähler sowie die zweite Fakultät im
Nenner ausschreibt und anschließend kürzt:

n n!
=
k k! · (n − k)!
n · (n − 1) · · · (n − k + 1) · (n − k) · (n − k − 1) · · · 1
=
k! · (n − k) · (n − k − 1) · · · 1
n · (n − 1) · · · (n − k + 1)
= (1.12)
k!
Ebenso wie die Fakultät besitzt der Binomialkoeffizient eine Bedeutung im Zusammen-
hang mit endlichen Mengen:
Ist eine Menge mit n Elementen gegeben, so gibt der Binomialkoeffizient nk an, wie viele

Möglichkeiten bestehen, aus dieser Menge eine Teilmenge von k Elementen auszuwählen.
Beispiel: Beim Samstagslotto werden aus 49 Kugeln 6 Kugeln ausgewählt. Dabei beste-
hen 49

6
Auswahlmöglichkeiten.
' $
t
t t t
t t Wie viele Möglichkeiten beste-
t t t t t
t t hen, aus 20 Elementen 5 aus-
t t
t t zuwählen?
t t t
& %
Die Deutung des Binomialkoeffizienten soll plausibilisiert werden. Dazu wird ähnlich
wie bei der Plausibilisierung der Deutung der Fakultät vorgegangen: man kann jede
k-elementige Teilmenge erzeugen, indem man aus den insgesamt n Elementen nachein-
ander k Elemente auswählt. Es soll zunächst gezählt werden, wie viele Möglichkeiten
solcher k-fachen Auswahlen aus einer n-elementigen Menge bestehen:
24
Für das erste Element bestehen n Aus-
wahlmöglichkeiten.
Für das zweite Element verbleiben n−1 Dieses ergibt soweit n·(n−1) Auswahl-
Auswahlmöglichkeiten. möglichkeiten.
Für das dritte Element verbleiben n−2 Dieses ergibt soweit n · (n − 1) · (n − 2)
Auswahlmöglichkeiten. Auswahlmöglichkeiten.
usw.
Für das k − 1-te Element verbleiben Dieses ergibt soweit
noch n − (k − 2) = n − k + 2 Auswahl- n · (n − 1) · (n − 2) · · · (n − k + 2) Aus-
möglichkeiten. wahlmöglichkeiten.
Für das k-te Element verbleiben Dieses ergibt insgesamt
schließlich n − (k − 1) = n − k + 1 Aus- n·(n−1)·(n−2) · · · (n−k+2)·(n−k−1)
wahlmöglichkeiten. Auswahlmöglichkeiten.
Nun kommen bei diesen k-fachen Auswahlen nicht nur alle k-elementigen Teilmengen
vor; es kommt unter ihnen vielmehr jede mögliche Anordnung einer jeden k-elementigen
Teilmengen vor. Damit ergibt sich:
Anzahl der k-elementigen Teilmengen

Anzahl der k-fachen Auswahlen
=
Anzahl der Anordnungmöglichkeiten einer k-elementigen Teilmenge
n · (n − 1) · (n − 2) · · · (n − k + 2) · (n − k − 1)
=
k!

n
= (Siehe Gleichung 1.12.)
k
Eine wichtige Rechenregel des Binomialkoeffizienten beinhaltet der folgende

Satz: Seien n, k ∈ IN0 mit 0 < k < n, dann gilt die Summenregel:

n−1 n−1 n
+ = (1.13)
k−1 k k
25
Beweis:

n−1 n−1
+
k−1 k
(n − 1)! (n − 1)!
= +
(k − 1)! · (n − 1 − (k − 1))! k! · (n − 1 − k)!
(n − 1)! (n − 1)! (auf den Hauptnen-

= +
(k − 1)! · (n − k)! k! · (n − k − 1)! ner bringen)
(n − 1)! · k (n − 1)! · (n − k)
= +
k · (k − 1)! · (n − k)! k! · (n − k − 1)! · (n − k)
(n − 1)! · k + (n − 1)! · (n − k)
=
k! · (n − k)!
(n − 1)! · (k + (n − k)) (n − 1)! · n

= =
k! · (n − k)! k! · (n − k)!

n! n
= =
k! · (n − k)! k
qed.
Jetzt folgt der Satz, der das Hauptziel dieses Abschnitts darstellt. Er ist eine Verallge-
meinerung der ersten Binomischen Formel:
Satz: (Binomischer Lehrsatz ) Für a, b ∈ IR und n ∈ IN gilt

n
n
X n k n−k
(a + b) = a b (1.14)
k=0
k
Bemerkung: Für n = 2 ist dieses die erste Binomische Formel.

linke Seite = (a + b)1 = a + b
1
X 1 k 1−k
rechte Seite = a b = b+a
k
k=0 | {z }
=1
“n − 1 ⇒ n“ (Induktionsschluß):
n−1
n−1
X n − 1 k n−1−k
· (a + b)
(a + b) = a b
k=0
k
n−1
X n−1
(a + b)n
= (a + b) · ak bn−1−k (ausmultiplizieren)
k=0
k
n−1 n−1
X n−1 k+1 n−1−k
X n − 1 k n−k
= a b + a b
k=0
k k=0
k
26
Bei der ersten dieser beiden Summen wird eine Indexverschiebung durchgeführt, indem
bei allen Summanden dieser Summe k durch k − 1 ersetzt und die beiden Indexgrenzen
entsprechend angepaßt werden:
n n−1
n
X n − 1 k n−k X n − 1 k n−k
(a + b) = a b + a b
k=1
k − 1 k=0
k
n−1 n−1
n − 1 n X n − 1 k n−k X n − 1 k n−k n−1 n
= a + a b + a b + b
n−1 k=1
k−1 k=1
k 0
| {z } | {z }
zu k=n zu k=0
Aus der ersten Summe ist der letzte, aus der zweiten der erste Summand herausgenom-
men worden. Die Indexbereiche beider Summen sind damit gleich, die beiden Summen
können zusammengefaßt werden. Man schließt weiter:
n−1
n n−1 n X n−1 n−1 k n−k n−1 n
(a + b) = a + + a b + b
n−1 k=1 |
k−1 k 0
| {z } {z } | {z }
=1=(n
n)
=(n
k)
(nach (1.13)) =1=(n
0)
n−1
n n X n k n−k n n (Alles unter ein Sum-
= a + a b + b
n k 0 menzeichen bringen.)
| {z } k=1 | {z }
zu k=n zu k=0
n
X n k n−k
= a b
k=0
k
qed.
1.3 Der Begriff der Funktion

Definition: Gegeben seien zwei nichtleere Mengen M und N ; eine Funktion f von M
nach N
f : M 7→ N
ist eine Zuordnungsvorschrift, die jedem Element x ∈ M genau ein Element y ∈ N
zuordnet. Man schreibt für dieses y:
y = f (x)
Beispiel:
1. Sei M = {Menschen}, N = {Zeichenketten} und
f : M 7→ N mit f (x) =der vollständige Name von x“
”
Unter der Annahme, daß jeder Mensch genau einen Namen besitzt, ist f (x) eine
Funktion.
27
2. Die Temperatur T , die an einem bestimmten Ort herrscht, wird während der Zeit
von t = a bis t = b betrachtet; diese liefert eine Zuordnung
t 7→ T = f (t) für a ≤ t ≤ b
und damit eine Funktion f : I = [a, b] 7→ IR .
Zwischen zwei endlichen Mengen läßt sich eine Funktion folgendermaßen darstellen:
f
' $ ' $
w - w
1

w
w
XX : w

XXX
w : w
X
X
XXX
w z w

XXX
X

w

w
& % & %
M N
Bedeutsam ist bei einer Funktion, daß von jedem Element der links stehenden Menge
M genau ein Pfeil ausgeht. Bei einer Funktion f : M 7→ N ist jedoch möglich,
• daß es x1 , x2 ∈ M mit x1 6= x2 , aber
f (x1 ) = f (x2 )
gibt;
• daß es ein y ∈ N gibt, zu dem es kein x ∈ M mit f (x) = y gibt.

Dieses führt auf die folgende
Definition: Die Funktion f : M 7→ N heißt genau dann umkehrbar, wenn gilt:
1. zu jedem y ∈ N gibt es ein x ∈ M mit
f (x) = y
(man sagt: f ist surjektiv);
2. für x1 , x2 ∈ M mit x1 6= x2 ist stets
f (x1 ) 6= f (x2 )
(man sagt: f ist eineindeutig oder injektiv).
Bemerkung: Bei einer umkehrbaren Funktion ist insbesondere zu einem vorgegebenen

y ∈ N das x ∈ M mit f (x) = y eindeutig bestimmt.
Bei einer umkehrbaren Funktion entsprechen sich alle Elemente von M und N paar-
weise (siehe Zeichnung). Die Bezeichnung umkehrbar“ wird durch den folgenden Satz
”
gerechtfertigt.
Beispiel einer umkehrbaren Funktion:
28
M f N
' $ ' $
| - |
| - |
|
|
XX
XXX

X
:
z |
XX
|

X
& % & %
Satz: Die Funktion f : M →

7 N ist genau dann umkehrbar, wenn die Umkehrfunktion
oder inverse Funktion von f

−1 −1 Das zu y eindeutig bestimmte
f : N 7→ M mit f (y) =
x ∈ M mit f (x) = y
existiert.
Setzt man f (x) und f −1 (y) ineinander ein, so folgt für y = f (x) bzw. x = f −1 (y)
f −1 (f (x)) = f −1 (y) = x und f (f −1 (y)) = f (x) = y (1.15)
Diese Gleichungen besagen: Wendet man eine umkehrbare Funktion f auf ein Element
x ∈ M an und wendet man darauf wiederum die Umkehrfunktion f −1 an, so erhält man
das ursprüngliche Element x zurück. Das entsprechende gilt, wenn man auf ein y ∈ N
zunächst f −1 und danach f anwendet.
Die bereits als Spezialfall in den Gleichungen 1.15 vorkommende Ineinandersetzung zwei-
er Funktionen ist Inhalt der folgenden
Definition: Sind drei nichtleere Mengen M , N und P und die beiden Funktionen
f : M 7→ N und g : N 7→ P
gegeben, dann heißt die Funktion
g ◦ f : M 7→ P
mit
g ◦ f (x) = g(f (x))
für x ∈ M die Verknüpfung, Ineinandersetzung oder Komposition der Funktionen f und
g.
:
g◦f XX
XXX
XXX
XX
' $f ' $g '
z
$
| - | - |
|

: - |
| |
: |
PP :
P PP
P
|
PP
PPP
|
P
P P
PPP P

|
PP
PP P
| q |
PP
PP
q P
& % & % & %
M N P
29
Beispiel: M = N = P = IR
f : x −→ x + 1
g : x −→ x2
g ◦ f : x −→ (x + 1)2
Mit den Bezeichnungen der Definition lauten die Gleichungen 1.15
(f −1 ◦ f )(x) = x für alle x ∈ M

(1.16)
und (f ◦ f −1 )(y) = y für alle y ∈ N
1.3.1 Liste wichtiger Bezeichnungen bei Funktionen

Seien M und N zwei nichtleere Mengen und
f : M 7→ N
eine Funktion zwischen ihnen. Dann gelten die folgenden Bezeichnungen:
x das Argument von f

f (x) der Funktionswert von f an der Stelle x

x −→ f (x) Angabe der Zuordnungsvorschrift
y = f (x) Beispiel: M = N = IR , x 7→ f (x) = x3
M der Definitionsbereich der Funktion f

N die Zielmenge der Funktion f
die Bildmenge oder der Wertebereich von f :
f (M )
{y ∈ N | es gibt ein x ∈ M mit y = f (x)}
f ist reelle Funktion M ⊂ IR und N ⊂ IR
für eine reelle Funktion f : die größte Teilmenge von IR auf
der die definierende Zuordnungsvorschrift für f noch gültig
ist. Beispiel:
Dmax 1
x −→
1−x
Dmax = IR \ {1}
Bemerkung: Die Funktion ist genau dann surjektiv , wenn N = f (M ), d. h. wenn die
Zielmenge gleich dem Wertebereich ist.
30
1.3.2 Das Schaubild einer reellen Funktion
Man stellt eine reelle Funktion
f : M 7→ N dabei ist M, N ⊂ IR
anschaulich dar, in dem man in der Ebene IR2 die Punkte mit den Koordinaten (x, f (x)
für x ∈ M kennzeichnet. Bei vielen Funktionen ergeben die so markierten Punkte eine
Kurve bzw. mehrere Kurvenstücke.
Beispiel: Die reelle Funktion f : IR 7→ IR sei definiert durch
(x − 2)2 1
f (x) = +
2 2
Das Schaubild dieser Funktion oberhalb des Intervalls [0, 4] ist
3
... .. f (x)
... ..
... .
2 ...
... ...
.... .
y .... ......
.... ..
..... .
. ...
.
1 ..... ...u (3, f (3)) = (3, 1)
.......
.......... ...
. .....
.
...........................
0
0 1 2 3 4
x
Anhand des Schaubildes erkennt man leicht, ob es auch wirklich eine Funktion darstellt:
Oberhalb eines jeden Punktes aus dem Definitionsbereich M ⊂ IR muß genau ein Punkt
des Schaubildes liegen.
Beispiel: Das folgende Schaubild

4
..........................
......................
.................
................
3 ...........u. (x, y2 ) = (3, 2.651)
...........
........
......
....
...
y 2 .
....
..
..........
....
1 .........u......
......
....
... .............. (x, y1 ) = (3, 0.849)
..
. ..
..
.......
...........................
.
0 ........
0 1 2 3 4 5
x
stellt keine Funktion f : IR 7→ IR dar, denn
1. es gibt etwa zu x = 3 zwei Werte y1 , y2 ∈ IR , so daß die beiden Punkte (x, y1 )
und (x, y2 ) auf dem Schaubild liegen;
31
2. es gibt für x > 4 kein y ∈ IR mit f (x) = y
Das Schaubild der Umkehrfunktion f −1 einer umkehrbaren Funktion f : IR 7→ IR erhält

man,
• indem man das Schaubild von y = f (x) verwendet, dabei jedoch y als unabhängige
und x als abhängige Veränderliche auffaßt;
• oder, damit wie üblich die Achse der unabhängigen Veränderlichen die waagerechte
Achse ist, indem man die beiden Achsen durch Spiegelung an der Winkelhalbie-
renden x = y vertauscht und gleichzeitig die beiden Variablen x und y ineinander
umbenennt. Das Schaubild von f −1 ist dann genau das Spiegelbild des Schaubildes
von f .
−1
5 . f (x) .
.. . . ...
.. .. .
.. . ...
..
.. .. .
4 .. . ... .
.. ..
.. . . ...
..
... .
. ... f (x)
3
.. .
.
. ... ...
...
.........
..
. .....
...
.
. .. ...
............
.....
y ... . ...
.. .
..............
2
.. .. .....
.........
... ... ... ..................
.......................
.
..
... . ..
.
1 .......................... ......
......... .
... . .
.............. .
.. .. ...
.. .
. . ...
.
... .
.. ... ...
−1 .. . . 1 2 3 4 5
... ..
.
... . x
.. −1 ..
Beispiel: Die Funktion
f : IR 7→ IR mit f (x) = x2
ist nicht umkehrbar: sie ist weder surjektiv (die negativen Zahlen werden nicht angenom-
men) noch eineindeutig (es ist etwa 1 = f (−1) = f (+1)). Um von f (x) = x2 dennoch
noch eine Umkehrfunktion zu erhalten, schränkt man sowohl den Definitionsbereich als
auch die Zielmenge von f (x) auf die Menge der nicht negativen Zahlen ein; die dadurch
entstehende Funktion
f : {x ∈ IR | x ≥ 0} 7→ {y ∈ IR | y ≥ 0}
√
x 7→ x
erfüllt beide Bedingungen für die Umkehrbarkeit; ihre Umkehrfunktion lautet

√
f −1 (x) = x
32
f (x) = x2
9 ... ..
.. ...
.. ..
8 .. .
... .. .
.. ..
7
... . ... .
. ..
6 ... .. ..
. .. .
5 ... .
...
.
y .
... ... .
4 . ..
... . ... √
.. f −1 (x) = x
3 ... .. ... ................
...
...
...
. .
... ... .. .....
.....
. ..
.......................
.........
2 . ... ..............
.........................
...
1 ..........
................
0 .......
0 1 2 3 4 5 6 7 8 9
x
Abbildung 1.1: Bei der Umkehrung von f (x) = x2 werden die beiden negativen Halb-
achsen weggelassen.
√
Dabei ist x die positive Quadratwurzel von x. Nunmehr besitzt f in der Tat eine Um-
kehrfunktion (die Quadratwurzelfunktion); diese ist aber nur auf dem eingeschränkten
Definitionsbereich, d.h. den nichtnegativen reellen Zahlen definiert.8 Weiterhin liegen
die Werte der Umkehrfunktion in der eingeschränkten Zielmenge der Ausgangsfunktion
f .9
1.3.3 Eigenschaften von Funktionen

1.3.3.1 Monotonie
Sei f : M 7→ N eine reelle Funktion. f heißt
monoton wachsend , falls für alle x, y ∈ M gilt
x<y =⇒ f (x) ≤ f (y),
streng monoton wachsend , falls für alle x, y ∈ M gilt

x<y =⇒ f (x) < f (y),
monoton fallend , falls für alle x, y ∈ M gilt

x<y =⇒ f (x) ≥ f (y),
streng monoton fallend , falls für alle x, y ∈ M gilt

x<y =⇒ f (x) > f (y),
monoton , falls f monoton wachsend oder monoton fallend ist,

streng monoton , falls f streng monoton wachsend oder streng monoton fallend ist.
8
Dieses erklärt, wieso man aus einer negativen Zahl keine Wurzel ziehen kann.
9
Das heißt hier: die Quadratwurzelfunktion nimmt nur nichtnegative Werte an.
33
1.3.3.2 Gerade – Ungerade
• f : IR 7→ IR heißt eine gerade Funktion, falls f (−x) = f (x) für alle x ∈ IR ist.
• f : IR 7→ IR heißt eine ungerade Funktion, falls f (−x) = −f (x) für alle x ∈ IR
ist.
Bemerkung: Es gibt Funktionen f : IR 7→ IR , die weder gerade noch ungerade sind.

Beispiel: f (x) = x + 1.
1.3.3.3 Beschränktheit
Sei f : M 7→ N eine reelle Funktion. f heißt
nach oben beschränkt , falls die Bildmenge f (M ) nach oben beschränkt ist,
nach unten beschränkt , falls die Bildmenge f (M ) nach unten beschränkt ist,
beschränkt , falls die Bildmenge f (M ) beschränkt ist.
Für nach oben oder unten beschränkte Funktionen definiert man:

sup(f ):=sup(f (M )) für nach oben beschränktes f
inf(f ) :=inf(f (M )) für nach unten beschränktes f
und entsprechend:

max(f ):=max(f (M ))
falls diese existieren
min(f ) :=min(f (M ))
Beispiel: Eine häufig verwendete Funktion ist die sogenannte Gaußklammer einer re-
ellen Zahl x; man schreibt dafür f(x) = [x]. Die Definition der Gaußklammer lautet:
f(x) = [x] = max{z | z ∈ ZZ , z ≤ x} (1.17)
[x] ist somit die größte ganze Zahl, die kleiner oder gleich x ist. Dieses ist genau der
ganze Anteil der reellen Zahl x. Für x > 0 entspricht das dem Weglassen der Nachkom-
mastellen von x. Die Gaußklammer besitzt das folgende Schaubild:
y
d
f(x) = [x]
2 d
1 d
d x
-1 1 2 3
d -1
Man beachte, daß etwa [π] = 3, aber [−π] = −4 ist. Prüft man nun nach, welche der
oben beschrieben Eigenschaften bei der Gaußklammer erfüllt ist, so stellt man fast, daß
die Gaußklammer
34
• weder injektiv noch surjektiv und damit auf keinen Fall umkehrbar ist,
• monoton wachsend, aber nicht streng monoton wachsend ist,
• nicht monoton fallend ist,
• weder gerade noch ungerade ist
• und weder nach oben noch nach unten beschränkt ist.
Aufgabe: Man begründe diese Aussagen über die Gaußklammer.
1.3.4 Einige grundlegende Funktionen

1.3.4.1 Lineare Funktionen
Sehr einfache, aber dennoch sehr bedeutsame Funktionen sind die linearen Funktionen.
Sie besitzen die Gestalt
f(x) = a x + b (1.18)
mit zwei (konstanten) Koeffizienten a, b ∈ R. Das Schaubild einer solchen Funktion ist
eine Gerade10 :
f(x) = ax +
b

f(x)

x
Die beiden Koeffizienten besitzen eine anschauliche Bedeutung: Bei b handelt es sich um
den y-Achsenabschnitt; es ist nämlich f(0) = b.
f(x) = ax +
b

f(x1 )

∆f

f(x0 )

b ∆x
x0 x1
Der Koeffizient a stellt die konstante Steigung, d. h. den Zuwachs der Funktion im
Verhältnis zur Differenz der zugehörigen x-Werte dar. Man rechnet nämlich nach:
∆f = f(x1 ) − f(x0 ) = (ax1 + b) − (ax0 + b) = a x1 − x0 = a (1.19)
∆x x1 − x0 x1 − x0 x1 − x0
Ist b = 0, also f(x) = a x, so ist f(x) linear im engeren Sinne. Zur Abgrenzung davon
nennt man solche Funktionen im Falle b 6= 0 auch als affin-linear.
10
eine unendliche ungekrümmte Linie
35
1.3.4.2 Quadratische Funktionen
Eine quadratische Funktion ist mit Koeffizienten a, b, c ∈ R, a 6= 0 durch
f(x) = a x2 + b x + c (1.20)
gegeben.
Das Schaubild einer solchen ...

quadratischen Funktion be- ... 1
...
... .
sitzt die Gestalt einer Parabel; ... ...
... ..
im Falle a > 0 ist diese Parabel ...
... .....
... ...
nach oben offen: −2 ...−1
.... 1 2 3..... 4
.... .
..
.... ...
.
Für a < 0 erhält man das um- .....−1
......
..... ..
gekehrte Bild einer nach unten ......
....... .
...
......
........ ....
offenen Parabel. ..........................................
−2
Häufig betrachtet man normierte quadratische Funktionen. Hierbei besitzt der höchste
Koeffizient a den Wert 1. Die verbleiben Koeffizienten bezeichnet man in der Regel mit
p und q:
f(x) = x2 + p x + q (1.21)
Zum Finden der Nullstellen, d. h. zum Lösen der Gleichung f(x) = 0, verwendet man
die bekannte “p-q-Formel“:
p 1p 2
− ± p −4q (1.22)
2 2
Man setzt dazu D = p2 − 4 q. Im Falle D > 0 liefert (1.22) zwei, im Falle D = 0 eine
und im Falle D < 0 keine (reelle) Lösung.
1.3.4.3 Potenz- und Wurzelfunktionen

Potenzfunktion besitzen die Gestalt
f(x) = xn mit n ∈ N (1.23)
Für die weitere Betrachtung ist eine Unterscheidung zwischen geraden und ungeraden
Exponenten n vorteilhaft. Sei zunächst n ungerade. In diesem Fall sind die Funktionen
(1.23) streng monoton wachsend; sie sind sogar injektiv und surjektiv und damit umkehr-
bar (bijektiv). Man kann dieses anhand der Schaubilder erkennen, die hier beispielhaft
für x3 und x7 gezeichnet sind:
36
2 . x7
...
..
...... x3
...
1 .
......
...
.........
... .
......................
........ .................................................................................
..................................
−1..... .......... 1
.........
......
...... −1
. ..
..
...
.
−2
Die Umkehrfunktion ist die Wurzelfunktion, die in diesem Fall für alle x ∈ R definiert
ist. Man schreibt dafür
√
f −1 (x) = n x (x ∈ R) (1.24)
Liegt ein gerader Exponent n vor, so besitzen die Potenzfunktionen Schaubilder der
Gestalt (hier beispielhaft für x2 und x6 gezeichnet):
... 1.8 . 6
... ... x
.. .
......... ...... x2
..... ...
......... 1 .
.........
... ........ ... .
... ........ ........... ...
.... .......
...... ........... ....... ...
..................... .......... . . . . . . ..............................................
......................................................
−1 1
Man erkennt unmittelbar, daß diese Funktionen weder injektiv noch surjektiv sind. Um
aber doch zumindest teilweise diese Funktion umkehren zu können, schränkt man sie
auf die nicht negativen reellen Zahlen ein. Dieses liefert die Funktionen
g : R \ {x < 0} −→ R \ {x < 0}
mit g(x) = f|{x≥0} (x) (1.25)
Die zugehörige Umkehrfunktion ist ebenfalls nur auf den nicht negativen reellen Zahlen
definiert:
g−1 : R \ {x < 0} −→ R \ {x < 0} (1.26)
Man schreibt auch dieses wieder als Wurzelfunktion, die aber jetzt – beim Vorliegen
eines geraden Exponenten – nicht für negative x-Werte definiert ist:
√
g−1 (x) = n x (x ∈ R, x ≥ 0) (1.27)
Für n = 2 ist dieses die übliche Quadratwurzel (siehe auch Seite 32); bekanntlich schreibt
man dafür nur
√ √
x = 2x (x ∈ R, x ≥ 0) (1.28)
37
Das Schaubild aller Wurzelfunktion für n ≥ 2 und x ≥ 0 ähnelt dem der Quadratwurzel:
1.5
.......
...
...
...
...............
.
.........
.
...
...
.............
.......
1
..
...
..........
....
..
.........
.
.....
..
......
....
.. ..
..
...
1 2
√
Bemerkung: Auch wenn für ungerades n die Wurzel x sowohl für positive als auch für n
negative x-Werte definiert ist, betrachtet häufig auch diese Wurzeln nur für x ≥ 0. Man
kann damit die Wurzelfunktionen einheitlich behandeln. Im Folgenden soll demgemäß
n sowohl gerade als auch ungerade sein können, und x sei stets nicht negativ.
Mit diesen Festsetzungen gelten die Gleichungen
√ n √n
n
x = x und xn = x (1.29)
sowie weiterhin
√ √ √
n
x·y = n
x· n
y (1.30)
Neben der Wurzelschreibweise ist die Potenzschreibweise mit gebrochenem Exponenten
üblich:
1 √
xn = n x (1.31)
Motiviert wird die Gleichung durch Anwendung der bekannten Regel (ak )l = ak·l :
1 n 1 n
1 n
xn = x n ·n = x n = x1 = x also: xn = x (1.32)
Jetzt muß man nur auf beiden Seiten von (1.32) die n-te Wurzel ziehen und anschließend
auf der linken Seite von (1.32) die zweite Gleichung in (1.29) verwenden.
Man erweitert (1.31) auf Potenzfunktionen mit beliebigen rationalen Exponenten. Sei
r ∈ Q zunächst eine positive rationale Zahl mit r = p/q und p, q ∈ N; dann setzt man
für x ∈ R, x ≥ 0:
√ p
f(x) = xr = q x (1.33)
oder gleichbedeutend
√
f(x) = xr = q
xp (1.34)
Ist dagegen r ∈ Q und r < 0, so setzt man r = −p/q mit wieder p, q ∈ N und definiert
für x > 0
1
f(x) = xr = √ q
(1.35)
xp
Die bekannten Regeln des Potenzierens (siehe (1.1)) gelten auch mit diesen rationalen
Exponenten:
Satz: Für x, y ∈ R+ und r, s ∈ Q gilt:
xr+s = xr · xs
(x · y)r = xr · y r (1.36)
(xr )s = xr·s
38
1.3.4.4 Die Funktion f (x) = 1/x
Hierbei handelt es sich um eine sogenannte gebrochen rationale Funktion11 Da eine
Teilung durch Null nicht möglich ist, ist diese Funktion nur für x 6= 0 definiert. Bei
x = 0 liegt eine sogenannte Polstelle vor. Ein Kennzeichen einer Polstelle besteht
darin, daß bei Annäherung von x an die Polstelle der Funktionswert f(x) gegen Plus-
oder Minusunendlich strebt:
3 ....
...
...
2 ...
...
...
....
1 ......
..........
.........................
............................................
.......................................................
−5 .................. −1 1 2 3 4 5
........
.....
...−1
...
...
...
...
...
...
.
Wie man anhand der Zeichnung erkennt, nähert sich umgekehrt der Funktionswert 1/x
beliebig stark der Null an, wenn x dem Betrage nach immer größer wird.
1.3.4.5 Exponentialfunktion und Logarithmus

Im Abschnitt 1.3.4.3 auf Seite 38 wurden für x > 0 Potenzfunktionen der Gestalt
f(x) = xr mit rationalen Exponenten r eingeführt. Hier soll umgekehrt für die Basis
dieser Potenz ein fester positiver reeller Wert a eingesetzt werden und der Exponent
veränderlich sein. Dieses liefert eine sogenannte Exponentialfunktion:
f(x) = ax mit einem a ∈ R+ (1.37)
Aufgrund der im Abschnitt 1.3.4.3 angestellten Betrachtungen ist diese Funktion zu-
nächst nur für x ∈ Q definiert. In natürlicher Weise läßt sich die Definition auf be-
liebige x ∈ R. Dieses wird mit Mitteln der Differential- und Integralrechnung in einer
nachfolgenden Vorlesung gezeigt werden. Als Standardwert für die Basis wählt man die
Eulersche Konstante:
e ≈ 2.71828183 (1.38)
Es handelt bei e um eine irrationale Zahl; der Grund für deren Wahl als Standardbasis
einer Exponentialfunktion wird später erläutert werden. Man erhält damit die Standar-
dexponentialfunktion12 :
exp(x) = ex (1.39)
11
Eine gebrochen rationale Funktion ist ein Quotienten zweier Polynome. Solche Funktionen werden
in einer nachfolgenden Vorlesung genauer behandelt werden.
12
in der Regel einfach als Exponentialfunktion“ bezeichnet
”
39
Es gelten die üblichen Regeln der Potenzrechnung13
ex+y = ex · ey
(ex )y = ex·y
(1.40)
e−x = 1x
e
0
e = 1
oder in anderer Schreibweise:

exp(x + y) = exp(x) · exp(y)
exp(x)y = exp(x · y)
(1.41)
exp(−x) = 1
exp(x)
exp(0) = 1
Die Exponentialfunktion exp(x) besitzt das Schaubild
12 ..
.. .
.
10
...
...
8 .. ..
.
.
.
.....
y 6 ..
......
...
4 ..
........
.
....
..
...
. .
.........
2 ..................
..
...
...
................
..........................................................................................
−3.0 −2.0 −1.0 0.0 1.0 2.0
x
Abbildung 1.2: f(x) = exp(x)
Man erkennt das typische Verhalten der Exponentialfunktion:
• exp(x) nimmt nur positive Werte an.
• Für x gegen Unendlich strebt exp(x) sehr schnell gegen Unendlich.
• Für x gegen Minusunendlich nähert sich exp(x) beliebig stark dem Wert Null an.
• exp(x) ist streng monoton wachsend.
Insbesondere ist exp(x) injektiv und, wenn man die Zielmenge auf R+ (die positiven
reellen Zahlen) einschränkt, auch surjektiv. Insbesondere liefert dieses eine umkehrbare
Funktion
exp : R −→ R+ (1.42)
13
Die Regel sind hier nur für die Standardbasis e formuliert, gelten aber entsprechend für andere
Basen a > 0.
40
Die zugehörige Umkehrfunktion
exp−1 : R+ −→ R (1.43)
wird logarithmus naturalis, natürlicher Logarithmus oder einfach nur als Loga-
rithmus genannt. Übliche Bezeichnungen sind
log(x) = exp−1 (x) oder auch ln(x) = exp−1 (x) (1.44)
Anhand des Schaubildes des Logarithmus (siehe Abbildung 1.3) erkennt man dessen
Eigenschaften14 :
• log(x) ist nur für x > 0 definiert.
• log(1) = 0
• log(x) > 0 ⇔ x > 1
• Für x gegen Null nähert sich log(x) Minusunendlich an.
• Für x gegen Unendlich strebt auch log(x) gegen Unendlich, wobei jedoch das
Wachstum immer geringer wird.
.......
...
...
...
...
...
...
....
...
...
.........................................
.
2.0 ...................
..
...
...
...
...
........................
.
..........
..
...
...
................
1.0 ......
...
. .
.........
.....
y 0.0 .
. ....
.... 2 4 6 8 10 12
.. .
−1.0 .. x
.
...
−2.0 ..
...
..
−3.0 ..
Abbildung 1.3: f(x) = log x
Da log und exp zueinander Umkehrfunktionen sind, gelten die Gleichungen
log (ex ) = x (1.45)

elog(x) = x (1.46)
Dabei gilt Gleichung (1.46) nur für x > 0. Diese Gleichung besagt unter anderem, daß
log(x) derjenige Exponent ist, mit dem man e potenzieren muß, um als Potenzwert x
zu erhalten.
Aus der Regel ex+y = ex ·ey (siehe (1.40)) ergibt sich das berühmte Logarithmusgesetz:
Für x, y ∈ R+ gilt:
log(x · y) = log(x) + log(y) (1.47)

14
Diese Eigenschaften werden in einer nachfolgenden Vorlesung noch genau hergeleitet und begründet
werden.
41
Beweis:

log(x · y) = log elog(x) · elog(y) Zweimal wurde (1.46) angewandt.

= log elog(x)+log(y) nach (1.40)
= log(x) + log(y) wieder nach (1.46)
qed.
+
Ebenso wichtig sind diese Folgerungen aus dem Logarithmusgesetz: Für x, y ∈ R , u ∈ R
gilt:

x
log = log(x) − log(y) (1.48)
y
log(xu ) = u · log(x) (1.49)
Beweis: Mit Hilfe von (1.47) folgt:

log xy = log x + log(y) − log(y) = log x · y − log(y)
y y
= log (x) − log(y)
Zum Nachweis von (1.49) verwendet man (1.40) und (1.46):

u
log (xu ) = log elog(x) = log eu·log(x)
= u · log(x)
qed.
Die Gleichungen (1.47), (1.48) und (1.49) rechtfertigen die große Bedeutung des Lo-
garithmus. Diese Gleichungen besagen, daß der Logarithmus eine Rechnungsart in die
nächst einfachere Rechnungsart überführt. So wird ein Produkt in eine Summen, ein
Quotient in eine Differenz und eine Potenz in ein Produkt verwandelt.
1.3.4.5.1 Rechenbeispiele mit dem Logarithmus 15

Eine häufige Frage betrifft die nächst größere Zweierpotenz einer gegebenen positiven
reellen Zahl a ∈ IR+ :
gegeben : a ∈ IR+
gesucht : n ∈ IN minimal mit 2n ≥ a (1.50)
Zum Bestimmen dieses n ∈ IN logarithmiert man beide Seiten der Ungleichung (1.50)
und verwendet (1.49) sowie die Monotonie des Logarithmus:
n · log(2) ≥ log(a) (1.51)
Wegen log(2) > 0 ist weiter
log(a)
n ≥ (1.52)
log(2)
15
Dieser Abschnitt wird nicht in der Vorlesung behandelt; es ist zum selbständigen Lesen vorgesehen.
42
Die kleinste natürliche Zahl n, die diese Ungleichung erfüllt, wird gesucht. Ist die rechte
Seite von (1.52) bereits in IN, so kann man
log(a)
n = (1.53)
log(2)
setzen. Andernfalls benötigt man die nächst größere natürliche Zahl; die erhält etwa
man mit Hilfe der Gaußklammer (siehe Seite 34):

log(a)
n = +1 (1.54)
log(2)
Beispielfrage: Jemand spielt ein Gewinnspiel, bei dem im Falle eines Gewinns der ein-
gesetzte Geldbetrag verdoppelt wird.
Wie oft müßte jemand hintereinander gewinnen, der mit einen Einsatz von einem Euro
beginnt und anschließend stets den bislang gewonnenen Betrag beim folgenden Spiel
wieder einsetzt, um anschließend mindestens 10 000 000 Euro zu erhalten?
Da nach jedem Spiel der Betrag verdoppelt wird, beläuft sich der Betrag nach n hinter-
einander gewonnen Spielen auf
1 · 2n (Euro)
n soll minimal gewählt werden, so daß dieser Wert mindestens 10 000 000 = 107 beträgt.
Nach (1.52) liefert dieses die Bedingung
log(107 ) 7 · log(10) · 2.3026 = 23.2535
n ≥ = = 70.69315
log(2) log(2)
Die nächst größere natürliche Zahl ist n = 24.
Beispielfrage: Wieviele Dezimalstellen besitzt die Zahl

31000 ? (1.55)
Allgemein lautet dieses Frage: Wieviele Dezimalstellen besitzt eine gegeben natürliche
Zahl a ∈ IN ?.
Zur Beantwortung dieser Frage wird die vollständige Dezimaldarstellung der Zahl a
verwendet:
a = zk · 10k + zk−1 · 10k−1 + . . . z1 · 10 + z0 (1.56)
Dabei sind die zi die dezimalen Ziffern, für die bekanntlich
0 ≤ zi ≤ 9 (i = 0, . . . k − 1)
(1.57)
1 ≤ zi ≤ 9 (die führende Ziffer)
Die gesuchte Anzahl der Dezimalstellen ist dann
k +1 (1.58)
zu deren Bestimmung zwei Ungleichungen hergeleitet werden. Da in (1.56) alle Sum-
manden nicht negativ sind, folgt als erstes
a = zk · 10k + zk−1 · 10k−1 + . . . + z1 · 10 + z0
≥ zk · 10k ≥ 10k (wegen zk ≥ 1)
⇒ a ≥ 10k (1.59)
43
Und weiter hat man wegen zi ≤ 9
a = zk · 10k + zk−1 · 10k−1 + . . . + z1 · 10 + z0

≤ 9 · 10k + 9 · 10k−1 + . . . + 9 · 10 + 9
k
X
= 9· 10i (endliche geometrische Reihe, siehe (1.10))
i=0
1 − 10k+1 1 − 10k+1
= 9 · = 9 · = 10k+1 − 1 < 10k+1
1 − 10 −9
⇒ a < 10k+1 (1.60)
(1.59) und (1.60) liefern zusammen
10k ≤ a < 10k+1 (1.61)
Hieraus folgt, daß 10k+1 die kleinste Zehnerpotenz ist, die größer als a ist. Logarithmiert
man (1.61), so erhält man entsprechend wie bei (1.51)
k · log(10) ≤ log(a) < (k + 1) · log(10)

log(a)
⇒ k ≤ < (k + 1) (1.62)
log(10)
Damit ist k die größte ganze Zahl, die kleiner oder gleich log(a)/ log(10) ist. Die erhält
man wiederum mit der Gaußklammer (siehe (1.17)). Die Anzahl der Dezimalstellen von
a ∈ IN lautet damit

log(a)
k+1 = +1 (1.63)
log(10)
Für 31000 aus (1.55) erhält man damit als Stellenzahl:
log(31000 )

1000 · log(3) 1000 · 1.0986
+1 = +1 = +1
log(10) log(10) 2.3026
= [477.12] + 1 = 478
Die Zahl 31000 besitzt somit 478 Dezimalstellen.
1.3.4.5.2 Der Logarithmus zu anderen Basen Definition:
log(x)
der dekadische Logarithmus : lg(x) =
log(10)
log(x)
der Logarithmus dualis : ld (x) =
log(2)
Für den dekadischen Logarithmus gilt dann etwa:

log(x)
10lg(x) = elog(10)·lg(x) = elog(10) log(10) = elog(x) = x
44
1.3.4.6 Polynome
1.3.4.6.1 Definition Die Funktion
p : IR 7→ IR
sei durch die Zuordnungsvorschrift
x 7→ p(x) = 2x7 + 2x3 + 1
gegeben; p(x) ist ein Beispiel für ein sogenanntes Polynom.

Definition: Eine Funktion p : IR 7→ IR mit einer Zurordnungsvorschrift der Gestalt
p(x) = an xn + an−1 xn−1 + . . . + a2 x2 + a1 x + a0

Xn
= ai x i
i=0
mit n ∈ IN0 und a0 , a1 , . . . , an ∈ IR heißt (reelles) Polynom. Die reellen Zahlen

a0 , a1 , . . . , an sind die sogenannten Koeffizienten des Polynoms.
Üblicherweise gibt man bei einem Polynom nur die Summanden mit von Null verschie-
denen Koeffizienten an, so wie in dem obigen Beispiel geschehen: in dem Ausdruck
p(x) = 2x7 + 2x3 + 1
wurde der Summand 0x2 weggelassen.
Eine Polynom ist durch seine Koeffizienten festgelegt, d. h.
Zwei Polynome sind genau dann gleich, wenn ihre Koeffizi-

enten an den entsprechenden Gliedern übereinstimmen.
Beispiel: Die beiden Polynome
p(x) = 2x7 + 2x3 + 1 und

q(x) = x17 + 2x7 + 3x3 + 1
sind nicht gleich, da sich die Koeffizienten an den Positionen 17 und 3 unterscheiden.
Das Polynom, dessen sämtliche Koeffizienten den Wert Null haben, heißt Nullpolynom;
man schreibt dafür einfach 0“. Das 0–te Glied, d. h. das Glied bei x0 , ist das sogenannte
”
konstante Glied.
Polynome haben in der Anwendung eine sehr große Bedeutung, unter anderem deshalb,
weil sich ihre Werte sehr leicht berechnen lassen16
z.B.: p(3) = 2 · 37 + 2 · 32 + 1 = 4393
Die Berechnung erfolgte durch einfaches Multiplzieren (einschl. Potenzieren) und Ad-
dieren/Subtrahieren.
Auch kann man mit Polynomen untereinander rechnen:
16
Wie man eine solche Berechnung auf besonders effektive Weise vornehmen kann, wird später gezeigt.
45
• Zwei Polynome werden addiert bzw. subtrahiert, indem ihre Koeffizienten an den
entsprechenden Gliedern addiert (subtrahiert) werden, z.B.:
p(x) + q(x) = (2x7 + 2x3 + 1) + (x17 + 2x7 + 3x3 + 1)

= x17 + 4x7 + 5x3 + 2
• Zwei Polynome werden miteinander multipliziert, indem man sie ausmultipliziert,

anschließend die einzelnen Glieder miteinander multipliziert:
(ai xi ) · (bj xj ) = (ai · bj )xi+j
und die Summanden mit gleichen Potenzen der Unbestimmten zusammenfaßt,

z. B.:
(x3 + 2x + 4) · (3x2 + x + 1)
= x3 · (3x2 + x + 1) + 2x · (3x2 + x + 1) + 4 · (3x2 + x + 1)
= 3x5 + x4 + x3 + 6x3 + 2x2 + 2x + 12x2 + 4x + 4
= 3x5 + x4 + 7x3 + 14x2 + 6x + 4
Neben der Addition/Subtraktion und der Multiplikation, die als Ergebnis stets wieder
ein Polynom liefern, ist auch eine Polynomdivision vorhanden; die Polynomdivision
geht jedoch im allgemeinen nicht auf, es bleibt dann ein (Divisions-) Rest.
Die Polynomdivision erfolgt auf dieselbe Art wie die schriftliche Division zweier Dezimal-
zahlen: Man beginnt, indem man das höchste Glied des Dividenden durch das höchste
Glied des Divisiors teilt, danach erfolgt die Gegenrechnung, und die Rechnung wird mit
dem höchsten Glied des verbliebenen Dividenden fortgesetzt; z. B.:
(2x5 +4x3 + 6) : (2x2 +2x) = x3 −x2 +3x−3

2x5 +2x4
−2x4 +4x3
−2x4 −2x3
6x3 + 6
6x3 + 6x2
− 6x2 + 6
− 6x2 − 6x
6x + 6
Ein weiterer Divisionsschritt ist hier nicht möglich, 6x + 6 bleibt als Divisionsrest, also
(2x5 + 4x3 + 6) : (2x2 + 2x) = x3 − x2 + 3x − 3 Rest 6x + 6

6x + 6
= x3 − x2 + 3x − 3 +
2x2 + 2x
Die Division geht genau dann auf, wenn der Rest Null ist; man nennt dann – wie bei
Zahlen – das Divisorpolynom einen Teiler des Dividendenpolynoms. Im anderen Fall ist
der Quotient kein (ganzes) Polynom17 mehr, sondern eine gebrochen rationale Funktion,
solche werden später behandelt.
17
Eine andere Bezeichnung für Polynome ist ganz rationale Funktionen.
46
Ein wichtiger Fall, in dem die Division immer aufgeht, ist der folgende:
Hilfssatz: Sei n ∈ IN und a ∈ IR , dann ist der Quotient
x n − an
x−a
stets ein (ganzes) Polynom, d. h. diese Division geht ohne Rest auf.
Beweis: Durch vollständige Induktion:
Induktionsanfang n = 1“: klar, denn
”
x 1 − a1
= 1 ist (ganzes) Polynom
x−a
Induktionsschluß (n − 1) ⇒ n“: Wir nehmen an, daß die Behauptung für den Fall n − 1
”
richtig ist, d. h. wir nehmen an, daß
xn−1 − an−1
x−a
ein (ganzes) Polynom ist; multipliziert man dieses mit x und addiert man an−1 hinzu,
so erhält man wieder ein (ganzes) Polynom:
xn−1 − an−1
x· + an−1
x−a
Eine einfache Umformung (x ausmultiplizieren und alles auf den Hauptnenner x − a
bringen) zeigt, daß dieses Polynom gleich (xn − an )/(x − a) ist:
x n − an xn−1 − an−1
= x· + an−1
x−a | x − {z
a }
ist Polynom
Somit ist auch (xn − an )/(x − a) ein Polynom; damit ist alles bewiesen.
qed
Eine Maßzahl“ für ein Polynom ist sein Grad; der Grad eines Polynoms ist der größte
”
in ihm vorkommende Exponent der Unbestimmten; bzw. genauer:
Definition: Sei
Xn
p(x) = ai xi 6= 0
i=0
ein Polynom, das nicht gleich dem Nullpolynom ist. Ist an 6= 0, so heißt n der Grad
von p(x); man schreibt dafür
grad(p(x)) = n
Bemerkung:
• Ein Polynom hat genau dann den Grad 0, wenn es ein konstantes Polynom 6= 0
ist.
• Für das Nullpolynom ist der Grad nicht definiert; aus formalen Gründen verleiht
man dem Nullpolynom häufig den Grad −∞ ( minus unendlich“).
”
47
• Ein Polynom p(x) 6= 0 heißt normiert, falls sein höchster Koeffizient gleich 1 ist;
mit anderen Worten: ist n = grad(p(x)), so ist p(x) genau dann normiert, wenn
an = 1 ist.
Wie hängt der Grad eines Produkts zweier Polynome von den beiden Faktoren ab?
Multipliziert man zwei vom Nullpolynom verschiedene Polynome miteinander, so liefert
das Produkt der beiden höchsten Glieder das höchste Glied des Produktpolynoms: hat
man
n
X
p(x) = ai x i mit an 6= 0
i=0
Xm
und q(x) = bj x j mit bm 6= 0
j=0
so hat deren Produkt die Gestalt
p(x) · q(x) = an · bm · xn+m + Glieder niederer Ordnung
Hieraus folgt die sogenannte Gradformel:

Satz: Sind p(x) und q(x) zwei Polynome (6= Nullpolynom), so gilt für den Grad ihres
Produktes p(x) · q(x):
grad(p(x) · q(x)) = grad(p(x)) + grad(q(x))
Der Grad des Produktes ist die Summe der Grade der Faktoren.
Beispiel:
grad((x3 + 2x + 4) · (3x2 + x + 1))

= grad(3x5 + x4 + 7x3 + 14x2 + 6x + 4)
= 5 = 3+2
= grad(x3 + 2x + 4) + grad(3x2 + x + 1)
1.3.4.6.2 Nullstellen und Hornerschema Bei der Betrachtung von Polynomen

spielen Nullstellen eine wichtige Rolle18 .
Definition: Die Zahl x0 ∈ IR heißt (reelle) Nullstelle des Polynoms p(x), falls
p(x0 ) = 0 ist.
Einfaches Beispiel: Das zu x0 ∈ IR gehörige Polynom
s(x) = x − x0
hat genau eine Nullstelle, nämlich x0 .

Wie wir gleich sehen werden, kommt Polynomen dieser Art eine besondere Bedeutung
zu. Ein solches Polynom wird als der zu x0 gehörige Linearfaktor bezeichnet.
18
Es sei hier schon angemerkt, daß wir von den weiteren Überlegungen dieses Abschnitts das Null-
polynom ausnehmen; bei dem Nullpolynom sind Nullstellen nicht besonders interessant!
48
y
Das Polynom s(x) ist ein normiertes Poly-

nom ersten Gerades, sein Schaubild ist eine

Gerade, die die x–Achse an der Stelle x0 , der

s(x) = x − x0

Nullstelle schneidet.

x
0 x
Bemerkenswert ist nun, daß man von einem Polynom p(x) mit p(x0 ) = 0 den Linearfak-
tor x − x0 als Faktor abspalten kann.
Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades, und sei x0 ∈ IR mit p(x0 ) =
0. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit
p(x) = (x − x0 ) · g(x)
Beweis: Geht man von der behaupteten Gleichung aus, und teilt man ihre beiden Seiten
durch x − x0 , so führt das für g(x) auf den Ansatz
p(x)
g(x) =
x − x0
Zu zeigen ist nun, daß dieser Quotient ein (ganzes) Polynom, bzw. daß p(x) ohne Rest
durch den Linearfaktor x − x0 teilbar ist. Dazu schreiben wir p(x) wieder in der Form
n
X
p(x) = ai xi
i=0
und verwenden, daß x0 eine Nullstelle von p(x) ist:

n
X
0 = p(x0 ) = ai xi0
i=0
Damit ist dann

p(x) − 0 p(x) − p(x0 )
g(x) = =
x − x0 x − x0
n n
!
1 X X
= · ai x i − ai xi0
x − x0 i=0 i=0
n
!
1 X
= · ai (xi − xi0 )
x − x0 i=0
n
X xi − xi0
= ai
i=0
x − x0
Nach dem Hilfssatz auf Seite 47 sind alle Quotienten
xi − xi0
x − x0
49
(ganze) Polynome; sie bleiben ganz, wenn man sie mit den ai multipliziert und aufad-
diert. Damit ist dann auch, wie behauptet, g(x) ein (ganzes) Polynom ist. Es bleibt
noch
grad(g(x)) = n − 1
zu zeigen. Wendet man dazu auf
p(x) = (x − x0 ) · g(x)
die Gradformel an:
grad(p(x)) = grad(x − x0 ) + grad(g(x))

| {z } | {z }
=n =1
so erkennt man sofort grad(g(x)) = n − 1.
qed
Bevor man einen Weg sucht, das Polynom g(x) effektiv ausrechnen zu können, bietet
sich eine kleine Verallgemeinerung an:
Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades mit n ≥ 1; sei weiter x0 ∈ IR
beliebig. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit
p(x) = (x − x0 ) · g(x) + p(x0 ) (1.64)
Hier wird nicht gefordert, daß x0 eine Nullstelle von p(x). Man nimmt aber eine Rückführung
auf diesen Fall vor, indem man setzt
p̂(x) = p(x) − p(x0 )
Dann ist x0 Nullstelle des Polynoms p̂(x) :
p̂(x0 ) = p(x0 ) − p(x0 ) = 0
Nun kann man den vorherigen Satz anwenden: es gibt ein Polynom n − 1-ten Grades
g(x) mit
p̂(x) = p(x) − p(x0 )

= (x − x0 ) · g(x)
Addiert man zu beiden Seiten der Gleichung p(x0 ), so erhält man die behauptete Aus-
sage.
Gegeben seien nun

n
X
p(x) = ai x i und x0 ∈ IR
i=0
Das Polynom g(x) und gleichzeitig auch der Wert p(x0 ) sollen berechnet werden. Alles,
was man bis jetzt weiß, ist grad(g(x)) = n − 1, man kann daher
n−1
X
g(x) = bi x i
i=0
50
ansetzen. Dieses setzt man in die Gleichung 1.64 ein:
n n−1
!
X X
ai xi = (x − x0 ) · b i xi + p(x0 )
i=0 i=0
Ausmultiplizieren auf der rechten Seite und geeignete Umformungen liefern

n
X n−1
X n−1
X
i i+1
ai x = bi x − bi x 0 x i + p(x0 )
i=0 i=0 i=0
| {z } | {z }
Indexverschiebung auf die andere
i→i−1 Seite bringen
n
X n−1
X n
X
⇒ ai x i + bi x 0 x i = bi−1 xi + p(x0 )
i=0 i=0 i=1
Faßt man noch die beiden Summenzeichen auf der linken Seite zusammen, so liefert das
die Gleichung
n−1
X n
X
an x n + (ai + bi x0 )xi = bi−1 xi + p(x0 ) (1.65)
i=0 i=1
Dieses ist eine Gleichung zweier Polynome; zwei Polynome sind genau dann gleich, wenn
ihre entsprechenden Koeffizienten gleich sind. Wendet man das hier an, so führt Glei-
chung 1.65 auf die Koeffizientengleichungen
bn−1 = an die beiden höchsten Glieder

bi−1 = ai + bi x0 für i = 1, . . . , n − 1
p(x0 ) = a0 + b0 x0 die beiden konstanten Glieder
Damit kann man nacheinander die Koeffizienten19 bn−1 , . . . , b0 und schließlich auch den
Wert p(x0 ) berechnen. Die Berechnung folgt dabei dem Schema (dem sogenannten
Horner-Schema):
an an−1 an−2 ... a1 a0

x0 bn−1 x0 bn−2 x0 ... b 1 x0 b0 x 0
+ bn−1 % bn−2 % bn−3 % ... b0 % p(x0 )
Beispiel: Gegeben seien p(x) = 2x7 + 2x3 + 1 und x0 = −2, darauf das Horner-Schema
angewandt:
2 0 0 0 2 0 0 1
−2 −4 8 −16 32 −68 136 −272
+ 2 −4 8 −16 34 −68 136 −271
Damit haben wir das Polynom g(x) aus Gleichung 1.64 berechnet:
2x7 + 2x3 + 1
= (x + 2) · (2x6 − 4x5 + 8x4 − 16x3 + 34x2 − 68x + 136) − 271
19
Wohl gemerkt: das Ziel, das Polynom g(x) zu berechnen ist erreicht, wenn die Koeffizienten von
g(x) bestimmt worden sind.
51
Insbesondere ist p(−2) = −271.
Wegen seiner gut rechnerischen Eigenschaften lohnt es sich sogar, das Horner-Schema
auch dann einzusetzen, wenn man nur an dem Funktionswert p(x0 ) interessiert ist.
Beispiel: Wir wollen das Horner-Schema auf
p(x) = x4 − 4x3 − 5x2 + 36x − 36 mit x0 = 3
anwenden:
1 −4 −5 36 −36
3 3 −3 −24 36
+ 1 −1 −8 12 0
also insbesondere p(x0 ) = 0 und genauer:
p(x) = x4 − 4x3 − 5x2 + 36x − 36

= (x − 3) · (x3 − x2 − 8x + 12) (1.66)
| {z }
g1 (x)
Wir wenden das Verfahren nochmal an, diesmal auf g1 (x) = x3 −x2 −8x+12 mit x0 = 2:
1 −1 −8 12
2 2 2 −12
+ 1 1 −6 0
also g1 (2) = 0 und
g1 (x) = (x − 2) · (x2 + x − 6)
bzw. g1 (x) in Gleichung 1.66 eingesetzt:
p(x) = (x − 3)(x − 2) · (x2 + x − 6) (1.67)

| {z }
g2 (x)
Eine weitere Anwendung auf g2 (x) = x2 + x − 6 mit nochmal x0 = 2 liefert
1 1 −6
2 2 6 also g2 (x) = (x − 2) · (x + 3)
+ 1 3 0
und dieses in Gleichung 1.67 eingesetzt
p(x) = (x − 3)(x − 2)(x − 2) · (x + 3)

| {z }
g3 (x)
Der letzte Faktor g3 (x) = x + 3 = x − (−3) ist selbst ein Linearfaktor, nämlich der
mit Nullstelle −3. Eine nochmalige20 Anwendung des Verfahrens auf g3 (x) mit x0 = −3
lieferte die triviale Zerlegung
g3 (x) = (x + 3) · 1
20
aber natürlich nicht übliche
52
Der letzte Faktor g4 (x) = 1 hat als konstante Funktion 6= 0 natürlich keine Nullstellen.
In der gewonnenen Zerlegung
p(x) = x4 − 4x3 − 5x2 + 36x − 36

= (x − 3)(x − 2)(x − 2)(x + 3)
= (x − 3)(x + 3)(x − 2)2
erscheint der Linearfaktor x − 2 mit Exponentem 2, er war zweimal als Teiler in p(x)
enthalten. Man nennt daher x0 = 2 eine doppelte - oder zweifache Nullstelle von
p(x); allgemein:
Definition: Sei p(x) nicht das Nullpolynom und x0 ∈ IR . x0 heißt k–fache Nullstelle
oder Nullstelle der Ordnung (Vielfachheit) k von p(x), falls es ein Polynom g(x) mit
g(x0 ) 6= 0 gibt, so daß gilt
p(x) = (x − x0 )k · g(x)
Die Forderung g(x0 ) 6= 0 soll sicherstellen, daß x0 nicht sogar eine (k+1)–fache Nullstelle
von p(x) ist.
1.3.4.6.3 Anzahl von Nullstellen Wir wollen erkennen, daß ein Polynom nur eine
beschränkte Anzahl von Nullstellen besitzen kann, und wir wollen daraus eine wichtige
Folgerung ziehen.
Wir kommen dazu noch einmal auf die Beispiele (siehe Seite 52) mit dem Polynom
p(x) = x4 − 4x3 − 5x2 + 36x − 36
zurück. Nacheinander wurden die folgenden Abspaltungen von Linearfaktoren vorge-

nommen:
p(x) = (x − 3) · g1 (x) mit g1 (x) = x3 − x2 − 8x + 12
p(x) = (x − 3)(x − 2) · g2 (x) mit g2 (x) = x2 + x − 6
p(x) = (x − 3)(x − 2)2 · g3 (x) mit g3 (x) = x + 3
p(x) = (x − 3)(x − 2)2 (x + 3) · g4 (x) mit g4 (x) = 1
Bei jedem Schritt sinkt der Grad des verbleibenden Faktors gi (x) um 1. Wenn so der
Grad 0 erreicht wird, ist der verbleibende Faktor ein konstantes Polynom (6= Nullpoly-
nom), von dem ein weiterer Linearfaktor nicht mehr abgespalten werden kann. Es sind
daher nur 4 = grad(p(x)) Abspaltungen möglich.
Ein solcher Sachverhalt trifft auch bei einem beliebigen Polynom zu: Hat das Polynom
p(x) den Grad n, so kann von ihm höchstens n Mal ein Linearfaktor abgespalten werden;
nach n Abspaltungen hat der letzte verbleibende Faktor den Grad 0 und ist somit
konstant. In einem Polynom vom Grade n sind daher höchstens n Linarfaktoren als
Teiler enthalten.
Da zu jeder Nullstelle mindestens ein Linearfaktor gehört21 , folgt daraus: Das Polynom
p(x) vom Grade n hat höchstens n Nullstellen.
21
aufgrund des Satzes auf Seite 49
53
Berücksichtigt man jetzt auch noch die Vielfachheit der Nullstellen und beachtet man,
daß zu einer Nullstelle der Vielfachheit k ein genau k Mal als Teiler vorkommender
Linearfaktor gehört, so ist man auf einen der wichtigsten Sätze der Mathematik gestoßen:
Satz: Sei p(x) ein Polynom, das nicht gleich dem Nullpolynom ist. Ist n = grad(p(x)),
so hat p(x) höchstens n Nullstellen; dabei wird jede Nullstelle mit ihrer Vielfachheit
gezählt.
In unserem Beispiel mit

x4 − 4x3 − 5x2 + 36x − 36 = (x − 3)(x + 3)(x − 2)2
sind mit Vielfachheit 1 die Nullstellen +3 und −3 sowie mit Vielfachheit 2 die Nullstelle
+2 vorhanden. Die Vielfachheiten zusammen ergeben
4 = grad(x4 − 4x3 − 5x2 + 36x − 36)
Für Interessierte hier zu dem Satz der exakte

Beweis22 : Eine erweiterte Fassung der vollständigen Induktion wird verwendet.
Induktionsanfang n = 0“: Wegen grad(p(x)) = 0 ist p(x) eine Konstante 6= 0 und
”
besitzt keine (also 0) Nullstellen.
Induktionsschluß: Die Behauptung sei für alle Polynome g(x) mit
grad(g(x)) < n
richtig. Zu zeigen ist: die Behauptung gilt auch für p(x) mit
grad(p(x)) = n
Hat p(x) keine Nullstelle, so ist die Behauptung offensichtlich richtig.
Sei andernfalls x0 irgendeine Nullstelle von p(x); ihre Vielfachheit betrage k > 0. Man
kann dann die zugehörige Abspaltung vornehmen:
p(x) = (x − x0 )k · g(x)
Dabei hat g(x) den Grad
grad(g(x)) = n − k < n
Auf g(x) läßt sich die Induktionsvoraussetzung anwenden:
g(x) besitzt, mit Vielfachheit gezählt, höchstens n − k Nullstellen.
Sei nun x1 6= x0 eine weitere Nullstelle von p(x), wegen
0 = p(x1 ) = (x1 − x0 ) ·g(x1 ) ⇒ g(x1 ) = 0
| {z }
6= 0
da x1 6= x0
ist x1 notwendigerweise eine Nullstelle von g(x). Daraus folgt: als Nullstellen von p(x)
kommen neben x0 genau die Nullstellen von g(x) vor. Die Gesamtzahl (mit Vielfachheit)
der Nullstellen von g(x) ist daher beschränkt durch
k
|{z} + n − k}
| {z = n
Vielfachheit Maximalzahl der
von x0 Nullstellen von g(x)
22
Es ist nicht zwingend erforderlich, daß Sie diesen Beweis nachvollziehen.
54
qed
Dieser Satz hat bedeutsame Konsequenzen, u. a.:

Satz: Sind p(x) und q(x) zwei Polynome mit
grad(p(x)) ≤ n und grad(q(x)) ≤ n
und gibt es n + 1 verschiedene Zahlen x1 , . . . , xn+1 ∈ IR mit
p(xi ) = q(xi ) für i = 1, . . . , n + 1
so folgt p(x) ≡ q(x)23
Beweis: Man betrachte das Differenzpolynom
h(x) = p(x) − q(x)
Offensichtlich ist grad(h(x)) ≤ n. (Höhere Potenzen als in p(x) und q(x) können in h(x)
nicht vorkommen.) Wäre nun h(x) nicht das Nullpolynom, so hätte h(x) aufgrund des
vorherigen Satzes höchstens n verschiedene Nullstellen.
h(x) besitzt jedoch n + 1 verschiedene Nullstellen:
h(xi ) = p(xi ) − q(xi ) = 0 für i = 1, . . . , n + 1

⇒ h(x) kann nur das Nullpolynom sein.
⇒ h(x) = p(x) − q(x) ≡ 0 ⇒ p(x) ≡ q(x)
qed
Dieser Satz besagt etwa:
• Ein Polynom p(x) mit grad(p(x)) ≤ n ist durch n + 1 Werte
p(x1 ), p(x2 ), . . . , p(xn+1 )
eindeutig bestimmt.
• Ein (lineares) Polynom p(x) = ax + b ist durch zwei Werte eindeutig bestimmt.
• Ein quadratisches Polynom
p(x) = ax2 + bx + c
ist durch drei Werte p(x1 ), p(x2 ), p(x3 ) festgelegt.

Es läßt sich allerdings sehr wohl ein Polynom dritten Grades q(x) mit
q(x) ≡6 p(x)
und q(xi ) = p(xi ) für i = 1, 2, 3
finden, nämlich etwa
q(x) = p(x) + (x − x1 )(x − x2 )(x − x3 )

23
D. h.: p(x) und q(x) haben dieselben Koeffizienten.
55
1.3.4.6.4 Der Fundamentalsatz der Algebra Zwei schwieriger zu behandelnde
Fragen sind die folgenden:
1. Hat ein Polynom n-ten Gerades mit Vielfachheit genau n Nullstellen?
2. Wie kann man die Nullstellen eines Polynoms finden?
Zu Frage 1.: Die Antwort ist leider nein“. Beispiel: Das (berüchtigte) Polynom
”
p(x) = x2 + 1
hat keine Nullstellen, obwohl sein Grad 2 beträgt; es ist immer p(x) ≥ 1. Dieser Sachver-
halt verleitete zur Einführung der komplexen Zahlen (siehe später). Alles, was man
für (reelle) Polynome in diesem Zusammenhang weiß, ist der folgende
Satz: (Fundamentalsatz der Algebra, reelle Schreibweise) Sei p(x) ein Polynom n-ten
Grades. Dann gibt es
x1 , x2 , . . . , xl ∈ IR und Polynome g1 (x), . . . , gk (x)
mit grad(gi (x)) = 2 und gi (x) ohne Nullstelle für i = 1, . . . , k, so daß
p(x) = (x − x1 ) · · · (x − xl ) · g1 (x)g2 (x) · · · gk (x).
ist.
Der Beweis dieses Satzes ist umfangreich und schwierig, er soll hier nicht gebracht wer-
den. Auf die Aussage des Satzes werden wir jedoch später im Zusammenhang mit der
Partialbruchzerlegung und Integration gebrochen rationaler Funktionen zurückkommen.
Zu Frage 2.: Auch hier ist die Antwort nicht sehr befriedigend:
Für die Nullstellen der Polynome ersten und zweiten Grades gibt es einfache Formeln;
bei Polynomen dritten und vierten Grades existieren noch Formeln, die jedoch sehr
komplizert sind (siehe Formelsammlungen) und selten verwendet werden. Für allgemei-
ne Polynome fünften oder eines höheren Grades gibt es jedoch – wie man beweisen
kann – keine Formeln zur Berechnung ihrer Nullstellen. Man ist hier auf numerische
Lösungsverfahren24 angewiesen (siehe später).
Für den Fall eines normierten quadratischen Polynoms sei hier an die Formel zur Be-
rechnung seiner Nullstellen erinnert. Zu lösen ist die quadratische Gleichung
Quadratische Ergänzung zur
0 = x2 + ax + b Anwendung der 1. binomi-
schen Formel vornehmen!
a2 + b − a2

Jetzt die 1. binomische Formel
= x2 + 2 a
2 x + 4 4 anwenden!
2 2
= x+ a
2 + b − a4
2
⇒ x+ a
2 = 14 (a2 − 4b)
| {z }
=D
⇒ x1/2 = −a ± 1 √D für D ≥ 0
2 2
24
Numerische Lösungsverfahren verwendet man üblicherweise auch bei Gleichungen dritten und vier-
ten Grades.
56
Die Diskriminante D = a2 − 4b bestimmt die Nullstellenmenge von p(x) = x2 + ax + b:
D > 0 ⇒ 2 Nullstellen
D = 0 ⇒ 1 doppelte Nullstelle
D < 0 ⇒ keine Nullstellen
Kontrollfrage: Begründen Sie mit Hilfe der Sätze dieses Abschnitts, daß es für die
Lösungsmenge der normierten quadratischen Gleichung nur diese drei Möglichkeiten
geben kann.
Einfach lösen läßt sich noch die biquadratische Gleichung:
0 = x4 + ax2 + b
Man substituiert dazu y = x2 und versucht, 0 = y 2 + ay + b zu lösen. Jede positive

√
Lösung y0 davon liefert die beiden Lösungen ± y0 der biquadratischen Gleichung.
√
Beispiel: Auf diesem Wege findet man die beiden Nullstellen ± 2 von p(x) = x4 − 4,
genauer gilt:
p(x) = x4 − 4
= (x2 − 2)(x2 + 2)
√ √
= (x − 2)(x + 2)(x2 + 2)
1.3.4.7 Trigonometrische Funktionen und Arcusfunktionen

1.3.4.7.1 Kreisfunktionen Man betrachte den Einheitskreis um den Nullpunkt in
der Ebene IR2 :
S1 = (a, b) | a, b ∈ IR , a2 + b2 = 1

Jeder Punkt P ∈ S1 ist bestimmt durch
1 ............................
...........
a ............... P = (a, b)
b .......
....
7 ........

.....
....

.... a2 + b 2 = 1
...
...

1 (Pythagoras)
...

b ... x
...
...

...

..... α ...

. ...
... ...
0 .. ..
0 a 1
Abbildung 1.4: Punkte auf dem Einheitskreis
57
.................. 1 .............
.... ....... ..................
..... ...
... ..
... ..... ...
...
.. . ... .. ... .. ...
.. ... .. ... .. ...
.. ... ... ... .. ...
.. ... .. ... .. ...
... . ... . ... .
.
... .. ... .
. . ..
...
−9 ... −6 −3 ... ... 3 ..... 6..
. 9
... .. ... .. ... ..
... . ... ...
... .. ... ... .. ...
.... .. .... .. .
.... .
................ ................ ................
−1
Abbildung 1.5: f(x) = sin x
• den Winkel α zwischen der waagerechten Koordinatenachse und der Stecke zwi-
schen den Punkten (0, 0) und P bzw.
• die Länge x des Kreisbogens auf S1 zwischen den Punkten (1, 0) und P
Der Zusammenhang zwischen der Bogenlänge x und dem Winkel α ist gegeben durch
2π
x = α·
360
Dabei sind 2π und 360◦ die Maße für den vollen Kreis.
Die Koordinaten des Punktes P = (a, b) sind dabei durch die Bogenlänge x bzw. den
Winkel α eindeutig bestimmt, d. h. sie sind Funktionen von x bzw. α. Man kann daher
setzen:
P = (cos x, sin x) bzw. P = (cos α, sin α)
mit den beiden Funktionen sinus und cosinus
sin : IR 7→ IR cos : IR 7→ IR
Da ganze Kreisumläufe zum selben Punkt P führen“, folgt für jede ganze Zahl k ∈ ZZ :
”
cos(x + k · 2π) = cos x
sin(x + k · 2π) = sin x
D. h. sin und cos haben die Periode 2π (bzw. 360◦ im Winkelmaß).
Die beiden so definierten Funktionen sin und cos besitzen große Bedeutung in der Geo-
metrie und bei der Behandlung periodischer Vorgänge. Bei geometrischen Problemen
faßt man sie in der Regel als Funktionen des Winkels α und sonst üblicherweise als
Funktionen des Bogenmaßes x auf.
Aus der Definition der beiden Funktionen folgt unmittelbar:
1.
sin 0 = 0 sin π
2 =1 sin π = 0
cos 0 = 1 cos π
2 =0 cos π = −1
58
.................. ..1................
...
..................
.. .. ...
... ..... ...
... .. ...
...
.. . ... ... ... ... ...
.. ... . .... . ...
.. ... ... .... ... ...
... ... .. ... .
. ...
.. ... .
. ... .. ...
. ... .. . .. ...
−9 .. −6 ... −3 .. ... 3 .. 6 ... 9
.. . ... .. ... .. ...
.. ... . ... . ...
... .. ... .. ...
.
. .... .. ..... ... .
. ....
... . .
............. . . .......
...... −1 ..........
Abbildung 1.6: f(x) = cos x
2. Der sin ist eine ungerade, der cos ist eine gerade Funktion:
sin(−x) = − sin x cos(−x) = cos x
Diese Eigenschaften werden sofort anhand von Zeichnung 1.8 deutlich: Man be-
trachte dort die beiden auf dem Einheitskreis liegenden Punkte
P1 = (cos α, sin α)
P2 = (cos(−α), sin(−α))
Den zu −α gehörigen Punkt P2 erhält man auch, wenn man P1 an der x-Achse
spiegelt. Bei dieser Spiegelung bleibt der Wert der x-Koordinate unverändert, d. h.
cos(−α) = cos α; der Wert der y-Koordinate wechselt dagegen sein Vorzeichen,
d. h. sin(−α) = − sin α.
3. (Satz des Pythagoras)
cos2 x + sin2 x = 1 für alle x ∈ IR (1.68)
4. Für x ∈ [−π/2, π/2] ist cos x ≥ 0 (rechter Halbkreis), man kann daher die Glei-
chung cos2 x + sin2 x = 1 nach cos x auflösen und erhält eine Darstellung des cos
durch den sin:
p
cos x = 1 − sin2 x (1.69)
Für x ∈ [0, π] ist ebenso sin x ≥ 0 (oberer Halbkreis), löst man die Gleichung
cos2 x + sin2 x = 1 nach sin x auf, so folgt ähnlich wie oben
√
sin x = 1 − cos2 x (1.70)
5. Für alle x ∈ IR ist

| sin x| ≤ 1 und | cos x| ≤ 1
Begründung: cos x und sin x sind nach Definition die Koordinaten eines Punktes
auf dem Einheitskreis, diese sind dem Betrage nach nicht größer als 1. Siehe hierzu
auch Abbildung 1.4.
59
Mit dem Strahlensatz erhält man in einem rechtwinkligen Dreieck:
b Gegenkathete
sin x = =
c Hypothenuse
a Ankathete
cos x = =
c Hypothenuse
*

c

b
1

sin α

α

cos α
a -
Auf diesem Wege lassen sich auch die Funktionen tangens und cotangens definieren:
sin x = Gegenkathete
tan x = cos x Ankathete
cot x = cos x Ankathete
sin x = Gegenkathete
Drei wichtige Werte des sin und cos:
sin π
4= 2
√1 cos π
4= 2
√1
sin π 1 cos π 1 √3
6=2 =
6 2
sin π = 1 √3 cos π 1
3 2 3=2
Man erhält diese Werte auf geometrischem Wege: man betrachtet ein gleichseitiges bzw.
ein rechtwinkliges gleichschenkliges Dreieck.
Zwischen den Werten des sin und des cos besteht neben den Gleichungen 1.69 und 1.70
ein weiterer Zusammenhang. Man erkennt diesen, indem man die in Abbildung 1.8 die
beiden auf dem Einheitskreis liegenden Punkte
P1 = (cos α, sin α)

1 1
P3 = cos(α + π), sin(α + π)
2 2
60
1 ...................... ................................. ............
........ ................ ........ ..............
.... ....... ...
.......... ............ ......
. ..
........
.
..... ..... ..... ....
....... .....
.
.....
.. ........
.. ..... ..... ..
.... ..... .....
. .... .
.....
..
.....
.. .. .
...
......
1 .....2
..... 3 ....... 4 ...... 5 ..
...6.
...... ..... .
.... .....
....... ...... ...... ...
....... ..........
.
.... ...
. ...........
.
......... . .......... .
...................................... .....................................
−1
Abbildung 1.7: sin x und cos x
betrachtet. P3 ist durch Drehung von P1 um 90◦ bzw. π/2 entstanden. An der Abbildung
erkennt man, daß die x-Koordinate von P3 gleich dem Negativen der y-Koordinate von
P1 ist und daß die y-Koordinate von P3 gleich der x-Koordinate von P1 . Dieses liefert
die Beziehungen
sin(x + π
2 ) = cos x Drehung um
(1.71)
cos(x + π
2 ) = − sin x
π ' 90◦
2
1.71 besagt insbesondere, daß man den cos auch durch Verschiebung des sin um π2 nach
rechts erhalten kann. Verdeutlicht wird dieses in Abbildung 1.7, in der sin und cos
gemeinsam über der Grundperiode [0, 2π] eingezeichnet sind.
Wendet man die Gleichungen 1.71 zweimal hintereinander an, so erhält man
sin(x + π) = cos(x + π 2) = − sin x
π (1.72)
cos(x + π) = − sin(x + 2 ) = − cos x
Die Gleichungen 1.72 liefern gemeinsam mit der Periodizität und den Eigenschaften
gerade/ungerade die weiteren Gleichungen
sin(π − x) = sin(−π − x) = sin x
(1.73)
cos(π − x) = cos(−π − x) = − cos x
Die Gleichungen 1.71, 1.72 und 1.73 erweisen sich bei vielen Rechnungen, in denen sin
und cos vorkommen, als sehr nützlich.
Es ist sin π = 0 und cos 12 π = 0. Daraus leiten sich mit den Formeln 1.73 die weiteren
Nullstellen ab:
Nullstellen des sin : {kπ | k ∈ ZZ }

1
Nullstellen des cos : (k + )π | k ∈ ZZ
2
Satz: Additionstheorem des sin und cos: Für alle x, y ∈ IR gilt.

sin(x + y) = sin x · cos y + cos x · sin y
cos(x + y) = cos x · cos y − sin x · sin y
61
der Gesamtwinkel:
.1
...............................
.....
...............
............ α + 12 π
................ cos α
..........
....
.........
....
...
......... .......P1
......
. .. .....
.
. ... − sin α 7

.....
P3 ......

....
....
......}

Z ...
.. Z ...
.. Z
...
...
Z
sin α ...
.. cos α Z
Z ...
.. ...
..
Z ...
..
Z
Z α

...
.. Z ........... α ...
... Z.. .... ...
Z. . ..
... S. . ..
... .
S −α ..
-1..... .
. 1
... ..
S
... .
..
S
... S − sin α . .
...
...
S
...
... S
..
....
....
S
. ....
..... .. .
....
S
..... S
..
...... S ......
....... w...
........ ......
S
......... ....
....
...........
.................-1 cos...α.................. P2
..........................
.......
Abbildung 1.8: sin–Werte und cos–Werte
62
Zum Beweis: Wir werden den Beweis geometrisch führen und zwar nur für den Spezialfall
des ersten Quadranten, d. h. nur für den Fall x, y > 0 und x + y < π/2. Wegen der
geometrischen Vorgehensweise ist es günstiger, statt des Bogenmaßes die zugehörigen
Winkel zu betrachten; dazu sei
360◦ 360◦
α = x β = y
2π 2π
Wir tragen jetzt den Winkel α und anschließend den Winkel β im Einheitskreis an, so
daß insgesamt der Winkel α + β entsteht; zusätzlich wird vom Punkte P4 = (cos(α +
β), sin(α + β)) aus die Senkrechte auf die Strecke zwischen P0 = (0, 0) und P2 =
(cos α, sin α) gezeichnet:
1 ........................................
...............
............
..........
.........
........
........P4 = (cos(α + β), sin(α + β))
.......
..L.. ...........
L .......
......
L .....
.....

αL ..... α + γ = 90◦
L
.....
L ....
....
L
....
L ....
L
c ...
...
L ...
1
L ...
...
...
L
L ..
!.... P2 = (cos α, sin α)

L

....... b
!
...
.L...L!!!
!

P . .
. ...
6 !
P ...
......γ!!! 3 ...
!

e ...

...!...
!
...
...
! !
! ! γ ...
...
! !

β !!!
!
...
..... !! d ...
....
!
! .. α .... ...
P0 a P5 b P1
1
Zu beachten ist hierbei, daß an dem Punkte P4 der Winkel α ein weiteres Mal auftaucht,
da genau α den Winkel γ zu 90◦ ergänzt.
Aus den in der Zeichnung vorhandenen rechtwinkligen Dreiecken ergeben sich nun die
folgenden sin– und cos–Werte:
Dreieck (P3 , P4 , P6 ) : sin α = cb

Dreieck (P0 , P5 , P4 ) : cos(α + β) = a
Dreieck (P0 , P1 , P3 ) : cos α = a + b

d+e
Dreieck (P0 , P3 , P4 ) : cos β = d + e sin β = c
63
Setzt man jetzt diese Werte geeignet ineinander ein und drückt man dabei insbesondere
alle Längen durch sin– und cos–Werte aus, so folgt:
cos α · cos β = a + b · (d + e) = a+b

d+e
= cos(α + β) + b = cos(α + β) + sin α · c
= cos(α + β) + sin α · sin β
⇒ cos(α + β) = cos α · cos β − sin α · sin β
Damit ist das Additionstheorem des cos hergeleitet; dasjenige des sin soll daraus mit
Hilfe der beiden Gleichungen (siehe Seite 61) sin x = cos(x − π/2) bzw. sin(x − π/2) =
− cos x abgeleitet werden:
sin(α + β) = cos(α + β − π/2)

= cos α · cos(β − π/2) − sin α · sin(β − π/2)
| {z } | {z }
=sin β =− cos β
= cos α · sin β + sin α · cos β
qed.
Folgerungen:
a) sin 2x = 2 sin x · cos x
b) cos 2x = cos2 x − sin2 x
x+y x−y
c) sin x + sin y = 2 · sin 2 · cos 2
x+y x−y
d) cos x + cos y = 2 · cos
2 · cos 2
Zum Beweis der Folgerungen: a) und b) Man setze in die Additionstheoreme des sin
bzw. cos 2x = x + x ein. c) und d) Man setze
x+y x−y
u = und v =
2 2
und wende bei c) in den beiden Gleichungen
sin x = sin(u + v)
sin y = sin(u − v)
das Additionstheorem des sin an, addiere die beiden Gleichungen und setze für u und
v wieder die Definitionen ein. Bei d) verfahre man ebenso, indem man dabei auf die
beiden folgenden Gleichungen das Additionstheorem des cos anwendet:
cos x = cos(u + v)
cos y = cos(u − v)
Mit Hilfe der Funktionen sin und cos lassen sich viele Sätze und Formeln zur Bearbeitung
von Dreiecken herleiten. Als Beispiel folgen hier der Cosinussatz und der Sinussatz:
Satz: Seien a, b und c die drei Seiten eines Dreiecks und α, β und γ die jeweils ge-
genüberliegenden Winkel. Dann gilt
64
1. der Cosinussatz:
a2 = b2 + c2 − 2cb cos α
b2 = c2 + a2 − 2ac cos β
c2 = a2 + b2 − 2ab cos γ
2. der Sinussatz:
a b c
= =
sin α sin β sin γ
% QQ
% Q
% γ Q
a
% Q
b %
Q
Q
% Q
Q
h
% Q
% Q
Q
% Q
Q
β QQ
%
% α Q
% Q
p
c
Abbildung 1.9: Zum sin– und cos–Satz
Beweis: Es soll nur jeweils eine Gleichung hergeleitet werden, die übrigen folgen entspre-
chend. Die Bezeichnungen aus Abbildung 1.9 werden verwendet.
1. zum Cosinussatz:
p = b · cos α
h2 = b2 − p 2
h2 = a2 − (c − p)2
⇒ a2 = b2 − p2 + (c − p)2
= b2 − p2 + c2 − 2cp + p2
= b2 + c2 − 2cp die Gleichung für p einsetzen
2 2
= b + c − 2cb · cos α
2. zum Sinussatz:
h = b · sin α
h = a · sin β
⇒ a · sin β = b · sin α
a b
⇒ =
sin α sin β
65
7

cot α
1
α
cos α

7
P

1 tan α

sin α

α
0
0 1
Abbildung 1.10: tan und cot am Einheitskreis
sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
lassen sich wie in Abbildung 1.10 deuten.
Sie besitzen die Periode π:
sin(x + π) − sin x = tan x
tan(x + π) = =− cos x
cos(x + π)
cos(x + π)
cot(x + π) = =− cos x
− sin x = cot x
sin(x + π)
sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
besitzen Polstellen:

1
Polstellen des tan : (k + )π | k ∈ ZZ
2
Polstellen des cot : {kπ | k ∈ ZZ }
Periode und Polstellen des tan sind in Abbildung 1.11 dargestellt.
1.3.4.7.2 Die Arcusfunktionen
1. Die Einschränkung der Funktion sin auf das abgeschlossene Intervall [− π2 , + π2 ]

liefert eine bijektive Funktion
h π πi
sin : − , + 7→ [−1, +1]
2 2
Die zugehörige Umkehrfunktion sin−1 ist auf dem Intervall [−1, +1] definiert, ihr
Name lautet arcus sinus:
h π πi
arcsin : [−1, +1] 7→ − , +
2 2
66
.. .. ..
... ... ...
.. 12 .. ..
... ... ...
.. .. ..
... ... ...
.. 8 .. ..
... ... ...
.. .. ..
... ... ...
.. 4 .. ..
... ... ...
....
..... ....
..... ....
.....
........ ....... .......
.
...
. .
............ ...
...............
. ...
...............
.
.. .... ..
....
.−4 −3 −2 −1 ... 1 2..... 3 4
... ... ...
.. .. ..
... ... −4 ...
.. .. ..
... ... ...
.. .. ..
... ... −8 ...
.. .. ..
... ... ...
.. .. ..
... ... −12 ...
. . .
.. .. ..
Abbildung 1.11: f(x) = tan x
2. Die Einschränkung der Funktion cos auf das abgeschlossene Intervall [0, π] liefert
eine bijektive Funktion
cos : [0, π] 7→ [−1, +1]
Die zugehörige Umkehrfunktion cos−1 ist auf dem Intervall [−1, +1] definiert, ihr
Name lautet arcus cosinus:
arccos : [−1, +1] 7→ [0, π]
3. Die Einschränkung der Funktion tan auf das offene Intervall (− π2 , + π2 ) liefert eine
bijektive Funktion π π
tan : − , + 7→ IR
2 2
Die zugehörige Umkehrfunktion tan−1 ist wegen der Surjektivität des tan auf ganz
IR definiert, ihr Name lautet arcus tangens:
π π
arctan : IR 7→ − , +
2 2
Bemerkung: Man beachte, daß ausschießlich nur für x ∈ (− π2 , + π2 ) die Beziehung
x = arctan(tan x) erfüllt ist; umgekehrt gilt jedoch für alle y ∈ IR die Gleichung
y = tan(arctan y).
4. Die Umkehrfunktion von cot : (0, π) 7→ IR ist der arcus cotangens:
arccot : IR 7→ (0, π)
Als Anwendung des arctan folgt der Beweis des wichtigen Satzes
67
1 .................................
.............
..........
.........
........
.......
....... P = (u, v)
.........
.....
.....
....
....
.... δ
...
...

...
...
..
v = sin δ ....

...

...
...
...
...
...

...
... α ...
.
u = cos δ
1
Abbildung 1.12: Das gesuchte δ ist die Länge des Bogens bis P = (u, v).
Satz: Sind u, v ∈ IR mit

u2 + v 2 = 1
gegeben, so gibt es dazu ein δ ∈ IR mit
cos δ = u und sin δ = v
Dieses δ berechnet man durch


arctan v für u > 0


 u

v

 arctan u +π für u < 0


δ = (1.74)
 π für u = 0, v = 1
2





 −π

für u = 0, v = −1
2
Beweisidee: Der Nachweis der Existenz der Zahl δ erfolgt mit Hilfe der geometrischen
Bedeutung des sin und des cos, siehe dazu Abbildung 1.12:
Ist P = (u, v) der Punkt in der Ebene mit den Koordinaten u und v, so liegt P wegen
u2 + v 2 = 1 auf dem Einheitskreis. P ist daher eindeutig durch die Länge δ des Bogens
auf dem Einheitskreis von (1, 0) bis zu dem Punkt P festgelegt. Nach Definition von sin
and cos sind die Koordinaten von P dann gerade durch (cos δ, sin δ) gegeben. Somit ist
P = (u, v) = (cos δ, sin δ) und damit u = cos δ sowie v = sin δ.
Beim Nachweis der Berechnungsformel 1.74 für δ ist eine Fallunterscheidung erforderlich:
1. Sei u = 0, dann ist v = ±1, und man kann

π
δ = ±
2
setzen.
68
2. Sei u 6= 0. Man nimmt dann folgenden Ansatz vor:
u = cos δ und v = sin δ

(1.75)
⇒ tan δ = sin δ = u
v
cos δ
Jetzt bietet sich die Anwendung des arctan an; das ist aber nur möglich, wenn δ
in dem Bereich liegt, auf dem der tan umkehrbar ist; dieses ist genau für
π π
δ ∈ − ,
2 2
der Fall. Eine weitere Fallunterscheidung ist jetzt erforderlich:
(a) Sei u > 0. Durch Addition oder Subtraktion eines geeigneten Vielfachen der
Periode 2π kann man erreichen, daß δ in der Grundperiode [−π, π] liegt.
Wegen
cos δ = u > 0
ist dann δ ∈ (−π/2, π/2) erfüllt25 , man kann in 1.75 den arctan anwenden
und erhält
v
δ = arctan
u
(b) Sei u < 0. Ist jetzt hier δ in der Grundperiode [0, 2π] und ist cos δ = u < 0,
so folgt wieder aus geometrischen Gründen (siehe Abbildung 1.4)
π < δ < 32 π

−π
2
⇒ −π
2 < δ−π < 2
π
Somit liegt δ − π im Umkehrbereich des tan. Berücksichtigt man nun noch,

daß der tan die Periode π besitzt, so kann man aus 1.75 schließen:
tan(δ − π) = tan δ
v
= u

arctan()
⇒ v
δ − π = arctan u

+π
⇒ v + π
δ = arctan u
qed.
Zusatz: δ kann aus (−π, π] gewählt werden.
25
Dieses folgt wieder aus geometrischen Gründen, siehe Abbildung 1.4.
69
Kapitel 2
Lineare Gleichungssysteme und

Matrizenrechnung
2.1 Lineare Gleichungssysteme und das Gaußsche

Verfahren
Ein (armer) Student möchte seinen Lebensstandard etwas aufbessern, indem er neben
seinem Studium arbeitet und dabei etwas Geld hinzuverdient. Ihm werden zwei Stellen
angeboten:
• eine zu einem Lohn von 20 Euro/Std aber mit einer sehr anstrengenden Arbeit,
• eine zu einem Lohn von 10 Euro/Std mit einer sehr interessanten Tätigkeit.
Der Student beschließt, jede Woche insgesamt, d. h. für sein Studium und für den
Gelderwerb, 50 Stunden zu arbeiten, und faßt dabei folgenden Vorsatz:
• Er will 400 Euro pro Woche verdienen.
• Er will für das Studium zwei Stunden mehr arbeiten als für beide Stellen zusam-
men.
Wie viel Zeit würde der Student aufgrund dieser Regeln je Woche für sein Studium
aufwenden? Mit wie vielen Stunden würde der Studenten die erste und die zweite Stelle
annehmen?
Um diese Fragen zu beantworten, findet man ein geeignete mathematisches Modell. Man
definiert dazu als erstes die (zunächst) unbekannten Größen
x1 Zeit für Stelle 1
x2 Zeit für Stelle 2 (jeweils in Stunden)
x3 Zeit für das Studium
Unter Beachtung seiner aufgestellten Regeln erhält der Student drei Gleichungen1 :
x1 + x2 + x3 = 50
20x1 + 10x2 = 400
2 + x1 + x2 = x 3 ⇔ x1 + x2 − x3 = −2
1
. . ., bei denen die Einheiten weggelassen wurden.
70
Etwas schöner“ aufgeschrieben, lautet dieses:
”
x1 + x2 + x3 = 50
20x1 + 10x2 = 400
x1 + x2 − x3 = −2
Hierbei handelt es sich um ein sogenanntes lineares Gleichungssystemen; es ist da-

durch gekennzeichnet, daß alle unbekannten Größen (bzw. Variablen) nur in der ers-
ten Potenz erscheinen, keine Produkte aus verschiedenen Variablen und keine sonstigen
Funktionen vorkommen. Der Vorgang zum Lösen eines solchen linearen Gleichungssys-
tems besteht aus zwei Schritten:
• Reduzieren: Durch Zeilensubtraktion und Zeilenvertauschung (siehe gleich) wird

die Anzahl der Variablen von Zeile zu Zeile verringert.
• Auflösen: Beginnend bei der letzten Zeile wird die jeweils an der Stufe stehende
Variable (siehe gleich) berechnen.
Dieses Verfahren wird als Gaußsches Eliminationsverfahren bezeichnet. Im Idealfall

erhält das Gleichungssystems durch den Reduktionsschritt die Gestalt
x1 #
x2
..
.
...
0 xn
Wie man gleich sehen wird, wird sich eine solche Form für das Beispiel ( armer Student“)
”
mit n = 3 ergeben. Liegt eine solche Form vor, so ist das Gleichungssystem eindeutig
lösbar , denn
• In der letzten Zeile steht genau eine Variable; der eindeutige Wert dieser letzten
Variablen kann sofort ermittelt werden.
• Jede Variable steht an einer Stufe; die Variablen xn−1 , xn−2 , . . . , x1 können so
nacheinander eindeutig berechnet werden.
Im Allgemeinen ist es jedoch auch möglich,
• daß mehrdeutige Lösung vorkommen,
• daß das Gleichungssystem unlösbar ist.
Dazu folgen drei Beispiele.
1. Beispiel:2
9x2 + 13x3 = 7 1. Vertauschen,

x1 + 2x2 + 3x3 = 1 damit 1. Zeile
10x1 + 2x2 + 4x3 = 1 mit x1 beginnt
71
Die Vertauschung 1. und 2. Zeile liefert:
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
10x1 + 2x2 + 4x3 = 1 (III) − 10 · (I)
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
−18x2 − 26x3 = −9 (III) + 2 · (II)
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
0x3 = 5
Der letzter Schritt führte zur gleichzeitigen Elimination zweier Variablen. Die sich erge-
bende letzte Gleichung kann nie erfüllt werden, denn es ist stets
0x3 6= 5
Damit folgt, daß dieses Gleichungssystem nicht erfüllbar ist; es ist unlösbar!
Allgemein gilt: Genau dann, wenn die Reduzierung mindestens eine Gleichung liefert, die
auf der linken Seite nur Nullen und auf der rechten Seite dagegen einen Wert ungleich
Null besitzt, ist das Gleichungssystem unlösbar.
2. Beispiel: ( armer Student“)

”
x1 + x2 + x3 = 50
20x1 + 10x2 = 400
x1 + x2 − x3 = −2
Die 2. und die 3. Gleichung werden x1 -frei“ gemacht:
”
(II) → (II) − 20 · (I)
(III) → (III) − (I)
⇒
x1 + x2 + x3 = 50
−10x2 − 20x3 = −600
−2x3 = −52
Jetzt wird noch eine Normierung vorgenommen, dabei wird durch die Koeffizienten der
an den Stufen stehenden Gleichungen geteilt:
1
(II) → (II) ·
−10
1
(III) → (III) ·
−2
Die Normierung bewirkt, daß alle an einer Stufe stehenden Variablen den Koeffizienten
1 besitzen3 :
x1 + x2 + x3 = 50
x2 + 2x3 = 60
x3 = 26 Von hinten auflösen
72
Nun können die Lösungswerte der einzelnen Variablen, beginnend bei der letzten, nach-
einander berechnet werden
x3 = 26, x2 = 60 − 2x3 = 60 − 52 = 8
x1 = 50 − x2 − x3 = 50 − 8 − 26 = 16
Um die Lösung geeignet als ein einheitliches Objekt darstellen zu können, soll hier schon
die sogenannte Vektorschreibweise (siehe später) verwendet werden. Die Lösungswerte
der Variablen x1 , x2 , . . . , xn werden nacheinander untereinander geschrieben und mit
einem Paar runder Klammern umgeben; diese Objekte werden als Vektoren (bzw.
genau als Spaltenvektoren“) bezeichnet. Für das letzte Gleichungssystem erhält man
”
als Lösung den Vektor:  
16
 8 
26
Insbesondere besitzt dieses Gleichungssystem eine eindeutige Lösung.
3. Beispiel
9x2 + 13x3 = 63
x1 + 2x2 + 3x3 = 14
10x1 + 2x2 + 4x3 = 14
Dieselben Reduzierungsschritte wie beim vorletzten Beispiel liefern
x1 + 2x2 + 3x3 = 14
9x2 + 13x3 = 63 (2.1)
0x3 = 0
Dieses Gleichungssystem ist lösbar, denn die letzte Gleichung ist immer erfüllt.
Aber es ist nicht eindeutig lösbar, denn
• x3 steht nicht an einer Stufe.4
• Für x3 kann ein beliebiger Wert λ ∈ IR eingesetzt werden.
Man setzt in diesem Fall x3 = λ, wobei λ eine beliege reelle Zahl sein kann, und löst
damit das reduzierte Gleichungssystem wie eben auf:
x3 = λ
x2 = 19 (63 − 13 · λ) = 7 − 13
9λ (2.2)
x1 = 14 − 2x2 − 3x3 = 14 − (14 − 26 1
9 λ) − 3λ = − 9 λ
Da ja für λ jede reelle Zahl eingesetzt werden kann, ergibt sich eine aus mehreren
möglichen Lösungen bestehende Menge; diese Lösungsmenge lautet:
− 19 λ
  
 

 

13

L =  7 − λ  λ ∈ IR
 

 9 

λ
 
73
Man erkennt, daß auch hier wieder die Spaltenschreibweise verwendet wird.
Zu klären ist noch, was genau unter einer Stufe“ bzw. einer Stufenvariable“ bei einem
” ”
reduzierten Gleichungssystem zu verstehen ist:
• Eine Stufenvariable ist die erste in einer Gleichung erscheinende Variable; insbe-
sondere ist ihr Koeffizient ungleich Null bzw. nach Normierung sogar gleich eins.
• Die Indizes der Stufenvariablen sind aufsteigend.
Das reduzierte Gleichungssystem (2.1) enthält zwei Stufen mit den beiden Stufenvaria-
blen x1 und x2 ; dagegen ist x3 keine Stufenvariable.
Allgemein gilt für lineare Gleichungssysteme der folgende wichtige Sachverhalt:

Erhält das reduzierte Gleichungssystem weniger Stufen als Variablen, bzw. weniger echte
Gleichungen (nicht Nullgleichungen) als Variablen5 , so
• bilden die nicht an einer Stufe stehenden Variablen Freiheitsgrade,
• werden nur die Werte der Stufenvariablen durch das Gleichungssystem festgelegt.
Beispiel:
3x1 + 15x2 + 9x3 − 3x4 = 6

−2x1 − 10x2 − 5x3 + x4 − 2x5 = −6
−2x1 − 10x2 − 9x3 + 6x4 + 4x5 = 3 (2.3)
x1 + 5x2 + 5x3 − 2x4 − 6x5 = −1
−x1 − 5x2 − 5x3 + 5x4 = 4
Man beginnt mit den Reduzierungsschritten

1
(I) → (I) (Normierung)
3
(II) + 2 · (I)
(III) + 2 · (I)
(IV ) − (I)
(V ) + (I)
und erhält nach einigen weiteren Reduzierungsschritten das Zwischenergebnis
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
x4 − 2x5 = 1
2x4 − 4x5 = 2
Wie man erkennt, wurde hier x2 in der zweiten Gleichungen ebenfalls eliminiert; x2
erscheint an keiner Stufe und liefert einen Freiheitsgrad.
5
Eine unechte Gleichung“ bzw. Nullgleichung“ zeichnet sich dadurch aus, daß in ihr keine Varia-
” ”
blen mehr erscheint; dieses ist gleichbedeutende damit, daß alle Variablen in dieser Gleichungen den
Koeffizienten Null besitzen. Die rechte Seite einer Nullgleichung kann von Null verschieden sein.
74
Die weiteren Reduzierungsschritte: (IV)-(III)
(V)-2·(III)
liefern
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0
An Hand dieser reduzierten Form erkennt man sofort:

• Das Gleichungssystem ist lösbar, da bei den Nullgleichungen rechts ebenfalls Null
steht.
• Es ist nicht eindeutig lösbar, denn die Variablen x2 und x5 stehen nicht an einer
Stufe, sie bilden Freiheitsgrade x2 = λ1 , x5 = λ2 .
Nachdem bis zu dieser Stelle ausschließlich Beispiele behandelt wurden, sollen jetzt allge-
meine lineare Gleichungssystem und die zugehörigen üblichen Bezeichnungen besprochen
werden. Insbesondere soll eine Lösungstheorie dargestellt werden.
Ein allgemeines lineares Gleichungssystem besitzt die Gestalt:
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
Dabei sind: n: die Anzahl der Unbestimmten
m: die Anzahl der Gleichungen
aij : die Koeffizienten für i = 1, . . . , m und j = 1, . . . , n
bi : die rechten Seiten i = 1, . . . , m
Sind die rechten Seiten gleich Null
b1 = b 2 = . . . = bm = 0
so heißt das Gleichungssystem homogen. Homogene Gleichungssysteme werden sich als
sehr wichtiger Spezialfall erweisen.
Zu einem beliebigen (inhomogenen) Gleichungssystem wird oft das sogenannte zu-
gehörige homogene Gleichungssystem benötigt. Man erhält dieses, wenn man bei
dem ursprünglichen Gleichungssystem die rechten Seiten gleich Null setzt, die Koeffizi-
enten auf der linken Seite aber unverändert läßt.
Weitere Bezeichnungen sind:

r = Anzahl der echten Gleichungen nach Reduzierung
= Anzahl der Variablen an den Stufen
r heißt Rang des Gleichungssystems.
s = n−r
= Anzahl der Freiheitsgrade
s heißt Corang des Gleichungssystems.
75
Rang und Corang sind zwei sehr wichtige Kennzahlen des linearen Gleichungssystems.
Der Rang bezeichnet die echte“ Anzahl der Gleichungen6 . Der Rang und der Corang
”
ergeben sich unmittelbar nach Reduzierung des Gleichungssystems.
Für den Rang und den Corang gelten die folgenden wichtigen Sachverhalte, die sich
ebenfalls unmittelbar aus der reduzierten Form des Gleichungssystems ergeben:
1. 0 ≤ r und 0 ≤ s ≤ n
2. ist r =n⇔s=0
⇔ alle n Variablen stehen an einer Stufe
⇔ alle n Variablen sind durch das Gleichungssystem bestimmt
⇔ keine Freiheitsgrade
⇔ nicht mehrdeutig lösbar
3. r ≤ m (= Anzahl der Gleichungen)

(Begründung: Jede Stufe verbraucht eine Gleichung.“)
”
4. m − r = Anzahl der Nullgleichungen nach Reduzierung
5. m = r ⇔ es gibt keine Nullgleichungen nach Reduzierung
⇔ das Gleichungssystem ist sicher lösbar
Wie man anhand von (2), (5) erkennen konnte, erhält man Hilfe des Ranges und des
Coranges Hinweise zur Gestalt der Lösungsmenge.
Bemerkung: Im Fall r = n sagt man, das Gleichungssystem besitzt einen vollen Rang.
Beispiel für ein Gleichungssystem mit n > m:
x1 − 3x2 + 4x3 = 8
2x1 − 6x2 + 9x3 = 20 (II)-2(I)
Die reduzierte Form lautet:

x1 − 3x2 + 4x3 = 8
x3 = 4
Man erkennt anhand der reduzierten Form sofort:
r = 2, n = 3 ⇒ s=n−r =1
Vorhanden ist somit ein Freiheitsgrad; dieser ist durch die nicht an einer Stufe erschei-
nenden Variablen x2 gegeben. Weiter folgt:
r=2=m ⇒ sicher lösbar
Zur Bestimmen der Lösungsmenge setzt man x2 = λ und löst das reduzierte Gleichungs-
system, beginnend bei der letzten Gleichung, auf:
x3 = 4
x2 = λ
x1 = 8 + 3λ − 4 · 4 = −8 + 3λ
6
Sollte jemand versuchen, ein Gleichungssystem zu erweitern, indem er einfach eine bereits vorhan-
dene Gleichung ein zweites Mal hinzufügt, so erhöht sich zwar m, die Anzahl der Gleichungen, der Rang
r bleibt jedoch unverändert.
76
Für die Lösungsmenge ergibt sich damit:
  
 −8 + 3λ 
L =  λ  λ ∈ IR (2.4)
4
 
Eine andere, in vielen Fällen nützlichere Schreibweise der Lösungsmenge lautet:

    
 −8 3 
L =  0  + λ ·  1  λ ∈ IR (2.5)

4 0
 
Die in (2.5) erscheinende Addition zweier Vektoren sowie Multiplikation eines Vektors
mit einer reellen Zahl werden komponentenweise durchgeführt. Damit erhält man aus
(2.5) genau die Darstellung (2.4).
Für die beiden in der Lösungsdarstellung (2.5) vorkommenden Vektoren gilt:

 
−8
 0  ist eine spezielle Lösung (für λ = 0)
4
  (2.6)
3
 1  ist eine Lösung des zugehörigen homogenen Systems
0 (siehe Seite 75)
Durch Einsetzen in das Gleichungssystem weist man dieses sofort nach.
Es gilt nämlich der folgende allgemeine Sachverhalt:

Sei S eine spezielle Lösung des Gleichungssystems7 . Die Lösungsmenge besitzt dann die
Gestalt

H ist eine beliebige Lösung des
L = S+H (2.7)
zugehörigen homogenen Systems
Begründung:
1. Zunächst wird gezeigt, daß S + H tatsächlich eine Lösung des Gleichungssystem

ist; dazu wird S + H einfach ins Gleichungssystem eingesetzt:
     
s1 h1 s1 + h1
S =  ...  , H =  ...  , S + H =  ..
     
. 
sn hn sn + hn
7
Eine spezielle Lösung ist eine beliebig gewählte, dann aber festgehaltene Lösung des Gleichungs-
systems; zur Ermittlung einer speziellen Lösung siehe später.
77
Setzt man dieses in jede einzelne Gleichung des Gleichungssystems ein, so folgt für
j = 1, . . . , m
aj1 (s1 + h1 ) + ... + ajn (sn + hn )

= (aj1 s1 + ... + ajn sn ) + (aj1 h1 + ... + ajn hn )
| {z } | {z }
= bj (da Lösung) =0 (da Lösung des homogenen Systems)
= bj
⇒ j-te Gleichung wird erfüllt
⇒ wegen j = 1, . . . , m wird damit das Gleichungssystem
insgesamt erfüllt.
2. Umgekehrt ist nun zu zeigen, daß eine beliebige Lösung T in der Form
T = S +H
mit der speziellen Lösung S und einer geeigneten Lösung H des homogenen Sys-
tems dargestellt werden kann. Da ja die spezielle Lösung S gegeben ist bzw. fest
gewählt wurde, ergibt sich H sofort aus dem Ansatz
 
t1 − s1
H = T −S = 
 .. 
. 
tn − sn
Zu zeigen bleibt, daß H tatsächlich Lösung des homogenen Systems ist. Einsetzen
von H in das homogene System liefert für j = 1, . . . , m in der Tat
aj1 (t1 − s1 ) + ... + ajn (tn − sn )
= (aj1 t1 + ... + ajn tn ) − (aj1 s1 + ... + ajn sn )

= bj − bj =0
Zusammenfassend kann bis jetzt festgestellt werden:

1. Das Gleichungssystem ist genau dann unlösbar , wenn es gibt keine spezielle Lösung
besitzt.
2. Ist das Gleichungssystem selber homogen (also b1 = . . . = bm = 0), so kann man

als spezielle Lösung die Nulllösung
 
0
 .. 
0 =  .  (2.8)
0
wählen.
3. Das homogene System ist natürlich immer lösbar; es besitzt zumindest die Nulllösung
(2.8).
4. Das Gleichungssystem ist genau dann eindeutig lösbar, wenn
78
• es eine spezielle Lösung gibt und
• das zugehörige homogene System nur die Nulllösung (2.8) besitzt! Man be-
achte dazu, daß durch S = S + 0 bereits eine Lösung gegeben ist; jedes H 6= 0
würde eine weitere Lösung liefern.
Durch
L = {S + H | H ist homogene Lösung.}
wurde bereits eine erste, grobe Darstellung der Lösungsmenge eines linearen Gleichungs-
systems geliefert. Die Struktur der Lösungsmenge läßt sich aber noch genauer beschrei-
ben:
 
 

L = S + λ1 G1 + ... + λs Gs λ1 , . . . , λs ∈ IR
(2.9)
 | {z } 
homogene Lösung
Dabei ist wieder


s1
S =  ...  (2.10)
 
sn
eine spezielle Lösung des Gleichungssystems. Für i = 1, . . . , s (s ist der Corang) sind
 
w1,i
Gi =  ...  (2.11)
 
wn,i
die sogenannten Grundlösungen des zugehörigen homogenen Systems. Die Darstel-

lung (2.10) existiert, da jede Lösung H des homogenen Systems eine sogar eindeutige
Darstellung der Form
H = λ1 G1 + . . . + λs Gs mit λ1 , . . . , λs ∈ IR (2.12)
besitzt8 .
Nachdem man ein lineares Gleichungssystem in die reduzierte Gestalt gebracht hat, läßt
sich die Lösungsmenge in der Form (2.9) sehr einfach berechnen. Man wählt dazu die
folgende Vorgehensweise:
Berechnung von S : Man löst das Gleichungssystem auf und setzt dabei alle Frei-
heitsgrade gleich Null; d. h. ist xi keine Stufenvariable, so wird xi = 0 gesetzt.9
Berechnung der Gi : Das zugehörige homogene System10 wird für i = 1, . . . , s jeweils

einmal gelöst; dabei wird stets der i-te Freiheitsgrad (d. h. die i-te nicht an einer
Stufe stehende Variable) gleich 1 gesetzt, und die übrigen Freiheitsgrade werden
gleich 0 gesetzt.
8
Der Beweis wird hier nicht gebracht.
9
Man verfährt dazu entsprechend wie in (2.2); für die in (2.2) erscheinende Nichtstufenvariable x3
würde man hier x3 = 0 setzen.
10
d. h. das System mit denselben Koeffizienten, aber den rechten Seiten b1 = ... = bm = 0
79
Als Beispiel wird das Gleichungssystem (2.1) mit der reduzierten Form
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0
verwendet. Als erstes wird die spezielle Lösung S berechnet, indem für die beiden Frei-
heitsgrade x2 = x5 = 0 gesetzt wird. Das Auflösen liefert damit:
x5 = 0
x4 = 1 − (−2)x5 = 1
x3 = −2 − (−1)x4 − (−2)x5 = −2 + 1 = −1
x2 = 0
x1 = 2 − 5x2 − 3x3 − (−1)x4 − 0x5 = 2 − 0 + 3 + 1 − 0 = 6
Das Ergebnis ist die spezielle Lösung

 
6

 0 

S = 
 −1 
 (2.13)
 1 
0
Zur Berechnung der ersten Grundlösung setzt man x2 = 1, x5 = 0; damit liefert die
Auflösung
 
x5 = 0 −5
x4 = 0  1



x3 = 0 ⇒ G1 =   0


x2 = 1  0 
x1 = -5 0
Zur Berechnung der zweiten Grundlösung setzt man dann x2 = 0, x5 = 1; hier liefert
die Auflösung
 
x5 = 1 −10
x4 = 2  0
 

x3 = 4 ⇒ G2 =   4


x2 = 0  2 
x1 = -10 1
Die Lösungsmenge des Gleichungssystems (2.1) kann nun sehr gut dargestellt werden:
      

 6 −5 −10


0 1 0

       

      
L = 
 −1 
 + λ1 · 
 0 
 + λ 2 · 
 4 

λi ∈ IR


  1   0   2  


 
0 0 1
 
80
Wie bereits erwähnt wurde, kann an Hand des zugehörigen homogenen Gleichungssys-
tems die Eindeutigkeit der Lösung festgestellt werden; es gilt nämlich:
Ein Gleichungssystem ist genau dann höchstens eindeutig lösbar, wenn das
zugehörige homogene System nur die Lösung Null besitzt.
Die Begründung ergibt sich sofort aus der Darstellung
L = {S + 0} = {S}
Diese Lösungsmenge enthält genau ein Element.11
Beispiel:
2x1 + 6x2 = 4 x1 + 3x2 = 2
reduziert:
x1 + 4x2 = 1 x2 = −1
Das zugehörige homogene System lautet:
2x1 + 6x2 = 0 x1 + 3x2 = 0
reduziert:
x1 4x2 = 0 x2 = 0
Die Auflösung des homogenen Gleichungssystems liefert als dessen einzige Lösung x2 =
0, x1 = −3x2 = 0. Damit folgt, daß das ursprüngliches System eindeutig lösbar ist. Die
betreffende eindeutige Lösung erhält man durch

5
x2 = −1, x1 = 2 − 3x2 = 5 ⇒ A=
−1
Sehr wichtig sind die Quadratischen Systeme; bei diesen ist n = m, also
Anzahl der Gleichungen = Anzahl der Unbestimmten
Für die quadratischen Systeme gelten einige Besonderheiten:

eindeutig lösbar ⇔ n = r (voller Rang)
⇔ m = r (da n = r)
⇔ keine Nullgleichungen
⇔ ist sicher lösbar
Ist somit von einem quadratischen System bekannt, daß es bei jeder möglichen rechten
Seite sicher lösbar ist, so ist es auch mit Sicherheit eindeutig lösbar.
Umgekehrt gilt entsprechend: Wenn das quadratische Gleichungssystem eindeutig lösbar
ist, so ist es auch sicher für jede rechte Seite lösbar.
Weiterhin ergibt sich, daß das zugehörige homogene System genau dann nur die Lösung
Null besitzt, wenn das Gleichungssystem eindeutig lösbar ist, was wiederum genau dann
der Fall ist, wenn es für jede beliebige rechte Seite sicher lösbar ist.12
11
Kontrollfrage: Warum ist ein homogenes System immer lösbar?
12
Diese Aussage wird bei der Polynominterpolation von großem Nutzen sein.
81
Beispiel:13
Der hier gezeigte Ausschnitt des Stra- .. ..
ßennetzes einer Stadt enthält vier Ein- .. ..
.. ..
bahnstraßen mit vier Kreuzungen je- 500 .. .. 300
.. ..
weils zweier dieser Einbahnstraßen. .. ..
200 D .. x3 .. . C 200
Eine Verkehrszählung ergab, wievie- ..................................................................................................................................................................................................
le Kraftfahrzeuge durchschnittlich pro .. ..
.. ..
Stunde auf die Kreuzungen zufahren .. ..
.. ..
bzw. diese wieder verlassen. Läßt sich .. .
.. ........
.
hieraus schließen, wieviele Kraftfahr- x4 .... ... x2
.... ..
zeuge durchschnittlich pro Stunde zwi- .. ..
schen diesen Kreuzungen verkehren? .. ..
.. ..
Diese Anzahlen seien x1 , x2 , x3 , x4 . Zwi- .. ..
.. .
schen diesen Kreuzungen und Zähl- ...................................................................................................................................................................................................
punkten gibt es keine weiteren Straßen 500 A ... x1 .. B 500
..
.. ..
Einmündungen oder Abgänge; außer- .. .. 700
900 .. ..
dem soll angenommen werden, daß es zu .. ..
.. .
keinen Staus oder dergleichen kommt.
Als Ansatz zur Bestimmung der Anzahlen x1 , x2 , x3 , x4 verwendet man:
Die Anzahl der (stündlich) auf eine Kreuzung zufahrenden Fahrzeuge muß
gleich der Anzahl der von der Kreuzung abfahrenden Fahrzeuge sein.
Das ergibt hier mit den Werten aus der Zeichnung:
Kreuzung zufahrend abfahrend
A 500 + 900 = x1 + x2
B x1 + x 2 = 700 + 500
C 200 + 300 = x2 + x3
D x3 + x 4 = 200 + 500
Man erkennt sofort, daß diese Gleichungen ein lineares Gleichungssystem mit vier Glei-
chungen und vier Unbekannten bilden. In die übliche Form umgeschrieben lautet dieses
Gleichungssystem:
x1 + x4 = 1400
x1 + x2 = 1200
(2.14)
x2 + x3 = 500
x3 + x4 = 700
Gemäß des Gaußschen Verfahrens zieht man nacheinander die erste Gleichung von der
zweiten, die zweite von der dritten, die dritte von der vierten ab und schließlich erhält
die reduzierte Form:
x1 + x4 = 1400
x2 − x4 = −200
(2.15)
x3 + x4 = 700
0 · x4 = 0
Man erkennt, der Rang ist 3, und der Corang beträgt 1. Außerdem ist das Gleichungs-
system wegen der vollständigen Nullgleichung lösbar. Die Lösungsmenge ist somit nicht
82
leer und besitzt einen Freiheitsgrad. Zur Bestimmung der Lösungsmenge bestimmt man
zunächst wie üblich eine spezielle Lösung ~x0 , indem man x4 = 0 setzt:
 
x4 = 0 1400
x3 = 700 − x4  −200 
⇒ ~x0 =   (2.16)
x2 = −200 + x4  700 
x1 = 1400 − x4 0
Wie man sieht, können die Komponenten dieser speziellen Lösungsmenge ~x0 nicht die
gesuchten Anzahlen darstellen. Warum nicht?
Um die vollständige Lösungsmenge von (2.14) zu erhalten, benötigt man noch eine
Grundlösung ~x1 des zugehörigen homogenen Systems. Wie üblich setzt man dazu x4 = 1
und verwendet die reduzierte Form des zugehörigen homogenen Gleichungssystems:
 
x4 = 1 −1
x3 = − x4  1 
⇒ ~x1 = 
 −1 
 (2.17)
x2 = + x4
x1 = − x4 1
Damit lautet die Lösungsmenge von (2.14)

  

 1400 − λ


 −200 + λ
  
{~x0 + λ ~x1 | λ ∈ IR} =  700 − λ
 λ ∈ IR
 (2.18)

 

λ
 
Da die Komponenten eines Lösungsvektors Anzahlen darstellen sollen, dürfen sie nicht
negativ sein. Für den Parameter λ sind daher genau die folgenden Werte möglich:
200 ≤ λ ≤ 700 (2.19)
Man erhält damit zwar keine eindeutige Lösung für die gesuchten Verkehrsflüsse. Man
hat damit aber berechnet, daß die gesuchten Anzahlen von Fahrzeugen pro Stunde in
folgenden Bereichen liegen:
1200 ≤ x1 ≤ 700
0 ≥ x2 ≥ 500
(2.20)
500 ≤ x3 ≤ 0
200 ≥ x4 ≥ 700
Die mittlere Verkehrsdichte an den vier Straßenabschnitten beträgt (in Kfz/Std)

 
950
 250 
~xm =   250 
 (2.21)
450
83
2.2 Matrizen
2.2.1 Der Begriff der Matrix
Wir kommen auf die linearen Gleichungssysteme (siehe Seite 70 ff) zurück und verfolgen
das Ziel, für diese eine geeignetere und auch kürzere Schreibweise zu finden.
Der wesentliche Bestandteil eines Gleichungssystems sind seine Koeffizienten, sie be-
stimmen Rang und Corang des Gleichungssystems. Man beginnt daher beim Aufstellen
der neuen Schreibweise bei den Koeffizienten:
Die Koeffizienten eines linearen Gleichungssystems mit m Gleichungen und n Unbekann-
ten
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
schreibt man in der Form einer sogenannten m × n–Matrix
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A =  ..
 
.. .. 
 . . . 
am1 am2 . . . amn
Eine m × n–Matrix ist ein rechteckiges Zahlenschema mit m Zeilen und n Spalten.
Man bezeichnet Matrizen meist mit großen Druckbuchstaben. Kurzschreibweisen für
allgemeine Matrizen sind
A = ((aij ), i = 1 . . . m, j = 1 . . . n)
oder, falls Zeilen- und Spaltenzahl bereits festliegen, auch nur einfach A = ((aij )). Die
aij nennt man die Koeffizienten oder Einträge der Matrix.
Als Beispiel betrachten wir das lineare Gleichungssystem
2x1 + 10x2 + 6x3 = 18

−x1 + 2x2 − 3x3 = 0
(2.22)
3x1 + x2 + 2x3 = 9
4x1 + 13x2 + 5x3 = 27
Dieses ist ein Gleichungssystem mit 4 Gleichungen und 3 Unbekannten, es besitzt als
Koeffizientenmatrix die 4 × 3–Matrix
 
2 10 6
 −1 2 −3 
A =  3 1
 (2.23)
2 
4 13 5
Matrizen sind eine Verallgemeinerung der Spaltenvektoren, der Schreibweise, die man
für die Lösung von Gleichungssystemen verwendet (siehe Seite 73): Einen Spaltenvektor
wie  
x1
~x =  ... 
 
xn
84
kann man als n × 1–Matrix auffassen, also als Matrix mit n Zeilen und nur einer Spalte.
Umgekehrt ist es oft günstig, eine m × n–Matrix als Zusammensetzung von n Spalten-
vektoren mit jeweils m Komponenten zu betrachten:
A = ((aij ), i = 1 . . . m, j = 1 . . . n)
= (~a1 , . . . , ~an )
 
a1j
mit ~aj =  ...  für j = 1 . . . n
 
amj
Der erste Index zählt hier die Komponente des Spaltenvektors, der zweite gibt an, daß
es sich um den j-ten Spaltenvektor handelt.
Die Spaltenvektoren der Matrix (2.23) sind

     
2 10 6
 −1   2   −3 
~a1 = 
 3 
 ~a2 =  1

 ~a3 = 
 2 

4 13 5
Die Menge der n–dimensionalen Spaltenvektoren wird mit IRn bezeichnet. Für Matrizen
trifft man entsprechend die
Definition: Für m, n ∈ IN ist
Mm,n (IR) = {((aij ), i = 1 . . . m, j = 1 . . . n) | aij ∈ IR }
die Menge aller (reellen) m × n–Matrizen.
Die Matrix (2.23) ist demnach ein Element der Menge M4,3 (IR).
Als wichtige Spezialfälle von Mm,n (IR) hat man:

• Mn,n (IR) ist die Menge der quadratischen Matrizen; Zeilen- und Spaltenzahl sind
bei diesen gleich.
• Mm,1 (IR ) ist – wie bereits erwähnt – die Menge der einspaltigen Matrizen, sie
entspricht der Menge der m-dimensionalen Spaltenvektoren:
Mm,1 (IR) =
˜ IRm
• M1,n (IR) ist die Menge der einzeiligen Matrizen, sie entspricht der Menge der n-
dimensionalen Zeilenvektoren:
M1,n (IR) =
˜ {(a1 , . . . , an ) | ai ∈ IR }
• M1,1 (IR) ist die Menge der Matrizen mit nur einem einzigen Eintrag, sie entspricht
der Menge der reellen Zahlen:
M1,1 (IR) =
˜ IR
85
Um mit Hilfe der Matrizen zu einer einfachen Schreibweise für lineare Gleichungssysteme
zu gelangen, definiert man eine Multiplikation“ zwischen einer m×n–Matrix und einem
”
n-dimensionalen Spaltenvektor:
Definition: Seien
 
x1
A = ((ai,j )) ∈ Mm,n (IR) und ~x =  ...  ∈ IRn
 
xn
eine m × n–Matrix und ein n-dimensionaler Spaltenvektor, dann definiert man deren
Produkt durch
   
a11 . . . a1n x1
A ◦ ~x =  ... ..  ◦  .. 

.   . 
am1 . . . amn xn
  (2.24)
a11 x1 + a12 x2 + . . . + a1n xn
 a21 x1 + a22 x2 + . . . + a2n xn 
= 
 
.. .. .. 
 . . . 
am1 x1 + am2 x2 + . . . + amn xn
Das Symbol für diese Verknüpfung ist der Kringel ( ◦“), der auch zur Verknüpfung von
”
Funktionen (f ◦ g) verwendet wird. Verknüpft wird hier immer jeweils eine Zeile der
Matrix mit dem Spaltenvektor:
 
x1
(ai1 , . . . , ain ) ,  ...  −→ ai1 x1 + ai2 x2 + . . . + ain xn ∈ IR
 
xn
Das Ergebnis hiervon ist eine reelle Zahl. Hat die Matrix m Zeilen, so liefert die gesam-
te Operation als Ergebnis m reelle Zahlen; diese bilden genau einen m–dimensionalen
Spaltenvektor.
Der Wertebereich der Verknüpfung ◦“ zwischen einer m × n–Matrix und einem n–
”
dimensionalen Spaltenvektor ist somit der IRm :
◦ : Mm,n (IR) × IRn −→ IRm
Jetzt braucht man nur die rechte Seite eines Gleichungssystems als m–dimensionalen
Spaltenvektor darzustellen. Dann kann man statt
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
das Gleichungssystem in der einfacheren Form
     
a11 . . . a1n x1 b1
 .. ..  ◦  ..  =  .. 
 . .   .   . 
am1 . . . amn xn bm
86
aufschreiben, bzw. man kann die Kurzschreibweise
A ◦ ~x = ~b
verwenden. Der letzte Ausdruck ist die direkte Verallgemeinerung der Darstellung ax = b
einer einfachen Gleichung mit einer Unbekannten.
Die Matrix–Vektor–Multiplikation
   
a11 . . . a1n x1
A ◦ ~x =  ... ..  ◦  .. 

.   . 
am1 . . . amn xn
 
a11 x1 + . . . + a1n xn
= 
 .. .. 
. . 
am1 x1 + . . . + amn xn
ist dabei so gefaßt worden, daß sie genau auf die linearen Gleichungssysteme paßt!
Beispiel: Das Gleichungssystem (2.22) auf Seite 84 bekommt in Matrizenschreibweise

die Gestalt    
2 10 6   18
 −1 2 −3  x1
 ◦  x2  =  0 
 

 3 1 2   9 
x3
4 13 5 27
Beim Reduzieren des Gleichungssystems mit dem Gaußschen Verfahren schreibt man
natürlich nur die Koeffizientenmatrix und den Spaltenvektor der rechten Seite auf:
1. Normierung der ersten Gleichung liefert

   
1 5 3
9
 −1 2 −3   0 
   
 3 1 2   9 

4 13 5 27
2. Geeignete Vielfache der ersten Zeile werden von den folgenden abgezogen oder zu
diesen hinzuaddiert:
   
1 5 3
9
 0 7 0   9 
   
 0 −14 7   −18 

0 −7 −7 −9
3. Die zweite Zeile wird normiert, anschließend werden geeignete Vielfache der zwei-
ten Zeile von den folgenden abgezogen oder zu diesen hinzuaddiert:

9
   
1 5 3
 9 

 0 1 0 
   7 
 0 0 7   0 

0 0 −7 0
87
4. Normiert man nun noch die dritte Gleichung und addiert man ihr Siebenfaches
zur letzten Gleichung, so erhält man ein reduziertes Gleichungssystem, das in
Matrizenschreibweise so aussieht:
9
   
1 5 3  
 0 1 0  x1  9 
  ◦  x2  =  7 
 0 0 1   0 
x3
0 0 0 0
Nachdem wir hier die Matrizen über lineare Gleichungssysteme eingeführt haben, werden
wir sie jedoch – so wie es üblich ist - weitestgehend losgelöst von den Gleichungssystemen
behandelt. Wir werden sehen, daß man Matrizen formal gut handhaben kann und werden
insbesondere die Matrizenrechnung kennenlernen.
Daß sich die Anwendungsmöglichkeit der Matrizen keinesfalls nur auf die linearen Glei-
chungssysteme beschränkt, wird durch das folgende Beispiel unterstrichen:
Beispiel: Matrizen finden Verwendung bei der Beschreibung von Graphen. Als Beispiel
betrachten wir diesen gerichteten Graphen:
v7 w k
1
5

6
w v v9

8
v1 1 PPP

P

k1 v4 PPPP
w w k
q
k4
PP
PP 2 v v6 1

2
P
6
PP PP
Pq ?
w v5
PP
PP P
v3 P! !
k3
Ein gerichteter Graph besteht aus einer Menge K von sogenannten Knoten, hier:
K = {k1 , k2 , k3 , k4 , k5 }
und eine Menge V von gerichteten Verbindungen zwischen einem Teil der Knoten, hier:
{v1 = (k4 , k1 ), v2 = (k4 , k3 ), v3 = (k3 , k4 ), v4 = (k1 , k2 ), v5 = (k3 , k2 ),
V =
v6 = (k1 , k3 ), v7 = (k5 , k1 ), v8 = (k1 , k5 ), v9 = (k2 , k5 )}
Einen gerichteten Graphen stellt etwa das Straßennetz einer Stadt dar: Straßenkreuzun-
gen und Einmündungen sind die Knoten, Straßenfahrtrichtungen bzw. Einbahnstraßen
sind die gerichteten Verbindungen.
Zur Darstellung solcher Graphen dient die sogenannte Adjazenzmatrix :
Hat ein gerichteter Graph n ∈ IN Knoten, so ist seine Adjazenzmatrix
 
a11 . . . a1n
A = ((aij ), i, j = 1 . . . n) =  ... .. 

. 
an1 . . . ann
eine n × n–Matrix, sie ist definiert durch

 1 falls eine Verbindung vom i-ten Knoten
aij = zum j-ten Knoten vorhanden ist
0 sonst

88
Die Adjazenzmatrix des Graphen hier lautet
 
0 1 1 0 1
 0 0 0 0 1 
 
A =   0 1 0 1 0 (2.25)


 1 0 1 0 0 
1 0 0 0 0
Die Adjazenzmatrix eines Graphen kann leicht im Rechner dargestellt und bearbeitet
werden; ausgehend von ihr kann man etwa die Zusammenhangskomponenten des Gra-
phen bestimmen.
Eine wichtige Kennzahl erbt“ die Matrix vom zugehörigen linearen Gleichungssystem:
”
Definition: Der Rang einer Matrix M , geschrieben rgM , ist der Rang eines linearen
Gleichungssystems mit Koeffizientenmatrix M .
Ein Gleichungssystem mit Koeffizientenmatrix M hat die Gestalt M ◦ ~x = ~b mit einem

~b ∈ IRm . Will man den Rang berechnen, so erfolgt das natürlich mit dem Gaußschen
Verfahren. Ist man nur am Rang der Matrix interessiert und nicht an möglichen Lösun-
gen des Gleichungssystems, so reicht es, die Umformungsschritte des Verfahrens nur auf
die Matrix anzuwenden und dabei die rechte Seite ~b nicht zu beachten.
Beispiel: Für die Matrix (2.23) ergab die Rechnung ab Seite 87

 
2 10 6
 −1 2 −3 
rg 
 3 1
 = 3
2 
4 13 5
Eine wichtige Operation auf Matrizen ist die Transposition:

Definition: Sei A ∈ Mm,n (IR) ein m × n–Matrix. Dann ist
At oder in Worten: “A transponiert“
diejenige Matrix n × m–Matrix, die man erhält, wenn man A an der Hauptdiagonalen14
spiegelt. Die Spalten von At sind dann genau die Zeilen von A:
 
a11 . . . a1n  
 a21 . . . a2n  a 11 a 21 . . . a m1
t  . .. .. 
A =  .. ..  ⇒ A =  ..
 
 . . . 
. 
a1n a2n . . . amn
am1 . . . amn
Beispiel:
 t
2 10 6  
 −1 2 −3  2 −1 3 4
  =  10 2 1 13 
 3 1 2 
6 −3 2 5
4 13 5
14
Die Hauptdiagonale ist die Diagonale mit den Elementen a11 , a22 , . . . .
89
Beispiel: Die Transponierte der Adjazenzmatrix (2.25) des gerichteten Graphen auf Seite
88 ist  
0 0 0 1 1
 1 0 1 0 0 
t
 
A =   1 0 0 1 0 

 0 0 1 0 0 
1 1 0 0 0
Dieses ist die Adjazenzmatrix desjenigen gerichteten Graphen, den man enthält, indem
man beim ursprünglichen Graphen alle Verbindungsrichtungen umkehrt.
Bemerkung: Bei nicht quadratischen Matrizen werden beim Transponieren Zeilen- und
Spaltenzahl vertauscht, d. h.
A ∈ Mm,n (IR) ⇒ At ∈ Mn,m (IR)
Für n 6= m liegt insbesondere die transponierte Matrix in einer anderen Matrizenmenge,

nämlich Mn,m (IR), als die ursprüngliche. Nicht so bei quadratischen Matrizen, dort gilt:
A ∈ Mn,n (IR) ⇒ At ∈ Mn,n (IR)
Da doppeltes Spiegeln zum Ursprünglichen zurückführt, gilt der

Satz: A ∈ Mm,n (IR) ⇒ (At )t = A.
Die zweimal transponierte Matrix ist also gleich der ursprünglichen!
Definition: Eine quadratische Matrix A ∈ Mn,n (IR) heißt symmetrisch, falls sie gleich
ihrer Transponierten ist:
A = At
Eine n × n–MatrixA = ((aij )) ist genau dann symmetrisch, wenn ihre Einträge die
Gleichungen
aij = aji für alle i, j = 1 . . . n
erfüllen. Beispiel:

1 3
A = ist symmetrisch,
3 2

1 3
B = dagegen nicht.
4 2
Beispiel: Was bedeutet es, wenn die Adjazenzmatrix

 
a11 . . . a1n
A =  ... .. 

. 
an1 . . . ann
90
eines gerichteten Graphen (siehe Seite 88) symmetrisch ist, d. h. wenn
aij = 1 ⇔ aji = 1
bzw. aij = 0 ⇔ aji = 0 gilt?
Das heißt: es gibt genau dann eine gerichtete Verbindung vom i-ten zum j-ten Knoten,
wenn es auch eine solche Verbindung in umgekehrter Richtung gibt. Ein Graph dieser
Art entspricht einem sogenannten ungerichteten Graphen.
Zwei interessante Spezialfälle beim Transponieren sind Zeilen- und Spaltenvektoren: Ein
Spaltenvektor geht in einen Zeilenvektor über und umgekehrt.
 
a1
~a =  ...  ⇔ ~a t = (a1 , . . . , an )
 
an
Dieses hat u. a. Bedeutung für die Schreibweise:

Für Zeilenvektoren gewinnt man eine Schreibweise dadurch, daß man sie als transpo-
nierte Spaltenvektoren schreibt. Dieses führt auf Bezeichnungen wie ~a t , ~b t oder ~c t für
Zeilenvektoren. Ist nämlich
~c t = (c1 , . . . , cn ) (2.26)
ein Zeilenvektor, so ist ~c der zugehörige Spaltenvektor; dieses erkennt man, indem man
beide Seiten der Gleichung (2.26) transponiert:
 
c1
~c tt = (c1 , . . . , cn )t =  ... 
 
cn
und ~c tt = ~c verwendet. Ebenso verwendet man für Spaltenvektoren mitunter die beque-
mere Schreibweise ~a = (a1 , . . . , an )t“, es ist nämlich
”
 
a1
~a = (a1 , . . . , an )t =  ... 
 
an
Es folgt ein wichtiger Satz, der später noch plausibilisiert werden wird:
Satz: Die transponierte Matrix besitzt denselben Rang wie die ursprüngliche Matrix:
rgA = rgAt
91
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt
Zunächst lassen sich zwei Matrizen derselben Dimension addieren; das Ergebnis der
Addition ist wieder eine Matrix derselben Dimension:
+ : Mm,n (IR) × Mm,n (IR) −→ Mm,n (IR)
Die Addition erfolgt komponentenweise:

     
a11 . . . a1n b11 . . . b1n a11 + b11 . . . a1n + b1n
 .. ..  .. ..  =  .. ..
 +  .
 
 . . .   . . 
am1 . . . amn bm1 . . . bmn am1 + bm1 . . . amn + bmn
Ein neutrales Element der Addition ist vorhanden, die Nullmatrix , die man üblicherweise
einfach durch 0“ bezeichnet:
”
 
0 ... 0
0 =  ... .. 

. 
0 ... 0
Ebenso gibt es zu jeder Matrix A = ((aij )) die negative:

 
−a11 . . . −a1n
−A =  ... .. 

. 
−am1 . . . −amn
Damit ist A + (−A) = 0. Zu beachten ist, daß man zwei Matrizen nur dann addieren
oder voneinander abziehen kann, wenn sie Elemente derselben Matrizenmenge Mm,n (IR)
sind.
Weiterhin kann man eine Matrix mit einer reellen Zahl λ ∈ IR multiplizieren; diese
Multiplikation erfolgt ebenfalls komponentenweise:
 
λa11 . . . λa1n
λ · A =  ... .. 

. 
λam1 . . . λamn
Die bedeutsamste Rechenoperation für Matrizen ist das Matrizenprodukt, das zwischen
Matrizen passender Dimension erfüllt ist: Ist A ∈ Ml,m (IR) und B ∈ Mm,n (IR), so läßt
sich mit diesen Matrizen die Matrizenmultiplikation ausführen:
A◦B = C
Das Ergebnis ist eine Matrix C ∈ Ml,n (IR). Zur Bezeichnung der Matrizenmultiplikation
wird auch der Kringel ◦“ verwendet.
”
Zur Herleitung der genauen Definition des Matrizenproduktes kehren wir zu den linearen
Gleichungssystemen zurück:
Gegeben sei ein lineares Gleichungssystem mit m Gleichungen und n Unbekannten,

geschrieben in Matrizenform:
B ◦ ~x = ~y (2.27)
92
Dabei sind
B ∈ Mm,n (IR), B = ((bij )),
~x ∈ IRn , ~x = (x1 , . . . , xn )t ein Spaltenvektor, bestehend aus
n Unbestimmten,
m t
~y ∈ IR , ~y = (y1 , . . . , ym ) die rechte Seite des Gleichungs-
systems, wobei hier die y1 , . . . , ym
ebenfalls Unbestimmte sein sol-
len, sie sollen sich als Lösung ei-
nes weiteren linearen Gleichungs-
systems ergeben.
Das Gleichungssystem zur Bestimmung von ~y = (y1 , . . . , ym )t sei
A ◦ ~y = d~ (2.28)
mit A = ((aij )) ∈ Ml,m (IR) und der festen rechten Seite d~ ∈ IRl .
Um direkt eine Lösung für ~x zu finden, d. h. ohne zunächst das Gleichungssystem in ~y
lösen zu müssen, setzen wir in die Gleichung (2.28) für ~y die linke Seite von (2.27) und
erhalten
A ◦ (B ◦ ~x) = d~ (2.29)
Wir wollen
• zeigen, daß (2.29) ein lineares Gleichungssystem mit n Unbekannten und l Glei-
chungen ist,
• die Koeffizientenmatrix C des Gleichungssystems (2.29) in Abhängigkeit von den
Koeffizentenmatrizen A und B der beiden ursprünglichen Gleichungssysteme be-
stimmen.
Dazu führen wir die beiden Matrix-Vektor-Multiplikationen in (2.29) explizit aus; als
erstes erfolgt die Multiplikation B ◦ ~x:
A ◦ (B ◦ ~x)
     
a11 . . . a1m b11 . . . b1n x1
=  ... ..  ◦  .. ..  ◦  .. 

.   . .   . 
al1 . . . alm bm1 . . . bmn xn
n
 
X
b1j xj
Der rechte Faktor ist ein m-
   
a11 . . . a1m  j=1 
dimensionaler Spaltenvektor, den
 
 .. .
. ..
=  . .  ◦ 
  
 n . multiplizieren wir jetzt mit der


al1 . . . alm  X 
l × m–Matrix A.
 bmj xj 
j=1
 m n
! 
X X
 a1i bij xj 
 i=1 j=1

 
= 
 .. 
(2.30)
 m . !

n

 X X 
 ali bij xj 
i=1 j=1
93
Als Zwischenergebnis haben wir den l-dimensionalen Spaltenvektor mit den Komponen-
ten !
Xm X n
aki bij xj für k = 1 . . . l
i=1 j=1
erhalten. Die Komponenten dieses Vektors formen wir in einer Nebenrechnung um: für
k = 1 . . . l ist
m n
!
X X
aki bij xj
i=1 j=1
m n
!
X X
= aki bij xj Die aki wurden durch Ausmultiplizieren
i=1 j=1 in die innere Summe gezogen.
n m
!
X X
= aki bij xj Jetzt wird zuerst über j und dann über
j=1 i=1 i summiert; diese Änderung bewirkt
nur, daß Summanden in anderer Rei-
henfolge aufaddiert werden.
n m
!
X X
= aki bij xj xj wurde aus der inneren Summe her-
j=1
| i=1
{z } ausgezogen.
ckj
n
X
= ckj xj Die Koeffizienten der xj bezeichnen wir
j=1 zur Abkürzung mit ckj .
Für die ckj gilt dabei

m
X k = 1...l
ckj = aki bij für (2.31)
j = 1...n
i=1
Setzt man das Ergebnis der Zwischenrechnung in (2.30) ein, so folgt für den zu berech-
nenden Ausdruck A ◦ (B ◦ ~x)
n
 
X
 c1j xj 
 j=1 
 
A ◦ (B ◦ ~x) = 
 .. 
(2.32)
 n .


 X 
 clj xj 
j=1
Schaut man sich die rechte Seite der Gleichung (2.32) genau an, so stellt man fest, daß
dieses genau das Ergebnis der Multiplikation der l × n–Matrix
 
c11 . . . c1n
C =  ... .. 

. 
cl1 . . . cln
94
mit dem Spaltenvektor ~x ∈ IRn ist, also hat man
   
c11 . . . c1n x1
A ◦ (B ◦ ~x) =  ... ..  ◦  .. 

.   . 
cl1 . . . cln xn
= C ◦ ~x (2.33)
Setzt man jetzt noch (2.33) in die Gleichung (siehe Seite 93)
A ◦ (B ◦ ~x) = d~ (2.34)
ein, so wird diese Gleichung zu
C ◦ ~x = d~ (2.35)
Damit haben wir hergeleitet: Die Gleichung (2.29) bzw. (2.34) läßt sich in der Form
(2.35) schreiben und besitzt folglich die Gestalt eines linearen Gleichungssystems.
Gleichzeitig haben wir die Koeffizientenmatrix dieses Gleichungssystems berechnet, es
ist die l × n–Matrix
 
c11 . . . c1n
C =  ... ..  ∈ Ml,n (IR)

. 
cl1 . . . cln
m
X
mit ckj = aki bij (2.36)
i=1
Die neue Matrix C, auf die wir gestoßen sind, hängt über die Berechnungsvorschrift
(2.36) von den beiden gegebenen Matrizen A und B ab. Diese Berechnungsvorschrift ist
das sogenannte Matrizenprodukt, dessen genaue Definition jetzt folgt:
Definition: Sei A = ((aki )) ∈ Ml,m (IR) eine l × m–Matrix und B = ((bij )) ∈ Mm,n (IR)
eine m × n–Matrix. Dann ist deren Produktmatrix
C = A◦B
die l × n–Matrix C = ((ckj )) ∈ Ml,n (IR) mit den Koeffizienten
m
X k = 1...l
ckj = aki bij für (2.37)
j = 1...n
i=1
Man beachte, daß der zweite Index der Einträge von A und der erste Index der Ein-
träge von B denselben Wertebereich durchlaufen; dieses ist auch genau der Bereich des
Summationsindex’ in (2.37).
Beispiel:
 
0 2
1 2 4 1·0+2·3+4·1 1·2+2·4+4·1
◦  3 4  =
9 8 1 9·0+8·3+1·1 9·2+8·4+1·1
1 1

10 14
=
25 51
95
Wichtige Bemerkung: Die Multiplikation zweier Matrizen kann nur dann ausgeführt
werden, wenn die Dimensionen passend sind: die Spaltenzahl des linken Faktors muß
gleich der Zeilenzahl des rechten Faktors sein; also
Ml,m (IR) × Mm,n (IR) −→ Ml,n (IR)
(2.38)
A ◦ B = C
Die Produktmatrix erbt“ die Zeilenzahl vom linken und die Spaltenzahl vom rechten
”
Faktor.
Wir wollen jetzt das Matrizenprodukt A ◦ B = C noch etwas genauer betrachten und
dabei zwei weitere wichtige Schreibweisen für dieses gewinnen. Zunächst erkennt man,
daß bei der Berechnung der Koeffizienten ckj von C, also in
m
X
ckj = aki bij = ak1 b1j + . . . + akm bmj (2.39)
i=1
die k-te Zeile (ak1 , . . . , akm ) von A mit der j-ten Spalte (b1j , . . . , bmj )t von B miteinander
verknüpft werden:
 
b11 . . . b1j . . . b1n
 .. .. .. 
 . . . 
bm1 . . . bmj . . . bmn
↓
a11 . . . a1m
 
 .. .. 
 . . 
 ak1 . . . akm → ckj
 
 . .. 
 .. . 
al1 . . . alm
Dieses führt auf eine andere Schreibweise für (2.39): Wir betrachten dazu den zweiten
Faktor B wieder als aus n Spaltenvektoren zusammengesetzt:
 
b1j
B = (~b1 , . . . , ~bn ) mit ~bj =  ...  für j = 1 . . . n
 
bmj
Eine ähnliche Darstellung wählen wir für den ersten Faktor A, indem wir setzen
 
ak1
~ak =  ... 
 
akm
bzw. ~akt = (ak1 , . . . , akm ) für k = 1 . . . l

und die l × m–Matrix A als Zusammensetzung der l verschiedenen m-dimensionalen
Zeilenvektoren ~a1t , . . . ~alt auffassen, die Zeilenvektoren werden dazu untereinander ge-
schrieben:
 
~a1t
 ~a t 
 2 
A =  ..  (2.40)
 . 
~alt
96
Dann können wir die Gleichung (2.39) in der kurzen Form
 
b1j
ckj = (ak1 , . . . , akm ) ◦  ... 
 
bmj
bzw. ckj = ~akt ◦ ~bj (2.41)
schreiben. Dieses ist nichts anderes als das Produkt einer 1 × m–Matrix mit einer m × 1–
Matrix!
Die Kurzschreibweise (2.41) für die Koeffizenten der Produktmatrix wenden wir bei der
Herleitung einer wichtigen Formel an. Diese Formel beschreibt das Zusammenspiel von
Transposition und Matrizenprodukt:
Satz: Sei A ∈ Ml,m (IR) und B ∈ Mm,n (IR). Dann ist A ◦ B definiert, und es gilt
(A ◦ B)t = B t ◦ At (2.42)
(Man beachte, daß wegen B t ∈ Mn,m (IR) und At ∈ Mm,l (IR) auch das Produkt B t ◦ At
definiert ist.)
Beweis15 : Wir schreiben A in Zeilendarstellung (siehe 2.40) und B in Spaltendarstellung:
 
~a1t
A =  ...  mit ~ak ∈ IRm
 
~alt
B = (~b1 , . . . , ~bn ) mit ~bk ∈ IRm
Hierdurch lassen sich auch deren transponierte Matrizen darstellen:

~b t
 
1
At = (~a1 , . . . , ~al ) B t =  ...  (2.43)
 
~b t
n
Das Produkt der beiden Matrizen A und B stellen wir mit Hilfe von (2.41) dar:
~a1t ◦ ~b1 . . . ~a1t ◦ ~bn

 
A◦B = 
 .. .. 
. . 
t ~ t ~
~al ◦ b1 . . . ~al ◦ bn
Beide Seiten dieser Gleichung werden transponiert, dazu müssen auf der rechten Seite
Zeilen und Spalten vertauscht werden:
~a1t ◦ ~b1 . . . ~alt ◦ ~b1

 
(A ◦ B)t = 
 .. .. 
(2.44)
. . 
~a t ◦ ~bn . . . ~a t ◦ ~bn
1 l
15
Das Nachvollziehen dieses Beweises ist zwar nützlich und wird dringend empfohlen, ist aber für das
Verständnis des Folgenden nicht zwingend erforderlich.
97
Einen Eintrag dieser Matrix wollen wir etwas genau betrachten und geeignet umschrei-
ben:
m
X
~akt ◦ ~bj = aki bij Die beiden Faktoren unter dem Summenzei-
i=1 chen werden vertauscht.
m
X
= bij aki Dieses kann man als Produkt der 1 × m–
i=1 Matrix ~bjt und der m×l–Matrix ~ak auffassen.
Daß hier der gemeinsame Summationsindex
nicht in der Mitte sondern außen steht, ist ohne
Belang. Man könnte dieses durch Umbenennung
der Koeffizienten vermeiden.
= ~bjt ◦ ~ak
Dieses wird jetzt in (2.44) eingesetzt, die Einträge der dortigen Matrix bekommen dann
die Gestalt:
~b t ◦ ~a1 . . . ~b t ◦ ~al
 
1 1
(A ◦ B)t = 
 .. .. 
Vergleicht man die Einträge die-
. . 
~b ◦ ~a1 . . . ~b ◦ ~al
t t ser Matrix mit Gleichung (2.41),
n n
so erkennt man: diese Matrix
ist Produkt zweier Matrizen,
nämlich:
~b t
 
1
=  ...  ◦ (~a1 , . . . , ~al ) Dieses sind aber gerade die beiden
 
~b t Matrizen aus (2.43).
n
= B t ◦ At
qed.
Es gibt noch eine weitere Darstellung des Matrizproduktes C = A ◦ B, auch dieses

werden wir später häufig verwenden. Die Herleitung dieser Darstellung beginnt wieder
mit der Spaltenschreibweise des zweiten Faktors B:
 
b1j
B = (~b1 , . . . , ~bn ) mit ~bj =  ...  ∈ IRm
 
bmj
Genauso stellen wir die Produktmatrix C dar:

 
c1j
C = (~c1 , . . . , ~cn ) mit ~cj =  ...  ∈ IRl
 
clj
98
Wir wollen untersuchen, wie eine Spalte ~cj = (c1j , . . . , c1j )t der l × n–Matrix C von A
und den Spalten von B abhängt. Für jede Spalte ~cj mit j = 1 . . . n gilt
 
c1j
~cj =  ...  Für jeden Koeffizienten clj setzen
 
clj wir die Darstellung aus Gleichung
(2.39) ein.
 m
X

 a1i bij 
 i=1 

=  .. 
Ausgeschrieben ergibt dieses
 . 

 Xm 
ali bij
 
i=1
 
a11 b1j + . . . + a1m bmj
= 
 .. 
. 
al1 b1j + . . . + alm bmj
Vergleicht man dieses mit der Definition der Multiplikation einer Matrix mit einem
Vektor (siehe Gleichung 2.24 auf Seite 86), dann erkennt man, daß man für den letzten
Ausdruck schreiben kann
     
a11 b1j + . . . + a1m bmj a11 . . . a1m b1j
..  . ..  ◦  .. 
 =  ..
 
 . .   . 
al1 b1j + . . . + alm bmj al1 . . . alm bmj
= A ◦ ~bj
Damit haben wir als Ergebnis die Gleichung
~cj = A ◦ ~bj
erhalten. Diese Gleichung besagt, daß die Spalten der Produktmatrix das Ergebnis der
Matrix-Vektor-Multiplikation des linken Faktors A mit den Spalten des rechten Faktors
B sind. Setzt man dieses in die Spaltendarstellung der Produktmatrix C = A ◦ B ein,
so erhält man eine wichtige Schreibweise des Matrizenproduktes:
C = (A ◦ ~b1 , . . . , A ◦ ~bn ) (2.45)
Zusätzlich gewinnt man hier die folgenden Erkenntnisse:
• Das Matrizenprodukt läßt sich auf das Matrix-Vektor-Produkt zurückführen.
• Das Matrix-Vektor-Produkt ist das gleiche wie das Produkt einer Matrix mit ei-
ner einspaltigen Matrix. Das Matrix-Vektor-Produkt ist daher ein Spezialfall des
Matrizenproduktes.
99
Insbesondere gelten dann alle Aussagen und Formeln des Matrizenproduktes auch für
das Matrix-Vektor-Produkt.
Die folgenden Gleichungen werden ohne Beweise16 gebracht. Sehr wichtig ist darunter
insbesondere die erste Aussage, das Assoziativgesetz:
Satz: Die folgenden Matrizen seien gegeben
A, A1 , A2 ∈ Ml,m (IR), B, B1 , B2 ∈ Mm,n (IR), und C ∈ Mn,p (IR)
Dann gilt:
1. Das Assoziativgesetz:
(A ◦ B) ◦ C = A ◦ (B ◦ C)
Die Reihenfolge der Ausführung spielt bei der Matrizenmutliplikation keine Rolle.
2. Das 1. Distributivgesetz:
(A1 + A2 ) ◦ B = A1 ◦ B + A2 ◦ B
3. Das 2. Distributivgesetz:
A ◦ (B1 + B2 ) = A ◦ B1 + A ◦ B2
4. Für λ ∈ IR ist
λ · (A ◦ B) = (λ · A) ◦ B = A ◦ (λ · B)
Zum Schluß dieses Abschnitts noch ein Beispiel zur Anwendung des Matrizenproduktes.
Wir betrachten wieder den gerichteten Graphen auf Seite 88 mit Adjazenzmatrix
 
0 1 1 0 1
 0 0 0 0 1 
 
A =   0 1 0 1 0 

 1 0 1 0 0 
1 0 0 0 0
und berechnen deren Quadrat

 
  1 1 0 1 1
b11 . . . b1n  1 0 0 0 0 
 .. . 2

..  = A = A ◦ A = 

B =  . 1 0 1 0 1
 
 
bn1 . . . bnn  0 2 1 1 1 
0 1 1 0 1
16
Diese Beweise erfolgen durch Nachrechnen.
100
Während die Adjazenzmatrix angibt, ob eine direkte Verbindung von einem Knoten
zu einem anderen führt, gibt deren Quadrat an, wie viele Wege zwischen zwei Knoten
verlaufen, die genau über einen weiteren Knoten führen17 , genauer:


 0 Kein Weg der Länge zwei führt vom i-ten
Knoten zu j-ten Knoten.

bij =

 s > 0 Genau s Wege der Länge zwei führen vom
i-ten Knoten zu j-ten Knoten.

Am Quadrat der Adjazenzmatrix dieses Graphen erkennt man etwa:
• Genau zwei Wege der Länge zwei führen vom vierten zum zweiten Knoten.
• Genau ein Weg der Länge zwei führt vom ersten zum zweiten Knoten.
• Kein Weg der Länge zwei besteht zwischen dem zweiten und dritten Knoten.
2.2.3 Quadratische Matrizen und die Umkehrmatrix
Multipliziert man zwei Matrizen passender Dimension miteinander so hat im allgemeinen

die Produktmatrix eine andere Dimension als die beiden Faktoren (siehe (2.38) auf Seite
96), d. h. liegt in einer anderen Matrizenmenge Ml,n (IR).
Anders (besser!) verhält es sich bei quadratischen Matrizen: Sind zwei quadratische
Matrizen A und B derselben Dimension gegeben, so sind beide Matrizenprodukte A ◦ B
und B ◦ A definiert, und die Ergebnisse sind wieder quadratische Matrizen derselben
Dimension (siehe dazu (2.38) mit l = m = n):
A, B ∈ Mn,n (IR) ⇒ A ◦ B, B ◦ A ∈ Mn,n (IR)
Damit wird die Matrizenmultiplikation zu einer inneren Verknüpfung der Menge Mn,n (IR):
Sie ist für alle Elemente aus Mn,n (IR) definiert, und Mn,n (IR) ist abgeschlossen bezüglich
◦“.
”
Zum Vergleich sei daran erinnert, daß die übliche Multiplikation eine innere Verknüpfung
der Menge der reellen Zahlen ist.
Betrachtet man Mn,n (IR) zusammen mit den beiden inneren Verknüpfungen +“ (der
”
komponentenweisen Addition) und ◦“, so spricht vom Matrizenring und schreibt
”
(Mn,n (IR), +, ◦)
Bezüglich der Addition gilt das auf der Seite 92 ausgeführt; insgesamt gilt: Zusammen
mit +“ ist Mn,n (IR) eine kommutative Gruppe mit der Nullmatrix als neutralem Ele-
”
ment; das negative Element einer Matrix erhält man dadurch, daß man jeden ihrer
Einträge durch dessen Negatives ersetzt.
Wir wollen uns jetzt der anderen inneren Verknüpfung ◦“ zuwenden. Zunächst gilt auch
”
hier der Satz auf Seite 100:
17
Solche Wege bezeichne man als Wege der Länge 2.
101
• ◦“ ist assoziativ, d. h.
”
A, B, C ∈ Mn,n (IR) ⇒ (A ◦ B) ◦ C = A ◦ (B ◦ C)
• Zusammen mit der Addition gelten die Distributivgesetze:
A, B, C ∈ Mn,n (IR) ⇒ (A + B) ◦ C = A ◦ C + B ◦ C
A ◦ (B + C) = A ◦ B + A ◦ C
Wie steht es bei der Matrizenmultiplikation bezüglich
• Kommutativität
• neutralem Element
• Inversenbildung
Wir gehen nacheinander diese Punkte durch. Dazu setzen wir fortan n > 1 voraus. Für
n = 1 entspricht Mn,n (IR) der Menge der reellen Zahlen (Aufgaben: Machen Sie sich
dieses klar!):
(M1,1 (IR), +, ◦) =
˜ (IR, +, ·)
Zunächst muß man feststellen, daß die Matrizenmultiplikation nicht kommutativ ist,
d. h. es gibt Matrizen A, B ∈ Mn,n (IR) mit A ◦ B 6= B ◦ A.
Beispiel:

0 1 2 0 0 1
◦ =
1 0 0 1 2 0

2 0 0 1 0 2
6= ◦ =
0 1 1 0 1 0
Ein neutrales Element zur Matrizenmultiplikation ist vorhanden; dieses ist die sogenann-
te Einheitsmatrix , bezeichnet mit E“:
”
 
1 0 ··· 0
 0 1 ··· 0 
E =  .. .. . . .. 
 
 . . . . 
0 0 ··· 1
Die Einheitsmatrix ist die Matrix, deren Einträge auf der Hauptdiagonalen alle gleich 1
und sonst gleich 0 sind. Die Einträge von E bezeichnet man üblicherweise mit δij :
 
δ11 . . . δ1n
 .. .
..  mit δij = 1 für i = j
E =  .

0 für i 6= j
δn1 . . . δnn
Die δij heißen Kroneckersymbole.
102
Eine weitere Schreibweise für die Einheitsmatrix ist die Darstellung durch Spaltenvek-
toren:
E = (~e1 , ~e2 , . . . , ~en )

 
0
 .. 
 . 
 0 
 
mit ~ej =  1  ←− j-te Stelle
 
 0 
 
 . 
 .. 
0
Die ~e1 , . . . , ~en bezeichnet man als die n-dimensionalen Einheitsvektoren; die Einheits-
vektoren enthalten genau eine Eins und sonst Nullen. Für n = 3 hat man beispielsweise
     
1 0 0
~e1 =  0 , ~e2 =
  1  und ~e3 =  0 
0 0 1
Zusammen ergeben diese die dreidimensionale Einheitsmatrix:

 
1 0 0
E = (~e1 , ~e2 , ~e3 ) =  0 1 0 
0 0 1
Um zu zeigen, daß E wirklich neutrales Element ist, bedarf es zweier Sätze:
Satz: Für alle A ∈ Mn,n (IR) ist

E ◦ A = A.
Beweis: Sei ~a = (a1 , . . . , an )t ∈ IRn ; wir zeigen im ersten Schritt E ◦ ~a = ~a:
   
1 0 ··· 0 a1
 0 1 ··· 0    a2 
 
E ◦ ~a =  .. .. . . ..  ◦  .. 

 . . . .   . 
0 0 ··· 1 an
   
1 · a1 + 0 · a2 + · · · + 0 · an a1
 0 · a1 + 1 · a2 + · · · + 0 · an   a2 
=  =  = ~a
   
..   ..
 .   . 
0 · a1 + 0 · a2 + · · · + 1 · an an
Stellt man jetzt A in Spaltenschreibweise dar, so folgt im zweiten Schritt mit (2.45)
E ◦ A = E ◦ (~a1 , . . . , ~an ) = (E ◦ ~a1 , . . . , E ◦ ~an )

= (~a1 , . . . , ~an ) = A
Denn, wie eben gezeigt, ist stets E ◦ ~aj = ~aj . qed.
103
Bis jetzt wurde nur gezeigt, daß für alle A ∈ Mn,n (IR) die Gleichung
E◦A = A
gilt, d. h. es wurde nur gezeigt, daß E ein sogenanntes linksneutrales Element ist. Man
kann daraus nicht unmittelbar folgern, daß auch
A◦E = A (2.46)
gilt, denn die Matrizenmultiplikation ist nicht kommutativ!.

Die Gleichung (2.46) wird im nächsten Satz gezeigt; dabei wird verwendet, daß die
Einheitsmatrix symmetrisch ist
Et = E
Satz: Für alle A ∈ Mn,n (IR) gilt
A◦E = A
Beweis: Im vorangegangenen Satz wurde gezeigt, daß für alle B ∈ Mn,n (IR) gilt
B = E◦B
Dieses wenden wir auf die Matrix At (der Transponierten unserer gegebenen Matrix A)
an:
At = E ◦ At
und transponieren beide Seiten dieser Gleichung
Att = (E ◦ At )t
Wegen Att = A und E t = E folgt daraus nach Gleichung (2.42) auf Seite 97
A = (E ◦ At )t = Att ◦ E t = A ◦ E
qed.
Die Einheitsmatrix E ist ein links- und rechtsneutrales Element. Ist ein solches vorhan-
den, so stellt sich sofort die Frage nach inversen Elementen: Zu A ∈ Mn,n (IR), A 6= 0 ist
ein D ∈ Mn,n (IR) mit
A◦D = E
gesucht. Man muß jedoch sogleich feststellen, daß es – im Gegensatz zu den reellen
Zahlen – nicht zu jedem von Null verschiedenen Element ein Inverses gibt. Als Beispiel
betrachten wir
1 2
A =
3 6
Setzt man hilfsweise
3 −1
C =
3 −1
so rechnet man nach:18
C ◦A =0 (2.47)
18
Die Matrizen C und A sind auch ein Beispiel für Nullteiler. Mn,n (IR) ist also - anders als IR - nicht
nullteilerfrei.
104
Angenommen, A besitzt ein Inverses, d. h. es gibt eine Matrix D ∈ Mn,n (IR) mit A◦D =
E. Multipliziert man beide Seiten der Gleichung (2.47) von rechts mit dieser Matrix D,
so folgt
C ◦A ◦ D} = 0| {z
| {z ◦ D}
=E =0
⇒ C ◦E = C = 0
Widerspruch, denn nach Definition ist C 6= 0.
Der folgende Satz gibt an, wann eine Matrix invertierbar ist; der zweite Teil seines
Beweises weist einen Weg, zu einer gegebenen Matrix deren Inverse zu berechnen.
Satz: Sei A ∈ Mn,n (IR). Zu A gibt es genau dann eine Matrix D ∈ Mn,n (IR) mit
A◦D = E
wenn rgA = n ist, d. h. genau dann, wenn A vollen Rang hat.
Beweis: Zwei Richtungen sind zu zeigen.
1. Es sei eine Matrix D ∈ Mn,n (IR) mit A ◦ D = E vorhanden. Zu zeigen: Dann

folgt rgA = n.
Dieses wird gezeigt, in dem man nachrechnet, daß ein lineares Gleichungssystem
mit Koeffizentenmatrix A den Rang n besitzt.
Ein quadratisches Gleichungssystem mit n Unbekannten hat genau dann den vollen
Rang n, wenn es für jede rechte Seite lösbar ist (siehe Seite 76 sowie auch Seite 81).
Zu zeigen bleibt also, daß für jedes ~b ∈ IRn eine Lösung von
A ◦ ~x = ~b (2.48)
vorhanden ist. Mit Hilfe der Matrix D kann man die Lösung sofort angeben: Diese
lautet:
~x = D ◦ ~b (2.49)
Dann ist nämlich, wenn man dieses in Gleichung (2.48) einsetzt:
A ◦ ~x = A ◦ D} ◦~b
| {z
=E
= E ◦ ~b = ~b
In der Tat hat man so eine Lösung von (2.48) für eine beliebige rechte Seite ~b
gefunden. A hat folglich den Rang n.
2. Jetzt werde umgekehrt vorausgesetzt, daß rgA = n ist; zu zeigen ist nun: es gibt
ein D ∈ Mn,n (IR) mit A ◦ D = E.
Da rgA = n ist, hat ein quadratischen Gleichungssystem mit Koeffizientenmatrix
A, also
A ◦ ~x = ~b
105
den Rang n und ist für jede rechte Seite ~b lösbar (siehe wieder Seite 76 oder
Seite 81). Insbesondere lassen sich Lösungen finden, wenn man für ~b die n Spalten
der Einheitsmatrix E = (~e1 , . . . , ~en ) einsetzt; dieses liefert die n Gleichungssysteme
A ◦ ~x = ~ej für j = 1 . . . n (2.50)
Sei d~j ∈ IRn jeweils die Lösung hiervon. Dann kann man schreiben
A ◦ d~j = ~ej für j = 1 . . . n
Definiert man nun die Matrix D ∈ Mn,n (IR) durch
D = (d~1 , . . . , d~n )
so ist
A ◦ D = A ◦ (d~1 , . . . , d~n )
= (A ◦ d~1 , . . . , A ◦ d~n )
= (~e1 , . . . , ~en )
= E
D ist die gesuchte inverse Matrix zu A. qed.
Im zweiten Teil des Beweises wurde die inverse Matrix mit Hilfe linearer Gleichungs-
systeme gefunden. Wir kommen darauf zurück, wenn wir die Inverse einer gegebenen
Matrix explizit berechnen wollen.
Ist zu A ∈ Mn,n (IR) ein D ∈ Mn,n (IR) mit A ◦ D = E vorhanden, so schreibt man für D
A−1
und nennt A−1 die Umkehrmatrix zu A. Existiert A−1 , so nennt man A umkehrbar oder
invertierbar .
Wegen der fehlenden Kommutativität der Matrizenmultiplikation taucht hier wieder ein
Problem auf: Es ist zwar
A ◦ A−1 = E
Daraus folgt aber noch nicht, daß auch A−1 ◦ A = E ist. Wir wissen eben bis jetzt nur,
A−1 ein Rechtsinverses zu A; daß A−1 auch Linksinverses ist, ist eine der Aussagen des
folgenden Satzes.
Satz: Die Matrix A ∈ Mn,n (IR) sei umkehrbar mit Umkehrmatrix A−1 . Dann gilt
1. Die Matrix A−1 ist ebenfalls umkehrbar.
2. Ist (A−1 )−1 die (rechtsinverse) Umkehrmatrix von A−1 , so ist
(A−1 )−1 = A
3. Es ist
A−1 ◦ A = E
106
Beweis:
1. Aufgrund des Satzes auf Seite 105 ist zum Nachweis der Umkehrbarkeit von A−1
zu zeigen, daß
rgA−1 = n
ist. Dieses ergibt sich dadurch, daß gezeigt wird, daß das homogene Gleichungs-
system mit Koeffizientenmatrix A−1
A−1 ◦ ~x = 0
nur die Lösung ~x = 0 besitzt (siehe wieder Seite 81). Sei ~x0 ∈ IRn eine beliebige
Lösung, d. h. es sei
A−1 ◦ ~x0 = 0
Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man19 :
−1
| ◦{zA } ◦~x0 = A
A ◦ 0}
| {z
=E =0
⇒ E ◦ ~x0 = 0
⇒ ~x0 = 0
Damit ist rgA−1 = n gezeigt. Die Umkehrmatrix (A−1 )−1 von A−1 existiert also
und für diese gilt
A−1 ◦ (A−1 )−1 = E (2.51)
2. Zu zeigen ist jetzt: (A−1 )−1 = A. Dazu multiplizieren wir Gleichung (2.51) von
links mit A und verwenden wieder A ◦ A−1 = E:
−1 −1 −1
| ◦{zA } ◦(A )
A = A◦E
=E
⇒ E ◦ (A−1 )−1 = A
⇒ (A−1 )−1 = A
3. Als letztes ist zu zeigen: A−1 ◦ A. Dieses folgt aber sofort aus Gleichung (2.51)
zusammen mit der eben bewiesenen Gleichung (A−1 )−1 = A. qed.
Nun wissen wir, daß A−1 sowohl Links- als auch Rechtsinverses zu A ist:
A−1 ◦ A = A ◦ A−1 = E
Wir wollen jetzt ein Verfahren kennenlernen, zu A ∈ Mn,n (IR) mit rgA = n die Umkehr-
matrix A−1 zu berechnen. In dem Beweis des Satzes auf Seite 105 wurde das Verfahren
bereits beschrieben: Man muß die Gleichungssysteme
A ◦ ~x = ~ej (2.52)
19
Zur Erinnerung: 0 steht hier für den Nullvektor (0, . . . , 0). Offensichtlich ist A ◦ 0 = 0.
107
für j = 1 . . . n lösen. Dabei sind ~e1 , . . . , ~en die Spalten der Einheitsmatrix E = (~e1 , . . . , ~en ).
Sind d~1 , . . . , d~n die Lösungen der Gleichung (2.52), so ist – wie gezeigt -
A−1 = (d~1 , . . . , d~n )
Da sich die n Gleichungssysteme (2.52) nur um die rechten Seiten unterscheiden, las-
sen sie sich mit Hilfe des Gaußschen Verfahrens simultan lösen. Man schreibt dazu die
gemeinsame Koeffizientenmatrix A und die rechten Seiten nebeneinander auf:

A ~e1 ~e2 · · · ~en
bzw. ausführlicher
     
  1 0 0
a11 . . . a1n
 .. ..
 0   1   0 
 ...
      
 . .   ..  ..  .. 
 .  .  . 
an1 . . . ann
0 0 1
Anschließend beginnt man mit dem Umformen nach dem Gaußschen Verfahren. Die
Umformungsschritte wendet man hier nicht nur auf die eine rechte Seite, sondern auf
die n rechten Seiten an. Dieses liefert die reduzierte Form der n Gleichungssysteme; sie
bekommen damit die Gestalt
 
1 α12 α13 . . . α1n−1 α1n
 0 1 α23 . . . α2n−1 α2n 
 
 0 0 1 . . . α3n−1 α 3n 
 (1) (1)
· · · ~en(1)
 . . . . .
 . . . ... . .  ~e1 ~e2
 . . . . . 
 0 0 0 ... 1 αn−1n 
 
..
0 0 0 . 0 1
(1) (1)
Die ~e1 , . . . , ~en sind die umgeformten rechten Seiten. Auf der gesamten Diagonalen der
reduzierten Koeffizientenmatrix müssen Einsen stehen, da ja rgA = n vorausgesetzt ist.
Stieße man hier auf Nullgleichungen, so wäre rgA < n, und man könnte die Rechnung
abbrechen, da A nicht invertierbar wäre.
Wegen der Einsen auf der Diagonalen kann man die weitere Rechnung dadurch be-
schleunigen, daß man die Gleichungssysteme noch weiter reduziert. Die Fortsetzung des
Reduktionsvorganges soll dazu führen, daß auch oberhalb der Diagonalen nur Nullen
stehen. Die Vorgehensweise dabei lautet:
Als erstes zieht man für i = 1 . . . n − 1 das αin –Fache der letzten Zeile von der i-ten
Zeile ab; dieses liefert
 
1 α12 α13 . . . α1n−1 0
 0 1 α23 . . . α2n−1 0 
 
 0 0 1 . . . α3n−1 0  (2) (2)
 . .
 . . .. . . .. ..  ~e1 ~e2 · · · ~en(2)
 . . . . . . 

0 0 0 . . . 1 0
 
 
..
0 0 0 . 0 1
Jetzt sind die Elemente der letzten Spalte außerhalb der Diagonalen alle Null. Die rech-
ten Seiten haben sich aufgrund der Zeilensubtraktionen auch weiter verändert.
108
Man verfährt jetzt so weiter, indem man – von hinten beginnend – für j = n − 1 . . . 2
und bei festem j jeweils für i = 1 . . . j − 1 das αij –Fache der j-ten Zeile von der i-ten
Zeile abzieht; dieses liefert die vollständig reduzierte Form
 
1 0 0 ... 0 0
 0 1 0 ... 0 0 
 
 0 0 1 ... 0 0 
 . . . . . . .. ..  f~1 f~2 · · · f~n
 . . . 
 . . . . . 
 0 0 0 ... 1 0 
 
.
0 0 0 .. 0 1
Dabei sind die f~1 , . . . , f~n die endgültig umgeformten rechten Seiten. Die Koeffizienten-
matrix ist in die Einheitsmatrix verwandelt worden. Damit kann man die vollständig
reduzierten Gleichungssysteme schreiben als
E ◦ ~x = f~j für j = 1 . . . n (2.53)
Wegen
E ◦ f~j = f~j
sind die Lösungen von (2.53) und damit auch die Lösungen von (2.52) genau die n
Spaltenvektoren f~1 , . . . , f~n . Die aus deren Zusammensetzung gebildete Matrix
D = (f~1 , . . . , f~n )
ist gerade die Umkehrmatrix von A, also
A−1 = (f~1 , . . . , f~n )
Beipiel: Wir wollen die Umkehrmatrix der 3 × 3–Matrix

 
1 2 3
A =  5 11 22 
3 10 38
berechnen und schreiben dazu

A ~e1 ~e2 ~e3
Ausgeschrieben lautet dies
       
1 2 3
1
0
0
 5 11 22   0   1   0 

3 10 38 0 0 1
Geeignete Vielfache der ersten Zeile werden von den folgenden Zeilen abgezogen:
       
1 2 3
1
0
0
 0 1 7   −5   1   0 

0 4 29 −3 0 1
109
Das Vierfache der zweiten wird von der letzen Zeile abgezogen:
       
1 2 3
1
0
0
 0 1 7   −5   1   0 

0 0 1 17 −4 1
Jetzt setzt man die Reduzierung fort; dabei wird das 7–Fache der letzten von der zweiten
und das 3–Fache der letzten von der ersten Zeile abgezogen:
       
1 2 0
−50
12
−3
 0 1 0   −124   29   −7 

0 0 1 17 −4 1
Zum Schluß wird das Zweifache der zweiten Zeile von der ersten abgezogen:
       
1 0 0
198
−46
11
 0 1 0  
−124   29   −7 

0 0 1 17 −4 1
Damit haben wir als Ergebnis unserer Berechnung erhalten:
 −1  
1 2 3 198 −46 11
A−1 =  5 11 22  =  −124 29 −7 
3 10 38 17 −4 1
Mit Hilfe der Umkehrmatrix läßt sich das Gleichungssystem
A ◦ ~x = ~b
sofort lösen. Multipliziert man beide Seiten dieser (Matrizen-) Gleichung von links mit
A−1 :
−1 −1 ~
| {z◦ A} ◦~x = A ◦ b
A
=E
so folgt daraus sofort die eindeutige Lösung
~x = A−1 ◦ ~b
Beispiel: Die eindeutige Lösung von

   
1 2 3 3
 5 11 22  ◦ ~x =  2 
3 10 38 1
ist
 −1      
1 2 3 3 198 −46 11 3
 5 11 22  ◦  2  =  −124 29 −7  ◦  2 
3 10 38 1 17 −4 1 1
 
513
=  −321 
44
110
Die Berechnung der Umkehrmatrix ist immer dann angezeigt, wenn ein quadratisches
Gleichungssystem mit vollem Rang mehrmals mit unterschiedlichen rechten Seiten zu
lösen ist. Hat man die Umkehrmatrix vorliegen, dann beschränkt sich der Aufwand beim
Berechnen einer Lösung auf eine einfache Multiplikation einer Matrix mit einem Vektor.
Aufgabe: Eine Diagonalmatrix ist eine n × n–Matrix, deren Einträge außerhalb der
Hauptdiagonalen alle gleich Null sind:
 
λ1 0
 0 λ2 0 
 
D = 
 . . 
mit λ1 , . . . , λn ∈ IR
0 . 0 
 
 0 λn−1 0 
0 λn
Zeigen Sie: D ist genau dann umkehrbar, wenn λj 6= 0 für j = 1 . . . n ist, und daß in
diesem Falle die Umkehrmatrix durch
 −1 
λ1 0
 0 λ−1 0 
 2 
D −1
= 
 . .. 
0 0 
−1
 
 0 λn−1 0 
0 λ−1
n
gegeben ist!
Es folgen zwei nützliche Formeln im Zusammenhang mit den Einheitsvektoren. Zu deren

Herleitung schreiben wir die n × n–Matrix A und anschließend auch die Einheitsmatrix
in Spaltenschreibweise:
A = (~a1 , . . . , ~an ) Spaltenschreibweise
= A◦E
= A ◦ (~e1 , . . . , ~en ) Spaltenschreibeise für
die Einheitsmatrix
= (A ◦ ~e1 , . . . , A ◦ ~en ) nach Gleichung (2.45)
also:
(~a1 , . . . , ~an ) = (A ◦ ~e1 , . . . , A ◦ ~en )
Die letzte Gleichung gibt die Gleichheit zweier Matrizen an; da zwei Matrizen genau
dann gleich sich, wenn ihre entsprechenden Spalten gleich sind, liefert dieses
A ◦ ~ej = ~aj für j = 1 . . . n (2.54)
Diese Gleichung besagt: die Multiplikation einer Matrix mit dem j-ten Einheitsvektor
liefert die j-te Spalte der Matrix.
Jetzt werde vorausgesetzt, daß die Matrix A umkehrbar ist. Multipliziert man die Glei-
chung (2.54) von links mit A−1 , so erhält man
A−1 ◦ A ◦ ~ej = A−1 ◦ ~aj
⇒ ~ej = A−1 ◦ ~aj für j = 1 . . . n (2.55)
111
Der nächste Satz beschreibt den Zusammenhang zwischen Matrizenmultiplikation und
Inversenbildung.
Satz: Sind A, B ∈ Mn,n (IR) zwei umkehrbare Matrizen, so ist auch ihr Produkt umkehr-
bar, und die Umkehrmatrix des Produktes erhält man durch
(A ◦ B)−1 = B −1 ◦ A−1 (2.56)
Beweis: Man zeigt, daß B −1 ◦ A−1 die Umkehrmatrix von A ◦ B ist, indem man ganz
einfach nachrechnet, daß diese beiden Matrizen miteinander multipliziert die Einheits-
matrix ergeben:
(A ◦ B) ◦ (B −1 ◦ A−1 ) = (A ◦ B) ◦ (B −1 ◦ A−1 )
= A ◦ (B ◦ B −1 ) ◦ A−1
= A ◦ E ◦ A−1
= A ◦ A−1
= E
qed.
Es fehlt noch der Zusammenhang zwischen Inversenbildung und Transponieren; den

herzuleiten, stellen wir als
Aufgabe: Zeigen Sie mit Hilfe der Gleichung (2.42) auf Seite 97: Die Transponierte einer
umkehrbaren Matrix ist ebenfalls umkehrbar. Die Inverse der Transponierten erhält
durch
(At )−1 = (A−1 )t
In Worten lautet diese Gleichung: Die Inverse der Transponierten ist die Transponierte
der Inversen.
2.2.4 Einige Matrizengruppen
Die allgemeine lineare Gruppe ist definiert durch
GL(n, IR ) = A ∈ Mn,n (IR)|A ist umkehrbar

Wegen der beiden Sätze auf Seite 112 und Seite 106 ist GL(n, IR ) bezüglich Matrizen-
multiplikation und Inversenbildung abgeschlossen. GL(n, IR ) bildet mit der Matrizen-
multiplikation eine nicht-kommutative Gruppe.
Die Menge der orthogonalen Matrizen, die sogenannte orthogonale Gruppe ist definiert
durch
O(n, IR ) = A ∈ Mn,n (IR)|A ◦ At = E

Bei einer orthogonalen Matrix ist die Umkehrmatrix gleich der Transponierten. Mit
Hilfe von Gleichung (2.42) auf Seite 97 folgt die Abgeschlossenheit der orthogonalen
Gruppe bezüglich der Matrizenmultiplikation; O(n, IR ) ist damit ebenfalls eine nicht-
kommutative Gruppe.
112
Aufgabe: Weisen Sie die Abgeschlossenheit von O(n, IR) unter ◦“ nach, d. h. zeigen Sie,
”
daß für A, B ∈ O(n, IR ) auch A ◦ B orthogonal ist, daß nämlich (A ◦ B) ◦ (A ◦ B)t = E
ist!
Für n = 2 und n = 3 besitzen orthogonale Matrizen eine geometrische Bedeutung.
Beispiel: Für eine reelle Zahl α ∈ IR ist die Matrix

 
cos α 0 − sin α
U =  0 1 0 
sin α 0 cos α
orthogonal. Das zeigt man, indem man U ◦ U t = E durch Rechnen nachprüft:

   
cos α 0 − sin α cos α 0 sin α
t
U ◦U =  0 1 0  ◦  0 1 0 
sin α 0 cos α − sin α 0 cos α
cos2 α + sin2 α
 
0 cos α sin α − sin α cos α
=  0 1 0 
2 2
sin α cos α − sin α cos α 0 sin α + cos α
 
1 0 0
=  0 1 0  = E
0 0 1
Die Matrix U beschreibt im 3-dimensionalen Raum eine Drehung um den Winkel α mit
der y–Achse als Drehachse.
2.3 Die Determinante

2.3.1 Einführung und Definition
Das Ziel dieses Abschnittes besteht darin, eine Funktionen von der Menge der quadra-
tischen n–reihigen Matrizen in die Menge der reellen Zahlen, d. h. eine Funktion
f : Mn,n (IR) 7→ IR
zu finden, die gute rechnerische Eigenschaften“ besitzt und für die gilt
”
6= 0 falls A ∈ Mn,n (IR) umkehrbar ist

f (A)
= 0 sonst
Diese Funktion ist dann die sogenannte Determinante.
Beispiel: Wir betrachten die 2 × 2–Matrix

a11 a12
A =
a21 a22
113
und dazu das Gleichungssystem
A ◦ ~x = ~b
mit der rechten Seite ~b = (b1 , b2 )t . Ausgeschrieben lautet dieses Gleichungssystem
a11 x1 + a12 x2 = b1
a21 x1 + a22 x2 = b2
Wir versuchen dieses Gleichungssystem zu lösen, indem wir hier die erste Gleichung mit
a21 und die zweite Gleichung mit a11 multiplizieren:
a11 a21 x1 + a12 a21 x2 = b1 a21
a11 a21 x1 + a11 a22 x2 = b2 a11
und anschließend die erste Gleichung von der zweiten abziehen:
a11 a21 x1 + a12 a21 x2 = b1 a21
(a a − a a ) x = b2 a11 − b1 a21
| 11 22 {z 12 21} 2
d
Man sieht leicht, daß das Gleichungssystem genau dann für jede Wahl von ~b = (b1 , b2 )t
lösbar ist und folglich den vollen Rang r = 2 besitzt, wenn d 6= 0 ist. Man setzt daher
für 2 × 2–Matrix A:

a11 a12 a11 a12
f = det = a11 a22 − a12 a21
a21 a22 a21 a22
Diese Definition der Determinanten soll nun auf Mn,n (IR) für beliebiges n ∈ IN verallge-
meinert werden. Anschließend wird gezeigt, daß die Determinante die eingangs genann-
ten Eigenschaften besitzt und wie man mit der Determinante rechnet bzw. umgeht.
Auch hier erweist es sich wieder als vorteilhaft, eine n×n–Matrix in Spaltenschreibweise
darzustellen:
A = (~a1 , . . . , ~an ) mit Spaltenvektoren ~ai ∈ IRn für i = 1, . . . , n
und die Determinante als Funktion der n Spaltenvektoren aufzufassen:
f (A) = det A = det(~a1 , . . . , ~an )
Die weitere Vorgehensweise besteht darin, daß wir zunächst einige rechnerische Eigen-
schaften, die die Determinante besitzen soll, aufführen. Diese Eigenschaften werden sich
zum einen später als nützlich erweisen, zum anderen legen sie – wie wir sehen werden –
die Definition der Determinanten eindeutig fest.
Die zu fordernden Eigenschaften sind:
1. Für die Determinante der Einheitsmatrix ist
det E = 1
2. Multipliziert man eine der Spalten ~aj mit einem reellen Faktor, so kann man diesen
Faktor aus der Determinanten herausziehen:
Für λ ∈ IR und 1 ≤ j ≤ n gilt:
det(~a1 , . . . , λ · ~aj , . . . , ~an ) = λ · det(~a1 , . . . , ~aj , . . . , ~an )
114
3. Ist eine der Spalten eine Summe, so kann man die Addition aus der Determinanten
”
herausziehen“: Hat die j-te Spalte die Gestalt ~aj = ~uj + ~vj , so gilt
det(~a1 , . . . ~uj + ~vj , . . . , ~an ) =

det(~a1 , . . . ~uj , . . . , ~an ) + det(~a1 , . . . ~vj , . . . , ~an )
4. Sind zwei Spalten der Matrix gleich, so ist der Wert ihrer Determinanten Null;
steht etwa die j-te Spalte auch an der i-ten Stelle mit i 6= j, so hat man:
det(~a1 , . . . , ~aj , . . . , ~aj , . . . , ~an ) = 0

|{z}
i-te Stelle
5. Vertauscht man zwei Spalten, so ändert der Wert der Determinanten sein Vorzei-
chen: für i 6= j ist
det(~a1 , . . . , ~aj , . . . , ~ai , . . . , ~an ) = − det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an )
Bemerkungen:
• Die erste Eigenschaft ist die sogenannte Normierung.
• Eigenschaft 2) und 3) zusammen werden als Linearität in den Spalten bezeichnet.

Aus Eigenschaft zwei folgt insbesondere für einen reellen Faktor λ, der bei allen n
Spalten steht:
det(λ · ~a1 , . . . , λ · ~aj , . . . , λ · ~an ) = λn · det(~a1 , . . . , ~aj , . . . , ~an )
• Man kann zeigen, daß die beiden Eigenschaften 4) und 5) äquivalent sind; man
bezeichnet sie als Alternierend in den Spalten.
Es folgt aus den fünf Eigenschaften sofort, daß eine Matrix A, von deren Spalten eine
nur Nullen enthält, die Determinante Null besitzt: Gilt etwa für die j-te Spalte ~aj = ~0,
so ändert sich nichts, wenn man diese mit 0 multipliziert: 0 ·~aj = ~0 = ~aj , und man kann
schließen:
det A = det(~a1 , . . . , ~aj , . . . , ~an )

= det(~a1 , . . . , 0 · ~aj , . . . , ~an )
= 0 · det(~a1 , . . . , ~aj , . . . , ~an )
= 0 · det A = 0
Hierbei wurde verwendet, daß man den Faktor 0 nach Eigenschaft 2) herausziehen kann.
Aus den Eigenschaften 2), 3) und 4) folgt gemeinsam die wichtige Regel, daß sich der
Wert der Determinanten nicht ändert, wenn man von einer Spalte das Vielfache einer
anderen abzieht; es gilt nämlich für i 6= j
det(~a1 , . . . , ~ai − λ~aj , . . . , ~aj , . . . , ~an )

= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an ) + det(~a1 , . . . , −λ~aj , . . . , ~aj , . . . , ~an )
(2.57)
= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an ) − λ det(~a1 , . . . , ~aj , . . . , ~aj , . . . , ~an )
= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an )
115
Hier wurde als erstes die Determinante nach Eigenschaft 3) auseinandergezogen; an-
schließend wurde mit Eigenschaft 2) der Faktor −λ aus dem zweiten Summanden her-
ausgezogen; in der letzten Zeile hat die zweite Determinante wegen der doppelt vorkom-
menden Spalte ~aj nach Eigenschaft 4) den Wert Null.
Wir zeigen jetzt, daß man aus den geforderten Eigenschaften (auf Seite 114) eine Berech-
nungsvorschrift für den Wert der Determinanten einer beliebigen n × n–Matrix herleiten
kann. Wir gehen dazu schrittweise vor, beginnen im ersten Schritt mit der Determinanten
der Einheitsmatrix und erhalten nach mehreren Verallgemeinerungsschritten schließlich
eine Darstellung der Determinanten einer allgemeinen Matrix.
Im 1. Schritt stellen wir fest, daß durch die Normierungsbedingung die Determinante
der Einheitsmatrix festgelegt ist:
det E = 1
Im 2. Schritt betrachten wir solche Matrizen, deren Spalten Einheitsvektoren sind, d. h. die
in jeder Spalte jeweils genau eine Eins enthalten:
A = (~ε1 , ~ε2 , . . . , ~εn )
dabei ist ~εi ∈ {~e1 , . . . , ~en } für i = 1, . . . , n
Sind unter den ~ε1 , . . . , ~εn zwei gleich, so besitzt A zwei gleiche Spalten, und nach Eigen-
schaft 4) auf Seite 114 ist det A = 0. Sind dagegen alle ~εi voneinander verschieden, so
handelt es sich bei ihnen um eine Vertauschung der Einheitsvektoren ~e1 , . . . , ~en , d. h. die
Matrix A ist aus der Einheitsmatrix durch Spaltenvertauschung hervorgegangen. Da
nach Eigenschaft 5) eine Vertauschung zweier Spalten zu einem Vorzeichenwechsel bei
der Determinanten führt, muß det A = ± det E = ±1 sein. Das Vorzeichen hängt hier
von der Anzahl der paarweisen Vertauschungen ab. Genauer gilt:


 0 falls zwei der ~ε1 , . . . , ~εn gleich sind





+1 falls die ~ε1 , . . . , ~εn durch eine ge-




rade Anzahl paarweiser Vertau-




schungen aus ~e1 , . . . , ~en entstan-

det(~ε1 , ~ε2 , . . . , ~εn ) = (2.58)

 den sind

 −1 falls die ~ε1 , . . . , ~εn durch eine un-






 gerade Anzahl paarweiser Vertau-
schungen aus ~e1 , . . . , ~en entstan-




den sind

Ab jetzt betrachten wir bereits eine allgemeine n × n–Matrix

 
a11 . . . a1n
A = (~a1 , . . . , ~an ) =  ... .. 

. 
an1 . . . ann
und versuchen, deren Determinante auf Determinanten vom eben im 2. Schritt behan-
delten Typ zurückzuführen.
116
Im 3. Schritt nehmen wir uns der ersten Spalte ~a1 von A an. Wir zerlegen diese in eine
Summe aus Vielfachen der Einheitsvektoren:
       
a11 1 0 0
 a21   0   1   0 
~a1 =  ..  = a11  ..  + a21  ..  + . . . + an1  .. 
       
 .   .   .   . 
an1 0 0 1
n
X
= ai1 · ~ei (2.59)
i=1
und setzen diese Summe für ~a1 in det(~a1 , . . . , ~an ) ein:
det A = det(~a1 , ~a2 , . . . , ~an )

n
!
X
= det ai1 · ~ei , ~a2 , . . . , ~an
i=1
Ist eine Spalte eine Summe, so kann nach Eigenschaft 3) auf Seite 114 die Summenbil-
dung aus der Determinanten herausgezogen werden; damit erhält man20 :
n
X
det A = det(ai1 · ~ei , ~a2 , . . . , ~an )
i=1
Hier ist jeder Summand eine Determinante, deren erste Spalte jeweils den Faktor ai1
enthält; nach Eigenschaft 2) kann dieser jeweils vor die Determinante gezogen werden:
n
X
det A = ai1 det(~ei , ~a2 , . . . , ~an ) (2.60)
i=1
Die hier erscheinenden Determinanten haben jeweils in der ersten Spalte genau eine
Eins und sonst Nullen und besitzen damit schon etwas Ähnlichkeit“ mit den bei 2.58
”
behandelten Determinanten.
Im 4. Schritt wird auf dieselbe Art die zweite Spalte zerlegt:
n
X
~a2 = aj2 · ~ej
j=1
Dieses in 2.60 eingesetzt liefert eine Doppelsumme:

n
X n
X
det A = ai1 det(~ei , aj2 · ~ej , ~a3 , . . . , ~an )
i=1 j=1
n X
X n
= ai1 aj2 det(~ei , ~ej , ~a3 , . . . , ~an ) (2.61)
i=1 j=1
20
Bei einer mehrfachen Addition muß streng genommen die Eigenschaft 3) entsprechend mehrfach
angewandt werden.
117
In den weiteren Schritten werden die restlichen Spalten zerlegt. Führt man dieses zunächst
als Beispiel für n = 5 durch, so erhält man
n X
X n X
n X
n X
n
det A = ai1 aj2 ak3 al4 am5 det(~ei , ~ej , ~ek , ~el , ~em )
i=1 j=1 k=1 l=1 m=1
Will man dieses für ein allgemeines n ∈ IN durchführen, so tritt aber ein Problem hin-
sichtlich der Schreibweise auf: Für jede der n Spalte benötigt man in der entstehenden
Mehrfachsumme einen eigenen Index. Bei großen Werten für n reicht für deren Bezeich-
nung kein Alphabet aus. Deshalb verschafft man sich n Indizes, indem den Index i selber
indiziert; das liefert die Indizes
i1 , i2 . . . , in
Verwendet man diese Indizes in der Summe 2.61, so wird diese zu
n X
X n
det A = ai1 1 ai2 2 det(~ei1 , ~ei2 , ~a3 , . . . , ~an )
i1 =1 i2 =1
Im letzten Schritt nach Zerlegung aller Spalten gelangt man bei Verwendung dieser
Indexschreibweise zu der Darstellung
n X
X n n
X
det A = ... ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1 i2 =1 in =1
Gewöhnlich stellt man diese n-fache Summe durch ein einziges Summenzeichen dar:
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.62)
i1 =1,i2 =1,...,in =1
Die in den einzelnen Summanden erscheinenden Faktoren det(~ei1 , ~ei2 , . . . , ~ein ) sind De-
terminanten, die in jeder Spalte jeweils genau eine Eins und sonst Nullen besitzen. Die
Werte solcher Determinanten sind durch 2.58 bestimmt. Durch den Ausdruck 2.62 ist
somit der Wert der Determinanten der Matrix A festgelegt.
Bemerkenswert ist, daß die Darstellung der Determinanten 2.62 in Verbindung mit 2.58
allein aus den geforderten Eigenschaften 2.3.1 auf Seite 2.3.1 gefolgert werden konnte.
Bevor die Summe in 2.62 noch etwas genauer betrachtet wird, folgt als Beispiel die
Determinante einer 2 × 2–Matrix:

1 2 1 0 2
det = det 1 · +3· ,
3 4 0 1 4

1 2 0 2
= 1 · det + 3 · det
0 4 1 4

1 1 1 0
= 1 · 2 · det + 1 · 4 · det
0 0 0 1
| {z } | {z }
=0 =1

0 1 0 0
+ 3 · 2 · det + 3 · 4 · det
1 0 1 1
| {z } | {z }
=−1 =0
= 4 − 3 · 2 = −2
118
Führt man diese Rechnung für eine allgemeine 2 × 2–Matrix durch, so erhält man die
Formel
a b
det = ad − bc
c d
Wir betrachten noch einmal die Darstellung 2.62:

n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1
und bemerken dazu:
• In jedem Summanden erscheint aus jeder Spalte genau ein Eintrag.
• Ein Summand ist höchstens dann von Null verschieden, wenn die zugehörigen
Werte der Indizes i1 , . . . , in alle paarweise verschieden sind. Andernfalls wären in
dem Faktor det(~ei1 , ~ei2 , . . . , ~ein ) zwei gleiche Spalten vorhanden und er wäre damit
wegen 2.58 gleich Null. Hieraus folgt insbesondere:
– Die Summe besitzt höchstens n! von Null verschiedene Summanden.

– In jedem von Null verschiedenen Summanden erscheint auch aus jeder Zeile
genau ein Eintrag.
• Die Determinante läßt sich durch die Rechenoperationen Addition, Subtraktion

und Multiplikation berechnen; eine Division wird nicht benötigt. Die Determinante
ist daher für alle n × n–Matrizen definiert.
• Zur praktischen Berechnung der Determinanten wird die obige Darstellung nur bei
2 × 2–Matrizen verwendet. Für n × n–Matrizen mit n ≥ 2 sind zur Determinan-
tenberechnung geeignetere Verfahren vorhanden (siehe später).
Nachdem wir bisher die Determinante über ihre Grundeigenschaften (siehe Seite 114)
und ihre Darstellung 2.62 eingeführt haben, wollen wir nun
• einige wichtige Formeln und Gleichungen im Zusammenhang mit der Determinan-

ten herleiten,
• zwei weitere Möglichkeiten zum Berechnen der Determinanten kennenlernen und
• verstehen, aus welchem Grund genau dann det A 6= 0 ist, wenn A umkehrbar ist.
2.3.2 Determinante der Produktmatrix und der Transponier-

ten
Eingangs wurde von den guten rechnerischen Eigenschaften der Determinanten gespro-
chen; eine sehr bedeutsame davon ist die Verträglichkeit“ der Determinanten mit dem
”
Matrizenprodukt, beschrieben durch den folgenden
119
Satz: Für zwei Matrizen A, B ∈ Mn,n (IR) gilt
det(A ◦ B) = det A · det B (2.63)
Beweis: Der Beweis verläuft ganz ähnlich wie die Herleitung der Gleichung 2.62.
Als erstes nehmen wir an, daß die Matrix B nur aus Einheitsvektoren besteht. In ge-
ringfügiger Abänderung der Schreibweise auf Seite 116 schreiben wir hier B in der Form
B = (~ei1 , ~ei2 , . . . , ~ein )
Dabei nimmt jeder der Indizes i1 , . . . , in einen Wert zwischen 1 und n (einschl. ) an.
Besitzen zwei dieser Indizes denselben Wert, so sind zwei Spalten von B gleich, und es
ist in diesem Fall
det B = 0
Andererseits sind in diesem Fall auch zwei Spalten der Produktmatrix A ◦ B gleich:
Schreibt man das Produkt A ◦ B in Spaltenform (siehe 2.45 auf Seite 99), so lautet es
A ◦ B = A ◦ (~ei1 , ~ei2 , . . . , ~ein )

= (A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein )
= (~ai1 , ~ai2 , . . . , ~ain ) (2.64)
Dazu wurde A = (~a1 , . . . , ~an ) gesetzt und Gleichung 2.54 auf Seite 111 verwendet. Haben
zwei der Indizes denselben Werte, so erscheint auf der rechten Seite der letzten Gleichung
2.64 eine Spalte zweimal; unter Verwendung Eigenschaft 4) auf Seite 114 erhält man nun
det(A ◦ B) = 0
= det A · 0
= det A · det B denn det B = 0
Im nächsten Schritt nehmen wir wieder eine Matrix B der Gestalt B = (~ei1 , . . . , ~ein ),
setzen jetzt aber voraus, daß alle Spalten voneinander verschieden sind, bzw. daß alle
Werte der Indizes i1 , . . . , in paarweise verschieden sind. Dann ist nach Gleichung 2.58
det B = (−1)s (2.65)
mit
s = Anzahl der paarweisen Vertauschungen zur Überführung
von (~ei1 , . . . , ~ein ) nach (~e1 , . . . , ~en )
= Anzahl der paarweisen Vertauschungen zur Überführung (2.66)
der Indexwerte (i1 , i2 . . . , in ) in die sortierte Reihenfolge
1, 2, . . . , n
Die Zahl s aus Gleichung 2.66 ist auch die Anzahl der paarweisen Vertauschungen, die
man benötigt, um (~ai1 , ~ai2 , . . . , ~ain ) in (~a1 , ~a2 , . . . , ~an ) zu überführen Mit Grundeigen-
schaft 5) (siehe Seite 114) und der obigen Gleichung 2.64 folgt dann
det(A ◦ B) = det(~ai1 , ~ai2 , . . . , ~ain )

= (−1)s · det(~a1 , ~a2 , . . . , ~an )
= (−1)s det A
120
Verwendet man hier Gleichung 2.65, indem man det B für (−1)s einsetzt, so erhält man
für diesen Spezialfall von B die gewünschte Gleichung
det(A ◦ B) = det B · det A = det A · det B
Ab jetzt sei B eine allgemeine n × n–Matrix

 
b11 . . . b1n
B = (~b1 , . . . , ~bn ) =  ... .. 

. 
bn1 . . . bnn
Wie schon bei der Herleitung von 2.62 zerlegen wir die Spalten von B (siehe dazu 2.59
auf Seite 117):
n
X
~bj = bij · ~ei für j = 1, . . . , n
i=1
Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man für
j = 1, . . . , n:
n
!
X
A ◦ ~bj = A ◦ bij · ~ei Nach 2.46 kann man den Faktor A in
i=1 die Summe bis vor die ~ei hineinziehen. (2.67)
n
X
= bij · (A ◦ ~ei )
i=1
Dieses setzen wir jetzt in die Gleichung
det(A ◦ B) = det(A ◦ ~b1 , A ◦ ~b2 , . . . , A ◦ ~bn )
für jedes ~bj ein und verwenden für jede Spalte den eigenen Index ij :
n n n
!
X X X
det(A ◦ B) = det bi1 1 · (A ◦ ~ei1 ), bi2 2 · (A ◦ ~ei2 ), . . . , bin n · (A ◦ ~ein ) (2.68)
i1 =1 i2 =1 in =1
Ziehen wir jetzt in Gleichung 2.68 alle Summenzeichen und alle Faktoren bij j aus der
Determinanten heraus, so erhalten wir
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det(A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein ) (2.69)
i1 =1,i2 =1,...,in =1
Die in dieser Gleichung erscheinenden Determinantenfaktoren lassen sich weiter umfor-

men:
det(A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein ) = det(A ◦ (~ei1 , ~ei2 , . . . , ~ein ))
Die Matrix (~ei1 , ~ei2 , . . . , ~ein ) besteht aus Einheitsvektoren und ist damit vom Typ der
im ersten Teil des Beweises behandelten Matrizen. Nach dem schon gezeigten ist daher
det(A ◦ (~ei1 , ~ei2 , . . . , ~ein )) = det A · det(~ei1 , ~ei2 , . . . , ~ein ))
121
Faßt man die beiden letzten Gleichungen zusammen und setzt sie in Gleichung 2.69 ein,
so erhält man
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det A · det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1
Den Faktor det A kann man aus der Mehrfachsumme herausziehen:

n
!
X
det(A ◦ B) = det A · bi1 1 bi2 2 . . . bin n det(~ei1 , ~ei2 , . . . , ~ein ) (2.70)
i1 =1,i2 =1,...,in =1
Vergleicht man die Mehrfachsumme auf der rechten Seite von Gleichung 2.70 mit Glei-
chung 2.62, so bemerkt man, daß diese genau die Determinante von B ist. Damit ist in
der Tat
det(A ◦ B) = det A · det B
qed.
Folgerung: Ist A ∈ Mn,n (IR) umkehrbar, so ist det A 6= 0 und det A−1 = (det A)−1 .
Beweis: Ist A ∈ Mn,n (IR) umkehrbar, so existiert die inverse Matrix A−1 , und mit 2.63
gilt
det A · det A−1 = det(A ◦ A−1 ) = det E = 1
Ist ein Produkt von Null verschieden, so müssen alle Faktoren von Null verschieden
sein. Teilt man beide Seiten dieser Gleichung durch det A, so ergibt sich die zweite
Behauptung. qed.
Später wird noch hergeleitet, daß ebenso aus det A 6= 0 die Umkehrbarkeit von A folgt.
Satz Die Determinante einer Matrix ist gleich der Determinanten ihrer Transponierten:
det At = det A
Beweis:21 Sei
   
a11 . . . a1n α11 . . . α1n
A =  ... ..  und At =  ... .. 
 
.  . 
an1 . . . ann αn1 . . . αnn
Dabei ist dann
αji = aij (2.71)
Wir formen jetzt die Darstellung von det A so um, daß daraus eine Darstellung von
det At entsteht. Nach 2.62 ist zunächst
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.72)
i1 =1,i2 =1,...,in =1
Es reicht, in dieser Summe nur diejenigen Summanden zu betrachten, bei denen die
Indizes i1 , . . . , in paarweise verschiedene Werte annehmen (siehe Seite 119). In einem
solchen Summanden nehmen wir das Produkt der Einträge
ai1 1 ai2 2 . . . ain n
21
Die Kenntnis dieses Beweises ist für das Weitere nicht zwingend erforderlich.
122
und ordnen diese Faktoren nach den Werten ihrer Indizes, das Ergebnis davon ist
a1j1 a2j2 . . . anjn
Dabei ist j1 , . . . , jn die entstehende Anordnung der zweiten Indizes. Sei s die Anzahl
der paarweisen Vertauschungen, die die erste Anordnung der Faktoren in die zweite
überführt. Wie man leicht sieht, ist dann s auch die Anzahl der paarweisen Vertauschun-
gen, die sowohl i1 , i2 , . . . , in in 1, 2, . . . , n als auch j1 , j2 , . . . , jn in 1, 2, . . . , n überführt.
Wegen Gleichung 2.58 ist dann insbesondere
det(~ei1 , ~ei2 , . . . , ~ein ) = det(~ej1 , ~ej2 , . . . , ~ejn )
Diese Gleichung und die neue Anordnung der Faktoren aij j setzt man in Gleichung 2.72
ein und verwendet, daß die Werte der Indizes j1 , j2 , . . . , jn die einzelnen Summanden
ebenso festlegen, wie die Indizes i1 , i2 , . . . , in . Man kann daher genauso gut über die
j1 , j2 , . . . , jn summieren. Damit wird Gleichung 2.72 zu
n
X
det A = a1j1 a2j2 . . . anjn det(~ej1 , ~ej2 , . . . , ~ejn ) (2.73)
j1 =1,j2 =1,...,jn =1
Setzt man hier für die ajij noch die Koeffizienten αij j von At ein (siehe Gleichung 2.71),
so folgt schließlich
n
X
det A = αj1 1 αj2 2 . . . αjn j det(~ej1 , ~ej2 , . . . , ~ejn ) = det At
j1 =1,j2 =1,...,jn =1
qed.
Der letzte Satz besitzt eine Folgerung, die bei der Berechnung von Determinanten nütz-
lich ist. Da nämlich durch das Transponieren Spalten in Zeilen und Zeilen in Spalten
übergehen, gelten wegen det A = det At die sich auf Spalten beziehenden Eigenschaften
auf Seite 114 und auch die Regel 2.57 ebenso für Spalten:
Folgerung: Für die Zeilen einer Determinanten gilt:
• Enthält eine Zeile einen reellen Faktor, so kann dieser vor die Determinante gezogen
werden.
• Ist eine Zeile eine Summe, so kann die Addition aus der Determinanten herausge-
zogen werden:
~at1
   t   t 
~a1 ~a1
.
..  . .  .. 
 .   . 
 
 
det  ~ui + ~vi  = det  ~ui  + det  ~vit 
 t t   t   
 ..   . 
 .. 
 . 
 .. 
 . 
t t
~an ~an ~atn
• Sind zwei Zeilen gleich, so ist der Wert der Determinanten Null.
• Bei Vertauschung zweier Zeilen wechselt die Determinante ihr Vorzeichen.
123
• Zieht man einer Zeile das Vielfache einer anderen ab, so ändert sich die Determi-
nante nicht, d. h. für i ≥ j:
~at1
   t 
~a1
..  .. 
.  . 
 
 
 t
 ~ai − λ · ~atj 
 t 
 ~ai 

.  = det  ... 
   
det 
 .
.    (2.74)
t t 
~aj  ~aj 
  
 
.  . 
..  .. 
 
 
~an t
~atn
2.3.3 Berechnung der Determinanten
Selbstverständlich könnte man die Determinante mit Hilfe der Darstellung 2.62 berech-
nen. Es gibt aber Methoden zur Berechnung der Determinanten, die dem aus praktischen
Gründen und hinsichtlich des Rechenaufwandes vorzuziehen sind. Zwei Methoden sollen
hier vorgestellt werden: die eine beruht auf dem Gaußschen Eliminationsverfahren (siehe
Seite 71), die andere ist der sogenannte Entwicklungssatz. Beide haben als Grundlage
den folgenden
Satz: Sei A ∈ Mn,n (IR) eine Matrix, die in der ersten Spalte ab dem zweiten Eintrag nur
Nullen enthält. Eine solche Matrix A hat die Gestalt
 
a11 a12 . . . a1n
 0 
A =  ..
 

 . A1 
0
mit der (n − 1) × (n − 1)-Matrix

 
a22 . . . a2n
A1 =  ... .. 

. 
an2 . . . ann
Dann gilt für die Determinante von A:
det A = a11 · det A1
Beweis: Wir beginnen wieder mit der Darstellung 2.62:
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1
Da nach Voraussetzung ai1 1 = 0 für i1 ≥ 2 ist, kann man die Summanden mit i1 ≥ 2
weglassen:
n
X
det A = a11 ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein )
i2 =1,...,in =1
124
Den Faktor a11 zieht man vor die Summe. In der Summe hat ein Summand den Wert
Null, wenn mindestens einer der Indizes i2 , . . . , in den Wert 1 hat; in diesem Fall kommt
in dem Determinantenfaktor det(~e1 , ~ei2 , . . . , ~ein ) an mindestens zwei Stellen die Spalte
~e1 vor, und er ist damit Null. Man kann daher weiter schreiben, indem man den Bereich
der Indizes bei 2 beginnen läßt
n
X
det A = a11 · ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein ) (2.75)
i2 =2,...,in =2
Nun müssen noch die Determinantenfaktoren det(~e1 , ~ei2 , . . . , ~ein ) vereinfacht werden. Da
~e1 an seiner ursprünglichen, nämlich der ersten Stelle steht, kommt es für den Wert dieser
Determinanten nur auf die ~ei2 , . . . , ~ein an; man kann daher setzen
det(~e1 , ~ei2 , . . . , ~ein ) = det(~ei2 , . . . , ~ein )
Hierbei werden die ursprünglich n-dimensionalen Einheitsvektoren ~ei2 , . . . , ~ein als (n−1)-
dimensionale Einheitsvektoren aufgefaßt, indem ihre ersten Komponenten gestrichen
werden. Das ist ohne Probleme möglich, da wegen i2 , . . . , in ≥ 2 diese Komponenten
ohnehin den Wert Null haben. Schreibt man so Gleichung 2.75 noch einmal auf:
n
X
det A = a11 · ai2 2 . . . ain n det(~ei2 , . . . , ~ein )
i2 =2,...,in =2
so erkennt man, daß die darin erhaltene Summe genau die Determinante der Matrix A1
ist. Damit ist die Behauptung det A = a11 · det A1 gezeigt. qed.
Eine erste Folgerung dieses Satzes gibt an, wie von Matrizen eines wichtigen Typs leicht
die Determinante berechnet werden kann:
Satz: Sei A eine obere Dreiecksmatrix:
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
A =  ..
 
.. . . .. 
 . . . . 
0 0 . . . ann
Eine obere Dreiecksmatrix ist eine Matrix, die unterhalb der Hauptdiagonalen nur Nullen
besitzt. Für eine solche Matrix A gilt:
det A = a11 · a22 · · · ann
det A ist gerade das Produkt der Diagonalelemente.

Beweis: Der Beweis erfolgt durch vollständige Induktion über die Spaltenzahl n der
Matrix.
Für n = 1 ist die Behauptung klar; dann besteht die Matrix nur aus dem Eintrag a11
und es ist det A = a11 .
125
Ist die Behauptung für n − 1 bewiesen, so kann man den Satz von eben anwenden:
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
det A = det  ..
 
.. . . .. 
 . . . . 
0 0 . . . ann
 
a22 . . . a2n
= a11 · det  ... . . . ... 
 
0 . . . ann
Die rechts stehende Matrix ist wieder eine obere Dreiecksmatrix, ihre Spaltenzahl beträgt
n − 1. Nach Induktionsvoraussetzung besitzt sie daher die Determinante a22 · a33 · · · ann .
Setzt man dieses oben ein, so folgt die Behauptung. qed.
Folgerung: Sei A eine untere Dreiecksmatrix:

 
a11 0 ... 0
 a21 a22 ... 0 
A = 
 
.. .. ... .. 
 . . . 
an1 an2 . . . ann
Für eine solche Matrix gilt ebenfalls:
det A = a11 · a22 · · · ann
Beweis: Früher wurde det A = det At gezeigt (siehe Seite 122). Da die Transponierte von
A eine obere Dreiecksmatrix ist, kann man die Folgerung von eben verwenden, und es
gilt
det A = det At = a11 · a22 · · · ann
qed.
Es soll jetzt gezeigt werden, wie mit dem Gaußschen Eliminationsverfahren (siehe Sei-
te 71) auf eine sehr effektive Art und Weise die Determinante berechnet werden kann.
Die Verwendung des Gaußschen Verfahrens bietet sich an, da zwei der bei diesem Verfah-
ren anzuwendenden Zeilenoperationen den Wert der Determinanten unverändert lassen
bzw. nur zu einem Vorzeichenwechsel führen (siehe dazu Seite 123 und Gleichung 2.74):
• Zieht man von einer Zeile das Vielfache einer anderen ab, so ändert sich die De-
terminante nicht.
• Vertauscht man zwei Zeilen, so wechselt das Vorzeichen der Determinanten.
Wir wenden jetzt auf die Matrix

 
a11 . . . a1n
A =  ... .. 

. 
an1 . . . ann
126
das Gaußsche Verfahren an, verzichten jetzt hier jedoch auf die sonst üblichen Normie-
rungsschritte und schreiben die so erhaltene reduzierte Form von A in der Fassung
 
α11 α12 . . . α1n
 0 α22 . . . α2n 
Ã =  .. (2.76)
 
.. ... .. 
 . . . 
0 0 . . . αnn
Abweichend zu sonst sind die Stufen der reduzierten Form durch einen von Null ver-
schiedenen Eintrag gekennzeichnet, der aber nicht notwendigerweise gleich eins ist. Hat
die Matrix den vollen Rang r = n, so verlaufen die Stufen genau auf der Diagonalen, und
es ist αii 6= 0 für i = 1, . . . , n. Ist hingegen rgA < n, so verlaufen einige Stufen oberhalb
der Hauptdiagonalen, es kommt zu mindestens einer Nullgleichung (bzw. Nullzeile), und
es ist zumindest αnn = 0.
Auf alle Fälle können wir in den beiden Fällen rgA = n und rgA < n die reduzierte Form
Ã von A wie in 2.76 schreiben. Da zu ihrer Herstellung auf die Normierung verzichtet
und nur die beiden oben genannten Operationen verwendet wurden, ist det A = ± det Ã.
Die reduzierte Form ist eine obere Dreiecksmatrix. Somit bietet sich jetzt zur Berechnung
von det A der Satz auf Seite 125 an:
 
α11 α12 . . . α1n
 0 α22 . . . α2n 
det A = ± det  ..
 
.. . . ..  (2.77)
 . . . . 
0 0 . . . αnn
= ±α11 · α22 · · · αnn
A besitzt – wie oben begründet – bis auf das Vorzeichen dieselbe Determinante wie
seine reduzierte Form. Die reduzierte Form ist eine Dreiecksmatrix, daher ist ist ihre
Determinante gleich dem Produkt ihrer Diagonalelemente. Das Vorzeichen hängt davon
ab, ob zur Herstellung der reduzierten Form eine gerade oder eine ungerade Anzahl von
Zeilenvertauschungen notwendig waren.
Bevor wir uns in einem Beispiel diese Möglichkeit zur Determinantenberechnung genauer
anschauen, bemerken wir, daß wir mit Hilfe der reduzierten Form einer Matrix den
wichtigsten Satz über Matrizen herleiten können:
Satz: Eine n × n–Matrix ist genau dann umkehrbar, wenn ihre Determinante ungleich
Null ist.
Beweis: Die Bezeichnungen von eben werden verwendet:
A ist umkehrbar ⇔ Der Rang von A beträgt n.
⇔ Die Stufen in der reduzierten Form verlaufen auf der
Hauptdiagonalen (siehe 2.76).
⇔ αii 6= 0 für i = 1, . . . , n
⇔ det A = ±α11 · α22 · · · αnn 6= 0 (siehe 2.77)
qed.
Beispiel: Wir wollen mit dem Gaußschen Verfahren die Determinante der 3 × 3–Matrix
 
0 2 7
A =  1 2 3 
2 0 1
127
berechnen:
 
0 2 7
det 1 2 3
  Die ersten beiden Zeilen
2 0 1 vertauschen.
 
1 2 3
= − det 0 2
 7  Das Zweifache der ersten
2 0 1 Gleichung von der letzten
abziehen.
 
1 2 3
= − det  0 2 7  Das Zweifache der zweiten
0 −4 −5 Gleichung zu der letzten
hinzuzählen.
 
1 2 3
= − det  0 2 7  Jetzt kann das Produkt
0 0 9 der Diagonalelemente ge-
nommen werden.
= −1 · 2 · 9 = −18
Wir kommen jetzt zum Entwicklungssatz. Dieser stellt eine weitere Methode zum Be-
rechnen einer Determinanten dar und ist eine Verallgemeinerung des Satzes auf Seite
124. Dort wurde eine Determinante behandelt, die in der ersten Spalte ab dem zweiten
Eintrag nur Nullen enthält. Wir nehmen jetzt den ersten Verallgemeinerungsschritt vor,
indem wir die Determinante einer n × n–Matrix A berechnen, die in irgendeiner Spalte
nur höchstens ein von Null verschiedenes Element besitzt, und dieses Element muß nicht
notwendigerweise an der ersten Stelle stehen; A besitzt dann die Gestalt
i-Spalte
↓
 
a11 ... 0 ... a1n
 .. .. .. 
 . . . 
 aj−1,1

... 0 ... aj−1,n 
 (2.78)
A =  aj1 . . . aji . . . ajn  ← j-te Zeile
 
 aj+1,1 ... 0 ... aj+1,n 
 
 . .. .. 
 .. . . 
an1 ... 0 ... ann
A besitzt in ihrer i-ten Spalte nur ein von Null verschiedenes Element, und dieses steht
dort an der j-ten Stelle. Die Matrix A soll durch Zeilen- und Spaltenvertauschung in
eine Matrix wie die auf Seite 124 verwandelt werden. Dazu wird zunächst das Element
aji in die erste Zeile gebracht, in dem die j-te Zeile mit der (j − 1)-ten Zeile, danach
mit der (j − 2)-ten und schließlich mit der 1-ten Zeile vertauscht wird. Durch insgesamt
j − 1 Zeilenvertauschungen wandert“ so die ursprüngliche j-te Zeile an die erste Stelle.
”
128
Dieses liefert wegen der j − 1 Vorzeichenwechsel der Determinanten
 
aj1 . . . aji . . . ajn
 a11 . . . 0 ... a1n 
 . .. .. 
 .
 . . .


j−1
det A = (−1) det  aj−1,1 . . . 0 . . . aj−1,n
 

 aj+1,1 . . . 0 . . . aj+1,n
 

 . .. ..
 ..

. . 
an1 . . . 0 ... ann
Nun soll die i-te Spalte an die erste Stelle gebracht werden, dazu wird sie, indem man
entsprechend wie vorher bei der j-ten Zeile verfährt, i − 1 Mal mit ihrer jeweiligen
vorangehenden Spalte vertauscht. Durch diese i − 1 paarweisen Vertauschungen erhält
man
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
 0 a11 . . . a1,i−1 a1,i+1 . . . a1n 
 . .. .. .. .. 
 .
 . . . . . 

det A = (−1)j−1 (−1)i−1 det  0 aj−1,1 . . . aj−1,i−1 aj−1,i+1 . . . aj−1,n 
 
 0 aj+1,1 . . . aj+1,i−1 aj+1,i+1 . . . aj+1,n 
 
 . .. .. .. .. 
 .. . . . . 
0 an1 . . . an,i−1 an,i+1 . . . ann
Diese Determinante hat genau die Form wie diejenige im Satz auf Seite 124. Sie soll
ebenfalls mit Hilfe einer (n − 1) × (n − 1)-Matrix dargestellt werden; dazu definieren wir
Definition: Sei eine n × n–Matrix. Dann setzt man für 1 ≤ i, j ≤ n
Aij :die (n−1)×(n−1)-Matrix, die entsteht, wenn
man bei der n × n–MatrixA die i-te Spalte
(2.79)
und die j-te Zeile22 streicht.
Uij = det Aij
Mit dieser Definition gilt aufgrund des Satzes auf Seite 124:
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
j+i
 0 
det A = (−1) det 
 
.. 
 . Aij 
0
= (−1)j+i aji det Aij

= (−1)j+i aji Uij (2.80)
Nun kommen wir zu einer allgemeinen n × n–Matrix A und wählen von dieser die i-te
Spalte fest aus. Die i-te Spalte hat nicht notwendigerweise nur eine von Null verschiedene
Komponente, aber sie besitzt eine Summenzerlegung in Spalten, bei der jeweils alle bis
eine Komponente gleich Null sind:
     
  a1i 0 0
a1i  0   a2i   0  n
 ..  X
~aj =  .  =  ..  +  ..  + . . . +  ..  = aji~ej
     
 .   .   .  j=1
ani
0 0 ani
129
Jetzt kann man wieder Eigenschaft 3) auf Seite 114 anwenden und bei der Berechnung
von det A die Summe in der i-ten Spalte vorziehen:
n
X
det A = det(~a1 , . . . , aji~ej , . . . , ~an )
j=1
n
X
= det(~a1 , . . . , aji~ej , . . . , ~an )
j=1
Schreibt man diese Determinante ausführlich hin und verwendet man die Bezeichnungen
aus 2.79, so kann man schließlich Gleichung 2.80 verwenden:
 
a11 . . . 0 . . . a1n
 .. .. .. 
 . . . 
 aj−1,1 . . . 0 . . . aj−1,n 
n
 
X
det A = det  aj1 . . . aji . . . ajn 
 
 aj+1,1 . . . 0 . . . aj+1,n 
 
j=1
 . .. .. 
 .. . . 
an1 . . . 0 . . . ann
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
n
X  0 
= (−1)j+i det 
 
.. 
j=1
 . Aij 
0
n
X
= (−1)j+i aji det Aij
j=1
n
X
= (−1)j+i aji Uij
j=1
Damit haben wir den Entwicklungssatz hergeleitet, seine genaue Formulierung lautet:
Satz: (Entwicklungssatz ) Sei A eine n × n–Matrix. Dann gilt mit den Bezeichnungen aus
2.79:
• Entwicklung nach der i-ten Spalte:
n
X
det A = (−1)j+i aji Uij (2.81)
j=1
• Entwicklung nach der j-ten Zeile:

n
X
det A = (−1)j+i aji Uij (2.82)
i=1
Zum Beweis: Die Entwicklung nach einer Spalte haben wir bereits hergeleitet. Die Ent-
wicklung nach einer Zeile führt man auf die Spaltenentwicklung zurück, indem man
det At = det A verwendet. qed.
130
Durch den Entwicklungssatz wird die Berechnung einer n-reihigen Determinanten auf
die Berechnung der (n − 1) reihigen Unterdeterminanten Uij zurückgeführt. Auf die Uij
läßt sich den wieder der Entwicklungssatz anwenden, bis man bei 2 × 2–Determinanten
angekommen ist, die man direkt berechnen kann.
Beispiel: Die folgende Determinante wird mit dem Entwicklungssatz berechnet. Da die
zweite Spalte eine Null enthält, wird nach dieser entwickelt:
 
3 1 2
det  7 0 2 
1 2 0
7 2 3 2 3 2
= −1 · det + 0 · det − 2 · det
1 0 1 0 7 2
= −1 · (7 · 0 − 2 · 1) + 0 − 2 · (3 · 2 − 7 · 2)
= 18
Zum Abschluß dieses Abschnitts folgen einige Bemerkungen zu den Verfahren zur De-
terminantenberechnung:
Entwicklungssatz: Der Nachteil besteht darin, daß ungefähr n! Multiplikationen not-
wendig sind. Man nimmt den Entwicklungssatz nur bei kleinen Dimensionen (bis
Dimension 3) oder bei Determinanten, die sehr viele Nullen enthalten. Man ent-
wickelt dann stets nach der Zeile oder Spalte, die die meisten Nullen enthält.
Gaußsches Verfahren: Diese Methode bietet sich immer an. Da die Anzahl der not-
wendigen Multiplikationen – wie man zeigen kann – von der Größenordnung n2
ist, ist für größere n das Gaußsche Verfahren von erheblich geringerem Aufwand
als der Entwicklungssatz.
Mitunter empfiehlt sich auch eine Verbindung von Entwicklungssatz und Gauß-
schem Verfahren: Enthält bei größerem n eine Zeile oder eine Spalte viele Nullen,
so entwickelt man zunächst nach dieser Spalte bzw. Zeile und wendet dann das
Gaußsche Verfahren auf die Unterdeterminanten Uij an.
Sarrus-Regel: Für 3 × 3-Matrizen gibt es noch ein Verfahren, das zwar bezüglich der
Multiplikationen noch etwas aufwendiger als der Entwicklungssatz ist, das aber
wegen seines leicht zu merkenden Schemas oft genommen wird. Man schreibt dazu
die ersten beiden Spalten der Determinanten noch einmal hinter die dritte Spalte
und bildet die Summe bzw. Differenz aus den Produkten, die aus drei auf einer
Schrägen liegenden Einträgen bestehen:
+ + +
a11 a12 a13 a11 a12
a21 a22 a23 a21 a22
a31 a32 a33 a31 a32
− − −
damit ist det A = + a11 a22 a33 + a12 a23 a31 + a13 a21 a32
− a31 a22 a13 − a32 a23 a11 − a33 a21 a12
131
2.3.4 Die adjungierte Matrix
Gegeben sei wieder eine n × n–Matrix und dazu die (n − 1) × (n − 1)-Untermatrizen

Aij und Unterdeterminanten Uij wie in 2.79 auf Seite 129. Dann ist die sogenannte
adjungierte Matrix zu A definiert durch:
Ã = ((−1)i+j Uij ) i, j = 1, . . . , n

 
+U11 −U12 . . . (−1)n+1 U1n
 −U21 +U22 . . . (−1)n+2 U2n 
= 
 
.. .. .. 
 . . . 
n+1 n+2 n+n
(−1) Un1 (−1) Un2 . . . (−1) Unn
Die adjungierte Matrix erfüllt eine bemerkenswerte Beziehung:

Satz: Es gilt
 
det A 0 ... 0
 0 det A . . . 0 
Ã ◦ A = (det A) · E =  ..
 
. .. .. 
 . . 
0 ... 0 det A
Beweis: Wir rechnen die Gleichung einfach nach, indem wir die Matrizenmultiplikation
spaltenweise ausführen. Sei dazu A = (~a1 , . . . , ~an ); dann ist die i-te Spalte von Ã ◦ A
gerade Ã ◦ ~ai (siehe 2.45 auf Seite 99). Dieses Produkt rechnen wir aus, indem wir die
Definition von Ã einsetzen:
 n 
X
1+j
 (−1) U1j aji 
 j=1 
..
 
.
 
 
 X n 
i+j
 

 (−1) Uij aji  
 j=1 

Ã ◦ ~ai =  .
..


 
 X n 
k+j
(−1) Ukj aji 
 

 
 j=1 

 .
..


 n 
 X 
 (−1)n+j U a 
nj ji
j=1
Wir betrachten hiervon zunächst die i-Komponente, d. h. die Komponente zu demselben

Indexwert wie die Spalte ~ai ; der Wert dieser Komponente ist
n
X
(−1)i+j Uij aji
j=1
Vergleicht man dieses mit Gleichung 2.81, so stellt man fest, daß dieser Ausdruck ge-
nau die Determinante von A, entwickelt nach der i-ten Spalte, ist. Der Wert der i-ten
Komponente ist demnach gerade det A.
132
Nun betrachten wir eine k-te Komponente mit k 6= i. Der Wert einer solchen Kompo-
nente ist n
X
(−1)k+j Ukj aji
j=1
Vergleicht man dieses ebenfalls mit der Spaltenentwicklung (Gleichung 2.81), so erkennt
man hier, daß dieser Ausdruck gerade die Entwicklung der folgenden Determinanten
nach der k-ten Spalte ist:
 
a11 . . . a1i . . . a1,k−1 a1i a1,k+1 . . . a1i
 a21 . . . a2i . . . a2,k−1 a2i a2,k+1 . . . a2i 
det  ..
 
.. .. .. .. .. 
 . . . . . . 
an1 . . . ani . . . an,k−1 ani an,k+1 . . . ani
= det(~a1 , . . . , ~ai , . . . , ~ak−1 , ~ai , ~ak+1 , . . . , ~an )
Dieses ist die Determinante der Matrix, die entsteht, wenn man in der Matrix A an die
Stelle der k-ten Spalte ~ak noch einmal die i-te Spalte ~ai schreibt. Diese Determinante
besitzt dann den Wert Null, da ja nach Konstruktion ihre i-te und k-te Spalte beide
gleich ~ai sind. Damit besitzt auch die obige Summe den Wert Null; da die Summe gleich
der k-ten Komponente von Ã ◦ ~ai ist, hat auch diese den Wert Null. Insgesamt hat man
damit für i-te Spalte von Ã ◦ A für i = 1, . . . , n:
 
0
 .. 
 . 
 0 
 
Ã ◦ ~ai =  det A  ← i-te Stelle
 
 0 
 
 . 
 .. 
0
= (det A) · ~ei
Daraus folgt dann schließlich
Ã ◦ A = Ã ◦ (~a1 , ~a2 . . . , ~an )

= (Ã ◦ ~a1 , Ã ◦ ~a2 , . . . , Ã ◦ ~an )
= ((det A) · ~e1 , (det A) · ~e2 , . . . , (det A) · ~en )
= (det A) · (~e1 , ~e2 , . . . , ~en )
= (det A) · E
qed.
Hieraus ergibt sich eine zweite Herleitung einer Aussage, die wir bereits mit dem Gauß-
schen Satz bewiesen hatten, so wie eine weitere Möglichkeit zur Berechnung der Inversen
einer Matrix:
Folgerung: Sei det A 6= 0, dann ist A umkehrbar, und es gilt
1
A−1 = · Ã (2.83)
det A
133
Diese Art der Berechnung der Inversen empfiehlt sich nur bei 2 × 2-Matrizen; dort ist
sie allerdings recht nützlich, wie das folgende Beispiel zeigt:
Sei
1 2
A =
9 7
Dann ist
U11 −U12 7 −2
Ã = =
−U21 U22 −9 1
Damit ist dann
−7 2
 

1 −1 7 −2 11 11 
A−1 = · Ã = · = 
det A 11 −9 1 9 −1
11 11
Aus Gleichung 2.83 folgt insbesondere, daß bei der Berechnung der Inversen einer Matrix
die Teilung durch die Determinanten der einzige notwendige Divisionsschritt ist.
Die Gleichung 2.83 liefert weiterhin eine Lösungsformel für ein quadratisches lineares
Gleichungssystem A ◦ ~x = ~b mit vollem Rang. Geht man hier von dem Lösungsansatz
1
~x = · Ã ◦ ~b
det A
aus, so erhält man die sogenannte Cramersche Regel .
2.4 Der Begriff des Eigenwertes
In diesem Abschnitt werden wir wieder ausschließlich quadratische Matrizen
A ∈ Mn,n (IR)
betrachten. Ist ein Vektor ~x ∈ IRn gegeben, so ist das Produkt A◦~x ebenfalls ein Vektor
aus dem IRn :
   
x1 y1
~x =  ...  ∈ IRn ⇒ ~y =  ...  = A ◦ ~x ∈ IRn
   
xn yn
In der Regel hat der Vektor ~y mit dem Vektor ~x nicht mehr viel gemeinsam, er “sieht“
völlig anders aus. Interessant ist daher der Spezialfall, daß der eine der beiden Vektoren
ein Vielfaches des anderen ist. Dieses führt auf den Begriff des Eigenwertes.
Definition: Gegeben sei eine quadratische Matrix A ∈ Mn,n (IR). Eine Zahl λ ∈ IR heißt
Eigenwert der Matrix A, wenn es einen Vektor ~u ∈ IRn mit ~u 6= 0 gibt, so daß gilt
A ◦ ~u = λ · ~u (2.84)
Der Vektor ~u heißt Eigenvektor zum Eigenwert λ.
134
Die Eigenwertgleichung 2.84 besagt, daß bei dem Eigenvektor ~u die aufwendigere Mul-
tiplikation mit der Matrix A das gleiche bewirkt, wie die einfachere komponentenweise
Multiplikation mit der reellen Zahl λ.
Man beachte, daß für einen Eigenvektor gefordert wird, daß er nicht gleich dem Null-
vektor ist. (Frage: warum?)
Beispiel: Ist die 2 × 2–Matrix

929 −425
A =
2035 −931
gegeben, so rechnet man leicht nach, daß ~u = (5, 11)t ein Eigenvektor von A ist:

929 −425 5
A ◦ ~u = ◦
2035 −931 11

−30 5
= = −6 · = −6 · ~u
−66 11
Also ist ~u Eigenvektor von A zum Eigenwert λ = −6. Kein Eigenvektor von A ist etwa
~v = (1, 1)t :
1 504
A ◦ ~v = A ◦ =
1 1104
Offensichtlich gibt es kein λ ∈ IR mit A ◦ ~v = λ~v .
Es ist aussichtslos, durch “Raten“ einen Eigenvektor zu finden. Bevor wir uns anschauen,
wie man gezielt einen Eigenvektor berechnet, soll festgestellt werden, daß die Vielfachen
eines Eigenvektors ebenfalls Eigenvektoren sind:
Satz: Die Matrix A ∈ Mn,n (IR) besitze den Eigenwert λ mit dem Eigenvektor ~u. Dann
ist für jedes c ∈ IR mit c 6= 0 auch der Vektor
c · ~u
ein Eigenvektor von A zum Eigenwert λ.

Beweis: Man rechnet nach, daß auch für ~v = c · ~u die Gleichung 2.84 erfüllt ist:
A ◦ (c · ~u) = c · A ◦ ~u nach dem Satz auf Seite 100

= c · λ · ~u da ~u Eigenvektor zu λ ist
= λ · (c · ~u)
qed.
Eigenwerte und Eigenvektoren besitzen bei vielen Problemstellungen eine große Bedeu-
tung; einen kleinen Eindruck davon soll das folgende Beispiel liefern:
Zur Beschreibung der zeitlichen Entwicklung der Altersverteilung in einer Bevölkerung
teilt man die Bevölkerung in drei Gruppen ein und stellt die Größen dieser drei Gruppen
durch einen Vektor dar:
 
x1 = Anzahl der jüngeren Leute
~x  x 2
 = Anzahl der Leute mittleren Alters
x3 = Anzahl der Rentner
135
Die Verteilung verändert sich mit der Zeit, nach einem Jahr hat man neue Anzahlen
~y = (y1 , y2 , y3 ).
Es werde nun angenommen, daß man aus Erfahrung weiß, daß sich die neuen Zahlen
auf folgendem Wege aus den alten Zahlen berechnen lassen:
Junge 80 x + 20 x + 1 x
= y1 = 100 1 100 2 100 3
19 x + 85 x
Mittlere = y2 = 100 1 100 2
1 x + 15 x + 70 x
Rentner = y3 = 100 1 100 2 100 3
Die erste Gleichung besagt, daß 80% der Jungen auch nach einem Jahr noch zu den
Jungen zählen und daß 20% der Leute mittleren Alters sowie auch 1% der Rentner sich
einmal vermehren und deren Nachwuchs zu der Gruppe der Jungen hinzukommt. Inhalt
der zweiten Gleichung ist, daß 19% der Jungen erwachsen geworden sind und zu der
mittleren Gruppe hinzukommen und daß 85% der Leute mittleren Alters auch noch
nach einem Jahr zu dieser Gruppe gehören. Entsprechend läßt sich die dritte Gleichung
deuten23
Wie man leicht erkennt, lassen sich die drei obigen Gleichungen als Produkt einer Matrix
mit einem Vektor schreiben: Setzt man
80 20 1
 
 100 100 100 
 19 85 
A =   100 100 0 
 
1 15 70
100 100 100
so erhält man für die Bevölkerungsverteilung nach einem Jahr
~y = A ◦ ~x
Entsprechend erhält man für die Verteilung nach zwei Jahren, indem man diese Glei-
chung auf ~y anwendet:
A ◦ ~y = A ◦ (A ◦ ~x) = A2 ◦ ~x
Ebenso erhält man die Verteilung nach n Jahren aus An ◦ ~x.
Eine Frage, die in diesem Zusammenhang von Interesse ist, lautet: gibt es eine stabile
Bevölkerungsverteilung. Eine Bevölkerungsverteilung gilt als stabil, wenn die Größen-
verhältnisse zwischen den drei Gruppen unverändert bleiben:
x1 y1 x3 y3
= und =
x2 y2 x2 y2
y1 y2 y3
⇔ = =
x1 x2 x3
Setzt man
y1
λ =
x1
so lautet die letzte Doppelgleichung in Vektorschreibweise
   
y1 λx1
~y =  y2  =  λx2  = λ · ~x ⇔ ~y = A ◦ ~x = λ · ~x
y3 λx3
23
Es sei noch einmal darauf hingewiesen, daß es sich hier um angenommene Beispielwerte handelt!
136
Mit anderen Worten: die stabile Bevölkerungsverteilung wird durch einen Eigenvektor
der Übergangsmatrix A beschrieben.
Wie findet man einen Eigenwert mit zugehörigem Eigenvektor? Diese Frage ist das
sogenannte
Eigenwertproblem: Zu einer gegebenen Matrix A ∈ Mn,n (IR) sucht man

• einen Eigenwert λ ∈ IR
• und einen dazugehörigen Eigenvektor ~u ∈ IRn \ {0}.
D. h. die Gleichung
A ◦ ~x = t · ~x (2.85)
mit unbekanntem t ∈ IR und unbekanntem ~x ∈ IRn ist unter der Nebenbedingung
~x 6= 0 zu lösen.
Die Schwierigkeit der Gleichung 2.85 besteht darin, daß auf ihrer rechten Seite das
Produkt der Unbekannten t und ~x steht, sie ist damit nicht mehr linear. Man formt daher
die Gleichung 2.85 so um, daß eine Gleichung entsteht, in der nur noch die Unbestimmte
t erscheint. Mit Hilfe dieser Gleichung bestimmt man dann zunächst einen Wert für t.
Im ersten Schritt formt man 2.85 so um, daß auch auf der rechten Seite ein Produkt aus
einer Matrix mit einem Vektor steht; man verwendet dazu das t-fache der Einheitsma-
trix:    
1 0 ··· 0 t 0 ··· 0
 0 1 ··· 0   0 t ··· 0 
t · E = t ·  .. .. . . ..  =  .. .. . . .. 
   
 . . . .   . . . . 
0 0 ··· 1 0 0 ··· t
Verwendet man weiter E ◦ ~x = ~x, so erhält man
A ◦ ~x = t · ~x = t · (E ◦ ~x) = (t · E) ◦ ~x
Jetzt faßt man alle Ausdrücke, in denen die Unbestimmte ~x erscheint, zusammen:
A ◦ ~x = (t · E) ◦ ~x (auf beiden Seiten (t · E) ◦ ~x abziehen)
⇔ A ◦ ~x − (t · E) ◦ ~x = 0 (~x ausklammen, siehe dazu Seite 100)
⇔ (A − t · E) ◦ ~x = 0
Dabei hängt die Matrix
 
a11 − t a12 ··· a1n
 a21 a22 − t · · · a2n 
A−t·E = 
 
.. .. .. .. 
 . . . . 
an1 an2 ··· ann − t
vom Wert der Unbestimmten t ab.
Nimmt man jetzt für einen Moment an, man habe bereits einen Lösungswert für t
gefunden, so bestimmt man dazu einen Wert für ~x = (x1 , . . . , xn ), indem mit diesem t
die Gleichung
(A − t · E) ◦ ~x = 0 (2.86)
137
Diese Gleichung ist ein homogenes lineares Gleichungssystem. Die im Eigenwertproblem
genannte Nebenbedingung lautet ~x 6= 0. Das homogene Gleichungssystem muß daher
so beschaffen sein, daß es eine von Null verschiedene Lösung besitzt. Folglich muß der
Wert der Unbestimmten t so gewählt werden, daß gilt:
corg(A − t · E) > 0
⇔ rg(A − t · E) < n
⇔ (A − t · E) ist nicht invertierbar
⇔ det(A − t · E) = 0 (siehe den Satz auf Seite 127)
Hier kommt also die Determinante ins Spiel. Hergeleitet haben wir den
Satz: λ ∈ IR ist genau dann Eigenwert der Matrix A ∈ Mn,n (IR), wenn λ Nullstelle der
Funktion
f (t) = det(A − t · E)
ist, d. h. wenn gilt
f (λ) = det(A − λ · E) = 0 (2.87)
Einen zu λ gehörigen Eigenvektor erhält man als von Null verschiedene Lösung des
homogenen Gleichungssystems
det(A − λ · E) · ~x = 0
Als nächstes soll die Funktion f (t) = det(A − t · E) genauer untersucht werden; zuvor
erhält sie einen Namen:
Definition: Die Funktion
f (t) = det(A − t · E)
heißt charakteristisches Polynom der Matrix A ∈ Mn,n (IR).
Den Namen “Polynom“ rechtfertigt der folgende

Satz: Sei A ∈ Mn,n (IR), dann ist die Funktion
f (t) = det(A − t · E) (2.88)
ein Polynom n-ten Grades mit höchstem Koeffizienten
(−1)n (2.89)
und konstantem Glied det A.

Beweis: Um die Matrix A − t · E in die Formel für die Determinante (2.62) einsetzen
zu können, müssen deren Koeffizienten angegeben werden. Die Einheitsmatrix E wird
dazu in der Form
 
δ11 . . . δ1n
 .. .
..  1 für i = j
E =  . mit δij =

0 für i 6= j
δn1 . . . δnn
138
geschrieben. Dann ist
   
a11 . . . a1n tδ11 . . . tδ1n
A − t · E =  ... ..  −  .. .. 

.   . . 
an1 . . . ann tδn1 . . . tδnn
 
a11 − tδ11 . . . a1n − tδ1n
= 
 .. .. 
. . 
an1 − tδn1 . . . ann − tδnn
Setzt man dieses in die Formel der Determinanten (siehe 2.62 auf Seite 118) ein, so wird
dieses zu
f (t) = det(A − t · E) (2.90)

Xn
= (ai1 1 − tδi1 1 )(ai2 2 − tδi2 2 ) . . . (ain n − tδin n ) det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1
Dieser Ausdruck soll genauer betrachtet werden:
Jeder Summand in 2.90 ist ein Produkt
• aus Konstanten, dabei handelt es sich um Koeffizienten von A
• und aus höchstens n Linearfaktoren der Gestalt
(aii − tδii )
Ein Produkt aus Linarfaktoren ist ein Polynom; summiert man endlich viele Ausdrücke
dieser Art auf, so erhält man wieder ein Polynom.
Damit ist gezeigt: f (t) = det(A−t·E) ist ein Polynom, und der Name charakteristisches
Polynom ist gerechtfertigt.
Das Glied mit der höchsten Potenz von t erhält man, indem man den Summanden mit
den meisten Linearfaktoren betrachtet; dieser ist genau
(a11 − t) · (a22 − t) · · · (ann − t)
Ausmultiplizieren dieses Ausdrucks liefert einen Ausdruck der Gestalt
(−t)n + Glieder niederer Ordnung
Alle anderen Summanden besitzen weniger als n − 1 Linearfaktoren. Ausmultipliziert

ergeben sie daher nur Glieder niederer Ordnung. Man erhält daher insgesamt für f (t) =
det(A − t · E) die Gestalt
f (t) = (−1)n · tn + Glieder niederer Ordnung (2.91)
Der Grad des Polynoms f (t) beträgt somit n, der höchste Koeffizient ist (−1)n .
Das konstante Glied von f (t) erhält man durch Einsetzen der Null:
a0 = f (0) = det(A − 0 · E) = det A
139
qed.
Als sehr wichtige Folgerung ergibt sich

Folgerung: Eine n × n–MatrixA ∈ Mn,n (IR) besitzt höchstens n verschiedene Eigenwerte.
Beweis: Jeder Eigenwert von A ist Nullstelle von f (t) = det(A − t · E). Als Polynom
n-ten Grades besitzt f (t) höchstens n Nullstellen. qed.
Zusammenfassend kann man feststellen, daß die Lösung des Eigenwertproblems in zwei
Schritten verläuft:
1. Man bestimmt die Nullstellen des charakteristischen Polynoms und erhält damit
die Eigenwerte der Matrix.
2. Man berechnet zu einem Eigenwert λ einen Eigenvektor, indem man eine von
Null verschiedene Lösung des homogenen linearen Gleichungssystems (A − λE) ◦ ~x
bestimmt.
Beispiel: Alle Eigenwerte der Matrix (siehe Seite 135)

929 −425
A =
2035 −931
sind gesucht. Das charakteristische Polynom von A lautet

929−t −425
det(A − t · E) = det
2035 −931−t
= (929 − t) · (−931 − t) + 425 · 2035

= t2 − (929 − 931) · t − 929 · 931 + 425 · 2035
= t2 + 2t − 24
Die beiden Lösungen λ1 = −6 und λ2 = 4 der quadratischen Gleichung
t2 + 2t − 24 = 0
sind die beiden Eigenwerte von A. Ein Eigenvektor zu λ1 = −6 wurde bereits auf Seite
135 angegeben. Einen Eigenvektor zu λ2 = 4 erhält man durch Lösen des homogenen
Gleichungssystems

929−4 −425
(A − 4 · E) ◦ ~x = ◦ ~x = 0
2035 −931−4
Eine mit dem Gaußschen Verfahren reduzierte Form der Koeffizientenmatrix liefert
!
17
1 − 37
◦ ~x = 0
0 0
Eine von Null verschiedene Lösung hiervon ist ~u2 = (17, 37)t . Der gefundene Vektor ~u2
ist ein Eigenvektor zu Eigenwert λ2 = 4.
140
Beispiel: Gesucht sind alle Eigenvektoren der 3 × 3–Matrix
 
18 137 −15
A =  0 −5 0 
20 116 −17
Das charakteristische Polynom von A stellt man am besten durch Enwickeln nach der
zweiten Zeile auf (siehe 2.82 auf Seite 130):
 
18−t 137 −15
det(A − t · E) = det  0 −5−t 0 
20 116 −17−t
= (−5 − t) · ((18 − t)(−17 − t) + 300)

= (−5 − t) · (t2 − t − 6)
= −t3 − 4t2 + 11t + 30
Die drei Nullstellen dieses Polynoms ergeben sich sofort aus der vorletzten Darstellung:
Neben 5 sind es die beiden Nullstellen −2 und 3 des quadratischen Faktors. Die drei
Eigenwerte der Matrix A lauten somit
λ1 = −5, λ2 = −2 und λ3 = 3
Zu λ2 = −2 soll noch ein Eigenvektor bestimmt werden; zu lösen ist das homogene
Gleichungssystem
 
18−(−2) 137 −15
 0 −5−(−2) 0  ◦ ~x = 0
20 116 −17−(−2)
 
20 137 −15
⇔  0 −3 0  ◦ ~x = 0
20 116 −15
Eine mit dem Gaußschen Verfahren reduzierte Form der Koeffizientenmatrix ist
1 137 3 

20 − 4
 1 0 
0
Als eine Lösung hiervon und damit als Eigenvektor zu λ2 = −2 erhält man
 
3/4
~u2 =  0 
1
Beispiel: Wir kommen auf das Beispiel zur Bevölkerungsentwicklung auf Seite 135 zurück.
Das charakteristische Polynom der dort verwendeten Übergangsmatrix
 80 20 1 
 100 100 100 
 19 85 
A =   100 100 0 

 
1 15 70
100 100 100
141
lautet
47 2 17969 281
f (t) = − t3 + t − t+
20 10000 625
Man findet folgende Eigenwerte und Eigenvektoren:
λ1 = 0.64 ~u1 = (−1.105, 1.0, −2.316)t

λ2 = 1.024 ~u2 = ( 0.915, 1.0, 0.491)t
λ3 = 0.686 ~u3 = (−0.863, 1.0,−10.176)t
Da der aus den Bevölkerungszahlen gebildete Vektor nur positive Komponenten enthal-
ten kann, kommt als Eigenvektor, der eine stabile Bevölkerungsentwicklung beschreibt,
nur ~u2 in Frage. Um realistische Größenordnungen zu erhalten, wird ~u mit c = 30000000
multipliziert (siehe dazu den Satz auf Seite 135). Eine mögliche stabile Bevölkerungs-
verteilung wäre damit  
27460000
~x =  30000000 
14740000
142
Kapitel 3
Elemente der diskreten Mathematik
3.1 Ein Schlüsselaustauschverfahren als einleitendes

Beispiel
In den bisher in dieser Vorlesung behandelten Themen spielten die reellen Zahlen die
wesentliche Rolle und werden auch in späteren Abschnitten dieser Vorlesung und in den
nachfolgenden Vorlesungen von Bedeutung sein. Gerade bei Anwendungen mathemati-
scher Verfahren in Naturwissenschaft und Technik kommen reelle Zahlen vor; Meßwerte
sind in der Regel reelle Größen.
Jetzt sollen endliche Mengen oder zumindest abzählbar unendliche, diskrete Mengen
im Mittelpunkt der Betrachtung stehen. Ein Beispiel für eine solche Menge stellen die
ganzen Zahlen ZZ dar, deren Elemente auf der Zahlengeraden den Mindestabstand eins
besitzen. Zur Untersuchung und Behandlung der Mengen dieser Art sind oft andere
Methoden als beim Umgange mit den reellen Zahlen erforderlich. Solche Methoden lie-
fert die diskrete Mathematik . Die diskrete Mathematik umfaßt mehrere Teilgebiete; zu
nennen sind etwas Kombinatorik, Graphentheorie, diskrete Geometrie, diskrete Optimie-
rung, Algebra und Zahlentheorie. Ihre Bedeutung hat in den letzten Jahrzehnten stark
zugenommen, da mit dem Aufkommen der digitalen Rechner zahlreiche Anwendungs-
bereiche der diskreten Mathematik entstanden sind. Beispiele dafür finden sich u. a. bei
der Automatentheorie, der Algorithmenentwicklung sowie der Codierungstheorie.
Zur Einführung in diskrete Mathematik sollen hier einige Themen sowie grundlegen-
de Begriffe aus den Bereichen Algebra und Zahlentheorie behandelt werden. Aus deren
Anwendungsbereichen ist insbesondere die Kryptologie (Lehre von der Ver- und Ent-
schlüsselung von Nachrichten) zu nennen.
Als einleitendes Beispiel soll hier ein typisches Problem aus der Kryptologie erörtert
werden. In der Kryptologie besteht die Aufgabe, eine Nachricht auf eine solche Wei-
se in eine neue Form (den Schlüsseltext“) zu überführen ( zu verschlüsseln“), daß sie
” ”
von unbefugter Seite weder gelesen noch unbemerkt verändert werden kann und an-
schließend wieder in den ursprünglichen Klartext zurücktransformiert werden kann. Das
Grundprinzip der Verschlüsselung zeigt das folgende Bild:
143
Klartext Schlüssel (optional)
- Verschlüsselung
(encryption)
plain text key
Übertragung des Schlüsseltextes

(cipher text)
?
ursprünglicher
Klartext Schlüssel (optional)
Entschlüsselung
(decryption)
plain text key
Üblich sind die folgenden Bezeichnungen:
M : die Nachricht bzw. der Klartext (plain text), in der Regel eine Zeichenkette über
einem Alphabet Σ, z. B.
Σ = {a, b, c, . . . , z} #Σ = 26
oder: Σ = {0, 1} #Σ = 2
Damit ist dann
M ∈ Σ∗ = {x1 x2 . . . xn | n ∈ IN0 , xi ∈ Σ}
C : die verschlüsselte Nachricht, d. h. der Schlüsseltext (cipher text, cryptogram)
k : der Schlüssel (key)
Ein Verschlüsselungsverfahren liefert nun
eine Verschlüsselungsfunktion (encryption) e( , ), die einer Nachricht M in Ver-

bindung mit einem Schlüssel k einen Schlüsseltext C zuordnet:
e
(M, k) −→ C
bzw. C = e(M, k)
eine Entschlüsselungsfunktion (decryption) d( , ), die einem Schlüsseltext C in

Verbindung mit dem Schlüssel k wieder den Klartext M zuordnet:
d
(C, k) −→ M
bzw. M = d(C, k)
144
Insbesondere muß beim Entschlüsseln mit dem korrekten Schlüssel wieder ursprüngliche
Klartext entstehen. Zusammenfassend muß somit gelten:

C = e(M, k)
=⇒ d(e(M, k), k) = M
M = d(C, k)
Es ist auch möglich, daß zum Ver- und Entschlüsseln unterschiedliche Schlüssel ver-
wendet werden. Viele übliche Verfahren arbeiten jedoch, wie hier angegeben, mit einem
einzigen Schlüssel. Man spricht daher von symmetrischen Verfahren.
Andere gängige Bezeichnungen für “(Verschlüsselungs-)Verfahren“ sind “Chiffre“ oder
“Code“.
Beispiel: Caesar-Verfahren
Dieses Verfahren wurde angeblich bereits von Julius Caesar eingesetzt. Es bietet nur
geringe Sicherheit; man erkennt an ihm aber sehr gut die Funktionsweise eines symme-
trischen Verfahrens.1
Man nimmt die übliche natürliche Zuordnung vor:
{A, B, . . . , Z} ←→ {0, 1, . . . , 25}

A ↔ 0, B ↔ 1, . . . Z ↔ 25
Schlüssel : Man wählt einen Buchstaben
k ∈ {A, B, . . . , Z}
bzw. k ∈ {0, 1, . . . , 25}
Verschlüsselung eines einzelnen Klartextbuchstabens m:
c = e(m, k) = m + k mod 26
Entschlüsselung eines einzelnen Buchstabens c des Schlüsseltextes:
m = d(c, k) = c − k mod 26
= c + (26 − k) mod 26
Beispiel zur Caesar-Chiffre:

Wähle als Schlüssel k = X bzw. k = 23. Die Verschlüsselung des Beispieltextes erfolgt
durch buchstabenweise Addition mod 26:
G U T E N T A G =
ˆ 6 20 19 4 13 19 0 6
X X X X X X X X 23 23 23 23 23 23 23 23
3 17 16 1 10 16 23 3
=
ˆ
D R Q B K Q X D
1
Hier wird erstmalig die modulo-Funtion verwendet: Für a, b ∈ Z, a 6= 0 bezeichnet “a mod b“
den kleinsten nichtnegativen Divisionsrest, der bei Teilung von a durch b entsteht. In den Program-
moersprachen C, Java usw. steht dafür der Operator % ur Verfügung.
145
Die Entschlüsselung erfolgt mit 26 − k = 26 − 23 = 3=D:
ˆ
D R Q B K Q X D =
ˆ 3 17 16 1 10 16 23 3
D D D D D D D D 3 3 3 3 3 3 3 3
6 20 19 4 13 19 0 6
=
ˆ
G U T E N T A G
Eine grundlegende Voraussetzung zum Einsatz dieses oder eines heute gebräuchlichen
symmetrischen Verfahrens (wie z. B. 3DES oder AES) besteht darin, daß die beiden
Kommunikationspartner A und B sich über einen gemeinsamen Schlüssel k verständigt
haben, der nur ihnen bekannt ist und ansonsten geheim bleibt. Es bietet sich an, daß
einer der beiden Partner einen geeigneten Schlüssel zufällig erzeugt und diesem dann
dem anderen Partner mitteilt. Aber dabei tritt folgendes Problem auf:
Wie überträgt man einen Schlüssel sicher von A nach B?
'$ '$
A - B
&% &%
?
Feind
Beispiele:
• Beim Einbruch in die vom deutschen Militär im zweiten Weltkrieg verwendeten
Verschlüsselungsmaschine, der sogenannten Enigma“ wurde wesentlich der zu Be-
”
ginn einer Übertragung stattfindende Schlüsselaustausch ausgenutzt.
• Beim Heißen Draht zwischen Moskau und Washington (verschlüsselt mit dem
sogenannten Vernam-Verfahren) wird der Schlüssel für jede Sitzung unter Einsatz
großer Sicherheitsmaßnahmen getrennt mit dem Flugzeug übertragen.
Man vermutete sehr lange, daß das Problem des Schlüsselaustauschs nicht lösbar wäre.
Aber im Jahr 1976 wurde das Diffie-Hellman-Verfahren zum Schlüsselaustausch
veröffentlicht. Dessen Idee soll im Folgenden beschrieben werden. Man beachte dabei
aber, daß die folgende Beschreibung noch kein verwendungsfähiges Verfahren liefert; es
soll zunächst nur die grundsätzliche Idee deutlich werden. Weitere Ergänzungen folgen
später.
Man geht von der Idee der Einwegfunktion aus: Eine Einwegfunktion ist eine Funktion
y = f(n)
deren Wert y für ein gegebenes n leicht und schnell zu berechnen ist. Umkehrt soll
es aber praktisch unmöglich sein, bei gegebenem y ein n mit f(n) = y zu ermittelt.
Insbesondere sollte es kein systematisches Verfahren zum Bestimmen von n geben. Eine
Suche nach dem passenden Werte von n durch probeweises Einsetzen aller möglichen in
Frage kommender Werte für n sollte an zu großem Aufwand scheitern.2
2
Eine Einwegfunktion besitzt Ähnlichkeit mit einem Briefkasten: Jeder kann einen Brief einwerfen;
man kann ihn aber nur entnehmen, wenn man über den passenden Schlüssel verfügt.
146
Beim Diffie-Hellman-Verfahren definiert man als Einwegfunktion mit einem vorgegebe-
nen a ∈ IR , a > 1 die Funktion:
y = f(n) = an für n ∈ IN (Potenzieren)

(3.1)
g(y) = n (Logarithmieren)
Zur Berechnung des Wertes der Funktion f(n) muß eine Potenz berechnet werden, was
mit Sicherheit verhältnismäßig einfach und schnell durchgeführt werden kann. Zur Be-
rechnung der Umkehrfunktion g(y) muß hingegen logarithmiert werden; die Berechnung
des Logarithmus kann auf alle Fälle als deutlich schwieriger als das Potenzieren bezeich-
net werden.
Angenommen, f(n) wäre aufgrund dieser Eigenschaften in der Tat eine Einwegfunktion,
so kann damit folgendes Schlüsselaustauschverfahren beschrieben werden:
1. Als Schlüssel dienen möglichst lange natürliche Zahlen.
2. Die Basis a > 1 wird veröffentlicht.
3. Die Partner A und B denken sich jeder einen geheimen Wert aus:
A: n ∈ IN
B: m ∈ IN
4. A berechnet
y1 = an
und sendet y1 unverschlüsselt an B. Entsprechend berechnet B
y2 = am
und sendet y2 unverschlüsselt an A.
5. A berechnet
y = y2n = (am )n = an·m
B berechnet
y = y1m = (an )m = an·m
6. y ist der gemeinsame Sitzungsschlüssel. y ist geheim, d. h. nur A und B bekannt.
7. (Zusatz ) y ist eine natürliche Zahl und kann folgendermaßen zum Austausch einer
verschlüsselten Nachricht benutzt werden:
(a) A stellt den Nachrichtentext M als als natürliche Zahl dar.

(b) A berechnet
C = M ·y
(c) A versendet C.
(d) B empfängt C.
(e) B berechnet
M = C · y −1
147
Man beachte, daß hierbei der Schlüssel y nur den beiden Partnern A und B be-
kannt ist. Es handelt sich hier um das Verfahren von El Gamal zum Nachrichten-
austausch.
Dieses als Diffie-Hellman-Verfahren bezeichnete Verfahren zum Schlüsselaustausch soll

im einzelnen besprochen werden.
Entscheidend ist die Einwegfunktion
f(n) = an
Deren erstes Merkmal besteht darin, daß die Potenz an auch für sehr große n ∈ IN
(etwa n > 10100 ) sehr schnell berechnet werden kann. Natürlich kann dieses nicht durch
eine Schleife mit einzelnen Multiplikationen erfolgen. Man verwendet statt dessen einen
schnellen, auf dem Prinzip Teile und herrsche beruhenden Algorithmus, dessen Idee
lautet:

0
setze n = 2 · q + r mit q ∈ IN und r =
1
n 2q+r q 2 r
⇒ a = a = (a ) · a
⇒ Im wesentlichen ist nur noch aq zu berechnen; der
Exponent wurde halbiert.
Dieser Idee folgt folgendes rekursives Verfahren zum Potenzieren:
pot(a,n)
if(n==0) return 1
r = n%2
q = n/2 // Ganzzahldivision
y = pot(a,q)
y = y * y
if(r==1) y = y * a
return y
Wie man leicht zeigen kann, beträgt der Aufwand dieses Verfahrens ungefähr
2 · ld (n) Multiplikationsschritte. (3.2)
Für n = 10100 wären das nur circa 666 Multiplikationen.

Zusammenfassend kann festgestellt werden, daß die Verschlüsselung leicht ist; die erste
Bedingung, die an eine Einwegfunktion gestellt wird, wird von (3.1) erfüllt.
Wie verhält es sich aber, wenn jemand versucht, das beschriebene Schlüsselaustausch-
verfahren (siehe Seite 147) zu brechen?
Der Feind kennt
y 1 = an
sowie die Basis a (3.3)
y 2 = am
Wenn er y = anm berechnen will, benötigt er n oder m, d. h. er müßte einen der

beiden Exponenten aus (3.3) ermitteln. Diese Aufgabe kann sicher als etwas schwieriger
bezeichnet werden und könnte für einen unwissenden Feind schon ein Problem darstellen.
148
Verfügt der Feind aber über eine Möglichkeit, den Logarithmus leicht zu berechnen, so
kann er folgendermaßen vorgehen:
y 1 = an | log( )
log(y1 ) = log(an )
= n · log(a) (3.4)
log(y1 )
⇒ n =
log(a)
In der Tat ist der Logarithmus3 nicht schwer zu berechnen. Bekanntlich sind Funktionen
zur Berechnung des Logarithmus in üblichen mathematischen Bibliotheken und auch Ta-
schenrechnern anzutreffen. Solche Funktionen verwenden Methoden der Analysis; einen
Ansatz dazu liefert die sogenannte Logarithmusreihe4 .
Man benötigt somit eine weitere Idee, um eine Verwendung des Logarithmus wie in (3.4)
auszuschließen und so das Diffie-Hellman-Verfahren sinnvoll einsetzen zu können.
Ein zusätzliches Problem des auf Seite 147 so beschriebenen Schlüsselaustauschverfah-
rens besteht darin, daß die beiden vertraulichen Werte n und m möglichst große Zahlen
sein sollen; andernfalls wäre ein Brechen durch Probieren“ möglich.
”
Sind aber n und m große Werte, so wären
y 1 = an , y2 = am und y = anm
so große Werte, daß damit sogar der verfügbare Speicher bei weitem nicht mehr zu deren
Darstellung ausreichte. Auch auch diesem Grunde ist eine weitere Idee erforderlich.
Der erste Teil dieser Idee besteht darin, von der Rechnung mit reellen Zahlen abzugehen
und statt dessen geeignete ganze“ (diskreten) Zahlen zu verwenden5 . Um dieses zu
”
erläutern, folgt ein Abschnitt, der eine genauere Betrachtung der ganzen Zahlen ZZ und
deren Arithmetik zum Inhalt hat.
Um dem Problem der zu großen Zahlen abzuhelfen, setzt man schließlich doch nicht
die ganzen Zahlen ein, sondern man verwendet davon abgeleitete Zahlenbereiche, deren
Elemente nicht über eine bestimmte Größe hinauswachsen können. Um dieses verste-
hen zu können, sind einige algebraische Grundlagen erforderlich, die in einem späteren
Abschnitt dieses Kapitels vermittelt werden.
3.2 Arithmetik der ganzen Zahlen

3.2.1 Wiederholung einiger Grundlagen
Gegenstand der folgenden Betrachtung ist die Menge der ganzen Zahlen:
ZZ = {0, ±1, ±2, ±3, . . .}
Mit der Addition bilden die ganzen Zahlen eine Gruppe; man bezeichnet diese Gruppe
als (ZZ , +). Für (ZZ , +) gilt:
3
log(x) bezeichnet hier wie im folgenden den natürlichen Logarithmus.
4
Die Logarithmusreihe wird in einer Nachfolgevorlesung behandelt werden.
5
Bekanntlich ist dieses für einen digitalen Rechner ohnehin passender.
149
• Das neutrale Element ist die Null: 0.
• Zu a ∈ ZZ ist das (additiv) inverse Element die zugehöre negative Zahl: −a.
Bekanntlich ist auf ZZ auch die Multiplikation definiert, und das Produkt zweier ganzer
Zahlen ist ebenfalls wieder eine ganze Zahl. Allerdings bilden ZZ und auch ZZ \ {0} mit
der Multiplikation keine Gruppe. Die Eins (1) ist zwar ein neutrales Element bezüglich
der Multiplikation; die einzigen Elemente in ZZ, die ein (multiplikativ) inverses Element
besitzen, sind jedoch nur 1 und −1.
Eine Division m : n ist für zwei ganze Zahlen m, n ∈ ZZ im Bereich von ZZ nur möglich6 ,
falls n ein sogenannter Teiler von m ist:
n ∈ ZZ , n 6= 0 heißt genau dann Teiler von m ∈ ZZ, wenn es eine weitere

ganze Zahl d ∈ ZZ mit
m = d·n (3.5)
gibt. Die Schreibweise zur Bezeichnung einer solchen Teilerbeziehung lautet
n | m (Man sagt: n teilt m“). (3.6)

”
Beispiel:
17 | 51 denn 51 = 3 · 17, also hier: d = 3
Der Teiler7 n von m heißt echter Teiler von m, wenn sowohl n 6= ±1 als auch n 6= ±m
ist. Teilt n die beiden ganzen Zahlen m1 und m2 , so teilt n auch deren Summe und
Differenz:
n | m1 und n | m2 ⇒ n | (m1 ± m2 ) (3.7)
(3.7) kann leicht durch Ausklammern nachgewiesen werden. Ebenso leicht nachzuweisen
sind die folgenden Regeln zur Teilbarkeit:
n | m1 und m1 | m2 ⇒ n | m2 für m1 6= 0 (3.8)

n|m ⇒ (a · n) | (a · m) für a ∈ ZZ , a 6= 0 (3.9)
n|m ⇒ n | (a · m) für a ∈ ZZ (3.10)
Aufgabe: Man begründe die Aussagen (3.7), (3.8), (3.9) und (3.10).
Aufgabe: Man begründe:
n|0 für alle n ∈ ZZ \ {0} (3.11)
Sind n, m ∈ ZZ mit n ≥ 1 und m ≥ 1 gegeben, so folgt weiter
n|m ⇒ n ≤ m (3.12)
6
d. h. mit Ergebnis wieder in ZZ
7
Ist n kein Teiler von m, so schreibt man n 6 |m.
150
Begründung: Wegen n|m gibt es ein d ∈ ZZ mit m = d · n. Da n und m positiv sind, ist
auch d positiv; wegen d ∈ ZZ ist sogar 1 ≤ d. Multipliziert man diese Ungleichung mit
n, so erhält man
n·1 ≤ n·d = m
Aufgabe: Man zeige, daß allgemeiner für n, m ∈ ZZ mit n 6= 0 und m 6= 0
n|m ⇒ |n| ≤ |m| (3.13)
gilt. (3.13) besagt, daß der Teiler einer ganzen Zahlen dem Betrage nach niemals größer
als diese Zahl sein kann.
F
Für ganze Zahlen ist die bedeutsame Teilung mit Rest vorhanden: Sind m, n ∈ ZZ
mit n 6= 0, so gibt es q, r ∈ ZZ mit
m = q·n + r dabei ist 0 ≤ r < |n| (3.14)
q ist der ganzzahlige Quotient bzw. das Ergebnis der Ganzzahldivision von m : n; r ist
der Divisionsrest. Man beachte, daß ein gültiger Rest immer einen kleineren Betrag als
der Divisor besitzen muß.
Begründung der Teilung mit Rest: Zunächst sei n > 0. Man betrachtet die folgende
Teilmenge der ganzen Zahlen:
{m − q · n | q ∈ ZZ } (3.15)
= { . . . , n − 3 · n, m − 2 · n, m − 1 · n, m, m + 1 · n, m + 2 · n, m + 3 · n, . . . }
Da für hinreichend großes q der Ausdruck m − q · n negativ und für hinreichend kleines q
positiv wird, muß diese Menge sowohl positive als auch negative Zahlen enthalten. Man
kann daher ein q ∈ ZZ finden, so daß m − q · n die kleinste nicht negative Zahl innerhalb
die Menge (3.15) ist. Für dieses q gilt dann
m − q·n ≥ 0
(3.16)
und m − (q + 1) · n < 0
Denn m − (q + 1) · n ist das nächst kleinere Element nach m − q · n in (3.15). Addiert

man n zur zweiten Gleichung in (3.16) hinzu, so erhält man
m − (q + 1) · n + n < n
(3.17)
⇔ m − q·n < n
Die erste Ungleichung in (3.16) sowie die zweite Ungleichung in (3.17) liefern zusammen
0 ≤ m − q·n < n
| {z } (3.18)
=r
Damit ist 0 ≤ r < n für den Spezialfall n > 0 gezeigt. Läßt man nun für n auch negative
Werte zu, so kann man die Teilung mit Rest zunächst für den nichtnegativen Wert |n|
(den Betrag von n) durchführen. Das liefert die Darstellung
m = q1 · |n| + r (3.19)
151
mit 0 ≤ r < |n|. Sollte nun n < 0 sein, so ist in diesem Fall |n| = −n, und diese setzt
man einfach in (3.19) ein:
m = q1 · (−n) + r (mit 0 ≤ r < |n|)

= (−q1 ) · n + r (3.20)
Setzt man jetzt in (3.20) q = −q1 , so hat man (3.14) erhalten. qed.
Bemerkung: In der Regel wird (3.14) später nur für positive ganze Zahlen n, m > 0
verwendet werden.
Aufgabe: Man zeige zu (3.14):
m, n > 0 ⇒ 0 ≤ q ≤ m (3.21)
m > 0, n > 1 ⇒ 0 ≤ q < m (3.22)
Lösung: Angenommen, es wäre q < 0. Wegen q ∈ ZZ wäre dann sogar q ≤ −1. Multipli-
ziert man diese Ungleichung mit n > 0 und addiert anschließend r, so folgt
m = q · n + r ≤ −n + r < 0 (wegen r < n)
Dieses ist ein Widerspruch zu m > 0; also muß q ≥ 0 sein. Weiter folgt:
m−r m
q·n = m − r ⇒ q = ≤ ≤ m (3.23)
n n
Damit ist (3.21) gezeigt. Ist sogar n ≥ 2, so muß die zweite Ungleichung auf der rechten
Seite von (3.23) eine strikte Ungleichung (“ < “) sein. Damit folgt (3.22).
F
Anhand des Restes r kann man die Teilbarkeit erkennen; mit den hier verwendeten
Bezeichnungen hat man nämlich:
n|m ⇔ r = 0 (3.24)
Beispiel:
50 : 8 = 6 Rest 2
⇔ 50 = 8 · 6 + 2
Die Teilung mit Rest wird sich im Späteren als sehr wichtig und grundlegend erweisen.
Bei der Programmiersprache C wird die Division mit Rest durch die beiden folgenden
Operatoren unterstützt:
• m%n: liefert den Rest r (mit Vorzeichen) von m : n.
• m/n: liefert den ganzzahligen Quotient von m : n, der Rest wird ohne zu runden
abgeschnitten.
152
Wie bereits bemerkt, werden zur Vereinfachung im folgenden oft nur nichtnegative ganze
Zahlen betrachtet. Die Menge der nichtnegativen ganzen Zahlen wird als IN0 bezeichnet.
Läßt man noch die Null weg, d. h. beschränkt man sich nur auf die positiven ganzen
Zahlen, so erhält man IN, die Menge der natürlichen Zahlen.
Wichtige Folgerung aus der Teilung mit Rest: Sind m, n ∈ ZZ mit n > 0, so gibt es bei
der Division von m durch n
m = q·n + r (3.25)
für den Rest r nur n Möglichkeiten. Wegen 0 ≤ r < n kann r nur die Werte
r = 0, 1, 2, . . . , n − 1 (3.26)
annehmen.
(3.26) besitzt eine wichtige Anwendung; es führt auf die bekannte Darstellung der
natürlichen Zahlen durch Stellenwertsysteme.
Satz (b-Stellenwertsystem): Vorgegeben sei die sogenannte Basis b ∈ IN mit b > 1.
Dann besitzt jede Zahl n ∈ IN0 eine eindeutige Darstellung der Form
n = z0 b0 + z1 b1 + z2 b2 + z3 b3 + . . . + zs bs (3.27)
mit 0 ≤ zi < b für i = 0, . . . , s
Dabei ist s ∈ IN0 ; s + 1 ist die Anzahl der Stellen von n. Die z0 , z1 , . . . , zs sind die
Ziffern von n.
Bemerkung:
• Am meisten verwendet wird die Basis b = 10; der Grund dafür ist sicherlich die
Verwendung der zehn Finger beim Rechnen.
• Im Zusammenhang mit digitalen Rechnern zusätzlich verwendete Systeme sind

heute b = 2, 8, 16, 64. Für b = 16 (Hexadezimalzahlen) benötigt man aufgrund
von (3.27) 16 Ziffern; man nimmt dafür die Symbole
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Das Oktalsystem (b = 8) wurde bei einigen Völkern schon früher verwendet; of-
fenbar rechnete man mit den Fingern, verwendete aber die Daumen nicht.
• Bekannt ist, daß weitere Zahlensysteme verwendet wurden:
– Das Sexagesimalsystem b = 60 wurde bei den Babyloniern verwendet. Die

Zahl 60 bietet den Vorteil, daß sie viele Teiler besitzt.
– Die Mayas verwendeten mit gewissen Abweichungen das Vigesimalsystem
(b = 20); offenbar setzte man beim Rechnen sowohl die Finger als auch die
Zehen ein.
• Die von den Römern verwendete Methode zur Zahlendarstellung sind ein Beispiel
für ein Zahlensystem, das kein Stellenwertsystem ist
153
Begründung von (3.27): Verwendet wird eine verallgemeinerte vollständige Induk-
tion. Der Induktionsanfang wird mit den kleinen“ Zahlen n = 0, 1, 2, . . . , b − 1
”
durchgeführt. Schreibt man für ein solches n
n = z0 · b0 mit 0 ≤ z0 = n < b
so ist dieses bereits die gewünschte Darstellung (3.27), die offenbar eindeutig ist. Es folgt
der Induktionsschluß. Sei dazu n ∈ ZZ mit n ≥ b. Als Induktionsvoraussetzung
wird angenommen, daß die Behauptung
für alle ñ ∈ ZZ mit 0 < ñ < n
bereits bewiesen wurde. Man nimmt dann eine Teilung mit Rest vor:
n = q·b + r mit 0 ≤ r < b (3.28)
Dann ist 0 < q < n (wegen (3.22)), und man kann auf q die Induktionsvoraussetzung
anwenden. q besitzt somit die eindeutige Darstellung
q = y0 b0 + y1 b1 + y2 b2 + . . . + yt bt (3.29)
mit 0 ≤ yi < b für i = 0, . . . , t
Multipliziert man beide Seiten von (3.29) mit b und addiert man anschließend r, so
liefert dieses zusammen mit (3.28)
n = q · b + r = r + y0 b1 + y1 b2 + y2 b3 + y3 b4 + . . . + yt bt+1 (3.30)
Setze man jetzt hier
z0 = r, zi = yi−1 für i = 1, . . . , t + 1 sowie s = t + 1
so erkennt man, daß (3.30) eine Stellenwertdarstellung für n der Form (3.27) ist. Diese
ist sogar eindeutig, denn q und r in (3.28) sind durch n eindeutig bestimmt. qed.
3.2.2 Größter gemeinsamer Teiler und euklidischer Algorith-

mus
Eine sehr wichtige Größe bei ganzen Zahlen ist der sogenannte
größte gemeinsame Teiler8
Sind m, n ∈ ZZ zwei ganze Zahlen, von denen mindestens eine ungleich Null ist, so
schreibt man für deren größten gemeinsamen Teiler
ggT(m, n) oder gcd(m, n) (3.31)
Der Wert des größten gemeinsamen Teilers
d = ggT(m, n) (3.32)
ist eine natürliche Zahl, die durch die beiden folgenden gleichwertigen Eigenschaften
festgelegt ist:
8
engl. greatest common divisor
154
1. d ∈ IN ist die größte natürliche Zahl, die sowohl ein Teiler von m als auch ein
Teiler von n ist, d. h.
d = max{a ∈ IN | a|m und a|n} (3.33)
Man beachte, daß die in (3.33) erscheinende Menge zumindest die Zahl 1 enthält
und damit nicht leer ist. Außerdem besitzt diese Menge wegen (3.13) notwendi-
gerweise ein größtes Element.
2. Die bedeutsamste Charakterisierung des größten gemeinsamen Teilers liefern die
beiden folgenden Eigenschaften; genau wenn diese erfüllt sind, ist d = ggT(m, n):
(1) d ist ein gemeinsamer Teiler von m und n, d. h. d | m und d | n.
(3.34)
(2) Sei d˜ ∈ IN beliebig mit d˜| m und d˜| n ⇒ d˜| d
Dieses bedeutet: Jeder beliebige gemeinsame Teiler von m und n ist auch ein Teiler
des größten gemeinsamen Teilers von m und n.
Beispiel: Gemeinsame Teiler von 12 und 40 sind 1 und 2, diese teilen auch 4 =
ggT(12, 40).
Der Nachweis der Gleichwertigkeit von (3.33) und (3.34) erfolgt später, da hierzu erst
noch einige Vorbereitungen erforderlich sind.
Für zahlreiche Anwendungen erweist es sich als sehr günstig, daß es ein sehr schnelles
und einfaches Verfahren zur Berechnung des größten gemeinsamen Teilers gibt; dieses
ist der sogenannte
euklidische Algorithmus
der im Folgenden hergeleitet und genauer besprochen werden soll. Es reicht, sich auf
zwei nichtnegative ganze Zahlen m, n ∈ ZZ zu beschränken9 ; ebenso setzt man zunächst
m ≥ n voraus. Die Vorgehensweise und Idee des euklidischen Algorithmus lautet damit:
(a) Ist n = 0, so setzt man einfach
ggT(m, n) = m (3.35)
Man erkennt sofort, daß (3.35) in diesem Spezialfall in Übereinstimmung zu der
Eigenschaft (3.33) ist.
(b) Ist n > 0, so nimmt man eine Teilung mit Rest vor (siehe (3.14)):
m = q·n + r mit 0 ≤ r < n (3.36)
⇔ r = m − q·n (3.37)
Für beliebiges d ∈ IN gilt dann folgende Tatsache:
d ist genau dann ein gemeinsamer Teiler von m und n,
(3.38)
wenn d auch ein gemeinsamer Teiler von n und r ist.
⇔ {d ∈ IN | d|m und d|n} = {d ∈ IN | d|n und d|r}

9
Frage: warum?
155
Die Begründung von (3.38) erhält man, indem man einen beliebigen gemeinsamen
Teiler d von m und n auf der rechten Seite von (3.37) ausklammert, bzw. indem
man einen beliebigen gemeinsamen Teiler d von n und r auf der rechten Seite von
(3.36) ausklammert
Hieraus folgt wiederum sofort10
ggT(n, r) = ggT(m, n) (3.39)
Setzt man nun

m1 = n sowie n1 = r
so reicht es,
ggT(m1 , n1 )
zu berechnen. Dieses ist eine merkliche Vereinfachung, da ja
n1 < n
ist.
Fährt man auf diese Weise fort, d. h. mit der schrittweisen Vereinfachung durch Teilung
mit Rest in Schritt (a), so erhält man nacheinander:
m0 = m, n0 = n, m0 = q0 · n0 + r0 (r0 < n0 )
m1 = n0 , n1 = r0 , m1 = q1 · n1 + r1 (r1 < n1 )
m2 = n1 , n2 = r1 , m2 = q2 · n2 + r2 (r2 < n2 )
.. ..
. .
mi = ni−1 , ni = ri−1 , mi = qi · ni + ri (ri < ni )
.. ..
. .
Dabei ist stets11
ggT(mi , ni ) = ggT(mi−1 , ni−1 ) = . . . = ggT(m1 , n1 ) = ggT(m0 , n0 ) (3.40)
Ist ni−1 > 0 so ist 0 ≤ ri−1 < ni−1 ; beachtet man noch ni = ri−1 , so liefert dieses die
Ungleichungen
n0 > n1 > n2 > . . . > ni−1 > ni > . . . ≥ 0
Da alle ni nichtnegative ganze Zahlen sind, muß bei dieser absteigenden Kette irgend-
wann einmal die Null erreicht werden, d. h. es muß ein j ∈ IN mit
nj = 0
geben. Für das Paar (mj , nj ) kann dann Schritt (a) des Algorithmus angewandt werden.
Der Algorithmus endet damit und liefert wegen (3.40) das gewünschte Ergebnis:
ggT(m, n) = ggT(m0 , n0 ) = ggT(mj , nj ) = ggT(mj , 0) = mj
Es folgt im Pseudocode eine iterative Fassung des euklidischen Algorithmus:

10
Aufgabe: Man führe die Begründungen von (3.38) und (3.39) genau durch.
11
Wie man sieht, werden die auftauchenden Werte qi nicht verwendet; sie gelangen erst bei der
erweiterten Form des euklidischen Algorithmus Bedeutung.
156
ggT(m,n)
while (n > 0)
r = m%n
m = n
n = r
return m
Aufgabe: Begründen Sie, daß man auf die zunächst geforderte Bedingung m ≥ n (siehe
Seite 155) verzichten kann; zum Ablauf des so geschilderten euklidischen Algorithmus
kommt höchstens ein Schritt vom Typ (b) hinzu.
Der euklidische Algorithmus ist sehr schnell; sein Aufwand beträgt höchstens
2 · ld (n) + 2 (3.41)
Schleifendurchläufe. Er ist damit auch noch für sehr große Zahlen (n, m ≥ 10300 )
durchführbar.
Zur Begründung12 von (3.41) weist man nach, daß spätestens nach zwei Schritten eine
Halbierung von ni erfolgt, d. h. mit den Bezeichnungen von Seite 156 ist
1
ni+2 < · ni (3.42)
2
Zunächst gilt nach Konstruktion ebenfalls mit den Bezeichnungen von Seite 156
ni > ni+1 (= ri )
und ni = qi+1 · ni+1 + ni+2 (3.43)
|{z} |{z}
=mi+1 =ri+1
Jetzt gibt es zwei Möglichkeiten:

1
1. Es ist bereits ni+1 ≤ 2
· ni ; dann ist natürlich erst recht
1
ni+2 < · ni wegen ni+2 < ni+1
2
2. Es ist umgekehrt ni+1 > 12 · ni bzw. 2ni+1 > ni ; dann muß aber in (3.43) qi+1 = 1
sein, sonst erhielte man wegen qi+1 ∈ IN und ni+2 = ri+1 ≥ 0 einen Widerspruch.
Setzt man qi+1 = 1 in (3.43) ein, so folgt in der Tat wieder mit Hilfe von ni+1 > 12 ·ni
ni = ni+1 + ni+2
1 1
⇒ ni+2 = ni − ni+1 < ni − · ni = · ni
2 2
Damit ist Ungleichung (3.42) gezeigt. Wendet man die Ungleichung (3.42) mehrmals an,
so folgt für k ∈ IN:
1
ni+2k < k · ni
2
Speziell für i = 0, d. h. für n = n0 ist dann
1
n2k < ·n (3.44)
2k
12
Diese Begründung ist eine Hintergrundinformation; sie ist für das Verständnis des Folgenden nicht
notwendig.
157
Wählt man k ∈ IN mit ld (n) ≤ k < ld (n) + 1, so ist 2k ≥ n und daher
1
n2k < ·n ≤1 ⇒ n2k < 1
2k
Wegen n2k ∈ ZZ und n2k ≥ 0 muß daher n2k = 0 sein. Damit endet der Algorithmus. Er
hat bis zu seinem Ende höchstens diese 2k Schritte durchlaufen, wobei k < ld (n) + 1
ist. Damit ist (3.41) gezeigt.
F
Beispiel:
m = 4, n = 17, 4 = 0 · 17 + 4
m1 = 17, n1 = 4, 17 = 4 · 4 + 1
m2 = 4, n2 = 1, 4 = 4·1 + 0
m3 = 1, n3 = 0 ⇒ ggT(4, 17) = m3 = 1
Hier tritt die Besonderheit auf, daß die beiden Zahlen 4 und 17 keinen echten gemein-
samen Teiler besitzen. Gerade dieser Fall ist für viele Anwendungen bedeutsam, man
definiert daher:
Definition: n, m ∈ ZZ heißen teilerfremd oder zueinander prim, falls gilt
ggT(m, n) = 1 (3.45)
Bedeutsamer als der einfache“ größte gemeinsame Teiler ist häufig die Tatsache, daß
”
der größte gemeinsamer Teiler zweier Zahlen m, n ∈ ZZ in folgender Weise dargestellt
werden kann: Zu m, n ∈ IN0 gibt es stets ein Paar ganzer Zahlen a, b ∈ ZZ mit
ggT(m, n) = a · m + b · n (3.46)
Diese Aussage wird als Lemmas von Bezout bezeichnet und ist insbesondere im Falle
ggT(m, n) = 1 interessant. Zwei Zahlen m, n ∈ ZZ sind nämlich genau dann teilerfremd,
wenn es Zahlen a, b ∈ ZZ mit
a·m + b·n = 1 (3.47)
gibt. Die Gültigkeit der Gleichung (3.47) folgt sofort aus dem Lemmas von Bezout. Zu
zeigen bleibt nach die Umkehrung: Besteht für m, n ∈ ZZ eine Gleichung der Form (3.47),
so sind sie teilerfremd. Das wird als Aufgabe überlassen.
Die Darstellung (3.46) wird mit einer Erweiterung des euklidischen Algorithmus
berechnet; wie beim gewöhnlichen euklidischen Algorithmus nimmt man eine Teilung
mit Rest vor (siehe Seite 156) und setzt
m0 = m, n0 = n, m0 = q0 · n0 + r0
(3.48)
m1 = n0 , n1 = r0 (r0 < n0 )
Angenommen, man hat für das Zahlenpaar (m1 , n1 ) mit n1 < n0 bereits die ggT-
Darstellung
ggT(m1 , n1 ) = a1 · m1 + b1 · n1 (3.49)
158
berechnet, so setzt man in diese die Gleichungen
m1 = n0 und n1 = m0 − q0 · n0
aus (3.48) ein und berücksichtigt ggT(m, n) = ggT(m1 , n1 ) (siehe (3.39)) :
ggT(m, n) = a1 · m1 + b1 · n1
= a1 · n0 + b1 · (m0 − q0 · n0 )
= b1 ·m0 + (a1 − q0 · b1 ) ·n0 (3.50)
|{z} | {z }
a0 b0
= a·m + b·n
wobei in der letzten Zeile von (3.50) wieder m0 = m, n0 = n, a0 = a sowie b0 = b gesetzt

wurde.
Beispiel: Mit m = m0 = 61 und n = n0 = 17 liefert der erweiterte Euklidische Algorith-

mus die folgenden Werte und Zwischenwerte:
i mi ni qi ri ai bi ggT
0 61 17 3 10 −5 18 1
1 17 10 1 7 3 −5 1
2 10 7 1 3 −2 3 1
3 7 3 2 1 1 −2 1
4 3 1 3 0 0 1 1
5 1 0 1 0 1
Zunächst wurden nur die Spalten bis zur Spalte ri“ berechnet. Dazu wurde wie in (3.48)
”
die Teilung mit Rest mi = qi ·ni +ri durchgeführt sowie mi+1 = ni und ni+1 = ri gesetzt.
Wurde hier nach fünf Schritt n5 = 0 erreicht, so konnte ggT(m5 , n5 ) = ggT(m, n) = 1
gesetzt werden. Ebenso konnte a5 = 1 und b5 = 0 gesetzt werden. Danach erfolgte die
Rückrechnung mit absteigendem i, indem wie in (3.50) ai = bi+1 und bi = ai+1 − qi · bi+1
gesetzt wurde. Das Ergebnis liefert die 0-te Zeile der Tabelle:
ggT(61, 17) = −5 · 61 + 18 · 17 = 1
Für m = m0 = 100 und n = n0 = 34 erhält man auf diese Weise:
0 100 34 2 32 −1 3 2
1 34 32 1 2 1 −1 2
2 32 2 16 0 0 1 2
3 2 0 1 0 2
Die 0-te Zeile der Tabelle zeigt das Ergebnis:
ggT(100, 34) = −100 + 3 · 17 = 2
Es folgt mit entsprechender Rechnung ein weiteres Beispiel mit etwas größeren Zahlen:
159
0 9654321 1234569 7 1012338 8633 −67510 3
1 1234569 1012338 1 222231 −7079 8633 3
2 1012338 222231 4 123414 1554 −7079 3
3 222231 123414 1 98817 −863 1554 3
4 123414 98817 1 24597 691 −863 3
5 98817 24597 4 429 −172 691 3
6 24597 429 57 144 3 −172 3
7 429 144 2 141 −1 3 3
8 144 141 1 3 1 −1 3
9 141 3 47 0 0 1 3
10 3 0 1 0 3
Das Ergebnis wird wieder der 0-te Zeile der Tabelle entnommen:
ggT(9654321, 1234569) = 8633 · 9654321 − 67510 · 1234569 = 3
Die dritte Zeile von (3.50) führt auf eine rekursive Fassung des erweiterten euklidischen
Algorithmus:
erw_ggT(m,n,&a,&b) // mit Referenzparametern f"ur R"uckgabewerte

if (n=0)
d = m
a = 1
b = 0
else
d = erw_ggT(n,m%n,&a1,&b1) // rekursiver Aufruf
q = m/n // Ganzzahldivision
a = b1
b = a1 - q*b1
return d
Der Aufwand hiervon ist wie beim einfachen euklidischen Algorithmus (siehe (3.41)). Der
Nachteil dieser Fassung ist die Verwendung der Rekursion. Will man diese vermeiden
und zu einer iterativen Fassung kommen, so benötigt man eine kleine Vorarbeit:13
Zunächst betrachtet man dazu die Rekursionsgleichungen, die die Grundlage dieser re-
kursiven Fassung des erweiterten euklidischen Algorithmus bilden:
mi = qi · ni + ri
(3.51)
mi+1 = ni ni+1 = ri
Mit (3.51) berechnet man rekursiv ganze Zahlen d, ai+1 , bi+1 mit
d = ggT(ai+1 , bi+1 ) = ggT(ai , bi ) (3.52)

sowie d = ai+1 · mi+1 + bi+1 · ni+1 (3.53)
13
Die folgende Herleitung dient zur Vertiefung und ist für das Verständnis des Folgenden nicht erfor-
derlich.
160
Damit berechnet man wiederum (siehe (3.50)):
ai = bi+1
(3.54)
bi = ai+1 − qi · bi+1
Jetzt erkennt man unschwer, daß sich (3.54) mit Hilfe einer Matrix schreiben läßt:

ai 0 1 ai+1
= ◦ (3.55)
bi 1 −qi bi+1
| {z }
Ai
Dabei ist qi der ganzzahlige Quotient von mi und ni aus (3.51); die vorkommende Matrix
wird Ai genannt. Für i + 1 gilt (3.55) ebenso:

ai+1 ai+2
= Ai+1 ◦
bi+1 bi+2
Dieses in (3.55) liefert

ai ai+2
= Ai ◦ Ai+1 ◦
bi bi+2
Die Weiterführung dieser Iteration liefert

a a0 aj
= = A0 ◦ A1 ◦ . . . ◦ Aj ◦
b b0 bj

aj 1
mit =
bj 0
j ∈ IN ist hier gerade der Iterationsschritt, bei dem der euklidische Algorithmus endet
(siehe Seite 156). Mit Hilfe dieses iterierten Matrizenproduktes erhält man die iterative
Fassung des erweiterten euklidischen Algorithmus:
erw_ggT(m,n,&a,&b) // mit Referenzparametern f"ur R"uckgabewerte

A = 0 1
1 0
while (n > 0)
r = m%n
q = m/n
m = n
n = r

0 1
A = A ◦ 1 −q
a = A[0][0] // die erste Spalte von A

b = A[1][0] //
return m
161
Hierbei wurde verwendet, daß die erste Spalte von A gerade gleich dem Produkt A◦(1, 0)t
ist.
Beispiel: m = 4, n = 17

m = 4 n = 17 q = 0 r = 4 A = 01 1
0

m = 17 n = 4 q = 4 r = 1 A = 01 1 ◦ 0 1 = 1 −4
0 1 −4 0 1

1 −4 0 1 −4 17
m=4 n=1 q=4 r=0 A= 0 1 ◦ 1 −4 = 1 −4

a −4 17 1 −4
m=1 n=0 ⇒ = 1 −4 ◦ =
b 0 1
⇒ ggT(4, 17) = 1 = (−4) · 4 + 1 · 17
F
Bemerkung: Der größte gemeinsame Teiler ist auch für mehrere ganze Zahlen definiert;
er kann schrittweise berechnet werden:
ggT(m1 , . . . , mk ) = ggT(ggT(m1 , . . . , mk−1 ), mk ) (3.56)
Eine erste Besonderheit teilerfremder Zahlen stellt der folgende Hilfssatz dar:
Hilfssatz: Sind m, n ∈ IN teilerfremd, d. h. ist ggT(n, m) = 1, und ist c ∈ IN eine weitere
Zahl, so daß
m | c und n | c
ist, dann gilt auch
(m · n) | c (3.57)
Begründung: Da m und n teilerfremd sind, kann man von einer Darstellung nach (3.47)
ausgehen;
a·m + b·n = 1 mit a, b ∈ ZZ
Diese Gleichung multipliziert man mit c:
a·m·c + b·n·c = c (3.58)
Nun teilt m · n beide Summanden auf der linken Seite von (3.58), denn man kann nach
(3.9), (3.10) folgern:
n | c ⇒ (n · m) | (m · c) ⇒ (n · m) | (a · m · c)
m | c ⇒ (n · m|(n · c) ⇒ (n · m) | (b · n · c)
Da m · m somit die beide Summanden auf der rechten Seite von (3.58) teilt, ist m · n
nach (3.7) auch ein Teiler der Summe und damit auch von c. qed.
162
Auf die folgende Aussage zu teilerfremden Zahlen benötigt man, wie man noch sehen
wird, sehr häufig.
Hilfssatz: Gegeben seien drei Zahlen m, n1 , n2 ∈ ZZ . Sind dann m und n1 teilerfremd
und ebenso m und n2 teilerfremd, so sind auch m und n1 · n2 teilerfremd; d. h.
ggT(m, n1 ) = 1 und ggT(m, n2 ) = 1 ⇒ ggT(m, (n1 · n2 )) = 1 (3.59)
Begründung: Wegen der Teilerfremdheit von m und n1 sowie von m und n2 gibt es
Darstellungen (siehe (3.47))
a1 · m + b 1 · n 1 = 1
a2 · m + b 2 · n 2 = 1
Die beiden Gleichungen multipliziert man einfach miteinander:
1 = (a1 m + b1 n1 ) · (a2 m + b2 n2 )
= a1 a2 m2 + a1 mb2 n2 + b1 n1 a2 m + b1 n1 b2 n2 Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 m + a1 b2 n2 + b1 n1 a2 ) ·m + b1 b2 ·n1 n2
| {z } |{z}
a b
= a · m + b · (n1 · n2 )
Damit wurde a · m + b · (n1 n2 ) = 1 gezeigt, woraus dann sofort ggT(a, (n1 n2 )) = 1) folgt
(siehe (3.47)). qed.
Zusatz: Durch vollständige Induktion zeigt man mit Hilfe von (3.59): Sind beliebig viele
Zahlen n1 , . . . , nk ∈ IN mit ggtT(m, ni ) = 1 gegeben, so ist auch
ggtT(m, n1 · n2 · . . . · nk ) = 1 (3.60)
F
Es bleibt noch zu zeigen, daß der größte gemeinsame Teiler d = ggT(m, n) zweier ganzer
Zahlen m, n ∈ ZZ durch die Eigenschaften (3.34) festgelegt ist; diese lauteten:
(1) d ist ein gemeinsamer Teiler von m und n, d. h. d | m und d | n.

(3.61)
(2) Sei d˜ ∈ IN beliebig mit d˜| m und d˜| n ⇒ d˜| d
Auch dieses wird als Aufgabe überlassen. Hinweis: Man verwende (3.46).
3.2.3 Primzahlen
Grundlegend sind die sogenannten Primzahlen. Eine Zahl p ∈ IN mit p > 1 heißt
Primzahl, falls gilt (mit d ∈ ZZ):
p besitzt keine echten Teiler

⇔ (d | p ⇒ d = ±1 oder d = ±p ) (3.62)
Achtung: Man beachte, daß aufgrund dieser Definition die Zahl 1 keine Primzahl ist.
163
(3.62) ist die bekannte Definition der Primzahlen. Es gibt aber ein weiteres Merkmal,
welches die Primzahlen charakterisiert und bei den meisten Betrachtungen zu Primzah-
len hilfreicher als die Beschreibung (3.62) ist. Dieses ist Inhalt des folgenden wichtigen
Satzes.
Satz: Für p ∈ IN mit p > 1 gilt
p ist Primzahl
⇔ (p | (n · m) ⇒ p | n oder p | m für n, m ∈ ZZ ) (3.63)
⇔ (p 6 | n und p 6 | m ⇒ p 6 | (n · m) für n, m ∈ ZZ ) (3.64)
Dieses besagt, daß eine Primzahl, die Teiler eines Produktes zweier ganzer Zahlen ist,
bereits mindestens einen der Faktoren teilen muß. Umgekehrt besagt (3.63), daß eine
Zahl p ein Produkt ganzer Zahlen nur dann teilt, wenn sie mindestens schon einen der
Faktoren teilt, eine Primzahl sein muß.
Beweis: Gegeben sei p ∈ IN .
1. Zunächst wird angenommen, daß p die Bedingung (3.63) erfüllt; zu zeigen ist, daß
p eine Primzahl ist. Dazu führt man einen Widerspruchsbeweis.
Angenommen, p wäre keine Primzahl; dann muß es einen echten Teiler d von p
geben. Dann muß zunächst
p = d·c mit einem c ∈ ZZ
gelten. Da d ein echter Teiler von p ist, ist wegen (3.13) |d| < p. Ebenso muß dann
|c| < p sein. Ebenfalls wegen (3.13) kann dann p keinen der beiden Faktoren d und
c teilen. Andererseits teilt p das Produkt d · c, denn es ist ja
d·c = 1·p
Das ist ein Widerspruch. Also kann p keinen echten Teiler besitzen; also muß p
eine Primzahl sein.
2. Jetzt sei p eine Primzahl, die das Produkt n · m teilt. Zu zeigen ist, daß p schon
mindestens einen der beiden Faktoren teilen muß. Auch hier wird wieder ein Beweis
durch Widerspruch geführt. Dazu wird angenommen, daß p keinen der beiden
Faktoren m und n teilt. Dann müssen aber die beiden größten gemeinsamen Teiler
von p mit m sowie von p mit n gleich 1 sein. Diese sind nämlich auch Teiler der
Primzahl p; daher kommen für sie nur 1 und p selber in Frage. Da aber p ja nach
Annahme weder m noch n teilen soll, bleibt für beide größten gemeinsamen Teiler
nur der Wert 1. Nach (3.47) gibt es daher mit geeigneten a1 , b1 , a2 , b2 Darstellungen
a1 · p + b 1 · m = 1
a2 · p + b 2 · n = 1
Die beiden Gleichungen multipliziert man miteinander:
1 = (a1 p + b1 m) · (a2 p + b2 n)
= a1 a2 p2 + a1 pb2 n + b1 ma2 p + b1 mb2 n Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 p + a1 b2 n + b1 na2 ) · p + b1 b2 · (m · n) (3.65)
164
Da ja nach Voraussetzung p ein Teiler von m · n ist, teilt p beide Summanden auf
der rechten Seite von (3.65). Dann müßte p aber auch die Summe und damit 1
teilen. Wegen p > 1 ist das aber ein Widerspruch. Somit muß p mindestens einen
der Faktoren m oder n teilen. qed.
Beispiel: Für die Primzahl 3 hat man
3 | 66 (= 6 · 11) : in der Tat gilt bereits 3 | 6

3 6 | 7 und 3 6 | 7 ⇒ 3 6 | 77 (= 7 · 11)
Beispiel: 10 kann keine Primzahl sein, denn es ist
10 | 100 aber 100 = 4 · 25 und 10 6 | 4, 10 6 | 25
Zusatz zu (3.63): Gegeben seien eine Primzahl p sowie ganze Zahlen m1 , m2 , . . . , mk .

Dann gilt:
p | (m1 · m2 · . . . · mk ) ⇒ p | mi (3.66)
für mindestens ein mi unter den m1 , m2 , . . . , mk
Begründung: (3.66) folgt durch vollständige Induktion aus (3.66). Aufgabe: Man führe
dieses durch.
Die ersten Primzahlen lauten
2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37
Primzahlen werden sich als grundlegend für viele Verfahren in der Kryptologie erweisen;
insbesondere werden sehr große Primzahlen benötigt. Aber auch bei vielen anderen
Betrachtungen über die ganzen Zahlen und damit verbundenen Anwendungen ist die
Berücksichtigung der Primzahlen sehr hilfreich bzw. sogar notwendig. Ursache dafür
ist der folgende Satz, der besagt, daß jede ganze Zahl m mit |m| > 1 aus Primzahlen
zusammengesetzt“ ist.
”
Satz: (eindeutige Primfaktorzerlegung) Zu jedem m ∈ ZZ \ {0} gibt es eine Darstel-
lung der Form
m = ±1 · pe11 · pe22 · . . . · pess (3.67)
Dabei ist s ∈ IN0 ; die pi sind s verschiedene Primzahlen, die jeweils einen Exponenten
ei ∈ IN besitzen. Diese Darstellung ist bis auf die Reihenfolge eindeutig.
Beweis: Dieser Beweis wird mittels verallgemeinerter vollständiger Induktion durch-
geführt. Führt Induktionsanfang betrachtet man die beiden folgenden Arten ganzer
Zahlen:
1. m = ±1
(3.68)
2. m = ±p mit einer Primzahl p
165
Beide Möglichkeiten in (3.68) sind offenbar eine Darstellung der Form (3.67) und sind
offenbar eindeutig.
Für den Induktionsschluß betrachtet man eine ganze Zahl m ∈ ZZ mit |m| > 1, die
keine Primzahl ist, und nimmt an, daß die Behauptung bereits für alle d ∈ ZZ mit
0 < |d| < |m| bewiesen ist. Dann gibt es ein Zerlegung
m = d1 · d2 (3.69)
mit zwei echten Teilern d1 , d2 ∈ ZZ . Nach (3.13) ist dann
|d1 | < m und d2 < m
und man kann die Induktionsvoraussetzung auf d1 und d2 anwenden. Es gibt somit
Primfaktorzerlegungen
d1 = ±1 · pe11 · pe22 · . . . · pess d2 = ±1 · q1f1 · q2f2 · . . . · qtft (3.70)
mit Primzahlen p1 und qj sowie Exponenten ei und fj . Das liefert sofort eine Primfak-
torzerlegung von m:
m = d1 · d2 = ±1 · pe11 · pe22 · . . . · pess · q1f1 · q2f2 · . . . · qtft (3.71)
In (3.70) würde man natürlich Faktoren mit derselben Basis pi = qj zusammenfassen.

Damit wurde die Existenz der Primfaktorzerlegung von m gezeigt.
Zu zeigen bleibt noch, daß diese Primfaktorzerlegung eindeutig ist. Angenommen, man
hat die beiden Darstellungen
m = ±1 · pe11 · pe22 · . . . · pess (3.72)

m = ±1 · p̃g11 · p̃g22 · . . . · p̃gt t (3.73)
Da p1 ein Teiler von m und damit des Produktes auf der rechten Seite von (3.72) ist,
muß p1 einen der Faktoren auf der rechten Seite von (3.72) teilen. Da es sich bei diesen
Faktoren (nach Auflösung der Potenzen) um die Primzahlen p̃1 , p̃2 , . . . , p̃t handelt, muß
p1 eine dieser Primzahlen teilen und damit gleich eine dieser Primzahlen seinen. Indem
man gegebenenfalls eine Umnummerierung vornimmt, kann man p1 = p̃1 annehmen.
Man kann daher die beiden Gleichungen (3.72) und (3.73) durch p1 teilen:
m1 = ±1 · pe11 −1 · pe22 · . . . · pess (3.74)

m1 = ±1 · p̃g11 −1 · p̃g22 · . . . · p̃gt t (3.75)
Dabei ist m1 = m/p1 ∈ ZZ . Wegen p1 > 1 ist dann insbesondere |m1 | < |m|. Folg-
lich sind nach Induktionsvoraussetzung die beiden Primfaktorzerlegungen (3.74) und
(3.75) gleich. Das heißt, auf den rechten Seiten von (3.73) und (3.75) kommen diesel-
ben Primzahlen mit den jeweiligen selben Exponenten vor. Dasselbe gilt dann auch für
die beiden Zerlegungen in (3.72) und (3.73), die somit ebenfalls gleich sind. Zwei be-
liebige Primfaktorzerlegungen von m sind somit gleich; damit ist die Eindeutigkeit der
Primfaktorzerlegung nachgewiesen. qed.
Bemerkung: Sind alle Exponenten ei = 1, so heißt m quadratfrei. Für s = 0 enthält m

keine Primfaktoren; dieses ist genau für m = ±1 der Fall.
166
Schon seit 2300 Jahren bekannt aber erst seit ca. 40 Jahren von praktischer Bedeutung
ist der folgende
Satz von Euklid: Es gibt unendlich viele Primzahlen.14
Beweis:15 : Offensichtlich gibt es mindestens eine Primzahl (etwa = 2); die Menge der
Primzahlen ist damit nicht leer. Angenommen, deren Anzahl ist endlich und beträgt
genau k ∈ IN. Sind p1 , . . . , pk sämtliche existierende Primzahlen, so bildet man damit
die Zahl
N = p1 · p2 · . . . · p k + 1
Da mindestens ein Primzahl vorhanden ist, ist N > 1 und damit insbesondere N 6= ±1.
N muß daher mindestens einen Faktor der Gestalt pe in seiner eindeutigen Primfak-
torzerlegung besitzen; insbesondere ist dann die Primzahl p ein Teiler von N . Da die
p1 , . . . , pk alle Primzahlen sind, muß p gleich einer dieser Primzahlen sein, d. h. p = pi
mit einem i mit 1 ≤ i ≤ k. Dann ist aber offensichtlich p auch ein Teiler von p1 ·p2 ·. . .·pk .
Da p als Teiler von N gewählt wurde, ist somit
p | N = (p1 · p2 · . . . · pk + 1) und p | (p1 · p2 · . . . · pk )
Nach (3.7) teilt p auch die Differenz dieser beiden Zahlen:
p | (N − p1 · p2 · . . . · pk ) = 1
Also folgt p|1, was nicht möglich ist. Die Annahme, es gäbe nur endlich viele Primzahlen
führt somit auf einen Widerspruch und kann nicht richtig sein. qed.
Da es unendlich viele Primzahlen gibt, muß es insbesondere beliebig große Primzahlen

geben. Weiterhin kann man feststellen, daß die Primzahlen zwar immer seltener“ wer-
”
den16 , daß sie aber auch in größeren Bereichen (etwa mit einer Größenordnung 10300 )
noch relativ häufig sind. Eine genauere Aussage über die Häufigkeit der Primzahlen
liefert der Primzahlsatz: Für große x ∈ IR ist

Anzahl der Primzahlen p x
≈ (3.76)
mit p ≤ x log x
Setzt man in (3.76) nacheinander x = 10299 und x = 10300 ein, so folgt, daß in dem
Bereich von 10299 bis 10300 im Durchschnitt jede 700ste Zahl eine Primzahl ist. Dieses
ist für kryptologische Anwendungen sehr bedeutsam; in vielen Fällen werden dabei sehr
große Primzahlen benötigt.
F
Wie findet man Primzahlen?
• Ab einem - häufig zufällig gewählten - ungeraden M ∈ IN testet man nacheinander

die Zahlen
m = M, M + 2, M + 4, M + 6, . . .
• Für jede dieser Zahlen wird ein Primzahltest durchgeführt:

14
Der griechische Mathematiker Euklid lebte um 300 v. Chr. in Alexandria.
15
Das Lesen dieses Beweises ist für das Verständnis des Folgenden nicht zwingend erforderlich.
16
Es gibt sogar beliebig große Lücken: für n ∈ IN ist keine der Zahlen n! + i mit i = 2, . . . , n eine
Primzahl (warum?).
167
– Ein einfacher Test besteht darin, daß man einen Teiler von m ∈ IN sucht.
Besitzt m einen Teiler n mit 1 < n < m, so kann m keine Primzahl sein. Es
reicht, für alle n ∈ IN mit
√
n ist ungerade und 2 < n ≤ m
zu prüfen, ob es sich um einen Teiler von m handelt. Einerseits17 einen ist
hier m ungerade kann daher keinen geraden Teiler besitzen. Andererseits muß,
wenn m ein Produktdarstellung
m = n1 · n2
√
besitzt, mindestens einer der beiden Faktoren ni kleiner oder gleich m sein.
Wäre nämlich
m = n1 · n2
eine Produktdarstellung von m mit
√
n1 > m
√
n2 > m
so folgte durch Multiplikation dieser beiden Ungleichungen
√ √
m = n1 · n2 > m· m = m
und damit m > m. Dieses ist ein Widerspruch.
Eine entsprechende Testfunktion ist:
bool primtest(m)
if (m==3) return true
if (m % 2 ==0) return false
w = sqrt(m)
n=3
while (n <= w)
if(m % n ==0) return false
n = n+2
return true
√
Der Aufwand dieses Tests beläuft sich auf m/2 Schleifendurchläufe und ist
für m ≤ 1012 gut machbar.
– Für sehr große m ∈ IN sind sehr interessante und effektive Tests vorhanden.
Aus allgemeinen Interesse sind viele Informatiker und Mathematiker damit beschäftigt
immer neuere und größerer Primzahlen zu finden. Gute Kandidaten für Primzahlen sind
die Zahlen der Form
n = 2k − 1 (3.77)
Ist n eine Primzahl, so heißt n Mersennesche Primzahl. Notwendig ist, daß k ebenfalls
eine Primzahl ist. Andernfalls wäre für k = a · b, 1 < a < k die Zahl 2a − 1 ein Teiler
von n. Die ersten Mersenneschen Primzahlen sind
3, 7, 31, 127, 8191, 131071, 524287
17
Das Lesen dieses Absatzes ist für das Verständnis des folgenden nicht zwingend erforderlich.
168
Der Fall n = 211 −1 = 2047 = 23·89 zeigt, daß nicht jede Zahl mit dieser Eigenschaft eine
Primzahl ist. Eine vor kurzem mit einigem Aufwand gefundene Mersennesche Primzahl
ist
p = 257 885 161 − 1 (3.78)
Diese Primzahl besitzt 17 425 170 Dezimalstellen.
3.2.4 Chinesischer Restsatz

Ein Beispielproblem: Eine natürliche Zahl m soll einen geheimen Wert darstellen; es
könnte sich etwa um den Zahlencode eines Tresors handeln. Die Kenntnis dieser ge-
heimen Zahl m soll über drei verschiedene Personen aufgeteilt werden. Das heißt, jede
dieser Personen erhält eine Information über m, aus der sie jedoch m nicht ermitteln
kann. Tragen jedoch die drei Personen ihre Informationen zusammen, so soll sich daraus
m bestimmen lassen.
Die Lösung hierzu ist nicht besonders kompliziert: Man bestimmt zufällig zwei Zahlen
m1 , m2 ∈ IN , die beide in Größenordnung von m/3 liegen und setzt zusätzliche m3 =
m − m1 − m2 . Übermittelt man nun jede der Zahlen m1 , m2 und m3 an eine der drei
Personen, so kennt keine von ihnen m; gemeinsam können sie aber m = m1 + m2 + m3
berechnen.
Interessanter, aber auch komplizierter wird es, wenn bereits zwei der drei Personen in der
Lage sein sollen, gemeinsam m zu ermitteln. Um diese Aufgabe zu lösen, bedient man
sich der Rechnung mit Divisionsresten, so wie schon die Herleitung der Zahlendarstellung
im b-Stellenwertsystem auf Divisionsresten beruhte (siehe Seite 153).
Um das beschriebene Problem bearbeiten zu können sowie auch für viele andere An-
wendungen soll hier der sogenannte Chinesische Restsatz erläutert werden. Er wird
hier zunächst in einer stark vereinfachten Form formuliert; dieses ist ohnehin für viele
Anwendungen ausreichend.
Satz: Gegeben seien
1. m, n ∈ IN teilerfremd, d. h. mit ggT(m, n) = 1,
2. u, v ∈ ZZ beliebig.
Die Reste, die sich bei Teilung von u durch m und v durch n ergeben, seien r1 bzw. r2 ,
d. h. es sei
u = q1 · m + r1 mit 0 ≤ r1 < m
(3.79)
v = q2 · n + r2 mit 0 ≤ r2 < n
Dann gibt es eine ganze Zahl w ∈ ZZ , die bei Teilung durch m bzw. durch n ebenfalls
die Reste r1 und r2 aus (3.79) liefert:
w = q̃1 · m + r1
(3.80)
w = q̃2 · n + r2
Eine Zahl w ∈ ZZ mit dieser Eigenschaft ist bis auf Vielfache von m · n eindeutig
bestimmt.
169
Bemerkung: Die Aussage (3.80) bedeutet, daß man zu vorgegebenen Werten u und v
eine ganze Zahl w finden kann, die sowohl bei Teilung durch m als auch bei Teilung
durch n jeweils denselben Rest wie u bzw. wie v ergibt. Man bezeichnet dieses als Lösen
simultaner Kongruenzen
Beispiel: Für m = 4, n = 17 sowie u = 3, v = 8 ist w = 59 ein Lösung von (3.80).
Für die folgenden Anwendungen wird es sich wieder als sehr günstig erweisen, daß die
Berechnung der Lösung zum Chinesischen Restsatz sehr einfach ist und außerdem keinen
großen Aufwand erfordert.
Beweis und Berechnung des Chinesischen Restsatzes: Man verwendet den erweiterten
euklidischen Algorithmus (siehe (3.46)) und bestimmt mit diesem a, b ∈ ZZ mit
1 = a·m + b·n (3.81)
Damit kann man das w aus (3.80) berechnen:
w = v·a·m + u·b·n (3.82)
(3.82) liefert die Lösung zu (3.80). Mit diesem so definierten w ∈ ZZ berechnet man
nämlich in der Tat
w = v · a · m + u · (b · n) Nach (3.81) ist b · n = 1 − a · m;
dieses wird hier eingesetzt.
= v·a·m + u − u·a·m
= u + (v · a − u · a) · m Und hier kann man u = q1 ·m+r1
einsetzen (siehe (3.79)).
= q1 · m + r1 + (v · a − u · a) · m
= (q1 + v · a − u · a) ·m + r1 Dieses ist die erste Gleichung aus
(3.80).
| {z }
q̃1
Ebenso zeigt man die zweite Gleichung aus (3.80).

Es muß noch die Eindeutigkeit von w bis auf Vielfache von m · n gezeigt werden. Sei
dazu w1 ∈ ZZ eine weitere ganze Zahl, die entsprechende Gleichungen wie (3.80) erfüllt.
Man subtrahiert nun einfach die entsprechenden Gleichungen:
w1 = q̂1 · m + r1 w1 = q̂2 · n + r2
− w = q˜1 · m + r1 − w = q˜2 · n + r2
(w1 − w) = (q̂1 − q˜1 ) · m (w1 − w) = (q̂2 − q˜2 ) · n
⇔ m | (w1 − w) und n | (w1 − w)

⇔ (m · n) | (w1 − w) (wegen ggT(m, n) = 1, siehe (3.57))
⇔ (w1 − w) = k · m · n mit einem k ∈ ZZ
⇔ w1 = w + k · m · n d. h. w1 und w unterscheiden sich
in der Tat nur um eine Vielfaches
qed.
von m · n.
170
Beispiel: Zu m = 4, n = 17 sowie u = 3, v = 8 berechnet man zunächst (siehe auch
Seite 162)
1 = (−4) · 4 + 1 · 17
und setzt
w = 8 · (−16) + 3 · 17 = −77
w ist eine Lösung zu den vorgegebenen Werten bezüglich des Chinesischen Restsatzes.
Ändert man w um Vielfache von 4 · 17 = 68 ab, so bleibt w eine Lösung; als kleinste
positive Lösung erhält man damit
w = −77 + 2 · 68 = 59
Wie man nachrechnet, ist in der Tat 59 = 14 · 4 + 3 und 59 = 3 · 17 + 8.
Mit dem so formulierten Chinesischen Restsatz kann die Erweiterung des zu Beginn
dieses Abschnitts erläuterten Problems (siehe Seite 169) gelöst werden:
1. Zu dem gegebenen m ∈ IN bestimmt man drei natürliche Zahlen
n1 , n2 , n3 ∈ IN
mit folgenden Eigenschaften:
ni < m für i = 1, 2, 3 (3.83)

m < ni · nj für 1 ≤ i < j ≤ 3 (3.84)
1 = ggT(ni , nj ) für 1 ≤ i < j ≤ 3 (3.85)
2. Man berechnet
m = qi · ni + ri für i = 1, 2, 3 (3.86)
3. Jede der drei Personen erhält ein Wertepaar
(ri , ni ) (3.87)
Die i-Person weiß zwar, daß die Gleichung (3.86) besteht; wegen (3.83) hat sie aber keine
Chance, daraus m zu ermitteln. Nun sei angenommen, die erste und die zweite Person
kommen zusammen. Sie berechnen dann mit dem Chinesischen Restsatz ein M ∈ ZZ
mit
M = q̃1 · n1 + r1
(3.88)
M = q̃2 · n2 + r2
Da der zunächst noch unbekannte Wert m die entsprechenden Gleichungen (3.86) erfüllt,
können sich nach dem Chinesischen Restsatz M und m nur um ein Vielfaches von n1 · n2
unterscheiden; d. h. es muß gelten:
M = m + c · (n1 · n2 ) mit c ∈ ZZ (3.89)
171
Da weiterhin gemäß (3.84) noch 0 < m < (n1 · n2 ) bekannt ist, kann m nun bestimmt
werden: Man teilt dazu einfach M durch n1 · n2 , der Divisionsrest ist dann m.18
Beispiel: Der geheime Wert sei m = 1234. Dazu werden die drei Zahlen n1 = 41, n2 = 53
und n3 = 61 ausgewählt. Die Bedingungen (3.83), (3.84), (3.85) sind damit erfüllt. Man
führt nun die Divisionen mit Rest durch:
1234 = 30 · 41 + 4, 1234 = 23 · 53 + 15, 1234 = 20 · 61 + 14
und übergibt jeder der drei Personen eines der Wertepaar
(4, 41), (15, 53), (14, 61)
Keine der drei Personen kann daraus alleine den Werte n = 1234 ermitteln. Angenom-
men, die erste und die zweite Personen kommen zusammen. Sie wenden den Chinesischen
Restsatz an und berechnen damit:
22 · n1 − 17 · n2 = 1 (erweiterter euklidischer Algorithmus)
15 · 22 · n1 − 4 · 17 · n2 = 9926 (chinesischer Restsatz)
4 · n1 · n2 + 1234 = 9926 (Teilung mit Rest)
In der letzten Zeile erscheint als Divisionsrest der geheime Wert n. Jetzt kommen die
erste und die dritte Person zusammen:
3 · n1 − 2 · n3 = 1 (erweiterter euklidischer Algorithmus)
14 · 3 · n1 − 4 · 2 · n3 = 1234 (chinesischer Restsatz)
Hier erscheint sofort der geheime Wert; eine Teilung mit Rest durch n1 · n3 war nicht
mehr notwendig. Die zweite und die dritte Person berechnen zusammen:
−23 · n2 + 20 · n3 = 1 (erweiterter euklidischer Algorithmus)

14 · (−23) · n2 + 15 · 20 · n3 = 1234 (chinesischer Restsatz)
Auch hier erscheint ohne weitere Division bereits der geheime Wert.
Auf Seite 169 wurde nur eine einfache Version des Chinesischen Restsatzes angegeben.
Der vollständige Chinesische Restsatz, der nicht nur den Fall zweier Reste sondern den
Fall einer beliebigen Anzahl von Resten behandelt, lautet:
Satz: Gegeben seien m1 , m2 , . . . , mk ∈ IN , k ≥ 2 mit
ggT(mi , mj ) = 1 für 1 ≤ i < j ≤ k (3.90)
Weiterhin seien u1 , u2 , . . . , uk ∈ ZZ gegeben. Ist dazu für i = 1, . . . , k
ui = qi · mi + ri mit 0 ≤ ri < mi (3.91)

18
Siehe [8], dort wird dieses für eine beliebige Personenzahl erläutert.
172
so gibt es ein w ∈ ZZ mit
w = q̃i · mi + ri für i = 1, . . . , k (3.92)
w ist bis auf Vielfache von (m1 · m2 · . . . · mk ) eindeutig bestimmt.
Bemerkung: Die Bedeutung ist entsprechend wie beim einfachen Chinesischen Restsatz:
Man kann unter den gegebenen Voraussetzungen eine Zahl w finden, die bei Teilung
durch mi jeweils denselben Rest wie ui ergibt.
Beweisskizze des vollständigen Chinesischen Restsatzes: Eine vollständige Induktion

über k, die Anzahl der Rest u1 , . . . , uk wird durchgeführt.
Induktionsanfang: Sei k = 2. Dann folgt die Behauptung aus dem einfachen“ Chinesi-
”
schen Restsatz auf Seite 169.
Induktionsschluß: Sei k > 2. Die Behauptung sei für k − 1 bereits bewiesen. Da die k − 1
Werte m1 , m2 , . . . , mk−1 ∈ IN die Voraussetzung (3.90) erfüllen, gibt es ein ŵ ∈ ZZ mit
ŵ = q̂i · mi + ri für i = 1, . . . , k − 1 (3.93)
Zur Abkürzung sei M = m1 · m2 · . . . · mk−1 . Der Wert ŵ aus (3.93) ist dann bis auf
Vielfache von M eindeutig bestimmt. Da die m1 , m2 , . . . , mk−1 zu mk teilerfremd sind,
sind auch M und mk teilerfremd (siehe (3.60)). Setzt man jetzt noch
ŵ = q̂ · M + r̂ (3.94)
so gibt es aufgrund des einfachen“ Chinesischen Restsatzes ein w ∈ ZZ mit

”
w = q · M + r̂
(3.95)
w = q̃k · mk + rk
Man rechnet nun leicht nach, daß (3.92) von w erfüllt wird. Außerdem ist w bis auf
Vielfache von M · mk =m1 · m2 · . . . · mk−1 · mk eindeutig bestimmt. qed.
3.3 Gruppen, Ringe, Körper

3.3.1 Grundlegende Definition
3.3.1.1 Einführung
Im vorherigen Abschnitt wurden einige bedeutsame Eigenschaften der ganzen Zahlen ZZ
hergeleitet. Dazu gehört ganz wesentlich die Möglichkeit, Rechnungen, wie sie etwa der
euklidische Algorithmus sowie der Chinesische Restsatz erlauben, durchzuführen.
Die Herleitung des euklidischen Algorithmus sowie des Chinesische Restsatzes beruhten
vor allem auf zwei Dingen:
• die Grundrechenarten mit ihren Rechengesetzen
• der Teilung mit Rest
173
Aber man stellt fest, daß es noch weitere Bereiche gibt, bei denen entsprechende Grund-
rechenarten mit entsprechenden Rechengesetzen wie bei den ganzen Zahlen anzutreffen
sind. Ein wichtiges Beispiel dafür bildet die bekannte Menge der Polynome mit reellen
Koeffizienten; man schreibt dafür
IR[X] = an X n + an−1 X n−1 + . . . + a1 X + a0 | ai ∈ IR

(3.96)
Entscheidend kommt hinzu, daß auch hier eine Teilung mit Rest möglich ist. Diese
Teilung mit Rest verwendet den Grad eines Polynoms. Für ein Polynom
p(X) = an X n + an−1 X n−1 + . . . + a1 X + a0 mit an 6= 0 (3.97)
setzt man bekanntlich
grad(p(X)) = n (3.98)
Nach ist (3.98) der Grad gerade der größte vorkommende Exponent der Unbestimmten
X in dem Polynom p(X). Damit kann die Teilung mit Rest für reelle Polynome
formuliert werden:
Satz: Seien p(X), s(X) ∈ IR[X] mit q(X) 6= 0. Dann gibt es Polynome q(X), r(X) ∈
IR [X] mit
p(X) = q(X) · s(X) + r(X) dabei ist grad(r(X)) < grad(s(X)) (3.99)
Da somit ähnliche Grundvoraussetzungen wie bei den ganzen Zahlen anzutreffen sind,
kann hier ein Großteil der Betrachtung des vorherigen Abschnitts übertragen werden.
Dazu gehören u. a. der euklidische Algorithmus sowie der Chinesische Restsatz. An
die Stelle der Primzahlen treten hier die Polynome, die sich nicht als Produkt von
Polynomen kleineren Grades schreiben lassen, wie z. B. p(X) = X + 3 oder p(X) =
X 2 + 1.
Man könnte jetzt beginnen, zahlreiche Überlegungen und Herleitungen des letzten Ab-
schnitts noch einmal für reelle Polynome und u. U. weitere Male für weitere Bereiche,
bei denen ebenfalls die entsprechenden Voraussetzungen vorliegen, durchzuführen. Bes-
ser und üblich ist jedoch eine andere Vorgehensweise:
• Man versucht, die Betrachtungen möglichst einheitlich durchzuführen.
• Man nimmt dazu Verallgemeinerungen vor, die es gestatten, verschiedene Bereiche

mit sich entsprechenden Eigenschaften unter einem Blickwinkel zu betrachten.
• Im vorliegenden Fall geht man nur von der Voraussetzung aus, daß bestimmte
Grundrechenarten mit gewissen Rechenregeln vorhanden sind.19
Die angestellten Betrachtungen sind dann in gleichem Maße für alle Bereiche
gültig, die diese Voraussetzung erfüllen.
Mengen, für deren Elemente gewisse Rechenoperationen möglich sind und bei denen
zusätzlich noch gewisse Rechenregeln erfüllt werden, bezeichnet man als algebraische
Strukturen.
19
Die Teilung mit Rest wird zunächst zurückgestellt.
174
Führt man seine Betrachtung für allgemeine algebraische Strukturen durch, so bietet
das neben der Möglichkeit zur Verallgemeinerung den zusätzlichen Vorteil, daß viele
Rechnungen und Überlegungen erheblich vereinfacht werden.20
Im folgenden wird kurz in die folgenden algebraischen Strukturen eingeführt:

• Gruppen,
• Ringen und
• Körper
Eine Gruppe ist eine Menge G, für deren Elemente eine Verknüpfung definiert ist, für
die die folgenden Rechenregeln gelten:
1. Abgeschlossenheit
a, b ∈ G ⇒ a · b ∈ G
2. Assoziativgesetz
a, b, c ∈ G ⇒ (a · b) · c = a · (b · c)
3. neutrales Element
Es gibt ein Element 1 ∈ G
mit a · 1 = a für alle a ∈ G
4. inverses Element
a∈G ⇒ Es gibt dazu ein Element
ã ∈ G mit ã · a = 1
Schreibweise: ã = a−1
5. Ist zusätzlich noch das Kommutativgesetz erfüllt
a, b ∈ G ⇒ a · b = b · a
so spricht man von einer kommutativen Gruppe oder von einer abelschen
Gruppe.
Es ist grundsätzlich bedeutungslos und hängt vom speziellen Einzelfall ab, ob man als
Verknüpfungszeichen wie hier den Malpunkt “·“ oder das Pluszeichen “+“ verwendet.
Im letzten Fall spricht man von einer additiv geschriebenen Gruppe und bezeichnet das
neutrale Element durch Null (“0“) und das Inverse zu einem a ∈ G durch −a. In der
Regel wird jedoch der Punkt “·“ verwendet.
Beispiele für kommutative Gruppen:
• (ZZ , +): die ganzen Zahlen mit der Addition
• (IR \ {0}, ·): die reellen Zahlen ohne die Null mit der Multiplikation
• {ak | k ∈ ZZ }: alle Potenzen der reellen Zahl a mit ganzzahligen Exponenten
20
So läßt sich zum Beispiel durch eine allgemeinere Vorgehensweise der Beweis des Chinesischen
Restsatzes erheblich vereinfachen.
175
Wie man an diesen Beispielen erkennt, gibt es sowohl unendliche als auch endliche
Gruppen. Die letzteren werden im Späteren eine besondere Rolle spielen.
Beispiele für nicht kommutative Gruppen sind:
• die Menge der invertieren Matrizen der Dimension n mit der üblichen Matrizen-
multiplikation als Verknüpfung:
GL(n, IR ) = {A ∈ Mn,n (IR ) | det(A) 6= 0} (3.100)
• die Menge der orthogonalen Matrizen der Dimension n:
O(n, IR ) = A ∈ Mn,n (IR ) | A ◦ At = E

(3.101)
Aufgabe: Man weise nach, daß es sich bei den Mengen (3.100) und (3.101) tatsächlich
um Gruppen handelt.
F
Ein Ring ist eine Menge R, für deren Elemente zwei Verknüpfungen (“+“ und “·“)
definiert sind, für die die folgenden Rechenregeln gelten:
1. Addition
a, b ∈ R ⇒ a + b ∈ R
a, b ∈ R ⇒ a + b = b + a
a, b, c ∈ R ⇒ (a + b) + c = a + (b + c)
Es gibt ein Element 0 ∈ R

mit a + 0 = a für alle a ∈ R
a∈R ⇒ Es gibt dazu ein Element

ã ∈ R mit ã + a = 0
Schreibweise: ã = −a
2. Multiplikation
a, b ∈ R ⇒ a · b ∈ R
(b) Assoziativgesetz
a, b, c ∈ R ⇒ (a·b)·c = a·(b·c)
176
3. Distributivgesetz
a, b, c ∈ R ⇒ a · (b + c) = a · b + a · c
Besitzt der Ring bezüglich der Multiplikation ein neutrales Element:
Es gibt ein Element 1 ∈ R \ {0}
mit a·1 = a für alle a ∈ R
so spricht man von einem Ring mit Eins.
Ist die Multiplikation des Ringes kommutativ:
a, b ∈ R ⇒ a · b = b · a
so spricht man von einem kommutativen Ring
Beispiele für kommutative Ringe mit Eins sind:

R =Z
R = R[X] = { reelle Polynome }
Ein Beispiel für einen nicht kommutativen Ring bilden die quadratischen reellen Ma-
trizen Mn,n (IR ) für n > 1 (Bezeichnung: Matrizenring“) mit der Addition sowie der
”
Matrizenmultiplikation:
Bemerkung: Bezüglich der Addition ist ein Ring eine kommutative Gruppe.
Bemerkung: In einem Ring kann folgendes vorkommen:
• Es kann von Null verschiedene Elemente geben, die bezüglich der Multiplikation
kein Inverses Element besitzen.
• Es kann Nullteiler geben. Das heißt, es kann Elemente a, b ∈ R mit
a·b = 0 und a, b 6= 0 (3.102)
geben.
Ein Beispiel hierfür liefert der Matrizenring Mn,n (IR ) für n > 1.
Hilfssatz: Für einen Ring R gilt
1. Für alle a ∈ R ist a · 0 = 0.
2. Ist R kommutativ mit Eins und a ∈ R invertierbar, so ist a kein Nullteiler.
Der Beweis wird als Aufgabe überlassen. Hinweis zum Beweis der zweiten Aussage: Man
gehe von der Gleichung a · b = 0 mit einem b ∈ R aus.
F
Besitzt in einem kommutativen Ring mit Eins jedes von Null verschiedenes Element
bezüglich der Multiplikation ein Inverses, so bezeichnet man den Ring als Körper.
Bekannte Körper sind
• Q| : die rationalen Zahlen
• IR : die reellen Zahlen
Im folgenden werden noch weitere Körper hergeleitet werden, die sich ebenso wie diese
drei bekannten Körper zahlreiche Anwendungen besitzen.
Bemerkung: Aufgrund des Hilfssatzes von Seite 177 ist ein Körper nullteilerfrei.
177
3.3.1.2 Endliche kommutative Gruppen
In diesem Abschnitt sei G stets eine kommutative Gruppe, die nur endlich viele Elemente
besitzt. Die Anzahl der Elemente sei stets
g = #G (3.103)
Die Anzahl der Elemente einer endlichen Gruppe wird üblicherweise als Ordnung der
Gruppe bzw. als Gruppenordnung bezeichnet. Man schreibt dafür
ord(G) (3.104)
Beispiel: Einige Gruppen mit kleinen Werten für g sind:
g =1 : G = {1}
g = 2 : G = { 1, −1 }
g = 3 : G = { e, u, v }
mit der Verküpfungstabelle : · e u v
e e u v (3.105)
u u v e
v v e u
g = 4 : G = { 1, j, −1, −j } mit 1 als neutralem Element
und den Festsetzungen (−1)2 = 1, j2 = −1, (−1) · j = −j
Wie diese Beispiele zeigen, gibt es sehr kleine Gruppen.
Aufgabe: Man stelle zur eben angegebenen Gruppe mit vier Elementen die vollständige
Verknüpfungstabelle auf.
Ganz zentral bei der Behandlung endlicher Gruppen ist der folgende
Satz: Ist #G = g die Ordnung der Gruppe G, so besteht für jedes Element a ∈ G die
Gleichung.
ag = 1 (3.106)
(3.106) besagt, daß man stehts das neutrale Element der Gruppe erhält, wenn ein be-
liebiges Element der Gruppe mit der Gruppenordnung potenziert
Begründung: Sei wieder g = #G; dann läßt sich G durch eine passende Durchnumme-
rierung ihrer Elemente folgendermaßen darstellen
G = {a1 , a2 , . . . , ag }
Dabei sind die ai genau die g Elemente von G. Sei nun a ∈ G beliebig, dann ist auch
G = {a · a1 , a · a2 , . . . , a · ag }
Denn alle a · a1 , a · a2 , . . . , a · ag sind paarweise verschieden; wäre nämlich
a · ai = a · aj | · a−1
⇒ ai = aj Widerspruch, da ai 6= aj
178
Somit sind die a · a1 , a · a2 , . . . , a · ag genau g verschiedene Gruppenelemente. Folglich
müssen dieses alle Gruppenelemente sein. Weiter gilt (Trick!):
a1 · a2 · ... · ag (Produkt aller Elemente)

= (a · a1 ) · (a · a2 ) · · · · · (a · ag ) (ebenfalls Produkt aller Elemente)
= ag · (a1 · a2 . . . ag ) (G ist kommutativ!)
Also hat man
a1 · a2 · ... · ag = ag · (a1 · a2 . . . ag ) | (a1 · a2 . . . ag )−1

⇒ 1 = ag
qed.
Beispiel: Man betrachte wieder die Gruppe G = {1, −1, j, −j} aus den Beispielen
in (3.105). Hier ist #G = 4, und in der Tat ist
j 4 = (j 2 )2 = (−1)2 = 1
(−1)4 = ((−1)2 )2 = 12 = 1
Wie man am Beispiel von −1 ∈ G erkennt, ist zwar wie zu erwarten,
(−1)g = 1
mit g = 4 = #G. Es gilt aber bereits
(−1)2 = 1
d.h. es gibt bereits einen Exponenten e ∈ N mit 1 ≤ e < g, so daß (−1)e = 1 ist.
Für eine allgemeine endliche (und kommutative) Gruppe G und ein Element a ∈ G
definiert man daher die sogenannte Ordnung von a:
ord(a) = min{e ∈ N|ae = 1} (3.107)
Offensichtlich ist wegen (3.106) ord(a) ≤ g = #G. Darüberhinaus gilt der wichtige
Satz:
ord(a) | g (g = #G) (3.108)
das heißt, die Ordnung eines Gruppenelements ist ein Teiler der Gruppenordnung. Zur
Begründung von (3.108) setzt man für a ∈ G
e = ord(a)
und nimmt eine Teilung mit Rest vor:
g : e = q Rest r
bzw.
g =q·e + r mit 0 ≤ r < e
179
Angenommen, e wäre kein Teiler von g, d. h. der Divisionsrest r wäre ungleich Null,
dann gelte
1 = ag (wegen (3.106))
= aq·e+r (wegen g = q · e + r)
= (ae )q ·ar (da e = ord(a))
| {z }
=1
= 1q · ar = ar
⇒ 1 = ar
Dieses ist ein Widerspruch, denn
1≤r<e
und e = ord(a) ist minimal mit e ≥ 1 und ae = 1. qed.
Beispiel: Bei der Gruppe G = {1, −1, j, −j} aus (3.105) hat man
ord(1) = 1
ord(-1) = 2
ord(j) = 4
ord(-j) = 4
Alle diese Werte sind Teiler von 4 = #G.
Ganz genauso wie den letzten Satz beweist man den folgenden
Zusatz: Seien a ∈ G mit e = ord(a) und k ∈ IN , dann gilt
ak = 1 ⇒ e|k (3.109)
Im letzten Satz wurde dieses für den Spezialfall k = g gezeigt. Dessen Beweis läßt sich
unmittelbar auf diesen Zusatz übertragen.
Bemerkung: Das kartesische Produkt zweier Gruppen ist wieder eine Gruppe. Sind G1
und G2 , so lautet deren kartesisches Produkt
G1 × G2 = {(a, b) | a ∈ G1 , b ∈ G2 } (3.110)
Die Verknüpfung erfolgt komponentenweise:
(a1 , b1 ) · (a2 , b2 ) = (a1 · a2 , b1 · b2 ) (3.111)
Dabei wird in der ersten Komponente die für die Gruppe G1 definierte Multiplikati-
on und entsprechend in der zweiten Komponente die für die zweite Gruppe definierte
Multiplikation ausgeführt. Wegen
(a, b) · (1, 1) = (a · 1, b · 1) = (a, b)
ist (1, 1) das neutrale Elemente der Gruppe G1 × G2 ; dabei ist die Eins in der ersten
Komponente das neutrale Element von G1 , und die in der zweiten Komponente das
neutrale Elemente von G2 .
180
Beispiel: Aus den beiden Gruppen (siehe (3.105))
G1 = { 1, −1 } , G2 = { 1, j, −1, −j }
bildet man das kartesische Produkt

(1, 1), (1, j), (1, −1), (1, −j)

G1 × G2 = (3.112)
(−1, 1), (−1, j), (−1, −1), (−1, −j)
dann gilt wegen (3.105) und (3.106) für jedes Element der Gruppe
(a, b)4 = (a4 , b4 ) = (1, 1)
3.3.2 Restklassenringe über ZZ

3.3.2.1 Einführung und Motivation
Zunächst folgt als Einführung und Motivation die Idee eines asymmetrischen Verfahrens
mit öffentlichem Schlüssel (RSA-Verfahren).
Wichtiger Hinweis: Hier wird wieder nur die Idee erläutert; in der Art, wie das Verfahren
hier beschrieben wird, ist es nicht anwendbar.
Ansatz: Sei e ∈ N möglichst groß, dann gilt
• Wurzelziehen
√
e
y
ist schwer21 und daher gut für Entschlüsselung, die nur für Befugte durchführbar
sein soll.
• Potenzieren mit dem Exponenten e
xe
ist leicht und daher gut für Verschlüsselung.
Das Verfahren:
B kennt irgendwo her“ (siehe später) eine Möglichkeit zum Ziehen der e-ten Wurzel
”
für einen Exponenten e ∈ IN . B nennt diese Möglichkeit bzw dieses Programm k2“.
”
k2 ist Bs privater Schlüssel und wird daher geheim gehalten. k1 = e ist Bs
öffentlicher Schlüssel und wird von B veröffentlicht; jeder kann somit e lesen.
Damit ist eine sicherer Nachrichtenversand an B durch eine beliebige Person A möglich:
• A will B eine vertrauliche Nachricht M senden
• A zerlegt M in Blöcke Mi (z.B. mit einer Größe von 128, 256 oder 512 Bits)
21
zumindest ohne irgendwelche Zusatzinformationen
181
• A will jeden Block Mi einzeln an B senden und faßt dabei Mi als Dualzahl auf,
also:
Mi ∈ N
• Vor dem Versenden erfolgt die Verschlüsselung mit Bs öffentlichem Schlüssel k1

Ci = e(Mi , k1 ) = Mie
• A versendet Ci an B
• B entschlüsselt Ci mit seinem geheimen Schlüssel k2 und erhält Mi :
p
Mi = d(Ci , k2 ) = e Ci
Zum Brechen: Der Angreifer müßte in der Lage sein, für y

√
e
y
zu berechnen. Und in der Tat:
• Dieses ist mit Logarithmus und e-Funktion leicht möglich:
√ 1
e
y = exp( log(y))
e
Diese Funktionen können mit Hilfe ihrer Potenzreihen22 berechnet werden.
• Ohnehin stellt sich die Frage: Wie soll nur eine einzige Person (nämlich B) in der
Lage sein, zu einem gegebenen
e∈N
die e-te Wurzel zu ziehen?
Aber eine Rettung“ des RSA-Systems läßt sich auf folgendem Wege bewerkstelligen:
”
• Keine Verwendung der bekannten Zahlen
• Übergang zu neuen“ Zahlenbereichen, dabei:
”
1. Die Zahlenbereiche sollen endlich sein.
2. Die aus Z bekannten Regeln der Grundrechenarten (+, −, ∗) sollen erhalten
bleiben. Es sollte sich daher um kommutative Ringe mit Eins handeln.
Zur Konstruktion solcher kommutativen Ringe mit Eins, die nur endlich viele Elemente
besitzen, geht man von Z, dem Ring der ganzen Zahlen aus.23
Um solche endlichen Ringe konstruieren zu können, muß als Vorbeitung zunächst der
Begriff der Äquivalenzrelation eingeführt werden.
Unter einer Relation Rel zwischen zwei Mengen A und B versteht man bekanntlich eine
Teilmenge des kartesischen Produktes:
Rel ⊂ A × B (3.113)
22
Potenzreihen werden in der Vorlesung Mathematik 2 für I“ behandelt.
23 ”
Da man zunächst noch keine speziellen Eigenschaften der ganzen Zahlen benötigt, könnten hier die
ersten Teile der Betrachtungen für einen allgemeinen kommutativen Ring mit Eins angestellt werden.
182
Beispiele:
1.
)
A = {alle Personen}
Rel = besitzt“ (3.114)
B = {alle Autos} ”
2. Zu A = B = IR ist Rel = kleiner als“ die durch

”
(x, y) ∈ Rel ⇔ x < y (3.115)
gegebene Relation.
3. Die Relation Rel = hat als Quadrat“ ⊂ IR × IR ist durch

”
(x, y) ∈ Rel ⇔ x2 = y (3.116)
definiert.
Wie die letzten beiden Beispiele zeigen, kann eine Relation nicht nur zwischen zwei
verschiedenen Mengen sondern auch zwischen einer Menge A und sich selber bestehen;
es handelt sich dann um eine Teilmenge von A × A.
Von besonderem Interesse sind Relationen Rel ⊂ A × A, die eine oder mehrere der
folgenden Eigenschaften aufweisen:
1. reflexiv : (x, x) ∈ Rel für alle x ∈ A
2. symmetrisch : (x, y) ⊂ Rel ⇒ (y, x) ⊂ Rel (3.117)
2. transitiv : (x, y), (y, z) ⊂ Rel ⇒ (x, z) ⊂ Rel
Definition: Eine Relation Rel ⊂ A × A mit den drei Eigenschaften (3.117) heißt Äqui-
valenzrelation über A. Man schreibt bei einer Äquivalenzrelation
x ∼ y für (x, y) ∈ Rel (3.118)
Man sagt: x ist äquivalent zu y“.
”
Beispiele: Für A = IR ist
• kleiner oder gleich“ (x ≤ y) keine Äquivalenzrelation, denn die Symmetrie ist

”
verletzt. Die Reflexivität und die Transitivität sind jedoch erfüllt,
• hat als Quadrat“ keine Äquivalenzrelation, denn keine der drei Eigenschaften aus
”
(3.118) ist erfüllt,
• die Relation
Rel = { (x, y) ∈ IR2 | sin(x) = sin(y) } (3.119)
eine Äquivalenzrelation.
183
Aufgabe: Man begründe, daß (3.119) eine Äquivalenzrelation ist.
Beispiel: Für die Menge

A = {alle e-Geldscheine}
ist die Relation
Rel = “aufgedruckt ist derselbe Geldwert“ (3.120)
offensichtlich eine Äquivalenzrelation. Zwei Geldscheine desselben Betrags sind natürlich

gleichwertig.
Um Äquivalenzrelationen für die hier vorgesehenen Zwecke einsetzen zu können, benötigt

man den folgenden Begriff.
Definition: Sei Rel eine Äquivalenzrelation über der Menge A. Dann heißt für x ∈ A die
Menge
x = {y ∈ A | x ∼ y} (3.121)
Äquivalenzklasse von x.
Die Äquivalenzrelation x enthält somit alle zu x äquivalenten Elemente.
Beispiel: Zu der Relation (3.120) besteht die die Äquivalenzklasse
5e-Schein mit Nummer U50685699578 = { alle 5e-Scheine } (3.122)
Definition: Ist Kl ⊂ A eine Äquivalenzklasse zur Äquivalenzrelation Rel ⊂ A × A mit

Kl = x für ein x ∈ A, so heißt x Repräsentant der Äquivalenzklasse Kl.
Beispiel: Der in (3.122) genannte Geldschein ist eine Repräsentant der Menge aller 5e-
Scheine.
Satz: Ist Rel ⊂ A × A eine Äquivalenzrelation über der Menge A, so gilt mit x, y ∈ A
1. x = y ⇔ x ∼ y
2. x ∩ y 6= ∅ ⇔ x ∼ y
(3.123)
3. A ist disjunkte Vereinigung aller Äquivalenz-
klassen zu Rel.
Beweis: Aufgabe!
Eine Äquivalenzrelation bewirkt immer eine Zerlegung der betreffenden Menge. Sind
etwa nur die endlich vielen Äquivalenzklassen a1 , a2 , . . . , ak vorhanden, so ergibt
sich eine Zerlegung der Menge A der Form
184
a1 a2 a4 ··· ak
Abbildung 3.1: Zerlegung der Menge A in Äquivalenzklassen
Beispiel zur Äquivalenzrelation (3.120):
{alle e-Geldscheine} = 5e-Schein mit Nummer U50685699578

∪ 10e-Schein mit Nummer X72591257738
∪ 20e-Schein mit Nummer U83384149955
∪ 50e-Schein mit Nummer V02387040034 (3.124)
∪ 100e-Schein mit Nummer L00105481787
∪ 200e-Schein mit Nummer P00641307178
∪ 500e-Schein mit Nummer S00630387745
Definition: Rel sei eine Äquivalenzrelation über der Menge A. Ist dann P ⊂ A eine
Teilmenge mit den beiden folgenden Eigenschaften
1. x, x0 ∈ P ⇒ x 6∼ x0
2. A =
[
x (3.125)
x∈P
so heißt P Repräsentantensystem der Äquivalenzrelation Rel.

Ein Repräsentantensystem enthält aus jeder Äquivalenzklasse genau ein Element.
Beispiel: In (3.124) ist ein Repräsentantensystem zur Äquivalenzrelation (3.120) aufge-

stellt.
Zu der in Abbildung 3.1 dargestellten Äquivalenzrelation gehört das Repräsentanten-
system a1 , a2 , . . . , ak .
Aufgabe: Geben Sie ein Repräsentantensystem zur Äquivalenzrelation (3.119) an.

F
Jetzt kann der Typ von Äquivalenzrelation definiert werden, der im Folgenden die be-
deutende Rolle spielen wird. Gegeben sei jetzt bis zum Ende dieses Abschnitts stets
• der Ring der ganzen Zahlen Z24 ,

24
Anstelle von Z könnte hier ebenso ein beliebiger kommutativer Ring mit Eins verwendet werden.
185
• ein fest gewähltes Element n ∈ Z \ {0, ±1}
Dazu sei ab jetzt die folgende Relation gegeben (mit a, b ∈ Z):
a ∼ b ⇔ n | (a − b) ⇔ es gibt ein s ∈ Z mit (a − b) = s · n

(3.126)
⇔ a = b + s · n mit einem s ∈ Z
Man erkennt sofort, daß es sich bei (3.126) um eine Äquivalenzrelation handelt. Zum
Nachweis der Transitivität zeigt man:
a ∼ b, b ∼ c ⇒ n | (a − b) und n | (b − c)

⇒ n | (a − b) + (b − c)
| {z }
=a−c
⇒ n | (a − c)
⇒ a ∼ c
Der Nachweis der Symmetrie und der Reflexivität wird als Aufgabe überlassen.
Für die Äquivalenzrelation (3.126) besteht eine besondere Schreibweise. Sind a, b ∈ Z

äquivalent, d. h. ist a ∼ b bezüglich (3.126), so schreibt man dafür
a ≡ b mod n (3.127)
und sagt a ist kongruent b modulo n“. Ein zugehöriges Repräsentantensystem nennt
”
man Repräsentantensystem modulo n oder auch Restsystem modulo n.
Beispiel:
• n = 10: 5 ≡ 55 mod 10
• n = 6: 2 ≡ −10 mod 6
Beispiel: Zwei Tage sind bezüglich des Arbeitslebens und des sonstigen sozialen Lebens
gleichwertig. Das betrifft zum Beispiel Stundenpläne an einer Hochschule und Fahrpläne
bei der Eisenbahn. Numeriert man alle Tag durch – ein typischer Beginn für diese Nu-
merierung ist der 01.01.1900 – so sind in diesem Sinne zwei Tage gleichwertig, wenn sich
ihre Tagnummern um ein Vielfaches von 7 unterscheiden. Bei Tagnummern a und b ist
somit oft die Kongruenz a ≡ b mod 7 von Interesse. Die sieben Wochentage Montag“,
”
Dienstag“, . . ., Sonntag“ stellen die Äquivalenzklassen dar.
” ”
Für a ∈ Z besitzt die zugehörige Äquivalenzklasse die Gestalt
a = {b ∈ Z | a ≡ b mod n}
= {a + s · n | s ∈ Z} (3.128)
186
Die Äquivalenzklassen dieser Äquivalenzrelation werden als Restklassen bezeichnet.
Die Menge der Äquivalenzklassen der Äquivalenzrelation (3.126) wird eine große Rolle
spielen. Daher trifft man die folgende
Definition:

Menge der Restklassen der Rela-
Zn = (3.129)
tion (3.126) bezüglich n
Über Zn folgt ein sehr zentraler

Satz: Die Menge Zn , der Restklassen bezüglich n bildet einen kommutativen Ring mit
Eins; die Verknüpfungen erfolgen repräsentantenweise:
a + b = a+b (3.130)
a · b = a·b (3.131)
Beweis: Zu zeigen ist, daß die durch (3.130), (3.131) definierten Verknüpfungen wohlde-
finiert sind. Das heißt, stellt man die auf der rechten Seite von (3.130), (3.131) stehen-
den Restklassen durch andere Repräsentanten dar, so liefern die durch (3.130), (3.131)
definierte Addition und Multiplikation als Ergebnisse wieder dieselben Restklassen.
Hat man etwa a = c sowie b = d , so ist nachzurechnen, daß gilt
a + b = c + d ⇔ a+b = c+d
⇔ a+b ∼ c+d
(3.132)
a · b = c · d ⇔ a·b = c·d
⇔ a·b ∼ c·d
Um nun (3.132) zu begründen, sei mit s, t ∈ Z
c = a + s · n und d = b + t · n (3.133)
Dann folgt
c + d = a+s·n + b+t·n
= (a + b) + (s + t) · n
⇒ c+d ∼a+b ⇔ c+d = a+b
c · d = (a · n) · (b + t · n)
= a · b + (a · t + s · b + s · t · n) · n
⇒ c·d ∼a·b ⇔ c·d = a·b
Damit wurden beide Aussagen in (3.132) nachgerechnet. qed.
F
Weiterhin gilt für den Ring Zn :
Nullelement in Zn :
0 = s·n mit beliebigem s ∈ Z (3.134)
Negatives zu a
−a denn a + −a = a + (−a) = 0 (3.135)
187
Einselement in Zn :
1 = 1+s·n mit beliebigem s ∈ Z (3.136)
Beispiel: Sei n = 3. Für jedes a ∈ Z liefert die Teilung mit Rest
a = q·n + r mit r = 0, 1 oder 2 (3.137)
a ist daher zu einer der drei Zahlen 0, 1 oder 2 kongruent modulo 3. Da andererseits
diese drei Zahlen zueinander nicht kongruent modulo 3 sind, bilden sie ein Restsystem
modulo 3, also hat man mit der Bezeichnung (3.129)
ZZ3 = { 0 , 1 , 2 } (3.138)
Damit berechnet man:

2
1 = 1 · 1 = 1·1 = 1
2
(3.139)
2 = 2 · 2 = 2·2 = 4 = 1
Damit folgt etwa: Ist a ∈ ZZ nicht durch 3 teilbar, also a = 1 oder a = 2 , so ist
a2 = 1 , d. h. a2 = 1 + s · 3. Damit wurde gezeigt, daß jede Quadratzahl entweder ein
Vielfaches von 3 ist oder mit Rest 1 durch 3 teilbar ist.
Beispiel und Aufgabe: Sei n = 10.
ZZ10 = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } (3.140)
Welche der Restklassen aus (3.140) sind Ergebnis der folgenden Rechnungen?
• − 6 = ?
• 7 + 8 = ?
• 3 · 7 = ?
• 2 · 5 = ?
3.3.2.2 Weitere Bezeichnungen und Endlichkeit

Bemerkung: Die im letzten Abschnitt durchführten Betrachtungen hätten anstelle von
Z mit einem beliebigen kommutativen Ring R mit Eins durchgeführt werden können;
bedeutsam ist z. B. der Fall R = R[X] (Ring der reellen Polynome). Für diesen und die
folgenden Abschnitte trifft das jedoch nicht mehr zu; es wird davon ausgegengen, daß
den folgenden Betrachtungen der Ring Z zu Grunde liegt.
Satz: Zu jedem a ∈ Z gibt es genau ein r ∈ Z mit 0 ≤ r < n so daß gilt
a ∼ r d. h. a ≡ r mod n (3.141)
188
Begründung: Man nimmt eine Teilung mit Rest (siehe (3.14)) vor:
a = k·n + r mit eindeutigem r mit 0 ≤ r < n (3.142)
Insbesondere gilt dann n | (a − r) und daher a ∼ r bzw. a ≡ r mod r. qed.
Wichtige Folgerung: Die n Werte
0, 1, . . . , n − 1 (3.143)
bilden ein Restsystem modulo n (siehe Seite 186 sowie (3.125)).

Begründung: Nach (3.142) ist jedes a ∈ ZZ genau zu einem r mit 0 ≤ r < n kongruent
modulo n. qed.
Bezeichnung: Man nennt (3.143) kleinstes nicht negatives Restsystem modulo n.
Für die Äquivalenzklasse von a ∈ Z bedeutet dieses:
a = {b ∈ Z | a ≡ b mod n} (die Menge aller zu a äquivalenten Elemente)

= Äquivalenzklasse zu a
= r mit 0 ≤ r < n, a ∼ r (gemäß (3.141))
Für die Menge der Äquivalenzklassen ergibt sich damit
Zn = {Menge der Äquivalenzklassen a mit a ∈ Z}

= { 0 , 1 , 2 , ..., n − 2 , n − 1 } (wegen (3.143)) (3.144)
Insbesondere besitzt Zn nur n Elemente und ist damit endlich.
Beispiel: Z6 = { 0 , 1 , 2 , 3 , 4 , 5 }
Zusammenfassend gilt:
a = b
⇔ a∼b
(3.145)
⇔ a ≡ b mod n
⇔ n|a − b
Der große Vorteil und Nutzen von Zn ergibt sich durch die folgende Tatsache:
Zn ist ein endlicher kommutativer Ring mit Eins.
Wie im Abschnitt 3.3.2 gesehen, erfolgen die Addition und die Multiplikation in Zn
repräsentantenweise.
Für kleine Werte von n lassen sich die Addition und die Multiplikation durch Ver-
knüpfungstabellen darstellen.25
25
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.
189
Beispiel: Die Verknüpfungstabellen für n = 3 lauten:
Addition:
+ 0 1 2
0 0 1 2
1 1 2 0
2 2 0 1
Multiplikation:
· 0 1 2
0 0 0 0
1 0 1 2
2 0 2 1
Beispiel: (27 · 53) mod 7 = 27 · 53 =

−1 · 4 = −4 |{z}
= 3
+1·7
6 · 4 = 24 |{z}
= 3
−3·7
Bemerkung: Allgemein gilt in Zn :
1 + · · · + 1} = 0
|1 + 1 + {z
n-mal
Bemerkung: Die übliche Potenzschreibweise wird entsprechend in ZZ n angewandt:
ae = ( a )e = |a · a{z· · · · a}
e-mal
Bezeichnung: Die Zuordnung, die jedem a ∈ ZZ seine Restklasse a zuweist:
a 7→ a (3.146)
heißt Restklassenabbildung.
F
Bemerkung: Neben dem kleinsten nicht negativen Restsystem (3.143) ist zusätzlich das
dem Betrage nach kleinste Restsystem von Bedeutung:
für gerades n : −n n n
2 , − 2 + 1, . . . , 0 . . . , 2 − 1
(3.147)
für ungerades n : −n − 1 n−1
2 , − 2 + 1, . . . , 0 . . . , 2
n−1
Aufgabe: Man zeige, daß es sich bei (3.147) tatsächlich um Restsysteme modulo n han-
delt.
190
Als Anwendung soll ein 16-Bit-Rechenwerk26 betrachtet werden. Werden mit einem 16-
Bit-Rechenwerk zwei zu große“ Zahlen addiert, so kann es zu einem Übertrag über
”
die 16-te Stelle hinauskommen. Dieser höchste Übertrag wird abgeschnitten und damit
beim Ergebnis ignoriert; z. B.:
11100000 00000011 =
ˆ 57347
00100000 00001110 =
ˆ 8206
1 00000000 00010001 (3.148)
↑
fällt weg
Das führt natürlich zu einer Veränderung des Ergebnisses:
57347 + 8206 = 65553 tatsächliches Ergebnis

→ 17 vom Rechenwerk geliefertes (3.149)
Ergebnis
Liefert das Rechenwerk damit ein falsches Ergebnis? Nein, das Rechenwerk arbeitet
korrekt. Die Rechnungen verlaufen allerdings nicht in ZZ sondern in dem Restklassenring
ZZn mit n = 216 = 65536 (3.150)
Durch Abschneiden der Bits an der 17-ten und noch höheren Stellen erfolgt immer eine
Veränderung um ein Vielfachen27 von 216 . Das bedeutet für das Beispiel (3.148), (3.149)
57347 + 8206 ≡ 17 mod 216

(3.151)
⇔ 57347 + 8206 = 17 (als Restklassen in ZZ216 )
Intern stellt dabei das Rechenwerk jede Restklasse durch ihren kleinsten nicht negativen
Repräsentanten (siehe (3.143)) dar.
Der Bediener möchte als Ergebnis jedoch keine Restklasse erhalten sondern eine ganze
Zahl. Deshalb stellt sich die Frage, in welcher Weise die intern vom Rechenwerk als
Restklassen behandeltet Werte nach außen hin dargestellt werden. Dazu bestehen für
die Restklassen zwei Deutungsmöglichkeiten:
1. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem kleinsten
nicht negativen Restsystem (3.143):
0 ↔ 0, 1 ↔ 1, 2 ↔ 2, . . . , 216 − 1 ↔ 216 − 1 (3.152)
Diese Deutung liegt den
unsigned int -Datentypen
zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des kleinsten nicht negativen Restsystems (3.143) bewegt. Andernfalls kommt es
durch Überläufe zu Ergebnisverfälschungen. Insbesondere rechnet man dann nur
mit positiven Zahlen zuzüglich der Null.
26
Das Folgende kann sinngemäß auf andere Bitlängen übertragen werden.
27
Nach (3.27) besitzt die Ziffer an der 17-ten Stelle die Wertigkeit 216 , die noch höheren Ziffern
besitzen entsprechend eine noch höhere Wertigkeit der Form 216+t mit t ∈ IN .
191
2. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem betragsmäßig
kleinsten Restsystem (3.147). Für die unteren Restklassen von 0 bis 216 /2 − 1 =
215 − 1 ändert sich nicht, man identifiziert nach wie vor
0 ↔ 0
1 ↔ 1
.. (3.153)
.
215 − 1 ↔ 215 − 1
Die folgenden Restklassen von 215 − 1 bis 216 − 1 werden mit negativen Werten
identifiziert; bei Beachtung von 215 = 216 − 215 bedeutet dieses:
215 = 216 − 215 ↔ −215

215 + 1 = 216 − 215 + 1 ↔ 1 − 215
215 + 2 = 216 − 215 + 2 ↔ 2 − 215
.. .. (3.154)
. .
215 + 215 − 3 = 216 − 215 + 215 − 3 ↔ −3
215 + 215 − 2 = 216 − 215 + 215 − 2 ↔ −2
215 + 215 − 1 = 216 − 215 + 215 − 1 ↔ −1
Allgemein lautet dieses für a ∈ Z mit 215 ≤ a ≤ 216 − 1:
a = a − 216 ↔ a − 216 (3.155)
Diese Deutung nennt man Zweierkomplement, sie liegt den
int -Datentypen
zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des Restsystems (3.147) bewegt. Hiermit wird das Rechnen mit negativen Zahlen
innerhalb der gegebenen Grenzen ermöglicht.
Betrachtet man mit dieser Deutung noch einmal die Rechnung (3.149), (3.151), so ist
die Restklasse von 57347 wegen 57347 ≤ 215 = 32768 als
57347 − 216 = 57347 − 65536 = −8189
zu deuten. Die Rechnung (3.149) lautet mit dieser Deutung
−8189 + 8206 = 17
Und dieses wird in der Tat vom Rechenwerk geliefert.
Beispiel: 3 wird intern durch 3 und −3 durch den zugehörigen positiven Repräsentanten
216 − 3 der Restklasse von −3 dargestellt. Das Rechenwerk liefert dann wie erwartet
3 + (216 − 3) = 216
(3.156)
≡ 0 mod 216 → 0 (geliefertes Ergebnis)
192
Auch die vom Rechenwerk durchgeführte Multiplikation ist die Multiplikation im Rest-
klassenring ZZ n mit n = 216 , denn durch Überläufe kommt es auch hier nur zum
Abschneiden der Bits ab der 17-ten Stelle, was wiederum nur eine Veränderung um ein
Vielfaches von 216 bewirkt.
Beispiel: Die Zahlen −3 und −5 werden intern durch 216 − 3 und 216 − 5 dargestellt. Die
Multiplikation erfolgt erwartungsgemäß:
(216 − 3) · (216 − 5) = 232 − 8 · 216 + 15

(3.157)
≡ 15 mod 216 → 15 (geliefertes Ergebnis)
Für 3 und −5 ist entsprechend
3 · (216 − 5) = 3 · 216 − 15
(3.158)
≡ −15 mod 216 → −15 (geliefertes Ergebnis)
Beispiel: In dem folgenden C-Programm werden intern als 16-stellige Dualzahlen dar-
gestellte Zahlen einmal als vorzeichenlose Werte und einmal als Werte mit Vorzeichen
ausgegeben:
#include <stdio.h>
int main(){
unsigned short int a=1;
unsigned short int b=65533; // = 2^(16)-3
printf(" %hu + %hu = %hu\n",a,b, a+b);
printf(" %hd + %hd = %hd\n",a,b, a+b);
printf("%hu + %hu = %hu (*)\n",10*a,b,10*a+b);

printf("%hd + %hd = %hd\n",10*a,b,10*a+b);
return 0;
}
------------------------------------------------
Ausgabe:
1 + 65533 = 65534
1 + -3 = -2
10 + 65533 = 7 (*)
10 + -3 = 7
Der mit (*)“ gekennzeichnete Wert ist nicht das Ergebnis einer korrekten Ganzzahlad-
”
dition. Faßt man ihn jedoch als Ergebnis einer Addition in ZZn mit n = 216 auf, so ist er
korrekt.
Bemerkung: Die Darstellung der negativen Zahlen durch (3.154) besitzt den Vorteil, daß
jede negative Zahl intern durch eine Bitkette dargestellt wird, an deren höchsten Stelle
ein 1 steht. Da umgekehrt nach (3.153) bei den positiven Zahlen und der Null dieses Bit
Null ist, wirkt dieses Bit wie ein Vorzeichenbit.
193
3.3.2.3 Die Einheitengruppe
Der Restklassenring ZZn besitzt mit 1 , der Restklasse von 1 ein neutrales Element der
Multiplikation. Das wirft die Frage auf, ob ein Element a ∈ ZZ n \ { 0 } ein inverses
Element bezüglich der Multiplikation besitzt oder nicht.
Daß beide Fälle auftreten können, zweigt das folgende
Beispiel: Man betrachte n = 10 und dazu
Zn = { 0 , 1 , . . . , 9 }
Invertierbar ist u. a. 7 , genauer gilt:

−1
7 = 3
Wie man nachrechnet, ist nämlich
7 · 3 = 7·3
= 21
⇔ 7 · 3 = 1 + 2 · 10 (3.159)
⇔ 7·3 ≡ 1 mod 10
⇔ 7·3 = 1
Andererseits ist die Restklasse 5 6= 0 nicht invertierbar. Angenommen, es gäbe eine

inverse Restklasse a zu 5 , so wäre
1 = a · 5 (3.160)
Multipliziert man beide Seiten von (3.160) mit 2 , so folgt:
1 · 2 = a · 5 · 2
⇔ 2 = a · 10 = a · 0 = 0 (3.161)
⇔ 2 = 0
Das ist ein Widerspruch, denn offensichtlich ist 2 kein Vielfaches von 10 und daher
2 6= 0 .
Angeregt durch dieses Beispiel trifft man die folgende, hier allgemein gefaßte
Definition: Für einen Ring R mit Eins setzt man
R∗ = { a ∈ R | a ist invertierbar } (3.162)
und nennt R∗ die Einheitengruppe von R. Die Elemente von R∗ heißen Einheiten.28
28
Man beachte, daß bei dieser Definition nicht verlangt wird, daß der Ring kommutativ ist. Das
Vorhandensein der Eins ist natürlich notwendig.
194
Wie das Beispiel von eben gezeigt hat, ist
7 ∈ ZZ∗10 , aber 5 6∈ ZZ∗10
Es folgen noch einige Beispiele für Einheitengruppen bei weiteren Ringen mit Eins:
• Z∗ = {±1}
• R∗ = R \ {0}
• Menge der reellen Polynome R[X]∗ = R∗ = R \ {0}
• Menge der reellen umkehrbaren Matrizen Mn,n (IR)∗ = GL(n, IR) (siehe (3.100))
Wann ist eine Restklasse a ∈ ZZn invertierbar? Auskunft gibt der folgende
Satz: Sei a ∈ ZZn . Dann gilt
a ist invertierbar ⇔ ggT(a, n) = 1 (3.163)
Beweis: a ist genau dann invertierbar, wenn es ein u mit a · u = 1 gibt; damit zeigt
man:
a·u = 1
⇔ a·u ∼ 1
⇔ a·u = 1+k·n
⇔ 1 = a·u−k·n
⇔ 1 = a · u + (−k) · n Man beachte: Dieses ist genau die
ggT-Darstellung von a und n.
⇔ ggT(a, n) = 1
qed.
Wie berechnet man für eine invertierbare Restklasse das inverse Element? Hierzu steht
eine sehr gute Berechnungsmethode zur Verfügung. Diese Berechnungsmethode spielt
eine wichtige Rolle bei vielen Anwendungen.
Berechnung der inversen Restklasse: Gegeben sei die Restklasse a ∈ ZZn mit a ∈ ZZ .
1. Zunächst wendet man den erweiterten Euklidischen Algorithmus (siehe Seite 3.48)
auf a und n an und erhält damit die ggT-Darstellung
u · a + v · n = ggT(a, n) mit u, v ∈ ZZ (3.164)
(siehe (3.47)). Ist in (3.164) der größte gemeinsame Teiler größer als Eins, so
ist a nach (3.163) nicht invertierbar. Andernfalls kann man mit dem 2. Schritt
fortfahren.
2. Im Falle von ggT(a, n) = 1 weiß man, daß a invertierbar ist, und der Koeffizient
u in (3.164) liefert die inverse Restklasse:
−1
a = u mit u aus (3.164) (3.165)
195
Begründung von (3.165): Nach Annahme hat man in (3.164)
u·a + v·n = 1
⇒ u·a = 1 − v·n
⇒ u·a ≡ 1 mod n
⇒ u·a = u · a = 1
−1
⇒ u = a
qed.
Beispiel: Sei n = 20, dann ist
ZZ∗20 =

1 , 3 , 7 , 9 , 11 , 13 , 17 , 19 (3.166)
denn dieses sind offensichtlich genau die Restklassen zu teilerfremden Resten modulo
20. Mit dem erweiterten euklidischen Algorithmus – oder falls möglich auf einfacherem
Wege – erhält man die folgenden inversen Restklassen:
−1
1 = 1 klar!
−1
3 = 7 wegen 7 · 3 + (−1) · 20 = 1
−1 −1
7 = 3 da schon 3 = 7 bekannt
−1
9 = 9 wegen 9 · 9 + (−4) · 20 = 1
−1
11 = 11 wegen (−9) · 11 + 5 · 20 = 1
und −9 = 11 , denn 11 = −9 + 20 (3.167)
−1
13 = 17 wegen (−3) · 13 + 2 · 20 = 1
und −3 = 17 , denn 17 = −3 + 20
−1 −1
17 = 13 da schon 13 = 17 bekannt
−1
19 = 19 denn wegen −1 = 19 − 20 ist 19 = −1
und zusätzlich ist −1 · −1 = (−1) · (−1) = 1
Aufgabe: In dem folgen C-Programm liefern zwei Produkte ganzer Zahlen den Wert
eins, obwohl keiner der vorkommenden Faktoren ±1 ist. Wie ist das zu erklären?
#include <stdio.h>
int main(){
unsigned short int a= 2013;
unsigned short int b=34933;
printf("%hu * %hu = %hu\n",a,b,a*b);
printf("%hd * %hd = %hd\n",a,b,a*b);
return 0;
}
---------------------------------------
196
Ausgabe :
2013 * 34933 = 1
2013 * -30603 = 1
Es gilt folgender wichtiger Sachverhalt, der auch wieder für allgemeine Ringe mit Eins
formuliert wird:
Satz: Die Einheitengruppe R∗ eines Ringe R mit Eins ist eine Gruppe.
Beweis: Zum Nachweis der Tatsache, daß die Menge der invertierbaren Elemente eines
kommutativen Ringes mit Eins eine Gruppe bilden, ist nur noch die Abgeschlossenheit
bezüglich der Verknüpfung ·“ zu zeigen. Seien dazu
”
a, b ∈ R∗
Zu zeigen ist, daß dann auch gilt
(a · b) ∈ R∗
d. h. daß auch
(a · b)
invertierbar ist. Dazu setzt man:
y = b−1 · a−1 (3.168)
Dann gilt:
(a · b) · y = (a · b) · (b−1 · a−1 ) = a · (b · b−1 ) ·a−1 = a · a−1 = 1

| {z }
=1
Die übrigen Gruppenaxiome (siehe Seite 175) sind bereits aufgrund der Ringaxiome
(siehe Seite 176) erfüllt. qed.
∗
Zusatz 1: Ist der Ring R kommutativ, so ist auch seine Einheitengruppe R kommutativ.
Zusatz 2: Ist der Ring R eine endliche Menge, so ist seine Einheitengruppe R∗ eine
endliche Gruppe.
Aus dem letzten Satz und seinen beiden Folgerungen ergibt sich der wichtige Sachverhalt:
Für jedes n ∈ IN , n > 1 ist die Einheitengruppe des Restklassenrings Zn

eine endliche Gruppe.
Diese endliche Gruppe besitzt in der Kryptologie eines sehr große Bedeutung.
R∗ = R \ {0} ist eine Beispiel für eine unendliche Einheitengruppe.
Da es sich bei den Einheitengruppen ZZ ∗n um endliche kommutative Gruppen handelt,

können darauf die Ergebnisse des Abschnitts 3.3.1.2 angewandt werden.
F
197
Eine bedeutende Rolle spielte bei den endlichen kommutativen Gruppen die Gruppen-
ordnung (3.104). Da die Ordnung der Gruppe ZZ∗n von n abhängt, führt man dafür eine
besondere Bezeichnung ein, man setzt:
ϕ(n) = ord(Z∗n ) (3.169)

= #(Z∗n )
= #{r | 0 ≤ r < n, ggT(r, n) = 1}
Die Funktion in (3.169) heißt Eulersche Phi-Funktion. Es handelt sich um eine Funk-
tion, die für alle natürlichen Zahlen, die größer als eins sind, definiert ist:
ϕ : {n ∈ IN | n > 1} 7→ IN (3.170)
Beispiel:
ϕ(2)= 1 : vorhanden ist nur die invertierbare Restklasse 1
ϕ(10)= 4 : vorhanden sind die invertierbaren Restklassen 1 , 3 , 7 , 9
ϕ(11)=10 : vorhanden sind die invertierbaren Restklassen 1 , 2 , 3 , . . . , 9 , 10
Potenziert man ein Element einer endlichen kommutativen Gruppe mit der Gruppen-
ordnung, so erhält man nach (3.106) das Einselement der Gruppe. Wegen (3.169) liefert
das den wichtigen
Satz von Euler: Für a ∈ Z∗n gilt
a ϕ(n) = 1 (3.171)
bzw. anders ausgedrückt, für a, n ∈ N mit 1 = ggT(a, n) gilt
aϕ(n) ≡ 1 mod n (3.172)
Bemerkung Ist n eine Primzahl, so werden die Gleichungen (3.171) bzw. (3.172) als
kleiner Fermatscher Satz bezeichnet.
Für die Kryptologie sind zwei Spezialfälle von besonderem Interesse:
a.) n = p (Primzahl)
b.) n = p · q (Produkt zweier Primzahlen p 6= q)
In beiden Fällen sollen
• die Struktur der Einheitengruppe (Zn )∗ sowie
• der Wert ϕ(n)
genau untersucht bzw. berechnet werden.29
29
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.
198
Beispiele für Z∗n mit n = p oder n = p · q :
Für n = 12 hat man Z∗n = { 1 , 5 , 7 , 11 }; diese Gruppe besitzt die Multiplikationsta-
belle:
· 1 5 7 11
1 1 5 7 11
5 5 1 11 4
7 7 11 1 5
11 11 7 5 1
Man beachte: Der Ring Z12 enthält Nullteiler : Es ist 3 6= 0 und auch 4 6= 0; andererseits
ist jedoch 3 · 4 = 12 = 0.
Für n = 5 hat man Z∗n = { 1 , 2 , 3 , 4 }; diese Gruppe besitzt die Multiplikationstabelle:
· 1 2 3 4
1 1 2 3 4
2 2 4 1 3
3 3 1 4 2
4 4 3 2 1
3.3.2.4 Der Fall n = p

Als erstes soll der Spezialfall n = p mit einer Primzahl p behandelt werden. Hier liegen
zwei Besonderheiten vor, die im folgenden nacheinander erläutert werden sollen.
Die erste Besonderheit ergibt sich dadurch, daß die Zahlen
1, 2, · · · , p − 1
alle teilerfremd zu p. Nach (3.163) folgt daraus, daß jede der Restklassen
1 , 2 , ..., p − 1
invertierbar ist. Da dieses außer 0 alle Restklassen modulo p sind, gilt
a ∈ Zp \ { 0 } ⇔ a ist invertierbar (3.173)
Da somit außer der der Null alle Elemente invertierbar sind, erhält man sofort
ϕ(p) = p − 1 (3.174)
und wegen (3.171) daher
a p−1 = 1 für alle a ∈ Zp \ { 0 }) (3.175)
Multipliziert man beide Seiten von (3.175) mit der Restklasse a , so erhält man eine
Gleichung, die – wie man schnell nachprüft – zusätzlich für die Restklasse 0 gültig ist:
ap = a für alle a ∈ Zp (3.176)
199
Ebenso folgt aus (3.173), daß Zp sogar ein Körper ist (siehe Seite 177). Insbesondere
hat man damit
Z∗p = Zp \ { 0 } (3.177)
Wichtige Bezeichnung: Man nennt diese Körper Restklassenkörper mod p, Galois-

feld oder
Fp (3.178)
Mit dem Körper Fp kann weitestgehend so verfahren werden, wie man es von den be-
kannten Körpern Q und R gewohnt ist. Das betrifft vor allem
• Behandlung linearer Gleichungssysteme
• Grundtatsachen über Polynome
• Nullteilerfreiheit
Allgemein kann gesagt werden, daß dieses alles betrifft, was unmittelbar auf den Grund-
rechenarten beruht, hingegen nicht die auf zusätzlichen Besonderheiten der reellen Zah-
len beruhende Differential- und Integralrechnung.
Beispiel: Z2 = F2 = { 0 , 1 } ist der kleinste Körper. Er besitzt nur zwei Elemente,

dabei handelt es sich um das Nullelement und das Einselement, d. h. um die neutralen
Elemente der beiden Verknüpfungen. Die beiden Verknüpfungstabellen sind:
+ 0 1 · 0 1
0 0 1 0 0 0
1 1 0 1 0 1
Häufig nimmt man bezüglich Z2 folgende Identifizierungen vor:
ˆ {w, f },
Z2 = ˆ ⊕,
+= ·=
ˆ ∧
und führt die Behandlung logischer Ausdrücke auf Rechnungen im Körper Z2 zurück.
Aufgabe: Warum ist 1010 − 1 ist durch 11 teilbar?
Satz: Der Körper ist Zp ist nullteilerfrei .30

Beweis: Seien a , b ∈ Zp mit a · b = 0 . Zu zeigen ist: Dann ist a = 0 oder b = 0 .
Angenommen, es ist a 6= 0, dann wäre a invertierbar, und man könnte folgern:
−1
a · b = 0 | · a
−1 −1
⇒ |a {z· a} · b = a · 0 = 0
1
⇒ b = 0
F
Das Ziehen einer Wurzel ist im Restklassenkörper ZZ p mit etwas Einschränkungen
sehr leicht möglich. Wurzel ziehen“ bedeutet: Ist ein Wert y ∈ ZZp der Form
”
y = xl (3.179)
30
Dieser Satz gilt für alle Körper; der folgende Beweis läßt sich wörtlich auf andere Körper übertragen.
200
mit bekanntem l ∈ IN aber unbekanntem x gegeben, so ist die Restklasse x zu be-
rechnen. In vielen Fällen ist das leicht möglich. Genauer gilt:
Für l ∈ IN ist die l-te stets Wurzel
⇔ ggT(l, p − 1) = 1 (3.180)
ziehbar
Begründung und Vorgehensweise: Gegeben ist y = x l ; zu berechnen ist x . Man be-
rechne dazu mit dem erweiterten euklidischen Algorithmus (siehe (3.48))
u, v ∈ Z mit 1 = u · l + v · (p − 1)
Dann ist in der Tat y u = x ; wie man nachrechnet, ist nämlich:
x l )u · |x v·(p−1)
y u = (|{z} {z } denn x p−1 = 1 , siehe (3.175)
y =1
1
z }| {
= x u · l + v · (p − 1) = x1 = x
qed.
Beispiel: p = 11, x = 2 , l = 7, y = x 7 = 7 wegen 128 mod 11 = 7. Nun soll gezeigt

werden, daß allein aus dem Wert y = 7 dieser siebten Potenz durch Ziehen
√ der siebten
Wurzel die Basis x = 2 ermittelt werden kann. Zum Berechnen von y wird nun der
7
erweiterte euklidische Algorithmus angewandt:
1 = 3 · 7 − 2 · |{z}
10
p−1
3
⇒ 7 = 7 · 7 · 7 = 7 · 49 = 7 · 5 = 35 = 2
Bemerkung: Diese Art des Wurzelziehen kommt in leicht abgewandelter Fassung auch
beim RSA-Verfahren (siehe Seite 181) vor und bildet dabei eine wichtige Grundlage.
F
Beim Ziehen der l-ten Wurzel wurde wegen der Bedingung ggT(l, p − 1) = 1 (siehe
(3.180)) der Fall einer Quadratwurzel nicht erfaßt. Da dieser jedoch bei mehreren An-
wendungen31 bedeutsam ist, soll hier auf das Ziehen einer Quadratwurzel in Z∗p kurz
eingegangen werden. Vorausgesetzt wird für das folgende, daß p Primzahl mit p 6= 2
ist.32
Von einer Restklasse a ∈ Z∗p existiert genau dann eine Quadratwurzel, wenn a ein
Quadrat in Z∗p ist. Das bedeutet,
es gibt ein c ∈ Z∗p mit c2 = a (3.181)
In diesem Fall nennt man a einen quadratischen Rest mod p.
31
u. a. bei gewissen Primzahltest, mit Erweiterung bei einem sogenannten Zero-Knowledge-Verfahren,
eine Anwendung folgt in Abschnitt 3.3.2.7.2
32
Der Fall p = 2 ist hier uninteressant; warum?
201
Als Beispiel soll die Multiplikationstabelle des Restklassenkörpers Z7 betrachtet werden.
Die Quadrate bzw. quadratischen Reste befinden sich auf den Diagonalen. Die von Null
verschiedenen Quadrate wurden unterstrichen. Wie üblich werden die Restklassen hier
wieder durch ihre kleinsten nicht negativen Repräsentanten dargestellt:
∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von Z7
Man erkennt anhand der Multiplikationstabelle:
• Nur die Elemente 1 , 2 , 4 , ∈ Z7 sind Quadrate.
• Jedes dieser Quadrate erscheint genau zweimal in der Diagonalen.
Um die Quadrate in Zp genauer zu untersuchen, beachtet man zunächst, daß es sich bei
diesem Restklassenring um einen Körper handelt. Bezüglich der Quadratwurzeln liegen
dieselben Verhältnisse wie bei den bekannten Körpern Q| und IR vor. Sei etwa
a = c 2 ∈ Zp (3.182)
ein Quadrat mit der ungeraden Primzahl p, dann hat die Gleichung
X2 − a = 0 (3.183)
für a 6= 0 genau zwei Lösungen, denn sei etwa X = u eine Lösung von (3.183), dann
gilt:
0 = u2 − a = u2 − c2
= (u − c)·(u + c)
⇔ p | (u + c) · (u − c)
(3.184)
⇔ p | (u − c) oder p | (u + c) Denn p ist eine Primzahl.
(Siehe dazu (3.63).)
⇔ u − c = 0 oder u + c = 0
⇔ u = c oder u = −c
Die beiden einzigen vorhandenen Lösungen unterscheiden sich genau um das Vorzei-
chen.33
33
Alternativ hätte man in der Rechnung (3.182) die Nullteilerfreiheit des Körpers Zp ausnutzen
können: Wegen 0 = ( u − c ) · ( u + c ) muß bereits mindestens einer dieser beiden Faktoren null sein.
202
Bemerkung: Diese Tatsache, daß eine Quadratzahl höchsten zwei Quadratwurzeln besitzt
und diese sich nur um den Faktor −1 unterscheiden, ist gleicher Weise für die bekannten
Körper Q| und IR sowie für alle anderen Körper gültig. Die Rechnung (3.183) verwendet
nur die Körperaxiome (siehe Seite 177).
Wie gesehen, ist nicht jede Restklasse a ∈ Z∗p ein quadratischer Rest. Eine genauerer
Aussage liefert der folgende
Satz: Sei p eine ungerade Primzahl; dann gilt
(1) Es gibt genau (p − 1)/2 quadratische Reste in Z∗p .
(2) a ∈ Z∗p ist genau dann ein quadratischer Rest in Z∗p , falls
p−1
a 2 = 1 (3.185)
gilt.
Beweis:
zu (1): Offenbar erhält man alle quadratischen Reste in Z∗p , wenn die Elemente aus Z∗p
quadriert:
2 2 2 2
1 , 2 , 3 , . . . , (p − 1) , (3.186)
Hierbei handelt es sich um p−1 Quadrate, die nicht alle verschieden sein müssen.
Wann sind zwei der dieser quadrierten Werte gleich?
Wie in (3.184) gesehen, gilt
u2 = c2 ⇔ u = ±c (3.187)
Zwei Werte in (3.186) sind somit genau gleich, falls sie sich um das Vorzeichen
unterscheiden.
Das heißt wiederum, daß von den (p − 1) Werten in (3.186) jeweils zwei gleich
sind. In (3.186) sind somit (p − 1)/2 unterschiedliche Werte vorhanden. Dieses
sind genau die Quadrate in Z∗p , deren Anzahl damit wie behauptet (p − 1)/2
beträgt.
zu (2): Angenommen a = c 2 ist ein quadratischer Rest; dann rechnet man nach:
p−1 p−1
a 2 = ( c 2) 2
= c p−1
(3.188)
= 1 wegen (3.171) (kleiner Fermatscher Satz)
Für a ∈ Z∗p gelte jetzt umgekehrt
p−1
a 2 = 1 (3.189)
Zu zeigen bleibt: Dann ist a ein quadratischer Rest. Wegen (3.189) ist a eine
Nullstelle des Polynoms
p−1
P(X) = X 2 − 1 (3.190)
Wie aber die Rechnung in (3.188) gezeigt hat, ist jeder der (p − 1)/2 quadra-
tischen Rest eine Nullstelle von P(X). Andererseits besitzt P(X) als Polynom
(p−1)/2-ten Grades über dem Körper Zp höchstens (p−1)/2 Nullstellen. Damit
folgt:
203
• Die (p − 1)/2 quadratischen Reste sind genau alle Nullstellen von P(X).
• Ist P( a ) = 0 , so muß demgemäß a ein quadratischer Rest sein.
qed.
Bemerkung: Ist a ∈ Z∗p kein quadratischer Rest in Z∗p , so ist

p−1
a 2 = −1 (3.191)
Denn wegen des kleinen Fermatschen Satzes (3.175) ist sicher

p−1
2
a 2 = a p−1 = 1 (3.192)
Da das Quadrat der linken Seite von (3.191) somit 1 ist, muß die linke Seite nach
(3.184) einen der beiden Werte 1 oder −1 besitzen. Da hier nach Voraussetzung a
kein quadratischer Rest sein soll, bleibt nur der Wert −1 .
Wie berechnet man praktisch für einen quadratischen Rest a ∈ Z∗p eine Quadratwurzel?
Hier soll dieses nur für einen Spezialfall durchgeführt werden:
Satz: Sei p eine mit Rest 3 durch 4 teilbare Primzahl, d. h. eine Primzahl der Gestalt
p = 4 · k + 3 mit k ∈ IN0 (3.193)
Weiterhin sei a ∈ Zp eine Quadratzahl:
a = c2 mit einem c ∈ Z (3.194)
Berechnet man dann die Restklasse

p+1
u = a 4 (3.195)
dann ist u ∈ Zp eine Quadratwurzel von a , genauer gilt
u2 = a (3.196)
und außerdem: u = ±c (3.197)
Beweis: Man quadriert die in (3.195) definierte Restklasse u :

p+1
2
u2 = a 4
p+1
2 p+1
2
= c 2· 4 = c 2 = c p+1
p−1 2
= |c{z }· c (wegen 3.175)
1
= c2 = a (wegen 3.194)
Aufgrund der Rechnung in (3.184) muß dann außerdem u = ± c sein. qed.
204
Beispiel: Sei p = 23. Dann ist 2 ein quadratischer Rest; es ist nämlich
2
±5 = 25 = 2 + 23 = 2
Das Potenzieren von 2 mit (23 + 1)/4 = 6 liefert nun eine der beiden Quadratwurzeln:
6
2 = 64 = 64 − 3 · 23 = − 5
Bemerkung: Da, wie gesehen, das Ziehen der Quadratwurzel für quadratische Reste in
Z∗p für p ≡ 3 mod 4 recht einfach ist, beschränkt man bei Anwendungen oft auf solche
Primzahlen. Für die übrigen ungeraden Primzahlen ist ein zu (3.193) entsprechendes, al-
lerdings erheblich komplizierteres Verfahren vorhanden, der Tonelli-Shanks-Algorithmus
(siehe etwas [10]).
F
Nicht bekannt ist ein effektiver Algorithmus zum Berechnen des sogenannten diskreten
Logarithmus. Beim diskreten Logarithmus ist ein Potenzwert
y = x l ∈ Z∗p (3.198)
gegeben, wobei die Basis x bekannt, der Exponenten aber l unbekannt ist. Zu berechnen
ist nun bei Kenntnis von y und x der Exponent l ∈ N.
Dieses ist die Grundlage des Schlüsselaustauschverfahrens von Diffie-Hellman.
3.3.2.5 Anwendungen
3.3.2.5.1 Schlüsselaustausch nach Diffie-Hellman
Die Idee des Schlüsselaustauschverfahrens von Diffie-Hellman wurde bereits auf Seite 146
erläutert. Hier kann jetzt das Schema von Diffie-Hellman lautet in seiner endgültigen,
verwendungsfähigen Form dargestellt werden:
1. p ist eine fest vorgegebene oder eine fest gewählte große Primzahl (p > 2300 ); dazu
wird weiter ein a ∈ N mit 1 < a < p gewählt. p und a werden veröffentlicht.
2. Die Partner A und34 B merken sich jeder einen geheimen Wert
A: l∈N
B: k∈N
3. A berechnet in Zp :
y1 = a l
und sendet y1 an B.
B berechnet in Zp :
y2 = a k
und sendet y2 an A.
34
Gerne auch als Alice und Bob bezeichnet.
205
4. A berechnet aus seinem empfangenen Wert y2
Y = y2 l = ( a k )l = a k·l
B berechnet aus seinem empfangenen Wert y1
y = y1 k = ( a l )k = a k·l
Damit ist y , d. h. der kleinste positive Rest von y mod p, der gemeinsame, aber
sonst geheime Schlüssel von A und B.
Bemerkungen zum Diffie-Hellman-Schema:
• Das Patent 1997 ist abgelaufen.
• Es wird zum Schlüsselaustausch im Internet verwendet, z.B. beim Simple Key

Management for Internet Protocol (SKIP)
Das Brechen ist nur durch Berechnen von l aus y1 und a bzw. nur durch Berechnen von
k aus y2 und a möglich. Dieses ist das Problem des Diskreten Logarithmus“ (siehe
”
3.198) und ist praktisch nicht machbar. Es gibt zwar asymptotisch gute Verfahren, diese
sind jedoch nicht praktikabel.
Achtung: Die Primzahl p sollte so gewählt sein, daß p − 1 mindestens einen großen
Primfaktor enthält, sonst u. U. wäre ein Brechen doch möglich.
3.3.2.5.2 ISBN-Prüfziffer
Jedes Buch besitzt eine sogenannte internationale Standardbuchnummer (ISBN), die
die Auflage des Buches mit allen zugehörigen Daten (Herkunftsland, Verlag usw.) ein-
deutig kennzeichnet. Die jetzt noch gültige 10-stellige ISBN
a1 a2 a3 · · · a10 (3.199)
besitzt die die neun Datenziffern
ai ∈ {0, 1, 2, . . . , 9} für i = 1, . . . , 9 (3.200)
sowie an der zehnten Stelle eine Prüfziffer a10 . Die Prüfziffer wird aus den Datenbits so
berechnet, daß stets die Kongruenz
1 · a1 + 2 · a2 + . . . + 9 · a9 + 10 · a10 ≡ 0 mod 11 (3.201)
erfüllt ist. Verwendet wird die Primzahl p = 11. Das bietet mehrere Vorteile:
• Alle Rechnungen können in dem Körper Z11 durchgeführt werden. Die Nulltei-
lerfreiheit sowie die Invertierbarkeit aller Restklassen a 6= 0 kann ausgenutzt
werden.
• Die Datenziffern (3.200) können mit den Restklassen 0 , 1 , 3 , . . . , 9 eindeutig

identifiziert werden.
• Die Kongruenzbedingung (3.201) wird zu einer einfachen Gleichung im Körper

Z11 :
1 · a1 + 2 · a2 + . . . + 9 · a9 + 10 · a10 = 0 (3.202)
206
Die Gleichung (3.202) liefert sofort die Berechnungsvorschrift für die Bestimmung der
Prüfziffer aus den Datenziffern; man löst die Gleichung (3.202) nach a10 auf:
1 · a1 + 2 · a2 + . . . + 9 · a9 = − 10 · a10
= a10 (3.203)
denn : − 10 = 11 − 10 = 1
In der ISBN wird für die Restklasse a10 wieder der kleinste nicht negative Repräsentant
modulo 11 genommen (siehe (3.143)). Da aber die Rechnung (3.203) die Restklasse 10
ergeben könnte, reichen die dezimalen Ziffern hierfür nicht aus. Man verwendet daher
die zusätzliche Ziffer X“ (die römische Ziffer mit dem Wert 10). An der letzten Stelle
”
einer ISBN kann somit neben den dezimalen Ziffern auch ein X erscheinen.
Der so aufgebaute ISBN-Code leistet:
(a) Erkennen eines Einzelfehlers
(b) Korrektur eines Einzelfehlers bei bekannter Fehlerposition
(c) Erkennen einer Ziffernvertauschung
Begründung: Zu (a): Angenommen, an der j-ten Stelle steht anstatt der korrekten (und
unbekannten) Ziffer aj die falsche Ziffer bj . Zum Prüfen der Korrektheit berechnet man
in Z11 die gewichtete Summe (3.202) und verwendet die vorliegende Ziffer bj . Diese
Rechnung führt zu dem folgenden Ergebnis:
s = 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10 (3.204)
= 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10

= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)

= j · b j − aj (3.205)
6= 0 für bj 6= aj
Damit wurde festgestellt, daß die Gleichung (3.202) nicht erfüllt ist. Der Einzelfehler
wurde bemerkt.
Zu (b): Ist die Position j des Einzelfehlers bekannt, so kann aus der gewichteten Summe
(3.204) sowie der vorliegenden falschen Ziffer bj die korrekte Ziffer aj berechnet werden;
indem man die Gleichung (3.205) nach aj auflöst:
−1
aj = bj − j · s (3.206)
Zu berechnen ist dabei die inverse Restklasse von j . Das erfolgt dann wie üblich mit
dem erweiterten euklidischen Algorithmus (siehe (3.164)).
207
Zu (c): Angenommen, die i-te und die j-te Ziffer seien vertauscht. Dann liefert die
Berechnung der gewichteten Summe (3.204) mit den beiden vertauschten Ziffern:
s = 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10
= 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10

= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)
= i · ( aj − ai ) + j · ( ai − aj )

= j − i · ( ai − aj ) (3.207)
6= 0 für ai 6= aj , i 6= j
Anhand von s 6= 0 konnte auch dieser Vertauschungsfehler erkannt werden.

F
Seit 2005 ist die 13-stellige ISBN im Gebrauch. Hier wird die Prüfziffer (an der 13-ten
Stelle) durch eine Gleichung in Z10 festgelegt. Die dezimalen Ziffern können dann eindeu-
tig und ohne Zusatzziffer mit den Restklassen Z10 identifiziert werden. Die Bedingung
für die Prüfziffer a13 lautet in Z10 :
1 · a1 + 3 · a2 + 1 · a3 + . . . + 3 · a12 + 1 · a13 = 0 (3.208)
Die geraden Positionen werden mit 3 und die ungeraden Positionen werden mit 1 ge-
wichtet. Einzelfehler können bemerkt und bei bekannter Position korrigiert werden.
Aufgabe: Man begründe dieses.
Aufgabe: In welchen Fällen kann eine Vertauschung zweier Ziffern bemerkt werden, in
welchen Fällen bleibt sie unentdeckt?
Bemerkung: Weitere Codes mit ähnlicher Bedingung für die Prüfziffer sind vorhanden.
Zum Beispiel verwenden einige Banken und Kreditkartenunternehmen bei ihren Konto-
nummern ein Verfahren wie bei der ISBN-13, wobei anstelle des Gewichtungsfaktors 3
der Faktor 2 genommen wird.
Aufgabe: Was sind Vor- und Nachteil des des Gewichtungsfaktors 2 gegenüber dem des
Gewichtungsfaktors 3?
3.3.2.5.3 Aufstellung eines Spielplans

Während einer Runde der ersten Fußballbundesliga (Hinrunde oder Rückrunde) spielt
jede Mannschaft genau einmal gegen jede andere Mannschaft. Die Spiele werden dabei
so geplant, daß jede Mannschaft an einem Spieltag (bzw. einem Spielwochenende) genau
ein Spiel durchführt. Wie muß ein Spielplan aufgestellt werden, der dieses ermöglicht?
Insbesondere ist sicherzustellen, daß an jedem Spieltag für jede Mannschaft ein Gegner
zur Verfügung steht, gegen den sie in der betreffenden Runde noch nicht angetreten ist.
Hier soll gezeigt werden, wie mit einer einfachen Restklassenrechnung für dieses Problem
eine unkomplizierte Lösung gefunden werden kann. Es empfiehlt sich, zunächst von einer
beliebigen Anzahl n von teilnehmenden Mannschaften auszugehen; dabei sei n ∈ IN mit
n ≥ 2.
Weiterhin werde zunächst angenommen, daß n ungerade ist. In diesem Fall muß in Kauf
genommen werden, daß an jedem Spieltag genau eine Mannschaft spielfrei ist. Es soll
208
aber je Spieltag immer nur eine Mannschaft spielfrei sein und keine Mannschaft während
der Runde zweimal oder noch häufiger spielfrei sein.
Man identifiziert die n Mannschaften35 mit den n Restklassen aus Zn :
0 , 1 , ..., n − 1
Geplant werden n Spieltage; die Spieltage werden ebenfalls mit den n Restklassen aus
Zn identifiziert.
An dem Spieltag a ∈ Zn liefert nun die folgende einfache Funktion den Gegner der
Mannschaft x ∈ Zn :
Ga ( x ) = a − x (3.209)
Aus der Definition (3.209) folgt sofort:
• An einem Spieltag a haben alle Mannschaften x unterschiedliche Gegner; keine

Mannschaft muß gegen zwei Gegner antreten.
• Eine Mannschaft x hat an unterschiedlichen Spieltagen unterschiedliche Gegner:

keine Mannschaft spielt somit zweimal gegen denselben Gegner.
Zu zeigen bleibt noch das Folgende:
• Die Mannschaft x hat jede andere Mannschaft y einmal als Gegner. Setzt man
nämlich a = x + y , so liefert (3.209) für den Spieltag a :
Ga ( x ) = a − x = x + y − x = y
• Liefert die Funktion (3.209) für die Mannschaft x den Gegner y = a − x , so

liefert sie umgekehrt für y den Gegner x . In der Tat rechnet man nach:
Ga ( y ) = a − y = a − (a − x)
= x
• Am Spieltag a bleibt genau eine Mannschaft spielfrei. Die Funktion (3.209) über-
führt nämlich genau eine Restklasse x0 in sich selber:
x0 = G a ( x0 )
⇔ x0 = a − x0
⇔ 2 · x0 = a
−1
⇔ x0 = 2 · a (3.210)
Man beachte, daß n ungerade und damit
die Restklasse 2 in Zn invertierbar ist.
Die Restklasse x0 mit G a ( x0 ) = x0 ist somit bei jedem Spieltag a durch
(3.210) eindeutig bestimmt. Alle anderen haben den durch (3.209) wohlbestimmten
Gegner G a ( x ). Nur x0 ist am Spieltag a spielfrei.
35
n braucht hier keine Primzahl zu sein; zunächst wird nur vorausgesetzt, daß n ungerade ist.
209
Nachdem der Spielplan für ungerades n aufgestellt wurde, fehlt jetzt noch ein Spielplan
für eine gerade Anzahl an Mannschaften. Diesen führt man aber auf einfache Weise auf
den eben behandelten Fall einer ungeraden Anzahl zurück.
Sei jetzt n gerade und n ≥ 4. Dann läßt man zunächst die letzte Mannschaft weg und
stellt wie eben beschrieben den Spielplan für n0 = n − 1 Mannschaften auf. Die bei
diesem Plan an jeweils einem Spieltag spielfrei bleibende Mannschaft läßt man gegen
die zunächst weggelassene letzte Mannschaft spielen.
Beispiel: Ein Spielplan für n = 10 Mannschaft wird aufgestellt. Wie beschrieben, werden
zunächst nur die ersten n0 = 9 Mannschaften beachtet. Diese und die Spieltage werden
mit den Restklassen 0 , . . . 8 ∈ Z9 identifiziert. Die letzte, zunächst nicht beachtete
Mannschaft wird als “9“ bezeichnet:
1. Spieltag 0 :

G0 0 = 0 − 0 = 0 =⇒ 0 spielt gegen 9
G0 1 = 0 − 1 = 8 =⇒ 1 spielt gegen 8
G0 2 = 0 − 2 = 7 =⇒ 2 spielt gegen 7
G0 3 = 0 − 3 = 6 =⇒ 3 spielt gegen 6
G0 4 = 0 − 4 = 5 =⇒ 4 spielt gegen 5
2. Spieltag 1 :

G1 0 = 1 − 0 = 1 =⇒ 0 spielt gegen 1
G1 2 = 1 − 2 = 8 =⇒ 2 spielt gegen 8
G1 3 = 1 − 3 = 7 =⇒ 3 spielt gegen 7
G1 4 = 1 − 4 = 6 =⇒ 4 spielt gegen 6
G1 5 = 1 − 5 = 5 =⇒ 5 spielt gegen 9
3. Spieltag 2 :

G2 0 = 2 − 0 = 2 =⇒ 0 spielt gegen 2
G2 1 = 2 − 1 = 1 =⇒ 1 spielt gegen 9
G2 3 = 2 − 3 = 8 =⇒ 3 spielt gegen 8
G2 4 = 2 − 4 = 7 =⇒ 4 spielt gegen 7
G2 5 = 2 − 5 = 6 =⇒ 5 spielt gegen 6
4. Spieltag 3 :

G3 0 = 3 − 0 = 3 =⇒ 0 spielt gegen 3
G3 1 = 3 − 1 = 2 =⇒ 1 spielt gegen 2
G3 4 = 3 − 4 = 8 =⇒ 4 spielt gegen 8
G3 5 = 3 − 5 = 7 =⇒ 5 spielt gegen 7
G3 6 = 3 − 6 = 6 =⇒ 6 spielt gegen 9
5. Spieltag 4 :

G4 0 = 4 − 0 = 4 =⇒ 0 spielt gegen 4
G4 1 = 4 − 1 = 3 =⇒ 1 spielt gegen 3
G4 2 = 4 − 2 = 2 =⇒ 2 spielt gegen 9
G4 5 = 4 − 5 = 8 =⇒ 5 spielt gegen 8
G4 6 = 4 − 6 = 7 =⇒ 6 spielt gegen 7
210
6. Spieltag 5 :

G5 0 = 5 − 0 = 5 =⇒ 0 spielt gegen 5
G5 1 = 5 − 1 = 4 =⇒ 1 spielt gegen 4
G5 2 = 5 − 2 = 3 =⇒ 2 spielt gegen 3
G5 6 = 5 − 6 = 8 =⇒ 6 spielt gegen 8
G5 7 = 5 − 7 = 7 =⇒ 7 spielt gegen 9
7. Spieltag 6 :

G6 0 = 6 − 0 = 6 =⇒ 0 spielt gegen 6
G6 1 = 6 − 1 = 5 =⇒ 1 spielt gegen 5
G6 2 = 6 − 2 = 4 =⇒ 2 spielt gegen 4
G6 3 = 6 − 3 = 3 =⇒ 3 spielt gegen 9
G6 7 = 6 − 7 = 8 =⇒ 7 spielt gegen 8
8. Spieltag 7 :

G7 0 = 7 − 0 = 7 =⇒ 0 spielt gegen 7
G7 1 = 7 − 1 = 6 =⇒ 1 spielt gegen 6
G7 2 = 7 − 2 = 5 =⇒ 2 spielt gegen 5
G7 3 = 7 − 3 = 4 =⇒ 3 spielt gegen 4
G7 8 = 7 − 8 = 8 =⇒ 7 spielt gegen 9
9. Spieltag 8 :

G8 0 = 8 − 0 = 8 =⇒ 0 spielt gegen 8
G8 1 = 8 − 1 = 7 =⇒ 1 spielt gegen 7
G8 2 = 8 − 2 = 6 =⇒ 2 spielt gegen 6
G8 3 = 8 − 3 = 5 =⇒ 3 spielt gegen 5
G8 4 = 8 − 4 = 4 =⇒ 4 spielt gegen 9
3.3.2.6 Der Fall n = p · q

Nachdem in vorherigen Abschnitt der Fall n = p behandelt wurde, soll nun der für
kryptologische Anwendungen ebenfalls bedeutsame Fall
n = p·q mit Primzahlen p 6= q (3.211)
betrachtet werden.
Betrachtet wird jetzt zu n = p · q der Restklassenring Zn , wobei dessen Einheitengruppe
Z∗n = { r | 1 ≤ r < n, ggT(r, n) = 1} (3.212)
von besonderem Interesse ist. Gemäß der Bezeichnung auf Seite 198 hat man
ϕ(n) = ϕ(p · q) = #Z∗n
211
und damit für r ∈ Z∗n nach dem Satz auf Seite 198
r ϕ(n) = r ϕ(p·q) = 1 (3.213)
Ziel dieses Abschnitts ist es,

• ϕ(n) = ϕ(p · q) zu berechnen
• die Struktur von Z∗n genauer darzustellen

Der erste Teil ist recht einfach; man zählt dazu die zu n = p · q nicht teilerfremden
Zahlen unter den
r = 0, 1, 2, . . . , n − 1
Ist r nicht zu n = p · q teilerfremd, so kann r nur durch p oder q teilbar sein; damit
bestehen folgende Möglichkeiten:
• 0 · p, 1 · p, 2 · p, . . . , (q − 1) · p
• 0 · q, 1 · q, 2 · q, . . . , (p − 1) · q
Beachtet man, daß 0 = 0 · p = 0 · q hier doppelt vorkommt, so erhält man genau
q+p−1
Zahlen r mit 0 ≤ r < n, die nicht zu n = p · q teilerfremd sind. Die restlichen Zahlen r
mit 0 ≤ r < n sind gerade die zu n = p · q teilerfremden und entsprechen den Elementen
in Z∗n ; ihre Anzahl beträgt damit (wegen n = p · q = #Zn )
p · q − (q + p − 1) = (p − 1) · (q − 1)
Also hat man
ϕ(p · q) = (p − 1) · (q − 1) (3.214)
Insbesondere hat man damit und aufgrund von (3.171) für r ∈ Z∗n mit n = p · q die
wichtige Gleichung
r (p−1)·(q−1) = 1 (3.215)
hergeleitet.
F
Die Gleichung (3.215) ist für gewisse Anwendungen schon ausreichend. Für andere An-
wendungen ist aber eine genaue Kenntnis der Struktur der Gruppe Z∗n erforderlich. Um
die Struktur der Gruppe Z∗n für den Fall n = p · q aufzuschlüsseln bedient man sich eines
Tricks“: Man nimmt eine Rückführung von Zn auf die beiden Ringe Zp und Zq vor.
”
Man betrachtet die Menge
R = Zp × Zq = {( a , b ) | a ∈ Zp , b ∈ Zq } (3.216)
Mit der komponentenweisen Addition und Multiplikation wird diese Menge zu einem
kommutativen Ring mit
Nullelement (0, 0)
(3.217)
Einselement (1, 1)
212
Für die Inversenbildung bezüglich “·“ gilt:
( a , b ) ∈ R∗ (d.h. invertierbar) ⇔ a ∈ Z∗p und b ∈ Z∗q (3.218)
Genauer gilt nämlich:

−1
( a , b )−1 = ( a −1 , b )
−1 −1
(3.219)
−1 −1
denn ( a , b ) · ( a ,b ) = (a · a ,b · b ) = (1, 1)
Damit wurde gezeigt:
R∗ = Z∗p × Z∗q = {( a , b )| a ∈ Z∗p , b ∈ Z∗q }

⇒ #R∗ = (#Z∗p ) · (#Z∗q ) = (p − 1) · (q − 1) (3.220)
Jetzt folgt der Trick! Man definiert folgende Funktion36
f : Zn → Zp × Zq mit a →(a, a) (3.221)
Zu zeigen ist: Die Funktion f ist
1. wohldefiniert
2. umkehrbar eindeutig (bijektiv)
3. vertauschbar mit der Addition und der Multiplikation, das heißt:
f( a1 + a2 ) = f( a1 ) + f( a2 )
f( a1 · a2 ) = f( a1 ) · f( a2 )
(3.222)
Insbesondere gilt: f( 0 ) = ( 0 , 0 )
f( 1 ) = ( 1 , 1 )
Begründungen:
1. Wohldefiniert: Zu zeigen ist, daß der wie oben definiert Funktionswert f( a ) nicht
von der speziellen Repräsentanten a der Restklasse a abhängt.
Sei daher
a = b ⇔ n | (a − b) (beachte n = p · q)
⇒ p | (a − b) und q | (a − b)
⇒ a ≡ b mod p und a ≡ b mod q
⇒ (a, a)=(b, b)
2. Eineindeutig: Zunächst wird die Injektivität nachgewiesen.

Zu zeigen ist: f( a ) = f( b ) ⇒ a = b
36
Man beachte, daß immer noch gilt (n = p · q, p 6= q).
213
Aufgabe: Vor dem Weiterlesen versuche man, dieses selber zu beweisen.
f( a ) = f( b ) ⇔ (a, a) = (b, b)
⇔ a ≡ b mod p, a ≡ b mod q
⇔ p|(a − b) und q|(a − b)
⇔ n|(a − b) wegen n = p · q mit p 6= q prim (siehe (3.57))
⇔ a ≡ b mod n ⇔ a = b
Nachzuweisen beleibt noch die Surjektivität. Hier ist zu zeigen, daß es zu jedem
Paar ( a , b ) ∈ Zp × Zq ein c ∈ Zn mit
f( c ) = ( c , c ) = ( a , b )
⇔ c ≡ a mod p und c ≡ b mod q
gibt; ein solches c ∈ Zn existiert jedoch aufgrund des chinesischen Restsatzes

(3.80) und ist außerdem schnell zu berechnen.
3. Vertauschbarkeit mit den Verknüpfungen (3.222): Dieses wird als Aufgabe über-
lassen.
Damit ist gezeigt, daß die beiden Ringe Zn und Zp × Zq strukturell gleich sind, d. h. ihr
Verhalten beim Addieren und Multiplizieren ist völlig identisch. Das heißt wiederum,
daß alle Rechnungen in Zn auf Rechnung in Zp × Zq zurückgeführt werden können.
Insbesondere folgt dann der wichtige Sachverhalt, daß die Einheitengruppen
Z∗n und Z∗p × Z∗q
einander entsprechen, d.h. durch die durch (3.221) definierte Funktion f( c ) umkehrbar
eindeutig ineinander überführt werden.
Begründung: Sei c ∈ Z∗n , zu ist zeigen nun: f( c ) ∈ Z∗p × Z∗q . Sei dazu c 1 ∈ Z∗n mit
c 1 · c = 1 . Seien weiter
f( c ) = ( a , b )
f( c 1 ) = ( a 1 , b 1 )
Dann folgt unter Ausnutzung der Eigenschaften der Funktion f (siehe Seite 213):
( 1 , 1 ) = f( 1 ) = f( c · c 1 ) = f( c ) · f( c 1 )
(3.223)
= ( a , b ) · ( a 1, b 1) = ( a · a 1, b · b 1)
Der Vergleich der Komponenten liefert:
1 = a · a1 und 1 = b · b1
und somit a ∈ Z∗p und b ∈ Z∗q , d.h. ( a , b ) ∈ Z∗p × Z∗q .

Die umgekehrte Richtung, d.h. daß für
a ∈ Z∗p und b ∈ Z∗q
gilt37
c = f −1 (( a , b )) ∈ Z∗n = Z∗pq
37
da f( c ), wie gezeigt, bijektiv ist, existiert die Umkehrfunktion f −1
214
zeigt man genauso38 . qed.
Insbesondere sind damit die Einheitengruppen Z∗pq und Z∗p × Z∗q einander strukturell
gleich, man schreibt dafür
Z∗p·q ∼
= Z∗p × Z∗q (3.224)
Üblicherweise identifiziert man sogar beide Seiten miteinander, d. h. man betrachtet sie
als gleich.
Als Anwendung von (3.224) ergibt sich, daß beide Seiten von (3.224) gleich viele Ele-
mente besitzen müssen; man gewinnt damit noch einmal das Resultat von (3.214):
ϕ(p · q) = #Z∗p·q
= #(Z∗p × Z∗q )
= #Z∗p · #Z∗q
= (p − 1) · (q − 1)
Als Übung zeige man unter der Verwendung von (3.224), daß Z∗pq (leider) nicht zyklisch
ist.
Beispiel: In der folgenden Tabelle wird die Funktion f (siehe (3.221)) für die beiden
Primzahlen p = 11 und q = 7 dargestellt. In der ersten Spalte sind die Restklassen von
Z11 und in der ersten Zeile die Restklassen von Z7 aufgeführt. Die übrigen Einträge der
Tabelle enthalten die jeweils bezüglich der Funktion f entsprechende Restklasse aus Z77 .
So erkennt man etwa, daß zu dem Restklassenpaar ( 7 , 2 ) ∈ Z11 × Z7 die Restklassen
51 ∈ Z77 gehört. (Aufgabe: Man bestätige dieses durch nachrechnen.)
ZZ7
0 1 2 3 4 5 6
0 0 22 44 66 11 33 55
1 56 1 23 45 67 12 34
2 35 57 2 24 46 68 13
3 14 36 58 3 25 47 69
4 70 15 37 59 4 26 48
ZZ11 5 49 71 16 38 60 5 27
6 28 50 72 17 39 61 6
7 7 29 51 73 18 40 62
8 63 8 30 52 74 19 41
9 42 64 9 31 53 75 20
10 21 43 65 10 32 54 76
Die Bijektivität der Funktion f läßt für den vorliegen Fall (p = 11, q = 7) ebenfalls leicht
erkennen: einerseits gehört zu jedem Paar ( a , b ) ∈ Z11 × Z7 ein Eintrag im Inneren der
Tabelle und damit eine Restklasse aus Z77 , andererseits kommt jede Restklasse aus Z77
genau einmal vor.
38
Man führe den Beweis der umgekehrten Richtung als Übung aus.
215
Bemerkung: Diese Überlegungen lassen sich gleichlautend auf zwei teilerfremde Zahlen
n1 , n2 ∈ N mit n1 , n2 ≥ 2 übertragen. Im Falle ggT(n1 , n2 ) = 1 hat man damit
Z∗n1 ·n2 ∼
= Z∗n1 × Z∗n2
und damit insbesondere für 1 = ggT(n1 , n2 )
ϕ(n1 · n2 ) = ϕ(n1 ) · ϕ(n2 ) (3.225)
Beispiel: Seien p1 , p2 , p3 paarweise verschiedene Primzahlen; beachtet man dabei 1 =

ggT(p1 , (p2 · p3 )) und ebenso 1 = ggT(p2 , p3 ), so liefert eine doppelte Anwendung der
Gleichung (3.225)
ϕ(p1 · (p2 · p3 )) = ϕ(p1 ) · ϕ(p2 · p3 ) = ϕ(p1 ) · ϕ(p2 ) · ϕ(p3 )
Interessant ist weiterhin der Fall einer Primpotenz pk . Man zeige als Aufgabe
ϕ(pk ) = (p − 1) · pk−1
Da er für die vorliegende Anwendung von untergeordneter Bedeutung ist, soll dieser Fall
nicht weiter behandelt werden.
Stattdessen soll der Fall n = p · q, p 6= q wieder aufgegriffen werden und eine wichtige
Betrachtung angestellt werden, die auf die Grundlage des RSA-Verfahrens hinführen
wird (siehe den folgenden Abschnitt 3.3.2.7.1). Mit Hilfe der umkehrbaren Funktion
(3.221)
f: Zn → Zp × Zq
a → (a, a)
bzw. auch durch direkte Rechnung (siehe Seite 212) wurde die Gleichung (3.214)
ϕ(p · q) = (p − 1) · (q − 1) (3.226)
hergeleitet, woraus mit Hilfe der Gleichung (3.171) wiederum die wichtige Gleichung
r (p−1)·(q−1) = 1 (3.227)
folgte (siehe 3.215). Die Gleichung (3.227) gestattet, ähnlich wie in Z∗p auch in dem Ring
Z∗n die e-te Wurzel ziehen, siehe dazu Seite 200:
• Vorgeben sei ein Exponent e ∈ N mit ggT(e, (p − 1) · (q − 1)) = 1
• Weiter sei ein Potenzwert y = x e ∈ Z∗n vorgegeben, wobei die Basis x ∈ Z∗n
unbekannt ist.
• Durch Wurzelziehen wird x ∈ Z∗n berechnet:
– Als erstes berechnet man mit Hilfe des erweiterten Euklidischen Algorithmus
(siehe (3.46)) zwei ganze Zahlen d, v ∈ Z mit
1 = d · e + v · (p − 1) · (q − 1)
216
– Anschließend berechnet man y d ; in der Tat gilt nämlich x = y d .
Begründung:
x e )d · x v·(p−1)·(q−1)
y d = (|{z} denn x (p−1)·(q−1) = 1
=y
(siehe (3.171), (3.227))
=1
z }| {
= x e·d+v·(p−1)·(q−1) = x 1 = x
qed.
Beispiel: Für n = 7 · 11 sei in ZZ77 die folgende 37-te Potenz gegeben:

37 36 9 9 3
3 = 3 · 3 = 81 · 3 = 4 · 3 = 64 · 3 (3.228)
3
= −13 · 3 = 169 · −13 · 3 = 15 · −39 = 15 · 38
= 31 (3.229)
Die hier durchgeführte Rechnung wurde schrittweise durchgeführt; besser wäre natürlich
der Einsatz eines Rechners (schnelles Potenzieren, siehe (3.1)) oder das komponenten-
weise Potenzieren unter Verwendung von ZZ77 =Z˜ Z7 × ZZ77 (siehe (3.224)) gewesen.
Angenommen, man weiß jetzt nur, daß 31 in ZZ77 eine 37-te Potenz ist, und man will
die zugehörige Basis wissen, dann zieht man aus 31 die 37-te Wurzel. Im ersten Schritt
berechnet man dazu mit dem erweiterten euklidischen Algorithmus:
1 = 13 · 37 − 8 · (6 · 10) (3.230)
Zu Berechnen ist daher die 13-te Potenz

13 6 6 6 3
31 = 961 · 31 = 31 · 31 · 31 = 37 · 31 = 1369 · 31
3
= −17 · 31 = −4913 · 31 = = 15 · 31 = 465
= 3 (3.231)
Man hat somit wieder die Basis 3 aus (3.228) erhalten.

Obwohl es in der Praxis nicht üblich ist – man nimmt dort das schnelle Potenzieren,
siehe (3.1) – soll hier die letzte Potenz zum Vergleich noch einmal unter Ausnutzung
˜ Z7 × ZZ77 (siehe (3.224)) berechnet werden:
von ZZ77 =Z
13
13 13 13
31 =
ˆ 31 , 31 = 3 , 9 Jetzt den Satz von Euler anwenden!

1 3 3
= 3 , 9 = 3 , −2 = 3 , −8 = 3, 3
=
ˆ 3 (3.232)
Hier war nicht einmal die Anwendung des chinesischen Restsatzes notwendig.
Eine weitere sehr wichtige Folgerung aus der Gleichungen (3.226) und (3.169) betrifft
die Tatsache, daß der Anteil der nicht invertierbaren Elemente in Zp·q sehr gering ist.
217
Dieser Anteil beträgt nämlich
#Zp·q − #(Zp·q )∗ p · q − (p − 1) · (q − 1)
= p·q
#Zp·q (3.233)
= p + q − p 1· q
1 1
Für zwei Primzahlen mit p, q > 2 000 000 000 ist dieser Anteil kleiner als ein Milliardens-
tel. Bei zufälliger Auswahl einer Restklasse r aus Zp·q ist daher die Wahrscheinlichkeit
außerordentlich gering, daß r nicht invertierbar ist; man kann daher davon ausgehen,
daß r ∈ (Zp·q )∗ ist39 .
3.3.2.7 Anwendungen
3.3.2.7.1 Idee und Ablauf des RSA-Verfahrens Das Verfahren von River, Sha-
mir und Adelmann, kurz RSA-Verfahren genannt, ist ein asymmetrisches Verfahren,
d. h. die beiden Schlüssel k1 und k2 sind unterschiedlich (siehe Seite 145). Die große
Bedeutung dieses Verfahren besteht darin, daß der Besitzer B der beiden Schlüssel von
beliebiger Seite her ohne besonderen Schlüsselaustausch eine vertrauliche Nachricht emp-
fangen kann:
• Der Besitzer B veröffentlicht k1 , den Schlüssel zur Verschlüsselung. k1 wird daher

als öffentlicher Schlüssel (public key) bezeichnet.
• Der Schlüssel zum Entschlüsseln, k2 wird jedoch vertraulich gehalten. k2 ist der
private Schlüssel (private key).
• Jeder kann nun eine mit dem öffentlichen Schlüssel k1 verschlüsselte vertrauliche
Nachricht an B senden.
• Nur B kann die so verschlüsselten und an ihn gerichteten Nachrichten lesen, da nur
B den privaten Schlüssel k2 kennt und daher nur er diese Nachrichten entschlüsseln
kann.
39
Wie man später sehen wird, werden in der Tat ausschließlich sehr große Primzahlen verwendet.
218
Klartext
?
Verschlüsselung
P
i
PP
P Sender (beliebig)
PP
PP
PP
PP
?
öffentlicher Schlüssel
Geheimtext des Empfängers (k1 )
%EE
,
,D %
Feind
6
?
privater Schlüssel
Entschlüsselung
(k2 )
Klartext
Empfänger (B)
Das RSA-Verfahren ist ein Beispiel für ein public key-Verfahren. Der zu Grund liegende
Algorithmus zur Ver- und Entschlüsselung beruht auf dem Wurzelziehen in dem Rest-
klassenring Zp·q (siehe Seite 216); es folgt der genau Ablauf des Verfahrens:
1. B wählt zwei Primzahlen
p, q ∈ N mit p 6= q (3.234)
B wählt weiterhin einen Exponenten
e ∈ N mit ggT(e, (p − 1)(q − 1)) = 1 (3.235)
B setzt
n=p·q
.
2. B veröffentlicht
k1 = (n, e) (3.236)
Dieses ist Bs öffentlicher Schlüssel. Die beiden gewählten Primzahlen p und q hält
B jedoch geheim.
3. A will B eine vertrauliche Nachricht M senden, dazu
• zerlegt A die Nachricht M in k Bitblöcke mit
M = M1 , M2 , . . . , Mk mit Mi < n (3.237)
Die Bitblöcke Mi werden dabei als nicht negative Dualzahlen aufgefaßt.
219
• Anschließend berechnet A unter Verwendung des bekannt öffentlichen Schlüs-
sels (n, e) blockweise für i = 1, . . . k die Verschlüsselung durch
Ci = e(Mi , b1 ) = Mie mod n (∈ (Zn )∗ ) (3.238)
• A sendet die verschlüsselten Blöcke C1 , . . . , Ck an B.
4. B empfängt die Ci und entschlüsselt sie. Dazu berechnet B seinen privaten Schlüs-
sel d mit Hilfe des erweiterten euklidischen Algorithmus:
1 = d · e + v · (p − 1)(q − 1) (3.239)
und zieht die Wurzel“ (siehe Seite 3.3.2.6); für i = 1, . . . k berechnet B

”
d
Mi = Ci (∈ (Zn )∗ ) (3.240)
Wegen Mi < n ist Mi der kleinste positive Rest der durch (3.240) berechneten
Restklasse Mi ∈ Zn ; B kann daher für i = 1, . . . k den Klartextblock Mi aus (3.240)
eindeutig bestimmt und damit insgesamt die empfangene Nachricht entschlüsseln.
Wie könnte ein Brechen dieses Codes aussehen? Angenommen, ein Angreifer hat Ci
abgefangen:
• Er weiß. daß Ci = Mie gilt, da er das Verfahren kennt.
• Mi ist ihm unbekannt, er will es ermittelt.

p
• Er muß Ci in Zn berechnen
e
• Er muß 1 = d·e+v·(p−1)(q−1) berechnen (erweiterter euklidischer Algorithmus).
• Er benötigt dazu (p − 1)(q − 1) bzw. die beiden Primzahlen p und q.
• Er benötigt die Zerlegung n = p · q.
• Er kennt aber nur n, die Primfaktoren p und q sind unbekannt!!.
• Er müßte daher aus n die Faktoren p und q durch Teilersuche“ ermitteln.

”
300
Für großes n (n ≥ 10 ) gilt jedoch
• Eine Faktorensuche durch nacheinander ausgeführte Teilbarkeitstests ist zu lang-

sam!
• Es gibt zwar schnellere algebraische Methoden zum Teilerfinden, aber auch diese
besitzen zumindest zur Zeit noch keine ausreichende Geschwindigkeit, um den
Code in absehbarer Zeit zu brechen.
Gebrochen wurden bereits Schlüssel der Länge 430 Bits (≈ 10130 ) sowie mit großem
Aufwand auch der Länge 512 Bits (≈ 10153 ). Als Folgerung bzw. Empfehlung ergibt sich
daraus:
• 512 Bits gelten nur noch als bedingt sicher.
• Minimal 768 Bits (n ≈ 10225 ) oder 1024 Bits (n ≈ 10300 ) sollten verwendet werden.
220
• Um ganz sicher zu gehen, wähle man
p, q ≈ 21024 , d. h. n ≈ 22048 ≈ 10600
• p − 1 und q − 1 sollten nicht nur kleine Primfaktoren (wie z. B. 2, 3, 5 usw.)

enthalten.
Neben der Faktorisierung gibt es weitere Angriffsmöglichkeiten.
Beispiel: B erzeugt ein Schlüsselpaar und wählt dazu die beiden (für die Anwendung zu
kleinen) Primzahlen p = 211 und q = 223. Damit berechnet bzw. wählt er aus:
n = p · q = 47053
ϕ(n) = (p − 1) · (q − 1) = 46620
e = 107 der gewählte öffentliche Exponent: er muß teilerfremd zu ϕ(n) sein.
1 = (−4357) · |{z}
107 + 10 · 46620
| {z }
| {z }
d e ϕ(n)
k1 = (47053, 107) öffentlicher Schlüssel

k2 = (47053, −4357) privater Schlüssel
A sendet die Nachricht M = 2013 an B und verschlüsselt sie dazu mit Bs öffentlichem
Schlüssel:
C = M 107 mod 47053 ≡ 42747 mod 47053
A versendet C = 42747. B empfängt C und entschlüsselt dieses:
42747−4357 ≡ 105234357 mod 47053 Wegen des negativen Exponenten

wurde zunächst die inverse Rest-
klasse von 42747 in ZZn berechnet.
≡ 2013 mod 47053
Damit hat B den Klartext der von A gesandten Nachricht berechnet.
3.3.2.7.2 Münzwurf per Telefon

Zwei miteinander telefonierende40 Personen wollen eine Münze werfen. Teilnehmer A soll
raten, welche Seite der Münze oben liegen wird. Teilnehmer B wird die Münze werfen
und A mitteilen, ob er richtige geraten hat. Wenn A richtig geraten hat, hat er gewonnen,
sonst hat B gewonnen.
40
ohne Bildübertragung
221
Teilnehmer A Teilnehmer B
rät - wirft die Münze

Welche Seite
?
liegt oben?

Z

oder K
A B
Dabei ergibt sich folgendes Problem: A kann die Münze nicht sehen, er muß sich auf B’s
Aussage verlassen. Wie kann der Teilnehmer B dem Teilnehmer A glaubhaft machen,
daß jener falsch geraten hat?
Ansatz zur Lösung • Wenn A falsch rät, so verrät er damit gleichzeitig eine geheime
dieses Problems: Information. Dadurch daß B seine Kenntnis dieser geheime
Information nachweist, beweist er, daß A falsch geraten haben
muß.
• Die geheime Information (dem Spieler A bekannt, dem Spieler

B unbekannt) ist die Kenntnis der beiden Primfaktoren p und
q einer Zahl
n = p·q
Die Zahl n selber ist beiden Spielern bekannt und ist sehr
groß, etwa
n > 10300
Die Zerlegung n = p · q ist damit ebenso wie beim RSA-Verfahren die vertrauliche
Information, die hier nur dem Teilnehmer A bekannt. Wie schon beim RSA-Verfahren
bemerkt, ist das Berechnen der Zerlegung der Zahl n bei dieser Größenordnung praktisch
unmöglich.
Genau dann, wenn A falsch rät, soll er mit seiner falschen Aussage die bis dahin geheime
Zerlegung n = p · q an B verraten. B soll aus A’s falscher Aussage und dem ihm bekann-
ten korrekten Ergebnis die Zerlegung berechnen können, was andernfalls ja praktisch
unmöglich wäre. Dadurch, daß er nun die Zerlegung kennt, kann B glaubhaft machen,
daß A falsch geraten hat.
Wie kann ein Verfahren so etwas ermöglichen? Grundlage ist das besondere Verhalten
beim Ziehen der Quadratwurzeln im Restklassenring ZZn mit n = p · q.
Als Beispiel werden die Multiplikationstabellen in den beiden Restklassenringen (siehe
auch Seite 202)
• ZZ7
• ZZ7·11
betrachtet. Die Quadrate (die quadratischen Reste) befinden sich auf den Diagonalen.
Die von Null verschiedenen Quadrate wurden unterstrichen:41
41
Wie üblich werden die Restklassen hier wieder durch ihre kleinsten nicht negativen Repräsentanten
dargestellt.
222
∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von ZZ7
∗ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2 0 2 4 6 8 10 12 14 1 3 5 7 9 11 13
3 0 3 6 9 12 0 3 6 9 12 0 3 6 9 12
4 0 4 8 12 1 5 9 13 2 6 10 14 3 7 11
5 0 5 10 0 5 10 0 5 10 0 5 10 0 5 10
6 0 6 12 3 9 0 6 12 3 9 0 6 12 3 9
7 0 7 14 6 13 5 12 4 11 3 10 2 9 1 8
8 0 8 1 9 2 10 3 11 4 12 5 13 6 14 7
9 0 9 3 12 6 0 9 3 12 6 0 9 3 12 6
10 0 10 5 0 10 5 0 10 5 0 10 5 0 10 5
11 0 11 7 3 14 10 6 2 13 9 5 1 12 8 4
12 0 12 9 6 3 0 12 9 6 3 0 12 9 6 3
13 0 13 11 9 7 5 3 1 14 12 10 8 6 4 2
14 0 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Multiplikationstabelle von ZZ3·5
Beim Vergleich der beiden Multiplikationstabellen sollte Folgendes auffallen:
• Bei ZZ7 erscheint jedes Quadrat in der Diagonalen genau zweimal. Das sollte nicht
weiter erstaunen, siehe dazu (3.183), (3.184).
• Bei ZZ3·5 erscheinen hingegen in der Diagonalen einige Quadrate viermal.
Der erste dieser beiden Fällen wurde bereits in Abschnitt 3.3.2.4 (ab Seite 202) erläutert.
Es folgt die Betrachtung der Quadrate in ZZp·q mit den beiden ungeraden Primzahl p
und q. Sei dazu
a = c 2 ∈ ZZp·q (3.241)
ein Quadrat. Wie schon bemerkt, kann die Gleichung
X2 − a = 0 (3.242)
für a 6= 0 bis zu vier Lösungen besitzen. Diese ungewohnte Tatsache liegt daran, daß
ZZp·q kein Körper ist und nicht einmal nullteilerfrei ist42 ist. Sei etwa X = u eine Lösung
42
Aufgabe: Finden Sie mindestens zwei Nullteiler in ZZp·q .
223
von (3.242), dann gilt:
0 = u2 − a = u2 − c2
(3.243)
= (u − c)·(u + c)
Wie üblich erhält man wieder jeweils eine Lösung, wenn einer der beiden Faktoren null
ist.
Aber wenn die Gleichung (3.243) erfüllt ist, so kann man daraus nicht schließend, daß
jeder der beiden Faktoren auf der rechten Seite von (3.243) zwingend null sein muß. Es
ist zusätzlich noch möglich, daß die Faktoren Nullteiler sind.
Man erkennt, daß in der Tat vier Lösungen vorhanden sein können, wenn man die
Entsprechung (3.224) verwendet und jede Restklasse in ZZp·q wieder durch ein Restklas-
senpaar in ZZp × ZZq darstellt. Die Quadratzahl (3.241) wird dann zu
( a , a ) = ( c , c )2 = ( c 2 , c 2 ) ∈ ZZp × ZZq (3.244)
Damit lassen sich sofort vier Lösungen der Gleichung (3.242) angeben:

 1. (+ c , + c )


 2. (− c , − c )

p
(a, a) = (3.245)


 3. (+ c , − c )


4. (− c , + c )
Durch Quadrieren sieht man sofort, daß dieses alles Lösungen von (3.242) (unter Berück-
sichtigung von (3.224)) sind. Daß diese vier Lösungen alle verschieden sein können, zeigt
das folgende
Beispiel: Sei n = 7 · 11. Dann ist wegen
( 3 , 5 )2 = ( 9 , 25 ) = ( 2 + 7 , 3 + 2 · 11 ) = ( 2 , 3 ) (3.246)
( 2 , 3 ) eine Quadratzahl, und die Quadrate der folgenden vier Restklassenpaare ergeben
wieder ( 2 , 3 ):
(+ 3 , + 5 ), (− 3 , − 5 ), (+ 3 , − 5 ), (− 3 , + 5 ) (3.247)
Stellt man ( 2 , 3 ) mit Hilfe des chinesischen Restsatzes (siehe (3.80), (3.82)) durch eine
Restklasse in ZZ77 dar, so erhält man mit 1 = −3 · 7 + 2 · 11:
(2, 3) =
ˆ −3 · 3 · 7 + 2 · ·2 · 11 = −63 + 44 = 58 (3.248)
Ebenso werden die vier Lösungen aus (3.247) durch jeweils eine Restklasse in ZZ77 dar-
gestellt:
(+ 3 , + 5 ) =
ˆ −5 · 3 · 7 + 3 · ·2 · 11 = −105 + 66 = 38
(− 3 , − 5 ) =
ˆ +5 · 3 · 7 − 3 · ·2 · 11 = +105 − 66 = 39
(3.249)
(+ 3 , − 5 ) =
ˆ +5 · 3 · 7 + 3 · ·2 · 11 = +105 + 66 = 17
(− 3 , + 5 ) =
ˆ −5 · 3 · 7 − 3 · ·2 · 11 = −105 − 66 = 60
Wie man sieht, sind alle vier Restklassen in (3.249) unterschiedlich. Die Restklasse
(3.248) aus ZZ77 besitzt tatsächlich vier verschiedene Quadratwurzeln.
224
Wie man anhand von (3.249) und auch von (3.245) sieht, setzen sich die vier Lösungen
aus zwei Paaren zusammen, die jeweils aus zwei Lösungen bestehen. Die beiden Lösungen
eines Paares unterscheiden sich dabei nur um den Faktor −1.
Genau dieses wird beim Münzwurf per Telefon ausgenutzt. Beim Raten muß sich der
Teilnehmer A für eine von zwei Möglichkeiten entscheiden. Diese beiden Möglichkeiten
sind die Lösungspaare bzw. Paare aus Quadratwurzeln eines quadratischen Restes aus
ZZp·q .
Bevor der Ablauf des Münzwurfs per Telefon erläutert werden kann, muß noch gezeigt
werden, wie in ZZp·q aus einem quadratischen Rest die Quadratwurzeln berechnet werden
können. Dabei wird
p ≡ 3 mod 4 q ≡ 3 mod 4 (3.250)
vorausgesetzt, so daß (3.195) angewandt werden kann. Für ein Quadrat in ZZp·q
a = c2 mit einem c ∈ ZZ (3.251)
nutzt man wieder die Entsprechung (3.224), faßt a als Restklassenpaar ( a , a ) in ZZp ×
ZZp auf und zieht aus jeder Komponente einzeln nach (3.195) die Quadratwurzel:
p+1
c1 = a 4 in ZZp
q+1
(3.252)
c2 = a 4 in ZZq
Dieses liefert die vier Quadratwurzeln in ZZp × ZZq
(+ c1 , + c2 ), (− c1 , − c2 ), (− c1 , + c2 ), (+ c1 , − c2 )
die dann wieder mit Hilfe des Chinesischen Restsatzes zu Restklassen in ZZp·q zusammen
gesetzt werden. Nachdem man mit dem euklidischen Algorithmus 1 = s·p+t·q berechnet
hat, setzt man
u1 = c2 · s · p + c1 · t · q
u2 = −u1
(3.253)
u3 = c2 · s · p − c1 · t · q
u4 = −u3
Beispiel: n = 77 = 7 · 11
1. Gegeben ist 23 = 102 . Gesucht sind alle Lösungen in ZZ77 von
X 2 = 23
2. Setze in ZZ7
7+1
c1 = 23 4 = 232 = 4
225
3. Setze in ZZ11
11+1
c2 = 23 4 = 233 = 1
4. Es ist
1 = 2 · 11 − 3 · 7
5. Setze
u1 = +2 · 11 · 4 − 3 · 7 · 1 = 67
u2 = −u1 = −67 =
ˆ 10
u3 = +2 · 11 · 4 + 3 · 7 · 1 = 109 =
ˆ 32
u4 = −u3 = −109 =
ˆ 45
Es folgt der Ablauf des Münzwurfs per Telefon:
• B soll die Münze werfen“.

”
• A soll raten“.
”
1. A:
(a) zufällige Auswahl zweier geheimzuhaltender Primzahlen
p, q > 10150
die beide mit Rest 3 durch 4 teilbar sind.

(b) Berechnung von n = p · q
(c) Senden von n an B
2. B:
(a) zufällige Auswahl einer geheimzuhaltenden Zahl c mit
0 < c < n
(b) Berechnung im Restklassenring ZZp·q von
a = c · c = c2
mit einem Repräsentanten

0 < a < n
(c) Senden von a an A
3. A:
226
(a) kennt die Zerlegung n = p · q und kann damit nach (3.252), (3.253) die vier
Quadratwurzeln von a berechnen:
u1 u2 = −u1
u3 u4 = −u3
(b) Eine der beiden Gleichungen muß gelten:
u1 = ±c
oder u3 = ±c
A rät, welche der beiden Gleichungen gilt, und sendet entsprechend an B
u = u1 oder u = u3
4. B: testet:
gilt x = ±c ?
1. Fall: Gleichung erfüllt, B sendet an A : Du hast gewonnen“

”
2. Fall: Gleichung nicht erfüllt, B sendet an A : Du hast verloren“
”
Um dieses zu beweisen, berechnet B die geheime Zerlegung n = p · q und
sendet diese an A.
Wie kann B die geheimgehaltene Zerlegung n = p · q im 2. Fall berechnen?
Wenn A falsch geraten hat, kennt B von der Gleichung
X2 = a
die beiden Lösungen
c (seine eigene Lösung)
u (die von A gesandte Lösung)
Für diese gilt:

c 6= u und c 6= −u
Daraus erhält B die Zerlegung n = p · q, es gilt nämlich

 p
ggT(u + c, n) = oder
q

227
Der größte gemeinsame Teiler kann schnell durch den euklidischen Algorithmus berech-
net werden.
Begründung der Gleichung

 p
ggT(u + c, n) = oder
q

Zunächst gilt
c 6= u ⇒ c−u 6= 0 ⇒ n = p · q teilt nicht c − u
c 6= −u ⇒ c+u 6= 0 ⇒ n = p · q teilt nicht c + u
andererseits gilt
c2 = a = u 2
⇒ c2 − u 2 = 0
⇒ n = p · q teilt (c2 − u2 ) = (c − u) · (c + u)
Dieses kann nur erfüllt sein, wenn
(c − u) und (c + u)
beide von genau einer der beiden Primzahlen geteilt werden. Damit folgt:
)
ggT(c + u, n) = p
oder umgekehrt
ggT(c − u, n) = q
Beispiel:
1. A:
(a) wählt die beiden Primzahlen p = 7 und q = 11 aus

(b) Sendet an B n = 77
2. B:
(a) wählt aus c = 10 mit

(b) berechnet a = 10 · 10 = 100 = 23
(c) sendet a = 23 an A
3. A:
228
(a) kennt die Zerlegung 77 = 7 · 11 und kann damit die vier Quadratwurzeln
von 23 berechnen (siehe vorne):
67 10 = −67
32 45 = −32
(b) Eine der beiden Gleichungen muß gelten :
67 = ±c
oder 32 = ±c
Zur Erinnerung: A kennt c nicht!

A rät, welche der beiden Gleichungen gilt und sendet entsprechend an B
u = 67 oder u = 32
Angenommen, A rät falsch und sendet u = 32 an B
4. B: stellt fest:
32 6= ±10
und B an A : Du hast verloren“
”
Um dieses zu beweisen, berechnet B die geheime Zerlegung 77 = p · q und sendet
diese an A:
p = ggT(u + c, n) = ggT(32 + 10, 77) = 7
77
q = = 11
7
Dadurch, daß A 32 geraten hat, hat B die fehlende Information zum Herausfinden der
geheimen Zerlegung 77 = 7 · 11 bekommen.
Wie könnte B schummeln?

B müßte dazu die Zerlegung n = p·q direkt, d. h. ohne Kenntnis zweier Quadratwurzeln
c , u von a mit c 6= ± u , herausfinden. Wie schon im Zusammenhang mit dem RSA-
Verfahren erwähnt, ist dieses für große Primzahlen p und q praktisch unmöglich.
229
Kapitel 4
Grundlagen der Vektorrechnung
4.1 Problemstellung und grundlegende Definitionen
Beispiel: Gegeben seien zwei positive Ladun-

gen Q1 und Q2 mit Q1 = 2Q2 ; weiterhin sei w Q2
ein negativ geladenes Teilchen mit Ladung q
vorhanden.
Man stellt fest, daß auf das Teilchen eine
Kraft F1 der Größe
F1
*

F1 = a N
α
u
w
wirkt. q
Vertauscht man die beiden Ladungen Q1 und Q1
Q2 miteinander, so wirkt auf das Teilchen ei-
ne andere Kraft F2 , die denselben Betrag wie
F1 besitzt, sich aber gleichwohl von F1 unter-
scheidet.
Was ist der Unterschied zwischen den beiden Kräften F1 und F2 ?
w Q1
F1 und F2 besitzen denselben Betrag, wirken

F2
aber in unterschiedliche Richtungen.
1 F
*
α
u

w
q
Q2
Dieses Beispiel zeigt: Zur vollständigen Beschreibung einer Kraft ist die Angabe einer
Maßzahl nicht ausreichend; man benötigt zur Darstellung einer Kraft und ebenso zur
Darstellung zahlreicher anderer Größen sogenannte Vektoren.
Ein Vektor wird durch einen Pfeil veranschaulicht und durch die folgenden Angaben
festgelegt:
230
• die Länge des Pfeils, es handelt sich dabei um eine nicht negative Maßzahl;
• eine Richtung, gegeben durch den Winkel des Pfeils zur x-Achse (bzw. bei räum-
lichen Vektoren zusätzlich durch den Winkel zu z-Achse);
• einen Richtungssinn, angedeutet durch die Pfeilspitze.
Länge l *

α

Üblicherweise identifiziert man einen Vektor mit seinem Pfeil und spricht somit von der
Länge, der Richtung und dem Richtungssinn eines Vektors.
Die Lage des Vektors (bzw. seines zugehörigen Pfeils) ist unerheblich; man nennt daher
die Vektoren auch ungebundene Vektoren.
Bemerkung: Ersetzt man in dem Beispiel die Ladung q des Teilchens durch −q, so
wechselt der Kraftvektor seinen Richtungssinn.
Bei der Bezeichnung von Vektoren will man eine deutliche Abgrenzung zu der Bezeich-
nung üblicher Größen vornehmen; von den unterschiedlichen Schreibweisen, die für Vek-
tornamen gebräuchlich sind, sollen hier die beiden folgenden verwendet werden:
• ein kleiner oder großer lateinischer Buchstabe mit einem darüber stehenden Pfeil:
~a, ~b, ~x, ~y , A,

~ B,
~ ...
• ein Pfeil über zwei Großbuchstaben, die den Anfangs- und Endpunkt des Vektors
darstellen:
Q
:

P~Q

P
Beispiele für vektorielle Größen:
• Kraft: F~
F~ )
• Beschleunigung: ~b (= m
• Geschwindigkeit: ~v
~ (= F~ )
• elektrische Feldstärke: E q
• Stromdichte1 : J~ oder S
~
1
Die Anzahl positiver Ladungsträger, die sich je Zeiteinheit und Flächeneinheit in eine bestimmte
Richtung bewegen.
231
Bei einigen Größen reicht zu deren Beschreibung die Angabe einer Maßzahl (einschließ-
lich Vorzeichen), man nennt diese Größen Skalare; Beispiele für skalare Größen sind:
• Masse: m
• Spannung: U
• Ladung: Q
• Energie: W
Definition: Der Betrag eines Vektors ~a ist die Länge des zugehörigen Pfeils, man schreibt
dafür ||~a|| oder auch |~a|.
Der Betrag eines Vektors ist immer eine nicht negative reelle Zahl:
||~a|| ∈ [0, ∞)
Definition: Der Nullvektor ist derjenige Vektor, bei dem Anfangs- und Endpunkt zu-
sammenfallen:
~0 = P~P
Bemerkung: Ein Vektor ist genau dann der Nullvektor, wenn er den Betrag Null besitzt:
||~x|| = 0 ⇔ ~x = ~0
Definition: Ein Vektor der Länge 1 heißt Einheitsvektor:
||~e|| = 1 ⇔ ~e ist Einheitsvektor.
Einen Einheitsvektor verwendet man insbesondere dann, wenn es nur auf die Richtung
und den Richtungssinn eines Vektors ankommt und dessen Länge unerheblich ist.
Definition: Ein Vektor heißt Ortsvektor, wenn sein Anfangspunkt im Ursprung des kar-
tesischen Koordinatensystems liegt:
y
3P

~a ~
~a = OP

O x
Bemerkung: Bei einem Ortsvektor ist dessen Lage in der Ebene bzw. im Raum eindeutig
bestimmt. Ortsvektoren unterscheiden sich damit von den ungebundenen Vektoren, bei
denen die Lage ohne Bedeutung ist.
Definition: Zwei Vektoren ~a und ~b sind genau dann gleich, wenn sie durch Parallelver-
schiebung zur Deckung gebracht werden können. Dieses ist genau dann der Fall, wenn
die beiden Vektoren bezüglich
232
• ihrer Längen,
• ihrer Richtungen
• und ihrer Richtungssinne
gleich sind.

~a ~b
~a ~b

~a = ~b ~a 6= ~b
Wie man erkennt, spielt bei der Gleichheit zweier Vektoren deren Lage keine Rolle.
Anders verhält es sich bei Ortsvektoren: Sind ~a und ~b Ortsvektoren, so ist genau dann
~a = ~b, wenn sie durch denselben Pfeil dargestellt werden.
Definition: (Das Negative eines Vektors) Besitzen die beiden Vektoren ~a und ~b dieselbe
Länge und dieselbe Richtung, aber entgegengesetzten Richtungssinn, so gilt
~a = −~b
Als nächstes soll ein Produkt zwischen einer reellen Zahl und einem Vektor erklärt
werden.
Definition: Sei λ ∈ IR \ {0} eine reelle Zahl und ~a ein Vektor, dann ist
λ · ~a
derjenige Vektor, der
die Länge |λ| · ||~a||





die Richtung von ~a




 und den Richtungssinn von
 ~a für λ>0
−~a für λ<0
besitzt. 0 · ~a ist der Nullvektor.

~a 2~a −2~a

Für diese Multiplikation gelten die beiden Regeln: (λ, µ ∈ IR , ~a ein beliebiger Vektor)
• (λ · µ) · ~a (Assoziativgesetz)
• ||λ · ~a|| = |λ| · ||~a||
233
Mit Hilfe der Multiplikation läßt sich ein von Null verschiedener Vektor ~a durch dessen
Betrag und Richtung darstellen:
~a = a · ~n (4.1)
Dabei stellt der erste Faktor den Betrag von
~a dar: ~a, ||~a|| = a
a = ||~a||
Der zweite Faktor ist ein Einheitsvektor in =1 n, ||~n||

~

Richtung von ~a; er beinhaltet die Richtung
und den Richtungssinn von ~a. Man erhält ~n
durch

~a
~n =
||~a||
Aufgabe: Man zeige durch Nachrechnen, daß ~n tatsächlich ein Einheitsvektor ist.
Als nächstes soll die Addition zweier Vektoren erklärt werden. Zur Herleitung wird von
dem Beispiel auf Seite 230 ausgegangen.
Beispiel: Gegeben seien wieder die beiden po-
w Q2
sitiven Ladungen Q1 und Q2 mit Q2 = 2Q1
sowie das negativ geladene Teilchen mit La-
dung q.
Bezeichnet man die Kraft, die Q1 alleine auf q
ausübt, mit K ~ 1 und die, die Q2 auf q ausübt, ~1
K
mit K~ 2 , so ist die auf q wirkende Gesamtkraft -
*

~
K2 6
F~1 = K~1 + K
~2
offensichtlich die Überlagerung bzw. Summe
u
- w
der beiden Einzelkräfte: q ~1
K Q1
~ ~
F 1 = K1 + K2 ~
Trägt man den Vektor K ~ 1 noch einmal am Endpunkt von K ~ 2 an2 , so stellt man fest, daß
der Vektor F~1 = K ~ 1 +K
~ 2 vom Anfangspunkt von K~ 2 bis zum Endpunkt des verschobenen
Vektors K~ 1 verläuft.
Dieses ist genau die Regel zur Bildung der Summe zweier Vektoren ~a und ~b:
Regel: Man trage den Anfangspunkt des Vektors ~a an den Endpunkt des Vek-
tors ~b an. Der Vektor ~a + ~b verläuft dann vom Anfangspunkt von ~b bis zum
Endpunkt von ~a.
Trägt man beide Vektoren zweimal ein, einmal mit gemeinsamem Anfangs-
punkt und einmal so, daß der Anfangspunkt des einen mit dem Endpunkt des
anderen zusammenfällt, so ist ~a + ~b gerade die Diagonale des entstehenden
Parallelogrammes.
~a ~a
- -
>
>

~b

~b

~b

a + ~b a + ~b

~ ~

-
~a
2
Man beachte, daß diese Vektoren ungebundene Vektoren sind.
234
Führt man diesen Prozeß mehrfach aus, so erhält man eine Vielfachsumme; für die
Zweifachsumme ergibt sich das Bild:
Y
H ~c
HHH
HH

BMB
B
~a + ~b + ~c B
~
Bb
B

~a + ~b
B
B
B
B
-B
~a
Für die Addition zweier Vektoren gelten die folgenden Regeln (~a, ~b, ~c drei beliebige
Vektoren, λ, λ1 , λ2 ∈ IR ):
• ~a + (~b + ~c) = (~a + ~b) + ~c (Assoziativgesetzt),
• ~a + ~b = ~b + ~a (Kommutativgesetz),
• ~a + ~0 = ~a (der Nullvektor ist neutrales Element),
• ~a + (−~a) = ~0 (das Negative des Vektors ist inverses Element),

−~a
:

r
9
~a

P ~a + (−~a) = P~P = ~0
−~
9 a
• (λ1 + λ2 )~a = λ1~a + λ2~a (1. Distributivgesetz)
• λ(~a + ~b) = λ~a + λ~b (2. Distributivgesetz)
Die Vektoraddition liefert zusammen mit der skalaren Multiplikation eine sehr gute
Möglichkeit zur Darstellung einer Geraden:
Man gibt einen Ortsvektor ~a und einen ungebunden, von Null verschiedenen Vektor ~b
vor und bildet mit dem Parameter t ∈ IR die Ortsvektoren
~a + t · ~b
Durchläuft der Parameter t die reellen Zahlen, so bilden die Endpunkte der Ortsvektoren
~a + t · ~b eine Gerade. Man schreibt für die Gerade
n o
~
G = ~a + t · b | t ∈ IR (4.2)
Den Vektor ~b nennt man Richtungsvektor der Geraden. In der folgenden Zeichnung
sind die Vektoren ~a + t · ~b für t = 1.65, 3.4, −1 eingezeichnet; man erkennt, daß die
Endpunkte dieser Vektoren auf einer Geraden liegen.
235
COC OCC
C C
C C
C C
C C
C C
C C
~a + 3.4 · ~b

C C
C 3.4 · b
~
C OC
C C C
C C C
CO C C
~ ~
Cb C1.65 · b C
C C C

~a + 1.65 · ~b C C C
1C

C C
C

C −~b
C
~ a
C
-CW
O ~a − ~b
Als Beispiel für eine Anwendung der Vektoraddition soll bewiesen werden, daß sich die
Diagonalen eines Parallelogrammes halbieren.
~a -
PP
i *AK

K PP
A
A PP A
PP d~
PP
c
A ~ A
A PP A
A ~b
PP
~b A
A

P PP
P A
PP
A P PP A
A PP A
A P- P
A
O ~a
Aus der Zeichnung erkennt man
~c = ~a + ~b, ~b = ~a + d~
Damit folgt:
Mittelpunkt der ersten Diagonalen

1 1 1
= · ~c = · ~a + · ~b (hier ~b = ~a + d~ einsetzen)
2 2 2
1 1 ~
= · ~a + (~a + d)
2 2
1
= ~a + · d~
2
= Mittelpunkt der zweiten Diagonalen
Bemerkung: So wie bei der Anwendung der Vektorrechnung auf geometrische Fragestel-
lung üblich, wurden in diesem Beispiel die Ortsvektoren mit ihren Endpunkten iden-
tifiziert. Man beachte dazu, daß ein Ortsvektor durch seinen Endpunkt festgelegt ist
236
und eine eineindeutige Beziehung zwischen Punkten in der Ebene3 und Ortsvektoren
besteht.
Die Subtraktion zweier Vektoren erfolgt

dadurch, daß zu dem einen das Negative des 7A

anderen addiert wird: A
~b a−b~
A~
A

~a − ~b = ~a + (−~b) A
A
~a AU
-
Anschaulich erhält man den Differenzvektor A
~a −~b als Pfeil, der vom Endpunkt des Subtra- A
henden ~b bis zum Endpunkt des Minuenden −~b A
a−b
A~
~ ~
−b
~a verläuft. Man erhält natürlich ~a − ~b auch A
als Diagonale des aus ~a und ~b gebildeten Pa-
/
A
-AU
/

rallelogrammes. ~a
Durch zwei Punkte verläuft bekanntlich genau eine Gerade. Mit Hilfe der Vektorsubtrak-
tion läßt sich zu zwei gegebenen Punkten P und Q sehr leicht diese Gerade konstruieren.
Man stellt die Gerade in der Form (4.2) dar: Zunächst bildet man die zu den beiden
Punkten gehörigen Ortsvektoren:
~
~x = OP und ~
~y = OQ
Man wählt den einen dieser beiden Vektoren als Ortsvektor der Geraden und die Diffe-
renz der beiden Vektoren als Richtungsvektor der Geraden. Eine Darstellung der Gera-
den durch P und Q lautet damit
G = {~x + t · (~y − ~x) | t ∈ IR } (4.3)
A
A
A
* Q
A

~y AKA
A
y − ~x
A ~
O
XXX
X
A
A
XXX
XXX A
~x XX z
XAP
A
A
G
A
A
Fragen:
1. Man überlege sich anhand eines Beispiels, daß eine Gerade mehrere Darstellungen
der Form (4.2) besitzt.
2. Warum muß bei der Geradendarstellung (4.2) vorausgesetzt werden, daß der Rich-
tungsvektor nicht der Nullvektor ist.
3
bzw. im Raum
237
4.2 Lineare Unabhängigkeit
Die beiden Vektoren ~a und ~b besitzen dieselbe

Richtung; aus diesem Grund läßt sich der ei-
ne Vektor als Vielfaches des anderen darstel-

len. Man sagt in diesem Fall: Die Vektoren ~a

⇒ ~a = λ · ~b
und ~b sind kollinear oder linear abhängig.

~a ~b

Die beiden Vektoren ~a und ~b besitzen unter-

~
a
: schiedliche Richtungen, bei ihnen besteht da-
~b her keine Beziehung der Form

~a = λ · ~b
Die Vektoren ~a sind nicht kollinear, sondern sie sind linear unabhängig. Sie sind
jedoch noch komplanar, da sie sich in einer Ebene befinden.
Auf ähnliche Weise folgt für die drei Vektoren

aus der Zeichnung: Es gibt keine Darstellung ~c 6
der Art *

~
b

~c = λ~a + µ~b (4.4)

r
Die beiden Vektoren ~a und ~b liegen in einer
X r
XX
Ebene, der Vektor ~c ragt aus dieser Ebene XXX
XXX
heraus. XXX
~a
z
Auch hier gilt: Die drei Vektoren ~a, ~b und ~c sind linear unabhängig. Um dieses auszu-
drücken, ist eine Schreibweise der Form (4.4) ungeeignet. Man wählt eine Formulierung,
in der die vorkommenden Vektoren in “gleichberechtigter Form“ erscheinen. Dieses ist
Inhalt der sehr wichtigen und grundlegenden
Definition: Sei n ∈ IN . Die n Vektoren ~a1 , ~a2 , . . . , ~an heißen linear unabhängig, falls
eine Gleichung mit Koeffizienten λ1 , . . . , λn ∈ IR der Form
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an = 0 (4.5)
nur für
λ1 = λ2 = · · · = λn = 0
erfüllt ist. Ist hingegen eine Gleichung der Form
n
X
λi~ai = 0
i=1
erfüllt, bei der mindestens ein λi mit λi 6= 0 vorhanden ist, so heißen ~a1 , ~a2 , . . . , ~an linear
abhängig.
Die Ausdrücke, die in der Definition der linearen Unabhängigkeit erscheinen, werden
auch an anderer Stelle häufig vorkommen; man gibt ihnen daher einen Namen:
Definition: Ein aus n ∈ IN Vektoren ~a1 , . . . , ~an und n reellen Zahlen λ1 , . . . , λn gebildeter
Ausdruck der Form
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (4.6)
238
heißt Linearkombination der ~a1 , . . . , ~an . Unter Verwendung des Summenzeichens be-
kommt eine Linearkombination die Gestalt
n
X
λi~ai
i=1
Bemerkungen:
1. Sind ~a1 , ~a2 , . . . , ~an linear abhängig, so läßt sich mindestens einer dieser Vektoren
durch die übrigen darstellen. Genauer gilt: mindestens ein Vektor läßt sich durch
eine Linearkombination der übrigen Vektoren darstellen.
Wegen der linearen Abhängigkeit der ~a1 , ~a2 , . . . , ~an besteht eine Gleichung der
Form (4.5), bei der mindestens ein Koeffizient λi von Null verschieden ist. Der
zugehörige Vektor ~ai ist dann gleich einer Linearkombination der übrigen Vektoren.
Ist beispielsweise λ1 6= 0, so ist eine Teilung durch λ1 möglich, und man kann die
Gleichung
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (λ1 6= 0)
nach ~a1 auflösen:
n
X λi
~a1 = − ~ai
i=2
λ1
2. Ein einzelner Vektor ~a ist genau linear abhängig, wenn ~a der Nullvektor ist; es gilt
nämlich:
~a 6= 0 ⇔ λ · ~a 6= 0 für alle λ 6= 0
~a = 0 ⇒ 1 · ~a = 0
3. Befindet sich unter den Vektoren ~a1 , . . . , ~an der Nullvektor, so sind diese Vektoren
linear abhängig. Ist etwa ~a1 = 0, so gilt:
1 · ~a1 + 0 · ~a2 + . . . + 0 · ~an = 0
Der Koeffizient von ~a1 ist hier von Null verschieden.
Es folgt ein Beispiel für die Verwendung der linearen Unabhängigkeit: Es soll gezeigt
werden, daß sich die Seitenhalbierenden eines Dreiecks im Verhältnis 2 : 1 schneiden.
Hierzu wird ein Dreieck durch ~a

Z
}
Z
drei Vektoren ~a, ~b und ~c dar- Z
Z
gestellt. Dabei wird vorausge-
Z
Z
setzt, daß die beiden Vekto- 1~ 1
Z
b *Z 2 ~a
ren ~a und ~b linear unabhängig
Z
2 P
i

PP Z
sind. ~
y ~x
P PP Z
PP Z
Die beiden Vektoren ~x und ~y P Z
m~x n~y
PP
PP Z
stellen die Seitenhalbierenden P PP ZZ
auf die Seiten ~a und ~b dar. ~b PP
PZ

P-
ZP
~c
239
Die Abschnitte auf den beiden Seitenhalbierenden von den Eckpunkten bis zu deren
Schnittpunkt entsprechen den Vektoren m · ~x und n · ~y . Die Behauptung ist gezeigt,
wenn man
2
m = n =
3
hergeleitet hat. Dazu werden einige Gleichungen mit Hilfe der Zeichnung aufgestellt:
~a + ~b + ~c = 0 ⇒ ~c = −~a − ~b
1
~x = ~c + ~a
2
1
~y = ~a + ~b
2
m ~x = ~c + n ~y
In die letzte Gleichung werden für ~c, ~x und ~y die drei ersten Gleichungen eingesetzt:
1 1
−m ~a − m ~b + m ~a = −~a − ~b + n ~a + n ~b
2 2
Alle Glieder werden auf die rechte Seite dieser Gleichung gebracht, anschließend werden
die Summanden mit ~a und ~b zusammengefaßt:
−m ~b − 21 m ~a + ~a + ~b − n ~a − 21 n ~b = 0

⇒ 1 1
1 − 2 m − n ~a + 1 − 2 n − m ~b = 0
Da die beiden Vektoren ~a und ~b linear unabhängig sind, sind die Koeffizienten von ~a
und ~b in der letzten Gleichung gleich Null:
 
1
1 − 2m − n = 0   1 m+ n = 1
⇔ 2
1
1 − 2n − m = 0   m+ 21 n = 1
Löst man dieses lineare Gleichungssystem in den unbekannten Werten m und n, so erhält
man als eindeutige Lösung
2 2
m = und n =
3 3
Damit ist die Behauptung gezeigt.
Definition: Ist n ∈ IN0 die maximale Anzahl zueinander linear unabhängiger Vektoren,
so heißt dieses n die Dimension.
Beispiel4
• In der Ebene gilt n = 2.
• Im (Anschauungsraum-) Raum gilt n = 3.

4
Begründungen folgen
240
Q
Q
In der Ebene seien zwei linear unabhängige
Q ~
c
Q
Vektoren ~a und ~b vorgegeben. Weiterhin sei ~a Q
Q
ein beliebiger Vektor ~c gegeben:
~b
:
Qs
Q

Das es sich um drei Vektoren handelt und andererseits aus Dimensionsgründen nur
höchstens zwei Vektoren voneinander linear unabhängig sein können, müssen diese drei
Vektoren linear abhängig sein, d. h. es besteht eine Gleichung
λ · ~a + µ · ~b + ν · ~c = 0
bei der mindestens einer der drei Koeffizienten λ, µ und ν von Null verschieden ist.
Insbesondere ist ν 6= 0; wäre nämlich ν = 0, so verbliebe die Gleichung
λ · ~a + µ · ~b = 0
bei der nach wie vor ein Koeffizient ungleich Null ist, d. h. λ 6= 0 oder µ 6= 0 ist; dieses
ist ein Widerspruch zur linearen Unabhängigkeit von ~a und ~b. Damit folgt:
ν 6= 0

λ µ
⇒ ~c = − · ~a + − · ~b
ν ν
⇒ ~c wird durch Linearkombination von ~a und ~b dargestellt
Da sich ein beliebiger Vektor ~c aus der Ebene so darstellen ließ, bilden ~a und ~b zusammen
eine sogenannte Basis der Ebene.
Definition: Sind Vektoren ~a1 , . . . , ~an mit

1. jeder Vektor ~c läßt sich als Linearkombination der ~ai darstellen:
~c = λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (4.7)
2. die Vektoren ~ai sind linear unabhängig,

gegeben, so heißen die ~a1 , . . . , ~an Basis.
Frage: Warum ist die Darstellung (4.7) eines Vektors durch eine Basis eindeutig?
Antwort: Angenommen, man hat zwei Darstellungen von ~c:
~c = λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an

~c = µ1 · ~a1 + µ2 · ~a2 + . . . + µn · ~an
Die Subtraktion beider Darstellungen voneinander liefert:
~c = (λ1 − µ1 ) · ~a1 + (λ2 − µ2 ) · ~a2 + . . . + (λn − µn ) · ~an (4.8)
Da die ~ai eine Basis bilden, sind sie linear unabhängig. Die Koeffizienten in (4.8) sind
daher Null:
(λ2 − µ2 ) = 0 ⇒ λ2 = µ2 für i = 1, . . . , n
241
Es handelt sich also beide Male um dieselbe Darstellung von ~c durch die Basis (~a1 , . . . , ~an ).
Bemerkung:
maximale Länge eines linear
n = Basislänge =
unabhängigen Systems
Beispiel:
• Ebene: Basislänge=Dimension= 2.
• (Anschauungs-) Raum: Basislänge=Dimension= 3.
Um dieses begründen zu können, benötigt man eine weitere Darstellung der Vektoren,
die Komponentendarstellung.
4.3 Komponentendarstellung
Um Vektoren durch ihre Komponenten darzustellen, geht man von Kartesischen Koor-
dinaten aus:
y z y
6 Ebene 6 Raum
x x
- -
Hier sollen zunächst ebene Vektoren behandelt werden. Ein Vektor ~a ist durch
• seinen Betrag a = ||~a|| und
• seinen Winkel α mit der x − Achse P

a sin α

>
a = ||~a||
gegeben. Als Ortsvektor ist ~a eindeutig
~a ~
~a = OP
durch seinen Endpunkt P bestimmt. Da-
mit ist ~a wiederum durch die Koordi- α

naten seines Endpunktes bestimmt, und
die folgenden Identifizierungen können O a cos α
vorgenommen werden:
~a = ~ =
ˆ OP ˆ Punkt P mit den Koordinaten

a1 a · cos α
= (4.9)
a2 a · sin α
Damit hat man die Komponentendarstellung eines Vektors ~a hergeleitet:

a1
~a =
a2
242
Die Komponenten des Vektors sind die Koordinaten seines Endpunktes, wenn man ihn
als Ortsvektor darstellt.
Wie lauten die Rechenverknüpfungen für Vektoren in Komponentenschreibweise? Mit

den Bezeichnungen von oben ergibt sich für die Multiplikation mit λ ≥ 0 (siehe Seite 233)
(
Betrag : λ · a = λ · ||~a||
λ · ~a −→
Winkel : α
Damit lautet λ~a in Komponentenschreibweise

λa cos α λa1
λ · ~a = = (4.10)
λa sin α λa2
Ist λ < 0, so besitzt λ~a die entgegengesetzte Richtung von ~a:
(
Betrag : |λ| · a = |λ| · ||~a||
λ · ~a −→
Winkel : α + π

~a
Wegen λ = −|λ| sowie cos(α + π) = − cos α
und sin(α+π) = − sin α folgt für diesen Fall: 180◦ α

a
λ~

|λ|a cos(α + π) λa1
λ · ~a = = (4.11)
|λ|a sin(α + π) λa2
Beide Fälle zusammen ergeben die komponentenweise Multiplikation. Ebenso erhält
bei der Vektoraddition die komponentenweise Addition; Man erkennt dieses anhand
der Zeichnung; zur Ausführung der Addition mit Hilfe der Parallelogrammregel (siehe
Seite 234) wurde der Vektor ~b als freier Vektor an das Ende von ~a angetragen:

a1 + b 1
a2 + b 2 a + ~b =
1 ~
7
*
a2 + b 2

a2

1

b2

~b
7
~ a

b1 a1 a1 + b 1
Bemerkung: Ein räumlicher Vektor wird durch drei Komponenten dargestellt, entspre-
chend verlaufen die Rechenverknüpfungen:
   
λa1 a1 + b 1
λ · ~a =  λa2  ~a + ~b =  a2 + b2 
λa2 a3 + b 3
243
z
a cos β ~a

Die Darstellung eines ebenen Vektors durch
y

Betrag und Richtung erfolgt mit Hilfe sei-
nes Winkels mit der x-Achse. Will man einen β

räumlichen Vektor ~a auf diese Weise dar-
stellen, benötigt man zwei Winkel; außerdem
verwendet man die Projektion ~b des Vektors

β
~a auf die xy-Ebene:

* ~b

α

x


 Betrag : a = ||~a||

~a gegeben durch Winkel von ~a mit der z-Achse : β

Winkel der Projektion ~b mit der x-Achse : α


Dabei besitzt die Projektion ~b als z-Komponente den Wert 0 und kann damit als ebener
Vektor auf der xy-Ebene aufgefaßt werden. Da offensichtlich (siehe Zeichnung) 0 ≤ β ≤
π ist, ist sin β ≥ 0; daher gilt
(
Betrag : a sin β = ||~a|| sin β
~b gegeben durch
Winkel mit x-Achse : α
Damit gilt  
a sin β cos α
~b =  a sin β sin α 
0
Die beiden ersten Komponenten von ~b sind auch die ersten beiden Komponenten von ~a;
die z-Komponente von ~a lautet (siehe Zeichnung) a3 = a cos β. Damit wurde hergeleitet:
Die Komponentenschreibweise eines durch Betrag und Richtung gegebenen räumlichen
Vektors lautet:  
a sin β cos α
~a =  a sin β sin α 
a cos β
Jetzt ist man in der Lage, zu zeigen, daß die Ebene die Dimension zwei besitzt; dazu
beweist man:
Satz: Je drei Vektoren der Ebene sind linear abhängig.
Beweis: Seien ~a = (a1 , a2 )t , ~b = (b1 , b2 )t und ~c = (c1 , c2 )t drei beliebige Vektoren der
Ebene. Zu zeigen ist: Es gibt drei Zahlen λ, µ, ν ∈ IR , von denen mindestens eine
ungleich Null ist, so daß gilt
λ · ~a + µ · ~b + ν · ~c = 0 (4.12)
Setzt man die Komponentendarstellungen der Vektoren ein, so erhält man

a1 b1 c1 0
λ· + µ· + ν· =
a2 b2 c2 0
244
Die Zusammenfassung der Vektoren auf der rechten Seite liefert:

λa1 + µb1 + νc1 0
=
λa2 + µb2 + νc2 0
Zwei Vektoren sind genau dann gleich, wenn ihre entsprechenden Komponenten gleich
sind; dieses führt auf die beiden Gleichungen:
λa1 + µb1 + νc1 = 0

λa2 + µb2 + νc2 = 0
Dieses ist ein homogenes lineares Gleichungssystem mit zwei Gleichungen und den drei
Unbestimmten λ, µ und ν; in Matrizenschreibweise lautet es:
 
λ
a1 b 1 c 1 0
◦  µ  =
a2 b 2 c 2 0
ν
Für dieses Gleichungssystem gilt
Rang ≤ 2 = Anzahl der Gleichungen

⇒ Corang ≥ 1 = 3 − 2 = Anzahl der Unbestimmten − Rang
Damit besitzt dieses homogene System mindestens eine von Null verschiedene Lösung
(λ, µ, ν)t ; d. h. es gibt drei Zahlen λ, µ, ν ∈ IR , die nicht alle gleich Null sind und die
das Gleichungssystem und damit (4.12). qed.
Bemerkung: Hier wurde die gängige Methode angewandt, die lineare Unabhängigkeit
bzw. Abhängigkeit von Vektoren durch Rückführung auf ein homogenes lineares Glei-
chungssystem zu testen.
Die oben bewiesene Behauptung besagt, daß
dim Ebene ≤ 2
Um zu zeigen, daß die Dimension tatsächlich zwei beträgt, gibt eine Basis der Ebene
der Länge zwei an. Eine solche Basis ist die Standardbasis, bestehend aus den beiden
Einheitsvektoren
1 0
~e1 = ~e2 =
0 1
Man zeigt leicht, daß diese beiden Vektoren linear unabhängig sind; außerdem stellen
sie jeden beliebigen Vektor der Ebene dar:

a1
= a1 · ~e1 + a2 · ~e2
a2
Auf die gleiche Art zeigt man, daß der Raum die Dimension drei besitzt. Auch hier
bilden die drei Einheitsvektoren
     
1 0 0
~e1 =  0  ~e2 =  1  ~e3 =  0  (4.13)
0 0 1
245
die Standardbasis. Einen beliebigen räumlichen Vektor stellt man damit durch
 
a1
 a2  = a1 · ~e1 + a2 · ~e2 + a3 · ~e3 (4.14)
a3
dar.
Es bleibt noch zu erwähnen, wie sich der Betrag eines Vektors aus dessen Komponenten
errechnet. Man verwendet dazu den Satz des Pythagoras:
q
a2 ||~a|| = a = a21 + a22
*~
a

a

a1
Ebenso hat man im Raum:

q
t
||~a|| = ||(a1 , a2 , a3 ) || = a = a21 + a22 + a23
Bezeichnungen:
Ebene ˜ IR2
= 2-dim. Anschauungsraum =
˜ IR3
“Raum“ = 3-dim. Anschauungsraum =
Neben der Standardbasis (4.13) sind beliebige weitere Basen vorhanden.
Beispiel: Nachzuweisen ist die lineare Unabhängigkeit der beiden Vektoren im Raum
   
3 9
~a =  7  und ~b =  21  (4.15)
5 17
Zu prüfen ist dazu, ob die Gleichung
λ1 ~a + λ2 ~b = 0 (4.16)
nur für λ1 = λ2 = 0 erfüllt ist. Umgeschrieben in ein homogenes lineares Gleichungssys-
tem mit den Unbestimmten λ1 , λ2 lautet diese Gleichung
 
3 9
λ1
 7 21  ◦ = 0 (4.17)
 
λ2
5 17
Das Gaußsche Verfahren (erste Gleichung durch 3 teilen, das 7-fache der ersten Glei-
chung von der zweiten Gleichung und das 5-fache der ersten Gleichung von der dritten
Gleichung abziehen, die dritte Gleichung durch 2 teilen) liefert
 
1 3
λ1
 0 0 ◦ = 0 (4.18)
 
λ2
0 1
246
Man erkennt, der Rang ist 2, und der Corang ist Null. Dieses homogene Gleichungs-
system besitzt daher nur die Nulllösung. In der Gleichung (4.16) ist daher in der Tat
nur λ1 = λ2 = 0 möglich, und die Vektoren ~a und ~b sind linear unabhängig. Sie bilden
aber noch keine Basis, da der Raum die Dimension 3 besitzt. Will man sie zu einer Ba-
sis ergänzen, so benötigt man einen dritten Basisvektor ~c. Da in der reduzierten Form
(4.18) in der zweiten Zeile keine 1-Stufe vorhanden ist, kann man ~c = ~e2 = (0, 1, 0)t als
dritten Basisvektor wählen. Eine Basis des Raumes bilden somit
     
3 9 0
~a =  7  ~
b =  21  ~c =  1  (4.19)
5 17 0
Desweiteren soll der Vektor ~u = (6, −1, 8)t durch diese Basis dargestellt werden. Zu
bestimmen sind dazu λ1 , λ2 , λ3 ∈ IR mit
λ1 ~a + λ2 ~b + λ3 ~c = ~u (4.20)
Umgeschrieben in ein lineares Gleichungssystem lautet dieses

  
3 9 0
  
λ1 6
 7 21 1  ◦  λ2  =  −1  (4.21)
 
5 17 0 λ3 8
Mit dem Gaußschen Verfahren erhält man die reduzierte Form

  
1 3 0
  
λ1 2
 0 1 0  ◦  λ2  =  −1  (4.22)
 
0 0 1 λ3 −15
und damit weiter λ3 = −15, λ2 = −1, λ1 = 5. Das liefert die gesuchte Darstellung des
Vektors ~u durch die Basis (4.19):
       
3 9 0 6
5 ·  7  −  21  − 15 ·  1  =  −1  (4.23)
5 17 0 8
4.4 Ebenen im Raum

Die Darstellung einer Ebene erfolgt ähnlich wie die Darstellung einer Geraden (siehe
Seite 235); man benötigt nur einen zweiten Richtungsvektor, wobei die beiden Rich-
tungsvektoren linear unabhängig sein müssen5 :
E = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR } ⊂ IR3 (4.24)

5
Frage: warum?
247

die Ebene

~a1

3 a0 + λ~
a1 + µ~a2

:~a2
z

~

a

0

y

x
Auf diese Weise seien jetzt zwei Ebenen gegeben:

E1 = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR }
n o
E2 = ~b0 + l · ~b1 + m · ~b2 | l, m ∈ IR
Der Durchschnitt E1 ∩ E2 der beiden Ebenen soll untersucht werden: Liegt der Vektor ~x
im Durchschnitt (~x ∈ E1 ∩ E2 ), so läßt er sich gleichzeitig sowohl durch die definierenden
Vektoren der einen als auch durch die der anderen Ebene darstellen. Es gibt daher
Parameterwerte λ, µ, l, m ∈ IR mit
~x = ~a0 + λ · ~a1 + µ · ~a2 = ~b0 + l · ~b1 + m · ~b2 (4.25)
Da die Punkte im Durchschnitt E1 ∩E2 durch die in der Darstellung (4.25) vorkommenden
Parameterwerte eindeutig bestimmt sind, reicht es, zur Beschreibung von E1 ∩ E2 die
Menge aller Kombinationen von Parameterwerten λ, µ, l, m ∈ IR zu beschreiben, die zu
einer Darstellung der Art (4.25) gehören.
Nun stellt aber (4.25) ein Gleichungssystem der zu ~x ∈ E1 ∩E2 gehörigen Parameterwerte
dar. Formt man (4.25) so um, daß auf der rechten Seite nur die konstanten Summanden
stehen, und setzt man die Komponenten der vorkommenden Vektoren ein, so lautet das
Gleichungssystem
λ · a11 + µ · a12 − l · b11 − m · b12 = −a10 + b10
λ · a21 + µ · a22 − l · b21 − m · b22 = −a20 + b20 (4.26)
λ · a31 + µ · a32 − l · b31 − m · b32 = −a30 + b30
In Matrizenschreibweise lautet dieses Gleichungssystem:
 
  λ  
a11 a12 −b11 −b12  µ  −a10 + b10
 a21 a22 −b21 −b22  ◦   −a20 + b20 
 l  = (4.27)

a31 a32 −b31 −b32 −a30 + b30
m
248
Um E1 ∩ E2 zu beschreiben, muß nun die Lösungsmenge des Gleichungssystems (4.27)
untersucht werden. Die Lösungsmenge hängt vom Rang des Gleichungssystems ab; für
den Rang von (4.27) gilt
Rang ≤ 3 = Anzahl der Gleichungen

⇒ Corang = Anzahl der Unbestimmten − Rang ≥ 4 − 3 = 1
Als erstes Ergebnis erhält man damit: Die Lösungsmenge des Gleichungssystems (4.27)
besteht niemals nur aus einem Element. Angewandt auf E1 ∩ E2 bedeutet dieses: zwei
Ebenen im Raum schneiden sich niemals genau in einem Punkt.
Betrachtet man die möglichen Werte für den Rang im einzelnen, so erhält man:
1. Rang = 3: In diesem Fall ist der Rang gleich der Anzahl der Gleichungen, es
gibt daher keine Nullgleichungen, und das Gleichungssystem ist sicher lösbar.
Da der Corang gleich 1 ist, ist die Lösungsmenge durch eine spezielle Lösung
(λ0 , µ0 , l0 , m0 ) und durch eine Grundlösung (λ1 , µ1 , l1 , m1 ) des zugehörigen homo-
genen Systems gegeben:
 
λ0 + t · λ1
 µ0 + t · µ1 

 l0 + t · l1 
 mit t ∈ IR (4.28)
m0 + t · m1
Welche Gestalt von E1 ∩ E2 folgt hieraus? Da eine Grundlösung eines homogenen

Systems nicht Null ist, muß mindestens eine der Zahlen λ1 , µ1 , l1 , m1 ungleich Null
sein. Sei etwa λ1 6= 0 oder µ1 6= 0, dann setzt man (4.28) in die Darstellung der
Geraden E1 ein6 :
~x = ~a0 + (λ0 + t · λ1 )~a1 + (µ0 + t · µ1 )~a2

= (~a0 + λ0~a1 + µ0~a2 ) + t · (λ1~a1 + µ1~a2 )
für alle t ∈ IR
Dieses ist die Darstellung einer Geraden. In diesem Fall handelt es sich bei E1 ∩
E2 somit um eine Gerade. Zu beachten ist noch, daß die Gerade einen von Null
verschiedenen Richtungsvektor λ1~a1 + µ1~a2 besitzt; dieses liegt an der linearen
Unabhängigkeit von ~a1 und ~a2 .
2. Rang = 2: In diesem Fall besitzt das Gleichungssystem (4.27) nach Reduzierung

eine Nullgleichung; abhängend von deren rechter Seite ergeben sich zwei Möglich-
keiten:
(a) Das Gleichungssystem ist unlösbar und damit E1 ∩ E2 = ∅. Man kann zeigen,
daß dieses genau dann der Fall ist, wenn die beiden Ebenen parallel aber
nicht gleich sind.
(b) Das Gleichungssystem ist mit 2 = (4−Rang) Grundlösungen lösbar. In diesem
Fall ist E1 ∩ E2 eine Ebene und es gilt
E1 ∩ E 2 = E1 = E2
6
Andernfalls würde man (4.28) in die Darstellung der Geraden E2 einsetzen.
249
3. Rang ≤ 1: Man kann zeigen, daß dieser Fall nicht vorkommt. Die Annahme
Rang ≤ 1 führt zu einem Widerspruch zur linearen Unabhängigkeit der beiden
Richtungsvektoren ~a1 und ~a2 bzw. der beiden Richtungsvektoren ~b1 und ~b2
Bemerkung: Das hier vorgestellte Verfahren zur Beschreibung des Durchschnitts zweier
Ebenen ist effektiv: mit ihm läßt sich der Durchschnitt zweier gegebener Ebenen konkret
berechnen.
Aufgabe: Man führe eine entsprechende Überlegung zur Untersuchung des Durchschnitts
zweier Geraden G1 ∩ G2 durch. Man verwende für ~x ∈ G1 ∩ G2 die Darstellung durch die
beiden Geradengleichungen:
~x = ~a0 + λ · ~a1 = ~b0 + l · ~b1
und leite daraus ein Gleichungssystem für die möglichen Parameterwerte ab. Dieses Glei-
chungssystem besitzt den Rang eins oder zwei; es besteht aus zwei oder drei Gleichungen,
je nach dem ob es sich um ebene oder räumliche Geraden handelt.
4.5 Das Skalarprodukt

Das Skalarprodukt ist eine Rechenvorschrift, durch die zwei Vektoren ein Skalar, d. h.
eine reelle Zahl zugeordnet wird. Man stößt auf das Skalarprodukt, wenn man berech-
net, welche Arbeit bei Fortbewegung eines Massenpunktes längs eines gerichteten Stre-
ckenstückes ~s durch eine Kraft F~ geleistet wird. Ausschlaggebend für die geleistete Ar-
beit sind die Länge des Streckenstückes ||~s|| sowie die Länge des Kraftanteils in Richtung
von ~s; ist α der Winkel zwischen ~s und F~ , so beträgt diese Länge ||F~ || · cos α:
F~
*

die geleistete Arbeit:

α W = ||~s|| · ||F~ || · cos α
- ~s
-
||F~ || · cos α
Dieser von den beiden Vektoren ~s und F~ abhängende Ausdruck ist nicht nur bei der
Berechnung der geleisteten Arbeit von Bedeutung. Man trifft daher die folgende
Definition: Für zwei Vektoren ~a und ~b heißt
~a · ~b = ||~a|| · ||~b|| · cos α (4.29)
das Skalarprodukt von ~a und ~b. Dabei ist α der Winkel zwischen den beiden Vektoren
~a und ~b:
*

~a

α
- ~b
250
Eine andere Schreibweise für das Skalarprodukt lautet: (~a, ~b):
Frage: Warum ist es für den Wert des Skalarproduktes unerheblich, ob der größere oder
der kleinere Winkel zwischen den beiden Vektoren verwendet wird?
Bemerkung: Man beachte, daß der Wert des Ausdruckes (4.29) eine reelle Zahl, d. h. ein
Skalar, ist.
Bemerkung: Ist einer der beiden Faktoren des Skalarproduktes der Nullvektor, so ist der
Wert des Skalarproduktes Null. Anders als bei dem Produkt reeller Zahlen ist es beim
Skalarprodukt jedoch möglich, daß sein Wert Null ist und trotzdem keiner seiner beiden
Faktoren gleich dem Nullvektor ist (Beispiel?).
Bemerkung: Mit Hilfe des Skalarproduktes kann nachgerechnet werden, ob zwei von Null
verschiedene Vektoren ~x und ~y aufeinander senkrecht stehen; es gilt nämlich (α ist der
Winkel zwischen ~x und ~y ):
~x⊥~y ⇔ ~x · ~y = 0
⇔ cos α = 0 (4.30)
1 3
⇔ α = π, π
2 2
Für den Nullvektor ~0 und einen beliebigen Vektors ~x liefert das Skalarprodukt den Wert
~0 · ~x = 0
Hieraus folgt: Der Nullvektor steht auf jedem beliebigen Vektor senkrecht.
In vielen Anwendung benötigt man den Anteil eines Vektors, der senkrecht auf einem
anderen Vektor steht. Es soll hergeleitet werden, wie sich dieser senkrechte Anteil
eines Vektors mit Hilfe des Skalarproduktes berechnen läßt. Zunächst muß aber geklärt
werden, was genau darunter zu verstehen ist:
Gegeben seien zwei vom Nullvektor verschiedene Vektoren ~a und ~b. Gesucht ist eine
Zerlegung des Vektors ~a in zwei Summanden:
~a = ~a1 + ~a2 (4.31)
für die gelten soll:

~a 3~a
62
~a1 : ein zu ~b paralleler und gleichgerichteter

Vektor; man nennt ~a1 den Anteil von ~a

in Richtung von ~b
~a2 : ein zu ~b senkrechter Vektor; man nennt

α

~a ~
-1 -b ~a2 den zu ~b senkrechten Anteil von ~a
Der Anteil ~a1 ist leicht zu berechnen; die Zeichnung liefert den Ansatz
Betrag : ||~a|| · cos α

~b
Richtung : ein Einheitsvektor in Rich-
||~b|| tung von ~b (siehe Seite 234)
251
Verwendet man dieses zusammen mit (4.1), so erhält man für ~a1 :
~b
~a1 = (||~a|| · cos α) ·
||~b||
~b
= (||~a|| · ||~b|| · cos α) · (erweitert mit ||~b||)
||~b||2
(~a · ~b) · ~b
=
||~b||2
Der Nenner dieses Ausdrucks soll ebenso wie der Zähler durch das Skalarprodukt aus-
gedrückt werden. Beachtet man, daß der Vektor ~b mit sich selber den Winkel 0 Grad
bildet, so liefert eine kleine Nebenrechnung
||~b||2 = ||~b|| · ||~b|| · cos 0 = ~b · ~b (4.32)
Dieses oben eingesetzt liefert die wichtige Formel für den Anteil von ~a in Richtung ~b
(~a · ~b) ~
~a1 = ·b (4.33)
(~b · ~b)
Man beachte, daß in (4.33) die Punkte für unterschiedliche Multiplikationen stehen: die
in Klammern stehenden Produkte sind Skalarprodukte; der Punkt hinter dem Bruch
bezeichnet die Multiplikation einer reellen Zahl mit einem Vektor.
Nun ist auch offensichtlich, wie man den zu ~b senkrechten von ~a berechnet; aus (4.33)
und (4.31) folgt sofort:
(~a · ~b) ~
~a2 = ~a − ~a1 = ~a − ·b (4.34)
(~b · ~b)
Gilt tatsächlich ~a2 ⊥~b? Nach (4.30) ist dieses mit
~b · (~a − ~a1 ) = 0 (4.35)
gleichbedeutend. Will man diese Gleichung nachrechnen, so stößt man im Augenblick

noch bei der Berechnung von ~b · (~a − ~a1 ) auf Schwierigkeiten. Um ein Skalarprodukt zu
berechnen, dessen einer Faktor eine Summe oder eine Differenz ist, benötigt man noch
einige weitere Eigenschaften des Skalarproduktes. Zu deren Herleitung wird als nächstes
die Komponentenschreibweise des Skalarproduktes eingeführt.
Zu Vereinfachung soll nur der Fall zweidimensionaler Vektoren behandelt werden. Gege-
ben seien die beiden Vektoren ~a, ~b ∈ IR2 mit den Beträgen a und b sowie den Winkeln α
und β mit der x-Achse. Ausgangspunkt ist die Komponentendarstellung (4.9) der beiden
252
Vektoren:
a2 ~a

a1 a cos α a
~a = =
a2 a sin α

α

a1

~b = b1 b cos β
=
b2 b sin β b2 1~
b

b
β
b1
a2 ~a Der Winkel zwischen den beiden Vektoren ~a

und ~b beträgt

a α−β

b2 1~b

Verwendet man dieses bei der Berechnung

b des Skalarproduktes von ~a und ~b, so erhält
α

β man:
a1 b1
~a · ~b = a · b · cos(α − β) (Additionstheorem verwenden!)
= a · b · (cos α cos β + sin α sin β)
= a cos α · b cos β + a sin α · b sin β
= a1 · b1 + a2 · b2
Damit wurde gezeigt: Das Skalarprodukt kann berechnet werden, indem man die entspre-
chenden Komponenten der beiden Vektoren multipliziert und die entstehenden Produkte
addiert. Die entsprechende Formel gilt für Vektoren im IR3 :
~a · ~b = (a1 , a2 , a3 )t · (b1 , b2 , b3 )t = a1 b1 + a2 b2 + a3 b3
und ebenso für Vektoren beliebiger Dimension n ∈ IN :

   
a1 b1 n
~  ..   ..  X
~a · b =  .  ·  .  = ai b i (4.36)
an bn i=1
Die Gleichung (4.36) stellt eine Möglichkeit dar, das Skalarprodukt leicht zu berechnen;
der Cosinus wird dabei nicht mehr benötigt. Weiterhin gestattet die Gleichung (4.36),
die folgenden sehr wichtigen Recheneigenschaften des Skalarproduktes zu beweisen:
253
Satz: Sei λ ∈ IR , und seien ~a, ~a1 , ~a2 , ~b, ~b1 , ~b2 Vektoren. Dann gilt für das Skalarprodukt:
(λ~a) · ~b = λ · (~a · ~b)
~a · (λ~b) = λ · (~a · ~b)
~a · (~b1 + ~b2 ) = ~a · ~b1 + ~a · ~b2
(4.37)
(~a1 + ~a2 ) · ~b = ~a1 · ~b + ~a2 · ~b
~a · ~b = ~b · ~a
~a · ~a > 0 für ~a 6= ~0
Beweis: Durch Nachrechnen mit der Komponentendarstellung (4.36) des Skalarproduk-
tes.
Die Rechengesetze (4.37) des Skalarproduktes sollten einen an die entsprechenden Ge-
setze der reellen Zahlen erinnern: bei den beiden ersten Regeln handelt es sich um
Assoziativgesetze, bei der dritten und vierten Regeln um Distributivgesetze und bei der
vorletzten Regel um ein Kommutativgesetz. Ein Produkt, das die Rechengesetze (4.37)
erfüllt, heißt bilinear.
Wir kommen zum senkrechten Anteil zurück. Nun kann leicht nachgerechnet werden,
daß die Gleichung (4.35) erfüllt ist:
~a2 · ~b = (~a − ~a1 ) · ~b (ausmultiplizieren und für
~a1 einsetzen!)

= ~a · ~b − ~a · ~b · ~b · ~b (die erste Regel aus (4.37)
~b · ~b ~
mit λ = ~~ab··~bb ) anwenden!)
~
= ~a · ~b − ~a · b · (~b · ~b)
~b · ~b
= ~a · ~b − ~a · ~b = 0
Dieses ist gleichbedeutend mit ~b⊥~a2 . Der Vektor ~a2 verdient somit zurecht den Namen
zu ~b senkrechter Anteil von ~a.
Mit Hilfe von (4.37) kann jetzt ein bedeutsamer Satz bewiesen werden, er beinhaltet
zwei wichtige Ungleichungen:
Satz: Für zwei Vektoren ~a und ~b gilt:
|~a · ~b| ≤ ||~a|| · ||~b|| (4.38)
||~a + ~b|| ≤ ||~a|| + ||~b|| (4.39)

Die Ungleichung (4.38) heißt Cauchy-Schwarzsche Ungleichung; die Ungleichung
(4.39) heißt Dreiecksungleichung.
Die Dreiecksungleichung ist schon für reelle @

I
Zahlen bekannt, rechtfertigt aber erst im Zu- ~
@ b
@
sammenhang mit Vektoren ihren Namen:
Die Dreiecksungleichung besagt, daß bei ei- ~a + ~b @
@
nem Dreieck eine Seite höchstens so lang ist @
:

wie die Summe der Längen der beiden ande-
ren Seiten. ~

a

254
Beweis:
zu (4.38): |~a · ~b| = ||~a|| · ||~b|| · | cos α| ≤ ||~a|| · ||~b||
| {z }
≤1
zu (4.39): ||~a + ~b||2 = (~a + ~b) · (~a + ~b) vergleiche mit (4.32); aus-
multiplizieren!
= ||~a||2 + 2 · ~a · ~b + ||~b||2
≤ ||~a||2 + 2 · |~a · ~b| + ||~b||2 Cauchy-Schwarzsche

Ungleichung anwenden!
≤ ||~a||2 + 2 · ||~a|| · ||~b|| + ||~b||2 die erste Binomische For-
mel anwenden!
≤ (||~a|| + ||~b||)2 aus beiden Seiten der Un-
gleichung! die Wurzel zie-
hen
||~a + ~b|| ≤ ||~a|| + ||~b||
qed.
Nach (4.30) liefert das Skalarprodukt eine einfache Möglichkeit, nachzurechnen, wann
zwei Vektoren aufeinander senkrecht stehen: man braucht nur die Gleichung ~x · ~y = 0
nachzuprüfen. Dieses wurde bereits im Zusammenhang mit dem senkrechten Anteil ver-
wandt (siehe (4.35)). Als weiteres Beispiel für diese Anwendung des Skalarproduktes
sowie auch für die Anwendung der Rechenregeln (4.37) soll hier ein einfacher geometri-
scher Sachverhalt nachgewiesen werden.
Es gilt nämlich: Die drei Höhen eines Dreiecks schneiden sich in einem Punkt.
Beweis dieser Aussage: Gegeben sei ein beliebiges Dreieck mit den drei Eckpunkten
A, B und C. Die Höhen durch die beiden Punkte A und B werden eingezeichnet, de-
ren Schnittpunkt werde mit S bezeichnet. Weiterhin seien die drei Vektoren von den
Eckpunkten bis zu dem Punkt S gegeben:
~
~a = AS, ~b = BS,
~ ~
~c = CS
C
S
S
S
S
S
S
Sq
q ~
~c = CS S
b S
b b
S
b S
b S
b
S
bb S
b
b S
b S
b S
b
~
~
a = AS ~b = BS
~ bb S
b S
b
b S
b S
b

bS
A B
255
Die Behauptung ist bewiesen, wenn man zeigen kann, daß die durch C und S verlaufende
Stecke die dritte Höhe des Dreiecks ist. Dieses ist gleichbedeutend damit, daß der Vektor
~c auf dem Vektor AB ~ senkrecht steht. Zu zeigen bleibt daher (siehe (4.30)):
~ = 0
~c · AB (4.40)
Aus der Zeichnung erkennt man sofort die Beziehungen

~ = ~a − ~b,
AB ~ = ~b − ~c,
BC ~ = ~c − ~a
CA
Weiterhin gilt, da nach Konstruktion ~a und ~b auf den Höhen durch A und B liegen:
~a⊥(~b − ~c) ⇔ ~a · (~b − ~c) = 0 und ~b⊥(~c − ~a) ⇔ ~b · (~c − ~a) = 0
Nach diesen Vorüberlegungen kann (4.40) leicht nachgerechnet werden:

~ = ~c · (~a − ~b)
~c · AB (ausmultiplizieren!)
= ~c · ~a − ~c · ~b (geeignet ergänzen!)
= ~c · ~a |− ~b · ~a{z+ ~b · ~a} − ~c · ~b (ausklammern!)
=0
= ~a · (~c − ~b) + ~b · (~a − ~c) (siehe oben!)
= 0+0 = 0
qed.
Es folgen einige weitere nützliche Formeln, die auf dem Skalarprodukt beruhen:
Abstand zweier Punkte : Gegeben seien in der Ebene (n = 2) oder im Raum n ≥ 3
die beiden Punkte P und Q, die zugehörigen Ortsvektoren seien

   P
p1 q1 >

~ =  .  ~ =  .  p~ d
p~ = OP  ..  und ~q = OQ  ..  Q
:
pn qn

~q
O
Der Abstand d zwischen ihnen ist die Länge des zugehörigen Differenzvektors, man
berechnet ihn durch (siehe dazu (4.32) und (4.36), vergleiche auch mit 4.3)
v
u n
p uX
d = ||~p − ~q|| = (~p − ~q) · (~p − ~q) = t (pi − qi )2 (4.41)
i=1
Den Winkel zwischen zwei Vektoren berechnet man mit der Darstellung (4.29)
des Skalarproduktes:
!
~a · ~b
α = arccos (4.42)
~a ||~a|| · ||~b||
*

α -~
b
Dabei wird in der Regel ~a · ~b durch die Komponentendarstellung (4.36) berechnet.
256
Der Schnittwinkel zweier sich schneidender Geraden ist genau der Winkel zwi-
schen den beiden Richtungsvektoren: Sind die beiden Geraden
n o n o
~
G1 = ~a1 + t · b1 | t ∈ IR ~
und G2 = ~a2 + t · b2 | t ∈ IR
gegeben, so erhält man mit (4.42) für deren Schnittwinkel
1G

!
~b1 ~b1 · ~b2
*
α = arccos (4.43)
||~b1 || · ||~b2 ||

α
-
~b2 G2

Berechnung der Komponenten eines Vektors mit Hilfe des Skalarproduktes:
*

Gegeben sei ein Vektor ~a im Raum
durch dessen Betrag und dessen Rich-

tungswinkeln.

~a

Gesucht ist die Komponentendarstellung des Vektors ~a, was gleichbedeutend mit
dessen Basisdarstellung durch die Einheitsvektoren ist (siehe (4.13), (4.14)):
 
a1
~a =  a2  = a1 · ~e1 + a2 · ~e2 + a3 · ~e3
a3
Zunächst beachte man, daß für das Skalarprodukt zweier Einheitsvektoren gilt

1 für i = j
~ei · ~ej = (4.44)
0 für i 6= j
Die Gleichung (4.44) ergibt sich sofort aus der Komponentendarstellung der Ein-
heitsvektoren und des Skalarproduktes. Man kann (4.44) auch nur mit (4.29) und
ohne Verwendung der Komponenten begründen: ein Einheitsvektor besitzt die
Länge ||~ei || = 1, und zwei unterschiedliche Einheitsvektoren stehen aufeinander
senkrecht.
Zur Berechnung von a1 macht man den Ansatz ~a = a1~e1 + a2~e2 + a3~e3 und multi-
pliziert7 beide Seiten dieser Gleichung mit ~e1 :
~a · ~e1 = (a1 · ~e1 + a2 · ~e2 + a3 · ~e3 ) · ~e1
= a1 · ~e1 · ~e1 + a2 · ~e2 · ~e1 + a3 · ~e3 · ~e1
| {z } | {z } | {z }
=1 =0 =0
= a1
Allgemein erhält auf diesem Wege:
ai = ~a · ~ei
(4.45)
= ||~a|| · ||~e|| · cos αi = a · cos αi
7
durch das Skalarprodukt
257
a2 ~a

Dabei ist a = ||~a|| und αi der Winkel ~e2 a

zwischen ~a und der i-ten Koordinaten- 6
achse:
α2
α1
-
~e1 a1
Nächster Geradenpunkt, Abstand Punkt-Gerade

Im IR3 seien ein Punkt und eine Gerade gegeben:
~c ∈ IR3
n o (4.46)
G = ~a + t · ~b | t ∈ IR mit ~b =
6 0
Wie groß ist der Abstand zwischen dem Punkt ~c und der Geraden G?
n

o

G = ~a + t · ~b | t ∈ IR

s
~c
Zur Beantwortung dieser Frage wird zunächst einer anderen Frage nachgegangen:
Welches ist der Punkt ~x0 auf der Geraden, der zu dem gegebenen Punkt ~c den
geringsten Abstand besitzt?
~x0 n
s
o
+ t · ~b | t ∈ IR

G = ~a

s
~c
Gesucht ist somit derjenige Punkt ~x0 ∈ G mit
||~x0 − ~c|| = min ||~x − ~c|| (4.47)

x∈G
~
Die letzte Zeichnung legt folgenden Ansatz zum Finden des Punktes ~x0 nahe:
Wähle ~x0 ∈ G so, daß der Differenzvektor
~u = ~x0 − ~c (4.48)
senkrecht auf der Geraden G steht.
258
~b
n
~x0 :

~
o
~b

G = ~a + t · b | t ∈ IR
OC r

:

C

C
C
C
C ~ u = ~x0 − ~c
~a C
C
C
C
-C
~0
~c
Beachtet man, daß der Vektor ~u = ~x0 −~u genau dann auf der Geraden G senkrecht
steht, wenn er senkrecht auf ihrem Richtungsvektor ~b steht, so erhält man weiter
mit Hilfe des Skalarproduktes:
(~x0 − ~c) ⊥ ~b ⇔ (~x0 − ~c) · ~b = 0 (4.49)
Wegen ~x0 ∈ G besitzt ~x0 mit einem ~t0 ∈ IR d die Darstellung
~x0 = ~a + t0 · ~b (4.50)
Zur Bestimmung von ~x0 ist t0 zu bestimmen. Dazu setzt man (4.50) in die Glei-
chung auf der rechten Seite von (4.49) ein:
0 = (~a + t0 · ~b − ~c) · ~b (ausmultiplizieren)

= (~a − ~c) · ~b + t0 · |{z}
~b · ~b (nach ~t0 auflösen)
||~b||2
(~a − ~c) · ~b
⇒ t0 = − (Beachte: wegen ~b 6= 0 (4.51)
~b · ~b
ist ~b · ~b = ||~b||2 6= 0)
Einsetzen des Parameterwertes (4.51) in die Darstellung (4.50) liefert als erstes
Ergebnis den zu ~c nächst gelegenen Geradenpunkt
(~a − ~c) · ~b ~
~x0 = ~a − ·b (4.52)
~b · ~b
Damit erhält man sofort den Abstand zwischen ~c und der Geraden G. Nach Defi-
nition ist dieses ist dieses gerade der Abstand zwischen ~c und ~x0 :
(~a − ~c) · ~b ~
||~x0 − ~c|| = ||~a − ~c − · b|| (4.53)
~b · ~b
Vergleicht man (4.34) mit dem Vektor auf der rechten Seite von (4.53), so sieht
man, daß dieses genau der zu ~b senkrechte Anteil von ~a − ~c ist.
Zu zeigen bleibt noch, daß der durch (4.52) berechnete Vektor ~x0 tatsächlich der
Geradenpunkt mit dem geringsten Abstand zu ~c0 ist. Bis jetzt ist nur bekannt,
daß ~u = ~x0 − ~c senkrecht auf ~b steht. Zu zeigen ist somit, daß für ein
~x1 ∈ IR3 mit ~x1 6= ~x0
259
die Ungleichung
||~x1 − ~c|| > ||~x0 − ~c||
⇔ ||~x1 − ~c||2 > ||~x0 − ~c||2
⇔ (~x1 − ~c) · (~x1 − ~c) > (~x0 − ~c) · (~x0 − ~c) (4.54)
erfüllt ist. Um das zu zeigen, wird zunächst beachtet, daß ~x0 und ~x1 auf G liegen
und damit die Darstellungen
~x0 = ~a + t0 · ~b ~x1 = ~a + t1 · ~b (4.55)
besitzen. Damit folgt für die Differenz dieser beiden Vektoren
~x1 − ~x0 = (t1 − t0 ) · ~b
⇒ ~x1 = ~x0 + s0 · ~b mit s0 = t1 − t0 (4.56)
Wegen ~x1 6= ~x0 ist dabei t1 6= t0 und damit s0 6= 0.

~x1

r
n o
:
G = ~a + t · ~b | t ∈ IR

~x0

s0 · ~b
t

Jetzt setzt man die die Darstellung (4.56) von ~x1 in die rechte Seite von (4.54) ein:
||~x1 − ~c||2 = (~x1 − ~c) · (~x1 − ~c)
mit binomischer Formel
= ((~x0 + s0 · ~b) − ~c) · ((~x0 + s0 · ~b) − ~c)
ausmultiplizieren
= (~x0 − ~c) · (~x0 − ~c) + 2 · s0 · (~x0 − ~c) · ~b + s20 · (~b · ~b) wegen (4.49)
| {z }
=0
= (~x0 − ~c) · (~x0 − ~c) + s20 · (~b · ~b) wegen s0 6= 0 und ~b 6= 0

| {z }
>0
> (~x0 − ~c) · (~x0 − ~c) = ||~x0 − ~c||2 (4.57)

Damit hat man, wie gewünscht,
||~x0 − ~c|| < ||~x1 − ~c|| (4.58)
gezeigt. Der Punkt ~x0 aus (4.52) ist damit in der Tat derjenige Punkt auf der
Geraden G, der den geringsten Abstand zu ~c besitzt, alle anderen Geradenpunkte
besitzen einen größeren Abstand.
Bemerkung: Hier für den IR3 durchgeführten Überlegungen lassen sich ohne Ände-
rung auf beliebige Dimension übertragen.
260
4.6 Die Hessesche Normalform
4.6.1 Geraden im IR2
Man betrachte eine Gerade in der Ebene (IR2 ), gegeben durch die Darstellung
n o
G = ~a + t · ~b | t ∈ IR (4.59)
Die Darstellung mit Hilfe eines auf der Gerade liegenden Ortsvektors ~a, eines Rich-
tungsvektors ~b der Geraden und des reellen Parameters t heißt Parameterform oder
Parameterdarstellung der Geraden. Diese Darstellung ist u. a. dann günstig, wenn
man die Gerade bzw. einen Teil von ihr zeichnen will. Die Parameterdarstellung ist
jedoch nachteilig, wenn man etwa folgende Frage klären will:
1. Gegeben sei ein beliebiger Vektor ~c ∈ IR2 ; liegt

dieser Vektor auf der Geraden, d. h. gilt ~ b
XXz
X

~c ∈ G ? ~a :

~c
~0
2. Gegeben seien zwei beliebige Vektoren ~c, d~ ∈ IR2 ;

BMB
liegen diese beiden Vektoren auf derselben Seite B
~ b
XX
der Geraden G?
z
X
d~ B ~ a
B
Man beachte dazu, daß eine Gerade die Ebene in
B :
zwei Hälften zerlegt.
B ~c
~0
Die entsprechenden Fragen gelten auch bei einer Ebene im Raum (E ∈ IR3 ). Hier soll
jedoch zunächst der Fall der Geraden im IR2 behandelt werden. Das Ziel besteht darin,
neben der Parameterform eine weitere Geradendarstellung zu finden, mit Hilfe derer
sich diese beiden Fragen und auch noch weitere Fragen leicht beantworten lassen.
Zunächst soll als Spezialfall eine Gerade durch den Nullpunkt betrachtet werden; sie
besitzt eine Parameterform der Gestalt
n o
G = t · ~b | t ∈ IR
Man wählt einen Vektor ~n 6= 0 aus,

der auf dem Richtungsvektor und da- ~n BMB
mit auf der Geraden senkrecht steht:

G
B
1

~
B

b
~n ⊥ ~b ~n · ~b = 0
B

⇔
~0

Dann gilt offensichtlich
G = {Menge aller auf ~n senkrecht stehenden Vektoren}

= {~x ∈ IR2 | ~n · ~x = 0} (4.60)
261
Da bei dem Vektor ~n nur die Richtung von Bedeutung ist, wählt man für ~n einen Vektor
aus, für den neben ~n · ~b = 0 zusätzlich
||~n|| = 1
gilt. Der Vektor ~n heißt Normalenvektor oder, da er die Länge eins besitzt, auch
Normaleneinheitsvektor.
Mit der Gleichung (4.60) hat man für diesen Spezialfall eine neue Darstellungsmöglich-
keit gefunden.
Jetzt zum Fall einer Gerade in allgemeiner Lage; es sei jetzt ~0 6∈ G vorausgesetzt:

G
1

~b
n o
~a + t · ~b | t ∈ IR

G =
~a

~
0
Ebenso wie bei der Parameterform müssen auch hier die Richtung und die Lage der
Geraden festgelegt werden:
1. Die Richtung legt man ebenso wie im Spezialfall ~0 ∈ G durch einen Vektor ~n 6= 0
fest, der auf der Geraden G senkrecht steht:
BMB

~n B 1

G
B
B r
~b
B

BMB
B ~ a
~n B
B
~0
B
Dieses bedeutet insbesondere: ~n steht senkrecht auf dem Richtungsvektor:
~n⊥~b ⇔ ~n · ~b = 0 (4.61)
Da bei ~n nur dessen Richtung bedeutsam ist, verlangt man
||~n|| = 1 (4.62)
Nachdem damit ~n damit Richtung und Länge festliegen, bestehen für die Orien-
tierung dieses Vektors noch zwei Möglichkeiten. Um die Orientierung von ~n auch
noch festzulegen, fordert man:
262
BMB

~n B

G
~n soll vom Nullpunkt aus in Rich- B q
B
tung der Geraden zeigen B

Der Vektor mit der umgekehrten B
B−~ n
Orientierung ist −~n. BMB B
BN
~n B
B
Br
~0
~n ist der Normalenvektor der Geraden.
2. Die Lage der Gerade legt man fest, indem man

d = Abstand der Geraden vom Nullpunkt
G
A
A d
vorgibt. Dabei ist

A
A
d ∈ IR mit d ≥ 0 Ar ~
0
Nachdem man auf diese Weise Richtung und Lage der Geraden festgelegt hat, gewinnt
man daraus eine neue Geradengleichung: Dazu wird ein beliebiger Vektor
~x ∈ G
betrachtet. Der Winkel α sei dann der Winkel zwischen diesem Vektor ~x und dem
Normalenvektor ~n:
BMB

~n B
G

B r
B 7B
B B

α B d = Abstand zwischen ~0 und G
B

~x B
B
rB
B
BMB
α

~n BB

B
Bq

~0
Aus der Zeichnung ergibt sich:
d = ||~x|| · cos α
= ||~n|| · ||~x|| · cos α (wegen ||~n|| = 1)
= ~n · ~x
Damit wurde hergeleitet: Alle ~x ∈ G erfüllen die Gleichung
~n · ~x = d (4.63)
263
Man kann auch umgekehrt zeigen: Erfüllt ein ~x ∈ IR2 die Gleichung (4.63), so liegt (der
Endpunkt von) ~x auf der Geraden; d. h. für alle ~x ∈ IR2 gilt die Aussage
~n · ~x ⇒ ~x ∈ G (4.64)
Beweis8 von (4.64): Man gehe von einer Parameterdarstellung der Geraden aus:
n o
G = ~a + t · ~b | t ∈ IR (4.65)
Weiterhin fasse man die Gleichung
~n · ~x = d
als lineares Gleichungssystem auf; ausgeschrieben lautet dieses Gleichungssystem mit

~n = (n1 , n2 )t und ~x = (x1 , x2 )t
n 1 · x1 + n 2 · x2 = d (4.66)
Die Merkmale dieses aus einer Gleichung mit zwei Unbekannten bestehenden Gleichungs-
systems erkennt man sofort:
• Sein Rang ist 1, da wegen 1 = ||~n|| = n21 + n22 nicht beide Koeffizienten n1 und
p
n2 gleich Null sein können.
• Sein Corang ist 2 − 1 = 1. Außerdem enthält es keine Nullgleichungen.
• Seine Lösungsmenge ist gegeben durch eine spezielle Lösung ~x0 und eine Grundlösung
~x1 des zugehörigen homogenen Systems; sie besitzt die Gestalt
~x0 + t · ~x1 für alle t ∈ IR (4.67)
Mit Hilfe der Parameterdarstellung (4.65) lassen sich für x0 und x1 sofort Werte
angeben:
– Als spezielle Lösung kann man
~x0 = ~a
setzen, denn
~a ∈ G ⇒ ~n · ~a = d
– Als Grundlösung des homogenen Systems kann man
~x1 = ~b
setzen; denn als Richtungsvektor ist ~b ungleich Null, und, da ~n Normalenvek-

tor ist, gilt
~n · ~b = 0
8
Die Kenntnis dieses Beweises ist für das Verständnis des folgenden Stoffes nicht zwingend erforder-
lich. Seine Durcharbeitung wird jedoch dringend empfohlen; sie dient auch der Wiederholung bisherigen
Stoffes.
264
Damit besitzt die Lösungsmenge des Gleichungssystems (4.66) die Darstellung
~a0 + t · ~b1 für alle t ∈ IR
Dieses ist genau die Parameterform (4.65) der Geraden.

Die Lösungsmenge der Gleichung ~n · ~x = 0 ist somit gleich der Geraden. Insbesondere
liegen alle Vektoren ~x ∈ IR2 , die diese Gleichung erfüllen, auf der Geraden G. qed.
Zusammenfassend gilt: Eine Gerade G ⊂ IR2 besitzt eine Darstellung
G = {~x ∈ IR2 | ~n · ~x = d} (4.68)
mit d ∈ IR , d ≥ 0 und ~n ∈ IR2 , ||~n|| = 1. Diese Darstellung heißt Hessesche

Normalform der Geraden.
Die vorkommenden Werte d und ~n besitzen anschauliche Bedeutungen:

• ~n steht senkrecht auf der Gera-
AA ~
n
G
K
A q
den.
A AA d
• d ist der Abstand der Geraden

A
A zum Nullpunkt.
Aq ~
0
Dabei besteht ein wichtiger Spezialfall:
d = 0 ⇔ Der Abstand zum Nullpunkt beträgt Null.

⇔ Die Gerade verläuft durch den Nullpunkt.
Bemerkung: Man beachte, daß nur eine Gerade in der Ebene (IR2 ) eine Hessesche
Normalform (4.68) besitzt, nicht jedoch eine Gerade im Raum (IRn , n ≥ 3).
Aufgabe: Finden Sie die beiden Stellen, an denen die Voraussetzung einging, daß die
bisherigen Betrachtungen für Geraden im IR2 durchgeführt wurden.
Bemerkung: Man erkennt sofort zwei Vorteile der Hesseschen Normalform gegenüber
der Parameterform:
1. Man sieht der Hesseschen Normalform sofort an, ob die betreffende Gerade den
Nullpunkt enthält (~0 ∈ G ⇔ d = 0).
2. Sind zwei Geraden G1 , G2 ∈ IR2 mit Hesseschen Normalformen
G1 = {~x ∈ IR2 | ~n1 · ~x = d1 }

G2 = {~x ∈ IR2 | ~n2 · ~x = d2 }
gegeben, so sieht man diesen sofort an, ob es sich beide Male um dieselbe Gerade
handelt oder nicht. Das erste ist genau dann der Fall, wenn ~n1 = ~n2 und d1 = d2
ist. Mit Hilfe der Parameterdarstellung ist dieses nicht so einfach zu erkennen, da
eine Gerade unterschiedliche Orts- und Richtungsvektoren besitzt.
Mit Hilfe der Hesseschen Normalform können die auf Seite 261 gestellten Fragen leicht
beantwortet werden:
265
1. Liegt ein gegebener Vektor ~c ∈ IR2 auf der Geraden? Dazu prüft man einfach
durch Einsetzen, ob ~c die Gleichung
~n · ~x = d
erfüllt.
2. Liegen die beiden gegebenen Vektoren ~c, d~ ∈ IR2 auf derselben Seite der Geraden?
Hierzu ist zunächst die Frage zu klären, ob ein Vektor ~c ∈ IR2 auf derselben Seite
wie der Nullpunkt liegt9
Die Antwort der zuletzt gestellten Frage ergibt sich sofort aus der folgenden Zeichnung;
dabei ist α der Winkel zwischen dem Normalenvektor ~n und dem Vektor ~c:
XXG XXX
~c >

XXX
XXX
XXX α
XXX
XXX

~n XXX
α
XX
XX
XXX

X

XX
~0 XXX
XXX q

d
l = ||~c|| · cos α
XX
X

Anhand der Zeichnung erkennt man:
~c und ~0 liegen auf entgegengesetzten Seiten der Geraden.

⇔ l = ||~c|| · cos α > d
⇔ 1 · ||~c|| · cos α = ||~n|| · ||~c|| · cos α > d
⇔ ~n · ~c > d
Also gilt:
~c und ~0 liegen auf entgegengesetzten Seiten. ⇐⇒ ~n · ~c > d
Damit läßt sich nun für zwei Vektoren ~c, d~ ∈ IR2 mit ~c, d~ 6∈ G die zweite Frage beant-
worten:
~c und d~ liegen auf derselben Seite der Geraden.

⇔ ~c und d~ liegen beide auf der entgegengesetzten Seite zum Nullpunkt
oder beide auf derselben Seite wie der Nullpunkt.
~n · ~c > d und ~n · d~ > d
⇔
oder ~n · ~c < d und ~n · d~ < d
⇔ (~n · ~c − d) und (~n · d~ − d) besitzen dasselbe Vorzeichen.

9
Dabei wird zunächst davon ausgegangen, daß nicht der Spezialfall ~0 ∈ G vorliegt.
266
Dieses Ergebnis kann man folgendermaßen zusammenfassen: Eine Gerade in der Ebene
G ⊂ IR2 mit Hessescher Normalform
G = {~x ∈ IR2 | ~n · ~x = d}
teilt die Ebene in drei Teile:
1. einen “positiven Teil“, gegeben durch
~n · ~x > d
2. einen “negativen Teil“, gegeben durch
~n · ~x < d
3. die Gerade selber, gegeben durch
~n · ~x = d
Dabei zeigt der Normalenvektor ~n in den “positiven Teil“:
~n
PP G
PP
PP
PP

+
P PP s
P P
PP
− PP
PP
P
Zur Umrechnung zwischen der Parameterform einer Geraden G ∈ IR2 und ihrer Hesse-
sche Normalform:
1. Gegeben sei die Parameterform:

G
1

n o
~b
~
G = ~a + t · b | t ∈ IR

~a

~
0
Zu berechnen ist die Hessesche Normalform:
(a) Berechnung von ~n: Ist ~b = (b1 , b2 )t , so setzt man

b2
m
~ = ⇒ m ~ · ~b = 0
~ 6= 0 und m
−b1
Der Vektor m ~ steht damit bereits senkrecht auf G, die Normierung von m
~
liefert den Normalenvektor:
m
~
~n =
||m||
~
267
(b) Berechnung von d: Da für jedes ~x ∈ G die Gleichung
d = ~n · ~x
erfüllt ist und ~n bereits berechnet wurde, reicht es, in diese Gleichung irgend-
einen Vektor ~x ∈ IR2 , von dem ~x ∈ G bekannt ist, einzusetzen. Da etwa ~a ∈ G
ist, hat man
d = ~n · ~a
Ergibt sich hierbei ein negativer Wert d < 0, so ersetzt man ~n durch −~n und d
durch −d.
2. Gegeben sei die Hessesche Normalform:

KAA ~
n G

A q
A AA d
G = {~x ∈ IR2 | ~n · ~x = d} (4.69)

A
A
Aq ~
0
Zu berechnen ist eine Parameterdarstellung: Man faßt dazu wieder die Gleichung
(4.69) als lineares Gleichungssystem auf (siehe auch Seite 264):
n1 · x1 + n2 · x2 = d
Dieses Gleichungssystem ist lösbar und besitzt den Corang eins. Seine Lösungs-
menge ist durch eine spezielle Lösung und durch eine Grundlösung des zugehörigen
homogenen Systems gegeben.
Diese beiden Vektoren bilden den Orts- und den Richtungsvektor in einer Para-
meterdarstellung der Geraden.
4.6.2 Ebenen im IR3

Ein weiterer Vorteil der Hesseschen Normalform ist deren vollständige Übertragbarkeit
auf Ebenen im Raum (IR3 ).
Sei ~n ∈ IR3 mit ||~n|| = 1 (ein Normalenvektor) und sei d ∈ IR mit d ≥ 0 gegeben, dann
ist die Menge
{~x ∈ IR3 | ~n · ~x = d} (4.70)
eine Ebene im Raum (IR3 ). Zur Begründung dieser Tatsache betrachte man die in (4.70)
enthaltene Gleichung, ausgeschrieben lautet sie mit ~n = (n1 , n2 , n3 )t und ~x = (x1 , x2 , x3 ):
n1 · x1 + n2 x2 + n3 · x3 = d (4.71)
Dieses ist ein lineares Gleichungssystem mit einer Gleichung und drei Unbekannten. Es
besitzt den Rang 1 (wegen ~n 6= 0) und den Corang 2. Seine Lösungsmenge läßt durch
eine spezielle Lösung a0 sowie zwei Grundlösungen des zugehörigen homogenen Systems
darstellen:
a0 + λ · ~a1 + µ · ~a2 mit λ, µ ∈ IR
268
Dieses ist genau die Parameterdarstellung einer Ebene im IR3 (siehe 4.24); die spezielle
Lösung ~a0 ist dabei der Ortsvektor, die Grundlösungen bilden die beiden Richtungsvek-
toren.
Für die Hessesche Normalform einer Ebene E im IR3
E = {~x ∈ IR3 | ~n · ~x = d} (4.72)
gilt entsprechend wie bei Geraden im IR2 :
• Der Normalenvektor steht senkrecht auf der Ebene. Dieses ist gleichbedeutend
damit, daß er auf den beiden Richtungsvektoren senkrecht steht.
• Verläuft die Ebene nicht durch

den Nullpunkt, so zeigt ~n vom
Nullpunkt aus in Richtung der

~
a1
Ebene. ~n 6
q q

-

~a2

Ebene E

~n
6
r~
0
• d ist der Abstand der Ebene vom Nullpunkt, insbesondere gilt
d = 0 ⇔ Die Ebene geht durch den Nullpunkt.
• Ein Vektor ~c ∈ IR3 liegt genau dann auf der Ebenen, wenn ~c die Gleichung ~n ·~x = d
erfüllt.
• Zwei Vektoren ~c, d~ ∈ IR3 liegen genau dann auf derselben Seite der Ebene, wenn
~n · ~c − d und ~n · d~ − d
dasselbe Vorzeichen besitzen.
Es folgen zwei wichtige Anwendungen für die Hessesche Normalform einer Ebene:
4.6.3 Schnittwinkel zweier Ebenen
Gegeben seien zwei Ebenen in Hessescher Normalform:
E1 = {~x ∈ IR3 | ~n1 · ~x = d1 }

E2 = {~x ∈ IR3 | ~n2 · ~x = d2 }
Dabei sind ~n1 und ~n2 deren beiden Normalenvektoren. Betrachtet man die seitliche
Ansicht beider Ebenen:
269
~n2
~n1
KA

A α
A
XX
XXX A
XX
XX A
XXX A α
XXXX
E2

XXX Ebene
XXX

XXX
X

Ebene E1
so erkennt man, daß für ihren Schnittwinkel α gilt:
α = Schnittwinkel zwischen E1 und E2
= Schnittwinkel zwischen ~n1 und ~n2
= arccos(~n1 · ~n2 ) (wegen ~n1 · ~n2 = 1 · 1 · cos α)
4.6.4 Abstand eines Punktes von einer Ebene

Hier soll noch einer weitergehenden Aufgabenstellung nachgegangen werden: Sind ein
Punkt ~c ∈ IR3 sowie eine Ebene in Hessescher Normalform
E = {~x ∈ IR3 | ~n · ~x = d}
gegeben, so ist derjenige Punkt ~x0 ∈ E gesucht, der unter allen Punkten ~x ∈ E den
geringsten Abstand zu ~c besitzt; d. h. für ~x = ~x0 soll der Ausdruck
a = ||~x − ~c|| (~x ∈ E)
minimal werden.
r ~c
a0 = Minimalabstand
= ||~x0 − ~c||
J J
J J
J J
J J
J r ~x0 J
J J
J J
J Ebene E J
J J
Aufgrund der Zeichnungen erkennt man,

daß der Verbindungsvektor PP ~
n seitliche Ansicht
PP
PP
~x0 − ~c
PP
r PP
PP
BMB PP Ebene E
~x
senkrecht auf der Ebene steht; dieses ist ~x0 − ~c B 0
PP
PP
B
gleichbedeutend damit, daß der Vektor ~c B ~0
~x0 − ~c in Richtung des Normalenvektors 9

~n verläuft.
270
Damit liegt der folgende Ansatz für ~x0 auf der Hand: Der am dichtesten zu ~c liegende
Punkt ~x0 auf der Ebene ist der Schnittpunkt zwischen der Ebene und der Geraden
G = {~c + t · ~n | t ∈ IR } (4.73)
= Gerade durch ~c in Richtung des Normalenvektors ~n
Dieser Schnittpunkt ist leicht zu berechnen: Wegen ~x0 ∈ G und wegen (4.73) ist einerseits
~x0 = ~c + t0 · ~n mit einem t0 ∈ IR ; wegen ~x0 ∈ E und wegen (4.72) gilt andererseits die
Gleichung ~n · ~x0 = d. Setzt man diese beiden Gleichungen ineinander ein, so erhält als
erstes den zu ~x0 gehörigen Wert von t0 :
~n · ~x0 = d für ~x0 einsetzten
~n · (~c + t0 · ~n) = d
~n · ~c + t0 · ~|{z}
n · ~n = d
=1
⇒ t0 = d − ~n · ~c
Setzt man diesen Wert wiederum in die Geradengleichung (4.73) ein, so liefert dieses
den gesuchten Vektor ~x0 :
~x0 = ~c + t0 · ~n
= ~c + (d − ~n · ~c) · ~n (4.74)
Für den Abstand zwischen ~x0 und ~c ergibt sich
a0 = ||~x0 − ~c||
= ||~c + (d − ~n · ~c) · ~n − ~c||
= ||(d − ~n · ~c) · ~n||
= |d − ~n · ~c| · ||~n|| = |d − ~n · ~c| (4.75)
|{z}
=1
Es muß allerdings noch gezeigt werden, daß der Abstand (4.75) tatsächlich minimal ist,
d. h. daß gilt
|d − ~n · ~c| = ||~x0 − ~c|| ≤ ||~x − ~c|| für alle ~x ∈ E (4.76)
Sei dazu ~x ∈ E beliebig gegeben. Setzt man hilfsweise
~y = ~x − ~x0 bzw. ~x = ~x0 + ~y
so gilt für den Abstandsvektor ~x − ~c wegen (4.74):
~x − ~c = ~x0 + ~y − ~c
= ~c + (d − ~n · ~c) · ~n − ~c
= (d − ~n · ~c) · ~n + ~y (4.77)
Wegen ~x0 , ~x ∈ E gilt weiterhin:
~n · ~y = ~n · (~x − ~x0 )
= ~n · ~x − ~n · ~x0
= d−d = 0 (4.78)
271
Damit läßt sich jetzt der Abstand ||~x − ~c|| abschätzen. Um Gleichung (4.41) anwenden
zu können, schätzt man das Quadrat des Abstands ab und verwendet dabei (4.77) sowie
(4.78):
||~x − ~c||2 = (~x − ~c) · (~x − ~c)
= ((d − ~n · ~c) · ~n + ~y ) · ((d − ~n · ~c) · ~n + ~y )
= (d − ~n · ~c)2 · ~|{z}
n · ~n + 2 · (d − ~n · ~c) · ~n · ~y + ~y · ~y
|{z}
=1 =0
= (d − ~n · ~c)2 + ~y · ~y
| {z }
x0 −~c||2
=||~
= ||~x0 − ~c||2 + ||~y ||2

≥ ||~x0 − ~c||2 wegen ||~y ||2 ≥ 0
Zieht man aus beiden Seiten dieser Ungleichung noch die Wurzel, so hat man (4.76)
gezeigt. qed.
4.6.5 Der Durchschnitt zweier Ebenen

Der Durchschnitt zweier Ebenen im Raum zwar wurde bereits im Abschnitt 4.4 behan-
delt; jedoch ist dieses mit Hilfe der Hesseschen Normalform sehr viel einfacher und soll
daher hier noch einmal durchgeführt werden. Gegeben seien zwei Ebenen in Hessescher
Normalform
E1 = {~x ∈ IR3 | ~n1 · ~x = d1 }
(4.79)
E2 = {~x ∈ IR3 | ~n2 · ~x = d2 }
mit den zugehörigen Normalenvektoren ~n1 , ~n2 und Abständen vom Nullpunkt d1 , d2 ,
für die gilt
||~n1 || = ||~n2 || = 1, d1 , d2 ≥ 0
Für den Durchschnitt der beiden Ebenen ergibt sich aus (4.79) die Bedingung
(
~n1 · ~x = d1
~x ∈ E1 ∩ E2 ⇔ (4.80)
~n2 · ~x = d2
Bei der rechten Seite (4.80) handelt es sich wieder um eine lineares Gleichungssystem,
für dessen Rang gilt:
0 ≤ Rang ≤ 2 (wegen zweier Gleichungen)
Man nimmt eine Fallunterscheidung nach den möglichen Werten des Ranges vor10 .
Rang 0: Wegen ~n1 6= 0 bzw. ~n2 6= 0 tritt dieser Fall nicht auf.
Rang 1: Eine Reduzierung des Gleichungssystems (4.80) liefert in diesem Fall11 :
~n1 · ~x = d1
(4.81)
0 = β
10
Hierzu sowie für die im Folgenden verwendeten Sachverhalte über lineare Gleichungssysteme siehe
Abschnitt 2.1.
11
wobei hier zur Vereinfachung auf die Normierung der ersten Gleichung verzichtet werden kann
272
Hierbei wurde ein Vielfaches der ersten Gleichung von der zweiten Gleichung abgezogen.
Dabei wurden die Koeffizienten der zweiten Gleichung durch Subtraktion von λ · ~n1
eliminiert, wobei λ ∈ IR ein geeigneter Faktor ist. Dieses bedeutet:
mit einem λ ∈ IR gilt: ~n2 = λ · ~n1
⇒ ||~n || = ||λ · ~n1 ||

| {z2 }
=1
= |λ| · ||~n1 ||
| {z }
=1
⇒ |λ| = 1 ⇒ λ = ±1 (4.82)
Das reduzierte Gleichungssystem (4.80) läßt sich aufgrund von (4.82) somit etwas ge-
nauer darstellen:
~n1 · ~x = d1
(4.83)
0 = d2 − λ · d1 (mit λ = ±1)
Aus (4.82) folgt weiter:
Die beiden Normalenvektoren ~n1 und ~n2 sind entweder gleich (λ = 1) oder
genau entgegengesetzt (λ = −1):
~n1 = ~n2 ~n1

entweder
oder
r

r

~n2 = −~n1
In beiden Fällen ergibt sich, daß die Ebenen E1 und E2 beide auf dem Normalenvektor
~n1 senkrecht stehen.
Hieraus folgt wiederum, daß beide Ebenen E1 und E2 parallel sind. In der Seitenansicht
hat man zum Beispiel:
~n1

HH
HH
H
HH HH
H HH
HH
H HH
HH H
H E1 HHH
HH
H
H E2

~n2
Um nun als nächstes zu prüfen, ob der Durchschnitt der beiden Ebenen nicht leer ist,
schließt man:
E1 ∩ E2 6= ∅
⇔ Das Gleichungssystem (4.80) bzw. (4.81) ist lösbar.
⇔ d2 − λ · d1 = 0
⇔ d2 = λ · d1 (wegen λ = ±1) (4.84)
273
Da d1 ≥ 0 sowie d2 ≥ 0 bekannt ist, ist (4.84) weiter äquivalent zu
d1 = d2 = 0 (4.85)
oder
d1 = d2 und λ = 1 (4.86)
Für diese beiden Fälle ergibt sich:

• Im Fall (4.85) sind beiden Ebenen parallel und enthalten den Nullpunkt. Sie sind
daher gleich.
• Im Fall (4.86) ist wegen λ = 1
~n1 = ~n2 und d1 = d2
Somit sich auch in diesem Fall beide Ebenen gleich:
E1 = E2
Andernfalls gilt nach (4.83) und (4.84):
E1 ∩ E2 = ∅ ⇔ d2 − λ · d1 6= 0 (4.87)
In diesem Fall sind beide Ebenen zwar parallel aber nicht gleich; sie schneiden sich nicht.
Rang 2: In diesem Fall schließt man
Rang = Anzahl der Gleichungen

⇒ Nullgleichungen sind nicht vorhanden.
⇒ Das Gleichungen ist lösbar; insbesondere ist daher
E1 ∩ E2 6= ∅
Weiter schließt man:
Corang = 3 − 2 = 1
⇒ Das Gleichungssystem (4.80) besitzt genau einen Freiheitsgrad,
d. h. es gibt genau eine Grundlösung ~b des zugehörigen homoge-
nen Gleichungssystems.
Mit einer speziellen Lösung ~a des Gleichungssystems (4.80) bzw. (4.81) hat man somit
die Lösungsmenge
n o
E1 ∩ E2 = ~a + t · ~b | t ∈ IR (4.88)
Wie man erkennt, handelt es sich hierbei um eine Gerade.

Zusammenfassend hat man folgendes Ergebnis erhalten: Zwei Ebenen im Raum sind
• entweder gleich
• oder parallel und nicht gleich und damit durchschnittsfremd
• oder ihr Durchschnitt ist eine Gerade.
274
4.6.6 Berechnung der Hesseschen Normalform einer Ebene
Offen ist noch die Frage, wie man zu einer in Parameterform gegebenen Ebene
E = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR }
deren Hessesche Normalform {~n ·~x = d} berechnen12 kann. Dazu bestehen zwei Möglich-
keiten:
1. Möglichkeit : Wegen ~n⊥~a1 und ~n⊥~a2 muß
~n · ~a1 = ~n · ~a2 = 0
gelten. Man kann daher zunächst eine von Null verschiedene Lösung m
~ des homo-
genen linearen Gleichungssystems
~a1 · ~x = 0
~a2 · ~x = 0
bestimmen. Ausgeschrieben lautet dieses Gleichungssystem in Matrizenschreibwei-
se:
 
x1
a11 a12 a13
◦  x2  = 0
a21 a22 a23
x3
Die Normierung der gefundenen Lösung liefert den Normalenvektor:
m
~
~n =
||m||
~
Schließlich setzt man
d = ~n · ~a0 (4.89)
Sollte dieses einen negativen Wert für d ergeben, so ersetzt man ~n durch −~n und
entsprechend d durch −d.
2. Möglichkeit : Man verwendet zur Berechnung des Normalenvektors ~n das sogenann-
te Kreuzprodukt. Mit dem Kreuzprodukt können zwei Vektoren ~a und ~b aus dem
IR3 verknüpft werden; das Ergebnis ist ein weiterer, auf den beiden gegebenen Vek-
toren ~a und ~b senkrecht stehender Vektor. Die Definition des Kreuzproduktes kann
durch die Lorentzkraft motiviert werden.
Wird ein Teilchen mit der elektrischen
Ladung q in einem Magnetfelde der
~ Flußdichte B ~ bewegt und ist ~v dabei die
B
Geschwindigkeit des Teilchens, so wirkt
~
F

auf dieses Teilchen eine Kraft, die senk-
I
@
@ ~v recht zu ~v und B~ ist.
Wie man feststellen kann, gilt für die
@
@
@ α Größe dieser Kraft
@ q
||F~ || ∼ ||~v || · ||B||
~ · | sin α|
@
@
~ und ~v .
mit dem Winkel α zwischen B
12
Die umgekehrte Rechnung erfolgt durch Lösung des Gleichungssystems (4.71).
275
Insbesondere folgt, daß diese sogenannte Lorentzkraft F~ maximal ist, wenn die Be-
wegungsrichtung (gegeben durch ~v ) und die Richtung des Magnetfeldes (gegeben
~ aufeinander senkrecht stehen (α = ±π/2), sie wird Null, wenn ~v und B
durch B) ~
parallel (α = 0, π) sind. Zur Berechnung von F~ dient das üblicherweise mit ×“
”
bezeichnete Kreuzprodukt:
F~ = q · ~v × B
~
Das Kreuzprodukt ist Inhalt des folgenden Abschnitts.
4.7 Das Kreuzprodukt

Definition: Seien ~a, ~b ∈ IR3 ; dann heißt der Vektor
~c = ~a × ~b
das Kreuz- oder Vektorprodukt von ~a und ~b, falls folgende Bedingungen erfüllt sind:
1. Falls ~a und ~b linear abhängig sind, ist ~c = 0.
2. Falls ~a und ~b linear unabhängig sind, gilt:
(a) ~c steht senkrecht auf ~a und auf ~b.

(b) ||~c|| ist der Flächeninhalt F des durch die beiden Vektoren ~a und ~b aufge-
spannten Parallelogrammes:
~b
1

F

-
~a
(c) Die drei Vektoren ~a, ~b, ~c bilden ein Rechtssystem, d. h. schaut man in Rich-
tung von ~c auf die von ~a und ~b aufgespannte Ebene, so verläuft die kürzere
Drehung des ersten Faktors ~a auf den zweiten Faktor ~b im Uhrzeigersinn.13
Die Fläche F kann bekanntlich auf einfache Weise berechnet werden:

~b

F
h
α -
~a
F = h · ||~a|| = ||~a|| · ||~b|| · | sin α| (4.90)

| {z }
h
Man beachte, daß nach Definition (~a × ~b) ⊥ ~a sowie (~a × ~b) ⊥ ~b gilt. Weitere wichtige Ei-
genschaften des Kreuzproduktes, die zum Umgang mit demselben unbedingt erforderlich
sind, liefert der folgende Satz. Erst mit Hilfe des folgenden Satze ist es möglich, mit dem
Kreuzproduktes in ähnlich einfacher Weise wie mit dem Skalarprodukt zu rechnen.
13
Eine weitere Möglichkeit zur Darstellung der Richtung von ~c liefert die Rechtehandregel : Zeigt der
Daumen der rechten Hand in Richtung von ~a, der Zeigefinger in Richtung von ~b, so verläuft deren
Kreuzprodukt ~c = ~a × ~b in Richtung des Mittelfingers.
276
Satz: Seien ~a, ~b, ~c ∈ IR3 und λ ∈ IR beliebig. Dann gilt:
~a × ~b = −~b × ~a (4.91)
~a und ~b linear abhängig ⇔ ~a × ~b = 0 (4.92)
(λ · ~a) × ~b = ~a × (λ · ~b) = λ · (~a × ~b) (4.93)
(~a + ~b) × ~c = ~a × ~c + ~b × ~c (4.94)

(4.94) gilt entsprechend für den zweiten Faktor
des Kreuzproduktes.
Beweis: Zu (4.91): Nach Konstruktion des Kreuzproduktes bewirkt eine Vertauschung

der beiden Faktoren genau eine Umkehrung des Produktvektors.
Zu (4.92):
~a und ~a linear abhängig ⇒ ~a × ~b = 0 nach Konstruktion

~a und ~a linear unabhängig ⇒ Die Fläche des Parallelogrammes ist positiv.
Zu (4.93):
1. Sei λ > 0. Dann wird eine Seite des durch ~a und ~b gebildeten Parallelogrammes
um den Faktor λ gestreckt oder gestaucht14 :
*
~b

- -
~a λ · ~a
Die Fläche wird dann ebenfalls mit dem Faktor λ multipliziert (F → λ · F ).
2. Sei λ < 0. Dann ist λ = −1 · |λ|. Dann folgt:
(λ · ~a) × ~b = |λ| · (−1 · ~a) × ~b
= |λ| · (−~a) × ~b
= |λ| · (−(~a × ~b)) denn die Umorientierung eines Faktors

(~a → −~a) bewirkt aufgrund der Re-
geln des Kreuzproduktes eine Umkehr der
Richtung der Drehung von ~a auf ~b und da-
mit nach Definition des Kreuzproduktes
eine Umorientierung des Produktvektors.
= λ · (~a × ~b)
Zu (4.94):
1. Im ersten Fall seien ~c und ~b linear abhängig, d. h. es sei ~b = λ · ~c:

14
je nachdem, ob λ > 1 oder λ < 1 ist
277
~b -
1

~a
7

h1
h2
~a + ~b

-
~c
Zunächst wird ~a × ~c = (~a + ~b) × ~c gezeigt. Da die beiden Höhen h1 und h2 gleich
sind, kann man schließen:
||~a × ~c|| = h1 · ||~c|| Die Fläche des von ~a und

~c aufgespannten Parallelo-
grammes
= h2 · ||~c|| Die Fläche des von ~a + ~b

und ~c aufgespannten Paral-
lelogrammes
= ||(~a + ~b) × ~c||
Nachdem so gezeigt wurde, daß die beiden Vektoren (~a +~b) × ~c und ~a × ~c denselben
Betrag besitzen, muß noch gezeigt werden, daß sie auch dieselbe Richtung und
dieselbe Orientierung besitzen.
~a und ~c einerseits sowie (~a + ~b) und ~c andererseits spannen dieselbe Ebene auf,
denn ~b und ~c sind linear abhängig (siehe Zeichnung). Da ~a ×~c und (~a +~b) ×~c beide
auf dieser Ebene senkrecht stehen, besitzen diese Vektoren dieselbe Richtung. Da
weiterhin die Drehungen von ~a auf ~c und von ~a +~b auf ~c in derselben Drehrichtung
verlaufen, besitzen die beiden Vektoren ~a × ~c und (~a + ~b) × ~c ebenfalls dieselbe
Orientierung. Es folgt ~a × ~c = (~a + ~b) × ~c. Damit ergibt sich schließlich wegen
(4.92)
(~a + ~b) × ~c = ~a × ~c = ~a × ~c + ~b| {z

× ~}c (4.95)
=0
2. Es sei ~c ⊥ ~a und ~c ⊥ ~b, d. h. ~c stehe sowohl auf ~a als auch auf ~b senkrecht. Damit
ist ebenfalls ~c ⊥ (~a + ~b). Weiterhin ist dann hier wegen (4.90)
||~a × ~c|| = ||~a|| · ||~c|| (4.96)
(4.96) gilt in gleicher Weise für ~b × ~c sowie für (~a + ~b) × ~c.
278
Der Vektor ~c steht senkrecht
auf der von ~a und ~b aufge-
OCC
C
C spannten Ebene. Nach Definition des Kreuzproduktes
C~ c stehen ~a × ~c, ~b × ~c sowie (~a + ~b) × ~c
C
C ~b 1H
ebenfalls senkrecht auf ~c. Sie liegen
q
HH
C q

~ damit in derselben Ebene wie ~a und
~a + b
HH
CH

H
-
~b, nämlich in der zu ~c senkrechten
B H
B HHH

Ebene.
B ~a j
H
Da auch ~a × ~c auf ~a senkrecht steht,
B
~a × ~c B ergibt sich die Richtung von ~a × ~c
B durch eine Drehung um 90◦ in der
B~
Bb × ~ c

zu ~c senkrechten Ebene. In gleicher
B B Weise ergeben sich die Richtungen
von ~b × ~c und (~a + ~b) × ~c, nämlich
B B
B B
B B
BN ebenfalls durch entsprechende Dre-
B hungen von ~b bzw. ~a + ~b um 90◦ ,
wobei - aufgrund der Definition des
B
B
B Kreuzproduktes - die Drehrichtung
B
B
dieselbe ist.

B
B
B?
(~a + ~b) × ~c
Insgesamt unterliegen die drei Vektoren ~a × ~c, ~b × ~c und (~a + ~b) × ~c damit dersel-
ben Drehstreckung15 : einerseits ergeben sich die oben angegebenen Drehungen um
90◦ ; andererseits werden wegen (4.96) alle Vektoren mit dem selben Faktor ||~c||
multipliziert.
Nun beachtet man die Diagonale des von ~a und ~b aufgespannten Parallelogrammes;
diese ist durch ~a + ~b gegeben und wird bei der Drehstreckung in die Diagonale des
durch ~a × ~c und ~b × ~c aufgespannten Parallelogrammes, d. h. in ~a × ~c + ~b × ~c
überführt, also
~a + ~b → ~a × ~c + ~b × ~c
Andererseits ist das Ergebnis dieser Drehstreckung nach Definition ja gerade das
Kreuzprodukt von ~a + ~b mit dem Vektor ~c. Damit ist in der Tat für diesen Fall:
(~a + ~b) × ~c = ~a × ~c + ~b × ~c
3. Seien nun ~a, ~b, ~c ∈ IR3 beliebig. Dann nimmt man für ~a und ebenso für ~b eine
Aufspaltung in einen zu ~c senkrechten Anteil und einen Anteil, der parallel zu ~c
ist, vor (siehe dazu (4.33), (4.34)):
setze ~a = ~a1 + ~a2 mit ~a1 = λ1 · ~c und ~a2 ⊥ ~c

(4.97)
~b = ~b1 + ~b2 mit ~b1 = λ2 · ~c und ~b2 ⊥ ~c
15
Als Drehstreckung“ bezeichnet man die Drehung eines Vektors um einen bestimmten Winkel mit
”
zusätzlicher Multiplikation dieses Vektors mit einer reellen Zahl.
279
λ1 , λ2 ∈ IR entsprechen dem Faktor auf der rechten Seite von (4.33). Die Zerle-
gungen (4.97) führen zu einer entsprechenden Zerlegung für den Summenvektor:
~a + ~b = (~a1 + ~b1 ) + (~a2 + ~b2 )

(4.98)
wobei gilt (~a1 + ~b1 ) = λ · ~c und (~a2 + ~b2 ) ⊥ ~c
Hiermit berechnet man
(~a + ~b) × ~c = (~a1 + ~a2 + ~b1 + ~b2 ) × ~c

= (~a1 + ~b1 + ~a2 + ~b2 ) × ~c
= (~a2 + ~b2 ) × ~c wegen (4.98), (4.95)
= ~a2 × ~c + ~b2 × ~c wegen (4.97) und we-
gen des 2. Falles (siehe
Seite 278)
= (~a1 + ~a2 ) × ~c + (~b1 + ~b2 ) × ~c Hierbei wurde zweimal
(4.95) angewandt.
= ~a × ~c + ~b × ~c
qed.
Grundlegend sind die Werte des Kreuzproduktes bei den drei Einheitsvektoren ~e1 , ~e2 ,
~e3 . Da die drei Einheitsvektoren die Länge eins besitzen und paarweise aufeinander
senkrecht stehen, folgt aus der Definition des Kreuzproduktes (bzw. mit der Rechte-
handregel)16
~e1 × ~e2 = ~e3 , ~e2 × ~e3 = ~e1 , ~e3 × ~e1 = ~e2 , ~ei × ~ei = 0 (4.99)
Mit des Satzes auf Seite 277 kann aus (4.99) die Komponentendarstellung des Kreuz-
produktes gewonnen werden. Für zwei Vektoren ~a, ~b ∈ IR3 setzt man dazu
3
X 3
X
t
~a = (a1 , a2 , a3 ) = ai · ~ei , sowie ~b = (b1 , b2 , b3 )t = bi · ~ei (4.100)
i=1 i=1
16
Die ersten drei Ausdrücke in (4.99) ergeben sich genau durch eine zyklische Vertauschung der drei
Einheitsvektoren ( Rechtssystem“).
”
280
und berechnet ausgehend von (4.100)
3
!
X
~a × ~b = ai · ~ei × ~b (nach (4.100))
i=1
3
X
= ai · ~ei × ~b (nach (4.94), (4.93))
i=1
3 3
!
X X
= ai · ~ei × bj · ~ej (nach (4.100))
i=1 j=1
3 X
X 3
= ai · bj · (~ei × ~ej ) (nach (4.94), (4.93))
| {z }
i=1 j=1
= 0 für i = j
= a1 · b2 · (~e1 × ~e2 ) + a1 · b3 · (~e1 × ~e3 ) (nach (4.99))

| {z } | {z }
~e3 −~e2
+ a2 · b3 · (~e2 × ~e3 ) + a2 · b1 · (~e2 × ~e1 )
| {z } | {z }
~e1 −~e3
+ a3 · b1 · (~e3 × ~e1 ) + a3 · b2 · (~e3 × ~e2 )
| {z } | {z }
~e2 −~e1
= ~e1 · (a2 · b3 − a3 · b2 )
+ ~e2 · (a3 · b1 − a1 · b3 )
+ ~e3 · (a1 · b2 − a2 · b1 )
Wandelt man den letzten Ausdruck in Komponentendarstellung um (siehe Abschnitt 4.3),

so liefert dieses die gesuchte und zum praktischen Rechnen sehr nützliche Komponen-
tendarstellung des Kreuzproduktes:
a2 · b 3 − a3 · b 2
 
~a × ~b =  a3 · b1 − a1 · b3  (4.101)
 
a1 · b 2 − a2 · b 1
Als Merkregel“ für die Darstellung (4.101) des Kreuzproduktes eignet sich folgende
”
Formel, die auf der Determinanten beruht:
~e1 a1 b1
 
~a × ~b = det  ~e2 a2 b2  (4.102)

 
~e3 a3 b3
Die rechte Seite von (4.102) ist als formale Schreibweise aufzufassen. Die Determinante
in (4.102) ist nach der ersten Spalte zu entwickeln (siehe (2.81)). Das Ergebnis ist dann
genau die rechte Seite von (4.101).
Folgerung: Für ~a, ~b, ~c ∈ IR3 liefert die gemeinsame Anwendung des Skalarproduktes
und des Kreuzproduktes
~c · (~a × ~b) = det(~c, ~a, ~b) (4.103)
281
Auf der rechten Seite von (4.103) steht die Determinante der aus den drei Spaltenvek-
toren ~a, ~b und ~c gebildeten Matrix.
Beweis:
c 1 a1 b 1
 
(Entwicklungssatz auf die
det  c2 a2 b2 
 
erste Spalte anwenden)
c 3 a3 b 3
= c1 · (a2 b3 − b2 a3 ) − c2 · (a1 b3 − b1 a3 )
+ c3 · (a1 b2 − b1 a2 )
a2 · b3 − ~a3 · b2
 
= (c1 , c2 , c3 ) ◦  a3 · b1 − ~a1 · b3 
 
a1 · b2 − ~a2 · b1
= ~c t ◦ (~a × ~b) = ~c · (~a × ~b)

qed.
Die Gleichung (4.103) führt auf eine anschauliche Deutung der dreidimensionalen De-
terminanten. Faßt man dazu die Determinante als Funktion der drei Spaltenvektoren
det(~c, ~a, ~b)
auf, so gilt:
| det(~c, ~a, ~b) | = Volumen des von den drei Vektoren ~c, ~a, ~b (4.104)
aufgespannten Parallelotops im IR3
Ein Parallelotop (auch Spat, Parallelflach oder Parallelepiped genannt) ist ein drei-
”
dimensionales Parallelogramm“:
....... ..... ..... ..... ..... ..... ..... ..... ..... ............... ...
.. ... . ... .. .. ...
. ... .
. ..
. . . ... ... ...
.. ..
........... .... .... .... .... ..... ..... ............. ..... .......... ...
...
.... .. .. ..
.... .. ..
.... ........... ..... ..... ...... ..... ..... ..... ..... ..... ..... ..........
.
~c ....... ~b ........... ... ..
.... .... ... . .. ...
.
.... ....... .
..................................................................................................... .... .
~a ..
Zur Berechnung des Volumens dieses dreidimensionalen Körpers wählt man eine seitliche
Ansicht:
A
K
A
A 6
A ~
c ~a × ~b
A
h = ||~c|| · | cos α | A α
A
A
A
A Ebene von ~a, ~b
282
Hierbei ist h die Höhe des von ~c, ~a, ~b aufgespannten Parallelotops; für dessen Volumen
gilt dann:
vol(~c, ~a, ~b) = h · Grundfläche

= h · ||~a × ~b||
= ||~c|| · | cos α | · ||~a × ~b||
= ||~c|| · ||~a × ~b|| · | cos α | (Skalarprodukt)
= | ~c · (~a × ~b) | = | det(~c, ~a, ~b) | (nach (4.103))
Der Ausdruck ~c · (~a × ~b) wird wegen (4.103), (4.104) als Spatprodukt bezeichnet.
Bemerkung: (4.105) läßt sich auf den n-dimensionalen Fall verallgemeinern; betrachtet
man das durch Vektoren ~a1 , ~a2 , . . . , ~an ∈ IRn aufgespannte n-dimensionale Parallelotops,
so kann auch dessen Volumen durch die Determinante berechnet werden:
| det(~a1 , ~a2 , . . . , ~an ) | = orientiertes Volumen des von den n Vekto- (4.105)
ren ~a1 , ~a2 , . . . , ~an aufgespannten Parallelotops
im IRn
Unter dem orientierten Volumen versteht man das vorzeichenbehaftete Volumen. Das
Vorzeichen hängt von der Reihenfolge der aufspannenden Vektoren ~a1 , ~a2 , . . . , ~an ∈ IRn
ab; bei jeder paarweisen Vertauschung erfolgt ein Vorzeichenwechsel. Das Vorzeichen des
orientierten Volumens ist dann aufgrund von (4.105) gerade gleich den Vorzeichen der
Determinanten.
Zur Berechnung des Betrages des Kreuzproduktes ~a × ~b und damit der Fläche des von
~a und ~b aufgespannten Parallelogrammes kann das Skalarprodukt verwendet werden.
Satz: Für ~a, ~b ∈ IR3 gilt:
||~a × ~b||2 = ||~a||2 · ||~b||2 − (~a · ~b)2 (4.106)
Beweis: α sei der von ~a und ~b eingeschlossene Winkel. Dann ist nach (4.90)
||~a × ~b||2 = ||~a||2 · ||~b||2 · sin2 α
= ||~a||2 · ||~b||2 · (1 − cos2 α)
= ||~a||2 · ||~b||2 − ||~a||2 · ||~b||2 · cos2 α (siehe (4.29)) qed.

| {z }
(~a·~b)2
Eine in vielen Fällen recht nützliche Formel für die zweifache Anwendung des Kreuz-
produktes liefert der folgende Satz.
Satz: (Entwicklungssatz für das Kreuzprodukt) Für ~a, ~b, ~c ∈ IR3 gilt:
~c × (~a × ~b) = (~b · ~c) · ~a − (~a · ~c) · ~b (4.107)
Zur teilweisen Plausibilisierung von (4.107) kann bemerkt werden, daß der Vektor d~ =
~c × (~a × ~b) auf ~a × ~b senkrecht steht. Auf ~a × ~b stehen ebenso die beiden Vektoren ~a
und ~b senkrecht. Folglich muß d~ in der von ~a und ~b aufgespannten Ebene enthalten sein
und ist damit eine Linearkombination von ~a und ~b.
283
Zum Beweis (von (4.107)): Zunächst berechnet man (4.107) für den Spezialfall ~c = ~e1 ;
zunächst wird dabei für ~a × ~b von Darstellung (4.101) ausgegangen:
~e1 × (~a × ~b) = ~e1 × ((a2 b3 − a3 b2 ) · ~e1 + (a3 b1 − a1 b3 ) · ~e2

+ (a1 b2 − a2 b1 ) · ~e3 )
= (a3 b1 − a1 b3 ) · ~e3 − (a1 b2 − a2 b1 ) · ~e2 (nach 4.99)
   
0 0
=  b 1 a2  −  a1 b 2 
b 1 a3 a1 b 3
   
b 1 a1 a1 b 1
=  b 1 a2  −  a1 b 2 
b 1 a3 a1 b 3
= b1 · ~a − a1 · ~b
= (~b · ~e1 ) · ~a − (~a · ~e1 ) · ~b
Damit hat man (4.107) für ~c = ~e1 gezeigt:
~e1 × (~a × ~b) = (~b · ~e1 ) · ~a − (~a · ~e1 ) · ~b (4.108)
Ganz entsprechend berechnet man
~e2 × (~a × ~b) = (~b · ~e2 ) · ~a − (~a · ~e2 ) · ~b (4.109)
~e3 × (~a × ~b) = (~b · ~e3 ) · ~a − (~a · ~e3 ) · ~b (4.110)
Für ein allgemeines ~c ∈ IR3 verwendet man die Darstellung ~c = c1~e1 + c2~e2 + c3~e3 sowie
(4.108), (4.109), (4.110):
3
!
X
~c × (~a × ~b) = ci~ei × (~a × ~b)
i=1
3
X
= ~
ci · ~ei × (~a × b) (hier (4.108), (4.109), (4.110)
i=1 einsetzen)
3
X
= ci · (~b · ~ei ) · ~a − (~a · ~ei ) · ~b
i=1
3
! 3
!
X X
= (~b · ci · ~ei ) · ~a − (~a · ci · ~ei ) · ~b
i=1 i=1
= (~b · ~c) · ~a − (~a · ~c) · ~b
qed.
Zum Abschluß dieses Abschnitts folgen noch drei Anwendungen des Skalarproduktes:
284
1. Einen Normalenvektor ~n zu einer Ebene
E = {~a0 + λ~a1 + µ~a2 | λ, µ ∈ IR }
d. h. einen auf E senkrecht stehenden Vektor der Länge 1 erhält man als normiertes
Kreuzprodukt der beiden Richtungsvektoren:
~a1 × ~a2
~n = (4.111)
||~a1 × ~a2 ||
2. Der Abstand zwischen einem Punkt ~x ∈ IR3 und einer Geraden:

:
~a1 AA

C

G= {~a0 + t · ~a1 }
A
C A
A K C A
A C A
A
A~a0 − ~x C h A
C A
A
~a0 A C
C r
A
:

A C
A

A ~
*

a1

~ x

Der Abstand zwischen dem Punkt ~x und der Geraden G ist genau die Höhe h des
vom Richtungsvektor ~a1 und vom Vektor ~a0 − ~x (einem von ~x nach G führenden
Vektor) aufgespannten Parallelogrammes. Man erhält die Höhe h, indem man die
Parallelogrammfläche (gegeben durch das Kreuzprodukt ~a1 × (~a0 − ~x)) durch die
Länge der Grundlinie des Parallelogrammes (gegeben durch ~a1 ) teilt:
||~a1 × (~a0 − ~x)||

h = (4.112)
||~a1 ||
3. Ähnlich geht man bei der Berechnung des Abstands zweier Geraden
G1 = {~a0 + λ · ~a1 }, G2 = {~b0 + µ · ~b1 } ⊂ IR3
in allgemeiner Lage17 vor. Der Abstand ist gerade die Höhe d des von den bei-
den Richtungsvektoren ~a1 und ~b1 sowie dem Verbindungsvektor ~a0 − ~b0 zwischen
den beiden Geraden aufgespannten Parallelotops. Die Höhe dieses Parallelotops
berechnet man, indem man dessen Volumen (gegeben durch (4.104) bzw. durch
(4.103)) durch dessen Grundfläche (gegeben durch das Kreuzprodukt der beiden
Richtungsvektoren) teilt:
| det((~a0 − ~b0 ), ~a1 , ~b1 )| |(~a0 − ~b0 ) · (~a1 × ~b1 )|

d = = (4.113)
||~a1 × ~b1 || ||~a1 × ~b1 ||
17
zweier sogenannter windschiefer Geraden“
”
285
Literaturverzeichnis
[1] Fetzer/Fränkel. Mathematik - Lehrbuch für Fachhochschulen, Bd I und II. VDI

Verlag
[2] Stingl. Mathematik für Fachhochschulen. Hanser-Verlag
[3] Arens/Hettlich/Karpfinger et al.. Mathematik. 2008.

ISBN 978-3-8274-1758-9
[4] Meyberg/Vachenauer. Höhere Mathematik, Band 1 und Band 2 . 2001.

ISBN 3-540-41850-4, ISBN 3-540-41851-2
[5] Trinkaus. Probleme? Höhere Mathematik. 1988

ISBN 3-540-19346-4
[6] Beutelspacher/Zschiegner. Diskrete Mathematik für Einsteiger. 2011.

ISBN 978-3-8348-1248-3
[7] Hartmann. Mathematik für Informatiker . 2012.

ISBN 978-3-8348-1856-0, ISBN 978-3-8348-2002-0 (eBook)
[8] Teschl/Teschl. Mathematik für Informatiker, Band 1. 2008.

ISBN 978-3-540-77431-0, e-ISBN 978-3-540-77432-7
[9] Welsh. Codes and Cryptography . 1998.

ISBN 0-19-853287-3
[10] Kranakis. Primality and Cryptography .

1986, ISBN 0-471-90934-3, 3-519-021048-8
[11] Stöcker. Taschenbuch mathematischer Formeln und moderner Verfahren. Verlag

Harri Deutsch
[12] Bartsch. Taschenbuch mathematischer Formeln. Fachbuchverlag Leibzig
286

Mathe 1

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Mathe 1

Hochgeladen von

Copyright:

Verfügbare Formate

Fakultät Ingenieurwissenschaften und Informatik

Mathematik 1 für Informatik

Version für das Wintersemester 2020

Osnabrück, Juli 2018

3 Elemente der diskreten Mathematik 143

1.1 Der Begriff der Menge und die reellen Zahlen

Eine Menge ist die Zusammenfassung wohlunterschiedener Objekte unserer

nach G. Cantor, 1895

x∈M (x ist Element der Menge M )

N ⊂M (die Menge N ist eine Teilmenge der Menge M )

Zur Darstellung von Mengen verwendet man die

Die bedeutsamste Zahlenmenge ist

IR = Menge der reellen Zahlen

Eine reelle Zahl x wird durch einen unendlichen Dezimalbruch dargestellt:

x = an an−1 . . . a1 a0 , a−1 a2 . . . mit ai ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

I = (a, b) = {x ∈ IR | a < x < b}

Die Randpunkte a und b sind nicht Elemente des offenen Intervalls.

Hier gehören die Randpunkte zum Intervall.

halboffen: [a, b) = {x ∈ IR | a ≤ x < b}

positive reelle Zahlen :

IR+ = (0, ∞) = {x ∈ IR | 0 < x}

natürliche Zahlen einschließlich der Null :

Dieser Abstand kann beliebig klein gewählt werden.

Durch solche Einschachtelungen gewinnt man näherungsweise Darstellungen der

Zwischen einigen der genannten Mengen bestehen Teilmengenbeziehungen:

Ebenso gilt natürlich für jedes Intervall I:

Durch Bildung der Differenzmenge2 erhält man weitere Teilmengen von IR :

1.1.5 Das kartesische Produkt

Zur Darstellung eindimensionaler Objekte dienen die reellen Zahlen:

Die Ebene stellt man durch zwei Geraden dar:

ein Punkt, dargestellt

Beide Achsen entspre-

Beispiel: Ein kartesisches Produkt zweier Intervalle ergibt ein Viereck:

R = “kennt“ = {(a, b) | a und b sind Personen, a kennt b} ⊂ A × B

R = “besitzt“ = {(a, b) | a besitzt b} ⊂ A × B

R = “<“ = {(a, b) ∈ IR2 | a < b} (eine Anordnungsrelation)

1.1.6 Grundlegende Eigenschaften der reellen Zahlen

• man kann mit ihnen rechnen,

• sie sind angeordnet,

• sie besitzen eine Bewertung.

(d) neutrales Element

es gibt ein Element 0 ∈ IR

a ∈ IR =⇒ es gibt dazu ein Element

(d) neutrales Element

es gibt ein Element 1 ∈ IR

(e) inverses Element

a ∈ IR \ {0} =⇒ es gibt dazu ein Element

• Grundregeln, von deren Richtigkeit man ausgeht, heißen Axiome.

Satz: Für alle x ∈ IR ist x · 0 = 0.

Üblicherweise verwendet man im Zusammenhang mit den Grundrechenarten noch die

Die Anordnungsaxiome lauten:

Folgerung: Für reelle Zahlen a, b, c, d ∈ IR gilt:

a < b ⇔ a·c > b·c

a < b ⇔ a−1 > b−1

5. Reelle Quadrate sind nie negativ: für alle a ∈ IR ist

6. Für a 6= 0 ist das Quadrat echt größer als Null:

Beweis: Beim Beweis dieser Folgerungen werden ausschließlich die Anordnungsaxiome

|x| = “Betrag von x“

= die positive der beiden Zahlen x und −x

Ebenso gilt für zwei reelle Zahlen x, y ∈ IR :

|x − y| = Abstand zwischen x und y auf der Zahlengeraden

Abstand zwischen x und y

Wichtige Regeln für den Umgang mit dem Betrag sind:

6. die bedeutsame Dreiecksungleichung: