Sie sind auf Seite 1von 290

Fakultät Ingenieurwissenschaften und Informatik

Vorlesungsumdruck

Mathematik 1 für Informatik

Version für das Wintersemester 2020

J. Biermann

Osnabrück, Juli 2018


Version vom 9. Dezember 2020
Inhaltsverzeichnis

1 Grundbegriffe 1
1.1 Der Begriff der Menge und die reellen Zahlen . . . . . . . . . . . . . . . . 1
1.1.1 Der Begriff der Menge . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Mengendarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Standardzahlenmengen . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.4 Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.5 Das kartesische Produkt . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.6 Grundlegende Eigenschaften der reellen Zahlen . . . . . . . . . . . 7
1.1.7 Infimum und Supremum . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Die vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Die Summenschreibweise . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Das Prinzip der vollständigen Induktion . . . . . . . . . . . . . . 17
1.2.3 Der Binomische Lehrsatz . . . . . . . . . . . . . . . . . . . . . . . 23
1.3 Der Begriff der Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.1 Liste wichtiger Bezeichnungen bei Funktionen . . . . . . . . . . . 30
1.3.2 Das Schaubild einer reellen Funktion . . . . . . . . . . . . . . . . 31
1.3.3 Eigenschaften von Funktionen . . . . . . . . . . . . . . . . . . . . 33
1.3.3.1 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.3.3.2 Gerade – Ungerade . . . . . . . . . . . . . . . . . . . . . 34
1.3.3.3 Beschränktheit . . . . . . . . . . . . . . . . . . . . . . . 34
1.3.4 Einige grundlegende Funktionen . . . . . . . . . . . . . . . . . . . 35
1.3.4.1 Lineare Funktionen . . . . . . . . . . . . . . . . . . . . . 35
1.3.4.2 Quadratische Funktionen . . . . . . . . . . . . . . . . . 36
1.3.4.3 Potenz- und Wurzelfunktionen . . . . . . . . . . . . . . 36
1.3.4.4 Die Funktion f (x) = 1/x . . . . . . . . . . . . . . . . . . 39
1.3.4.5 Exponentialfunktion und Logarithmus . . . . . . . . . . 39
1.3.4.5.1 Rechenbeispiele mit dem Logarithmus . . . . . 42
1.3.4.5.2 Der Logarithmus zu anderen Basen . . . . . . . 44
1.3.4.6 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.1 Definition . . . . . . . . . . . . . . . . . . . . . 45
1.3.4.6.2 Nullstellen und Hornerschema . . . . . . . . . . 48
1.3.4.6.3 Anzahl von Nullstellen . . . . . . . . . . . . . . 53
1.3.4.6.4 Der Fundamentalsatz der Algebra . . . . . . . . 56
1.3.4.7 Trigonometrische Funktionen und Arcusfunktionen . . . 57
1.3.4.7.1 Kreisfunktionen . . . . . . . . . . . . . . . . . . 57
1.3.4.7.2 Die Arcusfunktionen . . . . . . . . . . . . . . . 66

i
2 Lineare Gleichungssysteme und Matrizenrechnung 70
2.1 Lineare Gleichungssysteme und das Gaußsche Verfahren . . . . . . . . . . 70
2.2 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.1 Der Begriff der Matrix . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt . . . . . . . . . . . . 92
2.2.3 Quadratische Matrizen und die Umkehrmatrix . . . . . . . . . . . 101
2.2.4 Einige Matrizengruppen . . . . . . . . . . . . . . . . . . . . . . . 112
2.3 Die Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.3.1 Einführung und Definition . . . . . . . . . . . . . . . . . . . . . . 113
2.3.2 Determinante der Produktmatrix und der Transponierten . . . . . 119
2.3.3 Berechnung der Determinanten . . . . . . . . . . . . . . . . . . . 124
2.3.4 Die adjungierte Matrix . . . . . . . . . . . . . . . . . . . . . . . . 132
2.4 Der Begriff des Eigenwertes . . . . . . . . . . . . . . . . . . . . . . . . . 134

3 Elemente der diskreten Mathematik 143


3.1 Ein Schlüsselaustauschverfahren als einleitendes Beispiel . . . . . . . . . 143
3.2 Arithmetik der ganzen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 149
3.2.1 Wiederholung einiger Grundlagen . . . . . . . . . . . . . . . . . . 149
Teilung mit Rest . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3.2.2 Größter gemeinsamer Teiler und euklidischer Algorithmus . . . . 154
3.2.3 Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
3.2.4 Chinesischer Restsatz . . . . . . . . . . . . . . . . . . . . . . . . . 169
3.3 Gruppen, Ringe, Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
3.3.1 Grundlegende Definition . . . . . . . . . . . . . . . . . . . . . . . 173
3.3.1.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . 173
Definition der Gruppe . . . . . . . . . . . . . . . . . . . . . 175
Definition des Ringes . . . . . . . . . . . . . . . . . . . . . 176
Definition des Körpers . . . . . . . . . . . . . . . . . . . . 177
3.3.1.2 Endliche kommutative Gruppen . . . . . . . . . . . . . . 178
3.3.2 Restklassenringe über ZZ . . . . . . . . . . . . . . . . . . . . . . . 181
3.3.2.1 Einführung und Motivation . . . . . . . . . . . . . . . . 181
Äquivalenzrelationen . . . . . . . . . . . . . . . . . . . . . 182
3.3.2.2 Weitere Bezeichnungen und Endlichkeit . . . . . . . . . 188
3.3.2.3 Die Einheitengruppe . . . . . . . . . . . . . . . . . . . . 194
Eulersche Phi-Funktion . . . . . . . . . . . . . . . . . . . . 198
3.3.2.4 Der Fall n = p . . . . . . . . . . . . . . . . . . . . . . . 199
Wurzel ziehen . . . . . . . . . . . . . . . . . . . . . . . . . 200
Quadratische Reste . . . . . . . . . . . . . . . . . . . . . . 201
Diskreter Logarithmus . . . . . . . . . . . . . . . . . . . . 205
3.3.2.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . 205
3.3.2.5.1 Schlüsselaustausch nach Diffie-Hellman . . . . . 205
3.3.2.5.2 ISBN-Prüfziffer . . . . . . . . . . . . . . . . . . 206
3.3.2.5.3 Aufstellung eines Spielplans . . . . . . . . . . . 208
3.3.2.6 Der Fall n = p · q . . . . . . . . . . . . . . . . . . . . . . 211
3.3.2.7 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . 218
3.3.2.7.1 Idee und Ablauf des RSA-Verfahrens . . . . . . 218
3.3.2.7.2 Münzwurf per Telefon . . . . . . . . . . . . . . 221

ii
4 Grundlagen der Vektorrechnung 230
4.1 Problemstellung und grundlegende Definitionen . . . . . . . . . . . . . . 230
4.2 Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
4.3 Komponentendarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
4.4 Ebenen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
4.5 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
4.6 Die Hessesche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.1 Geraden im IR2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
4.6.2 Ebenen im IR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
4.6.3 Schnittwinkel zweier Ebenen . . . . . . . . . . . . . . . . . . . . . 269
4.6.4 Abstand eines Punktes von einer Ebene . . . . . . . . . . . . . . . 270
4.6.5 Der Durchschnitt zweier Ebenen . . . . . . . . . . . . . . . . . . . 272
4.6.6 Berechnung der Hesseschen Normalform einer Ebene . . . . . . . 275
4.7 Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276

Literaturverzeichnis 286

3
Kapitel 1

Grundbegriffe

1.1 Der Begriff der Menge und die reellen Zahlen


1.1.1 Der Begriff der Menge
Grundlegend für die mathematische Denk- und Sprechweise ist der Begriff der Menge.
Zu diesem Begriff läßt man am besten den Schöpfer der Mengenlehre zu Wort kommen:

Eine Menge ist die Zusammenfassung wohlunterschiedener Objekte unserer


Anschauung oder unseres Denkens zu einem Ganzen; die darin enthaltenen
Objekte heißen Elemente der Menge.

nach G. Cantor, 1895


Hierzu gehören die beiden Schreibweisen

x∈M (x ist Element der Menge M )


x 6∈ M (x ist nicht Element der Menge M )

Die N heißt Teilmenge der Menge M oder enthalten in der Menge M , wenn jedes
Element der Menge N auch ein Element der Menge M ist.
Beispiel: Die Menge, die aus den Zahlen von eins bis zehn besteht, ist eine Teilmenge
der Menge der Zahlen von eins bis hundert.
Als Schreibweise verwendet man:

N ⊂M (die Menge N ist eine Teilmenge der Menge M )

Den Sachverhalt “N ⊂ M“ veranschaulicht man, indem man die Mengen durch Flächen
darstellt:

' $

M  
N
 
& %

1
1.1.2 Mengendarstellungen

Zur Darstellung von Mengen verwendet man die

Aufzählung :
M = {a1 , a2 , a3 , . . . , an }

Beschreibung :
M = {x | x besitzt die Eigenschaft E}

Beispiel:

M = {1, 2, 4, 8}
M = {1, 2, 3, 4, 5, 6, 7, . . .} (= IN )
M = {x | x ∈ IN , x hat Endziffer 1}
= {1, 11, 21, . . .}

1.1.3 Standardzahlenmengen

Die bedeutsamste Zahlenmenge ist

IR = Menge der reellen Zahlen


=
ˆ Punkte auf der Zahlengeraden

√ π
1
−1 0 2 1 2 2 3

Eine reelle Zahl x wird durch einen unendlichen Dezimalbruch dargestellt:

x = an an−1 . . . a1 a0 , a−1 a2 . . . mit ai ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

Die Werte fast aller zu messenden Größen sind reell, z.B. Spannung, Stromstärke, Zeit,
Länge.

Neben IR selber sind gewisse Teilmengen der reellen Zahlen sehr wichtig:

Intervalle : Seien1 a, b ∈ IR mit a < b, dann ist das offene Intervall von a und b
gegeben durch

I = (a, b) = {x ∈ IR | a < x < b}

1
“a < b“ bedeutet: a ist kleiner als b; “a ≤ b“ bedeutet: a ist kleiner als b oder gleich b; siehe später.

2
a b

Die Randpunkte a und b sind nicht Elemente des offenen Intervalls.


Das abgeschlossene Intervall lautet

I = [a, b] = {x ∈ IR | a ≤ x ≤ b}

Hier gehören die Randpunkte zum Intervall.


Weitere Intervalltypen sind:

halboffen: [a, b) = {x ∈ IR | a ≤ x < b}


(a, b] = {x ∈ IR | a < x ≤ b}
unendlich: [a, ∞) = {x ∈ IR | a ≤ x}
(a, ∞) = {x ∈ IR | a < x}
(−∞, b] = {x ∈ IR | x ≤ b}
(−∞, b) = {x ∈ IR | x < b}

positive reelle Zahlen :

IR+ = (0, ∞) = {x ∈ IR | 0 < x}

natürliche Zahlen :
IN = {1, 2, 3, 4, 5, 6, . . .}

natürliche Zahlen einschließlich der Null :

IN0 = {0, 1, 2, 3, 4, 5, 6, . . .}

ganze Zahlen :
ZZ = {0, ±1, ±2, ±3, ±4, ±5, ±6, . . .}
Die ganzen Zahlen liegen diskret auf der Zahlengeraden, sie besitzen den Min-
destabstand 1 voneinander.

−2 −1 0 +1 +2 +3

rationale Zahlen :
 
p
Q| = p ∈ ZZ , q ∈ IN = Menge der Brüche
q
= Menge der periodischen Dezimalbrüche

1 3 1 3 1 3
0 8 16 4 8 2 4 1

3
Die Menge Q| liegt dicht auf der Zahlengeraden. Das bedeutet insbesondere: Ist
x ∈ IR beliebig, so läßt sich x beliebig eng durch zwei rationale Zahlen einschach-
teln:

r1 x r2
 -

Dieser Abstand kann beliebig klein gewählt werden.

Durch solche Einschachtelungen gewinnt man näherungsweise Darstellungen der


reellen Zahlen.

Beispiel: Wie man zeigen kann, ist 2 6∈ Q| ; eine recht gute Einschachtelung von

2 ist √
r1 = 1, 4142 < 2 < 1, 41422 = r2

Zwischen einigen der genannten Mengen bestehen Teilmengenbeziehungen:

IN ⊂ IN0 ⊂ ZZ ⊂ Q| ⊂ IR

Ebenso gilt natürlich für jedes Intervall I:

I ⊂ IR

Durch Bildung der Differenzmenge2 erhält man weitere Teilmengen von IR :

IN0 \ IN = {0} (die Menge, die nur aus der Zahl Null besteht)
ZZ \ IN = {−1, −2, −3, . . .} (die Menge der negativen Zahlen)
Q| \ ZZ = die Menge der echten Brüche
IR \ Q| = die Menge der irrationalen Zahlen

Die Menge der irrationalen Zahlen ist “sehr groß“. Es gilt etwa 3, π ∈ IR \ Q| .

1.1.4 Mengenoperationen

Aus zwei gegebenen Mengen A und B wird durch die folgenden Operationen jeweils eine
weitere Menge gebildet:
 A  B 
  
    
Vereinigung A ∪ B = {x | x ∈ A oder x ∈ B} 
   

A  B 

Durchschnitt A ∩ B = {x | x ∈ A und x ∈ B} 





A  B 
 
 
Differenz A \ B = {x | x ∈ A und x 6∈ B} 
   
2
Siehe gleich!

4
Was ist die folgende Menge?
IN \ ZZ
Da alle Elemente von IN auch in ZZ enthalten sind, handelt es sich hierbei um eine
Menge ohne Elemente. Dieses ist die sogenannte leere Menge; man bezeichnet sie durch
“∅“. Ihre formale Definition lautet:

∅ = {x | x 6= x}

Bemerkung: Neben den Zahlenmengen gibt es natürlich noch weitere Mengen; Beispiel:

{Autos}
{Einwohner Osnabrücks} ⊂ {Personen}

1.1.5 Das kartesische Produkt

Zur Darstellung eindimensionaler Objekte dienen die reellen Zahlen:

IR =
ˆ Gerade
Intervalle =
ˆ Strecken

Die Ebene stellt man durch zwei Geraden dar:

ein Punkt, dargestellt


3
y t (x, y) durch ein Paar reeller
Zahlen:
2 die Koordinaten

=IR
ˆ
−1 1 2 3 x 4
−1

Beide Achsen entspre-


−2
chen den reellen Zahlen.

=IR
ˆ

Die waagerechte Gerade nennt man x-Achse, die senkrechte Gerade y-Achse.

5
Hierbei handelt es sich um einen Spezialfall des kartesischen Produktes; das kartesi-
sche Produkt zweier Mengen A und B ist definiert durch

A × B = {(a, b) | a ∈ A, b ∈ B}
= Menge der geordneten
Paare (a, b) mit a ∈ A
und b ∈ B
Im vorliegenden Fall hat man

IR × IR = IR2 = {(a, b) | a, b ∈ IR }
=
ˆ Ebene

Beispiel: Ein kartesisches Produkt zweier Intervalle ergibt ein Viereck:

M = {(x, y) ∈ IR2 | 2 ≤ x ≤ 3, 1 ≤ y ≤ 2}
= [2, 3] × [1, 2]

2
 die Menge M
1 

1 2 3

Definition: Sind A und B Mengen und ist R eine Teilmenge des kartesischen Produktes
dieser beiden Mengen:
R ⊂ A×B
so heißt R Relation über A und B.

Beispiel:
1. Seien A und B die Menge der Personen (A = B = {Personen}). Relationen über
A und B sind:

R = “kennt“ = {(a, b) | a und b sind Personen, a kennt b} ⊂ A × B


R = “verheiratet“
R = “älter als“
R = “unterrichtet in Mathematik“

6
2. A = {Personen}, B = {Autos}

R = “besitzt“ = {(a, b) | a besitzt b} ⊂ A × B


R = “überfährt“ = {(a, b) | b überfährt a} ⊂ B × A

3. A = B = IR

R = “<“ = {(a, b) ∈ IR2 | a < b} (eine Anordnungsrelation)

1.1.6 Grundlegende Eigenschaften der reellen Zahlen

Die Menge IR besitzt viele sehr bedeutsame Eigenschaften. Die grundlegensten Merk-
male der reellen Zahlen sind:

• man kann mit ihnen rechnen,

• sie sind angeordnet,

• sie besitzen eine Bewertung.

Die Körperaxiome
Je zwei reelle Zahlen a, b ∈ IR kann man mit Hilfe der Addition bzw. der Multiplika-
tion miteinander verknüpfen; Ergebnis einer solchen Operation ist wiederum eine reelle
Zahl. Die beiden Grundrechenarten Addition und Multiplikation gehorchen gewissen
Grundregeln, den sogenannten Körperaxiomen:

1. Addition

(a) Abgeschlossenheit

a, b ∈ IR =⇒ a + b ∈ IR

(b) Kommutativgesetz

a, b ∈ IR =⇒ a+b=b+a

(c) Assoziativgesetz

a, b, c ∈ IR =⇒ (a + b) + c = a + (b + c)

(d) neutrales Element

es gibt ein Element 0 ∈ IR


mit a + 0 = a für alle a ∈ IR

7
(e) inverses Element

a ∈ IR =⇒ es gibt dazu ein Element


ã ∈ IR mit ã + a = 0

Schreibweise: ã = −a

2. Multiplikation

(a) Abgeschlossenheit

a, b ∈ IR =⇒ a · b ∈ IR

(b) Kommutativgesetz
a, b ∈ IR =⇒ a·b=b·a
(c) Assoziativgesetz

a, b, c ∈ IR =⇒ (a·b)·c = a·(b·c)

(d) neutrales Element

es gibt ein Element 1 ∈ IR


mit a·1 = a für alle a ∈ IR

(e) inverses Element

a ∈ IR \ {0} =⇒ es gibt dazu ein Element


ã ∈ IR mit ã·a = 1

1 = a−1
Schreibweise: ã = a

3. Distributivgesetz

a, b, c ∈ IR =⇒ a · (b + c) = a · b + a · c

Bemerkung:

• Grundregeln, von deren Richtigkeit man ausgeht, heißen Axiome.

• Eine nicht leere Menge, für deren Elemente die beiden Verknüpfungen “+“ und
“·“ erklärt sind, so daß die oben genannten Axiome gelten, heißt Körper. Ist nur
eine Addition mit den zugehörigen Grundregeln erklärt, so heißt die Menge (kom-
mutative) Gruppe. (Beispiel: ZZ ist eine Gruppe, nicht jedoch IN ).

Aus den Körperaxiomen leitet man alle weiteren rechnerischen Eigenschaften der reellen
Zahlen ab. Als Beispiel wird der folgende Satz bewiesen:

Satz: Für alle x ∈ IR ist x · 0 = 0.

8
Beweis:
x · 0 = x · (0 + 0) (da Null neutral bezügl. +)
x·0 = x·0+x·0 | −x · 0 (Distributivgesetz)
0 = x·0
qed.
Man beachte, daß bei diesem Beweis nichts anderes als die Körperaxiome verwendet
wurden! Ähnlich zeige man unter anderem: Für alle x ∈ IR ist x = −(−x).

Üblicherweise verwendet man im Zusammenhang mit den Grundrechenarten noch die


folgenden Schreibweisen
ab = a · b (verkürzte Schreibweise der Multiplikation)
a − b = a + (−b) (Subtraktion)
a : b = a · b−1 (Division)
−1
a/b = a · b (Division)
a = a · b−1 (Division mit Bruchstrich)
b
an = a
| · a{z· · · a} (n ∈ IN ) (Potenz)
n−mal
a−n = 1 (n ∈ IN ) (Potenz mit negativem Exponenten)
an
Für die Potenz kommen die folgenden Regeln hinzu:
an · am = an+m (n, m ∈ ZZ)
a0 = 1 (1.1)
a−n = 1n (n ∈ ZZ)
a

Die Anordnungsaxiome

Mit den Elementen der Menge IR kann nicht nur gerechnet werden, sie sind zusätzlich
auch angeordnet. Die Anordnung ergibt sich sofort mit Hilfe der Zahlengeraden: man
trifft für zwei Zahlen a, b ∈ IR die folgende Festlegung:

a liegt auf der Zahlengeraden links von b ⇔ a ist kleiner als b bzw. a < b

IR
−1 0 1 2
a b
Entsprechend definiert sind die übrigen Anordnungsrelationen
a ≤ b : a ist kleiner oder gleich b
a > b : a ist größer als b
a ≥ b : a ist größer oder gleich b

9
Ebenso wie für die Addition und Multiplikation bestehen Grundregeln für die Anordnun-
grelationen, die sogenannten Anordnungaxiome. Sie werden hier für “<“ formuliert,
gelten aber auch entsprechend für “≤“, “>“ und “≥“.

Die Anordnungsaxiome lauten:

1.
a, b ∈ IR =⇒ es gilt genau eine der drei Beziehungen
a < b, a = b, b < a

2. Transitivität
a, b, c ∈ IR mit a < b, b < c =⇒ a<c

3.
a, b, c ∈ IR mit a < b =⇒ a+c<b+c

4.
a, b, c ∈ IR mit a < b und c > 0 =⇒ a·c<b·c

Ebenso grundlegend wie die Anordnungsaxiome selber sind die ersten Folgerungen, die
man aus ihnen zieht:

Folgerung: Für reelle Zahlen a, b, c, d ∈ IR gilt:

1.
a > 0 ⇔ 0 > −a

2. Eine Ungleichung kehrt sich um, wenn man sie mit einem Faktor kleiner als Null
multipliziert: Für c < 0 gilt:

a < b ⇔ a·c > b·c

3. Eine Ungleichung zwischen Zahlen größer Null kehrt sich beim Übergang zu den
Inversen um: Für a, b > 0 gilt:

a < b ⇔ a−1 > b−1

4. 
a>b>0
⇒ a·c > b·d
c>d>0

5. Reelle Quadrate sind nie negativ: für alle a ∈ IR ist

a2 ≥ 0

6. Für a 6= 0 ist das Quadrat echt größer als Null:

a2 > 0 ⇔ a 6= 0

Beweis: Beim Beweis dieser Folgerungen werden ausschließlich die Anordnungsaxiome


oder bereits zuvor hergeleitete Aussagen verwendet.

10
1.
a > 0 | +(−a)
⇒ 0 > −a
2. Es gilt c < 0 ⇒ −c > 0, also folgt:
a > b | ·(−c) (> 0)
⇔ a · (−c) > b · (−c) | +(a · c + b · c)
⇔ b·c > a·c
⇔ a·c < b·c

3.
a < b | ·a−1 · b−1 (> 0)
⇔ b−1 < a−1
⇔ a−1 > b−1

4. Als Übung!
5. Als Übung!
6. Als Übung!
qed.

Der Betrag

Die reellen Zahlen besitzen eine Bewertung. Diese Bewertung wird durch den Betrag
geliefert: Man setzt für eine reelle Zahl x ∈ IR

|x| = “Betrag von x“

x 0
= Abstand von x zu 0 auf der Zahlengeraden  -


x für x ≥ 0
=
−x für x < 0

= die positive der beiden Zahlen x und −x

Ebenso gilt für zwei reelle Zahlen x, y ∈ IR :

|x − y| = Abstand zwischen x und y auf der Zahlengeraden

0 x y
 -
|x − y|
11
Die Begründung dieser Aussage erhält man, wenn man x und y auf der Zahlengeraden
um −y verschiebt:

Abstand zwischen x und y


= Abstand zwischen x − y und 0
= |x − y|

x−y y−y

0 x y
 -  -
|x − y| |x − y|

Wichtige Regeln für den Umgang mit dem Betrag sind:

1.
|x| = 0 ⇔ x = 0

2.
|x − y| = 0 ⇔ x−y = 0 ⇔ x = y

3.
| − x| = |x|, |x − y| = |y − x|

4.
|x| · |y| = |x · y|

5.
= |x|
x
für y 6= 0
y |y|

6. die bedeutsame Dreiecksungleichung:

|a + b| ≤ |a| + |b|

7. zwei Folgerungen aus der Dreiecksungleichung:

|a − b| ≤ |a| + |b|
|a − b| ≥ |a| − |b|

Das Rechnen mit Beträgen wird anhand eines wichtigen Beispiels vorgeführt. Das Er-
gebnis der Rechnung dieses Beispiels wird später oft verwendet werden. Vorgegeben
seien
a ∈ IR und ε ∈ IR mit ε > 0

12
Wie sieht dazu die folgende Menge aus?
M = {x ∈ IR | |x − a| < ε}
Der sicherste Weg, den man beim Beantworten einer solchen Frage einschlagen kann,
besteht in einer Fallunterscheidung nach dem Vorzeichen des Ausdrucks innerhalb der
Betragsstriche. Liegt das Vorzeichen des Ausdrucks innerhalb der Betragsstriche fest, so
können die Betragsstriche durch Klammern ersetzt werden (u. U. mit Voranstellen eines
Minuszeichens), und man erhält einen üblichen arithmetischen Ausdruck. In Einzelfällen
bieten sich neben der Fallunterscheidung natürlich noch weitere Berechnungsmöglich-
keiten an.
Hier lautet die Fallunterscheidung:
1. x − a ≥ 0 ⇔ |x − a| = x − a ⇔ x ≥ a
2. x − a < 0 ⇔ |x − a| = a − x ⇔ x < a

Fall 1 : |x − a| = x − a und x ≥ a, also kann man schließen:


|x − a| < ε
⇔ x−a < ε
⇔ x < a+ε
insgesamt: a ≤ x < a+ε

Fall 2 : |x − a| = a − x und x < a, also kann man schließen:


|x − a| < ε
⇔ a−x < ε
⇔ x − a > −ε
⇔ x > a−ε
insgesamt: a−ε < x < a

Die Zusammenfassung beider Fälle liefert


|x − a| < ε ⇔ a−ε < x < a+ε
Damit erhält man für die Menge das Bild:
Der Abstand zu a ist kleiner als ε.
 -

0 a−ε x a a+ε
 -
die Menge M

Die Menge M bezeichnet man als ε-Umgebung von a und schreibt sie in der Form
Uε (a) (1.2)

13
1.1.7 Infimum und Supremum

Definition: Sei M ∈ IR eine Teilmenge der reellen Zahlen.

1. Gibt es eine Konstante K ∈ IR mit der Eigenschaft

K ≤ x für alle x ∈ M

so heißt die Menge M nach unten beschränkt.

          
          
K die Menge M
2. Gibt es eine Konstante L ∈ IR mit der Eigenschaft

x ≤ L für alle x ∈ M

so heißt die Menge M nach oben beschränkt.

          
          
die Menge M L
3. Gibt es Konstanten K, L ∈ IR mit der Eigenschaft

K ≤ x ≤ L für alle x ∈ M

so heißt die Menge M beschränkt.

Die Zahlen K und L heißen untere Schranke bzw. obere Schranke der Menge M .

Man beachte, daß die Schranken einer Menge nicht eindeutig bestimmt sind!.

          
          
die Menge M L1 L2

Definition: (Infimum und Supremum)

1. Die Menge M ∈ IR sei nach oben beschränkt; dann heißt die kleinste obere Schran-
ke das Supremum der Menge M . Man schreibt für das Supremum von M

sup M

2. Die Menge M ∈ IR sei nach unten beschränkt; dann heißt die größte untere
Schranke das Infimum der Menge M . Man schreibt für das Infimum von M

inf M

Beispiel: Sei M = (−1, 1].

14


−1 0 1
Dann gilt inf M = −1 und sup M = 1. Insbesondere erkennt man: inf M 6∈ M und
sup M ∈ M .

Definition: (Maximum und Minimum)

1. Gilt bei der nach oben beschränkten Menge M ∈ IR

sup M ∈ M

so heißt sup M das Maximum von M ; man schreibt für das Maximum von M :

max M

2. Gilt bei der nach unten beschränkten Menge M ∈ IR

inf M ∈ M

so heißt inf M das Minimum von M ; man schreibt für das Minimum von M :

min M

Beispiel: Bei endlichen Mengen M ∈ IR sind stets max M und min M vorhanden.
Begründung: Eine endliche Menge M ∈ IR besitzt die Gestalt M = {a1 , a2 , . . . , an } mit
reellen Zahlen a1 , . . . , an . Die größte dieser Zahlen ist das Maximum, die kleinste das
Minimum von M .

Eine sehr wichtige Eigenschaft des Supremums stellt der folgende Sachverhalt dar3 :
Sei M ∈ IR nach oben beschränkt, und sei x0 = sup M . Sei weiter

x ∈ IR mit x < x0

Dann gibt es ein y ∈ M mit y > x.

x y
x0
M
Begründung: Gälte y ≤ x für alle y ∈ M , so wäre x eine noch kleinere obere Schranke
von M als x0 . Dieses wäre ein Widerspruch zu x0 = sup M .

3
der, entsprechend formuliert, auch für das Infimum gilt.

15
1.2 Die vollständige Induktion
1.2.1 Die Summenschreibweise

Die vollständige Induktion stellt ein Schema dar, mit dessen Hilfe man viele Aussagen im
Zusammenhang mit natürlichen Zahlen beweisen kann. Das zugrundeliegende Prinzip
ist nicht nur für die Mathematik sondern auch für die Informatik sehr bedeutsam.
Da wir die vollständige Induktion u. a. anhand von Formeln, in denen Summen vor-
kommen, kennenlernen wollen, ist es günstig, sich zuvor mit der Summenschreibweise
zu befassen.

Bei der Addition mehrerer Summanden führt man zur abkürzenden Schreibweise das
sogenannte Summenzeichen ein: Für reelle Zahlen4

a1 , a2 , . . . , an (n ∈ IN )

stellt man deren Summe mit Hilfe des Summenzeichens dar:


n
X
ai = a1 + a2 + . . . + an
i=1

Beispiele:

10
X 1 1 1 1
= + + ... +
i=1
2+i 3 4 12
100
X
i = 1 + 2 + 3 + . . . + 100 (mit ai = i)
i=1

In dem Ausdruck n
X
ai
i=1

heißt der Index i Summationsindex , die Indexwerte 1 und n sind die untere - und die
obere Summationsgrenze. Man beachte, daß die untere Summationsgrenze einen anderen
ganzzahligen Wert als 1 annehmen kann. Ein häufig vorkommender Wert der unteren
Summationsgrenze ist Null. Ist der Wert der unteren Summationsgrenze größer als der
der oberen, so handelt es sich um eine leere Summe. Die leere Summe ist eine Summe
ohne Summanden, ihr wird der Wert Null zugeordnet.

Bedeutsam für den Umgang mit dem Summenzeichen sind die folgenden Regeln5 : (n, m ∈
4
Die ai sind indizierte Unbestimmte, i ist der Index, die Indexwerte sind hier 1, 2, 3, . . . , n.
5
Diese Regeln gelten entsprechend für eine beliebige untere Summationsgrenze.

16
IN , 1 ≤ m ≤ n)
n
X m
X n
X
1) ai = ai + ai (Aufteilung)
i=1 i=1 i=m+1
n
X n
X
2) λ· ai = (λ · ai ) mit λ ∈ IR (Ausmultiplizieren)
i=1 i=1
n
X n
X n
X
3) ai + bi = (ai + bi ) (gliedweise Addieren)
i=1 i=1 i=1

n
X n+l
X
4) ai = ai−l (Indexverschiebung um l ∈ ZZ )
i=1 i=1+l

1.2.2 Das Prinzip der vollständigen Induktion

Um mit einem Anwendungsbeispiel der vollständigen Induktion zu beginnen, wird eine


sehr bedeutsame, auf Gauß zurückgehende Summenformel bewiesen.

Satz: Für n ∈ IN ist


n
X n(n + 1)
i = (1.3)
i=1
2

Beweis: (Durch vollständige Induktion) Zunächst wird die Aussage für n = 1 gezeigt;
dieses ist der sogenannte Induktionsanfang:
Sei also n = 1; setzt man dieses in beide Seiten von (1.3) ein, so erhält man:
1
X
linke Seite = i = 1
i=1

1(1 + 1)
rechte Seite = = 1
2

Beide Seite besitzen für n = 1 denselben Wert; damit ist (1.3) für n = 1 bewiesen.
Im zweiten Schritt, dem sogenannten Induktionsschluß nimmt man an, die Behauptung
sei bereits für n − 1 bewiesen, und leitet daraus die Behauptung für n selber ab.
Man beginnt, indem man in die Formel (1.3) für n den Ausdruck n − 1 einsetzt:
n−1
X (n − 1)n
i =
i=1
2

17
Dieses ist die Induktionsvoraussetzung, von deren Richtigkeit man ausgeht und aus der
man durch zulässige Umformungsschritte die Aussage für n selber herzuleiten versucht:
n−1
X (n − 1)n
i = 2
+n
i=1
n
X (n − 1)n
⇒ i = 2 +n
i=1

(n − 1)n + 2n
= 2 = n· n+
2
1

Mit der letzten Zeile wurde die Gleichung (1.3) für den Fall n hergeleitet. qed.

Die Gleichung (1.3) ist hiermit vollständig bewiesen. Dieses wird deutlich, wenn man
das allgemeine Prinzip der vollständigen Induktion betrachtet:

Das gestellte Ziel bei der vollständigen Induktion besteht darin, eine Aussage P (n)
für alle n ∈ IN zu beweisen. Dieser Beweis wird in zwei Schritten ausgeführt: dem
Induktionsanfang und dem Induktionsschluß.
1. Man weist nach, daß die Aussage für n = 1, wahr ist, d. h. man beweist P (1).
2. Man setzt voraus, daß P (n − 1) bereits bewiesen ist ( Induktionsvoraussetzung“)

und leitet daraus P (n) ab (n ≥ 2), d. h. man beweist die Richtigkeit der Folgerung
P (n − 1) =⇒ P (n) für n ≥ 2.

Damit ist die Aussage für alle n ∈ IN bewiesen: für jedes feste n ≥ 2 folgt das aus der
Gültigkeit der Ableitungskette
P (1) ⇒ P (2) ⇒ · · · ⇒ P (i − 1) ⇒ P (i) ⇒ · · · ⇒ P (n)
| {z } | {z }
wurde direkt ge- diese Folgerung wur-
zeigt de gezeigt

Zur Verdeutlichung soll noch einmal klargestellt werden, warum die Aussage P (n) für
ein beliebig ausgewähltes n0 ∈ IN (d. h. P (n0 )) richtig ist:
P (n0 ) gilt, da P (n0 − 1) gilt.
P (n0 − 1) gilt, da P (n0 − 2) gilt.
P (n0 − 2) gilt, da P (n0 − 3) gilt.

usw.

P (2) gilt, da P (1) gilt.


P (1) wurde direkt bewiesen.

Als weiteres Beispiel zeigen wir den


Satz: (Summenformel für die Quadratzahlen) Für jedes n ∈ IN ist
n
X n(n + 1)(2n + 1)
i2 = (1.4)
i=1
6

18
Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang):

linke Seite = 12 = 1
1(1 + 1)(2 + 1)
rechte Seite = = 1
6
“n − 1 ⇒ n“ (Induktionsschluß): In (1.4) wird für n der Ausdruck n − 1 eingesetzt; die
so entstehende Induktionsvoraussetzung wird geeignet weiter umgeformt:
n−1
X (n − 1)n(2n − 1)
i2 = 6
+ n2
i=1
n
X (n − 1)n(2n − 1)
⇒ i2 = 6 + n2
i=1

(n − 1)n(2n − 1) + 6n2
= 6 (n ausklammern)

(n − 1)(2n − 1) + 6n
= n· 6 (ausmultiplizieren)

(2n2 + 2n) + (n + 1)
= n· 6 (n + 1 ausklammern)

(2n + 1)
= n · (n + 1) · 6
Dieses ist die zu beweisende Aussage (1.4) für den Fall n. qed.

Die vollständige Induktion ist nicht zum Nachweis von Summenformeln geeignet. Im
weiteren Verlauf der Vorlesungen wird man dazu noch mehrere Bespiele sehen. Eben-
so geben die nächsten beiden Anwendungen einen Hinweise auf die vielfältigen Ein-
satzmöglichkeiten der vollständigen Induktion.

Satz: Für alle n ∈ IN ist die Zahl

5n + 7 (1.5)

durch 4 teilbar.
Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang): Setzt man in (1.5) n = 1 ein, so erhält man den Wert 12,
und 12 ist durch 4 teilbar. Die Behauptung ist damit für den Fall n = 1 beweisen.
“n − 1 ⇒ n“ (Induktionsschluß): Vorausgesetzt wird, daß für jedes n ≥ 2 der Ausdruck
5n−1 + 7 durch 4 teilbar ist. Zu zeigen ist dann, daß sich daraus die

Teilbarkeit durch 4 von 5n + 7

ergibt. Dazu ist der Ausdruck 5n + 7 geeignet auf den Vorgängerausdruck 5n−1 + 7

19
zurückzuführen:

5n + 7 = 5 · 5n−1 + 7
= (4 + 1) · 5n−1 + 7
= 5n−1}
|4 · {z + n−1
|5 {z+ 7} (1.6)
durch 4 teilbar durch 4 teilbar nach
Induktionsvoraussetzung

Als Summe zweier durch 4 teilbarer Ausdrücke ist auch 5n + 7 durch 4 teilbar. Damit
ist alles bewiesen. qed.

Der nächste Satz, an dessen Beweis die vollständige Induktion vorgeführt werden soll,
betrifft eine sehr wichtige Größe, die sogenannte Fakultät:
Definition: Sei n ∈ IN0 ; dann heißt die Zahl
(
1 für n = 0
n! = (1.7)
1 · 2 · 3 · . . . · n für n > 0

die Fakultät von n. Man sagt zu n! n-Fakultät“.



Beispiel: 1! = 1, 2! = 1 · 2 = 2, 3! = 1 · 2 · 3 = 6, 4! = 1 · 2 · 3 · 4 = 24.

Man beachte, daß die Werte der Fakultät sehr schnell sehr groß werden. Es ist etwa
10! = 3628800 sowie 20! = 2432902008176640000.
Die Fakultät besitzt eine sehr wichtige Deutung; dieses ist Inhalt des folgenden Satzes
Satz: Für n ∈ IN sei eine Menge mit n Elementen gegeben. Dann ist der Wert n! die
Anzahl der Möglichkeiten, die n Elemente dieser Menge anzuordnen.

Vor dem Beweis folgt ein


Beispiel: Für die Elemente der Menge {a, b} bestehen 2! = 2 Anordnungen: a, b und
b, a. Für die Elemente der dreielementigen Menge {a, b, c} gibt es folgende Anord-
nungsmöglichkeiten:

a, b, c b, a, c b, c, a
a, c, b c, a, b c, b, a

Dieses sind genau 3! = 6 Anordnungen.

Beweis des Satzes: (Durch vollständige Induktion)


“n = 1“ (Induktionsanfang): Man betrachte die einelementige Menge M = {a1 }. Deren
einziges Element kann nur in der einen Form

a1

angeordnet werden. Somit bestehen in der Tat für diese Menge 1 = 1! Anordungsmöglich-
keiten, und die Behauptung wäre damit für den Fall n = 1 bewiesen.
“n − 1 ⇒ n“ (Induktionsschluß): Man betrachte für n ≥ 2 die Menge mit n Elementen

M = {a1 , a2 , a3 , . . . , an }

20
und dazu deren Teilmenge ohne das letzte Element

M 0 = {a1 , a2 , a3 , . . . , an−1 }

Jetzt kann man folgern:

• Nach Induktionsvoraussetzung besitzen die n − 1 Elemente a1 , . . . , an−1 von M 0


genau (n − 1)! Anordungsmöglichkeiten.

• Bei Hinzunahme des Elementes an können aus jeder einzelnen Anordung der
a1 , . . . , an−1 genau n Anordnungen der n Elmente a1 , . . . , an−1 , an gebildet wer-
den.
Geht man nämlich von einer bestenden, festen Anordnung der a1 , . . . , an−1 aus, so
gibt es n verschiedene Möglichkeiten, an in diese Anordnung einzufügen:
an an an an an an an

? w ? w ? w ? w ? r r r ? w ?

Position Position Position Position Position


1 2 3 4 n−1
an könnte jeweils vor das Elemente an Position 1, an Position 2, . . . bzw. an
Position n−1 gesetzt werden und zuzüglich noch hinter das letzte, d. h. an Position
n − 1 stehende Element gestellt werden. Man erkennt, daß auf die Weise aus der
ursprünglichen einen gegeben Anordnung der a1 , a2 , . . . , an−1 genau n verschiedene
Anordnung der a1 , a2 , . . . , an entstehen.6

• Damit kann die Anzahl der Anordnung der a1 , a2 , . . . , an berechnet werden:

(n − 1)! · n
|{z} (1.8)
| {z }
Anzahl der Jede einzelne
Anordnungen Anordnungen
der a1 , . . . , an−1 der a1 , . . . , an−1
nach liefert
Induktions- n Anordnungen
voraussetzung der a1 , . . . , an .

= 1 · 2 · 3 · · · (n − 1) · n = n! (1.9)
| {z }
(n−1)!

Damit die Behauptung vollständig bewiesen. qed.

Bemerkung: Es ist nicht so, daß die vollständige Induktion immer bei n = 1 beginnen
muß. Es ist auch möglich, den Induktionsanfang bei n = a mit einem beliebigen a ∈ ZZ
beginnen zu lassen. Dadurch wird dann die Richtigkeit einer Aussage P (n) für n ∈ {u |
u ∈ ZZ und u ≥ a} bewiesen. Das Schema der vollständigen Induktion wird aber in
einem solchen Fall ganz entsprechend angewandt.
6
Man müßte zur Vollständigkeit noch zeigen, daß jede Anordnung der a1 , . . . , an sich auf diese Weise
aus einer Andordnung der a1 , . . . , an−1 gewinnen läßt. Das ist aber klar!

21
In den beiden folgenden Beweisen erfolgt der Induktionsanfang nicht bei n = 1. Die
zugehörigen Aussagen dienen hier nicht nur als Beispiel für die vollständige Induktion,
sie sind auch für das Folgende sehr bedeutsam. Dazu gehört vor allen Dingen die sehr
häufig verwendete Summenformel für die endliche geometrische Reihe:

Satz: (Summenformel für die endliche geometrische Reihe) Für n ∈ IN0 und q ∈ IR
mit q 6= 1 gilt
n
X 1 − q n+1
qi = (1.10)
i=0
1−q

Beweis: (Durch vollständige Induktion) Hier wird der Induktionsanfang bei n = 0 durch-
geführt:
“n = 0“ (Induktionsanfang):

linke Seite = q 0 = 1
1 − q 0+1 1−q
rechte Seite = = = 1
1−q 1−q
“n − 1 ⇒ n“ (Induktionsschluß):
n−1
X 1 − qn
qi = 1−q
+ qn
i=0
n
X 1 − qn n 1−q
⇒ qi = 1−q + q · 1−q (Ausmultiplizieren und bei-
i=0 de Brüche zusammenfassen)
1 − q n + q n − q n+1 1 − q n+1
= 1−q = 1−q
qed.

Beispiel: Mit q = 2 und n = 10:


10
X 1 − 210+1
1 + 2 + 4 + 8 + . . . + 1024 = 2i = = 211 − 1 = 2047
i=0
1−2

Im nächsten Satz ist die Aussage nur für n ≥ 2 gültig, der Induktionsanfang wird bei
n = 2 durchgeführt.

Satz: (Bernoullische Ungleichung) Für n ∈ IN0 mit n ≥ 2 sowie a ∈ IR mit a 6= 0 und


a > −1 gilt

(1 + a)n > 1 + n · a (1.11)

Beweis: (Durch vollständige Induktion)


“n = 2“ (Induktionsanfang): Die erste Binomische Formel liefert

(1 + a)2 = 1 + 2a + a2
> 1 + 2a

22
Die Ungleichung gilt, da in der letzten Zeile der positive Summand a2 weggelassen
wurde. Die so hergeleitete Ungleichung stellt genau die Aussage (1.11) für n = 2 dar.
“n − 1 ⇒ n“ (Induktionsschluß): Setzt man in (1.11) für n den Ausdruck n − 1 ein, so
erhält man als Induktionsvoraussetzung die Ungleichung

(1 + a)n−1 > 1 + (n − 1)a

Wegen a > −1 ist 1 + a > 0. Multipliziert man eine Ungleichung mit einem positi-
ven Faktor, so bleibt diese gemäß der Anordnungsaxiome erhalten. Damit kann man
schließen:

(1 + a)n−1 > 1 + (n − 1)a × (1 + a)

⇒ (1 + a)n > (1 + (n − 1)a) · (1 + a) (Ausmultiplizieren)


= 1 + (n − 1)a + a + (n − 1)a2 (Weglassen des positi-
ven Summanden
(n − 1)a2 )
> 1 + na
⇒ (1 + a)n > 1 + na

qed.

Bemerkung: In diesem Beweis wurde zweimal die folgende Aussage verwendet: Läßt man
auf einer Seite einer Gleichung einen positiven Summanden weg, so wird diese Seite der
Gleichung kleiner als die andere. Anders ausgedrückt lautet dieses: Für x, y, z ∈ IR
mit x = y + z und z > 0 folgt x > y. Aufgabe: Leiten Sie diese Aussage aus den
Anordnungsaxiomen ab.

Frage: An welchen Stellen gingen im Beweis der Bernoullischen Ungleichung die Voraus-
setzungen a > −1 und ≥ 2 ein?

1.2.3 Der Binomische Lehrsatz

Vorbereitend für den Binomischen Satz wird der sogannate Binomialkoeffizient ein-
geführt. Er baut auf der Fakultät (siehe Seite 20) und zählt ebenso wie diese zu den
Grundbegriffen der Kombinatorik 7 .

Definition: Seien n, k ∈ IN0 mit k ≤ n gegeben; dann heißt die Zahl


 
n n!
=
k k! · (n − k)!
der Binomialkoeffizient von n und k. Man sagt zu dem Binomialkoeffizient von n und
k: n über k“.

Beispiel:
 
5 5! 5·4·3
= = = 10
3 3! · 2! 6
7
Die Kombinatorik ist die Theorie der endlichen Mengen.

23
Aus der Definition des Binomialkoeffizienten ergeben sich sofort einige Regeln:
   
n n
= = 1
0 n
   
n n
= = n
1 n−1
   
n n
=
k n−k

Bemerkung: Man erhält eine zum praktischen Rechnen geeignetere Darstellung des Bi-
nomialkoeffizienten, wenn man die Fakultät im Zähler sowie die zweite Fakultät im
Nenner ausschreibt und anschließend kürzt:
 
n n!
=
k k! · (n − k)!
n · (n − 1) · · · (n − k + 1) · (n − k) · (n − k − 1) · · · 1
=
k! · (n − k) · (n − k − 1) · · · 1
n · (n − 1) · · · (n − k + 1)
= (1.12)
k!

Ebenso wie die Fakultät besitzt der Binomialkoeffizient eine Bedeutung im Zusammen-
hang mit endlichen Mengen:
Ist eine Menge mit n Elementen gegeben, so gibt der Binomialkoeffizient nk an, wie viele


Möglichkeiten bestehen, aus dieser Menge eine Teilmenge von k Elementen auszuwählen.

Beispiel: Beim Samstagslotto werden aus 49 Kugeln 6 Kugeln ausgewählt. Dabei beste-
hen 49

6
Auswahlmöglichkeiten.

' $
t
t t t
t t   Wie viele Möglichkeiten beste-
t t t t t
t t hen, aus 20 Elementen 5 aus-
t t
t t zuwählen?
t t  t
& %

Die Deutung des Binomialkoeffizienten soll plausibilisiert werden. Dazu wird ähnlich
wie bei der Plausibilisierung der Deutung der Fakultät vorgegangen: man kann jede
k-elementige Teilmenge erzeugen, indem man aus den insgesamt n Elementen nachein-
ander k Elemente auswählt. Es soll zunächst gezählt werden, wie viele Möglichkeiten
solcher k-fachen Auswahlen aus einer n-elementigen Menge bestehen:

24
Für das erste Element bestehen n Aus-
wahlmöglichkeiten.
Für das zweite Element verbleiben n−1 Dieses ergibt soweit n·(n−1) Auswahl-
Auswahlmöglichkeiten. möglichkeiten.
Für das dritte Element verbleiben n−2 Dieses ergibt soweit n · (n − 1) · (n − 2)
Auswahlmöglichkeiten. Auswahlmöglichkeiten.
usw.
Für das k − 1-te Element verbleiben Dieses ergibt soweit
noch n − (k − 2) = n − k + 2 Auswahl- n · (n − 1) · (n − 2) · · · (n − k + 2) Aus-
möglichkeiten. wahlmöglichkeiten.
Für das k-te Element verbleiben Dieses ergibt insgesamt
schließlich n − (k − 1) = n − k + 1 Aus- n·(n−1)·(n−2) · · · (n−k+2)·(n−k−1)
wahlmöglichkeiten. Auswahlmöglichkeiten.

Nun kommen bei diesen k-fachen Auswahlen nicht nur alle k-elementigen Teilmengen
vor; es kommt unter ihnen vielmehr jede mögliche Anordnung einer jeden k-elementigen
Teilmengen vor. Damit ergibt sich:

Anzahl der k-elementigen Teilmengen


Anzahl der k-fachen Auswahlen
=
Anzahl der Anordnungmöglichkeiten einer k-elementigen Teilmenge
n · (n − 1) · (n − 2) · · · (n − k + 2) · (n − k − 1)
=
k!
 
n
= (Siehe Gleichung 1.12.)
k

Eine wichtige Rechenregel des Binomialkoeffizienten beinhaltet der folgende


Satz: Seien n, k ∈ IN0 mit 0 < k < n, dann gilt die Summenregel:
     
n−1 n−1 n
+ = (1.13)
k−1 k k

25
Beweis:
   
n−1 n−1
+
k−1 k

(n − 1)! (n − 1)!
= +
(k − 1)! · (n − 1 − (k − 1))! k! · (n − 1 − k)!

(n − 1)! (n − 1)! (auf den Hauptnen-


= +
(k − 1)! · (n − k)! k! · (n − k − 1)! ner bringen)

(n − 1)! · k (n − 1)! · (n − k)
= +
k · (k − 1)! · (n − k)! k! · (n − k − 1)! · (n − k)

(n − 1)! · k + (n − 1)! · (n − k)
=
k! · (n − k)!

(n − 1)! · (k + (n − k)) (n − 1)! · n


= =
k! · (n − k)! k! · (n − k)!
 
n! n
= =
k! · (n − k)! k
qed.

Jetzt folgt der Satz, der das Hauptziel dieses Abschnitts darstellt. Er ist eine Verallge-
meinerung der ersten Binomischen Formel:

Satz: (Binomischer Lehrsatz ) Für a, b ∈ IR und n ∈ IN gilt


n  
n
X n k n−k
(a + b) = a b (1.14)
k=0
k

Bemerkung: Für n = 2 ist dieses die erste Binomische Formel.


Beweis: (Durch vollständige Induktion)
“n = 1“ (Induktionsanfang):
linke Seite = (a + b)1 = a + b
1  
X 1 k 1−k
rechte Seite = a b = b+a
k
k=0 | {z }
=1

“n − 1 ⇒ n“ (Induktionsschluß):
n−1  
n−1
X n − 1 k n−1−k
· (a + b)
(a + b) = a b
k=0
k
n−1  
X n−1
(a + b)n
= (a + b) · ak bn−1−k (ausmultiplizieren)
k=0
k
n−1   n−1  
X n−1 k+1 n−1−k
X n − 1 k n−k
= a b + a b
k=0
k k=0
k

26
Bei der ersten dieser beiden Summen wird eine Indexverschiebung durchgeführt, indem
bei allen Summanden dieser Summe k durch k − 1 ersetzt und die beiden Indexgrenzen
entsprechend angepaßt werden:
n   n−1  
n
X n − 1 k n−k X n − 1 k n−k
(a + b) = a b + a b
k=1
k − 1 k=0
k

  n−1   n−1    
n − 1 n X n − 1 k n−k X n − 1 k n−k n−1 n
= a + a b + a b + b
n−1 k=1
k−1 k=1
k 0
| {z } | {z }
zu k=n zu k=0

Aus der ersten Summe ist der letzte, aus der zweiten der erste Summand herausgenom-
men worden. Die Indexbereiche beider Summen sind damit gleich, die beiden Summen
können zusammengefaßt werden. Man schließt weiter:

  n−1      
n n−1 n X n−1 n−1 k n−k n−1 n
(a + b) = a + + a b + b
n−1 k=1 |
k−1 k 0
| {z } {z } | {z }
=1=(n
n)
=(n
k)
(nach (1.13)) =1=(n
0)

  n−1    
n n X n k n−k n n (Alles unter ein Sum-
= a + a b + b
n k 0 menzeichen bringen.)
| {z } k=1 | {z }
zu k=n zu k=0

n  
X n k n−k
= a b
k=0
k

qed.

1.3 Der Begriff der Funktion


Definition: Gegeben seien zwei nichtleere Mengen M und N ; eine Funktion f von M
nach N
f : M 7→ N
ist eine Zuordnungsvorschrift, die jedem Element x ∈ M genau ein Element y ∈ N
zuordnet. Man schreibt für dieses y:
y = f (x)

Beispiel:
1. Sei M = {Menschen}, N = {Zeichenketten} und
f : M 7→ N mit f (x) =der vollständige Name von x“

Unter der Annahme, daß jeder Mensch genau einen Namen besitzt, ist f (x) eine
Funktion.

27
2. Die Temperatur T , die an einem bestimmten Ort herrscht, wird während der Zeit
von t = a bis t = b betrachtet; diese liefert eine Zuordnung

t 7→ T = f (t) für a ≤ t ≤ b

und damit eine Funktion f : I = [a, b] 7→ IR .

Zwischen zwei endlichen Mengen läßt sich eine Funktion folgendermaßen darstellen:
f
' $ ' $
w - w
1

w
 w
XX  : w

XXX
w : w
 X
  X
XXX  
w z w
    
XXX
  X

w

  w
& % & %
M N
Bedeutsam ist bei einer Funktion, daß von jedem Element der links stehenden Menge
M genau ein Pfeil ausgeht. Bei einer Funktion f : M 7→ N ist jedoch möglich,
• daß es x1 , x2 ∈ M mit x1 6= x2 , aber

f (x1 ) = f (x2 )

gibt;

• daß es ein y ∈ N gibt, zu dem es kein x ∈ M mit f (x) = y gibt.


Dieses führt auf die folgende
Definition: Die Funktion f : M 7→ N heißt genau dann umkehrbar, wenn gilt:
1. zu jedem y ∈ N gibt es ein x ∈ M mit

f (x) = y

(man sagt: f ist surjektiv);

2. für x1 , x2 ∈ M mit x1 6= x2 ist stets

f (x1 ) 6= f (x2 )

(man sagt: f ist eineindeutig oder injektiv).

Bemerkung: Bei einer umkehrbaren Funktion ist insbesondere zu einem vorgegebenen


y ∈ N das x ∈ M mit f (x) = y eindeutig bestimmt.

Bei einer umkehrbaren Funktion entsprechen sich alle Elemente von M und N paar-
weise (siehe Zeichnung). Die Bezeichnung umkehrbar“ wird durch den folgenden Satz

gerechtfertigt.

Beispiel einer umkehrbaren Funktion:

28
M f N
' $ ' $
| - |
| - |
|
|
XX
XXX
 
X
:
z |
 XX
|

 X
& % & %

Satz: Die Funktion f : M →


7 N ist genau dann umkehrbar, wenn die Umkehrfunktion
oder inverse Funktion von f

−1 −1 Das zu y eindeutig bestimmte
f : N 7→ M mit f (y) =
x ∈ M mit f (x) = y
existiert.
Setzt man f (x) und f −1 (y) ineinander ein, so folgt für y = f (x) bzw. x = f −1 (y)
f −1 (f (x)) = f −1 (y) = x und f (f −1 (y)) = f (x) = y (1.15)
Diese Gleichungen besagen: Wendet man eine umkehrbare Funktion f auf ein Element
x ∈ M an und wendet man darauf wiederum die Umkehrfunktion f −1 an, so erhält man
das ursprüngliche Element x zurück. Das entsprechende gilt, wenn man auf ein y ∈ N
zunächst f −1 und danach f anwendet.
Die bereits als Spezialfall in den Gleichungen 1.15 vorkommende Ineinandersetzung zwei-
er Funktionen ist Inhalt der folgenden
Definition: Sind drei nichtleere Mengen M , N und P und die beiden Funktionen
f : M 7→ N und g : N 7→ P
gegeben, dann heißt die Funktion
g ◦ f : M 7→ P
mit
g ◦ f (x) = g(f (x))
für x ∈ M die Verknüpfung, Ineinandersetzung oder Komposition der Funktionen f und
g.

:
 g◦f XX
  XXX
 XXX
 XX
' $f ' $g '
z
$
| - | - |
| 

: - |
| | 
: |
PP :
 P PP
P 
|
PP 
  PPP 
|
P
P P  
 PPP P

|
PP
 PP  P
| q |
 PP
PP
q  P
& % & % & %
M N P

29
Beispiel: M = N = P = IR

f : x −→ x + 1
g : x −→ x2
g ◦ f : x −→ (x + 1)2

Mit den Bezeichnungen der Definition lauten die Gleichungen 1.15

(f −1 ◦ f )(x) = x für alle x ∈ M


(1.16)
und (f ◦ f −1 )(y) = y für alle y ∈ N

1.3.1 Liste wichtiger Bezeichnungen bei Funktionen


Seien M und N zwei nichtleere Mengen und

f : M 7→ N

eine Funktion zwischen ihnen. Dann gelten die folgenden Bezeichnungen:

x das Argument von f


f (x) der Funktionswert von f an der Stelle x


x −→ f (x) Angabe der Zuordnungsvorschrift
y = f (x) Beispiel: M = N = IR , x 7→ f (x) = x3

M der Definitionsbereich der Funktion f


N die Zielmenge der Funktion f
die Bildmenge oder der Wertebereich von f :
f (M )
{y ∈ N | es gibt ein x ∈ M mit y = f (x)}
f ist reelle Funktion M ⊂ IR und N ⊂ IR
für eine reelle Funktion f : die größte Teilmenge von IR auf
der die definierende Zuordnungsvorschrift für f noch gültig
ist. Beispiel:

Dmax 1
x −→
1−x
Dmax = IR \ {1}

Bemerkung: Die Funktion ist genau dann surjektiv , wenn N = f (M ), d. h. wenn die
Zielmenge gleich dem Wertebereich ist.

30
1.3.2 Das Schaubild einer reellen Funktion
Man stellt eine reelle Funktion
f : M 7→ N dabei ist M, N ⊂ IR
anschaulich dar, in dem man in der Ebene IR2 die Punkte mit den Koordinaten (x, f (x)
für x ∈ M kennzeichnet. Bei vielen Funktionen ergeben die so markierten Punkte eine
Kurve bzw. mehrere Kurvenstücke.
Beispiel: Die reelle Funktion f : IR 7→ IR sei definiert durch

(x − 2)2 1
f (x) = +
2 2
Das Schaubild dieser Funktion oberhalb des Intervalls [0, 4] ist
3
... .. f (x)
... ..
... .
2 ...
... ...
.... .
y .... ......
.... ..
..... .
. ...
.
1 ..... ...u (3, f (3)) = (3, 1)
.......
.......... ...
. .....
.
...........................

0
0 1 2 3 4
x
Anhand des Schaubildes erkennt man leicht, ob es auch wirklich eine Funktion darstellt:
Oberhalb eines jeden Punktes aus dem Definitionsbereich M ⊂ IR muß genau ein Punkt
des Schaubildes liegen.

Beispiel: Das folgende Schaubild


4
..........................
......................
.................
................
3 ...........u. (x, y2 ) = (3, 2.651)
...........
........
......
....
...
y 2 .
....
..
..........
....
1 .........u......
......
....
... .............. (x, y1 ) = (3, 0.849)
..
. ..
..
.......
...........................
.
0 ........
0 1 2 3 4 5
x
stellt keine Funktion f : IR 7→ IR dar, denn
1. es gibt etwa zu x = 3 zwei Werte y1 , y2 ∈ IR , so daß die beiden Punkte (x, y1 )
und (x, y2 ) auf dem Schaubild liegen;

31
2. es gibt für x > 4 kein y ∈ IR mit f (x) = y

Das Schaubild der Umkehrfunktion f −1 einer umkehrbaren Funktion f : IR 7→ IR erhält


man,

• indem man das Schaubild von y = f (x) verwendet, dabei jedoch y als unabhängige
und x als abhängige Veränderliche auffaßt;

• oder, damit wie üblich die Achse der unabhängigen Veränderlichen die waagerechte
Achse ist, indem man die beiden Achsen durch Spiegelung an der Winkelhalbie-
renden x = y vertauscht und gleichzeitig die beiden Variablen x und y ineinander
umbenennt. Das Schaubild von f −1 ist dann genau das Spiegelbild des Schaubildes
von f .
−1
5 . f (x) .
.. . . ...
.. .. .
.. . ...
..
.. .. .
4 .. . ... .
.. ..
.. . . ...
..
... .
. ... f (x)
3
.. .
.
. ... ...
...
.........
..
. .....
...
.
. .. ...
............
.....
y ... . ...
.. .
..............
2
.. .. .....
.........
... ... ... ..................
.......................
.
..
... . ..
.
1 .......................... ......
......... .
... . .
.............. .
.. .. ...
.. .
. . ...
.
... .
.. ... ...
−1 .. . . 1 2 3 4 5
... ..
.
... . x
.. −1 ..

Beispiel: Die Funktion

f : IR 7→ IR mit f (x) = x2

ist nicht umkehrbar: sie ist weder surjektiv (die negativen Zahlen werden nicht angenom-
men) noch eineindeutig (es ist etwa 1 = f (−1) = f (+1)). Um von f (x) = x2 dennoch
noch eine Umkehrfunktion zu erhalten, schränkt man sowohl den Definitionsbereich als
auch die Zielmenge von f (x) auf die Menge der nicht negativen Zahlen ein; die dadurch
entstehende Funktion

f : {x ∈ IR | x ≥ 0} 7→ {y ∈ IR | y ≥ 0}

x 7→ x

erfüllt beide Bedingungen für die Umkehrbarkeit; ihre Umkehrfunktion lautet



f −1 (x) = x

32
f (x) = x2
9 ... ..
.. ...
.. ..
8 .. .
... .. .
.. ..
7
... . ... .
. ..
6 ... .. ..
. .. .
5 ... .
...
.
y .
... ... .
4 . ..
... . ... √
.. f −1 (x) = x
3 ... .. ... ................
...
...
...
. .
... ... .. .....
.....
. ..
.......................
.........
2 . ... ..............
.........................
...
1 ..........
................
0 .......
0 1 2 3 4 5 6 7 8 9
x
Abbildung 1.1: Bei der Umkehrung von f (x) = x2 werden die beiden negativen Halb-
achsen weggelassen.

Dabei ist x die positive Quadratwurzel von x. Nunmehr besitzt f in der Tat eine Um-
kehrfunktion (die Quadratwurzelfunktion); diese ist aber nur auf dem eingeschränkten
Definitionsbereich, d.h. den nichtnegativen reellen Zahlen definiert.8 Weiterhin liegen
die Werte der Umkehrfunktion in der eingeschränkten Zielmenge der Ausgangsfunktion
f .9

1.3.3 Eigenschaften von Funktionen


1.3.3.1 Monotonie
Sei f : M 7→ N eine reelle Funktion. f heißt
monoton wachsend , falls für alle x, y ∈ M gilt
x<y =⇒ f (x) ≤ f (y),

streng monoton wachsend , falls für alle x, y ∈ M gilt


x<y =⇒ f (x) < f (y),

monoton fallend , falls für alle x, y ∈ M gilt


x<y =⇒ f (x) ≥ f (y),

streng monoton fallend , falls für alle x, y ∈ M gilt


x<y =⇒ f (x) > f (y),

monoton , falls f monoton wachsend oder monoton fallend ist,


streng monoton , falls f streng monoton wachsend oder streng monoton fallend ist.
8
Dieses erklärt, wieso man aus einer negativen Zahl keine Wurzel ziehen kann.
9
Das heißt hier: die Quadratwurzelfunktion nimmt nur nichtnegative Werte an.

33
1.3.3.2 Gerade – Ungerade
• f : IR 7→ IR heißt eine gerade Funktion, falls f (−x) = f (x) für alle x ∈ IR ist.
• f : IR 7→ IR heißt eine ungerade Funktion, falls f (−x) = −f (x) für alle x ∈ IR
ist.

Bemerkung: Es gibt Funktionen f : IR 7→ IR , die weder gerade noch ungerade sind.


Beispiel: f (x) = x + 1.

1.3.3.3 Beschränktheit
Sei f : M 7→ N eine reelle Funktion. f heißt
nach oben beschränkt , falls die Bildmenge f (M ) nach oben beschränkt ist,
nach unten beschränkt , falls die Bildmenge f (M ) nach unten beschränkt ist,
beschränkt , falls die Bildmenge f (M ) beschränkt ist.

Für nach oben oder unten beschränkte Funktionen definiert man:


sup(f ):=sup(f (M )) für nach oben beschränktes f
inf(f ) :=inf(f (M )) für nach unten beschränktes f
und entsprechend:

max(f ):=max(f (M ))
falls diese existieren
min(f ) :=min(f (M ))

Beispiel: Eine häufig verwendete Funktion ist die sogenannte Gaußklammer einer re-
ellen Zahl x; man schreibt dafür f(x) = [x]. Die Definition der Gaußklammer lautet:

f(x) = [x] = max{z | z ∈ ZZ , z ≤ x} (1.17)

[x] ist somit die größte ganze Zahl, die kleiner oder gleich x ist. Dieses ist genau der
ganze Anteil der reellen Zahl x. Für x > 0 entspricht das dem Weglassen der Nachkom-
mastellen von x. Die Gaußklammer besitzt das folgende Schaubild:
y
d
f(x) = [x]
2 d

1 d

d x
-1 1 2 3
d -1
Man beachte, daß etwa [π] = 3, aber [−π] = −4 ist. Prüft man nun nach, welche der
oben beschrieben Eigenschaften bei der Gaußklammer erfüllt ist, so stellt man fast, daß
die Gaußklammer

34
• weder injektiv noch surjektiv und damit auf keinen Fall umkehrbar ist,
• monoton wachsend, aber nicht streng monoton wachsend ist,
• nicht monoton fallend ist,
• weder gerade noch ungerade ist
• und weder nach oben noch nach unten beschränkt ist.
Aufgabe: Man begründe diese Aussagen über die Gaußklammer.

1.3.4 Einige grundlegende Funktionen


1.3.4.1 Lineare Funktionen
Sehr einfache, aber dennoch sehr bedeutsame Funktionen sind die linearen Funktionen.
Sie besitzen die Gestalt
f(x) = a x + b (1.18)
mit zwei (konstanten) Koeffizienten a, b ∈ R. Das Schaubild einer solchen Funktion ist
eine Gerade10 :
f(x) = ax + 
b


 

 
f(x) 







x
Die beiden Koeffizienten besitzen eine anschauliche Bedeutung: Bei b handelt es sich um
den y-Achsenabschnitt; es ist nämlich f(0) = b.

f(x) = ax + 
b


f(x1 ) 




 ∆f

f(x0 ) 

b  ∆x

x0 x1
Der Koeffizient a stellt die konstante Steigung, d. h. den Zuwachs der Funktion im
Verhältnis zur Differenz der zugehörigen x-Werte dar. Man rechnet nämlich nach:
∆f = f(x1 ) − f(x0 ) = (ax1 + b) − (ax0 + b) = a x1 − x0 = a (1.19)
∆x x1 − x0 x1 − x0 x1 − x0
Ist b = 0, also f(x) = a x, so ist f(x) linear im engeren Sinne. Zur Abgrenzung davon
nennt man solche Funktionen im Falle b 6= 0 auch als affin-linear.
10
eine unendliche ungekrümmte Linie

35
1.3.4.2 Quadratische Funktionen
Eine quadratische Funktion ist mit Koeffizienten a, b, c ∈ R, a 6= 0 durch

f(x) = a x2 + b x + c (1.20)

gegeben.

Das Schaubild einer solchen ...


quadratischen Funktion be- ... 1
...
... .
sitzt die Gestalt einer Parabel; ... ...
... ..
im Falle a > 0 ist diese Parabel ...
... .....
... ...
nach oben offen: −2 ...−1
.... 1 2 3..... 4
.... .
..
.... ...
.
Für a < 0 erhält man das um- .....−1
......
..... ..
gekehrte Bild einer nach unten ......
....... .
...
......
........ ....
offenen Parabel. ..........................................
−2

Häufig betrachtet man normierte quadratische Funktionen. Hierbei besitzt der höchste
Koeffizient a den Wert 1. Die verbleiben Koeffizienten bezeichnet man in der Regel mit
p und q:

f(x) = x2 + p x + q (1.21)

Zum Finden der Nullstellen, d. h. zum Lösen der Gleichung f(x) = 0, verwendet man
die bekannte “p-q-Formel“:
p 1p 2
− ± p −4q (1.22)
2 2
Man setzt dazu D = p2 − 4 q. Im Falle D > 0 liefert (1.22) zwei, im Falle D = 0 eine
und im Falle D < 0 keine (reelle) Lösung.

1.3.4.3 Potenz- und Wurzelfunktionen


Potenzfunktion besitzen die Gestalt

f(x) = xn mit n ∈ N (1.23)

Für die weitere Betrachtung ist eine Unterscheidung zwischen geraden und ungeraden
Exponenten n vorteilhaft. Sei zunächst n ungerade. In diesem Fall sind die Funktionen
(1.23) streng monoton wachsend; sie sind sogar injektiv und surjektiv und damit umkehr-
bar (bijektiv). Man kann dieses anhand der Schaubilder erkennen, die hier beispielhaft
für x3 und x7 gezeichnet sind:

36
2 . x7
...
..
...... x3
...
1 .
......
...
.........
... .
......................
........ .................................................................................
..................................
−1..... .......... 1
.........
......
...... −1
. ..
..
...
.
−2
Die Umkehrfunktion ist die Wurzelfunktion, die in diesem Fall für alle x ∈ R definiert
ist. Man schreibt dafür

f −1 (x) = n x (x ∈ R) (1.24)

Liegt ein gerader Exponent n vor, so besitzen die Potenzfunktionen Schaubilder der
Gestalt (hier beispielhaft für x2 und x6 gezeichnet):
... 1.8 . 6
... ... x
.. .
......... ...... x2
..... ...
......... 1 .
.........
... ........ ... .
... ........ ........... ...
.... .......
...... ........... ....... ...
..................... .......... . . . . . . ..............................................
......................................................
−1 1
Man erkennt unmittelbar, daß diese Funktionen weder injektiv noch surjektiv sind. Um
aber doch zumindest teilweise diese Funktion umkehren zu können, schränkt man sie
auf die nicht negativen reellen Zahlen ein. Dieses liefert die Funktionen

g : R \ {x < 0} −→ R \ {x < 0}
mit g(x) = f|{x≥0} (x) (1.25)

Die zugehörige Umkehrfunktion ist ebenfalls nur auf den nicht negativen reellen Zahlen
definiert:

g−1 : R \ {x < 0} −→ R \ {x < 0} (1.26)

Man schreibt auch dieses wieder als Wurzelfunktion, die aber jetzt – beim Vorliegen
eines geraden Exponenten – nicht für negative x-Werte definiert ist:

g−1 (x) = n x (x ∈ R, x ≥ 0) (1.27)

Für n = 2 ist dieses die übliche Quadratwurzel (siehe auch Seite 32); bekanntlich schreibt
man dafür nur
√ √
x = 2x (x ∈ R, x ≥ 0) (1.28)

37
Das Schaubild aller Wurzelfunktion für n ≥ 2 und x ≥ 0 ähnelt dem der Quadratwurzel:
1.5
.......
...
...
...
...............
.
.........
.
...
...
.............
.......
1
..
...
..........
....
..
.........
.
.....
..
......
....
.. ..
..
...
1 2

Bemerkung: Auch wenn für ungerades n die Wurzel x sowohl für positive als auch für n

negative x-Werte definiert ist, betrachtet häufig auch diese Wurzeln nur für x ≥ 0. Man
kann damit die Wurzelfunktionen einheitlich behandeln. Im Folgenden soll demgemäß
n sowohl gerade als auch ungerade sein können, und x sei stets nicht negativ.
Mit diesen Festsetzungen gelten die Gleichungen
√ n √n
n
x = x und xn = x (1.29)
sowie weiterhin
√ √ √
n
x·y = n
x· n
y (1.30)
Neben der Wurzelschreibweise ist die Potenzschreibweise mit gebrochenem Exponenten
üblich:
1 √
xn = n x (1.31)
Motiviert wird die Gleichung durch Anwendung der bekannten Regel (ak )l = ak·l :
 1 n 1 n
 1 n
xn = x n ·n = x n = x1 = x also: xn = x (1.32)
Jetzt muß man nur auf beiden Seiten von (1.32) die n-te Wurzel ziehen und anschließend
auf der linken Seite von (1.32) die zweite Gleichung in (1.29) verwenden.
Man erweitert (1.31) auf Potenzfunktionen mit beliebigen rationalen Exponenten. Sei
r ∈ Q zunächst eine positive rationale Zahl mit r = p/q und p, q ∈ N; dann setzt man
für x ∈ R, x ≥ 0:
√ p
f(x) = xr = q x (1.33)
oder gleichbedeutend

f(x) = xr = q
xp (1.34)
Ist dagegen r ∈ Q und r < 0, so setzt man r = −p/q mit wieder p, q ∈ N und definiert
für x > 0
1
f(x) = xr = √ q
(1.35)
xp
Die bekannten Regeln des Potenzierens (siehe (1.1)) gelten auch mit diesen rationalen
Exponenten:
Satz: Für x, y ∈ R+ und r, s ∈ Q gilt:
xr+s = xr · xs
(x · y)r = xr · y r (1.36)
(xr )s = xr·s

38
1.3.4.4 Die Funktion f (x) = 1/x
Hierbei handelt es sich um eine sogenannte gebrochen rationale Funktion11 Da eine
Teilung durch Null nicht möglich ist, ist diese Funktion nur für x 6= 0 definiert. Bei
x = 0 liegt eine sogenannte Polstelle vor. Ein Kennzeichen einer Polstelle besteht
darin, daß bei Annäherung von x an die Polstelle der Funktionswert f(x) gegen Plus-
oder Minusunendlich strebt:
3 ....
...
...
2 ...
...
...
....
1 ......
..........
.........................
............................................
.......................................................
−5 .................. −1 1 2 3 4 5
........
.....
...−1
...
...
...
...
...
...
.
Wie man anhand der Zeichnung erkennt, nähert sich umgekehrt der Funktionswert 1/x
beliebig stark der Null an, wenn x dem Betrage nach immer größer wird.

1.3.4.5 Exponentialfunktion und Logarithmus


Im Abschnitt 1.3.4.3 auf Seite 38 wurden für x > 0 Potenzfunktionen der Gestalt
f(x) = xr mit rationalen Exponenten r eingeführt. Hier soll umgekehrt für die Basis
dieser Potenz ein fester positiver reeller Wert a eingesetzt werden und der Exponent
veränderlich sein. Dieses liefert eine sogenannte Exponentialfunktion:

f(x) = ax mit einem a ∈ R+ (1.37)

Aufgrund der im Abschnitt 1.3.4.3 angestellten Betrachtungen ist diese Funktion zu-
nächst nur für x ∈ Q definiert. In natürlicher Weise läßt sich die Definition auf be-
liebige x ∈ R. Dieses wird mit Mitteln der Differential- und Integralrechnung in einer
nachfolgenden Vorlesung gezeigt werden. Als Standardwert für die Basis wählt man die
Eulersche Konstante:

e ≈ 2.71828183 (1.38)

Es handelt bei e um eine irrationale Zahl; der Grund für deren Wahl als Standardbasis
einer Exponentialfunktion wird später erläutert werden. Man erhält damit die Standar-
dexponentialfunktion12 :

exp(x) = ex (1.39)
11
Eine gebrochen rationale Funktion ist ein Quotienten zweier Polynome. Solche Funktionen werden
in einer nachfolgenden Vorlesung genauer behandelt werden.
12
in der Regel einfach als Exponentialfunktion“ bezeichnet

39
Es gelten die üblichen Regeln der Potenzrechnung13

ex+y = ex · ey
(ex )y = ex·y
(1.40)
e−x = 1x
e
0
e = 1

oder in anderer Schreibweise:


exp(x + y) = exp(x) · exp(y)
exp(x)y = exp(x · y)
(1.41)
exp(−x) = 1
exp(x)
exp(0) = 1

Die Exponentialfunktion exp(x) besitzt das Schaubild

12 ..
.. .
.
10
...
...
8 .. ..
.
.
.
.....
y 6 ..
......
...
4 ..
........
.
....
..
...
. .
.........
2 ..................
..
...
...
................
..........................................................................................
−3.0 −2.0 −1.0 0.0 1.0 2.0
x

Abbildung 1.2: f(x) = exp(x)

Man erkennt das typische Verhalten der Exponentialfunktion:

• exp(x) nimmt nur positive Werte an.

• Für x gegen Unendlich strebt exp(x) sehr schnell gegen Unendlich.

• Für x gegen Minusunendlich nähert sich exp(x) beliebig stark dem Wert Null an.

• exp(x) ist streng monoton wachsend.

Insbesondere ist exp(x) injektiv und, wenn man die Zielmenge auf R+ (die positiven
reellen Zahlen) einschränkt, auch surjektiv. Insbesondere liefert dieses eine umkehrbare
Funktion

exp : R −→ R+ (1.42)
13
Die Regel sind hier nur für die Standardbasis e formuliert, gelten aber entsprechend für andere
Basen a > 0.

40
Die zugehörige Umkehrfunktion

exp−1 : R+ −→ R (1.43)

wird logarithmus naturalis, natürlicher Logarithmus oder einfach nur als Loga-
rithmus genannt. Übliche Bezeichnungen sind

log(x) = exp−1 (x) oder auch ln(x) = exp−1 (x) (1.44)

Anhand des Schaubildes des Logarithmus (siehe Abbildung 1.3) erkennt man dessen
Eigenschaften14 :
• log(x) ist nur für x > 0 definiert.
• log(1) = 0
• log(x) > 0 ⇔ x > 1
• Für x gegen Null nähert sich log(x) Minusunendlich an.
• Für x gegen Unendlich strebt auch log(x) gegen Unendlich, wobei jedoch das
Wachstum immer geringer wird.

.......
...
...
...
...
...
...
....
...
...
.........................................
.
2.0 ...................
..
...
...
...
...
........................
.
..........
..
...
...
................
1.0 ......
...
. .
.........
.....
y 0.0 .
. ....
.... 2 4 6 8 10 12
.. .
−1.0 .. x
.
...
−2.0 ..
...
..
−3.0 ..

Abbildung 1.3: f(x) = log x

Da log und exp zueinander Umkehrfunktionen sind, gelten die Gleichungen

log (ex ) = x (1.45)


elog(x) = x (1.46)

Dabei gilt Gleichung (1.46) nur für x > 0. Diese Gleichung besagt unter anderem, daß
log(x) derjenige Exponent ist, mit dem man e potenzieren muß, um als Potenzwert x
zu erhalten.
Aus der Regel ex+y = ex ·ey (siehe (1.40)) ergibt sich das berühmte Logarithmusgesetz:
Für x, y ∈ R+ gilt:

log(x · y) = log(x) + log(y) (1.47)


14
Diese Eigenschaften werden in einer nachfolgenden Vorlesung noch genau hergeleitet und begründet
werden.

41
Beweis:

log(x · y) = log elog(x) · elog(y) Zweimal wurde (1.46) angewandt.

= log elog(x)+log(y) nach (1.40)
= log(x) + log(y) wieder nach (1.46)

qed.
+
Ebenso wichtig sind diese Folgerungen aus dem Logarithmusgesetz: Für x, y ∈ R , u ∈ R
gilt:
 
x
log = log(x) − log(y) (1.48)
y
log(xu ) = u · log(x) (1.49)

Beweis: Mit Hilfe von (1.47) folgt:


     
log xy = log x + log(y) − log(y) = log x · y − log(y)
y y
= log (x) − log(y)

Zum Nachweis von (1.49) verwendet man (1.40) und (1.46):


u  
log (xu ) = log elog(x) = log eu·log(x)
= u · log(x)

qed.
Die Gleichungen (1.47), (1.48) und (1.49) rechtfertigen die große Bedeutung des Lo-
garithmus. Diese Gleichungen besagen, daß der Logarithmus eine Rechnungsart in die
nächst einfachere Rechnungsart überführt. So wird ein Produkt in eine Summen, ein
Quotient in eine Differenz und eine Potenz in ein Produkt verwandelt.

1.3.4.5.1 Rechenbeispiele mit dem Logarithmus 15


Eine häufige Frage betrifft die nächst größere Zweierpotenz einer gegebenen positiven
reellen Zahl a ∈ IR+ :

gegeben : a ∈ IR+
gesucht : n ∈ IN minimal mit 2n ≥ a (1.50)

Zum Bestimmen dieses n ∈ IN logarithmiert man beide Seiten der Ungleichung (1.50)
und verwendet (1.49) sowie die Monotonie des Logarithmus:

n · log(2) ≥ log(a) (1.51)

Wegen log(2) > 0 ist weiter

log(a)
n ≥ (1.52)
log(2)
15
Dieser Abschnitt wird nicht in der Vorlesung behandelt; es ist zum selbständigen Lesen vorgesehen.

42
Die kleinste natürliche Zahl n, die diese Ungleichung erfüllt, wird gesucht. Ist die rechte
Seite von (1.52) bereits in IN, so kann man
log(a)
n = (1.53)
log(2)
setzen. Andernfalls benötigt man die nächst größere natürliche Zahl; die erhält etwa
man mit Hilfe der Gaußklammer (siehe Seite 34):
 
log(a)
n = +1 (1.54)
log(2)
Beispielfrage: Jemand spielt ein Gewinnspiel, bei dem im Falle eines Gewinns der ein-
gesetzte Geldbetrag verdoppelt wird.
Wie oft müßte jemand hintereinander gewinnen, der mit einen Einsatz von einem Euro
beginnt und anschließend stets den bislang gewonnenen Betrag beim folgenden Spiel
wieder einsetzt, um anschließend mindestens 10 000 000 Euro zu erhalten?
Da nach jedem Spiel der Betrag verdoppelt wird, beläuft sich der Betrag nach n hinter-
einander gewonnen Spielen auf
1 · 2n (Euro)
n soll minimal gewählt werden, so daß dieser Wert mindestens 10 000 000 = 107 beträgt.
Nach (1.52) liefert dieses die Bedingung
log(107 ) 7 · log(10) · 2.3026 = 23.2535
n ≥ = = 70.69315
log(2) log(2)
Die nächst größere natürliche Zahl ist n = 24.

Beispielfrage: Wieviele Dezimalstellen besitzt die Zahl


31000 ? (1.55)
Allgemein lautet dieses Frage: Wieviele Dezimalstellen besitzt eine gegeben natürliche
Zahl a ∈ IN ?.
Zur Beantwortung dieser Frage wird die vollständige Dezimaldarstellung der Zahl a
verwendet:
a = zk · 10k + zk−1 · 10k−1 + . . . z1 · 10 + z0 (1.56)
Dabei sind die zi die dezimalen Ziffern, für die bekanntlich
0 ≤ zi ≤ 9 (i = 0, . . . k − 1)
(1.57)
1 ≤ zi ≤ 9 (die führende Ziffer)
Die gesuchte Anzahl der Dezimalstellen ist dann
k +1 (1.58)
zu deren Bestimmung zwei Ungleichungen hergeleitet werden. Da in (1.56) alle Sum-
manden nicht negativ sind, folgt als erstes
a = zk · 10k + zk−1 · 10k−1 + . . . + z1 · 10 + z0
≥ zk · 10k ≥ 10k (wegen zk ≥ 1)
⇒ a ≥ 10k (1.59)

43
Und weiter hat man wegen zi ≤ 9

a = zk · 10k + zk−1 · 10k−1 + . . . + z1 · 10 + z0


≤ 9 · 10k + 9 · 10k−1 + . . . + 9 · 10 + 9
k
X
= 9· 10i (endliche geometrische Reihe, siehe (1.10))
i=0

1 − 10k+1 1 − 10k+1
= 9 · = 9 · = 10k+1 − 1 < 10k+1
1 − 10 −9
⇒ a < 10k+1 (1.60)

(1.59) und (1.60) liefern zusammen

10k ≤ a < 10k+1 (1.61)

Hieraus folgt, daß 10k+1 die kleinste Zehnerpotenz ist, die größer als a ist. Logarithmiert
man (1.61), so erhält man entsprechend wie bei (1.51)

k · log(10) ≤ log(a) < (k + 1) · log(10)


log(a)
⇒ k ≤ < (k + 1) (1.62)
log(10)

Damit ist k die größte ganze Zahl, die kleiner oder gleich log(a)/ log(10) ist. Die erhält
man wiederum mit der Gaußklammer (siehe (1.17)). Die Anzahl der Dezimalstellen von
a ∈ IN lautet damit
 
log(a)
k+1 = +1 (1.63)
log(10)

Für 31000 aus (1.55) erhält man damit als Stellenzahl:

log(31000 )
     
1000 · log(3) 1000 · 1.0986
+1 = +1 = +1
log(10) log(10) 2.3026
= [477.12] + 1 = 478

Die Zahl 31000 besitzt somit 478 Dezimalstellen.

1.3.4.5.2 Der Logarithmus zu anderen Basen Definition:

log(x)
der dekadische Logarithmus : lg(x) =
log(10)
log(x)
der Logarithmus dualis : ld (x) =
log(2)

Für den dekadischen Logarithmus gilt dann etwa:


log(x)
10lg(x) = elog(10)·lg(x) = elog(10) log(10) = elog(x) = x

44
1.3.4.6 Polynome
1.3.4.6.1 Definition Die Funktion

p : IR 7→ IR

sei durch die Zuordnungsvorschrift

x 7→ p(x) = 2x7 + 2x3 + 1

gegeben; p(x) ist ein Beispiel für ein sogenanntes Polynom.


Definition: Eine Funktion p : IR 7→ IR mit einer Zurordnungsvorschrift der Gestalt

p(x) = an xn + an−1 xn−1 + . . . + a2 x2 + a1 x + a0


Xn
= ai x i
i=0

mit n ∈ IN0 und a0 , a1 , . . . , an ∈ IR heißt (reelles) Polynom. Die reellen Zahlen


a0 , a1 , . . . , an sind die sogenannten Koeffizienten des Polynoms.

Üblicherweise gibt man bei einem Polynom nur die Summanden mit von Null verschie-
denen Koeffizienten an, so wie in dem obigen Beispiel geschehen: in dem Ausdruck

p(x) = 2x7 + 2x3 + 1

wurde der Summand 0x2 weggelassen.

Eine Polynom ist durch seine Koeffizienten festgelegt, d. h.

Zwei Polynome sind genau dann gleich, wenn ihre Koeffizi-


enten an den entsprechenden Gliedern übereinstimmen.

Beispiel: Die beiden Polynome

p(x) = 2x7 + 2x3 + 1 und


q(x) = x17 + 2x7 + 3x3 + 1

sind nicht gleich, da sich die Koeffizienten an den Positionen 17 und 3 unterscheiden.

Das Polynom, dessen sämtliche Koeffizienten den Wert Null haben, heißt Nullpolynom;
man schreibt dafür einfach 0“. Das 0–te Glied, d. h. das Glied bei x0 , ist das sogenannte

konstante Glied.

Polynome haben in der Anwendung eine sehr große Bedeutung, unter anderem deshalb,
weil sich ihre Werte sehr leicht berechnen lassen16

z.B.: p(3) = 2 · 37 + 2 · 32 + 1 = 4393

Die Berechnung erfolgte durch einfaches Multiplzieren (einschl. Potenzieren) und Ad-
dieren/Subtrahieren.
Auch kann man mit Polynomen untereinander rechnen:
16
Wie man eine solche Berechnung auf besonders effektive Weise vornehmen kann, wird später gezeigt.

45
• Zwei Polynome werden addiert bzw. subtrahiert, indem ihre Koeffizienten an den
entsprechenden Gliedern addiert (subtrahiert) werden, z.B.:

p(x) + q(x) = (2x7 + 2x3 + 1) + (x17 + 2x7 + 3x3 + 1)


= x17 + 4x7 + 5x3 + 2

• Zwei Polynome werden miteinander multipliziert, indem man sie ausmultipliziert,


anschließend die einzelnen Glieder miteinander multipliziert:

(ai xi ) · (bj xj ) = (ai · bj )xi+j

und die Summanden mit gleichen Potenzen der Unbestimmten zusammenfaßt,


z. B.:

(x3 + 2x + 4) · (3x2 + x + 1)
= x3 · (3x2 + x + 1) + 2x · (3x2 + x + 1) + 4 · (3x2 + x + 1)
= 3x5 + x4 + x3 + 6x3 + 2x2 + 2x + 12x2 + 4x + 4
= 3x5 + x4 + 7x3 + 14x2 + 6x + 4

Neben der Addition/Subtraktion und der Multiplikation, die als Ergebnis stets wieder
ein Polynom liefern, ist auch eine Polynomdivision vorhanden; die Polynomdivision
geht jedoch im allgemeinen nicht auf, es bleibt dann ein (Divisions-) Rest.
Die Polynomdivision erfolgt auf dieselbe Art wie die schriftliche Division zweier Dezimal-
zahlen: Man beginnt, indem man das höchste Glied des Dividenden durch das höchste
Glied des Divisiors teilt, danach erfolgt die Gegenrechnung, und die Rechnung wird mit
dem höchsten Glied des verbliebenen Dividenden fortgesetzt; z. B.:

(2x5 +4x3 + 6) : (2x2 +2x) = x3 −x2 +3x−3


2x5 +2x4
−2x4 +4x3
−2x4 −2x3
6x3 + 6
6x3 + 6x2
− 6x2 + 6
− 6x2 − 6x
6x + 6

Ein weiterer Divisionsschritt ist hier nicht möglich, 6x + 6 bleibt als Divisionsrest, also

(2x5 + 4x3 + 6) : (2x2 + 2x) = x3 − x2 + 3x − 3 Rest 6x + 6


6x + 6
= x3 − x2 + 3x − 3 +
2x2 + 2x
Die Division geht genau dann auf, wenn der Rest Null ist; man nennt dann – wie bei
Zahlen – das Divisorpolynom einen Teiler des Dividendenpolynoms. Im anderen Fall ist
der Quotient kein (ganzes) Polynom17 mehr, sondern eine gebrochen rationale Funktion,
solche werden später behandelt.
17
Eine andere Bezeichnung für Polynome ist ganz rationale Funktionen.

46
Ein wichtiger Fall, in dem die Division immer aufgeht, ist der folgende:
Hilfssatz: Sei n ∈ IN und a ∈ IR , dann ist der Quotient
x n − an
x−a
stets ein (ganzes) Polynom, d. h. diese Division geht ohne Rest auf.
Beweis: Durch vollständige Induktion:
Induktionsanfang n = 1“: klar, denn

x 1 − a1
= 1 ist (ganzes) Polynom
x−a
Induktionsschluß (n − 1) ⇒ n“: Wir nehmen an, daß die Behauptung für den Fall n − 1

richtig ist, d. h. wir nehmen an, daß

xn−1 − an−1
x−a
ein (ganzes) Polynom ist; multipliziert man dieses mit x und addiert man an−1 hinzu,
so erhält man wieder ein (ganzes) Polynom:

xn−1 − an−1
x· + an−1
x−a
Eine einfache Umformung (x ausmultiplizieren und alles auf den Hauptnenner x − a
bringen) zeigt, daß dieses Polynom gleich (xn − an )/(x − a) ist:

x n − an xn−1 − an−1
= x· + an−1
x−a | x − {z
a }
ist Polynom

Somit ist auch (xn − an )/(x − a) ein Polynom; damit ist alles bewiesen.
qed

Eine Maßzahl“ für ein Polynom ist sein Grad; der Grad eines Polynoms ist der größte

in ihm vorkommende Exponent der Unbestimmten; bzw. genauer:
Definition: Sei
Xn
p(x) = ai xi 6= 0
i=0

ein Polynom, das nicht gleich dem Nullpolynom ist. Ist an 6= 0, so heißt n der Grad
von p(x); man schreibt dafür
grad(p(x)) = n

Bemerkung:

• Ein Polynom hat genau dann den Grad 0, wenn es ein konstantes Polynom 6= 0
ist.

• Für das Nullpolynom ist der Grad nicht definiert; aus formalen Gründen verleiht
man dem Nullpolynom häufig den Grad −∞ ( minus unendlich“).

47
• Ein Polynom p(x) 6= 0 heißt normiert, falls sein höchster Koeffizient gleich 1 ist;
mit anderen Worten: ist n = grad(p(x)), so ist p(x) genau dann normiert, wenn
an = 1 ist.

Wie hängt der Grad eines Produkts zweier Polynome von den beiden Faktoren ab?
Multipliziert man zwei vom Nullpolynom verschiedene Polynome miteinander, so liefert
das Produkt der beiden höchsten Glieder das höchste Glied des Produktpolynoms: hat
man
n
X
p(x) = ai x i mit an 6= 0
i=0
Xm
und q(x) = bj x j mit bm 6= 0
j=0

so hat deren Produkt die Gestalt

p(x) · q(x) = an · bm · xn+m + Glieder niederer Ordnung

Hieraus folgt die sogenannte Gradformel:


Satz: Sind p(x) und q(x) zwei Polynome (6= Nullpolynom), so gilt für den Grad ihres
Produktes p(x) · q(x):

grad(p(x) · q(x)) = grad(p(x)) + grad(q(x))

Der Grad des Produktes ist die Summe der Grade der Faktoren.

Beispiel:

grad((x3 + 2x + 4) · (3x2 + x + 1))


= grad(3x5 + x4 + 7x3 + 14x2 + 6x + 4)
= 5 = 3+2
= grad(x3 + 2x + 4) + grad(3x2 + x + 1)

1.3.4.6.2 Nullstellen und Hornerschema Bei der Betrachtung von Polynomen


spielen Nullstellen eine wichtige Rolle18 .
Definition: Die Zahl x0 ∈ IR heißt (reelle) Nullstelle des Polynoms p(x), falls

p(x0 ) = 0 ist.

Einfaches Beispiel: Das zu x0 ∈ IR gehörige Polynom

s(x) = x − x0

hat genau eine Nullstelle, nämlich x0 .


Wie wir gleich sehen werden, kommt Polynomen dieser Art eine besondere Bedeutung
zu. Ein solches Polynom wird als der zu x0 gehörige Linearfaktor bezeichnet.
18
Es sei hier schon angemerkt, daß wir von den weiteren Überlegungen dieses Abschnitts das Null-
polynom ausnehmen; bei dem Nullpolynom sind Nullstellen nicht besonders interessant!

48
y

Das Polynom s(x) ist ein normiertes Poly-



nom ersten Gerades, sein Schaubild ist eine

Gerade, die die x–Achse an der Stelle x0 , der



s(x) = x − x0

Nullstelle schneidet.


x
0 x

Bemerkenswert ist nun, daß man von einem Polynom p(x) mit p(x0 ) = 0 den Linearfak-
tor x − x0 als Faktor abspalten kann.

Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades, und sei x0 ∈ IR mit p(x0 ) =
0. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit

p(x) = (x − x0 ) · g(x)

Beweis: Geht man von der behaupteten Gleichung aus, und teilt man ihre beiden Seiten
durch x − x0 , so führt das für g(x) auf den Ansatz

p(x)
g(x) =
x − x0
Zu zeigen ist nun, daß dieser Quotient ein (ganzes) Polynom, bzw. daß p(x) ohne Rest
durch den Linearfaktor x − x0 teilbar ist. Dazu schreiben wir p(x) wieder in der Form
n
X
p(x) = ai xi
i=0

und verwenden, daß x0 eine Nullstelle von p(x) ist:


n
X
0 = p(x0 ) = ai xi0
i=0

Damit ist dann


p(x) − 0 p(x) − p(x0 )
g(x) = =
x − x0 x − x0
n n
!
1 X X
= · ai x i − ai xi0
x − x0 i=0 i=0
n
!
1 X
= · ai (xi − xi0 )
x − x0 i=0
n
X xi − xi0
= ai
i=0
x − x0

Nach dem Hilfssatz auf Seite 47 sind alle Quotienten

xi − xi0
x − x0

49
(ganze) Polynome; sie bleiben ganz, wenn man sie mit den ai multipliziert und aufad-
diert. Damit ist dann auch, wie behauptet, g(x) ein (ganzes) Polynom ist. Es bleibt
noch
grad(g(x)) = n − 1
zu zeigen. Wendet man dazu auf

p(x) = (x − x0 ) · g(x)

die Gradformel an:

grad(p(x)) = grad(x − x0 ) + grad(g(x))


| {z } | {z }
=n =1
so erkennt man sofort grad(g(x)) = n − 1.
qed

Bevor man einen Weg sucht, das Polynom g(x) effektiv ausrechnen zu können, bietet
sich eine kleine Verallgemeinerung an:
Satz: Sei p(x) (6=Nullpolynom) ein Polynom n–ten Grades mit n ≥ 1; sei weiter x0 ∈ IR
beliebig. Dann gibt es ein Polynom g(x) vom Grad n − 1 mit

p(x) = (x − x0 ) · g(x) + p(x0 ) (1.64)

Hier wird nicht gefordert, daß x0 eine Nullstelle von p(x). Man nimmt aber eine Rückführung
auf diesen Fall vor, indem man setzt

p̂(x) = p(x) − p(x0 )

Dann ist x0 Nullstelle des Polynoms p̂(x) :

p̂(x0 ) = p(x0 ) − p(x0 ) = 0

Nun kann man den vorherigen Satz anwenden: es gibt ein Polynom n − 1-ten Grades
g(x) mit

p̂(x) = p(x) − p(x0 )


= (x − x0 ) · g(x)

Addiert man zu beiden Seiten der Gleichung p(x0 ), so erhält man die behauptete Aus-
sage.

Gegeben seien nun


n
X
p(x) = ai x i und x0 ∈ IR
i=0

Das Polynom g(x) und gleichzeitig auch der Wert p(x0 ) sollen berechnet werden. Alles,
was man bis jetzt weiß, ist grad(g(x)) = n − 1, man kann daher
n−1
X
g(x) = bi x i
i=0

50
ansetzen. Dieses setzt man in die Gleichung 1.64 ein:
n n−1
!
X X
ai xi = (x − x0 ) · b i xi + p(x0 )
i=0 i=0

Ausmultiplizieren auf der rechten Seite und geeignete Umformungen liefern


n
X n−1
X n−1
X
i i+1
ai x = bi x − bi x 0 x i + p(x0 )
i=0 i=0 i=0
| {z } | {z }
Indexverschiebung auf die andere
i→i−1 Seite bringen
n
X n−1
X n
X
⇒ ai x i + bi x 0 x i = bi−1 xi + p(x0 )
i=0 i=0 i=1

Faßt man noch die beiden Summenzeichen auf der linken Seite zusammen, so liefert das
die Gleichung
n−1
X n
X
an x n + (ai + bi x0 )xi = bi−1 xi + p(x0 ) (1.65)
i=0 i=1

Dieses ist eine Gleichung zweier Polynome; zwei Polynome sind genau dann gleich, wenn
ihre entsprechenden Koeffizienten gleich sind. Wendet man das hier an, so führt Glei-
chung 1.65 auf die Koeffizientengleichungen

bn−1 = an die beiden höchsten Glieder


bi−1 = ai + bi x0 für i = 1, . . . , n − 1
p(x0 ) = a0 + b0 x0 die beiden konstanten Glieder

Damit kann man nacheinander die Koeffizienten19 bn−1 , . . . , b0 und schließlich auch den
Wert p(x0 ) berechnen. Die Berechnung folgt dabei dem Schema (dem sogenannten
Horner-Schema):

an an−1 an−2 ... a1 a0


x0 bn−1 x0 bn−2 x0 ... b 1 x0 b0 x 0
+ bn−1 % bn−2 % bn−3 % ... b0 % p(x0 )

Beispiel: Gegeben seien p(x) = 2x7 + 2x3 + 1 und x0 = −2, darauf das Horner-Schema
angewandt:
2 0 0 0 2 0 0 1
−2 −4 8 −16 32 −68 136 −272
+ 2 −4 8 −16 34 −68 136 −271
Damit haben wir das Polynom g(x) aus Gleichung 1.64 berechnet:

2x7 + 2x3 + 1
= (x + 2) · (2x6 − 4x5 + 8x4 − 16x3 + 34x2 − 68x + 136) − 271
19
Wohl gemerkt: das Ziel, das Polynom g(x) zu berechnen ist erreicht, wenn die Koeffizienten von
g(x) bestimmt worden sind.

51
Insbesondere ist p(−2) = −271.

Wegen seiner gut rechnerischen Eigenschaften lohnt es sich sogar, das Horner-Schema
auch dann einzusetzen, wenn man nur an dem Funktionswert p(x0 ) interessiert ist.

Beispiel: Wir wollen das Horner-Schema auf

p(x) = x4 − 4x3 − 5x2 + 36x − 36 mit x0 = 3

anwenden:
1 −4 −5 36 −36
3 3 −3 −24 36
+ 1 −1 −8 12 0
also insbesondere p(x0 ) = 0 und genauer:

p(x) = x4 − 4x3 − 5x2 + 36x − 36


= (x − 3) · (x3 − x2 − 8x + 12) (1.66)
| {z }
g1 (x)

Wir wenden das Verfahren nochmal an, diesmal auf g1 (x) = x3 −x2 −8x+12 mit x0 = 2:

1 −1 −8 12
2 2 2 −12
+ 1 1 −6 0

also g1 (2) = 0 und

g1 (x) = (x − 2) · (x2 + x − 6)

bzw. g1 (x) in Gleichung 1.66 eingesetzt:

p(x) = (x − 3)(x − 2) · (x2 + x − 6) (1.67)


| {z }
g2 (x)

Eine weitere Anwendung auf g2 (x) = x2 + x − 6 mit nochmal x0 = 2 liefert

1 1 −6
2 2 6 also g2 (x) = (x − 2) · (x + 3)
+ 1 3 0

und dieses in Gleichung 1.67 eingesetzt

p(x) = (x − 3)(x − 2)(x − 2) · (x + 3)


| {z }
g3 (x)

Der letzte Faktor g3 (x) = x + 3 = x − (−3) ist selbst ein Linearfaktor, nämlich der
mit Nullstelle −3. Eine nochmalige20 Anwendung des Verfahrens auf g3 (x) mit x0 = −3
lieferte die triviale Zerlegung

g3 (x) = (x + 3) · 1
20
aber natürlich nicht übliche

52
Der letzte Faktor g4 (x) = 1 hat als konstante Funktion 6= 0 natürlich keine Nullstellen.

In der gewonnenen Zerlegung

p(x) = x4 − 4x3 − 5x2 + 36x − 36


= (x − 3)(x − 2)(x − 2)(x + 3)
= (x − 3)(x + 3)(x − 2)2

erscheint der Linearfaktor x − 2 mit Exponentem 2, er war zweimal als Teiler in p(x)
enthalten. Man nennt daher x0 = 2 eine doppelte - oder zweifache Nullstelle von
p(x); allgemein:

Definition: Sei p(x) nicht das Nullpolynom und x0 ∈ IR . x0 heißt k–fache Nullstelle
oder Nullstelle der Ordnung (Vielfachheit) k von p(x), falls es ein Polynom g(x) mit
g(x0 ) 6= 0 gibt, so daß gilt

p(x) = (x − x0 )k · g(x)

Die Forderung g(x0 ) 6= 0 soll sicherstellen, daß x0 nicht sogar eine (k+1)–fache Nullstelle
von p(x) ist.

1.3.4.6.3 Anzahl von Nullstellen Wir wollen erkennen, daß ein Polynom nur eine
beschränkte Anzahl von Nullstellen besitzen kann, und wir wollen daraus eine wichtige
Folgerung ziehen.
Wir kommen dazu noch einmal auf die Beispiele (siehe Seite 52) mit dem Polynom

p(x) = x4 − 4x3 − 5x2 + 36x − 36

zurück. Nacheinander wurden die folgenden Abspaltungen von Linearfaktoren vorge-


nommen:
p(x) = (x − 3) · g1 (x) mit g1 (x) = x3 − x2 − 8x + 12
p(x) = (x − 3)(x − 2) · g2 (x) mit g2 (x) = x2 + x − 6
p(x) = (x − 3)(x − 2)2 · g3 (x) mit g3 (x) = x + 3
p(x) = (x − 3)(x − 2)2 (x + 3) · g4 (x) mit g4 (x) = 1

Bei jedem Schritt sinkt der Grad des verbleibenden Faktors gi (x) um 1. Wenn so der
Grad 0 erreicht wird, ist der verbleibende Faktor ein konstantes Polynom (6= Nullpoly-
nom), von dem ein weiterer Linearfaktor nicht mehr abgespalten werden kann. Es sind
daher nur 4 = grad(p(x)) Abspaltungen möglich.
Ein solcher Sachverhalt trifft auch bei einem beliebigen Polynom zu: Hat das Polynom
p(x) den Grad n, so kann von ihm höchstens n Mal ein Linearfaktor abgespalten werden;
nach n Abspaltungen hat der letzte verbleibende Faktor den Grad 0 und ist somit
konstant. In einem Polynom vom Grade n sind daher höchstens n Linarfaktoren als
Teiler enthalten.

Da zu jeder Nullstelle mindestens ein Linearfaktor gehört21 , folgt daraus: Das Polynom
p(x) vom Grade n hat höchstens n Nullstellen.
21
aufgrund des Satzes auf Seite 49

53
Berücksichtigt man jetzt auch noch die Vielfachheit der Nullstellen und beachtet man,
daß zu einer Nullstelle der Vielfachheit k ein genau k Mal als Teiler vorkommender
Linearfaktor gehört, so ist man auf einen der wichtigsten Sätze der Mathematik gestoßen:

Satz: Sei p(x) ein Polynom, das nicht gleich dem Nullpolynom ist. Ist n = grad(p(x)),
so hat p(x) höchstens n Nullstellen; dabei wird jede Nullstelle mit ihrer Vielfachheit
gezählt.

In unserem Beispiel mit


x4 − 4x3 − 5x2 + 36x − 36 = (x − 3)(x + 3)(x − 2)2
sind mit Vielfachheit 1 die Nullstellen +3 und −3 sowie mit Vielfachheit 2 die Nullstelle
+2 vorhanden. Die Vielfachheiten zusammen ergeben
4 = grad(x4 − 4x3 − 5x2 + 36x − 36)

Für Interessierte hier zu dem Satz der exakte


Beweis22 : Eine erweiterte Fassung der vollständigen Induktion wird verwendet.
Induktionsanfang n = 0“: Wegen grad(p(x)) = 0 ist p(x) eine Konstante 6= 0 und

besitzt keine (also 0) Nullstellen.
Induktionsschluß: Die Behauptung sei für alle Polynome g(x) mit
grad(g(x)) < n
richtig. Zu zeigen ist: die Behauptung gilt auch für p(x) mit
grad(p(x)) = n
Hat p(x) keine Nullstelle, so ist die Behauptung offensichtlich richtig.
Sei andernfalls x0 irgendeine Nullstelle von p(x); ihre Vielfachheit betrage k > 0. Man
kann dann die zugehörige Abspaltung vornehmen:
p(x) = (x − x0 )k · g(x)
Dabei hat g(x) den Grad
grad(g(x)) = n − k < n
Auf g(x) läßt sich die Induktionsvoraussetzung anwenden:
g(x) besitzt, mit Vielfachheit gezählt, höchstens n − k Nullstellen.
Sei nun x1 6= x0 eine weitere Nullstelle von p(x), wegen
0 = p(x1 ) = (x1 − x0 ) ·g(x1 ) ⇒ g(x1 ) = 0
| {z }
6= 0
da x1 6= x0

ist x1 notwendigerweise eine Nullstelle von g(x). Daraus folgt: als Nullstellen von p(x)
kommen neben x0 genau die Nullstellen von g(x) vor. Die Gesamtzahl (mit Vielfachheit)
der Nullstellen von g(x) ist daher beschränkt durch
k
|{z} + n − k}
| {z = n
Vielfachheit Maximalzahl der
von x0 Nullstellen von g(x)
22
Es ist nicht zwingend erforderlich, daß Sie diesen Beweis nachvollziehen.

54
qed

Dieser Satz hat bedeutsame Konsequenzen, u. a.:


Satz: Sind p(x) und q(x) zwei Polynome mit

grad(p(x)) ≤ n und grad(q(x)) ≤ n

und gibt es n + 1 verschiedene Zahlen x1 , . . . , xn+1 ∈ IR mit

p(xi ) = q(xi ) für i = 1, . . . , n + 1

so folgt p(x) ≡ q(x)23

Beweis: Man betrachte das Differenzpolynom

h(x) = p(x) − q(x)

Offensichtlich ist grad(h(x)) ≤ n. (Höhere Potenzen als in p(x) und q(x) können in h(x)
nicht vorkommen.) Wäre nun h(x) nicht das Nullpolynom, so hätte h(x) aufgrund des
vorherigen Satzes höchstens n verschiedene Nullstellen.
h(x) besitzt jedoch n + 1 verschiedene Nullstellen:

h(xi ) = p(xi ) − q(xi ) = 0 für i = 1, . . . , n + 1


⇒ h(x) kann nur das Nullpolynom sein.
⇒ h(x) = p(x) − q(x) ≡ 0 ⇒ p(x) ≡ q(x)

qed

Dieser Satz besagt etwa:

• Ein Polynom p(x) mit grad(p(x)) ≤ n ist durch n + 1 Werte

p(x1 ), p(x2 ), . . . , p(xn+1 )

eindeutig bestimmt.

• Ein (lineares) Polynom p(x) = ax + b ist durch zwei Werte eindeutig bestimmt.

• Ein quadratisches Polynom

p(x) = ax2 + bx + c

ist durch drei Werte p(x1 ), p(x2 ), p(x3 ) festgelegt.


Es läßt sich allerdings sehr wohl ein Polynom dritten Grades q(x) mit

q(x) ≡6 p(x)
und q(xi ) = p(xi ) für i = 1, 2, 3

finden, nämlich etwa

q(x) = p(x) + (x − x1 )(x − x2 )(x − x3 )


23
D. h.: p(x) und q(x) haben dieselben Koeffizienten.

55
1.3.4.6.4 Der Fundamentalsatz der Algebra Zwei schwieriger zu behandelnde
Fragen sind die folgenden:
1. Hat ein Polynom n-ten Gerades mit Vielfachheit genau n Nullstellen?
2. Wie kann man die Nullstellen eines Polynoms finden?

Zu Frage 1.: Die Antwort ist leider nein“. Beispiel: Das (berüchtigte) Polynom

p(x) = x2 + 1
hat keine Nullstellen, obwohl sein Grad 2 beträgt; es ist immer p(x) ≥ 1. Dieser Sachver-
halt verleitete zur Einführung der komplexen Zahlen (siehe später). Alles, was man
für (reelle) Polynome in diesem Zusammenhang weiß, ist der folgende
Satz: (Fundamentalsatz der Algebra, reelle Schreibweise) Sei p(x) ein Polynom n-ten
Grades. Dann gibt es
x1 , x2 , . . . , xl ∈ IR und Polynome g1 (x), . . . , gk (x)
mit grad(gi (x)) = 2 und gi (x) ohne Nullstelle für i = 1, . . . , k, so daß
p(x) = (x − x1 ) · · · (x − xl ) · g1 (x)g2 (x) · · · gk (x).
ist.
Der Beweis dieses Satzes ist umfangreich und schwierig, er soll hier nicht gebracht wer-
den. Auf die Aussage des Satzes werden wir jedoch später im Zusammenhang mit der
Partialbruchzerlegung und Integration gebrochen rationaler Funktionen zurückkommen.

Zu Frage 2.: Auch hier ist die Antwort nicht sehr befriedigend:
Für die Nullstellen der Polynome ersten und zweiten Grades gibt es einfache Formeln;
bei Polynomen dritten und vierten Grades existieren noch Formeln, die jedoch sehr
komplizert sind (siehe Formelsammlungen) und selten verwendet werden. Für allgemei-
ne Polynome fünften oder eines höheren Grades gibt es jedoch – wie man beweisen
kann – keine Formeln zur Berechnung ihrer Nullstellen. Man ist hier auf numerische
Lösungsverfahren24 angewiesen (siehe später).
Für den Fall eines normierten quadratischen Polynoms sei hier an die Formel zur Be-
rechnung seiner Nullstellen erinnert. Zu lösen ist die quadratische Gleichung
Quadratische Ergänzung zur
0 = x2 + ax + b Anwendung der 1. binomi-
schen Formel vornehmen!
a2 + b − a2
   
Jetzt die 1. binomische Formel
= x2 + 2 a
2 x + 4 4 anwenden!
 2  2
= x+ a
2 + b − a4
 2
⇒ x+ a
2 = 14 (a2 − 4b)
| {z }
=D
⇒ x1/2 = −a ± 1 √D für D ≥ 0
2 2
24
Numerische Lösungsverfahren verwendet man üblicherweise auch bei Gleichungen dritten und vier-
ten Grades.

56
Die Diskriminante D = a2 − 4b bestimmt die Nullstellenmenge von p(x) = x2 + ax + b:

D > 0 ⇒ 2 Nullstellen
D = 0 ⇒ 1 doppelte Nullstelle
D < 0 ⇒ keine Nullstellen

Kontrollfrage: Begründen Sie mit Hilfe der Sätze dieses Abschnitts, daß es für die
Lösungsmenge der normierten quadratischen Gleichung nur diese drei Möglichkeiten
geben kann.

Einfach lösen läßt sich noch die biquadratische Gleichung:

0 = x4 + ax2 + b

Man substituiert dazu y = x2 und versucht, 0 = y 2 + ay + b zu lösen. Jede positive



Lösung y0 davon liefert die beiden Lösungen ± y0 der biquadratischen Gleichung.

Beispiel: Auf diesem Wege findet man die beiden Nullstellen ± 2 von p(x) = x4 − 4,
genauer gilt:

p(x) = x4 − 4
= (x2 − 2)(x2 + 2)
√ √
= (x − 2)(x + 2)(x2 + 2)

1.3.4.7 Trigonometrische Funktionen und Arcusfunktionen


1.3.4.7.1 Kreisfunktionen Man betrachte den Einheitskreis um den Nullpunkt in
der Ebene IR2 :
S1 = (a, b) | a, b ∈ IR , a2 + b2 = 1


Jeder Punkt P ∈ S1 ist bestimmt durch

1 ............................
...........
a ............... P = (a, b)
b .......
....
7 ........

.....
....

 .... a2 + b 2 = 1
...
...

1 (Pythagoras)
...

b ... x
...
...

 ...

..... α ...

. ...
 ... ...
0  .. ..

0 a 1

Abbildung 1.4: Punkte auf dem Einheitskreis

57
.................. 1 .............
.... ....... ..................
..... ...
... ..
... ..... ...
...
.. . ... .. ... .. ...
.. ... .. ... .. ...
.. ... ... ... .. ...
.. ... .. ... .. ...
... . ... . ... .
.
... .. ... .
. . ..
...
−9 ... −6 −3 ... ... 3 ..... 6..
. 9
... .. ... .. ... ..
... . ... ...
... .. ... ... .. ...
.... .. .... .. .
.... .
................ ................ ................
−1

Abbildung 1.5: f(x) = sin x

• den Winkel α zwischen der waagerechten Koordinatenachse und der Stecke zwi-
schen den Punkten (0, 0) und P bzw.

• die Länge x des Kreisbogens auf S1 zwischen den Punkten (1, 0) und P

Der Zusammenhang zwischen der Bogenlänge x und dem Winkel α ist gegeben durch

x = α·
360
Dabei sind 2π und 360◦ die Maße für den vollen Kreis.
Die Koordinaten des Punktes P = (a, b) sind dabei durch die Bogenlänge x bzw. den
Winkel α eindeutig bestimmt, d. h. sie sind Funktionen von x bzw. α. Man kann daher
setzen:
P = (cos x, sin x) bzw. P = (cos α, sin α)
mit den beiden Funktionen sinus und cosinus

sin : IR 7→ IR cos : IR 7→ IR

Da ganze Kreisumläufe zum selben Punkt P führen“, folgt für jede ganze Zahl k ∈ ZZ :

cos(x + k · 2π) = cos x
sin(x + k · 2π) = sin x

D. h. sin und cos haben die Periode 2π (bzw. 360◦ im Winkelmaß).

Die beiden so definierten Funktionen sin und cos besitzen große Bedeutung in der Geo-
metrie und bei der Behandlung periodischer Vorgänge. Bei geometrischen Problemen
faßt man sie in der Regel als Funktionen des Winkels α und sonst üblicherweise als
Funktionen des Bogenmaßes x auf.

Aus der Definition der beiden Funktionen folgt unmittelbar:

1.
sin 0 = 0 sin π
2 =1 sin π = 0

cos 0 = 1 cos π
2 =0 cos π = −1

58
.................. ..1................
...
..................
.. .. ...
... ..... ...
... .. ...
...
.. . ... ... ... ... ...
.. ... . .... . ...
.. ... ... .... ... ...
... ... .. ... .
. ...
.. ... .
. ... .. ...
. ... .. . .. ...
−9 .. −6 ... −3 .. ... 3 .. 6 ... 9
.. . ... .. ... .. ...
.. ... . ... . ...
... .. ... .. ...
.
. .... .. ..... ... .
. ....
... . .
............. . . .......
...... −1 ..........

Abbildung 1.6: f(x) = cos x

2. Der sin ist eine ungerade, der cos ist eine gerade Funktion:

sin(−x) = − sin x cos(−x) = cos x

Diese Eigenschaften werden sofort anhand von Zeichnung 1.8 deutlich: Man be-
trachte dort die beiden auf dem Einheitskreis liegenden Punkte

P1 = (cos α, sin α)
P2 = (cos(−α), sin(−α))

Den zu −α gehörigen Punkt P2 erhält man auch, wenn man P1 an der x-Achse
spiegelt. Bei dieser Spiegelung bleibt der Wert der x-Koordinate unverändert, d. h.
cos(−α) = cos α; der Wert der y-Koordinate wechselt dagegen sein Vorzeichen,
d. h. sin(−α) = − sin α.

3. (Satz des Pythagoras)

cos2 x + sin2 x = 1 für alle x ∈ IR (1.68)

4. Für x ∈ [−π/2, π/2] ist cos x ≥ 0 (rechter Halbkreis), man kann daher die Glei-
chung cos2 x + sin2 x = 1 nach cos x auflösen und erhält eine Darstellung des cos
durch den sin:
p
cos x = 1 − sin2 x (1.69)

Für x ∈ [0, π] ist ebenso sin x ≥ 0 (oberer Halbkreis), löst man die Gleichung
cos2 x + sin2 x = 1 nach sin x auf, so folgt ähnlich wie oben

sin x = 1 − cos2 x (1.70)

5. Für alle x ∈ IR ist


| sin x| ≤ 1 und | cos x| ≤ 1
Begründung: cos x und sin x sind nach Definition die Koordinaten eines Punktes
auf dem Einheitskreis, diese sind dem Betrage nach nicht größer als 1. Siehe hierzu
auch Abbildung 1.4.

59
Mit dem Strahlensatz erhält man in einem rechtwinkligen Dreieck:
b Gegenkathete
sin x = =
c Hypothenuse
a Ankathete
cos x = =
c Hypothenuse 
*


 

 
  
 

 
c 
  
 
 
 b
 1

 

 sin α
 

 


α

cos α
 a -

Auf diesem Wege lassen sich auch die Funktionen tangens und cotangens definieren:
sin x = Gegenkathete
tan x = cos x Ankathete
cot x = cos x Ankathete
sin x = Gegenkathete

Drei wichtige Werte des sin und cos:

sin π
4= 2
√1 cos π
4= 2
√1

sin π 1 cos π 1 √3
6=2 =
6 2

sin π = 1 √3 cos π 1
3 2 3=2
Man erhält diese Werte auf geometrischem Wege: man betrachtet ein gleichseitiges bzw.
ein rechtwinkliges gleichschenkliges Dreieck.

Zwischen den Werten des sin und des cos besteht neben den Gleichungen 1.69 und 1.70
ein weiterer Zusammenhang. Man erkennt diesen, indem man die in Abbildung 1.8 die
beiden auf dem Einheitskreis liegenden Punkte

P1 = (cos α, sin α)
 
1 1
P3 = cos(α + π), sin(α + π)
2 2

60
1 ...................... ................................. ............
........ ................ ........ ..............
.... ....... ...
.......... ............ ......
. ..
........
.
..... ..... ..... ....
....... .....
.
.....
.. ........
.. ..... ..... ..
.... ..... .....
. .... .
.....
..
.....
.. .. .
...
......
1 .....2
..... 3 ....... 4 ...... 5 ..
...6.
...... ..... .
.... .....
....... ...... ...... ...
....... ..........
.
.... ...
. ...........
.
......... . .......... .
...................................... .....................................
−1

Abbildung 1.7: sin x und cos x

betrachtet. P3 ist durch Drehung von P1 um 90◦ bzw. π/2 entstanden. An der Abbildung
erkennt man, daß die x-Koordinate von P3 gleich dem Negativen der y-Koordinate von
P1 ist und daß die y-Koordinate von P3 gleich der x-Koordinate von P1 . Dieses liefert
die Beziehungen

sin(x + π
2 ) = cos x Drehung um
(1.71)
cos(x + π
2 ) = − sin x
π ' 90◦
2
1.71 besagt insbesondere, daß man den cos auch durch Verschiebung des sin um π2 nach
rechts erhalten kann. Verdeutlicht wird dieses in Abbildung 1.7, in der sin und cos
gemeinsam über der Grundperiode [0, 2π] eingezeichnet sind.

Wendet man die Gleichungen 1.71 zweimal hintereinander an, so erhält man
sin(x + π) = cos(x + π 2) = − sin x
π (1.72)
cos(x + π) = − sin(x + 2 ) = − cos x

Die Gleichungen 1.72 liefern gemeinsam mit der Periodizität und den Eigenschaften
gerade/ungerade die weiteren Gleichungen
sin(π − x) = sin(−π − x) = sin x
(1.73)
cos(π − x) = cos(−π − x) = − cos x
Die Gleichungen 1.71, 1.72 und 1.73 erweisen sich bei vielen Rechnungen, in denen sin
und cos vorkommen, als sehr nützlich.

Es ist sin π = 0 und cos 12 π = 0. Daraus leiten sich mit den Formeln 1.73 die weiteren
Nullstellen ab:
Nullstellen des sin : {kπ | k ∈ ZZ }
 
1
Nullstellen des cos : (k + )π | k ∈ ZZ
2

Satz: Additionstheorem des sin und cos: Für alle x, y ∈ IR gilt.


sin(x + y) = sin x · cos y + cos x · sin y

cos(x + y) = cos x · cos y − sin x · sin y

61
der Gesamtwinkel:
.1
...............................
.....
...............
............ α + 12 π
................ cos α
..........
....
.........
....
...
......... .......P1
......
. .. .....
.
. ... − sin α 7

.....
P3 ......

....
....
......}

Z  ...
.. Z ...
.. Z 
...
...
Z 
sin α ...
.. cos α Z
Z  ...
..  ...
..
Z ...
..
Z
Z α

...
.. Z ........... α  ...
... Z.. .... ...
Z. . ..
... S. . ..
... .
S −α ..
-1..... .
. 1
... ..
S
... .
..
S
... S − sin α . .
...
...
S
...
... S
..
....
....
S
. ....
..... .. .
....
S
..... S
..
...... S ......
....... w...
........ ......
S
......... ....
....
...........
.................-1 cos...α.................. P2
..........................
.......

Abbildung 1.8: sin–Werte und cos–Werte

62
Zum Beweis: Wir werden den Beweis geometrisch führen und zwar nur für den Spezialfall
des ersten Quadranten, d. h. nur für den Fall x, y > 0 und x + y < π/2. Wegen der
geometrischen Vorgehensweise ist es günstiger, statt des Bogenmaßes die zugehörigen
Winkel zu betrachten; dazu sei
360◦ 360◦
α = x β = y
2π 2π
Wir tragen jetzt den Winkel α und anschließend den Winkel β im Einheitskreis an, so
daß insgesamt der Winkel α + β entsteht; zusätzlich wird vom Punkte P4 = (cos(α +
β), sin(α + β)) aus die Senkrechte auf die Strecke zwischen P0 = (0, 0) und P2 =
(cos α, sin α) gezeichnet:

1 ........................................
...............
............
..........
.........
........
........P4 = (cos(α + β), sin(α + β))
.......
..L.. ...........
 L .......
......
L .....
.....

 αL ..... α + γ = 90◦
 L
.....
L ....
 ....
 L
....
 L ....
L
c ...
 ...
 L ...
1
L ...
 ...
...
 L
L ..
!.... P2 = (cos α, sin α)

L

....... b
!
...
.L...L!!!
!

P . .
. ...
 6 !
P ...
......γ!!! 3 ...
!

e ...

...!...
!
...
...
 ! !
 ! ! γ ...
...
! !

 β !!!
!
...
..... !! d ...
....
 !
! .. α .... ...
P0 a P5 b P1
1
Zu beachten ist hierbei, daß an dem Punkte P4 der Winkel α ein weiteres Mal auftaucht,
da genau α den Winkel γ zu 90◦ ergänzt.
Aus den in der Zeichnung vorhandenen rechtwinkligen Dreiecken ergeben sich nun die
folgenden sin– und cos–Werte:

Dreieck (P3 , P4 , P6 ) : sin α = cb


Dreieck (P0 , P5 , P4 ) : cos(α + β) = a

Dreieck (P0 , P1 , P3 ) : cos α = a + b


d+e
Dreieck (P0 , P3 , P4 ) : cos β = d + e sin β = c

63
Setzt man jetzt diese Werte geeignet ineinander ein und drückt man dabei insbesondere
alle Längen durch sin– und cos–Werte aus, so folgt:

cos α · cos β = a + b · (d + e) = a+b


d+e
= cos(α + β) + b = cos(α + β) + sin α · c
= cos(α + β) + sin α · sin β
⇒ cos(α + β) = cos α · cos β − sin α · sin β

Damit ist das Additionstheorem des cos hergeleitet; dasjenige des sin soll daraus mit
Hilfe der beiden Gleichungen (siehe Seite 61) sin x = cos(x − π/2) bzw. sin(x − π/2) =
− cos x abgeleitet werden:

sin(α + β) = cos(α + β − π/2)


= cos α · cos(β − π/2) − sin α · sin(β − π/2)
| {z } | {z }
=sin β =− cos β
= cos α · sin β + sin α · cos β

qed.

Folgerungen:
a) sin 2x = 2 sin x · cos x

b) cos 2x = cos2 x − sin2 x

x+y x−y
c) sin x + sin y = 2 · sin 2 · cos 2
x+y x−y
d) cos x + cos y = 2 · cos
2 · cos 2
Zum Beweis der Folgerungen: a) und b) Man setze in die Additionstheoreme des sin
bzw. cos 2x = x + x ein. c) und d) Man setze
x+y x−y
u = und v =
2 2
und wende bei c) in den beiden Gleichungen

sin x = sin(u + v)
sin y = sin(u − v)

das Additionstheorem des sin an, addiere die beiden Gleichungen und setze für u und
v wieder die Definitionen ein. Bei d) verfahre man ebenso, indem man dabei auf die
beiden folgenden Gleichungen das Additionstheorem des cos anwendet:

cos x = cos(u + v)
cos y = cos(u − v)

Mit Hilfe der Funktionen sin und cos lassen sich viele Sätze und Formeln zur Bearbeitung
von Dreiecken herleiten. Als Beispiel folgen hier der Cosinussatz und der Sinussatz:
Satz: Seien a, b und c die drei Seiten eines Dreiecks und α, β und γ die jeweils ge-
genüberliegenden Winkel. Dann gilt

64
1. der Cosinussatz:

a2 = b2 + c2 − 2cb cos α
b2 = c2 + a2 − 2ac cos β
c2 = a2 + b2 − 2ab cos γ

2. der Sinussatz:
a b c
= =
sin α sin β sin γ

% QQ
% Q
% γ Q
a
% Q
b %
Q
Q
% Q
Q
h
% Q
% Q
Q
% Q
Q
β QQ
%
% α Q
% Q
p
c

Abbildung 1.9: Zum sin– und cos–Satz

Beweis: Es soll nur jeweils eine Gleichung hergeleitet werden, die übrigen folgen entspre-
chend. Die Bezeichnungen aus Abbildung 1.9 werden verwendet.

1. zum Cosinussatz:

p = b · cos α
h2 = b2 − p 2
h2 = a2 − (c − p)2
⇒ a2 = b2 − p2 + (c − p)2
= b2 − p2 + c2 − 2cp + p2
= b2 + c2 − 2cp die Gleichung für p einsetzen
2 2
= b + c − 2cb · cos α

2. zum Sinussatz:
h = b · sin α
h = a · sin β
⇒ a · sin β = b · sin α
a b
⇒ =
sin α sin β

65
7



cot α 
1 
α
cos α 

7
 P



1 tan α


sin α



 α
0 

0 1

Abbildung 1.10: tan und cot am Einheitskreis

sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
lassen sich wie in Abbildung 1.10 deuten.
Sie besitzen die Periode π:
sin(x + π) − sin x = tan x
tan(x + π) = =− cos x
cos(x + π)
cos(x + π)
cot(x + π) = =− cos x
− sin x = cot x
sin(x + π)
sin x cos x
Die Funktionen tan x = cos x
und cot x = sin x
besitzen Polstellen:

 
1
Polstellen des tan : (k + )π | k ∈ ZZ
2

Polstellen des cot : {kπ | k ∈ ZZ }

Periode und Polstellen des tan sind in Abbildung 1.11 dargestellt.

1.3.4.7.2 Die Arcusfunktionen

1. Die Einschränkung der Funktion sin auf das abgeschlossene Intervall [− π2 , + π2 ]


liefert eine bijektive Funktion
h π πi
sin : − , + 7→ [−1, +1]
2 2
Die zugehörige Umkehrfunktion sin−1 ist auf dem Intervall [−1, +1] definiert, ihr
Name lautet arcus sinus:
h π πi
arcsin : [−1, +1] 7→ − , +
2 2

66
.. .. ..
... ... ...
.. 12 .. ..
... ... ...
.. .. ..
... ... ...
.. 8 .. ..
... ... ...
.. .. ..
... ... ...
.. 4 .. ..
... ... ...
....
..... ....
..... ....
.....
........ ....... .......
.
...
. .
............ ...
...............
. ...
...............
.
.. .... ..
....
.−4 −3 −2 −1 ... 1 2..... 3 4
... ... ...
.. .. ..
... ... −4 ...
.. .. ..
... ... ...
.. .. ..
... ... −8 ...
.. .. ..
... ... ...
.. .. ..
... ... −12 ...
. . .
.. .. ..

Abbildung 1.11: f(x) = tan x

2. Die Einschränkung der Funktion cos auf das abgeschlossene Intervall [0, π] liefert
eine bijektive Funktion
cos : [0, π] 7→ [−1, +1]
Die zugehörige Umkehrfunktion cos−1 ist auf dem Intervall [−1, +1] definiert, ihr
Name lautet arcus cosinus:

arccos : [−1, +1] 7→ [0, π]

3. Die Einschränkung der Funktion tan auf das offene Intervall (− π2 , + π2 ) liefert eine
bijektive Funktion  π π
tan : − , + 7→ IR
2 2
Die zugehörige Umkehrfunktion tan−1 ist wegen der Surjektivität des tan auf ganz
IR definiert, ihr Name lautet arcus tangens:
 π π
arctan : IR 7→ − , +
2 2
Bemerkung: Man beachte, daß ausschießlich nur für x ∈ (− π2 , + π2 ) die Beziehung
x = arctan(tan x) erfüllt ist; umgekehrt gilt jedoch für alle y ∈ IR die Gleichung
y = tan(arctan y).

4. Die Umkehrfunktion von cot : (0, π) 7→ IR ist der arcus cotangens:

arccot : IR 7→ (0, π)

Als Anwendung des arctan folgt der Beweis des wichtigen Satzes

67
1 .................................
.............
..........
.........
........
.......
....... P = (u, v)
 .........
.....
 .....
 ....
....
 .... δ
 ...
...

...
 ...
..
v = sin δ ....

...

 ...
 ...
 ...
 ...
...

...
... α ...
.
u = cos δ
1
Abbildung 1.12: Das gesuchte δ ist die Länge des Bogens bis P = (u, v).

Satz: Sind u, v ∈ IR mit


u2 + v 2 = 1
gegeben, so gibt es dazu ein δ ∈ IR mit

cos δ = u und sin δ = v

Dieses δ berechnet man durch



arctan v für u > 0


 u

v

 arctan u +π für u < 0


δ = (1.74)
 π für u = 0, v = 1
2





 −π

für u = 0, v = −1
2
Beweisidee: Der Nachweis der Existenz der Zahl δ erfolgt mit Hilfe der geometrischen
Bedeutung des sin und des cos, siehe dazu Abbildung 1.12:
Ist P = (u, v) der Punkt in der Ebene mit den Koordinaten u und v, so liegt P wegen
u2 + v 2 = 1 auf dem Einheitskreis. P ist daher eindeutig durch die Länge δ des Bogens
auf dem Einheitskreis von (1, 0) bis zu dem Punkt P festgelegt. Nach Definition von sin
and cos sind die Koordinaten von P dann gerade durch (cos δ, sin δ) gegeben. Somit ist
P = (u, v) = (cos δ, sin δ) und damit u = cos δ sowie v = sin δ.
Beim Nachweis der Berechnungsformel 1.74 für δ ist eine Fallunterscheidung erforderlich:

1. Sei u = 0, dann ist v = ±1, und man kann


π
δ = ±
2
setzen.

68
2. Sei u 6= 0. Man nimmt dann folgenden Ansatz vor:

u = cos δ und v = sin δ


(1.75)
⇒ tan δ = sin δ = u
v
cos δ
Jetzt bietet sich die Anwendung des arctan an; das ist aber nur möglich, wenn δ
in dem Bereich liegt, auf dem der tan umkehrbar ist; dieses ist genau für
 π π
δ ∈ − ,
2 2
der Fall. Eine weitere Fallunterscheidung ist jetzt erforderlich:

(a) Sei u > 0. Durch Addition oder Subtraktion eines geeigneten Vielfachen der
Periode 2π kann man erreichen, daß δ in der Grundperiode [−π, π] liegt.
Wegen
cos δ = u > 0
ist dann δ ∈ (−π/2, π/2) erfüllt25 , man kann in 1.75 den arctan anwenden
und erhält
v
δ = arctan
u
(b) Sei u < 0. Ist jetzt hier δ in der Grundperiode [0, 2π] und ist cos δ = u < 0,
so folgt wieder aus geometrischen Gründen (siehe Abbildung 1.4)
π < δ < 32 π

−π
2
⇒ −π
2 < δ−π < 2
π

Somit liegt δ − π im Umkehrbereich des tan. Berücksichtigt man nun noch,


daß der tan die Periode π besitzt, so kann man aus 1.75 schließen:

tan(δ − π) = tan δ
v
= u

arctan()

⇒ v
δ − π = arctan u

⇒ v + π
δ = arctan u

qed.
Zusatz: δ kann aus (−π, π] gewählt werden.

25
Dieses folgt wieder aus geometrischen Gründen, siehe Abbildung 1.4.

69
Kapitel 2

Lineare Gleichungssysteme und


Matrizenrechnung

2.1 Lineare Gleichungssysteme und das Gaußsche


Verfahren

Ein (armer) Student möchte seinen Lebensstandard etwas aufbessern, indem er neben
seinem Studium arbeitet und dabei etwas Geld hinzuverdient. Ihm werden zwei Stellen
angeboten:
• eine zu einem Lohn von 20 Euro/Std aber mit einer sehr anstrengenden Arbeit,

• eine zu einem Lohn von 10 Euro/Std mit einer sehr interessanten Tätigkeit.
Der Student beschließt, jede Woche insgesamt, d. h. für sein Studium und für den
Gelderwerb, 50 Stunden zu arbeiten, und faßt dabei folgenden Vorsatz:
• Er will 400 Euro pro Woche verdienen.

• Er will für das Studium zwei Stunden mehr arbeiten als für beide Stellen zusam-
men.
Wie viel Zeit würde der Student aufgrund dieser Regeln je Woche für sein Studium
aufwenden? Mit wie vielen Stunden würde der Studenten die erste und die zweite Stelle
annehmen?
Um diese Fragen zu beantworten, findet man ein geeignete mathematisches Modell. Man
definiert dazu als erstes die (zunächst) unbekannten Größen
x1 Zeit für Stelle 1
x2 Zeit für Stelle 2 (jeweils in Stunden)
x3 Zeit für das Studium

Unter Beachtung seiner aufgestellten Regeln erhält der Student drei Gleichungen1 :

x1 + x2 + x3 = 50
20x1 + 10x2 = 400
2 + x1 + x2 = x 3 ⇔ x1 + x2 − x3 = −2
1
. . ., bei denen die Einheiten weggelassen wurden.

70
Etwas schöner“ aufgeschrieben, lautet dieses:

x1 + x2 + x3 = 50
20x1 + 10x2 = 400
x1 + x2 − x3 = −2

Hierbei handelt es sich um ein sogenanntes lineares Gleichungssystemen; es ist da-


durch gekennzeichnet, daß alle unbekannten Größen (bzw. Variablen) nur in der ers-
ten Potenz erscheinen, keine Produkte aus verschiedenen Variablen und keine sonstigen
Funktionen vorkommen. Der Vorgang zum Lösen eines solchen linearen Gleichungssys-
tems besteht aus zwei Schritten:

• Reduzieren: Durch Zeilensubtraktion und Zeilenvertauschung (siehe gleich) wird


die Anzahl der Variablen von Zeile zu Zeile verringert.

• Auflösen: Beginnend bei der letzten Zeile wird die jeweils an der Stufe stehende
Variable (siehe gleich) berechnen.

Dieses Verfahren wird als Gaußsches Eliminationsverfahren bezeichnet. Im Idealfall


erhält das Gleichungssystems durch den Reduktionsschritt die Gestalt

x1 #
x2
..
.
...
0 xn

Wie man gleich sehen wird, wird sich eine solche Form für das Beispiel ( armer Student“)

mit n = 3 ergeben. Liegt eine solche Form vor, so ist das Gleichungssystem eindeutig
lösbar , denn

• In der letzten Zeile steht genau eine Variable; der eindeutige Wert dieser letzten
Variablen kann sofort ermittelt werden.

• Jede Variable steht an einer Stufe; die Variablen xn−1 , xn−2 , . . . , x1 können so
nacheinander eindeutig berechnet werden.

Im Allgemeinen ist es jedoch auch möglich,

• daß mehrdeutige Lösung vorkommen,

• daß das Gleichungssystem unlösbar ist.

Dazu folgen drei Beispiele.

1. Beispiel:2

9x2 + 13x3 = 7 1. Vertauschen,


x1 + 2x2 + 3x3 = 1 damit 1. Zeile
10x1 + 2x2 + 4x3 = 1 mit x1 beginnt

71
Die Vertauschung 1. und 2. Zeile liefert:

x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
10x1 + 2x2 + 4x3 = 1 (III) − 10 · (I)

x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
−18x2 − 26x3 = −9 (III) + 2 · (II)
x1 + 2x2 + 3x3 = 1
9x2 + 13x3 = 7
0x3 = 5
Der letzter Schritt führte zur gleichzeitigen Elimination zweier Variablen. Die sich erge-
bende letzte Gleichung kann nie erfüllt werden, denn es ist stets

0x3 6= 5

Damit folgt, daß dieses Gleichungssystem nicht erfüllbar ist; es ist unlösbar!

Allgemein gilt: Genau dann, wenn die Reduzierung mindestens eine Gleichung liefert, die
auf der linken Seite nur Nullen und auf der rechten Seite dagegen einen Wert ungleich
Null besitzt, ist das Gleichungssystem unlösbar.

2. Beispiel: ( armer Student“)



x1 + x2 + x3 = 50
20x1 + 10x2 = 400
x1 + x2 − x3 = −2
Die 2. und die 3. Gleichung werden x1 -frei“ gemacht:

(II) → (II) − 20 · (I)
(III) → (III) − (I)

x1 + x2 + x3 = 50
−10x2 − 20x3 = −600
−2x3 = −52
Jetzt wird noch eine Normierung vorgenommen, dabei wird durch die Koeffizienten der
an den Stufen stehenden Gleichungen geteilt:
1
(II) → (II) ·
−10
1
(III) → (III) ·
−2
Die Normierung bewirkt, daß alle an einer Stufe stehenden Variablen den Koeffizienten
1 besitzen3 :
x1 + x2 + x3 = 50
x2 + 2x3 = 60
x3 = 26 Von hinten auflösen

72
Nun können die Lösungswerte der einzelnen Variablen, beginnend bei der letzten, nach-
einander berechnet werden

x3 = 26, x2 = 60 − 2x3 = 60 − 52 = 8
x1 = 50 − x2 − x3 = 50 − 8 − 26 = 16

Um die Lösung geeignet als ein einheitliches Objekt darstellen zu können, soll hier schon
die sogenannte Vektorschreibweise (siehe später) verwendet werden. Die Lösungswerte
der Variablen x1 , x2 , . . . , xn werden nacheinander untereinander geschrieben und mit
einem Paar runder Klammern umgeben; diese Objekte werden als Vektoren (bzw.
genau als Spaltenvektoren“) bezeichnet. Für das letzte Gleichungssystem erhält man

als Lösung den Vektor:  
16
 8 
26
Insbesondere besitzt dieses Gleichungssystem eine eindeutige Lösung.

3. Beispiel
9x2 + 13x3 = 63
x1 + 2x2 + 3x3 = 14
10x1 + 2x2 + 4x3 = 14
Dieselben Reduzierungsschritte wie beim vorletzten Beispiel liefern
x1 + 2x2 + 3x3 = 14
9x2 + 13x3 = 63 (2.1)
0x3 = 0
Dieses Gleichungssystem ist lösbar, denn die letzte Gleichung ist immer erfüllt.
Aber es ist nicht eindeutig lösbar, denn
• x3 steht nicht an einer Stufe.4
• Für x3 kann ein beliebiger Wert λ ∈ IR eingesetzt werden.
Man setzt in diesem Fall x3 = λ, wobei λ eine beliege reelle Zahl sein kann, und löst
damit das reduzierte Gleichungssystem wie eben auf:
x3 = λ
x2 = 19 (63 − 13 · λ) = 7 − 13
9λ (2.2)
x1 = 14 − 2x2 − 3x3 = 14 − (14 − 26 1
9 λ) − 3λ = − 9 λ
Da ja für λ jede reelle Zahl eingesetzt werden kann, ergibt sich eine aus mehreren
möglichen Lösungen bestehende Menge; diese Lösungsmenge lautet:

− 19 λ
  
 

 

13

L =  7 − λ  λ ∈ IR
 

 9 

λ
 

73
Man erkennt, daß auch hier wieder die Spaltenschreibweise verwendet wird.
Zu klären ist noch, was genau unter einer Stufe“ bzw. einer Stufenvariable“ bei einem
” ”
reduzierten Gleichungssystem zu verstehen ist:

• Eine Stufenvariable ist die erste in einer Gleichung erscheinende Variable; insbe-
sondere ist ihr Koeffizient ungleich Null bzw. nach Normierung sogar gleich eins.

• Die Indizes der Stufenvariablen sind aufsteigend.

Das reduzierte Gleichungssystem (2.1) enthält zwei Stufen mit den beiden Stufenvaria-
blen x1 und x2 ; dagegen ist x3 keine Stufenvariable.

Allgemein gilt für lineare Gleichungssysteme der folgende wichtige Sachverhalt:


Erhält das reduzierte Gleichungssystem weniger Stufen als Variablen, bzw. weniger echte
Gleichungen (nicht Nullgleichungen) als Variablen5 , so

• bilden die nicht an einer Stufe stehenden Variablen Freiheitsgrade,

• werden nur die Werte der Stufenvariablen durch das Gleichungssystem festgelegt.

Beispiel:

3x1 + 15x2 + 9x3 − 3x4 = 6


−2x1 − 10x2 − 5x3 + x4 − 2x5 = −6
−2x1 − 10x2 − 9x3 + 6x4 + 4x5 = 3 (2.3)
x1 + 5x2 + 5x3 − 2x4 − 6x5 = −1
−x1 − 5x2 − 5x3 + 5x4 = 4

Man beginnt mit den Reduzierungsschritten


1
(I) → (I) (Normierung)
3
(II) + 2 · (I)
(III) + 2 · (I)
(IV ) − (I)
(V ) + (I)

und erhält nach einigen weiteren Reduzierungsschritten das Zwischenergebnis

x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
x4 − 2x5 = 1
2x4 − 4x5 = 2

Wie man erkennt, wurde hier x2 in der zweiten Gleichungen ebenfalls eliminiert; x2
erscheint an keiner Stufe und liefert einen Freiheitsgrad.

5
Eine unechte Gleichung“ bzw. Nullgleichung“ zeichnet sich dadurch aus, daß in ihr keine Varia-
” ”
blen mehr erscheint; dieses ist gleichbedeutende damit, daß alle Variablen in dieser Gleichungen den
Koeffizienten Null besitzen. Die rechte Seite einer Nullgleichung kann von Null verschieden sein.

74
Die weiteren Reduzierungsschritte: (IV)-(III)
(V)-2·(III)

liefern
x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0

An Hand dieser reduzierten Form erkennt man sofort:


• Das Gleichungssystem ist lösbar, da bei den Nullgleichungen rechts ebenfalls Null
steht.
• Es ist nicht eindeutig lösbar, denn die Variablen x2 und x5 stehen nicht an einer
Stufe, sie bilden Freiheitsgrade x2 = λ1 , x5 = λ2 .
Nachdem bis zu dieser Stelle ausschließlich Beispiele behandelt wurden, sollen jetzt allge-
meine lineare Gleichungssystem und die zugehörigen üblichen Bezeichnungen besprochen
werden. Insbesondere soll eine Lösungstheorie dargestellt werden.
Ein allgemeines lineares Gleichungssystem besitzt die Gestalt:
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
Dabei sind: n: die Anzahl der Unbestimmten
m: die Anzahl der Gleichungen
aij : die Koeffizienten für i = 1, . . . , m und j = 1, . . . , n
bi : die rechten Seiten i = 1, . . . , m
Sind die rechten Seiten gleich Null
b1 = b 2 = . . . = bm = 0
so heißt das Gleichungssystem homogen. Homogene Gleichungssysteme werden sich als
sehr wichtiger Spezialfall erweisen.
Zu einem beliebigen (inhomogenen) Gleichungssystem wird oft das sogenannte zu-
gehörige homogene Gleichungssystem benötigt. Man erhält dieses, wenn man bei
dem ursprünglichen Gleichungssystem die rechten Seiten gleich Null setzt, die Koeffizi-
enten auf der linken Seite aber unverändert läßt.

Weitere Bezeichnungen sind:


r = Anzahl der echten Gleichungen nach Reduzierung
= Anzahl der Variablen an den Stufen
r heißt Rang des Gleichungssystems.
s = n−r
= Anzahl der Freiheitsgrade
s heißt Corang des Gleichungssystems.

75
Rang und Corang sind zwei sehr wichtige Kennzahlen des linearen Gleichungssystems.
Der Rang bezeichnet die echte“ Anzahl der Gleichungen6 . Der Rang und der Corang

ergeben sich unmittelbar nach Reduzierung des Gleichungssystems.
Für den Rang und den Corang gelten die folgenden wichtigen Sachverhalte, die sich
ebenfalls unmittelbar aus der reduzierten Form des Gleichungssystems ergeben:
1. 0 ≤ r und 0 ≤ s ≤ n
2. ist r =n⇔s=0
⇔ alle n Variablen stehen an einer Stufe
⇔ alle n Variablen sind durch das Gleichungssystem bestimmt
⇔ keine Freiheitsgrade
⇔ nicht mehrdeutig lösbar

3. r ≤ m (= Anzahl der Gleichungen)


(Begründung: Jede Stufe verbraucht eine Gleichung.“)

4. m − r = Anzahl der Nullgleichungen nach Reduzierung
5. m = r ⇔ es gibt keine Nullgleichungen nach Reduzierung
⇔ das Gleichungssystem ist sicher lösbar
Wie man anhand von (2), (5) erkennen konnte, erhält man Hilfe des Ranges und des
Coranges Hinweise zur Gestalt der Lösungsmenge.
Bemerkung: Im Fall r = n sagt man, das Gleichungssystem besitzt einen vollen Rang.

Beispiel für ein Gleichungssystem mit n > m:

x1 − 3x2 + 4x3 = 8
2x1 − 6x2 + 9x3 = 20 (II)-2(I)

Die reduzierte Form lautet:


x1 − 3x2 + 4x3 = 8
x3 = 4

Man erkennt anhand der reduzierten Form sofort:

r = 2, n = 3 ⇒ s=n−r =1

Vorhanden ist somit ein Freiheitsgrad; dieser ist durch die nicht an einer Stufe erschei-
nenden Variablen x2 gegeben. Weiter folgt:

r=2=m ⇒ sicher lösbar

Zur Bestimmen der Lösungsmenge setzt man x2 = λ und löst das reduzierte Gleichungs-
system, beginnend bei der letzten Gleichung, auf:
x3 = 4
x2 = λ
x1 = 8 + 3λ − 4 · 4 = −8 + 3λ

6
Sollte jemand versuchen, ein Gleichungssystem zu erweitern, indem er einfach eine bereits vorhan-
dene Gleichung ein zweites Mal hinzufügt, so erhöht sich zwar m, die Anzahl der Gleichungen, der Rang
r bleibt jedoch unverändert.

76
Für die Lösungsmenge ergibt sich damit:
  
 −8 + 3λ 
L =  λ  λ ∈ IR (2.4)
4
 

Eine andere, in vielen Fällen nützlichere Schreibweise der Lösungsmenge lautet:


    
 −8 3 
L =  0  + λ ·  1  λ ∈ IR (2.5)

4 0
 

Die in (2.5) erscheinende Addition zweier Vektoren sowie Multiplikation eines Vektors
mit einer reellen Zahl werden komponentenweise durchgeführt. Damit erhält man aus
(2.5) genau die Darstellung (2.4).

Für die beiden in der Lösungsdarstellung (2.5) vorkommenden Vektoren gilt:


 
−8
 0  ist eine spezielle Lösung (für λ = 0)
4
  (2.6)
3
 1  ist eine Lösung des zugehörigen homogenen Systems
0 (siehe Seite 75)

Durch Einsetzen in das Gleichungssystem weist man dieses sofort nach.

Es gilt nämlich der folgende allgemeine Sachverhalt:


Sei S eine spezielle Lösung des Gleichungssystems7 . Die Lösungsmenge besitzt dann die
Gestalt
 
H ist eine beliebige Lösung des
L = S+H (2.7)
zugehörigen homogenen Systems

Begründung:

1. Zunächst wird gezeigt, daß S + H tatsächlich eine Lösung des Gleichungssystem


ist; dazu wird S + H einfach ins Gleichungssystem eingesetzt:
     
s1 h1 s1 + h1
S =  ...  , H =  ...  , S + H =  ..
     
. 
sn hn sn + hn
7
Eine spezielle Lösung ist eine beliebig gewählte, dann aber festgehaltene Lösung des Gleichungs-
systems; zur Ermittlung einer speziellen Lösung siehe später.

77
Setzt man dieses in jede einzelne Gleichung des Gleichungssystems ein, so folgt für
j = 1, . . . , m

aj1 (s1 + h1 ) + ... + ajn (sn + hn )


= (aj1 s1 + ... + ajn sn ) + (aj1 h1 + ... + ajn hn )
| {z } | {z }
= bj (da Lösung) =0 (da Lösung des homogenen Systems)

= bj
⇒ j-te Gleichung wird erfüllt
⇒ wegen j = 1, . . . , m wird damit das Gleichungssystem
insgesamt erfüllt.

2. Umgekehrt ist nun zu zeigen, daß eine beliebige Lösung T in der Form

T = S +H

mit der speziellen Lösung S und einer geeigneten Lösung H des homogenen Sys-
tems dargestellt werden kann. Da ja die spezielle Lösung S gegeben ist bzw. fest
gewählt wurde, ergibt sich H sofort aus dem Ansatz
 
t1 − s1
H = T −S = 
 .. 
. 
tn − sn

Zu zeigen bleibt, daß H tatsächlich Lösung des homogenen Systems ist. Einsetzen
von H in das homogene System liefert für j = 1, . . . , m in der Tat

aj1 (t1 − s1 ) + ... + ajn (tn − sn )

= (aj1 t1 + ... + ajn tn ) − (aj1 s1 + ... + ajn sn )


= bj − bj =0

Zusammenfassend kann bis jetzt festgestellt werden:


1. Das Gleichungssystem ist genau dann unlösbar , wenn es gibt keine spezielle Lösung
besitzt.

2. Ist das Gleichungssystem selber homogen (also b1 = . . . = bm = 0), so kann man


als spezielle Lösung die Nulllösung
 
0
 .. 
0 =  .  (2.8)
0

wählen.

3. Das homogene System ist natürlich immer lösbar; es besitzt zumindest die Nulllösung
(2.8).

4. Das Gleichungssystem ist genau dann eindeutig lösbar, wenn

78
• es eine spezielle Lösung gibt und
• das zugehörige homogene System nur die Nulllösung (2.8) besitzt! Man be-
achte dazu, daß durch S = S + 0 bereits eine Lösung gegeben ist; jedes H 6= 0
würde eine weitere Lösung liefern.

Durch
L = {S + H | H ist homogene Lösung.}
wurde bereits eine erste, grobe Darstellung der Lösungsmenge eines linearen Gleichungs-
systems geliefert. Die Struktur der Lösungsmenge läßt sich aber noch genauer beschrei-
ben:
 
 

L = S + λ1 G1 + ... + λs Gs λ1 , . . . , λs ∈ IR
(2.9)
 | {z } 
homogene Lösung

Dabei ist wieder



s1
S =  ...  (2.10)
 
sn

eine spezielle Lösung des Gleichungssystems. Für i = 1, . . . , s (s ist der Corang) sind
 
w1,i
Gi =  ...  (2.11)
 
wn,i

die sogenannten Grundlösungen des zugehörigen homogenen Systems. Die Darstel-


lung (2.10) existiert, da jede Lösung H des homogenen Systems eine sogar eindeutige
Darstellung der Form

H = λ1 G1 + . . . + λs Gs mit λ1 , . . . , λs ∈ IR (2.12)

besitzt8 .

Nachdem man ein lineares Gleichungssystem in die reduzierte Gestalt gebracht hat, läßt
sich die Lösungsmenge in der Form (2.9) sehr einfach berechnen. Man wählt dazu die
folgende Vorgehensweise:
Berechnung von S : Man löst das Gleichungssystem auf und setzt dabei alle Frei-
heitsgrade gleich Null; d. h. ist xi keine Stufenvariable, so wird xi = 0 gesetzt.9

Berechnung der Gi : Das zugehörige homogene System10 wird für i = 1, . . . , s jeweils


einmal gelöst; dabei wird stets der i-te Freiheitsgrad (d. h. die i-te nicht an einer
Stufe stehende Variable) gleich 1 gesetzt, und die übrigen Freiheitsgrade werden
gleich 0 gesetzt.

8
Der Beweis wird hier nicht gebracht.
9
Man verfährt dazu entsprechend wie in (2.2); für die in (2.2) erscheinende Nichtstufenvariable x3
würde man hier x3 = 0 setzen.
10
d. h. das System mit denselben Koeffizienten, aber den rechten Seiten b1 = ... = bm = 0

79
Als Beispiel wird das Gleichungssystem (2.1) mit der reduzierten Form

x1 + 5x2 + 3x3 − x4 = 2
x3 − x4 − 2x5 = −2
x4 − 2x5 = 1
0x5 = 0
0x5 = 0

verwendet. Als erstes wird die spezielle Lösung S berechnet, indem für die beiden Frei-
heitsgrade x2 = x5 = 0 gesetzt wird. Das Auflösen liefert damit:

x5 = 0
x4 = 1 − (−2)x5 = 1
x3 = −2 − (−1)x4 − (−2)x5 = −2 + 1 = −1
x2 = 0
x1 = 2 − 5x2 − 3x3 − (−1)x4 − 0x5 = 2 − 0 + 3 + 1 − 0 = 6

Das Ergebnis ist die spezielle Lösung


 
6

 0 

S = 
 −1 
 (2.13)
 1 
0

Zur Berechnung der ersten Grundlösung setzt man x2 = 1, x5 = 0; damit liefert die
Auflösung
 
x5 = 0 −5
x4 = 0  1



x3 = 0 ⇒ G1 =   0


x2 = 1  0 
x1 = -5 0
Zur Berechnung der zweiten Grundlösung setzt man dann x2 = 0, x5 = 1; hier liefert
die Auflösung
 
x5 = 1 −10
x4 = 2  0
 

x3 = 4 ⇒ G2 =   4


x2 = 0  2 
x1 = -10 1
Die Lösungsmenge des Gleichungssystems (2.1) kann nun sehr gut dargestellt werden:
      

 6 −5 −10


0 1 0

       

      
L = 
 −1 
 + λ1 · 
 0 
 + λ 2 · 
 4 

λi ∈ IR


  1   0   2  


 
0 0 1
 

80
Wie bereits erwähnt wurde, kann an Hand des zugehörigen homogenen Gleichungssys-
tems die Eindeutigkeit der Lösung festgestellt werden; es gilt nämlich:

Ein Gleichungssystem ist genau dann höchstens eindeutig lösbar, wenn das
zugehörige homogene System nur die Lösung Null besitzt.

Die Begründung ergibt sich sofort aus der Darstellung

L = {S + 0} = {S}

Diese Lösungsmenge enthält genau ein Element.11

Beispiel:
2x1 + 6x2 = 4 x1 + 3x2 = 2
reduziert:
x1 + 4x2 = 1 x2 = −1
Das zugehörige homogene System lautet:
2x1 + 6x2 = 0 x1 + 3x2 = 0
reduziert:
x1 4x2 = 0 x2 = 0
Die Auflösung des homogenen Gleichungssystems liefert als dessen einzige Lösung x2 =
0, x1 = −3x2 = 0. Damit folgt, daß das ursprüngliches System eindeutig lösbar ist. Die
betreffende eindeutige Lösung erhält man durch
 
5
x2 = −1, x1 = 2 − 3x2 = 5 ⇒ A=
−1

Sehr wichtig sind die Quadratischen Systeme; bei diesen ist n = m, also

Anzahl der Gleichungen = Anzahl der Unbestimmten

Für die quadratischen Systeme gelten einige Besonderheiten:


eindeutig lösbar ⇔ n = r (voller Rang)
⇔ m = r (da n = r)
⇔ keine Nullgleichungen
⇔ ist sicher lösbar
Ist somit von einem quadratischen System bekannt, daß es bei jeder möglichen rechten
Seite sicher lösbar ist, so ist es auch mit Sicherheit eindeutig lösbar.
Umgekehrt gilt entsprechend: Wenn das quadratische Gleichungssystem eindeutig lösbar
ist, so ist es auch sicher für jede rechte Seite lösbar.
Weiterhin ergibt sich, daß das zugehörige homogene System genau dann nur die Lösung
Null besitzt, wenn das Gleichungssystem eindeutig lösbar ist, was wiederum genau dann
der Fall ist, wenn es für jede beliebige rechte Seite sicher lösbar ist.12

11
Kontrollfrage: Warum ist ein homogenes System immer lösbar?
12
Diese Aussage wird bei der Polynominterpolation von großem Nutzen sein.

81
Beispiel:13
Der hier gezeigte Ausschnitt des Stra- .. ..
ßennetzes einer Stadt enthält vier Ein- .. ..
.. ..
bahnstraßen mit vier Kreuzungen je- 500 .. .. 300
.. ..
weils zweier dieser Einbahnstraßen. .. ..
200 D .. x3 .. . C 200
Eine Verkehrszählung ergab, wievie- ..................................................................................................................................................................................................
le Kraftfahrzeuge durchschnittlich pro .. ..
.. ..
Stunde auf die Kreuzungen zufahren .. ..
.. ..
bzw. diese wieder verlassen. Läßt sich .. .
.. ........
.
hieraus schließen, wieviele Kraftfahr- x4 .... ... x2
.... ..
zeuge durchschnittlich pro Stunde zwi- .. ..
schen diesen Kreuzungen verkehren? .. ..
.. ..
Diese Anzahlen seien x1 , x2 , x3 , x4 . Zwi- .. ..
.. .
schen diesen Kreuzungen und Zähl- ...................................................................................................................................................................................................
punkten gibt es keine weiteren Straßen 500 A ... x1 .. B 500
..
.. ..
Einmündungen oder Abgänge; außer- .. .. 700
900 .. ..
dem soll angenommen werden, daß es zu .. ..
.. .
keinen Staus oder dergleichen kommt.
Als Ansatz zur Bestimmung der Anzahlen x1 , x2 , x3 , x4 verwendet man:
Die Anzahl der (stündlich) auf eine Kreuzung zufahrenden Fahrzeuge muß
gleich der Anzahl der von der Kreuzung abfahrenden Fahrzeuge sein.
Das ergibt hier mit den Werten aus der Zeichnung:
Kreuzung zufahrend abfahrend
A 500 + 900 = x1 + x2
B x1 + x 2 = 700 + 500
C 200 + 300 = x2 + x3
D x3 + x 4 = 200 + 500
Man erkennt sofort, daß diese Gleichungen ein lineares Gleichungssystem mit vier Glei-
chungen und vier Unbekannten bilden. In die übliche Form umgeschrieben lautet dieses
Gleichungssystem:
x1 + x4 = 1400
x1 + x2 = 1200
(2.14)
x2 + x3 = 500
x3 + x4 = 700
Gemäß des Gaußschen Verfahrens zieht man nacheinander die erste Gleichung von der
zweiten, die zweite von der dritten, die dritte von der vierten ab und schließlich erhält
die reduzierte Form:
x1 + x4 = 1400
x2 − x4 = −200
(2.15)
x3 + x4 = 700
0 · x4 = 0
Man erkennt, der Rang ist 3, und der Corang beträgt 1. Außerdem ist das Gleichungs-
system wegen der vollständigen Nullgleichung lösbar. Die Lösungsmenge ist somit nicht

82
leer und besitzt einen Freiheitsgrad. Zur Bestimmung der Lösungsmenge bestimmt man
zunächst wie üblich eine spezielle Lösung ~x0 , indem man x4 = 0 setzt:
 
x4 = 0 1400
x3 = 700 − x4  −200 
⇒ ~x0 =   (2.16)
x2 = −200 + x4  700 
x1 = 1400 − x4 0

Wie man sieht, können die Komponenten dieser speziellen Lösungsmenge ~x0 nicht die
gesuchten Anzahlen darstellen. Warum nicht?
Um die vollständige Lösungsmenge von (2.14) zu erhalten, benötigt man noch eine
Grundlösung ~x1 des zugehörigen homogenen Systems. Wie üblich setzt man dazu x4 = 1
und verwendet die reduzierte Form des zugehörigen homogenen Gleichungssystems:
 
x4 = 1 −1
x3 = − x4  1 
⇒ ~x1 = 
 −1 
 (2.17)
x2 = + x4
x1 = − x4 1

Damit lautet die Lösungsmenge von (2.14)


  

 1400 − λ


 −200 + λ
  
{~x0 + λ ~x1 | λ ∈ IR} =  700 − λ
 λ ∈ IR
 (2.18)

 

λ
 

Da die Komponenten eines Lösungsvektors Anzahlen darstellen sollen, dürfen sie nicht
negativ sein. Für den Parameter λ sind daher genau die folgenden Werte möglich:

200 ≤ λ ≤ 700 (2.19)

Man erhält damit zwar keine eindeutige Lösung für die gesuchten Verkehrsflüsse. Man
hat damit aber berechnet, daß die gesuchten Anzahlen von Fahrzeugen pro Stunde in
folgenden Bereichen liegen:

1200 ≤ x1 ≤ 700
0 ≥ x2 ≥ 500
(2.20)
500 ≤ x3 ≤ 0
200 ≥ x4 ≥ 700

Die mittlere Verkehrsdichte an den vier Straßenabschnitten beträgt (in Kfz/Std)


 
950
 250 
~xm =   250 
 (2.21)
450

83
2.2 Matrizen
2.2.1 Der Begriff der Matrix
Wir kommen auf die linearen Gleichungssysteme (siehe Seite 70 ff) zurück und verfolgen
das Ziel, für diese eine geeignetere und auch kürzere Schreibweise zu finden.
Der wesentliche Bestandteil eines Gleichungssystems sind seine Koeffizienten, sie be-
stimmen Rang und Corang des Gleichungssystems. Man beginnt daher beim Aufstellen
der neuen Schreibweise bei den Koeffizienten:
Die Koeffizienten eines linearen Gleichungssystems mit m Gleichungen und n Unbekann-
ten
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
schreibt man in der Form einer sogenannten m × n–Matrix
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A =  ..
 
.. .. 
 . . . 
am1 am2 . . . amn
Eine m × n–Matrix ist ein rechteckiges Zahlenschema mit m Zeilen und n Spalten.
Man bezeichnet Matrizen meist mit großen Druckbuchstaben. Kurzschreibweisen für
allgemeine Matrizen sind
A = ((aij ), i = 1 . . . m, j = 1 . . . n)
oder, falls Zeilen- und Spaltenzahl bereits festliegen, auch nur einfach A = ((aij )). Die
aij nennt man die Koeffizienten oder Einträge der Matrix.

Als Beispiel betrachten wir das lineare Gleichungssystem

2x1 + 10x2 + 6x3 = 18


−x1 + 2x2 − 3x3 = 0
(2.22)
3x1 + x2 + 2x3 = 9
4x1 + 13x2 + 5x3 = 27
Dieses ist ein Gleichungssystem mit 4 Gleichungen und 3 Unbekannten, es besitzt als
Koeffizientenmatrix die 4 × 3–Matrix
 
2 10 6
 −1 2 −3 
A =  3 1
 (2.23)
2 
4 13 5

Matrizen sind eine Verallgemeinerung der Spaltenvektoren, der Schreibweise, die man
für die Lösung von Gleichungssystemen verwendet (siehe Seite 73): Einen Spaltenvektor
wie  
x1
~x =  ... 
 
xn

84
kann man als n × 1–Matrix auffassen, also als Matrix mit n Zeilen und nur einer Spalte.
Umgekehrt ist es oft günstig, eine m × n–Matrix als Zusammensetzung von n Spalten-
vektoren mit jeweils m Komponenten zu betrachten:

A = ((aij ), i = 1 . . . m, j = 1 . . . n)

= (~a1 , . . . , ~an )

 
a1j
mit ~aj =  ...  für j = 1 . . . n
 
amj

Der erste Index zählt hier die Komponente des Spaltenvektors, der zweite gibt an, daß
es sich um den j-ten Spaltenvektor handelt.

Die Spaltenvektoren der Matrix (2.23) sind


     
2 10 6
 −1   2   −3 
~a1 = 
 3 
 ~a2 =  1

 ~a3 = 
 2 

4 13 5

Die Menge der n–dimensionalen Spaltenvektoren wird mit IRn bezeichnet. Für Matrizen
trifft man entsprechend die
Definition: Für m, n ∈ IN ist

Mm,n (IR) = {((aij ), i = 1 . . . m, j = 1 . . . n) | aij ∈ IR }

die Menge aller (reellen) m × n–Matrizen.

Die Matrix (2.23) ist demnach ein Element der Menge M4,3 (IR).

Als wichtige Spezialfälle von Mm,n (IR) hat man:


• Mn,n (IR) ist die Menge der quadratischen Matrizen; Zeilen- und Spaltenzahl sind
bei diesen gleich.

• Mm,1 (IR ) ist – wie bereits erwähnt – die Menge der einspaltigen Matrizen, sie
entspricht der Menge der m-dimensionalen Spaltenvektoren:

Mm,1 (IR) =
˜ IRm

• M1,n (IR) ist die Menge der einzeiligen Matrizen, sie entspricht der Menge der n-
dimensionalen Zeilenvektoren:

M1,n (IR) =
˜ {(a1 , . . . , an ) | ai ∈ IR }

• M1,1 (IR) ist die Menge der Matrizen mit nur einem einzigen Eintrag, sie entspricht
der Menge der reellen Zahlen:

M1,1 (IR) =
˜ IR

85
Um mit Hilfe der Matrizen zu einer einfachen Schreibweise für lineare Gleichungssysteme
zu gelangen, definiert man eine Multiplikation“ zwischen einer m×n–Matrix und einem

n-dimensionalen Spaltenvektor:
Definition: Seien
 
x1
A = ((ai,j )) ∈ Mm,n (IR) und ~x =  ...  ∈ IRn
 
xn

eine m × n–Matrix und ein n-dimensionaler Spaltenvektor, dann definiert man deren
Produkt durch
   
a11 . . . a1n x1
A ◦ ~x =  ... ..  ◦  .. 

.   . 
am1 . . . amn xn
  (2.24)
a11 x1 + a12 x2 + . . . + a1n xn
 a21 x1 + a22 x2 + . . . + a2n xn 
= 
 
.. .. .. 
 . . . 
am1 x1 + am2 x2 + . . . + amn xn

Das Symbol für diese Verknüpfung ist der Kringel ( ◦“), der auch zur Verknüpfung von

Funktionen (f ◦ g) verwendet wird. Verknüpft wird hier immer jeweils eine Zeile der
Matrix mit dem Spaltenvektor:
 
x1
(ai1 , . . . , ain ) ,  ...  −→ ai1 x1 + ai2 x2 + . . . + ain xn ∈ IR
 
xn

Das Ergebnis hiervon ist eine reelle Zahl. Hat die Matrix m Zeilen, so liefert die gesam-
te Operation als Ergebnis m reelle Zahlen; diese bilden genau einen m–dimensionalen
Spaltenvektor.
Der Wertebereich der Verknüpfung ◦“ zwischen einer m × n–Matrix und einem n–

dimensionalen Spaltenvektor ist somit der IRm :

◦ : Mm,n (IR) × IRn −→ IRm

Jetzt braucht man nur die rechte Seite eines Gleichungssystems als m–dimensionalen
Spaltenvektor darzustellen. Dann kann man statt
a11 x1 + a12 x2 + . . . + a1n xn = b1
a21 x1 + a22 x2 + . . . + a2n xn = b2
.. . . . .
. + .. + .. + .. = ..
am1 x1 + am2 x2 + . . . + amn xn = bm
das Gleichungssystem in der einfacheren Form
     
a11 . . . a1n x1 b1
 .. ..  ◦  ..  =  .. 
 . .   .   . 
am1 . . . amn xn bm

86
aufschreiben, bzw. man kann die Kurzschreibweise

A ◦ ~x = ~b

verwenden. Der letzte Ausdruck ist die direkte Verallgemeinerung der Darstellung ax = b
einer einfachen Gleichung mit einer Unbekannten.

Die Matrix–Vektor–Multiplikation
   
a11 . . . a1n x1
A ◦ ~x =  ... ..  ◦  .. 

.   . 
am1 . . . amn xn
 
a11 x1 + . . . + a1n xn
= 
 .. .. 
. . 
am1 x1 + . . . + amn xn

ist dabei so gefaßt worden, daß sie genau auf die linearen Gleichungssysteme paßt!

Beispiel: Das Gleichungssystem (2.22) auf Seite 84 bekommt in Matrizenschreibweise


die Gestalt    
2 10 6   18
 −1 2 −3  x1
 ◦  x2  =  0 
 

 3 1 2   9 
x3
4 13 5 27
Beim Reduzieren des Gleichungssystems mit dem Gaußschen Verfahren schreibt man
natürlich nur die Koeffizientenmatrix und den Spaltenvektor der rechten Seite auf:

1. Normierung der ersten Gleichung liefert


   
1 5 3
9
 −1 2 −3   0 
   
 3 1 2   9 

4 13 5 27

2. Geeignete Vielfache der ersten Zeile werden von den folgenden abgezogen oder zu
diesen hinzuaddiert:
   
1 5 3
9
 0 7 0   9 
   
 0 −14 7   −18 

0 −7 −7 −9

3. Die zweite Zeile wird normiert, anschließend werden geeignete Vielfache der zwei-
ten Zeile von den folgenden abgezogen oder zu diesen hinzuaddiert:

9
   
1 5 3
 9 

 0 1 0 
   7 
 0 0 7   0 

0 0 −7 0

87
4. Normiert man nun noch die dritte Gleichung und addiert man ihr Siebenfaches
zur letzten Gleichung, so erhält man ein reduziertes Gleichungssystem, das in
Matrizenschreibweise so aussieht:
9
   
1 5 3  
 0 1 0  x1  9 
  ◦  x2  =  7 
 0 0 1   0 
x3
0 0 0 0

Nachdem wir hier die Matrizen über lineare Gleichungssysteme eingeführt haben, werden
wir sie jedoch – so wie es üblich ist - weitestgehend losgelöst von den Gleichungssystemen
behandelt. Wir werden sehen, daß man Matrizen formal gut handhaben kann und werden
insbesondere die Matrizenrechnung kennenlernen.
Daß sich die Anwendungsmöglichkeit der Matrizen keinesfalls nur auf die linearen Glei-
chungssysteme beschränkt, wird durch das folgende Beispiel unterstrichen:

Beispiel: Matrizen finden Verwendung bei der Beschreibung von Graphen. Als Beispiel
betrachten wir diesen gerichteten Graphen:
v7 w k
1
 5

  6
w v v9

 8
v1 1 PPP

P

 k1 v4 PPPP
w w k
q
k4  
PP
PP 2 v v6 1


2
P
6
PP PP  
Pq ?
w v5
PP
PP P
v3 P! !
k3

Ein gerichteter Graph besteht aus einer Menge K von sogenannten Knoten, hier:
K = {k1 , k2 , k3 , k4 , k5 }
und eine Menge V von gerichteten Verbindungen zwischen einem Teil der Knoten, hier:
{v1 = (k4 , k1 ), v2 = (k4 , k3 ), v3 = (k3 , k4 ), v4 = (k1 , k2 ), v5 = (k3 , k2 ),
V =
v6 = (k1 , k3 ), v7 = (k5 , k1 ), v8 = (k1 , k5 ), v9 = (k2 , k5 )}
Einen gerichteten Graphen stellt etwa das Straßennetz einer Stadt dar: Straßenkreuzun-
gen und Einmündungen sind die Knoten, Straßenfahrtrichtungen bzw. Einbahnstraßen
sind die gerichteten Verbindungen.
Zur Darstellung solcher Graphen dient die sogenannte Adjazenzmatrix :
Hat ein gerichteter Graph n ∈ IN Knoten, so ist seine Adjazenzmatrix
 
a11 . . . a1n
A = ((aij ), i, j = 1 . . . n) =  ... .. 

. 
an1 . . . ann
eine n × n–Matrix, sie ist definiert durch

 1 falls eine Verbindung vom i-ten Knoten
aij = zum j-ten Knoten vorhanden ist
0 sonst

88
Die Adjazenzmatrix des Graphen hier lautet
 
0 1 1 0 1
 0 0 0 0 1 
 
A =   0 1 0 1 0 (2.25)


 1 0 1 0 0 
1 0 0 0 0

Die Adjazenzmatrix eines Graphen kann leicht im Rechner dargestellt und bearbeitet
werden; ausgehend von ihr kann man etwa die Zusammenhangskomponenten des Gra-
phen bestimmen.

Eine wichtige Kennzahl erbt“ die Matrix vom zugehörigen linearen Gleichungssystem:

Definition: Der Rang einer Matrix M , geschrieben rgM , ist der Rang eines linearen
Gleichungssystems mit Koeffizientenmatrix M .

Ein Gleichungssystem mit Koeffizientenmatrix M hat die Gestalt M ◦ ~x = ~b mit einem


~b ∈ IRm . Will man den Rang berechnen, so erfolgt das natürlich mit dem Gaußschen
Verfahren. Ist man nur am Rang der Matrix interessiert und nicht an möglichen Lösun-
gen des Gleichungssystems, so reicht es, die Umformungsschritte des Verfahrens nur auf
die Matrix anzuwenden und dabei die rechte Seite ~b nicht zu beachten.

Beispiel: Für die Matrix (2.23) ergab die Rechnung ab Seite 87


 
2 10 6
 −1 2 −3 
rg 
 3 1
 = 3
2 
4 13 5

Eine wichtige Operation auf Matrizen ist die Transposition:


Definition: Sei A ∈ Mm,n (IR) ein m × n–Matrix. Dann ist

At oder in Worten: “A transponiert“

diejenige Matrix n × m–Matrix, die man erhält, wenn man A an der Hauptdiagonalen14
spiegelt. Die Spalten von At sind dann genau die Zeilen von A:
 
a11 . . . a1n  
 a21 . . . a2n  a 11 a 21 . . . a m1
t  . .. .. 
A =  .. ..  ⇒ A =  ..
 
 . . . 
. 
a1n a2n . . . amn
am1 . . . amn

Beispiel:
 t
2 10 6  
 −1 2 −3  2 −1 3 4
  =  10 2 1 13 
 3 1 2 
6 −3 2 5
4 13 5
14
Die Hauptdiagonale ist die Diagonale mit den Elementen a11 , a22 , . . . .

89
Beispiel: Die Transponierte der Adjazenzmatrix (2.25) des gerichteten Graphen auf Seite
88 ist  
0 0 0 1 1
 1 0 1 0 0 
t
 
A =   1 0 0 1 0 

 0 0 1 0 0 
1 1 0 0 0
Dieses ist die Adjazenzmatrix desjenigen gerichteten Graphen, den man enthält, indem
man beim ursprünglichen Graphen alle Verbindungsrichtungen umkehrt.

Bemerkung: Bei nicht quadratischen Matrizen werden beim Transponieren Zeilen- und
Spaltenzahl vertauscht, d. h.

A ∈ Mm,n (IR) ⇒ At ∈ Mn,m (IR)

Für n 6= m liegt insbesondere die transponierte Matrix in einer anderen Matrizenmenge,


nämlich Mn,m (IR), als die ursprüngliche. Nicht so bei quadratischen Matrizen, dort gilt:

A ∈ Mn,n (IR) ⇒ At ∈ Mn,n (IR)

Da doppeltes Spiegeln zum Ursprünglichen zurückführt, gilt der


Satz: A ∈ Mm,n (IR) ⇒ (At )t = A.

Die zweimal transponierte Matrix ist also gleich der ursprünglichen!

Definition: Eine quadratische Matrix A ∈ Mn,n (IR) heißt symmetrisch, falls sie gleich
ihrer Transponierten ist:
A = At

Eine n × n–MatrixA = ((aij )) ist genau dann symmetrisch, wenn ihre Einträge die
Gleichungen
aij = aji für alle i, j = 1 . . . n
erfüllen. Beispiel:
 
1 3
A = ist symmetrisch,
3 2
 
1 3
B = dagegen nicht.
4 2

Beispiel: Was bedeutet es, wenn die Adjazenzmatrix


 
a11 . . . a1n
A =  ... .. 

. 
an1 . . . ann

90
eines gerichteten Graphen (siehe Seite 88) symmetrisch ist, d. h. wenn

aij = 1 ⇔ aji = 1
bzw. aij = 0 ⇔ aji = 0 gilt?

Das heißt: es gibt genau dann eine gerichtete Verbindung vom i-ten zum j-ten Knoten,
wenn es auch eine solche Verbindung in umgekehrter Richtung gibt. Ein Graph dieser
Art entspricht einem sogenannten ungerichteten Graphen.

Zwei interessante Spezialfälle beim Transponieren sind Zeilen- und Spaltenvektoren: Ein
Spaltenvektor geht in einen Zeilenvektor über und umgekehrt.
 
a1
~a =  ...  ⇔ ~a t = (a1 , . . . , an )
 
an

Dieses hat u. a. Bedeutung für die Schreibweise:


Für Zeilenvektoren gewinnt man eine Schreibweise dadurch, daß man sie als transpo-
nierte Spaltenvektoren schreibt. Dieses führt auf Bezeichnungen wie ~a t , ~b t oder ~c t für
Zeilenvektoren. Ist nämlich

~c t = (c1 , . . . , cn ) (2.26)

ein Zeilenvektor, so ist ~c der zugehörige Spaltenvektor; dieses erkennt man, indem man
beide Seiten der Gleichung (2.26) transponiert:
 
c1
~c tt = (c1 , . . . , cn )t =  ... 
 
cn

und ~c tt = ~c verwendet. Ebenso verwendet man für Spaltenvektoren mitunter die beque-
mere Schreibweise ~a = (a1 , . . . , an )t“, es ist nämlich

 
a1
~a = (a1 , . . . , an )t =  ... 
 
an

Es folgt ein wichtiger Satz, der später noch plausibilisiert werden wird:
Satz: Die transponierte Matrix besitzt denselben Rang wie die ursprüngliche Matrix:

rgA = rgAt

91
2.2.2 Rechnen mit Matrizen, das Matrizenprodukt

Zunächst lassen sich zwei Matrizen derselben Dimension addieren; das Ergebnis der
Addition ist wieder eine Matrix derselben Dimension:

+ : Mm,n (IR) × Mm,n (IR) −→ Mm,n (IR)

Die Addition erfolgt komponentenweise:


     
a11 . . . a1n b11 . . . b1n a11 + b11 . . . a1n + b1n
 .. ..  .. ..  =  .. ..
 +  .
 
 . . .   . . 
am1 . . . amn bm1 . . . bmn am1 + bm1 . . . amn + bmn

Ein neutrales Element der Addition ist vorhanden, die Nullmatrix , die man üblicherweise
einfach durch 0“ bezeichnet:

 
0 ... 0
0 =  ... .. 

. 
0 ... 0

Ebenso gibt es zu jeder Matrix A = ((aij )) die negative:


 
−a11 . . . −a1n
−A =  ... .. 

. 
−am1 . . . −amn

Damit ist A + (−A) = 0. Zu beachten ist, daß man zwei Matrizen nur dann addieren
oder voneinander abziehen kann, wenn sie Elemente derselben Matrizenmenge Mm,n (IR)
sind.
Weiterhin kann man eine Matrix mit einer reellen Zahl λ ∈ IR multiplizieren; diese
Multiplikation erfolgt ebenfalls komponentenweise:
 
λa11 . . . λa1n
λ · A =  ... .. 

. 
λam1 . . . λamn

Die bedeutsamste Rechenoperation für Matrizen ist das Matrizenprodukt, das zwischen
Matrizen passender Dimension erfüllt ist: Ist A ∈ Ml,m (IR) und B ∈ Mm,n (IR), so läßt
sich mit diesen Matrizen die Matrizenmultiplikation ausführen:

A◦B = C

Das Ergebnis ist eine Matrix C ∈ Ml,n (IR). Zur Bezeichnung der Matrizenmultiplikation
wird auch der Kringel ◦“ verwendet.

Zur Herleitung der genauen Definition des Matrizenproduktes kehren wir zu den linearen
Gleichungssystemen zurück:

Gegeben sei ein lineares Gleichungssystem mit m Gleichungen und n Unbekannten,


geschrieben in Matrizenform:

B ◦ ~x = ~y (2.27)

92
Dabei sind
B ∈ Mm,n (IR), B = ((bij )),
~x ∈ IRn , ~x = (x1 , . . . , xn )t ein Spaltenvektor, bestehend aus
n Unbestimmten,
m t
~y ∈ IR , ~y = (y1 , . . . , ym ) die rechte Seite des Gleichungs-
systems, wobei hier die y1 , . . . , ym
ebenfalls Unbestimmte sein sol-
len, sie sollen sich als Lösung ei-
nes weiteren linearen Gleichungs-
systems ergeben.
Das Gleichungssystem zur Bestimmung von ~y = (y1 , . . . , ym )t sei
A ◦ ~y = d~ (2.28)
mit A = ((aij )) ∈ Ml,m (IR) und der festen rechten Seite d~ ∈ IRl .
Um direkt eine Lösung für ~x zu finden, d. h. ohne zunächst das Gleichungssystem in ~y
lösen zu müssen, setzen wir in die Gleichung (2.28) für ~y die linke Seite von (2.27) und
erhalten
A ◦ (B ◦ ~x) = d~ (2.29)
Wir wollen
• zeigen, daß (2.29) ein lineares Gleichungssystem mit n Unbekannten und l Glei-
chungen ist,
• die Koeffizientenmatrix C des Gleichungssystems (2.29) in Abhängigkeit von den
Koeffizentenmatrizen A und B der beiden ursprünglichen Gleichungssysteme be-
stimmen.
Dazu führen wir die beiden Matrix-Vektor-Multiplikationen in (2.29) explizit aus; als
erstes erfolgt die Multiplikation B ◦ ~x:
A ◦ (B ◦ ~x)
     
a11 . . . a1m b11 . . . b1n x1
=  ... ..  ◦  .. ..  ◦  .. 

.   . .   . 
al1 . . . alm bm1 . . . bmn xn

n
 
X
b1j xj
Der rechte Faktor ist ein m-
   
a11 . . . a1m  j=1 
dimensionaler Spaltenvektor, den
 
 .. .
. ..
=  . .  ◦ 
  
 n . multiplizieren wir jetzt mit der


al1 . . . alm  X 
l × m–Matrix A.
 bmj xj 
j=1
 m n
! 
X X
 a1i bij xj 
 i=1 j=1

 
= 
 .. 
(2.30)
 m . !

n

 X X 
 ali bij xj 
i=1 j=1

93
Als Zwischenergebnis haben wir den l-dimensionalen Spaltenvektor mit den Komponen-
ten !
Xm X n
aki bij xj für k = 1 . . . l
i=1 j=1

erhalten. Die Komponenten dieses Vektors formen wir in einer Nebenrechnung um: für
k = 1 . . . l ist
m n
!
X X
aki bij xj
i=1 j=1

m n
!
X X
= aki bij xj Die aki wurden durch Ausmultiplizieren
i=1 j=1 in die innere Summe gezogen.

n m
!
X X
= aki bij xj Jetzt wird zuerst über j und dann über
j=1 i=1 i summiert; diese Änderung bewirkt
nur, daß Summanden in anderer Rei-
henfolge aufaddiert werden.

n m
!
X X
= aki bij xj xj wurde aus der inneren Summe her-
j=1
| i=1
{z } ausgezogen.
ckj
n
X
= ckj xj Die Koeffizienten der xj bezeichnen wir
j=1 zur Abkürzung mit ckj .

Für die ckj gilt dabei


m
X k = 1...l
ckj = aki bij für (2.31)
j = 1...n
i=1

Setzt man das Ergebnis der Zwischenrechnung in (2.30) ein, so folgt für den zu berech-
nenden Ausdruck A ◦ (B ◦ ~x)

n
 
X
 c1j xj 
 j=1 
 
A ◦ (B ◦ ~x) = 
 .. 
(2.32)
 n .


 X 
 clj xj 
j=1

Schaut man sich die rechte Seite der Gleichung (2.32) genau an, so stellt man fest, daß
dieses genau das Ergebnis der Multiplikation der l × n–Matrix
 
c11 . . . c1n
C =  ... .. 

. 
cl1 . . . cln

94
mit dem Spaltenvektor ~x ∈ IRn ist, also hat man
   
c11 . . . c1n x1
A ◦ (B ◦ ~x) =  ... ..  ◦  .. 

.   . 
cl1 . . . cln xn

= C ◦ ~x (2.33)
Setzt man jetzt noch (2.33) in die Gleichung (siehe Seite 93)
A ◦ (B ◦ ~x) = d~ (2.34)
ein, so wird diese Gleichung zu
C ◦ ~x = d~ (2.35)
Damit haben wir hergeleitet: Die Gleichung (2.29) bzw. (2.34) läßt sich in der Form
(2.35) schreiben und besitzt folglich die Gestalt eines linearen Gleichungssystems.
Gleichzeitig haben wir die Koeffizientenmatrix dieses Gleichungssystems berechnet, es
ist die l × n–Matrix
 
c11 . . . c1n
C =  ... ..  ∈ Ml,n (IR)

. 
cl1 . . . cln

m
X
mit ckj = aki bij (2.36)
i=1

Die neue Matrix C, auf die wir gestoßen sind, hängt über die Berechnungsvorschrift
(2.36) von den beiden gegebenen Matrizen A und B ab. Diese Berechnungsvorschrift ist
das sogenannte Matrizenprodukt, dessen genaue Definition jetzt folgt:
Definition: Sei A = ((aki )) ∈ Ml,m (IR) eine l × m–Matrix und B = ((bij )) ∈ Mm,n (IR)
eine m × n–Matrix. Dann ist deren Produktmatrix
C = A◦B
die l × n–Matrix C = ((ckj )) ∈ Ml,n (IR) mit den Koeffizienten
m
X k = 1...l
ckj = aki bij für (2.37)
j = 1...n
i=1

Man beachte, daß der zweite Index der Einträge von A und der erste Index der Ein-
träge von B denselben Wertebereich durchlaufen; dieses ist auch genau der Bereich des
Summationsindex’ in (2.37).

Beispiel:
 
  0 2  
1 2 4 1·0+2·3+4·1 1·2+2·4+4·1
◦  3 4  =
9 8 1 9·0+8·3+1·1 9·2+8·4+1·1
1 1
 
10 14
=
25 51

95
Wichtige Bemerkung: Die Multiplikation zweier Matrizen kann nur dann ausgeführt
werden, wenn die Dimensionen passend sind: die Spaltenzahl des linken Faktors muß
gleich der Zeilenzahl des rechten Faktors sein; also
Ml,m (IR) × Mm,n (IR) −→ Ml,n (IR)
(2.38)
A ◦ B = C
Die Produktmatrix erbt“ die Zeilenzahl vom linken und die Spaltenzahl vom rechten

Faktor.
Wir wollen jetzt das Matrizenprodukt A ◦ B = C noch etwas genauer betrachten und
dabei zwei weitere wichtige Schreibweisen für dieses gewinnen. Zunächst erkennt man,
daß bei der Berechnung der Koeffizienten ckj von C, also in
m
X
ckj = aki bij = ak1 b1j + . . . + akm bmj (2.39)
i=1

die k-te Zeile (ak1 , . . . , akm ) von A mit der j-ten Spalte (b1j , . . . , bmj )t von B miteinander
verknüpft werden:
 
b11 . . . b1j . . . b1n
 .. .. .. 
 . . . 
bm1 . . . bmj . . . bmn

a11 . . . a1m
 
 .. .. 
 . . 
 ak1 . . . akm → ckj
 
 . .. 
 .. . 
al1 . . . alm
Dieses führt auf eine andere Schreibweise für (2.39): Wir betrachten dazu den zweiten
Faktor B wieder als aus n Spaltenvektoren zusammengesetzt:
 
b1j
B = (~b1 , . . . , ~bn ) mit ~bj =  ...  für j = 1 . . . n
 
bmj
Eine ähnliche Darstellung wählen wir für den ersten Faktor A, indem wir setzen
 
ak1
~ak =  ... 
 
akm

bzw. ~akt = (ak1 , . . . , akm ) für k = 1 . . . l


und die l × m–Matrix A als Zusammensetzung der l verschiedenen m-dimensionalen
Zeilenvektoren ~a1t , . . . ~alt auffassen, die Zeilenvektoren werden dazu untereinander ge-
schrieben:
 
~a1t
 ~a t 
 2 
A =  ..  (2.40)
 . 
~alt

96
Dann können wir die Gleichung (2.39) in der kurzen Form
 
b1j
ckj = (ak1 , . . . , akm ) ◦  ... 
 
bmj

bzw. ckj = ~akt ◦ ~bj (2.41)

schreiben. Dieses ist nichts anderes als das Produkt einer 1 × m–Matrix mit einer m × 1–
Matrix!
Die Kurzschreibweise (2.41) für die Koeffizenten der Produktmatrix wenden wir bei der
Herleitung einer wichtigen Formel an. Diese Formel beschreibt das Zusammenspiel von
Transposition und Matrizenprodukt:

Satz: Sei A ∈ Ml,m (IR) und B ∈ Mm,n (IR). Dann ist A ◦ B definiert, und es gilt

(A ◦ B)t = B t ◦ At (2.42)

(Man beachte, daß wegen B t ∈ Mn,m (IR) und At ∈ Mm,l (IR) auch das Produkt B t ◦ At
definiert ist.)
Beweis15 : Wir schreiben A in Zeilendarstellung (siehe 2.40) und B in Spaltendarstellung:
 
~a1t
A =  ...  mit ~ak ∈ IRm
 
~alt

B = (~b1 , . . . , ~bn ) mit ~bk ∈ IRm

Hierdurch lassen sich auch deren transponierte Matrizen darstellen:


~b t
 
1
At = (~a1 , . . . , ~al ) B t =  ...  (2.43)
 
~b t
n

Das Produkt der beiden Matrizen A und B stellen wir mit Hilfe von (2.41) dar:

~a1t ◦ ~b1 . . . ~a1t ◦ ~bn


 

A◦B = 
 .. .. 
. . 
t ~ t ~
~al ◦ b1 . . . ~al ◦ bn

Beide Seiten dieser Gleichung werden transponiert, dazu müssen auf der rechten Seite
Zeilen und Spalten vertauscht werden:

~a1t ◦ ~b1 . . . ~alt ◦ ~b1


 

(A ◦ B)t = 
 .. .. 
(2.44)
. . 
~a t ◦ ~bn . . . ~a t ◦ ~bn
1 l

15
Das Nachvollziehen dieses Beweises ist zwar nützlich und wird dringend empfohlen, ist aber für das
Verständnis des Folgenden nicht zwingend erforderlich.

97
Einen Eintrag dieser Matrix wollen wir etwas genau betrachten und geeignet umschrei-
ben:
m
X
~akt ◦ ~bj = aki bij Die beiden Faktoren unter dem Summenzei-
i=1 chen werden vertauscht.
m
X
= bij aki Dieses kann man als Produkt der 1 × m–
i=1 Matrix ~bjt und der m×l–Matrix ~ak auffassen.
Daß hier der gemeinsame Summationsindex
nicht in der Mitte sondern außen steht, ist ohne
Belang. Man könnte dieses durch Umbenennung
der Koeffizienten vermeiden.
= ~bjt ◦ ~ak

Dieses wird jetzt in (2.44) eingesetzt, die Einträge der dortigen Matrix bekommen dann
die Gestalt:
~b t ◦ ~a1 . . . ~b t ◦ ~al
 
1 1
(A ◦ B)t = 
 .. .. 
Vergleicht man die Einträge die-
. . 
~b ◦ ~a1 . . . ~b ◦ ~al
t t ser Matrix mit Gleichung (2.41),
n n
so erkennt man: diese Matrix
ist Produkt zweier Matrizen,
nämlich:
~b t
 
1
=  ...  ◦ (~a1 , . . . , ~al ) Dieses sind aber gerade die beiden
 
~b t Matrizen aus (2.43).
n

= B t ◦ At

qed.

Es gibt noch eine weitere Darstellung des Matrizproduktes C = A ◦ B, auch dieses


werden wir später häufig verwenden. Die Herleitung dieser Darstellung beginnt wieder
mit der Spaltenschreibweise des zweiten Faktors B:
 
b1j
B = (~b1 , . . . , ~bn ) mit ~bj =  ...  ∈ IRm
 
bmj

Genauso stellen wir die Produktmatrix C dar:


 
c1j
C = (~c1 , . . . , ~cn ) mit ~cj =  ...  ∈ IRl
 
clj

98
Wir wollen untersuchen, wie eine Spalte ~cj = (c1j , . . . , c1j )t der l × n–Matrix C von A
und den Spalten von B abhängt. Für jede Spalte ~cj mit j = 1 . . . n gilt
 
c1j
~cj =  ...  Für jeden Koeffizienten clj setzen
 
clj wir die Darstellung aus Gleichung
(2.39) ein.
 m
X

 a1i bij 
 i=1 

=  .. 
Ausgeschrieben ergibt dieses
 . 

 Xm 
ali bij
 
i=1
 
a11 b1j + . . . + a1m bmj
= 
 .. 
. 
al1 b1j + . . . + alm bmj

Vergleicht man dieses mit der Definition der Multiplikation einer Matrix mit einem
Vektor (siehe Gleichung 2.24 auf Seite 86), dann erkennt man, daß man für den letzten
Ausdruck schreiben kann
     
a11 b1j + . . . + a1m bmj a11 . . . a1m b1j
..  . ..  ◦  .. 
 =  ..
 
 . .   . 
al1 b1j + . . . + alm bmj al1 . . . alm bmj

= A ◦ ~bj

Damit haben wir als Ergebnis die Gleichung

~cj = A ◦ ~bj

erhalten. Diese Gleichung besagt, daß die Spalten der Produktmatrix das Ergebnis der
Matrix-Vektor-Multiplikation des linken Faktors A mit den Spalten des rechten Faktors
B sind. Setzt man dieses in die Spaltendarstellung der Produktmatrix C = A ◦ B ein,
so erhält man eine wichtige Schreibweise des Matrizenproduktes:

C = (A ◦ ~b1 , . . . , A ◦ ~bn ) (2.45)

Zusätzlich gewinnt man hier die folgenden Erkenntnisse:

• Das Matrizenprodukt läßt sich auf das Matrix-Vektor-Produkt zurückführen.

• Das Matrix-Vektor-Produkt ist das gleiche wie das Produkt einer Matrix mit ei-
ner einspaltigen Matrix. Das Matrix-Vektor-Produkt ist daher ein Spezialfall des
Matrizenproduktes.

99
Insbesondere gelten dann alle Aussagen und Formeln des Matrizenproduktes auch für
das Matrix-Vektor-Produkt.

Die folgenden Gleichungen werden ohne Beweise16 gebracht. Sehr wichtig ist darunter
insbesondere die erste Aussage, das Assoziativgesetz:

Satz: Die folgenden Matrizen seien gegeben

A, A1 , A2 ∈ Ml,m (IR), B, B1 , B2 ∈ Mm,n (IR), und C ∈ Mn,p (IR)

Dann gilt:

1. Das Assoziativgesetz:

(A ◦ B) ◦ C = A ◦ (B ◦ C)

Die Reihenfolge der Ausführung spielt bei der Matrizenmutliplikation keine Rolle.

2. Das 1. Distributivgesetz:

(A1 + A2 ) ◦ B = A1 ◦ B + A2 ◦ B

3. Das 2. Distributivgesetz:

A ◦ (B1 + B2 ) = A ◦ B1 + A ◦ B2

4. Für λ ∈ IR ist

λ · (A ◦ B) = (λ · A) ◦ B = A ◦ (λ · B)

Zum Schluß dieses Abschnitts noch ein Beispiel zur Anwendung des Matrizenproduktes.
Wir betrachten wieder den gerichteten Graphen auf Seite 88 mit Adjazenzmatrix
 
0 1 1 0 1
 0 0 0 0 1 
 
A =   0 1 0 1 0 

 1 0 1 0 0 
1 0 0 0 0

und berechnen deren Quadrat


 
  1 1 0 1 1
b11 . . . b1n  1 0 0 0 0 
 .. . 2

..  = A = A ◦ A = 

B =  . 1 0 1 0 1
 
 
bn1 . . . bnn  0 2 1 1 1 
0 1 1 0 1
16
Diese Beweise erfolgen durch Nachrechnen.

100
Während die Adjazenzmatrix angibt, ob eine direkte Verbindung von einem Knoten
zu einem anderen führt, gibt deren Quadrat an, wie viele Wege zwischen zwei Knoten
verlaufen, die genau über einen weiteren Knoten führen17 , genauer:


 0 Kein Weg der Länge zwei führt vom i-ten
Knoten zu j-ten Knoten.

bij =

 s > 0 Genau s Wege der Länge zwei führen vom
i-ten Knoten zu j-ten Knoten.

Am Quadrat der Adjazenzmatrix dieses Graphen erkennt man etwa:

• Genau zwei Wege der Länge zwei führen vom vierten zum zweiten Knoten.

• Genau ein Weg der Länge zwei führt vom ersten zum zweiten Knoten.

• Kein Weg der Länge zwei besteht zwischen dem zweiten und dritten Knoten.

2.2.3 Quadratische Matrizen und die Umkehrmatrix

Multipliziert man zwei Matrizen passender Dimension miteinander so hat im allgemeinen


die Produktmatrix eine andere Dimension als die beiden Faktoren (siehe (2.38) auf Seite
96), d. h. liegt in einer anderen Matrizenmenge Ml,n (IR).
Anders (besser!) verhält es sich bei quadratischen Matrizen: Sind zwei quadratische
Matrizen A und B derselben Dimension gegeben, so sind beide Matrizenprodukte A ◦ B
und B ◦ A definiert, und die Ergebnisse sind wieder quadratische Matrizen derselben
Dimension (siehe dazu (2.38) mit l = m = n):

A, B ∈ Mn,n (IR) ⇒ A ◦ B, B ◦ A ∈ Mn,n (IR)

Damit wird die Matrizenmultiplikation zu einer inneren Verknüpfung der Menge Mn,n (IR):
Sie ist für alle Elemente aus Mn,n (IR) definiert, und Mn,n (IR) ist abgeschlossen bezüglich
◦“.

Zum Vergleich sei daran erinnert, daß die übliche Multiplikation eine innere Verknüpfung
der Menge der reellen Zahlen ist.

Betrachtet man Mn,n (IR) zusammen mit den beiden inneren Verknüpfungen +“ (der

komponentenweisen Addition) und ◦“, so spricht vom Matrizenring und schreibt

(Mn,n (IR), +, ◦)

Bezüglich der Addition gilt das auf der Seite 92 ausgeführt; insgesamt gilt: Zusammen
mit +“ ist Mn,n (IR) eine kommutative Gruppe mit der Nullmatrix als neutralem Ele-

ment; das negative Element einer Matrix erhält man dadurch, daß man jeden ihrer
Einträge durch dessen Negatives ersetzt.

Wir wollen uns jetzt der anderen inneren Verknüpfung ◦“ zuwenden. Zunächst gilt auch

hier der Satz auf Seite 100:
17
Solche Wege bezeichne man als Wege der Länge 2.

101
• ◦“ ist assoziativ, d. h.

A, B, C ∈ Mn,n (IR) ⇒ (A ◦ B) ◦ C = A ◦ (B ◦ C)

• Zusammen mit der Addition gelten die Distributivgesetze:

A, B, C ∈ Mn,n (IR) ⇒ (A + B) ◦ C = A ◦ C + B ◦ C
A ◦ (B + C) = A ◦ B + A ◦ C

Wie steht es bei der Matrizenmultiplikation bezüglich

• Kommutativität

• neutralem Element

• Inversenbildung

Wir gehen nacheinander diese Punkte durch. Dazu setzen wir fortan n > 1 voraus. Für
n = 1 entspricht Mn,n (IR) der Menge der reellen Zahlen (Aufgaben: Machen Sie sich
dieses klar!):
(M1,1 (IR), +, ◦) =
˜ (IR, +, ·)

Zunächst muß man feststellen, daß die Matrizenmultiplikation nicht kommutativ ist,
d. h. es gibt Matrizen A, B ∈ Mn,n (IR) mit A ◦ B 6= B ◦ A.
Beispiel:
     
0 1 2 0 0 1
◦ =
1 0 0 1 2 0
     
2 0 0 1 0 2
6= ◦ =
0 1 1 0 1 0

Ein neutrales Element zur Matrizenmultiplikation ist vorhanden; dieses ist die sogenann-
te Einheitsmatrix , bezeichnet mit E“:

 
1 0 ··· 0
 0 1 ··· 0 
E =  .. .. . . .. 
 
 . . . . 
0 0 ··· 1

Die Einheitsmatrix ist die Matrix, deren Einträge auf der Hauptdiagonalen alle gleich 1
und sonst gleich 0 sind. Die Einträge von E bezeichnet man üblicherweise mit δij :
 
δ11 . . . δ1n 
 .. .
..  mit δij = 1 für i = j
E =  .

0 für i 6= j
δn1 . . . δnn

Die δij heißen Kroneckersymbole.

102
Eine weitere Schreibweise für die Einheitsmatrix ist die Darstellung durch Spaltenvek-
toren:

E = (~e1 , ~e2 , . . . , ~en )


 
0
 .. 
 . 
 0 
 
mit ~ej =  1  ←− j-te Stelle
 
 0 
 
 . 
 .. 
0

Die ~e1 , . . . , ~en bezeichnet man als die n-dimensionalen Einheitsvektoren; die Einheits-
vektoren enthalten genau eine Eins und sonst Nullen. Für n = 3 hat man beispielsweise
     
1 0 0
~e1 =  0 , ~e2 =
  1  und ~e3 =  0 
0 0 1

Zusammen ergeben diese die dreidimensionale Einheitsmatrix:


 
1 0 0
E = (~e1 , ~e2 , ~e3 ) =  0 1 0 
0 0 1

Um zu zeigen, daß E wirklich neutrales Element ist, bedarf es zweier Sätze:

Satz: Für alle A ∈ Mn,n (IR) ist


E ◦ A = A.
Beweis: Sei ~a = (a1 , . . . , an )t ∈ IRn ; wir zeigen im ersten Schritt E ◦ ~a = ~a:
   
1 0 ··· 0 a1
 0 1 ··· 0    a2 
 
E ◦ ~a =  .. .. . . ..  ◦  .. 

 . . . .   . 
0 0 ··· 1 an

   
1 · a1 + 0 · a2 + · · · + 0 · an a1
 0 · a1 + 1 · a2 + · · · + 0 · an   a2 
=  =  = ~a
   
..   ..
 .   . 
0 · a1 + 0 · a2 + · · · + 1 · an an

Stellt man jetzt A in Spaltenschreibweise dar, so folgt im zweiten Schritt mit (2.45)

E ◦ A = E ◦ (~a1 , . . . , ~an ) = (E ◦ ~a1 , . . . , E ◦ ~an )


= (~a1 , . . . , ~an ) = A

Denn, wie eben gezeigt, ist stets E ◦ ~aj = ~aj . qed.

103
Bis jetzt wurde nur gezeigt, daß für alle A ∈ Mn,n (IR) die Gleichung

E◦A = A

gilt, d. h. es wurde nur gezeigt, daß E ein sogenanntes linksneutrales Element ist. Man
kann daraus nicht unmittelbar folgern, daß auch

A◦E = A (2.46)

gilt, denn die Matrizenmultiplikation ist nicht kommutativ!.


Die Gleichung (2.46) wird im nächsten Satz gezeigt; dabei wird verwendet, daß die
Einheitsmatrix symmetrisch ist
Et = E
Satz: Für alle A ∈ Mn,n (IR) gilt
A◦E = A
Beweis: Im vorangegangenen Satz wurde gezeigt, daß für alle B ∈ Mn,n (IR) gilt

B = E◦B

Dieses wenden wir auf die Matrix At (der Transponierten unserer gegebenen Matrix A)
an:
At = E ◦ At
und transponieren beide Seiten dieser Gleichung

Att = (E ◦ At )t

Wegen Att = A und E t = E folgt daraus nach Gleichung (2.42) auf Seite 97

A = (E ◦ At )t = Att ◦ E t = A ◦ E

qed.

Die Einheitsmatrix E ist ein links- und rechtsneutrales Element. Ist ein solches vorhan-
den, so stellt sich sofort die Frage nach inversen Elementen: Zu A ∈ Mn,n (IR), A 6= 0 ist
ein D ∈ Mn,n (IR) mit
A◦D = E
gesucht. Man muß jedoch sogleich feststellen, daß es – im Gegensatz zu den reellen
Zahlen – nicht zu jedem von Null verschiedenen Element ein Inverses gibt. Als Beispiel
betrachten wir  
1 2
A =
3 6
Setzt man hilfsweise  
3 −1
C =
3 −1
so rechnet man nach:18

C ◦A =0 (2.47)
18
Die Matrizen C und A sind auch ein Beispiel für Nullteiler. Mn,n (IR) ist also - anders als IR - nicht
nullteilerfrei.

104
Angenommen, A besitzt ein Inverses, d. h. es gibt eine Matrix D ∈ Mn,n (IR) mit A◦D =
E. Multipliziert man beide Seiten der Gleichung (2.47) von rechts mit dieser Matrix D,
so folgt

C ◦A ◦ D} = 0| {z
| {z ◦ D}
=E =0

⇒ C ◦E = C = 0

Widerspruch, denn nach Definition ist C 6= 0.

Der folgende Satz gibt an, wann eine Matrix invertierbar ist; der zweite Teil seines
Beweises weist einen Weg, zu einer gegebenen Matrix deren Inverse zu berechnen.

Satz: Sei A ∈ Mn,n (IR). Zu A gibt es genau dann eine Matrix D ∈ Mn,n (IR) mit

A◦D = E

wenn rgA = n ist, d. h. genau dann, wenn A vollen Rang hat.

Beweis: Zwei Richtungen sind zu zeigen.

1. Es sei eine Matrix D ∈ Mn,n (IR) mit A ◦ D = E vorhanden. Zu zeigen: Dann


folgt rgA = n.
Dieses wird gezeigt, in dem man nachrechnet, daß ein lineares Gleichungssystem
mit Koeffizentenmatrix A den Rang n besitzt.
Ein quadratisches Gleichungssystem mit n Unbekannten hat genau dann den vollen
Rang n, wenn es für jede rechte Seite lösbar ist (siehe Seite 76 sowie auch Seite 81).
Zu zeigen bleibt also, daß für jedes ~b ∈ IRn eine Lösung von

A ◦ ~x = ~b (2.48)

vorhanden ist. Mit Hilfe der Matrix D kann man die Lösung sofort angeben: Diese
lautet:

~x = D ◦ ~b (2.49)

Dann ist nämlich, wenn man dieses in Gleichung (2.48) einsetzt:

A ◦ ~x = A ◦ D} ◦~b
| {z
=E

= E ◦ ~b = ~b

In der Tat hat man so eine Lösung von (2.48) für eine beliebige rechte Seite ~b
gefunden. A hat folglich den Rang n.

2. Jetzt werde umgekehrt vorausgesetzt, daß rgA = n ist; zu zeigen ist nun: es gibt
ein D ∈ Mn,n (IR) mit A ◦ D = E.
Da rgA = n ist, hat ein quadratischen Gleichungssystem mit Koeffizientenmatrix
A, also
A ◦ ~x = ~b

105
den Rang n und ist für jede rechte Seite ~b lösbar (siehe wieder Seite 76 oder
Seite 81). Insbesondere lassen sich Lösungen finden, wenn man für ~b die n Spalten
der Einheitsmatrix E = (~e1 , . . . , ~en ) einsetzt; dieses liefert die n Gleichungssysteme

A ◦ ~x = ~ej für j = 1 . . . n (2.50)

Sei d~j ∈ IRn jeweils die Lösung hiervon. Dann kann man schreiben

A ◦ d~j = ~ej für j = 1 . . . n

Definiert man nun die Matrix D ∈ Mn,n (IR) durch

D = (d~1 , . . . , d~n )

so ist

A ◦ D = A ◦ (d~1 , . . . , d~n )
= (A ◦ d~1 , . . . , A ◦ d~n )
= (~e1 , . . . , ~en )
= E

D ist die gesuchte inverse Matrix zu A. qed.

Im zweiten Teil des Beweises wurde die inverse Matrix mit Hilfe linearer Gleichungs-
systeme gefunden. Wir kommen darauf zurück, wenn wir die Inverse einer gegebenen
Matrix explizit berechnen wollen.

Ist zu A ∈ Mn,n (IR) ein D ∈ Mn,n (IR) mit A ◦ D = E vorhanden, so schreibt man für D

A−1

und nennt A−1 die Umkehrmatrix zu A. Existiert A−1 , so nennt man A umkehrbar oder
invertierbar .

Wegen der fehlenden Kommutativität der Matrizenmultiplikation taucht hier wieder ein
Problem auf: Es ist zwar
A ◦ A−1 = E
Daraus folgt aber noch nicht, daß auch A−1 ◦ A = E ist. Wir wissen eben bis jetzt nur,
A−1 ein Rechtsinverses zu A; daß A−1 auch Linksinverses ist, ist eine der Aussagen des
folgenden Satzes.
Satz: Die Matrix A ∈ Mn,n (IR) sei umkehrbar mit Umkehrmatrix A−1 . Dann gilt
1. Die Matrix A−1 ist ebenfalls umkehrbar.

2. Ist (A−1 )−1 die (rechtsinverse) Umkehrmatrix von A−1 , so ist

(A−1 )−1 = A

3. Es ist
A−1 ◦ A = E

106
Beweis:

1. Aufgrund des Satzes auf Seite 105 ist zum Nachweis der Umkehrbarkeit von A−1
zu zeigen, daß
rgA−1 = n
ist. Dieses ergibt sich dadurch, daß gezeigt wird, daß das homogene Gleichungs-
system mit Koeffizientenmatrix A−1

A−1 ◦ ~x = 0

nur die Lösung ~x = 0 besitzt (siehe wieder Seite 81). Sei ~x0 ∈ IRn eine beliebige
Lösung, d. h. es sei
A−1 ◦ ~x0 = 0
Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man19 :
−1
| ◦{zA } ◦~x0 = A
A ◦ 0}
| {z
=E =0
⇒ E ◦ ~x0 = 0
⇒ ~x0 = 0

Damit ist rgA−1 = n gezeigt. Die Umkehrmatrix (A−1 )−1 von A−1 existiert also
und für diese gilt

A−1 ◦ (A−1 )−1 = E (2.51)

2. Zu zeigen ist jetzt: (A−1 )−1 = A. Dazu multiplizieren wir Gleichung (2.51) von
links mit A und verwenden wieder A ◦ A−1 = E:
−1 −1 −1
| ◦{zA } ◦(A )
A = A◦E
=E
⇒ E ◦ (A−1 )−1 = A
⇒ (A−1 )−1 = A

3. Als letztes ist zu zeigen: A−1 ◦ A. Dieses folgt aber sofort aus Gleichung (2.51)
zusammen mit der eben bewiesenen Gleichung (A−1 )−1 = A. qed.

Nun wissen wir, daß A−1 sowohl Links- als auch Rechtsinverses zu A ist:

A−1 ◦ A = A ◦ A−1 = E

Wir wollen jetzt ein Verfahren kennenlernen, zu A ∈ Mn,n (IR) mit rgA = n die Umkehr-
matrix A−1 zu berechnen. In dem Beweis des Satzes auf Seite 105 wurde das Verfahren
bereits beschrieben: Man muß die Gleichungssysteme

A ◦ ~x = ~ej (2.52)
19
Zur Erinnerung: 0 steht hier für den Nullvektor (0, . . . , 0). Offensichtlich ist A ◦ 0 = 0.

107
für j = 1 . . . n lösen. Dabei sind ~e1 , . . . , ~en die Spalten der Einheitsmatrix E = (~e1 , . . . , ~en ).
Sind d~1 , . . . , d~n die Lösungen der Gleichung (2.52), so ist – wie gezeigt -

A−1 = (d~1 , . . . , d~n )

Da sich die n Gleichungssysteme (2.52) nur um die rechten Seiten unterscheiden, las-
sen sie sich mit Hilfe des Gaußschen Verfahrens simultan lösen. Man schreibt dazu die
gemeinsame Koeffizientenmatrix A und die rechten Seiten nebeneinander auf:

A ~e1 ~e2 · · · ~en

bzw. ausführlicher
     
  1 0 0
a11 . . . a1n
 .. ..
 0   1   0 
 ...
      
 . .   ..  ..  .. 
 .  .  . 
an1 . . . ann
0 0 1

Anschließend beginnt man mit dem Umformen nach dem Gaußschen Verfahren. Die
Umformungsschritte wendet man hier nicht nur auf die eine rechte Seite, sondern auf
die n rechten Seiten an. Dieses liefert die reduzierte Form der n Gleichungssysteme; sie
bekommen damit die Gestalt
 
1 α12 α13 . . . α1n−1 α1n
 0 1 α23 . . . α2n−1 α2n 
 
 0 0 1 . . . α3n−1 α 3n 
 (1) (1)
· · · ~en(1)
 . . . . .
 . . . ... . .  ~e1 ~e2
 . . . . . 
 0 0 0 ... 1 αn−1n 
 
..
0 0 0 . 0 1
(1) (1)
Die ~e1 , . . . , ~en sind die umgeformten rechten Seiten. Auf der gesamten Diagonalen der
reduzierten Koeffizientenmatrix müssen Einsen stehen, da ja rgA = n vorausgesetzt ist.
Stieße man hier auf Nullgleichungen, so wäre rgA < n, und man könnte die Rechnung
abbrechen, da A nicht invertierbar wäre.
Wegen der Einsen auf der Diagonalen kann man die weitere Rechnung dadurch be-
schleunigen, daß man die Gleichungssysteme noch weiter reduziert. Die Fortsetzung des
Reduktionsvorganges soll dazu führen, daß auch oberhalb der Diagonalen nur Nullen
stehen. Die Vorgehensweise dabei lautet:

Als erstes zieht man für i = 1 . . . n − 1 das αin –Fache der letzten Zeile von der i-ten
Zeile ab; dieses liefert
 
1 α12 α13 . . . α1n−1 0
 0 1 α23 . . . α2n−1 0 
 
 0 0 1 . . . α3n−1 0  (2) (2)
 . .
 . . .. . . .. ..  ~e1 ~e2 · · · ~en(2)
 . . . . . . 

0 0 0 . . . 1 0
 
 
..
0 0 0 . 0 1
Jetzt sind die Elemente der letzten Spalte außerhalb der Diagonalen alle Null. Die rech-
ten Seiten haben sich aufgrund der Zeilensubtraktionen auch weiter verändert.

108
Man verfährt jetzt so weiter, indem man – von hinten beginnend – für j = n − 1 . . . 2
und bei festem j jeweils für i = 1 . . . j − 1 das αij –Fache der j-ten Zeile von der i-ten
Zeile abzieht; dieses liefert die vollständig reduzierte Form
 
1 0 0 ... 0 0
 0 1 0 ... 0 0 
 
 0 0 1 ... 0 0 
 . . . . . . .. ..  f~1 f~2 · · · f~n
 . . . 
 . . . . . 
 0 0 0 ... 1 0 
 
.
0 0 0 .. 0 1

Dabei sind die f~1 , . . . , f~n die endgültig umgeformten rechten Seiten. Die Koeffizienten-
matrix ist in die Einheitsmatrix verwandelt worden. Damit kann man die vollständig
reduzierten Gleichungssysteme schreiben als

E ◦ ~x = f~j für j = 1 . . . n (2.53)

Wegen
E ◦ f~j = f~j
sind die Lösungen von (2.53) und damit auch die Lösungen von (2.52) genau die n
Spaltenvektoren f~1 , . . . , f~n . Die aus deren Zusammensetzung gebildete Matrix

D = (f~1 , . . . , f~n )

ist gerade die Umkehrmatrix von A, also

A−1 = (f~1 , . . . , f~n )

Beipiel: Wir wollen die Umkehrmatrix der 3 × 3–Matrix


 
1 2 3
A =  5 11 22 
3 10 38

berechnen und schreiben dazu


A ~e1 ~e2 ~e3
Ausgeschrieben lautet dies
       
1 2 3
1
0
0
 5 11 22   0   1   0 

3 10 38 0 0 1

Geeignete Vielfache der ersten Zeile werden von den folgenden Zeilen abgezogen:
       
1 2 3
1
0
0
 0 1 7   −5   1   0 

0 4 29 −3 0 1

109
Das Vierfache der zweiten wird von der letzen Zeile abgezogen:
       
1 2 3
1
0
0
 0 1 7   −5   1   0 


0 0 1 17 −4 1
Jetzt setzt man die Reduzierung fort; dabei wird das 7–Fache der letzten von der zweiten
und das 3–Fache der letzten von der ersten Zeile abgezogen:
       
1 2 0
−50
12
−3
 0 1 0   −124   29   −7 

0 0 1 17 −4 1
Zum Schluß wird das Zweifache der zweiten Zeile von der ersten abgezogen:
       
1 0 0
198
−46
11
 0 1 0  
−124   29   −7 

0 0 1 17 −4 1
Damit haben wir als Ergebnis unserer Berechnung erhalten:
 −1  
1 2 3 198 −46 11
A−1 =  5 11 22  =  −124 29 −7 
3 10 38 17 −4 1

Mit Hilfe der Umkehrmatrix läßt sich das Gleichungssystem

A ◦ ~x = ~b

sofort lösen. Multipliziert man beide Seiten dieser (Matrizen-) Gleichung von links mit
A−1 :
−1 −1 ~
| {z◦ A} ◦~x = A ◦ b
A
=E

so folgt daraus sofort die eindeutige Lösung

~x = A−1 ◦ ~b

Beispiel: Die eindeutige Lösung von


   
1 2 3 3
 5 11 22  ◦ ~x =  2 
3 10 38 1
ist
 −1      
1 2 3 3 198 −46 11 3
 5 11 22  ◦  2  =  −124 29 −7  ◦  2 
3 10 38 1 17 −4 1 1
 
513
=  −321 
44

110
Die Berechnung der Umkehrmatrix ist immer dann angezeigt, wenn ein quadratisches
Gleichungssystem mit vollem Rang mehrmals mit unterschiedlichen rechten Seiten zu
lösen ist. Hat man die Umkehrmatrix vorliegen, dann beschränkt sich der Aufwand beim
Berechnen einer Lösung auf eine einfache Multiplikation einer Matrix mit einem Vektor.

Aufgabe: Eine Diagonalmatrix ist eine n × n–Matrix, deren Einträge außerhalb der
Hauptdiagonalen alle gleich Null sind:
 
λ1 0
 0 λ2 0 
 
D = 
 . . 
mit λ1 , . . . , λn ∈ IR
0 . 0 
 
 0 λn−1 0 
0 λn
Zeigen Sie: D ist genau dann umkehrbar, wenn λj 6= 0 für j = 1 . . . n ist, und daß in
diesem Falle die Umkehrmatrix durch
 −1 
λ1 0
 0 λ−1 0 
 2 
D −1
= 
 . .. 
0 0 
−1
 
 0 λn−1 0 
0 λ−1
n

gegeben ist!

Es folgen zwei nützliche Formeln im Zusammenhang mit den Einheitsvektoren. Zu deren


Herleitung schreiben wir die n × n–Matrix A und anschließend auch die Einheitsmatrix
in Spaltenschreibweise:
A = (~a1 , . . . , ~an ) Spaltenschreibweise
= A◦E
= A ◦ (~e1 , . . . , ~en ) Spaltenschreibeise für
die Einheitsmatrix
= (A ◦ ~e1 , . . . , A ◦ ~en ) nach Gleichung (2.45)

also:
(~a1 , . . . , ~an ) = (A ◦ ~e1 , . . . , A ◦ ~en )
Die letzte Gleichung gibt die Gleichheit zweier Matrizen an; da zwei Matrizen genau
dann gleich sich, wenn ihre entsprechenden Spalten gleich sind, liefert dieses
A ◦ ~ej = ~aj für j = 1 . . . n (2.54)
Diese Gleichung besagt: die Multiplikation einer Matrix mit dem j-ten Einheitsvektor
liefert die j-te Spalte der Matrix.
Jetzt werde vorausgesetzt, daß die Matrix A umkehrbar ist. Multipliziert man die Glei-
chung (2.54) von links mit A−1 , so erhält man
A−1 ◦ A ◦ ~ej = A−1 ◦ ~aj
⇒ ~ej = A−1 ◦ ~aj für j = 1 . . . n (2.55)

111
Der nächste Satz beschreibt den Zusammenhang zwischen Matrizenmultiplikation und
Inversenbildung.

Satz: Sind A, B ∈ Mn,n (IR) zwei umkehrbare Matrizen, so ist auch ihr Produkt umkehr-
bar, und die Umkehrmatrix des Produktes erhält man durch

(A ◦ B)−1 = B −1 ◦ A−1 (2.56)

Beweis: Man zeigt, daß B −1 ◦ A−1 die Umkehrmatrix von A ◦ B ist, indem man ganz
einfach nachrechnet, daß diese beiden Matrizen miteinander multipliziert die Einheits-
matrix ergeben:

(A ◦ B) ◦ (B −1 ◦ A−1 ) = (A ◦ B) ◦ (B −1 ◦ A−1 )
= A ◦ (B ◦ B −1 ) ◦ A−1
= A ◦ E ◦ A−1
= A ◦ A−1
= E

qed.

Es fehlt noch der Zusammenhang zwischen Inversenbildung und Transponieren; den


herzuleiten, stellen wir als
Aufgabe: Zeigen Sie mit Hilfe der Gleichung (2.42) auf Seite 97: Die Transponierte einer
umkehrbaren Matrix ist ebenfalls umkehrbar. Die Inverse der Transponierten erhält
durch

(At )−1 = (A−1 )t

In Worten lautet diese Gleichung: Die Inverse der Transponierten ist die Transponierte
der Inversen.

2.2.4 Einige Matrizengruppen

Die allgemeine lineare Gruppe ist definiert durch

GL(n, IR ) = A ∈ Mn,n (IR)|A ist umkehrbar




Wegen der beiden Sätze auf Seite 112 und Seite 106 ist GL(n, IR ) bezüglich Matrizen-
multiplikation und Inversenbildung abgeschlossen. GL(n, IR ) bildet mit der Matrizen-
multiplikation eine nicht-kommutative Gruppe.

Die Menge der orthogonalen Matrizen, die sogenannte orthogonale Gruppe ist definiert
durch
O(n, IR ) = A ∈ Mn,n (IR)|A ◦ At = E


Bei einer orthogonalen Matrix ist die Umkehrmatrix gleich der Transponierten. Mit
Hilfe von Gleichung (2.42) auf Seite 97 folgt die Abgeschlossenheit der orthogonalen
Gruppe bezüglich der Matrizenmultiplikation; O(n, IR ) ist damit ebenfalls eine nicht-
kommutative Gruppe.

112
Aufgabe: Weisen Sie die Abgeschlossenheit von O(n, IR) unter ◦“ nach, d. h. zeigen Sie,

daß für A, B ∈ O(n, IR ) auch A ◦ B orthogonal ist, daß nämlich (A ◦ B) ◦ (A ◦ B)t = E
ist!

Für n = 2 und n = 3 besitzen orthogonale Matrizen eine geometrische Bedeutung.

Beispiel: Für eine reelle Zahl α ∈ IR ist die Matrix


 
cos α 0 − sin α
U =  0 1 0 
sin α 0 cos α

orthogonal. Das zeigt man, indem man U ◦ U t = E durch Rechnen nachprüft:


   
cos α 0 − sin α cos α 0 sin α
t
U ◦U =  0 1 0  ◦  0 1 0 
sin α 0 cos α − sin α 0 cos α

cos2 α + sin2 α
 
0 cos α sin α − sin α cos α
=  0 1 0 
2 2
sin α cos α − sin α cos α 0 sin α + cos α
 
1 0 0
=  0 1 0  = E
0 0 1

Die Matrix U beschreibt im 3-dimensionalen Raum eine Drehung um den Winkel α mit
der y–Achse als Drehachse.

2.3 Die Determinante


2.3.1 Einführung und Definition
Das Ziel dieses Abschnittes besteht darin, eine Funktionen von der Menge der quadra-
tischen n–reihigen Matrizen in die Menge der reellen Zahlen, d. h. eine Funktion

f : Mn,n (IR) 7→ IR

zu finden, die gute rechnerische Eigenschaften“ besitzt und für die gilt

6= 0 falls A ∈ Mn,n (IR) umkehrbar ist

f (A)
= 0 sonst

Diese Funktion ist dann die sogenannte Determinante.

Beispiel: Wir betrachten die 2 × 2–Matrix


 
a11 a12
A =
a21 a22

113
und dazu das Gleichungssystem
A ◦ ~x = ~b
mit der rechten Seite ~b = (b1 , b2 )t . Ausgeschrieben lautet dieses Gleichungssystem
a11 x1 + a12 x2 = b1
a21 x1 + a22 x2 = b2
Wir versuchen dieses Gleichungssystem zu lösen, indem wir hier die erste Gleichung mit
a21 und die zweite Gleichung mit a11 multiplizieren:
a11 a21 x1 + a12 a21 x2 = b1 a21
a11 a21 x1 + a11 a22 x2 = b2 a11
und anschließend die erste Gleichung von der zweiten abziehen:
a11 a21 x1 + a12 a21 x2 = b1 a21
(a a − a a ) x = b2 a11 − b1 a21
| 11 22 {z 12 21} 2
d

Man sieht leicht, daß das Gleichungssystem genau dann für jede Wahl von ~b = (b1 , b2 )t
lösbar ist und folglich den vollen Rang r = 2 besitzt, wenn d 6= 0 ist. Man setzt daher
für 2 × 2–Matrix A:
   
a11 a12 a11 a12
f = det = a11 a22 − a12 a21
a21 a22 a21 a22
Diese Definition der Determinanten soll nun auf Mn,n (IR) für beliebiges n ∈ IN verallge-
meinert werden. Anschließend wird gezeigt, daß die Determinante die eingangs genann-
ten Eigenschaften besitzt und wie man mit der Determinante rechnet bzw. umgeht.

Auch hier erweist es sich wieder als vorteilhaft, eine n×n–Matrix in Spaltenschreibweise
darzustellen:
A = (~a1 , . . . , ~an ) mit Spaltenvektoren ~ai ∈ IRn für i = 1, . . . , n
und die Determinante als Funktion der n Spaltenvektoren aufzufassen:
f (A) = det A = det(~a1 , . . . , ~an )
Die weitere Vorgehensweise besteht darin, daß wir zunächst einige rechnerische Eigen-
schaften, die die Determinante besitzen soll, aufführen. Diese Eigenschaften werden sich
zum einen später als nützlich erweisen, zum anderen legen sie – wie wir sehen werden –
die Definition der Determinanten eindeutig fest.
Die zu fordernden Eigenschaften sind:
1. Für die Determinante der Einheitsmatrix ist
det E = 1

2. Multipliziert man eine der Spalten ~aj mit einem reellen Faktor, so kann man diesen
Faktor aus der Determinanten herausziehen:
Für λ ∈ IR und 1 ≤ j ≤ n gilt:
det(~a1 , . . . , λ · ~aj , . . . , ~an ) = λ · det(~a1 , . . . , ~aj , . . . , ~an )

114
3. Ist eine der Spalten eine Summe, so kann man die Addition aus der Determinanten

herausziehen“: Hat die j-te Spalte die Gestalt ~aj = ~uj + ~vj , so gilt

det(~a1 , . . . ~uj + ~vj , . . . , ~an ) =


det(~a1 , . . . ~uj , . . . , ~an ) + det(~a1 , . . . ~vj , . . . , ~an )

4. Sind zwei Spalten der Matrix gleich, so ist der Wert ihrer Determinanten Null;
steht etwa die j-te Spalte auch an der i-ten Stelle mit i 6= j, so hat man:

det(~a1 , . . . , ~aj , . . . , ~aj , . . . , ~an ) = 0


|{z}
i-te Stelle

5. Vertauscht man zwei Spalten, so ändert der Wert der Determinanten sein Vorzei-
chen: für i 6= j ist

det(~a1 , . . . , ~aj , . . . , ~ai , . . . , ~an ) = − det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an )

Bemerkungen:
• Die erste Eigenschaft ist die sogenannte Normierung.

• Eigenschaft 2) und 3) zusammen werden als Linearität in den Spalten bezeichnet.


Aus Eigenschaft zwei folgt insbesondere für einen reellen Faktor λ, der bei allen n
Spalten steht:

det(λ · ~a1 , . . . , λ · ~aj , . . . , λ · ~an ) = λn · det(~a1 , . . . , ~aj , . . . , ~an )

• Man kann zeigen, daß die beiden Eigenschaften 4) und 5) äquivalent sind; man
bezeichnet sie als Alternierend in den Spalten.

Es folgt aus den fünf Eigenschaften sofort, daß eine Matrix A, von deren Spalten eine
nur Nullen enthält, die Determinante Null besitzt: Gilt etwa für die j-te Spalte ~aj = ~0,
so ändert sich nichts, wenn man diese mit 0 multipliziert: 0 ·~aj = ~0 = ~aj , und man kann
schließen:

det A = det(~a1 , . . . , ~aj , . . . , ~an )


= det(~a1 , . . . , 0 · ~aj , . . . , ~an )
= 0 · det(~a1 , . . . , ~aj , . . . , ~an )
= 0 · det A = 0

Hierbei wurde verwendet, daß man den Faktor 0 nach Eigenschaft 2) herausziehen kann.
Aus den Eigenschaften 2), 3) und 4) folgt gemeinsam die wichtige Regel, daß sich der
Wert der Determinanten nicht ändert, wenn man von einer Spalte das Vielfache einer
anderen abzieht; es gilt nämlich für i 6= j

det(~a1 , . . . , ~ai − λ~aj , . . . , ~aj , . . . , ~an )


= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an ) + det(~a1 , . . . , −λ~aj , . . . , ~aj , . . . , ~an )
(2.57)
= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an ) − λ det(~a1 , . . . , ~aj , . . . , ~aj , . . . , ~an )
= det(~a1 , . . . , ~ai , . . . , ~aj , . . . , ~an )

115
Hier wurde als erstes die Determinante nach Eigenschaft 3) auseinandergezogen; an-
schließend wurde mit Eigenschaft 2) der Faktor −λ aus dem zweiten Summanden her-
ausgezogen; in der letzten Zeile hat die zweite Determinante wegen der doppelt vorkom-
menden Spalte ~aj nach Eigenschaft 4) den Wert Null.

Wir zeigen jetzt, daß man aus den geforderten Eigenschaften (auf Seite 114) eine Berech-
nungsvorschrift für den Wert der Determinanten einer beliebigen n × n–Matrix herleiten
kann. Wir gehen dazu schrittweise vor, beginnen im ersten Schritt mit der Determinanten
der Einheitsmatrix und erhalten nach mehreren Verallgemeinerungsschritten schließlich
eine Darstellung der Determinanten einer allgemeinen Matrix.

Im 1. Schritt stellen wir fest, daß durch die Normierungsbedingung die Determinante
der Einheitsmatrix festgelegt ist:
det E = 1
Im 2. Schritt betrachten wir solche Matrizen, deren Spalten Einheitsvektoren sind, d. h. die
in jeder Spalte jeweils genau eine Eins enthalten:

A = (~ε1 , ~ε2 , . . . , ~εn )

dabei ist ~εi ∈ {~e1 , . . . , ~en } für i = 1, . . . , n

Sind unter den ~ε1 , . . . , ~εn zwei gleich, so besitzt A zwei gleiche Spalten, und nach Eigen-
schaft 4) auf Seite 114 ist det A = 0. Sind dagegen alle ~εi voneinander verschieden, so
handelt es sich bei ihnen um eine Vertauschung der Einheitsvektoren ~e1 , . . . , ~en , d. h. die
Matrix A ist aus der Einheitsmatrix durch Spaltenvertauschung hervorgegangen. Da
nach Eigenschaft 5) eine Vertauschung zweier Spalten zu einem Vorzeichenwechsel bei
der Determinanten führt, muß det A = ± det E = ±1 sein. Das Vorzeichen hängt hier
von der Anzahl der paarweisen Vertauschungen ab. Genauer gilt:


 0 falls zwei der ~ε1 , . . . , ~εn gleich sind





+1 falls die ~ε1 , . . . , ~εn durch eine ge-




rade Anzahl paarweiser Vertau-




schungen aus ~e1 , . . . , ~en entstan-

det(~ε1 , ~ε2 , . . . , ~εn ) = (2.58)

 den sind

 −1 falls die ~ε1 , . . . , ~εn durch eine un-






 gerade Anzahl paarweiser Vertau-
schungen aus ~e1 , . . . , ~en entstan-




den sind

Ab jetzt betrachten wir bereits eine allgemeine n × n–Matrix


 
a11 . . . a1n
A = (~a1 , . . . , ~an ) =  ... .. 

. 
an1 . . . ann

und versuchen, deren Determinante auf Determinanten vom eben im 2. Schritt behan-
delten Typ zurückzuführen.

116
Im 3. Schritt nehmen wir uns der ersten Spalte ~a1 von A an. Wir zerlegen diese in eine
Summe aus Vielfachen der Einheitsvektoren:
       
a11 1 0 0
 a21   0   1   0 
~a1 =  ..  = a11  ..  + a21  ..  + . . . + an1  .. 
       
 .   .   .   . 
an1 0 0 1
n
X
= ai1 · ~ei (2.59)
i=1

und setzen diese Summe für ~a1 in det(~a1 , . . . , ~an ) ein:

det A = det(~a1 , ~a2 , . . . , ~an )


n
!
X
= det ai1 · ~ei , ~a2 , . . . , ~an
i=1

Ist eine Spalte eine Summe, so kann nach Eigenschaft 3) auf Seite 114 die Summenbil-
dung aus der Determinanten herausgezogen werden; damit erhält man20 :
n
X
det A = det(ai1 · ~ei , ~a2 , . . . , ~an )
i=1

Hier ist jeder Summand eine Determinante, deren erste Spalte jeweils den Faktor ai1
enthält; nach Eigenschaft 2) kann dieser jeweils vor die Determinante gezogen werden:
n
X
det A = ai1 det(~ei , ~a2 , . . . , ~an ) (2.60)
i=1

Die hier erscheinenden Determinanten haben jeweils in der ersten Spalte genau eine
Eins und sonst Nullen und besitzen damit schon etwas Ähnlichkeit“ mit den bei 2.58

behandelten Determinanten.
Im 4. Schritt wird auf dieselbe Art die zweite Spalte zerlegt:
n
X
~a2 = aj2 · ~ej
j=1

Dieses in 2.60 eingesetzt liefert eine Doppelsumme:


n
X n
X
det A = ai1 det(~ei , aj2 · ~ej , ~a3 , . . . , ~an )
i=1 j=1

n X
X n
= ai1 aj2 det(~ei , ~ej , ~a3 , . . . , ~an ) (2.61)
i=1 j=1

20
Bei einer mehrfachen Addition muß streng genommen die Eigenschaft 3) entsprechend mehrfach
angewandt werden.

117
In den weiteren Schritten werden die restlichen Spalten zerlegt. Führt man dieses zunächst
als Beispiel für n = 5 durch, so erhält man
n X
X n X
n X
n X
n
det A = ai1 aj2 ak3 al4 am5 det(~ei , ~ej , ~ek , ~el , ~em )
i=1 j=1 k=1 l=1 m=1

Will man dieses für ein allgemeines n ∈ IN durchführen, so tritt aber ein Problem hin-
sichtlich der Schreibweise auf: Für jede der n Spalte benötigt man in der entstehenden
Mehrfachsumme einen eigenen Index. Bei großen Werten für n reicht für deren Bezeich-
nung kein Alphabet aus. Deshalb verschafft man sich n Indizes, indem den Index i selber
indiziert; das liefert die Indizes
i1 , i2 . . . , in
Verwendet man diese Indizes in der Summe 2.61, so wird diese zu
n X
X n
det A = ai1 1 ai2 2 det(~ei1 , ~ei2 , ~a3 , . . . , ~an )
i1 =1 i2 =1

Im letzten Schritt nach Zerlegung aller Spalten gelangt man bei Verwendung dieser
Indexschreibweise zu der Darstellung
n X
X n n
X
det A = ... ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1 i2 =1 in =1

Gewöhnlich stellt man diese n-fache Summe durch ein einziges Summenzeichen dar:
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.62)
i1 =1,i2 =1,...,in =1

Die in den einzelnen Summanden erscheinenden Faktoren det(~ei1 , ~ei2 , . . . , ~ein ) sind De-
terminanten, die in jeder Spalte jeweils genau eine Eins und sonst Nullen besitzen. Die
Werte solcher Determinanten sind durch 2.58 bestimmt. Durch den Ausdruck 2.62 ist
somit der Wert der Determinanten der Matrix A festgelegt.
Bemerkenswert ist, daß die Darstellung der Determinanten 2.62 in Verbindung mit 2.58
allein aus den geforderten Eigenschaften 2.3.1 auf Seite 2.3.1 gefolgert werden konnte.

Bevor die Summe in 2.62 noch etwas genauer betrachtet wird, folgt als Beispiel die
Determinante einer 2 × 2–Matrix:
        
1 2 1 0 2
det = det 1 · +3· ,
3 4 0 1 4
   
1 2 0 2
= 1 · det + 3 · det
0 4 1 4
   
1 1 1 0
= 1 · 2 · det + 1 · 4 · det
0 0 0 1
| {z } | {z }
=0 =1
   
0 1 0 0
+ 3 · 2 · det + 3 · 4 · det
1 0 1 1
| {z } | {z }
=−1 =0

= 4 − 3 · 2 = −2

118
Führt man diese Rechnung für eine allgemeine 2 × 2–Matrix durch, so erhält man die
Formel  
a b
det = ad − bc
c d

Wir betrachten noch einmal die Darstellung 2.62:


n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1

und bemerken dazu:

• In jedem Summanden erscheint aus jeder Spalte genau ein Eintrag.

• Ein Summand ist höchstens dann von Null verschieden, wenn die zugehörigen
Werte der Indizes i1 , . . . , in alle paarweise verschieden sind. Andernfalls wären in
dem Faktor det(~ei1 , ~ei2 , . . . , ~ein ) zwei gleiche Spalten vorhanden und er wäre damit
wegen 2.58 gleich Null. Hieraus folgt insbesondere:

– Die Summe besitzt höchstens n! von Null verschiedene Summanden.


– In jedem von Null verschiedenen Summanden erscheint auch aus jeder Zeile
genau ein Eintrag.

• Die Determinante läßt sich durch die Rechenoperationen Addition, Subtraktion


und Multiplikation berechnen; eine Division wird nicht benötigt. Die Determinante
ist daher für alle n × n–Matrizen definiert.

• Zur praktischen Berechnung der Determinanten wird die obige Darstellung nur bei
2 × 2–Matrizen verwendet. Für n × n–Matrizen mit n ≥ 2 sind zur Determinan-
tenberechnung geeignetere Verfahren vorhanden (siehe später).

Nachdem wir bisher die Determinante über ihre Grundeigenschaften (siehe Seite 114)
und ihre Darstellung 2.62 eingeführt haben, wollen wir nun

• einige wichtige Formeln und Gleichungen im Zusammenhang mit der Determinan-


ten herleiten,

• zwei weitere Möglichkeiten zum Berechnen der Determinanten kennenlernen und

• verstehen, aus welchem Grund genau dann det A 6= 0 ist, wenn A umkehrbar ist.

2.3.2 Determinante der Produktmatrix und der Transponier-


ten

Eingangs wurde von den guten rechnerischen Eigenschaften der Determinanten gespro-
chen; eine sehr bedeutsame davon ist die Verträglichkeit“ der Determinanten mit dem

Matrizenprodukt, beschrieben durch den folgenden

119
Satz: Für zwei Matrizen A, B ∈ Mn,n (IR) gilt

det(A ◦ B) = det A · det B (2.63)

Beweis: Der Beweis verläuft ganz ähnlich wie die Herleitung der Gleichung 2.62.
Als erstes nehmen wir an, daß die Matrix B nur aus Einheitsvektoren besteht. In ge-
ringfügiger Abänderung der Schreibweise auf Seite 116 schreiben wir hier B in der Form

B = (~ei1 , ~ei2 , . . . , ~ein )

Dabei nimmt jeder der Indizes i1 , . . . , in einen Wert zwischen 1 und n (einschl. ) an.
Besitzen zwei dieser Indizes denselben Wert, so sind zwei Spalten von B gleich, und es
ist in diesem Fall
det B = 0
Andererseits sind in diesem Fall auch zwei Spalten der Produktmatrix A ◦ B gleich:
Schreibt man das Produkt A ◦ B in Spaltenform (siehe 2.45 auf Seite 99), so lautet es

A ◦ B = A ◦ (~ei1 , ~ei2 , . . . , ~ein )


= (A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein )
= (~ai1 , ~ai2 , . . . , ~ain ) (2.64)

Dazu wurde A = (~a1 , . . . , ~an ) gesetzt und Gleichung 2.54 auf Seite 111 verwendet. Haben
zwei der Indizes denselben Werte, so erscheint auf der rechten Seite der letzten Gleichung
2.64 eine Spalte zweimal; unter Verwendung Eigenschaft 4) auf Seite 114 erhält man nun

det(A ◦ B) = 0
= det A · 0
= det A · det B denn det B = 0

Im nächsten Schritt nehmen wir wieder eine Matrix B der Gestalt B = (~ei1 , . . . , ~ein ),
setzen jetzt aber voraus, daß alle Spalten voneinander verschieden sind, bzw. daß alle
Werte der Indizes i1 , . . . , in paarweise verschieden sind. Dann ist nach Gleichung 2.58

det B = (−1)s (2.65)

mit
s = Anzahl der paarweisen Vertauschungen zur Überführung
von (~ei1 , . . . , ~ein ) nach (~e1 , . . . , ~en )
= Anzahl der paarweisen Vertauschungen zur Überführung (2.66)
der Indexwerte (i1 , i2 . . . , in ) in die sortierte Reihenfolge
1, 2, . . . , n

Die Zahl s aus Gleichung 2.66 ist auch die Anzahl der paarweisen Vertauschungen, die
man benötigt, um (~ai1 , ~ai2 , . . . , ~ain ) in (~a1 , ~a2 , . . . , ~an ) zu überführen Mit Grundeigen-
schaft 5) (siehe Seite 114) und der obigen Gleichung 2.64 folgt dann

det(A ◦ B) = det(~ai1 , ~ai2 , . . . , ~ain )


= (−1)s · det(~a1 , ~a2 , . . . , ~an )
= (−1)s det A

120
Verwendet man hier Gleichung 2.65, indem man det B für (−1)s einsetzt, so erhält man
für diesen Spezialfall von B die gewünschte Gleichung

det(A ◦ B) = det B · det A = det A · det B

Ab jetzt sei B eine allgemeine n × n–Matrix


 
b11 . . . b1n
B = (~b1 , . . . , ~bn ) =  ... .. 

. 
bn1 . . . bnn

Wie schon bei der Herleitung von 2.62 zerlegen wir die Spalten von B (siehe dazu 2.59
auf Seite 117):
n
X
~bj = bij · ~ei für j = 1, . . . , n
i=1

Multipliziert man beide Seiten dieser Gleichung von links mit A, so erhält man für
j = 1, . . . , n:
n
!
X
A ◦ ~bj = A ◦ bij · ~ei Nach 2.46 kann man den Faktor A in
i=1 die Summe bis vor die ~ei hineinziehen. (2.67)
n
X
= bij · (A ◦ ~ei )
i=1

Dieses setzen wir jetzt in die Gleichung

det(A ◦ B) = det(A ◦ ~b1 , A ◦ ~b2 , . . . , A ◦ ~bn )

für jedes ~bj ein und verwenden für jede Spalte den eigenen Index ij :
n n n
!
X X X
det(A ◦ B) = det bi1 1 · (A ◦ ~ei1 ), bi2 2 · (A ◦ ~ei2 ), . . . , bin n · (A ◦ ~ein ) (2.68)
i1 =1 i2 =1 in =1

Ziehen wir jetzt in Gleichung 2.68 alle Summenzeichen und alle Faktoren bij j aus der
Determinanten heraus, so erhalten wir
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det(A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein ) (2.69)
i1 =1,i2 =1,...,in =1

Die in dieser Gleichung erscheinenden Determinantenfaktoren lassen sich weiter umfor-


men:

det(A ◦ ~ei1 , A ◦ ~ei2 , . . . , A ◦ ~ein ) = det(A ◦ (~ei1 , ~ei2 , . . . , ~ein ))

Die Matrix (~ei1 , ~ei2 , . . . , ~ein ) besteht aus Einheitsvektoren und ist damit vom Typ der
im ersten Teil des Beweises behandelten Matrizen. Nach dem schon gezeigten ist daher

det(A ◦ (~ei1 , ~ei2 , . . . , ~ein )) = det A · det(~ei1 , ~ei2 , . . . , ~ein ))

121
Faßt man die beiden letzten Gleichungen zusammen und setzt sie in Gleichung 2.69 ein,
so erhält man
n
X
det(A ◦ B) = bi1 1 bi2 2 . . . bin n det A · det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1

Den Faktor det A kann man aus der Mehrfachsumme herausziehen:


n
!
X
det(A ◦ B) = det A · bi1 1 bi2 2 . . . bin n det(~ei1 , ~ei2 , . . . , ~ein ) (2.70)
i1 =1,i2 =1,...,in =1

Vergleicht man die Mehrfachsumme auf der rechten Seite von Gleichung 2.70 mit Glei-
chung 2.62, so bemerkt man, daß diese genau die Determinante von B ist. Damit ist in
der Tat
det(A ◦ B) = det A · det B
qed.
Folgerung: Ist A ∈ Mn,n (IR) umkehrbar, so ist det A 6= 0 und det A−1 = (det A)−1 .
Beweis: Ist A ∈ Mn,n (IR) umkehrbar, so existiert die inverse Matrix A−1 , und mit 2.63
gilt
det A · det A−1 = det(A ◦ A−1 ) = det E = 1
Ist ein Produkt von Null verschieden, so müssen alle Faktoren von Null verschieden
sein. Teilt man beide Seiten dieser Gleichung durch det A, so ergibt sich die zweite
Behauptung. qed.
Später wird noch hergeleitet, daß ebenso aus det A 6= 0 die Umkehrbarkeit von A folgt.

Satz Die Determinante einer Matrix ist gleich der Determinanten ihrer Transponierten:
det At = det A
Beweis:21 Sei
   
a11 . . . a1n α11 . . . α1n
A =  ... ..  und At =  ... .. 
 
.  . 
an1 . . . ann αn1 . . . αnn
Dabei ist dann
αji = aij (2.71)
Wir formen jetzt die Darstellung von det A so um, daß daraus eine Darstellung von
det At entsteht. Nach 2.62 ist zunächst
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein ) (2.72)
i1 =1,i2 =1,...,in =1

Es reicht, in dieser Summe nur diejenigen Summanden zu betrachten, bei denen die
Indizes i1 , . . . , in paarweise verschiedene Werte annehmen (siehe Seite 119). In einem
solchen Summanden nehmen wir das Produkt der Einträge
ai1 1 ai2 2 . . . ain n
21
Die Kenntnis dieses Beweises ist für das Weitere nicht zwingend erforderlich.

122
und ordnen diese Faktoren nach den Werten ihrer Indizes, das Ergebnis davon ist

a1j1 a2j2 . . . anjn

Dabei ist j1 , . . . , jn die entstehende Anordnung der zweiten Indizes. Sei s die Anzahl
der paarweisen Vertauschungen, die die erste Anordnung der Faktoren in die zweite
überführt. Wie man leicht sieht, ist dann s auch die Anzahl der paarweisen Vertauschun-
gen, die sowohl i1 , i2 , . . . , in in 1, 2, . . . , n als auch j1 , j2 , . . . , jn in 1, 2, . . . , n überführt.
Wegen Gleichung 2.58 ist dann insbesondere

det(~ei1 , ~ei2 , . . . , ~ein ) = det(~ej1 , ~ej2 , . . . , ~ejn )

Diese Gleichung und die neue Anordnung der Faktoren aij j setzt man in Gleichung 2.72
ein und verwendet, daß die Werte der Indizes j1 , j2 , . . . , jn die einzelnen Summanden
ebenso festlegen, wie die Indizes i1 , i2 , . . . , in . Man kann daher genauso gut über die
j1 , j2 , . . . , jn summieren. Damit wird Gleichung 2.72 zu
n
X
det A = a1j1 a2j2 . . . anjn det(~ej1 , ~ej2 , . . . , ~ejn ) (2.73)
j1 =1,j2 =1,...,jn =1

Setzt man hier für die ajij noch die Koeffizienten αij j von At ein (siehe Gleichung 2.71),
so folgt schließlich
n
X
det A = αj1 1 αj2 2 . . . αjn j det(~ej1 , ~ej2 , . . . , ~ejn ) = det At
j1 =1,j2 =1,...,jn =1

qed.

Der letzte Satz besitzt eine Folgerung, die bei der Berechnung von Determinanten nütz-
lich ist. Da nämlich durch das Transponieren Spalten in Zeilen und Zeilen in Spalten
übergehen, gelten wegen det A = det At die sich auf Spalten beziehenden Eigenschaften
auf Seite 114 und auch die Regel 2.57 ebenso für Spalten:
Folgerung: Für die Zeilen einer Determinanten gilt:

• Enthält eine Zeile einen reellen Faktor, so kann dieser vor die Determinante gezogen
werden.

• Ist eine Zeile eine Summe, so kann die Addition aus der Determinanten herausge-
zogen werden:

~at1
   t   t 
~a1 ~a1
.
..  . .  .. 
 .   . 
 
 
det  ~ui + ~vi  = det  ~ui  + det  ~vit 
 t t   t   
 ..   . 
 .. 
 . 
 .. 
 . 
t t
~an ~an ~atn

• Sind zwei Zeilen gleich, so ist der Wert der Determinanten Null.

• Bei Vertauschung zweier Zeilen wechselt die Determinante ihr Vorzeichen.

123
• Zieht man einer Zeile das Vielfache einer anderen ab, so ändert sich die Determi-
nante nicht, d. h. für i ≥ j:
~at1
   t 
~a1
..  .. 
.  . 
 
 
 t
 ~ai − λ · ~atj 
 t 
 ~ai 

.  = det  ... 
   
det 
 .
.    (2.74)
t t 
~aj  ~aj 
  
 
.  . 
..  .. 
 
 
~an t
~atn

2.3.3 Berechnung der Determinanten

Selbstverständlich könnte man die Determinante mit Hilfe der Darstellung 2.62 berech-
nen. Es gibt aber Methoden zur Berechnung der Determinanten, die dem aus praktischen
Gründen und hinsichtlich des Rechenaufwandes vorzuziehen sind. Zwei Methoden sollen
hier vorgestellt werden: die eine beruht auf dem Gaußschen Eliminationsverfahren (siehe
Seite 71), die andere ist der sogenannte Entwicklungssatz. Beide haben als Grundlage
den folgenden

Satz: Sei A ∈ Mn,n (IR) eine Matrix, die in der ersten Spalte ab dem zweiten Eintrag nur
Nullen enthält. Eine solche Matrix A hat die Gestalt
 
a11 a12 . . . a1n
 0 
A =  ..
 

 . A1 
0

mit der (n − 1) × (n − 1)-Matrix


 
a22 . . . a2n
A1 =  ... .. 

. 
an2 . . . ann
Dann gilt für die Determinante von A:
det A = a11 · det A1
Beweis: Wir beginnen wieder mit der Darstellung 2.62:
n
X
det A = ai1 1 ai2 2 . . . ain n det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1

Da nach Voraussetzung ai1 1 = 0 für i1 ≥ 2 ist, kann man die Summanden mit i1 ≥ 2
weglassen:
n
X
det A = a11 ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein )
i2 =1,...,in =1

124
Den Faktor a11 zieht man vor die Summe. In der Summe hat ein Summand den Wert
Null, wenn mindestens einer der Indizes i2 , . . . , in den Wert 1 hat; in diesem Fall kommt
in dem Determinantenfaktor det(~e1 , ~ei2 , . . . , ~ein ) an mindestens zwei Stellen die Spalte
~e1 vor, und er ist damit Null. Man kann daher weiter schreiben, indem man den Bereich
der Indizes bei 2 beginnen läßt
n
X
det A = a11 · ai2 2 . . . ain n det(~e1 , ~ei2 , . . . , ~ein ) (2.75)
i2 =2,...,in =2

Nun müssen noch die Determinantenfaktoren det(~e1 , ~ei2 , . . . , ~ein ) vereinfacht werden. Da
~e1 an seiner ursprünglichen, nämlich der ersten Stelle steht, kommt es für den Wert dieser
Determinanten nur auf die ~ei2 , . . . , ~ein an; man kann daher setzen

det(~e1 , ~ei2 , . . . , ~ein ) = det(~ei2 , . . . , ~ein )

Hierbei werden die ursprünglich n-dimensionalen Einheitsvektoren ~ei2 , . . . , ~ein als (n−1)-
dimensionale Einheitsvektoren aufgefaßt, indem ihre ersten Komponenten gestrichen
werden. Das ist ohne Probleme möglich, da wegen i2 , . . . , in ≥ 2 diese Komponenten
ohnehin den Wert Null haben. Schreibt man so Gleichung 2.75 noch einmal auf:
n
X
det A = a11 · ai2 2 . . . ain n det(~ei2 , . . . , ~ein )
i2 =2,...,in =2

so erkennt man, daß die darin erhaltene Summe genau die Determinante der Matrix A1
ist. Damit ist die Behauptung det A = a11 · det A1 gezeigt. qed.

Eine erste Folgerung dieses Satzes gibt an, wie von Matrizen eines wichtigen Typs leicht
die Determinante berechnet werden kann:
Satz: Sei A eine obere Dreiecksmatrix:
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
A =  ..
 
.. . . .. 
 . . . . 
0 0 . . . ann

Eine obere Dreiecksmatrix ist eine Matrix, die unterhalb der Hauptdiagonalen nur Nullen
besitzt. Für eine solche Matrix A gilt:

det A = a11 · a22 · · · ann

det A ist gerade das Produkt der Diagonalelemente.


Beweis: Der Beweis erfolgt durch vollständige Induktion über die Spaltenzahl n der
Matrix.
Für n = 1 ist die Behauptung klar; dann besteht die Matrix nur aus dem Eintrag a11
und es ist det A = a11 .

125
Ist die Behauptung für n − 1 bewiesen, so kann man den Satz von eben anwenden:
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
det A = det  ..
 
.. . . .. 
 . . . . 
0 0 . . . ann
 
a22 . . . a2n
= a11 · det  ... . . . ... 
 
0 . . . ann

Die rechts stehende Matrix ist wieder eine obere Dreiecksmatrix, ihre Spaltenzahl beträgt
n − 1. Nach Induktionsvoraussetzung besitzt sie daher die Determinante a22 · a33 · · · ann .
Setzt man dieses oben ein, so folgt die Behauptung. qed.

Folgerung: Sei A eine untere Dreiecksmatrix:


 
a11 0 ... 0
 a21 a22 ... 0 
A = 
 
.. .. ... .. 
 . . . 
an1 an2 . . . ann

Für eine solche Matrix gilt ebenfalls:

det A = a11 · a22 · · · ann

Beweis: Früher wurde det A = det At gezeigt (siehe Seite 122). Da die Transponierte von
A eine obere Dreiecksmatrix ist, kann man die Folgerung von eben verwenden, und es
gilt
det A = det At = a11 · a22 · · · ann
qed.

Es soll jetzt gezeigt werden, wie mit dem Gaußschen Eliminationsverfahren (siehe Sei-
te 71) auf eine sehr effektive Art und Weise die Determinante berechnet werden kann.
Die Verwendung des Gaußschen Verfahrens bietet sich an, da zwei der bei diesem Verfah-
ren anzuwendenden Zeilenoperationen den Wert der Determinanten unverändert lassen
bzw. nur zu einem Vorzeichenwechsel führen (siehe dazu Seite 123 und Gleichung 2.74):

• Zieht man von einer Zeile das Vielfache einer anderen ab, so ändert sich die De-
terminante nicht.

• Vertauscht man zwei Zeilen, so wechselt das Vorzeichen der Determinanten.

Wir wenden jetzt auf die Matrix


 
a11 . . . a1n
A =  ... .. 

. 
an1 . . . ann

126
das Gaußsche Verfahren an, verzichten jetzt hier jedoch auf die sonst üblichen Normie-
rungsschritte und schreiben die so erhaltene reduzierte Form von A in der Fassung
 
α11 α12 . . . α1n
 0 α22 . . . α2n 
à =  .. (2.76)
 
.. ... .. 
 . . . 
0 0 . . . αnn

Abweichend zu sonst sind die Stufen der reduzierten Form durch einen von Null ver-
schiedenen Eintrag gekennzeichnet, der aber nicht notwendigerweise gleich eins ist. Hat
die Matrix den vollen Rang r = n, so verlaufen die Stufen genau auf der Diagonalen, und
es ist αii 6= 0 für i = 1, . . . , n. Ist hingegen rgA < n, so verlaufen einige Stufen oberhalb
der Hauptdiagonalen, es kommt zu mindestens einer Nullgleichung (bzw. Nullzeile), und
es ist zumindest αnn = 0.
Auf alle Fälle können wir in den beiden Fällen rgA = n und rgA < n die reduzierte Form
à von A wie in 2.76 schreiben. Da zu ihrer Herstellung auf die Normierung verzichtet
und nur die beiden oben genannten Operationen verwendet wurden, ist det A = ± det Ã.
Die reduzierte Form ist eine obere Dreiecksmatrix. Somit bietet sich jetzt zur Berechnung
von det A der Satz auf Seite 125 an:
 
α11 α12 . . . α1n
 0 α22 . . . α2n 
det A = ± det  ..
 
.. . . ..  (2.77)
 . . . . 
0 0 . . . αnn
= ±α11 · α22 · · · αnn
A besitzt – wie oben begründet – bis auf das Vorzeichen dieselbe Determinante wie
seine reduzierte Form. Die reduzierte Form ist eine Dreiecksmatrix, daher ist ist ihre
Determinante gleich dem Produkt ihrer Diagonalelemente. Das Vorzeichen hängt davon
ab, ob zur Herstellung der reduzierten Form eine gerade oder eine ungerade Anzahl von
Zeilenvertauschungen notwendig waren.

Bevor wir uns in einem Beispiel diese Möglichkeit zur Determinantenberechnung genauer
anschauen, bemerken wir, daß wir mit Hilfe der reduzierten Form einer Matrix den
wichtigsten Satz über Matrizen herleiten können:
Satz: Eine n × n–Matrix ist genau dann umkehrbar, wenn ihre Determinante ungleich
Null ist.
Beweis: Die Bezeichnungen von eben werden verwendet:
A ist umkehrbar ⇔ Der Rang von A beträgt n.
⇔ Die Stufen in der reduzierten Form verlaufen auf der
Hauptdiagonalen (siehe 2.76).
⇔ αii 6= 0 für i = 1, . . . , n
⇔ det A = ±α11 · α22 · · · αnn 6= 0 (siehe 2.77)
qed.

Beispiel: Wir wollen mit dem Gaußschen Verfahren die Determinante der 3 × 3–Matrix
 
0 2 7
A =  1 2 3 
2 0 1

127
berechnen:
 
0 2 7
det 1 2 3
  Die ersten beiden Zeilen
2 0 1 vertauschen.
 
1 2 3
= − det 0 2
 7  Das Zweifache der ersten
2 0 1 Gleichung von der letzten
abziehen.
 
1 2 3
= − det  0 2 7  Das Zweifache der zweiten
0 −4 −5 Gleichung zu der letzten
hinzuzählen.
 
1 2 3
= − det  0 2 7  Jetzt kann das Produkt
0 0 9 der Diagonalelemente ge-
nommen werden.

= −1 · 2 · 9 = −18

Wir kommen jetzt zum Entwicklungssatz. Dieser stellt eine weitere Methode zum Be-
rechnen einer Determinanten dar und ist eine Verallgemeinerung des Satzes auf Seite
124. Dort wurde eine Determinante behandelt, die in der ersten Spalte ab dem zweiten
Eintrag nur Nullen enthält. Wir nehmen jetzt den ersten Verallgemeinerungsschritt vor,
indem wir die Determinante einer n × n–Matrix A berechnen, die in irgendeiner Spalte
nur höchstens ein von Null verschiedenes Element besitzt, und dieses Element muß nicht
notwendigerweise an der ersten Stelle stehen; A besitzt dann die Gestalt

i-Spalte

 
a11 ... 0 ... a1n
 .. .. .. 
 . . . 
 aj−1,1

... 0 ... aj−1,n 
 (2.78)
A =  aj1 . . . aji . . . ajn  ← j-te Zeile
 
 aj+1,1 ... 0 ... aj+1,n 
 
 . .. .. 
 .. . . 
an1 ... 0 ... ann

A besitzt in ihrer i-ten Spalte nur ein von Null verschiedenes Element, und dieses steht
dort an der j-ten Stelle. Die Matrix A soll durch Zeilen- und Spaltenvertauschung in
eine Matrix wie die auf Seite 124 verwandelt werden. Dazu wird zunächst das Element
aji in die erste Zeile gebracht, in dem die j-te Zeile mit der (j − 1)-ten Zeile, danach
mit der (j − 2)-ten und schließlich mit der 1-ten Zeile vertauscht wird. Durch insgesamt
j − 1 Zeilenvertauschungen wandert“ so die ursprüngliche j-te Zeile an die erste Stelle.

128
Dieses liefert wegen der j − 1 Vorzeichenwechsel der Determinanten
 
aj1 . . . aji . . . ajn
 a11 . . . 0 ... a1n 
 . .. .. 
 .
 . . .


j−1
det A = (−1) det  aj−1,1 . . . 0 . . . aj−1,n
 

 aj+1,1 . . . 0 . . . aj+1,n
 

 . .. ..
 ..

. . 
an1 . . . 0 ... ann
Nun soll die i-te Spalte an die erste Stelle gebracht werden, dazu wird sie, indem man
entsprechend wie vorher bei der j-ten Zeile verfährt, i − 1 Mal mit ihrer jeweiligen
vorangehenden Spalte vertauscht. Durch diese i − 1 paarweisen Vertauschungen erhält
man
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
 0 a11 . . . a1,i−1 a1,i+1 . . . a1n 
 . .. .. .. .. 
 .
 . . . . . 

det A = (−1)j−1 (−1)i−1 det  0 aj−1,1 . . . aj−1,i−1 aj−1,i+1 . . . aj−1,n 
 
 0 aj+1,1 . . . aj+1,i−1 aj+1,i+1 . . . aj+1,n 
 
 . .. .. .. .. 
 .. . . . . 
0 an1 . . . an,i−1 an,i+1 . . . ann
Diese Determinante hat genau die Form wie diejenige im Satz auf Seite 124. Sie soll
ebenfalls mit Hilfe einer (n − 1) × (n − 1)-Matrix dargestellt werden; dazu definieren wir
Definition: Sei eine n × n–Matrix. Dann setzt man für 1 ≤ i, j ≤ n
Aij :die (n−1)×(n−1)-Matrix, die entsteht, wenn
man bei der n × n–MatrixA die i-te Spalte
(2.79)
und die j-te Zeile22 streicht.
Uij = det Aij
Mit dieser Definition gilt aufgrund des Satzes auf Seite 124:
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
j+i
 0 
det A = (−1) det 
 
.. 
 . Aij 
0

= (−1)j+i aji det Aij


= (−1)j+i aji Uij (2.80)

Nun kommen wir zu einer allgemeinen n × n–Matrix A und wählen von dieser die i-te
Spalte fest aus. Die i-te Spalte hat nicht notwendigerweise nur eine von Null verschiedene
Komponente, aber sie besitzt eine Summenzerlegung in Spalten, bei der jeweils alle bis
eine Komponente gleich Null sind:
     
  a1i 0 0
a1i  0   a2i   0  n
 ..  X
~aj =  .  =  ..  +  ..  + . . . +  ..  = aji~ej
     
 .   .   .  j=1
ani
0 0 ani

129
Jetzt kann man wieder Eigenschaft 3) auf Seite 114 anwenden und bei der Berechnung
von det A die Summe in der i-ten Spalte vorziehen:
n
X
det A = det(~a1 , . . . , aji~ej , . . . , ~an )
j=1
n
X
= det(~a1 , . . . , aji~ej , . . . , ~an )
j=1

Schreibt man diese Determinante ausführlich hin und verwendet man die Bezeichnungen
aus 2.79, so kann man schließlich Gleichung 2.80 verwenden:
 
a11 . . . 0 . . . a1n
 .. .. .. 
 . . . 
 aj−1,1 . . . 0 . . . aj−1,n 
n
 
X
det A = det  aj1 . . . aji . . . ajn 
 
 aj+1,1 . . . 0 . . . aj+1,n 
 
j=1
 . .. .. 
 .. . . 
an1 . . . 0 . . . ann
 
aji aj1 . . . aj,i−1 aj,i+1 . . . ajn
n
X  0 
= (−1)j+i det 
 
.. 
j=1
 . Aij 
0
n
X
= (−1)j+i aji det Aij
j=1
n
X
= (−1)j+i aji Uij
j=1

Damit haben wir den Entwicklungssatz hergeleitet, seine genaue Formulierung lautet:
Satz: (Entwicklungssatz ) Sei A eine n × n–Matrix. Dann gilt mit den Bezeichnungen aus
2.79:
• Entwicklung nach der i-ten Spalte:
n
X
det A = (−1)j+i aji Uij (2.81)
j=1

• Entwicklung nach der j-ten Zeile:


n
X
det A = (−1)j+i aji Uij (2.82)
i=1

Zum Beweis: Die Entwicklung nach einer Spalte haben wir bereits hergeleitet. Die Ent-
wicklung nach einer Zeile führt man auf die Spaltenentwicklung zurück, indem man
det At = det A verwendet. qed.

130
Durch den Entwicklungssatz wird die Berechnung einer n-reihigen Determinanten auf
die Berechnung der (n − 1) reihigen Unterdeterminanten Uij zurückgeführt. Auf die Uij
läßt sich den wieder der Entwicklungssatz anwenden, bis man bei 2 × 2–Determinanten
angekommen ist, die man direkt berechnen kann.

Beispiel: Die folgende Determinante wird mit dem Entwicklungssatz berechnet. Da die
zweite Spalte eine Null enthält, wird nach dieser entwickelt:
 
3 1 2
det  7 0 2 
1 2 0      
7 2 3 2 3 2
= −1 · det + 0 · det − 2 · det
1 0 1 0 7 2
= −1 · (7 · 0 − 2 · 1) + 0 − 2 · (3 · 2 − 7 · 2)
= 18

Zum Abschluß dieses Abschnitts folgen einige Bemerkungen zu den Verfahren zur De-
terminantenberechnung:
Entwicklungssatz: Der Nachteil besteht darin, daß ungefähr n! Multiplikationen not-
wendig sind. Man nimmt den Entwicklungssatz nur bei kleinen Dimensionen (bis
Dimension 3) oder bei Determinanten, die sehr viele Nullen enthalten. Man ent-
wickelt dann stets nach der Zeile oder Spalte, die die meisten Nullen enthält.
Gaußsches Verfahren: Diese Methode bietet sich immer an. Da die Anzahl der not-
wendigen Multiplikationen – wie man zeigen kann – von der Größenordnung n2
ist, ist für größere n das Gaußsche Verfahren von erheblich geringerem Aufwand
als der Entwicklungssatz.
Mitunter empfiehlt sich auch eine Verbindung von Entwicklungssatz und Gauß-
schem Verfahren: Enthält bei größerem n eine Zeile oder eine Spalte viele Nullen,
so entwickelt man zunächst nach dieser Spalte bzw. Zeile und wendet dann das
Gaußsche Verfahren auf die Unterdeterminanten Uij an.
Sarrus-Regel: Für 3 × 3-Matrizen gibt es noch ein Verfahren, das zwar bezüglich der
Multiplikationen noch etwas aufwendiger als der Entwicklungssatz ist, das aber
wegen seines leicht zu merkenden Schemas oft genommen wird. Man schreibt dazu
die ersten beiden Spalten der Determinanten noch einmal hinter die dritte Spalte
und bildet die Summe bzw. Differenz aus den Produkten, die aus drei auf einer
Schrägen liegenden Einträgen bestehen:
+ + +
a11 a12 a13 a11 a12
a21 a22 a23 a21 a22
a31 a32 a33 a31 a32
− − −

damit ist det A = + a11 a22 a33 + a12 a23 a31 + a13 a21 a32
− a31 a22 a13 − a32 a23 a11 − a33 a21 a12

131
2.3.4 Die adjungierte Matrix

Gegeben sei wieder eine n × n–Matrix und dazu die (n − 1) × (n − 1)-Untermatrizen


Aij und Unterdeterminanten Uij wie in 2.79 auf Seite 129. Dann ist die sogenannte
adjungierte Matrix zu A definiert durch:

à = ((−1)i+j Uij ) i, j = 1, . . . , n


 
+U11 −U12 . . . (−1)n+1 U1n
 −U21 +U22 . . . (−1)n+2 U2n 
= 
 
.. .. .. 
 . . . 
n+1 n+2 n+n
(−1) Un1 (−1) Un2 . . . (−1) Unn

Die adjungierte Matrix erfüllt eine bemerkenswerte Beziehung:


Satz: Es gilt
 
det A 0 ... 0
 0 det A . . . 0 
à ◦ A = (det A) · E =  ..
 
. .. .. 
 . . 
0 ... 0 det A

Beweis: Wir rechnen die Gleichung einfach nach, indem wir die Matrizenmultiplikation
spaltenweise ausführen. Sei dazu A = (~a1 , . . . , ~an ); dann ist die i-te Spalte von à ◦ A
gerade à ◦ ~ai (siehe 2.45 auf Seite 99). Dieses Produkt rechnen wir aus, indem wir die
Definition von à einsetzen:
 n 
X
1+j
 (−1) U1j aji 
 j=1 
..
 
.
 
 
 X n 
i+j
 

 (−1) Uij aji  
 j=1 

à ◦ ~ai =  .
..


 
 X n 
k+j
(−1) Ukj aji 
 

 
 j=1 

 .
..


 n 
 X 
 (−1)n+j U a 
nj ji
j=1

Wir betrachten hiervon zunächst die i-Komponente, d. h. die Komponente zu demselben


Indexwert wie die Spalte ~ai ; der Wert dieser Komponente ist
n
X
(−1)i+j Uij aji
j=1

Vergleicht man dieses mit Gleichung 2.81, so stellt man fest, daß dieser Ausdruck ge-
nau die Determinante von A, entwickelt nach der i-ten Spalte, ist. Der Wert der i-ten
Komponente ist demnach gerade det A.

132
Nun betrachten wir eine k-te Komponente mit k 6= i. Der Wert einer solchen Kompo-
nente ist n
X
(−1)k+j Ukj aji
j=1

Vergleicht man dieses ebenfalls mit der Spaltenentwicklung (Gleichung 2.81), so erkennt
man hier, daß dieser Ausdruck gerade die Entwicklung der folgenden Determinanten
nach der k-ten Spalte ist:
 
a11 . . . a1i . . . a1,k−1 a1i a1,k+1 . . . a1i
 a21 . . . a2i . . . a2,k−1 a2i a2,k+1 . . . a2i 
det  ..
 
.. .. .. .. .. 
 . . . . . . 
an1 . . . ani . . . an,k−1 ani an,k+1 . . . ani

= det(~a1 , . . . , ~ai , . . . , ~ak−1 , ~ai , ~ak+1 , . . . , ~an )

Dieses ist die Determinante der Matrix, die entsteht, wenn man in der Matrix A an die
Stelle der k-ten Spalte ~ak noch einmal die i-te Spalte ~ai schreibt. Diese Determinante
besitzt dann den Wert Null, da ja nach Konstruktion ihre i-te und k-te Spalte beide
gleich ~ai sind. Damit besitzt auch die obige Summe den Wert Null; da die Summe gleich
der k-ten Komponente von à ◦ ~ai ist, hat auch diese den Wert Null. Insgesamt hat man
damit für i-te Spalte von à ◦ A für i = 1, . . . , n:
 
0
 .. 
 . 
 0 
 
à ◦ ~ai =  det A  ← i-te Stelle
 
 0 
 
 . 
 .. 
0

= (det A) · ~ei

Daraus folgt dann schließlich

à ◦ A = à ◦ (~a1 , ~a2 . . . , ~an )


= (Ã ◦ ~a1 , Ã ◦ ~a2 , . . . , Ã ◦ ~an )
= ((det A) · ~e1 , (det A) · ~e2 , . . . , (det A) · ~en )
= (det A) · (~e1 , ~e2 , . . . , ~en )
= (det A) · E

qed.

Hieraus ergibt sich eine zweite Herleitung einer Aussage, die wir bereits mit dem Gauß-
schen Satz bewiesen hatten, so wie eine weitere Möglichkeit zur Berechnung der Inversen
einer Matrix:
Folgerung: Sei det A 6= 0, dann ist A umkehrbar, und es gilt
1
A−1 = · Ã (2.83)
det A
133
Diese Art der Berechnung der Inversen empfiehlt sich nur bei 2 × 2-Matrizen; dort ist
sie allerdings recht nützlich, wie das folgende Beispiel zeigt:
Sei  
1 2
A =
9 7
Dann ist    
U11 −U12 7 −2
à = =
−U21 U22 −9 1
Damit ist dann
−7 2
 
 
1 −1 7 −2 11 11 
A−1 = · Ã = · = 
det A 11 −9 1 9 −1
11 11
Aus Gleichung 2.83 folgt insbesondere, daß bei der Berechnung der Inversen einer Matrix
die Teilung durch die Determinanten der einzige notwendige Divisionsschritt ist.

Die Gleichung 2.83 liefert weiterhin eine Lösungsformel für ein quadratisches lineares
Gleichungssystem A ◦ ~x = ~b mit vollem Rang. Geht man hier von dem Lösungsansatz
1
~x = · Ã ◦ ~b
det A
aus, so erhält man die sogenannte Cramersche Regel .

2.4 Der Begriff des Eigenwertes

In diesem Abschnitt werden wir wieder ausschließlich quadratische Matrizen

A ∈ Mn,n (IR)

betrachten. Ist ein Vektor ~x ∈ IRn gegeben, so ist das Produkt A◦~x ebenfalls ein Vektor
aus dem IRn :
   
x1 y1
~x =  ...  ∈ IRn ⇒ ~y =  ...  = A ◦ ~x ∈ IRn
   
xn yn

In der Regel hat der Vektor ~y mit dem Vektor ~x nicht mehr viel gemeinsam, er “sieht“
völlig anders aus. Interessant ist daher der Spezialfall, daß der eine der beiden Vektoren
ein Vielfaches des anderen ist. Dieses führt auf den Begriff des Eigenwertes.

Definition: Gegeben sei eine quadratische Matrix A ∈ Mn,n (IR). Eine Zahl λ ∈ IR heißt
Eigenwert der Matrix A, wenn es einen Vektor ~u ∈ IRn mit ~u 6= 0 gibt, so daß gilt

A ◦ ~u = λ · ~u (2.84)

Der Vektor ~u heißt Eigenvektor zum Eigenwert λ.

134
Die Eigenwertgleichung 2.84 besagt, daß bei dem Eigenvektor ~u die aufwendigere Mul-
tiplikation mit der Matrix A das gleiche bewirkt, wie die einfachere komponentenweise
Multiplikation mit der reellen Zahl λ.
Man beachte, daß für einen Eigenvektor gefordert wird, daß er nicht gleich dem Null-
vektor ist. (Frage: warum?)

Beispiel: Ist die 2 × 2–Matrix


 
929 −425
A =
2035 −931

gegeben, so rechnet man leicht nach, daß ~u = (5, 11)t ein Eigenvektor von A ist:
   
929 −425 5
A ◦ ~u = ◦
2035 −931 11
   
−30 5
= = −6 · = −6 · ~u
−66 11

Also ist ~u Eigenvektor von A zum Eigenwert λ = −6. Kein Eigenvektor von A ist etwa
~v = (1, 1)t :    
1 504
A ◦ ~v = A ◦ =
1 1104
Offensichtlich gibt es kein λ ∈ IR mit A ◦ ~v = λ~v .

Es ist aussichtslos, durch “Raten“ einen Eigenvektor zu finden. Bevor wir uns anschauen,
wie man gezielt einen Eigenvektor berechnet, soll festgestellt werden, daß die Vielfachen
eines Eigenvektors ebenfalls Eigenvektoren sind:

Satz: Die Matrix A ∈ Mn,n (IR) besitze den Eigenwert λ mit dem Eigenvektor ~u. Dann
ist für jedes c ∈ IR mit c 6= 0 auch der Vektor

c · ~u

ein Eigenvektor von A zum Eigenwert λ.


Beweis: Man rechnet nach, daß auch für ~v = c · ~u die Gleichung 2.84 erfüllt ist:

A ◦ (c · ~u) = c · A ◦ ~u nach dem Satz auf Seite 100


= c · λ · ~u da ~u Eigenvektor zu λ ist
= λ · (c · ~u)

qed.

Eigenwerte und Eigenvektoren besitzen bei vielen Problemstellungen eine große Bedeu-
tung; einen kleinen Eindruck davon soll das folgende Beispiel liefern:
Zur Beschreibung der zeitlichen Entwicklung der Altersverteilung in einer Bevölkerung
teilt man die Bevölkerung in drei Gruppen ein und stellt die Größen dieser drei Gruppen
durch einen Vektor dar:
 
x1 = Anzahl der jüngeren Leute
~x  x 2
 = Anzahl der Leute mittleren Alters
x3 = Anzahl der Rentner

135
Die Verteilung verändert sich mit der Zeit, nach einem Jahr hat man neue Anzahlen
~y = (y1 , y2 , y3 ).
Es werde nun angenommen, daß man aus Erfahrung weiß, daß sich die neuen Zahlen
auf folgendem Wege aus den alten Zahlen berechnen lassen:

Junge 80 x + 20 x + 1 x
= y1 = 100 1 100 2 100 3
19 x + 85 x
Mittlere = y2 = 100 1 100 2
1 x + 15 x + 70 x
Rentner = y3 = 100 1 100 2 100 3
Die erste Gleichung besagt, daß 80% der Jungen auch nach einem Jahr noch zu den
Jungen zählen und daß 20% der Leute mittleren Alters sowie auch 1% der Rentner sich
einmal vermehren und deren Nachwuchs zu der Gruppe der Jungen hinzukommt. Inhalt
der zweiten Gleichung ist, daß 19% der Jungen erwachsen geworden sind und zu der
mittleren Gruppe hinzukommen und daß 85% der Leute mittleren Alters auch noch
nach einem Jahr zu dieser Gruppe gehören. Entsprechend läßt sich die dritte Gleichung
deuten23
Wie man leicht erkennt, lassen sich die drei obigen Gleichungen als Produkt einer Matrix
mit einem Vektor schreiben: Setzt man
80 20 1
 
 100 100 100 
 19 85 
A =   100 100 0 
 
1 15 70
100 100 100
so erhält man für die Bevölkerungsverteilung nach einem Jahr
~y = A ◦ ~x
Entsprechend erhält man für die Verteilung nach zwei Jahren, indem man diese Glei-
chung auf ~y anwendet:
A ◦ ~y = A ◦ (A ◦ ~x) = A2 ◦ ~x
Ebenso erhält man die Verteilung nach n Jahren aus An ◦ ~x.
Eine Frage, die in diesem Zusammenhang von Interesse ist, lautet: gibt es eine stabile
Bevölkerungsverteilung. Eine Bevölkerungsverteilung gilt als stabil, wenn die Größen-
verhältnisse zwischen den drei Gruppen unverändert bleiben:
x1 y1 x3 y3
= und =
x2 y2 x2 y2
y1 y2 y3
⇔ = =
x1 x2 x3
Setzt man
y1
λ =
x1
so lautet die letzte Doppelgleichung in Vektorschreibweise
   
y1 λx1
~y =  y2  =  λx2  = λ · ~x ⇔ ~y = A ◦ ~x = λ · ~x
y3 λx3
23
Es sei noch einmal darauf hingewiesen, daß es sich hier um angenommene Beispielwerte handelt!

136
Mit anderen Worten: die stabile Bevölkerungsverteilung wird durch einen Eigenvektor
der Übergangsmatrix A beschrieben.

Wie findet man einen Eigenwert mit zugehörigem Eigenvektor? Diese Frage ist das
sogenannte

Eigenwertproblem: Zu einer gegebenen Matrix A ∈ Mn,n (IR) sucht man


• einen Eigenwert λ ∈ IR
• und einen dazugehörigen Eigenvektor ~u ∈ IRn \ {0}.
D. h. die Gleichung
A ◦ ~x = t · ~x (2.85)
mit unbekanntem t ∈ IR und unbekanntem ~x ∈ IRn ist unter der Nebenbedingung
~x 6= 0 zu lösen.

Die Schwierigkeit der Gleichung 2.85 besteht darin, daß auf ihrer rechten Seite das
Produkt der Unbekannten t und ~x steht, sie ist damit nicht mehr linear. Man formt daher
die Gleichung 2.85 so um, daß eine Gleichung entsteht, in der nur noch die Unbestimmte
t erscheint. Mit Hilfe dieser Gleichung bestimmt man dann zunächst einen Wert für t.
Im ersten Schritt formt man 2.85 so um, daß auch auf der rechten Seite ein Produkt aus
einer Matrix mit einem Vektor steht; man verwendet dazu das t-fache der Einheitsma-
trix:    
1 0 ··· 0 t 0 ··· 0
 0 1 ··· 0   0 t ··· 0 
t · E = t ·  .. .. . . ..  =  .. .. . . .. 
   
 . . . .   . . . . 
0 0 ··· 1 0 0 ··· t
Verwendet man weiter E ◦ ~x = ~x, so erhält man
A ◦ ~x = t · ~x = t · (E ◦ ~x) = (t · E) ◦ ~x
Jetzt faßt man alle Ausdrücke, in denen die Unbestimmte ~x erscheint, zusammen:
A ◦ ~x = (t · E) ◦ ~x (auf beiden Seiten (t · E) ◦ ~x abziehen)

⇔ A ◦ ~x − (t · E) ◦ ~x = 0 (~x ausklammen, siehe dazu Seite 100)

⇔ (A − t · E) ◦ ~x = 0
Dabei hängt die Matrix
 
a11 − t a12 ··· a1n
 a21 a22 − t · · · a2n 
A−t·E = 
 
.. .. .. .. 
 . . . . 
an1 an2 ··· ann − t
vom Wert der Unbestimmten t ab.
Nimmt man jetzt für einen Moment an, man habe bereits einen Lösungswert für t
gefunden, so bestimmt man dazu einen Wert für ~x = (x1 , . . . , xn ), indem mit diesem t
die Gleichung
(A − t · E) ◦ ~x = 0 (2.86)

137
Diese Gleichung ist ein homogenes lineares Gleichungssystem. Die im Eigenwertproblem
genannte Nebenbedingung lautet ~x 6= 0. Das homogene Gleichungssystem muß daher
so beschaffen sein, daß es eine von Null verschiedene Lösung besitzt. Folglich muß der
Wert der Unbestimmten t so gewählt werden, daß gilt:

corg(A − t · E) > 0
⇔ rg(A − t · E) < n
⇔ (A − t · E) ist nicht invertierbar
⇔ det(A − t · E) = 0 (siehe den Satz auf Seite 127)

Hier kommt also die Determinante ins Spiel. Hergeleitet haben wir den
Satz: λ ∈ IR ist genau dann Eigenwert der Matrix A ∈ Mn,n (IR), wenn λ Nullstelle der
Funktion
f (t) = det(A − t · E)
ist, d. h. wenn gilt

f (λ) = det(A − λ · E) = 0 (2.87)

Einen zu λ gehörigen Eigenvektor erhält man als von Null verschiedene Lösung des
homogenen Gleichungssystems

det(A − λ · E) · ~x = 0

Als nächstes soll die Funktion f (t) = det(A − t · E) genauer untersucht werden; zuvor
erhält sie einen Namen:
Definition: Die Funktion
f (t) = det(A − t · E)
heißt charakteristisches Polynom der Matrix A ∈ Mn,n (IR).

Den Namen “Polynom“ rechtfertigt der folgende


Satz: Sei A ∈ Mn,n (IR), dann ist die Funktion

f (t) = det(A − t · E) (2.88)

ein Polynom n-ten Grades mit höchstem Koeffizienten

(−1)n (2.89)

und konstantem Glied det A.


Beweis: Um die Matrix A − t · E in die Formel für die Determinante (2.62) einsetzen
zu können, müssen deren Koeffizienten angegeben werden. Die Einheitsmatrix E wird
dazu in der Form
 
δ11 . . . δ1n 
 .. .
..  1 für i = j
E =  . mit δij =

0 für i 6= j
δn1 . . . δnn

138
geschrieben. Dann ist
   
a11 . . . a1n tδ11 . . . tδ1n
A − t · E =  ... ..  −  .. .. 

.   . . 
an1 . . . ann tδn1 . . . tδnn
 
a11 − tδ11 . . . a1n − tδ1n
= 
 .. .. 
. . 
an1 − tδn1 . . . ann − tδnn

Setzt man dieses in die Formel der Determinanten (siehe 2.62 auf Seite 118) ein, so wird
dieses zu

f (t) = det(A − t · E) (2.90)


Xn
= (ai1 1 − tδi1 1 )(ai2 2 − tδi2 2 ) . . . (ain n − tδin n ) det(~ei1 , ~ei2 , . . . , ~ein )
i1 =1,i2 =1,...,in =1

Dieser Ausdruck soll genauer betrachtet werden:

Jeder Summand in 2.90 ist ein Produkt

• aus Konstanten, dabei handelt es sich um Koeffizienten von A

• und aus höchstens n Linearfaktoren der Gestalt

(aii − tδii )

Ein Produkt aus Linarfaktoren ist ein Polynom; summiert man endlich viele Ausdrücke
dieser Art auf, so erhält man wieder ein Polynom.
Damit ist gezeigt: f (t) = det(A−t·E) ist ein Polynom, und der Name charakteristisches
Polynom ist gerechtfertigt.
Das Glied mit der höchsten Potenz von t erhält man, indem man den Summanden mit
den meisten Linearfaktoren betrachtet; dieser ist genau

(a11 − t) · (a22 − t) · · · (ann − t)

Ausmultiplizieren dieses Ausdrucks liefert einen Ausdruck der Gestalt

(−t)n + Glieder niederer Ordnung

Alle anderen Summanden besitzen weniger als n − 1 Linearfaktoren. Ausmultipliziert


ergeben sie daher nur Glieder niederer Ordnung. Man erhält daher insgesamt für f (t) =
det(A − t · E) die Gestalt

f (t) = (−1)n · tn + Glieder niederer Ordnung (2.91)

Der Grad des Polynoms f (t) beträgt somit n, der höchste Koeffizient ist (−1)n .
Das konstante Glied von f (t) erhält man durch Einsetzen der Null:

a0 = f (0) = det(A − 0 · E) = det A

139
qed.

Als sehr wichtige Folgerung ergibt sich


Folgerung: Eine n × n–MatrixA ∈ Mn,n (IR) besitzt höchstens n verschiedene Eigenwerte.
Beweis: Jeder Eigenwert von A ist Nullstelle von f (t) = det(A − t · E). Als Polynom
n-ten Grades besitzt f (t) höchstens n Nullstellen. qed.

Zusammenfassend kann man feststellen, daß die Lösung des Eigenwertproblems in zwei
Schritten verläuft:

1. Man bestimmt die Nullstellen des charakteristischen Polynoms und erhält damit
die Eigenwerte der Matrix.

2. Man berechnet zu einem Eigenwert λ einen Eigenvektor, indem man eine von
Null verschiedene Lösung des homogenen linearen Gleichungssystems (A − λE) ◦ ~x
bestimmt.

Beispiel: Alle Eigenwerte der Matrix (siehe Seite 135)


 
929 −425
A =
2035 −931

sind gesucht. Das charakteristische Polynom von A lautet


 
929−t −425
det(A − t · E) = det
2035 −931−t

= (929 − t) · (−931 − t) + 425 · 2035


= t2 − (929 − 931) · t − 929 · 931 + 425 · 2035
= t2 + 2t − 24

Die beiden Lösungen λ1 = −6 und λ2 = 4 der quadratischen Gleichung

t2 + 2t − 24 = 0

sind die beiden Eigenwerte von A. Ein Eigenvektor zu λ1 = −6 wurde bereits auf Seite
135 angegeben. Einen Eigenvektor zu λ2 = 4 erhält man durch Lösen des homogenen
Gleichungssystems
 
929−4 −425
(A − 4 · E) ◦ ~x = ◦ ~x = 0
2035 −931−4

Eine mit dem Gaußschen Verfahren reduzierte Form der Koeffizientenmatrix liefert
!
17
1 − 37
◦ ~x = 0
0 0

Eine von Null verschiedene Lösung hiervon ist ~u2 = (17, 37)t . Der gefundene Vektor ~u2
ist ein Eigenvektor zu Eigenwert λ2 = 4.

140
Beispiel: Gesucht sind alle Eigenvektoren der 3 × 3–Matrix
 
18 137 −15
A =  0 −5 0 
20 116 −17
Das charakteristische Polynom von A stellt man am besten durch Enwickeln nach der
zweiten Zeile auf (siehe 2.82 auf Seite 130):
 
18−t 137 −15
det(A − t · E) = det  0 −5−t 0 
20 116 −17−t

= (−5 − t) · ((18 − t)(−17 − t) + 300)


= (−5 − t) · (t2 − t − 6)
= −t3 − 4t2 + 11t + 30
Die drei Nullstellen dieses Polynoms ergeben sich sofort aus der vorletzten Darstellung:
Neben 5 sind es die beiden Nullstellen −2 und 3 des quadratischen Faktors. Die drei
Eigenwerte der Matrix A lauten somit
λ1 = −5, λ2 = −2 und λ3 = 3
Zu λ2 = −2 soll noch ein Eigenvektor bestimmt werden; zu lösen ist das homogene
Gleichungssystem
 
18−(−2) 137 −15
 0 −5−(−2) 0  ◦ ~x = 0
20 116 −17−(−2)
 
20 137 −15
⇔  0 −3 0  ◦ ~x = 0
20 116 −15
Eine mit dem Gaußschen Verfahren reduzierte Form der Koeffizientenmatrix ist
1 137 3 

20 − 4
 1 0 
0
Als eine Lösung hiervon und damit als Eigenvektor zu λ2 = −2 erhält man
 
3/4
~u2 =  0 
1

Beispiel: Wir kommen auf das Beispiel zur Bevölkerungsentwicklung auf Seite 135 zurück.
Das charakteristische Polynom der dort verwendeten Übergangsmatrix
 80 20 1 
 100 100 100 
 19 85 
A =   100 100 0 

 
1 15 70
100 100 100
141
lautet
47 2 17969 281
f (t) = − t3 + t − t+
20 10000 625
Man findet folgende Eigenwerte und Eigenvektoren:

λ1 = 0.64 ~u1 = (−1.105, 1.0, −2.316)t


λ2 = 1.024 ~u2 = ( 0.915, 1.0, 0.491)t
λ3 = 0.686 ~u3 = (−0.863, 1.0,−10.176)t

Da der aus den Bevölkerungszahlen gebildete Vektor nur positive Komponenten enthal-
ten kann, kommt als Eigenvektor, der eine stabile Bevölkerungsentwicklung beschreibt,
nur ~u2 in Frage. Um realistische Größenordnungen zu erhalten, wird ~u mit c = 30000000
multipliziert (siehe dazu den Satz auf Seite 135). Eine mögliche stabile Bevölkerungs-
verteilung wäre damit  
27460000
~x =  30000000 
14740000

142
Kapitel 3

Elemente der diskreten Mathematik

3.1 Ein Schlüsselaustauschverfahren als einleitendes


Beispiel
In den bisher in dieser Vorlesung behandelten Themen spielten die reellen Zahlen die
wesentliche Rolle und werden auch in späteren Abschnitten dieser Vorlesung und in den
nachfolgenden Vorlesungen von Bedeutung sein. Gerade bei Anwendungen mathemati-
scher Verfahren in Naturwissenschaft und Technik kommen reelle Zahlen vor; Meßwerte
sind in der Regel reelle Größen.
Jetzt sollen endliche Mengen oder zumindest abzählbar unendliche, diskrete Mengen
im Mittelpunkt der Betrachtung stehen. Ein Beispiel für eine solche Menge stellen die
ganzen Zahlen ZZ dar, deren Elemente auf der Zahlengeraden den Mindestabstand eins
besitzen. Zur Untersuchung und Behandlung der Mengen dieser Art sind oft andere
Methoden als beim Umgange mit den reellen Zahlen erforderlich. Solche Methoden lie-
fert die diskrete Mathematik . Die diskrete Mathematik umfaßt mehrere Teilgebiete; zu
nennen sind etwas Kombinatorik, Graphentheorie, diskrete Geometrie, diskrete Optimie-
rung, Algebra und Zahlentheorie. Ihre Bedeutung hat in den letzten Jahrzehnten stark
zugenommen, da mit dem Aufkommen der digitalen Rechner zahlreiche Anwendungs-
bereiche der diskreten Mathematik entstanden sind. Beispiele dafür finden sich u. a. bei
der Automatentheorie, der Algorithmenentwicklung sowie der Codierungstheorie.
Zur Einführung in diskrete Mathematik sollen hier einige Themen sowie grundlegen-
de Begriffe aus den Bereichen Algebra und Zahlentheorie behandelt werden. Aus deren
Anwendungsbereichen ist insbesondere die Kryptologie (Lehre von der Ver- und Ent-
schlüsselung von Nachrichten) zu nennen.

Als einleitendes Beispiel soll hier ein typisches Problem aus der Kryptologie erörtert
werden. In der Kryptologie besteht die Aufgabe, eine Nachricht auf eine solche Wei-
se in eine neue Form (den Schlüsseltext“) zu überführen ( zu verschlüsseln“), daß sie
” ”
von unbefugter Seite weder gelesen noch unbemerkt verändert werden kann und an-
schließend wieder in den ursprünglichen Klartext zurücktransformiert werden kann. Das
Grundprinzip der Verschlüsselung zeigt das folgende Bild:

143
Klartext Schlüssel (optional)
- Verschlüsselung 
(encryption)
plain text key

Übertragung des Schlüsseltextes


(cipher text)

?
ursprünglicher
Klartext Schlüssel (optional)
 Entschlüsselung 
(decryption)
plain text key

Üblich sind die folgenden Bezeichnungen:

M : die Nachricht bzw. der Klartext (plain text), in der Regel eine Zeichenkette über
einem Alphabet Σ, z. B.

Σ = {a, b, c, . . . , z} #Σ = 26
oder: Σ = {0, 1} #Σ = 2

Damit ist dann

M ∈ Σ∗ = {x1 x2 . . . xn | n ∈ IN0 , xi ∈ Σ}

C : die verschlüsselte Nachricht, d. h. der Schlüsseltext (cipher text, cryptogram)

k : der Schlüssel (key)

Ein Verschlüsselungsverfahren liefert nun

eine Verschlüsselungsfunktion (encryption) e( , ), die einer Nachricht M in Ver-


bindung mit einem Schlüssel k einen Schlüsseltext C zuordnet:
e
(M, k) −→ C
bzw. C = e(M, k)

eine Entschlüsselungsfunktion (decryption) d( , ), die einem Schlüsseltext C in


Verbindung mit dem Schlüssel k wieder den Klartext M zuordnet:
d
(C, k) −→ M
bzw. M = d(C, k)

144
Insbesondere muß beim Entschlüsseln mit dem korrekten Schlüssel wieder ursprüngliche
Klartext entstehen. Zusammenfassend muß somit gelten:

C = e(M, k)
=⇒ d(e(M, k), k) = M
M = d(C, k)

Es ist auch möglich, daß zum Ver- und Entschlüsseln unterschiedliche Schlüssel ver-
wendet werden. Viele übliche Verfahren arbeiten jedoch, wie hier angegeben, mit einem
einzigen Schlüssel. Man spricht daher von symmetrischen Verfahren.
Andere gängige Bezeichnungen für “(Verschlüsselungs-)Verfahren“ sind “Chiffre“ oder
“Code“.

Beispiel: Caesar-Verfahren
Dieses Verfahren wurde angeblich bereits von Julius Caesar eingesetzt. Es bietet nur
geringe Sicherheit; man erkennt an ihm aber sehr gut die Funktionsweise eines symme-
trischen Verfahrens.1
Man nimmt die übliche natürliche Zuordnung vor:

{A, B, . . . , Z} ←→ {0, 1, . . . , 25}


A ↔ 0, B ↔ 1, . . . Z ↔ 25

Schlüssel : Man wählt einen Buchstaben

k ∈ {A, B, . . . , Z}
bzw. k ∈ {0, 1, . . . , 25}

Verschlüsselung eines einzelnen Klartextbuchstabens m:

c = e(m, k) = m + k mod 26

Entschlüsselung eines einzelnen Buchstabens c des Schlüsseltextes:

m = d(c, k) = c − k mod 26
= c + (26 − k) mod 26

Beispiel zur Caesar-Chiffre:


Wähle als Schlüssel k = X bzw. k = 23. Die Verschlüsselung des Beispieltextes erfolgt
durch buchstabenweise Addition mod 26:

G U T E N T A G =
ˆ 6 20 19 4 13 19 0 6
X X X X X X X X 23 23 23 23 23 23 23 23
3 17 16 1 10 16 23 3
=
ˆ
D R Q B K Q X D

1
Hier wird erstmalig die modulo-Funtion verwendet: Für a, b ∈ Z, a 6= 0 bezeichnet “a mod b“
den kleinsten nichtnegativen Divisionsrest, der bei Teilung von a durch b entsteht. In den Program-
moersprachen C, Java usw. steht dafür der Operator % ur Verfügung.

145
Die Entschlüsselung erfolgt mit 26 − k = 26 − 23 = 3=D:
ˆ

D R Q B K Q X D =
ˆ 3 17 16 1 10 16 23 3
D D D D D D D D 3 3 3 3 3 3 3 3
6 20 19 4 13 19 0 6
=
ˆ
G U T E N T A G

Eine grundlegende Voraussetzung zum Einsatz dieses oder eines heute gebräuchlichen
symmetrischen Verfahrens (wie z. B. 3DES oder AES) besteht darin, daß die beiden
Kommunikationspartner A und B sich über einen gemeinsamen Schlüssel k verständigt
haben, der nur ihnen bekannt ist und ansonsten geheim bleibt. Es bietet sich an, daß
einer der beiden Partner einen geeigneten Schlüssel zufällig erzeugt und diesem dann
dem anderen Partner mitteilt. Aber dabei tritt folgendes Problem auf:
Wie überträgt man einen Schlüssel sicher von A nach B?
'$ '$

A - B
&% &%

?
Feind
Beispiele:
• Beim Einbruch in die vom deutschen Militär im zweiten Weltkrieg verwendeten
Verschlüsselungsmaschine, der sogenannten Enigma“ wurde wesentlich der zu Be-

ginn einer Übertragung stattfindende Schlüsselaustausch ausgenutzt.
• Beim Heißen Draht zwischen Moskau und Washington (verschlüsselt mit dem
sogenannten Vernam-Verfahren) wird der Schlüssel für jede Sitzung unter Einsatz
großer Sicherheitsmaßnahmen getrennt mit dem Flugzeug übertragen.
Man vermutete sehr lange, daß das Problem des Schlüsselaustauschs nicht lösbar wäre.
Aber im Jahr 1976 wurde das Diffie-Hellman-Verfahren zum Schlüsselaustausch
veröffentlicht. Dessen Idee soll im Folgenden beschrieben werden. Man beachte dabei
aber, daß die folgende Beschreibung noch kein verwendungsfähiges Verfahren liefert; es
soll zunächst nur die grundsätzliche Idee deutlich werden. Weitere Ergänzungen folgen
später.
Man geht von der Idee der Einwegfunktion aus: Eine Einwegfunktion ist eine Funktion
y = f(n)
deren Wert y für ein gegebenes n leicht und schnell zu berechnen ist. Umkehrt soll
es aber praktisch unmöglich sein, bei gegebenem y ein n mit f(n) = y zu ermittelt.
Insbesondere sollte es kein systematisches Verfahren zum Bestimmen von n geben. Eine
Suche nach dem passenden Werte von n durch probeweises Einsetzen aller möglichen in
Frage kommender Werte für n sollte an zu großem Aufwand scheitern.2
2
Eine Einwegfunktion besitzt Ähnlichkeit mit einem Briefkasten: Jeder kann einen Brief einwerfen;
man kann ihn aber nur entnehmen, wenn man über den passenden Schlüssel verfügt.

146
Beim Diffie-Hellman-Verfahren definiert man als Einwegfunktion mit einem vorgegebe-
nen a ∈ IR , a > 1 die Funktion:

y = f(n) = an für n ∈ IN (Potenzieren)


(3.1)
g(y) = n (Logarithmieren)

Zur Berechnung des Wertes der Funktion f(n) muß eine Potenz berechnet werden, was
mit Sicherheit verhältnismäßig einfach und schnell durchgeführt werden kann. Zur Be-
rechnung der Umkehrfunktion g(y) muß hingegen logarithmiert werden; die Berechnung
des Logarithmus kann auf alle Fälle als deutlich schwieriger als das Potenzieren bezeich-
net werden.
Angenommen, f(n) wäre aufgrund dieser Eigenschaften in der Tat eine Einwegfunktion,
so kann damit folgendes Schlüsselaustauschverfahren beschrieben werden:

1. Als Schlüssel dienen möglichst lange natürliche Zahlen.

2. Die Basis a > 1 wird veröffentlicht.

3. Die Partner A und B denken sich jeder einen geheimen Wert aus:

A: n ∈ IN
B: m ∈ IN

4. A berechnet
y1 = an
und sendet y1 unverschlüsselt an B. Entsprechend berechnet B

y2 = am

und sendet y2 unverschlüsselt an A.

5. A berechnet
y = y2n = (am )n = an·m
B berechnet
y = y1m = (an )m = an·m

6. y ist der gemeinsame Sitzungsschlüssel. y ist geheim, d. h. nur A und B bekannt.

7. (Zusatz ) y ist eine natürliche Zahl und kann folgendermaßen zum Austausch einer
verschlüsselten Nachricht benutzt werden:

(a) A stellt den Nachrichtentext M als als natürliche Zahl dar.


(b) A berechnet
C = M ·y
(c) A versendet C.
(d) B empfängt C.
(e) B berechnet
M = C · y −1

147
Man beachte, daß hierbei der Schlüssel y nur den beiden Partnern A und B be-
kannt ist. Es handelt sich hier um das Verfahren von El Gamal zum Nachrichten-
austausch.

Dieses als Diffie-Hellman-Verfahren bezeichnete Verfahren zum Schlüsselaustausch soll


im einzelnen besprochen werden.
Entscheidend ist die Einwegfunktion

f(n) = an

Deren erstes Merkmal besteht darin, daß die Potenz an auch für sehr große n ∈ IN
(etwa n > 10100 ) sehr schnell berechnet werden kann. Natürlich kann dieses nicht durch
eine Schleife mit einzelnen Multiplikationen erfolgen. Man verwendet statt dessen einen
schnellen, auf dem Prinzip Teile und herrsche beruhenden Algorithmus, dessen Idee
lautet:

0
setze n = 2 · q + r mit q ∈ IN und r =
1
n 2q+r q 2 r
⇒ a = a = (a ) · a
⇒ Im wesentlichen ist nur noch aq zu berechnen; der
Exponent wurde halbiert.
Dieser Idee folgt folgendes rekursives Verfahren zum Potenzieren:

pot(a,n)
if(n==0) return 1
r = n%2
q = n/2 // Ganzzahldivision
y = pot(a,q)
y = y * y
if(r==1) y = y * a
return y

Wie man leicht zeigen kann, beträgt der Aufwand dieses Verfahrens ungefähr

2 · ld (n) Multiplikationsschritte. (3.2)

Für n = 10100 wären das nur circa 666 Multiplikationen.


Zusammenfassend kann festgestellt werden, daß die Verschlüsselung leicht ist; die erste
Bedingung, die an eine Einwegfunktion gestellt wird, wird von (3.1) erfüllt.
Wie verhält es sich aber, wenn jemand versucht, das beschriebene Schlüsselaustausch-
verfahren (siehe Seite 147) zu brechen?
Der Feind kennt
y 1 = an
sowie die Basis a (3.3)
y 2 = am

Wenn er y = anm berechnen will, benötigt er n oder m, d. h. er müßte einen der


beiden Exponenten aus (3.3) ermitteln. Diese Aufgabe kann sicher als etwas schwieriger
bezeichnet werden und könnte für einen unwissenden Feind schon ein Problem darstellen.

148
Verfügt der Feind aber über eine Möglichkeit, den Logarithmus leicht zu berechnen, so
kann er folgendermaßen vorgehen:

y 1 = an | log( )
log(y1 ) = log(an )
= n · log(a) (3.4)
log(y1 )
⇒ n =
log(a)

In der Tat ist der Logarithmus3 nicht schwer zu berechnen. Bekanntlich sind Funktionen
zur Berechnung des Logarithmus in üblichen mathematischen Bibliotheken und auch Ta-
schenrechnern anzutreffen. Solche Funktionen verwenden Methoden der Analysis; einen
Ansatz dazu liefert die sogenannte Logarithmusreihe4 .
Man benötigt somit eine weitere Idee, um eine Verwendung des Logarithmus wie in (3.4)
auszuschließen und so das Diffie-Hellman-Verfahren sinnvoll einsetzen zu können.
Ein zusätzliches Problem des auf Seite 147 so beschriebenen Schlüsselaustauschverfah-
rens besteht darin, daß die beiden vertraulichen Werte n und m möglichst große Zahlen
sein sollen; andernfalls wäre ein Brechen durch Probieren“ möglich.

Sind aber n und m große Werte, so wären

y 1 = an , y2 = am und y = anm

so große Werte, daß damit sogar der verfügbare Speicher bei weitem nicht mehr zu deren
Darstellung ausreichte. Auch auch diesem Grunde ist eine weitere Idee erforderlich.
Der erste Teil dieser Idee besteht darin, von der Rechnung mit reellen Zahlen abzugehen
und statt dessen geeignete ganze“ (diskreten) Zahlen zu verwenden5 . Um dieses zu

erläutern, folgt ein Abschnitt, der eine genauere Betrachtung der ganzen Zahlen ZZ und
deren Arithmetik zum Inhalt hat.
Um dem Problem der zu großen Zahlen abzuhelfen, setzt man schließlich doch nicht
die ganzen Zahlen ein, sondern man verwendet davon abgeleitete Zahlenbereiche, deren
Elemente nicht über eine bestimmte Größe hinauswachsen können. Um dieses verste-
hen zu können, sind einige algebraische Grundlagen erforderlich, die in einem späteren
Abschnitt dieses Kapitels vermittelt werden.

3.2 Arithmetik der ganzen Zahlen


3.2.1 Wiederholung einiger Grundlagen

Gegenstand der folgenden Betrachtung ist die Menge der ganzen Zahlen:

ZZ = {0, ±1, ±2, ±3, . . .}

Mit der Addition bilden die ganzen Zahlen eine Gruppe; man bezeichnet diese Gruppe
als (ZZ , +). Für (ZZ , +) gilt:
3
log(x) bezeichnet hier wie im folgenden den natürlichen Logarithmus.
4
Die Logarithmusreihe wird in einer Nachfolgevorlesung behandelt werden.
5
Bekanntlich ist dieses für einen digitalen Rechner ohnehin passender.

149
• Das neutrale Element ist die Null: 0.

• Zu a ∈ ZZ ist das (additiv) inverse Element die zugehöre negative Zahl: −a.

Bekanntlich ist auf ZZ auch die Multiplikation definiert, und das Produkt zweier ganzer
Zahlen ist ebenfalls wieder eine ganze Zahl. Allerdings bilden ZZ und auch ZZ \ {0} mit
der Multiplikation keine Gruppe. Die Eins (1) ist zwar ein neutrales Element bezüglich
der Multiplikation; die einzigen Elemente in ZZ, die ein (multiplikativ) inverses Element
besitzen, sind jedoch nur 1 und −1.
Eine Division m : n ist für zwei ganze Zahlen m, n ∈ ZZ im Bereich von ZZ nur möglich6 ,
falls n ein sogenannter Teiler von m ist:

n ∈ ZZ , n 6= 0 heißt genau dann Teiler von m ∈ ZZ, wenn es eine weitere


ganze Zahl d ∈ ZZ mit

m = d·n (3.5)

gibt. Die Schreibweise zur Bezeichnung einer solchen Teilerbeziehung lautet

n | m (Man sagt: n teilt m“). (3.6)


Beispiel:
17 | 51 denn 51 = 3 · 17, also hier: d = 3

Der Teiler7 n von m heißt echter Teiler von m, wenn sowohl n 6= ±1 als auch n 6= ±m
ist. Teilt n die beiden ganzen Zahlen m1 und m2 , so teilt n auch deren Summe und
Differenz:

n | m1 und n | m2 ⇒ n | (m1 ± m2 ) (3.7)

(3.7) kann leicht durch Ausklammern nachgewiesen werden. Ebenso leicht nachzuweisen
sind die folgenden Regeln zur Teilbarkeit:

n | m1 und m1 | m2 ⇒ n | m2 für m1 6= 0 (3.8)


n|m ⇒ (a · n) | (a · m) für a ∈ ZZ , a 6= 0 (3.9)
n|m ⇒ n | (a · m) für a ∈ ZZ (3.10)

Aufgabe: Man begründe die Aussagen (3.7), (3.8), (3.9) und (3.10).
Aufgabe: Man begründe:

n|0 für alle n ∈ ZZ \ {0} (3.11)

Sind n, m ∈ ZZ mit n ≥ 1 und m ≥ 1 gegeben, so folgt weiter

n|m ⇒ n ≤ m (3.12)
6
d. h. mit Ergebnis wieder in ZZ
7
Ist n kein Teiler von m, so schreibt man n 6 |m.

150
Begründung: Wegen n|m gibt es ein d ∈ ZZ mit m = d · n. Da n und m positiv sind, ist
auch d positiv; wegen d ∈ ZZ ist sogar 1 ≤ d. Multipliziert man diese Ungleichung mit
n, so erhält man
n·1 ≤ n·d = m
Aufgabe: Man zeige, daß allgemeiner für n, m ∈ ZZ mit n 6= 0 und m 6= 0

n|m ⇒ |n| ≤ |m| (3.13)

gilt. (3.13) besagt, daß der Teiler einer ganzen Zahlen dem Betrage nach niemals größer
als diese Zahl sein kann.
F
Für ganze Zahlen ist die bedeutsame Teilung mit Rest vorhanden: Sind m, n ∈ ZZ
mit n 6= 0, so gibt es q, r ∈ ZZ mit

m = q·n + r dabei ist 0 ≤ r < |n| (3.14)

q ist der ganzzahlige Quotient bzw. das Ergebnis der Ganzzahldivision von m : n; r ist
der Divisionsrest. Man beachte, daß ein gültiger Rest immer einen kleineren Betrag als
der Divisor besitzen muß.

Begründung der Teilung mit Rest: Zunächst sei n > 0. Man betrachtet die folgende
Teilmenge der ganzen Zahlen:

{m − q · n | q ∈ ZZ } (3.15)
= { . . . , n − 3 · n, m − 2 · n, m − 1 · n, m, m + 1 · n, m + 2 · n, m + 3 · n, . . . }

Da für hinreichend großes q der Ausdruck m − q · n negativ und für hinreichend kleines q
positiv wird, muß diese Menge sowohl positive als auch negative Zahlen enthalten. Man
kann daher ein q ∈ ZZ finden, so daß m − q · n die kleinste nicht negative Zahl innerhalb
die Menge (3.15) ist. Für dieses q gilt dann

m − q·n ≥ 0
(3.16)
und m − (q + 1) · n < 0

Denn m − (q + 1) · n ist das nächst kleinere Element nach m − q · n in (3.15). Addiert


man n zur zweiten Gleichung in (3.16) hinzu, so erhält man

m − (q + 1) · n + n < n
(3.17)
⇔ m − q·n < n

Die erste Ungleichung in (3.16) sowie die zweite Ungleichung in (3.17) liefern zusammen

0 ≤ m − q·n < n
| {z } (3.18)
=r

Damit ist 0 ≤ r < n für den Spezialfall n > 0 gezeigt. Läßt man nun für n auch negative
Werte zu, so kann man die Teilung mit Rest zunächst für den nichtnegativen Wert |n|
(den Betrag von n) durchführen. Das liefert die Darstellung

m = q1 · |n| + r (3.19)

151
mit 0 ≤ r < |n|. Sollte nun n < 0 sein, so ist in diesem Fall |n| = −n, und diese setzt
man einfach in (3.19) ein:

m = q1 · (−n) + r (mit 0 ≤ r < |n|)


= (−q1 ) · n + r (3.20)

Setzt man jetzt in (3.20) q = −q1 , so hat man (3.14) erhalten. qed.

Bemerkung: In der Regel wird (3.14) später nur für positive ganze Zahlen n, m > 0
verwendet werden.
Aufgabe: Man zeige zu (3.14):

m, n > 0 ⇒ 0 ≤ q ≤ m (3.21)
m > 0, n > 1 ⇒ 0 ≤ q < m (3.22)

Lösung: Angenommen, es wäre q < 0. Wegen q ∈ ZZ wäre dann sogar q ≤ −1. Multipli-
ziert man diese Ungleichung mit n > 0 und addiert anschließend r, so folgt

m = q · n + r ≤ −n + r < 0 (wegen r < n)

Dieses ist ein Widerspruch zu m > 0; also muß q ≥ 0 sein. Weiter folgt:
m−r m
q·n = m − r ⇒ q = ≤ ≤ m (3.23)
n n
Damit ist (3.21) gezeigt. Ist sogar n ≥ 2, so muß die zweite Ungleichung auf der rechten
Seite von (3.23) eine strikte Ungleichung (“ < “) sein. Damit folgt (3.22).
F
Anhand des Restes r kann man die Teilbarkeit erkennen; mit den hier verwendeten
Bezeichnungen hat man nämlich:

n|m ⇔ r = 0 (3.24)

Beispiel:

50 : 8 = 6 Rest 2
⇔ 50 = 8 · 6 + 2

Die Teilung mit Rest wird sich im Späteren als sehr wichtig und grundlegend erweisen.
Bei der Programmiersprache C wird die Division mit Rest durch die beiden folgenden
Operatoren unterstützt:

• m%n: liefert den Rest r (mit Vorzeichen) von m : n.

• m/n: liefert den ganzzahligen Quotient von m : n, der Rest wird ohne zu runden
abgeschnitten.

152
Wie bereits bemerkt, werden zur Vereinfachung im folgenden oft nur nichtnegative ganze
Zahlen betrachtet. Die Menge der nichtnegativen ganzen Zahlen wird als IN0 bezeichnet.
Läßt man noch die Null weg, d. h. beschränkt man sich nur auf die positiven ganzen
Zahlen, so erhält man IN, die Menge der natürlichen Zahlen.

Wichtige Folgerung aus der Teilung mit Rest: Sind m, n ∈ ZZ mit n > 0, so gibt es bei
der Division von m durch n

m = q·n + r (3.25)

für den Rest r nur n Möglichkeiten. Wegen 0 ≤ r < n kann r nur die Werte

r = 0, 1, 2, . . . , n − 1 (3.26)

annehmen.

(3.26) besitzt eine wichtige Anwendung; es führt auf die bekannte Darstellung der
natürlichen Zahlen durch Stellenwertsysteme.
Satz (b-Stellenwertsystem): Vorgegeben sei die sogenannte Basis b ∈ IN mit b > 1.
Dann besitzt jede Zahl n ∈ IN0 eine eindeutige Darstellung der Form

n = z0 b0 + z1 b1 + z2 b2 + z3 b3 + . . . + zs bs (3.27)
mit 0 ≤ zi < b für i = 0, . . . , s

Dabei ist s ∈ IN0 ; s + 1 ist die Anzahl der Stellen von n. Die z0 , z1 , . . . , zs sind die
Ziffern von n.
Bemerkung:

• Am meisten verwendet wird die Basis b = 10; der Grund dafür ist sicherlich die
Verwendung der zehn Finger beim Rechnen.

• Im Zusammenhang mit digitalen Rechnern zusätzlich verwendete Systeme sind


heute b = 2, 8, 16, 64. Für b = 16 (Hexadezimalzahlen) benötigt man aufgrund
von (3.27) 16 Ziffern; man nimmt dafür die Symbole

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Das Oktalsystem (b = 8) wurde bei einigen Völkern schon früher verwendet; of-
fenbar rechnete man mit den Fingern, verwendete aber die Daumen nicht.

• Bekannt ist, daß weitere Zahlensysteme verwendet wurden:

– Das Sexagesimalsystem b = 60 wurde bei den Babyloniern verwendet. Die


Zahl 60 bietet den Vorteil, daß sie viele Teiler besitzt.
– Die Mayas verwendeten mit gewissen Abweichungen das Vigesimalsystem
(b = 20); offenbar setzte man beim Rechnen sowohl die Finger als auch die
Zehen ein.

• Die von den Römern verwendete Methode zur Zahlendarstellung sind ein Beispiel
für ein Zahlensystem, das kein Stellenwertsystem ist

153
Begründung von (3.27): Verwendet wird eine verallgemeinerte vollständige Induk-
tion. Der Induktionsanfang wird mit den kleinen“ Zahlen n = 0, 1, 2, . . . , b − 1

durchgeführt. Schreibt man für ein solches n

n = z0 · b0 mit 0 ≤ z0 = n < b

so ist dieses bereits die gewünschte Darstellung (3.27), die offenbar eindeutig ist. Es folgt
der Induktionsschluß. Sei dazu n ∈ ZZ mit n ≥ b. Als Induktionsvoraussetzung
wird angenommen, daß die Behauptung

für alle ñ ∈ ZZ mit 0 < ñ < n

bereits bewiesen wurde. Man nimmt dann eine Teilung mit Rest vor:

n = q·b + r mit 0 ≤ r < b (3.28)

Dann ist 0 < q < n (wegen (3.22)), und man kann auf q die Induktionsvoraussetzung
anwenden. q besitzt somit die eindeutige Darstellung

q = y0 b0 + y1 b1 + y2 b2 + . . . + yt bt (3.29)
mit 0 ≤ yi < b für i = 0, . . . , t

Multipliziert man beide Seiten von (3.29) mit b und addiert man anschließend r, so
liefert dieses zusammen mit (3.28)

n = q · b + r = r + y0 b1 + y1 b2 + y2 b3 + y3 b4 + . . . + yt bt+1 (3.30)

Setze man jetzt hier

z0 = r, zi = yi−1 für i = 1, . . . , t + 1 sowie s = t + 1

so erkennt man, daß (3.30) eine Stellenwertdarstellung für n der Form (3.27) ist. Diese
ist sogar eindeutig, denn q und r in (3.28) sind durch n eindeutig bestimmt. qed.

3.2.2 Größter gemeinsamer Teiler und euklidischer Algorith-


mus
Eine sehr wichtige Größe bei ganzen Zahlen ist der sogenannte
größte gemeinsame Teiler8
Sind m, n ∈ ZZ zwei ganze Zahlen, von denen mindestens eine ungleich Null ist, so
schreibt man für deren größten gemeinsamen Teiler

ggT(m, n) oder gcd(m, n) (3.31)

Der Wert des größten gemeinsamen Teilers

d = ggT(m, n) (3.32)

ist eine natürliche Zahl, die durch die beiden folgenden gleichwertigen Eigenschaften
festgelegt ist:
8
engl. greatest common divisor

154
1. d ∈ IN ist die größte natürliche Zahl, die sowohl ein Teiler von m als auch ein
Teiler von n ist, d. h.
d = max{a ∈ IN | a|m und a|n} (3.33)
Man beachte, daß die in (3.33) erscheinende Menge zumindest die Zahl 1 enthält
und damit nicht leer ist. Außerdem besitzt diese Menge wegen (3.13) notwendi-
gerweise ein größtes Element.
2. Die bedeutsamste Charakterisierung des größten gemeinsamen Teilers liefern die
beiden folgenden Eigenschaften; genau wenn diese erfüllt sind, ist d = ggT(m, n):
(1) d ist ein gemeinsamer Teiler von m und n, d. h. d | m und d | n.
(3.34)
(2) Sei d˜ ∈ IN beliebig mit d˜| m und d˜| n ⇒ d˜| d
Dieses bedeutet: Jeder beliebige gemeinsame Teiler von m und n ist auch ein Teiler
des größten gemeinsamen Teilers von m und n.

Beispiel: Gemeinsame Teiler von 12 und 40 sind 1 und 2, diese teilen auch 4 =
ggT(12, 40).

Der Nachweis der Gleichwertigkeit von (3.33) und (3.34) erfolgt später, da hierzu erst
noch einige Vorbereitungen erforderlich sind.

Für zahlreiche Anwendungen erweist es sich als sehr günstig, daß es ein sehr schnelles
und einfaches Verfahren zur Berechnung des größten gemeinsamen Teilers gibt; dieses
ist der sogenannte
euklidische Algorithmus
der im Folgenden hergeleitet und genauer besprochen werden soll. Es reicht, sich auf
zwei nichtnegative ganze Zahlen m, n ∈ ZZ zu beschränken9 ; ebenso setzt man zunächst
m ≥ n voraus. Die Vorgehensweise und Idee des euklidischen Algorithmus lautet damit:
(a) Ist n = 0, so setzt man einfach
ggT(m, n) = m (3.35)
Man erkennt sofort, daß (3.35) in diesem Spezialfall in Übereinstimmung zu der
Eigenschaft (3.33) ist.
(b) Ist n > 0, so nimmt man eine Teilung mit Rest vor (siehe (3.14)):
m = q·n + r mit 0 ≤ r < n (3.36)
⇔ r = m − q·n (3.37)
Für beliebiges d ∈ IN gilt dann folgende Tatsache:
d ist genau dann ein gemeinsamer Teiler von m und n,
(3.38)
wenn d auch ein gemeinsamer Teiler von n und r ist.

⇔ {d ∈ IN | d|m und d|n} = {d ∈ IN | d|n und d|r}


9
Frage: warum?

155
Die Begründung von (3.38) erhält man, indem man einen beliebigen gemeinsamen
Teiler d von m und n auf der rechten Seite von (3.37) ausklammert, bzw. indem
man einen beliebigen gemeinsamen Teiler d von n und r auf der rechten Seite von
(3.36) ausklammert
Hieraus folgt wiederum sofort10

ggT(n, r) = ggT(m, n) (3.39)

Setzt man nun


m1 = n sowie n1 = r
so reicht es,
ggT(m1 , n1 )
zu berechnen. Dieses ist eine merkliche Vereinfachung, da ja

n1 < n

ist.
Fährt man auf diese Weise fort, d. h. mit der schrittweisen Vereinfachung durch Teilung
mit Rest in Schritt (a), so erhält man nacheinander:

m0 = m, n0 = n, m0 = q0 · n0 + r0 (r0 < n0 )
m1 = n0 , n1 = r0 , m1 = q1 · n1 + r1 (r1 < n1 )
m2 = n1 , n2 = r1 , m2 = q2 · n2 + r2 (r2 < n2 )
.. ..
. .
mi = ni−1 , ni = ri−1 , mi = qi · ni + ri (ri < ni )
.. ..
. .

Dabei ist stets11

ggT(mi , ni ) = ggT(mi−1 , ni−1 ) = . . . = ggT(m1 , n1 ) = ggT(m0 , n0 ) (3.40)

Ist ni−1 > 0 so ist 0 ≤ ri−1 < ni−1 ; beachtet man noch ni = ri−1 , so liefert dieses die
Ungleichungen
n0 > n1 > n2 > . . . > ni−1 > ni > . . . ≥ 0
Da alle ni nichtnegative ganze Zahlen sind, muß bei dieser absteigenden Kette irgend-
wann einmal die Null erreicht werden, d. h. es muß ein j ∈ IN mit

nj = 0

geben. Für das Paar (mj , nj ) kann dann Schritt (a) des Algorithmus angewandt werden.
Der Algorithmus endet damit und liefert wegen (3.40) das gewünschte Ergebnis:

ggT(m, n) = ggT(m0 , n0 ) = ggT(mj , nj ) = ggT(mj , 0) = mj

Es folgt im Pseudocode eine iterative Fassung des euklidischen Algorithmus:


10
Aufgabe: Man führe die Begründungen von (3.38) und (3.39) genau durch.
11
Wie man sieht, werden die auftauchenden Werte qi nicht verwendet; sie gelangen erst bei der
erweiterten Form des euklidischen Algorithmus Bedeutung.

156
ggT(m,n)
while (n > 0)
r = m%n
m = n
n = r
return m
Aufgabe: Begründen Sie, daß man auf die zunächst geforderte Bedingung m ≥ n (siehe
Seite 155) verzichten kann; zum Ablauf des so geschilderten euklidischen Algorithmus
kommt höchstens ein Schritt vom Typ (b) hinzu.
Der euklidische Algorithmus ist sehr schnell; sein Aufwand beträgt höchstens

2 · ld (n) + 2 (3.41)

Schleifendurchläufe. Er ist damit auch noch für sehr große Zahlen (n, m ≥ 10300 )
durchführbar.
Zur Begründung12 von (3.41) weist man nach, daß spätestens nach zwei Schritten eine
Halbierung von ni erfolgt, d. h. mit den Bezeichnungen von Seite 156 ist
1
ni+2 < · ni (3.42)
2
Zunächst gilt nach Konstruktion ebenfalls mit den Bezeichnungen von Seite 156
ni > ni+1 (= ri )
und ni = qi+1 · ni+1 + ni+2 (3.43)
|{z} |{z}
=mi+1 =ri+1

Jetzt gibt es zwei Möglichkeiten:


1
1. Es ist bereits ni+1 ≤ 2
· ni ; dann ist natürlich erst recht
1
ni+2 < · ni wegen ni+2 < ni+1
2

2. Es ist umgekehrt ni+1 > 12 · ni bzw. 2ni+1 > ni ; dann muß aber in (3.43) qi+1 = 1
sein, sonst erhielte man wegen qi+1 ∈ IN und ni+2 = ri+1 ≥ 0 einen Widerspruch.
Setzt man qi+1 = 1 in (3.43) ein, so folgt in der Tat wieder mit Hilfe von ni+1 > 12 ·ni

ni = ni+1 + ni+2
1 1
⇒ ni+2 = ni − ni+1 < ni − · ni = · ni
2 2

Damit ist Ungleichung (3.42) gezeigt. Wendet man die Ungleichung (3.42) mehrmals an,
so folgt für k ∈ IN:
1
ni+2k < k · ni
2
Speziell für i = 0, d. h. für n = n0 ist dann
1
n2k < ·n (3.44)
2k
12
Diese Begründung ist eine Hintergrundinformation; sie ist für das Verständnis des Folgenden nicht
notwendig.

157
Wählt man k ∈ IN mit ld (n) ≤ k < ld (n) + 1, so ist 2k ≥ n und daher
1
n2k < ·n ≤1 ⇒ n2k < 1
2k
Wegen n2k ∈ ZZ und n2k ≥ 0 muß daher n2k = 0 sein. Damit endet der Algorithmus. Er
hat bis zu seinem Ende höchstens diese 2k Schritte durchlaufen, wobei k < ld (n) + 1
ist. Damit ist (3.41) gezeigt.
F

Beispiel:

m = 4, n = 17, 4 = 0 · 17 + 4
m1 = 17, n1 = 4, 17 = 4 · 4 + 1
m2 = 4, n2 = 1, 4 = 4·1 + 0
m3 = 1, n3 = 0 ⇒ ggT(4, 17) = m3 = 1

Hier tritt die Besonderheit auf, daß die beiden Zahlen 4 und 17 keinen echten gemein-
samen Teiler besitzen. Gerade dieser Fall ist für viele Anwendungen bedeutsam, man
definiert daher:
Definition: n, m ∈ ZZ heißen teilerfremd oder zueinander prim, falls gilt

ggT(m, n) = 1 (3.45)

Bedeutsamer als der einfache“ größte gemeinsame Teiler ist häufig die Tatsache, daß

der größte gemeinsamer Teiler zweier Zahlen m, n ∈ ZZ in folgender Weise dargestellt
werden kann: Zu m, n ∈ IN0 gibt es stets ein Paar ganzer Zahlen a, b ∈ ZZ mit

ggT(m, n) = a · m + b · n (3.46)

Diese Aussage wird als Lemmas von Bezout bezeichnet und ist insbesondere im Falle
ggT(m, n) = 1 interessant. Zwei Zahlen m, n ∈ ZZ sind nämlich genau dann teilerfremd,
wenn es Zahlen a, b ∈ ZZ mit

a·m + b·n = 1 (3.47)

gibt. Die Gültigkeit der Gleichung (3.47) folgt sofort aus dem Lemmas von Bezout. Zu
zeigen bleibt nach die Umkehrung: Besteht für m, n ∈ ZZ eine Gleichung der Form (3.47),
so sind sie teilerfremd. Das wird als Aufgabe überlassen.

Die Darstellung (3.46) wird mit einer Erweiterung des euklidischen Algorithmus
berechnet; wie beim gewöhnlichen euklidischen Algorithmus nimmt man eine Teilung
mit Rest vor (siehe Seite 156) und setzt

m0 = m, n0 = n, m0 = q0 · n0 + r0
(3.48)
m1 = n0 , n1 = r0 (r0 < n0 )

Angenommen, man hat für das Zahlenpaar (m1 , n1 ) mit n1 < n0 bereits die ggT-
Darstellung

ggT(m1 , n1 ) = a1 · m1 + b1 · n1 (3.49)

158
berechnet, so setzt man in diese die Gleichungen

m1 = n0 und n1 = m0 − q0 · n0

aus (3.48) ein und berücksichtigt ggT(m, n) = ggT(m1 , n1 ) (siehe (3.39)) :

ggT(m, n) = a1 · m1 + b1 · n1
= a1 · n0 + b1 · (m0 − q0 · n0 )
= b1 ·m0 + (a1 − q0 · b1 ) ·n0 (3.50)
|{z} | {z }
a0 b0
= a·m + b·n

wobei in der letzten Zeile von (3.50) wieder m0 = m, n0 = n, a0 = a sowie b0 = b gesetzt


wurde.

Beispiel: Mit m = m0 = 61 und n = n0 = 17 liefert der erweiterte Euklidische Algorith-


mus die folgenden Werte und Zwischenwerte:

i mi ni qi ri ai bi ggT
0 61 17 3 10 −5 18 1
1 17 10 1 7 3 −5 1
2 10 7 1 3 −2 3 1
3 7 3 2 1 1 −2 1
4 3 1 3 0 0 1 1
5 1 0 1 0 1

Zunächst wurden nur die Spalten bis zur Spalte ri“ berechnet. Dazu wurde wie in (3.48)

die Teilung mit Rest mi = qi ·ni +ri durchgeführt sowie mi+1 = ni und ni+1 = ri gesetzt.
Wurde hier nach fünf Schritt n5 = 0 erreicht, so konnte ggT(m5 , n5 ) = ggT(m, n) = 1
gesetzt werden. Ebenso konnte a5 = 1 und b5 = 0 gesetzt werden. Danach erfolgte die
Rückrechnung mit absteigendem i, indem wie in (3.50) ai = bi+1 und bi = ai+1 − qi · bi+1
gesetzt wurde. Das Ergebnis liefert die 0-te Zeile der Tabelle:

ggT(61, 17) = −5 · 61 + 18 · 17 = 1

Für m = m0 = 100 und n = n0 = 34 erhält man auf diese Weise:

i mi ni qi ri ai bi ggT
0 100 34 2 32 −1 3 2
1 34 32 1 2 1 −1 2
2 32 2 16 0 0 1 2
3 2 0 1 0 2

Die 0-te Zeile der Tabelle zeigt das Ergebnis:

ggT(100, 34) = −100 + 3 · 17 = 2

Es folgt mit entsprechender Rechnung ein weiteres Beispiel mit etwas größeren Zahlen:

159
i mi ni qi ri ai bi ggT
0 9654321 1234569 7 1012338 8633 −67510 3
1 1234569 1012338 1 222231 −7079 8633 3
2 1012338 222231 4 123414 1554 −7079 3
3 222231 123414 1 98817 −863 1554 3
4 123414 98817 1 24597 691 −863 3
5 98817 24597 4 429 −172 691 3
6 24597 429 57 144 3 −172 3
7 429 144 2 141 −1 3 3
8 144 141 1 3 1 −1 3
9 141 3 47 0 0 1 3
10 3 0 1 0 3
Das Ergebnis wird wieder der 0-te Zeile der Tabelle entnommen:

ggT(9654321, 1234569) = 8633 · 9654321 − 67510 · 1234569 = 3

Die dritte Zeile von (3.50) führt auf eine rekursive Fassung des erweiterten euklidischen
Algorithmus:

erw_ggT(m,n,&a,&b) // mit Referenzparametern f"ur R"uckgabewerte


if (n=0)
d = m
a = 1
b = 0
else
d = erw_ggT(n,m%n,&a1,&b1) // rekursiver Aufruf
q = m/n // Ganzzahldivision
a = b1
b = a1 - q*b1
return d

Der Aufwand hiervon ist wie beim einfachen euklidischen Algorithmus (siehe (3.41)). Der
Nachteil dieser Fassung ist die Verwendung der Rekursion. Will man diese vermeiden
und zu einer iterativen Fassung kommen, so benötigt man eine kleine Vorarbeit:13
Zunächst betrachtet man dazu die Rekursionsgleichungen, die die Grundlage dieser re-
kursiven Fassung des erweiterten euklidischen Algorithmus bilden:

mi = qi · ni + ri
(3.51)
mi+1 = ni ni+1 = ri

Mit (3.51) berechnet man rekursiv ganze Zahlen d, ai+1 , bi+1 mit

d = ggT(ai+1 , bi+1 ) = ggT(ai , bi ) (3.52)


sowie d = ai+1 · mi+1 + bi+1 · ni+1 (3.53)
13
Die folgende Herleitung dient zur Vertiefung und ist für das Verständnis des Folgenden nicht erfor-
derlich.

160
Damit berechnet man wiederum (siehe (3.50)):

ai = bi+1
(3.54)
bi = ai+1 − qi · bi+1

Jetzt erkennt man unschwer, daß sich (3.54) mit Hilfe einer Matrix schreiben läßt:
     
ai 0 1 ai+1
= ◦ (3.55)
bi 1 −qi bi+1
| {z }
Ai

Dabei ist qi der ganzzahlige Quotient von mi und ni aus (3.51); die vorkommende Matrix
wird Ai genannt. Für i + 1 gilt (3.55) ebenso:
   
ai+1 ai+2
= Ai+1 ◦
bi+1 bi+2

Dieses in (3.55) liefert


   
ai ai+2
= Ai ◦ Ai+1 ◦
bi bi+2

Die Weiterführung dieser Iteration liefert

     
a a0 aj
= = A0 ◦ A1 ◦ . . . ◦ Aj ◦
b b0 bj
   
aj 1
mit =
bj 0

j ∈ IN ist hier gerade der Iterationsschritt, bei dem der euklidische Algorithmus endet
(siehe Seite 156). Mit Hilfe dieses iterierten Matrizenproduktes erhält man die iterative
Fassung des erweiterten euklidischen Algorithmus:

erw_ggT(m,n,&a,&b) // mit Referenzparametern f"ur R"uckgabewerte


 
A = 0 1
1 0

while (n > 0)
r = m%n
q = m/n
m = n
n = r
 
0 1
A = A ◦ 1 −q

a = A[0][0] // die erste Spalte von A


b = A[1][0] //
return m

161
Hierbei wurde verwendet, daß die erste Spalte von A gerade gleich dem Produkt A◦(1, 0)t
ist.

Beispiel: m = 4, n = 17
 
m = 4 n = 17 q = 0 r = 4 A = 01 1
0
     
m = 17 n = 4 q = 4 r = 1 A = 01 1 ◦ 0 1 = 1 −4
0 1 −4 0 1
     
1 −4 0 1 −4 17
m=4 n=1 q=4 r=0 A= 0 1 ◦ 1 −4 = 1 −4
       
a −4 17 1 −4
m=1 n=0 ⇒ = 1 −4 ◦ =
b 0 1

⇒ ggT(4, 17) = 1 = (−4) · 4 + 1 · 17

F
Bemerkung: Der größte gemeinsame Teiler ist auch für mehrere ganze Zahlen definiert;
er kann schrittweise berechnet werden:

ggT(m1 , . . . , mk ) = ggT(ggT(m1 , . . . , mk−1 ), mk ) (3.56)

Eine erste Besonderheit teilerfremder Zahlen stellt der folgende Hilfssatz dar:
Hilfssatz: Sind m, n ∈ IN teilerfremd, d. h. ist ggT(n, m) = 1, und ist c ∈ IN eine weitere
Zahl, so daß
m | c und n | c
ist, dann gilt auch

(m · n) | c (3.57)

Begründung: Da m und n teilerfremd sind, kann man von einer Darstellung nach (3.47)
ausgehen;
a·m + b·n = 1 mit a, b ∈ ZZ
Diese Gleichung multipliziert man mit c:

a·m·c + b·n·c = c (3.58)

Nun teilt m · n beide Summanden auf der linken Seite von (3.58), denn man kann nach
(3.9), (3.10) folgern:

n | c ⇒ (n · m) | (m · c) ⇒ (n · m) | (a · m · c)
m | c ⇒ (n · m|(n · c) ⇒ (n · m) | (b · n · c)

Da m · m somit die beide Summanden auf der rechten Seite von (3.58) teilt, ist m · n
nach (3.7) auch ein Teiler der Summe und damit auch von c. qed.

162
Auf die folgende Aussage zu teilerfremden Zahlen benötigt man, wie man noch sehen
wird, sehr häufig.
Hilfssatz: Gegeben seien drei Zahlen m, n1 , n2 ∈ ZZ . Sind dann m und n1 teilerfremd
und ebenso m und n2 teilerfremd, so sind auch m und n1 · n2 teilerfremd; d. h.

ggT(m, n1 ) = 1 und ggT(m, n2 ) = 1 ⇒ ggT(m, (n1 · n2 )) = 1 (3.59)

Begründung: Wegen der Teilerfremdheit von m und n1 sowie von m und n2 gibt es
Darstellungen (siehe (3.47))

a1 · m + b 1 · n 1 = 1
a2 · m + b 2 · n 2 = 1

Die beiden Gleichungen multipliziert man einfach miteinander:

1 = (a1 m + b1 n1 ) · (a2 m + b2 n2 )
= a1 a2 m2 + a1 mb2 n2 + b1 n1 a2 m + b1 n1 b2 n2 Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 m + a1 b2 n2 + b1 n1 a2 ) ·m + b1 b2 ·n1 n2
| {z } |{z}
a b

= a · m + b · (n1 · n2 )

Damit wurde a · m + b · (n1 n2 ) = 1 gezeigt, woraus dann sofort ggT(a, (n1 n2 )) = 1) folgt
(siehe (3.47)). qed.
Zusatz: Durch vollständige Induktion zeigt man mit Hilfe von (3.59): Sind beliebig viele
Zahlen n1 , . . . , nk ∈ IN mit ggtT(m, ni ) = 1 gegeben, so ist auch

ggtT(m, n1 · n2 · . . . · nk ) = 1 (3.60)

F
Es bleibt noch zu zeigen, daß der größte gemeinsame Teiler d = ggT(m, n) zweier ganzer
Zahlen m, n ∈ ZZ durch die Eigenschaften (3.34) festgelegt ist; diese lauteten:

(1) d ist ein gemeinsamer Teiler von m und n, d. h. d | m und d | n.


(3.61)
(2) Sei d˜ ∈ IN beliebig mit d˜| m und d˜| n ⇒ d˜| d

Auch dieses wird als Aufgabe überlassen. Hinweis: Man verwende (3.46).

3.2.3 Primzahlen
Grundlegend sind die sogenannten Primzahlen. Eine Zahl p ∈ IN mit p > 1 heißt
Primzahl, falls gilt (mit d ∈ ZZ):

p besitzt keine echten Teiler


⇔ (d | p ⇒ d = ±1 oder d = ±p ) (3.62)

Achtung: Man beachte, daß aufgrund dieser Definition die Zahl 1 keine Primzahl ist.

163
(3.62) ist die bekannte Definition der Primzahlen. Es gibt aber ein weiteres Merkmal,
welches die Primzahlen charakterisiert und bei den meisten Betrachtungen zu Primzah-
len hilfreicher als die Beschreibung (3.62) ist. Dieses ist Inhalt des folgenden wichtigen
Satzes.
Satz: Für p ∈ IN mit p > 1 gilt
p ist Primzahl
⇔ (p | (n · m) ⇒ p | n oder p | m für n, m ∈ ZZ ) (3.63)
⇔ (p 6 | n und p 6 | m ⇒ p 6 | (n · m) für n, m ∈ ZZ ) (3.64)
Dieses besagt, daß eine Primzahl, die Teiler eines Produktes zweier ganzer Zahlen ist,
bereits mindestens einen der Faktoren teilen muß. Umgekehrt besagt (3.63), daß eine
Zahl p ein Produkt ganzer Zahlen nur dann teilt, wenn sie mindestens schon einen der
Faktoren teilt, eine Primzahl sein muß.
Beweis: Gegeben sei p ∈ IN .
1. Zunächst wird angenommen, daß p die Bedingung (3.63) erfüllt; zu zeigen ist, daß
p eine Primzahl ist. Dazu führt man einen Widerspruchsbeweis.
Angenommen, p wäre keine Primzahl; dann muß es einen echten Teiler d von p
geben. Dann muß zunächst
p = d·c mit einem c ∈ ZZ
gelten. Da d ein echter Teiler von p ist, ist wegen (3.13) |d| < p. Ebenso muß dann
|c| < p sein. Ebenfalls wegen (3.13) kann dann p keinen der beiden Faktoren d und
c teilen. Andererseits teilt p das Produkt d · c, denn es ist ja
d·c = 1·p
Das ist ein Widerspruch. Also kann p keinen echten Teiler besitzen; also muß p
eine Primzahl sein.
2. Jetzt sei p eine Primzahl, die das Produkt n · m teilt. Zu zeigen ist, daß p schon
mindestens einen der beiden Faktoren teilen muß. Auch hier wird wieder ein Beweis
durch Widerspruch geführt. Dazu wird angenommen, daß p keinen der beiden
Faktoren m und n teilt. Dann müssen aber die beiden größten gemeinsamen Teiler
von p mit m sowie von p mit n gleich 1 sein. Diese sind nämlich auch Teiler der
Primzahl p; daher kommen für sie nur 1 und p selber in Frage. Da aber p ja nach
Annahme weder m noch n teilen soll, bleibt für beide größten gemeinsamen Teiler
nur der Wert 1. Nach (3.47) gibt es daher mit geeigneten a1 , b1 , a2 , b2 Darstellungen
a1 · p + b 1 · m = 1
a2 · p + b 2 · n = 1
Die beiden Gleichungen multipliziert man miteinander:
1 = (a1 p + b1 m) · (a2 p + b2 n)
= a1 a2 p2 + a1 pb2 n + b1 ma2 p + b1 mb2 n Hier faßt man die Summan-
den geeignet zusammen.
= (a1 a2 p + a1 b2 n + b1 na2 ) · p + b1 b2 · (m · n) (3.65)

164
Da ja nach Voraussetzung p ein Teiler von m · n ist, teilt p beide Summanden auf
der rechten Seite von (3.65). Dann müßte p aber auch die Summe und damit 1
teilen. Wegen p > 1 ist das aber ein Widerspruch. Somit muß p mindestens einen
der Faktoren m oder n teilen. qed.

Beispiel: Für die Primzahl 3 hat man

3 | 66 (= 6 · 11) : in der Tat gilt bereits 3 | 6


3 6 | 7 und 3 6 | 7 ⇒ 3 6 | 77 (= 7 · 11)

Beispiel: 10 kann keine Primzahl sein, denn es ist

10 | 100 aber 100 = 4 · 25 und 10 6 | 4, 10 6 | 25

Zusatz zu (3.63): Gegeben seien eine Primzahl p sowie ganze Zahlen m1 , m2 , . . . , mk .


Dann gilt:
p | (m1 · m2 · . . . · mk ) ⇒ p | mi (3.66)
für mindestens ein mi unter den m1 , m2 , . . . , mk
Begründung: (3.66) folgt durch vollständige Induktion aus (3.66). Aufgabe: Man führe
dieses durch.

Die ersten Primzahlen lauten

2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37

Primzahlen werden sich als grundlegend für viele Verfahren in der Kryptologie erweisen;
insbesondere werden sehr große Primzahlen benötigt. Aber auch bei vielen anderen
Betrachtungen über die ganzen Zahlen und damit verbundenen Anwendungen ist die
Berücksichtigung der Primzahlen sehr hilfreich bzw. sogar notwendig. Ursache dafür
ist der folgende Satz, der besagt, daß jede ganze Zahl m mit |m| > 1 aus Primzahlen
zusammengesetzt“ ist.

Satz: (eindeutige Primfaktorzerlegung) Zu jedem m ∈ ZZ \ {0} gibt es eine Darstel-
lung der Form
m = ±1 · pe11 · pe22 · . . . · pess (3.67)
Dabei ist s ∈ IN0 ; die pi sind s verschiedene Primzahlen, die jeweils einen Exponenten
ei ∈ IN besitzen. Diese Darstellung ist bis auf die Reihenfolge eindeutig.
Beweis: Dieser Beweis wird mittels verallgemeinerter vollständiger Induktion durch-
geführt. Führt Induktionsanfang betrachtet man die beiden folgenden Arten ganzer
Zahlen:

1. m = ±1
(3.68)
2. m = ±p mit einer Primzahl p

165
Beide Möglichkeiten in (3.68) sind offenbar eine Darstellung der Form (3.67) und sind
offenbar eindeutig.
Für den Induktionsschluß betrachtet man eine ganze Zahl m ∈ ZZ mit |m| > 1, die
keine Primzahl ist, und nimmt an, daß die Behauptung bereits für alle d ∈ ZZ mit
0 < |d| < |m| bewiesen ist. Dann gibt es ein Zerlegung

m = d1 · d2 (3.69)

mit zwei echten Teilern d1 , d2 ∈ ZZ . Nach (3.13) ist dann

|d1 | < m und d2 < m

und man kann die Induktionsvoraussetzung auf d1 und d2 anwenden. Es gibt somit
Primfaktorzerlegungen

d1 = ±1 · pe11 · pe22 · . . . · pess d2 = ±1 · q1f1 · q2f2 · . . . · qtft (3.70)

mit Primzahlen p1 und qj sowie Exponenten ei und fj . Das liefert sofort eine Primfak-
torzerlegung von m:

m = d1 · d2 = ±1 · pe11 · pe22 · . . . · pess · q1f1 · q2f2 · . . . · qtft (3.71)

In (3.70) würde man natürlich Faktoren mit derselben Basis pi = qj zusammenfassen.


Damit wurde die Existenz der Primfaktorzerlegung von m gezeigt.
Zu zeigen bleibt noch, daß diese Primfaktorzerlegung eindeutig ist. Angenommen, man
hat die beiden Darstellungen

m = ±1 · pe11 · pe22 · . . . · pess (3.72)


m = ±1 · p̃g11 · p̃g22 · . . . · p̃gt t (3.73)

Da p1 ein Teiler von m und damit des Produktes auf der rechten Seite von (3.72) ist,
muß p1 einen der Faktoren auf der rechten Seite von (3.72) teilen. Da es sich bei diesen
Faktoren (nach Auflösung der Potenzen) um die Primzahlen p̃1 , p̃2 , . . . , p̃t handelt, muß
p1 eine dieser Primzahlen teilen und damit gleich eine dieser Primzahlen seinen. Indem
man gegebenenfalls eine Umnummerierung vornimmt, kann man p1 = p̃1 annehmen.
Man kann daher die beiden Gleichungen (3.72) und (3.73) durch p1 teilen:

m1 = ±1 · pe11 −1 · pe22 · . . . · pess (3.74)


m1 = ±1 · p̃g11 −1 · p̃g22 · . . . · p̃gt t (3.75)

Dabei ist m1 = m/p1 ∈ ZZ . Wegen p1 > 1 ist dann insbesondere |m1 | < |m|. Folg-
lich sind nach Induktionsvoraussetzung die beiden Primfaktorzerlegungen (3.74) und
(3.75) gleich. Das heißt, auf den rechten Seiten von (3.73) und (3.75) kommen diesel-
ben Primzahlen mit den jeweiligen selben Exponenten vor. Dasselbe gilt dann auch für
die beiden Zerlegungen in (3.72) und (3.73), die somit ebenfalls gleich sind. Zwei be-
liebige Primfaktorzerlegungen von m sind somit gleich; damit ist die Eindeutigkeit der
Primfaktorzerlegung nachgewiesen. qed.

Bemerkung: Sind alle Exponenten ei = 1, so heißt m quadratfrei. Für s = 0 enthält m


keine Primfaktoren; dieses ist genau für m = ±1 der Fall.

166
Schon seit 2300 Jahren bekannt aber erst seit ca. 40 Jahren von praktischer Bedeutung
ist der folgende
Satz von Euklid: Es gibt unendlich viele Primzahlen.14
Beweis:15 : Offensichtlich gibt es mindestens eine Primzahl (etwa = 2); die Menge der
Primzahlen ist damit nicht leer. Angenommen, deren Anzahl ist endlich und beträgt
genau k ∈ IN. Sind p1 , . . . , pk sämtliche existierende Primzahlen, so bildet man damit
die Zahl
N = p1 · p2 · . . . · p k + 1
Da mindestens ein Primzahl vorhanden ist, ist N > 1 und damit insbesondere N 6= ±1.
N muß daher mindestens einen Faktor der Gestalt pe in seiner eindeutigen Primfak-
torzerlegung besitzen; insbesondere ist dann die Primzahl p ein Teiler von N . Da die
p1 , . . . , pk alle Primzahlen sind, muß p gleich einer dieser Primzahlen sein, d. h. p = pi
mit einem i mit 1 ≤ i ≤ k. Dann ist aber offensichtlich p auch ein Teiler von p1 ·p2 ·. . .·pk .
Da p als Teiler von N gewählt wurde, ist somit

p | N = (p1 · p2 · . . . · pk + 1) und p | (p1 · p2 · . . . · pk )

Nach (3.7) teilt p auch die Differenz dieser beiden Zahlen:

p | (N − p1 · p2 · . . . · pk ) = 1

Also folgt p|1, was nicht möglich ist. Die Annahme, es gäbe nur endlich viele Primzahlen
führt somit auf einen Widerspruch und kann nicht richtig sein. qed.

Da es unendlich viele Primzahlen gibt, muß es insbesondere beliebig große Primzahlen


geben. Weiterhin kann man feststellen, daß die Primzahlen zwar immer seltener“ wer-

den16 , daß sie aber auch in größeren Bereichen (etwa mit einer Größenordnung 10300 )
noch relativ häufig sind. Eine genauere Aussage über die Häufigkeit der Primzahlen
liefert der Primzahlsatz: Für große x ∈ IR ist
 
Anzahl der Primzahlen p x
≈ (3.76)
mit p ≤ x log x

Setzt man in (3.76) nacheinander x = 10299 und x = 10300 ein, so folgt, daß in dem
Bereich von 10299 bis 10300 im Durchschnitt jede 700ste Zahl eine Primzahl ist. Dieses
ist für kryptologische Anwendungen sehr bedeutsam; in vielen Fällen werden dabei sehr
große Primzahlen benötigt.
F
Wie findet man Primzahlen?

• Ab einem - häufig zufällig gewählten - ungeraden M ∈ IN testet man nacheinander


die Zahlen
m = M, M + 2, M + 4, M + 6, . . .

• Für jede dieser Zahlen wird ein Primzahltest durchgeführt:


14
Der griechische Mathematiker Euklid lebte um 300 v. Chr. in Alexandria.
15
Das Lesen dieses Beweises ist für das Verständnis des Folgenden nicht zwingend erforderlich.
16
Es gibt sogar beliebig große Lücken: für n ∈ IN ist keine der Zahlen n! + i mit i = 2, . . . , n eine
Primzahl (warum?).

167
– Ein einfacher Test besteht darin, daß man einen Teiler von m ∈ IN sucht.
Besitzt m einen Teiler n mit 1 < n < m, so kann m keine Primzahl sein. Es
reicht, für alle n ∈ IN mit

n ist ungerade und 2 < n ≤ m
zu prüfen, ob es sich um einen Teiler von m handelt. Einerseits17 einen ist
hier m ungerade kann daher keinen geraden Teiler besitzen. Andererseits muß,
wenn m ein Produktdarstellung
m = n1 · n2

besitzt, mindestens einer der beiden Faktoren ni kleiner oder gleich m sein.
Wäre nämlich
m = n1 · n2
eine Produktdarstellung von m mit

n1 > m

n2 > m
so folgte durch Multiplikation dieser beiden Ungleichungen
√ √
m = n1 · n2 > m· m = m
und damit m > m. Dieses ist ein Widerspruch.
Eine entsprechende Testfunktion ist:
bool primtest(m)
if (m==3) return true
if (m % 2 ==0) return false
w = sqrt(m)
n=3
while (n <= w)
if(m % n ==0) return false
n = n+2
return true

Der Aufwand dieses Tests beläuft sich auf m/2 Schleifendurchläufe und ist
für m ≤ 1012 gut machbar.
– Für sehr große m ∈ IN sind sehr interessante und effektive Tests vorhanden.
Aus allgemeinen Interesse sind viele Informatiker und Mathematiker damit beschäftigt
immer neuere und größerer Primzahlen zu finden. Gute Kandidaten für Primzahlen sind
die Zahlen der Form
n = 2k − 1 (3.77)
Ist n eine Primzahl, so heißt n Mersennesche Primzahl. Notwendig ist, daß k ebenfalls
eine Primzahl ist. Andernfalls wäre für k = a · b, 1 < a < k die Zahl 2a − 1 ein Teiler
von n. Die ersten Mersenneschen Primzahlen sind
3, 7, 31, 127, 8191, 131071, 524287
17
Das Lesen dieses Absatzes ist für das Verständnis des folgenden nicht zwingend erforderlich.

168
Der Fall n = 211 −1 = 2047 = 23·89 zeigt, daß nicht jede Zahl mit dieser Eigenschaft eine
Primzahl ist. Eine vor kurzem mit einigem Aufwand gefundene Mersennesche Primzahl
ist

p = 257 885 161 − 1 (3.78)

Diese Primzahl besitzt 17 425 170 Dezimalstellen.

3.2.4 Chinesischer Restsatz


Ein Beispielproblem: Eine natürliche Zahl m soll einen geheimen Wert darstellen; es
könnte sich etwa um den Zahlencode eines Tresors handeln. Die Kenntnis dieser ge-
heimen Zahl m soll über drei verschiedene Personen aufgeteilt werden. Das heißt, jede
dieser Personen erhält eine Information über m, aus der sie jedoch m nicht ermitteln
kann. Tragen jedoch die drei Personen ihre Informationen zusammen, so soll sich daraus
m bestimmen lassen.
Die Lösung hierzu ist nicht besonders kompliziert: Man bestimmt zufällig zwei Zahlen
m1 , m2 ∈ IN , die beide in Größenordnung von m/3 liegen und setzt zusätzliche m3 =
m − m1 − m2 . Übermittelt man nun jede der Zahlen m1 , m2 und m3 an eine der drei
Personen, so kennt keine von ihnen m; gemeinsam können sie aber m = m1 + m2 + m3
berechnen.
Interessanter, aber auch komplizierter wird es, wenn bereits zwei der drei Personen in der
Lage sein sollen, gemeinsam m zu ermitteln. Um diese Aufgabe zu lösen, bedient man
sich der Rechnung mit Divisionsresten, so wie schon die Herleitung der Zahlendarstellung
im b-Stellenwertsystem auf Divisionsresten beruhte (siehe Seite 153).

Um das beschriebene Problem bearbeiten zu können sowie auch für viele andere An-
wendungen soll hier der sogenannte Chinesische Restsatz erläutert werden. Er wird
hier zunächst in einer stark vereinfachten Form formuliert; dieses ist ohnehin für viele
Anwendungen ausreichend.
Satz: Gegeben seien

1. m, n ∈ IN teilerfremd, d. h. mit ggT(m, n) = 1,

2. u, v ∈ ZZ beliebig.

Die Reste, die sich bei Teilung von u durch m und v durch n ergeben, seien r1 bzw. r2 ,
d. h. es sei
u = q1 · m + r1 mit 0 ≤ r1 < m
(3.79)
v = q2 · n + r2 mit 0 ≤ r2 < n

Dann gibt es eine ganze Zahl w ∈ ZZ , die bei Teilung durch m bzw. durch n ebenfalls
die Reste r1 und r2 aus (3.79) liefert:

w = q̃1 · m + r1
(3.80)
w = q̃2 · n + r2

Eine Zahl w ∈ ZZ mit dieser Eigenschaft ist bis auf Vielfache von m · n eindeutig
bestimmt.

169
Bemerkung: Die Aussage (3.80) bedeutet, daß man zu vorgegebenen Werten u und v
eine ganze Zahl w finden kann, die sowohl bei Teilung durch m als auch bei Teilung
durch n jeweils denselben Rest wie u bzw. wie v ergibt. Man bezeichnet dieses als Lösen
simultaner Kongruenzen

Beispiel: Für m = 4, n = 17 sowie u = 3, v = 8 ist w = 59 ein Lösung von (3.80).

Für die folgenden Anwendungen wird es sich wieder als sehr günstig erweisen, daß die
Berechnung der Lösung zum Chinesischen Restsatz sehr einfach ist und außerdem keinen
großen Aufwand erfordert.
Beweis und Berechnung des Chinesischen Restsatzes: Man verwendet den erweiterten
euklidischen Algorithmus (siehe (3.46)) und bestimmt mit diesem a, b ∈ ZZ mit

1 = a·m + b·n (3.81)

Damit kann man das w aus (3.80) berechnen:

w = v·a·m + u·b·n (3.82)

(3.82) liefert die Lösung zu (3.80). Mit diesem so definierten w ∈ ZZ berechnet man
nämlich in der Tat
w = v · a · m + u · (b · n) Nach (3.81) ist b · n = 1 − a · m;
dieses wird hier eingesetzt.
= v·a·m + u − u·a·m
= u + (v · a − u · a) · m Und hier kann man u = q1 ·m+r1
einsetzen (siehe (3.79)).
= q1 · m + r1 + (v · a − u · a) · m
= (q1 + v · a − u · a) ·m + r1 Dieses ist die erste Gleichung aus
(3.80).
| {z }
q̃1

Ebenso zeigt man die zweite Gleichung aus (3.80).


Es muß noch die Eindeutigkeit von w bis auf Vielfache von m · n gezeigt werden. Sei
dazu w1 ∈ ZZ eine weitere ganze Zahl, die entsprechende Gleichungen wie (3.80) erfüllt.
Man subtrahiert nun einfach die entsprechenden Gleichungen:

w1 = q̂1 · m + r1 w1 = q̂2 · n + r2
− w = q˜1 · m + r1 − w = q˜2 · n + r2
(w1 − w) = (q̂1 − q˜1 ) · m (w1 − w) = (q̂2 − q˜2 ) · n

⇔ m | (w1 − w) und n | (w1 − w)


⇔ (m · n) | (w1 − w) (wegen ggT(m, n) = 1, siehe (3.57))
⇔ (w1 − w) = k · m · n mit einem k ∈ ZZ
⇔ w1 = w + k · m · n d. h. w1 und w unterscheiden sich
in der Tat nur um eine Vielfaches
qed.
von m · n.

170
Beispiel: Zu m = 4, n = 17 sowie u = 3, v = 8 berechnet man zunächst (siehe auch
Seite 162)
1 = (−4) · 4 + 1 · 17
und setzt
w = 8 · (−16) + 3 · 17 = −77
w ist eine Lösung zu den vorgegebenen Werten bezüglich des Chinesischen Restsatzes.
Ändert man w um Vielfache von 4 · 17 = 68 ab, so bleibt w eine Lösung; als kleinste
positive Lösung erhält man damit

w = −77 + 2 · 68 = 59

Wie man nachrechnet, ist in der Tat 59 = 14 · 4 + 3 und 59 = 3 · 17 + 8.

Mit dem so formulierten Chinesischen Restsatz kann die Erweiterung des zu Beginn
dieses Abschnitts erläuterten Problems (siehe Seite 169) gelöst werden:
1. Zu dem gegebenen m ∈ IN bestimmt man drei natürliche Zahlen

n1 , n2 , n3 ∈ IN

mit folgenden Eigenschaften:

ni < m für i = 1, 2, 3 (3.83)


m < ni · nj für 1 ≤ i < j ≤ 3 (3.84)
1 = ggT(ni , nj ) für 1 ≤ i < j ≤ 3 (3.85)

2. Man berechnet

m = qi · ni + ri für i = 1, 2, 3 (3.86)

3. Jede der drei Personen erhält ein Wertepaar

(ri , ni ) (3.87)

Die i-Person weiß zwar, daß die Gleichung (3.86) besteht; wegen (3.83) hat sie aber keine
Chance, daraus m zu ermitteln. Nun sei angenommen, die erste und die zweite Person
kommen zusammen. Sie berechnen dann mit dem Chinesischen Restsatz ein M ∈ ZZ
mit
M = q̃1 · n1 + r1
(3.88)
M = q̃2 · n2 + r2

Da der zunächst noch unbekannte Wert m die entsprechenden Gleichungen (3.86) erfüllt,
können sich nach dem Chinesischen Restsatz M und m nur um ein Vielfaches von n1 · n2
unterscheiden; d. h. es muß gelten:

M = m + c · (n1 · n2 ) mit c ∈ ZZ (3.89)

171
Da weiterhin gemäß (3.84) noch 0 < m < (n1 · n2 ) bekannt ist, kann m nun bestimmt
werden: Man teilt dazu einfach M durch n1 · n2 , der Divisionsrest ist dann m.18

Beispiel: Der geheime Wert sei m = 1234. Dazu werden die drei Zahlen n1 = 41, n2 = 53
und n3 = 61 ausgewählt. Die Bedingungen (3.83), (3.84), (3.85) sind damit erfüllt. Man
führt nun die Divisionen mit Rest durch:

1234 = 30 · 41 + 4, 1234 = 23 · 53 + 15, 1234 = 20 · 61 + 14

und übergibt jeder der drei Personen eines der Wertepaar

(4, 41), (15, 53), (14, 61)

Keine der drei Personen kann daraus alleine den Werte n = 1234 ermitteln. Angenom-
men, die erste und die zweite Personen kommen zusammen. Sie wenden den Chinesischen
Restsatz an und berechnen damit:
22 · n1 − 17 · n2 = 1 (erweiterter euklidischer Algorithmus)
15 · 22 · n1 − 4 · 17 · n2 = 9926 (chinesischer Restsatz)
4 · n1 · n2 + 1234 = 9926 (Teilung mit Rest)

In der letzten Zeile erscheint als Divisionsrest der geheime Wert n. Jetzt kommen die
erste und die dritte Person zusammen:
3 · n1 − 2 · n3 = 1 (erweiterter euklidischer Algorithmus)
14 · 3 · n1 − 4 · 2 · n3 = 1234 (chinesischer Restsatz)

Hier erscheint sofort der geheime Wert; eine Teilung mit Rest durch n1 · n3 war nicht
mehr notwendig. Die zweite und die dritte Person berechnen zusammen:

−23 · n2 + 20 · n3 = 1 (erweiterter euklidischer Algorithmus)


14 · (−23) · n2 + 15 · 20 · n3 = 1234 (chinesischer Restsatz)

Auch hier erscheint ohne weitere Division bereits der geheime Wert.

Auf Seite 169 wurde nur eine einfache Version des Chinesischen Restsatzes angegeben.
Der vollständige Chinesische Restsatz, der nicht nur den Fall zweier Reste sondern den
Fall einer beliebigen Anzahl von Resten behandelt, lautet:
Satz: Gegeben seien m1 , m2 , . . . , mk ∈ IN , k ≥ 2 mit

ggT(mi , mj ) = 1 für 1 ≤ i < j ≤ k (3.90)

Weiterhin seien u1 , u2 , . . . , uk ∈ ZZ gegeben. Ist dazu für i = 1, . . . , k

ui = qi · mi + ri mit 0 ≤ ri < mi (3.91)


18
Siehe [8], dort wird dieses für eine beliebige Personenzahl erläutert.

172
so gibt es ein w ∈ ZZ mit

w = q̃i · mi + ri für i = 1, . . . , k (3.92)

w ist bis auf Vielfache von (m1 · m2 · . . . · mk ) eindeutig bestimmt.

Bemerkung: Die Bedeutung ist entsprechend wie beim einfachen Chinesischen Restsatz:
Man kann unter den gegebenen Voraussetzungen eine Zahl w finden, die bei Teilung
durch mi jeweils denselben Rest wie ui ergibt.

Beweisskizze des vollständigen Chinesischen Restsatzes: Eine vollständige Induktion


über k, die Anzahl der Rest u1 , . . . , uk wird durchgeführt.
Induktionsanfang: Sei k = 2. Dann folgt die Behauptung aus dem einfachen“ Chinesi-

schen Restsatz auf Seite 169.
Induktionsschluß: Sei k > 2. Die Behauptung sei für k − 1 bereits bewiesen. Da die k − 1
Werte m1 , m2 , . . . , mk−1 ∈ IN die Voraussetzung (3.90) erfüllen, gibt es ein ŵ ∈ ZZ mit

ŵ = q̂i · mi + ri für i = 1, . . . , k − 1 (3.93)

Zur Abkürzung sei M = m1 · m2 · . . . · mk−1 . Der Wert ŵ aus (3.93) ist dann bis auf
Vielfache von M eindeutig bestimmt. Da die m1 , m2 , . . . , mk−1 zu mk teilerfremd sind,
sind auch M und mk teilerfremd (siehe (3.60)). Setzt man jetzt noch

ŵ = q̂ · M + r̂ (3.94)

so gibt es aufgrund des einfachen“ Chinesischen Restsatzes ein w ∈ ZZ mit



w = q · M + r̂
(3.95)
w = q̃k · mk + rk

Man rechnet nun leicht nach, daß (3.92) von w erfüllt wird. Außerdem ist w bis auf
Vielfache von M · mk =m1 · m2 · . . . · mk−1 · mk eindeutig bestimmt. qed.

3.3 Gruppen, Ringe, Körper


3.3.1 Grundlegende Definition
3.3.1.1 Einführung
Im vorherigen Abschnitt wurden einige bedeutsame Eigenschaften der ganzen Zahlen ZZ
hergeleitet. Dazu gehört ganz wesentlich die Möglichkeit, Rechnungen, wie sie etwa der
euklidische Algorithmus sowie der Chinesische Restsatz erlauben, durchzuführen.
Die Herleitung des euklidischen Algorithmus sowie des Chinesische Restsatzes beruhten
vor allem auf zwei Dingen:

• die Grundrechenarten mit ihren Rechengesetzen

• der Teilung mit Rest

173
Aber man stellt fest, daß es noch weitere Bereiche gibt, bei denen entsprechende Grund-
rechenarten mit entsprechenden Rechengesetzen wie bei den ganzen Zahlen anzutreffen
sind. Ein wichtiges Beispiel dafür bildet die bekannte Menge der Polynome mit reellen
Koeffizienten; man schreibt dafür

IR[X] = an X n + an−1 X n−1 + . . . + a1 X + a0 | ai ∈ IR



(3.96)

Entscheidend kommt hinzu, daß auch hier eine Teilung mit Rest möglich ist. Diese
Teilung mit Rest verwendet den Grad eines Polynoms. Für ein Polynom

p(X) = an X n + an−1 X n−1 + . . . + a1 X + a0 mit an 6= 0 (3.97)

setzt man bekanntlich

grad(p(X)) = n (3.98)

Nach ist (3.98) der Grad gerade der größte vorkommende Exponent der Unbestimmten
X in dem Polynom p(X). Damit kann die Teilung mit Rest für reelle Polynome
formuliert werden:
Satz: Seien p(X), s(X) ∈ IR[X] mit q(X) 6= 0. Dann gibt es Polynome q(X), r(X) ∈
IR [X] mit

p(X) = q(X) · s(X) + r(X) dabei ist grad(r(X)) < grad(s(X)) (3.99)

Da somit ähnliche Grundvoraussetzungen wie bei den ganzen Zahlen anzutreffen sind,
kann hier ein Großteil der Betrachtung des vorherigen Abschnitts übertragen werden.
Dazu gehören u. a. der euklidische Algorithmus sowie der Chinesische Restsatz. An
die Stelle der Primzahlen treten hier die Polynome, die sich nicht als Produkt von
Polynomen kleineren Grades schreiben lassen, wie z. B. p(X) = X + 3 oder p(X) =
X 2 + 1.
Man könnte jetzt beginnen, zahlreiche Überlegungen und Herleitungen des letzten Ab-
schnitts noch einmal für reelle Polynome und u. U. weitere Male für weitere Bereiche,
bei denen ebenfalls die entsprechenden Voraussetzungen vorliegen, durchzuführen. Bes-
ser und üblich ist jedoch eine andere Vorgehensweise:

• Man versucht, die Betrachtungen möglichst einheitlich durchzuführen.

• Man nimmt dazu Verallgemeinerungen vor, die es gestatten, verschiedene Bereiche


mit sich entsprechenden Eigenschaften unter einem Blickwinkel zu betrachten.

• Im vorliegenden Fall geht man nur von der Voraussetzung aus, daß bestimmte
Grundrechenarten mit gewissen Rechenregeln vorhanden sind.19
Die angestellten Betrachtungen sind dann in gleichem Maße für alle Bereiche
gültig, die diese Voraussetzung erfüllen.

Mengen, für deren Elemente gewisse Rechenoperationen möglich sind und bei denen
zusätzlich noch gewisse Rechenregeln erfüllt werden, bezeichnet man als algebraische
Strukturen.
19
Die Teilung mit Rest wird zunächst zurückgestellt.

174
Führt man seine Betrachtung für allgemeine algebraische Strukturen durch, so bietet
das neben der Möglichkeit zur Verallgemeinerung den zusätzlichen Vorteil, daß viele
Rechnungen und Überlegungen erheblich vereinfacht werden.20

Im folgenden wird kurz in die folgenden algebraischen Strukturen eingeführt:


• Gruppen,
• Ringen und
• Körper

Eine Gruppe ist eine Menge G, für deren Elemente eine Verknüpfung definiert ist, für
die die folgenden Rechenregeln gelten:
1. Abgeschlossenheit
a, b ∈ G ⇒ a · b ∈ G
2. Assoziativgesetz
a, b, c ∈ G ⇒ (a · b) · c = a · (b · c)
3. neutrales Element
Es gibt ein Element 1 ∈ G
mit a · 1 = a für alle a ∈ G
4. inverses Element
a∈G ⇒ Es gibt dazu ein Element
ã ∈ G mit ã · a = 1
Schreibweise: ã = a−1
5. Ist zusätzlich noch das Kommutativgesetz erfüllt
a, b ∈ G ⇒ a · b = b · a
so spricht man von einer kommutativen Gruppe oder von einer abelschen
Gruppe.
Es ist grundsätzlich bedeutungslos und hängt vom speziellen Einzelfall ab, ob man als
Verknüpfungszeichen wie hier den Malpunkt “·“ oder das Pluszeichen “+“ verwendet.
Im letzten Fall spricht man von einer additiv geschriebenen Gruppe und bezeichnet das
neutrale Element durch Null (“0“) und das Inverse zu einem a ∈ G durch −a. In der
Regel wird jedoch der Punkt “·“ verwendet.

Beispiele für kommutative Gruppen:

• (ZZ , +): die ganzen Zahlen mit der Addition

• (IR \ {0}, ·): die reellen Zahlen ohne die Null mit der Multiplikation

• {ak | k ∈ ZZ }: alle Potenzen der reellen Zahl a mit ganzzahligen Exponenten

20
So läßt sich zum Beispiel durch eine allgemeinere Vorgehensweise der Beweis des Chinesischen
Restsatzes erheblich vereinfachen.

175
Wie man an diesen Beispielen erkennt, gibt es sowohl unendliche als auch endliche
Gruppen. Die letzteren werden im Späteren eine besondere Rolle spielen.

Beispiele für nicht kommutative Gruppen sind:

• die Menge der invertieren Matrizen der Dimension n mit der üblichen Matrizen-
multiplikation als Verknüpfung:

GL(n, IR ) = {A ∈ Mn,n (IR ) | det(A) 6= 0} (3.100)

• die Menge der orthogonalen Matrizen der Dimension n:

O(n, IR ) = A ∈ Mn,n (IR ) | A ◦ At = E



(3.101)

Aufgabe: Man weise nach, daß es sich bei den Mengen (3.100) und (3.101) tatsächlich
um Gruppen handelt.
F
Ein Ring ist eine Menge R, für deren Elemente zwei Verknüpfungen (“+“ und “·“)
definiert sind, für die die folgenden Rechenregeln gelten:
1. Addition

(a) Abgeschlossenheit
a, b ∈ R ⇒ a + b ∈ R
(b) Kommutativgesetz
a, b ∈ R ⇒ a + b = b + a
(c) Assoziativgesetz

a, b, c ∈ R ⇒ (a + b) + c = a + (b + c)

(d) neutrales Element

Es gibt ein Element 0 ∈ R


mit a + 0 = a für alle a ∈ R

(e) inverses Element

a∈R ⇒ Es gibt dazu ein Element


ã ∈ R mit ã + a = 0

Schreibweise: ã = −a

2. Multiplikation

(a) Abgeschlossenheit
a, b ∈ R ⇒ a · b ∈ R
(b) Assoziativgesetz
a, b, c ∈ R ⇒ (a·b)·c = a·(b·c)

176
3. Distributivgesetz
a, b, c ∈ R ⇒ a · (b + c) = a · b + a · c
Besitzt der Ring bezüglich der Multiplikation ein neutrales Element:
Es gibt ein Element 1 ∈ R \ {0}
mit a·1 = a für alle a ∈ R
so spricht man von einem Ring mit Eins.
Ist die Multiplikation des Ringes kommutativ:
a, b ∈ R ⇒ a · b = b · a
so spricht man von einem kommutativen Ring

Beispiele für kommutative Ringe mit Eins sind:


R =Z
R = R[X] = { reelle Polynome }

Ein Beispiel für einen nicht kommutativen Ring bilden die quadratischen reellen Ma-
trizen Mn,n (IR ) für n > 1 (Bezeichnung: Matrizenring“) mit der Addition sowie der

Matrizenmultiplikation:
Bemerkung: Bezüglich der Addition ist ein Ring eine kommutative Gruppe.
Bemerkung: In einem Ring kann folgendes vorkommen:
• Es kann von Null verschiedene Elemente geben, die bezüglich der Multiplikation
kein Inverses Element besitzen.
• Es kann Nullteiler geben. Das heißt, es kann Elemente a, b ∈ R mit
a·b = 0 und a, b 6= 0 (3.102)
geben.
Ein Beispiel hierfür liefert der Matrizenring Mn,n (IR ) für n > 1.
Hilfssatz: Für einen Ring R gilt
1. Für alle a ∈ R ist a · 0 = 0.
2. Ist R kommutativ mit Eins und a ∈ R invertierbar, so ist a kein Nullteiler.
Der Beweis wird als Aufgabe überlassen. Hinweis zum Beweis der zweiten Aussage: Man
gehe von der Gleichung a · b = 0 mit einem b ∈ R aus.
F
Besitzt in einem kommutativen Ring mit Eins jedes von Null verschiedenes Element
bezüglich der Multiplikation ein Inverses, so bezeichnet man den Ring als Körper.
Bekannte Körper sind
• Q| : die rationalen Zahlen
• IR : die reellen Zahlen
Im folgenden werden noch weitere Körper hergeleitet werden, die sich ebenso wie diese
drei bekannten Körper zahlreiche Anwendungen besitzen.
Bemerkung: Aufgrund des Hilfssatzes von Seite 177 ist ein Körper nullteilerfrei.

177
3.3.1.2 Endliche kommutative Gruppen
In diesem Abschnitt sei G stets eine kommutative Gruppe, die nur endlich viele Elemente
besitzt. Die Anzahl der Elemente sei stets

g = #G (3.103)

Die Anzahl der Elemente einer endlichen Gruppe wird üblicherweise als Ordnung der
Gruppe bzw. als Gruppenordnung bezeichnet. Man schreibt dafür

ord(G) (3.104)

Beispiel: Einige Gruppen mit kleinen Werten für g sind:

g =1 : G = {1}
g = 2 : G = { 1, −1 }
g = 3 : G = { e, u, v }
mit der Verküpfungstabelle : · e u v
e e u v (3.105)
u u v e
v v e u
g = 4 : G = { 1, j, −1, −j } mit 1 als neutralem Element
und den Festsetzungen (−1)2 = 1, j2 = −1, (−1) · j = −j

Wie diese Beispiele zeigen, gibt es sehr kleine Gruppen.

Aufgabe: Man stelle zur eben angegebenen Gruppe mit vier Elementen die vollständige
Verknüpfungstabelle auf.

Ganz zentral bei der Behandlung endlicher Gruppen ist der folgende
Satz: Ist #G = g die Ordnung der Gruppe G, so besteht für jedes Element a ∈ G die
Gleichung.

ag = 1 (3.106)

(3.106) besagt, daß man stehts das neutrale Element der Gruppe erhält, wenn ein be-
liebiges Element der Gruppe mit der Gruppenordnung potenziert
Begründung: Sei wieder g = #G; dann läßt sich G durch eine passende Durchnumme-
rierung ihrer Elemente folgendermaßen darstellen

G = {a1 , a2 , . . . , ag }

Dabei sind die ai genau die g Elemente von G. Sei nun a ∈ G beliebig, dann ist auch

G = {a · a1 , a · a2 , . . . , a · ag }

Denn alle a · a1 , a · a2 , . . . , a · ag sind paarweise verschieden; wäre nämlich

a · ai = a · aj | · a−1
⇒ ai = aj Widerspruch, da ai 6= aj

178
Somit sind die a · a1 , a · a2 , . . . , a · ag genau g verschiedene Gruppenelemente. Folglich
müssen dieses alle Gruppenelemente sein. Weiter gilt (Trick!):

a1 · a2 · ... · ag (Produkt aller Elemente)


= (a · a1 ) · (a · a2 ) · · · · · (a · ag ) (ebenfalls Produkt aller Elemente)
= ag · (a1 · a2 . . . ag ) (G ist kommutativ!)

Also hat man

a1 · a2 · ... · ag = ag · (a1 · a2 . . . ag ) | (a1 · a2 . . . ag )−1


⇒ 1 = ag

qed.

Beispiel: Man betrachte wieder die Gruppe G = {1, −1, j, −j} aus den Beispielen
in (3.105). Hier ist #G = 4, und in der Tat ist

j 4 = (j 2 )2 = (−1)2 = 1

(−1)4 = ((−1)2 )2 = 12 = 1
Wie man am Beispiel von −1 ∈ G erkennt, ist zwar wie zu erwarten,

(−1)g = 1

mit g = 4 = #G. Es gilt aber bereits

(−1)2 = 1

d.h. es gibt bereits einen Exponenten e ∈ N mit 1 ≤ e < g, so daß (−1)e = 1 ist.

Für eine allgemeine endliche (und kommutative) Gruppe G und ein Element a ∈ G
definiert man daher die sogenannte Ordnung von a:

ord(a) = min{e ∈ N|ae = 1} (3.107)

Offensichtlich ist wegen (3.106) ord(a) ≤ g = #G. Darüberhinaus gilt der wichtige
Satz:

ord(a) | g (g = #G) (3.108)

das heißt, die Ordnung eines Gruppenelements ist ein Teiler der Gruppenordnung. Zur
Begründung von (3.108) setzt man für a ∈ G

e = ord(a)

und nimmt eine Teilung mit Rest vor:

g : e = q Rest r

bzw.
g =q·e + r mit 0 ≤ r < e

179
Angenommen, e wäre kein Teiler von g, d. h. der Divisionsrest r wäre ungleich Null,
dann gelte
1 = ag (wegen (3.106))
= aq·e+r (wegen g = q · e + r)
= (ae )q ·ar (da e = ord(a))
| {z }
=1
= 1q · ar = ar
⇒ 1 = ar
Dieses ist ein Widerspruch, denn
1≤r<e
und e = ord(a) ist minimal mit e ≥ 1 und ae = 1. qed.

Beispiel: Bei der Gruppe G = {1, −1, j, −j} aus (3.105) hat man
ord(1) = 1
ord(-1) = 2
ord(j) = 4
ord(-j) = 4
Alle diese Werte sind Teiler von 4 = #G.

Ganz genauso wie den letzten Satz beweist man den folgenden
Zusatz: Seien a ∈ G mit e = ord(a) und k ∈ IN , dann gilt

ak = 1 ⇒ e|k (3.109)

Im letzten Satz wurde dieses für den Spezialfall k = g gezeigt. Dessen Beweis läßt sich
unmittelbar auf diesen Zusatz übertragen.

Bemerkung: Das kartesische Produkt zweier Gruppen ist wieder eine Gruppe. Sind G1
und G2 , so lautet deren kartesisches Produkt

G1 × G2 = {(a, b) | a ∈ G1 , b ∈ G2 } (3.110)

Die Verknüpfung erfolgt komponentenweise:

(a1 , b1 ) · (a2 , b2 ) = (a1 · a2 , b1 · b2 ) (3.111)

Dabei wird in der ersten Komponente die für die Gruppe G1 definierte Multiplikati-
on und entsprechend in der zweiten Komponente die für die zweite Gruppe definierte
Multiplikation ausgeführt. Wegen

(a, b) · (1, 1) = (a · 1, b · 1) = (a, b)

ist (1, 1) das neutrale Elemente der Gruppe G1 × G2 ; dabei ist die Eins in der ersten
Komponente das neutrale Element von G1 , und die in der zweiten Komponente das
neutrale Elemente von G2 .

180
Beispiel: Aus den beiden Gruppen (siehe (3.105))

G1 = { 1, −1 } , G2 = { 1, j, −1, −j }

bildet man das kartesische Produkt


(1, 1), (1, j), (1, −1), (1, −j)
 
G1 × G2 = (3.112)
(−1, 1), (−1, j), (−1, −1), (−1, −j)

dann gilt wegen (3.105) und (3.106) für jedes Element der Gruppe

(a, b)4 = (a4 , b4 ) = (1, 1)

3.3.2 Restklassenringe über ZZ


3.3.2.1 Einführung und Motivation
Zunächst folgt als Einführung und Motivation die Idee eines asymmetrischen Verfahrens
mit öffentlichem Schlüssel (RSA-Verfahren).
Wichtiger Hinweis: Hier wird wieder nur die Idee erläutert; in der Art, wie das Verfahren
hier beschrieben wird, ist es nicht anwendbar.
Ansatz: Sei e ∈ N möglichst groß, dann gilt

• Wurzelziehen

e
y

ist schwer21 und daher gut für Entschlüsselung, die nur für Befugte durchführbar
sein soll.

• Potenzieren mit dem Exponenten e

xe

ist leicht und daher gut für Verschlüsselung.

Das Verfahren:
B kennt irgendwo her“ (siehe später) eine Möglichkeit zum Ziehen der e-ten Wurzel

für einen Exponenten e ∈ IN . B nennt diese Möglichkeit bzw dieses Programm k2“.

k2 ist Bs privater Schlüssel und wird daher geheim gehalten. k1 = e ist Bs
öffentlicher Schlüssel und wird von B veröffentlicht; jeder kann somit e lesen.
Damit ist eine sicherer Nachrichtenversand an B durch eine beliebige Person A möglich:

• A will B eine vertrauliche Nachricht M senden

• A zerlegt M in Blöcke Mi (z.B. mit einer Größe von 128, 256 oder 512 Bits)
21
zumindest ohne irgendwelche Zusatzinformationen

181
• A will jeden Block Mi einzeln an B senden und faßt dabei Mi als Dualzahl auf,
also:
Mi ∈ N

• Vor dem Versenden erfolgt die Verschlüsselung mit Bs öffentlichem Schlüssel k1


Ci = e(Mi , k1 ) = Mie

• A versendet Ci an B
• B entschlüsselt Ci mit seinem geheimen Schlüssel k2 und erhält Mi :
p
Mi = d(Ci , k2 ) = e Ci

Zum Brechen: Der Angreifer müßte in der Lage sein, für y



e
y
zu berechnen. Und in der Tat:
• Dieses ist mit Logarithmus und e-Funktion leicht möglich:
√ 1
e
y = exp( log(y))
e
Diese Funktionen können mit Hilfe ihrer Potenzreihen22 berechnet werden.
• Ohnehin stellt sich die Frage: Wie soll nur eine einzige Person (nämlich B) in der
Lage sein, zu einem gegebenen
e∈N
die e-te Wurzel zu ziehen?
Aber eine Rettung“ des RSA-Systems läßt sich auf folgendem Wege bewerkstelligen:

• Keine Verwendung der bekannten Zahlen
• Übergang zu neuen“ Zahlenbereichen, dabei:

1. Die Zahlenbereiche sollen endlich sein.
2. Die aus Z bekannten Regeln der Grundrechenarten (+, −, ∗) sollen erhalten
bleiben. Es sollte sich daher um kommutative Ringe mit Eins handeln.
Zur Konstruktion solcher kommutativen Ringe mit Eins, die nur endlich viele Elemente
besitzen, geht man von Z, dem Ring der ganzen Zahlen aus.23

Um solche endlichen Ringe konstruieren zu können, muß als Vorbeitung zunächst der
Begriff der Äquivalenzrelation eingeführt werden.
Unter einer Relation Rel zwischen zwei Mengen A und B versteht man bekanntlich eine
Teilmenge des kartesischen Produktes:
Rel ⊂ A × B (3.113)

22
Potenzreihen werden in der Vorlesung Mathematik 2 für I“ behandelt.
23 ”
Da man zunächst noch keine speziellen Eigenschaften der ganzen Zahlen benötigt, könnten hier die
ersten Teile der Betrachtungen für einen allgemeinen kommutativen Ring mit Eins angestellt werden.

182
Beispiele:

1.
)
A = {alle Personen}
Rel = besitzt“ (3.114)
B = {alle Autos} ”

2. Zu A = B = IR ist Rel = kleiner als“ die durch



(x, y) ∈ Rel ⇔ x < y (3.115)

gegebene Relation.

3. Die Relation Rel = hat als Quadrat“ ⊂ IR × IR ist durch



(x, y) ∈ Rel ⇔ x2 = y (3.116)

definiert.

Wie die letzten beiden Beispiele zeigen, kann eine Relation nicht nur zwischen zwei
verschiedenen Mengen sondern auch zwischen einer Menge A und sich selber bestehen;
es handelt sich dann um eine Teilmenge von A × A.
Von besonderem Interesse sind Relationen Rel ⊂ A × A, die eine oder mehrere der
folgenden Eigenschaften aufweisen:
1. reflexiv : (x, x) ∈ Rel für alle x ∈ A
2. symmetrisch : (x, y) ⊂ Rel ⇒ (y, x) ⊂ Rel (3.117)
2. transitiv : (x, y), (y, z) ⊂ Rel ⇒ (x, z) ⊂ Rel
Definition: Eine Relation Rel ⊂ A × A mit den drei Eigenschaften (3.117) heißt Äqui-
valenzrelation über A. Man schreibt bei einer Äquivalenzrelation
x ∼ y für (x, y) ∈ Rel (3.118)
Man sagt: x ist äquivalent zu y“.

Beispiele: Für A = IR ist

• kleiner oder gleich“ (x ≤ y) keine Äquivalenzrelation, denn die Symmetrie ist



verletzt. Die Reflexivität und die Transitivität sind jedoch erfüllt,

• hat als Quadrat“ keine Äquivalenzrelation, denn keine der drei Eigenschaften aus

(3.118) ist erfüllt,

• die Relation

Rel = { (x, y) ∈ IR2 | sin(x) = sin(y) } (3.119)

eine Äquivalenzrelation.

183
Aufgabe: Man begründe, daß (3.119) eine Äquivalenzrelation ist.

Beispiel: Für die Menge


A = {alle e-Geldscheine}
ist die Relation

Rel = “aufgedruckt ist derselbe Geldwert“ (3.120)

offensichtlich eine Äquivalenzrelation. Zwei Geldscheine desselben Betrags sind natürlich


gleichwertig.

Um Äquivalenzrelationen für die hier vorgesehenen Zwecke einsetzen zu können, benötigt


man den folgenden Begriff.
Definition: Sei Rel eine Äquivalenzrelation über der Menge A. Dann heißt für x ∈ A die
Menge

x = {y ∈ A | x ∼ y} (3.121)

Äquivalenzklasse von x.
Die Äquivalenzrelation x enthält somit alle zu x äquivalenten Elemente.

Beispiel: Zu der Relation (3.120) besteht die die Äquivalenzklasse

5e-Schein mit Nummer U50685699578 = { alle 5e-Scheine } (3.122)

Definition: Ist Kl ⊂ A eine Äquivalenzklasse zur Äquivalenzrelation Rel ⊂ A × A mit


Kl = x für ein x ∈ A, so heißt x Repräsentant der Äquivalenzklasse Kl.

Beispiel: Der in (3.122) genannte Geldschein ist eine Repräsentant der Menge aller 5e-
Scheine.

Satz: Ist Rel ⊂ A × A eine Äquivalenzrelation über der Menge A, so gilt mit x, y ∈ A

1. x = y ⇔ x ∼ y
2. x ∩ y 6= ∅ ⇔ x ∼ y
(3.123)
3. A ist disjunkte Vereinigung aller Äquivalenz-
klassen zu Rel.

Beweis: Aufgabe!
Eine Äquivalenzrelation bewirkt immer eine Zerlegung der betreffenden Menge. Sind
etwa nur die endlich vielen Äquivalenzklassen a1 , a2 , . . . , ak vorhanden, so ergibt
sich eine Zerlegung der Menge A der Form

184
a1 a2 a4 ··· ak

Abbildung 3.1: Zerlegung der Menge A in Äquivalenzklassen

Beispiel zur Äquivalenzrelation (3.120):

{alle e-Geldscheine} = 5e-Schein mit Nummer U50685699578


∪ 10e-Schein mit Nummer X72591257738
∪ 20e-Schein mit Nummer U83384149955
∪ 50e-Schein mit Nummer V02387040034 (3.124)
∪ 100e-Schein mit Nummer L00105481787
∪ 200e-Schein mit Nummer P00641307178
∪ 500e-Schein mit Nummer S00630387745

Definition: Rel sei eine Äquivalenzrelation über der Menge A. Ist dann P ⊂ A eine
Teilmenge mit den beiden folgenden Eigenschaften

1. x, x0 ∈ P ⇒ x 6∼ x0
2. A =
[
x (3.125)
x∈P

so heißt P Repräsentantensystem der Äquivalenzrelation Rel.


Ein Repräsentantensystem enthält aus jeder Äquivalenzklasse genau ein Element.

Beispiel: In (3.124) ist ein Repräsentantensystem zur Äquivalenzrelation (3.120) aufge-


stellt.
Zu der in Abbildung 3.1 dargestellten Äquivalenzrelation gehört das Repräsentanten-
system a1 , a2 , . . . , ak .

Aufgabe: Geben Sie ein Repräsentantensystem zur Äquivalenzrelation (3.119) an.


F
Jetzt kann der Typ von Äquivalenzrelation definiert werden, der im Folgenden die be-
deutende Rolle spielen wird. Gegeben sei jetzt bis zum Ende dieses Abschnitts stets

• der Ring der ganzen Zahlen Z24 ,


24
Anstelle von Z könnte hier ebenso ein beliebiger kommutativer Ring mit Eins verwendet werden.

185
• ein fest gewähltes Element n ∈ Z \ {0, ±1}
Dazu sei ab jetzt die folgende Relation gegeben (mit a, b ∈ Z):

a ∼ b ⇔ n | (a − b) ⇔ es gibt ein s ∈ Z mit (a − b) = s · n


(3.126)
⇔ a = b + s · n mit einem s ∈ Z

Man erkennt sofort, daß es sich bei (3.126) um eine Äquivalenzrelation handelt. Zum
Nachweis der Transitivität zeigt man:

a ∼ b, b ∼ c ⇒ n | (a − b) und n | (b − c)

⇒ n | (a − b) + (b − c)
| {z }
=a−c

⇒ n | (a − c)
⇒ a ∼ c

Der Nachweis der Symmetrie und der Reflexivität wird als Aufgabe überlassen.

Für die Äquivalenzrelation (3.126) besteht eine besondere Schreibweise. Sind a, b ∈ Z


äquivalent, d. h. ist a ∼ b bezüglich (3.126), so schreibt man dafür

a ≡ b mod n (3.127)

und sagt a ist kongruent b modulo n“. Ein zugehöriges Repräsentantensystem nennt

man Repräsentantensystem modulo n oder auch Restsystem modulo n.

Beispiel:

• n = 10: 5 ≡ 55 mod 10

• n = 6: 2 ≡ −10 mod 6

Beispiel: Zwei Tage sind bezüglich des Arbeitslebens und des sonstigen sozialen Lebens
gleichwertig. Das betrifft zum Beispiel Stundenpläne an einer Hochschule und Fahrpläne
bei der Eisenbahn. Numeriert man alle Tag durch – ein typischer Beginn für diese Nu-
merierung ist der 01.01.1900 – so sind in diesem Sinne zwei Tage gleichwertig, wenn sich
ihre Tagnummern um ein Vielfaches von 7 unterscheiden. Bei Tagnummern a und b ist
somit oft die Kongruenz a ≡ b mod 7 von Interesse. Die sieben Wochentage Montag“,

Dienstag“, . . ., Sonntag“ stellen die Äquivalenzklassen dar.
” ”

Für a ∈ Z besitzt die zugehörige Äquivalenzklasse die Gestalt

a = {b ∈ Z | a ≡ b mod n}
= {a + s · n | s ∈ Z} (3.128)

186
Die Äquivalenzklassen dieser Äquivalenzrelation werden als Restklassen bezeichnet.
Die Menge der Äquivalenzklassen der Äquivalenzrelation (3.126) wird eine große Rolle
spielen. Daher trifft man die folgende
Definition:
 
Menge der Restklassen der Rela-
Zn = (3.129)
tion (3.126) bezüglich n

Über Zn folgt ein sehr zentraler


Satz: Die Menge Zn , der Restklassen bezüglich n bildet einen kommutativen Ring mit
Eins; die Verknüpfungen erfolgen repräsentantenweise:
a + b = a+b (3.130)
a · b = a·b (3.131)
Beweis: Zu zeigen ist, daß die durch (3.130), (3.131) definierten Verknüpfungen wohlde-
finiert sind. Das heißt, stellt man die auf der rechten Seite von (3.130), (3.131) stehen-
den Restklassen durch andere Repräsentanten dar, so liefern die durch (3.130), (3.131)
definierte Addition und Multiplikation als Ergebnisse wieder dieselben Restklassen.
Hat man etwa a = c sowie b = d , so ist nachzurechnen, daß gilt
a + b = c + d ⇔ a+b = c+d
⇔ a+b ∼ c+d
(3.132)
a · b = c · d ⇔ a·b = c·d
⇔ a·b ∼ c·d
Um nun (3.132) zu begründen, sei mit s, t ∈ Z
c = a + s · n und d = b + t · n (3.133)
Dann folgt
c + d = a+s·n + b+t·n
= (a + b) + (s + t) · n
⇒ c+d ∼a+b ⇔ c+d = a+b
c · d = (a · n) · (b + t · n)
= a · b + (a · t + s · b + s · t · n) · n
⇒ c·d ∼a·b ⇔ c·d = a·b
Damit wurden beide Aussagen in (3.132) nachgerechnet. qed.
F
Weiterhin gilt für den Ring Zn :
Nullelement in Zn :
0 = s·n mit beliebigem s ∈ Z (3.134)

Negatives zu a
−a denn a + −a = a + (−a) = 0 (3.135)

187
Einselement in Zn :

1 = 1+s·n mit beliebigem s ∈ Z (3.136)

Beispiel: Sei n = 3. Für jedes a ∈ Z liefert die Teilung mit Rest

a = q·n + r mit r = 0, 1 oder 2 (3.137)

a ist daher zu einer der drei Zahlen 0, 1 oder 2 kongruent modulo 3. Da andererseits
diese drei Zahlen zueinander nicht kongruent modulo 3 sind, bilden sie ein Restsystem
modulo 3, also hat man mit der Bezeichnung (3.129)

ZZ3 = { 0 , 1 , 2 } (3.138)

Damit berechnet man:


2
1 = 1 · 1 = 1·1 = 1
2
(3.139)
2 = 2 · 2 = 2·2 = 4 = 1

Damit folgt etwa: Ist a ∈ ZZ nicht durch 3 teilbar, also a = 1 oder a = 2 , so ist
a2 = 1 , d. h. a2 = 1 + s · 3. Damit wurde gezeigt, daß jede Quadratzahl entweder ein
Vielfaches von 3 ist oder mit Rest 1 durch 3 teilbar ist.

Beispiel und Aufgabe: Sei n = 10.

ZZ10 = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } (3.140)

Welche der Restklassen aus (3.140) sind Ergebnis der folgenden Rechnungen?

• − 6 = ?
• 7 + 8 = ?
• 3 · 7 = ?
• 2 · 5 = ?

3.3.2.2 Weitere Bezeichnungen und Endlichkeit


Bemerkung: Die im letzten Abschnitt durchführten Betrachtungen hätten anstelle von
Z mit einem beliebigen kommutativen Ring R mit Eins durchgeführt werden können;
bedeutsam ist z. B. der Fall R = R[X] (Ring der reellen Polynome). Für diesen und die
folgenden Abschnitte trifft das jedoch nicht mehr zu; es wird davon ausgegengen, daß
den folgenden Betrachtungen der Ring Z zu Grunde liegt.

Satz: Zu jedem a ∈ Z gibt es genau ein r ∈ Z mit 0 ≤ r < n so daß gilt

a ∼ r d. h. a ≡ r mod n (3.141)

188
Begründung: Man nimmt eine Teilung mit Rest (siehe (3.14)) vor:

a = k·n + r mit eindeutigem r mit 0 ≤ r < n (3.142)

Insbesondere gilt dann n | (a − r) und daher a ∼ r bzw. a ≡ r mod r. qed.

Wichtige Folgerung: Die n Werte

0, 1, . . . , n − 1 (3.143)

bilden ein Restsystem modulo n (siehe Seite 186 sowie (3.125)).


Begründung: Nach (3.142) ist jedes a ∈ ZZ genau zu einem r mit 0 ≤ r < n kongruent
modulo n. qed.
Bezeichnung: Man nennt (3.143) kleinstes nicht negatives Restsystem modulo n.

Für die Äquivalenzklasse von a ∈ Z bedeutet dieses:

a = {b ∈ Z | a ≡ b mod n} (die Menge aller zu a äquivalenten Elemente)


= Äquivalenzklasse zu a
= r mit 0 ≤ r < n, a ∼ r (gemäß (3.141))

Für die Menge der Äquivalenzklassen ergibt sich damit

Zn = {Menge der Äquivalenzklassen a mit a ∈ Z}


= { 0 , 1 , 2 , ..., n − 2 , n − 1 } (wegen (3.143)) (3.144)

Insbesondere besitzt Zn nur n Elemente und ist damit endlich.

Beispiel: Z6 = { 0 , 1 , 2 , 3 , 4 , 5 }

Zusammenfassend gilt:

a = b
⇔ a∼b
(3.145)
⇔ a ≡ b mod n
⇔ n|a − b

Der große Vorteil und Nutzen von Zn ergibt sich durch die folgende Tatsache:
Zn ist ein endlicher kommutativer Ring mit Eins.
Wie im Abschnitt 3.3.2 gesehen, erfolgen die Addition und die Multiplikation in Zn
repräsentantenweise.
Für kleine Werte von n lassen sich die Addition und die Multiplikation durch Ver-
knüpfungstabellen darstellen.25

25
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.

189
Beispiel: Die Verknüpfungstabellen für n = 3 lauten:
Addition:
+ 0 1 2
0 0 1 2
1 1 2 0
2 2 0 1
Multiplikation:
· 0 1 2
0 0 0 0
1 0 1 2
2 0 2 1

Beispiel: (27 · 53) mod 7 = 27 · 53 =


−1 · 4 = −4 |{z}
= 3
+1·7
6 · 4 = 24 |{z}
= 3
−3·7

Bemerkung: Allgemein gilt in Zn :

1 + · · · + 1} = 0
|1 + 1 + {z
n-mal
Bemerkung: Die übliche Potenzschreibweise wird entsprechend in ZZ n angewandt:

ae = ( a )e = |a · a{z· · · · a}
e-mal
Bezeichnung: Die Zuordnung, die jedem a ∈ ZZ seine Restklasse a zuweist:

a 7→ a (3.146)

heißt Restklassenabbildung.
F
Bemerkung: Neben dem kleinsten nicht negativen Restsystem (3.143) ist zusätzlich das
dem Betrage nach kleinste Restsystem von Bedeutung:

für gerades n : −n n n
2 , − 2 + 1, . . . , 0 . . . , 2 − 1
(3.147)
für ungerades n : −n − 1 n−1
2 , − 2 + 1, . . . , 0 . . . , 2
n−1

Aufgabe: Man zeige, daß es sich bei (3.147) tatsächlich um Restsysteme modulo n han-
delt.

190
Als Anwendung soll ein 16-Bit-Rechenwerk26 betrachtet werden. Werden mit einem 16-
Bit-Rechenwerk zwei zu große“ Zahlen addiert, so kann es zu einem Übertrag über

die 16-te Stelle hinauskommen. Dieser höchste Übertrag wird abgeschnitten und damit
beim Ergebnis ignoriert; z. B.:

11100000 00000011 =
ˆ 57347
00100000 00001110 =
ˆ 8206
1 00000000 00010001 (3.148)

fällt weg

Das führt natürlich zu einer Veränderung des Ergebnisses:

57347 + 8206 = 65553 tatsächliches Ergebnis


→ 17 vom Rechenwerk geliefertes (3.149)
Ergebnis

Liefert das Rechenwerk damit ein falsches Ergebnis? Nein, das Rechenwerk arbeitet
korrekt. Die Rechnungen verlaufen allerdings nicht in ZZ sondern in dem Restklassenring

ZZn mit n = 216 = 65536 (3.150)

Durch Abschneiden der Bits an der 17-ten und noch höheren Stellen erfolgt immer eine
Veränderung um ein Vielfachen27 von 216 . Das bedeutet für das Beispiel (3.148), (3.149)

57347 + 8206 ≡ 17 mod 216


(3.151)
⇔ 57347 + 8206 = 17 (als Restklassen in ZZ216 )

Intern stellt dabei das Rechenwerk jede Restklasse durch ihren kleinsten nicht negativen
Repräsentanten (siehe (3.143)) dar.
Der Bediener möchte als Ergebnis jedoch keine Restklasse erhalten sondern eine ganze
Zahl. Deshalb stellt sich die Frage, in welcher Weise die intern vom Rechenwerk als
Restklassen behandeltet Werte nach außen hin dargestellt werden. Dazu bestehen für
die Restklassen zwei Deutungsmöglichkeiten:
1. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem kleinsten
nicht negativen Restsystem (3.143):

0 ↔ 0, 1 ↔ 1, 2 ↔ 2, . . . , 216 − 1 ↔ 216 − 1 (3.152)

Diese Deutung liegt den

unsigned int -Datentypen

zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des kleinsten nicht negativen Restsystems (3.143) bewegt. Andernfalls kommt es
durch Überläufe zu Ergebnisverfälschungen. Insbesondere rechnet man dann nur
mit positiven Zahlen zuzüglich der Null.
26
Das Folgende kann sinngemäß auf andere Bitlängen übertragen werden.
27
Nach (3.27) besitzt die Ziffer an der 17-ten Stelle die Wertigkeit 216 , die noch höheren Ziffern
besitzen entsprechend eine noch höhere Wertigkeit der Form 216+t mit t ∈ IN .

191
2. Man identifiziert jede Restklasse mit ihrem Repräsentanten aus dem betragsmäßig
kleinsten Restsystem (3.147). Für die unteren Restklassen von 0 bis 216 /2 − 1 =
215 − 1 ändert sich nicht, man identifiziert nach wie vor

0 ↔ 0
1 ↔ 1
.. (3.153)
.
215 − 1 ↔ 215 − 1

Die folgenden Restklassen von 215 − 1 bis 216 − 1 werden mit negativen Werten
identifiziert; bei Beachtung von 215 = 216 − 215 bedeutet dieses:

215 = 216 − 215 ↔ −215


215 + 1 = 216 − 215 + 1 ↔ 1 − 215
215 + 2 = 216 − 215 + 2 ↔ 2 − 215
.. .. (3.154)
. .
215 + 215 − 3 = 216 − 215 + 215 − 3 ↔ −3
215 + 215 − 2 = 216 − 215 + 215 − 2 ↔ −2
215 + 215 − 1 = 216 − 215 + 215 − 1 ↔ −1

Allgemein lautet dieses für a ∈ Z mit 215 ≤ a ≤ 216 − 1:

a = a − 216 ↔ a − 216 (3.155)

Diese Deutung nennt man Zweierkomplement, sie liegt den

int -Datentypen

zu Grunde. Man erhält exakte Ergebnisse, solange man sich innerhalb der Werte
des Restsystems (3.147) bewegt. Hiermit wird das Rechnen mit negativen Zahlen
innerhalb der gegebenen Grenzen ermöglicht.

Betrachtet man mit dieser Deutung noch einmal die Rechnung (3.149), (3.151), so ist
die Restklasse von 57347 wegen 57347 ≤ 215 = 32768 als

57347 − 216 = 57347 − 65536 = −8189

zu deuten. Die Rechnung (3.149) lautet mit dieser Deutung

−8189 + 8206 = 17

Und dieses wird in der Tat vom Rechenwerk geliefert.

Beispiel: 3 wird intern durch 3 und −3 durch den zugehörigen positiven Repräsentanten
216 − 3 der Restklasse von −3 dargestellt. Das Rechenwerk liefert dann wie erwartet

3 + (216 − 3) = 216
(3.156)
≡ 0 mod 216 → 0 (geliefertes Ergebnis)

192
Auch die vom Rechenwerk durchgeführte Multiplikation ist die Multiplikation im Rest-
klassenring ZZ n mit n = 216 , denn durch Überläufe kommt es auch hier nur zum
Abschneiden der Bits ab der 17-ten Stelle, was wiederum nur eine Veränderung um ein
Vielfaches von 216 bewirkt.

Beispiel: Die Zahlen −3 und −5 werden intern durch 216 − 3 und 216 − 5 dargestellt. Die
Multiplikation erfolgt erwartungsgemäß:

(216 − 3) · (216 − 5) = 232 − 8 · 216 + 15


(3.157)
≡ 15 mod 216 → 15 (geliefertes Ergebnis)

Für 3 und −5 ist entsprechend

3 · (216 − 5) = 3 · 216 − 15
(3.158)
≡ −15 mod 216 → −15 (geliefertes Ergebnis)

Beispiel: In dem folgenden C-Programm werden intern als 16-stellige Dualzahlen dar-
gestellte Zahlen einmal als vorzeichenlose Werte und einmal als Werte mit Vorzeichen
ausgegeben:

#include <stdio.h>
int main(){
unsigned short int a=1;
unsigned short int b=65533; // = 2^(16)-3
printf(" %hu + %hu = %hu\n",a,b, a+b);
printf(" %hd + %hd = %hd\n",a,b, a+b);

printf("%hu + %hu = %hu (*)\n",10*a,b,10*a+b);


printf("%hd + %hd = %hd\n",10*a,b,10*a+b);
return 0;
}
------------------------------------------------
Ausgabe:
1 + 65533 = 65534
1 + -3 = -2
10 + 65533 = 7 (*)
10 + -3 = 7

Der mit (*)“ gekennzeichnete Wert ist nicht das Ergebnis einer korrekten Ganzzahlad-

dition. Faßt man ihn jedoch als Ergebnis einer Addition in ZZn mit n = 216 auf, so ist er
korrekt.

Bemerkung: Die Darstellung der negativen Zahlen durch (3.154) besitzt den Vorteil, daß
jede negative Zahl intern durch eine Bitkette dargestellt wird, an deren höchsten Stelle
ein 1 steht. Da umgekehrt nach (3.153) bei den positiven Zahlen und der Null dieses Bit
Null ist, wirkt dieses Bit wie ein Vorzeichenbit.

193
3.3.2.3 Die Einheitengruppe
Der Restklassenring ZZn besitzt mit 1 , der Restklasse von 1 ein neutrales Element der
Multiplikation. Das wirft die Frage auf, ob ein Element a ∈ ZZ n \ { 0 } ein inverses
Element bezüglich der Multiplikation besitzt oder nicht.
Daß beide Fälle auftreten können, zweigt das folgende

Beispiel: Man betrachte n = 10 und dazu

Zn = { 0 , 1 , . . . , 9 }

Invertierbar ist u. a. 7 , genauer gilt:


−1
7 = 3

Wie man nachrechnet, ist nämlich

7 · 3 = 7·3
= 21
⇔ 7 · 3 = 1 + 2 · 10 (3.159)
⇔ 7·3 ≡ 1 mod 10
⇔ 7·3 = 1

Andererseits ist die Restklasse 5 6= 0 nicht invertierbar. Angenommen, es gäbe eine


inverse Restklasse a zu 5 , so wäre

1 = a · 5 (3.160)

Multipliziert man beide Seiten von (3.160) mit 2 , so folgt:

1 · 2 = a · 5 · 2
⇔ 2 = a · 10 = a · 0 = 0 (3.161)
⇔ 2 = 0

Das ist ein Widerspruch, denn offensichtlich ist 2 kein Vielfaches von 10 und daher
2 6= 0 .

Angeregt durch dieses Beispiel trifft man die folgende, hier allgemein gefaßte
Definition: Für einen Ring R mit Eins setzt man

R∗ = { a ∈ R | a ist invertierbar } (3.162)

und nennt R∗ die Einheitengruppe von R. Die Elemente von R∗ heißen Einheiten.28

28
Man beachte, daß bei dieser Definition nicht verlangt wird, daß der Ring kommutativ ist. Das
Vorhandensein der Eins ist natürlich notwendig.

194
Wie das Beispiel von eben gezeigt hat, ist

7 ∈ ZZ∗10 , aber 5 6∈ ZZ∗10

Es folgen noch einige Beispiele für Einheitengruppen bei weiteren Ringen mit Eins:

• Z∗ = {±1}

• R∗ = R \ {0}

• Menge der reellen Polynome R[X]∗ = R∗ = R \ {0}

• Menge der reellen umkehrbaren Matrizen Mn,n (IR)∗ = GL(n, IR) (siehe (3.100))

Wann ist eine Restklasse a ∈ ZZn invertierbar? Auskunft gibt der folgende
Satz: Sei a ∈ ZZn . Dann gilt

a ist invertierbar ⇔ ggT(a, n) = 1 (3.163)

Beweis: a ist genau dann invertierbar, wenn es ein u mit a · u = 1 gibt; damit zeigt
man:
a·u = 1
⇔ a·u ∼ 1
⇔ a·u = 1+k·n
⇔ 1 = a·u−k·n
⇔ 1 = a · u + (−k) · n Man beachte: Dieses ist genau die
ggT-Darstellung von a und n.
⇔ ggT(a, n) = 1
qed.
Wie berechnet man für eine invertierbare Restklasse das inverse Element? Hierzu steht
eine sehr gute Berechnungsmethode zur Verfügung. Diese Berechnungsmethode spielt
eine wichtige Rolle bei vielen Anwendungen.
Berechnung der inversen Restklasse: Gegeben sei die Restklasse a ∈ ZZn mit a ∈ ZZ .
1. Zunächst wendet man den erweiterten Euklidischen Algorithmus (siehe Seite 3.48)
auf a und n an und erhält damit die ggT-Darstellung

u · a + v · n = ggT(a, n) mit u, v ∈ ZZ (3.164)

(siehe (3.47)). Ist in (3.164) der größte gemeinsame Teiler größer als Eins, so
ist a nach (3.163) nicht invertierbar. Andernfalls kann man mit dem 2. Schritt
fortfahren.
2. Im Falle von ggT(a, n) = 1 weiß man, daß a invertierbar ist, und der Koeffizient
u in (3.164) liefert die inverse Restklasse:
−1
a = u mit u aus (3.164) (3.165)

195
Begründung von (3.165): Nach Annahme hat man in (3.164)

u·a + v·n = 1
⇒ u·a = 1 − v·n
⇒ u·a ≡ 1 mod n
⇒ u·a = u · a = 1
−1
⇒ u = a

qed.

Beispiel: Sei n = 20, dann ist

ZZ∗20 =

1 , 3 , 7 , 9 , 11 , 13 , 17 , 19 (3.166)

denn dieses sind offensichtlich genau die Restklassen zu teilerfremden Resten modulo
20. Mit dem erweiterten euklidischen Algorithmus – oder falls möglich auf einfacherem
Wege – erhält man die folgenden inversen Restklassen:
−1
1 = 1 klar!
−1
3 = 7 wegen 7 · 3 + (−1) · 20 = 1
−1 −1
7 = 3 da schon 3 = 7 bekannt
−1
9 = 9 wegen 9 · 9 + (−4) · 20 = 1
−1
11 = 11 wegen (−9) · 11 + 5 · 20 = 1
und −9 = 11 , denn 11 = −9 + 20 (3.167)
−1
13 = 17 wegen (−3) · 13 + 2 · 20 = 1
und −3 = 17 , denn 17 = −3 + 20
−1 −1
17 = 13 da schon 13 = 17 bekannt
−1
19 = 19 denn wegen −1 = 19 − 20 ist 19 = −1
und zusätzlich ist −1 · −1 = (−1) · (−1) = 1

Aufgabe: In dem folgen C-Programm liefern zwei Produkte ganzer Zahlen den Wert
eins, obwohl keiner der vorkommenden Faktoren ±1 ist. Wie ist das zu erklären?
#include <stdio.h>
int main(){
unsigned short int a= 2013;
unsigned short int b=34933;
printf("%hu * %hu = %hu\n",a,b,a*b);
printf("%hd * %hd = %hd\n",a,b,a*b);
return 0;
}
---------------------------------------

196
Ausgabe :
2013 * 34933 = 1
2013 * -30603 = 1

Es gilt folgender wichtiger Sachverhalt, der auch wieder für allgemeine Ringe mit Eins
formuliert wird:
Satz: Die Einheitengruppe R∗ eines Ringe R mit Eins ist eine Gruppe.
Beweis: Zum Nachweis der Tatsache, daß die Menge der invertierbaren Elemente eines
kommutativen Ringes mit Eins eine Gruppe bilden, ist nur noch die Abgeschlossenheit
bezüglich der Verknüpfung ·“ zu zeigen. Seien dazu

a, b ∈ R∗

Zu zeigen ist, daß dann auch gilt

(a · b) ∈ R∗

d. h. daß auch
(a · b)
invertierbar ist. Dazu setzt man:

y = b−1 · a−1 (3.168)

Dann gilt:

(a · b) · y = (a · b) · (b−1 · a−1 ) = a · (b · b−1 ) ·a−1 = a · a−1 = 1


| {z }
=1

Die übrigen Gruppenaxiome (siehe Seite 175) sind bereits aufgrund der Ringaxiome
(siehe Seite 176) erfüllt. qed.

Zusatz 1: Ist der Ring R kommutativ, so ist auch seine Einheitengruppe R kommutativ.
Zusatz 2: Ist der Ring R eine endliche Menge, so ist seine Einheitengruppe R∗ eine
endliche Gruppe.

Aus dem letzten Satz und seinen beiden Folgerungen ergibt sich der wichtige Sachverhalt:

Für jedes n ∈ IN , n > 1 ist die Einheitengruppe des Restklassenrings Zn


eine endliche Gruppe.

Diese endliche Gruppe besitzt in der Kryptologie eines sehr große Bedeutung.

R∗ = R \ {0} ist eine Beispiel für eine unendliche Einheitengruppe.

Da es sich bei den Einheitengruppen ZZ ∗n um endliche kommutative Gruppen handelt,


können darauf die Ergebnisse des Abschnitts 3.3.1.2 angewandt werden.
F

197
Eine bedeutende Rolle spielte bei den endlichen kommutativen Gruppen die Gruppen-
ordnung (3.104). Da die Ordnung der Gruppe ZZ∗n von n abhängt, führt man dafür eine
besondere Bezeichnung ein, man setzt:

ϕ(n) = ord(Z∗n ) (3.169)


= #(Z∗n )
= #{r | 0 ≤ r < n, ggT(r, n) = 1}

Die Funktion in (3.169) heißt Eulersche Phi-Funktion. Es handelt sich um eine Funk-
tion, die für alle natürlichen Zahlen, die größer als eins sind, definiert ist:

ϕ : {n ∈ IN | n > 1} 7→ IN (3.170)

Beispiel:
ϕ(2)= 1 : vorhanden ist nur die invertierbare Restklasse 1
ϕ(10)= 4 : vorhanden sind die invertierbaren Restklassen 1 , 3 , 7 , 9
ϕ(11)=10 : vorhanden sind die invertierbaren Restklassen 1 , 2 , 3 , . . . , 9 , 10

Potenziert man ein Element einer endlichen kommutativen Gruppe mit der Gruppen-
ordnung, so erhält man nach (3.106) das Einselement der Gruppe. Wegen (3.169) liefert
das den wichtigen
Satz von Euler: Für a ∈ Z∗n gilt

a ϕ(n) = 1 (3.171)

bzw. anders ausgedrückt, für a, n ∈ N mit 1 = ggT(a, n) gilt

aϕ(n) ≡ 1 mod n (3.172)

Bemerkung Ist n eine Primzahl, so werden die Gleichungen (3.171) bzw. (3.172) als
kleiner Fermatscher Satz bezeichnet.

Für die Kryptologie sind zwei Spezialfälle von besonderem Interesse:

a.) n = p (Primzahl)

b.) n = p · q (Produkt zweier Primzahlen p 6= q)

In beiden Fällen sollen

• die Struktur der Einheitengruppe (Zn )∗ sowie

• der Wert ϕ(n)

genau untersucht bzw. berechnet werden.29

29
Achtung: Zur Vereinfachung wird im folgenden Beispiel in den Verknüpfungstabellen auf die Rest-
bezeichnung verzichtet: Anstelle von r steht dort nur r.

198
Beispiele für Z∗n mit n = p oder n = p · q :
Für n = 12 hat man Z∗n = { 1 , 5 , 7 , 11 }; diese Gruppe besitzt die Multiplikationsta-
belle:
· 1 5 7 11
1 1 5 7 11
5 5 1 11 4
7 7 11 1 5
11 11 7 5 1

Man beachte: Der Ring Z12 enthält Nullteiler : Es ist 3 6= 0 und auch 4 6= 0; andererseits
ist jedoch 3 · 4 = 12 = 0.
Für n = 5 hat man Z∗n = { 1 , 2 , 3 , 4 }; diese Gruppe besitzt die Multiplikationstabelle:

· 1 2 3 4
1 1 2 3 4
2 2 4 1 3
3 3 1 4 2
4 4 3 2 1

3.3.2.4 Der Fall n = p


Als erstes soll der Spezialfall n = p mit einer Primzahl p behandelt werden. Hier liegen
zwei Besonderheiten vor, die im folgenden nacheinander erläutert werden sollen.

Die erste Besonderheit ergibt sich dadurch, daß die Zahlen

1, 2, · · · , p − 1

alle teilerfremd zu p. Nach (3.163) folgt daraus, daß jede der Restklassen

1 , 2 , ..., p − 1

invertierbar ist. Da dieses außer 0 alle Restklassen modulo p sind, gilt

a ∈ Zp \ { 0 } ⇔ a ist invertierbar (3.173)

Da somit außer der der Null alle Elemente invertierbar sind, erhält man sofort

ϕ(p) = p − 1 (3.174)

und wegen (3.171) daher

a p−1 = 1 für alle a ∈ Zp \ { 0 }) (3.175)

Multipliziert man beide Seiten von (3.175) mit der Restklasse a , so erhält man eine
Gleichung, die – wie man schnell nachprüft – zusätzlich für die Restklasse 0 gültig ist:

ap = a für alle a ∈ Zp (3.176)

199
Ebenso folgt aus (3.173), daß Zp sogar ein Körper ist (siehe Seite 177). Insbesondere
hat man damit

Z∗p = Zp \ { 0 } (3.177)

Wichtige Bezeichnung: Man nennt diese Körper Restklassenkörper mod p, Galois-


feld oder

Fp (3.178)

Mit dem Körper Fp kann weitestgehend so verfahren werden, wie man es von den be-
kannten Körpern Q und R gewohnt ist. Das betrifft vor allem
• Behandlung linearer Gleichungssysteme
• Grundtatsachen über Polynome
• Nullteilerfreiheit
Allgemein kann gesagt werden, daß dieses alles betrifft, was unmittelbar auf den Grund-
rechenarten beruht, hingegen nicht die auf zusätzlichen Besonderheiten der reellen Zah-
len beruhende Differential- und Integralrechnung.

Beispiel: Z2 = F2 = { 0 , 1 } ist der kleinste Körper. Er besitzt nur zwei Elemente,


dabei handelt es sich um das Nullelement und das Einselement, d. h. um die neutralen
Elemente der beiden Verknüpfungen. Die beiden Verknüpfungstabellen sind:
+ 0 1 · 0 1
0 0 1 0 0 0
1 1 0 1 0 1

Häufig nimmt man bezüglich Z2 folgende Identifizierungen vor:

ˆ {w, f },
Z2 = ˆ ⊕,
+= ·=
ˆ ∧

und führt die Behandlung logischer Ausdrücke auf Rechnungen im Körper Z2 zurück.
Aufgabe: Warum ist 1010 − 1 ist durch 11 teilbar?

Satz: Der Körper ist Zp ist nullteilerfrei .30


Beweis: Seien a , b ∈ Zp mit a · b = 0 . Zu zeigen ist: Dann ist a = 0 oder b = 0 .
Angenommen, es ist a 6= 0, dann wäre a invertierbar, und man könnte folgern:
−1
a · b = 0 | · a
−1 −1
⇒ |a {z· a} · b = a · 0 = 0
1
⇒ b = 0
F
Das Ziehen einer Wurzel ist im Restklassenkörper ZZ p mit etwas Einschränkungen
sehr leicht möglich. Wurzel ziehen“ bedeutet: Ist ein Wert y ∈ ZZp der Form

y = xl (3.179)
30
Dieser Satz gilt für alle Körper; der folgende Beweis läßt sich wörtlich auf andere Körper übertragen.

200
mit bekanntem l ∈ IN aber unbekanntem x gegeben, so ist die Restklasse x zu be-
rechnen. In vielen Fällen ist das leicht möglich. Genauer gilt:
Für l ∈ IN ist die l-te stets Wurzel
⇔ ggT(l, p − 1) = 1 (3.180)
ziehbar
Begründung und Vorgehensweise: Gegeben ist y = x l ; zu berechnen ist x . Man be-
rechne dazu mit dem erweiterten euklidischen Algorithmus (siehe (3.48))

u, v ∈ Z mit 1 = u · l + v · (p − 1)

Dann ist in der Tat y u = x ; wie man nachrechnet, ist nämlich:

x l )u · |x v·(p−1)
y u = (|{z} {z } denn x p−1 = 1 , siehe (3.175)
y =1

1
z }| {
= x u · l + v · (p − 1) = x1 = x

qed.

Beispiel: p = 11, x = 2 , l = 7, y = x 7 = 7 wegen 128 mod 11 = 7. Nun soll gezeigt


werden, daß allein aus dem Wert y = 7 dieser siebten Potenz durch Ziehen
√ der siebten
Wurzel die Basis x = 2 ermittelt werden kann. Zum Berechnen von y wird nun der
7

erweiterte euklidische Algorithmus angewandt:

1 = 3 · 7 − 2 · |{z}
10
p−1

3
⇒ 7 = 7 · 7 · 7 = 7 · 49 = 7 · 5 = 35 = 2

Bemerkung: Diese Art des Wurzelziehen kommt in leicht abgewandelter Fassung auch
beim RSA-Verfahren (siehe Seite 181) vor und bildet dabei eine wichtige Grundlage.
F
Beim Ziehen der l-ten Wurzel wurde wegen der Bedingung ggT(l, p − 1) = 1 (siehe
(3.180)) der Fall einer Quadratwurzel nicht erfaßt. Da dieser jedoch bei mehreren An-
wendungen31 bedeutsam ist, soll hier auf das Ziehen einer Quadratwurzel in Z∗p kurz
eingegangen werden. Vorausgesetzt wird für das folgende, daß p Primzahl mit p 6= 2
ist.32

Von einer Restklasse a ∈ Z∗p existiert genau dann eine Quadratwurzel, wenn a ein
Quadrat in Z∗p ist. Das bedeutet,

es gibt ein c ∈ Z∗p mit c2 = a (3.181)

In diesem Fall nennt man a einen quadratischen Rest mod p.

31
u. a. bei gewissen Primzahltest, mit Erweiterung bei einem sogenannten Zero-Knowledge-Verfahren,
eine Anwendung folgt in Abschnitt 3.3.2.7.2
32
Der Fall p = 2 ist hier uninteressant; warum?

201
Als Beispiel soll die Multiplikationstabelle des Restklassenkörpers Z7 betrachtet werden.
Die Quadrate bzw. quadratischen Reste befinden sich auf den Diagonalen. Die von Null
verschiedenen Quadrate wurden unterstrichen. Wie üblich werden die Restklassen hier
wieder durch ihre kleinsten nicht negativen Repräsentanten dargestellt:

∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von Z7

Man erkennt anhand der Multiplikationstabelle:

• Nur die Elemente 1 , 2 , 4 , ∈ Z7 sind Quadrate.

• Jedes dieser Quadrate erscheint genau zweimal in der Diagonalen.

Um die Quadrate in Zp genauer zu untersuchen, beachtet man zunächst, daß es sich bei
diesem Restklassenring um einen Körper handelt. Bezüglich der Quadratwurzeln liegen
dieselben Verhältnisse wie bei den bekannten Körpern Q| und IR vor. Sei etwa

a = c 2 ∈ Zp (3.182)

ein Quadrat mit der ungeraden Primzahl p, dann hat die Gleichung

X2 − a = 0 (3.183)

für a 6= 0 genau zwei Lösungen, denn sei etwa X = u eine Lösung von (3.183), dann
gilt:

0 = u2 − a = u2 − c2
= (u − c)·(u + c)
⇔ p | (u + c) · (u − c)
(3.184)
⇔ p | (u − c) oder p | (u + c) Denn p ist eine Primzahl.
(Siehe dazu (3.63).)
⇔ u − c = 0 oder u + c = 0
⇔ u = c oder u = −c

Die beiden einzigen vorhandenen Lösungen unterscheiden sich genau um das Vorzei-
chen.33
33
Alternativ hätte man in der Rechnung (3.182) die Nullteilerfreiheit des Körpers Zp ausnutzen
können: Wegen 0 = ( u − c ) · ( u + c ) muß bereits mindestens einer dieser beiden Faktoren null sein.

202
Bemerkung: Diese Tatsache, daß eine Quadratzahl höchsten zwei Quadratwurzeln besitzt
und diese sich nur um den Faktor −1 unterscheiden, ist gleicher Weise für die bekannten
Körper Q| und IR sowie für alle anderen Körper gültig. Die Rechnung (3.183) verwendet
nur die Körperaxiome (siehe Seite 177).

Wie gesehen, ist nicht jede Restklasse a ∈ Z∗p ein quadratischer Rest. Eine genauerer
Aussage liefert der folgende
Satz: Sei p eine ungerade Primzahl; dann gilt
(1) Es gibt genau (p − 1)/2 quadratische Reste in Z∗p .
(2) a ∈ Z∗p ist genau dann ein quadratischer Rest in Z∗p , falls
p−1
a 2 = 1 (3.185)
gilt.
Beweis:
zu (1): Offenbar erhält man alle quadratischen Reste in Z∗p , wenn die Elemente aus Z∗p
quadriert:
2 2 2 2
1 , 2 , 3 , . . . , (p − 1) , (3.186)
Hierbei handelt es sich um p−1 Quadrate, die nicht alle verschieden sein müssen.
Wann sind zwei der dieser quadrierten Werte gleich?
Wie in (3.184) gesehen, gilt
u2 = c2 ⇔ u = ±c (3.187)
Zwei Werte in (3.186) sind somit genau gleich, falls sie sich um das Vorzeichen
unterscheiden.
Das heißt wiederum, daß von den (p − 1) Werten in (3.186) jeweils zwei gleich
sind. In (3.186) sind somit (p − 1)/2 unterschiedliche Werte vorhanden. Dieses
sind genau die Quadrate in Z∗p , deren Anzahl damit wie behauptet (p − 1)/2
beträgt.
zu (2): Angenommen a = c 2 ist ein quadratischer Rest; dann rechnet man nach:
p−1 p−1
a 2 = ( c 2) 2
= c p−1
(3.188)
= 1 wegen (3.171) (kleiner Fermatscher Satz)
Für a ∈ Z∗p gelte jetzt umgekehrt
p−1
a 2 = 1 (3.189)
Zu zeigen bleibt: Dann ist a ein quadratischer Rest. Wegen (3.189) ist a eine
Nullstelle des Polynoms
p−1
P(X) = X 2 − 1 (3.190)
Wie aber die Rechnung in (3.188) gezeigt hat, ist jeder der (p − 1)/2 quadra-
tischen Rest eine Nullstelle von P(X). Andererseits besitzt P(X) als Polynom
(p−1)/2-ten Grades über dem Körper Zp höchstens (p−1)/2 Nullstellen. Damit
folgt:

203
• Die (p − 1)/2 quadratischen Reste sind genau alle Nullstellen von P(X).
• Ist P( a ) = 0 , so muß demgemäß a ein quadratischer Rest sein.

qed.

Bemerkung: Ist a ∈ Z∗p kein quadratischer Rest in Z∗p , so ist


p−1
a 2 = −1 (3.191)

Denn wegen des kleinen Fermatschen Satzes (3.175) ist sicher


 p−1
2
a 2 = a p−1 = 1 (3.192)

Da das Quadrat der linken Seite von (3.191) somit 1 ist, muß die linke Seite nach
(3.184) einen der beiden Werte 1 oder −1 besitzen. Da hier nach Voraussetzung a
kein quadratischer Rest sein soll, bleibt nur der Wert −1 .

Wie berechnet man praktisch für einen quadratischen Rest a ∈ Z∗p eine Quadratwurzel?
Hier soll dieses nur für einen Spezialfall durchgeführt werden:

Satz: Sei p eine mit Rest 3 durch 4 teilbare Primzahl, d. h. eine Primzahl der Gestalt

p = 4 · k + 3 mit k ∈ IN0 (3.193)

Weiterhin sei a ∈ Zp eine Quadratzahl:

a = c2 mit einem c ∈ Z (3.194)

Berechnet man dann die Restklasse


p+1
u = a 4 (3.195)

dann ist u ∈ Zp eine Quadratwurzel von a , genauer gilt

u2 = a (3.196)
und außerdem: u = ±c (3.197)

Beweis: Man quadriert die in (3.195) definierte Restklasse u :


 p+1
2
u2 = a 4

 p+1
2  p+1
2
= c 2· 4 = c 2 = c p+1

p−1 2
= |c{z }· c (wegen 3.175)
1

= c2 = a (wegen 3.194)

Aufgrund der Rechnung in (3.184) muß dann außerdem u = ± c sein. qed.

204
Beispiel: Sei p = 23. Dann ist 2 ein quadratischer Rest; es ist nämlich
2
±5 = 25 = 2 + 23 = 2

Das Potenzieren von 2 mit (23 + 1)/4 = 6 liefert nun eine der beiden Quadratwurzeln:
6
2 = 64 = 64 − 3 · 23 = − 5

Bemerkung: Da, wie gesehen, das Ziehen der Quadratwurzel für quadratische Reste in
Z∗p für p ≡ 3 mod 4 recht einfach ist, beschränkt man bei Anwendungen oft auf solche
Primzahlen. Für die übrigen ungeraden Primzahlen ist ein zu (3.193) entsprechendes, al-
lerdings erheblich komplizierteres Verfahren vorhanden, der Tonelli-Shanks-Algorithmus
(siehe etwas [10]).
F
Nicht bekannt ist ein effektiver Algorithmus zum Berechnen des sogenannten diskreten
Logarithmus. Beim diskreten Logarithmus ist ein Potenzwert

y = x l ∈ Z∗p (3.198)

gegeben, wobei die Basis x bekannt, der Exponenten aber l unbekannt ist. Zu berechnen
ist nun bei Kenntnis von y und x der Exponent l ∈ N.
Dieses ist die Grundlage des Schlüsselaustauschverfahrens von Diffie-Hellman.

3.3.2.5 Anwendungen
3.3.2.5.1 Schlüsselaustausch nach Diffie-Hellman
Die Idee des Schlüsselaustauschverfahrens von Diffie-Hellman wurde bereits auf Seite 146
erläutert. Hier kann jetzt das Schema von Diffie-Hellman lautet in seiner endgültigen,
verwendungsfähigen Form dargestellt werden:

1. p ist eine fest vorgegebene oder eine fest gewählte große Primzahl (p > 2300 ); dazu
wird weiter ein a ∈ N mit 1 < a < p gewählt. p und a werden veröffentlicht.

2. Die Partner A und34 B merken sich jeder einen geheimen Wert

A: l∈N
B: k∈N

3. A berechnet in Zp :
y1 = a l
und sendet y1 an B.
B berechnet in Zp :
y2 = a k
und sendet y2 an A.
34
Gerne auch als Alice und Bob bezeichnet.

205
4. A berechnet aus seinem empfangenen Wert y2

Y = y2 l = ( a k )l = a k·l

B berechnet aus seinem empfangenen Wert y1

y = y1 k = ( a l )k = a k·l

Damit ist y , d. h. der kleinste positive Rest von y mod p, der gemeinsame, aber
sonst geheime Schlüssel von A und B.
Bemerkungen zum Diffie-Hellman-Schema:
• Das Patent 1997 ist abgelaufen.

• Es wird zum Schlüsselaustausch im Internet verwendet, z.B. beim Simple Key


Management for Internet Protocol (SKIP)
Das Brechen ist nur durch Berechnen von l aus y1 und a bzw. nur durch Berechnen von
k aus y2 und a möglich. Dieses ist das Problem des Diskreten Logarithmus“ (siehe

3.198) und ist praktisch nicht machbar. Es gibt zwar asymptotisch gute Verfahren, diese
sind jedoch nicht praktikabel.
Achtung: Die Primzahl p sollte so gewählt sein, daß p − 1 mindestens einen großen
Primfaktor enthält, sonst u. U. wäre ein Brechen doch möglich.

3.3.2.5.2 ISBN-Prüfziffer
Jedes Buch besitzt eine sogenannte internationale Standardbuchnummer (ISBN), die
die Auflage des Buches mit allen zugehörigen Daten (Herkunftsland, Verlag usw.) ein-
deutig kennzeichnet. Die jetzt noch gültige 10-stellige ISBN

a1 a2 a3 · · · a10 (3.199)

besitzt die die neun Datenziffern

ai ∈ {0, 1, 2, . . . , 9} für i = 1, . . . , 9 (3.200)

sowie an der zehnten Stelle eine Prüfziffer a10 . Die Prüfziffer wird aus den Datenbits so
berechnet, daß stets die Kongruenz

1 · a1 + 2 · a2 + . . . + 9 · a9 + 10 · a10 ≡ 0 mod 11 (3.201)

erfüllt ist. Verwendet wird die Primzahl p = 11. Das bietet mehrere Vorteile:
• Alle Rechnungen können in dem Körper Z11 durchgeführt werden. Die Nulltei-
lerfreiheit sowie die Invertierbarkeit aller Restklassen a 6= 0 kann ausgenutzt
werden.

• Die Datenziffern (3.200) können mit den Restklassen 0 , 1 , 3 , . . . , 9 eindeutig


identifiziert werden.

• Die Kongruenzbedingung (3.201) wird zu einer einfachen Gleichung im Körper


Z11 :

1 · a1 + 2 · a2 + . . . + 9 · a9 + 10 · a10 = 0 (3.202)

206
Die Gleichung (3.202) liefert sofort die Berechnungsvorschrift für die Bestimmung der
Prüfziffer aus den Datenziffern; man löst die Gleichung (3.202) nach a10 auf:

1 · a1 + 2 · a2 + . . . + 9 · a9 = − 10 · a10
= a10 (3.203)
denn : − 10 = 11 − 10 = 1

In der ISBN wird für die Restklasse a10 wieder der kleinste nicht negative Repräsentant
modulo 11 genommen (siehe (3.143)). Da aber die Rechnung (3.203) die Restklasse 10
ergeben könnte, reichen die dezimalen Ziffern hierfür nicht aus. Man verwendet daher
die zusätzliche Ziffer X“ (die römische Ziffer mit dem Wert 10). An der letzten Stelle

einer ISBN kann somit neben den dezimalen Ziffern auch ein X erscheinen.

Der so aufgebaute ISBN-Code leistet:

(a) Erkennen eines Einzelfehlers

(b) Korrektur eines Einzelfehlers bei bekannter Fehlerposition

(c) Erkennen einer Ziffernvertauschung

Begründung: Zu (a): Angenommen, an der j-ten Stelle steht anstatt der korrekten (und
unbekannten) Ziffer aj die falsche Ziffer bj . Zum Prüfen der Korrektheit berechnet man
in Z11 die gewichtete Summe (3.202) und verwendet die vorliegende Ziffer bj . Diese
Rechnung führt zu dem folgenden Ergebnis:

s = 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10 (3.204)

= 1 · a1 + . . . + j · bj + . . . + 9 · a9 + 10 · a10

= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)

= j · b j − aj (3.205)

6= 0 für bj 6= aj

Damit wurde festgestellt, daß die Gleichung (3.202) nicht erfüllt ist. Der Einzelfehler
wurde bemerkt.
Zu (b): Ist die Position j des Einzelfehlers bekannt, so kann aus der gewichteten Summe
(3.204) sowie der vorliegenden falschen Ziffer bj die korrekte Ziffer aj berechnet werden;
indem man die Gleichung (3.205) nach aj auflöst:
−1
aj = bj − j · s (3.206)

Zu berechnen ist dabei die inverse Restklasse von j . Das erfolgt dann wie üblich mit
dem erweiterten euklidischen Algorithmus (siehe (3.164)).

207
Zu (c): Angenommen, die i-te und die j-te Ziffer seien vertauscht. Dann liefert die
Berechnung der gewichteten Summe (3.204) mit den beiden vertauschten Ziffern:

s = 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10

= 1 · a1 + . . . + i · aj + . . . + j · ai + . . . + 9 · a9 + 10 · a10

= − 1 · a1 + . . . + j · aj + . . . + 9 · a9 + 10 · a10
| {z }
=0 wegen (3.202)

= i · ( aj − ai ) + j · ( ai − aj )

= j − i · ( ai − aj ) (3.207)
6= 0 für ai 6= aj , i 6= j

Anhand von s 6= 0 konnte auch dieser Vertauschungsfehler erkannt werden.


F
Seit 2005 ist die 13-stellige ISBN im Gebrauch. Hier wird die Prüfziffer (an der 13-ten
Stelle) durch eine Gleichung in Z10 festgelegt. Die dezimalen Ziffern können dann eindeu-
tig und ohne Zusatzziffer mit den Restklassen Z10 identifiziert werden. Die Bedingung
für die Prüfziffer a13 lautet in Z10 :

1 · a1 + 3 · a2 + 1 · a3 + . . . + 3 · a12 + 1 · a13 = 0 (3.208)

Die geraden Positionen werden mit 3 und die ungeraden Positionen werden mit 1 ge-
wichtet. Einzelfehler können bemerkt und bei bekannter Position korrigiert werden.
Aufgabe: Man begründe dieses.
Aufgabe: In welchen Fällen kann eine Vertauschung zweier Ziffern bemerkt werden, in
welchen Fällen bleibt sie unentdeckt?
Bemerkung: Weitere Codes mit ähnlicher Bedingung für die Prüfziffer sind vorhanden.
Zum Beispiel verwenden einige Banken und Kreditkartenunternehmen bei ihren Konto-
nummern ein Verfahren wie bei der ISBN-13, wobei anstelle des Gewichtungsfaktors 3
der Faktor 2 genommen wird.
Aufgabe: Was sind Vor- und Nachteil des des Gewichtungsfaktors 2 gegenüber dem des
Gewichtungsfaktors 3?

3.3.2.5.3 Aufstellung eines Spielplans


Während einer Runde der ersten Fußballbundesliga (Hinrunde oder Rückrunde) spielt
jede Mannschaft genau einmal gegen jede andere Mannschaft. Die Spiele werden dabei
so geplant, daß jede Mannschaft an einem Spieltag (bzw. einem Spielwochenende) genau
ein Spiel durchführt. Wie muß ein Spielplan aufgestellt werden, der dieses ermöglicht?
Insbesondere ist sicherzustellen, daß an jedem Spieltag für jede Mannschaft ein Gegner
zur Verfügung steht, gegen den sie in der betreffenden Runde noch nicht angetreten ist.
Hier soll gezeigt werden, wie mit einer einfachen Restklassenrechnung für dieses Problem
eine unkomplizierte Lösung gefunden werden kann. Es empfiehlt sich, zunächst von einer
beliebigen Anzahl n von teilnehmenden Mannschaften auszugehen; dabei sei n ∈ IN mit
n ≥ 2.
Weiterhin werde zunächst angenommen, daß n ungerade ist. In diesem Fall muß in Kauf
genommen werden, daß an jedem Spieltag genau eine Mannschaft spielfrei ist. Es soll

208
aber je Spieltag immer nur eine Mannschaft spielfrei sein und keine Mannschaft während
der Runde zweimal oder noch häufiger spielfrei sein.
Man identifiziert die n Mannschaften35 mit den n Restklassen aus Zn :

0 , 1 , ..., n − 1

Geplant werden n Spieltage; die Spieltage werden ebenfalls mit den n Restklassen aus
Zn identifiziert.
An dem Spieltag a ∈ Zn liefert nun die folgende einfache Funktion den Gegner der
Mannschaft x ∈ Zn :

Ga ( x ) = a − x (3.209)

Aus der Definition (3.209) folgt sofort:

• An einem Spieltag a haben alle Mannschaften x unterschiedliche Gegner; keine


Mannschaft muß gegen zwei Gegner antreten.

• Eine Mannschaft x hat an unterschiedlichen Spieltagen unterschiedliche Gegner:


keine Mannschaft spielt somit zweimal gegen denselben Gegner.

Zu zeigen bleibt noch das Folgende:

• Die Mannschaft x hat jede andere Mannschaft y einmal als Gegner. Setzt man
nämlich a = x + y , so liefert (3.209) für den Spieltag a :

Ga ( x ) = a − x = x + y − x = y

• Liefert die Funktion (3.209) für die Mannschaft x den Gegner y = a − x , so


liefert sie umgekehrt für y den Gegner x . In der Tat rechnet man nach:

Ga ( y ) = a − y = a − (a − x)
= x

• Am Spieltag a bleibt genau eine Mannschaft spielfrei. Die Funktion (3.209) über-
führt nämlich genau eine Restklasse x0 in sich selber:

x0 = G a ( x0 )
⇔ x0 = a − x0
⇔ 2 · x0 = a
−1
⇔ x0 = 2 · a (3.210)
Man beachte, daß n ungerade und damit
die Restklasse 2 in Zn invertierbar ist.
Die Restklasse x0 mit G a ( x0 ) = x0 ist somit bei jedem Spieltag a durch
(3.210) eindeutig bestimmt. Alle anderen haben den durch (3.209) wohlbestimmten
Gegner G a ( x ). Nur x0 ist am Spieltag a spielfrei.
35
n braucht hier keine Primzahl zu sein; zunächst wird nur vorausgesetzt, daß n ungerade ist.

209
Nachdem der Spielplan für ungerades n aufgestellt wurde, fehlt jetzt noch ein Spielplan
für eine gerade Anzahl an Mannschaften. Diesen führt man aber auf einfache Weise auf
den eben behandelten Fall einer ungeraden Anzahl zurück.
Sei jetzt n gerade und n ≥ 4. Dann läßt man zunächst die letzte Mannschaft weg und
stellt wie eben beschrieben den Spielplan für n0 = n − 1 Mannschaften auf. Die bei
diesem Plan an jeweils einem Spieltag spielfrei bleibende Mannschaft läßt man gegen
die zunächst weggelassene letzte Mannschaft spielen.

Beispiel: Ein Spielplan für n = 10 Mannschaft wird aufgestellt. Wie beschrieben, werden
zunächst nur die ersten n0 = 9 Mannschaften beachtet. Diese und die Spieltage werden
mit den Restklassen 0 , . . . 8 ∈ Z9 identifiziert. Die letzte, zunächst nicht beachtete
Mannschaft wird als “9“ bezeichnet:
1. Spieltag 0 :

G0 0  = 0 − 0 = 0 =⇒ 0 spielt gegen 9
G0 1  = 0 − 1 = 8 =⇒ 1 spielt gegen 8
G0 2  = 0 − 2 = 7 =⇒ 2 spielt gegen 7
G0 3  = 0 − 3 = 6 =⇒ 3 spielt gegen 6
G0 4 = 0 − 4 = 5 =⇒ 4 spielt gegen 5

2. Spieltag 1 :

G1 0  = 1 − 0 = 1 =⇒ 0 spielt gegen 1
G1 2  = 1 − 2 = 8 =⇒ 2 spielt gegen 8
G1 3  = 1 − 3 = 7 =⇒ 3 spielt gegen 7
G1 4  = 1 − 4 = 6 =⇒ 4 spielt gegen 6
G1 5 = 1 − 5 = 5 =⇒ 5 spielt gegen 9

3. Spieltag 2 :

G2 0  = 2 − 0 = 2 =⇒ 0 spielt gegen 2
G2 1  = 2 − 1 = 1 =⇒ 1 spielt gegen 9
G2 3  = 2 − 3 = 8 =⇒ 3 spielt gegen 8
G2 4  = 2 − 4 = 7 =⇒ 4 spielt gegen 7
G2 5 = 2 − 5 = 6 =⇒ 5 spielt gegen 6

4. Spieltag 3 :

G3 0  = 3 − 0 = 3 =⇒ 0 spielt gegen 3
G3 1  = 3 − 1 = 2 =⇒ 1 spielt gegen 2
G3 4  = 3 − 4 = 8 =⇒ 4 spielt gegen 8
G3 5  = 3 − 5 = 7 =⇒ 5 spielt gegen 7
G3 6 = 3 − 6 = 6 =⇒ 6 spielt gegen 9

5. Spieltag 4 :

G4 0  = 4 − 0 = 4 =⇒ 0 spielt gegen 4
G4 1  = 4 − 1 = 3 =⇒ 1 spielt gegen 3
G4 2  = 4 − 2 = 2 =⇒ 2 spielt gegen 9
G4 5  = 4 − 5 = 8 =⇒ 5 spielt gegen 8
G4 6 = 4 − 6 = 7 =⇒ 6 spielt gegen 7

210
6. Spieltag 5 :

G5 0  = 5 − 0 = 5 =⇒ 0 spielt gegen 5
G5 1  = 5 − 1 = 4 =⇒ 1 spielt gegen 4
G5 2  = 5 − 2 = 3 =⇒ 2 spielt gegen 3
G5 6  = 5 − 6 = 8 =⇒ 6 spielt gegen 8
G5 7 = 5 − 7 = 7 =⇒ 7 spielt gegen 9

7. Spieltag 6 :

G6 0  = 6 − 0 = 6 =⇒ 0 spielt gegen 6
G6 1  = 6 − 1 = 5 =⇒ 1 spielt gegen 5
G6 2  = 6 − 2 = 4 =⇒ 2 spielt gegen 4
G6 3  = 6 − 3 = 3 =⇒ 3 spielt gegen 9
G6 7 = 6 − 7 = 8 =⇒ 7 spielt gegen 8

8. Spieltag 7 :

G7 0  = 7 − 0 = 7 =⇒ 0 spielt gegen 7
G7 1  = 7 − 1 = 6 =⇒ 1 spielt gegen 6
G7 2  = 7 − 2 = 5 =⇒ 2 spielt gegen 5
G7 3  = 7 − 3 = 4 =⇒ 3 spielt gegen 4
G7 8 = 7 − 8 = 8 =⇒ 7 spielt gegen 9

9. Spieltag 8 :

G8 0  = 8 − 0 = 8 =⇒ 0 spielt gegen 8
G8 1  = 8 − 1 = 7 =⇒ 1 spielt gegen 7
G8 2  = 8 − 2 = 6 =⇒ 2 spielt gegen 6
G8 3  = 8 − 3 = 5 =⇒ 3 spielt gegen 5
G8 4 = 8 − 4 = 4 =⇒ 4 spielt gegen 9

3.3.2.6 Der Fall n = p · q


Nachdem in vorherigen Abschnitt der Fall n = p behandelt wurde, soll nun der für
kryptologische Anwendungen ebenfalls bedeutsame Fall
n = p·q mit Primzahlen p 6= q (3.211)
betrachtet werden.
Betrachtet wird jetzt zu n = p · q der Restklassenring Zn , wobei dessen Einheitengruppe
Z∗n = { r | 1 ≤ r < n, ggT(r, n) = 1} (3.212)
von besonderem Interesse ist. Gemäß der Bezeichnung auf Seite 198 hat man
ϕ(n) = ϕ(p · q) = #Z∗n

211
und damit für r ∈ Z∗n nach dem Satz auf Seite 198

r ϕ(n) = r ϕ(p·q) = 1 (3.213)

Ziel dieses Abschnitts ist es,


• ϕ(n) = ϕ(p · q) zu berechnen

• die Struktur von Z∗n genauer darzustellen


Der erste Teil ist recht einfach; man zählt dazu die zu n = p · q nicht teilerfremden
Zahlen unter den
r = 0, 1, 2, . . . , n − 1
Ist r nicht zu n = p · q teilerfremd, so kann r nur durch p oder q teilbar sein; damit
bestehen folgende Möglichkeiten:
• 0 · p, 1 · p, 2 · p, . . . , (q − 1) · p

• 0 · q, 1 · q, 2 · q, . . . , (p − 1) · q
Beachtet man, daß 0 = 0 · p = 0 · q hier doppelt vorkommt, so erhält man genau

q+p−1

Zahlen r mit 0 ≤ r < n, die nicht zu n = p · q teilerfremd sind. Die restlichen Zahlen r
mit 0 ≤ r < n sind gerade die zu n = p · q teilerfremden und entsprechen den Elementen
in Z∗n ; ihre Anzahl beträgt damit (wegen n = p · q = #Zn )

p · q − (q + p − 1) = (p − 1) · (q − 1)

Also hat man

ϕ(p · q) = (p − 1) · (q − 1) (3.214)

Insbesondere hat man damit und aufgrund von (3.171) für r ∈ Z∗n mit n = p · q die
wichtige Gleichung

r (p−1)·(q−1) = 1 (3.215)

hergeleitet.
F
Die Gleichung (3.215) ist für gewisse Anwendungen schon ausreichend. Für andere An-
wendungen ist aber eine genaue Kenntnis der Struktur der Gruppe Z∗n erforderlich. Um
die Struktur der Gruppe Z∗n für den Fall n = p · q aufzuschlüsseln bedient man sich eines
Tricks“: Man nimmt eine Rückführung von Zn auf die beiden Ringe Zp und Zq vor.

Man betrachtet die Menge

R = Zp × Zq = {( a , b ) | a ∈ Zp , b ∈ Zq } (3.216)

Mit der komponentenweisen Addition und Multiplikation wird diese Menge zu einem
kommutativen Ring mit

Nullelement (0, 0)
(3.217)
Einselement (1, 1)

212
Für die Inversenbildung bezüglich “·“ gilt:

( a , b ) ∈ R∗ (d.h. invertierbar) ⇔ a ∈ Z∗p und b ∈ Z∗q (3.218)

Genauer gilt nämlich:


−1
( a , b )−1 = ( a −1 , b )
−1 −1
(3.219)
−1 −1
denn ( a , b ) · ( a ,b ) = (a · a ,b · b ) = (1, 1)

Damit wurde gezeigt:

R∗ = Z∗p × Z∗q = {( a , b )| a ∈ Z∗p , b ∈ Z∗q }


⇒ #R∗ = (#Z∗p ) · (#Z∗q ) = (p − 1) · (q − 1) (3.220)

Jetzt folgt der Trick! Man definiert folgende Funktion36

f : Zn → Zp × Zq mit a →(a, a) (3.221)

Zu zeigen ist: Die Funktion f ist

1. wohldefiniert

2. umkehrbar eindeutig (bijektiv)

3. vertauschbar mit der Addition und der Multiplikation, das heißt:

f( a1 + a2 ) = f( a1 ) + f( a2 )
f( a1 · a2 ) = f( a1 ) · f( a2 )
(3.222)
Insbesondere gilt: f( 0 ) = ( 0 , 0 )
f( 1 ) = ( 1 , 1 )

Begründungen:

1. Wohldefiniert: Zu zeigen ist, daß der wie oben definiert Funktionswert f( a ) nicht
von der speziellen Repräsentanten a der Restklasse a abhängt.
Sei daher

a = b ⇔ n | (a − b) (beachte n = p · q)
⇒ p | (a − b) und q | (a − b)
⇒ a ≡ b mod p und a ≡ b mod q
⇒ (a, a)=(b, b)

2. Eineindeutig: Zunächst wird die Injektivität nachgewiesen.


Zu zeigen ist: f( a ) = f( b ) ⇒ a = b
36
Man beachte, daß immer noch gilt (n = p · q, p 6= q).

213
Aufgabe: Vor dem Weiterlesen versuche man, dieses selber zu beweisen.

f( a ) = f( b ) ⇔ (a, a) = (b, b)
⇔ a ≡ b mod p, a ≡ b mod q
⇔ p|(a − b) und q|(a − b)
⇔ n|(a − b) wegen n = p · q mit p 6= q prim (siehe (3.57))
⇔ a ≡ b mod n ⇔ a = b

Nachzuweisen beleibt noch die Surjektivität. Hier ist zu zeigen, daß es zu jedem
Paar ( a , b ) ∈ Zp × Zq ein c ∈ Zn mit

f( c ) = ( c , c ) = ( a , b )
⇔ c ≡ a mod p und c ≡ b mod q

gibt; ein solches c ∈ Zn existiert jedoch aufgrund des chinesischen Restsatzes


(3.80) und ist außerdem schnell zu berechnen.

3. Vertauschbarkeit mit den Verknüpfungen (3.222): Dieses wird als Aufgabe über-
lassen.
Damit ist gezeigt, daß die beiden Ringe Zn und Zp × Zq strukturell gleich sind, d. h. ihr
Verhalten beim Addieren und Multiplizieren ist völlig identisch. Das heißt wiederum,
daß alle Rechnungen in Zn auf Rechnung in Zp × Zq zurückgeführt werden können.
Insbesondere folgt dann der wichtige Sachverhalt, daß die Einheitengruppen

Z∗n und Z∗p × Z∗q

einander entsprechen, d.h. durch die durch (3.221) definierte Funktion f( c ) umkehrbar
eindeutig ineinander überführt werden.
Begründung: Sei c ∈ Z∗n , zu ist zeigen nun: f( c ) ∈ Z∗p × Z∗q . Sei dazu c 1 ∈ Z∗n mit
c 1 · c = 1 . Seien weiter
f( c ) = ( a , b )
f( c 1 ) = ( a 1 , b 1 )
Dann folgt unter Ausnutzung der Eigenschaften der Funktion f (siehe Seite 213):

( 1 , 1 ) = f( 1 ) = f( c · c 1 ) = f( c ) · f( c 1 )
(3.223)
= ( a , b ) · ( a 1, b 1) = ( a · a 1, b · b 1)

Der Vergleich der Komponenten liefert:

1 = a · a1 und 1 = b · b1

und somit a ∈ Z∗p und b ∈ Z∗q , d.h. ( a , b ) ∈ Z∗p × Z∗q .


Die umgekehrte Richtung, d.h. daß für

a ∈ Z∗p und b ∈ Z∗q

gilt37
c = f −1 (( a , b )) ∈ Z∗n = Z∗pq
37
da f( c ), wie gezeigt, bijektiv ist, existiert die Umkehrfunktion f −1

214
zeigt man genauso38 . qed.

Insbesondere sind damit die Einheitengruppen Z∗pq und Z∗p × Z∗q einander strukturell
gleich, man schreibt dafür

Z∗p·q ∼
= Z∗p × Z∗q (3.224)

Üblicherweise identifiziert man sogar beide Seiten miteinander, d. h. man betrachtet sie
als gleich.
Als Anwendung von (3.224) ergibt sich, daß beide Seiten von (3.224) gleich viele Ele-
mente besitzen müssen; man gewinnt damit noch einmal das Resultat von (3.214):

ϕ(p · q) = #Z∗p·q
= #(Z∗p × Z∗q )
= #Z∗p · #Z∗q
= (p − 1) · (q − 1)

Als Übung zeige man unter der Verwendung von (3.224), daß Z∗pq (leider) nicht zyklisch
ist.

Beispiel: In der folgenden Tabelle wird die Funktion f (siehe (3.221)) für die beiden
Primzahlen p = 11 und q = 7 dargestellt. In der ersten Spalte sind die Restklassen von
Z11 und in der ersten Zeile die Restklassen von Z7 aufgeführt. Die übrigen Einträge der
Tabelle enthalten die jeweils bezüglich der Funktion f entsprechende Restklasse aus Z77 .
So erkennt man etwa, daß zu dem Restklassenpaar ( 7 , 2 ) ∈ Z11 × Z7 die Restklassen
51 ∈ Z77 gehört. (Aufgabe: Man bestätige dieses durch nachrechnen.)

ZZ7

0 1 2 3 4 5 6
0 0 22 44 66 11 33 55
1 56 1 23 45 67 12 34
2 35 57 2 24 46 68 13
3 14 36 58 3 25 47 69
4 70 15 37 59 4 26 48
ZZ11 5 49 71 16 38 60 5 27
6 28 50 72 17 39 61 6
7 7 29 51 73 18 40 62
8 63 8 30 52 74 19 41
9 42 64 9 31 53 75 20
10 21 43 65 10 32 54 76

Die Bijektivität der Funktion f läßt für den vorliegen Fall (p = 11, q = 7) ebenfalls leicht
erkennen: einerseits gehört zu jedem Paar ( a , b ) ∈ Z11 × Z7 ein Eintrag im Inneren der
Tabelle und damit eine Restklasse aus Z77 , andererseits kommt jede Restklasse aus Z77
genau einmal vor.

38
Man führe den Beweis der umgekehrten Richtung als Übung aus.

215
Bemerkung: Diese Überlegungen lassen sich gleichlautend auf zwei teilerfremde Zahlen
n1 , n2 ∈ N mit n1 , n2 ≥ 2 übertragen. Im Falle ggT(n1 , n2 ) = 1 hat man damit

Z∗n1 ·n2 ∼
= Z∗n1 × Z∗n2

und damit insbesondere für 1 = ggT(n1 , n2 )

ϕ(n1 · n2 ) = ϕ(n1 ) · ϕ(n2 ) (3.225)

Beispiel: Seien p1 , p2 , p3 paarweise verschiedene Primzahlen; beachtet man dabei 1 =


ggT(p1 , (p2 · p3 )) und ebenso 1 = ggT(p2 , p3 ), so liefert eine doppelte Anwendung der
Gleichung (3.225)

ϕ(p1 · (p2 · p3 )) = ϕ(p1 ) · ϕ(p2 · p3 ) = ϕ(p1 ) · ϕ(p2 ) · ϕ(p3 )

Interessant ist weiterhin der Fall einer Primpotenz pk . Man zeige als Aufgabe

ϕ(pk ) = (p − 1) · pk−1

Da er für die vorliegende Anwendung von untergeordneter Bedeutung ist, soll dieser Fall
nicht weiter behandelt werden.
Stattdessen soll der Fall n = p · q, p 6= q wieder aufgegriffen werden und eine wichtige
Betrachtung angestellt werden, die auf die Grundlage des RSA-Verfahrens hinführen
wird (siehe den folgenden Abschnitt 3.3.2.7.1). Mit Hilfe der umkehrbaren Funktion
(3.221)

f: Zn → Zp × Zq
a → (a, a)

bzw. auch durch direkte Rechnung (siehe Seite 212) wurde die Gleichung (3.214)

ϕ(p · q) = (p − 1) · (q − 1) (3.226)

hergeleitet, woraus mit Hilfe der Gleichung (3.171) wiederum die wichtige Gleichung

r (p−1)·(q−1) = 1 (3.227)

folgte (siehe 3.215). Die Gleichung (3.227) gestattet, ähnlich wie in Z∗p auch in dem Ring
Z∗n die e-te Wurzel ziehen, siehe dazu Seite 200:

• Vorgeben sei ein Exponent e ∈ N mit ggT(e, (p − 1) · (q − 1)) = 1

• Weiter sei ein Potenzwert y = x e ∈ Z∗n vorgegeben, wobei die Basis x ∈ Z∗n
unbekannt ist.

• Durch Wurzelziehen wird x ∈ Z∗n berechnet:

– Als erstes berechnet man mit Hilfe des erweiterten Euklidischen Algorithmus
(siehe (3.46)) zwei ganze Zahlen d, v ∈ Z mit

1 = d · e + v · (p − 1) · (q − 1)

216
– Anschließend berechnet man y d ; in der Tat gilt nämlich x = y d .
Begründung:

x e )d · x v·(p−1)·(q−1)
y d = (|{z} denn x (p−1)·(q−1) = 1
=y
(siehe (3.171), (3.227))
=1
z }| {
= x e·d+v·(p−1)·(q−1) = x 1 = x

qed.

Beispiel: Für n = 7 · 11 sei in ZZ77 die folgende 37-te Potenz gegeben:


37 36 9 9 3
3 = 3 · 3 = 81 · 3 = 4 · 3 = 64 · 3 (3.228)
3
= −13 · 3 = 169 · −13 · 3 = 15 · −39 = 15 · 38
= 31 (3.229)

Die hier durchgeführte Rechnung wurde schrittweise durchgeführt; besser wäre natürlich
der Einsatz eines Rechners (schnelles Potenzieren, siehe (3.1)) oder das komponenten-
weise Potenzieren unter Verwendung von ZZ77 =Z˜ Z7 × ZZ77 (siehe (3.224)) gewesen.
Angenommen, man weiß jetzt nur, daß 31 in ZZ77 eine 37-te Potenz ist, und man will
die zugehörige Basis wissen, dann zieht man aus 31 die 37-te Wurzel. Im ersten Schritt
berechnet man dazu mit dem erweiterten euklidischen Algorithmus:

1 = 13 · 37 − 8 · (6 · 10) (3.230)

Zu Berechnen ist daher die 13-te Potenz


13 6 6 6 3
31 = 961 · 31 = 31 · 31 · 31 = 37 · 31 = 1369 · 31
3
= −17 · 31 = −4913 · 31 = = 15 · 31 = 465
= 3 (3.231)

Man hat somit wieder die Basis 3 aus (3.228) erhalten.


Obwohl es in der Praxis nicht üblich ist – man nimmt dort das schnelle Potenzieren,
siehe (3.1) – soll hier die letzte Potenz zum Vergleich noch einmal unter Ausnutzung
˜ Z7 × ZZ77 (siehe (3.224)) berechnet werden:
von ZZ77 =Z
 13  
13 13 13
31 =
ˆ 31 , 31 = 3 , 9 Jetzt den Satz von Euler anwenden!
   
1 3 3  
= 3 , 9 = 3 , −2 = 3 , −8 = 3, 3

=
ˆ 3 (3.232)

Hier war nicht einmal die Anwendung des chinesischen Restsatzes notwendig.

Eine weitere sehr wichtige Folgerung aus der Gleichungen (3.226) und (3.169) betrifft
die Tatsache, daß der Anteil der nicht invertierbaren Elemente in Zp·q sehr gering ist.

217
Dieser Anteil beträgt nämlich

#Zp·q − #(Zp·q )∗ p · q − (p − 1) · (q − 1)
= p·q
#Zp·q (3.233)
= p + q − p 1· q
1 1

Für zwei Primzahlen mit p, q > 2 000 000 000 ist dieser Anteil kleiner als ein Milliardens-
tel. Bei zufälliger Auswahl einer Restklasse r aus Zp·q ist daher die Wahrscheinlichkeit
außerordentlich gering, daß r nicht invertierbar ist; man kann daher davon ausgehen,
daß r ∈ (Zp·q )∗ ist39 .

3.3.2.7 Anwendungen
3.3.2.7.1 Idee und Ablauf des RSA-Verfahrens Das Verfahren von River, Sha-
mir und Adelmann, kurz RSA-Verfahren genannt, ist ein asymmetrisches Verfahren,
d. h. die beiden Schlüssel k1 und k2 sind unterschiedlich (siehe Seite 145). Die große
Bedeutung dieses Verfahren besteht darin, daß der Besitzer B der beiden Schlüssel von
beliebiger Seite her ohne besonderen Schlüsselaustausch eine vertrauliche Nachricht emp-
fangen kann:

• Der Besitzer B veröffentlicht k1 , den Schlüssel zur Verschlüsselung. k1 wird daher


als öffentlicher Schlüssel (public key) bezeichnet.

• Der Schlüssel zum Entschlüsseln, k2 wird jedoch vertraulich gehalten. k2 ist der
private Schlüssel (private key).

• Jeder kann nun eine mit dem öffentlichen Schlüssel k1 verschlüsselte vertrauliche
Nachricht an B senden.

• Nur B kann die so verschlüsselten und an ihn gerichteten Nachrichten lesen, da nur
B den privaten Schlüssel k2 kennt und daher nur er diese Nachrichten entschlüsseln
kann.

39
Wie man später sehen wird, werden in der Tat ausschließlich sehr große Primzahlen verwendet.

218
Klartext

?
Verschlüsselung
P
i
PP
P Sender (beliebig)
PP
PP
PP
PP
?
öffentlicher Schlüssel
Geheimtext des Empfängers (k1 )
%EE
, 
,D %
Feind
  6

?
privater Schlüssel
Entschlüsselung 
(k2 )

Klartext
Empfänger (B)

Das RSA-Verfahren ist ein Beispiel für ein public key-Verfahren. Der zu Grund liegende
Algorithmus zur Ver- und Entschlüsselung beruht auf dem Wurzelziehen in dem Rest-
klassenring Zp·q (siehe Seite 216); es folgt der genau Ablauf des Verfahrens:
1. B wählt zwei Primzahlen
p, q ∈ N mit p 6= q (3.234)
B wählt weiterhin einen Exponenten
e ∈ N mit ggT(e, (p − 1)(q − 1)) = 1 (3.235)
B setzt
n=p·q
.
2. B veröffentlicht
k1 = (n, e) (3.236)
Dieses ist Bs öffentlicher Schlüssel. Die beiden gewählten Primzahlen p und q hält
B jedoch geheim.
3. A will B eine vertrauliche Nachricht M senden, dazu
• zerlegt A die Nachricht M in k Bitblöcke mit
M = M1 , M2 , . . . , Mk mit Mi < n (3.237)
Die Bitblöcke Mi werden dabei als nicht negative Dualzahlen aufgefaßt.

219
• Anschließend berechnet A unter Verwendung des bekannt öffentlichen Schlüs-
sels (n, e) blockweise für i = 1, . . . k die Verschlüsselung durch

Ci = e(Mi , b1 ) = Mie mod n (∈ (Zn )∗ ) (3.238)

• A sendet die verschlüsselten Blöcke C1 , . . . , Ck an B.

4. B empfängt die Ci und entschlüsselt sie. Dazu berechnet B seinen privaten Schlüs-
sel d mit Hilfe des erweiterten euklidischen Algorithmus:

1 = d · e + v · (p − 1)(q − 1) (3.239)

und zieht die Wurzel“ (siehe Seite 3.3.2.6); für i = 1, . . . k berechnet B



d
Mi = Ci (∈ (Zn )∗ ) (3.240)

Wegen Mi < n ist Mi der kleinste positive Rest der durch (3.240) berechneten
Restklasse Mi ∈ Zn ; B kann daher für i = 1, . . . k den Klartextblock Mi aus (3.240)
eindeutig bestimmt und damit insgesamt die empfangene Nachricht entschlüsseln.

Wie könnte ein Brechen dieses Codes aussehen? Angenommen, ein Angreifer hat Ci
abgefangen:

• Er weiß. daß Ci = Mie gilt, da er das Verfahren kennt.

• Mi ist ihm unbekannt, er will es ermittelt.


p
• Er muß Ci in Zn berechnen
e

• Er muß 1 = d·e+v·(p−1)(q−1) berechnen (erweiterter euklidischer Algorithmus).

• Er benötigt dazu (p − 1)(q − 1) bzw. die beiden Primzahlen p und q.

• Er benötigt die Zerlegung n = p · q.

• Er kennt aber nur n, die Primfaktoren p und q sind unbekannt!!.

• Er müßte daher aus n die Faktoren p und q durch Teilersuche“ ermitteln.



300
Für großes n (n ≥ 10 ) gilt jedoch

• Eine Faktorensuche durch nacheinander ausgeführte Teilbarkeitstests ist zu lang-


sam!

• Es gibt zwar schnellere algebraische Methoden zum Teilerfinden, aber auch diese
besitzen zumindest zur Zeit noch keine ausreichende Geschwindigkeit, um den
Code in absehbarer Zeit zu brechen.

Gebrochen wurden bereits Schlüssel der Länge 430 Bits (≈ 10130 ) sowie mit großem
Aufwand auch der Länge 512 Bits (≈ 10153 ). Als Folgerung bzw. Empfehlung ergibt sich
daraus:

• 512 Bits gelten nur noch als bedingt sicher.

• Minimal 768 Bits (n ≈ 10225 ) oder 1024 Bits (n ≈ 10300 ) sollten verwendet werden.

220
• Um ganz sicher zu gehen, wähle man

p, q ≈ 21024 , d. h. n ≈ 22048 ≈ 10600

• p − 1 und q − 1 sollten nicht nur kleine Primfaktoren (wie z. B. 2, 3, 5 usw.)


enthalten.

Neben der Faktorisierung gibt es weitere Angriffsmöglichkeiten.

Beispiel: B erzeugt ein Schlüsselpaar und wählt dazu die beiden (für die Anwendung zu
kleinen) Primzahlen p = 211 und q = 223. Damit berechnet bzw. wählt er aus:

n = p · q = 47053
ϕ(n) = (p − 1) · (q − 1) = 46620
e = 107 der gewählte öffentliche Exponent: er muß teilerfremd zu ϕ(n) sein.
1 = (−4357) · |{z}
107 + 10 · 46620
| {z }
| {z }
d e ϕ(n)

k1 = (47053, 107) öffentlicher Schlüssel


k2 = (47053, −4357) privater Schlüssel

A sendet die Nachricht M = 2013 an B und verschlüsselt sie dazu mit Bs öffentlichem
Schlüssel:

C = M 107 mod 47053 ≡ 42747 mod 47053

A versendet C = 42747. B empfängt C und entschlüsselt dieses:

42747−4357 ≡ 105234357 mod 47053 Wegen des negativen Exponenten


wurde zunächst die inverse Rest-
klasse von 42747 in ZZn berechnet.
≡ 2013 mod 47053

Damit hat B den Klartext der von A gesandten Nachricht berechnet.

3.3.2.7.2 Münzwurf per Telefon


Zwei miteinander telefonierende40 Personen wollen eine Münze werfen. Teilnehmer A soll
raten, welche Seite der Münze oben liegen wird. Teilnehmer B wird die Münze werfen
und A mitteilen, ob er richtige geraten hat. Wenn A richtig geraten hat, hat er gewonnen,
sonst hat B gewonnen.

40
ohne Bildübertragung

221
Teilnehmer A Teilnehmer B
rät - wirft die Münze

   
Welche Seite
?
liegt oben?

Z
 
oder K
A B

Dabei ergibt sich folgendes Problem: A kann die Münze nicht sehen, er muß sich auf B’s
Aussage verlassen. Wie kann der Teilnehmer B dem Teilnehmer A glaubhaft machen,
daß jener falsch geraten hat?
Ansatz zur Lösung • Wenn A falsch rät, so verrät er damit gleichzeitig eine geheime
dieses Problems: Information. Dadurch daß B seine Kenntnis dieser geheime
Information nachweist, beweist er, daß A falsch geraten haben
muß.

• Die geheime Information (dem Spieler A bekannt, dem Spieler


B unbekannt) ist die Kenntnis der beiden Primfaktoren p und
q einer Zahl
n = p·q
Die Zahl n selber ist beiden Spielern bekannt und ist sehr
groß, etwa
n > 10300

Die Zerlegung n = p · q ist damit ebenso wie beim RSA-Verfahren die vertrauliche
Information, die hier nur dem Teilnehmer A bekannt. Wie schon beim RSA-Verfahren
bemerkt, ist das Berechnen der Zerlegung der Zahl n bei dieser Größenordnung praktisch
unmöglich.
Genau dann, wenn A falsch rät, soll er mit seiner falschen Aussage die bis dahin geheime
Zerlegung n = p · q an B verraten. B soll aus A’s falscher Aussage und dem ihm bekann-
ten korrekten Ergebnis die Zerlegung berechnen können, was andernfalls ja praktisch
unmöglich wäre. Dadurch, daß er nun die Zerlegung kennt, kann B glaubhaft machen,
daß A falsch geraten hat.
Wie kann ein Verfahren so etwas ermöglichen? Grundlage ist das besondere Verhalten
beim Ziehen der Quadratwurzeln im Restklassenring ZZn mit n = p · q.
Als Beispiel werden die Multiplikationstabellen in den beiden Restklassenringen (siehe
auch Seite 202)

• ZZ7

• ZZ7·11

betrachtet. Die Quadrate (die quadratischen Reste) befinden sich auf den Diagonalen.
Die von Null verschiedenen Quadrate wurden unterstrichen:41
41
Wie üblich werden die Restklassen hier wieder durch ihre kleinsten nicht negativen Repräsentanten
dargestellt.

222
∗ 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
Multiplikationstabelle von ZZ7

∗ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2 0 2 4 6 8 10 12 14 1 3 5 7 9 11 13
3 0 3 6 9 12 0 3 6 9 12 0 3 6 9 12
4 0 4 8 12 1 5 9 13 2 6 10 14 3 7 11
5 0 5 10 0 5 10 0 5 10 0 5 10 0 5 10
6 0 6 12 3 9 0 6 12 3 9 0 6 12 3 9
7 0 7 14 6 13 5 12 4 11 3 10 2 9 1 8
8 0 8 1 9 2 10 3 11 4 12 5 13 6 14 7
9 0 9 3 12 6 0 9 3 12 6 0 9 3 12 6
10 0 10 5 0 10 5 0 10 5 0 10 5 0 10 5
11 0 11 7 3 14 10 6 2 13 9 5 1 12 8 4
12 0 12 9 6 3 0 12 9 6 3 0 12 9 6 3
13 0 13 11 9 7 5 3 1 14 12 10 8 6 4 2
14 0 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Multiplikationstabelle von ZZ3·5

Beim Vergleich der beiden Multiplikationstabellen sollte Folgendes auffallen:

• Bei ZZ7 erscheint jedes Quadrat in der Diagonalen genau zweimal. Das sollte nicht
weiter erstaunen, siehe dazu (3.183), (3.184).

• Bei ZZ3·5 erscheinen hingegen in der Diagonalen einige Quadrate viermal.

Der erste dieser beiden Fällen wurde bereits in Abschnitt 3.3.2.4 (ab Seite 202) erläutert.
Es folgt die Betrachtung der Quadrate in ZZp·q mit den beiden ungeraden Primzahl p
und q. Sei dazu

a = c 2 ∈ ZZp·q (3.241)

ein Quadrat. Wie schon bemerkt, kann die Gleichung

X2 − a = 0 (3.242)

für a 6= 0 bis zu vier Lösungen besitzen. Diese ungewohnte Tatsache liegt daran, daß
ZZp·q kein Körper ist und nicht einmal nullteilerfrei ist42 ist. Sei etwa X = u eine Lösung
42
Aufgabe: Finden Sie mindestens zwei Nullteiler in ZZp·q .

223
von (3.242), dann gilt:
0 = u2 − a = u2 − c2
(3.243)
= (u − c)·(u + c)

Wie üblich erhält man wieder jeweils eine Lösung, wenn einer der beiden Faktoren null
ist.
Aber wenn die Gleichung (3.243) erfüllt ist, so kann man daraus nicht schließend, daß
jeder der beiden Faktoren auf der rechten Seite von (3.243) zwingend null sein muß. Es
ist zusätzlich noch möglich, daß die Faktoren Nullteiler sind.
Man erkennt, daß in der Tat vier Lösungen vorhanden sein können, wenn man die
Entsprechung (3.224) verwendet und jede Restklasse in ZZp·q wieder durch ein Restklas-
senpaar in ZZp × ZZq darstellt. Die Quadratzahl (3.241) wird dann zu
( a , a ) = ( c , c )2 = ( c 2 , c 2 ) ∈ ZZp × ZZq (3.244)
Damit lassen sich sofort vier Lösungen der Gleichung (3.242) angeben:

 1. (+ c , + c )


 2. (− c , − c )

p
(a, a) = (3.245)


 3. (+ c , − c )


4. (− c , + c )
Durch Quadrieren sieht man sofort, daß dieses alles Lösungen von (3.242) (unter Berück-
sichtigung von (3.224)) sind. Daß diese vier Lösungen alle verschieden sein können, zeigt
das folgende

Beispiel: Sei n = 7 · 11. Dann ist wegen

( 3 , 5 )2 = ( 9 , 25 ) = ( 2 + 7 , 3 + 2 · 11 ) = ( 2 , 3 ) (3.246)

( 2 , 3 ) eine Quadratzahl, und die Quadrate der folgenden vier Restklassenpaare ergeben
wieder ( 2 , 3 ):

(+ 3 , + 5 ), (− 3 , − 5 ), (+ 3 , − 5 ), (− 3 , + 5 ) (3.247)

Stellt man ( 2 , 3 ) mit Hilfe des chinesischen Restsatzes (siehe (3.80), (3.82)) durch eine
Restklasse in ZZ77 dar, so erhält man mit 1 = −3 · 7 + 2 · 11:

(2, 3) =
ˆ −3 · 3 · 7 + 2 · ·2 · 11 = −63 + 44 = 58 (3.248)

Ebenso werden die vier Lösungen aus (3.247) durch jeweils eine Restklasse in ZZ77 dar-
gestellt:
(+ 3 , + 5 ) =
ˆ −5 · 3 · 7 + 3 · ·2 · 11 = −105 + 66 = 38
(− 3 , − 5 ) =
ˆ +5 · 3 · 7 − 3 · ·2 · 11 = +105 − 66 = 39
(3.249)
(+ 3 , − 5 ) =
ˆ +5 · 3 · 7 + 3 · ·2 · 11 = +105 + 66 = 17
(− 3 , + 5 ) =
ˆ −5 · 3 · 7 − 3 · ·2 · 11 = −105 − 66 = 60

Wie man sieht, sind alle vier Restklassen in (3.249) unterschiedlich. Die Restklasse
(3.248) aus ZZ77 besitzt tatsächlich vier verschiedene Quadratwurzeln.

224
Wie man anhand von (3.249) und auch von (3.245) sieht, setzen sich die vier Lösungen
aus zwei Paaren zusammen, die jeweils aus zwei Lösungen bestehen. Die beiden Lösungen
eines Paares unterscheiden sich dabei nur um den Faktor −1.
Genau dieses wird beim Münzwurf per Telefon ausgenutzt. Beim Raten muß sich der
Teilnehmer A für eine von zwei Möglichkeiten entscheiden. Diese beiden Möglichkeiten
sind die Lösungspaare bzw. Paare aus Quadratwurzeln eines quadratischen Restes aus
ZZp·q .

Bevor der Ablauf des Münzwurfs per Telefon erläutert werden kann, muß noch gezeigt
werden, wie in ZZp·q aus einem quadratischen Rest die Quadratwurzeln berechnet werden
können. Dabei wird

p ≡ 3 mod 4 q ≡ 3 mod 4 (3.250)

vorausgesetzt, so daß (3.195) angewandt werden kann. Für ein Quadrat in ZZp·q

a = c2 mit einem c ∈ ZZ (3.251)

nutzt man wieder die Entsprechung (3.224), faßt a als Restklassenpaar ( a , a ) in ZZp ×
ZZp auf und zieht aus jeder Komponente einzeln nach (3.195) die Quadratwurzel:
p+1
c1 = a 4 in ZZp
q+1
(3.252)
c2 = a 4 in ZZq

Dieses liefert die vier Quadratwurzeln in ZZp × ZZq

(+ c1 , + c2 ), (− c1 , − c2 ), (− c1 , + c2 ), (+ c1 , − c2 )

die dann wieder mit Hilfe des Chinesischen Restsatzes zu Restklassen in ZZp·q zusammen
gesetzt werden. Nachdem man mit dem euklidischen Algorithmus 1 = s·p+t·q berechnet
hat, setzt man

u1 = c2 · s · p + c1 · t · q
u2 = −u1
(3.253)
u3 = c2 · s · p − c1 · t · q
u4 = −u3

Beispiel: n = 77 = 7 · 11

1. Gegeben ist 23 = 102 . Gesucht sind alle Lösungen in ZZ77 von

X 2 = 23

2. Setze in ZZ7
7+1
c1 = 23 4 = 232 = 4

225
3. Setze in ZZ11
11+1
c2 = 23 4 = 233 = 1

4. Es ist
1 = 2 · 11 − 3 · 7

5. Setze

u1 = +2 · 11 · 4 − 3 · 7 · 1 = 67

u2 = −u1 = −67 =
ˆ 10

u3 = +2 · 11 · 4 + 3 · 7 · 1 = 109 =
ˆ 32

u4 = −u3 = −109 =
ˆ 45

Es folgt der Ablauf des Münzwurfs per Telefon:

• B soll die Münze werfen“.



• A soll raten“.

1. A:

(a) zufällige Auswahl zweier geheimzuhaltender Primzahlen

p, q > 10150

die beide mit Rest 3 durch 4 teilbar sind.


(b) Berechnung von n = p · q
(c) Senden von n an B

2. B:

(a) zufällige Auswahl einer geheimzuhaltenden Zahl c mit

0 < c < n

(b) Berechnung im Restklassenring ZZp·q von

a = c · c = c2

mit einem Repräsentanten


0 < a < n
(c) Senden von a an A

3. A:

226
(a) kennt die Zerlegung n = p · q und kann damit nach (3.252), (3.253) die vier
Quadratwurzeln von a berechnen:

u1 u2 = −u1

u3 u4 = −u3

(b) Eine der beiden Gleichungen muß gelten:

u1 = ±c

oder u3 = ±c

A rät, welche der beiden Gleichungen gilt, und sendet entsprechend an B

u = u1 oder u = u3

4. B: testet:
gilt x = ±c ?

1. Fall: Gleichung erfüllt, B sendet an A : Du hast gewonnen“



2. Fall: Gleichung nicht erfüllt, B sendet an A : Du hast verloren“

Um dieses zu beweisen, berechnet B die geheime Zerlegung n = p · q und
sendet diese an A.

Wie kann B die geheimgehaltene Zerlegung n = p · q im 2. Fall berechnen?

Wenn A falsch geraten hat, kennt B von der Gleichung

X2 = a

die beiden Lösungen

c (seine eigene Lösung)

u (die von A gesandte Lösung)

Für diese gilt:


c 6= u und c 6= −u
Daraus erhält B die Zerlegung n = p · q, es gilt nämlich

 p
ggT(u + c, n) = oder
q

227
Der größte gemeinsame Teiler kann schnell durch den euklidischen Algorithmus berech-
net werden.
Begründung der Gleichung

 p
ggT(u + c, n) = oder
q

Zunächst gilt

c 6= u ⇒ c−u 6= 0 ⇒ n = p · q teilt nicht c − u

c 6= −u ⇒ c+u 6= 0 ⇒ n = p · q teilt nicht c + u

andererseits gilt

c2 = a = u 2

⇒ c2 − u 2 = 0

⇒ n = p · q teilt (c2 − u2 ) = (c − u) · (c + u)

Dieses kann nur erfüllt sein, wenn

(c − u) und (c + u)

beide von genau einer der beiden Primzahlen geteilt werden. Damit folgt:
)
ggT(c + u, n) = p
oder umgekehrt
ggT(c − u, n) = q

Beispiel:

1. A:

(a) wählt die beiden Primzahlen p = 7 und q = 11 aus


(b) Sendet an B n = 77

2. B:

(a) wählt aus c = 10 mit


(b) berechnet a = 10 · 10 = 100 = 23
(c) sendet a = 23 an A

3. A:

228
(a) kennt die Zerlegung 77 = 7 · 11 und kann damit die vier Quadratwurzeln
von 23 berechnen (siehe vorne):

67 10 = −67

32 45 = −32

(b) Eine der beiden Gleichungen muß gelten :

67 = ±c

oder 32 = ±c

Zur Erinnerung: A kennt c nicht!


A rät, welche der beiden Gleichungen gilt und sendet entsprechend an B

u = 67 oder u = 32

Angenommen, A rät falsch und sendet u = 32 an B

4. B: stellt fest:
32 6= ±10
und B an A : Du hast verloren“

Um dieses zu beweisen, berechnet B die geheime Zerlegung 77 = p · q und sendet
diese an A:

p = ggT(u + c, n) = ggT(32 + 10, 77) = 7

77
q = = 11
7

Dadurch, daß A 32 geraten hat, hat B die fehlende Information zum Herausfinden der
geheimen Zerlegung 77 = 7 · 11 bekommen.

Wie könnte B schummeln?


B müßte dazu die Zerlegung n = p·q direkt, d. h. ohne Kenntnis zweier Quadratwurzeln
c , u von a mit c 6= ± u , herausfinden. Wie schon im Zusammenhang mit dem RSA-
Verfahren erwähnt, ist dieses für große Primzahlen p und q praktisch unmöglich.

229
Kapitel 4

Grundlagen der Vektorrechnung

4.1 Problemstellung und grundlegende Definitionen

Beispiel: Gegeben seien zwei positive Ladun-


gen Q1 und Q2 mit Q1 = 2Q2 ; weiterhin sei w Q2
ein negativ geladenes Teilchen mit Ladung q
vorhanden.
Man stellt fest, daß auf das Teilchen eine
Kraft F1 der Größe
F1
*

F1 = a N  
 α
u
 w
wirkt. q
Vertauscht man die beiden Ladungen Q1 und Q1
Q2 miteinander, so wirkt auf das Teilchen ei-
ne andere Kraft F2 , die denselben Betrag wie
F1 besitzt, sich aber gleichwohl von F1 unter-
scheidet.
Was ist der Unterschied zwischen den beiden Kräften F1 und F2 ?

w Q1

F1 und F2 besitzen denselben Betrag, wirken


F2 
 aber in unterschiedliche Richtungen.
1 F
  *
 α
u

 w
q
Q2

Dieses Beispiel zeigt: Zur vollständigen Beschreibung einer Kraft ist die Angabe einer
Maßzahl nicht ausreichend; man benötigt zur Darstellung einer Kraft und ebenso zur
Darstellung zahlreicher anderer Größen sogenannte Vektoren.
Ein Vektor wird durch einen Pfeil veranschaulicht und durch die folgenden Angaben
festgelegt:

230
• die Länge des Pfeils, es handelt sich dabei um eine nicht negative Maßzahl;

• eine Richtung, gegeben durch den Winkel des Pfeils zur x-Achse (bzw. bei räum-
lichen Vektoren zusätzlich durch den Winkel zu z-Achse);

• einen Richtungssinn, angedeutet durch die Pfeilspitze.

Länge l *





α


Üblicherweise identifiziert man einen Vektor mit seinem Pfeil und spricht somit von der
Länge, der Richtung und dem Richtungssinn eines Vektors.
Die Lage des Vektors (bzw. seines zugehörigen Pfeils) ist unerheblich; man nennt daher
die Vektoren auch ungebundene Vektoren.

Bemerkung: Ersetzt man in dem Beispiel die Ladung q des Teilchens durch −q, so
wechselt der Kraftvektor seinen Richtungssinn.

Bei der Bezeichnung von Vektoren will man eine deutliche Abgrenzung zu der Bezeich-
nung üblicher Größen vornehmen; von den unterschiedlichen Schreibweisen, die für Vek-
tornamen gebräuchlich sind, sollen hier die beiden folgenden verwendet werden:

• ein kleiner oder großer lateinischer Buchstabe mit einem darüber stehenden Pfeil:

~a, ~b, ~x, ~y , A,


~ B,
~ ...

• ein Pfeil über zwei Großbuchstaben, die den Anfangs- und Endpunkt des Vektors
darstellen:
Q
:

 
 

P~Q
 
 
P

Beispiele für vektorielle Größen:

• Kraft: F~
F~ )
• Beschleunigung: ~b (= m

• Geschwindigkeit: ~v

~ (= F~ )
• elektrische Feldstärke: E q

• Stromdichte1 : J~ oder S
~
1
Die Anzahl positiver Ladungsträger, die sich je Zeiteinheit und Flächeneinheit in eine bestimmte
Richtung bewegen.

231
Bei einigen Größen reicht zu deren Beschreibung die Angabe einer Maßzahl (einschließ-
lich Vorzeichen), man nennt diese Größen Skalare; Beispiele für skalare Größen sind:

• Masse: m

• Spannung: U

• Ladung: Q

• Energie: W

Definition: Der Betrag eines Vektors ~a ist die Länge des zugehörigen Pfeils, man schreibt
dafür ||~a|| oder auch |~a|.
Der Betrag eines Vektors ist immer eine nicht negative reelle Zahl:

||~a|| ∈ [0, ∞)

Definition: Der Nullvektor ist derjenige Vektor, bei dem Anfangs- und Endpunkt zu-
sammenfallen:
~0 = P~P
Bemerkung: Ein Vektor ist genau dann der Nullvektor, wenn er den Betrag Null besitzt:

||~x|| = 0 ⇔ ~x = ~0

Definition: Ein Vektor der Länge 1 heißt Einheitsvektor:

||~e|| = 1 ⇔ ~e ist Einheitsvektor.

Einen Einheitsvektor verwendet man insbesondere dann, wenn es nur auf die Richtung
und den Richtungssinn eines Vektors ankommt und dessen Länge unerheblich ist.
Definition: Ein Vektor heißt Ortsvektor, wenn sein Anfangspunkt im Ursprung des kar-
tesischen Koordinatensystems liegt:
y

3P





~a ~
 ~a = OP





O x

Bemerkung: Bei einem Ortsvektor ist dessen Lage in der Ebene bzw. im Raum eindeutig
bestimmt. Ortsvektoren unterscheiden sich damit von den ungebundenen Vektoren, bei
denen die Lage ohne Bedeutung ist.

Definition: Zwei Vektoren ~a und ~b sind genau dann gleich, wenn sie durch Parallelver-
schiebung zur Deckung gebracht werden können. Dieses ist genau dann der Fall, wenn
die beiden Vektoren bezüglich

232
• ihrer Längen,

• ihrer Richtungen

• und ihrer Richtungssinne

gleich sind.

   
~a ~b  
~a  ~b 
 
 

~a = ~b ~a 6= ~b
Wie man erkennt, spielt bei der Gleichheit zweier Vektoren deren Lage keine Rolle.
Anders verhält es sich bei Ortsvektoren: Sind ~a und ~b Ortsvektoren, so ist genau dann
~a = ~b, wenn sie durch denselben Pfeil dargestellt werden.

Definition: (Das Negative eines Vektors) Besitzen die beiden Vektoren ~a und ~b dieselbe
Länge und dieselbe Richtung, aber entgegengesetzten Richtungssinn, so gilt

~a = −~b

Als nächstes soll ein Produkt zwischen einer reellen Zahl und einem Vektor erklärt
werden.
Definition: Sei λ ∈ IR \ {0} eine reelle Zahl und ~a ein Vektor, dann ist

λ · ~a

derjenige Vektor, der

die Länge |λ| · ||~a||






die Richtung von ~a




 und den Richtungssinn von
 ~a für λ>0
−~a für λ<0

besitzt. 0 · ~a ist der Nullvektor.




~a 2~a −2~a

Für diese Multiplikation gelten die beiden Regeln: (λ, µ ∈ IR , ~a ein beliebiger Vektor)

• (λ · µ) · ~a (Assoziativgesetz)

• ||λ · ~a|| = |λ| · ||~a||

233
Mit Hilfe der Multiplikation läßt sich ein von Null verschiedener Vektor ~a durch dessen
Betrag und Richtung darstellen:
~a = a · ~n (4.1)
Dabei stellt der erste Faktor den Betrag von
~a dar: ~a, ||~a|| = a
a = ||~a||

Der zweite Faktor ist ein Einheitsvektor in =1 n, ||~n||



~


Richtung von ~a; er beinhaltet die Richtung

und den Richtungssinn von ~a. Man erhält ~n

durch

~a

~n =

||~a||
Aufgabe: Man zeige durch Nachrechnen, daß ~n tatsächlich ein Einheitsvektor ist.

Als nächstes soll die Addition zweier Vektoren erklärt werden. Zur Herleitung wird von
dem Beispiel auf Seite 230 ausgegangen.
Beispiel: Gegeben seien wieder die beiden po-
w Q2
sitiven Ladungen Q1 und Q2 mit Q2 = 2Q1
sowie das negativ geladene Teilchen mit La-
dung q.
Bezeichnet man die Kraft, die Q1 alleine auf q
ausübt, mit K ~ 1 und die, die Q2 auf q ausübt, ~1
K
mit K~ 2 , so ist die auf q wirkende Gesamtkraft -
*

~
K2 6 
 F~1 = K~1 + K
~2
offensichtlich die Überlagerung bzw. Summe 
u
  - w
der beiden Einzelkräfte: q ~1
K Q1
~ ~
F 1 = K1 + K2 ~

Trägt man den Vektor K ~ 1 noch einmal am Endpunkt von K ~ 2 an2 , so stellt man fest, daß
der Vektor F~1 = K ~ 1 +K
~ 2 vom Anfangspunkt von K~ 2 bis zum Endpunkt des verschobenen
Vektors K~ 1 verläuft.

Dieses ist genau die Regel zur Bildung der Summe zweier Vektoren ~a und ~b:
Regel: Man trage den Anfangspunkt des Vektors ~a an den Endpunkt des Vek-
tors ~b an. Der Vektor ~a + ~b verläuft dann vom Anfangspunkt von ~b bis zum
Endpunkt von ~a.
Trägt man beide Vektoren zweimal ein, einmal mit gemeinsamem Anfangs-
punkt und einmal so, daß der Anfangspunkt des einen mit dem Endpunkt des
anderen zusammenfällt, so ist ~a + ~b gerade die Diagonale des entstehenden
Parallelogrammes.
~a ~a
- -
>
 >

    
    
 
~b  

 ~b  


 ~b

 
a + ~b a + ~b 
  
  ~   ~
 
 -
~a
2
Man beachte, daß diese Vektoren ungebundene Vektoren sind.

234
Führt man diesen Prozeß mehrfach aus, so erhält man eine Vielfachsumme; für die
Zweifachsumme ergibt sich das Bild:
Y
H ~c
 HHH
 HH

  BMB
 B
~a + ~b + ~c  B
~
Bb
 B

~a + ~b
 B
 B
 B
 B
 -B
~a
Für die Addition zweier Vektoren gelten die folgenden Regeln (~a, ~b, ~c drei beliebige
Vektoren, λ, λ1 , λ2 ∈ IR ):

• ~a + (~b + ~c) = (~a + ~b) + ~c (Assoziativgesetzt),

• ~a + ~b = ~b + ~a (Kommutativgesetz),

• ~a + ~0 = ~a (der Nullvektor ist neutrales Element),

• ~a + (−~a) = ~0 (das Negative des Vektors ist inverses Element),


−~a 
 :
 


r
9
~a
 
  
P ~a + (−~a) = P~P = ~0
 −~
9 a
• (λ1 + λ2 )~a = λ1~a + λ2~a (1. Distributivgesetz)

• λ(~a + ~b) = λ~a + λ~b (2. Distributivgesetz)

Die Vektoraddition liefert zusammen mit der skalaren Multiplikation eine sehr gute
Möglichkeit zur Darstellung einer Geraden:
Man gibt einen Ortsvektor ~a und einen ungebunden, von Null verschiedenen Vektor ~b
vor und bildet mit dem Parameter t ∈ IR die Ortsvektoren

~a + t · ~b

Durchläuft der Parameter t die reellen Zahlen, so bilden die Endpunkte der Ortsvektoren
~a + t · ~b eine Gerade. Man schreibt für die Gerade
n o
~
G = ~a + t · b | t ∈ IR (4.2)

Den Vektor ~b nennt man Richtungsvektor der Geraden. In der folgenden Zeichnung
sind die Vektoren ~a + t · ~b für t = 1.65, 3.4, −1 eingezeichnet; man erkennt, daß die
Endpunkte dieser Vektoren auf einer Geraden liegen.

235
COC OCC
 C C
 C C
 C C
 C C
 C C
 C C
~a + 3.4 · ~b


C C
C 3.4 · b
~
C OC
 C C C
 C C C
 CO C C
 ~ ~
Cb C1.65 · b C
C C C



~a + 1.65 · ~b C C C
 1C


C C
  C
 
C −~b
 C
   ~ a
  C
 -CW
O ~a − ~b

Als Beispiel für eine Anwendung der Vektoraddition soll bewiesen werden, daß sich die
Diagonalen eines Parallelogrammes halbieren.

~a -
PP
i *AK

K PP
A 
A PP  A
PP d~
PP 
 c
A ~ A
A PP  A
A ~b
PP 
~b A
A

 P PP
P A
 PP
A   P PP A
A  PP A
A P- P
A
O ~a

Aus der Zeichnung erkennt man

~c = ~a + ~b, ~b = ~a + d~

Damit folgt:

Mittelpunkt der ersten Diagonalen


1 1 1
= · ~c = · ~a + · ~b (hier ~b = ~a + d~ einsetzen)
2 2 2
1 1 ~
= · ~a + (~a + d)
2 2
1
= ~a + · d~
2
= Mittelpunkt der zweiten Diagonalen

Bemerkung: So wie bei der Anwendung der Vektorrechnung auf geometrische Fragestel-
lung üblich, wurden in diesem Beispiel die Ortsvektoren mit ihren Endpunkten iden-
tifiziert. Man beachte dazu, daß ein Ortsvektor durch seinen Endpunkt festgelegt ist

236
und eine eineindeutige Beziehung zwischen Punkten in der Ebene3 und Ortsvektoren
besteht.

Die Subtraktion zweier Vektoren erfolgt


dadurch, daß zu dem einen das Negative des 7A

anderen addiert wird:  A
~b a−b~
A~
 A

~a − ~b = ~a + (−~b)  A
 A
 ~a AU
-
Anschaulich erhält man den Differenzvektor A 
~a −~b als Pfeil, der vom Endpunkt des Subtra-  A 
henden ~b bis zum Endpunkt des Minuenden −~b  A
a−b
A~
~ ~
 −b
~a verläuft. Man erhält natürlich ~a − ~b auch  A 
als Diagonale des aus ~a und ~b gebildeten Pa- 
/
 A
-AU 
/


rallelogrammes. ~a
Durch zwei Punkte verläuft bekanntlich genau eine Gerade. Mit Hilfe der Vektorsubtrak-
tion läßt sich zu zwei gegebenen Punkten P und Q sehr leicht diese Gerade konstruieren.
Man stellt die Gerade in der Form (4.2) dar: Zunächst bildet man die zu den beiden
Punkten gehörigen Ortsvektoren:
~
~x = OP und ~
~y = OQ

Man wählt den einen dieser beiden Vektoren als Ortsvektor der Geraden und die Diffe-
renz der beiden Vektoren als Richtungsvektor der Geraden. Eine Darstellung der Gera-
den durch P und Q lautet damit

G = {~x + t · (~y − ~x) | t ∈ IR } (4.3)

A
A
A
* Q
A

~y   AKA
 A
 y − ~x
A ~
O 
XXX
X
A
A
XXX
XXX A
~x XX z
XAP
A
A
G
A
A

Fragen:

1. Man überlege sich anhand eines Beispiels, daß eine Gerade mehrere Darstellungen
der Form (4.2) besitzt.

2. Warum muß bei der Geradendarstellung (4.2) vorausgesetzt werden, daß der Rich-
tungsvektor nicht der Nullvektor ist.
3
bzw. im Raum

237
4.2 Lineare Unabhängigkeit
Die beiden Vektoren ~a und ~b besitzen dieselbe

 Richtung; aus diesem Grund läßt sich der ei-
 ne Vektor als Vielfaches des anderen darstel-

len. Man sagt in diesem Fall: Die Vektoren ~a

 ⇒ ~a = λ · ~b
und ~b sind kollinear oder linear abhängig.

~a  ~b
 

Die beiden Vektoren ~a und ~b besitzen unter-


~
a 
: schiedliche Richtungen, bei ihnen besteht da-
  ~b her keine Beziehung der Form

~a = λ · ~b
Die Vektoren ~a sind nicht kollinear, sondern sie sind linear unabhängig. Sie sind
jedoch noch komplanar, da sie sich in einer Ebene befinden.

Auf ähnliche Weise folgt für die drei Vektoren


aus der Zeichnung: Es gibt keine Darstellung ~c 6
der Art *


~
 b

~c = λ~a + µ~b (4.4) 

r 
Die beiden Vektoren ~a und ~b liegen in einer 
X r
XX
Ebene, der Vektor ~c ragt aus dieser Ebene XXX
XXX
heraus. XXX
~a
z
Auch hier gilt: Die drei Vektoren ~a, ~b und ~c sind linear unabhängig. Um dieses auszu-
drücken, ist eine Schreibweise der Form (4.4) ungeeignet. Man wählt eine Formulierung,
in der die vorkommenden Vektoren in “gleichberechtigter Form“ erscheinen. Dieses ist
Inhalt der sehr wichtigen und grundlegenden
Definition: Sei n ∈ IN . Die n Vektoren ~a1 , ~a2 , . . . , ~an heißen linear unabhängig, falls
eine Gleichung mit Koeffizienten λ1 , . . . , λn ∈ IR der Form
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an = 0 (4.5)
nur für
λ1 = λ2 = · · · = λn = 0
erfüllt ist. Ist hingegen eine Gleichung der Form
n
X
λi~ai = 0
i=1

erfüllt, bei der mindestens ein λi mit λi 6= 0 vorhanden ist, so heißen ~a1 , ~a2 , . . . , ~an linear
abhängig.

Die Ausdrücke, die in der Definition der linearen Unabhängigkeit erscheinen, werden
auch an anderer Stelle häufig vorkommen; man gibt ihnen daher einen Namen:
Definition: Ein aus n ∈ IN Vektoren ~a1 , . . . , ~an und n reellen Zahlen λ1 , . . . , λn gebildeter
Ausdruck der Form
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (4.6)

238
heißt Linearkombination der ~a1 , . . . , ~an . Unter Verwendung des Summenzeichens be-
kommt eine Linearkombination die Gestalt
n
X
λi~ai
i=1

Bemerkungen:

1. Sind ~a1 , ~a2 , . . . , ~an linear abhängig, so läßt sich mindestens einer dieser Vektoren
durch die übrigen darstellen. Genauer gilt: mindestens ein Vektor läßt sich durch
eine Linearkombination der übrigen Vektoren darstellen.
Wegen der linearen Abhängigkeit der ~a1 , ~a2 , . . . , ~an besteht eine Gleichung der
Form (4.5), bei der mindestens ein Koeffizient λi von Null verschieden ist. Der
zugehörige Vektor ~ai ist dann gleich einer Linearkombination der übrigen Vektoren.
Ist beispielsweise λ1 6= 0, so ist eine Teilung durch λ1 möglich, und man kann die
Gleichung
λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (λ1 6= 0)
nach ~a1 auflösen:
n  
X λi
~a1 = − ~ai
i=2
λ1

2. Ein einzelner Vektor ~a ist genau linear abhängig, wenn ~a der Nullvektor ist; es gilt
nämlich:

~a 6= 0 ⇔ λ · ~a 6= 0 für alle λ 6= 0
~a = 0 ⇒ 1 · ~a = 0

3. Befindet sich unter den Vektoren ~a1 , . . . , ~an der Nullvektor, so sind diese Vektoren
linear abhängig. Ist etwa ~a1 = 0, so gilt:

1 · ~a1 + 0 · ~a2 + . . . + 0 · ~an = 0

Der Koeffizient von ~a1 ist hier von Null verschieden.

Es folgt ein Beispiel für die Verwendung der linearen Unabhängigkeit: Es soll gezeigt
werden, daß sich die Seitenhalbierenden eines Dreiecks im Verhältnis 2 : 1 schneiden.

Hierzu wird ein Dreieck durch ~a


Z
}
Z
drei Vektoren ~a, ~b und ~c dar-  Z
Z
gestellt. Dabei wird vorausge- 
 Z
Z
setzt, daß die beiden Vekto- 1~  1
Z
b *Z 2 ~a
ren ~a und ~b linear unabhängig
Z
2 P
i 

 PP  Z
sind.  ~
y ~x
P PP   Z
PP Z
Die beiden Vektoren ~x und ~y   P Z
 m~x n~y
 PP
 PP Z
stellen die Seitenhalbierenden    P PP ZZ
auf die Seiten ~a und ~b dar. ~b    PP
PZ

 P-
ZP
~c

239
Die Abschnitte auf den beiden Seitenhalbierenden von den Eckpunkten bis zu deren
Schnittpunkt entsprechen den Vektoren m · ~x und n · ~y . Die Behauptung ist gezeigt,
wenn man
2
m = n =
3
hergeleitet hat. Dazu werden einige Gleichungen mit Hilfe der Zeichnung aufgestellt:

~a + ~b + ~c = 0 ⇒ ~c = −~a − ~b
1
~x = ~c + ~a
2
1
~y = ~a + ~b
2
m ~x = ~c + n ~y

In die letzte Gleichung werden für ~c, ~x und ~y die drei ersten Gleichungen eingesetzt:
1 1
−m ~a − m ~b + m ~a = −~a − ~b + n ~a + n ~b
2 2
Alle Glieder werden auf die rechte Seite dieser Gleichung gebracht, anschließend werden
die Summanden mit ~a und ~b zusammengefaßt:

−m ~b − 21 m ~a + ~a + ~b − n ~a − 21 n ~b = 0
   
⇒ 1 1
1 − 2 m − n ~a + 1 − 2 n − m ~b = 0

Da die beiden Vektoren ~a und ~b linear unabhängig sind, sind die Koeffizienten von ~a
und ~b in der letzten Gleichung gleich Null:
 
1
1 − 2m − n = 0   1 m+ n = 1
⇔ 2
1
1 − 2n − m = 0   m+ 21 n = 1

Löst man dieses lineare Gleichungssystem in den unbekannten Werten m und n, so erhält
man als eindeutige Lösung
2 2
m = und n =
3 3
Damit ist die Behauptung gezeigt.

Definition: Ist n ∈ IN0 die maximale Anzahl zueinander linear unabhängiger Vektoren,
so heißt dieses n die Dimension.

Beispiel4

• In der Ebene gilt n = 2.

• Im (Anschauungsraum-) Raum gilt n = 3.


4
Begründungen folgen

240
 Q
Q
In der Ebene seien zwei linear unabhängige 
Q ~
c
 Q
Vektoren ~a und ~b vorgegeben. Weiterhin sei ~a Q
Q
ein beliebiger Vektor ~c gegeben: 
 ~b
:
Qs
Q
 

Das es sich um drei Vektoren handelt und andererseits aus Dimensionsgründen nur
höchstens zwei Vektoren voneinander linear unabhängig sein können, müssen diese drei
Vektoren linear abhängig sein, d. h. es besteht eine Gleichung

λ · ~a + µ · ~b + ν · ~c = 0

bei der mindestens einer der drei Koeffizienten λ, µ und ν von Null verschieden ist.
Insbesondere ist ν 6= 0; wäre nämlich ν = 0, so verbliebe die Gleichung

λ · ~a + µ · ~b = 0

bei der nach wie vor ein Koeffizient ungleich Null ist, d. h. λ 6= 0 oder µ 6= 0 ist; dieses
ist ein Widerspruch zur linearen Unabhängigkeit von ~a und ~b. Damit folgt:

ν 6= 0
 
λ  µ
⇒ ~c = − · ~a + − · ~b
ν ν

⇒ ~c wird durch Linearkombination von ~a und ~b dargestellt

Da sich ein beliebiger Vektor ~c aus der Ebene so darstellen ließ, bilden ~a und ~b zusammen
eine sogenannte Basis der Ebene.

Definition: Sind Vektoren ~a1 , . . . , ~an mit


1. jeder Vektor ~c läßt sich als Linearkombination der ~ai darstellen:

~c = λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an (4.7)

2. die Vektoren ~ai sind linear unabhängig,


gegeben, so heißen die ~a1 , . . . , ~an Basis.

Frage: Warum ist die Darstellung (4.7) eines Vektors durch eine Basis eindeutig?
Antwort: Angenommen, man hat zwei Darstellungen von ~c:

~c = λ1 · ~a1 + λ2 · ~a2 + . . . + λn · ~an


~c = µ1 · ~a1 + µ2 · ~a2 + . . . + µn · ~an

Die Subtraktion beider Darstellungen voneinander liefert:

~c = (λ1 − µ1 ) · ~a1 + (λ2 − µ2 ) · ~a2 + . . . + (λn − µn ) · ~an (4.8)

Da die ~ai eine Basis bilden, sind sie linear unabhängig. Die Koeffizienten in (4.8) sind
daher Null:
(λ2 − µ2 ) = 0 ⇒ λ2 = µ2 für i = 1, . . . , n

241
Es handelt sich also beide Male um dieselbe Darstellung von ~c durch die Basis (~a1 , . . . , ~an ).

Bemerkung:
maximale Länge eines linear
n = Basislänge =
unabhängigen Systems
Beispiel:

• Ebene: Basislänge=Dimension= 2.

• (Anschauungs-) Raum: Basislänge=Dimension= 3.

Um dieses begründen zu können, benötigt man eine weitere Darstellung der Vektoren,
die Komponentendarstellung.

4.3 Komponentendarstellung
Um Vektoren durch ihre Komponenten darzustellen, geht man von Kartesischen Koor-
dinaten aus:
y z y
6 Ebene 6  Raum

x x
- -

Hier sollen zunächst ebene Vektoren behandelt werden. Ein Vektor ~a ist durch
• seinen Betrag a = ||~a|| und

• seinen Winkel α mit der x − Achse P


a sin α

>
 a = ||~a||
gegeben. Als Ortsvektor ist ~a eindeutig 
~a  ~
~a = OP
durch seinen Endpunkt P bestimmt. Da- 
mit ist ~a wiederum durch die Koordi-  α

naten seines Endpunktes bestimmt, und 
die folgenden Identifizierungen können O a cos α
vorgenommen werden:

~a = ~ =
ˆ OP ˆ Punkt P mit den Koordinaten
   
a1 a · cos α
= (4.9)
a2 a · sin α

Damit hat man die Komponentendarstellung eines Vektors ~a hergeleitet:


 
a1
~a =
a2

242
Die Komponenten des Vektors sind die Koordinaten seines Endpunktes, wenn man ihn
als Ortsvektor darstellt.

Wie lauten die Rechenverknüpfungen für Vektoren in Komponentenschreibweise? Mit


den Bezeichnungen von oben ergibt sich für die Multiplikation mit λ ≥ 0 (siehe Seite 233)
(
Betrag : λ · a = λ · ||~a||
λ · ~a −→
Winkel : α
Damit lautet λ~a in Komponentenschreibweise
   
λa cos α λa1
λ · ~a = = (4.10)
λa sin α λa2
Ist λ < 0, so besitzt λ~a die entgegengesetzte Richtung von ~a:
(
Betrag : |λ| · a = |λ| · ||~a||
λ · ~a −→
Winkel : α + π


~a
Wegen λ = −|λ| sowie cos(α + π) = − cos α 
und sin(α+π) = − sin α folgt für diesen Fall: 180◦  α

 a
λ~

   
|λ|a cos(α + π) λa1
λ · ~a = = (4.11)
|λ|a sin(α + π) λa2
Beide Fälle zusammen ergeben die komponentenweise Multiplikation. Ebenso erhält
bei der Vektoraddition die komponentenweise Addition; Man erkennt dieses anhand
der Zeichnung; zur Ausführung der Addition mit Hilfe der Parallelogrammregel (siehe
Seite 234) wurde der Vektor ~b als freier Vektor an das Ende von ~a angetragen:
 
a1 + b 1
a2 + b 2  a + ~b =
1 ~
 7 
*
 a2 + b 2
  
  
   

  
a2   

 1

 
b2

 
~b 
7   
  ~ a
   
  
 
 



b1 a1 a1 + b 1

Bemerkung: Ein räumlicher Vektor wird durch drei Komponenten dargestellt, entspre-
chend verlaufen die Rechenverknüpfungen:
   
λa1 a1 + b 1
λ · ~a =  λa2  ~a + ~b =  a2 + b2 
λa2 a3 + b 3

243
z
a cos β ~a

Die Darstellung eines ebenen Vektors durch 
y

Betrag und Richtung erfolgt mit Hilfe sei- 
nes Winkels mit der x-Achse. Will man einen β

räumlichen Vektor ~a auf diese Weise dar- 
stellen, benötigt man zwei Winkel; außerdem 
verwendet man die Projektion ~b des Vektors

β 
~a auf die xy-Ebene: 

 * ~b
 
α

 x


 Betrag : a = ||~a||

~a gegeben durch Winkel von ~a mit der z-Achse : β

Winkel der Projektion ~b mit der x-Achse : α

Dabei besitzt die Projektion ~b als z-Komponente den Wert 0 und kann damit als ebener
Vektor auf der xy-Ebene aufgefaßt werden. Da offensichtlich (siehe Zeichnung) 0 ≤ β ≤
π ist, ist sin β ≥ 0; daher gilt
(
Betrag : a sin β = ||~a|| sin β
~b gegeben durch
Winkel mit x-Achse : α
Damit gilt  
a sin β cos α
~b =  a sin β sin α 
0
Die beiden ersten Komponenten von ~b sind auch die ersten beiden Komponenten von ~a;
die z-Komponente von ~a lautet (siehe Zeichnung) a3 = a cos β. Damit wurde hergeleitet:
Die Komponentenschreibweise eines durch Betrag und Richtung gegebenen räumlichen
Vektors lautet:  
a sin β cos α
~a =  a sin β sin α 
a cos β

Jetzt ist man in der Lage, zu zeigen, daß die Ebene die Dimension zwei besitzt; dazu
beweist man:
Satz: Je drei Vektoren der Ebene sind linear abhängig.
Beweis: Seien ~a = (a1 , a2 )t , ~b = (b1 , b2 )t und ~c = (c1 , c2 )t drei beliebige Vektoren der
Ebene. Zu zeigen ist: Es gibt drei Zahlen λ, µ, ν ∈ IR , von denen mindestens eine
ungleich Null ist, so daß gilt
λ · ~a + µ · ~b + ν · ~c = 0 (4.12)
Setzt man die Komponentendarstellungen der Vektoren ein, so erhält man
       
a1 b1 c1 0
λ· + µ· + ν· =
a2 b2 c2 0

244
Die Zusammenfassung der Vektoren auf der rechten Seite liefert:
   
λa1 + µb1 + νc1 0
=
λa2 + µb2 + νc2 0

Zwei Vektoren sind genau dann gleich, wenn ihre entsprechenden Komponenten gleich
sind; dieses führt auf die beiden Gleichungen:

λa1 + µb1 + νc1 = 0


λa2 + µb2 + νc2 = 0

Dieses ist ein homogenes lineares Gleichungssystem mit zwei Gleichungen und den drei
Unbestimmten λ, µ und ν; in Matrizenschreibweise lautet es:
 
  λ  
a1 b 1 c 1 0
◦  µ  =
a2 b 2 c 2 0
ν

Für dieses Gleichungssystem gilt

Rang ≤ 2 = Anzahl der Gleichungen


⇒ Corang ≥ 1 = 3 − 2 = Anzahl der Unbestimmten − Rang

Damit besitzt dieses homogene System mindestens eine von Null verschiedene Lösung
(λ, µ, ν)t ; d. h. es gibt drei Zahlen λ, µ, ν ∈ IR , die nicht alle gleich Null sind und die
das Gleichungssystem und damit (4.12). qed.

Bemerkung: Hier wurde die gängige Methode angewandt, die lineare Unabhängigkeit
bzw. Abhängigkeit von Vektoren durch Rückführung auf ein homogenes lineares Glei-
chungssystem zu testen.

Die oben bewiesene Behauptung besagt, daß

dim Ebene ≤ 2

Um zu zeigen, daß die Dimension tatsächlich zwei beträgt, gibt eine Basis der Ebene
der Länge zwei an. Eine solche Basis ist die Standardbasis, bestehend aus den beiden
Einheitsvektoren    
1 0
~e1 = ~e2 =
0 1
Man zeigt leicht, daß diese beiden Vektoren linear unabhängig sind; außerdem stellen
sie jeden beliebigen Vektor der Ebene dar:
 
a1
= a1 · ~e1 + a2 · ~e2
a2

Auf die gleiche Art zeigt man, daß der Raum die Dimension drei besitzt. Auch hier
bilden die drei Einheitsvektoren
     
1 0 0
~e1 =  0  ~e2 =  1  ~e3 =  0  (4.13)
0 0 1

245
die Standardbasis. Einen beliebigen räumlichen Vektor stellt man damit durch
 
a1
 a2  = a1 · ~e1 + a2 · ~e2 + a3 · ~e3 (4.14)
a3
dar.
Es bleibt noch zu erwähnen, wie sich der Betrag eines Vektors aus dessen Komponenten
errechnet. Man verwendet dazu den Satz des Pythagoras:
q
a2 ||~a|| = a = a21 + a22
*~
 a


 
 a

 

a1

Ebenso hat man im Raum:


q
t
||~a|| = ||(a1 , a2 , a3 ) || = a = a21 + a22 + a23

Bezeichnungen:
Ebene ˜ IR2
= 2-dim. Anschauungsraum =
˜ IR3
“Raum“ = 3-dim. Anschauungsraum =
Neben der Standardbasis (4.13) sind beliebige weitere Basen vorhanden.

Beispiel: Nachzuweisen ist die lineare Unabhängigkeit der beiden Vektoren im Raum
   
3 9
~a =  7  und ~b =  21  (4.15)
5 17
Zu prüfen ist dazu, ob die Gleichung
λ1 ~a + λ2 ~b = 0 (4.16)
nur für λ1 = λ2 = 0 erfüllt ist. Umgeschrieben in ein homogenes lineares Gleichungssys-
tem mit den Unbestimmten λ1 , λ2 lautet diese Gleichung
 
3 9  
λ1
 7 21  ◦ = 0 (4.17)
 
λ2
5 17
Das Gaußsche Verfahren (erste Gleichung durch 3 teilen, das 7-fache der ersten Glei-
chung von der zweiten Gleichung und das 5-fache der ersten Gleichung von der dritten
Gleichung abziehen, die dritte Gleichung durch 2 teilen) liefert
 
1 3  
λ1
 0 0 ◦ = 0 (4.18)
 
λ2
0 1

246
Man erkennt, der Rang ist 2, und der Corang ist Null. Dieses homogene Gleichungs-
system besitzt daher nur die Nulllösung. In der Gleichung (4.16) ist daher in der Tat
nur λ1 = λ2 = 0 möglich, und die Vektoren ~a und ~b sind linear unabhängig. Sie bilden
aber noch keine Basis, da der Raum die Dimension 3 besitzt. Will man sie zu einer Ba-
sis ergänzen, so benötigt man einen dritten Basisvektor ~c. Da in der reduzierten Form
(4.18) in der zweiten Zeile keine 1-Stufe vorhanden ist, kann man ~c = ~e2 = (0, 1, 0)t als
dritten Basisvektor wählen. Eine Basis des Raumes bilden somit
     
3 9 0
~a =  7  ~
b =  21  ~c =  1  (4.19)
5 17 0

Desweiteren soll der Vektor ~u = (6, −1, 8)t durch diese Basis dargestellt werden. Zu
bestimmen sind dazu λ1 , λ2 , λ3 ∈ IR mit

λ1 ~a + λ2 ~b + λ3 ~c = ~u (4.20)

Umgeschrieben in ein lineares Gleichungssystem lautet dieses


  
3 9 0
  
λ1 6
 7 21 1  ◦  λ2  =  −1  (4.21)
 
5 17 0 λ3 8

Mit dem Gaußschen Verfahren erhält man die reduzierte Form


  
1 3 0
  
λ1 2
 0 1 0  ◦  λ2  =  −1  (4.22)
 
0 0 1 λ3 −15

und damit weiter λ3 = −15, λ2 = −1, λ1 = 5. Das liefert die gesuchte Darstellung des
Vektors ~u durch die Basis (4.19):
       
3 9 0 6
5 ·  7  −  21  − 15 ·  1  =  −1  (4.23)
5 17 0 8

4.4 Ebenen im Raum


Die Darstellung einer Ebene erfolgt ähnlich wie die Darstellung einer Geraden (siehe
Seite 235); man benötigt nur einen zweiten Richtungsvektor, wobei die beiden Rich-
tungsvektoren linear unabhängig sein müssen5 :

E = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR } ⊂ IR3 (4.24)


5
Frage: warum?

247

  
 
  
   
 
  
 
 die Ebene 
 
 
 ~a1 
  
  3  a0 + λ~
 a1 + µ~a2
   

   
   

 
:~a2  
z      

  
  
   
~ 

a  


0  





 
 
 


y 













 x

Auf diese Weise seien jetzt zwei Ebenen gegeben:


E1 = {~a0 + λ · ~a1 + µ · ~a2 | λ, µ ∈ IR }
n o
E2 = ~b0 + l · ~b1 + m · ~b2 | l, m ∈ IR
Der Durchschnitt E1 ∩ E2 der beiden Ebenen soll untersucht werden: Liegt der Vektor ~x
im Durchschnitt (~x ∈ E1 ∩ E2 ), so läßt er sich gleichzeitig sowohl durch die definierenden
Vektoren der einen als auch durch die der anderen Ebene darstellen. Es gibt daher
Parameterwerte λ, µ, l, m ∈ IR mit
~x = ~a0 + λ · ~a1 + µ · ~a2 = ~b0 + l · ~b1 + m · ~b2 (4.25)
Da die Punkte im Durchschnitt E1 ∩E2 durch die in der Darstellung (4.25) vorkommenden
Parameterwerte eindeutig bestimmt sind, reicht es, zur Beschreibung von E1 ∩ E2 die
Menge aller Kombinationen von Parameterwerten λ, µ, l, m ∈ IR zu beschreiben, die zu
einer Darstellung der Art (4.25) gehören.
Nun stellt aber (4.25) ein Gleichungssystem der zu ~x ∈ E1 ∩E2 gehörigen Parameterwerte
dar. Formt man (4.25) so um, daß auf der rechten Seite nur die konstanten Summanden
stehen, und setzt man die Komponenten der vorkommenden Vektoren ein, so lautet das
Gleichungssystem
λ · a11 + µ · a12 − l · b11 − m · b12 = −a10 + b10
λ · a21 + µ · a22 − l · b21 − m · b22 = −a20 + b20 (4.26)
λ · a31 + µ · a32 − l · b31 − m · b32 = −a30 + b30
In Matrizenschreibweise lautet dieses Gleichungssystem:
 
  λ  
a11 a12 −b11 −b12  µ  −a10 + b10
 a21 a22 −b21 −b22  ◦   −a20 + b20 
 l  = (4.27)

a31 a32 −b31 −b32 −a30 + b30
m

248
Um E1 ∩ E2 zu beschreiben, muß nun die Lösungsmenge des Gleichungssystems (4.27)
untersucht werden. Die Lösungsmenge hängt vom Rang des Gleichungssystems ab; für
den Rang von (4.27) gilt

Rang ≤ 3 = Anzahl der Gleichungen


⇒ Corang = Anzahl der Unbestimmten − Rang ≥ 4 − 3 = 1

Als erstes Ergebnis erhält man damit: Die Lösungsmenge des Gleichungssystems (4.27)
besteht niemals nur aus einem Element. Angewandt auf E1 ∩ E2 bedeutet dieses: zwei
Ebenen im Raum schneiden sich niemals genau in einem Punkt.
Betrachtet man die möglichen Werte für den Rang im einzelnen, so erhält man:

1. Rang = 3: In diesem Fall ist der Rang gleich der Anzahl der Gleichungen, es
gibt daher keine Nullgleichungen, und das Gleichungssystem ist sicher lösbar.
Da der Corang gleich 1 ist, ist die Lösungsmenge durch eine spezielle Lösung
(λ0 , µ0 , l0 , m0 ) und durch eine Grundlösung (λ1 , µ1 , l1 , m1 ) des zugehörigen homo-
genen Systems gegeben:
 
λ0 + t · λ1
 µ0 + t · µ1 

 l0 + t · l1 
 mit t ∈ IR (4.28)
m0 + t · m1

Welche Gestalt von E1 ∩ E2 folgt hieraus? Da eine Grundlösung eines homogenen


Systems nicht Null ist, muß mindestens eine der Zahlen λ1 , µ1 , l1 , m1 ungleich Null
sein. Sei etwa λ1 6= 0 oder µ1 6= 0, dann setzt man (4.28) in die Darstellung der
Geraden E1 ein6 :

~x = ~a0 + (λ0 + t · λ1 )~a1 + (µ0 + t · µ1 )~a2


= (~a0 + λ0~a1 + µ0~a2 ) + t · (λ1~a1 + µ1~a2 )
für alle t ∈ IR

Dieses ist die Darstellung einer Geraden. In diesem Fall handelt es sich bei E1 ∩
E2 somit um eine Gerade. Zu beachten ist noch, daß die Gerade einen von Null
verschiedenen Richtungsvektor λ1~a1 + µ1~a2 besitzt; dieses liegt an der linearen
Unabhängigkeit von ~a1 und ~a2 .

2. Rang = 2: In diesem Fall besitzt das Gleichungssystem (4.27) nach Reduzierung


eine Nullgleichung; abhängend von deren rechter Seite ergeben sich zwei Möglich-
keiten:

(a) Das Gleichungssystem ist unlösbar und damit E1 ∩ E2 = ∅. Man kann zeigen,
daß dieses genau dann der Fall ist, wenn die beiden Ebenen parallel aber
nicht gleich sind.
(b) Das Gleichungssystem ist mit 2 = (4−Rang) Grundlösungen lösbar. In diesem
Fall ist E1 ∩ E2 eine Ebene und es gilt

E1 ∩ E 2 = E1 = E2
6
Andernfalls würde man (4.28) in die Darstellung der Geraden E2 einsetzen.

249
3. Rang ≤ 1: Man kann zeigen, daß dieser Fall nicht vorkommt. Die Annahme
Rang ≤ 1 führt zu einem Widerspruch zur linearen Unabhängigkeit der beiden
Richtungsvektoren ~a1 und ~a2 bzw. der beiden Richtungsvektoren ~b1 und ~b2

Bemerkung: Das hier vorgestellte Verfahren zur Beschreibung des Durchschnitts zweier
Ebenen ist effektiv: mit ihm läßt sich der Durchschnitt zweier gegebener Ebenen konkret
berechnen.

Aufgabe: Man führe eine entsprechende Überlegung zur Untersuchung des Durchschnitts
zweier Geraden G1 ∩ G2 durch. Man verwende für ~x ∈ G1 ∩ G2 die Darstellung durch die
beiden Geradengleichungen:

~x = ~a0 + λ · ~a1 = ~b0 + l · ~b1

und leite daraus ein Gleichungssystem für die möglichen Parameterwerte ab. Dieses Glei-
chungssystem besitzt den Rang eins oder zwei; es besteht aus zwei oder drei Gleichungen,
je nach dem ob es sich um ebene oder räumliche Geraden handelt.

4.5 Das Skalarprodukt


Das Skalarprodukt ist eine Rechenvorschrift, durch die zwei Vektoren ein Skalar, d. h.
eine reelle Zahl zugeordnet wird. Man stößt auf das Skalarprodukt, wenn man berech-
net, welche Arbeit bei Fortbewegung eines Massenpunktes längs eines gerichteten Stre-
ckenstückes ~s durch eine Kraft F~ geleistet wird. Ausschlaggebend für die geleistete Ar-
beit sind die Länge des Streckenstückes ||~s|| sowie die Länge des Kraftanteils in Richtung
von ~s; ist α der Winkel zwischen ~s und F~ , so beträgt diese Länge ||F~ || · cos α:

F~
*

 die geleistete Arbeit:

  
α W = ||~s|| · ||F~ || · cos α
 - ~s
 -
||F~ || · cos α

Dieser von den beiden Vektoren ~s und F~ abhängende Ausdruck ist nicht nur bei der
Berechnung der geleisteten Arbeit von Bedeutung. Man trifft daher die folgende
Definition: Für zwei Vektoren ~a und ~b heißt

~a · ~b = ||~a|| · ||~b|| · cos α (4.29)

das Skalarprodukt von ~a und ~b. Dabei ist α der Winkel zwischen den beiden Vektoren
~a und ~b:
*


~a 

  α
 - ~b

250
Eine andere Schreibweise für das Skalarprodukt lautet: (~a, ~b):

Frage: Warum ist es für den Wert des Skalarproduktes unerheblich, ob der größere oder
der kleinere Winkel zwischen den beiden Vektoren verwendet wird?
Bemerkung: Man beachte, daß der Wert des Ausdruckes (4.29) eine reelle Zahl, d. h. ein
Skalar, ist.
Bemerkung: Ist einer der beiden Faktoren des Skalarproduktes der Nullvektor, so ist der
Wert des Skalarproduktes Null. Anders als bei dem Produkt reeller Zahlen ist es beim
Skalarprodukt jedoch möglich, daß sein Wert Null ist und trotzdem keiner seiner beiden
Faktoren gleich dem Nullvektor ist (Beispiel?).

Bemerkung: Mit Hilfe des Skalarproduktes kann nachgerechnet werden, ob zwei von Null
verschiedene Vektoren ~x und ~y aufeinander senkrecht stehen; es gilt nämlich (α ist der
Winkel zwischen ~x und ~y ):

~x⊥~y ⇔ ~x · ~y = 0
⇔ cos α = 0 (4.30)
1 3
⇔ α = π, π
2 2

Für den Nullvektor ~0 und einen beliebigen Vektors ~x liefert das Skalarprodukt den Wert
~0 · ~x = 0

Hieraus folgt: Der Nullvektor steht auf jedem beliebigen Vektor senkrecht.

In vielen Anwendung benötigt man den Anteil eines Vektors, der senkrecht auf einem
anderen Vektor steht. Es soll hergeleitet werden, wie sich dieser senkrechte Anteil
eines Vektors mit Hilfe des Skalarproduktes berechnen läßt. Zunächst muß aber geklärt
werden, was genau darunter zu verstehen ist:
Gegeben seien zwei vom Nullvektor verschiedene Vektoren ~a und ~b. Gesucht ist eine
Zerlegung des Vektors ~a in zwei Summanden:

~a = ~a1 + ~a2 (4.31)

für die gelten soll:


~a 3~a
62 
 ~a1 : ein zu ~b paralleler und gleichgerichteter


 Vektor; man nennt ~a1 den Anteil von ~a

 in Richtung von ~b
~a2 : ein zu ~b senkrechter Vektor; man nennt

 α

~a ~
 -1 -b ~a2 den zu ~b senkrechten Anteil von ~a
Der Anteil ~a1 ist leicht zu berechnen; die Zeichnung liefert den Ansatz

Betrag : ||~a|| · cos α


~b
Richtung : ein Einheitsvektor in Rich-
||~b|| tung von ~b (siehe Seite 234)

251
Verwendet man dieses zusammen mit (4.1), so erhält man für ~a1 :

~b
~a1 = (||~a|| · cos α) ·
||~b||
~b
= (||~a|| · ||~b|| · cos α) · (erweitert mit ||~b||)
||~b||2

(~a · ~b) · ~b
=
||~b||2

Der Nenner dieses Ausdrucks soll ebenso wie der Zähler durch das Skalarprodukt aus-
gedrückt werden. Beachtet man, daß der Vektor ~b mit sich selber den Winkel 0 Grad
bildet, so liefert eine kleine Nebenrechnung

||~b||2 = ||~b|| · ||~b|| · cos 0 = ~b · ~b (4.32)

Dieses oben eingesetzt liefert die wichtige Formel für den Anteil von ~a in Richtung ~b

(~a · ~b) ~
~a1 = ·b (4.33)
(~b · ~b)

Man beachte, daß in (4.33) die Punkte für unterschiedliche Multiplikationen stehen: die
in Klammern stehenden Produkte sind Skalarprodukte; der Punkt hinter dem Bruch
bezeichnet die Multiplikation einer reellen Zahl mit einem Vektor.

Nun ist auch offensichtlich, wie man den zu ~b senkrechten von ~a berechnet; aus (4.33)
und (4.31) folgt sofort:

(~a · ~b) ~
~a2 = ~a − ~a1 = ~a − ·b (4.34)
(~b · ~b)

Gilt tatsächlich ~a2 ⊥~b? Nach (4.30) ist dieses mit

~b · (~a − ~a1 ) = 0 (4.35)

gleichbedeutend. Will man diese Gleichung nachrechnen, so stößt man im Augenblick


noch bei der Berechnung von ~b · (~a − ~a1 ) auf Schwierigkeiten. Um ein Skalarprodukt zu
berechnen, dessen einer Faktor eine Summe oder eine Differenz ist, benötigt man noch
einige weitere Eigenschaften des Skalarproduktes. Zu deren Herleitung wird als nächstes
die Komponentenschreibweise des Skalarproduktes eingeführt.
Zu Vereinfachung soll nur der Fall zweidimensionaler Vektoren behandelt werden. Gege-
ben seien die beiden Vektoren ~a, ~b ∈ IR2 mit den Beträgen a und b sowie den Winkeln α
und β mit der x-Achse. Ausgangspunkt ist die Komponentendarstellung (4.9) der beiden

252
Vektoren:

a2 ~a
    

a1 a cos α a
~a = =
a2 a sin α 



a1

   
~b = b1 b cos β
=
b2 b sin β b2 1~
 b



 b
 β
b1

a2 ~a Der Winkel zwischen den beiden Vektoren ~a


 und ~b beträgt


a α−β


b2  1~b

 Verwendet man dieses bei der Berechnung
 
b des Skalarproduktes von ~a und ~b, so erhält
 α

 β man:
a1 b1
~a · ~b = a · b · cos(α − β) (Additionstheorem verwenden!)
= a · b · (cos α cos β + sin α sin β)
= a cos α · b cos β + a sin α · b sin β
= a1 · b1 + a2 · b2
Damit wurde gezeigt: Das Skalarprodukt kann berechnet werden, indem man die entspre-
chenden Komponenten der beiden Vektoren multipliziert und die entstehenden Produkte
addiert. Die entsprechende Formel gilt für Vektoren im IR3 :

~a · ~b = (a1 , a2 , a3 )t · (b1 , b2 , b3 )t = a1 b1 + a2 b2 + a3 b3

und ebenso für Vektoren beliebiger Dimension n ∈ IN :


   
a1 b1 n
~  ..   ..  X
~a · b =  .  ·  .  = ai b i (4.36)
an bn i=1

Die Gleichung (4.36) stellt eine Möglichkeit dar, das Skalarprodukt leicht zu berechnen;
der Cosinus wird dabei nicht mehr benötigt. Weiterhin gestattet die Gleichung (4.36),
die folgenden sehr wichtigen Recheneigenschaften des Skalarproduktes zu beweisen:

253
Satz: Sei λ ∈ IR , und seien ~a, ~a1 , ~a2 , ~b, ~b1 , ~b2 Vektoren. Dann gilt für das Skalarprodukt:
(λ~a) · ~b = λ · (~a · ~b)
~a · (λ~b) = λ · (~a · ~b)
~a · (~b1 + ~b2 ) = ~a · ~b1 + ~a · ~b2
(4.37)
(~a1 + ~a2 ) · ~b = ~a1 · ~b + ~a2 · ~b
~a · ~b = ~b · ~a
~a · ~a > 0 für ~a 6= ~0
Beweis: Durch Nachrechnen mit der Komponentendarstellung (4.36) des Skalarproduk-
tes.
Die Rechengesetze (4.37) des Skalarproduktes sollten einen an die entsprechenden Ge-
setze der reellen Zahlen erinnern: bei den beiden ersten Regeln handelt es sich um
Assoziativgesetze, bei der dritten und vierten Regeln um Distributivgesetze und bei der
vorletzten Regel um ein Kommutativgesetz. Ein Produkt, das die Rechengesetze (4.37)
erfüllt, heißt bilinear.
Wir kommen zum senkrechten Anteil zurück. Nun kann leicht nachgerechnet werden,
daß die Gleichung (4.35) erfüllt ist:
~a2 · ~b = (~a − ~a1 ) · ~b (ausmultiplizieren und für
~a1 einsetzen!)
 
= ~a · ~b − ~a · ~b · ~b · ~b (die erste Regel aus (4.37)
~b · ~b ~
mit λ = ~~ab··~bb ) anwenden!)
~
= ~a · ~b − ~a · b · (~b · ~b)
~b · ~b
= ~a · ~b − ~a · ~b = 0
Dieses ist gleichbedeutend mit ~b⊥~a2 . Der Vektor ~a2 verdient somit zurecht den Namen
zu ~b senkrechter Anteil von ~a.
Mit Hilfe von (4.37) kann jetzt ein bedeutsamer Satz bewiesen werden, er beinhaltet
zwei wichtige Ungleichungen:
Satz: Für zwei Vektoren ~a und ~b gilt:
|~a · ~b| ≤ ||~a|| · ||~b|| (4.38)

||~a + ~b|| ≤ ||~a|| + ||~b|| (4.39)


Die Ungleichung (4.38) heißt Cauchy-Schwarzsche Ungleichung; die Ungleichung
(4.39) heißt Dreiecksungleichung.

Die Dreiecksungleichung ist schon für reelle @


I
Zahlen bekannt, rechtfertigt aber erst im Zu- ~
@ b
@
sammenhang mit Vektoren ihren Namen:
Die Dreiecksungleichung besagt, daß bei ei- ~a + ~b @
@
nem Dreieck eine Seite höchstens so lang ist @
:


wie die Summe der Längen der beiden ande-   

ren Seiten.   ~


a


254
Beweis:
zu (4.38): |~a · ~b| = ||~a|| · ||~b|| · | cos α| ≤ ||~a|| · ||~b||
| {z }
≤1

zu (4.39): ||~a + ~b||2 = (~a + ~b) · (~a + ~b) vergleiche mit (4.32); aus-
multiplizieren!
= ||~a||2 + 2 · ~a · ~b + ||~b||2

≤ ||~a||2 + 2 · |~a · ~b| + ||~b||2 Cauchy-Schwarzsche


Ungleichung anwenden!
≤ ||~a||2 + 2 · ||~a|| · ||~b|| + ||~b||2 die erste Binomische For-
mel anwenden!
≤ (||~a|| + ||~b||)2 aus beiden Seiten der Un-
gleichung! die Wurzel zie-
hen
||~a + ~b|| ≤ ||~a|| + ||~b||
qed.

Nach (4.30) liefert das Skalarprodukt eine einfache Möglichkeit, nachzurechnen, wann
zwei Vektoren aufeinander senkrecht stehen: man braucht nur die Gleichung ~x · ~y = 0
nachzuprüfen. Dieses wurde bereits im Zusammenhang mit dem senkrechten Anteil ver-
wandt (siehe (4.35)). Als weiteres Beispiel für diese Anwendung des Skalarproduktes
sowie auch für die Anwendung der Rechenregeln (4.37) soll hier ein einfacher geometri-
scher Sachverhalt nachgewiesen werden.
Es gilt nämlich: Die drei Höhen eines Dreiecks schneiden sich in einem Punkt.
Beweis dieser Aussage: Gegeben sei ein beliebiges Dreieck mit den drei Eckpunkten
A, B und C. Die Höhen durch die beiden Punkte A und B werden eingezeichnet, de-
ren Schnittpunkt werde mit S bezeichnet. Weiterhin seien die drei Vektoren von den
Eckpunkten bis zu dem Punkt S gegeben:
~
~a = AS, ~b = BS,
~ ~
~c = CS

C
S
 S
 S
 S
 S
 S
 Sq
q ~ 
~c = CS S
b  S
 b b 
 S
 b S
b S
b 
  S
  bb S
 b
  b S
  b S
  b S
b
 ~
 ~
a = AS ~b = BS
~ bb S
  b S
  b
b S
 b S
b

 bS
A B
255
Die Behauptung ist bewiesen, wenn man zeigen kann, daß die durch C und S verlaufende
Stecke die dritte Höhe des Dreiecks ist. Dieses ist gleichbedeutend damit, daß der Vektor
~c auf dem Vektor AB ~ senkrecht steht. Zu zeigen bleibt daher (siehe (4.30)):

~ = 0
~c · AB (4.40)

Aus der Zeichnung erkennt man sofort die Beziehungen


~ = ~a − ~b,
AB ~ = ~b − ~c,
BC ~ = ~c − ~a
CA

Weiterhin gilt, da nach Konstruktion ~a und ~b auf den Höhen durch A und B liegen:

~a⊥(~b − ~c) ⇔ ~a · (~b − ~c) = 0 und ~b⊥(~c − ~a) ⇔ ~b · (~c − ~a) = 0

Nach diesen Vorüberlegungen kann (4.40) leicht nachgerechnet werden:


~ = ~c · (~a − ~b)
~c · AB (ausmultiplizieren!)
= ~c · ~a − ~c · ~b (geeignet ergänzen!)
= ~c · ~a |− ~b · ~a{z+ ~b · ~a} − ~c · ~b (ausklammern!)
=0
= ~a · (~c − ~b) + ~b · (~a − ~c) (siehe oben!)
= 0+0 = 0

qed.

Es folgen einige weitere nützliche Formeln, die auf dem Skalarprodukt beruhen:
Abstand zweier Punkte : Gegeben seien in der Ebene (n = 2) oder im Raum n ≥ 3
die beiden Punkte P und Q, die zugehörigen Ortsvektoren seien


   P
p1 q1 >

~ =  .  ~ =  .  p~ d
p~ = OP  ..  und ~q = OQ  ..   Q
:
pn qn 

~q
O
Der Abstand d zwischen ihnen ist die Länge des zugehörigen Differenzvektors, man
berechnet ihn durch (siehe dazu (4.32) und (4.36), vergleiche auch mit 4.3)
v
u n
p uX
d = ||~p − ~q|| = (~p − ~q) · (~p − ~q) = t (pi − qi )2 (4.41)
i=1

Den Winkel zwischen zwei Vektoren berechnet man mit der Darstellung (4.29)
des Skalarproduktes:
!
~a · ~b
α = arccos (4.42)
~a ||~a|| · ||~b||
*


α -~
b

Dabei wird in der Regel ~a · ~b durch die Komponentendarstellung (4.36) berechnet.

256
Der Schnittwinkel zweier sich schneidender Geraden ist genau der Winkel zwi-
schen den beiden Richtungsvektoren: Sind die beiden Geraden
n o n o
~
G1 = ~a1 + t · b1 | t ∈ IR ~
und G2 = ~a2 + t · b2 | t ∈ IR

gegeben, so erhält man mit (4.42) für deren Schnittwinkel

1G

 !
~b1  ~b1 · ~b2
*
 α = arccos (4.43)
||~b1 || · ||~b2 ||

 α
 -
 ~b2 G2


Berechnung der Komponenten eines Vektors mit Hilfe des Skalarproduktes:

*


Gegeben sei ein Vektor ~a im Raum  
durch dessen Betrag und dessen Rich-  

tungswinkeln. 

~a


Gesucht ist die Komponentendarstellung des Vektors ~a, was gleichbedeutend mit
dessen Basisdarstellung durch die Einheitsvektoren ist (siehe (4.13), (4.14)):
 
a1
~a =  a2  = a1 · ~e1 + a2 · ~e2 + a3 · ~e3
a3
Zunächst beachte man, daß für das Skalarprodukt zweier Einheitsvektoren gilt

1 für i = j
~ei · ~ej = (4.44)
0 für i 6= j
Die Gleichung (4.44) ergibt sich sofort aus der Komponentendarstellung der Ein-
heitsvektoren und des Skalarproduktes. Man kann (4.44) auch nur mit (4.29) und
ohne Verwendung der Komponenten begründen: ein Einheitsvektor besitzt die
Länge ||~ei || = 1, und zwei unterschiedliche Einheitsvektoren stehen aufeinander
senkrecht.
Zur Berechnung von a1 macht man den Ansatz ~a = a1~e1 + a2~e2 + a3~e3 und multi-
pliziert7 beide Seiten dieser Gleichung mit ~e1 :
~a · ~e1 = (a1 · ~e1 + a2 · ~e2 + a3 · ~e3 ) · ~e1
= a1 · ~e1 · ~e1 + a2 · ~e2 · ~e1 + a3 · ~e3 · ~e1
| {z } | {z } | {z }
=1 =0 =0

= a1
Allgemein erhält auf diesem Wege:
ai = ~a · ~ei
(4.45)
= ||~a|| · ||~e|| · cos αi = a · cos αi
7
durch das Skalarprodukt

257
a2 ~a


Dabei ist a = ||~a|| und αi der Winkel ~e2 a


zwischen ~a und der i-ten Koordinaten- 6
achse:
α2
α1
-
~e1 a1

Nächster Geradenpunkt, Abstand Punkt-Gerade


Im IR3 seien ein Punkt und eine Gerade gegeben:

~c ∈ IR3
n o (4.46)
G = ~a + t · ~b | t ∈ IR mit ~b =
6 0

Wie groß ist der Abstand zwischen dem Punkt ~c und der Geraden G?

n

o


G = ~a + t · ~b | t ∈ IR


 

s
~c

Zur Beantwortung dieser Frage wird zunächst einer anderen Frage nachgegangen:
Welches ist der Punkt ~x0 auf der Geraden, der zu dem gegebenen Punkt ~c den
geringsten Abstand besitzt?

~x0 n
s
o
+ t · ~b | t ∈ IR

  
G = ~a



s
~c

Gesucht ist somit derjenige Punkt ~x0 ∈ G mit

||~x0 − ~c|| = min ||~x − ~c|| (4.47)


x∈G
~

Die letzte Zeichnung legt folgenden Ansatz zum Finden des Punktes ~x0 nahe:

Wähle ~x0 ∈ G so, daß der Differenzvektor

~u = ~x0 − ~c (4.48)

senkrecht auf der Geraden G steht.

258
~b 
n
~x0  :


~
o
~b
 
G = ~a + t · b | t ∈ IR
OC r
 

 

 :



 C

  

C
   C
 C
C ~ u = ~x0 − ~c
~a  C
 C
 C
 C
 -C
~0
~c
Beachtet man, daß der Vektor ~u = ~x0 −~u genau dann auf der Geraden G senkrecht
steht, wenn er senkrecht auf ihrem Richtungsvektor ~b steht, so erhält man weiter
mit Hilfe des Skalarproduktes:

(~x0 − ~c) ⊥ ~b ⇔ (~x0 − ~c) · ~b = 0 (4.49)

Wegen ~x0 ∈ G besitzt ~x0 mit einem ~t0 ∈ IR d die Darstellung

~x0 = ~a + t0 · ~b (4.50)

Zur Bestimmung von ~x0 ist t0 zu bestimmen. Dazu setzt man (4.50) in die Glei-
chung auf der rechten Seite von (4.49) ein:

0 = (~a + t0 · ~b − ~c) · ~b (ausmultiplizieren)


= (~a − ~c) · ~b + t0 · |{z}
~b · ~b (nach ~t0 auflösen)
||~b||2
(~a − ~c) · ~b
⇒ t0 = − (Beachte: wegen ~b 6= 0 (4.51)
~b · ~b
ist ~b · ~b = ||~b||2 6= 0)

Einsetzen des Parameterwertes (4.51) in die Darstellung (4.50) liefert als erstes
Ergebnis den zu ~c nächst gelegenen Geradenpunkt

(~a − ~c) · ~b ~
~x0 = ~a − ·b (4.52)
~b · ~b

Damit erhält man sofort den Abstand zwischen ~c und der Geraden G. Nach Defi-
nition ist dieses ist dieses gerade der Abstand zwischen ~c und ~x0 :

(~a − ~c) · ~b ~
||~x0 − ~c|| = ||~a − ~c − · b|| (4.53)
~b · ~b

Vergleicht man (4.34) mit dem Vektor auf der rechten Seite von (4.53), so sieht
man, daß dieses genau der zu ~b senkrechte Anteil von ~a − ~c ist.

Zu zeigen bleibt noch, daß der durch (4.52) berechnete Vektor ~x0 tatsächlich der
Geradenpunkt mit dem geringsten Abstand zu ~c0 ist. Bis jetzt ist nur bekannt,
daß ~u = ~x0 − ~c senkrecht auf ~b steht. Zu zeigen ist somit, daß für ein

~x1 ∈ IR3 mit ~x1 6= ~x0

259
die Ungleichung
||~x1 − ~c|| > ||~x0 − ~c||
⇔ ||~x1 − ~c||2 > ||~x0 − ~c||2
⇔ (~x1 − ~c) · (~x1 − ~c) > (~x0 − ~c) · (~x0 − ~c) (4.54)
erfüllt ist. Um das zu zeigen, wird zunächst beachtet, daß ~x0 und ~x1 auf G liegen
und damit die Darstellungen
~x0 = ~a + t0 · ~b ~x1 = ~a + t1 · ~b (4.55)
besitzen. Damit folgt für die Differenz dieser beiden Vektoren
~x1 − ~x0 = (t1 − t0 ) · ~b
⇒ ~x1 = ~x0 + s0 · ~b mit s0 = t1 − t0 (4.56)
Wegen ~x1 6= ~x0 ist dabei t1 6= t0 und damit s0 6= 0.



~x1 
 
r 
n o
 :
 G = ~a + t · ~b | t ∈ IR
 
 


~x0 
 
 
 s0 · ~b
t 

 



Jetzt setzt man die die Darstellung (4.56) von ~x1 in die rechte Seite von (4.54) ein:
||~x1 − ~c||2 = (~x1 − ~c) · (~x1 − ~c)
mit binomischer Formel
= ((~x0 + s0 · ~b) − ~c) · ((~x0 + s0 · ~b) − ~c)
ausmultiplizieren

= (~x0 − ~c) · (~x0 − ~c) + 2 · s0 · (~x0 − ~c) · ~b + s20 · (~b · ~b) wegen (4.49)
| {z }
=0

= (~x0 − ~c) · (~x0 − ~c) + s20 · (~b · ~b) wegen s0 6= 0 und ~b 6= 0


| {z }
>0

> (~x0 − ~c) · (~x0 − ~c) = ||~x0 − ~c||2 (4.57)


Damit hat man, wie gewünscht,
||~x0 − ~c|| < ||~x1 − ~c|| (4.58)
gezeigt. Der Punkt ~x0 aus (4.52) ist damit in der Tat derjenige Punkt auf der
Geraden G, der den geringsten Abstand zu ~c besitzt, alle anderen Geradenpunkte
besitzen einen größeren Abstand.
Bemerkung: Hier für den IR3 durchgeführten Überlegungen lassen sich ohne Ände-
rung auf beliebige Dimension übertragen.

260
4.6 Die Hessesche Normalform
4.6.1 Geraden im IR2

Man betrachte eine Gerade in der Ebene (IR2 ), gegeben durch die Darstellung
n o
G = ~a + t · ~b | t ∈ IR (4.59)

Die Darstellung mit Hilfe eines auf der Gerade liegenden Ortsvektors ~a, eines Rich-
tungsvektors ~b der Geraden und des reellen Parameters t heißt Parameterform oder
Parameterdarstellung der Geraden. Diese Darstellung ist u. a. dann günstig, wenn
man die Gerade bzw. einen Teil von ihr zeichnen will. Die Parameterdarstellung ist
jedoch nachteilig, wenn man etwa folgende Frage klären will:

1. Gegeben sei ein beliebiger Vektor ~c ∈ IR2 ; liegt


dieser Vektor auf der Geraden, d. h. gilt ~ b
XXz
X

~c ∈ G ? ~a :


 
 
 ~c
~0

2. Gegeben seien zwei beliebige Vektoren ~c, d~ ∈ IR2 ;


BMB
liegen diese beiden Vektoren auf derselben Seite B
~ b
XX
der Geraden G? 
z
X
d~ B ~ a
B
Man beachte dazu, daß eine Gerade die Ebene in
B   :
zwei Hälften zerlegt.  
B ~c
~0
Die entsprechenden Fragen gelten auch bei einer Ebene im Raum (E ∈ IR3 ). Hier soll
jedoch zunächst der Fall der Geraden im IR2 behandelt werden. Das Ziel besteht darin,
neben der Parameterform eine weitere Geradendarstellung zu finden, mit Hilfe derer
sich diese beiden Fragen und auch noch weitere Fragen leicht beantworten lassen.

Zunächst soll als Spezialfall eine Gerade durch den Nullpunkt betrachtet werden; sie
besitzt eine Parameterform der Gestalt
n o
G = t · ~b | t ∈ IR

Man wählt einen Vektor ~n 6= 0 aus,


der auf dem Richtungsvektor und da- ~n BMB
mit auf der Geraden senkrecht steht:


G
B 
1

~
B 

b
~n ⊥ ~b ~n · ~b = 0
B
 
⇔ 
 ~0


Dann gilt offensichtlich

G = {Menge aller auf ~n senkrecht stehenden Vektoren}


= {~x ∈ IR2 | ~n · ~x = 0} (4.60)

261
Da bei dem Vektor ~n nur die Richtung von Bedeutung ist, wählt man für ~n einen Vektor
aus, für den neben ~n · ~b = 0 zusätzlich

||~n|| = 1

gilt. Der Vektor ~n heißt Normalenvektor oder, da er die Länge eins besitzt, auch
Normaleneinheitsvektor.
Mit der Gleichung (4.60) hat man für diesen Spezialfall eine neue Darstellungsmöglich-
keit gefunden.

Jetzt zum Fall einer Gerade in allgemeiner Lage; es sei jetzt ~0 6∈ G vorausgesetzt:



  G
1


 ~b
 n o
~a + t · ~b | t ∈ IR

 

G =
~a

~
0
Ebenso wie bei der Parameterform müssen auch hier die Richtung und die Lage der
Geraden festgelegt werden:

1. Die Richtung legt man ebenso wie im Spezialfall ~0 ∈ G durch einen Vektor ~n 6= 0
fest, der auf der Geraden G senkrecht steht:

BMB 

~n B 1



G
B 
B r 
 ~b
 B
 


 



BMB 
B  ~ a
~n B 
B 
~0
B

Dieses bedeutet insbesondere: ~n steht senkrecht auf dem Richtungsvektor:

~n⊥~b ⇔ ~n · ~b = 0 (4.61)

Da bei ~n nur dessen Richtung bedeutsam ist, verlangt man

||~n|| = 1 (4.62)

Nachdem damit ~n damit Richtung und Länge festliegen, bestehen für die Orien-
tierung dieses Vektors noch zwei Möglichkeiten. Um die Orientierung von ~n auch
noch festzulegen, fordert man:

262
BMB 


~n B 

G
~n soll vom Nullpunkt aus in Rich- B q 
B
tung der Geraden zeigen   B

Der Vektor mit der umgekehrten  B
B−~ n
Orientierung ist −~n. BMB B
BN
~n B
B
Br
~0
~n ist der Normalenvektor der Geraden.
2. Die Lage der Gerade legt man fest, indem man


d = Abstand der Geraden vom Nullpunkt 
 G
 A
 A d
vorgibt. Dabei ist 


A
A
d ∈ IR mit d ≥ 0 Ar ~
0

Nachdem man auf diese Weise Richtung und Lage der Geraden festgelegt hat, gewinnt
man daraus eine neue Geradengleichung: Dazu wird ein beliebiger Vektor

~x ∈ G

betrachtet. Der Winkel α sei dann der Winkel zwischen diesem Vektor ~x und dem
Normalenvektor ~n:
BMB 

~n B 
 G

B r  
B  7B
 B   B

 α B d = Abstand zwischen ~0 und G
 B
 


~x  B
B
rB
 B
BMB
α 


~n BB   

B  
Bq

~0
Aus der Zeichnung ergibt sich:

d = ||~x|| · cos α
= ||~n|| · ||~x|| · cos α (wegen ||~n|| = 1)
= ~n · ~x

Damit wurde hergeleitet: Alle ~x ∈ G erfüllen die Gleichung

~n · ~x = d (4.63)

263
Man kann auch umgekehrt zeigen: Erfüllt ein ~x ∈ IR2 die Gleichung (4.63), so liegt (der
Endpunkt von) ~x auf der Geraden; d. h. für alle ~x ∈ IR2 gilt die Aussage

~n · ~x ⇒ ~x ∈ G (4.64)

Beweis8 von (4.64): Man gehe von einer Parameterdarstellung der Geraden aus:
n o
G = ~a + t · ~b | t ∈ IR (4.65)

Weiterhin fasse man die Gleichung

~n · ~x = d

als lineares Gleichungssystem auf; ausgeschrieben lautet dieses Gleichungssystem mit


~n = (n1 , n2 )t und ~x = (x1 , x2 )t

n 1 · x1 + n 2 · x2 = d (4.66)

Die Merkmale dieses aus einer Gleichung mit zwei Unbekannten bestehenden Gleichungs-
systems erkennt man sofort:

• Sein Rang ist 1, da wegen 1 = ||~n|| = n21 + n22 nicht beide Koeffizienten n1 und
p

n2 gleich Null sein können.

• Sein Corang ist 2 − 1 = 1. Außerdem enthält es keine Nullgleichungen.

• Seine Lösungsmenge ist gegeben durch eine spezielle Lösung ~x0 und eine Grundlösung
~x1 des zugehörigen homogenen Systems; sie besitzt die Gestalt

~x0 + t · ~x1 für alle t ∈ IR (4.67)

Mit Hilfe der Parameterdarstellung (4.65) lassen sich für x0 und x1 sofort Werte
angeben:

– Als spezielle Lösung kann man

~x0 = ~a

setzen, denn
~a ∈ G ⇒ ~n · ~a = d
– Als Grundlösung des homogenen Systems kann man

~x1 = ~b

setzen; denn als Richtungsvektor ist ~b ungleich Null, und, da ~n Normalenvek-


tor ist, gilt
~n · ~b = 0
8
Die Kenntnis dieses Beweises ist für das Verständnis des folgenden Stoffes nicht zwingend erforder-
lich. Seine Durcharbeitung wird jedoch dringend empfohlen; sie dient auch der Wiederholung bisherigen
Stoffes.

264
Damit besitzt die Lösungsmenge des Gleichungssystems (4.66) die Darstellung

~a0 + t · ~b1 für alle t ∈ IR

Dieses ist genau die Parameterform (4.65) der Geraden.


Die Lösungsmenge der Gleichung ~n · ~x = 0 ist somit gleich der Geraden. Insbesondere
liegen alle Vektoren ~x ∈ IR2 , die diese Gleichung erfüllen, auf der Geraden G. qed.

Zusammenfassend gilt: Eine Gerade G ⊂ IR2 besitzt eine Darstellung

G = {~x ∈ IR2 | ~n · ~x = d} (4.68)

mit d ∈ IR , d ≥ 0 und ~n ∈ IR2 , ||~n|| = 1. Diese Darstellung heißt Hessesche


Normalform der Geraden.

Die vorkommenden Werte d und ~n besitzen anschauliche Bedeutungen:


 • ~n steht senkrecht auf der Gera-
AA ~
n 
 G
K
A q 
den.
A  AA d
• d ist der Abstand der Geraden
 

 A
A zum Nullpunkt.
Aq ~
0
Dabei besteht ein wichtiger Spezialfall:

d = 0 ⇔ Der Abstand zum Nullpunkt beträgt Null.


⇔ Die Gerade verläuft durch den Nullpunkt.

Bemerkung: Man beachte, daß nur eine Gerade in der Ebene (IR2 ) eine Hessesche
Normalform (4.68) besitzt, nicht jedoch eine Gerade im Raum (IRn , n ≥ 3).
Aufgabe: Finden Sie die beiden Stellen, an denen die Voraussetzung einging, daß die
bisherigen Betrachtungen für Geraden im IR2 durchgeführt wurden.

Bemerkung: Man erkennt sofort zwei Vorteile der Hesseschen Normalform gegenüber
der Parameterform:
1. Man sieht der Hesseschen Normalform sofort an, ob die betreffende Gerade den
Nullpunkt enthält (~0 ∈ G ⇔ d = 0).
2. Sind zwei Geraden G1 , G2 ∈ IR2 mit Hesseschen Normalformen

G1 = {~x ∈ IR2 | ~n1 · ~x = d1 }


G2 = {~x ∈ IR2 | ~n2 · ~x = d2 }

gegeben, so sieht man diesen sofort an, ob es sich beide Male um dieselbe Gerade
handelt oder nicht. Das erste ist genau dann der Fall, wenn ~n1 = ~n2 und d1 = d2
ist. Mit Hilfe der Parameterdarstellung ist dieses nicht so einfach zu erkennen, da
eine Gerade unterschiedliche Orts- und Richtungsvektoren besitzt.

Mit Hilfe der Hesseschen Normalform können die auf Seite 261 gestellten Fragen leicht
beantwortet werden:

265
1. Liegt ein gegebener Vektor ~c ∈ IR2 auf der Geraden? Dazu prüft man einfach
durch Einsetzen, ob ~c die Gleichung

~n · ~x = d

erfüllt.

2. Liegen die beiden gegebenen Vektoren ~c, d~ ∈ IR2 auf derselben Seite der Geraden?
Hierzu ist zunächst die Frage zu klären, ob ein Vektor ~c ∈ IR2 auf derselben Seite
wie der Nullpunkt liegt9

Die Antwort der zuletzt gestellten Frage ergibt sich sofort aus der folgenden Zeichnung;
dabei ist α der Winkel zwischen dem Normalenvektor ~n und dem Vektor ~c:
XXG XXX
~c >


XXX 
XXX  
XXX  α 
XXX 
 XXX 

~n   XXX
 α
  XX 
 XX 
 XXX
  
 X 
   
 

XX  
~0 XXX
XXX q 

 d
 l = ||~c|| · cos α
XX  
X  
 
 

Anhand der Zeichnung erkennt man:

~c und ~0 liegen auf entgegengesetzten Seiten der Geraden.


⇔ l = ||~c|| · cos α > d
⇔ 1 · ||~c|| · cos α = ||~n|| · ||~c|| · cos α > d
⇔ ~n · ~c > d

Also gilt:

~c und ~0 liegen auf entgegengesetzten Seiten. ⇐⇒ ~n · ~c > d

Damit läßt sich nun für zwei Vektoren ~c, d~ ∈ IR2 mit ~c, d~ 6∈ G die zweite Frage beant-
worten:

~c und d~ liegen auf derselben Seite der Geraden.


⇔ ~c und d~ liegen beide auf der entgegengesetzten Seite zum Nullpunkt
oder beide auf derselben Seite wie der Nullpunkt.
~n · ~c > d und ~n · d~ > d

oder ~n · ~c < d und ~n · d~ < d

⇔ (~n · ~c − d) und (~n · d~ − d) besitzen dasselbe Vorzeichen.


9
Dabei wird zunächst davon ausgegangen, daß nicht der Spezialfall ~0 ∈ G vorliegt.

266
Dieses Ergebnis kann man folgendermaßen zusammenfassen: Eine Gerade in der Ebene
G ⊂ IR2 mit Hessescher Normalform

G = {~x ∈ IR2 | ~n · ~x = d}

teilt die Ebene in drei Teile:

1. einen “positiven Teil“, gegeben durch

~n · ~x > d

2. einen “negativen Teil“, gegeben durch

~n · ~x < d

3. die Gerade selber, gegeben durch

~n · ~x = d

Dabei zeigt der Normalenvektor ~n in den “positiven Teil“:

 ~n
PP G 
PP
PP
PP 

+
P PP  s
P P
PP
− PP
PP
P

Zur Umrechnung zwischen der Parameterform einer Geraden G ∈ IR2 und ihrer Hesse-
sche Normalform:

1. Gegeben sei die Parameterform:


 
 G
1

n o  
 ~b
~
G = ~a + t · b | t ∈ IR  

~a

~
0
Zu berechnen ist die Hessesche Normalform:

(a) Berechnung von ~n: Ist ~b = (b1 , b2 )t , so setzt man


 
b2
m
~ = ⇒ m ~ · ~b = 0
~ 6= 0 und m
−b1

Der Vektor m ~ steht damit bereits senkrecht auf G, die Normierung von m
~
liefert den Normalenvektor:
m
~
~n =
||m||
~

267
(b) Berechnung von d: Da für jedes ~x ∈ G die Gleichung

d = ~n · ~x

erfüllt ist und ~n bereits berechnet wurde, reicht es, in diese Gleichung irgend-
einen Vektor ~x ∈ IR2 , von dem ~x ∈ G bekannt ist, einzusetzen. Da etwa ~a ∈ G
ist, hat man
d = ~n · ~a

Ergibt sich hierbei ein negativer Wert d < 0, so ersetzt man ~n durch −~n und d
durch −d.

2. Gegeben sei die Hessesche Normalform:


KAA ~
n G

A q 
A  AA d
G = {~x ∈ IR2 | ~n · ~x = d} (4.69) 

 A
A
Aq ~
0
Zu berechnen ist eine Parameterdarstellung: Man faßt dazu wieder die Gleichung
(4.69) als lineares Gleichungssystem auf (siehe auch Seite 264):

n1 · x1 + n2 · x2 = d

Dieses Gleichungssystem ist lösbar und besitzt den Corang eins. Seine Lösungs-
menge ist durch eine spezielle Lösung und durch eine Grundlösung des zugehörigen
homogenen Systems gegeben.
Diese beiden Vektoren bilden den Orts- und den Richtungsvektor in einer Para-
meterdarstellung der Geraden.

4.6.2 Ebenen im IR3


Ein weiterer Vorteil der Hesseschen Normalform ist deren vollständige Übertragbarkeit
auf Ebenen im Raum (IR3 ).
Sei ~n ∈ IR3 mit ||~n|| = 1 (ein Normalenvektor) und sei d ∈ IR mit d ≥ 0 gegeben, dann
ist die Menge

{~x ∈ IR3 | ~n · ~x = d} (4.70)

eine Ebene im Raum (IR3 ). Zur Begründung dieser Tatsache betrachte man die in (4.70)
enthaltene Gleichung, ausgeschrieben lautet sie mit ~n = (n1 , n2 , n3 )t und ~x = (x1 , x2 , x3 ):

n1 · x1 + n2 x2 + n3 · x3 = d (4.71)

Dieses ist ein lineares Gleichungssystem mit einer Gleichung und drei Unbekannten. Es
besitzt den Rang 1 (wegen ~n 6= 0) und den Corang 2. Seine Lösungsmenge läßt durch
eine spezielle Lösung a0 sowie zwei Grundlösungen des zugehörigen homogenen Systems
darstellen:
a0 + λ · ~a1 + µ · ~a2 mit λ, µ ∈ IR

268
Dieses ist genau die Parameterdarstellung einer Ebene im IR3 (siehe 4.24); die spezielle
Lösung ~a0 ist dabei der Ortsvektor, die Grundlösungen bilden die beiden Richtungsvek-
toren.
Für die Hessesche Normalform einer Ebene E im IR3

E = {~x ∈ IR3 | ~n · ~x = d} (4.72)

gilt entsprechend wie bei Geraden im IR2 :

• Der Normalenvektor steht senkrecht auf der Ebene. Dieses ist gleichbedeutend
damit, daß er auf den beiden Richtungsvektoren senkrecht steht.

• Verläuft die Ebene nicht durch


den Nullpunkt, so zeigt ~n vom
Nullpunkt aus in Richtung der



~
a1
Ebene. ~n 6
q q

-



~a2



Ebene E

~n
6

r~
0

• d ist der Abstand der Ebene vom Nullpunkt, insbesondere gilt

d = 0 ⇔ Die Ebene geht durch den Nullpunkt.

• Ein Vektor ~c ∈ IR3 liegt genau dann auf der Ebenen, wenn ~c die Gleichung ~n ·~x = d
erfüllt.

• Zwei Vektoren ~c, d~ ∈ IR3 liegen genau dann auf derselben Seite der Ebene, wenn

~n · ~c − d und ~n · d~ − d

dasselbe Vorzeichen besitzen.

Es folgen zwei wichtige Anwendungen für die Hessesche Normalform einer Ebene:

4.6.3 Schnittwinkel zweier Ebenen

Gegeben seien zwei Ebenen in Hessescher Normalform:

E1 = {~x ∈ IR3 | ~n1 · ~x = d1 }


E2 = {~x ∈ IR3 | ~n2 · ~x = d2 }

Dabei sind ~n1 und ~n2 deren beiden Normalenvektoren. Betrachtet man die seitliche
Ansicht beider Ebenen:

269
~n2 
~n1   
KA  

A α 
A  
XX
XXX A  
XX 
XX A  
XXX A α
XXXX
E2

XXX Ebene
 XXX
 
 XXX
  X
 
 Ebene E1
so erkennt man, daß für ihren Schnittwinkel α gilt:
α = Schnittwinkel zwischen E1 und E2
= Schnittwinkel zwischen ~n1 und ~n2
= arccos(~n1 · ~n2 ) (wegen ~n1 · ~n2 = 1 · 1 · cos α)

4.6.4 Abstand eines Punktes von einer Ebene


Hier soll noch einer weitergehenden Aufgabenstellung nachgegangen werden: Sind ein
Punkt ~c ∈ IR3 sowie eine Ebene in Hessescher Normalform
E = {~x ∈ IR3 | ~n · ~x = d}
gegeben, so ist derjenige Punkt ~x0 ∈ E gesucht, der unter allen Punkten ~x ∈ E den
geringsten Abstand zu ~c besitzt; d. h. für ~x = ~x0 soll der Ausdruck
a = ||~x − ~c|| (~x ∈ E)
minimal werden.
r ~c

a0 = Minimalabstand
= ||~x0 − ~c||
J J
J J
J J
J J
J r ~x0 J
J J
J J
J Ebene E J
J J

Aufgrund der Zeichnungen erkennt man,


daß der Verbindungsvektor PP  ~
n seitliche Ansicht
PP
PP 
~x0 − ~c
PP 
r PP