Sie sind auf Seite 1von 20

Eigenwertaufgaben

Heinrich Voss

voss@tu-harburg.de

Hamburg University of Technology Institute for Numerical Simulation

University of Technology Institute for Numerical Simulation Heinrich Voss (Hamburg University of TechnologyInstitute for

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

1 / 80

Eigenwertaufgaben

Vorbetrachtungen

Da Eigenwerte und Eigenvektoren reeller Matrizen komplex sein können, betrachten wir gleich für A C n × n das spezielle Eigenwertproblem

.

Ax = λ x

(1)

Besitzt (1) eine nichttriviale Lösung x C n \ {0}, so heißt λ eine Eigenwert von A und x ein zugehöriger Eigenvektor.

Die Menge aller Eigenwerte einer Matrix A heißt das Spektrum von A und wird mit σ( A) bezeichnet.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

3 / 80

Eigenwertaufgaben

Eigenwertaufgaben

Wir betrachten in diesem Kapitel die numerische Behandlung von vollbesetzten Eigenwertaufgaben.

Abschnitt 6.1

Ergebnisse aus Lineare Algebra

Abschnitt 6.2

Potenzmethode

Abschnitt 6.3

QR Algorithmus

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

2 / 80

Eigenwertaufgaben

Vorbetrachtungen

Genauer heißt x

= 0 mit (1) ein Rechtseigenvektor von A zu λ.

Ist λ eine Eigenwert von A, so besitzt auch die Gleichung

y H ( A λ I ) = 0

(2)

nichttriviale Lösungen. Jedes y C n , das die Gleichung (2) erfüllt, heißt ein Linkseigenvektor von A.

Die Notation ist hier nicht einheitlich. In einigen Büchern werden die nichttrivialen Lösungen von y T ( A λ I ) = 0 die Linkseigenvektoren von A genannt.

Wenn wir nur von Eigenvektoren sprechen, so sind stets Rechtseigenvektoren gemeint.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

4 / 80

Eigenwertaufgaben

Vorbetrachtungen

Die Eigenwerte von A sind die Nullstellen des charakteristischen Polynoms

χ(λ) := det( A λ I ).

Ist λ ein k -fache Nullstelle von χ (ist also das Polynom χ(λ) durch (λ λ) k

˜

˜

˜

aber nicht durch (λ λ) k +1 teilbar), so heißt k die algebraische Vielfachheit

˜

von λ.

Da χ den Grad n besitzt, besitzt also A genau n Eigenwerte, wenn man jeden Eigenwert entsprechend seiner algebraischen Vielfachheit zählt.

˜

Die geometrische Vielfachheit eines Eigenwerts λ ist die Dimension des

Lösungsraums des linearen Gleichungssystems

˜

( A λ I ) x = 0.

Nach LA Satz 8.18 ist für jeden Eigenwert die geometrische Vielfachheit kleiner oder gleich der algebraischen Vielfachheit.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

5 / 80

Eigenwertaufgaben

 

Lemma

Besitzt A C n × n eine Blockzerlegung

A = A 11

O

A

A 22

12

 

mit A 11 C m × m , A 22 C n m × n m , so gilt

 

σ( A) = σ( A 11 )

σ( A 22 ).

(3)

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

7 / 80

Eigenwertaufgaben

Vorbetrachtungen

Gilt B = X 1 AX mit einer regulären Matrix X C n × n , so heißen die Matrizen A und B ähnlich, den Übergang von A zu B nennt man eine Ähnlichkeitstransformation.

Ähnliche Matrizen besitzen (vgl. LA Satz 8.15) dieselben Eigenwerte einschließlich ihrer algebraischen und geometrischen Vielfachheit.

Naheliegend ist es nun, die Matrix A, deren Eigenwerte bestimmt werden sollen, durch geeignete Ähnlichkeitstransformationen auf eine Gestalt zu

bringen, aus der man die Eigenwerte (oder jedenfalls Näherungen hierfür) von A leicht ablesen kann oder für die das Eigenwertproblem leichter gelöst werden kann.

Da folgende Lemma ermöglicht es, die Dimension des Eigenwertproblems zu reduzieren.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

6 / 80

Eigenwertaufgaben

Beweis

Es gelte

Ax = A 11

O

mit x 1 C m und x 2 C n m .

A

A 22 x 1

12

x 2 = λ x 1

x 2

Gilt x 2 = 0, so ist A 22 x 2 = λ x 2 und λ σ( A 22 ).

Ist x 2 = 0, so gilt A 11 x 1 = λ x 1 und λ σ( A 11 ). Es ist also

σ( A) σ( A 11 ) σ( A 22 ).

Zählt man alle Eigenwerte entsprechend ihrer algebraischen Vielfachheit, so besitzt A n Eigenwerte, A 11 m Eigenwerte und A 22 n m Eigenwerte. Damit kann die Inklusion nicht echt sein, und es ist (3) bewiesen.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

8 / 80

Eigenwertaufgaben

Jordansche Normalform

Ist J die Jordansche Normalform der Matrix A und X 1 AX = J , so kann man (vgl. LA Abschnitt 8.5) alle Eigenwerte und Eigenvektoren (und auch Hauptvektoren) von A aus J und der Transformationsmatrix X sofort ablesen.

Trotzdem wird die Jordansche Normalform in der numerischen Mathematik nicht verwendet. Den Grund zeigt

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

9 / 80

Eigenwertaufgaben

Unitäre Transformationen

Wir betrachten ferner nicht beliebige Ähnlichkeitstransformationen, denn die nichtsinguläre Transformationsmatrix X kann schlecht konditioniert sein.

In diesem Fall ist die Transformation X 1 AX anfällig für Rundungsfehler.

Um dies auszuschließen, beschränken wir uns auf unitäre Transformationsmatrizen U , für die also gilt U H U = I . Für diese ist

Ux 2 2 = ( Ux ) H ( Ux ) = x H U H Ux = x H x

= x 2

2

für alle x C n , daher gilt U 2 = 1, und da mit U auch U 1 = U H unitär ist, erhält man κ 2 ( U ) = 1.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

11 / 80

Die Störung

Eigenwertaufgaben

Beispiel

0

1

0

.

.

.

0

0

0

1

.

.

.

0

J α :=

.

.

.

.

R n × n

.

.

.

.

.

.

.

.

.

α

0

0

.

.

.

0

der Jordanschen Normalform J 0 mit dem n -fachen Eigenwert 0 besitzt das charakteristische Polynom

χ α (λ) = (1) n (λ n α).

J α besitzt also n verschiedene Nullstellen, und ist daher auf Diagonalgestalt transformierbar. Dies zeigt, dass die Struktur der Jordanschen Normalform nicht stabil unter kleinen Störungen ist.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

10 / 80

Eigenwertaufgaben

Schursche Normalform

Wir wissen (vgl. LA Satz 8.31), dass man genau die normalen Matrizen mit unitären Matrizen auf Diagonalgestalt transformieren kann.

Allgemeine Matrizen kann man auf obere Dreiecksgestalt transformieren, aus der man dann wieder die Eigenwerte unmittelbar ablesen kann.

Satz 6.3 [Schursche Normalform] Es sei A C n × n . Dann existiert eine unitäre Matrix U, so dass

U H AU = T

(4)

obere Dreiecksgestalt besitzt.

T heißt Schursche Normalform der Matrix A.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

12 / 80

Eigenwertaufgaben Bemerkung Besitzt A die Schur Zerlegung U H AU = diag {λ 1 ,
Eigenwertaufgaben
Bemerkung
Besitzt A die Schur Zerlegung
U H AU = diag {λ 1 ,
, λ n }
+ N
mit einer strikten oberen Dreiecksmatrix N , so gilt unabhängig von der Wahl
von U für die Schur Norm
n
n
N S
2 = U H AU 2 S −
|λ j | 2 = A 2 S −
|λ j | 2 .
j =1
j =1
Es gilt N S 2 = 0 genau dann, wenn A eine normale Matrix ist.
N S =: ∆( A) heißt die Abweichung von A von der Normalität.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

13 / 80

 

Eigenwertaufgaben

 
 

Quasidreiecksgestalt

 

Dabei heißt eine Matrix R Quasidreiecksmatrix, falls

 

R =

R

.

.

11

R 12

R 13

.

.

.

R 1 k

 

O

R 22

R 23

.

.

.

R 2 k

.

.

.

.

.

.

.

.

.

.

.

O

O

O

.

.

.

R kk

obere Blockdreiecksgestalt besitzt und die Diagonalblöcke R jj alle die Dimension 1 oder 2 besitzen.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

15 / 80

Eigenwertaufgaben

Quasidreiecksgestalt

Bei der bisherigen Behandlung der Ähnlichkeitstransformationen haben wir einen wichtigen Aspekt nicht berücksichtigt. Ist die Ausgangsmatrix A reell, so wird man nur orthogonale Matrizen U (d.h. reelle unitäre Matrizen) zur Transformation benutzen, da sonst U H AU komplexe Elemente enthält.

Besitzt A komplexe Eigenwerte, so kann A hiermit offenbar nicht auf obere Dreiecksgestalt transformiert werden (die Diagonale enthält ja die Eigenwerte).

 

¯

Da mit λ C \ R auch λ Eigenwert von A ist (das charakteristische Polynom

 

hat reelle Koeffizienten!), kann man A auf Quasidreiecksgestalt transformieren.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

14 / 80

Eigenwertaufgaben

Reelle Schur Form

Sei A R n × n . Dann existiert eine orthogonale Matrix U , so dass U T AU

 

quasidreieckig ist. U kann so gewählt werden, dass jeder

2 × 2–Diagonalblock R jj nur komplexe Eigenwerte besitzt.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

16 / 80

Eigenwertaufgaben

Störungssätze

Viele Verfahren zur Bestimmung von Eigenwerten bestehen darin, Matrizen

X k zu bestimmen, so dass X gleicht.

1

k

AX k mehr und mehr einer Diagonalmatrix

Wir fragen daher, wie gut die Eigenwerte einer Matrix durch ihre Diagonalelemente approximiert werden.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

17 / 80

 

Eigenwertaufgaben

 

Beweis

(i):

Sei Ax = λ x , x

= 0. Dann gilt

(λ a ii ) x i = a ij x j

für alle i .

 

j = i

Sei i ∈ {1,

 
 

, n } ein Index mit | x i | = x . Dann folgt

|λ a ii | ≤ | a ij | ·

x

j

x

i

z i ,

j = i

 
 

1

und daher gilt λ Z i .

(ii)

folgt aus (i), da A und A T dieselben Eigenwerte besitzen.

 

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

19 / 80

Eigenwertaufgaben Satz von Gerschgorin Sei n n A := ( a ij ) ∈ C
Eigenwertaufgaben
Satz von Gerschgorin
Sei
n n
A := ( a ij ) ∈ C n × n , z i :=
| a ij |, s j :=
| a ij |.
j =1
i =1
j = i
i = j
Dann gilt
(i) Alle Eigenwerte von A liegen in der Vereinigung der Kreise
Z i := { z ∈ C : | z − a ii | ≤ z i }.
(ii) Alle Eigenwerte von A liegen in der Vereinigung der Kreise
S j := {z ∈ C : | z − a jj | ≤ s j }.
n n
(iii) Jede Zusammenhangskomponente von
Z i bzw.
=1 S j enthält genau so
i =1
j
viele Eigenwerte von A wie Kreise an der Komponente beteiligt sind, wobei
Kreise und Eigenwerte entsprechend ihrer (algebraischen) Vielfachheit
gezählt sind.
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
18 / 80

Eigenwertaufgaben

Beweis cnt.

(iii) Wir betrachten für t [0, 1]

A( t ) := D + t ( A D ) mit D := diag { a 11 ,

, a nn }.

Dann sind für A( t ) die Radien der Kreise Z i ( t ) bzw. S j ( t ) gleich tz i bzw. ts j und die Mittelpunkte a ii bzw. a jj .

Offenbar ist die Behauptung für t = 0 richtig. Wächst nun t , so bleibt wegen der stetigen Abhängigkeit der Eigenwerte von den Elementen der Matrix A( t ), also von t , die Anzahl der Kreise und Eigenwerte in einer Komponente konstant, solange sie nicht mit einer anderen Komponente zusammenstößt.

Geschieht dies, so addieren sich die Kreise und Eigenwerte. Die Behauptung

ist also für alle t 0 und damit für A = A(1) richtig.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

20 / 80

Eigenwertaufgaben

Bemerkung

Die Aussage (iii) lässt sich nicht verschärfen zu: In jedem Kreis S i bzw. Z j liegt mindestens ein Eigenwert von A,

denn sei

A =

0

1

0 .

2

Dann sind die Eigenwerte λ 1/2 = ± 2, und es liegt kein Eigenwert in

Z 1 = S 2 = {z

: | z | ≤ 1}.

Für viele Eigenwert Routinen kann man zeigen, dass die berechneten

Eigenwerte λ 1 ,

sind, wobei E eine kleine Norm besitzt.

, λ n die exakten Eigenwerte einer gestörten Matrix A + E

Wir fragen daher, wie Störungen die Eigenwerte einer Matrix beeinflussen. Beispielhaft hierfür ist:

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

21 / 80

Eigenwertaufgaben

Beweis

Für µ σ( A) ist die Aussage trivial. Sei also µ / σ( A).

Da X 1 ( A + E µ I ) X singulär ist, ist auch

I + (Λ µ I ) 1 ( X 1 EX ) = (Λ µ I ) 1 X 1 ( A + E µ I ) X

singulär.

Also existiert y C n , y p = 1 mit

y + (Λ µ I ) 1 ( X 1 EX ) y = 0

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

23 / 80

Es sei A diagonalisierbar.

Eigenwertaufgaben

Satz von Bauer–Fike

Ist µ Eigenwert von A + E C n × n und

so gilt

X 1 AX = Λ = diag {λ 1 ,

, λ n },

min A) |λ µ| ≤ κ p ( X ) E p .

λσ(

Dabei bezeichnet · p die von der Höldernorm

x p :=

n

j =1

| x j | p

1/ p

, p 1,

induzierte Matrixnorm und κ p die Kondition bzgl. · p .

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

22 / 80

Eigenwertaufgaben

Beweis cnt.

Hieraus folgt

1

= y p = µ I ) 1 ( X 1 EX ) y p

max

z p

=1 µ I ) 1 ( X 1 EX ) z p

= µ I ) 1 X 1 EX p

1

|λ µ| X 1 p E p X p ,

min

λσ( A)

wobei ausgenutzt wurde, dass die p –Norm einer Diagonalmatrix gleich dem Betrag des betragsmaximalen Elements der Matrix ist.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

24 / 80

Eigenwertaufgaben

Korollar

Für normale Matrizen erhält man insbesondere

Korollar 6.9 Es sei A eine normale Matrix und µ ein Eigenwert von A + E C n × n . Dann gilt

min A) |λ µ| ≤ E 2

λσ(

Beweis

Da A normal ist, kann man in Satz 6.8 X unitär wählen, und die Behauptung

folgt dann aus κ 2 ( X ) = 1.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

25 / 80

Eigenwertaufgaben

Potenzmethods

Wir betrachten für A C n × n die spezielle Eigenwertaufgabe

Ax = λ x .

(1)

Es sei A diagonalisierbar, Ax i = λ i x i , i = 1, dominanten Eigenwert λ 1 , d.h.

|λ 1 | > |λ 2 | ≥

≥ |λ n |.

, n , und es besitze A einen

(2)

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

27 / 80

Eigenwertaufgaben

Potenzmethods

Wir betrachten in diesem Abschnitt ein Verfahren zur Bestimmung des betragsgrößten Eigenwerts und zugehörigen Eigenvektors, eine Modifikation hiervon, um auch andere Eigenwerte zu berechnen und eine simultane Variante.

Wir besprechen die Methoden vor allem zum besseren Verständnis des dann im nächsten Abschnitt folgenden Arbeitspferdes zur Berechnung von Eigenwerten und Eigenvektoren, des QR Algorithmus.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

26 / 80

Eigenwertaufgaben

Es sei u 0 C n , u 0 = 0, gegeben.

Potenzmethods

Multipliziert man

u 0 =:

n

i =1

α i x i

m mal mit der Matrix A, so folgt

A m u 0 =

n

i m x i = λ m α 1 x 1 +

1

n

i =2

α i

λ i

m x i .

 

i =1

α i λ

(3)

λ 1

Wegen (2) konvergiert daher die Folge {λ

x 1 , falls α 1

span{x 1 } zum dominanten Eigenwert λ 1 , wenn der Startvektor u 0 eine Komponente in Richtung von x 1 besitzt.

1 A m u 0 } gegen ein Vielfaches von

m

= 0 gilt, d.h. {A m u 0 } konvergiert gegen die Eigenrichtung

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

28 / 80

Eigenwertaufgaben

Potenzmethods

Gilt |λ 1 | = 1, so erhält man für große m Exponentenüberlauf oder -unterlauf. Man wird also die Folge {A m u 0 } noch geeignet normieren und erhält die Potenzmethode oder das von Mises Verfahren.

Sei · irgendeine Norm auf C n und u 0 C n \ {0}.

Algorithmus 6.14 [Potenzmethode]

1: for m=0,1, =

2:

3:

4:

+1

until convergence do Au m ;

v m

k m +1 = v m +1 ;

u m +1 = v m +1 /k m +1 ;

5: end for

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

29 / 80

Eigenwertaufgaben

Konvergenzsatz

Es sei λ 1 dominanter Eigenwert von A und

mit α 1 = 0 und C n .

u 0 :=

n

i =1

α i x i

Es seien u m und k m nach Algorithmus 6.15 berechnet. Gilt dann H u m = 0 für

alle m N und H x 1 = 0, so ist

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

31 / 80

k m = λ 1 ,

lim

m

→ ∞ k m = λ 1 , lim m m →∞ u m = lim

m →∞ u m =

lim

1 x 1 x 1 .

H

Eigenwertaufgaben Potenzmethods Häufig wird eine andere Skalierung der erzeugten Folge gewählt, die billiger ist als
Eigenwertaufgaben
Potenzmethods
Häufig wird eine andere Skalierung der erzeugten Folge gewählt, die billiger
ist als die Normierung. Sei dazu ∈ C n ein gegebener Vektor. Hiermit
iterieren wir gemäß
Algorithmus 6.15 [Potenzmethode]
2:
1: for m=0,1,
=
v m
until convergence do
Au m ;
+1
3:
k m
=
+1
H v m +1 ;
4:
u m +1 = v m +1 /k m +1 ;
5: end for

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

30 / 80

 

Eigenwertaufgaben

 
 

Beweis

Offensichtlich gilt

 

u m = A m u 0 / H A m u 0 .

 

Daher ist

 

A m 1 u 0

 

k m = H v m = H Au m 1 =

H A

H A m 1

u 0 = H A m u 0

H A m 1 u 0 ,

und aus

folgt

lim

1

lim

m →∞ λ

k m =

1 A m u 0 = α 1 x

m

1

m →∞ H (λ

lim

1 A m u 0 )

m

 

m →∞ λ

1

H (λ

lim

m

( m 1)

1

A m 1 u 0 ) = 1,

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

32 / 80

Eigenwertaufgaben Beweis cnt. d.h. lim →∞ k m = λ 1 m und A m
Eigenwertaufgaben
Beweis cnt.
d.h.
lim
→∞ k m = λ 1
m
und
A m u 0
lim
=
lim
m
→∞ u m
m →∞
H A m u 0
n
α 1 x 1 + =2 α i (λ i /λ 1 ) m x i
i
=
n
α 1 H x 1 + =2 α 1 (λ i /λ 1 ) m H x i
i
=
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
33 / 80

1

x x 1 .

H

Eigenwertaufgaben

Bemerkungen

5. Ist A R n × n mit |λ 1 | = |λ 2 | > |λ 3 | ≥

oder λ 1 = λ 2 ), so erhält man keine Konvergenz, sondern es treten in der Folge {u m } Oszillationen auf. Auch in diesem Fall kann man aus (drei aufeinanderfolgenden Elementen) der Folge {u m } Näherungen für die zu λ 1 und λ 2 gehörenden Eigenvektoren ermitteln. Eine ausführliche Diskussion

findet man in Zurmühl, pp. 283 ff.

≥ |λ n | und λ 1

= λ 2 (also λ 1 = λ 2

6. Schließlich haben wir vorausgesetzt, dass A diagonalisierbar ist. Ist dies

nicht erfüllt, so muss man u 0 als Linearkombination von Hauptvektoren darstellen und erhält ebenfalls Konvergenz des Verfahrens (vgl. Collatz, pp. 325 ff.).

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

35 / 80

Eigenwertaufgaben

Bemerkungen

1. Eine häufige Wahl von ist = e k für ein k ∈ {1,

im Eigenvektor die k te Komponente zu 1, wobei man nicht vorhersagen kann, welches k geeignet ist.

, n }, d.h. man normiert

2. Ist A R n × n nichtnegativ und irreduzibel, so ist der zum Spektralradius

gehörende Eigenvektor positiv, und man kann = (1, 1, u 0 positive Komponenten hat.

, 1) T wählen, wenn

3. Wir haben α 1

einschneidend, denn durch Rundungsfehler wird (fast immer) ein u m erzeugt, das eine Komponente in Richtung von x 1 besitzt.

= 0 vorausgesetzt. Diese Voraussetzung ist nicht

4. Ist λ 1 mehrfacher Eigenwert von A und A diagonalähnlich, so bleiben alle

Überlegungen richtig, wenn nur u 0 eine Komponente in Richtung des Eigenraumes von A zu λ 1 besitzt oder eine solche durch Rundungsfehler erzeugt wird.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

34 / 80

Eigenwertaufgaben Bemerkungen 7. Für die Konvergenzgeschwindigkeit gilt mit λ i q := max i =2,
Eigenwertaufgaben
Bemerkungen
7.
Für die Konvergenzgeschwindigkeit gilt mit
λ
i
q :=
max
i =2,
,
m
λ 1
| k m +1 − λ 1 |
=
n
=
i =2
m +1
n
λ
1
2
H A m u 0
i =2
d.h. wir haben lineare Konvergenz mit dem Konvergenzfaktor q .
Ist also |λ 1 | von den Beträgen der übrigen Eigenwerte gut getrennt, so erhält
man rasche Konvergenz, i.a. ist das Verfahren aber sehr langsam.
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
36 / 80

H A m +1 u 0

H A m u 0

λ 1

=

1

H A

m u 0 H ( A m +1 u 0 λ 1 A m u 0 )

H A m u 0 H

λ

m +1

1

H A m u 0 H λ m + 1 1 α i λ i λ

α i

λ i

λ 1

m +1

λ i

λ 1

m x i

|α i |

λ i

λ 1

m

λ i

λ 1

1 x i 2

Cq m

(4)

Eigenwertaufgaben Bemerkungen 8. Bisweilen kann die Konvergenzgeschwindigkeit durch eine Spektralverschiebung
Eigenwertaufgaben
Bemerkungen
8. Bisweilen kann die Konvergenzgeschwindigkeit durch eine
Spektralverschiebung verbessert werden, d.h. betrachte A + α I , α ∈ C. Dann
gehen die Eigenwerte über in λ i + α, und die Konvergenzgeschwindigkeit wird
bestimmt durch
λ i + α
q :=
max
.
i =2,
,
n
λ 1 + α
Die Verbesserung hierdurch ist meistens unwesentlich.
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
37 / 80

Eigenwertaufgaben

Inverse Iteration

Sei λ

= λ i für alle i . Dann besitzt die Matrix (λ I A) 1 die Eigenwerte

1/(λ λ i ) und die Eigenvektoren stimmen mit denen von A überein.

Führt man die von Mises Iteration für (λ I A) 1 aus und gilt

|λ λ i | < |λ

λ j |, j = 1,

=

, n , j

i ,

mit einem einfachen Eigenwert λ i von A, so ist

von (λ I A) 1 und die Konvergenzgeschwindigkeit wird bestimmt durch

1

λλ i dominanter Eigenwert

q := max

j = i

λ λ i

λ λ j

.

Ist also λ eine gute Näherung für λ i , so erhält man sehr schnelle Konvergenz.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

39 / 80

Eigenwertaufgaben

Inverse Iteration

Eine erhebliche Beschleunigung der von Mises Iteration erhält man durch die inverse Iteration, die 1944 von Wielandt eingeführt wurde bei der Stabilitätsanalyse von Strukturen, die kleine Störungen bekannter Systeme sind. In diesem Fall sind gute Approximationen für die relevanten Eigenwerte bekannt, und man erhält (wie wir noch sehen werden) rasche Konvergenz.

Heute wird die inverse Iteration vor allem verwendet zur Bestimmung von Eigenvektoren, wenn wenige Eigenwerte und Eigenvektoren gesucht sind.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

38 / 80

Eigenwertaufgaben Inverse Iteration; feste Shifts 1: for m=0,1, until convergence do 2: solve (λ I
Eigenwertaufgaben
Inverse Iteration; feste Shifts
1: for m=0,1,
until convergence do
2:
solve (λ I − A) v m +1 = u m ;
3:
=
k m +1
H v m +1 ;
4:
u m +1 = v m +1 /k m +1 ;
5: end for
Wie für die Potenzmethode erhält man im Fall |λ − λ i | < |λ − λ j | für alle j
= i
i
x
1
u m →
k m →
unter den entsprechenden Voraussetzungen α i = 0, H v m = 0, H x i = 0.
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
40 / 80

H

x i ,

λ λ i

Eigenwertaufgaben

Inverse Iteration; variable Shifts

Die Konvergenz ist natürlich linear. Dies wird verbessert, wenn man λ gleichzeitig iteriert:

Algorithmus 6.19 [Inverse Iteration; variable Shifts]

1: for m=0,1,

until convergence do

2:

3:

4:

5:

solve (λ m I A) v m +1 = u m for v m +1

k m +1 = H v m +1 ;

u m +1 =

v m +1 /k m +1 ;

λ m +1 = λ m 1/k m +1 ;

6: end for

Es gilt ja k m +1

1

λλ i . Hieraus erhält man eine Schätzung λ ( m +1) für λ i durch

k m +1 1/(λ ( m ) λ ( m +1) ),

und damit die Aufdatierung des Shifts in Algorithmus 6.19

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

41 / 80

 

Eigenwertaufgaben

 
 

Beweis cnt.

 

Es gilt

 

F ( u , λ) = λ I H A

u 0 .

Das Newton-Verfahren ist also gegeben durch

 

I A u m

 

u m +1

u m

u m Au m

 

d.h.

λ ( m )

H

0

λ ( m +1) λ (

m ) = λ ( m )

H u m 1

(λ ( m ) I A) u m +1 + λ ( m +1) λ ( m ) u m H u m +1

=

0

=

1,

und dies ist äquivalent Algorithmus 6.19.

 

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

43 / 80

˜

Eigenwertaufgaben

Konvergenzsatz

Sei λ ein algebraisch einfacher Eigenwert von A mit zugehörigem Eigenvektor

u˜, und es gelte H u˜ = H u 0 = 1.

Dann konvergiert das Verfahren in Algorithmus 6.19 lokal quadratisch gegen

˜

λ bzw. u.˜

Beweis Wir zeigen, dass das Verfahren genau die Iterationsvorschrift des Newton-Verfahrens für das Gleichungssystem

˜

F ( u , λ) := λ H u u Au 1

= 0

0

ist und dass F ( u˜, λ) nichtsingulär ist. Dann folgt die quadratische

Konvergenz sowohl für den Eigenvektor als auch den Eigenwert aus einem Satz in Mathematik III. Wir werden auf das Newton Verfahren in Kapitel 7 eingehen.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

42 / 80

Es sei

d.h.

Eigenwertaufgaben

Beweis cnt.

F ( u˜, λ)

˜

v

= 0

µ

˜

H v = 0.

( λ I A) v

+ µ u˜ = 0,

˜

˜

Im Falle µ = 0 gilt ( λ I A) v = 0, d.h., da λ ein einfacher Eigenwert von A ist,

v = α u˜ für ein α C, und es folgt 0 = H v = α H u˜ = α.

Im Falle µ

= 0 gilt

und daher

˜

( λ I A) v = µ u˜

= 0,

( λ I A) 2 v = µ( λ I A) u˜ = 0.

˜

˜

˜

v ist also ein Hauptvektor 2. Stufe, und daher besitzt λ mindestens die

algebraische Vielfachheit 2.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

44 / 80

Eigenwertaufgaben Bemerkung Man entnimmt dem Beweis sofort, dass das Verfahren in Algorithmus 6.18 auch dann
Eigenwertaufgaben
Bemerkung
Man entnimmt dem Beweis sofort, dass das Verfahren in Algorithmus 6.18
auch dann lokal konvergiert, wenn A nicht diagonalisierbar ist.
Die inverse Iteration konvergiert sogar kubisch, wenn die Matrix A
symmetrisch ist und wenn die Näherung für den Eigenwert aufdatiert wird mit
dem Rayleighschen Quotienten
λ ( m ) = ( u m ) H Au m
.
u m 2
2
Diese Aufdatierung ist auch bei nicht symmetrischen Matrizen sinnvoll wegen
des folgenden Lemmas. Man erhält dann wie in Abschnitt 8 quadratische
Konvergenz (s. Stewart, pp. 346 ff.).
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
45 / 80

Eigenwertaufgaben

Inverse Iteration

Auf den ersten Blick scheint es eine Schwierigkeit bei der inversen Iteration zu sein, dass die Koeffizientenmatrix λ ( m ) I A des zu lösenden linearen Gleichungssystems bei Konvergenz von λ ( m ) gegen einen Eigenwert von A mehr und mehr singulär wird, die Kondition also wächst und damit der Fehler der Lösung des Gleichungssystems wächst.

Man kann jedoch zeigen (vgl. Chatelin, pp. 217 ff.), dass (bei gut konditionierten Problemen) der Fehler, der bei der Lösung von (λ ( m ) I A) v m +1 = u m gemacht wird, vornehmlich die Richtung des Eigenvektors zu λ, also die gewünschte Richtung, hat.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

47 / 80

Eigenwertaufgaben Lemma Sei A ∈ C n × n beliebig, x ∈ C n ,
Eigenwertaufgaben
Lemma
Sei A ∈ C n × n beliebig, x ∈ C n , und für µ ∈ C
r (µ) :=
Ax − µ x
der zugehörige Defekt.
Dann gilt
x 2
2
Beweis
r (µ) 2 = min! ist ein lineares Ausgleichsproblem zur Bestimmung von µ mit
der Koeffizientenmatrix x und der rechten Seite Ax . Die Normalgleichung
hierzu lautet
x˜ H x µ = x˜ H Ax .

r (µ) 2 = min!

⇐⇒

µ = x H Ax .

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

46 / 80

Eigenwertaufgaben

QR Algorithmus

Der QR Algorithmus dient dazu, alle Eigenwerte einer Matrix A C n × n zu bestimmen.

 

Er wurde von Francis und Kublanovskaya unabhängig voneinander im Jahr 1961 eingeführt.

Er wird heute als das beste Verfahren zur Lösung der vollständigen Eigenwertaufgabe für nichtsymmetrische Probleme angesehen.

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

48 / 80

Eigenwertaufgaben

Grundform des QR Algorithmus

Es sei A 0 := A. Die Grundform des QR Algorithmus ist gegeben durch

Algorithmus 6.24 [QR Algorithmus; Grundform]

1: for i=0,1,

until convergence do

2:

3:

Zerlege A i = Q i R i

A i +1 = R i Q i ;

(QR Zerlegung)

4: end for

Die durch den QR Algorithmus erzeugten Matrizen A i sind einander ähnlich und damit ähnlich zu A, denn es gilt

A i +1 =

H

H

i

i

R i Q i = Q ( Q i R i ) Q i = Q A i Q i .

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

49 / 80

Eigenwertaufgaben Bemerkung Am Ende sind die Eigenwerte von A in A i der Größe der
Eigenwertaufgaben
Bemerkung
Am Ende sind die Eigenwerte von A in A i der Größe der Beträge nach
geordnet.
Beispiel 6.29
Die Matrix
1
−1
−1
A = 
4
6
3
−4
−4
−1
besitzt die Eigenwerte λ 1 = 3, λ 2 = 2 und λ 3 = 1, und für die Matrix der
Eigenvektoren gilt (bis auf die Normierung)
0
−1
−1
X = 
1
2
 und
2 2
1
1
X −1 = 
0 1
1
 .
−1
0
−2
−1
−1
−1
Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6
2010
51 / 80
Eigenwertaufgaben Konvergenzsatz Es seien die Eigenwerte von A ∈ C n × n dem Betrage
Eigenwertaufgaben
Konvergenzsatz
Es seien die Eigenwerte von A ∈ C n × n dem Betrage nach voneinander
verschieden und angeordnet gemäß
|λ 1 | > |λ 2 | > ··· > |λ n | > 0.
(5)
Es sei A = X Λ X −1 , und es besitze die Matrix Y := X −1 eine LR Zerlegung.
Dann konvergiert der QR Algorithmus im Wesentlichen, d.h. für A i := ( a
gilt
( i )
jk
) j , k
lim
( i )
jk
= 0 für j > k
i →∞ a
lim
a
( i )
kk = λ k
für
k = 1,
, n .
i →∞

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

50 / 80

 

Eigenwertaufgaben

 
 

Beispiel

 

Die Voraussetzungen von Satz 6.27 sind also erfüllt.

 

Man erhält

 

3.000034 0.577363 8.981447

 

A 10 =

9.78 e 6

1.999995

1.4142593

6.91e 6 3.99 e 6 0.999972

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

 

2010

52 / 80

Eigenwertaufgaben

Bemerkung

Wegen (5) ist A diagonalisierbar, d.h. X und damit Y existieren.

Die einzige Forderung in Satz 6.27 an die Matrix X ist also, dass Y := X 1 eine LR Zerlegung besitzt.

Verzichtet man hierauf, so erhält man

für eine Permutation π von {1,

lim

i →∞ a

( i ) kk = λ π( k )

, n } (vgl. Wilkinson, p. 519 ff.).

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

2010

53 / 80

Eigenwertaufgaben

Beispiel

Die orthogonale Iteration liefert nach 30 Schritten

A 30 =

3.0000058 2.0000014 2.9999975

0.9999989

1.16e 6 6.69 e 5 1.9999953

1.16e 6

0.9999978

  .

Die Diagonalelemente scheinen also gegen die Eigenwerte zu konvergieren, wobei sie allerdings nicht nach der Betragsgöße geordnet sind. Diese Konvergenz würde auch bei exakter Rechnung eintreten (vgl. Bemerkung

6.30).

Iteriert man weiter, so erhält man (durch Rundungsfehler)

A 70 =

3 + 5.2e 13

3.5355303

1.48e 13

1.9999949

7.52 e 19

5.07 e 6

0.7071247

1.0000051

1.0000051

Heinrich Voss (Hamburg University of TechnologyInstitute for Numerical Simulation)Kapitel 6

  .

2010

55 / 80

Für die Matrix

Eigenwertaufgaben

A =

1 0

1

1

2

2 3

2

2

Beispiel

mit den Eigenwerten λ 1