Sie sind auf Seite 1von 100

Numerik IV

Fritz Colonius
24. Juli 2006
ii
Inhaltsverzeichnis
Vorwort v
1 Einleitung 1
2 Lineare Kontrollsysteme 11
2.1 Kontrollierbarkeit bei unbeschrnkten Kontrollen . . . . . . . 11
2.2 Lineare Systeme mit beschrnkten Kontrollen . . . . . . . . . 18
2.3 Feedback-Stabilisierung . . . . . . . . . . . . . . . . . . . . . . 23
3 Nichtlineare Kontrollsysteme 33
3.1 Lokale Akzessibilitt . . . . . . . . . . . . . . . . . . . . . . . 33
3.2 Kontrollmengen . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Der Kontrolluss 57
4.1 Der Shift auf | . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2 Der Kontrolluss . . . . . . . . . . . . . . . . . . . . . . . . . 62
5 Berechnung von Erreichbarkeitsmengen 71
5.1 Relative Globale Attraktoren . . . . . . . . . . . . . . . . . . 71
5.2 Grundalgorithmus zur Subdivision . . . . . . . . . . . . . . . . 78
5.3 Zeitdiskretisierung . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4 Zeitdiskretisierung und Kettenerreichbarkeit . . . . . . . . . . 82
5.5 Graphen-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . 83
5.6 Varianten des Subdivisions-Algorithmus . . . . . . . . . . . . 89
Literaturverzeichnis 93
iii
iv INHALTSVERZEICHNIS
Vorwort
Dies ist das Skript der im Sommersemester 2006 am Institut fr Mathematik
der Universitt Augsburg gehaltenen Vorlesung. Die im Literaturverzeichnis
angegebenen Quellen werden ohne weitere Kennzeichnung verwendet.
Das Ziel dieser Vorlesung ist es, eine Einfhrung in Probleme der Ma-
thematischen Kontrolltheorie zugeben, die zu einigen aktuellen analytischen
und numerischen Problemen hinfhrt. Dabei stehen die Beziehungen zur Dy-
namik im Vordergrund.
v
vi VORWORT
Kapitel 1
Einleitung
Diese Vorlesung gibt eine Einfhrung in die Kontrolltheorie und damit zu-
sammenhngende numerische Probleme. Genauer handelt es sich um Pro-
bleme der Kontrolle von Systemen, die durch gewhnliche Dierentialglei-
chungen beschrieben werden. Eine Standardreferenz hierfr ist das Buch von
Eduardo Sontag [19]; ferner D. Hinrichsen/A.J. Pritchard [10], S. Sastry [18],
und speziell fr nichtlineare Kontrollsysteme sind auch insbesondere die B-
cher V. Jurdjevic [13], Nijmeijer/Van der Schaft [16] und Isidori [11] zu nen-
nen.
Zunchst werden wir ein einfaches und klassisches Beispiel aus der Me-
chanik diskutieren, das mathematische Pendel oder, moderner interpretiert,
die Bewegung eines Roboterarms. Dabei treten bereits eine Reihe typischer
Probleme und Konzepte der Kontrolltheorie auf. Eine schne Herleitung der
Dierentialgleichung fr das Pendel ndet man in Aulbach [2, Beispiel 1.3.3],
vergleiche auch Sontag [19, Chapter 1].
Wir betrachten ein Pendel, das aus einer masselosen starren Stange und
einem daran befestigten Massepunkt besteht. Das Pendel soll sich unter dem
Einuss der senkrecht nach unten wirkenden Schwerkraft benden. Wir be-
zeichnen die Winkelposition des Pendels mit , [0. 2:), so dass _ ,(t) die
Winkelgeschwindigkeit und ,(t) die Winkelbeschleunigung zum Zeitpunkt t
bezeichnet. Die Lage, Geschwindigkeit und Beschleunigung des Punktes `
des sich auf dem Kreis mit Radius | bewegenden Punktes erhlt man ein-
fach durch Multiplikation von ,(t). _ ,(t) und ,(t) mit |. Zur Herleitung einer
Dierentialgleichung fr , benutzen wir das Newtonsche Kraftgesetz:
Kraft = Masse mal Beschleunigung
zu jedem Zeitpunkt t. Hier ist Masse mal Beschleunigung gegeben durch
:| ,(t).
1
2 KAPITEL 1. EINLEITUNG
Die zur Zeit t wirkende Kraft ist die tangentiale Komponente der (nach unten
gerichteten) Schwerkraft :q, also
:q sin ,(t).
Darberhinaus bercksichtigen wir eine Reibungskraft, die der momentanen
Geschwindigkeit proportional und entgegengesetzt ist, also
/ _ ,(t)
mit einer Proportionalittskonstanten / (dies ist eine stark vereinfachende
Annahme! Die Modellierung von Reibungskrften ist sehr schwierig). Wir
erhalten nach Newton also
:q sin ,(t) / _ ,(t) = :| ,(t)
oder
,(t) =
/
|:
_ ,
q
|
sin ,.
Wir nehmen jetzt zustzlich an, dass ein Motor am Drehpunkt angebracht
ist, der eine Kraft (oder ein Drehmoment) n(t) auf den Roboterarm ausbt.
Dann modiziert sich die Gleichung zu
,(t) =
/
:
_ ,
q
|
sin , +n(t).
In dieser Gleichung entspricht , = 0 dem senkrecht nach unten hngenden
Roboterarm und , = : dem senkrecht nach oben stehenden Roboterarm. Wir
interessieren uns fr die Position , = :. Der Einfachheit halber normieren
wir die Konstanten : = q = | = 1, so dass
,(t) = / _ , sin , +n(t).
Setzen wir 0 = , :, so ndern sich die Gleichungen zu

0(t) = /
_
0(t) sin[0(t) +:] +n(t).
Die Ruhelage in der senkrechten Position 0(t) = 0 mit Geschwindigkeit
_
0 = 0
ist oenbar eine Lsung dieser Dierentialgleichung fr n(t) = 0. Aus oen-
sichtlichen physikalischen Grnden ist diese Ruhelage bei n = 0 instabil.
Unser Kontrollproblem (Steuerungs- oder Regelungsproblem) besteht darin,
kleine Abweichungen aus dieser Ruhelage durch geeignete Wahl von n zu kor-
rigieren. Der Sinus-Term ist nichtlinear; wir knnen aber ein lineares System
3
herleiten, indem wir fr kleine Abweichungen , - : die Approximation
sin , - (, :) benutzen, oder fr 0 nahe 0
sin[0 +:] - 0.
Man erhlt

0(t) +/
_
0(t) 0(t) = n(t).
Schreiben wir
r
1
(t) = 0(t) und r
2
(t) =
_
0(t)
so erhlt man
_ r
1
= r
2
_ r
2
= /r
2
+r
1
+n(t)
oder
_
_ r
1
_ r
2
_
=
_
0 1
1 /
__
r
1
r
2
_
+
_
0
1
_
n(t).
Wir erwarten natrlich, dass diese Gleichung das Verhalten des Ausgangsys-
tems in der Nhe der (oberen) Ruhelage annhernd beschreibt. Dieses Vorge-
hen (Linearisierung des Systems) werden wir spter mathematisch analysie-
ren. Jetzt beschrnken wir uns auf die Analyse der linearisierten Gleichung.
Unser Ziel ist es, das System durch geeignete Wahl von n fr (r
1
. r
2
) ,=
(0. 0) mglichst schnell und mit mglichst wenig Oszillationen wieder nach
(0. 0) zu bringen.
Ansatz:
n = cr
1
mit c 0.
Dies nennt man ein proportionales Feedback mit dem Feedback-Gain c.
Einsetzen liefert
_
_ r
1
_ r
2
_
=
_
0 1
1 /
__
r
1
r
2
_
+
_
0
1
_
(cr
1
)
oder
_
_ r
1
_ r
2
_
=
_
0 1
1 c /
__
r
1
r
2
_
.
Zur Vereinfachung nehmen wir jetzt an, dass / = 0 gilt. Dann
_
_ r
1
_ r
2
_
=
_
0 1
1 c 0
__
r
1
r
2
_
oder

0 = (1 c)0.
4 KAPITEL 1. EINLEITUNG
Die Eigenwerte von
_
0 1
1 c 0
_
sind die Lsungen von
.
2
+c 1 = 0.
fr c 1 also
.
1,2
= i
_
c 1.
Daher sind fr c 1 die Lsungen Ellipsen. Fr c < 1 gehen alle Lsungen
betragsmig gegen , auer denen mit
r
2
(0) = r
1
(0)
_
1 c.
Fr c = 1 sind alle Anfangswerte mit r
2
(0) = 0 Ruhelagen (also _ ,(0) = 0
liefert _ ,(t) = 0 fr alle t).
Wir sehen also, dass proportionales Feedback hier nicht funktioniert. Wir
werden einen Dmpfungsterm hinzufgen:
Ansatz:
n(t) = cr
1
(t) ,r
2
(t)
mit c 1 und , 1. Dies ist ein PD-Feedback (proportional-derivative).
Man beachte, dass zur Implementierung dieses Feedbacks nicht nur der mo-
mentane Zustand r
1
(t) = 0(t), sondern auch seine Geschwindigkeit r
2
(t) =
_
0(t) gemessen werden muss.
Einsetzen liefert

0 +,
_
0 + (c 1)0 = 0
oder
_
_ r
1
_ r
2
_
=
_
0 1
1 c ,
__
r
1
r
2
_
Die zugehrigen Eigenwerte sind
.
1,2
=
,
2

1
2
_
,
2
4(c 1).
Ist ,
2
4(c 1) _ 0, so ist der Realteil der Eigenwerte gleich
o
2
< 0, die
Lsungen konvergieren dann fr t gegen 0. Will man auch Oszillationen
um den Nullpunkt vermeiden, so muss ,
2
4(c 1) 0 gewhlt werden;
auch dann haben beide Eigenwerte negativen Realteil.
Das PD-Feedback stabilisiert also das linearisierte System; wir werden
spter sehen, dass es in einer Umgebung der Ruhelage auch fr das nichtli-
5
neare Systeme funktioniert. Dies ist ein Beispiel eines allgemeinen Lineari-
sierungsprinzips in der Kontrolltheorie:
Designs, die auf Linearisierung beruhen,
funktionieren lokal fr das nichtlineare System.
Dieses Prinzip, das jeweils unter entsprechenden Voraussetzungen zu przi-
sieren ist, liefert die Rechtfertigung fr das intensive Studium linearer Kon-
trollsysteme.
Unser obige PD-Kontrolle hat die Form eines Feedbacks, ist also vom
augenblicklichen Zustand r des Systems abhngig. Eine Alternative sind
zeitabhngige Kontrollen n, die nur von t abhngen, nicht von r. Die fol-
gende berlegung demonstriert, warum man bei Stabilisierungsproblemen
Feedback verwenden muss.
Betrachte das linearisierte System (mit / = 0)

0(t) 0(t) = n(t).


mit festem Anfangswert
0(0) = 1.
_
0(0) = 2.
Die Steuerung
n(t) = 3 c
2t
liefert die Lsung
0(t) = c
2t
.
wie man durch Einsetzen nachprft:
_
0 = 2c
2t
.

0 = 4c
2t
also
0(0) = 1.
_
0(0) = 2.

0(t) 0(t) = 4c
2t
c
2t
= 3c
2t
= n(t).
Die Lsung konvergiert dann fr t gegen (0. 0)
T
. Ist der Anfangswert
jedoch
0(0) = 1.
_
0(0) = 2 +, mit ,= 0. .
so fhrt Anwendung derselben Steuerung zu unbeschrnkten Lsungen.
6 KAPITEL 1. EINLEITUNG
(bungsaufgabe! Hinweis: Beachte, dass
d
dt
sinh t = cosh t und
d
dt
cosh t = sinh t.)
Kleine nderungen oder Ungenauigkeiten in den Startwerten fhren also
dazu, dass die (vorab berechnete) Steuerung wertlos fr Stabilisierung wird.
Bei der PD-Regelung tritt dieses Problem, wie oben gesehen, nicht auf.
Das linearisierte Kontrollsystem lsst sich in der Form
_ r(t) = r(t) +1n(t)
mit
r =
_
r
1
r
2
_
. =
_
0 1
1 0
_
. 1 =
_
0
1
_
schreiben. Kontrollsysteme dieser Form mit konstanten Matrizen Rn
a
und 1 R
an
heien lineare autonome (oder zeitinvariante) Kontrollsys-
teme von endlicher Dimension in stetiger Zeit (dies bedeutet implizit, das
es auch nichtlineare und nichtautonome Kontrollsysteme und solche von un-
endlicher Dimension und solche in diskreter Zeit gibt). In dieser Vorlesung
werden wir uns mit linearen und nichtlinearen Kontrollsystemen der Form
_ r(t) = ,(r(t). n(t))
von endlicher Dimension beschftigen. Fr das obige lineare Kontrollsystem
haben wir ein Feedback der Form
n = 1r =
_
c ,
_
_
r
1
r
2
_
konstruiert. Einsetzen in das open-loop System _ r = r + 1n ergibt das
closed-loop oder Feedback-System
_ r = ( +11)r.
Bei geeigneter Wahl von 1 haben alle Eigenwerte, also die Nullstellen des
charakteristischen Polynoms

+11
(.) = det[.1 ( +11)].
negative Realteile. Dies garantiert, dass alle Lsungen fr t gegen 0
laufen.
7
Dies fhrt auf das allgemeine Problem:
Gegeben seien Matrizen R
aa
und 1 R
an
; charakterisiere die mglichen
Mengen von Eigenwerten, wenn 1 alle Matrizen in R
na
durchluft.
Der fr die lineare Systemtheorie zentrale Polverschiebungsatz, lst dieses
Problem.
Hug ist nicht der gesamte Zustand des Systems einer Messung zugng-
lich und damit fr ein Feedback verwendbar. Whrend das PD-Feedback fr
das invertierte Pendel zum Beispiel den gesamten Zustand r = (r
1
. r
2
) =
(0.
_
0) des Systems verwendet, benutzt das 1-Feedback nur r
1
= 0. Deniert
man hier
C : R
2
R,
_
r
1
r
2
_
r
1
, also in Matrizendarstellung C =
_
1 0
_
.
so erhlt man ein lineares System mit Output
_ r = r +1n. = Cr.
Eine lineares Feedback der Form
n = 1 = 1Cr mit einer Matrix 1 der entsprechenden Dimension,
wird als statisches Output-Feedback bezeichnet. Feedbacks dieser Form sind
meist nicht geeignet (wie oben gesehen), das Stabilisierungsproblem zu l-
sen. Stattdessen fhrt jedoch hug ein dynamisches Output-Feedback zum
Erfolg: Man benutzt eine Dierentialgleichung (einen dynamischen Beobach-
ter), um aus dem Output den Zustand zu schtzen, und verwendet dann
diese Schtzung im Feedback. Diese Konstruktion ist sogar ntzlich, wenn
alle Zustandsvariablen im Feedback zur Verfgung stehen, jedoch Strungen
auf das System wirken. Als Illustration soll wieder das linearisierte invertierte
Pendel dienen, auf das eine konstante additive Strung (zum Beispiel Wind)
d(t) = c R wirkt:

0(t) 0(t) = n(t) +c.


Eine PD-Kontrolle
n = c0 ,
_
0. c. , 0,
stabilisiert das System fr c = 0. Ist jedoch c ,= 0, so gilt fr keine Lsung
des Feedback-Systems

0(t) 0(t) +c0(t) +,


_
0(t) = c,
8 KAPITEL 1. EINLEITUNG
dass 0(t) 0 fr t . Dies liest man aus der Lsungsformel fr diese
Gleichung ab: Mit r = (r
1
. r
2
)
T
= (0.
_
0)
T
ist
_ r
1
(t) = r
2
(t)
_ r
2
(t) = (1 c)r
1
,r
2
.
das heit
_
_ r
1
_ r
2
_
=
_
0 1
1 c ,
__
r
1
r
2
_
+
_
c
0
_
oder
_ r = Gr + c
mit
G =
_
0 1
1 c ,
_
. c =
_
0
c
_
.
Die Variation-der-Parameter-Formel liefert
r(t) = c
Gt
r(0) +
_
t
0
c
G(tc)
c d:.
Da das obige PF-Feedback das homogene System stabilisiert, gilt
c
Gt
r(0) 0 fr t .
Weil aber die zweite Komponente von
_
t
0
c
G(tc)
d: fr t nicht gegen 0
geht (warum?), konvergiert auch r(t) nicht gegen 0. Zur Konstruktion eines
Feedbacks, das die Strung c kompensiert, fassen wir c als eine zustzliche
(nicht messbare) Zustandsvariable auf, die durch die triviale Dierentialglei-
chung _ c = 0 beschrieben wird. Das open-loop-System hat also die Form
_ c(t) = 0.
_ r
1
(t) = r
2
(t).
_ r
2
(t) = r
1
(t) +c(t) +n(t).
Nach den obigen Bemerkungen liegt es dann nahe, ein dynamisches Zustands-
feedback zu verwenden. Whle mit c. ,. j R als Feedback
n = cr
1
,r
2
jr
0
.
wobei r
0
eine Lsung von
_ r
0
= r
1
9
ist. In der Tat gibt es Zahlen c. ,. j R, so dass fr alle c R die Lsungen
von
_ r
0
(t) = r
1
(t).
_ r
1
(t) = r
2
(t).
_ r
2
(t) = jr
0
(t) + (1 c)r
1
(t) ,r
2
(t) +c
fr t gegen (
c
j
. 0. 0) konvergieren. Die Komponenten r
1
= 0 und r
2
=
_
0
konvergieren, wie gewnscht, fr t also gegen 0. In den ursprnglichen
Variablen ist die Kontrolle gegeben durch
n(t) = c0 ,
_
0 j
_
t
0
0(:) d:
Dies ist auch als PID-Regler (proportional-integral-derivative) bekannt, der
in Anwendungen von Ingenieuren am hugsten verwendete Regler. Teil die-
ses Reglers ist die Dierentialgleichung _ r
0
= r
1
.
10 KAPITEL 1. EINLEITUNG
Kapitel 2
Lineare Kontrollsysteme
In diesem Kapitel werden Kontrollierbarkeitseigenschaften fr die einfachste
Klasse von Kontrollsystemen, lineare Kontrollsysteme, analysiert. Im ers-
ten Abschnitt werden wir keine Beschrnkungen an die Kontrollfunktionen
fordern, so dass wir mit Hilfsmitteln der linearen Algebra auskommen. Im
zweiten Abschnitt werden wir den Wertebereich der Kontrollfunktionen ein-
schrnken und den wichtigen Begri der Kontrollmengen einfhren.
Lineare Kontrolltheorie ist ein riesiges mathematisches Gebiet, mit hoher
Anwendungsrelevanz in den Ingenieurwissenschaften. Es wird im Folgenden
nur gestreift. Mehr Einsicht kann man zum Beispiel in Sontag [19] gewinnen.
2.1 Kontrollierbarkeit bei unbeschrnkten Kon-
trollen
Die einfachsten Kontrollsysteme sind lineare Systeme. Sie haben die Form
_ r(t) = r(t) +1n(t) (2.1)
mit Matrizen R
aa
. 1 R
an
; die Funktionen n : R R
n
heien
Kontroll- oder Steuerfunktionen, und knnen frei in einer Menge | zulssiger
Kontrollfunktionen gewhlt werden. Von Interesse ist zunchst das Verhalten
des Systems unter beliebigen Kontrollfunktionen. Die Punkte r R
a
werden
als Zustnde des Systems bezeichnet.
Natrlich kann man und 1 auch als lineare Abbildungen auf R
a
bzw.
von R
n
nach R
a
auassen.
Die Lsungen ,(t. t
0
. r
0
. n) von (2.1) zum Anfangswert r(t
0
) = r
0

R
a
sind (nach der Variation der Konstanten-Formel oder wie man leicht
11
12 KAPITEL 2. LINEARE KONTROLLSYSTEME
nachrechnet) gegeben durch
,(t. t
0
. r
0
. n) = c
(tt
0
)
r
0
+
_
t
t
0
c
(tc)
1n(:) d:. t R. (2.2)
Dieses Integral ist natrlich nicht fr alle Funktionen n : R R
n
wohlde-
niert. Oenbar reicht es, dass sie Lebesgue-integrierbar auf jedem Intervall
[0. t] sind. Dann ist auch das Produkt mit der beschrnkten, stetigen Funkti-
on c
(tc)
1. : [0. t], Lebesgue-integrierbar. Manchmal verlangt man auch
mehr Regularitt, zum Beispiel, dass sie stetig, stckweise stetig, stckweise
konstant, oder unendlich oft dierenzierbar sind.
Standardvoraussetzungen an die Kontrollfunktionen sind, dass | einer
der folgenden Funktionenrume ist:
1
1,|cc
(R. R
n
) = n : R R
n
. auf jedem kompakten Intervall integrierbar
1
o
(R. R
n
) = n : R R
n
. essentiell beschrnkt
1
o,|cc
(R. R
n
) = n : R R
n
. auf jedem komp. Intervall ess. beschrnkt
C
jc
(R. R
n
) = n : R R
n
. n ist stckweise stetig
Die Funktionen in 1
1,|cc
nennt man auch lokal integrierbar. Man beachte,
dass die Wahl von | = 1
1
(R. R
n
bezglich des Verhaltens fr [t[
einschrnkend ist. Natrlich kann man auch weitere Anforderungen an die
Kontrollfunktionen stellen, zum Beispiel, dass ihre Werte in einer vorgegebe-
nen Menge l R
n
liegen, also n(t) l fr fast alle t R (zum Beispiel
[n(t)[ _ 1). Wir werden diese Situation spter diskutieren (dies fhrt jedoch
schon ber den Bereich der linearen Kontrolltheorie hinaus, die zunchst nur
eine Theorie fr Matrizenpaare (. 1) ist).
Wir werden in diesem Kapitel, soweit nichts anderes gesagt wird,
| = C
jc
(R. R
n
)
whlen. Es wird sich herausstellen, dass dabei nichts Wesentliches verloren
geht.
Ist in (2.2) die Anfangszeit t
0
= 0, so bezeichnen wir die Lsung (oder
Trajektorie) auch hug mit ,(t. r
0
. n). t R. Oenbar gilt wegen (2.2)
(setze im Integral : := : t
0
)
,(t. t
0
. r
0
. n) = c
(tt
0
)
r
0
+
_
t
t
0
c
(tc)
1n(:) d:
= c
(tt
0
)
r
0
+
_
tt
0
0
c
(tc)
1n(: +t
0
) d:
= ,(t t
0
. r
0
. n( +t
0
)).
2.1. KONTROLLIERBARKEITBEI UNBESCHRNKTENKONTROLLEN13
mit der verschobenen Kontrollfunktion n( + t
0
))(:) = n(: + t
0
)). :
t
=
n(: +t
0
) . : R.
Eine grundlegende Frage an Kontrollsysteme sind Kontrollierbarkeits-
oder Erreichbarkeitsfragen: Gegeben ein Startpunkt r
0
, welche Punkte r
1

R
a
kann man mit zulssigen Kontrollfunktionen erreichen?
Denition 1 Ein Zustand r
0
R
a
heit kontrollierbar (oder steuerbar)
nach r
1
R
a
zur Zeit 1 _ 0, falls eine Kontrolle n | existiert mit
,(1. r
0
. n) = r
1
. Der Zustand r
1
heit dann auch erreichbar von r
0
zur Zeit
1.
Wir denieren die Menge der Punkte, die von r
0
in der Zeit 1 erreichbar
sind, als
O
+
T
(r
0
) = r
1
R
a
. es gibt n | mit r
1
= ,(t. r
0
. n).
und die Menge der Punkte, die in der Zeit 1 nach r
1
gesteuert (oder kon-
trolliert) werden knnen, als
O

T
(r
1
) = r
0
R
a
. es gibt n | mit r
1
= ,(t. r
0
. n).
Oenbar ist r O
+
(r
0
) quivalent zu r
0
O

T
(r). Speziell schreiben wir in
diesem Kapitel auch
(1) = O
+
T
(0) und =
_
T0
(1);
((1) = O

T
(0) und ( =
_
T0
((1).
Von besonderem Interesse sind Systeme, bei denen jeder Punkt erreichbar
oder kontrollierbar ist. Diese werden wir jetzt charakterisieren. Zunchst zei-
gen wir das folgende einfache Lemma.
Lemma 2 Sei o 1 0. Dann gilt: (i) (1) (o); (ii)
_
(o) =
(1)
_
=
_
(1) = (t) fr alle t _ 1
_
(iii) (1) und sind Unterrume.
Beweis. (i) Fr (1) existiert n | mit = ,(1. 0. n). Deniere |
durch
(t) =
_
0 fr t [0. o 1)
n(t o +1) fr t [o 1. o]
Dann ist = ,(o. 0. ) (o). (man bleibt im Nullpunkt so lange wie
ntig sitzen.)
14 KAPITEL 2. LINEARE KONTROLLSYSTEME
(iii) Seien
1
.
2
(1). Dann existieren Kontrollen n
1
. n
2
| mit

i
= ,(1. 0. n) =
_
T
0
c
(Tc)
1n
i
(:) d: fr i = 1. 2
und damit (wegen der Linearitt in n)

1
+
2
=
_
T
0
c
(Tc)
1[n
1
(:) +n
2
(:)] d: = ,(t. 0. n
1
+n
2
).
Wegen der Linearitt in n gilt fr ` R, dass `
1
= ,(1.
1
. `n) (1).
Daher ist (1) ein Untervektorraum. Seien nun
1
.
2
. Mit (i) knnen
wir annehmen, dass
1
.
2
(1) fr ein 1 0, also
1
+
2
(1) .
(ii) Es gelte (o) = (1). Fr r (2o 1) existiert n | mit
r = ,(2o 1. 0. n) =
_
2ST
0
c
(2STc)
1n(:) d:.
Weil ,(o. 0. n) (o) = (1), existiert | mit
,(o. 0. n) = ,(1. 0. ) =
_
T
0
c
(Tc)
1(:) d:.
(wir sparen die Zeit o 1 ein.) Deniere n | durch
n(t) =
_
(t) fr t [0. 1)
n(t 1 +o) fr t [1. o]
.
Dann ist (wegen der Zeitinvarianz)
,(o. 0. n) =
_
T
0
c
(Sc)
1n(:) d: +
_
S
T
c
(Sc)
1n(:) d:
= c
(ST)
_
T
0
c
(Tc)
1(:) d: +
_
S
T
c
(Sc)
1n(: 1 +o) d:
= c
(ST)
_
T
0
c
(Sc)
1n(:) d: +
_
2ST
S
c
(2STc)
1n(:) d:
=
_
T
0
c
(2STc)
1n(:) d: +
_
2ST
S
c
(2STc)
1n(:) d:
= ,(2o 1. 0. n) = r
(hier haben wir ,(o. 0. n) = ,(1. 0. ) und die Transformation :
t
= :1 +o
verwendet). Daher ist r (o) und es folgt
(2o 1) = (o).
2.1. KONTROLLIERBARKEITBEI UNBESCHRNKTENKONTROLLEN15
Durch Induktion erhlt man (:o 1) = (o) fr alle : N. Mit (i) folgt
(t) = (o) fr alle t _ o.
Weil (1) ein linearer Unterraum von R
a
ist und (ii) in dem obigen
Lemma gilt, folgt (t) = fr alle t 0. Ferner ist = R
a
genau dann
wenn fr alle r
0
. r
1
R
a
und alle t 0 eine Kontrolle n | existiert mit
r
1
= ,(t. r
0
. n). In der Tat:
Betrachte r
1
,(t. r
0
. 0) R
a
= (t). Dann existiert n | mit
r
1
,(t. r
0
. 0) = ,(t. 0. n).
also
r
1
= ,(t. r
0
. 0) +,(t. 0. n) = ,(t. r
0
. n). (2.3)
Wir haben damit insbesondere gezeigt, dass hier
R
a
= O
+
t
(r
0
)
fr ein r
0
R
a
. t 0. genau dann gilt, wenn es fr alle r
0
R
a
und alle
t 0 gilt. Analoge Aussage gelten fr ((1) und ( sowie O

t
(r
0
).
Wir werden jetzt (t) charakterisieren.
Lemma 3 Sei \ R
a
ein linearer Unterraum und eine lineare Abbildung
auf R
a
. Dann ist der kleinste -invariante Unterraum, der \ enthlt, gegeben
durch
[ \ = \ +\ + ... +
a1
\ .
Beweis. Die Menge der -invarianten Unterrume, die \ enthalten, ist
nicht leer (R
a
ist solch ein Unterraum) und der Durchschnitt von solchen
Unterrumen ist wieder von diesem Typ, also existiert der kleinste Unter-
raum von diesem Typ. Wegen der Invarianz folgt
I
\ [ \ fr alle
/ N, und daher gilt \ . Fr die Umkehrung ist nur zu zeigen, dass
\ + \ + ... +
a1
\ invariant ist. Das charakteristische Polynom

ist

(.) = det(.1 ) = .
a
+c
a1
.
a1
+... +c
1
. +c
0
mit Koezienten c
i
R. Nach dem Satz von Cayley-Hamilton ist

() =
a
+c
a1

a1
+... +c
1
+c
0
1 = 0.
und daher

a
= c
a1

a1
... c
1
c
0
1.
Daraus folgt die Invarianz von \ +\ + ... +
a1
\.
16 KAPITEL 2. LINEARE KONTROLLSYSTEME
Deniere fr t 0 eine Matrix in R
aa
durch
\
t
=
_
t
0
c
t
11
T
c

T
t
dt
(hierbei bedeutet
T
Transposition einer Matrix). Diese Abbildung ist sym-
metrisch und positiv semidenit, weil fr r R
a
r
T
\
t
r =
_
t
0
r
T
c
t
11
T
c

T
t
r dt =
_
t
0

1
T
c

T
t
r

2
dt.
wobei [[ die euklidische Norm bezeichnet.
Lemma 4 Fr alle t 0 ist [ Im1 = Im\
t
.
Beweis. Die Behauptung ist dazu quivalent, dass fr die orthogonalen Kom-
plemente gilt: [ Im1
l
= [Im\
t
]
l
.
: Sei r [ Im1
l
. Dann ist r
T

I
1 = fr alle / = 0. 1. ... und
daher
r
T
c
t
1 =
o

I=0
1
/!
r
T

I
1 = 0 fr alle t _ 0.
Dann folgt r
T
\
t
= 0, also r [Im\
t
]
l
. : Sei r [Im\
t
]
l
fr ein
t 0. Dann ist
0 = r
T
\
t
r =
_
t
0

1
T
c

T
t
r

2
dt.
und daher
r
T
c
t
1 fr alle t _ 0. (2.4)
Insbesondere ist fr t = 0
r
T
1 = 0.
Sukzessives Dierenzieren in (2.4) und Auswerten in t = 0 liefert
r
T
1 = 0
r
T

2
1 = 0
...
r
T

a1
1 = 0.
Insgesamt folgt, dass r senkrecht auf Im1 + Im1 + ... +
a1
Im1 =
[ Im1 steht.
Der nchste Satz charakterisiert die Erreichbarkeitsmenge vom Ursprung.
2.1. KONTROLLIERBARKEITBEI UNBESCHRNKTENKONTROLLEN17
Satz 5 Fr das System (2.1) gilt
= ( = Im[11...
a1
1] = [ Im1
Beweis. Die letzte Gleichung folgt aus Lemma 3. Wir zeigen nur (t) =
[ Im1, die Behauptung fr ( folgt analog. : Fr r gibt es n |
und t 0 mit r = ,(t. 0. n). Fr alle t [0. t] ist
c
(Tt)
1n(t) =
o

I=0
1
/!

I
1n(t) [ Im1 ,
also auch (beachte die Denition des Integrals!)
r =
_
t
0
c
(Tt)
1n(t) dt [ Im1 ,
: Sei r [ Im1. Nach Lemma 4 existiert . R
a
mit
r = \
t
. =
_
t
0
c
t
11
T
c

T
t
. dt.
Fr eine Kontrolle n | mit
n(t) = 1
T
c

T
t
. fr t [0. t]
ist dann
,(t. 0. n) =
_
t
0
c
t
1n(t) dt =
_
t
0
c
t
11
T
c

T
t
dt .
= r.
also r (t).
Das folgende Korollar charakterisiert vollstndige Kontrollierbarkeit di-
rekt mit Hilfe der Matrizen und 1.
Korollar 6 (Kalman-Kriterium) Fr das System (2.1) gilt = R
a
ge-
nau dann, wenn der Rang der Erreichbarkeitsmatrix [11...
a1
1] gleich
: ist. Das System (und auch das Matrizenpaar (. 1)) heit dann vollstndig
kontrollierbar.
Beispiel 7 Die Gleichung des linearisierten Pendels (mit Dmpfung / _ 0)
ist
,(t) / _ ,(t) ,(t) = n(t)
18 KAPITEL 2. LINEARE KONTROLLSYSTEME
oder mit r
1
= ,, r
2
= _ ,
_
_ r
1
_ r
2
_
=
_
0 1
1 /
__
r
1
r
2
_
+
_
0
1
_
n(t)
Die Erreichbarkeitsmatrix mit : = 2
[11] =
_
0 1
1 o
_
hat den Rang 2, das System ist also vollstndig kontrollierbar.
Bemerkung 8 Die vorangegangenen Beweise lassen sich genauso fhren,
wenn an Stelle von stetigen Kontrollfunktionen lokal integrierbare Kontroll-
funktionen erlaubt sind. Insbesondere bleibt die Charakterisierung von Er-
reichbarkeitsmengen in Theorem 5 gltig.
2.2 Lineare Systeme mit beschrnkten Kon-
trollen
In diesem Abschnitt betrachten wir lineare Systeme mit Kontrollbeschrn-
kungen von folgendem Typ:
_ r = r +1n(t) in R
a
. (2.5)
n | = n : R l. messbar.
wobei l R
n
konvex und kompakt ist mit 0 int l und und 1 wie in
(2.1) sind. Die Bezeichnungen fr Erreichbarkeitsmengen etc. aus dem letzten
Abschnitt bernehmen wir entsprechend fr dieses System. Wir nehmen in
diesem ganzen Abschnitt an, dass (. 1) kontrollierbar ist, das heit, die
Kalman-Bedingung rg [1. 1. ...
a1
1] = : gilt. Ist dies nicht erfllt, so
knnen wir in dem Kontrollierbarkeitsunterraum
[ Im 1 = Im[1. 1. ...
a1
1]
arbeiten. Beispiel 7 (mit / 0) berzeugt uns rasch, dass wir hier im all-
gemeinen keine vollstndige Kontrollierbarkeit erwarten knnen. Stattdessen
betrachten wir die folgendermaen denierten Teilmengen vollstndiger (ap-
proximativer) Kontrollierbarkeit.
2.2. LINEARE SYSTEME MIT BESCHRNKTEN KONTROLLEN 19
Abbildung 2.1: Phasenportrts fr n = +1 und n = 1.
Denition 9 Eine Teilmenge 1 des Zustandsraums R
a
heit Kontrollmen-
ge, falls gilt: (i) fr alle r 1 gibt es n | mit ,(t. r. n) 1 fr alle
t _ 0; (ii) fr alle r 1 ist 1 clO
+
(r); und 1 ist maximal mit diesen
Eigenschaften.
Die Maximalittsbedingung bedeutet, dass jede Obermenge 1
t
1, die
die Eigenschaften (i) und (ii) erfllt, mit 1 bereinstimmt.
Beispiel 10 Betrachte das zwei-dimensionale lineare Kontrollsystem
_
_ r
_
_
=
_
1 0
0 1
__
r

_
+
_
1
1
_
n(t). n(t) l = [1. 1].
Die Lsungen sind
_
r(t)
(t)
_
=
_
c
t
r
0
c
t

0
_
+
_
t
0
n(:)
_
c
tc
c
ct
_
d:.
Man sieht leicht (siehe Figur 2.1), dass hier eine eindeutige Kontrollmenge
1 existiert, und dass sie durch
D = (1. 1) [1. 1]
gegeben ist.
20 KAPITEL 2. LINEARE KONTROLLSYSTEME
Wir diskutieren zunchst die folgende grundlegende Eigenschaft von Er-
reichbarkeitsmengen.
Denition 11 Das System (2.5) heit lokal akzessibel in r, falls fr alle
1 0 gilt:
intO
+
T
(r) ,= O und intO

T
(r) ,= O.
Ist dies fr alle r R
a
erfllt, so heit das System lokal akzessibel.
Die folgende Proposition zeigt, dass lokale Akzessibilitt schon durch die
Matrizen und 1 bestimmt ist.
Proposition 12 Fr das System (2.5) gilt intO
+
T
(r) ,= O fr ein 1 0 und
ein r R
a
(und dann fr alle) genau dann, wenn die Kalman-Bedingung
gilt. quivalent dazu ist die lokale Akzessibilitt.
Beweis. Es gelte die Kalman-Bedingung. Betrachte fr 1 0 die stetige
lineare Abbildung zwischen Banachrumen,
1 : 1
o
([0. 1]. R
n
) R
a
: n ,(1. 0. n).
Die Linearitt ist klar, und die Stetigkeit folgt aus
[,(1. 0. n)[ =

_
T
0
c
(tc)
1n(:) d:

_
_
T
0

c
(tc)
1n(:)

d:
_ sup
t[0,T]

c
t

[1[ 1 [n[
o
.
Diese Abbildung ist nach Satz 5 surjektiv. Das Open-Mapping-Theorem
(siehe ein beliebiges Buch ber Funktionalanalysis) besagt, dass solch ei-
ne Abbildung oene Mengen auf oene Mengen abbildet. Weil intl ,= O, hat
|
[0,T]
:= n 1
o
([0. 1]. R
n
). n(t) l fr fast alle t [0. 1] nichtleeres
Inneres. Nun ist wegen der Linearitt (vgl. (2.3))
O
+
T
(r) = R
a
. = ,(1. r. n) fr ein n |
= R
a
. = ,(1. r. 0) +,(1. 0. n) fr ein n |
= ,(1. r. 0) +1(n). n |.
Also hat O
+
T
(r) nichtleeres Inneres. Analog argumentiert man fr O

T
(r).
Umgekehrt, gilt lokale Akzessibilitt, so hat die Erreichbarkeitsmenge vom
Ursprung nichtleeres Inneres. Daraus folgt die Kalman-Bedingung (ist sie
verletzt, so ist O
+
T
(0) in einem echten Unterraum enthalten).
Bei lokaler Akzessibilitt gilt sogar exakte Kontrollierbarkeit im Innern
von Kontrollmengen.
2.2. LINEARE SYSTEME MIT BESCHRNKTEN KONTROLLEN 21
Proposition 13 Das System (2.5) sei lokal akzessibel, und 1 sei eine Kon-
trollmenge mit nichtleerem Innern. Dann gilt
int1 O
+
(r) fr alle r 1.
Beweis. Sei r 1. Wegen der lokalen Akzessibilitt von int 1 und der
Beschrnktheit von l, ndet man t 0 so dass O ,= int O

t
() int 1.
Whle . int O

t
() . Wegen . clO
+
(r) ndet man einen Punkt .
0

O

t
() O
+
(r). Daher gibt es o. 1 0 und Kontrollen n. | mit
,(o. r. n) = .
1
und ,(1. .
1
. ) = . Die Verknpfung
n(t) =
_
n(t) fr t [0. o]
(t o) fr t (o. 1 +o]
liefert ,(o +1. r. n) = , also O
+
(r).
Wir bemerken auch die folgende Eigenschaft.
Proposition 14 Das System (2.5) sei lokal akzessibel, und 1 sei eine Kon-
trollmenge mit nichtleerem Innern. Dann ist 1 = clO
+
(r)O

(r) fr jedes
r int1.
Beweis. Der Durchschnitt clO
+
(r) O

(r) ist in 1 enthalten: fr jedes


. clO
+
(r) O

(r) existiert n | und 1 _ 0 mit r = ,(1. .. n), also


gibt es eine Steuerung, so dass die zugehrige Trajektorie von . in 1 bleibt;
dies zeigt zugleich, dass jeder Punkt von 1 approximativ von . erreichbar
ist. Ferner ist . von r approximativ erreichbar, d.h. . clO
+
(r). Dann ist
. clO
+
() fr jedes 1: steuere von zunchst nach r und dann
approximativ nach ..
Fr die umgekehrte Inklusion whle r int1 und betrachte 1.
Dann ist clO
+
(r) nach der Denition von Kontrollmengen. Ferner folgt
r O
+
() nach der vorangehenden Proposition, also O

(r).
Der nchste Satz charakterisiert Kontrollmengen fr lineare Kontrollsys-
teme mit beschrnkten Kontrollen. Der Vollstndigkeit halber sind alle vor-
angegangenen Annahmen noch einmal aufgefhrt.
Satz 15 Fr das System (2.5) sei l R
n
konvex und kompakt mit 0 int l
und (. 1) sei kontrollierbar ist, das heit, die Kalman-Bedingung rg [1. 1.
...
a1
1] = : gilt. Dann gibt es genau eine Kontrollmenge 1 mit nichtleerem
Innern; sie enthlt 0 im Innern und 1 = clO
+
(0) O

(0).
Die Kontrollmenge 1 ist invariant, falls asymptotisch stabil ist; in
diesem Fall ist 1 = clO
+
(0), insbesondere ist 1 also abgeschlossen.
22 KAPITEL 2. LINEARE KONTROLLSYSTEME
Beweis. Die Kalman-Bedingung garantiert, dass zur Zeit 1 = 1 der po-
sitive und der negative Orbit des Systems ohne Kontrollbeschrnkung mit
R
a
bereinstimmen. Wegen 0 int l liefert das Open-Mapping Theorem,
angewendet auf die lineare Abbildung
1
o
([0. 1]. R
n
) R
a
: n ,(1. 0. n).
dass 0 int O
+
1
(0). Wegen 0 = ,(1. 0. 0) mit 0 int| und
O

1
(0) = r R
a
. c

r +
_
t
0
c
(1c)
n(:) d: = 0 fr ein n |
folgt sogar 0 int O
+
1
(0) int O

1
(0). Draus folgt leicht, dass 0 im Innern
einer Kontrollmenge 1 liegt. Nach Proposition 14 ist die Kontrollmenge 1 =
clO
+
(0) O

(0).
Ist asymptotisch stabil, so ist O

(0) = R
a
(denn Lsungen mit n = 0
von einem beliebigen Anfangspunkt erreichen fr t jede Umgebung des
Ursprungs, also auch 1 und dann auch 0 int1). Es folgt, dass 1 = clO
+
(0)
und wegen 0 int1 sieht man, dass 1 = clO
+
(r) fr alle r 1.
Es bleibt zu zeigen, dass die Kontrollmenge eindeutig ist. Sei also 1
t
eine
beliebige Kontrollmenge mit nichtleerem Innern und r int1
t
. Betrachte ei-
ne Umgebung ` int1
t
von r. Wegen exakter Kontrollierbarkeit im Innern
von Kontrollmengen gibt es fr alle ` Kontrollen n. | und Zeiten
o. 1 0 mit
,(o. r. n) = und ,(1. . ) = r.
Die Linearitt impliziert, dass auch c` eine Umgebung von cr ist, so dass
fr alle Punkte in c` (die von der Form c. ` sind) gilt
,(o. cr. cn) = und ,(1. c. c) = r.
Dabei sind cn und c in |, weil l konvex ist mit 0 l. Daher sind alle
Punkte cr. c (0. 1). im Innern einer Kontrollmenge. Dann mssen diese
Kontrollmengen alle mit der Kontrollmenge um den Ursprung bereinstim-
men. Das ist sicherlich richtig fr kleine c 0. Deniere c
0
:= supc
0. cr int1. Dann ist c
0
r im Abschluss von 1. Weil c
0
r im Innern ei-
ner Kontrollmenge liegt, hat diese Kontrollmenge nichtleeren Schnitt mit 1,
stimmt also mit 1 berein. Es folgt c
0
= 1.
Bemerkung 16 Das wesentliche Argument im Beweis der Eindeutigkeit ist
die Konstruktion einer stetigen Familie von Punkten, die jeweils im Innern
einer Kontrollmenge liegen. Daraus folgt, dass diese Kontrollmengen schon
bereinstimmen.
2.3. FEEDBACK-STABILISIERUNG 23
Bemerkung 17 Mit hnlichen Argumenten wie oben kann man auch zeigen,
dass es nur eine Kontrollmenge gibt (also auch keine weitere Kontrollmenge,
die leeres Inneres hat).
2.3 Feedback-Stabilisierung
In diesem Abschnitt werden wir (fr Systeme ohne Kontrollbeschrnkungen)
analysieren, wann Feedbacks existieren, unter denen ein Gleichgewicht stabil
wird. Zunchst diskutieren wir die Linearisierung an einem Gleichgewicht.
Dann konstruieren wir stabilisierende Feedbacks fr lineare Kontrollsysteme.
Aus der Theorie gewhnlicher Dierentialgleichungen ist folgendes be-
kannt: Betrachte eine nichtlineare Dierentialgleichung
_ (t) = ,((t)) mit einer C
1
Funktion ,.
und nimm an, dass Lsungen ,
t
(
0
) zu Anfangswerten (0) =
0
fr alle
Zeiten t R existieren. Sei
+
R
a
ein Gleichgewicht, also ,(
+
) = 0. Dann
gilt fr t R und :=
0
0j
,(
+
)
J
J
,
t
(
+
)r
0
= c
t
r
0
.
d.h. die Ableitung der Lsung nach dem Anfangswert in Richtung r
0
ist die
Lsung der linearisierten Dierentialgleichung
_ r = r mit Anfangswert r(0) = r
0
.
Ferner ist
+
lokal exponentiell stabil ist, wenn das Gleichgewicht r
+
= 0
ihrer Linearisierung global exponentiell stabil ist, also wenn alle Eigenwerte
von negativen Realteil haben; siehe dazu z.B. Aulbach [2].
Ein allgemeines nichtlineares Kontrollsystem ist gegeben durch die Die-
rentialgleichung
_ (t) = ,((t). n(t)) (2.6)
mit , : R
a
R
n
R
a
. Wir nehmen an, dass fr n
+
= 0 der Punkt
+
= 0 ein
Gleichgewicht ist, d.h., ,(0. 0) = 0. Ferner sei die Abbildung , in (
+
. n
+
) =
(0. 0) sowohl nach als auch nach n stetig dierenzierbar. Dann knnen wir
die Linearisierung denieren als
_ r(t) = r(t) +1n(t) (2.7)
mit
=
J
J

(j,&)=(0,0)
,(. n). 1 =
J
Jn

(j,&)=(0,0)
,(. n).
24 KAPITEL 2. LINEARE KONTROLLSYSTEME
Das folgende Lemma zeigt, wie diese Linearisierungen von Dierentialglei-
chungen und Kontrollsystemen fr lineares Feedback 1 zusammenhngen.
Lemma 18 Betrachte ein nichtlineares Kontrollsystem (2.6) und seine Li-
nearisierung (2.7) im Gleichgewicht (0. 0). Sei 1 : R
a
R
n
eine lineare
Abbildung. Dann ist die lineare Dierentialgleichung
_ r(t) = ( +11)r(t)
die Linearisierung in
+
= 0 der nichtlinearen Dierentialgleichung
_ (t) = ,((t). 1(t)).
Beweis. Wir mssen nachweisen, dass
d
d

j=0
,(. 1) = +11
gilt. Sei dazu G : 1
a
1
a
1
n
gegeben durch G() = (. 1), wobei wir
(. 1) als (: + :)dimensionalen Spaltenvektor interpretieren. Dann folgt
nach der Kettenregel
d
d
,(. 1) =
d
d
,(G())
=
J
J

(j,&)=G(j)
,(. n) +
J
Jn

(j,&)=G(j)
,(. n)1.
Also ist in = 0
d
d

j=0
,(. 1) =
J
J

(j,&)=(0,0)
,(. n) +
J
Jn

(j,&)=(0,0)
,(. n)1 = +11.
Damit erhalten wir das folgende lokale Stabilisierungsresultat.
Satz 19 Ein nichtlineares Kontrollsystem (2.6) ist durch ein lineares Feed-
back lokal exponentiell stabilisierbar , wenn seine Linearisierung (2.7) durch
ein lineares Feedback global exponentiell stabilisierbar ist. Darberhinaus ist
das Gleichgewicht
+
= 0 der Gleichung
_ = ,((t). 1(t))
lokal exponentiell stabil fr jedes lineare Feedback 1, das das Stabilisierungs-
problem fr das linearisierte System lst.
2.3. FEEDBACK-STABILISIERUNG 25
Aus der linearen Struktur des Feedbacks 1 ergibt sich also, dass wir
nichtlineare Stabilisierungsprobleme lokal lsen knnen, indem wir lineare
Stabilisierungsprobleme lsen. Wir wenden uns der Stabilisierung linearer
Kontrollsysteme zu und beginnen mit einem Beispiel.
Beispiel 20 Wir betrachten ein (sehr einfaches) Modell fr eine Heizungs-
regelung. Nehmen wir an, dass wir die Temperatur r
1
in einem Raum an
einem festgelegten Messpunkt regeln wollen. Der Einfachheit halber sei die
gewnschte Temperatur auf r
1
= 0 normiert. In dem Raum bendet sich
ein Heizkrper mit Temperatur r
2
, auf die wir mit der Kontrolle n Einuss
nehmen knnen. Die Vernderung von r
2
sei durch die Dierentialgleichung
_ r
2
(t) = n(t)
beschrieben, d.h. die Kontrolle n regelt die Zunahme (falls n 0) bzw. Ab-
nahme (falls n < 0) der Temperatur. Fr die Temperatur r
1
im Messpunkt
nehmen wir an, dass sie der Dierentialgleichung
_ r
1
(t) = r
1
(t) +r
2
(t)
gengt, d.h. fr konstante Heiztemperatur r
2
ergibt sich
r
1
(t) = c
t
r
1
(0) + (1 c
t
)r
2
Mit anderen Worten, wir nehmen an, dass die Raumtemperatur r
1
im Mess-
punkt exponentiell gegen die Temperatur des Heizkrpers konvergiert. Aus
diesem Modell erhalten wir das Kontrollsystem
_ r(t) =
_
1 1
0 0
_
r(t) +
_
0
1
_
n(t).
Eine naheliegende Regelstrategie ergibt sich nun wie folgt: Falls r
1
r
+
1
= 0
ist, so vermindern wir die Temperatur in r
2
, d.h., wir whlen n < 0. Im
umgekehrten Fall, d.h. falls r
1
< r
+
1
= 0 ist, erhhen wir die Temperatur und
setzen n 0. Da unser Feedback linear sein soll, lsst sich dies durch die
Wahl 1(r) = `r
1
fr ein ` 0 erreichen, oder, in MatrixSchreibweise,
1(r) = (`. 0) (hier ist : = 2 und : = 1). Damit erhalten wir das rckge-
koppelte System
_ r(t) =
_
1 1
` 0
_
r(t).
Berechnet man die Eigenwerte fr ` 0, so sieht man, dass alle Realteile
negativ sind. Wir haben also das Stabilisierungsproblem gelst und folglich
26 KAPITEL 2. LINEARE KONTROLLSYSTEME
konvergieren r
1
(t) und r
2
(t) fr alle Anfangswerte exponentiell schnell ge-
gen 0, insbesondere konvergiert r
1
exponentiell schnell gegen die gewnschte
Temperatur r
+
1
= 0. Falls wir die Temperatur r
2
am Heizkrper messen kn-
nen, so knnen wir auch 1(r) = `r
2
, bzw. 1 = (0. `) setzen. Wiederum
sieht man durch Betrachtung der Eigenwerte, dass das rckgekoppelte System
fr alle ` 0 exponentiell stabil ist.
Wir werden zunchst zwei ntzliche Koordinatentransformationen fr
Kontrollsysteme betrachten. Beachte, dass fr eine Transformationsmatrix
1 R
aa
das zu
_ r(t) = r(t) +1n(t) (2.8)
gehrige transformierte System fr . = 1r
_ .(t) =
~
.(t) +
~
1n(t) (2.9)
durch

= 1
1
1 und

1 = 1
1
1 gegeben ist. Ein Feedback 1 fr (2.8) wird
mittels

1 = 11 in eines fr (2.9) transformiert (dies folgt sofort aus 1
1
(+
11)1 =

+

1

1). Aus der Erreichbarkeitsmatrix 1 = [1. 1. ....


a1
1]
fr (2.8) erhlt man die Erreichbarkeitsmatrix

1 = 1
1
1 fr (2.9). Das
folgende Lemma zeigt, dass man fr beliebige MatrixPaare (. 1) durch
eine geeignete Koordinatentransformation erreichen kann, dass das System
in einen kontrollierbaren und einen nichtkontrollierbaren Anteil zerlegt wird.
Lemma 21 Es sei (. 1) R
aa
R
an
. Dann gibt es eine Koordinaten-
transformation 1, so dass
~
= 1
1
1 =
_

1

2
0
3
_
und
~
1 = 1
1
1 =
_
1
1
0
_
mit
1
R
aa
und 1
1
R
an
ist und (
1
. 1
1
) kontrollierbar ist.
Beweis. Dies folgt mit Standardargumenten der linearen Algebra, wenn man
eine Basis des Erreichbarkeitsunterraums C
+
(0) = = [Im1 vom Ur-
sprung zu einer Basis von R
a
ergnzt und die Spalten von 1 als diese Basis-
vektoren deniert.
Die zweite Koordinatentransformation, die wir betrachten wollen, gilt fr
kontrollierbare Systeme, bei denen n eindimensional ist, also : = 1.
2.3. FEEDBACK-STABILISIERUNG 27
Lemma 22 Ein Paar (. 1) R
aa
R
a1
ist genau dann kontrollierbar,
wenn es eine Koordinatentransformation o in die sogenannte Regelungsnor-
malform gibt,
~
= o
1
o =
_
_
_
_
_
_
_
_
0 1 . . . 0
. . . .
. . . .
. . . .
0 0 . . . 1
c
0
c
1
. . . c
a1
_
_
_
_
_
_
_
_
und
~
1 = o
1
1 =
_
_
_
_
_
_
_
_
0
.
.
.
0
1
_
_
_
_
_
_
_
_
;
hierbei sind die c
i
die Koezienten des charakteristischen Polynoms

von
, d.h.,

(.) = .
a
c
a1
.
a1
... c
1
. c
0
.
Beweis. Wir zeigen zunchst, dass fr Matrizen

der angegebenen Form
die c
i
gerade die Koezienten des charakteristischen Polynoms sind. Dies
folgt durch Induktion ber :: Fr : = 1 ist die Behauptung sofort klar. Fr
den Induktionsschritt sei
a
R
aa
von der Form des Satzes und
a+1

R
(a+1)(a+1)
gegeben durch

a+1
=
_
_
_
_
_
0 1 0
0
.
.
.
a
c
+
_
_
_
_
_
.
Entwickeln wir nun det(.1
a+1
) nach der ersten Spalte, so ergibt sich

n+1
(.) = .

n
(.) c
+
(1)
a+1
det diag(1. .... 1)
= .

n
(.) c
+
= .
a
c
a2
.
a1
c
0
. c
+
.
also nach Umnumerierung der c
i
gerade der gewnschte Ausdruck.
Es existiere eine Transformation o mit den angegebenen Eigenschaften.
Durch Nachrechnen sieht man leicht, dass

1 = (

1 . . .

a1

1) =
_
_
_
_
0 0 1
0 .
.
:
+
0 1 + +
1 + +
_
_
_
_
(2.10)
gilt, wobei + beliebige Werte bezeichnet. Diese Matrix hat vollen Rang, denn
durch Umordnung der Zeilen erhalten wir eine obere Dreiecksmatrix mit lau-
ter Einsen auf der Diagonalen, welche oenbar invertierbar ist, also vollen
28 KAPITEL 2. LINEARE KONTROLLSYSTEME
Rang besitzt. Daher ist (

.

1) kontrollierbar und da Kontrollierbarkeit un-
ter Koordinatentransformationen erhalten bleibt, ist auch das Paar (. 1)
kontrollierbar.
Sei umgekehrt (. 1) kontrollierbar. Dann ist die Erreichbarkeitsmatrix
1 = [1. 1. . . . .
a1
1] invertierbar. Wir zeigen nun zunchst, dass 1
1
1
=

T
, d.h., dass 1 = 1
~

T
ist. Dies folgt (unter Verwendung des Satzes
von CayleyHamilton) aus
1 = [1. 1. ....
a1
1]
= [1.
2
1. ....
a1
1. c
a1

a1
1 +... +c
0
1]
= [1. 1. ....
a1
1]
_
_
_
_
_
_
_
_
0 . . . 0 c
0
1 . . . 0 c
1
. . .
. . .
. . .
0 . . . 1 c
a1
_
_
_
_
_
_
_
_
= 1
~

T
.
Eine analoge Rechnung mit
~
1 aus (2.10) liefert
~
1
1
~

~
1 =
~

T
und damit
~
=
~
1
~

T
~
1
1
=
~
11
1
1
~
1
1
.
Ferner ist oensichtlich 1(1. 0. .... 0)
T
= 1 und
~
1(1. 0. .... 0)
T
=
~
1, also
1
~
1
1
~
1 = 1. Damit ist o = 1
~
1
1
die gesuchte Tranformationsmatrix.
Bemerkung 23 In der Regelungsnormalform enthlt das System eine Kette
von : 1 Integratoren, erst in der letzten Gleichung erscheint die Kontrolle
explizit
Wir werden das Stabilisierungsproblems zunchst fr skalare Kontrol-
le, also : = 1, lsen. Der allgemeine Fall wird dann darauf zurckgefhrt.
Zunchst drcken wir das Stabilisierungsproblem mit Hilfe des charakteris-
tischen Polynoms aus. Dies hngt eng mit dem Hautus-Kriterium fr Kon-
trollierbarkeit zusammen.
Denition 24 Fr ein Kontrollsystem (2.8) heit ein Polynom vorgebbar,
falls ein lineares Feedback 1 existiert, so dass gleich dem charakteristischen
Polynom
+11
von +11 ist.
Oenbar existiert ein stabilisierendes Feedback 1 genau dann, wenn ein
vorgebbares Polynom existiert, dessen Nullstellen nur negative Realteile ha-
ben.
Die folgende Proposition zeigt, fr skalare Kontrollen, die Beziehung zwi-
schen Kontrollierbarkeit und der Vorgebbarkeit von Polynomen.
2.3. FEEDBACK-STABILISIERUNG 29
Proposition 25 Betrachte das Kontrollsystem (2.8) mit skalarer Kontrolle,
also 1 R
a1
. Dann sind quivalent:
(i) Das Paar (. 1) ist kontrollierbar.
(ii) Jedes Polynom der Form (.) = .
a
,
a1
.
a1
... ,
1
. ,
0
mit
,
i
R ist vorgebbar.
Beweis. (i) = (ii): Sei (. 1) kontrollierbar und sei o die Koordinatentrans-
formation aus Lemma 22. Wir setzen

1 = (,
0
c
0
. ,
1
c
1
. . . . . ,
a1
c
a1
) R
1a
.
Dann gilt

+

1

1
=
_
_
_
_
_
_
_
_
0 1 . . . 0
. . . .
. . . .
. . . .
0 0 . . . 1
c
0
c
1
. . . c
a1
_
_
_
_
_
_
_
_
+
_
_
_
_
_
_
_
_
0
.
.
.
.
1
_
_
_
_
_
_
_
_
(,
0
c
0
. ,
1
c
1
. . . . . ,
a1
c
a1
)
=
_
_
_
_
_
_
_
_
0 1 . . . 0
. . . .
. . . .
. . . .
0 0 . . . 1
,
0
,
1
. . . ,
a1
_
_
_
_
_
_
_
_
.
Daher ist nach Lemma 22 das charakteristische Polynom von

+

1

1 gleich
.
(ii) = (i): Es sei 1 die Koordinatentransformation aus Lemma 21. Dann
ergibt sich fr jedes beliebige Feedback

1 = (1
1
. 1
2
)

+

1

1 =
_

1
+1
1
1
1

2
+1
1
1
2
0
3
_
.
Das charakteristische Polynom dieser Matrix ist

e
+
e
1
e
1
=

1
+1
1
1
1

3
.
daher sind (beachte, dass (
1
. 1
1
) kontrollierbar ist) die vorgebbaren Poly-
nome gerade von der Form =
c

&
, wobei
c
ein beliebiges normiertes
Polynom vom Grad d ist und
&
=

3
ist. Bedingung (ii) kann oenbar
30 KAPITEL 2. LINEARE KONTROLLSYSTEME
nur gelten, wenn
3
= 0 ist, also das System kontrollierbar ist. Damit ist
Theorem 25 bewiesen.
Das Polynom
&
=

3
wird auch als als unkontrollierbarer Teil des
charakteristischen Polynoms von bezeichnet (vgl. bungsaufgabe zum
Hautus-Kriterium).
Natrlich ist es zur Stabilisierung nicht notwendig, dass jedes Polynom
vorgebbar ist, wir brauchen lediglich eines zu nden, dessen Nullstellen nur
negative Realteile haben. Der Beweis von Satz 25 zeigt, wann dies mglich
ist: Man bentigt, dass der unkontrollierbare Teil des charakteristischen Po-
lynoms nur Nullstellen mit negativem Realteil hat.
Das folgende Lemma, Heymanns Lemma, erlaubt es uns, den allgemeinen
Fall auf den Fall : = 1 zurckzufhren.
Lemma 26 Das Paar (. 1) sei kontrollierbar. Sei R
n
mit / := 1 ,= 0.
Dann existiert 1 R
an
, so dass ( +11. /) kontrollierbar ist.
Beweis. Mittels einer rekursiven Vorschrift konstruieren wir uns zunchst
linear unabhngige Vektoren r
1
. . . . . r
a
R
a
mit der folgenden Eigenschaft:
Fr alle i 1. . . . . : 1 gilt
r
i
\
i+1
= r
1
. . . . . r
i+1
. (2.11)
Deniere r
1
:= / ,= 0. Jetzt seien fr / 1. . . . . : 1 linear unabhngige
Vektoren r
1
. . . . . r
I
gegeben, so dass fr alle i = 1. .... / 1 die (2.11) er-
fllt ist. Wir konstruieren einen Vektor r
I+1
, so dass r
1
. . . . . r
I
. r
I+1
linear
unabhngig sind und
r
I
\
I+1
= r
1
. . . . . r
I+1

erfllt ist.
1. Fall: r
I
, \
I
: Setze n
I
:= 0 R
n
und r
I+1
:= r
I
+ 1n
I
= r
I
.
Oenbar gilt dann auch die lineare Unabhngigkeit.
2. Fall: r
I
\
I
: Wegen (2.11) folgt dann, dass \
I
ein invarianter Un-
terraumist. Weil (. 1) kontrollierbar ist, gilt fr den kleinsten invarianten
Unterraum des R
a
, der das Bild von 1 enthlt, dass R
a
= [Im1. Weil
\
I
ein invarianter Unterraum mit dim\
I
= / < : ist, kann dieser das Bild
von 1 also nicht enthalten. Daher gibt es ein n
I
R
n
mit r
I
+ 1n
I
, \
I
und wir setzen r
I+1
= r
I
+1n
I
.
Wir konstruieren nun die gesuchte Abbildung 1 aus r
1
. . . . . r
a
. Da die r
i
linear unabhngig sind, ist die Matrix A = (r
1,
. . . . r
a
) invertierbar, und wir
knnen 1 := lA
1
fr l = (n
1
. . . . . n
a
) R
na
denieren, wobei die n
i
fr
i = 1. . . . . : 1 die in der obigen Rekursion verwendeten Kontrollvektoren
2.3. FEEDBACK-STABILISIERUNG 31
sind und n
a
:= 0 R
n
gesetzt wird. Damit gilt 1r
i
= n
i
und deswegen
( +11)r
i
= r
i+1
fr i = 1. . . . . : 1. Wegen / = r
1
folgt somit
[/. ( +11)/. . . . . ( +11)
a1
/] = A.
also hat diese Matrix den Rang : und ( +11. /) ist kontrollierbar.
Mit diesem Resultat lsst sich nun die Proposition 25 leicht auf beliebige
Kontrolldimension verallgemeinern.
Satz 27 Fr das System (2.8) sind quivalent:
(i) Das Paar (. 1) ist kontrollierbar.
(ii) Jedes Polynom vom Grad : ist vorgebbar.
Beweis. (i) =(ii): Sei (. 1) kontrollierbar und gegeben. Seien 1
1
R
an
und / = 1 R
a1
die in Lemma 26 konstruierten Matrizen. Dann ist das
Paar ( + 11
1
. /) kontrollierbar und aus Satz 25 folgt die Existenz eines
Feedbacks 1
2
R
1a
, so dass

+11
1
+b1
2
=
ist. Wegen
+11
1
+/1
2
= +11
1
+11
2
= +1(1
1
+1
2
)
ist also 1 = 1
1
+1
2
das gesuchte Feedback.
(ii) = (i): Vllig analog zum Beweis von Satz 25.
Satz 28 Fr das System (2.8) sind die vorgebbaren Polynome gerade die
Polynome der Form
=
c

&
.
wobei
c
ein beliebiges normiertes Polynom vom Grad d = [Im1 ist und

&
der unkontrollierbare Teil des charakteristischen Polynoms von . Insbe-
sondere ist das Stabilisierungsproblem genau dann lsbar, wenn alle Nullstel-
len von
&
negativen Realteil haben.
Beweis. Dies ergibt sich unmittelbar aus den obigen Beweisen.
Dieser Satz, der zentral fr die lineare Kontrolltheorie ist, wird oft als Pol-
verschiebungssatz bezeichnet, da die Nullstellen des charakteristischen Poly-
noms in der Kontrolltheorie auch als Pole bezeichnet werden (dies hat seine
Wurzeln in alternativen Darstellungen linearer Kontrollsystems ber soge-
nannte bergangsabbildungen) und der Satz angibt, wie man diese Nullstel-
len durch geeignete Wahl des Feedbacks verschieben kann.
32 KAPITEL 2. LINEARE KONTROLLSYSTEME
Kapitel 3
Nichtlineare Kontrollsysteme
In diesem Kapitel diskutieren wir allgemeine nichtlineare Kontrollsysteme.
Im ersten Abschnitt werden wir deshalb eine hinreichende Bedingung fr
lokale Akzessibilitt herleiten, die im reell-analytischen Fall auch notwendig
ist. Im C
o
-Fall ist sie nur fast hinreichend. Im zweiten Abschnitt werden wir
dann grundlegende Eigenschaften von Kontrollmengen beweisen.
3.1 Lokale Akzessibilitt
Zunchst beschreiben wir die allgemeine Klasse von Kontrollsystemen, die
wir betrachten werden.
_ r(t) = ,(r(t). n(t)). t R.
n | = n : RR
n
. n(t) l fr alle t R. lokal integrierbar .
(3.1)
wobei , : R
a
R
n
R
a
eine Lipschitz-stetige Abbildung ist. und lokal inte-
grierbar bedeutet (Lebesgue) integrierbar auf jedem beschrnkten Intervall
in R. Manchmal benutzen wir fr die Menge der involvierten Vektorfelder
(zu konstantem n) die Notation
1 = ,(. n). n l.
Wir nehmen an, dass der Kontrollwertebereich l R
n
nichtleer ist, und
dass fr jeden Anfangswert r R
a
und jede Kontrollfunktion n | eine
eindeutige (absolut-stetige) Lsung von (3.1) in folgendem Sinn existiert:
r(t) = r
0
+
_
t
0
,(r(t). n(t)) dt fr alle t R. (3.2)
Diese Lsung wird mit ,(t. r. n). t R. bezeichnet und erfllt ,(0. r. n) = r.
Meist reicht es, stckweise konstante Kontrollfunktionen zu betrachten, also
33
34 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
n in
| = n : RR
n
. n(t) l fr alle t R, stckweise konstant .
Dann sind die zugehrigen Trajektorien ,(. r. n) stckweise C
1
Funktionen.
Die Denition von Erreichbarkeitsmengen,. lokaler Akzessibilitt, und von
Kontrollmengen bertragen sich wrtlich auf diese Klasse von Kontrollsyste-
men. Insbesondere ist das System (3.1) lokal akzessibel in r R
a
, falls fr
alle 1 0
intO
+
T
(r) = int,(t. r. n). 0 _ t _ 1 und n | ,= O und
intO

T
(r) = int R
a
. ,(t. . n) = r. 0 _ t _ 1 und n | ,= O.
Wenn das System lokal akzessibel ist, bleiben die Aussagen der Propositionen
13 und 14 ber exakte Kontrollierbarkeit im Innern von Kontrollmengen und
ihre Beweise richtig, also
int1 O
+
(r) fr alle r 1
und
1 = clO
+
(r) O

(r).
Man kann aber natrlich nicht erwarten, dass Kontrollmengen eindeutig sind.
Im Unterschied zur linearen Situation haben wir zunchst kein einfaches Kri-
terium, um lokale Akzessibilitt nachzuweisen. Wir bentigen also eine Ver-
allgemeinerung von Kalmans Rang-Bedingung. Dies ist der Beitrag von Kre-
ners Theorem, das wir in diesem Abschnitt beweisen. Wir folgen dabei Sontag
[19]. Es wird sich herausstellen, dass diese Verallgemeinerung auch fr un-
beschrnkte Kontrollen nicht vollstndige Kontrollierbarkeit liefert, sondern
nur lokale Akzessibilitt. Es gibt - trotz vieler Einzelresultate - keine allge-
meinen Kriterien fr vollstndige Kontrollierbarkeit nichtlinearer Systeme.
Die folgenden Beispiele illustrieren den Unterschied zwischen Kontrollier-
barkeit und lokale Akzessibilitt.
Beispiel 29 Betrachte in R
2
_ r
1
= n(t). _ r
2
= r
2
1
.
Das System ist fr keinen Kontrollwertebereich l kontrollierbar, weil der
positive Orbit O
+
(0. 0) in (r
1
. r
2
) . r
2
0 ' (0. 0) enthalten ist. Das
System ist aber lokal akzessibel in (0. 0): Whle fr t 0
n
t
(t) =
_
0 fr t [0. t]
1 fr t t
.
Daher enthlt O
+
(0. 0) eine oene Menge.
3.1. LOKALE AKZESSIBILITT 35
Beispiel 30 Betrachte in R
2
_ r
1
= n
1
(t). _ r
2
= n
2
(t),(r
1
). (n
1
(t).n
2
(t)) l
mit ,(r
1
) = 0 fr r
1
_ 0 und ,(r
1
) 0 fr r
1
0; ferner gelte 0 intl
R
2
. Dieses System ist kontrollierbar in R
2
, aber nicht lokal akzessibel fr
(r
1
. r
2
) mit r
1
< 0.
Beispiel 29 deutet bereits an, wie man eine hinreichende Bedingung fr lo-
kale Akzessibilitt in R
a
herleiten kann. Whle Kontrollwerte n
1
. .... n
a

l und betrachte
_ r(t) = ,
)
(r(t)) := ,(r(t). n
)
). r(0) = .
Bezeichne die Lsung mit c
t)
j
= ,(t. . n
)
) (diese Bezeichnung erinnert an
die Matrix-Exponentialfunktion, die hnlichkeit ist aber nur formal). Be-
trachte dann fr 1 0 die Abbildung
[0. 1)
I
R
a
. (t
1
. ...t
a
) c
t
n
)
n
... c
t
1
)
1
.
Ist diese Abbildung stetig dierenzierbar und hat die Ableitung vollen Rang
in (t
1
. .... t
a
), so folgt aus dem Inversen-Funktionen-Theorem, dass eine Um-
gebung von c
t
n
)
n
... c
t
1
)
1
von erreichbar ist. Zur Analyse der Ableitung
dieser Funktion und zur Formulierung von Kreners Theorem sind einige Vor-
bereitungen ntig, insbesondere Lie-Klammern von Vektorfeldern.
Es seien , und q glatte (C
1
)Vektorfeldern,deniert auf einer oenen
Menge C R
a
. Das Vektorfeld [,. q] auf C ist deniert durch
[,. q](r) =
J
Jr
q(r),(r)
J
Jr
,(r)q(r).
wobei
0
0a
q(r) bzw.
0
0a
,(r) die jeweiligen Jacobi-Matrizen bezeichnet. Bei ge-
ngender Glattheit kann man auf die oensichtliche Weise auch iterierte Lie-
Klammern denieren, also zum Beispiel fr Vektorfeldern ,. q und /
[,. [q. /]].
Ferner ist
[,. q] = [q. ,] und [,. ,] = 0.
Man beachte, dass die Lie-Klammer oenbar linear in jedem Argument ist,
also
[,. q +/] = [,. q] + [,. /].
36 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Fr eine Menge 1 von glatten Vektorfeldern ist die von 1 erzeugte Lie-
Algebra /(1) der kleinste lineare Raum von Vektorfeldern, der gegenber
Lie-Klammer-Bildung abgeschlossen ist, also
[,. q] /(1) fr alle ,. q /(1).
Die Berechnung von iterierten Lie-Klammern per Hand ist aufwndig und
fehleranfllig, aber im Prinzip immer durchfhrbar. Allerdings sei betont,
dass Lie-Algebren, auch wenn sie von endlich vielen Vektorfeldern erzeugt
werden, im Allgemeinen keine endlich-dimensionalen Vektorrume bilden.
Fr eine Lie-Algebra / (einen linearen Raum von Vektorfeldern, der unter
Lie-Klammern abgeschlossen ist) sei

/
(r) := R
a
. es gibt , / mit = ,(r).
Wir nennen
/
(r). r C, auch die von / erzeugte Distribution (von Un-
terrumen im Tangentialbndel).
Der folgende Satz von A. Krener [14] gibt ein hinreichendes Kriterium fr
lokale Akzessibilitt an.
Satz 31 (Krener) Fr das Kontrollsystem (3.1) in R
a
mit Vektorfeldern
1, gelte die folgende Akzessibilitts-Rangbedingung in r R
a
:
dim
/(1)
(r) = :. (3.3)
Dann ist das System lokal akzessibel in r.
Bemerkung 32 Oenbar ist die obige Bedingung quivalent zu
/(1)
(r) =
R
a
. Man sagt auch, dass die Distribution in r den Rang : hat, also
rang (r) = :, daher der Name.
Bemerkung 33 Ist das System reell-analytisch (d.h. die rechte Seite ist in
eine konvergente Potenzreihe entwickelbar) oder ist dim
/(1)
(r) konstant
fr r R
a
, so gilt auch die Umkehrung. Im C
o
-Fall folgt aus der lokalen
Akzessibilitt nur, dass die Rang-Bedingung auf einer oenen und dichten
Teilmenge gilt.
Bevor wir uns dem Beweis zuwenden, illustrieren wir die Bedeutung dieses
Resultats. Fr lineare Kontrollsysteme mit unbeschrnkten Kontrollen ist die
Bedingung (3.3) quivalent zur Kalman-Bedingung.
Proposition 34 Fr _ r = r + 1n in R
a
gilt (3.3) in jedem r R
a
genau
dann, wenn
rang [1. 1. ....
a1
1] = :.
3.1. LOKALE AKZESSIBILITT 37
Beweis. Hier ist 1 = r + 1n. n R
n
. Fr n = 0 erhlt man das
Vektorfeld r. Wegen der Linearitt ist fr n R
n
[r. r +1n] = [r. r] + [r. 1n]
= r r + [r. 1n]
= [r. 1n].
Beachte nun, dass 1n ein konstantes Vektorfeld ist, whle n als einen kano-
nischen Basisvektor c
i
in R
n
, und bezeichne die i-te Spalte von 1 mit /
i
:
Dann ist wegen der Linearitt von /(1)
/
i
= (r +1c
i
) 1c
i
/(1).
Ferner folgt
[r. 1c
i
] = 0 r 1c
i
= /
i
/(1).
Entsprechend ist
[r. [r. 1c
i
]] =
2
/
i
.
Man erhlt schlielich , dass
/(1)
(r) alle Vektorfeldern
r. /
1
. .... /
n
. /
1
. .... /
n
. .....
a1
/
1
. ....
a1
/
n
enthlt. Mit Hilfe des Satzes von Cayley-Hamilton folgt, dass der davon
aufgespannte Vektorraum gleich /(1) ist. Der Unterraum
/(1)
(r) von R
a
stimmt fr jedes r R
a
(also auch fr r = 0) mit R
a
berein, wenn Kalmans
Rang-Bedingung erfllt ist. Die umgekehrte Richtung wird etwas spter be-
wiesen (Bemerkung 40).
Eine wichtige Klasse von Kontrollsystemen sind bilineare Kontrollsysteme
in R
a
gegeben durch
_ r =
_

0
+
n

i=1
n
i
(t)
i
_
r(t) = (n(t))r(t). (n
i
(t)) l.
mit : : Matrizen
0
.
1
. ....
n
und l R
n
. Beachte, das hier die Lie-
Klammer durch den Kommutator von Matrizen gegeben ist:
[(n)r. ()r] = (()(n) (n)()) r = [(n)() ()(n)]r.
Man kann dies auch als Kontrollsystem auf dem Raum ` = G|(:. R) der
invertierbaren :: Matrizen auassen oder auf der Untergruppe, die durch
Multiplikation der Einheitsmatrix mit den entsprechenden Fundamental-Matrizen
entsteht. Es entsteht also in Kontrollsystem auf dieser (zusammenhngenden)
38 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Lie-Untergruppe ( (mit rechts-invarianten Vektorfeldern). Es stellt sich her-
aus, das die Akzessibilitts-Rangbedingung (3.3) fr das System in R
a
0
genau dann gilt, wenn sie fr das System auf ( gilt. Allgemeiner kann man
Kontrolltheorie fr Systeme auf Liegruppen betreiben; hierzu gibt es eine gut
ausgearbeitete Theorie (siehe z.B. die Monographie von V. Jurdjevic [13]).
Fr den Beweis von Theorem 31 bentigen wir einige Vorbereitungen.
Dazu diskutieren wir zunchst, wie das Umschalten zwischen Vektorfeldern
zu konstanten Kontrollen neue Richtungen generieren kann. Wir hatten den
Fluss zu einem Vektorfeld , auch mit
c
t)
r = ,(t. r)
bezeichnet. Dann ist die Komposition zweier solcher Flsse, die zu konstanten
Kontrollen auf [0. t
1
] und (t
1
. t
2
] gehren, gegeben durch
c
t
2
j
c
t
1
)
. t
1
. t
2
R.
Im Allgemeinen ist
c
t
3
)
c
t
2
j
c
t
1
)
,= c
t
2
j
c
(t
1
+t
3
))
.
weil die Flsse nicht kommutieren mssen.
Das folgende Beispiel zeigt, wie durch diese Komposition neue Richtungen
erzeugt werden.
Beispiel 35 Betrachte ein Kontrollsystem, das Rotationen im R
3
um einen
Punkt beschreibt (zum Beispiel fr einen Satelliten). Die Kontrollen sollen
Rotation um die .-Achse und um die -Achse erlauben. Die zugehrigen Vek-
torfelder (fr Rotation entgegen der Uhrzeigerrichtung) sind
,(r) =
_
_
r
2
r
1
0
_
_
und q(r) =
_
_
r
3
0
r
1
_
_
mit den Flssen
c
t)
r =
_
_
cos t sin t 0
sin t cos t 0
0 0 1
_
_
_
_
r
1
r
2
r
3
_
_
, c
tj
r =
_
_
cos t 0 sin t
0 1 0
sin t 0 cos t
_
_
_
_
r
1
r
2
r
3
_
_
.
Die Folge von Rotationen mit , (um die .Achse) fr :,2 Sekunden, mit
q (um die Achse) fr :,2 Sekunden und mit , fr :,2 Sekunden (um
die Achse) hat eine andere Auswirkung als die Rotation mit q (um die
3.1. LOKALE AKZESSIBILITT 39
.Achse) fr :,2 Sekunden. Ersteres produziert eine Drehung im Uhrzeiger-
sinn um :,2 um die rAchse. Dies sieht man leicht geometrisch; algebraisch
ergibt es sich aus
c
(2))
c
(2)j
c
(2))
r
=
_
_
0 1 0
1 0 0
0 0 1
_
_
_
_
0 0 1
0 1 0
1 0 0
_
_
_
_
0 1 0
1 0 0
0 0 1
_
_
_
_
r
1
r
2
r
3
_
_
=
_
_
1 0 0
0 0 1
0 1 0
_
_
_
_
r
1
r
2
r
3
_
_
.
Dieses Beispiel zeigt, dass eine total neue Bewegung, verschieden von reinen
Rotationen um die oder die .Achse, aus der Kombination der ursprng-
lichen Flsse entsteht.
Um diese Fragen in einem angemessenen Kontext zu diskutieren, mssen
wir einige Konzepte aus der Dierentialgeometrie einfhren. Fr eine stetige
dierenzierbare Abbildung , = (,
1
. .... ,
a
)
T
: C R
a
deniert auf einer
oenen Menge C R
j
, bezeichnen wir mit ,
+
die Jacobi-Matrix von ,,
betrachtet als eine Matrix-Funktion auf C. Das heit, fr jedes r
0
C ist
,
+
(r
0
) R
aj
die in r
0
ausgewertete Jacobi-Matrix, deren (i. ,)ter Eintrag
0)
i
0a
j
[
a=a
0 . ist.
Im Spezialfall j = : heit solch eine stetig dierenzierbare Funktion
Vektorfeld auf C. Im Weiteren nehmen wir immer an, dass Vektorfelder C
o
sind. Die Menge aller Vektorfelder auf C R
a
ist ein Vektorraum, bezeichnet
mit V(C).
Ist , : C R dierenzierbar, so ist ,
+
(r) = O,(r) ein Zeilenvektor, der
Gradient von , ausgewertet in r. Die Menge aller glatten (C
o
)Funktionen
, : C R ist wieder ein Vektorraum, bezeichnet mit F(C). Fr jedes ,
V(C) und jedes , F(C) ist 1
)
, F(C) die Richtungs-Ableitung oder
Lie-Ableitung von , entlang ,,
(1
)
,)(r) = ,
+
(r),(r)
(wie fr Lyapunov-Funktionen). Man kann 1
)
als einen linearen Operator
auf F(C) auassen. Zwei Vektorfelder ,. q V(C) sind genau dann gleich,
wenn 1
)
= 1
j
: In der Tat, aus der letzteren Ungleichung folgt, dass fr jede
der : (linearen) Koordinatenfunktionen :
i
(r) = r
i
gilt: ,
i
(r) = (1
)
:
i
)(r) =
(1
j
:
i
)(r) = q
i
(r). Beachte, dass 1
)
ein Dierential-Operator erster Ordnung
ist, whrend die Komposition 1
)
1
j
= 1
)
1
j
ein Operator zweiter Ordnung
40 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
ist: es sei
H
,
=
_
J
2
,
Jr
i
Jr
)
_
die Hesse-Matrix. Dann folgt
1
)
1
j
, = 1
)
(,
+
q) = q
T
H
,
, +,
+
q
+
,.
Weil H
,
symmetrisch ist, folgt
1
)
1
j
, 1
j
1
)
, = 1
j

))

j
,. (3.4)
Mit dieser Notation kann man die Lie-Klammer folgendermaen denieren.
Denition 36 Die Lie-Klammer von ,. q V(C) ist [,. q] = q
+
, ,
+
q
V(C).
Die Gleichung (3.4) bedeutet daher
1
[),j]
= 1
)
1
j
1
j
1
)
. (3.5)
Wir notieren, dass diese Operation linear in jedem ihrer Argumente ist und
[,. q] = [q. ,]. Manchmal ist es bequem zu schreiben
ad
)
q = [,. q]
und ad
)
als linearen Operator auf V(C) zu betrachten. Dies ist ein Dierential-
Operator bezglich der Lie-Klammer in folgendem Sinn:
ad
)
[q. /] = [ad
)
q. /] + [q. ad
)
/]
fr alle ,. q. /. Diese Formel heit auch Jacobi-Identitt, insbesondere, wenn
sie in der quivalenten Form (man beachte die zyklische Vertauschung von
,. q, und /)
[,. [q. /]] + [/. [,. q]] + [q. [/. ,]] = 0
geschrieben wird. Man beweist sie, indem man (3.5) zweimal anwendet und
hnliche Ausdrcke fr die anderen beiden Terme benutzt. Wir notieren die
folgenden weiteren Eigenschaften.
Lemma 37 Fr alle ,. q V(C) und alle ,. F(C) gilt (i) 1
)
(,) =
1
)
(,)+,(1
)
); (ii) 1
,)
() = ,1
)
; (iii) [,,. q] = ,[,. q] +(1
)
),q
(1
j
,),.
Beweis. bung.
3.1. LOKALE AKZESSIBILITT 41
Denition 38 Eine Lie-Algebra (von Vektorfeldern auf C) ist ein linearer
Unterraum o V(C), der bezglich der Lie-Klammern abgeschlossen ist,
das heit, [,. q] o, falls , und q in o sind.
Fr Teilmengen V(C) denieren wir die von erzeugte Lie-Algebra
/() als den Durchschnitt aller Lie-Algebren, die enthalten. Dieser (nicht-
leere) Durchschnitt ist eine Lie-Algebra, weil Durchschnitte von Lie-Algebren
wieder Lie-Algebren sind.
Lemma 39 Fr V(C) deniere

0
= .
I+1
= [,. q]. ,
I
und q . / _ 0.
und
o
=

I0

I
. Dann /() = linear span
o
.
Beweis. Es ist klar, dass linear span
o
/(). Die Umkehrung folgt, in-
dem man zeigt, dass linear span
o
eine Lie-Algebra ist (der Beweis benutzt
die Jacobi-Identitt). Wir lassen die Details weg..
Dieses Lemma zeigt, dass /(/) der kleinste Unterraum von V(C) ist, der
enthlt und unter dem Operator ad
)
abgeschlossen ist.
Bemerkung 40 Aus diesem Lemma folgt auch die noch fehlende Beweis-
richtung in Proposition 34.
Seien \ R
j
und C R
a
oen. Wir nennen eine glatte Abbildung
` : \ C
eine Scheibe (slice) falls ihre Jacobi-Matrix `
+
(n) in jedem n \ den
Rang j hat. Ein Vektorfeld , V(C) heit tangential an `, falls fr alle
n \ das Bild ,(`(n)) im Spaltenraum von `
+
(n) ist, d.h. in dem von
den Spalten aufgespannten Unterraum von R
a
.
Wir betrachten auch das Bild von ` als eine j-dimensionale Scheibe
von C. Ist ` injektiv, so liefert es, dierentialgeometrisch ausgedrckt, eine
Karte fr die Untermannigfaltigkeit, die durch ihr Bild dargestellt wird. Tan-
gentiale Vektorfelder in diesem Sinn sind genau diejenigen, die im blichen
Sinn tangential an diese Untermannigfaltigkeit sind.
Proposition 41 Sei ` : \ C eine Scheibe. Dann ist die Menge der an
` tangentialen Vektorfelder eine Lie-Algebra.
Fr den Beweis dieser Proposition bentigen wir das folgende Resultat
(das mit linearer Algebra und etwas Analysis bewiesen wird; vgl. Sontag [19,
Corollary 4.1.6]). Man beachte, dass die Aussage fr festes n oensichtlich
ist.
42 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Lemma 42 Fr eine oene Teilmenge \ R
j
betrachte C
I
-Funktionen
, : \ R
a
und Q : \ R
aj
, fr die der Rang von Q(n) konstant auf
\ ist. Dann sind quivalent:
(i) Fr jedes n \ gehrt ,(n) zum Spaltenraum von Q(n).
(ii) Fr jedes n
0
\ gibt es eine Umgebung \
0
von n
0
und eine C
I
-
Funktion c : \
0
R
j
, so dass
,(n) = Q(n)c(n) fr alle n \.
Beweis. (von Proposition 41). Natrlich ist die Menge der Vektorfelder, die
tangential an ` sind, ein linearer Unterraum von V(C). Anwendung von
Lemma 42 auf , ` zeigt, dass , genau dann tangential an ` ist, wenn es
fr jedes n
0
\ eine Umgebung \
0
und ein glattes c : \
0
R
j
gibt, so
dass
,(`(n)) = `
+
(n)c(n) fr alle n \
0
.
Whle tangentiale Vektorfelder ,. q und ein n
0
\
0
. Wir mssen zeigen,
dass [,. q](`(n
0
)) im Spaltenraum von `
+
(n
0
) liegt. Whle eine Umgebung
\
0
von n
0
und glatte c. , : \
0
R
j
, so dass fr alle n \
0
,(`(n)) = `
+
(n)c(n) und q(`(n)) = `
+
(n),(n).
Wir werden
[,. q](`(n)) = `
+
(n)[c. ,](n) fr alle n \
0
(3.6)
zeigen, woraus die Behauptung folgt. Betrachte
~
,(n) = ,(`(n)) = `
+
(n)c(n) und ~ q(n) = q(`(n)) = `
+
(n),(n).
Die Kettenregel liefert
(
~
,)
+
(n) = ,
+
(`(n))`
+
(n). (~ q)
+
(n) = q
+
(`(n))`
+
(n). (3.7)
Fr i 1. .... : sei c
i
der i-te kanonische Einheitsvektor; betrachte die glatte
Funktion
,
i
= c
T
i
` : \
0
R.
Dann ist
c
T
i
~
, = c
T
i
`
+
(n)c(n) = 1
c
,
i
und c
T
i
~ q = c
T
i
`
+
(n),(n) = 1
o
,
i
. (3.8)
und daher
c
T
i
(q
+
,)(`(n)) = c
T
i
q
+
(`(n))`
+
(n)c(n)
= c
T
i
(~ q)
+
(n)c(n) = (c
T
i
~ q)
+
(n)c(n) wegen (3.7)
= (1
o
,
i
)
+
(n)c(n) = (1
c
1
o
,
i
)(n) wegen (3.8).
3.1. LOKALE AKZESSIBILITT 43
Ein analoges Argument liefert
c
T
i
(,
+
q)(`(n)) = (1
o
1
c
,
i
)(n).
Mit 1
[c,o]
= 1
c
1
o
1
o
1
c
erhalten wir
c
T
i
[,. q](`(n)) = (1
[c,o]
,
i
)(n) = c
T
i
`
+
(n)[c. ,](n).
Weil dies fr alle i gilt, folgt (3.6) und der Beweis von Proposition 41 ist
vollstndig.
Im Weiteren xieren wir eine oene Teilmenge C R
a
und eine Menge
V(C) von Vektorfeldern.
Denition 43 Ein /Tupel (,
1
. .... ,
I
) in ist nichtsingular in r
0
C,
falls es t
0
= (t
0
1
. .... t
0
I
) R
I
0
gibt, so dass fr

a
0
)
1
,...,)
k
: 1 C. t = (t
1
. .... t
I
) c
t
k
)
k
... c
t
1
)
1
r
0
.
deniert auf einer oenen Menge 1 R
I
mit 0 1, die Jacobi-Matrix in
t
0
den Rang / hat.
Die Lsung t c
t)
r
0
ist C
o
, weil , eine C
o
Funktion ist, daher ist
auch eine C
o
Funktion. Das nchste Lemma ist entscheidend fr den
Beweis von Kreners Satz.
Lemma 44 Wenn fr die Lie-Algebra /() die Rang-Bedingung
rang/()(r
0
) = :
gilt, so gibt es ein nichtsingular :Tupel in r
0
. Ferner gibt es fr jedes 0
ein t
0
R
a
0
mit t
0
i
< fr alle i und ,
1
. .... ,
a
, so dass
_

a
0
)
1
,...,)
d
_
+
(t
0
)
den Rang : hat.
Beweis. Wir knnen annehmen, dass rang/()(r) = : fr alle r C gilt,
indem wir, wenn ntig, C durch eine kleinere Umgebung von r
0
ersetzen.
Fixiere 0. Es sei / die grte ganze Zahl fr die ein /Tupel (,
1
. .... ,
I
)
in und ein t
0
R
I
0
mit t
0
i
< existieren, so dass
a
0
)
1
,...,)
k
auf einer
Umgebung von
[0. t
0
1
] ... [0. t
0
I
]
deniert ist und rang
_

a
0
)
1
,...,)
k
_
+
(t
0
) = / erfllt. Beachte, das / _ 1 gilt, weil
es ein , mit ,(r
0
) ,= 0 gibt (andernfalls sind alle Lie-Klammern gleich
null, woraus /()(r
0
) = 0 folgt). Fr dieses 1Tupel hat (
a
0
)
)
+
(0) = ,(r
0
)
44 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
den Rang eins. Fr den Beweis des Lemmas mssen wir / = : zeigen. Es
seien (,
1
. .... ,
I
) und t
0
R
I
mit t
0
i
< , so dass rang
_

a
0
)
1
,...,)
k
_
+
(t
0
) = /.
Wegen der Stetigkeit knnen wir annehmen, dass alle Eintrge von t
0
positiv
sind. Whle eine Umgebung \ R
I
0
von t
0
(enthalten in dem Gebiet 1),
so dass rang
_

a
0
)
1
,...,)
k
_
+
(t) = / fr alle t \ und betrachte die Scheibe
` =
a
0
)
1
,...,)
k
: \ C.
Behauptung: Jedes Element von ist tangential an `.
Andernfalls gibt es , , so dass ,(`(:
0
)) fr ein :
0
\ nicht im
Spaltenraum von `
+
(:
0
) liegt. Betrachte das (/ + 1)Tupel
(,
1
. .... ,
I
. ,).
setze G =
a
0
)
1
,...,)
k
,)
, und nimm :
t
0
= (:
0
. 0) = (:
0
1
. .... :
0
I
. 0). Beachte, dass G
auf einer Umgebung von
[0. :
0
1
] ... [0. :
0
I
] 0
deniert ist. Wir berechnen die Jacobi-Matrix G
+
(:
t
0
). Wegen
G(t. t
I+1
) = c
t
k+1
)
`(t).
ist die Jacobi-Matrix bezglich der Variablen t gleich Q(t
I+1
)`
+
(t), wobei
Q(t
I+1
) das Dierential von r c
t
k+1
)
r ausgewertet in `(t) ist. Insbe-
sondere erhlt man `
+
(:
0
) in (t. t
I+1
) = :
t
0
. Die Ableitung bezglich t
I+1
ist ,(c
t
k+1
)
`(t)), was ausgewertet in :
t
0
gleich ,(`(:
0
)) ist. Wir schlieen
daraus, dass
_

a
0
)
1
,...,)
k
,)
_
+
(:
t
0
) = [`
+
(:
0
). ,(`(:
0
)].
Dies hat den Rang / + 1, weil die ersten / Spalten eine Matrix vom Rang /
bilden, denn ` ist eine Scheibe und die letzte Spalte ist nicht im Aufspann
der anderen. Weil alle Eintrge von :
t
0
nichtnegativ und kleiner als sind,
widerspricht dies der Maximalitt von / und die Behauptung ist bewiesen.
Daher sind alle Vektorfelder in tangential an `, und Proposition 41 zeigt,
dass auch alle Vektorfelder in der Lie-Algebra /() tangential an ` sind.
Whle t \. Dann liegt ,(`(t)) fr , /() im Spaltenraum von `
+
(t).
Daher impliziert die Rang-Bedingung, dass rang`
+
(t) = :, also folgt / = :
wie gewnscht
Jetzt knnen wir mit dem Beweis von Theorem 31 beginnen. Es behaup-
tet, dass fr ein Kontrollsystem, das durch die Vektorfelder 1 = ,(. n). n
l die Akzessibilitts-Rangbedingung
dim
/(1)
(r
0
) = :
3.1. LOKALE AKZESSIBILITT 45
die lokale Akzessibilitt in r
0
impliziert, das heit, fr alle 1 0
O
+
T
(r
0
) = R
a
. es gibt 0 < t _ 1 und n | mit = ,(t. r
0
. n).
und
O

T
(r
0
) = R
a
. es gibt 0 < t _ 1 und n | mit r
0
= ,(t. . n).
haben nichtleeres Inneres..
Beweis. (von Theorem 31) Nach Annahme gibt es eine endliche Teilmenge
1 von Vektorfeldern, so dass

/()
(r
0
) = R
a
.
Weil jedes c
t)
in t und r stetig ist, gibt es 0, so dass fr alle ,
1
. ...,
a

und alle t
1
. .... t
a
0 mit 0 _ t
i
< der Wert c
t
n
)
n
...c
t
1
)
1
deniert ist. Wir
whlen solch ein mit < 1,:. Lemma 44 sichert, dass es Vektorfelder
,
1
= ,(. n
1
). .... ,
a
= ,(. n
a
) in und t
0
R
a
0
mit 0 _ t
0
i
< fr alle i
gibt, so dass
rang(
a
0
)
1
,...,)
n
)
+
(t
0
) = :.
Wegen der Stetigkeit knnen wir annehmen, dass alle t
0
i
0 sind. Das
Implizite-Funktionentheorem garantiert, dass das Bild von
a
0
)
1
,...,)
n
restrin-
giert auf eine Teilmenge von (t
1
. .... t
a
). 0 < t
i
< fr i = 1. .... : eine
oene Menge enthlt. Wegen

a
0
)
1
,...,)
n
(t) = c
t
n
)(,&
d
)
... c
t
1
)(,&
1
)
r
0
= ,(t
1
+... +t
a
. r
0
. n).
wobei n die Kontrollfunktion ist, die den Wert n
1
auf [0. t
1
]. den Wert n
2
auf
[t
1
. t
1
+t
2
] etc. hat, ist dieses Bild in dem positiven Orbit O
+
T
(r
0
) enthalten.
Um die Behauptung fr O

T
(r
0
) zu beweisen, betrachten wir das Zeit-
umgekehrte System _ r = ,(r. n). Wegen /() = /() erfllt es ebenfalls
die Akzessibilitts-Rangbedingung. Daher haben die positiven Orbits fr das
zeitumgekehrte System nichtleeres Inneres. Sie stimmen mit den negativen
Orbits des Originalsystems berein. Damit ist der Beweis von Theorem 31
abgeschlossen.
Bemerkung 45 Eine Inspektion des Beweises zeigt, dass fr jede Umgebung
\ von r
0
die im Beweis benutzten Trajektorien so gewhlt werden knnen,
dass sie \ nicht verlassen. Manchmal wird lokale Akzessibilitt mit Hilfe
dieser Eigenschaft deniert, also wenn fr alle Umgebungen \ die Menge
der Punkte, die mit Trajektorien innerhalb von \ erreicht werden knnen,
nichtleeres Inneres hat. Ist der Kontrollwertebereich beschrnkt, so ist dies
quivalent dazu, dass die Menge der Punkte, die von r
0
bis zu einer beliebigen
Zeit 1 0 erreicht werden knnen, nichtleeres Inneres hat.
46 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Bemerkung 46 Die Lie-Algebra /(1) heit auch die zu dem Kontrollsys-
tem assoziierte Akzessibilitts-Lie-Algebra.
Ein relevante Klasse von Kontrollsystemen sind kontrollane Systeme;
sie haben die folgende Form.
_ r(t) = ,(r(t). n(t)) = ,
0
(r(t)) +n
1
(t),
1
(r(t)) +... +n
n
(t),
n
(r(t)). (3.9)
n | = n = (n
i
) : R R
n
. n(t) l fr t R.
Hierbei sind die ,
i
glatte Vektorfelder auf R
a
; das Vektorfeld ,
0
heit Drift-
Vektorfeld ,
1
. .... ,
n
heien Kontroll-Vektorfelder. Manchmal schreibt man
auch kurz
_ r = ,
0
(r) +G(r)n
mit G = (,
1
. ...,
n
) R
na
. Fr kontrollane Systems kann die Akzessibilitts-
Lie-Algebra durch weniger Elemente erzeugt werden als im allgemeinen Fall.
Proposition 47 Betrachte ein kontrollanes System (3.9), fr das der Kontroll-
Wertebereich l R
n
die Null enthlt und linear den R
n
aufspannt. Dann
ist die Lie-Algebra, die von 1 = ,(. n). n l erzeugt wird,
/(1) = /(,
0
. ,
1
. .... ,
n
).
Beweis. Es reicht, zu zeigen, dass die linearen Hllen von ,
0
. ,
1
. .... ,
n
und
von 1 bereinstimmen. Nach Denition ist jedes Element in 1 von der Form
,(. n) = ,
0
+
n

i=1
n
i
,
i
und ist daher natrlich in der linearen Hlle der ,
i
. Umgekehrt, mit n = 0
l ndet man ,
0
1 und daher ist fr jedes n l
G(r)n = n
1
,
1
+... +n
n
,
n
= ,(r. n) ,(r. 0)
in der linearen Hlle von 1. Um einzusehen, dass dies auch fr jedes ,
i
. i =
1. .... :, gilt, xiere solch ein i, und schreibe den iten kanonischen Basisvektor
von R
n
als Linearkombination der Elemente von l,
c
i
=
n

)=1
j
)
n
)
.
Dann ist ,
i
= G(r)c
i
=

n
)=1
j
)
G(r)n
)
, also in der linearen Hlle von 1.
3.1. LOKALE AKZESSIBILITT 47
In Theorem 31 betrachten wir Mengen von Punkten, die in jeweils einer
Zeitrichtung (in positiver Zeit oder in negativer Zeit) erreichbar sind. Die
Rang-Bedingung impliziert auch Eigenschaften von Punkten, die in positi-
ver und negativer Zeit kombiniert erreichbar sind., Dies ist eine klassische
Konstruktion in der Dierentialgeometrie und fhrt
zu Resultaten, die als Theoreme von Frobenius und von Chow bekannt
sind. Die denitive Version stammt von H. Sussmann und P. Stefan und ist
als Orbit-Theorem bekannt. Es stellt fest, dass alle Orbits Untermannigfal-
tigkeiten sind.
Auch einige in Anwendungen relevante Kontrollsysteme haben die Ei-
genschaft, dass Gehen in positiver und negativer Zeit erlaubt ist. Betrachte
driftfreie Systeme
_ r(t) = n
1
(t),
1
(r(t)) +... +n
n
(t),
n
(r(t)) mit (n
1
. .... n
n
) l
wobei fr den Kontrollwertebereich l = l gilt. Dann erfllt die Menge der
denierenden Vektorfelder
1 = n
1
,
1
+... +n
n
,
n
. n l
die Bedingung = und daher stimmt das zeitumgekehrte System mit
dem Originalsystem berein. Viele Systeme aus der Mechanik, wie Satelliten
oder Trailer, sind von diesem Typ.
Akzessibilitt ist eine viel schwchere Bedingung als vollstndige Kontrol-
lierbarkeit. Trotz intensiver Forschung und vieler Spezialresultate sind kei-
ne allgemeinen notwendigen und hinreichenden Bedingungen bekannt (nicht
einmal fr bilineare Systeme ohne Kontrollbeschrnkungen) Sind Kontroll-
beschrnkungen vorhanden, so wird vollstndige Kontrollierbarkeit eher die
Ausnahme sein. Stattdessen sind maximale Teilmengen vollstndiger Kon-
trollierbarkeit (also Kontrollmengen) das angemessene Konzept. Bevor wir
im nchsten Abschnitt zu ihrer Analyse kommen, notieren wir noch die fol-
genden Resultate.
Proposition 48 Es sei n | eine zulssige Kontrolle und betrachte fr
r
0
R
a
und 1 R den Punkt .
0
= ,(1. r
0
. n). Dann gibt es eine Umgebung
\ von r
0
, so dass die Abbildung c : r ,(1. r. n), deniert auf \ ein
Homomorphismus auf sein Bild ist, das eine Umgebung von .
0
bildet.
Beweis. Die stetige Inverse ist durch die Abbildung ,(1. . n(1 +))
gegeben, weil
,(1. ,(1. r. n). n(1 +)) = r.
Fr das folgende Resultat ber Kontrollierbarkeit entlang von Trajekto-
rien siehe z.B. Sontag [19, (1st ed.), Lemma/Exercise 3.6.13].
48 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Satz 49 Betrachte das kontrollane System
_ r = ,
0
(r) +
n

i=1
n
i
(t),
i
(r). (n
i
)
i=1,...,n
|. (3.10)
in R
a
und die Trajektorie ,(t. r
0
. 0). t R, zum Anfangswert r
0
R
a
und
zur Kontrolle n = 0 int l. Es gebe / N und 1 0, so dass die folgende
Matrix ausgewertet in ,(1. r
0
. 0) den Rang d hat:
[,
1
. .... ,
n
. cd
)
0
,
1
. .... cd
)
0
,
n
. .... cd
I
)
0
,
1
. .... cd
I
)
0
,
n
].
Dann ist das linearisierte (zeitabhngige!) Kontrollsystem
_ .(t) = 1,
0
(,(t. r
0
. 0)).(t) +
n

i=1
n
i
(t),
i
(,(t. r
0
. 0))
mit Kontrollen n 1
o
([0. 1]. R
n
) kontrollierbar auf [0. 1] (das heit, die
Erreichbarkeitsmenge zur Zeit 1 bei Start in r = 0 zur Zeit t = 0 ist R
a
)
und fr das nichtlineare System gilt ,(1. r
0
. 0) int O
+
T
(r).
Bemerkung 50 Der Beweis dieses Resultats basiert auf einer Rang-Bedingung
(hnlich der Kalman-Bedingung) fr Kontrollierbarkeit zeitabhngiger linea-
rer Kontrollsysteme, die zur obigen Bedingung quivalent ist. Diese Kontrol-
lierbarkeitsbedingung bedeutet, dass die stetig dierenzierbare Abbildung
(n. r) ,(1. r. n) : 1
o
(0. 1. R
n
) R
a
R
a
eine surjektive Ableitung in (n = 0. r
0
) hat. Dann impliziert das Open-
Mapping-Theorem die zweite Behauptung.
3.2 Kontrollmengen
Wir betrachten weiterhin das Kontrollsystem (3.1) und diskutieren in diesem
Abschnitt grundlegende Eigenschaften von Kontrollmengen. Wir setzen auch
voraus, dass der Kontrollwertebereich l beschrnkt ist (siehe auch Bemer-
kung 45). Kontrollmengen sind Teilmengen 1 des Zustandsraums R
a
, fr die
gilt: (i) fr alle r 1 gibt es n | mit ,(t. r. n) 1 fr alle t _ 0; (ii) fr
alle r 1 ist 1 clO
+
(r) und 1 ist maximal mit diesen Eigenschaften.
Eine Kontrollmenge heit invariante Kontrollmenge, falls clC = cl O
+
(r) fr
alle r C. Alle anderen Kontrollmengen heien variante Kontrollmengen.
Eigenschaft (i) fordert, dass man fr alle positiven Zeiten in 1 bleiben
kann. Das bedeutet, dass Kontrollmengen viabel im Sinn von J. P. Aubin
3.2. KONTROLLMENGEN 49
[1] sind, oder, wie es in der Kontrolltheorie meist heit, dass sie kontrolliert-
invariant sind (in der Theorie dynamischer Systeme auch schwach positiv
invariant). Wir werden spter sehen, dass diese Bedingung automatisch er-
fllt ist, wenn 1 die Eigenschaft (ii) hat und nichtleeres Inneres besitzt.
Die folgenden Beispiele zeigen, dass Kontrollsysteme viele oder gar keine
Kontrollmengen besitzen knnen.
Beispiel 51 Betrachte in R
_ r(t) = n(t). n(t) l R
1
.
Ist l (0. ), so gibt es keine Kontrollmenge. Ist l = 0 . so ist jede ein-
punktige Menge eine invariante Kontrollmenge. Daher gibt es ein Kontinuum
von Kontrollmengen.
Beispiel 52 Betrachte in R
2
_ r(t) =
_
0 n(t)
n(t) 0
_
r(t). n(t) l R
1
.
Ist l ,= 0 so sind alle Kreise um den Ursprung invariante Kontrollmengen.
Wir beginnen unser systematische Studium von Kontrollmengen mit ei-
nigen einfachen Beobachtungen. Zunchst zeigen wir, dass man nicht in eine
Kontrollmenge zurckkehren kann.
Proposition 53 Sei 1 eine maximale Menge mit der Eigenschaft, dass fr
alle r 1 gilt 1 clO
+
(r). Ferner existiere fr r 1 eine Zeit 1 0 und
n | mit ,(1. r. n) 1. Dann ist ,(t. r. n) 1 fr alle 0 _ t _ 1.
Beweis. Wegen der Maximalittseigenschaft reicht es zu zeigen, dass fr
0 _ t _ 1 und jedes 1 gilt clO
+
(,(t. r. n)) und ,(t. r. n) clO
+
().
Wegen stetiger Abhngigkeit vom Anfangswert ist clO
+
(,(1. r. n))
clO
+
(,(t. r. n)), und damit folgt die erste Behauptung. Um die zweite Be-
hauptung zu sehen, betrachte eine Umgebung `(,(t. r. n)). Wegen stetiger
Abhngigkeit vom Anfangswert gibt es eine Umgebung `(r) mit ,(t. .. n)
`(,(t. r. n)) fr alle . `(r). Es gibt n
1
| und t
1
0 mit ,(t
1
. . n
1
)
`(r), weil r 1. Daher liefert die zusammengesetzte Kontrolle
n
2
(t) =
_
n
1
(t) fr t [0. t
1
]
n(t t
1
) fr t [t
1
. t
1
+t]
dass ,(t
1
+t. . n
2
) `(,(t. r. n)). Dies zeigt ,(t. r. n) clO
+
().
In der Denition von Kontrollmengen 1 wird gefordert, dass man bei
Start in 1 fr alle positiven Zeiten in 1 bleiben kann. Die folgende Propo-
sition zeigt, dass diese Bedingung berssig ist, wenn die Kontrollmenge
nichtleeres Inneres hat.
50 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Proposition 54 Sei 1 R
a
eine Menge, die maximal ist mit der Eigen-
schaft, dass 1 clO
+
(r) fr alle r 1, und 1 habe nichtleeres Inneres.
Dann ist 1 eine Kontrollmenge.
Beweis. Es reicht zu zeigen, dass es fr alle r 1 eine Kontrolle n |
gibt mit ,(t. r. n) 1 fr alle t _ 0. Whle r 1. Dann gibt es 1
0
0
und n
0
| mit := ,(1
0
. r. n
0
) int 1. Sei . int 1 mit . ,= . Wegen
approximativer Kontrollierbarkeit in 1 und stetiger Abhngigkeit vom An-
fangswert ndet man eine Kontrolle n
1
|, eine Zeit 1
1
0 und disjunkte
oene Umgebungen \
j
. \
:
int 1 von bzw. ., so dass ,(1
1
.
t
. n
1
) \
:
fr alle
t
\
j
. Nun deniere eine Trajektorie ,(t. r. n). t _ 0, indem man
zunchst mit n
0
in der Zeit 1
0
von r nach geht; dann geht man in der Zeit
1
1
mit der Kontrolle n
1
von nach \
:
. Approximative Kontrollierbarkeit
impliziert, dass man das System zurck nach \
j
steuern kann. Dann wieder-
hole diesen Prozess. Jede Schleife von \
j
in \
:
und zurck nach \
j
braucht
mindestens die Zeit 1
1
. Daher ist diese Trajektorie auf [0. ) deniert und
nach der vorangehenden Proposition enthalten in 1. Es folgt, dass 1 eine
Kontrollmenge ist.
Die folgende Proposition zeigt, dass jede Menge approximativer Kontrol-
lierbarkeit in einer maximalen Menge mit dieser Eigenschaft, also einer Kon-
trollmenge enthalten ist.
Proposition 55 Sei 1
0
R
a
eine Menge, die die Eigenschaften (i) und
(ii) in der Denition von Kontrollmengen erfllt. Dann ist 1
0
enthalten in
einer Kontrollmenge 1.
Beweis. Deniere 1 als die Vereinigung aller Mengen, die (i) und (ii) erfllen
und 1
0
enthalten. Dann ist 1 eine Kontrollmenge: Die Eigenschaft (i) gilt
nach Denition. Seien r. 1. Dann gibt es . 1
0
mit clO
+
(.)
und . clO
+
(r). Wegen stetiger Abhngigkeit vom Anfangswert gilt
clO
+
(r). Die Maximalittseigenschaft ist trivialerweise erfllt.
Dieselben Argumente zeigen, dass Kontrollmengen paarweise disjunkt
sind. Jetzt betrachten wir zunchst invariante Kontrollmengen.
Proposition 56 Eine Menge C R
a
ist eine invariante Kontrollmenge,
falls es fr alle r C eine Kontrolle n | gibt mit ,(t. r. n) C fr
alle t _ 0 und clC = clO
+
(r) fr alle r C, und C maximal mit diesen
Eigenschaften ist. Ist insbesondere C = cl O
+
(r) fr alle r C, so ist C
eine invariante Kontrollmenge.
Beweis. Nach Annahme gelten die Eigenschaften (i) und (ii) in der Denition
von Kontrollmengen. Die Maximalittseigenschaft sieht man folgendermaen:
3.2. KONTROLLMENGEN 51
Falls fr ` gilt C clO
+
() und clO
+
(r) = clC fr ein r
C, so folgt clO
+
() = clC, also C. Die zweite Behauptung ist eine
oensichtliche Konsequenz.
Bei lokaler Akzessibilitt haben invariante Kontrollmengen eine Reihe von
schnen Eigenschaften. Insbesondere sind sie positiv invariant, also ,(t. r. n)
C fr t _ 0. r C. n |.
Lemma 57 Das System (3.1) sei lokal akzessibel fr alle r in dem Abschluss
einer invarianten Kontrollmenge C. Dann gilt
(i) intC ,= O;
(ii) cl intC = C und C ist zusammenhngend;
(iii) intC und C sind positiv invariant;
(iv) intC O
+
(r) fr alle r C und intC = O
+
(r) fr alle r intC.
(v) Ist das System lokal akzessibel, so gibt es hchstens abzhlbar viele inva-
riante Kontrollmengen.
Beweis. Wir zeigen zunchst, dass r clC impliziert clO
+
(r) clC. Wenn
nicht, so gibt es r clC. n |, und 1 0, so dass := ,(1. r. n) , clC. Es
gibt dann eine oene Umgebung `() (clC)
c
, dem Komplement von clC.
und daher eine oene Umgebung \ von r, so dass ,(1. .. n). . \
`() (cl C)
c
. Es gibt daher einen Punkt . C \ mit ,(1. .. n) , cl C,
ein Widerspruch, weil C nach Annahme eine invariante Kontrollmenge ist.
Lokale Akzessibilitt zeigt mit dem gleichen Argument, dass C abge-
schlossen ist: Fr r cl C gilt clO
+
(r) clC und int O
+
(r) ,= O. Daher
gibt es ein int O
+
(r) C. Die Denition von invarianten Kontrollmen-
gen zeigt, dass clC = clO
+
() clO
+
(r). d.h. clO
+
(r) = clC. Wegen der
Maximalitt von Kontrollmengen folgt r C. also clC = C.
(i) Wegen lokaler Akzessibilitt folgt fr r C, dass O , = int O
+
(r) C.
(ii) Wir wissen bereits C = clC, und cl intC clC ist oensichtlich. Fr
die umgekehrte Richtung whle r C. Dann ist O
+
(r) C und daher
int O
+
(r) intC. Mann sieht leicht, dass wegen lokaler Akzessibilitt int
O
+
(r) dicht in O
+
(r) ist, und O
+
(r) ist dicht in C nach Denition invari-
anter Kontrollmengen. Deswegen ist int O
+
(r) dicht in C, also clC = cl int
O
+
(r) cl intC. Um den Zusammenhang zu zeigen, nehmen wir an, dass
C als disjunkte Vereinigung C = ' 1 von nichtleeren oenen Mengen
. 1 geschrieben werden kann, die oen und abgeschlossen in C sind. Wegen
clC cl intC folgt die Existenz von c int . / int 1. Approximative
Kontrollierbarkeit in C von c nach / liefert einen Widerspruch.
(iii) Natrlich ist C = clC positiv invariant. Um die positive Invarianz
von intC zu sehen, whle r intC und nimm an, dass es t 0 und n |
gibt mit ,(t. r. n) , intC. Dann gibt es eine Umgebung ` C von r und
52 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
,(t. . n). ` ist eine Umgebung von ,(t. r. n) mit ,(t. . n).
` (intC)
c
,= O. Wegen cl intC = C gibt es . C
c
,(t. . n). `.
Dies widerspricht der positiven Invarianz von C.
(iv) Whle r C und intC. Wir wissen cl O
+
(r) = clC = C.
Lokale Akzessibilitt impliziert int O

() intC ,= O. Deswegen gibt es .


O
+
(r) intO

() intC und daher ist O


+
(r). Positive Invarianz von
intC. impliziert O
+
(r) = intC fr intC.
(v) Die Anzahl der invarianten Kontrollmengen hchstens abzhlbar, weil
sie nichtleeres Inneres haben, und R
a
eine abzhlbare Basis der Topologie
besitzt.
Whrend im Allgemeinen keine Kontrollmengen existieren mssen, haben
wir im kompakten Fall das folgende Existenzresultat fr invariante Kontroll-
mengen.
Satz 58 Sei 1 eine kompakte, positiv invariante Menge fr (3.1). Dann gibt
es fr jedes r 1 eine invariante Kontrollmenge C
a
clO
+
(r). Ist das
System lokal akzessibel von jedem Punkt in 1. so gibt es hchstens endlich
viele invariante Kontrollmengen in 1.
Beweis. Fr r 1 betrachte die Familie T = clO
+
(). clO
+
(r).
Dann ist T nichtleer und jede Menge in T ist positiv invariant. Ferner be-
steht T aus abgeschlossenen Teilmengen eines kompakten metrischen Raums
und ist (halb-)geordnet bezglich der Mengeninklusion (d.h., Transitivitt,
Reexivitt und Antisymmetrie gelten). Fr jede absteigende lineare Kette
clO
+
(r
i
). i 1 gilt wegen der Kompaktheit

i1
clO
+
(r
i
) ,= O. Also hat
die Kette eine untere Schranke, gegeben durch clO
+
() fr ein beliebiges
Element

i1
clO
+
(r
i
). Daher erfllt T die Voraussetzungen von Zorns
Lemma (vgl. zum Beispiel Pedersen [17, Section 1.1]), und besitzt daher ein
minimales Element, das natrlich die FormC
a
= clO
+
() fr ein clO
+
(r)
hat. Die Menge C
a
ist positiv invariant und clO
+
() = C
a
fr alle C
a
.
weil C
a
minimal ist Daher ist C
a
nach Proposition 56 eine invariante Kon-
trollmenge.
Sei jetzt, im Widerspruch zur zweiten Behauptung, C
a
. : N eine ab-
zhlbare Kollektion von invarianten Kontrollmengen in 1. Wegen der lokalen
Akzessibilitt gibt es r
a
intC
a
. Sei r der Limes einer Teilfolge, die wir wie-
der mit (r
a
) bezeichnen. Whle intC
a
. wobei C
a
O
+
(r) eine invariante
Kontrollmenge ist. Dann gibt es t 0 und n | mit = ,(t. r. n) nach
Lemma 57. Fr eine oene Umgebung l() int C
a
gibt es eine oene Um-
gebung \ (r) so dass ,(t. .. n). . \ l. Daher gibt es ein ` N. so
dass fr alle : _ ` gilt C
a
= C
a
, nach Lemma 57.
3.2. KONTROLLMENGEN 53
Im allgemeinen ist es nicht wahr, dass invariante Kontrollmengen positiv
invariant sind. Ferner knnen variante Kontrollmengen auch bei lokaler Ak-
zessibilitt leeres Inneres haben. Die Anzahl von Kontrollmengen mit nicht-
leerem Innern kann auch in kompakten Mengen unendlich sein. Einige Ei-
genschaften von invarianten Kontrollmengen gelten jedoch auch fr variante
Kontrollmengen.
Lemma 59 Sei 1 eine Kontrollmenge mit nichtleerem Innern.
(i) Ist das System lokal akzessibel fr alle r cl1, so ist 1 zusammenhn-
gend und cl int 1 = cl 1.
(ii) Ist int 1 lokal akzessibel, so ist O
+
(r) fr alle r 1.
(iii) Ist das System lokal akzessibel fr alle int1. so ist int1 O
+
(r)
fr alle r 1. und fr jedes int1 gilt
1 = clO
+
() O

() . (3.11)
Ferner ist die Anzahl der Kontrollmengen mit nichtleerem Innern hchs-
tens abzhlbar.
Beweis. (i) Oenbar ist cl int 1 cl1. Fr die Umkehrung reicht es zu
zeigen, dass 1 cl int1. Whle r 1. Dann gibt es t 0 und n | und
eine oene Umgebung ` von r mit ,(t. .. n). . ` int1. Nun ist r
1 clO
+
() = cl intO
+
() fr 1, also ist die oene Menge intO
+
()`
nichtleer und enthalten in 1. Daher r cl int1. Wie in Lemma 57 beweist
man, dass 1 zusammenhngend ist.
(ii) Sei r 1. Wegen lokaler Akzessibilitt von int1 ndet man
t 0 so dass O , = int

t
() int1. Whle . int

t
() . Wegen . clO
+
(r),
folgt O
+
(r).
(iii) Es ist clO
+
(r) O

(r) 1 nach Denition von Kontrollmengen.


Die umgekehrte Inklusion folgt nach dem obigen Beweis.
Die letzte Aussage folgt, weil die Topologie von R
a
eine abzhlbare Basis
besitzt.
Bemerkung 60 Die Formel (3.11) reduziert die Berechnung von Kontroll-
mengen auf die von positiven und negativen Orbits
Wie zeigen jetzt eine topologische Charakterisierung invarianter Kontroll-
mengen. Zunchst zeigt das Beispiel
_ r = nr(1 r). n(t) [1. 1].
mit den invarianten Kontrollmengen 0. 1. (. 0). (0. 1). [1. ), dass
invariante Kontrollmengen bei fehlender lokaler Akzessibilitt nicht abge-
schlosssen sein mssen.
54 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Satz 61 Es gelte lokale Akzessibilitt fr alle r im Abschluss cl1 einer Kon-
trollmenge 1 mit nichtleerem Innern. Die Menge 1 ist eine invariante Kon-
trollmenge genau dann, wenn 1 abgeschlossen ist.
Beweis. Ist 1 eine invariante Kontrollmenge, so ist 1 nach Lemma 57 ab-
geschlossen. Fr die Umkehrung sei 1 eine variante Kontrollmenge und r
int 1. Dann existieren t
0
0 und eine Kontrollfunktion n mit ,(t
0
. r. n) ,
cl 1. Sei 1 = max t _ t
0
. ,(t. r. n) cl1. Dann ist ,(1. r. n) , 1 und
daher ist 1 nicht abgeschlossen. Dies sieht man wie folgt: Ist := ,(1. r. n)
1, so gibt es n
1
und t
1
so dass ,(t
1
. . n
1
) = r int 1, nach Lemma 59.
Daher gibt es eine Umgebung ` von so dass ,(t
1
. .. n
1
) int 1 fr alle
. `. Dies gilt insbesondere fr . = ,(t
2
. r. n) ` mit t
2
1 0, klein.
Dann ist
1 ' .
eine Menge mit nichtleerem Innern, die fr alle Anfangswerte r
t
in ihr in
clO
+
(r
t
) enthalten ist, also ist sie nach Lemma 54 in einer Kontrollmen-
ge enthalten und daher gleich 1. Insbesondere ist . = ,(t
2
. r. n) 1 im
Widerspruch zur Denition von 1.
Jetzt analysieren wir das Kontrollierbarkeitsverhalten unter Zeitumkehr
und die Feinstruktur des Randes.
Das zeitumgekehrte System zu (3.1)
_ r(t) = ,(r(t). n(t)). t R. (3.12)
das man erhlt, indem man t durch t ersetzt. Lokale Akzessibilitt in r gilt
fr (3.1) genau dann wenn sie fr (3.12); das gleiche gilt fr die Akzessibilitt-
Rang-Bedingung (3.3).
Lemma 62 Sei 1 eine Kontrollmenge mit nichtleerem Innern fr (3.1) und
es gelte lokale Akzessibilitt fr alle r int 1. Dann existiert genau eine
Kontrollmenge 1
+
von (3.12) mit int 1 = int 1
+
.
Beweis. Exakte Kontrollierbarkeit im Innern impliziert, dass es genau eine
Kontrollmenge 1
+
des zeitumgekehrten Systems mit int 1 int 1
+
gibt.
Wendet man dasselbe Argument auf 1
+
an, so erhlt man die Behauptung.
Dies Lemma zeigt, dass nur am Rand von Kontrollmengen interessan-
te Dinge bei Zeitumkehr passieren knnen. Zur Analyse dieser Feinstruktur
fhren wir die folgenden Begrie ein.
Denition 63 Sei 1 eine Kontrollmenge mit nichtleerem Innern. Deniere
die folgenden Teilmengen des Randes J1:
3.2. KONTROLLMENGEN 55

+
(1) = r J1. es gibt int 1, t 0. n | mit r = ,(t. . n) .
(1) = r J1. es gibt int 1, t 0. n | mit = ,(t. r. n) .
~
(1) = r J1. O
+
(r) 1 = O und O

(r) int 1 = O.
Diese Mengen heien Austritts-, Eintritts- und tangentialer Rand von 1.
Lemma 64 Sei 1 Kontrollmenge mit nichtleerem Innern, so dass lokale
Akzessibilitt in cl1 gilt.
(i) Die Mengen (1),
+
(1), und
~
(1) bilden eine Dekomposition von J1.
(ii) (1) und
+
(1) sind oen in J1 und
~
(1) ist abgeschlossen in J1.
(iii)
~
(1) = cl (1) cl
+
(1) und int
01
~
(1) = O.
Beweis. (i) Dies folgt aus der Maximalitt von Kontrollmengen.
(ii) Weil die Lsungsabbildungen Dieomorphismen sind, sind (1) und

+
(1) oen in J1. Dies impliziert die Abgeschlossenheit von
~
(1) wegen
der Dekompositionseigenschaft.
(iii) Sei r
~
(1) und whle int
+
t
(r) . Dann gibt es t _ t und n |
und eine Umgebung \ von r, so dass ,t. r. n). r \ int
+
t
(r).
Weil \ Punkte in int 1 enthlt, und O
+
(r) 1 = O und t 0 beliebig
klein gewhlt werden kann, folgt r cl
+
(1). Ein hnliches Argument gilt
fr O

(r) und zeigt r cl (1). Die umgekehrte Inklusion folgt aus (i) und
(ii). Dann impliziert (ii) auch die letzte Behauptung.
Die nchste Proposition klrt das Verhalten des Randes unter Zeitum-
kehr.
Proposition 65 Sei1 eine Kontrollmenge mit nichtleerem Innern fr (3.1)
und es gelte lokale Akzessibilitt fr alle r cl1. Dann gilt fr jedes r J1:
(i) r (1) genau dann wenn r 1.
(ii) r
+
(1) genau dann wenn r 1
+
, wobei 1
+
die Kontrollmenge des
zeitumgekehrte Systems aus Lemma 62 ist.
(iii) r
~
(1) genau dann wenn r , 1 ' 1
+
.
Beweis. (i) Wenn r 1, so folgt r (1) direkt aus der Denition.
Umgekehrt, ist r (1), so ist r clO
+
() fr alle 1, und D O
+
(r).
Also folgt r 1 nach Proposition 54. (ii) folgt durch Zeitumkehr: O

(r)
der Vorwrts-Orbit des zeitumgekehrten Systems. (iii) folgt aus (i) und (ii)
wegen der Zerlegungseigenschaft.
Das einfache Beispiel 10 einer Kontrollmenge an einem hyperbolischen
Fixpunkt illustriert die verschiedenen Teile des Randes (beachte, dass es drei
Kontrollmengen in diesem Bild gibt). Dieses Beispiel regt die Frage an, wann
(auch ohne Hyperbolizitt) um ein Gleichgewicht des unkontrollierten Sys-
tems eine Kontrollmenge existiert.
56 KAPITEL 3. NICHTLINEARE KONTROLLSYSTEME
Proposition 66 Betrachte das System (2.8) mit 0 l und einen Punkt j
mit ,(j. 0) = 0, d.h., j ist ein Gleichgewicht des unkontrollierten Systems.
Wenn j intO
+
(j) intO

(j), so existiert eine Kontrollmenge 1 mit j


int1.
Beweis. Es gibt Umgebungen \ (j) und \(j) mit \ (j) O
+
(j) und
\(j) O

(j). Dann ist \ (j) \(j) eine Menge vollstndiger Kontrollier-


barkeit mit nichtleerem Innern. Sie ist enthalten in einer maximalen Menge
mit dieser Eigenschaft, die natrlich wieder nichtleeres Inneres hat. Dies ist
nach Proposition 54 eine Kontrollmenge.
Kapitel 4
Der Kontrolluss
In diesem Kapitel beschreiben wir Kontrollsysteme als dynamische Systeme.
Dabei wird einem Kontrollsystem
_ r(t) = ,(r(t). n(t)). n |.
in R
a
das dynamische System, der Kontrolluss,

t
: | R
a
| R
a
. (n. r) (n(t +). ,(t. r. n)). t R, (4.1)
zugeordnet. Um Stetigkeit dieses dynamischen Systems zu erhalten, fhren
wir im ersten Abschnitt eine angemessene Metrik auf | ein, bevor wir im
zweiten Abschnitt den Kontrolluss diskutieren. Danach beschftigen wir
uns mit der Bedeutung von Kontrollmengen fr den Kontrolluss.
Die Konstruktion des Kontrollusses ist durch die folgende berlegung
geleitet: Fr einen Anfangswert r R
a
, Zeiten t. : R und eine Kontroll-
funktion n erfllt die zugehrige Trajektorie oenbar
,(: +t. r. n) = ,(:. ,(t. r. n). n(t +)).
Man muss also die zugehrige Kontrollfunktion verschieben. Dies wird in
der ersten Komponente des Kontrollusses getan. Die erste Komponente von
(4.1) ist unabhngig vom Anfangswert in der zweiten Komponente. Solch
einen Fluss nennt man in der Theorie Dynamischer Systeme einen Schief-
produktuss (skew product ow). Die Betrachtung von Kontrollsystemen als
dynamische Systeme ermglicht es, Konzepte und Methoden aus der Theorie
dynamischer Systeme auf Kontrollsysteme zu bertragen, insbesondere kann
man so den Subdivisionsalgorithmus zur Berechnung von relativen globalen
Attraktoren verallgemeinern.
Wir wollen eine Metrik auf | denieren, so dass Trajektorien stetig von
n | abhngen, also
r
a
r und n
a
n in | == ,(t. r
a
. n
a
) ,(t. r. n) fr jedes t R.
57
58 KAPITEL 4. DER KONTROLLFLUSS
Ferner mchten wir, dass | ein kompakter metrischer Raum wird, damit
jede Folge (n
a
) einen Hufungspunkt besitzt. Daher beschftigen wir uns
zunchst mit |. Da | in einem unendlich-dimensionalen Raum liegt, ist die
Wahl einer Norm-Topologie auf | schwerlich mit der Kompaktheit vereinbar.
Dies schliet zum Beispiel die naheliegende Wahl fr die Metrik mit Hilfe der
1
o
-Norm aus. Einen Ausweg bieten schwache Topologien:
Sei 2 ein Banachraum mit Dualraum
2
+
= .
+
: 2 R. .
+
ist linear und stetig.
Die schwache Topologie auf 2 ist die schwchste Topologie, fr die alle .
+

2
+
stetig sind. Ist 2 reexiv, also (2
+
)
+
zu 2 isomorph mittels
. .
++
:
deniert durch .
++
:
(.
+
) = .
+
(.). (4.2)
so ist die Einheitskugel in 2 schwach kompakt. Leider bietet sich keine ka-
nonische Wahl fr einen reexiven Banachraum 2 mit | 2 an (1
2
(R. R
n
)
scheidet aus, weil dann konstante Kontrollfunktionen nicht in 2 liegen).
Eine Alternative ist folgendes: Ist | 2
+
, also enthalten in einem dualen
Banachraum, so ist nach dem Satz von Alaoglu wiederum die Einheitskugel
in 2
+
kompakt in der schwach
+
-Topologie: Dies ist die schwchste Topologie,
so dass alle linearen Abbildungen der Form (4.2) stetig werden. Speziell hat
fr 2 = 1
1
(R. R
n
) der Raum
2
+
= 1
o
(R. R
n
)
eine schwach
+
-kompakte Einheitskugel; die Dualitt ist gegeben durch
(.
+
. .) =
_
o
o
.(:)
T
.
+
(:) d: fr .
+
1
o
(R. R
n
). . 1
1
(R. R
n
).
Daraus ergibt sich unmittelbar die Forderung, dass unser Kontrollwertebe-
reich beschrnkt sein muss. Die Bedingungen, die sich aus der Forderung nach
stetiger Abhngigkeit der Trajektorien von den Kontrollen ergeben, werden
wir in Abschnitt 4.2 diskutieren.
4.1 Der Shift auf |
Wir setzen im Folgenden voraus, dass l R
n
eine kompakte und konvexe
Menge ist, und betrachten
| = n : R R
n
. n(t) l fr fast alle t R
= n 1
o
(R. R
n
). n(t) l fr fast alle t R.
4.1. DER SHIFT AUF | 59
Deniere den Shift oder Verschiebe-Operator auf | durch
o
t
n = n(t +). t R.
Oenbar hat o die dynamischen Systeme-Eigenschaften o
0
= id und o
t+c
=
o
t
o
c
fr t. : R. Der nchste Satz beschreibt unsere gesuchte Topologie.
Satz 67 Die Menge | ist kompakt und metrisierbar in der schwach
+
Topo-
logie von 1
o
(R.R
n
) = (1
1
(R.R
n
))
+
; eine Metrik ist gegeben durch
d(n. ) =
o

a=1
1
2
a
[
_
R
n(t) (t). r
a
(t) dt [
1+ [
_
R
n(t) (t). r
a
(t) dt [
. (4.3)
wobei r
a
. : N eine abzhlbare dichte Teilmenge von 1
1
(R.R
n
) ist und
, ein inneres Produkt inR
n
bezeichnet. Mit dieser Metrik wird | ein kom-
pakter, vollstndiger, separabler metrischer Raum.
Bemerkungen zum Beweis: Der Dualraum von 1
1
(R.R
n
) ist 1
o
(R.R
n
)
(siehe z.B. [3, Theorem 4.5.1] und beachte, dass das Lebesgue-Ma auf R
oendlich ist). Ferner ist 1
1
(R.R
n
) ist separabel (siehe z.B. [3, Proposition
3.4.5] und beachte, dass die oAlgebra der Borel-Mengen auf R abzhlbar
erzeugt ist). Nach dem Satz von Alaoglu hat der Dualraum eines separablen
Banachraums eine kompakte, metrisierbare Einheitskugel in der schwach
+
-
Topologie, und eine Metrik ist durch (4.3) gegeben (siehe z.B. [6, Theorem
4.5.1]). Ist also | schwach
+
abgeschlossen, so ist es schwach
+
kompakt und ein
kompakter metrischer Raum; Daher ist | vollstndig (siehe z.B. [7, Theorem
4.3.28]) und separabel ([7, Theorems 4.3.5 and 4.3.27]). Es bleibt zu zeigen,
dass | schwach
+
abgeschlossen in 1
o
(R.R
n
) ist. Dies folgt, weil fr jedes
kompakte Intervall 1 R die konvexe und Norm-abgeschlossene Menge n [
1. n | 1
2
(1. R
n
schwach abgeschlossen ist. Daher ist ein schwach
+
Limes n einer Folge (n
a
) | wieder in |, weil fr jedes kompakte 1 die
Restriktionen (n
a
[ 1) schwach konvergent gegen n [ 1 in 1
2
(1. R) sind.
Im Weiteren xieren wir der Einfachheit halber solch eine Metrik. Zu-
nchst analysieren wir den Shift auf |.
Lemma 68 Der Shift deniert ein stetiges dynamisches System auf |.
Beweis. Es ist nur die Stetigkeit von nachzuweisen. Betrachte t
a
t in
R und n
a
n in |. Dann gilt fr alle . 1
1
(R.R
n
)

_
R
n
a
(t
a
+t). .(t) dt
_
R
n(t +t). .(t) dt

_
R
n
a
(t
a
+t) n
a
(t +t). .(t) dt

_
R
n
a
(t +t) n(t +t). .(t) dt

60 KAPITEL 4. DER KONTROLLFLUSS


=

_
R
n
a
(t). .(t t
a
) dt
_
R
n
a
(t). .(t t) dt

_
R
n
a
(t) n(t). .(t t) dt

.
(hier sind in den ersten beiden Integralen die Transformationen t
t
= t
a
+ t
und t
t
= t + t verwendet). Der zweite Summand konvergiert gegen 0, weil
n
a
n in |; der erste kann abgeschtzt werden durch
_ sup
&l
[n[
_
R
[.(t t
a
) .(t t)[ dt.
Hier konvergiert das Integral gegen 0 fr t
a
t . Dieser Fakt (Stetigkeit der
Norm in 1
1
) kann folgendermaen gesehen werden: Fr ein beschrnktes
Intervall 1 R und t R deniere 1(t) = 1 + t. Dann erfllt die charakte-
ristische Funktion

1
(t) =
_
1. t 1
0. t , 1
die Beziehung
_
1
[
1
(t t)
1
(t)[ dt =
_
1\1(t)
dt +
_
1(t)\1
dt
= `(1) + `(1(t)) 2`(1 1(t)).
Sei [t
a
[ 0 mit 1(t
1
) 1 1(t
2
) 1 ... 1(t
a
) 1 ... . Dann ist

o
a=1
1(t
a
) 1 = 1 und wir erhalten fr die Lebesgue-Mae
lim
ao
:(1 1(t
a
)) = :(1) = lim
ao
:(1(t
a
)).
Dies beweist die Behauptung fr
1
in t = 0. Dann zeigt man die Behauptung
fr beliebiges t R. fr Treppenfunktionen, und dann fr alle Elemente
r 1
1
. Wir haben gezeigt, dass
(t
a
. n
a
) = n
a
(t
a
+) (t. n) = n(t +) in |.
Beachte, dass n | genau dann eine periodische Funktion ist, wenn
n ein periodischer Punkt des Flusses (|. ) ist. Man kann zeigen, dass die
periodischen Funktionen, also die periodischen Punkte des Shifts, dicht in |
sind.
Denition 69 Ein Fluss auf einem metrischen Raum A (also eine stetige
Abbildung : R A A mit (0. r) = r und (t + :. r) = (t. (:. r))
4.1. DER SHIFT AUF | 61
fr alle t. : und r) ist topologisch mischend, falls fr je zwei oene Mengen
\
1
. \
2
A ein 1 0 existiert, so dass
(1. \
1
) \
2
,= O.
Proposition 70 Der Shift (|. ) ist topologisch mischend.
Beweis. Es reicht, oene Mengen in einer Basis der schwach
+
Topologie zu
betrachten (dann ist jede oene Menge Vereinigung von Mengen aus der
Basis). Daher betrachten wir nur oene Mengen der Form (siehe z.B. Dun-
ford/Schwartz [6])
\
)
=
_
n |.

_
R
n
)
(t) n(t). .
i)
(t) dt

< fr i = 1. .... /
)
_
.
mit n
)
|, 0. /
)
N, und .
i)
1
1
(R. R
n
) fr i = 1. .... /
)
. , = 1. 2. Wir
mssen zeigen, dass es 1
0
0 gibt mit (1
0
. \
1
) \
2
,= O. Es gibt 1 0,
so dass fr alle i. ,
_
R\[T,T]
[.
i)
(t)[ dt <

diaml
.
Setze 1
0
:= 21 und deniere
(t) =
_
n
2
(t + 21) fr t (. 1]
n
1
(t) fr t (1. ) .
Dann \
1
weil fr i = 1. .... /
1

_
R
n
1
(t) (t). .
i1
(t) dt

_
_
T
o
[n
1
(t) (t). .
i1
(t)[ dt
_ diaml
_
T
o
[.
i1
(t)[ dt < .
Andererseits ist, (1
0
. ) \
2
. weil fr i = 1. .... /
2

_
R
n
2
(t) (t 1
0
). .
i2
(t) dt

_
R
n
2
(t + 21) (t). .
i2
(t + 21) dt

_
o
T
n
2
(t + 21) n
1
(t). .
i2
(t + 21) dt

_
o
T
n
2
(t) n
1
(t 21). .
i2
(t) dt

_ diaml
_
o
T
[.
i2
(t)[ dt < .
62 KAPITEL 4. DER KONTROLLFLUSS
Bemerkung 71 Ein stetiger Fluss heit topologisch transitiv, falls ein r
A existiert mit
.(r) = A. lim
t
k
o
(t
I
. r) = = A.
Jeder topologisch mischende Fluss ist topologisch transitiv (siehe z.B. Colo-
nius/Kliemann [4, Proposition B.2.4]).
4.2 Der Kontrolluss
Um die Bedingungen zu klren, die sich aus der Forderung nach stetiger Ab-
hngigkeit der Trajektorien von den Kontrollen ergeben, betrachte zunchst
Systeme der Form
_ r(t) = ,(n(t)). n(t) , l R
n
.
Sei n
a
n
0
in 1
o
(R. R
n
) und betrachte der Einfachheit halber r(0) = 0.
Dann ist
r
a
(t) =
_
t
0
,(n
a
(:)) d:.
Man erhlt Konvergenz, falls die Abbildungen
n
_
t
0
,(n(:)) d:
von der Form (4.2) mit einer 1
1
-Funktion ist. Dies ist zum Beispiel der Fall,
wenn
,(n) =
n

i=1
n
i
(:),
i
.
Dann ist
_
t
0
,(n(:)) d: =
_
o
o
n(:)
T
.(:) d: fr n 1
o
(R. R
n
)
mit . 1
1
(R. R
n
) deniert durch
.(:) =
[0,t]
(:)(,
1
. .... ,
n
)
T
.
Wir werden sehen, dass alle kontrollanen Systeme erlaubt sind, also Syste-
me der Form
_ r(t) = ,
0
(r(t)) +
n

i=1
n
i
(t),
i
(r(t)). n |. (4.4)
4.2. DER KONTROLLFLUSS 63
in R
a
unter unseren Standard-Voraussetzungen. Fr n | und r R
a
ist
die eindeutige Lsung mit ,(0. r. n) = r wieder ,(t. r. n). t R.
Der zugehrige Kontrolluss ist
: R | R
a
| R
a
. (t. n. r) = ((t. n). ,(t. r. n)).
Satz 72 Die Abbildung deniert ein stetiges dynamisches System auf |
R
a
.
Beweis. Die Gruppeneigenschaften gelten natrlich und der Shift ist nach
Proposition 68 stetig. Fr die Stetigkeit von betrachte Folgen t
I
t
0
in
R, n
I
n
0
in |, und r
I
r
0
in R
a
. Krze ab ,
I
(t) = ,(t. r
I
. n
I
). t R,
/ = 0. 1. ... .
Wir mssen ,
I
(t
I
) ,
0
(t
0
) zeigen. Man ndet

,
a
(t
I
) ,
0
(t
0
)

,
a
(t
I
) ,
a
(t
0
)

,
a
(t
0
) ,
0
(t
0
)

.
Der erste Summand geht gegen 0 wegen der gleichmigen Beschrnktheit
der Ableitungen, und es ist

,
I
(t
0
) ,
0
(t
0
)

r
I
r
0

_
t
0
0
_
,
0
(,
I
(t)) ,
0
(,
0
(t))

dt

_
t
0
0
n

i=1
n
I
i
(t)
_
,
i
(,
I
(t)) ,
i
(,
0
(t))

dt

_
t
0
0
n

i=1
_
n
I
i
(t) n
0
i
(t)

,
i
(,
0
(t)) dt

.
Hier konvergieren der erste und der vierte Summand gegen 0 nach Annah-
me; der zweite und dritte sind nach oben durch c
1
_
t
0
0

,
I
(t) ,
0
(t)

dt be-
schrnkt, wobei c
1
von den Lipschitz-Konstanten der Vektorfelder ,
0
. .... ,
n
und dem Kontrollwertebereich l abhngt. Dann liefert Gronwalls Lemma
die Behauptung.
Wir zeigen jetzt, dass der Kontrolluss ber den Kontrollmengen die Ei-
genschaften des Shifts erbt. Deniere den Lift von Kontrollmengen 1 `
(mit nichtleerem Innern) nach | R
a
durch
T = cl (n. r) | `. ,(t. r. n) int1 fr alle t R . (4.5)
Beachte, dass T und
(n. r) | `. ,(t. r. n) int1 fr alle t R
invariant unter sind; ist 1 beschrnkt, so ist der Lift T kompakt.
64 KAPITEL 4. DER KONTROLLFLUSS
Proposition 73 Es sei 1 R
a
eine Kontrollmenge mit nichtleerem Innern
und jeder Punkt im Innern von 1 sei lokal akzessibel. Dann hat der Lift T
|R
a
von 1 die folgenden Eigenschaften: (i) die periodischen Punkte von
sind dicht in T; (ii) Die Restriktion von auf T ist topologisch mischend.
Beweis. (i) Es reicht zu zeigen, dass jedes (n. r) T mit ,(t. r. n) int1
fr alle t R durch periodische Punkte approximiert werden kann. Whle
solch ein (n. r) und eine Umgebung \ = (\ `) T von (n. r) mit \ |
und ` `. Wir knnen annehmen, dass
\ =
_
|.

_
R
n(t) (t). .
i
(t) dt

< fr i = 1. .... /
_
mit .
i
1
1
(R. R
n
). Es gibt 1 0. so dass fr i = 1. .... /
_
R\[T,T]
[.
i
(t)[ dt <

diaml
.
Nach Annahme gilt ,(1. r. n), ,(1. r. n) int1. Daher existieren, wegen
exakter Kontrollierbarkeit in int1, eine Zeit 1
1
0 und n
0
| mit
,(1
1
. ,(1. r. n). n
0
) = ,(1. r. n).
Deniere
n
j
(t) =
_
n(t). t [1. 1]
n
0
(t 1). t [1. 1 +1
1
]
und setze n
j
zu einer (21 + 1
1
)-periodischen Funktion auf R fort. Die zu-
gehrige Trajektorie ,(t. r. n
j
) ist ebenfalls periodisch mit Periode 21 + 1
1
und enthalten in int 1, wegen der Maximalitt von Kontrollmengen. Daher
ist (n
j
. r) ein periodischer Punkt in T. Ferner gilt fr i = 1. .... /,

_
R
n(t) n
j
(t). .
i
(t) dt

_ diaml
_
R\[T,T]
[.
i
(t)[ dt < .
Also ist n
j
\ und daher (n
j
. r) \.
(ii) Wir mssen zeigen, dass fr jedes Paar \
1
. \
2
von oenen Men-
gen in T ein 1
0
0 existiert, so dass (1
0
. \
1
) \
2
,= O. Wir kn-
nen wieder annehmen, dass fr , = 1. 2 die Menge \
)
die folgende Form
hat: \
)
= (\
)
`
)
) T mit ,(t. r
)
. n
)
) int1 fr alle t R, `
)
=
R
a
. |r
)
| < , und
\
)
=
_
n |.

_
R
n
)
(t) n(t). .
i)
(t) dt

< fr i = 1. .... /
)
_
.
4.2. DER KONTROLLFLUSS 65
Es gibt 1 0, so dass fr , = 1. 2 und i = 1. .... /
)
_
R\[T,T]
[.
i)
(t)[ dt <

diaml
. (4.6)
Ferner gibt es t
0
0 und n
0
| mit ,(t
0
. ,(1. r
2
. n
2
). n
0
) = ,(1. r
1
. n
1
).
Deniere n | durch
n(t) =
_
_
_
n
2
(t) fr t (. 1]
n
0
(t 1) fr t [1. 1 +t
0
)
n
1
(t t
0
21) fr t [1 +t
0
. ).
Mit (4.6) sieht man, dass n \
2
und n(t
0
+ 21 + ) \
1
. Ferner gilt nach
Konstruktion
,(t
0
+ 21. r
2
. n) = ,(t
0
+1. ,(1. r
2
. n
2
). n
0
) = r
1
.
Daher ist (n. r
2
) \
2
und (n(t
0
+ 21 + ). ,(t
0
+ 21. r
2
. n)) \
1
und die
Behauptung folgt mit 1
0
:= t
0
+ 21.
In der folgenden Situation erhlt man ohne weiteres die Existenz einer
Kontrollmenge: Sei (n. r) | R
a
ein periodischer Punkt. Aus den
Denitionen folgt unmittelbar, dass eine Kontrollmenge 1 R
a
existiert
mit r 1. Mit n = 0 | gilt dies insbesondere fr einen periodischen
Punkt des unkontrollierten Systems _ r = ,
0
(r).
Fr allgemeine kompakte invariante Mengen gilt das folgende Resultat.
Lemma 74 Es sei \ |R
a
eine kompakte invariante Menge mit Projek-
tion :
R
n \ in R
a
. Dann gibt es eine Kontrollmenge 1 R
a
mit :
R
n \1 ,=
O. Insbesondere gilt dies fr kompakte .Limesmengen .(n. r).
Beweis. Jede kompakte invariante Menge enthlt eine minimale abgeschlos-
sene invariante Teilmenge, etwa \
0
. Dann ist jede Trajektorie dicht in \
0
und daher sind alle r. :
R
n \
0
von einander approximativ erreichbar, also
enthalten in einer Kontrollmenge.
Das folgende Resultat zeigt, dass es eine 1-1-Beziehung zwischen Kontroll-
mengen und maximalen topologisch mischenden Mengen des Kontrollusses
gibt.
Satz 75 Es sei T | R
a
eine kompakte Menge, so dass
:
R
nT =r R
a
. es gibt n | mit (n. r) T
66 KAPITEL 4. DER KONTROLLFLUSS
nichtleeres Inneres hat und aus lokal akzessiblen Punkten besteht. Die Menge
T genau dann eine maximale topologisch mischend, wenn es eine Kontroll-
menge 1 gibt, so dass T ihr Lift von der Form (4.5) ist. In diesem Fall ist
1 eindeutig und
int1 = int :
R
nT und cl1 = :
R
nT. (4.7)
Beweis. Wir betrachten zunchst T deniert in (4.5). Nach Proposition 73
ist T topologisch mischend. Sie erfllt auch die erste Gleichung in (4.7), weil
cl 1 = cl int1 und weil fr jedes r int1 ein n | existiert, so dass
,(. r. n) periodisch und enthalten in int1 ist. Dann folgt auch die zweite
Gleichung.
Wir mssen noch die Maximalitt von T zeigen: ist T
t
T topologisch
mischend, so auch topologisch transitiv (bung). Also existiert (n. r) T
t
mit .(n. r) = T
t
und daher gibt es t
0
R, so dass ,(t. r. n) int1 fr alle
t _ t
0
. Wegen r
0
= ,(t
0
. r. n) int1. gibt es | mit ,(t. r. ) int1 fr
alle t < 0. Deniere
n
0
(t) =
_
(t +t
0
) fr t < t
0
n(t) fr t _ t
0
.
Dann ist (n
0
. r
0
) T und ,(t. r
0
. n
0
) int1 fr alle t R. und .(n
0
. r
0
) =
.(n. r) = T
t
. Daher ist T
t
= .(n
0
. r
0
) T, weil T abgeschlossen ist, und es
folgt die Maximalitt von T.
Fr die umgekehrte Richtung betrachte eine maximale topologisch mi-
schende Menge T mit int(:
R
nT) ,= O. Wir zeigen, dass es fr r
1
. r
2

int(:
R
nT) eine Kontrolle n | und t 0 gibt mit ,(t. r
1
. n) = r
2
: Sei

1
intO
+
(r
1
) int :
R
nT und
2
intO

(r
2
) int(:
R
nT). Betrachte Um-
gebungen \
1
von
1
und \
2
von
2
mit \
1
intO
+
(r
1
) und \
2
intO

(r
2
).
Weil T topologisch transitiv ist, gibt es (n. r) mit .(n. r) = T. Daher kann
ein Punkt in \
2
von einem Punkt in \
1
erreicht werden, und also kann r
2
von r
1
erreicht werden, wie behauptet. Dies impliziert die Existenz einer
Kontrollmenge 1 mit int(:
R
nT) int1. Dann kann man 1 zu einer ma-
ximalen topologisch mischenden Menge T
t
liften. Wir behaupten T
t
T;
dann impliziert die Maximalitt von T
t
, dass T
t
= T, wie gewnscht. Wegen
.(n. r) = T und int(:
R
nT) int1 = int(:
R
nT
t
). ndet man wie im ersten
Teil des Beweises (n
0
. r
0
) mit .(n
0
. r
0
) = T. Nun impliziert die Invarianz
von T
t
, dass T
t
T.
Theorem 75 zeigt, dass im lokale akzessiblen Fall die maximalen topolo-
gisch mischenden Mengen, deren Projektion auf R
a
innere Punkte hat, durch
Kontrollierbarkeitseigenschaften charakterisiert sind. Dieses Resultat ist der
Ausgangspunkt fr eine Theorie, die Kontrollsysteme als dynamische Syste-
me interpretiert, und die Kontrollmengen als die geeigneten Limesobjekte.
4.2. DER KONTROLLFLUSS 67
Dann kann man zum Beispiel Linearisierung, Bifurkationsfragen, etc. disku-
tieren. Kontrollsysteme erweisen sich damit als eine besondere Klasse von
nichtautonomen Dierentialgleichungen, die spezielle Eigenschaften haben,
so dass viele Fragen im Kontext der Theorie dynamischer Systeme, genauer
der Schiefproduktsse, behandelt werden knnen.
Bei der numerischen Lsung von Dierentialgleichungen kann man im
Allgemeinen kleine Sprnge nicht ausschlieen. Daher ist die Forderung nach
Kontrollierbarkeit von einem Punkt zum anderen sehr scharf und numerisch
schwer nachprfbar. Einen Hinweis, wie man dies umgehen kann, erhlt man
aus der Theorie dynamischer Systeme: Kettentransienz erlaubt (beliebig)
kleine Sprnge. Der folgende Begri ist eine Adaption an die Situation von
Kontrollsystemen und stellt eine Abschwchung der Kontrollierbarkeitsfor-
derung dar.
Weil der Shift auf | und der Kontrolluss eingeschrnkt auf den Lift T
einer beschrnkten Kontrollmenge mit nichtleerem Innern topologisch tran-
sitiv sind, folgt, dass diese Flsse kettentransitiv sind. Wir werden jedoch
sehen, dass dies nicht die einzigen kettentransitiven Mengen des Kontrollus-
ses sind Dafr fhren wir eine abgeschwchte Version von approximativer
Kontrollierbarkeit ein, die kleine Sprnge erlaubt.
Denition 76 Es seien r. R
a
und . 1 0. Eine kontrollierte (. 1)Kette
. von r nach ist gegeben durch / N. r
0
. .... r
I
R
a
. n
0
. .... n
I1
| und
t
0
. .... t
I1
_ 1 mit r
0
= r. r
I
= . und
d(,(t
)
. r
)
. n
)
). r
)+1
) _ fr alle , = 0. .... / 1.
Gibt es fr alle . 1 0 eine (. 1)Kette von r nach , so ist der Punkt r
nach kettenkontrollierbar.
Denition 77 Eine Menge 1 R
a
heit Kettenkontrollmenge des Systems
(4.4) falls (i) es fr alle r 1 eine Kontrolle n | gibt, so dass ,(t. r. n)
1 fr alle t R, (ii) fr alle r. 1 und . 1 0 eine kontrollierte
(. 1)Kette von r nach existiert, und 1 maximal mit diesen Eigenschaften
ist.
Man beweist leicht, dass jede Kontrollmenge mit nichtleerem Innern in
einer Kettenkontrollmenge enthalten ist:
Proposition 78 Es sei 1 eine Kontrollmenge mit nichtleerem Innern und
es gelte lokale Akzessibilitt in int1. Dann ist cl1 in einer Kettenkontroll-
menge 1 enthalten.
68 KAPITEL 4. DER KONTROLLFLUSS
Beweis. Wir mssen zeigen, dass (i) fr jedes r cl1 eine Kontrolle n |
mit ,(t. r. n) cl1 fr alle t R existiert, und dass (ii) fr jedes r cl1
zu jedem cl1 kettenkontrollierbar ist. Beides ist klar fr r. int1.
Fr r cl1 = cl int1 gibt es r
a
int1 mit r
a
r. Whle n
a
| mit
,(t. r
a
. n
a
) 1 fr alle t R. Geht man zu einer konvergenten Teilfolge in |
ber, so liefert die Stetigkeit des Kontrollusses die Behauptung. Analog sieht
man, dass fr r J1 und 1 0 eine Kontrolle n existiert mit ,(1. r. n)
cl1. Dann kann man in int1 springen und so eine (. 1)Kette nach cl1
nden.
Die Dierenz zwischen Kontrollmengen und Kettenkontrollmengen kann
man in der folgenden Situation sehen. Es seien, unter den obigen Annahmen,
1 ,= 1
t
Kontrollmengen mit nichtleerem Innern, so dass cl1 cl1
t
,= ?.
Dann gibt es eine Kettenkontrollmenge, die cl1 ' cl1
t
enthlt. (bung)
Wir notieren auch das folgende Resultat.
Proposition 79 Jede Kettenkontrollmenge ist abgeschlossen.
Beweis. Wenn eine Folge (r
I
) in einer Kettenkontrollmenge 1 gegen r kon-
vergiert, so nden man n
I
| mit ,(t. r
I
. n
I
) 1 fr alle t R. Weil |
kompakt ist, knnen wir annehmen, dass (n
I
) gegen n | konvergiert. Ste-
tigkeit des Kontrollusses impliziert, dass ,(t. r
I
. n
I
) ,(t. r. n) fr jedes
t R und daher ist ,(t. r. n) 1. Ferner gilt Kettenkontrollierbarkeit fr
alle r. cl1, und daher ist cl1 = 1.
Wie Kontrollmengen liften wir auch Kettenkontrollmengen 1 auf | R
a
,
c = (n. r) | R
a
. ,(t. r. n) 1 fr alle t R . (4.8)
Satz 80 Seit 1 R
a
eine Kettenkontrollmenge des Systems (4.4). Dann ist
der Lift c | R
a
deniert in (4.8) eine maximale invariante kettentran-
sitive Menge fr den Kontrolluss (| R
a
. ). Ist umgekehrt c | R
a
eine maximale invariante kettentransitive Menge fr den Kontrolluss, so ist
:
R
nc eine Kettenkontrollmenge.
Beweis. (i) Es seien (n. r). (. ) c und . 1 0. Erinnere die Denition
der Metrik d auf | in (4.3) und whle ` N gro genug, so dass
o

i=.+1
2
i
<

2
.
Fr endlich viele .
1
. ..... .
.
1
1
(R. R
n
) gibt es 1
0
0, so dass fr alle i
_
R\[T
0
,T
0
]
[.
i
(t)[ dt <

2 diaml
.
4.2. DER KONTROLLFLUSS 69
O.B.d.A. knnen wir 1 1
0
annehmen. Kettenkontrollierbarkeit von ,(21. r. n)
1 nach ,(1. . ) 1 liefert die Existenz von / N und r
0
. .... r
I

R
a
. n
0
. .... n
I1
|. t
0
. .... t
I1
_ 1 mit r
0
= ,(21. r. n). r
I
= ,(1. . ).
und
|,(t
)
. r
)
. n
)
) r
)+1
| < fr , = 0. .... / 1.
Wir konstruieren jetzt eine (. 1)Kette von (n. r) nach (. ) folgenderma-
en. Deniere
t
2
= 1. r
2
= r.
2
= n.
t
1
= 1. r
1
= ,(1. r. n).
1
(t) =
_
n(t
2
+t) fr t _ t
1
n
0
(t t
1
) fr t t
1
und nimm die Zeiten t
0
. .... t
I1
und die Punkte r
0
. .... r
I
wie oben gegeben.
Setze ferner
t
I
= 1. r
I+1
= .
I+1
= .
und deniere fr , = 0. .... / 2

)
(t) =
_
_
_

)1
(t
)1
+t) fr t _ 0
n
)
(t) fr 0 < t < t
)
n
)+1
(t t
)
) fr t t
)
.

I1
(t) =
_
_
_

I2
(t
I2
+t) fr t _ 0
n
I1
(t) fr 0 < t _ t
I1
(t t
I1
1) fr t t
I1
.

I
(t) =
_

I1
(t
I1
+t) fr t _ 0
(t 1) fr t 0.
Man sieht leicht, dass
(
2
. r
2
). (
1
. r
1
). .... (
I+1
. r
I+1
) und t
2
. t
1
. .... t
I
_ 1
eine (. 1)Kette von (n. r) nach (. ) bilden, falls fr , = 2. 1. .... /
d(
)
(t
)
+).
)+1
) < .
Nach Wahl von 1 und ` gilt fr alle n
1
. n
2
|
d(n
1
. n
2
) =
o

i=1
2
i

_
R
n
1
(t) n
2
(t). .
i
(t) dt

1 +

_
R
n
1
(t) n
2
(t). .
i
(t) dt

_
.

i=1
2
i
_

_
R\[T,T]
n
1
(t) n
2
(t). .
i
(t) dt

_
T
T
n
1
(t) n
2
(t). .
i
(t) dt

_
+

2
< + max
i=1,...,.
_
T
T
[n
1
(t) n
2
(t)[ [.
i
(t)[ dt.
70 KAPITEL 4. DER KONTROLLFLUSS
Daher reicht es zu zeigen, dass fr die betrachteten Paare von Kontrollfunk-
tionen die Integranden verschwinden. Dies folgt unmittelbar aus der Deni-
tion von
)
. , = 2. .... / + 1.
(ii) Es sei c eine invariante, kettentransitive Menge in | R
a
. Fr r
:
R
nc gibt es wegen der Invarianz n |, so dass ,(t. r. n) c fr alle
t R. Nun betrachte r. :
R
nc und whle 0. 1 0. Wegen der
Kettentransitivitt von c knnen wir r
)
. n
)
. t
)
nden, so dass die zugehrigen
Trajektorien die geforderte Bedingung erfllen.
Der Beweis von (i) und (ii) wird abgeschlossen durch die Beobachtung,
dass 1 genau dann ist maximal, wenn c maximal ist.
In Lemma 74 haben wir gesehen, dass jede projizierte .Limesmenge
nichtleeren Schnitt mit einer Kontrollmenge hat. Weil .Limesmengen ket-
tentransitiv sind, erhalten wir als Korollar zu Theorem 80, dass ihre Projek-
tionen in Kettenkontrollmengen enthalten sind.
Korollar 81 Fr das System (4.4) betrachte (n. r) | R
a
mit beschrnk-
ter positiver Trajektorie ,(t. r. n). t _ 0. Dann existiert eine Kettenkontroll-
menge 1, so dass die projizierte .Limesmenge in 1 enthalten ist, also
:
A
.(n. r) 1.
Beweis. Dies folgt aus Theorem 80, weil .Limesmengen kettentransitiv
sind.
Bemerkung 82 Eine interessante Frage ist, wann eine Kettenkontrollmen-
ge gleich dem Abschluss einer Kontrollmenge mit nichtleerem Innern ist.
Dies gilt nicht, falls die Abschlsse zweier Kontrollmengen einen nichtleeren
Schnitt haben, die Kontrollmengen sich also berhren. Betrachtet man para-
meterabhngige Systeme, so entspricht dies einer Bifurkation von Kontroll-
mengen, ist also eine Ausnahmesituation. In der Tat kann man Bedingungen
angeben, unter denen die Abschlsse von Kontrollmengen mit nichtleerem In-
nern generisch (d.h. typischerweise) Kettenkontrollmengen sind (vgl. Gayer
[8]).
Kapitel 5
Berechnung von
Erreichbarkeitsmengen
In diesem Kapitel werden wir numerische Verfahren prsentieren, die es er-
lauben, Erreichbarkeitsmengen und Kontrollmengen zu approximieren. Sie
beruhen auf mengewertiger Dynamik, wie sie etwa in dem berblicksarti-
kel Dellnitz/Junge [5] erklrt werden. Fr Kontrollsysteme beziehen wir uns
insbesondere auf Szolnoki [22], [21].
5.1 Relative Globale Attraktoren
In Numerik III haben wir relative globale Attraktoren von Homomorphis-
men und ihre numerische Berechnung mit Hilfe von Subdivisionsalgorithmen
studiert. Analog dazu betrachten wir in diesem Abschnitt relative globale
Attraktoren von Kontrollssen und geben zumnchst eine Charakterisie-
rung mit Hilfe von Kettenkontrollmengen, bevor wir im weiteren auf ihre
numerische Berechnung eingehen. Wir betrachten weiterhin kontroll-ane
Systeme unter den Standard-Voraussetzungen an Existenz und Eindeutig-
keit von Lsungen. Allerdings legen wir eine kompakte Teilmenge Q R
a
des Zustandsraums zu Grunde.
Denition 83 Fr eine kompakte Menge 1 | R
a
heit

1
:=

t0
(t. 1)
globaler Attraktor des Kontrollusses relativ zu 1.
71
72 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Dies ist analog zum Fall dynamischer Systeme im zeitdiskreten Fall, wo
man den globalen Attraktor relativ zu 1 als

1
:=

)0
,
)
(1)
deniert.
Proposition 84 Es sei Q R
a
kompakt. Dann ist der globale Attraktor des
Kontrollusses relativ zu 1 = | Q gegeben durch
1 = (n. r) | R
a
. ,(t. r. n) Q fr alle t _ 0.
Beweis. Dies folgt leicht aus den Denitionen: Ist (n. r)

t0
(t. 1) so
folgt fr jedes 1 _ 0, dass

T
(n. r)
T
((1. 1)) = 1 = | Q.
Umgekehrt folgt aus (n. r) 1, dass fr jedes 1 _ 0

T
(n. r) = (n(1 +). ,(t. r. n)) | Q = 1.
Bemerkung 85 Die Menge
Viab

Q
= r R
a
. es gibt n | mit ,(t. r. n) Q fr alle t _ 0
heit auch negativer Viabilittskern (oder Kontrollierbarkeits-Kern) von Q.
Der relative globale Attraktor ist also gleich dem Lift des negativen Viabili-
ttskerns, und seine Projektion in R
a
ist gleich dem negativen Viabilittskern.
Analog kann man auch positive Viabilittskerne und RViabilittskerne (fr
die also ,(t. r. n) Q fr alle t R gilt) denieren. Man beachte, dass
oenbar gilt
Viab
R
Q
= Viab
+
Q
Viab

Q
.
Oenbar ist die Komponente des relativen globalen Attraktors in | nicht
von Interesse. Stattdessen interessieren wir uns fr seine R
a
Komponente,
also den Viabilittskern. Als nchstes charakterisieren wir relative globale
Attraktoren mit Hilfe von Kontrollierbarkeitseigenschaften. Weil nur das Ver-
halten in der kompakten (nicht notwendigerweise invarianten) Menge Q R
a
relevant ist, mssen wir die Denition von Kettenkontrollmengen etwas ver-
allgemeinern.
5.1. RELATIVE GLOBALE ATTRAKTOREN 73
Denition 86 Eine Menge 1
Q
Q heit Kettenkontrollmenge relativ zu
Q, falls sie maximal ist mit den Eigenschaften
(i) fr alle r 1
Q
existiert eine Kontrolle n | mit ,(t. r. n) 1
Q
fr
alle t R;
(ii) fr alle r. 1
Q
und . 1 0 existiert eine kontrollierte (. 1)Kette
von r nach , die ganz in Q enthalten ist, fr die also ,(t. r
)
. n
)
) Q fr
alle t [0. t
)
]. , = 0. 1. .... / 1. gilt.
Wir bentigen darberhinaus den Attraktionsbereich solch einer relativen
Kettenkontrollmenge.
Denition 87 Fr eine Kettenkontrollmenge 1
Q
relativ zu Q ist der positive
und der negative Attraktionsbereich (relativ zu Q) deniert durch
A
+
Q
(1
Q
) = r Q. es gibt n | mit ,(t. r. n) Q. t _ 0 und :
2
.(n. r) 1
Q
.
A

Q
(1
Q
) = r Q. es gibt n | mit ,(t. r. n) Q. t _ 0 und :
2
c(n. r) 1
Q
.
Der folgende Satz (Szolnoki [20]) charakterisiert Viabilittskerne mit Hilfe
von Kontrollierbarkeitseigenschaften.
Satz 88 Es sei Q R
a
kompakt. Dann ist
Viab
+
Q
=
_
1
Q
A
+
Q
(1
Q
) und Viab

Q
=
_
1
Q
A

Q
(1
Q
);
hierbei wird die Vereinigung ber alle Kettenkontrollmengen 1
Q
relativ zu Q
genommen.
Beweis. Wir zeigen die Behauptung nur fr positive Viabilittskerne, die fr
negative folgt analog. Sei zunchst r Viab
+
Q
. Dann gibt es eine Kontrol-
le n | mit ,(t. r. n) Q fr alle t _ 0. Die Kompaktheit von | Q
impliziert, dass .(n. r) | Q nicht leer ist. Ferner ist der Kontroll-
uss eingeschrnkt auf eine .Limesmenge kettentransitiv (siehe zum Bei-
spiel [4, Appendix B.2]). Daher knnen je zwei Elemente in .(n. r) durch
(. 1)Ketten in .(n. r) miteinander verbunden werden. Ihre Projektion auf
die R
a
Komponente ist enthalten in Q. Da fr jedes Element :
2
.(n. r)
eine Kontrolle | mit ,(t. . ) :
2
.(n. r) fr alle t _ 0 existiert, ist
:
2
.(n. r) in einer relativen Kettenkontrollmenge 1
Q
enthalten. Oenbar ist
r A
+
Q
(1
Q
).
Die umgekehrte Inklusion gilt, weil nach Konstruktion der relative posi-
tive Attraktionsbereich einer relativen Kettenkontrollmenge positiv viabel in
Q, also enthalten in Viab
+
Q
ist.
74 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Oenbar ergibt sich fr den RViabilittskern
Viab
R
Q
=
_
1
Q
A
+
Q
(1
Q
)
_
1
Q
A

Q
(1
Q
). (5.1)
Stimmen die relativen Kettenkontrollmengen mit den Abschlssen von Kon-
trollmengen 1 berein, so folgt auch
Viab
R
Q
=
_
1
A
+
Q
(cl1)
_
1
A

Q
(cl1). (5.2)
wobei die Vereinigungen ber alle Kontrollmengen 1 Q genommen wer-
den. Hier wird also auch angenommen, dass die Menge Q so gewhlt ist, dass
eine Kontrollmenge 1, die nichtleeren Schnitt mit Q hat, ganz in Q enthalten
ist.
Das folgende Beispiel aus der chemischen Technologie (das vereinfachte
Modell eines sog. stetigen Rhrkessel-Reaktors) illustriert diese Resultate.
Beispiel 89 Betrachte die folgende Modellgleichung (siehe Uppal, Ray, Poo-
re [23])
_ r = r +1c(1 )c
a
n(t)(r r
c
)
_ = +c(1 )c
a
.
Hier ist r die (dimensionslose) Temperatur und die Produktkonzentration
im Reaktor, die Khlmitteltemperatur ist r
c
, und c und 1 sind technische
Konstanten. Die Flussrate n(t) des Khlmittels dient als Kontrolle. Whle
c = 0.05. 1 = 10. r
c
= 1.
Dann stellt sich heraus, dass fr das unkontrollierte System mit n = 0 zwei
stabile Gleichgewichte und ein hyperbolisches Gleichgewicht existieren. (Die
folgenden Bilder sind numerisch erzeugt mit dem Subdivisionsalgorithmus fr
Kontrollsysteme.)
Wir notieren das folgende Resultat zur Approximation von Kettenkon-
trollmengen.
Korollar 90 Sei Q R
a
kompakt, und Q enthalte genau eine relative Ket-
tenkontrollmenge 1
Q
. Dann ist
Viab
R
(Q) = 1
Q
.
(i) Ist 1
Q
= cl1 fr eine Kontrollmenge 1, so ist Viab
R
(Q) = cl1.
(ii) Ist 1
Q
= C eine invariante Kontrollmenge, so ist Viab

(Q) = C.
5.1. RELATIVE GLOBALE ATTRAKTOREN 75
76 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
5.1. RELATIVE GLOBALE ATTRAKTOREN 77
Beweis. Die Gleichung (5.1) zeigt, dass
Viab
R
Q
= A
+
Q
(1
Q
) A

Q
(1
Q
) = 1
Q
.
wobei die zweite Gleichung aus der Maximalitt von Kettenkontrollmengen
folgt. (i) ist eine unmittelbare Folgerung und (ii) ergibt sich aus der posi-
tiven Invarianz von C, und der Tatsache, dass jede Trajektorie in Q eine
.Limesmenge in 1
Q
= C hat, also
Q
(1) = Q und damit
C = A

Q
(C) = A

Q
(1
Q
) = Viab

Q
.
Ist man durch geschickte Wahl von Q sicher, dass die Voraussetzungen
dieses Korollars erfllt sind, so kann man zur Berechnung einer Kontrollmen-
ge zunchst etwa Viab
+
(Q) berechnen, und dann
r Viab
+
(Q). r Viab

(Q) = Viab
+
(Q) Viab

(Q) =
_
1.
Fr invariante Kontrollmengen reicht es, nur Viab

(Q) zu berechnen.
Im weiteren werden wir drei numerische Algorithmen fr die Berechnung
von (Ketten-)kontrollmengen und ihrer Einzugsbereiche diskutieren: basie-
rend auf Subdivision, Fortsetzung (continuation) und symbolischen Bildern.
78 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
5.2 Grundalgorithmus zur Subdivision
In Analogie zum Fall zeitdiskreter dynamischer Systeme erlutern wir hier
die Grundidee des Subdivisionsalgorithmus fr Kontrollsysteme, und einige
der auftretenden Probleme.
Betrachte ein zeitdiskretes Kontrollsystem in R
a
r
I+1
= ,(r
I
.
I
). / Z.
mit Kontrollen
I
in einer Menge \ und Trajektorien (/. r. (
n
)
nZ
). /
Z. Wir nehmen an, dass fr alle \ die Abbildung ,

:= ,(. ) ein
Homomorphismus auf Q ist. Approximiere den zugehrigen (zeitdiskreten)
ZViabilittskern
Viab
Z
Q
:= r R
a
. (/. r. (
n
)
nZ
) Q fr alle / Z (5.3)
in einer kompakten Menge Q R
a
auf die folgende Weise:
Starte in der trivialen Zerlegung E
0
= Q und konstruiere Familien von
abgeschlossenen Teilmengen E
I
aus E
I1
in zwei rekursiven Schritten:
(i) Subdivisionsschritt: Konstruiere E
t
I
so dass
_
1B
0
k
1 =
_
1B
k1
1
und
max diam1 E
t
I
= o
I
diam1 E
I1

mit 0 < o
min
_ o
I
_ o
max
< 1.
(ii) Auswahlschritt: Deniere E
0
I
= E
t
I
und fr , = 1. 2. ...setze
E
)
I
=
_
1 E
)1
I
.

1
\ 1
1
E
)1
I
: ,

1
(1) 1
1
,= O und

2
\ 1
2
E
)1
I
: ,
1

2
(1) 1
2
,= O
_
.
Bemerkung 91 Die Iteration im Auswahlschritt endet nach hchstens #E
0
I
Schritten.
Bemerkung 92 Will man diesen Algorithmus fr die Berechnung von Via-
bilittskernen von Kontrollsystemen in stetiger Zeit einsetzen, so muss man
zeitliche und rumliche Diskretisierungen vornehmen und den Raum der Kon-
trollfunktionen diskretisieren. Whlt man fr ein System der Form
_ r = 1(r. n(t)). n(t) l.
5.2. GRUNDALGORITHMUS ZUR SUBDIVISION 79
mit Lsungen ,(t. r. n) etwa die Zeitschrittweite t 0 so erhlt man ein
System der Form
r
I+1
= ,(r
I
.
I
) := ,(t. r
I
.
I
)
mit
I
\ := 1
o
([0. t]. R
n
). n(t) l fr fast alle t [0. t]. Der
Kontrollwertebereich ist also selber unendlich-dimensional. Ferner ist es nicht
klar, ob man fr Kettenkontrollmengen mit Vielfachen von t auskommt; und
schlielich ist die Berechnung von Bilder der Form
,

(1) = ,(t. r. ). r 1
schwierig.
Die Konvergenz der Grundform des Subdivisionsalgorithmus ergibt sich
wie fr zeitdiskrete dynamische Systeme.
Proposition 93 Es sei Q R
a
kompakt. Dann gilt fr die durch den Sub-
divisionsalgorithmus erzeugte Folge von Mengen
Q
I
:=
_
1cB
k
1.
dass
Viab
Z
Q
=
o

I=0
Q
I
.
Beweis. Oenbar ist Viab
Z
Q
schwach (oder kontrolliert-) invariant in folgen-
dem Sinn: Fr jedes r Viab
Z
Q
existiert eine Kontrollfolge (
n
)
nZ
, so dass
die zugehrige Lsung fr alle / Z in Q bleibt. Wir zeigen zunchst
Viab
Z
Q
Q
I
fr alle / = 0. 1. ... (5.4)
Das ist klar fr Q
0
= Q. Sei jetzt Viab
Z
Q
Q
I1
und r Viab
Z
Q
mit r , Q
I
.
Dann existiert 1 E
t
I
mit r 1, und dies 1 wird im /ten Auswahlschritt
entfernt, also gilt die Negation von
\ 1
1
E
t
I
: ,

(1) 1
1
,= O und \ 1
2
E
t
I
: ,
1

(1) 1
2
,= O,
also
\ \ : ,

(1) Q
I1
= O oder \ \ : ,
1

(1) Q
I1
= O.
Daher ist
\ \ : ,

(r) , Q
I1
oder \ \ : ,
1

(r) , Q
I1
.
80 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Dies widerspricht der oben erwhnten schwachen Invarianz von Viab
Q
, und
damit ist (5.4) gezeigt.
Ist ` Q, so dass fr alle r ` Kontrollen
+
und

\ existieren
mit
,

+(r) ` und ,
1

(r) `. (5.5)
so folgt ` Viab
Z
Q
. In der Tat: Fr r ` gibt es
+
1
.

1
\ mit
,

+
1
(r) ` Q und ,
1

1
(r) ` Q.
Fr ,

+
1
(r). ,

1
(r) ` gibt es wieder Kontrollen
+
2
.

2
\ mit
,

+
2
,

+
1
(r) ` Q und ,
1

2
,
1

1
(r) ` Q.
Auf diese Weise deniert man induktiv eine Kontrollfolge, so dass die zuge-
hrige Lsung fr alle Zeiten in Q bleibt, also ist r Viab
Z
Q
.
Es bleibt nur noch zu zeigen, dass die kompakte Teilmenge
Q
o
:=
o

I=0
Q
I
Q
die Bedingung (5.5) erfllt, denn dann ist sie in Viab
Z
Q
enthalten. Dazu sieht
man zunchst, dass Q
I
Q
I+1
und daher ist fr jedes / N
Q
I
=
I

|=0
Q
|
.
Daraus folgt, dass Q
o
der Limes im Hausdor-Sinn der Q
I
ist. Gibt es, im
Widerspruch zur Behauptung, ein Q
o
, so dass
\ \ : ,

() , Q
o
oder \ \ : ,
1

(r) , Q
o
.
so gibt es o 0 mit
min d(,

(). Q
o
). \ o oder min d(,
1

(). Q
o
). \ o.
Also gibt es ` N, so dass fr alle / _ `
max d(,

(). Q
I
). \ o oder max d(,
1

(). Q
I
). \ o.
Fr jedes / whle eine Menge 1
I
() E
I
mit 1
I
(). Weil diam1
I
() 0
fr / , folgt aus der Stetigkeit von ,, dass fr / gro genug
\ \ : ,

(1
I
()) Q
I
= O oder \ \ : ,
1

(1
I
()) Q
I
= O.
im Widerspruch zu den Denitionen.
Bemerkung 94 Den gleichen Beweis kann man benutzen, um die Konver-
genz eines Subdivisionsalgorithmus fr den positiven und den negativen Via-
bilittskern Viab

Q
zu zeigen.
5.3. ZEITDISKRETISIERUNG 81
5.3 Zeitdiskretisierung
In diesem Abschnitt analysieren wir, wann man zu einer festen Zeitschritt-
weite t 0 bergehen kann.
Betrachte das zeitkontinuierliche Kontrollsystem (4.4)
_ r(t) = ,
0
(r(t)) +
n

i=1
n
i
(t),
i
(r(t)). n |.
mit Trajektorien ,(t. r. n). t R, und eine kompakte Teilmenge Q R
a
.
Whle eine Schrittweite t 0, und betrachte das zeitdiskrete Kontrollsystem
mit
t
0
= 0. t
I+1
= t
I
+t. r
I+1
= ,(t. r
I+1
. n(t
I
+))
mit Lsungen (/. r. ).
I
= (n(t
I
+)[ [0. t]). / Z.
Oenbar ist dann (/. r. ) = ,(t
I
. r. n). / Z. Dies impliziert sofort,
dass der Viabilittskern Viab
R
Q
des zeitkontinuierlichen Systems in dem Via-
bilittskern Viab
Z
Q
des zeitdiskreten Systems enthalten ist,
Viab
R
Q
Viab
Z
Q
.
Hier ist eine hinreichende Bedingung, die garantiert, dass die beiden ber-
einstimmen: Sie fordert, dass der Viabilittskern hinreichend weit im Innern
von Q liegt (oder t 0 klein genug ist). Wir bezeichnen die Kugel um r
0
mit Radius : 0 mit B(r
0
. :).
Proposition 95 Es sei 1 0 eine Konstante mit
_
_
_
_
_
,
0
(r) +
n

i=1
n
i
,
i
(r)
_
_
_
_
_
_ 1 fr alle r R
a
und n l. (5.6)
Ferner sei
B(r
0
. 1t,2) Q fr alle r
0
Viab
Z
Q
. (5.7)
Dann folgt
Viab
R
Q
= Viab
Z
Q
.
Beweis. Fr r Viab
Z
Q
gibt es eine Kontrolle n |, so dass
r
I
= ,(t
I
. r. n) Viab
Z
Q
Q. / Z.
Wir mssen also zeigen, dass auch fr die Zwischenzeiten t [t
I
. t
I+1
] =
[/t. (/ + 1)t] die Trajektorie in Q liegt, d.h.
r(t) = ,(t. r
I
. n(t
I
+)) Q fr alle t [0. t].
82 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Wir berechnen fr t [0. t,2]
|,(t. r
I
. n(t
I
+)) r
I
| _
_
_
_
_
_
_
t
0
_
,
0
(r(:)) +
n

i=1
n
i
(:),
i
(r(:))
_
d:
_
_
_
_
_
_ 1t,2
und analog fr t [t,2. t]
|,(t. r
I
. n(t
I
+)) r
I
| _ 1t,2.
Also gilt fr alle t [0. t], dass ,(t. r
I
. n(t
I
+)) B(r
I
. 1t,2)'B(r
+1
. 1t,2)
Q, weil r
I
. r
I+1
Viab
Z
Q
.
Bemerkung 96 Die Bedingung (5.6) ist sehr stark, weil sie fr alle r R
a
gelten soll. Ist der interessierende Bereich kompakt, so kann man auerhalb
davon die Vektorfelder ,
i
abndern,.so dass die Beschrnktheit gilt.
5.4 Zeitdiskretisierung und Kettenerreichbar-
keit
Wir haben oben gesehen, dass, unter einer Zusatzbedingung, die Berechnung
von Viabilittskernen in stetiger Zeit auf die von solchen in diskreter Zeit
zurckgefhrt werden kann. Andererseits wissen wir, dass, in stetiger Zeit,
Viabilittskernen durch die in ihnen enthaltenen relativen Kettenkontroll-
mengen und ihre Einzugsbereiche beschrieben werden. Insbesondere kann
man, wenn in der zugrundeliegenden Menge Q nur eine einzige relative Ket-
tenkontrollmenge 1
Q
liegt, sie beschreiben durch
1
Q
= Viab
R
(Q) = Viab
+
(Q) Viab

(Q)
= Viab
Z
(Q).
wobei die letzte Gleichheit nur unter der Zusatzbedingung gezeigt ist. Unser
nchstes Ziel ist es, einen Graphen-Algorithmus fr die Berechnung von Ket-
tenkontrollmengen zu entwickeln. Dafr mssen wir zunchst diskutieren, ob
man auch ohne diese Zusatzbedingung relative Kettenkontrollmengen durch
das zeitdiskretisierte System beschreiben kann. Dazu fhren wir zeitdiskre-
te Erreichbarkeits- und Kettenerreichbarkeitsmengen ein. Sei im Folgenden
Q R
a
kompakt.
Denition 97 Sei Q R
a
kompakt und t 0. Die positive und die negative
tKettenerreichbarkeitsmenge von r Q ist deniert als
O
+
Q,t
(r) =
_
Q.
\ 0 kontrollierte (. t) Kette in Q
von r nach mit Sprungzeiten t
i
= t
_
.
5.5. GRAPHEN-ALGORITHMUS 83
O

Q,t
(r) =
_
Q.
\ 0 kontrollierte (. t) Kette in Q
von nach r mit Sprungzeiten t
i
= t
_
.
Die Beziehung zu den Kettenkontrollmengen des zeitkontinuierlichen Sys-
tems klren die folgenden Propositionen.
Proposition 98 Es sei Q R
a
kompakt und r. seien in einer Kettenkon-
trollmenge 1
Q
relativ zu Q. Dann existieren fr alle . t 0 kontrollierte
(. t)Ketten von r nach in 1
Q
mit allen Sprungzeiten gleich t.
Beweis. Siehe Szolnoki [22, Proposition 3.1].
Proposition 99 Es sei Q R
a
kompakt, Q und r. Viab
R
(O
+
Q,t
(r)
O

Q,t
(r)). Dann existiert fr alle . 1 0 eine kontrollierte (. 1)Kette von
r nach in Q.
Beweis. Siehe Szolnoki [22, Proposition 3.2].
Als Folgerung aus diesen Propositionen und der Maximalitt von Viabi-
littskernen erhlt man das folgende Korollar.
Korollar 100 Es sei Q R
a
kompakt und r sei in einer Kettenkontroll-
menge 1
Q
relativ zu Q.Dann folgt
1
Q
= Viab
R
(O
+
Q,t
(r) O

Q,t
(r)).
Dies Korollar zeigt, dass man Kettenkontrollmenge numerisch durch den
Schnitt der Kettenerreichbarkeitsmengen in positiver und in negativer Zeit
berechnen kann, sobald man einen Punkt darin kennt.
5.5 Graphen-Algorithmus
In diesem Abschnitt werden wir Kontrollsystemen bei gegebener Diskretisie-
rung einen gerichteten Graphen (ein symbolisches Bild) zuordnen, der we-
sentliche Eigenschaften des Kontrollsystems widerspiegelt. Dann kann man
Standardmethoden aus der Graphentheorie anwenden, um alle Kettenkon-
trollmengen zu berechnen; dabei ist es nicht ntig, schon ihre Anzahl oder
einzelne Punkte darin zu kennen. Diese Idee (fr Abbildungen) erscheint zu-
erst in einer Arbeit von G. Osipenko (1983) und ist insbesondere von M.
Dellnitz zu einer ezienten numerischen Methode ausgebaut worden.
Ein gerichteter Graph G = (\. 1) besteht aus einer Menge \ von Knoten
und einer Teilmenge 1 \ \ von gerichteten Kanten. Ein Pfad von einem
Knoten \ zu einem Knoten \ ist gegeben durch (
i
.
i+1
) 1. i =
84 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
0. .... :1. mit
0
= und
a
=
t
. Eine starke Zusammenhangskomponente
von G ist eine maximale Teilmenge o \ , so dass fr alle .
t
o ein Pfad
in o von nach
t
existiert.
Wir betrachten jetzt ein kontrollanes System in R
a
unter unseren Stan-
dardvoraussetzungen an Existenz und Eindeutigkeit von Lsungen ,(t. r. n).
n |. Sei t 0 eine Zeitschrittweite und Q R
a
eine kompakte Menge.
Ferner sei eine Folge von Partitionen T
I
von Q in kompakte Mengen gegeben,
so dass
_
1T
k
1 = Q. int1 int1
t
= O fr 1 ,= 1
t
. o
I
:= max
1T
k
diam1 0.
und fr alle 1 T
I+1
ein 1
t
T
I
mit 1 1
t
existiert.
Der Graphenalgorithmus fr Symbolische Bilder.
Schritt1: Setze E
1
= T
1
= Q;
Schritt / (/ = 2. 3. ...) Am Anfang von Schritt / haben wir eine Kollek-
tion E
I1
T
I1
. Deniere E
I
in 2 Schritten:
Schritt k.1 (Subdivision): Wir gehen zu T
I
ber, indem wir set-
zen:
^
E
I
:=
I
T
I
.
I1
E
I1
:
I

I1
;
Schritt k.2: Konstruiere den gerichteten Graphen G
I
= (\
I
. 1
I
) mit
\
I
=
^
E
I
und
1
I
= (1. 1
t
)
^
E
I

^
E
I
: 1
t
,(t. 1. n). n | ,= O.
Berechne die starken Zusammenhangskomponenten von G
I
und setze
E
I
:= 1
^
E
I
. 1 ist in einer starken Zus.komp.von G
I
.
Wir werden zeigen, dass die Vereinigung der Boxen in E
I
fr /
gegen die Kettenkontrollmengen relativ zu Q konvergiert.
Lemma 101 Sei 1
Q
eine Kettenkontrollmenge relativ zu Q. Dann existiert
fr alle / N eine starke Zusammenhangskomponente o von G
I
mit
1
Q

_
1S
1.
Beweis. Wir beweisen die Behauptung durch Induktion ber /, wobei der
Induktionsanfang trivial ist. Es gebe jetzt eine starke Zusammenhangskom-
ponente o
I1
E
I1
mit 1
Q

1S
k1
1.Dann existiert
^
o
I

^
E
I
mit
_
1
^
S
k
1 =
_
1S
k1
1 1
Q
..
5.5. GRAPHEN-ALGORITHMUS 85
Nun betrachte Schritt k.2 des Algorithmus. Wir mssen zeigen, dass es eine
starke Zusammenhangskomponente von
^
o
I
gibt, die E
Q
enthlt. Seien dazu
r. 1
Q


1
^
S
k
1. dann gibt es 1. 1
t

^
o
I
mit r 1 und 1
t
. Wir
mssen einen Pfad von 1 nach 1
t
konstruieren. Es gibt
0
0, so dass fr
alle 1
1
. 1
2
T
I
gilt:
1
1
,(t. 1
1
. n). n | ,= O == d
1
(1
1
. ,(t. 1
1
. n). n |)
0
.
Dies folgt, weil 1
1
. 1
2
und | kompakt sind und , stetig ist. Whle jetzt fr
<
0
eine kontrollierte Kette (alle Sprungzeiten gleich t) in 1
Q
von r
nach , so dass also fr alle i gilt
|,(t. r
i
. n
i
) r
i+1
| < .
Dann liegt ,(t. r
i
. n
i
) in der Box, die r
i+1
enthlt. Daher gibt es einen Pfad
von r
0
= r nach r
a
= .
Der folgende Satz zeigt, dass in der Tat die im Graphen-Algorithmus
erzeugte Folge von starken Zusammenhangskomponenten gegen die relati-
ven Kettenkontrollmengen konvergiert (sie bilden eine Approximation von
auen).
Satz 102 Es sei
o
o
:=
o

I=1
_
1B
k
1.
Dann ist
Viab
R
(o
o
) =
_
1
Q
.
wobei die Vereinigung ber alle Kettenkontrollmengen relativ zu Q genommen
wird.
Beweis. Aus dem Lemma 102 folgt

1
Q
o
o
.Weil relative Kettenkon-
trollmengen viabel sind, folgt damit die eine Inklusion. Sei umgekehrt r
Viab
R
(o
o
). Fr alle / N gibt es eine starke Zusammenhangskomponente
~
o
I
von G
I
mit r
~
o
I
. Also gibt es einen Pfad von r nach r, dessen Knoten
aus Boxen 1 besteht mit diam1 _ o
I
= diamT
I
. Daher gibt es fr alle 0
ein /, so dass der Pfad eine kontrollierte (. t)Kette in Q von r nach r
enthlt, und daher
r Viab
R
_
O
+
Q,t
(r) O

Q,t
(r)
_
.
und die rechte Seite ist eine Kettenkontrollmenge relativ zu Q.
86 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Wir wenden uns jetzt der Berechnung von starken Zusammenhangskom-
ponenten in gerichteten Graphen zu. Dies geschieht mit einer doppelten An-
wendung von sog. Tiefensuche , die wir zunchst erklren. Dabei werden allen
Knoten in einem gerichteten Graphen G = (\. 1) zwei natrliche Zahlen zu-
geordnet. Dafr denieren wir zunchst fr einen Knoten \ die Menge
() := n \. (. n) 1 der direkten Nachfolger von .
Algorithmus Tiefensuche.
Schritt 1: Initialisiere c(n) := 0. .(n) = 0 fr alle n \ ;
Zhlvariable / := 1;
Wir starten mit einem beliebigen Knoten \.
Schritt 2: (a) Setze c() := /. / := / + 1;
(b) Fhre Schritt 2 rekursiv fr alle n () mit c(n) = 0
aus, und kehre dann wieder hierher zurck;
(c) Setze c(n) := /. / := / + 1;
Schritt 3: Existiert noch ein Knoten \ mit c() = 0, so starte erneut
mit Schritt 2 fr .
Der Algorithmus terminiert, wenn alle c und .Werte gesetzt sind.
Dieser Algorithmus ist, so wie er hier rekursiv durchgefhrt wird, sehr
speicheraufwndig; es wird unntig viel Arbeitsspeicher von Verwaltungsva-
riablen belegt, weil rekursive Funktionen sich selbst aufrufen. Dies wird bei
einer hohen Anzahl von Kanten problematisch. Man kann die Rekursivitt
umgehen, in dem man Schritt 2 so modizieren, dass er immer beendet wird,
bevor wir ihn neu aufrufen. Dazu mssen wir allerdings speichern, von wel-
chem Knoten aus Schritt 2 aufgerufen wurde. Als Speicherstruktur bietet
sich der sogenannte Stapel an. Ein Stapel ist eine Liste von Elementen, in
unserem Fall Knoten, in der immer nur das erste (=oberste) Element gelesen
oder gelscht wird. Neue Elemente knnen immer nur oben eingefgt werden.
Algorithmus Nichtrekursive Tiefensuche
Schritt 1: Initialisiere c(n) := 0. .(n) = 0 fr alle n \ ;
Zhlvariable / := 1;
Lege einen beliebigen Knoten \ auf den Stapel;
Schritt 2: ist das oberste Element des Stapels;
(a) Wenn c() = 0. dann setze c() := /. / := / + 1;
(b) Existiert ein n () mit c(n) = 0, dann lege n auf
den Stapel und fhre Schritt 2 erneut aus;
(c) Setze .() := /. / := / + 1 und nimm vom Stapel;
ist der Stapel leer, dann gehe zu Schritt 3, starte ansonsten
Schritt 2 erneut;
5.5. GRAPHEN-ALGORITHMUS 87
Schritt 3: Existiert noch ein Knoten \ mit c() = 0, so lege auf den
Stapel und starte erneut mit Schritt 2..
Der Algorithmus terminiert wieder, wenn alle c und .Werte gesetzt
worden sind. Der Schritt 2 wird jedesmal beendet, bevor er erneut aufgerufen
wird.
Dieser Algorithmus ist von A. Marquardt in GAIO-Algorithmen fr Kon-
trollsysteme implementiert (vgl. auch Marquardt [15]).
Die beiden Algorithmen laufen, wenn die frei whlbaren Knoten identisch
gewhlt sind, auch identisch ab und vergeben damit auch dieselben c und
.Werte.
Die Berechnung der starken Zusammenhangskomponenten basiert im We-
sentlichen auf der doppelten Ausfhrung der Tiefensuche. Im Folgenden wer-
den Knoten, fr die kein Pfad zu sich zurck existiert, als einpunktige Zu-
sammenhangskomponenten deniert. Sie sind von einpunktigen Zusammen-
hangskomponenten zu unterscheiden, fr die eine Kante zu auf sich selbst
existiert, und werden bei dem Graphen-Algorithmus fr symbolische Bilder
nicht bercksichtigt.
Algorithmus Starke Zusammenhangskomponenten
Wir ermitteln die starken Zusammenhangskomponenten des gerichteten
Graphen G = (\. 1). Die Knoten werden in eine Reihenfolge gebracht, in
der die Knoten einer Komponente jeweils nebeneinander liegen. Der erste
Knoten jeder Komponente, wir nennen ihn Startknoten, wird in die Menge
o := O eingefgt. Wir benutzen dabei auch den zu G invertierten Graphen
H = (\. 1), wobei 1 = (c. /). (/. c) 1.
Schritt 1: Fhre die Tiefensuche auf G aus;
Lege den Knoten \ mit maximalem .Wert auf den Stapel;
Schritt 2: Fhre die Tiefensuche auf H aus und vergib dabei Werte fr
(~ c. ~ .). Whle dabei jedesmal, wenn in Schritt 1 oder Schritt 3 ein Knoten
frei gewhlt werden kann, den Knoten : = arg max
&
^
1
.(n), wobei 1
0
:=
n \. ~ c(n) = 0 die Menge der noch nicht besuchten Knoten ist.
Dieser Algorithmus fhrt in Schritt 1 die Tiefensuche aus, um die Startrei-
henfolge der Knoten fr die zweite Tiefensuche auf dem invertierten Graphen
in Schritt 2 zu erhalten. Diese setzt ausgehend von dem Startknoten : zuerst
~ c(:), dann die ~ c und ~ .Werte der von : besuchten Knoten und danach
~ .(:). Wir fassen diese Knoten in der Menge
1(:) := \. ~ c(:) _ ~ c() < ~ .() _ ~ .(:) (5.8)
zusammen. Der zu \ gehrende Startknoten ist :() und die Menge aller
Startknoten bezeichnen wir mit o \ .
88 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
Aus der Konstruktion der Zhlvariablen folgt sofort, dass c() < .()
und ~ c() < ~ .() fr alle \ . Wir bezeichnen mit :cc() \ die starke
Zusammenhangskomponente (strongly connected component), die enthlt.
Satz 103 Die von dem obigen Algorithmus berechneten Mengen 1(:). : o.
in (5.8) sind die starken Zusammenhangskomponenten des Graphen G.
:cc() = 1(:()) fr alle \ .
Beweis. Sei zunchst n :cc() fr n ,= . Dann existieren in G Pfade
=
0
.
1
. ....
a
= n und n = n
0
. n
1
. .... n
n
= von nach n und von
n nach . Dies liefert auch Pfade auf dem invertierten Graphen H, gegeben
durch n =
a
.
a1
. ....
0
= und = n
a
. n
n1
. .... n
0
= n.
Wir nehmen an, dass bei der Tiefensuche auf H (Schritt 2) vor n erreicht
wird, d.h. ~ c() < ~ c(n). Dann existiert ein Pfad in H von : := :() nach ,
und es gibt einen Pfad in H von : (ber ) nach n. Die Tiefensuche in H
luft also von : zu , dann zu n und wieder zurck zu :. Das heit n 1(:).
Fr die umgekehrte Inklusion 1(:()) :cc() whle einen Startknoten
: und zwei beliebige Knoten . n 1(:) mit ,= :. Dann existiert ein Pfad
in H von : nach und ein Pfad in G von nach : Da in Schritt 2 der Knoten
: und nicht gewhlt wurde, gilt .(:) .(). Auf Grund des Pfades in G
von nach :, muss : vor erreicht werden, da ansonsten .(:) < .() gelten
msste. Damit ergibt sich
c(:) < c() < .() < .(:).
Demzufolge existiert in G ein Pfad von : nach . Der Knoten liegt also in
derselben starken Zusammenhangskomponente wie :, das heit, :cc(:).
Analog zeigt man, dass n :cc(:). Folglich liegen und n in derselben
starken Zusammenhangskomponente (vgl. auch Jungnickel [12].)
Die starken Zusammenhangskomponenten zerlegen die Knotenmenge in
disjunkte Knotenmengen, von denen es keinen Pfad zu einem anderen Kno-
ten und wieder zurck gibt, bilden jeweils eine einpunktige Komponente.
Der Graphenalgorithmus whlt aus den starken Zusammenhangskomponen-
ten diejenigen aus, die mehrere Knoten enthalten oder einpunktig sind und
eine Kante auf sich selbst enthalten.
5.6. VARIANTEN DES SUBDIVISIONS-ALGORITHMUS 89
5.6 Varianten des Subdivisions-Algorithmus
Im Weiteren nehmen wir an, dass zeitdiskrete Viabilittskerne berechnet wer-
den sollen und diskutieren Varianten des Auswahlschritts, die zu Verbesse-
rungen der Konvergenzgeschwindigkeit bzw. zu geringeren Speicheranforde-
rungen fhren.
Der zweite Teil des Grundalgorithmus besteht aus dem Auswahlschritt,
der zum Beispiel fr die Vorwrts-Zeitrichtung die folgende Form hat. Fr
eine (verfeinerte) Zerlegung E
t
I
deniere E
I
durch
E
I
= 1 E
t
I
.
1
\ 1
1
E
t
I
: ,

1
(1) 1
1
,= O .
Wir nehmen jetzt an, dass eine Zerlegung vorgegeben ist. Fr das im vorigen
Abschnitt eingefhrte System mssen wir im Auswahlschritt berprfen, ob
fr Mengen 1
1
. 1
2
aus der Zerlegung
,(t. r. n). r 1
1
und n | 1
2
,= O.
Mit

t
(1
1
. n) := ,(t. r. n). r 1
1
. n |.
knnen wir dies auch schreiben als

t
(1
1
. n) 1
2
,= O.
Hier entsteht also zum Einen das aus der Dynamik bekannte Problem, dass
fr alle r aus einer Menge die Bilder berechnet werden mssen; zustzlich
mssen alle Kontrollfunktionen n : [0. t] l berprft werden. Man wird
gengend viele geeignete Testpunkte r
i
nehmen, und geeignete, zum Beispiel
konstante Kontrollen oder stckweise konstante mit einer festen Zahl von
xierten Umschaltpunkten whlen. Eine rigorose Strategie, die garantiert,
dass keine Mengen weggelassen werden, ist in Grne [9] entwickelt.
Hier werden wir ein anderes Problem genauer diskutieren (vgl. Szolnoki
[21]). In der obigen Version wird fr jede Box berprft, ob eine Kontrolle
existiert, so dass das Bild in Q bleibt. Dann folgt bereits ein Verfeinerungs-
schritt, also wird auf der nchsten Verfeinerungsstufe der Auswahlschritt
wiederholt. Da die Anzahl der Boxen sich blicherweise bei jeder Verfeine-
rung verdoppelt, wre es oenbar gnstiger, schon auf der grberen Ebene
die Anzahl der relevanten Boxen zu verkleinern.
Einfache Beispiele (etwa Berechnung der instabilen Mannigfaltigkeit eines
Fixpunktes) zeigen, dass man dies durch eine Wiederholung des Auswahl-
schritts (ohne Verfeinerung) erreichen kann. Dies fhrt zu dem folgenden
90 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
modizierten Subdivisions-Algorithmus fr eine gegebene Folge (,
I
)
IN
von
natrlichen Zahlen.
Starte in der trivialen Zerlegung E
0
= Q und konstruiere Familien von
abgeschlossenen Teilmengen E
I
aus E
I1
in zwei rekursiven Schritten:
(i) Subdivisionsschritt: Konstruiere E
t
I
, so dass
_
1B
0
k
1 =
_
1B
k1
1
und
max diam1 E
t
I
= o
I
diam1 E
I1

mit 0 < o
min
_ o
I
_ o
max
< 1.
(ii) Auswahlschritt: Deniere E
0
I
= E
t
I
und fr , = 1. 2. .... ,
I
setze
E
)
I
=
_
1 E
)1
I
.
1
\ 1
1
E
)1
I
: ,

1
(1) 1
1
,= O
_
.
Weil die Anzahl der Boxen auf dem Level / jeweils endlich ist, gibt es eine
Oberschranke fr die Zahl ,
I
der Schritte, die zu einer echten Verkleinerung
der Anzahl der Boxen fhren.
Der Konvergenzbeweis bertrgt sich ohne Weiteres auf diese Variante
des Subdivisions-Algorithmus.
Bemerkung 104 Siehe Szolnoki [21] fr eine Diskussion, wieviele Schritte
,
I
numerisch gnstig sind. Er schlgt vor, zur Verfeinerung berzugehen,
wenn die Anzahl der entfernten Boxen (relativ zur momentanen Gesamtzahl)
unter eine vorgegebene Schranke fllt.
Bemerkung 105 Entsprechende Modikationen des Subdivisions-Algorithmus
kann man auch fr die Berechnung von negativen Viabilittsbereichen und
solchen auf ganz R vornehmen
Wir wenden uns jetzt einer anderen Modikation zu, die auf Grne [9]
zurckgeht. Es sollen beschrnkte Teilmengen mit nichtleerem Innern des R
a
berechnet werden. Oenbar reicht es dafr, den (:1)dimensionalen Rand
solch einer Menge zu berechnen. Will man ihn berdecken, ist also die Anzahl
der bentigten Boxen wesentlich geringer.
Um einen solchen adaptiven Algorithmus (der sich auf den Rand der zu
berechnenden Menge konzentriert) zu formulieren, mssen wir jeder Box 1
in einer Partition E
I
noch einen Status :(1) zuordnen. Er hat (genau) einen
der folgenden Werte:
1` (inside), 11` (partially inside). l`1 (undened), oder Cl1 (outside).
5.6. VARIANTEN DES SUBDIVISIONS-ALGORITHMUS 91
Wir denieren die zugehrigen Punktmengen
(
1.
I
:=
_
1B
k
,c(1)=1.
1. (
11.
I
:=
_
1B
k
,c(1)=11.
1.
(
1.
I
:=
_
1B
k
,c(1)=1.
1 ' (
1.
I
. (
OlT
I
:=
_
1B
k
,c(1)=OlT
1 ' Q
c
.
Im adaptiven Subdivisionsalgorithmus berechnen wir fr eine Teilmenge o
intQ den negativen relativen Ketten-Orbit. Um den Algorithmus zu starten,
muss o Boxen der Anfangspartition enthalten, diese muss also insbesondere
fein genug sein.
Adaptiver Subdivisions-Algorithmus:
Schritt 1: Whle eine Zielmenge o intQ und setze / = 0.
Setze den Status aller Boxen 1 E
0
mit
:(1) :=
_
1` wenn 1 o
11` sonst
.
Bestimme die Mengen (
1.
0
. (
11.
0
und (
OlT
0
= Q
c
.
Schritt 2: Fhre den Subdivisions-Algorithmus folgendermaen aus:
(a) Beim bergang von E
I1
zur feineren Zerlegung
^
E
I
existieren fr alle
1 E
I1
Boxen
1
. ...
n

^
E
I
mit 1 =

n
i=1

i
. Setze im Subdivisions-
schritt :(
i
) := :(1).
(b) Fhre im Auswahlschritt E
I

^
E
I
die folgenden Status-Zuordnungen
durch:
(b1) Wiederhole fr alle 1
^
E
I
mit :(1) = l`1 oder :(1) = 11`
folgende Vorschrift so oft, bis sich kein Status mehr ndert:
:(1) :=
_

_
1` falls n | : (t. 1. n) E
1.
I
Cl1 falls \n | : (t. 1. l E
OlT
I
11` fallsn | : (t. 1. n) E
1.
I
,= O und ,n | : (t. 1. n) E
1.
I
l`1 sonst
.
Berechne jedesmal die Mengen (
1.
I
. (
11.
I
und (
OlT
I
neu.
(b2) Setze nach der Konvergenz fr alle 1 E
I
:
:(1) :=
_
Cl1. falls :(1) = l`1
l`1. falls :(1) = 11`
(b3) Berechne die Mengen (
1.
I
. (
11.
I
und (
OlT
I
erneut.
Da die Boxen in E
1.
I
und E
OlT
I
nicht abgebildet werden, mssen sie in
der Praxis auch nicht verfeinert werden. Das Verfahren bestimmt also selbst,
92 KAPITEL 5. BERECHNUNG VON ERREICHBARKEITSMENGEN
welche Boxen unterteilt werden mssen und ist in diesem Sinn adaptiv. Die
Mengenfolge, die nun den Rand der berechneten Menge beschreibt, ist
C
l.1
I
= 1
0

_
E
1.
I
' E
OlT
I
_
. fr / N.
Satz 106 Ergebnis der adaptiven Subdivision
Unter den obigen Voraussetzungen sei o
0
= E
1.
0
. Dann gilt fr alle /
N
0
:
(
1.
I
O

Q,t
(o
0
) ' o
0
(
1.
I
' (
l.1
I
(
OlT
I

_
O

Q,t
(o
0
) ' o
0
_
c
(
OlT
I
' (
l.1
I
J
_
O

Q,t
(o
0
) ' o
0
_
(
l.1
I
.
Fr einen einfachen Beweis siehe Marquardt [15]. Der obige Satz ent-
hlt noch keine Konvergenz-Aussagen (nur berdeckungs-Eigenschaften).
Einen Konvergenzbeweis bei rigorosen Raumdiskretisierungen liefert Grne
[9, Theorem 7.5.5].
Literaturverzeichnis
[1] J.-P. Aubin, Viability Theory, Birkhuser, 1991.
[2] B. Aulbach, Gewhnliche Dierentialgleichungen, Spektrum Akade-
mischer Verlag, 2004. Zweite Auage.
[3] D. Cohen, Measure Theory, Birkhuser Verlag, 1980.
[4] F. Colonius and W. Kliemann, The Dynamics of Control, Birk-
huser, 2000.
[5] M. Dellnitz and O. Junge, Set oriented numerical methods for dyna-
mical systems, in Handbook of Dynamical Systems. Volume, B. Fiedler,
ed., Elsevier, 2002, ch. 5, pp. 221264.
[6] N. Dunford and J. T. Schwartz, Linear Operators, Part I: General
Theory, Wiley-Interscience, 1977.
[7] F. Engelking, General Topology, PWN-Polish Scientic, Warszawa,
1977.
[8] T. Gayer, Control sets and their boundaries under parameter variation,
J. Di. Equations, 201 (2004), pp. 177200.
[9] L. Grne, Asymptotic Behavior of Dynamical and Control Systems
under Perturbation and Discretization, Springer-Verlag, 2002.
[10] D. Hinrichsen and A. Pritchard, Mathematical Systems Theory,
Springer-Verlag, 2005.
[11] A. Isidori, Nonlinear Control Systems, Springer-Verlag, 1998.
[12] D. Jungnickel, Graphs, Networks and Algorithms, Springer-Verlag,
2005.
[13] V. Jurdjevic, Geometric Control Theory, Cambridge University Press,
1997.
93
94 LITERATURVERZEICHNIS
[14] A. J. Krener, A generalization of Chows theorem and Bang-Bang
theorem for nonlinear control problems, SIAM J. Control Optim., 14
(1974), pp. 4352.
[15] A. Marquardt, Subdivisionsalgorithmen fr Kontrollierbarkeitsproble-
me, 2001. Diplomarbeit, Institut fr Mathematik, Universitt Augsburg.
[16] H. Nijmeijer and A. J. van der Schaft, Nonlinear Dynamical Con-
trol Systems, Springer-Verlag, 1990.
[17] G. K. Pedersen, Analysis Now, Springer-Verlag, 1988.
[18] S. Sastry, Nonlinear Systems. Analysis, Stability, and Control,
Springer-Verlag, 1999.
[19] E. D. Sontag, Mathematical Control Theory, Springer-Verlag, 1998.
Second Edition (First Edition, 1990).
[20] D. Szolnoki, Viability Kernels and Control Sets, ESAIM Control, Op-
timisation and Calculus of Variations, 5 (2000), pp. 175185.
[21] , Algorithms for reachability problems, 2001. Dissertation. Univer-
sitt Augsburg. Shaker Verlag Aachen.
[22] , Set oriented methods for computing reachable sets and control sets,
Discrete and Continuous Dynamical Systems-Series B, 3 (2003), pp. 361
382.
[23] A. Uppal, W. H. Ray, and A. B. Poore, On the dynamic behavior
of continuous stirred tank reactors, Chem. Eng. Sci., 19 (1974), pp. 967
985.