PresComOpt PDF

Commande Optimale
Commande Optimale
Edouard Laroche
ENSPS - 3A ISAV
laroche@lsiit.u-strasbg.fr
http://eavr.u-strasbg.fr/perso/edouard/Student/
E. Laroche
ENSPS - ISAV
Commande Optimale
Objectifs et Evaluation
Objectifs
Connaissance des methode de commande optimale
Capacite à mettre en oeuvre une telle commande
Evaluation
Bureau detude en simulation
E. Laroche
ENSPS - ISAV
Commande Optimale
Plan
Generalites sur les systèmes dynamiques
Introduction à la commande optimale
Commande Lineaire Quadratique
Commande Lineaire Quadratique Gaussienne
Etude dun cas pratique
E. Laroche
ENSPS - ISAV
Commande Optimale
Notations
hermicien dun vecteur o` u dune matrice M
H
= (M
)
T
= (M
T
)
derivee dun vecteur par rapport à un vecteur

_
y(x)
x
_
i,j
=
y
i
(x)
x
j
E. Laroche
ENSPS - ISAV
Commande Optimale
Introduction sur les systèmes dynamiques
Dierents systèmes
Système à temps continu x = f(x, u, t) / à temps discret x
k+1
= f(x
k
, u
k
, t
k
)
Systèmes à temps variant x = f(x, u, t) / à temps invariant x = f(x, u)
Système lineaire LTV x = A(t)x + B(t)u ou LTI x = Ax + Bu
Proprietes
Commandabilite, stabilisabilite
Observabilite, detectabilite
E. Laroche
ENSPS - ISAV
Commande Optimale
Dierents types dasservissement
retour statique detat
retour statique de sortie
retour dynamique detat
retour dynamique de sortie
remarque : equivalence entre retour dynamique et retour statique
E. Laroche
ENSPS - ISAV
Commande Optimale
Proprietes des systèmes asservis
Stabilite
Valeurs singulières (reponses frequentielles)
Performances : bande passante
Robustesse
Marge de module
Roll-o
E. Laroche
ENSPS - ISAV
Commande Optimale
Introduction à la Commande Optimale
Système
Système à temps continu x = f(x, u, t)
avec x(t
0
) = x
0
Critère
Minimiser J(x
0
, t
0
, u) = (x(t
f
), t
f
) +
_
t
f
t
0
(x(t), u(t), t)dt
La commande optimale est u = arg
u
min J(x
0
, t
0
, u)
La valeur optimale du critère est

J(x
0
, t
0
) = J(x
0
, t
0
, u)
E. Laroche
ENSPS - ISAV
Commande Optimale
Contraintes
Sur le temps nal : libre ou impose
Sur letat nal x
f
X
f
Sur la commande u U
Principe doptimalite de Bellman
Notons u
[t
1
,t
f
]
la commande sur [t
1
, t
f
] avec t
0
< t
1
< t
f
Principe doptimalite de Bellman: la trajectoire optimale sur [t
0
, t
f
] contient la
trajectoire optimale sur [t
1
, t
f
] avec comme condition initiale x(t
1
).
Formulation mathematique :
J(x
0
, t
0
) = min
u
[t
0
,t
1
]
_
_
t
1
t
0
(x(t), u(t), t)dt +

J(x
1
, t
1
)
_
Application : recherche recursive dun chemin optimal
E. Laroche
ENSPS - ISAV
Commande Optimale
Principe du maximum de Pontriaguine
Lagrangien L(x, u, p, t) = (x, u, t) + p
T
f(x, u, t) (p : etat adjoit)
La solution optimale du problème sans contrainte verie le principe du
maximum :
L
x
= p
T
: equation adjointe, avec p(t
f
) =

x
(x(t
f
), t
f
) dans le cas dun
etat nal libre ;
L
u
= 0 ; il sagit de la condition de transversabilite dans le cas o` u aucune
contrainte nest imposee sur u ;
L
p
= x
T
, avec x(t
0
) donne ; il sagit de lequation du système x = f(x, u, t).
E. Laroche
ENSPS - ISAV
Commande Optimale
Equation dEuler-Lagrange
Un système mecanique denergie cynetique T et denergie potentielle U se
comporte de manière à minimiser laction S =
_
t
f
t
0
(T U)dt (Principe de
moindre action de Maupertuis)
Système q = u
Critère J(q, q) =
_
t
f
t
0
L(q(t), q(t))dt avec L = T U
Exercice : en appliquant le principe du mamimum de Pontriaguine, demontrez
lequation dEuler-Lagrange
d
dt
L
q

L
q
= 0
E. Laroche
ENSPS - ISAV
Commande Optimale
Commande bang-bang
Il sagit des commandes à temps minimal avec des contraintes intervalle sur les
commandes
La commande optimale est alors toujours egale au maximum ou au minimal
Exemple illustratif :
Système lineaire à une entree x = Ax + bu, x(t
0
) = x
0
co ut J =
_
t
f
t
0
dt = t
f
t
0
(temps minimal)
contrainte sur lentree 1 u(t) 1
contrainte sur letat nal x(t
f
) = 0
temps nal libre (toujours le cas pour un temps minimal)
E. Laroche
ENSPS - ISAV
Commande Optimale
Application du principe du maximum
Le Lagrangien est L(x, u, p, t) = 1 + p
T
Ax + p
T
bu
Le critère secrit J =
_
t
f
t
0
L(x, u, p, t)dt. La commande minimisant le critère
est u(t) = sign(b
T
p(t)).
Lequation adjointe est p = A
T
p avec p(t
f
) libre (car x(t
f
) impose)
Equation detat x = Ax bsign(b
T
p)
Système integrateur double
x
1
= x
2
, x
2
= u
A =
_
0 1
0 0
_
; B =
_
0
1
_
. (1)
exp(At) = I + At +
1
2
A
2
t
t
+ =
_
1 t
0 1
_
(2)
E. Laroche
ENSPS - ISAV
Commande Optimale
Resolution
p = A
T
p p(t) = exp(A
T
(t t
f
))p(tf)
p
1
(t) = p
1
(t
f
) (3)
p
2
(t) = (t
f
t)p
1
(t
f
) + p
2
(t
f
) (4)
u(t) = sign(p
2
(t)) (5)
x(t) = exp(A(t t
f
))x(t
f
) +
_
t
t
f
exp(A(t ))bu()d (6)
=
_
t
f
t
_
t
1
_
sign((t
f
)p
1
(t
f
) + p
2
(t
f
))d (7)
E. Laroche
ENSPS - ISAV
Commande Optimale
Caracterisation des points de commutation x(t
s
) denis par
(t
f
t
s
)p
1
(t
f
) + p
2
(t
f
) = 0.
x(t
s
) =
_
t
f
t
s
_
t
s

1
_
sign((t
s
)p
1
(t
f
))d (8)
= sign(p
1
(t
f
))
_
t
f
t
s
_
t
s

1
_
(9)
= sign(p
1
(t
f
))
_
1
2
(t
f
t
s
)
2
t
f
t
s
_
(10)
Pour p
1
(t
f
) > 0, les points de commutation appartiennent à la branche de
parabole dequation x
1
=
1
2
x
2
2
avec x
2
> 0 ; pour p
1
(t
f
) < 0, ils
appartiennent à la parabole dequation x
1
=
1
2
x
2
2
avec x
2
< 0. Le lieu complet
est deni par x
1
+
1
2
x
2
|x
2
| = 0.
Loi de commande optimale u(t) = sign(x
1
+
1
2
x
2
|x
2
|)
Representation des trajectoires dans lespace detat
E. Laroche
ENSPS - ISAV
Commande Optimale
Commande Lineaire Quadratique
Horizon ni
Position du problème
Système x = A(t)x + B(t)u
Critère J(x
0
, u) =
1
2
x
T
(t
f
)Sx(t
f
) +
_
t
f
t
0
1
2
_
x
T
(t)Q(t)x(t) + u
T
(t)R(t)u(t)
_
dt
avec Q = Q
T
0 et R = R
T
> 0
Formulation du problème par Pontriaguine avec
L(x, u, p, t) = p
T
A(t)x + p
T
B(t)u +
1
2
(x
T
Q(t)x + u
T
R(t)u)
L
u
= B
T
(t)p + R(t)u = 0
p =
L
x
= A
T
(t)p Q(t)x
p(t
f
) = Sx(t
f
)
E. Laroche
ENSPS - ISAV
Commande Optimale
Reformulation
u(t) = R
1
(t)B
T
(t)p(t)
x(t) = A(t)x(t) B(t)R
1
(t)B
T
(t)p(t)
p = A
T
(t)p Q(t)x
système Hamiltonien :
d
dt
_
x(t)
p(t)
_
=
_
A(t) B(t)R
1
(t)B
T
(t)
Q(t) A
T
(t)
_ _
x(t)
p(t)
_
(11)
Resolution
ecrivons p(t) = P(t)x(t) avec P(t
f
) = S
alors, p(t) =
_
A
T
(t)P(t) + Q(t)
_
x(t)
ce qui donne (

P + PA + A
T
P PBR
1
B
T
P + Q)x = 0
on obtient une equation (dierentielle) de Riccati :
P + PA + A
T
P PBR
1
B
T
P + Q = 0 avec P(t
f
) = S
Solution : u(t) = K(t)x(t) avec K(t) = R(t)
1
B(t)
T
P(t).
E. Laroche
ENSPS - ISAV
Commande Optimale
Horizon inni
On a necessairement x(t
f
) = 0 et la ponderation sur x(t
f
) na plus de sens
J(x
0
, u) =
_
t
0
1
2
_
x
T
(t)Q(t)x(t) + u
T
(t)R(t)u(t)
_
dt
Système LTI x = Ax + Bu
Solution
u(t) = Kx(t)
avec K = R
1
B
T
P
et P solution de lequation algebrique de Riccati
PA + A
T
P PBR
1
B
T
P + Q = 0
E. Laroche
ENSPS - ISAV
Commande Optimale
Commande LQ à temps discret : horizon ni
x(k + 1) = A(k)x(k) + B(k)u(k)
J =
1
2
k=n
k=0
x
T
(k)Q(k)x(k) + u
T
(k)R(k)u(k)
Resolution par le Lagrangien
L =
k=n
k=0
1
2
x
T
(k)Q(k)x(k) +
1
2
u
T
(k)R(k)u(k) + p
T
(k +
1) (x(k + 1) + A(k)x(k) + B(k)u(k))
L
u(k)
= R(k)u(k) + B
T
(k)p(k + 1) = 0
L
x(k)
= Q(k)x(k) p(k) + A
T
(k)p(k + 1) = 0
L
p(k+1)
= x(k + 1) + A(k)x(k) + B(k)u(k) = 0
Reformulation
Commande u(k) = R
1
(k)B
T
(k)p(k + 1) avec u(n) = 0 et donc
p(n + 1) = 0.
Lequation adjointe pour k = n donne p(n) = Q(n)x(n), on choisit alors
p(k) = P(k)x(k) avec P(n) = Q(n)
E. Laroche
ENSPS - ISAV
Commande Optimale
Solution
u(k) = K(k)x(k) avec
K(k) =

R
1
(k)B
T
(k)P(k + 1)A(k) et

R(k) = R(k) + B
T
(k)P(k + 1)B(k).
Determination de P(k)
P(k) = Q(k) + A
T
(k)P(k + 1)(A(k) B(k)K(k))
ce qui est equivalent à P(k) = Q(k) + A
T
(k)M(k + 1)A(k)
avec lequation de Riccati discrète M(k + 1) =
P(k + 1) P(k + 1)B(k)(R(k) + B
T
(k)P(k + 1)B(k))
1
B
T
(k)P(k + 1)
calcul à rebours à partir de P(n) = Q(n)
E. Laroche
ENSPS - ISAV
Commande Optimale
Commande LQ à temps discret : horizon inni
x(k + 1) = Ax(k) + Bu(k)
J =
1
2
k=0
x
T
(k)Qx(k) + u
T
(k)Ru(k)
Solution
u(k) = K(k)x(k)
avec K = (R + B
T
PB)
1
B
T
PA
et P solution de lequation algebrique de Riccati discrète
P = Q+ A
T
(P PB(R + B
T
PB)
1
B
T
P)A
E. Laroche
ENSPS - ISAV
Commande Optimale
Propriete de robustesse : marge de module 1
Dierence de retour : par des manipulations à partir de lequation de Riccati, on
obtient lequation de la dierence de retour :
(I + B
T
(sI A
T
)
1
K
T
)R(I + K(sI A)
1
B) =
R + B
T
(sI A
T
)
1
Q(sI A)
1
B
Inegalite de Kalman multivariable : en frequentiel (s = j) et en notant
H(j) = (jI A)
1
B, on obtient :
(I + KH(j))
H
R(I + KH(j)) = R + H
H
(j)QH(j) R
Dans le cas particulier o` u R = I et en ecrivant Q = L
T
L (factorisation de
Choleski), on obtient :
(I + KH(j))
H
(I + KH(j)) = I +
1
(LH(j))
H
(LH(j))
Marge de module : on en deduit :
i
(I + KH(j)) =
_
1 +
1
2
i
(LH(j)) 1
E. Laroche
ENSPS - ISAV
Commande Optimale
Reglage des ponderations
Remarque : la multiplication des ponderations Q et R par un meme scalaire ne
modie pas le regulateur
Restriction à des ponderations diagonales
Methodologie iterative
ponderations initiales : matrices identite.
Regler globalemnt la dynamique en multipliant Q ou R par un scalaire
Ajuster les dynamiques sur les dierents etats en ajustant les elements de Q
Ajuster les dunamiques des actionneurs en ajustant les elements de R
Schema de regulation
Prise en compte des signaux de consigne
Ajout dun terme integral
E. Laroche
ENSPS - ISAV
Commande Optimale
Commande Lineaire Quadratique Gaussienne
Formulation du problème
Système dynamique stochastique
_
x(t) = Ax(t) + Bu(t) + v(t)
y(t) = Cx(t) + w(t)
(12)
o` u v et le bruit de mesure w sont des bruits blancs centres de variance
E{v
T
v} = V = V
T
0 et E{w
T
w} = W = W
T
> 0
Critère
J(x
0
, u) = lim
t
f
E
_
1
t
f
_
t
f
t
0
_
(x(t))
T
Qx(t) + (u(t))
T
Ru(t)
_
dt
_
, (13)
avec Q = Q
T
0 et R = R
T
> 0
E. Laroche
ENSPS - ISAV
Commande Optimale
Principe de separation
La solution du problème LQG est donnee par les solutions de deux problèmes
connus :
le problème destimation optimale de letat dun système dynamique
stochastique (ltre de Kalman donnant une estimee x de x)
le problème de commande LQ optimale en supposant x connu, donnant un
retour detat de gain K.
La commande LQG est nalement u = K x
E. Laroche
ENSPS - ISAV
Commande Optimale
Structure de la commande
Equation de lobservateur
x(t) = Ax(t) + Bu(t) + L(y(t) Cx(t)) (14)

gain de Kalman : L = C
T
W
1
avec la solution de lequation algebrique de
Riccati : A
T
+ A C
T
W
1
C + V = 0
Equations du regulateur :
_

x(t) = (A BK LC) x(t) + Ly(t)
u(t) = K x(t)
(15)
equivalent à un transfert u = C(s)y avec
C(s) = K(sI A + BK + LC)
1
L.
Suivi de consigne : on peut facilement integrer un signal de sonsigne y
avec
u = C(s)(y
y).
E. Laroche
ENSPS - ISAV
Commande Optimale
Retour sur le principe de separation
Equations du système boucle avec u = w K
c
x :
_
_
_
x = Ax BK x + Bw
x = LCx + (A BK LC) x
y
= Cx C x
(16)
Avec
x
= x x, les equations du système secrivent :
_
_
_
x = (A BK)x BK
x
+ Bw

x
= (A LC)
x
y
= C
x
(17)
matrice detat bloc-triangulaire : ses valeurs propres = celles de A BK +
celles de A LC. On retrouve le principe de separation des modes de la
commande des modes dobservation.
E. Laroche
ENSPS - ISAV
Commande Optimale
Methode de reglage
Reglage du retour detat
Reglage du ltre de Kalman
Recouvrement du gain de boucle (LTR pour loop transfer recovery)
E. Laroche
ENSPS - ISAV
Commande Optimale
Formulation standard
Representation lineaire fractionnaire (LFR ou LFT ou produit de Redheer ou
star product)
Soit un système dynamique dentrees v et u et de sorties z et y
_
_
x(t)
z(t)
y(t)
_
_
=
_
_
A B
1
B
2
C
1
D
11
D
12
C
2
D
21
D
22
_
_
_
_
x(t)
v(t)
u(t)
_
_
(18)
boucle avec un correcteur K(s) dentree y et de sortie u
_
x
K
(t)
u(t)
_
=
_
A
K
B
K
C
K
D
K
_ _
x(t)
y(t)
_
(19)
Linterconnexion des deux systèmes est un système dentree v et de sortie z.
E. Laroche
ENSPS - ISAV
Commande Optimale
Principe de la formulation standard : synthetiser le correcteur permettant de
minimiser une norme sur le transfert entre v et z : K(s) = arg min ||T
zw
(s)||
n
Norme H
2
. Soit G(s) = C(sI A)
1
B un système LTI strictement propre. Sa
norme H
2
est ||G(s)||
2
=
_
_
1
2
_
tr [G
H
(j)G(j)] d
_
Norme H
: ||G(s)||
= max
(G(j)) o` u est la valeur singulière maximale.

Formulation standard de la commande LQ
Formulation standard de la commande LQG
E. Laroche
ENSPS - ISAV
Commande Optimale
Forme LQG equivalente
Principe
Soit un correcteur LTI nordre n
K
Est-il possible de le mettre sous une forme LQG : estimateur detat + retour
detat ?
Applications
retouche de correcteurs
interpolation de correcteurs (par interpolation des gains de la forme LQG)
E. Laroche
ENSPS - ISAV
Commande Optimale
Parametrisation de Youla dun correcteur LQG
Le modèle système + correcteur secrit :
_
_
_
x = (A BK)x BK
x
+ Bw

x
= (A LC)
x
y
= C
x
(20)
il presente :
n p oles non commandables (les valeurs propres de A LC)
n p oles non observables (les valeurs propres de A BK)
ces p oles sont distincts ; tous les p oles sont donc soit non commandables soit
non observables
le transfert entre w et
y
est donc nul
on peut donc ajouter nimporte quel transfert stable entre
y
et w sans
changer la dynamique du correcteur
on appelle paramètre de Youla ce transfert
E. Laroche
ENSPS - ISAV
Commande Optimale
Cas dun correcteur de meme ordre que le système
meme ordre paramètre de Youla statique : w = D
N
y
le correcteur LQG secrit alors
_

x = (A LC BK BD
N
C) x + (L + BD
N
)y
u = (K + D
N
C) x + D
N
y
(21)
Trouver les matrices de gain K et L ainsi que la metrice T du changement de
repère x
K
= T x tel que les 2 representations detat soient identiques du point
de vue entree-sortie
Ce qui secrit :
T
1
A
K
T = A LC BK BD
N
C (22)
T
1
B
K
= L + BD
N
(23)
C
K
T = K D
N
C (24)
D
K
= D
N
(25)
E. Laroche
ENSPS - ISAV
Commande Optimale
La solution est donnee par :
D
N
= D
K
(26)
K = C
K
T D
K
C (27)
L = T
1
B
K
BD
K
(28)
0 = TBC
K
T T(A BD
K
C) + A
K
T + B
K
C (29)
La dernière equation est une equation algebrique de Riccati non symetrique
(GNARE pour Generalized Non-symetric Algebraic Riccati Equation)
Cas dun correcteur dordre superieur : ajouter des modes non observables ou
non commandables à la representation detat du système pour obtenir un
modèle dordre n
K
E. Laroche
ENSPS - ISAV
Commande Optimale
Bureau detude
Pendule inverse
Commande LQ puis LQG
Mise en oeuvre des connaissances de cet enseignement mais aussi des autres
cours dautomatique
Methodologie
synthèse de la commande à partir du modèle linearise autour du point de
fonctionnement nominal
evaluation des performances et de la robustesse par analyse frequentielle sur le
modèle lineaire
validation nale du correcteur par simulation sur le modèle non-lineaire
E. Laroche
ENSPS - ISAV

PresComOpt PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

PresComOpt PDF

Hochgeladen von

Copyright:

Verfügbare Formate

Commande Optimale

derivee dun vecteur par rapport `a un vecteur

x(t) = Ax(t) + Bu(t) + L(y(t) Cx(t)) (14)

(G(j)) o` u est la valeur singuli`ere maximale.

Das könnte Ihnen auch gefallen