Pres Com Opt

Commande Optimale
Commande Optimale
Edouard Laroche
ENSPS - 3A ISAV
laroche@lsiit.u-strasbg.fr
http://eavr.u-strasbg.fr/perso/edouard/Student/
E. Laroche ENSPS - ISAV
Commande Optimale
Objectifs et Evaluation
☞ Objectifs
➣ Connaissance des méthode de commande optimale
➣ Capacité à mettre en oeuvre une telle commande
☞ Evaluation
➣ Bureau d’étude en simulation

Commande Optimale
Plan
➣ Généralités sur les systèmes dynamiques

➣ Introduction à la commande optimale
➣ Commande Linéaire Quadratique
➣ Commande Linéaire Quadratique Gaussienne
➣ Etude d’un cas pratique

Commande Optimale
Notations
➣ hermicien d’un vecteur où d’une matrice M H = (M ∗)T = (M T )∗

³ ´
∂y(x)
➣ dérivée d’un vecteur par rapport à un vecteur ∂x = ∂y∂xi(x)
j
i,j

Commande Optimale
Introduction sur les systèmes dynamiques
☞ Différents systèmes
➣ Système à temps continu ẋ = f (x, u, t) / à temps discret xk+1 = f (xk , uk , tk )
➣ Systèmes à temps variant ẋ = f (x, u, t) / à temps invariant ẋ = f (x, u)
➣ Système linéaire LTV ẋ = A(t)x + B(t)u ou LTI ẋ = Ax + Bu
☞ Propriétés
➣ Commandabilité, stabilisabilité
➣ Observabilité, détectabilité

Commande Optimale
☞ Différents types d’asservissement

➣ retour statique d’état
➣ retour statique de sortie
➣ retour dynamique d’état
➣ retour dynamique de sortie
➣ remarque : équivalence entre retour dynamique et retour statique

Commande Optimale
☞ Propriétés des systèmes asservis

➣ Stabilité
➣ Valeurs singulières (réponses fréquentielles)
➣ Performances : bande passante
➣ Robustesse
◦ Marge de module
◦ Roll-off

Commande Optimale
Introduction à la Commande Optimale
☞ Système
➣ Système à temps continu ẋ = f (x, u, t)
➣ avec x(t0) = x0
☞ Critère
R tf
➣ Minimiser J(x0, t0, u) = θ(x(tf ), tf ) + t0 φ(x(t), u(t), t)dt
➣ La commande optimale est ũ = argu min J(x0, t0, u)
˜ 0, t0) = J(x0, t0, ũ)
➣ La valeur optimale du critère est J(x

Commande Optimale
☞ Contraintes
➣ Sur le temps final : libre ou imposé
➣ Sur l’état final xf ∈ Xf
➣ Sur la commande u ∈ U
☞ Principe d’optimalité de Bellman

➣ Notons u[t1,tf ] la commande sur [t1, tf ] avec t0 < t1 < tf
➣ Principe d’optimalité de Bellman: la trajectoire optimale sur [t 0, tf ] contient la
trajectoire optimale sur [t1, tf ] avec comme condition initiale x(t1).
➣ Formulation mathématique
³R : ´
˜ 0, t0) = minu t 1 ˜
J(x [t ,t ]
0 1 t0 φ(x(t), u(t), t)dt + J(x1 , t1 )
➣ Application : recherche récursive d’un chemin optimal

Commande Optimale
☞ Principe du maximum de Pontriaguine

➣ Lagrangien L(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (p : état adjoit)
➣ La solution optimale du problème sans contrainte vérifie le principe du
maximum :
◦ ∂L
∂x = − ṗ T
: équation adjointe, avec p(t f ) = ∂θ
∂x (x(tf ), tf ) dans le cas d’un
état final libre ;
◦ ∂L
∂u = 0 ; il s’agit de la condition de transversabilité dans le cas où aucune
contrainte n’est imposée sur u ;
◦ ∂L
∂p = ẋ T
, avec x(t0) donné ; il s’agit de l’équation du système ẋ = f (x, u, t).

Commande Optimale
☞ Equation d’Euler-Lagrange
➣ Un système mécanique d’énergie cynétique T etR d’énergie potentielle U se
t
comporte de manière à minimiser l’action S = t0f (T − U )dt (Principe de
moindre action de Maupertuis)
➣ Système q̇ = u
R tf
➣ Critère J(q, q̇) = t0 L(q(t), q̇(t))dt avec L = T − U
➣ Exercice : en appliquant le principe du mamimum de Pontriaguine, démontrez
l’équation d’Euler-Lagrange dtd ∂L
∂ q̇ − ∂L
∂q = 0

Commande Optimale
☞ Commande bang-bang
➣ Il s’agit des commandes à temps minimal avec des contraintes intervalle sur les
commandes
➣ La commande optimale est alors toujours égale au maximum ou au minimal
➣ Exemple illustratif :
◦ Système linéaire à une entrée ẋ = Ax + bu, x(t0) = x0
R tf
◦ coût J = t0 dt = tf − t0 (temps minimal)
◦ contrainte sur l’entrée −1 ≤ u(t) ≤ 1
◦ contrainte sur l’état final x(tf ) = 0
◦ temps final libre (toujours le cas pour un temps minimal)

Commande Optimale
➣ Application du principe du maximum

◦ Le Lagrangien est L(x, u, p, t) = 1 + pT Ax + pT bu
R tf
◦ Le critère s’écrit J = t0 L(x, u, p, t)dt. La commande minimisant le critère
est ũ(t) = −sign(bT p(t)).
◦ L’équation adjointe est ṗ = −AT p avec p(tf ) libre (car x(tf ) imposé)
◦ Equation d’état ẋ = Ax − bsign(bT p)
➣ Système ‘intégrateur double’
◦ ẋ1 = x2, ẋ2 = u · ¸ · ¸
0 1 0
A= ; B= . (1)
0 0 1
◦ · ¸
1 1 t
exp(At) = I + At + A2tt + · · · = (2)
2 0 1

Commande Optimale
➣ Résolution
◦ ṗ = −AT p ⇒ p(t) = exp(−AT (t − tf ))p(tf )
p1(t) = p1(tf ) (3)
p2(t) = (tf − t)p1(tf ) + p2(tf ) (4)
u(t) = sign(p2(t)) (5)
◦
Z t
x(t) = exp(A(t − tf ))x(tf ) + exp(A(t − τ ))bu(τ )dτ (6)
tf
Z tf · ¸
t−τ
= − sign((tf − τ )p1(tf ) + p2(tf ))dτ (7)
t 1

Commande Optimale
➣ Caractérisation des points de commutation x(ts) définis par

(tf − ts)p1(tf ) + p2(tf ) = 0.
Z tf · ¸
ts − τ
x(ts) = − sign((ts − τ )p1(tf ))dτ (8)
ts 1
Z tf · ¸
ts − τ
= sign(p1(tf )) (9)
t s
1
· 1 2
¸
− 2 (tf − ts)
= sign(p1(tf )) (10)
tf − t s
Pour p1(tf ) > 0, les points de commutation appartiennent à la branche de
parabole d’équation x1 = − 12 x22 avec x2 > 0 ; pour p1(tf ) < 0, ils
appartiennent à la parabole d’équation x1 = 12 x22 avec x2 < 0. Le lieu complet
est défini par x1 + 12 x2|x2| = 0.
➣ Loi de commande optimale u(t) = −sign(x1 + 12 x2|x2|)
➣ Représentation des trajectoires dans l’espace d’état

Commande Optimale
Commande Linéaire Quadratique
☞ Horizon fini
➣ Position du problème
◦ Système ẋ = A(t)x + B(t)u
1 T
R tf 1 ¡ T T
¢
◦ Critère J(x0, u) = 2 x (tf )Sx(tf ) + t0 2 x (t)Q(t)x(t) + u (t)R(t)u(t) dt
avec Q = QT ≥ 0 et R = RT > 0
➣ Formulation du problème par Pontriaguine avec
L(x, u, p, t) = pT A(t)x + pT B(t)u + 12 (xT Q(t)x + uT R(t)u)
◦ ∂L
∂u = B T
(t)p + R(t)u = 0
◦ ṗ = − ∂L
∂x = −A T
(t)p − Q(t)x
◦ p(tf ) = Sx(tf )

Commande Optimale
➣ Reformulation
◦ u(t) = −R−1(t)B T (t)p(t)
◦ ẋ(t) = A(t)x(t) − B(t)R−1(t)B T (t)p(t)
◦ ṗ = −AT (t)p − Q(t)x
➣ système Hamiltonien :
−1 T
· ¸ · ¸· ¸
d x(t) A(t) −B(t)R (t)B (t) x(t)
= (11)
dt p(t) −Q(t) −AT (t) p(t)
➣ Résolution
◦ écrivons p(t) = P (t)x(t) avec P (tf ) = S
¡ T ¢
◦ alors, ṗ(t) = − A (t)P (t) + Q(t) x(t)
◦ ce qui donne (Ṗ + P A + AT P − P BR−1B T P + Q)x = 0
◦ on obtient une équation (différentielle) de Riccati :
Ṗ + P A + AT P − P BR−1B T P + Q = 0 avec P (tf ) = S
➣ Solution : u(t) = −K(t)x(t) avec K(t) = −R(t)−1B(t)T P (t).

Commande Optimale
☞ Horizon infini
◦ On a nécessairement x(tf ) = 0 et la pondération sur x(tf ) n’a plus de sens
R∞1¡ T T
¢
◦ J(x0, u) = t0 2 x (t)Q(t)x(t) + u (t)R(t)u(t) dt
◦ Système LTI ẋ = Ax + Bu
➣ Solution
◦ u(t) = −Kx(t)
◦ avec K = −R−1B T P
◦ et P solution de l’équation algébrique de Riccati
P A + AT P − P BR−1B T P + Q = 0

Commande Optimale
☞ Commande LQ à temps discret : horizon fini

◦ x(k + 1) = A(k)x(k) + B(k)u(k)
1
Pk=n T
◦ J = 2 k=0 x (k)Q(k)x(k) + uT (k)R(k)u(k)
➣ Résolution par le Lagrangien
Pk=n 1 T
◦ L = k=0 2 x (k)Q(k)x(k) + 12 uT (k)R(k)u(k) + pT (k +
1) (−x(k + 1) + A(k)x(k) + B(k)u(k))
∂L
◦ ∂u(k) = R(k)u(k) + B T (k)p(k + 1) = 0
∂L
◦ ∂x(k) = Q(k)x(k) − p(k) + AT (k)p(k + 1) = 0
∂L
◦ ∂p(k+1) = −x(k + 1) + A(k)x(k) + B(k)u(k) = 0
➣ Reformulation
◦ Commande u(k) = −R−1(k)B T (k)p(k + 1) avec u(n) = 0 et donc
p(n + 1) = 0.
◦ L’équation adjointe pour k = n donne p(n) = Q(n)x(n), on choisit alors
p(k) = P (k)x(k) avec P (n) = Q(n)
Commande Optimale
➣ Solution
◦ u(k) = −K(k)x(k) avec
◦ K(k) = R̃−1(k)B T (k)P (k + 1)A(k) et
◦ R̃(k) = R(k) + B T (k)P (k + 1)B(k).
➣ Détermination de P (k)
◦ P (k) = Q(k) + AT (k)P (k + 1)(A(k) − B(k)K(k))
◦ ce qui est équivalent à P (k) = Q(k) + AT (k)M (k + 1)A(k)
◦ avec l’équation de Riccati discrète M (k + 1) =
P (k + 1) − P (k + 1)B(k)(R(k) + B T (k)P (k + 1)B(k))−1B T (k)P (k + 1)
◦ calcul à rebours à partir de P (n) = Q(n)

Commande Optimale
☞ Commande LQ à temps discret : horizon infini

◦ x(k + 1) = Ax(k) + Bu(k)
1
P∞ T
◦ J = 2 k=0 x (k)Qx(k) + uT (k)Ru(k)
➣ Solution
◦ u(k) = −K(k)x(k)
◦ avec K = (R + B T P B)−1B T P A
◦ et P solution de l’équation algébrique de Riccati discrète
P = Q + AT (P − P B(R + B T P B)−1B T P )A

Commande Optimale
☞ Propriété de robustesse : marge de module ≥ 1

➣ Différence de retour : par des manipulations à partir de l’équation de Riccati, on
obtient l’équation de la différence de retour :
(I + B T (−sI − AT )−1K T )R(I + K(sI − A)−1B) =
R + B T (−sI − AT )−1Q(sI − A)−1B
➣ Inégalité de Kalman multivariable : en fréquentiel (s = jω) et en notant
H(jω) = (jωI − A)−1B, on obtient :
(I + KH(jω))H R(I + KH(jω)) = R + H H (jω)QH(jω) ≥ R
➣ Dans le cas particulier où R = ρI et en écrivant Q = LT L (factorisation de
Choleski), on obtient :
(I + KH(jω))H (I + KH(jω)) = I + ρ1 (LH(jω))H (LH(jω))
q
➣ Marge de module : on en déduit : σi(I + KH(jω)) = 1 + ρ1 σi2(LH(jω)) ≥ 1

Commande Optimale
☞ Réglage des pondérations

➣ Remarque : la multiplication des pondérations Q et R par un même scalaire ne
modifie pas le régulateur
➣ Restriction à des pondérations diagonales
➣ Méthodologie itérative
◦ pondérations initiales : matrices identité.
◦ Régler globalemnt la dynamique en multipliant Q ou R par un scalaire
◦ Ajuster les dynamiques sur les différents états en ajustant les éléments de Q
◦ Ajuster les dunamiques des actionneurs en ajustant les éléments de R
☞ Schéma de régulation
➣ Prise en compte des signaux de consigne
➣ Ajout d’un terme intégral

Commande Optimale
Commande Linéaire Quadratique Gaussienne
☞ Formulation du problème
➣ Système dynamique stochastique
½
ẋ(t) = Ax(t) + Bu(t) + v(t)
(12)
y(t) = Cx(t) + w(t)
où v et le bruit de mesure w sont des bruits blancs centrés de variance
E{v T v} = V = V T ≥ 0 et E{w T w} = W = W T > 0
➣ Critère
½ tf ¾
1
Z
(x(t))T Qx(t) + (u(t))T Ru(t) dt ,
¡ ¢
J(x0, u) = lim E (13)
tf →∞ tf t0
avec Q = QT ≥ 0 et R = RT > 0

Commande Optimale
☞ Principe de séparation
La solution du problème LQG est donnée par les solutions de deux problèmes
connus :
➣ le problème d’estimation optimale de l’état d’un système dynamique
stochastique (filtre de Kalman donnant une estimée x̂ de x)
➣ le problème de commande LQ optimale en supposant x connu, donnant un
retour d’état de gain K.
La commande LQG est finalement u = −K x̂

Commande Optimale
☞ Structure de la commande
➣ Equation de l’observateur
˙ = Ax(t) + Bu(t) + L(y(t) − Cx(t))
x̂(t) (14)
gain de Kalman : L = ΣC T W −1 avec Σ la solution de l’équation algébrique de
Riccati : ΣAT + AΣ − ΣC T W −1CΣ + V = 0
➣ Equations du régulateur :
˙
½
x̂(t) = (A − BK − LC)x̂(t) + Ly(t)
(15)
u(t) = −K x̂(t)
équivalent à un transfert u = −C(s)y avec
C(s) = K(sI − A + BK + LC)−1L.
➣ Suivi de consigne : on peut facilement intégrer un signal de sonsigne y ∗ avec
u = C(s)(y ∗ − y).

Commande Optimale
☞ Retour sur le principe de séparation

➣ Equations du système bouclé avec u = w − Kcx̂ :

 ẋ = Ax − BK x̂ + Bw
x̂˙ = LCx + (A − BK − LC)x̂ (16)
²y = Cx − C x̂

➣ Avec ²x = x − x̂, les équations du système s’écrivent :


 ẋ = (A − BK)x − BK²x + Bw
²̇x = (A − LC)²x (17)
²y = C²x

matrice d’état bloc-triangulaire : ses valeurs propres = celles de A − BK +

celles de A − LC. On retrouve le principe de séparation des modes de la
commande des modes d’observation.

Commande Optimale
☞ Méthode de réglage
➣ Réglage du retour d’état
➣ Réglage du filtre de Kalman
➣ Recouvrement du gain de boucle (LTR pour loop transfer recovery)

Commande Optimale
☞ Formulation standard
➣ Représentation linéaire fractionnaire (LFR ou LFT ou produit de Redheffer ou
star product)
◦ Soit un système dynamique d’entrées v et u et de sorties z et y
    
ẋ(t) A B 1 B2 x(t)
 z(t)  =  C1 D11 D12   v(t)  (18)
y(t) C2 D21 D22 u(t)
◦ bouclé avec un correcteur K(s) d’entrée y et de sortie u
· ¸ · ¸· ¸
x˙K (t) AK BK x(t)
= (19)
u(t) CK D K y(t)
◦ L’interconnexion des deux systèmes est un système d’entrée v et de sortie z.

Commande Optimale
➣ Principe de la formulation standard : synthétiser le correcteur permettant de

minimiser une norme sur le transfert entre v et z : K(s) = arg min ||Tzw (s)||n
−1
➣ Norme H2. Soit G(s) = C(sI −
q¡ R A) B un système LTI strictement propre. Sa
1 ∞ H
¢
norme H2 est ||G(s)||2 = 2π −∞ tr [G (jω)G(jω)] dω
➣ Norme H∞ : ||G(s)||∞ = maxω σ(G(jω)) où σ est la valeur singulière maximale.

➣ Formulation standard de la commande LQ
➣ Formulation standard de la commande LQG

Commande Optimale
☞ Forme LQG équivalente

➣ Principe
◦ Soit un correcteur LTI n’ordre nK
◦ Est-il possible de le mettre sous une forme LQG : estimateur d’état + retour
d’état ?
➣ Applications
◦ retouche de correcteurs
◦ interpolation de correcteurs (par interpolation des gains de la forme LQG)

Commande Optimale
➣ Paramétrisation de Youla d’un correcteur LQG

◦ Le modèle système + correcteur s’écrit :

 ẋ = (A − BK)x − BK²x + Bw
²̇x = (A − LC)²x (20)
²y = C²x

◦ il présente :
• n pôles non commandables (les valeurs propres de A − LC)
• n pôles non observables (les valeurs propres de A − BK)
◦ ces pôles sont distincts ; tous les pôles sont donc soit non commandables soit
non observables
◦ le transfert entre w et ²y est donc nul
◦ on peut donc ajouter n’importe quel transfert stable entre ² y et w sans
changer la dynamique du correcteur
◦ on appelle paramètre de Youla ce transfert

Commande Optimale
➣ Cas d’un correcteur de même ordre que le système

◦ même ordre ⇒ paramètre de Youla statique : w = DN ²y
◦ le correcteur LQG s’écrit alors
x̂˙ = (A − LC − BK − BDN C)x̂ + (L + BDN )y
½
(21)
u = −(K + DN C)x̂ + DN y
◦ Trouver les matrices de gain K et L ainsi que la metrice T du changement de
repère xK = T x̂ tel que les 2 représentations d’état soient identiques du point
de vue entrée-sortie
◦ Ce qui s’écrit :
T −1AK T = A − LC − BK − BDN C (22)
T −1BK = L + BDN (23)
CK T = −K − DN C (24)
DK = DN (25)

Commande Optimale
◦ La solution est donnée par :

DN = DK (26)
K = −CK T − DK C (27)
L = T −1BK − BDK (28)
0 = −T BCK T − T (A − BDK C) + AK T + BK C (29)
◦ La dernière équation est une équation algébrique de Riccati non symétrique
(GNARE pour Generalized Non-symetric Algebraic Riccati Equation)
➣ Cas d’un correcteur d’ordre supérieur : ajouter des modes non observables ou
non commandables à la représentation d’état du système pour obtenir un
modèle d’ordre nK

Commande Optimale
Bureau d’étude
☞ Pendule inversé
➣ Commande LQ puis LQG
➣ Mise en oeuvre des connaissances de cet enseignement mais aussi des autres
cours d’automatique
☞ Méthodologie
➣ synthèse de la commande à partir du modèle linéarisé autour du point de
fonctionnement nominal
➣ évaluation des performances et de la robustesse par analyse fréquentielle sur le
modèle linéaire
➣ validation finale du correcteur par simulation sur le modèle non-linéaire

Pres Com Opt

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Pres Com Opt

Hochgeladen von

Copyright:

Verfügbare Formate

Commande Optimale

E. Laroche ENSPS - ISAV

➣ Généralités sur les systèmes dynamiques

E. Laroche ENSPS - ISAV

➣ hermicien d’un vecteur où d’une matrice M H = (M ∗)T = (M T )∗

E. Laroche ENSPS - ISAV

Introduction sur les systèmes dynamiques

E. Laroche ENSPS - ISAV

☞ Différents types d’asservissement

E. Laroche ENSPS - ISAV

☞ Propriétés des systèmes asservis

E. Laroche ENSPS - ISAV

Introduction à la Commande Optimale

E. Laroche ENSPS - ISAV

☞ Principe d’optimalité de Bellman

➣ Application : recherche récursive d’un chemin optimal

E. Laroche ENSPS - ISAV

☞ Principe du maximum de Pontriaguine

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

➣ Application du principe du maximum

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

➣ Caractérisation des points de commutation x(ts) définis par

E. Laroche ENSPS - ISAV

Commande Linéaire Quadratique

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

☞ Commande LQ à temps discret : horizon fini

E. Laroche ENSPS - ISAV

☞ Commande LQ à temps discret : horizon infini

E. Laroche ENSPS - ISAV

☞ Propriété de robustesse : marge de module ≥ 1

E. Laroche ENSPS - ISAV

☞ Réglage des pondérations

E. Laroche ENSPS - ISAV

Commande Linéaire Quadratique Gaussienne

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

☞ Retour sur le principe de séparation

➣ Avec ²x = x − x̂, les équations du système s’écrivent :

matrice d’état bloc-triangulaire : ses valeurs propres = celles de A − BK +

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

➣ Principe de la formulation standard : synthétiser le correcteur permettant de

➣ Norme H∞ : ||G(s)||∞ = maxω σ(G(jω)) où σ est la valeur singulière maximale.

E. Laroche ENSPS - ISAV

☞ Forme LQG équivalente

E. Laroche ENSPS - ISAV

➣ Paramétrisation de Youla d’un correcteur LQG

E. Laroche ENSPS - ISAV

➣ Cas d’un correcteur de même ordre que le système

E. Laroche ENSPS - ISAV

◦ La solution est donnée par :

E. Laroche ENSPS - ISAV

E. Laroche ENSPS - ISAV

Das könnte Ihnen auch gefallen