Beruflich Dokumente
Kultur Dokumente
Commande Optimale
Edouard Laroche
ENSPS - 3A ISAV
laroche@lsiit.u-strasbg.fr
http://eavr.u-strasbg.fr/perso/edouard/Student/
E. Laroche ENSPS - ISAV
Commande Optimale
Objectifs et Evaluation
☞ Objectifs
➣ Connaissance des méthode de commande optimale
➣ Capacité à mettre en oeuvre une telle commande
☞ Evaluation
➣ Bureau d’étude en simulation
Plan
Notations
☞ Différents systèmes
➣ Système à temps continu ẋ = f (x, u, t) / à temps discret xk+1 = f (xk , uk , tk )
➣ Systèmes à temps variant ẋ = f (x, u, t) / à temps invariant ẋ = f (x, u)
➣ Système linéaire LTV ẋ = A(t)x + B(t)u ou LTI ẋ = Ax + Bu
☞ Propriétés
➣ Commandabilité, stabilisabilité
➣ Observabilité, détectabilité
☞ Système
➣ Système à temps continu ẋ = f (x, u, t)
➣ avec x(t0) = x0
☞ Critère
R tf
➣ Minimiser J(x0, t0, u) = θ(x(tf ), tf ) + t0 φ(x(t), u(t), t)dt
➣ La commande optimale est ũ = argu min J(x0, t0, u)
˜ 0, t0) = J(x0, t0, ũ)
➣ La valeur optimale du critère est J(x
☞ Contraintes
➣ Sur le temps final : libre ou imposé
➣ Sur l’état final xf ∈ Xf
➣ Sur la commande u ∈ U
☞ Equation d’Euler-Lagrange
➣ Un système mécanique d’énergie cynétique T etR d’énergie potentielle U se
t
comporte de manière à minimiser l’action S = t0f (T − U )dt (Principe de
moindre action de Maupertuis)
➣ Système q̇ = u
R tf
➣ Critère J(q, q̇) = t0 L(q(t), q̇(t))dt avec L = T − U
➣ Exercice : en appliquant le principe du mamimum de Pontriaguine, démontrez
l’équation d’Euler-Lagrange dtd ∂L
∂ q̇ − ∂L
∂q = 0
☞ Commande bang-bang
➣ Il s’agit des commandes à temps minimal avec des contraintes intervalle sur les
commandes
➣ La commande optimale est alors toujours égale au maximum ou au minimal
➣ Exemple illustratif :
◦ Système linéaire à une entrée ẋ = Ax + bu, x(t0) = x0
R tf
◦ coût J = t0 dt = tf − t0 (temps minimal)
◦ contrainte sur l’entrée −1 ≤ u(t) ≤ 1
◦ contrainte sur l’état final x(tf ) = 0
◦ temps final libre (toujours le cas pour un temps minimal)
➣ Résolution
◦ ṗ = −AT p ⇒ p(t) = exp(−AT (t − tf ))p(tf )
p1(t) = p1(tf ) (3)
p2(t) = (tf − t)p1(tf ) + p2(tf ) (4)
u(t) = sign(p2(t)) (5)
◦
Z t
x(t) = exp(A(t − tf ))x(tf ) + exp(A(t − τ ))bu(τ )dτ (6)
tf
Z tf · ¸
t−τ
= − sign((tf − τ )p1(tf ) + p2(tf ))dτ (7)
t 1
☞ Horizon fini
➣ Position du problème
◦ Système ẋ = A(t)x + B(t)u
1 T
R tf 1 ¡ T T
¢
◦ Critère J(x0, u) = 2 x (tf )Sx(tf ) + t0 2 x (t)Q(t)x(t) + u (t)R(t)u(t) dt
avec Q = QT ≥ 0 et R = RT > 0
➣ Formulation du problème par Pontriaguine avec
L(x, u, p, t) = pT A(t)x + pT B(t)u + 12 (xT Q(t)x + uT R(t)u)
◦ ∂L
∂u = B T
(t)p + R(t)u = 0
◦ ṗ = − ∂L
∂x = −A T
(t)p − Q(t)x
◦ p(tf ) = Sx(tf )
➣ Reformulation
◦ u(t) = −R−1(t)B T (t)p(t)
◦ ẋ(t) = A(t)x(t) − B(t)R−1(t)B T (t)p(t)
◦ ṗ = −AT (t)p − Q(t)x
➣ système Hamiltonien :
−1 T
· ¸ · ¸· ¸
d x(t) A(t) −B(t)R (t)B (t) x(t)
= (11)
dt p(t) −Q(t) −AT (t) p(t)
➣ Résolution
◦ écrivons p(t) = P (t)x(t) avec P (tf ) = S
¡ T ¢
◦ alors, ṗ(t) = − A (t)P (t) + Q(t) x(t)
◦ ce qui donne (Ṗ + P A + AT P − P BR−1B T P + Q)x = 0
◦ on obtient une équation (différentielle) de Riccati :
Ṗ + P A + AT P − P BR−1B T P + Q = 0 avec P (tf ) = S
➣ Solution : u(t) = −K(t)x(t) avec K(t) = −R(t)−1B(t)T P (t).
☞ Horizon infini
➣ Position du problème
◦ On a nécessairement x(tf ) = 0 et la pondération sur x(tf ) n’a plus de sens
R∞1¡ T T
¢
◦ J(x0, u) = t0 2 x (t)Q(t)x(t) + u (t)R(t)u(t) dt
◦ Système LTI ẋ = Ax + Bu
➣ Solution
◦ u(t) = −Kx(t)
◦ avec K = −R−1B T P
◦ et P solution de l’équation algébrique de Riccati
P A + AT P − P BR−1B T P + Q = 0
➣ Solution
◦ u(k) = −K(k)x(k) avec
◦ K(k) = R̃−1(k)B T (k)P (k + 1)A(k) et
◦ R̃(k) = R(k) + B T (k)P (k + 1)B(k).
➣ Détermination de P (k)
◦ P (k) = Q(k) + AT (k)P (k + 1)(A(k) − B(k)K(k))
◦ ce qui est équivalent à P (k) = Q(k) + AT (k)M (k + 1)A(k)
◦ avec l’équation de Riccati discrète M (k + 1) =
P (k + 1) − P (k + 1)B(k)(R(k) + B T (k)P (k + 1)B(k))−1B T (k)P (k + 1)
◦ calcul à rebours à partir de P (n) = Q(n)
☞ Schéma de régulation
➣ Prise en compte des signaux de consigne
➣ Ajout d’un terme intégral
☞ Formulation du problème
➣ Système dynamique stochastique
½
ẋ(t) = Ax(t) + Bu(t) + v(t)
(12)
y(t) = Cx(t) + w(t)
où v et le bruit de mesure w sont des bruits blancs centrés de variance
E{v T v} = V = V T ≥ 0 et E{w T w} = W = W T > 0
➣ Critère
½ tf ¾
1
Z
(x(t))T Qx(t) + (u(t))T Ru(t) dt ,
¡ ¢
J(x0, u) = lim E (13)
tf →∞ tf t0
avec Q = QT ≥ 0 et R = RT > 0
☞ Principe de séparation
La solution du problème LQG est donnée par les solutions de deux problèmes
connus :
➣ le problème d’estimation optimale de l’état d’un système dynamique
stochastique (filtre de Kalman donnant une estimée x̂ de x)
➣ le problème de commande LQ optimale en supposant x connu, donnant un
retour d’état de gain K.
La commande LQG est finalement u = −K x̂
☞ Structure de la commande
➣ Equation de l’observateur
˙ = Ax(t) + Bu(t) + L(y(t) − Cx(t))
x̂(t) (14)
gain de Kalman : L = ΣC T W −1 avec Σ la solution de l’équation algébrique de
Riccati : ΣAT + AΣ − ΣC T W −1CΣ + V = 0
➣ Equations du régulateur :
˙
½
x̂(t) = (A − BK − LC)x̂(t) + Ly(t)
(15)
u(t) = −K x̂(t)
équivalent à un transfert u = −C(s)y avec
C(s) = K(sI − A + BK + LC)−1L.
➣ Suivi de consigne : on peut facilement intégrer un signal de sonsigne y ∗ avec
u = C(s)(y ∗ − y).
☞ Méthode de réglage
➣ Réglage du retour d’état
➣ Réglage du filtre de Kalman
➣ Recouvrement du gain de boucle (LTR pour loop transfer recovery)
☞ Formulation standard
➣ Représentation linéaire fractionnaire (LFR ou LFT ou produit de Redheffer ou
star product)
◦ Soit un système dynamique d’entrées v et u et de sorties z et y
ẋ(t) A B 1 B2 x(t)
z(t) = C1 D11 D12 v(t) (18)
y(t) C2 D21 D22 u(t)
◦ bouclé avec un correcteur K(s) d’entrée y et de sortie u
· ¸ · ¸· ¸
x˙K (t) AK BK x(t)
= (19)
u(t) CK D K y(t)
◦ L’interconnexion des deux systèmes est un système d’entrée v et de sortie z.
◦ il présente :
• n pôles non commandables (les valeurs propres de A − LC)
• n pôles non observables (les valeurs propres de A − BK)
◦ ces pôles sont distincts ; tous les pôles sont donc soit non commandables soit
non observables
◦ le transfert entre w et ²y est donc nul
◦ on peut donc ajouter n’importe quel transfert stable entre ² y et w sans
changer la dynamique du correcteur
◦ on appelle paramètre de Youla ce transfert
Bureau d’étude
☞ Pendule inversé
➣ Commande LQ puis LQG
➣ Mise en oeuvre des connaissances de cet enseignement mais aussi des autres
cours d’automatique
☞ Méthodologie
➣ synthèse de la commande à partir du modèle linéarisé autour du point de
fonctionnement nominal
➣ évaluation des performances et de la robustesse par analyse fréquentielle sur le
modèle linéaire
➣ validation finale du correcteur par simulation sur le modèle non-linéaire