Beruflich Dokumente
Kultur Dokumente
i
Palabras Clave: Sistemas no lineales, linealizacion aproximada, linealizacion extendida,
linealizacion exacta.
Versi
on actualizada de las notas del curso Sistemas No Lineales dictadas por el
Profesor H. Sira-Ramrez durante los a
nos 1990 a 1993, (Sira-Ramrez, 1994b;
Sira-Ramrez, 1994c; Sira-Ramrez, 1994a), en la Facultad de Ingeniera de la
Universidad de Los Andes. La estructuraci
on y organizaci
on actual de los apuntes
surgieron de las clases del mismo curso dictadas por el profesor R. Marquez
durante el perodo septiembre (1996) a mayo de 1997.
ii
Contents
1 Introducci
on
1.1 Control de Sistemas No Lineales: Para que? . .
1.2 Sistemas No lineales y Trayectorias de equilibrio
1.2.1 Casos Patologicos . . . . . . . . . . . . .
1.2.2 Sistemas de naturaleza fsica real . . . .
1.3 Ejemplos de Sistemas no lineales controlados . .
1.4 Ejercicios Propuestos . . . . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . . . . . .
2 Esquema de Dise
no de Leyes de Control
2.1 Introduccion . . . . . . . . . . . . . . . .
2.2 Esquema Propuesto . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
basadas en
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
1
2
4
5
6
10
31
31
Linealizaci
on
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
33
34
34
38
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
El M
etodo de la Linealizaci
on Aproximada
3 El M
etodo de la Linealizaci
on Aproximada
3.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 El Metodo de la Linealizacion Aproximada . . . . . . . . . . .
3.2.1 Linealizacion mediante expansiones en serie de Taylor .
3.2.2 Representacion en Funciones de Transferencia . . . . .
3.2.3 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Que tan bueno es el Metodo de la Linealizacion Aproximada?
c . . . . . . . . . . . . . . . . . .
3.4 Primer ejemplo en Matlab
3.4.1 Modo de uso . . . . . . . . . . . . . . . . . . . . . . .
3.5 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . .
39
.
.
.
.
.
.
.
.
.
.
41
42
42
43
46
47
49
52
52
55
56
4 La Linealizaci
on Aproximada y el Dise
no de Controladores
4.1 Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Dise
no de Controladores mediante Linealizacion Aproximada . . . . . . . . .
4.3 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
58
58
76
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
CONTENTS
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
5 Observadores Din
amicos de Estado basados en Linealizaci
on Aproximada 79
5.1 Reconstruccion del Vector de Estado . . . . . . . . . . . . . . . . . . . . . . 80
5.2 El Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.3 Realimentacion Lineal de Salida Mediante Observadores de Orden Reducido 101
5.3.1 Observadores de Orden Reducido: Caso General . . . . . . . . . . . . 105
5.4 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 Dise
no de Compensadores Cl
asicos mediante Linealizaci
on Aproximada 113
6.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Dise
no de reguladores del tipo P, PI y PID mediante Linealizacion Aproximada114
6.3 Compensadores basados en el Metodo del Controlador-Observador Clasico . 120
6.4 Redes Compensadoras de Adelanto . . . . . . . . . . . . . . . . . . . . . . . 126
6.5 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
II
El M
etodo de la Linealizaci
on Extendida
en
. .
. .
. .
. .
135
.
.
.
.
137
138
139
140
162
Linealizaci
on Extendida
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
165
165
168
178
178
.
.
.
.
9 Dise
no de Compensadores No lineales G() mediante Linealizaci
on Extendida
179
9.1 Dise
no de reguladores del tipo P, PI y PID mediante Linealizacion Extendida 180
9.2 Controlador-Observador clasico utilizando Linealizacion Extendida . . . . . . 188
9.3 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
9.4 Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
CONTENTS
III
El M
etodo de la Linealizaci
on Exacta
10 M
etodo de Control Calculado
10.1 El metodo del Control Calculado: Ejemplos . . . . . . . . . . . . . . .
10.1.1 Dos sencillos ejemplos: procedimiento de dise
no, singularidades
10.2 Una primera generalizacion a una forma canonica en cascada . . . . . .
10.3 Linealizacion Exacta de Sistemas en Forma Canonica Controlable . . .
199
.
.
.
.
.
.
.
.
.
.
.
.
201
202
202
209
211
241
13 Linealizaci
on EntradaSalida
259
13.1 Formas Canonicas Normales, Dinamica de los ceros . . . . . . . . . . . . . . 260
Bibliografa
284
Chapter 1
Introducci
on
Newton tuvo mucha razon cuando dijo que el lenguaje de la naturaleza es la matematica. La
realidad fsica que nos rodea la hemos tratado de interpretar de diferentes maneras. Los modelos
matematicos constituyen una forma idonea de resolver muchos de los problemas que se nos
presentan al enfrentarnos a esa realidad. Un modelo matematico, obtenido por medio de leyes
y relaciones de tipo fsico, qumico o de alguna otra ndole, servira para captar algunas de las
propiedades importantes del sistema bajo estudio, dependiendo de las necesidades. particulares.
Ademas de brindar la posibilidad de estudiar un sistema cualquiera, modelos nos proporcionan
las bases necesarias para tener una idea de como influenciar (controlar) el comportamiento del
sistema real. En ultimo termino, este es el interes practico del modelo en s, brindar informacion
relevante del sistema susceptible de ser controlado.
Los sistemas de control de maquinaria, motores, aviones, reactores qumicos, etc., estan for1
CHAPTER 1. INTRODUCCION
mados por procesos y plantas, habitualmente representados a traves de modelos matematicos que
expresan las diferentes propiedades o comportamientos que satisfacen tales sistemas. Visto de
esta forma, tales modelos no son otra cosa que los llamados sistemas dinamicos. Los sistemas
dinamicos que estudiaremos describen procesos reales de naturaleza no lineal. La herramienta
matematica para su descripcion esta constituida por sistemas de ecuaciones diferenciales ordinarias no lineales a par
ametros agrupados.
1.1
1.1. CONTROL DE SISTEMAS NO LINEALES: PARA QUE?
CHAPTER 1. INTRODUCCION
.
x=f(x,u)
u(t)
y(t)
y=h(x)
ENTRADA
SALIDA
SISTEMA NO LINEAL
1.2
Considerese el siguiente sistema no lineal con una sola entrada y una salida:
x(t)
= f (x(t), u(t)),
y(t) = h(x(t))
x(t0 ) = x0
(1.1)
donde x(t) es una funcion vectorial del tiempo la cual toma valores en el espacio de ndimensiones y representa el estado del sistema, u(t) es una funcion escalar del tiempo y
toma valores en la recta real, u(t) IR. La variable y(t) es tambien una funcion escalar del
tiempo y representa la salida del sistema. Las funciones f () y h() son funciones continuas,
diferenciables al menos una vez con respecto a cada uno de sus argumentos, definidas de tal
forma que f : IRn IR IRn y h : IRn IR. Representamos este sistema no lineal mediante
el diagrama de bloques mostrado en la figura 1.1.
Consideraremos sistemas de ecuaciones diferenciales de la forma (1.1) que poseen puntos
de equilibrio constantes, dados por:
u(t) = U ; x(t) = X(U ); y(t) = Y (U ) = h(X(U )),
para todo t
(1.2)
x(t) = X(U )
(1.3)
1.2.1
Casos Patol
ogicos
Ejemplo 1.1:
1
+ u(t)
x(t)
y(t) = x(t)
x(t)
(1.4)
Ejemplo 1.2:
El sistema descrito por:
x = u(x2 2)
y = x
(1.5)
y =
x21 + x22 R
(1.6)
CHAPTER 1. INTRODUCCION
x2
u
R
x1
x21 + x22 ,
x1 = cos ,
= arctan
x2 = sen
x2
x1
(1.7)
obtenemos:
= V cos( u)
= V sen ( u)
y = R
(1.8)
Es facil ver que, para una direccion fija = , el valor del control u = U = produce un
angulo de direccion constante, en equilibrio, dado precisamente por = , a partir de la segunda
ecuacion diferencial. Sin embargo, el radio vector crece o decrece a una rata constante V y por lo
tanto no tiene equilibrio constante.
1.2.2
Veremos ahora algunos ejemplos en los cuales se establece, posiblemente bajo algunas condiciones, un punto de equilibrio u
nico.
P0 (P P0 ) +
RT
u
V
(1.9)
donde u es el volumen de gas por unidad de tiempo, con que se alimenta un tanque usando un
compresor. Este valor, se supone, no depende de la presion. La alimentaci
on se lleva a cabo de
tal manera que los cambios de presion del gas son suficientemente lentos como para considerarlos
isotermicos. V es el volumen del recipiente, A0 y K0 son constantes que dependen de la valvula de
entrada y del gas considerado. R es la constante universal de los gases y T es la temperatura a la
que se lleva a cabo el proceso. P0 es igualmente una constante.
Evidentemente, si no alimentamos gas alguno al tanque, u = U = 0, el punto de equilibrio de
la presion es P = P0 . Si, por el contrario, inyectamos una cantidad constante de gas u = U 6= 0, el
punto de equilibrio para la presion resulta ser ahora:
1
P (U ) = P0 +
P0
U
K0 A0
(1.10)
el cual es mayor que el valor de equilibrio anterior, como es logico suponer (se deja como ejercicio
al lector justificar tal afirmacion).
Ejemplo 1.5: p
endulo sin amortiguamiento
L
cm
mg
(1.11)
CHAPTER 1. INTRODUCCION
(1.12)
x2 = X2 (U ) =
BU
A U
(1.13)
Como hemos visto anteriormente, no solo la existencia sino la naturaleza misma de los
puntos de equilibrio de un sistema no lineal dependen en alto grado del valor del punto
de equilibrio del control. En aquellos casos en que el punto de equilibrio de las variables
de estado y la variable de salida sean calculables en terminos del valor U de la se
nal de
entrada u, diremos que el punto de equilibrio se encuentra parametrizado por el valor del
control. Tales parametrizaciones son muy importantes en la teora de la linealizacion y sus
extensiones recientes. Sin embargo, la parametrizacion de los puntos de equilibrio no es
potestativa u
nicamente en terminos del valor constante de la se
nal de control. Tambien es
u
Figure 1.4: Satelite mono-axial
Considerese un cuerpo que gira alrededor de un eje fijo en el espacio ingravido accionado por
torques, los cuales son producidos gracias a la expulsion controlada de gases, mediante un sistema
de toberas de reaccion adosadas al cuerpo en forma opuesta, tal como se ilustra en la figura 1.4.
El modelo que se presenta esta asociado al problema de orientaci
on de un satelite mono-axial
cuyo angulo de orientacion, respecto de un eje oblicuo no coincidente con el eje principal, se mide
utilizando la representacion de Cayley-Rodrgues dada por:
x 1 = 0.5 (1 + x21 ) x2
1
u
x 2 =
J
y = x1
(1.14)
donde x1 es el angulo de orientacion del satelite, x2 es la velocidad angular respecto al eje principal
y u representa el torque aplicado.
Para u = 0, el punto de equilibrio esta dado por x1 = X1 (constante arbitraria) y x2 = 0. En
este caso el punto de equilibrio se parametriza en terminos de la posicion angular X1 y no del valor
del control el cual debe ser, necesariamente, cero en el equilibrio.
CHAPTER 1. INTRODUCCION
10
1.3
cg
Figure 1.5: Esquema de un artefacto espacial que requiere control de su orientacion a un valor
deseado ( = )
Supongase que deseamos controlar la posicion angular de un artefacto espacial, como el que
se muestra en la Figura 1.5. Para controlar este artefacto se dispone de una tobera que puede
girar alrededor de su base sobre un pivote especial. El angulo de orientaci
on de la tobera respecto
al eje principal del cuerpo de la astronave es . La tasa de variaci
on del angulo de la tobera es
directamente proporcional a u. L es la distancia desde el punto de apoyo de la tobera en el cuerpo
del artefacto hasta el centro de gravedad de la nave (cg). Se supone que la fuerza F de reaccion,
debida a la expulsion de los gases de la combusti
on del motor del artefacto, esta aplicada sobre el
punto de apoyo de la tobera. Como consecuencia de la fuerza F el artefacto gira alrededor de su
centro de gravedad en uno u otro sentido. El problema de control consiste en mantener el angulo
en un valor fijo , usando como control la velocidad de variaci
on u del angulo de la tobera.
11
Las ecuaciones diferenciales que rigen el movimiento del sistema se obtienen de la segunda Ley
de Newton:
J
d2
= torque neto aplicado = fuerza brazo = F sen L
dt2
(1.15)
(1.16)
donde R es una constante conocida que representa una cierta ganancia estatica del actuador o
transductor que convierte el comando u en velocidad de variaci
on del angulo . Supondremos que
existe cierta limitacion en los valores de u, los cuales adscribiremos, arbitrariamente, al intervalo
cerrado [1, 1].
Las variables de estado del sistema se escogen como:
x1 = ; x2 =
d
= ; x3 =
dt
(1.17)
(1.18)
El punto de equilibrio, fsicamente significativo, del sistema se obtiene haciendo cero el miembro
derecho de cada ecuacion de estado. Este resulta ser:
x1 = arbitrario = ; x2 = 0; x3 = 0; u = 0
(1.19)
Notese que x3 = k tambien califica como punto de equilibrio, pero no es fisicamente factible
introducir la tobera dentro de la nave. De hecho, la posicion angular de la tobera se debe
restringir a valores que estan contenidos estrictamente dentro del intervalo [/2, +/2], es decir,
/2 < min < < max < +/2.
u
x3
= u
x 2 = g
x 3
y = x1 K
(1.20)
CHAPTER 1. INTRODUCCION
12
x 1<0
x3
13
x1
x2
x3
V
(1.21)
Tomaremos como salida del sistema una funcion que mida el error de posicion del punto de
contacto del uniciclo con respecto al crculo establecido. Es decir:
y = x21 + x22 R2 = 2 R2
(1.22)
Es facil ver que el movimiento del uniciclo descrito por (1.21) presenta ecuaciones similares a
las del modelo del avion en vuelo horizontal (1.6).
u
x1 + x2
L
x1 x2
L
(1.23)
N
; u=0
L
(1.24)
Ejemplo 1.12: motor de corriente continua con carga (modelo de velocidad angular)
CHAPTER 1. INTRODUCCION
14
ia
Ra
La
+
voltaje
control
Va
O,
Vb
back emf
circuito
de armadura
Lf
if corriente (constante)
circuito
de campo
dia
+ Ra ia + Kv if = Va
dt
d
J
+ B = Kv if ia
dt
(1.25)
x2 =
Va = constante
De acuerdo a esta seleccion de las variables de estado, el sistema (1.25) queda representado
mediante un modelo en el espacio de estado (llamado modelo bilineal1 ) dado por:
"
x 1
x 2
"
a
R
La
0
0
B
J
#"
x1
x2
"
+u
0
Kv
J
v
K
La
0
#"
x1
x2
"
Va
La
(1.26)
donde x1 representa la corriente de armadura, x2 es la velocidad angular del eje del motor; La y Ra
son, respectivamente, la inductancia y la resistencia en el circuito de armadura, Kv es la constante
de torque del motor, mientras que J y B son, respectivamente, el momento de inercia de la carga
y el coeficiente de friccion viscosa asociada a la carga.
El punto de equilibrio para este sistema, generado por una corriente de armadura constante
dada por u = U , se obtiene directamente de (1.26) y resulta en:
"
x1 (U )
x2 (U )
Va
=
Ra B + Kv2 U 2
"
B
Kv U
(1.27)
15
Ra
ia
+
+
if
VT =Va + Vf
-
Ea
Va
Rf
Vf
Lf
(1.28)
donde x1 = corresponde al angulo del eje del motor, x2 = , es la velocidad angular del eje del
motor, x3 = ia = if representa la corriente com
un que fluye por los circuitos de armadura y del
campo. La se
nal de control u = VT corresponde al voltaje de alimentaci
on de la red.
(1.29)
CHAPTER 1. INTRODUCCION
16
E
-
(1.30)
b
b1
: Z2 (U ) =
2
0 (1 U )
U)
02 (1
(1.31)
17
L,m
I
fe
k
i
L0
x
a
fe =
2IiL
ax
2IiL
ax
2iL
u
a x1
(1.32)
k(
x L0 )(a x
)
; X1 (
x) = x
; X2 (
x) = 0
2iL
(1.33)
CHAPTER 1. INTRODUCCION
18
R
i
+
-
v(t)
f
m
mg
Figure 1.12: Sistema de suspension magnetica
La figura siguiente muestra un sistema de suspension magnetica que permite mantener levitada
una peque
na esfera metalica de masa m. El objetivo del controlador sera regular el valor de la
corriente i del circuito del electroiman de tal forma que la esfera se mantenga suspendida a una
distancia constante x = X, del electromagneto. La tension o voltaje aplicado al circuito es v(t) y
act
ua como variable de control.
Las ecuaciones diferenciales que describen el sistema estan dadas por:
di
dt
d2 x
m 2
dt
L
= Ri + v(t)
= mg fm = mg
ci2
x
(1.34)
donde i es la corriente del circuito y x es el desplazamiento de la esfera medido desde el electromagneto. L es la inductancia del electromagneto y c es una constante conocida. La fuerza fm de
atraccion que ejerce el magneto sobre la esfera se supone inversamente proporcional a la distancia
x y directamente proporcional al cuadrado de la corriente. La salida se obtiene a traves de un
fotosensor mediante el cual se realiza la medicion de la altura de la esfera metalica suspendida en
el aire. Este modelo aunque aproximado describe con cierta precision el fenomeno de la levitacion
magnetica (en (Wong, 1986) puede conseguir un enfoque muy similar para la obtencion de este
modelo). Sin embargo, tal modelo no es valido para distancias muy peque
nas o cero.
Escogemos como variables de estado y como variable de control del sistema a las siguientes
variables fsicas:
x1 = x ; x2 = x ; x3 = i ; u = v(t)
(1.35)
c x23
m x1
19
(1.36)
Los puntos de equilibrio del sistema se obtienen igualando a cero los segundos miembros de
las ecuaciones diferenciales anteriores con u = U = constante. Obtenemos entonces los puntos de
equilibrio en terminos de una parametrizacion del valor deseado X de la distancia:
x1 = X1 (X) = X ; x2 = 0 ;
s
x3 = X3 (X) =
mgX
; u = U (X) = R
c
mgX
c
(1.37)
Una parametrizacion diferente esta constituida por aquella que utiliza el valor constante U del
control. Tal parametrizacion esta dada por:
cU 2
; x2 = 0 ;
mgR2
U
; u=U
= X3 (U ) =
R
x1 = X1 (U ) =
x3
(1.38)
Figure 1.13: Aro rotatorio sobre el que desliza un anillo cuya posicion angular se desea controlar
Se desea mantener el valor del angulo en un valor constante deseado dado por = . La
variable de control en este caso esta constituida por el cuadrado de la velocidad angular u = 2 .
El radio del aro, que se supone indeformable por efecto de la fuerza centrfuga, esta dado por a.
El modelo del sistema esta dado por:
d2
= g sen + a 2 sen cos
dt2
(1.39)
CHAPTER 1. INTRODUCCION
20
el cual podemos reescribir de la manera siguiente:
x 1 = x2
g
x 2 = sen x1 + u sen x1 cos x1
a
(1.40)
Para un valor fijo u = U del cuadrado de la velocidad angular tenemos el siguiente punto de
equilibrio:
g
x1 (X) = X = ; x2 (X) = 0; u = U =
a cos X
el cual hemos parametrizado en terminos del valor deseado del angulo . Debemos recalcar que el
punto de equilibrio x1 = 0 carece de interes, pues para lograrlo basta con detener el movimiento
del aro alrededor de su eje.
Notese que de haber parametrizado en terminos del cuadrado de la velocidad angular entonces
el punto de equilibrio se hubiese expresado como:
x1 (U ) = arccos
g
aU
; x2 (U ) = 0; u = U
Es facil ver que no puede adoptar por valores de equilibrio /2, 3/2, . . .. Para estos
puntos de equilibrio es necesario poder imprimirle al aro una velocidad angular infinitamente grande,
lo cual es imposible fisicamente.
Ejemplo 1.18: p
endulo invertido sobre una plataforma m
ovil (modelo 1)
2L
.
mg
u
Mg
(1.41)
21
En este modelo, las constantes C y F representan los coeficientes de friccion del movimiento
rotatorio del pendulo y del movimiento lineal del carrito. J es el momento de inercia con respecto
al centro de gravedad del pendulo y esta dado aproximadamente por J = mL3 /3.
Definimos, como variables de estado, el desplazamiento horizontal del carro , y su velocidad
as como el desplazamiento angular del pendulo y su velocidad angular correspondiente. La
,
variable de entrada u representa la fuerza con que se arrastra o se empuja al sistema, con el objeto
de controlarlo.
El par de ecuaciones diferenciales de segundo orden (1.41) se puede representar con respecto a
las derivadas de mayor orden de la siguiente forma:
"
"
J + mL2 mL cos
mL cos M + m
#1 "
C + mLg sen
F + mL sen 2 + u
(1.42)
es decir,
"
"
(1.43)
donde 1 = C +mLg
sen , 2 = F +mL sen 2 +u y = J(M +m)+mL2 (M +m sen 2 ).
Seleccionando como variables de estado
x3 = ; x4 =
x1 = ; x2 = ;
(1.44)
reescribimos las dos ecuaciones diferenciales de segundo orden anteriores como un sistema de cuatro
ecuaciones diferenciales de primer orden:
x 1 = x2
mL cos x3 1 + (J + mL2 )2
x 2 =
x 3 = x4
(M + m)1 mL cos x3 2
x 4 =
(1.45)
Ejemplo 1.19: p
endulo invertido sobre un m
ovil (modelo 2)
Consideremos otro modelo del problema de balancear un pendulo invertido montado sobre un
carrito o movil; en este caso tenemos un sistema de segundo orden. Las ecuaciones del movimiento
son:
x 1 = x2
g sen (x1 ) 0.5a mLx22 sen (2x1 ) a cos(x1 )u
x 2 =
4L/3 a mL cos2 (x1 )
(1.46)
CHAPTER 1. INTRODUCCION
22
Los puntos de equilibrio del sistema para u = U = constante, estan dados por:
"
X(U ) =
tan1 ( aU
g )
0
(1.47)
op
1:N
B
motor de corriente
continua
L
Mg
(1.48)
donde x1 = p , x2 = p son las variables de estado y la variable de control esta dada por el torque
aplicado u = . N es el factor de reduccion angular del juego de engranajes que acopla el eje
del motor al eje del brazo manipulador. B es el coeficiente de friccion viscosa y J es el momento
de inercia; c es una constante emprica que iguala al triple del producto mgL. Siendo m la masa
del brazo, g la aceleracion de la gravedad y L la distancia del eje al centro de masa del brazo
manipulador.
El punto de equilibrio del sistema, parametrizado con respecto a la posicion angular deseada
X, esta dado por:
X
N
(1.49)
El punto de equilibrio del sistema, parametrizado con respecto al torque nominal U que produce
la posicion angular deseada X, esta dado por:
x2 (U ) = 0; x1 = X(U ) = N sen 1
U
c
; u=U
(1.50)
23
Ejemplo 1.21: p
endulo invertido controlado por un motor de corriente continua a
trav
es de un sistema de engranaje
Consideremos, otra vez, el pendulo invertido mostrado en la figura 1.15, controlado por un motor
de corriente continua. Para obtener el modelo se pueden plantear las siguientes suposiciones:
1. El motor es controlado por armadura.
2. La inercia del motor Jm es insignificante comparada con la inercia del pendulo invertido Jp .
3. Jp = ml2 , es decir, la inercia del pendulo es calculada como si la masa estuviese concentrada
en el extremo del pendulo de longitud l.
4. El sistema de engranajes no presenta histeresis (backlash). Todos sus elementos son rgidos.
5. Se desprecian las fuerzas de roce.
El esquema del motor de corriente continua controlado por armadura se presenta en la figura 1.8.
Tomando como variables de estado x1 = p , x2 = p = p , x3 = ia , el modelo queda expresado
por las siguientes ecuaciones:
x2
0
x 1
g
N Km
x 2 = l sen x1 + ml2 x3 + 0 u
1
Kb N
Ra
x 3
La x2 La x3
La
x1
y = [1 0 0] x2
x3
(1.51)
(1.52)
donde es la posicion angular del brazo manipulador y es la posicion angular del eje del motor,
la cual es ligeramente diferente de la anterior en virtud de la flexibilidad del acoplamiento entre el
CHAPTER 1. INTRODUCCION
24
JL
o
Jm
k
MOTOR
BL
L
Bm
Mg
ARTICULACION FLEXIBLE
x2 + ;
x3 = ;
x4 =
el modelo (1.52), en el espacio de estado, del manipulador flexible resulta ser entonces:
x 1 = x2
BL
k
M gL
sen x1
x2
(x1 x3 )
x 2 =
JL
JL
JL
x 3 = x4
Bm
k
x 4 =
x4 +
(x1 x3 )
Jm
Jm
(1.53)
(1.54)
25
Puesto que ambas concentraciones deben ser, necesariamente, positivas, tenemos las siguientes
restricciones en equilibrio para el sistema:
0 < X1 (E) = E < 1;
U > 0;
(1.56)
F
CAi
T
ALIMENTACION
TANQUE
FC
TC
V
CA
T
REFRIGERANTE
FC
TCi
CHAQUETA
PRODUCTO
F
CA
T
CHAPTER 1. INTRODUCCION
26
Las ecuaciones que modelan el comportamiento dinamico del sistema, resultantes de los balances
respectivos de masa y energa, estan representadas por:
Balance de masa del reactante A
dCA
n
= F ( CAi CA ) V k(T ) CA
dt
(1.57)
E
donde k(T ) = k0 exp( R(T +273.16)
).
Cp V
dT
n
= Cp F (Ti T ) HR V k(T ) CA
U A(T TC )
dt
(1.58)
CpC VC C
dTC
= U A(T TC ) FC CpC C (TC TCi )
dt
(1.59)
x 1 =
x 2 =
x 3 =
F
(CAi x1 ) k(x2 )xn1
V
HR
UA
F
n
(Ti x2 )
k(x2 ) CA
(x2 x3 )
V
Cp
Cp V
UA
1
(x2 x3 )
(x3 TCi )FC max (1v)
CpC VC C
VC
E
donde k(x2 ) = k0 exp( R(x2 +273.16)
).
(1.60)
27
Table 1.1: Nomenclatura empleada en el modelo del tanque reactor continuamente agitado
Smbolo
T
CA
TC
FC
Cp
A
c
k0
HR
U
VC
CpC
E
F
CAi
Ti
R
TCi
a
Descripci
on
Variables de estado y control:
temperatura en el tanque [ C]
concentracion del reactante A
temperatura de la chaqueta
Flujo de entrada del refrigerante se
nal de
control
Par
ametros:
volumen del tanque [m3 ]
densidad del fluido en el tanque [kgmol/m3 ]
capacidad
calorica
del
reactante
[J/kgmol C]
area del tanque [m2 ]
densidad del refrigerante [kg/m3 ]
constante de Arrhenius [m3 /s kgmol]
calor de reaccion [J/kgmol]
coeficiente de transferencia de calor tanque
chaqueta [J/s m2 C]
volumen en la chaqueta [m3 ]
calor especfico del refrigerante [J/kg C]
energa de activaci
on de la reaccion
[J/kgmol]
flujo de entrada al tanque [m3 /s]
concentracion del reactante en el flujo de entrada [kgmol/m3 ]
temperatura del flujo de entrada [ C]
constante de los gases [J/kgmol K]
temperatura del refrigerante
Valor nominala
88.0
1.1298
50.48
0.0073
7.08
19.2
1.815e5
5.4
1000
0.0744
-9.86e7
3550
1.82
4184
1.182e7
7.5e-3
2.88
66
8314.39
27
CHAPTER 1. INTRODUCCION
28
Fi
(ci c) rA (c, T )
V
Fi
U At
(Ti T ) + JH rA (c, T )
(T Tc )
V
cp V
(1.61)
(1.62)
29
CAf q Tf
CA q
A
qc
Tcf
qc Tc
=
=
q
E
(CAf CA ) k0 CA exp
V
RT
q
(H)k0 CA
E
(Tf T ) +
exp
V
Cp
RT
"
hA
c Cpc
qc 1 exp
+
Cp V
qc Cpc
!#
(Tcf T )
(1.63)
(1.64)
CHAPTER 1. INTRODUCCION
30
bQ
;
1b
X2 =
u
+P
ba
(1.65)
donde x1 y x2 representan, respectivamente, la velocidad del caudal volumetrico del lquido que
sale del tanque a traves de una tuberia y la altura del lquido en el tanque. g es la constante de
aceleracion de gravedad, L es la longitud de la tuberia a la salida del tanque, Kf es un factor de
friccion y es la densidad del lquido, Ap es el area transversal de la tuberia y At es el area de la
base del tanque.
c
1
x1 + u
A
A
c
c
xi +
xi1 ; i = 2, 3, . . . , n
A
A
y = xn
U2
U2
;
i
=
1,
2,
.
.
.
,
n;
y(U
)
=
Y
(U
)
=
c2
c2
1.4
31
Ejercicios Propuestos
g2
g1
m
k2
k1
x
Lecturas Recomendadas
Un tema intimamente relacionado al contenido de este captulo es el modelado de sistemas
reales a traves de ecuaciones diferenciales ordinarias. La clave del modelado de procesos
continuos de origen electrico, mecanico, qumico, biologico o de otra ndole, esta basada
fundamentalmente en tres aspectos:
Conocer exhaustivamente el proceso. Esto viene de estudiar el sistema y subsistemas
(planta, sensores, y actuadores) y los posibles efectos e interrelaciones involucrados.
Aplicar los principios de la fsica, la qumica, la termodinamica, etc. en las ecuaciones
de balance de masa y energa.
Proponer y fijar hipotesis simplificatorias razonables para hacer que el modelo del
sistema sea manejable o sea, al menos, de mediana complejidad.
32
CHAPTER 1. INTRODUCCION
Muchos de los textos relacionados con el control de sistemas lineales o no lineales proveen
habitualmente de algunos lineamientos basicos para enfrentar satisfactoriamente el modelado
de cierto tipo de sistemas. Sin embargo, al momento de acometer un proyecto en el cual
se necesita obtener un modelo suficientemente preciso de una planta o proceso real (en la
industria, por ejemplo) hace falta tener conocimientos mas solidos y algo mas de experiencia.
De la noche a la ma
nana no es posible convertirse en un experto en dise
no de modelos
continuos, de hecho, esta cualidad depende del area de trabajo y de la experiencia del
modelador, del dominio de las herramientas matematicas y del uso adecuado de hipotesis
simplificatorias. Una buena practica consistira en replantear el modelado de algunos de los
ejemplos presentados hasta este momento y entender como se obtuvo cada modelo y cuales
fueron las hipotesis simplificatorias involucradas.
Para afianzar algunos de estos conceptos existen amplias y detalladas referencias al respecto. Puede ser de utilidad revisar e investigar la informacion contenida en textos de
circuitos lineales y no lineales, textos de mecanica racional (estatica y dinamica), textos
sobre procesos qumicos (la parte referida a control), etc.
Chapter 2
Esquema de Dise
no de Leyes de
Control basadas en Linealizaci
on
Posicion del movil
Angulo
0.5
600
0.4
400
0.3
200
0.2
0.1
0
0.5
0
0
0.5
Posicion del cg
2.5
2
1.5
1
0.5
0
0
0.5
El diseno de leyes de control para un sistema real requiere seguir una metodologa sistematica
que permita probar y poner en funcionamiento el sistema de control en lazo cerrado.
Nuestro proposito en este captulo sera el de hacer explcita una metodologa para el diseno
la cual permite afrontar en forma sistematica los metodos de control basados en la linealizacion
del modelo no lineal del sistema real.
33
2.1
Introducci
on
2.2
Esquema Propuesto
Empleando como marco de referencia el esquema general propuesto en la Figura 2.1, procederemos a analizar someramente cada una de las estrategias de dise
no de leyes de control
para sistemas no lineales controlados. Notemos que el esquema presentado constituye un
diagrama de bloques que ilustra los posibles pasos a seguir en cualquier proceso iterativo de
dise
no de leyes de control.
Nuestro objetivo central durante el desarrollo de estas notas sera el de presentar metodos
de dise
no estrechamente asociados al deseo de linealizar el sistema no lineal dado. Este
afan viene del hecho de que, en el caso de los sistemas lineales, disponemos de estrategias
de dise
no muy bien definidas y probadas durante a
nos, tanto en forma teorica como en la
practica. Esta facilidad que nos proveen los sistemas lineales es usada corrientemente en el
ambito de los sistemas no lineales. La herramienta fundamental que nos permite establecer
esta conexion entre los sistemas lineales y los sistemas no lineales controlados sera el metodo
de linealizaci
on, ver la indicacion (1) del diagrama presentado en la Figura 2.1.
El resultado directo de la linealizacion es el sistema linealizado, ver (2). Este sistema
dependera estrechamente del o de los puntos de equilibrio del sistema no lineal; en ciertas ocasiones, en lugar de trabajar con un sistema lineal, dispondremos de una familia de
sistemas linealizados parametrizados respecto a puntos de equilibrio genericos de la forma
(U, X(U ), Y (U )), ver seccion anterior. El sistema lineal obtenido nos permitira estudiar mas
facilmente propiedades locales inherentes del sistema no lineal, tales como controlabilidad,
observabilidad, etc., y mas precisamente nos facilitara la aplicacion de las estrategias de
dise
no de leyes de control, ver (3).
La ley de control para el sistema lineal es elaborada a partir de metodos de dise
no para
sistemas lineales, es decir, es obtenida usando herramientas de dise
no en el espacio de estados
(matrices de controlabilidad y observabilidad, analisis matricial, polinomios caractersticos,
controladores y observadores dinamicos de estado, etc.) o en el plano de la frecuencia (diagrama de Nyquist, lugar de las races, metodo de ZieglerNichols, compensadores P, PI,
Sistema no lineal
controlado
linealizacin
mtodo de
Ley de control
no lineal
Sistema lineal
(parametrizado)
Ley de control
para el sist. lineal
(parametrizada)
mtodo de transformacin
"NO LINEALIZACIN"
para sistemas
lineales
mtodos
de diseo
especificaciones
de diseo:
(tiempo de asentamiento,
sobredisparo mximo, etc)
Figure 2.1: Esquema general de diseno de leyes de control para sistemas no lineales controlados
37
Lecturas Recomendadas
Diversos textos podran mencionarse que permitan brindar un panorama general de la
filosofa de dise
no implicada en todo proyecto asociado a un sistema de control de tipo
practico. Interesantes lecturas en este sentido son, en opinion de los autores, las siguientes:
El captulo 1 del texto de Doyle, Francis, Tannenbaum: Feedback control systems, etc.
El capitulo 1 del texto de el autor de LMI, etc.
Part I
El M
etodo de la Linealizaci
on
Aproximada
39
Chapter 3
El M
etodo de la Linealizaci
on
Aproximada
Nuestra comprension del mundo circundante y las leyes que en el adivinamos son meras aproximaciones que tienden a extraer la parte mas relevante de su naturaleza, la mayora de las veces
para poder explotarlas en nuestro beneficio inmediato. Tales aproximaciones se sustentan como
modelos validos de una realidad restringida que no ha sido contradicha por la experiencia cotidiana. Desde este punto de vista, los fenomenos de naturaleza no lineal son tambien susceptibles
de aproximaciones lineales cuyo valor practico es innegable.
Nos proponemos utilizar sistemas de ecuaciones diferenciales lineales que aproximen, en una
region restringida del espacio de estado, de las entradas y de las salidas del sistema, el comportamiento descrito por el conjunto de ecuaciones diferenciales no lineal original. El metodo de la
linealizacion aproximada es util en el analisis del comportamiento de sistemas dinamicos no lineales en la vecindad de su punto de equilibrio cuando las perturbaciones que afectan la evolucion
del sistema son suficientemente pequenas. El metodo tambien es util no solo en el analisis sino
tambien en el diseno de estrategias de control que mantengan la evolucion del sistema en un
entorno alrededor del punto de equilibrio nominal.
41
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
42
3.1
Introducci
on
3.2
El M
etodo de la Linealizaci
on Aproximada
Los lineamientos mediante los cuales analizaremos los sistemas dinamicos no lineales, y sobre
los cuales propondremos lazos de control en realimentacion, son los siguientes:
Consideracion del sistema no lineal desde el punto de vista de la descripcion por variables de estado y determinacion de los puntos de equilibrio constantes del sistema no
lineal dado.
Descripcion aproximada de los efectos de las perturbaciones del estado inicial y de las
entradas al sistema, mediante un modelo lineal dinamico de estado.
Utilizacion del modelo lineal en la prescripcion de leyes de control realimentadas estabilizantes de las trayectorias del estado, perturbadas alrededor de la trayectoria de
equilibrio.
APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION
3.2.1
43
Linealizaci
on mediante expansiones en serie de Taylor
= f (x(t), u(t)),
y(t) = h(x(t))
x(t0 ) = x0
(3.1)
Z t
t0
y(t) = h x0 +
f (x(), u())d
Z t
t0
f (x(), u())d
(3.2)
Esta representacion tiene sus ventajas al momento de evaluar el efecto causado sobre los
estados y las salidas debido a posibles perturbaciones que se sucedan en el estado inicial x0
y en la funcion de entrada u(t).
Supondremos que el sistema dinamico se encuentra operando en perfecto equilibrio. Esto
se traduce en lo siguiente:
x(t0 ) = x0 = X;
u(t) = U ;
y(t) = h(x) = Y
(3.3)
u(t) = U + u (t)
(3.4)
Z t
t0
f (X + x (), U + u ())d
(3.5)
La representacion (3.5) constituye una representacion exacta del efecto de las perturbaciones pero ciertamente una que no es muy u
til puesto que sigue describiendo mediante una
ecuacion integral el valor del nuevo estado x(t) = X + x (t) y como una relacion no lineal
44
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
el valor de la nueva salida y(t) = Y + y (t). En efecto a partir de (3.5) y de las definiciones
que acabamos de dar del estado perturbado y la salida perturbada, obtenemos:
x (t) = x0 +
Z t
t0
f (X + x (), U + u ())d
f
f
x (t) +
u (t) + . . .
f (X + x (t), U + u (t)) = f (X, U ) +
x (X,U )
u (X,U )
h
h(X + x (t)) = h(X) +
x (t) + . . .
x X
(3.6)
Tomando en cuenta que f (X, U ) = 0, podemos calcular el valor del estado perturbado
como:
Z t
f
f
x (t) = x0 +
x (t) +
u (t) + . . . d
x (X,U )
u (X,U )
t0
"
y (t) =
h
h
h(X) +
x (t) + . . . h(X) =
x (t) + . . .
x X
x X
Evidentemente que si truncamos la serie de Taylor, tanto en la ecuacion integral del estado
perturbado como en la ecuacion de salida, y despreciamos los terminos de orden superior, que
quedaron tacitos en los puntos suspensivos utilizados en las formulas anteriores, obtendremos
solo una aproximacion a los valores de x (t) y de y (t). Adoptaremos como valor aproximado
de x (t) al valor x (t) el cual obtenemos al eliminar todos los terminos de orden superior en
la ecuacion integral. Es decir:
Z t
f
f
x (t) = x0 +
x (t) +
u (t) d
x (X,U )
u (X,U )
t0
y (t) =
h
x
(t)
x X
(3.7)
Notese que x (t) no es exactamente igual a x (t) y otro tanto sucede con y (t) y y (t). Sin
embargo, no estableceremos diferencia entre el valor de la perturbacion y el valor aproximado
de la misma obtenido en (3.7). Asumimos, entonces, como valor perturbado del estado y
como valor de la perturbacion de la se
nal de salida, a la solucion de la ecuacion integral y a
la relacion lineal descritas en (3.7), i. e.
Z t
f
f
x (t) +
u (t) d
x (t) = x0 +
x (X,U )
u (X,U )
t0
APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION
45
y (t) =
h
x (t)
x X
(3.8)
Z t
t0
(A x () + B u ()) d
y (t) = C x (t)
(3.9)
x (t0 ) = x0
(3.10)
La ecuacion diferencial en la expresion (3.10) representa un sistema de ecuaciones diferenciales lineales en x (t) y en u (t), cuya solucion x (t) es una aproximacion al comportamiento
de las perturbaciones que exhibe el sistema no lineal (3.1) por sobre los valores de la trayectoria de equilibrio x(t) = X y u(t) = U . Es evidente que para conocer integramente la
solucion de (3.10) deben conocerse tanto el valor de la perturbacion del estado inicial x (t0 )
como los valores, en funcion del tiempo, de las perturbaciones de la entrada en equilibrio
u (t).
En resumen, el sistema dinamico que aproxima las perturbaciones ocurridas al sistema
no lineal cuando este opera en condiciones estables de equilibrio esta representado por un
sistema lineal cuyas ecuaciones de estado y de salida estan dadas por (3.10). Las matrices
constantes (A, B, C) que definen a esta aproximacion lineal estan dadas por:
f
A=
;
x (X,U )
f
B=
;
u (X,U )
h
C=
x X
(3.11)
u(t) = U + u (t);
y(t) = Y + y (t)
(3.12)
u (t) = u(t) U ;
y (t) = y(t) Y
(3.13)
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
46
u (t)
u(t)
.
x=f(x,u)
x(t)
x (t)
Figure 3.1: Relacion entre las variables originales y las variables perturbadas
3.2.2
Representaci
on en Funciones de Transferencia
= f (x(t), u(t))
y = h(x(t))
Sea u(t) = U un punto de operacion constante para la entrada escalar del sistema anterior.
Correspondiente con este valor nominal de la entrada, tenemos un valor de equilibrio para el
vector de estado y para la salida, dados, respectivamente, por x(t) = X(U ) y y(t) = Y (U ).
La expresion linealizada del sistema alrededor del punto de operacion generico
(U, X(U ), Y (U )),
parametrizada en terminos del valor constante de la entrada de control en equilibrio U , esta
dada por:
x = A(U )x + B(U )u
y = C(U )x
donde
A(U ) =
f (x, u)
;
x X(U ),U
C(U ) =
h(x)
x X(U )
(3.14)
f (x, u)
B(U ) =
;
u X(U ),U
y
x = x X(U ); u U ; y = y Y (U )
Evidentemente, a partir de esta representacion del sistema linealizado (ver figura 3.2)
podemos obtener la funcion de transferencia del sistema en lazo abierto, dada por:
GU (s) = C(U )[sI A(U )]1 B(U )
(3.15)
APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION
u
ENTRADA
INCREMENTAL
GU(s)
FUNCION
DE
TRANFERENCIA
47
y
SALIDA
INCREMENTAL
3.2.3
Ejemplos
Antes de proceder a exponer como utilizar este esquema conceptual, lineal, daremos algunos
ejemplos de linealizacion de sistemas alrededor de trayectorias de equilibrio constantes.
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
48
z1
z2
"
#"
0
0 (1 U )
0 (1 U )
1
z1
z2
"
b
1U
b1
0 (1U )2
y = z2
(3.16)
La funcion de transferencia que relaciona el voltaje incremental de salida con el valor incremental
de la relacion de trabajo, se obtiene del modelo linealizado (3.16) como:
GU (s) = 0 Z1 (U )
b
Z1 (U )
+ 02 (1
s
s2 + 1 s
(3.17)
U )2
0
x 1
x 2 = X
x 3
0
y = x1
1
0
0
x1
q
cg
0 2 mX x2 + 0 u
1
x3
0
R
L
L
(3.18)
y (s)
GX (s) =
=
u (s)
s2
g
X
cg
mX
s+
R
L
(3.19)
1 +
4Da1 Da2 U
1+
1 + Da1
(3.20)
La linealizacion del sistema alrededor de este punto de equilibrio esta dada por:
x 1 = (1 + Da1 )x1 + u
s
x 2 = Da1 x1
y = x1 + x2
1+
4Da1 Da2 U
x2
1 + Da1
(3.21)
APROXIMADA?49
3.3. QUE
DE LA LINEALIZACION
como puede verificarse sin mayores esfuerzos.
BVa
Va KU
; x2 = X2 (U ) =
2
2
Ra B + K U
Ra B + K 2 U 2
(3.22)
La linealizacion de este sistema alrededor del punto de equilibrio descrito anteriormente se obtiene
como:
"
x 1
x 2
Ra
= La
KU
J
K 2 Va U
KU "
#
x1
La (Ra B + K 2 U 2 )
La
+
B
K 2 BVa
x2
J
J(Ra B + K 2 U 2 )
(3.23)
3.3
Qu
e tan bueno es el M
etodo de la Linealizaci
on
Aproximada?
(3.24)
Es facil ver, sin embargo, que este sistema tiene por punto de equilibrio x = 0 (cuyo
signo tambien se supone cero). Justamente en el origen, la funcion signo, designada aqu
mediante las siglas sign , no es diferenciable sobre la recta real.
50
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
u=U
h
c
A
(3.25)
El punto de equilibrio del sistema, para un valor de entrada constante, u = U , esta dado por
h = H = U 2 /c2 . Considerese una peque
na perturbacion en el valor constante del control dada por
un s
ubito incremento fijo en la rata de alimentaci
on de lquido al tanque, de valor U , durante un
perodo de tiempo indefinido.
Nuestro objetivo es calcular, mediante linealizacion aproximada, el efecto de esta perturbacion
y compararlo con un calculo preciso (es decir, sin aproximaciones) del nuevo valor de la altura del
tanque en equilibrio. (Ver figura 3.4).
De acuerdo a la ecuacion diferencial del sistema, el valor del nuevo estado de equilibrio (la nueva
altura del nivel del lquido) esta dada por:
H + h =
(U + U )2
U 2 2U U + U 2
=
+
c2
c2
c2
(3.26)
APROXIMADA?51
3.3. QUE
DE LA LINEALIZACION
U+u (t)
t
t0
c
1
h + u
A
2A H
y = h
(3.28)
2
2U U
Hu =
c
c2
(3.29)
El error que se comete, en este ejemplo, al utilizar la linealizacion aproximada tiene una magnitud cuadratica respecto de la perturbacion de entrada y esta dado por (U/c)2 . El metodo
de linealizacion es valido en la medida en que el termino (U/c)2 sea completamente despreciable frente al valor de equilibrio de la perturbacion que hemos calculado de manera aproximada
2U U/c2 . Por lo tanto, si U es grande, el error cometido es significativo.
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
52
aproximaci
on se deteriora en forma, cuando menos cuadratica, al admitir perturbaciones que representan excursiones significativas a partir de los valores de
equilibrio de las variables de entrada y estados iniciales del sistema.
3.4
c
Primer ejemplo en Matlab
3.4.1
Modo de uso
En general, para simular un sistema no lineal controlado, se requieren dos programas que
llamaremos el programa de simulacion y el sistema de control (o function). El programa de
simulacion permite definir los lineamientos basicos de la simulacion: tiempo de simulacion
(inicial y final), condiciones iniciales y tipo de algoritmo de simulacion, inclusive podemos
definir los parametros del sistema controlado y hasta graficar los resultados de la simulacion.
Este programa consiste en un conjunto logico de instrucciones de ejecucion secuencial dec El corazon principal de este programa es el
nominado script en el ambiente Matlab .
algoritmo de simulacion. Tenemos dos tipos: ode23 o ode45, los cuales son metodos de
resolucion de ecuaciones diferenciales mediante las formulas de Runge-Kutta de 2do. y 3er.
orden (ode23) y 4to. y 5to. orden (ode45).
El sistema de control se presenta por medio de un programa o funcion en el cual se
plantean explcitamente las ecuaciones diferenciales asociadas al sistema de control. Junto
con estas ecuaciones, la ley de control dise
nada puede estar definida a traves de variables
auxiliares (locales). A diferencia del script, este programa requiere un encabezado con la
palabra function <salida> = <nom arch>(t,x), donde <salida> corresponde al vector
x que refleja la dinamica del sistema, <nom arch> es el nombre original del programa y
(t,x) representan las variables de tiempo y de estado correspondientes de la simulacion y
del sistema controlado.
Ejemplo 3.6: p
endulo invertido sobre una plataforma m
ovil
Considere el sistema de control del pendulo invertido sobre una plataforma movil ya visto
c mediante los cuales
(1.45). A continuacion se presenta los programas de simulaci
on en Matlab
c
3.4. PRIMER EJEMPLO EN MATLAB
53
se pueden comparar las respuestas del sistema linealizado (3.31) y del sistema no lineal en lazo
abierto. Tomaremos como salida la posicion del centro de gravedad (cg) del pendulo y(t) = x1 (t) +
L sen (x3 (t)).
El contenido de cada programa se puede describir de la siguiente manera. El programa spend.m
permite simular el modelo no lineal, mpend.m contiene el modelo no lineal del sistema y lpend.m
genera la comparacion entre el modelo lineal y el modelo no lineal. Nota: el smbolo % al comienzo
de una lnea indica los comentarios que se hacen en pro de claridad.
c se ejecutan los programas:
Desde Matlab
> spend
> lpend
Programa de simulaci
on del sistema no lineal:
%% spend.m
%% Programa de simulacion del modelo
%% del pendulo invertido sobre una plataforma movil.
%% Parametros
global M F r0 u0 m L J C g
%% Movil (Cart )
M = 0.48; % masa
F = 3.83; % constante de friccion
%% Pendulo
m = 0.16; % masa
L = 0.25; % longitud del pendulo (distancia entre el eje y el centro de
% gravedad)
J = 0.0043; % momento de inercia alrededor del centro de gravedad
C = 0.00218; % constante de friccion
g = 9.8; % aceleracion de gravedad
%% condiciones iniciales
x0 = [0.4 0 pi/40 0];
%% tiempo de simulacion
ti = 0;
tf = 1;
[t,x] = ode45(mpend,ti,tf,x0,1e-6,1);
subplot(221),plot(t,x(:,1)),title(Posicion del movil),grid
subplot(222),plot(t,x(:,3)),title(Angulo de rotacion del pendulo),grid
subplot(223),plot(t,x(:,1)+L*sin(x(:,3))),title(Posicion del c.g. del %%@
pendulo),grid
% fin de spend.m
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
54
D1 = -C*x(4)+m*L*g*sin(x(3));
D2 = -F*x(2)+m*L*sin(x(3))*x(4)^2+u;
D = J*(M+m)+m*L^2*(M+m*sin(x(3))^2);
xdot = [x(2);
(-m*L*cos(x(3))*D1+(J+m*L^2)*D2)/D;
x(4);
((M+m)*D1-m*L*cos(x(3))*D2)/D];
%% fin de mpend.m
lpend.m
Modelo incremental
pendulo invertido sobre una plataforma movil.
Se debe ejecutar despues de spend.m
Los parametros son los mismos de spend.m
Dt = J*(M+m)+M*m*L^2;
A
0
0
0
=
[0 1 0 0;
-F*(J+m*L^2)/Dt -m^2*L^2*g/Dt m*L*C/Dt;
0 0 1;
m*L*F/Dt (M+m)*m*L*g/Dt -C*(M+m)/Dt];
B =
[0;
(J+m*L^2)/Dt;
0;
-m*L/Dt];
C = [1 0 L 0]; %% Consideramos como salida la posicion
%% del centro de gravedad y = x_1+L*sin(x_3)
D = 0;
T = (0:0.05:tf);
U = zeros(size(T));
%% condiciones iniciales x0, ver spend.m
[Y,X] = lsim(A,B,C,D,U,T,x0);
subplot(221),plot(t,x(:,1),y--,T,X(:,1),r),
title(Posicion del movil),grid
subplot(222),plot(t,x(:,3)*180/pi,y--,T,X(:,3)*180/pi,r),
title(Angulo de rotacion del pendulo),grid
subplot(223),plot(t,x(:,1)+L*sin(x(:,3)),y--,T,Y,r),
title(Posicion del cg),grid
%% fin de lpend.m
En la figura 3.5 se puede observar la equivalencia local entre el modelo linealizado y el modelo
no lineal original.
55
Angulo
0.5
600
0.4
400
0.3
200
0.2
0.1
0
0.5
0
0
0.5
Posicion del cg
2.5
2
1.5
1
0.5
0
0
0.5
Figure 3.5: Comportamiento local del sistema lineal (lnea continua ) y el sistema no lineal
(trazos - -)
3.5
Ejercicios Propuestos
Ejercicio 3.1: p
endulo invertido sobre una plataforma m
ovil
Dejamos como ejercicio verificar que en el punto de equilibrio
x1 = arbitrario; x2 = 0; x3 = 0; x4 = 0
(3.30)
(3.31)
donde
A =
f
=
B =
f
u
=
(xe ,ue )=(0,0)
0
1
F (J+mL2 )
0
0
0
mLF
0
0
J+mL2
0
mL
0
2
0
2g
L
m
(M +m)mLg
F (mLC
+m)
C(M
= J(M + m) + mL2 M .
donde
(?)
Ejercicio 3.2: Matlab
proceso de producci
on de etanol
56
APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
Obtenga el modelo incremental del sistema (1.54) alrededor del punto de equilibrio (1.55).
Obtenga las simulaciones numericas del comportamiento del sistema linealizado ante una se
nal
escalon en lazo abierto u (t) = 0.2, con una concentraci
on de etanol nominal x
1 = E = 0.7
(condiciones iniciales en el punto de equilibrio). Realice el mismo experimento de simulaci
on
(identica se
nal de prueba y condiciones iniciales) sobre el sistema no lineal original (1.54), usando
para ello la relacion dada por (3.13). Compare los resultados y disc
utalos con el instructor o
asistente del curso.
(?)
Lecturas
Varios de los textos que tratan a fondo el dise
no de sistemas de control lineales presentan en
sus captulos introductorios un rese
na sobre linealizacion de sistemas no lineales alrededor
de puntos de equilibrio, consulte por ejemplo:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems, 3ra. Edicion, Addison-Wesley, 1994.
B. Kuo, Automatic Control Systems, Prentice Hall, Septima edici
on, 1995
N. Nise, Control System Engineering, Addison Wesley, Segunda edici
on, 1996
Chapter 4
El M
etodo de la Linealizaci
on
Aproximada en el Dise
no de
Controladores para Sistemas
Din
amicos No Lineales
Es imprescindible entender que, al tratar de establecer leyes de control sobre sistemas reales
(no lineales) en base a modelos lineales aproximados, la validez de tales acciones de regulacion
esta necesariamente restringida al rango de validez de la linealizacion. No podra por lo tanto
pretenderse que un modelo as establecido sea valido en todo el ambito de posible variabilidad
del sistema. Sin embargo, gran parte de la tecnologa de regulacion automatica disenada para
innumerables clases de procesos en la industria, durante los ultimos 20 anos, esta basada en este
solo hecho.
57
APROXIMADA Y EL DISENO
DE CONTROLADORES
58CHAPTER 4. LA LINEALIZACION
4.1
Motivaci
on
Es bien conocido que, en la realidad, los procesos a ser controlados siempre se ven afectados
por peque
nas perturbaciones que desvian, de sus puntos de equilibrio, a las variables que
caracterizan al sistema. Se hace preciso, por lo tanto, dise
nar mecanismos de control que
ayuden a mantener las variables del sistema en sus valores nominales de operacion, a la luz de
las perturbaciones reinantes. Estas perturbaciones pueden provenir del medio ambiente como
influencias de caracter aleatorio o generadas por peque
nas variaciones de los parametros que
definen el sistema dinamico. En ocasiones, las perturbaciones tambien pueden ser inducidas
por operadores humanos en el deseo de conducir algunos experimentos sobre el sistema y su
comportamiento controlado con el objetivo de realizar el dise
no del modelo matematico por
medio de identificaci
on, o en el caso de ajuste (tuning) de los parametros del controlador,
por ejemplo.
En cualquiera de los casos enunciados, la linealizacion aproximada puede ser u
til, en
cuanto al dise
no del controlador se refiere, pues esta permite obtener un modelo lineal que
describe el comportamiento del sistema alrededor de sus valores nominales como respuesta a
las perturbaciones que afectan al mismo. Este modelo exhibe en forma explcita la relacion
entre las perturbaciones de entrada y estados iniciales y su efecto en las variables perturbadas
de estado y salida del sistema. En consecuencia, este modelo puede servirnos para proponer
una perturbacion de caracter controlador a la entrada incremental del sistema. El proposito
de dise
nar tal entrada sera el de hacer que el efecto de las posibles perturbaciones en los
estados iniciales y variables de estado sea estabilizado a cero. Con esto se lograra que el
sistema no lineal original contin
ue operando en su punto de equilibrio nominal.
Este captulo se dedica a desarrollar los esquemas basicos de aplicacion de la linealizacion
aproximada en el dise
no de estrategias de control. Presentaremos a continuacion el esquema
de dise
no de un controlador estatico para un sistema linealizado basado en el conocimiento
preciso del vector de estado.
4.2
Dise
no de Controladores mediante Linealizaci
on
Aproximada
Supondremos, en primer lugar, que el valor del estado del sistema x(t) y de sus posibles
perturbaciones x (t) estan disponibles para medicion. Es decir, tenemos conocimiento pleno
de todas y cada una de las variables de estado perturbadas y podemos, por lo tanto, utilizarlas
en esquemas de control realimentado.
El metodo que estudiaremos esta basado en suponer que los valores de las perturbaciones de estado se describen mediante un sistema lineal obtenido a partir del no lineal
original por medio de linealizacion aproximada alrededor del punto de equilibrio nominal del
sistema. Es decir, reemplazaremos los valores reales de las perturbaciones por las aproximaciones obtenidas por linealizacion, representadas por un sistema lineal. Sabemos que
esta substitucion es valida solo cuando los valores de las perturbaciones son suficientemente
u (t)
u(t)
.
x=f(x,u)
x(t)
x (t)
Figure 4.1: Relacion entre las variables originales y las variables perturbadas
peque
nos. En efecto, el esquema de la figura 3.1, reproducida en la figura 4.1, nos muestra
que el comportamiento de los efectos de las perturbaciones sobre el sistema no lineal son
reemplazables, en forma aproximada, por un sistema lineal.
Veamos al sistema no lineal de la figura 4.1 como una relacion entre u (t) y x (t). Es
evidente que si se puede encontrar un control estabilizante como funcion de la variables
perturbadas de estado x (t), entonces el control debe garantizarnos la estabilizacion a cero
de estas variables perturbadas. Entre u (t) y x (t) existe una relacion lineal aproximada que
podemos representar como:
u (t)
.
x (t)=Ax (t)+bu (t)
x (t)
Figure 4.2: Sistema lineal que describe, en forma aproximada, el comportamiento de las perturbaciones
Es indudable que si logramos establecer una prescripcion que especifique al control o
entrada incremental u (t) en terminos del estado, nuestro problema no lineal original queda
reducido a un problema lineal, en tanto que las magnitudes de las perturbaciones a que
se ve sometido el sistema original sean lo suficientemente peque
nas como para no desviar
significativamente los valores de las variables de estado originales de sus puntos de operacion
nominales.
La estrategia de control consistira en dise
nar una ley de control lineal para el sistema de
la figura 4.2, la cual estabilice a cero las variables de estado perturbadas x (t). El esquema
de control sera el que se muestra en la figura 4.3. En terminos del sistema no lineal original,
el esquema de control sera el representado en la figura 4.4.
Cabe ahora preguntarnos: cuando sera efectivo utilizar el esquema de control anterior?.
Es decir, que limitaciones pueden existir para que, en ciertos casos, el esquema de control
propuesto no funcione satisfactoriamente?. Puesto que hemos reemplazado el problema de
control no lineal por uno lineal, la pregunta se reduce a plantear las condiciones bajo las
cuales el sistema de la figura 4.2 es estabilizable mediante realimentacion constante de las
variables de estado incrementales. Para ello recordemos el siguiente teorema basico de la
teora de sistemas lineales.
APROXIMADA Y EL DISENO
DE CONTROLADORES
60CHAPTER 4. LA LINEALIZACION
u (t)
x (t)
.
x (t)=Ax (t)+bu (t)
u (t)=-Kx (t)
u (t)
u(t)
.
x=f(x,u)
x(t)
x (t)
u (t)=-Kx (t)
(4.1)
C = det B : AB : . . . : An1 B = 0
(4.2)
forman una variedad algebraica, es decir, una union de planos, cuya medida (entendamos por
tal medida el hipervolumen) es cero. En consecuencia, al escoger un punto aleatoriamente
en este espacio de dimension n(n + 1), con probabilidad uno caeremos fuera de esta variedad
algebraica1 .
El resultado anterior y nuestra seguridad de encontrarnos frente a un sistema controlable
nos hace concluir que el metodo tendra limitaciones solamente relativas a la magnitud de las
perturbaciones que se requiere controlar, es decir, las mismas deberan ser suficientemente
peque
nas.
Una forma de ilustrar lo que decimos consiste en dibujar una o varias lneas en una hoja de papel en
forma desordenada, luego proponer dos n
umeros aleatorios que representen coordenadas adoptadas sobre
dos bordes contiguos de la hoja y, por u
ltimo, ver si los n
umeros propuestos al azar representan un punto de
alguna de las lineas que hemos trazado. Como es facil imaginarse, es muy difcil caer exactamente sobre una
de las lneas dibujadas. Es posible predecir que, si el experimento se hace adivinando en forma aleatoria (por
ejemplo, pidiendole a un amigo que no ve la hoja ni el resultado de sus intentos, el decir las coordenadas en
cuestion), entonces es casi seguro que de cien intentos que hagamos caeremos cien veces fuera de las rectas
dibujadas!.
APROXIMADA Y EL DISENO
DE CONTROLADORES
62CHAPTER 4. LA LINEALIZACION
Consideremos nuevamente el sistema (1.18):
x 1 = x2
FL
sen x3
x 2 =
J
x 3 = Ru
Bajo la suposicion de que todas las variables de estado son medibles y, por lo tanto, utilizables en
cualquier poltica de control realimentado, procedemos a definir las variables perturbadas alrededor
de los valores nominales de equilibrio, los cuales, se asume, son coincidentes con las condiciones
inherentes a la posicion deseada:
x1 = x1 ; x2 = x2 ; x3 = x3 ; u = u
(4.3)
La linealizacion del sistema alrededor de su punto de equilibrio constante esta dada por:
x 1
= x2
FL
FL
=
cos x3
x3 =
x3
J
J
x3 =0
= Ru
x 2
x 3
(4.4)
o , en terminos matriciales:
0 1
x
d 1
x2 = 0 0
dt
x3
0 0
0
x1
FL
J x2 + 0 u
x3
R
0
(4.5)
El sistema linealizado es independiente del punto de equilibrio. Tambien es facil ver que el
sistema es completamente controlable debido a que la matriz de controlabilidad, dada por:
C= 0
R
0
F LR
J
F LR
J
0
0
(4.6)
(4.7)
Esta ley de control conlleva, en consecuencia, la siguiente expresion para el sistema controlado
en lazo cerrado:
0
1
0
x
x1
d 1
FL
x2
0
0
x2 =
J
dt
x3
x3
RK1 RK2 RK3
(4.8)
Puesto que el interes fundamental esta en inducir una dinamica controlada, para el valor de las
perturbaciones del estado, de naturaleza asint
oticamente estable a cero, los valores de las ganancias
c
Im
plano s
Re
a
-c
Figure 4.5: Ubicacion de polos en el plano complejo para el sistema en lazo cerrado
K1 , K2 , K3 deben especificarse de tal manera que los autovalores del sistema autonomo anterior
(sistema en lazo cerrado) tengan parte real negativa. Con el objeto de obtener esta especificacion
calculamos el polinomio caracterstico y lo igualamos a alguno del cual sabemos tiene sus raices en
el semiplano izquierdo en valores preestablecidos.
El polinomio caracterstico del sistema lineal en lazo cerrado esta dado por:
s
1
0
(4.10)
donde a, b y c son conocidos y se escogen de tal manera que la respuesta tenga caractersticas
deseables (tiempo de ascenso, sobrepaso, tiempo de estabilizacion, etc.).
Igualando los coeficientes de las mismas potencias de ambos polinomios obtenemos el siguiente
conjunto de ecuaciones para los parametros de dise
no:
RK3
F LRK2
J
F LRK1
J
de donde obtenemos en forma inmediata los
K1 = J
a(b2
c2 )
+
F LR
= 2b + a
= b2 + c2 + 2ab
= a(b2 + c2 )
(4.11)
; K2 = J
b2 + c2 + 2ab
2b + a
; K3 =
F LR
R
(4.12)
APROXIMADA Y EL DISENO
DE CONTROLADORES
64CHAPTER 4. LA LINEALIZACION
Posicin angular
Velocidad angular
2.5
1.2
1
2.4
omega
theta
0.8
2.3
2.2
0.6
0.4
2.1
2
0
0.2
0.5
1.5
tiempo t
2.5
0
0
0.5
Orientacin de la tobera
1.5
tiempo t
2.5
2.5
Variable de control
0.8
0.6
0.5
beta
0.4
0.2
0
0
-0.2
-0.5
0
0.5
1.5
tiempo t
2.5
-0.4
0
0.5
1.5
tiempo t
a(b2 + c2 )
b2 + c2 + 2ab
2b + a
x1 J
x2
x3
F LR
F LR
R
(4.13)
a(b2 + c2 )
b2 + c2 + 2ab
2b + a
(x1 ) J
x2
x3
F LR
F LR
R
(4.14)
ejemplo1.m
Primer ejemplo de simulacion numerica:
Control de orientacion de un artefacto espacial por medio
de linealizacion aproximada
Este programa simula la respuesta de un modelo de tercer
orden, que representa un artefacto espacial del cual se requiere
una reorientacion angular mediante control de las variables
de estado: posicion, velocidad y orientacion de la tobera.
El controlador disen~ado esta basado en linealizacion
aproximada alrededor del punto de equilibrio deseado.
function xdot=ejemplo1(t,x)
%% parametros del sistema
F = 200; L=3; R=20; J =50;
%% parametros del controlador
a =2.0; b=3.5; c = 12.75; Theta = 2.5;
%% Ley de control
u = -J*a*(b^2+c^2)/(F*L*R)*(x(1)-Theta)-J*(b^2+c^2+2*a*b)/F/L/R*x(2)-...
(2*b+a)/R*x(3);
%% Ecuaciones de estado
xdot = [x(2) ; F*L/J*sin(x(3)) ; R*u];
%% Fin de ejemplo1.m
APROXIMADA Y EL DISENO
DE CONTROLADORES
66CHAPTER 4. LA LINEALIZACION
Posicin angular
Velocidad angular
0.6
1.5
1
omega
theta
0.4
0.2
0.5
0
0
0
0.5
1.5
tiempo t
2.5
-0.5
0
0.5
Orientacin de la tobera
1.5
tiempo t
2.5
2.5
Variable de control
beta
2
4
1
2
0
0
0.5
1.5
tiempo t
2.5
-1
0
0.5
1.5
tiempo t
Figure 4.7: Respuestas del comportamiento del artefacto espacial obtenidas por simulacion del
sistema controlado para desviaciones iniciales significativas del punto de equilibrio.
APROXIMADA Y EL DISENO
DE CONTROLADORES
68CHAPTER 4. LA LINEALIZACION
N
; u=0
L
se expresa como:
N
x 1 = x1 + x2 + u
L
L
x 2 =
x1 x2
L
(4.15)
L
A=
L
B=
L
0
(4.16)
N
N
L L2
C = [B : AB] =
N ;
0
L2
det C =
N 2
6= 0
L3
(4.17)
(4.18)
x =
N
L K1
N
L K2
(4.19)
pAKB = s2 + +
N
N
+ K1 s + K1 + 2 K2
L
L
L
L
(4.20)
(4.21)
L
N
2n
;
L
K2 =
L2
2 2n
N n
L
(4.22)
L
N
2n
L2
x1
n2 2n
L
N
L
x2
(4.23)
La ley de control lineal que estabiliza al sistema no lineal se consigue substituyendo las variables
incrementales x1 , x1 y x por sus valores:
x1 = x1 N ;
u
L
=
N
x2 = x2
N
;
L
u = u
L2
2n
(x1 N )
2 2n
L
N n
L
N
x2
(4.24)
L
1E
E
1E
Eu
E
1
x2 + (1 x2 )u
E
(4.25)
1E
E
A=
0
1
1 ;
"
B=
E
E
(4.26)
C = [B : AB] =
E
1
E 1
det C = 0
(4.27)
Debemos transformar el sistema linealizado con el objeto de esclarecer cual de los modos del
sistema es incontrolable.
Considerese la siguiente transformacion del vector de estados:
z1 = x1 + x2
z2 = x1
la cual es, evidentemente, invertible.
(4.28)
APROXIMADA Y EL DISENO
DE CONTROLADORES
70CHAPTER 4. LA LINEALIZACION
Las ecuaciones diferenciales para z resultan ser:
z1 =
z2 =
1
E
z1
1
z2 + Eu
E
(4.29)
Esta ecuacion exhibe claramente a z1 como modo incontrolable del sistema, mientras que z2
representa el modo controlable del mismo. Afortunadamente, el modo incontrolable del sistema es,
evidentemente, asintoticamente estable en virtud de las restricciones que sobre el valor de E pesan
desde un principio (0 < E < 1), esto hace que la cantidad 1 1/E, que es el autovalor asociado a
z1 , sea, efectivamente, menor que cero. El valor de esta variable de estado transformada tiende,
por s sola, a cero en forma exponencial.
El dise
no del controlador se reduce a prescribir una ley de control que estabilice al modo z2 a
cero (z2 = x1 = concentracion incremental de etanol.
Hacemos entonces:
u = Kz2 = Kx1
(4.30)
z2
1
+ KE z2
=
E
(4.31)
Igualando el u
nico autovalor a una cantidad real negativa , se tiene:
u = Kx1
1
=
E
x1
(4.32)
1
1
(x1 E)
u = U (E)
E
E
1E
1
1
=
(x1 E)
E
E
E
(4.33)
Concentracin de azcar
0.9
0.6
0.8
0.5
0.7
x2
x1
0.4
0.6
0.3
0.5
0.2
0.4
0.1
0
2
tiempo t
0.3
0
2
tiempo t
0.4
0.3
0.2
0.1
0
0
2
tiempo t
APROXIMADA Y EL DISENO
DE CONTROLADORES
72CHAPTER 4. LA LINEALIZACION
%%
%%
%%
%%
%%
%%
%%
libro:
Control de Sistemas No Lineales
Hebertt Sira-Ramirez
Control de un reactor de fision por linealizacion
aproximada
function xdot=ejemplo2(t,x)
%% parametros del sistema
E = 0.7 ; Ue = (1-E)/E;
%% parametros del controlador
lambda = 1 ;
%% Ley de control
u = Ue -(1/E)*(lambda-1/E)*(x(1)-E) ;
%% Ecuaciones de estado
xdot = [ x(2)-x(1)*u ; -x(2)+ (1-x(2))*u ];
%% Fin de ejemplo2.m
x3 = X3 (X) =
mgX
; u = U (X) = R
c
mgX
c
Utilizaremos esta parametrizacion pues, de esta manera, la ley de control lineal vendr
a directamente en terminos del error de la variable que se desea controlar y no en terminos de una variable
que esta indirectamente relacionada con ella.
Definimos, como siempre, las variables de estado incrementales utilizando los valores de equilibrio de los estados y los controles:
cU 2
; x2 = x2 ;
mgR2
= x3 X3 (X) ; u = u U (X)
x1 = x1 X =
x3
(4.34)
x
d 1
x2
dt
x3
g
=
X
0
r0
0 2
0
x1
cg
x2
mX x
R
3
u
+ 0
1
L
(4.35)
(4.36)
2
cg
0
0
L r mX
2
cg
2R
cg
2
C = [B : AB : A B] = 0
L mX
L mX
R
R2
1
L
L2
L3
det C =
4cg
L3 mX
6= 0
(4.37)
Examinemos brevemente la naturaleza del sistema en lazo abierto, es decir, sin control.
Los autovalores de la matriz A del sistema determinan la estabilidad del mismo alrededor del
origen (x = 0), cuando u = 0.
0
g
A=
X
0
0 2
0
r0
cg
mX
(4.38)
R
L
Tales autovalores se obtienen a partir de las raices del polinomio caracterstico de la matriz A,
el cual se calcula de la manera siguiente:
g
gR
R 2
s s
L
X XL
R
g
R
R
g
2
= s s+
s+
= s+
s2
L
X
L
L
X
pA (s) = det(sI A) = s3 +
(4.39)
R
; s2 =
L
g
X
(4.40)
El sistema cuenta, por tanto, con dos raices estables (ubicadas en el lado izquierdo del plano
complejo) y una raiz inestable (ubicada en el semiplano derecho del plano complejo), tal como se
muestra en la figura 4.9.
La respuesta en lazo abierto
del sistema
erminos exponenciales de la
p
p linealizado cuenta con t
forma exp(R/Lt), exp( g/Kt) y exp( g/Kt). Uno de estos terminos crece de manera indefinida dando lugar a inestabilidad.
Sin embargo, siendo el sistema controlable podemos, por tanto, garantizar la existencia de
una ley de realimentacion lineal que ubica los polos del sistema en lazo cerrado en puntos preseleccionados del plano complejo que hagan al sistema asint
oticamente estable.
Deseamos por ejemplo, que el sistema linealizado de tercer orden, en lazo cerrado tenga sus
polos ubicados en las raices del siguiente polinomio caracterstico deseado:
pd (s) = (s + )(s2 + 2n + n2 ) = s3 + (2n + )s2 + (n2 + 2n )s + n2
(4.41)
APROXIMADA Y EL DISENO
DE CONTROLADORES
74CHAPTER 4. LA LINEALIZACION
Im
plano s
-R/L -
Re
g
X
g
X
c
Im
plano s
Re
-c
x
d 1
x2 =
dt
x3
0
g
X
KL1
1
0
KL2
x1
cg
x2
mX
r0
R
L
K3
L
(4.42)
x3
y su polinomio caracterstico es :
pABK (s) = det(sI A)
r
R K3 2
K2
cg
g
= s3 +
+
s + 2
s
L
L
L mX
X
r
K1
g R K3
cg
+ 2
+
L mX
X L
L
(4.43)
Si igualamos este polinomio, termino a termino, con pd (s) obtenemos el siguiente sistema de
ecuaciones lineales para las ganancias de realimentaci
on K1 , K2 y K3 ,
R K3
+
L
L
= 2n +
x (X) = mgX/c
R
i
+
-
u (t)
u(t)
v(t)
x(t)
f
m
x (t)
mg
+
+
K1
x1 (t)
K2
x2 (t)
K3
x3 (t)
g
K2
cg
= n2 + 2n
2
L mX
X
r
K1
cg
g R K3
2
+
= n2
L mX
X L
L
(4.44)
de donde:
K1
K2
K3
L mX 2g n + g + n2 X
=
2 cgX
L mX g + n2 X + 2 n X
=
2 cgX
= R + 2 n L + L
(4.45)
El esquema de control esta representado entonces, al menos conceptualmente, por medio del
diagrama mostrado en la figura 4.11.
APROXIMADA Y EL DISENO
DE CONTROLADORES
76CHAPTER 4. LA LINEALIZACION
El controlador lineal queda dado por:
!
L mX 2g n + g + n2 X
u =
(x1 X)
2 cgX
!
L mX g + n2 X + 2 n X
x2
2 cgX
(R + 2 n L + L) x3
mgX
c
(4.46)
4.3
Ejercicios Propuestos
Table 4.1: Parametros usados en el sistema del pendulo invertido sobre una plataforma movil
Par
ametro
M
J
C
Valor
0.5 [kg]
0.006 [kg m2 ]
0.0
Par
ametro
m
L
F
Valor
0.2 [kg]
0.3 [m]
0.1 [N/m/seg]
c=1
m2 kg
; g = 9.8 [m/s2 ]; m = 0.1 [kg]
s2 Amp2
77
Lecturas Recomendadas
Sobre las consideraciones de dise
no de controladores lineales en el espacio de estado, consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Para una introduccion a metodos de dise
no en el espacio de estados mas avanzados, como
es el caso del regulador lineal cuadratico (dise
no LQR) refierase a:
Dorato, P., C. Abdallah, and V. Cerone. Linear-Quadratic Control: An introduction. Prentice Hall, Englewood Cliffs, New Jersey, 1995.
c para el caso de sistemas lineales (colocacion de
Una referencia sobre el uso de Matlab
polos, LQR, dise
no de compensadores PID, adelanto, adelanto-atraso, H , etc) es el libro:
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.
APROXIMADA Y EL DISENO
DE CONTROLADORES
78CHAPTER 4. LA LINEALIZACION
Chapter 5
Dise
no de Controladores mediante
Linealizaci
on Aproximada Utilizando
Observadores Din
amicos de Estado
En los desarrollos anteriores, hicimos la suposicion explcita de que todos y cada uno de los estados
del sistema no lineal estaban disponibles para su utilizacion en las leyes de control retroalimentadas, sintetizadas a partir de los errores de equilibrio de tales estados con respecto a sus valores
nominales constantes. Esta suposicion no siempre es valida, pues en una gran cantidad de casos practicos solo algunos (o algun) estados estan disponibles fisicamente para llevar a cabo
mediciones sobre ellos. En otros casos, solamente la variable de salida se encuentra a nuestra
disposicion y, por lo tanto, con todo lo que contamos es con una relacion entre el valor de la
salida y su dependencia con respecto a los estados. Esta situacion debe resolverse entonces,
tratando de inferir un valor estimado del vector de los estados a partir de nuestro conocimiento
del sistema, de nuestra disponibilidad de los valores de la salida y del conocimiento inequvoco de
los valores del control que estamos suministrando al sistema. Este proceso de inferencia recibe
el nombre de estimaci
on, o reconstrucci
on, del vector de estado.
Este captulo considera la construccion de un controlador sobre la base de diseno de un
observador o reconstructor del vector de estado, cuando solo se dispone del conocimiento de la
79
APRO
80CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
salida, de la entrada y de la estructura del sistema lineal. La seccion 5.3 se dedica al caso de
diseno de observadores de orden reducido.
5.1
Reconstrucci
on del Vector de Estado
El proceso de estimacion del vector de estado para un sistema no lineal ha sido investigado y
resuelto solo recientemente y sus desarrollos requieren de una base adecuada de la geometra
diferencial. A
un cuando abordaremos el topico en toda su generalidad mas adelante, por
ahora restringiremos nuestra atencion al problema de reconstruir el vector de estado con el
objeto de utilizarlo en una ley de realimentacion lineal basada en la linealizacion aproximada
del sistema no lineal. Desde este punto de vista el problema es mucho mas sencillo pues se
reduce a reconstruir u observar el vector de estados incrementales, o perturbados, que se
suceden alrededor de los valores nominales de operacion del sistema no lineal. Como el
modelo que hemos dado en aceptar como valido para tales valores incrementales del estado
es un modelo dinamico lineal, que ademas resulto ser invariante en el tiempo, entonces
solamente precisaremos utilizar la solucion del problema de estimacion de sistemas dinamicos
lineales.
El problema de reconstruccion del vector de estado, o, equivalentemente, de construccion
(dise
no) de un observador para un sistema lineal fue resuelto a principios de los a
nos 60 por un
profesor americano de nombre David Luenberger. En su honor, el observador determinstico
de estado recibe en la literatura el nombre de Observador de Luenberger.
Considerese el sistema lineal, que suponemos aproxima dentro de un primer orden los
valores de las perturbaciones del vector de estado de un sistema no lineal.
x = A x + B u
y = C x
(5.1)
u (t)
81
u(t)
.
x=f(x,u)
x(t)
x (t)
u (t)=-Kx (t)
Figure 5.1: Esquema de realimentacion lineal con medicion total de las componentes del vector
de estado
u (t)
.
x (t)=Ax (t)+bu (t)
x (t)
u (t)=-Kx (t)
Figure 5.2: Esquema de realimentacion lineal del sistema aproximado con medicion total de las
componentes del vector de estado
APRO
82CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA
u (t)
u(t)
.
x=f(x,u)
y(t)
y (t)
y=h(x)
Figure 5.3: Esquema de aproximacion del comportamiento entrada-salida del sistema no lineal
x (t)
u (t)
OBSERVADOR DE
LUENBERGER
y (t)
u (t)
83
u(t)
.
x=f(x,u)
y(t)
y (t)
y=h(x)
x (t)
-K
u (t)
OBSERVADOR DE
LUENBERGER
y (t)
Figure 5.5: Esquema de control realimentado lineal utilizando un observador dinamico de estado
sistema incremental as erroneamente controlado (aun cuando de manera temporal) siga
siendo asintoticamente estable a cero. La primera preocupacion resulta facil de contestar,
mientras que la segunda requerira un poco mas de analisis. Estudiaremos primeramente el
problema de la convergencia del error de estimacion a cero.
5.2
El Observador de Luenberger
En virtud de que tratamos de estimar el estado de un sistema lineal, no resulta del todo
ilogico proponer un reconstructor dinamico que tambien sea lineal. Caracterizaremos este
reconstructor, evidentemente, utilizando la representacion de sistemas dinamicos mediante
el vector de estado. As pues tomaremos por nuestro observador de estados, o reconstructor,
al sistema dinamico lineal dado por:
x =
x + u + Ly ;
x (t0 ) = x0
(5.2)
donde la matriz y los vectores y L seran determinados en lo sucesivo, de tal manera que
sea posible obtener un estimador asintotico de los estados del sistema lineal.
Definimos el error de observacion como la diferencia entre el valor real del vector de
estado del sistema linealizado y el valor estimado de tal vector de estado. Esta definicion,
por supuesto, se extiende a los valores iniciales de tales estados. En resumen, se define:
e = x x ; e (t0 ) = x (t0 ) x (t0 ) = x0 x0
(5.3)
Puesto que el valor inicial del estado verdadero es desconocido, no podemos hacer suposicion alguna acerca del valor inicial del error de estimacion. En general tendremos que
suponer que tal error inicial es diferente de cero pero no podremos dar calificaciones adicionales a esta cantidad vectorial.
APRO
84CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Es facil establecer una ecuacion diferencial que describa el comportamiento del vector
de error de estimacion en terminos de las matrices y vectores que definen tanto al sistema
original linealizado como al observador propuesto. En efecto:
e = x x = Ax + Bu (
x u Ly )
= Ax
x + e + (B )u LCx
= (A LC)x + (B )u + e
(5.4)
La dinamica del error de observacion no debe depender ni de los valores de las acciones
de control ni de los valores correspondientes que estas producen en los estados del sistema.
Si hemos de manipular u para lograr, digamos, la estabilizacion del sistema linealizado
hacia el origen de coordenadas, no parece logico que el error de observacion dependiera de
cuan grandes o peque
nas deban ser tales acciones de control. El mismo razonamiento nos
conduce a concluir que es igualmente inconveniente que el error de estimacion dependa de
los valores que va tomando el vector de estado en su camino hacia la estabilizacion, pues la
existencia de sus transientes alejara, a
un mas, el valor del estado estimado del real, actuando
como perturbaciones en la dinamica del error. En consecuencia, debemos anular, con una
escogencia apropiada de las matrices y vectores , y L, la influencia de los estados y
controles del sistema original linealizado. Esto requiere que:
=B ;
= A LC
(5.5)
lo cual hace que el error de observacion evolucione de acuerdo con la dinamica lineal y
autonoma dada por:
e = (A LC)e ;
e (t0 ) = e0
(5.6)
(5.7)
u (t)
85
x (t)
y (t)
C
+
+
x (t)
L
y (t)
OBSERVADOR DE LUENBERGER
(5.8)
si hacemos :
y = C x
(5.9)
es decir, si damos el nombre de salida estimada al valor que produce el estado estimado
cuando es afectado por el mapa de salida C, entonces reescribimos las ecuaciones del observador como:
x = A
x + Bu + L(y y )
y = C x
(5.10)
El observador dinamico del vector de estado puede representarse entonces como se ilustra
en la figura 5.6.
La interpretacion que podemos hacer de la estructura del observador es directa: el observador de estado no es mas que una emulacion, con capacidad auto-correctora, de la dinamica
del sistema cuyo estado se desea reconstruir. El vector de parametros L juega un papel de
realimentador del error de estimacion en cuanto a su reflejo en los valores de la salida. Precisamente, esta realimentacion del error de salida (mas propiamente llamada inyecci
on de la
salida) es la que trata de corregir cualquier discrepancia que exista entre el valor verdadero
del vector de estado y su valor estimado.
Notese que esta entrada adicional inyectada al modelo emulador del sistema solo puede
tomar valores diferentes a cero cuando la salida del sistema no coincide con el valor de la
APRO
86CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
salida estimada y, de hecho, tal error se anula por completo cuando estos valores coinciden.
Esto es un indicativo de que el proceso de estimacion se esta llevando a cabo en forma
correcta, al menos en principio. Sin embargo, debe quedar suficientemente claro que si
la salida estimada coincide con la salida del sistema esto no implica, necesariamente, que
el estado estimado este coincidiendo con el estado verdadero. Es enteramente posible que
ambos estados (estimado y verdadero) se encuentren temporalmente ocultos por el mapa de
salida representado por el vector fila C, es decir, en un subespacio de su subespacio nulo. La
condicion que nos permitira asegurar que no existe un subespacio, diferente de cero, donde
ambos vectores de estado puedan ocultarse por coincidencia de los valores que arrojan a
la salida es, evidentemente, una condici
on de observabilidad. Veamos este hecho en detalle
en los siguientes parrafos.
El problema de estabilizar asintoticamente el error de estimacion a cero puede verse como
un problema de control sobre un sistema al cual daremos el nombre de dual del original (5.1).
En efecto consideremos el sistema realimentado siguiente:
z = AT z + C T v
v = LT z
(5.11)
y hagamonos la siguiente pregunta: Bajo que condiciones puede estabilizarse a cero el sistema (5.11) por realimentacion lineal del vector de estado z ? La respuesta es, evidentemente,
que el par (AT , C T ) debe ser un par controlable.
Notese que el sistema en lazo cerrado se describe mediante:
z = (AT C T LT )z
(5.12)
Los autovalores que gobiernan la respuesta del sistema (5.12) son los de la matriz del
sistema en lazo cerrado, la cual puede reescribirse como :
(AT C T LT ) = (A LC)T
(5.13)
En otras palabras, como los autovalores de cualquier matriz cuadrada coinciden con los
autovalores de su traspuesta, el vector L debera tener la posibilidad de asignarle los polos
a la matriz (AT C T LT ), en lugares prefijados del semiplano izquierdo del plano complejo.
Esto es posible siempre y cuando el par (AT , C T ) sea un par controlable.
La relacion con nuestro problema de estimacion es inmediata pues el error de estimacion
se encuentra gobernado por la dinamica autonoma:
e = (A LC)e
(5.14)
Concluimos, por tanto, que el problema de estabilizar a cero el error de estimacion del
vector de estado, mediante inyeccion de la salida es factible en tanto que el par de matrices
(AT , C T ) sea un par controlable.
Si escribimos la matriz y la condicion de controlabilidad del par (AT , C T ) obtenemos:
h
rk C = rk C T : AT C T : . . . : (AT )n1 C T = n
(5.15)
87
(5.16)
entonces, es facil ver que la condicion de controlabilidad del sistema dual (5.11) se traduce
en la siguiente condicion:
C
CA
..
.
rk O = rk C = rk
CAn2
CAn1
(5.17)
(5.18)
1E
Eu
E
1
x2 + (1 x2 )u
E
y = x2
(5.19)
APRO
88CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA
u (t)
.
x=f(x,u)
u(t)
y(t)
y (t)
y=h(x)
u (t)
x (t)
OBSERVADOR DE
-K
LUENBERGER
y (t)
O=
0
0
1
1
E
; rk O = 1 6= 2
(5.20)
En equilibrio, el estado x2 tiende a cero, ya que u tambien se supone cero en esta condicion.
El estado x1 no puede reconstruirse a partir del conocimiento de x2 y u ya que x1 no influencia
para nada a x2 , como es facil ver de la estructura de las ecuaciones del sistema. En condiciones
de equilibrio para x2 y u es facil ver que x1 es tambien asint
oticamente estable a cero, en la
medida en que la cantidad (1 E)/E sea positiva, tal y como, efectivamente, hemos supuesto. El
sistema estudiado es, por lo tanto, inobservable pero reconstruible. En el momento de dise
nar un
observador a este sistema, no tendramos necesidad de reconstruir x1 . Ademas, en este caso, el
observador para x2 es trivial.
Tal como nos lo propusimos al inicio del estudio del problema de control sin disponibilidad
del vector de estado, hemos estudiado hasta aqu el problema de la convergencia del error de
estimacion a cero y hemos logrado contestar bajo que condiciones podemos garantizar que
tal error de reconstruccion sea asintoticamente estable a cero.
Debemos atender ahora la inquietud de como garantizar que, durante aquel lapso de
tiempo en el cual el valor del estado estimado no coincide exactamente con el valor del estado
incremental verdadero, el sistema incremental erroneamente controlado sea asintoticamente
estable a cero.
La pregunta fundamental se refiere a si el esquema de la figura 5.7 es valido para la
estabilizacion del sistema alrededor de un punto de operacion.
La pregunta la contestaremos estudiando la validez del esquema de control realimentado
presentado en la figura 5.8, pero utilizando ahora el modelo linealizado en reemplazo de la
parte incremental del modelo no lineal en la figura anterior.
89
SISTEMA LINEALIZADO
u (t)
B
x (t)
y (t)
C
A
x (t)
x (t)
-K
u (t)
+
+
LEY DE CONTROL
LINEAL
y (t)
y (t)
OBSERVADOR DE ESTADO
Figure 5.8: Esquema de control realimentado de salida del sistema lineal que aproxima al sistema
no lineal
Las ecuaciones del sistema en lazo cerrado son:
x
y
u
x
y
=
=
=
=
=
Ax + Bu
Cx
K x
A
x + Bu + L (y y ) = (A LC)
x + Bu + LC x
C x
(5.21)
x
x
"
A
BK
LC A LC BK
#"
x
x
(5.22)
x
e
"
I 0
I I
#"
x
x
"
=P
x
x
(5.23)
donde P es, evidentemente, una matriz invertible la cual permite representar el nuevo vector
de estado por medio del estado de la planta y del error de observacion y no por medio de los
APRO
90CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
estados de la planta y del observador. Esta transformacion similar asegura que el sistema
transformado presenta los mismos autovalores que el sistema original.
El sistema transformado resulta entonces:
"
x
e
"
A BK
BK
0
A LC
#"
x
e
(5.24)
Los autovalores del sistema (5.24) son sencillamente la union de los autovalores de las
matriz ABK y de la matriz ALC, es decir, los autovalores del sistema controlado son los
mismos a los obtenidos si el estado estuviese disponible mas los autovalores que gobiernan
la dinamica del error de observacion. Este resultado, el cual en su sentido mas general es
llamado principio de separaci
on, nos indica que el esquema de control presentado en la figura
5.5 es valido, sobre la base del proceso de reconstruccion del vector de estado, en el sentido de
que las variables de estado incrementales x convergen asintoticamente a cero si y solamente
si tanto los autovalores de la matriz A BK como los de la matriz A LC se encuentran
ubicados, gracias a la escogencia apropiada de los vectores K y L, en el semiplano izquierdo
del plano complejo.
El esquema presentado, el cual involucra la ley de control u basada en el observador dinamico de estados, siempre sera factible si los pares (A, B) y (C, A)
son respectivamente controlables y observables. De otro modo, debe cumplirse al
menos que el par (A, B) sea estabilizable y el par (C, A) sea detectable.
Afortunadamente, casi todos los sistemas son controlables y observables. Esto valida
totalmente el esquema propuesto para controlar un sistema mediante realimentacion de la
salida utilizando un reconstructor, u observador, del vector de estado.
0 1
x 1
x 2 = 0 0
x 3
0 0
0
x1
FL
J x2 + 0 u
R
x3
0
x1
= [1 0 0] x2
x3
(5.25)
91
1 0
O= 0 1
0 0
0
FL
0 ; det O =
6= 0
J
FL
(5.26)
Esto significa que podemos construir un observador para el sistema linealizado cuyo error de reconstruccion es asintoticamente estable a cero.
Proponemos entonces el observador siguiente:
x
1
0 1
2 = 0 0
x
0 0
x
3
x
1
0
L1
FL
x
0
L2 (y y )
+
u
+
J
x
3
L3
R
0
x
1
2
= [1 0 0] x
x
3
(5.27)
L1 1
e 1
e 2 = L2 0
e 3
L3 0
e1
FL
J e2
e3
0
(5.28)
FL
L3
J
(5.29)
El valor de las componentes del vector L, el cual garantiza un observador cuyo error de reconstruccion es asintoticamente estable, se obtiene a partir de una igualacion del polinomio caracterstico anterior con un polinomio cuyas races sabemos estan ubicadas en el semiplano izquierdo.
Podemos escoger tales races como las del polinomio siguiente:
pd = (s + 1 )(s + 3 )(s + 3 )
= s3 + (1 + 2 + 3 )s2 + (1 2 + 1 3 + 2 3 )s + 1 2 3
(5.30)
Es decir:
L1 = 1 + 2 + 3
L2 = 1 2 + 1 3 + 2 3
J
L3 =
1 2 3
FL
(5.31)
APRO
92CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
omega omega_estim
theta theta_estim
2
2
1
0
-1
-2
-3
-1
0
0.5
1
tiempo t
1.5
-4
0
0.5
1.5
1.5
Variable de control
2
1
u
beta beta_estim
1
tiempo t
0
0
-1
-1
-2
0
0.5
1
tiempo t
1.5
-2
0
0.5
1
tiempo t
Figure 5.9: Respuesta del sistema de orientacion de un artefacto espacial mediante realimentacion
lineal de la salida utilizando un observador dinamico
93
ejemplo3.m
Tercer ejemplo con simulaciones numericas del
libro:
Control de Sistemas No Lineales
Hebertt Sira-Ramirez
Control de orientacion de un artefacto espacial por medio
de linealizacion aproximada y uso de un observador dinamico
function xdot=ejemplo3(t,x)
%% parametros del sistema
F = 200; L=3; R=20; J =50;
%% parametros del controlador
a =2.0; b=3.5; c = 12.75; Theta = 2.5;
%% parametros del observador (los tres polos de la dinamica
%% del error se ubican en -5:
lambda1 = 5;
lambda2 = 5;
lambda3 = 5;
Ll = lambda1+lambda2+lambda3;
L2 = lambda1*lambda2+lambda1*lambda3+lambda2*lambda3 ;
L3 = lambda1*lambda2*lambda3*J/(F*L);
%% Ley de control
u = -J*a*(b^2+c^2)/(F*L*R)*x(4)-J*(b^2+c^2+2*a*b)/F/L/R*x(5)-...
(2*b+a)/R*x(6);
%% Ecuaciones de estado
xdot= [ x(2) ;
F*L/J*sin(x(3)) ;
R*u ;
x(5)+Ll*(x(1)-Theta-x(4)) ;
F*L/J*x(6)+L2*(x(1)-Theta-x(4)) ;
R*u + L3*(x(1)-Theta-x(4))] ;
%% Fin de ejemplo3.m
APRO
94CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Utilizaremos el punto de equilibrio parametrizado en terminos del valor de equilibrio de la
variable x1e = X:
x1 (X) = X; x2 (X) = 0; u = U =
g
a cos X
(5.32)
x 2
g
1
=
sen X tan X x1 + sen (2X) u
a
2
(5.33)
C=
0
1
2 sen (2X)
1
2
sen (2X)
0
1
det C = sen 2 2X
4
de donde se deduce que el sistema se torna incontrolable en los puntos X = 0, /2, 3/2, . . ..
Bajo la suposicion de que el estado incremental se encuentra disponible para ser usado en una
poltica de realimentacion para estabilizar el sistema linealizado, se propone la ley de control por
realimentacion del vector de estado:
u = K1 x1 K2 x2
(5.34)
x 2
1
1
g
sen X tan X K1 sen (2X) x1 K2 sen 2X x2
=
a
2
2
(5.35)
(5.36)
n2
g
a
tan X sen X
;
sen 2X
K2 =
4n
sen 2X
(5.37)
Por lo tanto, el control lineal que habra de regular al sistema no lineal original esta dado por:
u=
2 g tan X sen X
g
4n
2 n a
(x1 X)
x2
a cos X
sen 2X
sen 2X
(5.38)
95
La escogencia de n y se hacen, por ejemplo, sobre la base de fijar el tiempo de subida del
sistema tr (en ingles, rise time), el cual viene dado por:
tr =
0.8 + 2.5
n
(5.39)
Tpicamente se escoge a como 0.707, con el objeto de lograr una respuesta suficientemente
amortiguada, lo cual significa que, por ejemplo, para un tiempo de ascenso de 0.2 segundos (esto
es, del 10% al 90% del valor final de equilibrio en 0.2 seg.) debemos tomar a n aproximadamente
como 12.83 rad/s.
c simula el comportamiento del sistema no lineal
El siguiente programa, realizado en MatLab ,
controlado mediante la ley realimentada basada en linealizacion aproximada (5.32)(5.38). Los
datos fsicos y valores de equilibrio que utilizamos para la simulaci
on son:
a = 0.20 [m]; g = 9.8 [
rad2
];
(X)
=
X
=
]
[rad];
u(X)
=
69.296465
[
s2
4
s2
(5.40)
%% ejemplo4.m
%%
%% Sistemas No Lineales
%% Hebertt Sira-Ramirez
%%
%% Sistema Controlado por linealizacion aproximada para
%% regular la posicion de un anillo que desliza sobre
%% un aro que gira alrededor
%% de su eje vertical. El cuadrado de su velocidad angular
%% sirve de se~nal de control al sistema.
%%
function xdot=ejemplo4(t,x)
%% parametros del sistema
a = 0.2; g = 9.8;
%% parametros del controlador
X1e = 0.7854; Ue = g/(a*cos(X1e));
wn = 12.83; xi = 0.707;
K1 = 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
K2 = 4*xi*wn/sin(2*X1e);
%% Ley de control
u = -K1*(x(1)-X1e)-K2*x(2)+Ue;
%% Ecuaciones de estado
xdot = [x(2) ;
-g/a*sin(x(1))+u*sin(x(1))*cos(x(1))];
%% Fin de ejemplo4.m
La figura 5.10 muestra las simulaciones correspondientes al comportamiento del sistema (5.32)
en lazo cerrado. El programa que genera estas graficas es el siguiente:
% sejem4.m
% Programa de generacion de los graficos del ejemplo4.m
% tiempo de simulacion
ti = 0;
tf = 1;
APRO
96CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
theta [rad]
0.8
0.6
0.4
0.2
0
1
0
0.5
tiempo t
-1
0
0.5
tiempo t
omega
15
10
5
0
0.5
tiempo t
Figure 5.10: Respuesta del sistema aroanillo controlado mediante realimentacion completa del
vector de estado
97
%% condiciones iniciales:
x0 = [0.2 0];
%% simulacion
[t,x] = ode23(ejemplo4,ti,tf,x0);
%% Angulo theta (x(1))
subplot(2,2,1), plot(t,x(:,1))
title(Posicin angular del anillo sobre el aro)
xlabel(tiempo t)
ylabel(theta [rad])
%% Velocidad angular (x(2))
subplot(2,2,2), plot(t,x(:,2))
title(Velocidad angular del anillo)
xlabel(tiempo t)
ylabel([rad/s])
%% Variable de control (u)
%% parametros del sistema
a = 0.2; g = 9.8;
%% parametros del controlador
X1e = 0.7854; Ue = g/(a*cos(X1e));
wn = 12.83; xi = 0.707;
K1 = 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
K2 = 4*xi*wn/sin(2*X1e);
%% Ley de control
u = -K1*(x(:,1)-X1e)-K2*x(:,2)+Ue;
w = sqrt(u);
subplot(2,2,3), plot(t,w)
title(Velocidad angular del aro)
xlabel(tiempo t)
ylabel(omega)
% fin de sejem4.m
x 2 =
g
1
sen X tan X x1 + sen (2X)u
a
2
y = x1
(5.41)
g
1
x
2 =
sen X tan X x
1 + sen (2X)u + L2 (y y )
a
2
y = x
1
(5.42)
APRO
98CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
La ley de control para el sistema (5.32), basada en tal estimador del vector de estado, esta dada
por:
u = K1 x1 K2 x2 + U
(5.43)
g
e 2 =
sen X tan X + L2 e1
a
(5.44)
Con el objeto de escoger apropiadamente las ganancias del observador L1 y L2 que garanticen
un comportamiento asintoticamente estable a cero para el error de estimacion e, obtenemos el
polinomio caracterstico del sistema anterior:
p(s) = s2 + L1 s + L2 +
g
tan X sen X
a
(5.45)
e igualamos los coeficientes de este polinomio a los de un polinomio caracterstico deseado pd (s),
dado por:
2
pd (s) = s2 + 21 n1 s + n1
(5.46)
donde 1 y n1 son n
umeros reales tales que el polinomio caracterstico deseado tiene sus races en
el semiplano izquierdo. Las ganancias buscadas resultan
L1 = 21 n1 ;
2 g
L2 = n1
tan X sen X
a
(5.47)
ejemplo5.m
Sistemas No Lineales
Hebertt Sira-Ramirez
Sistema Controlado por linealizacion aproximada para
regular la posicion de un anillo que desliza sobre
un aro que gira alrededor
de su eje vertical. El cuadrado de su velocidad angular
sirve de se~nal de control al sistema.
La ley de control esta basada en la reconstruccion
del vector de estado mediante un observador de Luenberger
function xdot=ejemplo5(t,x)
theta_inc [rad]
theta [rad]
0.8
0.6
0.4
0.2
0
99
0.5
tiempo t
0
-0.2
-0.4
-0.6
0
[rad/s]
-2
0
omega
0.5
tiempo t
10
0.5
tiempo t
0
0
0.5
tiempo t
Figure 5.11: Respuestas del sistema aroanillo controlado por realimentacion lineal de la salida
utilizando un observador dinamico de estado
APRO
100CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
siguiente prograna genera las graficas presentadas.
% sejem5.m
% Programa de generacion de los graficos del ejemplo5.m
% tiempo de simulacion
ti = 0;
tf = 1;
%% condiciones iniciales:
%%x0 = [0.2 0.0 0.2 0.0];
x0 = [0.2 0.0 0.0 -1.0];
%% simulacion
[t,x] = ode23(ejemplo5,ti,tf,x0);
%% Angulo theta (x(1))
subplot(2,2,1), plot(t,x(:,1))
title(Posicin angular del anillo)
xlabel(tiempo t)
ylabel(theta [rad])
%% punto de equilibrio
X1e = 0.7854;
%% Angulo theta (x(1))
subplot(2,2,2), plot(t,x(:,1)-X1e,t,x(:,3),-.)
title(Posicin incremental del anillo (real y estimada -.))
xlabel(tiempo t)
ylabel(theta_inc [rad])
%% Velocidad angular (x(2))
subplot(2,2,3), plot(t,x(:,2),t,x(:,4),-.)
title(Velocidad angular del anillo (real y estimada -.))
xlabel(tiempo t)
ylabel([rad/s])
%% Variable de control (u)
%% parametros del sistema
a = 0.2; g = 9.8;
%%
Ue
wn
K1
K2
%% Ley de control
u = -K1*(x(:,3))-K2*x(:,4)+Ue;
w = sqrt(u);
subplot(2,2,4), plot(t,w)
title(Velocidad angular del aro)
xlabel(tiempo t)
ylabel(omega)
% fin de sejem5.m
5.3
Realimentaci
on Lineal de Salida Mediante Observadores de Orden Reducido
Es facil darse cuenta que en los observadores que hemos construido en la seccion anterior
existe una redundancia implcita sobre la cual no hemos llamado la atencion. En efecto,
en algunos de los ejemplos que hemos presentado hemos procedido a construir observadores
dinamicos de estado que reconstruyen absolutamente todas y cada una de las variables
de estado del sistema. Sin embargo, la variable de salida, en algunas oportunidades, esta
representada por una variable de estado. Si ese estado es perfectamente conocido, en virtud
de las mediciones que de el tenemos en la forma de una salida, pudieramos entonces utiilizarlo
directamente en la elaboracion de la ley de control lineal. Evidentemente, la situacion puede
ser cierta no solo para una de las variables de estado sino para varias de ellas. Es decir, un
n
umero de salidas bien pudiera estar representada por un conjunto de variables de estado.
La pregunta logica es: por que debemos esforzamos en reconstruir o estimar variables de
estado que ya conocemos en forma precisa debido a que son salidas del sistema?. En otras
palabras, el esfuerzo de reconstruir variables de estado debe estar vinculado solamente a
aquellas variables que no conocemos, evitando reconstruir las que ya conocemos.
Recordemos que los observadores de estado representan una cierta emulacion, con facultades de autocorreccion, del sistema dinamico que ellos observan. En virtud de esto, un
observador tiene, en principio, la misma dimension que la planta del sistema. Si algunas
variables de estado ya son conocidas y no hace falta reconstruirlas con error, podemos entonces pensar que es factible obtener una economa en el orden del sistema que necesitamos
utilizar como observador de la planta. En efecto, si solo un n
umero inferior de estados debe
ser reconstruido, el observador debera tener dimension igual al n
umero de variables que deseamos reconstruir. Estas consideraciones nos conducen a la idea de proponer observadores
de orden reducido para aquellos sistemas donde ya poseemos conocimiento de una, o algunas,
de las variables de estado.
Introduciremos, mediante un ejemplo, la posibilidad de reconstruir solo un n
umero inferior de las variables de estado mediante un observador de orden reducido.
x 1 = x2
1 u x1
1/2
x 2 = x1
y = x2
1/2
x2
(5.48)
donde x1 y x2 son, respectivamente, las alturas del lquido en cada uno de los tanques, medidas
desde el borde inferior del tanque correspondiente. La variable de control esta constituida por
APRO
102CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
u=U
x1
x2
(5.49)
x1 (X) = X; x2 (X) = X; u = X
Linealizamos el sistema alrededor de este punto de equilibrio para obtener:
1
x 1 = X 5/2 x1 + X 2 u
2
1 1/2
1
x 2 =
X
x1 X 1/2 x2
2
2
y = x2
(5.50)
Este sistema es controlable en tanto que la altura deseada X se mantenga en un valor finito,
0 < X < , lo cual es posible fisicamente.
Usando los metodos explicados anteriormente, dise
namos un controlador por realimentaci
on
del vector de estado incremental. La ley de control incremental estara dada, en caso de conocer
perfectamente ambos estados incrementales, por:
u = K1 x1 K2 x2
(5.51)
x 1
x 2
"
21 X 5/2 K1 X 2 K2 X 2
1 1/2
12 X 1/2
2X
#"
x1
x2
(5.52)
donde las ganancias K1 y K2 se obtienen de igualar el polinomio caracterstico plc (s) del sistema
en lazo cerrado y un polinomio caracterstico deseado pd (s).
"
s + 21 X 5/2 + K1 X 2
K2 X 2
1 1/2
s + 12 X 1/2
2X
1 1/2 1 5/2
1
1
X
+ X
+ K1 X 2 s + (K1 + K2 )X 5/2 + X 3
2
2
2
4
2
2
pd (s) = s + 2n s + n
= s2 +
(5.53)
1
1
1
u = 2n X X 3/2 X 1/2 x1 n2 X 5/2 2n X 2 + x3/2 x2
2
2
2
2
(5.54)
Esta ley de control es utilizada para controlar el sistema si se conocen en forma exacta ambas
variables de estado. Debido a que esto no es as, es necesario utilizar variables estimadas del estado
incremental, de la siguiente manera:
1
1
1
1 n2 X 5/2 2n X 2 + x3/2 x
2
u = 2n X X 3/2 X 1/2 x
2
2
2
2
(5.55)
Por cuanto la variable incremental y = x2 es medible, no hace falta reconstruir sus valores y
la ley de control sera la siguiente:
1
1
1
1 n2 X 5/2 2n X 2 + x3/2 y
u = 2n X 2 X 3/2 X 1/2 x
2
2
2
(5.56)
(5.57)
Esta ecuacion, evidentemente, guarda alguna informacion sobre x1 puesto que al ser conocida
en forma exacta x2 podemos suponer como conocida tambien su derivada temporal. De esta
ecuacion, obtenemos el siguiente valor para x1 :
x1 = 2X 1/2 x 2 + x2
(5.58)
Haciendo caso omiso, por los momentos, de la necesidad de tener que tomar derivadas temporales x 2 de la altura incremental, podemos considerar la expresion en el miembro derecho de esta
u
ltima ecuacion como una medicion o salida auxiliar. Llamaremos tal salida z .
Consideremos la primera ecuacion diferencial del sistema linealizado en conjuncion con la salida
auxiliar que mide, de forma un poco incomoda, el valor de x1 :
1
x 1 = X 5/2 x1 + X 2 u
2
z = x1 = 2X 1/2 x 2 + x2
(5.59)
APRO
104CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
En virtud de que disponemos, al menos conceptualmente, de la medicion z pudieramos
aprovechar el conocimiento de la ecuacion diferencial de x1 con el fin de implementar un proceso
de estimacion para x1 basado en estos dos datos. Un estimador dinamico del estado incremental
estara dado por:
1
x
1 = X 5/2 x1 + X 2 u + L1 (z z )
2
z = 2X 1/2 x 2 + x2
z = x
1
(5.60)
e 1
(5.61)
1 5/2
=
X
x1 + L1 e1
2
(5.62)
No existe, entonces, problema alguno en proponer un valor de la ganancia L1 de tal forma que
el error de estimacion sea asintoticamente estable a cero. De hecho, cualquier valor positivo L1 > 0
de tal ganancia lo lograra. Sin embargo, este estimador a
un requiere del calculo de la derivada
temporal de la altura incremental en el segundo tanque. Con el objeto de evitar tal proceso de
derivacion, definamos la siguiente variable auxiliar:
= x
1 2L1 X 1/2 x2
(5.63)
De esta forma, podemos obtener una ecuacion diferencial para esta nueva variable usando la
ecuacion del estimador. En efecto vemos que esa ecuacion es equivalente a la siguiente:
i
d h
x
1 2L1 X 1/2 x2
dt
h
i
1
1 2L1 X 1/2 x2 L1 X 2 x2 X 2 u
= X 5/2 x
2
+ L1 (x2 [
x1 2L1 X 1/2 x2 ]) 2L21 X 1/2 x2
x
1 2L1 X 1/2 x 2 =
(5.64)
(5.66)
x 2 (X)=Y(X)=X
U
+ +
y=x 2
x1
y =x 2
K2 K1
x2
-2
-2
-5/2
2 1/2
=- (1/2X +L1) +X u +(L1-2 L1 X - L1 X )y
u
x2
2L1X 1/2
Figure 5.13: Esquema de control realimentado lineal de la salida para un sistema de tanques
mediante el uso de un observador de orden reducido
5.3.1
x =
x1
x2
IRn1 +n2
(5.67)
Notese que no hay perdida alguna de generalidad en suponer que las variables de estado
directamente medibles ocupan las primeras n1 posiciones en el vector de estado. Si este no
fuera el caso, mediante un reordenamiento de las variables de estado podemos hacer que
estas primeras componentes sean precisamente las variables de estado medibles. De acuerdo
con estas dimensiones tenemos:
x1 IRn1 ; x2 IRn2 ; x IRn
(5.68)
x 1
x 2
"
A11 A12
A21 A22
#"
x1
x2
"
B1
B2
(5.69)
APRO
106CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
donde A11 IRn1 n1 , A12 IRn1 n2 , A21 IRn2 n1 , A22 IRn2 n2 , B1 IRn1 , B2 IRn2 . La
ecuacion vectorial de salida representada por el subvector de estados conocidos:
y = x1
(5.70)
(5.71)
Puesto que y y u son conocidas, es concebible que tambien podamos conocer como
se
nal del tiempo al vector n1 -dimensional dado por la segunda ecuaon anterior. Designemos
a este vector como y2 :
y2 = A12 x2 = y A11 y B1 u
(5.72)
(5.73)
(5.74)
es para = 0.
Prueba: Supongamos, por un momento, que el sistema lineal dado es inobservable. Entonces, existe una transformacion del vector de estado z que exhibe tal inobservabilidad. Tal
transformacion lleva al sistema a su forma canonica inobservable de Kalman:
z1 = A11 z1
z2 = A21 z1 + A22 z2
"
#
z1
w = z1 = [I 0]
z2
(5.75)
exp
A11 0
A21 A22
# !
"
t =
exp A11 t
0
?
exp(A22 t)
(5.76)
entonces es claro que existen vectores distintos de cero que hacen cero el siguiente producto:
"
[I 0]
exp A11 t
0
?
exp A22 t
#"
1
2
"
= [exp(A11 t) 0]
1
2
= exp(A11 t)1
(5.77)
0
2
(5.78)
x 1
x 2
"
A11 A12
A21 A22
#"
x1
x2
y = x1
(5.79)
(5.80)
(5.81)
(5.82)
(5.83)
APRO
108CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
L2
y (t)
( A22 - L 2 A12 )
u (t)
+A - L 2 A
21
11
z2
+ +
x (t)
A22 - L 2 A12
B2 - L 2 B1
(5.84)
d
(
x2 L2 y ) = (A22 L2 A12 )(
x2 L2 y ) + (A22 L2 A12 )L2 y
dt
+(A21 L2 A11 )y (B2 L2 B1 )u
(5.85)
es decir:
Si hacemos:
z2 = x2 L2 y
(5.86)
u (t)
.
x=f(x,u)
u(t)
y(t)
y =x 1
y=h(x)
x2
OBSERVADOR
DINAMICO DE
ORDEN REDUCIDO
LEY DE
x1
x1
CONTROL
Figure 5.15: Estructura de control por realimentacion lineal de la salida, a base de un observador
dinmico de orden reducido
0 1
x 1
x 2 = 0 0
x 3
0 0
0
x1
FL
J x2 + 0 u
x3
R
0
y = x1
(5.88)
Deseamos utilizar la posicion angular incremental x1 , para emplearla directamente en el controlador por realimentacion de estado (es decir, usaremos esta variable sin estimarla). Sobre la base
del conocimiento de esta variable incremental y de la entrada u , deseamos estimar o reconstruir
los valores de x2 y x3 con un observador de orden reducido.
Las ecuaciones particionadas son:
"
x 1 = x2
x 2
x 3
"
0
0
FL
J
#"
x2
x3
"
0
R
y = x1
(5.89)
0
0
"
; A22 =
0
0
FL
j
"
; b1 = 0; b2 =
0
R
(5.90)
APRO
110CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Consideremos, entonces, el problema de estimar los estados x2 y x3 a partir de:
"
x 2
x 3
"
FL
J
0
0
#"
x2
x3
"
0
R
y = x1
(5.91)
"
[1 0],
0
0
#!
FL
J
(5.92)
es observable.
Usando el procedimiento explicado anteriormente, reescribimos las ecuaciones del observador
reducido de la manera siguiente:
"
x
2
x
3
"
=
"
0
0
FL
J
0
0
FL
J
#"
#"
x
2
x
3
x
2
x
3
#
x
2 L21 x 1
x
3 L22 x 1
"
+
#
"
"
0
R
0
R
"
u +
#
"
#"
(x 1 y2 )
#
L21
L22
u +
FL
J
L21
L22
L21
L22
x
2
x
3
"
x 1 +
"
0
R
L21 0
L22 0
#"
x
2
x
3
(5.93)
(5.94)
Hagamos ahora:
z21 = x
2 L21 x1 = x
2 L21 y
z22 = x
3 L22 x1 = x
3 L22 y
(5.95)
z21
z22
"
L21
L22
FL
J
#"
z21
z22
"
0
R
"
u +
L21
L22
FL
J
#"
L21
L22
(5.96)
(5.97)
La ubicacion de los polos del observador, los cuales habran de regir el comportamiento del error
de reconstruccion de los estados no medibles directamente, en el semiplano izquierdo del plano
complejo, se logra escogiendo las ganacias del observador de forma tal que igualen el polinomio
caracterstico del sistema autonomo, p(s), a un polinomio escogido previamente pd (s),
"
e 21
e 22
"
L21
L22
FL
J
#"
e21
e22
(5.98)
111
As:
FL
2
L22 pd (s) = s2 + 2r nr s + nr
J
p(s) = s2 + L21 s +
(5.99)
y entonces:
J 2
F L nr
L21 = 2r nr ; L22 =
5.4
(5.100)
Ejercicios Propuestos
cm
L
y(t) = h(t)
APRO
112CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Lecturas Recomendadas
Al igual que en el captulo anterior le sugerimos consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.
Chapter 6
Dise
no de Compensadores Cl
asicos
mediante Linealizaci
on Aproximada
Durante anos el diseno de leyes de control estuvo basado exclusivamente en el uso de metodos
frecuenciales. En la actualidad, el uso de reguladores o compensadores en el control de plantas
y procesos industriales no ha perdido su vigencia y sigue teniendo una gran importancia. El
metodo de la linealizacion aproximada ilustrado en los captulos previos, nos permitira dedicarnos
a la llamada teora clasica de sistemas de control lineales.
6.1
Introducci
on
DE COMPENSADORES CLASICOS
APROX
114CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
En este captulo seguiremos este mismo esquema para el dise
no de esquemas de control
clasicos basados en la funcion de transferencia. No desarrollaremos en forma extensa los
diferentes metodos para el dise
no de compensadores Gc (s) (lugar de las races, metodo de
Bode, Nichols, etc) ya que existen excelentes y detalladas referencias al respecto (ver la
seccion Lecturas Recomendadas). En lugar de ello, presentaremos un conjunto de ejemplos
ilustrativos de la aplicacion de algunas de las estrategias de compensacion mas comunmente
empleadas.
En adelante, trataremos el dise
no de compensadores en serie Gc (s) para sistemas no lineales. En la seccion 6.2 trataremos en detalle los esquemas de dise
no clasicos para la regulacion,
conocidos como controlador proporcional, P, proporcionalintegral, PI y proporcional integral derivativo, PID, todos ellos basados en el metodo frecuencial de Ziegler-Nichols. En la
seccion 6.3 se presenta el desarrollo de compensadores basados en el metodo de controladorobservador clasico. Finalmente, en la seccion 6.4, presentaremos el procedimiento de dise
no
de un compensador en adelanto, utilizando para ello el ejemplo del sistema de levitacion
c en forma intensiva y podra servir como
magnetica. El esquema presentado usa Matlab
una gua en futuras experiencias de dise
no de sistemas de control realimentado.
6.2
Dise
no de reguladores del tipo P, PI y PID mediante Linealizaci
on Aproximada
(6.1)
plano GU(s)
(U)
=0
Re
GU(j
GU(j 0(U))
(6.2)
La expresion general del compensador PID que estabiliza la salida del sistema linealizado
al valor de cero esta dada por :
"
1
Gc (s) = KP (U ) 1 +
+ TD (U )s
TI (U )s
(6.3)
Como se observa, las expresiones de los controladores P y PI se obtienen haciendo, respectivamente, TI (U ) = , TD (U ) = 0 y TD (U ) = 0. Para el caso del regulador PD hacemos
simplemente TI (U ) = .
Una representacion un tanto mas simple para el controlador (6.3) es la siguiente:
Gc (s) = K1 (U ) +
K2 (U )
+ K3 (U )s
s
(6.4)
DE COMPENSADORES CLASICOS
APROX
116CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Table 6.1: Parametros KP , TI , TD del metodo de Ziegler-Nichols
Tipo der
Parametro
controlador KP
P
0.5K0 (U )
PI
0.45K0 (U )
PID
0.6K0 (U )
Parametro Parametro
TI
TD
0
0.83P0 (U ) 0
0.5P0 (U )
0.125P0 (U )
de
dt
(6.5)
donde e = yref y = 0 y = y .
Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la
forma:
u = K1 (U )e + K2 (U )
Z t
o
e ()d + K3 (U )
de
dt
(6.6)
el cual, ciertamente, constituye un controlador PID clasico. Este regulador PID lineal clasico,
e
+
-
Y(U)
1
KP(U) [ 1 + T (U)s + TD(U)s]
SISTEMA
NO
LINEAL
cg
mX
g
R 2
Ls Xs
2
L
Rg
LX
(6.7)
(0bservese la inversion de signo respecto a la funcion de transferencia original (3.19), en este caso
hemos tomado la se
nal de salida de tal forma que y (t) = x1 (t), esto nos permitira facilitar los
calculos mas adelante).
De acuerdo con el criterio de Nyquist este sistema en lazo cerrado es inestable. Este criterio
tiene que ver con la siguiente funcion de transferencia
1 + Kc
NG (s)
DG (s)
(6.8)
DE COMPENSADORES CLASICOS
APROX
118CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
0.04
0.03
Eje Imaginario
0.02
0.01
-0.01
-0.02
-0.03
-0.04
-0.5
-0.45
-0.4
-0.35
-0.3
-0.25
-0.2
Eje Real
-0.15
-0.1
-0.05
b
Z1 (U )
+ 02 (1
s
s2 + 1 s
U )2
(6.9)
0.5
Eje Imaginario
-0.5
-1
-1.5
-2
-2
-1.5
-1
-0.5
0
Eje Real
0.5
1.5
Figure 6.4: Grafico de Nyquist de la funcion de transferencia del modelo promedio de un convertidor de corriente continua tipo Boost
donde
= U : Z1 (U ) =
b
b1
: Z2 (U ) =
2
0 (1 U )
U)
02 (1
(6.10)
La forma particular del grafico es indicativa de que podemos aplicar el metodo de Ziegler-Nichols
presentado anteriormente, basado en la respuesta frecuencial, para el dise
no de un controlador PI
o PID. En este caso particular realizaremos el dise
no de un controlador PI.
Calculemos la funcion de transferencia para s = j . Obtenemos, a partir de (6.9), la siguiente
expresion que nos permitira determinar la parte imaginaria y la parte real de G( j ):
b
Z1 (U )
( j )2 + 1 j + 02 (1 U )2
(02 (1 U )2 2 ) Z1b(U ) 2 1
0 Z1 (U )
(02 (1 U )2 2 )2 + (1 )2
1b
(02 (1 U )2 2 ) + Z
1 (U )
j 0 Z1 (U ) 2
(0 (1 U )2 2 )2 + (1 )2
GU (s) = 0 Z1 (U )
=
En consecuencia,
Imag GU ( j ) = 0 Z1 (U )
1 b
Z1 (U )
(1 )2
(02 (1 U )2 2 ) +
(02 (1 U )2 2 )2 +
(6.11)
DE COMPENSADORES CLASICOS
APROX
120CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
= 0 Z1 (U )
202 (1 U )2 2
(02 (1 U )2 2 )2 + (1 )2
(6.12)
Se puede observar en el grafico 6.4 que la parte imaginaria (6.12) del grafico de Nyquist se hace
cero en = 0, = , los cuales son valores que no podemos emplear. Entonces, la frecuencia de
cruce con el eje imaginario que nos interesa sera:
(U ) = 20 (1 U )
(6.13)
El valor del modulo de la funcion de transferencia GU ( j ) para el valor de frecuencia angular
(U ) esta dado por
|GU ( j (U ))| =
b
0
Z1 (U ) =
1
0 (1 U )
de donde el periodo u
ltimo P0 (U ) y la ganancia u
ltima K0 (U ) resultan ser en este caso:
2
2
0 (1 U )2
=
; K0 (U ) =
P0 (U ) =
(U )
0 (1 U )
b
(6.14)
(6.15)
De acuerdo a los valores de la tabla 6.2, las ganancias del controlador PI para el sistema
linealizado estan dadas por:
K1 (U ) = 0.45
2 (1 U )3
0 (1 U )2
: K2 (U ) = 0.54 0
b
2b
(6.16)
(1 U )
= 0.54 0
e
2b
0 (1 U )2
= + 0.45
e
b
(6.17)
donde e = y .
En este caso particular, debido a que la se
nal control u cumple la relacion 0 u 1, el esquema
final de control involucra la delimitacion de la se
nal de entrada u, constituida por la adicion del
controlador lineal u resultante del compensador PI y el valor del control en equilibrio ue = U .
Esta delimitacion se lleva a cabo mediante un saturador , el cual impide que la se
nal de entrada
u, representada por la relacion de trabajo, tome valores inferiores a 0 o superiores a 1. Por esta
razon, aparece un limitador con estas caractexisticas en el diagrama de bloques presentado en la
figura 6.5.
6.3
Un analisis del esquema de compensacion lineal basado en el uso de realimentacion del vector
de estado a traves de observadores, nos conduce a convencernos de que es posible utilizar
U
0
+
-
COMPENSADOR
tipo PI
X (U)
2
x2
+ +
CONVERTIDOR
BOOST
y+
x2
LIMITADOR
(6.18)
DE COMPENSADORES CLASICOS
APROX
122CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
v (s)
u (s)
GU (s)=
y (s)
-1
C(sI-A) B
Hu (U,s)
+
Hy (U,s)
Figure 6.6: Interpretacion del diseno en variables de estado
v (s)
+
-
u (s)
GU (s)=
y (s)
-1
C(sI-A) B
+
Hu (U,s)
Hy (Y,s)
NG (U, s)
;
DG (U, s)
Hy (Y, s) =
Ny (Y, s)
;
C(s)
Hu =
Nu (U, s)
C(s)
DE COMPENSADORES CLASICOS
APROX
124CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
estada dada por:
y (s)
NG (U, s)
= FU (s) =
v (s)
D(U, s)
El dise
no de los bloques compensadores se lleva a cabo entonces a partir de la ecuacion
que relaciona los numeradores de sus funciones de transferencia con los polinomios conocidos
y con los polinomios que determinan la dinamica asignada al sistema en lazo cerrado y al
observador subyacente. Observamos que la igualdad polinomial involucra la identificacion
termino a termino de los coeficientes de dos polinomios de grado 2n 1 que arrojan un
total de 2n ecuaciones y tenemos como incognitas, precisamente, los 2n coeficientes de los
numeradores de las funciones de transferencia de los bloques compensadores, es decir, los
coeficientes de Ny (Y, s) y Nu (U, s). Se puede demostrar que si los polinomios NG (U, s) y
DG (U, s) son coprimos existe, entonces, solucion para tal sistema de ecuaciones y, ademas,
tal solucion es u
nica.
A continuacion ilustraremos el uso de este metodo de dise
no de control lineal en un
ejemplo sencillo, proveniente de una linealizacion.
x 1
x 2
"
NcJ
h
y =
q0
"
1 0
U2
c2
x1
x2
#"
B
J
x1
x2
"
1
j
u
(6.19)
y (s)
NG (U, s)
=
=
u (s)
DG (U, s)
s2 +
1/J
B
Js
c
NJ
U2
c2
(6.20)
Proponemos para este sistema el esquema de compensacion lineal basado en el esquema clasico
del controlador-observador descrito en esta seccion:
Definimos los siguientes bloques compensadores:
Hu (U, s) =
Hy (Y, s) =
Nu (U, s)
nu1 (U )
=
+ nu2 (U )
C(s)
s+
Ny (Y, s)
ny1 (Y )
=
+ ny2 (Y )
C(s)
s+
FU (s) =
1/J
NG (U, s)
= 2
D(s)
s + 2n s + n2
(s + )(s2 + 2n s + n2 ) (s + ) s2 +
B
c
s+
J
NJ
U2
c2
B
c
= (nu2 (U )s + [nu2 (U ) + nu1 (U )]) s2 + s +
J
NJ
U2
1 2
c
1
+ (ny2 (U )s + [ny2 (Y ) + ny1 (Y )])
J
Se igualan los coeficientes de las potencias iguales de s, de los polinomios que se encuentran
a ambos lados de la identidad.
Obtenemos los siguientes valores para las incognitas, los cuales determinan los coeficientes
de los numeradores de las funciones de transferencia de los bloques compensadores:
B
J
B
ny2 (U ) = J n2 +
J
ny2 (Y ) = J n2 +
B
J
B
2n
J
B
J
NJ
U2
1 2 ;
c
c
Y
cos
NJ
N
u2
B
1 2 + J
;
c
J
B c
ny1 (U ) = 2n
J
N
ny1 (Y ) = 2n
B
J
2n
c
Y
cos
N
N
+ J
B
J
2n B
J
s+
2n
B
J
Hy (Y, s) = h
J n2 +
h
B
J
c
N
cos
Y
N
2n
+ J
B
J
donde es un n
umero real positivo completamente arbitrario.
c
NJ
B
J
cos
i
Y
n
DE COMPENSADORES CLASICOS
APROX
126CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Es u
til considerar la siguiente realizacion de espacio de estado de los bloques compensadores:
zu = zu + u
B
yu =
2n
zu
J
zy = zy + y
B
c
Y
B
yy =
2n
cos
+ J
zy
J
N
N
J
B
B
c
Y
+J n2 +
2n
cos
y
J
J
NJ
N
(6.21)
6.4
x1 (s)
y (s)
=
=
GX (s) =
u (s)
u (s)
s3 +
cg
mX
g
R 2
Ls Xs
2
L
Rg
LX
GX (s)
127
200
150
Eje Imaginario
100
50
-50
-100
-150
-200
-200
-150
-100
-50
0
Eje Real
50
100
150
200
u (s)
s + z1
= Kc
e (s)
s + p1
(6.22)
DE COMPENSADORES CLASICOS
APROX
128CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Gc (s)
GX (s)
200
150
Eje Imaginario
100
50
-50
-100
-150
-200
-200
-150
-100
-50
0
Eje Real
50
100
150
200
129
60
40
Eje Imaginario
20
-20
-40
-60
-50
-40
-30
-20
-10
Eje Real
Figure 6.12: Lugar de las races para el sistema compensado. El signo + indica la ubicacion
aproximada de los polos para la ganancia Kc = 16.5
Un valor de Kc inferior a 11.0680, nos da un sistema en lazo cerrado inestable, esto se puede
observar del diagrama de Nyquist de la figura 6.13.
A continuacion, comprobaremos el desempe
no de la estrategia de control propuesta. Emplearemos, para ello, simulaciones numericas del comportamiento del sistema compensado en lazo cerrado.
c (esta funcion permite una mayor precision que la
Haremos uso de la funcion ode45 de Matlab
ode23). Como recordaremos, para realizar tales simulaciones de los procesos siempre llevamos las
ecuaciones del sistema a una representaci
on en variables de estado. De aqui que la funcion de transferencia del compensador en adelanto (6.22) debe ser representada en esta forma. Una realizacion
o programaci
on de esta funcion de transferencia se puede obtener mediante los siguientes pasos:
Escriba Gc (s) en la forma de una fraccion estrictamente propia mas un termino constante:
u (s)
s + z1
z1 p1
= Kc
= Kc + Kc
e (s)
s + p1
s + p1
(6.23)
u
(s)
z1 p1
= Kc
e (s)
s + p1
(6.24)
Haciendo
(6.25)
DE COMPENSADORES CLASICOS
APROX
130CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
0.06
0.04
Imag Axis
0.02
-0.02
-0.04
-0.06
-0.1
-0.09
-0.08
-0.07
-0.06
-0.05 -0.04
Real Axis
-0.03
-0.02
-0.01
(6.26)
smgto
%% mgto.m
%% Este programa presenta la programaci\on del sistema de control
%% en lazo cerrado para el sistema de suspension magnetica. Se
%% emplea un compensador en adelanto como estrategia de control.
function xdot = mgto(t,x)
global C M G X R L U K A B YREF
131
Posicion de la esfera
Velocidad
0.1
0.5
x2
x1
0
0.05
-0.5
0
0
0.5
1
tiempo t
1.5
-1
0
Corriente en el magneto
0.5
1
tiempo t
1.5
Voltaje de entrada
1
0.4
0.5
x3
0.6
0.2
0
0
0.5
1
tiempo t
1.5
-0.5
0
0.5
1
tiempo t
1.5
Figure 6.14: Comportamiento dinamico del sistema de suspension magnetica en lazo cerrado
con el compensador en adelanto disenado
smgto.m
Programa para simular el comportamiento dinamico controlado
del sistema de suspension magnetica usando
un compensador por adelanto. Utiliza el programa mgto.m
clear all
ti = 0.0; %% tiempo inicial
tf = 1.0; %% tiempo final
global C M G X R L U K A B YREF
C = 1;
M = 0.1;
DE COMPENSADORES CLASICOS
APROX
132CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
G = 9.8;
X = 0.05;
R = 1;
L = 1e-2;
U = R*sqrt(M*G*X/C);
K = 16.5;
A = 10;
B = 50;
YREF = 0.0; %% sennal de referencia
%% Diferentes
%%x0 = [0.051
%%x0 = [X*1.8
%%x0 = [X*1.8
%%x0 = [0.1 0
x0 = [X*1.5 0
[t,x] = ode45(mgto,ti,tf,x0,1e-6,1);
%%[t,x] = ode45(mgto,ti,tf,x0);
%% fin de smgto.m
6.5
Ejercicios Propuestos
(6.27)
(?)
manipulador rob
otico de una sola uni
on rgida
Ejercicio 6.3: Matlab
Deduzca los pasos necesarios para obtener la expresion en variables de estado (6.21) del esquema de conpensacion propuesto en la pagina 6.3. Realice las simulaciones correspondientes para
comprobar la efectividad de la estrategia de control propuesta. Utilice el siguiente conjunto de
parametros:
B = 0.1 [N/m/seg]; J = 0.25 [kg m2 ]; c = 1 [kg m2 /seg 2 ]; N = 10; X =
15
[rad].
180
(6.28)
133
(?)
Lecturas Recomendadas
Para esta parte le sugerimos consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.
Una introduccion al dise
no robusto de compensadores para sistemas de control realimentado, basado en los desarrollos modernos y fundamentado en factorizaciones coprimas y el
uso de la ecuaci
on diofantina o de Bezout, se puede conseguir en:
J.C. Doyle, B.A. Francis and A.R. Tannenbaum, Feedback Control Theory. Macmillan, New
York, 1992
DE COMPENSADORES CLASICOS
APROX
134CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Part II
El M
etodo de la Linealizaci
on
Extendida
135
Chapter 7
Control de Sistemas No Lineales por
Linealizaci
on Extendida
Desde los anos 40, el uso de la tecnica de linealizacion aproximada ha permitido resolver una
gran diversidad de problemas relacionados con el control de sistemas reales. Sin embargo, esta
estrategia presenta algunas restricciones fundamentales en su aplicacion. Para resolver estos
inconvenientes, se han propuesto diferentes extensiones del metodo, estas extensiones incluyen
aspectos teoricos fundamentales relacionados con diversas areas de la matematica, tales como la
teora de operadores, el analisis funcional, el algebra y la geometra diferencial, por ejemplo.
En este captulo ilustraremos los elementos fundamentales de un metodo propuesto por W.
Rugh y sus colaboradores (Rugh, 1986; Rugh, 1987; Rugh, 1991) para el control de sistemas
dinamicos no lineales y al cual se le ha denominado Metodo de la Linealizaci
on Extendida.
El metodo de la linealizacion extendida esta basado en la familia de linealizaciones del sistema no lineal, parametrizada respecto a puntos de operacion constante. Las ganancias de
realimentacion no lineal del vector de estado se calculan de tal manera que los autovalores del
sistema linealizado en lazo cerrado se colocan en valores especficos del plano complejo y tales
que, al mismo tiempo, sean invariantes para todos los puntos de operacion constantes en lazo
cerrado en una vecindad del punto de operacion constante nominal en lazo cerrado. La tecnica
137
EXTENDIDA
138CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
se extiende facilmente al caso de diseno por realimentacion del vector de salidas a traves de
observadores y compensadores estaticos.
7.1
Introducci
on
Un enfoque de dise
no tpico en el control de sistemas no lineales es obtener la linealizacion
(jacobiana) del sistema alrededor de un punto de equilibrio, dise
nar los esquemas de control
para el sistema linealizado obtenido y someter al sistema no lineal a la estrategia lineal de
control definida. Si bien esto ha resultado provechoso en un gran n
umero de aplicaciones,
la linealizacion aproximada presenta algunos inconvenientes. Por un lado, su efectividad se
limita a una region peque
na del espacio de estados de tal forma que, a partir de condiciones
iniciales alejadas de la posicion de equilibrio, el sistema de control puede ser inestable o,
simplemente, puede fallar en estabilizar el sistema alrededor del punto de operacion deseado.
Por otro lado, existen sistemas que pueden operar bajo diferentes condiciones de funcionamiento, esto es, pueden presentar comportamientos en diferentes regiones de operacion
asociados con diferentes puntos de equilibrio. Al establecer la ley de control para un sistema linealizado no estamos considerando la posibilidad de que el punto de operacion actual
cambie su ubicacion a un punto diferente, en alg
un instante del tiempo. La estrategia de
control implantada en el sistema no lineal original debe tomar en cuenta este aspecto y esto
implica, necesariamente, lo siguiente: a) recalcular las leyes de control y obtener las ganancias K del controlador para cada sistema linealizado resultante de cada punto de equilibrio,
y b) disponer de un mecanismo de asignacion de los valores K de acuerdo al punto actual
de operacion. La estrategia mas com
unmente empleada para aplicar este procedimento es
el llamado esquema de asignacion de ganancias, E.A.S., o Gain Scheduling, en ingles. El
E.A.S. consiste en lo siguiente. Conociendo las diferentes condiciones de operacion del sistema no lineal, se obtienen las linealizaciones particulares y las leyes de control asociadas
alrededor de los puntos de equilibrio. Mediante un mecanismo ad hoc de interpolacion de las
leyes de control lineal obtenidas (la parte mas difcil de definir en esta estrategia), se ajustan
las ganancias o parametros del controlador de acuerdo a la region actual de operacion del
sistema. De esta forma, se ajustan los parametros del dise
no de acuerdo a ciertas variables
seleccionadas del sistema para obtener el dise
no linealizado adecuado cuando el sistema no
lineal opera alrededor de alguno de sus puntos de equilibrio.
Estudiaremos a continuacion un metodo de naturaleza no lineal, equivalente en cierta
medida al E.A.S., llamado Linealizaci
on Extendida. En comparacion a la estrategia de
asignacion de ganancias, esta metodologa de dise
no propone un enfoque sistematico para
el dise
no de controladores, ademas posee una formulacion analtica, una propiedad muy
interesante desde el punto de vista de ingeniera. Esta estrategia constituye una extensi
on
no lineal del metodo de la linealizacion aproximada.
EXTENDIDA
7.2. EL METODO
DE LA LINEALIZACION
7.2
139
El M
etodo de la Linealizaci
on Extendida
El metodo de la linealizaci
on extendida utiliza la linealizacion aproximada tradicional como
herramienta fundamental. El modelo utilizado para generar el dise
no del controlador es un
modelo obtenido sobre la base de los primeros terminos (de caracter lineal) de una expansion
en serie de Taylor de un sistema no lineal que opera en la vecindad de un punto de operacion
constante. En este caso, la diferencia radica en que en lugar de obtener un modelo linealizado
para un punto en particular, se procede a obtener el modelo parametrizado de caracter
lineal para un punto de operaci
on generico de naturaleza arbitraria. Esta parametrizacion
se calcula bajo la suposicion de que existe un continuum de puntos de operacion en el
espacio de entrada-estado (o en el espacio entrada-salida correspondiente) asociado a cada
valor constante del control y del estado (y de la salida, respectivamente). En su defecto, tal
parametrizacion puede asociarse a los valores de una magnitud de referencia (constante) del
sistema en lazo cerrado.
El resultado fundamental obtenido a partir de esta estrategia consiste en la obtencion
de una familia de modelos lineales parametrizados, validos en primera aproximacion, respecto a puntos de operacion deseados. Esta familia de modelos ofrece una descripcion del
comportamiento de las perturbaciones de estado-entrada (o salida-entrada) explcitamente
parametrizada en terminos de un valor constante U de la entrada o del alg
un estado de interes (o de salida). A partir de esta familia de modelos, el metodo propone inicialmente
obtener un controlador por realimentacion del vector de estado (o una combinacion de
observador-controlador o, incluso, un compensador clasico obtenido por metodos inherentes
a la descripcion por funciones de transferencia). El compensador lineal obtenido, entonces,
se encuentra tambien parametrizado por el punto de operacion y estabiliza, en principio, a
cualquier representante de la familia de modelos lineales obtenidos en la etapa inicial del
dise
no.
A continuacion del dise
no lineal se presenta la parte mas importante de este metodo: la
obtencion del controlador no lineal. La idea crucial del metodo es la no linealizacion (ver
seccion ??) y esta basada en proponer un controlador de car
acter no-lineal cuya linealizaci
on
alrededor del punto de operaci
on coincide con el controlador lineal dise
nado para la familia
de modelos lineales parametrizados por el punto de operacion. Naturalmente, en este u
ltimo
paso del proceso de dise
no, se pueden obtener, en general, infinitas soluciones al problema
de inversion planteado.
La ventaja fundamental del metodo de la linealizacion extendida es que a la par de retener
el significado fsico de las variables linealizadas, debido a que no estamos acudiendo a transformaciones de coordenadas de estado o del espacio de los controles que puedan destruir el
significado fsico de tales variables originales, ademas se logra una programacion automatica
de las ganancias del compensador, tanto a nivel del observador como del controlador; un
hecho que, como hemos mencionado, esta intimamente ligado al E.A.S. .
Es preciso apuntar dos aspectos importantes. Primeramente, el metodo de la linealizacion extendida abre las posibilidades de utilizar metodos clasicos de dise
no para los compensadores mediante tecnicas tradicionales de entrada-salida (al menos en el caso de una
EXTENDIDA
140CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
sola entrada y una sola salida). El caso de controladores PID constituye el ejemplo clasico
y fundamentalmente interesante dentro de las posibilidades del metodo. Por otro lado, para
sistemas de dimension considerable, el metodo de la linealizacion extendida plantea la utilizacion de herramientas computacionales de calculo simbolico tales como los representados
por los paquetes REDUCE, MACSYMA o MAPLE.
7.3
Dise
no de Controladores no Lineales por Asignaci
on
de Polos Invariantes en Familias de Modelos Parametrizados por un Punto de Operaci
on Constante
Arbitrario
Supondremos que el sistema no lineal a ser controlado se puede describir mediante un conjunto de ecuaciones diferenciales analticas a parametros constantes. Considere el sistema:
x = f (x, u)
(7.1)
(7.2)
= f (x(t), k(x(t))
(7.3)
Debido a que este sistema ha de tener el mismo punto de operacion constante del sistema
(7.1), debe cumplirse que:
f (X(U ), k(X(U )) = 0
(7.4)
k(X(U )) = U
(7.5)
es decir,
y, ademas, la solucion de X(U ) obtenida a partir de (7.4) coincidira con la solucion resultante
de la ecuacion (7.2).
En virtud del teorema de la funcion implcita, si existe la solucion x(U ) del sistema de
ecuaciones (7.4), la misma es u
nica s y solamente s la matriz jacobiana de (7.4), respecto
f (x, k(x))
f (x, u)
f (x, u)
k(x)
x
x X(U ),U
u X(U ),U
x X(U ),U
(7.6)
esto se interpreta como el hecho de que la linealizacion del sistema en lazo cerrado, alrededor
de su punto de equilibrio, no debe tener autovalores en el origen.
Es suficiente, entonces, que la linealizacion del sistema en lazo cerrado tenga sus autovalores en el semiplano izquierdo. La ley de control del sistema linealizado
k(x)
x
u =
x X(U ),U
(7.7)
f (x, u)
f (x, u)
x =
x +
u
x X(U ),U
u X(U ),U
(7.8)
A(U ) =
f (x, u)
f (x, u)
; B(U ) =
;
x X(U ),U
u X(U ),U
K(U ) =
k(x)
x X(U ),U
(7.9)
En tanto el sistema linealizado presente autovalores independientes del punto de operacion (X(U ), U ), la calidad de la respuesta controlada en la vecindad del punto de
equilibrio que se desea mantener, es, por as decirlo, invariante. Esta propiedad es u
til pues
de alguna manera homogeneiza las propiedades cualitativas del dise
no en forma independiente al punto de equilibrio considerado. El objetivo seraahora demostrar que existe una
funcion analtica k(x) tal que los autovalores de la matriz [A(U ) B(U )K(U )] pueden ser
pre-especificados de tal manera que sean independientes del punto de operacion U . Dichos
autovalores, sin embargo, no pueden ser cero, por la razones que acabamos de proponer, y
deben ocurrir en pares complejos conjugados si su parte imaginaria es no nula.
Para proceder supondremos que el par (A(U ), B(U )) es controlable. Entonces, (A(), B())
tambien es controlable en cualquier vecindad peque
na de U en la recta real (esto es consecuencia de que las entradas aij y bij de A(U ) y B(U ), respectivamente, son continuas
respecto de la variable U ). A partir del par (A(U ), B(U )) y de la dinamica deseada del
sistema lineal en lazo cerrado, la ganancia de realimentacion lineal K(U ) se puede calcular
EXTENDIDA
142CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
utilizando, por ejemplo, la formula de Bass-Gura1 (Kailath, 1980) o mediante la formula de
Ackermann (Franklin et al., 1994).
Veamos el siguiente teorema de existencia de la funcion u = k(x), base del metodo de
la linealizacion extendida:
Teorema 7.1 Supongase que el sistema analtico dx/dt = f (x, u) es tal que (A(U ), B(U ))
es un par controlable, entonces existe una ganancia o funcion de realimentaci
on no lineal
k() : IRn IR, tal que los autovalores del sistema lineal en lazo cerrado, i.e., los autovalores
de la matriz [A(U ) B(U )K(U )], tienen valores pre-especificados cualesquiera los cuales son
localmente invariantes con respecto a U .
Prueba: La prueba se divide, esencialmente, en dos pasos. Primero demostraremos que
dX(U )/dU 6= 0. Esta cualidad sera u
til en el segundo paso de la prueba, para poder
establecer una funcion k() definida de tal forma que la linealizacion de u = k(x) resulta
en u = K(U )x .
Notese que se puede suponer que A(U ) = f /x|U,X(U ) es invertible, pues, si no lo es,
podemos hacer todos los autovalores de
"
f
f
f (x, u)
=
+
x
x
u
1
donde = [n n1 . . . 1 ] es el vector formado por los coeficientes del polinomio caracterstico deseado
del sistema en lazo cerrado:
pd (s) = sn + n sn1 + . . . + 1 ,
y a(U ) = [an (U ) an1 (U ) ldots a1 (U )] es el vector formado con los coeficientes del polinomio caracterstico
de la matriz A(U ), es decir,
p(s) = det(sI A(U )) = sn + an (U )sn1 + . . . + a1 (U ) ,
R(U ) es una matriz triangular de Toepliz, dada por
1
a1 (U )
R(U ) =
..
0
1
..
.
...
...
..
.
0
0
..
.
an1 (U ) an2 (U ) . . .
y
C(U ) = [B(U ) A(U )B(U ) ... A(n1) (U )B(U )]
es la matriz de controlabilidad del par (A(U ), B(U )).
El polinomio caracterstico deseado se selecciona de tal manera que presente coeficientes constantes e
independientes de U .
(7.10)
X(U )
f
d
f
=0
f (X(U ), U ) =
dU
x X(U ),U U U
u X(U ),U
(7.11)
y por lo tanto:
dX(U )
dU
f
=
x
X(U ),U
6= 0
u X(U ),U
(7.12)
= K(U ) = [K1 (U ), . . . , Kn (U )]
x X(U )
(7.13)
k(X(U )) = U
(7.14)
Z X 1 (x1 )
1
K()
dX()
d
d
n
X
(7.15)
j=2
(7.16)
n
X
k
dXj ()
=
Kj ()
x1
d
j=1
dX11 (x1 )
dx1
X11 (x1 )
n
X
dXj (X11 (x1 )) dX11 (x1 )
Kj (X11 (x1 ))
dx1
dX11 (x1 )
j=2
dX11 (x1 )
dx1
EXTENDIDA
144CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
Evaluando la expresion anterior en el punto X11 (x1 ) se tiene.
n
X
k
dXj (X11 (x1 )) dX11 (x1 )
1
=
K
(X
(x
))
j
1
1
x1 X 1 (x1 )
dx1
dX11 (x1 )
j=1
1
n
X
j=2
=
=
Kj (X11 (x1 ))
dx1
dx1
dX11 (x1 )
dX11 (x1 )
dx1
(7.17)
donde x2 es la velocidad angular respecto del eje principal, u es el torque aplicado y x1 es el angulo
de orientacion medido respecto de un eje oblicuo, no coincidente con el eje principal.
(7.18)
x 1
x 2
"
0 0.5(1 + X 2 )
0
0
#"
x1
x2
"
1
J
(7.19)
(7.20)
cuyas ganancias dependen del valor constatnte X del punto de equilibrio, el sistema en lazo cerrado
esta dado por:
"
x 1
x 2
"
K1J(x)
0.5(1 + X 2 )
K2J(x)
#"
x1
x2
(7.21)
K2 (X)
0.5(1 + X 2 )K1 (X)
s+
J
J
(7.22)
Si deseamos imponer al sistema controlado un comportamiento independiente del punto de operacion buscamos ganancias K1 (X), K2 (X) que hagan al polinomio caracterstico independiente de
X. En efecto, sea pd (s) un polinomio caracterstico deseable e independiente del punto de operacion:
P d(s) = (s + a1 )(s + a2 ) = s2 + (al + a2 )s + a1 a2
(7.23)
donde a1 y a2 son raices en el semiplano izquierdo del plano complejo que se suponen dan al
sistema linealizado un comportamiento deseable.
Haciendo entonces:
K2 (X) = K2 = J(a1 + a2 )
Ja1 a2
K1 (X) =
1 + X2
(7.24)
obtenemos un sistema en lazo cerrado cuyo comportamiento es independiente del punto de operacion
X. La ley de control linealizada y parametrizada en terminos de X es entonces:
u =
Ja1 a2
x1 J(a1 + a2 )x2
1 + X2
(7.25)
EXTENDIDA
146CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
resulta en el controlador obtenido por dise
no lineal aproximado?. Este controlador ha de ser tal
que estabilice el sistema en el punto de equilibrio dado por (7.18).
Previamente a cualquier particularizacion de las variables de estado, la funcion de control debe
satisfacer el siguiente par de ecuaciones en derivadas parciales, ver (7.13):
k
Ja1 a2
k
=
;
= J(a1 + a2 )
2
x1 x1 =X;x2 =0 1 + X
x2 x1 =X;x2 =0
(7.26)
(7.27)
Z x2
0
(7.28)
donde (x1 ) es una funcion arbitraria de x1 que debemos determinar. Usando la expresion obtenida
en la primera ecuacion en derivadas parciales, se tiene:
d
Ja1 a2
(x1 ) =
dx1
1 + X2
(7.29)
Z x1
Ja1 a2
X
1 + 2
(7.30)
El controlador as obtenido satisface con la condicion de contorno (7.13) impuesta por el punto
de equilibrio U del control u:
u = J(a1 + a2 )x2 Ja1 a2 [tan1 (x1 ) tan1 (X)]
(7.31)
Hemos obtenido, por tanto, un controlador no lineal que responde al esquema mostrado en la
figura 7.1.
Este controlador estabiliza al sistema alrededor del punto de equilibrio (X, U ) y sirve para
cualquier cambio brusco del punto de equilibrio deseado X, sin necesidad de reprogramar las
ganancias.
c el comportamiento del sistema controlado en
A continuacion vamos a simular en Matlab
lazo cerrado. Los siguientes programas permiten obtener las graficas correspondientes al comportamiento de los estados x y de la se
nal de control u, mostrados en la figura 7.2.
%
%
%
%
%
%
%
%
%
ejext1.m
Primer ejemplo de simulacion numerica usando el metodo
de linealizacion extendida:
El sistema representa un satelite mono-axial descrito por el
parametro de orientacion de Cayley-Rodrigues.
La ley de control realimentada es no lineal,
obtenida mediante el metodo de linealizacion extendida.
- tan1 ()
- j
+
- Ja1 a2
x1
u
x = 0.5(1 + x21 )x2
- ?
j- 1
6-
- J(a1 + a2 )
tan1 ()
x 2 =
x2
1
u
J
1.5
x2
x1
1
0.1
0.5
0
0
10
20
30
t [seg]
0
0
10
20
30
t [seg]
20
10
0
-10
0
10
20
30
t [seg]
Figure 7.2: Comportamiento del satelite mono-axial controlado mediante realimentacion del
vector de estados basada en linealizacion extendida
EXTENDIDA
148CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
%
%
%
%
%
%
%
%
sejext1.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext1.m
El sistema es controlado mediante una realimentacion no lineal de estado
obtenida por linealizacion extendida.
% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0];
% simulacion numerica
[t,x] = ode23(ejext1,t0,tf,x0);
save dejext1 t x u
% procedimiento para obtener la ley de control en forma vectorial
% parametros
J=90;a1=0.5;a2=0.5; X=1.5;
for i = 1:length(x),
u(1,i) = -J*a1*a2*(atan(x(i,1)) - atan(X) ) - J(a1+a2)*x(i,2) ;
end
clg
subplot(221), plot(t,x(:,1))
title(posicion angular de orientacion)
ylabel(x1)
xlabel(t [seg])
subplot(222), plot(t,x(:,2))
title(velocidad angular respecto al eje principal)
1.5
0.5
0
0
10
20
30
t [seg]
0.1
0
0
10
20
30
t [seg]
30
20
10
0
-10
0
10
20
30
t [seg]
Figure 7.3: Comportamiento del satelite mono-axial controlado por linealizacion extendida, limitando la senal de control mediante Umax -; sin limitar --ylabel(x2)
xlabel(t [seg])
subplot(223), plot(t,u)
title(torque externo - ley de control)
ylabel(u)
xlabel(t [seg])
% sejext1.m
De la simulacion presentada en la figura 7.2 se puede observar que el torque necesario para
realizar el control del sistema debe ser significativo (del orden de 20 Nm). En la practica los
torques externos empleados son mucho menores, digamos de unos 5 Nm. La simulaci
on de la
figura 7.3 muestra el comportamiento del mismo sistema pero sujeto a una saturacion en amplitud
del control externo a aplicarse. El valor maximo del torque en la simulaci
on se ha escogido,
precisamente, de Umax = 5 Nm. El efecto de tal limitacion o saturacion resulta en una disminuci
on
de la velocidad angular maxima alcanzada por el artefacto y una respuesta relativamente mas lenta
(en la figura 7.3, por razones de comparacion, se han sobrepuesto los resultados de la simulaci
on
del sistema controlado sin saturar el torque externo, los cuales estan representados mediante una
lnea a trazos ---). Las modificaciones hechas a los programas anteriores se muestran a continuaci
on
(ejext1b.m y sejext1b.m).
% ejext1b.m
%
EXTENDIDA
150CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
%
%
%
%
%
%
%
%
%
%
%
%
sejext1b.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext1b.m
El sistema es controlado mediante una realimentacion no lineal de estado
obtenida por linealizacion extendida, usando una saturacion del
valor maximo del control
% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0];
% simulacion numerica
[t,x] = ode23(ejext1b,t0,tf,x0);
% procedimiento para obtener la ley de control en forma vectorial
% parametros
J=90;a1=0.5;a2=0.5; X=1.5; umax=5;
- tan1 ()
- j- Ja1 a2
+
6- J(a1 + a2 )
ulim
u
- ?
j-
tan1 ()
x1
Umax
-Umax
1
u
J
x2
Figure 7.4: Esquema de control no lineal obtenido para el satelite mono-axial con ley de control
limitada por el valor Umax
for i = 1:length(x),
uu(1,i) = -J*a1*a2*(atan(x(i,1)) - atan(X) ) - J(a1+a2)*x(i,2) ;
% saturacion
if abs(uu(1,i)) > umax,
u(1,i) = umax;
else
u(1,i) = uu(1,i);
end
end
save dejext1b t x u
clg
subplot(221), plot(t,x(:,1))
title(posicion angular de orientacion)
ylabel(x1 (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,x(:,1),--)
load dejext1b
subplot(222), plot(t,x(:,2))
title(velocidad angular respecto al eje principal)
ylabel(x2 (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,x(:,2),--)
load dejext1b
subplot(223), plot(t,u)
title(torque externo - ley de control)
ylabel(u (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,u,--)
% sejext1b.m
El diagrama de bloques correspondiente a este sistema de control realimentado, con una ley de
control limitada a un valor maximo, se presenta en la figura 7.4.
EXTENDIDA
152CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
tan1 ( aU
g )
0
X(U ) =
(7.32)
x =
0
1
h(U ) 0
"
x +
0
)g
aah(U
2 U 2 +g 2
(7.33)
donde:
p
h(U ) =
4L
3
a2 U 2 + g 2
amLg 2
(a2 U 2 +g 2 )
(7.34)
k
a2 U 2 + g 2
[e1 e2 + h(U ) (e1 + e2 )]
=
K(U
)
=
x X(U )
abg
(7.35)
Z X 1 (x1 )
1
0
K(U )
n
X
dX(U )
dU +
Kj [X11 (x1 )](xj xj (X11 (x1 ))
dU
j=2
(7.36)
es decir,
u = k(x1 , x2 ) =
+
g
4Le1 e2
tan(x1 )
log[sec(x1 ) + tan(x1 )] + e1 e2 mL sen (x1 )
a
3a
(e1 + e2 )
4L
x2
sec(x1 ) amL cos(x1 )
a
3
(7.37)
x 1
x 2
"
NcJ
q0
#"
U2
c2
B
J
x1
x2
"
0
1
J
(7.38)
(7.39)
x 1
x 2
"
NcJ
#"
U2
c2
1
1
J1 K1 (U ) B
J J K2 (U )
x1
x2
(7.40)
P (s) = s2 +
B K2 (U )
1 c
+
s+
J
J
J N
U2
c2
+ K1 (U )
(7.41)
(7.42)
c
U2
K1 (U ) = Jn2
1 2
N
c
K2 (U ) = 2Jn B
(7.43)
y, por ende,
c
u = Jn2
N
U2
1 2 x1 (2Jn B)x2
c
(7.44)
Como ya hemos visto, una vez obtenido el controlador lineal que estabiliza a toda la familia
de modelos lineales parametrizados por el punto de equilibrio, debemos proceder a buscar un
controlador no lineal, de la forma u = k(x), cuya linealizacion coincida con (7.44). Tal controlador
debe satisfacer las siguientes expresiones:
k(x)
x1 [X(U ),0],U
c
= Jn2
N
k(x)
x2 [X(U ),0],U
= 2Jn B
U2
c2
(7.45)
EXTENDIDA
154CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
con la condicion de contorno:
k(X(U ), 0) = U
(7.46)
(7.47)
donde (x
on arbitraria de x1 . Consideremos primeramente la expresion U =
1 ) es una funci
x1
c sen N .
Procedemos a determinar la funcion (x1 ), utilizando la primera de las relaciones de (7.45), de
tal forma que se obtiene:
s
d
c
x1
(x1 ) = Jn2
1 sen 2
dx1
N
N
c
x1
= Jn2
cos
N
N
(7.48)
x1
N
+K
(7.49)
x1
N
(2Jn B)x2
K
(7.50)
= J 2 N sen 1 U
K
n
c
(7.51)
As, el controlador no lineal obtenido por linealizacion extendida esta dado por:
u = k(x) =
Jn2
x1 N sen
U
c
+ c sen
x1
N
(2Jn B)x2
(7.52)
la cual, al ser substituida en el sistema no lineal original (1.48), arroja la siguiente expresion,
perfectamente lineal, para el sistema en lazo cerrado:
x 1 = x2
x 2 =
n2
x1 N sen
U
c
2n x2
(7.53)
El punto de equilibrio del sistema en lazo cerrado es, evidentemente, el punto de equilibrio
deseado, parametrizado por el control constante U . El sistema anterior se reescribe, en terminos
de X, como:
x 1 = x2
x 2 = n2 (x1 X) 2n x2
(7.54)
= c sen
c
u = U Jn2
N
X
N
U2
1 2 (x1 X) (2Jn B)x2
c
Jn2
c
X
cos
N
N
(7.55)
ejext2.m
Ejemplo de simulacion numerica usando el metodo
de linealizacion extendida:
El sistema representa un brazo manipulador robotico controlado
mediante una ley de realimentacion no lineal,
obtenida mediante el metodo de linealizacion extendida.
El programa requerido para realizar las simulaciones
y obtener las graficas es:
sejext2.m
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/08/97
sejext2.m
Programa de simulacion de la respuesta controlada
de un brazo manopulador robotico mono-axial.
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext2.m
EXTENDIDA
156CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
% El sistema es controlado por realimentacion no lineal de estado
% obtenida mediante linealizacion extendida.
% tiempo de simulacion
t0=0;
tf=1;
% condiciones iniciales
x0=[0.1 0];
% simulacion numerica
[t,x] = ode23(ejext2,t0,tf,x0);
% parametros
X = 0; N = 1;
B=1e-2; J=4e-2; c=.58;
xi=0.707; wn=8.56;
% expresion vectorial de la ley de control no lineal u
u = -J*wn*wn*(x(:,1)-X)+c*sin(x(:,1)/N)+(B-2*J*xi*wn)*(x(:,2)-0);
clg
subplot(221), plot(t,x(:,1))
title(posicion angular del brazo)
ylabel(x1)
xlabel(t [seg])
subplot(222), plot(t,x(:,2))
title(velocidad angular del brazo)
ylabel(x2)
xlabel(t [seg])
subplot(223), plot(t,u)
title(torque externo aplicado)
ylabel(u)
xlabel(t [seg])
% sejext2.m
Una respuesta tpica de este sistema se muestra en la figura 7.5. La grafica de la figura 7.6
muestra las respuestas controladas de la posicion angular desde distintas condiciones iniciales que
van a groso modo desde -0.5 rad a 0.5 rad. El controlador no lineal tiene exito completo en
estabilizar la posicion angular del brazo manipulador robotico alrededor de la posicion vertical,
dada por X = 0, desde las diferentes posiciones iniciales.
Sustituyendo adecuadamente la ley de control no lineal en los programas sejext2.m y
sejext2.m podemos simular el comportamiento del brazo en lazo cerrado con la ley de control
obtenida por linealizacion extendida (7.55). Solo basta comentar la ley de control no lineal y, a
continuacion, agregar las siguientes lneas a los programas anteriores.
En ejext2.m:
% ley de control no lineal
%u = -J*wn*wn*(x(1) - X) +c*sin(x(1)/N)+....
%(B-2*J*xi*wn)*(x(2)-0);
% ley de control lineal
u = c*sin(X/N)-(J*wn*wn-c/N*cos(X/N))*(x(1)-X)+....
(B-2*J*xi*wn)*(x(2)-0);
En sejext2.m:
% expresion vectorial de la ley de control no lineal u
0.1
0.1
0
0.05
x2
x1
-0.1
-0.2
-0.3
-0.05
0
0.5
t [seg]
-0.4
0
0.5
t [seg]
0
-0.1
-0.2
-0.3
0
0.5
t [seg]
Figure 7.5: Comportamiento del brazo manipulador robotico controlado por linealizacion extendida
EXTENDIDA
158CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
x1 [rad]
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0
0.1
0.2
0.3
0.4
0.5
t [seg]
0.6
0.7
0.8
0.9
Figure 7.6: Posicion angular del brazo manipulador robotico controlado por linealizacion extendida para diferentes condiciones iniciales
x1 [rad]
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0
0.1
0.2
0.3
0.4
0.5
t [seg]
0.6
0.7
0.8
0.9
Figure 7.7: Posicion angular del brazo manipulador robotico para diferentes condiciones iniciales
usando una ley de control lineal
%u = -J*wn*wn*(x(:,1)-X)+c*sin(x(:,1)/N)+(B-2*J*xi*wn)*(x(:,2)-0);
% expresion vectorial de la ley de control lineal u
u = c*sin(X/N)-(J*wn*wn-c/N*cos(X/N))*(x(:,1)-X)+....
(B-2*J*xi*wn)*(x(:,2)-0);
Las respuestas del sistema controlado por el regulador lineal (7.55), para diferentes condiciones
iniciales, se muestran en la figura 7.7.
En este ejemplo tanto el controlador no lineal como el lineal tienen exito en estabilizar el sistema
alrededor de la posicion vertical desde posiciones significativamente lejanas de tal valor deseado de
equilibrio.
2iL
u
a x1
EXTENDIDA
160CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
cuyo punto de equilibrio en terminos de la distancia nominal b esta dado por, ver (1.33):
k(b L0 )(a b)
; X1 (b) = b; X2 (b) = 0
2iL
u = U (b) =
x 1
x 2
"
2iL
U (b)
(ab)2
1
0
#"
x1
x2
"
2iL
ab
donde:
x1 = x1 b; x2 = x2 ; u = u U (b)
Este modelo se puede escribir tambien como:
"
x 1
x 2
"
0
k a2b+L
ab
1
0
#"
x1
x2
"
0
2iL
ab
C=
0
2iL
ab
2iL
ab
= det C =
2iL
ab
6= 0
x 1
x 2
"
0i
0
k a2b+L
ab
1
2iL
2iL
ab k1 (b) ab k2 (b)
#"
x1
x2
p(s) = s2 + K2 (b)
2iL
a 2b + L0
2iL
s+ k
+ K1 (b)
ab
ab
ab
a 2b + L0
2iL
2iL
s+ k
+ K1 (b)
ab
ab
ab
2
= s + (a1 + a2 )s + a1 a2
p(s) = s2 + K2 (b)
es decir:
K1 (b) =
K2 (b) =
ab
a 2b + L0
a1 a2 k
2iL
ab
a1 + a2
(a b)
2iL
ab
a 2b + L0
a1 + a2
u =
a1 a2 k
x1
(a b)x2
2iL
ab
2iL
Debemos encontrar un controlador no lineal u = k(x) tal que, al linealizarlo alrededor del
punto de equilibrio, resulte precisamente en el controlador lineal que acabamos de dise
nar:
=
x1 [x1 =b,x2 =0]
=
x2 [x1 =b,x2 =0]
ab
a 2b + L0
a1 a2 k
2iL
ab
a1 + a2
(a b)
2iL
(7.56)
Ademas, el valor del control suministrado por este controlador no lineal, en condiciones de equilibrio,
debe satisfacer la siguiente condicion de contorno:
k(b L0 ) +
2iL
((b, 0)) = 0
ab
y, por lo tanto,
(b, 0) =
k(b L0 )(a b)
= U (b)
2iL
x1
x2
=
=
a x1
a 2x1 + L0
a1 a2 k
2iL
a x1
a1 + a2
(a x1 )
2iL
(x1 , x2 ) =
=
x1
a1 a2 x1
k
k(a b)(b L0 )
(a 1 )d1
[(a + L0 ) 21 ]d1
+ (x2 )
2iL b
2iL b
2iL
a1 a2
k
k
k(a b)(b L0 )
[(a x1 )2 (a b)2 ]
(a + L0 )(x1 b) +
(x21 b2 )
+ (x2 )
4iL
2iL
2iL
2iL
donde (x2 ) es una funcion arbitraria de x2 que procedemos a determinar gracias a la primera
ecuacion diferencial parcial de (7.56):
d
a1 + a2
(x2 ) =
(a x1 )
dx2
2iL
Integrando:
(x2 ) =
a1 + a2
(a x1 )x2 + M
2iL
EXTENDIDA
162CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
donde M es una constante arbitraria que determinamos a partir de la condicion de contorno para
(x1 , x2 ). Luego de algunas simplificaciones, el controlador u resulta en la siguiente expresion:
(x1 , x2 ) =
a x1
[a1 a2 (x1 b) + k(x1 L0 ) (a1 + a2 )x2 ]
2iL
7.4
Ejercicios Propuestos
J(a1 a2 )
x1 J(a1 + a2 )x2
1 + X2
con x1 = x1 X; x2 = x2 ; u = u.
(?)
(3amL 4L)(e1 + e2 )
3amLe1 e2 4Le1 e2 3g
x1
x2
3a
3a
(7.57)
la cual s
olo coincide hasta un primer orden de aproximaci
on con el controlador no lineal propuesto
por la linealizaci
on extendida.
Demostrar, mediante simulaciones computacionales, que las respuestas de ambos controladores
son significativamente diferentes para angulos relativamente grandes en la posicion inicial x1 (0) del
pendulo. De hecho, para valores iniciales que satisfagan la condicion x1 (0) > 0.8, el controlador
lineal no puede estabilizar el pendulo invertido mientras que el no lineal s lo hace. Se deja esta
verificacion como ejercicio de simulaci
on. Los parametros del sistema se muestran en la tabla 7.1.
(?)
Variable
m
M
2L
g
a = (m + M )1
163
Descripci
on
masa del pendulo
masa del carro
Longitud del pendulo
aceleracion de gravedad
constante auxiliar
Valor
2.0 Kgs
8.0 Kgs
1.0 m
9.8 m.s2
0.1
EXTENDIDA
164CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
Chapter 8
Observadores Din
amicos de Estado en
el Dise
no de Controles No Lineales
basados en Linealizaci
on Extendida
8.1
Introducci
on
EXTE
166CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
parameterizadas por el punto de operacion, tenga autovalores invariantes con respecto a
dicho punto de operacion, al menos localmente.
Considerese el sistema:
x = f (x(t), u(t))
y(t) = h(x(t))
cuyo punto de operacion constante esta dado por:
u(t) = U ; x(t) = X(U ); y(t) = h(X(U )) = Y (U )
Supondremos que la relacion funcional que se establece, en equilibrio, entre la entrada y
la salida, es tal que satisface:
dY (U )
6= 0
dU
Es decir, existe una familia continua de puntos de equilibrio en el espacio de salida que
se relaciona con el valor del control en equilibrio, cuando menos localmente.
Supondremos ademas que el sistema linealizado alrededor del punto de equilibrio dado
por:
x (t) = A(U )x (t) + B(U )u (t)
y (t) = C(U )x (t)
es tal que el par (C(U ), A(U )) es completamente observable (o en su defecto detectable).
Supondremos ademas que la matriz A(U ) es invertible alrededor del valor U .
Proponemos un observador no lineal de la forma:
x = f (
x(t), u(t)) + g(y(t)) g(
y (t))
y(t) = h(
x(t))
El punto de equilibrio de este observador para u(t) = U se obtiene de las ecuaciones:
f (
x(U ), U ) + g(Y (U )) g(Y (U )) = 0
Con el objeto de hacer compatible las funciones del observador con el valor asignado en
equilibrio al estado verdadero del sistema, supondremos que:
)) = Y (U ) = h(X(U )); X(U ) = X(U
)
Y (U ) = h(X(U
lo cual implica, en particular que la funcion g de ganancia no lineal del observador satisface
igualmente:
g(Y (U )) = g(Y (U ))
8.1. INTRODUCCION
167
f
d
f
x
[x (t) x (t)] =
dt
x X(U ),U
x X(U
),U
g
h
g
h
x +
x
y Y (U ) x X(U )
y Y (U ) x X(U
)
f
f
h
(x x
)
(x x )
x X(U ),U
y Y (U ) x X(U )
f
g
h
A(U ) =
;
G(U
)
=
;
C(U
)
=
x X(U ),U
y Y (U )
x X(U )
A continuacion, nuestro objetivo sera el de escoger la ganancia linealizada G(U ) de tal
forma que los autovalores de [A(U ) G(U )C(U )] se encuentren en el semiplano izquierdo
del plano complejo y que ademas sean independientes del valor de U ( si esto u
ltimo no
es enteramente posible, entonces, al menos, asegurarnos que la forma como varian tales
autovalores con respecto a U responda a una funcion previamente conocida o impuesta). Tal
escogencia de la ganancia linealizada G(U ) puede hacerse utilizando la formula de Bass-Gura
para el par de matrices traspuestas:(AT (U ), C T (U )). Es decir:
G(U ) = O1 (U )R1 (U )[d U ]T
donde :
C(U )
1
0
... 0
C(U )A(U )
1...
0
a1 (U )
; R(U ) =
...
O(U ) =
..
..
..
. 0
.
.
n2
(U )
C(U )A
an1 (U ) an2 (U ) . . . 1
C(U )An1 (U )
d = [1 . . . n ]; U = [a1 (U ) . . . an (U )]
EXTE
168CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
siendo d el vector fila compuesto por los coeficientes del polinomio caracterstico deseado
para la dinamica del error linealizado de estimacion y u el vector fila conformado por los
coeficientes del polinomio caracterstico de la matriz A(U ).
Puesto que dY (U )/dU 6= 0, el teorema de la funcion implcita asegura que de la igualdad
Y (U ) = y podemos obtener como solucion u
nica para U al valor dado por: U = Y 1 (y). El
valor de la ganancia linealizada debe provenir entonces de una ganancia no lineal g que debe
satisfacer:
g
G(U ) =
y y=Y (U )
Deshaciendo la substitucion indicada en la formula anterior obtenemos:
g
= G(Y 1 (y))
y
de donde, integrando respecto a y, obtenemos
g(y) =
=
Z y
Y
Z Y 1 (y)
U
G(U )
dY (U )
dU + G(Y (U ))
dU
dg(y)
dY (Y 1 (y)) d(Y 1 (y))
= G(Y 1 (y))
dy Y (U )
dU
dy
Y (U )
= G(U )
dy dU
= G(U )
dU dy
8.2
Ejemplos de aplicaci
on
8.2. EJEMPLOS DE APLICACION
169
x 1
x 2
"
0 0.5(1 + X 2 )
0
0
#"
x1
x2
"
1
J
y = x1
Un observador dinamico lineal del vector de estado incremental esta dado por:
"
x
1
x
2
"
0 0.5(1 + X 2 )
0
0
#"
x
1
x
2
"
1
J
"
u +
G1 (X)
G2 (X)
(y y )
y = x
1
donde G1 (X) y G2 (X) son ganancias dependendientes del punto de equilibrio deseado X, las cuales
se calculan de tal manera que el sistema lineal autonomo que gobierna el error de estimacion tenga
sus autovalores en el semiplano izquierdo.
En primer lugar, verificamos si el sistema linealizado es observable.
"
1
0
0 0.5(1 + X 2 )
O(X) =
e 1
e 2
"
G1 (X) 0.5(1 + X 2 )
G2 (X)
0
#"
e1
e2
Los modos que rigen esta dinamica se corresponden con las races del polinomio caracterstico
siguiente:
p(s) = s2 + G1 (X)s + 0.5(1 + X 2 )G2 (X)
Si deseamos que el error de estimacion linealizado responda de acuerdo a autovalores que asignamos libremente en el semiplano izquierdo del plano complejo, podemos igualar, termino a termino,
el polinomio anterior al siguiente polinomio caracterstico estandar de segundo grado:
pd (s) = s2 + 2n s + n2
Se obtiene, entonces,
G1 (X) = 2n ; G2 (X) =
2n2
1 + X2
x
1
x
2
"
0 0.5(1 + X 2 )
0
0
y = x
1
#"
x
1
x
2
"
0
1
J
"
u +
2n
2
2n
1+X 2
(y y )
EXTE
170CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
La pregunta clave del metodo de la linealizacion extendida sera la siguiente: Cual ha de ser el
observador no lineal cuya linealizacion alrededor del punto de equilibrio coincida con el observador
que acabamos de obtener?. Es decir, quienes deben ser las ganancias no lineales g1 (y) y g2 (y)
tales que el observador no lineal dado por:
x
1 = 0.5(1 + x
21 )
x2 + g1 (y) g1 (
y)
2 = 1 u + g2 (y) g2 (
y)
X
J
y = x
1
tenga por linealizacion el observador anteriormente dise
nado?. Es claro que los valores de equilibrio
del observador no lineal estan dados por:
x
2 (X) = x2 (X) = 0; x
1 (X) = x1 (X) = X; u = u(X) = 0
De tal forma que debe cumplirse entonces que:
g1
g2
2n2
=
2
;
=
n
y X
y X
1 + X2
(8.1)
1
x
2 =
u + 2n2 tan1 (y) tan1 (
y)
J
y = x
1
El observador no lineal responde al diagrama mostrado en la figura 8.1.
Recordemos que en la seccion anterior habamos dise
nado una ley de control realimentada no
lineal que estabilizaba al sistema al punto de equilibrio deseado. Esta ley de control no lineal era
la siguiente:
h
u = J(a1 + a2 )
x2 Ja1 a2 tan1 (
x1 ) tan1 (X)
8.2. EJEMPLOS DE APLICACION
- x 2 = 1 u
J
171
2 =
u- x
y = x1
x
1
y = x1 x
2
- 1 = 0.5(1 + x1 )x2 + 2n (y y)
1
u
J
x
2
y = x
1
Figure 8.1: Diagrama de bloques del observador dinamico de estados para el satelite mono-axial,
basado en linealizacion extendida
- x 2 = 1 u
J
y = x1
d 1-
y = x1 x
2
- 1 = 0.5(1 + x1 )x2 + 2n (y y)
2 =
u- x
1
u
J
x
2
d-
y = x
1
u = J(a1 + a2 )
x2 Ja1 a2 tan1 (
x1 ) tan1 (X)
Figure 8.2: Diagrama de bloques en lazo cerrado del sistema de control de un satelite, considerando un observador dinamico no lineal
con
x
1 = 0.5(1 + x
21 )
x2 + 2n (y y)
1
u + 2n2 tan1 (y) tan1 (
y)
x
2 =
J
y = x
1
El sistema en lazo cerrado se muestra en la figura 8.2.
Los programas siguientes permiten simular el comportamiento en lazo cerrado del sistema controlado por la ley de control no lineal sintetizada sobre la base de la operacion de un observador
dinamico no lineal. La respuesta del sistema dinamico se muestra en la figura 8.3.
Modelo:
%
%
%
%
%
%
%
%
ejext3.m
Ejemplo de simulacion numerica usando el metodo
de linealizacion extendida para el disen~o de un
observador no lineal:
El sistema representa un satelite mono-axial descrito por el
parametro de orientacion de Cayley-Rodrigues.
EXTE
172CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
%
%
%
%
%
%
%
%
%
%
%
%
Generaci
on de gr
aficas:
%
%
%
%
%
%
%
%
%
%
%
%
%
%
sejext3.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext3.m
El sistema es controlado mediante una realimentacion no lineal de estado
sintetizada mediante un observador no lineal
dise~nado mediante linealizacion extendida.
% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0 0.5 0.2];
% simulacion numerica
[t,x] = ode23(ejext3,t0,tf,x0);
% parametros
J=90;a1=0.4;a2=0.5; X=1.5;
xi=0.7; wn=0.8;
% ley de control
u = -J*a1*a2*(atan(x(:,3))-atan(X))-J(a1+a2)*x(:,4);
8.2. EJEMPLOS DE APLICACION
173
1.5
0.3
1
x2
x1
0.2
0.5
0.1
0
-0.5
0
0
10
20
30
t [seg]
-0.1
0
10
20
30
t [seg]
10
0
-10
-20
0
10
20
30
t [seg]
EXTE
174CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
y = x1
El punto de equilibrio se caracteriza genericamente mediante:
u = c sin
X
n
; x1 = X; x2 = 0
(8.2)
x 1
x 2
"
c
nJ
y = x1
0
1
cos(X) B
J
#"
x1
x2
"
1
J
x
1
x
2
"
#"
0
1
cos(X) B
J
c
nJ
x
1
x
2
"
"
u +
1
J
G1 (X)
G2 (X)
(y y )
y = x
1
El sistema que gobierna la dinamica del error de estimacion de las variables esta dado por:
"
e 1
e 2
"
G1 (X)
1
c
G2 (X) nJ
cos(X) B
J
#"
e1
e2
p(s) = s2 + G1 (X) +
B
c
X
s+
cos
J
nJ
n
+ G2 (X)
G1 (X) = 1 + 2
B
c
X
; G2 (X) = 1 2
cos
J
nJ
n
B
B2
(1 + 2 ) + 2
J
J
Debemos proponer un observador no lineal, cuya linealizacion coincida con el observador lineal
de la familia de sistemas linealizados, parametrizado por el punto de equilibrio que acabamos de
dise
nar como:
"
x
1
x
2
"
c
nJ
0
1
cos(X) B
J
#"
x
1
x
2
"
0
1
J
"
u +
1 2
c
nJ
1 +2 B
J
B
cos X
(
1 + 2 ) +
n
J
y = x
1
Tal observador no lineal estara dado, en forma general, por:
x
1 = x
2 + g1 (y) g1 (
y)
B
c
x
1
1
x
2 = x
2 sin
+ u + g2 (y) g2 (
y)
J
J
n
J
y = x
1
B2
J2
(y y )
8.2. EJEMPLOS DE APLICACION
175
La linealizacion de este observador no lineal, alrededor del punto de equilibrio del sistema
original, el cual tambien debe ser punto de equilibrio del observador, esta dado por:
"
x
1
x
2
"
c
nJ
0
1
cos(X) B
J
#"
x
1
x
2
"
u +
1
J
g1
y X
g2
y X
(y y )
y = x
1
Por lo tanto debe cumplirse las siguientes igualdades:
B g2
c
g1
X
= 1 + 2 ;
= 1 2
cos
y y=X
J y y=X
nJ
n
B
B2
(1 + 2 ) + 2
J
J
g1
B g2
c
y
= 1 + 2 ;
= 1 2
cos
y
J y
nJ
n
B
B2
(1 + 2 ) + 2
J
J
Integrando obtenemos :
B
B
B2
g1 (y) = 1 + 2
y; g2 (y) = 1 2 (1 + 2 ) + 2
J
J
J
c
y
sin
J
n
B
x
1 = x
2 + 1 + 2
(y y)
J
!
2
2 = B2 + 1 u + 1 2 B (1 + 2 ) + B (y y) c sin y
J
J
J
J2
J
n
y = x
1
Notese que el error de observacion, obtienido a partir de las ecuaciones diferenciales no lineales
de la planta y del observador, esta gobernado por el siguiente par de ecuaciones diferenciales
autonomas de naturaleza lineal:
e 1
e 2
B
e1 + e2
=
1 + 2
J
!
B
B2
B
=
1 2 (1 + 2 ) + 2 e1 e2
J
J
J
cuyos autovalores coinciden con las raices del siguiente polinomio caracterstico:
pcl (s) = s2 + (1 + 2 )s + 1 2 = pd (s)
El cual es identico al polinomio caracterstico que gobierna el error de estimacion del observador
del estado incremental linealizado.
EXTE
176CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Los estados del observador no lineal se utilizan en la conformacion de la ley de control no lineal
derivada en la seccion anterior. Tal ley de control rezara ahora de la manera siguiente:
u=
Jn2 (
x1
x
1
X) (2Jn B)
x2 + c sin
n
2iL
u
a x1
k(b L0 )(a b)
; X1 (b) = b; X2 (b) = 0; Y (b) = b
2iL
El controlador no lineal que estabiliza la posicion del conductor a su valor nominal estaba dado
por:
u = (x1 , x2 ) =
a x1
[a1 a2 (x1 b) + k(x1 L0 ) (a1 + a2 )x2 ]
2iL
Dise
naremos ahora un observador de estado no lineal que permita instrumentar la ley de control
anterior sobre la base de estimaciones del vector de estado. Es decir:
u = (
x1 , x
2 ) =
ax
1
[a1 a2 (
x1 b) + k(
x1 L0 ) (a1 + a2 )
x2 ]
2iL
La linealizacion del sistema alrededor del punto de equilibrio esta dada por:
"
x 1
x 2
"
0
k a2b+L
ab
1
0
#"
x1
x2
y = x1
La observabilidad se establece a partir de:
"
O=
1 0
0 1
; detO = 1 6= 0
"
0
2iL
ab
8.2. EJEMPLOS DE APLICACION
177
x
1
x
2
"
0
k a2b+L
ab
1
0
#"
x
1
x
2
"
2iL
ab
"
u +
G1 (b)
G2 (b)
(y y )
y = x
1
El error de estimacion incremental debera satisfacer la siguiente ecuacion dinamica
"
e 1
e 2
"
Gh1 (b)
i 1
a2b+L0
G2 (b) k ab
0
#"
e1
e2
a un polinomio caracterstico deseado, cuyas raices estan en el semiplano izquierdo del plano complejo:
pd (s) = s2 + 2n s + n2
obtenemos las ganancias requeridas del observador lineal:
G1 (b) = 2n ; G2 (b) = n2 k
a 2b + L0
ab
x
1
x
2
"
0
k a2b+L
ab
1
0
#"
x
1
x
2
"
0
2iL
ab
"
u +
2n
2
0
n k a2b+L
ab
(y y )
y = x
1
Este observador lineal debe representar la linealizacion, alrededor del punto de equilibrio, del
siguiente observador dinamico no lineal de estado del sistema original:
x
1 = x
2 + g1 (y) g1 (
y)
2iL
x
2 = k(
x1 L0 ) +
+ g2 (y) g2 (
y)
ax
1
y = x
1
para lo cual debe cumplirse que:
g1 (y)
g2 (y)
a 2b + L0
= 2n ;
= n2 k
y y=b
y y=b
ab
Estas relaciones son ciertas cuando tambien se satisfacen las siguientes relaciones:
g1 (y)
g2 (y)
a 2y + L0
= 2n ;
= n2 k
y
y
ay
EXTE
178CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Integrando ambas ecuaciones tenemos:
g1 (y) = 2n y; g2 (y) = (n2 2k)y k(a L0 )Ln(a y)
El observador dinamico no lineal esta entonces dado por:
x
1 = x
2 + 2n (y y)
ay
2iL
+ (n2 2k)(y y) k(a L0 )Ln
x
2 = k(
x1 L0 ) +
ax
1
a y
y = x
1
El diagrama de bloques correspondiente al sistema en lazo cerrado estara dado por:
Los siguientes graficos demuestran el comportamiento del sistema en lazo cerrado:
El programa utilizado para hacer las simulaciones anteriores se muestra a continuaci
on.
8.3
Ejercicios Propuestos
8.4
Lecturas Recomendadas
Chapter 9
Dise
no de Compensadores No lineales
G() mediante Linealizaci
on Extendida
180CHAPTER 9. DISENO
cial. No utilizaremos el metodo de Ziegler-Nichols basado en los parametros de la respuesta
escalon, por cuanto es mucho mas dificil obtener estos parametros en forma analtica parametrizada. El metodo frecuencial permite encontrar de una forma sistematica y analtica
mas directa los elementos del diagrama de Nyquist sobre los que se basa el calculo de los
parametros del controlador, P, P I o P ID.
El metodo que expondremos solo se aplica a sistemas de una sola entrada y una salida.
Supoongase que tenemos un sistema no lineal, n-dimensional, de una entrada y una salida
dado por:
x(t)
= f (x(t), u(t))
y = h(x(t))
Sea u(t) = U un punto de operacion constante para la entrada escalar del sistema anterior.
Correspondiente con este valor nominal de la entrada tenemos un valor de equilibrio para
el vector de estado y de la salida, dados respectivamente por: x(t) = X(U ) y y(t) = Y (U ).
Supondremos que Y (U ) es una funcion continua de U cuya derivada dY (U )/dU es no nula.
Podremos ocasionalmente parametrizar el punto de equilibrio para el control en base a un
valor deseado de la salida y(t) = Y mediante una expresion de la forma: U = U (Y ).
La expresion linealizada del sistema alrededor del punto de operacion generico (U, X(U ), Y (U )),
parametrizada en terminos del valor constante de la entrada de control en equilibrio, esta
dada por:
x = A(U )x + B(U )u
y = C(U )x
con:
f (x, u)
f (x, u)
h(x)
A(U ) =
; B(U ) =
; C(U ) =
x X(U ),U
u X(U ),U
x X(U ),U
y:
x = x X(U ); u = u U ; y = y Y (U )
De esta representacion del sistema linealizado podemos obtener la funcion de transferencia
del sistema en lazo abierto, parametrizada por el valor U , de la manera siguiente:
GU (s) = C(U )[sI A(U )]1 B(U )
9.1
Dise
no de reguladores del tipo P, PI y PID mediante Linealizaci
on Extendida
Par
ametro Kp
0.5K0 (U )
0.45K0 (U )
0.6K0 (U )
Par
ametro TI
0.83P0 (U )
0.5P0 (U )
Par
ametro TD
0
0
0.125P0 (U )
K0 (U ) =
1
CU (s) = Kp (U ) 1 +
+ TD (U )s
TI (U )s
K2 (U )
+ K3 (U )s
s
La siguiente tabla muestra los diferentes valores parametricos recomendados por el metodo
de Ziegler-Nichols, para determinacion de los dise nos de compensador lineal del tipo P, P I
y P ID. Estos valores determinan las constantes de los compensadores que regulan eficientemente a toda la familia de sistemas lineales parametrizada por el punto de equilibrio.
En terminos de los parametros K1 (U ), K2 (U ) y K3 (U ) la tabla anterior se reescribe como:
182CHAPTER 9. DISENO
Controlador
P
PI
P ID
Par
ametro K1
0.5K0 (U )
0.45K0 (U )
0.6K0 (U )
Par
ametro K2
0
0.54K0 (U )
P0 (U )
1,2K0 (U )
P0 (U )
Par
ametro K3
0
0
0.075K0 (U )P0 (U )
de
dt
donde:
e = 0 y = y
Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la
forma:
u = K1 (U )e + K2 (U )
Z t
0
e ()d + K3 (U )
de (t)
dt
= k2 (z(t))e(t)
u(t) = z(t) + k1 (z(t))e(t) + k3 (z(t))
de(t)
dt
La variable z(t) juega el papel del estado del compensador dinamico no lineal. Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la forma
Z t
0
k2 (z())e()d + k3 (z(t))
de(t)
dt
que en efecto representa una generalizacion, de tipo no lineal, del controlador clasico P ID.
El punto de equilibrio del controlador P ID no lineal esta dado, evidentemente,por e = 0
y z(U ) = U .
La linealizacin del regulador no lineal, alrededor de su punto de equilibrio, arroja el
siguiente resultado:
z = k2 (U )e
u = z + k1 (U )e (t) + k3 (U )
de (t)
dt
184CHAPTER 9. DISENO
donde x1 representa la corriente normalizada promedio de entrada a la bobina del convertidor,
x2 es el voltaje normalizado promedio de salida del condensador del convertidor, b es el valor
numerico, positivo, de una fuente externa de voltaje constante y la variable de control u representa
la llamada relaci
on de trabajo del conmutador electronico, sintetizado mediante transistores ( los
valores numericos de u satisfacen la siguiente relacion de saturacion 0 < u < 1). Las constantes
1 y 2 reciben el nombre, respectivamente, de constante de tiempo del circuito RC de salida y
frecuencia natural de oscilaci
on del circuito LC de entrada.
El convertidor tiene por punto de equilibrio para una relacion de trabajo constante u = U los
siguientes valores constantes de corriente y voltaje normalizados promedio:
u = U ; X1 (U ) =
b
b1
; X2 (U ) =
2
0 (1 U )
U)
02 (1
x 1
x 2
"
0
0 (1 U )
0 (1 U )
1
#"
x1
x2
"
y = x2
b
1U
b1
0 (1U )2
b
X1 (U )
+ 02 (1
s
s2 + 1 s
U )2
Para valores numerico tpicos, que daremos mas adelante, la funcion de transferencia anterior
tiene el siguiente grafico de Nyquist.
La forma particular del grafico es indicativa de que podemos aplicar el metodo de ZieglerNichols, basado en la respuesta frecuencial, para el dise
no de un controlador P I.
Calculamos la funcion de transferencia para s = j y obtenemos:
GU (s) =
=
b
2
2
2
X1 (U ) ([0 (1 U ) ]
0 X1 (U ) 2
= 0 X1 (U )
0 (1
j1
[02 (1 U )2 2 ]2 + (1 )2
h
i
1b
[02 (1 U )2 2 ] X1b(U ) 2 1
[02 (1 U )2 2 ] + X
1 (U )
0 X1 (U )
j
X
(U
)
0 1
[02 (1 U )2 2 ]2 + (1 )2
[02 (1 U )2 2 ]2 + (1 )2
b
X1 (U )
U )2 2 +
j1 )
En consecuencia:
Im GU (j) = j0 X1 (U )
1 b
X1 (U )
(1 )2
[02 (1 U )2 2 ] +
[02 (1
U )2
2 ]2
= j0 X1 (U )
[02 (1
202 (1 U )2 2
U )2 2 ]2 + (1 )2
La parte
imaginaria del grafico de Nyquist se hace cero en = 0; = y tambien en
0 (U ) = 20 (1 U )
j 20 (1 U ) X1b(U )
2
2
2
2
20 (1 U ) + j1 20 (1 U ) + 0 (1 U )
v
u
u
t
= 0 X1 (U )
v
u
4 (1U )4
u
+
u 202 (1 U )2 + 0 2
1
= 0 X1 (U )t 4
0 (1 U )4 + 212 02 (1 U )2
02 (1 U )2 + j1 20 (1 U )
202 (1
U )2
b2
X12 (U )
0 X1 (U )
b
=
1
0 (1 U )
El perodo u
ltimo y la ganancia u
ltima resultan ser entonces, en este caso:
2
2
0 (1 U )2
P0 (U ) =
=
; K0 (U ) =
0 (U )
0 (1 U )
b
De acuerdo con los valores de la tabla, las ganancias del controlador P I para el sistema linealizado estan dadas por:
K1 (U ) =
0.450 (1 U )2
2 (1 U )3
; K2 (U ) = 0.54 0
b
2b
Es inmediato entonces obtener la estructura del controlador no lineal P I cuyo estado designamos
mediante z(t):
"
z(t)
2 (1 z(t))3
0.54 0
e(t)
2b
"
0 (1 z(t))2
u
(t) = z(t) + 0.45
e(t)
b
donde:
e(t) = Z2 (U ) z2 (t)
El esquema final involucra la delimitacion de la se
nal de control generada por el controlador no
lineal del tipo P I, de acuerdo a un saturador que impide que esa se
nal tome valores inferiores a 0 o
superiores a 1. Por esta razon aparece en el diagrama de bloques siguiente un limitador con estas
caractersticas:
El siguiente programa simula la respuesta en lazo cerrado del convertidor Boost promedio cuyos
parametros se escogieron como:
0 = 1.811e3; 1 = 1.6667e3; b = 106.066; U = 0.8;
con un valor de equilibrio para el voltaje normalizado promedio de:
X2 (0.8) = 0.3354.
186CHAPTER 9. DISENO
La grafica siguiente muestra una respuesta del voltaje normalizado promedio del sistema controlado.
c
1
x1 + u
A
A
c
c
xi +
xi1 ; i = 2, 3, . . . , n
A
A
y = xn
U2
U2
; i = 1, 2, . . . , n; y(U ) = Y (U ) = 2
2
c
c
El modelo linealizado del sistema dinamico, alrededor de este punto de equilibrio generico, esta
dado por :
c2
1
x1 + u
2AU
A
c2
c2
=
xi +
x
; i = 1, . . . , n
2AU
2AU (i1)
x 1 =
x i
donde :
xi = xi Xi (U ) = xi
U2
U2
;
u
=
u
U
;
y
=
y
c2
c2
Tomando transformadas de Laplace de cada una de las ecuaciones diferenciales lineales anteriores, as como en la ecuacion de salida, obtenemos:
x1 (s) =
1 u (s)
c2
A s + 2AU
c2 x(i1) (s)
; i = 2, . . . , n
c2
2AU s + 2AU
yn (s) = xn (s)
xi (s) =
GU (s) =
donde :
1
K=
A
c2
2A
!n1
; =
c2
2A
K/U n1
=
(j0 (U ) + /U )n
ntan
0 (U )
= 0 (U ) = tan
/U
U
n
El perodo u
ltimo es entonces:
P0 (U ) =
U
2
=
0 (U )
tan n
K/U n1
K/U n1
q
|GU (j0 (U ))| =
=
(j0 (U ) + /U )n
2 (U ) + ( /U )2
0
hq
K/U n1
( /U )2 tan2
+ ( /U )2
in =
KU
n secn
La ganancia u
ltima esta dada entonces por:
n secn
K0 (U ) =
KU
Las ganancias del controlador P ID lineal que estabiliza la familia de sistemas linealizados
parametrizados por el punto de equilibrio se obtienen de la tabla anterior y resultan ser:
0.6 n
KU 2
0.15 n1 secn
; K3 (U ) =
Ktan n
188CHAPTER 9. DISENO
Es inmediato entonces obtener el controlador no lineal del tipo P ID. Este esta dado por:
=
e(t);
Kz 2 (t)
0.15 n1 secn n de(t)
0.6 n
n
u(t) = z(t) +
sec
e(t) +
Kz(t)
n
Ktan n
dt
donde:
e(t) = Y (U ) y(t) = Xn (U ) xn (t) =
U2
xn (t)
c2
9.2
EXTENDIDA189
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
Proponemos un esquema de compensacion general de la misma forma que el esquema
lineal. La generalidad se debe a que especificaremos cada uno de los bloques compensadores
dinamicos como un sistema n 1 dimensional no lineal de tipo general, cuyas salidas pueden
exhibir dependencia de la entrada. Tales subsistemas compensadores seran de la forma:
zu = u (zu , u); zy = y (zy , y);
yu = u (zu , u); yy = y (zy , y)
Estos sistemas compensadores se arreglan, en interconexion, de acuerdo al siguiente esquema general controlador-observador:
El conjunto de ecuaciones que conforman el sistema en lazo cerrado, sobre las cuales
ejerceremos el proceso de linealizacion, estan dadas por el siguiente conjunto de 3n 2
ecuaciones diferenciales:
zu =
zy
y =
u =
f (x(t), u(t))
u (zu , u)
y (zy , y)
h(x(t))
u (zu , u) + y (zy , y)
donde:
u (Zu (U ), U ) = 0
La funcion de transferencia de la linealizacion de este subsistema alrededor del punto de
equilibrio esta dada por:
yu (s)
u
u
sI
= Hu (U, s) =
u (s)
zu Zu (U ),U
zu Zu (U ),U
u
u
u Zu (U ),U
u Zu (U ),U
Supongamos, mas a
un, que la funcion de transferencia Hu (U, s) tiene la siguiente expresion explcita:
nu(n1) (U )sn2 + nu(n2) (U )sn3 + . . . + nu2 (U )s + nu1 (U )
yu (s)
= Hu (U, s) =
+ nun (U )
u (s)
sn1 + n1 sn2 + . . . + 2 s + 1
190CHAPTER 9. DISENO
De comparar esta expresion con la expresion linealizada surge inmediatamente la identificacion siguiente:
nun (U ) =
u Zu (U ),U
Con el objeto de continuar el proceso de identificacion haremos ahora una simplificacion
drastica e importante, pero que no conlleva perdida de generalidad, la cual es suponer una
estructura lineal en forma canonica compa
nera para la funcion vectorial u (zu , u). Esto
se corresponde con la idea de obtener realizaciones en espacio de estado del compensador
linealizado en forma canonica de la controlabilidad. Esto permite identificar la funcion de
salida del bloque compensador como una funcion no lineal haciendo, por tanto, todo el
bloque compensador de naturaleza no lineal. En efecto, supongamos entonces que u (zu , u)
es de la forma:
zu2
zu3
..
.
u (zu , u) =
0
0
..
.
+
0
Puesto que:
0
0
..
.
= bu =
u (zu , u)
zu
"
#
(z , u)
u (zu , u) u (zu , u)
u (zu , u)
u u
=
...
;
zu
zu1
zu2
zu(n1)
= Au (U ) =
u (zu , u)
zu
0
0
..
.
1
0
..
.
0
1
..
.
...
...
...
0
0
..
.
0
0
0 ...
1
1 2 3 . . . n1
u (zu ,u)
zu(n1)
u
u
sI
zu Zu (U ),U
zu Zu (U ),U
!
n2
s
Zu (U ),U
u (zu ,u)
zu(n2)
sn1 + n1
Zu (U ),U
n2
s
+ ...
n3
+ ... +
+ 2 s + 1
u Zu (U ),U
u (zu ,u)
zu1
Zu (U ),U
EXTENDIDA191
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
Comparando esta u
ltima expresion con la parte de la funcion de transferencia a que se
corresponde obtenemos las siguientes relaciones:
(z
,
u)
u
u
zui
= nui (U ); i = 1, 2, . . . , n 1
Zu (U ),U
zu2 (U )
zu3 (U )
...
1 zu1 (U ) 2 zu2 (U ) . . . n1 zu(n1)(U )
0
0
...
0
U
en consecuencia:
zu1 (U ) =
U
1
De esta igualdad podemos encontrar base suficiente para suponer que esta relacion es
una particularizacion de una relacion semejante que es valida en condiciones arbitrarias,
diferentes a las de equilibrio. Es decir:
zu1 =
U
u = 1 zu1
1
Podemos ahora, sin mayores dificultades, proponer que el conjunto de relaciones dadas
por:
u (zu , u)
= nui (U ); i = 1, 2, . . . , n 1
zui Zu (U ),U
surge, en realidad, del siguiente conjunto de ecuaciones en derivadas parciales:
u (zu , u)
= nui (1 zu1 ); i = 1, 2, . . . , n 1
zui
De estas relaciones obtenemos, inmediatamente, como solucion posible para la funcion
no lineal de salida, u , lo siguiente:
u (zu , u) = (zu1 , u) + nu2 (1 zu1 )zu2 + nu3 (1 zu1 )zu3 + . . . + nu(n1) (1 zu1 )zu(n1)
192CHAPTER 9. DISENO
Donde (zu1 , u) es una funcion arbitraria de las variables zu1 y u, que tiene la forma
siguiente, como es facil verificar:
Z u
1
1
nun () + nu1 () d
(zu1 , u) = nu1 (1 zu1 )zu1 nu1 (1 zu1 )u +
1
1
0
En efecto:
u (zu , u)
(zu , u)
1
1
=
= nu1 (1 zu1 ) + nun (u) + nu1 (u) = nun (u)
u
u
1
1
y
nu1 (1 zu1 )
1 nu1 (1 zu1 )
(zu1 , u)
= nu1 (1 zu1 ) +
u = nu1 (1 zu1 )
zu1
zu1
1
zu1
En resumen, el compensador no lineal que conforma el lazo mas interior estara dado por
el siguiente sistema lineal con funcion de salida no lineal dados por:
zu1 = zu2
zu2 = zu3
..
.
zu(n2) = zu(n1)
zu(n1) = 1 zu1 2 zu2 . . . n1 zu(n1) + u
yu = nu1 (1 zu1 )zu1 + nu2 (1 zu1 )zu2 + . . . + nu(n1) (1 zu1 )zu(n1)
Z u
1
1
nu1 (1 zu1 )u +
nun () + nu1 () d
1
1
0
En condiciones de equilibrio tenemos que yu satisface:
yu (U ) =
Z U
0
Z U
1
nun () + nu1 () d =
Hu (, 0)d
1
0
y
y
yy (s)
sI
= Hy (Y, s) =
y (s)
zy Zy (Y ),Y
zy Zy (Y ),Y
=
y
y
y Zy (Y ),Y
y Zy (Y ),Y
EXTENDIDA193
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
La forma de este compensador estara dada por:
zy1 = zy2
zy2 = zy3
..
.
zy(n2) = zy(n1)
zy(n1) = 1 zy1 2 zy2 . . . n1 zy(n1) + y
yy = ny1 (1 zy1 )zy1 + ny2 (1 zy1 )zy2 + . . . + ny(n1) (1 zy1 )zy(n1)
Z y
1
1
nyn () + ny1 () d
ny1 (1 zy1 )y +
1
1
0
En condiciones de equilibrio yy satisface:
yy (Y ) =
Z Y
0
Z Y
1
nyn () + ny1 () d =
Hy (, 0)d
1
0
El diagrama de bloques del esquema compensador demanda entonces que debe ser cierta
la siguiente relacion de equilibrio:
yu (U ) yy (Y ) + V = yu (U ) yy (Y (U )) + V = U
de donde, la se
nal constante de referencia que es necesario suministrar para producir el
equilibrio deseado debera cumplir:
V = yu (U ) + yy (Y (U )) + U
Completaremos ahora el ejemplo del manipulador robotico, proponiendo el dise
no de un
regulador no lineal del tipo controlador-observador para este sistema.
Ejemplo 9.3: Compensador no lineal del tipo controlador-observador para un manipulador rob
otico (continuaci
on)
Las realizaciones en espacio de estado de los compensadores estabilizantes del sistema linealizado
alrededor del punto de equilibrio resultaron ser:
zu = zu + u ; yu = 2n
zy = zy + y
yy = 2n
B
J
c
Y
cos
n
n
B
zu
J
+ J
B
J
zy + J n2 +
B
J
2n
B
J
c
Y
cos
nJ
n
Observamos inmediatamente que el controlador del lazo mas interno es independiente del punto
de operacion. Por lo tanto esta parte del compensador estara constituida por un sistema lineal cuya
funcion de salida es tambien lineal:
zu = zu + u; yu = 2n
B
zu
J
194CHAPTER 9. DISENO
Usando el procedimiento expuesto anteriormente podemos escribir el compensador no lineal
mas externo de la manera siguiente:
zy = zy + y
B
2n
J
c
zy
B
1
B
c
zy
B
yy =
cos
+ J
zy +
2n
cos
+ J
y
n
n
J
J
n
n
J
Z y
B
B
c
1
B
c
B
2
+
J n +
2n
cos
2n
cos
+ J
d
J
J
nJ
n
J
n
n
J
0
Resolviendo la integral y simplificando obtenemos:
B
c
zy
B
y
1
B
y
yy = 2n
cos
+ J
zy
+ Jn2 y c 1 +
2n
sin
J
n
n
J
J
n
De la condicion de equilibrio obtenemos:
2
1 U
V = nJn sin
= Jn2 Y
n
El siguiente diagrama de bloques ilustra la disposicion del esquema de compensacion no lineal
Los graficos siguientes muestran la respuesta del brazo controlado por el regulador no lineal del
tipo controlador-observador que hemos derivado en este ejemplo:
El programa utilizado en la generacion de los graficos anteriores se muestra a continuacion.
c x23
m x1
R
1
x 3 = x3 + u
L
L
y = x1
Siendo el punto de equilibrio parametrizado por la corriente de entrada constante U :
c U2
U
; x2 (U ) = 0; x3 (U ) = X3 (U ) =
2
mg R
R
Linealizando el sistema alrededor del punto de equilibrio generico se obtiene:
u = U ; x1 (U ) = X1 (U ) =
x 1 = x2
mg 2 R2
2gR
x 2 =
x1
x3
2
cU
U
R
1
x 3 = x3 + u
L
L
y = x1
EXTENDIDA195
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
y la funcion de transferencia del sistema linealizado, parametrizada en terminos de la corriente de
entrada U es:
GU (s) =
NG (U, s)
=
DG (U, s)
s2
2gR
LU
mg 2 R2
cU 2
s+
R
L
s3 +
R 2
Ls
2gR
LU
mg 2 R2
s
cU 2
mg 2 R3
cLU 2
Nu (U, s)
nu2 (U )s + nu1 (U )
+ nu3 (U )
=
C(s)
s2 + 2 s + 1
nu3 (U )s2 + [2 nu3 (U ) + nu2 (U )]s + [1 nu3 (U ) + nu1 (U )]
s2 + 2 s + 1
Ny (Y, s)
ny2 (Y )s + ny1 (Y )
=
+ ny3 (Y )
C(s)
s2 + 2 s + 1
ny3 (Y )s2 + [2 ny3 (Y ) + ny2 (Y )]s + [1 ny3 (Y ) + ny1 (Y )]
s2 + 2 s + 1
2gR
LU
2gR
LU
NG (U, s)
=
= 3
D(U, s)
(s + )(s2 + 2n s + n2 )
s + (2n + )s2 + (2n + n2 )s + n2
FU (s) =
mg 2 R2
mg 2 R3
R
s
(s + 2 s + 1 ) s + s2
2
L
cU
cLU 2
2
R
mg 2 R2
mg 2 R3
+ [nu3 (U )s + (2 nu3 (U ) + nu2 (U ))s + (1 nu3 (U ) + nu1 (U ))] s + s2
s
L
cU 2
cLU 2
2gR
[ny3 (Y )s2 + (2 ny3 (Y ) + ny2 (Y ))s + (1 ny3 (Y ) + ny1 (Y ))]
LU
2
Nu (U, s)
C(s)
2n +
R
L
s + (2n + n2 ) + 2 (2n + )
R
L
2n +
2 R
L +
mg 2 R2
cU 2
s2 + 2 s + 1
Ny (U, s)
C(s)
mgRL
R
R
LU
ny2 (U )s + ny1 (U )
2
2 + 2n +
+ (2n + n )
2
2
s + 2 s + 1
2cU
L
L
2gR
Hy (U, s) =
=
R
L
R
LU
R R2
+ (2n + ) 2 1
+ 1 2 + 2
L
2gR
L
L
U
n2 LU
2g
2gR
196CHAPTER 9. DISENO
Ejercicio: Completar los pasos de dise
no del controlador no lineal iniciado.
x1 (U ) =
1
U
; x2 (U ) =
1 +
1 + Da1
2Da2
Y (U ) =
U
1
+
1 +
1 + Da1 2Da2
"
4Da1 Da2 U
1+
1 + Da1
4Da1 Da2 U
1+
1 + Da1
x 2 = Da1 x1
1+
4Da1 Da2 U
x2
1 + Da1
y = x1 + x2
La funcion de transferencia del sistema linealizado se obtiene directamente de las ecuaciones
diferenciales lineales anteriores como:
q
a1 Da2 U
1 + 4D1+D
y (s)
NG (U, s)
a1
q
= GU (s) =
=
4Da1 Da2 U
u (s)
DG (U, s)
(s + 1 + Da1 ) s + 1 + 1+Da1
s + Da1 +
197
q
s + Da1 +
s2 + 1 + Da1 +
1+
1+
4Da1 Da2 U
1+Da1
4Da1 Da2 U
1+Da1
s + (1 + Da1 ) 1 +
4Da1 Da2 U
1+Da1
"
(s + ) s + 1 + Da1 +
4Da1 Da2 U
4Da1 Da2 U
1+
s + (1 + Da1 ) 1 +
1 + Da1
1 + Da1
(
"
+
s
4Da1 Da2 U
4Da1 Da2 U
1+
s + (1 + Da1 ) 1 +
1 + Da1
1 + Da1
4Da1 Da2 U
1+
1 + Da1
(s + )(s2 + 2n + n2 )
De la identificacion, termino a termino, de ambos polinomios en la identidad anterior, surgen los siguientes valores para las incognitas que conforman los numeradores de las funciones de
transferencia de los bloques compensadores:
no iniciado.
Ejercicio: Completar el dise
9.3
Ejercicios Propuestos
9.4
Lecturas Recomendadas
198CHAPTER 9. DISENO
Part III
El M
etodo de la Linealizaci
on Exacta
199
Chapter 10
M
etodo de Control Calculado
202
10.1
El m
etodo del Control Calculado: Ejemplos
10.1.1
(10.1)
donde la variable de control u deba ser, necesariamente, positiva. La Figura 10.1 representa el
sistema no lineal mediante un diagrama de bloques.
A primera vista este sistema solo exhibe no linealidades en la ecuacion donde aparece la variable
de control y del diagrama de control la cadena de dos integradores nos sugiere una estructura
prevalecientemente lineal. Estos hechos pudieran ayudarnos enormemente, si por un momento nos
atrevemos a pensar de que manera pudieramos destruir o reemplazar por linealidades las no
linealidades presentes en el sistema, mediante la especificacion apropiada de la variable de control
u. En efecto, si definimos una entrada auxiliar v como:
g
v = sen (x1 ) + u sen (x1 ) cos(x1 )
a
(10.2)
10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS
x2
203
x1
(10.3)
De hecho, el sistema se ha reducido simplemente a dos integradores dispuestos en cascada, tal como
se muestra en la Figura 10.2.
x2
x1
(10.4)
(10.5)
(10.6)
CHAPTER 10. METODO
DE CONTROL CALCULADO
204
es decir:
u =
=
g
1
v sen (x1 )
sen (x1 ) cos(x1 )
a
1
g
2
2n x2 n (x1 X) sen (x1 )
sen (x1 ) cos(x1 )
a
(10.7)
(10.8)
La relacion (10.8) puede verse como una transformacion de la coordenada del control
u que depende de las componentes del estado. Es decir, mediante una redefinicion de la
variable de control en terminos de la variable original y operaciones no lineales sobre las
componentes del estado obtenemos un nuevo canal de control y desde el cual el sistema luce
perfectamente lineal. Esto nos dice que hemos encontrado una nueva forma de representar
la accion de control, representada por v, desde donde el sistema exhibe un comportamiento
perfectamente lineal sin aproximaciones de ning
un tipo. Tal transformacion tiene entonces
la enorme virtud de eliminar las no linealidades presentes en el sistema de una manera limpia
y tajante, sin acudir a aproximaciones de genero alguno.
El metodo que acabamos de describir recibe el nombre de Metodo del Control Calculado
y fue conocido y difundido ampliamente por quienes trabajaban en el area de robotica (por
ello en algunos libros aparece con el nombre de Metodo del Torque Calculado). La razon de
este nombre se explica inmediatamente del ejemplo presentado, si en lugar del procedimiento
anterior hubiesemos procedido a comparar directamente las ecuaciones (10.1) y (10.5). Es
evidente que la dinamica deseada en (10.5) se obtiene de igualar, en ambas expresiones, los
miembros derechos de las ecuaciones diferenciales y proceder luego a calcular el control
necesario que convierte a (10.1) en (10.5).
Nuestra alegra quizas puede verse empa
nada por un hecho significativo: la posibilidad
de una singularidad en la definicion del control. Esta surge por la indefinicion del control
cuando la variable x1 adopta los valores:
x1 = 0,
, , etc.
2
Notese que para tales valores singulares, el sistema pierde el canal de control pues el
factor que precede a u en (10.1) se hace cero justamente en estos valores. Desde el punto
de vista fsico era de esperar ciertos problemas de controlabilidad cuando la posicion del
anillo adopta tales valores. Ciertamente, si el anillo se encuentra perfectamente ubicado en
la posicion mas baja del aro, la velocidad de rotacion del aro no afecta para nada la posicion
del anillo sobre el aro. Lo mismo sucede cuando este se encuentra girando describiendo un
crculo de radio maximo o en la posicion superior del aro. Esto implica que la poltica de
control linealizante (10.8) tiene ciertas restricciones y que, sin lugar a dudas, su aplicacion
puede llevar a una indefinicion de la accion de control (haciendola infinitamente grande por
ejemplo) si la trayectoria del sistema se acerca a tales singularidades. Es muy dificil en
10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS
205
general, saber si para ciertas condiciones iniciales dadas, las trayectorias del sistema, en
respuesta a la ley de control antes especificada, habra de acercarse a una singularidad o no.
Los siguientes programas, sarole.m y arole.m, permiten simular el comportamiento
controlado del sistema no lineal del Ejemplo 10.1, sujeto a la ley de control linealizante
c
(10.8) restringida a valores positivos. Para ejecutar en Matlab
> sarole
%
%
%
%
%
%
%
%
%
sarole.m
Programa de simulacion del sistema
que describe el movimiento de un anillo sobre
un aro giratorio, controlador por una ley
de realimentacion no lineal la cual linealiza
en forma exacta al sistema en lazo cerrado.
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/04/97
% Parametros de simulacion
ti = 0;
tf = 1;
% Parametros del sistema
global a g X1e wn xi
a = 0.2;
g = 9.8;
X1e = 0.7854;
wn = 12.83;
xi = 0.707;
% Condiciones iniciales
x0 = [0.1 0];
% Simulacion
[t,x] = ode23(arole,ti,tf,x0);
% Ley de control
uc = (-2*xi*wn*x(:,2)-wn^2*(x(:,1)-X1e)+g/a*sin(x(:,1)))./...
(sin(x(:,1)).*cos(x(:,1)));
u = zeros(size(t));
for j = 1:length(t)
if uc(j)<0
u(j)=0;
else
u(j) = uc(j);
end
end
% graficas
subplot(221),plot(t,x(:,1))
title(Posicin angular del anillo sobre el aro)
xlabel(t (seg))
ylabel(x1)
subplot(222),plot(t,x(:,2))
title(Velocidad angular del anillo)
xlabel(t (seg))
ylabel(x2)
subplot(223),plot(t,u)
title(Cuadrado de la velocidad angular del aro)
xlabel(t (seg))
ylabel(u)
subplot(224),plot(t,sqrt(u))
CHAPTER 10. METODO
DE CONTROL CALCULADO
206
0.8
x2
x1
0.6
2
0.4
0
0.2
0
0
0.5
t (seg)
-2
0
0.5
t (seg)
1000
20
500
10
0
0
0.5
t (seg)
0
0
0.5
t (seg)
En la Figura 10.3 se muestra la respuesta del anillo controlado, el cual se desea estabilizar
a la posicion de X = 0.7854 [rad]. Partiendo de una condicion inicial cercana a la singularidad (x1 = 0.1) se obtiene un valor del cuadrado de la velocidad angular del aro (control)
significativamente alto. El mismo resultado se obtiene a medida que la condicion inicial se
acerca al valor singular x1 = /2 = 1, 57079 . . ..
La Figura 10.4 muestra un conjunto de trayectorias de la posicion angular del anillo sobre
10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS
207
1.2
x1 [rad]
0.8
0.6
0.4
0.2
0
0.1
0.2
0.3
0.4
0.5
t (seg)
0.6
0.7
0.8
0.9
Figure 10.4: Posicion angular del anillo para diferentes condiciones iniciales
el aro para distintas condiciones iniciales. Presentamos a continuacion, en la Figura 10.5,
las trayectorias correspondientes a la variable de control u.
(10.9)
B
c
x2 sen
J
J
x1
N
u
J
(10.10)
(10.11)
CHAPTER 10. METODO
DE CONTROL CALCULADO
208
Variable de control
600
500
400
300
200
100
0
0
0.1
0.2
0.3
0.4
0.5
t (seg)
0.6
0.7
0.8
0.9
(10.12)
(10.13)
x1
N
u
= 2n x2 n2 (x1 X)
J
(10.14)
es decir,
u = J 2n x2 + n2 (x1 X)
B
c
x2 sen
J
J
x1
N
(10.15)
A diferencia del caso anterior, la ley de control realimentada no lineal (10.15) se encuentra definida para todo valor posible de las variables de estado en virtud de no presentar
singularidad alguna. En estos casos decimos que la ley de control se encuentra definida
globalmente, en caso contrario decimos que su definicion solamente es local.
10.2
Los ejemplos anteriores nos dan una idea intuitiva de como proceder a generalizar, a sistemas
de mayor dimension, el dise
no de una ley de control linealizante. Esta intuicion nos dice,
al menos en un primer intento, el sistema debera exhibir en forma natural una estructura
inherente equivalente a una cadena de integracion pura sin intervenciones de la variable de
control. Las no linealidades del sistema deberan estar circunscritas a la u
ltima ecuacion
diferencial donde, de paso, debera encontrarse la variable de control. En tales sistemas
sera posible calcular, mediante pura y simple comparacion, una ley de control que obliga al
sistema a presentar una estructura perfectamente lineal. A tal procedimiento de calculo del
control se le conoce con el nombre de inversi
on del sistema.
De las consideraciones anteriores podemos establecer que la clase de sistemas no lineales
representables en la forma:
x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = fn (x1 . . . , nn ) + ugn (x1 , . . . , xn )
(10.16)
(10.17)
210
produce un sistema perfectamente lineal que exhibe una estructura de cadena de integracion
pura.
x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = v
(10.18)
La variable auxiliar v puede entonces sintetizarse como una ley de control que realimenta
linealmente las variables de estado:
v = a1 x1 a2 x2 . . . an1 xn1 an xn
(10.19)
(10.20)
(10.21)
La ley de control no lineal que linealiza, en forma exacta, al sistema no lineal (10.16) se
obtiene entonces como:
a1 x1 + a2 x2 + . . . + an xn + fn (x1 , . . . , xn )
(10.22)
u=
gn (x1 , . . . , xn )
La linealizacion sera valida y u
til, solamente en dos circunstancias:
1) La linealizacion es valida en todo el ambiente del espacio de estado donde se cumpla
que:
gn (x1 , . . . , xn ) 6= 0
(10.23)
2) La linealizacion es u
til en la medida en que el sistema lineal en lazo cerrado sea
asintoticamente estable a cero. Puesto que la estabilidad de este sistema lineal esta determinada, univocamente, por la ubicacion de las raices del polinomio caracterstico:
p(s) = sn + an sn1 + . . . + a2 s + a1
(10.24)
supondremos, por tanto, que el polinomio p(s) tiene todas sus raices en el semiplano izquierdo
del plano complejo. Cuando esta condicion se cumpla, diremos brevemente que p(s) es
Hurwitz.
10.3. LINEALIZACION
CONTROLABLE211
N
otese que la condici
on de singularidad que pudiera exhibir el control realimentado que hemos dise
nado para linealizar el sistema se corresponde, realmente,
con una condici
on de falta de controlabilidad. Es obvio que en aquellos lugares
del espacio de estado donde el canal de entrada al sistema se anula, es decir
gn (x) = 0, se corresponden a regiones donde el sistema se hace completamente
incontrolable.
Ejemplo 10.3:
El sistema
x 1 = x2
x 2 = x3
"
x 3 =
2Kba Kf
Ra + Rf
x2 x3 2
Lf
Lf
x3 +
2Km Kf
J
Jx3 1
Km Kf Lf
! #
(10.25)
"
2Km Kf
Jx3 1
Km Kf Lf
Ra + Rf
2Kba Kf
a3 x3 a2 x2 a1 x1 +
x2 x3 2
Lf
Lf
x3
(10.26)
10.3
Linealizaci
on Exacta de Sistemas no lineales reducibles a la Forma Can
onica Controlable
CHAPTER 10. METODO
DE CONTROL CALCULADO
212
(10.27)
(10.28)
donde:
f1 (x1 , . . . , xn )
g1 (x1 , . . . , xn )
.
..
; g(x) =
..
f (x) =
.
fn (x1 . . . , xn )
gn (x1 . . . , xn )
(10.29)
Esta clase de sistemas representada por (10.28) recibe el nombre de sistemas lineales en
el control. Las funciones vectoriales f (x) y g(x) reciben el nombre de campos vectoriales.
Supondremos de una buena vez y con el objeto de no tener que contar a cada paso el
orden de diferenciabilidad de las funciones f (x) y g(x), que tales campos vectoriales son
diferenciables, respecto de las componentes de x, un n
umero ilimitado de veces, es decir,
un n
umero infinito de veces. Diremos entonces que f (x) y g(x) son campos vectoriales
infinitamente diferenciables. Una expresion equivalente, que tambien utilizaremos con mucha
frecuencia, es la de afirmar que f (x) y g(x) son campos suaves. Representaremos esta clase
de campos vectoriales escribiendo f (x) C .
Con el objeto de ganar la intuicion necesaria que nos permita abordar este problema
en toda generalidad, comenzaremos haciendo algunos ejemplos sencillos donde podremos
transformar el sistema a la forma canonica controlable mediante simple inspeccion. De estos
ejemplos trataremos de derivar reglas generales que nos permitiran abordar cualquier caso.
Ejemplo 10.4:
Consideremos el sistema no lineal siguiente:
x 1 = x1 x2 + u
x 2 = x2 u
(10.30)
10.3. LINEALIZACION
CONTROLABLE213
estado, digamos z1 , y tal que su primera derivada sea independiente del control, y pueda por lo
tanto ser definida como segunda variable de estado, digamos z2 . Si ademas, la derivada respecto del
tiempo de z2 depende explcitamente del control u, entonces tenemos un sistema en forma canonica
controlable, en las nuevas variables z. En efecto, en este caso es facil ver que si definimos una nueva
variable z1 como funcion de las componentes del estado x1 y x2 de la manera siguiente:
z1 = x1 + x2
(10.31)
(10.32)
y por tanto, la primera derivada temporal de esta funcion z1 resulta ser independiente del control.
Si ahora bautizamos a esta expresion de la derivada de z1 como una nueva variable de estado z2 , y
tomamos de nuevo la derivada respecto del tiempo, obtenemos:
z2 = x1 x2 + x2 ;
z2 = x 1 x2 + (x1 + 1)x 2 = (x1 x2 + u)x2 + (x1 + 1)(x2 u)
= x1 x22 + x1 x2 + x2 + u(x2 x1 1)
(10.33)
La derivada de esta nueva variable de estado z2 depende del control a traves de las variables
originales (x), cuyas expresiones podemos buscar en terminos de las nuevas variables de estado z,
invirtiendo el siguiente par de ecuaciones algebraicas:
z1 = x1 + x2
z2 = x1 x2 + x2
(10.34)
Este par de ecuaciones algebraicas no lineales constituyen una funcion vectorial de las variables
x. Su matriz Jacobiana esta dada por:
z
=
x
"
z1
x1
z2
x1
z1
x2
z2
x2
"
1
1
x2 (1 + x1 )
z
= 1 + x1 x2
; Det
x
La matriz Jacobiana de esta funcion vectorial es singular en el conjunto de puntos que satisfacen:
1 + x1 x2 = 0
De donde obtenemos como posibles soluciones locales de la inversi
on:
x2 =
(1 + z1 )2 4z2
2
p
(1 + z1 ) + (1 + z1 )2 4z2
2
x1 = z1
(1 + z1 ) +
(10.35)
x2 =
(1 + z1 )2 4z2
2
p
(1 + z1 ) (1 + z1 )2 4z2
2
x1 = z1
(1 + z1 )
(10.36)
CHAPTER 10. METODO
DE CONTROL CALCULADO
214
z2 =
2 + z1
"
(1 + z1 )
(1 + z1 )
(1 + z1 )2 4z2
2
#
!# "
(1 + z1 )
(1 + z1 )2 4z2
q
(1 + z1 )2 4z2
+ u (1 + 2z1 ) + (1 + z1 )2 4z2 1
2
(10.37)
Podemos resumir nuestra experiencia en postular las siguientes condiciones para que
exista la posibilidad de linealizar exactamente un sistema no lineal de dimension n.
1) Debemos poder hallar una funcion h(x) de las variables de estado cuyas n
1 primeras derivadas, respecto del tiempo, sean funcionalmente independientes
entre s e independientes de la variable de control. Esto es equivalente a que el
gradiente de h(x) y el de todas sus derivadas hasta la n1esima (inclusive) deben
ser linealmente independientes.
2) La n-esima derivada de h(x), respecto del tiempo, debe depender explcitamente
de la variable de control.
La u
ltima condicion es clara, por cuanto expresando el sistema dinamico en las nuevas
variables, todas las nolinealidades de las ecuaciones dinamicas, as como la dependencia del
control, deben quedar relegadas a la u
ltima ecuacion, como ha sido el caso en todos los
ejemplos que hemos visto.
La primera condicion posiblemente requiere de alguna explicacion adicional, sobre todo
en lo referente a la independencia funcional de las derivadas sucesivas de la funcion candidata
h(x).
En efecto, un sencillo ejemplo servira para convencernos de que esta condicion es necesaria:
Ejemplo 10.5:
Consideremos el sistema:
x 1 = x2
x 2 = x22
x 3 = u
(10.38)
Si adoptamos h(x) = x1 como funcion candidata a jugar el papel de primera variable de estado
z1 en el sistema transformado vemos que su primera derivada, x2 , es funcionalmente independiente
10.3. LINEALIZACION
CONTROLABLE215
de x1 . Por lo tanto, x2 calificara como segunda variable de estado. En efecto la transformacion
parcial:
z1 = x1
z2 = x2
(10.39)
(z1 , z2 )
=
(x1 , x2 , x3 )
1 0 0
0 1 0
la cual es de rango 2, lo cual dice que las dos primeras variables escogidas son funcionalmente
independientes. Es decir, la funcion h(x) = x1 y su primera derivada x2 , son funcionalmente
independientes. Sin embargo, la tercera derivada de la funcion h(x) resulta ser:
z3 = x22
(10.40)
1 0 0
(z1 , z2 , z3 )
= 0 1 0
(x1 , x2 , x3 )
0 2x2 0
(10.41)
cuyo rango sigue siendo 2. En consecuencia la funcion h(x) = x1 no nos sirve para generar una
transformacion invertible en el espacio de estado (tridimensional) del sistema en cuestion. Parte
del problema de la falta de independencia funcional estriba en que, en este caso, podemos tomar
infinitas derivadas de h(x) que el control u no habra de aparecer nunca en forma explcita en alguna
de las posibles derivadas de orden superior. En efecto, si enlistamos algunas de las derivadas de
h(x) tenemos:
z1 = x1 ; z2 = x 1 = x2 ;
z3 = z2 = x
1 = x22 ;
(3)
z4 = z3 = z2 = x1 = 2x32
(3)
(4)
(4)
z5 = z4 = z3 = z2 = z1 = x1 = 6x42 . . .
(10.42)
(10.43)
tenemos ahora s, la independencia funcional de h(x) y sus derivadas, que requerimos. En efecto:
z1 = x1 ; z2 = x2 ; z3 = x22 + x3
1 0 0
(z1 , z2 , z3 )
= 0 1 0
(x1 , x2 , x3 )
0 2x2
(10.44)
CHAPTER 10. METODO
DE CONTROL CALCULADO
216
z3 z22
(10.45)
El sistema transformado exhibe, sin lugar a dudas, una estructura canonica controlable:
z1 = z2
z2 = z3
z3 = 2z23 + 2z2 (z3 z22 ) + u
(10.46)
Para el sistema modificado (10.43) la funcion h(x) = x1 cumple, evidentemente, las condiciones
que hemos establecido anteriormente.
Con el objeto de completar el proceso de linealizacion, definimos ahora el control transformado
v como:
v = 2z23 + 2z2 (z3 z22 ) + u
(10.47)
(10.48)
Estabilizar a cero este sistema lineal se reduce a un problema clasico de asignacion de polos
mediante realimentacion lineal del vector de estado.
Notese adicionalmente que lo que ha logrado la transformacion requerida, a traves de h(x) y
sus derivadas, no es solamente el haber perturbado el sistema original, sino haberlo perturbado
apropiadamente. Es facil ver que el siguiente sistema perturbado
x 1 = x2
x 2 = x22 + x1
x 3 = u
(10.49)
no es linealizable en forma exacta a traves de la funcion h(x) = x1 , por cuanto la matriz Jacobiana de
la transformacion resulta ser de nuevo singular y podramos, igualmente, tomar infinitas derivadas
de h(x) sin que aparezca el control u explcitamente en alguna derivada de orden superior.
z1 = x1 ; z2 = x2 ; z3 = x22 + x1
z
x
1 0 0
z
= 0 1 0 Det
=0
x
2x2 0
(10.50)
10.3. LINEALIZACION
CONTROLABLE217
Los ejemplos anteriores nos ayudan a formular en forma mas precisa las condiciones de
existencia de una tranformacion del vector de estado que torna al sistema original en un
sistema en forma canonica controlable.
La condici
on necesaria y suficiente para que exista una transformaci
on del vector
de estado que lleve a un sistema no lineal de la forma (10.28) es que exista una
funci
on escalar diferenciable h(x) tal que:
1)
rango
h(x)
x
..
.
=n
(10.51)
h(n1) (x)
x
2)
h
h
h(n1) (x)
=
= ... =
=0
u
u
u
(10.52)
h(n) (x, u)
6= 0
u
(10.53)
3)
(10.54)
donde:
x1 = = angulo del eje del motor
x2 = = velocidad angular del eje del motor
x3 = ia = if = corriente comun que f luye por los circuitos de armadura y del campo
u = VT
(10.55)
CHAPTER 10. METODO
DE CONTROL CALCULADO
218
z2 = h(x)
= x2
Km Kf 2
z3 = h(x)
=
x3
J
(10.56)
Det
z
x
h(x)
x
h(x)
x
h(x)
x
1 0
= 0 1
0 0
0
0
2Km Kf x3
J
2Km Kf x3
J
(10.57)
Lo cual indica que la transformacion dada por h(x) y sus dos primeras derivadas tiene rango
completo en todas partes del espacio de coordenadas x, excepto en el plano representado por x3 = 0.
En otras palabras, la transformacion de coordenadas es solamente de caracter local y su validez
deja de tener efecto cuando por alguna razon el sistema produce valores de estado x que satisfacen
esta restriccion, o cuando las trayectorias del sistema se acercan asint
oticamente a este valor. La
condicion x3 = 0 se corresponde con un valor nulo de la corriente com
un que circula por los circuitos
de armadura y de campo. En el resto del espacio de estado la transformacion (10.56) es invertible.
La transformacion (10.56) tambien satisface la segunda condicion dada por (10.52). Finalmente,
la tercera derivada de h(x) esta dada por:
(3)
(x, u) =
Kba Kf
Ra + Rf
2Km Kf
1
x3
x2 x3
x3 +
u
J
Lf
Lf
Lf
(10.58)
de donde:
2Km Kf
h(3) (x, u)
=
x3
u
JLf
(10.59)
x3 = +
Jz3
Km Kf
10.3. LINEALIZACION
CONTROLABLE219
la cual es valida solo en la region z3 > 0 del espacio descrito por las nuevas coordenadas. Como
puede inferirse de (10.56), la transformacion de coordenadas no esta definida en la region x3 < 0,
es decir, su validez es solo local.
El motor serie de corriente continua, transformado a nuevas coordenadas, se describe entonces
localmente mediante las ecuaciones diferenciales:
z1 = z2
z2 = z3
"
z3 =
Ra + Rf
2Kba Kf
z2 z3 2
Lf
Lf
z3 +
2Km Kf
JLf
JZ3
Km Kf
! #
(10.60)
Ra + Rf
2Kba Kf
v=
z2 z3 2
Lf
Lf
z3 +
2Km Kf
JLf
JZ3
Km Kf
! #
(10.61)
(10.62)
(10.63)
El sistema en lazo cerrado (10.62) y (10.63) tiene entonces por polinomio caracterstico al
siguiente polinomio de raices estables (o simplemente polinomio de Hurwitz);
p(s) = (s + )(s2 + 2n s + n2 )
= s3 + ( + 2n )s2 + (2n + n2 )s + n2
(10.64)
El controlador no lineal para el sistema transformado (10.60) esta dado entonces a partir de la
siguiente relacion, escrita en terminos de variables transformadas y obtenida directamente de las
ecuaciones (10.61) y (10.63):
n2 z1 (2n + n2 )z2 ( + 2n )z3
"
2Kba Kf
Ra + Rf
z2 z3 2
Lf
Lf
z3 +
2Km Kf
JLf
JZ3
Km Kf
! #
(10.65)
JLf
2Km Kf
Jx3
Km Kf
h
n2 z1 + (2n + n2 )z2 + ( + 2n )z3
2Kba Kf
Ra + Rf
z2 z3 2
Lf
Lf
z3
(10.66)
CHAPTER 10. METODO
DE CONTROL CALCULADO
220
Usando (10.56) en (10.66) obtenemos en variables de estado originales la expresion del controlador dise
nado mediante linealizacion exacta:
JLf
u=
(2Km Kf x3 )
n2 x1
"
+ (2n +
2Kba Km Kf2
x2 x23
JLf
n2 )x2
Ra + Rf
+ ( + 2n ) 2
Lf
!#
Km Kf 2
x3
J
(10.67)
N
otese sin embargo que este controlador presenta un serio problema para su instrumentaci
on en el sistema (10.54), o incluso para realizar sobre su base de cualquier
simulaci
on digital. El problema consiste en que el punto de equilibrio del sistema
(10.54) necesariamente implica que la corriente com
un del circuito de campo y armadura, x3 , tiene que hacerse cero. Pero tal valor de la corriente hace singular la
acci
on de control representada por (10.67).
El problema de regulaci
on del motor de corriente continua en conexi
on serie no puede
resolverse entonces por linealizaci
on exacta.
(10.68)
Tratemos de buscar una transformacion invertible, generada por una funcion escalar h(x), que
satisfaga las tres condiciones (10.51) -(10.53), dadas anteriormente, y que nos transforme el modelo
(10.68) a la forma canonica controlable.
Sea z1 = h(x) una funcion escalar diferenciable. La derivada de esta funcion, con respecto del
tiempo, se escribe usando (10.68) de la manera siguiente:
"
z1
h
i
h(x)
0 x2 + u0 x2 + b
h
h
x = x
=
x2
1
0 x1 1 x2 u0 x1
x
h
h
=
[0 x2 + u0 x2 + b] +
[0 x1 1 x2 u0 x1 ]
x
x2
1
h
h
h
h
[0 x2 + b] +
[0 x1 1 x2 ] + u0
x2
x1
=
x1
x2
x1
x2
(10.69)
Puesto que la primera derivada de h(x) no debe depender de u, de acuerdo a (10.52), h(x) debe
satisfacer:
h
h
x2
x1 = 0
x1
x2
(10.70)
10.3. LINEALIZACION
CONTROLABLE221
lo cual constituye una ecuacion en derivadas parciales del tipo lineal para la funcion desconocida
h(x).
Una solucion general de (10.70) esta dada por:
z1 = h(x) =
i
1h 2
x1 + x22 + c
2
(10.71)
donde c es una constante que debemos ajustar para que, por ejemplo, cuando las variables de estado
x1 y x2 adoptan sus valores de equilibrio X1 (U ) y X2 (U ), inducidos por una relacion de trabajo
constante u = U , entonces la nueva variable z1 adopte, por ejemplo, el valor de cero en tal punto
de equilibrio.
Puesto que:
X1 (U ) =
b1
b
; X2 (U ) =
0 (1 U )
02 (1 U )2
(10.72)
entonces:
"
i 1
1h 2
b2
2
z1 = h(x) =
1+ 2 1
x1 + x22
2
2
2
2 0 (1 U )
0 (1 U )2
(10.73)
h
h
[0 x2 + b] +
[0 x1 1 x2 ]
x1
x2
= bx1 1 x22
z1 =
(10.74)
es decir:
z2 = bx1 1 x22
(10.75)
Notese que el valor de equilibrio de z2 resulta ser tambien cero, como lo habra de demandar el
modelo transformado en forma canonica controlable. Comprobamos finalmente que la derivada de
esta segunda variable de estado s depende de la variable de control u, tal como se establece en la
condicion (10.53). En efecto:
z2 = bx 1 21 x2 x 2
= b(0 x2 + u0 x2 + b) 21 x2 (0 x1 1 x2 u0 x1 )
= b2 + 212 x22 (b + 21 x1 )0 x2 + u(b + 21 x1 )0 x2
(10.76)
Siempre que la cantidad (b + 21 x1 )x2 sea diferente de cero, la transformacion generada por
h(x) es una transformacion linealizante que cumple con las condiciones (10.51)-(10.53).
La trasformacion de coordenadas de estado esta dada entonces por:
"
z1 =
i 1
1h 2
b2
2
x1 + x22
1+ 2 1
2
2
2
2 0 (1 U )
0 (1 U )2
z2 = bx1 1 x22
(10.77)
CHAPTER 10. METODO
DE CONTROL CALCULADO
222
"
h
x
h
x
"
x1
x2
b 21 x2
z
; Det
= (b + 21 x1 )x2
x
(10.78)
La no singularidad de esta matriz Jacobiana coincide, como es claro, con la condicion que
hemos encontrado anteriormente, al exigir en (10.76) que la segunda derivada de h(x) dependa
explcitamente de la variable de control u.
La primera variable de estado, obtenida de la transformaci
on (10.77), es interpretable
en terminos de la energa promedio incremental, medida sobre la base de la energa
consumida en mantener la condici
on de equilibrio promedio. La segunda variable de la
transformaci
on representa la variaci
on temporal del tal energa, es decir, la potencia
incremental promedio consumida por el circuito.
La transformacion (10.77) es localmente invertible en todos aquellos puntos que se encuentren
alejados de la condicion de singularidad de la matriz Jacobiana calculada en (10.78). Los valores
de x1 y x2 , como funcion de z1 y z2 , se obtiene a partir de las ecuaciones siguientes:
(
x21
x2 =
Es decir:
"
z2
b2
b
12
+ 2
+ x1 2z1 +
1
+
1
1 0 (1 U )2
02 (1 U )2
v
u
=0
bx1 z2
1
u b
b
x1 =
+t
21
21
(10.79)
(
"
b2
z2
12
+ 2
+ 2z1 +
1
+
1 0 (1 U )2
02 (1 U )2
v v
u u
(
u u
u b t b 2
z2
+
x2 = t
+ 2z1 +
#)
21
"
b2
12
1
+
02 (1 U )2
02 (1 U )2
#)
#)
b2
1
z(10.80)
2
2
1
21
Notese que hemos tomado la raz positiva para x1 , de la solucion de la primera ecuacion en
(10.79). La raz negativa carece de significado fsico, en virtud de que, de acuerdo a (10.72), las
condiciones de equilibrio (es decir, cuando z1 = z2 = 0), la variable x1 debe ser positiva pues b
y 1 son constantes positivas. Verificamos que efectivamente en equilibrio las expresiones que se
obtienen de (10.80) coinciden plenamente con (10.72).
La forma canonica controlable del sistema en nuevas coordenadas es:
z1 = z2
z2
v
(
u
u b 2
z2
t
+ 2z1 +
+
= 21 z2 + 21 b
21
v
(
u
u b 2
z2
21 0 (1 u)t
+ 2z1 +
+
"
b2
12
1
+
02 (1 U )2
02 (1 U )2
21
v v
u u
(
u u
u b t b 2
z2
t
+ 2z1 +
+
21
b2
02 (1 U )2
"
"
1+
12
02 (1 U )2
b2
12
1
+
02 (1 U )2
02 (1 U )2
#)
#)
#)
b2
1
z2
2
1
21
10.3. LINEALIZACION
CONTROLABLE223
Ejercicio:Terminar el dise
no del controlador no lineal por Linealizacion Exacta.
(10.81)
(10.82)
Es facil verificar que la funcion del error de posicionamiento, dada por h(x) = x1 X califica
como funcion generadora de una transformacion linealizante. Haciendo:
FL
sin x3
J
esta transformacion es invertible, al menos localmente, pues:
z1 = x1 X; z2 = x2 ; z3 =
z
=
x
h(x)
x
h(x)
x
h(x)
x
1 0
= 0 1
0 0
(10.83)
0
z
FL
0
=
cos x3
; Det
x
J
FL
cos
x
3
J
(10.84)
x1 = z1 + X; x2 = z2 ; x3 = sin
Jz3
FL
(10.85)
F LR
1
J
Jz3
FL
(10.86)
1 2 3 z1 (1 2 + 1 3 + 2 3 )z2 (1 + 2 + 3 )z3
!
u=J
r
Jz3
F LR
FL
(10.87)
CHAPTER 10. METODO
DE CONTROL CALCULADO
224
Lo cual induce en el sistema lineal en lazo cerrado un polinomio caracterstico dado por:
p(s) = (s + 1 )(s + 2 )(s + 3 )
= s3 + (1 + 2 + 3 )s2 + (1 2 + 1 3 + 2 3 )s + 1 2 3
(10.88)
(10.89)
El siguiente programa simula la respuesta del sistema controlado por la ley de realimentaci
on
no lineal que logra la linealizacion perfecta del sistema.
10.3. LINEALIZACION
CONTROLABLE225
Figure 10.6: Diagrama de bloques del manipulador robotico de una sola union
226
Chapter 11
Nociones b
asicas de geometra
diferencial
A principios de los anos ochenta surgio un enfoque teorico que permitio abrazar el problema de
control no lineal con gran elegancia, en vasta generalidad y con suficiente profundidad, a la par
que logro una extension, dentro del area no lineal, de conceptos bien conocidos en el area de los
sistemas lineales de control tales como la nocion de grado relativo. Este enfoque, propuesta por el
profesor A. Isidori y sus colaboradores, esta basado en la utilizacion de conceptos basicos nacidos
de la Geometra Diferencial para el analisis y el diseno de sistemas de control. Desde su concepcion, un sin numero de artculos han sido escritos que tratan tanto los aspectos teoricos como
las multiples aplicaciones de estas tecnicas a situaciones reales. Existen en la actualidad diversos
textos dedicados a la explicacion detallada de estos topicos, vease, por ejemplo, (Isidori, 1995; Nijmeijer and van der Schaft, 1990; Marino and Tomei, 1995; Slotine and Li, 1991; Vidyasagar,
1993).
227
228
11.1
f (x) =
1
0
f (x) =
x1
x2
f (x) =
x1
x2
(11.1)
La interpretacion de una ecuacion diferencial tal como esta, es inmediata si pensamos que
la rata de variacion de las componentes de las coordenadas de IRn estan dadas en cada punto
de x, por el campo vectorial f (x). Es decir, la velocidad de variacion de las coordenadas del
espacio en cada punto, evaluada a medida que recorremos la solucion (11.1), es representable
por el vector f (x) que indica la direccion en la que instantaneamente tiende a moverse la
solucion de la ecuacion diferencial. El campo vectorial f (x) representa entonces, en cada
punto x del espacio, un vector tangente a la trayectoria solucion de la ecuacion (11.1).
Por ejemplo, las trayectorias de la ecuacion diferencial:
"
x = f (x) =
x1
x2
(11.2)
(11.3)
[FIGURA]
El gradiente de h(x) es un vector que representa la direccion de maximo creciemiento
de la funcion misma dentro del plano donde toma valores su argumento. Veamos que tanto
crece (o decrece) esta funcion escalar con respecto a la direccion dada, en cada punto del
plano, por la velocidad de variacion de la trayectoria solucion de (11.2). Es decir, veamos
que rata de variacion exhibe h(x) en la direccion del campo vectorial f (x) que define las
soluciones de (11.2). Evidentemente esta rata de variacion esta dada por la derivada de h(x)
con respecto al tiempo, evaluada a lo largo de la solucion de (11.2). El calculo se dispone de
la manera siguiente:
d
h(x) dx
h(x)
h(x) =
=
x
dt
x dt
x
"
#
h(x)
x2
f (x) = [ 2x1 2x2 ]
= 2x1 x2 2x1 x2 = 0
=
x1
x
(11.4)
Las trayectorias, representadas por los crculos concentricos, resultan entonces tangentes
al campo vectorial que las genera a traves de la ecuacion diferencial.
Esta propiedad de los campos vectoriales asociados con los miembros derechos de ecuaciones diferenciales vectoriales de primer orden, ha dado origen de hecho a un metodo de
graficacion de las soluciones de ecuaciones diferenciales de este tipo, cuando sus soluciones se
definen en IR2 . Existen algunos paquetes de simulacion que exhiben las soluciones de ecuaciones diferenciales de segundo orden recurriendo, primordialmente al campo de direcciones
asociado a la ecuacion y procediendo luego a hallar el grafico de la trayectoria mediante
interpolacion de estas direcciones a base de trayectorias seccionalmente lineales que se
mantienen aproximadamente tangentes al campo de direcciones. La siguiente figura muestra
un ejemplo de este tipo, para el sistema dado por:
"
x =
x 1
x 2
"
= f (x) =
x2
x1 1.5x2
(11.5)
Tal como vimos en uno de los ejemplos anteriores, los campos vectoriales asociados a
ecuaciones diferenciales permiten calcular de manera conceptualmente sencilla, la rata de
variacion de funciones escalares a lo largo de soluciones de la ecuacion diferencial asociada
al campo vectorial. As vimos, por ejemplo, que la variacion de la funcion h(x) = x21 + x22
a lo largo de las soluciones de la ecuacion (11.2) es nula por cuanto el campo vectorial
f (x) resulto ser tangente a las curvas de nivel de esta funcion. Sin embargo, otra funcion
230
cualquiera puede exhibir una rata de variacion diferente en cada punto. Por ejemplo, la
funcion h(x) = x21 x22 tiene una velocidad de variacion a lo largo de las soluciones de (11.2)
dada por:
d
h(x)
h(x) =
f (x) = [ 2x1 2x2 ]
dt
x
"
x2
x1
(11.6)
h(x)
f (x) = h(x)
x
(11.7)
Es de hacer resaltar que la derivada direccional, tambien llamada derivada de Lie, Lf h(x),
sigue siendo una funcion escalar de x. La derivada de h(x) con respecto a f (x) mide entonces,
en cada punto x del espacio, la velocidad de variacion instantanea, de la funcion escalar h(x)
con respecto de la solucion de la ecuacion diferencial dx/dt = f (x) que pasa por ese punto
x.
La notacion Lf h(x) facilita mucho los calculos reiterados de derivadas direccionales. As
por ejemplo, si quisieramos calcular ahora la rata de variacion de la funcion escalar Lf h(x)
con respecto a la misma direccion f (x), podramos simplificar notablemente la expresion del
resultado haciendo:
Lf h(x)
d
[Lf h(x)] =
f (x) = Lf (Lf h(x)) = h(x)
dt
x
lo cual designaremos sencillamente, mediante:
L2f h(x) = Lf (Lf h(x))
(11.8)
h(x)
h(x)
=
=
x
x
h(x)
h
x
!T
("
#"
#)
h(x)
f
(x)
f (x) +
f (x)
(11.9)
(11.10)
En general, podremos designar las derivadas direccionales reiteradas de una funcion escalar h(x) con respecto a un campo vectorial f (x) como:
Lnf h(x) =
Ln1
h (x)
f
x
(11.11)
Si quisieramos calcular la derivada direccional de una funcion escalar h(x) respecto del
campo vectorial f (x), y luego evaluar la derivada direccional de la funcion escalar resultante,
Lf h(x), respecto de otro campo vectorial g(x), tendramos simplemente:
"
(11.12)
lo cual es una representacion convenientemente compacta, en relacion a la complejidad operacional que realmente representa.
Es preciso apuntar que en general tenemos que:
Lg Lf h(x) 6= Lf Lg h(x)
(11.13)
(11.14)
h(x)
=
x =
[f (x) + ug(x)] =
x
x
= Lf h(x) + uLg h(x)
h(x)
h(x)
f (x) + u
g(x)
x
x
(11.15)
(11.16)
232
h(x)
= Lf +ug [h(x)]
= Lf +ug [Lf h(x) + uLg h(x)]
= Lf [Lf h(x) + uLg h(x)] + uLg [Lf h(x) + uLg h(x)]
= L2f h(x) + uLf Lg h(x) + uLg Lf h(x) + u2 L2g h(x)
(11.17)
De los calculos anteriores se desprende que en terminos de las derivadas de Lie, o derivadas
direccionales, es relativamente sencillo establecer las derivadas temporales, de orden superior,
de funciones escalares h(x), evaluadas a lo largo de soluciones de ecuaciones diferenciales,
controladas o no. Esto permitira, mas adelante, reemplazar las derivadas con respecto al
tiempo que aparecen en la condicion (10.51), por condiciones que involucran derivadas direccionales reiteradas respecto de los campos vectoriales f (x) y g(x). Antes de hacer esto
daremos algunos ejemplos de calculo de derivadas de Lie e introduciremos otro concepto
fundamental, cual es el del corchete de Lie de dos campos vectoriales suaves.
Ejemplo 11.1:
Considerese el campo vectorial controlado:
"
f (x) + ug(x) =
x2
Lg sin x1
#
k
M x2
"
+u
(11.18)
1
u
M L2
y la funcion escalar dada por h(x) = x1 . La derivada de Lie de h(x) con respecto al campo vectorial
controlado anterior estara dado por:
("
h(x)
= Lf +ug h(x) = [1 0]
x2
Lg sin x1
#
k
M x2
"
+u
#)
1
M L2
= x2
(11.19)
que como vemos es independiente de u. Es decir, en este caso particular tenemos (por ser Lg h(x) =
0):
h(x)
= Lf +ug h(x) = Lf h(x) = x2
(11.20)
h(x)
= Lf +ug (Lf +ug h)(x) = Lf +ug Lf h(x) = L2f h(x) + uLg Lf h(x)
"
= Lf x2 + uLg x2 = [0 1]
=
x2
Lg sin x1
g
k
1
sin x1
x2 +
u
L
M
M L2
k
M x2
"
+ u[0 1]
1
M L2
(11.21)
(11.22)
h(x)
= Lf +ug h(x) = LAx+Bu cx = LAx cx + LBu cx
= cAx + cBu
(11.23)
h(x)
= LAx+Bu [cAx + cBu] = LAx [cAx] + LBu cAx
= cA2 x + cABu
(11.24)
(11.25)
(11.26)
h(x)
h(x)
h(x)
..
.
(n1)
h
(x)
h(x)
Lf h(x)
L2f h(x)
..
.
(n1)
Lf
h(x)
cx
cAx
cA2 x
..
.
cA(n1) x
c
cA
cA2
..
.
x = Ox
(11.27)
cA(n1)
234
Hemos se
nalado en (11.13), que la derivada reiterada de Lie, de una funcion escalar h(x),
respecto a dos campos vectoriales f (x) y g(x) no satisface la propiedad de conmutatividad.
Es decir, el orden en que se toman las derivadas de Lie de h(x) respecto de f (x) y g(x) es
importante y distintivo. Es decir, en general tenemos que:
Lf Lg h(x) Lg Lf h(x) 6= 0
(11.28)
y por tanto Lf Lg h(x) Lg Lf h(x) es una funcion escalar de x, no identicamente nula. Vale la
pena preguntarnos si podremos o no determinar la existencia de un campo vectorial, digamos
p(x), respecto del cual la expresion: Lf Lg h(x) Lg Lf h(x) es su derivada direccional de la
funcion h(x). En otras palabras, deseamos saber si existe alg
un campo vectorial suave p(x)
para el cual se cumple:
Lp h(x) = Lf Lg h(x) Lg Lf h(x) = {[Lf Lg Lg Lf ]h}(x)
(11.29)
Evaluaremos los elementos del miembro derecho de (11.29) en detalle con el objeto de
ver si podemos identificar el campo vectorial buscado p(x):
[Lg h(x)]
Lf Lg h(x) =
f (x) = g T (x)
x
x
h(x)
x
"
!T
#"
#
h(x) g(x)
f (x) +
f (x)(11.30)
igualmente:
[Lf h(x)]
Lg Lf h(x) =
g(x) = f T (x)
x
x
= g T (x)
h(x)
x
"
!T
#"
#
h(x)
f
(x)
g(x) +
g(x)
!T
"
#"
#
h(x)
h(x) f (x)
f (x) +
g(x)
(11.31)
donde la u
ltima igualdad se debe a que la matriz Hessiana de h(x) es evidentemente simetrica
y cada uno de los terminos en la expresion anterior es una cantidad escalar. Uniendo (11.30)
y (11.31), para conformar el segundo miembro de (11.29), tenemos:
"
#"
"
#"
h(x) g(x)
h(x) f (x)
Lf Lg h(x) Lg Lf h(x) =
f (x)
g(x)
x
x
x
x
"
# ("
#
"
#
)
h(x)
g(x)
f (x)
=
f (x)
g(x)
x
x
x
(11.32)
= L{[ g ]f [ f ]g} h(x)
x
g(x)
f (x)
f (x)
g(x)
x
x
(11.33)
g(x)
f (x)
f (x)
g(x)
x
x
(11.34)
(11.35)
(11.36)
para cualquier constante escalar a y cualesquiera campos vectoriales f (x), g(x) y (x). Estas
propiedades generan otras de uso frecuente como por ejemplo, de la primera propiedad surge
inmediatamente que: [f, f ] = 0. La llamada identidad de Jacobi dada por: [f, [g, ]] +
[g, [, f ]] + [, [f, g]] = 0, es una consecuencia de habilmente manipular las propiedades
anteriores.
La reiteracion del corchete de Lie del campo vectorial f con el campo vectorial [f, g] se
escribe como:
[f, [f, g]] =
[f, g]
f
f
[f, g]
x
x
(11.37)
(11.38)
Sobreentendemos que:
ad0f g = g
(11.39)
Ejemplo 11.3:
Consideremos los campos vectoriales lineales dados por:
"
f (x) =
0 x2 + b
0 x1 1 x2
"
; g(x) =
0 x2
0 x1
(11.40)
236
Calculamos, como ejercicio, algunos corchetes de Lie que involucran a f (x) y g(x):
g(x)
f (x)
f (x)
g(x)
x # "
#x
"
#"
#
0
0 x2 + b
0 0
0 x2
0
0 x1 1 x2
0 1
0 x1
=
"
0
0
0 1 x2
0 b 0 1 x1
(11.41)
f (x)
[f, g](x)
f (x)
[f, g](x)
x
x# "
#
#"
#"
0 0
0 1 x2
0 x2 + b
0 1
0 1
0 b 0 1 x1
0 x1 1 x2
0
=
"
0
0 1
202 1 x1 + 0 12 x2 02 b
202 1 x2 20 1 b 0 12 x1
(11.42)
Ejemplo 11.4:
Sean c1 y c2 dos constantes arbitrarias y sean:f , g1 , g2 campos vectoriales suaves y a(x) y b(x)
funciones escalares suaves. Demostrar, a partir de las propiedades basicas dadas en (11.36),que:
1. [f, c1 g1 + c2 g2 ] = c1 [f, g1] + c2 [f, g2 ]
2. [a(x)f, b(x)g] = a(x)b(x)[f, g](x) + a(x)[Lf b(x)]g(x) b(x)[Lg a(x)]f (x)
Para demostrar la primera identidad procedemos como sigue:
[f, c1 g1 + c2 g2 ] = [c1 g1 + c2 g2 , f ] = c1 [g1 , f ] c2 [g2 , f ]
= c1 [f, g1 ] + c2 [f, g2 ]
La segunda requiere algo mas de calculo. Aplicamos la definicion de corchete de Lie y evaluamos
cuidadosamente (cuidando las dimensiones de los productos matriciales) la expresion resultante:
(a(x)f (x))
(b(x)g(x))
a(x)f (x)
b(x)g(x)
x
x
b(x)
g(x)
a(x)
f (x)
= a(x) g(x)
+ b(x)
f (x) b(x) f (x)
+ a(x)
g(x)
x
x
x
x
g(x)
f (x)
b(x)
a(x)
= a(x)b(x)
f (x)
g(x) + a(x)
f (x) g(x) b(x)
g(x) f (x)
x
x
x
x
= a(x)b(x)[f, g](x) + a(x)[Lf b(x)]g(x) b(x)[Lg a(x)]f (x)
[a(x)f, b(x)g] =
(11.43)
(11.44)
"
#
g
= x0 + f (x0 ) + g(x0 ) +
f (x0 ) + . . .
x x0
(11.45)
"
#
f
= x0 + g(x0 ) + f (x0 ) +
g(x0 ) + . . .
x x0
(11.46)
La diferencia entre los dos vectores obtenidos al cabo de 2 unidades de tiempo es, dentro
de un primer orden de aproximacion:
"
f
g
f (x0 )
g(x0 ) + . . .
x(2) x(2) =
x x0
x x0
= [f, g](x0 ) + . . .
(11.47)
238
x(2) x(2)
1
x = lim
= [f, g](x)
0
2
2
(11.48)
(11.49)
En tales circunstancias, se dice que el par de campos vectoriales f y g conforman un conjunto de vectores involutivos y entonces, por extension, decimos tambien que la distribucion
que los contiene es involutiva.
Sea h(x) la funcion cuyos conjuntos de nivel, h(x) = constante, especifican la superficie
integral de la distribucion que contiene a f (x) y a g(x). Es inmediato ver que si el plano
formado por f (x) y g(x) ha de ser tangente a cada punto x a una de estas superficies
integrales, entonces el gradiente de la funcion en ese punto debera ser ortogonal a cada uno
de los campos vectoriales que existen en el plano tangente, en particular, sera ortogonal
tanto a f (x) como a g(x).
Tendremos entonces:
h(x)
h(x)
f (x) = 0; Lg h(x) =
g(x) = 0
x
x
Lo cual podemos expresar en una sola ecuacion en derivadas parciales:
Lf h(x) =
h(x)
[f (x), g(x)] = 0
x
(11.50)
(11.51)
Si el conjunto formado por los vectores f (x) y g(x) es involutivo entonces tambien es
cierto, por ser [f, g](x) combinacion lineal de los campos vectoriales f (x) y g(x), que el rango
de la matriz [f (x), g(x)] (que es igual a 2) no se incrementa si adosamos como columna el
vector [f (x), g(x)] es decir:
rango[f (x) g(x)] = rango[f (x) g(x) [f, g](x)]
(11.52)
h(x)
[f (x) g(x) [f, g](x)] = 0
x
(11.53)
y entonces:
Es facil ver que si (11.53) es cierta es porque [f, g](x) es combinacion lineal de f (x) y
g(x), lo cual dira que f y g son involutivos. En conclusion podemos decir que el conjunto
formado por los campos vectoriales f y g son involutivos s y solo s se cumple (11.52).
Al mismo tiempo, podemos entonces afirmar que la distribucion que contiene a f y g es
integrable s y solo s la distribucion es involutiva. Este enunciado constituye el Teorema
de Frobenius, base de la teora de control no lineal moderna.
En general, podemos extender este concepto de integrabilidad e involutividad a un conjunto arbitrario de campos vectoriales que esten contenidos en una cierta distribucion y
considerar entonces un conjunto de k campos vectoriales suaves linealmente independientes,
definidos en IRn , y dados por:
f1 (x), f2 (x), . . . , fk (x)
(11.54)
240
La distribucion que contiene a este conjunto de vectores en cada punto x del espacio IRn
esta constituida por un hiperplano, o subespacio, o variedad lineal, de dimension k. Esta
distribucion es integrable si el conjunto de vectores en (11.50) es involutivo, lo cual quiere
decir que el corchete de Lie de dos cualesquiera de estos campos vectoriales es expresable
como combinacion lineal (dependiente del punto x, logicamente) de los elementos del mismo
conjunto. Es decir, si para cualesquiera enteros i y j pertenecientes al conjunto {1, 2, . . . , k},
se tiene que:
[fi , fj ](x) =
k
X
(11.55)
k=1
(11.56)
(11.57)
El teorema de Frobenius nos permite asegurar que existe solucion h(x) para el sistema
de ecuaciones en derivadas parciales, representado en (11.57), s y solamente s, el conjunto
de campos vectoriales f1 (x), f2 (x), . . . , fk (x) es un conjunto linealmente independiente e
involutivo.
Chapter 12
Transformaci
on de Sistemas No
Lineales a la Forma Can
onica
Controlable
(12.1)
A LA FORMA CANONICA
h(x)
h(x)
h(n1) (x)
=
= ... =
=0
u
u
u
(12.2)
Escribamos estas condiciones sobre h(x), una por una, haciendo la exigencia anterior.
Empezamos haciendo notar que h(x) no depende explcitamente de u y por lo tanto la
primera condicion siempre se satisface trivialmente.
La segunda condicion implica:
"
h(x)
h
=
(f (x) + ug(x)) =
[Lf h(x) + uLg h(x)] = Lg h(x) = 0
u
u x
u
(12.3)
h(x)
= Lf h(x)
(12.4)
"
h(x)
h(x)
(Lf h(x))
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
(Lf h(x))
(Lf h(x))
2
=
f (x) + u
g(x) =
[L h(x) + uLg Lf h(x)]
u
x
x
u f
= Lg Lf h(x) = 0
(12.5)
y entonces tambien es cierto que:
h(x)
= L2f h(x)
(12.6)
Verifiquemos la tercera condicion solo por ejercicio, sin olvidar de tomar en cuenta las
condiciones ya obtenidas en (12.3) y (12.5).
"
"
h(3) (x)
h(x)
(L2f h(x))
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
(L2f h(x))
3
(L2f h(x))
=
f (x) + u
g(x) =
[L h(x) + uLg L2f h(x)]
u
x
x
u f
= Lg L2f h(x) = 0
(12.7)
e igualmente tenemos:
h(3) (x) = L3f h(x)
(12.8)
(12.9)
243
y que ademas:
h(i) (x) = Lif h(x); i =, 1, 2 . . . , n 1
(12.10)
Lg h(x) = Lg Lf h(x) = . . . = Lg Lf
h(x) = 0
(12.11)
(12.12)
"
h(x))
h(n) (x)
h(n1)
(Ln1
f
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
h(x))
(Ln1
h(x))
n
(Ln1
f
f
=
f (x) + u
g(x) =
[L h(x) + uLg Lfn1 h(x)]
u
x
x
u f
= Lg Ln1
h(x) 6= 0
(12.13)
f
Finalmente las condiciones (10.51), dadas por:
rango
h(x)
x
h(x)
x
..
.
h(n1) (x)
x
=n
(12.14)
rango
h(x)
x
Lf h(x)
x
..
.
(n1)
Lf
h(x)
= rango
h(x)
Lf h(x)
..
.
=n
(12.15)
Ln1
h(x)
f
Esta u
ltima condicion dice que las funciones h(x), Lf h(x), . . . , etc deben ser funcionalmente independientes.
Tenemos ahora, en terminos de los campos vectoriales f (x) y g(x), las condiciones que
permiten asegurar la existencia de una funcion h(x) que genera, a traves de sus sucesivas
derivadas temporales, una transformacion del espacio de coordenadas que permite escribir
al sistema en su forma canonica de la controlabilidad. Sin embargo todava debemos refinar
mas las condiciones (12.11),(12.13) y (12.15) a otras condiciones equivalentes mas claras
desde el punto de vista intuitivo y operacional.
A LA FORMA CANONICA
h(x)
g(x) = 0
x
(12.16)
(12.17)
(12.18)
(12.19)
(12.20)
(12.21)
Podemos entonces substituir las condiciones (12.11) por las siguientes, que les son equivalentes:
Lg h(x) = Ladf g h(x) = . . . = Ladn2 g h(x) = 0
f
(12.22)
(12.23)
Reescribimos la condicion (12.21) en terminos de una ecuacion diferencial para h(x) como
sigue:
h(x)
[g, adf g, ad2f g, . . . , adfn2 g] = 0
x
(12.24)
h(x) n1
[adf g] 6= 0
x
(12.25)
y (12.22):
245
La existencia de una funcion h(x) que satisfaga el sistema de ecuaciones diferenciales
parciales (12.24) esta entonces intimamente vinculado a la integrabilidad de la distribucion
que contiene los campos vectoriales que aparecen conformando la matriz del sistema. Esta
integrabilidad, como hemos visto en el Teorema de Forbenius, es equivalente a la involutividad de los campos vectoriales involucrados. Notese ademas que la condicion (12.25) implica
que el campo vectorial asociado a esta condicion no puede estar en la misma distribucion
que contiene a los campos anteriores. Estos hechos los resumimos en las siguientes dos
condiciones:
Existe una funcion h(x) que genera una transformaci
on, valida alrededor de un
punto x del espacio, que reduce el sistema (12.1) a la forma can
onica controlable
s y solamente s se satisfacen las siguientes condiciones:
1. El conjunto de vectores:
{g adf g ad2f g . . . adfn2 g adfn1 g}
(12.26)
(12.27)
es localmente involutivo.
z = (x) =
h(x)
Lf h(x)
..
.
(12.28)
Ln1
h(x)
f
Notese que la condicion de independencia lineal no ha sido considerada como parte de las
condiciones de existencia de la funcion generadora de la transformacion buscada. En efecto,
es facil constatar que esta condicion se verifica en forma automatica y por lo tanto no juega
papel importante.
Para demostrar que (10.57) siempre es cierta, basta con verificar que el conjunto de
funciones que conforma el vector en (12.28) es funcionalmente independiente. En efecto,
supongamos, contrario a lo que deseamos demostrar, que existe una combinacion lineal de
estas funciones que se hace identicamente nula. Es decir, existe un conjunto de n constantes
[1 , . . . , n ] no nulo para el cual se cumple que:
1 h(x) + 2 Lf h(x) + . . . + n Ln1
h(x) = 0
f
(12.29)
A LA FORMA CANONICA
(12.30)
(12.31)
(12.32)
(12.33)
Tomando de nuevo la derivada direccional respecto del campo vectorial g(x) tenemos:
1 Lg Lf h(x) + 2 Lg L2f h(x) + . . . + n1 Lg Ln1
h(x) = 0
f
(12.34)
(12.35)
247
Completaremos los ejemplos de transformacion a forma canonica controlable, con el
calculo de la ley de control linealizante en algunos de los ejemplos a presentarse y dejaremos como ejercicio el dise
no del controlador no lineal que hace al sistema en lazo cerrado
perfectamente lineal. Presentamos programas de simulaciones en algunos de los casos, que
demuestran la efectividad del controlador.
Ejemplo 12.1: Motor de corriente continua con carga (modelo de velocidad angular)
Considerese el motor de corriente continua que esquematizamos en la figura siguiente:
Las ecuaciones que describen el sistema estan dadas por:
dia
+ Ra ia + Kv ic = Va
dt
d
J
+ D = Kv ie ia
dt
La
(12.36)
(12.37)
el modelo del sistema responde al siguiente conjunto de ecuaciones diferenciales no lineales de estado
(de hecho, las ecuaciones son bilineales):
"
x 1
x 2
"
a
R
La
0
#"
0
DJL
x1
x2
"
v
K
La
0
+u
Kv
J
#"
x1
x2
"
Va
La
(12.38)
El punto de equilibrio para este sistema, generado por una corriente de armadura constante
dada por u = U , se obtiene directamente de (12.38) y resulta en:
"
X1 (U )
X2 (U )
Va
=
Ra DL + Kv2 U 2
"
DL
Kv U
f (x) =
Va
a
R
La x1 + La
DL
J x2
"
; g(x) =
v
K
La x2
Kv
J x1
(12.39)
Calculemos los campos vectoriales que intervienen en las condiciones (12.26) y (12.27):
"
g(x) =
f
g
f
g =
adf g =
x
x
"
0
Kv
J
v
K
La
0
#"
Va
a
R
La x1 + La
DJL x2
DL
Ra
J
La
DL
Ra
J La x1
Kv
Kv
J
v
K
La x2
Kv
J x1
La
x2
+
Kv Va
J La
"
a
R
La
0
0
DJL
#"
v
K
La x 2
Kv
J x1
(12.40)
A LA FORMA CANONICA
[g(x) adf g] =
Kv
La
Kv DL
J
J
v
K
La x2
Kv
J x1
DL
Ra
J
La
a
R
La x1
x2
+
Kv Va
J La
(12.41)
(12.42)
"
K2
Det[g(x) adf g] = 2 v
JLa
DL Ra
K 2 Va
x1 v 2 x2
J
La
JLa
(12.43)
Evidentemente, la matriz formada por los campos vectoriales g y adf g es localmente de rango
completo, por lo que los vectores columna que la constituyen son localmente linealmente independientes. Vemos que:
x2 = 0
x1 =
Va
J
2 (DL La JRa )
constituyen lineas del plano IR2 donde no existe transformacion linealizante. El esquema de control
que adoptemos finalmente, sobre la base de linealizacion exacta aqu calculada, se hara inv
alido si
existen trayectorias del sistema controlado que se acerquen a estos valores prohibidos que causan
singularidad en la transformacion de estados que habremos de hallar.
El conjunto formado por el vector g(x) es trivialmente involutivo, pues [g, g](x) 0, para
cualquier campo vectorial g(x). En consecuencia, se cumplen las dos condiciones necesarias y
suficientes para la existencia de una transformacion linealizante. Para buscar la funcion h(x)
que genera la transformacion procedemos a utilizar la condicion de integrabilidad del conjunto
conformado por g(x) solamente.
h
h
h
g = 0 J
x2 + La
x1 = 0
x
x1
x2
(12.44)
(12.45)
El valor de la constante c lo podemos ajustar de manera que, por ejemplo, el punto de equilibrio
de la variable transformada z1 = h(x) sea cero cuando x es el valor de equilibrio dado anteriormente.
c=
2 + JK 2 U 2 )V
(La DL
a
v
(Ra DL + Kv2 U 2 )2
(12.46)
h(x)
= Lf h(x) =
f (x) = [2La x1 2Jx2 ]
x
= 2Ra x21 2DL x22 + 2Va x1
"
Va
a
R
La x1 + La
DJL x2
249
(12.47)
a
R
x 1
La
x 2 = 0
x 3
0
0
0
0
x1
0
1 x2 + u 0
Kv
x3
0 DJL
J
Va
v
0 K
x1
La
La
0
0 x2 + 0
x3
0
0
0
(12.48)
Va
a
v
R
K
La x1 + La
La x3
f (x) =
x3
0
; g(x) =
Kv
x
DJL x3
1
J
(12.49)
Ejercicio:Calcular la transformaci
on de estados que lleva al sistema a su forma can
onica controlable.
(12.50)
donde es la posicion angular del miembro manipulador y es la posicion angular del eje del
motor, la cual es ligeramente diferente de la anterior en virtud de la flexibilidad del acoplamiento
entre el motor y el manipulador. Esta flexibilidad la hemos modelado como un resorte torsional.
La variable u representa el torque aplicado por el motor a su carga, constituida en este caso por el
miembro manipulador.
Definimos como variables de estado las siguientes:
x3 = ; x4 =
x1 = ; x2 = ;
(12.51)
(12.52)
A LA FORMA CANONICA
f (x) =
x2
M gL
BL
JL sin x1 JL x2 JkL (x1 x3 )
x4
Bm
Jm x4 + Jkm (x1 x3 )
0
0
0
; g(x) =
(12.53)
1
Jm
Calculamos el conjunto de campos vectoriales que permite establecer la existencia de una transformacion de estado linealizante:
g
f
f
f (x)
g(x) = g(x)
x
x
x
0
1
0
M gL
BL
K
k
JL cos x1 JL JL
JL
0
0
0
K
0
Jkm
Jm
adf g =
0
0
1
0
0
0
1
Jm
m
B
Jm
0
0
1
Jm
Bm
J2
m
(12.54)
2
adf g =
0
k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
J
m
m
; ad3 g =
BL
Bm
k
Jm JL JL Jm
B
k
m
J2 + J3
m
m
3
k
Jm JL
Bm
4
Jm
En virtud de resultar todos estos vectores constantes, la involutividad del subconjunto formado
por los tres primeros vectores es trivial. La independencia lineal del conjunto completo de los cuatro
vectores calculados tambien es inmediata en virtud de la naturaleza antidiagonal de la matriz:
[g(x) adf g(x) ad2f g(x) ad3f g(x)] =
k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
Jm
m
J1m
1
Jm
Bm
2
Jm
BL
Bm
k
Jm JL JL Jm
Bm
k
J2 + J3
m
m
3
k
Jm JL
(12.55)
Bm
4
Jm
La funcion que genera la transformacion difomorfica del estado satisface en virtud de la integrabilidad de los tres primeros campos vectoriales que se muestran en la matriz anterior, el siguiente
conjunto de ecuaciones en derivadas parciales:
0
0
0
1
Jm
0
0
1
Jm
m
B
2
Jm
0
k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
J
m
m
= [0 0 0]
(12.56)
251
lo cual se traduce en:
1 h
= 0;
Jm x4
1 h
Bm h
2
= 0;
Jm x3
Jm x4
k h
Bm h
k
B2
+ 2
+ 2 + 3m
Jm JL x2
Jm x3
Jm
Jm
h
=0
x4
es decir:
h
h
h
= 0;
= 0;
=0
x4
x3
x2
(12.57)
(12.58)
z = (x) =
h(x)
Lf h(x)
L2f h(x)
L3f h(x)
L
B
JL
x1
x2
M gL
BL
JL sin x1 JL x2
MJgL
L
sin x1
BL
JL x2
k
JL (x1
k
JL (x1
(12.59)
x3 )
x3 )
k
JL (x2
x4 )
M gL
BL
JL
z3 +
sin z1 +
z2
k
JL
JL
JL
M gL
BL
= z2 +
z4 +
z2 cos z1 +
z3
k
JL
JL
x3 = z1 +
x4
(12.60)
"
M gL
k
M gL 2
B2
= z3
+
cos z1 + 2L
z sin z1
JL
JL
JL 2
JL
BL
M gL
BL M gL
BL
z2 cos z1
z4 +
+
z2 cos z1 +
z3
JL
JL
JL
JL2
kBm
JL
M gL
BL
z2 +
z4 +
z2 cos z1 +
z3
Jm JL
k
JL
JL
M gL
BL
k
k
z3 +
sin z1 +
z2 +
u
Jm
JL
JL
Jm JL
(12.61)
A LA FORMA CANONICA
(12.62)
donde
"
M gL
B2
k
M gL 2
v = z3
cos z1 + 2L
+
z sin z1
JL
JL
JL 2
JL
BL
BL M gL
M gL
BL
z
cos
z
+
z
+
z
cos
z
+
z
2
1
4
2
1
3
JL
JL
JL
JL2
JL
M gL
BL
kBm
z2 +
z4 +
z2 cos z1 +
z3
Jm JL
k
JL
JL
k
k
M gL
BL
z3 +
sin z1 +
z2 +
u
Jm
JL
JL
Jm JL
(12.63)
y la variable auxiliar v se escoge como una ley de control lineal dada por:
v = a1 z1 a2 z2 a3 z3 a4 z4
(12.64)
(12.65)
En particular hemos querido factorizar este polinomio deseado de cuarto orden, en el producto
de dos polinomios de segundo orden cuyas raices sean complejas conjugadas. Uno de estos dos
polinomios se escoge con raices mas alejadas dentro del semiplano izquierdo del plano complejo que
el otro. De esta manera la respuesta en lazo cerrado se encuentra dominada por los autovalores
que se encuentran mas cerca al eje imaginario del plano complejo.
Utilizando (12.63) y (12.64) obtenemos el valor del control u como ley de control realimentada
no lineal que ejerce estabilizacion del sistema, mediante un esquema de linealizacion exacta, en lazo
cerrado:
"
M gL
k
B2
Jm M gL 2
Jm JL
z3
z2 sin z1
cos z1 + 2L
u =
k
JL
JL
k
JL
Jm JL BL M gL
BL Jm JL
M gL
BL
z2 cos z1 +
z4 +
z2 cos z1 +
z3
J k
k
JL
JL
L
M gL
BL
JL
z4 +
z2 cos z1 +
z3
+Bm z2 +
k
JL
JL
M gL
BL
Jm JL
+JL z3 +
sin z1 +
z2 +
[a1 z1 + a2 z2 + a3 z3 + a4 z4 ]
JL
JL
k
(12.66)
253
c x23
m x1
R
1
x 3 = x3 + u
L
L
(12.67)
x2
c x3
f (x) = g m
x1
R
L x3
; g(x) = 0
(12.68)
1
L
2
[g(x) adf g(x) adf g(x)] = 0
1
L
0
cx3
2 mLx
1
R
L2
cx3
2 mLx
1
c2 x23
0
c x3
1
R
L
(12.70)
L2
La involutividad de este conjunto se chequea inmediatamente por ser dos el rango de la siguiente
matriz:
1
L
0
cx3
2 mLx
1
R
L2
c 1
2m
L2 x 1 = 0
0
(12.71)
lo cual dice que en el campo vectorial dado por el corchete de Lie, [g, adf g], es combinaci
on lineal
de los campos vectoriales g(x) y adf g(x).
A LA FORMA CANONICA
0
h
h
[g(x) adf g(x)] =
0
x
x
1
cx3
2 mLx
= [0 0]
1
(12.72)
R
L2
(12.73)
(12.74)
z1
x1
h(x)
1
z2
x
2
z = (x) = Lf h(x) =
; x = (z) = q
cx23
2
m
Lf h(x)
z
(g
z
)
g mx1
3
c 1
(12.75)
El sistema en forma canonica controlable, expresado en variables transformadas esta dado por:
z1 = z2
z2 = z3
z3
2R z2
= (g z3 )
+
L
z1
Usando:
u=
2c
mL
m
(g z3 )u
cz1
L mcz1
2R z2
p
(g z3 )
+
v
L
z1
2c (g z3 )
(12.76)
(12.77)
obtenemos:
z1 = z2
z2 = z3
z3 = v
(12.78)
La variable auxiliar v se puede escoger de tal forma que el sistema en lazo cerrado sea perfectamente lineal y asintoticamente estable al punto de equilibrio deseado para la posicion de la esfera,
Xd .
z1 = z2
z2 = z3
z3 = ( + 2n )z3 (n2 + 2n )z2 n2 (z1 Xd )
(12.79)
255
El polinomio caracterstico que gobierna las respuestas del sistema en lazo cerrado estara dado,
en tales circunstancias, por:
p(s) = s3 + ( + 2n )s2 + (n2 + 2n )s + n2
= (s + )(s2 + 2n + n2 )
(12.80)
c x23 2R x2
c x23
+ ( + 2n ) g
+
m x1 L
x1
m x1
(12.81)
(12.82)
X1 (U ) =
1
U
; X2 (U ) =
1 +
1 + Da1
2Da2
4Da1 Da2 U
1+
1 + Da1
(12.83)
Se supone que la especie Q es altamente acida mientras que la especie reactante R es neutra.
A fin de evadir problemas de corrosion en el equipo que se encuentra aguas abajo se desea regular
A LA FORMA CANONICA
f (x) =
(1 + Da1 )x1
Da1 x1 x2 Da2 x22
"
; g(x) =
1
0
(12.84)
#"
(1 + Da1 )
0
Da1
(1 + 2Da2 )
adf g(x) =
1
0
"
(1 + Da1 )
Da1
(12.85)
El vector g(x) es trivialmente involutivo y la matriz [g(x) adf g(x)] es de rango completo, igual
a 2.
"
1 (1 + Da1 )
0
Da1
(12.86)
h(x) h(x)
x1
x2
"
1
0
h(x)
=0
x1
(12.87)
(12.88)
Escogemos la constante c, de tal manera que el punto de equilibrio de la variable z1 sea cero,
es decir:
"
1
z1 = h(x) = x2
1 +
2Da2
4Da1 Da2 U
1+
1 + Da1
(12.89)
La transformacion es entonces:
"
z = (x) =
h(x)
Lf h(x)
"
x2 X2 (U )
Da1 x1 x2 Da2 x22
"
x2
i #
a1 Da2 U
1 + 1 + 4D1+D
a1
(12.90)
Da1 x1 x2 Da2 x22
1
2Da2
y el punto de equilibrio de las nuevas variables de estado z, coincide entonces con el origen del
plano, como es facil verificar. La transformacion inversa se obtiene inmediatamente a partir de
(12.90) como:
"
x1
x2
"
1
Da1 [z2
(12.91)
257
El modelo transformado, en forma canonica controlable resulta en:
z1 = z2
z2 = (1 + Da1 )[z2 + (z1 + X2 (U )) + Da2 (z1 + X2 (U ))2 ] z2 [1 + 2Da2 (z1 + X2 (U ))] +(12.92)
Da1 u
El sistema es equivalente a un sistema lineal asint
oticamente estable, de la forma:
z1 = z2
z2 = 2n z2 n2 z1
(12.93)
siempre y cuando se asigne al control u la forma de ley realimentada del estado, dada por la
expresion siguiente:
u=
o
1 n
(1 + Da1 )[z2 + (z1 + X2 (U )) + Da2 (z1 + X2 (U ))2 ] + z2 [1 + 2Da2 (z1 + X2 (U ))] 2n z2 n2 z(12.94)
1
Da1
i
1 h
Da1 (1 + Da1 )x1 + (1 2n + 2Da2 x2 )(Da1 x1 x2 Da2 x22 ) n2 (x2 X2 (U ))(12.95)
Da1
Con el objeto de simular la respuesta controlada del sistema constituido por el tanque reactor
realizamos el siguiente programa:
La siguiente figura
muestra las trayectorias controladas del estado del sistema para valores de
= 0.707, n = 10, Da1 = 1, Da2 = 1. El punto de equilibrio para el vector de estado resulta
oticamente a estos
ser, para U = 4, X1 (U ) = 2 y X2 (U ) = 1. Las trayectorias convergen asint
valores.
La trayectoria de la variable de control u tambien converge a su punto de equilibrio.
Antes de concluir esta seccion, daremos una justificacion a nuestro uso de la frase Matriz
de controlabilidad del sistema cuando nos referimos a la matriz:
[g(x) adf g(x) . . . adn1
g(x)]
f
(12.96)
(12.97)
A LA FORMA CANONICA
Chapter 13
Linealizaci
on EntradaSalida
En las secciones anteriores hemos estudiado el problema de transformar los sistemas no lineales
a sistemas lineales en forma exacta. A tal tipo de linealizacion, que involucra transformaciones
del espacio de estado y transformaciones del espacio de los controles (es decir realimentacion
con definicion de nuevas entradas) se le conoce tambien con el nombre de linealizaci
on entradaestado. Como vimos, la base de tal posibilidad estriba en encontrar una funcion que pueda generar
tal transformacion a traves de derivaciones sucesivas con respecto al tiempo. El requisito indispensable para establecer la existencia de esta funcion generadora, en sistemas n-dinensionales,
ha sido que la variable de control, o de entrada al sistema, aparezca precisamente en la n-esima
derivada temporal de tal funcion generadora. Tal requisito puede no cumplirse cabalmente sobre todo si nos empenamos en utilizar como funciones generadoras, funciones del estado que
tengan algun significado fsico especial. Por ejemplo, si tomamos cualquiera de las variables de
estado del sistema como funcion generadora, no siempre podremos cumplir con el requisito de
que sus derivadas, hasta la n-esima sean independientes del control, Lo mismo podramos decir
si tomamos, por ejemplo, la variable de salida como funcion generadora de la transformacion
requerida. Solo en casos muy especiales de esta ndole, tendramos la posibilidad de linealizar
exactamente el comportamiento del sistema sobre la base de tales exigencias a la funcion generadora. Es obvio que el problema de linealizacion de entrada-estado involucra como pregunta
259
260
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
13.1
Formas Can
onicas Normales, Din
amica de los ceros
(13.1)
(13.2)
Debe resultar suficientemente claro que si bien no siempre podremos linealizar el comportamiento entrada-estado, sin embargo pudieramos conformarnos con linealizar solamente el
comportamiento entrada-salida del sistema sin preocuparnos por el comportamiento entradaestado. Esta nueva alternativa merece consideracion cuidadosa por cuanto si bien pudieramos
linealizar el comportamiento entrada salida, la dinamica lineal que induzcamos en esta
relacion sera en general de orden menor que el orden del sistema original. Notese que
de ser cierto lo contrario, la salida sera tambien funcion generadora de la linealizacion de
entrada-estado. Estamos suponiendo, especficamente, que este no es el caso pues el control
ha de aparecer explcitamente en una expresion anterior a la n-esima derivada de la salida.
Digamos que u aparece en la derivada de orden r de la salida. La linealizacion de entrada
salida sera posible entonces con un control que force a la salida a satisfacer una ecuacion
diferencial lineal de orden r, pero entonces nos queda flotando una dinamica adicional de
orden n r que debemos determinar con toda precision. Para fijar ideas continuemos elaborando un poco mas sobre el ejemplo anterior
261
(13.3)
(13.4)
Tal realimentacion del vector de estado logra linealizar la salida, habida cuenta que el valor de
se haya escojido positivamente. El sistema original, sin embargo, es un sistema de segundo orden y
por lo tanto, internamente, una cierta dinamica, al menos de primer orden, debe estar llevandose a
cabo mientras el comportamiento de entrada-salida, que es de primer orden solamente, evoluciona
aparentemente en forma satisfactoria hacia su valor de equilibrio, y = C, de una manera estable.
Debemos proceder entoces con suma cautela en nuestro analisis.
Puesto que y es la suma de las variables de estado que describen el sistema, transformemos el
sistema original de tal manera que el error de salida, dado por y C, pase a ser una nueva variable
de estado y escojamos, como segunda variable de estado, una variable funcionalmente independiente
del error y C. Tal funcion podra ser, por ejemplo, x1 , o incluso x2 . Tomemos x1 como segunda
variable de estado y consideremos la transformacion siguiente:
= x1 + x2 C
= x1
(13.5)
(13.6)
por lo cual, el sistema no lineal transformado se expresa, despues de algunas manipulaciones algebraicas sencillas, como:
= + u Da2 ( + C) C
= (1 + Da1 ) + u
y =
(13.7)
En variables transformadas, la ley de control realimentada propuesta en (13.4), esta dada por:
u = + + C + Da2 ( + C)2
(13.8)
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
262
(13.9)
Puesto que tiende asintoticamente a cero (y entonces por virtud de la ecuacion (13.5), la salida
y tiende a C), la dinamica en la primera ecuacion pasa, despues de un tiempo arbitrariamente
grande, a ser una relacion smplemente algebraica dada por = 0. Esto implica que la variable
( la cual representa la concentracion x1 ) evolucionar
a, finalmente, cuando y valga C, de acuerdo
con:
= (1 + Da1 ) + C + Da2 (C )2
(13.10)
Esta dinamica autonoma representa, por as decirlo, una dinamica remanente del sistema cuando
el error de salida = y C se encuentra ya en su valor de equilibrio de cero. Recordemos que esta
dinamica representa la evolucion de un estado con significado real, puesto que el mismo modela
la concentracion de una especie qumica. El sistema autonomo (13.10), no causa adicionalmente
efecto alguno sobre la variable de salida ni sobre el error de salida y C. Esto quiere decir que, en
condiciones de lazo cerrado, la variable se encuentra desacoplada del comportamiento de entradasalida del sistema, y por lo tanto, no puede ser evaluada sobre la base del conocimiento de la
salida. Notese entonces que la realimentaci
on propuesta ha producido el insolito hecho de hacer a
la variable completamente inobservable.
La evaluacion de la naturaleza de la estabilidad del comportamiento de es entonces crucial,
cuando se trate de garantizar el exito de la estabilizacion que induce la ley de control (13.8) sobre
la variable de salida del sistema (en este caso representada por el error de la concentraci
on total).
Por otra parte, vemos que la dinamica remanente (13.10) es completamente no lineal y autonoma
y sabemos que los diferentes equilibrios posibles de un sistema no lineal autonomo pueden exhibir
muy distintos caracteres. Algunos puntos de equilibrio son estables y otros puedieran no serlo.
La ley de control (13.4), o su equivalente (13.8), puede entonces conducir a un fracaso total si el
comportamiento inobservable de (13.10) arranca de las cercanas, o en la vecindad inmediata, de
un punto de equilibrio inestable. Se hace, por tanto, imprescindible establecer la naturaleza de la
estabilidad en los puntos de equilibrio de la dinamica remanente (13.10).
En efecto el sistema autonomo cuenta con dos puntos de equilibrio bien establecidos como se
desprende del siguiente grafico, hecho con los valores utilizados en la seccion anterior:
Uno de los puntos de equilibrio es estable ( = 3) mientras que el otro ( = 6) es inestable.
Esto hace que sea posiblemente riesgoso iniciar el proceso de control de la concentraci
on total con
valores muy altos de la concentracion de la especie representada por x1 . Sobre todo si la rata de
alimentacion al tanque, representada por u, se encuentra limitada. El siguiente grafico muestra,
sin embargo, el retrato de fase del sistema obtenido de la simulaci
on del mismo, cuando este se
controla mediante la ley de control (13.4), para distintos valores de la condicion inicial x1 . Los
efectos de la dinamica remanente, en este caso, no afectan la atractividad del punto de equilibrio
estable dado que no hemos puesto lmites a la entrada (permitiendo incluso valores negativos de
u, lo cual no es fsicamente posible). Puesto que este tipo de comportamiento no es siempre el
caso en general, la dinamica remanente debe ser cuidadosamente evaluada y su comportamiento
plenamente establecido.
263
Dejamos como ejercicio obtener el retrato de fase del sistema controlador cuando la variable
u(t) satisface, por ejemplo, la condicion: 0 u(t) Umax = 6
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
264
Esta u
ltima terminologa debera ser plenamente justificada. Para ello analizaremos detalladamente el proceso de linealizacion de entrada- salida en un sistema lineal invariante en
el tiempo.
Consideremos el sistema n-dimensional, de naturaleza lineal que es, ademas, invariante
en el tiempo y cuenta con una sola entrada y una sola salida, dado por:
x(t)
= Ax(t) + Bu
y = Cx(t)
(13.11)
Supongamos, mas a
un, que el sistema tiene por funcion de transferencia de entrada-salida
la siguiente funcion racional de variable compleja s, en la cual suponemos, adicionalmente no
existen factores comunes al numerador y denominador (es decir, los polinomios del numerador
y del denominador son coprimos).
y(s)
bnr snr + . . . + b1 s + b0
= C(sI A)1 B = n
u(s)
s + an1 sn1 + . . . + a1 s + a0
(13.12)
Sin perdida de generalidad alguna, podemos suponer que las matrices A, B y C del
sistema tienen la forma siguiente:
A =
C =
0
0
..
.
1
0
..
.
0
1
..
.
...
...
...
0
0
..
.
0
0 ... ...
1
a0 a1 . . . . . . an1
0
0
..
.
; B =
b0 b1 . . . bnr1 bnr 0 . . . 0
1
(13.13)
X
CB CAB
CAr1 B CAr B
CAi1 B
y(s)
=
+
+ ... +
+
+
.
.
.
=
(13.14)
u(s)
s
s
sr
sr+1
si
i=1
En virtud de que la primera potencia de r que puede surgir de la division de polinomios
indicada en (13.12) es r, luego de multiplicar ambos miembros de (13.13) por sr obtenemos
la siguiente expresion de y(s):
sr y(s) = CBsr1 u(s) + CABsr2 u(s) + . . . + CAr1 Bu(s) + CAr Bsu(s) + . . .
= CA
r1
"
X
i=r
CA
i1
Bs
r+i
u(s)
(13.15)
265
Esto nos dice que en un sistema lineal invariante en el tiempo, cuyo grado relativo sea
r, la derivada de orden r de y(t) contiene en forma explicita la presencia de la variable de
control u(t). Derivadas anteriores de y(t), es decir desde la de orden cero hasta la de orden
r 1 no cuentan con la presencia de u(t). En efecto, de las relaciones anteriores se tiene:
CB = CAB = . . . = CAr2 B = 0
(13.16)
(13.17)
(13.18)
C
CA
..
.
CAr2
CAr1
x = Or x
(13.19)
Vemos que estas primeras r funciones son independientes por cuanto si fueran dependientes, existira una ecuacion diferencial lineal invariante en el tiempo satisfecha por la salida
y sus r 1 primeras derivadas (es decir una ecuacion lineal de orden r 1) que sera ademas
autonoma; es decir, independiente de u. Esto estara en contradiccion con la suposicion de
que (13.12) es cierta y que, por tanto, la salida y satisface una ecuacion diferencial de orden
n que s depende de u y sus n r primeras derivadas.
Con el objeto de obtener la transformacion que buscamos, definida sobre el espacio de
estado n-dimensional original, debemos completar la transformacion (13.18) en las n r
variables de estado que all faltan por definir. Estas nuevas variables solamente tendran que
ser linealmente independientes de las variables definidas anteriormente en (13.19).
Sea Enr una matriz de (n r) filas y n columnas de rango completo n r cuyas filas
ei estan constituidas por los vectores unitarios cuyas componentes son todas cero excepto
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
266
e1
..
x =
.
= Enr x =
enr
1
0
..
.
0 0 ...
1 0 ...
.
.. . .
. ..
.
0 0 ... 1
0 ...
0 ...
.. ..
. .
0 ...
0
0
..
.
(13.20)
Entonces:
C
CA
..
.
"
#
"
#
Or
r1
=
x=
CA
Enr
e1
..
(13.21)
enr
Las ecuaciones de estado y salida en nuevas coordenadas tendran la siguiente forma:
"
"
Or
Enr
"
y = c
"
Or
Enr
Or
Enr
#1 "
#1 "
"
Or
Enr
Bu
(13.22)
0
0
..
.
0 ...
1 ...
.. . .
.
.
"
#
0 0 0 0
.
.
.
y =
1
0
..
.
..
.
..
.
..
.
0
0
..
.
0
0
..
.
0
0
..
.
...
...
..
.
0
0
..
.
..
.
0
..
.
0
..
.
...
...
...
..
.
...
1
b0 b1 . . . bnr
1 0 ... 0 0
"
0
0
..
.
0
1
0
..
.
(13.23)
267
De la expresion anterior es facil ver que la dinamica remanente que se obtiene cuando
= 0, resulta gobernada por:
0
..
.
0
..
.
b0 b1
...
...
0
0
...
1
. . . bnr
(13.24)
(13.25)
u
x3
= u
x 2 = g
x 3
y = x1 K
(13.26)
donde x1 es la posicion (altura) medida sobre el eje vertical, orientado positivamente hacia abajo
(es decir, x1 < 0 para alturas reales por sobre la superficie), x2 es la velocidad de descenso y x3
representa la masa combinada del vehculo y el combustible.
La variable u es el control y el producto u representa la velocidad de gasto de combustible
por unidad de tiempo. es la velocidad relativa de eyecci
on de los gases y es una constante de
proporcionalidad, tal que resulta ser la fuerza maxima de frenaje que puede imprimir la maquina
268
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
u
x3
(13.27)
El control u aparece entonces en la segunda derivada de la salida respecto del tiempo. En este
caso tenemos, de acuerdo a la primera regla que r = 2. El cambio de coordenadas parcial, sugerido
en las reglas anteriores, para las dos primeras variables de estada es entonces el siguiente:
z1 = x1 K; z2 = x2
x1 = z1 + K; x2 = z2
(13.28)
3
3
x2 +
g
u
u
=
x1
x2
x3
x3
(13.29)
y vemos que tal funcion coordenada debera entonces satisfacer la siguiente relacion:
3 3
+
=0
x3 x2
x3
(13.30)
(13.31)
z2
x1 = z1 + K; x2 = z2 ; x3 = exp
(13.32)
1 0
0
z
0
Det
= Det 0 1
6= 0
=
x
x3
0 1 x3
(13.33)
269
z2
z2 = g u exp
= g
y = z1
(13.34)
u=
2n z2 + n2 z1 + g
z2
exp
(13.35)
establece una dinamica del error en lazo cerrado gobernada por el sistema lineal asint
oticamente
estable a cero:
z1 = z2
z2 = 2n z2 n2 z1
y = z1
(13.36)
2n x2 + n2 (x1 K) + g
x3
(13.37)
Notemos sin embargo que la dinamica remanente, o dinamica de los ceros, esta representada
por una dinamica totalmente inestable dada por :
= g; (t) = gt + (0)
(13.38)
(13.39)
lo cual establece, a las claras, un decrecimiento exponencial de la masa total del vehculo hasta
su desaparicion completa . Esto, evidentemente se
nala la naturaleza ideal, no fsica, del modelo
postulado, invalido por entero a partir del momento en que la masa del combustible se ha consumido
por completo. Mas a
un, la dinamica remanente solo apunta al hecho de que no se puede mantener
270
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
flotando el vehculo a la altura K de una manera indefinida pues la cantidad finita de combustible
habra de desaparecer por completo en un cierto momento. Por estas razones la maniobra de
mantener el vehculo flotando a una altura K s
olo se lleva a cabo moment
aneamente y luego se
procede a apagar la maquina principal del vehculo de descenso.
(13.40)
(13.41)
Lg h(x) = 0
Lg Lf h(x) = 0
..
.
r2
Lg Lf h(x) = 0
(13.42)
y tambien:
La r-esima derivada de la salida depende del control, por lo tanto debera cumplirse que:
y (r) = Lrf h(x) + Lg Lr1
f h(x)u
(13.43)
Lg Lr1
f h(x) 6= 0
(13.44)
con:
Definicion: Diremos que el sistema (13.40) tiene grado relativo r en un punto x0 , si existe
una vecindad N (x0 ) de x0 tal que se cumplen las siguientes condiciones:
Lg Ljf h(x) = 0; j = 0, 1, 2, . . . , r 2 para todo x en N (x0 )
Lg Lr1
f h(x0 ) 6= 0
(13.45)
271
Un sistema no lineal que tenga grado relativo r admite una linealizacion de entradasalida que puede hacerse coincidente, en lazo cerrado con una ley de control realimentado
apropiada, con una dinamica lineal asintoticamente estable de orden r.
En efecto, si igualamos el segundo miembro de (13.43) a una expresion lineal de las
derivadas de la salida obtenemos:
(r1)
y (r) = Lrf h(x) + Lg Lr1
. . . m1 y m0 y
f h(x)u = mr1 y
(13.46)
donde los coeficientes se escojen de tal manera que el polinomio caracterstico dado por:
p(s) = sr + mr1 sr1 + . . . + m1 s + m0
(13.47)
(13.48)
(13.49)
h(x)
Lf h(x)
..
.
"
#
r1
z
= (x) =
Lf h(x)
..
(13.50)
nr
estas coordenadas deberan escojerse de tal manera que satisfagan la condicion de rango
siguiente:
h(x)
Lf h(x)
..
.
"
#
r1
z
L
= rango
rango
f h(x)
x
x
..
nr
h(x)
x
Lf h(x)
x
..
Lr1 h(x)
= rango
f
..
nr
x
=n
(13.51)
272
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
(13.52)
(13.54)
(13.55)
Es evidente que podemos llevar, facilmente, una linealizacion parcial de la dinamica del
sistema si la r-esima ecuacion diferencial de (13.55) la igualamos a una expresion lineal en
273
(13.56)
es decir:
u=
(13.57)
(13.58)
Es evidente que si los coeficientes constantes mi (i = 0, 1, . . . , r 1) se escojen apropiadamente entonces todas las variables desde z1 hasta zr convergen asintoticamente a cero.
La razon por la cual dijimos que la poltica de control (13.57) produce solo un sistema
parcialmente asintoticamente estable estriba en que la dinamica remanente, ahora claramente
exhibida en (13.58) a traves de la dinamica de las coordenadas , puede o no tener una
dinamica asintoticamente estable. Estudiaremos en cierto detalle la dinamica remanente.
En primer lugar vemos que la utilizacion del control u dado por (13.57) produce un
efecto de desacoplamiento sobre las variables del resto del sistema. Efectivamente, las r
primeras ecuaciones no dependen para nada de y por lo tanto este conjunto de variables se
ha hecho inobservable desde la variable de salida y del sistema. La dinamica remanente que
representan estas variables por lo tanto no tiene efecto alguno sobre la variable de salida, es
decir, su evolucion interna no logra influenciar el comportamiento de la variable de salida del
sistema en lazo cerrado. En segundo lugar es facil verificar que en virtud de la construccion
que hemos hecho para definir las variables las mismas estan desprovistas de la presencia del
control en todas sus ecuaciones. Esta es una de las razones por las cuales es imprescindible
tener una evaluacion inequvoca de la dinamica remanente pues si ella es inestable, no lo
notaremos a la salida mientras que internamente en el sistema un cierto n
umero de estados
estaran creciendo ilimitadamente y no hay manera alguna de que el control u pueda remediar
esta situacion. La dinamica remanente es por tanto inalterable por realimentaci
on del vector
de estado. Una vez que z y sus r primeras derivadas se han hecho cero la dinamica remanente
274
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
(13.60)
q0 ()
=
=0
(13.61)
La estabilidad del sistema lineal invarante en el tiempo (13.61) depende de los autovalores
de la matriz constante del sistema. Haremos las siguientes definiciones:
Diremos que el sistema (13.40) es de fase mnima si todos los autovalores de la matriz
del sistema (13.61) tienen parte real estrictamente negativa. Es decir, un sistema es de
fase mnima si la dinamica de los ceros es asintoticamente estable. Si por lo menos uno
de los autovalores tiene parte real estrictamente positiva diremos entonces que el sistema
es de fase no mnima. Un sistema sera entonces de fase no mnima si su dinamica de los
ceros es inestable. Finalmente puede ocurrir que absolutamente todos aquellos autovalores
(o por lo menos uno) de la matriz constante del sistema (13.61) que no tienen parte real
estrictamente negativa tengan parte real nula. En tal caso no podremos concluir nada sobre
la establidad o no de la dinamica de los ceros. En este caso diremos que la dinamica de
los ceros exhibe un comportamiento crtico, El estudio de estos casos en mayor profundidad
requiere de herramientas proporcionadas por la teora de las variedades centrales. Tal topico
escapa al caracter introductorio de estas notas.
La dinamica de los ceros puede tener m
ultiples puntos de equilibrio. Las definiciones
anteriores se trasladan entonces a cada punto de equilibrio. En caso de estabilidad asintotica
de un cierto punto de equilibrio de la dinamica de los ceros, diremos que el sistema es
localmente de fase no mnima alrededor del equilibrio hallado, en caso contrario diremos que
el sistema es localmente de fase no mnima alrededor de tal punto de equilibrio. Podran
275
existir tambien puntos de equilibrio para los cuales la estabilidad de la dinamica de los ceros
sea localmente crtica.
Ejemplo 13.4:
El siguiente sistema no lineal, visto en el captulo 2, representa, de manera muy aproximada,
la dinamica de una reaccion atomica en un proceso de fision nuclear.
u
x1 + x2
L
x1 x2
L
x 1 =
x 2 =
(13.62)
f (x) =
x1
x2 L
L x1 x2
x1 x2
L
"
1
1
"
; g(x) =
1
L x1
h(x) = x1 N
(13.63)
1
x1
L
(13.64)
En la recta x1 = 0 del plano de coordenadas el sistema no tiene grado relativo definido. Como
en este caso la propia variable x2 tiene una derivada temporal que es independiente del control u,
en este caso tenemos al sistema directamente escrito en forma canonica normal. El u
nico cambio
que haremos sera el necesario para hacer que el punto de equilibrio del sistema transformado sea
el origen. La transformacion difomorfica que lleva (13.62) a la forma canonica normal con punto
de equilibrio en el origen esta dada entonces por:
z1 = x1 N
z2 = x2
(13.65)
z1 = (z1 + N ) + z2 + u (z1 + N )
L
L
z2 =
(z1 + N ) z2
L
y = z1
(13.66)
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
276
Si adoptamos por control realimentado una ley de control que linealice la primera de las ecuaciones y establezca un comportamiento asint
oticamente estable entonces:
1
(13.67)
(13.68)
(z1 + N ) z2
z2 =
L
y = z1
(13.69)
z2 = z2 +
N = z2 N
L
L
(13.70)
x 1 = V cos(x3 )
x 2 = V sin(x3 )
x 3 = u
(13.71)
277
Tomaremos como salida del sistema una funcion que mida el error de posicion del punto de
contacto del uniciclo con respecto al crculo establecido. Es decir:
y = x21 + x22 R2 = 2 R2
(13.72)
Utilizaremos en la solucion del problema de control propuesto los conceptos desarrollados anteriormente de grado relativo y de linealizacion de entrada-salida.
El problema de control se traduce entonces en estabilizar a cero la salida del sistema (13.72)
y obtener as un movimiento perfectamente circular de radio R para el uniciclo. Notese que bajo
seguimiento perfecto del crculo d/dt = 0.
En primer lugar, vemos que el sistema es de grado relativo igual a dos, pues la segunda derivada
de la salida y = 2 R2 depende explcitamente de la variable de control u. Esto quiere decir que
tendremos, necesariamente, una dinamica de los ceros unidimensional.
Definimos:
V cos(x3 )
0
(13.73)
V cos(x3 )
(13.74)
Es decir la tangente del angulo de direccion coincide con la tangente del angulo que describe
la posicion del punto de contacto. Es decir, donde el angulo que describe la posicion del punto
de contacto en el sistema coordenado del plano y el angulo de direccion del uniciclo coinciden.
Esta situacion se corresponde con una trayectoria en lnea radial hacia el crculo (vease la figura
siguiente)
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
278
(13.75)
Como tercera coordenada pudieramos tomar a x3 misma. Sin embargo, a fin de ser consistentes
con la definicion que hemos dado de forma canonica normal, busquemos una funcion = 3 (x)
cuya primera derivada respecto del tiempo no dependa de la variable de control u. Puesto que la
expresion de la derivada de tal funcion resulta ser:
3 (x)
3 (x)
3 (x)
= 3 (x) =
V cos(x3 ) +
V sin(x3 ) +
u
x1
x2
x3
Vemos entonces que tal funcion debe cumplir con la relacion:
3 (x)
=0
x3
(13.76)
(13.77)
Una funcion candidata que cumple con la condicion (13.77), y ademas tiene sentido fsico estara
dada por:
x2
= 3 (x) = tan
(13.78)
x1
Esta coordenada evidentemente representa el angulo que forma con el eje x1 la recta que une el
punto de contacto del uniciclo al plano con el origen de coordenadas. Es decir, el angulo de posicion
del punto de contacto del uniciclo en coordenadas polares. Finalmente tenemos la transformacion
de coordenadas como:
1
q
x2
= 2V x21 + x22 cos x3 tan1
x1
x
2
= 3 (x) = tan1
x1
y su inversa:
x1 =
(13.79)
z1 + R2 cos()
z12 + R2 sin()
x2 =
z
2
x3 = + cos
2V z1 + R2
El sistema en forma canonica normal es entonces el siguiente:
1
z1 = z2
z2 = 2V
V u z1 + R 2 1
s
z1 + R2
z
2
2V z1 + R2
z
2
2V z1 + R2
(13.80)
(13.81)
279
Del sistema anterior resulta claro, luego de algunas manipulaciones algebraicas elementales que
el control :
u=
2V 2 + 2n z2 + n2 z1
q
2V
z1 + R2
(13.82)
z2 2
2V
V
=
z1 + R2
y = z1
z
2
1
2V z1 + R2
(13.83)
Escogiendo los parametros constantes y n apropiadamente podemos garantizar que las variables z1 y z2 convergen asintoticamente a cero. En otras palabras el error de posicion respecto del
circulo y su derivada se anulan asintoticamente. Esto significa que el objetivo de control se logra
mediante la ley de control (13.82). De la u
ltima ecuacion diferencial de (13.83) obtenemos, bajo
la suposicion de establizacion a cero de las variables z1 y z2 , la dinamica de los ceros o dinamica
remanente:
=
V
R
(13.84)
Es evidente que la variable crece indefinidamente a medida que transcurre el tiempo y por
lo tanto la dinamica de los ceros del sistema es inestable. El sistema es, por lo tanto, de fase
no mnima. Este es uno de esos casos excepcionales donde la inestabilidad de la dinamica de los
ceros inestable no conlleva un efecto desastroso pues es facilmente explicable que la naturaleza
del problema formulado implica necesariamente que el angulo de posicion del punto de contacto
debe crecer indefinidamente a medida que el uniciclo avanza ininterrumpidamente sobre el circulo
dibujado en el plano. Esta inestabilidad no implica mas que el crecimiento de un angulo que hasta
cierto punto es una variable inmaterial, imaginaria.
z1 = 1 (x) = x21 + x22 R2
z2 = 2 (x) = 2V [x1 cos(x3 ) + x2 sin(x3 )]
= x3
(13.85)
y su inversa:
x2
x3
z
2
2V z1 + R2
p
z
2
z1 + R2 sin cos1
=
2V z1 + R2
=
x1 =
z1 + R2 cos cos1
(13.86)
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
280
z2
= 2V V u z1 + R2
2V
= u
(13.87)
Es facil ver que la ley de control que linealiza la forma normal del sistema esta dada por la
misma expresion (13.82). El sistema en lazo cerrado esta dado entonces por:
z1 = z2
z2 = 2n z2 n2 z1
2V 2 + 2n z2 + n2 z1
q
=
z2 2
2V z1 + R2 2V
y = z1
(13.88)
(13.89)
Obtenemos la misma expresion anterior a pesar del significado diferente de la variable en esta
ocasion. La explicacion de la inestabilidad de esta variable es exactamente igual a la explicacion
anterior. En efecto, el crecimiento indefinido del angulo de direccion del uniciclo con una velocidad
constante es provocado por la necesidad de mantener la trayectoria del uniciclo sobre el crculo
dibujado en el plano. Con el objeto de relacionar mas estrechamente este resultado con el anterior
notese que de las ecuaciones de transformacion (13.86) obtenemos la siguiente relacion:
tan1
x2
x1
= cos1
z
2
2V z1 + R2
(13.90)
= tan
x2
x1
(13.91)
Esta relacion es enteramente compatible con el logro del objetivo del control, tal como lo muestra
la figura siguiente:
Consideremos ahora un ejemplo donde una dinamica de los ceros puede ser estable o inestable
dependiendo de que variable adoptemos como variable de salida del sistema. Trataremos el problema de estabilizar un sistema que exhibe la propiedad de ser de fase mnima desde cierta salida
y el cual es imposible de estabilizar adoptando por salida una variable diferente pues el sistema
desde esta nueva salida pierde radicalmente la propiedad de ser de fase mnima y se convierte en
un sistema de fase no mnima.
281
1 U b
;
2
0 (1 U )2
X2 (U ) =
Ub
0 (1 U )
(13.93)
f (x) =
0 x2
0 x1 1 x2
"
; g(x) =
b 0 x2
0 x1
; h(x) = x1
(13.94)
Lg h(x) = [1 0]
b 0 x2
0 x1
= b 0 x2 6= 0
(13.95)
Las consideraciones que siguen son validas, por tanto, para puntos y trayectorias que no se
encuentran sobre, o no intersectan,la linea b 0 x2 = 0.
No es dificil constatar que el sistema (13.92) se encuentra ya en forma canonica normal y por
lo tanto la primera variable de estado transformada puede definirse, directamente, como el error
de la corriente promedio de entrada con respecto a un cierto valor de equilibrio deseado, el cual
siempre se calcula en funcion del valor de equilibrio deseado, X2 (U ), para el voltaje normalizado
promedio de salida a partir de la siguiente relacion obtenida directamente de (13.93):
X1 (U ) =
1
1
X2 (U ) 2 X22 (U )
0 b
b
(13.96)
De forma similar, la segunda variable de estado transformada pudiera ser directamente el voltaje
promedio de salida x2 , sin embargo, su derivada depende de la variable de control u. Trataremos,
por lo tanto, de expresar la coordenada complementaria (en este caso, la segunda coordenada de
estado) mediante una funcion cuya derivada respecto del tiempo no dependa de la variable de
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
282
control u. Esto facilita mucho las cosas para el momento de evaluar la dinamica de los ceros. Tal
funcion coordenada, designada mediante , tiene por derivada respecto del tiempo la expresion
siguiente:
2 (x)
2 (x)
[0 x2 u(0 x2 b)] +
[0 x1 1 x2 + u0 x1 ]
= 2 (x) =
x1
x2
2 (x)
2 (x)
2 (x)
2 (x)
=
0 x2
[0 x1 + 1 x2 ] + u
(0 x2 b) +
0 x1 (13.97)
x1
x2
x1
x2
para que la funcion 2 (x) tenga una derivada respecto del tiempo independiente de la relacion de
trabajo u la expresion anterior nos dice que esta debe satisfacer:
2 (x)
2 (x)
(0 x2 b) +
0 x1 = 0
x1
x2
(13.98)
Verificamos facilmente que una solucion para esta ecuacion en derivadas parciales esta dada
por:
= 2 (x) = 02 x21 + (0 x2 b)2
(13.99)
La transformacion que permite escribir el sistema (13.92) en forma canonica normal esta dada
por:
z1 = x1 X1 (U )
= 2 (x) = 02 x21 + (0 x2 b)2
(13.100)
y la transformacion inversa:
x1 = z1 + X1 (U )
x2 =
b
+
0
[z1 + X1 (U )]2
02
(13.101)
Det
x
"
z1
"
= Det
1
0
2
20 x1 20 (0 x2 b)
= 20 (0 x2 b) 6= 0
(13.102)
Lo cual indica que la transformacion a realizarse, as como la linealizacion parcial que de ella
depende, es valida para puntos alejados de la lnea: x2 = b/0 , tal como era de esperarse pues
la singularidad para el grado relativo coincide siempre con la singularidad del Jacobiano de la
transformacion parcialmente linealizante.
Vemos que esta restriccion sobre la variable x2 es compatible con la que debe privar sobre
la variable a fin de que esta sea real. En efecto, de la ecuacion (13.101) vemos que para que la
transformacion (13.100) sea entre valores reales de las variables y no se involucren valores complejos,
carentes de realidad o interpretacion fsica, la variable debe cumplir la siguiente restriccion:
02 x21
283
Pero de (13.100) vemos que siempre cumple esta condicion, y adopta la igualdad en aquellos
valores para los cuales se cumple que: x2 = b/0 . De forma tal que nuestras consideraciones se han
de limitar a aquella region del plano de coordenadas originales donde se cumpla que:
x2 >
b
0
z1 = b + (1 u) 02 [z1 + X1 (U )]2
202 b(z1
+ X1 (U )) 21 b +
02 [z1
+ X1
(U )]2
02 [z1 + X1 (U )]2
y = z1
(13.103)
(13.104)
u=1+ q
(13.105)
02 [z1 + X1 (U )]2
m0 [x1 X1 (U )] + 0 x2
0 x2 b
(13.106)
El sistema en lazo cerrado se obtiene de sustituir (13.106) en (13.103) y resulta ser entonces:
z1 = m0 z1
= 202 b(z1 + X1 (U )) 21 b +
02 [z1 + X1 (U )]2
02 [z1 + X1 (U )]2
y = z1
(13.107)
De esta expresion obtenemos la dinamica de los ceros por substitucion directa de la condicion
z1 = 0 en la segunda ecuacion de(13.107):
= 21
q
2b
0 X1 (U ) 02 [X1 (U )]2 21 b 02 [X1 (U )]2
1
(13.108)
Es facil verificar, por substitucion directa en el miembro derecho de la ecuacion (13.108), que
un punto de equilibrio para este sistema autonomo esta dado por:
(U ) = 02 X12 (U ) + [0 X2 (U ) b]2
(13.109)
ENTRADASALIDA
CHAPTER 13. LINEALIZACION
284
Este punto de equilibrio es asintoticamente estable como se puede verificar por linealizacion
alrededor del punto de equilibrio de (13.108).
Si en lugar de haber utilizado la variable definida en (13.99) hubiesemos analizado el sistema
directamente a partir de las ecuaciones (13.92) utilizando para ello la transformacion mucho mas
sencilla:
z1 = x1 X1 (U )
= x2
(13.110)
Vemos que la forma canonica normal con punto de equilibrio en z1 = 0 esta dada por:
z1 = 0 u(0 b)
= 1 (1 u)0 (z1 + X1 (U ))
(13.111)
m0 z1 + 0
(0 b)
(13.112)
b + m0 z1
0 (z1 + X1 (U ))
0 b
(13.113)
b0 X1 (U )
0 b
(13.114)
Bibliography
Bahram, S. and M. Hassul (1993). Control System Design using Matlab. Prentice Hall. Englewood Cliffs, New Jersey.
Dorato, P., C. Abdallah and V. Cerone (1995). LinearQuadratic Control:An Introduction.
Prentice Hall. Englewood Cliffs, New Jersey.
Doyle, J.C., B.A. Francis and A.R. Tannenbaum (1992). Feedback Control Theory. Macmillan. New Jersey.
Franklin, G.F., J.D. Powell and A.R. Emami-Naeini (1994). Feedback Control of Dynamic
Systems. third ed.. Addison Wesley. New York.
Isidori, A. (1995). Nonlinear Control Systems. Communication and Control Engineering
Series. third ed.. Springer. Berlin.
Kailath, T. (1980). Linear Systems. Prentice Hall Inc.. Englewood Cliffs, New Jersey.
Marino, R. and P. Tomei (1995). Nonlinear Control Design: Geometric, adaptive and robust.
Information and Systems Science Series. Prentice Hall. London.
Nijmeijer, H. and A. van der Schaft (1990). Nonlinear Dynamical Control Systems. SpringerVerlag. New York.
Ogata, K. (1996). Modern Control Engineering. third ed.. Prentice Hall. New York.
Rugh, W.J. (1986). The extended-linearization aproach for nonlinear systems problems.
In: Algebraic and Geometric Methods in Nonlinear Control Theory (M.Fliess and
M. Hazewinkel, Eds.). pp. 285309. D. Reidel Publishing Company. Dordrecht.
Rugh, W.J. (1987). Design of nonlinear pid controllers. AICHE Journal 33(10), 17381742.
Rugh, W.J. (1991). Analytical framework for gain scheduling. IEEE Control Systems
11(1), 7984.
Sira-Ramrez, Hebertt (1994a). Control de sistemas no lineales mediante linealizacion exacta.
Technical report. Universidad de Los Andes. CUADERNOS DE CONTROL, #3-94,
Maestra en Ingeniera de Control.
285
286
BIBLIOGRAPHY