Sie sind auf Seite 1von 292

DC

Control de Sistemas No Lineales


Hebertt Sira-Ramrez, Richard Marquez y Francklin Rivas-Echeverra
Departamento de Sistemas de Control
Escuela de Ingeniera de Sistemas
Facultad de Ingeniera
Universidad de Los Andes
Merida 5101, Venezuela
{isira,marquez,rivas}@ing.ula.ve
Abril 1997

i
Palabras Clave: Sistemas no lineales, linealizacion aproximada, linealizacion extendida,
linealizacion exacta.

Versi
on actualizada de las notas del curso Sistemas No Lineales dictadas por el
Profesor H. Sira-Ramrez durante los a
nos 1990 a 1993, (Sira-Ramrez, 1994b;
Sira-Ramrez, 1994c; Sira-Ramrez, 1994a), en la Facultad de Ingeniera de la
Universidad de Los Andes. La estructuraci
on y organizaci
on actual de los apuntes
surgieron de las clases del mismo curso dictadas por el profesor R. Marquez
durante el perodo septiembre (1996) a mayo de 1997.

ii

Contents
1 Introducci
on
1.1 Control de Sistemas No Lineales: Para que? . .
1.2 Sistemas No lineales y Trayectorias de equilibrio
1.2.1 Casos Patologicos . . . . . . . . . . . . .
1.2.2 Sistemas de naturaleza fsica real . . . .
1.3 Ejemplos de Sistemas no lineales controlados . .
1.4 Ejercicios Propuestos . . . . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . . . . . .
2 Esquema de Dise
no de Leyes de Control
2.1 Introduccion . . . . . . . . . . . . . . . .
2.2 Esquema Propuesto . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

basadas en
. . . . . . .
. . . . . . .
. . . . . . .

.
.
.
.
.
.
.

1
2
4
5
6
10
31
31

Linealizaci
on
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .

33
34
34
38

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

El M
etodo de la Linealizaci
on Aproximada

3 El M
etodo de la Linealizaci
on Aproximada
3.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 El Metodo de la Linealizacion Aproximada . . . . . . . . . . .
3.2.1 Linealizacion mediante expansiones en serie de Taylor .
3.2.2 Representacion en Funciones de Transferencia . . . . .
3.2.3 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Que tan bueno es el Metodo de la Linealizacion Aproximada?
c . . . . . . . . . . . . . . . . . .
3.4 Primer ejemplo en Matlab
3.4.1 Modo de uso . . . . . . . . . . . . . . . . . . . . . . .
3.5 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . .
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . .

39
.
.
.
.
.
.
.
.
.
.

41
42
42
43
46
47
49
52
52
55
56

4 La Linealizaci
on Aproximada y el Dise
no de Controladores
4.1 Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Dise
no de Controladores mediante Linealizacion Aproximada . . . . . . . . .
4.3 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

57
58
58
76

iii

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

iv

CONTENTS
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

5 Observadores Din
amicos de Estado basados en Linealizaci
on Aproximada 79
5.1 Reconstruccion del Vector de Estado . . . . . . . . . . . . . . . . . . . . . . 80
5.2 El Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.3 Realimentacion Lineal de Salida Mediante Observadores de Orden Reducido 101
5.3.1 Observadores de Orden Reducido: Caso General . . . . . . . . . . . . 105
5.4 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 Dise
no de Compensadores Cl
asicos mediante Linealizaci
on Aproximada 113
6.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Dise
no de reguladores del tipo P, PI y PID mediante Linealizacion Aproximada114
6.3 Compensadores basados en el Metodo del Controlador-Observador Clasico . 120
6.4 Redes Compensadoras de Adelanto . . . . . . . . . . . . . . . . . . . . . . . 126
6.5 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

II

El M
etodo de la Linealizaci
on Extendida

7 Control de Sistemas No Lineales por Linealizaci


on Extendida
7.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 El Metodo de la Linealizacion Extendida . . . . . . . . . . . . . . . . . .
7.3 Dise
no de Controladores no Lineales por Asignacion de Polos Invariantes
7.4 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 Observadores Din
amicos de Estado basados
8.1 Introduccion . . . . . . . . . . . . . . . . . .
8.2 Ejemplos de aplicacion . . . . . . . . . . . .
8.3 Ejercicios Propuestos . . . . . . . . . . . . .
8.4 Lecturas Recomendadas . . . . . . . . . . .

en
. .
. .
. .
. .

135
.
.
.
.

137
138
139
140
162

Linealizaci
on Extendida
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .

165
165
168
178
178

.
.
.
.

9 Dise
no de Compensadores No lineales G() mediante Linealizaci
on Extendida
179
9.1 Dise
no de reguladores del tipo P, PI y PID mediante Linealizacion Extendida 180
9.2 Controlador-Observador clasico utilizando Linealizacion Extendida . . . . . . 188
9.3 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
9.4 Lecturas Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

CONTENTS

III

El M
etodo de la Linealizaci
on Exacta

10 M
etodo de Control Calculado
10.1 El metodo del Control Calculado: Ejemplos . . . . . . . . . . . . . . .
10.1.1 Dos sencillos ejemplos: procedimiento de dise
no, singularidades
10.2 Una primera generalizacion a una forma canonica en cascada . . . . . .
10.3 Linealizacion Exacta de Sistemas en Forma Canonica Controlable . . .

199
.
.
.
.

.
.
.
.

.
.
.
.

201
202
202
209
211

11 Nociones de geometra diferencial


227
11.1 Campos Vectoriales, Derivadas de Lie, Corchetes de Lie, El Teorema de Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
12 Transformaci
on a la Forma Can
onica Controlable

241

13 Linealizaci
on EntradaSalida
259
13.1 Formas Canonicas Normales, Dinamica de los ceros . . . . . . . . . . . . . . 260
Bibliografa

284

Chapter 1
Introducci
on

Newton tuvo mucha razon cuando dijo que el lenguaje de la naturaleza es la matematica. La
realidad fsica que nos rodea la hemos tratado de interpretar de diferentes maneras. Los modelos
matematicos constituyen una forma idonea de resolver muchos de los problemas que se nos
presentan al enfrentarnos a esa realidad. Un modelo matematico, obtenido por medio de leyes
y relaciones de tipo fsico, qumico o de alguna otra ndole, servira para captar algunas de las
propiedades importantes del sistema bajo estudio, dependiendo de las necesidades. particulares.
Ademas de brindar la posibilidad de estudiar un sistema cualquiera, modelos nos proporcionan
las bases necesarias para tener una idea de como influenciar (controlar) el comportamiento del
sistema real. En ultimo termino, este es el interes practico del modelo en s, brindar informacion
relevante del sistema susceptible de ser controlado.
Los sistemas de control de maquinaria, motores, aviones, reactores qumicos, etc., estan for1

CHAPTER 1. INTRODUCCION

mados por procesos y plantas, habitualmente representados a traves de modelos matematicos que
expresan las diferentes propiedades o comportamientos que satisfacen tales sistemas. Visto de
esta forma, tales modelos no son otra cosa que los llamados sistemas dinamicos. Los sistemas
dinamicos que estudiaremos describen procesos reales de naturaleza no lineal. La herramienta
matematica para su descripcion esta constituida por sistemas de ecuaciones diferenciales ordinarias no lineales a par
ametros agrupados.

1.1

Control de Sistemas No Lineales: Para qu


e?

Desde los los inicios de la humanidad, el hombre ha tratado de entender y aprender de su


medio ambiente a traves de observaciones. A partir de estas observaciones se fue creando
en su cerebro un modelo de la realidad circundante. Los diferentes modelos que formaba
le servian para actuar dentro de su medio y para tratar de solventar sus problemas en la
caceria, construccion de vivienda, etc. Con el paso del tiempo, y en virtud de los cambios en
sus necesidades, estos modelos se fueron convirtiendo en modelos mas sofisticados desde el
punto de vista abstracto. Desde el punto de vista ingenieril, los modelos lingusticos y graficos
(diagramas, dibujos, etc.), los cuales transmita a sus semejantes, le sirvieron para entender
mejor y en una forma mas sistematica su entorno, pero a la vez le permitieron afrontar
problemas cada vez mas complicados, como por ejemplo los sistemas de regulacion de la
posicion y de la velocidad en los molinos de viento, y los dispositivos mas simples, pero no
menos ingeniosos, usados para controlar el nivel del lquido en los relojes de agua (clepsidra).
Estos modelos, lingusticos y graficos, constituyeron el origen de lo que posteriormente seran
los modelos matematicos.
Un modelo matematico de un sistema real constituye una representacion abstracta realizada en terminos de lenguaje y simbologa matematica (ecuaciones algebraicas, ecuaciones
diferenciales, en diferencias, etc.) la cual resalta propiedades importantes del sistema en estudio. En nuestro caso, estaremos interesados en que el modelo presente las propiedades mas
importantes relativas al comportamiento dinamico (en el tiempo) del sistema a controlar,
tomando en cuenta los requerimientos y la disponibilidad de recursos respecto a beneficios,
costos, precision y exactitud en representar el comportamiento del sistema, seguridad o riesgos, etc. Por ejemplo, un modelo del comportamiento de varias sustancias en un reactor
qumico podra ser representado mediante un conjunto de ecuaciones diferenciales parciales
que reflejan un comportamiento muy preciso y una inversion muy costosa, contrastando
con muchas situaciones en las cuales es suficiente representar el sistema dado en la forma
de ecuaciones algebraicas de las relaciones estaticas entre las sustancias, el cual resulta un
modelo con un costo muy inferior al anterior. En el caso de un avion esto no puede ser as,
el modelo a emplear tiene que ser lo suficientemente sofisticado como para tomar en cuenta
todas las variables necesarias: vientos, presion, condiciones climatologicas, etc. debido al
elevado riesgo de vidas humanas involucradas. El interes practico de estudiar modelos no
lineales, visto que nos proporcionan una vision mas real del sistema fsico tangible, se cen-


1.1. CONTROL DE SISTEMAS NO LINEALES: PARA QUE?

tra especialmente en su utilidad para analizar la manera de influenciar, regular o controlar


sistemas dinamicos. As pues, esta es la razon que ha fortalecido la inversion en la investigacion academica para el ulterior desarrollo de la teora de control. La creciente complejidad
tecnologica de las plantas y procesos industriales ha influenciado, en los u
ltimos a
nos, el
notable avance de la investigacion en campos relacionados directa e indirectamente con la
teora de control no lineal.
La necesidad de controlar sistemas no lineales mediante un procedimiento sistematico
viene desde la epoca en que James Watt presento su ensayo titulado On governors. A pesar
de que la teora de control no lineal no se comenzo a definir propiamente sino hasta principios
de los a
nos 60, muchos fueron los investigadores pioneros que participaron ofreciendo avances
en el campo, mayormente en la parte lineal, que evidentemente permitieron solventar muchos
problemas en sistemas reales; resaltan los nombres de Routh y Hurwitz (1877), Lyapunov
(1980), el cual sento las bases del modelo de estados y proporciono un criterio de estabilidad
para sistemas no lineales, Sperry (1910), Sykorsky (1923), Black (a
nos 30), Nyquist y Bode,
decada de los 40, cuyos nombres estuvieron intimamente asociados al de los laboratorios Bell
en EEUU. Es de recordar el importante avance de la ingeniera de control a nivel industrial,
cuando Ziegler y Nichols propusieron las tecnicas de sintonizacion de los controladores PID,
ampliamente usados hoy en da.
Dos acontecimientos trascendentales marcaron el desarrollo de los a
nos siguientes: 1) la
Segunda Guerra Mundial, en la cual las investigaciones cientficas recibieron grandes inversiones para resolver problemas de balstica, la creacion de poderosas armas, el desarrollo de
la aviacion, etc., y, 2) el comienzo de la Era Espacial. En los a
nos 60 se plantea seriamente el
problema de control de sistemas no lineales gracias al resurgimiento del interes en los trabajos
de Lyapunov y en la representacion en el espacio de estados, abanderada principalmente por
Kalman quien sento las bases de lo que actualmente se conoce como teora de control moderna. Este fenomeno fue influenciado, ademas, por el origen del control optimo (Pontryagin)
y de la programacion dinamica (Bellman) y por problemas tales como el control automatico
de las naves espaciales tripuladas y de los satelites artificiales los cuales no pudieron ser
resueltos facilmente usando modelos y estrategias de tipo lineal. En la u
ltima parte de este
siglo, las necesidades de la industria, el ambiente de competencia, tanto industrial como
academico, y los progresos tecnologicos son los que han marcado el desarrollo del control de
sistemas no lineales. Problemas importantes han surgido del control de procesos qumicos,
del desarrollo de la robotica y servomecanismos, del control de aeroplanos y helicopteros, y
un sinn
umero de diferentes aplicaciones.
En estos apuntes, nuestra atencion estara centrada en los sistemas de tipo no lineal
que puedan ser representados por modelos que involucren el uso de sistemas de ecuaciones
diferenciales ordinarias no lineales. De all que los metodos de analisis y dise
no presentados
no se aplican a sistemas mas complejos, conocidos con el nombre de sistemas a par
ametros
distribuidos, descritos, por lo general, por ecuaciones y sistemas de ecuaciones diferenciales
parciales.
Durante el desarrollo de las diferentes secciones correspondientes a este captulo se hara
una exposicion de a) el esquema (o algoritmo) de dise
no, mediante el cual analizaremos las


CHAPTER 1. INTRODUCCION

.
x=f(x,u)

u(t)

y(t)

y=h(x)
ENTRADA

SALIDA
SISTEMA NO LINEAL

Figure 1.1: Diagrama de Bloques de un Sistema no lineal


diferentes estrategias de control propuestas en los captulos posteriores, y b) los diferentes
modelos no lineales de sistemas reales que usaremos en el resto del texto. A continuacion,
se estudian algunas caractersticas de los sistemas no lineales, las cuales serviran de soporte
a los temas desarrollados mas adelante. En la siguiente seccion se estudian las trayectorias
y los puntos de equilibrio que se pueden deducir de un sistema no lineal. Es importante
estudiar este tipo de trayectorias ya que constituyen parte fundamental del comportamiento
intrnseco del sistema a ser controlado.

1.2

Sistemas No lineales y Trayectorias de equilibrio

Considerese el siguiente sistema no lineal con una sola entrada y una salida:
x(t)

= f (x(t), u(t)),
y(t) = h(x(t))

x(t0 ) = x0
(1.1)

donde x(t) es una funcion vectorial del tiempo la cual toma valores en el espacio de ndimensiones y representa el estado del sistema, u(t) es una funcion escalar del tiempo y
toma valores en la recta real, u(t) IR. La variable y(t) es tambien una funcion escalar del
tiempo y representa la salida del sistema. Las funciones f () y h() son funciones continuas,
diferenciables al menos una vez con respecto a cada uno de sus argumentos, definidas de tal
forma que f : IRn IR IRn y h : IRn IR. Representamos este sistema no lineal mediante
el diagrama de bloques mostrado en la figura 1.1.
Consideraremos sistemas de ecuaciones diferenciales de la forma (1.1) que poseen puntos
de equilibrio constantes, dados por:
u(t) = U ; x(t) = X(U ); y(t) = Y (U ) = h(X(U )),

para todo t

(1.2)

Tales puntos de equilibrio se obtienen de resolver la ecuacion:


f (x(t), U ) = 0

x(t) = X(U )

(1.3)

1.2. SISTEMAS NO LINEALES Y TRAYECTORIAS DE EQUILIBRIO

Notese que, en general, pueden existir m


ultiples puntos de equilibrio, con o sin sentido
fsico. Mas a
un, es posible que ni siquiera exista tal punto de equilibrio constante. A los
sistemas donde aparezcan tales fenomenos los llamaremos casos patol
ogicos.

1.2.1

Casos Patol
ogicos

A continuacion daremos algunos ejemplos de los llamados casos patologicos.

Ejemplo 1.1:
1
+ u(t)
x(t)
y(t) = x(t)

x(t)

(1.4)

Evidentemente, si u = U = 0, no existe ning


un punto de equilibrio para la variable de estado x(t).
Sin embargo, si u = U 6= 0 entonces si existe un punto de equilibrio y vale x(t) = X(U ) = 1/U .

Ejemplo 1.2:
El sistema descrito por:
x = u(x2 2)
y = x

(1.5)

tiene para u = U 6= 0 solamente dos puntos de equilibrio ubicados en x = 2. Sin embargo,


si u = U = 0 entonces el sistema tiene infinitos puntos de equilibrio, ya que, en este caso, para
cualquier x = X = constante, se cumple que dx/dt = 0.

Ejemplo 1.3: avi


on en vuelo horizontal
Considere las ecuaciones diferenciales que describen la trayectoria de un avi
on que vuela a una
cierta altura sobre el nivel del mar (cuyo valor no interesa), en un plano de dos dimensiones paralelo
al plano tangente a la tierra (ver Figura 1.2). El plano tiene por funciones coordenadas x1 y x2 , las
cuales describen la posicion del avion en cada instante. El parametro de control es la funcion u, que
representa la direccion del avion relativa a las coordenadas fijas (x1 , x2 ), la cual puede cambiarse a
voluntad. El modelo del sistema es el siguiente:
x 1 = V cos u
x 2 = V sen u
q

y =

x21 + x22 R

(1.6)


CHAPTER 1. INTRODUCCION

x2

u
R

x1

Figure 1.2: Avion en vuelo horizontal


La salida del sistema representa la distancia a un crculo imaginario, trazado sobre el plano,
con centro en el origen de coordenadas y radio R.
En este caso no existe ning
un punto de equilibrio constante pues el par de ecuaciones diferenciales igualadas a cero representan, para un valor fijo U de u, un sistema incompatible que no posee
solucion alguna.
Si expresamos el sistema anterior en coordenadas polares, a partir de la transformacion de
coordenadas dada por:

x21 + x22 ,

x1 = cos ,

= arctan
x2 = sen

x2
x1

(1.7)

obtenemos:
= V cos( u)
= V sen ( u)
y = R

(1.8)

Es facil ver que, para una direccion fija = , el valor del control u = U = produce un
angulo de direccion constante, en equilibrio, dado precisamente por = , a partir de la segunda
ecuacion diferencial. Sin embargo, el radio vector crece o decrece a una rata constante V y por lo
tanto no tiene equilibrio constante.

No queremos inducir al lector a pensar que lo com


un es que no se tenga puntos de
equilibrio constantes para los sistemas dinamicos. La mayora de los sistemas que trataremos,
de origen eminentemente real: mecanico, electrico, qumico, biologico, etc., tienen puntos de
equilibrio constantes. De hecho, la mayor parte de la tecnologa de regulacion automatica
en sistemas de produccion industrial est
a basada en este solo hecho.

1.2.2

Sistemas de naturaleza fsica real

Veremos ahora algunos ejemplos en los cuales se establece, posiblemente bajo algunas condiciones, un punto de equilibrio u
nico.

1.2. SISTEMAS NO LINEALES Y TRAYECTORIAS DE EQUILIBRIO

Ejemplo 1.4: cambios en el estado de un gas confinado a un recipiente cerrado


La ecuacion diferencial que describe los cambios de presion de un gas dentro de un tanque, del
cual se permite cierto escape en regimen subcrtico, esta dada por:
RT K0 A0
P =
V

P0 (P P0 ) +

RT
u
V

(1.9)

donde u es el volumen de gas por unidad de tiempo, con que se alimenta un tanque usando un
compresor. Este valor, se supone, no depende de la presion. La alimentaci
on se lleva a cabo de
tal manera que los cambios de presion del gas son suficientemente lentos como para considerarlos
isotermicos. V es el volumen del recipiente, A0 y K0 son constantes que dependen de la valvula de
entrada y del gas considerado. R es la constante universal de los gases y T es la temperatura a la
que se lleva a cabo el proceso. P0 es igualmente una constante.
Evidentemente, si no alimentamos gas alguno al tanque, u = U = 0, el punto de equilibrio de
la presion es P = P0 . Si, por el contrario, inyectamos una cantidad constante de gas u = U 6= 0, el
punto de equilibrio para la presion resulta ser ahora:
1
P (U ) = P0 +
P0

U
K0 A0

(1.10)

el cual es mayor que el valor de equilibrio anterior, como es logico suponer (se deja como ejercicio
al lector justificar tal afirmacion).

Ejemplo 1.5: p
endulo sin amortiguamiento

L
cm

mg

Figure 1.3: Pendulo simple


El modelo de un pendulo simple sin amortiguamiento (ver Figura 1.3) esta dado por:
x 1 = x2
1
mgL
cos x1 + u
x 2 =
J
J
y = x1

(1.11)


CHAPTER 1. INTRODUCCION

donde x1 = , x 1 = x2 = representan la posicion y la velocidad angular de la barra respecto al eje


de referencia. u representa el torque aplicado por un servomotor. m es la masa total de la barra
concentrada en su centro de masa; g representa la aceleracion de gravedad, L es la distancia desde
el origen de hasta el punto cm y J corresponde al momento de inercia de la barra respecto al centro
de masa.
Si u = U = 0, el punto de equilibrio para x2 es, simplemente, x2 = 0. Sin embargo, para todo
valor del angulo x1 que haga cos x1 = 0, tendremos infinitos puntos de equilibrio constante para
x1 . En efecto, x1 = k /2, k = 1, 2, 3, . . ., son puntos de equilibrio del sistema. Sin embargo, si
restringimos el espacio de estados a una region donde x1 pertecenece al intervalo x1 [/2, +],
para un suficientemente peque
no, entonces el sistema (1.11) poseera un u
nico punto de equilibrio
sobre ese rango de valores. Fisicamente, este punto de equilibrio correpondera a la posicion vertical,
inestable, del pendulo.

Ejemplo 1.6: tanque de reacci


on biol
ogica continuamente agitado
Las siguientes ecuaciones diferenciales describen el crecimiento del metanol en un tanque de
reaccion biologica continuamente agitado que utiliza organismos conocidos como metilomonas. Si
x1 representa la densidad de celulas de metilomonas y x2 representa la concentraci
on del metanol,
el sistema se describe como:
A x2
x1 u x1
B + x2
A x2
x 2 =
x1 + u(Af x2 )
B + x2
y = x2
x 1 =

(1.12)

donde u es la tasa de disolucion del substrato y Af es la concentraci


on del substrato en la alimentacion del tanque. Af , A y A son constantes conocidas.
Para valores constantes de la tasa de disolucion, u = U , el sistema tiene dos puntos de equilibrio
constantes. Uno de ellos ubicado en (0, Af ) y el otro en:
x1 = X1 (U ) =

A (Af A (Af + B)U )


;
A
A U

x2 = X2 (U ) =

BU
A U

(1.13)

Como hemos visto anteriormente, no solo la existencia sino la naturaleza misma de los
puntos de equilibrio de un sistema no lineal dependen en alto grado del valor del punto
de equilibrio del control. En aquellos casos en que el punto de equilibrio de las variables
de estado y la variable de salida sean calculables en terminos del valor U de la se
nal de
entrada u, diremos que el punto de equilibrio se encuentra parametrizado por el valor del
control. Tales parametrizaciones son muy importantes en la teora de la linealizacion y sus
extensiones recientes. Sin embargo, la parametrizacion de los puntos de equilibrio no es
potestativa u
nicamente en terminos del valor constante de la se
nal de control. Tambien es

1.2. SISTEMAS NO LINEALES Y TRAYECTORIAS DE EQUILIBRIO

posible parametrizar la familia de puntos de equilibrio posibles de un sistema en terminos


de un valor constante de alguna de las variables de estado en particular. Veamos el siguiente
ejemplo.

Ejemplo 1.7: sat


elite mono-axial (Cayley-Rodrgues)

u
Figure 1.4: Satelite mono-axial
Considerese un cuerpo que gira alrededor de un eje fijo en el espacio ingravido accionado por
torques, los cuales son producidos gracias a la expulsion controlada de gases, mediante un sistema
de toberas de reaccion adosadas al cuerpo en forma opuesta, tal como se ilustra en la figura 1.4.
El modelo que se presenta esta asociado al problema de orientaci
on de un satelite mono-axial
cuyo angulo de orientacion, respecto de un eje oblicuo no coincidente con el eje principal, se mide
utilizando la representacion de Cayley-Rodrgues dada por:
x 1 = 0.5 (1 + x21 ) x2
1
u
x 2 =
J
y = x1

(1.14)

donde x1 es el angulo de orientacion del satelite, x2 es la velocidad angular respecto al eje principal
y u representa el torque aplicado.
Para u = 0, el punto de equilibrio esta dado por x1 = X1 (constante arbitraria) y x2 = 0. En
este caso el punto de equilibrio se parametriza en terminos de la posicion angular X1 y no del valor
del control el cual debe ser, necesariamente, cero en el equilibrio.

En este captulo no insistiremos mas en parametrizaciones particulares, pues ellas tendran


importancia cuando estudiemos el metodo de la Linealizaci
on Extendida. As en lo sucesivo,
expresaremos el punto de equilibrio asociado al sistema (1.1) como un conjunto dado por
(U, X, Y ). En ocasiones, cuando la salida no sea considerada en forma especial, simplemente
nos referiremos al punto de equlibrio mediante (U, X).


CHAPTER 1. INTRODUCCION

10

1.3

Ejemplos de Sistemas no lineales controlados

En esta parte presentaremos un n


umero significativo de sistemas no lineales. Estos ejemplos
han sido escogidos de tal forma que sean representativos e ilustrativos de las diferentes
areas donde pueden encontrarse sistemas controlados representados por medio de ecuaciones
diferenciales ordinarias no lineales. En lo sucesivo, se propone al lector, como ejercicio,
verificar los puntos de equilibrio de algunos de estos sistemas, tengan sentido fsico o no.
Notese que algunos de estos sistemas presentaran complicaciones al momento de obtener
parametrizaciones particulares respecto del punto de operacion deseado y, por lo tanto, se
debe recurrir a metodos numericos (y hasta simulaciones!) para obtener los valores adecuados. Sin embargo, por razones de ndole didactico, hemos tratado de presentar aquellos
modelos que permitan, en lo posible, obtener parametrizaciones particulares respecto a un
valor nominal de la se
nal de control, u = U , o respecto al valor nominal de alguna variable
especfica, sea esta una variable de estado, xi = X, o de salida, y = Y .
Ejemplo 1.8: control de la orientaci
on de un artefacto espacial
0

cg

Figure 1.5: Esquema de un artefacto espacial que requiere control de su orientacion a un valor
deseado ( = )
Supongase que deseamos controlar la posicion angular de un artefacto espacial, como el que
se muestra en la Figura 1.5. Para controlar este artefacto se dispone de una tobera que puede
girar alrededor de su base sobre un pivote especial. El angulo de orientaci
on de la tobera respecto
al eje principal del cuerpo de la astronave es . La tasa de variaci
on del angulo de la tobera es
directamente proporcional a u. L es la distancia desde el punto de apoyo de la tobera en el cuerpo
del artefacto hasta el centro de gravedad de la nave (cg). Se supone que la fuerza F de reaccion,
debida a la expulsion de los gases de la combusti
on del motor del artefacto, esta aplicada sobre el
punto de apoyo de la tobera. Como consecuencia de la fuerza F el artefacto gira alrededor de su
centro de gravedad en uno u otro sentido. El problema de control consiste en mantener el angulo
en un valor fijo , usando como control la velocidad de variaci
on u del angulo de la tobera.

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

11

Las ecuaciones diferenciales que rigen el movimiento del sistema se obtienen de la segunda Ley
de Newton:
J

d2
= torque neto aplicado = fuerza brazo = F sen L
dt2

(1.15)

El angulo crece, o decrece, de acuerdo al control aplicado u mediante la ley de variaci


on:
d
= Ru
dt

(1.16)

donde R es una constante conocida que representa una cierta ganancia estatica del actuador o
transductor que convierte el comando u en velocidad de variaci
on del angulo . Supondremos que
existe cierta limitacion en los valores de u, los cuales adscribiremos, arbitrariamente, al intervalo
cerrado [1, 1].
Las variables de estado del sistema se escogen como:
x1 = ; x2 =

d
= ; x3 =
dt

(1.17)

El sistema no lineal se describe entonces de la manera siguiente:


x 1 = x2
FL
x 2 =
sen x3
J
x 3 = Ru

(1.18)

El punto de equilibrio, fsicamente significativo, del sistema se obtiene haciendo cero el miembro
derecho de cada ecuacion de estado. Este resulta ser:
x1 = arbitrario = ; x2 = 0; x3 = 0; u = 0

(1.19)

Notese que x3 = k tambien califica como punto de equilibrio, pero no es fisicamente factible
introducir la tobera dentro de la nave. De hecho, la posicion angular de la tobera se debe
restringir a valores que estan contenidos estrictamente dentro del intervalo [/2, +/2], es decir,
/2 < min < < max < +/2.

Ejemplo 1.9: descenso suave controlado en un planeta sin atm


osfera
Considere el siguiente sistema dinamico controlado que representa la dinamica del modulo de
descenso vertical que se muestra en la figura 1.6:
x 1 = x2

u
x3
= u

x 2 = g
x 3

y = x1 K

(1.20)


CHAPTER 1. INTRODUCCION

12

x 1<0

x3

Figure 1.6: Descenso suave controlado en un planeta sin atmosfera


donde x1 es la posicion (altura) medida sobre el eje vertical, orientado positivamente hacia abajo,
es decir, x1 < 0 para alturas reales sobre la superficie; x2 es la velocidad de descenso y x3 representa
la masa combinada del vehculo y el combustible.
La variable u es el control y el producto u representa la velocidad de gasto de combustible por
unidad de tiempo. es la velocidad relatica de ejeccion eyecci
on de los gases y es una constante de
proporcionalidad, tal que resulta ser la fuerza maxima de frenaje que puede imprimir la maquina
al modulo en su descenso. u esta restringida a tomar valores entre 0 y 1. g es la aceleracion de la
gravedad del planeta en cuestion. La salida del sistema representa el error de posicion respecto a
una altura fija de valor K < 0. Por lo general esta altura es peque
na (1 metro o algo as) de tal
manera que el problema de control consiste en llevar la altura x1 al valor x1 = K (es decir y = 0).
Mantener el modulo flotando a esta altura por un brevsimo tiempo y luego apagar el motor para
lograr un descenso en caida libre desde muy baja altura.

Ejemplo 1.10: control de un uniciclo


Considere el problema de maniobrar un uniciclo, provisto de un motor, que avanza con velocidad
constante V sobre un plano equipado con coordenadas cartesianas dadas por el par ordenado (x1 ,
x2 ) el cual describe la posicion del punto de contacto. La entrada de control esta representada por
la rata de variacion del angulo de direccion = x3 , medido con respecto al eje x1 . El objetivo de
control consiste en maniobrar el uniciclo para hacer que la trayectoria coincida con un crculo de
radio R, previamente marcado sobre el plano, y cuyo centro es el origen 0 de coordenadas (vease la
figura). Por simplicidad, suponemos que toma valores en el intervalo (, /2) y, por lo tanto
solo se consideran movimientos en contra del sentido de las agujas del reloj.
El conjunto de ecuaciones diferenciales que representa este sistema estan dadas por:
x 1 = V cos(x3 )
x 2 = V sen (x3 )

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

13

x1
x2
x3
V

Figure 1.7: Control de un uniciclo


x 3 = u

(1.21)

Tomaremos como salida del sistema una funcion que mida el error de posicion del punto de
contacto del uniciclo con respecto al crculo establecido. Es decir:
y = x21 + x22 R2 = 2 R2

(1.22)

Es facil ver que el movimiento del uniciclo descrito por (1.21) presenta ecuaciones similares a
las del modelo del avion en vuelo horizontal (1.6).

Ejemplo 1.11: control de un reactor de fisi


on
El siguiente sistema no lineal representa, de manera muy aproximada, la dinamica de una
reaccion atomica en un proceso de fision nuclear:
x 1 =
x 2 =

u
x1 + x2
L

x1 x2
L

(1.23)

donde x1 representa la poblacion de neutrones, x2 es la poblacion de precursores y la variable


de control u recibe el nombre de reactividad. Los parametros , y L son constantes conocidas.
El objetivo del control sera el de mantener la poblacion de neutrones a un nivel constante N ,
preestablecido.
El punto de equilibrio para el sistema, parametrizado en terminos de la poblacion deseada de
neutrones N , esta dado por:
x1 = X1 (N ) = N ; x2 = X2 (N ) =

N
; u=0
L

(1.24)

Ejemplo 1.12: motor de corriente continua con carga (modelo de velocidad angular)


CHAPTER 1. INTRODUCCION

14
ia

Ra

La

+
voltaje
control

Va

O,

Vb

back emf

circuito
de armadura

Lf

if corriente (constante)
circuito
de campo

Figure 1.8: Motor de corriente continua


Considerese un motor de corriente continua controlado por campo, provisto de excitacion separada, el cual esta esquematizado en la figura 1.8. Sea Va el voltaje constante de armadura y sea if
la corriente de campo, que act
ua como variable de control. El conjunto de ecuaciones diferenciales
que describen la dinamica del sistema controlado estan dadas por:
La

dia
+ Ra ia + Kv if = Va
dt
d
J
+ B = Kv if ia
dt

(1.25)

Definamos las variables de estado y de control como:


x1 = ia ;
u = if ;

x2 =
Va = constante

De acuerdo a esta seleccion de las variables de estado, el sistema (1.25) queda representado
mediante un modelo en el espacio de estado (llamado modelo bilineal1 ) dado por:
"

x 1
x 2

"

a
R
La
0

0
B
J

#"

x1
x2

"

+u

0
Kv
J

v
K
La
0

#"

x1
x2

"

Va
La

(1.26)

donde x1 representa la corriente de armadura, x2 es la velocidad angular del eje del motor; La y Ra
son, respectivamente, la inductancia y la resistencia en el circuito de armadura, Kv es la constante
de torque del motor, mientras que J y B son, respectivamente, el momento de inercia de la carga
y el coeficiente de friccion viscosa asociada a la carga.
El punto de equilibrio para este sistema, generado por una corriente de armadura constante
dada por u = U , se obtiene directamente de (1.26) y resulta en:
"

x1 (U )
x2 (U )

Va
=
Ra B + Kv2 U 2

"

B
Kv U

(1.27)

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

15

Ra

ia
+
+

if

VT =Va + Vf
-

Ea

Va
Rf

Vf

Lf

Figure 1.9: Motor serie de corriente continua


Ejemplo 1.13: motor serie de corriente continua
La figura 1.9 representa el diagrama esquematico de un motor de corriente continua que posee
conexion en serie de su circuito de armadura (subndice a) y su circuito de alimentaci
on del campo
(subndice f ). Las ecuaciones de estado que describen este sistema no lineal estan dadas por:
x 1 = x2
Km Kf 2
x 2 =
x3
J
Kba Kf
Ra + Rf
1
x 3 =
x2 x3
x3 +
u
Lf
Lf
Lf

(1.28)

donde x1 = corresponde al angulo del eje del motor, x2 = , es la velocidad angular del eje del
motor, x3 = ia = if representa la corriente com
un que fluye por los circuitos de armadura y del
campo. La se
nal de control u = VT corresponde al voltaje de alimentaci
on de la red.

Ejemplo 1.14: modelo promedio de un convertidor tipo Boost de corriente continua


En la figura 1.10 se presenta el circuito electrico correspondiente a un convertidor tipo Boost
de corriente continua. Este circuito se puede describir mediante el siguiente sistema de ecuaciones
de estado (este modelo es del tipo bilineal, es decir, presenta productos de la forma xi u):
x 1 = 0 x2 + u 0 x2 + b
x 2 = 0 x1 1 x2 u 0 x1
y = x2

(1.29)

donde x1 = I L, x2 = V C, representan las variables normalizadas de la corriente de entrada


a la
bobina L del convertidor y el voltaje de salida del condensador C, respectivamente. b = E/ L > 0
es el valor
numerico normalizado de la fuente externa de voltaje constante E. Las constantes
0 = 1/ LC y 1 = 1/RC reciben el nombre, respectivamente, de frecuencia natural de oscilaci
on
1

Se dice que un sistema de control es bilineal cuando, independientemente, es lineal en el control u y es


lineal respecto al estado x.


CHAPTER 1. INTRODUCCION

16

E
-

Figure 1.10: Convertidor de potencia DCDC tipo Boost


del circuito LC de entrada y constante de tiempo del circuito RC de salida. La variable u denota
la funcion de posicion del interruptor, la cual actua como variable de control, tomando valores en
el conjunto discreto {0, 1}. Esta se
nal es sintetizada mediante transistores.
Consideremos el modelo promedio 2 , con variables normalizadas, del convertidor tipo Boost
regulado mediante un esquema de conmutaci
on por modulacion de ancho de pulsos:
z1 = 0 z2 + 0 z2 + b
z2 = 0 z1 1 z2 0 z1
y = z2

(1.30)

donde z1 representa la corriente normalizada promedio de entrada, z2 es el voltaje normalizado


promedio de salida. La se
nal de control u, de tipo discontinuo, se reemplaza por la funcion continua
, denominada relaci
on de trabajo del conmutador electronico. La variable de control satisface
la relacion 0 1.
El modelo del convertidor (1.30) tiene por punto de equilibrio, para una relacion de trabajo
constante u = U , los siguientes valores constantes de corriente y voltaje promedio normalizados:
= U : Z1 (U ) =

b
b1
: Z2 (U ) =
2
0 (1 U )
U)

02 (1

(1.31)

Ejemplo 1.15: conductores el


ectricos acoplados
Un conductor muy largo se fija en posicion vertical y por el se hace pasar una corriente I
que act
ua como variable de control. Otro peque
no conductor, de longitud L y masa m, tambien se
coloca en posicion vertical y se fija a un resorte que puede moverse horizontalmente. Ver figura 1.11.
Por el conductor peque
no se hace circular una corriente i, fija. La fuerza de atraccion o de repulsion
que se establece sobre el conductor movil esta dada por:
2

En electronica de potencia, sobretodo en el caso de convertidores de potencia DCDC, se acostumbra


emplear este tipo de modelos promedios para control y analisis de los circuitos. Estos modelos permiten
aproximar en promedio el comportamiento real conmutado que presentan estos convertidores.

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

17

L,m
I

fe

k
i

L0

x
a

Figure 1.11: Sistema de dos conductores acoplados magneticamente

fe =

2IiL
ax

Cuando I = 0, el resorte se encuentra en reposo y sin ejercer fuerza alguna a la distancia x = L0 .


La ecuacion del movimiento del conductor peque
no esta dada por:
m
x = k(x L0 ) +

2IiL
ax

donde a es la distancia que se muestra en la figura y k es la constante de elasticidad del resorte.


La ecuacion anterior es valida para 0 < x < a . Suponemos, por lo tanto, que 0 < x < a.
Supongase que se desea controlar la posicion del conductor peque
no a un valor constante x = x

tal que L0 < x


< a. Escogiendo las variables del sistema como
x1 = x; x2 = x;
u=I
las ecuaciones de estado del sistema son, entonces:
x 1 = x2
x 2 = k(x1 L0 ) +

2iL
u
a x1

(1.32)

Evidentemente el punto x2 = 0, x1 = L0 y u = I = 0 constituye un punto de equilibrio, el cual


es claramente estable. Pero estamos interesados en mantener como punto de equilibrio la condicion:
x2 = 0, x1 = x
> 0 con el resorte sujeto a cierta tension constante. Para tales valores de equilibrio
se tiene la siguiente parameterizacion del punto de equilibrio (en terminos de la distancia nominal
x
):
u = U (
x) =

k(
x L0 )(a x
)
; X1 (
x) = x
; X2 (
x) = 0
2iL

(1.33)


CHAPTER 1. INTRODUCCION

18

Ejemplo 1.16: sistema de levitaci


on magn
etica

R
i

+
-

v(t)

f
m

mg
Figure 1.12: Sistema de suspension magnetica
La figura siguiente muestra un sistema de suspension magnetica que permite mantener levitada
una peque
na esfera metalica de masa m. El objetivo del controlador sera regular el valor de la
corriente i del circuito del electroiman de tal forma que la esfera se mantenga suspendida a una
distancia constante x = X, del electromagneto. La tension o voltaje aplicado al circuito es v(t) y
act
ua como variable de control.
Las ecuaciones diferenciales que describen el sistema estan dadas por:
di
dt
d2 x
m 2
dt
L

= Ri + v(t)
= mg fm = mg

ci2
x

(1.34)

donde i es la corriente del circuito y x es el desplazamiento de la esfera medido desde el electromagneto. L es la inductancia del electromagneto y c es una constante conocida. La fuerza fm de
atraccion que ejerce el magneto sobre la esfera se supone inversamente proporcional a la distancia
x y directamente proporcional al cuadrado de la corriente. La salida se obtiene a traves de un
fotosensor mediante el cual se realiza la medicion de la altura de la esfera metalica suspendida en
el aire. Este modelo aunque aproximado describe con cierta precision el fenomeno de la levitacion
magnetica (en (Wong, 1986) puede conseguir un enfoque muy similar para la obtencion de este
modelo). Sin embargo, tal modelo no es valido para distancias muy peque
nas o cero.
Escogemos como variables de estado y como variable de control del sistema a las siguientes
variables fsicas:
x1 = x ; x2 = x ; x3 = i ; u = v(t)

(1.35)

y reescribimos las ecuaciones diferenciales anteriores como un sistema de ecuaciones diferenciales


de primer orden.
x 1 = x2
x 2 = g

c x23
m x1

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS


1
R
x 3 = x3 + u
L
L
y = x1

19

(1.36)

Los puntos de equilibrio del sistema se obtienen igualando a cero los segundos miembros de
las ecuaciones diferenciales anteriores con u = U = constante. Obtenemos entonces los puntos de
equilibrio en terminos de una parametrizacion del valor deseado X de la distancia:
x1 = X1 (X) = X ; x2 = 0 ;
s

x3 = X3 (X) =

mgX
; u = U (X) = R
c

mgX
c

(1.37)

Una parametrizacion diferente esta constituida por aquella que utiliza el valor constante U del
control. Tal parametrizacion esta dada por:
cU 2
; x2 = 0 ;
mgR2
U
; u=U
= X3 (U ) =
R

x1 = X1 (U ) =
x3

(1.38)

Ejemplo 1.17: posici


on de un anillo sobre un aro rotatorio
Considerese el caso de un anillo que se desliza sin roce sobre un aro que se puede hacer girar a
velocidad angular , regulable a voluntad (ver figura 1.13).

Figure 1.13: Aro rotatorio sobre el que desliza un anillo cuya posicion angular se desea controlar
Se desea mantener el valor del angulo en un valor constante deseado dado por = . La
variable de control en este caso esta constituida por el cuadrado de la velocidad angular u = 2 .
El radio del aro, que se supone indeformable por efecto de la fuerza centrfuga, esta dado por a.
El modelo del sistema esta dado por:

d2
= g sen + a 2 sen cos
dt2

(1.39)


CHAPTER 1. INTRODUCCION

20
el cual podemos reescribir de la manera siguiente:

x 1 = x2
g
x 2 = sen x1 + u sen x1 cos x1
a

(1.40)

Para un valor fijo u = U del cuadrado de la velocidad angular tenemos el siguiente punto de
equilibrio:
g
x1 (X) = X = ; x2 (X) = 0; u = U =
a cos X
el cual hemos parametrizado en terminos del valor deseado del angulo . Debemos recalcar que el
punto de equilibrio x1 = 0 carece de interes, pues para lograrlo basta con detener el movimiento
del aro alrededor de su eje.
Notese que de haber parametrizado en terminos del cuadrado de la velocidad angular entonces
el punto de equilibrio se hubiese expresado como:

x1 (U ) = arccos

g
aU

; x2 (U ) = 0; u = U

Es facil ver que no puede adoptar por valores de equilibrio /2, 3/2, . . .. Para estos
puntos de equilibrio es necesario poder imprimirle al aro una velocidad angular infinitamente grande,
lo cual es imposible fisicamente.

Ejemplo 1.18: p
endulo invertido sobre una plataforma m
ovil (modelo 1)

2L

.
mg
u


Mg

Figure 1.14: Pendulo invertido sobre una plataforma movil


Considerese el sistema que se muestra en la Figura 1.14. Las ecuaciones que describen el
comportamiento del angulo del pendulo invertido, de longitud 2L, con respecto a la direccion
vertical, as como el desplazamiento del movil desde un punto fijo (= 0 en el plano horizontal)
estan dadas por:
(mL cos ) + (J + mL2 ) = C + mLg sen
(M + m) + (mL cos ) = F + (mL sen ) 2 + u

(1.41)

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

21

En este modelo, las constantes C y F representan los coeficientes de friccion del movimiento
rotatorio del pendulo y del movimiento lineal del carrito. J es el momento de inercia con respecto
al centro de gravedad del pendulo y esta dado aproximadamente por J = mL3 /3.
Definimos, como variables de estado, el desplazamiento horizontal del carro , y su velocidad
as como el desplazamiento angular del pendulo y su velocidad angular correspondiente. La
,
variable de entrada u representa la fuerza con que se arrastra o se empuja al sistema, con el objeto
de controlarlo.
El par de ecuaciones diferenciales de segundo orden (1.41) se puede representar con respecto a
las derivadas de mayor orden de la siguiente forma:
"

"

J + mL2 mL cos
mL cos M + m

#1 "

C + mLg sen
F + mL sen 2 + u

(1.42)

es decir,
"

"

[(M + m)1 mL cos 2 ]


mL cos 1 + (J + mL2 )2

(1.43)

donde 1 = C +mLg
sen , 2 = F +mL sen 2 +u y = J(M +m)+mL2 (M +m sen 2 ).
Seleccionando como variables de estado
x3 = ; x4 =
x1 = ; x2 = ;

(1.44)

reescribimos las dos ecuaciones diferenciales de segundo orden anteriores como un sistema de cuatro
ecuaciones diferenciales de primer orden:
x 1 = x2
mL cos x3 1 + (J + mL2 )2
x 2 =

x 3 = x4
(M + m)1 mL cos x3 2
x 4 =

(1.45)

Ejemplo 1.19: p
endulo invertido sobre un m
ovil (modelo 2)
Consideremos otro modelo del problema de balancear un pendulo invertido montado sobre un
carrito o movil; en este caso tenemos un sistema de segundo orden. Las ecuaciones del movimiento
son:
x 1 = x2
g sen (x1 ) 0.5a mLx22 sen (2x1 ) a cos(x1 )u
x 2 =
4L/3 a mL cos2 (x1 )

(1.46)

donde x1 es el angulo en radianes, medido con respecto a la vertical, x2 la velocidad angular


asociada y u es la fuerza que se aplica al carrito (en Newtons).


CHAPTER 1. INTRODUCCION

22

Los puntos de equilibrio del sistema para u = U = constante, estan dados por:
"

X(U ) =

tan1 ( aU
g )
0

(1.47)

Ejemplo 1.20: manipulador rob


otico de una sola uni
on rgida

op
1:N
B
motor de corriente
continua

L
Mg

Figure 1.15: Manipulador robotico de union rgida


Considerese el manipulador robotico de una sola union que se muestra en la figura 1.15. El
modelo no lineal de este sistema se puede representar mediante las siguientes ecuaciones:
x 1 = x2

c
x1
1
B
+ u
x 2 = x2 sen
J
J
N
J
y = x1

(1.48)

donde x1 = p , x2 = p son las variables de estado y la variable de control esta dada por el torque
aplicado u = . N es el factor de reduccion angular del juego de engranajes que acopla el eje
del motor al eje del brazo manipulador. B es el coeficiente de friccion viscosa y J es el momento
de inercia; c es una constante emprica que iguala al triple del producto mgL. Siendo m la masa
del brazo, g la aceleracion de la gravedad y L la distancia del eje al centro de masa del brazo
manipulador.
El punto de equilibrio del sistema, parametrizado con respecto a la posicion angular deseada
X, esta dado por:

x2 (X) = 0; x1 (X) = X; u = U (X) = c sen

X
N

(1.49)

El punto de equilibrio del sistema, parametrizado con respecto al torque nominal U que produce
la posicion angular deseada X, esta dado por:

x2 (U ) = 0; x1 = X(U ) = N sen 1

U
c

; u=U

(1.50)

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

23

donde, evidentemente, debe cumplirse que U < c.


Adoptaremos la segunda de las parametrizaciones, pero nos sentiremos libres de cambiarla, si
tal fuese la necesidad, en base a las relaciones existentes entre ellas.

Ejemplo 1.21: p
endulo invertido controlado por un motor de corriente continua a
trav
es de un sistema de engranaje
Consideremos, otra vez, el pendulo invertido mostrado en la figura 1.15, controlado por un motor
de corriente continua. Para obtener el modelo se pueden plantear las siguientes suposiciones:
1. El motor es controlado por armadura.
2. La inercia del motor Jm es insignificante comparada con la inercia del pendulo invertido Jp .
3. Jp = ml2 , es decir, la inercia del pendulo es calculada como si la masa estuviese concentrada
en el extremo del pendulo de longitud l.
4. El sistema de engranajes no presenta histeresis (backlash). Todos sus elementos son rgidos.
5. Se desprecian las fuerzas de roce.
El esquema del motor de corriente continua controlado por armadura se presenta en la figura 1.8.
Tomando como variables de estado x1 = p , x2 = p = p , x3 = ia , el modelo queda expresado
por las siguientes ecuaciones:

x2
0
x 1

g
N Km
x 2 = l sen x1 + ml2 x3 + 0 u
1
Kb N
Ra
x 3
La x2 La x3
La

x1

y = [1 0 0] x2
x3

(1.51)

donde Km es la constante de torque del motor, Kb es la constante de fuerza contra electromotriz


(back emf , en ingles) y N es la relacion de engranajes.

Ejemplo 1.22: manipulador rob


otico flexible
Considere un manipulador robotico de un grado de libertad, con articulacion flexible, representado en la figura 1.16. Las ecuaciones diferenciales que gobiernan este sistema no lineal estan
dadas por:
JL + BL + M gL sen + k( ) = 0
Jm + Bm k( ) = u

(1.52)

donde es la posicion angular del brazo manipulador y es la posicion angular del eje del motor,
la cual es ligeramente diferente de la anterior en virtud de la flexibilidad del acoplamiento entre el


CHAPTER 1. INTRODUCCION

24

JL

o
Jm

k
MOTOR

BL
L

Bm

Mg
ARTICULACION FLEXIBLE

Figure 1.16: Manipulador robotico flexible


motor y el manipulador. Esta flexibilidad ha sido modelada como un resorte torsional. La variable
u representa el torque aplicado por el motor a su carga, constituida en este caso por el brazo
mecanico.
Definiendo como variables de estado las siguientes:
x1 = ;

x2 + ;

x3 = ;

x4 =

el modelo (1.52), en el espacio de estado, del manipulador flexible resulta ser entonces:
x 1 = x2
BL
k
M gL
sen x1
x2
(x1 x3 )
x 2 =
JL
JL
JL
x 3 = x4
Bm
k
x 4 =
x4 +
(x1 x3 )
Jm
Jm

(1.53)

Ejemplo 1.23: proceso de producci


on de etanol
Un proceso de fermentacion de azucar para la produccion de etanol se describe mediante el
siguiente par de ecuaciones diferenciales ordinarias:
x 1 = x2 x1 u
x 2 = x2 + (1 x2 )u

(1.54)

donde x1 representa la concentracion de etanol, x2 describe la concentraci


on de az
ucar y u es la
tasa de alimentacion del substrato que act
ua como variable de control.
Se desea regular la concentracion de etanol a un valor constante x1 = E. El punto de equilibrio
del sistema se obtiene a partir de las ecuaciones diferenciales, igualando a cero las derivadas de las
variables de estado:
1E
x1 = X1 (E) = E; x2 = X2 (E) = 1 E; u = U (E) =
(1.55)
E

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

25

Puesto que ambas concentraciones deben ser, necesariamente, positivas, tenemos las siguientes
restricciones en equilibrio para el sistema:
0 < X1 (E) = E < 1;

U > 0;

0 < X2 (E) < 1

(1.56)

Ejemplo 1.24: tanque de reacci


on (continuamente agitado) (modelo 1)

F
CAi
T

ALIMENTACION
TANQUE

FC
TC

V
CA
T
REFRIGERANTE

FC
TCi

CHAQUETA

PRODUCTO

F
CA
T

Figure 1.17: Tanque reactor continuamente agitado


En la figura 1.17 se presenta un esquema de un tanque de reaccion continuamente agitado,
TRCA, donde la reaccion A B es exotermica y de orden n. Consideremos las siguientes hipotesis:
El volumen del fluido en el TRCA es constante, su temperatura es homogenea gracias a la
agitacion.
La chaqueta en adiabatica.
La capacidad calorfica de la pared del tanque es despreciable respecto a la del lquido.
Las capacidades calorficas son independientes de la temperatura as como de las densidades.
El vapor es saturado, el condensado esta en equilibrio con el vapor.
El reactor y la chaqueta, se unen perfectamente.
Los vol
umenes y las propiedades fsicas son constantes.
Se consideran despreciables las perdidas de calor.


CHAPTER 1. INTRODUCCION

26

Las ecuaciones que modelan el comportamiento dinamico del sistema, resultantes de los balances
respectivos de masa y energa, estan representadas por:
Balance de masa del reactante A

dCA
n
= F ( CAi CA ) V k(T ) CA
dt

(1.57)

E
donde k(T ) = k0 exp( R(T +273.16)
).

Balance de energa en el tanque

Cp V

dT
n
= Cp F (Ti T ) HR V k(T ) CA
U A(T TC )
dt

(1.58)

Balance de energa en la chaqueta

CpC VC C

dTC
= U A(T TC ) FC CpC C (TC TCi )
dt

(1.59)

En las ecuaciones anteriores, u = FC 0 representa la se


nal de control (manipulada); CA es la
variable controlada y T representa la variable medida o salida. En la Tabla 1.1 se puede observar
el significado de cada una de las variables y parametros, con los respectivos valores nominales para
el ejemplo considerado.
Consideremos el siguiente modelo estatico para el comportamiento del flujo del refrigerante
debido a la accion de una valvula de igual porcentaje:
FC = FC max (1v)
donde v [0, 1] corresponde a la posicion de la valvula (0 = completamente cerrada, 1 = completamente abierta) y representa la verdadera se
nal de control. FC max es el valor maximo de la velocidad
del caudal volumetrico del refrigerante. es un parametro de funcionamiento de la valvula. Entonces, la representacion en variables de estado del modelo del TRCA, haciendo x1 = CA , x2 = T ,
x3 = TC , queda dada por:

x 1 =
x 2 =
x 3 =

F
(CAi x1 ) k(x2 )xn1
V
HR
UA
F
n
(Ti x2 )
k(x2 ) CA

(x2 x3 )
V
Cp
Cp V
UA
1
(x2 x3 )
(x3 TCi )FC max (1v)
CpC VC C
VC

E
donde k(x2 ) = k0 exp( R(x2 +273.16)
).

(1.60)

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

27

Table 1.1: Nomenclatura empleada en el modelo del tanque reactor continuamente agitado
Smbolo
T
CA
TC
FC

Cp
A
c
k0
HR
U
VC
CpC
E
F
CAi
Ti
R
TCi
a

Descripci
on
Variables de estado y control:
temperatura en el tanque [ C]
concentracion del reactante A
temperatura de la chaqueta
Flujo de entrada del refrigerante se
nal de
control
Par
ametros:
volumen del tanque [m3 ]
densidad del fluido en el tanque [kgmol/m3 ]
capacidad
calorica
del
reactante
[J/kgmol C]
area del tanque [m2 ]
densidad del refrigerante [kg/m3 ]
constante de Arrhenius [m3 /s kgmol]
calor de reaccion [J/kgmol]
coeficiente de transferencia de calor tanque
chaqueta [J/s m2 C]
volumen en la chaqueta [m3 ]
calor especfico del refrigerante [J/kg C]
energa de activaci
on de la reaccion
[J/kgmol]
flujo de entrada al tanque [m3 /s]
concentracion del reactante en el flujo de entrada [kgmol/m3 ]
temperatura del flujo de entrada [ C]
constante de los gases [J/kgmol K]
temperatura del refrigerante

Valor nominala
88.0
1.1298
50.48
0.0073

7.08
19.2
1.815e5
5.4
1000
0.0744
-9.86e7
3550
1.82
4184
1.182e7
7.5e-3
2.88
66
8314.39
27

Para las variables de estado y la se


nal de control, estos valores representan el punto de operaci
on nominal
o equilibrio.


CHAPTER 1. INTRODUCCION

28

Ejemplo 1.25: tanque de reacci


on continuamente agitado (modelo 2)
Considere el siguiente modelo de un TRCA en el cual una reaccion exotermica A B toma
lugar. El calor de reaccion es removido por medio de un lquido refrigerante que pasa a traves de
una chaqueta alrededor del reactor. El volumen V se considera constante.
Las ecuaciones diferenciales que modelan este sistema son las siguientes:
c =
T

Fi
(ci c) rA (c, T )
V
Fi
U At
(Ti T ) + JH rA (c, T )
(T Tc )
V
cp V

(1.61)

donde c es la concentracion molar de producto A en [mol m1 ], T es la temperatura del reactor en


[ K]. Los parmetros

considerados son: , densidad en [kg m3 ]; JH , calor de reaccion especfico


[mol1 m3 K]; ci , concentracion molar de A a la entrada [mol m1 ]; V volumen del TRCA [m3 ]; Ti
temperatura de entrada [ K]; At area efectiva de intercambio de calor [m2 ]; cp capacidad calorfica
[J kg 1 K 1 ]; rA (c, T ) representa la tasa de reaccion para el compuesto A [m3 s1 ]; Fi flujo de
entrada [m3 s1 ]; Tc temperatura del refrigerante [ K], corresponde a la se
nal de control, u = Tc ; U
coeficiente de transferencia de calor [J s1 m2 K 1 ]. La tasa de reaccion es del tipo Arrhenius,
dada por:
rA (c, T ) = k0 cA exp(E/RT )
donde E, k0 y R son constantes.

Ejemplo 1.26: tanque de reacci


on continuamente agitado (modelo 3)
Considerese el siguiente modelo sencillo, de naturaleza no lineal, de un tanque continuamente
agitado en el cual se lleva a cabo una reaccion qumica, en fase lquida, de caracter isotermica entre
multicomponentes:
x 1 = (1 + Da1 )x1 + u
x 2 = Da1 x1 x2 Da2 x22
y = x1 + x2

(1.62)

donde x1 representa la concentracion normalizada (adimensional) CP /CP0 de una cierta especie P


en el reactor. Designaremos por Y = CP0 a la concentraci
on nominal total de las especies P y Q,
medida en [mol.m3 ]. La variable de estado x2 representa la concentraci
on normalizada CQ /CP0 de
la especie Q. La variable de control u se define como la relacion de la tasa de alimentaci
on molar por
unidad volumetrica de la especie P , designada mediante NP F , y la concentraci
on nominal CP0 , es
decir, u = NP F /F CP0 donde F es la tasa volumetrica de alimentaci
on en [m3 s1 ]. Las constantes
Da1 y Da2 se definen respectivamente como k1 V /F y k2 V CP0 /F siendo V el volumen del reactor,
en [m3 ], y las constantes k1 y k2 son las constantes de primer orden, dadas en [s1 ].

1.3. EJEMPLOS DE SISTEMAS NO LINEALES CONTROLADOS

29

CAf q Tf

CA q
A

qc

Tcf

qc Tc

Figure 1.18: Tanque reactor continuamente agitado, no isotermico

Ejemplo 1.27: tanque de reacci


on continuamente agitado (modelo 4)
Considere el tanque reactor (no isotermico), en el cual ocurre una reaccion exotermica A
B, presentado en la figura 1.18. El modelo del proceso esta representado por dos ecuaciones
diferenciales no lineales dadas por:
dCA
dt
dT
dt

=
=

q
E
(CAf CA ) k0 CA exp
V
RT

q
(H)k0 CA
E
(Tf T ) +
exp
V
Cp
RT
"

hA
c Cpc
qc 1 exp
+
Cp V
qc Cpc

!#

(Tcf T )

(1.63)

donde CA es la concentracion del componente A; T es la temperatura de la sustancia resultante. qc


es el flujo de entrada del refrigerante, el cual actua como variable de control; q es el flujo del substrato
de alimentacion al tanque; Tf es la temperatura del flujo de entrada; Tcf es la temperatura del
refrigerante a la entrada del sistema. Los parametros restantes son A, area; Cp , capacidad calorica,
E, energa de activacion; h, coeficiente de transferencia de calor para el TRCA; k0 , constante de la
reaccion; H, calor de reaccion; , densidad del lquido. El subndice c se refiere al refrigerante.

Ejemplo 1.28: hemostato (sistema bioreactor)


Considere el siguiente sistema bioreactor o hemostato:
x1 x2
+ ax2
x1 + Q
x1 x2
x 2 = bx2 +
x1 + Q
y = x2
x 1 = u + P

(1.64)

donde x1 y x2 representan las concentraciones de la masa de alimentaci


on y la de microoganismos,
respectivamente. Los parametros del sistema P, Q, a y b son constantes conocidas. El punto de


CHAPTER 1. INTRODUCCION

30

equilibrio, correspondiente a un valor constante u


de la variable de entrada u, esta dado por:
X1 =

bQ
;
1b

X2 =

u
+P
ba

Ejemplo 1.29: nivel de lquido en un tanque con flujo por gravedad


El siguiente modelo representa un sistema de nivel de lquido en un tanque con flujo por
gravedad:
Kf 2
Ap g
x2
x
L
A2p 1
1
x 2 =
(u x1 )
At
y = x2
x 1 =

(1.65)

donde x1 y x2 representan, respectivamente, la velocidad del caudal volumetrico del lquido que
sale del tanque a traves de una tuberia y la altura del lquido en el tanque. g es la constante de
aceleracion de gravedad, L es la longitud de la tuberia a la salida del tanque, Kf es un factor de
friccion y es la densidad del lquido, Ap es el area transversal de la tuberia y At es el area de la
base del tanque.

Ejemplo 1.30: sistema de nivel de lquido en un conjunto de tanques dispuestos en


cascada
Considerese el problema general de controlar la altura del lquido en el u
ltimo tanque Tn , de
una serie de n tanques identicos y no interactuantes, cuya entrada u(t) esta representada por el
flujo (no negativo), u 0, entregado al primer tanque y la salida esta constituida por la altura
del lquido en el n:esimo tanque. Si designamos por xi la altura en el i-esimo tanque, el modelo
dinamico que describe el sistema es el siguiente:
x 1 =
..
.
x i =

c
1
x1 + u
A
A
c
c
xi +
xi1 ; i = 2, 3, . . . , n
A
A

y = xn

donde c es una constante que representa la resistencia a la salida de lquido y A es el area de la


base de cualquiera de los tanques.
Para un valor constante del flujo de entrada u, el punto de equilibrio del sistema es, simplemente:
u = U ; xi (U ) = Xi (U ) =

U2
U2
;
i
=
1,
2,
.
.
.
,
n;
y(U
)
=
Y
(U
)
=
c2
c2

1.4. EJERCICIOS PROPUESTOS

1.4

31

Ejercicios Propuestos

Ejercicio 1.1: Modelado de un sistema masaresorteamortiguador

g2

g1

m
k2

k1
x

Figure 1.19: Sistema masaresorteamortiguador


Modele el sistema de dos masas de la figura 1.19 y obtenga una representaci
on en variables de
estado de dicho modelo. Considere dos casos:
1. Los terminos g1 , g2 , k1 , k2 son constantes y permiten obtener relaciones lineales en el modelo.
2. g1 y g2 son funciones que representan la caracterstica de cada resorte:
g1 () = a1 + b1 3
g2 () = a2 + b2 3
donde se corresponde a la elongacion del resorte.
Calcule los puntos de equilibrio del sistema.
(?)

Lecturas Recomendadas
Un tema intimamente relacionado al contenido de este captulo es el modelado de sistemas
reales a traves de ecuaciones diferenciales ordinarias. La clave del modelado de procesos
continuos de origen electrico, mecanico, qumico, biologico o de otra ndole, esta basada
fundamentalmente en tres aspectos:
Conocer exhaustivamente el proceso. Esto viene de estudiar el sistema y subsistemas
(planta, sensores, y actuadores) y los posibles efectos e interrelaciones involucrados.
Aplicar los principios de la fsica, la qumica, la termodinamica, etc. en las ecuaciones
de balance de masa y energa.
Proponer y fijar hipotesis simplificatorias razonables para hacer que el modelo del
sistema sea manejable o sea, al menos, de mediana complejidad.

32

CHAPTER 1. INTRODUCCION

Muchos de los textos relacionados con el control de sistemas lineales o no lineales proveen
habitualmente de algunos lineamientos basicos para enfrentar satisfactoriamente el modelado
de cierto tipo de sistemas. Sin embargo, al momento de acometer un proyecto en el cual
se necesita obtener un modelo suficientemente preciso de una planta o proceso real (en la
industria, por ejemplo) hace falta tener conocimientos mas solidos y algo mas de experiencia.
De la noche a la ma
nana no es posible convertirse en un experto en dise
no de modelos
continuos, de hecho, esta cualidad depende del area de trabajo y de la experiencia del
modelador, del dominio de las herramientas matematicas y del uso adecuado de hipotesis
simplificatorias. Una buena practica consistira en replantear el modelado de algunos de los
ejemplos presentados hasta este momento y entender como se obtuvo cada modelo y cuales
fueron las hipotesis simplificatorias involucradas.
Para afianzar algunos de estos conceptos existen amplias y detalladas referencias al respecto. Puede ser de utilidad revisar e investigar la informacion contenida en textos de
circuitos lineales y no lineales, textos de mecanica racional (estatica y dinamica), textos
sobre procesos qumicos (la parte referida a control), etc.

Chapter 2
Esquema de Dise
no de Leyes de
Control basadas en Linealizaci
on
Posicion del movil

Angulo

0.5

600

0.4
400
0.3
200
0.2
0.1
0

0.5

0
0

0.5

Posicion del cg
2.5
2
1.5
1
0.5
0
0

0.5

El diseno de leyes de control para un sistema real requiere seguir una metodologa sistematica
que permita probar y poner en funcionamiento el sistema de control en lazo cerrado.
Nuestro proposito en este captulo sera el de hacer explcita una metodologa para el diseno
la cual permite afrontar en forma sistematica los metodos de control basados en la linealizacion
del modelo no lineal del sistema real.

33

DE LEYES DE CONTROL BASADAS EN LINEALIZACION

34CHAPTER 2. ESQUEMA DE DISENO

2.1

Introducci
on

Las leyes o estrategias de control que se dise


naran en los siguientes captulos tienen el objetivo
principal de estabilizar o regular el comportamiento de sistemas no lineales controlados
alrededor de trayectorias de equilibrio deseadas. En esta seccion presentaremos un esquema
o procedimiento de dise
no ad hoc de leyes de control para sistemas no lineales. Como veremos
a continuacion, este enfoque nos facilitara analizar, al menos conceptualmente, cualquiera
de los metodos de dise
no que utilizaremos. Gracias a este enfoque estudiar, ademas, algunos
otros metodos de dise
no los cuales hemos preferido pasar por alto en la realizacion de estos
apuntes. En lo sucesivo, nos ocuparemos de estudiar fundamentalmente tres metodos de
dise
no de leyes de control para sistemas no lineales, los cuales hemos ubicado en el texto de
acuerdo a su nivel complejidad: linealizaci
on aproximada, linealizaci
on extendida y
el m
etodo de la linealizaci
on exacta.

2.2

Esquema Propuesto

Empleando como marco de referencia el esquema general propuesto en la Figura 2.1, procederemos a analizar someramente cada una de las estrategias de dise
no de leyes de control
para sistemas no lineales controlados. Notemos que el esquema presentado constituye un
diagrama de bloques que ilustra los posibles pasos a seguir en cualquier proceso iterativo de
dise
no de leyes de control.
Nuestro objetivo central durante el desarrollo de estas notas sera el de presentar metodos
de dise
no estrechamente asociados al deseo de linealizar el sistema no lineal dado. Este
afan viene del hecho de que, en el caso de los sistemas lineales, disponemos de estrategias
de dise
no muy bien definidas y probadas durante a
nos, tanto en forma teorica como en la
practica. Esta facilidad que nos proveen los sistemas lineales es usada corrientemente en el
ambito de los sistemas no lineales. La herramienta fundamental que nos permite establecer
esta conexion entre los sistemas lineales y los sistemas no lineales controlados sera el metodo
de linealizaci
on, ver la indicacion (1) del diagrama presentado en la Figura 2.1.
El resultado directo de la linealizacion es el sistema linealizado, ver (2). Este sistema
dependera estrechamente del o de los puntos de equilibrio del sistema no lineal; en ciertas ocasiones, en lugar de trabajar con un sistema lineal, dispondremos de una familia de
sistemas linealizados parametrizados respecto a puntos de equilibrio genericos de la forma
(U, X(U ), Y (U )), ver seccion anterior. El sistema lineal obtenido nos permitira estudiar mas
facilmente propiedades locales inherentes del sistema no lineal, tales como controlabilidad,
observabilidad, etc., y mas precisamente nos facilitara la aplicacion de las estrategias de
dise
no de leyes de control, ver (3).
La ley de control para el sistema lineal es elaborada a partir de metodos de dise
no para
sistemas lineales, es decir, es obtenida usando herramientas de dise
no en el espacio de estados
(matrices de controlabilidad y observabilidad, analisis matricial, polinomios caractersticos,
controladores y observadores dinamicos de estado, etc.) o en el plano de la frecuencia (diagrama de Nyquist, lugar de las races, metodo de ZieglerNichols, compensadores P, PI,

(se estudia el rango de aplicabilidad, robustez, etc.,


de la estrategia de control diseada)

aplicacin al sistema no lineal


objetivos: estabilizacin o regulacin,
seguimiento de seales, etc.

Validacin de la estrategia de control no lineal:

Sistema no lineal
controlado

linealizacin

mtodo de

Ley de control
no lineal

Sistema lineal
(parametrizado)

Ley de control
para el sist. lineal
(parametrizada)

(proceso inverso a la linealizacin)

mtodo de transformacin
"NO LINEALIZACIN"

para sistemas
lineales

mtodos
de diseo

especificaciones
de diseo:
(tiempo de asentamiento,
sobredisparo mximo, etc)

aplicacin al sistema linealizado


objetivos: estabilizacin o regulacin,
seguimiento de seales, etc.

Validacin de la estrategia de control lineal:

2.2. ESQUEMA PROPUESTO


35

Figure 2.1: Esquema general de diseno de leyes de control para sistemas no lineales controlados

DE LEYES DE CONTROL BASADAS EN LINEALIZACION

36CHAPTER 2. ESQUEMA DE DISENO


PID, redes compensadoras en adelanto, adelantoatraso, etc.), de acuerdo a la configuracion
entradaestado o entradasalida disponible en el sistema. La estrategia de control dise
nada
puede ser validada inicialmente para el sistema lineal obtenido, ver (4). Esto conduce a
un proceso de dise
no iterativo en el cual se verifican, o se replantean, las diferentes especificaciones de dise
no originalmente propuestas, de acuerdo a los resultados obtenidos. Esto
constituira una etapa de redise
no de las leyes de control. Por ello, se representa esta parte
en el diagrama como un lazo cerrado entre los pasos (2), (3) y (4).
Si el estudio (analtico o a traves de simulaciones) de la estrategia de control asegura un
desempe
no adecuado, procedemos a transformar tal estrategia de manera que sea aplicable
al sistema no lineal. A este proceso lo hemos denominado No Linealizaci
on, ver (5). Los
metodos de tranformacion que utilicemos en esta parte consistiran en una especie de inversion
del metodo de linealizacion empleado anteriormente. Tales transformaciones podran ser
lineales o no lineales de acuerdo al metodo empleado para dise
nar las leyes de control del
sistema no lineal (sea linealizacion aproximada, extendida o exacta).
La ley de control resultante, ley de control no lineal, sera la estrategia que aplicaremos directamente al sistema no lineal, ver (6). Esta ley podra ser verificada por medio
de diferentes procedimientos: linealizacion, transformaciones lineales o no lineales, etc. Sin
embargo, su aplicacion al sistema no lineal requiere, al igual que en el caso lineal, de un
proceso de validacion, ver (7), el cual habitualmente es llevado a cabo por medio de simulaciones. En esta etapa de prueba se estudia el rango de aplicabilidad (el dominio o regi
on
de operaci
on) de la ley de control dise
nada; se estudian las diferentes propiedades asociadas
a la estrategia de control, sus ventajas y desventajas (tales como estabilizacion, regulacion
alrededor de condiciones constantes de operacion, seguimiento de se
nales, etc.) y se eval
ua
la robustez de la estrategia (p.e. respecto a conocimento impreciso del modelo no lineal,
perturbaciones, etc.).
Analicemos a continuacion las diferentes estrategias mencionadas: linealizacion aproximada, linealizacion extendida y linealizacion exacta, en funcion del diagrama de dise
no
presentado en la Figura 2.1, atendiendo al m
etodo de linealizaci
on, el sistema linealizado, la ley de control lineal y su aplicaci
on en el sistema lineal, el metodo de
transformacion o no linealizaci
on y, por u
ltimo, la aplicaci
on al sistema no lineal.
Linealizaci
on aproximada. Primeramente se estudiaran los metodos basados en la linealizaci
on aproximada o jacobiana. Conceptualmente, constituye la estrategia mas
sencilla de entender y aplicar. Esta intimamente ligada a la validez de la aproximacion
de primer orden de la expansion en serie de Taylor de la funcion f (x, u) que describe el
comportamiento del sistema no lineal. La ley de control se define mediante la expresion
u = K x , donde K es un vector n-dimensional.
Observando cuidadosamente el diagrama presentado en la Figura 2.1, podemos distinguir cada uno de sus elementos de la siguiente manera:
1. metodo de linealizacion: linealizacion jacobiana basada en los terminos de primer
de la expansion en serie de Taylor. El sistema lineal obtenido esta representado

2.2. ESQUEMA PROPUESTO

37

en variables transformadas x , u y y , tambien llamadas variables incrementales;


estas variables conservan el significado fsico de las variables no lineales originales.
2. el sistema linealizado, la ley de control lineal y su aplicacion: empleareamos las
diferentes estrategias de dise
no conocidas para sistemas lineales.
3. el metodo de transformacion o no linealizacion: para que la ley de control dise
nada
sea aplicable al sistema no lineal original es necesario utilizar una transformacion
que lleve las variables incrementales a las variables originales (x , u , y ) 7 (x, u, y);
en este caso la tranformacion empleada es lineal.
4. aplicacion al sistema no lineal: como veremos mas adelante, la caracterstica mas
importante a analizar sera el rango de validez de la ley de control obtenida.
El m
etodo de la linealizaci
on extendida. Constituye la extension mas simple del metodo
anterior. La ley de control no lineal dise
nada u(t) = k(x(t)) esta definida de tal forma
que su linealizacion alrededor del punto de equilibrio es equivalente a u = K x . Debido a este hecho la obtencion de la ley de control no es u
nica y se puede caracterizar
de acuerdo a m
ultiples enfoques.
1. metodo de linealizacion, sistema linealizado, ley de control lineal y su aplicacion:
esta parte del proceso de dise
no es equivalente a la realizada usando el metodo
de linealizacion aproximada, la diferencia fundamental estriba en la necesidad de
obtener parametrizaciones (U, X, Y ) del punto de equilibrio.
2. no linealizacion: mediante un cierto proceso de integracion se obtiene la ley de
control no lineal; la ley obtenida es equivalente, en forma local, a la ley de control
obtenida para el sistema linealizado.
3. aplicacion al sistema no lineal: se extiende el rango de aplicabilidad de la estrategia de control obtenida por linealizacion aproximada; el esquema empleado en este
caso puede ser la base de un metodo general de asignacion de las ganancias del
controlador de acuerdo a variaciones en las condiciones de operacion del sistema
real.
El m
etodo de la linealizaci
on exacta. Esta estrategia esta basada en la obtencion de
una transformacion de coordenadas z = (x) la cual permite transformar el sistema
no lineal, en forma exacta y sin ninguna aproximacion, en un sistema lineal susceptible
de ser controlado. Dentro de esta filosofa se incluye el metodo de la linealizaci
on
entradasalida. Las estrategias surgidas alrededor de este enfoque de dise
no estan
intimamente ligadas al uso de metodos matematicos obtenidos de la Geometra Diferencial.
1. metodo de linealizacion: se basa en una transformacion no lineal de coordenadas
x = 1 (z) obtenida a partir de las propiedades de integrabilidad de la funcion
f (x, u) y, especificamente, de sus campos vectoriales asociados. Para generar el
sistema lineal se usa una realimentacion estatica que cancele las no linealidades

DE LEYES DE CONTROL BASADAS EN LINEALIZACION

38CHAPTER 2. ESQUEMA DE DISENO


remanentes en el sistema; este sistema lineal es equivalente exactamente y sin
ninguna aproximacion al sistema no lineal. A diferencia de los metodos anteriores, para poder considerar cualquier tipo de aplicacion practica se tiene el inconveniente de requerir de un modelo muy preciso del sistema real. Las variables
transformadas pierden el significado fsico de las variables originales.
2. sistema linealizado, la ley de control lineal y su aplicacion: el proceso de dise
no
sigue las mismas pautas al empleado en las estrategias de dise
no basadas en
linealizacion aproximada o extendida.
3. no linealizacion: la estrategia de control no lineal se obtiene transformando las
variables z del sistema linealizado en las variables originales x mediante la tranformacion no lineal inversa z = (x); la ley de control no lineal definitiva resulta de
emplear conjuntamente este cambio de coordenadas y la realimentacion estatica
propuesta anteriormente.
4. aplicacion al sistema no lineal: se extiende el rango de validez de los dos metodos
anteriores, en algunos casos practicos, es de caracter global; la aplicacion practica
de la linealizacion exacta, sin embargo, se ve afectada grandemente por las imperfecciones del modelo no lineal respecto al modelo real. La dimension y complejidad
del modelo no lineal estudiado son tambien factores que afectan la confiabilidad
de este tipo de dise
no.
Basada en el esquema propuesto en la Figura 2.1, la discusion anterior solo constituye una
breve revision de los metodos de dise
no que estudiaremos detalladamente en los captulos
siguientes, en ning
un caso pretende ser un analisis concluyente de las ventajas y desventajas
de las diferentes estrategias.
La practica y la destreza del ingeniero de control constituyen los elementos fundamentales
que, en u
ltimo termino, decidiran si las caractersticas de un dise
no particular seran mas
u
tiles que las de cualquier otro metodo al momento de acometer el problema practico de
dise
no de leyes de control en el sistema real controlado.

Lecturas Recomendadas
Diversos textos podran mencionarse que permitan brindar un panorama general de la
filosofa de dise
no implicada en todo proyecto asociado a un sistema de control de tipo
practico. Interesantes lecturas en este sentido son, en opinion de los autores, las siguientes:
El captulo 1 del texto de Doyle, Francis, Tannenbaum: Feedback control systems, etc.
El capitulo 1 del texto de el autor de LMI, etc.

Part I
El M
etodo de la Linealizaci
on
Aproximada

39

Chapter 3
El M
etodo de la Linealizaci
on
Aproximada

Cortesa de Boeing Company

Nuestra comprension del mundo circundante y las leyes que en el adivinamos son meras aproximaciones que tienden a extraer la parte mas relevante de su naturaleza, la mayora de las veces
para poder explotarlas en nuestro beneficio inmediato. Tales aproximaciones se sustentan como
modelos validos de una realidad restringida que no ha sido contradicha por la experiencia cotidiana. Desde este punto de vista, los fenomenos de naturaleza no lineal son tambien susceptibles
de aproximaciones lineales cuyo valor practico es innegable.
Nos proponemos utilizar sistemas de ecuaciones diferenciales lineales que aproximen, en una
region restringida del espacio de estado, de las entradas y de las salidas del sistema, el comportamiento descrito por el conjunto de ecuaciones diferenciales no lineal original. El metodo de la
linealizacion aproximada es util en el analisis del comportamiento de sistemas dinamicos no lineales en la vecindad de su punto de equilibrio cuando las perturbaciones que afectan la evolucion
del sistema son suficientemente pequenas. El metodo tambien es util no solo en el analisis sino
tambien en el diseno de estrategias de control que mantengan la evolucion del sistema en un
entorno alrededor del punto de equilibrio nominal.
41


APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

42

3.1

Introducci
on

En los proximos captulos, utilizaremos la aproximacion lineal para proponer esquemas de


control realimentado en sistemas no lineales. Fundamentalmente trataremos sistemas de una
entrada y una salida. Los esquemas propuestos se clasificaran de la siguiente manera:
1. Esquemas basados en la descripcion de estado (esquemas en el espacio de estados):
(a) Control mediante Realimentacion del Vector de Estados.
(b) Control mediante la Realimentacion de la Salida utilizando Observadores Dinamicos
de Estado. Observadores de Orden Completo y Observadores de Orden Reducido.
2. Esquemas de control clasicos basados en la funcion de transferencia (m
etodos frecuenciales):
(a) Controladores P, PI, PID.
(b) Controladores basados en el esquema ControladorObservador Clasico.
(c) Controladores por Redes Compensadoras de Adelanto y Adelanto-Atraso.
En este captulo introduciremos la tecnica de linealizacion aproximada basada en una
representacion integral de las ecuaciones de estado. Proponemos ver al sistema no lineal
como una ecuacion integral y analizaremos el efecto de peque
nas perturbaciones alrededor
de un punto de equilibrio constante. Despreciando los terminos de orden superior del efecto
de tales perturbaciones y reteniendo solamente los terminos lineales, presentaremos en un
solo esquema la linealizacion que aproxima el comportamiento del sistema perturbado.

3.2

El M
etodo de la Linealizaci
on Aproximada

Los lineamientos mediante los cuales analizaremos los sistemas dinamicos no lineales, y sobre
los cuales propondremos lazos de control en realimentacion, son los siguientes:
Consideracion del sistema no lineal desde el punto de vista de la descripcion por variables de estado y determinacion de los puntos de equilibrio constantes del sistema no
lineal dado.
Descripcion aproximada de los efectos de las perturbaciones del estado inicial y de las
entradas al sistema, mediante un modelo lineal dinamico de estado.
Utilizacion del modelo lineal en la prescripcion de leyes de control realimentadas estabilizantes de las trayectorias del estado, perturbadas alrededor de la trayectoria de
equilibrio.


APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION

3.2.1

43

Linealizaci
on mediante expansiones en serie de Taylor

Considerese el sistema no lineal:


x(t)

= f (x(t), u(t)),
y(t) = h(x(t))

x(t0 ) = x0
(3.1)

cuyos puntos de equilibrio son constantes, dados por (U, X, Y ).


Escribiremos este sistema de ecuaciones diferenciales como una ecuacion integral equivalente, de la manera siguiente:
x(t) = x0 +

Z t
t0

y(t) = h x0 +

f (x(), u())d
Z t
t0

f (x(), u())d

(3.2)

Esta representacion tiene sus ventajas al momento de evaluar el efecto causado sobre los
estados y las salidas debido a posibles perturbaciones que se sucedan en el estado inicial x0
y en la funcion de entrada u(t).
Supondremos que el sistema dinamico se encuentra operando en perfecto equilibrio. Esto
se traduce en lo siguiente:
x(t0 ) = x0 = X;

u(t) = U ;

y(t) = h(x) = Y

(3.3)

Es decir, el estado inicial en que encontramos operando al sistema en el instante t0


coincide enteramente con el estado de equilibrio constante X, el cual se produce de manera
inmutable sobre la base de sustentar la entrada constante u = U durante un perodo de
tiempo indefinidamente grande.
Consideremos sendas perturbaciones en el estado inicial de equilibrio x0 = X y en la
funcion de entrada de equilibrio u(t) = U , descritas de la manera siguiente:
x(t0 ) = x0 + x0 = X + x0 ;

u(t) = U + u (t)

(3.4)

Correspondiente con estas perturbaciones acaecidas alrededor de los valores de equilibrio,


se suceden cambios o perturbaciones tanto en el estado de equilibrio constante del sistema
x(t) = X como en el valor de la salida y(t) = Y . Utilizando las ecuaciones (3.2) podemos
describir estas perturbaciones de la manera siguiente:
x(t) = X + x0 +

Z t
t0

y(t) = h(X + x (t))

f (X + x (), U + u ())d
(3.5)

La representacion (3.5) constituye una representacion exacta del efecto de las perturbaciones pero ciertamente una que no es muy u
til puesto que sigue describiendo mediante una
ecuacion integral el valor del nuevo estado x(t) = X + x (t) y como una relacion no lineal

44

APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

el valor de la nueva salida y(t) = Y + y (t). En efecto a partir de (3.5) y de las definiciones
que acabamos de dar del estado perturbado y la salida perturbada, obtenemos:
x (t) = x0 +

Z t
t0

f (X + x (), U + u ())d

y (t) = h(X + x (t)) h(X)


Es preferible, por lo tanto, una aproximacion. Sabemos que, en virtud del Teorema de
expansion en serie de Taylor, podemos escribir los valores perturbados de las funciones f ()
y h() como :

f
f

x (t) +

u (t) + . . .
f (X + x (t), U + u (t)) = f (X, U ) +
x (X,U )
u (X,U )

h
h(X + x (t)) = h(X) +
x (t) + . . .
x X

(3.6)

Tomando en cuenta que f (X, U ) = 0, podemos calcular el valor del estado perturbado
como:
Z t

f
f

x (t) = x0 +

x (t) +
u (t) + . . . d
x (X,U )
u (X,U )
t0
"

y (t) =

h
h
h(X) +
x (t) + . . . h(X) =
x (t) + . . .
x X
x X

Evidentemente que si truncamos la serie de Taylor, tanto en la ecuacion integral del estado
perturbado como en la ecuacion de salida, y despreciamos los terminos de orden superior, que
quedaron tacitos en los puntos suspensivos utilizados en las formulas anteriores, obtendremos
solo una aproximacion a los valores de x (t) y de y (t). Adoptaremos como valor aproximado
de x (t) al valor x (t) el cual obtenemos al eliminar todos los terminos de orden superior en
la ecuacion integral. Es decir:
Z t

f
f

x (t) = x0 +

x (t) +

u (t) d
x (X,U )
u (X,U )
t0

y (t) =

h
x
(t)
x X

(3.7)

Notese que x (t) no es exactamente igual a x (t) y otro tanto sucede con y (t) y y (t). Sin
embargo, no estableceremos diferencia entre el valor de la perturbacion y el valor aproximado
de la misma obtenido en (3.7). Asumimos, entonces, como valor perturbado del estado y
como valor de la perturbacion de la se
nal de salida, a la solucion de la ecuacion integral y a
la relacion lineal descritas en (3.7), i. e.
Z t

f
f

x (t) +

u (t) d
x (t) = x0 +
x (X,U )
u (X,U )
t0


APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION

45

y (t) =

h
x (t)
x X

(3.8)

Designaremos mediante la matriz A de n filas y n columnas, la matriz Jacobiana f /x


particularizada en el punto de equilibrio constante (X, U ). Mediante el vector B de n filas
designaremos al vector f /u evaluado en (X, U ). Igualmente designaremos mediante el
vector fila C al vector h/x evaluado en X.
La ecuaciones en (3.8) se reescriben entonces como:
x (t) = x0 +

Z t
t0

(A x () + B u ()) d

y (t) = C x (t)

(3.9)

Si tomamos derivadas respecto del tiempo en la ecuacion integral de (3.9), obtendremos


una ecuacion diferencial equivalente para x (t), habida cuenta de tomar como condicion
inicial en t = t0 , el valor x0 para dicho sistema de ecuaciones diferenciales:
x (t) = A x (t) + B u (t);
y (t) = C x (t)

x (t0 ) = x0
(3.10)

La ecuacion diferencial en la expresion (3.10) representa un sistema de ecuaciones diferenciales lineales en x (t) y en u (t), cuya solucion x (t) es una aproximacion al comportamiento
de las perturbaciones que exhibe el sistema no lineal (3.1) por sobre los valores de la trayectoria de equilibrio x(t) = X y u(t) = U . Es evidente que para conocer integramente la
solucion de (3.10) deben conocerse tanto el valor de la perturbacion del estado inicial x (t0 )
como los valores, en funcion del tiempo, de las perturbaciones de la entrada en equilibrio
u (t).
En resumen, el sistema dinamico que aproxima las perturbaciones ocurridas al sistema
no lineal cuando este opera en condiciones estables de equilibrio esta representado por un
sistema lineal cuyas ecuaciones de estado y de salida estan dadas por (3.10). Las matrices
constantes (A, B, C) que definen a esta aproximacion lineal estan dadas por:

f
A=

;
x (X,U )

f
B=

;
u (X,U )

h
C=

x X

(3.11)

u(t) = U + u (t);

y(t) = Y + y (t)

(3.12)

u (t) = u(t) U ;

y (t) = y(t) Y

(3.13)

y en forma aproximada tendremos igualmente:


x(t) = X + x (t);
o equivalentemente:
x (t) = x(t) X;

Sobre la base de estas relaciones aproximadas propondremos un esquema de control que


estabilice al sistema no lineal a su punto de equilibrio, bajo la suposicion fundamental de
tener excursiones de la perturbacion x (t) relativamente peque
nas. La interpretacion de los
valores perturbados en terminos de las variables originales admite una representacion grafica
como la que se muestra en la figura 3.1.


APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

46

u (t)

u(t)

.
x=f(x,u)

x(t)

x (t)

Figure 3.1: Relacion entre las variables originales y las variables perturbadas

3.2.2

Representaci
on en Funciones de Transferencia

A partir de la representacion de estados incrementales propuesta anteriormente, surge en


forma inmediata la representacion en funciones de transferencia asociadas al comportamiento
linealizado del sistema. Supongase que tenemos el sistema no lineal, n-dimensional, de una
entrada y una salida (3.1):
x(t)

= f (x(t), u(t))
y = h(x(t))
Sea u(t) = U un punto de operacion constante para la entrada escalar del sistema anterior.
Correspondiente con este valor nominal de la entrada, tenemos un valor de equilibrio para el
vector de estado y para la salida, dados, respectivamente, por x(t) = X(U ) y y(t) = Y (U ).
La expresion linealizada del sistema alrededor del punto de operacion generico
(U, X(U ), Y (U )),
parametrizada en terminos del valor constante de la entrada de control en equilibrio U , esta
dada por:
x = A(U )x + B(U )u
y = C(U )x
donde

A(U ) =

f (x, u)

;
x X(U ),U

C(U ) =

h(x)

x X(U )

(3.14)

f (x, u)
B(U ) =

;
u X(U ),U

y
x = x X(U ); u U ; y = y Y (U )
Evidentemente, a partir de esta representacion del sistema linealizado (ver figura 3.2)
podemos obtener la funcion de transferencia del sistema en lazo abierto, dada por:
GU (s) = C(U )[sI A(U )]1 B(U )

(3.15)


APROXIMADA
3.2. EL METODO
DE LA LINEALIZACION

u
ENTRADA
INCREMENTAL

GU(s)
FUNCION
DE
TRANFERENCIA

47

y
SALIDA
INCREMENTAL

Figure 3.2: Representacion entrada-salida del sistema linealizado

3.2.3

Ejemplos

Antes de proceder a exponer como utilizar este esquema conceptual, lineal, daremos algunos
ejemplos de linealizacion de sistemas alrededor de trayectorias de equilibrio constantes.


APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

48

Ejemplo 3.1: modelo promedio de un convertidor tipo Boost de corriente continua


La linealizacion del sistema (1.30) alrededor del punto de equilibrio (1.31) resulta en:
"

z1
z2

"

#"

0
0 (1 U )
0 (1 U )
1

z1
z2

"

b
1U
b1
0 (1U )2

y = z2

(3.16)

La funcion de transferencia que relaciona el voltaje incremental de salida con el valor incremental
de la relacion de trabajo, se obtiene del modelo linealizado (3.16) como:
GU (s) = 0 Z1 (U )

b
Z1 (U )
+ 02 (1

s
s2 + 1 s

(3.17)

U )2

Ejemplo 3.2: sistema de levitaci


on magn
etica
La evolucion de las perturbaciones de estado del modelo (1.36) estan gobernadas por el sistema
de ecuaciones diferenciales lineales obtenido del proceso de linealizacion alrededor de los valores de
equilibrio (1.37):

0
x 1

x 2 = X
x 3
0
y = x1

1
0
0
x1
q

cg
0 2 mX x2 + 0 u
1
x3
0
R
L
L
(3.18)

La funcion de transferencia asociada a este sistema esta dada por:


2
L

y (s)
GX (s) =
=
u (s)
s2

g
X

cg
mX

s+

R
L

(3.19)

Ejemplo 3.3: tanque de reacci


on con agitaci
on continua
El punto de equilibrio estable para (1.62) se calcula a partir de las ecuaciones del sistema como:
U
1
u = U ; x1 (U ) =
; x2 (U ) =
1 + Da1
2Da2

1 +

4Da1 Da2 U
1+
1 + Da1

(3.20)

La linealizacion del sistema alrededor de este punto de equilibrio esta dada por:
x 1 = (1 + Da1 )x1 + u
s

x 2 = Da1 x1
y = x1 + x2

1+

4Da1 Da2 U
x2
1 + Da1
(3.21)

TAN BUENO ES EL METODO

APROXIMADA?49
3.3. QUE
DE LA LINEALIZACION
como puede verificarse sin mayores esfuerzos.

Ejemplo 3.4: motor de corriente continua


Para una corriente de circuito de campo constante u = U , el punto de equilibrio del sistema
(1.26) esta dado por:
u = U ; x1 = X1 (U ) =

BVa
Va KU
; x2 = X2 (U ) =
2
2
Ra B + K U
Ra B + K 2 U 2

(3.22)

La linealizacion de este sistema alrededor del punto de equilibrio descrito anteriormente se obtiene
como:
"

x 1
x 2

Ra

= La
KU
J

K 2 Va U
KU "
#

x1
La (Ra B + K 2 U 2 )
La
+

B
K 2 BVa

x2

J
J(Ra B + K 2 U 2 )

(3.23)

3.3

Qu
e tan bueno es el M
etodo de la Linealizaci
on
Aproximada?

La linealizacion aproximada esta fundamentada en retener como valida para la descripcion


de un sistema en las vecindades de un punto de equilibrio, a aquella representacion que
se obtiene de los terminos de primer orden de la expansion en serie de Taylor de la nolinealidad que caracteriza al sistema como tal. Desde este punto de vista, las exigencias que
hemos impuesto al sistema son de diferenciabilidad por lo menos hasta un primer orden.
Es indudable que las cantidades que estamos despreciando al tomar como substitutos de las
verdaderas perturbaciones a los primeros terminos en la expansion, son cantidades que se
tornan cada vez mas importantes a medida que nos alejamos de las condiciones de equilibrio
del sistema. El deterioro de la representatividad que tiene la aproximacion lineal con respecto
al comportamiento verdadero, ocasionado por los efectos de las perturbaciones, puede hacerse
tan burdo que cualquier resultado o conclusion que obtengamos sobre su base puede llegar
a carecer de toda significacion cualitativa y cuantitativa.
Es oportuno se
nalar que el metodo de la linealizacion aproximada, tambien llamada
linealizaci
on jacobiana, no es aplicable a sistemas que exhiban no linealidades carentes de
derivadas. As, por ejemplo, el siguiente sistema no puede ser aproximado, bajo ninguna
justificacion razonable, mediante la tecnica que hemos descrito:
x = sign x

(3.24)

Es facil ver, sin embargo, que este sistema tiene por punto de equilibrio x = 0 (cuyo
signo tambien se supone cero). Justamente en el origen, la funcion signo, designada aqu
mediante las siglas sign , no es diferenciable sobre la recta real.

50

APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION
u=U

h
c
A

Figure 3.3: Sistema de un tanque con perdida de lquido.


Mostraremos un sencillo ejemplo el cual nos permitira comprender cual es el grado de representatividad del comportamiento verdadero del sistema no lineal, sujeto a perturbaciones
de magnitud creciente, que puede tener la aproximacion de primer orden que se emplea en
el metodo de la linealizacion aproximada.

Ejemplo 3.5: un simple sistema no lineal: tanque con p


erdida de lquido
Considerese el tanque de la figura 3.3, el cual se alimenta a una rata constante u = U [m3 /s]
con un cierto lquido. A es el area de la base del tanque y h representa la altura del nivel del
lquido medido desde la base del recipiente. La constante c representa un coeficiente de resistencia
al escape del lquido.
La ecuacion diferencial que describe la variaci
on de altura del lquido esta dada por :
c
1
h =
h+ u
A
A
y = h

(3.25)

El punto de equilibrio del sistema, para un valor de entrada constante, u = U , esta dado por
h = H = U 2 /c2 . Considerese una peque
na perturbacion en el valor constante del control dada por
un s
ubito incremento fijo en la rata de alimentaci
on de lquido al tanque, de valor U , durante un
perodo de tiempo indefinido.
Nuestro objetivo es calcular, mediante linealizacion aproximada, el efecto de esta perturbacion
y compararlo con un calculo preciso (es decir, sin aproximaciones) del nuevo valor de la altura del
tanque en equilibrio. (Ver figura 3.4).
De acuerdo a la ecuacion diferencial del sistema, el valor del nuevo estado de equilibrio (la nueva
altura del nivel del lquido) esta dada por:
H + h =

(U + U )2
U 2 2U U + U 2
=
+
c2
c2
c2

(3.26)

TAN BUENO ES EL METODO

APROXIMADA?51
3.3. QUE
DE LA LINEALIZACION
U+u (t)

t
t0

Figure 3.4: Perturbacion de la senal de entrada al tanque


es decir, el valor exacto del efecto de la perturbacion de entrada sobre la altura final del nivel del
lquido esta dada por :
2U U + U 2
h =
(3.27)
c2
Por otro lado, el sistema linealizado alrededor del punto de equilibrio esta dado por:
h =

c
1
h + u
A
2A H

y = h

(3.28)

El valor final de h a un escalon de excitacion u = U en este sistema linealizado esta dado


por el valor de equilibrio del sistema lineal a una entrada constante. Este valor es simplemente
h =

2
2U U
Hu =
c
c2

(3.29)

El error que se comete, en este ejemplo, al utilizar la linealizacion aproximada tiene una magnitud cuadratica respecto de la perturbacion de entrada y esta dado por (U/c)2 . El metodo
de linealizacion es valido en la medida en que el termino (U/c)2 sea completamente despreciable frente al valor de equilibrio de la perturbacion que hemos calculado de manera aproximada
2U U/c2 . Por lo tanto, si U es grande, el error cometido es significativo.

Como veremos mas adelante, el dise


no basado en el sistema linealizado funcionara en
forma efectiva, al menos en un entorno peque
no alrededor del punto de operacion deseado,
para el sistema no lineal original, e incluso para el sistema real, asumiendo que el modelo
es lo suficientemente preciso. El hecho de que las aproximaciones de primer orden pueden
resultar suficientes para caracterizar el comportamiento local de un sistema, constituye
uno de los mas importantes en la teora de control y en muchas areas de la matematica, y
se puede establecer en la siguiente forma:
Validez de la Linealizacion Aproximada
El metodo de la linealizaci
on aproximada es valido en tanto que las perturbaciones
que afectan al comportamiento del sistema no lineal, operando en equilibrio, sean
peque
nas, relativas a los valores de equilibrio de las variables del sistema. La


APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

52

aproximaci
on se deteriora en forma, cuando menos cuadratica, al admitir perturbaciones que representan excursiones significativas a partir de los valores de
equilibrio de las variables de entrada y estados iniciales del sistema.

3.4

c
Primer ejemplo en Matlab

El siguiente ejemplo es el primero que presentaremos en el cual se emplea el programa


c como herramienta auxiliar al analisis y a los dise
Matlab
nos que propondremos. Rec
comendamos al lector familiarizarse con Matlab ya que el mismo nos sera u
til durante el
desarrolo de estos apuntes al momento de ilustrar las propiedades de los sistemas no lineales
c es un ambiente numerico de proposito general orientado al uso de
controlados. Matlab
estructuras de tipo vectorial y matricial, especialmente, el cual permite ejecutar algoritmos
secuenciales con una amplia gama de aplicaciones. La aplicacion principal que le daremos
sera como programa de simulacion numerica, es decir, haremos uso de los algoritmos que
tiene disponibles para la obtencion de las soluciones de sistemas de ecuaciones diferenciales
de primer orden.

3.4.1

Modo de uso

En general, para simular un sistema no lineal controlado, se requieren dos programas que
llamaremos el programa de simulacion y el sistema de control (o function). El programa de
simulacion permite definir los lineamientos basicos de la simulacion: tiempo de simulacion
(inicial y final), condiciones iniciales y tipo de algoritmo de simulacion, inclusive podemos
definir los parametros del sistema controlado y hasta graficar los resultados de la simulacion.
Este programa consiste en un conjunto logico de instrucciones de ejecucion secuencial dec El corazon principal de este programa es el
nominado script en el ambiente Matlab .
algoritmo de simulacion. Tenemos dos tipos: ode23 o ode45, los cuales son metodos de
resolucion de ecuaciones diferenciales mediante las formulas de Runge-Kutta de 2do. y 3er.
orden (ode23) y 4to. y 5to. orden (ode45).
El sistema de control se presenta por medio de un programa o funcion en el cual se
plantean explcitamente las ecuaciones diferenciales asociadas al sistema de control. Junto
con estas ecuaciones, la ley de control dise
nada puede estar definida a traves de variables
auxiliares (locales). A diferencia del script, este programa requiere un encabezado con la
palabra function <salida> = <nom arch>(t,x), donde <salida> corresponde al vector
x que refleja la dinamica del sistema, <nom arch> es el nombre original del programa y
(t,x) representan las variables de tiempo y de estado correspondientes de la simulacion y
del sistema controlado.

Ejemplo 3.6: p
endulo invertido sobre una plataforma m
ovil
Considere el sistema de control del pendulo invertido sobre una plataforma movil ya visto
c mediante los cuales
(1.45). A continuacion se presenta los programas de simulaci
on en Matlab

c
3.4. PRIMER EJEMPLO EN MATLAB

53

se pueden comparar las respuestas del sistema linealizado (3.31) y del sistema no lineal en lazo
abierto. Tomaremos como salida la posicion del centro de gravedad (cg) del pendulo y(t) = x1 (t) +
L sen (x3 (t)).
El contenido de cada programa se puede describir de la siguiente manera. El programa spend.m
permite simular el modelo no lineal, mpend.m contiene el modelo no lineal del sistema y lpend.m
genera la comparacion entre el modelo lineal y el modelo no lineal. Nota: el smbolo % al comienzo
de una lnea indica los comentarios que se hacen en pro de claridad.
c se ejecutan los programas:
Desde Matlab
> spend
> lpend

Programa de simulaci
on del sistema no lineal:
%% spend.m
%% Programa de simulacion del modelo
%% del pendulo invertido sobre una plataforma movil.
%% Parametros
global M F r0 u0 m L J C g
%% Movil (Cart )
M = 0.48; % masa
F = 3.83; % constante de friccion
%% Pendulo
m = 0.16; % masa
L = 0.25; % longitud del pendulo (distancia entre el eje y el centro de
% gravedad)
J = 0.0043; % momento de inercia alrededor del centro de gravedad
C = 0.00218; % constante de friccion
g = 9.8; % aceleracion de gravedad
%% condiciones iniciales
x0 = [0.4 0 pi/40 0];
%% tiempo de simulacion
ti = 0;
tf = 1;
[t,x] = ode45(mpend,ti,tf,x0,1e-6,1);
subplot(221),plot(t,x(:,1)),title(Posicion del movil),grid
subplot(222),plot(t,x(:,3)),title(Angulo de rotacion del pendulo),grid
subplot(223),plot(t,x(:,1)+L*sin(x(:,3))),title(Posicion del c.g. del %%@
pendulo),grid
% fin de spend.m

Modelo del sistema:


%% mpend.m
%% modelo del pendulo invertido sobre una plataforma movil
%% para utilizarlo hay que ejecutar el programa spend.m
function xdot = mpend(t,x)
%% Parametros
global M F r0 u0 m L J C g
u = 0;


APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

54

D1 = -C*x(4)+m*L*g*sin(x(3));
D2 = -F*x(2)+m*L*sin(x(3))*x(4)^2+u;
D = J*(M+m)+m*L^2*(M+m*sin(x(3))^2);
xdot = [x(2);
(-m*L*cos(x(3))*D1+(J+m*L^2)*D2)/D;
x(4);
((M+m)*D1-m*L*cos(x(3))*D2)/D];
%% fin de mpend.m

Inclumos el siguiente script a manera de ilustracion de algunas de las instrucciones que se


c en el caso de simulaci
pueden emplear en Matlab
on de sistemas lineales. Las graficas permiten
observar las simulaciones anteriores y comparar con los resultados en el caso lineal.
Simulaci
on del sistema lineal:
%%
%%
%%
%%
%%
%%

lpend.m
Modelo incremental
pendulo invertido sobre una plataforma movil.
Se debe ejecutar despues de spend.m
Los parametros son los mismos de spend.m

Dt = J*(M+m)+M*m*L^2;
A
0
0
0

=
[0 1 0 0;
-F*(J+m*L^2)/Dt -m^2*L^2*g/Dt m*L*C/Dt;
0 0 1;
m*L*F/Dt (M+m)*m*L*g/Dt -C*(M+m)/Dt];

B =
[0;
(J+m*L^2)/Dt;
0;
-m*L/Dt];
C = [1 0 L 0]; %% Consideramos como salida la posicion
%% del centro de gravedad y = x_1+L*sin(x_3)
D = 0;
T = (0:0.05:tf);
U = zeros(size(T));
%% condiciones iniciales x0, ver spend.m
[Y,X] = lsim(A,B,C,D,U,T,x0);
subplot(221),plot(t,x(:,1),y--,T,X(:,1),r),
title(Posicion del movil),grid
subplot(222),plot(t,x(:,3)*180/pi,y--,T,X(:,3)*180/pi,r),
title(Angulo de rotacion del pendulo),grid
subplot(223),plot(t,x(:,1)+L*sin(x(:,3)),y--,T,Y,r),
title(Posicion del cg),grid
%% fin de lpend.m

En la figura 3.5 se puede observar la equivalencia local entre el modelo linealizado y el modelo
no lineal original.

3.5. EJERCICIOS PROPUESTOS

55

Posicion del movil

Angulo

0.5

600

0.4
400
0.3
200
0.2
0.1
0

0.5

0
0

0.5

Posicion del cg
2.5
2
1.5
1
0.5
0
0

0.5

Figure 3.5: Comportamiento local del sistema lineal (lnea continua ) y el sistema no lineal
(trazos - -)

3.5

Ejercicios Propuestos

Ejercicio 3.1: p
endulo invertido sobre una plataforma m
ovil
Dejamos como ejercicio verificar que en el punto de equilibrio
x1 = arbitrario; x2 = 0; x3 = 0; x4 = 0

(3.30)

la linealizacion del sistema (1.45), con x = (x1 , x2 , x3 , x4 )T , se expresa de la siguiente manera:


x = Ax + Bu

(3.31)

donde

A =

f
=

x (xe ,ue )=(0,0)

B =

f
u

=
(xe ,ue )=(0,0)

0
1
F (J+mL2 )
0

0
0
mLF
0

0
J+mL2

0
mL

0
2

0
2g

L
m

(M +m)mLg

F (mLC

+m)
C(M

= J(M + m) + mL2 M .
donde
(?)
Ejercicio 3.2: Matlab

proceso de producci
on de etanol

56

APROXIMADA
CHAPTER 3. EL METODO
DE LA LINEALIZACION

Obtenga el modelo incremental del sistema (1.54) alrededor del punto de equilibrio (1.55).
Obtenga las simulaciones numericas del comportamiento del sistema linealizado ante una se
nal
escalon en lazo abierto u (t) = 0.2, con una concentraci
on de etanol nominal x
1 = E = 0.7
(condiciones iniciales en el punto de equilibrio). Realice el mismo experimento de simulaci
on
(identica se
nal de prueba y condiciones iniciales) sobre el sistema no lineal original (1.54), usando
para ello la relacion dada por (3.13). Compare los resultados y disc
utalos con el instructor o
asistente del curso.
(?)

Lecturas
Varios de los textos que tratan a fondo el dise
no de sistemas de control lineales presentan en
sus captulos introductorios un rese
na sobre linealizacion de sistemas no lineales alrededor
de puntos de equilibrio, consulte por ejemplo:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems, 3ra. Edicion, Addison-Wesley, 1994.
B. Kuo, Automatic Control Systems, Prentice Hall, Septima edici
on, 1995
N. Nise, Control System Engineering, Addison Wesley, Segunda edici
on, 1996

Chapter 4
El M
etodo de la Linealizaci
on
Aproximada en el Dise
no de
Controladores para Sistemas
Din
amicos No Lineales

Es imprescindible entender que, al tratar de establecer leyes de control sobre sistemas reales
(no lineales) en base a modelos lineales aproximados, la validez de tales acciones de regulacion
esta necesariamente restringida al rango de validez de la linealizacion. No podra por lo tanto
pretenderse que un modelo as establecido sea valido en todo el ambito de posible variabilidad
del sistema. Sin embargo, gran parte de la tecnologa de regulacion automatica disenada para
innumerables clases de procesos en la industria, durante los ultimos 20 anos, esta basada en este
solo hecho.

57

APROXIMADA Y EL DISENO
DE CONTROLADORES
58CHAPTER 4. LA LINEALIZACION

4.1

Motivaci
on

Es bien conocido que, en la realidad, los procesos a ser controlados siempre se ven afectados
por peque
nas perturbaciones que desvian, de sus puntos de equilibrio, a las variables que
caracterizan al sistema. Se hace preciso, por lo tanto, dise
nar mecanismos de control que
ayuden a mantener las variables del sistema en sus valores nominales de operacion, a la luz de
las perturbaciones reinantes. Estas perturbaciones pueden provenir del medio ambiente como
influencias de caracter aleatorio o generadas por peque
nas variaciones de los parametros que
definen el sistema dinamico. En ocasiones, las perturbaciones tambien pueden ser inducidas
por operadores humanos en el deseo de conducir algunos experimentos sobre el sistema y su
comportamiento controlado con el objetivo de realizar el dise
no del modelo matematico por
medio de identificaci
on, o en el caso de ajuste (tuning) de los parametros del controlador,
por ejemplo.
En cualquiera de los casos enunciados, la linealizacion aproximada puede ser u
til, en
cuanto al dise
no del controlador se refiere, pues esta permite obtener un modelo lineal que
describe el comportamiento del sistema alrededor de sus valores nominales como respuesta a
las perturbaciones que afectan al mismo. Este modelo exhibe en forma explcita la relacion
entre las perturbaciones de entrada y estados iniciales y su efecto en las variables perturbadas
de estado y salida del sistema. En consecuencia, este modelo puede servirnos para proponer
una perturbacion de caracter controlador a la entrada incremental del sistema. El proposito
de dise
nar tal entrada sera el de hacer que el efecto de las posibles perturbaciones en los
estados iniciales y variables de estado sea estabilizado a cero. Con esto se lograra que el
sistema no lineal original contin
ue operando en su punto de equilibrio nominal.
Este captulo se dedica a desarrollar los esquemas basicos de aplicacion de la linealizacion
aproximada en el dise
no de estrategias de control. Presentaremos a continuacion el esquema
de dise
no de un controlador estatico para un sistema linealizado basado en el conocimiento
preciso del vector de estado.

4.2

Dise
no de Controladores mediante Linealizaci
on
Aproximada

Supondremos, en primer lugar, que el valor del estado del sistema x(t) y de sus posibles
perturbaciones x (t) estan disponibles para medicion. Es decir, tenemos conocimiento pleno
de todas y cada una de las variables de estado perturbadas y podemos, por lo tanto, utilizarlas
en esquemas de control realimentado.
El metodo que estudiaremos esta basado en suponer que los valores de las perturbaciones de estado se describen mediante un sistema lineal obtenido a partir del no lineal
original por medio de linealizacion aproximada alrededor del punto de equilibrio nominal del
sistema. Es decir, reemplazaremos los valores reales de las perturbaciones por las aproximaciones obtenidas por linealizacion, representadas por un sistema lineal. Sabemos que
esta substitucion es valida solo cuando los valores de las perturbaciones son suficientemente

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA59
4.2. DISENO
U

u (t)

u(t)

.
x=f(x,u)

x(t)

x (t)

Figure 4.1: Relacion entre las variables originales y las variables perturbadas
peque
nos. En efecto, el esquema de la figura 3.1, reproducida en la figura 4.1, nos muestra
que el comportamiento de los efectos de las perturbaciones sobre el sistema no lineal son
reemplazables, en forma aproximada, por un sistema lineal.
Veamos al sistema no lineal de la figura 4.1 como una relacion entre u (t) y x (t). Es
evidente que si se puede encontrar un control estabilizante como funcion de la variables
perturbadas de estado x (t), entonces el control debe garantizarnos la estabilizacion a cero
de estas variables perturbadas. Entre u (t) y x (t) existe una relacion lineal aproximada que
podemos representar como:
u (t)

.
x (t)=Ax (t)+bu (t)

x (t)

Figure 4.2: Sistema lineal que describe, en forma aproximada, el comportamiento de las perturbaciones
Es indudable que si logramos establecer una prescripcion que especifique al control o
entrada incremental u (t) en terminos del estado, nuestro problema no lineal original queda
reducido a un problema lineal, en tanto que las magnitudes de las perturbaciones a que
se ve sometido el sistema original sean lo suficientemente peque
nas como para no desviar
significativamente los valores de las variables de estado originales de sus puntos de operacion
nominales.
La estrategia de control consistira en dise
nar una ley de control lineal para el sistema de
la figura 4.2, la cual estabilice a cero las variables de estado perturbadas x (t). El esquema
de control sera el que se muestra en la figura 4.3. En terminos del sistema no lineal original,
el esquema de control sera el representado en la figura 4.4.
Cabe ahora preguntarnos: cuando sera efectivo utilizar el esquema de control anterior?.
Es decir, que limitaciones pueden existir para que, en ciertos casos, el esquema de control
propuesto no funcione satisfactoriamente?. Puesto que hemos reemplazado el problema de
control no lineal por uno lineal, la pregunta se reduce a plantear las condiciones bajo las
cuales el sistema de la figura 4.2 es estabilizable mediante realimentacion constante de las
variables de estado incrementales. Para ello recordemos el siguiente teorema basico de la
teora de sistemas lineales.

APROXIMADA Y EL DISENO
DE CONTROLADORES
60CHAPTER 4. LA LINEALIZACION

u (t)

x (t)

.
x (t)=Ax (t)+bu (t)

u (t)=-Kx (t)

Figure 4.3: Sistema lineal realimentado linealmente

PUNTO DE OPERACION NOMINAL

u (t)

u(t)

.
x=f(x,u)

x(t)

x (t)

u (t)=-Kx (t)

Figure 4.4: Esquema de control lineal para sistemas no lineales

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA61
4.2. DISENO
Teorema 4.1 La condici
on necesaria y suficiente para que el sistema lineal
x = Ax + Bu

(4.1)

sea estabilizable mediante una ley de control por realimentaci


on constante del vector de estado, es que el par (A, B) sea controlable. Si el sistema es incontrolable, este puede a
un estabilizarse mediante realimentaci
on si y solo si los modos incontrolables son asintoticamente
estables.
En la literatura siempre se distingue entre sistemas controlables y sistemas estabilizables.
Todo sistema controlable es estabilizable. Sin embargo, no todo sistema estabilizable es per
se controlable. De hecho existe, como reza el teorema anterior, la posibilidad de tener un
sistema incontrolable que sea estabilizable. La nocion de estabilizabilidad de un sistema
representa un requerimiento mas debil que el implicado por la nocion de controlabilidad.
Afortunadamente, casi todos los sistemas lineales son controlables. Para explicar esta
aseveracion debemos decir que si escogemos aleatoriamente los valores numericos que intervienen en la conformacion de la matriz A y los del vector B, entonces, con probabilidad
uno, el sistema resultante es controlable. Esto se debe a que en el espacio de los parametros
del sistema lineal (cuya dimension es n2 + n = n(n + 1)) el conjunto de valores de esos
parametros que hacen cero al determinante de la matriz de controlabilidad, es decir, los
valores numericos de la matriz A y del vector B que hacen cero a:
h

C = det B : AB : . . . : An1 B = 0

(4.2)

forman una variedad algebraica, es decir, una union de planos, cuya medida (entendamos por
tal medida el hipervolumen) es cero. En consecuencia, al escoger un punto aleatoriamente
en este espacio de dimension n(n + 1), con probabilidad uno caeremos fuera de esta variedad
algebraica1 .
El resultado anterior y nuestra seguridad de encontrarnos frente a un sistema controlable
nos hace concluir que el metodo tendra limitaciones solamente relativas a la magnitud de las
perturbaciones que se requiere controlar, es decir, las mismas deberan ser suficientemente
peque
nas.

Ejemplo 4.1: control de la orientaci


on de un artefacto espacial mediante linealizaci
on
aproximada
1

Una forma de ilustrar lo que decimos consiste en dibujar una o varias lneas en una hoja de papel en
forma desordenada, luego proponer dos n
umeros aleatorios que representen coordenadas adoptadas sobre
dos bordes contiguos de la hoja y, por u
ltimo, ver si los n
umeros propuestos al azar representan un punto de
alguna de las lineas que hemos trazado. Como es facil imaginarse, es muy difcil caer exactamente sobre una
de las lneas dibujadas. Es posible predecir que, si el experimento se hace adivinando en forma aleatoria (por
ejemplo, pidiendole a un amigo que no ve la hoja ni el resultado de sus intentos, el decir las coordenadas en
cuestion), entonces es casi seguro que de cien intentos que hagamos caeremos cien veces fuera de las rectas
dibujadas!.

APROXIMADA Y EL DISENO
DE CONTROLADORES
62CHAPTER 4. LA LINEALIZACION
Consideremos nuevamente el sistema (1.18):
x 1 = x2
FL
sen x3
x 2 =
J
x 3 = Ru
Bajo la suposicion de que todas las variables de estado son medibles y, por lo tanto, utilizables en
cualquier poltica de control realimentado, procedemos a definir las variables perturbadas alrededor
de los valores nominales de equilibrio, los cuales, se asume, son coincidentes con las condiciones
inherentes a la posicion deseada:
x1 = x1 ; x2 = x2 ; x3 = x3 ; u = u

(4.3)

La linealizacion del sistema alrededor de su punto de equilibrio constante esta dada por:
x 1

= x2

FL
FL
=
cos x3
x3 =
x3
J
J
x3 =0
= Ru

x 2
x 3

(4.4)

o , en terminos matriciales:

0 1
x
d 1
x2 = 0 0
dt
x3
0 0

0
x1

FL
J x2 + 0 u
x3
R
0

(4.5)

El sistema linealizado es independiente del punto de equilibrio. Tambien es facil ver que el
sistema es completamente controlable debido a que la matriz de controlabilidad, dada por:

C= 0
R

0
F LR
J

F LR
J

0
0

(4.6)

es de rango completo (es decir, rk C = 3) pues su determinante es distinto de cero.


Proponemos una ley de control realimentado del tipo lineal especificada mediante:
u = K1 x1 K2 x2 K3 x3

(4.7)

Esta ley de control conlleva, en consecuencia, la siguiente expresion para el sistema controlado
en lazo cerrado:

0
1
0
x
x1
d 1

FL
x2
0
0
x2 =

J
dt
x3
x3
RK1 RK2 RK3

(4.8)

Puesto que el interes fundamental esta en inducir una dinamica controlada, para el valor de las
perturbaciones del estado, de naturaleza asint
oticamente estable a cero, los valores de las ganancias

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA63
4.2. DISENO


c


Im

plano s
Re


a
-c



Figure 4.5: Ubicacion de polos en el plano complejo para el sistema en lazo cerrado
K1 , K2 , K3 deben especificarse de tal manera que los autovalores del sistema autonomo anterior
(sistema en lazo cerrado) tengan parte real negativa. Con el objeto de obtener esta especificacion
calculamos el polinomio caracterstico y lo igualamos a alguno del cual sabemos tiene sus raices en
el semiplano izquierdo en valores preestablecidos.
El polinomio caracterstico del sistema lineal en lazo cerrado esta dado por:

s
1
0

det(sI A + BK) = det 0


s
FJL
RK1 RK2 s + RK3
F LRK2
F LRK1
= s3 + RK3 s2 +
s+
(4.9)
J
J
Como puede apreciarse de la conformacion de este polinomio caracterstico, los parametros de
dise
no K1 , K2 y K3 intervienen independientemente en cada termino del polinomio. Este hecho
permitira obtener estos valores al igualar el polinomio caracterstico a uno deseado cuyos polos se
encuentran en el semiplano izquierdo.
Supongamos que deseamos contar con una localizacion de polos como la que se muestra en la
figura 4.5.
Es decir, deseamos que el polinomio caracterstico pd en lazo cerrado este dado por:
pd (s) = (s + a)(s + b j c)(s + b + j c) = (s + a)(s2 + 2bs + b2 + c2 )
= s3 + (2b + a)s2 + (b2 + c2 + 2ab)s + a(b2 + c2 )

(4.10)

donde a, b y c son conocidos y se escogen de tal manera que la respuesta tenga caractersticas
deseables (tiempo de ascenso, sobrepaso, tiempo de estabilizacion, etc.).
Igualando los coeficientes de las mismas potencias de ambos polinomios obtenemos el siguiente
conjunto de ecuaciones para los parametros de dise
no:
RK3
F LRK2
J
F LRK1
J
de donde obtenemos en forma inmediata los
K1 = J

a(b2

c2 )

+
F LR

= 2b + a
= b2 + c2 + 2ab
= a(b2 + c2 )

(4.11)

valores requeridos de los parametros de dise


no:

; K2 = J

b2 + c2 + 2ab
2b + a
; K3 =
F LR
R

(4.12)

APROXIMADA Y EL DISENO
DE CONTROLADORES
64CHAPTER 4. LA LINEALIZACION

Posicin angular

Velocidad angular

2.5

1.2
1

2.4

omega

theta

0.8
2.3

2.2

0.6
0.4

2.1

2
0

0.2

0.5

1.5
tiempo t

2.5

0
0

0.5

Orientacin de la tobera

1.5
tiempo t

2.5

2.5

Variable de control
0.8
0.6

0.5

beta

0.4
0.2

0
0
-0.2
-0.5
0

0.5

1.5
tiempo t

2.5

-0.4
0

0.5

1.5
tiempo t

Figure 4.6: Respuestas obtenidas por simulacion del sistema controlado


La ley de control lineal retroalimentada que estabiliza el modelo incremental alrededor del
origen esta dada entonces por:
u = J

a(b2 + c2 )
b2 + c2 + 2ab
2b + a
x1 J
x2
x3
F LR
F LR
R

(4.13)

El controlador lineal que estabiliza el sistema a su punto de equilibrio x1 = , x2 = 0, x3 = 0,


se obtiene substituyendo las variables incrementales en el controlador lineal por sus valores en
funcion de las variables originales. En este caso, el controlador esta dado entonces por:
u = J

a(b2 + c2 )
b2 + c2 + 2ab
2b + a
(x1 ) J
x2
x3
F LR
F LR
R

(4.14)

Es necesario recalcar que


la validez del controlador lineal obtenido anteriormente se circunscribe a valores
cercanos al punto de equilibrio deseado.
En virtud de las no linealidades del sistema, cuando se pretende utilizar un control lineal simple
que, de por s, no toma en cuenta las complejidades globales del sistema y solo sus expresiones
locales, el resultado puede ser un rotundo fracaso en lograr el control del sistema. Esto se ilustra
en los proximos parrafos mediante simulaciones numericas realizadas en el computador.
Las respuestas del sistema controlado en lazo cerrado se muestran en la figura 4.6. En este
grafico se presentan la posicion angular de orientaci
on de la tobera, velocidad angular de orientaci
on,

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA65
4.2. DISENO
posicion angular de la tobera, as como la se
nal de control usada en estabilizar el sistema. Los valores
utilizados en la simulacion fueron
F = 200; L = 3; R = 20; J = 50;
a = 2.0; b = 3.5; c = 12.75; = 2.5
El controlador estabiliza, exitosamente, la posicion angular del artefacto desde una posicion cercana
a la posicion deseada.
c con el cual
A continuacion damos el listado del programa ejemplo1.m realizado en MatLab
se pueden obtener las simulaciones numericas que se presentan a continuaci
on.
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%

ejemplo1.m
Primer ejemplo de simulacion numerica:
Control de orientacion de un artefacto espacial por medio
de linealizacion aproximada
Este programa simula la respuesta de un modelo de tercer
orden, que representa un artefacto espacial del cual se requiere
una reorientacion angular mediante control de las variables
de estado: posicion, velocidad y orientacion de la tobera.
El controlador disen~ado esta basado en linealizacion
aproximada alrededor del punto de equilibrio deseado.

function xdot=ejemplo1(t,x)
%% parametros del sistema
F = 200; L=3; R=20; J =50;
%% parametros del controlador
a =2.0; b=3.5; c = 12.75; Theta = 2.5;
%% Ley de control
u = -J*a*(b^2+c^2)/(F*L*R)*(x(1)-Theta)-J*(b^2+c^2+2*a*b)/F/L/R*x(2)-...
(2*b+a)/R*x(3);
%% Ecuaciones de estado
xdot = [x(2) ; F*L/J*sin(x(3)) ; R*u];
%% Fin de ejemplo1.m

Incluimos el programa sejem1.m para la generacion de los graficos de ejemplo1.m.


% sejem1.m
% Programa de generacion de los graficos del ejemplo1.m
% tiempo de simulacion
ti = 0;
tf = 3;
%% condiciones iniciales:
%% cerca del punto de equilibrio
x0 = [2 0 0];
%% lejos del p.e.
%%x0 = [0 0 0];
%% simulacion
[t,x] = ode45(ejemplo1,ti,tf,x0);

APROXIMADA Y EL DISENO
DE CONTROLADORES
66CHAPTER 4. LA LINEALIZACION

%% Posicion angular (x(1))


subplot(2,2,1), plot(t,x(:,1))
title(Posicin angular)
xlabel(tiempo t)
ylabel(theta)
%% Velocidad angular (x(2))
subplot(2,2,2), plot(t,x(:,2))
title(Velocidad angular)
xlabel(tiempo t)
ylabel(omega)
%% Angulo de orientacin de la tobera (x(3))
subplot(2,2,3), plot(t,x(:,3))
title(Orientacin de la tobera)
xlabel(tiempo t)
ylabel(beta)
%% Variable de control (u)
F = 200; L=3; R=20; J =50;
a =2; b=3.5; c = 12.75; Theta = 2.5;
u = -J*a*(b^2+c^2)/F/L/R*(x(:,1)-Theta)-J*(b^2+c^2+2*a*b)/F/L/R*x(:,2)-...
(2*b+a)/R*x(:,3);
subplot(2,2,4), plot(t,u)
title(Variable de control)
xlabel(tiempo t)
ylabel(u)
% fin de sejem1.m

En la siguiente figura (Fig. 4.7) se ha repetido la misma simulaci


on desde una posicion inicial
suficientemente alejada de la posicion final de equilibrio. Se puede observar que el controlador lineal
falla en estabilizar el sistema alrededor del valor de equilibrio deseado.

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA67
4.2. DISENO

Posicin angular

Velocidad angular

0.6

1.5

1
omega

theta

0.4

0.2

0.5

0
0
0

0.5

1.5
tiempo t

2.5

-0.5
0

0.5

Orientacin de la tobera

1.5
tiempo t

2.5

2.5

Variable de control

beta

2
4

1
2

0
0

0.5

1.5
tiempo t

2.5

-1
0

0.5

1.5
tiempo t

Figure 4.7: Respuestas del comportamiento del artefacto espacial obtenidas por simulacion del
sistema controlado para desviaciones iniciales significativas del punto de equilibrio.

APROXIMADA Y EL DISENO
DE CONTROLADORES
68CHAPTER 4. LA LINEALIZACION

Ejemplo 4.2: Control de un reactor de fisi


on por medio de linealizaci
on aproximada
La linealizacion del sistema (1.23) alrededor del punto de equilibrio
x1 = X1 (N ) = N ; x1 = X1 (N ) =

N
; u=0
L

se expresa como:

N
x 1 = x1 + x2 + u
L
L

x 2 =
x1 x2
L

(4.15)

Es decir, las matrices del sistema estan dadas por:

L
A=
L

B=
L
0

(4.16)

El sistema es evidentemente controlable pues su matriz de controlabilidad es no singular como se


puede constatar facilmente:

N
N
L L2
C = [B : AB] =
N ;
0
L2

det C =

N 2
6= 0
L3

(4.17)

Utilizamos para el sistema lineal la ley de control incremental dada por:


u = K1 x1 K2 x2

(4.18)

lo cual hace que el sistema en lazo cerrado adquiera la forma:


"

x =

N
L K1

N
L K2

(4.19)

El polinomio caracterstico de este sistema esta dado por:

pAKB = s2 + +

N
N
+ K1 s + K1 + 2 K2
L
L
L
L

(4.20)

Evidentemente las ganancias de dise


no K1 y K2 pueden escogerse independientemente para
hacer que el polinomio caracterstico del sistema en lazo cerrado iguale a un cierto polinomio
caracterstico deseado:
pd = s2 + 2n s + n2

(4.21)

Los valores de K1 y K2 se obtienen entonces igualando termino a termino los coeficientes de


ambos polinomios. Tenemos:
K1 =

L
N

2n

;
L

K2 =

L2

2 2n
N n
L

(4.22)

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA69
4.2. DISENO
La ley de control realimentado que estabiliza el modelo incremental se expresa entonces de la
manera siguiente:
u =

L
N

2n

L2

x1
n2 2n
L
N
L

x2

(4.23)

La ley de control lineal que estabiliza al sistema no lineal se consigue substituyendo las variables
incrementales x1 , x1 y x por sus valores:
x1 = x1 N ;
u

L
=
N

x2 = x2

N
;
L

u = u

L2

2n
(x1 N )
2 2n
L
N n
L

N
x2
(4.24)
L

Ejemplo 4.3: Ejemplo de dise


no para un proceso incontrolable de producci
on de etanol
La linealizacion del sistema (1.54) alrededor del punto de equilibrio (1.55):
x1 = X1 (E) = E; x2 = X2 (E) = 1 E; u = U (E) =

1E
E

arroja la siguiente expresion para la dinamica incremental:


x 1 = x2 x1
x 2 =

1E
Eu
E

1
x2 + (1 x2 )u
E

(4.25)

es decir, las matrices del sistema incremental resultante son:

1E
E
A=
0

1
1 ;

"

B=

E
E

(4.26)

Es facil ver que el sistema lineal no satisface la condicion de controlabilidad. En efecto, la


matriz de controlabilidad esta dada por:
"

C = [B : AB] =

E
1
E 1

det C = 0

(4.27)

Debemos transformar el sistema linealizado con el objeto de esclarecer cual de los modos del
sistema es incontrolable.
Considerese la siguiente transformacion del vector de estados:
z1 = x1 + x2
z2 = x1
la cual es, evidentemente, invertible.

(4.28)

APROXIMADA Y EL DISENO
DE CONTROLADORES
70CHAPTER 4. LA LINEALIZACION
Las ecuaciones diferenciales para z resultan ser:

z1 =

z2 =

1
E

z1

1
z2 + Eu
E

(4.29)

Esta ecuacion exhibe claramente a z1 como modo incontrolable del sistema, mientras que z2
representa el modo controlable del mismo. Afortunadamente, el modo incontrolable del sistema es,
evidentemente, asintoticamente estable en virtud de las restricciones que sobre el valor de E pesan
desde un principio (0 < E < 1), esto hace que la cantidad 1 1/E, que es el autovalor asociado a
z1 , sea, efectivamente, menor que cero. El valor de esta variable de estado transformada tiende,
por s sola, a cero en forma exponencial.
El dise
no del controlador se reduce a prescribir una ley de control que estabilice al modo z2 a
cero (z2 = x1 = concentracion incremental de etanol.
Hacemos entonces:
u = Kz2 = Kx1

(4.30)

lo cual resulta en un sistema en lazo cerrado de la forma:

z2

1
+ KE z2
=
E

(4.31)

Igualando el u
nico autovalor a una cantidad real negativa , se tiene:
u = Kx1

1
=
E

x1

(4.32)

El controlador no hace uso, evidentemente, de la variable de estado (o modo) incontrolable del


sistema.
Como consecuencia de la poltica de control adoptada para el sistema incremental transformado,
ademas del hecho de que la parte incontrolable del sistema presenta una dinamica asint
oticamente
estable a cero, los valores de las variables z1 y z2 convergen a cero y, por lo tanto, x1 y x2
convergen tambien a cero. Los estados originales x1 y x2 del sistema convergen, por lo tanto, a sus
puntos de equilibrio.
El controlador lineal, que regula al sistema no lineal, esta dado entonces por:

1
1

(x1 E)
u = U (E)
E
E

1E
1
1
=

(x1 E)
E
E
E

(4.33)

En la figura 4.8 se muestra la simulaci


on del comportamiento controlado del sistema en la lazo
cerrado. El punto de equilibrio tomado para la concentraci
on de etanol es de E = 0.7. El programa
c para obtener las simulaciones es el siguiente:
usado en Matlab
%% ejemplo2.m
%%
%% Segundo ejemplo con simulaciones numericas del

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA71
4.2. DISENO

Concentracin de azcar
0.9

0.6

0.8

0.5

0.7
x2

x1

Concentracin del etanol


0.7

0.4

0.6

0.3

0.5

0.2

0.4

0.1
0

2
tiempo t

0.3
0

2
tiempo t

Rata de alimentacin del sustrato


0.5

0.4

0.3

0.2

0.1

0
0

2
tiempo t

Figure 4.8: Respuesta del sistema de fermentacion estabilizable en lazo cerrado

APROXIMADA Y EL DISENO
DE CONTROLADORES
72CHAPTER 4. LA LINEALIZACION
%%
%%
%%
%%
%%
%%
%%

libro:
Control de Sistemas No Lineales
Hebertt Sira-Ramirez
Control de un reactor de fision por linealizacion
aproximada

function xdot=ejemplo2(t,x)
%% parametros del sistema
E = 0.7 ; Ue = (1-E)/E;
%% parametros del controlador
lambda = 1 ;
%% Ley de control
u = Ue -(1/E)*(lambda-1/E)*(x(1)-E) ;
%% Ecuaciones de estado
xdot = [ x(2)-x(1)*u ; -x(2)+ (1-x(2))*u ];
%% Fin de ejemplo2.m

Ejemplo 4.4: Sistema de levitaci


on magn
etica
Consideremos el sistema (1.36). Tomaremos como punto de equilibrio aquel parametrizado
respecto a X (ver (1.37)):
x1 = X1 (X) = X ; x2 = 0 ;

x3 = X3 (X) =

mgX
; u = U (X) = R
c

mgX
c

Utilizaremos esta parametrizacion pues, de esta manera, la ley de control lineal vendr
a directamente en terminos del error de la variable que se desea controlar y no en terminos de una variable
que esta indirectamente relacionada con ella.
Definimos, como siempre, las variables de estado incrementales utilizando los valores de equilibrio de los estados y los controles:
cU 2
; x2 = x2 ;
mgR2
= x3 X3 (X) ; u = u U (X)

x1 = x1 X =
x3

(4.34)

La evolucion de las perturbaciones de estado estan gobernadas por el sistema de ecuaciones


diferenciales lineales obtenido del proceso de linealizacion alrededor de los valores de equilibrio:

x
d 1
x2
dt
x3

g

=
X
0

r0

0 2
0

x1
cg

x2

mX x
R
3

u
+ 0
1
L

(4.35)

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA73
4.2. DISENO
Si mediante una ley de control lineal :
u = K1 x1 K2 x2 K3 x3

(4.36)

logramos que el estado incremental x tienda a cero asint


oticamente, habremos logrado que el
estado x del sistema no lineal se acerque a su valor de equilibrio.
Verificamos, entonces, que el sistema linealizado es controlable:
r

2
cg
0
0
L r mX

2
cg
2R
cg
2

C = [B : AB : A B] = 0
L mX
L mX

R
R2
1

L
L2
L3

det C =

4cg
L3 mX

6= 0

(4.37)

Examinemos brevemente la naturaleza del sistema en lazo abierto, es decir, sin control.
Los autovalores de la matriz A del sistema determinan la estabilidad del mismo alrededor del
origen (x = 0), cuando u = 0.

0
g
A=
X
0

0 2
0

r0

cg

mX

(4.38)

R
L

Tales autovalores se obtienen a partir de las raices del polinomio caracterstico de la matriz A,
el cual se calcula de la manera siguiente:
g
gR
R 2
s s

L
X XL

R
g
R
R
g
2
= s s+

s+
= s+
s2
L
X
L
L
X

pA (s) = det(sI A) = s3 +

(4.39)

cuyas raices son


s1 =

R
; s2 =
L

g
X

(4.40)

El sistema cuenta, por tanto, con dos raices estables (ubicadas en el lado izquierdo del plano
complejo) y una raiz inestable (ubicada en el semiplano derecho del plano complejo), tal como se
muestra en la figura 4.9.
La respuesta en lazo abierto
del sistema
erminos exponenciales de la
p
p linealizado cuenta con t
forma exp(R/Lt), exp( g/Kt) y exp( g/Kt). Uno de estos terminos crece de manera indefinida dando lugar a inestabilidad.
Sin embargo, siendo el sistema controlable podemos, por tanto, garantizar la existencia de
una ley de realimentacion lineal que ubica los polos del sistema en lazo cerrado en puntos preseleccionados del plano complejo que hagan al sistema asint
oticamente estable.
Deseamos por ejemplo, que el sistema linealizado de tercer orden, en lazo cerrado tenga sus
polos ubicados en las raices del siguiente polinomio caracterstico deseado:
pd (s) = (s + )(s2 + 2n + n2 ) = s3 + (2n + )s2 + (n2 + 2n )s + n2

(4.41)

APROXIMADA Y EL DISENO
DE CONTROLADORES
74CHAPTER 4. LA LINEALIZACION
Im

plano s




-R/L -

Re


g
X

g
X

Figure 4.9: Ubicacion de los polos del sistema en lazo abierto




c


Im

plano s
Re


-c


Figure 4.10: Polos del sistema en lazo cerrado


A manera de recordatorio, es conocido como relacion de amortiguamiento y n es la frecuencia natural no amortiguada correspondiente al par de polos complejos conjugados que genera
el factor de segundo grado. La figura 4.10 muestra una posible disposicion de los polos deseados
del sistema, en la cual los polos
p complejos conjugados son dominantes (en la figura se han tomado
a = , b = n y c = n 1 2 ).
El sistema en lazo cerrado esta dado por:

x
d 1
x2 =

dt
x3

0
g
X
KL1

1
0
KL2

x1

cg

x2
mX

r0

R
L

K3
L

(4.42)

x3

y su polinomio caracterstico es :
pABK (s) = det(sI A)
r

R K3 2
K2
cg
g
= s3 +
+
s + 2

s
L
L
L mX
X
r

K1
g R K3
cg
+ 2

+
L mX
X L
L

(4.43)

Si igualamos este polinomio, termino a termino, con pd (s) obtenemos el siguiente sistema de
ecuaciones lineales para las ganancias de realimentaci
on K1 , K2 y K3 ,
R K3
+
L
L

= 2n +

DE CONTROLADORES MEDIANTE LINEALIZACION


APROXIMADA75
4.2. DISENO

Punto de operacion nominal


x1(X)=X
x2(X)=0
U(X)=R mgX/c

x (X) = mgX/c

R
i

+
-

u (t)

u(t)

v(t)

x(t)

f
m

x (t)

mg

+
+

K1

x1 (t)

K2

x2 (t)

K3

x3 (t)

Figure 4.11: Esquema de realimentacion lineal para el sistema de levitacion magnetica


r

g
K2
cg

= n2 + 2n
2
L mX
X
r

K1
cg
g R K3
2

+
= n2
L mX
X L
L

(4.44)

de donde:
K1
K2
K3

L mX 2g n + g + n2 X
=

2 cgX

L mX g + n2 X + 2 n X
=

2 cgX
= R + 2 n L + L

(4.45)

El esquema de control esta representado entonces, al menos conceptualmente, por medio del
diagrama mostrado en la figura 4.11.

APROXIMADA Y EL DISENO
DE CONTROLADORES
76CHAPTER 4. LA LINEALIZACION
El controlador lineal queda dado por:

!
L mX 2g n + g + n2 X
u =
(x1 X)

2 cgX

!
L mX g + n2 X + 2 n X

x2

2 cgX

(R + 2 n L + L) x3

mgX
c

(4.46)

4.3

Ejercicios Propuestos

Ejercicio 4.1: Matlab


p
endulo invertido sobre una plataforma m
ovil
Dise
ne un controlador por realimentaci
on del vector de estados basado en linealizacion aproxic para realizar las
mada para el sistema (1.45). Realice los programas necesarios en MatLab
simulaciones. Los valores de los parametros a usar en las simulaciones se presentan en la tabla 4.1.

Table 4.1: Parametros usados en el sistema del pendulo invertido sobre una plataforma movil
Par
ametro
M
J
C

Valor
0.5 [kg]
0.006 [kg m2 ]
0.0

Par
ametro
m
L
F

Valor
0.2 [kg]
0.3 [m]
0.1 [N/m/seg]

Como requerimiento de dise


no, el comportamiento del sistema en lazo cerrado debe ser tal que
el tiempo de asentamiento sea inferior a 5 segundos, ts < 5 [seg].
(??)
Ejercicio 4.2: Matlab
sistema de levitaci
on magn
etica
Considere el sistema de levitacion magnetica de la pagina 72. Realice las simulaciones correspondientes para el siguiente conjunto de valores para los parametros del sistema:
"

c=1

m2 kg
; g = 9.8 [m/s2 ]; m = 0.1 [kg]
s2 Amp2

R = 1 []; L = 0.01 [Henrio]; X = 0.05 [m]


Las especificaciones de dise
no se dejan a libre escogencia. Que criterios utilizara para sugerir
la colocacion de polos? Discuta los resultados con el instructor de la materia. Ayuda: Tome en
cuenta siempre los diagramas utilizados en este captulo.
(?)

4.3. EJERCICIOS PROPUESTOS

77

Lecturas Recomendadas
Sobre las consideraciones de dise
no de controladores lineales en el espacio de estado, consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Para una introduccion a metodos de dise
no en el espacio de estados mas avanzados, como
es el caso del regulador lineal cuadratico (dise
no LQR) refierase a:
Dorato, P., C. Abdallah, and V. Cerone. Linear-Quadratic Control: An introduction. Prentice Hall, Englewood Cliffs, New Jersey, 1995.
c para el caso de sistemas lineales (colocacion de
Una referencia sobre el uso de Matlab
polos, LQR, dise
no de compensadores PID, adelanto, adelanto-atraso, H , etc) es el libro:
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.

APROXIMADA Y EL DISENO
DE CONTROLADORES
78CHAPTER 4. LA LINEALIZACION

Chapter 5
Dise
no de Controladores mediante
Linealizaci
on Aproximada Utilizando
Observadores Din
amicos de Estado

En los desarrollos anteriores, hicimos la suposicion explcita de que todos y cada uno de los estados
del sistema no lineal estaban disponibles para su utilizacion en las leyes de control retroalimentadas, sintetizadas a partir de los errores de equilibrio de tales estados con respecto a sus valores
nominales constantes. Esta suposicion no siempre es valida, pues en una gran cantidad de casos practicos solo algunos (o algun) estados estan disponibles fisicamente para llevar a cabo
mediciones sobre ellos. En otros casos, solamente la variable de salida se encuentra a nuestra
disposicion y, por lo tanto, con todo lo que contamos es con una relacion entre el valor de la
salida y su dependencia con respecto a los estados. Esta situacion debe resolverse entonces,
tratando de inferir un valor estimado del vector de los estados a partir de nuestro conocimiento
del sistema, de nuestra disponibilidad de los valores de la salida y del conocimiento inequvoco de
los valores del control que estamos suministrando al sistema. Este proceso de inferencia recibe
el nombre de estimaci
on, o reconstrucci
on, del vector de estado.
Este captulo considera la construccion de un controlador sobre la base de diseno de un
observador o reconstructor del vector de estado, cuando solo se dispone del conocimiento de la
79


APRO
80CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
salida, de la entrada y de la estructura del sistema lineal. La seccion 5.3 se dedica al caso de
diseno de observadores de orden reducido.

5.1

Reconstrucci
on del Vector de Estado

El proceso de estimacion del vector de estado para un sistema no lineal ha sido investigado y
resuelto solo recientemente y sus desarrollos requieren de una base adecuada de la geometra
diferencial. A
un cuando abordaremos el topico en toda su generalidad mas adelante, por
ahora restringiremos nuestra atencion al problema de reconstruir el vector de estado con el
objeto de utilizarlo en una ley de realimentacion lineal basada en la linealizacion aproximada
del sistema no lineal. Desde este punto de vista el problema es mucho mas sencillo pues se
reduce a reconstruir u observar el vector de estados incrementales, o perturbados, que se
suceden alrededor de los valores nominales de operacion del sistema no lineal. Como el
modelo que hemos dado en aceptar como valido para tales valores incrementales del estado
es un modelo dinamico lineal, que ademas resulto ser invariante en el tiempo, entonces
solamente precisaremos utilizar la solucion del problema de estimacion de sistemas dinamicos
lineales.
El problema de reconstruccion del vector de estado, o, equivalentemente, de construccion
(dise
no) de un observador para un sistema lineal fue resuelto a principios de los a
nos 60 por un
profesor americano de nombre David Luenberger. En su honor, el observador determinstico
de estado recibe en la literatura el nombre de Observador de Luenberger.
Considerese el sistema lineal, que suponemos aproxima dentro de un primer orden los
valores de las perturbaciones del vector de estado de un sistema no lineal.

x = A x + B u
y = C x

(5.1)

donde x es el vector de estado n-dimensional, u es la variable de control escalar y la variable


y es la salida (escalar) del sistema.
Como y no coincide con el estado del sistema, por cuanto hay una obvia diferencia en
cuanto a las dimensiones se refiere, no disponemos del estado incremental x para hacer
control realimentado del sistema, tal como lo hicimos en la seccion anterior. El valor del
estado inicial x (t0 ) es, ademas, desconocido.
Recordemos que en el esquema de control de la seccion 4.2, tuvimos la necesidad de
utilizar el vector de estado incremental completo, esto con el objeto de sintetizar la accion
de control realimentada incremental correspondiente que lograba la estabilizacion del sistema
no lineal. Este esquema se corresponda con el diagrama presentado en la figura 5.1. La
validez del control lineal resida en que el diagrama anterior era equivalente, en una primera
aproximacion, al de la figura 5.2.

DEL VECTOR DE ESTADO


5.1. RECONSTRUCCION

PUNTO DE OPERACION NOMINAL

u (t)

81

u(t)

.
x=f(x,u)

x(t)

x (t)

u (t)=-Kx (t)

Figure 5.1: Esquema de realimentacion lineal con medicion total de las componentes del vector
de estado

u (t)

.
x (t)=Ax (t)+bu (t)

x (t)

u (t)=-Kx (t)

Figure 5.2: Esquema de realimentacion lineal del sistema aproximado con medicion total de las
componentes del vector de estado


APRO
82CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA

u (t)

u(t)

.
x=f(x,u)

y(t)

y (t)

y=h(x)
Figure 5.3: Esquema de aproximacion del comportamiento entrada-salida del sistema no lineal
x (t)

u (t)
OBSERVADOR DE
LUENBERGER

y (t)

Figure 5.4: Observador dinamico de estado


A diferencia de esa situacion, ahora solo tenemos disponible la salida incremental del
sistema no lineal. Es decir, ahora visualizamos la situacion de la manera como se muestra
en la figura 5.3. En esta figura, Y = Y (U ) = h(X(U )) es el valor nominal de la salida.
Debemos entonces tratar de reconstruir el estado incremental x a partir del conocimiento
del sistema (es decir, a partir de A, B y C), de las mediciones realizadas sobre la salida y y
del innegable conocimiento que seguramente tendremos del valor del control el cual estamos
en capacidad de suministrar al sistema (y, por lo tanto, en capacidad de medir y conocer a
plenitud). Con este objetivo, debemos sintetizar un proceso dinamico de estimacion, es decir,
debemos proponer un sistema dinamico el cual acepte por entradas los valores del control y
de la salida y produzca como resultado un valor estimado del estado incremental del sistema
linealizado. Al resultado de este proceso de reconstruccion lo designaremos mediante x
. El
observador realizara, por ende, la funcion representada en el diagrama de bloques que se
muestra en la figura 5.4.
La idea es utilizar este reconstructor de estado en el esquema de control que propusimos
en la seccion anterior tal como si el valor del estado reconstruido coincidiera con el valor real
(no disponible) del vector de estado. Es decir, nuestra propuesta para controlar el sistema
esta basada en el diagrama de bloques de la figura 5.5.
Para garantizar la validez de este esquema debemos saber bajo que condiciones el valor
del estado estimado converge al valor del estado verdadero del sistema, es decir, bajo que
condiciones el estado estimado se aproxima asintoticamente al valor verdadero del estado.
Dicho de otra manera, necesitamos saber cuales son las condiciones bajo las cuales podemos
garantizar que el error de reconstrucci
on es asintoticamente estable a cero. En segundo
lugar, como garantizar que, durante aquel lapso de tiempo en el cual el valor del estado
estimado no coincide en forma precisa con el valor del estado incremental verdadero, el

5.2. EL OBSERVADOR DE LUENBERGER


PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA

u (t)

83

u(t)

.
x=f(x,u)

y(t)

y (t)

y=h(x)

x (t)
-K

u (t)
OBSERVADOR DE
LUENBERGER

y (t)

Figure 5.5: Esquema de control realimentado lineal utilizando un observador dinamico de estado
sistema incremental as erroneamente controlado (aun cuando de manera temporal) siga
siendo asintoticamente estable a cero. La primera preocupacion resulta facil de contestar,
mientras que la segunda requerira un poco mas de analisis. Estudiaremos primeramente el
problema de la convergencia del error de estimacion a cero.

5.2

El Observador de Luenberger

En virtud de que tratamos de estimar el estado de un sistema lineal, no resulta del todo
ilogico proponer un reconstructor dinamico que tambien sea lineal. Caracterizaremos este
reconstructor, evidentemente, utilizando la representacion de sistemas dinamicos mediante
el vector de estado. As pues tomaremos por nuestro observador de estados, o reconstructor,
al sistema dinamico lineal dado por:
x =
x + u + Ly ;

x (t0 ) = x0

(5.2)

donde la matriz y los vectores y L seran determinados en lo sucesivo, de tal manera que
sea posible obtener un estimador asintotico de los estados del sistema lineal.
Definimos el error de observacion como la diferencia entre el valor real del vector de
estado del sistema linealizado y el valor estimado de tal vector de estado. Esta definicion,
por supuesto, se extiende a los valores iniciales de tales estados. En resumen, se define:
e = x x ; e (t0 ) = x (t0 ) x (t0 ) = x0 x0

(5.3)

Puesto que el valor inicial del estado verdadero es desconocido, no podemos hacer suposicion alguna acerca del valor inicial del error de estimacion. En general tendremos que
suponer que tal error inicial es diferente de cero pero no podremos dar calificaciones adicionales a esta cantidad vectorial.


APRO
84CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Es facil establecer una ecuacion diferencial que describa el comportamiento del vector
de error de estimacion en terminos de las matrices y vectores que definen tanto al sistema
original linealizado como al observador propuesto. En efecto:
e = x x = Ax + Bu (
x u Ly )
= Ax
x + e + (B )u LCx
= (A LC)x + (B )u + e

(5.4)

La dinamica del error de observacion no debe depender ni de los valores de las acciones
de control ni de los valores correspondientes que estas producen en los estados del sistema.
Si hemos de manipular u para lograr, digamos, la estabilizacion del sistema linealizado
hacia el origen de coordenadas, no parece logico que el error de observacion dependiera de
cuan grandes o peque
nas deban ser tales acciones de control. El mismo razonamiento nos
conduce a concluir que es igualmente inconveniente que el error de estimacion dependa de
los valores que va tomando el vector de estado en su camino hacia la estabilizacion, pues la
existencia de sus transientes alejara, a
un mas, el valor del estado estimado del real, actuando
como perturbaciones en la dinamica del error. En consecuencia, debemos anular, con una
escogencia apropiada de las matrices y vectores , y L, la influencia de los estados y
controles del sistema original linealizado. Esto requiere que:
=B ;

= A LC

(5.5)

lo cual hace que el error de observacion evolucione de acuerdo con la dinamica lineal y
autonoma dada por:
e = (A LC)e ;

e (t0 ) = e0

(5.6)

y entonces, el error de estimacion e solo depende de su valor inicial.


La solucion de la ecuacion diferencial lineal vectorial de primer orden, la cual representa al
vector de error de estimacion, estara dada a
un en terminos del vector columna desconocido
L mediante la siguiente expresion:
e (t) = e(ALC)(tt0 ) e0

(5.7)

En virtud del resultado anterior, estamos en capacidad de predecir el comportamiento


cualitativo de e el cual depende principalmente de la naturaleza de los autovalores de la
matriz = A LC. Nuestro objetivo sera entonces el de imponer, sobre la dinamica
autonoma del error de estimacion, un comportamiento asintoticamente estable a cero a
traves de la escogencia juiciosa del vector L. Es decir, debemos escoger L de tal manera que
podamos garantizar que los autovalores de A LC se encuentren en el semiplano izquierdo
del plano complejo. Al hacer esto se garantiza, de paso, que el valor del estado estimado
converge, efectivamente, de manera asintotica al valor del estado verdadero del sistema
linealizado.

5.2. EL OBSERVADOR DE LUENBERGER

u (t)

85

x (t)

y (t)
C

+
+

x (t)

L
y (t)

OBSERVADOR DE LUENBERGER

Figure 5.6: Estructura del observador dinamico de estado


Antes de proceder a hallar el vector requerido L, en virtud de que ya hemos determinado algunas matrices inicialmente desconocidas del observador nos permitimos mostrar a
continuacion el esquema que va adoptando el mismo. En efecto:
x = (A LC)
x + Bu + Ly
= A
x + Bu + Ly LC x
= A
x + Bu + L(y y )

(5.8)

si hacemos :
y = C x

(5.9)

es decir, si damos el nombre de salida estimada al valor que produce el estado estimado
cuando es afectado por el mapa de salida C, entonces reescribimos las ecuaciones del observador como:
x = A
x + Bu + L(y y )
y = C x

(5.10)

El observador dinamico del vector de estado puede representarse entonces como se ilustra
en la figura 5.6.
La interpretacion que podemos hacer de la estructura del observador es directa: el observador de estado no es mas que una emulacion, con capacidad auto-correctora, de la dinamica
del sistema cuyo estado se desea reconstruir. El vector de parametros L juega un papel de
realimentador del error de estimacion en cuanto a su reflejo en los valores de la salida. Precisamente, esta realimentacion del error de salida (mas propiamente llamada inyecci
on de la
salida) es la que trata de corregir cualquier discrepancia que exista entre el valor verdadero
del vector de estado y su valor estimado.
Notese que esta entrada adicional inyectada al modelo emulador del sistema solo puede
tomar valores diferentes a cero cuando la salida del sistema no coincide con el valor de la


APRO
86CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
salida estimada y, de hecho, tal error se anula por completo cuando estos valores coinciden.
Esto es un indicativo de que el proceso de estimacion se esta llevando a cabo en forma
correcta, al menos en principio. Sin embargo, debe quedar suficientemente claro que si
la salida estimada coincide con la salida del sistema esto no implica, necesariamente, que
el estado estimado este coincidiendo con el estado verdadero. Es enteramente posible que
ambos estados (estimado y verdadero) se encuentren temporalmente ocultos por el mapa de
salida representado por el vector fila C, es decir, en un subespacio de su subespacio nulo. La
condicion que nos permitira asegurar que no existe un subespacio, diferente de cero, donde
ambos vectores de estado puedan ocultarse por coincidencia de los valores que arrojan a
la salida es, evidentemente, una condici
on de observabilidad. Veamos este hecho en detalle
en los siguientes parrafos.
El problema de estabilizar asintoticamente el error de estimacion a cero puede verse como
un problema de control sobre un sistema al cual daremos el nombre de dual del original (5.1).
En efecto consideremos el sistema realimentado siguiente:
z = AT z + C T v
v = LT z

(5.11)

y hagamonos la siguiente pregunta: Bajo que condiciones puede estabilizarse a cero el sistema (5.11) por realimentacion lineal del vector de estado z ? La respuesta es, evidentemente,
que el par (AT , C T ) debe ser un par controlable.
Notese que el sistema en lazo cerrado se describe mediante:
z = (AT C T LT )z

(5.12)

Los autovalores que gobiernan la respuesta del sistema (5.12) son los de la matriz del
sistema en lazo cerrado, la cual puede reescribirse como :
(AT C T LT ) = (A LC)T

(5.13)

En otras palabras, como los autovalores de cualquier matriz cuadrada coinciden con los
autovalores de su traspuesta, el vector L debera tener la posibilidad de asignarle los polos
a la matriz (AT C T LT ), en lugares prefijados del semiplano izquierdo del plano complejo.
Esto es posible siempre y cuando el par (AT , C T ) sea un par controlable.
La relacion con nuestro problema de estimacion es inmediata pues el error de estimacion
se encuentra gobernado por la dinamica autonoma:
e = (A LC)e

(5.14)

Concluimos, por tanto, que el problema de estabilizar a cero el error de estimacion del
vector de estado, mediante inyeccion de la salida es factible en tanto que el par de matrices
(AT , C T ) sea un par controlable.
Si escribimos la matriz y la condicion de controlabilidad del par (AT , C T ) obtenemos:
h

rk C = rk C T : AT C T : . . . : (AT )n1 C T = n

(5.15)

5.2. EL OBSERVADOR DE LUENBERGER

87

Puesto que el rango de una matriz iguala al rango de su traspuesta,


rk C = rk C T

(5.16)

entonces, es facil ver que la condicion de controlabilidad del sistema dual (5.11) se traduce
en la siguiente condicion:

C
CA
..
.

rk O = rk C = rk

CAn2

CAn1

(5.17)

que es la conocida condicion de observabiliad del sistema linealizado original.


Concluimos que:
La condici
on necesaria y suficiente para que exista un vector L de ganancia del
observador (que representa el error de observacion) el cual coloque los polos del
sistema lineal en el semiplano izquierdo del plano complejo y, por lo tanto, produzca un error de estimacion asintoticamente estable a cero para el observador
din
amico de Luenberger, es que el sistema linealizado original sea observable.
Notese que es posible que el sistema lineal de base no sea observable, pero que la dinamica
que rige la parte inobservable del vector de estado sea, por s sola, asintoticamente estable
a cero. En ese caso, no tendramos por que preocuparnos de reconstruir mas que la parte
observable del estado del sistema, ya que aquellos estados que no podamos reconstruir, por
ser inobservables, tendran por estimado obvio el valor cero ya que estaramos seguros de
que, tarde o temprano, estos estados llegaran, irremisiblemente, a tomar este u
ltimo valor de
cero. A tales sistemas se les conoce en la literatura como sistemas reconstruibles o detectables.
Ellos juegan un papel dual al de los sistemas estabilizables que estudiamos en la seccion
anterior.

Ejemplo 5.1: sistema de fermentaci


on de az
ucar
Considerese el sistema de fermentaci
on de az
ucar (1.54) que fue expuesto en la seccion 1.3. Este
sistema esta descrito por:
x 1 = x2 x1 u
x 2 = x2 + (1 x2 )u
y = x2

(5.18)

La linealizacion del sistema alrededor de su punto de equilibrio resulto (4.25):


x 1 = x2 x1
x 2 =

1E
Eu
E

1
x2 + (1 x2 )u
E

y = x2

(5.19)


APRO
88CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA

u (t)

.
x=f(x,u)

u(t)

y(t)

y (t)

y=h(x)

u (t)

x (t)

OBSERVADOR DE

-K

LUENBERGER

y (t)

Figure 5.7: Esquema de realimentacion lineal de salida para un sistema no lineal


El sistema linealizado no es observable ya que la matriz de observabilidad esta dada por:
"

O=

0
0

1
1
E

; rk O = 1 6= 2

(5.20)

En equilibrio, el estado x2 tiende a cero, ya que u tambien se supone cero en esta condicion.
El estado x1 no puede reconstruirse a partir del conocimiento de x2 y u ya que x1 no influencia
para nada a x2 , como es facil ver de la estructura de las ecuaciones del sistema. En condiciones
de equilibrio para x2 y u es facil ver que x1 es tambien asint
oticamente estable a cero, en la
medida en que la cantidad (1 E)/E sea positiva, tal y como, efectivamente, hemos supuesto. El
sistema estudiado es, por lo tanto, inobservable pero reconstruible. En el momento de dise
nar un
observador a este sistema, no tendramos necesidad de reconstruir x1 . Ademas, en este caso, el
observador para x2 es trivial.

Tal como nos lo propusimos al inicio del estudio del problema de control sin disponibilidad
del vector de estado, hemos estudiado hasta aqu el problema de la convergencia del error de
estimacion a cero y hemos logrado contestar bajo que condiciones podemos garantizar que
tal error de reconstruccion sea asintoticamente estable a cero.
Debemos atender ahora la inquietud de como garantizar que, durante aquel lapso de
tiempo en el cual el valor del estado estimado no coincide exactamente con el valor del estado
incremental verdadero, el sistema incremental erroneamente controlado sea asintoticamente
estable a cero.
La pregunta fundamental se refiere a si el esquema de la figura 5.7 es valido para la
estabilizacion del sistema alrededor de un punto de operacion.
La pregunta la contestaremos estudiando la validez del esquema de control realimentado
presentado en la figura 5.8, pero utilizando ahora el modelo linealizado en reemplazo de la
parte incremental del modelo no lineal en la figura anterior.

5.2. EL OBSERVADOR DE LUENBERGER

89

SISTEMA LINEALIZADO

u (t)
B

x (t)

y (t)
C

A
x (t)

x (t)
-K

u (t)

+
+

LEY DE CONTROL
LINEAL

y (t)

y (t)

OBSERVADOR DE ESTADO

Figure 5.8: Esquema de control realimentado de salida del sistema lineal que aproxima al sistema
no lineal
Las ecuaciones del sistema en lazo cerrado son:
x
y
u
x
y

=
=
=
=
=

Ax + Bu
Cx
K x
A
x + Bu + L (y y ) = (A LC)
x + Bu + LC x
C x

(5.21)

las cuales podemos reescribir en una sola ecuaci


on vectorial de estado aumentado o estado
compuesto de la planta y del observador, de la manera siguiente:
"

x
x

"

A
BK
LC A LC BK

#"

x
x

(5.22)

Es difcil ver el efecto de las matrices (o vectores) de dise


no K y L en la ecuacion lineal
(5.22) pues los autovalores de la matriz ampliada en lazo cerrado no son faciles de discernir.
Para ello, aprovecharemos el hecho de que dos matrices similares, es decir, aquellas que se
relacionan mediante una transformacion similar, tienen los mismos autovalores.
La transformacion que utilizaremos es la siguiente:
"

x
e

"

I 0
I I

#"

x
x

"

=P

x
x

(5.23)

donde P es, evidentemente, una matriz invertible la cual permite representar el nuevo vector
de estado por medio del estado de la planta y del error de observacion y no por medio de los


APRO
90CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
estados de la planta y del observador. Esta transformacion similar asegura que el sistema
transformado presenta los mismos autovalores que el sistema original.
El sistema transformado resulta entonces:
"

x
e

"

A BK
BK
0
A LC

#"

x
e

(5.24)

Los autovalores del sistema (5.24) son sencillamente la union de los autovalores de las
matriz ABK y de la matriz ALC, es decir, los autovalores del sistema controlado son los
mismos a los obtenidos si el estado estuviese disponible mas los autovalores que gobiernan
la dinamica del error de observacion. Este resultado, el cual en su sentido mas general es
llamado principio de separaci
on, nos indica que el esquema de control presentado en la figura
5.5 es valido, sobre la base del proceso de reconstruccion del vector de estado, en el sentido de
que las variables de estado incrementales x convergen asintoticamente a cero si y solamente
si tanto los autovalores de la matriz A BK como los de la matriz A LC se encuentran
ubicados, gracias a la escogencia apropiada de los vectores K y L, en el semiplano izquierdo
del plano complejo.
El esquema presentado, el cual involucra la ley de control u basada en el observador dinamico de estados, siempre sera factible si los pares (A, B) y (C, A)
son respectivamente controlables y observables. De otro modo, debe cumplirse al
menos que el par (A, B) sea estabilizable y el par (C, A) sea detectable.
Afortunadamente, casi todos los sistemas son controlables y observables. Esto valida
totalmente el esquema propuesto para controlar un sistema mediante realimentacion de la
salida utilizando un reconstructor, u observador, del vector de estado.

Ejemplo 5.2: control de la orientaci


on de un artefacto espacial: dise
no de un observador din
amico de estados
Considerese de nuevo el ejemplo de reorientaci
on del satelite (1.18) para el cual ya habamos
dise
nado un compensador por realimentaci
on de estado. Supondremos que solamente disponemos
de un conocimiento preciso de la orientaci
on del satelite. Es decir, conocemos la variable x1 como
salida del sistema. En virtud de nuestro conocimiento del modelo del sistema es razonable suponer
que tambien conocemos a la perfeccion, si bien por calculo, el estado de equilibrio del sistema. En
consecuencia, conocemos el estado incremental x1 como salida del sistema linealizado.
Las ecuaciones linealizadas de estado y de salida de este sistema son (4.5):

0 1
x 1

x 2 = 0 0
x 3
0 0

0
x1


FL
J x2 + 0 u
R
x3
0

x1

= [1 0 0] x2
x3

(5.25)

5.2. EL OBSERVADOR DE LUENBERGER

91

El sistema linealizado es observable pues la matriz de observabilidad tiene rango completo:

1 0

O= 0 1
0 0

0
FL

0 ; det O =
6= 0
J
FL

(5.26)

Esto significa que podemos construir un observador para el sistema linealizado cuyo error de reconstruccion es asintoticamente estable a cero.
Proponemos entonces el observador siguiente:

x
1
0 1

2 = 0 0
x
0 0
x
3

x
1
0
L1

FL
x

0
L2 (y y )
+
u
+

J
x
3
L3
R
0

x
1

2
= [1 0 0] x
x
3

(5.27)

El error de observacion satisface entonces:

L1 1
e 1

e 2 = L2 0
e 3
L3 0

e1

FL
J e2
e3
0

(5.28)

La estabilidad de este sistema dinamico depende de la ubicacion en el plano complejo de sus


autovalores, o races del polinomio caracterstico, de la matriz del sistema. En este caso, tal
polinomio caracterstico esta dado por:
det(sI A + LC) = s3 + L1 s2 + L2 s +

FL
L3
J

(5.29)

El valor de las componentes del vector L, el cual garantiza un observador cuyo error de reconstruccion es asintoticamente estable, se obtiene a partir de una igualacion del polinomio caracterstico anterior con un polinomio cuyas races sabemos estan ubicadas en el semiplano izquierdo.
Podemos escoger tales races como las del polinomio siguiente:
pd = (s + 1 )(s + 3 )(s + 3 )
= s3 + (1 + 2 + 3 )s2 + (1 2 + 1 3 + 2 3 )s + 1 2 3

(5.30)

Es decir:
L1 = 1 + 2 + 3
L2 = 1 2 + 1 3 + 2 3
J
L3 =
1 2 3
FL

(5.31)

El vector de estado estimado converger


a al valor del estado verdadero de una manera asint
otica.
El estado estimado se utilizara entonces en alimentar la ley lineal de control realimentado que
dedujimos en la seccion anterior.


APRO
92CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION

Posicin angular (real __, estimada - -)

Velocidad angular (real __, estimada - -)

omega omega_estim

theta theta_estim

2
2

1
0
-1
-2
-3

-1
0

0.5

1
tiempo t

1.5

-4
0

0.5

Orientacin de la tobera (real __, estimada - -)

1.5

1.5

Variable de control

2
1
u

beta beta_estim

1
tiempo t

0
0
-1

-1
-2
0

0.5

1
tiempo t

1.5

-2
0

0.5

1
tiempo t

Figure 5.9: Respuesta del sistema de orientacion de un artefacto espacial mediante realimentacion
lineal de la salida utilizando un observador dinamico

5.2. EL OBSERVADOR DE LUENBERGER

93

A continuacion se simula numericamente el comportamiento del sistema no lineal en lazo cerrado


regulado mediante una ley de control basada en un observador dinamico de Luenberger. Las graficas
se presentan en la figura 5.9. Los parametros del sistema y del controlador lineal son los mismos
utilizados en la seccion anterior (ver listado de ejemplo1.m).
c fue empleado para obtener las simulaciones
El programa ejemplo3.m, realizado en MatLab ,
fue el siguiente:
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%

ejemplo3.m
Tercer ejemplo con simulaciones numericas del
libro:
Control de Sistemas No Lineales
Hebertt Sira-Ramirez
Control de orientacion de un artefacto espacial por medio
de linealizacion aproximada y uso de un observador dinamico

function xdot=ejemplo3(t,x)
%% parametros del sistema
F = 200; L=3; R=20; J =50;
%% parametros del controlador
a =2.0; b=3.5; c = 12.75; Theta = 2.5;
%% parametros del observador (los tres polos de la dinamica
%% del error se ubican en -5:
lambda1 = 5;
lambda2 = 5;
lambda3 = 5;
Ll = lambda1+lambda2+lambda3;
L2 = lambda1*lambda2+lambda1*lambda3+lambda2*lambda3 ;
L3 = lambda1*lambda2*lambda3*J/(F*L);
%% Ley de control
u = -J*a*(b^2+c^2)/(F*L*R)*x(4)-J*(b^2+c^2+2*a*b)/F/L/R*x(5)-...
(2*b+a)/R*x(6);
%% Ecuaciones de estado
xdot= [ x(2) ;
F*L/J*sin(x(3)) ;
R*u ;
x(5)+Ll*(x(1)-Theta-x(4)) ;
F*L/J*x(6)+L2*(x(1)-Theta-x(4)) ;
R*u + L3*(x(1)-Theta-x(4))] ;
%% Fin de ejemplo3.m

Ejemplo 5.3: control de la posici


on de un anillo sobre un aro rotatorio
Consideremos el sistema (1.40) representado por:
x 1 = x2
g
x 2 = sin x1 + u sen x1 cos x1
a


APRO
94CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Utilizaremos el punto de equilibrio parametrizado en terminos del valor de equilibrio de la
variable x1e = X:
x1 (X) = X; x2 (X) = 0; u = U =

g
a cos X

(5.32)

La linealizacion de (5.32) alrededor del punto de equilibrio (5.32) resulta:


x 1 = x2

x 2

g
1
=
sen X tan X x1 + sen (2X) u
a
2

(5.33)

donde x1 = x1 X, x2 = x2 y u = u g/(a cos X).


El dise
no del controlador, cuando las variables de estado son completamente accesibles a
medicion, procede de acuerdo al esquema general utilizado en la seccion 4.2: La controlabilidad del
sistema se obtiene de determinar el rango de la matriz C de controlabilidad dada por:
"

C=

0
1
2 sen (2X)

1
2

sen (2X)
0

1
det C = sen 2 2X
4

de donde se deduce que el sistema se torna incontrolable en los puntos X = 0, /2, 3/2, . . ..
Bajo la suposicion de que el estado incremental se encuentra disponible para ser usado en una
poltica de realimentacion para estabilizar el sistema linealizado, se propone la ley de control por
realimentacion del vector de estado:
u = K1 x1 K2 x2

(5.34)

El sistema linealizado en lazo cerrado resultante de aplicar (5.34) es:


x 1 = x2

x 2

1
1
g
sen X tan X K1 sen (2X) x1 K2 sen 2X x2
=
a
2
2

(5.35)

Supongase que deseamos obtener el siguiente comportamiento asint


oticamente estable para el
sistema en lazo cerrado:
x 1 = x2
x 2 = n2 x1 2n x2

(5.36)

donde 0 < < 1, n > 0 son parametros de dise


no. Es inmediato ver que la escogencia de K1 y
K2 no puede ser otra que:
K1 = 2

n2

g
a

tan X sen X
;
sen 2X

K2 =

4n
sen 2X

(5.37)

Por lo tanto, el control lineal que habra de regular al sistema no lineal original esta dado por:
u=

2 g tan X sen X
g
4n
2 n a
(x1 X)
x2
a cos X
sen 2X
sen 2X

(5.38)

5.2. EL OBSERVADOR DE LUENBERGER

95

La escogencia de n y se hacen, por ejemplo, sobre la base de fijar el tiempo de subida del
sistema tr (en ingles, rise time), el cual viene dado por:
tr =

0.8 + 2.5
n

(5.39)

Tpicamente se escoge a como 0.707, con el objeto de lograr una respuesta suficientemente
amortiguada, lo cual significa que, por ejemplo, para un tiempo de ascenso de 0.2 segundos (esto
es, del 10% al 90% del valor final de equilibrio en 0.2 seg.) debemos tomar a n aproximadamente
como 12.83 rad/s.
c simula el comportamiento del sistema no lineal
El siguiente programa, realizado en MatLab ,
controlado mediante la ley realimentada basada en linealizacion aproximada (5.32)(5.38). Los
datos fsicos y valores de equilibrio que utilizamos para la simulaci
on son:
a = 0.20 [m]; g = 9.8 [

rad2
];
(X)
=
X
=
]
[rad];
u(X)
=
69.296465
[
s2
4
s2

(5.40)

%% ejemplo4.m
%%
%% Sistemas No Lineales
%% Hebertt Sira-Ramirez
%%
%% Sistema Controlado por linealizacion aproximada para
%% regular la posicion de un anillo que desliza sobre
%% un aro que gira alrededor
%% de su eje vertical. El cuadrado de su velocidad angular
%% sirve de se~nal de control al sistema.
%%
function xdot=ejemplo4(t,x)
%% parametros del sistema
a = 0.2; g = 9.8;
%% parametros del controlador
X1e = 0.7854; Ue = g/(a*cos(X1e));
wn = 12.83; xi = 0.707;
K1 = 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
K2 = 4*xi*wn/sin(2*X1e);
%% Ley de control
u = -K1*(x(1)-X1e)-K2*x(2)+Ue;
%% Ecuaciones de estado
xdot = [x(2) ;
-g/a*sin(x(1))+u*sin(x(1))*cos(x(1))];
%% Fin de ejemplo4.m

La figura 5.10 muestra las simulaciones correspondientes al comportamiento del sistema (5.32)
en lazo cerrado. El programa que genera estas graficas es el siguiente:
% sejem4.m
% Programa de generacion de los graficos del ejemplo4.m
% tiempo de simulacion
ti = 0;
tf = 1;


APRO
96CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION

Posicion angular del anillo sobre el aro


1

Velocidad angular del anillo


3
2
[rad/s]

theta [rad]

0.8
0.6
0.4
0.2
0

1
0

0.5
tiempo t

-1
0

0.5
tiempo t

Velocidad angular del aro

omega

15

10

5
0

0.5
tiempo t

Figure 5.10: Respuesta del sistema aroanillo controlado mediante realimentacion completa del
vector de estado

5.2. EL OBSERVADOR DE LUENBERGER

97

%% condiciones iniciales:
x0 = [0.2 0];
%% simulacion
[t,x] = ode23(ejemplo4,ti,tf,x0);
%% Angulo theta (x(1))
subplot(2,2,1), plot(t,x(:,1))
title(Posicin angular del anillo sobre el aro)
xlabel(tiempo t)
ylabel(theta [rad])
%% Velocidad angular (x(2))
subplot(2,2,2), plot(t,x(:,2))
title(Velocidad angular del anillo)
xlabel(tiempo t)
ylabel([rad/s])
%% Variable de control (u)
%% parametros del sistema
a = 0.2; g = 9.8;
%% parametros del controlador
X1e = 0.7854; Ue = g/(a*cos(X1e));
wn = 12.83; xi = 0.707;
K1 = 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
K2 = 4*xi*wn/sin(2*X1e);
%% Ley de control
u = -K1*(x(:,1)-X1e)-K2*x(:,2)+Ue;
w = sqrt(u);
subplot(2,2,3), plot(t,w)
title(Velocidad angular del aro)
xlabel(tiempo t)
ylabel(omega)
% fin de sejem4.m

Supondremos ahora que solamente la variable de estado x1 , representando la posicion angular


del anillo sobre el aro, puede ser medida con presicion. De esta manera, realizaremos el dise
no del
controlador lineal que estabilice la salida del sistema mediante un observador dinamico de estado.
El modelo linealizado del sistema con su salida linealizada esta dado por :
x 1 = x2

x 2 =

g
1
sen X tan X x1 + sen (2X)u
a
2

y = x1

(5.41)

El observador dinamico de Luenberger para este sistema linealizado es facil de dise


nar a partir
de este modelo,
x
1 = x
2 + L1 (y y )

g
1
x
2 =
sen X tan X x
1 + sen (2X)u + L2 (y y )
a
2
y = x
1

(5.42)


APRO
98CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
La ley de control para el sistema (5.32), basada en tal estimador del vector de estado, esta dada
por:
u = K1 x1 K2 x2 + U

(5.43)

con K1 y K2 definidos previamente en (5.37).


De (5.41) y (5.42), se deduce que el error de estimacion e = x x
evoluciona entonces de
acuerdo con la siguiente dinamica autonoma:
e 1 = L1 e1 + e2

g
e 2 =
sen X tan X + L2 e1
a

(5.44)

Con el objeto de escoger apropiadamente las ganancias del observador L1 y L2 que garanticen
un comportamiento asintoticamente estable a cero para el error de estimacion e, obtenemos el
polinomio caracterstico del sistema anterior:
p(s) = s2 + L1 s + L2 +

g
tan X sen X
a

(5.45)

e igualamos los coeficientes de este polinomio a los de un polinomio caracterstico deseado pd (s),
dado por:
2
pd (s) = s2 + 21 n1 s + n1

(5.46)

donde 1 y n1 son n
umeros reales tales que el polinomio caracterstico deseado tiene sus races en
el semiplano izquierdo. Las ganancias buscadas resultan
L1 = 21 n1 ;

2 g
L2 = n1
tan X sen X
a

(5.47)

Escojemos los polos del error de observaci


on un poco mas alejados hacia la izquierda del plano
complejo, con respecto al los del sistema en lazo cerrado, con el objeto de que el error de observaci
on
se aproxime rapidamente a cero, de tal forma que, durante la porcion inicial de la trayectoria de
respuesta, el sistema reciba un control realimentado con valores estimados del vector de estado muy
c permite simular la respuesta
similares a sus valores reales. El siguiente programa en MatLab
del sistema en lazo cerrado (5.32)(5.42)(5.43), esto es, utilizando la ley de control basada en el
observador dise
nado anteriormente.
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%
%%

ejemplo5.m
Sistemas No Lineales
Hebertt Sira-Ramirez
Sistema Controlado por linealizacion aproximada para
regular la posicion de un anillo que desliza sobre
un aro que gira alrededor
de su eje vertical. El cuadrado de su velocidad angular
sirve de se~nal de control al sistema.
La ley de control esta basada en la reconstruccion
del vector de estado mediante un observador de Luenberger

function xdot=ejemplo5(t,x)

5.2. EL OBSERVADOR DE LUENBERGER


Posicion angular del anillo

Posicion incremental del anillo (real y estimada -.)


0.2

theta_inc [rad]

theta [rad]

0.8
0.6
0.4
0.2
0

99

0.5
tiempo t

0
-0.2
-0.4
-0.6
0

Velocidad angular del anillo (real y estimada -.)


4

[rad/s]

-2
0

Velocidad angular del aro


15

omega

0.5
tiempo t

10

0.5
tiempo t

0
0

0.5
tiempo t

Figure 5.11: Respuestas del sistema aroanillo controlado por realimentacion lineal de la salida
utilizando un observador dinamico de estado

%% parametros del sistema


a = 0.2; g = 9.8;
%% parametros del controlador
X1e = 0.7854; Ue = g/(a*cos(X1e));
wn = 12.83; xi = 0.707;
K1 = 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
K2 = 4*xi*wn/sin(2*X1e);
%% parametros del observador
wn1 = 15.5; xi1 = 0.707;
L1 = 2*xi1*wn1;
L2 = wn1^2-g/a*tan(X1e)*sin(X1e);
%% Ley de control
u = -K1*x(3)-K2*x(4)+Ue
%% Ecuaciones de estado
xdot = [x(2);
-g/a*sin(x(1))+u*sin(x(1))*cos(x(1));
x(4)+L1*(x(1)-X1e-x(3));
-g/a*sin(X1e)*tan(X1e)*x(3)+1/2*sin(2*X1e)*(u-Ue)+L2*(x(1)-X1e-x(3))];
%% Fin de ejemplo5.m

El comportamiento del sistema controlado en lazo cerrado se muestra en la figura 5.11. El


APRO
100CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
siguiente prograna genera las graficas presentadas.
% sejem5.m
% Programa de generacion de los graficos del ejemplo5.m
% tiempo de simulacion
ti = 0;
tf = 1;
%% condiciones iniciales:
%%x0 = [0.2 0.0 0.2 0.0];
x0 = [0.2 0.0 0.0 -1.0];
%% simulacion
[t,x] = ode23(ejemplo5,ti,tf,x0);
%% Angulo theta (x(1))
subplot(2,2,1), plot(t,x(:,1))
title(Posicin angular del anillo)
xlabel(tiempo t)
ylabel(theta [rad])
%% punto de equilibrio
X1e = 0.7854;
%% Angulo theta (x(1))
subplot(2,2,2), plot(t,x(:,1)-X1e,t,x(:,3),-.)
title(Posicin incremental del anillo (real y estimada -.))
xlabel(tiempo t)
ylabel(theta_inc [rad])
%% Velocidad angular (x(2))
subplot(2,2,3), plot(t,x(:,2),t,x(:,4),-.)
title(Velocidad angular del anillo (real y estimada -.))
xlabel(tiempo t)
ylabel([rad/s])
%% Variable de control (u)
%% parametros del sistema
a = 0.2; g = 9.8;

%%
Ue
wn
K1
K2

parametros del controlador


= g/(a*cos(X1e));
= 12.83; xi = 0.707;
= 2*(wn^2-g/a*tan(X1e)*sin(X1e))/sin(2*X1e);
= 4*xi*wn/sin(2*X1e);

%% Ley de control
u = -K1*(x(:,3))-K2*x(:,4)+Ue;
w = sqrt(u);
subplot(2,2,4), plot(t,w)
title(Velocidad angular del aro)
xlabel(tiempo t)
ylabel(omega)
% fin de sejem5.m

LINEAL DE SALIDA MEDIANTE OBSERVADORES DE ORDEN REDUCID


5.3. REALIMENTACION

5.3

Realimentaci
on Lineal de Salida Mediante Observadores de Orden Reducido

Es facil darse cuenta que en los observadores que hemos construido en la seccion anterior
existe una redundancia implcita sobre la cual no hemos llamado la atencion. En efecto,
en algunos de los ejemplos que hemos presentado hemos procedido a construir observadores
dinamicos de estado que reconstruyen absolutamente todas y cada una de las variables
de estado del sistema. Sin embargo, la variable de salida, en algunas oportunidades, esta
representada por una variable de estado. Si ese estado es perfectamente conocido, en virtud
de las mediciones que de el tenemos en la forma de una salida, pudieramos entonces utiilizarlo
directamente en la elaboracion de la ley de control lineal. Evidentemente, la situacion puede
ser cierta no solo para una de las variables de estado sino para varias de ellas. Es decir, un
n
umero de salidas bien pudiera estar representada por un conjunto de variables de estado.
La pregunta logica es: por que debemos esforzamos en reconstruir o estimar variables de
estado que ya conocemos en forma precisa debido a que son salidas del sistema?. En otras
palabras, el esfuerzo de reconstruir variables de estado debe estar vinculado solamente a
aquellas variables que no conocemos, evitando reconstruir las que ya conocemos.
Recordemos que los observadores de estado representan una cierta emulacion, con facultades de autocorreccion, del sistema dinamico que ellos observan. En virtud de esto, un
observador tiene, en principio, la misma dimension que la planta del sistema. Si algunas
variables de estado ya son conocidas y no hace falta reconstruirlas con error, podemos entonces pensar que es factible obtener una economa en el orden del sistema que necesitamos
utilizar como observador de la planta. En efecto, si solo un n
umero inferior de estados debe
ser reconstruido, el observador debera tener dimension igual al n
umero de variables que deseamos reconstruir. Estas consideraciones nos conducen a la idea de proponer observadores
de orden reducido para aquellos sistemas donde ya poseemos conocimiento de una, o algunas,
de las variables de estado.
Introduciremos, mediante un ejemplo, la posibilidad de reconstruir solo un n
umero inferior de las variables de estado mediante un observador de orden reducido.

Ejemplo 5.4: control de nivel de un sistema de tanques


Considerese el sistema constituido por dos tanques, de forma diferente, tales como los que se
muestran en la figura 5.12 y en los cuales se vierte un cierto lquido. El modelo dinamico de este
sistema se obtiene facilmente mediante una aplicacion sencilla de la ley de Bernoulli. Las ecuaciones
son las siguientes:
3/2

x 1 = x2
1 u x1
1/2

x 2 = x1
y = x2

1/2

x2

(5.48)

donde x1 y x2 son, respectivamente, las alturas del lquido en cada uno de los tanques, medidas
desde el borde inferior del tanque correspondiente. La variable de control esta constituida por


APRO
102CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
u=U

x1

x2

Figure 5.12: Sistema de tanques en cascada


u, el flujo del lquido que entra al primero de los tanques. El modelo dinamico se encuentra,
evidentemente, en variables normalizadas pues no interviene en el constante alguna.
El punto de equilibrio del sistema (5.48) esta representado por una altura x2e = X que se desea
mantener en el segundo tanque. Parametrizando los puntos de equilibrio en terminos de tal valor
X, tenemos

(5.49)
x1 (X) = X; x2 (X) = X; u = X
Linealizamos el sistema alrededor de este punto de equilibrio para obtener:
1
x 1 = X 5/2 x1 + X 2 u
2
1 1/2
1
x 2 =
X
x1 X 1/2 x2
2
2
y = x2

(5.50)

Este sistema es controlable en tanto que la altura deseada X se mantenga en un valor finito,
0 < X < , lo cual es posible fisicamente.
Usando los metodos explicados anteriormente, dise
namos un controlador por realimentaci
on
del vector de estado incremental. La ley de control incremental estara dada, en caso de conocer
perfectamente ambos estados incrementales, por:
u = K1 x1 K2 x2

(5.51)

El sistema linealizado en lazo cerrado es:


"

x 1
x 2

"

21 X 5/2 K1 X 2 K2 X 2
1 1/2
12 X 1/2
2X

#"

x1
x2

(5.52)

donde las ganancias K1 y K2 se obtienen de igualar el polinomio caracterstico plc (s) del sistema
en lazo cerrado y un polinomio caracterstico deseado pd (s).
"

plc (s) = det

s + 21 X 5/2 + K1 X 2
K2 X 2
1 1/2
s + 12 X 1/2
2X

LINEAL DE SALIDA MEDIANTE OBSERVADORES DE ORDEN REDUCID


5.3. REALIMENTACION

1 1/2 1 5/2
1
1
X
+ X
+ K1 X 2 s + (K1 + K2 )X 5/2 + X 3
2
2
2
4
2
2
pd (s) = s + 2n s + n
= s2 +

(5.53)

Las ganancias K1 y K2 obtenidas son:


1
K1 = 2n X 2 1/2X 3/2 X 1/2
2
K2 = 2n2 X 5/2 2n X 2 + 1/2x3/2
A partir de este resultado, la ley de control para el sistema linealziado esta dada por:

1
1
1
u = 2n X X 3/2 X 1/2 x1 n2 X 5/2 2n X 2 + x3/2 x2
2
2
2
2

(5.54)

Esta ley de control es utilizada para controlar el sistema si se conocen en forma exacta ambas
variables de estado. Debido a que esto no es as, es necesario utilizar variables estimadas del estado
incremental, de la siguiente manera:

1
1
1
1 n2 X 5/2 2n X 2 + x3/2 x
2
u = 2n X X 3/2 X 1/2 x
2
2
2
2

(5.55)

Por cuanto la variable incremental y = x2 es medible, no hace falta reconstruir sus valores y
la ley de control sera la siguiente:

1
1
1
1 n2 X 5/2 2n X 2 + x3/2 y
u = 2n X 2 X 3/2 X 1/2 x
2
2
2

(5.56)

El problema entonces se centra en como estimar la altura incremental, x1 , en el primer tanque,


a partir del conocimiento de y = x2 (la altura incremental en el segundo tanque) y de nuestro
conocimiento del sistema linealizado.
Consideremos la segunda ecuacion diferencial del sistema linealizado, la cual describe la
evolucion de la variable conocida x2 :
1
1
x 2 = X 1/2 x1 X 1/2 x2
2
2

(5.57)

Esta ecuacion, evidentemente, guarda alguna informacion sobre x1 puesto que al ser conocida
en forma exacta x2 podemos suponer como conocida tambien su derivada temporal. De esta
ecuacion, obtenemos el siguiente valor para x1 :
x1 = 2X 1/2 x 2 + x2

(5.58)

Haciendo caso omiso, por los momentos, de la necesidad de tener que tomar derivadas temporales x 2 de la altura incremental, podemos considerar la expresion en el miembro derecho de esta
u
ltima ecuacion como una medicion o salida auxiliar. Llamaremos tal salida z .
Consideremos la primera ecuacion diferencial del sistema linealizado en conjuncion con la salida
auxiliar que mide, de forma un poco incomoda, el valor de x1 :
1
x 1 = X 5/2 x1 + X 2 u
2
z = x1 = 2X 1/2 x 2 + x2

(5.59)


APRO
104CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
En virtud de que disponemos, al menos conceptualmente, de la medicion z pudieramos
aprovechar el conocimiento de la ecuacion diferencial de x1 con el fin de implementar un proceso
de estimacion para x1 basado en estos dos datos. Un estimador dinamico del estado incremental
estara dado por:
1
x
1 = X 5/2 x1 + X 2 u + L1 (z z )
2
z = 2X 1/2 x 2 + x2
z = x
1

(5.60)

Substituyendo estos valores en la ecuacion diferencial tenemos:


1
x
1 = X 5/2 x1 + X 2 u + L1 (2X 1/2 x 2 + x2 x
1 )
2
El error de estimacion estara dado por la solucion de la ecuacion diferencial:

e 1

(5.61)

1 5/2
=
X
x1 + L1 e1
2

(5.62)

No existe, entonces, problema alguno en proponer un valor de la ganancia L1 de tal forma que
el error de estimacion sea asintoticamente estable a cero. De hecho, cualquier valor positivo L1 > 0
de tal ganancia lo lograra. Sin embargo, este estimador a
un requiere del calculo de la derivada
temporal de la altura incremental en el segundo tanque. Con el objeto de evitar tal proceso de
derivacion, definamos la siguiente variable auxiliar:
= x
1 2L1 X 1/2 x2

(5.63)

De esta forma, podemos obtener una ecuacion diferencial para esta nueva variable usando la
ecuacion del estimador. En efecto vemos que esa ecuacion es equivalente a la siguiente:
i
d h
x
1 2L1 X 1/2 x2
dt
h
i
1
1 2L1 X 1/2 x2 L1 X 2 x2 X 2 u
= X 5/2 x
2
+ L1 (x2 [
x1 2L1 X 1/2 x2 ]) 2L21 X 1/2 x2

x
1 2L1 X 1/2 x 2 =

(5.64)

la cual reescribimos como:


d
1
= ( X 5/2 + L1 ) X 2 u + [L1 2L21 X 1/2 L1 X 2 ]y
(5.65)
dt
2
En esta ecuacion diferencial todos sus terminos son conocidos y no requieren proceso alguno de
derivacion. Ademas el valor de esta directamente relacionado al valor del estimado de la altura
incremental x1 el cual necesitamos. En efecto, puesto que ahora es enteramente calculable como
solucion de la ecuacion diferencial anterior podemos establecer que el estimado de x1 es:
x
1 = + 2L1 X 1/2 y

(5.66)

donde es solucion de (5.65).


La figura 5.13 muestra el esquema de estimacion de estados utilizado para el control del sistema
de tanques, el cual esta basado solo en una ecuacion diferencial y no en dos como es en el caso de
un observador de orden completo.

LINEAL DE SALIDA MEDIANTE OBSERVADORES DE ORDEN REDUCID


5.3. REALIMENTACION
u=U

x 2 (X)=Y(X)=X

U
+ +

y=x 2

x1

y =x 2

K2 K1
x2

-2
-2
-5/2
2 1/2
=- (1/2X +L1) +X u +(L1-2 L1 X - L1 X )y

OBSERVADOR DE ORDEN REDUCIDO

u
x2

2L1X 1/2

Figure 5.13: Esquema de control realimentado lineal de la salida para un sistema de tanques
mediante el uso de un observador de orden reducido

5.3.1

Observadores de Orden Reducido: Caso Lineal de Indole


General

Supongase como salida y del sistema, un n


umero n1 < n de variables de estado incrementales
representadas por el vector x1 . Nuestro objetivo sera el de desarrrollar un observador
que permita hallar el valor estimado del resto de las variables de estado incremental que
supondremos son en n
umero, n2 , donde n1 + n2 = n. Representamos estas variables no
medibles mediante el vector x2 . Por lo tanto, el vector de estado incremental esta dado por:
"

x =

x1
x2

IRn1 +n2

(5.67)

Notese que no hay perdida alguna de generalidad en suponer que las variables de estado
directamente medibles ocupan las primeras n1 posiciones en el vector de estado. Si este no
fuera el caso, mediante un reordenamiento de las variables de estado podemos hacer que
estas primeras componentes sean precisamente las variables de estado medibles. De acuerdo
con estas dimensiones tenemos:
x1 IRn1 ; x2 IRn2 ; x IRn

(5.68)

Podemos, entonces, particionar las matrices que intervienen en el sistema linealizado


x = Ax + Bu y reescribir estas ecuaciones de estado incremental como:
"

x 1
x 2

"

A11 A12
A21 A22

#"

x1
x2

"

B1
B2

(5.69)


APRO
106CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
donde A11 IRn1 n1 , A12 IRn1 n2 , A21 IRn2 n1 , A22 IRn2 n2 , B1 IRn1 , B2 IRn2 . La
ecuacion vectorial de salida representada por el subvector de estados conocidos:
y = x1

(5.70)

Es evidente que el problema de estimar el vector de estado a partir de la salida puede


reducirse a estimar solamente las variables de estado contenidas en x2 , pues todos los estados
incrementales contenidos en x1 son conocidos a traves de la medicion directa representada
por el vector y . Reescribamos las ecuaciones de estado linealizadas de la manera siguiente:
x 2 = A21 x1 + A22 x2 + B2 u
A12 x2 = y A11 y B1 u

(5.71)

Puesto que y y u son conocidas, es concebible que tambien podamos conocer como
se
nal del tiempo al vector n1 -dimensional dado por la segunda ecuaon anterior. Designemos
a este vector como y2 :
y2 = A12 x2 = y A11 y B1 u

(5.72)

El problema de estimacion de x2 puede verse como el problema de reconstruir el estado


del subsistema dado por:
x 2 = A22 x2 + v1
y2 = A12 x2

(5.73)

donde el vector v1 = A21 x1 + B2 u es completamente conocido, al igual que la se


nal y2 .
La reconstruccion del estado incremental desconocido x2 , con error de estimacion asintoticamente
estable a cero, es factible si el par (A12 , A22 ) es observable o, en su defecto, simplemente detectable.
Recordemos el siguiente Teorema sobre la Observabilidad de un sistema:
Teorema 5.1 Un sistema lineal z = Az, y = Cz es observable (es decir, el par (C, A) es
observable) si, y solamente si, el u
nico vector para el cual se cumple que :
C exp(At) = 0

(5.74)

es para = 0.
Prueba: Supongamos, por un momento, que el sistema lineal dado es inobservable. Entonces, existe una transformacion del vector de estado z que exhibe tal inobservabilidad. Tal
transformacion lleva al sistema a su forma canonica inobservable de Kalman:
z1 = A11 z1
z2 = A21 z1 + A22 z2
"
#
z1
w = z1 = [I 0]
z2

(5.75)

LINEAL DE SALIDA MEDIANTE OBSERVADORES DE ORDEN REDUCID


5.3. REALIMENTACION
Puesto que la exponencial matricial de este sistema esta dada por:
"

exp

A11 0
A21 A22

# !

"

t =

exp A11 t
0
?
exp(A22 t)

(5.76)

entonces es claro que existen vectores distintos de cero que hacen cero el siguiente producto:
"

[I 0]

exp A11 t
0
?
exp A22 t

#"

1
2

"

= [exp(A11 t) 0]

1
2

= exp(A11 t)1

(5.77)

pues para ello bastara con tomar vectores de la forma:


"

0
2

(5.78)

Esto demuestra la necesidad de la condicion dada en el teorema. La demostracion de


la suficiencia se obtiene rapidamente a partir de una expansion en serie del exponencial
matricial. No haremos esta parte de la demostracion aqui.
A partir del teorema anterior, es facil demostrar que si el sistema dado por:
"

x 1
x 2

"

A11 A12
A21 A22

#"

x1
x2

y = x1

(5.79)

es observable (detectable) entonces el subsistema:


x 2 = A22 x2
y2 = A21 x2

(5.80)

tambien es observable (detectable).


Regresamos entonces al problema planteado, cual era reconstruir el vector de estado del
sistema:
x 2 = A22 x2 + v1
y2 = A21 x2

(5.81)

donde el vector v1 es conocido, al igual que la se


nal de salida y2 .
Un observador para este sistema se obtiene simplemente como:
x 2 = A22 x2 + v1 + L2 (y2 y2 )
y2 = A21 x2

(5.82)

El error de estimacion estara dado entonces por:


e 2 = x 2 x 2
= A22 x2 + v1 A22 x2 L2 (A12 x2 A12 x2 ) v1
= (A22 L2 A12 )e2

(5.83)


APRO
108CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
L2

y (t)

( A22 - L 2 A12 )

u (t)

+A - L 2 A
21
11

z2

+ +

x (t)

A22 - L 2 A12

B2 - L 2 B1

Figure 5.14: Estructura de un observador dinamico de orden reducido


Debemos encontrar una matriz L2 tal que la dinamica del error sea asintoticamente estable.
Puesto que el sistema se ha supuesto observable tal vector siempre existe.
A pesar de esta solucion, nuestro observador requiere de la se
nal y2 que involucra la
derivacion de x1 , es decir, del vector de salida original del sistema y1 (ver Ec. (5.72)). Tal
practica no es aconsejable en problemas reales y la solucion carece de sentido si las mediciones
se realizan fsicamente. Mas a
un, los derivadores ideales son circuitos altamente inestables
y sin visos de aplicabilidad practica. Reescribimos la ecuacion obtenida del observador de la
manera siguiente:
x 2 = A22 x2 + A21 y + B2 u + L2 (y A11 y B1 u A12 x2 )
= (A22 L2 A12 )
x2 + (A21 L2 A11 )y + (B2 L2 B1 )u + L2 y

(5.84)

d
(
x2 L2 y ) = (A22 L2 A12 )(
x2 L2 y ) + (A22 L2 A12 )L2 y
dt
+(A21 L2 A11 )y (B2 L2 B1 )u

(5.85)

es decir:

Si hacemos:
z2 = x2 L2 y

(5.86)

entonces de (5.85) y (5.86) obtenemos :


z2 = (A22 L2 A12 )z2 + ((A22 L2 A12 )L2 + A21 L2 A11 )y + (B2 L2 B1 )u
x2 = z2 + L2 y
(5.87)
Las ecuaciones (5.87) representan efectivamente un observador dinamico para la parte del
estado no medible del sistema original. Podemos, en consecuencia, obtener el estimado de
x2 como salida del sistema que genera a la variable auxiliar z2 . El esquema del observador
de orden reducido se puede representar, entonces, por medio del diagrama mostrado en la
figura 5.14.
El esquema general de control para un sistema no lineal sobre la base de un observador
de estado incremental de orden reducido se muestra en la figura 5.15.

LINEAL DE SALIDA MEDIANTE OBSERVADORES DE ORDEN REDUCID


5.3. REALIMENTACION
PUNTO DE OPERACION NOMINAL
DE ENTRADA Y SALIDA

u (t)

.
x=f(x,u)

u(t)

y(t)

y =x 1

y=h(x)

x2

OBSERVADOR
DINAMICO DE
ORDEN REDUCIDO

LEY DE

x1

x1

CONTROL

Figure 5.15: Estructura de control por realimentacion lineal de la salida, a base de un observador
dinmico de orden reducido

Ejemplo 5.5: control de la orientaci


on de un artefacto espacial
Consideremos nuestro ejemplo de reorientaci
on del satelite. El modelo linealizado esta dado
por (5.25):

0 1
x 1

x 2 = 0 0
x 3
0 0

0
x1

FL
J x2 + 0 u
x3
R
0

y = x1

(5.88)

Deseamos utilizar la posicion angular incremental x1 , para emplearla directamente en el controlador por realimentacion de estado (es decir, usaremos esta variable sin estimarla). Sobre la base
del conocimiento de esta variable incremental y de la entrada u , deseamos estimar o reconstruir
los valores de x2 y x3 con un observador de orden reducido.
Las ecuaciones particionadas son:
"

x 1 = x2
x 2
x 3

"

0
0

FL
J

#"

x2
x3

"

0
R

y = x1

(5.89)

es decir, de acuerdo a la formulacion general, tenemos:


"

A11 = 0; A12 = [1 0]; A21 =

0
0

"

; A22 =

0
0

FL
j

"

; b1 = 0; b2 =

0
R

(5.90)


APRO
110CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Consideremos, entonces, el problema de estimar los estados x2 y x3 a partir de:
"

x 2
x 3

"

FL
J

0
0

#"

x2
x3

"

0
R

y = x1

(5.91)

El observador dinamico para este subsistema estara dado por:


Notese que el par (A12 , A22 ) dado por las matrices:

"

[1 0],

0
0

#!

FL
J

(5.92)

es observable.
Usando el procedimiento explicado anteriormente, reescribimos las ecuaciones del observador
reducido de la manera siguiente:
"

x
2
x
3

"

=
"

0
0

FL
J

0
0

FL
J

#"
#"

En forma mas sintetica:


"

x
2
x
3
x
2
x
3
#

x
2 L21 x 1
x
3 L22 x 1

"

+
#

"

"

0
R
0
R

"

u +
#

"

#"

(x 1 y2 )
#

L21
L22

u +

FL
J

L21
L22

L21
L22

x
2
x
3

"

x 1 +

"

0
R

L21 0
L22 0

#"

x
2
x
3

(5.93)

(5.94)

Hagamos ahora:
z21 = x
2 L21 x1 = x
2 L21 y
z22 = x
3 L22 x1 = x
3 L22 y

(5.95)

Obtenemos a partir de la ecuacion diferencial anterior el siguiente observador dinamico de orden


reducido:
"

z21
z22

"

L21
L22

FL
J

#"

z21
z22

"

0
R

"

u +

L21
L22

FL
J

#"

L21
L22

(5.96)

Las variable estimadas estan dadas por:


x
2 = z21 + L21 y
x
3 = z22 + L22 y

(5.97)

La ubicacion de los polos del observador, los cuales habran de regir el comportamiento del error
de reconstruccion de los estados no medibles directamente, en el semiplano izquierdo del plano
complejo, se logra escogiendo las ganacias del observador de forma tal que igualen el polinomio
caracterstico del sistema autonomo, p(s), a un polinomio escogido previamente pd (s),
"

e 21
e 22

"

L21
L22

FL
J

#"

e21
e22

(5.98)

5.4. EJERCICIOS PROPUESTOS

111

As:
FL
2
L22 pd (s) = s2 + 2r nr s + nr
J

p(s) = s2 + L21 s +

(5.99)

y entonces:
J 2

F L nr

L21 = 2r nr ; L22 =

5.4

(5.100)

Ejercicios Propuestos

Ejercicio 5.1: Matlab


sistema de levitaci
on magn
etica
Dise
ne la ley de control por realimentaci
on del vector de estados para el sistema no lineal
(1.36), utilizando un observador de orden reducido. Realice las simulaciones del comportamiento
dinamico del sistema en lazo cerrado. Ayuda: Emplee los resultados obtenidos en el captulo
anterior. Recuerde que la salida esta dada por y(t) = x1 (t).
(?)
Ejercicio 5.2: p
endulo sin amortiguamiento
= x1

cm
L
y(t) = h(t)

Figure 5.16: Medicion de la altura en el pendulo simple


Considere el pendulo simple sin amortiguamiento (1.11), mostrado en la figura 1.3. Estudie dos
casos:
1. la salida esta dada por y(t) = x2 (t), es decir, se tiene disponible la velocidad angular del
brazo del pendulo,
2. se mide la altura y(t) = h(t) del extremo de la barra (ver figura 5.16).
Se desea estabilizar el sistema alrededor de x1e = d . Dise
ne, para cada caso, un observador
dinamico de estados. En el caso y(t) = x2 (t), obtenga adicionalmente un observador de orden
reducido.
Responda las siguientes preguntas para cualquiera de los dise
nos anteriores: Es posible obtener
tal observador? Que restricciones se deben imponer al sistema para realizar este dise
no? Explique
las implicaciones practicas o fsicas asociadas al dise
no de un observador dinamico de esta naturaleza.
(?)


APRO
112CHAPTER 5. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION

Lecturas Recomendadas
Al igual que en el captulo anterior le sugerimos consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.

Chapter 6
Dise
no de Compensadores Cl
asicos
mediante Linealizaci
on Aproximada

Durante anos el diseno de leyes de control estuvo basado exclusivamente en el uso de metodos
frecuenciales. En la actualidad, el uso de reguladores o compensadores en el control de plantas
y procesos industriales no ha perdido su vigencia y sigue teniendo una gran importancia. El
metodo de la linealizacion aproximada ilustrado en los captulos previos, nos permitira dedicarnos
a la llamada teora clasica de sistemas de control lineales.

6.1

Introducci
on

El metodo de la linealizacion aproximada permite, en principio, la utilizacion de cualquiera de


los metodos de dise
no de controladores inherentemente validos para sistemas lineales. Como
hemos visto hasta ahora, esto es cierto en tanto 1) el principio de Linealizacion sea valido
localmente en un entorno suficientemente grande alrededor del punto de operacion deseado,
y 2) el modelo linealizado cumpla con las condiciones de controlabilidad y observalidad
requeridas. En base al dise
no llevado a cabo sobre el sistema linealizado, se obtiene un
controlador que induce estabilizacion local del sistema no lineal alrededor de su punto de
equilibrio.
113

DE COMPENSADORES CLASICOS

APROX
114CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
En este captulo seguiremos este mismo esquema para el dise
no de esquemas de control
clasicos basados en la funcion de transferencia. No desarrollaremos en forma extensa los
diferentes metodos para el dise
no de compensadores Gc (s) (lugar de las races, metodo de
Bode, Nichols, etc) ya que existen excelentes y detalladas referencias al respecto (ver la
seccion Lecturas Recomendadas). En lugar de ello, presentaremos un conjunto de ejemplos
ilustrativos de la aplicacion de algunas de las estrategias de compensacion mas comunmente
empleadas.
En adelante, trataremos el dise
no de compensadores en serie Gc (s) para sistemas no lineales. En la seccion 6.2 trataremos en detalle los esquemas de dise
no clasicos para la regulacion,
conocidos como controlador proporcional, P, proporcionalintegral, PI y proporcional integral derivativo, PID, todos ellos basados en el metodo frecuencial de Ziegler-Nichols. En la
seccion 6.3 se presenta el desarrollo de compensadores basados en el metodo de controladorobservador clasico. Finalmente, en la seccion 6.4, presentaremos el procedimiento de dise
no
de un compensador en adelanto, utilizando para ello el ejemplo del sistema de levitacion
c en forma intensiva y podra servir como
magnetica. El esquema presentado usa Matlab
una gua en futuras experiencias de dise
no de sistemas de control realimentado.

6.2

Dise
no de reguladores del tipo P, PI y PID mediante Linealizaci
on Aproximada

Los metodos de dise


no de compensadores del tipo PID (proporcionalintegralderivativo)
son de gran importancia en la estabilizacion de sistemas reales que operan en la vecindad
de puntos de equilibrio, prueba de ello es el uso frecuente y entenso de compensadores
PID en aplicaciones industriales. A continuacion, usando como base el dise
no linealizado,
presentaremos el metodo de Ziegler-Nichols en regimen frecuencial para la entonacion de
los parametros del compensador. No utilizaremos el metodo de Ziegler-Nichols basado en
los parametros de la respuesta escalon, por cuanto la obtencion en forma analtica de estos
parametros es un tanto mas difcil. El metodo usado es el basado en la respuesta crtica del
sistema, el cual permite encontrar directamente, de una forma sistematica y analtica, los
elementos del diagrama de Nyquist para el calculo de los parametros del controlador, sea P,
PI o PID. El metodo que expondremos solo se aplica a sistemas SISO, de una sola entrada
y una salida y que ademas presenten la propiedad de ser estables en lazo abierto.
El metodo de Ziegler-Nichols en regimen frecuencial consiste en determinar dos parametros,
f0 (U ) y K0 (U ), a partir del diagrama de Nyquist de la funcion de transferencia en lazo abierto
(3.15). Estos parametros son conocidos como la frecuencia u
ltima f0 (U ) y la ganancia u
ltima
K0 (U ). Estos valores se expresan de la siguiente manera:
1
2
=
0 (U )
f0 (U )
1
K0 (U ) =
|GU (0 (U ))|
P0 (U ) =

(6.1)

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


APROXIMA
6.2. DISENO
Im

plano GU(s)
(U)

=0

Re

GU(j

GU(j 0(U))

Figure 6.1: Determinacion de la frecuencia ultima 0 y la ganancia ultima K0


donde P0 (U ) es el perodo u
ltimo y 0 (U ) corresponde a la frecuencia u
ltima expresada en
radianes. Los parametros presentados en (6.1) corresponden a los que usaremos directamente
en el Metodo de Ziegler-Nichols. Notese la dependencia de estos parametros respecto al punto
de operacion U .
La frecuencia 0 (U ) (o f0 (U )) corresponde al valor de frecuencia finita, diferente de
cero, para el cual Imag G(j(U )) = 0, es decir, cuando el sistema presenta estabilidad
marginal. Este valor se determina del grafico de Nyquist, tal como se muestra en la figura
6.1. Analticamente, los valores de K0 (U ) y 0 (U ) se calculan a partir de la funcion de
transferencia GU (s) de la manera siguiente:
1
|GU (j(U ))|
arg [GU (j0 (U ))] =
K0 (U ) =

(6.2)

La expresion general del compensador PID que estabiliza la salida del sistema linealizado
al valor de cero esta dada por :
"

1
Gc (s) = KP (U ) 1 +
+ TD (U )s
TI (U )s

(6.3)

Como se observa, las expresiones de los controladores P y PI se obtienen haciendo, respectivamente, TI (U ) = , TD (U ) = 0 y TD (U ) = 0. Para el caso del regulador PD hacemos
simplemente TI (U ) = .
Una representacion un tanto mas simple para el controlador (6.3) es la siguiente:
Gc (s) = K1 (U ) +

K2 (U )
+ K3 (U )s
s

(6.4)

De acuerdo a las representaciones anteriores (6.3) y (6.4), el metodo Ziegler-Nichols


propone, a partir de los valores P0 y K0 , los valores de los parametros del compensador lineal
del tipo P, PI o PID, a dise
nar. La tabla 6.1 muestra los diferentes valores parametricos

DE COMPENSADORES CLASICOS

APROX
116CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Table 6.1: Parametros KP , TI , TD del metodo de Ziegler-Nichols
Tipo der
Parametro
controlador KP
P
0.5K0 (U )
PI
0.45K0 (U )
PID
0.6K0 (U )

Parametro Parametro
TI
TD

0
0.83P0 (U ) 0
0.5P0 (U )
0.125P0 (U )

Table 6.2: Parametros K1 , K2 , K3 del metodo de Ziegler-Nichols


Tipo de
Parametro Parametro Parametro
controlador K1
K2
K3
P
0.5K0 (U ) 0
0
0.54K0 (U )
0
PI
0.45K0 (U )
P0 (U )
1.2K0 (U )
PID
0.6K0 (U )
0.075K0 (U )P0 (U )
P0 (U )

de KP , TI y TD recomendados por el metodo de Ziegler-Nichols Estos valores caracterizan


las constantes de los compensadores que permiten regular eficientemente a toda la familia
de sistemas lineales parametrizada por el punto de equilibrio deseado. En terminos de los
parametros K1 , K2 , K3 , la tabla 6.1 se puede reescribir como aparece en la tabla 6.2.
No hemos considerado explcitamente el caso PD por cuanto es facil demostrar que este
caso se corresponde, en general, con realimentacion (estatica) del vector de estado, cuyo
tratamiento ya hemos visto en todo detalle en captulos anteriores.
El controlador PID lineal, obtenido mediante el metodo de Ziegler-Nichols, puede escribirse facilmente en terminos de una representacion de estado, donde la entrada corresponde
al error linealizado de la salida incremental respecto de su valor nominal cero, e . Esta representacion admite en la ecuacion de salida la presencia de un termino en la derivada de la
entrada, es decir, de /dt, el cual excita al compensador directamente. Por lo tanto tenemos:
= K2 (U )e
u = + K1 (U )e + K3 (U )

de
dt

(6.5)

donde e = yref y = 0 y = y .
Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la
forma:
u = K1 (U )e + K2 (U )

Z t
o

e ()d + K3 (U )

de
dt

(6.6)

el cual, ciertamente, constituye un controlador PID clasico. Este regulador PID lineal clasico,

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


APROXIMA
6.2. DISENO
U
0

e
+
-

COMPENSADOR LINEAL CLASICO


tipo P, PI, PID

Y(U)

1
KP(U) [ 1 + T (U)s + TD(U)s]

SISTEMA
NO
LINEAL

Figure 6.2: Esquema de control PID para Sistemas No Lineales


as dise
nado, estabiliza localmente al sistema no lineal cuando el esquema de dise
no se realiza
de acuerdo al diagrama presentado en la figura 6.2.
Debemos advertir que no siempre es posible aplicar el metodo de Ziegler-Nichols
para el dise
no del compensador linealizado. En general, sistemas de primer y
segundo orden no pueden beneficiarse de dise
nos derivados de esta tecnica. La
raz
on fundamental estriba en el hecho de que tales sistemas possen funciones de
transferencia cuyo grafico de Nyquist no corta el eje real mas que en = 0 y
= . La determinacion de la ganancia u
ltima se convierte, entonces, en un
proceso singular. Tampoco se aplicar
a este metodo a sistemas inestables. De
hecho, este metodo se emplear
a en sistemas que presentan una caracterstica
forma en S de la respuesta escal
on unitario (Ogata, 1996).

Ejemplo 6.1: sistema de suspensi


on magn
etica - las condiciones fallan!
Consideremos nuevamente el sistema de suspension magnetica (1.36) el cual permite mantener
levitada una peque
na esfera metalica de masa m. La funcion de transferencia del sistema linealizado
(3.18), la cual relaciona la corriente de entrada al circuito del electroiman con la posicion de la esfera
metalica esta dada por:
y (s)
x1 (s)
GX (s) =
=
=
u (s)
u (s)
s3 +

cg
mX
g
R 2
Ls Xs
2
L

Rg
LX

(6.7)

(0bservese la inversion de signo respecto a la funcion de transferencia original (3.19), en este caso
hemos tomado la se
nal de salida de tal forma que y (t) = x1 (t), esto nos permitira facilitar los
calculos mas adelante).
De acuerdo con el criterio de Nyquist este sistema en lazo cerrado es inestable. Este criterio
tiene que ver con la siguiente funcion de transferencia
1 + Kc

NG (s)
DG (s)

(6.8)

donde GX (s) = NG (s)/DG (s). El numerador de (6.8) corresponde al polinomio caracterstico


del sistema en lazo cerrado. El criterio dice que el diagrama de Nyquist cumple con la condicion

DE COMPENSADORES CLASICOS

APROX
118CHAPTER 6. DISENO
MEDIANTE LINEALIZACION

0.04

0.03

Eje Imaginario

0.02

0.01

-0.01

-0.02

-0.03

-0.04
-0.5

-0.45

-0.4

-0.35

-0.3

-0.25
-0.2
Eje Real

-0.15

-0.1

-0.05

Figure 6.3: Grafico de Nyquist de la funcion de transferencia para el sistema de suspension


magnetica
N = ZP donde N es el n
umero de vueltas contadas en sentido horario alrededor del punto 1+0 j ,
Z es el n
umero de ceros inestables (Re(s) > 0) presentes en (6.8), es decir, Z se corresponde con el
n
umero de raices inestables del polinomio caracterstico del sistema en lazo cerrado; P es el n
umero
de polos inestables de (6.8).
El grafico de Nyquist para este sistema se presenta en la figura 6.3. Los valores empleados de
los parametros fueron los siguientes:
g = 9.8 [m/seg 2 ]; c = 1; m = 0.1 [kg]; R = 1 []; L = 0.01 [h]; X = 0.05 [m]
A partir de este diagrama se deduce que N = 0, el sistema en lazo abierto presenta una raiz
inestable P = 1 y, por lo tanto, Z = 1. Al aumentar la ganancia Kc , persisten las raices inestables
y de hecho aumentan a Z = 2. La ilustracion de este hecho se observa, mas adelante, en el lugar
de las raices del sistema (6.7) mostrado en la figura 6.9. Este sistema, entonces, no se puede tratar
mediante el metodo de dise
no de Ziegler-Nichols descrito anteriormente.

Ejemplo 6.2: Dise


no de un controlador PI para un modelo promedio de un convertidor
tipo Boost de corriente continua
Consideremos la funcion de transferencia (3.17) del modelo promedio del convertidor tipo
Boost (1.30):
GU (s) = 0 Z1 (U )

b
Z1 (U )
+ 02 (1

s
s2 + 1 s

U )2

(6.9)

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


APROXIMA
6.2. DISENO

0.5

Eje Imaginario

-0.5

-1

-1.5

-2
-2

-1.5

-1

-0.5

0
Eje Real

0.5

1.5

Figure 6.4: Grafico de Nyquist de la funcion de transferencia del modelo promedio de un convertidor de corriente continua tipo Boost
donde
= U : Z1 (U ) =

b
b1
: Z2 (U ) =
2
0 (1 U )
U)

02 (1

En la figura 6.4 se presenta el gr


afico de Nyquist de la funcion de transferencia (6.9), tomando
en cuenta los siguientes valores numericos tpicos de los parametros:
0 = 1.5811 103 ; 1 = 1.6667 103 : b = 106.066; U = 0.8

(6.10)

La forma particular del grafico es indicativa de que podemos aplicar el metodo de Ziegler-Nichols
presentado anteriormente, basado en la respuesta frecuencial, para el dise
no de un controlador PI
o PID. En este caso particular realizaremos el dise
no de un controlador PI.
Calculemos la funcion de transferencia para s = j . Obtenemos, a partir de (6.9), la siguiente
expresion que nos permitira determinar la parte imaginaria y la parte real de G( j ):
b
Z1 (U )
( j )2 + 1 j + 02 (1 U )2
(02 (1 U )2 2 ) Z1b(U ) 2 1
0 Z1 (U )
(02 (1 U )2 2 )2 + (1 )2
1b
(02 (1 U )2 2 ) + Z
1 (U )
j 0 Z1 (U ) 2
(0 (1 U )2 2 )2 + (1 )2

GU (s) = 0 Z1 (U )
=

En consecuencia,
Imag GU ( j ) = 0 Z1 (U )

1 b
Z1 (U )
(1 )2

(02 (1 U )2 2 ) +
(02 (1 U )2 2 )2 +

(6.11)

DE COMPENSADORES CLASICOS

APROX
120CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
= 0 Z1 (U )

202 (1 U )2 2
(02 (1 U )2 2 )2 + (1 )2

(6.12)

Se puede observar en el grafico 6.4 que la parte imaginaria (6.12) del grafico de Nyquist se hace
cero en = 0, = , los cuales son valores que no podemos emplear. Entonces, la frecuencia de
cruce con el eje imaginario que nos interesa sera:

(U ) = 20 (1 U )
(6.13)
El valor del modulo de la funcion de transferencia GU ( j ) para el valor de frecuencia angular
(U ) esta dado por
|GU ( j (U ))| =

b
0
Z1 (U ) =
1
0 (1 U )

de donde el periodo u
ltimo P0 (U ) y la ganancia u
ltima K0 (U ) resultan ser en este caso:

2
2
0 (1 U )2
=
; K0 (U ) =
P0 (U ) =
(U )
0 (1 U )
b

(6.14)

(6.15)

De acuerdo a los valores de la tabla 6.2, las ganancias del controlador PI para el sistema
linealizado estan dadas por:
K1 (U ) = 0.45

2 (1 U )3
0 (1 U )2
: K2 (U ) = 0.54 0
b
2b

(6.16)

La representacion del controlador PI en el espacio de estado se obtiene, de acuerdo a la expresion


(6.5), en la forma
2

(1 U )
= 0.54 0
e
2b
0 (1 U )2
= + 0.45
e
b

(6.17)

donde e = y .
En este caso particular, debido a que la se
nal control u cumple la relacion 0 u 1, el esquema
final de control involucra la delimitacion de la se
nal de entrada u, constituida por la adicion del
controlador lineal u resultante del compensador PI y el valor del control en equilibrio ue = U .
Esta delimitacion se lleva a cabo mediante un saturador , el cual impide que la se
nal de entrada
u, representada por la relacion de trabajo, tome valores inferiores a 0 o superiores a 1. Por esta
razon, aparece un limitador con estas caractexisticas en el diagrama de bloques presentado en la
figura 6.5.

6.3

Sntesis de Compensadores basados en el M


etodo
del Controlador-Observador Cl
asico

Un analisis del esquema de compensacion lineal basado en el uso de realimentacion del vector
de estado a traves de observadores, nos conduce a convencernos de que es posible utilizar

6.3. COMPENSADORES BASADOS EN EL METODO


DEL CONTROLADOR-OBSERVADOR CLASIC

U
0

+
-

COMPENSADOR
tipo PI

X (U)
2

x2

+ +

CONVERTIDOR
BOOST

y+

x2

LIMITADOR

Figure 6.5: Esquema de regulacion promedio basado en un controlador PI para un convertidor


tipo Boost
un esquema equivalente en terminos de funciones de transferencia, es decir, sin necesidad
de recurrir a la representacion de estado y sus conceptos asociados de controlabilidad y
observabilidad. A tal esquema de regulacion se le conoce con el nombre de esquema del
controlador-observador cl
asico.
Supongamos que hemos resuelto el problema de realimentacion de estado mediante el
uso de un observador dinamico en un sistema linealizado alrededor de un cierto punto de
equilibrio. Las ecuaciones del controlador y del observador seran, en tal caso, las siguientes:
u = e = v (s) K(U )
x
x = A(U )
x + B(U )u + L(U )[y y ]
y = C(U )
x
donde v (s) representa la transformada de una se
nal de referencia conocida. La funcion
de transferencia entre la salida del compensador, representada por la se
nal realimentada
incremental K(U )
x (s), y la entrada al compensador, representada por la salida incremental
de la planta, y (s), esta definida por la siguiente relacion, obtenida directamente de las
ecuaciones anteriores:
K(U )
x = K(U )[sI A(U ) + L(U )C(U )]1 L(U )y (s)
K(U )[sI A(U ) + L(U )C(U )]1 B(U )u (s)
= Hy (U, s)y (s) Hu (U, s)u (s)
La expresion del controlador representado en la forma de funciones de transferencia es,
entonces, la siguiente:
u (s) = v (s) K(U )
x (s) = v (s) Hy (U, s)y (s) Hu (U, s)u (s)

(6.18)

Resolviendo para la transformada de la entrada incremental a la planta, o error incremental,


tenemos:
u (s) = [1 + Hu (U, s)]1 [v (s) Hy (U, s)y (s)]

DE COMPENSADORES CLASICOS

APROX
122CHAPTER 6. DISENO
MEDIANTE LINEALIZACION

v (s)

u (s)

GU (s)=

y (s)
-1

C(sI-A) B

Hu (U,s)

+
Hy (U,s)
Figure 6.6: Interpretacion del diseno en variables de estado

v (s)

+
-

u (s)

GU (s)=

y (s)
-1

C(sI-A) B

+
Hu (U,s)
Hy (Y,s)

Figure 6.7: Representacion del esquema controlador-observador clasico


La figura 6.6 muestra una interpretacion en diagrama de bloques de la ecuacion (6.18), con
respecto a la entrada incremental. A menudo utilizaremos una parametrizacion en terminos
de la salida en equilibrio para el bloque compensador que recibe la influencia directa de
la salida incremental. Esta parametrizacion se muestra en la figura 6.7. Como se observa
en este diagrama, la notacion usada anteriormente permanece inalterada a excepcion de la
dependencia explcita del valor nominal Y de la salida.
Este u
ltimo esquema se corresponde, dentro de ciertas limitaciones, a un esquema clasico,
bien conocido, de disposicion de los bloques de compensacion en sistemas lineales. Sin
embargo, a diferencia del esquema clasico, existen ciertas limitaciones en la estructura de
estos bloques. Usando las expresiones obtenidas a partir de la transformada de la entrada
del control incremental en terminos de s misma y de la salida incremental, podemos ver, en
primer lugar, que los denominadores en ambas funciones de transferencia deben ser identicos.
En segundo lugar, es sabido que la manipulacion de bloques de funciones de transferencia
puede crear eliminaciones o simplificaciones de ciertos factores, los cuales pueden aparecer

6.3. COMPENSADORES BASADOS EN EL METODO


DEL CONTROLADOR-OBSERVADOR CLASIC
tanto en los numeradores como en los denominadores de las funciones de transferencia resultantes. Estas simplificaciones pueden pasar inadvertidas y dejar en los dise
nos resultantes
modos escondidos que, de ser inestables, causaran un esquema de control invalido. No
abundaremos, por ahora, en las especificidades de estos detalles que, aunque importantes,
apareceran en su debido momento durante los desarrollos que presentaremos a continuacion.
Supongamos que la familia de funciones de transferencia de la planta linealizada y de
los bloques de compensacion, parametrizada respecto al punto de equilibrio (X, U, Y ), esta
dada explcitamente por:
GU (s) =

NG (U, s)
;
DG (U, s)

Hy (Y, s) =

Ny (Y, s)
;
C(s)

Hu =

Nu (U, s)
C(s)

Los numeradores de estas funciones de transferencia son polinomios de grado n 1 como


maximo. A
un cuando podemos suponer que los denominadores de las funciones de transferencia de los bloques compensadores sean de grado n, es facil ver que podemos suponer,
sin perdida de generalidad, que C(s) es un polinomio de orden n 1, en virtud de que
siempre podemos reducir el orden del observador de estado en una unidad (ya que la salida
siempre puede considerarse como un estado observable del sistema). Recordemos tambien
que, en general, hemos buscado dise
nos de observadores cuyas dinamicas del error fuesen
asintoticamente estables e independientes del punto de operacion (es decir, los autovalores
de la matriz del sistema autonomo que describen la dinamica del error incremental deben
exhibir parte real negativa y, ademas, ser independientes del punto de equilibrio). Impondremos, por tanto, la independencia, con respecto a U , de los coeficientes del polinomio C(s),
as como la adscripcion de sus raices al semiplano izquierdo del plano complejo. Adicionalmente, supondremos que no existe simplificacion posible entre los factores que conforman el
numerador y el denominador de la funcion de transferencia de la planta linealizada. Es decir,
que los polinomios NG (U, s) y DG (U, s) deben ser coprimos. Esta suposicion es equivalente
a imponer, simultaneamente, las condiciones de controlabilidad y observabilidad en la planta
linealizada. Esta u
ltima exigencia, como sabemos, no es restrictiva en grado alguno.
La funcion de transferencia del sistema en lazo cerrado esta dada por:
y (s)
GU (s)
= FU (s) =
v (s)
1 + Hu (U, s) + Hy (Y, s)GU (s)
C(s)NG (U, s)
=
C(s)DG (U, s) + NU (U, s)DG (U, s) + Ny (Y, s)NG (U, s)
Daremos un argumento plausible que establece la posibilidad de escoger Nu (U, s) y
Ny (Y, s) de tal forma que el denominador de la funcion de transferencia del sistema en
lazo cerrado verifique la siguiente identidad:
C(s)DG (U, s) + NU (U, s)DG (U, s) + Ny (Y, s)NG (U, s) C(s)D(U, s)
donde D(U, s) representa el polinomio caracterstico deseado del sistema en lazo cerrado.
De esta forma la familia de funciones de transferencia que describen el sistema controlado

DE COMPENSADORES CLASICOS

APROX
124CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
estada dada por:
y (s)
NG (U, s)
= FU (s) =
v (s)
D(U, s)
El dise
no de los bloques compensadores se lleva a cabo entonces a partir de la ecuacion
que relaciona los numeradores de sus funciones de transferencia con los polinomios conocidos
y con los polinomios que determinan la dinamica asignada al sistema en lazo cerrado y al
observador subyacente. Observamos que la igualdad polinomial involucra la identificacion
termino a termino de los coeficientes de dos polinomios de grado 2n 1 que arrojan un
total de 2n ecuaciones y tenemos como incognitas, precisamente, los 2n coeficientes de los
numeradores de las funciones de transferencia de los bloques compensadores, es decir, los
coeficientes de Ny (Y, s) y Nu (U, s). Se puede demostrar que si los polinomios NG (U, s) y
DG (U, s) son coprimos existe, entonces, solucion para tal sistema de ecuaciones y, ademas,
tal solucion es u
nica.
A continuacion ilustraremos el uso de este metodo de dise
no de control lineal en un
ejemplo sencillo, proveniente de una linealizacion.

Ejemplo 6.3: manipulador rob


otico de una sola uni
on rgida
Considerese el modelo del manipulador robotico de una sola union rgida (1.48) cuyo punto de
equilibrio parametrizado respecto a u = U esta dado por (1.50).
La linealizacion de este sistema alrededor del punto de equilibrio resulta:
"

x 1
x 2

"

NcJ
h

y =

q0

"

1 0

U2
c2

x1
x2

#"

B
J

x1
x2

"

1
j

u
(6.19)

La funcion de transferencia de este sistema linealizado se obtiene de inmediato como:


GU (s) =

y (s)
NG (U, s)
=
=
u (s)
DG (U, s)
s2 +

1/J
B
Js

c
NJ

U2
c2

(6.20)

Proponemos para este sistema el esquema de compensacion lineal basado en el esquema clasico
del controlador-observador descrito en esta seccion:
Definimos los siguientes bloques compensadores:
Hu (U, s) =
Hy (Y, s) =

Nu (U, s)
nu1 (U )
=
+ nu2 (U )
C(s)
s+
Ny (Y, s)
ny1 (Y )
=
+ ny2 (Y )
C(s)
s+

6.3. COMPENSADORES BASADOS EN EL METODO


DEL CONTROLADOR-OBSERVADOR CLASIC
Como funcion de transferencia en lazo cerrado deseamos obtener:

FU (s) =

1/J
NG (U, s)
= 2
D(s)
s + 2n s + n2

La ecuacion fundamental sobre la que basamos el dise


no lineal se escribe en este caso como:

(s + )(s2 + 2n s + n2 ) (s + ) s2 +

B
c
s+
J
NJ

U2
c2

B
c
= (nu2 (U )s + [nu2 (U ) + nu1 (U )]) s2 + s +
J
NJ

U2
1 2
c

1
+ (ny2 (U )s + [ny2 (Y ) + ny1 (Y )])
J
Se igualan los coeficientes de las potencias iguales de s, de los polinomios que se encuentran
a ambos lados de la identidad.
Obtenemos los siguientes valores para las incognitas, los cuales determinan los coeficientes
de los numeradores de las funciones de transferencia de los bloques compensadores:
B
J

nu2 (U ) = 0; nu1 (U ) = nu1 = 2n

B
ny2 (U ) = J n2 +
J

ny2 (Y ) = J n2 +

B
J

B
2n
J

B
J

NJ

U2
1 2 ;
c

c
Y
cos
NJ
N

u2
B
1 2 + J
;
c
J

B c
ny1 (U ) = 2n
J
N
ny1 (Y ) = 2n

B
J

2n

c
Y
cos
N
N

+ J

B
J

El compensador clasico lineal esta dado, entonces, por:


Hu (U, s) =

2n B
J
s+

2n

B
J

Hy (Y, s) = h
J n2 +

h
B
J

c
N

cos

Y
N

2n

+ J
B
J

donde es un n
umero real positivo completamente arbitrario.

c
NJ

B
J

cos

i
Y
n

DE COMPENSADORES CLASICOS

APROX
126CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
Es u
til considerar la siguiente realizacion de espacio de estado de los bloques compensadores:
zu = zu + u

B
yu =
2n
zu
J
zy = zy + y

B
c
Y
B
yy =
2n
cos
+ J
zy
J
N
N
J


B
B
c
Y
+J n2 +
2n

cos
y
J
J
NJ
N

(6.21)

donde yu y yy representan las contribuciones de cada bloque a la conformacion de la se


nal de
entrada incremental. Las variables de estado zu y zy son los estados de los bloques compensadores.

6.4

Redes Compensadoras de Adelanto

En esta seccion plantearemos unicamente un ejemplo de un compensador por adelanto para


un sistema no lineal particular. Nuestra intencion es plantear dentro de este esquema de
dise
no algunos de los pasos necesarios que se deben seguir en general para realizar satisfactoriamente las pruebas y simulaciones del comportamiento dinamico de sistemas no lineales
regulados por medio de compensadores. Esta seccion esta orientada al uso intensivo de
c como herramienta auxiliar en el dise
Matlab
no, por su gran versatilidad y propiedades
de computo.

Ejemplo 6.4: sistema de suspensi


on magn
etica
Consideremos el sistema de suspension magnetica (1.36), ya presentado en las secciones previas.
Este sistema presenta una funcion de transferencia dada por:

x1 (s)
y (s)
=
=
GX (s) =
u (s)
u (s)
s3 +

cg
mX
g
R 2
Ls Xs
2
L

Rg
LX

donde y (t) = x1 (t) corresponde a la se


nal de salida en la representaci
on en variables de estado.
Este sistema es, evidentemente, inestable en lazo abierto. El conjunto de parametros empleado en
este ejemplo es el siguiente:
g = 9.8 [m/seg 2 ]; c = 1; m = 0.1 [kg]; R = 1 []; L = 0.01 [h]; X = 0.05 [m]
Para este conjunto de parametros los polos del sistema en lazo abierto estan ubicados en s1 = 100,
s2 = 14 y s3 = 14 (raiz inestable).
Supondremos por ahora que no sabemos que tipo de compensador sera empleado en el dise
no.
Por lo tanto, deberemos realizar un analisis del comportamiento actual del sistema. Consideremos,

6.4. REDES COMPENSADORAS DE ADELANTO

GX (s)

127

Figure 6.8: Esquema basico de compensacion


primeramente, el sistema en lazo cerrado dado por un conpensador de tipo P (proporcional) y la
planta GX (s). Este esquema se presenta en la figura 6.8. El grafico siguiente, figura 6.9, ilustra el
lugar de las races asociado a dicho esquema. Como se observa, el sistema en lazo cerrado presenta
raices inestables, independientemente del valor que pueda asumir la ganancia K. Por la forma de
este diagrama, surge de la experiencia del
nador que un posible compensador debera poseer
p dise
un cero z1 a la derecha del polo s = g/X. Este cero debe ser tal que Re (z1 ) < 0, lo cual
nos permitira atraer la ubicacion en lazo cerrado del polo inestable hacia la parte izquierda del
plano complejo ( Re (slc ) < 0). Ademas, para que el compensador sea efectivamente realizable debe
aparecer un polo p1 tal que la funcion de tranferencia asociada sea al menos propia (grado del
numerador = grado del denominador). Este polo no debe afectar sustancialmente la dinamica en
lazo cerrado generada por el cero z1 , esto es, el polo p1 debe ser ubicado satisfaciendo la restriccion
p1 < z1 (en la practica se sugiere que p1 este colocado entre 5 a 15 veces el valor de z1 ).

200

150

Eje Imaginario

100

50

-50

-100

-150

-200
-200

-150

-100

-50

0
Eje Real

50

100

150

200

Figure 6.9: Lugar de las races para el sistema de suspension magnetica


El compensador resultante esta dado por la siguiente expresion:
Gc (s) =

u (s)
s + z1
= Kc
e (s)
s + p1

(6.22)

DE COMPENSADORES CLASICOS

APROX
128CHAPTER 6. DISENO
MEDIANTE LINEALIZACION

Gc (s)

GX (s)

Figure 6.10: Esquema de compensacion por adelanto


el cual, dadas las consideraciones anteriores, corresponde a un compensador en adelanto.
El sistema en lazo cerrado resultante dado por Gc (s) en serie con GX (s), se muestra en la
figura 6.10. Para efectos de resolver nuestro problema de dise
no, fijemos valores adecuados para
los parametros del compensador en adelanto. Tomemos por ejemplo z1 = 10 y p1 = 50, los
cuales satisfacen las especificaciones planteadas. Nos queda por resolver el problema de asignar la
ganancia Kc . Para ello, obtengamos el lugar de las raices para el sistema compensado, el cual se
presenta El valor de Kc a proponer debe permitir seleccionar una ubicacion de los polos del sistema
en lazo cerrado tal que el sistema pueda comportarse en forma adecuada y, ademas, que todas las
raices tengan parte real negativa. Debido a estas restricciones, el polo ubicado sobre la recta que
une s3 = 14 y z1 = 10 no puede acercarse demasiado a z1 (por que?). Para ello, nos vamos a
c Empleando el comando rlocfind de Matlab
c sobre el lugar de las raices
valer de Matlab .
anterior, y ubicando el polo deseado de tal forma que este cerca de slc = 5, ver figura 6.12. Esto
nos da un valor aproximado de Kc = 16.5.

200

150

Eje Imaginario

100

50

-50

-100

-150

-200
-200

-150

-100

-50

0
Eje Real

50

100

150

200

Figure 6.11: Lugar de las races para el sistema compensado

6.4. REDES COMPENSADORAS DE ADELANTO

129

60

40

Eje Imaginario

20

-20

-40

-60
-50

-40

-30

-20

-10

Eje Real

Figure 6.12: Lugar de las races para el sistema compensado. El signo + indica la ubicacion
aproximada de los polos para la ganancia Kc = 16.5
Un valor de Kc inferior a 11.0680, nos da un sistema en lazo cerrado inestable, esto se puede
observar del diagrama de Nyquist de la figura 6.13.
A continuacion, comprobaremos el desempe
no de la estrategia de control propuesta. Emplearemos, para ello, simulaciones numericas del comportamiento del sistema compensado en lazo cerrado.
c (esta funcion permite una mayor precision que la
Haremos uso de la funcion ode45 de Matlab
ode23). Como recordaremos, para realizar tales simulaciones de los procesos siempre llevamos las
ecuaciones del sistema a una representaci
on en variables de estado. De aqui que la funcion de transferencia del compensador en adelanto (6.22) debe ser representada en esta forma. Una realizacion
o programaci
on de esta funcion de transferencia se puede obtener mediante los siguientes pasos:
Escriba Gc (s) en la forma de una fraccion estrictamente propia mas un termino constante:
u (s)
s + z1
z1 p1
= Kc
= Kc + Kc
e (s)
s + p1
s + p1

(6.23)

u
(s)
z1 p1
= Kc
e (s)
s + p1

(6.24)

Haciendo

se puede deducir, a partir de (6.23), la expresion para u (t):


u (t) = Kc e (t) + u
(t)

(6.25)

DE COMPENSADORES CLASICOS

APROX
130CHAPTER 6. DISENO
MEDIANTE LINEALIZACION

0.06

0.04

Imag Axis

0.02

-0.02

-0.04

-0.06
-0.1

-0.09

-0.08

-0.07

-0.06

-0.05 -0.04
Real Axis

-0.03

-0.02

-0.01

Figure 6.13: Diagrama de Nyquist del sistema compensado para Kc = 1


De (6.24) resulta la siguiente representaci
on dinamica para u (t):
u
(t) = Kc (z1 p1 )e (t) p1 u
(t)

(6.26)

En definitiva, la representacion en variables de estado del compensador en adelanto (6.22)


resulta de las ecuaciones (6.25) y (6.26) como el subsistema:
u (t) = Kc e (t) + u
(t)
u
(t) = Kc (z1 p1 )e (t) p1 u
(t)
Este subsistema tiene como entrada e , salida u y como variable de estado u
.
Las simulaciones del comportamiento en lazo cerrado del sistema no lineal de suspension
magnetica, usando el compensador dise
nado, se muestran en la figura 6.14. Los programas mgto.m
c se muestran a continuaci
y smgto.m, realizados en Matlab ,
on. Para ejecutar la simulaci
on,
recuerde:
Matlab from MathWorks, Inc.
>

smgto

%% mgto.m
%% Este programa presenta la programaci\on del sistema de control
%% en lazo cerrado para el sistema de suspension magnetica. Se
%% emplea un compensador en adelanto como estrategia de control.
function xdot = mgto(t,x)
global C M G X R L U K A B YREF

6.4. REDES COMPENSADORAS DE ADELANTO

131

Posicion de la esfera

Velocidad

0.1

0.5

x2

x1

0
0.05

-0.5

0
0

0.5

1
tiempo t

1.5

-1
0

Corriente en el magneto

0.5

1
tiempo t

1.5

Voltaje de entrada
1

0.4

0.5

x3

0.6

0.2

0
0

0.5

1
tiempo t

1.5

-0.5
0

0.5

1
tiempo t

1.5

Figure 6.14: Comportamiento dinamico del sistema de suspension magnetica en lazo cerrado
con el compensador en adelanto disenado

y = -(x(1)-X); %% salida incremental del sistema


%% --> Recuerde los principios basicos
%% de la linealizacion aproximada
eyref = YREF - y; %% error incremental
udelta = K*eyref+x(4); %% sennal de entrada incremental
u = udelta+U; %% control para el sistema no lineal
xdot = [x(2);
G - C/M*x(3)^2/x(1);
-R/L*x(3)+1/L*u;
(A-B)*K*eyref-B*x(4)];
%% fin mgto.m
%%
%%
%%
%%

smgto.m
Programa para simular el comportamiento dinamico controlado
del sistema de suspension magnetica usando
un compensador por adelanto. Utiliza el programa mgto.m

clear all
ti = 0.0; %% tiempo inicial
tf = 1.0; %% tiempo final
global C M G X R L U K A B YREF
C = 1;
M = 0.1;

DE COMPENSADORES CLASICOS

APROX
132CHAPTER 6. DISENO
MEDIANTE LINEALIZACION
G = 9.8;
X = 0.05;
R = 1;
L = 1e-2;
U = R*sqrt(M*G*X/C);
K = 16.5;
A = 10;
B = 50;
YREF = 0.0; %% sennal de referencia
%% Diferentes
%%x0 = [0.051
%%x0 = [X*1.8
%%x0 = [X*1.8
%%x0 = [0.1 0
x0 = [X*1.5 0

puntos de equilibrio que se pueden usar en las simulaciones


0 sqrt(M*G*X/C) 0];
0 sqrt(M*G*X/C) 0];
0 0.3 0];
0.3 0];
0.3 0];

[t,x] = ode45(mgto,ti,tf,x0,1e-6,1);
%%[t,x] = ode45(mgto,ti,tf,x0);
%% fin de smgto.m

6.5

Ejercicios Propuestos

Ejercicio 6.1: Compensador ProporcionalDerivativo PD


Demuestre que el caso del compensador PD es equivalente al empleo de la estrategia de asignacion de polos por realimentacion del vector de estados. Discuta su respuesta con el instructor
del curso. Ayuda: Haga un ejemplo de primer o segundo orden y desarrolle las ecuaciones. Luego,
generalice sus resultados.
(?)
Ejercicio 6.2: Matlab
Simulaci
on de la respuesta del modelo promedio del convertidor Boost controlado por medio de un compensador PI
Simule la respuesta en lazo cerrado para un modelo promedio de un convertidor tipo Boost,
cuyos parametros estan dados por (6.10), empleando el controlador PI desarrollado en este captulo.
Deseamos estabilizar el voltaje de salida normalizado promedio Z2 (U ) a un valor de equilibrio de:
X2 (0.8) = 0.3354

(6.27)
(?)

manipulador rob
otico de una sola uni
on rgida
Ejercicio 6.3: Matlab
Deduzca los pasos necesarios para obtener la expresion en variables de estado (6.21) del esquema de conpensacion propuesto en la pagina 6.3. Realice las simulaciones correspondientes para
comprobar la efectividad de la estrategia de control propuesta. Utilice el siguiente conjunto de
parametros:
B = 0.1 [N/m/seg]; J = 0.25 [kg m2 ]; c = 1 [kg m2 /seg 2 ]; N = 10; X =

15
[rad].
180

(6.28)

6.5. EJERCICIOS PROPUESTOS

133
(?)

Ejercicio 6.4: Matlab


tanque reactor continuamente agitado
Considere el tanque reactor continuamente agitado (1.60). Simule el comportamiento en lazo
abierto de este sistema ante se
nales de prueba tipo escalon unitario. Proponga especificaciones de
dise
no en el sentido de mejorar la respuesta obtenida. En el sistema real, que variable de proceso
se escoge variable de medicion?. Basados en la salida propuesta, dise
ne diversos tipos de compensadores para este sistema, los cuales permitan satisfacer las especificaciones deseadas. Compare,
por medio de simulaciones numericas, el desempe
no de los diferentes reguladores obtenidos. Discuta
los resultados con el instructor de la materia.
(??)
Ejercicio 6.5: Matlab
tanque reactor continuamente agitado
Analice el tipo y ubicacion de los sensores y actuadores en el sistema presentado anteriormente.
Emule el sistema con todos los componentes propuestos. Incluya esta informacion en los dise
nos
c para realizar las simulaciones. Ayuda: Investigue en la literatura de
realizados. Utilice Matlab
control de procesos e instrumentacion las diferentes caractersticas tecnicas de sensores y actuadores
utilizados para este tipo de procesos industriales.
(??)

Lecturas Recomendadas
Para esta parte le sugerimos consulte:
Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini, Feedback Control of Dynamic
Systems. 3ra. Edicion, Addison-Wesley, 1994.
Ogata, K. Modern Control Engineering. Prentice Hall, 1993.
Bahram S. and M. Hassul, Control System Design using Matlab. Prentice Hall, Englewood
Cliffs, New Jersey, 1995.
Una introduccion al dise
no robusto de compensadores para sistemas de control realimentado, basado en los desarrollos modernos y fundamentado en factorizaciones coprimas y el
uso de la ecuaci
on diofantina o de Bezout, se puede conseguir en:
J.C. Doyle, B.A. Francis and A.R. Tannenbaum, Feedback Control Theory. Macmillan, New
York, 1992

DE COMPENSADORES CLASICOS

APROX
134CHAPTER 6. DISENO
MEDIANTE LINEALIZACION

Part II
El M
etodo de la Linealizaci
on
Extendida

135

Chapter 7
Control de Sistemas No Lineales por
Linealizaci
on Extendida

Desde los anos 40, el uso de la tecnica de linealizacion aproximada ha permitido resolver una
gran diversidad de problemas relacionados con el control de sistemas reales. Sin embargo, esta
estrategia presenta algunas restricciones fundamentales en su aplicacion. Para resolver estos
inconvenientes, se han propuesto diferentes extensiones del metodo, estas extensiones incluyen
aspectos teoricos fundamentales relacionados con diversas areas de la matematica, tales como la
teora de operadores, el analisis funcional, el algebra y la geometra diferencial, por ejemplo.
En este captulo ilustraremos los elementos fundamentales de un metodo propuesto por W.
Rugh y sus colaboradores (Rugh, 1986; Rugh, 1987; Rugh, 1991) para el control de sistemas
dinamicos no lineales y al cual se le ha denominado Metodo de la Linealizaci
on Extendida.
El metodo de la linealizacion extendida esta basado en la familia de linealizaciones del sistema no lineal, parametrizada respecto a puntos de operacion constante. Las ganancias de
realimentacion no lineal del vector de estado se calculan de tal manera que los autovalores del
sistema linealizado en lazo cerrado se colocan en valores especficos del plano complejo y tales
que, al mismo tiempo, sean invariantes para todos los puntos de operacion constantes en lazo
cerrado en una vecindad del punto de operacion constante nominal en lazo cerrado. La tecnica
137

EXTENDIDA
138CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
se extiende facilmente al caso de diseno por realimentacion del vector de salidas a traves de
observadores y compensadores estaticos.

7.1

Introducci
on

Un enfoque de dise
no tpico en el control de sistemas no lineales es obtener la linealizacion
(jacobiana) del sistema alrededor de un punto de equilibrio, dise
nar los esquemas de control
para el sistema linealizado obtenido y someter al sistema no lineal a la estrategia lineal de
control definida. Si bien esto ha resultado provechoso en un gran n
umero de aplicaciones,
la linealizacion aproximada presenta algunos inconvenientes. Por un lado, su efectividad se
limita a una region peque
na del espacio de estados de tal forma que, a partir de condiciones
iniciales alejadas de la posicion de equilibrio, el sistema de control puede ser inestable o,
simplemente, puede fallar en estabilizar el sistema alrededor del punto de operacion deseado.
Por otro lado, existen sistemas que pueden operar bajo diferentes condiciones de funcionamiento, esto es, pueden presentar comportamientos en diferentes regiones de operacion
asociados con diferentes puntos de equilibrio. Al establecer la ley de control para un sistema linealizado no estamos considerando la posibilidad de que el punto de operacion actual
cambie su ubicacion a un punto diferente, en alg
un instante del tiempo. La estrategia de
control implantada en el sistema no lineal original debe tomar en cuenta este aspecto y esto
implica, necesariamente, lo siguiente: a) recalcular las leyes de control y obtener las ganancias K del controlador para cada sistema linealizado resultante de cada punto de equilibrio,
y b) disponer de un mecanismo de asignacion de los valores K de acuerdo al punto actual
de operacion. La estrategia mas com
unmente empleada para aplicar este procedimento es
el llamado esquema de asignacion de ganancias, E.A.S., o Gain Scheduling, en ingles. El
E.A.S. consiste en lo siguiente. Conociendo las diferentes condiciones de operacion del sistema no lineal, se obtienen las linealizaciones particulares y las leyes de control asociadas
alrededor de los puntos de equilibrio. Mediante un mecanismo ad hoc de interpolacion de las
leyes de control lineal obtenidas (la parte mas difcil de definir en esta estrategia), se ajustan
las ganancias o parametros del controlador de acuerdo a la region actual de operacion del
sistema. De esta forma, se ajustan los parametros del dise
no de acuerdo a ciertas variables
seleccionadas del sistema para obtener el dise
no linealizado adecuado cuando el sistema no
lineal opera alrededor de alguno de sus puntos de equilibrio.
Estudiaremos a continuacion un metodo de naturaleza no lineal, equivalente en cierta
medida al E.A.S., llamado Linealizaci
on Extendida. En comparacion a la estrategia de
asignacion de ganancias, esta metodologa de dise
no propone un enfoque sistematico para
el dise
no de controladores, ademas posee una formulacion analtica, una propiedad muy
interesante desde el punto de vista de ingeniera. Esta estrategia constituye una extensi
on
no lineal del metodo de la linealizacion aproximada.


EXTENDIDA
7.2. EL METODO
DE LA LINEALIZACION

7.2

139

El M
etodo de la Linealizaci
on Extendida

El metodo de la linealizaci
on extendida utiliza la linealizacion aproximada tradicional como
herramienta fundamental. El modelo utilizado para generar el dise
no del controlador es un
modelo obtenido sobre la base de los primeros terminos (de caracter lineal) de una expansion
en serie de Taylor de un sistema no lineal que opera en la vecindad de un punto de operacion
constante. En este caso, la diferencia radica en que en lugar de obtener un modelo linealizado
para un punto en particular, se procede a obtener el modelo parametrizado de caracter
lineal para un punto de operaci
on generico de naturaleza arbitraria. Esta parametrizacion
se calcula bajo la suposicion de que existe un continuum de puntos de operacion en el
espacio de entrada-estado (o en el espacio entrada-salida correspondiente) asociado a cada
valor constante del control y del estado (y de la salida, respectivamente). En su defecto, tal
parametrizacion puede asociarse a los valores de una magnitud de referencia (constante) del
sistema en lazo cerrado.
El resultado fundamental obtenido a partir de esta estrategia consiste en la obtencion
de una familia de modelos lineales parametrizados, validos en primera aproximacion, respecto a puntos de operacion deseados. Esta familia de modelos ofrece una descripcion del
comportamiento de las perturbaciones de estado-entrada (o salida-entrada) explcitamente
parametrizada en terminos de un valor constante U de la entrada o del alg
un estado de interes (o de salida). A partir de esta familia de modelos, el metodo propone inicialmente
obtener un controlador por realimentacion del vector de estado (o una combinacion de
observador-controlador o, incluso, un compensador clasico obtenido por metodos inherentes
a la descripcion por funciones de transferencia). El compensador lineal obtenido, entonces,
se encuentra tambien parametrizado por el punto de operacion y estabiliza, en principio, a
cualquier representante de la familia de modelos lineales obtenidos en la etapa inicial del
dise
no.
A continuacion del dise
no lineal se presenta la parte mas importante de este metodo: la
obtencion del controlador no lineal. La idea crucial del metodo es la no linealizacion (ver
seccion ??) y esta basada en proponer un controlador de car
acter no-lineal cuya linealizaci
on
alrededor del punto de operaci
on coincide con el controlador lineal dise
nado para la familia
de modelos lineales parametrizados por el punto de operacion. Naturalmente, en este u
ltimo
paso del proceso de dise
no, se pueden obtener, en general, infinitas soluciones al problema
de inversion planteado.
La ventaja fundamental del metodo de la linealizacion extendida es que a la par de retener
el significado fsico de las variables linealizadas, debido a que no estamos acudiendo a transformaciones de coordenadas de estado o del espacio de los controles que puedan destruir el
significado fsico de tales variables originales, ademas se logra una programacion automatica
de las ganancias del compensador, tanto a nivel del observador como del controlador; un
hecho que, como hemos mencionado, esta intimamente ligado al E.A.S. .
Es preciso apuntar dos aspectos importantes. Primeramente, el metodo de la linealizacion extendida abre las posibilidades de utilizar metodos clasicos de dise
no para los compensadores mediante tecnicas tradicionales de entrada-salida (al menos en el caso de una

EXTENDIDA
140CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
sola entrada y una sola salida). El caso de controladores PID constituye el ejemplo clasico
y fundamentalmente interesante dentro de las posibilidades del metodo. Por otro lado, para
sistemas de dimension considerable, el metodo de la linealizacion extendida plantea la utilizacion de herramientas computacionales de calculo simbolico tales como los representados
por los paquetes REDUCE, MACSYMA o MAPLE.

7.3

Dise
no de Controladores no Lineales por Asignaci
on
de Polos Invariantes en Familias de Modelos Parametrizados por un Punto de Operaci
on Constante
Arbitrario

Supondremos que el sistema no lineal a ser controlado se puede describir mediante un conjunto de ecuaciones diferenciales analticas a parametros constantes. Considere el sistema:
x = f (x, u)

(7.1)

donde f (, ) : IRn IR 7 IR es una funci


on analtica, es decir, desarrollable en serie de
Taylor alrededor de un punto de equilibrio.
Sea u = U un punto de operacion constante y sea X(U ) el vector de estado correspondiente a este punto de operacion, entonces:
) = f (X(U ), U ) = 0
X(U

(7.2)

Si la ley de realimentacion del control se escribe como u = -k(x), el sistema en lazo


cerrado satisface
x(t)

= f (x(t), k(x(t))

(7.3)

Debido a que este sistema ha de tener el mismo punto de operacion constante del sistema
(7.1), debe cumplirse que:
f (X(U ), k(X(U )) = 0

(7.4)

k(X(U )) = U

(7.5)

es decir,

y, ademas, la solucion de X(U ) obtenida a partir de (7.4) coincidira con la solucion resultante
de la ecuacion (7.2).
En virtud del teorema de la funcion implcita, si existe la solucion x(U ) del sistema de
ecuaciones (7.4), la misma es u
nica s y solamente s la matriz jacobiana de (7.4), respecto

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
de X(U ), es invertible en el punto de operacion. Por lo tanto, esta condicion esta dada por
la invertibilidad de

f (x, k(x))
f (x, u)
f (x, u)
k(x)

x
x X(U ),U
u X(U ),U
x X(U ),U

(7.6)

esto se interpreta como el hecho de que la linealizacion del sistema en lazo cerrado, alrededor
de su punto de equilibrio, no debe tener autovalores en el origen.
Es suficiente, entonces, que la linealizacion del sistema en lazo cerrado tenga sus autovalores en el semiplano izquierdo. La ley de control del sistema linealizado

k(x)
x
u =

x X(U ),U

(7.7)

debe ser capaz de colocar los autovalores del sistema linealizado

f (x, u)
f (x, u)
x =

x +
u
x X(U ),U
u X(U ),U

(7.8)

donde x = x(t) X(U ) y u = u(t) U en el semiplano izquierdo. Como es nuestra


costumbre, designaremos las siguientes matrices jacobianas mediante A(U ), B(U ) y K(U ):

A(U ) =

f (x, u)
f (x, u)

; B(U ) =
;
x X(U ),U
u X(U ),U

K(U ) =

k(x)

x X(U ),U

(7.9)

En tanto el sistema linealizado presente autovalores independientes del punto de operacion (X(U ), U ), la calidad de la respuesta controlada en la vecindad del punto de
equilibrio que se desea mantener, es, por as decirlo, invariante. Esta propiedad es u
til pues
de alguna manera homogeneiza las propiedades cualitativas del dise
no en forma independiente al punto de equilibrio considerado. El objetivo seraahora demostrar que existe una
funcion analtica k(x) tal que los autovalores de la matriz [A(U ) B(U )K(U )] pueden ser
pre-especificados de tal manera que sean independientes del punto de operacion U . Dichos
autovalores, sin embargo, no pueden ser cero, por la razones que acabamos de proponer, y
deben ocurrir en pares complejos conjugados si su parte imaginaria es no nula.
Para proceder supondremos que el par (A(U ), B(U )) es controlable. Entonces, (A(), B())
tambien es controlable en cualquier vecindad peque
na de U en la recta real (esto es consecuencia de que las entradas aij y bij de A(U ) y B(U ), respectivamente, son continuas
respecto de la variable U ). A partir del par (A(U ), B(U )) y de la dinamica deseada del
sistema lineal en lazo cerrado, la ganancia de realimentacion lineal K(U ) se puede calcular

EXTENDIDA
142CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
utilizando, por ejemplo, la formula de Bass-Gura1 (Kailath, 1980) o mediante la formula de
Ackermann (Franklin et al., 1994).
Veamos el siguiente teorema de existencia de la funcion u = k(x), base del metodo de
la linealizacion extendida:
Teorema 7.1 Supongase que el sistema analtico dx/dt = f (x, u) es tal que (A(U ), B(U ))
es un par controlable, entonces existe una ganancia o funcion de realimentaci
on no lineal
k() : IRn IR, tal que los autovalores del sistema lineal en lazo cerrado, i.e., los autovalores
de la matriz [A(U ) B(U )K(U )], tienen valores pre-especificados cualesquiera los cuales son
localmente invariantes con respecto a U .
Prueba: La prueba se divide, esencialmente, en dos pasos. Primero demostraremos que
dX(U )/dU 6= 0. Esta cualidad sera u
til en el segundo paso de la prueba, para poder
establecer una funcion k() definida de tal forma que la linealizacion de u = k(x) resulta
en u = K(U )x .
Notese que se puede suponer que A(U ) = f /x|U,X(U ) es invertible, pues, si no lo es,
podemos hacer todos los autovalores de
"

f
f
f (x, u)
=
+
x
x
u
1

Esta formula esta dada por la siguiente expresion:


K(U ) = ( a(U ))[R1 (U )]T C 1 (U )

donde = [n n1 . . . 1 ] es el vector formado por los coeficientes del polinomio caracterstico deseado
del sistema en lazo cerrado:
pd (s) = sn + n sn1 + . . . + 1 ,
y a(U ) = [an (U ) an1 (U ) ldots a1 (U )] es el vector formado con los coeficientes del polinomio caracterstico
de la matriz A(U ), es decir,
p(s) = det(sI A(U )) = sn + an (U )sn1 + . . . + a1 (U ) ,
R(U ) es una matriz triangular de Toepliz, dada por

1
a1 (U )

R(U ) =
..

0
1
..
.

...
...
..
.

0
0
..
.

an1 (U ) an2 (U ) . . .

y
C(U ) = [B(U ) A(U )B(U ) ... A(n1) (U )B(U )]
es la matriz de controlabilidad del par (A(U ), B(U )).
El polinomio caracterstico deseado se selecciona de tal manera que presente coeficientes constantes e
independientes de U .

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
distintos de cero mediante realimentacion previa del vector de estado y por lo tanto la matriz
A(U ) sera invertible.
Considerese
f (X(U ), U ) = 0
entonces:

(7.10)

X(U )
f
d
f

=0
f (X(U ), U ) =
dU
x X(U ),U U U
u X(U ),U

(7.11)

y por lo tanto:

dX(U )

dU

f
=
x

X(U ),U

6= 0
u X(U ),U

(7.12)

Por conveniencia, supondremos que la primera componente X1 del vector X satisface


dX1 /dU 6= 0 . Entonces, en virtud del teorema de la funcion inversa X11 (x1 ) = U .
Con el fin de hallar la ganancia no lineal que satisface:

= K(U ) = [K1 (U ), . . . , Kn (U )]
x X(U )

(7.13)

k(X(U )) = U

(7.14)

se puede verificar facilmente que esta se obtiene a partir de:


k(x) =
+

Z X 1 (x1 )
1

K()

dX()
d
d

n
X

Kj [X11 (x1 )](xj Xj (X11 (x1 )) X11 (x1 )

(7.15)

j=2

donde el subndice j indica la j-esima componente.


En efecto, diferenciando k(x) con respecto a xi , i = 2, 3, . . . , n, y evaluando en X(U ) se
tiene:
k
(X(U )) = Ki (X11 (x1 (U ))) = Ki (U ); i = 1, . . . , n
xi

(7.16)

Procediendo en forma similar con respecto a x1 obtenemos primeramente por derivacion


directa de la expresion (7.15):

n
X
k
dXj ()
=
Kj ()
x1
d
j=1

dX11 (x1 )
dx1

X11 (x1 )
n
X
dXj (X11 (x1 )) dX11 (x1 )
Kj (X11 (x1 ))
dx1
dX11 (x1 )
j=2

dX11 (x1 )
dx1

EXTENDIDA
144CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
Evaluando la expresion anterior en el punto X11 (x1 ) se tiene.

n
X
k
dXj (X11 (x1 )) dX11 (x1 )
1

=
K
(X
(x
))
j
1
1
x1 X 1 (x1 )
dx1
dX11 (x1 )
j=1
1

n
X
j=2

=
=

Kj (X11 (x1 ))

dXj (X11 (x1 )) dX11 (x1 ) dX11 (x1 )

dx1
dx1
dX11 (x1 )

dX1 (X11 (x1 )) dX11 (x1 )


1
K1 (X1 (x1 ))
dx1
dX11 (x1 )
1
dX1 (x1 )
K1 (X11 (x1 ))
dx1

dX11 (x1 )

dx1

y particularizando luego la expresion as obtenida respecto al punto de operacion U =


X11 (x1 ) se tiene:
k
(X(U )) = K1 (U )
x1
Finalmente, se puede constatar facilmente que la expresion (7.15), satisface la condicion de
contorno impuesta en (7.14). Con lo cual terminamos la demostracion.
Como hemos mencionado, este teorema solo demuestra la existencia, esto es, la expresion
resultante para el termino k(x) no es u
nica; la solucion que hemos obtenido es especfica
eel procedimiento utilizado en la demostracion del teorema anterior. Esto no significa que
el metodo tenga esta caracterstica como parte de un inconveniente, muy por el contrario,
la inmensa posibilidad de soluciones diferentes a este problema nos puede hacer comedidos
respecto a la solucion particular que adoptemos finalmente. En muchos de los ejemplos
que siguen a continuacion, hemos adoptado como solucion particular de la ley de control
realimentada, obtenida por linealizacion extendida, aquella que produce un efecto linealizante
sobre el sistema en lazo cerrado. En nuestros ejemplos nos concentraremos en resolver las
ecuaciones (7.14) y (7.13) de alguna forma plausible e insturmentalmente sencilla pues la
formula general (7.15) puede conducir a expresiones muy complicadas.

Ejemplo 7.1: Control de posici


on angular de un sat
elite mono-axial.
Consideremos el problema de orientaci
on de un satelite monoaxial, ver (1.14), cuyo angulo de
orientacion se mide respecto de un eje oblicuo utilizando el parametro de Cayley-Rodrigues. El
modelo de este sistema esta dado por:
x 1 = 0.5(1 + x21 )x2
1
x 2 =
u
J

(7.17)

donde x2 es la velocidad angular respecto del eje principal, u es el torque aplicado y x1 es el angulo
de orientacion medido respecto de un eje oblicuo, no coincidente con el eje principal.

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
El punto de equilibrio del sistema esta dado por:
u = U = 0; x2 = 0; x1 = X

(7.18)

y por lo tanto, solo es posible parametrizar con respecto a la orientaci


on angular X de equilibrio.
Linealizando el sistema alrededor del punto de equilibrio tenemos:
"

x 1
x 2

"

0 0.5(1 + X 2 )
0
0

#"

x1
x2

"

1
J

(7.19)

Si usamos una ley de control lineal:


u = K1 (X)x1 K2 (X)x2

(7.20)

cuyas ganancias dependen del valor constatnte X del punto de equilibrio, el sistema en lazo cerrado
esta dado por:
"

x 1
x 2

"

K1J(x)

0.5(1 + X 2 )
K2J(x)

#"

x1
x2

(7.21)

El polinomio caracterstico del sistema linealizado se obtiene inmediatamente de (7.21) como:


p(s) = s2 +

K2 (X)
0.5(1 + X 2 )K1 (X)
s+
J
J

(7.22)

Si deseamos imponer al sistema controlado un comportamiento independiente del punto de operacion buscamos ganancias K1 (X), K2 (X) que hagan al polinomio caracterstico independiente de
X. En efecto, sea pd (s) un polinomio caracterstico deseable e independiente del punto de operacion:
P d(s) = (s + a1 )(s + a2 ) = s2 + (al + a2 )s + a1 a2

(7.23)

donde a1 y a2 son raices en el semiplano izquierdo del plano complejo que se suponen dan al
sistema linealizado un comportamiento deseable.
Haciendo entonces:
K2 (X) = K2 = J(a1 + a2 )
Ja1 a2
K1 (X) =
1 + X2

(7.24)

obtenemos un sistema en lazo cerrado cuyo comportamiento es independiente del punto de operacion
X. La ley de control linealizada y parametrizada en terminos de X es entonces:
u =

Ja1 a2
x1 J(a1 + a2 )x2
1 + X2

(7.25)

El metodo de la linealizacion extendida se basa en contestar acertadamente la siguiente pregunta


Cual sera el controlador no lineal u = k(x) tal que al linealizarlo alrededor del punto de equilibrio

EXTENDIDA
146CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
resulta en el controlador obtenido por dise
no lineal aproximado?. Este controlador ha de ser tal
que estabilice el sistema en el punto de equilibrio dado por (7.18).
Previamente a cualquier particularizacion de las variables de estado, la funcion de control debe
satisfacer el siguiente par de ecuaciones en derivadas parciales, ver (7.13):

k
Ja1 a2
k
=
;
= J(a1 + a2 )

2
x1 x1 =X;x2 =0 1 + X
x2 x1 =X;x2 =0

(7.26)

con la condicion de contorno (7.14)


k(X, 0) = 0

(7.27)

De la segunda ecuacion en (7.26) se deriva que:


k(x) =

Z x2
0

J(a1 + a2 )d + (x1 ) = J(a1 + a2 )x2 + (x1 )

(7.28)

donde (x1 ) es una funcion arbitraria de x1 que debemos determinar. Usando la expresion obtenida
en la primera ecuacion en derivadas parciales, se tiene:
d
Ja1 a2
(x1 ) =
dx1
1 + X2

(7.29)

de donde inmediatamente surge como solucion general:


(x1 ) =

Z x1
Ja1 a2
X

1 + 2

d = Ja1 a2 [tan1 (x1 ) tan1 (X)]

(7.30)

El controlador as obtenido satisface con la condicion de contorno (7.13) impuesta por el punto
de equilibrio U del control u:
u = J(a1 + a2 )x2 Ja1 a2 [tan1 (x1 ) tan1 (X)]

(7.31)

Hemos obtenido, por tanto, un controlador no lineal que responde al esquema mostrado en la
figura 7.1.
Este controlador estabiliza al sistema alrededor del punto de equilibrio (X, U ) y sirve para
cualquier cambio brusco del punto de equilibrio deseado X, sin necesidad de reprogramar las
ganancias.
c el comportamiento del sistema controlado en
A continuacion vamos a simular en Matlab
lazo cerrado. Los siguientes programas permiten obtener las graficas correspondientes al comportamiento de los estados x y de la se
nal de control u, mostrados en la figura 7.2.
%
%
%
%
%
%
%
%
%

ejext1.m
Primer ejemplo de simulacion numerica usando el metodo
de linealizacion extendida:
El sistema representa un satelite mono-axial descrito por el
parametro de orientacion de Cayley-Rodrigues.
La ley de control realimentada es no lineal,
obtenida mediante el metodo de linealizacion extendida.

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO

- tan1 ()

- j
+

- Ja1 a2

x1
u
x = 0.5(1 + x21 )x2
- ?
j- 1

6-

- J(a1 + a2 )

tan1 ()

x 2 =

x2

1
u
J

Figure 7.1: Esquema de control no lineal obtenido para el satelite mono-axial

posicion angular de orientacion

velocidad angular respecto al eje principal


0.2

1.5

x2

x1

1
0.1

0.5

0
0

10

20

30

t [seg]

0
0

10

20

30

t [seg]

torque externo - ley de control


30

20
10
0
-10
0

10

20

30

t [seg]

Figure 7.2: Comportamiento del satelite mono-axial controlado mediante realimentacion del
vector de estados basada en linealizacion extendida

EXTENDIDA
148CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
%
%
%
%
%
%
%
%

El programa requerido para realizar las simulaciones


y obtener las graficas es:
sejext1.m
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/08/97

function xdot = ejext1(t,x)


% parametros del sistema
J=90;al=0.5;a2=0.5; X=1.5;
% ley de control
u = -J*al*a2*(atan(x(1)) - atan(X) ) - J(al+a2)*x(2) ;
% modelo no lineal (satelite mono-axial)
xdot = [0.5*(1+x(1)*x(1))*x(2) ;
1/J*u];
% fin ejext1.m

Programa para obtener las graficas de la figura 7.2:


%
%
%
%
%
%
%
%
%
%
%
%
%

sejext1.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext1.m
El sistema es controlado mediante una realimentacion no lineal de estado
obtenida por linealizacion extendida.

% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0];
% simulacion numerica
[t,x] = ode23(ejext1,t0,tf,x0);
save dejext1 t x u
% procedimiento para obtener la ley de control en forma vectorial
% parametros
J=90;a1=0.5;a2=0.5; X=1.5;
for i = 1:length(x),
u(1,i) = -J*a1*a2*(atan(x(i,1)) - atan(X) ) - J(a1+a2)*x(i,2) ;
end
clg
subplot(221), plot(t,x(:,1))
title(posicion angular de orientacion)
ylabel(x1)
xlabel(t [seg])
subplot(222), plot(t,x(:,2))
title(velocidad angular respecto al eje principal)

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
posicion angular de orientacion

velocidad angular respecto al eje principal


0.2
x2 (u sat -, u sin sat --)

x1 (u sat -, u sin sat --)

1.5

0.5

0
0

10

20

30

t [seg]

0.1

0
0

10

20

30

t [seg]

torque externo - ley de control


u (u sat -, u sin sat --)

30
20
10
0
-10
0

10

20

30

t [seg]

Figure 7.3: Comportamiento del satelite mono-axial controlado por linealizacion extendida, limitando la senal de control mediante Umax -; sin limitar --ylabel(x2)
xlabel(t [seg])
subplot(223), plot(t,u)
title(torque externo - ley de control)
ylabel(u)
xlabel(t [seg])
% sejext1.m

De la simulacion presentada en la figura 7.2 se puede observar que el torque necesario para
realizar el control del sistema debe ser significativo (del orden de 20 Nm). En la practica los
torques externos empleados son mucho menores, digamos de unos 5 Nm. La simulaci
on de la
figura 7.3 muestra el comportamiento del mismo sistema pero sujeto a una saturacion en amplitud
del control externo a aplicarse. El valor maximo del torque en la simulaci
on se ha escogido,
precisamente, de Umax = 5 Nm. El efecto de tal limitacion o saturacion resulta en una disminuci
on
de la velocidad angular maxima alcanzada por el artefacto y una respuesta relativamente mas lenta
(en la figura 7.3, por razones de comparacion, se han sobrepuesto los resultados de la simulaci
on
del sistema controlado sin saturar el torque externo, los cuales estan representados mediante una
lnea a trazos ---). Las modificaciones hechas a los programas anteriores se muestran a continuaci
on
(ejext1b.m y sejext1b.m).
% ejext1b.m
%

EXTENDIDA
150CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
%
%
%
%
%
%
%
%
%
%
%
%

Modificacion al programa ejext1.m


Ley de control realimentada usando una saturacion del
valor maximo y minimo posibles.
El programa requerido para realizar las simulaciones
y obtener las graficas es:
sejext1b.m
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/08/97

function xdot = ejext1b(t,x)


% parametros del sistema
J=90;al=0.5;a2=0.5; X=1.5;
% valor de saturacion del control
umax=5;
% ley de control
uu = -J*al*a2*(atan(x(1)) - atan(X) ) - J(al+a2)*x(2) ;
if abs(uu) > umax,
u = umax;
else
u = uu;
end
% modelo no lineal (satelite mono-axial)
xdot = [0.5*(1+x(1)*x(1))*x(2) ;
1/J*u];
% fin ejext1b.m
%
%
%
%
%
%
%
%
%
%
%
%
%
%

sejext1b.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext1b.m
El sistema es controlado mediante una realimentacion no lineal de estado
obtenida por linealizacion extendida, usando una saturacion del
valor maximo del control

% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0];
% simulacion numerica
[t,x] = ode23(ejext1b,t0,tf,x0);
% procedimiento para obtener la ley de control en forma vectorial
% parametros
J=90;a1=0.5;a2=0.5; X=1.5; umax=5;

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO

- tan1 ()

- j- Ja1 a2
+
6- J(a1 + a2 )

ulim
u
- ?
j-

tan1 ()

x1

Umax

-Umax

x 1 = 0.5(1 + x21 )x2


x 2 =

1
u
J

x2

Figure 7.4: Esquema de control no lineal obtenido para el satelite mono-axial con ley de control
limitada por el valor Umax
for i = 1:length(x),
uu(1,i) = -J*a1*a2*(atan(x(i,1)) - atan(X) ) - J(a1+a2)*x(i,2) ;
% saturacion
if abs(uu(1,i)) > umax,
u(1,i) = umax;
else
u(1,i) = uu(1,i);
end
end
save dejext1b t x u
clg
subplot(221), plot(t,x(:,1))
title(posicion angular de orientacion)
ylabel(x1 (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,x(:,1),--)
load dejext1b
subplot(222), plot(t,x(:,2))
title(velocidad angular respecto al eje principal)
ylabel(x2 (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,x(:,2),--)
load dejext1b
subplot(223), plot(t,u)
title(torque externo - ley de control)
ylabel(u (u sat -, u sin sat --))
xlabel(t [seg])
hold on
load dejext1
plot(t,u,--)
% sejext1b.m

El diagrama de bloques correspondiente a este sistema de control realimentado, con una ley de
control limitada a un valor maximo, se presenta en la figura 7.4.

EXTENDIDA
152CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION

Ejemplo 7.2: balance del p


endulo invertido sobre un m
ovil
Considerese el problema de balancear un pendulo invertido montado sobre un movil. El sistema
estudiado esta dado por la expresion (1.46) la cual repetiremos aqu:
x 1 = x2
g sen (x1 ) 0.5a mLx22 sen (2x1 ) a cos(x1 )u
x 2 =
4L/3 amL cos2 (x1 )
cuyos puntos de equilibrio estan dados por (ver (1.47)):
"

tan1 ( aU
g )
0

X(U ) =

(7.32)

La linealizacion del sistema alrededor de cualquiera de estos puntos de equilibrio resulta


"

x =

0
1
h(U ) 0

"

x +

0
)g
aah(U
2 U 2 +g 2

(7.33)

donde:
p

h(U ) =

4L
3

a2 U 2 + g 2

amLg 2
(a2 U 2 +g 2 )

(7.34)

Utilizando la formula de Bass-Gura obtenemos el siguiente controlador lineal:

k
a2 U 2 + g 2
[e1 e2 + h(U ) (e1 + e2 )]
=
K(U
)
=

x X(U )
abg

(7.35)

donde e1 y e2 son los autovalores deseados del sistema en lazo cerrado.


Puesto que : U = X11 (x1 ) = ag tan(x1 ) podemos, entonces, evaluar expltamente a k(x) mediante la expresion:
k(x) =

Z X 1 (x1 )
1
0

K(U )

n
X
dX(U )
dU +
Kj [X11 (x1 )](xj xj (X11 (x1 ))
dU
j=2

(7.36)

es decir,
u = k(x1 , x2 ) =
+

g
4Le1 e2
tan(x1 )
log[sec(x1 ) + tan(x1 )] + e1 e2 mL sen (x1 )
a
3a

(e1 + e2 )
4L
x2
sec(x1 ) amL cos(x1 )
a
3

(7.37)

Ejemplo 7.3: Control de manipulador rob


otico de una sola uni
on rgida

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
Considerese el modelo de un manipulador robotico de una sola union, ver (1.48),
x 1 = x2

B
c
x1
1
x 2 = x2 sen
+ u
J
J
N
J
La linealizacion del sistema alrededor del punto de equilibrio (1.50) resulta:
"

x 1
x 2

"

NcJ

q0

#"

U2
c2

B
J

x1
x2

"

0
1
J

(7.38)

El controlador lineal estabilizante por realimentaci


on del vector de estado, cuyas ganancias
tambien se encuentran parametrizadas en terminos de U , esta dado por:
u = K1 (U )x1 K2 (U )x2

(7.39)

El sistema en lazo cerrado presenta, entonces, la siguiente expresion:


"

x 1
x 2

"

NcJ

#"

U2
c2

1
1
J1 K1 (U ) B
J J K2 (U )

x1
x2

(7.40)

El polinomio caracterstico del sistema esta dado por

P (s) = s2 +

B K2 (U )
1 c
+
s+
J
J
J N

U2
c2

+ K1 (U )

(7.41)

Igualamos los coeficientes de este polinomio a los de un polinomio deseado de la forma:


P (s) = s2 + 2n s + n2
Obtenemos

(7.42)

c
U2
K1 (U ) = Jn2
1 2
N
c
K2 (U ) = 2Jn B

(7.43)

y, por ende,

c
u = Jn2
N

U2
1 2 x1 (2Jn B)x2
c

(7.44)

Como ya hemos visto, una vez obtenido el controlador lineal que estabiliza a toda la familia
de modelos lineales parametrizados por el punto de equilibrio, debemos proceder a buscar un
controlador no lineal, de la forma u = k(x), cuya linealizacion coincida con (7.44). Tal controlador
debe satisfacer las siguientes expresiones:

k(x)
x1 [X(U ),0],U

c
= Jn2
N

k(x)
x2 [X(U ),0],U

= 2Jn B

U2
c2
(7.45)

EXTENDIDA
154CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
con la condicion de contorno:
k(X(U ), 0) = U

(7.46)

De la segunda igualdad de (7.45) tenemos, en virtud de la independencia con respecto al punto


de equilibrio,
k(x) = (2Jn B)x2 + (x1 )

(7.47)

donde (x
on arbitraria de x1 . Consideremos primeramente la expresion U =
1 ) es una funci
x1
c sen N .
Procedemos a determinar la funcion (x1 ), utilizando la primera de las relaciones de (7.45), de
tal forma que se obtiene:
s

d
c
x1
(x1 ) = Jn2
1 sen 2
dx1
N
N

c
x1
= Jn2
cos
N
N

(7.48)

y, por lo tanto, resulta

(x1 ) = Jn2 x1 c sen

x1
N

+K

(7.49)

es una constante arbitraria la cual debemos determinar en base a la condicion de contorno


donde K
(7.46). La expresion

u = k(x) = Jn2 x1 + c sen

x1
N

(2Jn B)x2
K

(7.50)

debe satisfacer (7.46) a la luz de (1.50). De tal condicion se obtiene:

= J 2 N sen 1 U
K
n
c

(7.51)

As, el controlador no lineal obtenido por linealizacion extendida esta dado por:

u = k(x) =

Jn2

x1 N sen

U
c

+ c sen

x1
N

(2Jn B)x2

(7.52)

la cual, al ser substituida en el sistema no lineal original (1.48), arroja la siguiente expresion,
perfectamente lineal, para el sistema en lazo cerrado:
x 1 = x2
x 2 =

n2

x1 N sen

U
c

2n x2

(7.53)

El punto de equilibrio del sistema en lazo cerrado es, evidentemente, el punto de equilibrio
deseado, parametrizado por el control constante U . El sistema anterior se reescribe, en terminos
de X, como:
x 1 = x2
x 2 = n2 (x1 X) 2n x2

(7.54)

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
Compararemos, mediante simulaciones numericas, el comportamiento del sistema en lazo cerrado tanto para el controlador no lineal dado por (7.52), como el obtenido a partir del controlador
lineal basado en (7.44), el cual tiene la siguiente forma:

= c sen

c
u = U Jn2
N
X
N

U2
1 2 (x1 X) (2Jn B)x2
c

Jn2

c
X

cos
N
N

(x1 X) (2Jn B)x2

(7.55)

Tomaremos X = 0 y N = 1. Los siguientes programas, ejext2.m y sejext2.m, permiten


simular el comportamiento del sistema no lineal controlado por el regulador no lineal (7.52).
Modelo:
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%

ejext2.m
Ejemplo de simulacion numerica usando el metodo
de linealizacion extendida:
El sistema representa un brazo manipulador robotico controlado
mediante una ley de realimentacion no lineal,
obtenida mediante el metodo de linealizacion extendida.
El programa requerido para realizar las simulaciones
y obtener las graficas es:
sejext2.m
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/08/97

function xdot = ejext2(t,x)


% parametros del sistema
X = 0; N = 1;
B=1e-2; J=4e-2; c=.58;
xi=0.707; wn=8.56;
% ley de control no lineal
u = -J*wn*wn*(x(1) - X) +c*sin(x(1)/N)+....
(B-2*J*xi*wn)*(x(2)-0);
% modelo no lineal (satelite mono-axial)
xdot = [x(2) ;
-B/J*x(2)-(c/J)*sin(x(1)/N)+(1/J)*u];
% fin ejext2.m

Para obtener las graficas:


%
%
%
%
%
%
%
%
%
%

sejext2.m
Programa de simulacion de la respuesta controlada
de un brazo manopulador robotico mono-axial.
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext2.m

EXTENDIDA
156CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
% El sistema es controlado por realimentacion no lineal de estado
% obtenida mediante linealizacion extendida.
% tiempo de simulacion
t0=0;
tf=1;
% condiciones iniciales
x0=[0.1 0];
% simulacion numerica
[t,x] = ode23(ejext2,t0,tf,x0);
% parametros
X = 0; N = 1;
B=1e-2; J=4e-2; c=.58;
xi=0.707; wn=8.56;
% expresion vectorial de la ley de control no lineal u
u = -J*wn*wn*(x(:,1)-X)+c*sin(x(:,1)/N)+(B-2*J*xi*wn)*(x(:,2)-0);
clg
subplot(221), plot(t,x(:,1))
title(posicion angular del brazo)
ylabel(x1)
xlabel(t [seg])
subplot(222), plot(t,x(:,2))
title(velocidad angular del brazo)
ylabel(x2)
xlabel(t [seg])
subplot(223), plot(t,u)
title(torque externo aplicado)
ylabel(u)
xlabel(t [seg])
% sejext2.m

Una respuesta tpica de este sistema se muestra en la figura 7.5. La grafica de la figura 7.6
muestra las respuestas controladas de la posicion angular desde distintas condiciones iniciales que
van a groso modo desde -0.5 rad a 0.5 rad. El controlador no lineal tiene exito completo en
estabilizar la posicion angular del brazo manipulador robotico alrededor de la posicion vertical,
dada por X = 0, desde las diferentes posiciones iniciales.
Sustituyendo adecuadamente la ley de control no lineal en los programas sejext2.m y
sejext2.m podemos simular el comportamiento del brazo en lazo cerrado con la ley de control
obtenida por linealizacion extendida (7.55). Solo basta comentar la ley de control no lineal y, a
continuacion, agregar las siguientes lneas a los programas anteriores.
En ejext2.m:
% ley de control no lineal
%u = -J*wn*wn*(x(1) - X) +c*sin(x(1)/N)+....
%(B-2*J*xi*wn)*(x(2)-0);
% ley de control lineal
u = c*sin(X/N)-(J*wn*wn-c/N*cos(X/N))*(x(1)-X)+....
(B-2*J*xi*wn)*(x(2)-0);

En sejext2.m:
% expresion vectorial de la ley de control no lineal u

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO

posicion angular del brazo

velocidad angular del brazo

0.1

0.1
0

0.05
x2

x1

-0.1
-0.2

-0.3
-0.05
0

0.5
t [seg]

-0.4
0

0.5
t [seg]

torque externo aplicado


0.1

0
-0.1
-0.2
-0.3
0

0.5
t [seg]

Figure 7.5: Comportamiento del brazo manipulador robotico controlado por linealizacion extendida

EXTENDIDA
158CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION

Posicin angular del brazo


0.4
0.3
0.2

x1 [rad]

0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0

0.1

0.2

0.3

0.4

0.5
t [seg]

0.6

0.7

0.8

0.9

Figure 7.6: Posicion angular del brazo manipulador robotico controlado por linealizacion extendida para diferentes condiciones iniciales

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
Posicin angular del brazo
0.4
0.3
0.2

x1 [rad]

0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
0

0.1

0.2

0.3

0.4

0.5
t [seg]

0.6

0.7

0.8

0.9

Figure 7.7: Posicion angular del brazo manipulador robotico para diferentes condiciones iniciales
usando una ley de control lineal
%u = -J*wn*wn*(x(:,1)-X)+c*sin(x(:,1)/N)+(B-2*J*xi*wn)*(x(:,2)-0);
% expresion vectorial de la ley de control lineal u
u = c*sin(X/N)-(J*wn*wn-c/N*cos(X/N))*(x(:,1)-X)+....
(B-2*J*xi*wn)*(x(:,2)-0);

Las respuestas del sistema controlado por el regulador lineal (7.55), para diferentes condiciones
iniciales, se muestran en la figura 7.7.
En este ejemplo tanto el controlador no lineal como el lineal tienen exito en estabilizar el sistema
alrededor de la posicion vertical desde posiciones significativamente lejanas de tal valor deseado de
equilibrio.

Ejemplo 7.4: conductores acoplados magn


eticamente
Considere el modelo de un sistema de dos conductores acoplados magneticamente (1.32), presentado en el captulo 1:
x 1 = x2
x 2 = k(x1 L0 ) +

2iL
u
a x1

EXTENDIDA
160CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
cuyo punto de equilibrio en terminos de la distancia nominal b esta dado por, ver (1.33):
k(b L0 )(a b)
; X1 (b) = b; X2 (b) = 0
2iL

u = U (b) =

Linealizando el sistema alrededor de este punto de equilibrio se tiene:


"

x 1
x 2

"

2iL
U (b)
(ab)2

1
0

#"

x1
x2

"

2iL
ab

donde:
x1 = x1 b; x2 = x2 ; u = u U (b)
Este modelo se puede escribir tambien como:
"

x 1
x 2

"

0
k a2b+L
ab

1
0

#"

x1
x2

"

0
2iL
ab

La controlabilidad del sistema linealizado se establece inmediatamente a partir de la evaluaci


on
de la matriz de controlabilidad C:
"

C=

0
2iL
ab

2iL
ab

= det C =

2iL
ab

6= 0

Proponiendo un controlador lineal de la forma u = K1 (b)x1 K2 (b)x2 , el sistema en lazo


cerrado resulta:
"

x 1
x 2

"

0i

0
k a2b+L
ab

1
2iL
2iL
ab k1 (b) ab k2 (b)

#"

x1
x2

El polinomio caracterstico de este sistema en lazo cerrado esta dado por:

p(s) = s2 + K2 (b)

2iL
a 2b + L0
2iL
s+ k
+ K1 (b)
ab
ab
ab

Si deseamos un comportamiento independiente del punto de equilibrio buscamos ganancias


K1 (b) y K2 (b) tales que el polinomio caracterstico tenga races o coeficientes independientes de
b. En efecto, sean a1 y a2 dos raices convenientes del plano complejo, debe cumplirse para el
sistema en lazo cerrado que:

a 2b + L0
2iL
2iL
s+ k
+ K1 (b)
ab
ab
ab
2
= s + (a1 + a2 )s + a1 a2

p(s) = s2 + K2 (b)

es decir:

K1 (b) =
K2 (b) =

ab
a 2b + L0
a1 a2 k
2iL
ab
a1 + a2
(a b)
2iL

DE CONTROLADORES NO LINEALES POR ASIGNACION


DE POLOS INVARIANTES1
7.3. DISENO
con lo que u queda perfectamente definida:

ab
a 2b + L0
a1 + a2
u =
a1 a2 k
x1
(a b)x2
2iL
ab
2iL
Debemos encontrar un controlador no lineal u = k(x) tal que, al linealizarlo alrededor del
punto de equilibrio, resulte precisamente en el controlador lineal que acabamos de dise
nar:


=
x1 [x1 =b,x2 =0]


=
x2 [x1 =b,x2 =0]

ab
a 2b + L0
a1 a2 k
2iL
ab
a1 + a2
(a b)
2iL

(7.56)

Ademas, el valor del control suministrado por este controlador no lineal, en condiciones de equilibrio,
debe satisfacer la siguiente condicion de contorno:
k(b L0 ) +

2iL
((b, 0)) = 0
ab

y, por lo tanto,
(b, 0) =

k(b L0 )(a b)
= U (b)
2iL

Deshaciendo la substitucion x1 = b en los segundos miembros de (7.56), obtenemos las siguientes


ecuaciones en derivadas parciales:

x1

x2

=
=

a x1
a 2x1 + L0
a1 a2 k
2iL
a x1
a1 + a2
(a x1 )
2iL

Integrando la primera ecuacion, tenemos:


Z

(x1 , x2 ) =
=

x1
a1 a2 x1
k
k(a b)(b L0 )
(a 1 )d1
[(a + L0 ) 21 ]d1
+ (x2 )
2iL b
2iL b
2iL
a1 a2
k
k
k(a b)(b L0 )
[(a x1 )2 (a b)2 ]
(a + L0 )(x1 b) +
(x21 b2 )
+ (x2 )
4iL
2iL
2iL
2iL

donde (x2 ) es una funcion arbitraria de x2 que procedemos a determinar gracias a la primera
ecuacion diferencial parcial de (7.56):
d
a1 + a2
(x2 ) =
(a x1 )
dx2
2iL
Integrando:
(x2 ) =

a1 + a2
(a x1 )x2 + M
2iL

EXTENDIDA
162CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION
donde M es una constante arbitraria que determinamos a partir de la condicion de contorno para
(x1 , x2 ). Luego de algunas simplificaciones, el controlador u resulta en la siguiente expresion:
(x1 , x2 ) =

a x1
[a1 a2 (x1 b) + k(x1 L0 ) (a1 + a2 )x2 ]
2iL

El sistema controlado por esta ley de realimentaci


on no lineal resulta, evidentemente, en el
siguiente sistema lineal asintoticamente estable al punto de equilibrio requerido:
x 1 = x2
x 2 = a1 a2 (x1 b) (a1 + a2 )x2
La convergencia al punto de equilibrio del sistema en lazo cerrado se encuentra gobernada por
autovalores que son independientes del valor particular de b.

7.4

Ejercicios Propuestos

Ejercicio 7.1: Matlab


sat
elite mono-axial
Como ejercicio, el lector puede comparar mediante simulaciones numericas el funcionamiento
del controlador obtenido por linealizacion extendida (7.31) con el que se obtiene por linealizacion
aproximada, en el cual, evidentemente, se requiere de cierta programaci
on de la ganancia para cada
valor del punto de equilibrio X que se desee obtener para la posicion angular. El controlador lineal,
ver (7.25), esta dado por:
u =

J(a1 a2 )
x1 J(a1 + a2 )x2
1 + X2

con x1 = x1 X; x2 = x2 ; u = u.

(?)

Ejercicio 7.2: Matlab


p
endulo invertido sobre una plataforma m
ovil
Si se toma como punto de operacion u = U = 0 , x1 (0) = x2 (0) = 0, para el modelo del
pendulo invertido estudiado en este captulo, se puede comparar el funcionamiento del controlador
no lineal (7.37) con la ley de control que se obtiene mediante linealizacion tradicional alrededor de
este punto de equilibrio:
u = k(x1 , x2 ) =

(3amL 4L)(e1 + e2 )
3amLe1 e2 4Le1 e2 3g
x1
x2
3a
3a

(7.57)

la cual s
olo coincide hasta un primer orden de aproximaci
on con el controlador no lineal propuesto
por la linealizaci
on extendida.
Demostrar, mediante simulaciones computacionales, que las respuestas de ambos controladores
son significativamente diferentes para angulos relativamente grandes en la posicion inicial x1 (0) del
pendulo. De hecho, para valores iniciales que satisfagan la condicion x1 (0) > 0.8, el controlador
lineal no puede estabilizar el pendulo invertido mientras que el no lineal s lo hace. Se deja esta
verificacion como ejercicio de simulaci
on. Los parametros del sistema se muestran en la tabla 7.1.
(?)

7.4. EJERCICIOS PROPUESTOS

Variable
m
M
2L
g
a = (m + M )1

163

Descripci
on
masa del pendulo
masa del carro
Longitud del pendulo
aceleracion de gravedad
constante auxiliar

Valor
2.0 Kgs
8.0 Kgs
1.0 m
9.8 m.s2
0.1

Table 7.1: Parametros del sistema de balance de un pendulo invertido

EXTENDIDA
164CHAPTER 7. CONTROL DE SISTEMAS NO LINEALES POR LINEALIZACION

Chapter 8
Observadores Din
amicos de Estado en
el Dise
no de Controles No Lineales
basados en Linealizaci
on Extendida

El metodo de la linealizacion extendida permitio desarrollar una estrategia de construccion de


observadores no lineales en forma simple y altamente sistematica, siendo este uno de los metodos
mas reconocidos y utilizados en el campo del control no lineal.

8.1

Introducci
on

Como vimos en el captulo anterior, la metodologa de linealizacion extendida es simple


y permite resolver el dise
no de controladores no lineales sistematicamente. Debido a su
sencillez, la filosofa de linealizacion extendida puede emplearse en el dise
no de observadores
dinamicos de estado; la idea fundamental en este caso consistira en escoger un observador
no lineal de tal manera que la familia de ecuaciones linealizadas del error de estimacion,
165


EXTE
166CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
parameterizadas por el punto de operacion, tenga autovalores invariantes con respecto a
dicho punto de operacion, al menos localmente.
Considerese el sistema:
x = f (x(t), u(t))
y(t) = h(x(t))
cuyo punto de operacion constante esta dado por:
u(t) = U ; x(t) = X(U ); y(t) = h(X(U )) = Y (U )
Supondremos que la relacion funcional que se establece, en equilibrio, entre la entrada y
la salida, es tal que satisface:
dY (U )
6= 0
dU
Es decir, existe una familia continua de puntos de equilibrio en el espacio de salida que
se relaciona con el valor del control en equilibrio, cuando menos localmente.
Supondremos ademas que el sistema linealizado alrededor del punto de equilibrio dado
por:
x (t) = A(U )x (t) + B(U )u (t)
y (t) = C(U )x (t)
es tal que el par (C(U ), A(U )) es completamente observable (o en su defecto detectable).
Supondremos ademas que la matriz A(U ) es invertible alrededor del valor U .
Proponemos un observador no lineal de la forma:
x = f (
x(t), u(t)) + g(y(t)) g(
y (t))
y(t) = h(
x(t))
El punto de equilibrio de este observador para u(t) = U se obtiene de las ecuaciones:
f (
x(U ), U ) + g(Y (U )) g(Y (U )) = 0
Con el objeto de hacer compatible las funciones del observador con el valor asignado en
equilibrio al estado verdadero del sistema, supondremos que:
)) = Y (U ) = h(X(U )); X(U ) = X(U
)
Y (U ) = h(X(U
lo cual implica, en particular que la funcion g de ganancia no lineal del observador satisface
igualmente:
g(Y (U )) = g(Y (U ))


8.1. INTRODUCCION

167

La ecuacion del error de estimacion estara dada por:


d
(x(t) x(t)) = f (x(t), u(t)) f (
x(t), u(t)) g(y(t)) + g(
y (t))
dt
Esta ecuacion hereda, obviamente, los puntos de operacion constantes de la familia y un
calculo sencillo demuestra que la familia de ecuaciones linealizadas del error dinamico esta
dado por:
d
(x(t) x(t)) = f (x(t), u(t)) f (
x(t), u(t)) g(y(t)) + g(
y (t)) =
dt

f
d
f

x
[x (t) x (t)] =
dt
x X(U ),U
x X(U
),U

g
h
g
h
x +
x

y Y (U ) x X(U )
y Y (U ) x X(U
)

f
f
h
(x x

)
(x x )
x X(U ),U
y Y (U ) x X(U )

= [A(U ) G(U )C(U )](x x )


es decir:
d
e (t) = [A(U ) G(U )C(U )]e (t)
dt
donde:

f
g
h
A(U ) =

;
G(U
)
=
;
C(U
)
=
x X(U ),U
y Y (U )
x X(U )
A continuacion, nuestro objetivo sera el de escoger la ganancia linealizada G(U ) de tal
forma que los autovalores de [A(U ) G(U )C(U )] se encuentren en el semiplano izquierdo
del plano complejo y que ademas sean independientes del valor de U ( si esto u
ltimo no
es enteramente posible, entonces, al menos, asegurarnos que la forma como varian tales
autovalores con respecto a U responda a una funcion previamente conocida o impuesta). Tal
escogencia de la ganancia linealizada G(U ) puede hacerse utilizando la formula de Bass-Gura
para el par de matrices traspuestas:(AT (U ), C T (U )). Es decir:
G(U ) = O1 (U )R1 (U )[d U ]T
donde :

C(U )
1
0
... 0

C(U )A(U )

1...
0

a1 (U )
; R(U ) =
...
O(U ) =
..
..
..

. 0

.
.
n2
(U )
C(U )A

an1 (U ) an2 (U ) . . . 1
C(U )An1 (U )
d = [1 . . . n ]; U = [a1 (U ) . . . an (U )]


EXTE
168CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
siendo d el vector fila compuesto por los coeficientes del polinomio caracterstico deseado
para la dinamica del error linealizado de estimacion y u el vector fila conformado por los
coeficientes del polinomio caracterstico de la matriz A(U ).
Puesto que dY (U )/dU 6= 0, el teorema de la funcion implcita asegura que de la igualdad
Y (U ) = y podemos obtener como solucion u
nica para U al valor dado por: U = Y 1 (y). El
valor de la ganancia linealizada debe provenir entonces de una ganancia no lineal g que debe
satisfacer:

g
G(U ) =

y y=Y (U )
Deshaciendo la substitucion indicada en la formula anterior obtenemos:
g
= G(Y 1 (y))
y
de donde, integrando respecto a y, obtenemos
g(y) =
=

Z y

G(Y 1 (y))dy + G(Y )

Y
Z Y 1 (y)
U

G(U )

dY (U )
dU + G(Y (U ))
dU

como una posible solucion alternativa a la ganacia no lineal del observador.


Notese que tomando derivadas respecto de y en esta u
ltima expresion y particularizando
el resultado en el punto de equilibrio tenemos:

dg(y)
dY (Y 1 (y)) d(Y 1 (y))

= G(Y 1 (y))

dy Y (U )
dU
dy
Y (U )
= G(U )

dy dU
= G(U )
dU dy

Con este valor de g(y) el observador no lineal queda completamente especificado.

8.2

Ejemplos de aplicaci
on

Ejemplo 8.1: sat


elite mono-axial Cayley-Rodrguez
Considerese el sistema:
x 1 = 0.5(1 + x21 )x2
1
x 2 =
u
J
y = x1


8.2. EJEMPLOS DE APLICACION

169

con punto de equilibrio:


u = U = 0; x1 = X; x2 = 0; Y = X
El sistema linealizado alrededor del punto de equilibrio esta dado por:
"

x 1
x 2

"

0 0.5(1 + X 2 )
0
0

#"

x1
x2

"

1
J

y = x1

Un observador dinamico lineal del vector de estado incremental esta dado por:
"

x
1
x
2

"

0 0.5(1 + X 2 )
0
0

#"

x
1
x
2

"

1
J

"

u +

G1 (X)
G2 (X)

(y y )

y = x
1
donde G1 (X) y G2 (X) son ganancias dependendientes del punto de equilibrio deseado X, las cuales
se calculan de tal manera que el sistema lineal autonomo que gobierna el error de estimacion tenga
sus autovalores en el semiplano izquierdo.
En primer lugar, verificamos si el sistema linealizado es observable.
"

1
0
0 0.5(1 + X 2 )

O(X) =

= det O(X) = 0.5(1 + X 2 ) 6= 0

La dinamica del error de estimacion esta regida por:


"

e 1
e 2

"

G1 (X) 0.5(1 + X 2 )
G2 (X)
0

#"

e1
e2

Los modos que rigen esta dinamica se corresponden con las races del polinomio caracterstico
siguiente:
p(s) = s2 + G1 (X)s + 0.5(1 + X 2 )G2 (X)
Si deseamos que el error de estimacion linealizado responda de acuerdo a autovalores que asignamos libremente en el semiplano izquierdo del plano complejo, podemos igualar, termino a termino,
el polinomio anterior al siguiente polinomio caracterstico estandar de segundo grado:
pd (s) = s2 + 2n s + n2
Se obtiene, entonces,
G1 (X) = 2n ; G2 (X) =

2n2
1 + X2

El observador lineal del estado incremental esta dado por:


"

x
1
x
2

"

0 0.5(1 + X 2 )
0
0

y = x
1

#"

x
1
x
2

"

0
1
J

"

u +

2n
2
2n
1+X 2

(y y )


EXTE
170CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
La pregunta clave del metodo de la linealizacion extendida sera la siguiente: Cual ha de ser el
observador no lineal cuya linealizacion alrededor del punto de equilibrio coincida con el observador
que acabamos de obtener?. Es decir, quienes deben ser las ganancias no lineales g1 (y) y g2 (y)
tales que el observador no lineal dado por:
x
1 = 0.5(1 + x
21 )
x2 + g1 (y) g1 (
y)
2 = 1 u + g2 (y) g2 (
y)
X
J
y = x
1
tenga por linealizacion el observador anteriormente dise
nado?. Es claro que los valores de equilibrio
del observador no lineal estan dados por:
x
2 (X) = x2 (X) = 0; x
1 (X) = x1 (X) = X; u = u(X) = 0
De tal forma que debe cumplirse entonces que:

g1
g2
2n2
=
2
;
=
n
y X
y X
1 + X2

(8.1)

Deshaciendo la substitucion indicada en la ecuacion anterior, obtenemos el siguiente par de


ecuaciones en derivadas parciales para las ganancias no lineales:
g2
2n2
g1
= 2n ;
=
y
y
1 + y2
Integrando las ecuaciones anteriores resulta:
g1 (y) = 2n y; g2 (y) = 2n2 tan1 (y)
El observador dinamico no lineal esta dado entonces por:
x
1 = 0.5(1 + x
21 )
x2 + 2n (y y)

1
x
2 =
u + 2n2 tan1 (y) tan1 (
y)
J
y = x
1
El observador no lineal responde al diagrama mostrado en la figura 8.1.
Recordemos que en la seccion anterior habamos dise
nado una ley de control realimentada no
lineal que estabilizaba al sistema al punto de equilibrio deseado. Esta ley de control no lineal era
la siguiente:
h

u = J(a1 + a2 )x2 Ja1 a2 tan1 (x1 ) tan1 (X)

Con el objeto de completar el ejemplo utilizaremos el controlador propuesto en combinaci


on con
el observador dise
nado y simularemos su comportamiento en lazo cerrado. El controlador completo,
a base del observador dinamico no lineal esta dado por:
h

u = J(a1 + a2 )
x2 Ja1 a2 tan1 (
x1 ) tan1 (X)


8.2. EJEMPLOS DE APLICACION

x 1 = 0.5(1 + x21 )x2

- x 2 = 1 u
J

171

2 =
u- x

y = x1

x
1

y = x1 x
2
- 1 = 0.5(1 + x1 )x2 + 2n (y y)
1
u
J

2 (tan1 (y) tan1 (


+ 2n
y ))

x
2

y = x
1

Figure 8.1: Diagrama de bloques del observador dinamico de estados para el satelite mono-axial,
basado en linealizacion extendida

x 1 = 0.5(1 + x21 )x2

- x 2 = 1 u
J
y = x1

d 1-

y = x1 x
2
- 1 = 0.5(1 + x1 )x2 + 2n (y y)
2 =
u- x

1
u
J

2 (tan1 (y) tan1 (


+ 2n
y ))

x
2

d-

y = x
1

u = J(a1 + a2 )
x2 Ja1 a2 tan1 (
x1 ) tan1 (X)




Figure 8.2: Diagrama de bloques en lazo cerrado del sistema de control de un satelite, considerando un observador dinamico no lineal
con
x
1 = 0.5(1 + x
21 )
x2 + 2n (y y)

1
u + 2n2 tan1 (y) tan1 (
y)
x
2 =
J
y = x
1
El sistema en lazo cerrado se muestra en la figura 8.2.
Los programas siguientes permiten simular el comportamiento en lazo cerrado del sistema controlado por la ley de control no lineal sintetizada sobre la base de la operacion de un observador
dinamico no lineal. La respuesta del sistema dinamico se muestra en la figura 8.3.
Modelo:
%
%
%
%
%
%
%
%

ejext3.m
Ejemplo de simulacion numerica usando el metodo
de linealizacion extendida para el disen~o de un
observador no lineal:
El sistema representa un satelite mono-axial descrito por el
parametro de orientacion de Cayley-Rodrigues.


EXTE
172CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
%
%
%
%
%
%
%
%
%
%
%
%

La ley de control realimentada es no lineal,


obtenida mediante el metodo de linealizacion extendida.
La ley de control se sintetiza usando un observador
no lineal.
El programa requerido para realizar las simulaciones
y obtener las graficas es:
sejext3.m
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 17/08/97

function xdot = ejext3(t,x)


% parametros del sistema
J=90;al=0.5;a2=0.5; X=1.5;
xi=0.7; wn=0.8;
% ley de control
u = -J*al*a2*(atan(x(3))-atan(X))-J(al+a2)*x(4);
% modelo no lineal (satelite mono-axial)
xdot = [0.5*(1+x(1)*x(1))*x(2) ;
1/J*u;
0.5*(1+x(3)*x(3))*x(4)+2*xi*wn*(x(1)-x(3));
1/J*u+2*wn*wn*(atan(x(1))-atan(x(3)))];
% fin ejext3.m

Generaci
on de gr
aficas:
%
%
%
%
%
%
%
%
%
%
%
%
%
%

sejext3.m
Programa de simulacion de la respuesta controlada
de un satelite mono-axial (modelo no lineal obtenido
usando la representacion Cayley-Rodrigues).
Este programa permite simular la respuesta del sistema no lineal
presentado en el programa
ejext3.m
El sistema es controlado mediante una realimentacion no lineal de estado
sintetizada mediante un observador no lineal
dise~nado mediante linealizacion extendida.

% tiempo de simulacion
t0=0;
tf=30;
% condiciones iniciales
x0=[0 0 0.5 0.2];
% simulacion numerica
[t,x] = ode23(ejext3,t0,tf,x0);
% parametros
J=90;a1=0.4;a2=0.5; X=1.5;
xi=0.7; wn=0.8;
% ley de control
u = -J*a1*a2*(atan(x(:,3))-atan(X))-J(a1+a2)*x(:,4);


8.2. EJEMPLOS DE APLICACION

173

posicion angular de orientacion

velocidad angular respecto al eje principal


0.4

1.5

0.3

1
x2

x1

0.2
0.5

0.1
0
-0.5
0

0
10

20

30

t [seg]

-0.1
0

10

20

30

t [seg]

torque externo - ley de control


20

10
0
-10
-20
0

10

20

30

t [seg]

Figure 8.3: Comportamiento de un satelite mono-axial controlado sobre la base de un observador


dinamico de estados obtenido por linealizacion extendida
clg
subplot(221), plot(t,x(:,1),t,x(:,3),--)
title(posicion angular de orientacion)
ylabel(x1)
xlabel(t [seg])
subplot(222), plot(t,x(:,2),t,x(:,4),--)
title(velocidad angular respecto al eje principal)
ylabel(x2)
xlabel(t [seg])
subplot(223), plot(t,u)
title(torque externo - ley de control)
ylabel(u)
xlabel(t [seg])
% sejext3.m

Ejemplo 8.2: manipulador rob


otico
Considerese el manipulador robotico tratado anteriormente, cuyo modelo esta dado por:
x 1 = x2

B
c
x1
1
x 2 = x2 sin
+ u
J
J
n
J


EXTE
174CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
y = x1
El punto de equilibrio se caracteriza genericamente mediante:

u = c sin

X
n

; x1 = X; x2 = 0

(8.2)

La linealizacion de este sistema alrededor del punto de equilibrio resulto ser:


"

x 1
x 2

"

c
nJ

y = x1

0
1
cos(X) B
J

#"

x1
x2

"

1
J

Un observador dinamico para este sistema linealizado esta dado por:


"

x
1
x
2

"

#"

0
1
cos(X) B
J

c
nJ

x
1
x
2

"

"

u +

1
J

G1 (X)
G2 (X)

(y y )

y = x
1
El sistema que gobierna la dinamica del error de estimacion de las variables esta dado por:
"

e 1
e 2

"

G1 (X)
1
c
G2 (X) nJ
cos(X) B
J

#"

e1
e2

cuyo polinomio caracterstico es:

p(s) = s2 + G1 (X) +

B
c
X
s+
cos
J
nJ
n

+ G2 (X)

Si igualamos este polinomio caracterstico a un polinomio deseado de la forma:


pd (s) = (s + 1 )(s + 2 ) = s2 + (1 + 2 )s + 1 2
entonces podemos obtener los valores necesarios de las ganancias del observador dinamico. Estas
ganancias parametrizadas por el punto de equilibrio estan dadas por:

G1 (X) = 1 + 2

B
c
X
; G2 (X) = 1 2
cos
J
nJ
n

B
B2
(1 + 2 ) + 2
J
J

Debemos proponer un observador no lineal, cuya linealizacion coincida con el observador lineal
de la familia de sistemas linealizados, parametrizado por el punto de equilibrio que acabamos de
dise
nar como:
"

x
1
x
2

"

c
nJ

0
1
cos(X) B
J

#"

x
1
x
2

"

0
1
J

"

u +

1 2

c
nJ

1 +2 B
J
B
cos X

(
1 + 2 ) +
n
J

y = x
1
Tal observador no lineal estara dado, en forma general, por:
x
1 = x
2 + g1 (y) g1 (
y)

B
c
x
1
1
x
2 = x
2 sin
+ u + g2 (y) g2 (
y)
J
J
n
J
y = x
1

B2
J2

(y y )


8.2. EJEMPLOS DE APLICACION

175

La linealizacion de este observador no lineal, alrededor del punto de equilibrio del sistema
original, el cual tambien debe ser punto de equilibrio del observador, esta dado por:
"

x
1
x
2

"

c
nJ

0
1
cos(X) B
J

#"

x
1
x
2

"

u +

1
J

g1
y X
g2
y X

(y y )

y = x
1
Por lo tanto debe cumplirse las siguientes igualdades:

B g2
c
g1
X
= 1 + 2 ;
= 1 2
cos

y y=X
J y y=X
nJ
n

B
B2
(1 + 2 ) + 2
J
J

Este par de relaciones se conivierten en un par de ecuaciones en derivadas parciales al deshacer


la substitucion impuesta en los primeros miembros:

g1
B g2
c
y
= 1 + 2 ;
= 1 2
cos
y
J y
nJ
n

B
B2
(1 + 2 ) + 2
J
J

Integrando obtenemos :

B
B
B2
g1 (y) = 1 + 2
y; g2 (y) = 1 2 (1 + 2 ) + 2
J
J
J

c
y
sin
J
n

El observador dinamico no lineal resulta entonces, luego de algunas simplificaciones elementales,


en:

B
x
1 = x
2 + 1 + 2
(y y)
J

!

2
2 = B2 + 1 u + 1 2 B (1 + 2 ) + B (y y) c sin y
J
J
J
J2
J
n
y = x
1
Notese que el error de observacion, obtienido a partir de las ecuaciones diferenciales no lineales
de la planta y del observador, esta gobernado por el siguiente par de ecuaciones diferenciales
autonomas de naturaleza lineal:

e 1
e 2

B
e1 + e2
=
1 + 2
J

!
B
B2
B
=
1 2 (1 + 2 ) + 2 e1 e2
J
J
J

cuyos autovalores coinciden con las raices del siguiente polinomio caracterstico:
pcl (s) = s2 + (1 + 2 )s + 1 2 = pd (s)
El cual es identico al polinomio caracterstico que gobierna el error de estimacion del observador
del estado incremental linealizado.


EXTE
176CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Los estados del observador no lineal se utilizan en la conformacion de la ley de control no lineal
derivada en la seccion anterior. Tal ley de control rezara ahora de la manera siguiente:

u=

Jn2 (
x1

x
1
X) (2Jn B)
x2 + c sin
n

El esquema de control no lineal basado en el observador no lineal propuesto se muestra en el


siguiente diagrama de bloques.
El siguiente programa de computacion simula el sistema en lazo cerrado de acuerdo al esquema
anterior.

Ejemplo 8.3: conductor m


ovil
Consideramos ahora el ejemplo presentado en la seccion anterior de controlar, mediante el paso
de corriente, la posicion de un conductor movil dispuesto en forma paralela a otro conductor que
transporta una corriente constante. Las ecuaciones de estado del sistema son las siguientes:
x 1 = x2
x 2 = k(x1 L0 ) +
y = x1

2iL
u
a x1

El punto de equilibrio, parametrizado en terminos de una cierta distancia (nominal) deseada


de valor b, estaba dado por:
u = U (b) =

k(b L0 )(a b)
; X1 (b) = b; X2 (b) = 0; Y (b) = b
2iL

El controlador no lineal que estabiliza la posicion del conductor a su valor nominal estaba dado
por:
u = (x1 , x2 ) =

a x1
[a1 a2 (x1 b) + k(x1 L0 ) (a1 + a2 )x2 ]
2iL

Dise
naremos ahora un observador de estado no lineal que permita instrumentar la ley de control
anterior sobre la base de estimaciones del vector de estado. Es decir:
u = (
x1 , x
2 ) =

ax
1
[a1 a2 (
x1 b) + k(
x1 L0 ) (a1 + a2 )
x2 ]
2iL

La linealizacion del sistema alrededor del punto de equilibrio esta dada por:
"

x 1
x 2

"

0
k a2b+L
ab

1
0

#"

x1
x2

y = x1
La observabilidad se establece a partir de:
"

O=

1 0
0 1

; detO = 1 6= 0

"

0
2iL
ab


8.2. EJEMPLOS DE APLICACION

177

Proponemos un observador lineal de la forma siguiente:


"

x
1
x
2

"

0
k a2b+L
ab

1
0

#"

x
1
x
2

"

2iL
ab

"

u +

G1 (b)
G2 (b)

(y y )

y = x
1
El error de estimacion incremental debera satisfacer la siguiente ecuacion dinamica
"

e 1
e 2

"

Gh1 (b)
i 1
a2b+L0
G2 (b) k ab
0

#"

e1
e2

Si igualamos el polinomio caracterstico de este sistema autonomo, dado por:


a 2b + L0
ab

p(s) = s2 + G1 (b)s + G2 (b) + k

a un polinomio caracterstico deseado, cuyas raices estan en el semiplano izquierdo del plano complejo:
pd (s) = s2 + 2n s + n2
obtenemos las ganancias requeridas del observador lineal:
G1 (b) = 2n ; G2 (b) = n2 k

a 2b + L0
ab

el cual se expresa como:


"

x
1
x
2

"

0
k a2b+L
ab

1
0

#"

x
1
x
2

"

0
2iL
ab

"

u +

2n
2
0
n k a2b+L
ab

(y y )

y = x
1
Este observador lineal debe representar la linealizacion, alrededor del punto de equilibrio, del
siguiente observador dinamico no lineal de estado del sistema original:
x
1 = x
2 + g1 (y) g1 (
y)
2iL
x
2 = k(
x1 L0 ) +
+ g2 (y) g2 (
y)
ax
1
y = x
1
para lo cual debe cumplirse que:

g1 (y)
g2 (y)
a 2b + L0
= 2n ;
= n2 k

y y=b
y y=b
ab
Estas relaciones son ciertas cuando tambien se satisfacen las siguientes relaciones:
g1 (y)
g2 (y)
a 2y + L0
= 2n ;
= n2 k
y
y
ay


EXTE
178CHAPTER 8. OBSERVADORES DINAMICOS
DE ESTADO BASADOS EN LINEALIZACION
Integrando ambas ecuaciones tenemos:
g1 (y) = 2n y; g2 (y) = (n2 2k)y k(a L0 )Ln(a y)
El observador dinamico no lineal esta entonces dado por:
x
1 = x
2 + 2n (y y)

ay
2iL
+ (n2 2k)(y y) k(a L0 )Ln
x
2 = k(
x1 L0 ) +
ax
1
a y
y = x
1
El diagrama de bloques correspondiente al sistema en lazo cerrado estara dado por:
Los siguientes graficos demuestran el comportamiento del sistema en lazo cerrado:
El programa utilizado para hacer las simulaciones anteriores se muestra a continuaci
on.

8.3

Ejercicios Propuestos

8.4

Lecturas Recomendadas

Chapter 9
Dise
no de Compensadores No lineales
G() mediante Linealizaci
on Extendida

El metodo de la linealizacion extendida permite, en principio, la generalizacion al caso no lineal de


cualquier metodo de diseno de controladores especificado para sistemas lineales. La idea siempre
es la misma: obtener sobre la base del diseno lineal parametrizado un controlador no lineal, por
extensi
on del lineal, cuya linealizacion coincida con el compensador disenado.
En este captulo extenderemos el metodo de dise
no de compensadores del tipo P (Proporcional), P I (Proporcional-Integral) y P ID (Proporcional-Integral-Derivativo), de uso
frecuente y extenso en el control de sistemas lineales, al caso de sistemas no lineales. Utilizaremos como base del dise
no linealizado el metodo de Ziegler-Nichols en regimen frecuen179

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

180CHAPTER 9. DISENO
cial. No utilizaremos el metodo de Ziegler-Nichols basado en los parametros de la respuesta
escalon, por cuanto es mucho mas dificil obtener estos parametros en forma analtica parametrizada. El metodo frecuencial permite encontrar de una forma sistematica y analtica
mas directa los elementos del diagrama de Nyquist sobre los que se basa el calculo de los
parametros del controlador, P, P I o P ID.
El metodo que expondremos solo se aplica a sistemas de una sola entrada y una salida.
Supoongase que tenemos un sistema no lineal, n-dimensional, de una entrada y una salida
dado por:
x(t)

= f (x(t), u(t))
y = h(x(t))
Sea u(t) = U un punto de operacion constante para la entrada escalar del sistema anterior.
Correspondiente con este valor nominal de la entrada tenemos un valor de equilibrio para
el vector de estado y de la salida, dados respectivamente por: x(t) = X(U ) y y(t) = Y (U ).
Supondremos que Y (U ) es una funcion continua de U cuya derivada dY (U )/dU es no nula.
Podremos ocasionalmente parametrizar el punto de equilibrio para el control en base a un
valor deseado de la salida y(t) = Y mediante una expresion de la forma: U = U (Y ).
La expresion linealizada del sistema alrededor del punto de operacion generico (U, X(U ), Y (U )),
parametrizada en terminos del valor constante de la entrada de control en equilibrio, esta
dada por:
x = A(U )x + B(U )u
y = C(U )x
con:

f (x, u)
f (x, u)
h(x)
A(U ) =

; B(U ) =
; C(U ) =
x X(U ),U
u X(U ),U
x X(U ),U
y:
x = x X(U ); u = u U ; y = y Y (U )
De esta representacion del sistema linealizado podemos obtener la funcion de transferencia
del sistema en lazo abierto, parametrizada por el valor U , de la manera siguiente:
GU (s) = C(U )[sI A(U )]1 B(U )

9.1

Dise
no de reguladores del tipo P, PI y PID mediante Linealizaci
on Extendida

El metodo de Ziegler-Nichols en regimen frecuencial consiste en determinar dos parametros


conocidos como la frecuencia u
ltima y la ganancia u
tlima, a partir del diagrama de Nyquist

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


EXTENDIDA
9.1. DISENO
Controlador
P
PI
P ID

Par
ametro Kp
0.5K0 (U )
0.45K0 (U )
0.6K0 (U )

Par
ametro TI

0.83P0 (U )
0.5P0 (U )

Par
ametro TD
0
0
0.125P0 (U )

Table 9.1: Parametros Kp , TI , TD seg


un Ziegler-Nichols
de la funcion de transferencia en lazo abierto, GU (s), obtenida anteriormente. Estos valores
se designan de la manera siguiente:
f0 (U ) = f recuencia ultima
2
1
P0 (U ) =
= periodo ultimo =
0 (U )
f0 (U )
1
K0 (U ) =
= ganancia ultima
|GU (0 (U ))|
y se determinan en el grafico como se muestra a continuacion:
Analticamente, los valores de K0 (U ) y 0 (U ) se calculan a partir de la funcion de transferencia de la manera siguiente:
1
|GU (0 (U ))|
arg[GU (j0 (U ))] =

K0 (U ) =

La expresion general del compensador P ID que estabiliza el sistema linealizado a cero


esta dada por:
"

1
CU (s) = Kp (U ) 1 +
+ TD (U )s
TI (U )s

Las expresiones de los controladores P y P I se obtienen de la ecuacion anterior haciendo


respectivamente, TI = , TD (U ) = 0 y TD (U ) = 0. Para el caso del regulador P D hacemos
simplemente TI (U ) = .
En algunas oportunidades escribimos el controlador anterior de manera un tanto mas
simple de la manera siguiente:
CU (s) = K1 (U ) +

K2 (U )
+ K3 (U )s
s

La siguiente tabla muestra los diferentes valores parametricos recomendados por el metodo
de Ziegler-Nichols, para determinacion de los dise nos de compensador lineal del tipo P, P I
y P ID. Estos valores determinan las constantes de los compensadores que regulan eficientemente a toda la familia de sistemas lineales parametrizada por el punto de equilibrio.
En terminos de los parametros K1 (U ), K2 (U ) y K3 (U ) la tabla anterior se reescribe como:

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

182CHAPTER 9. DISENO
Controlador
P
PI
P ID

Par
ametro K1
0.5K0 (U )
0.45K0 (U )
0.6K0 (U )

Par
ametro K2
0
0.54K0 (U )
P0 (U )
1,2K0 (U )
P0 (U )

Par
ametro K3
0
0
0.075K0 (U )P0 (U )

Table 9.2: Parametros K1 , K2 , K3 seg


un Ziegler-Nichols
En las tablas anteriores no hemos considerado el caso P D por cuanto es facil demostrar
que este caso se corresponde en general, con realimentacion estatica del vector de estado,
cuyo tratamiento ya hemos visto en todo detalle en la seccion anterior.
El controlador P ID lineal, obtenido mediante el metodo de Ziegler-Nichols, puede escribirse facilmente en terminos de una representacion de estado que admite en la ecuacion de
salida la presencia de un termino en la derivada de la entrada que excita al compensador la
cual no es otra que el error linealizado de la salida incremental respecto de su valor nominal
cero. Es decir:
z = K2 (U )e
u = z + K1 (U )e + K3 (U )

de
dt

donde:
e = 0 y = y
Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la
forma:
u = K1 (U )e + K2 (U )

Z t
0

e ()d + K3 (U )

de (t)
dt

que ciertamente constituye un controlador P ID clasico.


El regulador P ID lineal clasico as dise
nado, estabiliza la familia parametrizada de sistemas lineales cuando se usa de acuerdo al esquema siguiente:
Este esquema de control lineal debe corresponderse, exactamente, con la linealizacion del
esquema de compoensacion no lineal siguiente:
Prponemos entonces un compensador no lineal general del tipo P ID al cual aplicaremos
linealizacion aproximada, con el objeto de identificarlo al dise
no llevado a cabo sobre la
familia de sistemas linealizados. Tal generalizacion puede tener la forma siguiente:
z(t)

= k2 (z(t))e(t)
u(t) = z(t) + k1 (z(t))e(t) + k3 (z(t))

de(t)
dt

La variable z(t) juega el papel del estado del compensador dinamico no lineal. Evidentemente la se
nal de control sintetizada por el compensador anterior adopta la forma

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


EXTENDIDA
9.1. DISENO
general:
u(t) = k1 (z(t))e(t) +

Z t
0

k2 (z())e()d + k3 (z(t))

de(t)
dt

que en efecto representa una generalizacion, de tipo no lineal, del controlador clasico P ID.
El punto de equilibrio del controlador P ID no lineal esta dado, evidentemente,por e = 0
y z(U ) = U .
La linealizacin del regulador no lineal, alrededor de su punto de equilibrio, arroja el
siguiente resultado:
z = k2 (U )e
u = z + k1 (U )e (t) + k3 (U )

de (t)
dt

Se desprende, inmediatamente, de la comparacion de este compensador linealizado con


el compensador lineal P ID diseado anteriormente que :
k1 (z)|z=U = K1 (U ); k2 (z)|z=U = K2 (U ); k3 (z)|z=U = K3 (U )
La determinacion de las ganancias no lineales se obtiene entonces, directamente, a partir
de las relaciones siguientes :
k1 (z) = K1 (z); k2 (z) = K2 (z); k3 (z) = K3 (z)
lo cual facilita enormemente la b
usqueda del controlador no lineal.
Debemos, antes de hacer algunos ejemplos, advertir que no siempre es posible aplicar el
metodo de ziegler-Nichols para el dise
no del compensador linealizado. En general, sistemas
de primero y segundo orden no pueden beneficiarse de dise
nos derivados de esta tecnica. La
razon fundamental estriba en el hecho de que tales sistemas poseen funciones de transferencia
cuyo grafico de Nyquist no corta el eje real mas que en = 0 y = . La determinacion
de la ganancia u
ltima puede convierte entonces en un proceso singular.

Ejemplo 9.1: Dise


no de un controlador no lineal del tipo P I para un modelo promedio
de un convertidor Boost de corriente continua
.
Considerese el siguiente modelo promedio de un convertidor tipo Boost de corriente continua
regulado mediante conmutaciones generadas sobre la base de un esquema de modulacion de ancho
de pulsos :
x 1 = 0 x2 + u0 x2 + b
x 2 = 0 x1 1 x2 u0 x1
y = x2

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

184CHAPTER 9. DISENO
donde x1 representa la corriente normalizada promedio de entrada a la bobina del convertidor,
x2 es el voltaje normalizado promedio de salida del condensador del convertidor, b es el valor
numerico, positivo, de una fuente externa de voltaje constante y la variable de control u representa
la llamada relaci
on de trabajo del conmutador electronico, sintetizado mediante transistores ( los
valores numericos de u satisfacen la siguiente relacion de saturacion 0 < u < 1). Las constantes
1 y 2 reciben el nombre, respectivamente, de constante de tiempo del circuito RC de salida y
frecuencia natural de oscilaci
on del circuito LC de entrada.
El convertidor tiene por punto de equilibrio para una relacion de trabajo constante u = U los
siguientes valores constantes de corriente y voltaje normalizados promedio:
u = U ; X1 (U ) =

b
b1
; X2 (U ) =
2
0 (1 U )
U)

02 (1

La linealizacion del sistema alrededor de este punto de equilibrio resulta en:


"

x 1
x 2

"

0
0 (1 U )
0 (1 U )
1

#"

x1
x2

"

y = x2

b
1U
b1
0 (1U )2

La familia de funciones de transferencia parametrizadas, que relacionan el voltaje incremental


de salida con el valor incremental de la relacion de trabajo, se obtiene del modelo linealizado anterior
como:
GU (s) = 0 X1 (U )

b
X1 (U )
+ 02 (1

s
s2 + 1 s

U )2

Para valores numerico tpicos, que daremos mas adelante, la funcion de transferencia anterior
tiene el siguiente grafico de Nyquist.
La forma particular del grafico es indicativa de que podemos aplicar el metodo de ZieglerNichols, basado en la respuesta frecuencial, para el dise
no de un controlador P I.
Calculamos la funcion de transferencia para s = j y obtenemos:
GU (s) =
=

b
2
2
2
X1 (U ) ([0 (1 U ) ]
0 X1 (U ) 2
= 0 X1 (U )
0 (1
j1
[02 (1 U )2 2 ]2 + (1 )2
h
i
1b
[02 (1 U )2 2 ] X1b(U ) 2 1
[02 (1 U )2 2 ] + X
1 (U )
0 X1 (U )

j
X
(U
)
0 1
[02 (1 U )2 2 ]2 + (1 )2
[02 (1 U )2 2 ]2 + (1 )2
b
X1 (U )
U )2 2 +

j1 )

En consecuencia:
Im GU (j) = j0 X1 (U )

1 b
X1 (U )
(1 )2

[02 (1 U )2 2 ] +
[02 (1

U )2

2 ]2

= j0 X1 (U )

[02 (1

202 (1 U )2 2
U )2 2 ]2 + (1 )2

La parte
imaginaria del grafico de Nyquist se hace cero en = 0; = y tambien en
0 (U ) = 20 (1 U )

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


EXTENDIDA
9.1. DISENO
El valor del modulo de la funcion de transferencia para este valor de la frecuencia angular
resulta en:

j 20 (1 U ) X1b(U )

|GU (j0 (U ))| = 0 X1 (U )

2
2
2
2
20 (1 U ) + j1 20 (1 U ) + 0 (1 U )
v
u
u
t

= 0 X1 (U )

v
u
4 (1U )4
u

+
u 202 (1 U )2 + 0 2
1

= 0 X1 (U )t 4
0 (1 U )4 + 212 02 (1 U )2
02 (1 U )2 + j1 20 (1 U )

202 (1

U )2

b2
X12 (U )

0 X1 (U )
b
=
1
0 (1 U )

El perodo u
ltimo y la ganancia u
ltima resultan ser entonces, en este caso:

2
2
0 (1 U )2
P0 (U ) =
=
; K0 (U ) =
0 (U )
0 (1 U )
b
De acuerdo con los valores de la tabla, las ganancias del controlador P I para el sistema linealizado estan dadas por:
K1 (U ) =

0.450 (1 U )2
2 (1 U )3
; K2 (U ) = 0.54 0
b
2b

Es inmediato entonces obtener la estructura del controlador no lineal P I cuyo estado designamos
mediante z(t):
"

z(t)

2 (1 z(t))3
0.54 0
e(t)
2b
"

0 (1 z(t))2
u
(t) = z(t) + 0.45
e(t)
b
donde:
e(t) = Z2 (U ) z2 (t)
El esquema final involucra la delimitacion de la se
nal de control generada por el controlador no
lineal del tipo P I, de acuerdo a un saturador que impide que esa se
nal tome valores inferiores a 0 o
superiores a 1. Por esta razon aparece en el diagrama de bloques siguiente un limitador con estas
caractersticas:
El siguiente programa simula la respuesta en lazo cerrado del convertidor Boost promedio cuyos
parametros se escogieron como:
0 = 1.811e3; 1 = 1.6667e3; b = 106.066; U = 0.8;
con un valor de equilibrio para el voltaje normalizado promedio de:
X2 (0.8) = 0.3354.

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

186CHAPTER 9. DISENO
La grafica siguiente muestra una respuesta del voltaje normalizado promedio del sistema controlado.

Ejemplo 9.2: Control de altura de nivel de lquido en un conjunto de tanques dispuestos


en cascada
Considerese el problema general de controlar la altura del lquido en el u
ltimo de una serie
de n tanques identicos y no interactuantes, cuya entrada u(t) esta representada por el flujo (no
negativo) entregado al primer tanque y la salida esta constituida por la altura del lquido en el nesimo tanque. Si designamos por xi la altura en el i-esimo tanque, el modelo dinamico que describe
el sistema es el siguiente:
x 1 =
..
.
x i =

c
1
x1 + u
A
A
c
c
xi +
xi1 ; i = 2, 3, . . . , n
A
A

y = xn

donde c es una constante que representa la resistencia a la salida de liquido y A es el area de la


base de cualquiera de los tanques.
Para un valor constante del flujo de entrada u, el punto de equilibrio del sistema es, simplemente:
u = U ; xi (U ) = Xi (U ) =

U2
U2
; i = 1, 2, . . . , n; y(U ) = Y (U ) = 2
2
c
c

El modelo linealizado del sistema dinamico, alrededor de este punto de equilibrio generico, esta
dado por :
c2
1
x1 + u
2AU
A
c2
c2
=
xi +
x
; i = 1, . . . , n
2AU
2AU (i1)

x 1 =
x i
donde :

xi = xi Xi (U ) = xi

U2
U2
;
u
=
u

U
;
y
=
y

c2
c2

Tomando transformadas de Laplace de cada una de las ecuaciones diferenciales lineales anteriores, as como en la ecuacion de salida, obtenemos:
x1 (s) =

1 u (s)
c2
A s + 2AU

c2 x(i1) (s)
; i = 2, . . . , n
c2
2AU s + 2AU
yn (s) = xn (s)
xi (s) =

DE REGULADORES DEL TIPO P, PI Y PID MEDIANTE LINEALIZACION


EXTENDIDA
9.1. DISENO
De este conjunto de relaciones es facil eliminar las transformadas de Laplace de las variables
de estado y obtenemos, sin mayor dificultad, la funcion de transferencia de la familia de sistemas
linealizados como:
K/U n1
y (s)
=
u (s)
(s + /U )n

GU (s) =
donde :
1
K=
A

c2
2A

!n1

; =

c2
2A

Para calcular las ganancias de un controlador P ID que logre regular el comportamiento de la


familia de sistemas linealizados debe ser, necesariamente, n 3. Las siguientes figuras muestran los
graficos de Nyquist para las funciones de transferencia del sistema de tanques linealizados, cuando
n = 1, 2, 3, 4. Solo para n 3 observamos que existe corte del grafico con el eje real y solo en tales
casos podremos calcular los valores de la ganancia u
ltima y del perodo u
ltimo.
El calculo de la frecuencia de corte se hace sobre la base de la siguiente relacion:
arg GU (j0 (U )) = arg

K/U n1
=
(j0 (U ) + /U )n

de la cual se deriva inmediatamente que:

ntan

0 (U )
= 0 (U ) = tan
/U
U
n

El perodo u
ltimo es entonces:
P0 (U ) =

U
2

=
0 (U )
tan n

El modulo de la funcion de transferencia para el valor obtenido de la frecuencia angular se


calcula como sigue:

K/U n1
K/U n1

q
|GU (j0 (U ))| =
=

(j0 (U ) + /U )n
2 (U ) + ( /U )2
0

hq

K/U n1

( /U )2 tan2

+ ( /U )2

in =

KU
n secn

La ganancia u
ltima esta dada entonces por:
n secn
K0 (U ) =
KU

Las ganancias del controlador P ID lineal que estabiliza la familia de sistemas linealizados
parametrizados por el punto de equilibrio se obtienen de la tabla anterior y resultan ser:

0.6 n

0.6 n1 tan n secn


K1 (U ) =
secn
; K2 (U ) =
KU
n

KU 2

0.15 n1 secn

; K3 (U ) =
Ktan n

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

188CHAPTER 9. DISENO
Es inmediato entonces obtener el controlador no lineal del tipo P ID. Este esta dado por:

0.6 n1 tan n secn n


z(t)

=
e(t);

Kz 2 (t)


0.15 n1 secn n de(t)
0.6 n
n

u(t) = z(t) +
sec
e(t) +
Kz(t)
n
Ktan n
dt
donde:
e(t) = Y (U ) y(t) = Xn (U ) xn (t) =

U2
xn (t)
c2

El siguiente diagrama de bloques muestra el esquema de control no lineal propuesto anteriormente.


Con el objeto de ilustrar el funcionamiento del controlador P ID no lineal que hemos desarrollado hacemos un ejemplo con los siguientes valores numericos:
n = 3; = 1; K = 2; U = 7
La siguiente figura muestra las respuestas de las alturas del lquido en cada uno de los tanques
cuando el flujo de entrada de lquido al primer tanque obedece una ley de control del tipo P ID no
lineal.
El programa utilizado para estas simulaciones se muestra a continuaci
on.
El esquema propuesto es suficientemente electivo a
un en la presencia de limitaciones naturales
impuestas a la magnitud de la variable de control. As por ejemplo, si acotamos el valor de u,
en el programa de simulacion anterior, a valores que no sobrepasen una cierta cota dada por
umax , entonces el sistema controlado funcionara temporalmente, durante el perodo que subsista la
condicion de saturacion, en lazo abierto. Las graficas siguientes demuestran que a pesar de perderse
la realimentacion, por efecto de la saturacion, durante perodos significativos el controlador a
un
tiene exito en estabilizar la salida del sistema al punto de equilibrio requerido:

9.2

Sintesis de Compensadores No Lineales basados en


el M
etodo del Controlador-Observador cl
asico utilizando Linealizaci
on Extendida

Nuestro objetivo ahora es el de extender este metodo clasico de dise


no de compensadores
lineales al caso no lineal. La idea principal en lograr esta extension es, de nuevo, proponer un esquema de compensacion no lineal que tenga la misma forma que el esquema
del controlador-observador. Proceder, seguidamente, a linealizar este dise
no e identificar las
linealizaciones de cada bloque con las que tenemos en el esquema linealizado. Exigir luego
que las linsealizaciones de los distintos bloques, en el esquema no lineal, coincidan con los
bloques compensadores que hemos obtenido para el sistema linealizado. Finalmente, obtener
las relaciones generales y las condiciones de equilibrio que logran tal identidad.


EXTENDIDA189
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
Proponemos un esquema de compensacion general de la misma forma que el esquema
lineal. La generalidad se debe a que especificaremos cada uno de los bloques compensadores
dinamicos como un sistema n 1 dimensional no lineal de tipo general, cuyas salidas pueden
exhibir dependencia de la entrada. Tales subsistemas compensadores seran de la forma:
zu = u (zu , u); zy = y (zy , y);
yu = u (zu , u); yy = y (zy , y)
Estos sistemas compensadores se arreglan, en interconexion, de acuerdo al siguiente esquema general controlador-observador:
El conjunto de ecuaciones que conforman el sistema en lazo cerrado, sobre las cuales
ejerceremos el proceso de linealizacion, estan dadas por el siguiente conjunto de 3n 2
ecuaciones diferenciales:

zu =
zy
y =
u =

f (x(t), u(t))

u (zu , u)
y (zy , y)
h(x(t))
u (zu , u) + y (zy , y)

Consideremos el problema particular de encontrar el bloque compensador no lineal del


lazo de realimentacion mas interior del esquema propuesto, suponiendo conocida la funcion
de transferencia de su version linealizada alrededor de su punto de operacion. Supongamos
que los puntos de operacion de tal bloque se especifican como:
u = U ; zu (U ) = Zu (U ); yu (U ) = u (Zu (U ), U ) = Yu (U );

donde:
u (Zu (U ), U ) = 0
La funcion de transferencia de la linealizacion de este subsistema alrededor del punto de
equilibrio esta dada por:

yu (s)
u
u
sI

= Hu (U, s) =

u (s)
zu Zu (U ),U
zu Zu (U ),U

u
u

u Zu (U ),U
u Zu (U ),U

Supongamos, mas a
un, que la funcion de transferencia Hu (U, s) tiene la siguiente expresion explcita:
nu(n1) (U )sn2 + nu(n2) (U )sn3 + . . . + nu2 (U )s + nu1 (U )
yu (s)
= Hu (U, s) =
+ nun (U )
u (s)
sn1 + n1 sn2 + . . . + 2 s + 1

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

190CHAPTER 9. DISENO
De comparar esta expresion con la expresion linealizada surge inmediatamente la identificacion siguiente:

nun (U ) =

u Zu (U ),U
Con el objeto de continuar el proceso de identificacion haremos ahora una simplificacion
drastica e importante, pero que no conlleva perdida de generalidad, la cual es suponer una
estructura lineal en forma canonica compa
nera para la funcion vectorial u (zu , u). Esto
se corresponde con la idea de obtener realizaciones en espacio de estado del compensador
linealizado en forma canonica de la controlabilidad. Esto permite identificar la funcion de
salida del bloque compensador como una funcion no lineal haciendo, por tanto, todo el
bloque compensador de naturaleza no lineal. En efecto, supongamos entonces que u (zu , u)
es de la forma:

zu2
zu3
..
.

u (zu , u) =

1 zu1 2 zu2 . . . n1 zu(n1)

0
0
..
.



+


0

Puesto que:

0
0
..
.

= bu =

u (zu , u)
zu

"
#
(z , u)
u (zu , u) u (zu , u)
u (zu , u)
u u

=
...
;

zu
zu1
zu2
zu(n1)

= Au (U ) =

u (zu , u)
zu

0
0
..
.

1
0
..
.

0
1
..
.

...
...
...

0
0
..
.

0
0
0 ...
1
1 2 3 . . . n1

entonces la expresion siguiente es valida:

u (zu ,u)
zu(n1)

u
u
sI

zu Zu (U ),U
zu Zu (U ),U
!

n2

s
Zu (U ),U

u (zu ,u)
zu(n2)

sn1 + n1

Zu (U ),U
n2
s
+ ...

n3

+ ... +

+ 2 s + 1

u Zu (U ),U

u (zu ,u)

zu1
Zu (U ),U


EXTENDIDA191
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
Comparando esta u
ltima expresion con la parte de la funcion de transferencia a que se
corresponde obtenemos las siguientes relaciones:

(z
,
u)
u
u

zui

= nui (U ); i = 1, 2, . . . , n 1
Zu (U ),U

Estas relaciones permitiran encontrar la expresion de la funcion no lineal de salida del


compensador interno. Antes de proceder a encontrar esta funcion no lineal de salida del
bloque compensador, hagamos unas breves consideraciones sobre el punto de equilibrio de
este subsistema.
En equilibrio u = U . Notese, sin embargo, que u representa realmente un error definido
en relacion a la se
nal de referencia v. El estado del compensador en condiciones de equilibrio
cumple:

zu2 (U )
zu3 (U )
...
1 zu1 (U ) 2 zu2 (U ) . . . n1 zu(n1)(U )

0
0
...
0
U

en consecuencia:
zu1 (U ) =

U
1

De esta igualdad podemos encontrar base suficiente para suponer que esta relacion es
una particularizacion de una relacion semejante que es valida en condiciones arbitrarias,
diferentes a las de equilibrio. Es decir:
zu1 =

U
u = 1 zu1
1

Podemos ahora, sin mayores dificultades, proponer que el conjunto de relaciones dadas
por:

u (zu , u)

= nui (U ); i = 1, 2, . . . , n 1

zui Zu (U ),U
surge, en realidad, del siguiente conjunto de ecuaciones en derivadas parciales:
u (zu , u)
= nui (1 zu1 ); i = 1, 2, . . . , n 1
zui
De estas relaciones obtenemos, inmediatamente, como solucion posible para la funcion
no lineal de salida, u , lo siguiente:
u (zu , u) = (zu1 , u) + nu2 (1 zu1 )zu2 + nu3 (1 zu1 )zu3 + . . . + nu(n1) (1 zu1 )zu(n1)

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

192CHAPTER 9. DISENO
Donde (zu1 , u) es una funcion arbitraria de las variables zu1 y u, que tiene la forma
siguiente, como es facil verificar:

Z u
1
1
nun () + nu1 () d
(zu1 , u) = nu1 (1 zu1 )zu1 nu1 (1 zu1 )u +
1
1
0

En efecto:
u (zu , u)
(zu , u)
1
1
=
= nu1 (1 zu1 ) + nun (u) + nu1 (u) = nun (u)
u
u
1
1
y
nu1 (1 zu1 )
1 nu1 (1 zu1 )
(zu1 , u)
= nu1 (1 zu1 ) +

u = nu1 (1 zu1 )
zu1
zu1
1
zu1
En resumen, el compensador no lineal que conforma el lazo mas interior estara dado por
el siguiente sistema lineal con funcion de salida no lineal dados por:
zu1 = zu2
zu2 = zu3
..
.
zu(n2) = zu(n1)
zu(n1) = 1 zu1 2 zu2 . . . n1 zu(n1) + u
yu = nu1 (1 zu1 )zu1 + nu2 (1 zu1 )zu2 + . . . + nu(n1) (1 zu1 )zu(n1)

Z u
1
1
nu1 (1 zu1 )u +
nun () + nu1 () d

1
1
0
En condiciones de equilibrio tenemos que yu satisface:
yu (U ) =

Z U
0

Z U
1
nun () + nu1 () d =
Hu (, 0)d
1
0

Lo cual dice que el sistema linealizado satisface en equilibrio:


yu (U )
u (U )
=
= Hu (U, 0) = lim Hu (U, s)
s0
U
U
cuya justificacion proviene, de manera independiente, del teorema del valor final.
Usando exactamente el mismo razonamiento podemos encontrar la realizacion en espacio
de estado del compensador que conforma el lazo de realimentacion externo.
Si suponemos que la funcion de transferencia del subsistema compensador linealizado es
de la forma

y
y
yy (s)
sI

= Hy (Y, s) =

y (s)
zy Zy (Y ),Y
zy Zy (Y ),Y
=

y
y

y Zy (Y ),Y
y Zy (Y ),Y

ny(n1) (Y )sn2 + ny(n2) (Y )sn3 + . . . + ny2 (Y )s + ny1 (Y )


+ nyn (Y )
sn1 + n1 sn2 + . . . + 2 s + 1


EXTENDIDA193
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
La forma de este compensador estara dada por:
zy1 = zy2
zy2 = zy3
..
.
zy(n2) = zy(n1)
zy(n1) = 1 zy1 2 zy2 . . . n1 zy(n1) + y
yy = ny1 (1 zy1 )zy1 + ny2 (1 zy1 )zy2 + . . . + ny(n1) (1 zy1 )zy(n1)

Z y
1
1
nyn () + ny1 () d
ny1 (1 zy1 )y +

1
1
0
En condiciones de equilibrio yy satisface:
yy (Y ) =

Z Y
0

Z Y
1
nyn () + ny1 () d =
Hy (, 0)d
1
0

El diagrama de bloques del esquema compensador demanda entonces que debe ser cierta
la siguiente relacion de equilibrio:
yu (U ) yy (Y ) + V = yu (U ) yy (Y (U )) + V = U
de donde, la se
nal constante de referencia que es necesario suministrar para producir el
equilibrio deseado debera cumplir:
V = yu (U ) + yy (Y (U )) + U
Completaremos ahora el ejemplo del manipulador robotico, proponiendo el dise
no de un
regulador no lineal del tipo controlador-observador para este sistema.

Ejemplo 9.3: Compensador no lineal del tipo controlador-observador para un manipulador rob
otico (continuaci
on)
Las realizaciones en espacio de estado de los compensadores estabilizantes del sistema linealizado
alrededor del punto de equilibrio resultaron ser:

zu = zu + u ; yu = 2n
zy = zy + y

yy = 2n

B
J

c
Y
cos
n
n

B
zu
J

+ J

B
J

zy + J n2 +

B
J

2n

B
J

c
Y
cos
nJ
n

Observamos inmediatamente que el controlador del lazo mas interno es independiente del punto
de operacion. Por lo tanto esta parte del compensador estara constituida por un sistema lineal cuya
funcion de salida es tambien lineal:

zu = zu + u; yu = 2n

B
zu
J

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

194CHAPTER 9. DISENO
Usando el procedimiento expuesto anteriormente podemos escribir el compensador no lineal
mas externo de la manera siguiente:
zy = zy + y

B
2n
J

c
zy
B
1
B
c
zy
B
yy =
cos
+ J
zy +
2n
cos
+ J
y
n
n
J

J
n
n
J

Z y
B
B
c

1
B
c

B
2
+
J n +
2n

cos

2n
cos
+ J
d
J
J
nJ
n

J
n
n
J
0
Resolviendo la integral y simplificando obtenemos:


B
c
zy
B
y
1
B
y
yy = 2n
cos
+ J
zy
+ Jn2 y c 1 +
2n
sin
J
n
n
J

J
n
De la condicion de equilibrio obtenemos:

2
1 U
V = nJn sin
= Jn2 Y
n
El siguiente diagrama de bloques ilustra la disposicion del esquema de compensacion no lineal
Los graficos siguientes muestran la respuesta del brazo controlado por el regulador no lineal del
tipo controlador-observador que hemos derivado en este ejemplo:
El programa utilizado en la generacion de los graficos anteriores se muestra a continuacion.

Ejemplo 9.4: Dise


no de un controlador no lineal del tipo controlador- observador para
un sistema de suspensi
on magn
etica
Damos a continuacion en forma resumida los pasos principales del proceso de dise
no de un regulador del tipo controlador-observador de ndole no lineal obtenido por el metodo de la linealizacion
extendida.
El modelo no lineal del sistema satisface las siguientes expresiones:
x 1 = x2
x 2 = g

c x23
m x1

R
1
x 3 = x3 + u
L
L
y = x1
Siendo el punto de equilibrio parametrizado por la corriente de entrada constante U :
c U2
U
; x2 (U ) = 0; x3 (U ) = X3 (U ) =
2
mg R
R
Linealizando el sistema alrededor del punto de equilibrio generico se obtiene:
u = U ; x1 (U ) = X1 (U ) =

x 1 = x2
mg 2 R2
2gR
x 2 =
x1
x3
2
cU
U
R
1
x 3 = x3 + u
L
L
y = x1


EXTENDIDA195
9.2. CONTROLADOR-OBSERVADOR CLASICO
UTILIZANDO LINEALIZACION
y la funcion de transferencia del sistema linealizado, parametrizada en terminos de la corriente de
entrada U es:

GU (s) =

NG (U, s)
=
DG (U, s)
s2

2gR
LU

mg 2 R2
cU 2

s+

R
L

s3 +

R 2
Ls

2gR
LU
mg 2 R2
s
cU 2

mg 2 R3
cLU 2

La estructura del compensador lineal esta dada entonces por:


Hu (U, s) =
=
Hy (Y, s) =
=

Nu (U, s)
nu2 (U )s + nu1 (U )
+ nu3 (U )
=
C(s)
s2 + 2 s + 1
nu3 (U )s2 + [2 nu3 (U ) + nu2 (U )]s + [1 nu3 (U ) + nu1 (U )]
s2 + 2 s + 1
Ny (Y, s)
ny2 (Y )s + ny1 (Y )
=
+ ny3 (Y )
C(s)
s2 + 2 s + 1
ny3 (Y )s2 + [2 ny3 (Y ) + ny2 (Y )]s + [1 ny3 (Y ) + ny1 (Y )]
s2 + 2 s + 1

Planteando la funcion de transferencia deseada en lazo cerrado:

2gR
LU

2gR
LU

NG (U, s)
=
= 3
D(U, s)
(s + )(s2 + 2n s + n2 )
s + (2n + )s2 + (2n + n2 )s + n2

FU (s) =

Obteniendo la ecuacion fundamental del dise


no:
(s2 + 2 s + 1 )[s3 + (2n + )s2 + (2n + n2 )s + n2 ]

mg 2 R2
mg 2 R3
R
s
(s + 2 s + 1 ) s + s2
2
L
cU
cLU 2
2

R
mg 2 R2
mg 2 R3
+ [nu3 (U )s + (2 nu3 (U ) + nu2 (U ))s + (1 nu3 (U ) + nu1 (U ))] s + s2
s

L
cU 2
cLU 2

2gR
[ny3 (Y )s2 + (2 ny3 (Y ) + ny2 (Y ))s + (1 ny3 (Y ) + ny1 (Y ))]
LU
2

La representacion entrada-salida del compensador lineal esta dada por:


Hu (U, s) =

Nu (U, s)
C(s)

2n +

R
L

s + (2n + n2 ) + 2 (2n + )

R
L

2n +

2 R
L +

mg 2 R2
cU 2

s2 + 2 s + 1
Ny (U, s)
C(s)

mgRL
R
R
LU
ny2 (U )s + ny1 (U )
2

2 + 2n +
+ (2n + n )
2
2
s + 2 s + 1
2cU
L
L
2gR

Hy (U, s) =
=

R
L

R
LU
R R2
+ (2n + ) 2 1
+ 1 2 + 2
L
2gR
L
L

U
n2 LU

2g
2gR

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

196CHAPTER 9. DISENO
Ejercicio: Completar los pasos de dise
no del controlador no lineal iniciado.

Ejemplo 9.5: Dise


no de un controlador no lineal, mediante el m
etodo del controladorobservador, de un tanque de reacci
on continuamente agitado
Consideremos ahora el modelo no lineal de un tanque reactor continuamente agitado en el cual
toma lugar una reaccion qumica del tipo isotermica en fase lquida
x 1 = (1 + Da1 )x1 + u
x 2 = Da1 x1 x2 Da2 x22
y = x1 + x2
Donde x1 representa la concentraci
on normalizada (adimensional) Cp /Cpo de cierta especie P
en el reactor, donde Cpo es la concentraci
on deseada de las especies P y Q medidas en mol.m3 , La
variable de estado x2 representa la concentraci
n normalizada CQ /Cpo de la especie Q . La variable
de control u se define como la razon de la rata de alimentaci
on molar por unidad volumetrica
de la especie P , la cual designamos mediante NP F , y la concentraci
on deseada CP O . Es decir,
u = NP F /(F CP O ) donde F es la rata de alimentaci
on volumetrica en m3 s1 . Las constantes Da1
y Da2 se definien, respectivamente como: k1 V /F y k2 V CP O /F siendo V el volumen del reactor, en
m3 , y k1 , k2 son las constantes de primer orden en s1 .
Se supone que la especie Q es altamente acida mientras que la especie reactante R es neutra.
A fin de evadir problemas de corrosion en el equipo que se encuentra aguas abajo se desea regular
la concentracion total y a un valor de referencia constante dado por Y . Se supone ademas que la
variable de control se encuentra acotada, de forma natural, en el intervalo [0, Umax ] reflejando as
la imposicion fsicamente valida de nuestra disponibilidad de una rata de alimentaci
on finita para
la especie P .
El punto de equilibrio para este sistema, a una rata fija de alimentaci
on U , esta dada por:
"

x1 (U ) =

1
U
; x2 (U ) =
1 +
1 + Da1
2Da2

Y (U ) =

U
1
+
1 +
1 + Da1 2Da2

"

4Da1 Da2 U
1+
1 + Da1

4Da1 Da2 U
1+
1 + Da1

La linealizacion del sistema alrededor de este punto de equilibrio resulta ser:


x 1 = (1 + Da1 )x1 + u
s

x 2 = Da1 x1

1+

4Da1 Da2 U
x2
1 + Da1

y = x1 + x2
La funcion de transferencia del sistema linealizado se obtiene directamente de las ecuaciones
diferenciales lineales anteriores como:
q

a1 Da2 U
1 + 4D1+D
y (s)
NG (U, s)
a1
q

= GU (s) =
=
4Da1 Da2 U
u (s)
DG (U, s)
(s + 1 + Da1 ) s + 1 + 1+Da1

s + Da1 +

9.3. EJERCICIOS PROPUESTOS

197
q

s + Da1 +

s2 + 1 + Da1 +

1+

1+

4Da1 Da2 U
1+Da1

4Da1 Da2 U
1+Da1

s + (1 + Da1 ) 1 +

4Da1 Da2 U
1+Da1

Las funciones de transferencia linealizadas de los bloques compensadores adoptan la forma


siguiente:
yy (s)
yu (s)
nu1 (U )
ny1 (U )
= Hu (U, s) =
+ nu2 (U );
= Hy (U, s) =
+ ny2 (U )
u (s)
s+
y (s)
s+
De otra forma equivalente, expresamos estas funciones de transferencia,como:
yu (s)
Nu (U, s)
nu2 (U )s + nu2 (U ) + nu1 (U )
= Hu (U, s) =
=
u (s)
C(s)
s+
yy (s)
Ny (U, s)
ny2 (U )s + ny2 (U ) + ny1 (U )
= Hy (U, s) =
=
y (s)
C(s)
s+
La identidad polinomica fundamental que nos permite dise
nar el regulador clasico del tipo
controlador-observador, se escribe, en este caso, como:
(

"

(s + ) s + 1 + Da1 +

4Da1 Da2 U
4Da1 Da2 U
1+
s + (1 + Da1 ) 1 +
1 + Da1
1 + Da1
(

"

[nu2 (U )s + nu2 (U ) + nu1 (U )] s + 1 + Da1 +


"

+ [ny2 (U )s + ny2 (U ) + ny1 (U )] s + Da1 +

+
s

4Da1 Da2 U
4Da1 Da2 U
1+
s + (1 + Da1 ) 1 +
1 + Da1
1 + Da1

4Da1 Da2 U
1+
1 + Da1

(s + )(s2 + 2n + n2 )
De la identificacion, termino a termino, de ambos polinomios en la identidad anterior, surgen los siguientes valores para las incognitas que conforman los numeradores de las funciones de
transferencia de los bloques compensadores:
no iniciado.
Ejercicio: Completar el dise

9.3

Ejercicios Propuestos

9.4

Lecturas Recomendadas

DE COMPENSADORES NO LINEALES G() MEDIANTE LINEALIZACION

198CHAPTER 9. DISENO

Part III
El M
etodo de la Linealizaci
on Exacta

199

Chapter 10
M
etodo de Control Calculado

Durante la decada de los ochenta, se han logrado avances significativos en la comprension de


los sistemas no lineales dinamicos de control. Estos avances han hecho posible la solucion
definitiva de problemas que ocuparon la atencion de los investigadores durante muchos anos. Las
dificultades asociadas con los problemas de diseno de controladores para sistemas no lineales han
sido ampliamente esclarecidas y su razon fundamental de ser ha logrado un tratamiento general
con explicaciones que se han beneficiado de la intuicion que se posee a partir del caso lineal.
Adicionalmente, el desarrollo sin precedentes de las herramientas computacionales y su enorme
velocidad de procesamiento ha permitido el tratamiento sistematico del diseno de controladores
para sistemas no lineales. En particular, debemos resaltar que el desarrollo de sistemas expertos,
aunado a la posibilidad, cada vez mas accesible y eficiente, de los paquetes de manipulacion
simbolica, hacen preveer en los proximos anos un desarrollo de gran alcance en las tecnicas de
diseno de controladores para sistemas no lineales. Las bases para tales posibilidades se encuentran
en su gran mayora completamente desarrolladas desde el punto de vista teorico y para una
gran clase de sistemas no lineales se cuenta, hoy da, con verdaderas posibilidades tecnicas de
implementacion de sus controladores.
En este captulo estudiaremos el metodo del control calculado. Este metodo fue usado
originalmente en el area de robotica con aplicaciones de diversa ndole. Por ello, la mayor parte de
201

202

CHAPTER 10. METODO


DE CONTROL CALCULADO

los ejemplos que presentaremos a continuacion seran fundamentalmente de naturaleza mecanica,


electrica o electromecanica.

10.1

El m
etodo del Control Calculado: Ejemplos

En este captulo daremos algunos ejemplos de dise


no de controladores no lineales que se
pueden llevar a cabo de manera directa, es decir, casi por inspeccion del modelo no lineal.
Como veremos tal procedimiento de dise
no resulta en un sistema en lazo cerrado que es perfectamente lineal, sin que en el proceso de dise
no hayamos involucrado, en forma alguna, un
proceso de aproximacion de las ecuaciones originales. Estos controladores se reinterpretaran,
mas adelante, como provenientes de ciertas transformaciones, dependientes del estado, llevadas a cabo en el espacio de los controles. Ademas, constataremos que el metodo propuesto
no es del todo general: una gran cantidad de casos no pueden beneficiarse de este ataque tan
sencillo. Aquellos casos que no pueden ser resueltos por esta tecnica ameritaran entonces
un tratamiento que debe explorar tambien la posibilidad de realizar transformaciones en el
espacio de los estados.

10.1.1

Dos sencillos ejemplos: procedimiento de dise


no, singularidades

Ejemplo 10.1: Movimiento de un anillo sobre un aro giratorio


Consideremos el Ejemplo 1.17 y el problema de controlar los movimientos del aro que se desliza
sobre el anillo al rotar sobre su eje vertical. El modelo en variables de estado de este sistema esta
dado por:
x 1 = x2
g
x 2 = sen (x1 ) + u sen (x1 ) cos(x1 )
a

(10.1)

donde la variable de control u deba ser, necesariamente, positiva. La Figura 10.1 representa el
sistema no lineal mediante un diagrama de bloques.
A primera vista este sistema solo exhibe no linealidades en la ecuacion donde aparece la variable
de control y del diagrama de control la cadena de dos integradores nos sugiere una estructura
prevalecientemente lineal. Estos hechos pudieran ayudarnos enormemente, si por un momento nos
atrevemos a pensar de que manera pudieramos destruir o reemplazar por linealidades las no
linealidades presentes en el sistema, mediante la especificacion apropiada de la variable de control
u. En efecto, si definimos una entrada auxiliar v como:
g
v = sen (x1 ) + u sen (x1 ) cos(x1 )
a

(10.2)


10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS

x2

-g/a . sen(x )+u sen(x1 )cos(x1 )

203

x1

Figure 10.1: Diagrama de bloques del sistema aroanillo


no hay duda que el sistema obtenido es perfectamente lineal desde esta nueva entrada:
x 1 = x2
x 2 = v

(10.3)

De hecho, el sistema se ha reducido simplemente a dos integradores dispuestos en cascada, tal como
se muestra en la Figura 10.2.

x2

x1

Figure 10.2: Diagrama de bloques del sistema linealizado


Es evidente que el problema de estabilizar la posicion del anillo a un valor deseado x1d (X) = X
luce ahora trivial. La especificacion de una ley de control por realimentaci
on lineal del estado
lograra tal efecto sin mayores complicaciones. En efecto, la ley de control:
v = 2n x2 n2 (x1 X)

(10.4)

produce un sistema perfectamente lineal en lazo cerrado dado por:


x 1 = x2
x 2 = 2n x2 n2 (x1 X)

(10.5)

Las trayectorias de este sistema convergen asint


oticamente al punto de equilibrio deseado, dado
por x2 = 0, x1 = X. El control original u, el cual debemos utilizar para sintetizar la entrada
auxiliar v, debe obtenerse a partir de la relacion:
g
sen (x1 ) + u sen (x1 ) cos(x1 ) = 2n x2 n2 (x1 X)
a

(10.6)


CHAPTER 10. METODO
DE CONTROL CALCULADO

204
es decir:

u =
=

g
1
v sen (x1 )
sen (x1 ) cos(x1 )
a

1
g
2
2n x2 n (x1 X) sen (x1 )
sen (x1 ) cos(x1 )
a

(10.7)
(10.8)

la cual ciertamente constituye una ley de control basada en realimentaci


on no lineal del vector de
estado.

La relacion (10.8) puede verse como una transformacion de la coordenada del control
u que depende de las componentes del estado. Es decir, mediante una redefinicion de la
variable de control en terminos de la variable original y operaciones no lineales sobre las
componentes del estado obtenemos un nuevo canal de control y desde el cual el sistema luce
perfectamente lineal. Esto nos dice que hemos encontrado una nueva forma de representar
la accion de control, representada por v, desde donde el sistema exhibe un comportamiento
perfectamente lineal sin aproximaciones de ning
un tipo. Tal transformacion tiene entonces
la enorme virtud de eliminar las no linealidades presentes en el sistema de una manera limpia
y tajante, sin acudir a aproximaciones de genero alguno.
El metodo que acabamos de describir recibe el nombre de Metodo del Control Calculado
y fue conocido y difundido ampliamente por quienes trabajaban en el area de robotica (por
ello en algunos libros aparece con el nombre de Metodo del Torque Calculado). La razon de
este nombre se explica inmediatamente del ejemplo presentado, si en lugar del procedimiento
anterior hubiesemos procedido a comparar directamente las ecuaciones (10.1) y (10.5). Es
evidente que la dinamica deseada en (10.5) se obtiene de igualar, en ambas expresiones, los
miembros derechos de las ecuaciones diferenciales y proceder luego a calcular el control
necesario que convierte a (10.1) en (10.5).
Nuestra alegra quizas puede verse empa
nada por un hecho significativo: la posibilidad
de una singularidad en la definicion del control. Esta surge por la indefinicion del control
cuando la variable x1 adopta los valores:
x1 = 0,

, , etc.
2

Notese que para tales valores singulares, el sistema pierde el canal de control pues el
factor que precede a u en (10.1) se hace cero justamente en estos valores. Desde el punto
de vista fsico era de esperar ciertos problemas de controlabilidad cuando la posicion del
anillo adopta tales valores. Ciertamente, si el anillo se encuentra perfectamente ubicado en
la posicion mas baja del aro, la velocidad de rotacion del aro no afecta para nada la posicion
del anillo sobre el aro. Lo mismo sucede cuando este se encuentra girando describiendo un
crculo de radio maximo o en la posicion superior del aro. Esto implica que la poltica de
control linealizante (10.8) tiene ciertas restricciones y que, sin lugar a dudas, su aplicacion
puede llevar a una indefinicion de la accion de control (haciendola infinitamente grande por
ejemplo) si la trayectoria del sistema se acerca a tales singularidades. Es muy dificil en


10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS

205

general, saber si para ciertas condiciones iniciales dadas, las trayectorias del sistema, en
respuesta a la ley de control antes especificada, habra de acercarse a una singularidad o no.
Los siguientes programas, sarole.m y arole.m, permiten simular el comportamiento
controlado del sistema no lineal del Ejemplo 10.1, sujeto a la ley de control linealizante
c
(10.8) restringida a valores positivos. Para ejecutar en Matlab
> sarole
%
%
%
%
%
%
%
%
%

sarole.m
Programa de simulacion del sistema
que describe el movimiento de un anillo sobre
un aro giratorio, controlador por una ley
de realimentacion no lineal la cual linealiza
en forma exacta al sistema en lazo cerrado.
Autor: Hebertt Sira-Ramirez, 1992.
Revisado: Richard Marquez, 10/04/97

% Parametros de simulacion
ti = 0;
tf = 1;
% Parametros del sistema
global a g X1e wn xi
a = 0.2;
g = 9.8;
X1e = 0.7854;
wn = 12.83;
xi = 0.707;
% Condiciones iniciales
x0 = [0.1 0];
% Simulacion
[t,x] = ode23(arole,ti,tf,x0);
% Ley de control
uc = (-2*xi*wn*x(:,2)-wn^2*(x(:,1)-X1e)+g/a*sin(x(:,1)))./...
(sin(x(:,1)).*cos(x(:,1)));
u = zeros(size(t));
for j = 1:length(t)
if uc(j)<0
u(j)=0;
else
u(j) = uc(j);
end
end
% graficas
subplot(221),plot(t,x(:,1))
title(Posicin angular del anillo sobre el aro)
xlabel(t (seg))
ylabel(x1)
subplot(222),plot(t,x(:,2))
title(Velocidad angular del anillo)
xlabel(t (seg))
ylabel(x2)
subplot(223),plot(t,u)
title(Cuadrado de la velocidad angular del aro)
xlabel(t (seg))
ylabel(u)
subplot(224),plot(t,sqrt(u))


CHAPTER 10. METODO
DE CONTROL CALCULADO

206

Posicin angular del anillo sobre el aro


1

Velocidad angular del anillo


6

0.8

x2

x1

0.6
2

0.4
0

0.2
0
0

0.5
t (seg)

-2
0

Cuadrado de la velocidad angular del aro


1500

0.5
t (seg)

Velocidad angular del aro


40
30

1000
20

500
10
0
0

0.5
t (seg)

0
0

0.5
t (seg)

Figure 10.3: Simulacion numerica del sistema aroanillo controlado


title(Velocidad angular del aro)
xlabel(t (seg))
ylabel(u)
%fin de sarole.m
% arole.m
% Sistema aro-anillo
% Programa de simulacion: sarole.m
%
function xdot=arole(t,x)
global a g X1e wn xi
uc = (-2*xi*wn*x(2)-wn^2*(x(1)-X1e)+g/a*sin(x(1)))/...
(sin(x(1))*cos(x(1)));
% solo se toman valores positivos de uc
if uc<0
u = 0;
else
u = uc;
end
% sistema dinamico
xdot = [x(2);
-g/a*sin(x(1))+0.5*u*sin(2*x(1))];
%fin de arole.m

En la Figura 10.3 se muestra la respuesta del anillo controlado, el cual se desea estabilizar
a la posicion de X = 0.7854 [rad]. Partiendo de una condicion inicial cercana a la singularidad (x1 = 0.1) se obtiene un valor del cuadrado de la velocidad angular del aro (control)
significativamente alto. El mismo resultado se obtiene a medida que la condicion inicial se
acerca al valor singular x1 = /2 = 1, 57079 . . ..
La Figura 10.4 muestra un conjunto de trayectorias de la posicion angular del anillo sobre


10.1. EL METODO
DEL CONTROL CALCULADO: EJEMPLOS

207

Posicin angular del anillo para diferentes condiciones iniciales


1.4

1.2

x1 [rad]

0.8

0.6

0.4

0.2
0

0.1

0.2

0.3

0.4

0.5
t (seg)

0.6

0.7

0.8

0.9

Figure 10.4: Posicion angular del anillo para diferentes condiciones iniciales
el aro para distintas condiciones iniciales. Presentamos a continuacion, en la Figura 10.5,
las trayectorias correspondientes a la variable de control u.

Ejemplo 10.2: Control de un manipulador rob


otico mediante el m
etodo del control
calculado
Considerese el manipulador robotico del Ejemplo 1.20, cuyas ecuaciones no lineales estan dadas
por:
x 1 = x2

B
c
x1
u
x 2 = x2 sen
+
J
J
N
J
y = x1

(10.9)

Este sistema se representa en la Figura 10.6.


Al igual que en el caso anterior este sistema solo exhibe las no linealidades en la (
unica) ecuacion
donde aparece la variable de control. Tambien, del diagrama de bloques del sistema, la presencia
de una cadena de dos integradores sugiere una estructura preponderantemente lineal que podemos
acabar de descubrir. Si definimos una entrada auxiliar v como:
v=

B
c
x2 sen
J
J

x1
N

u
J

(10.10)

El sistema transformado, asobtenido, es exactamente lineal:


x 1 = x2
x 2 = v

(10.11)


CHAPTER 10. METODO
DE CONTROL CALCULADO

208

Variable de control
600

500

400

300

200

100

0
0

0.1

0.2

0.3

0.4

0.5
t (seg)

0.6

0.7

0.8

0.9

Figure 10.5: Senal de control para diferentes condiciones iniciales


La estructura del sistema, desde esta nueva entrada es la de una cadena de dos integradores
uno a continuacion del otro, con la misma estructura del sistema de la Figura 10.2. Es evidente,
entonces, que el problema de estabilizar a un valor deseado x1d = X, la posicion del manipulador
robotico de una sola union, ha quedado reducido a estabilizar el sistema lineal representado por el
sistema transformado (10.11), mediante una ley de realimentaci
on lineal del estado. As
v = 2n x2 n2 (x1 X)

(10.12)

produce un sistema lineal, sin aproximaciones, en lazo cerrado dado por:


x 1 = x2
x 2 = 2n x2 n2 (x1 X)

(10.13)

Como veremos, las trayectorias del sistema controlado se estabilizan asint


oticamente al punto de
equilibrio deseado, dado por x2d = 0, x1d = X.
El control original u que debemos utilizar para sintetizar la entrada auxiliar v debe entonces
obtenerse a partir de la relacion:
c
B
x2 sen
J
J

x1
N

u
= 2n x2 n2 (x1 X)
J

(10.14)

es decir,

u = J 2n x2 + n2 (x1 X)

B
c
x2 sen
J
J

x1
N

(10.15)

la cual, ciertamente, constituye una ley de control basada en realimentaci


on no lineal del vector
de estado y puede, de nuevo, interpretarse como una transformacion, dependiente del estado, de

A UNA FORMA CANONICA

10.2. UNA PRIMERA GENERALIZACION


EN CASCADA209
la coordenada original en la que se describe la variable externa de control u (torque). El siguiente
programa simula el comportamiento controlado del sistema no lineal sujeto a la ley de control
linealizante (10.15).

A diferencia del caso anterior, la ley de control realimentada no lineal (10.15) se encuentra definida para todo valor posible de las variables de estado en virtud de no presentar
singularidad alguna. En estos casos decimos que la ley de control se encuentra definida
globalmente, en caso contrario decimos que su definicion solamente es local.

10.2

Una primera generalizaci


on a una forma can
onica
en cascada

Los ejemplos anteriores nos dan una idea intuitiva de como proceder a generalizar, a sistemas
de mayor dimension, el dise
no de una ley de control linealizante. Esta intuicion nos dice,
al menos en un primer intento, el sistema debera exhibir en forma natural una estructura
inherente equivalente a una cadena de integracion pura sin intervenciones de la variable de
control. Las no linealidades del sistema deberan estar circunscritas a la u
ltima ecuacion
diferencial donde, de paso, debera encontrarse la variable de control. En tales sistemas
sera posible calcular, mediante pura y simple comparacion, una ley de control que obliga al
sistema a presentar una estructura perfectamente lineal. A tal procedimiento de calculo del
control se le conoce con el nombre de inversi
on del sistema.
De las consideraciones anteriores podemos establecer que la clase de sistemas no lineales
representables en la forma:
x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = fn (x1 . . . , nn ) + ugn (x1 , . . . , xn )

(10.16)

son exactamente linealizables mediante una redefinicion de la variable de control en terminos


del estado y una entrada auxiliar externa. Esta redefinicion es incluso interpretable tanto
como un proceso de realimentacion no lineal como un proceso de transformacion de la coordenada de la variable de control.
Este sistema (10.16), tal como lo hemos vislumbrado, exhibe una cadena de integracion
pura, tiene ademas todas sus no linealidades, as como la variable de control, adscritas a la
u
ltima ecuacion diferencial. El siguiente diagrama de bloques representa el sistema anterior
y muestra claramente la estructura que hemos requerido del sistema para que califique como
un sistema linealizable en forma exacta.
Evidentemente, la definicion de la variable de entrada auxiliar v como:
v = fn (x1 . . . , nn ) + ugn (x1 , . . . , xn )

(10.17)

210

CHAPTER 10. METODO


DE CONTROL CALCULADO

produce un sistema perfectamente lineal que exhibe una estructura de cadena de integracion
pura.
x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = v

(10.18)

La variable auxiliar v puede entonces sintetizarse como una ley de control que realimenta
linealmente las variables de estado:
v = a1 x1 a2 x2 . . . an1 xn1 an xn

(10.19)

La comparacion de (10.16) con el sistema lineal n-dimensional en lazo cerrado:


x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = a1 x1 . . . an xn

(10.20)

nos lleva inmediatamente a establecer la relacion siguiente:


fn (x1 , . . . , xn ) + ugn (x1 , . . . , xn ) = v = a1 x1 a2 x2 . . . an xn

(10.21)

La ley de control no lineal que linealiza, en forma exacta, al sistema no lineal (10.16) se
obtiene entonces como:
a1 x1 + a2 x2 + . . . + an xn + fn (x1 , . . . , xn )
(10.22)
u=
gn (x1 , . . . , xn )
La linealizacion sera valida y u
til, solamente en dos circunstancias:
1) La linealizacion es valida en todo el ambiente del espacio de estado donde se cumpla
que:
gn (x1 , . . . , xn ) 6= 0

(10.23)

2) La linealizacion es u
til en la medida en que el sistema lineal en lazo cerrado sea
asintoticamente estable a cero. Puesto que la estabilidad de este sistema lineal esta determinada, univocamente, por la ubicacion de las raices del polinomio caracterstico:
p(s) = sn + an sn1 + . . . + a2 s + a1

(10.24)

supondremos, por tanto, que el polinomio p(s) tiene todas sus raices en el semiplano izquierdo
del plano complejo. Cuando esta condicion se cumpla, diremos brevemente que p(s) es
Hurwitz.

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE211
N
otese que la condici
on de singularidad que pudiera exhibir el control realimentado que hemos dise
nado para linealizar el sistema se corresponde, realmente,
con una condici
on de falta de controlabilidad. Es obvio que en aquellos lugares
del espacio de estado donde el canal de entrada al sistema se anula, es decir
gn (x) = 0, se corresponden a regiones donde el sistema se hace completamente
incontrolable.

Ejemplo 10.3:
El sistema
x 1 = x2
x 2 = x3
"

x 3 =

2Kba Kf
Ra + Rf

x2 x3 2
Lf
Lf

x3 +

2Km Kf
J

Jx3 1
Km Kf Lf

! #

(10.25)

es exactamente linealizable (localmente) mediante la ley de control no lineal:


u=

"

2Km Kf

Jx3 1
Km Kf Lf

Ra + Rf
2Kba Kf
a3 x3 a2 x2 a1 x1 +
x2 x3 2
Lf
Lf

x3

(10.26)

10.3

Linealizaci
on Exacta de Sistemas no lineales reducibles a la Forma Can
onica Controlable

Un sistema no lineal de la forma (10.16), es decir de la forma:


x 1 = x2
x 2 = x3
..
.
x n1 = xn
x n = fn (x1 . . . , nn ) + ugn (x1 , . . . , xn )
recibe el nombre de sistema no lineal en Forma Canonica Controlable o Forma Canonica
de Brownosky. Hemos visto en la seccion anterior que tales sistemas siempre admiten una
ley de control que resulta en un sistema perfectamente lineal en lazo cerrado. Es decir, el
sistema en forma canonica controlable es linealizable en forma exacta. Sin embargo, esta
clase de sistemas luce restringida a solo algunos ejemplos que pudieran incluso carecer de
significacion fsica. Debemos por lo tanto buscar la manera de extender la posibilidad de
lograr linealizaciones exactas a una clase mas amplia de sistemas dinamicos no lineales.


CHAPTER 10. METODO
DE CONTROL CALCULADO

212

Estamos interesados en determinar bajo cuales circunstancias un sistema de naturaleza


un tanto mas general puede ser transformado (o reducido) a la forma canonica controlable
anterior. Como modelo suficientemente general de un sistema no lineal deseamos tratar el
caso de sistemas descritos por ecuaciones diferenciales controladas de la forma:
x 1 = f1 (x1 , . . . , xn ) + ug1 (x1 , . . . , xn )
x 2 = f2 (x1 , . . . , xn ) + ug2 (x1 , . . . , xn )
..
.
x n1 = fn1 (x1 , . . . , xn ) + ugn1 (x1 , . . . , xn )
x n = fn (x1 . . . , xn ) + ugn (x1 , . . . , xn )

(10.27)

o en forma mas sucinta, sistemas de la forma:


x 1 = f (x) + ug(x)

(10.28)

donde:

f1 (x1 , . . . , xn )
g1 (x1 , . . . , xn )

.
..
; g(x) =

..
f (x) =
.

fn (x1 . . . , xn )
gn (x1 . . . , xn )

(10.29)

Esta clase de sistemas representada por (10.28) recibe el nombre de sistemas lineales en
el control. Las funciones vectoriales f (x) y g(x) reciben el nombre de campos vectoriales.
Supondremos de una buena vez y con el objeto de no tener que contar a cada paso el
orden de diferenciabilidad de las funciones f (x) y g(x), que tales campos vectoriales son
diferenciables, respecto de las componentes de x, un n
umero ilimitado de veces, es decir,
un n
umero infinito de veces. Diremos entonces que f (x) y g(x) son campos vectoriales
infinitamente diferenciables. Una expresion equivalente, que tambien utilizaremos con mucha
frecuencia, es la de afirmar que f (x) y g(x) son campos suaves. Representaremos esta clase
de campos vectoriales escribiendo f (x) C .
Con el objeto de ganar la intuicion necesaria que nos permita abordar este problema
en toda generalidad, comenzaremos haciendo algunos ejemplos sencillos donde podremos
transformar el sistema a la forma canonica controlable mediante simple inspeccion. De estos
ejemplos trataremos de derivar reglas generales que nos permitiran abordar cualquier caso.

Ejemplo 10.4:
Consideremos el sistema no lineal siguiente:
x 1 = x1 x2 + u
x 2 = x2 u

(10.30)

Evidentemente este sistema no se encuentra en forma canonica controlable. Nos preguntamos


entonces si existira una funcion del estado que puede adoptar el papel de primera variable de

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE213
estado, digamos z1 , y tal que su primera derivada sea independiente del control, y pueda por lo
tanto ser definida como segunda variable de estado, digamos z2 . Si ademas, la derivada respecto del
tiempo de z2 depende explcitamente del control u, entonces tenemos un sistema en forma canonica
controlable, en las nuevas variables z. En efecto, en este caso es facil ver que si definimos una nueva
variable z1 como funcion de las componentes del estado x1 y x2 de la manera siguiente:
z1 = x1 + x2

(10.31)

entonces, utilizando las ecuaciones del sistema, se cumple que:


z1 = x 1 + x 2 = x1 x2 + x2

(10.32)

y por tanto, la primera derivada temporal de esta funcion z1 resulta ser independiente del control.
Si ahora bautizamos a esta expresion de la derivada de z1 como una nueva variable de estado z2 , y
tomamos de nuevo la derivada respecto del tiempo, obtenemos:
z2 = x1 x2 + x2 ;
z2 = x 1 x2 + (x1 + 1)x 2 = (x1 x2 + u)x2 + (x1 + 1)(x2 u)
= x1 x22 + x1 x2 + x2 + u(x2 x1 1)

(10.33)

La derivada de esta nueva variable de estado z2 depende del control a traves de las variables
originales (x), cuyas expresiones podemos buscar en terminos de las nuevas variables de estado z,
invirtiendo el siguiente par de ecuaciones algebraicas:
z1 = x1 + x2
z2 = x1 x2 + x2

(10.34)

Este par de ecuaciones algebraicas no lineales constituyen una funcion vectorial de las variables
x. Su matriz Jacobiana esta dada por:
z
=
x

"

z1
x1
z2
x1

z1
x2
z2
x2

"

1
1
x2 (1 + x1 )

z
= 1 + x1 x2
; Det
x

La matriz Jacobiana de esta funcion vectorial es singular en el conjunto de puntos que satisfacen:
1 + x1 x2 = 0
De donde obtenemos como posibles soluciones locales de la inversi
on:

x2 =

(1 + z1 )2 4z2
2
p
(1 + z1 ) + (1 + z1 )2 4z2
2

x1 = z1

(1 + z1 ) +

(10.35)

x2 =

(1 + z1 )2 4z2
2
p
(1 + z1 ) (1 + z1 )2 4z2
2

x1 = z1

(1 + z1 )

(10.36)


CHAPTER 10. METODO
DE CONTROL CALCULADO

214

Adoptemos como solucion valida la primera de las expresiones anteriores.


Es facil constatar que en nuevas variables de estado z tenemos como ecuacion diferencial del
sistema transformado:
z1 = z2
"

z2 =

2 + z1
"

(1 + z1 )

(1 + z1 )

(1 + z1 )2 4z2
2
#

!# "

(1 + z1 )

(1 + z1 )2 4z2

q
(1 + z1 )2 4z2
+ u (1 + 2z1 ) + (1 + z1 )2 4z2 1
2

(10.37)

un sistema en forma canonica controlable.

Podemos resumir nuestra experiencia en postular las siguientes condiciones para que
exista la posibilidad de linealizar exactamente un sistema no lineal de dimension n.
1) Debemos poder hallar una funcion h(x) de las variables de estado cuyas n
1 primeras derivadas, respecto del tiempo, sean funcionalmente independientes
entre s e independientes de la variable de control. Esto es equivalente a que el
gradiente de h(x) y el de todas sus derivadas hasta la n1esima (inclusive) deben
ser linealmente independientes.
2) La n-esima derivada de h(x), respecto del tiempo, debe depender explcitamente
de la variable de control.
La u
ltima condicion es clara, por cuanto expresando el sistema dinamico en las nuevas
variables, todas las nolinealidades de las ecuaciones dinamicas, as como la dependencia del
control, deben quedar relegadas a la u
ltima ecuacion, como ha sido el caso en todos los
ejemplos que hemos visto.
La primera condicion posiblemente requiere de alguna explicacion adicional, sobre todo
en lo referente a la independencia funcional de las derivadas sucesivas de la funcion candidata
h(x).
En efecto, un sencillo ejemplo servira para convencernos de que esta condicion es necesaria:

Ejemplo 10.5:
Consideremos el sistema:
x 1 = x2
x 2 = x22
x 3 = u

(10.38)

Si adoptamos h(x) = x1 como funcion candidata a jugar el papel de primera variable de estado
z1 en el sistema transformado vemos que su primera derivada, x2 , es funcionalmente independiente

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE215
de x1 . Por lo tanto, x2 calificara como segunda variable de estado. En efecto la transformacion
parcial:
z1 = x1
z2 = x2

(10.39)

tiene por matriz Jacobiana a:


"

(z1 , z2 )
=
(x1 , x2 , x3 )

1 0 0
0 1 0

la cual es de rango 2, lo cual dice que las dos primeras variables escogidas son funcionalmente
independientes. Es decir, la funcion h(x) = x1 y su primera derivada x2 , son funcionalmente
independientes. Sin embargo, la tercera derivada de la funcion h(x) resulta ser:
z3 = x22

(10.40)

y ahora, en este caso, la matriz Jacobiana es:

1 0 0
(z1 , z2 , z3 )

= 0 1 0
(x1 , x2 , x3 )
0 2x2 0

(10.41)

cuyo rango sigue siendo 2. En consecuencia la funcion h(x) = x1 no nos sirve para generar una
transformacion invertible en el espacio de estado (tridimensional) del sistema en cuestion. Parte
del problema de la falta de independencia funcional estriba en que, en este caso, podemos tomar
infinitas derivadas de h(x) que el control u no habra de aparecer nunca en forma explcita en alguna
de las posibles derivadas de orden superior. En efecto, si enlistamos algunas de las derivadas de
h(x) tenemos:
z1 = x1 ; z2 = x 1 = x2 ;
z3 = z2 = x
1 = x22 ;
(3)

z4 = z3 = z2 = x1 = 2x32
(3)

(4)

(4)

z5 = z4 = z3 = z2 = z1 = x1 = 6x42 . . .

(10.42)

y, como es facil ver, nunca podra aparecer el control u en las derivadas.


Veamos, sin embargo, que al perturbar levemente el sistema dado (10.38) de la manera siguiente:
x 1 = x2
x 2 = x22 + x3
x 3 = u

(10.43)

tenemos ahora s, la independencia funcional de h(x) y sus derivadas, que requerimos. En efecto:
z1 = x1 ; z2 = x2 ; z3 = x22 + x3

1 0 0
(z1 , z2 , z3 )

= 0 1 0
(x1 , x2 , x3 )
0 2x2

(10.44)


CHAPTER 10. METODO
DE CONTROL CALCULADO

216

Como es facil verificar, el rango de la matriz Jacobiana es ahora 3, para todo 6= 0. La


transformacion es por lo tanto invertible, como podemos constatar sin mayores esfuerzos:
x1 = z1 ; x2 = z2 ; x3 =

z3 z22

(10.45)

El sistema transformado exhibe, sin lugar a dudas, una estructura canonica controlable:
z1 = z2
z2 = z3
z3 = 2z23 + 2z2 (z3 z22 ) + u

(10.46)

Para el sistema modificado (10.43) la funcion h(x) = x1 cumple, evidentemente, las condiciones
que hemos establecido anteriormente.
Con el objeto de completar el proceso de linealizacion, definimos ahora el control transformado
v como:
v = 2z23 + 2z2 (z3 z22 ) + u

(10.47)

lo cual ciertamente representa una transformacion de la variable original de control u, dependiente


del estado transformado.
El sistema linealizado en forma exacta, expresado en nuevas coordenadas del estado y del control
es el siguiente:
z1 = z2
z2 = z3
z3 = v

(10.48)

Estabilizar a cero este sistema lineal se reduce a un problema clasico de asignacion de polos
mediante realimentacion lineal del vector de estado.
Notese adicionalmente que lo que ha logrado la transformacion requerida, a traves de h(x) y
sus derivadas, no es solamente el haber perturbado el sistema original, sino haberlo perturbado
apropiadamente. Es facil ver que el siguiente sistema perturbado
x 1 = x2
x 2 = x22 + x1
x 3 = u

(10.49)

no es linealizable en forma exacta a traves de la funcion h(x) = x1 , por cuanto la matriz Jacobiana de
la transformacion resulta ser de nuevo singular y podramos, igualmente, tomar infinitas derivadas
de h(x) sin que aparezca el control u explcitamente en alguna derivada de orden superior.
z1 = x1 ; z2 = x2 ; z3 = x22 + x1

z
x

1 0 0
z

= 0 1 0 Det
=0
x
2x2 0

(10.50)

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE217

Los ejemplos anteriores nos ayudan a formular en forma mas precisa las condiciones de
existencia de una tranformacion del vector de estado que torna al sistema original en un
sistema en forma canonica controlable.
La condici
on necesaria y suficiente para que exista una transformaci
on del vector
de estado que lleve a un sistema no lineal de la forma (10.28) es que exista una
funci
on escalar diferenciable h(x) tal que:
1)

rango

h(x)
x

..
.

=n

(10.51)

h(n1) (x)
x

2)
h
h
h(n1) (x)
=
= ... =
=0
u
u
u

(10.52)

h(n) (x, u)
6= 0
u

(10.53)

3)

Haremos algunos ejemplos que ilustren la posibilidad de encontrar tales transformaciones


de estado del sistema que lo lleven a la forma canonica controlable.

Ejemplo 10.6: Motor serie de corriente continua


El siguiente grafico representa el circuito de un motor de corriente continua en conexion serie
de su circuito de armadura y su circuito de alimentaci
on del campo.
Las ecuaciones que describen este sistema no lineal estan dadas por:
x 1 = x2
KmKf 2
x 2 =
x3
J
Kba Kf
Ra + Rf
1
x 3 =
x2 x3
x3 +
u
Lf
Lf
Lf

(10.54)

donde:
x1 = = angulo del eje del motor
x2 = = velocidad angular del eje del motor
x3 = ia = if = corriente comun que f luye por los circuitos de armadura y del campo
u = VT

(10.55)


CHAPTER 10. METODO
DE CONTROL CALCULADO

218

Propongamos la funcion h(x) = x1 como funcion generadora de la transformacion linealizante


de coordenadas del espacio de estado.
La transformacion de coordenadas estara entonces dada por:
z1 = h(x) = x1

z2 = h(x)
= x2
Km Kf 2

z3 = h(x)
=
x3
J

(10.56)

La primera de las condiciones dada por (10.51) se escribe como:


z
x

Det

z
x

h(x)
x
h(x)

x

h(x)
x

1 0

= 0 1

0 0

0
0
2Km Kf x3
J

2Km Kf x3
J

(10.57)

Lo cual indica que la transformacion dada por h(x) y sus dos primeras derivadas tiene rango
completo en todas partes del espacio de coordenadas x, excepto en el plano representado por x3 = 0.
En otras palabras, la transformacion de coordenadas es solamente de caracter local y su validez
deja de tener efecto cuando por alguna razon el sistema produce valores de estado x que satisfacen
esta restriccion, o cuando las trayectorias del sistema se acercan asint
oticamente a este valor. La
condicion x3 = 0 se corresponde con un valor nulo de la corriente com
un que circula por los circuitos
de armadura y de campo. En el resto del espacio de estado la transformacion (10.56) es invertible.
La transformacion (10.56) tambien satisface la segunda condicion dada por (10.52). Finalmente,
la tercera derivada de h(x) esta dada por:

(3)

(x, u) =

Kba Kf
Ra + Rf
2Km Kf
1
x3
x2 x3
x3 +
u
J
Lf
Lf
Lf

2Km Kf2 Kba


2Km Kf (Ra + Rf ) 2 2Km Kf
x2 x23
x3 +
x3 u
JLf
JLf
JLf

(10.58)

de donde:
2Km Kf
h(3) (x, u)
=
x3
u
JLf

(10.59)

entonces la tercera condicion (10.53), se traduce, no sorprendentemente, en que la variable x3 debe


satisfacer la condicion: x3 6= 0.
La inversa de la transformacion (10.56) tiene entonces solamente caracter local y se obtiene por
inspeccion. Esta resulta ser para x3 > 0:
x1 = z1
x2 = z2

x3 = +

Jz3
Km Kf

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE219
la cual es valida solo en la region z3 > 0 del espacio descrito por las nuevas coordenadas. Como
puede inferirse de (10.56), la transformacion de coordenadas no esta definida en la region x3 < 0,
es decir, su validez es solo local.
El motor serie de corriente continua, transformado a nuevas coordenadas, se describe entonces
localmente mediante las ecuaciones diferenciales:
z1 = z2
z2 = z3
"

z3 =

Ra + Rf
2Kba Kf

z2 z3 2
Lf
Lf

z3 +

2Km Kf
JLf

JZ3
Km Kf

! #

(10.60)

las cuales evidentemente se encuentran en forma canonica controlable. La linealizacion exacta de


(10.60) se puede llevar a cabo entonces en forma inmediata.
Utilizamos como control externo auxiliar la variable v, la cual definimos de la manera siguiente:
"

Ra + Rf
2Kba Kf
v=
z2 z3 2
Lf
Lf

z3 +

2Km Kf
JLf

JZ3
Km Kf

! #

(10.61)

lo cual al substituirse en (10.60), nos transforma el sistema en una cadena de integraci


on pura:
z1 = z2
z2 = z3
z3 = v

(10.62)

Introducimos la siguiente realimentaci


on lineal para la regulacion asint
oticamente estable del
sistema transformado (10.62):
v = n2 z1 (2n + n2 )z2 ( + 2n )z3

(10.63)

El sistema en lazo cerrado (10.62) y (10.63) tiene entonces por polinomio caracterstico al
siguiente polinomio de raices estables (o simplemente polinomio de Hurwitz);
p(s) = (s + )(s2 + 2n s + n2 )
= s3 + ( + 2n )s2 + (2n + n2 )s + n2

(10.64)

El controlador no lineal para el sistema transformado (10.60) esta dado entonces a partir de la
siguiente relacion, escrita en terminos de variables transformadas y obtenida directamente de las
ecuaciones (10.61) y (10.63):
n2 z1 (2n + n2 )z2 ( + 2n )z3
"

2Kba Kf
Ra + Rf

z2 z3 2
Lf
Lf

z3 +

2Km Kf
JLf

JZ3
Km Kf

! #

(10.65)

Resolviendo para u tenemos:


u =

JLf
2Km Kf

Jx3
Km Kf

h
n2 z1 + (2n + n2 )z2 + ( + 2n )z3

2Kba Kf
Ra + Rf
z2 z3 2
Lf
Lf

z3

(10.66)


CHAPTER 10. METODO
DE CONTROL CALCULADO

220

Usando (10.56) en (10.66) obtenemos en variables de estado originales la expresion del controlador dise
nado mediante linealizacion exacta:
JLf
u=
(2Km Kf x3 )

n2 x1

"

+ (2n +

2Kba Km Kf2
x2 x23

JLf

n2 )x2

Ra + Rf
+ ( + 2n ) 2
Lf

!#

Km Kf 2
x3
J
(10.67)

N
otese sin embargo que este controlador presenta un serio problema para su instrumentaci
on en el sistema (10.54), o incluso para realizar sobre su base de cualquier
simulaci
on digital. El problema consiste en que el punto de equilibrio del sistema
(10.54) necesariamente implica que la corriente com
un del circuito de campo y armadura, x3 , tiene que hacerse cero. Pero tal valor de la corriente hace singular la
acci
on de control representada por (10.67).
El problema de regulaci
on del motor de corriente continua en conexi
on serie no puede
resolverse entonces por linealizaci
on exacta.

Ejemplo 10.7: Modelo promedio de un convertidor de corriente continua tipo Boost


Considerese el modelo promedio de un convertido tipo Boost, ya introducido anteriormente en
el captulo 3.
x 1 = 0 x2 + u0 x2 + b
x 2 = 0 x1 1 x2 u0 x1

(10.68)

Tratemos de buscar una transformacion invertible, generada por una funcion escalar h(x), que
satisfaga las tres condiciones (10.51) -(10.53), dadas anteriormente, y que nos transforme el modelo
(10.68) a la forma canonica controlable.
Sea z1 = h(x) una funcion escalar diferenciable. La derivada de esta funcion, con respecto del
tiempo, se escribe usando (10.68) de la manera siguiente:
"

z1

h
i
h(x)
0 x2 + u0 x2 + b
h
h
x = x
=
x2
1
0 x1 1 x2 u0 x1
x
h
h
=
[0 x2 + u0 x2 + b] +
[0 x1 1 x2 u0 x1 ]
x
x2

1
h
h
h
h
[0 x2 + b] +
[0 x1 1 x2 ] + u0
x2
x1
=
x1
x2
x1
x2

(10.69)

Puesto que la primera derivada de h(x) no debe depender de u, de acuerdo a (10.52), h(x) debe
satisfacer:
h
h
x2
x1 = 0
x1
x2

(10.70)

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE221
lo cual constituye una ecuacion en derivadas parciales del tipo lineal para la funcion desconocida
h(x).
Una solucion general de (10.70) esta dada por:
z1 = h(x) =

i
1h 2
x1 + x22 + c
2

(10.71)

donde c es una constante que debemos ajustar para que, por ejemplo, cuando las variables de estado
x1 y x2 adoptan sus valores de equilibrio X1 (U ) y X2 (U ), inducidos por una relacion de trabajo
constante u = U , entonces la nueva variable z1 adopte, por ejemplo, el valor de cero en tal punto
de equilibrio.
Puesto que:
X1 (U ) =

b1
b
; X2 (U ) =
0 (1 U )
02 (1 U )2

(10.72)

entonces:
"

i 1
1h 2
b2
2
z1 = h(x) =
1+ 2 1
x1 + x22
2
2
2
2 0 (1 U )
0 (1 U )2

(10.73)

La derivada de z1 resulta ser, despues de utilizar (10.73):

h
h
[0 x2 + b] +
[0 x1 1 x2 ]
x1
x2
= bx1 1 x22

z1 =

(10.74)

es decir:
z2 = bx1 1 x22

(10.75)

Notese que el valor de equilibrio de z2 resulta ser tambien cero, como lo habra de demandar el
modelo transformado en forma canonica controlable. Comprobamos finalmente que la derivada de
esta segunda variable de estado s depende de la variable de control u, tal como se establece en la
condicion (10.53). En efecto:
z2 = bx 1 21 x2 x 2
= b(0 x2 + u0 x2 + b) 21 x2 (0 x1 1 x2 u0 x1 )
= b2 + 212 x22 (b + 21 x1 )0 x2 + u(b + 21 x1 )0 x2

(10.76)

Siempre que la cantidad (b + 21 x1 )x2 sea diferente de cero, la transformacion generada por
h(x) es una transformacion linealizante que cumple con las condiciones (10.51)-(10.53).
La trasformacion de coordenadas de estado esta dada entonces por:
"

z1 =

i 1
1h 2
b2
2
x1 + x22
1+ 2 1
2
2
2
2 0 (1 U )
0 (1 U )2

z2 = bx1 1 x22

(10.77)


CHAPTER 10. METODO
DE CONTROL CALCULADO

222

La matriz Jacobiana de esta transformacion, y su determinante asociado, estan dados por:


z
=
x

"

h
x
h
x

"

x1
x2
b 21 x2

z
; Det
= (b + 21 x1 )x2
x

(10.78)

La no singularidad de esta matriz Jacobiana coincide, como es claro, con la condicion que
hemos encontrado anteriormente, al exigir en (10.76) que la segunda derivada de h(x) dependa
explcitamente de la variable de control u.
La primera variable de estado, obtenida de la transformaci
on (10.77), es interpretable
en terminos de la energa promedio incremental, medida sobre la base de la energa
consumida en mantener la condici
on de equilibrio promedio. La segunda variable de la
transformaci
on representa la variaci
on temporal del tal energa, es decir, la potencia
incremental promedio consumida por el circuito.
La transformacion (10.77) es localmente invertible en todos aquellos puntos que se encuentren
alejados de la condicion de singularidad de la matriz Jacobiana calculada en (10.78). Los valores
de x1 y x2 , como funcion de z1 y z2 , se obtiene a partir de las ecuaciones siguientes:
(

x21

x2 =
Es decir:

"

z2
b2
b
12
+ 2
+ x1 2z1 +
1
+
1
1 0 (1 U )2
02 (1 U )2

v
u

=0

bx1 z2
1

u b
b
x1 =
+t
21
21

(10.79)
(

"

b2
z2
12
+ 2
+ 2z1 +
1
+
1 0 (1 U )2
02 (1 U )2

v v
u u
(

u u
u b t b 2
z2
+
x2 = t
+ 2z1 +

#)

21

"

b2
12
1
+
02 (1 U )2
02 (1 U )2

#)

#)

b2
1
z(10.80)
2
2
1
21

Notese que hemos tomado la raz positiva para x1 , de la solucion de la primera ecuacion en
(10.79). La raz negativa carece de significado fsico, en virtud de que, de acuerdo a (10.72), las
condiciones de equilibrio (es decir, cuando z1 = z2 = 0), la variable x1 debe ser positiva pues b
y 1 son constantes positivas. Verificamos que efectivamente en equilibrio las expresiones que se
obtienen de (10.80) coinciden plenamente con (10.72).
La forma canonica controlable del sistema en nuevas coordenadas es:
z1 = z2
z2

v
(
u
u b 2
z2
t
+ 2z1 +
+
= 21 z2 + 21 b

21

v
(
u
u b 2
z2
21 0 (1 u)t
+ 2z1 +
+

"

b2
12
1
+
02 (1 U )2
02 (1 U )2

21

v v
u u
(

u u
u b t b 2
z2
t
+ 2z1 +
+

21

b2
02 (1 U )2
"

"

1+

12

02 (1 U )2

b2
12
1
+
02 (1 U )2
02 (1 U )2

#)

#)

#)

b2
1
z2
2
1
21

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE223
Ejercicio:Terminar el dise
no del controlador no lineal por Linealizacion Exacta.

Ejemplo 10.8: Orientaci


on de un artefacto espacial
Considerese el sistema no lineal que describe la orientaci
on de un artefacto espacial, tal como
fue descrito en detalle en el captulo 2. El sistema se encuentra descrito por:
x 1 = x2
FL
x 2 =
sin x3
J
x 3 = Ru

(10.81)

El punto de equilibrio fsicamente significativo del sistema esta dado por:


x1 = arbitrario = X; x2 = 0; x3 = 0; u = 0

(10.82)

Es facil verificar que la funcion del error de posicionamiento, dada por h(x) = x1 X califica
como funcion generadora de una transformacion linealizante. Haciendo:
FL
sin x3
J
esta transformacion es invertible, al menos localmente, pues:
z1 = x1 X; z2 = x2 ; z3 =

z
=
x

h(x)
x

h(x)
x

h(x)
x

1 0

= 0 1

0 0

(10.83)

0
z
FL

0
=
cos x3
; Det
x
J
FL
cos
x
3
J

(10.84)

El determinante de la matriz Jacobiana de la transformacion indica que el rango de validez de


la transformacion esta dado por /2 < x3 < /2, lo cual cubre todos los valores practicos del
angulo de posicionamiento de la tobera medido desde el eje principal de la nave. La transformacion
inversa (en aquellos lugares donde existe) esta dada simplemente por:

x1 = z1 + X; x2 = z2 ; x3 = sin

Jz3
FL

(10.85)

El sistema transformado esta dado por:


z1 = z2
z2 = z3
z3 =

F LR
1
J

Jz3
FL

(10.86)

El control linealizante puede ser obtenido directamente en coordenadas transformadas como:

1 2 3 z1 (1 2 + 1 3 + 2 3 )z2 (1 + 2 + 3 )z3

!
u=J
r

Jz3

F LR

FL

(10.87)


CHAPTER 10. METODO
DE CONTROL CALCULADO

224

Lo cual induce en el sistema lineal en lazo cerrado un polinomio caracterstico dado por:
p(s) = (s + 1 )(s + 2 )(s + 3 )
= s3 + (1 + 2 + 3 )s2 + (1 2 + 1 3 + 2 3 )s + 1 2 3

(10.88)

En coordenadas originales el controlador resulta ser:


"

1 2 3 (x1 X) (1 2 + 1 3 + 2 3 )x2 (1 + 2 + 3 ) FJL sin x3


u=J
F LR cos x3

(10.89)

El siguiente programa simula la respuesta del sistema controlado por la ley de realimentaci
on
no lineal que logra la linealizacion perfecta del sistema.

Las condiciones (10.51)-(10.53) sufren el defecto de no ser condiciones explcitas en


terminos de los campos vectoriales f (x) y g(x) que definen la ecuacion diferencial controlada
del sistema dada por (10.28). Nos dedicaremos ahora a buscar una forma diferente pero mas
significativa de esas condiciones.
En el proximo captulo presentaremos algunas de las herramientas matematicas, provenientes de la Geometra Diferencial, necesarias para transformar de forma sistematica un
sistema no lineal en un sistema lineal controlable. Introduciremos algunos conceptos tales
como campos vectoriales, corchetes de Lie, etc., con su respectiva notacion matematica. A
continuacion, en el captulo 12 aplicaremos estas herramientas en el dise
no de controladores
no lineales.

EXACTA DE SISTEMAS EN FORMA CANONICA

10.3. LINEALIZACION
CONTROLABLE225

Figure 10.6: Diagrama de bloques del manipulador robotico de una sola union

226

CHAPTER 10. METODO


DE CONTROL CALCULADO

Chapter 11
Nociones b
asicas de geometra
diferencial

A principios de los anos ochenta surgio un enfoque teorico que permitio abrazar el problema de
control no lineal con gran elegancia, en vasta generalidad y con suficiente profundidad, a la par
que logro una extension, dentro del area no lineal, de conceptos bien conocidos en el area de los
sistemas lineales de control tales como la nocion de grado relativo. Este enfoque, propuesta por el
profesor A. Isidori y sus colaboradores, esta basado en la utilizacion de conceptos basicos nacidos
de la Geometra Diferencial para el analisis y el diseno de sistemas de control. Desde su concepcion, un sin numero de artculos han sido escritos que tratan tanto los aspectos teoricos como
las multiples aplicaciones de estas tecnicas a situaciones reales. Existen en la actualidad diversos
textos dedicados a la explicacion detallada de estos topicos, vease, por ejemplo, (Isidori, 1995; Nijmeijer and van der Schaft, 1990; Marino and Tomei, 1995; Slotine and Li, 1991; Vidyasagar,
1993).

227

228

11.1

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

Campos Vectoriales, Derivadas de Lie, Corchetes


de Lie, El Teorema de Frobenius

Un campo vectorial arbitrario f (x), suave (esto es, perteneciente a C o equivalentemente


f (x) es infinitamente diferenciable respecto al argumento x) representa, en cada punto del
espacio n-dimensional de coordenadas x, una direccion unvocamente especificada por el
valor de sus componentes en cada punto.
As, por ejemplo, el campo vectorial constante definido en IR2 por:
"

f (x) =

1
0

representa un vector que en cada punto tiene componente 1 en la direccion x1 y componente


0 en la direccion x2 .
El campo f (x) definido mediante: f (x) = x tiene entonces la representacion siguiente en
2
IR [FIGURA]
El campo vectorial definido en IR2 mediante:
"

f (x) =

x1
x2

se representa como en la figura siguiente: [FIGURA]


Notese la diferencia de este campo vectorial con otro, un tanto similar pero dado por:
"

f (x) =

x1
x2

cuya representacion es: [FIGURA]


Una ecuacion diferencial autonoma, definida en IRn , tambien involucra un campo vectorial
suave en su definicion:
x = f (x)

(11.1)

La interpretacion de una ecuacion diferencial tal como esta, es inmediata si pensamos que
la rata de variacion de las componentes de las coordenadas de IRn estan dadas en cada punto
de x, por el campo vectorial f (x). Es decir, la velocidad de variacion de las coordenadas del
espacio en cada punto, evaluada a medida que recorremos la solucion (11.1), es representable
por el vector f (x) que indica la direccion en la que instantaneamente tiende a moverse la
solucion de la ecuacion diferencial. El campo vectorial f (x) representa entonces, en cada
punto x del espacio, un vector tangente a la trayectoria solucion de la ecuacion (11.1).
Por ejemplo, las trayectorias de la ecuacion diferencial:
"

x = f (x) =

x1
x2

(11.2)

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


estan representadas por crculos que tienen al origen como centro com
un, ver figura [SINNUMERO]. Es facil ver que el campo vectorial f (x), que define la ecuacion diferencial (11.2),
es tangente en cada punto x del plano a uno de esos crculos concentricos que representan la
solucion de (11.2) que pasa precisamente por ese punto. En efecto, las soluciones de (11.2)
estan constituidas por las curvas de nivel de la funcion escalar h(x) dada por:
h(x) = x21 + x22

(11.3)

[FIGURA]
El gradiente de h(x) es un vector que representa la direccion de maximo creciemiento
de la funcion misma dentro del plano donde toma valores su argumento. Veamos que tanto
crece (o decrece) esta funcion escalar con respecto a la direccion dada, en cada punto del
plano, por la velocidad de variacion de la trayectoria solucion de (11.2). Es decir, veamos
que rata de variacion exhibe h(x) en la direccion del campo vectorial f (x) que define las
soluciones de (11.2). Evidentemente esta rata de variacion esta dada por la derivada de h(x)
con respecto al tiempo, evaluada a lo largo de la solucion de (11.2). El calculo se dispone de
la manera siguiente:
d
h(x) dx
h(x)
h(x) =
=
x
dt
x dt
x
"
#
h(x)
x2
f (x) = [ 2x1 2x2 ]
= 2x1 x2 2x1 x2 = 0
=
x1
x

(11.4)

Las trayectorias, representadas por los crculos concentricos, resultan entonces tangentes
al campo vectorial que las genera a traves de la ecuacion diferencial.
Esta propiedad de los campos vectoriales asociados con los miembros derechos de ecuaciones diferenciales vectoriales de primer orden, ha dado origen de hecho a un metodo de
graficacion de las soluciones de ecuaciones diferenciales de este tipo, cuando sus soluciones se
definen en IR2 . Existen algunos paquetes de simulacion que exhiben las soluciones de ecuaciones diferenciales de segundo orden recurriendo, primordialmente al campo de direcciones
asociado a la ecuacion y procediendo luego a hallar el grafico de la trayectoria mediante
interpolacion de estas direcciones a base de trayectorias seccionalmente lineales que se
mantienen aproximadamente tangentes al campo de direcciones. La siguiente figura muestra
un ejemplo de este tipo, para el sistema dado por:
"

x =

x 1
x 2

"

= f (x) =

x2
x1 1.5x2

(11.5)

Tal como vimos en uno de los ejemplos anteriores, los campos vectoriales asociados a
ecuaciones diferenciales permiten calcular de manera conceptualmente sencilla, la rata de
variacion de funciones escalares a lo largo de soluciones de la ecuacion diferencial asociada
al campo vectorial. As vimos, por ejemplo, que la variacion de la funcion h(x) = x21 + x22
a lo largo de las soluciones de la ecuacion (11.2) es nula por cuanto el campo vectorial
f (x) resulto ser tangente a las curvas de nivel de esta funcion. Sin embargo, otra funcion

230

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

cualquiera puede exhibir una rata de variacion diferente en cada punto. Por ejemplo, la
funcion h(x) = x21 x22 tiene una velocidad de variacion a lo largo de las soluciones de (11.2)
dada por:
d
h(x)
h(x) =
f (x) = [ 2x1 2x2 ]
dt
x

"

x2
x1

= 2x1 x2 + 2x1 x2 = 4x1 x2

(11.6)

es decir, la velocidad de variacion de h(x) es una funci


on de las coordenadas del espacio.
En cada punto del plano habra, por lo tanto, una rata de variacion de h(x) diferente con
respecto a la solucion de la ecuacion diferencial que pasa por ese punto. Esta funcion depende
entonces de la direccion del campo vectorial, asociado a (11.2), en ese punto con respecto a
la direccion del gradiente de la funcion h(x). Esta rata de variacion es nula cuando el campo
vectorial y el gradiente son ortogonales. Notese que a lo largo de los ejes coordenados x1 y
x2 del plano IR2 , la derivada dh(x)/dt, de h(x) es cero, pues una de las coordenadas basicas
es cero. No es coincidencia, entonces, que a lo largo de los ejes coordenados, la direccion
del campo vectorial f (x), sea tambien ortogonal a tales ejes como se ve en las figuras ya
presentadas.
La discusion anterior se facilita enormemente si introducimos el concepto de derivada
direccional de una funcion escalar con respecto a un campo vectorial.
Sea h(x) una funcion escalar suave, es decir que admite infinitas diferenciaciones respecto
de las componentes de x. Sea f (x) un campo vectorial tambien suave. Definimos la derivada
direccional de la funcion escalar h(x) con respecto al campo vectorial f (x), y la designamos
mediante Lf h(x) de la manera siguiente:
Lf h(x) =

h(x)

f (x) = h(x)
x

(11.7)

Es de hacer resaltar que la derivada direccional, tambien llamada derivada de Lie, Lf h(x),
sigue siendo una funcion escalar de x. La derivada de h(x) con respecto a f (x) mide entonces,
en cada punto x del espacio, la velocidad de variacion instantanea, de la funcion escalar h(x)
con respecto de la solucion de la ecuacion diferencial dx/dt = f (x) que pasa por ese punto
x.
La notacion Lf h(x) facilita mucho los calculos reiterados de derivadas direccionales. As
por ejemplo, si quisieramos calcular ahora la rata de variacion de la funcion escalar Lf h(x)
con respecto a la misma direccion f (x), podramos simplificar notablemente la expresion del
resultado haciendo:
Lf h(x)
d

[Lf h(x)] =
f (x) = Lf (Lf h(x)) = h(x)
dt
x
lo cual designaremos sencillamente, mediante:
L2f h(x) = Lf (Lf h(x))

(11.8)

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


De otra forma habramos tenido la siguiente expresion, mucho mas complicada:

h(x)

h(x)
=
=
x
x

h(x)

f (x) f (x) = f T (x)


x
x

h
x

!T
("
#"
#)
h(x)
f
(x)
f (x) +
f (x)
(11.9)

Una nueva evaluacion de la derivada direccional respecto de la direccional resulta simple


con la notacion adoptada y un verdadero enrredo de cualquier otra forma:
h(3) (x) = L3f h(x)

(11.10)

En general, podremos designar las derivadas direccionales reiteradas de una funcion escalar h(x) con respecto a un campo vectorial f (x) como:

Lnf h(x) =

Ln1
h (x)
f
x

f (x) = Lf Ln1 h (x) = h(n) (x)


f

(11.11)

Si quisieramos calcular la derivada direccional de una funcion escalar h(x) respecto del
campo vectorial f (x), y luego evaluar la derivada direccional de la funcion escalar resultante,
Lf h(x), respecto de otro campo vectorial g(x), tendramos simplemente:
"

(Lf h(x)) g(x) = [Lg (Lf h)](x) = Lg Lf h(x)


x

(11.12)

lo cual es una representacion convenientemente compacta, en relacion a la complejidad operacional que realmente representa.
Es preciso apuntar que en general tenemos que:
Lg Lf h(x) 6= Lf Lg h(x)

(11.13)

En el caso de sistemas no lineales de la forma (10.28), la derivada direccional de h(x)


respecto de las soluciones de tal ecuacion, vendran parametrizadas en funcion del valor de
la varible de control u. En efecto, consideremos la rata de variacion de la funcion escalar
h(x) en relacion a las soluciones de la ecuacion controlada:
x = f (x) + ug(x)

(11.14)

esta rata estara dada por:


h(x)
h(x)

h(x)
=
x =
[f (x) + ug(x)] =
x
x
= Lf h(x) + uLg h(x)

h(x)
h(x)
f (x) + u
g(x)
x
x
(11.15)

Podemos entonces adoptar con cierta libertad la regla general:


Lf +ug h(x) = Lf h(x) + uLg h(x)

(11.16)

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

232

La reiteracion del calculo anterior sobre h(x) nos conducira a:

h(x)
= Lf +ug [h(x)]
= Lf +ug [Lf h(x) + uLg h(x)]
= Lf [Lf h(x) + uLg h(x)] + uLg [Lf h(x) + uLg h(x)]
= L2f h(x) + uLf Lg h(x) + uLg Lf h(x) + u2 L2g h(x)

(11.17)

De los calculos anteriores se desprende que en terminos de las derivadas de Lie, o derivadas
direccionales, es relativamente sencillo establecer las derivadas temporales, de orden superior,
de funciones escalares h(x), evaluadas a lo largo de soluciones de ecuaciones diferenciales,
controladas o no. Esto permitira, mas adelante, reemplazar las derivadas con respecto al
tiempo que aparecen en la condicion (10.51), por condiciones que involucran derivadas direccionales reiteradas respecto de los campos vectoriales f (x) y g(x). Antes de hacer esto
daremos algunos ejemplos de calculo de derivadas de Lie e introduciremos otro concepto
fundamental, cual es el del corchete de Lie de dos campos vectoriales suaves.

Ejemplo 11.1:
Considerese el campo vectorial controlado:
"

f (x) + ug(x) =

x2
Lg sin x1

#
k
M x2

"

+u

(11.18)

1
u
M L2

y la funcion escalar dada por h(x) = x1 . La derivada de Lie de h(x) con respecto al campo vectorial
controlado anterior estara dado por:
("

h(x)
= Lf +ug h(x) = [1 0]

x2
Lg sin x1

#
k
M x2

"

+u

#)

1
M L2

= x2

(11.19)

que como vemos es independiente de u. Es decir, en este caso particular tenemos (por ser Lg h(x) =
0):

h(x)
= Lf +ug h(x) = Lf h(x) = x2

(11.20)

Si reiteramos el caculo de la derivada de Lie obtenemos:

h(x)
= Lf +ug (Lf +ug h)(x) = Lf +ug Lf h(x) = L2f h(x) + uLg Lf h(x)
"

= Lf x2 + uLg x2 = [0 1]
=

x2
Lg sin x1

g
k
1
sin x1
x2 +
u
L
M
M L2

k
M x2

"

+ u[0 1]

1
M L2

(11.21)

que s depende globalmente del valor de u.

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


Ejemplo 11.2:
Consideremos el campo vectorial del tipo lineal siguiente:
f (x) + ug(x) = Ax + Bu

(11.22)

donde A es una matriz constante n n y B es un vector constante de n dimensiones. Consideremos


la funcion escalar h(x) = cx, donde c es un vector fila constante. Supondremos ademas que este
sistema lineal es de grado relativo igual a n, es decir, el numerador de la funcion de transferencia
es un polinomio de grado cero y su denominador esta constituido por un polinomio de grado n.
Para estos sistemas sabemos que se cumple que: cB = cAB = . . . = cAn2 B = 0, y que ademas:
cAn1 B 6= 0.
Calculamos las derivadas de Lie reiteradas de h(x) con respecto al campo vectorial dado:

h(x)
= Lf +ug h(x) = LAx+Bu cx = LAx cx + LBu cx
= cAx + cBu

(11.23)

Puesto que cB = 0, si reiteramos el calculo anterior obtenemos:

h(x)
= LAx+Bu [cAx + cBu] = LAx [cAx] + LBu cAx
= cA2 x + cABu

(11.24)

En virtud de la suposicion hecha: cAi B = 0; i = 1, . . . , n 1, no es dificil ver entonces que:


h(i) (x) = LAx+Bu [cAi1 x] = LAx [cAi1 x] + LBu cAi1 x
= cAi x

(11.25)

para i = 0, 1, 2, . . . , n 1.Para i = n obtenemos:


h(n) (x) = LAx+Bu [cAn1 x] = LAx [cAn1 x] + LBu cAn1 x
= cAn x + cAn1 Bu

(11.26)

Ordenando las n primeras derivadas temporales de h(x), incluyendo la de orden cero, en un


vector obtenemos:

h(x)

h(x)

h(x)
..
.
(n1)
h
(x)

h(x)
Lf h(x)
L2f h(x)
..
.
(n1)

Lf

h(x)

cx
cAx
cA2 x
..
.
cA(n1) x

c
cA
cA2
..
.

x = Ox

(11.27)

cA(n1)

Este ejercicio demuestra la ingerencia de la matriz de observabilidad en el c


alculo de
las derivadas reiteradas de Lie, o derivadas temporales de la funci
on de salida cx,
cuando el sistema es de grado relativo igual a n. Esto, evidentemente, tiene profundas
y sugestivas implicaciones en la condici
on (10.51), cuya expresi
on alternativa estamos
buscando.

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

234

Hemos se
nalado en (11.13), que la derivada reiterada de Lie, de una funcion escalar h(x),
respecto a dos campos vectoriales f (x) y g(x) no satisface la propiedad de conmutatividad.
Es decir, el orden en que se toman las derivadas de Lie de h(x) respecto de f (x) y g(x) es
importante y distintivo. Es decir, en general tenemos que:
Lf Lg h(x) Lg Lf h(x) 6= 0

(11.28)

y por tanto Lf Lg h(x) Lg Lf h(x) es una funcion escalar de x, no identicamente nula. Vale la
pena preguntarnos si podremos o no determinar la existencia de un campo vectorial, digamos
p(x), respecto del cual la expresion: Lf Lg h(x) Lg Lf h(x) es su derivada direccional de la
funcion h(x). En otras palabras, deseamos saber si existe alg
un campo vectorial suave p(x)
para el cual se cumple:
Lp h(x) = Lf Lg h(x) Lg Lf h(x) = {[Lf Lg Lg Lf ]h}(x)

(11.29)

Evaluaremos los elementos del miembro derecho de (11.29) en detalle con el objeto de
ver si podemos identificar el campo vectorial buscado p(x):

[Lg h(x)]

Lf Lg h(x) =
f (x) = g T (x)
x
x

h(x)
x

"
!T
#"
#
h(x) g(x)
f (x) +
f (x)(11.30)

igualmente:

[Lf h(x)]

Lg Lf h(x) =
g(x) = f T (x)
x
x

= g T (x)

h(x)
x

"
!T
#"
#
h(x)
f
(x)
g(x) +
g(x)

!T
"
#"
#
h(x)
h(x) f (x)
f (x) +
g(x)

(11.31)

donde la u
ltima igualdad se debe a que la matriz Hessiana de h(x) es evidentemente simetrica
y cada uno de los terminos en la expresion anterior es una cantidad escalar. Uniendo (11.30)
y (11.31), para conformar el segundo miembro de (11.29), tenemos:
"

#"

"

#"

h(x) g(x)
h(x) f (x)
Lf Lg h(x) Lg Lf h(x) =
f (x)
g(x)
x
x
x
x
"
# ("
#
"
#
)
h(x)
g(x)
f (x)
=
f (x)
g(x)
x
x
x
(11.32)
= L{[ g ]f [ f ]g} h(x)
x

es decir, el campo vectorial p(x) estara dado por:


p(x) =

g(x)
f (x)
f (x)
g(x)
x
x

(11.33)

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


A este campo vectorial le daremos un nombre y una notacion especial. Llamaremos al
campo vectorial p(x) el corchete de Lie de los campos vectoriales f (x) y g(x), y lo designaremos mediante la notacion [f (x), g(x)]:
[f (x), g(x)] =

g(x)
f (x)
f (x)
g(x)
x
x

(11.34)

Rsumiendo, tenemos la siguiente identidad basica:


L[f,g] h(x) = Lf Lg h(x) Lg Lf h(x)

(11.35)

El corchete de Lie satisface ciertas propiedades interesantes, entre ellas:


[f, g] = [g, f ]
[f, ag] = [af, g] = a[f, g]
[f + g, ] = [f, ] + [g, ]

(11.36)

para cualquier constante escalar a y cualesquiera campos vectoriales f (x), g(x) y (x). Estas
propiedades generan otras de uso frecuente como por ejemplo, de la primera propiedad surge
inmediatamente que: [f, f ] = 0. La llamada identidad de Jacobi dada por: [f, [g, ]] +
[g, [, f ]] + [, [f, g]] = 0, es una consecuencia de habilmente manipular las propiedades
anteriores.
La reiteracion del corchete de Lie del campo vectorial f con el campo vectorial [f, g] se
escribe como:
[f, [f, g]] =

[f, g]
f
f
[f, g]
x
x

(11.37)

Puesto que sucesivas reiteraciones de la operacion de componer dos campos vectoriales,


bajo el corchete de Lie, pueden hacerse confusas rapidamente, definiremos una operacion
nueva que nos permita escribir estas expresiones de una manera sencilla. A esta nueva operacion la llamaremos la operaci
on del adjunto del campo vectorial f y g, y la cual definiremos
como sigue:
adf g = [f, g]; ad2f g = [f, adf g] = [f, [f, g]]; adnf g = [f, adfn1 g]

(11.38)

Sobreentendemos que:
ad0f g = g

(11.39)

Ejemplo 11.3:
Consideremos los campos vectoriales lineales dados por:
"

f (x) =

0 x2 + b
0 x1 1 x2

"

; g(x) =

0 x2
0 x1

(11.40)

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

236

Calculamos, como ejercicio, algunos corchetes de Lie que involucran a f (x) y g(x):
g(x)
f (x)
f (x)
g(x)
x # "
#x
"
#"
#
0
0 x2 + b
0 0
0 x2

0
0 x1 1 x2
0 1
0 x1

adf g(x) = [f, g](x) =


"

=
"

0
0

0 1 x2
0 b 0 1 x1

(11.41)

f (x)
[f, g](x)
f (x)
[f, g](x)
x
x# "
#
#"
#"
0 0
0 1 x2
0 x2 + b
0 1

0 1
0 b 0 1 x1
0 x1 1 x2
0

ad2f g(x) = [f, [f, g]](x) =


"

=
"

0
0 1

202 1 x1 + 0 12 x2 02 b
202 1 x2 20 1 b 0 12 x1

(11.42)

Ejemplo 11.4:
Sean c1 y c2 dos constantes arbitrarias y sean:f , g1 , g2 campos vectoriales suaves y a(x) y b(x)
funciones escalares suaves. Demostrar, a partir de las propiedades basicas dadas en (11.36),que:
1. [f, c1 g1 + c2 g2 ] = c1 [f, g1] + c2 [f, g2 ]
2. [a(x)f, b(x)g] = a(x)b(x)[f, g](x) + a(x)[Lf b(x)]g(x) b(x)[Lg a(x)]f (x)
Para demostrar la primera identidad procedemos como sigue:
[f, c1 g1 + c2 g2 ] = [c1 g1 + c2 g2 , f ] = c1 [g1 , f ] c2 [g2 , f ]
= c1 [f, g1 ] + c2 [f, g2 ]
La segunda requiere algo mas de calculo. Aplicamos la definicion de corchete de Lie y evaluamos
cuidadosamente (cuidando las dimensiones de los productos matriciales) la expresion resultante:
(a(x)f (x))
(b(x)g(x))
a(x)f (x)
b(x)g(x)
x
x

b(x)
g(x)
a(x)
f (x)
= a(x) g(x)
+ b(x)
f (x) b(x) f (x)
+ a(x)
g(x)
x
x
x
x

g(x)
f (x)
b(x)
a(x)
= a(x)b(x)
f (x)
g(x) + a(x)
f (x) g(x) b(x)
g(x) f (x)
x
x
x
x
= a(x)b(x)[f, g](x) + a(x)[Lf b(x)]g(x) b(x)[Lg a(x)]f (x)

[a(x)f, b(x)g] =

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


Con el objeto de buscar una interpretacion geometrica del corchete de Lie, procedemos
ahora a realizar el calculo que toda persona debiera hacer alguna vez en la vida.
Consideremos las dos ecuaciones diferenciales siguientes:
x = f (x); x = g(x)

(11.43)

Supongamos que a partir de un valor inicial de x, dado por x0 , recorremos la solucion


de la primera ecuacion de (11.43) durante una cantidad de tiempo . Tomamos ahora
el estado x() como condicion inicial de la segunda ecuacion diferencial y recorremos la
trayectoria solucion generada a partir de esta nueva condicion inicial, durante otra cantidad
de tiempo tambien igual a . Digamos que obtenemos ahora un valor de x igual a x(2).
Hagamos exactamente lo mismo, pero ahora empezando con la segunda ecuacion diferencial y
obtengamos primero, digamos 0 x() despues de unidades de tiempo recorriendo la solucion
generada por la segunda ecuacion diferencial. Proseguimos luego recorriendo la trayectoria
solucion asociada a la primera ecuacion diferencial tomando como condicion inicial el valor
obtenido 0 x(). Obtendremos, luego de unidades de tiempo, un valor de x que llamamos
x(). Deseamos obtener una expresion de la diferencia de los dos vectores resultantes, es
decir, deseamos saber el valor, a
un cuando sea aproximado, del vector:x(2) x(2). Sera
cero esta diferencia? El siguiente grafico nos da una idea de lo que estamos buscando:
Calculemos, de manera aproximada, la solucion de la primera ecuacion diferencial en el
instante , que hemos designado mediante x0 ().
x0 () = x0 + f (x0 ) + . . .

(11.44)

La solucion de la segunda ecuacion diferencial en (11.43), tomando este u


ltimo valor de
x como condicion inicial, resulta ser tambien de manera aproximada:
x(2) = x0 () + g(x0 ()) + . . .
= x0 + f (x0 ) + . . . + g(x0 + f (x0 ) + . . .) + . . .

"
#
g
= x0 + f (x0 ) + g(x0 ) +
f (x0 ) + . . .
x x0

(11.45)

Si ahora hacemos lo mismo invirtiendo el orden del recorrido, obtenemos:


x(2) = 0 x() + f (x0 ()) + . . .
= x0 + g(x0 ) + . . . + f (x0 + g(x0 ) + . . .) + . . .

"
#
f
= x0 + g(x0 ) + f (x0 ) +
g(x0 ) + . . .
x x0

(11.46)

La diferencia entre los dos vectores obtenidos al cabo de 2 unidades de tiempo es, dentro
de un primer orden de aproximacion:
"

f
g
f (x0 )
g(x0 ) + . . .
x(2) x(2) =
x x0
x x0
= [f, g](x0 ) + . . .

(11.47)

238

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

Haciendo infinitesimal obtenemos, al menos formalmente:


"

x(2) x(2)
1
x = lim
= [f, g](x)
0
2
2

(11.48)

La interpretacion geometrica de este resultado es como sigue:


Cosideremos el plano bidimensional, formado en IRn por los dos vectores f (x) y g(x) en
el punto x0 . Este par de vectores existen tambien en cada punto x del espacio y forma,
de la misma manera, un plano en ese punto. Imaginemonos ahora todos los planos de dos
dimensiones que existen, construidos de esa forma, en una vecindad infinitesimal de x0 . Una
pregunta que nos podemos hacer es la siguiente: Existira una superficie suficientemente
suave, que pase por x0 y a la cual sean tangentes un subconjunto suficientemente grande de
estos planos, que contienen el par de vectores f y g, al menos en una region infinitamente
cercana a x0 ?. En terminos mas tecnicos estaramos preguntandonos si este conjunto de
planos que contiene a los campos vectoriales f (x) y g(x) es integrable. A tal conjunto
infinito de planos se le conoce como la distribuci
on que contiene a los campos vectoriales
f (x) y g(x) y la pregunta correcta es si tal distribucion es integrable.
Para construir esta superficie podemos empesar construyendo las dos curvas que emergen
de x0 como soluciones de las ecuaciones diferenciales gobernadas por los campos vectoriales
f (x) y g(x). Luego, a partir de cada punto de una cualquiera de las trayectorias solucion
hallaramos las curvas que se corresponden con soluciones de la otra ecuacion diferencial tal
como se muestra en las figuras siguientes.
Si tal superficie existe localmente, no importara cual de las trayectorias tomamos para
iniciar el proceso de generar las otras. Formaramos entonces un enrrejilladode curvas
en las cercanas de x0 . Si tal superficie integral existe, las curvas obtenidas descansaran
todas sobre esa superficie, al menos localmente. La falta de integrabilidad existira si los
puntos obtenidos sobre las curvas, correspondientes a las dos formas posibles de enrrejillar
las cercanas de x0 fueran diferentes al escoger cada orden diferente de construir las curvas
solucion de las ecuaciones asociadas a los campos f y g. Si existiese falta de integrabilidad
de los campos vectoriales tendramos entonces la situacion que se representa en la figura
siguiente.
Por lo tanto, de la construccion anterior es claro que la integrabilidad esta relacionada a
la direccion que representa el vector [f, g](x0 ) con respecto al plano formado por los vectores
f (x0 ) y g(x0 ). Si [f, g](x0 ) se encuentra en el mismo plano en que se encuentran tanto
f (x0 ) como g(x0 ) entonces no habra falta de integrabilidad de la distribucion en la vecindad
inmediata a x0 . Si por el contrario [f, g](x0 ) se sale del plano formado por f (x0 ) y g(x0 )
no podremos, entonces, formar la superficie buscada, por mas cerca que estemos del punto
x0 .
La integrabilidad (local) de la distribucion que contiene a f (x) y g(x) es equivalente a
decir que, para cualquier punto x, (y no ya solo para x0 ) el campo vectorial [f, g](x) es
(localmente) combinacion lineal de f (x) y g(x). Como es logico, los valores escalares que
conforman la ley de combinacion lineal no tiene por que ser los mismos para cada punto x del
espacio, y ellos dependeran, en general, del valor de x. Diremos entonces que la distribucion

11.1. CAMPOS VECTORIALES, DERIVADAS DE LIE, CORCHETES DE LIE, EL TEOREMA DE FRO


que contiene a f (x) y g(x) es localmente integrable s y solamente s existen, al menos
localmente, funciones suaves (x) y (x) tales que:
[f, g](x) = (x)f (x) + (x)g(x)

(11.49)

En tales circunstancias, se dice que el par de campos vectoriales f y g conforman un conjunto de vectores involutivos y entonces, por extension, decimos tambien que la distribucion
que los contiene es involutiva.
Sea h(x) la funcion cuyos conjuntos de nivel, h(x) = constante, especifican la superficie
integral de la distribucion que contiene a f (x) y a g(x). Es inmediato ver que si el plano
formado por f (x) y g(x) ha de ser tangente a cada punto x a una de estas superficies
integrales, entonces el gradiente de la funcion en ese punto debera ser ortogonal a cada uno
de los campos vectoriales que existen en el plano tangente, en particular, sera ortogonal
tanto a f (x) como a g(x).
Tendremos entonces:
h(x)
h(x)
f (x) = 0; Lg h(x) =
g(x) = 0
x
x
Lo cual podemos expresar en una sola ecuacion en derivadas parciales:
Lf h(x) =

h(x)
[f (x), g(x)] = 0
x

(11.50)

(11.51)

Si el conjunto formado por los vectores f (x) y g(x) es involutivo entonces tambien es
cierto, por ser [f, g](x) combinacion lineal de los campos vectoriales f (x) y g(x), que el rango
de la matriz [f (x), g(x)] (que es igual a 2) no se incrementa si adosamos como columna el
vector [f (x), g(x)] es decir:
rango[f (x) g(x)] = rango[f (x) g(x) [f, g](x)]

(11.52)

h(x)
[f (x) g(x) [f, g](x)] = 0
x

(11.53)

y entonces:

Es facil ver que si (11.53) es cierta es porque [f, g](x) es combinacion lineal de f (x) y
g(x), lo cual dira que f y g son involutivos. En conclusion podemos decir que el conjunto
formado por los campos vectoriales f y g son involutivos s y solo s se cumple (11.52).
Al mismo tiempo, podemos entonces afirmar que la distribucion que contiene a f y g es
integrable s y solo s la distribucion es involutiva. Este enunciado constituye el Teorema
de Frobenius, base de la teora de control no lineal moderna.
En general, podemos extender este concepto de integrabilidad e involutividad a un conjunto arbitrario de campos vectoriales que esten contenidos en una cierta distribucion y
considerar entonces un conjunto de k campos vectoriales suaves linealmente independientes,
definidos en IRn , y dados por:
f1 (x), f2 (x), . . . , fk (x)

(11.54)

240

CHAPTER 11. NOCIONES DE GEOMETRIA DIFERENCIAL

La distribucion que contiene a este conjunto de vectores en cada punto x del espacio IRn
esta constituida por un hiperplano, o subespacio, o variedad lineal, de dimension k. Esta
distribucion es integrable si el conjunto de vectores en (11.50) es involutivo, lo cual quiere
decir que el corchete de Lie de dos cualesquiera de estos campos vectoriales es expresable
como combinacion lineal (dependiente del punto x, logicamente) de los elementos del mismo
conjunto. Es decir, si para cualesquiera enteros i y j pertenecientes al conjunto {1, 2, . . . , k},
se tiene que:
[fi , fj ](x) =

k
X

ijk (x)fk (x)

(11.55)

k=1

En otras palabras, diremos que el conjunto (11.50) es involutivo s y solamente s se


cumple que:
rango[f1 (x), f2 (x), . . . , fk (x)] = rango[f1 (x), f2 (x), . . . , fk (x), [fi , fj ](x)] = k

(11.56)

para cualquier i y j en {1, 2, . . . , k].


La funcion h(x), cuyos conjuntos de nivel son tangentes a la distribucion satisface entonces
la condicion de ortogonalidad y se tendra entonces:
h(x)
[f1 (x), f2 (x), . . . , fk (x)] = 0
x

(11.57)

El teorema de Frobenius nos permite asegurar que existe solucion h(x) para el sistema
de ecuaciones en derivadas parciales, representado en (11.57), s y solamente s, el conjunto
de campos vectoriales f1 (x), f2 (x), . . . , fk (x) es un conjunto linealmente independiente e
involutivo.

Chapter 12
Transformaci
on de Sistemas No
Lineales a la Forma Can
onica
Controlable

En este captulo daremos una introduccion al tema de la linealizaci


on exacta, que es una de las
muchas consecuencias nacidas del uso del enfoque geometrico en el cotrol de sistemas no lineales
y de la cual se deriva una posibilidad cierta de aplicabilidad practica. Debemos advertir, sin
embargo, que tales implementaciones deberan aun sobrellevar una buena cantidad de desarrollo
tecnologico y pruebas exhaustivas antes de que estas hallen plena aceptacion en el ambiente
industrial y productivo.
Los resultados y la notacion que hemos desarrollado nos permiten la reinterpretacion de
las condiciones (10.51)-(10.53) en terminos de los campos vectoriales f y g que definen el
sistema:
x = f (x) + ug(x)

(12.1)

En efecto la condicion (10.52) demanda la independencia, con respecto a la variable de


241

A LA FORMA CANONICA

242 CHAPTER 12. TRANSFORMACION


CONTROLABLE
control u de la funcion h(x) y sus derivadas hasta un orden (n 1).

h(x)
h(x)
h(n1) (x)
=
= ... =
=0
u
u
u

(12.2)

Escribamos estas condiciones sobre h(x), una por una, haciendo la exigencia anterior.
Empezamos haciendo notar que h(x) no depende explcitamente de u y por lo tanto la
primera condicion siempre se satisface trivialmente.
La segunda condicion implica:
"

h(x)
h

=
(f (x) + ug(x)) =
[Lf h(x) + uLg h(x)] = Lg h(x) = 0
u
u x
u

(12.3)

En virtud de lo cual aseguramos simplemente que:

h(x)
= Lf h(x)

(12.4)

La tercera condicion significa, tomando en cuenta (12.3):


"

"

h(x)
h(x)
(Lf h(x))
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
(Lf h(x))
(Lf h(x))
2
=
f (x) + u
g(x) =
[L h(x) + uLg Lf h(x)]
u
x
x
u f
= Lg Lf h(x) = 0
(12.5)
y entonces tambien es cierto que:

h(x)
= L2f h(x)

(12.6)

Verifiquemos la tercera condicion solo por ejercicio, sin olvidar de tomar en cuenta las
condiciones ya obtenidas en (12.3) y (12.5).
"

"

h(3) (x)
h(x)
(L2f h(x))
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
(L2f h(x))
3
(L2f h(x))
=
f (x) + u
g(x) =
[L h(x) + uLg L2f h(x)]
u
x
x
u f
= Lg L2f h(x) = 0
(12.7)
e igualmente tenemos:
h(3) (x) = L3f h(x)

(12.8)

En general tendremos entonces que el conjunto de condiciones (12.2) se representan mas


explcitamente en terminos de operaciones que involucran los campos vectoriales f (x) y g(x)
como:
h(i) (x)
= Lg Li1
f h(x) = 0; i = 1, 2 . . . , n 1
u

(12.9)

243
y que ademas:
h(i) (x) = Lif h(x); i =, 1, 2 . . . , n 1

(12.10)

Las condiciones (12.2) son entonces equivalentes a:


(n2)

Lg h(x) = Lg Lf h(x) = . . . = Lg Lf

h(x) = 0

(12.11)

La condicion (10.53), que reproducimos a continuacion, demandaba por su parte que:


h(n) (x)
6= 0
u

(12.12)

Lo cual, en virtud de los calculos anteriores puede reescribirse de la siguiente manera:


"

"

h(x))
h(n) (x)
h(n1)
(Ln1
f
=
(f (x) + ug(x)) =
(f (x) + ug(x))
u
u
x
u
x
"
#
h(x))
(Ln1
h(x))
n
(Ln1
f
f
=
f (x) + u
g(x) =
[L h(x) + uLg Lfn1 h(x)]
u
x
x
u f
= Lg Ln1
h(x) 6= 0
(12.13)
f
Finalmente las condiciones (10.51), dadas por:

rango

h(x)
x

h(x)
x

..
.

h(n1) (x)
x

=n

(12.14)

se traducen entonces, en virtud de (12.10), en la condicion siguiente:

rango

h(x)
x
Lf h(x)
x

..
.

(n1)

Lf

h(x)

= rango

h(x)
Lf h(x)
..
.

=n

(12.15)

Ln1
h(x)
f

Esta u
ltima condicion dice que las funciones h(x), Lf h(x), . . . , etc deben ser funcionalmente independientes.
Tenemos ahora, en terminos de los campos vectoriales f (x) y g(x), las condiciones que
permiten asegurar la existencia de una funcion h(x) que genera, a traves de sus sucesivas
derivadas temporales, una transformacion del espacio de coordenadas que permite escribir
al sistema en su forma canonica de la controlabilidad. Sin embargo todava debemos refinar
mas las condiciones (12.11),(12.13) y (12.15) a otras condiciones equivalentes mas claras
desde el punto de vista intuitivo y operacional.

A LA FORMA CANONICA

244 CHAPTER 12. TRANSFORMACION


CONTROLABLE
Veremos ahora que es enteramente posible cambiar las condiciones (12.11) por una que
involucra los corchetes de Lie reiterados de los campos vectoriales f (x) y g(x).
La primera de las ecuaciones del sistema (12.11) se reescribe como:
Lg h(x) =

h(x)
g(x) = 0
x

(12.16)

Sabemos tambien, por otro lado, que:


L[f,g] h(x) = Ladf g h(x) = Lf Lg h(x) Lg Lf h(x)

(12.17)

Vemos entonces que si (12.16) es cierta entonces, en virtud de la segunda condicion de


(12.11), tambien resulta cierto que:
Ladf g h(x) = Lg Lf h(x) = 0

(12.18)

Lad2f g h(x) = L[f,adf g] h(x) = Lf Ladf g h(x) Ladf g Lf h(x)

(12.19)

Igualmente, en virtud de:

es inmediato ver que (12.18) y (12.19) implican que:


Lad2f g h(x) = Ladf g Lf h(x) = L[f,g] Lf h(x) = Lf Lg [Lf h(x)] Lg Lf [Lf h(x)]
= Lf [Lg Lf h(x)] Lg [Lf Lf h(x)] = Lg L2f h(x) = 0

(12.20)

En fin, la recursion nos lleva a asegurar que:


Ladj g h(x) = Lg Ljf h(x) = 0; j = 0, 1, 2, . . . , n 2
f

(12.21)

Podemos entonces substituir las condiciones (12.11) por las siguientes, que les son equivalentes:
Lg h(x) = Ladf g h(x) = . . . = Ladn2 g h(x) = 0
f

(12.22)

y la condicion (12.13) se convierte entonces en:


Ladn1 g h(x) 6= 0
f

(12.23)

Reescribimos la condicion (12.21) en terminos de una ecuacion diferencial para h(x) como
sigue:
h(x)
[g, adf g, ad2f g, . . . , adfn2 g] = 0
x

(12.24)

h(x) n1
[adf g] 6= 0
x

(12.25)

y (12.22):

245
La existencia de una funcion h(x) que satisfaga el sistema de ecuaciones diferenciales
parciales (12.24) esta entonces intimamente vinculado a la integrabilidad de la distribucion
que contiene los campos vectoriales que aparecen conformando la matriz del sistema. Esta
integrabilidad, como hemos visto en el Teorema de Forbenius, es equivalente a la involutividad de los campos vectoriales involucrados. Notese ademas que la condicion (12.25) implica
que el campo vectorial asociado a esta condicion no puede estar en la misma distribucion
que contiene a los campos anteriores. Estos hechos los resumimos en las siguientes dos
condiciones:
Existe una funcion h(x) que genera una transformaci
on, valida alrededor de un
punto x del espacio, que reduce el sistema (12.1) a la forma can
onica controlable
s y solamente s se satisfacen las siguientes condiciones:
1. El conjunto de vectores:
{g adf g ad2f g . . . adfn2 g adfn1 g}

(12.26)

es linealmente independiente, localmente alrededor de x.


2. El subconjunto de campos vectoriales
{g adf g ad2f g . . . adfn2 g}

(12.27)

es localmente involutivo.

La transformacion linealizante esta dada por:

z = (x) =

h(x)
Lf h(x)
..
.

(12.28)

Ln1
h(x)
f
Notese que la condicion de independencia lineal no ha sido considerada como parte de las
condiciones de existencia de la funcion generadora de la transformacion buscada. En efecto,
es facil constatar que esta condicion se verifica en forma automatica y por lo tanto no juega
papel importante.
Para demostrar que (10.57) siempre es cierta, basta con verificar que el conjunto de
funciones que conforma el vector en (12.28) es funcionalmente independiente. En efecto,
supongamos, contrario a lo que deseamos demostrar, que existe una combinacion lineal de
estas funciones que se hace identicamente nula. Es decir, existe un conjunto de n constantes
[1 , . . . , n ] no nulo para el cual se cumple que:
1 h(x) + 2 Lf h(x) + . . . + n Ln1
h(x) = 0
f

(12.29)

A LA FORMA CANONICA

246 CHAPTER 12. TRANSFORMACION


CONTROLABLE
Calculemos la derivada direccional de esta funcion con respecto al campo vectorial g(x).
Obtenemos:
1 Lg h(x) + 2 Lg Lf h(x) + . . . + n Lg Lfn1 h(x) = 0

(12.30)

En virtud de (12.11) tenemos que (12.30) implica:


n Lg Ln1
h(x) = 0
f

(12.31)

Pero de acuerdo a (12.13) la derivada direccional que aparece en (12.31) no es nula,


concluimos as que debe ser n = 0. La combinacion lineal que se anula esta dada entonces
por:
1 h(x) + 2 Lf h(x) + . . . + n1 Lfn2 h(x) = 0

(12.32)

Si ahora calculamos la derivada con respecto al tiempo de esta expresion obtenemos:


1 Lf h(x) + 2 L2f h(x) + . . . + n1 Lfn1 h(x) = 0

(12.33)

Tomando de nuevo la derivada direccional respecto del campo vectorial g(x) tenemos:
1 Lg Lf h(x) + 2 Lg L2f h(x) + . . . + n1 Lg Ln1
h(x) = 0
f

(12.34)

que, en virtud de (12.11) resulta en:


n1 Lg Ln1
h(x) = 0
f

(12.35)

de donde resulta que n1 = 0 ya que la derivada direccional no puede ser cero.


Repitiendo estos argumentos concluiremos que todos y cada uno de los elementos escalares
i (i = 1, 2 . . . , n) que ayudan a conformar la combinacion lineal (12.29), son indenticamente
nulos. Lo cual es una contradiccion a la suposicion de que tal conjunto [1 , . . . , n ] era no
nulo. Esto demuestra que los elementos en la transformacion (12.28) son funcionalmente
independientes y en consecuencia la condicion (12.26) siempre es cierta. La transformacion
(12.28) tiene entonces una matriz Jacobiana no singular. La transformacion z = (x) representa, por tanto, una transformacion invertible que ademas es diferenciable. A tales transformaciones se les da en la literatura el nombre de difeomorfismos. Si el rango de la transformacion se mantiene para todos los valores de x en el espacio de estado el difeomorfismo
es global, de otra manera decimos que es local.
Las condiciones (12.26) y (12.27) constituyen entonces las condiciones necesarias y suficientes para la existencia de una transformacion difeomorfica del espacio de estado que lleva
al sistema (12.1) a la forma canonica controlable. Las condiciones (12.26) y (12.27), sin
embargo, no nos dicen que funcion h(x) genera la transformacion buscada z = (x).
A continuacion daremos una serie de ejemplos donde resulta relativamente sencillo encontrar la funcion h(x) que genera, a traves de sus derivadas con respecto al tiempo, la
transformacion difeomorfica que lleva el sistema a su forma canonica controlable.

247
Completaremos los ejemplos de transformacion a forma canonica controlable, con el
calculo de la ley de control linealizante en algunos de los ejemplos a presentarse y dejaremos como ejercicio el dise
no del controlador no lineal que hace al sistema en lazo cerrado
perfectamente lineal. Presentamos programas de simulaciones en algunos de los casos, que
demuestran la efectividad del controlador.

Ejemplo 12.1: Motor de corriente continua con carga (modelo de velocidad angular)
Considerese el motor de corriente continua que esquematizamos en la figura siguiente:
Las ecuaciones que describen el sistema estan dadas por:
dia
+ Ra ia + Kv ic = Va
dt
d
J
+ D = Kv ie ia
dt
La

(12.36)

Si definimos variables de estado y de control como:


x1 = ia , x2 =
u = ie , Va = constante

(12.37)

el modelo del sistema responde al siguiente conjunto de ecuaciones diferenciales no lineales de estado
(de hecho, las ecuaciones son bilineales):
"

x 1
x 2

"

a
R
La
0

#"

0
DJL

x1
x2

"

v
K
La
0

+u

Kv
J

#"

x1
x2

"

Va
La

(12.38)

El punto de equilibrio para este sistema, generado por una corriente de armadura constante
dada por u = U , se obtiene directamente de (12.38) y resulta en:
"

X1 (U )
X2 (U )

Va
=
Ra DL + Kv2 U 2

"

DL
Kv U

Los vectores f (x) y g(x) del sistema son en este caso:


"

f (x) =

Va
a
R
La x1 + La
DL
J x2

"

; g(x) =

v
K
La x2
Kv
J x1

(12.39)

Calculemos los campos vectoriales que intervienen en las condiciones (12.26) y (12.27):
"

g(x) =
f
g
f
g =
adf g =
x
x

"

0
Kv
J

v
K
La
0

#"

Va
a
R
La x1 + La
DJL x2

DL
Ra
J
La
DL
Ra
J La x1

Kv

Kv
J

v
K
La x2
Kv
J x1

La

x2
+

Kv Va
J La

"

a
R
La
0

0
DJL

#"

v
K
La x 2
Kv
J x1

(12.40)

A LA FORMA CANONICA

248 CHAPTER 12. TRANSFORMACION


CONTROLABLE
La matriz formada por estos campos vectoriales, calculados en (12.40), es:

[g(x) adf g] =

Kv
La
Kv DL
J
J

v
K
La x2

Kv
J x1

DL
Ra
J
La
a
R
La x1

x2
+

Kv Va
J La

(12.41)
(12.42)

"

K2
Det[g(x) adf g] = 2 v
JLa

DL Ra
K 2 Va
x1 v 2 x2

J
La
JLa

(12.43)

Evidentemente, la matriz formada por los campos vectoriales g y adf g es localmente de rango
completo, por lo que los vectores columna que la constituyen son localmente linealmente independientes. Vemos que:
x2 = 0
x1 =

Va
J
2 (DL La JRa )

constituyen lineas del plano IR2 donde no existe transformacion linealizante. El esquema de control
que adoptemos finalmente, sobre la base de linealizacion exacta aqu calculada, se hara inv
alido si
existen trayectorias del sistema controlado que se acerquen a estos valores prohibidos que causan
singularidad en la transformacion de estados que habremos de hallar.
El conjunto formado por el vector g(x) es trivialmente involutivo, pues [g, g](x) 0, para
cualquier campo vectorial g(x). En consecuencia, se cumplen las dos condiciones necesarias y
suficientes para la existencia de una transformacion linealizante. Para buscar la funcion h(x)
que genera la transformacion procedemos a utilizar la condicion de integrabilidad del conjunto
conformado por g(x) solamente.
h
h
h
g = 0 J
x2 + La
x1 = 0
x
x1
x2

(12.44)

Esta ecuacion tiene por solucion general:


h(x) = La x21 + Jx22 + c

(12.45)

El valor de la constante c lo podemos ajustar de manera que, por ejemplo, el punto de equilibrio
de la variable transformada z1 = h(x) sea cero cuando x es el valor de equilibrio dado anteriormente.
c=

2 + JK 2 U 2 )V
(La DL
a
v
(Ra DL + Kv2 U 2 )2

(12.46)

La segunda variable de estado transformado estara dada por z2 = Lf g, la cual calculamos


como sigue:
z2

h(x)
= Lf h(x) =
f (x) = [2La x1 2Jx2 ]
x
= 2Ra x21 2DL x22 + 2Va x1

"

Va
a
R
La x1 + La
DJL x2

249

Ejemplo 12.2: Motor de corriente continua con carga (modelo de Posici


on)
Si en el ejemplo anterior se definen las variables de estado y de control de la siguiente manera:
x1 = ia ; x2 = ; x3 = ;
u = ie ; Va = constante

(12.47)

el modelo del sistema resulta de tercer orden y se puede escribir, en representaci


on de estado, como:

a
R
x 1
La


x 2 = 0
x 3
0

0
0
0
x1

0
1 x2 + u 0
Kv
x3
0 DJL
J

Va
v
0 K
x1
La
La

0
0 x2 + 0
x3
0
0
0

(12.48)

Los vectores f (x) y g(x) del sistema son en este caso:

Va
a
v
R
K
La x1 + La
La x3

f (x) =
x3
0

; g(x) =
Kv
x
DJL x3
1
J

(12.49)

Ejercicio:Calcular la transformaci
on de estados que lleva al sistema a su forma can
onica controlable.

Ejemplo 12.3: Manipulador rob


otico de un grado de libertad, con articulaci
on flexible
Las ecuaciones diferenciales que gobiernan el sistema no lineal estan dadas por:
JL + BL + M gL sin + k( ) = 0
+ Bm
k( ) = u
Jm

(12.50)

donde es la posicion angular del miembro manipulador y es la posicion angular del eje del
motor, la cual es ligeramente diferente de la anterior en virtud de la flexibilidad del acoplamiento
entre el motor y el manipulador. Esta flexibilidad la hemos modelado como un resorte torsional.
La variable u representa el torque aplicado por el motor a su carga, constituida en este caso por el
miembro manipulador.
Definimos como variables de estado las siguientes:
x3 = ; x4 =

x1 = ; x2 = ;

(12.51)

El modelo en variables de estado, del manipulador flexible resulta ser, entonces:


x 1 = x2
BL
k
M gL
sin x1
x2
(x1 x3 )
x 2 =
JL
JL
JL
x 3 = x4
Bm
k
1
x 4 =
x4 +
(x1 x3 ) +
u
Jm
Jm
Jm

(12.52)

A LA FORMA CANONICA

250 CHAPTER 12. TRANSFORMACION


CONTROLABLE
El sistema exhibe entonces la forma x = f (x) + ug(x) donde:

f (x) =

x2
M gL
BL
JL sin x1 JL x2 JkL (x1 x3 )
x4
Bm
Jm x4 + Jkm (x1 x3 )

0
0
0

; g(x) =

(12.53)

1
Jm

Calculamos el conjunto de campos vectoriales que permite establecer la existencia de una transformacion de estado linealizante:
g
f
f
f (x)
g(x) = g(x)
x
x
x
0
1
0
M gL
BL
K
k
JL cos x1 JL JL
JL
0
0
0
K
0
Jkm
Jm

adf g =

0
0
1

0
0
0

1
Jm

m
B
Jm

0
0
1
Jm
Bm
J2
m

(12.54)

El resto de los vectores resultan ser:

2
adf g =

0
k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
J
m
m

; ad3 g =


BL
Bm
k

Jm JL JL Jm

B
k
m

J2 + J3

m
m
3
k

Jm JL

Bm
4
Jm

En virtud de resultar todos estos vectores constantes, la involutividad del subconjunto formado
por los tres primeros vectores es trivial. La independencia lineal del conjunto completo de los cuatro
vectores calculados tambien es inmediata en virtud de la naturaleza antidiagonal de la matriz:
[g(x) adf g(x) ad2f g(x) ad3f g(x)] =

k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
Jm
m

J1m

1
Jm

Bm
2
Jm


BL
Bm
k

Jm JL JL Jm

Bm
k

J2 + J3

m
m
3
k

Jm JL

(12.55)

Bm
4
Jm

La funcion que genera la transformacion difomorfica del estado satisface en virtud de la integrabilidad de los tres primeros campos vectoriales que se muestran en la matriz anterior, el siguiente
conjunto de ecuaciones en derivadas parciales:

0
0
0
1
Jm

0
0
1
Jm
m
B
2
Jm

0
k
Jm JL
Bm
2
Jm
2
k
m
J2 + B
3
J
m
m

= [0 0 0]

(12.56)

251
lo cual se traduce en:
1 h
= 0;
Jm x4
1 h
Bm h
2
= 0;
Jm x3
Jm x4

k h
Bm h
k
B2
+ 2
+ 2 + 3m
Jm JL x2
Jm x3
Jm
Jm

h
=0
x4

es decir:
h
h
h
= 0;
= 0;
=0
x4
x3
x2

(12.57)

Una solucion posible esta dada por:


h(x) = x1

(12.58)

La transformacion linealizante se calcula mediante:

z = (x) =

h(x)
Lf h(x)
L2f h(x)
L3f h(x)

L
B
JL

x1
x2
M gL
BL
JL sin x1 JL x2

MJgL
L

sin x1

BL
JL x2

k
JL (x1

k
JL (x1

(12.59)

x3 )

x3 )

k
JL (x2

x4 )

La transformacion inversa se obtiene por inspeccion, a partir de la transformacion (12.59)


x1 = z1
x2 = z2

M gL
BL
JL
z3 +
sin z1 +
z2
k
JL
JL

JL
M gL
BL
= z2 +
z4 +
z2 cos z1 +
z3
k
JL
JL

x3 = z1 +
x4

(12.60)

El modelo transformado a la forma canonica controlable tiene la forma siguiente:


z1 = z2
z2 = z3
z3 = z4
z4

"

M gL
k
M gL 2
B2
= z3
+
cos z1 + 2L
z sin z1
JL
JL
JL 2
JL

BL
M gL
BL M gL
BL
z2 cos z1
z4 +
+
z2 cos z1 +
z3
JL
JL
JL
JL2

kBm
JL
M gL
BL

z2 +
z4 +
z2 cos z1 +
z3
Jm JL
k
JL
JL

M gL
BL
k
k
z3 +
sin z1 +
z2 +
u

Jm
JL
JL
Jm JL

(12.61)

A LA FORMA CANONICA

252 CHAPTER 12. TRANSFORMACION


CONTROLABLE
El control linealizante se obtiene de igualar la expresion en la u
ltima ecuacion a una entrada
auxiliar v, la cual a su vez representa una ley de realimentaci
on lineal en terminos de las nuevas
variables de estado transformadas.
z1 = z2
z2 = z3
z3 = z4
z4 = v

(12.62)

donde
"

M gL
B2
k
M gL 2
v = z3
cos z1 + 2L
+
z sin z1
JL
JL
JL 2
JL

BL
BL M gL
M gL
BL
z
cos
z

+
z
+
z
cos
z
+
z
2
1
4
2
1
3
JL
JL
JL
JL2

JL
M gL
BL
kBm
z2 +
z4 +
z2 cos z1 +
z3

Jm JL
k
JL
JL

k
k
M gL
BL

z3 +
sin z1 +
z2 +
u
Jm
JL
JL
Jm JL

(12.63)

y la variable auxiliar v se escoge como una ley de control lineal dada por:
v = a1 z1 a2 z2 a3 z3 a4 z4

(12.64)

de tal manera que el siguiente polinomio, en la variable compleja s, sea Hurwitz:


p(s) = s4 + a4 s3 + a3 s2 + a2 s + a1
2
2
= (s2 + 21 n1 s + n1
)(s2 + 22 n2 s + n2
)

(12.65)

En particular hemos querido factorizar este polinomio deseado de cuarto orden, en el producto
de dos polinomios de segundo orden cuyas raices sean complejas conjugadas. Uno de estos dos
polinomios se escoge con raices mas alejadas dentro del semiplano izquierdo del plano complejo que
el otro. De esta manera la respuesta en lazo cerrado se encuentra dominada por los autovalores
que se encuentran mas cerca al eje imaginario del plano complejo.
Utilizando (12.63) y (12.64) obtenemos el valor del control u como ley de control realimentada
no lineal que ejerce estabilizacion del sistema, mediante un esquema de linealizacion exacta, en lazo
cerrado:
"

M gL
k
B2
Jm M gL 2
Jm JL
z3
z2 sin z1
cos z1 + 2L

u =
k
JL
JL
k
JL

Jm JL BL M gL
BL Jm JL
M gL
BL

z2 cos z1 +
z4 +
z2 cos z1 +
z3
J k
k
JL
JL

L
M gL
BL
JL
z4 +
z2 cos z1 +
z3
+Bm z2 +
k
JL
JL

M gL
BL
Jm JL
+JL z3 +
sin z1 +
z2 +
[a1 z1 + a2 z2 + a3 z3 + a4 z4 ]
JL
JL
k

(12.66)

253

Ejemplo 12.4: Sistema de suspensi


on magnetica
Las ecuaciones del sistema son, de acuerdo a lo visto en el Captulo 2, las siguientes:
x 1 = x2
x 2 = g

c x23
m x1

R
1
x 3 = x3 + u
L
L

(12.67)

donde x1 representa el desplazamiento de la esfera metalica suspendida, medido desde el borde


del magneto. x2 es la velocidad de la esfera, medida positivamente hacia abajo. La variable x3
representa la corriente que fluye por el circuito del electroiman.
En este caso tenemos:

x2

c x3
f (x) = g m
x1
R
L x3

; g(x) = 0

(12.68)

1
L

El calculo de la matriz de controlabilidad arroja:

2
[g(x) adf g(x) adf g(x)] = 0

1
L

0
cx3
2 mLx
1
R
L2

cx3
2 mLx
1
c2 x23

; Det[g(x) adf g(x) adf g(x)] = 4 2 3(12.69)


m L x21

La singularidad de la transformacion se sucede entonces cuando la corriente que circula por


el circuito del electroiman se hace cero. La singularidad que ocurre al hacerse la distancia x1
infinitamente grande carece de significacion practica.
El subconjunto de campos vectoriales representado por las dos primeras columnas de la matriz
de controlabilidad esta dado por:

0
c x3

{g(x) adf g(x)} = 0 ; 2 m Lx1

1
R
L

(12.70)

L2

La involutividad de este conjunto se chequea inmediatamente por ser dos el rango de la siguiente
matriz:

Det[g(x) adf g(x) [g, adf g](x)] = Det 0

1
L

0
cx3
2 mLx
1
R
L2

c 1
2m
L2 x 1 = 0
0

(12.71)

lo cual dice que en el campo vectorial dado por el corchete de Lie, [g, adf g], es combinaci
on lineal
de los campos vectoriales g(x) y adf g(x).

A LA FORMA CANONICA

254 CHAPTER 12. TRANSFORMACION


CONTROLABLE
La funcion que genera la transformacion difomorfica que lleva al sistema a la forma canonica
controlable esta dada por cualquier funcion h(x) que satisfaga:

0
h
h
[g(x) adf g(x)] =
0
x
x
1

cx3
2 mLx
= [0 0]
1

(12.72)

R
L2

Es decir, h(x) debe satisfacer:


1 h
c x3 h
R h
= 0; 2
+ 2
=0
L x3
m Lx1 x2 L x3
lo cual se reduce a:
h
h
= 0;
=0
x3
x2

(12.73)

Una posible solucion, que ya sospechabamos, esta dada por:


h(x) = x1

(12.74)

La transformacion que linealiza exactamente al sistema esta dada por:

z1
x1
h(x)

1
z2
x
2
z = (x) = Lf h(x) =
; x = (z) = q

cx23
2
m
Lf h(x)
z
(g

z
)
g mx1
3
c 1

(12.75)

El sistema en forma canonica controlable, expresado en variables transformadas esta dado por:
z1 = z2
z2 = z3
z3

2R z2
= (g z3 )
+
L
z1

Usando:
u=

2c

mL

m
(g z3 )u
cz1

L mcz1
2R z2
p
(g z3 )
+
v
L
z1
2c (g z3 )

(12.76)

(12.77)

obtenemos:
z1 = z2
z2 = z3
z3 = v

(12.78)

La variable auxiliar v se puede escoger de tal forma que el sistema en lazo cerrado sea perfectamente lineal y asintoticamente estable al punto de equilibrio deseado para la posicion de la esfera,
Xd .
z1 = z2
z2 = z3
z3 = ( + 2n )z3 (n2 + 2n )z2 n2 (z1 Xd )

(12.79)

255
El polinomio caracterstico que gobierna las respuestas del sistema en lazo cerrado estara dado,
en tales circunstancias, por:
p(s) = s3 + ( + 2n )s2 + (n2 + 2n )s + n2
= (s + )(s2 + 2n + n2 )

(12.80)

En coordenadas originales la ley de control estabilizante, calculada mediante una estrategia de


linealizacion exacta, esta dada por:
mLx1
u=
2cx3

c x23 2R x2
c x23
+ ( + 2n ) g
+
m x1 L
x1
m x1

+ (n2 + 2n )x2 + n2 (x1 Xd)

(12.81)

El siguiente programa simula el sistema en lazo cerrado:


Los graficos obtenidos muestran que la posicion converge al valor deseado, mientras que la
velocidad y la corriente van a sus puntos de equilibrio.
El valor de la variable de control tambien fue graficada y se muestra a continuaci
on.
El esquema de control logra la estabilidad de la esfera metalica al valor deseado de la posicion
Xd = 0.005[m]. La siguiente figura muestra la respuesta del sistema para un valor significativamente
alejado del valor deseado.

Ejemplo 12.5: Dise


no de un controlador no lineal, mediante el m
etodo de la linealizaci
on exacta de un tanque de reacci
on continuamente agitado
Consideremos ahora el modelo no lineal de un tanque reactor continuamente agitado en el cual
toma lugar una reaccion qumica del tipo isotermica en fase lquida.
x 1 = (1 + Da1 )x1 + u
x 2 = Da1 x1 x2 Da2 x22

(12.82)

Donde x1 representa la concentraci


on normalizada (adimensional) CP /CP O de cierta especie P
en el reactor, donde CP O es la concentraci
on deseada de las especies P y Q medidas en mol.m3 . La
variable de estado x2 representa la concentraci
on normalizada CQ /CP O de la especie Q . La variable
de control u se define como la razon de la rata de alimentaci
on molar por unidad volumetrica
de la especie P , la cual designamos mediante NP F , y la concentraci
on deseada CP O . Es decir,
u = NP F /(F CP O ) donde F es la rata de alimentaci
on volumetrica en m3 s1 . Las constantes Da1
y Da2 se definen, respectivamente como: k1 V /F y k2 V CP O /F siendo V el volumen del reactor, en
m3 , y k1 , k2 son las constantes de primer orden en s1 .
El punto de equilibrio para este sistema, a una rata fija de alimentaci
on U , esta dado por:
"

X1 (U ) =

1
U
; X2 (U ) =
1 +
1 + Da1
2Da2

4Da1 Da2 U
1+
1 + Da1

(12.83)

Se supone que la especie Q es altamente acida mientras que la especie reactante R es neutra.
A fin de evadir problemas de corrosion en el equipo que se encuentra aguas abajo se desea regular

A LA FORMA CANONICA

256 CHAPTER 12. TRANSFORMACION


CONTROLABLE
la concentracion total y a un valor de referencia constante dado por Y . Se supone ademas que la
variable de control se encuentra acotada, de forma natural, en el intervalo [0, Umax ] reflejando as
la imposicion fsicamente valida de nuestra disponibilidad de una rata de alimentaci
on finita para
la especie P .
Los campos vectoriales f (x) y g(x) estan dados por:
"

f (x) =

(1 + Da1 )x1
Da1 x1 x2 Da2 x22

"

; g(x) =

1
0

(12.84)

El campo vectorial dado por adf g(x) es:


"

#"

(1 + Da1 )
0
Da1
(1 + 2Da2 )

adf g(x) =

1
0

"

(1 + Da1 )
Da1

(12.85)

El vector g(x) es trivialmente involutivo y la matriz [g(x) adf g(x)] es de rango completo, igual
a 2.
"

[g(x) adf g(x)] =

1 (1 + Da1 )
0
Da1

(12.86)

La funcion h(x) debe satisfacer:

h(x) h(x)
x1
x2

"

1
0

h(x)
=0
x1

(12.87)

Una solucion posible esta dada por:


h(x) = x2 + c

(12.88)

Escogemos la constante c, de tal manera que el punto de equilibrio de la variable z1 sea cero,
es decir:
"

1
z1 = h(x) = x2
1 +
2Da2

4Da1 Da2 U
1+
1 + Da1

(12.89)

La transformacion es entonces:
"

z = (x) =

h(x)
Lf h(x)

"

x2 X2 (U )
Da1 x1 x2 Da2 x22

"

x2

i #

a1 Da2 U
1 + 1 + 4D1+D
a1
(12.90)
Da1 x1 x2 Da2 x22

1
2Da2

y el punto de equilibrio de las nuevas variables de estado z, coincide entonces con el origen del
plano, como es facil verificar. La transformacion inversa se obtiene inmediatamente a partir de
(12.90) como:
"

x1
x2

"

1
Da1 [z2

+ z1 + X2 (U ) + Da2 (z1 + X2 (U ))2 ]


z1 + X2 (U )

(12.91)

257
El modelo transformado, en forma canonica controlable resulta en:
z1 = z2
z2 = (1 + Da1 )[z2 + (z1 + X2 (U )) + Da2 (z1 + X2 (U ))2 ] z2 [1 + 2Da2 (z1 + X2 (U ))] +(12.92)
Da1 u
El sistema es equivalente a un sistema lineal asint
oticamente estable, de la forma:
z1 = z2
z2 = 2n z2 n2 z1

(12.93)

siempre y cuando se asigne al control u la forma de ley realimentada del estado, dada por la
expresion siguiente:
u=

o
1 n
(1 + Da1 )[z2 + (z1 + X2 (U )) + Da2 (z1 + X2 (U ))2 ] + z2 [1 + 2Da2 (z1 + X2 (U ))] 2n z2 n2 z(12.94)
1
Da1

En coordenadas originales el controlador no lineal esta dado por:


u=

i
1 h
Da1 (1 + Da1 )x1 + (1 2n + 2Da2 x2 )(Da1 x1 x2 Da2 x22 ) n2 (x2 X2 (U ))(12.95)
Da1

Con el objeto de simular la respuesta controlada del sistema constituido por el tanque reactor
realizamos el siguiente programa:
La siguiente figura
muestra las trayectorias controladas del estado del sistema para valores de

= 0.707, n = 10, Da1 = 1, Da2 = 1. El punto de equilibrio para el vector de estado resulta
oticamente a estos
ser, para U = 4, X1 (U ) = 2 y X2 (U ) = 1. Las trayectorias convergen asint
valores.
La trayectoria de la variable de control u tambien converge a su punto de equilibrio.

Antes de concluir esta seccion, daremos una justificacion a nuestro uso de la frase Matriz
de controlabilidad del sistema cuando nos referimos a la matriz:
[g(x) adf g(x) . . . adn1
g(x)]
f

(12.96)

Primero, recordemos un resultado bien conocido del algebra lineal:


Lema: El conjunto de vectores {v1 , v2 , . . . , vn } es linealmente independiente s y
solo s el conjunto {v1, v2, . . . , (1)n1 vn } es linealmente independiente.
La demostraci
on de este resultado se deja como ejercicio al lector.
Consideremos ahora el caso de un sistema lineal (de una entrada) para el cual requerimos
calcular la matriz (12.96). Es decir, los campos vectoriales f (x) y g(x) estan dados por :
f (x) = Ax; g(x) = B

(12.97)

El calculo de las columnas que integran la matriz (12.96) resulta en:


B
Ax
Ax
B = AB;
x
x
Ax
(AB)
Ax
(AB) = A2 B; . . . ; adn1
g(x) = (1)n1 An1(12.98)
B
ad2f g(x) =
f
x
x
g(x) = B; adf g(x) =

A LA FORMA CANONICA

258 CHAPTER 12. TRANSFORMACION


CONTROLABLE
y entonces para el caso lineal:
g(x)] = [B AB A2 B . . . (1)n1 An1 B](12.99)
[g(x) adf g(x) ad2f g(x) . . . adn1
f
El rango de la matriz (12.99) satisface, en virtud del lema anterior:
Rango[B AB A2 B . . . (1)n1 An1 B] = Rango[B AB A2 B . . . An1 B]
(12.100)
Esto justifica plenamente la terminologa empleada con respecto a (12.96).

Chapter 13
Linealizaci
on EntradaSalida

En las secciones anteriores hemos estudiado el problema de transformar los sistemas no lineales
a sistemas lineales en forma exacta. A tal tipo de linealizacion, que involucra transformaciones
del espacio de estado y transformaciones del espacio de los controles (es decir realimentacion
con definicion de nuevas entradas) se le conoce tambien con el nombre de linealizaci
on entradaestado. Como vimos, la base de tal posibilidad estriba en encontrar una funcion que pueda generar
tal transformacion a traves de derivaciones sucesivas con respecto al tiempo. El requisito indispensable para establecer la existencia de esta funcion generadora, en sistemas n-dinensionales,
ha sido que la variable de control, o de entrada al sistema, aparezca precisamente en la n-esima
derivada temporal de tal funcion generadora. Tal requisito puede no cumplirse cabalmente sobre todo si nos empenamos en utilizar como funciones generadoras, funciones del estado que
tengan algun significado fsico especial. Por ejemplo, si tomamos cualquiera de las variables de
estado del sistema como funcion generadora, no siempre podremos cumplir con el requisito de
que sus derivadas, hasta la n-esima sean independientes del control, Lo mismo podramos decir
si tomamos, por ejemplo, la variable de salida como funcion generadora de la transformacion
requerida. Solo en casos muy especiales de esta ndole, tendramos la posibilidad de linealizar
exactamente el comportamiento del sistema sobre la base de tales exigencias a la funcion generadora. Es obvio que el problema de linealizacion de entrada-estado involucra como pregunta
259

260

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

capital la existencia de la funcion generadora de la transformacion del sistema a forma canonica


controlable. Sin embargo, si quisieramos linealizar el sistema en su comportamiento de entradasalida, la funcion candidata a ocupar, en forma natural, el puesto de la funcion generadora estara
constituida por la funcion de salida misma. Pero entonces resultara que no siempre podremos
cumplir con la exigencia de tener solo la n-esima derivada de la salida dependiente, explcitamente,
del control, puesto que la aparicion de tal variable pudiera sucederse mucho antes en el proceso
de derivacion. Un ejemplo sencillo nos dira que tal caso no es del todo infrecuente.

13.1

Formas Can
onicas Normales, Din
amica de los ceros

Ejemplo 13.1: Tanque de reacci


on continuamente agitado
Considerese el tanque de reaccion agitado visto en la seccion anterior. Si tomamos como salida
de este sistema de segundo orden el error en la concentraci
on total con respecto a un valor de
equilibrio dado C, expresado como:
y = x1 + x2 C

(13.1)

Es claro que la primera derivada de y, ya contiene, explcitamente, la influencia de la variable


de entrada u. En efecto:
y = x 1 + x 2 = x1 x2 + u Da2 x22

(13.2)

en consecuencia no podremos considerar a y como una funcion generadora de una linealizacion


exacta del estado del sistema.

Debe resultar suficientemente claro que si bien no siempre podremos linealizar el comportamiento entrada-estado, sin embargo pudieramos conformarnos con linealizar solamente el
comportamiento entrada-salida del sistema sin preocuparnos por el comportamiento entradaestado. Esta nueva alternativa merece consideracion cuidadosa por cuanto si bien pudieramos
linealizar el comportamiento entrada salida, la dinamica lineal que induzcamos en esta
relacion sera en general de orden menor que el orden del sistema original. Notese que
de ser cierto lo contrario, la salida sera tambien funcion generadora de la linealizacion de
entrada-estado. Estamos suponiendo, especficamente, que este no es el caso pues el control
ha de aparecer explcitamente en una expresion anterior a la n-esima derivada de la salida.
Digamos que u aparece en la derivada de orden r de la salida. La linealizacion de entrada
salida sera posible entonces con un control que force a la salida a satisfacer una ecuacion
diferencial lineal de orden r, pero entonces nos queda flotando una dinamica adicional de
orden n r que debemos determinar con toda precision. Para fijar ideas continuemos elaborando un poco mas sobre el ejemplo anterior

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

261

Ejemplo 13.2: Continuaci


on Tanque de reacci
on
Supongase que deseamos controlar el sistema representado por el tanque reactor continuamente
agitado, de tal manera que el comportamiento entrada-salida del sistema sea lineal y satisfaga el
requerimiento adicional de que, en equilibrio, el error de la salida sea y = 0. Es decir, que la
concentracion total, dada por la suma de las concentraciones de x1 y x2 sea C , un valor deseable
de la concentracion total. Es evidente, que en este caso pudieramos igualar la derivada de y a una
expresion lineal que implique un comportamiento asint
oticamente estable del error a cero. As, por
ejemplo, si hacemos:
y = y

(13.3)

el control necesario para lograr tal comportamiento sera:


u = (y C) + x1 + x2 + Da2 x22
= (x1 + x2 C) + x1 + x2 + Da2 x22

(13.4)

Tal realimentacion del vector de estado logra linealizar la salida, habida cuenta que el valor de
se haya escojido positivamente. El sistema original, sin embargo, es un sistema de segundo orden y
por lo tanto, internamente, una cierta dinamica, al menos de primer orden, debe estar llevandose a
cabo mientras el comportamiento de entrada-salida, que es de primer orden solamente, evoluciona
aparentemente en forma satisfactoria hacia su valor de equilibrio, y = C, de una manera estable.
Debemos proceder entoces con suma cautela en nuestro analisis.
Puesto que y es la suma de las variables de estado que describen el sistema, transformemos el
sistema original de tal manera que el error de salida, dado por y C, pase a ser una nueva variable
de estado y escojamos, como segunda variable de estado, una variable funcionalmente independiente
del error y C. Tal funcion podra ser, por ejemplo, x1 , o incluso x2 . Tomemos x1 como segunda
variable de estado y consideremos la transformacion siguiente:
= x1 + x2 C
= x1

(13.5)

La transformacion inversa de (13.5) esta dada por :


x1 =
x2 = + y

(13.6)

por lo cual, el sistema no lineal transformado se expresa, despues de algunas manipulaciones algebraicas sencillas, como:
= + u Da2 ( + C) C
= (1 + Da1 ) + u
y =

(13.7)

En variables transformadas, la ley de control realimentada propuesta en (13.4), esta dada por:
u = + + C + Da2 ( + C)2

(13.8)

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

262

Este control produce, al substituirse en (13.7), la siguiente dinamica en lazo cerrado;


=
= (1 + Da1 ) + + C + Da2 ( + C)2

(13.9)

Puesto que tiende asintoticamente a cero (y entonces por virtud de la ecuacion (13.5), la salida
y tiende a C), la dinamica en la primera ecuacion pasa, despues de un tiempo arbitrariamente
grande, a ser una relacion smplemente algebraica dada por = 0. Esto implica que la variable
( la cual representa la concentracion x1 ) evolucionar
a, finalmente, cuando y valga C, de acuerdo
con:
= (1 + Da1 ) + C + Da2 (C )2

(13.10)

Esta dinamica autonoma representa, por as decirlo, una dinamica remanente del sistema cuando
el error de salida = y C se encuentra ya en su valor de equilibrio de cero. Recordemos que esta
dinamica representa la evolucion de un estado con significado real, puesto que el mismo modela
la concentracion de una especie qumica. El sistema autonomo (13.10), no causa adicionalmente
efecto alguno sobre la variable de salida ni sobre el error de salida y C. Esto quiere decir que, en
condiciones de lazo cerrado, la variable se encuentra desacoplada del comportamiento de entradasalida del sistema, y por lo tanto, no puede ser evaluada sobre la base del conocimiento de la
salida. Notese entonces que la realimentaci
on propuesta ha producido el insolito hecho de hacer a
la variable completamente inobservable.
La evaluacion de la naturaleza de la estabilidad del comportamiento de es entonces crucial,
cuando se trate de garantizar el exito de la estabilizacion que induce la ley de control (13.8) sobre
la variable de salida del sistema (en este caso representada por el error de la concentraci
on total).
Por otra parte, vemos que la dinamica remanente (13.10) es completamente no lineal y autonoma
y sabemos que los diferentes equilibrios posibles de un sistema no lineal autonomo pueden exhibir
muy distintos caracteres. Algunos puntos de equilibrio son estables y otros puedieran no serlo.
La ley de control (13.4), o su equivalente (13.8), puede entonces conducir a un fracaso total si el
comportamiento inobservable de (13.10) arranca de las cercanas, o en la vecindad inmediata, de
un punto de equilibrio inestable. Se hace, por tanto, imprescindible establecer la naturaleza de la
estabilidad en los puntos de equilibrio de la dinamica remanente (13.10).
En efecto el sistema autonomo cuenta con dos puntos de equilibrio bien establecidos como se
desprende del siguiente grafico, hecho con los valores utilizados en la seccion anterior:
Uno de los puntos de equilibrio es estable ( = 3) mientras que el otro ( = 6) es inestable.
Esto hace que sea posiblemente riesgoso iniciar el proceso de control de la concentraci
on total con
valores muy altos de la concentracion de la especie representada por x1 . Sobre todo si la rata de
alimentacion al tanque, representada por u, se encuentra limitada. El siguiente grafico muestra,
sin embargo, el retrato de fase del sistema obtenido de la simulaci
on del mismo, cuando este se
controla mediante la ley de control (13.4), para distintos valores de la condicion inicial x1 . Los
efectos de la dinamica remanente, en este caso, no afectan la atractividad del punto de equilibrio
estable dado que no hemos puesto lmites a la entrada (permitiendo incluso valores negativos de
u, lo cual no es fsicamente posible). Puesto que este tipo de comportamiento no es siempre el
caso en general, la dinamica remanente debe ser cuidadosamente evaluada y su comportamiento
plenamente establecido.

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

263

Dejamos como ejercicio obtener el retrato de fase del sistema controlador cuando la variable
u(t) satisface, por ejemplo, la condicion: 0 u(t) Umax = 6

Del ejemplo anterior inferimos la siguiente generalizacion del proceso de linealizacion de


entrada - salida.
1. Se construye una transformaci
on del vector de estado original, tomando
como nuevas coordenadas la funcion de salida y sus derivadas sucesivas respecto del tiempo. El proceso de derivacion se interrumpe en aquel orden de
la derivacion en que aparezca, de manera explicita en la expresi
on de la
derivada, la variable de control del sistema. Deber
a cumplirse ademas que
todas estas derivadas sean funcionalmente independientes entre s. Supongamos que la variable de control aparece en la r-esima derivada de la funcion
de salida respecto del tiempo. Entonces las primeras r coordenadas estan
constituidas por las salidas y sus derivadas hasta un orden r 1.
2. Suplementamos las r coordenadas obtenidas anteriormente con nuevas coordenadas, hasta completar un total de n, que satisfagan la condici
on de ser
independientes entre s y ademas independientes de todas las coordenadas
definidas en el paso anterior.
3. El sistema dinamico, descrito en las nuevas coordenadas admite una linealizacion parcial de orden r. Tal linealizaci
on constituye la linealizaci
on de
entrada salida y se logra calculando el control que hace del sistema en lazo
cerrado un sistema lineal de orden r preferiblemente asint
oticamente estable
al origen de nuevas coordenadas. El proceso de hallar el control linealizante
de entrada salida difiere muy poco, en espritu, del proceso empleado para
linealizar un sistema no lineal al cual es aplicable el metodo del control calculado.
4. Con el objeto de constatar la factibilidad de utilizar la ley de control linealizante previamente calculada, se procede a buscar la dinamica remanente en
lazo cerrado, haciendo, en la expresi
on de la dinamica no linealizada, cero
las primeras r variables de estado para evaluar de seguidas la naturaleza de
la estabilidad de los puntos de equilibrio de la dinamica remanente. Si el
punto de equilibrio es u
nico y resulta ser globalmente asintoticamente estable
al origen el sistema se dira que es globalmente de fase mnima. Si alg
un
punto de equilibrio es inestable diremos que el sistema es localmente de fase
no mnima. El sistema puede ser localmente de una u otra naturaleza si
el sistema tiene un punto de equilibrio que no es asintoticamente estable ni
inestable, sino que su linealizaci
on exhibe autovalores en el eje imaginario
del plano complejo.

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

264

Esta u
ltima terminologa debera ser plenamente justificada. Para ello analizaremos detalladamente el proceso de linealizacion de entrada- salida en un sistema lineal invariante en
el tiempo.
Consideremos el sistema n-dimensional, de naturaleza lineal que es, ademas, invariante
en el tiempo y cuenta con una sola entrada y una sola salida, dado por:
x(t)

= Ax(t) + Bu
y = Cx(t)

(13.11)

Supongamos, mas a
un, que el sistema tiene por funcion de transferencia de entrada-salida
la siguiente funcion racional de variable compleja s, en la cual suponemos, adicionalmente no
existen factores comunes al numerador y denominador (es decir, los polinomios del numerador
y del denominador son coprimos).
y(s)
bnr snr + . . . + b1 s + b0
= C(sI A)1 B = n
u(s)
s + an1 sn1 + . . . + a1 s + a0

(13.12)

Sin perdida de generalidad alguna, podemos suponer que las matrices A, B y C del
sistema tienen la forma siguiente:

A =

C =

0
0
..
.

1
0
..
.

0
1
..
.

...
...
...

0
0
..
.

0
0 ... ...
1
a0 a1 . . . . . . an1

0
0
..
.

; B =

b0 b1 . . . bnr1 bnr 0 . . . 0

1
(13.13)

Es un ejercicio relativamente sencillo verificar que, con estas definiciones, la funcion de


transferencia del sistema (13.11) coincide plenamente con (13.12).
Puesto que la diferencia de grados entre el polinomio en el numerador y el polinomio en
el denominador es precisamente de orden r, decimos que (13.11) tiene una entrada o grado
relativo igual a r, sobreentendiendo que tal denominacion es adjudicable a la u
nica entrada
del sistema.
El desarrollo en serie de McLaurin de la funcion de transferencia alrededor del punto
s = resulta en :

X
CB CAB
CAr1 B CAr B
CAi1 B
y(s)
=
+
+ ... +
+
+
.
.
.
=
(13.14)
u(s)
s
s
sr
sr+1
si
i=1
En virtud de que la primera potencia de r que puede surgir de la division de polinomios
indicada en (13.12) es r, luego de multiplicar ambos miembros de (13.13) por sr obtenemos
la siguiente expresion de y(s):
sr y(s) = CBsr1 u(s) + CABsr2 u(s) + . . . + CAr1 Bu(s) + CAr Bsu(s) + . . .
= CA

r1

Bu(s) + +CA Bsu(s) + . . . =

"
X
i=r

CA

i1

Bs

r+i

u(s)

(13.15)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

265

Esto nos dice que en un sistema lineal invariante en el tiempo, cuyo grado relativo sea
r, la derivada de orden r de y(t) contiene en forma explicita la presencia de la variable de
control u(t). Derivadas anteriores de y(t), es decir desde la de orden cero hasta la de orden
r 1 no cuentan con la presencia de u(t). En efecto, de las relaciones anteriores se tiene:
CB = CAB = . . . = CAr2 B = 0

(13.16)

y ademas, en virtud de que la r-esima derivada de la salida s depende explicitamente de la


entrada u, se cumpliraque:
CAr1 B 6= 0

(13.17)

Teniendo en cuenta estas relaciones obtengamos, con fines meramente pedagogicos, la


transformacion del sistema que hemos propuesto para la linealizacion de entrada-salida en
sistemas no lineales. Vemos que:
y = Cx
y = CAx + CBu = CAx
y = CA2 x + CABu = CA2 x
..
.
y (r1) = CAr1 x

(13.18)

Tomaremos estas primeras r 1 derivadas como nuevas variables de estado.


Designaremos a estas variables de estado como:
1 = Cx
2 = CAx
3 = CA2 x
..
.
r = CAr1 x

C
CA
..
.

CAr2

CAr1

x = Or x

(13.19)

Vemos que estas primeras r funciones son independientes por cuanto si fueran dependientes, existira una ecuacion diferencial lineal invariante en el tiempo satisfecha por la salida
y sus r 1 primeras derivadas (es decir una ecuacion lineal de orden r 1) que sera ademas
autonoma; es decir, independiente de u. Esto estara en contradiccion con la suposicion de
que (13.12) es cierta y que, por tanto, la salida y satisface una ecuacion diferencial de orden
n que s depende de u y sus n r primeras derivadas.
Con el objeto de obtener la transformacion que buscamos, definida sobre el espacio de
estado n-dimensional original, debemos completar la transformacion (13.18) en las n r
variables de estado que all faltan por definir. Estas nuevas variables solamente tendran que
ser linealmente independientes de las variables definidas anteriormente en (13.19).
Sea Enr una matriz de (n r) filas y n columnas de rango completo n r cuyas filas
ei estan constituidas por los vectores unitarios cuyas componentes son todas cero excepto

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

266

la i-esima. Las nuevas variables de estado complementarias a las definidas anteriormente


seran:

e1

..
x =
.

= Enr x =

enr

1
0
..
.

0 0 ...
1 0 ...
.
.. . .
. ..
.
0 0 ... 1

0 ...
0 ...
.. ..
. .
0 ...

0
0
..
.

(13.20)

Entonces:

C
CA
..
.

"
#
"
#

Or
r1
=
x=
CA

Enr

e1

..

(13.21)

enr
Las ecuaciones de estado y salida en nuevas coordenadas tendran la siguiente forma:
"

"

Or
Enr

"

y = c

"

Or
Enr

Or
Enr

#1 "

#1 "

"

Or
Enr

Bu
(13.22)

En cierto detalle, tales ecuaciones se escriben de la manera siguiente:

0
0
..
.

0 ...

1 ...

.. . .

.
.

"
#
0 0 0 0

.
.
.

y =

1
0
..
.

..
.

..
.

..
.

0
0
..
.

0
0
..
.

0
0
..
.

...
...
..
.

0
0
..
.

..
.

0
..
.

0
..
.

...
...
...
..
.

...
1
b0 b1 . . . bnr

1 0 ... 0 0

"

0
0
..
.
0
1
0
..
.

donde los asteriscos representan componentes cuyo valor poco interesa.

(13.23)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

267

De la expresion anterior es facil ver que la dinamica remanente que se obtiene cuando
= 0, resulta gobernada por:

0
..
.

0
..
.

b0 b1

...
...

0
0

...
1
. . . bnr

(13.24)

El polinomio caracterstico de la dinamica remanente esta dado entonces por:


b(s) = bnr snr + . . . + b1 s + b0

(13.25)

que es precisamente el polinomio en el numerador de la funcion de transferencia del sistema,


es decir, aquel polinomio que define los ceros del sistema lineal. Este hecho justifica entonces
plenamente que llamemos a la dinamica remanente del sistema no lineal dinamica de los
ceros. Si logramos hacer cero mediante control realimentado las primeras r variables de
estado, representadas por , entonces, la estabilidad de la dinamica de los ceros, es decir
aquella que queda internamente libre dentro del sistema, depende entonces de la ubicacion
de los ceros de la funcion de transferencia. Estos hechos seran trasladables plenamente al
caso no lineal general. Recordemos, sin embargo, que un sistema cuyos ceros (y polos) se
encuentren en el semiplano izquierdo del plano complejo se llama sistema de fase mnima,
mientras que un sistema que tenga al menos un cero de su funcion de transferencia en el
semiplano derecho del plano complejo recibe el nombre de sistema de fase no mnima. La
misma terminologa tendra acepciones aceptablemente similares en el caso no lineal.
Haremos ahora un ejemplo de aplicacion de las cuatro reglas que hemos propuesto para
efectuar la linealizacion de entrada-salida en un sistema no lineal.

Ejemplo 13.3: Descenso suave controlado en un planeta sin atm


osfera
Considerese el siguiente sistema dinamico controlado que representa la dinamica del modulo de
descenso vertical que se muestra en la figura anterior:
x 1 = x2

u
x3
= u

x 2 = g
x 3

y = x1 K

(13.26)

donde x1 es la posicion (altura) medida sobre el eje vertical, orientado positivamente hacia abajo
(es decir, x1 < 0 para alturas reales por sobre la superficie), x2 es la velocidad de descenso y x3
representa la masa combinada del vehculo y el combustible.
La variable u es el control y el producto u representa la velocidad de gasto de combustible
por unidad de tiempo. es la velocidad relativa de eyecci
on de los gases y es una constante de
proporcionalidad, tal que resulta ser la fuerza maxima de frenaje que puede imprimir la maquina

268

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

al modulo en su descenso. u esta restringida a tomar valores entre 0 y 1. g es la aceleracion de la


gravedad del planeta en cuestion. La salida del sistema representa el error de posicion respecto a
una altura fija de valor K < 0. Por lo general esta altura es peque
na (1 metro o algo as) de tal
manera que el problema de control consiste en llevar la posicion al valor x1 = K (es decir y = 0).
Mantener el modulo flotando a esta altura por un brevsimo tiempo y luego apagar el motor para
lograr un aterrizaje en caida libre desde muy baja altura.
Con el objeto de linealizar el sistema desde el punto de vista de entrada salida procedemos
a tomar las derivadas de la salida respecto al tiempo, expresadas en terminos de las variables de
estado. Tal como lo recomienda la primera regla dejaremos de tomar derivadas en el momento en
que aparezca el cotrol u explcitamente.
y = x1 K; y = x 1 = x2 ; y = x 2 = g

u
x3

(13.27)

El control u aparece entonces en la segunda derivada de la salida respecto del tiempo. En este
caso tenemos, de acuerdo a la primera regla que r = 2. El cambio de coordenadas parcial, sugerido
en las reglas anteriores, para las dos primeras variables de estada es entonces el siguiente:
z1 = x1 K; z2 = x2
x1 = z1 + K; x2 = z2

(13.28)

Es evidente que las dos primeras coordenadas son independientes entre s.


Una tercera variable de estado que pudieramos proponer es la representada por una funcion
cuya derivada no dependa del control. Calculamos la derivada de esta funcion :
= 3 (x);

3
3
x2 +
g
u
u
=
x1
x2
x3
x3

(13.29)

y vemos que tal funcion coordenada debera entonces satisfacer la siguiente relacion:
3 3
+
=0
x3 x2
x3

(13.30)

Una solucion a esta ecuacion en derivadas parciales esta dada por:


= 3 (x) = x2 ln(x3 )

(13.31)

La transformacion del sistema queda establecida por el cambio de coordenadas siguiente:


z1 = x1 K; z2 = x2 ; = x2 ln(x3 )

z2
x1 = z1 + K; x2 = z2 ; x3 = exp

(13.32)

El Jacobiano de la transformacion esta dado por:

1 0
0
z

0
Det
= Det 0 1
6= 0
=
x
x3

0 1 x3

(13.33)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

269

y por lo tanto la transformacion de coordenadas es invertible globalmente.


El sistema transformado queda entonces descrito por:
z1 = z2

z2
z2 = g u exp

= g

y = z1

(13.34)

Es facil ver que siempre podremos hallar una realimentaci


on del vector de estado de tal manera
que logremos un comportamiento lineal del error de posicion. En efecto, la ley de control dada por:

u=

2n z2 + n2 z1 + g
z2
exp

(13.35)

establece una dinamica del error en lazo cerrado gobernada por el sistema lineal asint
oticamente
estable a cero:
z1 = z2
z2 = 2n z2 n2 z1
y = z1

(13.36)

La ley de control en funcion de las coordenadas originales estara dada por;


u=

2n x2 + n2 (x1 K) + g
x3

(13.37)

Notemos sin embargo que la dinamica remanente, o dinamica de los ceros, esta representada
por una dinamica totalmente inestable dada por :
= g; (t) = gt + (0)

(13.38)

La variable tiene entonces la interpretaci


on de una velocidad virtual (es decir de naturaleza
no fsica) creciente correspondiente a un movimiento uniformemente acelerado. Es facil ver de la
transformacion de coordenadas propuesta que el crecimiento indefinido de la variable (inobservable
en lazo cerrado) cuando la velocidad z2 se ha estabilizado en cero, que la masa del vehculo tiende
exponencialmente a cero. En efecto, esto se corrobora a partir de la ecuacion diferencial de la masa
del vehculo, dada por la tercera ecuacion de (13.26), cuando en ella se substituye la ley de control
realimentado propuesta en (13.37), bajo condiciones de equilibrio para la velocidad y la posicion
(es decir x1 = K; x2 = 0). Esta ecuacion diferencial esta dada por :
g
x 3 = x3

(13.39)

lo cual establece, a las claras, un decrecimiento exponencial de la masa total del vehculo hasta
su desaparicion completa . Esto, evidentemente se
nala la naturaleza ideal, no fsica, del modelo
postulado, invalido por entero a partir del momento en que la masa del combustible se ha consumido
por completo. Mas a
un, la dinamica remanente solo apunta al hecho de que no se puede mantener

270

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

flotando el vehculo a la altura K de una manera indefinida pues la cantidad finita de combustible
habra de desaparecer por completo en un cierto momento. Por estas razones la maniobra de
mantener el vehculo flotando a una altura K s
olo se lleva a cabo moment
aneamente y luego se
procede a apagar la maquina principal del vehculo de descenso.

Introduciremos ahora la caracterizacion de la linealizacion de entrada-salida de un sistema


no lineal en terminos de campos vectoriales y derivadas direccionales de Lie.
En efecto, consideremos el sistema no lineal dado por:
x = f (x) + g(x)u
y = h(x)

(13.40)

Si las r 1 primeras derivadas no dependen de u vemos que debe cumplirse que


y = h(x)
y = Lf h(x)
y = L2f h(x)
..
.
(r1)
y
= Lr1
f h(x)

(13.41)

Lg h(x) = 0
Lg Lf h(x) = 0
..
.
r2
Lg Lf h(x) = 0

(13.42)

y tambien:

La r-esima derivada de la salida depende del control, por lo tanto debera cumplirse que:
y (r) = Lrf h(x) + Lg Lr1
f h(x)u

(13.43)

Lg Lr1
f h(x) 6= 0

(13.44)

con:

Definicion: Diremos que el sistema (13.40) tiene grado relativo r en un punto x0 , si existe
una vecindad N (x0 ) de x0 tal que se cumplen las siguientes condiciones:
Lg Ljf h(x) = 0; j = 0, 1, 2, . . . , r 2 para todo x en N (x0 )
Lg Lr1
f h(x0 ) 6= 0

(13.45)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

271

Un sistema no lineal que tenga grado relativo r admite una linealizacion de entradasalida que puede hacerse coincidente, en lazo cerrado con una ley de control realimentado
apropiada, con una dinamica lineal asintoticamente estable de orden r.
En efecto, si igualamos el segundo miembro de (13.43) a una expresion lineal de las
derivadas de la salida obtenemos:
(r1)
y (r) = Lrf h(x) + Lg Lr1
. . . m1 y m0 y
f h(x)u = mr1 y

(13.46)

donde los coeficientes se escojen de tal manera que el polinomio caracterstico dado por:
p(s) = sr + mr1 sr1 + . . . + m1 s + m0

(13.47)

tenga todas sus raices en el semiplano izquierdo del plano complejo.


En terminos de las derivadas direccionales, el control que logra tal linealizacion esta dado
por:
Lrf h(x) mr1 Lr1
f h(x) . . . m1 Lf h(x) m0 h(x)
u=
Lg Lr1
f h(x)

(13.48)

Utilizaremos las r primeras coordenadas de la transformacion sugerida por la primera de


las cuatro reglas dadas anteriormente a las r 1 primeras derivadas con respecto del tiempo
de la funcion de salida:
z1 = h(x); z2 = Lf h(x); . . . ; zr = Lr1
f h(x)

(13.49)

mientras que el resto de las coordenadas seran funciones arbitrarias 1 , . . . , nr

h(x)
Lf h(x)
..
.

"
#

r1
z
= (x) =
Lf h(x)

..

(13.50)

nr
estas coordenadas deberan escojerse de tal manera que satisfagan la condicion de rango
siguiente:

h(x)
Lf h(x)
..
.

"
#

r1

z
L
= rango
rango
f h(x)
x
x

..

nr

h(x)
x
Lf h(x)
x

..

Lr1 h(x)
= rango
f

..

nr
x

=n

(13.51)

272

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

Si esta condicion se cumple la transformacion (13.50) es al menos localmente invertible.


El sistema transformado se conoce con el nombre de Sistema en forma can
onica normal:
z1 = z2
z2 = z3
..
.
1
zr = Lrf h[1 (z, )] + Lg Lr1
f h[ (z, )]u
1 = q1 (z, ) + uw1 (z, )
..
.
nr = qnr (z, ) + uwnr (z, )
y = z1

(13.52)

donde las componentes del vector q y w se obtienen a partir de:


qj (z, ) = Lf r+j (1 (z, )); j = 1, . . . , n r
wj (z, ) = Lg r+j (1 (z, )); j = 1, . . . , n r
(13.53)
Una practica u
til consiste en definir las variables j (j = 1, 2, . . . , n r) de tal manera
que sus derivadas son independientes del control, es decir que ellas solo dependen de las
variables de estado tranformadas z y . Esto se logra exigiendo que las funciones r+j (j =
1, 2, . . . , n r) satisfagan:
wj = Lg j+r (x) = 0; j = 1, 2, . . . .n r

(13.54)

Esta condicion implica la resolucion de una ecuacion lineal en derivadas parciales.


La forma normal para la cual hemos logrado encontrar solucion al conjunto de ecuaciones
(13.54), esta dada por:
z1 = z2
z2 = z3
..
.
1
zr = Lrf h[1 (z, )] + Lg Lr1
f h[ (z, )]u
1 = q1 (z, )
..
.
nr = qnr (z, )
y = z1

(13.55)

Es evidente que podemos llevar, facilmente, una linealizacion parcial de la dinamica del
sistema si la r-esima ecuacion diferencial de (13.55) la igualamos a una expresion lineal en

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

273

las variables transformadas z. Tal como hicimos en (13.46):


1
Lrf h[1 (z, )] + Lg Lr1
f h[ (z, )]u = mr1 zr . . . m1 z2 m0 z1

(13.56)

es decir:
u=

Lrf h[1 (z, )] mr1 zr . . . m1 z2 m0 z1


1
Lg Lr1
f h[ (z, )]

(13.57)

Esta poltica de control conduce al sistema parcialmente lineal, y tambien parcialmente


asintoticamente estable, en lazo cerrado dado por:
z1 = z2
z2 = z3
..
.
zr = mr1 zr . . . m1 z2 m0 z1
1 = q1 (z, )
..
.
nr = qnr (z, )
y = z1

(13.58)

Es evidente que si los coeficientes constantes mi (i = 0, 1, . . . , r 1) se escojen apropiadamente entonces todas las variables desde z1 hasta zr convergen asintoticamente a cero.
La razon por la cual dijimos que la poltica de control (13.57) produce solo un sistema
parcialmente asintoticamente estable estriba en que la dinamica remanente, ahora claramente
exhibida en (13.58) a traves de la dinamica de las coordenadas , puede o no tener una
dinamica asintoticamente estable. Estudiaremos en cierto detalle la dinamica remanente.
En primer lugar vemos que la utilizacion del control u dado por (13.57) produce un
efecto de desacoplamiento sobre las variables del resto del sistema. Efectivamente, las r
primeras ecuaciones no dependen para nada de y por lo tanto este conjunto de variables se
ha hecho inobservable desde la variable de salida y del sistema. La dinamica remanente que
representan estas variables por lo tanto no tiene efecto alguno sobre la variable de salida, es
decir, su evolucion interna no logra influenciar el comportamiento de la variable de salida del
sistema en lazo cerrado. En segundo lugar es facil verificar que en virtud de la construccion
que hemos hecho para definir las variables las mismas estan desprovistas de la presencia del
control en todas sus ecuaciones. Esta es una de las razones por las cuales es imprescindible
tener una evaluacion inequvoca de la dinamica remanente pues si ella es inestable, no lo
notaremos a la salida mientras que internamente en el sistema un cierto n
umero de estados
estaran creciendo ilimitadamente y no hay manera alguna de que el control u pueda remediar
esta situacion. La dinamica remanente es por tanto inalterable por realimentaci
on del vector
de estado. Una vez que z y sus r primeras derivadas se han hecho cero la dinamica remanente

274

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

esta dada por :


1 = q1 (0, )
..
.
nr = qnr (0, )
(13.59)
En forma abreviada expresamos esta ecuacion autonoma como:
1 = q(0, ) = q0 ()

(13.60)

Esta dinamica autonoma recibe el nombre de din


amica de los ceros y juega un papel
importantsimo en la teora moderna de los sistemas no lineales.
Supondremos, sin perdida de generalidad, que la ecuacion diferencial autonoma exhibe
un punto de equilibrio en el origen, es decir en = 0. Es facil ver que el comportamiento
asintotico de (13.58) se aproxima al comportamiento que tenga el sistema (13.60).
Considerese la linealizacion de (13.60) alrededor del origen. En este caso las variables
incrementales que aproximan la linealizacion : = 0 = , coinciden con las variables .
La linealizacion resulta entonces en:

q0 ()
=

=0

(13.61)

La estabilidad del sistema lineal invarante en el tiempo (13.61) depende de los autovalores
de la matriz constante del sistema. Haremos las siguientes definiciones:
Diremos que el sistema (13.40) es de fase mnima si todos los autovalores de la matriz
del sistema (13.61) tienen parte real estrictamente negativa. Es decir, un sistema es de
fase mnima si la dinamica de los ceros es asintoticamente estable. Si por lo menos uno
de los autovalores tiene parte real estrictamente positiva diremos entonces que el sistema
es de fase no mnima. Un sistema sera entonces de fase no mnima si su dinamica de los
ceros es inestable. Finalmente puede ocurrir que absolutamente todos aquellos autovalores
(o por lo menos uno) de la matriz constante del sistema (13.61) que no tienen parte real
estrictamente negativa tengan parte real nula. En tal caso no podremos concluir nada sobre
la establidad o no de la dinamica de los ceros. En este caso diremos que la dinamica de
los ceros exhibe un comportamiento crtico, El estudio de estos casos en mayor profundidad
requiere de herramientas proporcionadas por la teora de las variedades centrales. Tal topico
escapa al caracter introductorio de estas notas.
La dinamica de los ceros puede tener m
ultiples puntos de equilibrio. Las definiciones
anteriores se trasladan entonces a cada punto de equilibrio. En caso de estabilidad asintotica
de un cierto punto de equilibrio de la dinamica de los ceros, diremos que el sistema es
localmente de fase no mnima alrededor del equilibrio hallado, en caso contrario diremos que
el sistema es localmente de fase no mnima alrededor de tal punto de equilibrio. Podran

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

275

existir tambien puntos de equilibrio para los cuales la estabilidad de la dinamica de los ceros
sea localmente crtica.

Ejemplo 13.4:
El siguiente sistema no lineal, visto en el captulo 2, representa, de manera muy aproximada,
la dinamica de una reaccion atomica en un proceso de fision nuclear.
u
x1 + x2
L

x1 x2
L

x 1 =
x 2 =

(13.62)

donde x1 representa la poblacion de neutrones, x2 es la poblacion de precursores y la variable


de control u recibe el nombre de reactividad. Los parametros , y L son constantes conocidas.
El objetivo del control sera el de mantener la poblacion de neutrones a un nivel constante N ,
preestablecido. Tomaremos entonces como la salida del sistema a la variable de error del nivel de
concentracion de los neutrones: y = h(x) = x1 N . El valor deseado de y es por tanto cero.
Los vectores f (x) y g(x), as como la funcion de salida h(x), estan dados en este caso por:
"

f (x) =

x1
x2 L

L x1 x2

x1 x2
L

"

1
1

"

; g(x) =

1
L x1

h(x) = x1 N

(13.63)

El sistema es evidentemente de grado relativo r = 1 de manera local pues:


Lg h(x) =

1
x1
L

(13.64)

En la recta x1 = 0 del plano de coordenadas el sistema no tiene grado relativo definido. Como
en este caso la propia variable x2 tiene una derivada temporal que es independiente del control u,
en este caso tenemos al sistema directamente escrito en forma canonica normal. El u
nico cambio
que haremos sera el necesario para hacer que el punto de equilibrio del sistema transformado sea
el origen. La transformacion difomorfica que lleva (13.62) a la forma canonica normal con punto
de equilibrio en el origen esta dada entonces por:
z1 = x1 N
z2 = x2

(13.65)

El sistema transformado es:


1

z1 = (z1 + N ) + z2 + u (z1 + N )
L
L

z2 =
(z1 + N ) z2
L
y = z1

(13.66)

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

276

Si adoptamos por control realimentado una ley de control que linealice la primera de las ecuaciones y establezca un comportamiento asint
oticamente estable entonces:
1

z1 = (z1 + N ) + z2 + u (z1 + N ) = m0 z1 ; m0 > 0


L
L

(13.67)

es decir el control linealizante es:


u=

(m0 L + )z1 Lz2 + N


(z1 + N )

(13.68)

y el sistema en lazo cerrado estara dado por :


z1 = m0 z1

(z1 + N ) z2
z2 =
L
y = z1

(13.69)

Puesto que la salida y = z1 tiende a cero, la dinamica remanente se escribe como:

z2 = z2 +

N = z2 N
L
L

(13.70)

Esta dinamica es asintoticamente estable a su punto de equilibrio dado por z2 = N/(L)


pues la constante es positiva y por lo tanto el u
nico autovalor del sistema autonomo (13.70) esta
ubicado en el semiplano izquierdo del plano complejo. El sistema es por lo tanto de fase mnima.
La sencillez del modelo no permite explicar entonces por que en algunas ocasiones han ocurrido
accidentes desastrosos en plantas atomicas que involucran una inestabilidad en el reactor.

Ejemplo 13.5: Control de un uniciclo


Considerese el problema de maniobrar un uniciclo, provisto de un motor, que avanza con velocidad constante V sobre un plano equipado con coordenadas cartesianas dadas por el par ordenado
(x1 , x2 ) que describe la posicion del punto de contacto, La entrada de control esta representada
por la rata de variacion del angulo de direccion = x3 , medido con respecto al eje x1 . El objetivo
de control consiste en maniobrar el uniciclo para hacer que la trayectoria coincida con un crculo de
radio R, previamente marcado sobre el plano, y cuyo centro es el origen 0 de coordenadas (vease la
figura). Por simplicidad, suponemos que toma valores en el intervalo (, /2) y, por lo tanto
solo se consideran movimientos en contra del sentido de las agujas del reloj.
Es facil ver que el movimiento del uniciclo esta descrito por:

x 1 = V cos(x3 )
x 2 = V sin(x3 )
x 3 = u

(13.71)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

277

Tomaremos como salida del sistema una funcion que mida el error de posicion del punto de
contacto del uniciclo con respecto al crculo establecido. Es decir:
y = x21 + x22 R2 = 2 R2

(13.72)

Utilizaremos en la solucion del problema de control propuesto los conceptos desarrollados anteriormente de grado relativo y de linealizacion de entrada-salida.
El problema de control se traduce entonces en estabilizar a cero la salida del sistema (13.72)
y obtener as un movimiento perfectamente circular de radio R para el uniciclo. Notese que bajo
seguimiento perfecto del crculo d/dt = 0.
En primer lugar, vemos que el sistema es de grado relativo igual a dos, pues la segunda derivada
de la salida y = 2 R2 depende explcitamente de la variable de control u. Esto quiere decir que
tendremos, necesariamente, una dinamica de los ceros unidimensional.
Definimos:

V cos(x3 )
0

f (x) = V sin(x3 ) ; g(x) = 0 ; h(x) = x21 + x22 R2


0
1

(13.73)

Verificamos que el grado relativo es efectivamente igual a 2:

Lg h(x) = [2x1 2x2 0] 0 = 0


1

V cos(x3 )

Lf h(x) = [2x1 2x2 0] V sin(x3 ) = 2V [x1 cos(x3 ) + x2 sin(x3 )]


0

Lg Lf h(x) = [2V cos(x3 ) 2V sin(x3 ) 2V (x2 cos(x3 ) x1 sin(x3 ))] 0


1
= 2V (x2 cos(x3 ) x1 sin(x3 )) 6= 0
El sistema tiene un grado relativo no bien definido en aquellos puntos del sistema de coordenadas
donde la u
ltima expresion se anula. Es decir donde:
V (x2 cos(x3 ) x1 sin(x3 )) = 0
Esta condicion de singularidad tiene una interpretaci
on fsica inmediata. En efecto, la igualdad
anterior se cumple cuando:
x2
= tan(x3 )
x1

(13.74)

Es decir la tangente del angulo de direccion coincide con la tangente del angulo que describe
la posicion del punto de contacto. Es decir, donde el angulo que describe la posicion del punto
de contacto en el sistema coordenado del plano y el angulo de direccion del uniciclo coinciden.
Esta situacion se corresponde con una trayectoria en lnea radial hacia el crculo (vease la figura
siguiente)

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

278

Las dos primeras componentes de la transformacion de coordenadas z = (x) que lleva el


sistema a la forma canonica normal estan dadas por:
z1 = 1 (x) = x21 + x22 R2
z2 = 2 (x) = Lf h(x) = 2V [x1 cos(x3 ) + x2 sin(x3 )]

(13.75)

Como tercera coordenada pudieramos tomar a x3 misma. Sin embargo, a fin de ser consistentes
con la definicion que hemos dado de forma canonica normal, busquemos una funcion = 3 (x)
cuya primera derivada respecto del tiempo no dependa de la variable de control u. Puesto que la
expresion de la derivada de tal funcion resulta ser:
3 (x)
3 (x)
3 (x)
= 3 (x) =
V cos(x3 ) +
V sin(x3 ) +
u
x1
x2
x3
Vemos entonces que tal funcion debe cumplir con la relacion:
3 (x)
=0
x3

(13.76)

(13.77)

Una funcion candidata que cumple con la condicion (13.77), y ademas tiene sentido fsico estara
dada por:

x2
= 3 (x) = tan
(13.78)
x1
Esta coordenada evidentemente representa el angulo que forma con el eje x1 la recta que une el
punto de contacto del uniciclo al plano con el origen de coordenadas. Es decir, el angulo de posicion
del punto de contacto del uniciclo en coordenadas polares. Finalmente tenemos la transformacion
de coordenadas como:
1

z1 = 1 (x) = x21 + x22 R2


z2 = 2 (x) = 2V [x1 cos(x3 ) + x2 sin(x3 )]


q
x2
= 2V x21 + x22 cos x3 tan1
x1

x
2
= 3 (x) = tan1
x1
y su inversa:
x1 =

(13.79)

z1 + R2 cos()

z12 + R2 sin()

x2 =

z
2
x3 = + cos
2V z1 + R2
El sistema en forma canonica normal es entonces el siguiente:
1

z1 = z2
z2 = 2V

V u z1 + R 2 1
s

z1 + R2

z
2
2V z1 + R2

z
2
2V z1 + R2

(13.80)

(13.81)

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

279

Del sistema anterior resulta claro, luego de algunas manipulaciones algebraicas elementales que
el control :
u=

2V 2 + 2n z2 + n2 z1
q

2V

z1 + R2

(13.82)

z2 2
2V

produce un sistema en lazo cerrado dado por :


z1 = z2
z2 = 2n z2 n2 z1
s

V
=
z1 + R2
y = z1

z
2
1
2V z1 + R2

(13.83)

Escogiendo los parametros constantes y n apropiadamente podemos garantizar que las variables z1 y z2 convergen asintoticamente a cero. En otras palabras el error de posicion respecto del
circulo y su derivada se anulan asintoticamente. Esto significa que el objetivo de control se logra
mediante la ley de control (13.82). De la u
ltima ecuacion diferencial de (13.83) obtenemos, bajo
la suposicion de establizacion a cero de las variables z1 y z2 , la dinamica de los ceros o dinamica
remanente:
=

V
R

(13.84)

Es evidente que la variable crece indefinidamente a medida que transcurre el tiempo y por
lo tanto la dinamica de los ceros del sistema es inestable. El sistema es, por lo tanto, de fase
no mnima. Este es uno de esos casos excepcionales donde la inestabilidad de la dinamica de los
ceros inestable no conlleva un efecto desastroso pues es facilmente explicable que la naturaleza
del problema formulado implica necesariamente que el angulo de posicion del punto de contacto
debe crecer indefinidamente a medida que el uniciclo avanza ininterrumpidamente sobre el circulo
dibujado en el plano. Esta inestabilidad no implica mas que el crecimiento de un angulo que hasta
cierto punto es una variable inmaterial, imaginaria.
z1 = 1 (x) = x21 + x22 R2
z2 = 2 (x) = 2V [x1 cos(x3 ) + x2 sin(x3 )]
= x3

(13.85)

y su inversa:

x2
x3

z
2
2V z1 + R2

p
z
2
z1 + R2 sin cos1
=
2V z1 + R2
=

x1 =

z1 + R2 cos cos1

(13.86)

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

280

En este caso la forma canonica normal se obtiene como:


z1 = z2
z2

z2
= 2V V u z1 + R2
2V

= u

(13.87)

Es facil ver que la ley de control que linealiza la forma normal del sistema esta dada por la
misma expresion (13.82). El sistema en lazo cerrado esta dado entonces por:
z1 = z2
z2 = 2n z2 n2 z1
2V 2 + 2n z2 + n2 z1
q
=
z2 2
2V z1 + R2 2V
y = z1

(13.88)

La estabilizacion a cero de las variables z1 y z2 implica la siguiente dinamica remanente:


V
R

(13.89)

Obtenemos la misma expresion anterior a pesar del significado diferente de la variable en esta
ocasion. La explicacion de la inestabilidad de esta variable es exactamente igual a la explicacion
anterior. En efecto, el crecimiento indefinido del angulo de direccion del uniciclo con una velocidad
constante es provocado por la necesidad de mantener la trayectoria del uniciclo sobre el crculo
dibujado en el plano. Con el objeto de relacionar mas estrechamente este resultado con el anterior
notese que de las ecuaciones de transformacion (13.86) obtenemos la siguiente relacion:

tan1

x2
x1

= cos1

z
2
2V z1 + R2

(13.90)

En condiciones de estabilizacion de las variables z1 y z2 obtenemos la siguiente relacion entre


el angulo de posicion del punto de contacto y el angulo de direccion del uniciclo:

= tan

x2
x1

(13.91)

Esta relacion es enteramente compatible con el logro del objetivo del control, tal como lo muestra
la figura siguiente:
Consideremos ahora un ejemplo donde una dinamica de los ceros puede ser estable o inestable
dependiendo de que variable adoptemos como variable de salida del sistema. Trataremos el problema de estabilizar un sistema que exhibe la propiedad de ser de fase mnima desde cierta salida
y el cual es imposible de estabilizar adoptando por salida una variable diferente pues el sistema
desde esta nueva salida pierde radicalmente la propiedad de ser de fase mnima y se convierte en
un sistema de fase no mnima.

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

281

Ejemplo 13.6: Control realimentado del modelo promedio de un convertidor BuckBoost


Considerese el siguiente modelo promedio del convertidor Buck-Boost que se muestra en la
figura:
x 1 = 0 x2 u(0 x2 b)
x 2 = 0 x1 1 x2 + u0 x1
(13.92)

donde x1 = I/ L, x2 = V / C representan valores normalizados


promedio de la corriente de

entrada y del voltaje de salida respectivamente, b = E/ L es el voltaje externo normalizado


del
cual suponemos tiene un valor negativo (es decir polaridad invertida) mientras que, 0 = 1/ LC
y 1 = 1/RC son, respectivamente, la frecuencia de oscilacion natural del circuito LC de entrada
y la constante de tiempo del circuito RC de salida. La relacion de trabajo asociada a la posicion
del conmutador act
ua como entrada de control del sistema y se designa mediante u. Esta variable
toma valores en el conjunto cerrado [0, 1]. Los puntos de equilibrio del sistema promedio (13.92),
para un valor constante U de la relacion de trabajo, se expresan como:
u = U ; X1 (U ) =

1 U b
;
2
0 (1 U )2

X2 (U ) =

Ub
0 (1 U )

(13.93)

Tomaremos en una primera instancia a la corriente de entrada normalizada promedio como


variable de salida del sistema. Es decir y = x1 . El sistema (13.92) se define mediante los siguientes
campos vectoriales y funcion de salida:
"

f (x) =

0 x2
0 x1 1 x2

"

; g(x) =

b 0 x2
0 x1

; h(x) = x1

(13.94)

El grado relativo del sistema es, evidentemente, igual a uno pues:


"

Lg h(x) = [1 0]

b 0 x2
0 x1

= b 0 x2 6= 0

(13.95)

Las consideraciones que siguen son validas, por tanto, para puntos y trayectorias que no se
encuentran sobre, o no intersectan,la linea b 0 x2 = 0.
No es dificil constatar que el sistema (13.92) se encuentra ya en forma canonica normal y por
lo tanto la primera variable de estado transformada puede definirse, directamente, como el error
de la corriente promedio de entrada con respecto a un cierto valor de equilibrio deseado, el cual
siempre se calcula en funcion del valor de equilibrio deseado, X2 (U ), para el voltaje normalizado
promedio de salida a partir de la siguiente relacion obtenida directamente de (13.93):
X1 (U ) =

1
1
X2 (U ) 2 X22 (U )
0 b
b

(13.96)

De forma similar, la segunda variable de estado transformada pudiera ser directamente el voltaje
promedio de salida x2 , sin embargo, su derivada depende de la variable de control u. Trataremos,
por lo tanto, de expresar la coordenada complementaria (en este caso, la segunda coordenada de
estado) mediante una funcion cuya derivada respecto del tiempo no dependa de la variable de

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

282

control u. Esto facilita mucho las cosas para el momento de evaluar la dinamica de los ceros. Tal
funcion coordenada, designada mediante , tiene por derivada respecto del tiempo la expresion
siguiente:
2 (x)
2 (x)
[0 x2 u(0 x2 b)] +
[0 x1 1 x2 + u0 x1 ]
= 2 (x) =
x1
x2

2 (x)
2 (x)
2 (x)
2 (x)
=
0 x2
[0 x1 + 1 x2 ] + u
(0 x2 b) +
0 x1 (13.97)
x1
x2
x1
x2
para que la funcion 2 (x) tenga una derivada respecto del tiempo independiente de la relacion de
trabajo u la expresion anterior nos dice que esta debe satisfacer:

2 (x)
2 (x)
(0 x2 b) +
0 x1 = 0
x1
x2

(13.98)

Verificamos facilmente que una solucion para esta ecuacion en derivadas parciales esta dada
por:
= 2 (x) = 02 x21 + (0 x2 b)2

(13.99)

La transformacion que permite escribir el sistema (13.92) en forma canonica normal esta dada
por:
z1 = x1 X1 (U )
= 2 (x) = 02 x21 + (0 x2 b)2

(13.100)

y la transformacion inversa:
x1 = z1 + X1 (U )
x2 =

b
+
0

[z1 + X1 (U )]2
02

(13.101)

El Jacobiano de la transformacion (13.100), dado por:

Det
x

"

z1

"

= Det

1
0
2
20 x1 20 (0 x2 b)

= 20 (0 x2 b) 6= 0

(13.102)

Lo cual indica que la transformacion a realizarse, as como la linealizacion parcial que de ella
depende, es valida para puntos alejados de la lnea: x2 = b/0 , tal como era de esperarse pues
la singularidad para el grado relativo coincide siempre con la singularidad del Jacobiano de la
transformacion parcialmente linealizante.
Vemos que esta restriccion sobre la variable x2 es compatible con la que debe privar sobre
la variable a fin de que esta sea real. En efecto, de la ecuacion (13.101) vemos que para que la
transformacion (13.100) sea entre valores reales de las variables y no se involucren valores complejos,
carentes de realidad o interpretacion fsica, la variable debe cumplir la siguiente restriccion:
02 x21

13.1. FORMAS CANONICAS


NORMALES, DINAMICA
DE LOS CEROS

283

Pero de (13.100) vemos que siempre cumple esta condicion, y adopta la igualdad en aquellos
valores para los cuales se cumple que: x2 = b/0 . De forma tal que nuestras consideraciones se han
de limitar a aquella region del plano de coordenadas originales donde se cumpla que:
x2 >

b
0

El signo de las desigualdades es consistente con el hecho de ser el voltaje normalizado de


alimentacion, b, una cantidad negativa.
La forma canonica normal del modelo promedio del convertidor Buck-Boost se escribe entonces
como:
q

z1 = b + (1 u) 02 [z1 + X1 (U )]2

202 b(z1

+ X1 (U )) 21 b +

02 [z1

+ X1

(U )]2

02 [z1 + X1 (U )]2

y = z1

(13.103)

El control parcialmente linealizante del modelo promedio puede calcularse de imponer a la


dinamica del error de la corriente normalizada promedio de entrada el comportamiento siguiente:
z1 = m0 z1 ; m0 > 0

(13.104)

El control requerido resulta en:


m0 z1 + b

u=1+ q

(13.105)

02 [z1 + X1 (U )]2

que en coordenadas originales se escribe como:


u=

m0 [x1 X1 (U )] + 0 x2
0 x2 b

(13.106)

El sistema en lazo cerrado se obtiene de sustituir (13.106) en (13.103) y resulta ser entonces:
z1 = m0 z1

= 202 b(z1 + X1 (U )) 21 b +

02 [z1 + X1 (U )]2

02 [z1 + X1 (U )]2

y = z1

(13.107)

De esta expresion obtenemos la dinamica de los ceros por substitucion directa de la condicion
z1 = 0 en la segunda ecuacion de(13.107):

= 21

q
2b
0 X1 (U ) 02 [X1 (U )]2 21 b 02 [X1 (U )]2
1

(13.108)

Es facil verificar, por substitucion directa en el miembro derecho de la ecuacion (13.108), que
un punto de equilibrio para este sistema autonomo esta dado por:
(U ) = 02 X12 (U ) + [0 X2 (U ) b]2

(13.109)

ENTRADASALIDA
CHAPTER 13. LINEALIZACION

284

Este punto de equilibrio es asintoticamente estable como se puede verificar por linealizacion
alrededor del punto de equilibrio de (13.108).
Si en lugar de haber utilizado la variable definida en (13.99) hubiesemos analizado el sistema
directamente a partir de las ecuaciones (13.92) utilizando para ello la transformacion mucho mas
sencilla:
z1 = x1 X1 (U )
= x2

(13.110)

Vemos que la forma canonica normal con punto de equilibrio en z1 = 0 esta dada por:
z1 = 0 u(0 b)
= 1 (1 u)0 (z1 + X1 (U ))

(13.111)

El control linealizante es, simplemente:


u=

m0 z1 + 0
(0 b)

(13.112)

y el sistema en lazo cerrado:


z1 = m0 z1
= 1 +

b + m0 z1
0 (z1 + X1 (U ))
0 b

(13.113)

la dinamica de los ceros se obtiene entonces inmediatamente como:


= 1 +

b0 X1 (U )
0 b

(13.114)

Bibliography
Bahram, S. and M. Hassul (1993). Control System Design using Matlab. Prentice Hall. Englewood Cliffs, New Jersey.
Dorato, P., C. Abdallah and V. Cerone (1995). LinearQuadratic Control:An Introduction.
Prentice Hall. Englewood Cliffs, New Jersey.
Doyle, J.C., B.A. Francis and A.R. Tannenbaum (1992). Feedback Control Theory. Macmillan. New Jersey.
Franklin, G.F., J.D. Powell and A.R. Emami-Naeini (1994). Feedback Control of Dynamic
Systems. third ed.. Addison Wesley. New York.
Isidori, A. (1995). Nonlinear Control Systems. Communication and Control Engineering
Series. third ed.. Springer. Berlin.
Kailath, T. (1980). Linear Systems. Prentice Hall Inc.. Englewood Cliffs, New Jersey.
Marino, R. and P. Tomei (1995). Nonlinear Control Design: Geometric, adaptive and robust.
Information and Systems Science Series. Prentice Hall. London.
Nijmeijer, H. and A. van der Schaft (1990). Nonlinear Dynamical Control Systems. SpringerVerlag. New York.
Ogata, K. (1996). Modern Control Engineering. third ed.. Prentice Hall. New York.
Rugh, W.J. (1986). The extended-linearization aproach for nonlinear systems problems.
In: Algebraic and Geometric Methods in Nonlinear Control Theory (M.Fliess and
M. Hazewinkel, Eds.). pp. 285309. D. Reidel Publishing Company. Dordrecht.
Rugh, W.J. (1987). Design of nonlinear pid controllers. AICHE Journal 33(10), 17381742.
Rugh, W.J. (1991). Analytical framework for gain scheduling. IEEE Control Systems
11(1), 7984.
Sira-Ramrez, Hebertt (1994a). Control de sistemas no lineales mediante linealizacion exacta.
Technical report. Universidad de Los Andes. CUADERNOS DE CONTROL, #3-94,
Maestra en Ingeniera de Control.
285

286

BIBLIOGRAPHY

Sira-Ramrez, Hebertt (1994b). Control de sistemas no lineales por linealizacion aproximada.


Technical report. Universidad de Los Andes. CUADERNOS DE CONTROL, #1-94,
Maestra en Ingeniera de Control.
Sira-Ramrez, Hebertt (1994c). Control de sistemas no lineales por linealizacion extendida.
Technical report. Universidad de Los Andes. CUADERNOS DE CONTROL, #2-94,
Maestra en Ingeniera de Control.
Slotine, J.J. and W. Li (1991). Applied Nonlinear Control. Prentice-Hall. New York.
Smith, C.A. and A.B. Corripio (1985). Principles and Practice of Automatic Control. John
Wiley & Sons. New York.
Vidyasagar, M. (1993). Nonlinear Systems Analysis. second ed.. Prentice Hall. Englewood
Cliffs, New Yersey.
Wong, T.H. (1986). Design of a magnetic levitation control system: An undergraduate
project. IEEE Trans. on Educ. E-29(4), 196200.

Das könnte Ihnen auch gefallen