Sie sind auf Seite 1von 726

CONTROL AUTOMTICO

Teora de diseo, construccin de prototipos,


modelado, identificacin y pruebas experimentales
Victor Manuel Hernndez Guzmn
Ramn Silva Ortigoza
Roberto Valentn Carrillo Serrano
COLECCIN CIDETEC
C
O
N
T
R
O
L

A
U
T
O
M

T
I
C
O
V
i
c
t
o
r

M
a
n
u
e
l

H
e
r
n

n
d
e
z

G
u
z
m

n

R
a
m

n

S
i
l
v
a

O
r
t
i
g
o
z
a
R
o
b
e
r
t
o

V
a
l
e
n
t

n

C
a
r
r
i
l
l
o

S
e
r
r
a
n
o
El Centro de Innovacin y Desarrollo Tecnolgico en Cmputo del Instituto Politcnico Nacional,
presenta un libro cuyo objetivo es el de contribuir hacia la reduccin de la brecha existente entre la
teora y la prctica en la enseanza del Control Automtico. Por esta razn, aunque el contenido del
libro es de nivel Licenciatura puede ser de gran utilidad incluso para aquellas personas involucradas
en el proceso enseanza-aprendizaje del Control Automtico en el nivel de Posgrado.
La caracterstica principal de esta obra es que se describe de manera detallada cmo disear, construir
y probar experimentalmente varios sistemas de control. Para ello, primero se describe la tarea que
debe realizar el sistema de control bajo estudio y se obtiene su modelo matemtico. Luego, se explica
de manera detallada cmo construir el prototipo experimental y cmo estimar los valores numricos
de los parmetros del modelo obtenido previamente (identificacin experimental del modelo).
Entonces se disea el controlador correspondiente utilizando la teora presentada en los primeros
captulos de la obra. Finalmente, se muestra cmo construir el controlador diseado previamente
utilizando electrnica analgica o digital y se presentan los resultados obtenidos experimentalmente.
El libro es especialmente til para estudiantes y profesores en las carreras de Ingeniera Elctrica,
Electrnica, Mecnica, Mecatrnica e incluso Robtica.
Instituto Politcnico Nacional
Victor Manuel Hernndez Guzmn. Naci
en Quertaro, Qro., Mxico. Recibi el ttulo
de Ingeniero Industrial en Elctrica por parte
del Instituto Tecnolgico de Quertaro en
1988, el grado de Maestro en Ciencias en
Ingeniera Elctrica (Control) por parte del
Instituto Tecnolgico de la Laguna, en
Torren, Coah., en 1991 y el grado de Doctor
en Ci enci as en Ingeni er a El ctri ca
(Mecatrnica) por parte del CINVESTAV-
IPN, en Mxico, D.F., en 2003. Actualmente
es Profesor en los programas de Licenciatura y
Maestra en Instrumentacin y Control de la
Universidad Autnoma de Quertaro. Su
trabajo de investigacin trata sobre el control
de robots manipuladores y sistemas electro-
mecnicos. Tiene particular inters en la
construccin de prototipos didcticos para la
enseanza de tcnicas de control clsicas y
modernas (nolineales).
Roberto Valentn Carrillo Serrano. Naci
en Quertaro, Qro., Mxico en 1976. Recibi
el ttulo de Ingeniero en Instrumentacin y
Control de Procesos por la Universidad
Autnoma de Quertaro, donde tambin
obtuvo los grados de Maestro en Ciencias en
Instrumentacin y Control Automtico, y de
Doctor en Ingeniera en 2000, 2008 y 2011
respectivamente. Trabaj en Kellogg de
Mxicode 1999 a 2006. Las reas de inters del
Dr. Carri l l o Serrano son l os robots
manipuladores, control de mquinas elctricas
y control de si stemas mecatrni cos.
Actualmente es Profesor en el programa de
Licenciatura en Ingeniera en Automatizacin
y de la Maestra en Instrumentacin y Control
Automtico de la Universidad Autnoma de
Quertaro, adems de ser miembro del
Sistema Nacional de Investigadores, Mxico.
En cuanto a publicaciones se refiere, estas se
encuentran en estndares internacionales que
pertenecen a la base de datos Journal Citation
Reports (JCR) e ISI-Thomson.
Ramn Silva Ortigoza. Recibi el ttulo de
Licenciado en Electrnica por la Benemrita
Universidad Autnoma de Puebla en 1999, y
los grados de MaestroyDoctor en Ciencias en
Ingeniera Elctrica (Opcin Mecatrnica)
por el CINVESTAV-IPN, en 2002 y 2006,
r e s pe c t i v a me nt e . Ac t ua l me nt e , e s
Investigador del Departamento de Posgrado
del rea de Mecatrnica en el CIDETEC del
InstitutoPolitcnicoNacional, y miembrodel
Sistema Nacional de Investigadores. Es
coautor del libroControl Design Techniques
in Power Electronics Devices (Springer-
Verlag, London, 2006), y coeditor del libro
Mecatrnica (Coleccin CIDETEC,
Mxico, 2010). Se ha desempeado como
jurado en el Premio de Ingeniera de la
Ci udad de Mxi co y Premi o a l a
Investigacin en el IPN, as comoEvaluador
de Programas de Posgrado presentados en el
marco del PNPC de CONACYT. Sus reas
de inters incluyen el control de sistemas
mecatrnicos, la robtica mvil y el control
aplicadoa electrnica de potencia.
Victor Manuel Hernandez Guzman
Ramon Silva Ortigoza
Roberto Valentn Carrillo Serrano
CONTROL AUTOM

ATICO
Teora de dise no, construccion de prototipos,
modelado, identicacion y pruebas
experimentales
Mexico, D.F.
Enero 2013.
Control Automatico
Teora de dise no, construccion de prototipos,
modelado, identicacion y pruebas experimentales
Autores:
Victor Manuel Hernandez Guzman
Ramon Silva Ortigoza
Roberto Valentn Carrillo Serrano
Primera Edicion 2013
D.R. c 2013
Instituto Politecnico Nacional
Luis Enrique Erro s/n.
Unidad Profesional Adolfo Lopez Mateos
Zacatenco, 07738, Mexico, D.F.
CIDETEC
Av. Juan de Dios Batiz S.N. esq. Miguel Othon de Mendizabal
Col. Nueva Industrial Vallejo
Del. Gustavo A. Madero C.P. 07700
ISBN: 978-607-414-362-1
Hecho en Mexico / Made in Mexico
V
A mi esposa, padres y hermanos.
Victor.
Para mis maravillosos hijos, Rhomina y Joserhamon, y a mi madre.
Ramon.
A Dios, a mis padres, a mi esposa, a mis profesores y alumnos.
Roberto.
Prefacio
El Control Automatico es una de las disciplinas que soporta de manera
importante el tecnologicamente avanzado modo de vida que conocemos hoy
en da. Sus aplicaciones se encuentran en casi todas las actividades que el
ser humano realiza en el siglo XXI: desde el funcionamiento del telescopio
espacial Hubble y de numerosas naves espaciales hasta el refrigerador que se
encuentra en los hogares asegurando la conservacion de los alimentos. Desde
los depositos de agua residenciales hasta las grandes industrias que producen
todos los satisfactores de los seres humanos: automoviles, aviones, alimentos,
bebidas y medicinas, por mencionar algunos.
Aunque se sabe que las primeras aplicaciones del Control Automatico apa-
recieron hace mas de 2000 a nos, fue la Revolucion Industrial la que detono su
desarrollo como un conjunto de conocimientos cientcos destinados a resol-
ver problemas tecnologicos. Desde entonces, el uso del Control Automatico
ha sido fundamental para que las actividades productivas del ser humano se
hagan cada vez mas ecaces incrementando la calidad y la repetitibilidad de
los productos.
Por esta razon, los cursos sobre Control Automatico se han hecho comunes
en las carreras de Ingeniera Electrica, Electronica, Mecanica, Qumica y, mas
recientemente, Mecatronica y Robotica. Sin embargo, el hecho de que las tecni-
cas de Control Automatico convencionales esten soportadas por herramientas
matematicas ha planteado tradicionalmente una dicultad en la ense nanza de
esta disciplina: para aprender a dise nar sistemas de control primero se debe
tener un buen conocimiento de como se resuelven las ecuaciones diferencia-
les lineales de coecientes constantes mediante el uso de la transformada de
Laplace. Este hecho plantea un importante obstaculo dado que la solucion
de ecuaciones diferenciales es algo que normalmente es complicado para la
mayora de los estudiantes de Licenciatura. El problema se complica mas a un
porque en Control Automatico lo mas importante de resolver una ecuacion di-
ferencial es saber interpretar el resultado cuando la mayora de los estudiantes
de Licenciatura se quedan perdidos en como resolver la ecuacion diferencial.
VIII Prefacio
Otra dicultad en la ense nanza del Control Automatico es como mostrar
la manera de relacionar los resultados matematicos con los aspectos practicos
de un sistema de control: Como construir practicamente un controlador que
esta expresado en terminos de la variable de Laplace (funcion de transferen-
cia)? Como se construye un controlador usando electronica digital o usando
electronica analogica? Como tomar en cuenta las ganancias de los sensores y
de los amplicadores de potencia? Como determinar esta ganancia en un am-
plicador de potencia basado en modulacion por ancho de pulso? Que efectos
tienen estas ganancias en un sistema de control?
La manera en que tradicionalmente se ha resuelto el problema de la practi-
ca descrito en el parrafo anterior ha sido la compra de prototipos didacticos
comerciales. Sin embargo, esto tiene dos desventajas: 1) estos equipos nor-
malmente son excesivamente caros pues son construidos en el extranjero y 2)
muchos de los aspectos involucrados en el funcionamiento de un sistema de
control permanecen invisibles para el estudiante; esto es debido a que estos
equipos estan dise nados pensando que el estudiante de Control Automatico no
tiene porque saber como se resuelven los detalles practicos relacionados con la
electronica y la programacion, por ejemplo, de los diferentes componentes de
un sistema de control. Este es el caso de Como construir un amplicador de
potencia? Como dise nar y construir un controlador basado en amplicado-
res operacionales o un controlador basado en un microcontrolador? Existen
alternativas a la practica com un de comprar sensores en el extranjero?
La presente obra pone a la disposicion de los estudiantes y de los profeso-
res de nivel Licenciatura un material con el cual se pretende ayudar a resolver
algunas de las dicultades arriba mencionadas. Con el n de facilitar el apren-
dizaje de los aspectos teoricos se incluye un captulo dedicado exclusivamente
a la solucion de ecuaciones diferenciales lineales y de coecientes constantes
usando la transformada de Laplace. Si bien ese captulo puede ser visto como
un curso de ecuaciones diferenciales, la principal diferencia respecto del curso
de matematicas que sobre este tema se lleva en el tronco com un de Licencia-
tura (Ingeniera) es que en nuestro libro se hace enfasis en la interpretacion
de la solucion de una ecuacion diferencial. Ademas se resalta el efecto que
tienen los parametros de una ecuacion diferencial en la forma graca de la
solucion. Debemos subrayar que la experiencia de los autores es que los libros
existentes sobre Control Automatico (incluso los mas importantes) se limitan
a presentar un breve prontuario de soluciones de ecuaciones diferenciales y
no consiguen que el estudiante razone acerca de lo que esta haciendo. Para
salvar este problema, en el presente libro se recurre a ejemplicar cada tipo
de ecuacion diferencial con una situacion practica que cualquier estudiante de
Licenciatura ha observado en alg un momento de su vida. Es decir, se recurre
a la experiencia cotidiana del estudiante para que comprenda lo que signican
los resultados matematicos.
La problematica relacionada con los aspectos practicos de los sistemas de
control es resuelta mediante la aplicacion a varios sistemas de control experi-
mentales. En cada uno de estos ejemplos se procede de igual manera. Primero
Prefacio IX
se describe la tarea que ejecuta el sistema de control bajo estudio y luego
se explica al lector como construir cada uno de los componentes de dicho
sistema de control. Posteriormente se muestra como obtener el modelo ma-
tematico correspondiente para despues explicar a detalle como obtener, de
manera experimental, el valor numerico de cada uno de los parametros del
modelo. Entonces se usan las tecnicas de control presentadas previamente en
los primeros captulos del libro para dise nar (matematicamente) el controlador
correspondiente. Se presenta tambien la manera de construir el controlador
usando electronica analogica o digital y nalmente se presentan los resultados
experimentales obtenidos al controlar el prototipo que se ha construido.
A continuacion se explica como esta organizada la presente obra. En el
captulo 1 se presenta una panoramica general del Control Automatico con el
n de que el lector entienda a grandes rasgos cual es el objetivo de dise nar
sistemas de control. Esto se realiza utilizando un ejemplo que cuyo funciona-
miento es bien conocido por la mayora de las personas: el control de un ca non
antiaereo. Tambien se presenta una breve historia del Control Automatico y se
relaciona con el contenido de la obra para que el lector identique cuales son
las razones por las que cada herramienta de control ha sido desarrollada. En el
captulo 2 se aborda el problema de obtener el modelo matematico de sistemas
fsicos comunes en Ingeniera Electrica, Electronica, Mecanica y Mecatronica.
Una razon importante de incluir este tema es que el lector se de cuenta de que
los sistemas de control estan descritos por ecuaciones diferenciales lineales y
de coecientes constantes. Esto motiva el estudio de la solucion de las ecuacio-
nes diferenciales en el captulo 3, pues esto es importante para entender como
responde un sistema de control y que hay que modicar en el para conseguir
la respuesta deseada.
En los captulos 4 al 7 se presentan las herramientas utilizadas en el dise no
de sistemas de control clasico y moderno: criterios de estabilidad y error en
estado estacionario (captulo 4), la tecnica del lugar de las races (captulo 5),
la tecnica de la respuesta en frecuencia (captulo 6) y la tecnica de las variables
de estado (captulo 7). La exposicion de estos temas esta dirigida hacia su
aplicacion en los ejemplos practicos presentados en los ultimos captulos de
la obra. De este modo, muchos de los ejemplos presentados en los primeros
captulos tratan sobre el dise no de controladores que despues seran construidos
y probados experimentalmente en los ultimos captulos.
La estructura de los captulos 8 al 14 es la misma, pues tienen el mismo
objetivo: se presenta la aplicacion de las tecnicas de control desarrolladas
en los captulos 4 al 7 al analisis y dise no de sistemas de control practicos.
Los controladores correspondientes son construidos al igual que el sistema
de control completo, utilizando materiales de bajo costo y que son faciles
de conseguir por un estudiante de licenciatura. Finalmente, se presentan los
resultados obtenidos experimentalmente al probar los sistemas de control en
la practica.
En el captulo 8 se estudian y dise nan varios circuitos electronicos realimen-
tados, entre ellos algunos circuitos osciladores con forma de onda sinusoidal
X Prefacio
basados en amplicadores operacionales (audiofrecuencia) y en transistores
(radiofrecuencia). En los captulos 9 y 10 se controla la velocidad y la posi-
cion, respectivamente, de un motor de corriente directa con escobillas e imanes
permanentes. Un sistema de levitacion magnetica es controlado en el captulo
11 mientras que en el captulo 12 se controla un mecanismo muy popular en
Control Automatico y que es conocido como Ball and Beam. Finalmente, en
los captulos 13 y 14 se presentan dos mecanismos que incluyen pendulos: el
pendulo de Furuta y el pendulo con rueda inercial. Por ultimo, se debe decir
que la importancia de todos estos prototipos experimentales es reconocida en
los cursos de control en todo el mundo y por eso han sido seleccionados como
bancos de prueba en la presente obra.
El primer autor reconoce y agradece el apoyo de sus dos coautores. Su
colaboracion ha sido de gran valor no solo en la elaboracion de la presente obra
sino, ademas, en diversas actividades de investigacion que han realizado desde
que eran estudiantes de Doctorado (con el segundo autor) y desde que el tercer
autor realizo sus estudios de Maestra y Doctorado, los cuales el primer autor
tuvo la fortuna de dirigir. Un reconocimiento y un agradecimiento especial
para los Drs. Hebertt Sira Ramrez (Director de tesis) y Gerardo Silva Navarro,
ambos investigadores del CINVESTAV-IPN quienes fueron fundamentales en
los estudios de Doctorado del primer autor. Tambien se reconoce y agradece
al Dr. Vctor Santiba nez del Instituto Tecnologico de la Laguna con quien
el primer autor ha mantenido una importante colaboracion cientca desde
2004 en el area de control de robots manipuladores. Un reconocimiento a
la importante colaboracion cientca con los Drs. Ricardo Campa (Instituto
Tecnologico de la Laguna) y Arturo Zavala Ro (IPICYT).
Las ideas que han motivado este trabajo tomaron forma durante los cursos
que sobre Control Automatico ha impartido el primer autor a nivel Licencia-
tura y Maestra en la Facultad de Ingeniera de la Universidad Autonoma de
Queretaro, Institucion a la que esta adscrito desde 1995. Se agradece a es-
ta Institucion el apoyo recibido durante todos estos a nos. Un agradecimiento
al Sistema Nacional de Investigadores por el apoyo economico recibido des-
de 2005 y al CIDETEC del Instituto Politecnico Nacional por facilitar los
medios editoriales requeridos para la impresion de este libro. Una mencion es-
pecial para mi esposa Judith de quien siempre he recibido el apoyo necesario
para realizar no solo esta obra sino todo el trabajo de investigacion que he
desarrollado desde que decid hacer mis estudios de Doctorado.
El segundo autor reconoce y agradece la invitacion del primer autor para
participar en la elaboracion de este y otros proyectos ambiciosos, academicos
y de investigacion. Su apoyo ha sido fundamental en el desarrollo profesio-
nal del segundo autor y en la formacion conjunta de estudiantes de nivel
maestra. El segundo autor agradece de forma muy especial a los Doctores
Gilberto Silva Ortigoza y Hebertt Sira Ramrez, investigadores de la BUAP
y del CINVESTAV-IPN, por ser sus mentores; el primero a lo largo de toda
su trayectoria y el segundo en sus estudios de formacion de posgrado. Tam-
bien, se reconoce y agradece la importante colaboracion academica con las
Prefacio XI
Doctoras Magdalena Marciano Melchor (CIDETEC-IPN), Griselda Salda na
Gonzalez (Universidad Tecnologica de Puebla) y Mariana Marcelino Aran-
da (UPIICSA-IPN). El segundo autor agradece el apoyo recibido por parte
del CIDETEC del Instituto Politecnico Nacional, Centro de Investigacion al
que esta adscrito desde 2006, el soporte economico recibido de la SIP y de
los programas EDI y COFAA del Instituto Politecnico Nacional, as como del
Sistema Nacional de Investigadores. Mencion especial merecen mis hijos, Rho-
mina y Joserhamon, por su apoyo moral y ser la inspiracion que me permite
esforzarme cada da para dar siempre lo mejor.
El tercer autor agradece primeramente al Dr. V. M. Hernandez Guzman la
atenta invitacion a participar en la realizacion de la presente obra. Al Consejo
Nacional de Ciencia y Tecnologa que me beco para mis estudios de Maestra y
Doctorado (perodo de realizacion de la presente obra). A mi segunda casa, la
Universidad Autonoma de Queretaro, espacio para la docencia, investigacion
y difusion de la cultura que me ha ense nado a ser un mejor ser humano,
manteniendome da con da en constante superacion en todos los sentidos. A
Dios, a mis padres Valentn y Alicia, y a mi esposa Lizbeth, por el apoyo
recibido en todo momento.
V. M. Hernandez Guzman Queretaro, Qro., FI-UAQ.
R. Silva Ortigoza Mexico, D.F., Instituto Politecnico Nacional.
R. V. Carrillo Serrano Queretaro, Qro., FI-UAQ.
Enero de 2013.

Indice general
1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Sistema de control de un ca non antiaereo . . . . . . . . . . . . . . . . . . . 2
1.2. Historia del Control Automatico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Prototipos didacticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2. Modelado matematico de sistemas fsicos . . . . . . . . . . . . . . . . . . 15
2.1. Energa y variables generalizadas del sistema . . . . . . . . . . . . . . . . 16
2.2. Almacenadores de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Sistemas mecanicos traslacionales. . . . . . . . . . . . . . . . . . . . 20
2.2.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3. Disipadores de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1. Sistemas mecanicos traslacionales. . . . . . . . . . . . . . . . . . . . 27
2.3.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4. Fuentes de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.1. Sistemas mecanicos traslacionales. . . . . . . . . . . . . . . . . . . . 31
2.4.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5. Convertidores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1. Transformadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.2. Adaptadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7. Caso de estudio. Un convertidor electronico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 83
2.8. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
XIV

Indice general
2.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3. Base matematica: ecuaciones diferenciales . . . . . . . . . . . . . . . . . 97
3.1. Ecuacion diferencial de primer orden . . . . . . . . . . . . . . . . . . . . . . . 99
3.2. Un integrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.3. Ecuacion diferencial de segundo orden. . . . . . . . . . . . . . . . . . . . . . 112
3.4. Races reales diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
3.5. Races reales repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.6. Races complejas conjugadas diferentes . . . . . . . . . . . . . . . . . . . . . 134
3.7. Races complejas conjugadas repetidas . . . . . . . . . . . . . . . . . . . . . 140
3.8. Una ecuacion diferencial general . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
3.9. Polos y ceros en sistemas de orden superior . . . . . . . . . . . . . . . . . 150
3.9.1. Cancelacion polo-cero y modelos reducidos . . . . . . . . . . . 150
3.9.2. Polos dominantes y modelos reducidos . . . . . . . . . . . . . . . 152
3.10. El principio de superposicion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.11. Caso de estudio. Un convertidor electronico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 160
3.12. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
3.13. Preguntas de Repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.14. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
4. Criterios de estabilidad y error en estado estacionario . . . . . 177
4.1. Diagramas de bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2. Regla de los signos para determinar la ubicacion de las races
de un polinomio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.1. Polinomios de segundo grado . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.2. Polinomios de primer grado . . . . . . . . . . . . . . . . . . . . . . . . . 190
4.2.3. Polinomios de grado 3 o mayor . . . . . . . . . . . . . . . . . . . . . . 190
4.3. Criterio de estabilidad de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
4.4. Error en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
4.4.1. Referencia tipo escalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
4.4.2. Referencia tipo rampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
4.4.3. Referencia tipo parabola . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.5. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
4.6. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
4.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

Indice general XV
5. Dise no usando la respuesta en el tiempo . . . . . . . . . . . . . . . . . . . 221
5.1. Dise no con el lugar de las races . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
5.1.1. Reglas para construir el lugar de las races. . . . . . . . . . . . 225
5.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
5.2.1. Control proporcional de posicion . . . . . . . . . . . . . . . . . . . . 232
5.2.2. Control proporcional-derivativo (PD) de posicion . . . . . . 235
5.2.3. Control de posicion usando un compensador de adelanto238
5.2.4. Control proporcional-integral (PI) de velocidad. . . . . . . . 241
5.2.5. Control proporcional-integral-derivativo (PID) de
posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5.2.6. Asignacion de los polos de lazo cerrado deseados . . . . . . 257
5.2.7. Control proporcional-integral-derivativo (PID) de un
sistema de levitacion magnetica . . . . . . . . . . . . . . . . . . . . . 264
5.2.8. Control de un sistema ball and beam . . . . . . . . . . . . . . . . 268
5.3. Caso de estudio. Notas adicionales sobre el control PID de
posicion de un motor de CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
5.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
5.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
5.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
6. Dise no usando la respuesta en frecuencia . . . . . . . . . . . . . . . . . . 291
6.1. Un circuito RC de corriente alterna . . . . . . . . . . . . . . . . . . . . . . . . 292
6.1.1. Representaciones gracas comunes . . . . . . . . . . . . . . . . . . . 294
6.1.2. Modelo matematico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
6.1.3. Componentes de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 301
6.1.4. Relacion entre la respuesta en la frecuencia y en la
respuesta en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
6.2. Sistemas arbitrarios de orden n. . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
6.3. Gracas polares y de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
6.4. Gracas de respuesta en frecuencia. Ejemplos . . . . . . . . . . . . . . . 319
6.4.1. Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
6.4.2. Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
6.4.3. Ejemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
6.5. Criterio de estabilidad de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . 325
6.5.1. Recorridos cerrados alrededor de polos y ceros . . . . . . . . 326
6.5.2. Trayectoria de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
6.5.3. Polos y ceros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
6.5.4. Criterio de Nyquist. Caso especial . . . . . . . . . . . . . . . . . . . 331
6.5.5. Criterio de Nyquist. Caso general . . . . . . . . . . . . . . . . . . . . 332
6.6. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
6.7. Relacion entre las caractersticas de respuesta en la frecuencia
y en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
6.7.1. Respuesta en lazo abierto. . . . . . . . . . . . . . . . . . . . . . . . . . . 337
XVI

Indice general
6.7.2. Respuesta en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . 337
6.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.1. Ejemplo de analisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.2. Un sistema ball and beam . . . . . . . . . . . . . . . . . . . . . . . . . . 344
6.8.3. Control PD de posicion de un motor de CD. . . . . . . . . . . 355
6.8.4. Redise no del control PD de posicion de un motor de CD363
6.8.5. Control PID de posicion de un motor de CD . . . . . . . . . . 368
6.9. Caso de estudio. Control PID de un sistema de levitacion
magnetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
6.10. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
6.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
6.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
7. La tecnica de las variables de estado . . . . . . . . . . . . . . . . . . . . . . . 393
7.1. Representacion en variables de estado . . . . . . . . . . . . . . . . . . . . . . 394
7.2. Linealizacion aproximada de ecuaciones de estado no lineales . . 399
7.2.1. Procedimiento para ecuaciones de primer orden sin
entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
7.2.2. Procedimiento general para ecuaciones de orden
arbitrario y n umero de entradas arbitrario . . . . . . . . . . . . 402
7.3. Algunos resultados del algebra lineal . . . . . . . . . . . . . . . . . . . . . . . 407
7.4. Solucion de una ecuacion dinamica, lineal e invariante en el
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
7.5. Estabilidad de una ecuacion dinamica . . . . . . . . . . . . . . . . . . . . . . 412
7.6. Controlabilidad y observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 413
7.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
7.6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
7.7. Funcion de transferencia de una ecuacion dinamica . . . . . . . . . . 418
7.8. Una de las ecuaciones dinamicas que corresponden a una
funcion de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
7.9. Ecuaciones dinamicas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . 425
7.10. Control por realimentacion del estado . . . . . . . . . . . . . . . . . . . . . . 428
7.11. Observadores de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
7.12. El principio de separacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
7.13. Caso de estudio. El pendulo con rueda inercial . . . . . . . . . . . . . . 438
7.13.1. Obtencion de la forma en (7.75) . . . . . . . . . . . . . . . . . . . . . 438
7.13.2. Control por realimentacion del estado . . . . . . . . . . . . . . . . 439
7.14. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440
7.15. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
7.16. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445

Indice general XVII


8. Circuitos electronicos realimentados . . . . . . . . . . . . . . . . . . . . . . . 447
8.1. Circuitos electronicos para reducir no linealidades . . . . . . . . . . . 448
8.1.1. Reduccion de la distorsion en amplicadores . . . . . . . . . . 449
8.1.2. Reduccion de la zona muerta en amplicadores. . . . . . . . 451
8.2. Construccion analogica de controladores . . . . . . . . . . . . . . . . . . . . 456
8.3. Dise no de osciladores con forma de onda sinusoidal . . . . . . . . . . 458
8.3.1. Dise no basado en un amplicador operacional. Puente
de Wien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
8.3.2. Dise no basado en un amplicador operacional. Red
RC de defasaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468
8.3.3. Dise no basado en un transistor . . . . . . . . . . . . . . . . . . . . . . 472
8.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
8.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
9. Control de velocidad de un motor de CD . . . . . . . . . . . . . . . . . . 499
9.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
9.2. Amplicador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
9.3. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
9.4. Identicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507
9.5. Control de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.1. Un controlador PI modicado . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 512
9.6. Prototipo experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515
9.6.1. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.6.2. Amplicador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
9.8. Calculo numerico de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
9.9. Programacion del microcontrolador PIC16F877A . . . . . . . . . . . . 523
9.10. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
9.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
10. Control de posicion de un motor de CD . . . . . . . . . . . . . . . . . . . 531
10.1. Identicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
10.2. Control sin perturbaciones externas (T
p
= 0) . . . . . . . . . . . . . . . . 535
10.2.1. Control proporcional con realimentacion de velocidad . . 535
10.2.2. Control con un compensador de adelanto . . . . . . . . . . . . . 537
10.3. Control bajo el efecto de perturbaciones externas . . . . . . . . . . . . 540
10.3.1. Un controlador PID modicado . . . . . . . . . . . . . . . . . . . . . 541
10.3.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 544
10.3.3. Un controlador PID clasico . . . . . . . . . . . . . . . . . . . . . . . . . 549
10.4. Seguimiento de trayectorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
XVIII

Indice general
10.5. Calculo numerico de los algoritmos de control . . . . . . . . . . . . . . . 555
10.6. Construccion del sistema de control . . . . . . . . . . . . . . . . . . . . . . . . 556
10.7. Programacion del microcontrolador PIC16F877A . . . . . . . . . . . . 559
10.8. Control basado en una computadora personal . . . . . . . . . . . . . . . 562
10.9. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
10.10. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573
11. Control de un sistema de levitacion magnetica . . . . . . . . . . . . . 575
11.1. Modelo matematico no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578
11.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581
11.2.1. Obtencion de un modelo en variables de estado. . . . . . . . 581
11.2.2. Aproximacion lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
11.3. Construccion del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.1. Esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.2. Electroiman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.3. Sensor de posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.4. Controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
11.3.5. Lazo de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.3.6. Amplicador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.4. Identicacion experimental de los parametros del modelo . . . . . 587
11.4.1. Resistencia del electroiman, R . . . . . . . . . . . . . . . . . . . . . . 587
11.4.2. Inductancia del eletroiman, L(y) . . . . . . . . . . . . . . . . . . . . 587
11.4.3. Ganancia del sensor de posicion, A
s
. . . . . . . . . . . . . . . . . 588
11.4.4. Masa de la esfera, m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 589
11.5. Dise no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590
11.5.1. Un controlador proporcional . . . . . . . . . . . . . . . . . . . . . . . . 593
11.5.2. Un controlador proporcional-integral-derivativo (PID) . . 594
11.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595
11.7. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599
11.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601
12. Control de un sistema Ball and Beam . . . . . . . . . . . . . . . . . . . . . 603
12.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605
12.2. Construccion del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608
12.2.1. Medicion de la posicion x del baln . . . . . . . . . . . . . . . . . . 609
12.2.2. Medicion de la inclinacion de la varilla . . . . . . . . . . . . . 612
12.2.3. Interfaces y amplicador de potencia . . . . . . . . . . . . . . . . . 612
12.3. Identicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
12.3.1. Sistema de medicion de la inclinacion de la varilla . . . 614
12.3.2. Sistema de medicion de la posicion x del baln . . . . . . . . 614
12.3.3. Subsistema motor-varilla . . . . . . . . . . . . . . . . . . . . . . . . . . . 614

Indice general XIX


12.3.4. Dinamica del baln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615
12.4. Dise no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617
12.5. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620
12.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621
12.7. Control basado en el microcontrolador
PIC16F877A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 630
12.7.1. Construccion del sistema de control . . . . . . . . . . . . . . . . . . 630
12.7.2. Dise no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.4. Programa utilizado en el microcontrolador PIC16F877A 635
12.8. Un sistema de medicion mejorado para la posicion del baln . . . 639
12.9. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641
12.10. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643
13. Control de un pendulo de Furuta . . . . . . . . . . . . . . . . . . . . . . . . . . 645
13.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647
13.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
13.3. Construccion del pendulo de Furuta e indenticacion de sus
parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653
13.4. Dise no del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656
13.5. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657
13.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661
13.7. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665
13.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667
14. Control de un pendulo con rueda inercial . . . . . . . . . . . . . . . . . . 669
14.1. Pendulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670
14.2. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672
14.3. Controlador no lineal para levantar el pendulo . . . . . . . . . . . . . . 674
14.4. Controlador para atrapar el pendulo . . . . . . . . . . . . . . . . . . . . . . . 678
14.5. Construccion del pendulo con rueda inercial e identicacion
de sus parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 680
14.6. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687
14.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691
14.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699
14.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701

Indice alfabetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703


1
Introduccion
Las aplicaciones del control automatico en la actualidad son muy extensas,
variadas e importantes. Quiza una de las mas populares es la del control de
robots manipuladores en la industria de manufactura. Desde la lneas de en-
samble de automoviles hasta las celdas robotizadas de soldadura. Las razones
principales para este exito es la alta calidad del trabajo, el ahorro de tiempo
y la reduccion del costo de produccion.
2 1 Introduccion
Objetivos del captulo
Comprender de manera intuitiva los conceptos b asicos de realimentaci on
y control en lazo cerrado, as como los objetivos de un sistema de control.
Conocer la historia del Control Autom atico para comprender por que se
desarrollaron este conjunto de herramientas de dise no.
Relacionar los captulos de la presente obra con los hechos hist oricos que
motivaron los conocimientos descritos en cada captulo.
Con el n de explicar de que se trata el Control Automatico (o simplemente
control) y cual es su proposito, a continuacion se describe como funciona el
sistema de control del direccionamiento de un ca non antiaereo. Las razones
de haber elegido este ejemplo son las siguientes. i) Se trata de un sistema
cuyo objetivo y funcionamiento basico pueden ser entendidos facilmente por la
mayora de las personas debido a la gran cantidad de pelculas, video-juegos,
programas de television, etc., que de alguna manera u otra muestran para
que sirve este sistema de control. ii) Es un problema historicamente muy
importante pues motivo el desarrollo de gran parte de las ideas y tecnicas
basicas del Control Automatico durante la Segunda Guerra Mundial. Este
ejemplo tambien sera utilizado para que el lector pueda relacionar el contenido
del presente libro con algunos de los aspectos de los sistemas de control.
1.1. Sistema de control de un ca non antiaereo
En la gura 1.1 se muestra un esquema de este sistema de control. El ca non
antiaereo debe apuntar hacia un avion y derribarlo. Para conseguir esto, el
ca non debe tener varios movimientos independientes que permitan ajustar su
orientacion () en el plano horizontal y su inclinacion respecto de la horizontal.
Con el n de simplicar la descripcion del problema, en lo que sigue solo se
considerara el control de la orientacion en el plano horizontal .
Para ajustar la orientacion del ca non se utiliza un motor electrico. Esto
se consigue acoplando mecanicamente el motor al ca non mediante un juego de
engranes. El conjunto motor-ca non funciona, a grandes rasgos, del siguiente
modo. Si se aplica un voltaje positivo al motor entonces el ca non recibe un
par en sentido antihorario, por lo que el ca non tiende a moverse en sentido
antihorario. Si se aplica un voltaje negativo al motor entonces el ca non recibe
un par en sentido horario, por lo que el ca non tiende a moverse en sentido
horario. Si el voltaje que se aplica al motor es igual a cero, entonces el par
aplicado sobre el ca non es igual a cero, por lo que el ca non tiende a detenerse.
La posicion del avion se determina mediante el uso de un radar y se usa este
dato como el valor
d
que se desea alcance la orientacion del ca non . Es decir,
se desea conseguir que =
d
lo mas rapido posible para, una vez conseguido
1.1 Sistema de control de un ca non antiaereo 3
cano n
antiaereo
motor
engranes

d

amplificador
de
potencia
controlador
radar
v

d
Figura 1.1. Sistema de control de un ca non antiaereo.

d
(a)
d
> , v > 0, el ca non se
mueve en sentido antihorario.

d
(b)
d
< , v < 0, el ca non se mueve en
sentido horario.
Figura 1.2. El ca non antiaereo siempre debe moverse hacia la orientacion deseada.
esto, disparar
1
. De acuerdo al funcionamiento descrito en el parrafo anterior,
una manera sencilla de conseguir esto es aplicando al motor un voltaje v que
sea calculado de acuerdo a la siguiente regla:
v = k
p
(
d
) (1.1)
donde k
p
es una constante positiva. La operacion presentada en (1.1) es rea-
lizada utilizando equipo electronico de baja potencia (una computadora o un
microcontrolador, por ejemplo) y se debe utilizar un amplicador de potencia
para satisfacer los requerimientos del motor electrico. En este caso se esta su-
poniendo que el amplicador de potencia ofrece una amplicacion unitaria
1
Sin embargo, en una situacion real, es necesario que la orientacion del ca non vaya
adelante de la posicion del avion con el n de compensar el tiempo que la bomba
tarda en viajar desde que es disparada hasta que llega a donde esta el avion.
Aqu se esta despreciando este efecto con el n de simplicar la exposicion.
4 1 Introduccion
en voltaje, pero realiza una gran amplicacion en corriente electrica (vease el
captulo 9, seccion 9.2). De acuerdo a la gura 1.2 se puede presentar alguna
de las siguientes situaciones:
Si <
d
, entonces v > 0 y el ca non gira en sentido antihorario de modo
que se aproxima a
d
.
Si >
d
, entonces v < 0 y el ca non gira en sentido horario de modo que
se aproxima a
d
.
Si =
d
, entonces v = 0 y el ca non no gira por lo que la condicion =
d
se puede mantener para siempre.
A partir de este razonamiento se concluye que la regla presentada en (1.1) para
determinar el voltaje que se ha de aplicar al motor tiene buenas posibilidades
de funcionar en la practica.
A la regla en (1.1) se le conoce como ley de control o, simplemente, contro-
lador. En la gura 1.3 se muestra un diagrama de bloques de los componentes
del sistema de control de un ca non antiaereo. Notese que la construccion del
controlador en (1.1) requiere que la posicion del ca non (tambien conocida
como la salida) sea usada para generar el voltaje v (tambien conocido como
la entrada) que se aplica al motor. Este hecho dene los conceptos de reali-
mentacion y de sistema en lazo cerrado. Esto indica que el sistema de control
compara la posicion del motor (, salida) con la posicion deseada o referencia
(
d
) y aplica al motor un voltaje v que depende de la diferencia existente entre
estas variables (vease (1.1)).
motor
canon
amplificador
de
potencia
controlador +

d
v
k
p
1
Figura 1.3. Diagrama de bloques del sistema de control de un ca non antiaereo.
Si se dene el error de posicion como la diferencia
d
, se dice que
el error en estado estacionario
2
del sistema de control de posicion es cero
porque, de acuerdo a lo arriba explicado,
d
= 0 puede mantenerse para
siempre. Sin embargo, el termino en estado estacionario indica que esto
se conseguira cuando el tiempo sea sucientemente grande como para que el
ca non deje de moverse. As que a un queda el problema de determinar como
evolucionara el movimiento del ca non conforme se aproxima a
d
. A esto se
le conoce como la respuesta transitoria del sistema de control
3
. En la gura
2
Vease el captulo 4
3
Veanse los captulos 3, 5 y 6
1.1 Sistema de control de un ca non antiaereo 5
1.4 se muestran varios ejemplos de como puede ser la respuesta transitoria.
Notese que si k
p
es grande en (1.1) entonces el voltaje v que se aplica al
motor es mayor por lo que el par sobre el ca non tambien es mayor y, por tanto,
girara mas rapido. Entonces, el tiempo que debe transcurrir para que alcance
a
d
sera menor. Sin embargo, un movimiento rapido del ca non y la inercia
propia del mismo pueden provocar que cuando alcance a
d
la velocidad del
ca non sea diferente de cero

= 0 por lo que el ca non continuara moviendose
y cambiara el signo de
d
. Entonces la posicion puede efectuar varias
oscilaciones alrededor de
d
antes de que el ca non se detenga. Esto signica
que el valor de k
p
tiene un efecto importante sobre la forma de la respuesta
transitoria por lo que debe ser calculada de modo que se obtenga la respuesta
transitoria deseada (rapida y sin oscilaciones). Incluso, para conseguir esto, en
ocasiones no sera suciente con ajustar el valor de k
p
y debera modicarse la
regla en (1.1), es decir se debera utilizar otro controlador (veanse los captulos
5, 6, 7 y 10). Es mas, el error en estado estacionario puede ser diferente de cero
( =
d
cuando el motor alcanza el reposo) debido a perturbaciones externas
(el viento, por ejemplo, puede desviar al ca non de su posicion u orientacion
deseada) o por efectos tales como la friccion existente entre las partes moviles
de todo el mecanismo. Esto signica que incluso la b usqueda de un error en
estado estacionario que sea cero o, al menos, sucientemente peque no puede
ser una razon para buscar un nuevo controlador.
0
0
tiempo

Figura 1.4. Tres formas posibles de la respuesta transitoria en el control de un


ca non antiaereo.
6 1 Introduccion
Un aspecto muy importante en el dise no del sistema de control es la es-
tabilidad del mismo. El concepto de estabilidad puede interpretarse a groso
modo recordando lo que ocurre en un pendulo simple (vease la gura 1.5).
Si la posicion deseada del pendulo es = 0 entonces basta con dejar que el
pendulo se mueva libremente (con un par externo igual a cero, T(t) = 0) y
el pendulo oscilara hasta que, por efecto de la friccion, alcanzara el reposo en
= 0. Entonces se dice que, bajo esta situacion, el pendulo es estable porque
alcanza la posicion deseada = 0 en estado estacionario a partir de cual-
quier posicion inicial sucientemente cercana. Por otro lado, si se desea que
el pendulo alcance la posicion = es claro que, por efecto de la gravedad,
el pendulo siempre se aleja de esa conguracion por cercana que se elija la
posicion inicial respecto de ese valor deseado = . Entonces se dice que bajo
esa situacion el pendulo es inestable
4
. Notese que, de acuerdo a esta descrip-
cion intuitiva, el sistema de control de un ca non antiaereo es inestable si la
ley de control en (1.1) utiliza una constante k
p
negativa: en este caso el ca non
se movera de modo que se aleja de
d
. Por tanto, el valor de la constante
k
p
tambien determina la estabilidad del sistema de control y debe elegirse de
manera que la asegure
5
. Notese que si el sistema de control es inestable (k
p
negativa) entonces el error en estado estacionario nunca sera cero a pesar de
que la regla en (1.1) indica que el motor se detiene cuando =
d
. Esto se
debe a que, incluso si =
d
desde el principio, la medicion de la posicion
siempre esta contaminada de ruido el cual producira que =
d
en (1.1) y
esto sera suciente para que, de acuerdo a lo explicado previamente, se aleje
de
d
.
T(t)

l
m
g
d
Figura 1.5. Pendulo simple.
Otro factor importante en el sistema de control de un ca non antiaereo es
el movimiento que describe el avion por derribar. Es claro que si la direccion
4
Este es precisamente el termino que coloquialmente se usa pare describir que el
pendulo no puede permanecer en = para siempre
5
Veanse los captulos 3, 4, 5, 6, 7
1.1 Sistema de control de un ca non antiaereo 7

d
, que indica en donde se encuentra el avion, es constante entonces el avion
sera derribado mas facilmente que si el avion se aleja a gran velocidad (cuan-
do
d
cambia rapidamente) o cuando el avion acelera para escapar (cuando la
segunda derivada de
d
es grande). Por tanto, la ley de control en (1.1) debe
ser dise nada de manera que el sistema de control responda correctamente ba-
jo cualquiera de las tres situaciones anteriormente descritas. En caso que
d
tenga una forma diferente a las consideradas, se supone que el sistema de con-
trol respondera correctamente si responde bien ante las tres situaciones antes
consideradas. Esta es la idea detras del dise no del error en estado estacionario
del sistema, descrito en el captulo 4.
De acuerdo a lo anterior, se puede decir que las tres caractersticas fun-
damentales de un sistema de control son la respuesta transitoria, la respuesta
en estado estacionario (o error en estado estacionario) y la estabilidad. El
controlador debe ser dise nado de manera que estas tres partes fundamenta-
les de la respuesta de un sistema de control cumplan con las especicaciones
requeridas: rapidez y pocas oscilaciones (respuesta transitoria), que la posi-
cion del ca non alcance (o sea muy cercana a) la posicion deseada cuando el
tiempo sea sucientemente grande (respuesta en estado estacionario) y que
el sistema de control sea estable. Para conseguir esto, las tecnicas de control
estudiadas en la presente obra se basan en el estudio del modelo matematico
del sistema de control completo. De acuerdo a lo expuesto en el captulo 2,
este modelo matematico esta dado en terminos de una ecuacion diferencial
ordinaria, lineal y de coecientes constantes. Por esta razon, en el captulo 3
se estudia la solucion de este tipo de ecuaciones diferenciales para denir las
propiedades que determinan su estabilidad as como la forma transitoria de la
solucion y el valor nal de la misma. El conocimiento de como es la solucion
de estas ecuaciones diferenciales es fundamental para los metodos de dise no
de controladores que se estudian en este libro.
Los metodos de dise no que se usan en esta obra pueden dividirse en clasicas
y modernas. Las tecnicas de control clasicas son estudiadas en los captulos
3, 4, 5, 6 y existen dos metodologas diferentes: las tecnicas de respuesta en
el tiempo (captulo 5) y las tecnicas de la respuesta en la frecuencia (captulo
6). Las tecnicas de control clasico estan basadas en el uso de la transformada
de Laplace para resolver y analizar ecuaciones diferenciales. Las tecnicas de
la respuesta en el tiempo se basan en determinar la forma de la respuesta
temporal de un sistema de control a partir de la ubicacion de los polos de la
funcion de transferencia correspondiente (captulo 3) y el metodo principal de
dise no es el Lugar de las Races (captulo 5). Las tecnicas de la respuesta en la
frecuencia explotan la idea fundamental detras de la Transformada de Fourier:
los sistemas de control (lineales) funcionan como ltros de tal manera que,
ante una orden, la respuesta del sistema de control esta basicamente dada
como esa orden ltrada por el sistema de control. Es por esta razon que
las herramientas fundamentales de dise no para esta tecnica son las gracas
polares y de Bode (captulo 6) ampliamente utilizadas en el dise no y analisis
de ltros (pasa altas, pasa bajas, pasa banda, etc.). En los captulos 8, 9, 10,
8 1 Introduccion
11 y 12 se presentan algunas aplicaciones experimentales de las tecnicas de
control clasico.
Por otro lado, las tecnicas modernas que se abordan en este libro estan
representadas por las basadas en las variables de estado (captulo 7) las cua-
les, a diferencia de las tecnicas clasicas permiten estudiar el comportamiento
del interior del sistema de control. Esto signica que las variables de estado
suministran mas informacion que puede ser aprovechada para conseguir me-
jores resultados. Ejemplos de aplicaciones de estas tecnicas son mostrados en
los captulos 13 y 14.
1.2. Historia del Control Automatico
Una vez que se ha descrito a groso modo que es lo que se persigue al dise nar
un sistema de control as como algunos conceptos utiles para conseguirlo, a
continuacion se presenta una breve historia del Control Automatico. El obje-
tivo es que el lector se de cuenta de como han sido formulados estos conceptos
y, ademas, pueda apreciar cuales han sido las necesidades ingenieriles que han
motivado estas ideas. Tambien se indican las partes del presente libro en don-
de se abordan los principales conceptos y tecnicas de los sistemas de control.
El contenido de esta seccion esta basado en la informacion reportada en [1].
El Control Automatico se ha usado desde hace mas de 2000 a nos. Se tiene
conocimiento de la existencia de relojes de agua, construidos por Ktesibios,
hacia el a no 270 antes de Cristo, as como una variedad de mecanismos in-
geniosos construidos en Alejandra y descritos por Heron. Sin embargo, des-
de el punto de vista de la ingeniera, el avance mas importante en Control
Automatico se debio a James Watt en 1789 al introducir un regulador de ve-
locidad para su maquina de vapor. Sin embargo, a pesar de su importancia, el
regulador de velocidad de Watt tena varios problemas. Se observaba que en
ocasiones la velocidad variaba de manera oscilatoria en lugar de permanecer
constante o creca sin lmite. Tratando de determinar bajo que condiciones se
poda asegurar un funcionamiento estable, entre 1826 y 1851 J.V. Poncelet
y G.B. Airy mostraron que era posible utilizar ecuaciones diferenciales para
representar el funcionamiento completo de la maquina de vapor junto con el
regulador de velocidad (vease el captulo 2 para el problema del modelado de
sistemas fsicos).
En esas fechas los matematicos saban que la estabilidad de una ecuacion
diferencial estaba determinada por la ubicacion de las races de la ecuacion
caracterstica correspondiente y se saba que haba inestabilidad si la parte
real de una raz era positiva (vease el cap

tulo 3, seccion 3.8). Sin embargo, no


era sencillo calcular el valor numerico de dichas races y en ocasiones ni siquie-
ra era posible. As, en 1868 J.C. Maxwell mostro la manera de determinar la
estabilidad de las maquinas de vapor con el regulador de Watt simplemente
examinando los coecientes de la ecuacion diferencial que la representa. Sin
embargo, este resultado solo era util para ecuaciones diferenciales de segundo,
1.2 Historia del Control Automatico 9
tercero y cuarto orden. Mas tarde, entre 1877 y 1895 y de manera indepen-
diente, E.J. Routh y A. Hurwitz dedujeron un metodo para determinar la
estabilidad de sistemas de cualquier orden, resolviendo el problema que Max-
well haba dejado abierto. Este metodo ahora es conocido como el Criterio de
Routh o de Routh-Hurwitz (vease el captulo 4, seccion 4.3).
Durante gran parte del siglo XIX se desarrollaron muchas aplicaciones
relacionadas con el Control Automatico entre las cuales estaban el control
de temperatura, de presion, de nivel de lquidos y la velocidad de maquinas
rotativas. Por otro lado, se empezo a usar el vapor para mover grandes ca nones
y para actuar sobre el sistema de direccion de barcos cada vez mas grandes.
Incluso, por esa epoca, en Francia se introdujeron los terminos de servomotor
y servomecanismo para describir un movimiento generado por un servidor o
esclavo. Sin embargo, la mayora de los controladores de ese entonces eran
del tipo encendido-apagado y fueron personas como E. Sperry y M.E. Leeds
quienes se dieron cuenta de que los mejores operadores humanos empleaban
el sentido de anticipacion disminuyendo la potencia conforme la variable a
controlar se acercaba a su valor deseado. Fue N. Minorsky quien en 1922
presento un analisis claro de los sistemas de control de posicion y formulo lo
que hoy en da se conoce como controlador PID (vease el captulo 5, seccion
5.2.5). Este controlador fue deducido observando la manera en que el piloto
humano de un barco controla su direccion.
Por otro lado, desde 1920 la amplicacion haba producido muchos proble-
mas a las compa nas telefonicas ya que se distorsionaba fuertemente la se nal
de audio. Fue en esa epoca que H.S. Black encontro que si una peque na can-
tidad de la se nal obtenida a la salida de un amplicador se utilizaba para ser
realimentada a la entrada del mismo se poda reducir la distorsion producida
por el amplicador. Durante el desarrollo de este trabajo, Black fue ayudado
por H. Nyquist quien, a partir de esas experiencias, publico en 1932 un trabajo
titulado Regeneration Theory en donde establecio las bases de lo que ahora
es conocido como el Analisis de Nyquist (vease el captulo 6, seccion 6.5).
Durante el perodo 1935-1940, las compa nas telefonicas deseaban ampliar
el ancho de banda de sus sistemas de comunicacion para aumentar el n umero
de sus usuarios. Para esto necesitaban que sus lneas telefonicas presentaran
una buena caracterstica de respuesta en frecuencia (vease el captulo 6): una
ganancia constante sobre un amplio rango de frecuencias con un peque no
angulo de atraso y una aguda pendiente de atenuacion a partir de una deter-
minada frecuencia de corte. Motivado por este problema, H. Bode estudio la
relacion existente entre una caracterstica de atenuacion dada y el mnimo
corrimiento de fase que se le puede asociar. Como resultado introdujo los con-
ceptos de margen de ganancia y margen de fase (vease el captulo 6, seccion
6.6) y empezo a manejar el punto (1, 0) del plano complejo como un punto
crtico en lugar del punto (+1, 0) manejado por Nyquist. Detalles completos
del trabajo de Bode aparecieron en 1945 en su libro Network Analysis and
Feedback Amplier Design.
10 1 Introduccion
Pero fue la Segunda Guerra Mundial la que hizo que el trabajo en sistemas
de control se concentrara en unos pocos problemas especcos. El mas impor-
tante de estos fue el relacionado con el direccionamiento de ca nones antiaereos.
El trabajo en este problema motivo el desarrollo de nuevas ideas en el control
de servomecanismos. G. S. Brown del Instituto Tecnologico de Massachusetts
mostro que muchos sistemas electricos y mecanicos pueden ser representados
y manipulados usando diagramas de bloques (vease el captulo 4, seccion 4.1)
y A. C. Hall mostro en 1943 que manejando los bloques como funciones de
transferencia (vease el captulo 3) poda obtenerse la funcion de transferencia
del sistema completo para nalmente usar el criterio de estabilidad de Nyquist
y determinar los margenes de ganancia y de fase.
Los investigadores en el Instituto Tecnologico de Massachusetts usaron
circuitos de adelanto (vease el captulo 10, seccion 10.2.2) en el trayecto directo
para modicar el desempe no del sistema de control, mientras que en el Reino
Unido se usaron varios lazos internos para modicar la respuesta del sistema
de control.
Hacia el nal de la Segunda Guerra Mundial las tecnicas de respuesta en
frecuencia basadas en el metodo de Nyquist y las gracas de Bode ya estaban
bien establecidas, describiendo el desempe no del sistema de control en termi-
nos de ancho de banda, frecuencia de resonancia, margen de fase y margen
de ganancia (vease el captulo 6). El enfoque alternativo a estas tecnicas se
basaba en la solucion de las ecuaciones diferenciales usando la Transforma-
da de Laplace y describan el desempe no del sistema de control en terminos
del tiempo de subida, sobre paso, error en estado estacionario y el amorti-
guamiento (vease el captulo 3, seccion 3.3). Muchos ingenieros preferan este
metodo porque los resultados estaban expresados en terminos reales. Pero
este enfoque tena la desventaja de que no exista una manera sencilla que
permitiera al dise nador relacionar los cambios en los parametros con cambios
en la manera en que responda el sistema. Fue precisamente el metodo del
Lugar de las Races (vease el captulo 5, secciones 5.1 y 5.2) introducido en
1948 y 1950 por W. Evans el que permitio librar estos obstaculos. As, hacia
esas fechas las ahora llamadas tecnicas de control clasico estaban bien estable-
cidas y estaban orientadas a sistemas que podan ser descritos por ecuaciones
diferenciales lineales con coecientes constantes y con una sola entrada.
Entonces vino la era de los vuelos supersonicos y espaciales. Era necesario
utilizar modelos fsicos detallados representables en ecuaciones diferenciales
que podan ser lineales o no lineales. Los ingenieros que trabajaban en las
industrias aeroespaciales encontraron que siguiendo las ideas de Poincare era
posible formular ecuaciones diferenciales generales en terminos de un conjunto
de ecuaciones diferenciales de primer orden y as empezo a nacer lo que hoy
se conoce como la tecnica de las variables de estado (vease el captulo 7).
Un gran impulsor de esta tecnica fue R. Kalman quien, alrededor de 1960,
presento los conceptos de controlabilidad y observabilidad (vease la seccion
7.6).
1.3 Prototipos didacticos 11
Finalmente, se debe decir que a partir de esas fechas se han detectado nue-
vos problemas en los sistemas de control que han motivado la introduccion
de diversas tecnicas de control que a un hoy en da se siguen desarrollando.
Por ejemplo, las no linealidades encontradas en los servomecanismos ha mo-
tivado el desarrollo de las tecnicas de control no lineal. El control de aviones
supersonicos, que deben operar bajo amplios rangos de temperatura, presion,
velocidad, etc., motivo el desarrollo de control adaptable. La introduccion
de sistemas de control basados en radar motivo el desarrollo de tecnicas de
control para sistemas en tiempo discreto, etc.
1.3. Prototipos didacticos
En las secciones previas se ha mencionado que el Control Automatico ha
sido desarrollado con el n de resolver problemas de ingeniera importantes.
Sin embargo, la ense nanza de las tecnicas del Control Automatico necesita que
el estudiante pueda practicar aplicando sus conocimientos de manera experi-
mental. Como es difcil hacer uso de instalaciones industriales complejas o de
laboratorios de alta tecnologa con este proposito, en la ense nanza del Control
Automatico se recurre a los llamados prototipos didacticos. Un prototipo
didactico es un dispositivo que tiene dos caractersticas principales: i) es
sucientemente sencillo como para que pueda ser construido y ser puesto en
marcha usando diferentes controladores, e ii) que sea un modelo suciente-
mente complejo como para que se puedan apreciar los diferentes aspectos de
un sistema de control. A continuacion se listan los prototipos didacticos usados
en este libro y se indica cuales son las herramientas del Control Automatico
que son utilizadas en dichos prototipos:
Circuitos electronicos osciladores basados en amplicadores operacionales
y transistores (captulo 8). Respuesta en frecuencia, criterio de estabilidad
de Nyquist y criterio de estabilidad de Routh.
Motores de CD con escobillas e iman permanente (captulos 9 y 10). Dise no
de varios controladores basicos en servomecanismos utilizando la respuesta
en el tiempo: proporcional, proporcional-derivativo, proporcional-integral,
proporcional-integral-derivativo, compensadores de adelanto, controlado-
res con dos grados de libertad.
Sistema de levitacion magnetica (captulo 11). Dise no de un controlador
PID usando el concepto de aproximacion lineal de un sistema no lineal y
el metodo del lugar de las races.
Sistema ball and beam (captulo 12). Dise no de un sistema multilazo
usando la respuesta en frecuencia (criterio de Nyquist y gracas de Bode)
y el lugar de las races.
Pendulo de Furuta (captulo 13). Dise no de un controlador por realimen-
tacion del estado usando la tecnica de la variable de estado. Se utiliza una
aproximacion lineal de un sistema no lineal.
12 1 Introduccion
Pendulo con rueda inercial (captulo 14). Dise no de dos controladores por
realimentacion del estado usando la tecnica de la variable de estado. Uno
de los controladores es dise nado utilizando el modelo no lineal completo
del mecanismo y es utilizado para dar al lector una peque na introduccion
al control de sistemas no lineales.
1.4. Resumen del captulo
En el presente captulo se ha explicado de manera intuitiva cual es la idea
fundamental de controlar un sistema en lazo cerrado. Para esto se ha descrito
como funciona el sistema de control de un ca non antiaereo. Tambien se ha ex-
plicado, mediante el mismo ejemplo, que es lo que se busca cuando se dise na
un sistema de control. Se ha presentado una breve descripcion de la historia
del Control Automatico para que el lector entienda que todos los conceptos
detras de las herramientas de los sistemas de control han sido motivados por
problemas tecnologicos importantes. Esta descripcion historica ha sido utili-
zada para indicar en que partes de la presente obra se abordan las diferentes
herramientas del Control Automatico.
1.5. Preguntas de repaso
1. Para que podra el lector usar el Control Automatico?
2. Podra hacer una lista del equipo domestico que utilice la realimentacion?
3. Investigue como funciona un reloj de pared (que utiliza un pendulo)
Como cree que intervenga la realimentacion en el funcionamiento de estos
relojes?
4. Por que es historicamente importante el regulador de velocidad de Watt
para una maquina de vapor?
5. Que signica que un sistema de control sea inestable?
6. Que entiende por rapidez de respuesta?
7. Por que se dice que un pendulo invertido es inestable?
8. Por que se desarrollaron primero las tecnicas de respuesta en frecuencia
antes de las tecnicas de respuesta en el tiempo?
Referencias
1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-
zine, pp. 17-25, June 1996.
2. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
3. D.A. Mindell, Anti-aircraft re control and the develoment of integrated systems
at Sperry, 1925-1940, IEEE Control Systems Magazine, pp. 108-113, April 1995.
4. S.W. Herwald, Recollection of the early development of servomechanism and
control systems, IEEE Control Systems Magazine, pp. 29-32, november 1984.
5. D.S. Bernstein, Feedback control: an invisible thread in the history of technology,
IEEE Control Systems Magazine, pp. 53-68, April 2002.
6. W. Oppelt, On the early growth of conceptual thinking in the control system
theory- The German role up to 1945, IEEE Control Systems Magazine, pp.
16-22, November 1984.
7. S. Bennett, Nicolas Minorsky and the automatic steering of ships, IEEE Control
Systems Magazine, pp. 10-15, November 1984.
2
Modelado matematico de sistemas fsicos
El modelado matematico de sistemas fsicos consiste en obtener un conjun-
to de ecuaciones que, al ser resueltas, muestran como evolucionan las variables
importantes del sistema. Esto se consigue describiendo matematicamente, y
por separado, a cada una de las partes que componen al sistema por mo-
delar. Finalmente, estos modelos matematicos aislados deben ser conectados
de acuerdo a la conguracion que mantienen dentro del sistema completo,
respetando las leyes de la naturaleza que los rigen.
16 2 Modelado matematico de sistemas fsicos
Objetivos del captulo
Darse cuenta de que el modelo matem atico de los sistemas fsicos est a cons-
tituido por ecuaciones diferenciales.
Aprender a obtener el modelo matem atico de sistemas mec anicos, electri-
cos y electromec anicos.
Identicar a los sistemas fsicos como la interconexi on de procesadores de
energa.
Identicar las analogas entre sistemas de diferente naturaleza, a partir de
la manera en que procesan la energa.
Tradicionalmente, cuando se aborda el modelado de sistemas fsicos se re-
curre a los metodos especcos desarrollados para cada tipo de sistema. Es
decir, los sistemas electricos son modelados usando los metodos desarrollados
en la teora de circuitos electricos y cuando se trata de sistemas mecanicos
se usan los metodos desarrollados en ingeniera mecanica. Sin embargo, pro-
ceder de esta manera tiene varias desventajas: i) la persona no especializada
en el tema en cuestion debe simplemente aceptar (sin muchas explicaciones)
los metodos de modelado desarrollados en esa rama del conocimiento, ii) el
estudiante no se da cuenta de que las leyes fsicas utilizadas para el modelado
de sistemas de diferente naturaleza estan relacionadas por analogas; aunque
en todo curso de control automatico siempre se tratan de resaltar las ana-
logas, estas tienen que ser explicadas a partir de las ecuaciones resultantes
del modelado y no se puede ver que es la esencia del fenomeno la que tiene su
contraparte en sistemas de diferente naturaleza.
Una manera de estudiar el modelado de sistemas fsicos de diferente natu-
raleza bajo una perspectiva unicada es utilizando un concepto que es com un
a varios ambitos de la ingeniera: la energa del sistema. Por esta misma razon
en esta obra el modelado de sistemas se limita a sistemas electricos y mecani-
cos los cuales pueden estudiarse usando conceptos generales de energa que
son comunes a todos estos sistemas. La idea fundamental del uso de la energa
para el modelado es que los componentes de cada sistema bajo estudio suminis-
tran, almacenan o disipan energa y cuando se unen para formar un sistema
complejo es cuestion de determinar como esa energa es transmitida de un
componente a otro.
Este enfoque de usar la energa para el modelado (y, por tanto, el presente
captulo) esta basado en las ideas introducidas en [1].
2.1. Energa y variables generalizadas del sistema
En dos sistemas que se encuentran conectados el intercambio de energa
se realiza a traves de un puerto, el cual puede ser conceptualmente descrito
como formado por dos terminales comunes a ambos sistemas (vease la gura
2.1). La energa es intercambiada entre estos sistemas atraves de dos variables
2.1 Energa y variables generalizadas del sistema 17
generalizadas que se identican bajo los conceptos generales de esfuerzo e
y ujo f. Estas variables, al ser generalizadas, estan denidas en cualquier
sistema independientemente de su naturaleza. Por tanto, no se confundan
estas variables con las variables esfuerzo y ujo denidas en resistencia de
materiales (esfuerzo) y mecanica de uidos (ujo). Las variables generalizadas
de esfuerzo y ujo pueden ser distinguidas a partir de la manera en que son
medidas. El esfuerzo es medido utilizando un instrumento que se conecta
entre ambas terminales del puerto (en la literatura en ingles se usa el termino
across para describir estas variables). Ejemplos de estas variables son el voltaje
(sistemas electricos), la presion (sistemas de uidos) y la velocidad (sistemas
mecanicos): estas variables se miden entre dos puntos porque necesitan ser
medidas respecto a un valor de referencia. El ujo es medido utilizando un
instrumento que se conecta a lo largo de una de las terminales del puerto (en
la literatura en ingles se usa el termino through para describir estas variables).
En este caso no se necesita especicar un valor de referencia sino que se mide
la variable que uye a traves del sistema. Ejemplos de estas variables son el
ujo de uidos (sistemas de uidos), la corriente electrica (sistemas electricos)
y la fuerza (sistemas mecanicos).
Sistema
1
Sistema
2
f
e
puerto
Figura 2.1. Dos sistemas conectados a traves de un puerto.
En este enfoque en el cual lo sistemas son considerados como procesadores
de energa, el producto de las variables de esfuerzo y ujo es igual a la potencia
instantanea (w) intercambiada a traves del puerto:
w = ef
Para cada uno de los componentes del sistema se debe denir una convencion
de signos para las variables generalizadas de esfuerzo y de ujo (vease la gura
2.2). De este modo, si la potencia w tiene signo positivo para el componente i
entonces este componente recibe energa en ese instante. Si la potencia w tiene
signo negativo para el elemento i entonces el componente entrega energa a
los otros componentes del sistema en ese instante.
La energa intercambiada (E) en el intervalo de tiempo [0, t] esta dada
como la integral de la potencia instantanea:
18 2 Modelado matematico de sistemas fsicos
Componente
f
i
e
Figura 2.2. Sentidos denidos como positivos para las variables de esfuerzo y ujo.
E =
_
t
0
ef dt (2.1)
Si la energa E es positiva para el componente i, entonces E representa la
energa que este componente ha recibido en el intervalo de tiempo [0, t], pero si
E es negativa entonces E representa la cantidad de energa que el componente
ha entregado a los otros componentes del sistema en el intervalo de tiempo
[0, t].
Ejemplo 2.1 En un circuito electrico, la potencia (w) est a dada como el
producto de la corriente electrica i (A, Amperes) a traves del circuito y el
voltaje v (V, volts) medido entre las terminales del circuito, mientras que la
energa (E) intercambiada (puede ser recibida o entregada dependiendo del
signo de E) en el intervalo de tiempo [0, t] se calcula como la integral de la
potencia:
w = iv, E =
_
t
0
iv dt
En un sistema mec anico traslacional, la potencia (w) est a dada como el
producto de la fuerza aplicada F (N, Newton) y la velocidad v (m/s, me-
tros/segundo), mientras que la energa (E) intercambiada en el intervalo de
tiempo [0, t] se calcula como la integral de la potencia:
w = Fv, E =
_
t
0
Fv dt
En un sistema mec anico rotativo, la potencia (w) est a dada como el producto
del par aplicado T (Nm, Newtonmetro) y la velocidad angular (rad/s,
radian/segundo), mientras que la energa (E) intercambiada en el intervalo
de tiempo [0, t] se calcula como la integral de la potencia:
w = T, E =
_
t
0
T dt
En un sistema de uidos, la potencia (w) est a dada como el producto de la pre-
si on P (N/m
2
, Newton/metro
2
) y el ujo del uido Q (m
3
/s, metro
3
/segundo),
mientras que la energa (E) intercambiada en el intervalo de tiempo [0, t] se
calcula como la integral de la potencia:
2.2 Almacenadores de energa 19
w = PQ, E =
_
t
0
PQ dt
Se recomienda hacer el an alisis dimensional correspondiente en cada caso pa-
ra vericar que la energa siempre est a dada en Joules=Newtonmetro y la
potencia en Joules/segundo.
Los componentes de un sistema pueden clasicarse de la siguiente manera,
de acuerdo a la accion que realizan sobre la energa E que intercambian:
Almacenadores de energa.
Disipadores de energa.
Fuentes de energa.
Convertidores.
A continuacion se estudia cada una de estas funciones.
2.2. Almacenadores de energa
Existen dos maneras de almacenar la energa: i) mediante el almacena-
miento de esfuerzo e ii) mediante el almacenamiento de ujo. Estas dos ma-
neras de almacenar la energa denen dos nuevas variables: la acumulacion de
esfuerzo (e
a
) y la acumulacion de ujo (f
a
):
e
a
=
_
t
0
e dt, e =
de
a
dt
f
a
=
_
t
0
f dt, f =
df
a
dt
Notese que a partir de estas expresiones tambien se puede escribir:
e dt = de
a
, f dt = df
a
lo cual, al ser sustituido en (2.1) da origen a las siguientes expresiones para
la energa almacenada en terminos de la acumulacion de esfuerzo:
E =
_
ea(t)
ea(0)
f de
a
(2.2)
y para la energa almacenada en terminos de la acumulacion de ujo:
E =
_
fa(t)
fa(0)
e df
a
(2.3)
Para poder calcular la integral en (2.2) es necesario que el ujo f se pueda
escribir como funcion de la acumulacion de esfuerzo e
a
, es decir que se pueda
escribir:
20 2 Modelado matematico de sistemas fsicos
f = (e
a
)
Por otro lado, para poder calcular la integral en (2.3) es necesario que el
esfuerzo e se pueda escribir como funcion de la acumulacion de ujo f
a
, es
decir que se pueda escribir:
e = (f
a
)
En cada caso, las funciones y se conocen como las funciones constituti-
vas del componente del sistema que realiza la accion de almacenamiento de
esfuerzo o de ujo. A continuacion se estudian los componentes que realizan
el almacenamiento de esfuerzo o de ujo en sistemas de diferente naturaleza.
2.2.1. Sistemas mecanicos traslacionales
Almacenamiento de ujo
En la gura 2.3 se muestra un cuerpo rgido (sin exibilidad) de masa m
(positiva) que se mueve con velocidad v
12
(v
12
= e, esfuerzo) bajo el efecto de
una fuerza F (F = f, ujo). Se supone que no existe friccion entre el cuerpo
y el medio que lo rodea. Los sentidos mostrados para la fuerza y la velocidad
son los sentidos que se denen como positivos para este tipo de componente
de sistema. Bajo estas condiciones, la Segunda Ley de Newton [2], pag. 89,
establece que:
F = ma (2.4)
donde a =
dv12
dt
es la aceleracion del cuerpo. La siguiente manera de denir el
momentum p:
p = mv
12
(2.5)
es muy conveniente porque se puede integrar (2.5) y (2.4) para concluir que el
momentum es la acumulacion de ujo (p = f
a
), es decir que se puede escribir:
p =
_
t
0
F dt +p(0)
A partir de (2.5) se concluye que la funcion constitutiva es:
v
12
= (p) =
1
m
p, (e = (f
a
))
Entonces, sustituyendo v
12
= e, p = f
a
y v
12
= p/m en (2.3) y suponiendo
que p(0) = 0, se encuentra que la energa almacenada esta dada como:
E =
_
p
0
1
m
p dp =
1
2m
p
2
=
1
2
mv
2
12
lo cual constituye la expresion bien conocida para la energa cinetica.
2.2 Almacenadores de energa 21
F
v
12
m
1
2
Figura 2.3. Un cuerpo rgido de masa m como almacenador de ujo en sistemas
mecanicos traslacionales.
Almacenamiento de esfuerzo
En la gura 2.4 se muestra un resorte que se deforma (se comprime o se
estira) a una velocidad v
12
(v
12
= e, esfuerzo) bajo el efecto de una fuerza F
(F = f, ujo). Notese que aunque la fuerza F se aplica en el extremo 1 del
resorte, debe considerarse que una fuerza del mismo valor y de sentido con-
trario aparece en el extremo 2 del resorte para que sea posible la deformacion.
Ademas, v
12
= v
1
v
2
donde v
1
y v
2
son las velocidades de los extremos 1 y
2 del resorte, respectivamente. Los sentidos mostrados para la fuerza y las ve-
locidades son los que se denen como positivos para este tipo de componente
de sistema. Notese que la velocidad v
12
indica que el extremo 1 del resorte
se aproxima al extremo 2 del resorte. Se supone que el resorte no tiene masa
y que la deformacion no es permanente ni produce calor. El almacenamiento
de energa en un resorte se realiza mediante el desplazamiento neto del re-
sorte respecto de su estado nominal. El estado nominal del resorte puede ser
denido como aquel en el cual el resorte no esta ni estirado ni comprimido,
pero en algunos casos tambien puede ser denido como aquel en el cual el
sistema mecanico completo esta en reposo aunque el resorte este comprimido
o estirado en esa situacion de reposo. Por tanto, la acumulacion de esfuerzo
se dene como el desplazamiento neto (e
a
= x
12
):
F
v
12
F
v
1
v
2
1 2
Figura 2.4. Un resorte como almacenador de esfuerzo en sistemas mecanicos tras-
lacionales.
x
12
=
_
t
0
v
12
dt +x
12
(0) (2.6)
22 2 Modelado matematico de sistemas fsicos
donde x
12
= x
1
x
2
con x
1
y x
2
las posiciones de los extremos 1 y 2 del
resorte, respectivamente. De acuerdo al sentido de la velocidad v
12
que se ha
denido en la gura 2.4 se concluye que el desplazamiento neto x
12
es positivo
cuando el resorte esta comprimido.
En el caso de un resorte lineal la funcion constitutiva responde a la Ley
de Hooke [2], pag. 640:
F = k x
12
, (f = (e
a
)) (2.7)
donde k es una constante positiva que se conoce como la constante de rigidez
del resorte. Entonces, sustituyendo x
12
= e
a
, F = f y F = k x
12
en (2.2)
y suponiendo que x
12
(0) = 0, se encuentra que la energa almacenada en el
resorte esta dada como:
E =
_
x12
0
k x
12
dx
12
=
1
2
k x
2
12
2.2.2. Sistemas mecanicos rotativos
Almacenamiento de ujo
En la gura 2.5 se muestra un cuerpo rgido (sin exibilidad) que gira
con velocidad angular
12
(
12
= e, esfuerzo) bajo el efecto de un par T
(T = f, ujo). Se supone que no existe friccion entre el cuerpo y el medio
que lo rodea. Los sentidos mostrados para el par y la velocidad angular son
los sentidos que se denen como positivos para este tipo de componente de
sistema. De acuerdo a la Segunda Ley de Newton [2], pag. 122:
Eje de rotacin
T
1
2
!
12
Figura 2.5. Un cuerpo rgido rotativo de inercia I como almacenador de ujo en
sistemas mecanicos rotativos.
T = I (2.8)
donde =
d12
dt
es la aceleracion angular del cuerpo e I es el momento de
inercia (constante positiva). El momentum angular h se dene de la siguiente
manera conveniente:
2.2 Almacenadores de energa 23
h = I
12
(2.9)
porque integrando (2.8) y (2.9) se encuentra que el momentum angular es la
acumulacion de ujo (h = f
a
) porque se puede escribir:
h =
_
t
0
T dt +h(0)
A partir de (2.9) se concluye que la funcion constitutiva es:

12
= (h) =
1
I
h, (e = (f
a
))
Entonces, sustituyendo
12
= e, h = f
a
y
12
= h/I en (2.3) y suponiendo
que h(0) = 0, se encuentra que la energa almacenada esta dada como:
E =
_
h
0
1
I
h dh =
1
2I
h
2
=
1
2
I
2
12
lo cual constituye la expresion bien conocida para la energa cinetica.
Almacenamiento de esfuerzo
En la gura 2.6 se muestra un resorte que se deforma (mediante una exion
angular) a una velocidad
12
(
12
= e, esfuerzo) bajo el efecto de un par T
(T = f, ujo). Notese que aunque el par T se aplica en el extremo 1 del resorte,
debe considerarse que un par del mismo valor y de sentido contrario aparece
en el extremo 2 del resorte para que sea posible la deformacion. Ademas,

12
=
1

2
con
1
y
2
las velocidades de los extremos 1 y 2 del resorte,
respectivamente. Los sentidos mostrados para la fuerza y las velocidades son
los que se denen como positivos para este tipo de componente de sistema.
Se supone que el resorte no tiene momento de inercia (o masa) y que la
deformacion no es permanente ni produce calor. El almacenamiento de energa
en un resorte se realiza mediante el desplazamiento angular neto del resorte
respecto de su estado nominal. El estado nominal del resorte puede ser denido
como aquel en el cual el resorte no esta exionado en ni en sentido horario
ni antihorario, pero en algunos casos tambien puede ser denido como aquel
en el cual el sistema mecanico completo esta en reposo aunque el resorte este
exionado en esa situacion de reposo. Por tanto, la acumulacion de esfuerzo
se dene como el desplazamiento angular neto (e
a
=
12
):

12
=
_
t
0

12
dt +
12
(0) (2.10)
donde
12
=
1

2
con
1
y
2
las posiciones angulares de los extremos 1 y
2 del resorte, respectivamente. De acuerdo al sentido de la velocidad
12
que
24 2 Modelado matematico de sistemas fsicos
se ha denido en la gura 2.6 se concluye que el desplazamiento angular neto

12
es positivo cuando el resorte se exiona de modo que
1
>
2
.
En el caso de un resorte lineal, la funcion constitutiva responde a la Ley
de Hooke:
T = k
12
, (f = (e
a
)) (2.11)
donde k es una constante positiva que se conoce como la constante de rigidez
torsional del resorte. Entonces, sustituyendo
12
= e
a
, T = f y T = k
12
en
(2.2) y suponiendo que
12
(0) = 0, se encuentra que la energa almacenada en
el resorte esta dada como:
E =
_
12
0
k
12
d
12
=
1
2
k
2
12
2.2.3. Sistemas electricos
Almacenamiento de esfuerzo
En la gura 2.7 se muestra un inductor a traves del cual circula una corrien-
te electrica i (i = f, ujo) bajo el efecto de un voltaje v
12
(v
12
= e, esfuerzo)
aplicado entre sus extremos. Se supone que no existen efectos parasitos, es
decir, el inductor no tiene resistencia electrica interna ni existe capacitancia
entre sus espiras. Los sentidos mostrados para la corriente electrica y el voltaje
son los sentidos que se denen como positivos para este tipo de componente
de sistema.
Faraday fue el primero en darse cuenta de que un inductor (y en general
cualquier circuito electrico sucientemente largo, dado que un inductor es un
conductor electrico arrollado sobre un n ucleo) tiene propiedades analogas a
las que tiene el momentum en sistemas mecanicos. Lo que Faraday llamo el
T T
1
2
!
2
!
1
!
12
Figura 2.6. Un resorte como almacenador de esfuerzo en sistemas mecanicos rota-
tivos.
+
v
12
i
1 2
Figura 2.7. Un inductor como almacenador de esfuerzo en sistemas electricos.
2.2 Almacenadores de energa 25
momentum electrodinamico es mas conocido actualmente como el ujo con-
catenado y es igual al ujo magnetico que es encerrado por el inductor.
Faraday encontro que el ujo concatenado es proporcional a la corriente i que
uye a traves del inductor y a una constante positiva L que depende de la
forma geometrica en que el conductor esta arrollado para formar el inductor.
La constante L recibe el nombre de inductancia. Por tanto, se puede escribir:
= Li (2.12)
El ujo concatenado determina el voltaje que se produce en los extremos de
un inductor mediante lo que hoy se conoce como la Ley de Faraday [2], pag.
606, [3], pag. 325:
v
12
=
d
dt
= L
di
dt
(2.13)
Esto signica que el ujo concatenado representa la acumulacion de voltaje o
esfuerzo ( = e
a
).
=
_
t
0
v
12
dt +(0)
Por tanto, a partir de la expresion en (2.12) se concluye que:
i = () =
1
L
, (f = (e
a
))
Entonces, sustituyendo i = f, = e
a
e i = /L en (2.2) y suponiendo que
(0) = 0, se encuentra que la energa almacenada esta dada como:
E =
_

0
1
L
d =
1
2L

2
=
1
2
Li
2
(2.14)
lo cual constituye la expresion bien conocida para la energa magnetica alma-
cenada en un inductor.
Almacenamiento de ujo
Un capacitor se forma donde quiera que se encuentren dos conductores
electricos con potenciales electricos diferentes, separados por un material no
conductor a una distancia sucientemente peque na como para que se genere
un campo electrico entre ellos. Cada uno de los conductores electricos recibe
el nombre placa. En la gura 2.8 se muestra un capacitor a traves del cual
circula una corriente electrica i (i = f, ujo) bajo el efecto de un voltaje v
12
(v
12
= e, esfuerzo) aplicado entre sus terminales. Se supone que no existen
efectos parasitos, es decir que no existe corriente de fuga entre las placas del
capacitor y que no existen efectos inductivos debidos a las placas del capa-
citor. Debido a la diferencia de potencial que existe entre los conductores se
26 2 Modelado matematico de sistemas fsicos
producira una acumulacion de carga electrica. Se usa la letra q para repre-
sentar dicha carga electrica, la cual es igual pero de signo contrario en cada
uno de los conductores. Con el n de cuanticar la cantidad de carga electrica
que puede ser almacenada, se dene la capacitancia C (constante positiva)
del siguiente modo [3], pag. 121:
C =
q
v
12
(2.15)
La capacitancia C depende de la forma geometrica y la cercana de los con-
ductores (placas), as como de las propiedades dielectricas del material no
conductor colocado entre ellos. La corriente electrica se dene a partir de la
carga electrica del siguiente modo:
i =
dq
dt
(2.16)
Por tanto, la carga electrica representa la acumulacion de ujo (de corriente
electrica) (q = f
a
):
q =
_
t
0
i dt +q(0)
A partir de la expresion en (2.15) se concluye que
v
12
= (q) =
1
C
q, (e = (f
a
))
Entonces, sustituyendo v
12
= e, q = f
a
y v
12
= q/C en (2.3) y suponiendo
que q(0) = 0, se encuentra que la energa almacenada esta dada como:
E =
_
q
0
1
C
q dq =
1
2C
q
2
lo cual constituye la expresion bien conocida para la energa electrica alma-
cenada en un capacitor.
+
v
12
i
1 2
Figura 2.8. Un capacitor como almacenador de ujo en sistemas electricos.
2.3 Disipadores de energa 27
2.3. Disipadores de energa
Un disipador es un componente que basicamente convierte la energa en
otra forma de energa (generalmente termica) la cual no es recuperable por el
sistema. A diferencia de los almacenadores de energa, la disipacion de energa
solo se realiza mediante un unico proceso. As, un disipador es un componente
cuya funcion constitutiva relaciona de manera estatica (sin integrales de por
medio) a las variables generalizadas de esfuerzo y de ujo:
e = (f)
En este caso no hay energa almacenada y solo se puede hablar de que la
potencia instantanea que se disipa esta dada por el producto de las variables
generalizadas de esfuerzo y ujo:
w = ef (2.17)
A continuacion se estudian los componentes disipadores de energa en sistemas
de diferente naturaleza.
2.3.1. Sistemas mecanicos traslacionales
Cualquier objeto mecanico que requiere de la aplicacion permanente de
una fuerza para poder mantener un valor de velocidad presenta efectos di-
sipativos. Normalmente la disipacion de potencia ocurre porque la energa
cinetica esta siendo convertida en energa termica por efecto de la friccion, la
cual aparece siempre que dos cuerpos hacen contacto mientras existe movi-
miento relativo entre ellos. La funcion constitutiva de un disipador mecanico
general esta dada como:
v
12
= (F)
donde v
12
(e, esfuerzo) es la velocidad relativa entre los cuerpos y F (f, ujo)
es la fuerza aplicada. Un caso particular muy importante de friccion es la
friccion viscosa, la cual esta representada por una funcion constitutiva lineal
de la forma:
v
12
=
1
b
F, friccion viscosa (2.18)
donde b es una constante positiva conocida como el coeciente de friccion
viscosa. Este tipo de friccion ocurre, por ejemplo, cuando una placa plana
y llena de oricios se desplaza dentro de una camara cerrada llena de aire,
como se muestra en la gura 2.9. Debido a que el aire debe uir a traves de
los oricios conforme la placa se mueve a velocidad v
12
, es necesario aplicar
una fuerza F para mantener la velocidad del movimiento. Ademas, v
12
=
v
1
v
2
donde v
1
y v
2
son las velocidades de los extremos 1 y 2 del dispositivo,
28 2 Modelado matematico de sistemas fsicos
respectivamente. Los sentidos de la fuerza y las velocidades mostrados en la
gura 2.9 son los denidos como positivos. Aunque el dispositivo mostrado en
la gura 2.9 puede no estar colocado fsicamente entre dos cuerpos que hacen
contacto, la friccion viscosa generalmente esta presente y es com un tomarla
en cosideracion. De acuerdo a (2.17), la potencia disipada por efecto de la
friccion viscosa esta dada como:
w =
1
b
F
2
= bv
2
12
1
2
F
v
12
v
2
F v
1
Figura 2.9. La friccion viscosa se produce como resultado de la resistencia al ujo
del aire a traves de los oricios.
Tambien existen otros tipos de friccion que con frecuencia aparecen en la
practica. Dos de ellas son la friccion estatica y la friccion de Coulomb. Las
funciones constitutivas en cada caso son:
F = F
s
|
v12=0
, friccion estatica (2.19)
F = F
c
signo(v
12
), signo(v
12
) =
_
+1, si v
12
> 0
1, si v
12
< 0
, friccion de Coulomb
(2.20)
La friccion estatica representa una fuerza que tiende a prevenir el movimiento
solo en el momento en que este esta a punto de iniciar. Esta es la razon por
la que en la ecuacion (2.19) la contante F
s
se eval ua en v
12
= 0. La friccion
de Coulomb, en cambio, solo aparece cuando el movimiento se esta realizando
(v
12
= 0) y es constante para velocidades del mismo signo. En la gura 2.10 se
muestran gracamente las funciones constitutivas en (2.18), (2.19) y (2.20).
Dado que las fuerzas de friccion estatica y de Coulomb no tienden a ce-
ro cuando la velocidad tiende a cero, estas fricciones son las responsables
de algunos problemas en sistemas de control de posicion: la diferencia entre
la posicion que se desea alcanzar y la posicion realmente alcanzada por el
mecanismo es diferente de cero, lo que se conoce como un error en estado
2.3 Disipadores de energa 29
F F F
F
s
F
c
F
c
F
s
b
v
12
v
12
v
12
Figura 2.10. Funciones constitutivas denidas en (2.18), (2.19) y (2.20).
estacionario diferente de cero. Por otro lado, dado que las fricciones estatica
y de Coulomb tienen funciones constitutivas no lineales y discontinuas, no
pueden ser manejadas usando tecnicas de control por sistemas lineales ni por
las tecnicas de control para sistemas no lineales suaves. Esta es la razon
por las que con frecuencia no son consideradas en el modelado de sistemas.
Sin embargo, hay que tener presente que en cualquier situacion experimental
se observaran los efectos de estas dos fricciones. Se sugiere consultar [4] si se
desea conocer algunos metodos para medir los parametros de distintos tipos
de friccion.
2.3.2. Sistemas mecanicos rotativos
Los disipadores en sistemas mecanicos rotativos (vease la gura 2.11) son
identicos a los disipadores en sistemas mecanicos traslacionales. La unica di-
ferencia es que las variables generalizadas de esfuerzo y ujo estan expresadas
en terminos de velocidad angular
12
(
12
= e, esfuerzo) y par T (T = f,
ujo):

12
=
1
b
T, friccion viscosa (2.21)
T = T
s
|
12=0
, friccion estatica
T = T
c
signo(
12
), signo(
12
) =
_
+1, si
12
> 0
1, si
12
< 0
, friccion de Coulomb
2.3.3. Sistemas electricos
El componente disipador en sistemas electricos es aquel en el cual es ne-
cesario aplicar un voltaje v
12
(v
12
= e, esfuerzo) entre sus terminales para
mantener el ujo de una corriente i (i = f, ujo) a traves de el. La funcion
constitutiva correspondiente relaciona de manera estatica estas dos variables
30 2 Modelado matematico de sistemas fsicos
T T
!
12
!
1
!
2
Figura 2.11. Un disipador en sistemas mecanicos rotativos.
y esta denida por la Ley de Ohm [2], pag. 530, en el caso de que el disipador
sea lineal:
v
12
= iR (2.22)
donde R es una constante positiva conocida como la resistencia electrica del
disipador. En la gura 2.12 se muestra una resistencia electrica por la que
uye una corriente i y se aplica un voltaje v
12
. Los sentidos mostrados son los
denidos como positivos. De acuerdo a w = ef, la potencia disipada en una
resistencia electrica esta dada como:
w = i
2
R =
1
R
v
2
12
1
2
+
i
v
12
Figura 2.12. Una resistencia como disipador en sistemas electricos.
2.4. Fuentes de energa
Las fuentes de energa pueden ser de dos tipos: fuentes de esfuerzo (e) y
fuentes de ujo f. En las guras 2.13(a) y 2.13(b) se muestran ambos tipos
de fuentes y los sentidos denidos como positivos para el esfuerzo y el ujo.
Tambien se muestran dos dibujos en los que especica que una fuente de
esfuerzo (o de ujo) entrega un esfuerzo (o un ujo) que es independiente
(constante) del ujo (o esfuerzo) a traves de la fuente. Mas a un, cuando la
potencia w = ef es positiva, entonces w es la potencia que la fuente entrega
a los otros componentes del sistema; cuando la potencia w = ef es negativa,
entonces w es la potencia que la fuente recibe desde los otros componentes del
sistema.
2.4 Fuentes de energa 31
Recibe
potencia
Entrega
potencia
e
1
+

f
e
1
f
e
(a)
Recibe
potencia
Entrega
potencia
+

f
e
1
f
1
f
e
(b)
Figura 2.13. Fuentes de esfuerzo y de ujo.
2.4.1. Sistemas mecanicos traslacionales
Una fuente de fuerza es una fuente de ujo, por lo que la fuente entrega
una fuerza cuyo valor es independiente de la velocidad (esfuerzo) del compo-
nente del sistema sobre el cual se esta aplicando dicha fuerza. Una fuente de
velocidad es una fuente de esfuerzo, por lo que la velocidad que produce es
independiente de la fuerza (ujo) ejercida sobre el componente del sistema
correspondiente. Claramente es mucho mas facil visualizar lo que es una fuen-
te de fuerza que una fuente de velocidad. Sin embargo, algunos fenomenos
pueden ser modelados de manera conveniente como fuentes de velocidad.
2.4.2. Sistemas mecanicos rotativos
Las fuentes se denen como en el caso de sistemas mecanicos traslacionales,
pero en terminos de par (ujo) y velocidad angular (esfuerzo).
2.4.3. Sistemas electricos
Una fuente de corriente electrica es una fuente de ujo, por lo que la fuente
entrega una corriente electrica cuyo valor es independiente del voltaje (esfuer-
zo) entre sus terminales. Una fuente de voltaje es una fuente de esfuerzo, por
lo que el voltaje entre sus terminales es independiente de la corriente electrica
a traves de ella. Tal como sucede en los sistemas mecanicos, es mas facil visua-
lizar una clase de fuentes: el concepto de fuente de voltaje es mas claro que el
de una fuente de corriente electrica. Sin embargo, el uso de fuentes de corrien-
te es un articio muy util para modelar algunos efectos que se presentan, por
ejemplo, en circuitos electronicos.
32 2 Modelado matematico de sistemas fsicos
2.5. Convertidores
Los convertidores son componentes que simplemente permiten que la
energa uya a traves de ellos sin almacenarla ni disiparla. Estos componentes
estan conectados a traves de dos puertos (vese la gura 2.14). Cada puerto
esta denido por una variable generalizada de esfuerzo y una de ujo. El pa-
pel de los convertidores es modicar las variables de esfuerzo y de ujo en
el segundo puerto respecto de las variables de esfuerzo y de ujo que existen
en el primer puerto. Este proceso es realizado de manera que la energa en el
segundo puerto es igual a la energa en el primer puerto. Esos componentes
se pueden clasicar en dos tipos: i) los transformadores, en los cuales las va-
riables de esfuerzo y de ujo en ambos puertos son de la misma naturaleza e
ii) los adaptadores, en lo cuales las variables de esfuerzo y ujo en un puerto
son de naturaleza diferente a las del otro puerto.
Convertidor
e
1
e
2
f
1 2
f
Puerto 1 Puerto 2
Figura 2.14. Un convertidor tiene dos puertos.
2.5.1. Transformadores
Sistemas electricos
Un transformador electrico esta formado por dos inductores (conduc-
tores electricos) enrollados rmemente sobre un mismo n ucleo de material
ferromagnetico (vease la gura 2.15). Esto signica que los inductores est an
magneticamente acoplados pero electricamente aislados.
Cada inductor dene un puerto. En el puerto 1, v
1
representa la variable
de esfuerzo e i
1
representa la variable de ujo. En el puerto 2, v
2
representa
la variable de esfuerzo e i
2
representa la variable de ujo. Las direcciones
indicadas representan los sentidos denidos como positivos de estas variables.
El punto colocado en la parte superior de cada inductor se usa como una
convencion para indicar que los inductores se enrollan en la misma direccion.
Si no fuera este el caso entonces los puntos se colocaran en extremos opuestos
de los inductores. El inductor conectado al puerto 1 consta de n
1
vueltas y el
inductor conectado al puerto 2 consta de n
2
vueltas.
2.5 Convertidores 33
Como los inductores estan acoplados magneticamente, el ujo concatenado
por el inductor 1,
1
, y por el inductor 2,
2
, dependen ahora de las corrientes
en ambos inductores:

1
= L
1
i
1
+M
12
i
2
, (2.23)

2
= M
21
i
1
+L
2
i
2
(2.24)
donde L
1
, L
2
son las inductancias de los inductores 1 y 2, mientras que M
12
y M
21
son las inductancias mutuas existentes entre ambos circuitos. Siempre
se cumple que M
12
= M
21
= M. Los signos positivos en las expresiones
anteriores son debidos a que las orientaciones de las corrientes son tales que
la corriente positiva entra a los arrollamientos por los extremos marcados con
un punto. Despejando i
2
de (2.23) y sustituyendo en (2.24) se obtiene:

2
=
L
2
M

1
+
_
M
L
1
L
2
M
_
i
1
(2.25)
Se dene el coeciente de acoplamiento como:
k =
M

L
1
L
2
Si los circuitos estan completamente desacoplados entonces k = 0, pero si
los dos circuitos estan perfectamente acoplados de modo que todo el ujo
que es encerrado por el inductor 1 tambien es encerrado por el inductor 2,
entonces k = 1. Este caso es obtenido con muy buen grado de aproximacion
en la practica si el n ucleo sobre el cual se enrollan los dos inductores es de
material ferromagnetico con un valor grande de permeabilidad magnetica .
Suponiendo que este es el caso, es decir que M =

L
1
L
2
, entonces (2.25) se
convierte en:

2
=
_
L
2
L
1

1
(2.26)
+

v
1
v
2

+
i
2
i
1
n
1
n
2
Figura 2.15. Transformador electrico.
34 2 Modelado matematico de sistemas fsicos
Por otro lado, dividiendo (2.24) entre (2.23), con M
12
= M
21
= M, y usando
(2.26):

1
=
Mi
1
+L
2
i
2
L
1
i
1
+Mi
2
=
_
L
2
L
1
A partir de esto se puede escribir:
i
2
i
1
=

L
1
L
2
M
L
2

_
L2
L1
M
=

L1

L2
(

L
1
L
2
M)

L
1
L
2
M
=
_
L
1
L
2
(2.27)
La inductancia de cada circuito esta dada como:
L
1
=
n
2
1
A
l
L
2
=
n
2
2
A
l
donde A, l y son, respectivamente, el area, la longitud media y la permea-
bilidad magnetica del n ucleo. Por tanto
_
L
1
L
2
=
n
1
n
2
(2.28)
Usando esto y (2.13) se obtiene, de (2.26):
v
2
=
n
2
n
1
v
1
y de (2.27):
i
2
=
n
1
n
2
i
1
Lo cual signica que la potencia en ambos puertos es igual porque:
w
2
= v
2
i
2
=
n
2
n
1
v
1
n
1
n
2
i
1
= v
1
i
1
= w
1
Sistemas mecanicos traslacionales
En la gura 2.16 se muestra un transformador mecanico traslacional as co-
mo las variables denidas y los sentidos denidos positivos de las mismas. Se
trata de una palanca con brazos de longitud a y b. Las posiciones x
1
y x
2
se
obtienen por simple geometra:
2.5 Convertidores 35
x
1
= a sin(), x
2
= b sin()
Derivando respecto al tiempo y dividiendo ambos resultados se obtiene la
relacion entre esfuerzos:
v
2
=
b
a
v
1
La relacion entre las fuerzas (ujos) en cada puerto se obtiene usando el
principio del trabajo virtual:
F
1
x
1
= F
2
x
2
x
1
= a sin(), x
2
= b sin()
F
2
=
a
b
F
1
Notese que la potencia en ambos puertos es igual:
w
2
= v
2
F
2
=
b
a
v
1
_
a
b
F
1
_
= F
1
v
1
= w
1
v
2
v
1
F
1
F
2
a
b

Figura 2.16. Transformador mecanico traslacional.


Sistemas mecanicos rotativos
En la gura 2.17 se muestran dos ruedas dentadas de radios r
1
y r
2
unidas,
cada una, a un eje rotativo. La rueda de radio r
1
tiene n
1
dientes mientras que
la rueda de radio r
2
tiene n
2
dientes. En la gura 2.17 tambien se muestran
los sentidos denidos como positivos de los pares y las velocidades angulares
36 2 Modelado matematico de sistemas fsicos
en cada rueda. El hecho de que las ruedas sean dentadas evita que las ruedas
puedan patinar. Esto asegura que la longitud de arco de crculo s generado
por un angulo
1
descrito en el eje 1 sea igual a la longitud de arco generado
por un angulo
2
en el eje 2. Existe una relacion geometrica que relaciona al
radio de un crculo, el angulo descrito por el mismo y la longitud del arco de
crculo generado. Aplicando esta relacion en ambos ejes se tiene:
s =
1
r
1
, s =
2
r
2
(2.29)
donde
1
y
2
deben estar dados en radianes. De lo anterior se obtiene:

1
r
1
=
2
r
2
(2.30)
n
1
n
2
s
r
1
r
2
T
1
T
2
!
2
!
1

1

2
F
Figura 2.17. Caja de engranes.
Por otro lado, se sabe que el paso de los engranes (ancho de cada diente)
es igual en ambos ejes, pues esto es necesario para que dichos dientes se
adapten correctamente al girar. Esto signica que:
p
1
= n
1
, p
2
= n
2
p
1
= 2r
1
, p
2
= 2r
2
donde p
1
y p
2
representan los permetros de cada una de las ruedas dentadas.
Combinando estas expresiones se tiene:
r
1
r
2
=
n
1
n
2
(2.31)
Combinando (2.30) y (2.31):

1
=
n
2
n
1

2
Derivando respecto al tiempo se obtiene:
2.5 Convertidores 37

1
=
n
2
n
1

2
(2.32)
donde
1
y
2
son las velocidades angulares de cada rueda. Por otro lado, la
fuerza F aplicada en el punto donde hacen contacto las ruedas es igual para
ambas. Esta fuerza satisface:
T
1
= Fr
1
, T
2
= Fr
2
donde T
1
y T
2
son los pares aplicados a cada eje. Despejando F e igualando:
T
1
=
r
1
r
2
T
2
=
n
1
n
2
T
2
(2.33)
Usando (2.33) y (2.32) se encuentra que la potencia en ambos puertos es igual:
w
1
= T
1

1
=
n
1
n
2
T
2
n
2
n
1

2
= T
2

2
= w
2
2.5.2. Adaptadores
Sistemas mecanicos
Considere el sistema pi non-cremallera mostrado en la gura 2.18. El puerto
1 esta denido en terminos de variables rotativas: la velocidad angular
1
es
el esfuerzo y el par T
1
es el ujo, mientras que el puerto 2 esta denido en
terminos de variables de traslacion: la velocidad v
2
es el esfuerzo y la fuerza
F
2
es el ujo. Por denicion, el par T
1
y la fuerza F
2
se relacionan a traves
de:
T
1
= rF
2
(2.34)
donde r es el radio del pi non, mientras que la velocidad angular
1
y la
velocidad v
2
se relacionan a traves de (vease (2.29)):
v
2
= r
1
(2.35)
Por tanto, la potencia en ambos puertos es igual:
w
1
= T
1

1
= rF
2
1
r
v
2
= F
2
v
2
= w
2
Los sentidos mostrados en la gura 2.18 son los denidos como positivos.
Sistemas electromecanicos
En la gura 2.19 se muestra una espira cuadrada de area A = l
2
colocada
dentro de un campo magnetico B. Por la espira circula una corriente electrica
i, en el sentido indicado, por efecto de una fuente de voltaje externa de valor E.
38 2 Modelado matematico de sistemas fsicos
F
2
T
1
r
v
2
!
1
Figura 2.18. Pi non-cremallera.
N S
B
E
+

+ v
i
L
R
(a) Vista superior.

l
N S
B
F
F
(b) Vista frontal.
Figura 2.19. Motor electrico de CD.
La resistencia R y la inductancia L mostradas en la gura 2.19(a) representan
la resistencia del cobre y la inductancia de la espira. La fuerza que ejerce el
campo magnetico sobre una corriente electrica de longitud l esta dada como
[2], pag. 541:
2.5 Convertidores 39

F = il u

B (2.36)
donde u es un vector unitario en el mismo sentido de la corriente electrica y
se usa la barra arriba de las variables para indicar que se trata de vectores.
El smbolo representa el producto vectorial. Por tanto, bajo la situacion
mostrada en la gura 2.19(b), es decir cuando = 90

, el campo magnetico
ejerce sobre los lados izquierdo y derecho de la espira la fuerza:
F = ilB
en el sentido indicado. Esto signica que sobre el eje de la espira se ejerce un
par de valor:
T = 2
l
2
F = iBl
2
= iBA
donde se ha considerado que el par debido a la fuerza en cada lado es lF/2
(fuerza por radio) y que hay dos fuerzas aplicadas de la misma magnitud: una
aplicada sobre el lado izquierdo y otra sobre el lado derecho de la espira. El
lector puede vericar que, de acuerdo a (2.36), las fuerzas sobre los lados de
la espira que estan atras y adelante no producen ning un par de giro. Todo
lo anterior signica que la espira gira con una velocidad angular =

, es
decir, en sentido contrario al denido para en la gura 2.19(b) donde es el
angulo formado por las direcciones del campo magnetico y la perpendicular
a la espira. De acuerdo a la Ley de Faraday [3], pag. 325, este movimiento
induce un voltaje v en las terminales de la espira el cual esta dado de acuerdo
a (2.13), es decir:
v =
d
dt
donde es el ujo magnetico concatenado por la espira el cual esta dado por:
= BAcos()
Por tanto, usando estas dos expresiones se encuentra:
v = BA

sin() = BA sin()
Notese que, de acuerdo a la Ley de Lenz [3], pag. 327, el voltaje inducido v
tiene una polaridad tal (vease la gura 2.19(a)) que se opone a la causa que
lo produce la cual en este caso es, a n de cuentas, la corriente que circula i.
Ahora suponga que se colocan varias espiras con diferentes inclinaciones, de
manera que un conmutador mecanico automaticamente conecte y desconecte
las espiras de tal modo que siempre este conectada solamente la espira para
la cual = 90

. Entonces, el voltaje en las terminales del conjunto esta dado


como:
v = BA
40 2 Modelado matematico de sistemas fsicos
Lo que se acaba de describir es el funcionamiento de un motor electrico de CD
(corriente directa). Sean el voltaje v y la corriente i las variables de esfuerzo
y ujo, respectivamente, del puerto 1 y sean la velocidad angular y el par T
las variables de esfuerzo y ujo, respectivamente, del puerto 2. Las relaciones
entre las variables de ambos puertos estan dadas por:
v = BA (2.37)
i =
1
BA
T
Si se considera que en el puerto 1 se aplica un par T a una velocidad ,
produciendo en el puerto 2 un voltaje v y una corriente electrica i, entonces
se tiene un generador electrico de CD y ambas expresiones en (2.37) a un son
validas. Notese que en cualquiera de estos casos, la potencia en ambos puertos
es igual:
w
1
= vi =
1
BA
TBA = T = w
2
En situaciones mas generales se acostumbra escribir las expresiones en (2.37)
del siguiente modo:
v = k
e
(2.38)
T = k
m
i (2.39)
donde k
e
> 0 y k
m
> 0 se conocen, respectivamente, como la constante de
fuerza contra electromotriz y la constante de par. Estas constantes se intro-
ducen para tomar en consideracion la presencia de varias espiras en serie y
otras variantes en la construccion de motores y generadores de CD. Se puede
usar el hecho de que la potencia en ambos puertos es igual:
w
1
= vi = k
e

1
k
m
T = T = w
2
para mostrar que k
e
= k
m
en cualquier motor (generador) de CD. Sin embar-
go, hay que tener cuidado con las unidades: k
e
= k
m
se cumple siempre que
estas constantes se expresen en el sistema internacional de unidades (metro-
kilogramo-segundo).
Sistemas electromecanicos: fuerza debida a un campo magnetico
En la gura 2.20 se muestra una barra de material ferromagnetico colocada
a una distancia x de un electroiman. El electroiman consiste de un inductor
arrollado sobre un n ucleo del mismo material ferromagnetico que la barra. Por
el inductor circula una corriente electrica i por efecto de un voltaje v aplicado
en sus terminales.
La inductancia L(x) es dependiente de la posicion x de la barra debido a lo
siguiente. De acuerdo a (2.12), el ujo magnetico esta dado como el producto
2.5 Convertidores 41
x
i
v

F
+

Figura 2.20. Fuerza debida un campo magnetico.


de la inductancia y la corriente electrica = L(x)i. Por otro lado, si la barra
se aproxima al n ucleo entonces el espacio entre ambos disminuye. Como el aire
presenta mayor resistencia al paso del ujo magnetico que la resistencia que
presenta un material ferromagnetico, entonces el ujo magnetico aumenta al
disminuir x. Si la corriente electrica se mantiene constante mientras se reduce
x entonces, de acuerdo a = L(x)i un aumento del ujo solo puede ser
debido a un aumento en la inductancia L(x), es decir, que la inductancia
cambia al cambiar x.
Por efecto del campo magnetico generado por la corriente i, la barra recibe
una fuerza de atraccion F hacia el n ucleo del electroiman. A continuacion
se obtiene una expresion para esta fuerza. Suponga que la barra sufre un
desplazamiento dx. El trabajo mecanico debido a este desplazamiento es:
dE
M
= Fdx (2.40)
De acuerdo a (2.14), la energa almacenada en el campo magnetico esta dada
como:
E
m
=
1
2
L(x)i
2
(2.41)
Como la corriente se mantiene constante y solo hay un cambio en la posicion
de la barra, entonces el cambio en la energa magnetica esta dado por:
dE
m
=
1
2
i
2
dL(x) (2.42)
Los cambios en las energas mecanica y magnetica deben ser suministrados
por la fuente de voltaje conectada a la inductancia, es decir:
dE
v
= dE
m
+dE
M
(2.43)
donde dE
v
es el trabajo suministrado por la fuente de voltaje. Este trabajo
debe ser realizado compensando el voltaje inducido en la inductancia el cual,
de acuerdo a (2.13) y = L(x)i, esta dado como:
42 2 Modelado matematico de sistemas fsicos
v =
d
dt
= i
dL(x)
dt
Por tanto:
dE
v
= vidt = i
2
dL(x) (2.44)
Sustituyendo (2.42) y (2.44) en (2.43):
dE
M
= i
2
dL(x)
1
2
i
2
dL(x) =
1
2
i
2
dL(x)
es decir, la mitad del trabajo realizado por la fuente de voltaje se dedica a
cambiar la energa magnetica y la otra mitad se dedica a realizar el trabajo
mecanico, es decir;
dE
m
= dE
M
(2.45)
Por otro lado, como el cambio en la energa magnetica solo se debe al cambio
en la posicion x, entonces se puede escribir:
dE
m
=
E
m
x
dx
Entonces, de acuerdo a esto, (2.40), (2.45) y (2.41) se concluye que:
F =
E
m
x
=
1
2
i
2
L(x)
x
(2.46)
El desarrollo aqu presentado se basa en las ideas reportadas en [5], cap. 5.
2.6. Ejemplos
Una vez que se han establecido las funciones constitutivas de cada ele-
mento de sistema se debe abordar el problema de conectar varios de estos
elementos para obtener el modelo matematico de sistemas mas o menos com-
plejos. La clave para interconectar los elementos de un sistema mecanico es
considerar que todos ellos se conectan mediante uniones rgidas. Esto signica
que la velocidad a ambos lados de una union es igual. Para ser mas claros, a
continuacion se presentan varios ejemplos.
Ejemplo 2.2 Considere el sistema masa-resorte-amortiguador mostrado en
la gura 2.21(a) donde se aplica una fuerza externa F(t) sobre el cuerpo de
masa m. Este sistema quiz a sea el m as sencillo desde el punto de vista del
modelado, pero es muy importante desde el punto de vista de control porque
representa el comportamiento b asico de los sistemas de control de posici on.
En la gura 2.21(b) se muestra el diagrama de cuerpo libre correspondien-
te. N otese que en cada uni on entre componentes existen dos fuerzas iguales
2.6 Ejemplos 43
aplicadas en sentidos contrarios. Esto es con el n de satisfacer la Tercera
Ley de Newton [2], p ag. 88, que establece que a cada acci on (del cuerpo A
sobre el cuerpo B) corresponde una reacci on (del cuerpo B sobre el cuerpo
A). Las ruedas debajo del cuerpo se usan para indicar que no existe fricci on
con el suelo sobre el cual se apoya. Esto tambien signica que el efecto de la
gravedad no interviene. Sin embargo, equivalentemente se podra eliminar el
amortiguador colocado en el extremo derecho para ser sustituido por fricci on
entre el cuerpo y el suelo. El modelado de la fricci on entre el cuerpo y el sue-
lo se realiza de manera identica a como se considera el amortiguador en el
procedimiento que sigue.
K
F t ( )
m
b
(a)
m
F
K
F
K
F t ( )
F
b
F
b
v
b
v
K
v
m
(b) Diagrama de cuerpo libre.
Figura 2.21. Sistema masa-resorte-amortiguador.
La nomenclatura utilizada es la siguiente:
v
m
=
dxm
dt
, donde x
m
es la posici on del cuerpo.
v
b
=
dx
b
dt
, donde x
b
es la posici on del extremo m ovil del amortiguador.
v
K
=
dxK
dt
, donde x
K
es la posici on del extremo m ovil del resorte.
Usando la gura 2.21(b), as como (2.4), (2.7), (2.18) se obtienen las siguien-
tes expresiones:
masa: m
dv
m
dt
= F(t) +F
K
F
b
(2.47)
resorte: Kx
K
= F
K
(2.48)
amortiguador: bv
b
= F
b
(2.49)
N otese que, de acuerdo a la convenci on de signos mostrada en la gura 2.3, las
fuerzas que act uan sobre la masa m y que tienen el mismo sentido que v
m
en
la gura 2.21(b) aparecen con signo positivo en (2.47) y por esa misma raz on
F
b
aparece afectada por un signo negativo. Los signos a ambos lados de las
expresiones en (2.48) y (2.49) respetan las convenciones de signos denidas
en las guras 2.4 y 2.9, respectivamente. N otese que uno de los extremos del
resorte y del amortiguador est a en reposo y que son los extremos m oviles los
44 2 Modelado matematico de sistemas fsicos
que en las guras 2.4 y 2.9 tienen una velocidad y una fuerza aplicadas en el
mismo sentido. N otese tambien que se ha denido:
v
K
=
dx
K
dt
(2.50)
Considerando que los diferentes elementos de sistema se conectan mediante
uniones rgidas, de acuerdo a la gura 2.21(b) se puede escribir:
v
K
= v
m
= v
b
(2.51)
De acuerdo a esto se concluye que se puede escribir:
x
K
= x
m
+c
1
= x
b
+c
2
donde c
1
y c
2
son dos constantes. Si se usa la convenci on de denir x
K
= 0,
x
m
= 0 y x
b
= 0 como aquellos puntos ocupados por el extremo m ovil del
resorte, el centro del cuerpo de masa m y el extremo m ovil del amortiguador,
respectivamente, cuando el sistema est a en reposo con F(t) = 0, entonces se
puede decir que c
1
= c
2
= 0 y, por tanto:
x
K
= x
m
= x
b
Usando estas relaciones, tambien se puede escribir (2.47), (2.48), (2.49) co-
mo:
m
d
2
x
m
dt
2
+b
dx
m
dt
+Kx
m
= F(t) (2.52)
Esta ultima expresi on es una ecuaci on diferencial ordinaria, de segundo or-
den, lineal y de coecientes constantes, que representa el modelo matem atico
del sistema masa-resorte-amortiguador. Esto signica que si se conocen los
par ametros m, b y K, as como las condiciones iniciales x
m
(0),
dxm
dt
(0) y la
fuerza externa aplicada F(t) como una funci on del tiempo, entonces se puede
resolver dicha ecuaci on diferencial para obtener la posici on x
m
(t) y la velo-
cidad
dxm
dt
(t) del cuerpo como funciones del tiempo. Dicho de otro modo, se
puede conocer la posici on y la velocidad del cuerpo en cualquier instante de
tiempo presente o en el futuro, es decir, para todo t 0. Finalmente, cuando
se estudia la soluci on de las ecuaciones diferenciales es conveniente expresar
una ecuaci on diferencial de manera que el coeciente de la potencia mayor
sea igual a la unidad, es decir, es m as conveniente escribir (2.52) como:
x
m
+
b
m
x
m
+
K
m
x
m
=
1
m
F(t) (2.53)
donde x
m
=
d
2
xm
dt
2
y x
m
=
dxm
dt
.
Ejemplo 2.3 En la gura 2.22(a) se muestra un sistema masa-resorte-
amortiguador con un resorte y un amortiguador colocados en un mismo ex-
tremo del cuerpo de masa m. El objetivo de este ejemplo es mostrar que el
modelo matem atico en este caso es identico al obtenido en el ejemplo previo.
La nomenclatura utilizada es la siguiente:
2.6 Ejemplos 45
v =
dx
dt
, donde x es la posici on del cuerpo.
v
1
=
dxK
dt
=
dx
b
dt
, donde x
K
= x
b
representan la posici on del extremo m ovil
del resorte y del amortiguador, respectivamente.
De acuerdo a la gura 2.22(b) y a (2.4), (2.7), (2.18), se obtienen las siguien-
tes expresiones:
masa: m
dv
dt
= F(t) +F
K
+F
b
(2.54)
resorte: Kx
K
= F
K
amortiguador: bv
1
= F
b
K
m
b
F(t)
(a)
m
F
K
F
b
F
K
F
b
v
v
1
v
1
F(t)
(b) Diagrama de cuerpo libre.
Figura 2.22. Sistema masa-resorte-amortiguador.
N otese que, de acuerdo a la convenci on de signos mostrada en la gura
2.3, todas las fuerzas en (2.54) aparecen afectadas por un signo positivo porque
tienen el mismo sentido que v en la gura 2.22(b). Por otro lado, al existir
una uni on rgida y de acuerdo a los sentidos denidos en la gura 2.22(b) se
tiene que:
v = v
1
(2.55)
Del mismo modo a como se hizo en el ejemplo previo, si x = 0, x
K
= 0 y
x
b
= 0 se denen, respectivamente, como el centro del cuerpo m y el extremo
m ovil del resorte y del amortiguador cuando el sistema completo est a en reposo
con F(t) = 0, entonces se puede escribir:
x
K
= x
b
= x (2.56)
46 2 Modelado matematico de sistemas fsicos
No es difcil darse cuenta que combinando las expresiones en (2.54) y usando
(2.56), (2.55) se obtiene:
x +
b
m
x +
K
m
x =
1
m
F(t)
donde x =
d
2
x
dt
2
y x =
dx
dt
. Este modelo matem atico es identico al mostrado en
(2.53) si se considera que x = x
m
.
Ejemplo 2.4 En la gura 2.23(a) se muestran dos cuerpos unidos por un
resorte cuando se aplica una fuerza externa F(t) sobre el cuerpo de la izquier-
da. Esta situaci on representa el caso pr actico en el que el cuerpo 1 transmite
movimiento al cuerpo 2 pero ambos cuerpos est an conectados mediante una
pieza mec anica que presenta exibilidad. Esta exibilidad no es introducida
de manera intencional sino que es un problema no deseado que aparece debido
a la rigidez nita del material con el que est a hecha la pieza mec anica que
une a los cuerpos 1 y 2. Con frecuencia es muy importante estudiar cual es
el efecto de esta exibilidad en el desempe no del sistema de control y por eso
debe ser tomada en consideraci on durante el modelado. Los amortiguadores
se introducen para considerar el efecto de la fricci on de cada cuerpo con sus
soportes (o el suelo).
K
F t ( )
m
2
m
1
b
1
b
2
(a)
K
F t ( )
m
2
m
1
F b
1
F b
1
F
K1
v
1
F
K2
F
K2
F
b2
F
b2
v
2
v
b2
v
b1
v
m1
F
K1
v
K
v
m2
(b) Diagrama de cuerpo libre.
Figura 2.23. Dos cuerpos unidos por un resorte.
El diagrama de cuerpo libre correspondiente se muestra en la gura 2.23(b).
La nomenclatura utilizada es la siguiente:
v
m1
=
dxm1
dt
, donde x
m1
es la posici on del cuerpo 1.
v
m2
=
dxm2
dt
, donde x
m2
es la posici on del cuerpo 2.
v
b1
=
dx
b1
dt
, donde x
b1
es la posici on del extremo m ovil del amortiguador
1.
2.6 Ejemplos 47
v
b2
=
dx
b2
dt
, donde x
b2
es la posici on del extremo m ovil del amortiguador
2.
v
1
=
dx1
dt
, donde x
1
es la posici on del extremo del resorte unido al cuerpo
1.
v
2
=
dx2
dt
, donde x
2
es la posici on del extremo del resorte unido al cuerpo
2.
Usando la gura 2.23(b), as como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:
masa 1: m
1
dv
m1
dt
= F(t) +F
b1
F
K1
(2.57)
masa 2: m
2
dv
m2
dt
= F
K2
F
b2
(2.58)
resorte: Kx
K
= F
K1
= F
K2
amortiguador 1: b
1
v
b1
= F
b1
amortiguador 2: b
2
v
b2
= F
b2
Las fuerzas que tienen el mismo sentido que v
m1
y v
m2
, y que act uan sobre
cada uno de los cuerpos, aparecen afectadas con un signo positivo y con un
signo negativo en caso contrario. N otese tambien que se ha denido:
v
K
=
dx
K
dt
= v
1
v
2
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la gura 2.23(b) se tiene que:
v
m1
= v
b1
= v
1
(2.59)
v
m2
= v
b2
= v
2
De acuerdo a esto, si se denen x
m1
= 0, x
m2
= 0, x
b1
= 0, x
b2
= 0,
x
1
= 0, x
2
= 0 como aquellos puntos ocupados por el centro del cuerpo 1, el
centro del cuerpo 2, el extremo m ovil del amortiguador 1, el extremo m ovil
del amortiguador 2, el extremo del resorte que est a unido al cuerpo 1 y el
extremo del resorte que est a unido al cuerpo 2, respectivamente, cuando todo
el sistema est a en reposo con F(t) = 0, entonces se concluye que:
x
m1
= x
b1
= x
1
, (2.60)
x
m2
= x
b2
= x
2
Por tanto, las expresiones en (2.57) y (2.58) se pueden escribir como:
masa 1: m
1
dv
m1
dt
= F(t) +b
1
v
b1
Kx
K
masa 2: m
2
dv
m2
dt
= Kx
K
b
2
v
b2
48 2 Modelado matematico de sistemas fsicos
Usando (2.59) y (2.60) se obtiene:
masa 1: m
1
d
2
x
m1
dt
2
= F(t) b
1
dx
m1
dt
Kx
K
masa 2: m
2
d
2
x
m2
dt
2
= Kx
K
b
2
dx
m2
dt
Por otro lado, de acuerdo al p arrafo que sigue a (2.6) se tiene que x
K
=
x
1
x
2
, por lo que se puede escribir:
masa 1: m
1
d
2
x
m1
dt
2
= F(t) b
1
dx
m1
dt
K(x
1
x
2
)
masa 2: m
2
d
2
x
m2
dt
2
= K(x
1
x
2
) b
2
dx
m2
dt
Finalmente, usando de nuevo (2.60) se obtiene que el modelo matem atico
correspondiente est a dado por las dos siguientes ecuaciones diferenciales, las
cuales deben ser resueltas simult aneamente:
masa 1:
d
2
x
m1
dt
2
+
b
1
m
1
dx
m1
dt
+
K
m
1
(x
m1
x
m2
) =
1
m
1
F(t)
masa 2:
d
2
x
m2
dt
2
+
b
2
m
2
dx
m2
dt

K
m
2
(x
m1
x
m2
) = 0
Estas dos ecuaciones diferenciales no pueden ser combinadas para obtener
una sola ecuaci on diferencial, ya que las variables x
m1
y x
m2
son linealmente
independientes, es decir, no se cuenta con ninguna expresi on algebraica que
relacione a estas variables.
Ejemplo 2.5 En la gura 2.24(a) se muestran dos cuerpos conectados a tres
resortes y un amortiguador. En este caso, el amortiguador representa la fric-
ci on existente entre los dos cuerpos y, por esto, no puede ser sustituido por la
posible fricci on existente entre cada cuerpo y el suelo (si no estuvieran colo-
cadas las ruedas debajo de cada cuerpo). El diagrama de cuerpo libre corres-
pondiente se muestra en la gura 2.24(b). La nomenclatura utilizada es la
siguiente:
x
1
=
dx1
dt
, donde x
1
es la posici on del cuerpo 1.
x
2
=
dx2
dt
, donde x
2
es la posici on del cuerpo 2.
v
b1
=
dx
b1
dt
, donde x
b1
es la posici on del extremo del amortiguador que
est a conectado al cuerpo 1.
v
b2
=
dx
b2
dt
, donde x
b2
es la posici on del extremo del amortiguador que
est a conectado al cuerpo 2.
v
1
=
dx
dt
, donde x es la posici on del extremo del resorte unido al cuerpo 1.
v
2
=
dy
dt
, donde y es la posici on del extremo del resorte unido al cuerpo 2.
v
K1
=
dxK1
dt
, donde x
K1
es la posici on del extremo m ovil del resorte co-
nectado s olo al cuerpo 1.
2.6 Ejemplos 49
m
2
m
1
K
1
x
1
b
x
2 K
2
K
3
F(t)
(a)
m
2
m
1
F
K1
F
K1
F
K2
F
K2
F
K2
F
b
v
1
F
b
v
b1
v
b2
F
K2
F
b
v
K3
F
K3
F
K3
x
1
x
2
v
K1
F(t)
v
2
F
b
(b) Diagrama de cuerpo libre.
Figura 2.24. Sistema con dos cuerpos y tres resortes.
v
K3
=
dxK3
dt
, donde x
K3
es la posici on del extremo m ovil del resorte co-
nectado s olo al cuerpo 2.
Usando la gura 2.24(b), as como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:
masa 1: m
1
x
1
= F(t) +F
K1
F
K2
F
b
(2.61)
masa 2: m
2
x
2
= F
K2
F
K3
+F
b
(2.62)
resorte entre cuerpos: K
2
x
K2
= F
K2
resorte izquierdo: K
1
x
K1
= F
K1
resorte derecho: K
3
x
K3
= F
K3
amortiguador: b(v
b1
v
b2
) = F
b
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la gura 2.24(b) se tiene que:
x
1
= v
K1
= v
1
= v
b1
(2.63)
x
2
= v
b2
= v
2
= v
K3
De acuerdo a esto, si se denen x
1
= 0, x
2
= 0, x
b1
= 0, x
b2
= 0, x = 0, y = 0,
x
K1
= 0, x
K3
= 0 como aquellos puntos ocupados por el centro del cuerpo 1,
el centro del cuerpo 2, el extremo del amortiguador conectado al cuerpo 1, el
extremo del amortiguador conectado al cuerpo 2, el extremo del resorte central
que est a unido al cuerpo 1, el extremo del resorte central que est a unido al
cuerpo 2, el extremo m ovil del resorte de la izquierda y el extremo m ovil del
50 2 Modelado matematico de sistemas fsicos
resorte de la derecha, respectivamente, cuando todo el sistema est a en reposo
con F(t) = 0, entonces se concluye que:
x
1
= x
K1
= x = x
b1
(2.64)
x
2
= x
b2
= y = x
K3
Por tanto, las expresiones en (2.61) y (2.62) se pueden escribir como:
masa 1: m
1
x
1
= F(t) +K
1
x
K1
K
2
x
K2
b(v
b1
v
b2
)
masa 2: m
2
x
2
= K
2
x
K2
K
3
x
K3
+b(v
b1
v
b2
)
Usando (2.63) y (2.64) se obtiene:
masa 1: m
1
x
1
= F(t) K
1
x
1
K
2
x
K2
b( x
1
x
2
)
masa 2: m
2
x
2
= K
2
x
K2
K
3
x
2
+b( x
1
x
2
)
Por otro lado, de acuerdo al p arrafo que sigue a (2.6) se tiene que x
K2
=
x
1
x
2
, por lo que se puede escribir:
masa 1: m
1
x
1
= F(t) K
1
x
1
K
2
(x
1
x
2
) b( x
1
x
2
)
masa 2: m
2
x
2
= K
2
(x
1
x
2
) K
3
x
2
+b( x
1
x
2
)
Finalmente, se obtiene que modelo matem atico correspondiente est a dado por
las dos siguientes ecuaciones diferenciales, las cuales deben ser resueltas si-
mult aneamente:
masa 1: x
1
+
b
m
1
( x
1
x
2
) +
K
1
m
1
x
1
+
K
2
m
1
(x
1
x
2
) =
1
m
1
F(t)
masa 2: x
2

b
m
2
( x
1
x
2
) +
K
3
m
2
x
2

K
2
m
2
(x
1
x
2
) = 0
Tal como ocurre en el ejemplo anterior, estas dos ecuaciones diferenciales no
pueden ser combinadas para obtener una sola ecuaci on diferencial, ya que las
variables x
1
y x
2
son linealmente independientes, es decir, no se cuenta con
ninguna expresi on algebraica que relacione a estas variables. N otese tambien
que los terminos correspondientes al resorte central y al amortiguador aparecen
con signo contrario en cada una de estas ecuaciones diferenciales. Esto es
debido a que la fuerza que produce el resorte central o el amortiguador sobre
el cuerpo 1 es en sentido contrario a la fuerza que ejerce sobre el cuerpo 2.
Ejemplo 2.6 En la gura 2.25(a) se muestra un cuerpo rotativo unido a dos
muros a traves de un resorte y un amortiguador. Sobre este cuerpo se aplica
un par externo T(t). En este caso, el amortiguador representa la fricci on
existente entre el cuerpo y los rodamientos sobre los que se apoya. El resorte
representa la exibilidad del eje o echa del cuerpo giratorio. El diagrama de
cuerpo libre correspondiente se muestra en la gura 2.25(b). La nomenclatura
utilizada es la siguiente:
2.6 Ejemplos 51

=
d
dt
, donde es la posici on angular del cuerpo.

b
=
d
b
dt
, donde
b
es la posici on angular del extremo m ovil del amorti-
guador.

K
=
dK
dt
, donde
K
es la posici on angular del extremo m ovil del resorte.
Usando la gura 2.25(b), as como (2.8), (2.11), (2.21), se obtienen las si-
guientes expresiones:
cuerpo giratorio: I

= T(t) +T
b
T
K
(2.65)
resorte: K
K
= T
K
amortiguador: b
b
= T
b
I
K
b
T(t)
(a)

b

K
!
b T(t)
T
b
T
b
T
K
T
K
I
(b) Diagrama de cuerpo libre.
Figura 2.25. Sistema masa-resorte-amortiguador rotativo.
N otese que los pares que se aplican sobre el cuerpo I y tienen el mismo
sentido que la velocidad angular

, aparecen afectados por un signo positivo en
(2.65). En caso contrario aparecen afectados por un signo negativo, como es
el caso de T
K
. Considerando que todos los elementos del sistema se conectan
mediante uniones rgidas entonces, de acuerdo a la gura 2.25(b) se tiene que:

=
b
=

K
(2.66)
De acuerdo a esto, si se denen = 0,
b
= 0,
K
= 0 como las posiciones
angulares del cuerpo, el extremo m ovil del amortiguador y el extremo m ovil del
resorte, respectivamente, cuando todo el sistema est a en reposo con T(t) = 0,
entonces se concluye que:
=
b
=
K
(2.67)
Por tanto, las expresiones en (2.65) se pueden escribir como:
52 2 Modelado matematico de sistemas fsicos
I

= T(t) +b
b
K
K
= T(t) b

K
Finalmente, se obtiene que el modelo matem atico correspondiente est a dado
por la siguiente ecuaci on diferencial:

+
b
I

+
K
I
=
1
I
T(t) (2.68)
N otese que este modelo matem atico es identico al presentado en (2.53) para
un sistema masa-resorte-amortiguador traslacional si se sustituye la inercia
por la masa, la posici on angular por la posici on x
m
y el par externo T(t)
por la fuerza externa F(t).
Ejemplo 2.7 En la gura 2.26(a) se muestran dos cuerpos rotativos unidos
por una cremallera. Sobre el cuerpo rotativo de la izquierda se aplica un par
externo T(t). As que se puede pensar que el cuerpo de la izquierda es un
motor el cual debe transmitir movimiento al cuerpo rotativo de la derecha
a traves de una cremallera. Siguiendo las convenciones de signo mostradas
en las guras 2.3, 2.5, 2.9 y 2.18 se obtienen los diagramas de cuerpo libre
mostrados en las guras 2.26(b) y 2.26(c). En la gura 2.26(b) se muestra
la parte correspondiente a la conexi on de los dos cuerpos rotativos mediante
dos adaptadores tipo pi n on-cremallera, mientras que en la gura 2.26(c) se
muestra el diagrama de cuerpo libre de cada uno de los cuerpos rotativos
1
. La
nomenclatura utilizada es la siguiente:
v
m
=
dxm
dt
, donde x
m
es la posici on de la cremallera de masa m.

1
=
d1
dt
, donde
1
es la posici on angular del cuerpo rotativo 1.

2
=
d2
dt
, donde
2
es la posici on angular del cuerpo rotativo 2.
v
1
es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 1 gira con velocidad
1
.
v
2
es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 2 gira con velocidad
2
.

b1
=
d
b1
dt
, donde
b1
es la posici on angular del extremo m ovil del amorti-
guador unido al cuerpo rotativo 1 (fricci on del cuerpo 1 con los rodamien-
tos).

b2
=
d
b2
dt
, donde
b2
es la posici on angular del extremo m ovil del amor-
tiguador unido al 2 (fricci on del cuerpo 2 con los rodamientos).
v
b
=
dx
b
dt
, donde x
b
es la posici on del extremo del amortiguador unido a
la cremallera m. Este amortiguador representa la fricci on de la cremallera
con el suelo.
1
En un sistema pi non-cremallera debe utilizarse el principio de que a toda fuerza
(o par) de accion corresponde una fuerza (o par) de reaccion solo en uno de los
puertos, pues el par (o fuerza) en uno de los puertos es simplemente el reejo de
la fuerza (o par) en el otro puerto. Vease tambien el ejemplo 2.9
2.6 Ejemplos 53
Motor
I
1
I
2
Cremallera m
T(t)
(a)
T
1
r
F
1
F
1
m
F
b
F
2
F
2
T
2
r
w
2
!
1
v
1
v
m
v
2
F
b
v
b
(b) Diagrama de cuerpo libre.
b
1
T
b1
T
b1
I
1
T
1
T
2
T
b2
I
2
T
b2
b
2
!
b1
!
1
!
2
!
b2
T(t)
(c) Diagrama de cuerpo libre (cont.).
Figura 2.26. Dos cuerpos rotativos unidos por una cremallera.
Usando las guras 2.26(b) y 2.26(c), as como (2.4), (2.8), (2.18), (2.21),
(2.34), (2.35) se obtienen las siguientes expresiones:
inercia 1: I
1
d
1
dt
= T(t) +T
1
T
b1
(2.69)
inercia 2: I
2
d
2
dt
= T
2
T
b2
(2.70)
54 2 Modelado matematico de sistemas fsicos
masa: m
dv
m
dt
= F
1
F
2
+F
b
(2.71)
amortiguador izquierdo: b
1

b1
= T
b1
amortiguador derecho: b
2

b2
= T
b2
amortiguador central: bv
b
= F
b
pi n on-cremallera izquierda: T
1
= rF
1
, v
1
= r
1
(2.72)
pi n on-cremallera derecha: T
2
= rF
2
, v
2
= r
2
(2.73)
N otese que las fuerzas que tienen el mismo sentido que
1
,
2
y v
m
aparecen
afectadas con un signo positivo en (2.69), (2.70), (2.71) y con un signo nega-
tivo en caso contrario. Considerando que todos los elementos del sistema se
conectan mediante uniones rgidas entonces, de acuerdo a las guras 2.26(b)
y 2.26(c) se tiene que:
v
m
= v
1
= v
2
= v
b
(2.74)

1
=
b1
,
2
=
b2
(2.75)
De acuerdo a esto, si se denen x
m
= 0,
1
= 0,
2
= 0, x
b
= 0,
b1
= 0,
b2
=
0 como las posiciones de la cremallera, el cuerpo rotativo 1, el cuerpo rotativo
2 y los extremos m oviles de los amortiguadores conectados a la cremallera y
a los cuerpos rotativos 1 y 2, respectivamente, cuando todo el sistema est a en
reposo con T(t) = 0, entonces se concluye que:
x
m
= x
b
(2.76)

1
=
b1
,
2
=
b2
Por tanto, las expresiones en (2.69), (2.70) y (2.71) se pueden escribir como:
inercia 1: I
1
d
1
dt
= T(t) +rF
1
b
1

b1
(2.77)
inercia 2: I
2
d
2
dt
= rF
2
b
2

b2
(2.78)
masa: m
dv
m
dt
= F
1
F
2
+bv
b
(2.79)
Recordando que v
1
= v
2
, se pueden usar (2.72) y (2.73) para encontrar
que
1
=
2
. Entonces se puede usar este resultado as como (2.75) para,
restando (2.78) a (2.77), encontrar:
(I
1
+I
2
)
d
1
dt
= T(t) +r(F
1
F
2
) (b
1
+b
2
)
1
(2.80)
Por otro lado, usando v
m
= v
1
= r
1
= v
b
se puede escribir (2.79) como
mr
d
1
dt
= F
1
F
2
bv
m
2.6 Ejemplos 55
Despejando F
1
F
2
de esta expresi on y sustituyendo en (2.80) se obtiene
nalmente:
(I
1
+I
2
+mr
2
)
d
1
dt
= T(t) (b
1
+b
2
+r
2
b)
1
Esta ecuaci on diferencial representa el modelo matem atico del sistema en la
gura 2.26(a). En este caso se pudieron combinar tres ecuaciones diferencia-
les distintas en una sola ecuaci on diferencial. Esto es debido a que las tres
variables
1
,
2
y v
m
son linealmente dependientes pues est an relacionadas
mediante las expresiones algebraicas v
m
= r
1
= r
2
. N otese tambien
c omo el radio de los pi nones interviene para adaptar i) la masa de la crema-
llera a la inercia equivalente que se produce sobre el eje de la inercia 1 e ii)
la fricci on equivalente que sobre el eje de la inercia 1 produce la fricci on de la
cremallera con el suelo.
Ejemplo 2.8 En la gura 2.27(a) se muestran dos cuerpos rotativos unidos
por un resorte. Sobre el cuerpo de la izquierda se aplica un par externo T(t).
Entonces, el sistema mostrado en la gura 2.27(a) representa el caso de un
motor (cuerpo de la izquierda) que mueve a una carga (cuerpo de la derecha)
y que el eje que une a ambos cuerpos es exible. Esta exibilidad normal-
mente no es introducida intencionalmente, sino que es una caracterstica no
deseada que surge como resultado de la rigidez nita de los materiales con que
se construye el eje que une al motor y la carga. En situaciones como esta es
muy importante tomar en cuenta dicha exibilidad para estudiar como afec-
ta al desempe no del sistema de control. Siguiendo las convenciones de signo
mostradas en las guras 2.5, 2.6 y 2.11 se obtiene el diagrama de cuerpo libre
mostrado en la gura 2.27(b). La nomenclatura utilizada es la siguiente:

2
=
d2
dt
, donde
2
es la posici on angular del cuerpo 1.

5
=
d5
dt
, donde
5
es la posici on angular del cuerpo 2.

1
=
d1
dt
, donde
1
es la posici on angular del extremo m ovil del amorti-
guador conectado al cuerpo 1.

6
=
d6
dt
, donde
6
es la posici on angular del extremo m ovil del amorti-
guador conectado al cuerpo 2.

3
=
d3
dt
y
4
=
d4
dt
, donde
3
y
4
son las posiciones angulares de los
extremos del resorte.
Usando la gura 2.27(b), as como (2.8), (2.11), (2.21), se obtienen las
siguientes expresiones:
cuerpo 1: I
1

2
= T(t) +T
1
T
3
(2.81)
cuerpo 2: I
2

5
= T
4
T
6
(2.82)
amortiguador izquierdo: b
1

1
= T
1
amortiguador derecho: b
2

6
= T
6
resorte: Kx
K
= T
3
= T
4
, x
K
=
3

4
56 2 Modelado matematico de sistemas fsicos
b
1
I
1
I
2
b
2 K
T(t)
(a)
I
1
T
1
T
3
T
3
T
4
T
4
T
6
T
6
!
1 T
1
!
2
T(t) !
3
!
4
!
5
!
6
I
2
(b) Diagrama de cuerpo libre.
Figura 2.27. Dos cuerpos rotativos unidos por un resorte.
donde la ultima expresi on se obtiene de acuerdo al p arrafo que sigue a (2.10).
N otese que, en las expresiones (2.81) y (2.82), los pares que tienen el mismo
sentido que
2
y
5
aparecen afectadas con un signo positivo y con un signo
negativo en caso contrario. Considerando que todos los elementos del sistema
se conectan mediante uniones rgidas entonces, de acuerdo a la gura 2.27(b)
se tiene que:

2
=
1
=
3
,
5
=
6
=
4
(2.83)
De acuerdo a esto, si se denen
2
= 0,
5
= 0,
1
= 0,
6
= 0,
3
= 0 y

4
= 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
m ovil del amortiguador izquierdo, del extremo m ovil del amortiguador derecho
y de los extremos izquierdo y derecho del resorte, respectivamente, cuando todo
el sistema est a en reposo con T(t) = 0, entonces se concluye que:

2
=
1
=
3
,
5
=
6
=
4
(2.84)
Por tanto, las expresiones en (2.81) y (2.82) se pueden escribir como:
cuerpo 1: I
1

2
= T(t) +b
1

1
K(
3

4
)
cuerpo 2: I
2

5
= K(
3

4
) b
2

6
Usando (2.83) y (2.84) se encuentra nalmente que el modelo matem atico
est a dado por las siguientes dos ecuaciones diferenciales que deben ser resuel-
tas simult aneamente:
cuerpo 1: I
1

2
+b
1

2
+K(
2

5
) = T(t)
cuerpo 2: I
2

5
+b
2

5
K(
2

5
) = 0
Estas dos ecuaciones diferenciales no pueden ser agrupadas en una sola porque
las variables
2
y
5
son linealmente independientes, es decir, no se cuenta
con una expresi on algebraica que relacione a estas dos variables.
2.6 Ejemplos 57
Ejemplo 2.9 En la gura 2.28(a) se muestran dos cuerpos rotativos unidos
a traves de una caja de engranes. Sobre el cuerpo de la izquierda se aplica
un par externo T(t), por lo que este sistema puede ser interpretado como
un motor electrico (cuerpo de la izquierda) que transmite movimiento a una
carga (cuerpo de la derecha) a traves de una caja de engranes. Siguiendo las
convenciones de signo mostradas en las guras 2.5, 2.11, 2.17 se obtiene el
diagrama de cuerpo libre mostrado en la gura 2.28(b)
2
. La nomenclatura
utilizada es la siguiente:
=
d
dt
, donde es la posici on angular del cuerpo 1.

4
=
d4
dt
, donde
4
es la posici on angular del cuerpo 2.

b1
=
d
b1
dt
, donde
b1
es la posici on angular del extremo m ovil del amor-
tiguador conectado al cuerpo 1.

b2
=
d
b2
dt
, donde
b2
es la posici on angular del extremo m ovil del amor-
tiguador conectado al cuerpo 2.

n1
y
n2
son las velocidades angulares en las ruedas dentadas que resultan
del movimiento de los cuerpos 1 y 2.
T
n1
y T
n2
son los pares que aparecen en las ruedas dentadas como resultado
del movimiento de los cuerpos 1 y 2.
I
1
b
1 n
1
n
2
I
2
b
2
T(t)
(a)
I
1
T
b1
T
b1 T
n1
T
n2
T
3
T
b2
T
b2
I
2
!
b1 T(t)
! !
n1
!
n2
!
4
!
b2
(b) Diagrama de cuerpo libre.
Figura 2.28. Dos cuerpos unidos a traves de una caja de engranes.
Usando la gura 2.28(b), as como (2.8), (2.21), (2.32), (2.33) se obtienen
las siguientes expresiones:
cuerpo 1: I
1
= T(t) T
b1
T
n1
(2.85)
2
En una caja de engranes debe utilizarse el principio de que a todo par de accion
corresponde un par de reaccion solo en uno de los puertos, pues el par en uno de
los puertos es simplemente el reejo del par en el otro puerto. Vease tambien el
ejemplo 2.7
58 2 Modelado matematico de sistemas fsicos
cuerpo 2: I
2

4
= T
3
+T
b2
(2.86)
amortiguador izquierdo: b
1

b1
= T
b1
amortiguador derecho: b
2

b2
= T
b2
engranes: T
n1
=
n
1
n
2
T
n2
,
n1
=
n
2
n
1

n2
, T
n2
= T
3
(2.87)
donde la ultima expresi on se debe a que, de acuerdo a la tercera ley de Newton,
una acci on del cuerpo A sobre el cuerpo B produce una reacci on (en sentido
contrario) del cuerpo B sobre el cuerpo A. N otese que, en las expresiones
(2.85) y (2.86) los pares que tienen el mismo sentido que y
4
aparecen
afectadas con un signo positivo y con un signo negativo en caso contrario.
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la gura 2.28(b) se tiene que:
=
b1
=
n1
,
4
=
b2
=
n2
(2.88)
De acuerdo a esto, si se denen = 0,
4
= 0,
b1
= 0,
b2
= 0,
n1
= 0,

n2
= 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
m ovil del amortiguador izquierdo, del extremo m ovil del amortiguador derecho,
de la rueda dentada 1 y de la rueda dentada 2 cuando todo el sistema est a en
reposo con T(t) = 0, entonces se concluye que:
=
b1
=
n1
,
4
=
b2
=
n2
(2.89)
Por tanto, usando (2.88) y (2.89) las expresiones en (2.85) y (2.86) se pueden
escribir como:
cuerpo 1: I
1
= T(t) b
1

n
1
n
2
T
3
(2.90)
cuerpo 2: I
2

4
= T
3
b
2

4
(2.91)
Por otro lado, de (2.87) y (2.88) se tiene =
n2
n1

4
. Usando esto, despejan-
do T
3
de (2.91), sustituyendo en (2.90) y despues de acomodar terminos se
encuentra:
_
I
2
+
_
n
2
n
1
_
2
I
1
_

4
+
_
b
2
+
_
n
2
n
1
_
2
b
1
_

4
=
n
2
n
1
T(t) (2.92)
N otese que las dos ecuaciones diferenciales en (2.90) y (2.91) se han podi-
do combinar en una sola ecuaci on gracias a que las variables y
4
son
linealmente dependientes pues est an relacionadas a traves de =
n2
n1

4
. Esta
ecuaci on diferencial representa el modelo matem atico buscado: si se conoce el
par externo aplicado T(t) entonces se puede conocer la posici on
4
del cuerpo
2 al resolver la ecuaci on diferencial anterior.
Ejemplo 2.10 En la gura 2.29(a) se muestra el mismo mecanismo de la
gura 2.26(a) (estudiado en el ejemplo 2.7) pero ahora la cremallera es e-
xible. Esta exibilidad no se introduce de manera intencional, sino que es un
2.6 Ejemplos 59
problema no deseado que aparece debido a la rigidez nita del material con
el que est a hecha la cremallera. Para encontrar el modelo matem atico en este
caso se puede aprovechar el desarrollo realizado en el ejemplo 2.7. Es decir, se
puede partir de las ecuaciones (2.77), (2.78) y (2.79), las cuales se reescriben
a continuaci on para facilitar la referencia:
inercia 1: I
1
d
1
dt
= T(t) +rF
1
b
1

b1
inercia 2: I
2
d
2
dt
= rF
2
b
2

b2
masa: m
dv
m
dt
= F
1
F
2
+bv
b
considerando ahora que, de acuerdo a la gura 2.29(b) y las convenciones en
la gura 2.4 y (2.7):
F
1
= K
1
(x
A
x
B
), F
2
= K
2
(x
C
x
D
)
con:
v
A
=
dxA
dt
y v
B
=
dxB
dt
, donde x
A
y x
B
son las posiciones de los extremos
del resorte de la izquierda.
v
C
=
dxC
dt
y v
D
=
dxD
dt
, donde x
C
y x
D
son las posiciones de los extremos
del resorte de la derecha.
I
2
I
1
K
2 K
1
A
B C D
m
x
m
(a)
F
1
F
1
v
A
v
B
v
AB
K
1
F
2
F
2
v
C
v
D
v
CD
K
2
(b) Flexibilidad en la cremallera.
Figura 2.29. Sistema de transmision tipo cremallera con exibilidad.
Entonces, usando esto y (2.74) y (2.75) se encuentra:
60 2 Modelado matematico de sistemas fsicos
inercia 1: I
1
d
1
dt
= T(t) +rK
1
(x
A
x
B
) b
1

1
(2.93)
inercia 2: I
2
d
2
dt
= rK
2
(x
C
x
D
) b
2

2
(2.94)
masa: m x
m
= K
1
(x
A
x
B
) K
2
(x
C
x
D
) b x
m
(2.95)
Por otro lado, de acuerdo a (2.72), (2.73), (2.74), (2.76) y considerando que
todos los elementos del sistema se conectan mediante uniones rgidas se en-
cuentra que:
x
B
= x
C
= x
m
, x
A
= r
1
, x
D
= r
2
(2.96)
donde
1
y
2
son las posiciones angulares de las ruedas dentadas 1 y 2 de-
nidas de acuerdo a la gura 2.26(b). Sustituyendo (2.96) en (2.93), (2.94) y
(2.95):
inercia 1: I
1

1
+b
1

1
rK
1
(r
1
x
m
) = T(t)
inercia 2: I
2

2
+b
2

2
rK
2
(x
m
r
2
) = 0
masa: m x
m
+b x
m
K
1
(r
1
x
m
) +K
2
(x
m
r
2
) = 0
El modelo matem atico est a dado por estas tres ecuaciones diferenciales que
deben ser resueltas simult aneamente. En este caso no se pueden combinar
estas tres ecuaciones para obtener una sola ecuaci on diferencial equivalente
debido a que las variables
1
,
2
y x
m
son linealmente independientes pues no
se cuenta con una expresi on algebraica que relacione a estas tres variables.
N otese que desde el punto de vista del modelado este es el efecto que introdu-
cen los dos resortes considerados en este ejemplo. Comp arese con el modelo
matem atico obtenido en el ejemplo 2.7.
I
1
b
1 n
1
n
2
I
2
b
2 K
T(t)
(a)
T
n2
T
n2
!
A
!
B
K
(b) Flexibilidad en
los engranes.
Figura 2.30. Sistema de transmision con exibilidad en la caja de engranes.
Ejemplo 2.11 En la gura 2.30(a) se muestran dos cuerpos giratorios co-
nectados a traves de una caja de engranes y un resorte. El cuerpo del lado
2.6 Ejemplos 61
izquierdo recibe un par externo T(t). Por tanto, este ejemplo representa el
caso de un motor (cuerpo izquierdo) que transmite movimiento a una carga
(cuerpo derecho) a traves de una caja de engranes cuyos dientes son exibles.
Esta exibilidad es un problema no deseado que, sin embargo, aparece en la
pr actica debido a la rigidez nita del material con el que se hacen los engranes
(acero). Para resolver este problema se puede aprovechar el desarrollo presen-
tado en el ejemplo 2.9 para modelar el sistema mostrado en la gura 2.28(a).
Por tanto, se puede regresar a las expresiones en (2.90) y (2.91), las cuales
se reescriben a continuaci on para facilitar la referencia:
cuerpo 1: I
1
= T(t) b
1

n
1
n
2
T
n2
(2.97)
cuerpo 2: I
2

4
= T
n2
b
2

4
(2.98)
pero ahora, de acuerdo a las guras 2.30(b) y 2.6 y a (2.11):
T
n2
= K(
A

B
)
donde
A
=

A
y
B
=

B
con
A
y
B
las posiciones angulares de los
extremos del resorte. Por otro lado, de acuerdo a (2.87) se tiene que =
n2
n1

A
,
porque
A
=
n2
y
n1
= , donde y
A
son las posiciones angulares
del cuerpo 1 y del extremo del resorte conectado a la rueda dentada 2, seg un
se dene en la gura 2.30(b). N otese adem as que
B
=
4
. Sustituyendo todo
esto en (2.97) y (2.98) se encuentra:
cuerpo 1: I
1

+b
1

+
n
1
n
2
K
_
n
1
n
2

4
_
= T(t)
cuerpo 2: I
2

4
+b
2

4
K
_
n
1
n
2

4
_
= 0
Estas dos ecuaciones diferenciales deben ser resueltas simult aneamente y re-
presentan el modelo matem atico buscado. N otese que estas dos ecuaciones
diferenciales no pueden ser combinadas en una sola debido a que las variables
y
4
son linealmente independientes, es decir no se cuenta con una expresi on
algebraica que relacione a estas variables. Esta es la principal diferencia con
el problema resuelto en el ejemplo 2.9 y es debida a la introducci on del resorte
en el presente ejemplo.
Ejemplo 2.12 (tomado de [6], pp. 122). En la gura 2.31 se muestra un
servomecanismo, es decir, se trata de un motor de CD con escobillas que se
usa para mover un cuerpo de masa M atraves de una caja de engranes y
de un adaptador del tipo pi n on-cremallera. El cuerpo M se mueve sobre un
plano horizontal, por lo que no es necesario tomar en consideraci on el efecto
de la gravedad. Siguiendo las convenciones de signo mostradas en las guras
2.5, 2.3, 2.11, 2.9, 2.17, 2.18, 2.19 se obtienen los diagramas de cuerpo libre
mostrados en la gura 2.32. En la gura 2.32(a) se desglosan los componentes
62 2 Modelado matematico de sistemas fsicos
electricos del motor de CD, en la gura 2.32(b) se desglosan los componentes
mec anicos del motor y la caja de engranes mientras que en la gura 2.32(c) se
muestran los elementos que componen al sistema pi n on-cremallera
3
. N otese
que se considera fricci on entre el motor y sus rodamientos as como la fricci on
entre el pi n on y sus rodamientos y fricci on entre el cuerpo M y su soporte (o
el suelo). La nomenclatura utilizada es la siguiente:

m
=
dm
dt
, donde
m
es la posici on angular del motor.

P
=
dP
dt
, donde
P
es la posici on angular del pi n on.
x =
dx
dt
, donde x es la posici on del cuerpo M.

b1
=
d
b1
dt
, donde
b1
es la posici on angular del extremo m ovil del amor-
tiguador conectado al motor.

b2
=
d
b2
dt
, donde
b2
es la posici on angular del extremo m ovil del amor-
tiguador conectado al pi n on.
v
b3
=
dx
b3
dt
, donde x
b3
es la posici on del extremo m ovil del amortiguador
conectado al cuerpo M.

1
y
2
son las velocidades angulares en las ruedas dentadas resultantes
del movimiento del motor y del pi n on.
u es el voltaje aplicado a la armadura del motor e i es la corriente que
circula a traves de la armadura del motor.
3
Veanse los pies de pagina correspondientes a los ejemplos 2.9 y 2.7
u
+

n
1
n
2
r
b
1
b
2
M
Motor
Pion
Cremallera
Figura 2.31. Servomecanismo.
2.6 Ejemplos 63
R
L
u
+

i e
b
+

T
b
1
n
1
n
2
b
2
b
3
M
r
I
P
I
m
(a)
n
1
n
2
b
1
T
b1
T
b1

m
T
1
T
2
!
b1
I
m
!
1
!
2
T
(b)
T
b2
T
b2
T
2
r
F
F
x
F
b3
F
b3
!
b2
!
P
I
P
!
P
T
P
v
v
b3
M
(c)
Figura 2.32. Diagrama de cuerpo libre correspondiente a la gura 2.31.
64 2 Modelado matematico de sistemas fsicos
F, T
P
y v son la fuerza, el par y la velocidad traslacional que se producen
en el sistema pi n on-cremallera como resultado del movimiento del pi n on
y la masa M.
Usando la gura 2.32, as como (2.4), (2.8), (2.18), (2.21), (2.32), (2.33),
(2.34), (2.35) se obtienen las siguientes expresiones:
inercia motor: I
m

m
= T T
1
T
b1
(2.99)
inercia pi n on: I
P

P
= T
2
+T
b2
+T
P
(2.100)
masa M: M x = F F
b3
(2.101)
amortiguador motor: b
1

b1
= T
b1
amortiguador pi n on: b
2

b2
= T
b2
amortiguador masa M: b
3
v
b3
= F
b3
engranes: T
1
=
n
1
n
2
T
2
,
1
=
n
2
n
1

2
(2.102)
pi n on-cremallera: v = r
P
, T
P
= rF (2.103)
N otese que, en las expresiones (2.99), (2.100) y (2.101), las fuerzas que tienen
el mismo sentido que

m
,
P
y x aparecen afectadas con un signo positivo y
con un signo negativo en caso contrario. Considerando que todos los elementos
del sistema se conectan mediante uniones rgidas entonces, de acuerdo a la
gura 2.32 se tiene que:
v = x = v
b3
(2.104)

m
=
b1
=
1
,
2
=
b2
=
P
(2.105)
De acuerdo a esto, si se denen x = 0, x
b3
= 0,
m
= 0,
b1
= 0,
b2
= 0 como
las posiciones del cuerpo M, el extremo m ovil del amortiguador conectado al
cuerpo M, el rotor del motor, el extremo m ovil del amortiguador conectado
al rotor del motor y el extremo m ovil del amortiguador conectado al pi n on,
respectivamente, cuando todo el sistema est a en reposo con T = 0, entonces
se concluye que:
x = x
b3
(2.106)

m
=
b1
(2.107)
Por tanto, las expresiones en (2.99), (2.100) y (2.101) se pueden escribir
como:
inercia motor: I
m

m
= T
n
1
n
2
T
2
b
1

b1
inercia pi n on: I
P

P
= T
2
+b
2

b2
+rF
masa M: M x = F b
3
v
b3
Usando (2.104) y (2.105):
2.6 Ejemplos 65
inercia motor: I
m

m
= T
n
1
n
2
T
2
b
1

m
(2.108)
inercia pi n on: I
P

P
= T
2
b
2

P
+rF (2.109)
masa M: M x = F b
3
x (2.110)
Por otro lado, de acuerdo a (2.102), (2.103), (2.104) y (2.105) se encuentra
que

m
=
n2
n1r
x. Usando esto, despejando T
2
de (2.109) y sustituyendo en
(2.108):
I
m
n
2
n
1
r
x +b
1
n
2
n
1
r
x = T
n
1
n
2
[I
P

P
+b
2

P
rF] (2.111)
De (2.103) y (2.104) se tiene que x = r
P
. Usando esto en (2.111) y susti-
tuyendo F de (2.110) se encuentra:
I
m
n
2
n
1
r
x +b
1
n
2
n
1
r
x = T
_
n
1
n
2
r
I
P
+
n
1
n
2
rM
_
x
_
n
1
n
2
r
b
2
+
n
1
n
2
rb
3
_
x
Agrupando terminos se obtiene nalmente:
_
I
m
_
n
2
n
1
r
_
2
+I
P
1
r
2
+M
_
x +
_
b
1
_
n
2
n
1
r
_
2
+b
2
1
r
2
+b
3
_
x =
n
2
n
1
r
T
(2.112)
Por otro lado, usando la Ley de voltajes de Kirchho (vease el ejemplo 2.14)
al circuito de la gura 2.32(a) se obtiene:
L
di
dt
+Ri +e
b
= u (2.113)
Usando (2.38), (2.39) y

m
=
n2
n1r
x se encuentra que el voltaje inducido y el
par generado est an dados como:
e
b
= k
e

m
= k
e
n
2
n
1
r
x, T = k
m
i
Entonces, usando este resultado, (2.113) y (2.112) se encuentra, nalmente,
que el modelo matem atico buscado est a representado por las dos ecuaciones
diferenciales siguientes, las cuales deben ser resueltas simult aneamente:
L
di
dt
+Ri +k
e
n
2
n
1
r
x = u (2.114)
_
I
m
_
n
2
n
1
r
_
2
+I
P
1
r
2
+M
_
x +
_
b
1
_
n
2
n
1
r
_
2
+b
2
1
r
2
+b
3
_
x =
n
2
n
1
r
k
m
i
(2.115)
Otra manera de expresar este modelo matem atico es mediante una sola ecua-
ci on diferencial obtenida al combinar (2.114) y (2.115). Para esto, dervese
66 2 Modelado matematico de sistemas fsicos
una vez respecto al tiempo a (2.115). Esto produce la aparici on de
di
dt
en el
miembro derecho de la ecuaci on resultante. A continuaci on se sustituye el va-
lor de
di
dt
obtenido al despejar de (2.114). Con esto se obtiene una ecuaci on
diferencial en terminos de de
d
3
x
dt
3
, x, x e i. Para eliminar i, se despeja esta
variable de (2.115) y se sustituye. As, se obtiene una ecuaci on diferencial de
tercer orden en la variable x con el voltaje u como excitaci on. De este modo
el modelo matem atico queda representado por una sola ecuaci on diferencial a
partir de la cual se puede conocer la posici on x de la masa M si se conoce el
voltaje u aplicado al motor. Se deja como ejercicio para el lector el realizar el
procedimiento descrito.
Ejemplo 2.13 En la gura 2.33(a) se muestra un pendulo simple donde
representa la posici on angular del pendulo respecto de la vertical y

=
d
dt
.
Se supone que toda la masa m del pendulo est a concentrada en el extremo y
que la varilla, de longitud l, no tiene masa (o esta es despreciable comparada
con la masa m). El diagrama de cuerpo libre correspondiente se muestra en la
gura 2.33(b). El pendulo puede ser considerado un cuerpo rotativo de inercia:
I = ml
2
la cual corresponde a la inercia de una partcula de masa m que describe un
movimiento circular con un radio constante l [7], cap. 9. Se considera que
sobre el pendulo act uan tres pares: 1) el par externo T(t), 2) el par debido
a la fricci on, T
b
, existente en el punto de donde se sostiene el pendulo y 3)
el par debido a la fuerza de gravedad, T
g
. De acuerdo a las guras 2.33(a) y
2.33(b), el par T
g
est a aplicado en sentido contrario a como se dene y su
magnitud es igual a:
T
g
= peso del pendulo brazo de palanca
= mg d, d = l sin()
= mgl sin() (2.116)
Usando la gura 2.33(b), as como (2.8), (2.21), se obtienen las siguientes
expresiones:
cuerpo giratorio: I

= T(t) +T
b
T
g
(2.117)
amortiguador: b
b
= T
b
N otese que los pares que se aplican sobre el cuerpo I y tienen el mismo sentido
que la velocidad angular

, aparecen afectados por un signo positivo en (2.117).
En caso contrario aparecen afectados por un signo negativo, como es el caso
de T
g
. Considerando que todos los elementos del sistema se conectan mediante
uniones rgidas entonces, de acuerdo a la gura 2.33(b) se tiene que:

=
b
(2.118)
2.6 Ejemplos 67
T(t)

l
m
g
d
(a)

b
!
b T(t)
T
b
T
b
I
T
g
(b) Diagrama de cuerpo libre.
Figura 2.33. Pendulo simple.
Por tanto, si se denen = 0,
b
= 0 (con
b
=

b
) como las posiciones
angulares del pendulo y el extremo m ovil del amortiguador, respectivamente,
cuando todo el sistema est a en reposo con T(t) = 0, entonces se concluye que:
=
b
(2.119)
Entonces, las expresiones en (2.117) y (2.116) se pueden escribir como:
I

= T(t) +b
b
mgl sin()
= T(t) b

mgl sin()
Finalmente, se obtiene que el modelo matem atico correspondiente est a dado
por la siguiente ecuaci on diferencial:
ml
2

+b

+mgl sin() = T(t)


N otese que esta es una ecuaci on diferencial de segundo orden pero no lineal,
caracterstica que es debida al hecho de que aparece la funci on sin(). En
la secci on 7.2 del captulo 7 se explica la manera de manipular este tipo de
ecuaciones diferenciales. M as a un, en los captulos 11, 13 y 14 se muestra
como dise nar controladores para este tipo de ecuaciones diferenciales.
Ejemplo 2.14 En la gura 2.34(a) se muestra un circuito RLC conectado
en serie y alimentado con una fuente de voltaje. La manera de relacionar a
los elementos del circuito en este tipo de conexi on electrica es usando la Ley
de Kirchho de voltajes [8], p ag. 67:
Propiedad 2.1 Ley de Kirchho de voltajes. La suma de los voltajes
alrededor de un trayecto cerrado es igual a cero.
Usando las convenciones de signo de las guras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la gura 2.34(b). Entonces, a partir de esta gura y
68 2 Modelado matematico de sistemas fsicos
+

v
i
C L
R
(a)
+

v
i
R
L
C
+ +
+

i
v
R
v
L v
C
(b)
Figura 2.34. Circuito RLC conectado en serie.
usando (2.12), (2.13), (2.15), (2.16), (2.22) as como la Ley de Kirchho de
voltajes se obtiene:
v
i
= v
L
+v
R
+v
C
v
C
=
q
C
, q =
_
t
0
i(r)dr, si q(0) = 0 (2.120)
v
L
=
d
dt
, = Li (2.121)
v
R
= iR, i =
dq
dt
(2.122)
N otese que la corriente electrica que circula por todos los componentes del
circuito es la misma. Por tanto:
v
i
= L
d
2
q
dt
2
+R
dq
dt
+
1
C
q (2.123)
o bien:
v
i
= L
di
dt
+Ri +
1
C
_
t
0
i(r)dr (2.124)
El modelo matem atico correspondiente est a representado por cualquiera de las
expresiones en (2.123) o (2.124).
A partir de (2.122) se observa que existe una relaci on algebraica (y lineal,
adem as) entre el voltaje en una resistencia y la corriente a traves de la mis-
ma: v
R
= iR. N otese que la resistencia R es el factor constante que relaciona
2.6 Ejemplos 69
corriente y voltaje en una resistencia
vR
i
= R. Este hecho motiva el cuestio-
narse si acaso existe una relaci on similar entre la corriente y el voltaje en
un inductor y en un capacitor. Sin embargo, a partir de (2.120) y (2.121) se
observa que, a menos que se introduzca alg un articio matem atico, esto no
es posible por que est an de por medio una derivada y una integral. Entonces,
el articio matem atico que se usa es la transformada de Laplace ya que esta
tiene las siguientes propiedades:
L
_
dx
dt
_
= sX(s), L
__
t
0
x(r)dr
_
=
1
s
X(s), si x(0)=0 (2.125)
donde X(s) es la transformada de Laplace de x(t), es decir L{x(t)} = X(s).
Por tanto, a partir de (2.120) y (2.121) se obtiene, mediante el uso de la
transformada de Laplace y considerando todas las condiciones iniciales iguales
a cero:
V
C
(s) =
1
sC
I(s)
V
L
(s) = sLI(s)
donde L{v
C
(t)} = V
C
(s), L{v
L
(t)} = V
L
(s) y L{i(t)} = I(s). Por tanto, aho-
ra se tiene una relaci on algebraica entre las transformadas de Laplace de los
voltajes y las corrientes en un inductor y un capacitor. Al factor que relaciona
a estas variables se le denomina impedancia y se representa como:
Z(s) =
V (s)
I(s)
(2.126)
Es decir, la impedancia de un inductor es:
Z
L
(s) =
V
L
(s)
I(s)
= sL (2.127)
mientras que la impedancia en un capacitor es:
Z
C
(s) =
V
C
(s)
I(s)
=
1
sC
(2.128)
Entonces, usando la transformada de Laplace y el concepto de impedancia se
puede escribir el modelo matem atico en (2.124) como:
V
i
(s) = sLI(s) +RI(s) +
1
sC
I(s)
V
i
(s) = Z
L
(s)I(s) +RI(s) +Z
C
(s)I(s)
V
i
(s) = (Z
L
(s) +R +Z
C
(s))I(s)
lo cual motiva el denir la impedancia total del circuito serie como:
70 2 Modelado matematico de sistemas fsicos
Z
t
(s) = Z
L
(s) +R +Z
C
(s)
Z
t
(s) = sL +R +
1
sC
, Z
t
(s) =
V
i
(s)
I(s)
(2.129)
Con lo anterior se prueba una propiedad importante en circuitos electricos
conectados en serie:
Propiedad 2.2 La impedancia total de un circuito serie es igual a la suma
de las impedancias de todos los elementos conectados en serie.
El concepto de impedancia es muy importante en circuitos electricos y es
una de las herramientas que normalmente se utilizan para modelar y analizar
circuitos en ingeniera. Es decir, las expresiones en (2.129) tambien represen-
tan el modelo matem atico del circuito en la gura 2.34(a).
Ejemplo 2.15 En la gura 2.35(a) se muestra un circuito RLC conectado en
paralelo y alimentado con una fuente de corriente. La manera de relacionar
los componentes del circuito en este tipo de conexi on electrica es usando la
Ley de Kirchho de corrientes [8], p ag. 68:
Propiedad 2.3 Ley de Kirchho de corrientes.. La suma de las corrien-
tes que entran a un nodo es igual a la suma de las corrientes que salen del
mismo nodo.
i
i
L C
R
(a)
i
i
i
L
i
C i
R
+

L C R
v
(b)
Figura 2.35. Circuito RLC conectado en paralelo.
Usando las convenciones de signo de las guras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la gura 2.35(b). Entonces, a partir de esta gura y
2.6 Ejemplos 71
usando (2.12), (2.13), (2.15), (2.16), (2.22) as como la Ley de Kirchho de
corrientes se obtiene:
i
i
= i
L
+i
R
+i
C
q = vC, q =
_
t
0
i
C
(r)dr, si q(0) = 0 i
C
= C
dv
dt
(2.130)
i
L
=
1
L
_
t
0
v(r)dr, v = L
di
L
dt
(2.131)
i
R
=
v
R
(2.132)
N otese que el voltaje es el mismo en todos los componentes del circuito. Por
tanto, el modelo matem atico est a representado por:
i
i
=
1
L
_
t
0
v(r)dr +
v
R
+C
dv
dt
(2.133)
A partir de (2.130) y (2.131) se obtiene, mediante el uso de la transformada de
Laplace (vease (2.125)) y considerando todas las condiciones iniciales iguales
a cero:
I
C
(s) = sCV (s)
I
L
(s) =
1
sL
V (s)
donde L{i
C
(t)} = I
C
(s), L{i
L
(t)} = I
L
(s) y L{v(t)} = V (s). Al factor que
relaciona a las transformadas de Laplace de la corriente y el voltaje en un
elemento de circuito se le denomina admitancia y se representa como:
Y (s) =
I(s)
V (s)
(2.134)
Es decir, la admitancia de un inductor es:
Y
L
(s) =
I
L
(s)
V (s)
=
1
sL
(2.135)
mientras que la admitancia en un capacitor es:
Y
C
(s) =
I
C
(s)
V (s)
= sC (2.136)
Entonces, usando la transformada de Laplace y el concepto de admitancia se
puede escribir el modelo matem atico en (2.133) como:
I
i
(s) =
1
sL
V (s) +
1
R
V (s) +sCV (s)
I
i
(s) = Y
L
(s)V (s) +
1
R
V (s) +Y
C
(s)V (s)
I
i
(s) = (Y
L
(s) +
1
R
+Y
C
(s))V (s)
72 2 Modelado matematico de sistemas fsicos
lo cual motiva el denir la admitancia total del circuito en paralelo como:
Y
T
(s) = Y
L
(s) +
1
R
+Y
C
(s)
Y
T
(s) =
1
sL
+
1
R
+sC, Y
T
(s) =
I
i
(s)
V (s)
(2.137)
Con lo anterior se prueba una propiedad importante en circuitos electricos
conectados en paralelo:
Propiedad 2.4 La admitancia total de un circuito en paralelo es igual a la
suma de las admitancias de todos los elementos conectados en paralelo.
El concepto de admitancia es muy importante en circuitos electricos y es la
otra herramienta que normalmente se utiliza para modelar y analizar circuitos
en ingeniera. Es decir, las expresiones en (2.137) tambien representan el
modelo matem atico del circuito en la gura 2.35(a).
A partir de las deniciones de impedancia y admitancia en (2.126) y
(2.134) es claro que la admitancia es la inversa de la impedancia, es decir:
Y (s) =
1
Z(s)
(2.138)
Esto tambien se comprueba al comparar las deniciones de impedancia y ad-
mitancia en un inductor y un capacitor mostradas en (2.127), (2.128), (2.135)
y (2.136). Entonces, a partir de (2.137) se puede escribir:
1
Z
T
(s)
=
1
Z
L
(s)
+
1
R
+
1
Z
C
(s)
, Y
T
(s) =
1
Z
T
(s)
donde Z
T
(s) representa la impedancia total del circuito conectado en paralelo
mostrado en la gura 2.35(a). No debe relacionarse Z
T
(s) con Z
t
(s) denida
en (2.129) como la impedancia total del circuito conectado en serie mostra-
do en la gura 2.34(a). Generalizando la expresi on anterior al caso en que
se tienen n elementos de circuito conectados en paralelo, se encuentra la si-
guiente expresi on general para el c alculo de la impedancia total de n elementos
conectados en paralelo:
1
Z
T
(s)
=
1
Z
1
(s)
+
1
Z
2
(s)
+. . . +
1
Z
n
(s)
(2.139)
En el caso en que s olo dos elementos de circuito est an conectado en paralelo
es f acil comprobar que la expresi on anterior se reduce a:
Z
T
(s) =
Z
1
(s)Z
2
(s)
Z
1
(s) +Z
2
(s)
(2.140)
2.6 Ejemplos 73
I(s) R
R
C
C
+
+

V
i
(s) V
o
(s)
Figura 2.36. Circuito RC serie-paralelo.
Ejemplo 2.16 Considere el circuito mostrado en la gura 2.36. Si V
o
(s) es el
voltaje en las terminales de los elementos de circuito conectados en paralelo y
si Z
p
(s) es la impedancia total de estos dos elementos conectados en paralelo,
se puede escribir:
Z
p
(s) =
V
o
(s)
I(s)
(2.141)
Z
p
(s) =
R
1
sC
R +
1
sC
=
R
RCs + 1
donde se ha usado (2.140) para calcular la impedancia de dos elementos co-
nectados en paralelo. N otese que I(s) es la corriente total a traves de los dos
elementos conectados en paralelo. Por otro lado, si Z
sp
(s) es la impedancia to-
tal del circuito serie-paralelo, es decir, la impedancia medida en las terminales
donde se aplica el voltaje V
i
(s), entonces se puede escribir:
Z
sp
(s) =
V
i
(s)
I(s)
(2.142)
Z
sp
(s) = R +
1
sC
+
R
RCs + 1
donde se ha usado el hecho de que la impedancia total de elementos conectados
en serie es igual a la suma de las impedancias de cada elemento y que la
impedancia de los dos elementos en paralelo est a dada en (2.141). Combinando
las expresiones en (2.141) y (2.142) obtiene:
V
o
(s)
V
i
(s)
= G
T
(s) =
Z
p
(s)
Z
sp
(s)
=
R
RCs+1
R +
1
sC
+
R
RCs+1
por lo que se puede escribir:
V
o
(s)
V
i
(s)
= G
T
(s) =
Ts
T
2
s
2
+ 3Ts + 1
, T = RC (2.143)
N otese que G
T
(s) no es una impedancia ya que est a dada como el cociente de
dos impedancias y el cociente de dos voltajes.
74 2 Modelado matematico de sistemas fsicos
Ejemplo 2.17 Considere el circuito mostrado en la gura 2.37. A continua-
ci on se muestra como obtener la relaci on F(s) =
V2(s)
V1(s)
. Primero se denen los
tres trayectos cerrados (o mallas) mostrados en la gura 2.37, por los cuales
circulan las corrientes de malla I
1
(s), I
2
(s) e I
3
(s). A continuaci on se utiliza
la siguiente regla para aplicar la Ley de Kirchho de voltajes:
Considere la malla i. La suma algebraica de los voltajes en todos los ele-
mentos de circuito en la malla i se iguala a cero. El voltaje en un elemento de
circuito es el producto de su impedancia por la suma algebraica de las corrien-
tes de malla en ese elemento de circuito. La corriente de malla i siempre se
ve afectada con un signo + y las corrientes que van en sentido opuesto se
afectan con un signo . El voltaje en una fuente de voltaje se afecta con un
signo + si la corriente de la malla i pasa atraves de la fuente de un signo
+ a un signo y se afecta con un signo en caso contrario.
Esta regla constituye la base del metodo de an alisis de mallas utilizado para
el an alisis de circuitos en ingeniera. Se recomienda consultar las referencias
[9] y [8] para una exposici on m as amplia del metodo. Usando esta regla en
cada una de las mallas mostradas en la gura 2.37 se obtiene:
+
I
1
I
2
I
3
R R
R
C C C

V
1
(s) V
2
(s)
Figura 2.37. Red RC de defasaje.
I
1
(s)
1
sC
+ (I
1
(s) I
2
(s))R = V
1
(s) (2.144)
(I
2
(s) I
1
(s))R +I
2
(s)
1
sC
+ (I
2
(s) I
3
(s))R = 0
(I
3
(s) I
2
(s))R +I
3
(s)
1
sC
+V
2
(s) = 0, V
2
(s) = RI
3
(s)
De la tercera ecuaci on en (2.144) se obtiene:
I
2
(s)R =
1
R
_
R +
1
sC
_
V
2
(s) +V
2
(s) (2.145)
Sustituyendo esto e I
3
(s) =
V2(s)
R
en la segunda ecuaci on mostrada en (2.144)
se obtiene una expresi on que permite calcular I
1
(s) en funci on de V
2
(s) sola-
mente. Sustituyendo este valor de I
1
(s) e I
2
(s) dado en (2.145) en la primera
2.6 Ejemplos 75
ecuaci on mostrada en (2.144) se obtiene V
1
(s) como funci on de V
2
(s) so-
lamente. Finalmente, acomodando terminos convenientemente se obtiene la
expresi on buscada:
V
2
(s)
V
1
(s)
=
R
3
C
3
s
3
R
3
C
3
s
3
+ 6R
2
C
2
s
2
+ 5RCs + 1
= F(s) (2.146)
Ejemplo 2.18 Un convertidor electr onico de potencia de CD/CD es un cir-
cuito que en su entrada recibe un voltaje de CD y en su salida entrega otro
voltaje de CD pero de valor diferente al recibido en su entrada. En la gura
2.38(a) se muestra el circuito de un convertidor electr onico de potencia de
CD/CD tipo Boost o elevador de voltaje. Esto signica que el voltaje de CD
en la salida del convertidor es mayor que el voltaje de CD en su entrada. Se
puede observar que la construcci on del sistema se realiza mediante dispositivos
semiconductores (transistor-diodo). El transistor Q tiene dos posibles estados:
el estado apagado (corte) u = 0, y el estado encendido (saturaci on) u = 1. En
el estado apagado el diodo D se polariza directamente, y permite el paso de
la energa entre la fuente de voltaje E y la carga del sistema R. En el estado
encendido el diodo D se polariza inversamente, y en consecuencia no existe
conexi on entre la fuente de voltaje E y la carga del sistema R.
El modelo matem atico asociado al convertidor de potencia de CD/CD
Boost est a denido por:
L
di
dt
= E (1 u) (2.147)
C
d
dt
= (1 u)i

R
(2.148)
donde i es la corriente electrica a traves del inductor L, v es el voltaje en las
terminales del capacitor C y la constante E representa el voltaje de CD que
se aplica en la entrada del sistema. Este sistema tiene por salida v, el cual
tiene la caracterstica de satisfacer la siguiente desigualdad E. La entrada
de control u representa la funci on de posici on del interruptor, la cual es una
se nal que s olo toma el valor de 0 o de 1.
Para la obtenci on del modelo matem atico del convertidor de potencia de
CD/CD Boost (2.147)-(2.148) y el an alisis del mismo, se introduce el con-
cepto de interruptor ideal, mostrado en la gura 2.38(b). En este circuito el
interruptor ideal tiene dos posibles posiciones: el caso en el cual u = 0 que
corresponde al circuito equivalente mostrado en la gura 2.39(a), asociado al
hecho de que el transistor Q este apagado. Mientras que para el caso u = 1, el
circuito equivalente que se obtiene es el mostrado en la gura 2.39(b), estando
el transistor Q encendido.
Partiendo de los circuitos equivalentes mostrados en las guras 2.39(a) y
2.39(b), el empleo de la Ley de Kirchho de Voltajes (LVK) y la Ley de Kir-
chho de Corrientes (LCK), se procede a la obtenci on del modelo matem atico
asociado al convertidor de potencia de CD/CD Boost:
76 2 Modelado matematico de sistemas fsicos
E
L
v
i
D
Q
R
(a) Construccion del convertidor mediante
transistor-diodo.
i
v
L
E
u
u
R C
(b) Convertidor con interruptor ideal.
Figura 2.38. Convertidor de potencia conmutado de CD/CD Boost.
E
L
v R
C
i
I
a
(a) Interruptor colocado en u = 0.
L
v
C
i
I
a
E R
(b) Interruptor colocado en u = 1.
Figura 2.39. Circuitos equivalentes del convertidor de CD/CD Boost.
Para el caso en el cual u = 0, el circuito equivalente es el mostrado en
la gura 2.39(a). Aplicando la LVK a la malla I y la LCK al nodo a de
mencionada gura, se obtienen respectivamente las relaciones din amicas
que gobiernan a la corriente i y al voltaje v:
L
di
dt
= E (2.149)
C
d
dt
= i

R
(2.150)
Para el caso en el cual u = 1, se obtiene el circuito equivalente mostrado
en la gura 2.39(b). De igual manera, aplicando la LVK a la malla I y
2.6 Ejemplos 77
la LCK al nodo a de la gura en cuesti on, las ecuaciones que se obtienen
para la corriente i y el voltaje v, respectivamente son:
L
di
dt
= E (2.151)
C
d
dt
=

R
(2.152)
Mediante simple inspecci on se pueden relacionar las ecuaciones obtenidas en
los circuitos equivalentes, mostrados en las guras 2.39(a) y 2.39(b), a traves
de la variable u, de la siguiente manera:
L
di
dt
= E (1 u) (2.153)
C
d
dt
= (1 u)i

R
(2.154)
ya que cuando u = 0 o u = 1, se generan los sistemas (2.149)-(2.150) y
(2.151)-(2.152), respectivamente. De esta forma, el modelo matem atico del
convertidor de potencia de CD/CD Boost est a determinado por el sistema
de ecuaciones diferenciales no lineales (2.153)-(2.154). A este conjunto de
ecuaciones se le denomina modelo conmutado, que hace referencia al hecho
de que la posici on del interruptor u s olo puede tomar el valor de 0 o de 1.
Con la intenci on de conocer el valor en estado estacionario de las variables
asociadas al sistema (2.153)-(2.154), se parte del modelo promedio del con-
vertidor. En este modelo se supone que la conmutaci on (encendido-apagado)
del transistor ocurre a muy alta frecuencia de modo que se puede expresar el
modelo en terminos de variables promedio, es decir:
L
di
dt
= E (1 u
av
) (2.155)
C
d
dt
= (1 u
av
)i

R
(2.156)
donde i y representan, respectivamente, la corriente y el voltaje promedio en
el inductor y el capacitor. Mientras que la entrada u
av
ahora denota la entrada
de control promedio, la cual puede tomar valores en el intervalo continuo [0,1),
siendo esta la funci on de posici on promedio del interruptor.
Como consecuencia de imponer que la entrada del convertidor sea u
av
=
U = constante, se encuentra que en estado estacionario (cuando
di
dt
= 0 y
d
dt
= 0) el sistema (2.155)-(2.156) genera que:
_
0 (1 U)
(1 U)
1
R
_ _
i

_
=
_
E
0
_
(2.157)
As, resolviendo (2.157) se encuentra que en estado estacionario i y satis-
facen las siguientes relaciones:
78 2 Modelado matematico de sistemas fsicos
i =
1
R
E
(1 U)
2
(2.158)
=
E
(1 U)
(2.159)
De esta manera, a partir de las relaciones en estado estacionario, determi-
nadas por (2.158)-(2.159), es claro que se tiene la siguiente relaci on est atica
(en estado estacionario) promedio:
H(U) =

E
=
1
(1 U)
(2.160)
De (2.160) se puede observar que el cociente

E
es mayor o igual a uno,
pues U [0, 1), de ah que a este convertidor se le conozca como elevador de
voltaje. Finalmente, en la gura 2.40 se puede observar la curva caracterstica
est atica del convertidor Boost, donde claramente se ve cumplida la desigualdad
E.
0 0.2 0.4 0.6 0.8 1
0
1
2
3
4
5
6
7
8
9
10
U
H
(
U
)
Figura 2.40. Ganancia de voltaje estatico del convertidor de potencia Boost.
Ejemplo 2.19 El circuito de un convertidor de potencia de CD/CD tipo
Boost-Boost ideal, es decir sintetizado con interruptores, se muestra en la
gura 2.41. Mientras que el circuito pr actico es el que se muestra en la gura
2.42.
En el sistema mostrado en la gura 2.41 las entradas u
1
y u
2
s olo pueden
tomar el valor de 0 o de 1, que corresponden fsicamente a la posici on de los
interruptores (vease la gura 2.41). Estas posiciones en la pr actica se efect uan
por medio de transistores en modo de operaci on de corte/saturaci on, como se
ilustra en gura 2.42. Cabe mencionar que el estado de corte de los transistores
equivale al caso en el que u
1
= 0, u
2
= 0, y el estado de saturaci on de los
transistores equivale a tener u
1
= 1, u
2
= 1 en la gura 2.41.
2.6 Ejemplos 79
Figura 2.41. Circuito del convertidor de potencia de CD/CD Boost-Boost ideal.
Figura 2.42. Circuito del convertidor de potencia de CD/CD Boost-Boost real.
El resto de las variables involucradas en el sistema de la gura 2.41 son: i
1
,

1
, i
2
y
2
, las cuales corresponden a las corrientes y voltajes, respectivamente,
asociados a L
1
, C
1
, L
2
y C
2
. Asimismo, la constante E representa el voltaje
de CD aplicado a la entrada del convertidor y
2
la salida, misma que entrega
un voltaje amplicado que satisface la siguiente relaci on:
2
E, lo cual
quedar a demostrado cuando se realice un an alisis en estado permanente del
sistema Boost-Boost, a partir de la obtenci on de su modelo matem atico.
Partiendo de la gura 2.41 o 2.42 se procede a obtener el modelo matem ati-
co que describe la evoluci on del sistema a lo largo del tiempo con la ayuda de
la Ley de Kirchho de Voltajes (LVK) y la Ley de Kirchho de Corrien-
tes (LCK). Para esto, se consideran los cuatro casos diferentes que pueden
suscitarse de los dos posibles estados que toma cada transistor (encendido o
apagado), generando cuatro circuitos equivalentes, cada uno representado por
subsistemas de ecuaciones diferenciales lineales de cuarto orden. Finalmente,
estos subsistemas se hacen comulgar en un solo sistema diferencial de cuar-
to orden no lineal que constituye el modelo matem atico nal del convertidor
Boost-Boost. A continuaci on se muestra tal proceso.
a) Para el caso en el cual los transistores Q
1
y Q
2
est an encendidos, i. e.,
u
1
= 1 y u
2
= 1 (vease la gura 2.41), el circuito equivalente es el que
muestra en la gura 2.43(a). Aplicando la LVK a las mallas I y II de la
gura 2.43(a) se obtienen las ecuaciones que gobiernan a las corrientes i
1
e
i
2
, respectivamente determinadas por:
L
1
di
1
dt
= E, (2.161)
L
2
di
2
dt
=
1
. (2.162)
Por otro lado, aplicando la LCK a los nodos A y B de la gura 2.43(a), se
obtienen las ecuaciones diferenciales asociadas a los voltajes
1
y
2
, dadas
80 2 Modelado matematico de sistemas fsicos
por:
C
1
d
1
dt
=

1
R
1
i
2
, (2.163)
C
2
d
2
dt
=

2
R
L
. (2.164)
b) Para el caso en el que Q
1
est a encendido y Q
2
apagado, i. e., u
1
= 1 y
u
2
= 0, a partir de la gura 2.41, el circuito equivalente es el que muestra en
la gura 2.43(b). Aplicando la LVK a las mallas I y II de la gura 2.43(b)
se obtienen las ecuaciones para i
1
e i
2
respectivamente:
L
1
di
1
dt
= E, (2.165)
L
2
di
2
dt
=
1

2
. (2.166)
De igual forma, aplicando la LCK en los nodos A y B de la gura 2.43(b), se
obtienen las ecuaciones que gobiernan a los voltajes
1
y
2
:
C
1
d
1
dt
=

1
R
1
i
2
, (2.167)
C
2
d
2
dt
= i
2
(t)

2
R
L
. (2.168)
c) Cuando Q
1
est a apagado y Q
2
encendido, i. e., u
1
= 0 y u
2
= 1, el circuito
resultante es el que muestra en la gura 2.43(c) y aplicando la LVK en las
mallas I y II, se logra el planteamiento de las ecuaciones que describen el
comportamiento de las corrientes i
1
e i
2
respectivamente:
L
1
di
1
dt
=
1
+E, (2.169)
L
2
di
2
dt
=
1
. (2.170)
Asimismo, valiendose de la LCK para los nodos A y B de la gura 2.43(c),
se tiene lo siguiente:
C
1
d
1
dt
= i
1


1
R
1
i
2
, (2.171)
C
2
d
2
dt
=

2
R
L
. (2.172)
d) Finalmente, cuando u
1
= 0 y u
2
= 0, el cual corresponde al caso en el que
los transistores se encuentran apagados, el circuito equivalente es el que se
muestra en la gura 2.43(d). Para obtener las ecuaciones que gobiernan a los
voltajes y corrientes ilustrados en la gura 2.43(d), de igual forma, se aplica
la LVK para las mallas I y II obteniendo lo siguiente:
2.6 Ejemplos 81
L
1
di
1
dt
=
1
+E, (2.173)
L
2
di
2
dt
=
1

2
. (2.174)
Mientras que, aplicando la LCK para los nodos A y B, se tiene:
C
1
d
1
dt
= i
1


1
R
1
i
2
, (2.175)
C
2
d
2
dt
= i
2


2
R
L
. (2.176)
As, mediante inspecci on, al comparar las ecuaciones (2.161)-(2.162),
(2.165)-(2.166), (2.169)-(2.170) y (2.173)-(2.174), se producen como resul-
tado las ecuaciones que gobiernan el comportamiento de i
1
e i
2
, determinadas
respectivamente por (2.177) y (2.179). Realizando un proceso similar para las
variables
1
y
2
, determinadas por las ecuaciones (2.163)-(2.164), (2.167)-
(2.168), (2.171)-(2.172) y (2.175)-(2.176), se obtienen las ecuaciones (2.178)
y (2.180) respectivamente. De esta manera, el modelo matem atico del converti-
dor Boost-Boost queda determinado por el sistema de ecuaciones diferenciales
de cuarto orden no lineal, siguiente:
L
1
di
1
dt
= (1 u
1
)
1
+E, (2.177)
C
1
d
1
dt
= (1 u
1
)i
1


1
R
1
i
2
, (2.178)
L
2
di
2
dt
=
1
(1 u
2
)
2
, (2.179)
C
2
d
2
dt
= (1 u
2
)i
2


2
R
L
. (2.180)
As, las ecuaciones (2.177)-(2.180) constituyen el modelo matem atico del con-
vertidor de potencia Boost-Boost. Si se desea corroborar que estas ecuaciones
reproducen los cuatro modos de operaci on del convertidor (o circuitos equiva-
lentes de la gura 2.43), basta con asignarle los valores correspondientes a las
entradas u
1
y u
2
.
Con la nalidad de conocer las propiedades del convertidor de potencia
Boost-Boost en estado estacionario se parte de su modelo promedio asociado,
el cual se obtiene suponiendo que ambos transistores conmutan a alta frecuen-
cia y est a determinado como:
L
1
d

i
1
dt
= (1 u
1av
)
1
+E, (2.181)
C
1
d
1
dt
= (1 u
1av
)

i
1


1
R
1

i
2
, (2.182)
L
2
d

i
2
dt
=
1
(1 u
2av
)
2
, (2.183)
82 2 Modelado matematico de sistemas fsicos
(a) Circuito equivalente del convertidor de potencia Boost-Boost
cuando u1 = 1 y u2 = 1.
(b) Circuito equivalente del convertidor de potencia Boost-Boost
cuando u1 = 1 y u2 = 0.
(c) Circuito equivalente del convertidor de potencia Boost-Boost
para u1 = 0 y u2 = 1.
(d) Circuito equivalente del convertidor de potencia Boost-Boost
cuando u1 = 0 y u2 = 0.
Figura 2.43. Modos de operacion del convertidor de potencia de CD/CD Boost-
Boost.
C
2
d
2
dt
= (1 u
2av
)

i
2


2
R
L
, (2.184)
donde

i
1
,
1
,

i
2
y
2
representan las corrientes y los voltajes promedio asocia-
dos a L
1
, C
1
, L
2
y C
2
respectivamente. Las entradas u
1av
y u
2av
representan
las entradas de control promedio, las cuales pueden tomar valores en el in-
tervalo continuo [0, 1), siendo estas las funciones de posici on promedio de los
interruptores.
De esta manera, partiendo del modelo promedio (2.181)-(2.184), se procede
a obtener los valores en estado estacionario del sistema que aparecen cuando
las entradas del convertidor u
1av
y u
2av
son constantes en alg un valor dentro
del intervalo [0, 1). Esto se consigue suponiendo que
d

i1
dt
= 0,
d 1
dt
= 0,
d

i2
dt
= 0
2.7 Caso de estudio 83
y
d 2
dt
= 0, para encontrar:
_

_
0 (1 u
1av
) 0 0
(1 u
1av
)
1
R1
1 0
0 1 0 (1 u
2av
)
0 0 (1 u
2av
)
1
RL
_

_
_

1

1

2

2
_

_
=
_

_
E
0
0
0
_

_
,
Resolviendo para

i
1
,
1
,

i
2
y
2
, se obtiene lo siguiente:
_

1

1

2

2
_

_
=
_

_
E
R1RL
R1+RL(1 u2av)
2
(1 u1av)
2
(1 u2av)
2
E
1 u1av
E
RL
1
(1 u1av)(1 u2av)
2
E
(1 u1av)(1 u2av)
_

_
. (2.185)
De esta manera, (2.185) permite conocer de manera directa los valores que
toman las variables promedio

i
1
,
1
,

i
2
y
2
, en estado estacionario. Asi-
mismo, a partir de la ultima relaci on en (2.185) se puede observar que la
salida satisface la desigualdad
2
E, pues recordemos que u
1av
[0, 1) y
u
1av
[0, 1).
2.7. Caso de estudio. Un convertidor electronico de
potencia de CD a CD tipo resonante serie de alta
frecuencia
Muchos equipos en la actualidad utilizan para su funcionamiento una
gran diversidad de circuitos electronicos los cuales, precisamente debido a su
gran diversidad, necesitan ser alimentados con diferentes niveles de voltaje de
corriente directa (CD). Para alimentar estos equipos se puede utilizar un gran
transformador que cuente con varias derivaciones en el secundario de modo
que a partir de cada una de ellas se pueda utilizar un arreglo recticador-
ltro para obtener un voltaje de CD diferente. Sin embargo, este metodo ya
no es utilizado porque requiere de componentes (inductores y capacitores) de
valores grandes, resultando en equipos voluminosos, ademas de producir la
perdida de grandes cantidades de energa. La estrategia utilizada actualmente
para resolver este problema consiste en contar con varios circuitos electronicos
de potencia que mediante dispositivos de conmutacion obtienen, a su salida,
valores de voltaje de CD diferentes a partir de un unico voltaje de CD de
suministro. Estos circuitos reciben el nombre de convertidores electronicos de
potencia de CD a CD y resuelven el problema arriba mencionado reduciendo
las perdidas de energa y el volumen de los equipos. De hecho, la miniatu-
rizacion de los equipos electronicos modernos se debe en gran parte al uso
de convertidores electronicos de potencia. En los ejemplos 2.18 y 2.19 se han
modelado algunos de los convertidores electronicos de potencia utilizados en
la actualidad.
84 2 Modelado matematico de sistemas fsicos
E
L
C
R
+
-
+
-
C
0
v
0
i
v
(a) Serie
E
L
R
+
-
+
-
L
0
0
C
v
0
v
i i
0
(b) Paralelo
Figura 2.44. Convertidores electronicos de potencia de CD a CD tipo resonante.
Otro tipo especial de convertidores electronicos de potencia son aquellos
que se denominan resonantes, los cuales se clasican a su vez en serie y paralelo
seg un la manera en que se conectan sus componentes (vease la gura 2.44).
En particular, el convertidor resonante serie de CD a CD mostrado en la
gura 2.44(a) funciona del siguiente modo. La red de conmutacion constituye
un inversor que entrega un voltaje de potencia alterno y cuadrado (que toma
valores de E) a la entrada del circuito resonante serie. En la forma mas basica
de funcionamiento de un convertidor resonante serie, la frecuencia de la se nal
de voltaje entregada por el inversor es igual a la frecuencia de resonancia
del circuito serie LC. De este modo, los transistores con los que se construye
la red de conmutacion se encienden y apagan por parejas, Q
1
, Q
3
y Q
2
, Q
4
,
cuando la corriente a traves de ellos es igual a cero (veanse los interruptores
en la parte izquierda de la gura 2.45; los diodos colocados en paralelo a los
transistores son utilizados cuando el circuito no funciona en resonancia tal
como se explica la seccion 3.11 del captulo 3). Esto es muy conveniente pues
evita la fatiga de los transistores alargando la vida util de los mismos. Por
otro lado, como el circuito LC serie funciona en resonancia, la corriente i a
traves del circuito adquiere una forma de onda sinusoidal la cual es recticada
y ltrada por la parte derecha del circuito de la gura 2.44(a). De este modo,
la carga alimentada por el circuito (representada por la resistencia R) recibe
en sus terminales el voltaje de CD representado por v
0
.
En la gura 2.46 se muestra el diagrama electrico de un convertidor reso-
nante serie de CD a CD presentando el inversor de manera simplicada como
2.7 Caso de estudio 85
Q
1
Q
4
Q
3
Q
2
D
2
D
3
D
1
D
4
L C
C
0
R

+

v
i
+

v
0
+

E
Figura 2.45. Convertidor resonante serie de CD a CD mostrando la disposicion de
dispositivos en el inversor.
E(t)
L
C
C
i
+
-
R
o
-
+
v
v
0
Figura 2.46. Circuito simplicado de un convertidor resonante serie de CD a CD.
una fuente de voltaje alterno y cuadrado E(t) que toma valores E. Notese
que, debido a la presencia de los diodos recticadores, el funcionamiento del
circuito puede ser separado en dos casos: 1) cuando i > 0, gura 2.47(a), y
2) cuando i < 0, gura 2.47(b). A partir de la gura 2.47(a) se obtienen las
ecuaciones para i > 0. Aplicando la Ley de Kirchho de voltajes al trayecto
cerrado de la izquierda se obtiene:
E(t) = L
di
dt
+v +v
0
, i > 0
Es importante resaltar que se ha tomado en consideracion el sentido indicado
para la corriente i, as como la polaridad indicada para v
0
. Por otro lado, de
acuerdo a (2.120) la relacion entre el voltaje y la corriente en el capacitor
resonante esta dada como:
C
dv
dt
= i, i > 0
Finalmente, aplicando la Ley de Kirchho de corrientes al nodo com un a
ambos capacitores se obtiene:
86 2 Modelado matematico de sistemas fsicos
i = C
0
dv
0
dt
+
v
0
R
, i > 0
E(t)
L
C
C0
i
+ -
+
-
R
+
-
v
0
v
(a) i > 0
E(t)
L C
C0
i
+ -
+
-
R
+
-
v
v
0
(b) i < 0
Figura 2.47. Circuitos equivalentes para i > 0 e i < 0.
Por otro lado, a partir de la gura 2.47(b) se obtienen las ecuaciones para
i < 0. Aplicando la Ley de Kirchho de voltajes al trayecto cerrado de la
izquierda se obtiene:
E(t) = L
di
dt
+v v
0
, i < 0
Notese que v
0
esta afectado por un signo porque la polaridad indica-
da para este voltaje esta en sentido opuesto al denido por el sentido de la
corriente electrica i. Sin embargo, la relacion entre el voltaje y la corriente en
el capacitor resonante no sufre cambios:
C
dv
dt
= i, i < 0
Finalmente, aplicando la Ley de Kirchho de corrientes al nodo com un a
ambos capacitores se obtiene:
i =
v
0
R
C
0
dv
0
dt
, i < 0
Notese que el sentido correcto de la corriente en el capacitor C
0
y en la resis-
tencia es de la terminal marcada con + a la terminal marcada con , es
decir, es contrario al sentido indicado para i.
2.8 Resumen del captulo 87
Comparando estos dos conjuntos de ecuaciones, se puede obtener un unico
conjunto de ecuaciones que representa a ambos casos i > 0 e i < 0:
E(t) = L
di
dt
+v +v
0
sign(i) (2.186)
C
dv
dt
= i (2.187)
abs(i) = C
0
dv
0
dt
+
v
0
R
(2.188)
donde:
sign(i) =
_
+1, i > 0
1, i < 0
(2.189)
mientras que abs(i) representa el valor absoluto de i, es decir abs(i) = i si
i > 0 y abs(i) = i si i < 0. Las ecuaciones en (2.186)-(2.188) constituyen
el modelo matematico del convertidor electronico de potencia de CD a CD
tipo resonante serie. En la seccion 3.11 del captulo 3 se retomara el estudio
de este tipo de convertidor electronico de potencia. A partir del estudio del
modelo (2.186)-(2.188) se vera como funciona este circuito y se explicara por
que recibe el calicativo de alta frecuencia. Para mas informacion sobre el
modelado de este tipo de convertidores electronicos de potencia se recomienda
consultar [10].
2.8. Resumen del captulo
El modelo matematico de un sistema fsico es una ecuacion o un conjunto
de ecuaciones diferenciales que describen la evolucion de las variables impor-
tantes del sistema fsico cuando son sometidas a condiciones especcas. Tal
descripcion sera obtenida mediante la solucion de dichas ecuaciones diferen-
ciales en el captulo 3.
Se ha mostrado que el modelo matematico de los sistemas mecanicos,
electricos y electromecanicos puede ser obtenido utilizando el concepto de
energa, cantidad fsica que los ingenieros estan acostumbrados a manejar. De
acuerdo a este enfoque, se puede considerar que las partes que componen a los
sistemas fsicos son procesadores de energa y el modelo matematico describe
como intercambian la energa dichos componentes.
Comparando la manera en que los sistemas procesan la energa se pueden
establecer analogas entre sistemas de diferente naturaleza. Por ejemplo, la
masa y la inercia (sistemas mecanicos) son analogas a la inductancia (sistemas
electricos), un resorte (sistemas mecanicos) es analogo a un capacitor (sistemas
electricos), y la friccion viscosa (sistemas mecanicos) es analoga a la resistencia
(sistemas electricos). Ademas, una caja de engranes y una barra apoyada en
un punto (sistemas mecanicos) son analogas a un transformador (sistemas
88 2 Modelado matematico de sistemas fsicos
electricos), mientras que un sistema pi non-cremallera (sistemas mecanicos) es
analogo a un motor electrico (sistemas electromecanicos).
En lo que resta de la presente obra, el modelo matematico del sistema a
controlar sera utilizado para dise nar un controlador (otra ecuacion diferencial
en general). El objetivo es que al conectar el controlador en realimentacion
con el sistema a controlar se genere otra ecuacion diferencial (en lazo cerrado)
cuyas propiedades (estudiadas en el captulo 3) aseguren que la variable que
interesa controlar evolucione en el tiempo de la manera deseada.
2.9. Preguntas de repaso
1. Cuales son las leyes fundamentales de la fsica que se usan para describir
la interconexion de componentes en sistemas mecanicos y en sistemas
electricos?
2. Por que el modelo obtenido en el ejemplo 2.7 es una ecuacion diferen-
cial de primer orden mientras que el modelo obtenido en el ejemplo 2.8
esta constituido por dos ecuaciones diferenciales de segundo orden cada
una? Notese que en el ejemplo 2.7 hay tres cuerpos mientras que en el
ejemplo 2.8 hay dos cuerpos involucrados.
3. Por que el modelo en (2.92) no tiene el termino correspondiente a
4
, es
decir, a la posicion?
4. Por que los modelos matematicos de un circuito RL y de un circuito
RC son ecuaciones diferenciales de primer orden mientras que el modelo
matematico de un circuito RLC es una ecuacion diferencial de segundo
orden?
5. En la seccion 2.2.3 se menciona que Faraday fue el primero en darse cuen-
ta de que un inductor (y en general cualquier circuito electrico sucien-
temente largo) tiene propiedades analogas a las que tiene el momentum
en sistemas mecanicos. Puede explicar a que se reere esta armacion?
Ha observado que cuando se trata de desconectar un circuito altamente
inductivo salta una chispa? Recuerda lo que establece la Primera Ley de
Newton?
6. Se ha visto que en un motor electrico de CD se cumple que k
e
= k
m
. Por
otro lado, es claro que el subsistema electrico debe transmitir energa al
subsistema mecanico para realizar el movimiento. Puede dar el ejemplo
de una situacion en la que el subsistema mecanico transmite energa al
subsistema electrico? Que papel juega en este caso el hecho de que k
e
=
k
m
?
7. Se ha visto que una caja de engranes es analoga al transformador electrico
Podra listar las caractersticas existentes entre las corrientes y voltajes
en ambos devanados de un transformador electrico? Algo similar puede
establecerse para las velocidades y pares en ambos lados de la caja de
engranes? Podra listar las ventajas, desventajas y aplicaciones de estas
caractersticas en una caja de engranes y en un transformador electrico?
2.10 Ejercicios propuestos 89
8. De acuerdo a la pregunta anterior Por que un automovil debe viajar mas
lentamente para subir una pendiente muy pronunciada pero puede viajar
mas rapido en terrenos planos?
9. Si un transformador electrico puede elevar el voltaje eligiendo una ta-
za n
1
/n
2
apropiada Por que se usan circuitos electronicos basados en
transistores para amplicar se nales en sistemas de comunicaciones (que
procesan corriente alterna) en lugar de transformadores electricos?
10. Si un transformador electrico y una caja de engranes conservan la potencia
en ambos puertos De que manera intervienen las perdidas en ambos
dispositivos? A que se pueden deber dichas perdidas?
2.10. Ejercicios propuestos
1. Considere el sistema masa-resorte-amortiguador mostrado en la gura
2.22(a) y estudiado en el ejemplo 2.3. Ahora suponga que este mecanismo
esta girado 90

en sentido horario, es decir, que ahora existe el efecto de


la gravedad sobre la direccion del desplazamiento del resorte y del amorti-
guador (la masa cuelga del techo a traves del resorte y del amortiguador).
Demuestre que el modelo matematico correspondiente es:
y +
b
m
y +
K
m
y =
1
m
F(t)
donde y = x x
0
con x
0
= mg/K y g la aceleracion de la gravedad.
Que signica esto?
2. Considere el sistema mecanico del ejemplo 2.9. Suponga que sobre el cuer-
po de la derecha se aplica un par externo de perturbacion T
p
(t). Tambien
suponga que el par externo aplicado T(t) es producido por un motor
electrico de CD como en el ejemplo 2.12. Obtenga el modelo matematico
correspondiente y comparelo con el obtenido en (9.9) y (9.10) del captulo
9.
3. Realice las manipulaciones algebraicas que sobre el modelo (2.114) y
(2.115) se sugieren en el ultimo parrafo del ejemplo 2.12.
4. Realice las manipulaciones algebraicas del ejercicio anterior sobre el mo-
delo obtenido en el ejercicio 2 de esta seccion.
5. Considere el circuito electrico mostrado en la gura 2.48. Demuestre que
el voltaje v indicado en la gura es igual a:
v =
1
2
(v
1
v
2
)
6. Considere el circuito RC mostrado en la gura 2.49. Demuestre que el
voltaje en la resistencia esta dado como:
V
o
(s) =
s
s +
1
RC
V
i
(s)
v
c
(0)
s +
1
RC
90 2 Modelado matematico de sistemas fsicos
donde V
o
(s) y V
i
(s) son las transformadas de Laplace de v
o
y v
i
, mientras
que v
c
(0) es el voltaje inicial (cuando t = 0) en el capacitor.
7. Un voltmetro analogico de corriente directa es basicamente un motor de
CD con un resorte rmemente unido entre su eje de giro y un punto jo
a la parte no movil del voltmetro. Esto signica que dicho motor de CD
esta restringido a girar menos de una vuelta. En base a esta descripcion
obtenga el modelo matematico de un voltmetro analogico de CD.
8. Considere el sistema conmutado mostrado en la gura 2.50, el cual repre-
senta a un convertidor de potencia de CD/CD tipo Buck. Esta topologa
tambien es conocida como reductora de voltaje, porque la salida de voltaje
es menor o igual que el voltaje de entrada E, i.e., E. El objetivo de
control de este sistema consiste en conseguir que el voltaje de salida del
convertidor , se estabilice a un valor de voltaje deseado E, mediante
el dise no adecuado de u.
Demuestre que el modelo matematico del convertidor de potencia de
CD/CD Buck, esta determinado por:
L
di
dt
= +uE
+
+
+

v
1
v
2 v
R R
Figura 2.48. Circuito del ejercicio 5.
+

R
C
v
i
v
o
+

+
Figura 2.49. Circuito RC.
2.10 Ejercicios propuestos 91
L
i
v C R
E
D
Q
(a) Construccion del convertidor mediante
transistor-diodo.
L
i
u
u
v C R
E
(b) Representacion ideal del convertidor.
Figura 2.50. Diagrama electronico del convertidor de potencia de CD/CD Buck.
C
d
dt
= i

R
(2.190)
Las variables i, representan la corriente presente en el inductor L y el
voltaje entre las terminales del capacitor C, respectivamente. Mientras
que E representa el voltaje de entrada al sistema y R es la resistencia de
salida del sistema. Finalmente, la variable u denota la funcion de posicion
del interruptor o conmutador, la cual act ua como variable de control y
solo toma el valor de 0 o de 1.
9. El sistema Convertidor de potencia Buck-Motor de CD, mostrado en la
gura 2.51, representa una forma de conveniente de alimentar a un motor
de CD. El objetivo de control de este sistema consiste en lograr que la
velocidad angular de la echa del motor , se estabilice a un valor de
velocidad deseada a traves del voltaje , obtenido del convertidor de
potencia Buck, mediante el dise no adecuado de u.
Partiendo del hecho de que el modelo matematico de un motor de CD
esta determinado por:
L
a
di
a
dt
= R
a
i
a
k
e
,
J
d
dt
= k
m
i
a
B.
Demuestre que el modelo matematico del sistema Convertidor de potencia
Buck-Motor de CD, representado idealmente en la gura 2.51(b), esta de-
terminado por el siguiente sistema de ecuaciones diferenciales lineales:
L
di
dt
= +Eu, (2.191)
C
d
dt
= i i
a


R
,
92 2 Modelado matematico de sistemas fsicos
L
a
di
a
dt
= R
a
i
a
k
e
,
J
d
dt
= k
m
i
a
B.
donde:
i es la corriente presente en el inductor del convertidor Buck.
es el voltaje de salida del convertidor y a su vez es el voltaje aplicado
en las terminales de armadura del motor.
u representa la funcion de posicion del interruptor o conmutador, la
cual act ua como variable de control y solo toma el valor de 0 o de 1.
L denota la inductancia del convertidor Buck.
C representa la capacitancia del convertidor Buck.
E es el voltaje de alimentacion del sistema convertidor Buck-Motor de
CD.
R denota la resistencia de salida del convertidor.
i
a
es la corriente electrica de armadura.
es la velocidad angular del rotor del motor.
L
a
representa la inductancia de armadura.
R
a
es la resistencia de armadura.
D
Q
!
Convertidor Buck Motor de CD
(a) Construccion del sistema convertidor Buck-Motor de CD
mediante transistor-diodo.
!
Convertidor Buck Motor de CD
(b) Representacion ideal del sistema convertidor Buck-
Motor de CD.
Figura 2.51. Diagrama electronico del sistema convertidor de potencia de CD/CD
Buck-Motor de CD.
2.10 Ejercicios propuestos 93
J es la inercia del rotor del motor.
k
e
representa la constante de fuerza contra-electromotriz.
k
m
representa la constante de par del motor.
B es la constante de friccion viscosa del motor.
10. Considere el circuito RLC en serie del ejemplo 2.14, cuyo modelo ma-
tematico esta dado en (2.123). La Energa almacenada en el circuito es
igual a la energa magnetica de el inductor mas la energa electrica en el
capacitor E =
1
2
Li
2
+
1
2C
q
2
. Compruebe que

E = iv
i
Ri
2
. Que signica
cada termino de esta expresion?
11. Considere el sistema inercia-resorte-amortiguador del ejemplo 2.6, cuyo
modelo matematico esta dado en (2.68). La Energa almacenada en el
sistema es igual a la energa cinetica mas la energa en el resorte E =
1
2
I

2
+
1
2
K
2
. Compruebe que

E = T

b

2
. Que signica cada termino
de esta expresion?
12. Considere el modelo en (2.114),(2.115), correspondiente al sistema electro-
mecanico del ejemplo 2.12. La energa almacenada en este sistema es igual
a la energa magnetica en el inductor de armadura mas la energa cinetica
del mecanismo. Puede proceder como en los dos ejemplos previos para
encontrar la expresion correspondiente a
dE
dt
? Que signica cada uno de
los terminos que aparecen en
dE
dt
? Puede identicar a los terminos que
representan el intercambio de energa entre los subsistemas electrico y
mecanico?
Referencias
1. P.E. Wellstead, Physical system modelling, Academic Press, Londres, 1979.
2. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
3. R.K. Wangsness, Campos Electromagneticos, Limusa-Noriega Editores, Mexico,
D.F., 1987.
4. R. Kelly, J. Llamas, and R. Campa, A measurement procedure for viscous and
coulomb friction, IEEE Transactions on Instrumentation and Measurement, vol.
49, no. 4, pp. 857-861, 2000.
5. C.T.A. Johnk, Teora electromagnetica: campos y ondas, Limusa-Noriega Edi-
tores, Mexico, D.F., 1993.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. F. W. Sears, M. W. Zemansky y H. D. Young, Fsica Universitaria, 6a. Edicion,
Addison-Wesley Iberoamericana, Wilmington, Delaware, 1988.
8. M.E. Van Valkenburg, Analisis de redes, Limusa-Noriega Editores, Mexico, D.F.,
1994.
9. W. H. Hayt y J. E. Kemmerly, Analisis de circuitos en ingeniera, McGraw-Hill,
Mexico, D.F., 1985.
10. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: dise no y construccion, Tesis Maestra en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
3
Base matematica: ecuaciones diferenciales
0 0.5 1 1.5 2
x 10
-4
-50
0
50
t [s]
[
V
]
E(t)
0 2 4 6 8
x 10
-4
0
10
20
30
t [s]
[
W
a
t
t
]
P(t)
-500 -250 0 250 500
-1.5
-0.5
0.5
1.5
[V]
[
A
]
v(t)
i(t)
Las ecuaciones diferenciales describen el comportamiento de los sistemas
fsicos y de los sistemas de control en lazo cerrado. Por ejemplo, en los cir-
cuitos electricos y electronicos, resolviendo las ecuaciones diferenciales corres-
pondientes se puede contar con una descripcion cuantitativa y cualitativa de
las corrientes en los inductores y los voltajes en los capacitores. A partir de
estos valores se pueden calcular otras variables importantes como la potencia
y la energa.
98 3 Base matematica: ecuaciones diferenciales
Objetivos del captulo
En el captulo 2 se ha mostrado que la evoluci on de los sistemas fsicos que
interesa controlar en esta obra est a descrita por ecuaciones diferenciales ordi-
narias, lineales y de coecientes constantes. Es de mucha utilidad identicar
cuales son las propiedades que determinan la forma de la soluci on de este tipo
de ecuaciones diferenciales porque, seg un se ver a en captulos posteriores, el
dise no de un controlador consiste en construir un dispositivo que modique
convenientemente esas propiedades para conseguir una respuesta satisfactoria.
El presente captulo pretende que el lector aprenda lo siguiente respecto de las
ecuaciones diferenciales ordinarias, lineales y de coecientes constantes:
Que es la respuesta forzada y que es la respuesta natural, y que la solu-
ci on completa de la ecuaci on diferencial est a dada como la suma de estas
respuestas.
C omo depende la soluci on de la ecuaci on diferencial de las races del po-
linomio caracterstico (o, equivalentemente, de los polos de la funci on de
transferencia).
Identicar gr acamente c omo es la soluci on de las ecuaciones diferencia-
les de primero y segundo orden e interpretar con ejemplos pr acticos el
signicado de dichas formas gr acas. A partir de este estudio, ser capaz
de comprender cu ales son las posibles formas gr acas de las ecuaciones
diferenciales de orden arbitrario.
Identicar cu ales son las caractersticas que determinan la forma de la
respuesta transitoria, el valor nal de la respuesta y la estabilidad de la
ecuaci on diferencial.
Identicar el principio de superposici on como la propiedad fundamental
que determina la linealidad de una ecuaci on diferencial.
Las tecnicas de control que se utilizan en esta obra requieren del modelo
matematico del proceso fsico a controlar. Estos modelos matematicos resul-
tan ser ecuaciones diferenciales. El dise no del controlador se realiza buscando
que la ecuacion diferencial que representa al sistema controlado en lazo cerra-
do tenga las propiedades matematicas que aseguran que el sistema de control
respondera como se desea. Por tanto, es importante saber cuales son las ca-
ractersticas de una ecuacion diferencial que determinan como es su solucion.
Aunque existen varios enfoques para estudiar ecuaciones diferenciales, sin em-
bargo el uso de la transformada de Laplace es el metodo preferido en la teora
de control clasico. Es por esta razon que en este captulo se estudian las ecua-
ciones diferenciales ordinarias, lineales, de coecientes constantes usando la
transformada de Laplace.
La transformada de Laplace se dene del siguiente modo. Suponga que
se tiene una funcion del tiempo f(t), la transformada de Laplace de f(t) se
representa por F(s) y se puede calcular como [2], pag. 185,[3], pag. 285:
F(s) = L{f(t)} =
_

0
f(t)e
st
dt
3.1 Ecuacion diferencial de primer orden 99
El resultado fundamental de la transformada de Laplace que se utiliza en la
solucion de ecuaciones diferenciales ordinarias, lineales, de coecientes cons-
tantes es el siguiente [2], pag. 192,[3], pag. 293:
L
_
d
n
f(t)
dt
n
_
=
s
n
F(s) s
n1
f(0) s
n2
f
(1)
(0) sf
(n2)
(0) f
(n1)
(0) (3.1)
donde el exponente entre parentesis indica el orden de la derivada respecto al
tiempo. Tambien es util la siguiente propiedad [2], pag. 193,[3], pag. 293:
L
_
_
t
0
f()d
_
=
F(s)
s
(3.2)
Otro resultado importante es el teorema del valor nal [1], pag. 25, [3], pag.
304:
lm
t
f(t) = lm
s0
sF(s) (3.3)
expresion que es valida si dichos lmites existen.
3.1. Ecuacion diferencial de primer orden
Considere la siguiente ecuacion diferencial ordinaria, lineal, de coecientes
constantes de primer orden:
y +a y = k u, y(0) = y
0
(3.4)
donde k y a son constantes reales, y
0
se conoce como el valor inicial o la con-
dicion inicial de y(t) y y =
dy
dt
. El objetivo de resolver esta ecuacion diferencial
es, conociendo los valores de a, k y de la funcion del tiempo u, obtener y co-
mo una funcion del tiempo que al ser sustituida en (3.4) satisfaga la igualdad
ah establecida. Usando (3.1) en (3.4) se obtiene:
sY (s) y
0
+a Y (s) = k U(s) (3.5)
Despejando Y (s) se puede escribir:
Y (s) =
k
s +a
U(s) +
1
s +a
y
0
(3.6)
Para continuar es necesario especicar la funcion del tiempo u. Suponga que:
u = A, U(s) =
A
s
(3.7)
100 3 Base matematica: ecuaciones diferenciales
donde A es una constante. Por tanto, ahora se puede escribir (3.6) como:
Y (s) =
kA
s(s +a)
+
1
s +a
y
0
(3.8)
De acuerdo al metodo de expansion en fracciones parciales [2], Cap. 4, [3],
pag. 319, si a = 0 entonces se debe escribir:
kA
s(s +a)
=
B
s +a
+
C
s
(3.9)
donde B y C son dos constantes. El valor de B se obtiene multiplicando ambos
lados de (3.9) por el factor (s +a) y evaluando las expresiones resultantes en
s = a:
kA
s(s +a)
(s +a)

s=a
=
B
s +a
(s +a)

s=a
+
C
s
(s +a)

s=a
es decir:
B =
kA
s

s=a
=
kA
a
(3.10)
El valor de C se calcula multiplicando ambos lados de (3.9) por el factor s y
evaluando las expresiones resultantes en s = 0:
kA
s(s +a)
s

s=0
=
B
s +a
s

s=0
+
C
s
s

s=0
es decir:
C =
kA
s +a

s=0
=
kA
a
(3.11)
Sustituyendo (3.9), (3.10), (3.11) en (3.8) se tiene:
Y (s) =
kA
a
1
s +a
+
kA
a
1
s
+
y
0
s +a
(3.12)
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
L{e
t
} =
1
s
(3.13)
donde es cualquier constante real. Usando (3.13) se encuentra que la trans-
formada inversa de Laplace de (3.12) esta dada como:
y(t) =
kA
a
e
at
+
kA
a
+y
0
e
at
(3.14)
la cual constituye la solucion de (3.4).
3.1 Ecuacion diferencial de primer orden 101
Ejemplo 3.1 Para comprobar que (3.14) es la soluci on de (3.4) se procede
del siguiente modo. Primero se obtiene la derivada de y(t) =
kA
a
e
at
+
kA
a
+
y
0
e
at
, es decir:
y(t) = kAe
at
ay
0
e
at
y se sustituye y(t) e y(t) en (3.4) para obtener:
y(t) +ay(t) = kAe
at
ay
0
e
at
+a
_

kA
a
e
at
+
kA
a
+y
0
e
at
_
= kA = ku
porque en (3.7) se ha denido u = A. Esto signica que la expresi on para
y(t) presentada en (3.14) satisface a (3.4) y, por tanto, se ha comprobado que
(3.14) es la soluci on de (3.4). Este procedimiento debe seguirse para comprobar
la soluci on de cualquier ecuaci on diferencial.
La solucion dada en (3.14) se puede descomponer en dos partes:
y(t) = y
n
(t) +y
f
(t) (3.15)
y
n
(t) =
_

kA
a
+y
0
_
e
at
(3.16)
y
f
(t) =
kA
a
(3.17)
donde y
n
(t) y y
f
(t) reciben los nombres de respuesta natural y respuesta
forzada, respectivamente.
La respuesta forzada y
f
(t) recibe este nombre porque es debida unica-
mente a la presencia de la funcion del tiempo u. Por otro lado, la respuesta
natural y
n
(t) recibe dicho nombre porque esta determinada unicamente por la
estructura (o naturaleza) de la ecuacion diferencial, es decir, por los terminos
y+ay presentes en el lado izquierdo de (3.4). Todo esto se explica del siguiente
modo. Considere el procedimiento de solucion previo suponiendo por un mo-
mento que y
0
= 0. La expansion en fracciones parciales presentada en (3.9) y
la subsecuente aplicacion de la transformada inversa de Laplace muestran que
y(t) es obtenida como la suma de varias funciones del tiempo cuyas formas
dependen de las fracciones
1
s
y
1
s+a
. Notese que la presencia de la primera
de estas fracciones,
1
s
, en (3.9) es debida a que U(s) =
A
s
esta presente en
(3.8) lo cual, a su vez, se debe a que u = A donde A es una constante. Notese
que la respuesta forzada y
f
(t) es una constante que resulta del termino
kA
a
1
s
en (3.12), es decir, tiene su origen en la fraccion
1
s
. Esto conrma que y
f
(t)
depende unicamente de la funcion del tiempo u. Por otro lado, la presencia de
la fraccion
1
s+a
es debida a los terminos y+ay ya que L{ y+ay} = (s+a)Y (s).
De acuerdo a (3.13) esta fraccion da origen a la funcion e
at
que conforma a la
respuesta natural y
n
(t). Esto conrma que y
n
(t) esta determinada unicamente
por la estructura (o naturaleza) de la ecuacion diferencial. Una consecuencia
importante de este hecho es que y
n
(t) siempre estara dada en este ejemplo co-
mo una funcion de la forma e
at
sin importar cual sea el valor de u. El lector
102 3 Base matematica: ecuaciones diferenciales
puede repasar el procedimiento seguido para resolver la ecuacion diferencial y
darse cuenta que la condicion inicial y
0
siempre aparecera en la solucion y(t)
como parte de la respuesta natural y
n
(t).
Antes de continuar, un poco de nomenclatura. En sistemas de control y
y u se conocen como la salida y la entrada, respectivamente. El polinomio
que surge de aplicar la transformada de Laplace a la ecuacion diferencial, es
decir s + a que tiene su origen en L{ y + ay} = (s + a)Y (s), se conoce como
el polinomio caracterstico.
La solucion en (3.14) o, equivalentemente, en (3.15) puede tener uno de
los siguientes comportamientos.
1. Si a > 0, es decir si la raz del polinomio caracterstico s = a es negativa,
entonces lm
t
y
n
(t) = 0 y lm
t
y(t) = y
f
(t).
2. Si a < 0, es decir si la raz del polinomio caracterstico s = a es positiva,
entonces y
n
(t) y y(t) crecen sin lmite conforme el tiempo crece.
3. El caso en el que a = 0, es decir cuando la raz del polinomio caracterstico
esta en s = 0, no puede ser estudiado con las formulas desarrolladas
hasta aqu y se estudia como un caso especial en la siguiente seccion. Sin
embargo, con el n de presentar un resumen de todos los casos, aqu se
anticipa lo que se va a encontrar en la siguiente seccion. Cuando la raz
del polinomio caracterstico esta en s = a = 0, la respuesta natural
permanece constante y
n
(t) = y
0
, t 0 y la respuesta forzada es la
integral de la entrada y
f
(t) = k
_
t
0
u(t)dt.
Estudio graco de la solucion
En esta seccion se estudia la forma graca de la solucion en (3.15). De
acuerdo a lo que se acaba de estudiar, si a > 0 entonces la respuesta natu-
ral tiende a cero conforme el tiempo crece: lm
t
y
n
(t) = 0 y, por tanto,
para tiempos muy grandes la solucion de la ecuacion diferencial es igual a la
respuesta forzada unicamente: lm
t
y(t) = y
f
(t) =
kA
a
. Esto signica que
mientras mas rapido desaparezca la respuesta natural y
n
(t) (lo cual ocurre
conforme a > 0 es mayor) mas rapido la solucion completa y(t) alcanzara a
la respuesta forzada y
f
(t). Por tanto, se puede pensar que la respuesta na-
tural es el medio que permite que la solucion completa y(t) transite desde el
valor inicial y(0) = y
0
hasta la respuesta forzada y
f
(t). La existencia de tal
intermediario se justica recordando que la solucion de la ecuacion diferencial
ordinaria en (3.4), es decir y(t), es una funcion continua del tiempo. Esto sig-
nica que no pueden existir brincos discontinuos en y(t) y, por tanto, no se
puede saltar jamas desde el valor y(t) = y
0
a y(t) = y
f
(t) = y
0
en un intervalo
de tiempo de duracion cero.
En la gura 3.1 se muestra gracada la solucion en (3.15) cuando y
0
= 0
y a > 0, es decir:
y(t) =
kA
a
_
1 e
at
_
(3.18)
3.1 Ecuacion diferencial de primer orden 103
Se dene la constante de tiempo:
=
1
a
(3.19)
como una medida de la rapidez con la que desaparece la respuesta natural, es
decir, la rapidez con la que y(t) alcanza a la respuesta forzada y
f
(t). Mediante
sustitucion directa de (3.19) en (3.18), es sencillo comprobar que:
y() = 0.632
kA
a
(3.20)
Finalmente, es importante se nalar que y(t) crece sin lmite si a < 0. Si a = 0
entonces se tiene el caso estudiado en la seccion 3.2, es decir y(t) = kAt crece
sin lmite al aumentar el tiempo.

a
kA
a
kA
a
kA
0:632
a
kA
tiempo
y(t)
Figura 3.1. Estudio graco de y(t) en (3.18).
Funcion de transferencia
Suponga que la condicion inicial es cero, y
0
= 0, entonces (3.6) se puede
escribir como:
Y (s) =
k
s +a
U(s)
104 3 Base matematica: ecuaciones diferenciales
o tambien:
Y (s)
U(s)
= G(s) =
k
s +a
(3.21)
La funcion G(s) se conoce como la funcion de transferencia de la ecuacion
diferencial en (3.4). El polinomio que divide en G(s), es decir s +a, se conoce
como el polinomio caracterstico y sus races se conocen como los polos de
G(s). En este caso solo existe un polo en s = a. De acuerdo al estudio
previo se pueden hacer las siguientes armaciones en lo que se reere a la
salida y(t) de la funcion de transferencia G(s):
Si el polo ubicado en s = a es negativo (a > 0) entonces al crecer
el tiempo la respuesta natural y
n
(t) desaparece y la respuesta total y(t)
alcanza a la respuesta forzada y
f
(t). Si u(t) = A es una constante, entonces
y
f
(t) =
kA
a
.
La rapidez con la que y(t) alcanza a y
f
(t) (rapidez con la que y
n
(t) de-
saparece) es mayor conforme el polo en s = a esta colocado mas hacia
la izquierda del punto s = 0. Esta rapidez se puede cuanticar usando la
constante de tiempo =
1
a
. Una constante de tiempo grande implica una
respuesta lenta y una constante de tiempo peque na implica una respuesta
rapida.
Si k = a > 0 entonces se dice que la funcion de transferencia G(s) es
de ganancia unitaria en estado estacionario, porque si u(t) = A es una
constante entonces se puede usar el teorema del valor nal (3.3) para
encontrar que:
lm
t
y(t) = lm
s0
sY (s) = lm
s0
s
k
s +a
A
s
=
k
a
A = A (3.22)
En general, la ganancia en estado estacionario de la funcion de transferen-
cia en (3.21) se calcula como el cociente
k
a
.
Si el polo ubicado en s = a es positivo (a < 0) entonces al crecer el
tiempo la respuesta total y(t) crece sin lmite. Notese que esto implica que
el polo esta colocado en el lado derecho del plano s (vease la gura 3.2).
El caso cuando el polo esta ubicado en s = a = 0, no puede ser estudiado
con las formulas desarrolladas hasta aqu y se estudia como un caso especial
en la siguiente seccion. Sin embargo, de nuevo, con el n de presentar un
resumen de todos los casos aqu se anticipa lo que se va a encontrar en la
siguiente seccion. Cuando el polo esta ubicado en s = a = 0, la respuesta
natural no desaparece pero no crece sin lmite y la respuesta forzada es la
integral de la entrada y
f
(t) = k
_
t
0
u(t)dt.
Ejemplo 3.2 Suponga que se tiene un tanque que almacena un lquido incom-
presible como el agua (vease la gura 3.3). El tanque es de paredes paralelas,
es decir de secci on constante cuya area es representada por C. El lquido es
3.1 Ecuacion diferencial de primer orden 105
Re s ( )
Im s ( )
a a
a > 0 a < 0
0
Figura 3.2. Ubicacion de polos de la funcion de transferencia en (3.21). Es costum-
bre representar un polo en el plano s usando una cruz .
introducido al tanque a raz on de un ujo de entrada (en m
3
/s) representa-
do por q
i
. El lquido sale del tanque a traves de una v alvula de salida cuya
resistencia hidr aulica es R. La rapidez con la que sale el lquido del tanque
est a dada por el ujo de salida (en m
3
/s) el cual se representa por q
o
. El
nivel del agua dentro del tanque es h. El modelo matem atico que describe este
sistema se obtiene a partir de la Ley de Conservaci on de la Materia, ya que
al ser el agua incompresible esta ley puede ser expresada en terminos de la
masa o del volumen del agua. Suponga que durante un intervalo de tiempo de
duraci on t, entra un volumen de lquido V (entra) y sale un volumen de
lquido V (sale). La rapidez con la que se incrementa el volumen de lquido
en el tanque durante ese intervalo de tiempo se puede calcular como:
V (dentro del tanque)
t
=
V (entra)
t

V (sale)
t
(3.23)
Por otro lado, se tienen las siguientes relaciones:
V (dentro del tanque) = Ch
V (entra) = q
i
t
V (sale) = q
o
t
Sustituyendo en (3.23) y suponiendo peque nos incrementos tales que t dt,
h dh:
C
dh
dt
= q
i
q
o
(3.24)
Por otro lado, si el ujo a traves de la v alvula de salida es laminar, entonces
se cumple [1], p ag. 155:
q
o
=
h
R
(3.25)
Para entender el porque de esta expresi on considere los siguientes casos.
106 3 Base matematica: ecuaciones diferenciales
q
i
h
q
o
R
Figura 3.3. Sistema de nivel de lquido.
a) Suponga que la v alvula de salida se mantiene con la misma abertura,
es decir que R se mantiene constante. Ahora suponga que aumenta el nivel
de lquido en el tanque, es decir que h crece. La experiencia y la expresi on en
(3.25) nos indican que el ujo de salida q
o
aumenta bajo esta situaci on.
b) Suponga que se mantiene constante el nivel de lquido h, usando una
bomba hidr aulica para compensar exactamente el lquido que sale, y que se
cierra, poco a poco, la v alvula de salida, es decir que R aumenta. La experien-
cia y la expresi on en (3.25) indican que el ujo de salida q
o
disminuye bajo
esta situaci on.
Sustituyendo (3.25) en (3.24):
C
dh
dt
= q
i

h
R
Entonces, el modelo matem atico del sistema de nivel de la gura 3.3 queda
expresado como:
C
dh
dt
+
1
R
h = q
i
Dividiendo entre C, se puede expresar este modelo como la siguiente ecuaci on
diferencial ordinaria, lineal, de coecientes constantes, de primer orden:
dh
dt
+ah = kq
i
a =
1
RC
, k =
1
C
(3.26)
La raz on por la cual esta ecuaci on diferencial es el modelo de este sistema
de nivel de lquido es porque mediante su soluci on se puede conocer como
evoluciona el nivel h(t) en el tiempo, si se conocen el ujo del lquido que se
introduce q
i
(t), el area de la secci on del tanque C, si se tiene informaci on a
cerca de que tan grande es la abertura de la v avula de salida, es decir si se
conoce R, y si se conoce el nivel inicial.
3.1 Ecuacion diferencial de primer orden 107
Ejemplo 3.3 Considere el tanque que contiene agua mostrado en la gura
3.3. En el ejemplo 3.2 se encontr o que el modelo matem atico correspondiente
es:
dh
dt
+ah = kq
i
a =
1
RC
> 0, k =
1
C
(3.27)
N otese que esta ecuaci on diferencial se puede escribir como la ecuaci on en
(3.4) si se considera que y = h, u = q
i
y y
0
= h
0
. Esto signica que si q
i
= A,
entonces la soluci on h(t) tiene la misma forma que (3.14), es decir:
h(t) =
kA
a
e
at
+
kA
a
+h
0
e
at
, h
0
= h(0) (3.28)
A continuaci on se explica c omo la expresi on en (3.28) describe correctamente
la evoluaci on del nivel de lquido ante diferentes situaciones.
1. Suponga que el tanque est a inicialmente vaco (h
0
= 0) y que se empieza
a introducir lquido con un ujo constante de valor A > 0. De acuerdo a
lo anteriormente expuesto, el nivel del lquido en el tanque h(t) es descrito
gr acamente como en la gura 3.1 considerando que h(t) = y(t) (n otese
que a =
1
RC
> 0). A partir de esta gura y la soluci on en (3.28) se pueden
estudiar varios casos. Para comprobar que el comportamiento descrito en
(3.28) es correcto, el lector puede usar su experiencia previa para vericar
que lo descrito a continuaci on verdaderamente se observa en un dep osito
de agua:
Si A es mayor entonces el nivel nal alcanzado por el lquido h() =
kA
a
= RA tambien es mayor.
Si la v alvula de salida se ajusta a con una abertura menor (R mayor)
entonces el nivel nal alcanzado por el lquido lm
t
h(t) =
kA
a
= RA
es mayor.
El area de la secci on transversal del tanque no tiene efecto en el valor
nal del nivel alcanzado, es decir, el nivel nal es igual para un tanque
muy delgado y para uno muy grueso.
Si el producto RC es mayor, entonces a es menor, por lo que la res-
puesta es m as lenta, es decir, debe transcurrir m as tiempo para al-
canzar el nivel h() = 0.632
kA
a
= 0.632RA y, por tanto, el nivel nal
lm
t
h(t) =
kA
a
= RA. Esto se debe a que la funci on e
at
tiende
a cero m as lentamente cuando a =
1
RC
> 0 es menor. N otese que un
valor grande de RC puede obtenerse incrementando C (el area de la
secci on transversal del tanque), es decir usando un tanque m as grueso,
o disminuyendo la abertura de la v alvula de salida (aumentando R).
2. Suponga que no se introduce lquido al tanque, es decir, que q
i
(t) = A = 0
y que el tanque inicialmente contiene una cantidad determinada de agua,
es decir que h
0
> 0. A partir de la soluci on en (3.28) y usando la expe-
riencia del lector se puede vericar (vease la gura 3.4) que el nivel del
108 3 Base matematica: ecuaciones diferenciales
tanque decrece (n otese que a =
1
RC
> 0) hasta que el tanque se vaca
lm
t
h(t) = 0. Esto ocurre m as r apido si el producto RC es menor
(cuando a es mayor) y m as lentamente cuando RC es mayor (cuando a
es menor).
tiempo
h
0
h(t)
R
1
C
1
R
2
C
2
Figura 3.4. Comportamiento del nivel cuando h0 > 0 y qi(t) = A = 0 (R1C1 <
R2C2).
3. El caso cuando a < 0 no es posible en un sistema de nivel de lquido
porque C y R s olo pueden ser positivas (no existen areas de secciones
transversales negativas ni aberturas negativas). Sin embargo, la situaci on
en la que a < 0 ocurre con frecuencia en sistemas de control realimentados,
debido a la interconexi on de diversos componentes.
4. El caso cuando a = 0 se estudia a continuaci on.
3.2. Un integrador
Considere la siguiente ecuacion diferencial:
y = ku (3.29)
donde k es una constante real diferente de cero. Notese que esta ecuacion se
obtiene a partir de (3.4) cuando a = 0. Integrando directamente:
_
y(t)
y(0)
dy =
_
t
0
ku dt
y(t) = k
_
t
0
u(t) dt +y(0) (3.30)
3.2 Un integrador 109
y(t) = y
n
(t) +y
f
(t)
y
n
(t) = y(0), y
f
(t) = k
_
t
0
u(t) dt
En este caso y
n
(t) permanece constante cuando el tiempo crece. Notese que si
u = A es constante, entonces la respuesta forzada crece sin lmite y
f
(t) = kA t.
En la gura 3.5 se muestra gracada la solucion y(t) = y(0) + kA t, para los
casos a) y(0) = 0 y u = A =constante positiva, y b) y(0) = 0 y u = A = 0. A
los sistemas fsicos representados por este tipo de ecuacion diferencial se les
llama integradores porque, si y(0) = 0 la solucion y(t) (salida) es la integral
de la entrada u.
Ejemplo 3.4 Considere el tanque con agua mostrado en la gura 3.3. Su-
ponga que la v alvula de salida est a totalmente cerrada por lo que R .
Entonces, el modelo en (3.26) se reduce a:
dh
dt
= kq
i
porque a =
1
RC
0 cuando R . Entonces, la evoluci on del nivel en el
tiempo esta descrita por (3.30), es decir:
h(t) = h(0) +k
_
t
0
q
i
(t) dt
Por tanto, el sistema de nivel de lquido se comporta en este caso como un
integrador. Si q
i
= A > 0, entonces:
h(t) = h(0) +kAt (3.31)
Se puede hacer uso de la gura 3.5, haciendo h(t) = y(t) y q
i
(t) = u, para
apreciar gr acamente la soluci on en (3.31) en los casos i) h(0) > 0 y q
i
=
A =constante positiva, e ii) h(0) > 0 y q
i
= A = 0. N otese que el nivel
permanece constante si no se introduce lquido (cuando A = 0) y que el nivel
crece sin lmite cuando A > 0 es constante. El lector puede usar su experiencia
previa para comprobar que estas dos situaciones verdaderamente suceden en
un sistema de nivel de lquido real.
Ejemplo 3.5 La ecuaci on diferencial en (3.29) tambien puede resolverse
usando expansi on en fracciones parciales, es decir, usando el metodo de la
secci on 3.1. Usando (3.1) en (3.29) se obtiene:
sY (s) y
0
= k U(s)
Despejando Y (s) se puede escribir:
Y (s) =
k
s
U(s) +
1
s
y
0
(3.32)
110 3 Base matematica: ecuaciones diferenciales
0
0
kA
y(t)
y
0
tiempo
(a) y0 = 0 y u = A =constante positiva
tiempo
y(t)
y
0
(b) y0 = 0 y u = A = 0
Figura 3.5. Solucion de la ecuacion diferencial en (3.29).
Para continuar es necesario especicar la funci on del tiempo u. Suponga que:
u = A, U(s) =
A
s
donde A es una constante. Por tanto, ahora se puede escribir (3.32) como:
Y (s) =
kA
s
2
+
1
s
y
0
(3.33)
De acuerdo al metodo de expansi on en fracciones parciales [2], Cap. 4, [3],
Cap 7, se debe escribir:
3.2 Un integrador 111
kA
s
2
=
B
s
+
C
s
2
(3.34)
donde B y C son dos contantes. El valor de C se obtiene multiplicando ambos
lados de (3.34) por s
2
y evaluando en s = 0, es decir:
s
2
kA
s
2

s=0
=
B
s
s
2

s=0
+
C
s
2
s
2

s=0
De donde se obtiene que C = kA. Para calcular B se multiplican ambos lados
de (3.34) por s
2
, se deriva una vez respecto a s y se eval ua en s = 0:
d
ds
_
s
2
kA
s
2
_

s=0
=
d
ds
_
B
s
s
2
_

s=0
+
d
ds
_
C
s
2
s
2
_

s=0
De donde se obtiene que B = 0. Por tanto, usando estos valores y (3.34) se
puede escribir (3.33) como:
Y (s) =
kA
s
2
+
1
s
y
0
(3.35)
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
L{t} =
1
s
2
(3.36)
Usando (3.36) se encuentra que la transformada inversa de Laplace de (3.35)
est a dada como:
y(t) = kAt +y
0
(3.37)
la cual constituye la soluci on de (3.29). Esta soluci on se puede descomponer
en dos partes:
y(t) = y
n
(t) +y
f
(t) (3.38)
y
n
(t) = y
0
y
f
(t) = kAt
donde y
n
(t) y y
f
(t) reciben los nombres de respuesta natural y respuesta for-
zada, respectivamente.
Tal como se explic o en la secci on 3.1, la respuesta natural y
n
(t) recibe
dicho nombre porque est a determinada unicamente por la estructura (o natu-
raleza) de la ecuaci on diferencial, es decir, por la transformada de Laplace de
y presente en el lado izquierdo de (3.29). Esto da origen al termino
1
s
y
0
en
(3.35), lo cual permite tener y
n
(t) = y
0
en (3.38).
La respuesta forzada y
f
(t) es debida a la excitaci on (entrada) u = A.
Sin embargo, en este caso la respuesta forzada tambien recibe el efecto de la
transformada de Laplace del termino y presente en el lado izquierdo de (3.29),
pues ambos generan el termino
kA
s
2
, del cual se obtiene y
f
(t) = kAt.
112 3 Base matematica: ecuaciones diferenciales
El polinomio caracterstico de la ecuaci on diferencial en (3.29) es s y, por
tanto, s olo tiene una raz en s = 0. Por tanto, la funci on de transferencia
correspondiente G(s) (cuando y
0
= 0):
Y (s)
U(s)
= G(s) =
k
s
(3.39)
s olo tiene un polo en s = 0. N otese que la entrada U(s) =
A
s
tambien tiene
un polo en s = 0. La combinaci on de estos dos polos repetidos en (3.33)
produce una respuesta forzada de la forma y
f
(t) = kAt (un polinomio del
tiempo de primer grado), cuando la entrada es u = A (un polinomio del
tiempo de grado cero). N otese que la respuesta forzada correspondiente a la
ecuaci on diferencial en (3.4) tiene la forma y
f
(t) =
kA
a
(un polinomio del
tiempo de grado cero) cuando la entrada es u = A (un polinomio del tiempo
de grado cero). A partir de estos dos ejemplos se llega a la siguiente conclusi on
importante:
La respuesta forzada de una ecuaci on diferencial de primer orden excita-
da con una entrada constante, tambien ser a constante si el polinomio carac-
terstico no tiene races en s = 0.
En la gura 3.2 se muestra la ubicaci on en el plano s del polo de la funci on
de transferencia en (3.39), es decir, el polo en s = 0. El lector debe aprender a
relacionar la ubicaci on en el plano s de los polos de la funci on de transferencia
correspondiente con la forma en el tiempo de la soluci on y(t) correspondiente
(veanse los casos listados antes del ejemplo 3.2).
3.3. Ecuacion diferencial de segundo orden
Considere la siguiente ecuacion diferencial ordinaria, lineal, con coecientes
constantes, de segundo orden:
y + 2
n
y +
2
n
y = k
2
n
u, y(0) = y
0
, y(0) = y
0
(3.40)
donde
n
y k son constantes reales positivas. Supongase que u = A es una
constante. Usando (3.1) y U(s) = A/s se puede escribir:
s
2
Y (s) sy
0
y
0
+ 2
n
(sY (s) y
0
) +
2
n
Y (s) = k
2
n
U(s)
para obtener:
Y (s) = k

2
n
A
(s
2
+ 2
n
s +
2
n
)s
+
y
0
(s + 2
n
) + y
0
s
2
+ 2
n
s +
2
n
(3.41)
Suponga primero que las condiciones iniciales son cero y
0
= 0, y
0
= 0, enton-
ces:
Y (s) = k
A
2
n
(s
2
+ 2
n
s +
2
n
)s
3.3 Ecuacion diferencial de segundo orden 113
Suponga tambien que 0 < 1 es una constante real, entonces:
s
2
+ 2
n
s +
2
n
= (s a)(s a) (3.42)
a = +j
d
, a = j
d
, j =

d
=
n
_
1
2
> 0, =
n
0
Ahora, notese que:
s
2
+ 2
n
s +
2
n
= (s [ +j
d
])(s [ j
d
]) = (s )
2
+
2
d
De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4, [3], cap.
7, en este caso se debe escribir:
Y (s) = k
A
2
n
(s
2
+ 2
n
s +
2
n
)s
= k
A
2
n
[(s )
2
+
2
d
]s
=
Bs +C
(s )
2
+
2
d
+
D
s
(3.43)
donde B, C y D son constantes que deben ser calculadas. La transformada
inversa de (3.43) esta dada como:
y(t) = kA
_
1
e
nt
_
1
2
sin (
d
t +)
_
(3.44)
= arctan
_
1
2

Que constituye la solucion de (3.40) cuando las condiciones iniciales son cero
y
0
= 0, y
0
= 0. A continuacion se presenta el procedimiento detallado que se
utiliza para obtener (3.44) a partir de (3.43). El lector que no este interesado
en los detalles tecnicos de este procedimiento puede pasar directamente a la
ecuacion (3.49).
Multiplicando ambos miembros de (3.43) por el factor (s )
2
+
2
d
y
evaluando en s = a (vease (3.42)) se puede escribir:
k
A
2
n
[(s )
2
+
2
d
]s
[(s )
2
+
2
d
]

s=a
=
Bs +C
(s )
2
+
2
d
[(s )
2
+
2
d
]

s=a
+
D
s
[(s )
2
+
2
d
]

s=a
para obtener:
k
A
2
n
+j
d
= B( +j
d
) +C
Multiplicando el lado izquierdo por ( j
d
)/( j
d
):
kA
2
n
( j
d
)

2
+
2
d
= B +C +jB
d
114 3 Base matematica: ecuaciones diferenciales
Igualando partes imaginarias se tiene:
B =
kA
2
n

2
+
2
d
(3.45)
Igualando partes reales se tiene:
B +C =
kA
2
n

2
+
2
d
Sustituyendo (3.45):
C =
2kA
2
n

2
+
2
d
(3.46)
Usando (3.45) y (3.46) se puede escribir:
Bs +C
(s )
2
+
2
d
=

kA
2
n

2
+
2
d
s +
2kA
2
n

2
+
2
d
(s )
2
+
2
d
=
kA
2
n
(
2
+
2
d
)
(s )
[(s )
2
+
2
d
]
+
kA
2
n

(
2
+
2
d
)
1
[(s )
2
+
2
d
]
Usando las transformaciones inversas [4], cap. 32:
L
1
_
s
(s )
2
+
2
d
_
= e
t
cos(
d
t)
L
1
_

d
(s )
2
+
2
d
_
= e
t
sin(
d
t)
se obtiene:
L
1
_
Bs +C
(s )
2
+
2
d
_
=
kA
2
n

2
+
2
d
e
t
cos(
d
t) +
kA
2
n

d
(
2
+
2
d
)
e
t
sin(
d
t)
=
kA
2
n

2
+
2
d
e
t
[cos(
d
t) +

d
sin(
d
t)]
=
kA
2
n

2
+
2
d
e
t
[sin cos(
d
t) + cos sin(
d
t)]

d
_
2
+ 1
Notese que en el ultimo paso se han usado algunas relaciones de la gura
3.6(a). Por otro lado, se puede seguir reduciendo:
sin cos(
d
t) + cos sin(
d
t) =
1
2
[sin(
d
t) + sin( +
d
t)] +
+
1
2
[sin(
d
t ) + sin(
d
t +)]
= sin(
d
t +)
3.3 Ecuacion diferencial de segundo orden 115

1
=!
d
!
d

2
+
1
r
(a)

CO
CA
( )
( )
(b)
Figura 3.6. Relaciones importantes para el ejemplo de la seccion 3.3.
porque sin(x) = sin(x). Con esto se obtiene:
L
1
_
Bs +C
(s )
2
+
2
d
_
= kA
2
n
_
_

d
_
2
+ 1

2
+
2
d
e
t
sin(
d
t +)
Por otro lado, de la gura 3.6(a):
tan =
1
/
d
=
1
(
n
)/(
n
_
1
2
)
=
1

1
2
= + arctan
_
1
2

donde se ha tomado en consideracion el signo del cateto adyacente y del cateto


opuesto para determinar que representa un angulo en el tercer cuadrante
(ver gura 3.6(b)). Esto permite hacer la siguiente simplicacion [4], cap. 5:
sin(
d
t +) = sin (
d
t + +)
= sin (
d
t +)
= arctan
_
1
2

por lo que ahora se puede reescribir:


L
1
_
Bs +C
(s )
2
+
2
d
_
= kA
2
n
_
_

d
_
2
+ 1

2
+
2
d
e
t
sin (
d
t +)
= kA
2
n
_

2
+
2
d

d
(
2
+
2
d
)
e
t
sin (
d
t +)
= kA
2
n
1

d
_

2
+
2
d
e
t
sin (
d
t +)
116 3 Base matematica: ecuaciones diferenciales
L
1
_
Bs +C
(s )
2
+
2
d
_
= kA
1
_
1
2
e
t
sin (
d
t +) (3.47)
donde se ha usado =
n
y
d
=
n
_
1
2
. Por otro lado, el valor de
D en (3.43) se obtiene facilmente multiplicando ambos miembros de dicha
expresion por el factor s y evaluando en s = 0:
D =
kA
2
n
s
2
+ 2
n
s +
2
n

s=0
= kA (3.48)
Usando (3.43), (3.47) y (3.48) se encuentra la solucion buscada:
y(t) = kA
_
1
e
nt
_
1
2
sin (
d
t +)
_
Si ahora se considera que las condiciones iniciales no son cero entonces:
y(t) = kA
_
1
e
nt
_
1
2
sin (
d
t +)
_
+p(t) (3.49)
donde:
p(t) = L
1
_
y
0
(s + 2
n
) + y
0
s
2
+ 2
n
s +
2
n
_
(3.50)
La transformacion inversa de Laplace que dene a p(t) puede ser obtenida
usando un procedimiento similar al que se acaba de mostrar. Mas a un, el
lector puede darse cuenta que p(t) esta dada por una funcion de la forma
presentada en (3.47) y que su coeciente depende de y
0
y y
0
.
La solucion dada en (3.44) se puede descomponer en dos partes:
y(t) = y
n
(t) +y
f
(t) (3.51)
y
n
(t) = kA
e
nt
_
1
2
sin (
d
t +) (3.52)
y
f
(t) = kA (3.53)
donde y
n
(t) y y
f
(t) constituyen la respuesta natural y la respuesta forzada,
respectivamente. Notese que de acuerdo a (3.43) y (3.47), la respuesta natural
en (3.52) es debida unicamente a la estructura (o naturaleza) de la ecuacion
diferencial pues depende del polinomio caracterstico s
2
+ 2
n
s +
2
n
= (s
)
2
+
2
d
que resulta de aplicar la transformada de la Laplace al termino
y + 2
n
y +
2
n
y. As que sin importar cual sea el valor de u, la respuesta
natural y
n
(t) tendra la forma presentada en (3.52). Por otro lado, notese que
la respuesta forzada en (3.53) debe su origen al termino D/s en (3.43) el
cual, a su vez, es introducido por la presencia de la funcion constante u = A,
3.3 Ecuacion diferencial de segundo orden 117
ya que U(s) = A/s. Notese que de acuerdo al parrafo que sigue a (3.50),
cuando las condiciones iniciales son diferentes de cero estas solo afectan a la
respuesta natural en el sentido de que su coeciente se vera afectado por las
condiciones iniciales y
0
y y
0
, pero la forma de la funcion del tiempo siempre
sera e
nt
sin (
d
t +). De hecho, p(t) forma parte de la respuesta natural
cuando las condiciones iniciales son diferentes de cero.
El lector puede revisar el procedimiento presentado despues de (3.44) para
comprobar que en el caso en que 1 < < 0 con k y
n
positivos, la solucion
en (3.51) o, equivalentemente, en (3.44) se transforma en:
y(t) = y
n
(t) +y
f
(t) (3.54)
y
n
(t) = kA
e
nt
_
1
2
sin
_

d
t arctan
_
_
1
2
abs()
__
y
f
(t) = kA
donde abs() representa la funcion valor absoluto.
Utilizando (3.51) cuando 0 < 1 y (3.54) cuando 1 < < 0 se
concluye que la solucion de la ecuacion diferencial en (3.40) tiene uno de los
siguientes comportamientos.
1. Si 0 < < 1, es decir si las dos races del polinomio caracterstico, ubi-
cadas en s =
n
j
d
, tienen parte real negativa
n
< 0, entonces
lm
t
y
n
(t) = 0 y lm
t
y(t) = y
f
(t).
2. Si 1 < < 0, es decir si las dos races del polinomio caracterstico,
ubicadas en s =
n
j
d
, tienen parte real positiva
n
> 0, entonces
y
n
(t) y y(t) crecen sin lmite, de manera oscilatoria, conforme el tiempo
crece.
3. Si = 0, es decir si las dos races del polinomio caracterstico, ubicadas
en s =
n
j
d
, tienen parte real cero
n
= 0, entonces de (3.51)
se obtiene:
y(t) = y
n
(t) +y
f
(t) (3.55)
y
n
(t) = kAcos(
n
t), y
f
(t) = kA
cuando las condiciones iniciales son cero, es decir, y
n
(t) es una funcion
oscilatoria cuya amplitud no aumenta pero tampoco disminuye. Esto sig-
nica que aunque y(t) no crece sin lmite, sin embargo no alcanzara de
manera permanente a la respuesta forzada y
f
(t).
4. El comportamiento obtenido cuando esta fuera del rango 1 < < 1 es
estudiado en las secciones que siguen bajo los casos en los que las races
del polinomio caracterstico son reales y repetidas o reales y diferentes.
Finalmente, notese que de acuerdo a lo anteriormente expuesto y a (3.49),
(3.50), la solucion de una ecuacion diferencial de segundo orden puede pre-
sentar oscilaciones sostenidas ( = 0) a un cuando la entrada o excitacion sea
cero (u = 0) si las condiciones iniciales son diferentes de cero. Esto explica el
118 3 Base matematica: ecuaciones diferenciales
funcionamiento de los circuitos osciladores presentados en el captulo 8 (vease
el ultimo parrafo de la seccion 8.3.1).
Estudio graco de la solucion
A continuacion se estudia de manera graca la solucion presentada en
(3.51) para la ecuacion diferencial en (3.40). Recuerdese que se supone que
0 < 1, que
n
, k son constantes positivas y que las condiciones iniciales
son cero y
0
= 0, y
0
= 0. Notese que la respuesta natural tiende a cero conforme
el tiempo crece si 0 < < 1:
lm
t
y
n
(t) = lm
t
_
kA
e
nt
_
1
2
sin (
d
t +)
_
= 0 (3.56)
porque
n
> 0. Recuerdese tambien que en el caso en que las condiciones
iniciales no son cero, la respuesta natural tambien tiende a cero al crecer
el tiempo. Por tanto, para tiempos muy grandes la solucion de la ecuacion
diferencial es igual a la respuesta forzada unicamente:
lm
t
y(t) = y
f
(t) = kA (3.57)
Esto signica que mientras mas rapido desaparezca la respuesta natural y
n
(t)
(lo cual ocurre conforme el producto
n
> 0 es mayor) mas rapido la solucion
completa y(t) alcanzara a la respuesta forzada y
f
(t). Tal como se menciono pa-
ra las ecuaciones diferenciales de primer orden, la respuesta natural permite
que la respuesta total y(t) transite de manera continua desde el valor dictado
por las condiciones iniciales (iguales a cero en este caso) hasta la respuesta
forzada y
f
(t).
Dos caractersticas importantes de la respuesta en (3.51) son el tiempo de
subida t
r
y el sobre paso M
p
, las cuales se indican en la gura 3.7. La manera
de medir el sobre paso es mediante la expresion:
M
p
( %) =
y
p
y
f
y
f
100 (3.58)
donde y
f
= kA representa la respuesta forzada. Recuerdese que se supone que
y
0
= y
0
= 0. A partir del analisis detallado de la expresion en (3.51) se puede
demostrar que [1], pag. 232:
t
r
=
1

d
_
arctan
_
_
1
2

__
(3.59)
M
p
( %) = 100 e

1
2

En las guras 3.8 y 3.9 se muestra como se ve afectada la solucion en (3.51)


cuando los parametros y
n
cambian. Notese que el sobre paso M
p
es afec-
tado exclusivamente por mientras que el tiempo de subida t
r
es afectado
principalmente por
n
, aunque tambien tiene un peque no efecto sobre t
r
.
3.3 Ecuacion diferencial de segundo orden 119
t
r
y
f
y
p
tiempo
y(t)
Figura 3.7. Caractersticas de y(t) en (3.51).
Finalmente, es importante se nalar que cuando u = A = 0 pero alguna de
las condiciones iniciales y
0
o y
0
es diferente de cero, la forma de la respuesta
y(t) es como la funcion del tiempo en (3.52) y su aspecto graco es como
la parte oscilatoria sin la componente constante (alrededor de y = 0) en
cualquiera de las guras 3.7, 3.8 o 3.9. Esto es debido a la funcion p(t) que
aparece en (3.49).
Funcion de transferencia
Suponga que las condiciones iniciales son y
0
= 0, y
0
= 0, entonces (3.41)
se puede escribir como:
Y (s) =
k
2
n
s
2
+ 2
n
s +
2
n
U(s) (3.60)
o tambien:
Y (s)
U(s)
= G(s) =
k
2
n
s
2
+ 2
n
s +
2
n
(3.61)
donde G(s) es la funcion de transferencia de la ecuacion diferencial en (3.40).
Notese que G(s) denida en (3.61) tiene un polinomio caracterstico (polino-
mio en el denominador) de segundo grado por lo que G(s) tiene dos polos
120 3 Base matematica: ecuaciones diferenciales
= 0
0:1
0:2
0:3
0:4
0:5
0:6
0:7
1:0
2:0
tiempo
y(t)
kA
2kA
Figura 3.8. Efecto sobre la solucion en (3.51) al usar diferentes valores de . El
valor de n permanece constante.
(races del polinomio caracterstico). Por tanto, G(s) es una funcion de trans-
ferencia de segundo orden. De acuerdo a (3.42) estos polos estan ubicados en
s = a y en s = a, donde:
a = +j
d
, a = j
d
Es importante subrayar que estos polos son complejos conjugados solo bajo la
suposicion de que 1 < < 1. El lector puede vericar que los polos son reales
si no satisface la condicion anterior. Ese caso es estudiado en las secciones
que siguen.
De acuerdo al estudio realizado en las secciones previas se pueden hacer
las siguientes armaciones en lo que se reere a la salida y(t) de la funcion de
transferencia G(s):
Si los polos tienen parte real negativa =
n
< 0, es decir > 0,
entonces al crecer el tiempo la respuesta natural y
n
(t) desaparece y la
respuesta total y(t) alcanza a la respuesta forzada y
f
(t). Cuando la entrada
es una constante u(t) = A, entonces la respuesta forzada es y
f
(t) = kA.
La rapidez con la que y
n
(t) desaparece es mayor conforme el producto
n
es mayor. En la gura 3.10 se muestra como la respuesta del sistema de
segundo orden permanece envuelta por dos funciones exponenciales cuya
rapidez de decaimiento esta determinada por el producto
n
.
3.3 Ecuacion diferencial de segundo orden 121
y(t)
tiempo
kA
!
n1
!
n2
!
n3
Figura 3.9. Efecto sobre la solucion en (3.51) al usar diferentes valores de n:
n2 = 2n1, n3 = 3n1. El valor de permanece constante.
tiempo
kA
y(t)
kA 1 +
1
2
p
e
!nt

kA 1
1
2
p
e
!nt

Figura 3.10. Envoltura exponencial de la respuesta de un sistema de segundo orden
ante una entrada constante cuando las condiciones iniciales son cero.
122 3 Base matematica: ecuaciones diferenciales
El tiempo de subida t
r
disminuye si se incrementa
n
. Esto se puede
comprobar al observar que si
n
aumenta entonces, de acuerdo a (3.42),

d
aumenta y, de acuerdo a (3.59), t
r
disminuye.
El sobre paso M
p
disminuye si aumenta.
De acuerdo a la gura 3.11: i) el tiempo de subida t
r
disminuye conforme
los polos complejos conjugados estan mas alejados de s = 0 porque
n
crece
(vease (3.59) junto con
d
=
n
_
1
2
), ii) el parametro aumenta (y
por tanto, el sobre paso M
p
disminuye) conforme la ubicacion de los polos
complejos conjugados forma un angulo mayor porque = sin(), iii) la
rapidez con la que y
n
(t) desaparece es mayor conforme los polos complejos
conjugados estan ubicados mas hacia la izquierda del punto s = 0 porque
el producto
n
es mayor.
Si k = 1 entonces se dice que la funcion de transferencia G(s) es de ganan-
cia unitaria en estado estacionario, porque cuando u = A es una constante
se puede usar el teorema del valor nal (3.3) para encontrar que:
lm
t
y(t) = lm
s0
sY (s) = lm
s0
s
k
2
n
s
2
+ 2
n
s +
2
n
A
s
=
k
2
n

2
n
A = A(3.62)
La constante k representa la ganancia en estado estacionario de la funcion
!
n

!
n
Re s ( )
Im s ( )
j!
d
Figura 3.11. Uno de los polos de G(s) en (3.61) cuando 0 < < 1.
de transferencia en (3.61).
Si 1 < < 0 entonces la parte real de los polos =
n
es positiva por
lo que la respuesta total y(t) crece sin lmite al crecer el tiempo. Notese
que esto implica que los polos complejos conjugados se encuentran en el
lado derecho del plano s.
El coeciente recibe el nombre de factor de amortiguamiento porque es
el que determina que tan oscilatoria es la respuesta y(t) (vease (3.59), para
el sobre paso, y la gura 3.8).
3.3 Ecuacion diferencial de segundo orden 123
La constante
d
se conoce como la frecuencia natural amortiguada porque,
de acuerdo a lo visto previamente (vease (3.51)),
d
es la frecuencia de
oscilacion de y(t) cuando el amortiguamiento es diferente de cero. Notese
que la frecuencia de oscilacion
d
es la parte imaginaria de los polos de la
funcion de transferencia en (3.61) (vease (3.42)).
La constante
n
se conoce como la frecuencia natural no amortiguada
porque, de acuerdo a (3.51) y (3.55),
n
es la frecuencia de oscilacion de
la respuesta cuando el amortiguamiento es cero.
Ejemplo 3.6 Considere el sistema masa-resorte-amortiguador mostrado en
la gura 3.12. En el ejemplo 2.3 de la secci on 2.6 en el captulo 2 se mues-
tra que la posici on x del carrito est a determinada por la siguiente ecuaci on
diferencial de segundo orden:
m x = Kx b x +f (3.63)
donde K es la constante de rigidez del resorte, b es el coeciente de fricci on
viscosa del amortiguador, m es la masa del carrito y f es una fuerza externa.
La expresi on en (3.63) se puede escribir como:
x +
b
m
x +
K
m
x =
1
m
f
lo cual, a su vez, se puede escribir como la expresi on en (3.40):
x + 2
n
x +
2
n
x = k
2
n
f (3.64)
2
n
=
b
m
,
2
n
=
K
m
, k =
1
K
donde x juega el papel de la salida y mientras que f juega el papel de la entrada
u. Por tanto, x(t) tiene la forma mostrada para y(t) en (3.51) si 0 < 1
cuando las condiciones iniciales son cero. N otese que todas las constantes
en (3.63) son positivas: la masa m, el coeciente de fricci on viscosa b y la
constante de rigidez del resorte K s olo pueden ser positivas. De acuerdo a
(3.64), el factor de amortiguamiento est a dado como:
=
b
2

mK
(3.65)
Por tanto, si se aplica una fuerza constante f = A se pueden usar los resul-
tados en las guras 3.7, 3.8 y 3.9 para concluir lo siguiente.
Si no hay fricci on, es decir si b = 0, entonces = 0 y el carrito osci-
lar a permanentemente alrededor de la posici on x
f
= kA =
1
K
A. En el
caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de las
condiciones iniciales x
0
o x
0
sea diferente de cero, entonces el carrito tam-
bien oscilar a permanentemente pero alrededor de la posici on x = 0, como
lo describe la funci on p(t) que aparece en (3.49).
124 3 Base matematica: ecuaciones diferenciales
Si la fricci on b > 0 se incrementa poco a poco, entonces > 0 tambien
se incrementa y el carrito oscilar a cada vez menos veces porque el sistema
masa-resorte-amortiguador estar a cada vez m as amortiguado (cuando =
1 el sistema tiene dos races reales repetidas y ya no presenta oscilaciones,
como se ve en las secciones siguientes). En todos estos casos, cuando el
carrito deje de oscilar se detendr a en la posici on x = x
f
= kA =
1
K
A. En
el caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de
las condiciones iniciales x
0
o x
0
sea diferente de cero, entonces el carrito
tambien oscilar a cada vez menos (conforme > 0 se aproxima a 1) y
se detendr a en la posici on x = 0. De nuevo, esto est a descrito por la
funci on p(t) que aparece en (3.49). N otese que de acuerdo a (3.65) el
amortiguamiento tambien aumenta si decrece la masa m o la constante
de rigidez del resorte K. Para entender la raz on de esto considerese el
caso contrario: valores mayores de m y K producen fuerzas m as grandes
(m x para la masa y Kx para el resorte) que, por tanto, pueden vencer con
mayor facilidad a la fuerza de fricci on (b x) y por ello el movimiento puede
permanecer durante m as tiempo.
Debido a que el tiempo de subida t
r
depende inversamente de la frecuencia
natural no amortiguada
n
=
_
K
m
, entonces un resorte m as rgido (con
una K mayor) o una masa m as peque na producen respuestas m as r api-
das (t
r
menores). Por otro lado, el hecho que la frecuencia de oscilaci on
este dada por
d
=
n
_
1
2
con
n
=
_
K
m
es el principio mediante el
cual se ajusta la cadencia o ritmo de un reloj mec anico mediante el uso de
un sistema masa-resorte-amortiguador oscilatorio: si el reloj se atrasa
hay que aumentar su frecuencia de oscilaci on (ritmo o cadencia), lo cual
se consigue tensando m as el resorte para aumentar K. Se hace lo contrario
si el reloj se adelanta.
El caso cuando 1 < < 0 no es posible en este ejemplo porque todas las
constantes b, m y K son positivas. Sin embargo, la situaci on en la que 1 <
< 0 ocurre con frecuencia en sistemas de control realimentados, debido a la
interconexi on de diversos componentes.
m
K
b
f
x
Figura 3.12. Sistema masa-resorte-amortiguador.
3.4 Races reales diferentes 125
3.4. Races reales diferentes
Considere la siguiente ecuacion diferencial ordinaria, lineal, con coecientes
constantes de orden n:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = ku (3.66)
donde los coecientes a
i
, i = 0, . . . , n 1, son constantes reales e y
(j)
=
d
j
y
dt
j
.
Aplicando la transformada de Laplace (3.1) a (3.66) se obtiene:
s
n
Y (s) +a
n1
s
n1
Y (s) + +a
1
sY (s) +a
0
Y (s) +P(s) = kU(s)
donde P(s) es un polinomio de s cuyos coecientes dependen de las condiciones
iniciales y(0), y(0),...,y
(n1)
(0) y de los coecientes de la ecuacion diferencial.
Entonces puede escribirse:
Y (s) =
k
s
n
+a
n1
s
n1
+ +a
1
s +a
0
U(s)
P(s)
s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga que u(t) = A es una constante, es decir U(s) = A/s. Entonces:
Y (s) =
k
N(s)
A
s

P(s)
N(s)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nica que P(s) = 0 y se puede escribir:
Y (s) =
k
N(s)
A
s
Suponga que N(s) solo tiene races reales, distintas entre s y, ademas, distintas
de s = 0, es decir:
N(s) = (s p
1
)(s p
2
) (s p
n
)
donde p
i
= 0, i = 1, . . . , n, con p
j
= p
i
si i = j, representan las races de
N(s). De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4,
[3], cap. 7, en este caso se debe escribir:
Y (s) =
k
N(s)
A
s
=
c
1
s p
1
+
c
2
s p
2
+ +
c
n
s p
n
+
f
s
(3.67)
donde c
i
, i = 1, . . . , n, y f representan constantes reales que deben ser calcula-
das. Una manera de calcular c
i
es la siguiente. Multiplquense ambos miembros
de (3.67) por el factor (s p
i
) y eval uese toda la expresion en s = p
i
para
obtener:
126 3 Base matematica: ecuaciones diferenciales
c
i
=
k
N(s)
A
s
(s p
i
)

s=pi
, i = 1, . . . , n
De manera similar se puede calcular:
f =
kA
N(s)

s=0
Usando la transformacion inversa de Laplace, [4], cap.32:
L
1
_
k
s a
_
= ke
at
se obtiene nalmente:
y(t) = c
1
e
p1t
+c
2
e
p2t
+ +c
n
e
pnt
+f
que representa la solucion buscada. Notese que se puede escribir:
y(t) = y
n
(t) +y
f
(t)
y
n
(t) = c
1
e
p1t
+c
2
e
p2t
+ +c
n
e
pnt
(3.68)
y
f
(t) = f
donde la respuesta natural y
n
(t) solo depende de las races del polinomio
caracterstico N(s) mientras que la respuesta forzada y
f
(t) solo depende de
la fraccion
1
s
introducida por U(s). Considerense las siguientes posibilidades.
1. Si todas las races del polinomio caracterstico N(s) son negativas, es
decir si p
i
< 0 para toda i = 1, . . . , n, entonces lm
t
y
n
(t) = 0 y
lm
t
y(t) = y
f
(t).
2. Si al menos una raz del polinomio caracterstico N(s) es positiva, es decir
si p
i
> 0 para alguna i, entonces, y
n
(t) y y(t) , conforme
t .
Por ultimo, si las condiciones iniciales no son cero, entonces la solucion tiene
la forma:
y(t) = c
1
e
p1t
+c
2
e
p2t
+ +c
n
e
pnt
+f +q(t)
donde:
q(t) = L
1
_

P(s)
N(s)
_
(3.69)
La transformacion inversa de Laplace que dene a q(t) puede ser obtenida
usando un procedimiento similar al que se acaba de mostrar. Mas a un, el
lector puede darse cuenta de que q(t) esta dada por una funcion de la forma
presentada para y
n
(t) en (3.68) y que sus coecientes dependen de las condi-
ciones iniciales y(0) . . . , y
(n1)
(0). Esto signica que si y
n
(t) en (3.68)
entonces q(t) tambien y si y
n
(t) 0 en (3.68) entonces q(t) 0 tam-
bien. De hecho, q(t) forma parte de la respuesta natural cuando las condiciones
iniciales no son cero.
3.4 Races reales diferentes 127
Ejemplo 3.7 Considere la siguiente ecuaci on diferencial de segundo orden
dada en (3.40):
y + 2
n
y +
2
n
y = k
2
n
u, y(0) = y
0
, y(0) = y
0
(3.70)
Si > 1 entonces las dos races, p
1
y p
2
, del polinomio caracterstico N(s) =
s
2
+ 2
n
s +
2
n
son reales y diferentes:
p
1
=
n
+
n
_

2
1
p
2
=
n

n
_

2
1
p
1
= p
2
Adem as, ambas races son negativas:
p
1
< 0, p
2
< 0
Aunque esto es obvio para p
2
, para p
1
se requiere un poco de observaci on: n ote-
se que
n
+
n
_

2
= 0, y como
n
+
n
_

2
>
n
+
n
_

2
1,
entonces
n
+
n
_

2
1 < 0. En la gura 3.13 se muestra la soluci on
y(t) de la ecuaci on diferencial en (3.70) cuando > 1, u = A y las condicio-
nes iniciales son cero. N otese que y(t) no presenta oscilaciones en este caso.
Recuerdese que cuando 1 < < 1 la frecuencia de oscilaci on es igual a la
parte imaginaria de ambas races. Por tanto, cuando > 1 no hay oscilaci on
porque al ser cero la parte imaginaria de ambas races, la frecuencia de las
oscilaciones tambien es cero.
Ejemplo 3.8 Considerese de nuevo el sistema masa-resorte-amortiguador
del ejemplo 3.6. Recuerdese que (3.64) describe el movimiento del carrito.
Suponga que:
=
b
2

mK
> 1
Entonces, de acuerdo al ejemplo anterior, las races, p
1
y p
2
, del polinomio
caracterstico s
2
+ 2
n
s +
2
n
son reales, distintas y negativas. N otese que
este caso se presenta cuando el coeciente de fricci on viscosa b > 0 es muy
grande o bien cuando la constante de rigidez del resorte K > 0 o la masa
m del carrito son muy peque nas. N otese tambien que una de las races (p
1
=

n
+
n
_

2
1 < 0) se aproxima al origen conforme > 1 se hace m as
grande. De acuerdo a lo expuesto en la presente secci on, esto signica que
el movimiento del carrito es cada vez m as lento conforme crece porque la
funci on e
p1t
tarda m as tiempo en desaparecer (a pesar de que la funci on e
p2t
desaparece m as r apido porque p
2
=
n

n
_

2
1 < 0 se aleja cada vez
m as del origen). Esto explica porque en la gura 3.13 se obtienen respuestas
cada vez m as lentas conforme > 1 es m as grande.
128 3 Base matematica: ecuaciones diferenciales
tiempo
y(t)
kA
> 1
= 1
0 < < 1
(a) Respuesta en el tiempo
!
n
Re s ( )
Im s ( )

p
1
p
2
(b) Ubicacion de los polos cuando > 1
Figura 3.13. Solucion de una ecuacion diferencial de segundo orden en (3.70),
cuando > 1, y en (3.75), cuando = 1, con u = A y las condiciones iniciales son
cero.
Ejemplo 3.9 Considere la siguiente ecuaci on:
y +c y +dy = eu, y(0) = y
0
, y(0) = y
0
con c, d y e constantes reales. Las dos races, p
1
y p
2
, del polinomio carac-
terstico N(s) = s
2
+cs +d est an dadas como:
p
1
=
c
2
+

c
2
4d
2
p
2
=
c
2

c
2
4d
2
3.5 Races reales repetidas 129
Se tienen los siguientes casos:
Si d < 0 entonces:
p
1
=
c
2
+
_
c
2
+ 4 abs(d)
2
p
2
=
c
2

_
c
2
+ 4 abs(d)
2
las dos races son reales y diferentes siendo una positiva y otra negativa,
sin importar el valor de c. En el ejemplo 7.3 del captulo 7 se muestra que
este caso corresponde al de un sistema masa-resorte-amortiguador con co-
eciente de rigidez negativo y que esto se obtiene en la pr actica cuando un
pendulo simple funciona alrededor de su conguraci on invertida (tambien
llamada inestable).
Si c > 0 y d > 0 se recupera el caso estudiado en la secci on 3.3 cuando
1 > > 0 y en la presente secci on cuando > 1.
Si c < 0 y d > 0, con abs(c) peque no y d grande, se recupera el caso
estudiado en la secci on 3.3 cuando 1 < < 0. La situaci on cuando
< 1 tambien se obtiene en este caso cuando abs(c) es grande y d es
peque no, pero las dos races son positivas y diferentes:
p
1
=
n
+
n
_

2
1 > 0
p
2
=
n

n
_

2
1 > 0
p
1
= p
2
Los casos = 1 y = 1 se estudian en la siguiente secci on.
3.5. Races reales repetidas
Considere la siguiente ecuacion diferencial ordinaria, lineal, con coecientes
constantes de orden n:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = ku (3.71)
donde u(t) = A es una constante, es decir U(s) = A/s. Procediendo como en
la seccion 3.4 se obtiene:
Y (s) =
k
N(s)
A
s

P(s)
N(s)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P(s) = 0, entonces:
Y (s) =
k
N(s)
A
s
130 3 Base matematica: ecuaciones diferenciales
Suponga que N(s) solo tiene una raz la cual esta repetida n veces y que es
diferente de cero, es decir:
N(s) = (s p)
n
con p = 0. De acuerdo al metodo de expansion en fracciones parciales [2], cap.
4, [3], cap. 7, en este caso se debe escribir:
k
N(s)
A
s
=
c
n
(s p)
n
+
c
n1
(s p)
n1
+
c
n2
(s p)
n2
+ +
c
2
(s p)
2
+
c
1
s p
+
f
s
(3.72)
donde c
i
, i = 1, . . . , n, y f representan constantes reales que deben ser calcu-
ladas. Una manera de calcular c
n
es multiplicando ambos miembros de (3.72)
por el factor (s p)
n
y evaluando en s = p para obtener:
c
n
=
kA
p
Por otro lado, las constantes c
i
, i = 1, . . . , n 1, se pueden calcular multipli-
cando ambos miembros de (3.72) por el factor (s p)
n
, derivando n i veces
respecto a s y evaluando en s = p para obtener:
c
i
=
d
ni
ds
ni
_
kA
s
_

s=p
, i = 1, . . . , n 1
Finalmente, la constante f se puede calcular multiplicando ambos miembros
de (3.72) por el factor s y evaluando en s = 0 para obtener:
f =
kA
N(s)

s=0
Entonces, se puede escribir:
Y (s) =
c
n
(s p)
n
+
c
n1
(s p)
n1
+
c
n2
(s p)
n2
+ +
c
2
(s p)
2
+
c
1
s p
+
f
s
Usando la transformacion inversa de Laplace [4], cap. 32:
L
1
_
1
(s a)
j
_
=
t
j1
(j 1)!
e
at
, j = 1, 2, 3, . . . , 0! = 1
se obtiene nalmente:
y(t) = c
n
t
n1
(n 1)!
e
pt
+c
n1
t
n2
(n 2)!
e
pt
+c
n2
t
n3
(n 3)!
e
pt
+
+ c
2
t e
pt
+c
1
e
pt
+f
3.5 Races reales repetidas 131
que representa la solucion buscada. Notese que se puede escribir:
y(t) = y
n
(t) +y
f
(t)
y
n
(t) = c
n
t
n1
(n 1)!
e
pt
+c
n1
t
n2
(n 2)!
e
pt
+c
n2
t
n3
(n 3)!
e
pt
+
+c
2
t e
pt
+c
1
e
pt
(3.73)
y
f
(t) = f
Observese de nuevo que y
n
(t) solo depende de las races del polinomio ca-
racterstico N(s) y que y
f
(t) solo depende de la fraccion
1
s
introducida por
U(s). Finalmente, si las condiciones iniciales son diferentes de cero entonces
la solucion esta dada como:
y(t) = c
n
t
n1
(n 1)!
e
pt
+c
n1
t
n2
(n 2)!
e
pt
+c
n2
t
n3
(n 3)!
e
pt
+
+ c
2
t e
pt
+c
1
e
pt
+f +q(t)
q(t) = L
1
_

P(s)
N(s)
_
donde q(t) es una funcion del tiempo cuya forma es identica a la de y
n
(t)
en (3.73) y cuyos coecientes dependen de las condiciones iniciales. De hecho,
q(t) forma parte de la respuesta natural en el caso en que las condiciones
iniciales son diferentes de cero.
Considerense las siguientes posibilidades:
1. Si p < 0 es de utilidad calcular el siguiente lmite, donde j es cualquier
n umero entero positivo:
lm
t
t
j
e
pt
= lm
t
t
j
e
pt
lo cual da una indeterminacion porque pt +. Entonces puede usarse
la regla de LHopital [13], pag. 303:
lm
t
t
j
e
pt
= lm
t
t
j
e
pt
= lm
t
dt
j
dt
de
pt
dt
= lm
t
j t
j1
p e
pt
Como se sigue obteniendo una indeterminacion se puede aplicar LHopital
de nuevo varias veces hasta obtener:
lm
t
t
j
e
pt
= lm
t
t
j
e
pt
= lm
t
dt
j
dt
de
pt
dt
= lm
t
j t
j1
p e
pt
= lm
t
j(j 1) t
j2
(p)
2
e
pt
= = lm
t
j!
(p)
j
e
pt
= 0
Aplicando esto a la solucion obtenida se concluye que lm
t
y
n
(t) = 0,
lm
t
y(t) = y
f
(t) para cualquier valor p < 0 sin importar que tan
cercano a cero este dicho valor.
132 3 Base matematica: ecuaciones diferenciales
2. Si p > 0 es claro que y
n
(t) y y(t) conforme t .
3. Por ultimo, para considerar el caso en el que el polinomio caracterstico
tiene n races repetidas en p = 0 suponga que U(s) = 0. Por tanto:
Y (s) =
P(s)
N(s)
, N(s) = s
n
Entonces, de acuerdo al metodo de expansion en fracciones parciales [2],
cap 4, [3], cap. 7, en este caso se debe escribir:

P(s)
s
n
=
c
n
s
n
+
c
n1
s
n1
+
c
n2
s
n2
+ +
c
2
s
2
+
c
1
s
Usando la transformada de Laplace [4], cap.32:
L
1
_
1
s
j
_
=
t
j1
(j 1)!
, j = 1, 2, 3, . . . , 0! = 1
se obtiene:
y(t) = y
n
(t) = c
n
t
n1
(n 1)!
+c
n1
t
n2
(n 2)!
+c
n2
t
n3
(n 3)!
+
+c
2
t +c
1
(3.74)
y
f
(t) = 0
Es claro que y
n
(t) y y(t) cuando t para n 2 y que
y
n
(t) es una constante si n = 1. Notese que en el caso en que U(s) = A/s,
y
n
(t) contendra, ademas de los terminos en (3.74), el termino t
n
mientras
que y
f
(t) estara dada como:
y
f
(t) =
_
t
0

_
t
0
. .
n integrales
A dt
n
. . . dt
1
. .
n diferenciales
=
kA
n!
t
n
Ejemplo 3.10 Considere la siguiente ecuaci on diferencial de segundo orden
dada en (3.40):
y + 2
n
y +
2
n
y = k
2
n
u, y(0) = y
0
, y(0) = y
0
(3.75)
Si = 1 entonces las dos races, p
1
y p
2
, del polinomio caracterstico N(s) =
s
2
+ 2
n
s +
2
n
son reales, negativas e iguales:
p
1
= p
2
=
n
En la gura 3.13 se muestra la soluci on y(t) de la ecuaci on diferencial en
(3.75) cuando = 1, u = A y las condiciones iniciales son cero. N otese que
y(t) no presenta oscilaciones en este caso porque ambas races tienen parte
imaginaria igual a cero. Este caso, = 1, representa la frontera entre una
soluci on oscilatoria < 1 y una soluci on que no oscila > 1. De hecho el
caso = 1 produce la respuesta m as r apida sin que haya oscilaciones ya que
cuando > 1 la respuesta es cada vez m as lenta conforme crece.
3.5 Races reales repetidas 133
Ejemplo 3.11 Considerese de nuevo el sistema masa-resorte-amortiguador
del ejemplo 3.6. Recuerdese que (3.64) describe el movimiento del carrito.
Suponga que:
=
b
2

mK
= 1
Entonces, en este caso el polinomio caracterstico s
2
+ 2
n
s +
2
n
s olo tiene
una raz real y negativa:
p =
n
la cual est a repetida dos veces. La posici on x(t) del carrito evoluciona exac-
tamente de la misma forma en que lo hace y(t) en la gura 3.13. Este tipo
de respuesta puede ser de mucha utilidad si se desea que el movimiento del
carrito sea r apido y sin oscilaciones.
Ejemplo 3.12 Suponga que en la gura 3.12 no existe ning un resorte ni
amortiguador, es decir, suponiendo que b = 0 y K = 0 la ecuaci on (3.63) se
reduce a:
m x = f (3.76)
N otese que el polinomio caracterstico es en este caso s
2
el cual tiene una
raz real p = 0 repetida dos veces. Ahora suponga que todas las condiciones
iniciales son cero y que el carrito recibe una peque na perturbaci on descrita
por:
f =
_

0
, 0 t t
1
0, en otro caso
(3.77)
donde
0
> 0 y t
1
> 0 son n umeros constantes peque nos. Integrando (3.76)
una vez se obtiene:
x(t) =
1
m
_
t
0
f()d + x(0)
Integrando de nuevo se tiene (suponiendo que x(0) = 0):
x(t) =
1
m
_
t
0
__
r
0
f()d
_
dr +x(0)
x(t) =
1
m
_
t
0
__
r
0
f()d
_
dr, x(0) = 0
Sustituyendo (3.77) se obtiene:
x(t) =
_
1
2m

0
t
2
, 0 t t
1
1
2m

0
t
2
1
+
1
m

0
t
1
(t t
1
), t > t
1
134 3 Base matematica: ecuaciones diferenciales
N otese que x(t) conforme t (vease la gura 3.14) a pesar de que
f = 0 para t > t
1
, es decir, a pesar de que la respuesta forzada es cero para
todo t > t
1
. Esto signica que la respuesta natural x
n
(t) cuando t ,
lo cual conrma los resultados obtenidos en la presente secci on para races
reales iguales a cero que est an repetidas dos veces o m as. El lector puede
recurrir a su experiencia para vericar que un peque no golpe (f en (3.77))
sobre el carrito es suciente para que este empiece a moverse para nunca
detenerse (x(t) ) si no existe fricci on entre el carrito y el piso.
t s [ ] t
1
x(t)
2m
"
0
t
2
m
"
0
t
1
Figura 3.14. Posicion del carrito de la gura 3.12 cuando es perturbado y no existe
ning un resorte ni amortiguador.
Ejemplo 3.13 Considere la siguiente ecuaci on diferencial de segundo orden
dada en (3.40):
y + 2
n
y +
2
n
y = k
2
n
u, y(0) = y
0
, y(0) = y
0
Si = 1 entonces las dos races, p
1
y p
2
, del polinomio caracterstico N(s) =
s
2
+ 2
n
s +
2
n
son reales, positivas e iguales:
p
1
= p
2
=
n
> 0
3.6. Races complejas conjugadas diferentes
Considere la siguiente ecuacion diferencial ordinaria, lineal, con coecientes
constantes de orden n:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = ku (3.78)
donde u(t) = A es una constante, es decir U(s) = A/s. Procediendo como en
la seccion 3.4 se obtiene:
3.6 Races complejas conjugadas diferentes 135
Y (s) =
k
N(s)
A
s

P(s)
N(s)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P(s) = 0, entonces:
Y (s) =
k
N(s)
A
s
Suponga que N(s) tiene n/2 races complejas conjugadas diferentes, es decir:
N(s) =
i=n/2

i=1
[(s
i
)
2
+
2
di
]
donde
i
=
j
o
di
=
dj
si i = j. Entonces, de acuerdo al metodo de
expansion en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe
escribir:
k
N(s)
A
s
=
i=n/2

i=1
F
i
s +C
i
[(s
i
)
2
+
2
di
]
+
f
s
donde f es una constante que se puede calcular como en las secciones previas,
es decir:
f =
kA
N(s)

s=0
mientras que F
i
y C
i
son constantes que pueden calcularse del mismo modo
en que se calculan B y C en la seccion 3.3. Por tanto, usando (3.47) se puede
escribir:
y(t) = y
n
(t) +y
f
(t) (3.79)
y
n
(t) =
i=n/2

i=1

i
e
init
sin (
di
t +
i
)
y
f
(t) = f
donde
i
,
ni
,
i
y
i
, i = 1, . . . , n/2, son constantes reales (vease la seccion
3.3). El comportamiento de la solucion en (3.79) satisface uno de los siguientes
casos.
1. Si 0 <
i
< 1 para toda i = 1, . . . , n/2, es decir si la parte real de to-
das las races del polinomio caracterstico N(s) es estrictamente negativa,

ni
< 0 para toda i = 1, . . . , n/2, entonces y(t) oscila de manera que
lm
t
y
n
(t) = 0 y lm
t
y(t) = y
f
(t).
136 3 Base matematica: ecuaciones diferenciales
2. Si 1 <
i
< 0 para alguna i = 1, . . . , n/2, es decir si la parte real de
alguna de las races del polinomio caracterstico N(s) es estrictamente
positiva,
i

ni
> 0 para alguna i = 1, . . . , n/2, entonces y(t) oscila de
manera que y
n
(t) y y(t) crecen sin lmite conforme el tiempo aumenta.
3. Si
i
= 0 para toda i = 1, . . . , n/2, es decir si la parte real de todas las
races del polinomio caracterstico N(s) es cero,
i

ni
= 0 para toda
i = 1, . . . , n/2, entonces y
n
(t) no desaparece al crecer el tiempo pero
tampoco crece sin lmite. Por tanto, aunque y(t) no crece sin lmite, sin
embargo no converge a y
f
(t). Notese que para que esta situacion ocurra
es suciente que
i
= 0 para al menos una i y que para todas las demas i
se cumpla 0 <
i
< 1.
Finalmente, si las condiciones iniciales son diferentes de cero, entonces:
y(t) = y
n
(t) +y
f
(t) +q(t)
y
n
(t) =
i=n/2

i=1

i
e
init
sin (
di
t +
i
)
y
f
(t) = f
donde:
q(t) = L
1
_

P(s)
N(s)
_
Es sencillo vericar que q(t) esta dado por funciones de la misma forma que
las funciones que componen a y
n
(t). De hecho q(t) forma parte de la respuesta
natural cuando las condiciones iniciales son diferentes de cero.
Es importante se nalar que si 1 o 1 entonces se obtienen races
reales y se recupera uno de los casos de las secciones 3.4 o 3.5.
Es conveniente aclarar que se asume que las races complejas siempre apa-
recen con sus parejas conjugadas debido a que esa es la unica manera en
que el producto (s a)(s a), con a un n umero complejo y a su conjugado,
resulte en un polinomio cuyos coecientes son todos n umeros reales. Enton-
ces, cualquier polinomio que contenga races complejas y tambien sus parejas
conjugadas solo tendra coecientes reales. Este es un aspecto importante en
ingeniera de control donde las ecuaciones diferenciales representan sistemas
fsicos que, por tanto, solo manejan variables y parametros reales. Por ejemplo,
el polinomio caracterstico del sistema masa-resorte-amortiguador presentado
en (3.64) esta dado como s
2
+
b
m
s +
K
m
donde los coecientes representan la
masa, el coeciente de friccion viscosa y la constante de rigidez del resorte.
Es claro que ninguno de estos parametros pueden tener parte imaginaria pues
representan propiedades cuyos efectos pueden ser apreciados experimental-
mente.
Ejemplo 3.14 En el ejemplo 2.5 del captulo 2 se ha obtenido el modelo
matem atico del sistema compuesto por dos cuerpos y tres resortes mostrado
3.6 Races complejas conjugadas diferentes 137
en la gura 3.15. A partir de ese resultado se puede abordar el caso en el que
el resorte de la izquierda no est a presente. Esto se consigue considerando que
K
1
= 0, es decir:
x
1
+
b
m
1
( x
1
x
2
) +
K
2
m
1
(x
1
x
2
) =
1
m
1
F(t)
x
2

b
m
2
( x
1
x
2
) +
K
3
m
2
x
2

K
2
m
2
(x
1
x
2
) = 0
m
2
m
1
K
1
x
1
b
x
2 K
2
K
3
F(t)
Figura 3.15. Sistema con dos cuerpos y tres resortes.
Aplicando la transformada de Laplace (3.1) a cada una de estas ecuaciones
diferenciales y considerando todas las condiciones iniciales iguales a cero se
obtiene:
X
1
(s) =
1
m1
F(s) +
_
b
m1
s +
K2
m1
_
X
2
(s)
s
2
+
b
m1
s +
K2
m1
X
2
(s) =
_
b
m2
s +
K2
m2
_
X
1
(s)
s
2
+
b
m2
s +
K2+K3
m2
Sustituyendo la segunda ecuaci on en la primera y despues de realizar algunas
manipulaciones algebraicas se obtiene:
X
1
(s) =
1
m1
_
s
2
+
b
m2
s +
K2+K3
m2
_
F(s)
_
s
2
+
b
m1
s +
K2
m1
__
s
2
+
b
m2
s +
K2+K3
m2
_

_
b
m1
s +
K2
m1
__
b
m2
s +
K2
m2
_
Con el fn de simplicar el algebra correspondiente, supongamos que b = 0,
entonces:
X
1
(s) =
1
m1
_
s
2
+
K2+K3
m2
_
_
s
2
+
K2
m1
__
s
2
+
K2+K3
m2
_

K
2
2
m1m2
F(s)
o, equivalentemente:
138 3 Base matematica: ecuaciones diferenciales
X
1
(s) =
1
m1
_
s
2
+
K2+K3
m2
_
s
4
+
_
K2
m1
+
K2+K3
m2
_
s
2
+
K2K3
m1m2
F(s) (3.80)
Por otro lado, n otese que si se multiplican dos polinomios de segundo orden
con coecientes reales a, d, c, e, se obtiene:
(s
2
+as +c)(s
2
+ds +e) = s
4
+ (a +d)s
3
+ (c +ad +e)s
2
+ (cd +ea)s +ce
Esto signica que la siguiente simplicaci on:
(s
2
+as +c)(s
2
+ds +e) = s
4
+ (c +ad +e)s
2
+ce (3.81)
es posible si y s olo si:
a +d = 0 y cd +ea = 0 (3.82)
La primera condici on implica que a = d lo cual, sustituido en la segunda
condici on, implica que d(ce) = 0. Por tanto, la igualdad en (3.81) es posible
si y s olo si ocurre una de las siguientes posibilidades: i) d = a = 0, ii)
c = e = 0, a = d, o bien, iii) d = a = e = c = 0. La raz on de estudiar la
igualdad en (3.81) es el poder determinar c omo se puede descomponer en dos
factores el polinomio en el denominador de (3.80). En este sentido, n otese
que la situaci on en iii) no es de interes porque en tal caso s olo aparecera el
termino de s
4
en el lado derecho de (3.81). Por otro lado, cuando es aplicado
al polinomio en el denominador de (3.80), el caso en ii) implica que:
2e a
2
=
K
2
m
1
+
K
2
+K
3
m
2
e =
_
K
2
K
3
m
1
m
2
Combinando ambas expresiones se obtiene:
a
2
= 2
_
K
2
K
3
m
1
m
2

_
K
2
m
1
+
K
3
m
2
_

K
2
m
2
< 0 (3.83)
La raz on para la desigualdad al nal de esta expresi on es que, por denici on,
el siguiente binomio al cuadrado siempre es positivo o cero:
_
_
K
2
m
1

_
K
3
m
2
_
2
=
K
2
m
1
+
K
3
m
2
2
_
K
2
K
3
m
1
m
2
0
Por tanto, de acuerdo a (3.83), el valor de a sera un n umero imaginario.
Este caso debe desecharse porque viola la hip otesis inicial de que todos los
coecientes a, d, c, e, deben ser reales (vease tambien el p arrafo previo a este
3.6 Races complejas conjugadas diferentes 139
ejemplo). Entonces, el unico caso posible es i) d = a = 0, el cual, cuando es
aplicado al polinomio en el denominador de (3.80), implica:
c +e =
K
2
m
1
+
K
2
+K
3
m
2
(3.84)
ce =
K
2
K
3
m
1
m
2
(3.85)
Deniendo f =
K2
m1
+
K2+K3
m2
y g =
K2K3
m1m2
se tiene, de la segunda expresi on,
c = g/e y, sustituyendo en la primera expresi on, g/e + e = f. Finalmente,
multiplicando este resultado por e se obtiene:
e
2
ef +g = 0
Es interesante observar que, siguiendo el mismo procedimiento, se encuentra
que la misma ecuaci on es v alida para c:
c
2
cf +g = 0
Resolviendo estas ecuaciones cuadr aticas se encuentran las siguientes dos so-
luciones:
e
1
= c
1
=
K2
m1
+
K2+K3
m2
+
_
_
K2
m1

K2+K3
m2
_
2
+
4K
2
2
m1m2
2
e
2
= c
2
=
K2
m1
+
K2+K3
m2

_
_
K2
m1

K2+K3
m2
_
2
+
4K
2
2
m1m2
2
N otese que el caso e = c no es posible porque entonces (3.84) y (3.85) impli-
caran que:
K
2
m
1
+
K
2
+K
3
m
2
= 2
_
K
2
K
3
m
1
m
2
lo cual conducira a:
_
_
K
2
m
1

_
K
3
m
2
_
2
=
K
2
m
2
que no es posible porque el miembro izquierdo de esta expresi on no puede ser
negativo. De este modo, s olo son posibles los casos: a) e = e
1
y c = c
2
o, b)
e = e
2
y c = c
1
, los cuales son equivalentes porque, debido a que d = a = 0,
(3.80) se puede escribir como:
X
1
(s) =
1
m1
_
s
2
+
K2+K3
m2
_
(s
2
+c)(s
2
+e)
F(s) (3.86)
140 3 Base matematica: ecuaciones diferenciales
Por otro lado, es claro que
K2
m1
+
K2+K3
m2
+
_
_
K2
m1

K2+K3
m2
_
2
= 2
K2
m1
, lo
cual asegura que e
1
= c
1
> 0. Observese, sin embargo, que aunque
K2
m1
+
K2+K3
m2

_
_
K2
m1

K2+K3
m2
_
2
= 2
K2+K3
m2
> 0 esto no asegura que e
2
= c
2
> 0
por el termino adicional
4K
2
2
m1m2
dentro del radical. Este problema se resuelve
recurriendo a (3.85): los valores de e y c deben tener el mismo signo porque
el miembro derecho de (3.85) es positivo. Entonces, ambos e y c deben ser
positivos porque de acuerdo a los unicos casos posibles a) y b) se debe usar
e = e
1
> 0 (lo cual fuerza que c = c
2
> 0) o c = c
1
> 0 (lo cual fuerza
que e = e
2
> 0). Finalmente, el razonamiento al principio de este p arrafo
tambien muestra que, a excepci on de algunos posibles valores muy especiales
para m
1
, m
2
, K
2
, K
3
, ambos e
1
= c
1
y e
2
= c
2
, son diferentes de
K2+K3
m2
. Esto
asegura que no existen cancelaciones entre los polinomios del numerador y
del denominador en (3.86) y el hecho de que e y c sean positivos y diferentes
asegura que el polinomio caracterstico de (3.86) tiene dos pares de races
complejas (imaginarias puras) conjugadas diferentes.
3.7. Races complejas conjugadas repetidas
Considere la siguiente ecuacion diferencial ordinaria, lineal, con coecientes
constantes de orden n:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = ku (3.87)
donde u(t) = A es una constante, es decir U(s) = A/s. Procediendo como en
la seccion 3.4 se obtiene:
Y (s) =
k
N(s)
A
s

P(s)
N(s)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P(s) = 0, entonces:
Y (s) =
k
N(s)
A
s
Suponga que el polinomio caracterstico N(s) tiene dos races complejas con-
jugadas repetidas n/2 veces (para tener un total de n races):
N(s) = (s
2
+ 2
n
s +
2
n
)
n/2
= [(s )
2
+
2
d
]
n/2
Entonces, la expansion en fracciones parciales correspondiente a este caso es
[2], cap. 4:
3.7 Races complejas conjugadas repetidas 141
k
N(s)
A
s
=
F
1
s +C
1
[(s )
2
+
2
d
]
n/2
+
F
2
s +C
2
[(s )
2
+
2
d
]
n/21
+
+
F
n/21
s +C
n/21
[(s )
2
+
2
d
]
2
+
F
n/2
s +C
n/2
(s )
2
+
2
d
+
f
s
En el caso de races reales se encontro que cuando estas son sencillas intro-
ducen terminos de la forma e
pt
donde p es la raz en cuestion. Cuando dicha
raz es repetida j veces, se encontro que los terminos introducidos se transfor-
man en la forma t
j1
e
pt
. En el caso de races complejas conjugadas repetidas
ocurre algo similar. En este caso no se hara una demostracion formal de lo
que sigue debido a la complejidad del tema. Solo se presenta la idea intuitiva
de la solucion para comprender el porque de la forma obtenida.
Usando la transformacion inversa obtenida en (3.47) se encontro que una
raz compleja conjugada no repetida (sencilla) introduce en el tiempo un termi-
no de la forma:
L
1
_
Bs +C
(s )
2
+
2
d
_
= e
t
sin(
d
t +)
para algunas constantes y . Entonces y(t), formada por el efecto de races
complejas conjugadas repetidas, tiene la forma:
y(t) = y
n
(t) +y
f
(t) (3.88)
y
n
(t) =
n/2
t
n/21
e
t
sin(
d
t +
n/2
) +
n/21
t
n/22
e
t
sin(
d
t +
n/21
)
+ +
2
te
t
sin(
d
t +
2
) +
1
e
t
sin(
d
t +
1
)
y
f
(t) = f
La solucion en (3.88) tiene uno de los siguientes comportamientos.
1. Si la raz compleja conjugada tiene parte real positiva =
n
> 0, es
decir si 1 < < 0, es facil ver que y
n
(t) y y(t) conforme
t .
2. Si la raz compleja conjugada tiene parte real negativa =
n
< 0, es
decir si 0 < < 1, se puede proceder como en la seccion 3.5 para calcular
el siguiente lmite:
lm
t
t
j
e
t
sin(
d
t +) = 0
para cualquier entero j positivo y cualquier n umero real estrictamente
negativo . Entonces, para races complejas conjugadas, repetidas, con
parte real negativa se tiene que lm
t
y
n
(t) = 0 y lm
t
y(t) = y
f
(t).
3. Si la raz repetida tiene parte real cero, es decir, = 0. Entonces:
y(t) = y
n
(t) +y
f
(t)
y
n
(t) =
n/2
t
n/21
sin(
d
t +
n/2
) +
n/21
t
n/22
sin(
d
t +
n/21
) +
+
2
t sin(
d
t +
2
) +
1
sin(
d
t +
1
)
y
f
(t) = f
142 3 Base matematica: ecuaciones diferenciales
Notese que en este caso la respuesta natural, y
n
(t), crece sin lmite confor-
me el tiempo crece en el caso en que la raz se repita al menos dos veces.
Pero si la raz es sencilla entonces y
n
(t) esta formada por una funcion os-
cilatoria cuya amplitud no crece ni disminuye, es decir, aunque y(t) nunca
alcanzara de manera permanente a y
f
(t) la solucion y(t) permanece sin
crecer demasiado.
Finalmente, es sencillo vericar que si las condiciones iniciales no son cero
entonces:
y(t) = y
n
(t) +y
f
(t) +q(t)
y
n
(t) =
n/2
t
n/21
e
t
sin(
d
t +
n/2
) +
n/21
t
n/22
e
t
sin(
d
t +
n/21
)
+ +
2
te
t
sin(
d
t +
2
) +
1
e
t
sin(
d
t +
1
)
y
f
(t) = f
donde:
q(t) = L
1
_

P(s)
N(s)
_
La funcion q(t) esta dada por las mismas funciones que componen a y
n
(t) y
las tres posibilidades enumeradas previamente tambien siguen vigentes en este
caso. De hecho q(t) forma parte de la respuesta natural cuando las condiciones
iniciales son diferentes de cero.
Ejemplo 3.15 (Tomado de [2], cap. 4)Considere el sistema masa-resorte
mostrado en la gura 3.12. Suponga que no existe ning un amortiguador, es
decir que b = 0, y que se aplica una fuerza externa con la forma f = F
0
sin(t)
donde =
_
K
m
. Se desea describir la posici on del carrito x(t) si x(0) = 0
y x(0) = 0. No es necesario calcular el valor numerico de las constantes que
aparecen en x(t).
Soluci on. La ecuaci on diferencial que describe la situaci on en la gura 3.12
cuando b = 0 es:
m x +Kx = f, f = F
0
sin(t), =
_
K
m
(3.89)
Aplicando la transformada de Laplace a (3.89):
s
2
X(s) +
K
m
X(s) =
1
m
F(s)
N otese que esta expresi on tiene la forma:
s
2
X(s) +
2
n
X(s) =
2
n
F(s)
donde
n
=
_
K
m
= , =
1
K
. Se sabe que:
3.7 Races complejas conjugadas repetidas 143
F(s) =
F
0

s
2
+
2
Entonces:
X(s) =

3
F
0
(s
2
+
2
)
2
Expandiendo en fracciones parciales:
X(s) =
As +B
(s
2
+
2
)
2
+
Cs +D
s
2
+
2
Por tanto, de acuerdo a lo expuesto en la presente secci on, se puede escribir:
x(t) =
1
t sin(t +
1
) +
2
sin(t +
2
)
Donde
1
,
2
,
1
,
2
son algunas constantes reales. En la gura 3.16 se mues-
tra una gr aca de x(t) cuando =
_
K
m
= 10[rad/s], m = 1[Kg] y F
0
= 1[N].
A este fen omeno se le conoce como resonancia y signica que aunque la
entrada es acotada la salida puede alcanzar valores muy grandes a pesar de
que el polinomio caracterstico no tiene races con parte real positiva ni repe-
tidas en s = 0, por lo que este es un fen omeno diferente al que se presenta en
el ejemplo 3.12. N otese que el problema de la resonancia aparece cuando un
sistema (ecuaci on diferencial) est a mal amortiguado ( 0) y se excita con
una se nal oscilatoria cuya frecuencia es igual (o muy cercana) a la frecuencia
natural del sistema. Debido a que la posici on del carrito crece sin lmite la
resonancia es un fen omeno que se considera peligroso.
0 2 4 6 8 10 12 14 16 18 20
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
t s [ ]
x m [ ]
Figura 3.16. Posicion de un sistema masa-resorte sometido a condiciones de reso-
nancia.
144 3 Base matematica: ecuaciones diferenciales
3.8. Una ecuacion diferencial general
Una ecuacion diferencial ordinaria, lineal, con coecientes constantes de
orden n siempre puede escribirse como:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = b
0
u +b
1
u + +b
m
u
(m)
(3.90)
donde n m. Si n < m la ecuacion diferencial no tiene sentido fsico, es
decir, en la practica no existe ning un dispositivo real que este representado
por dicha ecuacion diferencial y, por tanto, no es de interes para los ingenie-
ros. Notese que todas las derivadas que aparecen son con respecto al tiempo.
Esta caracterstica permite llamar a estas ecuaciones diferenciales sistemas
dinamicos. La funcion y es la incognita de la ecuacion mientras que u es una
funcion del tiempo conocida que tambien es llamada excitacion. El objetivo
de resolver la ecuacion diferencial es encontrar la funcion y(t) que satisfaga la
igualdad denida por la ecuacion diferencial. Para encontrar y(t) es necesario
conocer u(t), las constantes reales a
i
, i = 0, . . . , n 1, b
j
, j = 0, . . . , m, y el
conjunto de n constantes y(0), y(0) ... y
(n1)
(0), conocidas como condiciones
iniciales del problema, que representan los valores que la funcion incognita y
sus derivadas tienen en t = 0.
Aplicando la transformada de Laplace (3.1) a (3.90):
s
n
Y (s) +a
n1
s
n1
Y (s) + + a
1
sY (s) +a
0
Y (s) +P(s)
= b
0
U(s) +b
1
sU(s) + +b
m
s
m
U(s)
donde P(s) es un polinomio de s cuyos coecientes dependen de las condiciones
iniciales y(0), y(0),...,y
(n1)
(0), u(0), u(0),...,u
(m1)
(0) y los coecientes de la
ecuacion diferencial. Entonces se puede escribir:
Y (s) =
b
0
+b
1
s + +b
m
s
m
s
n
+a
n1
s
n1
+ +a
1
s +a
0
U(s)
P(s)
s
n
+a
n1
s
n1
+ +a
1
s +a
0
Suponga que u(t) = A es una constante, es decir U(s) = A/s. Entonces:
Y (s) =
B(s)
N(s)
A
s

P(s)
N(s)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
B(s) = b
0
+b
1
s + +b
m
s
m
Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nica que P(s) = 0 y se puede escribir:
Y (s) =
B(s)
N(s)
A
s
De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4, [3], cap.
7, la solucion en el tiempo y(t) depende de las races del polinomio carac-
terstico N(s), es decir, de los polos de la siguiente funcion de transferencia:
3.8 Una ecuacion diferencial general 145
Y (s)
U(s)
= G(s) =
B(s)
N(s)
(3.91)
y del factor
1
s
introducido por U(s) = A/s. La variable y(t) se conoce como
la salida y u(t) como la entrada de la funcion de transferencia G(s). El orden
de G(s) se dene como el grado del polinomio caracterstico N(s). Como un
polinomio de grado n tiene n races, entonces una funcion de transferencia de
orden n tiene n polos (vease el parrafo que sigue a (3.21)). Por otro lado, las
races del polinomio B(s) se conocen como los ceros de la funcion de transfe-
rencia G(s). Si B(s) es de grado m entonces G(s) tiene m ceros. Recuerdese
la condicion n m impuesta al principio de esta seccion. En las secciones
previas se ha visto que siempre se puede escribir y(t) = y
n
(t) + y
f
(t) y que
el efecto de las condiciones iniciales siempre se pueden considerar como parte
de y
n
(t). Tambien se ha visto que y
n
(t) depende de la naturaleza de las races
del polinomio caracterstico N(s), es decir, si son reales, sencillas o repetidas,
si son complejas conjugadas, sencillas o repetidas y si tienen parte real nega-
tiva, positiva o cero. Si y
n
(t) tiende a cero conforme el tiempo crece se dice
que la ecuacion diferencial en (3.90) o, equivalentemente, que la funcion de
transferencia G(s) es estable. Resumiendo todos los casos estudiados en las
secciones anteriores ahora se puede armar lo siguiente:
Condiciones para la estabilidad de una funcion de transferencia
1. Si todos los polos de G(s) tienen parte real estrictamente negativa entonces
G(s) es estable.
2. Si todos los polos de G(s) tienen parte real estrictamente negativa a ex-
cepcion de algunos polos sencillos (no repetidos) que tienen parte real cero
entonces la funcion de transferencia G(s) es marginalmente estable. Esto
signica que aunque y
n
(t) no desaparece al crecer el tiempo sin embargo
tampoco crece sin lmite.
3. Si al menos un polo de G(s) tiene parte real estrictamente positiva en-
tonces la funcion de transferencia G(s) es inestable, es decir, y
n
(t) crece
hasta el innito conforme el tiempo crece.
4. Si existe al menos un polo de G(s) con parte real cero que esta repetido
al menos dos veces entonces G(s) es inestable.
Por otro lado, tambien se ha visto que y
f
(t) depende de la entrada u(t) y
que, de hecho, ambas tienen la misma forma si el polinomio caracterstico
no tiene races en s = 0 (si G(s) no tiene polos en s = 0). Esto signica que
en un sistema de control la variable u(t) puede ser usada como el valor que
se desea que alcance la salida y(t), es decir, u(t) puede ser usada para espe-
cicar el valor deseado de y(t). Esto se consigue de la siguiente manera. Si la
funcion de transferencia es estable (es decir, y
n
(t) 0) entonces y(t) y
f
(t)
y, por tanto, solo resta asegurar que y
f
(t) = u. A continuacion se establecen
las condiciones para cumplir esto en el caso en que u = A es una constante.
146 3 Base matematica: ecuaciones diferenciales
Condiciones que aseguran que lm
t
y(t) = A.
La respuesta total y(t) alcanza a la salida deseada u = A conforme el tiem-
po crece, es decir y
f
(t) = A y y
n
(t) 0, si G(s) es estable y los coecientes
de los terminos independientes de los polinomios B(s) y N(s) son iguales, es
decir, si B(0) = N(0). Esto se comprueba usando el teorema del valor nal
(3.3):
lm
t
y(t) = lm
s0
sY (s) = lm
s0
s
B(s)
N(s)
A
s
=
B(0)
N(0)
A = A (3.92)
Bajo estas condiciones se dice que G(s) es una funcion de transferencia de
ganancia unitaria en estado estacionario. Cuando u no es una constante y
se desea que lm
t
y(t) = u(t), tambien se requiere que G(s) sea estable,
y
n
(t) 0, pero algunas condiciones adicionales deben ser satisfechas. La
determinacion de estas condiciones y la manera de satisfacerlas es parte de lo
que se estudia en los captulos restantes de esta obra (vease la seccion 4.4).
Ejemplo 3.16 Considere la situaci on presentada en el ejemplo 3.12. A partir
de ese ejemplo se puede establecer un experimento que nos permite saber si un
sistema, ecuaci on diferencial o funci on de transferencia es estable o inestable:
Si se perturba ligeramente a un sistema que originalmente est a en reposo
puede haber dos comportamientos:
Si el sistema es estable entonces se mueve y despues de cierto tiempo
regresa al reposo en el mismo lugar en que originalmente se encontraba
Si el sistema es inestable entonces se mueve cada vez m as de manera
que se aleja m as y m as del lugar en donde inicialmente estaba.
Ejemplo 3.17 Considere el tanque que contiene agua estudiado en el ejemplo
3.2 y mostrado en la gura 3.3. Suponga que se utiliza una bomba de agua que
produce un ujo q
i
que es proporcional al voltaje u aplicado en las terminales
de la bomba, es decir:
q
i
= k
1
u (3.93)
donde k
1
es una constante positiva. Suponga tambien que el voltaje aplicado
a la bomba se obtiene de acuerdo a la expresi on:
u = k
p
(h
d
h) (3.94)
donde h
d
es un valor constante que representa el nivel de agua deseado, h es el
nivel de agua actual en el tanque y k
p
es una constante positiva. Combinando
estas expresiones junto con el modelo en (3.26) se obtiene:
dh
dt
+ah = kk
1
k
p
(h
d
h)
Agrupando terminos:
3.8 Una ecuacion diferencial general 147
dh
dt
+b
1
h = b
2
h
d
(3.95)
b
1
= a +kk
1
k
p
> 0, b
2
= kk
1
k
p
> 0, b
1
> b
2
N otese que esta expresi on tiene la forma de la ecuaci on diferencial en (3.4)
de manera que b
1
, b
2
, h y h
d
juegan los papeles, respectivamente,de a, k, y y
u. Entonces la soluci on h(t) tiene la misma forma que (3.14), es decir:
h(t) =
b
2
h
d
b
1
e
b1t
+
b
2
h
d
b
1
+h
0
e
b1t
, h
0
= h(0)
N otese que, debido a que b
1
> b
2
> 0:
lm
t
h(t) =
b
2
h
d
b
1
< h
d
(3.96)
es el valor que alcanza en estado estacionario el nivel de agua en el tanque y es
menor (diferente) que el nivel deseado h
d
. Esto puede explicarse usando (3.92)
del siguiente modo. La funci on de transferencia de la ecuaci on diferencial en
(3.95) es:
G(s) =
H(s)
H
d
(s)
=
b
2
s +b
1
Entonces:
lm
t
h(t) = lm
s0
sH(s) = lm
s0
s
b
2
s +b
1
h
d
s
=
b
2
b
1
h
d
< h
d
Ahora bien, este resultado tambien puede explicarse usando la experiencia
cotidiana del siguiente modo. Sup ongase por un momento que lm
t
h(t) =
h
d
. Entonces, de acuerdo a (3.93) y (3.94):
q
i
= k
1
k
p
(h
d
h) = 0
el ujo de agua que entra al tanque es cero porque h = h
d
. Como el agua con-
tin ua uyendo a traves de la v alvula de salida, q
o
= 0, lo anterior resultar a en
h < h
d
de nuevo. Esto signica que no es posible mantener h = h
d
de manera
permanente, lo que justica el resultado en (3.96).
Ahora suponga que se usa (3.93) junto con:
u = k
p
(h
d
h) +k
i
_
t
0
(h
d
h(r))dr (3.97)
donde k
i
es una constante positiva. Combinando (3.93), (3.97) y (3.26) se
obtiene:
dh
dt
+ah = kk
1
_
k
p
(h
d
h) +k
i
_
t
0
(h
d
h(r))dr
_
148 3 Base matematica: ecuaciones diferenciales
Derivando una vez respecto al tiempo a toda la ecuaci on se tiene:
d
2
h
dt
2
+a
dh
dt
= kk
1
_
k
p
d
dt
(h
d
h) +k
i
(h
d
h)
_
Agrupando terminos:
d
2
h
dt
2
+ (a +kk
1
k
p
)
dh
dt
+kk
1
k
i
h = kk
1
k
p
dh
d
dt
+kk
1
k
i
h
d
Usando la transformada de Laplace bajo la suposici on de condiciones iniciales
iguales a cero se obtiene la siguiente funci on de transferencia:
G(s) =
H(s)
H
d
(s)
=
kk
1
k
p
s +kk
1
k
i
s
2
+ (a +kk
1
k
p
)s +kk
1
k
i
Usando (3.92) se obtiene:
lm
t
h(t) = lm
s0
sH(s) = lm
s0
s
kk
1
k
p
s +kk
1
k
i
s
2
+ (a +kk
1
k
p
)s +kk
1
k
i
h
d
s
=
kk
1
k
i
kk
1
k
i
h
d
= h
d
(3.98)
lo cual es completamente cierto si a + kk
1
k
p
> 0 y kk
1
k
i
> 0 (se deja como
ejercicio consultar la secci on 4.2.1, del captulo 4, para vericar que estas
condiciones aseguran que las dos races del polinomio caracterstico s
2
+(a +
kk
1
k
p
)s + kk
1
k
i
tienen parte real negativa). De nuevo, este resultado puede
ser explicado usando la experiencia cotidiana. Dado que h = h
d
en estado
estacionario, entonces es de esperarse que la se nal de error e = h
d
h tenga un
comportamiento como el mostrado en la gura 3.17. Recuerdese que la integral
_
t
0
(h
d
h(r))dr es el area debajo de la curva mostrada en la gura 3.17 la cual
es positiva. Esto signica que cuando h = h
d
la integral permanece constante
(el integrando vale cero) en un valor positivo. Entonces, de acuerdo a (3.93)
y (3.97) contin ua entrando agua al tanque con un ujo q
i
que permanece
constante en este valor positivo multiplicado por k
1
k
i
> 0. Este ujo resulta
ser exactamente igual al ujo del agua que sale q
o
de manera que el nivel de
agua h = h
d
permanece igual al nivel deseado, tal como lo predice (3.98).
Ejemplo 3.18 Considere el sistema masa-resorte-amortiguador estudiado en
el ejemplo 3.6 pero ahora suponga que no hay ning un resorte. Haciendo K = 0
en (3.63) se obtiene:
m x +b x = f
Suponga que se utiliza alg un dispositivo (un motor tan r apido que su ecuaci on
diferencial puede no ser considerada, por ejemplo) que genera una fuerza de
acuerdo a la siguiente expresi on:
f = k
p
(x
d
x) (3.99)
3.8 Una ecuacion diferencial general 149
t s [ ]
e m [ ]
Figura 3.17. La integral
_
t
0
(h
d
h(r))dr es el area sombreada debajo de la curva
denida por e = h
d
h. Se supone que h
d
> h(0).
donde k
p
es una constante positiva, x
d
es una constante que representa la
posici on deseada y x es la posici on medida del carrito. Combinando estas
expresiones se obtiene:
m x +b x = k
p
(x
d
x)
y agrupando:
x +
b
m
x +
k
p
m
x =
k
p
m
x
d
Usando la transformada de Laplace bajo la suposici on de condiciones iniciales
iguales a cero se encuentra la siguiente funci on de transferencia:
G(s) =
X(s)
X
d
(s)
=
kp
m
s
2
+
b
m
s +
kp
m
Se deja como ejercicio encontrar las races del polinomio caracterstico s
2
+
b
m
s+
kp
m
y comprobar que ambas tienen parte real negativa si
b
m
> 0 y
kp
m
> 0.
Entonces, usando (3.92) se encuentra que la posici on alcanzada en estado
estacionario:
lm
t
x(t) = lm
s0
sX(s) = lm
s0
s
kp
m
s
2
+
b
m
s +
kp
m
x
d
s
=
kp
m
kp
m
x
d
= x
d
es igual a la posici on deseada x
d
. La raz on de este resultado puede explicar-
se usando, de nuevo, la experiencia: cuando x = x
d
la fuerza producida de
acuerdo a (3.99) es f = 0 por lo que el carrito puede detenerse y permanecer
en dicha posici on. M as a un, si x < x
d
entonces f > 0 y el carrito incrementa
su posici on x acerc andose a x
d
(vease la gura 3.12 para recordar la direcci on
en se aumenta x y en la que f es positiva). Si x > x
d
entonces f < 0 y el
carrito decrementa su posici on x acerc andose, de nuevo, a x
d
.
150 3 Base matematica: ecuaciones diferenciales
Se deja como ejercicio que el lector haga el an alisis correspondiente para
vericar que en el caso que exista un resorte, es decir cuando K > 0, entonces
lm
t
x(t) = x
d
si x
d
= 0. N otese sin embargo que, de nuevo, esto puede
explicarse de manera sencilla usando la experiencia:
Si x = x
d
entonces, de acuerdo a (3.99), la fuerza externa aplicada sobre
el carrito es cero f = 0 y la fuerza de fricci on tambien es cero b x = 0 si se
supone que el carrito ya est a en reposo. Sin embargo, si x = x
d
= 0 entonces
la fuerza del resorte sobre el carrito Kx es diferente de cero por lo que el
carrito abandonar a la posici on x = x
d
= 0. El carrito alcanzar a el reposo en
una posici on x tal que la fuerza del resorte y la fuerza f en (3.99) se cancelen
exactamente, es decir, donde k
p
(x
d
x) = Kx.
3.9. Polos y ceros en sistemas de orden superior
En los sistemas de orden 3 o mayor no es posible hacer un estudio graco
detallado de la respuesta y(t) como se ha hecho en el caso de sistemas de pri-
mer y segundo orden. La principal razon es la complejidad de las expresiones
obtenidas cuando una funcion de transferencia tiene tres polos o mas. Por esta
razon, cuando se tiene un sistema de orden alto es importante poder apro-
ximarlo usando un sistema de orden menor. Hay dos maneras de conseguir
esto: i) cancelando algunos polos con algunos ceros de la funcion de transfe-
rencia correspondiente e ii) despreciando el efecto de los polos rapidos. A
continuacion se presentan algunos ejemplos de como se puede hacer esto.
3.9.1. Cancelacion polo-cero y modelos reducidos
Considere el siguiente sistema de segundo orden:
Y (s) =
k(s d)
(s p
1
)(s p
2
)
U(s) (3.100)
Suponga que U(s) = A/s, p
1
= p
2
, p
1
< 0, p
2
< 0, d < 0, y que p
1
p
2
kd
con el n de que la funcion de transferencia en (3.100) sea de ganancia apro-
ximadamente unitaria en estado estacionario. Usando expansion en fracciones
parciales:
Y (s) =
k(s d)
(s p
1
)(s p
2
)
A
s
=
B
s p
1
+
C
s p
2
+
D
s
(3.101)
Multiplicando ambos miembros por el factor (s p
1
) y evaluando en s = p
1
se obtiene:
B =
k(s d)A
(s p
2
)s

s=p1
=
k(p
1
d)A
(p
1
p
2
)p
1
3.9 Polos y ceros en sistemas de orden superior 151
Multiplicando ambos miembros de (3.101) por el factor (s p
2
) y evaluando
en s = p
2
se obtiene:
C =
k(s d)A
(s p
1
)s

s=p2
=
k(p
2
d)A
(p
2
p
1
)p
2
Multiplicando ambos miembros de (3.101) por el factor s y evaluando en s = 0
se obtiene:
D =
k(s d)A
(s p
1
)(s p
2
)

s=0
=
kdA
p
1
p
2
Si p
1
d < 0 entonces, de acuerdo a la condicion p
1
p
2
kd, se tiene que
k p
2
y, por tanto:
B 0 (3.102)
C
k(p
2
d)A
(p
2
d)p
2
=
kA
p
2
(3.103)
D
kA
p
2
(3.104)
para obtener nalmente:
y(t)
kA
p
2
e
p2t

kA
p
2
(3.105)
El lector puede vericar que:
y(t) =
kA
p
2
e
p2t

kA
p
2
(3.106)
es la solucion de:
Y (s) =
k
s p
2
U(s) (3.107)
con U(s) = A/s y k = p
2
. Por tanto, se concluye. Si un polo y un cero de una
funcion de transferencia estan muy cercanos, entonces se pueden cancelar para
obtener una funcion de transferencia de orden reducido. Es decir, se puede
usar (3.107) en lugar de (3.100) para obtener resultados muy similares. Las
ventajas de usar el modelo (3.107) son: i) se trata un modelo de orden menor
que (3.100) e ii) no tiene ning un cero. La ventaja de disponer de un modelo de
orden reducido que describe aproximadamente a un modelo de orden superior
es que con mucha frecuencia el modelo reducido es de orden sucientemente
peque no de modo que su respuesta puede especicarse gracamente como
el de un sistema de primer o segundo orden. Por otro lado, un cero en la
funcion de transferencia modica su respuesta de una manera que no es facil
de cuanticar por lo que es muy conveniente que la funcion de transferencia
no tenga ceros.
Es importante mencionar que la cancelacion de un polo y un cero solo es
permitida si ambos tienen parte real negativa, pues de otro modo su efecto se
hara presente, tarde o temprano, conforme el tiempo crece.
152 3 Base matematica: ecuaciones diferenciales
3.9.2. Polos dominantes y modelos reducidos
Considere la siguiente funcion de transferencia:
Y (s) =
k
s +
1
RC
d
s +a
U(s) (3.108)
donde U(s) = A/s. Usando expansion en fracciones parciales:
Y (s) =
k
s +
1
RC
d
s +a
A
s
=
B
s +
1
RC
+
C
s +a
+
D
s
(3.109)
Multiplicando ambos miembros por el factor s+
1
RC
y evaluando en s =
1
RC
:
B = k
d
s +a
A
s

s=
1
RC
= k
d
a
1
RC
A
_

1
RC
_ (3.110)
Multiplicando ambos miembros de (3.109) por el factor s +a y evaluando en
s = a:
C = k
d
s +
1
RC
A
s

s=a
= k
d
a +
1
RC
A
(a)
(3.111)
Multiplicando ambos miembros de (3.109) por el factor s y evaluando en s = 0:
D = k
d
s +
1
RC
A
(s +a)

s=0
= k
d
1
RC
A
a
(3.112)
Si a
1
RC
> 0 entonces:
B k
d
a
A
1
RC
(3.113)
C k
dA
a
2
D (3.114)
Por tanto, usando (3.109) y despreciando C se obtiene:
y(t) k
d
a
A
1
RC
e

1
RC
t
+k
d
1
RC
A
a
(3.115)
El lector puede vericar que:
y(t) = k
d
a
A
1
RC
e

1
RC
t
+k
d
1
RC
A
a
(3.116)
es la solucion de:
Y (s) =
kd
a(s +
1
RC
)
U(s) (3.117)
3.9 Polos y ceros en sistemas de orden superior 153
con U(s) = A/s. Por tanto, se puede utilizar (3.117) en lugar de (3.108). La
condicion a
1
RC
se interpreta diciendo que el polo en s = a es muy
rapido comparado con el polo en s =
1
RC
. Al polo en s =
1
RC
se le conoce
como el polo dominante porque su efecto es el que sobresale en la respuesta del
sistema. Por tanto, se concluye. Si un polo es mucho mas rapido que los otros,
entonces se puede obtener una funcion de transferencia de orden reducido si
se desprecia el polo rapido y se conservan los polos dominantes (lentos). Un
criterio aceptado es que los polos rapidos (los que se pueden despreciar) tienen
una parte real de al menos 5 veces la parte real de los polos dominantes (los que
se conservan). Notese, sin embargo, que no es cuestion de simplemente hacer
desaparecer el factor s + a en el denominador de la funcion de transferencia:
la constante a a un aparece dividiendo en (3.117) porque es necesaria para
conservar la ganancia en estado estacionario de la funcion de transferencia en
(3.108).
Una manera sencilla de obtener (3.117) a partir de (3.108) es la siguiente:
Y (s) =
k
s +
1
RC
d
s +a
U(s) =
k
s +
1
RC
d
a(
1
a
s + 1)
U(s) (3.118)
Si a es muy grande se puede suponer que
1
a
s 1 y, por tanto:
Y (s)
kd
a(s +
1
RC
)
U(s) (3.119)
que es la expresion en (3.117).
Finalmente, es importante mencionar que una reduccion de orden como la
presentada es valida solo si el polo que se desprecia tiene parte real negativa.
Si el polo que se desprecia tiene parte real positiva entonces, por peque na que
sea C la contribucion de este polo crecera con el tiempo hasta el innito y no
podra ser despreciada de ninguna manera.
Ejemplo 3.19 De acuerdo al ejercicio 9 y el ejemplo 2.12 del captulo 2, el
modelo de un motor de CD est a dado como:
L
a
di
a
dt
= R
a
i
a
k
e
,
J
d
dt
= k
m
i
a
B (3.120)
donde es la velocidad del motor (veanse tambien (9.9) y (9.10) del captu-
lo 9). Suponga que este motor acciona un sistema hidr aulico que por efecto
centrfugo produce un ujo de agua, q
i
, que es proporcional a la velocidad del
motor, es decir, q
i
= , donde es una constante positiva. Finalmente, este
ujo de agua es utilizado para llenar el tanque del ejemplo 3.2 en el presente
captulo, cuyo modelo est a dado en (3.26) y que por facilidad de referencia se
reescribe a continuaci on:
154 3 Base matematica: ecuaciones diferenciales
dh
dt
+ah = kq
i
a =
1
RC
, k =
1
C
Usando la transformada de Laplace (3.1) y considerando todas las condiciones
iniciales iguales a cero, no es difcil comprobar que las ecuaciones correspon-
dientes adquieren la forma:
I(s) =
1/L
a
s +
Ra
La
(V (s) k
e
(s)) (3.121)
(s) =
k
m
/J
s +
B
J
I(s) (3.122)
H(s) =
1/C
s +
1
RC
Q
i
(s) (3.123)
Combinando (3.121) y (3.122) se obtiene:
(s) =
k
m
/J
s +
B
J
1/L
a
s +
Ra
La
(V (s) k
e
(s))
De acuerdo a (3.118) se puede escribir:
(s) =
k
m
/J
B
J
_
J
B
s + 1
_
1/L
a
Ra
La
_
La
Ra
s + 1
_(V (s) k
e
(s))
En motores de CD peque nos, la inductancia L
a
y la constante de fricci on
viscosa B son peque nas por lo que
La
Ra

J
B
. Por tanto, se puede considerar
que
La
Ra
s 1 s olamente y que entonces se puede aproximar:
(s) =
1
s +
B
J
k
m
JR
a
(V (s) k
e
(s))
Para continuar, se pueden reagrupar los terminos que contienen (s) para
reescribir esta expresi on del siguiente modo:
(s) =
km
JR
s +
_
B
J
+
kmke
JRa
_V (s)
Sustituyendo esto y Q
i
(s) = (s) en (3.123) se encuentra:
H(s) =
1
C
s +
1
RC

km
JR
s +
_
B
J
+
kmke
JRa
_V (s)
Procediendo de nuevo como en (3.118) se puede escribir:
3.10 El principio de superposicion 155
H(s) =

C
1
RC
(RCs + 1)
km
JR
_
B
J
+
kmke
JRa
_
_
1
B
J
+
kmke
JRa
s + 1
_V (s)
Si el tanque tiene una secci on sucientemente amplia, el motor alcanzar a su
velocidad nominal mucho tiempo antes de que el nivel de agua en el tanque
se incremente apreciablemente. Esto se cuantica de manera m as precisa es-
tableciendo que la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor, es decir, que RC
1
B
J
+
kmke
JRa
. Enton-
ces, se puede decir que
1
B
J
+
kmke
JRa
s 1 s olamente y que, por tanto, se puede
aproximar:
H(s) =

C
1
RC
(RCs + 1)
km
JR
_
B
J
+
kmke
JRa
_V (s)
o bien:
H(s) =
1
C
s +
1
RC
km
JR

_
B
J
+
kmke
JRa
_V (s)
Por lo que deniendo:
k
1
=
km
JR

B
J
+
kmke
JRa
y comparando con (3.123) se justica la expresi on presentada en (3.93), es
decir, que se puede considerar que el ujo de agua es proporcional al vol-
taje aplicado al motor a traves de una constante k
1
. Esto es posible si: 1)
la constante de tiempo de la din amica electrica del motor es m as peque na
que la constante de tiempo de la din amica mec anica del motor, es decir si
La
Ra

J
B
, y 2) si la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor completo, es decir si RC
1
B
J
+
kmke
JRa
.
Finalmente, es importante mencionar que este procedimiento es v alido porque
B
J
+
kmke
JRa
> 0 y
Ra
La
> 0, es decir, los polos despreciados son negativos.
3.10. El principio de superposicion
Toda ecuacion diferencial lineal satisface el principio de superposicion. Mas
a un, el hecho de que una ecuacion diferencial satisfaga el principio de super-
posicion se acepta como una prueba de que la ecuacion diferencial es lineal.
Con el n de simplicar la exposicion, a continuacion se presenta el principio
de superposicion para el caso en el que todas las condiciones iniciales son cero.
156 3 Base matematica: ecuaciones diferenciales
Principio de superposicion. Considere la siguiente ecuacion diferencial
ordinaria, lineal con coecientes constantes de orden n:
y
(n)
+a
n1
y
(n1)
+ +a
1
y +a
0
y = b
0
u +b
1
u + +b
m
u
(m)
(3.124)
donde n m. Suponga que todas las condiciones iniciales son cero. Suponga
tambien que y
1
(t) es la solucion de (3.124) cuando u
1
(t) se usa como entra-
da y que y
2
(t) es la solucion de (3.124) cuando u
2
(t) se usa como entrada.
Entonces,
1
y
1
(t) +
2
y
2
(t), donde
1
y
2
son constantes arbitrarias, es la
solucion de (3.124) cuando
1
u
1
(t) +
2
u
2
(t) se usa como entrada.
A continuacion se presenta una manera de comprobar este resultado. Como
la ecuacion diferencial en (3.124) es lineal y todas las condiciones iniciales son
cero entonces se puede expresar en terminos de su funcion de transferencia:
Y (s) = G(s)U(s) (3.125)
Esto signica que se puede escribir:
Y
1
(s) = G(s)U
1
(s)
Y
2
(s) = G(s)U
2
(s)
Sumando estas expresiones se obtiene:

1
Y
1
(s) +
2
Y
2
(s) =
1
G(s)U
1
(s) +
2
G(s)U
2
(s)
= G(s)(
1
U
1
(s) +
2
U
2
(s))
Esto es posible gracias a que
1
y
2
son constantes. Esta expresion comprueba
que
1
y
1
(t) +
2
y
2
(t) es la solucion de (3.125) y, por tanto, de (3.124) cuando

1
u
1
(t) +
2
u
2
(t) se usa como entrada.
Ejemplo 3.20 En el circuito mostrado en la gura 3.18(a) se desea conocer
el voltaje en la impedancia Z
4
(s), seg un la polaridad mostrada. Con el n
de simplicar el circuito y conseguir el objetivo planteado, se har a uso de un
resultado importante en el an alisis de circuitos: el teorema de intercambio de
fuentes.
Teorema 3.1 Teorema de intercambio de fuentes [5], p ag. 214, [11],
p ag. 61.
Cuando se tiene en serie una impedancia, Z(s), y una fuente de vol-
taje, V
fv
(s), entre dos terminales a y b, se le puede sustituir por una
fuente de corriente, I
fc
(s), conectada en paralelo a la misma impedan-
cia del circuito serie. La magnitud de la fuente de corriente es igual a
I
fc
(s) = V
fv
(s)/Z(s).
Cuando se tiene en paralelo una impedancia, Z(s), y una fuente de corrien-
te, I
fc
(s), entre dos terminales a y b, se le puede sustituir por una fuente de
voltaje, V
fv
(s), conectada en serie a la misma impedancia del circuito pa-
ralelo. La magnitud de la fuente de voltaje es igual a V
fv
(s) = Z(s)I
fc
(s).
3.10 El principio de superposicion 157
+

+
Z
1
(s)
Z
2
(s)
Z
3
(s)
Z
4
(s)
+

Z
5
(s)
V
1
(s) V
2
(s)
(a)
Z
1
(s) Z
2
(s)
Z
3
(s)
Z
4
(s)
+

Z
5
(s) I
1
(s) I
2
(s)
(b)
Z
3
(s)
Z
4
(s)
+

I
1
(s) + I
2
(s) Z
a
(s)
I
a
(s)
I
3
(s)
(c)
Figura 3.18. Circuito electrico estudiado en el ejemplo 3.20.
Aplicando la primera parte de este resultado a las fuentes V
1
(s) y V
2
(s), se
obtiene el circuito de la gura 3.18(b) donde:
I
1
(s) =
V
1
(s)
Z
1
(s)
, I
2
(s) =
V
2
(s)
Z
5
(s)
(3.126)
Es claro que Z
1
(s), Z
2
(s) y Z
5
(s) est an conectadas en paralelo y su equivalente
es (vease (2.139)):
Z
a
(s) =
1
1
Z1(s)
+
1
Z2(s)
+
1
Z5(s)
158 3 Base matematica: ecuaciones diferenciales
Usando esto y la combinaci on de las fuentes de corriente se obtiene el circuito
de la gura 3.18(c). A continuaci on se har a uso de otro resultado importante
en el an alsis de circuitos electicos: el divisor de corriente.
Resultado 3.1 Divisor de corriente [5], p ag. 176, [11], p ag. 38.
Cuando se tienen dos impedancias en paralelo que est an a su vez conectadas
en paralelo a una fuente de corriente, la corriente que circula por cualquier
impedancia es igual a el valor de la fuente de corriente multiplicada por la
impedancia contraria a la que se desea calcular la corriente y dividida ente la
suma de las dos impedancias.
Por tanto, aplicando la regla de divisor de corriente y la Ley de Ohm al circuito
en la gura 3.18(c) se obtienen las siguientes relaciones:
I
3
(s) =
Z
a
(s)
Z
a
(s) +Z
3
(s) +Z
4
(s)
(I
1
(s) +I
2
(s))
V
z4
(s) = Z
4
(s)I
3
(s)
donde V
z4
(s) es el voltaje en la impedancia Z
4
(s). Combinando estas expre-
siones se obtiene:
V
z4
(s) =
Z
a
(s)Z
4
(s)
Z
a
(s) +Z
3
(s) +Z
4
(s)
(I
1
(s) +I
2
(s))
Finalmente, utilizando (3.126) se encuentra:
V
z4
(s) =
Z
a
(s)Z
4
(s)
Z
a
(s) +Z
3
(s) +Z
4
(s)
_
V
1
(s)
Z
1
(s)
+
V
2
(s)
Z
5
(s)
_
Se concluye que el voltaje en la impedancia Z
4
(s) se puede obtener como la su-
ma de los voltajes en Z
4
(s) debidos a cada una de las fuentes, V
1
(s) y V
2
(s),
cuando la otra fuente es puesta en corto circuito (igual a cero) y sumando
ambos resultados. Esto es precisamente lo que establece el principio de super-
posici on. Es interesante subrayar que el principio de superposici on ha sido
establecido m as arriba en la presente secci on, suponiendo que las diferentes
entradas se suman directamente y luego se aplican al sistema. Sin embargo,
este ejemplo muestra que el principio de superposici on es v alido en sistemas
lineales a un y cuando las fuentes de voltaje, V
1
(s) y V
2
(s), no se pueden sumar
inmediatamente (vease la gura 3.18(a)).
Ejemplo 3.21 En el circuito mostrado en la gura 3.19(a) se desea conocer
el voltaje en la impedancia Z
3
(s), seg un la polaridad mostrada. Con el n de
simplicar el problema y conseguir el objetivo planteado, primero se obtiene el
circuito equivalente mostrado en la gura 3.19(b). Entonces se puede hacer uso
del teorema de intercambio de fuentes (vease el ejemplo previo) para obtener
el circuito de la gura 3.19(c), donde:
I
1
(s) =
V
1
(s)
Z
1
(s)
(3.127)
3.10 El principio de superposicion 159
+

+
Z
1
(s)
Z
2
(s)
Z
3
(s)
Z
4
(s)
+

V
1
(s)
V
2
(s)
(a)
+

+
Z
1
(s)
Z
2
(s)
Z
3
(s)
Z
4
(s)
+
V
1
(s) V
2
(s)
(b)

+
Z
1
(s) Z
2
(s)
Z
3
(s)
Z
4
(s)
+
V
2
(s) I
1
(s)
(c)

+
Z
3
(s)
+
V
2
(s) V
3
(s)
Z
a
(s) I(s)
+

(d)
Figura 3.19. Circuito electrico estudiado en el ejemplo 3.21.
160 3 Base matematica: ecuaciones diferenciales
Como las impedancias Z
1
(s), Z
2
(s) y Z
4
(s) est an conectadas en paralelo,
se encuentra que su equivalente est a dado como (vease (2.139)):
Z
a
(s) =
1
1
Z1(s)
+
1
Z2(s)
+
1
Z4(s)
Como la impedancia equivalente Z
a
(s) queda conectada en paralelo con la
fuente de corriente I
1
(s), se puede usar la segunda parte del teorema de in-
tercambio de fuentes, listado en el ejemplo previo, para obtener el circuito de
la gura 3.19(d), donde:
V
3
(s) = Z
a
(s)I
1
(s)
I(s) =
V
3
(s) V
2
(s)
Z
a
(s) +Z
3
(s)
V
z3
(s) = Z
3
(s)I(s)
donde V
z3
(s) es el voltaje en la impedancia Z
3
(s). Combinando estas expre-
siones y usando (3.127) se obtiene:
V
z3
(s) =
Z
3
(s)
Z
a
(s) +Z
3
(s)
(V
3
(s) V
2
(s))
=
Z
3
(s)
Z
a
(s) +Z
3
(s)
(Z
a
(s)I
1
(s) V
2
(s))
=
Z
3
(s)
Z
a
(s) +Z
3
(s)
_
Z
a
(s)
Z
1
(s)
V
1
(s) V
2
(s)
_
Se concluye, de nuevo, que el voltaje en la impedancia Z
3
(s) se puede obtener
como la suma de los voltajes en Z
3
(s) debidos a cada una de las fuentes,
V
1
(s) y V
2
(s), cuando la otra fuente es puesta en corto circuito (igual a cero)
y sumando ambos resultados. Adem as, este ejemplo tambien muestra que el
principio de superposici on es v alido en sistemas lineales a un y cuando las
fuentes de voltaje, V
1
(s) y V
2
(s), no se pueden sumar inmediatamente (vease
la gura 3.19(a)).
3.11. Caso de estudio. Un convertidor electronico de
potencia de CD a CD tipo resonante serie de alta
frecuencia
En la seccion 2.7 del captulo 2 se obtuvo el modelo matematico de un
convertidor electronico de potencia de CD a CD tipo resonante serie de alta
frecuencia. Este modelo es presentado en (2.186)-(2.188) y a continuacion se
reescribe para facilitar la referencia:
3.11 Caso de estudio 161
L
di
dt
= v v
0
sign(i) +E(t) (3.128)
C
dv
dt
= i (3.129)
C
0
dv
0
dt
= abs(i)
v
0
R
(3.130)
donde:
sign(i) =
_
+1, i > 0
1, i < 0
(3.131)
mientras que abs(i) representa el valor absoluto de i. En la presente seccion se
estudiara el funcionamiento de este circuito mediante la solucion del modelo
en (3.128)-(3.130). Para esto, es de mucha utilidad realizar un cambio de
coordenadas para las variables involucradas en el modelo. Por esta razon se
denen las siguientes variables (vease la seccion 2.7 del captulo 2 para una
explicacion del signicado de los parametros involucrados):
z
1
=
i
E
_
L
C
, z
2
=
v
E
, z
3
=
v
0
E
, =
t

LC
(3.132)
Sustituyendo esto en (3.128), (3.129), (3.130) se tiene:
L
d
_
E
_
C
L
z
1
_
d
_

LC
_ = Ez
2
Ez
3
sign(z
1
) +E(t)
C
d (Ez
2
)
d
_

LC
_ = z
1
E
_
C
L
C
0
d(Ez
3
)
d
_

LC
_ = abs
_
E
_
C
L
z
1
_

Ez
3
R
Simplicando se encuentra:
z
1
= z
2
z
3
sign(z
1
) +u (3.133)
z
2
= z
1
(3.134)
z
3
= abs(z
1
)
z
3
Q
(3.135)
donde el punto representa la derivada respecto al tiempo normalizado
mientras que = C
0
/C, Q = R
_
C/L y u es una variable que solo toma los
valores de +1 (cuando E(t) = +E) y 1 (cuando E(t) = E). Normalmente,
el valor del capacitor de salida C
0
se selecciona muy grande comparado con
el valor del capacitor resonante C porque esto asegura que z
3
, es decir v
0
, se
mantendra aproximadamente constante durante varios ciclos de la corriente
162 3 Base matematica: ecuaciones diferenciales
resonante z
1
, es decir i. Por tanto, bajo esta suposicion (z
3
constante), se
puede despreciar (3.135) y el uso de (3.133) y (3.134) es suciente para re-
presentar la evolucion de las variables resonantes z
1
y z
2
, al menos durante
varias oscilaciones.
Por otro lado, para conseguir que el circuito opere en resonancia, los tran-
sistores Q
1
, Q
3
se activan (conducen) cuando z
1
> 0 (es decir i > 0) con lo
que u = +1 (porque E(t) = +E en este caso), de acuerdo a las guras 2.44(a),
2.45 y 2.46, mientras que los transistores Q
2
, Q
4
se activan (conducen) cuando
z
1
< 0 (es decir i < 0) con lo que u = 1 (porque E(t) = E en este ca-
so). Una manera abreviada de indicar esto es especicando que u = sign(z
1
),
donde sign(z
1
) = +1 si z
1
> 0 y sign(z
1
) = 1 si z
1
< 0. Lo anterior signica
que, de acuerdo a (3.133) y (3.134), la evolucion de las variables resonantes
puede ser descrita como:
z
1
= z
2
+v
e
(3.136)
z
2
= z
1
(3.137)
v
e
=
_
1 z
3
, Q
1
, Q
3
conducen
(1 z
3
), Q
2
, Q
4
conducen
donde z
3
se considera constante. Aplicando el cambio de variable z
4
= z
2
v
e
a las ecuaciones anteriores se obtiene z
4
= z
2
= z
1
, porque v
e
= 0 al ser v
e
constante, y z
4
= z
1
= z
2
+v
e
= z
4
, es decir:
z
4
+z
4
= 0 (3.138)
Notese que se trata de una ecuacion diferencial ordinaria, de segundo orden,
lineal y de coecientes constantes, como la denida en (3.40) con = 0 y

n
= 1. Como ademas la excitacion, o entrada, de esta ecuacion diferencial es
igual a cero entonces A = 0 y la solucion completa esta dada por la respuesta
natural unicamente. Por tanto, de acuerdo a la seccion 3.3 y, en particular, a
(3.49) y (3.50), la solucion de (3.138) esta dada como:
z
4
() = p() = L
1
_
z
40
(s + 2
n
) + z
40
s
2
+ 2
n
s +
2
n
_
= L
1
_
z
40
s + z
40
s
2
+ 1
_
= L
1
_
z
40
s
s
2
+ 1
+
z
40
s
2
+ 1
_
= z
40
cos() + z
40
sin() (3.139)
donde se han usado los pares transformados [4], cap. 32:
L
1
_
s
s
2
+a
2
_
= cos(a)
L
1
_
a
s
2
+a
2
_
= sin(a)
mientras que z
40
= z
4
(0) = z
2
(0) v
e
y z
40
= z
4
(0) = z
1
(0). Derivando
(3.139) una vez respecto a se obtiene:
3.11 Caso de estudio 163
z
4
() = z
40
sin() + z
40
cos() (3.140)
Entonces, usando (3.139) y (3.140) es sencillo vericar que:
z
2
4
() + z
2
4
() = z
2
40
+ z
2
40
(3.141)
Esto signica que si la solucion de (3.138) se dibuja sobre un plano donde el eje
horizontal es z
4
y el eje vertical es z
4
, entonces se obtiene un crculo centrado
en el origen, (z
4
, z
4
) = (0, 0), que tiene un radio (constante) determinado
por las condiciones iniciales, es decir
_
z
2
40
+ z
2
40
. Mas a un, de acuerdo a los
cambios de variable z
4
= z
2
v
e
y z
4
= z
1
, se concluye que si la solucion
de (3.136), (3.137), se dibuja sobre un plano donde el eje horizontal es z
2
y el eje vertical es z
1
, entonces se obtiene un crculo centrado en el punto
(z
2
, z
1
) = (v
e
, 0), que tiene un radio (constante) igual a
_
(z
20
v
e
)
2
+z
2
10
donde z
20
= z
2
(0) y z
10
= z
1
(0). Es importante mencionar que, de acuerdo a
(3.136) y (3.137), los valores de z
1
y z
2
no pueden presentar discontinuidades
porque para eso se necesitaran valores innitos de z
1
y z
2
, respectivamente,
lo cual no es posible dado que los miembros derechos de (3.136) y (3.137)
no toman valores innitos. Esto signica que, al combinar las soluciones en
ambas regiones (cuando z
1
> 0 y cuando z
1
< 0), las condiciones iniciales en
cada region deben ser iguales a los valores nales de la solucion alcanzados en
la region previa. Todo lo anterior se muestra gracamente en la gura 3.20. La
trayectoria cerrada mostrada en esta gura indica que las variables resonantes
z
2
, z
1
(es decir v e i) oscilan de manera permanente. Se debe subrayar que esta
trayectoria cerrada se recorre en sentido horario porque, de acuerdo a (3.137),
z
2
crece cuando z
1
> 0 (si z
2
> 0 entonces z
2
crece) y z
2
disminuye cuando
z
1
< 0. Notese que debido a que v
e
puede tomar dos valores diferentes, 1 z
3
(cuando z
1
> 0) y (1 z
3
) (cuando z
1
< 0), la unica manera de conseguir
la situacion mostrada en la gura 3.20 es que z
3
= 1, es decir, que v
e
= 0 en
ambas regiones. Esto signica que el voltaje entregado a la salida es igual al
voltaje de suministro v
0
= E.
A continuacion se muestra como puede ser utilizado un convertidor re-
sonante serie de CD a CD para entregar voltajes de salida menores que la
unidad z
3
< 1 (es decir v
0
< E), lo cual es una aplicacion importante de este
tipo de convertidores. Sea la funcion s = z
1
z
2
, con una constante posi-
tiva, y asgnese u = sign(s). Esto dene las regiones mostradas en la gura
3.21. Notese que los transistores Q
1
, Q
3
estan encendidos cuando u = +1 (por
encima de la lnea recta denida por z
1
= z
2
), pero solo conducen cuando
z
1
> 0 pues, aunque Q
1
, Q
3
esten encendidos, cuando z
1
< 0 la corriente
electrica uye a traves de los diodos D
1
, D
3
(cualquiera de los transistores
Q
1
, Q
2
, Q
3
, Q
4
solo conducen en una direccion). Por otro lado, los transistores
Q
2
, Q
4
estan encendidos cuando u = 1 (por debajo de la lnea recta denida
por z
1
= z
2
), pero solo conducen cuando z
1
< 0 pues, aunque Q
2
, Q
4
esten
encendidos, cuando z
1
> 0 la corriente electrica uye a traves de los diodos
D
2
, D
4
.
164 3 Base matematica: ecuaciones diferenciales
Z
2
Z
1
(1 +Z
3
; 0) (1 Z
3
; 0)
Figura 3.20. Evolucion de las variables resonantes z2 y z1 cuando u = sign(z1).
Las variables resonantes siguen evolucionando de acuerdo a (3.136) y
(3.137) pero ahora v
e
toma los siguientes los valores constantes:
v
e
=
_

_
1 z
3
, Q
1
, Q
3
conducen, (z
1
> z
2
, z
1
> 0)
(1 z
3
), Q
2
, Q
4
conducen, (z
1
< z
2
, z
1
< 0)
1 +z
3
, D
1
, D
3
conducen, (z
1
> z
2
, z
1
< 0)
(1 +z
3
), D
2
, D
4
conducen, (z
1
< z
2
, z
1
> 0)
Esto signica que, de nuevo y de acuerdo a los argumentos establecidos entre
(3.136) y el parrafo que sigue de (3.141), las variables resonantes describen
crculos sobre el plano z
2
z
1
. El radio de estos crculos esta determinado
por las condiciones iniciales en cada region (iguales a los valores nales en
la region previa). El centro de estos crculos esta ubicado en los siguientes
puntos, dependiendo de la region en que se esta trabajando:
(z
2
, z
1
) = (1 z
3
, 0), z
1
> z
2
, z
1
> 0,
3.11 Caso de estudio 165
D
2
; D
4
D
1
; D
3
Q
1
; Q
3
Q
2
; Q
4
z
1
= z
2
1 +z
3
1 z
3
1 z
3
1 +z
3
z
1
> 0
z
1
> 0
z
1
< 0
z
1
< 0
z
1
< z
2
z
1
< z
2
z
1
> z
2
z
1
> z
2
z
1
z
2
s = 0
Figura 3.21. Evolucion de las variables resonantes z2 y z1 cuando u = sign(s) con
s = z1 z2.
(z
2
, z
1
) = (1 +z
3
, 0), z
1
< z
2
, z
1
< 0,
(z
2
, z
1
) = (1 +z
3
, 0), z
1
> z
2
, z
1
< 0,
(z
2
, z
1
) = (1 z
3
, 0), z
1
< z
2
, z
1
> 0
En la gura 3.21 se muestra la situacion correspondiente cuando = 3 que,
como antes, implica que las variables resonantes z
2
, z
1
(es decir v e i) oscilan de
manera permanente. El lector puede proceder del siguiente modo para obtener
la trayectoria cerrada mostrada en la gura 3.21. Proponga cualquier valor tal
que z
3
< 1 y utilice cualquier punto sobre el plano z
2
z
1
como valor inicial.
Usando un compas dibuje crculos con centro en los puntos arriba listados
seg un la region en cuestion. Recuerde que, seg un se explico previamente y
de acuerdo a (3.137), estos crculos deben ser recorridos en sentido horario.
166 3 Base matematica: ecuaciones diferenciales
Notara que se empezara a obtener una trayectoria con forma de espiral, como
la lnea punteada mostrada en la gura 3.21, que nalmente terminara en una
trayectoria cerrada. El hecho de que dicha trayectoria cerrada sea alcanzada a
partir de cualquier punto inicial sobre el plano z
2
z
1
es una muestra de que
tal trayectoria cerrada es estable (o atractiva). El lector puede proceder de la
misma manera usando un valor z
3
> 1 para vericar que en este caso no se
consigue alcanzar ninguna trayectoria cerrada. Esto es un indicativo de que
en un convertidor resonante serie no es posible obtener un voltaje de salida v
0
que sea mayor que el voltaje de suministro E, es decir no es posible obtener
un valor de z
3
mayor que la unidad (recuerdese que v
0
= Ez
3
). Si se desea
un voltaje de salida tal que v
0
> E se puede utilizar el convertidor resonante
paralelo mostrado en la gura 2.44(b).
Por otro lado, en la gura 3.21, los arcos de crculo con centro en
(z
2
, z
1
) = (1 z
3
, 0) y (z
2
, z
1
) = (1 z
3
, 0) se dibujan de manera conse-
cutiva. Entonces, si ambos estuvieran centrados en el origen (z
2
, z
1
) = (0, 0),
juntos completaran un angulo de 180 grados. Sin embargo, los centros de estos
arcos de crculo estan colocados en el cuadrante donde z
2
tiene signo contrario
al cuadrante donde esta ubicado dicho arco de crculo. Esta observacion junto
con el uso de geometra basica permite concluir que los arcos de crculo con
centro en (z
2
, z
1
) = (1 z
3
, 0) y (z
2
, z
1
) = (1 z
3
, 0) describen juntos un
angulo menor que 180 grados a pesar de que juntos completan un semiciclo
completo en ambas variables resonantes z
2
, z
1
. Por tanto, los cuatro arcos de
crculo que componen a la trayectoria cerrada completa en la gura 3.21 des-
criben juntos un angulo menor que 360 grados a pesar de que describen un
ciclo completo en ambas variables resonantes. Notese que la frecuencia con la
que se recorren los arcos de crculo mencionados sigue siendo
n
= 1 pero, de
acuerdo a lo recien explicado, ahora se requiere menos tiempo para realizar
una oscilacion completa porque los cuatro arcos de crculo describen un angu-
lo menor a la misma velocidad angular. Por tanto, la frecuencia de operacion

o
de las variables resonantes es mayor que
n
= 1, es decir
o
>
n
. Usando
(3.132) se puede comprobar que:

nt
=

n

LC
=
1

LC
,
ot
=

o

LC
>
nt
donde
nt
y
ot
representan, respectivamente, la frecuencia de resonancia del
circuito y la frecuencia de operacion del circuito, expresadas respecto a la
base de tiempo real t. Por tanto, se concluye que el circuito debe operar a
frecuencias mayores que la frecuencia de resonancia para entregar voltajes de
salida menores que el voltaje de suministro v
0
< E (es decir z
3
< 1). Por esta
razon, cuando los transistores se activan de acuerdo a la regla u = sign(s),
el circuito en las guras 2.44(a) y 2.45 se denomina convertidor electronico
de potencia de CD a CD tipo resonante serie de alta frecuencia. Para mayor
informacion sobre convertidores de potencia de CD a CD tipo resonantes
se recomienda consultar [8], donde se dise nan, construyen, controlan y se
prueban experimentalmente (ambos tipos: serie y paralelo), y [7], donde se
3.12 Resumen del captulo 167
abunda sobre el metodo aqu presentado para obtener la respuesta de un
convertidor resonante serie usando arcos de crculo. Por otro lado, en [9] y [10]
se introdujo por primera vez el uso del plano de fase (z
2
z
1
) para estudiar
el funcionamiento de convertidores electronicos de potencia tipo resonantes.
3.12. Resumen del captulo
Los sistemas que interesa controlar en ingeniera, as como cada uno de
los componentes de un sistema de control en lazo cerrado, estan descritos
por ecuaciones diferenciales ordinarias, lineales, de coecientes constantes.
As que, para el ingeniero de control, el estudio de las ecuaciones diferenciales
debe estar dirigido hacia la comprension de las caractersticas de una ecuacion
diferencial que determinan la forma graca de la solucion.
La solucion de una ecuacion diferencial lineal y de coecientes constantes
esta dada como la suma de la respuesta natural y la respuesta forzada. La
respuesta natural depende exclusivamente del polinomio caracterstico de la
ecuacion diferencial y siempre esta presente, aunque la excitacion o entrada
sea igual a cero. En cambio, la respuesta forzada depende de la entrada apli-
cada y si esta es cero entonces la respuesta forzada tambien es cero. Cuando el
polinomio caracterstico no tiene races con parte real igual a cero y la entra-
da es un polinomio del tiempo, entonces la respuesta forzada tambien es un
polinomio del tiempo del mismo grado que la entrada. La importancia de este
hecho es que, si la respuesta natural tiende a cero (si la ecuacion diferencial
es estable), entonces la respuesta total convergera a la respuesta forzada. Por
tanto, la entrada de una ecuacion diferencial puede ser seleccionada de modo
tal que represente la manera en que se desea se comporte la solucion de la
ecuacion diferencial.
De este modo, el dise no de sistemas de control se reduce a lo siguiente:
dado un sistema a controlar (ecuacion diferencial), seleccionar un controlador
(otra ecuacion diferencial, en general) para que al ser conectado en realimen-
tacion con el sistema a controlar se obtenga una nueva ecuacion diferencial
que 1) sea estable, 2) la respuesta forzada sea igual a la entrada aplicada al
sistema realimentado (o valor deseado a la salida) y 3) que la respuesta natural
desaparezca sucientemente rapido y sin producir demasiadas oscilaciones.
Las caractersticas listadas en el parrafo anterior se consiguen del siguiente
modo:
1. Estabilidad. Esta propiedad esta determinada exclusivamente por las
races del polinomio caracterstico de la ecuacion diferencial o, equiva-
lentemente, de los polos de la funcion de transferencia que representa al
sistema de control (vease la seccion 3.8).
2. Respuesta en estado estacionario. Este aspecto tiene que ver con el con-
seguir que la respuesta forzada sea igual a la entrada aplicada al sistema
realimentado. En la seccion 3.8 se indica que, en el caso de que la entrada
168 3 Base matematica: ecuaciones diferenciales
sea una constante, esto esta determinado por los terminos independientes
de los polinomios de la funcion de transferencia.
3. Respuesta transitoria. Este aspecto se reere a darle la forma adecuada a
la respuesta natural y depende de la seleccion adecuada de los polos de la
funcion de transferencia en lazo cerrado.
En los captulos 5, 6, 7 se estudia la manera de dise nar controladores para
plantas arbitrarias usando los metodos del lugar de las races, la respuesta
en frecuencia y la variable de estado. La idea es conseguir que el sistema en
lazo cerrado sea estable, que la respuesta en estado estacionario sea igual a la
entrada del sistema en lazo cerrado (para cualquier entrada) y que la respuesta
transitoria tenga la forma mas adecuada.
3.13. Preguntas de Repaso
1. Por que una funcion de transferencia es inestable si tiene un polo con
parte real cero que esta repetido dos o mas veces?
2. Se ha dicho que la respuesta forzada tiene la misma forma que la entrada
Por que esto puede no ser cierto si la funcion de transferencia tiene polos
con parte real cero? De un ejemplo de una entrada y una funcion de
transferencia para las cuales esto pueda suceder.
3. Cuando una lampara incandescente (foco) se enciende, se calienta. Sin
embargo, la temperatura del foco no crece de manera indenida sino que se
detiene en un cierto valor. De todas las ecuaciones diferenciales estudiadas,
Cual cree usted que mejor describe la evolucion de la temperatura del
foco? Por que?
4. Que relacion existe entre una funcion de transferencia y una ecuacion
diferencial?
5. Cuales son las cuatro reglas que determinan la estabilidad de una funcion
de transferencia?
6. Bajo que condiciones un motor de CD con escobillas podra comportarse
como un integrador? Y como un doble integrador?
7. Como cree que sera la graca de la solucion completa (respuesta natural
mas respuesta forzada) de una ecuacion diferencial que tiene dos pares de
polos complejos conjugados poco amortiguados: un par con parte imagi-
naria mucho mas grande que la parte imaginaria del otro par?
8. Como cree que sera la graca de la respuesta natural de una ecuacion
diferencial de segundo orden con dos races reales, repetidas y negativas?
9. Se ha visto que las funciones del tiempo que forman parte de la respuesta
natural estan determinadas por los polos de la funcion de transferencia
(races del polinomio caracterstico) pero, Cual es el efecto que tienen
los ceros de la funcion de transferencia? De que cree que dependen los
coecientes de las fracciones parciales obtenidas antes de aplicar la trans-
formada inversa de Laplace? (vea las secciones 3.1 y 3.9).
3.14 Ejercicios propuestos 169
10. Dibuje el plano complejo s y sobre el ubique la zona donde deben colocarse
i) los polos reales que corresponden a respuestas rapidas, ii) los polos
complejos conjugados que corresponden a respuestas poco oscilatorias, iii)
los polos complejos conjugados que corresponden a respuestas rapidas, iv)
los polos complejos conjugados que corresponden a respuestas que oscilan
de manera permanente y v) los polos inestables.
3.14. Ejercicios propuestos
1. Considere el tanque con agua descrito en el ejemplo 3.2. La graca mos-
trada en la gura 3.22 se obtiene cuando se aplica un ujo q
i
constante y
el tanque tiene una seccion de 0.5[m
2
]. Encuentre los valores de R y q
i
.
t s [ ]
h
m [ ]
Figura 3.22. Nivel en un tanque cuando se aplica un ujo de entrada constante.
2. Considere el control proporcional de nivel presentado en el ejemplo 3.17
(cuando se usa u = k
p
(h
d
h), es decir, la expresion en (3.94)). Utilice las
expresiones obtenidas en este caso para el nivel de agua para determinar
lo que sucede con la diferencia h
d
h(t), cuando t , conforme se
utilizan valores cada vez mayores de k
p
> 0. Use su experiencia cotidiana
para explicar por que sucede esto.
3. Considere el control proporcional-integral de nivel presentado en el ejem-
plo 3.17 (cuando se usa la expresion en (3.97)). Demuestre que existiran
170 3 Base matematica: ecuaciones diferenciales
oscilaciones en el nivel de agua si se utiliza un valor sucientemente grande
de k
i
> 0. Como puede explicar este fenomeno de acuerdo a su experien-
cia cotidiana?
4. Dada la siguiente ecuacion diferencial:
y + 127 y + 570y = 3990u, y(0) = 0, y(0) = 0, u = 1
encuentre los valores de ,
n
y el parametro k introducido en la ecuacion
(3.40). Usando estos datos diga como esta expresada y(t).
5. Considere el sistema masa-resorte-amortiguador descrito en el ejemplo
3.6. La graca mostrada en la gura 3.23 se obtiene cuando se aplica una
fuerza f=0.5[Nm] constante. Encuentre los valores de b, K y m.
x
m [ ]
t s [ ]
Figura 3.23. Posicion de la masa en un sistema masa-resorte-amortiguador cuando
se aplica una fuerza de entrada constante. La lnea punteada representa el valor nal
de la posicion de la masa.
6. Considere las siguientes funciones de transferencia:
Y
1
(s) = G
1
(s)U(s), Y
2
(s) = G
2
(s)U(s)
G
1
(s) =
ab
(s +a)(s +b)
, G
2
(s) =
b
s +b
, a > 0, b > 0
donde U(s) = A/s, con A una constante. Realice simulaciones en las que
use valores de a que aumentan desde valores peque nos hasta valores muy
3.14 Ejercicios propuestos 171
grandes (respecto a b) y compare gracamente a y
1
(t) e y
2
(t). Explique lo
que observa.
7. De acuerdo a la seccion 3.1, se sabe que para cualquier condicion inicial
la siguiente ecuacion diferencial y +7y = 2 tiene una solucion de la forma
y(t) = Ee
7t
+ D donde E y D son algunas constantes que no interesa
calcular en este ejercicio. Encuentre del mismo modo la solucion para cada
una de las siguientes ecuaciones diferenciales.
y + 4 y +y = 2
y + y + 10y = 3t
y + 7 y = 2 sin(t)
y + 3 y + 2y = 2e
t
y + 2 y + 2y = 2 cos(2t) 4 sin(2t)
y 4y = 8t
2
4
y
(4)
+ 11y
(3)
+ 28 y = 10
8. Para las siguientes ecuaciones diferenciales diga cuanto vale lm
t
y(t).
Notese que el mismo resultado se obtiene sin importar el valor de las
condiciones iniciales.
y
(3)
+ y 2 y +y = 8
y + y 10y = cos(5t)
y +a y +by = kA, a > 0, b > 0, a, b, A, k son constantes
9. Diga cual de las soluciones de las siguientes ecuaciones diferenciales pre-
senta menor sobre paso y cual tiene un tiempo de subida mas corto.
3 y + 3 y +y6 = 2A
y + 4 y + 10y = 9A
A es una constante.
10. Considere la solucion de una ecuacion diferencial de segundo orden ante
una entrada constante o tipo escalon, considerando condiciones iniciales
cero, presentada en (3.44). Obtenga los maximos de dicha respuesta y
resolviendo para el primero de dichos maximos demuestre que el sobre
paso se puede calcular como:
M
p
( %) = 100 e

1
2

Encuentre los instantes de tiempo en los cuales la respuesta natural es


cero y resolviendo para el primero de esos instantes demuestre que:
t
r
=
1

d
_
arctan
_
_
1
2

__
172 3 Base matematica: ecuaciones diferenciales
11. Considere las siguientes expresiones:
Y (s) =
as +b
s
2
+c
U(s), Z(s) =
d
s
2
+c
U(s)
donde U(s) = A/s con A, a, b, c, d constantes positivas. Exprese y(t) en
funcion de z(t).
12. Considere la siguiente funcion de transferencia:
G(s) =
c
s
2
+bs +c
Que debe hacer con b y/o c para que el sistema responda mas rapido?,
Que debe hacer con b y/o c para que el sistema responda con menos
oscilaciones?
13. Considere la solucion y(t) de una ecuacion diferencial lineal de coecientes
constantes de orden n arbitrario.
Si la excitacion o entrada es acotada, Cuales son las condiciones para
que y(t) sea acotada para todo tiempo? Es decir, para que y(t) no se
haga innita.
Cuales son las condiciones para que, cuando el tiempo tiende a in-
nito, la unica parte de y(t) que permanezca sea la llamada respuesta
forzada?
Suponga que la excitacion o entrada es cero. Diga cuales son las dife-
rentes posibilidades para el comportamiento de y(t) cuando el tiempo
crece y bajo que condiciones se presenta cada una de ellas.
Suponga que la excitacion o entrada es un polinomio del tiempo. De-
muestre que la solucion no puede tener un polinomio del tiempo de
grado mayor que el contenido en la excitacion o entrada si todas las
races del polinomio caracterstico de la ecuacion diferencial tienen
parte real negativa.
Suponga que la entrada o excitacion esta dada como la suma de muchas
funciones seno y coseno del tiempo, de diferentes frecuencias. Recor-
dando como es la respuesta ante una excitacion tipo seno o coseno
del tiempo y el principio de superposicion Puede explicar el resultado
fundamental de la respuesta de las ecuaciones diferenciales lineales que
dice ([6], pag. 389) si la excitacion es una funcion periodica cualquiera
de periodo T y si todas las races del polinomio caracterstico tienen
parte real negativa, entonces cuando t la solucion y(t) tambien
es una funcion periodica de periodo T aunque con una forma de onda
posiblemente diferente a la de la excitacion? (recuerde el concepto de
series de Fourier).
14. Verique las siguientes igualdades:
i)
5
s
2
+s 2
=
5/3
s + 2
+
5/3
s 1
ii)
2
s(s + 2)(s 1)
=
1/3
s + 2
+
2/3
s 1
+
1
s
3.14 Ejercicios propuestos 173
iii)
1
s
3
s
2
s + 1
=
1/2
(s 1)
2
+
1/4
s 1
+
1/4
s + 1
iv)
1
s
4
s
3
s
2
+s
=
1
s
+
1/2
(s 1)
2
+
3/4
s 1
+
1/4
s + 1
v)
2
s
3
+ 2s
=
1
s
+
s
s
2
+ 2
vi)
3
s
4
3s
3
=
1
s
3
+
1/3
s
2
+
1/9
s
+
1/9
s 3
vii)
8
s(s + 4)(s 4)
=
1/2
s
+
1/4
s + 4
+
1/4
s 4
viii)
8
s
2
16
=
1
s 4
+
1
s + 4
ix)
4
s
4
+s
3
+ 2s
2
=
2
s
2
+
1
s
+
s 1
s
2
+s + 2
x)
4
s
5
+ 3s
4
+ 4s
3
+ 4s
2
+ 3s
=
2
(s + 1)
3
+
2
(s + 1)
2
+
1
s + 1
+
s 1
s
2
+ 1
xi)
3s
2
+ 3s 2
s
3
+ 2s
2
=
1
s
2
+
2
s
+
1
s + 2
xii)
s + 2
s
2
(s + 1)
2
=
2
s
2
+
3
s
+
1
(s + 1)
2
+
3
s + 1
15. Un horno de induccion consiste basicamente de un inductor (L) dentro
del cual se coloca un recipiente de material refractario que contiene una
cantidad de metal (conductor de la electricidad) a fundir. En serie al
inductor se conecta un capacitor (C) para corregir el factor de potencia. Al
circuito se le aplica un voltaje alterno de alta frecuencia (audiofrecuencia)
con lo cual se inducen corrientes de remolino (o de eddy) en el metal
contenido dentro del recipiente refractario, por lo que se produce calor y
el metal se funde.
El dispositivo constituye un circuito RLC en serie donde la resistencia (R)
es el equivalente de la resistencia electrica del metal a fundir. El voltaje
alterno de alta frecuencia que se aplica al circuito esta dado como una
onda cuadrada de valor u = E sign(i) donde i es la corriente electrica a
traves del circuito, E es una constante positiva y sign(i) = +1 si i 0 o
sign(i) = 1 si i < 0.
Considere que el valor inicial de la corriente electrica en el circuito es
cero. Demuestre que si el coeciente de amortiguamiento del circuito
es menor que la unidad (0 < < 1) la corriente en el inductor es cero
de manera periodica cada /
d
segundos, donde
d
=
n
_
1
2
,

n
=
1

LC
y =
R
2Ln
.
De acuerdo a u = E sign(i), el voltaje aplicado, u, cambia de valor
cada que i = 0. Considerando esto y un valor inicial v
c
(0) para el
voltaje en el capacitor, encuentre una expresion para el voltaje en el
capacitor que sea valida en el proximo instante en el que i = 0.
174 3 Base matematica: ecuaciones diferenciales
Proponga los valores numericos que desee para R, L y C (tales que
0 < < 1). Sabiendo que el voltaje en el capacitor y la corriente en el
inductor no son discontinuos cuando el valor de u cambia (Por que?),
use de manera iterativa (utilizando un programa de computadora) la
formula obtenida en el inciso anterior para calcular de manera numeri-
ca el voltaje en el capacitor despues de varios cambios en el valor de
u. Verique que al crecer el tiempo el voltaje en el capacitor converge
a un valor constante cada que i = 0.
Simule el comportamiento del circuito RLC en serie cuando u =
E sign(i), para comprobar los resultados del inciso anterior.
16. De acuerdo al ejemplo 3.19, cuando la inductancia de armadura se consi-
dera despreciable, el modelo de un motor de CD esta dado como:
(s) =
km
JR
s +
_
B
J
+
kmke
JRa
_V (s)
donde (s) y V (s) son las transformadas de Laplace de la velocidad del
motor y del voltaje aplicado en las terminales de armadura.
Suponga que el voltaje aplicado es cero y que la velocidad inicial es
diferente de cero. Notese que aplicar un voltaje igual a cero en las ter-
minales del motor equivale a poner en corto las terminales de armadura
y el voltaje inducido es diferente de cero si la velocidad es diferente de
cero. Dibuje la respuesta natural bajo estas condiciones. Como puede
hacer que la respuesta natural desaparezca mas rapido? Que pasa con
la corriente electrica? Puede explicar por que la respuesta natural dis-
minuye mas rapidamente si la resistencia de armadura tiende a cero?
Conoce lo que signica el termino frenado dinamico? Por que la
constante de tiempo depende directamente de la inercia?Que signi-
ca esto desde el punto de vista de las Leyes de la Mecanica (Leyes de
Newton)? Por que la constante de tiempo depende inversamente de
la constante de fuerza contraelectromotriz?
Suponga que se aplica un voltaje diferente de cero a partir de una ve-
locidad inicial igual a cero. Dibuje la respuesta total del sistema. Por
que la velocidad nal no depende de la inercia J? De una interpretacion
desde el punto de vista de la fsica.
Referencias
1. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
2. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,
1980.
3. C. Ray Wylie, Matematicas superiores para ingeniera, McGraw-Hill, 4a. Edi-
cion, Mexico, 1994.
4. M. R. Spiegel, Manual de formulas y tablas matematicas., McGraw-Hill, Serie
Schaum, Mexico, 2002.
5. I. Benitez Serrano, Analisis de redes electricas: Circuitos 1, Instituto Politecnico
Nacional, ESIME, Mexico, D.F., 1983.
6. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
7. V. Hernandez Guzman, A new stability analysis method for DC to DC series
resonant converters, Computacion y Sistemas, vol. 11, no. 1, pp. 14-25, 2007.
8. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: dise no y construccion, Tesis Maestra en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
9. R. Oruganti y F.C. Lee, Resonant power processors, Part I-State plane analysis,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1453-1460, 1985.
10. R. Oruganti y F.C. Lee, Resonant power processors, Part II-Methods of control,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1461-1471, 1985.
11. W. H. Hayt y J. E. Kemmerly, Analisis de circuitos en ingeniera, McGraw-Hill,
Mexico, D.F., 1985.
12. V. Valkenburg, Analisis de redes, Limusa, Mexico, D.F., 1994.
13. J. Stewart, Calculo. Diferencial e integral, International Thomson Editores,
Mexico, D.F., 2003.
4
Criterios de estabilidad y error en estado
estacionario
+ +

I

d
= 0
+
PI
PI
I

q
1=
M
PI
v
d
v
q

!
d
I
q
I
d
!
(dq)
1
dq
PMSM
Los sistemas de control en lazo cerrado pueden ser complejos. En ellos, los
componentes del sistema de control se conectan entre s dando origen a los
diagramas de bloques. La manera de trabajar estos problemas es simplicando
los diagramas de bloques para obtener una unica funcion de transferencia de
lazo cerrado que representa al sistema completo. Una vez conseguido esto, se
puede determinar la estabilidad del sistema completo estudiando la ubicacion
de los polos de la funcion de transferencia de lazo cerrado. Este problema
puede ser complejo incluso para sistemas de segundo orden. Por esta razon,
se propone un metodo que determina la estabilidad simplemente analizando
los signos de los coecientes del polinomio caracterstico. Para sistemas de
orden superior se utiliza el criterio de Routh. Por otro lado, el estudio del
error en estado estacionario permite determinar que tipo de controlador se
debe utilizar para conseguir que la respuesta forzada sea igual o muy parecida
a la entrada del sistema en lazo cerrado (o valor deseado a la salida).
178 4 Criterios de estabilidad y error
Objetivos del captulo
Dado un sistema en lazo cerrado, aprender a manipular el diagrama de
bloques correspondiente para obtener una funci on de transferencia equiva-
lente.
Identicar la regla de los signos para determinar la ubicaci on de las races
de un polinomio, como un metodo sencillo que permite establecer la esta-
bilidad de sistemas de primero y segundo orden.
Identicar el criterio de estabilidad de Routh como el metodo que da con-
diciones necesarias y sucientes para determinar cu ando un sistema de
orden arbitrario es estable.
Dado un sistema en lazo cerrado y a partir del estudio del error en estado
estacionario, conseguir que la respuesta forzada sea igual o muy parecida
a la entrada.
Un sistema de control general esta formado por varios componentes que
interact uan entre s: planta a controlar, controlador, sistemas de medicion, ac-
tuadores, etc. Por esta razon un sistema de control puede ser muy complejo. A
pesar de esto, cualquier sistema de control en lazo cerrado puede ser reducido
para ser representado por una sola funcion de transferencia la cual relacio-
na a la salida controlada con la referencia o salida deseada. Esta funcion de
transferencia de lazo cerrado puede ser estudiada como se hace en el captulo
3. En el presente captulo se presenta el concepto de diagramas de bloques
para indicar como esta constituido un sistema de control en lazo cerrado y se
presenta la manera de manipularlos para obtener la funcion de transferencia
de lazo cerrado.
Por otro lado, un sistema de control siempre se dise na de modo que cumpla
tres requisitos: a) que sea estable, b) que tenga las caractersticas deseadas de
respuesta transitoria y c) que tenga las caractersticas deseadas de respuesta
en estado estacionario. De acuerdo a lo estudiado en el captulo 3, una funcion
de transferencia es estable si todos sus polos tienen parte real negativa. Sin
embargo, vericar este requisito de manera analtica puede presentar algunas
dicultades y por ello surge la necesidad de encontrar metodos sencillos para
conseguirlo. En este captulo se presentan dos alternativas: 1) la regla de los
signos para determinar la ubicacion de las races de un polinomio y, 2) el
Criterio de estabilidad de Routh.
Las caractersticas de respuesta transitoria de un sistema de control depen-
den de la ubicacion de los polos y de los ceros de la funcion de transferencia en
lazo cerrado. Hay dos metodos para el dise no de un controlador que asigne los
polos y los ceros de la funcion de transferencia de lazo cerrado en los lugares
requeridos para que se consigan las caractersticas deseadas de respuesta tran-
sitoria: el lugar de las races (captulo 5) y la respuesta en frecuencia (captulo
6).
Finalmente, las caractersticas deseadas de respuesta en estado estaciona-
rio se reeren al dise no de un controlador que consiga que, una vez que la
4.1 Diagramas de bloques 179
respuesta natural es cero
1
, la respuesta del sistema en lazo cerrado alcance la
referencia o salida deseada de manera exacta o, al menos, dentro de ciertos
margenes de tolerancia. Esto se consigue si la respuesta forzada del sistema
en lazo cerrado es igual o muy cercana a la referencia o salida deseada. Este
tema tambien es estudiado en el presente captulo.
4.1. Diagramas de bloques
A continuacion se muestra, a base de ejemplos, como se puede manipular
un diagrama de bloques formado por la interconexion de varias funciones de
transferencia para ser simplicado y ser representado por una sola funcion de
transferencia. Tambien se muestra como se pueden simplicar los diagramas
de bloques correspondientes a sistemas que tienen dos (o mas) entradas.
Ejemplo 4.1 Suponga que se tienen dos sistemas tales que la entrada de uno
es la salida del otro (conectados en cascada), como se muestra en la gura
4.1. Entonces se puede escribir:
Y
1
(s) = G
1
(s)U
1
(s), Y
2
(s) = G
2
(s)U
2
(s), U
1
(s) = Y
2
(s)
para obtener:
Y
1
(s) = G
1
(s)G
2
(s)U
2
(s), G(s) = G
1
(s)G
2
(s)
Y
1
(s) = G(s)U
2
(s)
)
U
2
(s)
G
1
(s) G
2
(s)
Y
1
(s)
U
2
(s) Y
1
(s)
G(s)
Figura 4.1. Sistemas conectados en cascada.
Esto signica que los sistemas conectados en cascada, como en la gura
4.1, pueden ser representados por una sola funci on de transferencia G(s) que
se calcula como el producto de las funciones de transferencia de los sistemas
en cascada. El lector puede vericar que esto es cierto sin importar el n umero
de sistemas conectados en cascada.
Ejemplo 4.2 Suponga que se tienen dos sistemas conectados en paralelo co-
mo se muestra en la gura 4.2. Entonces se puede escribir:
Y
1
(s) = G
1
(s)U(s), Y
2
(s) = G
2
(s)U(s)
1
Cuando el tiempo es sucientemente grande, o en estado estacionario
180 4 Criterios de estabilidad y error
para obtener:
Y
1
(s) +Y
2
(s) = (G
1
(s) +G
2
(s))U(s) G(s) = G
1
(s) +G
2
(s)
Y
1
(s) +Y
2
(s) = G(s)U(s)
+
+
)
U(s)
Y
1
(s)
Y
2
(s)
Y
1
(s) + Y
2
(s)
Y
1
(s) + Y
2
(s)
U(s)
G
1
(s)
G
2
(s)
G(s)
Figura 4.2. Sistemas conectados en paralelo.
Esto signica que los sistemas conectados en paralelo, como en la gura
4.2, pueden ser representados por una sola funci on de transferencia G(s) que
se calcula como la suma de las funciones de transferencia de los sistemas
conectados en paralelo. El lector puede vericar que esto es cierto sin importar
el n umero de sistemas conectados en paralelo.
Ejemplo 4.3 Considere el sistema de control en lazo cerrado mostrado en la
gura 4.3. Los bloques G(s) y H(s) representan las funciones de transferencia
de los diferentes componentes de un sistema de control. De hecho, G(s) y
H(s) pueden ser el resultado de combinar las funciones de transferencia de
varios componentes del sistema de control como se indica en los dos ejemplos
previos. De acuerdo a la denici on de funci on de transferencia, a partir de la
gura 4.3 se encuentra que:
C(s) = G(s)E(s), E(s) = R(s) Y (s), Y (s) = H(s)C(s)
Sustituyendo sucesivamente estas expresiones se encuentra que:
C(s) = G(s)[R(s) Y (s)]
= G(s)[R(s) H(s)C(s)]
= G(s)R(s) G(s)H(s)C(s)
C(s)[1 +G(s)H(s)] = G(s)R(s)
C(s) =
G(s)
1 +G(s)H(s)
R(s)
4.1 Diagramas de bloques 181
donde:
M(s) =
C(s)
R(s)
=
G(s)
1 +G(s)H(s)
(4.1)
se conoce como la funci on de transferencia de lazo cerrado.
+

R(s) E(s) C(s)


Y(s)
G(s)
H(s)
Figura 4.3. Sistema en lazo cerrado.
Ejemplo 4.4 Considere el diagrama de bloques de la gura 4.4(a). Para redu-
cir este diagrama de bloques es conveniente recorrer el punto de resta colocado
a la derecha de U(s) hasta donde se encuentra I

(s). Para conseguirlo es in-


dispensable que la variable I(s) en 4.4(a) permanezca sin alterarse. Es decir,
de acuerdo a la gura 4.4(a):
I(s) =
1
Ls +R
[KA
p
(I

(s) I(s)) nk
e
s(s)]
N otese que esta expresi on tambien es v alida en el diagrama de bloques de la
gura 4.4(b) y, por tanto, este diagrama de bloques es equivalente al de la
gura 4.4(a). A continuaci on, es claro que el lazo existente entre el segundo
punto de resta en 4.4(b) e I(s) es identico al sistema en lazo cerrado mostrado
en la gura 4.3 con:
G(s) =
KA
p
Ls +R
, H(s) = 1
donde se ha usado el resultado del ejemplo 4.1 para calcular la funci on de
transferencia de dos sistemas en cascada como el producto de las funciones de
transferencia de los sistemas en cascada. Por tanto, usando (4.1) se encuentra
que la siguiente funci on de transferencia debe ser colocada antes de I(s):
KA
p
Ls +R +KA
p
Esto se muestra en la gura 4.4(c). El diagrama de bloques en la gura 4.4(c)
tiene dos entradas. Para encontrar la salida (s) como funci on de las dos
entradas se usa el principio de superposici on (vease la secci on 3.10), es decir:
(s) = G
1
(s)I

(s) +G
2
(s)T
p
(s) (4.2)
182 4 Criterios de estabilidad y error
+
+

(s) I(s) +

T
p
s ( )
s ( )
nk
m
A
p
U s ( )
nk
e
s
U
i
s ( )
K
Ls+R
1
Js
2
+bs
1
(a)
Js
2
+bs
1
Ls+R
1
I

(s)
+

+
I(s)
+

(s)
T
p
s ( )
nk
m
KA
p
KA
p
nk
e
s
(b)
Js
2
+bs
1
I

(s) +

(s) I(s)
T
p
s ( )
nk
m
KA
p
nk
e
s
Ls+R+KAp
KAp
(c)
Figura 4.4. Simplicacion de un diagrama de bloques que contiene un lazo interno.
donde G
1
(s) es la funci on de transferencia obtenida con I

(s) como entrada y


(s) como salida cuando se considera que T
p
(s) = 0 en el diagrama de bloques
en la gura 4.4(c), es decir, cuando el diagrama de bloques tiene la forma
mostrada en la gura 4.5(a). Por tanto, usando (4.1) se dene:
M(s) =
G(s)
1 +G(s)H(s)
=
(s)
I

(s)
= G
1
(s)
con:
G(s) =
KA
p
nk
m
(Ls +R +KA
p
)(Js
2
+bs)
, H(s) =
nk
e
s
KA
p
para obtener:
G
1
(s) =
nk
m
__
sL+R
KAp
+ 1
_
(sJ +b) +
n
2
kmke
KAp
_
s
(4.3)
4.1 Diagramas de bloques 183
+

Ls+R+KA
p
KA
p
Js
2
+bs
1
KA
p
nk
e
s
nk
m
(s) I

(s)
(a) Diagrama de bloques cuando Tp(s) = 0.

Js
2
+bs
1
Ls+R+KA
p
nk
m
KA
p
KA
p
nk
e
s
T
p
(s) (s)
(b) Diagrama de bloques cuando I

(s) = 0.
+
+
G
1
(s)
G
2
(s)
I

(s)
T
p
(s)
(s)
(c) Diagrama de bloques equivalente a cualquiera de los diagra-
mas mostrados en la gura 4.4.
Figura 4.5. Simplicacion del diagrama de bloques en la gura 4.4(c).
Por otro lado, G
2
(s) es la funci on de transferencia obtenida con T
p
(s) como
entrada y (s) como salida cuando se considera que I

(s) = 0 en el diagrama
de bloques en la gura 4.4(c), es decir, cuando el diagrama de bloques tiene
la forma mostrada en la gura 4.5(b). Por tanto, usando (4.1) se dene:
M(s) =
G(s)
1 +G(s)H(s)
=
(s)
T
p
(s)
= G
2
(s)
con:
G(s) =
1
Js
2
+bs
, H(s) =
n
2
k
m
k
e
s
Ls +R +KA
p
para obtener:
184 4 Criterios de estabilidad y error
G
2
(s) =

_
sL+R
KAp
+ 1
_
__
sL+R
KAp
+ 1
_
(sJ +b) +
n
2
kmke
KAp
_
s
(4.4)
Por tanto, cualquiera de los diagramas de bloques de las guras 4.4(a), 4.4(b)
o 4.4(c) se puede representar como el diagrama de bloques de la gura 4.5(c)
con G
1
(s) y G
2
(s) dadas en (4.3) y (4.4).
Ejemplo 4.5 Considere el sistema en lazo cerrado mostrado en la gura
4.6(a). Este ejemplo representa un esquema de control conocido como contro-
lador con dos grados de libertad. Este es un sistema con dos entradas y una
salida. Por tanto, se puede proceder como en el ejemplo previo para, usando
el principio de superposici on, escribir:
C(s) = G
1
(s)R(s) +G
2
(s)D(s)
donde G
1
(s) es la funci on de transferencia obtenida usando R(s) como entrada
y C(s) como salida cuando D(s) = 0, es decir, cuando se usa el diagrama de
bloques de la gura 4.6(b). Por otro lado, G
2
(s) es la funci on de transferencia
obtenida usando D(s) como entrada y C(s) como salida cuando R(s) = 0, es
decir, cuando se usa el diagrama de bloques de la gura 4.6(c).
Primero se procede a obtener G
1
(s). Para simplicar el diagrama de blo-
ques de la gura 4.6(b) n otese que:
V (s) = G
c1
(s)(R(s) C(s)) G
c2
(s)C(s)
= G
c1
(s)(R(s) C(s)) +G
c2
(s)(R(s) C(s)) G
c2
(s)R(s)
= (G
c1
(s) +G
c2
(s))(R(s) C(s)) G
c2
(s)R(s)
Por lo que se obtienen, sucesivamente, los diagramas de bloques de las gu-
ras 4.7(a), 4.7(b) y 4.7(c). N otese que, de acuerdo al ejemplo 4.2, se puede
escribir:
F(s) =
_
1
G
c2
(s)
G
c1
(s) +G
c2
(s)
_
R(s)
=
G
c1
(s) +G
c2
(s) G
c2
(s)
G
c1
(s) +G
c2
(s)
R(s)
=
G
c1
(s)
G
c1
(s) +G
c2
(s)
R(s) (4.5)
Por otro lado, se puede hacer uso de (4.1) junto con:
G(s) = (G
c1
(s) +G
c2
(s))G
p
(s), H(s) = 1
para obtener:
C(s) =
(G
c1
(s) +G
c2
(s))G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
F(s) (4.6)
4.1 Diagramas de bloques 185
+

G
p
s ( )
G
c2
s ( )
G
c1
s ( )
+ +

+ C(s)
R(s)
D(s)
(a) Sistema en lazo cerrado.
+

G
p
s ( )
G
c2
s ( )
G
c1
s ( )
+

C(s)
R(s) V(s)
(b) Caso cuando D(s) = 0
+

G
p
s ( )
G
c2
s ( )
G
c1
s ( )
+
+
C(s) D(s)
(c) Caso cuando R(s) = 0
Figura 4.6. Sistema de control con dos grados de libertad.
Sustituyendo (4.5) en (4.6) se obtiene:
C(s) =
G
c1
(s)G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
R(s)
por lo que se concluye que:
G
1
(s) =
G
c1
(s)G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
(4.7)
Por otro lado, del diagrama de bloques de la gura 4.6(c) y de acuerdo al
ejemplo 4.2 se obtiene el diagrama de bloques de la gura 4.8. Usando (4.1)
junto con:
G(s) = G
p
(s), H(s) = G
c1
(s) +G
c2
(s)
186 4 Criterios de estabilidad y error
+

G
p
s ( )
+

C(s)
G
c2
(s)
G
c1
(s) + G
c2
(s)
R(s) V(s)
(a)
+

G
p
s ( )
+

C(s) R(s) V(s)


G
c1
(s) + G
c2
(s)
G
c1
(s) + G
c2
(s) G
c1
(s)+G
c2
(s)
G
c2
(s)
(b)
+

G
p
s ( )
+

1
G
c1
(s)+G
c2
(s)
G
c2
(s)
G
c1
(s) + G
c2
(s)
V(s)
C(s)
R(s)
F(s)
(c)
Figura 4.7. Simplicacion del diagrama de bloques mostrado en la gura 4.6(b).
se obtiene:
C(s) =
G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
D(s)
es decir:
G
2
(s) =
G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
(4.8)
Por tanto, el diagrama de bloques de la gura 4.6(a) se puede representar
como el diagrama de bloques de la gura 4.9 con G
1
(s) y G
2
(s) dadas en
(4.7) y (4.8).
4.2 Regla de los signos 187
G
p
s ( )
+

G
c1
(s) + G
c2
(s)
C(s)
D(s)
Figura 4.8. Simplicacion del diagrama de bloques en la gura 4.6(c).
+
+
R(s)
D(s)
G
1
(s)
G
2
(s)
C(s)
Figura 4.9. Diagrama de bloques equivalente al de la gura 4.6(a).
4.2. Regla de los signos para determinar la ubicacion
de las races de un polinomio
De acuerdo a la seccion 3.8, la estabilidad de una funcion de transferencia
esta asegurada si la parte real de todos sus polos es negativa, es decir si
todas las races de su polinomio caracterstico tienen parte real negativa. Sin
embargo, en ocasiones es difcil calcular el valor exacto de los polos, sobre
todo si el polinomio es de grado tres o mayor. La razon de esto es que el
procedimiento para calcular las races de polinomios de orden 3 y 4 es un poco
complicado. Mas a un, para polinomios de grado 5 o mayor ni siquiera existen
procedimientos analticos para esto. Incluso para polinomios de segundo grado
en ocasiones es un poco tedioso tener que hacer el calculo correspondiente a un
cuando la formula existente para tal caso es bien conocida. As que es muy
conveniente contar con un medio sencillo que permita determinar si los polos
de un polinomio tienen parte real negativa o si existe alguno con parte real
positiva. En esta seccion se introducen criterios sencillos que resuelven este
problema y que estan basados en el estudio de los signos de los coecientes
de un polinomio.
4.2.1. Polinomios de segundo grado
Criterio 4.1 Si un polinomio de segundo grado tiene todos sus coecientes
con el mismo signo, entonces todas sus races tienen parte real negativa.
Prueba. Considere el siguiente polinomio:
p(s) = s
2
+cs +d
188 4 Criterios de estabilidad y error
donde c > 0, d > 0. Si todos los coecientes de un polinomio tuvieran signo
negativo, entonces se puede factorizar dicho signo y proceder como se muestra
a continuacion. Las dos races de p(s) se obtienen usando la formula general:
s
1,2
=
c

c
2
4d
2
(4.9)
Caso i): c
2
4d < 0.
En este caso ambas races son complejas conjugadas con parte real negativa
porque c > 0:
s
1,2
=
c
2

4d c
2
2
j
Caso ii): c
2
4d > 0.
En este caso
c
2
> c
2
4d > 0
porque d > 0. Aplicando la raz cuadrada en ambos lados de la desigualdad
se obtiene:
c >
_
c
2
4d
porque la raz cuadrada es una funcion estrictamente creciente. Entonces:
c
_
c
2
4d > 0
De acuerdo a (4.9), esto signica que ambas races son reales, distintas y
negativas en este caso:
s
1
=
c +

c
2
4d
2
< 0
s
2
=
c

c
2
4d
2
< 0
Caso iii): c
2
4d = 0.
En este caso ambas races son reales, iguales y negativas:
s
1,2
=
c
2
(4.10)
Ejemplo 4.6 N otese que el polinomio s
2
+s+1 satisface el caso i) por lo que
sus races son complejas conjugadas con parte real negativa. De hecho, no es
difcil vericar que estas races son 0.5 + j0.866 y 0.5 j0.866. Por otro
lado, el polinomio s
2
+ 2.5s + 1 satisface el caso ii) por lo que sus dos races
son reales, distintas y negativas. No es difcil vericar que dichas races son
2 y 0.5. Finalmente, el polinomio s
2
+ 2s + 1 satisface el caso iii) por lo
que sus dos races son reales, iguales y negativas. No es difcil vericar que
dichas races son 1 y 1.
4.2 Regla de los signos 189
Criterio 4.2 Si un polinomio de segundo grado tiene algunos de sus coe-
cientes con signo contrario al de los otros coecientes, entonces al menos una
de sus races tiene parte real positiva.
Prueba. Considere el siguiente polinomio:
p(s) = s
2
+cs +d
donde hay tres posibilidades:
1) c < 0, d > 0.
2) c > 0, d < 0.
3) c < 0, d < 0.
Las dos races correspondientes se obtienen usando la formula general:
s
1,2
=
c

c
2
4d
2
(4.11)
Caso i): c
2
4d < 0.
En este caso ambas races son complejas conjugadas con parte real positiva
si se cumple 1). Los casos 2) y 3) no son posibles porque d < 0 implica
que c
2
4d > 0.
Caso ii): c
2
4d > 0.
Este caso es posible para d < 0, con c < 0 o c > 0 y algunos valores
peque nos de d > 0 con c < 0. Para valores mayores de d > 0 se recupera
el caso i). Si d < 0 entonces:
c
2
< c
2
4d
Aplicando la raz cuadrada en ambos lados de la desigualdad se obtiene:
abs(c) <
_
c
2
4d
porque la raz cuadrada es una funcion estrictamente creciente. Entonces:
abs(c)
_
c
2
4d < 0
Esto signica que ambas races son reales y distintas con una de ellas
positiva:
s
1
=
c +

c
2
4d
2
< 0
s
2
=
c

c
2
4d
2
> 0
Si d > 0 con c < 0 entonces:
c
2
> c
2
4d
190 4 Criterios de estabilidad y error
Aplicando la raz cuadrada en ambos lados de la desigualdad se obtiene:
abs(c) >
_
c
2
4d
abs(c)
_
c
2
4d > 0
Como c < 0, ya que d > 0, entonces hay dos races reales positivas:
s
1
=
c +

c
2
4d
2
> 0
s
2
=
c

c
2
4d
2
> 0
Caso iii): c
2
4d = 0.
En este caso d = c
2
/4 > 0, por lo que c < 0 (vease 1)). Esto implica que
ambas races son reales, iguales y positivas:
s
1,2
=
c
2
> 0 (4.12)
Ejemplo 4.7 A continuaci on se presentan varios polinomios de segundo or-
den y sus correspondientes races. Se deja como ejercicio para el lector que
verique estos resultados, que identique a que caso de los anteriores corres-
ponde cada uno y que compruebe que se cumplen las predicciones hechas en el
an alisis arriba presentado.
s
2
+ 2s 1, races: 2.4142 y 0.4142.
s
2
2.5s + 1, races: 2 y 0.5.
s
2
s 1, races: 1.618 y 0.618.
s
2
s + 1, races: 0.5 +j0.866 y 0.5 j0.866.
s
2
2s + 1, races: 1 y 1.
4.2.2. Polinomios de primer grado
En este caso es muy facil demostrar que se cumple algo similar a los poli-
nomios de segundo grado:
Criterio 4.3 Si los dos coecientes tienen el mismo signo entonces la unica
raz es real y negativa. Si un coeciente tiene signo contrario al otro coeciente
entonces la unica raz es real y positiva.
4.2.3. Polinomios de grado 3 o mayor
Criterio 4.4 Si al menos un coeciente tiene signo contrario a los otros coe-
cientes entonces es seguro que existe al menos una raz con parte real positiva.
4.3 Criterio de estabilidad de Routh 191
Prueba. Considere el siguiente polinomio donde n 3:
p(s) = s
n
+a
n1
s
n1
+. . . +a
1
s +a
0
= (s p
1
)(s p
2
) (s p
n
) (4.13)
Del estudio de polinomios de segundo grado se sabe que el producto (s
p
i
)(s p
j
) = s
2
+ cs + d sera tal que c < 0 y/o d < 0 si una de las races
p
i
o p
j
o ambas tienen parte real positiva. Por otro lado, el polinomio de
primer orden (s p
k
) tiene un coeciente negativo si su raz p
k
es positiva.
Notese tambien que los coecientes a
j
, j = 0, . . . , n 1 que se encuentran en
el lado izquierdo de (4.13) se obtienen como la suma de los productos de los
coecientes de los polinomios de la forma s
2
+cs +d y (s p
k
) que existen en
el miembro de la derecha de (4.13). Entonces, la unica manera de que exista
un coeciente a
j
< 0 en el lado izquierdo de (4.13) es que exista una raz con
parte real positiva en el miembro derecho de (4.13), es decir que alguno de los
polinomios s
2
+cs +d o (s p
k
) tenga un coeciente negativo.
Criterio 4.5 A un cuando todos los coecientes tengan el mismo signo, no
puede asegurarse que todas las races tienen parte real negativa.
Esto puede explicarse usando los mismos argumentos del parrafo anterior,
recordando que el producto de dos coecientes negativos da un resultado po-
sitivo. Entonces, a un cuando todos los coecientes del polinomio en el lado
izquierdo de (4.13) sean positivos, existe la posibilidad de que dos coecien-
tes negativos (races con parte real positiva) del lado derecho de (4.13) se
multipliquen para dar un coeciente positivo del lado izquierdo de (4.13).
Ejemplo 4.8 Para ilustrar lo que sucede cuando un polinomio es de orden
mayor a 2, a continuaci on se presentan algunos polinomios y sus races. El
lector puede comprobar estos resultados vericando que s
3
+a
2
s
2
+a
1
s +a
0
=
(sp
1
)(sp
2
)(sp
3
) donde p
1
, p
2
, p
3
son las races del polinomio en cuesti on.
s
3
+ s
2
+ s + 1.5, races: 1.2041, 0.102 + j1.1115 y 0.102 j1.1115.
Dos races con parte real positiva, a pesar de que todos los coecientes del
polinomio tienen el mismo signo.
s
3
s
2
+ s + 1, races: 0.7718 + j1.1151, 0.7718 j1.1151 y 0.5437.
Dos races con parte real positiva porque un coeciente del polinomio tiene
signo contrario a los otros coecientes.
s
3
+s
2
+1, races: 1.4656, 0.2328+j0.7926, 0.2328j0.7926. Dos races
con parte real positiva porque un coeciente tiene valor cero, aunque los
dem as coecientes tienen el mismo signo.
s
3
+s
2
+3s +1, races: 0.3194 +j1.6332, 0.3194 j1.6332 y 0.3611.
Todas las races tienen parte real negativa y todos los coecientes del poli-
nomio tienen el mismo signo.
4.3. Criterio de estabilidad de Routh
Como se ve en la seccion anterior, la regla de los signos para determinar
la ubicacion de las races de un polinomio, aunque muy comoda, tiene su
192 4 Criterios de estabilidad y error
principal desventaja cuando se trata de aplicar a polinomios de grado mayor
o igual a 3: si todos los coecientes de dicho polinomio tienen el mismo signo
nada se puede asegurar a cerca del signo de la parte real de sus races. La
solucion a este problema la da el criterio de estabilidad de Routh el cual,
dado un polinomio de grado arbitrario, establece condiciones necesarias y
sucientes para asegurar que todas las races tienen parte real negativa.
Tabla 4.1. Tabla que se debe construir para aplicar el criterio de Routh.
s
n
an an2 an4 an6 . . . 0
s
n1
an1 an3 an5 an7 . . . 0
s
n2
b1 b2 b3 b4 . . . 0
s
n3
c1 c2 c3 c4 . . . 0
s
n4
d1 d2 d3 d4 . . . 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . 0
s
2
p1 p2 0
s
1
q1 0
s
0
p2
Dado un polinomio arbitrario, ordenelo en orden descendente de potencias:
a
n
s
n
+a
n1
s
n1
+ +a
1
s +a
0
(4.14)
El criterio de estabilidad de Routh consiste en realizar los siguientes dos pasos:
1. Construya la tabla 4.1. Notese que los primeros dos renglones de la tabla
anterior se construyen usando directamente los coecientes del polinomio
bajo estudio. Observe tambien que los ultimos elementos de los dos pri-
meros renglones terminan en ceros, pues ese es el valor de los coecientes
de las potencias que no aparecen en el polinomio en (4.14). Los elementos
de los otros renglones se calculan de acuerdo a las siguientes reglas:
b
1
=
a
n1
a
n2
a
n
a
n3
a
n1
, b
2
=
a
n1
a
n4
a
n
a
n5
a
n1
,
b
3
=
a
n1
a
n6
a
n
a
n7
a
n1
.
.
.
c
1
=
b
1
a
n3
a
n1
b
2
b
1
, c
2
=
b
1
a
n5
a
n1
b
3
b
1
, c
3
=
b
1
a
n7
a
n1
b
4
b
1
.
.
.
d
1
=
c
1
b
2
b
1
c
2
c
1
, d
2
=
c
1
b
3
b
1
c
3
c
1
, d
3
=
c
1
b
4
b
1
c
4
c
1
.
.
.
4.3 Criterio de estabilidad de Routh 193
Notese que, de acuerdo a estas reglas, el ultimo elemento de cada renglon
es cero y que la tabla tiene una forma triangular.
2. Analice unicamente la primera columna de la tabla construida. El n umero
de cambios de signos al recorrer de arriba hacia abajo los elementos de la
primera columna es igual al n umero de races con parte real positiva.
A continuacion se presentan varios ejemplos.
Ejemplo 4.9 Sea el siguiente polinomio de segundo orden:
s
2
+as +b
con a y b dos constantes reales. Dado que este polinomio es de segundo grado
(tiene dos races) entonces se puede usar la regla de los signos vista en la
secci on 4.2 para concluir que las dos races tiene parte real negativa si
a > 0, b > 0
ya que el coeciente de s
2
es positivo e igual a uno. Ahora se har a uso del
criterio de Routh para vericar este resultado. De acuerdo a las reglas del
criterio de Routh se construye la tabla 4.2. El criterio de Routh establece
que el n umero de cambios de signo al recorrer los elementos de la primera
columna es igual al n umero de races con parte real positiva. Por tanto, si
no hay cambios de signo entonces las dos races tendr an parte real negativa.
Como el primer elemento de la primera columna es igual a 1, el cual es un
n umero positivo, entonces las condiciones:
a > 0, b > 0
deben cumplirse simult aneamente para asegurar que ambas races tienen parte
real negativa. De este modo, el criterio de Routh y la regla de los signos de la
secci on 4.2 dan el mismo resultado, como se esperaba.
Tabla 4.2. Aplicacion del criterio de Routh al polinomio s
2
+ as + b.
s
2
1 b 0
s
1
a 0
s
0
b
Ejemplo 4.10 Sea el siguiente polinomio:
s
3
+ 5s
2
+ 2s 8
Dado que existe un coeciente de signo contrario al de los otros (8) se puede
usar la regla de los signos vista en la secci on 4.2 para concluir que existe al
menos una raz con parte real positiva. Ahora se har a uso del criterio de Routh
194 4 Criterios de estabilidad y error
para vericar este resultado. De acuerdo a las reglas del criterio de Routh se
construye la tabla 4.3. El criterio de Routh establece que el n umero de cambios
de signo al recorrer los elementos de la primera columna es igual al n umero
de races con parte real positiva. Por tanto, se concluye que el polinomio s
3
+
5s
2
+2s 8 tiene una raz con parte real positiva. De hecho, usando software
especializado se pueden usar metodos numericos para encontrar que:
s = 2, s = 1, s = 4
son las races del polinomio en cuesti on.
Tabla 4.3. Aplicacion del criterio de Routh al polinomio s
3
+ 5s
2
+ 2s 8.
s
3
1 2 0
s
2
5 -8 0
s
1 521(8)
5
= 3.6 0
s
0
8
Ejemplo 4.11 Sea el siguiente polinomio:
s
3
+ 1.8s
2
+ 0.61s + 2.02
N otese que todos los coecientes del polinomio tienen el mismo signo (todos
son positivos). En este caso la regla de los signos vista en la secci on 4.2 no es
de utilidad porque el polinomio es de tercer grado. En este tipo de situaciones
el criterio de Routh es de gran utilidad. De acuerdo a las reglas del criterio de
Routh se construye la tabla 4.4. El criterio de Routh establece que el n umero
de cambios de signo al recorrer los elementos de la primera columna es igual
al n umero de races con parte real positiva. Por tanto, se concluye que el
polinomio s
3
+1.8s
2
+0.61s +2.02 tiene dos races con parte real positiva. De
hecho, usando software especializado se pueden usar metodos numericos para
encontrar que:
s = 2, s = 0.1 +j, s = 0.1 j
son las races del polinomio en cuesti on.
Tabla 4.4. Aplicacion del criterio de Routh al polinomio s
3
+1.8s
2
+0.61s +2.02.
s
3
1 0.61 0
s
2
1.8 2.02 0
s
1 1.80.6112.02
1.8
= 0.512 0
s
0
2.02
4.3 Criterio de estabilidad de Routh 195
Ejemplo 4.12 Sea el siguiente polinomio:
s
3
+as
2
+bs +c
donde a, b y c son constantes reales desconocidas. Este tipo de situaciones es
muy com un en sistemas de control donde los coecientes del polinomio carac-
terstico dependen de las ganancias del controlador, las cuales no se conocen
de antemano y deben ser determinadas de modo que se asegure la estabilidad
en lazo cerrado. Esto se consigue asegurando que todas las races del polino-
mio caracterstico de lazo cerrado tengan parte real negativa. Sin embargo, el
c alculo de las races de un polinomio de tercer orden usando f ormulas analti-
cas es un proceso tedioso y, por tanto, esa no es una soluci on pr actica. Este
es otro tipo de problema en el que el criterio de Routh es de gran utilidad.
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.5. El
criterio de Routh establece que el n umero de cambios de signo al recorrer los
elementos de la primera columna es igual al n umero de races con parte real
positiva. Por tanto, como el primer elemento de la columna es igual a 1, es
decir es positivo, entonces si:
a > 0,
ab c
a
> 0 c > 0 (4.15)
se asegura que las tres races tiene parte real negativa. N otese que las condi-
ciones en (4.15) son equivalentes a:
a > 0, b >
c
a
> 0 c > 0
Esto indica que aunque a los coecientes a y c s olo se les exige que deben ser
positivos, en el caso del coeciente b esto no es suciente y se le exige un poco
m as: b >
c
a
> 0.
Tabla 4.5. Aplicacion del criterio de Routh al polinomio s
3
+ as
2
+ bs + c.
s
3
1 b 0
s
2
a c 0
s
1 ab1c
a
0
s
0
c
Ejemplo 4.13 (Caso especial. Solo el elemento de la primera colum-
na de un renglon es igual a cero) Sea el siguiente polinomio:
s
5
+ 2s
4
+ 3s
3
+ 6s
2
+ 5s + 3
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.6. Sin
embargo, la construcci on de la tabla se detiene en el rengl on correspondiente a
196 4 Criterios de estabilidad y error
s
3
porque el elemento de la primera columna de ese rengl on es cero. Esto trae
como consecuencia algunas divisiones entre cero al continuar construyendo los
siguientes renglones. Se recomienda sustituir el cero de la primera columna
por un valor > 0 peque no pero positivo y continuar construyendo la tabla
como se muestra en la tabla 4.7.
Tabla 4.6. Aplicacion del criterio de Routh al polinomio s
5
+2s
4
+3s
3
+6s
2
+5s+3.
s
5
1 3 5
s
4
2 6 3
s
3 2316
2
= 0
2513
2
= 3.5 0
s
2
s
1
s
0
Tabla 4.7. Aplicacion del criterio de Routh al polinomio s
5
+2s
4
+3s
3
+6s
2
+5s+3
(continuacion).
s
5
1 3 5
s
4
2 6 3
s
3
3.5 0
s
2 623.5

320

= 3 0
s
1 42496
2
1214
0
s
0
3
Ahora determnese el n umero de cambios de signo en la primera columna
conforme > 0 tiende a cero. N otese que en el caso de este ejemplo hay dos
cambios de signo. Esto signica que el polinomio bajo estudio tiene dos races
con parte real positiva. De hecho, se puede usar software especializado para
encontrar, usando metodos numericos, que las races del polinomio s
5
+2s
4
+
3s
3
+ 6s
2
+ 5s + 3 son:
s = 0.3429 +j1.5083, s = 0.3429 j1.5083, s = 1.6681,
s = 0.5088 +j0.7020, s = 0.5088 j0.7020
Si al considerar > 0 no hubiera cambios de signo al recorrer la primera
columna entonces el sistema es marginalmente estable, es decir, hay races
sobre el eje imaginario.
Ejemplo 4.14 (Caso especial. Un renglon esta formado por ceros
exclusivamente o un renglon esta formado por un solo elemento el
cual, ademas, es cero) Sea el siguiente polinomio:
4.3 Criterio de estabilidad de Routh 197
s
3
+ 3s
2
+s + 3
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.8. Sin
embargo, la construcci on de la tabla se detiene en el rengl on correspondien-
te a s
1
porque todo ese rengl on est a formado exclusivamente por ceros. Este
es un caso especial que indica la existencia de races: 1) simetricas y reales,
2) simetricas e imaginarias, o 3) 4 races colocadas sobre los vertices de un
rect angulo centrado en el origen. Para continuar con el metodo se debe for-
mar un polinomio con los elementos del rengl on inmediato superior al rengl on
formado exclusivamente por ceros:
P(s) = 3s
2
+ 3,
se obtiene su derivada:
dP(s)
ds
= 6s
y se sustituyen estos coecientes en el rengl on formado exclusivamente por
ceros, como se muestra en la tabla 4.9, para continuar construyendo la tabla.
Tabla 4.8. Aplicacion del criterio de Routh al polinomio s
3
+ 3s
2
+ s + 3.
s
3
1 1 0
s
2
3 3 0
s
1 3113
3
= 0 0
s
0
Tabla 4.9. Aplicacion del criterio de Routh al polinomio s
3
+ 3s
2
+ s + 3 (conti-
nuacion).
s
3
1 1 0
s
2
3 3 0
s
1
6 0
s
0
3
Como no hay cambios de signo al recorrer los elementos de la primera
columna se concluye que no hay races con parte real positiva y se concluye,
por tanto, que de los tres casos mencionados anteriormente s olo es posible el
caso 2): hay races simetricas e imaginarias. Es m as, un aspecto importante
en este caso especial es el siguiente:
Con los elementos del rengl on inmediato superior al rengl on formado ex-
clusivamente por ceros forme un polinomio. Las races de dicho polinomio
tambien son races del polinomio original.
198 4 Criterios de estabilidad y error
Esto signica que las races del polinomio 3s
2
+ 3 tambien son races del
polinomio s
3
+ 3s
2
+s + 3. Estas races se pueden obtener como:
3s
2
+ 3 = 0, s = j
Por tanto, el polinomio s
3
+ 3s
2
+ s + 3 tiene una raz en s = j y otra en
s = j. De hecho, se puede usar software especializado para encontrar, usando
metodos numericos, que las races del polinomio s
3
+ 3s
2
+s + 3 son:
s = 3, s = j, s = j
Ejemplo 4.15 (Caso especial. Un renglon esta formado por ceros
exclusivamente o un renglon esta formado por un solo elemento el
cual, ademas, es cero) Sea el siguiente polinomio:
s
4
+s
2
+ 1
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.10. Como
hay un rengl on formado exclusivamente por ceros se procede como en el ejem-
plo anterior. El polinomio formado con los elementos del rengl on inmediato
superior (igual al polinomio original en este caso) es derivado respecto a s:
P(s) = s
4
+s
2
+ 1,
dP(s)
ds
= 4s
3
+ 2s
Tabla 4.10. Aplicacion del criterio de Routh al polinomio s
4
+ s
2
+ 1.
s
4
1 1 1 0
s
3
0 0 0
s
2
s
1
s
0
Tabla 4.11. Aplicacion del criterio de Routh al polinomio s
4
+s
2
+1 (continuacion).
s
4
1 1 1 0
s
3
4 2 0
s
2 4112
4
= 0.5
4110
4
= 1
s
1 0.5241
0.5
= 1.5 0
s
0
1
Los coecientes del polinomio resultante se sustituyen en el rengl on for-
mado exclusivamente por ceros y se contin ua con la construcci on de la tabla
4.3 Criterio de estabilidad de Routh 199
como se muestra en la tabla 4.11. Como hay dos cambios de signo al recorrer
la primera columna de la tabla 4.11 se concluye que existen dos races con
parte real positiva. Esto signica que es posible uno de los siguientes casos:
hay races simetricas y reales, o hay 4 races colocadas sobre los vertices de
un rect angulo centrado en el origen. De hecho, se puede hacer uso de softwa-
re especializado para encontrar, usando metodos numericos que las races del
polinomio s
4
+s
2
+ 1 son:
s = 0.5 j0.8660, s = 0.5 j0.8660
es decir, hay 4 races colocadas sobre los vertices de un rect angulo centrado
en el origen.
Ejemplo 4.16 (Races repetidas sobre el eje imaginario) Cuando el
polinomio caracterstico tiene races repetidas sobre el eje imaginario la fun-
ci on de transferencia es inestable. Sin embargo, este tipo de inestabilidad no
es detectado por el metodo del criterio de Routh. Por ejemplo, suponga que el
siguiente es el polinomio caracterstico de una funci on de transferencia:
s
4
+ 2s
2
+ 1 = [(s +j)(s j)]
2
N otese que hay dos races repetidas sobre el eje imaginario. De acuerdo a las
reglas del criterio de Routh se construye la tabla 4.12. Como hay un rengl on
formado exclusivamente por ceros se obtiene la derivada del siguiente polino-
mio:
P(s) = s
4
+ 2s
2
+ 1,
dP(s)
ds
= 4s
3
+ 4s
y se contin ua con el metodo como se muestra en la tabla 4.13.
Tabla 4.12. Aplicacion del criterio de Routh al polinomio s
4
+ 2s
2
+ 1.
s
4
1 2 1 0
s
3
0 0 0
s
2
s
1
s
0
Como hay otro rengl on formado exclusivamente por ceros se obtiene la
derivada del siguiente polinomio:
P
1
(s) = s
2
+ 1,
dP
1
(s)
ds
= 2s
y se contin ua con el metodo como se muestra en la tabla 4.14. N otese que
no hay cambios de signo en la primera columna de la tabla 4.14 por lo que
200 4 Criterios de estabilidad y error
Tabla 4.13. Aplicacion del criterio de Routh al polinomio s
4
+2s
2
+1 (continuacion).
s
4
1 2 1 0
s
3
4 4 0
s
2 4241
4
= 1
4110
4
= 1 0
s
1
0 0
s
0
Tabla 4.14. Aplicacion del criterio de Routh al polinomio s
4
+2s
2
+1 (continuacion).
s
4
1 2 1 0
s
3
4 4 0
s
2
1 1 0
s
1
2 0
s
0
1
el metodo indica, correctamente, que no hay races con parte real positiva.
Adem as, las races del polinomio P
1
(s) = s
2
+ 1 son s = j, por lo que se
concluye estabilidad marginal. N otese que esto es incorrecto porque el poli-
nomio s
4
+ 2s
2
+ 1 tiene dos races imaginarias repetidas dos veces, lo cual
implica inestabilidad. As que debe tenerse cuidado con estos casos.
4.4. Error en estado estacionario
Se ha visto que la solucion de una ecuacion diferencial siempre esta dada
como la suma de la respuesta natural y la respuesta forzada. Si la ecuacion
diferencial es estable o, equivalentemente, si la funcion de transferencia es es-
table entonces la respuesta natural desaparece al crecer el tiempo y la solucion
alcanza la respuesta forzada. Recuerdese que la respuesta forzada depende de
(o es similar a) la entrada aplicada a la ecuacion diferencial. De acuerdo a
este razonamiento, en un sistema de control en lazo cerrado se procede del
siguiente modo. 1) La entrada del sistema en lazo cerrado es una se nal que
representa el valor que se desea alcance la salida del sistema en lazo cerrado.
Por esto, a dicha se nal de entrada se le conoce como la referencia o la salida
deseada. 2) El controlador se dise na de manera que el sistema en lazo cerrado
sea estable y que la respuesta forzada del sistema en lazo cerrado sea igual o
muy cercana a la referencia o salida deseada.
En esta seccion se estudian las propiedades que debe tener un sistema de
control en lazo cerrado para que la respuesta forzada del sistema realimentado
sea igual o muy cercana a la entrada del sistema en lazo cerrado, es decir a la
referencia o salida deseada. Notese que esto equivale a conseguir que la se nal
de error, denida como la diferencia entre la salida del sistema y la referencia
o salida deseada, sea cero o muy cercana a cero en estado estacionario, es
4.4 Error en estado estacionario 201
decir, cuando el tiempo es muy grande. Por esta razon, en lo que sigue se
estudia el comportamiento del error en estado estacionario.
Considere el sistema en lazo cerrado con realimentacion unitaria mostrado
en la gura 4.10. Como se muestra en esta seccion, un concepto fundamental
para la determinacion del error en estado estacionario es el tipo del sistema,
el cual se dene a continuacion. Una funcion de transferencia de lazo abierto
de orden n siempre se puede escribir del siguiente modo:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
s
N
(s p
1
)(s p
2
) (s p
nN
)
donde n es el n umero de polos de lazo abierto y m es el n umero de ceros de
lazo abierto con n > m, z
j
= 0, j = 1, . . . , m y p
i
= 0, i = 1, . . . , n N.
De este modo, N es el n umero de polos que la funcion de transferencia de
lazo abierto tiene en el origen (una vez cancelados los ceros que la funcion de
transferencia de lazo abierto pueda tener en el origen). Por denicion, el tipo
del sistema es igual a N, es decir, es el n umero de integradores que el sistema
tiene en lazo abierto.
Por otro lado, la se nal de error esta dada como la diferencia entre la salida
del sistema realimentado y la referencia o salida deseada:
E(s) = R(s) C(s) C(s) = R(s) E(s)
y por otro lado:
C(s) = G(s)E(s) = R(s) E(s)
de donde se encuentra que:
+

R(s) E(s) C(s)


G(s)
Figura 4.10. Sistema en lazo cerrado con realimentacion unitaria.
E(s)[1 +G(s)] = R(s)
E(s) =
1
1 +G(s)
R(s) (4.16)
El error en estado estacionario e
ss
se obtiene usando (4.16) y el teorema del
valor nal presentado en (3.3), es decir:
e
ss
= lm
t
e(t) = lm
s0
sE(s) = lm
s0
s
1 +G(s)
R(s) (4.17)
202 4 Criterios de estabilidad y error
Como el error en estado estacionario es la diferencia entre la salida del siste-
ma c(t) y la referencia o salida deseada r(t), en estado estacionario, es logico
que en la expresion anterior e
ss
dependa de la referencia R(s). Por tanto, para
continuar con el estudio es necesario conocer el valor de R(s) lo cual motiva la
denicion de se nales de prueba. Una se nal de prueba debe ser una funcion del
tiempo con dos caractersticas: 1) que tenga un signicado fsico de importan-
cia en aplicaciones reales y 2) que sea sencilla de manejar matematicamente.
A continuacion se denen algunas de las se nales (o entradas) de prueba mas
com unes en control clasico.
Considere el problema del control de la posicion de un ca non antiaereo.
En este problema se desea que el ca non apunte todo el tiempo hacia un avion
que se mueve a gran velocidad. Algunas situaciones que pueden presentarse
son las siguientes.
Entrada de prueba escalon. Suponga que el avion se dirige directa-
mente hacia el ca non sobre una direccion de valor constante A. Si el ca non
inicialmente apunta hacia una direccion diferente (cero) a donde se en-
cuentra el avion, entonces la referencia o la direccion en la que se desea
apunte el ca non tiene la forma mostrada en la gura 4.11. Esta se nal se
conoce como escalon y representa un cambio muy rapido (discontinuo) en
la direccion en que se desea apunte el ca non. Entonces el ca non debe mo-
verse rapidamente para que la direccion en que realmente apunta alcance
la direccion deseada, mostrada en la gura 4.11. Mas a un, se desea que en
estado estacionario la diferencia entre estas se nales sea cero o al menos,
en el peor de los casos, muy cercana a cero. Si r(t) es un escalon:
r(t) =
_
0, t < 0
A, t 0
donde A es una constante, entonces R(s) = L{r(t)} =
A
s
es una funcion
sucientemente sencilla para ser manejada matematicamente.
A
t
r(t)
0
Figura 4.11. Entrada de prueba escalon.
Entrada de prueba rampa. Suponga que el avion pasa enfrente del
ca non con velocidad constante A, dirigiendose hacia otro punto, y que
4.4 Error en estado estacionario 203
inicialmente el ca non esta apuntando hacia el avion (en cero). Entonces la
referencia o la direccion en la que se desea apunte el ca non tiene la forma
mostrada en la gura 4.12. Esta se nal se conoce como rampa e indica
que se desea que la direccion en la que apunta el ca non cambie con una
velocidad constante A (la velocidad del avion). Si r(t) es una rampa:
r(t) =
_
0, t < 0
At, t 0
donde A =
dr(t)
dt
es una constante que representa la velocidad con que
r(t) cambia, entonces R(s) = L{r(t)} =
A
s
2
es una funcion sucientemente
sencilla para ser manejada matematicamente.
A
t 0
r(t)
Figura 4.12. Entrada de prueba rampa.
Entrada de prueba parabola. Suponga que ahora el avion pasa enfrente
del ca non con aceleracion constante A (tratando de escapar), dirigiendose
hacia otro punto, y que inicialmente el ca non esta apuntando hacia el avion
(en cero). Entonces la referencia o la direccion en la que se desea apunte
el ca non tiene la forma mostrada en la gura 4.13. Esta se nal se conoce
como parabola e indica que se desea que la direccion en la que apunta el
ca non cambie con una aceleracion constante A (la aceleracion del avion).
Si r(t) es una parabola:
r(t) =
_
0, t < 0
1
2
At
2
, t 0
donde A =
d
2
r(t)
dt
2
es una constante que representa la aceleracion con que
r(t) cambia, entonces R(s) = L{r(t)} =
A
s
3
es una funcion sucientemente
sencilla para ser manejada matematicamente.
Como cualquiera de las tres situaciones anteriores puede aparecer durante
el funcionamiento del sistema de control de posicion del ca non antiaereo, el
dise no del controlador debe ser tal que el error de estado estacionario sea cero
o muy peque no ante cualquiera de las tres se nales de prueba. A continuacion
se determinan las condiciones que permiten conseguir estas especicaciones
para cada se nal de prueba.
204 4 Criterios de estabilidad y error
r(t)
t 0
2
1
At
2
Figura 4.13. Entrada de prueba parabola.
4.4.1. Referencia tipo escalon
Suponga que R(s) = A/s es un escalon de altura A. Usando la expresion
en (4.17) se obtiene:
e
ss
= lm
s0
s
1 +G(s)
A
s
=
A
1 +k
p
, k
p
= lm
s0
G(s)
donde k
p
se conoce como la constante de error estatica de posicion y su va-
lor esta directamente relacionado con el tipo del sistema. Por esta razon se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la funcion de transferencia de lazo
abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
(s p
1
)(s p
2
) (s p
n
)
por lo que:
k
p
= lm
s0
G(s) =
k(z
1
)(z
2
) (z
m
)
(p
1
)(p
2
) (p
n
)
k
p
es nito. Esto signica que el error en estado estacionario es diferente
de cero:
e
ss
=
A
1 +k
p
= 0
Sistemas tipo mayor o igual a 1 (N 1). En este caso la funcion de
transferencia de lazo abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
s
N
(s p
1
)(s p
2
) (s p
nN
)
por lo que:
4.4 Error en estado estacionario 205
k
p
= lm
s0
G(s) =
k(z
1
)(z
2
) (z
m
)
s
N
(p
1
)(p
2
) (p
nN
)

Esto signica que el error en estado estacionario es igual a cero:
e
ss
=
A
1 +k
p
= 0
4.4.2. Referencia tipo rampa
Suponga que R(s) = A/s
2
es una rampa de pendiente A. Usando la ex-
presion en (4.17) se obtiene:
e
ss
= lm
s0
s
1 +G(s)
A
s
2
=
A
k
v
, k
v
= lm
s0
sG(s)
donde k
v
se conoce como la constante de error estatica de velocidad y su
valor esta directamente relacionado con el tipo del sistema. Por esta razon se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la funcion de transferencia de lazo
abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
(s p
1
)(s p
2
) (s p
n
)
por lo que:
k
v
= lm
s0
sG(s) = (0)
k(z
1
)(z
2
) (z
m
)
(p
1
)(p
2
) (p
n
)
= 0
Esto signica que el error en estado estacionario crece sin lmite (tiende a
innito):
e
ss
=
A
k
v

Sistemas tipo igual a 1 (N = 1). En este caso la funcion de transferencia


de lazo abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
s(s p
1
)(s p
2
) (s p
n1
)
por lo que:
k
v
= lm
s0
sG(s) =
k(z
1
)(z
2
) (z
m
)
(p
1
)(p
2
) (p
n1
)
206 4 Criterios de estabilidad y error
k
v
es un n umero diferente de cero y nito. Esto signica que el error en
estado estacionario es diferente de cero:
e
ss
=
A
k
v
= 0
Sistemas tipo mayor o igual a 2 (N 2). En este caso la funcion de
transferencia de lazo abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
s
N
(s p
1
)(s p
2
) (s p
nN
)
por lo que:
k
v
= lm
s0
sG(s) =
k(z
1
)(z
2
) (z
m
)
s
N1
(p
1
)(p
2
) (p
nN
)

porque N 1 1. Esto signica que el error en estado estacionario es
igual a cero:
e
ss
=
A
k
v
= 0
4.4.3. Referencia tipo parabola
Suponga que R(s) = A/s
3
es una parabola con segunda derivada igual a
A. Usando la expresion en (4.17) se obtiene:
e
ss
= lm
s0
s
1 +G(s)
A
s
3
=
A
k
a
, k
a
= lm
s0
s
2
G(s)
donde k
a
se conoce como la constante de error estatica de aceleracion y su
valor esta directamente relacionado con el tipo del sistema. La funcion de
transferencia de lazo abierto tiene la forma:
G(s) =
k(s z
1
)(s z
2
) (s z
m
)
s
N
(s p
1
)(s p
2
) (s p
nN
)
por lo que:
k
a
= lm
s0
s
2
G(s) =
k(z
1
)(z
2
) (z
m
)
s
N2
(p
1
)(p
2
) (p
nN
)
Esto signica que:
El error en estado estacionario crece sin lmite (tiende a innito) para
sistemas tipo menor o igual a 1:
e
ss
=
A
k
v
, N 1
4.4 Error en estado estacionario 207
El error en estado estacionario es diferente de cero para sistemas tipo igual
a 2:
e
ss
=
A
k
v
= 0, N = 2
El error en estado estacionario es igual a cero para sistemas tipo mayor o
igual a 3:
e
ss
=
A
k
v
= 0, N 3
Notese que, para las tres referencias o se nales de prueba consideradas, el
error en estado estacionario se hace cero si se incrementa convenientemente el
n umero de integradores que tiene la funcion de transferencia de lazo abierto
(tipo del sistema). Esto explica porque algunos controladores incluyen un
integrador (vease la seccion 5.2.4 donde se estudia el controlador PI). Por
otro lado, es muy importante subrayar que los resultados que se acaban de
presentar solo se cumplen si se asegura que el sistema en lazo cerrado es
estable ya que los resultados anteriores se han obtenido suponiendo que la
respuesta natural tiende a cero conforme el tiempo crece. Mas adelante, en los
captulos 5 y 6, se explica que el adicionar polos de lazo abierto (integradores,
cuando dichos polos estan en s = 0) tiende a hacer inestable al sistema en lazo
cerrado. As que no siempre sera posible, o conveniente, dise nar un sistema
de control con error en estado estacionario igual a cero y se debera conformar
con un error en estado estacionario peque no.
Finalmente, y por razones didacticas, en la gura 4.14 se muestra graca-
mente el comportamiento de la salida c(t) con respecto a la referencia r(t),
cuando esta es una rampa, para los distintos tipos de sistema.
t
0
r(t)
c(t)
e
ss
= 0
e
ss
6=0
e
ss
! 1
Figura 4.14. Comportamiento de la salida c(t) cuando la referencia r(t) es una
rampa. Notese que ess = 0 cuando el tipo es mayor o igual a 2, ess = 0 cuando el
tipo es igual a 1 y ess cuando el tipo es igual a 0.
Ejemplo 4.17 En la gura 4.15 se muestra un sistema de control de veloci-
dad de un motor de CD (vease el captulo 9). El modelo del motor est a dado
208 4 Criterios de estabilidad y error
por la funci on de transferencia G
m
(s) =
k
s+a
, con k > 0 y a > 0, mientras que
la constante positiva k
p
representa la funci on de transferencia de un controla-
dor proporcional. Esto signica que la corriente usada como se nal de control
se calcula como:
i

= k
p
(
d
)
donde es la velocidad medida,
d
es la velocidad deseada e I

(s) es la
transformada de Laplace de i

. La funci on de transferencia de lazo abierto es:


G(s)H(s) =
k
p
k
s +a
N otese que al ser a > 0 este sistema es tipo 0 porque la funci on de transferen-
cia de lazo abierto no tiene ning un polo en el origen (en s = 0). Por tanto,
de acuerdo a la secci on 4.4.1, si la velocidad deseada es constante (es decir,
un escal on) entonces el error en estado estacionario e
ss
=
d
lm
t
(t)
es constante y diferente de cero, es decir, un controlador proporcional de ve-
locidad no es util para conseguir que el motor alcance la velocidad deseada.
N otese que, de acuerdo a las secciones 4.4.2 y 4.4.3, el problema es m as grave
(es decir, el error en estado estacionario es mayor) si la velocidad deseada
tuviera la forma de una rampa o de una par abola.
+

(s) !(s) !
d
(s)
s+a
k
k
p
Figura 4.15. Sistema de control proporcional de velocidad.
La manera de resolver este problema, cuando la velocidad deseada es una
constante, es usando un controlador proporcional-integral (PI). El controlador
PI realiza la siguiente operaci on sobre el error de velocidad:
i

= k
p
e +k
i
_
t
0
e(r)dr, e =
d

donde k
p
y k
i
son constantes positivas.Usando la transformada de Laplace se
obtiene:
I

(s) = k
p
E(s) +k
i
E(s)
s
=
_
k
p
+
k
i
s
_
E(s)
4.4 Error en estado estacionario 209
=
_
k
p
s +k
i
s
_
E(s)
= k
p
_
s +
ki
kp
s
_
E(s)
donde E(s) es la transformada de Laplace del error de velocidad. Con esto
es posible construir el diagrama de bloques de lazo cerrado que se muestra
en la gura 4.16. N otese que ahora el sistema es tipo 1 porque la funci on de
transferencia de lazo abierto:
G(s)H(s) = k
p
_
s +
ki
kp
s
_
k
s +a
tiene un polo en s = 0 y, por tanto, de acuerdo a la secci on 4.4.1 el error en
estado estacionario es cero, es decir, la velocidad del motor alcanza la veloci-
dad deseada cuando el tiempo sea sucientemente grande y si
d
es constante
(un escal on). As, el termino integral en un controlador PI es introducido con
el n de llevar a cero el error en estado estacionario. Finalmente, debe acla-
rarse que este resultado ser a totalmente cierto s olo hasta que se asegure que
el sistema en lazo cerrado sea estable, es decir, hasta que todos los polos de
lazo cerrado tengan parte real negativa.
Por otro lado, n otese que, de acuerdo a las secciones 4.4.2 y 4.4.3 el con-
trolador PI de velocidad s olo es util para referencias tipo escal on, pues el error
en estado estacionario sigue siendo diferente de cero si la referencia de velo-
cidad tiene forma de una rampa o de una par abola.
+

k
p
s
s+
kp
k
i
I

(s)
!(s) !
d
(s)
s+a
k
Figura 4.16. Sistema de control proporcional-integral de velocidad.
Ejemplo 4.18 Considere el sistema de control proporcional de posici on de
un motor de CD mostrado en la gura 4.17. N otese que la funci on de trans-
ferencia del motor tiene un polo en s = 0 cuando la posici on es la salida a
controlar, por lo que el sistema es de tipo 1 y el error en estado estacionario
es cero si la posici on deseada es una constante (un escal on) (vease la secci on
4.4.1). Es interesante darse cuenta que este resultado se mantiene (la posici on
del motor alcanzar a a la posici on deseada) si se usa cualquiera de los siguien-
tes controladores (veanse los captulos 5 y 10): a) un controlador PD (gura
210 4 Criterios de estabilidad y error
4.18), b) un controlador proporcional de posici on con realimentaci on de velo-
cidad (gura 4.19), o c) o un compensador de adelanto (gura 4.20). Aunque
con cualquiera de estos controladores, el requisito de un error cero en estado
estacionario es satisfecho autom aticamente por las propiedades matem aticas
del modelo del motor (el polo en el origen con el que cuenta), sin embargo el
prop osito de todos estos controladores es introducir el amortiguamiento y la
rapidez de respuesta deseados as como asegurar la estabilidad del sistema en
lazo cerrado. Es importante aclarar que si la estabilidad en lazo cerrado no
es asegurada, entonces tampoco se asegura que el error en estado estacionario
sea cero, a pesar de que el sistema sea de tipo 1.
I

(s) (s)
+

d
s ( )
k
p s s+a ( )
k
Figura 4.17. Control proporcional de posicion.
+

s(s+a)
k
I

(s)
(s)
d
(s)
k
d
s +
k
d
k
p

Figura 4.18. Sistema de control proporcional-derivativo de posicion.
+

(s) +

(s)

d
s ( )
k
p
s s+a ( )
k
k
v
s
Figura 4.19. Control proporcional de posicion con realimentacion de velocidad.
4.4 Error en estado estacionario 211
+

(s) (s)

d
s ( )
s s+a ( )
k

s+c
s+d
Figura 4.20. Control de posicion con un compensador de adelanto.
Ejemplo 4.19 Que sucede en un motor de CD que pueda explicar el porque,
cuando la referencia es un escal on, un controlador proporcional de velocidad
no puede conseguir un error cero en estado estacionario y, en cambio, s lo
puede conseguir un controlador proporcional de posici on?
La respuesta a esta pregunta es la siguiente. Cuando en un sistema de
control proporcional de posici on el error es igual a cero (cuando la posici on
del motor es igual a la posici on deseada) entonces la corriente i

= k
p
(
d
)
ordenada al motor es cero, el motor se detiene y, por tanto, la condici on

d
= puede mantenerse para siempre.
En cambio, en un sistema de control proporcional de velocidad, si la velo-
cidad del motor es igual a la velocidad deseada entonces la corriente ordenada
al motor i

= k
p
(
d
) es cero y el motor se detendra. Esto signica que
la condici on
d
= no puede mantenerse para siempre y como resultado,
en un sistema de control proporcional de velocidad esta variable alcanza, en
estado estacionario, un valor constante tal que la diferencia entre y
d
sea
suciente para generar una corriente i

= k
p
(
d
) que mantenga girando
al motor en esa velocidad. Cuando se utiliza un controlador PI de velocidad
entonces la integral del error
_
t
0
(
d
(r))dr es constante cuando
d
= y
ese valor constante, multiplicado por la ganancia integral k
i
es suciente para
producir una corriente que mantiene girando al motor a la velocidad deseada.
Ejemplo 4.20 Considere un sistema de control de posici on de un motor de
CD que cuenta con un controlador PID, es decir, la consigna de corriente
est a dada como:
i

= k
p
e +k
d
de
dt
+k
i
_
t
0
e(r)dr, e =
d

Usando la transformada de Laplace se obtiene:


I

(s) = k
p
E(s) +k
d
sE(s) +k
i
E(s)
s
=
_
k
p
+k
d
s +
k
i
s
_
E(s)
= k
d
s
2
+
kp
k
d
s +
ki
k
d
s
E(s)
De este modo se obtiene el diagrama de bloques mostrado en la gura 4.21.
N otese que el motor tiene un polo en s = 0 y el controlador tiene otro polo en
212 4 Criterios de estabilidad y error
s = 0, es decir el sistema es tipo 2 porque la funci on de transferencia de lazo
abierto tiene dos polos en el origen (en s = 0). Esto signica, de acuerdo a
las secciones 4.4.1 y 4.4.2 que la posici on alcanzar a a la posici on deseada
d
si esta tiene la forma de un escal on o de una rampa. En cambio, el error en
estado estacionario ser a diferente de cero y constante si la posici on deseada
tiene la forma de una par abola (vease la secci on 4.4.3).
+

k
d
s
s
2
+
k
d
k
p
s+
k
d
k
i
I

(s) (s)
d
(s)
s(s+a)
k
Figura 4.21. Sistema de control PID de posicion.
s s+a ( )
k

s+c
s+b
s
2

+
+ +

A
x
A
A

ks
Xd(s) X(s)

1 2
Figura 4.22. Control de un sistema ball and beam.
Por otro lado, considere el sistema mostrado en la gura 4.22. Se trata del
sistema de control de posici on de un sistema ball and beam (vease el captulo
12). N otese que la funci on de transferencia de lazo abierto cuenta con dos
polos en s = 0. En este caso, estos dos polos de lazo abierto en el origen son
parte del modelo del sistema ball and beam a controlar, es decir, la planta posee
de manera natural dichos polos y no es necesario introducir un controlador
de tipo integral para generarlos. Por tanto, el error en estado estacionario
ser a igual a cero si la posici on deseada x
d
es un escal on o una rampa, pero si
la referencia es una par abola entonces el error en estado estacionario ser a una
constante diferente de cero.
Ejemplo 4.21 Suponga que tiene un motor de CD con funci on de transferen-
cia G
m
(s) =
(s)
I

(s)
=
k
s(s+a)
y que se desea que el error en estado estacionario
sea igual a cero cuando la referencia de posici on
d
sea una par abola. En este
caso se necesita que el sistema sea de tipo 3 y como la planta tiene un polo
4.5 Resumen del captulo 213
en s = 0 es necesario introducir un controlador que tenga dos polos en s = 0.
Por tanto, se propone un controlador de la forma:
i

= k
p
e +k
d
de
dt
+k
i
_
t
0
e(r)dr +k
ii
_
t
0
_
r
0
e()ddr, e =
d

el cual se puede escribir como:


I

(s) =
k
d
s
3
+k
p
s
2
+k
i
s +k
ii
s
2
E(s) (4.18)
donde E(s) es la transformada de Laplace del error de posici on, lo cual mues-
tra que tiene dos polos en s = 0 y que, por tanto, es util para resolver el
problema en cuesti on. N otese que adem as de introducir el termino de la in-
tegral doble, con ganancia k
ii
, tambien se ha incluido el termino de una in-
tegral sencilla con ganancia k
i
. Esto se hace para mejorar la estabilidad en
lazo cerrado. Si no se introduce el termino de la integral sencilla entonces se
obtendr an pobres desempe nos en la respuesta transitoria o incluso se puede
producir inestabilidad. Como regla general, si el controlador ha de introducir
una integral iterada de orden k entonces se deber an incluir tambien terminos
que incluyan todas las integrales iteradas de orden 1 hasta k1. Esto con el n
de mejorar la respuesta transitoria y asegurar la estabilidad en lazo cerrado.
4.5. Resumen del captulo
En este captulo se han presentado las herramientas preliminares basicas
para el analisis y dise no de sistemas de control de orden arbitrario. Primero se
debe entender que la respuesta de cualquier sistema de control en lazo cerra-
do, por complejo que sea, esta determinada por la funcion de transferencia
equivalente en lazo cerrado.
La representacion de un sistema de control mediante diagramas de bloques
y su correspondiente simplicacion son fundamentales para obtener la funcion
de transferencia de lazo cerrado. A partir de esta funcion de transferencia se
puede determinar i) la estabilidad en lazo cerrado y la respuesta transitoria
(polos de la funcion de transferencia de lazo cerrado), y ii) la respuesta en
estado estacionario (o valor nal).
En el captulo 3 se explica que para que una funcion de transferencia sea
estable es necesario y suciente que todos sus polos tengan parte real negativa.
Sin embargo, el vericar esta condicion mediante el calculo exacto de dichos
polos es un problema complejo. Esto es particularmente cierto cuando el valor
de los coecientes del polinomio no se conocen numericamente. Esta situacion
es frecuente en el dise no de sistemas de control ya que los coecientes del poli-
nomio caracterstico dependen de las ganancias del controlador las cuales a un
no se conocen. Mas a un, es deseable que las ganancias del controlador puedan
seleccionarse dentro de un rango de valores con el n de hacer exible el di-
se no del sistema de control. Estas caractersticas requieren el uso de tecnicas
214 4 Criterios de estabilidad y error
analticas (y no numericas) para determinar cuando el sistema de control en
lazo cerrado es estable. Este hecho representa un grave problema porque las
formulas analticas para determinar las races de polinomios de grado superior
son complejas. Mas a un, no existe solucion analtica para polinomios de grado
quinto o mayor. Esta problematica es resuelta, nalmente, usando el crite-
rio de estabilidad de Routh el cual, debe recordarse, simplemente representa
una herramienta para vericar si todas las races del polinomio caracterstico
tienen sus partes reales negativas. Por otro lado, la regla de los signos para
determinar la ubicacion de las races de un polinomio, vista en la seccion 4.2,
es un metodo que tiene sus limitaciones. Sin embargo, al ser mucho mas simple
que el criterio de Routh puede tener algunas ventajas en ciertas aplicaciones
y por eso tambien se ha presentado en este captulo.
El estudio del error en estado estacionario que se ha presentado en este
captulo, establece criterios para seleccionar el controlador mas conveniente
a n de conseguir que la respuesta en estado estacionario alcance al valor
deseado. Dicho de otro modo, para que la respuesta forzada sea igual, o muy
cercana, a la entrada del sistema en lazo cerrado o valor deseado a la salida.
Finalmente, la seleccion del controlador tambien debe hacerse de modo que se
consiga la respuesta transitoria deseada, a partir de una adecuada ubicacion
de los polos de lazo cerrado. La solucion de este problema se presenta en el
captulo siguiente.
4.6. Preguntas de repaso
1. Que es el tipo de un sistema en lazo cerrado?
2. Como se puede aumentar el tipo de un sistema de control?
3. Cual es la relacion entre el criterio de estabilidad de Routh y el requeri-
miento de que todas las races del polinomio caracterstico tengan parte
real negativa?
4. Para que sirve y cual es la principal desventaja de la regla de los signos
vista en la seccion 4.2?
5. Suponga que de acuerdo al estudio del error en estado estacionario se con-
cluye que el valor nal de la salida alcanzara el valor deseado Por que es
necesario que el sistema sea estable para que esto sea completamente cier-
to?
6. Suponga que para conseguir un error en estado estacionario igual a cero
necesita usar un controlador que incluya una integral quntuple (5 inte-
grales anidadas) Por que debe incluir tambien las integrales cuadruple
(4 integrales anidadas), triple y doble? Tambien debe incluir la integral
sencilla? Por que? Justique su respuesta usando un motor de CD como
planta y usando el criterio de Routh.
7. Que relacion existe entre el estudio del error en estado estacionario, pre-
sentado en este captulo, y el objetivo de conseguir que la respuesta for-
4.7 Ejercicios propuestos 215
zada alcance a la entrada del sistema en lazo cerrado (o valor deseado a
la salida)?
8. Considere el tanque que contiene agua estudiado en el ejemplo 3.2 del
captulo 3. Por que un controlador proporcional de nivel no consigue un
error en estado estacionario igual a cero, pero un controlador proporcional-
integral s puede conseguirlo? Justique su respuesta tambien desde el
punto de vista de la fsica del sistema: Que pasa con el ujo de entrada
cuando el nivel es igual al nivel deseado?
9. Que cuidado debe tener al aplicar el criterio de Routh a polinomios con
races repetidas con parte real cero?
10. El estudio del error en estado estacionario que se ha presentado solo consi-
dera valores deseados a la salida tipo escalon, rampa y parabola Que su-
cede en aplicaciones como la del ca non antiaereo (captulo 1) donde no se
conoce de manera exacta cual es la salida deseada?
4.7. Ejercicios propuestos
1. En base al conocimiento del tipo que debe tener un sistema para asegurar
un error en estado estacionario igual a cero para referencias escalon, ram-
pa y parabola, demuestre que la funcion de transferencia de lazo cerrado
correspondiente (vease la gura 4.10) debe tener las siguientes caractersti-
cas:
Los terminos independientes de s, en el numerador y en el denomina-
dor, deben ser iguales para conseguir un error cero en estado estacio-
nario ante una referencia tipo escalon.
Los terminos independientes de s as como los de primer orden en s,
tanto en el numerador como en el denominador, deben ser iguales para
conseguir un error cero en estado estacionario ante una referencia tipo
rampa.
Los terminos independientes de s as como los de primer orden y los de
segundo orden en s, en el numerador y en el denominador, deben ser
iguales para conseguir un error cero en estado estacionario ante una
referencia tipo parabola.
Notese que esto signica que el controlador tambien debe asignar conve-
nientemente los ceros de la funcion de transferencia, lo cual respalda los
argumentos presentados en el ejemplo 4.21 (vease (4.18)).
2. En los ejemplos 3.17 y 3.18 del captulo 3 se presentan explicaciones
basadas en la experiencia cotidiana para entender porque el control
proporcional-integral (expresion en (3.97)) de nivel de agua y el control
proporcional de un sistema masa-amortiguador consiguen que h h
d
y
x x
d
cuando t y h
d
y x
d
son constantes. Ahora revise esos ejem-
plos y explique esos resultados a partir del conocimiento del tipo de dichos
sistemas de control.
216 4 Criterios de estabilidad y error
3. Considere el sistema masa-resorte-amortiguador presentado en el ejemplo
3.6 del captulo 3. Si se aplica una fuerza constante de valor A y la masa
alcanza el reposo, es decir x = 0 y x = 0, entonces sustituyendo esto
directamente en la ecuacion diferencial correspondiente se obtiene que la
posicion que alcanza la masa es x =
A
K
. Ahora utilice el teorema del valor
nal para calcular el valor nal de x cuando f = A. Que relacion existe
entre las condiciones x = 0 y x = 0 y el requisito s 0 del teorema del
valor nal?
4. Considere el sistema masa-resorte-amortiguador rotativo:
J

+f

+K = T
donde J es la inercia, f es el coeciente de friccion viscosa, K es la cons-
tante de rigidez del resorte, es la posicion angular del cuerpo y T es el
par aplicado el cual esta dado como el siguiente controlador PID:
T = k
p
e +k
d
de
dt
+k
i
_
t
0
e(r)dr, e =
d

Use el criterio de Routh para demostrar que las siguientes condiciones:


J > 0 k
i
> 0, K +k
p
> 0,
f +k
d
J
>
k
i
K +k
p
> 0
aseguran la estabilidad en lazo cerrado. Notese que una ganancia integral
k
i
grande tiende a producir inestabilidad y que este efecto puede ser com-
pensado usando valores grandes de k
p
y de k
d
. Tambien puede observarse
que una inercia J peque na permite el uso de ganancias integrales mas
grandes antes de que aparezca la inestabilidad y que lo mismo ocurre si la
constante de rigidez K es grande. Puede encontrar una explicacion desde
el punto de vista de la mecanica (fsica) para este fenomeno?
5. Procediendo como en el ejemplo 4.3 de este captulo, demuestre que la
funcion de transferencia del sistema de lazo cerrado mostrado en la gura
4.3 es:
M(s) =
C(s)
R(s)
=
G(s)
1 G(s)H(s)
cuando el sistema tiene realimentacion positiva, es decir, cuando el tra-
yecto de realimentacion se suma (en lugar de restarse) en la gura 4.3.
6. Considere el sistema mecanico mostrado en la gura 4.23. En el ejemplo
2.4 del captulo 2 se encontro que el modelo matematico correspondiente
esta dado como:
d
2
x
m1
dt
2
+
b
1
m
1
dx
m1
dt
+
K
m
1
(x
m1
x
m2
) =
1
m
1
F(t)
d
2
x
m2
dt
2
+
b
2
m
2
dx
m2
dt

K
m
2
(x
m1
x
m2
) = 0
4.7 Ejercicios propuestos 217
donde x
m1
es la posicion de m
1
y x
m2
es la posicion de m
2
. Aplique la
transformada de Laplace a cada una de las expresiones anteriores para ex-
presar X
m1
(s) y X
m2
(s) como las salidas de dos funciones de transferencia.
Obtenga el diagrama de bloques correspondiente conectando conveniente-
mente estas dos funciones de transferencia de acuerdo a las entradas que
cada una de ellas tiene. Usando el resultado del ejercicio previo, reduzca
este diagrama de bloques para comprobar que:
X
m2
(s) =
G
1
(s)G
2
(s)/m
1
1 G
1
(s)G
2
(s)K/m
1
F(s)
donde F(s) es la transformada de Laplace de F(t) y:
G
1
(s) =
1
s
2
+
b1
m1
s +
K
m1
G
2
(s) =
K
m2
s
2
+
b2
m2
s +
K
m2
Usando este resultado compruebe que la funcion de transferencia
Xm2(s)
F(s)
tiene un polo en s = 0 Que signica esto? Para ello suponga
que se aplica una fuerza constante F(t) en el tiempo Que pasa con
la posicion de la masa m
2
bajo el efecto de esta fuerza? Y que pa-
sara con la posicion de la masa m
1
? Para esto encuentre la funcion de
transferencia existente entre X
m1
(s) y X
m2
(s).
Use el criterio de Routh para encontrar las condiciones bajo las cuales
la funcion de transferencia
Xm2(s)
F(s)
no es inestable.
Notese que se puede proceder del mismo modo con los otros ejemplos del
captulo 2 que tambien incluyen resortes.
K
F t ( )
m
2
m
1
b
1
b
2
Figura 4.23. Dos cuerpos unidos por un resorte.
Al nal del captulo 5 se proponen otros ejercicios cuya solucion involucra
el uso de los conceptos estudiados en el presente captulo.
Referencias
1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-
zine, pp. 17-25, June 1996.
2. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
3. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
4. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
5. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
6. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espa nol, McGraw-Hill, Mexico, 1992.
5
Dise no usando la respuesta en el tiempo
La herramienta mas importante para dise nar sistemas de control usando la
respuesta en el tiempo es el metodo del lugar de las races propuesto por W.R.
Evans entre 1948 y 1950. El propio Evans dijo que la motivacion especca que
recibio para desarrollar el metodo del lugar de las races vino de una pregunta
que le planteo un alumno durante un curso que imparta en North American
Aviation. De hecho, los primeros en usar el metodo fueron los dise nadores de
North American Aviation.
222 5 Dise no usando la respuesta en el tiempo
Objetivos del captulo
Entender que signica lugar de las races.
Aprender a dibujar el lugar de las races.
Analizar y dise nar sistemas de control usando el metodo del lugar de las
races.
Considere el sistema en lazo cerrado mostrado en la gura 5.1. En el ejem-
plo 4.3 de la seccion 4.1 se muestra que la funcion de transferencia del sistema
en lazo cerrado esta dada como:
M(s) =
C(s)
R(s)
=
G(s)
1 +G(s)H(s)
(5.1)
En el captulo 3 se explica que la respuesta en el tiempo c(t) = L
1
{C(s)} =
+

G(s)
H(s)
C(s) R(s)
Figura 5.1. Sistema en lazo cerrado.
L
1
{M(s)R(s)} esta dada como la suma de la respuesta natural y de la
respuesta forzada: c(t) = c
n
(t) +c
f
(t). Los objetivos del sistema de control en
la gura 5.1 son:
Que el sistema de control en lazo cerrado sea estable, es decir que
lm
t
c
n
(t) = 0, lo cual se asegura si todos los polos de la funcion de
transferencia de lazo cerrado M(s) tienen parte real menor que cero. Esto
es importante porque consigue que conforme el tiempo crece la respuesta
del sistema c(t) converge a la respuesta forzada c
f
(t).
Que la convergencia c
n
(t) 0 sea conseguida rapidamente.
Que la respuesta forzada sea igual a la salida deseada c
f
(t) = r(t) =
L
1
{R(s)}.
El ultimo punto constituye las caractersticas de respuesta en estado estacio-
nario y la manera de asegurar que el sistema en lazo cerrado responde con las
caractersticas deseadas se estudia en la seccion 4.4. El segundo punto cons-
tituye las caractersticas de respuesta transitoria deseadas y en este captulo
se estudia la manera de dise nar un controlador que asegure que el sistema en
lazo cerrado responda con las caractersticas deseadas. Debe subrayarse que al
asegurar que se obtienen las caractersticas deseadas de respuesta transitoria
tambien se debe asegurar la estabilidad del sistema en lazo cerrado.
5.1 Dise no con el lugar de las races 223
El problema de dise nar un controlador consiste en asignar conveniente-
mente los polos 1 + G(s)H(s) = 0 y los ceros G(s) = 0 de la funcion de
transferencia de lazo cerrado M(s). En control clasico los polos y los ceros de
la planta siempre se consideran conocidos y la estructura del controlador se
propone como algo conocido (para satisfacer las caractersticas de respuesta
en estado estacionario, por ejemplo). Sin embargo la ubicacion exacta de los
polos y los ceros del controlador debe ser seleccionada de modo que se asegure
que los polos de lazo cerrado 1 +G(s)H(s) = 0 esten colocados en los valores
deseados y que los ceros de lazo cerrado G(s) = 0 esten colocados convenien-
temente. En este captulo se presenta una de las herramientas principales de
control clasico para resolver este problema: el metodo del lugar de las races.
Este metodo determina la ubicacion de los polos de la funcion de transferencia
de lazo cerrado M(s) a partir del estudio de la funcion de transferencia de
lazo abierto G(s)H(s). Ademas, es posible ubicar los ceros de la funcion de
transferencia de lazo cerrado M(s) de modo que su efecto sobre la respuesta
del sistema en lazo cerrado sea peque no.
5.1. Dise no con el lugar de las races. Caractersticas
deseadas de la respuesta transitoria
Suponiendo que los polos y los ceros de la planta se conocen, el metodo del
lugar de las races es una herramienta graca que es util para determinar cuales
seran los polos de lazo cerrado si se usa un controlador que contiene ciertos
polos y ceros que se proponen o que se deben calcular. Por otro lado, tambien
es posible utilizar el lugar de las races para conseguir que uno o varios ceros de
lazo cerrado se cancelen con uno o varios polos de lazo cerrado. De acuerdo a la
seccion 3.9.1 esto permite reducir el orden del sistema y eliminar la presencia
de ceros de manera que la respuesta transitoria del sistema en lazo cerrado
puede ser aproximada por uno de los casos sencillos estudiados en las secciones
3.1 y 3.3. Estas caractersticas facilitan la tarea de dise nar el controlador de
manera que la funcion de transferencia de lazo cerrado M(s) tenga los polos
y los ceros que aseguren las caractersticas deseadas de respuesta transitoria.
El lugar de las races esta representado por varias curvas cuyos puntos cons-
tituyen los polos del sistema de lazo cerrado obtenidos conforme un parametro,
k, es variado desde k = 0 hasta k = +. De acuerdo a (5.1), todo punto s
que sea un polo de lazo cerrado (y que, por tanto, pertenezca al lugar de las
races) debe cumplir 1 + G(s)H(s) = 0. El lugar de las races se construye
proponiendo puntos s en el plano complejo s, los cuales deben ser vericados
si satisfacen la condicion para ser polos de lazo cerrado: 1 + G(s)H(s) = 0.
Para vericar esta condicion de una manera sencilla se propone un conjunto
de reglas que se listan a continuacion. Estas reglas dan lugar a la construccion
graca del lugar de las races el cual se dibuja a partir de los polos y los ceros
de la funcion de transferencia de lazo abierto G(s)H(s). Esto signica que los
224 5 Dise no usando la respuesta en el tiempo
polos de lazo cerrado seran determinados a partir de los polos y los ceros de
lazo abierto.
La funcion de transferencia de lazo abierto se puede escribir como:
G(s)H(s) = k

m
j=1
(s z
j
)

n
i=1
(s p
i
)
, n > m (5.2)
donde z
j
, j = 1, . . . , m, son los ceros de lazo abierto y p
i
, i = 1, . . . , n, son
los polos de lazo abierto. Siendo z
j
, p
i
y s n umeros complejos, en general,
ubicados en el plano s se puede escribir:
s z
j
= l
j

j
s p
i
= l
i

i
como se ilustra en la gura 5.2. Entonces:
Re s ( )
Im s ( )
z
j
p
i
s
l
j
l
i

i
s

z
j
s

p
i
Figura 5.2. Representacion graca de los factores s zj y s pi.
G(s)H(s) = k

m
j=1
l
j

n
i=1
l
i

i
= k

m
j=1
l
j

n
i=1
l
i

_
_
m

j=1

j

n

i=1

i
_
_
(5.3)
Por otro lado, los valores de s que satisfacen lo siguiente son los polos de lazo
cerrado:
1 +G(s)H(s) = 0 (5.4)
Esto signica que los polos de lazo cerrado son los valores de s que satisfacen:
G(s)H(s) = 1 = 1 (2q + 1)180

, q = 0, 1, 2, . . . (5.5)
Usando (5.3) y (5.5) se obtiene la condicion de magnitud (5.6) y la condicion
de angulo (5.7) que debe satisfacer todo s que sea polo de lazo cerrado y que,
por tanto, pertenezca al lugar de las races:
5.1 Dise no con el lugar de las races 225
k

m
j=1
l
j

n
i=1
l
i
= 1 (5.6)
m

j=1

j

n

i=1

i
= (2q + 1)180

, q = 0, 1, 2, . . . (5.7)
A partir de estas condiciones se obtienen las siguientes reglas.
5.1.1. Reglas para construir el lugar de las races.
1. El lugar de las races empieza (k = 0) en los polos de lazo abierto.
Usando (5.2) y (5.4):
1 +G(s)H(s) = 1 +k

m
j=1
(s z
j
)

n
i=1
(s p
i
)
= 0
=

n
i=1
(s p
i
) +k

m
j=1
(s z
j
)

n
i=1
(s p
i
)
= 0
=
n

i=1
(s p
i
) +k
m

j=1
(s z
j
) = 0 (5.8)
=
n

i=1
(s p
i
) = 0
si k = 0. Lo que signica que los polos de lazo cerrado (los que satisfacen
1 + G(s)H(s) = 0) son identicos a los polos de lazo abierto (s = p
i
,
i = 1, . . . , n).
2. El lugar de las races termina (k ) en los ceros de lazo
abierto.
Partiendo de (5.8):
1 +G(s)H(s) =
n

i=1
(s p
i
) +k
m

j=1
(s z
j
) = 0
k
m

j=1
(s z
j
) = 0
porque

n
i=1
(s p
i
) k

m
j=1
(s z
j
) si k . Lo que signica que los
polos de lazo cerrado (los que satisfacen 1 +G(s)H(s) = 0) son identicos
a los ceros de lazo abierto (s = z
j
, j = 1, . . . , m).
3. Cuando k hay nm ramas del lugar de las races que tienden
hacia alg un punto en el innito del plano s. Esto signica que
la funcion de transferencia de lazo abierto G(s)H(s) tiene n m
ceros en el innito.
Estas ramas pueden ser identicadas mediante la inclinacion de la linea
226 5 Dise no usando la respuesta en el tiempo
recta a la que cada una de dichas ramas tiende asintoticamente conforme
k . El angulo que cada asntota forma con el eje real positivo se
puede calcular como:
angulo de la asntota =
180

(2q + 1)
n m
, q = 0, 1, 2, . . . (5.9)
Esta formula se puede obtener del siguiente modo. Cuando se considera un
Re s ( )
Im s ( )
s

polos y ceros
de lazo abierto
asntota
Figura 5.3. Polos y ceros de lazo abierto para determinar las asntotas de la regla
3.
punto s que se encuentra muy lejos del origen sobre una asntota, todos
los polos y todos los ceros de G(s)H(s), o de lazo abierto, se observan
todos reunidos en un punto del plano s, como se muestra en la gura 5.3.
Por tanto, el angulo con que contribuye cada polo y cada cero de lazo
abierto a la condicion en (5.7) (vease la gura 5.3) es identico al de los
demas, es decir, representando dicho angulo por la condicion de angulo
(5.7) se puede escribir como:
m

j=1

j

n

i=1

i
= (mn) = (2q + 1)180

, q = 0, 1, 2, . . .
Despejando de esta expresion se obtiene:
=
(2q + 1)180

n m
, q = 0, 1, 2, . . .
lo cual se convierte en (5.9) al hacer =angulo de la asntota (vease la
gura 5.3).
4. El punto
a
donde las asntotas intersectan el eje real se calcula
como [5], Cap. 6:

a
=

i
p
i

j
z
j
n m
5.1 Dise no con el lugar de las races 227
5. Considere un punto sobre el eje real del plano s. Suponga que a
la derecha de dicho punto existe un n umero de polos (No. po-
losD) y de ceros (No. cerosD) reales que al ser sumados (N=No.
polosD+No. cerosD) dan un n umero impar N. Entonces dicho
punto sobre el eje real forma parte del lugar de las races. En
caso contrario tal punto no pertenece al lugar de las races.
Observe la gura 5.4 y considere la condicion de angulo (5.7). Notese que
dos polos o dos ceros complejos conjugados producen angulos que al su-
marse son iguales a 0 o a 360

por lo que no tienen contribucion en la


condicion de angulo (5.7). Esto signica que, en este caso, en la expre-
sion (5.7) solo se deben considerar los polos y ceros reales. Por otro lado,
notese que todo polo y cero real que se encuentre colocado a la izquierda
del punto de prueba s contribuye con un angulo cero. Esto signica que
en la expresion (5.7) solo se deben considerar los polos y ceros reales que
se encuentren a la derecha del punto de prueba s. Notese que cada cero
real a la derecha del punto s contribuye con un angulo de +180

y cada
polo a la derecha del mismo punto contribuye con un angulo de 180

.
Por tanto, en angulo total con el que contribuyen todos los polos y ceros
que estan a la derecha del punto de prueba es:
m

j=1

j

n

i=1

i
= No.cerosD(+180

) + No.polosD(180

)
Por otro lado, si la resta de dos n umeros es un n umero impar entonces
Re s ( )
Im s ( )
s

j
180

180

0
j

0
i
Figura 5.4. Polos y ceros de lazo abierto para estudiar la regla 5.
la suma de los mismos n umeros es un n umero impar. Por tanto, si:
m

j=1

j

n

i=1

i
= (No.cerosDNo.polosD) (+180

) = (2q + 1)180

228 5 Dise no usando la respuesta en el tiempo


para alg un q = 0, 1, 2, . . ., es decir (No. cerosDNo. polosD) es impar,
entonces tambien se cumple:
m

j=1

j

n

i=1

j
= N (+180

) = (2q + 1)180

para alg un q = 0, 1, 2, . . ., es decir con N =(No. PolosD+No. cerosD)


impar. Notese que esta ultima expresion constituye la condicion de angulo
(5.7) por lo que el punto de prueba s en la gura 5.4 es un polo de lazo
cerrado y forma parte del lugar de las races.
6. El lugar de las races es simetrico respecto al eje horizontal.
Esto se entiende facilmente si se recuerda que todo polo complejo aparece
siempre simultaneamente con su pareja conjugada (vease el ultimo parrafo
de la seccion 3.6).
7. El angulo de salida de un polo complejo se calcula como:
angulo de salida de un polo complejo=
(2q + 1)180

[angulos de vectores desde los ceros hacia el polo en


cuestion]

[angulos de vectores desde los otros polos hacia el polo en cuestion]


(5.10)
La explicacion de esta formula es como sigue. Considere la gura 5.5. El
Re s ( )
Im s ( ) s

pv

i

j
p
v
p
i
z
j
Figura 5.5. Polos y ceros de lazo abierto para estudiar la regla 7.
punto s es un punto que pertenece al lugar de las races y que esta inni-
tesimalmente cercano al polo en el punto p
v
. El angulo
pv
medido como
el angulo formado con respecto al eje horizontal positivo por el vector
trazado desde el polo en p
v
hacia el punto s es igual al angulo de salida
del polo complejo en p
v
. La condicion de angulo (5.7) establece que:
m

j=1

j

n

i=1

i
=
5.1 Dise no con el lugar de las races 229
= (
z1
+
z2
+ +
zm
) (
p1
+
p2
+ +
pv
+ +
pn
)
= (2q + 1)180

, q = 0, 1, 2, . . .
donde
zj
y
pi
representan los angulos debidos a los ceros y a los polos de
lazo abierto, respectivamente (puede considerarse que s = p
v
). Despejando

pv
:

pv
= (2q + 1)180

+ (
z1
+
z2
+ +
zm
) (
p1
+
p2
+ +
pn
)
para q = 0, 1, 2, . . ., que equivale a la formula (5.10).
8. El angulo de llegada a un cero complejo se calcula como:
angulo de llegada a un cero complejo=
(2q +1)180

[angulos de vectores desde los otros ceros hacia el cero


en cuestion]
+

[angulos de vectores desde los polos hacia el cero en cuestion]


(5.11)
La explicacion de esta formula es como sigue. Considere la gura 5.6. El
Re s ( )
Im s ( ) s

i

j
p
i
z
j
z
v

zv
Figura 5.6. Polos y ceros de lazo abierto para estudiar la regla 8.
punto s es un punto que pertenece al lugar de las races y que esta inni-
tesimalmente cercano al cero en el punto z
v
. El angulo
zv
medido como
el angulo formado con respecto al eje horizontal positivo por el vector
trazado desde el cero en z
v
hacia el punto s es igual al angulo de llegada
al cero en z
v
. La condicion de angulo (5.7) establece que:
m

j=1

j

n

i=1

i
=
= (
z1
+
z2
+ +
zv
+ +
zm
) (
p1
+
p2
+ +
pn
)
= (2q + 1)180

donde q = 0, 1, 2, . . ., mientras que


zj
y
pi
representan los angulos de-
bidos a los ceros y a los polos de lazo abierto, respectivamente (puede
considerarse que s = z
v
). Despejando
zv
:
230 5 Dise no usando la respuesta en el tiempo

zv
= (2q + 1)180

(
z1
+
z2
+ +
zm
) + (
p1
+
p2
+ +
pn
)
para q = 0, 1, 2, . . ., que equivale a la formula (5.11).
9. La ganancia de lazo abierto, k, requerida para que un punto s,
perteneciente al lugar de las races, verdaderamente sea selec-
cionado como un polo de lazo cerrado se calcula de manera que
se satisfaga la condicion de magnitud (5.6):
k =

n
i=1
l
i

m
j=1
l
j
10. Los puntos de cruce con el eje imaginario se pueden obtener usando el
criterio de Routh (vease la seccion 4.3).
Finalmente dos reglas practicas:
11. Un polo de lazo abierto (en el semiplano izquierdo) agregado
al lugar de las races tiende a inestabilizar al sistema en lazo
cerrado. Este efecto inestabilizante es mayor conforme el polo
se coloque cada vez mas cerca del origen.
Considere la gura 5.7, donde s representa un punto que pertenece al lugar
de las races y se esta considerando un sistema que en lazo abierto no tiene
ceros y solo tiene los dos polos mostrados. De acuerdo a la condicion de
angulo (5.7):
(
p1
+
p2
) = 180

En la gura 5.8 se conservan los polos en p


1
y en p
2
pero se agrega un
Re s ( )
Im s ( )
s

p1

p2
p
1
p
2
Figura 5.7. Un punto perteneciente al lugar de las races de un sistema con dos
polos en lazo abierto.
tercer polo en p
3
. Ahora la condicion de angulo (5.7) se escribe como:
5.1 Dise no con el lugar de las races 231
Re s ( )
Im s ( )
s

p1

p2
p
1
p
2

p3
p
3
Figura 5.8. El lugar de las races es empujado hacia la derecha al introducir un
polo adicional de lazo abierto.
(
p1
+
p2
+
p3
) = 180

Esto signica que la suma


p1
+
p2
debe ser menor en la gura 5.8 que
en la gura 5.7 lo cual se consigue si el punto s en la gura 5.7 se recorre
hacia la derecha como en la gura 5.8, es decir, si el lugar de las races es
doblado hacia la derecha en la gura 5.8. Es facil ver que esta desviacion
es mayor (el lugar de las races es empujado cada vez mas hacia la zona
de inestabilidad) conforme
p3
es mayor, es decir, conforme p
3
es mas
cercano al origen. Esto es una muestra de que un controlador integral
tiende a inestabilizar a un sistema en lazo cerrado.
12. Un cero de lazo abierto (en el semiplano izquierdo) agregado al
lugar de las races tiende a aumentar la estabilidad del sistema
en lazo cerrado. Este efecto estabilizante es mayor conforme el
cero se coloque cada vez mas cerca del origen.
Considere de nuevo la gura 5.7. De acuerdo a la condicion de angulo
(5.7):
(
p1
+
p2
) = 180

En la gura 5.9 se conservan los polos en p


1
y en p
2
pero se agrega un
cero en z
1
. Ahora la condicion de angulo (5.7) se escribe como:

z1
(
p1
+
p2
) = 180

Esto signica que la suma


p1
+
p2
debe ser mayor en la gura 5.9 que
en la gura 5.7 lo cual se consigue si el punto s en la gura 5.7 se recorre
hacia la izquierda como en la gura 5.9, es decir, si el lugar de las races es
doblado hacia la izquierda en la gura 5.9. Es facil ver que esta desviacion
es mayor (el sistema es halado cada vez mas hacia la zona de mayor
estabilidad) conforme
z1
es mayor, es decir, conforme z
1
es mas cercano
232 5 Dise no usando la respuesta en el tiempo
Re s ( )
Im s ( )
s

p1
p2
p
1
p
2

z1
z
1
Figura 5.9. El lugar de las races es halado hacia la izquierda al introducir un cero
adicional de lazo abierto.
al origen. Esto es una muestra de que el controlador derivativo tiende a
estabilizar a un sistema.
5.2. Ejemplos
5.2.1. Control proporcional de posicion
De acuerdo al captulo 10, el siguiente es el modelo de un motor de CD
cuando no existen perturbaciones externas:
(s) =
k
s(s +a)
I

(s) (5.12)
a =
b
J
> 0, k =
nk
m
J
> 0
donde (s) e I

(s) representan la posicion (salida) y la consigna de corriente


(entrada), respectivamente. Suponga que se usa el siguiente control propor-
cional de posicion:
I

(s) = k
p
(
d
(s) (s))
donde
d
(s) es la posicion deseada y k
p
es una constante conocida como la
ganancia proporcional. El sistema en lazo cerrado se puede representar como
en la gura 5.10, de donde se concluye que la funcion de transferencia en lazo
abierto esta dada como:
G(s)H(s) =
k
p
k
s(s +a)
(5.13)
5.2 Ejemplos 233
Notese que el sistema es tipo 1 por lo que el error en estado estacionario es
cero cuando la posicion deseada es un escalon. Por tanto, el unico problema
de dise no que resta es seleccionar el valor de k
p
de manera que los polos de
lazo cerrado esten ubicados en los lugares deseados. A continuacion se estudia
este problema usando el metodo del lugar de las races. La ganancia k
p
es
+

k
p
I

(s)
(s)
d
(s)
s(s+a)
k
Figura 5.10. Sistema de control proporcional de posicion.
variada por el metodo para que tome valores desde 0 hasta +. Primero se
reescribe G(s)H(s) en la siguiente forma:
G(s)H(s) =
k
p
k
l
1
l
2
(
1
+
2
)
donde se han denido los vectores s 0 = l
1

1
, s (a) = l
2

2
(vease
la gura 5.11). Las dos condiciones fundamentales que denen el lugar de las
races son las condiciones de angulo (5.7) y de magnitud (5.6) las cuales se
expresan, respectivamente, como:
(
1
+
2
) = (2q + 1)180

, q = 0, 1, 2, . . .
k
p
k
l
1
l
2
= 1
La regla 5 indica que sobre el eje real solo existe lugar de las races entre los
puntos s = 0 y s = a. Ademas, de acuerdo a la regla 1, el lugar de las races
inicia (k
p
= 0) en s = 0 y s = a. Por otro lado, de acuerdo a las reglas 2 y
3, cuando k
p
tiende a + las ramas que inician en los puntos s = 0 y s = a
deben terminar en alg un cero de lazo abierto (no existe ninguno en este caso)
o en alg un punto en el innito del plano s. Por tanto, el lugar de las races
debe alejarse de los puntos s = 0 y s = a, sobre el eje real, conforme k
p
crece de manera que debe existir un punto de separacion en alg un lugar entre
dichos puntos para luego dirigirse hacia el innito sobre el plano s.
Por otro lado, de acuerdo a la condicion de angulo, (
1
+
2
) = 180

=
(+
1
) en la gura 5.11, se concluye que =
2
y, por lo que los triangulos
t
1
y t
2
deben ser identicos para cualquier polo de lazo cerrado s. Entonces,
las dos ramas mencionadas anteriormente y que son mostradas en la gura
5.11 deben ser paralelas al eje imaginario. Esto signica que el punto donde
las dos ramas se separan del eje real esta ubicado en el punto medio entre los
polos ubicados en s = 0, s = a, es decir en (0 a)/2 = a/2. Esto tambien
234 5 Dise no usando la respuesta en el tiempo
Re s ( )
Im s ( )
a
0

2
a
l
1
l
2
t
1
t
2
s

2

Figura 5.11. Lugar de las races para G(s)H(s) =
kpk
s(s+a)
.
puede vericarse usando las reglas 3 y 4. Finalmente, de acuerdo a la regla 6
ambas ramas son simetricas respecto al eje horizontal.
La condicion de magnitud se usa cuando se necesita conocer el valor exacto
de k
p
que permita conseguir un punto especco sobre el lugar de las races.
Notese, por ejemplo, que al crecer k
p
hacia + las longitudes l
1
y l
2
deben
crecer para satisfacer la condicion de magnitud
k
p
k
l
1
l
2
= 1 (5.14)
lo cual signica que los polos de lazo cerrado correspondientes a valores gran-
des de k
p
tienden a alg un punto en el innito del plano s. Por tanto, se
concluye: i) los dos polos de lazo cerrado son reales, negativos y diferentes
cuando k
p
> 0 es peque na y ambos se aproximan al punto s = a/2; esto
signica que la rapidez del sistema aumenta porque el polo mas lento se aleja
del origen, ii) de acuerdo a la condicion de magnitud, cuando:
k
p
=
l
1
l
2
k
=
a
2
4k
, con l
1
= l
2
=
a
2
,
los dos polos de lazo cerrado son reales, repetidos, negativos y ubicados en
s =
a
2
; por lo que se alcanza la mayor rapidez sin que haya oscilaciones, iii)
conforme k
p
>
a
2
4k
se incrementa los dos polos se alejan del eje real (uno hacia
arriba y el otro hacia abajo) sobre la linea vertical que pasa por s =
a
2
;
esto signica que el sistema es mas rapido (porque
n
, la distancia de los
polos al origen, aumenta; vease la seccion 3.3) y la respuesta del sistema
5.2 Ejemplos 235
en lazo cerrado (de segundo orden) es cada vez mas oscilatoria (porque el
angulo 90

disminuye y el amortiguamiento, dado como = sin(90

),
disminuye; vease la seccion 3.3).
Todo lo anterior signica que no es posible conseguir simultaneamente una
respuesta tan rapida y tan amortiguada como se desee. Esto es una consecuen-
cia directa de que los polos de lazo cerrado no pueden ser ubicados en cualquier
lugar del plano s y solo pueden ser colocados sobre la linea gruesa mostrada
en la gura 5.11. En el siguiente ejemplo se muestra que la introduccion de
un cero en la funcion de transferencia de lazo abierto permite colocar los dos
polos de lazo cerrado en cualquier punto del plano s.
5.2.2. Control proporcional-derivativo (PD) de posicion
Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero
ahora junto con el siguiente controlador proporcional-derivativo:
i

= k
p
e +k
d
de
dt
, e =
d

donde k
p
es, como antes, la ganancia proporcional y k
d
es una constante
conocida como la ganancia derivativa. Usando la transformada de Laplace se
obtiene:
I

(s) = k
p
E(s) +k
d
sE(s)
= (k
p
+k
d
s)E(s)
= k
d
_
s +
k
p
k
d
_
E(s)
por lo que se obtiene el diagrama de bloques mostrado en la gura 5.12.
Entonces, la funcion de transferencia de lazo abierto esta dada como:
G(s)H(s) =
k
d
k(s +c)
s(s +a)
, c =
k
p
k
d
> 0 (5.15)
Notese que ahora es k
d
la ganancia que el metodo vara desde 0 hasta +para
+

s(s+a)
k
I

(s)
(s)
d
(s)
k
d
s +
k
d
k
p

Figura 5.12. Sistema de control proporcional-derivativo de posicion.
dibujar el lugar de las races. Primero se reescribe G(s)H(s) en la siguiente
forma:
236 5 Dise no usando la respuesta en el tiempo
G(s)H(s) =
k
d
k l
3
l
1
l
2

3
(
1
+
2
) (5.16)
donde se han denido los vectores s0 = l
1

1
, s(a) = l
2

2
, s(c) =
l
3

3
. Las condiciones de angulo y de magnitud se expresan, respectivamente,
como:

3
(
1
+
2
) = (2q + 1)180

, q = 0, 1, 2, . . .
k
d
k l
3
l
1
l
2
= 1
El lugar de las races correspondiente a este caso se puede obtener a par-
tir del obtenido para la funcion de transferencia en (5.13) considerando que
simplemente se ha adicionado un cero en s = c.
De acuerdo a la regla 12 el cero sera la causa para que las dos ramas del
lugar de las races mostrado en la gura 5.11 se doblen hacia la izquierda.
Esto puede comprobarse usando la regla 3 para encontrar que ahora existe una
sola rama del lugar de las races que tiende hacia una asntota que forma un
angulo de 180
0
con el eje real positivo. Como se muestra en la gura 5.13 el
a c
Re(s)
Im(s)
(a) c > a
a c
Im(s)
Re(s)
(b) c < a
Figura 5.13. Lugar de las races para G(s)H(s) =
k
d
k(s+c)
s(s+a)
.
lugar de las races puede tener dos formas diferentes dependiendo de en donde
5.2 Ejemplos 237
se coloque el cero en s = c. Si se coloca a la izquierda del polo en s = a
(como en la gura 5.13(a)) entonces, de acuerdo a la regla 5, existira lugar de
las races sobre dos segmentos del eje real negativo: entre los puntos s = 0 y
s = a y a la izquierda del cero en s = c. Ademas, de acuerdo a las reglas
2 y 3 una de las dos ramas del lugar de las races que inician (k
d
= 0) en
los polos de lazo abierto colocados en s = 0 y s = a debe tender al cero en
s = c mientras que la otra rama debe tender hacia el innito del plano s
siguiendo la asntota que forma un angulo de 180
0
con el eje real positivo. Por
tanto, debe existir un punto de separacion entre los puntos s = 0 y s = a.
Ademas, como el lugar de las races es simetrico respecto al eje real (regla
6) entonces despues de separarse estas ramas deben formar dos semicrculos
hacia la izquierda del punto de separacion para volverse a unir sobre el eje
real negativo en un punto a la izquierda del cero en s = c para que, luego,
una de las ramas se aproxime al cero en s = c y la otra se vaya hacia el
innito sobre el eje real negativo.
Por otro lado, si el cero en s = c se coloca entre los polos de lazo abierto
en s = 0 y s = a entonces, de acuerdo a la regla 5, existira lugar de las sobre
los segmentos del eje real negativo colocados entre los puntos s = c y s = 0
as como a la izquierda del polo en s = a. Notese que ahora la rama que
inicia (k
d
= 0) en s = 0 tiende al cero en s = c mientras que la rama que
inicia (k
d
= 0) en s = a tiende al innito sobre el eje real negativo. Notese
tambien que esto es posible sin necesidad de que existan ramas fuera del eje
real, como se muestra en la gura 5.13(b).
A partir de este estudio del lugar de las races, se puede ver que el sistema
en lazo cerrado es estable para cualquier k
p
> 0 y k
d
> 0 porque las dos
posibilidades para el lugar de las races que han sido presentadas en la gura
5.13 muestran que los polos de lazo cerrado siempre estan sobre el semipla-
no complejo izquierdo s (polos con parte real negativa). A continuacion se
muestra que siempre existen ganancias k
p
y k
d
que permiten colocar los polos
de lazo cerrado en cualquier punto sobre el semi plano complejo izquierdo s
que se desee. De acuerdo a (5.1), la funcion de transferencia de lazo cerrado
esta dada como:
(s)

d
(s)
=
k
d
k(s +c)
s
2
+ (a +k
d
k)s +ck
d
k
(5.17)
es decir, existen dos polos de lazo cerrado, dados por el lugar de las races, y
un cero en s = c que es precisamente el cero de lazo abierto que aparece en
los lugares de las races mostrados en la gura 5.13. Notese que el polinomio
caracterstico en (5.17) tiene la forma estandar:
s
2
+ 2
n
s +
2
n
(5.18)
Por esta razon se pueden igualar ambos polinomios para concluir que, igua-
lando coecientes:

2
n
= ck
d
k = k
p
k, =
a +k
d
k
2
_
k
p
k
(5.19)
238 5 Dise no usando la respuesta en el tiempo
polos deseados en lazo cerrado: s =
n

n
_

2
1
Esto signica que usando k
p
y k
d
se pueden colocar los polos de lazo cerrado en
cualquier punto del semiplano complejo izquierdo s porque se puede asignar
cualquier valor a y a
n
. Por a otro lado, es com un ubicar los polos de
lazo cerrado (complejos conjugados) de manera que se consiga el tiempo de
subida t
r
y el sobre paso M
p
( %) deseados. Para esto, normalmente se usan
las expresiones en (3.59) para encontrar:
=
abs(ln(M
p
( %)/100))
_

2
+ ln
2
(M
p
( %)/100)
(5.20)

d
=
1
t
r
_
atan
_
_
1
2

__

n
=

d
_
1
2
(5.21)
Sin embargo, en el caso del control PD de posicion que se esta estudiando,
la ubicacion de los polos de lazo cerrado en los puntos deseados no asegura
que se obtendra la respuesta transitoria deseada debido a la presencia del cero
colocado en s = c en la funcion de transferencia de lazo cerrado presentada
en (5.17). Este problema motiva el ejemplo mostrado a continuacion en el cual
se usa un compensador de adelanto para controlar la posicion. Sin embargo,
antes de continuar, es conveniente aclarar que a pesar del inconveniente que
se acaba de mencionar para el control PD de posicion su uso es muy com un
en las aplicaciones. Esto se debe a que la sintona del control PD en este tipo
de aplicaciones no necesita del calculo exacto de las ganancias, pues estas se
pueden seleccionar a prueba y error usando la siguiente regla (recuerde que la
funcion de transferencia en (5.17) es estable si k
p
> 0 y k
d
> 0):
Fije k
d
> 0 en un valor e incremente k
p
> 0 hasta obtener una respuesta
sucientemente rapida. Esto trae como consecuencia una respuesta muy
oscilatoria porque el amortiguamiento disminuye al incrementar k
p
(vease
(5.19)). En ese momento contin ue con el siguiente paso.
Mantenga k
p
> 0 en el ultimo valor obtenido en el paso anterior y em-
piece a incrementar k
d
> 0 hasta obtener una respuesta sucientemente
amortiguada. Esto, sin embargo, reduce la rapidez de la respuesta porque
el amortiguamiento aumenta. As que mantenga el ultimo valor de k
d
, re-
grese al punto anterior y repita el procedimiento hasta tener la rapidez y
el sobre paso (amortiguamiento) deseados.
5.2.3. Control de posicion usando un compensador de adelanto
Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero
ahora junto con el siguiente controlador:
5.2 Ejemplos 239
I

(s) =
s +d
s +c
, c > d > 0, > 0
el cual se conoce como compensador de adelanto porque c > d. Esta condi-
cion (c > d) se introduce cuando se quiere aumentar el amortiguamiento del
sistema, es decir, cuando los polos de lazo cerrado deben ser recorridos hacia
la izquierda del semi plano complejo izquierdo (veanse las reglas 11 y 12). El
diagrama de bloques en lazo cerrado se muestra en la gura 5.14. La funcion
de transferencia de lazo abierto esta dada como:
+

(s) (s)

d
s ( )
s s+a ( )
k

s+c
s+d
Figura 5.14. Control de posicion con una red de adelanto.
G(s)H(s) =
k(s +d)
s(s +a)(s +c)
(5.22)
Si el valor de d se propone tal que:
d = a (5.23)
entonces la funcion de transferencia en lazo cerrado es:
(s)

d
(s)
=
k
s
2
+cs +k
=

2
n
s
2
+ 2
n
s +
2
n
lo que signica que:
c = 2
n
, =

2
n
k
(5.24)
As que si se usan las expresiones en (5.20) y (5.21) para calcular y
n
de
manera que se consiga el tiempo de subida y el sobre paso deseados, entonces
(5.23) y (5.24) representan una regla de sintona muy simple. En la gura 5.15
se muestra que cuando d = a el lugar de las races es muy similar al obtenido
en la seccion 5.2.1 porque, al cancelarse el polo en s = a y el cero en s = d,
la funcion de transferencia de lazo abierto se reduce a:
G(s)H(s) =
k
s(s +c)
240 5 Dise no usando la respuesta en el tiempo
Re(s)
Im(s)
c
2
c
a
d
Figura 5.15. Lugar de las races para G(s)H(s) en (5.22) cuando d = a.
que es identica a la funcion de transferencia en (5.13) intercambiando k
p
por
y a por c. La diferencia radica en que, en el presente caso, al seleccionar c
de acuerdo a (5.24) se asegura que el lugar de las races pasara por los puntos
deseados del semiplano izquierdo complejo s:
s
1
=
n
+j
n
_
1
2
, s
2
=
n
j
n
_
1
2
cuando, de acuerdo a la condicion de magnitud (vease (5.14) y la gura 5.11
con c en lugar de a y en lugar de k
p
):
k
l
1
l
2
= 1, l
1
= l
2
= |s
1
| = |s
2
| =
n
=

2
n
k
Por tanto, si d = a no es necesario dibujar el lugar de las races. A continuacion
se obtiene el lugar de las races para el caso en que d = a, con el n de entender
que sucedera en tal caso. Por tanto, considerese la funcion de transferencia
de lazo abierto presentada en (5.22). La constante es la ganancia que el
metodo vara desde 0 hasta + para dibujar el lugar de las races. Notese
que, de acuerdo a (5.1) y la gura 5.14, la funcion de transferencia de lazo
cerrado tiene la forma:
(s)

d
(s)
=
k(s +d)
(s e)(s g)(s h)
(5.25)
donde e, g y h representan las ubicaciones de los tres polos de lazo cerrado.
Primero se reescribe G(s)H(s) en la siguiente forma:
G(s)H(s) =
k l
3
l
1
l
2
l
4
[
3
(
1
+
2
+
4
)] (5.26)
donde se han denido los vectores s0 = l
1

1
, s(a) = l
2

2
, s(d) =
l
3

3
, s (c) = l
4

4
. Las condiciones de angulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
5.2 Ejemplos 241

3
(
1
+
2
+
4
) = (2q + 1)180

, q = 0, 1, 2, . . . (5.27)
k l
3
l
1
l
2
l
4
= 1 (5.28)
Notese que ahora se tiene n = 3, m = 1, p
1
= 0, p
2
= a, p
3
= c, z
1
= d.
De acuerdo a las reglas 1, 2 y 3, una de las tres ramas que inician ( = 0)
en los puntos s = 0, s = a, s = c (polos de lazo abierto) debe terminar
( = +) en el cero de lazo abierto colocado en s = d. Por tanto, existiran
dos ramas del lugar de las races que tienden a alg un punto del innito sobre el
plano s. De acuerdo a la regla 3, los angulos de las asntotas a las que tienden
estas ramas son:
180

(2 0 + 1)
n m
=
180

(2 0 + 1)
3 1
= 90

Ademas, de acuerdo a la regla 4 la interseccion de estas asntotas con el eje


real puede ser ajustada usando el cero en s = d y el polo en s = c:

a
=
p
1
+p
2
+p
3
(d)
n m
=
0 a c +d
2
(5.29)
Como c y d deben ser positivas por motivos de estabilidad entonces las asnto-
tas se mueven hacia la izquierda (mayor estabilidad) conforme el cero es ubi-
cado mas cerca del origen (d 0) y/o el polo en c es movido hacia la
izquierda. Esto signica que los polos de lazo cerrado se pueden ubicar del si-
guiente modo: e y g complejos conjugados, mientras que h se selecciona como
real y cercano al cero colocado en s = d. De este modo, el polo y el cero
tienden a disminuir sus efectos sobre la respuesta transitoria del sistema en
lazo cerrado, la cual tiende a ser parecida a la de una funcion de transferencia
con la forma:
(s)

d
(s)
=
eg
(s e)(s g)
(5.30)
es decir, la forma estandar de segundo orden (5.18) para que el tiempo de
subida y el sobre paso puedan ser calculados a partir de los valores e y g usando
(3.59) o (5.20) y (5.21). Notese, sin embargo, que esto solo sera completamente
cierto si d = a.
De acuerdo a la regla 5 existe lugar de las races sobre dos segmentos
del eje real porque se tienen cuatro polos y ceros reales de lazo abierto. La
ubicacion de dichos segmentos sobre el eje real dependen del valor de d usado,
como se muestra en las guras 5.16(a) y 5.16(b). Sin embargo, notese que en
cualquiera de estos casos existe un polo de lazo cerrado que se aproxima al
cero en s = d conforme crece, lo cual es una caracterstica deseable para
conseguir (5.30) y que ocurre cuando d = a.
5.2.4. Control proporcional-integral (PI) de velocidad
De acuerdo al captulo 9, el siguiente es el modelo de un motor de CD
cuando la salida a controlar es la velocidad (s):
242 5 Dise no usando la respuesta en el tiempo
a c d
Re(s)
Im(s)
(a) a > d
a c d
Im(s)
Re(s)
(b) a < d
Figura 5.16. Lugares de las races para G(s)H(s) en (5.22).
(s) =
1
s +a
[kI

(s)
1
J
T
p
(s)]
a =
b
J
> 0, k =
nk
m
J
> 0
donde la consigna de corriente I

(s) es la entrada y T
p
(s) es una perturbacion
externa de par. Se propone dise nar un controlador PI de velocidad, es decir,
se escoge:
i

= k
p
e +k
i
_
t
0
e(r)dr, e =
d

5.2 Ejemplos 243


donde
d
es la velocidad deseada, k
p
es la ganancia proporcional y la constante
k
i
es conocida como la ganancia integral. Usando la transformada de Laplace:
I

(s) = k
p
E(s) +k
i
E(s)
s
=
_
k
p
+
k
i
s
_
E(s)
=
_
k
p
s +k
i
s
_
E(s)
= k
p
_
s +
ki
kp
s
_
E(s)
Por tanto, en lazo cerrado se obtiene el diagrama de bloques mostrado en la
gura 5.17(a). Como este sistema tiene dos entradas, se puede hacer uso del
principio de superposicion (vease la seccion 3.10) para escribir:
(s) = G
1
(s)
d
(s) +G
2
(s)T
p
(s)
donde G
1
(s) es la funcion de transferencia usando
d
(s) como la entrada y
(s) como la salida cuando T
p
(s) = 0, es decir, cuando se usa el diagrama de
bloques de la gura 5.17(b), mientras que G
2
(s) es la funcion de transferencia
usando T
p
(s) como la entrada y (s) como la salida cuando
d
(s) = 0, es
decir, cuando se usa el diagrama de bloques de la gura 5.17(c). Es importante
subrayar que cuando T
p
(s) es la entrada entonces (s) representa la desviacion
de la velocidad (respecto de
d
(s)) producida por la perturbacion.
A continuacion se estudia el problema de seleccionar las ganancias del
controlador PI de manera que la respuesta en lazo cerrado tenga las carac-
tersticas deseadas de respuesta transitoria ante la referencia de velocidad
d
.
Para esto se usa el diagrama de bloques de la gura 5.17(b), de donde se
observa que la funcion de transferencia de lazo abierto es:
G(s)H(s) =
k
p
k(s +c)
s(s +a)
, c =
k
i
k
p
(5.31)
Notese que el sistema es tipo 1, lo cual asegura que (t) =
d
en estado
estacionario si
d
es una constante. Esta es una de las razones de haber elegido
usar un controlador PI en este ejemplo. Por tanto, como las caractersticas
deseadas de la respuesta en estado estacionario estan aseguradas (la velocidad
alcanza la velocidad deseada) solo resta seleccionar las ganancias k
p
y k
i
de
manera que sean satisfechas las caractersticas de respuesta transitoria. Para
esto, notese que la funcion de transferencia en lazo abierto mostrada en (5.31)
es identica a la funcion de transferencia mostrada en (5.15) correspondiente al
control PD de posicion ya que solo hay que reemplazar k
d
por k
p
. Por tanto, el
lugar de las races correspondiente al control PI de velocidad es identico a los
dos casos mostrados en la gura 5.13 y se obtienen las mismas conclusiones: i)
244 5 Dise no usando la respuesta en el tiempo
+

k
p
s
s+
kp
k
i
k
s+a
1
I

(s) !(s) !
d
(s)
T
p
(s)
J
1
(a) Sistema de control completo.
+

k
p
s
s+
kp
k
i
s+a
k
!
d
(s)
!(s)
(b) Caso cuando Tp(s) = 0.

!(s)
s+a
1
k
p
k
s
s+
k
p
k
i
J
1
T
p
(s)
(c) Caso cuando
d
(s) = 0.
Figura 5.17. Sistema de control proporcional-integral de velocidad
siempre existen ganancias k
p
y k
i
que permiten colocar los dos polos de lazo
cerrado en cualquier punto sobre el semi plano complejo izquierdo; por tanto,
es posible sintonizar el controlador PI usando un procedimiento de prueba
y error identico al presentado al nal de la seccion 5.2.2: solo se debe usar
la ganancia k
i
(control PI) en lugar de k
p
(control PD) y usar la ganancia
k
p
(control PI) en lugar de k
d
(control PD), ii) el cero colocado en s = c
tambien es un cero de la funcion de transferencia en lazo cerrado G
1
(s) lo
que afecta a las caractersticas de respuesta transitoria ante la referencia de
velocidad. Es decir, que la respuesta transitoria no tendra las caractersticas
5.2 Ejemplos 245
dise nadas usando (5.20) y (5.21) para seleccionar los polos de lazo cerrado.
Esto plantea las siguientes dos posibilidades para el dise no.
1. El problema indicado en el inciso ii) puede ser eliminado si se elige:
c = a =
k
i
k
p
(5.32)
porque en tal caso, de acuerdo a la gura 5.17(b) y a (5.1), la funcion de
transferencia de lazo cerrado es:
(s)

d
(s)
=
k
p
k
s +k
p
k
Esto signica que la repuesta en lazo cerrado, ante la referencia de velo-
cidad, es como la de un sistema de primer orden con ganancia unitaria en
estado estacionario y una constante de tiempo igual a
1
kpk
. Entonces, si se
especica una constante de tiempo deseada igual a se debe establecer:
k
p
k =
1

(5.33)
As que las condiciones en (5.33) y (5.32) representan una sencilla regla
c
a
Re(s)
Im(s)
Figura 5.18. Lugar de las races para c = a, G(s)H(s) =
kpk
s
.
de sintona. Finalmente, el lugar de las races correspondientes al caso que
se acaba de estudiar (c = a, G(s)H(s) =
kpk
s
) se muestra en la gura
5.18. Esto puede deducirse facilmente usando las reglas 3 y 5, ya que al
solo existir un polo de lazo abierto, solo existe un polo de lazo cerrado, el
cual debe ser real y debe tender a un cero en el innito (sobre el eje real,
sobre una asntota que forma 180

con el eje real positivo) porque no


hay ning un cero de lazo abierto. Ademas, la condicion de magnitud:
k
p
k
l
1
= 1
246 5 Dise no usando la respuesta en el tiempo
donde l
1
es la distancia del polo de lazo cerrado deseado al origen, establece
que el polo deseado en lazo cerrado ubicado en s =
1

es alcanzado
cuando:
k
p
k = l
1
, l
1
=
1

k
p
k =
1

lo cual coincide con (5.33). Sin embargo, a continuacion se muestra que


esta regla de sintona trae un problema en cuanto a la respuesta del sistema
en lazo cerrado ante la perturbacion externa T
p
(s). Para esto, considerese
el diagrama de bloques de la gura 5.17(c). Si se selecciona c = a entonces
la funcion de transferencia de lazo cerrado es:
(s)
T
p
(s)
=

k
J
s
(s +k
p
k)(s +a)
(5.34)
Usando el teorema del valor nal se encuentra que:
lm
t
(t) = lm
s0
s(s)
= lm
s0
s

k
J
s
(s +k
p
k)(s +a)
t
d
s
= 0
la desviacion producida por una perturbacion externa de par de valor
constante igual a t
d
es reducida a cero en estado estacionario. Esta es la
otra razon por la cual se ha elegido usar un controlador PI de velocidad.
Sin embargo, existe un problema. La rapidez con la que tal desviacion es
llevada a cero depende de los polos de la funcion de transferencia mostrada
en (5.34), los cuales estan ubicados en s = k
p
k y s = a. Aunque uno
de estos polos puede ser hacerse tan rapido como se desee usando un valor
grande de k
p
, la rapidez del otro polo (s = a) no puede ser modicada y
depende de la rapidez que el motor de CD tiene en lazo abierto. Esto trae
como consecuencia que la desviacion debida a la perturbacion puede ser
llevada a cero muy lentamente, lo cual representa un serio inconveniente.
2. Tratando de resolver el problema que se acaba de indicar se puede optar
por abandonar la regla de sintona representada por (5.33) y (5.32). Como
ahora c = a, la funcion de transferencia de lazo cerrado correspondiente
al diagrama de bloques de la gura 5.17(c) es:
(s)
T
p
(s)
=

k
J
s
s
2
+ (a +k
p
k)s +k
p
kc
(5.35)
Usando de nuevo el teorema del valor nal se puede vericar facilmente
que si la perturbacion externa es constante T
p
(s) =
t
d
s
entonces la desvia-
cion producida en estado estacionario es cero de nuevo: lm
t
(t) = 0,
debido a que la funcion de trasferencia en (5.35) tiene un cero en s = 0.
Por otro lado, los polos de la funcion de transferencia en (5.35), que son los
5.2 Ejemplos 247
que determinan la rapidez con la que la desviacion de velocidad desapare-
ce, son identicos a los polos de la funcion de transferencia
(s)

d
(s)
= G
1
(s),
por lo que pueden ser determinados usando el metodo del lugar de las
races a partir de (5.31). Tal como ya se ha explicado, el lugar de las
races correspondiente es identico a los dos casos mostrados en la gura
5.13 sustituyendo el uso de k
d
por el de k
p
. Es muy importante subrayar
que la funcion de transferencia en (5.35) no tiene el cero en s = c que
se muestra en el lugar de las races de la gura 5.13. Esto signica que
ninguno de los dos polos de lazo cerrado obtenidos con el metodo del lugar
de las races podra cancelarse con el cero en s = c y el polo mas lento
tendra el efecto mas importante sobre la rapidez con la que la desviacion
debida a la perturbacion es llevada a cero. Con esto en mente se concluye
lo siguiente.
Con el n de que el cero en s = c tenga poco efecto sobre la respuesta
transitoria ante la referencia de velocidad, uno de los polos de lazo
cerrado debe seleccionarse cerca del cero en s = c. El otro polo de
lazo cerrado (el mas rapido) se aleja hacia la izquierda y tiende al
innito conforme el polo lento se acerca a s = c.
Esto signica que el polo rapido determina las caractersticas de res-
puesta transitoria (constante de tiempo) ante la referencia de velo-
cidad. Entonces, si se desea establecer cierto valor para la constante
de tiempo (de manera que el polo rapido ocupe un punto nito sobre
el eje real negativo), el polo lento siempre estara relativamente lejos
del cero en s = c (a donde convergera cuando el polo rapido llegue
al innito). Esto signica que la respuesta transitoria estara afecta-
da por los dos polos y el cero en s = c. Por tanto, si c = a, no se
puede determinar una regla de sintona que de manera exacta je las
caractersticas de respuesta transitoria ante la referencia de velocidad.
Es mas conveniente seleccionar c > a porque el polo de lazo cerrado
mas lento (el que se aproxima a s = c) queda colocado mas a la
izquierda (es mas rapido) que si selecciona c < a.
Por esta misma razon, si se quiere aumentar la rapidez con la que el
efecto de la perturbacion desaparece, se debe seleccionar c = a con
c > 0 cada vez mas grande. De acuerdo a c = k
i
/k
p
, esto signica que
se necesita una ganancia integral mayor.
Por tanto, aunque es posible aumentar la rapidez con la que desaparece
la desviacion producida por la perturbacion, se concluye que no se pue-
den calcular de manera exacta las ganancias k
p
y k
i
que aseguren que
se consiguen, simultaneamente, las caractersticas deseadas de respuesta
transitoria ante la referencia deseada y un rechazo rapido de los efectos
de la perturbacion. Esta armacion es vericada experimentalmente en
el captulo 9 y, por ello, en ese captulo se presenta un controlador PI
modicado de velocidad que resuelve este problema.
248 5 Dise no usando la respuesta en el tiempo
Previendo su uso experimental en el captulo 9, a continuacion se propone una
regla de sintona para el caso cuando c = a. De acuerdo a (5.31) la condicion
de magnitud es:
k
p
kl
1
l
3
l
2
= 1
donde s (0) = l
2

2
, s (a) = l
3

3
, s (c) = l
1

1
. El criterio
de sintona seleccionado es proponer que el polo mas lento este ubicado en
un valor conocido s = p
1
, para jar un lmite inferior en la rapidez con
la que se rechaza el efecto de la perturbacion. Por otro lado, de acuerdo a
los puntos listados previamente, se propone c cercano a p
1
de manera que
p
1
> c. Entonces, usando la condicion de magnitud previa se obtiene la regla
de sintona:
k
i
k
p
= c, c < p
1
, k
p
=
l
2
l
3
l
1
k
(5.36)
l
1
= abs(p
1
+c), l
2
= abs(p
1
), l
3
= abs(p
1
+a)
De acuerdo a lo expuesto previamente, la respuesta ante la referencia de ve-
locidad sera mucho mas rapida que la dictada por el polo en s = p
1
. Para
propositos de comparacion, esto es muy importante pues en el captulo 9 se
dise nan algunos controladores de velocidad que consiguen simultaneamente
respuestas transitorias ante una referencia de velocidad y una perturbacion
externa que son determinadas por un polo en s = p
1
. En cambio con el
control PI de velocidad aqu estudiado, si se desea aumentar la rapidez de res-
puesta ante una perturbacion externa (con un polo en s = p
1
), la respuesta
ante la referencia de velocidad debe ser mucho mas rapida.
5.2.5. Control proporcional-integral-derivativo (PID) de posicion
Considere de nuevo el modelo de un motor de CD pero ahora considerando
la presencia de una perturbacion externa:
(s) =
1
s(s +a)
[kI

(s)
1
J
T
p
(s)]
junto con el siguiente controlador proporcional-integral-derivativo:
i

= k
p
e +k
d
de
dt
+k
i
_
t
0
e(r)dr, e =
d

donde
d
es la posicion deseada y las constantes k
p
, k
d
y k
i
se conocen como
las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
5.2 Ejemplos 249
I

(s) = k
p
E(s) +k
d
sE(s) +k
i
E(s)
s
=
_
k
p
+k
d
s +
k
i
s
_
E(s)
= k
d
s
2
+
kp
k
d
s +
ki
k
d
s
E(s)
por lo que se obtiene el diagrama de bloques mostrado en la gura 5.19(a).
Como este sistema tiene dos entradas entonces se puede usar el principio de
superposicion (vease la seccion 3.10) para escribir:
(s) = G
1
(s)
d
(s) +G
2
(s)T
p
(s)
donde G
1
(s) es la funcion de transferencia usando
d
(s) como la entrada y
(s) como la salida cuando T
p
(s) = 0, es decir, cuando se usa el diagrama de
bloques de la gura 5.19(b) para encontrar:
(s)

d
(s)
= G
1
(s) =
k
d
k
_
s
2
+
kp
k
d
s +
ki
k
d
_
s
3
+ (a +k
d
k)s
2
+k
p
ks +k
i
k
, T
p
(s) = 0 (5.37)
Por otro lado, G
2
(s) es la funcion de transferencia usando T
p
(s) como la
entrada y (s) como la salida cuando
d
(s) = 0, es decir, cuando se usa el
diagrama de bloques de la gura 5.19(c) para encontrar:
(s)
T
p
(s)
= G
2
(s) =

k
J
s
s
3
+ (a +k
d
k)s
2
+k
p
ks +k
i
k
,
d
(s) = 0 (5.38)
Es importante subrayar que cuando T
p
(s) es la entrada entonces (s) re-
presenta la desviacion de la posicion (respecto de
d
(s)) producida por la
perturbacion. Usando el teorema del valor nal se encuentra que:
lm
t
(t) = lm
s0
s(s)
= lm
s0
s

k
J
s
s
3
+ (a +k
d
k)s
2
+k
p
ks +k
i
k
t
d
s
= 0
la desviacion de posicion en estado estacionario producida por una pertur-
bacion externa de par constante T
p
(s) =
t
d
s
es cero. Utilizando de nuevo el
teorema del valor nal, no es difcil comprobar que, usando (5.37), el valor
nal de posicion es igual al valor deseado
d
cuando este es constante. Estas
son las principales razones para usar un controlador PID de posicion.
A continuacion se estudia el problema de seleccionar las ganancias del
controlador PID de manera que la respuesta en lazo cerrado tenga las ca-
ractersticas deseadas de respuesta transitoria ante la referencia de posicion

d
. Con este proposito, los tres polos de la funcion de transferencia en (5.37)
deben ser asignados en los puntos deseados sobre el semiplano complejo iz-
quierdo. Esto se consigue igualando el polinomio caracterstico de la funcion
250 5 Dise no usando la respuesta en el tiempo
+

k
d
s
s
2
+
k
d
kp
s+
k
d
k
i
k
s(s+a)
1
I

(s) (s)
d
(s)
T
p
(s)
J
1
(a) El sistema de control completo.
+

k
d
s
s
2
+
k
d
kp
s+
k
d
k
i
s(s+a)
k
(s)

d
(s)
(b) Caso cuando Tp(s) = 0.

(s)
s(s+a)
1
k
d
k
s
s
2
+
k
d
k
p
s+
k
d
k
i
J
1
T
p
(s)
(c) Caso cuando
d
(s) = 0.
Figura 5.19. Sistema de control PID de posicion
de transferencia en (5.37) con un polinomio que tiene sus tres races en los
puntos deseados s = p
1
, s = p
2
, s = p
3
:
s
3
+ (a +k
d
k)s
2
+k
p
ks +k
i
k = (s p
1
)(s p
2
)(s p
3
)
Es claro que a los tres coecientes del polinomio caracterstico se les puede
asignar cualquier valor con combinaciones adecuadas de las ganancias k
p
, k
d
y k
i
. Esto signica que los tres polos del sistema en lazo cerrado pueden ser
asignados en cualquier lugar que se desee del semiplano complejo izquierdo.
Una manera de seleccionar los polos deseados es: dos complejos conjugados
con parte real negativa y el otro real y negativo (para asegurar estabilidad),
es decir:
5.2 Ejemplos 251
p
1
=
1
+j
1
, p
2
=
1
j
1
, p
3
< 0,
1
< 0,
1
> 0
Si se desea que la respuesta sea dominada por los dos polos complejos conju-
gados entonces se puede proponer:
|p
3
| > 6|
1
|
Con estos datos se obtiene:
s
3
+ (a +k
d
k)s
2
+ k
p
ks +k
i
k = (s p
1
)(s p
2
)(s p
3
) (5.39)
= s
3
(2
1
+p
3
)s
2
+ (
2
1
+
2
1
+ 2
1
p
3
)s p
3
(
2
1
+
2
1
)
de donde, igualando coecientes, se obtiene la siguiente regla de sintona:
k
d
=
(2
1
+p
3
) a
k
(5.40)
k
p
=

2
1
+
2
1
+ 2
1
p
3
k
k
i
=
p
3
(
2
1
+
2
1
)
k
Notese que las tres ganancias del controlador son positivas. Aunque la parte
real e imaginaria de los polos en p
1
y p
2
pueden ser calculadas usando (5.20) y
(5.21) de manera que se obtenga el tiempo de subida t
r
y el sobre paso M
p
( %)
deseados, sin embargo la respuesta obtenida tendra diferencias importantes
respecto de estos valores deseados debido a los dos ceros que tiene la funcion
de transferencia en (5.37). Aunque esta es una desventaja importante de la
regla de sintona en (5.40), estos valores pueden ser usados como una simple
aproximacion de las ganancias requeridas del controlador para posteriormente
hacer ajustes nos, a prueba y error, hasta obtener las caractersticas deseadas
de respuesta transitoria. Para esto, dado que el sistema en lazo cerrado es de
tercer orden, es muy importante tener presente la regla de estabilidad obtenida
en el ejemplo 4.12 de la seccion 4.3. La posibilidad de ajustar a prueba y error
las ganancias de un controlador PID (vease la seccion 5.3) es una de las
principales razones por las que este tipo de controlador tiene tanto uso en la
industria.
Con el n de buscar una regla de sintona que permita calcular de mane-
ra exacta las ganancias de un controlador PID, a continuacion se procede a
estudiar el lugar de las races para el control PID de posicion. Para esto se
usa el diagrama de bloques de la gura 5.19(b), de donde se observa que la
funcion de transferencia de lazo abierto es:
G(s)H(s) =
k
d
k(s +)(s +)
s
2
(s +a)
, (s +)(s +) = s
2
+
k
p
k
d
s +
k
i
k
d
(5.41)
para algunas constantes y diferentes de cero cuyos valores se proponen
como parte del proceso del dise no para despues, a partir de estos valores,
252 5 Dise no usando la respuesta en el tiempo
calcular k
p
y k
i
. Notese que k
d
es la ganancia que el metodo vara desde 0
hasta + para dibujar el lugar de las races. Es claro que el sistema es tipo
2 (el motor tiene un integrador por naturaleza y el otro integrador es debido
al controlador PID) y, por tanto, el error en estado estacionario ante una
referencia de posicion constante es cero.
En la gura 5.20 se presentan tres posibilidades para el lugar de las races
correspondiente, las cuales dependen de los valores propuestos para y . Se
invita al lector a usar las reglas presentadas en la seccion 5.1.1 para comprobar
estos resultados. De acuerdo a la gura 5.20(a), se puede dise nar el sistema
de control de manera que dos polos de lazo cerrado sean muy proximos a
los dos ceros colocados en s = y s = para que el sistema en lazo
cerrado responda como un sistema de primer orden con un polo real y negativo.
Tambien se puede elegir que un polo de lazo cerrado sea muy proximo al cero
en s = de modo que el sistema en lazo cerrado responda como un sistema
de segundo orden, con polos complejos conjugados, que contiene un cero.
Aunque la presencia de este cero modica la forma de la respuesta transitoria,
es una manera de conseguir una respuesta con especicaciones aproximadas
de tiempo de subida y sobre paso deseados. Este es el criterio de dise no que
se usa a continuacion.
En casos como este, los metodos tradicionales del lugar de las races pro-
ponen seguir los siguientes tres pasos:
Dise ne un controlador PD de posicion con funcion de transferencia:
k
d
(s +)
de manera que se obtengan el tiempo de subida y el sobre paso deseados.
A la funcion de transferencia de lazo abierto dise nada en el paso anterior,
agregue el factor:
s +
s
con un valor positivo muy cercano a cero.
Calcule las ganancias PID usando (5.41), es decir:
k
p
= ( +)k
d
, k
i
= k
d
(5.42)
A continuacion se dise na un controlador PD de la forma k
d
(s + ) para
la planta
k
s(s+a)
, es decir, cuando el sistema en lazo cerrado tiene la forma
presentada en la gura 5.21 y la funcion de transferencia de lazo abierto es:
G(s)H(s) =
k
d
k(s +)
s(s +a)
(5.43)
La funcion de transferencia de lazo cerrado es, en este caso:
(s)

d
(s)
=
k
d
k(s +)
s
2
+ (a +k
d
k)s +k
d
k
5.2 Ejemplos 253
a
+
Im(s)
Re(s)
(a)
a
Re(s)
Im(s)
+
(b)

a
+
Re(s)
Im(s)
(c)
Figura 5.20. Diferentes posibilidades para el lugar de las races del control PID de
posicion.
254 5 Dise no usando la respuesta en el tiempo
Igualando a un polinomio de segundo grado estandar:
s
2
+ (a +k
d
k)s +k
d
k = s
2
+ 2
n
s +
2
n
se obtiene:
k
d
=
2
n
a
k
, =

2
n
k
d
k
(5.44)
Los valores de y
n
se pueden calcular usando (5.20) y (5.21) a partir de
+

k
d
(s + )
s(s+a)
k
(s)

d
(s)
Figura 5.21. Control PD de posicion.
los valores deseados de tiempo de subida y sobre paso. El lugar de las races
correspondiente a este caso se muestra en la gura 5.22 y es identico al caso
c > a mostrado en la gura 5.13, porque solo en este caso el control PD de
posicion puede producir polos complejos conjugados de lazo cerrado. A partir
de (5.43) se encuentra que las condiciones de angulo y de magnitud establecen:

3
(
1
+
2
) = 180

(2q + 1), q = 1, 2, . . .
k
d
kl
3
l
1
l
2
= 1 (5.45)
donde l
1
, l
2
, l
3
,
1
,
2
y
3
estan denidas en la gura 5.22. Cuando se agrega el
factor
s+
s
a la funcion de transferencia de lazo abierto en (5.43) se encuentra
que la funcion de transferencia de lazo abierto ahora es:
G(s)H(s) =
k
d
k(s +)(s +)
s
2
(s +a)
(5.46)
Como > 0 es peque na, el lugar de las races correspondiente tiene la forma
mostrada en la gura 5.23 (se invita al lector a usar las reglas presentadas
en la seccion 5.1.1 para comprobar este resultado). Las condiciones de angulo
y de magnitud correspondientes a este caso se establecen a partir de (5.46)
como:

3
+
5
(2
1
+
2
) = 180

(2q + 1), q = 1, 2, . . .
k
d
kl
3
l
5
l
2
1
l
2
= 1 (5.47)
donde l
1
, l
2
, l
3
,
1
,
2
y
3
son identicas a las denidas en la gura 5.22,
mientras que l
5
y
5
se denen en la gura 5.23. La razon de seleccionar
5.2 Ejemplos 255

1
l
1 l
2
l
3
POLO DESEADO
a
Re(s)
Im(s)
Figura 5.22. Lugar de las races para el sistema en la gura 5.21.

3

2

1
l
1
l
2
l
3
l
5
"

5
+
a

Re(s)
Im(s)
Figura 5.23. Lugar de las races para la funcion de transferencia de lazo abierto
mostrada en (5.46).
> 0 cercana a cero es para conseguir que l
1
y l
5
sean casi iguales de manera
que l
5
/l
1
1. Esto tambien asegura que
1
y
5
son casi iguales por lo que

5

1
0. Entonces, las condiciones de angulo y de magnitud en (5.45) y
(5.47) son casi identicas. Esto asegura que los polos de lazo cerrado que se
obtienen cuando la funcion de transferencia de lazo abierto es la presentada
en (5.43) son casi identicos a los polos de lazo cerrado obtenidos cuando la
funcion de transferencia de lazo abierto es la presentada en (5.46). As se
asegura que las caractersticas de respuesta transitoria (tiempo de subida y
sobre paso) dese nadas con el controlador PD en (5.44) tambien se consiguen
con el controlador PID:
256 5 Dise no usando la respuesta en el tiempo
k
d
(s +)(s +)
s
= k
d
s
2
+
kp
k
d
s +
ki
k
d
s
es decir, cuando las ganancias se seleccionan de acuerdo a (5.42).
Sin embargo, es importante resaltar una gran desventaja de este metodo
de dise no: de acuerdo a (5.42) un valor peque no de resulta en un valor
peque no de la ganancia integral k
i
. La principal consecuencia de esto es que
la desviacion de posicion debida a la perturbacion externa es llevada a cero
muy lentamente y esto puede ser inaceptable en la practica. Esto tambien se
puede explicar a partir del lugar de las races de la gura 5.23. Notese que
un polo de lazo cerrado (colocado digamos en s = , > 0) se aproxima
al cero colocado en s = , por lo que ambos se cancelan en la funcion de
transferencia presentada en (5.37) y no se aprecia el efecto de ninguno de
ellos en la respuesta transitoria ante la referencia de posicion. Sin embargo, el
cero en s = no aparece en la funcion de transferencia mostrada en (5.38).
Pero el polo en s = a un esta presente en esta funcion de transferencia y
afecta considerablemente a la respuesta transitoria: este polo lento (cercano
al origen) es el responsable de una respuesta transitoria muy lenta cuando
aparece una perturbacion externa.
A pesar de estos inconvenientes, el metodo del lugar de las races reco-
mienda dise nar los controladores PID de esta manera. Mas a un, es interesante
mencionar que estos inconvenientes en los metodos clasicos de dise no siguen
sin solucion a pesar de que ya han sido puntualizados previamente en algunos
trabajos internacionales como el de la referencia [10].
Por otro lado, de acuerdo a (5.42), se puede obtener una ganancia integral
mas grande (para obtener un rechazo mas rapido de la perturbacion) selec-
cionando un valor mas grande de . Sin embargo, de acuerdo a lo expuesto
previamente, esto resultara en una respuesta transitoria ante la referencia de
posicion que no tiene las caractersticas deseadas. Estos razonamientos per-
miten armar que no existe una regla de sintona que permita calcular de
manera exacta las ganancias de un controlador PID de posicion de modo que
se consigan simultaneamente las caractersticas deseadas de respuesta transi-
toria ante una referencia de posicion y un rechazo satisfactorio de los efectos
de una perturbacion externa de par. Estas observaciones se verican experi-
mentalmente en el captulo 10 donde, dada la problematica que se acaba de
describir, se presentan y se prueban experimentalmente nuevos controladores
que eliminan estas desventajas.
Finalmente, a pesar de las desventajas arriba mencionadas, es importante
recordar lo que se indico justo despues de (5.40): el controlador PID es uno
de los controladores mas utilizados a nivel industrial debido a que puede ser
sintonizado a prueba y error (vease la seccion 5.3) de manera que se respete
la regla de estabilidad obtenida en el ejemplo 4.12 de la seccion 4.3.
5.2 Ejemplos 257
5.2.6. Asignacion de los polos de lazo cerrado deseados
En esta parte se presenta un ejemplo para mostrar como se usa el lugar
de las races para dise nar un controlador de modo que se asignen los polos de
lazo cerrado deseados. Considere la siguiente funcion de transferencia:
G(s)H(s) =
k
(s 35.7377)(s + 36.5040)
(5.48)
La ganancia k es variada por el metodo para que tome valores desde 0 hasta
+. Primero se reescribe G(s)H(s) en la siguiente forma:
G(s)H(s) =
k
l
1
l
2
(
1
+
2
)
donde se han denido los vectores s 35.7377 = l
1

1
, s (36.5040) =
l
2

2
. Las dos condiciones fundamentales que denen el lugar de las races
son las condiciones de angulo (5.7) y de magnitud (5.6) las cuales se expresan,
respectivamente, como:
(
1
+
2
) = (2q + 1)180

, q = 0, 1, 2, . . .
k
l
1
l
2
= 1
La regla 5 indica que sobre el eje real solo existe lugar de las races entre
los puntos s = 35.7377 y s = 36.5040. Ademas, de acuerdo a la regla 1, el
lugar de las races inicia (k = 0) en s = 35.7377 y s = 36.5040. Por otro
lado, de acuerdo a las reglas 2 y 3, cuando k tiende a + las ramas que
inician en los puntos s = 35.7377 y s = 36.5040 deben terminar en alg un
cero de lazo abierto (no existe ninguno en este caso) o en alg un punto en el
innito del plano s. Por tanto, el lugar de las races debe alejarse de los puntos
s = 35.7377 y s = 36.5040, sobre el eje real, conforme k crece de manera
que debe existir un punto de separacion en alg un lugar entre dichos puntos
para luego dirigirse hacia el innito sobre el plano s.
Por otro lado, de acuerdo a la condicion de angulo, (
1
+
2
) = 180

=
( +
1
), y la gura 5.24 se puede observar que =
2
y, por tanto, que
los triangulos t
1
y t
2
deben ser identicos para cualquier polo de lazo cerrado
s. Entonces, las dos ramas mencionadas anteriormente y que son mostradas
en la gura 5.24 deben ser paralelas al eje imaginario. Esto signica que el
punto donde las dos ramas se separan del eje real esta ubicado en el punto
medio entre los polos ubicados en s = 35.7377, s = 36.5040, es decir en
(35.7377 36.5040)/2 = 0.7663. Esto tambien puede vericarse usando las
reglas 3 y 4. Finalmente, de acuerdo a la regla 6 ambas ramas son simetricas
respecto al eje horizontal.
La condicion de magnitud se usa cuando se necesita conocer el valor exacto
de k que permita conseguir un punto especco sobre el lugar de las races.
258 5 Dise no usando la respuesta en el tiempo

t
2
t
1

2
36:50 0:7663 35:73
s
Re s ( )
Im s ( )
l
1
l
2
Figura 5.24. Lugar de las races para G(s)H(s) en (5.48).
Notese, por ejemplo, que al crecer k hacia + las longitudes l
1
y l
2
deben
crecer para satisfacer la condicion de magnitud
k
l
1
l
2
= 1
lo cual signica que los polos de lazo cerrado correspondientes a valores gran-
des de k tienden a alg un punto en el innito del plano s.
Suponga ahora que se incluye un polo adicional a la funcion de transferen-
cia en (5.48) para tener:
G(s)H(s) =
116137 k
s
3
+ 72.54s
2
1250s 9.363 10
4
=
=
116137 k
(s 35.7377)(s + 36.5040)(s + 71.7721)
(5.49)
De nuevo, la constante k es la ganancia que el metodo vara desde 0 hasta
+ para dibujar el lugar de las races. Primero se reescribe G(s)H(s) en la
siguiente forma:
G(s)H(s) =
116137 k
l
1
l
2
l
3
(
1
+
2
+
3
)
donde se han denido los vectores s35.7377 = l
1

1
, s(36.5040) = l
2

2
,
s (71.7721) = l
3

3
. Las condiciones de angulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
(
1
+
2
+
3
) = (2q + 1)180

, q = 0, 1, 2, . . .
116137 k
l
1
l
2
l
3
= 1
5.2 Ejemplos 259
El lugar de las races correspondiente a este caso se puede obtener a par-
tir del obtenido para la funcion de transferencia en (5.48) considerando que
simplemente se ha adicionado un polo en s = 71.7721.
De acuerdo a la regla 11 el nuevo polo sera causa para que las dos ramas del
lugar de las races mostrado en la gura 5.24 se doblen hacia la derecha como
se alcanza a apreciar ligeramente en la gura 5.25. Esto puede comprobarse
usando la regla 3 para encontrar que ahora existen tres ramas del lugar de las
races que tienden hacia asntotas que forman angulos de 180

y 60

con
el eje real positivo.
80 60 40 20 0 20 40
15
10
5
0
5
10
15
Root Locus
Real Axis
I
m
a
g
in
a
r
y

A
x
is
Figura 5.25. Lugar de las races para G(s)H(s) en (5.49).
Por otro lado, el punto de separacion entre los puntos s = 35.7377 y
s = 36.5040 que en la gura 5.24 estaba colocado en el punto (35.7377
36.5040)/2 = 0.7663 ahora en la gura 5.25 se encuentra colocado mas hacia
la derecha que 0.7663. La razon de esto se explica en la gura 5.26 donde s

y s representan dos puntos sobre el lugar de las races que estan muy cerca del
punto de separacion para el caso de las guras 5.24 y 5.25, respectivamente.
Como en la gura 5.25 se debe cumplir que (
1
+
2
+
3
) = 180

mientras
que en la gura 5.24 se debe cumplir (

1
+

2
) = 180

, entonces ambos
1
y
2
deben ser menores que

1
y

2
. Esto signica que el punto s debe estar
desplazado hacia la derecha del punto s

. Notese que este desplazamiento del


punto de separacion hacia la derecha del punto 0.7663 es mayor conforme
el angulo
3
introducido por el polo en s = 71.7721 sea mayor, es decir,
260 5 Dise no usando la respuesta en el tiempo
conforme este polo se encuentre colocado mas hacia la derecha. De hecho,
en la gura 5.25 se observa que el punto de separacion esta colocado en el
semiplano derecho.

;
2

;
1
s s
;
0:7663
Im s ( )
Re s ( )
Figura 5.26. Un polo adicional recorre el punto de separacion hacia la derecha.
Esta descripcion del lugar de las races de la gura 5.25 permite concluir
que siempre existira al menos un polo de lazo cerrado que tiene parte real
positiva, es decir, habra inestabilidad en lazo cerrado para cualquier valor
positivo de k. Debido a que k se puede interpretar como la ganancia de un
controlador proporcional, se concluye que no es posible estabilizar el sistema
usando ning un controlador proporcional y debe intentarse otro controlador.
De acuerdo a la regla 12 se requiere usar un controlador que introduzca un
cero de lazo abierto ya que esto consigue doblar el lugar de las races hacia
la izquierda para conseguir estabilidad de lazo cerrado.
Considere la siguiente funcion de transferencia de lazo abierto:
G(s)H(s) = k
116137(s +b)
s
3
+ 72.54s
2
1250s 9.363 10
4
= (5.50)
= k
116137(s +b)
(s 35.7377)(s + 36.5040)(s + 71.7721)
con b una constante positiva. De nuevo, la constante k es la ganancia que el
metodo vara desde 0 hasta + para dibujar el lugar de las races. Primero
se reescribe G(s)H(s) en la siguiente forma:
G(s)H(s) =
116137 k l
4
l
1
l
2
l
3
[
4
(
1
+
2
+
3
)] (5.51)
donde se han denido los vectores s35.7377 = l
1

1
, s(36.5040) = l
2

2
,
s (71.7721) = l
3

3
, s (b) = l
4

4
. Las condiciones de angulo (5.7) y
de magnitud (5.6) se expresan, respectivamente, como:

4
(
1
+
2
+
3
) = (2q + 1)180

, q = 0, 1, 2, . . . (5.52)
116137 k l
4
l
1
l
2
l
3
= 1 (5.53)
5.2 Ejemplos 261
Notese que ahora se tiene n = 3, m = 1, p
1
= 35.7377, p
2
= 36.5040,
p
3
= 71.7721, z
1
= b. De acuerdo a las reglas 1, 2 y 3, una de las tres ramas
que inician (k = 0) en los puntos s = 35.7377, s = 36.5040, s = 71.7721
(polos de lazo abierto) debe terminar (k = +) en el cero de lazo abierto
colocado en s = b. Por tanto, existiran dos ramas del lugar de las races que
tienden a alg un punto del innito sobre el plano s. De acuerdo a la regla 3,
los angulos de las asntotas a las que tienden estas ramas son:
180

(2 0 + 1)
n m
=
180

(2 0 + 1)
3 1
= 90

Ademas, de acuerdo a la regla 4 la ubicacion de estas asntotas sobre el eje


real puede ser ajustada usando el cero en s = b:

a
=
p
1
+p
2
+p
3
(b)
n m
=
35.7377 36.5040 71.7721 +b
2
(5.54)
Notese que b debe ser positivo pues de otra manera una rama del lugar de las
races sera halado hacia el semiplano derecho generando polos de lazo cerrado
inestables. Notese tambien que las asntotas se mueven hacia la izquierda
(mayor estabilidad) conforme el cero es ubicado mas cerca del origen, es decir
conforme b tiende a cero. Todo esto signica que existe un lmite en cuanto
a que tan a la izquierda se pueden colocar los polos complejos conjugados de
lazo cerrado.
De acuerdo a la regla 5 ahora existira lugar de las races sobre dos seg-
mentos del eje real porque ahora se tienen cuatro polos y ceros reales de lazo
abierto. La ubicacion de dichos segmentos sobre el eje real depende del va-
lor de b usado, como se muestra en las guras 5.27(a) y 5.27(b). Mas a un,
en la gura 5.27(c) se muestra que si se selecciona b = 36.5040 entonces se
cancela el cero de lazo abierto en s = b con el polo de lazo abierto ubicado
s = 36.5040. Esto signica que, en tal caso, solo existira lugar de las races
en un segmento del eje real.
En la gura 5.27(c) se aprecia que solo existen dos polos de lazo cerrado.
En las guras 5.27(a) y 5.27(b) se puede apreciar que existen tres polos de
lazo cerrado y que uno de esos polos estara en el semiplano complejo dere-
cho (inestabilidad en lazo cerrado) si la ganancia k es demasiado peque na. Por
otro lado, si k es demasiado grande se tendran dos polos complejos conjugados
con parte imaginaria demasiado grande, por lo que la respuesta oscilara rapi-
damente. Aunque en teora esto puede funcionar porque los tres polos tienen
parte real negativa, sin embargo un valor grande de k hace que se sature el
amplicador de potencia por lo que el sistema de control no podra funcionar
satisfactoriamente en la practica. As que un buen dise no sera aquel que per-
mita obtener los polos de lazo cerrado deseados usando una ganancia k que
no sea ni muy grande ni muy peque na.
Suponga que se desean los siguientes polos complejos conjugados de lazo
cerrado s = 25 j40. A continuacion se presenta la manera de calcular los
262 5 Dise no usando la respuesta en el tiempo
b
(a) b = 31.24 < 36.50
-80 -60 -40 -20 0 20 40
-150
-100
-50
0
50
100
150
Root Locus
Real Axis
Im
a
g
in
a
r
y
A
x
is
b
(b) b > 36.50
-80 -60 -40 -20 0 20 40
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
Root Locus
Real Axis
Im
a
g
in
a
r
y
A
x
is
b
(c) b = 36.50
Figura 5.27. Lugares de las races para G(s)H(s) denida en (5.50) obtenidos al
cambiar el valor de b.
5.2 Ejemplos 263

4
l
3
l
2
l
1
l
4
b 71:7 35:7
25 +j40
36:5
Re s ( )
Im s ( )

Figura 5.28. Polos y ceros de lazo abierto para ubicar los polos deseados de lazo
cerrado en s = 25 j40.
valores exactos de b y de k que permiten conseguir estos polos de lazo cerrado.
De acuerdo a la gura 5.28 se calculan los siguientes angulos:

3
= arctan
_
40
71.7721 25
_

2
= arctan
_
40
36.5040 25
_

1
= 180
0
arctan
_
40
35.7377 + 25
_
Usando la condicion de angulo (5.52) se calcula
4
y con esto el valor de b:

4
= 180
0
+ (
1
+
2
+
3
)
b =
40
tan(
4
)
+ 25 = 31.2463
Por otro lado, de acuerdo a la gura 5.28 se calculan las siguientes longitudes:
l
4
=
_
40
2
+ (b 25)
2
l
3
=
_
40
2
+ (71.7721 25)
2
l
2
=
_
40
2
+ (36.5040 25)
2
l
1
=
_
40
2
+ (35.7377 + 25)
2
con las que nalmente se usa la condicion de magnitud (5.53) para calcular k:
k =
l
1
l
2
l
3
116137 l
4
= 0.0396
La ubicacion del tercer polo de lazo cerrado se puede encontrar de la condicion
1 + G(s)H(s) = 0 usando G(s)H(s) dada en (5.50) as como b = 31.2463 y
k = 0.0396 es decir:
264 5 Dise no usando la respuesta en el tiempo
1 + 0.0396
116137(s + 31.2463)
s
3
+ 72.54s
2
1250s 9.363 10
4
= 0 (5.55)
de donde:
s
3
+ 72.54s
2
+ (0.0396 116137 1250)s
+(0.0396 116137 31.2463 9.363 10
4
) = 0
Las races de este polinomio son los polos de lazo cerrado conseguidos con
b = 31.2463 y k = 0.0396. Usando un programa de computadora se encuentra
que estas races son 25.0037 + j39.9630, 25.0037 j39.9630 y 22.5326.
Estos polos tambien son mostrados en la gura 5.27(a) usando signos +.
Notese que se han conseguido los polos complejos conjugados deseados y el
tercer polo, el cual es real, tambien esta colocado en el semiplano complejo
izquierdo, es decir, se ha conseguido estabilidad en lazo cerrado. Recuerdese
que el factor k(s +b) representa un controlador proporcional-derivativo.
Es importante mencionar que este sistema de control es utilizado para
regular la salida en un valor deseado igual a cero. Esto implica que indepen-
dientemente del tipo del sistema la salida deseada sera alcanzada . As que no
es necesaria ninguna consideracion respecto a la respuesta en estado estacio-
nario.
En la gura 5.29 se muestra la respuesta en lazo cerrado (lnea continua)
ante una entrada cero, r = 0 (vease la gura 5.1). Se usa (5.50), b = 31.2463
y k = 0.0396. Tambien se muestra, con lnea interrumpida, la respuesta de
un sistema cuya funcion de transferencia es

2
n
s
2
+2ns+
2
n
cuyos polos estan
ubicados en s = 25 j40. Por tanto, este sistema representa el modelo de
referencia pues su respuesta posee las caractersticas deseadas de la respuesta
transitoria. Ambas respuestas inician a partir de un valor de salida igual a
2.85. Notese que ambas respuestas son parecidas. Sin embargo, las diferencias
existentes entre ellas se deben al cero en s = 31.2463 y al polo de lazo
cerrado en s = 22.5326, los cuales no estan sucientemente cerca como para
que sus efectos sean cancelados completamente.
5.2.7. Control proporcional-integral-derivativo (PID) de un
sistema de levitacion magnetica
En esta seccion se presenta la manera de usar el lugar de las races para
seleccionar las ganancias de un controlador PID para el sistema de levitacion
magnetica que se construye y se prueba experimentalmente en el captulo 11.
La funcion de transferencia de lazo abierto es la siguiente:
G(s)H(s) =
11613700 k
d
s
3
+ 2739s
2
1250s 3.536 10
6
_
s
2
+
kp
k
d
s +
ki
k
d
s
_
(5.56)
donde k
d
es el parametro que vara el metodo desde 0 hasta +para dibujar
el lugar de las races, mientras que los valores de
kp
k
d
y
ki
k
d
deben ser propuestos.
5.2 Ejemplos 265
0 0.05 0.1 0.15 0.2 0.25
0.5
0
0.5
1
1.5
2
2.5
3
Figura 5.29. Respuesta en lazo cerrado del sistema (5.50) a partir de una condicion
inicial diferente de cero. Lnea continua: respuesta dise nada. Lnea interrumpida:
respuesta deseada. Eje vertical: y[m]. Eje horizontal: tiempo en segundos.
En el captulo 11 se explica que se utiliza un controlador PID para asegurar que
se alcanza la posicion deseada (constante) a un cuando exista incertidumbre en
el peso de la bola a levitar. Notese que el controlador PID introduce dos ceros
de lazo abierto. Usando software especializado se encuentra que los cuatro
polos de lazo abierto estan colocados en:
s
1
= 35.9, s
2
= 2739.4, s
3
= 35.9, s
4
= 0
Usando la regla 3 se encuentra que existen nm = 4 2 = 2 ramas del lugar
de las races que tienden al innito en el plano s siguiendo asntotas cuyos
angulos estan dados como:
180

2
= 90

Ademas, de acuerdo a la regla 4, el punto sobre el eje real donde estas asntotas
se intersectan es:

a
=
35.9 2739.4 35.9 +
z1
+
z2
2
donde
z1
< 0 y
z2
< 0 son las partes reales de los dos ceros de lazo abier-
to introducidos por el controlador PID (estos valores deben ser propuestos).
Es claro que
a
se mueve hacia la izquierda (lo que implica que el sistema de
266 5 Dise no usando la respuesta en el tiempo
lazo cerrado se hace mas estable) si
z1
< 0 y
z2
< 0 se eligen cercanos
a cero. Notese que esto esta de acuerdo con la regla 12. A partir de esto se
concluye que
a
< 1100 esta colocado muy a la izquierda del origen. Usando
estas observaciones, as como las reglas 1, 2, 5 y 6 se encuentra que existen
las tres posibilidades mostradas en la gura 5.30 para el lugar de las races de
este problema.
Si se conociera la ubicacion de los polos de lazo cerrado que resultan en
un buen desempe no experimental del sistema en lazo cerrado, se podra pro-
ceder como en la seccion 5.2.6 para determinar la ubicacion adecuada de los
ceros de lazo abierto (introducidos por el controlador PID). Sin embargo, este
no es el caso de este problema y por ello el principal objetivo del dise no es
simplemente conseguir que el sistema en lazo cerrado sea estable. Como ya
se menciono, es preferible que los dos ceros de lazo abierto esten colocados
cerca del origen. Esto signica que es preferible que el lugar de las races ten-
ga la forma mostrada en la gura 5.30(a). Por otro lado, dos ceros complejos
forzaran la existencia de polos complejos conjugados de lazo cerrado, lo cual
resulta en un sistema menos amortiguado (mas difcil de estabilizar). Por esta
razon, tambien se desecha el lugar de las races de gura 5.30(c). Por tanto,
buscando obtener el lugar de las races de la gura 5.30(a) se proponen los
siguientes valores:
k
p
k
d
= 31.24,
k
i
k
d
=
31.24
0.8
(5.57)
pues esto coloca los dos ceros de lazo abierto en:
s
5
= 29.9355, s
6
= 1.3045
es decir, estan colocados entre los polos de lazo abierto ubicados en:
s
3
= 35.9, s
4
= 0
Notese que el hecho de que
a
< 1100 esta colocado muy a la izquierda del
origen y que las asntotas forman angulos de 90

asegura que existe un valor


mnimo de k
d
a partir del cual todos los polos de lazo cerrado estan colocados
en el semi plano complejo izquierdo. Usando los valores numericos en (5.57)
se utiliza el criterio de Routh para encontrar que:
k
d
> 0.01 (5.58)
asegura que todos los polos de lazo cerrado estan colocados en el semi plano
complejo izquierdo y que el sistema en lazo cerrado es estable. Esto se hace
del siguiente modo. De la condicion 1+G(s)H(s) = 0 (es decir, usando (5.56)
y (5.57)) se obtiene el polinomio caracterstico:
s
4
+a
3
s
3
+a
2
s
2
+a
1
s +a
0
= 0 (5.59)
a
3
= 2739, a
2
= 11613700 k
d
1250,
a
1
= 11613700 31.24 k
d
3.536 10
6
,
a
0
= 11613700
31.28
8
k
d
5.2 Ejemplos 267

a
Re(s)
Im(s)
(a)
Im(s)
Re(s)
a
(b)
Im(s)
Re(s)

a
(c)
Figura 5.30. Diferentes posibilidades para el lugar de las races del control PID de
un sistema de levitacion magnetica.
268 5 Dise no usando la respuesta en el tiempo
Para aplicar el criterio de Routh se construye la tabla 5.1. Para que haya
Tabla 5.1. Aplicacion del criterio de Routh al polinomio en (5.59).
s
4
1 a2 a0
s
3
a3 a1 0
s
2 a
3
a
2
a
1
a
3
= e a0 0
s
1 ea
1
a
3
a
0
e
0
s
0
a0
estabilidad en lazo cerrado se requiere que no haya cambios de signo en la
primera columna de la tabla 5.1, es decir que:
a
3
a
2
a
1
a
3
> 0,
ea
1
a
3
a
0
e
> 0, a
3
> 0, a
0
> 0 (5.60)
Notese que la tercera condicion en (5.60) se satisface de manera natural mien-
tras que de la primera y la ultima condiciones se encuentra que:
k
d
> 3.5695 10
6
, k
d
> 0 (5.61)
De la segunda condicion en (5.60) se obtiene:
k
2
d
+
_
b
1
b
2

b
3
b
4
2739
2
b
5
b
2
b
4
_
k
d

b
1
b
3
b
2
b
4
> 0 (5.62)
b
1
= 112250, b
2
= 3.1447 10
10
, b
3
= 3.536 10
6
,
b
4
= 11613700 31.24, b
5
= 11613700
31.28
8
Dado que se trata de un polinomio de segundo grado, no es difcil encontrar
que las races del polinomio en (5.62) son k
d
= 0.01 y k
d
= 3.5 10
6
. Mas
a un, se puede evaluar numericamente para encontrar que:
(k
d
0.01)(k
d
+ 3.5 10
6
) > 0, si k
d
< 3.5 10
6
(k
d
0.01)(k
d
+ 3.5 10
6
) < 0, si 3.5 10
6
< k
d
< 0.01
(k
d
0.01)(k
d
+ 3.5 10
6
) > 0, si k
d
> 0.01
Por tanto, para satisfacer simultaneamente (5.61) y (5.62) y asegurar estabili-
dad en lazo cerrado, se debe seleccionar (5.58). En el captulo 11 se usan estos
resultados para proponer varios conjuntos de ganancias para el controlador
PID que son probados experimentalmente.
5.2.8. Control de un sistema ball and beam
En esta seccion se dise na un controlador para el sistema ball and beam
que se construye y prueba experimentalmente en el captulo 12, seccion 12.7.
5.2 Ejemplos 269
Inicialmente suponga que se usara un controlador proporcional de ganancia .
Lo primero que se procede a hacer es estudiar la posibilidad de que el sistema
en lazo cerrado pueda ser estable para alg un valor positivo de la ganancia
(los otros parametros tambien son positivos pero no se pueden cambiar). El
diagrama de bloques en lazo cerrado correspondiente se muestra en la gura
5.31. La funcion de transferencia de lazo cerrado es:

+
A
x
s s+a ( )
k
s
2

X
d
(s) X(s)
Figura 5.31. Sistema en lazo cerrado. Control proporcional de ganancia .
X(s)
X
d
(s)
=
A
x
k
s
4
+as
3
+A
x
k
A
x
= 5.3750, k = 16.6035, a = 3.3132, = 5
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.2 usando el polinomio caracterstico
de lazo cerrado s
4
+ as
3
+ A
x
k. Notese que un elemento de la primera
Tabla 5.2. Aplicacion del criterio de Routh al polinomio s
4
+ as
3
+ Axk.
s
4
1 0 Axk
s
3
a 0 0
s
2
0 Axk
s
1 aAxk

0
s
0
Axk
columna es igual a cero por lo que, de acuerdo al metodo, debe ser sustituido
por un valor > 0 peque no. Notese que bajo esta condicion, existen dos
cambios de signo en la primera columna de la tabla 5.2 y que esto no puede
ser modicado ajustando el valor de (positivo). Entonces, se concluye que
no existe ning un controlador proporcional que pueda hacer que el sistema en
lazo cerrado sea estable y debe intentarse con otro controlador.
De acuerdo a la regla 12 de la seccion 5.1.1 un controlador PD hace mas
estable aquello que no lo es, porque un controlador PD introduce un cero de
lazo abierto. Sin embargo, un controlador PD amplica el ruido debido a su
parte derivativa. Esto se ve claramente en el captulo 6 porque un contro-
lador PD es un ltro pasa altas y el ruido es una se nal de alta frecuencia.
270 5 Dise no usando la respuesta en el tiempo
Una manera de conseguir las propiedades estabilizantes de un controlador PD
pero disminuyendo un poco el efecto del ruido es usando un compensador de
adelanto de la forma
s+
s+c
con c > > 0. Por esta razon, a continuacion se
estudia la posibilidad de estabilizar el sistema en cuestion usando el diagrama
de bloques mostrado en la gura 5.32. La funcion de transferencia de lazo

+
A
x
s s+a ( )
k
s
2

s+c
s+
X
d
(s) X(s)
Figura 5.32. Sistema en lazo cerrado. Uso de un compensador de adelanto.
cerrado es:
X(s)
X
d
(s)
=
A
x
k(s +)
s
5
+ (a +c)s
4
+acs
3
+A
x
ks +A
x
k
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.3 usando el polinomio caracterstico
de lazo cerrado s
5
+(a+c)s
4
+acs
3
+A
x
ks+A
x
k. Notese que, dado que
Tabla 5.3. Aplicacion del criterio de Routh al polinomio s
5
+ (a + c)s
4
+ acs
3
+
Axks + Axk.
s
5
1 ac Axk
s
4
a + c 0 Axk
s
3
ac
(a+c)AxkAxk
a+c
= e
s
2 (a+c)e
ac
= f Axk
s
1 feacAxk
f
0
s
0
Axk
todos los parametros son positivos, hay al menos dos cambios de signo en la
primera columna de la tabla 5.3. Entonces, se concluye que no existe ning un
compensador de adelanto que pueda hacer que el sistema en lazo cerrado sea
estable y debe intentarse otra estrategia de control. Analizando cuidadosa-
mente la tabla 5.3 se encuentra que el problema es originado por el primer
elemento correspondiente al renglon s
2
, es decir
(a+c)e
ac
, el cual es negativo.
Notese que esto es una consecuencia de que el segundo elemento correspon-
diente al renglon s
4
es igual a cero. Esto es debido a que la potencia s
2
tiene
un coeciente cero en el polinomio s
5
+(a +c)s
4
+acs
3
+A
x
ks +A
x
k.
5.2 Ejemplos 271
Por tanto, se concluye que el sistema en lazo cerrado puede ser estable si el
polinomio caracterstio de la funcion de transferencia de lazo abierto tiene la
potencia s
2
con un coeciente positivo. A continuacion se muestra que esto es
posible si se usan dos lazos internos como se muestra en la gura 5.33. Notese
que se sigue manteniendo el uso del compensador de adelanto. En este caso,
s s+a ( )
k

s+c
s+b
s
2

+
+ +

A
x
A
A

ks
Xd(s) X(s)

1 2
Figura 5.33. Sistema en lazo cerrado. Uso de lazos internos y un compensador de
adelanto.
la funcion de transferencia de lazo abierto esta dada como:
G(s)H(s) =
A
x

A

s +b
s +c
kA

s
2
+ (a +k
v
kA

)s +kA

1
s
2
c > b > 0, > 0, A

= 0.9167
Notese que el sistema es tipo 2, por lo que el error en estado estacionario es
cero si la referencia deseada es una constante o una rampa. El lector pue-
de obtener la funcion de transferencia de lazo cerrado
X(s)
X
d
(s)
para vericar
que el polinomio caracterstico correspondiente es de grado 5 y con todos los
coecientes de sus potencias positivos (incluido el coeciente de s
2
), como se
esperaba. De acuerdo a la discusion previa, esto signica que existe la posibili-
dad de encontrar valores positivos para , c, b (con c > b), k
v
y que consigan
que el sistema en lazo cerrado sea estable. A continuacion se encuentran estos
valores usando el metodo del lugar de las races.
Suponga que las races del polinomio s
2
+ (a +k
v
kA

)s +kA

son com-
plejas conjugadas, es decir, que se puede escribir:
s
2
+ (a +k
v
kA

)s +kA

= (s + +j)(s + j), > 0, > 0


De acuerdo a la regla 3 existen n m = 4 ramas del lugar de las races que
tienden hacia el innito del plano s sobre cuatro asntotas cuyos angulos estan
dados como:
180

4
= 45

180

(3)
4
= 3(45

) = 135

Por tanto, usando estos resultados as como las reglas 1,2 y 5, se concluye que
272 5 Dise no usando la respuesta en el tiempo
b c
x
x
x
x +

Re(s)
Im(s)
(a)
c
x x +
b

x
x
Re(s)
Im(s)
(b)
b c
x

x +
x
x
Re(s)
Im(s)
(c)
Figura 5.34. Diferentes posibilidades para el lugar de las races de un sistema ball
and beam.
5.2 Ejemplos 273
existen las posibilidades mostradas en la gura 5.34. De acuerdo a la regla 4,
el punto donde se intersectan las asntotas mencionadas anteriormente con el
eje real esta dado como:

a
=
2 + (b c)
4
Esto signica que las 4 ramas son haladas hacia la izquierda (por lo que el
sistema en lazo cerrado tiende a ser mas estable) si:
Se elige un valor mayor de > 0, es decir, si el sistema:
kA

s
2
+ (a +k
v
kA

)s +kA

(5.63)
esta sucientemente amortiguado, lo cual se consigue usando un valor su-
cientemente grande de la ganancia k
v
> 0.
b > 0 se aproxima a cero y c > 0 es grande, es decir si c > b. Notese que
esto esta en completo acuerdo con las reglas 11 y 12.
Siguiendo la segunda opcion se obtiene el diagrama del lugar de las races
mostrado en la gura 5.34(b). Notese que las dos ramas que inician en los dos
polos colocados en s = 0 siempre permanecen sobre el semiplano complejo
derecho, lo cual implica que el sistema en lazo cerrado es inestable. La principal
razon para este comportamiento es que las ramas que inician en los polos de
la funcion de transferencia en (5.63) son halados hacia el segmento sobre
el eje real entre s = c y s = b. Esto, a su vez, se debe a que los dos
polos complejos de lazo abierto estan muy cerca del segmento entre s = c
y s = b. Si dichos polos complejos se alejan de dicho segmento entonces se
abre la posibilidad de que las dos ramas que inician en los polos colocados en
s = 0 sean haladas hacia el segmento entre s = c y s = b para obtener
el diagrama mostrado en la gura 5.34(c). Esto implica que hay estabilidad
en lazo cerrado para algunos valores peque nos de la ganancia de lazo. Para
conseguir esto, es necesario usar valores grandes del coeciente kA

(esto
incrementa la distancia al origen de los polos complejos de lazo abierto arriba
mencionados), es decir, usando un valor grande de .
La discusion anterior indica que se deben usar valores grandes de k
v
y
. Sin embargo, en la practica estos valores estan limitados por el contenido
de ruido del sistema, por lo que k
v
y deben ser obtenidos usando pruebas
experimentales. De hecho, el ruido tambien es una razon importante para no
seleccionar reales los polos de la funcion de transferencia en (5.63): obtener
polos reales implica un sistema muy amortiguado lo cual requiere un valor
de k
v
a un mayor. De acuerdo a las pruebas experimentales reportadas en el
captulo 12 se seleccionaron los siguientes valores:
= 12, k
v
= 0.2
Por tanto, los unicos valores que falta determinar son , c y b. Aunque estos
parametros se pueden determinar de manera que los polos de lazo cerrado
274 5 Dise no usando la respuesta en el tiempo
sean asignados en los valores deseados (usando la metodologa presentada
en la seccion 5.2.6), sin embargo en este problema no se conoce cual es la
ubicacion de los polos de lazo cerrado que resultan en un buen desempe no.
Por esta razon, el objetivo de dise no es simplemente que el sistema en lazo
cerrado sea estable. Para conseguir esto se procede del siguiente modo.
Se proponen valores para b y c de modo que c > b > 0.
Se hace uso de software especializado para dibujar el lugar de las races.
Se elige un valor de > 0 para el cual todos los polos de lazo cerrado
esten ubicados en el semi plano complejo izquierdo. Esto signica que es
el parametro usado por el metodo para dibujar el lugar de las races.
Si no existe tal valor de > 0 se regresa al primer paso.
De este modo se obtiene el lugar de las races de la gura 5.35 donde se
observa que todos los polos de lazo cerrado (marcados con el smbolo +)
tienen parte real negativa si se usa:
= 1.2, c = 20, b = 2.5
Finalmente, es conveniente decir que se debe incluir un paso adicional para el
procedimiento arriba listado:
Una vez seleccionados los valores de , c y b se deben realizar pruebas
experimentales para vericar que se obtiene un buen desempe no con el
sistema de control dise nado. Si no es as, entonces regrese de nuevo al
primer paso del procedimiento arriba listado.
20 15 10 5 0
15
10
5
0
5
10
15
Root Locus
Real Axis
I
m
a
g
in
a
r
y

A
x
is
Figura 5.35. Lugar de las races del sistema ball and beam dise nado.
5.3 Caso de estudio 275
5.3. Caso de estudio. Notas adicionales sobre el control
PID de posicion de un motor de CD
En la seccion 5.2.5 se estudia el uso de un controlador PID para regular
la posicion de un motor de CD. Ah se encontro que la posicion del motor se
relaciona con la posicion deseada y la perturbacion externa de par, a traves
de dos funciones de transferencia que, sin embargo, tienen el mismo polinomio
caracterstico:
s
3
+ (a +k
d
k)s
2
+k
p
ks +k
i
k (5.64)
Tambien se encontro que si se desean asignar los siguientes polos de lazo
cerrado p
1
, p
2
, p
3
:
p
1
=
1
+j
1
, p
2
=
1
j
1
, p
3
< 0,
1
< 0,
1
> 0
entonces las ganancias del controlador se deben seleccionar de acuerdo a
(5.40), es decir:
k
d
=
(2
1
+p
3
) a
k
> 0 (5.65)
k
p
=

2
1
+
2
1
+ 2
1
p
3
k
> 0 (5.66)
k
i
=
p
3
(
2
1
+
2
1
)
k
> 0 (5.67)
Por otro lado, en el ejemplo 4.12, del captulo 4, se encontro que todas las
races del siguiente polinomio:
s
3
+as
2
+bs +c
tienen parte real negativa si y solo si:
a > 0, b >
c
a
> 0 c > 0
Aplicando estas condiciones al polinomio caracterstico dado en (5.64) se ob-
tiene:
a +k
d
k > 0, k
p
k >
k
i
k
a +k
d
k
, k
i
k > 0 (5.68)
Usando las expresiones en (5.65), (5.66), (5.67) y (5.68) se puede concluir que
las ganancias de un controlador PID de posicion para un motor de CD tienen
los siguientes efectos sobre la respuesta del sistema en lazo cerrado:
Valores mayores y positivos de la ganancia integral, k
i
, resultan en una
respuesta mas rapida y que oscila cada vez mas. La primera parte de esta
observacion se justica a partir de (5.67), donde
2
n
=
2
1
+
2
1
, recordando
276 5 Dise no usando la respuesta en el tiempo
que dos polos complejos conjugados producen una respuesta mas rapida si

n
es mayor y que un polo real y negativo, p
3
< 0, produce una respuesta
mas rapida si su valor absoluto, p
3
, es mayor. La segunda parte de la
observacion se justica a partir de la segunda desigualdad en (5.68), es
decir k
p
k >
kik
a+k
d
k
. Si k
i
es mayor, entonces esta condicion tiende a no ser
valida, es decir, el sistema en lazo cerrado se acerca a la inestabilidad y
por eso oscila cada vez mas.
Valores mayores y positivos de la ganancia proporcional, k
p
, resultan en
una respuesta mas rapida cuyas oscilaciones, al menos, no se incrementan
de manera importante. La primera parte de esta observacion se justica a
partir de (5.66) usando argumentos similares a los de la ganancia integral
en el parrafo anterior: recordando que
2
n
=
2
1
+
2
1
,
1
p
3
> 0, que dos
polos complejos conjugados producen una respuesta mas rapida si
n
es
mayor y que un polo real y negativo, p
3
, produce una respuesta mas rapi-
da si su valor absoluto es mayor. La segunda parte de la observacion se
justica, de nuevo, a partir de la segunda desigualdad en (5.68), es decir
k
p
k >
kik
a+k
d
k
. Si k
p
es mayor, entonces esta condicion es cada vez mas vali-
da, es decir, el sistema en lazo cerrado se hace cada vez mas estable. Sin
embargo, esto, unido al incremento en la rapidez (que en general tiende
a aumentar las oscilaciones de la respuesta), puede resultar en un com-
portamiento transitorio donde, al menos, las oscilaciones no aumentan de
manera importante.
Valores mayores y positivos de la ganancia derivativa, k
d
, producen una
respuesta que oscila menos. Esta observacion se justica a partir de la
segunda desigualdad en (5.68), es decir k
p
k >
kik
a+k
d
k
. Notese que si k
d
> 0
es mayor, entonces esta condicion es mas valida y, por tanto, el sistema en
lazo cerrado es mas estable. As, un valor mayor de k
d
> 0 puede reducir las
oscilaciones debidas a un valor grande de k
i
> 0. Por otro lado, a partir de
(5.65) se concluye que valores mayores de k
d
> 0 producen valores mayores
de
1
> 0 y/o de p
3
> 0. Usando este hecho, junto con (5.66), (5.67), y
si k
p
y k
i
se mantienen constantes, se concluye que si
2
n
=
2
1
+
2
1
aumenta
(o disminuye), al variar
1
, entonces p
3
disminuye (o aumenta) por lo
que la rapidez de respuesta no se ve claramente afectada. Sin embargo,
en la pratica es com un encontrar que al aumentar k
d
> 0 la rapidez de
respuesta del sistema en lazo cerrado disminuye un poco.
Es conveniente advertir que la funcion de transferencia entre la posicion y
su valor deseado (G
1
(s) en (5.37)) tiene dos ceros cuyo efecto sobre la respuesta
transitoria no es del todo clara. As que es posible que en algunas ocasiones
existan algunas variaciones respecto de los efectos que se acaban de mencionar
para las ganancias de un controlador PID. Ademas, estas variantes pueden ser
favorecidas por el hecho de que en algunos mecanismos la perturbacion externa
esta presente desde que se ordena un nuevo valor deseado de posicion.
Para ilustrar mejor estas ideas, a continuacion se presentan los resultados
obtenidos de manera experimental al controlar la posicion de un motor de
5.3 Caso de estudio 277
CD. El prototipo experimental es el mismo que se describe en el captulo 10
con una variante adicional (no presente en dicho captulo): la echa del motor
se une rmemente a un pendulo como el mostrado en la gura 5.36. De este
modo, y por efecto de la gravedad g, se introduce una perturbacion de par
que trata de desviar la posicion del motor respecto de su valor deseado. En la
gura 5.36, T(t) representa el par generado por el motor y es la variable que
se controla. Los parametros del pendulo l y m no se miden para mostrar que se
puede sintonizar un controlador PID sin necesidad de conocer los parametros
de la planta, si se entienden cuales son los efectos de las ganancias de un
controlador PID (listados mas arriba).
T(t)

l
m
g
d
Figura 5.36. Pendulo simple que se conecta a la echa de un motor de CD.
En las guras 5.37 y 5.38 se muestran los resultados experimentales corres-
pondientes. Se usa el valor deseado de posicion
d
= /2[rad] pues es ah donde
la perturbacion de par debida a la gravedad tiene su mayor efecto. Ademas se
muestra una lnea vertical ubicada en t = 0.13[s] y una lnea horizontal ubica-
da en = 1.8[rad] para indicar el tiempo de subida y el sobre paso deseados.
La intencion es variar un parametro a la vez con el n de apreciar claramente
su efecto. De este modo, las curvas dibujadas en la gura 5.37 corresponden
a los siguientes parametros de controlador PID:
1. Graca superior:
Lnea contnua: k
p
= 0.5, k
i
= 0, k
d
= 0.
Lnea-punto: k
p
= 1, k
i
= 0, k
d
= 0.
Lnea punteada: k
p
= 1, k
i
= 0, k
d
= 0.05.
2. Graca inferior:
Lnea contnua: k
p
= 1, k
i
= 2, k
d
= 0.05.
Lnea-punto: k
p
= 1, k
i
= 5, k
d
= 0.05.
Lnea punteada: k
p
= 2, k
i
= 5, k
d
= 0.05.
Lnea interrumpida: k
p
= 2, k
i
= 5, k
d
= 0.1.
Como el sistema en lazo cerrado es de tercer orden cuando se usa un con-
trolador PID y, ademas, no se conocen los parametros del motor a controlar,
278 5 Dise no usando la respuesta en el tiempo
es difcil saber que ganancias del controlador hay que utilizar para evitar la
inestabilidad. As que lo mejor es iniciar con un controlador PD (asignando
k
i
= 0), que produce un sistema en lazo cerrado de segundo orden el cual es
estable para cualquier valor positivo de k
p
con k
d
= 0 (pues todo mecanismo
real posee un poco de friccion). Posteriormente, de acuerdo a la respuesta
transitoria que se vaya obteniendo y a las reglas de sintona arriba listadas,
se podra empezar a ajustar las ganancias k
i
y k
d
de manera que se consigan
respuestas estables. Por esta razon, en la parte superior de la gura 5.37 se
utiliza un controlador PD. Notese que se obtiene un error en estado esta-
cionario diferente de cero debido a la perturbacion de par que introduce la
gravedad (porque k
i
= 0). En esta parte del experimento, la idea es acercar
la rapidez del sistema a la rapidez deseada asegurando un comportamiento
sucientemente estable. Por esta razon, primero se incrementa la ganancia
proporcional hasta k
p
= 1 y luego se incrementa la ganancia derivativa has-
ta k
d
= 0.05. De este modo, en la parte inferior de la gura 5.37, se puede
introducir el termino integral que aunque lleva a cero el error en estado es-
tacionario produce respuestas mas oscilatorias. De nuevo, la idea es tratar de
aproximarse a la rapidez de respuesta deseada. Esto se consigue incrementan-
do primero la ganancia integral hasta k
i
= 5. Como esto tambien incrementa
las oscilaciones, posteriormente se usa k
p
= 2 consiguiendo mayor rapidez pero
sin aumentar notablemente las oscilaciones. Finalmente, se usa k
d
= 0.1 para
obtener una respuesta sucientemente amortiguada. Notese que el incremento
de k
d
reduce un poco la rapidez de la repuesta (tiempo de subida mayor).
Las curvas dibujadas en la gura 5.38 corresponden a los siguientes
parametros de controlador PID:
1. Graca superior:
Lnea contnua: k
p
= 2, k
i
= 5, k
d
= 0.1.
Lnea-punto: k
p
= 2, k
i
= 5, k
d
= 0.2.
Lnea punteada: k
p
= 2, k
i
= 8, k
d
= 0.2.
2. Graca inferior:
Lnea contnua: k
p
= 2, k
i
= 8, k
d
= 0.2.
Lnea-punto: k
p
= 2.5, k
i
= 8, k
d
= 0.2.
Lnea punteada: k
p
= 3, k
i
= 8, k
d
= 0.2.
Lnea interrumpida: k
p
= 3.5, k
i
= 8, k
d
= 0.2.
En la graca superior de la gura 5.38 se observa que la respuesta es a un mas
amortiguada y mas lenta al incrementar la ganancia derivativa de k
d
= 0.1
a k
d
= 0.2. Como en este momento la respuesta es muy lenta y el sobre
paso es muy peque no, se usa k
i
= 8 para producir un sistema mas rapido
y con un sobre paso mayor que coincide con el sobre paso deseado. Con el
n de incrementar la rapidez, sin afectar notablemente el sobre paso, en la
parte inferior de la gura 5.38 se incrementa la ganancia proporcional hasta
k
p
= 3.5. De este modo se consigue la rapidez y el sobre paso deseados.
Es conveniente aclarar lo siguiente. Al conectar un pendulo a la echa de
un motor de CD, el sistema de control es no lineal. Esto signica que en ciertas
5.3 Caso de estudio 279

[rad]
[rad]
tiempo[s]
tiempo[s]
Figura 5.37. Control PID de posicion de un motor de CD con una carga pendular.
Resultados experimentales.
regiones el comportamiento del sistema de control no es predicho adecuada-
mente por el analisis matematico presentado mas arriba. Por ejemplo, si el
valor deseado de posicion es cercano a
d
= , un simple control PD puede
ser inestable si la ganancia proporcional (positiva) no es mayor que un cierto
umbral inferior. Este resultado se obtiene usando un controlador PD en el caso
x

1
= , x

2
= 0 del ejemplo 7.3 estudiado en el captulo 7 y obteniendo los
polos de dicha aproximacion lineal. Tambien pueden consultarse los trabajos
reportados en [4], [2], cap. 8, [3], cap. 7. Esta situacion es mas grave cuando se
trata de un controlador PID pero el problema no aparece si el valor deseado
de posicion se mantiene alejado de
d
= , situacion que corresponde a los
experimentos aqu presentados.
Finalmente, notese que se ha conseguido seleccionar las ganancias de un
controlador PID de posicion para un motor de CD sin necesidad de conocer el
valor numerico de ning un parametro del motor ni del pendulo. Sin embargo, el
conocimiento mnimo con el que se debe contar para resolver este problema,
desde el punto de vista de construccion del mecanismo, es vericar previa-
mente que el motor puede producir par suciente. Esto debe incluir el par
necesario para compensar el efecto de la gravedad mas una parte adicional de
par que permita alcanzar la rapidez de respuesta deseada.
280 5 Dise no usando la respuesta en el tiempo
tiempo[s]
tiempo[s]

rad [ ]
rad [ ]

Figura 5.38. Control PID de posicion de un motor de CD con una carga pendular.
Resultados experimentales.
5.4. Resumen del captulo
El metodo mas poderoso para el dise no de sistemas de control usando la
respuesta en el tiempo es el lugar de las races. Esto signica que las plantas
a controlar pueden ser sistemas de orden arbitrario con cualquier n umero de
ceros. Este metodo provee las herramientas necesarias para determinar, de
manera graca, la ubicacion de los polos de lazo cerrado a partir de los polos
y ceros de lazo abierto. Algunos de los polos y ceros de lazo abierto son intro-
ducidos por el controlador y la idea del metodo es ajustar la ubicacion de los
polos y ceros del controlador (mediante la seleccion adecuada de sus ganan-
cias) de manera que se consigan los polos de lazo cerrado deseados. Los polos
de lazo cerrado deseados se determinan a partir del conocimiento de como
afectan los polos de una funcion de transferencia a la respuesta transitoria
correspondiente. Para esto es muy importante el estudio previo del captulo
3. Por otro lado, la estructura del controlador se selecciona a partir del co-
nocimiento de como inuyen los polos (de lazo abierto) del controlador sobre
la respuesta en estado estacionario del sistema en lazo cerrado. Para esto es
muy importante el estudio previo del error en estado estacionario presentado
en el captulo 4.
5.5 Preguntas de repaso 281
Aunque el lugar de las races ha sido usado como un metodo de dise no
de controladores, tambien es una herramienta poderosa para el analisis de
sistemas de control. Esto signica que se puede utilizar para determinar: i)
que tan estable es un sistema de control, ii) como afecta el cambio de un
parametro a la respuesta del sistema de control, iii) que debe hacerse para
modicar las propiedades del sistema de control, etc. El uso del metodo del
lugar de las races en estas aplicaciones depende en gran medida de un buen
entendimiento del metodo y del conocimiento del material presentado en los
captulos 3 y 4.
5.5. Preguntas de repaso
1. Cuando y para que utilizara cada uno de los siguientes controladores?
Proporcional.
Proporcional-derivativo.
Proporcional-integral.
Proporcional-integra-derivativo.
2. Por que cree que no es recomendable el uso de controladores: i) derivati-
vos, ii) integrales y iii) derivativos-integrales, sin la presencia de la parte
proporcional? Explique.
3. De que manera el error en estado estacionario determina los polos y/o
ceros (la estructura) del controlador?
4. Cual es el componente principal que debe tener un controlador si se desea
mejorar la estabilidad del sistema en lazo cerrado? Cual es el efecto de
esto sobre el lugar de las races?
5. Cual es el componente principal que debe tener un controlador si se desea
mejorar el error en estado estacionario? Cual es el efecto de esto sobre el
lugar de las races?
6. Por que el lugar de las races inicia en los polos de lazo abierto y ter-
mina en los ceros de lazo abierto? Que signican las palabras inicia y
termina?
7. Si la funcion de transferencia de lazo abierto no tiene ceros En donde
termina el lugar de las races?
8. Con frecuencia se dice que al aumentar la ganancia de lazo el sistema en
lazo cerrado tiende a hacerse inestable. Sin embargo, esto no siempre es
cierto pues depende de las caractersticas de la planta que se esta contro-
lando. Revise los ejemplos presentados en este captulo y de un ejemplo
de una planta a controlar que requiera que la ganancia de lazo sea su-
cientemente grande para que el sistema en lazo cerrado sea estable.
9. Que es un compensador de adelanto, cual es su principal caracterstica y
para que se usa?
10. Consulte la seccion 9.8 del captulo 9, las secciones 10.2.2 y 10.5 del captu-
lo 10 y la seccion 8.2 del captulo 8 para explicar como construira un con-
282 5 Dise no usando la respuesta en el tiempo
trolador PID y un compensador de adelanto usando software y electronica
analogica.
5.6. Ejercicios propuestos
1. Considere el sistema de control de la gura 5.39 donde:
k = 35.2671, a = 3.5201, c = 10.3672, = 2.0465, d = 3.8935
Verique que cuando k
i
= 0 y k
p
= 1 hay dos polos complejos conjugados
de lazo cerrado en s = 4.8935j6.6766. Con la ayuda de alg un software
especializado, obtenga el lugar de las races para los siguientes valores de
k
i
:
k
i
= 0.001, 0.01, 0.1, 1, 10
Use el valor de k
p
como la ganancia que el metodo vara desde 0 hasta +
para dibujar el graco. Seleccione el valor de k
p
= 1 y observe que pasa con
los polos de lazo cerrado correspondientes con respecto a los puntos s =
4.8935j6.6766. Utilice software especializado para realizar simulaciones
en cada caso cuando la referencia es un escalon unitario. Compare la
respuesta obtenida conforme k
i
crece con la respuesta obtenida cuando
k
p
= 1 y k
i
= 0. Elabore los lugares de las races correspondientes usando
el metodo propuesto en este captulo y explique lo que sucede.
+

(s)

d
s ( )

s+c
s+d
k
p
+
s
k
i
s(s+a)
k
Figura 5.39. Controlador PI en cascada con una red de adelanto.
2. Considere la siguiente planta:
Y (s) = H
1
(s)U(s), H
1
(s) =
k
s(s +a)
, k = 35.2671, a = 3.5201
a) Utilice las expresiones en (3.59) del captulo 3 para obtener los valores
de k
p
y k
v
que consigan las siguientes caractersticas de respuesta
transitoria:
t
r
= 0.33[s], M
p
( %) = 10
cuando y
d
es un escalon unitario (constante igual a uno) y se utiliza
la siguiente entrada: u(t) = k
p
(y
d
y) k
v
y, control proporcional con
realimentacion de velocidad.
5.6 Ejercicios propuestos 283
b) Considere que la entrada esta dada como:
u(t) = k
p
(y
d
y) +k
d
d(y
d
y)
dt
, control proporcional-derivativo
Obtenga la funcion de transferencia de lazo cerrado y use las expre-
siones en (3.59) del captulo 3 para determinar k
p
y k
d
de manera que
los polos de lazo cerrado se ubiquen en lugares tales que determinen
las siguientes carctersticas de lazo cerrado:
t
r
= 0.33[s], M
p
( %) = 10
Haga simulaciones para cada uno de los incisos anteriores y compare las
respuestas obtenidas. A que se debe la diferencia existente entre estas
respuestas? Los ceros de una funcion de transferencia pueden afectar la
forma exacta de la respuesta? Puede usar el lugar de las races para
explicar esta diferencia?
3. Considere un sistema en lazo cerrado como el de la gura 5.1 con H(s) = 1
y G(s) =
1
s
3
+s
2
+s+1
.
Usando las reglas presentadas en la seccion 5.1.1 construya el lugar de
las races correspondiente a un controlador proporcional. Compruebe
que el sistema en lazo cerrado es inestable para cualquier valor positivo
de la ganancia del controlador proporcional. Use el criterio de Routh
como alternativa para encontrar este resultado.
Con el n de estabilizar el sistema en lazo cerrado y para conseguir un
error cero en estado estacionario ante una referencia tipo escalon dise ne
un controlador PID del siguiente modo. i) Proponga k
d
s
2
+k
p
s +k
i
=
k
d
(s z
1
)(s z
2
), con z
1
= 0.5 + 1.3j, z
2
= 0.5 1.3j. Usando
las reglas presentadas en la seccion 5.1.1 dibuje el lugar de las races
correspondiente para vericar que no existe ning un valor positivo de la
ganancia derivativa que produzca un sistema en lazo cerrado estable.
ii) Proponga k
d
s
2
+k
p
s+k
i
= k
d
(sz
1
)(sz
2
), con z
1
= 0.25+1.3j,
z
2
= 0.25 1.3j. Usando las reglas presentadas en la seccion 5.1.1
dibuje el lugar de las races correspondiente para vericar que existe un
rango de valores positivos de la ganancia derivativa k
d
que producen
un sistema en lazo cerrado estable. Utilice el criterio de Routh para
encontrar el rango de valores de k
d
que consiguen estabilidad en lazo
cerrado.
De acuerdo a lo anterior Como debe seleccionar los ceros de un con-
trolador PID para mejorar la estabilidad del sistema en lazo cerrado?
4. Verique que la funcion de transferencia del circuito mostrado en la gura
5.40 es:
V
o
(s)
V
i
(s)
=
s +a
s +b
, a =
1
R
1
C
, b =
1
R
1
C
+
1
R
2
C
Notese que como b > a esta red electrica puede usarse como un compen-
sador de adelanto.
284 5 Dise no usando la respuesta en el tiempo
+

C
v
i
v
o
+

R
1
R
2
Figura 5.40. Compensador de adelanto.
5. Considere la siguiente planta:
G(s) =
4(s + 0.2)
(s + 0.5)(s
2
0.2s + 0.3)
Use la tecnica del lugar de las races para dise nar un controlador que ase-
gure estabilidad en lazo cerrado y un error cero en estado estacionario
cuando la referencia deseada es un escalon. Se sugiere proponer la ubica-
cion de los polos y ceros del controlador y luego seleccionar la ganancia
de lazo abierto de manera que todos los polos de lazo cerrado pertenezcan
al semiplano complejo izquierdo.
6. Considere el control PD de posicion estudiado en la seccion 5.2.2. Demues-
tre que el valor de la ganancia derivativa k
d
no afecta al error en estado
estacionario cuando la referencia deseada es una constante.
7. Considere el control PID de posicion estudiado en la seccion 5.2.5. De-
muestre que los valores de las ganancias proporcional k
p
y derivativa k
d
no afectan al error en estado estacionario a pesar de la presencia de una
perturbacion constante cuando la referencia deseada tambien es constante.
En este mismo problema suponga que no existe la parte integral del contro-
lador, es decir que k
i
= 0. Demuestre que el valor de la ganancia derivativa
k
d
no afecta al error en estado estacionario a pesar de la presencia de la
perturbacion.
8. Considere el sistema masa-resorte-amortiguador mostrado en la gura 5.41
y modelado en el ejemplo 2.2 del captulo 2. En el ejemplo 3.18 del captu-
lo 3 se explica porque hay un error en estado estacionario diferente de cero
cuando se usa un controlador proporcional de posicion y la posicion de-
seada x
d
es una constante diferente de cero. Recuerde que la fuerza F(t)
aplicada sobre la masa es la se nal entregada por el controlador.
Ahora suponga que se usa un controlador PID de posicion. Encuentre el
error en estado estacionario cuando la posicion deseada x
d
es un valor
5.6 Ejercicios propuestos 285
constante diferente de cero. Use su experiencia cotidiana para explicar el
porque de su respuesta, es decir, trate de explicar pensando en que pasa
con la fuerza F(t) aplicada sobre la masa y que efecto tiene el resorte
sobre la masa.
K
F t ( )
m
b
Figura 5.41. Sistema masa-resorte-amortiguador.
9. Considere el pendulo simple estudiado en el ejemplo 2.13 del captulo 2 y
mostrado en la gura 5.42. Notese que la gravedad ejerce un par diferente
de cero sobre el pendulo si la posicion angular no es igual a cero. Suponga
que se desea llevar la posicion del pendulo a un valor constante
d
igual a 90

. Notese que el par T(t) es la entrada del pendulo. Usando


la experiencia del ejercicio previo, diga que tipo de controlador utilizara
para calcular T(t) de manera que consiga alcanzar a
d
. Explique por
que. Este problema esta hecho para que razone y no necesita utilizar el
modelo matematico del pendulo. De hecho, dicho modelo matematico es
no lineal y por eso no puede ser analizado usando las tecnicas estudiadas
hasta aqu.
T(t)

l
m
g
d
Figura 5.42. Pendulo simple.
286 5 Dise no usando la respuesta en el tiempo
10. Considere una planta cualquiera G(s) y los siguientes controladores colo-
cados en cascada con G(s):
G
c
(s) =
s +a
s +b
, 0 < a < b
G
d
(s) =
s +c
s +d
, c > d > 0
G
c
(s) se conoce como un compensador de adelanto mientras que G
d
(s) se
conoce como un compensador de atraso.
Cual es el efecto de cada uno de estos compensadores sobre el error
en estado estacionario ante una referencia escalon?
Cual es el efecto de cada uno de estos compensadores sobre la esta-
bilidad relativa del sistema en lazo cerrado?
Con cual de estos compensadores se relaciona un controlador PI y
con cual un controlador PD? Explique por que.
Como construira con estos dos compensadores un controlador que
tenga caractersticas similares a las de un PID? Explique.
11. En un barco es com un contar con un unico girocompas que indica el rum-
bo actual de barco. Sin embargo, se debe contar con esta informacion en
diferentes puntos del barco por lo que es necesario transmitir esta infor-
macion electronicamente para exhibirla en cada punto del barco donde se
necesita usando un instrumento de aguja. La posicion angular de la aguja
es ajustada con un motor de CD usando la informacion suministrada por
el girocompas como la posicion deseada. Dise ne un sistema de control en
lazo cerrado de manera que la posicion de la aguja del instrumento siga
elmente a la orientacion suministrada por el girocompas de acuerdo a las
siguientes especicaciones:
Que ante un cambio tipo escalon de 8

en la orientacion del girocompas,


el error en estado estacionario se reduzca y se mantenga en menos de
1

en 0.3 segundos o menos y que el sobre paso sea menor o igual al


25 %.
Cuando la orientacion del girocompas cambie de acuerdo a una rampa
de 5

por segundo, que el error en estado estacionario sea de 0.3

o
menos.
No existen perturbaciones externas.
Bajo que condiciones de operacion del barco pueden ocurrir estas situa-
ciones? La funcion de transferencia entre el voltaje aplicado al motor y la
posicion de la aguja en grados es:
G(s) =
45.84 10
5
s(4.4 10
9
s
2
+ 308.5 10
9
s + 3.3 10
6
)
Sugerencia.
i) En base las especicaciones suministradas decida que controlador de-
bera usar. ii) Usando la primera especicacion determine una zona, en el
5.6 Ejercicios propuestos 287
dominio del tiempo, dentro de la cual debe estar la respuesta del siste-
ma en lazo cerrado. iii) Recuerde que, de acuerdo a la gura 3.10 en el
captulo 3, la respuesta de un sistema de segundo orden esta contenida
dentro de dos envolventes exponenciales que dependen de y de
n
. Con
esta informacion, usando el amortiguamiento deseado y usando el punto
ii) anterior, determine la zona del plano complejo s dentro de la cual de-
ben caer los polos dominantes (complejos conjugados) del sistema en lazo
cerrado. iv) Determine un punto conveniente sobre la frontera de dicha
zona del plano s y use las reglas vistas para construir el lugar de las races
para determinar las ganancias de un controlador que consiga que dicho
punto sea un polo de lazo cerrado. v) Una vez conseguido esto, seleccio-
ne una ganancia de lazo abierto que asegure que todos los polos de lazo
cerrado esten dentro de la zona deseada. vi) Verique que se cumple la se-
gunda especicacion y, si no es as, redise ne el controlador. vii) Mediante
simulaciones verique que se satisfacen todas las especicaciones.
Referencias
1. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
2. R. Kelly, V. Santiba nez and A. Lora, Control of robot manipulators in joint
space, Springer, London, 2005.
3. R. Kelly y V. Santiba nez, Control de movimiento de robots manipuladores, Pear-
son Prentice Hall, Madrid, 2003.
4. R. Kelly, PD control with desired gravity compensation of robotic manipulators:
a review, The International Journal of Robotcs Research, vo. 16, No. 5, pp. 660-
672, 1997.
5. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espa nol, McGraw-Hill, Mexico, 1992.
10. W. Ali and J.H. Burghart, Eects of lag controllers on the transient response,
IEE Proceedings-D, Control theory and applications, vol. 138, no. 2, pp. 119-122,
March 1991.
6
Dise no usando la respuesta en frecuencia
Uno de los problemas mas importantes y urgentes por resolver durante
la Segunda Guerra Mundial fue el direccionamiento de ca nones antiaereos.
La solucion de este problema motivo en buena medida el desarrollo del con-
junto de herramientas que hoy conocemos como las tecnicas de respuesta en
frecuencia. Aunque las ideas de Nyquist fueron formuladas un poco antes de
este perodo, las ideas de Bode sobre los margenes de fase y de ganancia,
as como el ancho de banda, fueron establecidas durante este perodo. El uso
de estas herramientas, en conjunto con el desarrollo de otras ideas como los
diagramas de bloques, fue fundamental para resolver el problema de controlar
ca nones antiaereos.
292 6 Dise no usando la respuesta en frecuencia
Objetivos del captulo
Entender que signica respuesta en frecuencia y conocer los conceptos fun-
damentales de este enfoque.
Conocer la relaci on entre las caractersticas de respuesta en frecuencia y
las caractersticas de respuesta en el tiempo.
Usar los conceptos de respuesta en frecuencia para el an alisis y dise no de
sistemas de control.
En el captulo 5 se presenta un metodo para dise nar sistemas de control
que se conoce como el metodo de la respuesta en el tiempo. La caracterstica
principal de ese metodo es que trata de ubicar convenientemente los polos de
lazo cerrado de manera que la respuesta transitoria tenga las caractersticas
deseadas. Para ese metodo es fundamental saber como es la respuesta transi-
toria en el tiempo que introducen los polos de lazo cerrado: reales, complejos
conjugados, sencillos, repetidos, etc.
En el presente captulo se introduce un nuevo metodo para el dise no de
sistemas de control que se conoce como el metodo de la respuesta en frecuencia.
Fundamental para este estudio es entender que si una ecuacion diferencial
lineal se excita con una entrada que es una funcion sinusoidal del tiempo,
entonces la salida tambien sera, en estado estacionario, una funcion sinusoidal
del tiempo de la misma frecuencia que la entrada pero con una amplitud y
una fase diferentes. La base de este metodo radica en estudiar como varan la
amplitud y la fase de la se nal de salida al cambiar la frecuencia de la se nal
sinusoidal aplicada a la entrada. Esto es lo que se conoce como respuesta en
frecuencia. Como se muestra en este captulo, la manera en que cambian la
amplitud y la fase de la se nal de salida depende de como son y en donde estan
ubicados los polos y los ceros de la funcion de transferencia correspondiente a
la ecuacion diferencial bajo estudio. La estrategia de dise no en este metodo es
modicar convenientemente las caractersticas de respuesta en frecuencia del
sistema en lazo abierto de manera que se obtengan las caractersticas deseadas
de la respuesta en el tiempo del sistema en lazo cerrado.
Puede armarse que cualquier problema de dise no en control clasico puede
ser resuelto usando cualquiera de los metodos: el metodo de la respuesta en
el tiempo o el metodo de la respuesta en frecuencia. Esto signica que ambos
metodos suministran las herramientas necesarias para cualquier problema de
control clasico. Sin embargo, dado que cada metodo analiza el mismo problema
desde puntos de vista diferentes, cada uno suministra informacion que puede
ser complementaria a la suministrada por el otro metodo. As que es muy
importante que se dominen ambos metodos.
6.1. Un circuito RC de corriente alterna
A continuacion se presentan algunos resultados experimentales obtenidos
con el circuito electrico de la gura 6.1(a). Se utiliza un generador de se nales
6.1 Un circuito RC de corriente alterna 293
para aplicar el siguiente voltaje de entrada:
v
i
(t) = Asin(t) (6.1)
En el osciloscopio se observa una situacion como la que se muestra en la gura
6.1(b), es decir el voltaje de salida (en el capacitor) tiene la forma:
v
0
(t) = Bsin(t +)
=
360 t

T
[grados]
Esto signica que ambas se nales v
i
(t) y v
0
(t) son funciones sinusoidales de la
R
C

i
t ( )
0
t ( )

+
i t ( )
(a)
A
B
t
i t ( )
0 t ( )
T
t
(b)
Figura 6.1. Relaciones entre los voltajes de entrada y de salida en un circuito RC.
misma frecuencia. Es importante aclarar que, bajo la situacion mostrada en la
gura 6.1(b), el valor de es considerado negativo, es decir que el voltaje de
salida, v
0
(t), esta atrasado respecto de la entrada, v
i
(t). Utilizando diferentes
valores de frecuencia, , se obtienen las mediciones mostradas en la tabla 6.1
las cuales se muestran gracadas en la gura 6.2 (lnea continua). La primera
de estas guras muestra como vara el cociente B/A al cambiar la frecuencia
y la otra como vara la fase al cambiar la frecuencia .
294 6 Dise no usando la respuesta en frecuencia
Tabla 6.1. Datos obtenidos experimentalmente con el circuito de la gura 6.1(a).
f [Hz] = 2f[10
5
rad/s] A [V] B [V] [grados]
50 0.0031 1.04 1.04 0
60 0.0038 1.04 1.04 0
70 0.0044 1.04 1.04 0
80 0.0050 1.08 1.08 0
90 0.0057 1 1 0
100 0.0063 0.7 0.7 0
200 0.0126 0.7 0.68 0
300 0.0188 0.98 0.94 -11.92
400 0.0251 1.02 0.9 -13.06
500 0.0314 1.2 1.1 -18
600 0.0377 1.2 1.1 -23.85
700 0.0440 1.22 1.1 -25.71
800 0.0503 1.24 1.1 -29.03
900 0.0565 1.22 1.08 -29.45
1000 0.0628 1.04 0.88 -29.38
2000 0.1257 1.22 0.8 -52.89
3000 0.1885 1.22 0.62 -65.8
4000 0.2513 1.22 0.5 -79.28
5000 0.3142 1.2 0.4 -79.2
6000 0.3770 1.12 0.28 -81.42
7000 0.4398 1.02 0.252 -88.73
8000 0.5027 0.83 0.22 -85.71
9000 0.5655 1.08 0.212 -94
10000 0.6283 1.08 0.28 -86.4
20000 1.2566 1.2 0.112 -83.22
30000 1.8850 1.2 0.08 -86.74
40000 2.5133 1.2 0.057 -83.52
50000 3.1416 1.18 0.047 -86.4
Se dice que el comportamiento mostrado en la gura 6.2 es el de un ltro
pasa bajas. Esto signica que las se nales de baja frecuencia (cercanas a = 0)
son poco atenuadas, B/A 1, mientras que las se nales de alta frecuencia (
muy grande) son fuertemente atenuadas, B/A 0. Por atenuar se debe
entender que el voltaje de salida v
0
(t) tiene un amplitud menor que la amplitud
del voltaje de entrada v
i
(t), es decir, B es menor que A.
6.1.1. Representaciones gracas comunes
Gracas de Bode
Suponga que se tiene un n umero k. El valor correspondiente en decibeles
(dB) se obtiene mediante la operacion:
6.1 Un circuito RC de corriente alterna 295
A
B

grados [ ]
! rad=s [ ]
RC
1
RC
1
2
p
1
45
Figura 6.2. Datos obtenidos experimentalmente con el circuito de la gura 6.1(a)
(vease la tabla 6.1).
k
dB
= 20 log(k)
donde log(k) representa el logaritmo base 10 de k. El logaritmo base 10 de k
se dene del siguiente modo. Si:
10
z
= k
entonces z = log(k). A continuacion se presentan algunas propiedades impor-
tantes y algunos valores que toman los logaritmos:
log(xy) = log(x) + log(y), log(x/y) = log(x) log(y), (6.2)
log(x
m
) = mlog(x), log(1) = 0,
Si x 0 entonces log(x)
Las gracas de Bode se dibujan sobre papel semilogartmico: el eje horizontal
() tiene escala logartmica mientras que el eje vertical tiene escala lineal.
Utilizando los valores de la tabla 6.1 se obtienen los datos mostrados en la
tabla 6.2. En la gura 6.3 se muestran las gracas de Bode correspondientes
(lnea continua).
Notese lo siguiente:
Cuando 0. En la gura 6.3 se tiene que 20log(B/A) 0 [dB] lo
cual corresponde, en la gura 6.2, a B/A 1. Esto esta de acuerdo con
log(1) = 0. En ambas guras 6.3 y 6.2 se tiene que 0[grados].
296 6 Dise no usando la respuesta en frecuencia
Tabla 6.2. Datos obtenidos experimentalmente con el circuito de la gura 6.1(a).
= 2f[10
5
rad/s] 20log(B/A) [dB] [grados]
0.0031 0 0
0.0038 0 0
0.0044 0 0
0.0050 0 0
0.0057 0 0
0.0063 0 0
0.0126 -0.2518 0
0.0188 -0.3620 -11.92
0.0251 -1.0872 -13.06
0.0314 -0.7558 -18
0.0377 -0.7558 -23.85
0.0440 -0.8993 -25.71
0.0503 -1.0406 -29.03
0.0565 -1.0587 -29.45
0.0628 -1.4510 -29.38
0.1257 -3.6654 -52.89
0.1885 -5.8794 -65.8
0.2513 -7.7478 -79.28
0.3142 -9.5424 -79.2
0.3770 -12.0412 -81.42
0.4398 -12.1440 -88.73
0.5027 -11.5331 -85.71
0.5655 -14.1418 -94
0.6283 -11.7253 -86.4
1.2566 -20.5993 -83.22
1.8850 -23.5218 -86.74
2.5133 -26.4661 -83.52
3.1416 -27.9957 -86.4
Cuando +. En la gura 6.3 se tiene que 20log(B/A) [dB]
lo cual corresponde, en la gura 6.2, a B/A 0. Esto esta de acuerdo
con log(x) si x 0. En ambas guras 6.3 y 6.2 se tiene que
90[grados].
Cuando = 1/RC =10 000[rad/s]. En la gura 6.3 se tiene que 20log(B/A)
= 3 [dB] lo cual corresponde, en la gura 6.2, a B/A = 1/

2. En ambas
guras 6.3 y 6.2 se tiene que = 45[grados].
Es posible observar que en las gracas de Bode es mas facil identicar la
frecuencia a partir de la cual el circuito RC aten ua las se nales de salida. Esta
es una de las razones por las que se introducen las gracas de Bode.
6.1 Un circuito RC de corriente alterna 297
45
3
RC
1
RC
1
! rad=s [ ]
20log
A
B

dB [ ]

grados [ ]
Figura 6.3. Gracas de Bode para el circuito en la gura 6.1(a).
Gracas polares
En la gura 6.4 se dene el n umero complejo G de la siguiente manera:
G =
B
A
= Re(G) +jIm(G)
|G| =
B
A
, Re(G) =
B
A
cos(), Im(G) =
B
A
sin()

G
G j j
Im G ( )
Re G ( )
Figura 6.4. N umero complejo.
Usando estas deniciones, los valores mostrados en la tabla 6.1 se pueden
gracar como en la gura 6.5 (lnea continua). Esta graca se conoce como
298 6 Dise no usando la respuesta en frecuencia
graca polar. En esta graca la frecuencia crece desde = 0 hasta = +
de acuerdo a la direccion indicada por la echa. De acuerdo a la denicion de
G, el cociente B/A esta determinado por la distancia hacia el origen medida
desde el punto correspondiente y es el angulo medido respecto del eje real
positivo. Con estas observaciones es posible identicar los puntos a los cuales
= 0, = + y = 1/RC (aquel en el cual el angulo formado con el eje
real positivo es 45[grados]). La razon principal por la que se introduce la
graca polar tiene que ver con el criterio de estabilidad que se presentara mas
adelante.

! =
RC
1
! = +1 ! = 0
45
Re(G)
Im(G)
Figura 6.5. Graca polar para el circuito de la gura 6.1(a).
6.1.2. Modelo matematico
Aplicando la ley de voltajes de Kirchho al circuito de la gura 6.1(a) se
encuentra:
v
i
(t) = iR +
1
C
_
t
0
i()d, v
0
(t) =
1
C
_
t
0
i()d
Aplicando la transformada de Laplace (3.2):
V
i
(s) = I(s)R +
1
sC
I(s), V
0
(s) =
1
sC
I(s)
6.1 Un circuito RC de corriente alterna 299
Combinando estas expresiones se tiene:
V
0
(s) =
a
s +a
V
i
(s), a =
1
RC
(6.3)
Sea v
i
(t) la se nal presentada en (6.1), entonces su transformada de Laplace
esta dada como:
V
i
(s) =
A
s
2
+
2
(6.4)
Por tanto, expandiendo en fracciones parciales:
V
0
(s) =
a
s +a
A
s
2
+
2
=
F
s +a
+
Cs +D
s
2
+
2
(6.5)
Las constantes C y de D se calculan del siguiente modo. Multiplicando ambos
miembros de (6.5) por el factor s
2
+
2
y evaluando en s = j:
aA
j +a
= jC +D
Multiplicando el miembro izquierdo por el factor (j+a)/(j+a) e igua-
lando partes reales e imaginarias se tiene:
D =
a
2
A

2
+a
2
, C =
aA

2
+a
2
Entonces:
Cs +D
s
2
+
2
=
aA

2
+a
2
s
s
2
+
2
+
a
2
A

2
+a
2

s
2
+
2
Usando los pares transformados:
L{cos(t)} =
s
s
2
+
2
, L{sin(t)} =

s
2
+
2
se encuentra:
L
1
_
Cs +D
s
2
+
2
_
=
aA

2
+a
2
[ cos(t) +a sin(t)]
De acuerdo a la gura 6.6 se puede escribir:
L
1
_
Cs +D
s
2
+
2
_
=
aA

2
+a
2

2
+a
2
[sin() cos(t) + cos() sin(t)]
= A
a

2
+a
2
sin(t +), = atan
_

a
_
(6.6)
Por tanto, aplicando la transformada inversa de Laplace a (6.5) se obtiene:
300 6 Dise no usando la respuesta en frecuencia

a
a 2
+
! 2
p
!
Figura 6.6. Triangulo denido por la fase .
v
0
(t) = F e
at
+A
a

2
+a
2
sin(t +)
Como a =
1
RC
> 0 entonces:
v
0
(t) Bsin(t +), B = A
a

2
+a
2
(6.7)
conforme t . Esto signica que si el voltaje de entrada v
i
(t) es una
funcion seno del tiempo entonces, en estado estacionario, el voltaje de salida
v
0
(t) tambien es una funcion seno del tiempo con la misma frecuencia pero
con amplitudes y fases diferentes.
A continuacion se muestra que los valores de B/A y obtenidos en (6.6)
y (6.7) tambien se pueden calcular a partir de la funcion de transferencia en
(6.3) usando el cambio de variable s = j. Dena:
G(s) =
a
s +a
y considere el cambio de variable s = j, entonces:
|G(j)| =

a
j +a

a
j +a
a j
a j

=
=

a(a j)

2
+a
2

=
a

2
+a
2
=
B
A
(6.8)
= G(j) = atan
_
Im(G(j))
Re(G(j))
_
= atan
_

a
_
(6.9)
En este punto es conveniente recordar que una funcion de transferencia se
dene como el cociente de la salida sobre la entrada, es decir G(s) =
a
s+a
=
V0(s)
Vi(s)
. As que no es extra no que |G(j)| este dado como el cociente de las
amplitudes de la salida y de la entrada. Por otro lado, si de manera intuitiva se
asume que G(j), V
0
(j), V
i
(j) son n umeros complejos, entonces el angulo
6.1 Un circuito RC de corriente alterna 301
de V
0
(j) debe obtenerse como la suma de los angulos de G(j) y de V
i
(j)
porque V
0
(j) = G(j)V
i
(j). Esto signica que la diferencia de angulo entre
V
i
(j) y V
0
(j) es igual al angulo de G(j).
En las guras 6.2, 6.3 y 6.5 se muestran las gracas correspondientes (lnea
interrumpida) obtenidas utilizando |G(j)| y denidas en (6.8) y (6.9).
La semejanza que se aprecia en estas guras entre las lneas continuas y las
interrumpidas son una muestra de que las relaciones obtenidas analticamente
representan satisfactoriamente la situacion experimental.
De acuerdo a (6.7), (6.8), (6.9) si v
i
(t) esta dada como en (6.1) entonces:
v
0
(t) = A|G(j)| sin(t +), = atan
_
Im(G(j))
Re(G(j))
_
(6.10)
Por otro lado, puede repetirse el procedimiento anterior para encontrar que si
v
i
(t) = Acos(t) entonces:
v
0
(t) = A|G(j)| cos(t +), = atan
_
Im(G(j))
Re(G(j))
_
(6.11)
6.1.3. Componentes de frecuencia
De acuerdo a las Series de Fourier, cualquier se nal periodica puede ser
representada como la suma de muchas se nales seno y coseno de frecuencias
diferentes. Por ejemplo, sea la funcion f(t) presentada en la gura 6.7. Su
expansion en series de Fourier esta dada como [1], pag. 457:
f(t) =
4k

_
sin(t) +
1
3
sin(3t) +
1
5
sin(5t) +
_
(6.12)
El espectro de frecuencias |F()| es una funcion de la frecuencia que indica
las frecuencias contenidas en la funcion f(t) y cual es la contribucion de cada
una de esas frecuencias a la se nal total f(t). El espectro |F()| puede ser
interpretado como la amplitud que tiene la se nal seno o coseno de frecuencia
, es decir
4k

,
4k

1
3
,
4k

1
5
,. . ., en (6.12). El espectro de frecuencias obtenido con
las series de Fourier es discreto, es decir, solo existe contribucion de frecuencias
que son m ultiplos enteros de una frecuencia fundamental. En el caso de (6.12)
la frecuencia fundamental es 1, mientras que 3, 5,. . . son sus m ultiplos enteros
a los que se hace referencia.
El uso de la transformada de Fourier permite representar cualquier funcion
no periodica como la suma de se nales seno y coseno de muchas frecuencias. En
este caso, el espectro de frecuencias es continuo, es decir, |F()| esta denido
para frecuencias que no necesitan ser m ultiplos enteros de ninguna frecuencia
fundamental. A las frecuencias que contribuyen al espectro |F()| se les conoce
como componentes de frecuencia.
El razonamiento que se presenta a continuacion es intuitivo pues un analisis
exacto esta fuera del alcance de este libro. Considere el sistema:
302 6 Dise no usando la respuesta en frecuencia
2 2 t
f t ( )
k
k
Figura 6.7. Funcion del tiempo periodica.
V
0
(s) =
a
s +a
V
i
(s) (6.13)
Suponga que v
i
(t) es la se nal escalon que se muestra en la la gura 6.8. A

i
t ( )
t
Figura 6.8. Entrada tipo escalon.
continuacion se muestra que el uso de la transformada de Fourier permite
expresar a v
i
(t) como la suma de se nales seno y coseno de muchas frecuencias.
En analisis de Fourier es com un encontrar la transformada de Fourier a partir
de las series de Fourier al suponer que la frecuencia fundamental
0
= 0
tiende a cero y que el armonico n
0
= n tiende a la frecuencia
continua . Esto signica que se puede escribir (vease, por ejemplo [2], pag.
6.1 Un circuito RC de corriente alterna 303
72):
v
i
(t) =
n=+

n=
A
n
[cos(nt) +j sin(nt)] (6.14)
donde, j =

1, el factor colocado en el extremo derecho se introduce


para asegurar la convergencia de la sumatoria, que en el lmite
0
= 0
se convierte en una integral y se convierte en una diferencial, y A
n
es en
general un n umero complejo que representa la amplitud del armonico de
frecuencia n .
De acuerdo a lo expuesto en la seccion 3.10 el sistema en (6.13) es lineal
y, por tanto, satisface el principio de superposicion, es decir si v
01
(t) es la
solucion cuando v
i1
(t) es la entrada y v
02
(t) es la solucion cuando v
i2
(t) es la
entrada entonces
1
v
01
(t) +
2
v
02
(t) es la solucion cuando
1
v
i1
(t) +
2
v
i2
(t)
es la entrada, donde
1
y
2
son constantes arbitrarias. Por tanto, se puede
usar el principio de superposicion, (6.10), (6.11), (6.14) para obtener:
v
0
(t) =
n=+

n=
A
n
|G(jn)| [cos(nt +
n
) +j sin(nt +
n
)]

n
= atan
_
Im(G(jn))
Re(G(jn))
_
(6.15)
Es decir, la contribucion de cada una de las se nales seno y coseno a la funcion
del tiempo v
0
(t) esta determinada por las componentes de frecuencia = n
de la se nal de entrada y por la amplicacion o atenuacion que el sistema
efect ua sobre cada una de esas componentes de frecuencia. Esto signica que
la salida, v
0
(t), contiene basicamente las mismas componentes de frecuencia
que, v
i
(t), pero amplicadas o atenuadas seg un lo determine el sistema, G(s).
Tambien se dice que la salida se obtiene como el ltraje de la entrada bajo el
efecto del sistema.
Componentes de frecuencias grandes
En la gura 6.9 se muestran dos se nales con forma de onda seno de diferente
frecuencia. Notese que una se nal de frecuencia mayor muestra variaciones mas
rapidas en el tiempo. Esto signica que si f(t) tiene componentes de frecuencia
mayores entonces f(t) contiene variaciones mas rapidas. Por ejemplo, sea la
funcion f(t) presentada en la gura 6.7. Su expansion en series de Fourier
esta dada como:
f(t) =
4k

_
sin(t) +
1
3
sin(3t) +
1
5
sin(5t) +
_
En la gura 6.10 se muestran varias aproximaciones de esta funcion que in-
cluyen diferentes componentes de frecuencia [1], pag. 458. Notese que mien-
tras exista mayor contenido de frecuencias grandes la funcion obtenida tiene
304 6 Dise no usando la respuesta en frecuencia
sen !
1
t ( )
sen !
2
t ( )
1
!
1
> !
2
t
Figura 6.9. Comparacion entre dos funciones seno de diferente frecuencia.
variaciones mas rapidas en el tiempo y se aproxima, poco a poco, a las dis-
continuidades abruptas que la funcion f(t) tiene en puntos especcos.
k
k
t s [ ]
Figura 6.10. Diferentes aproximaciones de la funcion f(t) presentada en la
gura 6.7. Lnea continua f1(t) =
4k

sin(t). Lnea interrumpida f2(t) =


4k

_
sin(t) +
1
3
sin(3t)
_
. Linea-punto f3(t) =
4k

_
sin(t) +
1
3
sin(3t) +
1
5
sin(5t)
_
.
6.1 Un circuito RC de corriente alterna 305
Ruido
El ruido es una se nal indeseable que vara rapidamente. Esto signica que
el ruido tiene componentes de frecuencia muy grandes.
Componentes de frecuencia cero
Una se nal de frecuencia cero es una se nal constante. Esto se puede concluir
partir de lo siguiente:
A
u
cos(t) = A
u
= constante, si = 0
Entonces, usando terminos propios de las ingenieras electrica y electronica,
una se nal f(t) que contiene una componente de frecuencia cero es una se nal
que tiene una componente de CD. Esto signica que si f(t) presenta varia-
ciones entonces estas se realizan alrededor de un valor constante diferente de
cero.
6.1.4. Relacion entre la respuesta en la frecuencia y en la
respuesta en el tiempo
De acuerdo a lo expuesto en la seccion previa se concluye lo siguiente:
Considere el sistema en (6.13). Si v
i
(t) = A es una se nal constante, es decir
de frecuencia cero = 0, entonces la salida correspondiente, en estado
estacionario, es v
0
(t) = A|G(j0)| = A (veanse (6.14) y (6.15)), porque
|G(j0)| = |G(j)|
=0
= 1 y = 0 cuando = 0 (vease (6.9)).
Es interesante darse cuenta que esto tambien se cumple, en estado estacio-
nario, cuando a un sistema de control se le aplica una entrada tipo escalon.
En la seccion 3.8 se muestra que si v
i
(t) es un escalon de altura A enton-
ces el valor nal (en estado estacionario) de la salida se calcula usando el
teorema del valor nal, es decir:
lm
t
v
0
(t) = lm
s0
sV
0
(s) = lm
s0
sG(s)
A
s
= G(0)A
donde es importante observar que que si s = +j 0 tambien se tiene
que 0.
En la siguiente seccion se explica que estos resultados tambien se pueden
generalizar al caso en que G(s) es una funcion de transferencia arbitraria de
orden n. Por tanto, se puede armar que dada una funcion de transferencia
G(s), la cantidad |G(j)|
=0
representa: i) la relacion entre la entrada y la
salida cuando la entrada es constante, o bien ii) la relacion entre la entrada
y la salida, en estado estacionario, cuando la entrada es un escalon. Notese
que en una funcion de transferencia arbitraria no se cumple, en general,
que G(0) = 1.
306 6 Dise no usando la respuesta en frecuencia
Considere el sistema en (6.13). Las componentes de alta frecuencia que
contiene la entrada v
i
(t) son fuertemente atenuadas, es decir casi no tienen
efecto sobre la salida v
0
(t), porque |G(j)| 0 conforme (vease
(6.14), (6.15) y (6.8)). De nuevo, este resultado puede extenderse al caso de
una funcion de transferencia arbitraria G(s) de orden n que cumpla que
|G(j)| 0 conforme . Esta condicion tiene dos consecuencias
importantes:
i) Suponga que v
i
(t) es un escalon. Tal como se menciona en la seccion pre-
via, las componentes de alta frecuencia son las que generan la discontinui-
dad que tiene esta funcion en t = 0. Como el efecto de estas componentes
es fuertemente atenuado, entonces la salida v
0
(t) no presentara ninguna
discontinuidad en t = 0 (vease la gura 3.1 en el captulo 3).
ii) El efecto del ruido sobre la salida es fuertemente atenuado.
La rapidez de respuesta del sistema en (6.13) se incrementa al aumentar
el parametro a > 0. Esto se concluye del siguiente modo.
Se ha mencionado que la rapidez de una se nal se incrementa al aumentar
su contenido de frecuencias mayores. Por tanto, la rapidez de respuesta del
sistema en (6.13) se puede incrementar si v
0
(t) tiene una mayor contribu-
cion de componentes de frecuencias mayores. En la gura 6.11 se muestra
que el valor de |G(j)| puede incrementarse para frecuencias mayores si
se usa un valor mas grande de a. Esto se comprueba con lo expuesto en
la seccion 3.1 del captulo 3 donde se explica que la rapidez de un sistema
con funcion de transferencia G(s) = a/(s + a) se incrementa al aumentar
el valor de a.
G j! ( ) j j
a
1
a
2
!
1
0
1= 2
p
Figura 6.11. Un valor mayor de a en el sistema
a
s+a
permite un mayor efecto de las
frecuencias intermedias y, por tanto, una mayor rapidez de respuesta en el tiempo.
Es importante subrayar que se busca incrementar la contribucion de fre-
cuencias mayores pero no aquellas que son demasiado elevadas ( )
las cuales acentuaran el efecto del ruido. Con el n de resaltar esta ca-
6.2 Sistemas arbitrarios de orden n 307
racterstica, se usa el termino frecuencias intermedias para referirse a
aquellas frecuencias que se utilizan para mejorar la rapidez de respuesta.
Esta idea puede extenderse al caso de una funcion de transferencia arbi-
traria G(s) de orden n, indicando que su rapidez de respuesta es mayor
conforme sus polos se colocan mas lejos del origen.
6.2. Sistemas arbitrarios de orden n
Los conceptos presentados en la seccion 6.1 se han realizado considerando
la funcion de transferencia en (6.13). Esto se ha hecho con el proposito de
explicar de manera sencilla los conceptos introducidos ah. En la presente
seccion se muestra que todas las ideas expuestas en la seccion 6.1 tambien
pueden generalizarse al caso de sistemas lineales arbitrarios de orden n.
Considere la funcion de transferencia arbitraria de orden n:
Y (s)
U(s)
= G(s) =
E(s)
N(s)
(6.16)
N(s) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
E(s) = b
0
+b
1
s + +b
m
s
m
donde n m y u(t) = Asin(t), por lo que U(s) = A

s
2
+
2
. Sustituyendo
U(s) en (6.16) y usando expansion en fracciones parciales:
Y (s) = G(s)A

s
2
+
2
= Y
n
(s) +
Cs +D
s
2
+
2
(6.17)
donde Y
n
(s) = L{y
n
(t)} es la respuesta natural la cual, de acuerdo al captulo
3, satisface lm
t
y
n
(t) = 0 si G(s) es estable. Con el n de facilitar la
exposicion se supone que G(s) no tiene polos en s = j. Multiplicando
ambos miembros de (6.17) por el factor s
2
+
2
y evaluando en s = j se
encuentra:
AG(j) = jC +D
Igualando partes reales e imaginarias se obtiene:
C = AIm(G(j)), D = ARe(G(j))
donde G(j) = Re(G(j)) +jIm(G(j)). Por tanto:
Cs +D
s
2
+
2
= AIm(G(j))
s
s
2
+
2
+ARe(G(j))

s
2
+
2
Usando los pares transformados:
L{cos(t)} =
s
s
2
+
2
, L{sin(t)} =

s
2
+
2
308 6 Dise no usando la respuesta en frecuencia
se obtiene:
L
1
_
Cs +D
s
2
+
2
_
= A[Im(G(j)) cos(t) + Re(G(j)) sin(t)]
Usando la gura 6.12 se encuentra que:
L
1
_
Cs +D
s
2
+
2
_
= A|G(j)| [sin() cos(t) + cos() sin(t)] (6.18)
= B sin(t +), B = A|G(j)|,
= atan
_
Im(G(j))
Re(G(j))
_
,
|G(j)| =
_
Re
2
(G(j)) + Im
2
(G(j))
Entonces, de acuerdo a (6.17) se encuentra que:

R
e
2
G
j
!
(
)
(
)
p
+
I
m
2
G
j
!
(
)
(
)
Im G j! ( ) ( )
Re G j! ( ) ( )
Figura 6.12. Triangulo denido por la fase .
y(t) A|G(j)| sin(t +)
conforme t si G(s) es estable. Por tanto, si la entrada u(t) de un sistema
lineal G(s) de orden n es una funcion seno, entonces la salida y(t) tambien
es, en estado estacionario, una funcion seno de la misma frecuencia pero con
una amplitud y una fase que son, en general, diferentes a la amplitud y a la
fase de la entrada. La relacion entre la amplitud de la entrada y la amplitud
de la salida a la frecuencia se puede calcular como:
B
A
= |G(j)|
y se conoce como magnitud de la funcion de transferencia mientras que la
diferencia de fase entre la entrada y la salida esta dada por en (6.18) y se
conoce como fase de la funcion de transferencia. Este resultado es identico al
6.3 Gracas polares y de Bode 309
encontrado en la seccion 6.1. Por tanto, todas las armaciones realizadas para
G(s) en esa seccion son validas cuando G(s) es una funcion de transferencia
arbitraria de orden n. Entonces, se esta en posicion de armar lo siguiente:
Por respuesta en frecuencia debemos entender, la descripcion de:
Como vara el cociente de la amplitud de la se nal de salida entre la am-
plitud de la se nal de entrada cuando se vara la frecuencia de la se nal de
entrada.
Como vara el defasaje entre la se nal de entrada y la se nal de salida cuando
se vara la frecuencia de la se nal de entrada
Estas dos cractersticas son muy importantes, pues permiten determinar de
manera exacta la manera en que responde un sistema de control: respues-
ta transitoria (rapidez y oscilaciones) y respuesta en estado estacionario.
Ademas, tal como se muestra en las secciones subsecuentes, tambien se pue-
den establecer metodos que permiten determinar la estabilidad de un sistema
en lazo cerrado. En este sentido es importante mencionar que todas las ideas
expuestas en las secciones 6.1 y 6.2 tambien pueden ser extendidas a funciones
de transferencia inestables: solo hay que recordar que, aunque en tal caso la
respuesta natural no desaparece al crecer el tiempo, la respuesta forzada es
una sinusoide si la entrada tambien lo es.
6.3. Gracas polares y de Bode
Un concepto importante en gracas de Bode es el denominado decada
cuya abreviacion es dec. En gracas de Bode es de mucho interes analizar
la frecuencia por decadas. Una decada representa un incremento de diez
veces en el valor de la frecuencia. Por ejemplo si
1
= 2.5 y
2
= 25 entonces
se dice que hay una decada entre
1
y
2
.
La funcion de transferencia arbitraria de orden n denida en (6.16) se
puede escribir como:
G(s) =
b
m

j=m
j=1
(s z
j
)

i=n
i=1
(s p
i
)
(6.19)
donde z
j
, j = 1, . . . , m, son los ceros de G(s) y p
i
, i = 1, . . . , n, son los polos de
G(s). Dado que los polos y los ceros pueden ser reales o complejos conjugados
entonces las gracas polares y de Bode de G(s) siempre pueden construirse
a partir del conocimiento de las gracas polares y de Bode de los siguientes
factores fundamentales de primero y segundo orden:
s,
1
s
,
s +a
a
,
a
s +a
, (6.20)
s
2
+ 2
n
s +
2
n

2
n
,

2
n
s
2
+ 2
n
s +
2
n
310 6 Dise no usando la respuesta en frecuencia
por esta razon, en las guras 6.13, 6.14, 6.15 y 6.16 se presentan las gracas
de Bode y polares de estos factores.
Recuerdese que las gracas de Bode de magnitud son curvas que represen-
tan la cantidad:
20 log (|G(j)|)
como funcion de la frecuencia . Las gracas de Bode de fase son curvas que
representan la cantidad:
= atan
_
Im(G(j))
Re(G(j))
_
como funcion de la frecuencia . Por otro lado, cada punto de las gracas
polares representa la cantidad:
G(j) = Re(G(j)) +jIm(G(j)) = |G(j)|
Las echas que aparecen en las gracas polares siempre apuntan en el sentido
en el que la frecuencia crece, es decir, desde = pasando por = 0
hasta = +. El lector puede recurrir a [3], [4] si desea conocer el metodo
detallado que se utiliza normalmente para obtener las gracas mostradas en
las guras 6.13, 6.14, 6.15 y 6.16.
Las lneas gruesas en las gracas de Bode de las guras 6.13 y 6.14 se
conocen como asntotas, mientras que las lneas nas representan el valor
exacto de las funciones representadas. Las asntotas solo son aproximaciones
que, sin embargo, son de mucha utilidad para reconocer la forma fundamen-
tal de las gracas de Bode correspondientes. Notese que en algunas de las
gracas de Bode de magnitud las asntotas forman una esquina. La frecuen-
cia a la cual ocurre dicha esquina se conoce como frecuencia de esquina y
esta directamente relacionada con el cero o el polo del factor de primero o
segundo orden que se representa. Recuerdese que, de acuerdo a la seccion 3.3,

n
es la distancia medida desde la raz correspondiente (polo o cero) hasta
el origen y que las races de un factor de segundo orden estan dadas como
s =
n
j
n
_
1
2
.
De acuerdo a lo que describen las asntotas, para frecuencias menores a la
frecuencia de esquina la magnitud de todos los factores en (6.20) (a excepcion
de s y 1/s) es de 0[dB], pero para frecuencias mayores que la frecuencia de
esquina la magnitud crece (ceros) o disminuye (polos) con una rapidez de
20[dB/dec] para los factores de primer orden y de 40[dB/dec] para los
factores de segundo orden. Notese que en el caso de los factores de segundo
orden, el comportamiento de la curva exacta cerca de la frecuencia de esquina
depende fuertemente del factor de amortiguamiento . De hecho, si < 0.7071,
alrededor de la frecuencia de esquina existe un maximo de magnitud cuyo valor
crece hacia el innito conforme tiende a cero. Este maximo de magnitud se
conoce como pico de resonancia y su valor se representa por M
r
.
6.3 Gracas polares y de Bode 311
1 10 0:1
! rad=s [ ]
G(j!) j j
dB [ ]
G(j!)
grados [ ]
pendiente :
20 dB=dec
(a) G(s) =
1
s
pendiente :
+ 20 dB=dec
G(j!) j j
dB [ ]
G(j!)
grados [ ]
! rad=s [ ]
1 10 0:1
(b) G(s) = s
G(j!) j j
dB [ ]
G(j!)
grados [ ]
! rad=s [ ]
a 10a 100a 0:1a 0:01a
pendiente :
20 dB=dec
45
(c) G(s) =
a
s+a
Figura 6.13. Gracas de Bode de los factores de primero y segundo orden en (6.20).
312 6 Dise no usando la respuesta en frecuencia
G(j!) j j
dB [ ]
G(j!)
grados [ ]
! rad=s [ ]
+ 20 dB=dec
pendiente :
a 10a 100a 0:1a 0:01a
+ 45
(a) G(s) =
s+a
a
G(j!) j j
dB [ ]
G(j!)
grados [ ]
! rad=s [ ]
pendiente :
40 dB=dec
!n 10!n 0:1!n

90
= 0:1
= 0:1
0:3
0:3 0:5
0:7
0:7
0:9
0:9
2
2
(b) G(s) =

2
n
s
2
+2ns+
2
n
G(j!) j j
dB [ ]
G(j!)
grados [ ]
! rad=s [ ]
pendiente :
+ 40dB=dec
!n 10!n 0:1!n

+ 90
= 0:1
0:3
0:7
0:9
2
2
0:9 0:7
0:3
= 0:1
0:5
(c) G(s) =
s
2
+2ns+
2
n

2
n
Figura 6.14. Gracas de Bode de los factores de primero y segundo orden en (6.20)
(cont.).
6.3 Gracas polares y de Bode 313
Im G(j!) ( )
Re G(j!) ( )
! ! 0
+
! ! 0

! ! +1
! ! 1
(a) G(s) =
1
s

! ! 1
! ! +1
! = 0
Im G(j!) ( )
Re G(j!) ( )
(b) G(s) = s
Im G(j!) ( )
Re G(j!) ( ) ! = 0
! ! +1
! ! 1
(c) G(s) =
a
s+a
Figura 6.15. Gracas polares de los factores de primero y segundo orden en (6.20).
314 6 Dise no usando la respuesta en frecuencia
Im G(j!) ( )
Re G(j!) ( )
! ! +1
! ! 1
! = 0

(a) G(s) =
s+a
a
Im G(j!) ( )
Re G(j!) ( ) ! = 0
! ! 1
! ! +1

= 0:1
0:3
0:5
0:7
0:9 2
(b) G(s) =

2
n
s
2
+2ns+
2
n
Figura 6.16. Gracas polares de los factores de primero y segundo orden en (6.20)
(cont.).
En cuanto a las gracas de Bode de fase se puede decir lo siguiente. Cada
factor de primer orden introduce una fase que va de cero hasta +90 grados
(ceros) o hasta 90 grados (polos). Cada factor de segundo orden introduce
una fase que va de cero hasta +180 grados (ceros) o hasta 180 grados (polos).
En todos los casos, cuando la frecuencia es igual a la frecuencia de esquina
la fase es igual a la mitad del rango correspondiente. De nuevo, en el caso de
factores de segundo orden y alrededor de la frecuencia de esquina, la curva
de fase depende fuertemente del factor de amortiguamiento : la fase cambia
mas rapidamente entre 0 y 180 grados conforme tiende a cero.
Es importante observar que si el factor en (6.20) contiene ceros, entonces
las gracas polares y de Bode correspondientes muestran que dicho factor se
comporta como un ltro pasa altas y que esto va acompa nado de un adelanto
de fase, es decir el factor contribuye con fase positiva. Esta observacion es im-
6.3 Gracas polares y de Bode 315
portante porque signica que los ceros de una funcion de transferencia tienden
a incrementar el efecto que el ruido tiene sobre un sistema de control. Esto
implica que el uso de una ganancia derivativa excesivamente grande en un con-
trolador PD o PID puede resultar en un sistema de control cuyo desempe no se
ve deteriorado. Para entender esto observese que un controlador PD introduce
un cero de lazo abierto mientras que un controlador PID introduce dos ceros
de lazo abierto. Por otro lado, tal como se menciona en la seccion 5.1.1, un
cero de lazo abierto tiende a mejorar la estabilidad de un sistema de control
en lazo cerrado. As que al dise nar un sistema de control se debe de tratar
de establecer un compromiso entre estabilidad y deterioro del desempe no por
efectos del ruido. En la seccion 6.6 se explica que el efecto estabilizante de un
cero de lazo abierto se debe al adelanto de fase que introduce en la respuesta
en frecuencia de la funcion de transferencia de lazo abierto.
Por otro lado, si el factor en (6.20) contiene polos, entonces las gracas
polares y de Bode correspondientes muestran que dicho factor se comporta
como un ltro pasa bajas y que esto va a compa nado de un atraso de fase, es
decir el factor contribuye con fase negativa. Esto signica que los polos de una
funcion de transferencia reducen el efecto del ruido. Por otro lado, tal como
se menciona en la seccion 5.1.1, un polo de lazo abierto tiende a deteriorar
la estabilidad de un sistema de control en lazo cerrado. En la seccion 6.6 se
explica que este efecto se debe al atraso de fase que un polo introduce en la
respuesta en frecuencia de la funcion de transferencia de lazo abierto.
Las gracas de respuesta en frecuencia de la funcion de transferencia arbi-
traria de orden n denida en (6.19) se obtiene mediante la combinacion de los
factores en (6.20). En el caso de las gracas de Bode este proceso de combina-
cion de factores de primero y segundo orden es muy sencillo, como se explica
a continuacion. Notese que la funcion de transferencia arbitraria de orden n,
G(s), dada en (6.19) se puede escribir como:
G(s) =
k=r

k=1
G
k
(s)
para alguna constante real y alg un n umero entero positivo r, donde G
k
(s),
para k = 1, . . . , r, tiene la forma de uno de los factores presentados en (6.20).
Entonces:
|G(j)| =

k=r

k=1
G
k
(j)

= ||
k=r

k=1
|G
k
(j)|
De acuerdo a esto, a la denicion de decibeles |G(j)|
dB
= 20 log(|G(j)|) y
a la propiedad log(xy) = log(x) +log(y) presentada en (6.2) se puede escribir:
|G(j)|
dB
= 20 log(||) +
k=r

k=1
20 log(|G
k
(j)|)
316 6 Dise no usando la respuesta en frecuencia
Esto signica que la graca de Bode de magnitud (y la graca de Bode de
fase) de una funcion de transferencia arbitraria de orden n, G(s), siempre se
puede obtener como la suma de las gracas de Bode de magnitud (y de las
gracas de Bode de fase) de todos los factores de primero y de segundo orden
de G(s)
1
. Notese, sin embargo, que esto no es cierto para las gracas polares
donde se debera realizar el producto de las magnitudes y la suma de las fases
de todos los factores de primero y segundo orden de G(s). Para simplicar este
procedimiento se recomienda obtener primero las gracas de Bode y a partir
de ellas obtener la informacion requerida para dibujar las gracas polares
correspondientes. En la siguiente seccion se presentan algunos ejemplos de
aplicacion de estas ideas.
Ejemplo 6.1 (Resonancia). Sea el sistema masa-resorte-amortiguador mos-
trado en la gura 6.17. La funci on de transferencia es en este caso igual a la
del ejemplo 3.6 del captulo 3, es decir:
X(s) = G(s)F(s), G(s) =
k
2
n
s
2
+ 2
n
s +
2
n

n
=
_
K
m
, =
b
2

mK
, k =
1
K
donde x = 0 se dene como la posici on en la cual el sistema alcanza el reposo
cuando f(t) = 0 y bajo el efecto del peso de la masa y el resorte. La disposici on
de la gura 6.17 es equivalente a la de un autom ovil que se encuentra en reposo
sobre el suelo: m representa la masa del autom ovil, K representa la rigidez
del sistema de suspensi on y b representa el efecto de los amortiguadores. La
experiencia cotidiana nos ha ense nado que, aunque es muy pesado, un auto
peque no puede ser volteado por unas pocas personas si las personas lo someten
a una fuerza como la siguiente. Se empuja el auto hacia arriba y se le suelta
para que despues de rebotar abajo se le vuelve a aplicar la misma fuerza hacia
arriba cuando el auto se encuentra moviendose hacia arriba. Aunque la fuerza
aplicada cada vez es peque na como para voltear al auto, sin embargo, despues
de aplicar esta misma acci on varias veces se consigue voltear el auto. Este es
un ejemplo claro de lo que puede conseguirse cuando se somete un autom ovil
a resonancia y a continuaci on se analiza dicha situaci on.
La fuerza que es aplicada por las personas tiene una forma peri odica que
tiene una componente fundamental con forma de onda coseno. Cuando es-
ta fuerza es positiva se empuja al auto hacia arriba, cuando es negativa se
deja caer el auto. El hecho de aplicar fuerza s olo cuando el auto se mueve
hacia arriba implica que esta componente cosenoidal tiene una frecuencia
que es igual a la frecuencia natural de oscilaci on del auto
n
. Si se supone
que no hay amortiguadores entonces b = 0, lo cual implica que = 0. De
acuerdo a la gura 6.14(b), bajo esta situaci on la salida x(t) (posici on del
1
Recuerdese que dados tres n umeros complejos z, x, y tales que z = xy, la fase de
z es igual a la suma de las fases de x y de y
6.3 Gracas polares y de Bode 317
K b
m
x
f
Figura 6.17. Suspension de un automovil.
auto) est a atrasada 90

respecto de la fuerza aplicada. Esto signica que si


f(t) = Acos(t) entonces x(t) = Bsin(t), para alguna constante B positiva,
si =
n
. Entonces, de acuerdo a la gura 6.18, se aplica una fuerza m axima
(f tiene una cresta) justo cuando el auto se est a moviendo hacia arriba (x
est a pasando de un valle a una cresta), lo cual est a en completo acuerdo con
la aplicaci on intuitiva de fuerza por parte de las personas. Adem as si =
n
y = 0 la amplitud B de la osiclaci on descrita por el auto crecer a sin lmite
a un cuando la amplitud de la fuerza de entrada A sea peque na (B = |G(
n
)|A
y |G(
n
)| ) por lo que nalmente el auto podr a ser volteado.
Ahora se presentar a una explicaci on desde el punto de vista de la fsica
que ayude a entender porque sucede esto. La energa del sistema est a dada
como la suma de la energa cinetica m as la energa potencial:
E = E
c
+E
p
,
E
c
=
1
2
m x
2
, E
p
=
1
2
Kx
2
El efecto de la gravedad no se toma en consideraci on porque se ha supuesto
que x = 0 es la posici on en la que el cuerpo alcanza el reposo cuando f = 0
bajo el efecto de la gravedad y del resorte. Conforme el tiempo transcurre la
variaci on de esta energa est a dada como:

E =

E
c
+

E
p
= m x x +Kx x
Utilizando el modelo para calcular x, es decir:
x =
b
m
x
K
m
x +
1
m
f
se obtiene que:
318 6 Dise no usando la respuesta en frecuencia
tiempo
f(t) = Acos(!
n
t)
x(t) = Bsin(!
n
t)
Figura 6.18. Fuerza aplicada y posicion resultante cuando se somete a resonancia
el cuerpo de la gura 6.17.

E = b x
2
+ xf
Considerense dos casos:
1. = 0, f = Acos(
n
t). En este caso b = 0 y de acuerdo a la gura
6.14(b), la salida x(t) est a atrasada 90

respecto de la fuerza aplicada, es


decir x(t) = B
0
sin(
n
t) y x =
n
B
0
cos(
n
t) para alguna B
0
positiva y,
entonces:

E = xf =
n
AB
0
cos
2
(
n
t)
Por lo que la energa de la masa crece sin lmite conforme el tiempo
aumenta porque, dado que cos
2
(
n
t) 0 para todo t:
E =
n
A
_
t
0
B
0
cos
2
(
n
r)dr , cuando t
Como E = E
c
+ E
p
con x(t) y x sinusoidales entonces la amplitud de
estas oscilaciones crece sin lmite tambien, tal como lo describe la gura
6.14(b).
2. > 0, f = Acos(
n
t). En este caso b > 0 y de acuerdo a la gura 6.14(b),
la salida x(t) converge (despues de que la respuesta natural se hace des-
preciable) a una funci on que est a atrasada un angulo igual a 90

respecto
de la fuerza aplicada, es decir x(t) = B
0
sin(
n
t) y x =
n
B
0
cos(
n
t)
para alguna B
0
positiva y, entonces:
6.4 Gracas de respuesta en frecuencia. Ejemplos 319

E = b x
2
+ xf = b
2
n
B
2
0
cos
2
(
n
t) +
n
AB
0
cos
2
(
n
t)
Por tanto, la energa de la masa est a dada como:
E =
_
t
0
[b
2
n
B
2
0
cos
2
(
n
r) +
n
AB
0
cos
2
(
n
r)]dr
=
_
t
0
[b
2
n
B
2
0
+
n
AB
0
] cos
2
(
n
r)dr (6.21)
Mientras la amplitud B
0
de la posici on sea peque na se cumplir a que
b
2
n
B
2
0
+
n
AB
0
> 0 y, por tanto, la energa E y la amplitud B
0
aumen-
tan. Entonces B
0
aumentar a hasta que b
2
n
B
2
0
+
n
AB
0
< 0 porque A
es constante. En ese momento, la energa deja de aumentar y se obtiene
un estado estacionario cuando b
2
n
B
2
=
n
AB, es decir, la amplitud de
la posici on B permanece constante en un valor nito dado como:
B =
A
b
n
=
A
2

mK
_
K
m
=
A
2K
=
kA
2
(6.22)
N otese que la amplitud de la posici on B crece sin lmite conforme tiende
a cero, lo cual est a en completo acuerdo con la gura 6.14(b) y al mismo
tiempo explica porque el pico de resonancia disminuye conforme aumenta
. En este sentido, observese que el termino b x
2
0 si b > 0 (es decir,
si > 0). Esto representa la energa que se disipa en forma de calor por
motivos de rozamiento (fricci on). As que la fricci on es la que evita que
la energa y, por tanto, la amplitud de las oscilaciones crezcan sin lmite.
Se puede armar que mientras m as rozamiento haya un mayor porcentaje
de la energa suministrada a la masa mediante la fuerza f se convierte
en calor y es menos la energa que se almacena en la masa y por ello la
menor amplitud de las oscilaciones.
Finalmente n otese que |G(j)|
=n
=
k
2
, lo cual est a en completo acuer-
do con (6.22). Tambien es importante recordar que el pico de resonancia
ocurre a una frecuencia ligeramente diferente a
n
cuando > 0. Sin
embargo, la magnitud de la funci on de transferencia en =
n
tambien
crece cuando se aproxima a cero.
6.4. Gracas de respuesta en frecuencia. Ejemplos
6.4.1. Ejemplo 1
Considere la siguiente funcion de transferencia:
G
d
(s) =
s +
1
T
s +
1
T
, 0 < < 1, T > 0 (6.23)
320 6 Dise no usando la respuesta en frecuencia
De acuerdo a las propiedades en (6.2) la graca de Bode de magnitud (en
dB) de G
d
(s) en (6.23) se obtiene como la suma de las gracas de Bode de
magnitud de dos factores de primer orden:
G
d
(s) =
1
T
1
T
s +
1
T
1
T
1
T
s +
1
T
(6.24)
El polo tiene una frecuencia de esquina en =
1
T
la cual es mayor que la
frecuencia de esquina del cero =
1
T
porque 0 < < 1. Este hecho determina
que G
d
(s) introduzca un adelanto de fase y que tenga las caractersticas de un
ltro pasa altas: las frecuencias bajas son atenuadas pero las frecuencias altas
no. El adelanto de fase maximo producido y la atenuacion a bajas frecuencias
dependen solamente de la constante , es decir de la separacion existente entre
las frecuencias de esquina del polo y del cero. Estas observaciones pueden
apreciarse en la gura 6.19 donde se muestran las gracas de Bode de G
d
(s)
y de los factores que la componen.
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
T
1
T
1
ii)
iii)
T
1
T
1
+ 90
iv)
iv)
Figura 6.19. Gracas de Bode para el ejemplo 1 (vease (6.24)): i) 0 <
1
T
1
T
< 1, ii)
s+
1
T
1
T
, iii)
1
T
s+
1
T
, iv) G
d
(s).
La funcion de transferencia en (6.23) es muy util para dise nar un tipo es-
pecial de controladores que reciben el nombre de compensadores de adelanto.
6.4 Gracas de respuesta en frecuencia. Ejemplos 321
Esta aplicacion, sin embargo, es facilitada si se utilizan algunas manipulacio-
nes algebraicas:
G
d
(Ts) =
Ts + 1
Ts +
1

Al hacer el cambio de variable s = j se obtiene:


G
d
(jT) =
jT + 1
jT +
1

Las gracas de Bode se pueden obtener facilmente al descomponer esta ex-


presion en los factores de primer orden que la componen:
G
d
(jT) =
jT + 1
1
1/
jT +
1

considerando que el producto T es la variable que se usa como variable


independiente, es decir en el eje horizontal de la gura 6.20. Aqu se muestran
las gracas de Bode de G
d
(s) para diferentes valores de 0 < < 1.
Por otro lado, la graca polar de G
d
(Ts) se puede obtener facilmente uti-
lizando la informacion proporcionada por las gracas de Bode en la gura
6.19. Para esto se debe recordar que la graca de Bode de magnitud esta en
dB pero la graca polar no. Se deben observar la magnitud y la fase para
las frecuencias cero e innito para dibujar en la graca polar trazos que re-
presenten los comportamientos correspondientes. Luego se dibujan trazos que
representen, aproximadamente, los comportamientos a las frecuencias inter-
medias y que satisfagan los trazos correspondientes a las frecuencias cero e
innito. Finalmente, las gracas polares para frecuencias negativas, es decir
desde = hasta = 0 son las imagenes al espejo de las gracas para
frecuencias positivas. Compare la graca polar mostrada en la gura 6.21 y
las gracas de Bode en la gura 6.19.
6.4.2. Ejemplo 2
Considere la funcion de transferencia:
G(s)H(s) =
A
x
k
s +a

s
3
(6.25)
donde las constantes A
x
, , k, a, son todas positivas. Descomponiendo esta
funcion de transferencia en los factores fundamentales que la forman se puede
escribir:
G(s)H(s) =
A
x
k
a
a
s +a
1
s
3
De acuerdo a las propiedades en (6.2), la graca de Bode de magnitud del
factor
1
s
3
es una linea recta de pendiente igual a 60[dB/dec]. En la gura
322 6 Dise no usando la respuesta en frecuencia
!T
1 10 100 1000 0:1 0:01
0:2
0:2
0:4
0:4
0:7
0:7
0:9
0:9
= 0:14
= 0:14
Figura 6.20. Gracas de Bode para G
d
(s) en (6.23).
0

! = 0

! ! +1
! ! 1
1
Im G
d
j! ( ) ( )
Re G
d
j! ( ) ( )
Figura 6.21. Graca polar de G
d
(s) en (6.23).
6.22 se presentan las gracas de Bode de G(s)H(s), as como de los factores
que la componen. Tal como se explica en el ejemplo previo, la graca polar
de la gura 6.23 se puede obtener facilmente a partir de las gracas de Bode
la gura 6.22.
6.4.3. Ejemplo 3
Siguiendo procedimientos como los descritos en los dos ejemplos previos
se pueden obtener las gracas polares y de Bode de las siguientes funciones
de transferencia:
6.4 Gracas de respuesta en frecuencia. Ejemplos 323
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
iv)
a
1
180
270
360
a
Figura 6.22. Gracas de Bode de G(s)H(s) denida en (6.25): i)
Axk
a
, ii)
1
s
3
,
iii)
a
s+a
, iv) G(s)H(s).
! = 0
+
Im G j! ( ) H j! ( ) ( )
Re G j! ( ) H j! ( ) ( )
! = 0

! ! 1
! ! + 1
Figura 6.23. Graca polar de G(s)H(s) en (6.25).
G(s)H(s) = A
x

s +b
s +c
k
s(s +a)

s
2
(6.26)
G(s)H(s) =
A
x

A

s +b
s +c
kA

s
2
+ (a +k
v
kA

)s +kA

s
2
(6.27)
324 6 Dise no usando la respuesta en frecuencia
donde A
x
, A

, , k, a, , b, c, , k
v
son constantes positivas. Las gracas
correspondientes se muestran en las guras 6.24, 6.25, 6.26 y 6.27.
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
a 1
180
270
360
a
v)
vi)
b
c
b
c
+ 90
v)
iv)
vi)
Figura 6.24. Gracas de Bode de G(s)H(s) en (6.26): i)
Ax bk
ac
, ii)
1
s
3
, iii)
a
s+a
,
iv)
c
s+c
, v)
s+b
b
, vi) G(s)H(s).
! = 0
+
Im G j! ( ) H j! ( ) ( )
Re G j! ( ) H j! ( ) ( )
! ! + 1
! ! 1
! = 0

Figura 6.25. Graca polar de G(s)H(s) en (6.26).


6.5 Criterio de estabilidad de Nyquist 325
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
1
180
270
360
v)
vi)
b
c
b
c
+ 90
v)
iv)
vi)
kA

p
kA

p
Figura 6.26. Gracas de Bode de G(s)H(s) en (6.27): i)
Ax b
A

c
, ii)
1
s
2
, iii)
kA

s
2
+(a+kvkA

)s+kA

, iv)
c
s+c
, v)
s+b
b
, vi) G(s)H(s).
! = 0
+
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
! = 0
+
! = 0

! ! 1
! ! + 1
Figura 6.27. Graca polar de G(s)H(s) en (6.27).
6.5. Criterio de estabilidad de Nyquist
En la literatura existente sobre control clasico es com un utilizar el criterio
de Routh como el metodo que sirve para determinar si un sistema tiene alguno
326 6 Dise no usando la respuesta en frecuencia
de sus polos en el semiplano derecho. De no ser as entonces todos los polos
deben estar en el semiplano izquierdo y entonces se asegura su estabilidad. El
criterio de Routh debe aplicarse al polinomio caracterstico del sistema en lazo
cerrado y se introduce como el criterio de estabilidad para sistemas de control
cuando se estudian desde el punto de vista de su respuesta en el tiempo. El
lector puede consultar el captulo 4 de la presente obra, o las referencias [3],
[4], para mayor informacion a cerca del uso del criterio de Routh.
Ahora se introduce un nuevo criterio de estabilidad para sistemas de con-
trol en lazo cerrado que esta fundamentado, sin embargo, en la respuesta en
frecuencia del mismo sistema pero en lazo abierto. Esta curiosa caracterstica
debe ser entendida correctamente pues es frecuente confundirse por completo
debido a la siguiente pregunta: Como es posible determinar la estabilidad del
sistema en lazo cerrado estudiando la respuesta en frecuencia del sistema
en lazo abierto? En esta seccion se presenta la respuesta a tal pregunta y el
criterio que resuelve este problema se conoce como el Criterio de Nyquist.
6.5.1. Recorridos cerrados alrededor de polos y ceros
Considere la siguiente funcion de transferencia:
G(s) = s a
donde a es cualquier n umero constante, real o complejo. Notese que este siste-
ma solo posee un cero en s = a. Considere una trayectoria cerrada trazada
sobre el plano s encerrando al cero en s = a y que es recorrida en sentido
horario (vease la gura 6.28). Cuando G(s) se eval ua sobre signica que
el argumento s de G(s) toma sucesivamente todos los valores de s que se
encuentran sobre . Eval uese G(s) sobre :
G(s) = l, l = |s a|, = (s a)
Notese que s a puede ser representado como un vector que inicia en a
y termina en s. Es facil observar que cada vez que el recorrido sobre se
completa una vez el angulo tiene un incremento negativo (sentido horario)
de 2 radianes. Por otro lado, como no pasa sobre s = a entonces l > 0
en todo el recorrido. Esto signica que cada que el recorrido horario es
completado una vez el vector l describe una vuelta horaria alrededor del
origen. Como G(s) = l decimos que la vuelta horaria ha sido completada
alrededor del origen del plano G(s), es decir, alrededor de G(s) = 0 (vease la
gura 6.29).
A partir de esto no es difcil ver que si G(s) solo tiene m ceros y si
encierra por completo a todos esos ceros, entonces cada vez que se completa
un recorrido horario sobre se completan m vueltas horarias alrededor del
origen del plano G(s).
Considere ahora la siguiente funcion de transferencia:
6.5 Criterio de estabilidad de Nyquist 327
a
l

Re s ( )
Im s ( )
s
Figura 6.28. Recorrido cerrado alrededor de un cero.

l
2
Im G s ( ) ( )
Re G s ( ) ( )
G s ( )
Figura 6.29. Recorrido horario alrededor del origen del plano G(s).
328 6 Dise no usando la respuesta en frecuencia
G(s) =
1
s a
donde a es cualquier n umero constante, real o complejo. Notese que este siste-
ma solo posee un polo en s = a. Considere una trayectoria cerrada trazada
sobre el plano s encerrando al polo en s = a y que es recorrida en sentido
horario (vease la gura 6.30). Eval uese G(s) sobre :
G(s) =
1
l
=
1
l
, l = |s a|, = (s a)
Notese, de nuevo, que sa puede ser representado como un vector que inicia
a
l

Re s ( )
Im s ( )
s
Figura 6.30. Recorrido cerrado alrededor de un polo.
en a y termina en s. Es facil observar que cada vez que el recorrido sobre
se completa una vez el angulo tiene un incremento positivo (sentido
antihorario) de +2 radianes. Por otro lado, como no pasa sobre s = a
entonces 1/l > 0 (y es nito) en todo el recorrido. Esto signica que cada vez
que el recorrido horario es completado una vez el vector
1
l
describe
una vuelta antihoraria alrededor del origen. Como G(s) =
1
l
decimos
que la vuelta antihoraria ha sido completada alrededor del origen del plano
G(s), es decir, alrededor de G(s) = 0 (vease la gura 6.31).
A partir de esto no es difcil ver que si G(s) solo tiene n polos y si
encierra por completo a todos esos polos, entonces cada vez que se completa
6.5 Criterio de estabilidad de Nyquist 329

1=l
+ 2
Im G s ( ) ( )
Re G s ( ) ( )
G s ( )
Figura 6.31. Recorrido antihorario alrededor del origen del plano G(s).
un recorrido horario sobre se completan n vueltas antihorarias alrededor
del origen del plano G(s).
6.5.2. Trayectoria de Nyquist
+

G(s)
H(s)
C(s) R(s)
Figura 6.32. Sistema en lazo cerrado.
Considere la funcion de transferencia del sistema en lazo cerrado de la
gura 6.32:
C(s)
R(s)
=
G(s)
1 +G(s)H(s)
330 6 Dise no usando la respuesta en frecuencia
Si se consigue probar que esta funcion de transferencia no tiene polos en el
semiplano derecho entonces la estabilidad del sistema en lazo cerrado esta ase-
gurada. La idea es investigar la existencia de tales polos usando una trayectoria
cerrada como en la seccion previa. Suponga que se usa una trayectoria cerra-
da como la mostrada en gura 6.33, la cual es recorrida en sentido horario.
Notese que esta trayectoria encierra por completo a cualquier polo o cero que
la funcion
G(s)
1+G(s)H(s)
tenga en el semiplano derecho. Esta trayectoria cerrada
se conoce como Trayectoria de Nyquist. Suponga que la funcion de transfe-
rencia
G(s)
1+G(s)H(s)
tiene p polos y z ceros en el semiplano derecho. De acuerdo
a la seccion anterior, si se recorre la trayectoria de Nyquist una vez el n ume-
ro de vueltas horarias alrededor del origen del plano
G(s)
1+G(s)H(s)
sera igual a
z p, donde un resultado negativo signica n umero de vueltas antihorarias.
Suponga que tal n umero de vueltas es igual a z, es decir, z p = z. Esto
implicara que p = 0, es decir, no habra ning un polo de lazo cerrado en el
semiplano derecho y por tanto se asegurara estabilidad del sistema en lazo
cerrado. Esta es la idea fundamental detras del criterio de Nyquist que se des-
arrolla a continuacion. Sin embargo, algunas sutilezas deben ser consideradas
antes.
r ! 1
1
+ 1
Re s ( )
Im s ( )
0
Figura 6.33. Trayectoria de Nyquist.
6.5 Criterio de estabilidad de Nyquist 331
El criterio de Nyquist fue desarrollado bajo la siguiente consigna. Dado un
sistema en lazo cerrado, la funcion de transferencia de lazo abierto G(s)H(s)
es conocida (planta y controlador) pero la funcion de transferencia de lazo
cerrado
G(s)
1+G(s)H(s)
es desconocida. Es decir, a un cuando los polos y ceros de
G(s)H(s) son conocidos, los polos de
G(s)
1+G(s)H(s)
son desconocidos. Si se cono-
cieran los polos de
G(s)
1+G(s)H(s)
el problema de estabilidad ya estara resuelto y
cualquier criterio de estabilidad estara de mas. Entonces, una de las consignas
del criterio de Nyquist es determinar la estabilidad en lazo cerrado a partir
del conocimiento de la funcion de transferencia de lazo abierto solamente.
Lo anterior signica que la funcion
G(s)
1+G(s)H(s)
no puede ser evaluada mien-
tras se hace el recorrido de la trayectoria de Nyquist como se describe en los
parrafos anteriores. Esto implica que no puede conocerse el n umero de vueltas
obtenidas al rededor del origen de
G(s)
1+G(s)H(s)
y, por tanto, dicho metodo debe
ser modicado. Esto es lo que se hace en las siguientes secciones.
6.5.3. Polos y ceros
Considere la funcion de transferencia del sistema en lazo cerrado de la
gura 6.32:
C(s)
R(s)
=
G(s)
1 +G(s)H(s)
(6.28)
Los polos del sistema en lazo cerrado son los ceros de 1 + G(s)H(s). Re-
cuerdese que los polos de lazo cerrado son los valores de s que satisfacen
1 +G(s)H(s) = 0.
Los polos de G(s)H(s) (polos de lazo abierto) tambien son los polos de
1 +G(s)H(s). Notese que si G(s)H(s) entonces 1 +G(s)H(s)
tambien.
6.5.4. Criterio de Nyquist. Caso especial
Suponga que G(s)H(s) tiene P polos en el semiplano derecho (polos de
lazo abierto inestables con parte real positiva), es decir, de acuerdo a la seccion
previa, la funcion 1+G(s)H(s) tiene P polos en el semiplano derecho. Tambien
suponga que la funcion 1 + G(s)H(s) tiene Z ceros en el semiplano derecho
(polos de lazo cerrado inestables). Suponga que, una vez que se recorre en
sentido horario la trayectoria de Nyquist, se obtienen N vueltas alrededor del
origen del plano 1 + G(s)H(s), es decir N = Z P. Si N = P < 0 es
decir, si se consiguen P vueltas antihorarias alrededor del origen del plano
1 +G(s)H(s) entonces el n umero de polos de lazo cerrado inestables es cero,
Z = 0, y se asegura la estabilidad del sistema en lazo cerrado.
Solo falta un peque no detalle para terminar de establecer el criterio de
Nyquist. El origen del plano 1+G(s)H(s) satisface la condicion 1+G(s)H(s) =
332 6 Dise no usando la respuesta en frecuencia
0 que equivale a G(s)H(s) = 1. Por tanto, el origen del plano 1 +G(s)H(s)
corresponde al punto (1, j0) del plano G(s)H(s). Esto signica que el n umero
de vueltas N alrededor del origen del plano 1+G(s)H(s) es identico al n umero
de vueltas alrededor del punto (1, j0) en el plano G(s)H(s). Esto es algo
muy conveniente porque solo se requiere conocer G(s)H(s) (en lugar de 1 +
G(s)H(s)).
Finalmente, notese que si G(s)H(s) es una funcion que tiene un n umero de
polos que es mayor o igual al n umero de ceros, entonces lm
s
G(s)H(s) =
constante. Esto signica que mientras se recorre toda la parte semicircular
de radio innito de la trayectoria de Nyquist la funcion G(s)H(s) representa
un unico punto. Entonces, la parte realmente interesante de G(s)H(s) es la
que se obtiene durante el recorrido del eje imaginario, desde j = j has-
ta j = +j. Notese que durante este recorrido G(s)H(s) se convierte en
G(j)H(j) lo que representa la graca polar del sistema en lazo abierto que
ya se ha aprendido a dibujar. Todo lo anterior permite establecer el siguiente
criterio.
Criterio de Nyquist. Caso especial en el que G(s)H(s) no tiene polos
y/o ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la gura 6.32, si la funcion de trans-
ferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho del
plano s y lm
s
G(s)H(s) = constante, entonces para que haya estabilidad
en lazo cerrado la graca polar de G(j)H(j) (al variar de a +)
debe rodear P veces en sentido antihorario al punto (1, j0).
La clave para recordar el criterio de Nyquist es expresandolo en la forma:
Z = N +P
donde P representa el n umero de polos de lazo abierto inestables, Z representa
el n umero de polos de lazo cerrado inestables y N representa el n umero de
vueltas que la graca polar G(j)H(j) realiza alrededor del punto (1, j0),
cuando vara desde hasta +. Un valor positivo de N representa
vueltas horarias y mientras que un valor negativo de N representa vueltas
antihorarias. La estabilidad en lazo cerrado se asegura cuando Z = 0, es decir
cuando N = P.
6.5.5. Criterio de Nyquist. Caso general
El truco del recorrido cerrado introducido en la seccion 6.5.1 solo es
valido si dicho recorrido contiene por completo a los polos y ceros en cuestion.
As que no es aplicable en el caso en que un polo o un cero estan sobre el
recorrido cerrado. Notese que en el caso en que la funcion de lazo abierto
G(s)H(s) tiene polos o ceros sobre el eje imaginario la trayectoria de Nyquist
contiene a dichos polos o ceros por lo que el criterio establecido en la seccion
6.5 Criterio de estabilidad de Nyquist 333
6.5.4 no es aplicable. Este problema se resuelve deniendo un nuevo recorrido
conocido como la trayectoria de Nyquist modicada que se muestra en la
gura 6.34. Esta trayectoria es identica a la trayectoria de Nyquist introducida
en la gura 6.33 y solo diere de esta en los puntos que contienen a los polos
o ceros de G(s)H(s) sobre el eje imaginario. La idea es rodear tales puntos
usando una trayectoria semicircular de radio peque no 0 que describe
un angulo que vara de 90
o
a +90
o
. La razon de introducir un radio muy
peque no es el asegurar que la trayectoria de Nyquist modicada encierre por
completo a cualquier posible polo o cero de lazo cerrado (desconocidos) que se
encuentren en el semiplano derecho cerca del eje imaginario. La forma general
del criterio de Nyquist puede establecerse del siguiente modo.
r ! 1
polos y
ceros de
G s ( ) H s ( )
Im s ( )
Re s ( )
Figura 6.34. Trayectoria de Nyquist modicada.
Criterio de Nyquist. Caso general en el que G(s)H(s) tiene polos y/o
ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la gura 6.32, si la funcion de
transferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho
del plano s, entonces para que haya estabilidad en lazo cerrado, cuando un
punto representativo s recorre la trayectoria de Nyquist modicada en sentido
horario la graca de G(s)H(s) debe rodear P veces en sentido antihorario al
334 6 Dise no usando la respuesta en frecuencia
punto (1, j0).
Es importante subrayar que en este caso tambien se requiere que G(s)H(s)
constante cuando s , es decir, que G(s)H(s) tenga un n umero de polos
mayor o igual al n umero de sus ceros. Ademas, tambien sigue aplicandose la
relacion Z = N +P con Z el n umero de polos inestables de lazo cerrado, P el
n umero de polos inestables de lazo abierto y N el n umero de vueltas alrededor
del punto (1, j0).
6.6. Margenes de estabilidad
El criterio de Nyquist es valido para sistemas cuyas funciones de trans-
ferencia son de fase mnima o de fase no mnima, es decir, se trata de un
resultado que se puede aplicar a cualquier caso. Sin embargo, lo que a conti-
nuacion se describe se hace suponiendo que el sistema tiene una funcion de
transferencia de lazo abierto de fase mnima (todos los polos y ceros tienen
parte real menor o igual que cero), pues esta consideracion simplica grande-
mente la exposicion de las ideas.
Si el sistema es de fase mnima entonces P = 0 por lo que la estabilidad de
lazo cerrado queda asegurada si N = 0, entonces el criterio de Nyquist puede
simplicarse a lo siguiente:
Considere que la frecuencia vara unicamente desde 0 hasta +. Trace
la graca polar de G(s)H(s) correspondiente a estas frecuencias. Suponga
que esta graca representa un camino que usted puede recorrer sobre el papel
desde = 0 hasta +. Si el punto (1, j0) queda a la izquierda de
dicho camino recorrido entonces el sistema en lazo cerrado es estable. Si tal
punto queda a la derecha entonces hay inestabilidad.
Ante esta descripcion salta a la vista la siguiente pregunta: Que sucede si
la graca polar obtenida pasa exactamente sobre el punto (1, j0)? En tal caso
se dice que se esta en el lmite de la estabilidad, lo que signica que hay polos
de lazo cerrado que tienen parte real cero. En base a esto se puede armar que
mientras el punto (1, j0) este mas lejos de la graca polar de G(s)H(s)|
s=j
pero siempre a su izquierda entonces el sistema en lazo cerrado sera mas
estable (mas lejos de la inestabilidad). A la lejana que guarda el sistema en
lazo cerrado respecto a la inestabilidad se le llama margen de estabilidad y
existen dos maneras de medir dicha lejana: el margen de fase y el margen de
ganancia.
Margen de fase. Es la cantidad de atraso de fase que se requiere a nadir
a la frecuencia de cruce de ganancia
1
, para llevar el sistema al bor-
de de la inestabilidad. La frecuencia de cruce de ganancia es aquella a
la cual |G(j
1
)H(j
1
)| = 1. Sea K
f
el margen de fase y la fase de
G(j
1
)H(j
1
), entonces:
K
f
= 180
o
+
6.6 Margenes de estabilidad 335
En la gura 6.35 puede observarse que un margen de fase negativo implica
inestabilidad en lazo cerrado, mientras que un margen de fase positivo im-
plica estabilidad en lazo cerrado. De acuerdo a estos razonamientos un cero
que se agregue en lazo abierto tiende a mejorar la estabilidad del sistema
en lazo cerrado porque introduce una fase positiva, es decir, incrementa o
hace positivo el valor de K
f
. Notese que, de acuerdo a las gracas en las
guras 6.13 y 6.15, el adelanto de fase debido un cero es mayor para una
frecuencia especca conforme la frecuencia de esquina es menor (la cual es
numericamente igual al valor absoluto de la ubicacion del cero). Por tanto,
el efecto estabilizante del cero de lazo abierto aumenta conforme este se
coloca mas cerca del origen (dentro del semiplano izquierdo).
Por otro lado, un polo que se agregue en lazo abierto tiende a hacer menos
estable al sistema en lazo cerrado porque introduce una fase negativa, es
decir, disminuye o hace negativo el valor de K
f
. Notese que, de acuer-
do a las gracas en las guras 6.13 y 6.15, el atraso de fase debido un
polo es mayor para una frecuencia especca conforme la frecuencia de
esquina es menor (la cual es numericamente igual al valor absoluto de la
ubicacion del polo). Por tanto, el efecto inestabilizante del polo de lazo
abierto aumenta conforme este se coloca mas cerca del origen (dentro del
semiplano izquierdo).
Margen de ganancia. Sea K
g
el margen de ganancia, entonces:
K
g
=
1
|G(j
2
)H(j
2
)|
donde
2
representa la frecuencia en la que la fase de G(j
2
)H(j
2
) es
180[grados ] (
2
tambien es conocida como frecuencia de cruce de fase).
En la gura 6.35 puede observarse que K
g
> 1 (20 log(K
g
) > 0[dB])
implica estabilidad en lazo cerrado, mientras que K
g
< 1 (20 log(K
g
) <
0[dB]) implica inestabilidad en lazo cerrado.
Es importante resaltar que los margenes de fase y de ganancia estan denidos
sobre las gracas de respuesta en frecuencia de la funci on de transferencia
de lazo abierto y, sin embargo, dan informacion sobre la estabilidad y las
caractersticas de respuesta transitoria del sistema en lazo cerrado.
336 6 Dise no usando la respuesta en frecuencia
0
fase
grados [ ]
90
!
0
dB
180
!
!
1
!
2
(a) Estabilidad en lazo cerrado.
0
fase
grados [ ]
90
!
0
dB
180
!
!
1
!
2
(b) Inestabilidad en lazo cerrado.
! = 0
+
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
! = 0
+
! ! + 1

K
g
1
(c) Estabilidad en lazo cerrado.
! = 0
+
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
! = 0
+
! ! + 1

K
g
1
(d) Inestabilidad en lazo cerrado.
Figura 6.35. Respuesta en frecuencia de G(j)H(j). Los margenes de fase y de
ganancia se determinan a partir de la respuesta en frecuencia obtenida a partir de
la funcion de transferencia de lazo abierto.
6.7. Relacion entre las caractersticas de respuesta en
la frecuencia y en el tiempo
Como se menciona en el captulo 5, la respuesta de un sistema de control
se compone de dos partes: la respuesta transitoria y la respuesta en estado es-
6.7 Relacion entre las caractersticas de respuesta en la frecuencia y en el tiempo 337
tacionario. Es importante saber como se relacionan las caractersticas de estas
respuestas en el tiempo con las caractersticas de la respuesta en frecuencia
del sistema a controlar, a n de saber que es lo que se debe modicar en estas
ultimas para poder dise nar adecuadamente las primeras. A continuacion se
describen los puntos mas sobresalientes de esta relacion.
6.7.1. Respuesta en lazo abierto
Existe una relacion muy estrecha entre las caractersticas de respuesta en
frecuencia de un sistema en lazo abierto y las caractersticas de respuesta en
el tiempo del mismo sistema en lazo abierto, como se describe a continuacion.
1. La altura del pico de resonancia M
r
esta relacionada inversamente con
el valor del amortiguamiento, : cuanto mayor es M
r
menor es (vease
la gura 6.14(b)). Recuerdese que menores amortiguamientos producen
mayores sobre pasos, M
p
( %), en la respuesta en el tiempo cuando se aplica
un escalon. Por tanto, el sobre paso es mayor (y el sistema presenta mas
oscilaciones) conforme M
r
es mayor. En terminos muy generales puede
armarse que cuando 1.0 < M
r
< 1.4 (0[dB]< M
r
< 3[dB]) entonces el
amortiguamiento esta en el rango 0.7 > > 0.4 [3] pag. 571, [4] pag. 637.
2. La magnitud de la frecuencia de esquina indica la velocidad de respuesta
del sistema [3] pag. 573, [4] pag 638. Recuerdese que en un sistema de
segundo orden la frecuencia de esquina es
n
la cual, cuando aumenta,
reduce el tiempo de subida (vease la seccion 3.3). En el caso de un sistema
de primer orden la frecuencia de esquina es igual al valor absoluto del polo
del sistema. De acuerdo a la seccion 3.1 el tiempo de respuesta (constante
de tiempo) se reduce si el valor absoluto del polo tiene un valor mayor.
En el caso general de un sistema arbitrario de orden n se dene el ancho
de banda para describir su rapidez de respuesta en el tiempo en terminos
de su respuesta en frecuencia. El ancho de banda es la frecuencia a la cual
la magnitud de la funcion de transferencia se reduce en 3[dB] respecto
de su magnitud a frecuencia cero. La rapidez de respuesta en el tiempo
del sistema es mayor conforme su ancho de banda es mayor.
3. El valor nal de la salida del sistema denido por Y (s) = G(s)U(s) ante
una entrada tipo escalon de altura A esta determinada por la respuesta
del sistema a frecuencia cero G(j)|
=0
:
lm
t
y(t) = lm
s0
sG(s)
A
s
= G(0)A = |G(j0)|A
Notese que los dos ultimos puntos estan en completo acuerdo con lo examinado
en la seccion 6.1.4.
6.7.2. Respuesta en lazo cerrado
Tambien existe una relacion entre la respuesta en frecuencia de la funcion
de lazo abierto G(s)H(s) y la respuesta en el tiempo del sistema en lazo
338 6 Dise no usando la respuesta en frecuencia
cerrado
C(s)
R(s)
. Esta relacion es muy importante para el dise no de sistemas de
control realimentados.
1. El margen de fase K
f
(medido a partir de la respuesta en frecuencia del
sistema en lazo abierto) se relaciona con el factor de amortiguamiento del
sistema en lazo cerrado de acuerdo a la siguiente tabla [3] pag. 570,[4] pag.
648:
Tabla 6.3. Relacion entre el margen de fase (lazo abierto) y el amortiguamiento de
un sistema en lazo cerrado.
K
f
[grados] 0 11 23 33 43 52 59 65 70 74 76
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Notese que para el rango 0 0.6 se cumple aproximadamente que
=
K
f
100
. Debe aclararse que estas relaciones se calculan a partir de la
respuesta de un sistema de segundo orden sin ceros. Aunque para sistemas
de orden mayor y con ceros se esperan diferencias respecto a estos valores
sin embargo es posible considerarlos como directivas para el dise no.
2. A mayor frecuencia de cruce de ganancia (medida a partir de la respuesta
en frecuencia del sistema en lazo abierto) mayor es la rapidez del sistema
en lazo cerrado [3], pag. 571. Esto puede explicarse del siguiente modo. La
frecuencia de cruce de ganancia es la frecuencia a la cual |G(j)H(j)| =
0[dB] y generalmente esta magnitud disminuye al aumentar la frecuencia.
Por tanto, una mayor frecuencia de cruce de ganancia en lazo abierto
implica un mayor ancho de banda en lazo cerrado y esto ultimo implica
una mayor rapidez de respuesta del sistema en lazo cerrado.
3. El error en estado estacionario de la respuesta en lazo cerrado se obtiene
a partir de la respuesta de la funcion de lazo abierto a frecuencia cero.
Por ejemplo, si en el sistema en lazo cerrado se tiene que R(s) = A/s
entonces:
e
ss
= lm
t
[r(t) y(t)] =
A
1 +k
p
, k
p
= G(0)H(0) = |G(j)H(j)|
=0
6.8. Ejemplos
6.8.1. Ejemplo de analisis
En esta parte se presenta un ejemplo de analisis usando la tecnica de la
respuesta en frecuencia. Este ejemplo es estudiado usando el metodo del lugar
de las races en la seccion 5.2.6.
6.8 Ejemplos 339
Analisis de estabilidad
Considere la siguiente funcion de transferencia:
G(s)H(s) =
116137 k
s
3
+ 72.54s
2
1250s 9.363 10
4
(6.29)
=
116137 k
(s 35.7377)(s + 36.5040)(s + 71.7721)
=
116137 k
(35.7377)(36.5040)(71.7721)
35.7377
(s 35.7377)
36.5040
(s + 36.5040)
71.7721
(s + 71.7721)
Para este ejemplo es importante encontrar las caractersticas de respuesta en
frecuencia de la siguiente funcion de transferencia:
G
1
(s) =
a
s a
, a > 0
Usando el cambio de variable s = j se puede obtener:
G
1
(j) =
a
j a
=
a
j a
j a
j a
=
a(j a)

2
+a
2
=
a

2
+a
2

2
+a
2
atan
_

a
_
=
a

2
+a
2
atan
_

a
_
|G
1
(j)| =
a

2
+a
2
, G
1
(j) = atan
_

a
_
De aqu se encuentra que:
si = 0 : |G
1
(j)| = 1, G
1
(j) = 180
o
si : |G
1
(j)| 0, G
1
(j) 90
o
si = a : |G
1
(j)| =
1

2
, G
1
(j) = 135
o
Usando esta informacion y los resultados de la seccion 6.3 se obtienen las
gracas de Bode mostradas en la gura 6.36. Usando estas gracas de Bode
se obtiene la graca polar de la gura 6.37. Es conveniente aclarar que tambien
es correcto decir que:
si = 0 : |G
1
(j)| = 1, G
1
(j) = +180
o
si : |G
1
(j)| 0, G
1
(j) +270
o
si = a : |G
1
(j)| =
1

2
, G
1
(j) = +225
o
340 6 Dise no usando la respuesta en frecuencia
Esto trae como consecuencia que en este caso la graca de Bode de fase
este desplazada 360

hacia arriba respecto de la graca de Bode de fase mos-


trada en la gura 6.36. Sin embargo, el lector puede vericar que la graca
polar en ambos casos es identica a la mostrada en la gura 6.37. Por esta
razon, el analisis presentado en la siguiente subseccion para estudiar el efecto
de un compensador es valido en ambos casos.
Continuando con la gura 6.37, notese que para k mayores crece la dis-
tancia al origen de cualquier punto sobre la graca polar. Por tanto, para k
peque nas se tiene que N = 0 y para k grandes se tiene N = 1. Notese que
el n umero de polos inestables de lazo abierto es P = 1. Entonces, de acuer-
do al criterio de Nyquist el n umero de polos inestables en lazo cerrado es
Z = P +N > 0. Esto signica que el sistema en lazo cerrado es inestable para
cualquier valor de k > 0. A continuacion se muestra que este problema puede
ser resuelto si se introduce convenientemente un adelanto de fase, es decir, si
se adiciona un cero a la funcion de transferencia de lazo abierto.
!
i)
ii) iii) iv)
0
dB
35:73
36:5
71:77
v)
0
fase
grados [ ]
90
!
iii) iv)
v)
ii)
180
270
35:73 36:5 71:77
Figura 6.36. Gracas de Bode de G(s)H(s) en (6.29): i)
116137 k
(35.7377)(36.5040)(71.7721)
,
ii)
35.7377
(s35.7377)
, iii)
36.5040
(s+36.5040)
, iv)
71.7721
(s+71.7721)
, v) G(s)H(s).
Considere la siguiente funcion de transferencia de lazo abierto:
6.8 Ejemplos 341

Re G(j!)H(j!) ( )
Im G(j!)H(j!) ( )
0

! = 0 ! ! +1
! ! 1 1
Figura 6.37. Graca polar de G(s)H(s) en (6.29).
G(s)H(s) = k
116137(s +b)
s
3
+ 72.54s
2
1250s 9.363 10
4
(6.30)
= k
116137(s +b)
(s 35.7377)(s + 36.5040)(s + 71.7721)
=
116137 k b
(35.7377)(36.5040)(71.7721)
35.7377
(s 35.7377)
36.5040
(s + 36.5040)
71.7721
(s + 71.7721)
s +b
b
con b una constante positiva. Si se elige b < 35.7377 entonces se obtienen
las gracas de Bode mostradas en la gura 6.38 y con ellas la graca polar
de la gura 6.39. Esto signica que si k es sucientemente grande entonces
N = 1 y como P = 1 entonces el sistema en lazo cerrado es estable porque
Z = P +N = 0.
Analisis usando gracas de Bode
En esta parte se usan las gracas de Bode para analizar las caractersticas
del sistema en lazo cerrado estudiado en la seccion 5.2.6. En la gura 6.40 se
muestran las gracas de Bode de la funcion de transferencia:
116137
s
3
+ 72.54s
2
1250s 9.363 10
4
Notese que el adelanto de fase del polo en s = 35.73, y que se muestra en
la gura 6.36, no se aprecia en la gura 6.40 debido a la presencia del polo en
s = 36.50. Observese tambien que el margen de fase
2
es negativo por lo que
2
De acuerdo a la seccion 6.6, el margen de fase y el margen de ganancia se denen
para sistemas de fase mnima y aunque el sistema aqu estudiado es de fase no
mnima (por el polo inestable en s = 35.7377), se utilizara el termino margen
de fase para indicar la comparacion de la fase del sistema respecto del valor
fundamental de 180

.
342 6 Dise no usando la respuesta en frecuencia
!
i)
ii)
iii)
iv)
0
dB
35:73 36:5 71:77
v)
b
vi)
0
fase
grados [ ]
90
!
iii)
iv)
v)
ii)
180
35:73 36:5 71:77
b
vi)
+ 90
Figura 6.38. Gracas de Bode de G(s)H(s) en (6.30): i)
116137 k b
(35.7377)(36.5040)(71.7721)
,
ii)
35.7377
(s35.7377)
, iii)
36.5040
(s+36.5040)
, iv)
71.7721
(s+71.7721)
, v) G(s)H(s), vi)
s+b
b
, b < 35.7377.

Re G(j!)H(j!) ( )
Im G(j!)H(j!) ( )
0

! = 0
1
! ! +1
! ! 1
Figura 6.39. Graca polar de G(s)H(s) en (6.30).
el sistema en lazo cerrado es inestable. Tal como se describe en la subseccion
previa, se puede conseguir estabilidad en lazo cerrado si se introduce suciente
adelanto de fase colocando en cascada un factor de la forma:
k(s +b) (6.31)
Al mismo tiempo, se puede hacer rapida la respuesta del sistema en lazo cerra-
do si se consigue una frecuencia de cruce de ganancia sucientemente grande.
Estas dos caractersticas pueden ser conseguidas si seleccionan adecuadamen-
te los valores de k y de b. Usando b =31.2463 y k =0.0396 determinados en
6.8 Ejemplos 343
Figura 6.40. Gracas de Bode del sistema sin compensar
116137
s
3
+72.54s
2
1250s9.36310
4
.
la seccion 5.2.6 se consigue lo siguiente. Para =38.5[rad/s] la magnitud y la
fase son de 5.85[dB] y 208[grados], respectivamente, en la gura 6.40. La
gura 6.41 muestra que a esta misma frecuencia la magnitud y la fase son de
5.87[dB] y 50.9[grados] para el factor en (6.31). En la gura 6.42 se muestra
que con esto se consigue que la funcion de transferencia G(s)H(s) mostrada
en (6.30) tenga una magnitud de 0[dB] y una fase de 157[grados] cuando
=38.5[rad/s]. Esto signica que el sistema en lazo cerrado tiene un margen
de fase de 23[grados]. De acuerdo a la seccion 6.7.2, si el sistema fuera de
segundo orden y sin ceros, esto correspondera a un amortiguamiento en lazo
cerrado de aproximadamente 0.2. As que, aunque el sistema estudiado es de
tercer orden y tiene un cero, es de esperarse que la respuesta del sistema en
lazo cerrado este poco amortiguada.
344 6 Dise no usando la respuesta en frecuencia
Figura 6.41. Gracas de Bode del compensador k(s + b), b =31.2463, k =0.0396.
6.8.2. Un sistema ball and beam
En esta parte se presenta un ejemplo de dise no usando la tecnica de la
respuesta en frecuencia. Este ejemplo constituye la aplicacion a un prototipo
conocido como ball and beam el cual es construido y controlado experimen-
talmente en el captulo 12.
Analisis de estabilidad
Considere el diagrama de bloques mostrado en la gura 6.43, donde A
x
, a,
, y k son constantes positivas. La funcion de transferencia de lazo abierto
esta dada como:
G(s)H(s) =
A
x
k
a
a
s +a
1
s
3
(6.32)
Esta funcion de transferencia de lazo abierto tiene tres polos en el origen, es
decir sobre el eje imaginario del plano complejo s. Por tanto, se debera utilizar
6.8 Ejemplos 345
Figura 6.42. G(s)H(s) en (6.30), b =31.2463 y k =0.0396.

+
A
x
s s+a ( )
k
s
2

X
d
(s) X(s)
Figura 6.43. Sistema en lazo cerrado. Primera propuesta.
la trayectoria de Nyquist modicada que se muestra en la gura 6.44. La
graca polar de G(s)H(s), dada en (6.32), obtenida al recorrer la trayectoria
de Nyquist modicada se muestra en la gura 6.45. A continuacion se explica
como se obtiene esta graca polar.
En la gura 6.23 se muestra la graca polar de (6.32). Para considerar el
rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modicada se
procede del siguiente modo. En primer lugar se hace el cambio de variable
s = en la funcion de transferencia (6.32) para obtener:
346 6 Dise no usando la respuesta en frecuencia
j!
j!
! = 0

! = 0
+
r ! 1
= + 90
= 90
s = "

"
Im s ( )
Re s ( )
Figura 6.44. Trayectoria de Nyquist modicada usada en la seccion 6.8.2.
G(s)H(s) =
A
x
k
+a
1

3
3
Como 0 es un valor constante muy peque no se puede considerar que
a para aproximar:
G(s)H(s) =
A
x
k
a
3
3 =
1
3
donde
1
=
Axk
a
3
+es una constante real muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0

) hasta +90 (cuando = 0


+
).
Entonces se tiene que:
G(s)H(s) =
1
3 =
_

1
+ 270, cuando = 0

1
270, cuando = 0
+
(6.33)
Esto explica la presencia de las circunferencias de radio innito que aparecen
en la gura 6.45 y que, de acuerdo a (6.33), deben ser recorridas en sentido
horario al pasar desde = 0

hasta = 0
+
.
6.8 Ejemplos 347
! = 0

! = 0
+
! ! 1
! ! + 1
r ! 1
1
+ 270
o
270
o
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
Figura 6.45. Graca polar de G(s)H(s) en (6.32) obtenida al recorrer la trayectoria
de Nyquist modicada mostrada en la gura 6.44.
Notese que P = 0 porque G(s)H(s) dada en (6.32) no tiene polos con
parte real positiva y que N = 2 porque al recorrer la trayectoria de Nyquist
modicada en el sentido mostrado, la graca polar en la gura 6.45 da dos
vueltas en sentido horario al punto (1, j0). Por tanto, la aplicacion del cri-
terio de Nyquist Z = N +P = 2 indica que existen dos polos de lazo cerrado
que estan en el semiplano complejo derecho y, por tanto, el sistema en lazo
cerrado de la gura 6.43 es inestable. Notese tambien que debido a que en la
gura 6.45 hay circunferencias de radio innito este resultado no cambia a un
cuando se redujera el valor de la ganancia:
A
x
k
a
(6.34)
reduciendo por ejemplo el valor del parametro . Esto se debe a que el valor
de
1
tiende a innito para cualquier valor nito de (6.34) porque 0 y,
por tanto, se sigue cumpliendo que P = 0, N = 2 y Z = 2.

+
A
x
s s+a ( )
k
s
2

s+c
s+
X
d
(s) X(s)
Figura 6.46. Sistema en lazo cerrado. Segunda propuesta.
348 6 Dise no usando la respuesta en frecuencia
Ahora considere el diagrama de bloques mostrado en la gura 6.46, donde
y c son constantes positivas. La motivacion para usar este diagrama de
bloques es el tratar de conseguir estabilidad en lazo cerrado mediante el uso
de un controlador PD con funcion de transferencia (s + ). Sin embargo,
en lugar de un controlador PD se propone usar una red de adelanto con
funcion de transferencia
s+
s+c
con < c pues este tipo de controlador reduce
el efecto del ruido que introduce un controlador PD. En este caso la funcion
de transferencia de lazo abierto esta dada como:
G(s)H(s) =
A
x
k
ac
s +

c
s +c
a
s +a
1
s
3
(6.35)
Esta funcion de transferencia de lazo abierto tambien tiene tres polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
debera utilizar la trayectoria de Nyquist modicada que se muestra en la gura
6.44. La graca polar de G(s)H(s), dada en (6.35), obtenida al recorrer la
trayectoria de Nyquist modicada se muestra en la gura 6.47. A continuacion
se explica como se obtiene esta graca polar.
! = 0

! = 0
+
! ! + 1
! ! 1
r ! 1
1
+ 270
o
270
o
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
Figura 6.47. Graca polar de G(s)H(s) en (6.35) obtenida al recorrer la trayectoria
de Nyquist modicada mostrada en la gura 6.44.
En la gura 6.25 se muestra la graca polar de (6.35). Para considerar el
rodeo al rededor de s = 0 que incluye la trayectoria de Nyquist modicada se
procede del siguiente modo. Primero se hace el cambio de variable s =
en la funcion de transferencia (6.35) para obtener:
G(s)H(s) = A
x
k
+
( +c)( +a)
1

3
3
6.8 Ejemplos 349
Como 0 es un valor constante muy peque no se puede considerar que
a , c y para aproximar:
G(s)H(s) =
A
x
k
ac
3
3 =
2
3
donde
2
=
Axk
ac
3
+ es una constante muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0

) hasta +90 (cuando = 0


+
).
Entonces se tiene que:
G(s)H(s) =
2
3 =
_

2
+ 270, cuando = 0

2
270, cuando = 0
+
(6.36)
Esto explica la presencia de las circunferencias de radio innito que aparecen
en la gura 6.47 y que, de acuerdo a (6.36), deben ser recorridas en sentido
horario al pasar desde = 0

hasta = 0
+
.
Notese que, de nuevo, P = 0, N = 2 y Z = N +P = 2. Por tanto, existen
dos polos de lazo cerrado que tienen parte real positiva y el sistema en lazo
cerrado es inestable. Ademas, usando argumentos similares al los usados en el
ejemplo anterior, se concluye que la inestabilidad no se puede corregir dando
valores peque nos a la siguiente ganancia:
A
x
k
ac
(6.37)
As que ni el uso de una red de adelanto es suciente para conseguir esta-
bilidad en lazo cerrado. Es momento entonces de analizar cuidadosamente lo
que esta sucediendo. Recuerdese que en la seccion 6.6 se menciono que cuando
se introduce un polo de lazo abierto (con parte real negativa) el sistema en
lazo cerrado se acerca hacia la inestabilidad. Tambien se dijo que este efec-
to inestabilizante crece conforme dicho polo se coloca mas cerca del origen.
Ahora observe que las funciones de transferencia en (6.32) y en (6.35) tienen
tres polos en el origen. Entonces es razonable preguntarse si los problemas de
inestabilidad que se han encontrado hasta ahora son debidos a que la funcion
de transferencia de lazo abierto tiene demasiados polos en el origen.
s s+a ( )
k

s+c
s+b
s
2

+
+ +

A
x
A
A

ks
Xd(s) X(s)

1 2
Figura 6.48. Sistema en lazo cerrado. Tercera propuesta.
Considere el diagrama de bloques de la gura 6.48, donde , A

, k
v
, b
y c son constantes positivas. El objetivo de los dos lazos internos alrededor
350 6 Dise no usando la respuesta en frecuencia
de la funcion de transferencia
k
s(s+a)
es sacar uno de los polos del origen re-
corriendolo hacia la izquierda. Notese tambien que la red de adelanto esta dada
como:
G
c
(s) =
s +b
s +c
, 0 < b < c (6.38)
La funcion de transferencia entre los puntos 1 y 2 de la gura 6.48 esta dada
como:
G
m
(s) =
k
s
2
+ (a +k
v
kA

)s +kA

Por tanto, la funcion de transferencia de lazo abierto es:


G(s)H(s) =
A
x
b
cA

s +b
b
c
s +c
kA

s
2
+ (a +k
v
kA

)s +kA

1
s
2
(6.39)
Notese que esta funcion de transferencia de lazo abierto tiene dos polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
debera utilizar la trayectoria de Nyquist modicada que se muestra en la gura
6.44. La graca polar de G(s)H(s), dada en (6.39), obtenida al recorrer la
trayectoria de Nyquist modicada se muestra en la gura 6.49. A continuacion
se explica como se obtiene esta graca polar.
! = 0

! = 0
+ ! ! 1
! ! + 1
r ! 1
1
! = 0
+ 1
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
180

+ 180

Figura 6.49. Graca polar de G(s)H(s) en (6.39) obtenida al recorrer la trayectoria


de Nyquist modicada mostrada en la gura 6.44.
En la gura 6.27 se muestra la graca polar de (6.39). Para considerar el
rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modicada se
6.8 Ejemplos 351
procede del siguiente modo. Primero se hace el cambio de variable s =
en la funcion de transferencia (6.39) para obtener:
G(s)H(s) = A
x

+b
+c
k

2
2 + (a +k
v
kA

) +kA

2
2 (6.40)
Como 0 es un valor constante muy peque no se puede aproximar:
G(s)H(s) =
A
x
b
cA

2
2 (6.41)
donde
3
=
Ax b
cA

2
+ es una constante muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0

) hasta +90 (cuando = 0


+
).
Entonces se tiene que:
G(s)H(s) =
3
2 =
_

3
+ 180, cuando = 0

3
180, cuando = 0
+
(6.42)
Esto explica la presencia de la circunferencia de radio innito que aparece en
la gura 6.49 y que, de acuerdo a (6.42), debe ser recorrida en sentido horario
al pasar desde = 0

hasta = 0
+
.
Notese que ahora se tiene P = 0, N = 0 y Z = N + P = 0. Por tanto,
no existe ning un polo de lazo cerrado con parte real positiva y entonces el
sistema en lazo cerrado es estable.
Dise no usando gracas de Bode
Considere los siguientes valores numericos:
k = 16.51, a = 3.04, A

= 1.43, (6.43)
A
x
= 5.64, = 5, = 4, k
v
= 0.2
Las constantes y k
v
forman parte del controlador a dise nar, por lo que se
requiere de un criterio para su seleccion. Sin embargo, este criterio depende de
aspectos practicos y solo puede denirse en base a las condiciones del prototipo
experimental que se va a controlar. En el captulo 12 se dene dicho criterio
y se explica como se pueden seleccionar y k
v
. En la gura 6.50 se muestran
las gracas de Bode de la siguiente funcion de transferencia:
A
x

A

kA

s
2
+ (a +k
v
kA

)s +kA

1
s
2
(6.44)
las cuales son obtenidas usando los valores presentados en (6.43). Puede verse
que la fase es aproximadamente igual a 208 grados cuando la magnitud es
igual a 0[dB] (cuando = 4.8[rad/s]). Esto signica que el margen de fase
es negativo y, por tanto, el sistema en lazo cerrado obtenido con (6.44) como
funcion de transferencia de lazo abierto sera inestable. Con el n de estabilizar
352 6 Dise no usando la respuesta en frecuencia
Bode Diagram
Frequency (rad/sec)
10
0
10
1
10
2
360
315
270
225
180
System: gh
Frequency (rad/sec): 4.84
Phase (deg): 208
P
h
a
s
e

(
d
e
g
)
100
50
0
50
System: gh
Frequency (rad/sec): 4.84
Magnitude (dB): 0.0804
M
a
g
n
i
t
u
d
e

(
d
B
)
Figura 6.50. Gracas de Bode de la funcion de transferencia en (6.44)
el sistema en lazo cerrado se introduce el compensador presentado en (6.38),
por lo que la funcion de transferencia en lazo abierto del sistema compensado
es la presentada en (6.39).
El compensador en (6.38) se dise na bajo el criterio de que el margen de
fase del sistema compensado sea de 20 grados. Esto representa un margen de
fase razonable y no requiere un adelanto de fase excesivo. Mas adelante se
mencionan las desventajas de introducir demasiado adelanto de fase. Eljase
= 4.8[rad/s] como la frecuencia a la cual el sistema en lazo abierto compen-
sado debe tener una magnitud de 0[dB]. Notese lo siguiente:
El sistema sin compensar tiene una fase de 208 grados y una magnitud
de 0[dB] a la frecuencia = 4.8[rad/s]. Esto puede apreciarse en la gura
6.50.
El compensador en (6.38) debe introducir, a la frecuencia = 4.8[rad/s],
un adelanto de fase de 208160=48 grados, para tener un margen de fase
de 20 grados, y una magnitud igual a 0[dB], para que la magnitud del
sistema compensado sea de 0[dB] a la frecuencia = 4.8[rad/s].
En la gura 6.51 se muestran las gracas de Bode de la funcion de transferencia
(vease la seccion 6.4.1):
6.8 Ejemplos 353
G
d
(s) =
s +
1
T
s +
1
T
, = 0.14 (6.45)
Se elige un valor de = 0.14 porque en la gura 6.51 se observa que esto
!T
!T
!T
Figura 6.51. Gracas de Bode para G
d
(s) en (6.45)
consigue que la red en (6.45) produzca un maximo adelanto de fase de apro-
ximadamente 48 grados. Esto ocurre cuando T = 2.6 lo cual introduce una
magnitud de aproximadamente 8.7[dB]. El valor de T se calcula del siguiente
modo:
T =
2.6

=
2.6
4.8
= 0.541
porque = 4.8[rad/s] es la frecuencia a la cual se debe introducir el adelanto
de fase de 48 grados. Por tanto, (6.45) toma la forma:
G
d
(s) =
s + 1.84
s + 13.2
Notese que el compensador en (6.38) se puede obtener como:
354 6 Dise no usando la respuesta en frecuencia
G
c
(s) = G
d
(s) (6.46)
si se selecciona b = 1.84 y c = 13.2. El compensador G
c
(s) debe introducir una
magnitud de 0[dB] a la frecuencia = 4.8[rad/s]. De acuerdo a (6.46), esta
cantidad esta dada como la suma en decibeles de la magnitud de la funcion
de transferencia G
d
(s) a dicha frecuencia (es decir, 8.7[dB]) y el equivalente
en decibeles de la ganancia :
8.7[dB] + 20 log() = 0[dB]
Despejando se obtiene:
= 10
8.7
20
2.6
Finalmente, se puede escribir:
G
c
(s) = 2.6
s + 1.84
s + 13.2
(6.47)
En la gura 6.52 se muestra la graca de Bode del sistema compensado (6.39)
usando el controlador (6.47). Notese que la frecuencia de cruce de ganancia
es aproximadamente = 4.8[rad/s] y que el margen de fase es de aproxima-
damente 22 grados, lo cual comprueba que se satisfacen las especicaciones
de dise no. En la gura 6.53 se muestra la respuesta al escalon del sistema en
lazo cerrado de la gura 6.48 usando (6.47) y los valores numericos en (6.43).
Notese que la respuesta es poco amortiguada debido al peque no margen de
fase. Sin embargo, este tipo de respuesta es satisfactoria en la practica para
un sistema ball and beam.
Finalmente, es conveniente aclarar los siguiente. La frecuencia de cruce
de ganancia (4.8[rad/s] en este ejemplo) determina la rapidez de respuesta
del sistema en lazo cerrado. Sin embargo, (exceptuando las aproximaciones
de segundo orden) no existe una regla exacta que permita calcular el valor
de la frecuencia de cruce de ganancia en funcion de la rapidez deseada. Lo
que se sabe es que aumentando esta frecuencia se obtienen respuestas mas
rapidas. Por otro lado, elegir una frecuencia de cruce de ganancia grande
tambien incrementa el efecto del ruido. As que es recomendable proponer una
frecuencia de cruce de ganancia, hacer el dise no con ella y al nal vericar si la
rapidez en lazo cerrado es la deseada y si el efecto del ruido no es prohibitivo. Si
la respuesta fuera muy lenta y el efecto del ruido no es importante, entonces
propongase una frecuencia de cruce de ganancia mayor y repita el proceso
hasta obtener la rapidez y el desempe no que se deseen.
En este ejemplo se ha decidido no intentar mejorar la rapidez de los resul-
tados obtenidos en la gura 6.53. Por un lado, puede observarse en esta gura
que el sistema alcanza el reposo en casi 3[s] lo cual es un tiempo muy bueno
para un sistema ball and beam en la practica. Por otro lado, de acuerdo a la
gura 6.50, si se elige una frecuencia de cruce de ganancia mayor entonces se
necesitara incrementar el adelanto de fase que debe introducir el compensador
6.8 Ejemplos 355
Bode Diagram
Frequency (rad/sec)
100
80
60
40
20
0
20
System: ghctrl
Frequency (rad/sec): 4.68
Magnitude (dB): 0.00958
M
a
g
n
i
t
u
d
e

(
d
B
)
10
0
10
1
10
2
360
315
270
225
180
135
System: ghctrl
Frequency (rad/sec): 4.68
Phase (deg): 158
P
h
a
s
e

(
d
e
g
)
Figura 6.52. Gracas de Bode del sistema ball and beam compensado.
G
c
(s) (o equivalentemente G
d
(s)). Esto implica elegir un valor de menor que
el utilizado, es decir 0.14, que dicho sea de paso ya es un valor peque no. El
problema de usar valores peque nos de es que se incrementa el efecto del
ruido en el sistema de control lo cual, como se explica en el captulo 12, es
una limitante en la practica. De hecho, el haber elegido = 4.8[rad/s] como
frecuencia de cruce de ganancia responde a la necesidad de poder conseguir
un margen de fase satisfactorio (20 grados) sin usar un valor de demasiado
peque no.
6.8.3. Control PD de posicion de un motor de CD
Considere el modelo de un motor de CD presentado en (5.12), captulo 5,
el cual se reescribe a continuacion:
(s) =
k
s(s +a)
I

(s) (6.48)
a =
b
J
> 0, k =
nk
m
J
> 0
donde (s) e I

(s) representan la posicion (salida) y la consigna de corriente


(entrada), respectivamente. Las gracas de Bode correspondientes a la funcion
356 6 Dise no usando la respuesta en frecuencia
0 0.5 1 1.5 2 2.5 3
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
Step Response
Time (sec)
A
m
p
lit
u
d
e
Figura 6.53. Respuesta del sistema en la gura 6.48 ante una referencia x
d
= 1[m].
La se nal gracada es x(t).
de transferencia:
G(s) =
k
s(s +a)
(6.49)
se muestran en la gura 6.54. Usando este resultado se obtiene la graca polar
mostrada en la gura 6.55, la cual corresponde al recorrido de la trayectoria
de Nyquist modicada mostrada en la gura 6.56. Es conveniente aclarar que
G(s) tiene un polo sencillo en s = 0 y eso da origen al semicrculo de radio
innito que aparece en la gura 6.55. Esto se consigue de manera similar a
como se procedio en la seccion 6.8.2. Es decir, se hace el cambio de variable
s = para reescribir (6.49) como:
G(s) =
k
( +a)
=
k
(a)
=
k
a

Recordando que 0 y que pasa de 90

a +90

conforme se hace el
rodeo alrededor de s = 0, mostrado en la gura 6.56, entonces se obtiene el
semicrculo de radio innito que aparece en la gura 6.55. Debido a que la fase
de G(j) tiende asintoticamente a 180

conforme +, es claro que


la graca polar mostrada en la gura 6.55 nunca rodeara al punto (1, j0)
para cualquier valor positivo de k y a. Es decir N = 0. Como G(s) no tiene
polos en el semiplano derecho, entonces P = 0. Por esta razon, si se cierra el
lazo alrededor de G(s) agregando una ganancia k
p
positiva para obtener un
6.8 Ejemplos 357
sistema de control de posicion proporcional, entonces el sistema de control en
lazo cerrado sera estable para cualquier k
p
positiva porque Z = N + P = 0.
Sin embargo, para valores mayores de k
p
, la graca polar de la gura 6.55 se
aproxima mas y mas al punto (1, j0) por lo que el margen de fase disminuye
(notese que el margen de ganancia es innito ya que el eje real negativo es
tocado solo en el origen). Como consecuencia, la respuesta es mas rapida pero
cada vez oscila mas (lo cual coincide con lo concluido en la seccion 5.2.1). Con
el n de conseguir una respuesta en el tiempo que sea rapida (usando valores
de k
p
mayores) pero sucientemente amortiguadas, a continuacion se realiza
el dise no de un controlador proporcional-derivativo (PD).
[
0
fase
grados]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
iv)
a
1
180
a
Figura 6.54. Gracas de Bode de G(s) presentada en (6.49). i)
k
a
, ii)
1
s
, iii)
a
s+a
,
iv)
k
s(s+a)
.
Considere el modelo de un motor de CD, presentado en (6.48), junto con
el siguiente controlador proporcional-derivativo:
i

= k
p
e +k
d
de
dt
, e =
d

Aplicando la transformada de Laplace se obtiene:


I

(s) = (k
p
+k
d
s)E(s), E(s) =
d
(s) (s)
El diagrama de bloques del sistema de control en lazo cerrado es se muestra
en la gura 6.57. La funcion de transferencia de lazo abierto es:
G(s)H(s) = k
d
_
s +
k
p
k
d
_
k
s(s +a)
(6.50)
En particular, el controlador se puede reescribr, sucesivamente, del siguiente
modo:
358 6 Dise no usando la respuesta en frecuencia
! = 0
+
Im G j! ( ) ( )
Re G j! ( ) ( )
! = 0

! ! 1
! ! + 1
1
Figura 6.55. Graca polar de G(s) presentada en (6.49).
j!
j!
! = 0

! = 0
+
r ! 1
= + 90
= 90
s = "

"
Im s ( )
Re s ( )
Figura 6.56. Trayectoria de Nyquist modicada para la funcion de transferencia
en (6.49).
6.8 Ejemplos 359
+

s(s+a)
k
I

(s)
(s)
d
(s)
k
d
s +
k
d
k
p

Figura 6.57. Sistema de control proporcional-derivativo de posicion.
I

(s)
E(s)
= k
d
(s +b), b =
k
p
k
d
(6.51)
= k
d
b
s +b
b
= k
d
b
_
1
b
s + 1
_
Deniendo el cambio de variable z =
1
b
s se tiene:
I

(s)
E(s)
= k
d
b(z + 1)
En la gura 6.58 se muestran las gracas de Bode del factor z +1. Notese que
el eje horizontal de estas gracas de Bode corresponde a
1
b
(vease la seccion
6.4.1). Por tanto, la funcion de transferencia de lazo abierto, dada en (6.50),
ahora se escribe como:
G(s)H(s) = k
d
b(z + 1)
k
s(s +a)
(6.52)
Considere el caso del motor de CD estudiado experimentalmente en el captulo
10. Los valores numericos de este motor son:
k = 675.4471, a = 2.8681
Usando estos datos se obtienen las gracas de Bode del factor
k
s(s+a)
, las cuales
se muestran en la gura 6.59. En estas gracas se observa que la frecuencia
de cruce de ganancia es
1
= 25.9[rad/s] y que la fase a esa frecuencia es de
174

, que corresponde a un margen de fase de +6

. Como este margen de


fase es muy peque no, la respuesta en el tiempo es muy oscilatoria cuando se
usa un controlador proporcional con k
p
= 1, lo cual se muestra en la gura
6.60. Notese que el tiempo de subida es t
r
= 0.0628[s] y el sobre paso es
M
p
= 83 %. A continuacion se dise na un controlador proporcional-derivativo
(PD) de modo que la respuesta en el tiempo, en lazo cerrado, mantenga el
mismo tiempo de subida t
r
= 0.0628[s] pero que el sobre paso sea M
p
= 20 %.
Con el n de mantener la misma rapidez de respuesta se propone mantener
la misma frecuencia de cruce de ganancia, es decir, se usara:

1
= 25.9[rad/s] (6.53)
360 6 Dise no usando la respuesta en frecuencia
Bode Diagram
Frequency (rad/sec)
10
1
10
0
10
1
0
45
90
System: gc
Frequency (rad/sec): 0.882
Phase (deg): 41.4
P
h
a
s
e

(
d
e
g
)
0
5
10
15
20
25
System: gc
Frequency (rad/sec): 0.882
Magnitude (dB): 2.5
M
a
g
n
i
t
u
d
e

(
d
B
)
Figura 6.58. Graca de Bode del factor z + 1, donde z =
1
b
s.
Por otro lado, usando el sobre paso deseado M
p
= 20 % y:
=

_
ln
2
_
Mp( %)
100
_
ln
2
_
Mp( %)
100
_
+
2
se obtiene = 0.4559. Usando interpolacion lineal en la tabla 6.3 se encuentra
que este amortiguamiento corresponde a un margen de fase de:
K
f
= +47.5

(6.54)
Como el margen de fase del motor sin compensar es de +6

, entonces se
necesita que el controlador introduzca un adelanto de fase de +47.5

=
41.5

. En la gura 6.58 se observa que esto sucede cuando


1
b
= 0.882. Por
tanto, el parametro b se obtiene forzando que esto suceda cuando =
1
=
25.9[rad/s], es decir:
b =

0.882

=25.9
= 29.3984
Por otro lado, como se desea que el sistema compensado tenga la misma
frecuencia de cruce de ganancia que el sistema sin compensar, =
1
=
6.8 Ejemplos 361
Bode Diagram
Frequency (rad/sec)
30
25
20
15
10
5
0
5
10
15
20
System: gh
Frequency (rad/sec): 25.9
Magnitude (dB): 0.00458
M
a
g
n
i
t
u
d
e

(
d
B
)
10
1
10
2
180
175
170
165
160
System: gh
Frequency (rad/sec): 25.9
Phase (deg): 174
P
h
a
s
e

(
d
e
g
)
Figura 6.59. Graca de Bode del factor
k
s(s+a)
, donde k = 675.4471 y a = 2.8681.
25.9[rad/s], es necesario que el controlador completo introduzca una magnitud
de 0[dB] cuando =
1
. Esto se consigue imponiendo lo siguiente sobre la
magnitud del controlador completo:
|k
d
b(z + 1)|
dB
= 20 log(k
d
b) +|z + 1|
dB
= 0[dB] (6.55)
donde, de acuerdo a la gura 6.58, se debe usar |z+1|
dB
= 2.5[dB]. Por tanto,
despejando k
d
y realizando los calculos correspondientes se encuentra:
k
d
=
1
b
10
2.5
20
= 0.0255
Finalmente, usando (6.51) se obtiene:
k
p
= bk
d
= 0.7499
En la gura 6.61 se muestran las gracas de Bode de la funcion de transferencia
de lazo abierto del sistema compensado (mostrada en (6.50)). En esta gura
se puede vericar que la frecuencia de cruce de ganancia es = 25.9[rad/s] y
que la fase a esa frecuencia es 132

, lo cual corresponde a un margen de fase


de +48

. Esto signica que se han conseguido las especicaciones de respuesta


362 6 Dise no usando la respuesta en frecuencia
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
System: Mc
Time (sec): 0.0628
Amplitude: 1
System: Mc
Time (sec): 0.119
Amplitude: 1.83

rad [ ]
tiempo s [ ]
Figura 6.60. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la
gura 6.57 cuando kp = 1, k
d
= 0, k = 675.4471 y a = 2.8681.
en frecuencia establecidas en (6.53) y (6.54). Por otro lado, en la gura 6.62
se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspon-
diente, cuando el valor deseado de posicion es un escalon unitario. Se puede
observar que el tiempo de subida es de 0.0612[s] y que el sobre paso es del
30 %. Aunque estos valores no son exactamente iguales a los especicados al
principio (t
r
= 0.0628[s] y M
p
= 20 %), sin embargo son relativamente cerca-
nos. Esta diferencia se atribuye al hecho de que el cero que posee la funcion
de transferencia de lazo cerrado, y que es introducido por el controlador PD,
modica un tanto la forma de la respuesta transitoria de una manera que no
se ha cuanticado de manera exacta. Si se desea cumplir exactamente con las
especicaciones de respuesta en el tiempo que se han indicado al principio,
se puede proceder a hacer un redise no. Es decir, proponga un margen de fase
un poco mayor para reducir el sobre paso. Si al conseguir el sobre paso de-
seado el sistema sigue siendo mas rapido que lo deseado, entonces proponga
una frecuencia de cruce de ganancia un poco menor para obtener un tiempo
de subida un poco mas grande. Sin embargo, en lugar de hacer esto, en la
siguiente seccion se buscara cumplir con otra especicacion para el tiempo de
subida.
6.8 Ejemplos 363
20
10
0
10
20
30
40
50
60
System: ghcomp
Frequency (rad/sec): 25.9
Magnitude (dB): 0.0325
M
a
g
n
i
t
u
d
e

(
d
B
)
10
0
10
1
10
2
150
120
90
System: ghcomp
Frequency (rad/sec): 25.8
Phase (deg): 132
P
h
a
s
e

(
d
e
g
)
Bode Diagram
Frequency (rad/sec)
Figura 6.61. Gracas de Bode de la funcion de transferencia en (6.50), cuando
k
d
= 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.
6.8.4. Redise no del control PD de posicion de un motor de CD
Considere de nuevo el control PD de posicion de un motor de CD. Es
decir, el diagrama de bloques del sistema de control en lazo cerrado es el que
se muestra en la gura 6.57 y la funcion de transferencia de lazo abierto es
la que se muestra en (6.50), expresion que se reescribe a continuacion para
facilitar la referencia:
G(s)H(s) = k
d
(s +b)
k
s(s +a)
, b =
k
p
k
d
(6.56)
En la seccion 6.8.3 se mostro que cuando los valores numericos del motor son:
k = 675.4471, a = 2.8681
y se usa solo el factor
k
s(s+a)
entonces la frecuencia de cruce de ganancia es

1
= 25.9[rad/s]. Ademas, en lazo cerrado se obtiene un tiempo de subida de
t
r
= 0.0628[s] y un sobre paso de M
p
= 83 % cuando se usa un controlador
proporcional de ganancia k
p
= 1. A continuacion se dise nara un controlador
364 6 Dise no usando la respuesta en frecuencia
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0
0.2
0.4
0.6
0.8
1
1.2
1.4
System: Mc
Time (sec): 0.0612
Amplitude: 1
System: Mc
Time (sec): 0.116
Amplitude: 1.3
tiempo s [ ]

rad [ ]
Figura 6.62. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la
gura 6.57, cuando k
d
= 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.
proporcional-derivativo para conseguir la mitad del tiempo de subida y un
sobre paso del 20 %, es decir ahora se desea:
t
r
=
0.0628
2
= 0.0314[s], M
p
= 20 % (6.57)
Como ya se ha mencionado, para reducir el tiempo de subida (aumentar la
rapidez de respuesta en el tiempo), se debe aumentar la frecuencia de cruce
de ganancia
1
. Sin embargo, no se ha denido una expresion matematica
que relacione al tiempo de subida con la frecuencia de cruce de ganancia. A
continuacion se explicara como puede seleccionar
1
a n de obtener un valor
especicado de t
r
.
Primero, considere el sistema en lazo cerrado de la gura 6.63. La funcion
de transferencia de lazo abierto es:
G(s) =
k
p
k
s(s +a)
(6.58)
mientras que la funcion de transferencia de lazo cerrado es:
(s)

d
(s)
=
G(s)
1 +G(s)
=

2
n
s
2
+ 2
n
s +
2
n
,
2
n
= k
p
k, 2
n
= a (6.59)
6.8 Ejemplos 365
I

(s) (s)
+

d
s ( )
k
p s s+a ( )
k
Figura 6.63. Control proporcional de posicion.
Las gracas de Bode de (6.58) tienen la forma presentada en la gura 6.64,
mientras que las gracas de Bode de (6.59) tienen la forma presentada en la
gura 6.14(b). De acuerdo a esta ultima gura, la funcion de transferencia
en (6.59) tiene magnitud unitaria cuando 0. Esto puede entenderse a
partir de la expresion
G(s)
1+G(s)
y la gura 6.64, observando que |G(j)| +
cuando 0. Esto signica que la funcion de transferencia de lazo cerrado

G(j)
1+G(j)

1 cuando 0.
[
0
fase
grados]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
iv)
a
1
180
a
Figura 6.64. Gracas de Bode de G(s) presentada en (6.58). i)
kpk
a
, ii)
1
s
, iii)
a
s+a
,
iv)
kpk
s(s+a)
.
Por otro lado, de acuerdo a la gura 6.14(b), la funcion de transferencia en
(6.59) tiene magnitud que tiende a cero cuando +. De nuevo, esto pue-
de entenderse a partir de la expresion
G(s)
1+G(s)
y la gura 6.64, observando que
|G(j)| 0 cuando +. Esto signica que la funcion de transferencia
de lazo cerrado

G(j)
1+G(j)

0 cuando +.
De acuerdo a estas ideas, la frecuencia de esquina que la funcion de trans-
ferencia en (6.59) presenta en =
n
(vease la gura 6.14(b)) debe ocurrir
366 6 Dise no usando la respuesta en frecuencia
aproximadamente cuando se alcanza la frecuencia de cruce de ganancia en la
gura 6.64 (cuando |G(j)| 1 y, por tanto,

G(j)
1+G(j)

empieza a decrecer de
manera importante). Esta observacion permite concluir que
n
en la gura
6.14(b) crece si
1
, medida en la gura 6.64, tambien crece.
Por otro lado, de acuerdo a:
t
r
=
1

n
_
1
2
_
arctan
_
_
1
2

__
,
d
=
n
_
1
2
,
si se desea reducir el tiempo de subida a la mitad (despreciando el efecto
debido a la variacion del amortiguamiento ) entonces debe aumentarse
n
al
doble. Esto signica, de acuerdo a la discusion anterior, que la frecuencia de
cruce de ganancia
1
debe aumentarse al doble.
Entonces, si t
r
= 0.0628[s] cuando
1
= 25.9[rad/s], debe usarse:

1
= 51.8[rad/s] (6.60)
para conseguir el tiempo de subida t
r
= 0.0314[s]. Por otro lado, en la seccion
6.8.3 se encontro que para obtener un sobre paso del 20 % se debe buscar un
margen de fase de:
K
f
= +47.5

(6.61)
En la gura 6.65 se muestran las gracas de Bode de
k
s(s+a)
cuando k =
675.4471 y a = 2.8681. Se observa que la magnitud y la fase valen 12[dB]
y 177

cuando = 51.8[rad/s]. Esto corresponde a un margen de fase de


+3

. Como el margen de fase deseado es de +47.5

entonces se necesita que


el controlador introduzca una fase positiva de 47.5

= 44.5

cuando =
51.8[rad/s]. Recuerdese que, de acuerdo a (6.52), la funcion de transferencia
de lazo abierto del sistema compensado esta dada como:
G(s)H(s) = k
d
b(z + 1)
k
s(s +a)
donde k
d
b(z +1) = k
d
s +k
p
, con b =
kp
k
d
y z =
1
b
s, es el controlador PD. En la
gura 6.66 se muestran las gracas de Bode del factor z + 1. Recuerdese que
en estas gracas el eje horizontal corresponde a
1
b
(vease la seccion 6.4.1). El
adelanto de fase requerido de +44.5

ocurre cuando
1
b
= 0.982. Como este
adelanto de fase debe ocurrir cuando la frecuencia sea igual a la frecuencia de
cruce de ganancia deseada = 51.8[rad/s] entonces:
b =

0.982

=51.8
= 52.8033
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =
51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,
6.8 Ejemplos 367
Bode Diagram
Frequency (rad/sec)
40
30
20
10
0
10
20
30
40
50
60
System: gh
Frequency (rad/sec): 51.8
Magnitude (dB): 12 M
a
g
n
i
t
u
d
e

(
d
B
)
10
0
10
1
10
2
180
150
120
90
System: gh
Frequency (rad/sec): 51.7
Phase (deg): 177
P
h
a
s
e

(
d
e
g
)
Figura 6.65. Gracas de Bode de
k
s(s+a)
cuando k = 675.4471 y a = 2.8681.
la misma magnitud, pero de signo contrario, que la magnitud introducida
(12[dB]) por el factor
k
s(s+a)
en esta frecuencia (para que la magnitud del
sistema compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia).
Esto implica que se debe exigir lo siguiente:
|k
d
b(z + 1)|
dB
= 20 log(k
d
b) +|z + 1|
dB
= 12[dB] (6.62)
donde, de acuerdo a la gura 6.66, se debe usar |z + 1|
dB
= 2.95[dB]. Por
tanto, despejando k
d
y realizando los calculos correspondientes se encuentra:
k
d
=
1
b
10
122.95
20
= 0.0537
Finalmente, usando b =
kp
k
d
se obtiene:
k
p
= bk
d
= 2.8347
En la gura 6.67 se muestran las gracas de Bode de la funcion de transferencia
de lazo abierto del sistema compensado (mostrada en (6.56)). En esta gura
se puede vericar que la frecuencia de cruce de ganancia es = 51.8[rad/s]
368 6 Dise no usando la respuesta en frecuencia
Bode Diagram
Frequency (rad/sec)
10
1
10
0
10
1
0
45
90
System: gc
Frequency (rad/sec): 0.982
Phase (deg): 44.5
P
h
a
s
e

(
d
e
g
)
0
5
10
15
20
25
System: gc
Frequency (rad/sec): 0.983
Magnitude (dB): 2.95
M
a
g
n
i
t
u
d
e

(
d
B
)
Figura 6.66. Gracas de Bode del factor z + 1.
y que la fase a esa frecuencia es 132

, lo cual corresponde a un margen


de fase de +48

. Esto signica que se han conseguido las especicaciones de


respuesta en frecuencia establecidas en (6.60) y (6.61). Por otro lado, en la
gura 6.68 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posicion es un escalon unitario.
Se puede observar que el tiempo de subida es de 0.03[s] y que el sobre paso es
del 31 %. Aunque estos valores no son exactamente iguales a los especicados
al principio (t
r
= 0.0314[s] y M
p
= 20 %), sin embargo son relativamente
cercanos. La razon de esta diferencia y la manera de corregirla ya ha sido
explicada en la seccion 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.
6.8.5. Control PID de posicion de un motor de CD
Considere el modelo de un motor de CD presentado en (5.12), captulo 5,
el cual se reescribe a continuacion para facilitar la referencia:
(s) =
k
s(s +a)
I

(s) (6.63)
6.8 Ejemplos 369
Bode Diagram
Frequency (rad/sec)
10
5
0
5
10
15
20
25
30
System: ghcomp
Frequency (rad/sec): 51.9
Magnitude (dB): 0.0529
M
a
g
n
i
t
u
d
e

(
d
B
)
10
1
10
2
180
150
120
90
System: ghcomp
Frequency (rad/sec): 51.8
Phase (deg): 132
P
h
a
s
e

(
d
e
g
)
Figura 6.67. Gracas de Bode de la funcion de transferencia en (6.56), cuando
k
d
= 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.
a =
b
J
> 0, k =
nk
m
J
> 0
donde (s) e I

(s) representan la posicion (salida) y la consigna de corriente


(entrada), respectivamente. En esta parte se dise nara el siguiente controlador
PID de posicion:
i

= k
p
e +k
d
de
dt
+k
i
_
t
0
e(r)dr, e =
d

donde
d
es la posicion deseada y las constantes k
p
, k
d
y k
i
se conocen como
las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
I

(s) = k
p
E(s) +k
d
sE(s) +k
i
E(s)
s
=
_
k
p
+k
d
s +
k
i
s
_
E(s)
= k
d
s
2
+
kp
k
d
s +
ki
k
d
s
E(s)
370 6 Dise no usando la respuesta en frecuencia
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35
0
0.2
0.4
0.6
0.8
1
1.2
1.4
System: Mc
Time (sec): 0.03
Amplitude: 1
System: Mc
Time (sec): 0.0579
Amplitude: 1.31
tiempo s [ ]

rad [ ]
Figura 6.68. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la
gura 6.57, cuando k
d
= 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.
Entonces, el sistema en lazo cerrado se representa por el diagrama de bloques
mostrado en la gura 6.69. La funcion de transferencia de lazo abierto es:
+

k
d
s
s
2
+
k
d
kp
s+
k
d
k
i
s(s+a)
k
(s)

d
(s)
Figura 6.69. Sistema en lazo cerrado del control PID de posicion de un motor de
CD.
G(s)H(s) = k
d
s
2
+
kp
k
d
s +
ki
k
d
s
k
s(s +a)
(6.64)
Deniendo:
s
2
+
k
p
k
d
s +
k
i
k
d
= (s +z
1
)(s +z
2
) = s
2
+ (z
1
+z
2
)s +z
1
z
2
6.8 Ejemplos 371
se concluye que:
k
p
k
d
= z
1
+z
2
,
k
i
k
d
= z
1
z
2
(6.65)
En la gura 6.70 se muestra un bosquejo de la graca polar de (6.64) cuando
se recorre la trayectoria de Nyquist modicada mostrada en la gura 6.56.
Notese que existen dos polos en s = 0 y se debe proceder de nuevo como en
la seccion 6.8.3 para rodear el origen en el plano s. Esta es la razon para el
crculo de radio innito en la gura 6.70. Ademas, no es difcil darse cuenta
que, para 0 < < +, la graca polar del factor
k
s
2
(s+a)
es como la mostrada
en la gura 6.55, pero girada 90

en sentido horario (en sentido antihorario


para < < 0). Por tanto, el adelanto de fase debido al factor de segundo
orden s
2
+
kp
k
d
s +
ki
k
d
debe modicar la graca polar como en la gura 6.70.
De este modo se obtiene estabilidad en lazo cerrado pues P = 0, N = 0 y
Z = N + P = 0. Para alcanzar este objetivo se propone usar el siguiente
criterio de dise no:
! = 0

! = 0
+ ! ! 1
! ! + 1
r ! 1
1
! = 0
+ 1
Re G j! ( ) H j! ( ) ( )
Im G j! ( ) H j! ( ) ( )
180

+ 180

Figura 6.70. Graca polar de (6.64) cuando se recorre la trayectoria de Nyquist


modicada mostrada en la gura 6.56.
z
1
= a (6.66)
porque esto simplica a la funcion de transferencia de lazo abierto, presentada
en (6.64), del siguiente modo:
G(s)H(s) = k
d
(s +z
2
)
k
s
2
(6.67)
372 6 Dise no usando la respuesta en frecuencia
Se debe subrayar que la cancelacion de los factores s + z
1
y s + a es valida
porque ambos corresponden a polos y ceros con parte real negativa pues a > 0
y z
1
> 0. Realizando algunos pasos algebraicos adicionales en (6.67) se obtiene:
G(s)H(s) = k
d
z
2
s +z
2
z
2
k
s
2
= k
d
z
2
_
1
z
2
s + 1
_
k
s
2
= k
d
z
2
(z + 1)
k
s
2
(6.68)
donde se ha denido z =
1
z2
s. Ahora el factor
k
s
2
representa el sistema sin
compensar y sus gracas de Bode se presentan en la gura 6.71 cuando se
usan los valores numericos del motor de CD controlado experimentalmente en
el captulo 10, es decir:
k = 675.4471
10
0
10
1
10
2
181
180.5
180
179.5
179
System: gh
Frequency (rad/sec): 51.7
Phase (deg): 180
P
h
a
s
e

(
d
e
g
)
Bode Diagram
Frequency (rad/sec)
40
30
20
10
0
10
20
30
40
50
60
System: gh
Frequency (rad/sec): 51.9
Magnitude (dB): 12 M
a
g
n
i
t
u
d
e

(
d
B
)
Figura 6.71. Gracas de Bode del factor
k
s
2
cuando k = 675.4471.
Se puede observar que la magnitud y la fase son iguales a 12[dB] y 180

cuando la frecuencia es igual a 51.8[rad/s]. De acuerdo a la seccion 6.8.4, se


propone usar la siguiente frecuencia de cruce de ganancia:

1
= 51.8[rad/s] (6.69)
6.8 Ejemplos 373
y el siguiente margen de fase:
K
f
= +47.5

(6.70)
para conseguir el tiempo de subida t
r
= 0.0314[s] y un sobre paso de 20 %.
Por tanto, el controlador denido por k
d
z
2
(z +1) debe introducir un adelanto
de fase de +47.5

y una magnitud de +12[dB] cuando la frecuencia sea igual


a 51.8[rad/s]. En la gura 6.72 se observa que el factor z + 1 introduce una
fase de +47.4

cuando
1
z2
= 1.09 (vease la seccion 6.4.1). Como esto debe
ocurrir cuando = 51.8[rad/s], entonces:
z
2
=

1.09

=51.8
= 47.5229
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =
0
5
10
15
20
25
System: gc
Frequency (rad/sec): 1.09
Magnitude (dB): 3.4
M
a
g
n
i
t
u
d
e

(
d
B
)
Bode Diagram
Frequency (rad/sec)
10
1
10
0
10
1
0
45
90
System: gc
Frequency (rad/sec): 1.09
Phase (deg): 47.4
P
h
a
s
e

(
d
e
g
)
Figura 6.72. Gracas de Bode del factor z + 1.
51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,
la misma magnitud, pero de signo contrario, que la magnitud introducida
(12[dB]) por el factor
k
s
2
en esta frecuencia (para que la magnitud del sistema
compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia). Esto
implica que se debe exigir lo siguiente:
374 6 Dise no usando la respuesta en frecuencia
|k
d
z
2
(z + 1)|
dB
= 20 log(k
d
z
2
) +|z + 1|
dB
= 12[dB] (6.71)
donde, de acuerdo a la gura 6.72, se debe usar |z+1|
dB
= 3.4[dB]. Por tanto,
despejando k
d
y realizando los calculos correspondientes se encuentra:
k
d
=
1
z
2
10
123.4
20
= 0.0566
Finalmente, usando (6.65), (6.66) y a = 2.8681 (vease el captulo 10) se ob-
tiene:
k
p
= k
d
(z
1
+z
2
) = 2.8540, k
i
= k
d
z
1
z
2
= 7.7196
En la gura 6.73 se muestran las gracas de Bode de la funcion de transferencia
de lazo abierto, del sistema compensado, mostrada en (6.64). En esta gura
se puede vericar que la frecuencia de cruce de ganancia es = 51.8[rad/s]
y que la fase a esa frecuencia es 133

, lo cual corresponde a un margen


de fase de +47

. Esto signica que se han conseguido las especicaciones de


respuesta en frecuencia establecidas en (6.69) y (6.70). Por otro lado, en la
gura 6.74 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posicion es un escalon unitario. Se
puede observar que el tiempo de subida es de 0.0291[s] y que el sobre paso es
del 33 %. Aunque estos valores no son exactamente iguales a los especicados
al principio (t
r
= 0.0314[s] y M
p
= 20 %), sin embargo son relativamente
cercanos. La razon de esta diferencia y la manera de corregirla ya ha sido
explicada en la seccion 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.
6.8 Ejemplos 375
Bode Diagram
Frequency (rad/sec)
10
5
0
5
10
15
20
25
30
System: ghcomp
Frequency (rad/sec): 51.8
Magnitude (dB): 0.0218
M
a
g
n
it
u
d
e

(
d
B
)
10
1
10
2
180
150
120
90
System: ghcomp
Frequency (rad/sec): 51.7
Phase (deg): 133
P
h
a
s
e

(
d
e
g
)
Figura 6.73. Gracas de Bode de la funcion de transferencia en (6.64), cuando
k
d
= 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35
0
0.2
0.4
0.6
0.8
1
1.2
1.4
System: Mc
Time (sec): 0.0291
Amplitude: 1
System: Mc
Time (sec): 0.0577
Amplitude: 1.33
tiempo s [ ]

rad [ ]
Figura 6.74. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la
gura 6.69, cuando k
d
= 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.
376 6 Dise no usando la respuesta en frecuencia
6.9. Caso de estudio. Control PID de un sistema de
levitacion magnetica
Considere el modelo de un sistema de levitacion magnetica presentado
en (11.31), captulo 11, el cual se reescribe a continuacion para facilitar la
referencia:
G(s) =
11613700
s
3
+ 2739s
2
1250s 3.536 10
6
El polinomio caracterstico de esta funcion de transferencia se puede factorizar
del siguiente modo s
3
+2739s
2
1250s3.53610
6
= (s+35.9)(s35.9)(s+
2739). As que este sistema es inestable en lazo abierto debido a que tiene un
polo con parte real positiva ubicado en s = 35.9. Para resolver este problema
se usara el siguiente controlador PID (vease la seccion 6.8.5):
k
d
s
2
+
kp
k
d
s +
ki
k
d
s
= k
d
(s +z
1
)(s +z
2
) = k
d
(s
2
+ (z
1
+z
2
)s +z
1
z
2
)
k
p
k
d
= z
1
+z
2
,
k
i
k
d
= z
1
z
2
(6.72)
Entonces la funcion de transferencia de lazo abierto es:
G(s)H(s) = k
d
(s +z
1
)(s +z
2
)
s
k
s
3
+ 2739s
2
1250s 3.536 10
6
(6.73)
= k
d
(s +z
1
)(s +z
2
)
s
k
(s + 35.9)(s 35.9)(s + 2739)
, k = 11613700
De esta manera, el sistema es de tipo 1 y, ante una referencia constante, el
error en estado estacionario sera igual a cero si el sistema en lazo cerrado
es estable. El controlador PID debera ser dise nado para asegurar que esta
condicion se cumple. Para esto se considerara el siguiente criterio de dise no:
z
1
= 35.9 (6.74)
De este modo se obtiene:
G(s)H(s) = k
d
(s +z
2
)
k
s(s 35.9)(s + 2739)
o bien:
G(s)H(s) = k
d
z
2
(z + 1)
k
s(s 35.9)(s + 2739)
(6.75)
donde se ha denido z =
1
z2
s. Se debe subrayar que la cancelacion de los
factores s+z
1
y s+35.9 es valida porque ambos corresponden a polos y ceros
con parte real negativa pues 35.9 > 0 y z
1
> 0. En la gura 6.75 se muestra
un bosquejo de las gracas de Bode de la funcion de transferencia:
6.9 Caso de estudio 377
!
i)
ii)
iii) iv)
0
dB
v)
0
fase
grados [ ]
90
!
iii)
iv)
v)
ii)
180
270
2739 35:9
1
35:9 2739
Figura 6.75. Gracas de Bode de (6.76). i)
k
(35.9)(2739)
, ii)
1
s
, iii)
35.9
s35.9
, iv)
2739
s+2739
,
v)
k
s(s35.9)(s+2739)
.
G
0
(s) =
k
s(s 35.9)(s + 2739)
(6.76)
donde se ha hecho uso de los resultados obtenidos en la seccion 6.8.1 para
obtener las gracas de Bode de un factor de la forma
a
sa
con a > 0. Usando
la gura 6.75 se procede a dibujar la graca polar mostrada en la gura 6.76.
Es importante subrayar que la funcion de transferencia en (6.76) tiene un
polo en el origen por lo que se debe usar la trayectoria de Nyquist modicada
mostrada en la gura 6.56. De acuerdo a esto, se debe dar un rodeo alrededor
de s = 0 del siguimiente modo. En (6.76) se debe hacer el cambio de variable
s = :
G
0
() =
k
( 35.9)( + 2739)
=
k
(35.9)(2739)
=
k
(35.9)(2739)
=
k
(35.9)(2739)
( 180
o
)
378 6 Dise no usando la respuesta en frecuencia
recordando que 0. Esto justica el semicrculo de radio innito que
! = 0

! = 0
+
! ! + 1
! ! 1
r ! 1
1
270
o
Re j! ( ) ( )
Im j! ( ) ( )
90
o
G
0
G
0
Figura 6.76. Graca polar de (6.76) cuando se recorre la trayectoria de Nyquist
modicada mostrada en la gura 6.56.
pasa de 90

cuando = 0

a 270

cuando = 0
+
(vease la gura 6.56).
En la gura 6.76 es claro que N = 1 y como P = 1 (vease (6.76) entonces
Z = N+P = 2, por lo que habra inestabilidad en lazo cerrado. Por esta razon,
para conseguir estabilidad en lazo cerrado usando la funcion de transferencia
de lazo abierto (6.75) (con un controlador PID), el factor k
d
z
2
(z + 1) debe
introducir un adelanto de fase suciente como para que se obtenga una graca
polar como se muestra en la gura 6.77. De este modo N = 1 y como P = 1
entonces Z = N + P = 0 y el sistema en lazo cerrado sera estable. En la
gura 6.78 se muestran las gracas de bode de (6.76). Se puede observar que
la magnitud y la fase son iguales a 0[dB] y 212

cuando la frecuencia es igual


a 60[rad/s]. Se propone mantener la misma frecuencia de cruce de ganancia:

1
= 60[rad/s] (6.77)
y conseguir el siguiente margen de fase
3
:
K
f
= +20

(6.78)
3
Aunque el margen de fase fue presentado en la seccion 6.6 para sistemas de fase
mnima, este concepto es aplicable de manera directa en este ejemplo
6.9 Caso de estudio 379
! = 0

! = 0
+
! ! + 1
! ! 1
r ! 1
1
270
o
90
o
Im(G(j!)H(j!))
Re(G(j!)H(j!))
Figura 6.77. Graca polar de (6.75) cuando se recorre la trayectoria de Nyquist
modicada mostrada en la gura 6.56.
10
0
10
1
10
2
10
3
10
4
10
5
270
225
180
System: gh
Frequency (rad/sec): 60.1
Phase (deg): 212
P
h
a
s
e

(
d
e
g
)
Bode Diagram
Frequency (rad/sec)
200
150
100
50
0
50
System: gh
Frequency (rad/sec): 60
Magnitude (dB): 0.0673
M
a
g
n
it
u
d
e

(
d
B
)
Figura 6.78. Gracas de Bode de (6.76).
Ya que la planta a controlar es naturalmente inestable, la idea es simplemente
asegurar estabilidad en lazo cerrado sin preocuparse por ninguna otra espe-
cicacion como podran ser el tiempo de subida y el sobrepaso. Por tanto,
380 6 Dise no usando la respuesta en frecuencia
el controlador denido por k
d
z
2
(z + 1) debe introducir un adelanto de fase
de +52

y una magnitud de 0[dB] cuando la frecuencia sea igual a 60[rad/s].


En la gura 6.79 se observa que el factor z + 1 introduce una fase de +52

cuando
1
z2
= 1.28 (vease la seccion 6.4.1). Como esto debe ocurrir cuando
= 60[rad/s], entonces:
z
2
=

1.28

=60
= 46.875
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =
Bode Diagram
Frequency (rad/sec)
10
2
10
1
10
0
10
1
10
2
0
45
90
System: Adel
Frequency (rad/sec): 1.28
Phase (deg): 52 P
h
a
s
e

(
d
e
g
)
0
5
10
15
20
25
30
35
40
System: Adel
Frequency (rad/sec): 1.28
Magnitude (dB): 4.24
M
a
g
n
it
u
d
e

(
d
B
)
Figura 6.79. Gracas de Bode del factor z + 1.
60[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia, una
magnitud de 0[dB] para que la magnitud del sistema compensado sea de 0[dB]
a la frecuencia de cruce de ganancia. Esto implica que se debe exigir lo siguien-
te:
|k
d
z
2
(z + 1)|
dB
= 20 log(k
d
z
2
) +|z + 1|
dB
= 0[dB] (6.79)
donde, de acuerdo a la gura 6.79, se debe usar |z + 1|
dB
= 4.24[dB]. Por
tanto, despejando k
d
y realizando los calculos correspondientes se encuentra:
k
d
=
1
z
2
10
4.24
20
= 0.0131
Finalmente, usando (6.72) y (6.74) se obtiene:
6.9 Caso de estudio 381
k
p
= k
d
(z
1
+z
2
) = 1.0838, k
i
= k
d
z
1
z
2
= 22.0341
En la gura 6.80 se muestran las gracas de Bode de la funcion de transferencia
de lazo abierto del sistema compensado (dada en (6.73), es decir, G(s)H(s) =
_
k
p
+k
d
s +
ki
s
_

k
s
3
+2739s
2
1250s3.53610
6
). En esta gura se puede vericar
que la frecuencia de cruce de ganancia es = 60[rad/s] y que la fase a esa
frecuencia es 160

, lo cual corresponde a un margen de fase de +20

. Esto
signica que se han conseguido las especicaciones de respuesta en frecuencia
establecidas en (6.77) y (6.78). Finalmente, en la gura 6.81 se muestra la
respuesta en el tiempo, ante un escalon unitario, cuando se cierra el lazo
alrededor de G(s)H(s) =
_
k
p
+k
d
s +
ki
s
_
k
s
3
+2739s
2
1250s3.53610
6
. Se puede
observar que el tiempo de subida es de 0.0166[s] y que el sobre paso es del 89 %.
Como se dijo anteriormente, no se ha procurado hacer nada por conseguir
un tiempo de subida y un sobre paso especcos y solo se busca asegurar
la estabilidad en lazo cerrado. Por esta razon, la respuesta en el tiempo de
la gura 6.81 se considera satisfactoria. Se deja como ejercicio al lector el
conseguir un dise no con el cual se consiga una respuesta mas amortiguada.
Para esto, debe especicar un margen de fase mayor.
Bode Diagram
Frequency (rad/sec)
100
50
0
50
System: gh
Frequency (rad/sec): 60
Magnitude (dB): 0.0784
M
a
g
n
it
u
d
e

(
d
B
)
10
0
10
1
10
2
10
3
10
4
10
5
270
225
180
135
90
System: gh
Frequency (rad/sec): 60
Phase (deg): 160
P
h
a
s
e

(
d
e
g
)
Figura 6.80. Gracas de Bode de la funcion de transferencia en (6.73), es de-
cir, G(s)H(s) =
_
kp + k
d
s +
k
i
s
_
k
s
3
+2739s
2
1250s3.53610
6
con k
d
= 0.0131, kp =
1.0838, ki = 22.0341.
382 6 Dise no usando la respuesta en frecuencia
Step Response
Time (sec)
A
m
p
lit
u
d
e
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
System: M
Time (sec): 0.0166
Amplitude: 1
System: M
Time (sec): 0.0449
Amplitude: 1.89
Figura 6.81. Respuesta en el tiempo, ante un escalon unitario, cuando se cierra el
lazo alrededor de G(s)H(s) =
_
kp + k
d
s +
k
i
s
_
k
s
3
+2739s
2
1250s3.53610
6
con k
d
=
0.0131, kp = 1.0838, ki = 22.0341.
6.10. Resumen del captulo
Un resultado fundamental del estudio de las ecuaciones diferenciales li-
neales es el siguiente. Dada una ecuacion diferencial lineal totalmente arbi-
traria, si se aplica a la entrada una funcion sinusoidal del tiempo entonces la
respuesta forzada a la salida es otra funcion sinusoidal del tiempo. Estas fun-
ciones sinusoidales dieren en sus amplitudes y sus fases pero son de la misma
frecuencia. Las relaciones entre las amplitudes y las fases de estas funciones
dependen de su frecuencia y la forma en que varan se conoce como respuesta
en frecuencia.
La propiedad fundamental de la respuesta en frecuencia que la teora de
control explota es el hecho de que la manera en que varan las relaciones entre
amplitudes y fases de las funciones a la entrada y a la salida depende de la ubi-
cacion de los polos y los ceros de la funcion de transferencia correspondiente.
En sistemas de lazo abierto, esto permite interpretar a las ecuaciones diferen-
ciales lineales, y a los sistemas de control lineales, como ltros. Esto signica
que la rapidez y las oscilaciones presentes en la respuesta de un sistema de
control dependen del contenido de componentes de frecuencia de la entrada
y de que componentes de frecuencia deja pasar el sistema de control: i) las
componentes de frecuencia altas favorecen una respuesta rapida, ii) si una
banda de frecuencias es favorecida (pico de resonancia) entonces la respuesta
6.11 Preguntas de repaso 383
es oscilatoria, iii) del tratamiento que se de a las componentes de frecuencias
bajas (cero) depende el valor de la salida en estado estacionario, iv) el efecto
del ruido se reduce si las componentes de muy alta frecuencia son fuertemente
atenuadas.
Un logro importante del estudio de los sistemas de control bajo el en-
foque de la respuesta en frecuencia es el poder relacionar las caractersticas
de respuesta en frecuencia en lazo abierto (frecuencia de cruce de ganancia
y margenes de estabilidad) con las caractersticas de respuesta en el tiempo
(rapidez y oscilaciones de la respuesta) del sistema de control en lazo cerrado.
De esta manera se puede dise nar un controlador buscando que este modique
convenientemente las gracas de respuesta en frecuencia del sistema en lazo
abierto.
6.11. Preguntas de repaso
1. Que entiende por respuesta en frecuencia? Que representan la magnitud
y la fase de una funcion de transferencia?
2. Las funciones de transferencia estan constituidas por polos y ceros Cuales
de estos componentes contribuyen como ltros pasa altas y cuales como
ltros pasa bajas? Cuales de ellos introducen fase positiva y cuales fase
negativa?
3. Dado un sistema de control en lazo cerrado Por que los ceros contribuyen
a la estabilidad cuando son colocados en la funcion de transferencia de lazo
abierto? Como contribuyen los polos de lazo abierto a la estabilidad?
Cual es la ventaja de agregar polos en la funcion de transferencia de lazo
abierto?
4. Cual es la relacion del criterio de estabilidad de Nyquist con los margenes
de estabilidad?
5. Dado un sistema en lazo abierto Por que una frecuencia de corte (o
de esquina) mayor contribuye a una mayor rapidez de la respuesta en el
tiempo?
6. Que se debe hacer con la frecuencia de cruce de ganancia para conse-
guir que el sistema en lazo cerrado tenga una respuesta mas rapida en el
tiempo?
7. Como afecta el margen de fase a la respuesta en el tiempo del sistema
en lazo cerrado?
8. Cual es la modicacion que se debe hacer al criterio de estabilidad de
Nyquist para que pueda ser aplicado a funciones de transferencia de lazo
abierto con polos y/o ceros sobre el eje imaginario? Cual es la razon para
esto?
9. Que es un sistema de fase mnima?
10. Que es la trayectoria de Nyquist y que es la trayectoria de Nyquist mo-
dicada?
384 6 Dise no usando la respuesta en frecuencia
6.12. Ejercicios propuestos
1. Como obtiene el error en estado estacionario de un sistema en lazo cerra-
do ante referencias tipo escalon, rampa y parabola, a partir de las gracas
de Bode? Investigue.
2. Considere un sistema integrador:
y(t) = k
_
t
0
u dt
y un sistema derivador:
y(t) = k u(t)
a) En ambos casos suponga que u = Acos(t), con A una constante,
y calcule y(t). Haga una graca donde muestre como vara la ampli-
tud de y(t) respecto de la frecuencia en cada caso y compare con las
gracas de Bode mostradas en las guras 6.13(a) y 6.13(b).
b) Cual es el efecto de un derivador cuando u tiene alto contenido de
ruido? (sinusoide de alta frecuencia). En base a lo anterior responda
que piensa que sucedera en los siguientes casos: Que efecto tiene
un controlador que contiene alguna accion derivativa en un sistema
de control de posicion que tiene alto contenido de ruido? Cual es
el efecto del ruido en un sistema de control que contiene una accion
integral unicamente?
c) Considere el caso de un piston neumatico. El ujo de aire de entrada
es u y la posicion del embolo del piston es y. Suponga que el aire no
se comprime ni se expande (que es incompresible) dentro del piston y
que el embolo del piston no tiene masa. Si se extrae ujo de aire del
piston entonces u < 0, si se introduce ujo de aire al piston entonces
u > 0. Bajo estas condiciones este sistema se comporta como un inte-
grador. Suponga que se aplica una entrada de la forma u = Acos(t)
con un valor de que cada vez se acerca mas a cero. Usando su ex-
periencia cotidiana explique que sucede con la posicion del piston y
compare con lo que indican las gracas de Bode correspondientes a
este problema y las gracas obtenidas en el primer inciso de este ejer-
cicio. Que signica el termino ganancia innita a frecuencia cero?
Aunque un motor de CD con escobillas no es exactamente un integra-
dor, use su experiencia cotidiana para ver si tiene un comportamiento
similar al descrito cuando y es la posicion y u = Acos(t) el voltaje
aplicado. Desde el punto de vista del modelo del motor Como puede
explicar este comportamiento?
3. Considere el siguiente sistema:
Y (s) =
a
s +a
U(s), a > 0
6.12 Ejercicios propuestos 385
Suponga que u(t) es una onda cuadrada (de perodo igual a 2) que es
igual a la unidad durante el primer medio perodo e igual a cero durante el
segundo medio perodo. Utilice alg un software especializado para realizar
varias simulaciones utilizando diferentes valores de a desde valores muy
cercanos a cero hasta valores considerablemente grandes. Observe la forma
de y(t) en estas simulaciones. Por que cree que y(t) sea muy diferente
de u(t) cuando a es muy cercana a cero? Por que cree que y(t) sea cada
vez mas parecida a u(t) cuando a es considerablemente grande? Puede
explicar este comportamiento desde el punto de vista de conceptos basados
en la respuesta en frecuencia de la funcion de transferencia
a
s+a
?
4. Existe un resultado fundamental en la teora de sistemas lineales que ar-
ma que si Y (s) = G(s)U(s) con u(t) una funcion periodica y si todos
los polos de G(s) tienen parte real estrictamente negativa, entonces y(t)
converge a una funcion periodica con el mismo perodo de u(t) pero posi-
blemente no con la misma forma de onda [5], pag. 389 (vease tambien el
ejercicio 13 del captulo 3) El ejemplo planteado en el ejercicio 3 de este
captulo le sugiere alguna explicacion acerca de porque u(t) y y(t) puedan
no tener la misma forma de onda? De que depende el que las formas de
onda de u(t) y y(t) sean parecidas o muy diferentes?
5. Considere la siguiente ecuacion diferencial:
y +
2
n
y =
2
n
u
El problema de calcular y(t) cuando t y u(t) = Asin(t) se simplica
enormemente usando las gracas de Bode de la gura 6.14(b). Usando esta
informacion elabore gracas donde se aprecie como cambia y(t) cuando
t conforme cambia desde un valor =
1
<
n
hasta otro valor
=
2
>
n
.
A partir de lo anterior explique que sucede cuando se hace el mismo ex-
perimento pero ahora se tiene una ecuacion diferencial como la siguiente:
y + 2
n
y +
2
n
y =
2
n
u
con
n
> 0 y > 0. Que sucede conforme crece? Por que la resonancia
se considera peligrosa en muchas aplicaciones?
6. Considere un sistema en lazo cerrado como el de la gura 4.10 y la corres-
pondiente expresion para el error dada como E(s) =
1
1+G(s)
R(s) donde
E(s) = R(s) C(s). Si el valor deseado es una sinusoide r(t) = Asin(t)
Que debe hacer para que el error lm
t
e(t) sea cada vez menor? Es po-
sible que se pueda tener que lm
t
e(t) = 0? Si la respuesta es armativa,
Bajo que condiciones? Verique su respuesta mediante una simulacion.
7. Considere el circuito RLC paralelo mostrado en la gura 6.82. Demuestre
que la funcion de transferencia esta dada como:
V (s)
I(s)
=
k
2
n
s
s
2
+ 2
n
s +
2
n
(6.80)
386 6 Dise no usando la respuesta en frecuencia
donde
n
=
1

LC
, =
1
2R
_
L
C
, k = L. Dibuje las gracas de Bode corres-
pondientes cuando es cercana a cero (Como puede ser esto posible en la
practica?) y compruebe que se trata de un ltro pasa banda alrededor de
la frecuencia
n
(de hecho
n
conforme 0). Como puede
variar el valor de
n
en la practica?
LL
C
R
+

V(s)
I(s)
Figura 6.82. Circuito RLC paralelo.
Una aplicacion interesante e importante de este ejercicio es el radio-
receptor de AM mostrado en la gura 6.83 [6], pag. 94-99. Se sugiere
al lector que construya este receptor pues no es difcil hacerlo y a conti-
nuacion se detalla sobre la elaboracion de las partes mas importantes.
La inductancia se construye enrollando alambre magneto sobre un n ucleo
cilndrico de carton o de plastico de aproximadamente 2.6[cm] de diametro
y aproximadamente 10[cm] de largo. Las espiras deben estar colocadas
una junto a la otra sin encimarse y sin dejar huecos apreciables entre
ellas. Entonces se utiliza papel lija para retirar completamente el barniz
que cubre al alambre de cobre sobre una franja a lo largo de todo el
cilindro de aproximadamente 0.5[cm] de ancho. Entonces, la inductancia
L se puede variar deslizando un contacto electrico a lo largo de esta franja
de alambre desnudo.
La antena consiste de un alambre de cobre de 30[m] de largo. Uno de los
extremos se ja, a traves de material aislante, a un punto solido sobre
una pared o un poste mientras que el otro extremo se conecta al circuito
sintonizador (LC en paralelo). Es importante que la antena no tenga con-
tacto electrico con ning un punto que no sea el indicado en la gura 6.83.
Notese que la funcion de la antena es recoger la se nales electricas que son
transportadas por las ondas electromagneticas que emiten las estaciones
radiodifusoras comerciales de AM. Mientras mas larga sea la antena mas
intensas seran las se nales recuperadas.
La conexion a tierra se realiza conectando rmemente dicho punto a una
tubera de agua de cobre. Es importante que la tubera sea de cobre y que
llegue a una profundidad suciente dentro del suelo.
6.12 Ejercicios propuestos 387
El diodo 1N34A es de germanio y tiene la funcion de elemento detector,
es decir, es quien extrae la informacion que porta la onda electromagneti-
ca transmitida. Es importante que este diodo sea de germanio pues tiene
una barrera de potencial mucho menor que la de un diodo de silicio. Esto
facilita que la debil se nal captada por la antena pueda vencer dicha barre-
ra de potencial. Precisamente debido a lo debil de esta se nal tambien es
importante que todo el circuito de audio represente una alta impedan-
cia. Entonces el circuito basado en amplicador operacional debe tener
una ganancia elevada y su resistencia de entrada debe ser grande (aun-
que se sugiere de 100K[Ohm] pueden utilizarse otros valores para ajustar
convenientemente la ganancia de este amplicador).
El lector puede sintonizar diferentes estaciones simplemente variando la
inductancia L. Si la antena es sucientemente larga, si ademas se tiene una
buena conexion a tierra y si los audfonos son de alta impedancia entonces
se podran escuchar estaciones de radio incluso sin necesidad de bateras, es
decir, se puede sustituir todo el circuito contenido por las lneas punteadas
por un simple corto. En caso de usar el amplicador operacional se sugiere
usar dos bateras de 9[V] para proveer la alimentacion necesaria.
Puede explicar el funcionamiento del circuito de sintona de este receptor
a partir de la respuesta en frecuencia de la funcion de transferencia en
(6.80)? Por que solo aparecen los elementos L y C pero no R en la gura
6.83? Que variables en el radio receptor juegan los papeles de V (s) y I(s)
en (6.80)?
L C
+

100K
1M
NA741
1N34A
Antena
Audifonos
Tierra
Figura 6.83. Radio-receptor de AM basico.
8. Considere el circuito RC mostrado en la gura 6.84. Si v
i
(t) es un escalon,
encuentre v
o
(t) y graque estas dos se nales. La se nal v
o
(t) es continua o
388 6 Dise no usando la respuesta en frecuencia
discontinua en t = 0? Obtenga la funcion de transferencia
Vo(s)
Vi(s)
, obtenga
las gracas de Bode correspondientes y diga si se trata de un ltro pasa
altas o pasa bajas. En base a estas observaciones Como puede explicar
la continuidad (o discontinuidad) de v
o
(t) en t = 0 cuando v
i
(t) es un
escalon?
+

R
C
v
i
v
o
+

+
Figura 6.84. Circuito RC.
9. En este captulo se ha explicado como se obtienen las gracas de Bode
correspondientes a una funcion de transferencia conocida. Sin embargo,
tambien es posible el proceso inverso: dadas las gracas de Bode se puede
obtener la funcion de transferencia correspondiente. En este tipo de pro-
blemas las gracas de Bode son obtenidas experimentalmente y se dice
que al encontrar la funcion de transferencia correspondiente se ha identi-
cado al sistema bajo estudio. En la gura 6.85 se muestran unas gracas
de Bode que se han obtenido experimentalmente. Encuentre la funcion de
transferencia correspondiente. Verique su respuesta dibujando las gra-
cas de Bode de la funcion de transferencia identicada y comparandolas
con las de la gura 6.85.
10. En el ejercicio 7 del captulo 2 se explica como obtener el modelo ma-
tematico de un voltmetro analogico de CD. Si se supone que la induc-
tancia del voltmetro es despreciable (L 0) el modelo se reduce a un
sistema masa-resorte-amortiguador giratorio (de segundo orden). Con es-
ta informacion en mente realice el siguiente experimento.
Conecte el voltmetro analogico en el modo de corriente directa.
Tome un generador de funciones y programelo para que genere una
forma de onda sinusoidal. Tambien programelo de manera que dicha
funcion sinusoidal de voltaje sea entregada montada sobre una compo-
nente de CD constante. El valor de esta componente de CD debe ser
igual a la mitad de la escala utilizada del voltmetro de CD. Ademas, el
generador de funciones debe entregar un voltaje cuyos valores maximo
6.12 Ejercicios propuestos 389
5
0
5
10
15
20
25
M
a
g
n
i
t
u
d
e

(
d
B
)
10
4
10
3
10
2
10
1
10
0
10
1
10
2
10
3
90
45
0
45
P
h
a
s
e

(
d
e
g
)
Bode Diagram
Frequency (rad/sec)
Figura 6.85. Gracas de Bode de una planta a identicar.
y mnimo (cuando aparece la funcion sinusoidal junto con la componen-
te de CD) no excedan la escala seleccionada del voltmetro analogico.
Conecte directamente a las terminales del voltmetro la salida del ge-
nerador de funciones. Aplique una se nal sinusoidal de frecuencia y
obtenga los valores v
min
y v
max
como los valores mnimo y maximo
obtenidos en la escala del voltmetro analogico. Utilice un osciloscopio
para medir el voltaje de pico a pico de la se nal sinusoidal entregada
por el generador de funciones y desgnelo como A. Utilice diferentes
valores de frecuencia y forme la siguiente tabla:
Tabla 6.4. Datos de respuesta en frecuencia de un voltmetro de CD.
, [rad/seg] B = vmax vmin, [Volts] A, [Volts]
B
A
390 6 Dise no usando la respuesta en frecuencia
Con estos datos dibuje la graca de Bode de magnitud correspondiente
y, a partir de ella, obtenga los valores numericos de la funcion de
transferencia G(s) =
Vo(s)
Vi(s)
donde V
i
(s) y V
o
(s) son las transformadas
de la place del voltaje entregado por el generador de funciones y el
voltaje medido por el voltmetro, respectivamente. Notese que esta
funcion de transferencia debe ser de ganancia unitaria a frecuencia
cero porque a este valor de frecuencia es cuando un voltmetro de
CD entrega un valor correcto del voltaje medido. Notese tambien que
el valor de
n
es un dato que da informacion a cerca de cual es el
valor maximo de frecuencia a la cual el voltmetro de CD entrega
mediciones correctas. Esta parte del resultado depende mucho de que
el osciloscopio y el voltmetro entreguen la misma medicion de voltaje
a bajas frecuencias.
Referencias
1. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,
1980.
2. H. P. Hsu, Analisis de Fourier, Fondo Educativo Interamericano, Mexico, 1973.
3. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
4. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
5. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
6. Fundacion Thomas Alva Edison, Experimentos faciles e increbles, Ediciones
Roca, Mexico, 1993.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espa nol, McGraw-Hill, Mexico, 1992.
7
La tecnica de las variables de estado
A nales de la decada de 1950 llego la era de los vuelos espaciales. El
lanzamiento, direccionamiento, navegacion y seguimiento de naves espacia-
les consiste basicamente en el control de objetos balsticos. Estos problemas
requieren de la construccion de modelos fsicos detallados que puedan ser cons-
truidos en terminos de ecuaciones diferenciales, lineales y no lineales. Basados
en el trabajo de Poincare, los ingenieros que trabajaban en las industrias
aeroespaciales empezaron a formular los problemas de control en terminos de
un conjunto de ecuaciones diferenciales de primer orden. As nacio el enfoque
que hoy conocemos como el de las variables de estado.
394 7 La tecnica de las variables de estado
Objetivos del captulo
Entender el concepto de variables de estado.
Conocer las herramientas principales usadas en el enfoque de las variables
de estado.
Conocer la relaci on entre la representaci on en variables de estado y la
representaci on en funci on de transferencia.
Analizar y dise nar sistemas de control usando el enfoque de las variables
de estado.
Los metodos de dise no presentados en los captulos 5 y 6 constituyen la
base de lo que se conoce hoy en da como los metodos de Control Clasico. Una
de las caractersticas del control clasico es que se basa en el enfoque entrada-
salida dictado por el uso de la funcion de transferencia. Esto signica que una
funcion de transferencia es como una caja negra a la que se le aplica una se nal
(la entrada) y solo se ve el efecto que se produce en la salida, es decir no se
sabe que es lo que ocurre en el interior de la caja negra. Una desventaja de
este metodo es que para dise nar un sistema de control solo se puede utilizar
la informacion suministrada por una sola se nal: la salida. Esto establece un
lmite en el desempe no que se puede conseguir.
La tecnica de las variables de estado se introduce con el n de mejorar
algunos de los aspectos mencionados en el parrafo anterior. Por ejemplo, dado
que la variable de estado es una tecnica que permite utilizar la informacion
suministrada por todas las variables internas de un sistema, ademas de la
salida, es posible dise nar sistemas de control que tienen mejores desempe nos.
Esta es la idea fundamental detras del control por realimentacion del estado
que es explotado por la tecnica de las variables de estado.
El estudio formal de la tecnica de las variables de estado es un tema com-
plejo porque involucra el manejo de herramientas matematicas avanzadas. Sin
embargo, el objetivo de este captulo no es presentar una exposicion formal de-
tallada de esta tecnica sino presentar los conceptos basicos que permiten usar
esta tecnica para controlar plantas sencillas. As, solo se consideran plantas
que tienen una entrada y una salida y que son controlables y observables.
7.1. Representacion en variables de estado
Considere las siguientes dos ecuaciones diferenciales lineales de coecientes
constantes:
L
di
dt
= u R i n k
e

(7.1)
J

= b

+n k
m
i (7.2)
Notese que cada una de estas ecuaciones diferenciales tiene efecto sobre la
otra ecuacion diferencial. Se dice que estas ecuaciones diferenciales deben ser
7.1 Representacion en variables de estado 395
resueltas simultaneamente. Una manera muy util de estudiar este tipo de
ecuaciones diferenciales es el enfoque de las variables de estado. Las variables
de estado pueden ser denidas de la siguiente manera.
Denicion 7.1 ( [1], p ag. 83) Si se conoce la entrada u(t) para t t
0
, las
variables de estado son el conjunto de variables cuyo conocimiento en t = t
0
permite calcular la soluci on de las ecuaciones diferenciales para todo t t
0
.
Notese que las variables de estado se denen de una manera muy ambi-
gua. Aunque esto pudiera parecer una desventaja, sin embargo se convierte
en una ventaja porque permite que las variables de estado sean seleccionadas
de la manera que mas convenga. De acuerdo a esto, aunque en la literatura se
proponen varios criterios diferentes para seleccionar las variables de estado,
se debe entender que sin importar cual criterio se utilice las variables selec-
cionadas deben ser tales que permitan conocer la solucion de las ecuaciones
diferenciales para todo tiempo futuro. Siguiendo esta lnea de ideas en esta
obra se utilizara el siguiente criterio para seleccionar las variables de estado.
Criterio 7.1 Identique la variable inc ognita de cada una de las ecuaciones
diferenciales involucradas. Identique el orden de cada una de las ecuaciones
diferenciales y desgnelo como r. Seleccione las variables de estado como el
conjunto formado por las variables inc ognita y sus primeras r 1 derivadas
en cada una de las ecuaciones diferenciales involucradas. Tambien se pue-
de seleccionar a alguna de estas variables multiplicada por alguna constante
diferente de cero.
Es una costumbre usar la letra n para designar el n umero de variables de
estado. Por otro lado, el estado es un vector cuyas componentes estan dadas
por cada una de las variables de estado. Entonces el estado es un vector de n
dimensiones. De acuerdo a este criterio las variables de estado seleccionadas
para las ecuaciones (7.1), (7.2) son i, ,

, por lo que n = 3 y el estado se
puede formar como el siguiente vector:
x =
_
_
x
1
x
2
x
3
_
_
=
_
_
i

_
_
Usando esta nomenclatura, las ecuaciones diferenciales en (7.1), (7.2) se pue-
den escribir como:
L x
1
= u R x
1
n k
e
x
3
(7.3)
J x
3
= b x
3
+n k
m
x
1
(7.4)
o, de manera vectorial:
d
dt
_
_
x
1
x
2
x
3
_
_
=
_
_
(u R x
1
n k
e
x
3
)/L
x
3
(b x
3
+n k
m
x
1
)/J
_
_
(7.5)
396 7 La tecnica de las variables de estado
lo cual se puede escribir de manera compacta como:
x = Ax +Bu
A =
_
_

R
L
0
n ke
L
0 0 1
n km
J
0
b
J
_
_
, B =
_
_
1
L
0
0
_
_
(7.6)
Por otro lado, se acostumbra usar la letra y para representar la salida a con-
trolar. Se debe resaltar que el estado x esta constituido por variables que son
internas al sistema y, por tanto, en general no se conocen y no se pueden
medir. En cambio, la salida y representa una variable que siempre se puede
medir. Si la salida se dene como la posicion, es decir, si y = = x
2
entonces
se puede escribir:
y = Cx, C = [0 1 0]
Al conjunto de las dos ecuaciones:
x = Ax +Bu (7.7)
y = Cx (7.8)
se le conoce como ecuacion dinamica lineal e invariante en el tiempo (A, B y
C son constantes). La ecuacion en (7.7) se conoce como ecuacion de estado y
la ecuacion en (7.8) se conoce como ecuacion de salida.
Aunque la ecuacion de estado en (7.7) se ha obtenido a partir de una
ecuacion diferencial que cuenta solo con una entrada, es decir u es un escalar,
es muy sencillo extender (7.7) al caso en el que existen p entradas, solo hay que
denir u como un vector de p componentes, cada una de las cuales representa
una entrada, y B debe ser denida como una matriz de n renglones y p
columnas. Por otro lado, tambien es muy sencillo generalizar la ecuacion de
salida en (7.8) al caso en que se tienen q salidas, solo hay que denir y como
un vector de q componentes, cada una de las cuales representa una salida, y
C debe ser denida como una matriz de q renglones y n columnas.
Notese que una ecuacion de estado esta constituida por un conjunto de
n ecuaciones diferenciales de primer orden. Una caracterstica de (7.7), (7.8),
es decir de una ecuacion dinamica lineal e invariante en el tiempo, es que
el miembro derecho de cada una de las ecuaciones diferenciales involucradas
en (7.7) esta dado como una combinacion lineal de las variables de estado y
la entrada a traves del uso de coecientes constantes. Notese tambien que el
miembro derecho de (7.8) esta constituido por la combinacion lineal de las
variables de estado a traves del uso de coecientes constantes.
Una propiedad fundamental de las ecuaciones de estado lineales e inva-
riantes en el tiempo es que satisfacen el principio de superposicion, lo cual es
logico ya que este tipo de ecuaciones de estado se obtienen, seg un se acaba
de explicar, a partir de ecuaciones diferenciales lineales, ordinarias y de co-
ecientes constantes las cuales, seg un se explica en la seccion 3.10, tambien
satisfacen el principio de superposicion.
7.1 Representacion en variables de estado 397
Ejemplo 7.1 Considere el sistema mec anico mostrado en la gura 7.1. El
modelo matem atico correspondiente fue obtenido en el ejemplo 2.5 del captulo
2 y a continuaci on se reescribe para facilitar la referencia
m
2
m
1
K
1
x
1
b
x
2 K
2
K
3
F(t)
Figura 7.1. Sistema mecanico.
x
1
+
b
m
1
( x
1
x
2
) +
K
1
m
1
x
1
+
K
2
m
1
(x
1
x
2
) =
1
m
1
F(t) (7.9)
x
2

b
m
2
( x
1
x
2
) +
K
3
m
2
x
2

K
2
m
2
(x
1
x
2
) = 0 (7.10)
N otese que se tienen dos ecuaciones diferenciales de segundo orden cada una.
Esto signica que s olo habr an cuatro variables de estado: la inc ognita de cada
una de estas ecuaciones diferenciales, es decir x
1
y x
2
, y la primer derivada
de cada una de estas inc ognitas, es decir x
1
y x
2
:
x =
_

_
x
1
x
2
x
3
x
4
_

_
=
_

_
x
1
x
2
x
1
x
2
_

_
, u = F(t)
Usando esta nomenclatura, las ecuaciones diferenciales en (7.9), (7.10) se
pueden escribir como:
x
1
= x
3
=
b
m
1
(x
3
x
4
)
K
1
m
1
x
1

K
2
m
1
(x
1
x
2
) +
1
m
1
u
x
2
= x
4
=
b
m
2
(x
3
x
4
)
K
3
m
2
x
2
+
K
2
m
2
(x
1
x
2
)
o, de manera vectorial:
d
dt
_

_
x
1
x
2
x
3
x
4
_

_
=
_

_
x
3
x
4

b
m1
(x
3
x
4
)
K1
m1
x
1

K2
m1
(x
1
x
2
) +
1
m1
u
b
m2
(x
3
x
4
)
K3
m2
x
2
+
K2
m2
(x
1
x
2
)
_

_
(7.11)
de donde se obtiene la ecuaci on de estado:
398 7 La tecnica de las variables de estado
x = Ax +Bu
A =
_

_
0 0 1 0
0 0 0 1

K1
m1

K2
m1
K2
m1

b
m1
b
m1
K2
m2

K2
m2

K3
m2
b
m2

b
m2
_

_
, B =
_

_
0
0
1
m1
0
_

_
(7.12)
Por otro lado, la ecuaci on de salida depende de que se desea controlar. Por
ejemplo, si lo que interesa controlar es la posici on de la masa 1 entonces:
y = Cx = x
1
, C = [1 0 0 0]
pero si se desea controlar la posici on de la masa 2 entonces:
y = Cx = x
2
, C = [0 1 0 0]
Ejemplo 7.2 En el captulo 12 se estudia un mecanismo conocido como el
sistema ball and beam. En ese captulo se obtiene el modelo matem atico corres-
pondiente y se presenta en la ecuaci on (12.16). A continuaci on se reescribe
dicho modelo con el n de facilitar la referencia:
X(s)
(s)
=

s
2
, (s) =
k
s(s +a)
I

(s)
Usando la transformada inversa de Laplace se pueden recuperar las ecuacio-
nes diferenciales de las que se han obtenido las funciones de transferencia
involucradas en las expresiones anteriores, es decir:
x = ,

+a

= ki

(7.13)
Como se trata de dos ecuaciones diferenciales de segundo orden entonces ha-
br a cuatro variables de estado: las inc ognitas de cada ecuaci on diferencial, es
decir x y , y las primeras derivadas de dichas inc ognitas, es decir x y

:
z =
_

_
z
1
z
2
z
3
z
4
_

_
=
_

_
x
x

_
, u = i

Usando esta nomenclatura, las ecuaciones diferenciales en (7.13) se pueden


escribir como:
x = z
2
= z
3
,

= z
4
= az
4
+ku
o, de manera vectorial:
d
dt
_

_
z
1
z
2
z
3
z
4
_

_
=
_

_
z
2
z
3
z
4
az
4
+ku
_

_
(7.14)
7.2 Linealizacion aproximada 399
de donde se obtiene la ecuaci on de estado:
z = Az +Bu
A =
_

_
0 1 0 0
0 0 0
0 0 0 1
0 0 0 a
_

_
, B =
_

_
0
0
0
k
_

_
(7.15)
Tal como se explica en el captulo 12 la variable que se desea controlar es x
y, por tanto, la ecuaci on de salida est a dada como:
y = Cz = x = z
1
, C = [1 0 0 0]
7.2. Linealizacion aproximada de ecuaciones de estado
no lineales
Es muy frecuente encontrar ecuaciones de estado que no son lineales, es
decir, ecuaciones de estado dadas como:
x = f(x, u) (7.16)
f =
_

_
f
1
(x, u)
f
2
(x, u)
.
.
.
f
n
(x, u)
_

_
, x =
_

_
x
1
x
2
.
.
.
x
n
_

_
, u =
_

_
u
1
u
2
.
.
.
u
p
_

_
donde al menos una de las funciones f
i
(x, u), i = 1, . . . , n, es una funcion
escalar no lineal de x y/o de u, es decir, que no se puede escribir como una
combinacion lineal de las componentes de x y/o de u. Por ejemplo, para una
ecuacion de estado con tres variables de estado y dos entradas se puede tener:
f
i
(x, u) = 3 sin(x
3
) +x
1
u
2
f
i
(x, u) =
e
x1
5x
2
f
i
(x, u) = u
2
1
Es importante subrayar que la notacion f
i
(x, u) signica que la componente i
del vector f es funcion, en general, de las componentes de los vectores estado
x y entrada u. Sin embargo, tal como se muestra en los ejemplos anteriores, no
es forzoso que f
i
(x, u) sea funcion de todas las variables de estado y de todas
la entradas. Mas a un, puede darse el caso en que f
i
(x, u) no es funcion de
ninguna variable de estado pero s lo es de algunas entradas y viceversa. Una
ecuacion de estado de la forma (7.16) que tiene las caractersticas mencionadas
se conoce como una ecuacion de estado no lineal invariante en el tiempo (no
depende explcitamente del tiempo).
400 7 La tecnica de las variables de estado
El estudio de ecuaciones de estado no lineales es mucho mas complejo
que el estudio de ecuaciones de estado lineales. Sin embargo, la mayora de los
procesos fsicos que son de interes para los ingenieros de control son no lineales
por naturaleza, es decir, sus modelos tienen la forma dada en (7.16). As que
deben desarrollarse metodos de estudio y dise no para este tipo de ecuaciones
de estado. Uno de los metodos mas sencillos consiste en encontrar una ecuacion
de estado lineal como la mostrada en (7.7) que represente satisfactoriamente la
evolucion de (7.16). La ventaja de este metodo es que las ecuaciones de estado
lineales de la forma (7.7) pueden ser estudiadas con mayor facilidad. Entonces
el analisis y el dise no de controladores para (7.16) se realizan utilizando un
modelo mas sencillo de la forma (7.7). Aunque este metodo es muy util se debe
mencionar que su principal desventaja es que los resultados que se obtienen
solo son validos en una region restringida del espacio de trabajo del proceso
que se desea controlar. En las siguientes secciones se explican en detalle todas
estas ideas.
7.2.1. Procedimiento para ecuaciones de primer orden sin
entrada
Considere una ecuacion diferencial no lineal de primer orden sin entrada:
x = f(x) (7.17)
donde x es un escalar y f(x) es una funcion no lineal de x. Se desea obtener
x

x
m
h x ( )
f x ( )
f x

( )
Figura 7.2. Aproximacion de una funcion no lineal f(x) usando una linea recta
h(x).
una ecuacion diferencial lineal que represente a (7.17) al menos de manera
7.2 Linealizacion aproximada 401
aproximada. Defnase un punto de equilibrio x

de (7.17) como aquel valor


de x que satisface f(x

) = 0. De acuerdo a (7.17) esto signica que en un


punto de equilibrio x

= f(x

) = 0, es decir, el sistema puede permanecer en


reposo en ese punto. En terminos practicos esto signica que un punto de
equilibrio x

representa la conguracion constante en la que puede mantenerse


sin movimiento un robot, por ejemplo, bajo la accion de la gravedad.
Suponga que f(x) esta representada por la curva que se muestra en la
gura 7.2. La linea recta punteada h(x) es tangente a f(x) en el punto x

.
Debido a esta caracterstica, h(x) y f(x) son aproximadamente iguales para
valores de x que sean cercanos a x

, es decir, si x x

0. Sin embargo,
la diferencia entre h(x) y f(x) crece conforme los valores de x se alejan de
x

, es decir, para valores grandes de x x

. As que se puede usar h(x) en


lugar de f(x) si la variable x se restringe a tomar solamente valores que sean
cercanos a x

. En el caso del ejemplo del robot, esto signica que aunque s se


permitira que el robot se mueva, sin embargo estos movimientos no deben ser
tales que la conguracion del robot sufra cambios demasiado grandes respecto
de su conguracion de equilibrio o reposo. En la gura 7.2 se observa que:
m =
h(x) f(x

)
x x

, m =
df(x)
dx

x=x

(7.18)
donde la constante m es la pendiente de h(x), es decir, la derivada de f(x)
evaluada en el punto de punto de equilibrio x

. Entonces, de la primera ex-


presion:
h(x) = m(x x

) +f(x

) (7.19)
y debido a que h(x) f(x), se puede escribir:
f(x) m(x x

) +f(x

) (7.20)
Como x

es un punto de equilibrio entonces f(x

) = 0 y se obtiene:
f(x) m(x x

) (7.21)
Entonces la ecuacion (7.17) se puede aproximar por:
x = m(x x

) (7.22)
Deniendo una nueva variable z = x x

, se tiene z = x, porque x

= 0. Por
tanto, la aproximacion lineal de (7.17) esta dada por:
z = m z (7.23)
la cual es valida solamente bajo la restriccion x x

0. Una vez que se usa


(7.23) para calcular z se puede usar z = xx

para obtener x ya que el punto


de equilibrio x

es conocido.
402 7 La tecnica de las variables de estado
7.2.2. Procedimiento general para ecuaciones de orden arbitrario
y n umero de entradas arbitrario
Considere ahora la ecuacion diferencial:
x = f(x, u) (7.24)
donde x R
n
es un vector de n dimensiones y u R
p
es un vector de p
dimensiones que representa la entrada o excitacion de la ecuacion diferencial.
Notese que f(x) debe ser una funcion vectorial de n dimensiones. Esto sig-
nica que (7.24) tiene la forma denida en (7.16). En este caso se preere
usar el concepto punto de operacion en lugar de punto de equilibrio ya
que este ultimo concepto se dene solamente para ecuaciones diferenciales sin
entradas. Un punto de operacion se dene como aquella pareja (x

, u

) tal que
f(x

, u

) = 0. Esto signica que la solucion de la ecuacion diferencial puede


permanecer en reposo en el valor constante x

, porque x

= f(x

, u

) = 0,
si se aplican las entradas adecuadas u

(p entradas) que tambien resultan ser


constantes.
Notese que f(x, u) depende de n+p variables. Defnase el siguiente vector:
y =
_
x
u
_
(7.25)
de n +p dimensiones. Entonces (7.24) se puede escribir como:
x = f(y) (7.26)
Siguiendo las ideas de la seccion previa, se desea aproximar la funcion no
lineal f(y) mediante una funcion h(y) que sea tangente a f(y) en el punto
de operacion y

denido como:
y

=
_
x

_
Generalizando la expresion en (7.19) al caso de n+p variables se puede escribir:
h(y) = M(y y

) +f(y

) (7.27)
donde M =
f(y)
y

y=y

es una matriz constante denida como:


M =
_

_
f1(x,u)
x1
f1(x,u)
x2
. . .
f1(x,u)
xn
f1(x,u)
u1
f1(x,u)
u2
. . .
f1(x,u)
up
f2(x,u)
x1
f2(x,u)
x2
. . .
f2(x,u)
xn
f2(x,u)
u1
f2(x,u)
u2
. . .
f2(x,u)
up
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
fn(x,u)
x1
fn(x,u)
x2
. . .
fn(x,u)
xn
fn(x,u)
u1
fn(x,u)
u2
. . .
fn(x,u)
up
_

_
x=x

,u=u

Usando f(y) h(y) se puede aproximar (7.26) por:


7.2 Linealizacion aproximada 403
x = M(y y

) +f(y

) (7.28)
Como f(y

) = f(x

, u

) = 0 y x x

= x, porque x

= 0, se tiene:
z = Az +Bv (7.29)
A =
_

_
f1(x,u)
x1
f1(x,u)
x2
. . .
f1(x,u)
xn
f2(x,u)
x1
f2(x,u)
x2
. . .
f2(x,u)
xn
.
.
.
.
.
.
.
.
.
.
.
.
fn(x,u)
x1
fn(x,u)
x2
. . .
fn(x,u)
xn
_

_
x=x

,u=u

(7.30)
B =
_

_
f1(x,u)
u1
f1(x,u)
u2
. . .
f1(x,u)
up
f2(x,u)
u1
f2(x,u)
u2
. . .
f2(x,u)
up
.
.
.
.
.
.
.
.
.
.
.
.
fn(x,u)
u1
fn(x,u)
u2
. . .
fn(x,u)
up
_

_
x=x

,u=u

(7.31)
donde se ha denido z = x x

y v = u u

. Las expresiones (7.29), (7.30),


(7.31) constituyen el modelo lineal aproximado que se utiliza para el estudio
y el dise no de controladores para el sistema no lineal en (7.24). Notese que
este modelo lineal aproximado solo es valido si el estado x y la entrada u son
tales que no se alejan mucho del punto de operacion (x

, u

), es decir, solo si
z = x x

0 y v = u u

0. Normalmente es difcil determinar desde el


punto de vista practico cuales valores de x y de u satisfacen estas condiciones
y lo que se hace es simplemente limitar sus variaciones de manera emprica.
Ejemplo 7.3 En la gura 7.3 se muestra un pendulo simple. En el ejemplo
2.13 del captulo 2 se encontr o que el modelo matem atico correspondiente
est a dado por la siguiente ecuaci on diferencial no lineal:
T(t)

l
m
g
d
Figura 7.3. Pendulo simple.
ml
2

+b

+mgl sin() = T(t) (7.32)


404 7 La tecnica de las variables de estado
La caracterstica de ser una ecuaci on diferencial no lineal es determinada
exclusivamente por la funci on sin() que aparece por efecto de la gravedad. Al
tratarse de una ecuaci on diferencial de segundo orden, entonces s olo hay dos
estados: la inc ognita y su primer derivada

:
x =
_
x
1
x
2
_
=
_

_
, u = T(t)
Usando esta nomenclatura, la ecuaci on diferencial en (7.32) se puede escribir
como:

= x
2
=
b
ml
2
x
2

g
l
sin(x
1
) +
1
ml
2
u
o, de manera vectorial:
d
dt
_
x
1
x
2
_
=
_
x
2

b
ml
2
x
2

g
l
sin(x
1
) +
1
ml
2
u
_
(7.33)
de donde se obtiene la ecuaci on de estado:
x = f(x, u)
f(x, u) =
_
f
1
(x, u)
f
2
(x, u)
_
=
_
x
2

b
ml
2
x
2

g
l
sin(x
1
) +
1
ml
2
u
_
N otese que en este caso no se puede obtener la forma lineal x = Ax+Bu debido
a la presencia de la funci on sin(). Con el n de obtener una aproximaci on
lineal de esta ecuaci on de estado no lineal, primero se encuentran los puntos
de operaci on, es decir las parejas (x

, u

) que satisfacen f(x

, u

) = [0 0]
T
:
f(x

, u

) =
_
x

b
ml
2
x

g
l
sin(x

1
) +
1
ml
2
u

_
=
_
0
0
_
de donde se obtiene:
x

2
= 0, u

= mgl sin(x

1
)
Esto signica que el valor de la entrada, en el punto de operaci on, depende
del valor de la posici on del pendulo en el punto de operaci on. Esto es debido a
que, para mantener al pendulo en reposo, es necesario que la entrada compense
de manera exacta al efecto de la gravedad. Para continuar, debe seleccionarse
alg un valor especco para x

1
. Aqu se considerar an dos casos:
Cuando x

1
= 0, x

2
= 0, u

= 0. Usando las expresiones en (7.29), (7.30),


(7.31) se encuentra que:
z = Az +Bv
A =
_
f1(x,u)
x1
f1(x,u)
x2
f2(x,u)
x1
f2(x,u)
x2
_
x=x

,u=u

=
_
0 1

g
l
cos(x
1
)
b
ml
2
_
x1=x2=u=0
7.2 Linealizacion aproximada 405
=
_
0 1

g
l

b
ml
2
_
B =
_
f1(x,u)
u
f2(x,u)
u
_
x=x

,u=u

=
_
0
1
ml
2
_
donde se ha denido z = x x

= x y v = u u

= u. N otese que esta


ecuaci on de estado especica que:
z
1
= z
2
, z
2
=
g
l
z
1

b
ml
2
z
2
+
1
ml
2
v
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuaci on diferencial de segundo orden, lineal y de coecientes
constantes:
z
1
+
b
ml
2
z
1
+
g
l
z
1
=
1
ml
2
v (7.34)
La cual puede ser analizada utilizando los conceptos vistos en las secciones
3.3 (races complejas conjugadas con parte real menor o igual a cero),
3.5 (races reales, repetidas y negativas) y 3.4 (races reales, diferentes y
negativas) del captulo 3, ya que corresponde a una ecuaci on diferencial de
la forma:
y + 2
n
y +
2
n
y = k
2
n
v
donde:
y = z
1
, 2
n
=
b
ml
2
,
2
n
=
g
l
, k =
1
mgl
con 0,
n
> 0 y k > 0 porque m > 0, g > 0, l > 0 y b 0.
Cuando x

1
= , x

2
= 0, u

= 0. Usando las expresiones en (7.29),


(7.30), (7.31) se encuentra que:
z = Az +Bv
A =
_
f1(x,u)
x1
f1(x,u)
x2
f2(x,u)
x1
f2(x,u)
x2
_
x=x

,u=u

=
_
0 1

g
l
cos(x
1
)
b
ml
2
_
x1=,x2=u=0
=
_
0 1
g
l

b
ml
2
_
B =
_
f1(x,u)
u
f2(x,u)
u
_
x=x

,u=u

=
_
0
1
ml
2
_
donde se ha denido z = xx

= [x
1
x

1
, x
2
]
T
y v = uu

= u. N otese
que esta ecuaci on de estado especica que:
406 7 La tecnica de las variables de estado
z
1
= z
2
, z
2
=
g
l
z
1

b
ml
2
z
2
+
1
ml
2
v
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuaci on diferencial de segundo orden, lineal y de coecientes
constantes:
z
1
+
b
ml
2
z
1

g
l
z
1
=
1
ml
2
v (7.35)
La cual puede ser analizada utilizando los conceptos vistos en la secci on
3.4 del captulo 3 (races reales, diferentes, una positiva y la otra negativa,
vease el ejemplo 3.9) ya que corresponde a una ecuaci on diferencial de la
forma:
y +c y +dy = ev
donde:
y = z
1
, c =
b
ml
2
0, d =
g
l
< 0, e =
1
ml
2
N otese que de acuerdo a (7.34) y a la secci on 3.3 del captulo 3, cuando el
pendulo funciona alrededor del punto de operaci on x

1
= 0, x

2
= 0, u

= 0,
oscila con una frecuencia natural dada como
n
=
_
g
l
. Esto signica que
un pendulo m as largo oscila m as lentamente mientras que un pendulo m as
corto oscila m as r apidamente. Estas observaciones son utiles, por ejemplo,
cuando se desea ajustar la rapidez de un reloj de pendulo que se atrasa o
se adelanta. M as a un, reacomodando (7.34) se obtiene:
ml
2
z
1
+b z
1
+mglz
1
= v (7.36)
De acuerdo al ejemplo 2.6 del captulo 2 que trata sobre el sistema masa-
resorte-amortiguador rotativo mostrado en la gura 7.4, (7.36) signica que
el factor K = mgl > 0 equivale al coeciente de rigidez de un resorte que es
introducido por el efecto de la gravedad. Por otro lado, usando argumentos
I
K
b
T(t)
Figura 7.4. Sistema masa-resorte-amortiguador rotativo.
similares se observa que, reacomodando (7.35):
ml
2
z
1
+b z
1
mglz
1
= v
7.3 Algunos resultados del algebra lineal 407
cuando el pendulo funciona alrededor de los puntos de operaci on x

1
= ,
x

2
= 0, u

= 0, su comportamiento es an alogo al de un sistema masa resorte


amortiguador que cuenta con un resorte con coeciente de rigidez negativo
K = mgl < 0. Esto puede verse del siguiente modo. Un coeciente de rigidez
positivo K > 0 indica que la fuerza ejercida por el resorte siempre va dirigida
en sentido contrario a la deformaci on y por eso el resorte forza al cuerpo a
regresar a la posici on donde el resorte no est a deformado. Esa es la raz on
por la que el pendulo oscila alrededor del punto de operaci on x

1
= 0, x

2
= 0,
u

= 0. Por otro lado y debido al cambio de signo, un resorte con coeciente


de rigidez negativo K < 0 debe hacer lo contrario, es decir, la fuerza ejercida
por el resorte ahora va dirigida en el mismo sentido que la deformaci on. Esto
signica que al deformarse el resorte con K < 0 este forza a que el resorte se
deforme a un m as por lo que el cuerpo se aleja de la conguraci on en la que el
resorte tiene deformaci on cero (es decir donde z
1
= 0). Esto es precisamente
lo que sucede con el pendulo alrededor de los puntos de operaci on x

1
= ,
x

2
= 0, u

= 0: si z
1
= 0 entonces la fuerza de la gravedad forza al pendulo
a caer y, por tanto a alejarse cada vez m as de la conguraci on donde z
1
=
0, es decir donde x
1
= x

1
= . Este comportamiento es la comprobaci on
experimental de lo que analticamente queda demostrado al tener un polinomio
caracterstico con una raz positiva: los puntos de operaci on x

1
= , x

2
= 0,
u

= 0 son inestables.
Se recomienda consultar las secciones 11.2 (en el captulo 11), 13.2 (en el
captulo 13) y 14.4 (en el captulo 14) para ver otros ejemplos de como utilizar
las expresiones en (7.29), (7.30), (7.31) para encontrar ecuaciones de estado
lineales aproximadas de ecuaciones de estado no lineales.
7.3. Algunos resultados del algebra lineal
En esta seccion se presentan algunos resultados que son utiles para el
estudio de la tecnica de las variables de estado.
Resultado 7.1 ( [1], cap. 2) Sean w
1
, w
2
, . . . , w
n
, n vectores de n componen-
tes cada uno. Estos vectores son linealmente dependientes si y s olo si existen
n escalares
1
,
2
, . . . ,
n
, no todos cero tales que:

1
w
1
+
2
w
2
+. . . +
n
w
n
= 0 (7.37)
donde el cero del lado derecho representa un vector de n componentes todas
ellas con valor cero. Si la unica manera de satisfacer la expresi on anterior es
que
1
=
2
= . . . =
n
= 0 entonces se dice que w
1
, w
2
, . . . , w
n
, son vectores
linealmente independientes.
En la version mas simple de la dependencia lineal de vectores, dos vectores de
dos componentes son linealmente dependientes si son paralelos. Esto puede
408 7 La tecnica de las variables de estado
verse del siguiente modo. Sean w
1
y w
2
dos vectores de n = 2 componentes ca-
da uno. Estos vectores son linealmente dependientes si existen dos constantes

1
= 0 y
2
= 0 tales que:

1
w
1
+
2
w
2
= 0
lo cual signica que se puede escribir:
w
1
=

1
w
2
Notese que
1
no puede ser cero por razones obvias. Por otro lado, si
2
fuera
igual a cero entonces w
1
= 0 es la unica posibilidad por lo que no interesa este
caso y, por tanto, se supone que ambos
1
= 0 y
2
= 0. Por tanto, como el
factor
2
1
es un escalar (positivo o negativo), lo anterior signica que w
1
y
w
2
son vectores que tienen la misma direccion, es decir, que son paralelos
1
.
Cuando se tienen 3 o mas vectores, entonces la dependencia lineal signi-
ca que uno (aunque no todos) de los vectores puede ser obtenido mediante
la suma de los otros vectores cuando son amplicados convenientemente
usando las ganancias
i
(esto es lo que se conoce como combinacion lineal
de vectores). Es decir:
w
1
=

1
w
2

1
w
3
se obtiene directamente de (7.37) cuando n = 3 y
1
= 0. Como n = 3, esto
signica que w
1
, w
2
y w
3
pertenecen a un mismo plano (o una linea recta, en
el peor de los casos) que esta incrustado en un volumen (en R
3
), es decir, que
la combinacion lineal de w
1
, w
2
y w
3
no permite obtener otro vector (o vecto-
res) que no pertenezcan a dicho plano. De acuerdo a todo esto, tres vectores
de 3 componentes son linealmente independientes si la combinacion lineal de
ellos permite generar vectores que cubren por completo tres dimensiones.
Generalizando, la combinacion lineal de n vectores (de n componentes) lineal-
mente independientes cubre un espacio de n dimensiones. La combinacion
lineal de n vectores (de n componentes) linealmente dependientes cubre un
espacio con un n umero de dimensiones menor que n.
Resultado 7.2 ( [1], cap. 2, [2], cap. 10) Sea la siguiente matriz de n n:
E =
_
w
1
w
2
. . . w
n

donde w
1
, w
2
, . . . , w
n
, son n vectores columna de n componentes. Los vecto-
res w
1
, w
2
, . . . , w
n
son linealmente independientes si y s olo si la matriz E es
no singular, es decir, si y s olo si el determinante de E es diferente de cero
(det(E) = 0).
1
Algunos autores usan el termino antiparalelos para designar dos vectores que
tienen la misma direccion pero sentido contrario. En esta obra se utiliza el termino
paralelos para designar dos vectores que tienen la misma direccion sin importar
su sentido.
7.3 Algunos resultados del algebra lineal 409
Para explicar este resultado se hace uso de lo siguiente.
Resultado 7.3 ([1], cap. 2) Suponga una matriz E de n n. La unica solu-
ci on de la expresi on Ew = 0, donde w representa un vector de n componentes,
es w = 0 si y s olo si la matriz E es no singular.
Notese que la suma de vectores mostrada en (7.37) se puede escribir como:

1
w
1
+
2
w
2
+. . . +
n
w
n
=
_
w
1
w
2
. . . w
n

2
.
.
.

n
_

_
=
_

_
0
0
.
.
.
0
_

_
De acuerdo al resultado 7.3, el vector [
1

2
. . .
n
] = [0 0 . . . 0] es la unica
solucion de este sistema homogeneo si y solo si la matriz E = [w
1
w
2
. . . w
n
]
es no singular. Esto implica que los vectores w
1
, w
2
, . . . , w
n
son linealmente
independientes si y solo si det(E) = 0.
Resultado 7.4 ([1], cap. 2) El rango de una matriz E de n n es el orden
del determinante m as grande y diferente de cero que puede formarse con los
elementos de E. El rango de E es n si y s olo si E es no singular. La matriz
inversa E
1
existe si y s olo si la matriz E es no singular [2], cap. 10.
Resultado 7.5 ([1], cap. 2) Los eigenvalores de una matriz E de n n son
aquellos escalares que satisfacen:
det(I E) = 0
donde I representa la matriz identidad de n n. La expresi on det(I E)
es un polinomio de grado n en la variable y se conoce como el polinomio
caracterstico de la matriz E. Los eigenvalores de una matriz E pueden ser
n umeros reales o complejos. La matriz E tiene exactamente n eigenvalores
incluyendo aquellos que se puedan repetir.
Resultado 7.6 ([3], cap. 7) Suponga que dos matrices E y

E, ambas de nn,
se relacionan a traves de:

E = PEP
1
(7.38)
donde P es una matriz constante y no singular de n n, entonces ambas
matrices E y

E tienen los mismos eigenvalores. Esto signica que:
det(I E) = det(I

E) (7.39)
Para explicar esto es de mucha utilidad lo siguiente.
Resultado 7.7 ([4], p ag. 303) Sean D y G dos matrices de nn. Entonces:
det(DG) = det(D) det(G) (7.40)
410 7 La tecnica de las variables de estado
Como PP
1
= I y det(I) = 1, entonces usando (7.40) se encuentra que
det(P) det(P
1
) = 1, es decir det(P
1
) =
1
det(P)
. Por otro lado, de acuerdo a
(7.38), (7.40), el polinomio caracterstico de

E es:
det(I

E) = det(I PEP
1
) = det(P[I E]P
1
)
= det(P) det(I E) det(P
1
) = det(I E)
Notese que en la ultima expresion se ha recuperado (7.39), lo que comprueba
ese resultado.
Resultado 7.8 ([4], p ag. 334) Sean E y F dos matrices de nn con F = E
T
.
Los eigenvalores de F son identicos a los eigenvalores de E.
Para explicar esto es de mucha utilidad lo siguiente.
Resultado 7.9 ([2], p ag. 504) El determinante de una matriz E es igual a
la suma de los productos de los elementos de cualquier columna o rengl on de
E y sus respectivos cofactores.
Resultado 7.10 ([2], p ag. 507) Si det(D) es un determinante cualquiera
y det(G) es el determinante cuyos renglones son las columnas de det(D),
entonces det(D) = det(G).
De acuerdo a lo anterior, det(I E) puede calcularse usando, por ejemplo,
la primera columna de la matriz I E, mientras que det(I F) se puede
calcular usando, por ejemplo, el primer renglon de la matriz I F. Notese
que la primera columna de I E es igual al primer renglon de I F ya
que (I E)
T
= I F debido a que F = E
T
. Por esta misma razon, los
renglones del cofactor del elemento en el renglon i y la columna 1 en la matriz
I E son iguales a las columnas del cofactor del elemento en el renglon 1 y
la columna i en la matriz I F. Esto demuestra que E y F tienen el mismo
polinomio caracterstico, es decir que:
det(I E) = det(I F) (7.41)
y por tanto, los eigenvalores de F son iguales a los eigenvalores de E.
7.4. Solucion de una ecuacion dinamica, lineal e
invariante en el tiempo
El calculo de la solucion de la ecuacion dinamica:
x = Ax +Bu, x R
n
, u R (7.42)
y = Cx, y R (7.43)
es un problema complejo que require del manejo de conceptos avanzados de
algebra lineal y calculo que estan fuera del alcance de esta obra. Sin embargo,
7.4 Solucion de una ecuacion dinamica 411
se pueden explicar las ideas fundamentales involucradas en el procedimiento
correspondiente si se establece una analoga con el problema de resolver la
siguiente ecuacion diferencial de primer orden:
x = ax +bu, x, u R
Aplicando la transformada de Laplace se tiene:
sX(s) x(0) = aX(s) +bU(s)
donde X(s), U(s) representan, respectivamente, las transformadas de Laplace
de x y u. Esto se puede escribir del siguiente modo:
X(s) =
b
s a
U(s) +
x(0)
s a
(7.44)
Usando los pares transformados [5]:
L
_
e
at
_
=
1
s a
= G(s) (7.45)
L
__
t
0
g(t )bu()d
_
=
b
s a
U(s), (convolucion)
g(t) = L
1
{G(s)}
se encuentra que, al aplicar la transformada inversa da Laplace a (7.44), se
obtiene:
x(t) =
_
t
0
g(t )bu()d + e
at
x(0)
Finalmente, usando (7.45) de nuevo se encuentra:
x(t) = e
at
x(0) +
_
t
0
e
a(t)
bu()d, x, u, a, b R
La solucion de la ecuacion de estado en (7.42) es similar a esta ultima ecuacion
y solo se debe utilizar notacion matricial, es decir, la solucion de (7.42) es [1],
pag. 142:
x(t) = e
At
x(0) +
_
t
0
e
A(t)
Bu()d, x R
n
, u R (7.46)
donde e
At
es una matriz de n n (notese que e
A(t)
= e
Ar
|
r=t
) y a
continuacion se explica como esta dada.
Si es un eigenvalor real (positivo, negativo o cero) y no repetido de la
matriz A entonces al menos uno de lo elementos de la matriz e
At
incluye
la siguiente funcion:
ce
t
donde c es una constante real.
412 7 La tecnica de las variables de estado
Si es un eigenvalor real (positivo, negativo o cero) y repetido r veces de
la matriz A entonces cada una de las siguientes funciones:
c
0
e
t
, c
1
te
t
, c
2
t
2
e
t
, . . . , c
r1
t
r1
e
t
donde c
k
, k = 1, 2, . . . , r 1, son constantes reales, esta incluida en al
menos uno de los elementos de la matriz e
At
.
Si = a+jb es un eigenvalor complejo de la matriz A donde j =

1 con a
un n umero real (positivo, negativo o cero) y b un n umero real estrictamente
positivo, si el complejo conjugado de tambien es un eigenvalor de la
matriz A y si estos eigenvalores no estan repetidos entonces cada una de
las siguientes funciones:
ce
at
sin(bt), de
at
cos(bt)
donde c y d son constantes reales, esta incluida en al menos uno de los
elementos de la matriz e
At
.
Si = a+jb es un eigenvalor complejo de la matriz A donde j =

1 con a
un n umero real (positivo, negativo o cero) y b un n umero real estrictamente
positivo, si el complejo conjugado de tambien es un eigenvalor de la
matriz A y si estos eigenvalores estan repetidos r veces entonces cada una
de las siguientes funciones:
c
0
e
at
sin(bt), , c
1
te
at
sin(bt), c
2
t
2
e
at
sin(bt), . . . , c
r1
t
r1
e
at
sin(bt)
d
0
e
at
cos(bt), , d
1
te
at
cos(bt), d
2
t
2
e
at
cos(bt), . . . , d
r1
t
r1
e
at
cos(bt)
(7.47)
donde c
k
y d
k
, k = 1, 2, . . . , r 1, son constantes reales, esta incluida en
al menos uno de los elementos de la matriz e
At
.
Finalmente, la salida de la ecuacion dinamica en (7.42), (7.43) se calcula
usando (7.46) como:
y(t) = Ce
At
x(0) +C
_
t
0
e
A(t)
Bu()d (7.48)
7.5. Estabilidad de una ecuacion dinamica
De particular interes resulta el estudio de la estabilidad de la siguiente
ecuacion dinamica sin entrada:
x = Ex (7.49)
y = Cx
donde x R
n
, y R, E es una matriz constante de n n y C es un vec-
tor renglon constante de n componentes. Aunque una ecuacion dinamica sin
7.6 Controlabilidad y observabilidad 413
entrada puede parecer algo que no corresponde a la realidad, sin embargo en
la seccion 7.10 se muestra que una ecuacion dinamica realimentada puede ser
escrita en la forma (7.49), debido a que en un sistema realimentado la entrada
se escoge como u = Kx donde K es un vector renglon de n componentes.
Entonces, sustituyendo esta entrada en (7.42) y deniendo E = A BK se
encuentra (7.49). Esta es la principal motivacion para estudiar la estabilidad
de dicha ecuacion dinamica sin entrada.
Aunque denicion formal de la estabilidad de (7.49) es algo elaborada,
podemos simplicarla diciendo que la ecuacion dinamica (7.49) es estable si
lm
t
x(t) = 0 (y por tanto, lm
t
y(t) = 0 tambien) para cualquier estado
inicial x(0) R
n
. Esto signica que si:
x(t) =
_

_
x
1
(t)
x
2
(t)
.
.
.
x
n
(t)
_

_
entonces lm
t
x
i
(t) = 0 para toda i = 1, 2, . . . , n, y a partir de cualquier
estado inicial. De acuerdo a la solucion encontrada en (7.46), la solucion de
(7.49) se encuentra usando u = 0 y A = E en (7.46), es decir:
x(t) = e
Et
x(0)
Como x(0) es un vector constante, la expresion anterior implica que si se ha de
conseguir que lm
t
x(t) = 0 entonces se debe conseguir que lm
t
e
Et
= 0
donde el 0 representa una matriz de n n con todos sus elementos iguales
a cero. De acuerdo a lo expuesto en la seccion previa a cerca de como estan
formados los elementos de la matriz e
At
(recuerde que A = E) se llega a la
siguiente conclusion:
Teorema 7.1 ([1], p ag. 409) La soluci on de (7.49) satisface lm
t
x(t) = 0,
sin importar cual sea el estado inicial x(0), si y s olo si todos los eigenvalores
de la matriz E tienen parte real estrictamente negativa. Se dice que bajo estas
condiciones el origen x = 0 de (7.49) es globalmente asint oticamente estable.
Para comprobar esto es de mucha utilidad recordar que en la seccion 3.5
del captulo 3 se ha demostrado que
lm
t
t
j
e
pt
= 0
para cualquier j > 0 entero y cualquier n umero real p < 0.
7.6. Controlabilidad y observabilidad
Dos propiedades importantes de la ecuacion dinamica
414 7 La tecnica de las variables de estado
x = Ax +Bu, x R
n
, u R (7.50)
y = Cx, y R (7.51)
que seran utilizadas a lo largo de este captulo son la controlabilidad y la
observabilidad. A continuacion se denen y estudian estas propiedades.
7.6.1. Controlabilidad
Denicion 7.2 ([1], p ag. 176) Una ecuaci on de estado es controlable en el
instante t
0
si existe un tiempo nito t
1
> t
0
tal que dados cualquiera dos
estados x
0
y x
1
existe una entrada u que aplicada desde t = t
0
hasta t = t
1
consigue trasferir el estado desde x
0
en t = t
0
hasta x
1
en t = t
1
. De otro
modo la ecuaci on de estado es no controlable.
Notese que esta denicion no especica la trayectoria que se deba seguir
para transferir el estado desde x
0
hasta x
1
por lo que queda en total liber-
tad. Ademas, no es necesario que el estado del sistema permanezca en x
1
para instantes posteriores a t
1
. Notese tambien que la controlabilidad es una
propiedad que solo tiene que ver con la entrada, es decir con la ecuacion de
estado, por lo que la ecuacion de salida no juega ning un papel. Finalmente,
esta denicion es muy general pues tambien considera la posibilidad de que
la ecuacion de estado sea variante en el tiempo, es decir, que los elementos de
A y B sean funciones del tiempo.
En el caso de una ecuacion de estado invariante en el tiempo como la
mostrada en (7.50), es decir cuando los elementos de A y B son constantes, si
la ecuacion de estado es controlable entonces lo es para cualquier t
0
0 y el
instante t
1
es cualquier valor tal que t
1
> t
0
, es decir, la transferencia desde x
0
a x
1
puede ser realizada en cualquier intervalo de tiempo de duracion no zero.
Esto permite obtener una manera muy simple de vericar si una ecuacion de
estado es controlable:
Teorema 7.2 ([6], p ag. 145) La ecuaci on de estado en (7.50) es controlable si
y s olo si cualquiera de las dos siguientes condiciones equivalentes se satisface:
1. La siguiente matriz de n n:
W
c
(t) =
_
t
0
e
A
BB
T
_
e
A
_
T
d =
_
t
0
e
A(t)
BB
T
_
e
A(t)
_
T
d
(7.52)
es no singular para cualquier t > 0.
2. La matriz de controlabilidad de n n:
_
B AB A
2
B A
n1
B

(7.53)
tiene rango igual a n, es decir, su determinante es diferente de cero.
7.6 Controlabilidad y observabilidad 415
La razon de este resultado puede explicarse a grandes rasgos del siguiente
modo. La siguiente entrada:
u(t) = B
T
_
e
A(t1t)
_
T
W
1
c
(t
1
)[e
At1
x
0
x
1
] (7.54)
transere el estado del sistema desde x
0
= x(0) en t
0
= 0 hasta x
1
en t
1
> 0.
Esto se puede vericar sustituyendo en la solucion presentada en (7.46), pero
evaluada en t = t
1
, es decir:
x(t
1
) = e
At1
x(0) +
_
t1
0
e
A(t1)
Bu()d
la entrada en (7.54), pero evaluada en t = , es decir:
u() = B
T
_
e
A(t1)
_
T
W
1
c
(t
1
)[e
At1
x
0
x
1
]
para obtener:
x(t
1
) = e
At1
x(0)
+
_
t1
0
e
A(t1)
B
_
B
T
_
e
A(t1)
_
T
W
1
c
(t
1
)[e
At1
x
0
x
1
]
_
d
= e
At1
x(0)

__
t1
0
e
A(t1)
BB
T
_
e
A(t1)
_
T
d
_
. .
Wc(t1)
W
1
c
(t
1
)[e
At1
x
0
x
1
]
= x
1
Notese que este resultado necesita que la matriz W
c
(t) de n n denida
en (7.52) sea no singular (para que W
1
c
(t
1
) exista), lo cual es cierto para
cualquier t
1
= t > 0 si la ecuacion dinamica es controlable. El hecho de que
t
1
sea cualquier instante positivo signica que el estado puede pasar de x
0
a
x
1
en cualquier intervalo de tiempo de duracion no cero.
Por otro lado, la igualdad en (7.52) se puede comprobar del siguiente modo.
Defnase v = t , entonces:
_
t
0
e
A(t)
BB
T
_
e
A(t)
_
T
d =
_
=t
=0
e
A(t)
BB
T
_
e
A(t)
_
T
d
=
_
v=0
v=t
e
Av
BB
T
_
e
Av
_
T
(dv)
=
_
v=t
v=0
e
Av
BB
T
_
e
Av
_
T
dv
lo cual comprueba la igualdad en (7.52) si se usa en lugar de v en la ultima
integral, lo cual es valido porque el uso de v o de como variable de integracion
en la ultima integral no afecta el resultado.
416 7 La tecnica de las variables de estado
Finalmente, el hecho de que el rango n de la matriz en (7.53) sea una
condicion equivalente a la no singularidad de W
c
(t) es de mucha utilidad
porque es mas facil vericar que (7.53) tenga rango n que la no singularidad
de W
c
(t).
7.6.2. Observabilidad
Denicion 7.3 ([1], p ag. 193) Una ecuaci on din amica es observable en el
instante t
0
si existe un tiempo nito t
1
> t
0
tal que para cualquier estado
desconocido x
0
en t = t
0
, es suciente el conocimiento de la entrada u y de la
salida y sobre el intervalo de tiempo [t
0
, t
1
] para determinar de manera unica
el estado x
0
. De otro modo la ecuaci on din amica es no observable.
Notese que la observabilidad es una propiedad que tiene que ver con la
posibilidad de conocer el estado (interno al sistema) a partir unicamente del
conocimiento de mediciones externas al sistema, es decir a partir de la entrada
y de la salida. Notese tambien que esta denicion es muy general pues tambien
considera la posibilidad de que la ecuacion de estado sea variante en el tiempo,
es decir, que los elementos de A, B y C sean funciones del tiempo. En el caso
de una ecuacion dinamica invariante en el tiempo como la mostrada en (7.50),
(7.51), es decir cuando los elementos de A, B y C son constantes, si la ecuacion
de estado es observable entonces lo es para cualquier t
0
0 y el instante t
1
es cualquier valor tal que t
1
> t
0
, es decir, la determinacion del estado inicial
puede ser conseguida en cualquier intervalo de tiempo de duracion no zero.
Esto permite obtener una manera muy simple de vericar si una ecuacion de
estado es observable:
Teorema 7.3 ([6], p ag. 155,156) La ecuaci on din amica en (7.50), (7.51), es
observable si y s olo si cualquiera de las dos siguientes condiciones equivalentes
se satisface:
1. La siguiente matriz de n n:
W
o
(t) =
_
t
0
_
e
A
_
T
C
T
Ce
A
d (7.55)
es no singular para cualquier t > 0.
2. La matriz de observabilidad de n n:
_

_
C
CA
CA
2
.
.
.
CA
n1
_

_
(7.56)
tiene rango igual a n, es decir, su determinante es diferente de cero.
7.6 Controlabilidad y observabilidad 417
La razon de este resultado puede explicarse a grandes rasgos del siguiente
modo. Considere la solucion dada en (7.48) y dena:
y(t) = Ce
At
x(0) (7.57)
= y(t) C
_
t
0
e
A(t)
Bu()d (7.58)
Notese que de acuerdo a (7.58) la funcion y(t) se puede calcular a partir del
conocimiento exclusivo de la entrada y de la salida. Multiplicando ambos lados
de (7.57) por
_
e
At
_
T
C
T
e integrando sobre [0, t
1
] se obtiene:
__
t1
0
_
e
At
_
T
C
T
Ce
At
dt
_
. .
Wo(t1)
x(0) =
_
t1
0
_
e
At
_
T
C
T
y(t)dt
Si la matriz W
o
(t
1
) es no singular, lo cual es cierto si el sistema es observable,
entonces el estado inicial x(0) = x
0
se puede calcular de manera unica como:
x
0
= W
1
o
(t
1
)
_
t1
0
_
e
At
_
T
C
T
y(t)dt
Notese que este resultado necesita que la matriz W
o
(t) de n n denida
en (7.55) sea no singular (para que W
1
o
(t
1
) exista), lo cual es cierto para
cualquier t
1
= t > 0 si la ecuacion dinamica es observable. El hecho de que t
1
sea cualquier instante positivo signica que el estado x
0
puede ser calculado
con la informacion obtenida desde la entrada y desde la salida en cualquier
intervalo de tiempo de duracion no cero.
Finalmente, el hecho de que el rango n de la matriz en (7.56) sea una
condicion equivalente a la no singularidad de W
o
(t) es de mucha utilidad
porque es mas facil vericar que (7.56) tenga rango n que la no singularidad
de W
o
(t).
Ejemplo 7.4 Una manera de estimar el estado actual x(t) (y no el estado
inicial x(0)) es utilizando mediciones de la salida y de la entrada as como
algunas de sus derivadas respecto al tiempo. A continuaci on se muestra que
una condici on necesaria para este c alculo es, de nuevo, que la matriz en (7.56)
tenga rango n. Considere la ecuaci on din amica en (7.50), (7.51). Las primeras
n 1 derivadas de la salida se obtienen como:
y = Cx,
y = C x = CAx +CBu,
y = CA x +CB u = CA
2
x +CABu +CB u,
y
(3)
= CA
2
x +CAB u +CB u = CA
3
x +CA
2
Bu +CAB u +CB u,
.
.
.
418 7 La tecnica de las variables de estado
y
(i)
= CA
i
x +CA
i1
Bu +CA
i2
B u + +CBu
(i1)
,
.
.
.
y
(n1)
= CA
n1
x +CA
n2
Bu +CA
n3
B u + +CBu
(n2)
donde el exponente entre parentesis representa el orden de la derivada respecto
al tiempo. Acomodando matricialmente estas expresiones:

Y = Dx(t) +

U
donde:

Y =
_

_
y
y
y
y
(3)
.
.
.
y
(n1)
_

_
, D =
_

_
C
CA
CA
2
CA
3
.
.
.
CA
n1
_

_
,

U =
_

_
0
CBu
CABu +CB u
CA
2
Bu +CAB u +CB u
.
.
.
CA
n2
Bu +CA
n3
B u + +CBu
(n2)
_

_
Por tanto, si la matriz en (7.56) tiene rango n entonces la matriz D de nn
es invertible y el estado actual se puede calcular como:
x(t) = D
1
(

Y

U) (7.59)
es decir, utilizando unicamente mediciones de la salida y la entrada as como
algunas de las derivadas respecto al tiempo de estas variables. La gran desven-
taja de esta manera de calcular el valor del estado x(t) es que generalmente las
mediciones de cualquier variable est an contaminadas de ruido en la pr actica
y este problema es m as grave conforme se calculan derivadas de orden mayor
a partir de estas mediciones. Esta es la raz on por la que (7.59) no se utiliza
para calcular el estado x(t) y se preeren metodos como el presentado en la
secci on 7.11.
7.7. Funcion de transferencia de una ecuacion dinamica
Sea la siguiente ecuacion dinamica de una entrada-una salida:
x = Ax +Bu (7.60)
y = Cx
7.7 Funcion de transferencia de una ecuacion dinamica 419
donde x R
n
, u R, y R son funciones del tiempo, A es una matriz
constante de n n, B es un vector columna constante de n componentes y C
es un vector renglon constante de n componentes. Aplicando la transformada
de Laplace a (7.60) se obtiene:
sX(s) x(0) = AX(s) +BU(s) (7.61)
Y (s) = CX(s) (7.62)
donde X(s), Y (s), U(s) representan, respectivamente, la transformada de La-
place del vector de estado x, de la salida escalar y y de la entrada escalar
u mientas que x(0) es el valor inicial del estado x. Recuerdese que dado un
vector x = [x
1
, x
2
, . . . , x
n
]
T
que es funcion del tiempo, su transformada de
Laplace se obtiene aplicando esta operacion a cada elemento de dicho vector,
es decir [3], cap. 4:
X(s) =
_

_
L{x
1
}
L{x
2
}
.
.
.
L{x
n
}
_

_
Una funcion de transferencia siempre se dene bajo la suposicion de condicio-
nes iniciales cero. Sustituyendo x(0) = 0 en (7.61) y despejando X(s):
X(s) = (sI A)
1
BU(s) (7.63)
donde I representa la matriz identidad de nn. Sustituyendo (7.63) en (7.62)
se obtiene:
Y (s)
U(s)
= G(s) = C(sI A)
1
B (7.64)
Notese que la funcion de transferencia G(s) dada en (7.64) es un escalar. Ahora
se procede a analizar dicha funcion de transferencia. Con el n de presentar
una exposicion mas clara de las ideas, a continuacion se supone que n = 3, es
decir que A es una matriz de 3 3, I es una matriz identidad de 3 3 y que
B y C son vectores columna y renglon, respectivamente, de 3 componentes:
A =
_
_
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
_
_
, B =
_
_
b
1
b
2
b
3
_
_
, C =
_
c
1
c
2
c
3

Sin embargo, el lector puede darse cuenta de que el mismo procedimiento es


valido para cualquier valor arbitrario de n. Primero calc ulese la matriz:
sI A =
_
_
s a
11
a
12
a
13
a
21
s a
22
a
23
a
31
a
32
s a
33
_
_
420 7 La tecnica de las variables de estado
cuya matriz inversa esta dada de acuerdo a la formula (sI A)
1
=
Adj(sIA)
det(sIA)
donde [2], cap. 10:
Adj(sI A) = Cof
T
(sI A) =
_
_
Cof
11
Cof
12
Cof
13
Cof
21
Cof
22
Cof
23
Cof
31
Cof
32
Cof
33
_
_
T
donde Cof(sI A) es la matriz de cofactores de sI A y Cof
ij
= (1)
i+j
M
ij
y M
ij
es el determinante de (n 1) (n 1), es decir de 2 2, que queda
al eliminar el renglon i y la columna j del determinante de la matriz sI A
[2], cap. 10. Calculando explcitamente estos elementos se puede observar que
Cof
ij
es un polinomio de s cuyo grado es estrictamente menor que n = 3. Por
otro lado, desarrollando a traves del primer renglon se encuentra que:
det(sI A) = (s a
11
)

s a
22
a
23
a
32
s a
33

+a
12

a
21
a
23
a
31
s a
33

a
13

a
21
s a
22
a
31
a
32

es decir, det(sI A) es un polinomio de s de grado igual a n = 3. A partir de


estas observaciones se concluye que todos los elementos de la matriz:
(sI A)
1
=
Adj(sI A)
det(sI A)
=
_
_
Inv
11
Inv
12
Inv
13
Inv
21
Inv
22
Inv
23
Inv
31
Inv
32
Inv
33
_
_
estan dados como el cociente de dos polinomios de s de manera que el polino-
mio del numerador es de grado estrictamente menor que n = 3 y el polinomio
del denominador es, para todos los elementos de (sI A)
1
, un polinomio de
grado n = 3 que esta dado como det(sI A).
Por otro lado, el producto (sI A)
1
B es un vector columna de n = 3
componentes. Cada uno de estos componentes se obtiene como:
(sI A)
1
B =
_
_
d
1
d
2
d
3
_
_
=
_
_
Inv
11
b
1
+Inv
12
b
2
+Inv
13
b
3
Inv
21
b
1
+Inv
22
b
2
+Inv
23
b
3
Inv
31
b
1
+Inv
32
b
2
+Inv
33
b
3
_
_
De acuerdo a lo expuesto en el parrafo anterior sobre la manera en que esta da-
do cada uno de los elementos Inv
ij
de la matriz (sI A)
1
y recurriendo a
la suma de fracciones con el mismo denominador, se concluye que cada uno
de los elementos d
i
del vector columna (sI A)
1
B tambien esta dado como
el cociente de dos polinomios de s de manera que el polinomio del numerador
tiene grado estrictamente menor que n = 3 mientras que el polinomio del
denominador es det(sI A) que tiene grado igual a n = 3. Finalmente, se
encuentra lo siguiente:
C(sI A)
1
B = c
1
d
1
+c
2
d
2
+c
3
d
3
7.7 Funcion de transferencia de una ecuacion dinamica 421
Razonando de manera similar es posible concluir lo siguiente, lo cual es valido
para cualquier valor de n:
Resultado 7.11 ( [1], caps. 6, 7) La funci on de transferencia dada en (7.64)
es un escalar que est a dado como el cociente de dos polinomios de s de manera
que el polinomio del numerador tiene grado estrictamente menor que n y el
polinomio del denominador es igual a det(sI A) el cual tiene grado igual a
n, es decir:
Y (s)
U(s)
= G(s) = C(sI A)
1
B =
b
m
s
m
+b
m1
s
m1
+ +b
1
s +b
0
s
n
+a
n1
s
n1
+ +a
1
s +a
0
(7.65)
det(sI A) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
para algunas constantes reales b
k
, a
l
, k = 0, 1, . . . , m, l = 0, 1, . . . , n 1, con
n > m.
Sin embargo, para que esta armacion sea cierta es necesario incluir la
siguiente condicion adicional [1], cap 7:
Condicion 7.1 La ecuaci on din amica en (7.60) debe ser controlable, es decir,
el determinante de la matriz en (7.53) debe ser diferente de cero.
Si ademas se cumple lo siguiente, entonces los polinomios b
m
s
m
+b
m1
s
m1
+ +b
1
s +b
0
y s
n
+a
n1
s
n1
+ +a
1
s +a
0
no tienen races comunes [1],
cap 6:
Condicion 7.2 La ecuaci on din amica en (7.60) es observable, es decir, el
determinante de la matriz en (7.56) es diferente de cero.
Ejemplo 7.5 Con el n de poner en pr actica estas ideas, a continuaci on se
considera un caso sencillo: un motor de CD. En el captulo 9 se muestra que
el modelo de un motor de CD es el siguiente (vease (9.8)):
J

+b

= n k
m
i

(7.66)
cuando no existe perturbaci on externa. Adem as, se puede considerar que la
corriente electrica i

es la se nal de entrada cuando se utiliza un lazo interno


de corriente de alta ganancia. Deniendo las variables de estado como la
posici on y la velocidad, no es difcil darse cuenta de que se obtiene la siguiente
ecuaci on din amica:
x = Ax +Bu, y = Cx (7.67)
x =
_
x
1
x
2
_
=
_

_
, A =
_
0 1
0
b
J
_
, B =
_
0
nkm
J
_
, u = i

donde C es un vector rengl on que se denir a m as adelante dependiendo de la


salida que se desee considerar. N otese que la siguiente matriz:
422 7 La tecnica de las variables de estado
_
B AB

=
_
0
nkm
J
nkm
J

nkm
J
b
J
_
tiene rango n = 2 ya que su determinante es igual a
_
nkm
J
_
2
= 0. A partir
de las deniciones en (7.67) se obtienen los siguientes resultados:
sI A =
_
s 1
0 s +
b
J
_
, det(sI A) = s
_
s +
b
J
_
,
Cof(sI A) =
_
s +
b
J
0
1 s
_
, Adj(sI A) = Cof
T
(sI A) =
_
s +
b
J
1
0 s
_
,
(sI A)
1
=
Adj(sI A)
det(sI A)
=
1
s(s +
b
J
)
_
s +
b
J
1
0 s
_
Para obtener la funci on de transferencia correspondiente se considerar an los
siguientes dos casos:
La salida es la posici on, es deicr y = = x
1
= Cx, donde C = [1 0].
Entonces:
G(s) = C(sI A)
1
B =
_
1 0

1
s(s +
b
J
)
_
s +
b
J
1
0 s
_ _
0
nkm
J
_
G(s) =
nkm
J
s(s +
b
J
)
N otese que en este caso la siguiente matriz:
_
C
CA
_
=
_
1 0
0 1
_
tiene rango igual a n = 2 ya que su determinante es igual a la unidad, es
decir, es diferente de cero.
La salida es la velocidad, es decir y =

= x
2
= Cx, donde C = [0 1].
Entonces:
G(s) = C(sI A)
1
B =
_
0 1

1
s(s +
b
J
)
_
s +
b
J
1
0 s
_ _
0
nkm
J
_
G(s) =
nkm
J
s
s(s +
b
J
)
En este caso la siguiente matriz:
_
C
CA
_
=
_
0 1
0
b
J
_
tiene rango menor que n = 2 ya que su determinante es igual a cero.
7.8 Funcion de transferencia y ecuacion dinamica 423
N otese que en ambos casos la funci on de transferencia obtenida cumple con lo
establecido en (7.65): que el polinomio del denominador es igual a det(sI A).
N otese tambien que esto es cierto gracias a que la matriz [B AB] tiene ran-
go igual a n = 2 en ambos casos. Finalmente, se puede apreciar el efecto de
que el sistema sea o no observable: en el segundo de los casos el sistema no
es observable y por ello la funci on de transferencia correspondiente tiene un
polo y un cero que se cancelan lo cual no ocurre en el primero de los casos
porque es observable. Dicha cancelaci on polo-cero en el segundo de los casos
trae como consecuencia que la funci on de transferencia sea de primer orden
lo cual signica que s olo uno de los estados (la velocidad) es descrito por la
correspondiente funci on de transferencia. Es decir, la posici on del motor no
tiene ning un efecto cuando se trata de controlar la velocidad del motor. De
esta manera se puede dar una nueva interpretaci on a la observabilidad, co-
mo se explica a continuaci on. Cuando la salida es la posici on, el sistema es
observable porque conociendo la posici on se puede calcular la velocidad (que
es la otra variable de estado) derivando la posici on, por ejemplo. Pero si la
salida es la velocidad el conocimiento de esta variable no es suciente para
conocer la posici on (que es la otra variable de estado) como se explica a conti-
nuaci on. Aunque se podra argumentar que la posici on (t) se puede calcular
simplemente integrando la velocidad

sin embargo, de acuerdo a:
(t) (0) =
_
t
0

(r)dr
adem as de conocer la velocidad es necesario conocer la posici on inicial (0) la
cual es desconocida. Por esto, el sistema no es observable cuando la velocidad
es la salida. Sin embargo, como ya se mencion o, si lo unico que se desea es
controlar la velocidad esto no trae ning un problema porque para eso no se
necesita conocer la posici on. As que la observabilidad es importante en otro
tipo de problemas que se abordar an m as adelante (secciones 7.11 y 7.12).
Finalmente, el lector puede comprobar la exactitud de estos resultados com-
parando estas funciones de transferencia con las obtenidas en los captulos 9
y 10.
7.8. Una de las ecuaciones dinamicas que corresponden
a una funcion de transferencia
Una de las caractersticas de la representacion en variables de estado es que
no es unica. Es decir, dado un mismo sistema fsico existen muchas ecuaciones
dinamicas que lo representan correctamente. Esto signica tambien que dada
una funcion de transferencia existen muchas ecuaciones dinamicas que la re-
presentan correctamente. A continuacion se muestra la manera de obtener una
de esas ecuaciones dinamicas. Considere la siguiente funcion de transferencia:
Y (s)
U(s)
= G(s) =
b
m
s
m
+b
m1
s
m1
+ +b
1
s +b
0
s
n
+a
n1
s
n1
+ +a
1
s +a
0
(7.68)
424 7 La tecnica de las variables de estado
Despejese la salida:
Y (s) =
b
m
s
m
+b
m1
s
m1
+ +b
1
s +b
0
s
n
+a
n1
s
n1
+ +a
1
s +a
0
U(s)
Defnase la nueva variable:
V (s) =
1
s
n
+a
n1
s
n1
+ +a
1
s +a
0
U(s) (7.69)
para escribir:
Y (s) = (b
m
s
m
+b
m1
s
m1
+ +b
1
s +b
0
)V (s) (7.70)
Considere la expresion (7.69). Pasando el denominador multiplicando al la-
do izquierdo, aplicando la transformada inversa de Laplace y despejando la
derivada de mayor orden se obtiene:
v
(n)
= a
n1
v
(n1)
a
1
v a
0
v +u (7.71)
donde V (s) = L{v}. De acuerdo a lo expuesto en la seccion 7.1, defnanse las
variables de estado como la incognita de la ecuacion diferencial (7.71), v, y
sus primeras n 1 derivadas:
x
1
= v, x
2
= v, x
3
= v, . . . , x
n
= v
(n1)
(7.72)
Entonces, (7.71) se puede escribir como:

x
n
= a
n1
x
n
a
1
x
2
a
0
x
1
+u (7.73)
Por otro lado, aplicando la transformada inversa de Laplace a (7.70) se obtiene:
y = b
m
v
(m)
+b
m1
v
(m1)
+ +b
1
v +b
0
v
Si se considera que m toma su valor maximo, es decir m = n 1 (recuerdese
que n > m) entonces puede usarse (7.72) para escribir:
y = b
n1
x
n
+b
n2
x
n1
+ +b
1
x
2
+b
0
x
1
(7.74)
Usando (7.72), (7.73) y (7.74) se obtiene:

x =

A x +

Bu (7.75)
y =

C x

A =
_

_
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0 1
a
0
a
1
a
2
a
3
a
n2
a
n1
_

_
,

B =
_

_
0
0
0
0
.
.
.
0
1
_

_
,

C =
_
b
0
b
1
b
2
b
3
b
n2
b
n1

,
x =
_
x
1
x
2
x
3
x
4
x
n1
x
n

T
7.9 Ecuaciones dinamicas equivalentes 425
La expresion (7.75) representa una ecuacion dinamica que corresponde a la
funcion de transferencia dada en (7.68) y se dice que esta en la forma canonica
de controlabilidad. Como se vera mas adelante la forma canonica de controla-
bilidad es muy util para dise nar un controlador por realimentacion del estado.
7.9. Ecuaciones dinamicas equivalentes
En la seccion 7.7 se ha mostrado a que cualquier ecuacion dinamica de una
entrada y una salida que sea controlable y que cuya forma sea la mostrada en
(7.60) le corresponde una funcion de transferencia de la forma presentada en
(7.65). Notese que el requisito de la observabilidad solo sirve para asegurar que
no hay cancelaciones de polos y ceros en la funcion de transferencia (7.65).
Por otro lado, en la seccion 7.8 se ha mostrado que cualquier funcion de
transferencia de la forma (7.65) puede escribirse en la forma de la ecuacion
dinamica mostrada en (7.75). Esto signica que cada una de las ecuaciones
dinamicas en (7.60) y (7.75) puede ser obtenida a partir de la otra, es decir,
que ambas son equivalentes.
A continuacion se muestra como pasar de (7.60) a (7.75), y viceversa, sin
necesidad del paso intermedio de una funcion de transferencia. Considere la
ecuacion dinamica (7.60) de una entrada y una salida y dena la siguiente
transformacion lineal:
x = Px (7.76)
donde P es una matriz constante de nn que se dene a partir de su inversa
como se indica a continuacion [1], cap. 7:
P
1
=
_
q
1
q
n2
q
n1
q
n

, (7.77)
q
n
= B,
q
n1
= AB +a
n1
B,
q
n2
= A
2
B +a
n1
AB +a
n2
B,
.
.
.
q
1
= A
n1
B +a
n1
A
n2
B + +a
1
B
det(sI A) = s
n
+a
n1
s
n1
+ +a
1
s +a
0
Es importante subrayar que la matriz P
1
es invertible, es decir, su inversa
P siempre existe si la matriz denida en (7.53) tiene rango n [1], cap. 7, es
decir si (7.60) es controlable. Esto puede explicarse del siguiente modo. Si
la matriz denida en (7.53) tiene rango n, es decir todas sus columnas son
linealmente independientes, entonces cuando sus columnas se suman como en
las expresiones anteriores que denen a los vectores q
1
, . . . , q
n2
, q
n1
, q
n
, las
columnas q
1
, . . . , q
n2
, q
n1
, q
n
resultan ser linealmente independientes. Esto
426 7 La tecnica de las variables de estado
signica que el determinante de P
1
es diferente de cero y, por tanto, su
inversa P existe. Usando (7.76) en (7.60), es decir

x = P x, se obtiene:

x =

A x +

Bu
y =

C x

A = PAP
1
,

B = PB,

C = CP
1
(7.78)
La matriz

A y los vectores

B,

C en (7.78) estan dados como en la forma
canonica de controlabilidad (7.75) sin importar la forma que tengan A, B y
C mientras la matriz denida en (7.53) tenga rango n. La demostracion de
esta ultima armacion requiere de herramientas matematicas que estan fuera
del alcance de este libro y por ello no se presenta. Se recomienda consultar la
referencia [1] para una solucion completa de este problema. El lector puede
vericar estas ideas proponiendo valores numericos para las matrices A, B, C
y realizando los calculos correspondientes. Esto signica que cada una de las
ecuaciones dinamicas (7.60) y (7.75) puede ser obtenida a partir de la otra y
que la relacion entre las matrices involucradas esta dada por (7.78), es decir,
que ambas son equivalentes. Notese que la condicion fundamental para que
exista esta equivalencia es que la matriz denida en (7.53) tenga rango n [1],
cap 5. Esto se resume del siguiente modo:
Teorema 7.4 ([1], cap. 7) Si (7.60) es controlable, entonces esta ecuaci on
din amica es equivalente a (7.75) mediante la transformaci on lineal (7.76),
(7.77), es decir, a traves de (7.78).
Ejemplo 7.6 En el captulo 13 se obtiene la aproximaci on lineal de un me-
canismo conocido como el pendulo de Furuta. Este modelo se presenta en
(13.13), (13.14), y a continuaci on se reescribe para facilitar la referencia:
z = Az +Bv (7.79)
A =
_

_
0 1 0 0
0 0
gm
2
1
l
2
1
L0
I0(J1+m1l
2
1
)+J1m1L
2
0
0
0 0 0 1
0 0
(I0+m1L
2
0
)m1l1g
I0(J1+m1l
2
1
)+J1m1L
2
0
0
_

_
, B =
_

_
0
J1+m1l
2
1
I0(J1+m1l
2
1
)+J1m1L
2
0
0
m1l1L0
I0(J1+m1l
2
1
)+J1m1L
2
0
_

_
k
m
r
a
Para facilitar la manipulaci on algebraica se denen las siguientes constantes:
a =
gm
2
1
l
2
1
L
0
I
0
(J
1
+m
1
l
2
1
) +J
1
m
1
L
2
0
, b =
(I
0
+m
1
L
2
0
)m
1
l
1
g
I
0
(J
1
+m
1
l
2
1
) +J
1
m
1
L
2
0
c =
J
1
+m
1
l
2
1
I
0
(J
1
+m
1
l
2
1
) +J
1
m
1
L
2
0
k
m
r
a
, d =
m
1
l
1
L
0
I
0
(J
1
+m
1
l
2
1
) +J
1
m
1
L
2
0
k
m
r
a
La siguiente matriz tiene la forma:
C
o
=
_
B AB A
2
B A
3
B

=
_

_
0 c 0 ad
c 0 ad 0
0 d 0 bd
d 0 bd 0
_

_
7.9 Ecuaciones dinamicas equivalentes 427
Despues de un desarrollo algebraico sencillo, aunque laborioso, se obtiene:
det(C
o
) =
m
4
1
l
4
1
L
2
0
g
2
[I
0
(J
1
+m
1
l
2
1
) +J
1
m
1
L
2
0
]
4
k
4
m
r
4
a
= 0 (7.80)
Por tanto, la ecuaci on din amica en (7.79) es controlable para cualquier con-
junto de par ametros del pendulo de Furuta. Es decir, este resultado no cambia
si el mecanismo con el que se cuenta es grande o peque no o si es ligero o pe-
sado. Esto signica que la matriz P introducida en (7.76) es no singular y a
continuaci on es construida utilizando la f ormula presentada en (7.77). Para
simplicar los c alculos se utilizar an los siguientes valores numericos:
I
0
= 1.137 10
3
[kgm
2
], J
1
= 0.38672 10
3
[kgm
2
], g = 9.81[m/s
2
]
l
1
= 0.1875[m], m
1
= 0.033[kg], L
0
= 0.235[m],
k
m
r
a
= 0.0215[Nm/V]
que corresponden a los par ametros del pendulo de Furuta que es construido y
controlado en el captulo 13. Con estos valores se encuentra:
A =
_

_
0 1 0 0
0 0 35.81 0
0 0 0 1
0 0 72.90 0
_

_
, B =
_

_
0
13.4684
0
12.6603
_

_
Con estos datos, y calculando numericamente, se encuentra que las races del
polinomio det(I A) son:

1
= 0,
2
= 0,
3
= 8.5381,
4
= 8.5381
Entonces se realiza el producto:
(
1
)(
2
)(
3
)(
4
) =
4
+a
3

3
+a
2

2
+a
1
+a
0
de donde se encuentra, al igualar coecientes:
a
3
= 0, a
2
= 72.8992, a
1
= 0, a
0
= 0 (7.81)
Usando estos valores en (7.77) se encuentra:
P
1
=
_

_
527.8686 0 13.4600 0
0 527.8686 0 13.4600
0.0101 0 12.6600 0
0 0.0101 0 12.6600
_

_
y, por tanto:
P =
_

_
0.0019 0 0.0020 0
0 0.0019 0 0.0020
0.0000 0 0.0790 0
0 0.0000 0 0.0790
_

_
(7.82)
428 7 La tecnica de las variables de estado
Finalmente, con el n de comprobar las expresiones en (7.78) se realizan los
siguientes productos:
PAP
1
=
_

_
0 1.0000 0 0
0.0008 0 1.0000 0
0 0 0 1.0000
0.0583 0 72.8992 0
_

_
, PB =
_

_
0
0
0
1
_

_
N otese que, una vez que se identican y eliminan algunos errores numericos,
estas matrices tienen exactamente la forma presentada en (7.75) para

A =
PAP
1
y

B = PB.
7.10. Control por realimentacion del estado
Considere la ecuacion de estado de una entrada una salida presentada en
(7.60) en lazo cerrado con el siguiente controlador:
u = Kx = (k
1
x
1
+k
2
x
2
+. . . +k
n
x
n
) (7.83)
K =
_
k
1
k
2
. . . k
n

donde k
i
, i = 1, . . . , n, son n escalares constantes. Sustituyendo (7.83) en
(7.60) se obtiene:
x = (ABK)x (7.84)
Al igual que (7.49), la ecuacion dinamica en (7.84) no tiene entrada. Por tanto,
el criterio de estabilidad establecido para (7.49) es aplicable a (7.84). Esto sig-
nica que el vector x(t) solucion de (7.84) satisface lm
t
x(t) = 0 si y solo
si todos los eigenvalores de la matriz ABK tienen parte real estrictamente
negativa. Sin embargo, desde el punto de vista de una aplicacion practica esto
no es suciente debido a que, ademas, se requiere un buen desempe no del
sistema en lazo cerrado. Es importante subrayar que la forma de la respuesta
x(t) de la ecuacion en (7.84) depende de la ubicacion de los eigenvalores de
A BK. Por tanto, los eigenvalores de la matriz A BK deben poder ser
asignados en donde se desee. Esto se indica diciendo que tales eigenvalores de-
ben poder ser asignados arbitrariamente. Dado que el vector renglon K puede
seleccionarse a voluntad, es de interes saber como seleccionar K de manera
que los eigenvalores de ABK queden asignados en donde se especique. A
continuacion se presenta la solucion a este problema.
Considere la transformacion lineal (7.76), (7.77) y sustit uyala en (7.84)
para obtener:

x =

A x

B

K x (7.85)

K = KP
1
7.10 Control por realimentacion del estado 429
con

A y

B dados como en (7.78) y (7.75). Notese que

K x es un escalar dado
como:

K x =

k
1
x
1
+

k
2
x
2
+. . . +

k
n
x
n
,

K =
_

k
1

k
2
. . .

k
n

que, de acuerdo a (7.75), solo afecta el ultimo renglon de (7.85) la cual, por
tanto, puede escribirse como:

x = (

A

B

K) x,

A

B

K =
_

_
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0 1

k
1
a
0

k
2
a
1

k
3
a
2

k
4
a
3

k
n1
a
n2

k
n
a
n1
_

_
Entonces, si se selecciona:

K =
_
a
0
a
0
a
1
a
1
. . . a
n1
a
n1

(7.86)
se consigue:

A

B

K =
_

_
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0 1
a
0
a
1
a
2
a
3
a
n2
a
n1
_

_
Notese que de acuerdo a (7.78) y (7.85) se puede escribir:

A

B

K = PAP
1
PBKP
1
= P(ABK)P
1
(7.87)
Es decir, las matrices

A

B

K y ABK satisfacen (7.38) por lo que ambas
tienen los mismos eigenvalores. De acuerdo a lo visto en las secciones previas,
los eigenvalores de

A

B

K satisfacen:
det(I [

A

B

K]) =
n
+ a
n1

n1
+ + a
1
+ a
0
=
n

i=1
(

i
)
430 7 La tecnica de las variables de estado
donde

i
, i = 1, . . . , n son los eigenvalores deseados y se proponen a voluntad
del dise nador. Debe tenerse el cuidado de que todos los eigenvalores deseados
complejos aparezcan con sus parejas conjugadas para asegurar que todos los
coecientes a
i
, i = 0, 1, . . . , n1 sean reales lo cual, a su vez, asegura que las
ganancias

K y K sean reales. A continuacion se resume el procedimiento [1],
cap. 7, para calcular el vector de ganancias K que asigne los eigenvalores que
se deseen a la matriz de lazo cerrado ABK.
Encuentre el polinomio:
det(I A) =
n
+a
n1

n1
+ +a
1
+a
0
Proponga los eigenvalores deseados en lazo cerrado

1
,

2
, . . . ,

n
. Si algu-
no de estos eigenvalores es complejo entonces tambien debe proponerse su
pareja conjugada como uno de los eigenvalores deseados.
Calcule:
n

i=1
(

i
) =
n
+ a
n1

n1
+ + a
1
+ a
0
Calcule:

K =
_
a
0
a
0
a
1
a
1
. . . a
n1
a
n1

Calcule los vectores q


1
, . . . , q
n2
, q
n1
, q
n
de acuerdo a (7.77), obtenga la
matriz P
1
denida en dicha expresion y encuentre su matriz inversa P.
Calcule la matriz de ganancias del controlador en (7.83) como K =

KP.
Ejemplo 7.7 Continuando con el ejemplo 7.6, donde se aborda el estudio del
pendulo de Furuta, ahora se desea encontrar el vector de ganancias K que, al
ser utilizado en el controlador (7.83) (con x = z), asigne en:

1
= 94,

2
= 18,

3
= 0.5,

4
= 1
a los eigenvalores de la matriz A BK. Para esto, utilizando los valores
anteriores se forma el siguiente polinomio:
(

1
)(

2
)(

3
)(

4
) =
4
+ a
3

3
+ a
2

2
+ a
1
+ a
0
de donde se encuentra, al igualar coecientes:
a
3
= 113.5, a
2
= 1860.5, a
1
= 2594, a
0
= 846
Con estos valores y los obtenidos en (7.81) se calcula el vector

K de acuerdo
a(7.86):

K =
_
846 2594 1933.3 113.5

Finalmente, usando estos valores y la matriz P mostrada en (7.82) se calcula


el vector de ganancias K de acuerdo a K =

KP:
7.11 Observadores de estado 431
K =
_
1.5997 4.9138 154.4179 14.1895

el cual, a excepci on de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el pendulo de Furuta en el captulo
13.
7.11. Observadores de estado
Como se indico en la seccion 7.1, el estado x esta constituido por variables
que son internas al sistema y, por tanto, en general no se conocen y no se
pueden medir. En cambio, la salida y representa una variable que siempre se
puede medir. Esto signica que la construccion practica de un controlador de
la forma (7.83) puede ser no posible si no se puede medir todo el estado. Por
esta razon es importante contar con una variable x(t) que sea el estimado del
estado x(t), el cual pueda ser utilizado para construir un controlador de la
forma:
u = K x = (k
1
x
1
+k
2
x
2
+. . . +k
n
x
n
) (7.88)
K =
_
k
1
k
2
. . . k
n

, x =
_
x
1
x
2
. . . x
n

T
El mecanismo que se utiliza para calcular el estimado x recibe el nombre de
observador de estado o simplemente observador. Un observador debe cal-
cular x exclusivamente a partir de informacion que pueda ser medida, es decir
usando la entrada y la salida exclusivamente. Por otro lado, si el controlador
(7.88) ha de sustituir al controlador en (7.83), entonces una propiedad funda-
mental que debe satisfacer el observador a construir es que debe producir un
estimado x que converja lo mas rapido posible al valor real de x, o al menos
que lo haga de manera sintotica, es decir, que se asegure que:
lm
t
x(t) = x(t)
Un observador que cumple con esta caracterstica es el siguiente:

x = (ALC) x +Ly +Bu (7.89)


donde L = [L
1
, L
2
, . . . , L
n
]
T
es un vector columna constante. Esto puede
explicarse del siguiente modo. Defnase el error de estimacion como x = x x.
Entonces, restando (7.89) a (7.60) se obtiene:

x = Ax (ALC) x Ly
Usando y = Cx en esta expresion:

x = A x LC x
= (ALC) x
432 7 La tecnica de las variables de estado
Por tanto, usando los resultados de la seccion 7.5 se concluye que lm
t
x(t) =
0 y, por tanto, lm
t
x(t) = x(t) si y solo si todos los eigenvalores de la ma-
triz ALC tienen parte real estrictamente negativa. As que el unico problema
que resta es como seleccionar el vector (columna) de ganancias L de manera
que todos los eigenvalores de la matriz ALC tengan parte real estrictamente
negativa. Este problema queda resuelto del siguiente modo:
Teorema 7.5 ([1], p ag. 358) Si la ecuaci on din amica en (7.60) es observable,
entonces su estado puede ser estimado usando el observador en (7.89) y todos
los eigenvalores de la matriz A LC pueden ser asignados arbitrariamente
previendo que los eigenvalores complejos aparecen con sus parejas conjugadas.
Para explicar esta armacion es de mucha utilidad el siguiente resultado:
Teorema 7.6 ([1], p ag. 195) Considere las dos ecuaciones din amicas siguien-
tes:
x = Ax +Bu (7.90)
y = Cx
z = A
T
z +C
T
u (7.91)
= B
T
z
donde u, y, R, mientras que x, z R
n
. La ecuaci on en (7.90) es controlable
(observable) si y s olo si la ecuaci on en (7.91) es observable (controlable).
Por tanto, volviendo al problema del observador, como el par (A, C) es
observable entonces el par (A
T
, C
T
) y, por tanto, el par (A
T
, C
T
) son con-
trolables (porque el signo de la matriz A
T
no afecta la independencia
lineal de las columnas de la matriz en (7.53), vease la seccion 7.3). A partir de
esto se concluye que, siguiendo el procedimiento presentado en la seccion 7.10,
siempre se puede encontrar un vector renglon K constante tal que la matriz
A
T
C
T
K posee cualquier conjunto de eigenvalores deseados (eigenvalores
arbitrarios). Como los eigenvalores de una matriz son iguales a los eigenvalores
de su matriz transpuesta (vease la seccion 7.3), entonces la matriz AK
T
C
tiene los mismos eigenvalores que la matriz A
T
C
T
K (los eigenvalores de-
seados). Deniendo L = K
T
se obtiene el vector columna de ganancias que se
necesita para dise nar el observador en (7.89).
Cabe aclarar que la idea de que todos los eigenvalores de la matriz ALC
puedan ser asignados arbitrariamente signica que puedan ser colocados don-
de se desee seg un el criterio del dise nador. Obviamente todos los eigenvalores
deben tener parte real estrictamente negativa pero, ademas, se debe buscar
que esten colocados en lugares del plano complejo que aseguren una rapida
convergencia de x(t) a x(t). Para decidir donde se deben colocar los eigenvalo-
res de la matriz ALC, son de mucha utilidad los conceptos sobre respuesta
transitoria que se estudiaron en el captulo 3 respecto de la ubicacion de los
polos de funciones de transferencia como la presentada en (7.65).
7.12 El principio de separacion 433
7.12. El principio de separacion
Cuando se tiene una ecuacion dinamica (planta):
x = Ax +Bu (7.92)
y = Cx
y un observador:

x = (ALC) x +Ly +Bu (7.93)


y se utiliza el siguiente controlador para unirlos (vease la gura 7.5):
u = K x = (k
1
x
1
+k
2
x
2
+. . . +k
n
x
n
) (7.94)
surge la pregunta de como se vera afectada la estabilidad del sistema en lazo
cerrado (7.92), (7.93), (7.94), es decir es importante asegurar que se a un se
cumple que lm
t
x(t) = x(t) y que lm
t
x(t) = 0.
La respuesta a esta pregunta se conoce como el principio de separacion
el cual establece lo siguiente:
Resultado 7.12 ([1], p ag. 367) Los eigenvalores del sistema en lazo cerrado
(7.92), (7.93), (7.94), son la uni on de los eigenvalores de las matrices ABK
y ALC.
Esto signica que los eigenvalores del observador no son afectados por
la realimentacion en (7.94) y que, al menos en cuanto a los eigenvalores se
reere, no hay diferencia entre realimentar el estimado x(t) o el estado real
x(t). Sin embargo, se debe prevenir al lector sobre el hecho de que la respuesta
transitoria del sistema generalmente es diferente si se usa x(t) o si se usa
x(t) para construir la entrada. Lo importante es que se sigue cumpliendo que
lm
t
x(t) = x(t) y lm
t
x(t) = 0. Por tanto, el dise no de las ganancias
K del controlador y el dise no de las ganancias L del observador pueden ser
realizados de manera independiente.
Ejemplo 7.8 Considere el motor de CD visto en el ejemplo 7.5, es decir,
considere la ecuaci on din amica:
x = Ax +Bu, y = Cx (7.95)
x =
_
x
1
x
2
_
=
_

_
, A =
_
0 1
0
b
J
_
, B =
_
0
nkm
J
_
, C = [1 0], u = i

donde se considera que la salida es la posici on mientras que la velocidad no


se puede medir y, por tanto, deber a ser estimada usando un observador de
estado. Suponga que se desea controlar el motor para que alcance una posici on
constante, es decir, los valores deseados de posici on y de velocidad son:
x
1d
=
d
, x
2d
= 0
434 7 La tecnica de las variables de estado
planta
observador
K
u
y
x c
Figura 7.5. Sistema realimentado usando un observador para estimar el estado.
donde
d
es una constante que representa la posici on deseada y la velocidad
deseada es cero porque la posici on deseada es constante. Deniendo las varia-
bles de estado:
x
1
= x
1
x
1d
, x
2
= x
2
y calculando

x
1
= x
1
x
1d
= x
2
= x
2
y

x
2
= x
2
=

se obtiene la ecuaci on
din amica:

x = A x +Bu, (7.96)
= C x
donde es la nueva salida y la matriz A y los vectores B y C est an denidos
como en (7.95). N otese que la salida medida ahora es el error de posici on
= x
1
. A partir de este momento se considerar an los valores numericos del
motor controlado en el captulo 10, es decir:
k =
nk
m
J
= 675.4471, a =
b
J
= 2.8681 (7.97)
A continuaci on se muestra como dise nar el observador de estado correspon-
diente. En el ejemplo 7.5 se mostr o que la ecuaci on din amica en (7.95) es
observable y, por tanto, tambien la ecuaci on din amica en (7.96). De acuerdo
al teorema 7.6, esto implica que los pares (A
T
, C
T
) y (A
T
, C
T
) son contro-
lables, es decir, que las siguientes matrices tienen rango n = 2:
_
C
T
A
T
C
T

,
_
C
T
A
T
C
T

porque el signo que acompa na a la matriz A no afecta la independencia
lineal de estas columnas (vease la secci on 7.3). Con los valores numericos en
(7.97) se calculan las rces del polinomio det(I A
T
):
7.12 El principio de separacion 435

1
= 0,
2
= 2.8681
Entonces se realiza el producto:
(
1
)(
2
) =
2
+a
1
+a
0
de donde se encuentra, al igualar coecientes:
a
1
= 2.8681, a
0
= 0 (7.98)
Usando B = C
T
y A
T
en lugar de A, la f ormula en (7.77) se convierte en:
P
1
=
_
q
1
q
2

,
q
2
= C
T
,
q
1
= A
T
C
T
+a
1
C
T
,
Usando los valores numericos en (7.97) y (7.98), as como la matriz A y el
vector C denidos en (7.95) se obtiene:
P
1
=
_
2.8681 1.0000
1.0000 0
_
y, por tanto:
P =
_
0 1.0000
1.0000 2.8681
_
(7.99)
Suponga que se desea asignar los siguientes eigenvalores para la matriz ALC:

1
= 150,

2
= 100 (7.100)
Para esto se forma el siguiente polinomio:
(

1
)(

2
) =
2
+ a
1
+ a
0
de donde se encuentra, al igualar coecientes:
a
1
= 250, a
0
= 15000
Con estos valores y los obtenidos en (7.98) se calcula el vector

K de acuerdo
a (7.86):

K =
_
15000 247

Usando estos valores y la matriz P mostrada en (7.99) se calcula el vector K,


de acuerdo a K =

KP, y se asigna L = K
T
:
L =
_
247
14291
_
(7.101)
436 7 La tecnica de las variables de estado
Por otro lado, siguiendo un procedimiento similar al de los ejemplos 7.13.1 y
7.13.2 se encuentra que el vector de ganancias:
K =
_
1.6889 0.0414

(7.102)
asigna en:
15.4 + 30.06j, 15.4 30.06j (7.103)
a los eigenvalores de la matriz ABK. N otese que los valores de las ganancias
en (7.102) son iguales a las ganancias proporcional y de realimentaci on de ve-
locidad en el controlador dise nado y probado experimentalmente en la secci on
10.2.1 del captulo 10, en donde los polos de lazo cerrado se asignan en los
valores indicados en (7.103). Finalmente, debe aclararse que el observador a
construir es:
z = (ALC)z +L +Bu (7.104)
donde z = [z
1
z
2
]
T
es el estimado del vector x = [ x
1
x
2
]
T
y u = i

. Mientras
que el controlador es:
u = K
_
z
1
z
2
_
(7.105)
donde L y K toman los valores indicados en (7.101) y (7.102). N otese que el
controlador debe utilizar z
1
, es decir el estimado de x
1
, a pesar de que x
1
es
una variable que se conoce por medici on. Esto es debido a que toda la teora
vista hasta aqu supone que es todo el estado estimado el que se realimenta. En
este sentido es conveniente aclarar que tambien existen observadores llamados
de orden reducido, los cuales s olo estiman una parte del estado si la otra parte
es conocida. Al lector interesado en este tema se le recomienda consultar la
referencia [1].
En la gura 7.6 se muestran resultados en simulaci on cuando se utiliza el
observador en (7.104) y la realimentaci on en (7.105) junto con las ganancias
en (7.101) y (7.102) para controlar el motor cuyos par ametros se muestran en
(7.97). La posici on deseada es
d
= 2, las condiciones iniciales de observador
son z(0) = [0 0]
T
, mientras que (0) = 0 (es decir, x
1
(0) = 2) y

(0) = 2.
Observese como los estimados z
1
y z
2
convergen asint oticamente a los valores
reales x
1
y x
2
. Es interesante darse cuenta de que esta convergencia es con-
seguida antes de que el motor termine de responder. Esto se ha conseguido
gracias a que los eigenvalores seleccionados para la matriz ALC (mostrados
en (7.100)) son mucho m as r apidos que los eigenvalores asignados a la matriz
ABK (mostrados en (7.103)). Este es el criterio que normalmente se debe
utilizar para asignar los eigenvalores del observador.
7.12 El principio de separacion 437
0 0,1 0,2 0,3 0,4
0
0,5
1
1,5
2
2,5
x
1
x
1d
t s [ ]
rad [ ]
(a) Posicion del motor
0 0,1 0,2 0,3 0,4
-2
-1,5
-1
-0,5
0
0,5
rad [ ]
t s [ ]
z
1
x f
1
(b) Error de posicion x1 y su estimado z1.
0 0,1 0,2 0,3 0,4
-60
-40
-20
0
20
40
60
x
2
z
2
t s [ ]
rad=s [ ]
(c) Velocidad del motor x2 y su estimado z2.
Figura 7.6. Simulaciones. Uso del observador en (7.104) para controlar un motor
de CD.
438 7 La tecnica de las variables de estado
7.13. Caso de estudio. El pendulo con rueda inercial
7.13.1. Obtencion de la forma en (7.75)
En el captulo 14 se obtiene la aproximacion lineal de un mecanismo cono-
cido como el pendulo con rueda inercial. Este modelo se presenta en (14.32),
(14.35), y a continuacion se reescribe para facilitar la referencia:
z = Az +Bw, (7.106)
A =
_
_
0 1 0
d
11
mg 0 0
d
21
mg 0 0
_
_
, B =
_
_
0
d
12
d
22
_
_
k
m
R
Para simplicar la manipulacion algebraica se denen las siguientes constan-
tes:
a = d
11
mg, b = d
21
mg
c = d
12
k
m
R
, d = d
22
k
m
R
La siguiente matriz tiene la forma:
C
o
=
_
B AB A
2
B

=
_
_
0 c 0
c 0 ac
d 0 bc
_
_
Despues de un desarrollo algebraico sencillo se obtiene:
det(C
o
) = (d
12
)
2
_
k
m
R
_
3
mg(d
11
d
22
d
12
d
21
) = 0 (7.107)
debido a que d
11
d
22
d
12
d
21
= 0 es una propiedad del mecanismo, tal co-
mo se explica en el captulo 14. Por tanto, la ecuacion dinamica en (7.106)
es controlable para cualquier conjunto de parametros del pendulo con rueda
inercial. Es decir, este resultado no cambia si el mecanismo con el que se cuen-
ta es grande o peque no o si es ligero o pesado. Esto signica que la matriz P
introducida en (7.76) es no singular y a continuacion es construida utilizando
la formula presentada en (7.77). Para simplicar los calculos se utilizaran los
siguientes valores numericos:
d
11
= 0.0014636, d
12
= 0.0000076,
d
21
= 0.0000076, d
22
= 0.0000076,
mg = 0.12597
donde:
D
1
=
_
d
11
d
12
d
21
d
22
_
=
1
d
11
d
22
d
12
d
21
_
d
22
d
12
d
21
d
11
_
7.13 Caso de estudio. El pendulo con rueda inercial 439
que corresponden a los parametros del pendulo con rueda inercial que es cons-
truido y controlado en el captulo 14. Con estos valores se encuentra:
A =
_
_
0 1.0000 0
86.5179 0 0
86.5179 0 0
_
_
, B =
_
_
0
1.2758
245.6998
_
_
Con estos datos, y calculando numericamente, se encuentra que las races del
polinomio det(I A) son:

1
= 0,
2
= 9.3015,
3
= 9.3015
Entonces se realiza el producto:
(
1
)(
2
)(
3
) =
3
+a
2

2
+a
1
+a
0
de donde se encuentra, al igualar coecientes:
a
2
= 0, a
1
= 86.5179, a
0
= 0 (7.108)
Usando estos valores en (7.77) se encuentra:
P
1
=
_
_
0 1.275 0
5.467 10
5
0 1.275
21147.049 0 245.6998
_
_
y, por tanto:
P = 10
5

_
_
0 910.6662 4.7287
78379.7677 0 0
0 78379.8067 0.0002
_
_
(7.109)
Finalmente, con el n de comprobar las expresiones en (7.78) se realizan los
siguientes productos:
PAP
1
=
_
_
0 1.0000 0
0.0000 0 1.0000
0 86.5179 0
_
_
, PB =
_
_
0
0
1
_
_
Notese que estas matrices tienen exactamente la forma presentada en (7.75)
para

A = PAP
1
y

B = PB.
7.13.2. Control por realimentacion del estado
Ahora se desea encontrar el vector de ganancias K que, al ser utilizado en
el controlador (7.83) (con x = z y u = w), asigne en:

1
= 5.8535 + 17.7192j,

2
= 5.8535 17.7192j,

3
= 0.5268
440 7 La tecnica de las variables de estado
a los eigenvalores de la matriz A BK. Para esto, utilizando los valores
anteriores se forma el siguiente polinomio:
(

1
)(

2
)(

3
) =
3
+ a
2

2
+ a
1
+ a
0
de donde se encuentra, al igualar coecientes:
a
2
= 12.2338, a
1
= 354.4008, a
0
= 183.4494
Con estos valores y los obtenidos en (7.108) se calcula el vector

K de acuerdo
a (7.86):

K =
_
183.44 440.91 12.23

Finalmente, usando estos valores y la matriz P mostrada en (7.109) se calcula


el vector de ganancias K de acuerdo a K =

KP:
K =
_
345.5910 11.2594 0.0086

el cual, a excepcion de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el pendulo con rueda inercial en
el captulo 14.
7.14. Resumen del captulo
La tecnica de las variables de estado constituye la primera herramienta de
lo que hoy se conoce como control moderno. La manera de trabajar los proble-
mas en este enfoque es representando los modelos utilizando un conjunto de
ecuaciones diferenciales de primer orden que deben ser resueltas simultanea-
mente. Por tanto, el estudio se realiza de acuerdo a la respuesta en el tiempo y
se abandona el uso de la transformada de Laplace. Esta ultima caracterstica
es fundamental para permitir el estudio de sistemas no lineales, es decir, aque-
llos representados por ecuaciones diferenciales no lineales (vease el captulo
14 para un ejemplo de tales aplicaciones). Recuerdese que la transformada
de Laplace no se puede utilizar cuando se tienen ecuaciones diferenciales no
lineales.
Aunque existe una equivalencia entre la representacion en variables de
estado y la representacion en funcion de transferencia, la primera es mas
general. Esto se ve reejado en el hecho de que la funcion de transferencia
solo representa la parte de lo que en variables de estado es controlable y
observable de manera simultanea. Es decir, hay partes de un sistema que no
pueden ser descritas por la funcion de transferencia. Sin embargo, el hecho
de que un sistema sea controlable y observable simplica mucho las tareas
de analisis y dise no de sistemas de control. De hecho, existen resultados muy
poderosos para este caso como los presentados en las secciones 7.10 y 7.11.
7.16 Ejercicios propuestos 441
Una ventaja del enfoque de las variables de estado es que con el se pue-
den resolver problemas que seran mas elaborados si se usara el enfoque de
la funcion de transferencia. Dos ejemplos de esta situacion son los prototipos
controlados experimentalmente en los captulos 13 y 14, donde se deben con-
trolar dos variables simultaneamente: las posiciones del brazo y del pendulo
(en el captulo 13) y la posicion del pendulo y la velocidad de la rueda inercial
(en el captulo 14). Estos problemas se complican usando el enfoque de la
funcion de transferencia donde solo se puede controlar una variable: la sali-
da. Ademas, otra ventaja del enfoque de las variables de estado es que con
el se puede desarrollar una metodologa general para obtener aproximaciones
lineales de sistemas no lineales (vease la seccion 7.2 y los captulos 11, 13 y
14)
7.15. Preguntas de repaso
1. Que signica el hecho de que una ecuacion dinamica sea controlable?
2. Que signica que una ecuacion dinamica sea observable?
3. Como verica si una ecuacion dinamica es controlable y observable?
4. Que utilidad tiene el hecho de que una ecuacion dinamica sea controlable?
5. Que utilidad tiene el hecho de que una ecuacion dinamica sea observable?
6. Que diferencia existe entre la salida y el estado?
7. Suponga una ecuacion dinamica que es controlable y observable Que re-
lacion existe entre los polos de la funcion de transferencia correspondiente
y los eigenvalores de la matriz A?
8. Que signica que el origen sea globalmente asintoticamente estable?
9. Cuales son las condiciones para que el origen sea globalmente asintotica-
mente estable?
10. Por que es importante que el origen del estado de una ecuacion dinamica
sin entrada sea globalmente asintoticamente estable?
11. Que signica control por realimentacion del estado?
12. Que es un observador de estado y para que sirve?
7.16. Ejercicios propuestos
1. Diga que entiende por estado y proponga un ejemplo de una planta o
proceso fsico indicando cual es su estado.
2. Como sabe si un sistema es controlable u observable? Una vez que sabe
esto Cual es su utilidad?
3. Que signica que el estado x = 0 sea globalmente asintoticamente estable
y como se asegura esto?
4. Verique que las siguientes ecuaciones dinamicas son controlables:
442 7 La tecnica de las variables de estado
A =
_
_
2 1 3
5 9 7
0 2 8
_
_
, B =
_
_
0
0
2
_
_
, C =
_
4 7 2

A =
_
_
0 1 0
0 20 50
0 5 250
_
_
, B =
_
_
0
0
100
_
_
, C =
_
1 0 0

A =
_

_
0 1 0 0
0 0 0.5 0
0 0 0 1
0 0 50 0
_

_
, B =
_

_
0
1
0
5
_

_
, C =
_
1 0 1 0

Calcule la matriz P denida en (7.77).


Calcule las matrices y vectores

A = PAP
1
,

B = PB,

C = CP
1
denidos en (7.78).
Compruebe que estas matrices y vectores tienen las formas denidas
en (7.75).
Con estos resultados diga cual es la funcion de transferencia de la
ecuacion dinamica dada.
Utilice software especializado para calcular la funcion de transferencia
de la ecuacion dinamica dada. Verique que este resultado y el del
inciso anterior sean iguales.
Use software especializado para simular la respuesta de la ecuacion
dinamica dada y de la funcion de transferencia encontrada ante una
entrada escalon unitario. Graque la salida en ambas simulaciones y
comparelas. Que concluye?
5. Haga un programa de computadora que ejecute el procedimiento listado
al nal de este captulo para calcular el vector de ganancias K que asig-
ne los eigenvalores que se deseen a la matriz de lazo cerrado A BK.
Utilice este programa para calcular las ganancias de los controladores por
realimentacion de estado de los captulos 13 y 14.
6. La siguiente expresion constituye un ltro donde y(t) es una aproximacion
de la derivada respecto al tiempo de u(t).
Y (s) =
as
s +a
U(s), a > 0
De hecho, y(t) es conocida como la derivada sucia de u(t) y es muy
utilizada para estimar la velocidad y(t) en sistemas mecanicos a partir
de la posicion u(t). Con el n de construir en la practica este ltro se
procede obtener una ecuacion dinamica que lo represente. Encuentre dicha
ecuacion dinamica. Recuerde que u(t) debe ser la entrada. Puede usar
los conceptos de respuesta en frecuencia para elegir el valor de a?
7.16 Ejercicios propuestos 443
7. Considere el sistema ball and beam estudiado en el ejemplo 7.2 del presente
captulo, junto con los siguientes valores numericos:
k = 16.6035, a = 3.3132, = 5
Obtenga la ecuacion dinamica correspondiente cuando el estado se
dene como z = [x x
d
, x, ,

]
T
y la salida es = x x
d
, donde x
d
es una constante que representa el valor deseado de la posicion x.
Dise ne un controlador por realimentacion de estado que permita esta-
bilizar el sistema en x = x
d
, x = =

= 0. Seleccione los eigenvalores
deseados del siguiente modo. Proponga dos parejas de tiempo de su-
bida y sobre paso deseados. Usando las expresiones presentadas en
(3.59) en el captulo 3, determine dos parejas de eigenvalores comple-
jos conjugados de manera que se obtengan las dos parejas de tiempo
de subida y sobre paso deseados.
Dise ne un observador de estado que permita estimar todo el estado del
sistema. Recuerde que los eigenvalores de la matriz ALC deben ser
varias veces mas rapidos que los eigenvalores de la matriz ABK.
Construya un sistema en lazo cerrado que use el observador arriba
dise nado y un controlador que realimente el estado estimado para es-
tabilizar el sistema en x = x
d
, x = =

= 0. Mediante simulaciones
verique si se han obtenido las caractersticas de respuesta transitoria
deseadas.
Referencias
1. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
2. C.R. Wylie, Matematicas superiores para ingeniera, 2a. edicion en espa nol,
McGraw-Hill, Mexico, 1994.
3. W.L. Brogan, Modern control theory, 3rd. edition, Prentice Hall, Upper Saddle
River, 1991.
4. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,
1980.
5. M. R. Spiegel, Manual de formulas y tablas matematicas., McGraw-Hill, Serie
Schaum, Mexico, 2002.
6. C.-T. Chen, Linear system theory and design, Oxford University Press, New
York, 1999.
7. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
8. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
9. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8
Circuitos electronicos realimentados
R
2
R
1
R
n
L
C
BP
R
E C
2
C
1
C
3

CC
R
t
Q
La primera aplicacion importante de la realimentacion, desde el punto de
vista tecnologico, fue el regulador de velocidad para la maquina de vapor de-
sarrollado por Watt. Sin embargo, las tecnicas de control clasico surgieron
como una solucion para los problemas que se presentaban en los circuitos
electronicos de las compa nas telefonicas. Se descubrio que si se realimentaba
una peque na cantidad de la se nal a la salida de un amplicador electronico
entonces se poda disminuir la distorsion que produca dicho amplicador. Las
tecnicas de control clasico tambien demostraron ser fundamentales para di-
se nar circuitos que, realimentados, son capaces de producir se nales con forma
de onda sinusoidal como el oscilador Colpitts mostrado en la gura.
448 8 Circuitos electronicos realimentados
Objetivos del captulo
Usar la realimentaci on para reducir la distorsi on producida por circuitos
electr onicos no lineales.
Construir controladores anal ogicos usando circuitos electr onicos realimen-
tados.
Dise nar y construir osciladores de audiofrecuencia y de radiofrecuencia
con forma de onda sinusoidal.
En este captulo se presentan algunas aplicaciones de los sistemas reali-
mentados al dise no de circuitos electronicos. Algunas de estas aplicaciones
seran utilizadas en el dise no de otros sistemas de control que se presentan en
los captulos subsecuentes. Por otro lado, algunas de estas aplicaciones, como
los circuitos osciladores, son en s mismas sistemas de control completos que
requieren el empleo de los conceptos de teora de control vistos en la captulos
precedentes.
8.1. Circuitos electronicos para reducir no linealidades
+

R s ( ) C s ( )
Figura 8.1. Sistema en lazo cerrado.
Considere el sistema en lazo cerrado mostrado en la gura 8.1. La corres-
pondiente funcion de transferencia es:
R(s)
C(s)
=
A
1 +A
donde A y son constantes positivas. Suponga que A 1, entonces se puede
escribir:
R(s)
C(s)
=
A
1 +A

1

(8.1)
Las aplicaciones de este hecho son importantes en circuitos electronicos reali-
mentados como se explica a continuacion.
8.1 Circuitos electronicos para reducir no linealidades 449
Suponga que A es la ganancia de un amplicador de potencia. Tal como
su nombre lo indica, este tipo de amplicadores normalmente estan construi-
dos de manera que tengan la capacidad para manejar altas potencias. Esto
signica que sus componentes deberan soportar, entre otras cosas, grandes
variaciones de temperatura. Por esta razon, es com un que estos componentes
no sean de gran precision y es de esperarse que el valor de sus parametros
cambien en un amplio rango. Por tanto, suponer que el valor de A esta sujeto
a cambios es algo que seguramente ocurre en la realidad. De acuerdo a (8.1)
el uso de realimentacion alrededor de un amplicador de ganancia A tiene
la ventaja de conseguir que la ganancia del circuito realimentado solo ten-
ga variaciones muy peque nas a pesar de que A presente grandes variaciones.
Por tanto, la realimentacion puede resolver el problema de un amplicador
de potencia cuya ganancia varia fuertemente. Un aspecto importante es que
la ganancia no tenga variaciones y esto se consigue si tal ganancia es jada
por componentes que solo manejan peque nas cantidades de potencia y, por
tanto, que puedan ser seleccionados como dispositivos de precision.
A continuacion se presentan algunas aplicaciones donde se usa la reali-
mentacion para reducir las variaciones de las ganancias de algunos circuitos
electronicos, lo cual tambien puede entenderse como la reduccion del compor-
tamiento no lineal de dichas ganancias.
8.1.1. Reduccion de la distorsion en amplicadores
u
+

Preamplificador
Amplificador
no lineal

V
o
V
i
Figura 8.2. Uso de realimentacion en un amplicador no lineal para reducir la
distorsion.
Considere el diagrama mostrado en la gura 8.2. El amplicador no lineal
es un amplicador que tiene una ganancia A
1
= 2 cuando el voltaje de entrada
u es negativo y una ganancia A
2
= 0.5 cuando el voltaje de entrada u es
positivo. Esta caracterstica puede representarse como se muestra en la gura
8.3. Por tanto, dicho amplicador entrega a su salida una version distorsionada
de lo que se aplica a su entrada. En la gura 8.4 se muestra la se nal a la salida
del amplicador no lineal cuando se aplica a su entrada una se nal sinusoidal.
Este es un buen ejemplo de lo que se quiere decir cuando se habla de distorsion.
450 8 Circuitos electronicos realimentados
V
o
u
0:5
2
Figura 8.3. Caracterstica del amplicador no lineal en la gura 8.2.
Combinando el efecto de todos los amplicadores en el trayecto directo se
concluye que el diagrama de bloques de la gura 8.2 se puede representar por
un diagrama de bloques como el de la gura 8.1 donde:
A = A
1
A
0
, u < 0,
A = A
2
A
0
, u > 0,
= 1, por ejemplo
A
0
es la ganancia del preamplicador y tiene un valor muy grande. Notese
que se obtiene la siguiente funcion de transferencia de lazo cerrado:
R(s)
C(s)
=
A
1 +A

1

= 1
si las ganancias A
0
y son tales que A 1 para ambos valores A
1
, A
2
.
De esta manera el circuito en lazo cerrado de la gura 8.2 funciona como
un amplicador de ganancia constante para ambos signos de la se nal que
se desea amplicar. Esto signica que se ha eliminado la distorsion debida
al amplicador no lineal de ganancias A
1
y A
2
. Esto representa la principal
ventaja de usar la realimentacion mostrada en la gura 8.2 a pesar de que
se haya tenido que cambiar la ganancia total del amplicador que ahora es
1/ = 1. En la gura 8.5 se muestra la forma de onda obtenida V
o
a la salida
del del sistema realimentado de la gura 8.2 cuando V
i
es una se nal sinusoidal.
Observe como es que V
o
tiene amplitudes iguales en ambos semiciclos cuando
un amplicador no lineal (de ganancia A) se encuentra inmerso en el sistema
realimentado. A esto se le llama eliminacion o reduccion de la distorsion.
8.1 Circuitos electronicos para reducir no linealidades 451
u
V
o
t
Figura 8.4. Voltajes a la entrada u y a la salida Vo del amplicador no lineal de la
gura 8.3.
V
i
; V
o
t
Figura 8.5. Voltajes de entrada Vi y de salida Vo en la gura 8.2.
8.1.2. Reduccion de la zona muerta en amplicadores.
En la gura 8.6 se muestra un amplicador de potencia en base a dos tran-
sistores conectados en simetra complementaria. Este circuito tiene una zona
muerta entre 0.6[V] y +0.6 [V] debido al voltaje de polarizacion requerido
en las uniones base-emisor de los transistores. Esto signica que la se nal de
salida V
o
se mantiene en cero mientras la se nal de entrada u se mantenga
en el rango [0.6, +0.6][V]. En la gura 8.7 se muestra la caracterstica que
representa a este amplicador no lineal. En la gura 8.8 se muestra la se nal
obtenida a la salida del amplicador V
o
cuando se aplica una se nal sinusoidal
a la entrada u. Notese el efecto que la zona muerta tiene para valores de u
cercanos a cero. El circuito de la gura 8.9 se utiliza para reducir el efecto de
dicha zona muerta. El objetivo es conseguir que la forma de onda obtenida a la
salida V
o
sea identica, o muy parecida, a la forma de onda de la se nal aplicada
V
i
, tal como se muestra en la gura 8.10 y, de este modo, reducir fuertemente
452 8 Circuitos electronicos realimentados
u V
o
+ V
cc
V
cc
Figura 8.6. Transistores conectados en simetra complementaria. Ejemplo de un
amplicador de potencia no lineal.
V
o
u + 0:6
0:6
1
1
Figura 8.7. Caracterstica del amplicador no lineal de la gura 8.6.
o eliminar el efecto de la zona muerta gracias al uso de realimentacion. A
continuacion se explica como es que se consigue esto.
El circuito de la gura 8.9 se puede representar por el diagrama de bloques
de la gura 8.1. Este sistema realimentado tiene un funcion de transferencia
en lazo cerrado dada como:
R(s)
C(s)
=
A
1 +A
, R(s) = V
o
(s), C(s) = V
i
(s)
=
R
1
R
1
+R
2
1
8.1 Circuitos electronicos para reducir no linealidades 453
u
V
o
t
Figura 8.8. Voltajes a la entrada u y a la salida Vo del amplicador de la gura
8.6.
+

V
i
V
o u
+ V
cc
V
cc
R
1
R
2
Figura 8.9. Circuito realimentado para reducir el efecto de la no linealidad presente
en el amplicador de la gura 8.6.
donde A = A
0
, con A
0
la ganancia de lazo abierto del amplicador operacio-
nal utilizado para realizar el punto de suma y la ganancia de la caracterstica
mostrada en la gura 8.7 (zona muerta). Es bien sabido que A
0
tiene un valor
muy grande, del orden de 100 000, mientas que tiene un valor que, aunque
variable, es del orden de la unidad. Por tanto, A = A
0
1 y se puede
aproximar, con poco margen de error a:
V
o
(s)
V
i
(s)
=
A
1 +A

1

(8.2)
454 8 Circuitos electronicos realimentados
V
i
; V
o
t
Figura 8.10. Voltajes a la entrada Vi y a la salida Vo del circuito de la gura 8.9.
La expresion (8.2) indica que el circuito completo se comporta como un ampli-
cador de ganancia constante 1/ que elimina o reduce fuertemente el efecto
de la zona muerta de modo que la forma de onda de V
o
is igual a la de V
i
.
Notese que R
1
y R
2
se pueden seleccionar de valor grande para asegurar
que manejen poca corriente (poca potencia) por lo que pueden usarse resis-
tencias de precision. Tambien es importante aclarar lo siguiente. De acuerdo a
la gura 8.7 el valor de es cero para valores de u en el rango [0.6, +0.6][V].
Esto sugiere que la condicion A = A
0
1 no se cumple. Sin embargo,
debe entenderse que la caracterstica mostrada en la gura 8.7 es una ideali-
zacion de lo que realmente sucede en la practica y que en la realidad V
o
solo
es cero cuando u tambien es cero.
En la gura 8.11 se muestran los voltajes u y V
o
correspondientes a la
gura 8.6 obtenidos durante un experimento. Se utilizan los transistores tipo
Darlington TIP 141 (NPN) y TIP 145 (PNP). Esto signica que el voltaje de
union base-emisor tiene un voltaje nominal de polarizacion directa de alrede-
dor de 1.2[V] y, por tanto, la zona muerta en este caso esta en el intervalo
[-1.2,+1.2][V] del voltaje de entrada u. El voltaje u es una se nal sinusoidal
de 2.083[KHz] de 1[V] de pico. Esto sit ua al voltaje de la union base-emisor
claramente por debajo de su valor de polarizacion directa. Es importante men-
cionar que se conecta una resistencia de carga de 1[KOhm] entre los emisores
y tierra. Notese que el voltaje V
o
tiene una forma de onda muy distinta a
una sinusoide (compare con el trazo punteado en la gura 8.8), por lo que se
conrma experimentalmente que la conexion en simetra complementaria de
dos transistores distorsiona fuertemente la se nal.
En la gura 8.12 se muestran las formas de onda de las se nales V
i
y V
o
correspondientes a la gura 8.9. Estas mediciones se obtuvieron en un expe-
rimento donde se utilizan los transistores tipo Darlington TIP 141 (NPN) y
TIP 145 (PNP) y el voltaje V
i
es una se nal sinusoidal de 2.083[KHz] de 1[V]
de pico, es decir, como en el experimento de la gura 8.11. Tambien se utilizan
los valores de resistencia R
1
= R
2
= 10[KOhm] y una resistencia de carga de
1[KOhm] entre los emisores y tierra. El amplicador operacional utilizado es
el TL081. Notese que la forma de onda de V
o
es como la de V
i
, es decir, ambas
son sinusoides de la misma frecuencia, aunque la amplitud de V
o
es el doble
8.1 Circuitos electronicos para reducir no linealidades 455
que la de V
i
. Esto se debe a que, de acuerdo (8.2) se tiene que:
V
o
(s)
V
i
(s)
=
1

= 2, =
R
1
R
1
+R
2
= 0.5
Figura 8.11. Resultados experimentales. Voltajes a la entrada y a la salida del
circuito de la gura 8.6. Trazo superior: Vo, trazo inferior: u.
Figura 8.12. Resultados experimentales. Voltajes a la entrada y a la salida del
circuito de la gura 8.9. Trazo superior: Vo, trazo inferior: Vi.
456 8 Circuitos electronicos realimentados
Para el estudio de otras aplicaciones de la realimentacion en circuitos elec-
tronicos se recomienda consultar [1].
8.2. Construccion analogica de controladores
Z
2
s ( )
Z
1
s ( )
E
o
s ( )
E
i
s ( )
V
1
s ( )
Figura 8.13. Construccion de un controlador analogico usando un amplicador
operacional.
Considere el circuito de la gura 8.13 donde Z
1
(s) y Z
2
(s) representan las
impedancias de dos redes pasivas colocadas en esos lugares. En el amplicador
operacional se cumple:
E
o
(s) = (0 V
1
(s))A
0
= V
1
(s)A
0
(8.3)
donde A
0
es la ganancia de lazo abierto del amplicador operacional la cual
es muy grande (del orden de 100 000 [2], pag. 500). Para calcular el valor de
V
1
se usan los circuitos auxiliares mostrados en las guras 8.14(a) y 8.14(b).
De aqu se encuentra que:
V
1
(s) =
Z
1
(s)
Z
1
(s) +Z
2
(s)
(E
o
(s) E
i
(s)) +E
i
(s)
=
Z
1
(s)
Z
1
(s) +Z
2
(s)
E
o
(s) +E
i
(s)
_
1
Z
1
(s)
Z
1
(s) +Z
2
(s)
_
Usando (8.3) se encuentra:
E
o
(s) =
_
Z
1
(s)
Z
1
(s) +Z
2
(s)
E
o
(s) +E
i
(s)
_
1
Z
1
(s)
Z
1
(s) +Z
2
(s)
__
A
0
de donde se obtiene:
E
o
(s)
E
i
(s)
=
A
0
_
1
Z1(s)
Z1(s)+Z2(s)
_
1 +A
0
Z1(s)
Z1(s)+Z2(s)
8.2 Construccion analogica de controladores 457
Z
2
s ( )
Z
1
s ( )
E
i
s ( )
E
o
s ( )
V
1
s ( )
V
Z1
s ( )
(a)
Z
2
s ( )
Z
1
s ( ) E
o
s ( ) E
i
s ( )
V
Z1
s ( )
(b)
Figura 8.14. Circuitos equivalentes del circuito mostrado en la gura 8.13
Reduciendo terminos:
E
o
(s)
E
i
(s)
=
A
0
_
Z2(s)
Z1(s)+Z2(s)
_
1 +A
0
Z1(s)
Z1(s)+Z2(s)
Se puede considerar que A
0
Z1(s)
Z1(s)+Z2(s)
1, debido a que A
0
es muy grande,
y por tanto:
E
o
(s)
E
i
(s)
=
Z
2
(s)
Z
1
(s)
(8.4)
Notese, sin embargo, que el cumplimiento de la condicion A
0
Z1(s)
Z1(s)+Z2(s)
1
depende del valor de A
0
. Es importante mencionar que en los amplicadores
operacionales que se usan en la practica, la ganancia A
0
no es constante sino
que varia con la frecuencia de las se nales que esta procesando el amplicador
operacional. Es com un que A
0
disminuya al aumentar dicha frecuencia del
mismo modo en que vara la caracterstica de magnitud de un ltro pasa
bajas [2], pag. 500. Como consecuencia, la condicion A
0
Z1(s)
Z1(s)+Z2(s)
1 y
(8.4) dejan de ser ciertas a altas frecuencias. Por otro lado, la manera en que
vara A
0
con la frecuencia depende del amplicador operacional utilizado. Esto
signica que se debe tener cuidado de seleccionar el amplicador operacional
458 8 Circuitos electronicos realimentados
correcto de acuerdo al tipo de aplicacion en cuestion, es decir, de acuerdo a
la rapidez de respuesta de la planta o sistema a controlar.
En la tabla 8.1 se muestran algunos ejemplos de redes usadas para formar
Z
1
(s) y Z
2
(s), as como el controlador analogico que puede ser construido al
utilizarlas. Se deja como ejercicio que el lector calcule los valores de Z
1
(s) y
Z
2
(s) para cada una de las redes electricas mostradas y que verique, usando
(8.4), que se obtiene la funcion de transferencia del controlador mostrado en
la columna del extremo derecho de la gura. Entiendase con esto la mane-
ra de construir practicamente y de manera analogica una gran parte de los
controladores que se utilizan en control clasico. Vease [3] para una tabla mas
completa que incluye controladores adicionales. Se aclara que, sin embargo,
estos mismos controladores pueden ser construidos usando una computadora
digital o un microcontrolador si no se desea utilizar electronica analogica.
Tabla 8.1. Construccion analogica de controladores.
Controlador Z1(s) Z2(s)
Z
2
(s)
Z
1
(s)
PI R1
R2, C
en serie

R
2
R
1
_
s+
1
R
2
C
_
s
PD
R1, C
en paralelo
R2 R2C
_
s +
1
R
1
C
_
PID
R1, C1
en paralelo
R2, C2
en serie

_
_
R
2
R
1
+
C
1
C
2
_
+ R2C1s +
1
R
1
C
2
s
_
Red de adelanto
R1, C1
en paralelo
R2, C2
en paralelo

C
1
C
2
_
s+
1
R
1
C
1
_
_
s+
1
R
2
C
2
_
, R1C1 > R2C2
8.3. Dise no de osciladores con forma de onda sinusoidal
El proposito de esta seccion es mostrar como se puede usar la teora de
control para dise nar circuitos electronicos realimentados que generen se nales
con forma de onda sinusoidal. Se presenta un dise no basado en un amplicador
operacional y un dise no basado en un transistor.
El circuito que se propone usando amplicadores operacionales simplica
enormemente el analisis y el dise no, ademas es muy util para trabajar a fre-
cuencias bajas ya que evita el uso de inductancias. Es importante subrayar
que el valor de las inductancias que se necesitan para generar oscilaciones de
baja frecuencia es tan grande que el tama no geometrico de la inductancia se
convierte en un problema. La principal desventaja de este dise no es que no es
util para trabajar en altas frecuencias (en la banda de radiofrecuencia) debido
a las limitaciones de operacion de los amplicadores operacionales.
Por otro lado, el uso de transistores tiene la caracterstica de que la impe-
dancia del circuito de entrada se ve reejada en el circuito de salida. Esto hace
8.3 Dise no de osciladores con forma de onda sinusoidal 459
un poco mas elaborado el analisis y dise no simplemente porque la obtencion
de las funciones de transferencia involucradas ahora require de mas desarrollos
algebraicos. Sin embargo, la principal ventaja de usar transistores es que se
puede construir osciladores que trabajan a altas frecuencias, es decir, en la
banda de radiofrecuencia. Tambien resulta interesante el uso de transistores
por la siguiente situacion. Tal como se muestra en lo que resta de esta seccion,
cuando se usan amplicadores operacionales el circuito resultante es comple-
tamente lineal y se debe introducir, de manera articial, un elemento no lineal
para conseguir la construccion practica del oscilador. Por el contrario, dado
que el transistor es un dispositivo no lineal es precisamente esta caracterstica
la que permite, de manera natural, el correcto funcionamiento del oscilador.
8.3.1. Dise no basado en un amplicador operacional. Puente de
Wien
Considere el circuito mostrado en la gura 8.15. En el ejemplo 2.16 del
captulo 2, se encontro que la relacion entre los voltajes E
o
(s) y E
i
(s) esta da-
da en (2.143), expresion que se reescribe a continuacion para facilitar la refe-
rencia:
E
i
(s) E
o
(s)
I(s) R
R
C
C
+
+

Figura 8.15. Circuito RC serie-paralelo.
E
o
(s)
E
i
(s)
= G
T
(s) =
Ts
T
2
s
2
+ 3Ts + 1
, T = RC (8.5)
Ahora considere el circuito de la gura 8.16 donde se introduce un amplicador
no inversor a base de un amplicador operacional. Siguiendo el procedimiento
presentado en la seccion 8.2 se encuentra que la ganancia del circuito de la
gura 8.17 es constante e igual a:
A =
R
1
+R
f
R
1
=
V
o
V
i
Notese que que a partir de este circuito se puede obtener el diagrama de blo-
ques mostrado en la gura 8.18(a) de donde se obtiene el diagrama de bloques
460 8 Circuitos electronicos realimentados
C
R
C V
i
R
1
R
f
V
o
R
Figura 8.16. Circuito oscilador en base a un amplicador operacional.
R
1
R
f
V
o
V
i
Figura 8.17. Amplicador no inversor.
de la gura 8.18(b). Es importante observar que de acuerdo a estos diagramas
de bloques el circuito de la gura 8.16 es un circuito con realimentacion posi-
tiva. Dado que toda la teora desarrollada en sistemas de control esta hecha
pensando en que se dise naran sistemas de control con realimentacion negativa
como el mostrado en la gura 8.18(d) es necesario transformar el diagrama de
bloques de la gura 8.18(b) en una forma mas conveniente.

Esto se consigue
en la gura 8.18(c) donde se introduce un signo negativo en la realimentacion
que se ve compensado con un cambio de signo en la funcion de transferencia
de trayecto directo. Esto signica que ahora se cuenta con un sistema con
realimentacion negativa que es equivalente al de la gura 8.18(b) y al de la
gura 8.18(d). Por tanto, la funcion de transferencia de lazo abierto esta dada
8.3 Dise no de osciladores con forma de onda sinusoidal 461
como:
G(s)H(s) = G
T
(s)A (8.6)
+
+
0
E
i
s ( ) E
o
s ( )
V
o
V
i
Circuito RC
serie paralelo
Amplificador
no inversor
(a)
R
1
R
f
+R
1
+
+
E
i
s ( ) E
o
s ( )
V
i
V
o
0
G
T
(s)
(b)
R
1
R
f
+R
1
+

E
o
s ( )
V
i
V
o
E
i
s ( )
0
G
T
(s)
(c)
G s ( )

+
R s ( )
H s ( )
C(s)
(d)
Figura 8.18. Diagramas de bloques equivalentes del circuito en la gura 8.16.
462 8 Circuitos electronicos realimentados
Analisis basado en la respuesta en el tiempo
Este metodo se reere al estudio del circuito a traves de localizar la ubi-
cacion de sus polos. A partir del estudio sobre ecuaciones diferenciales en el
captulo 3 se sabe que para tener oscilaciones sostenidas los polos de lazo
cerrado deben ser imaginarios puros, es decir, con parte real cero y parte ima-
ginaria diferente de cero. Bajo esta situacion, la frecuencia de oscilacion, en
radianes/segundo, es igual a la parte imaginaria de dichos polos.
Se sabe que los polos de lazo cerrado satisfacen:
1 +G(s)H(s) = 0
Sustituyendo las ecuaciones (8.6) y (8.5) se obtiene:
1 +G(s)H(s) = 1 G
T
(s)A = 1
TAs
T
2
s
2
+ 3Ts + 1
=
T
2
s
2
+ 3Ts + 1 TAs
T
2
s
2
+ 3Ts + 1
= 0
y, por tanto, los polos de lazo cerrado satisfacen:
T
2
s
2
+ (3 A)Ts + 1 = 0
Los polos de lazo cerrado son las races del polinomio del lado izquierdo, es
decir:
s
1
=
(3 A)T +
_
(3 A)
2
T
2
4T
2
2T
2
s
2
=
(3 A)T
_
(3 A)
2
T
2
4T
2
2T
2
Notese lo siguiente:
Ambos polos tienen parte imaginaria diferente de cero y, por tanto, el
circuito presentara oscilaciones si:
(3 A)
2
T
2
4T
2
< 0
es decir, si 5 > A > 1.
Si A > 3, entonces ambos polos tienen parte real positiva, es decir, el
circuito es inestable lo cual es altamente indeseable.
Si A < 3, entonces ambos polos tienen parte real negativa, es decir, el
circuito es estable. Esto, sin embargo, tampoco es deseable porque la res-
puesta del circuito sera tal que poco a poco dejara de oscilar.
Si A = 3, entonces los dos polos tienen parte real cero y, por tanto, son
imaginarios puros, tal como se desea. Estos polos estan ubicados en s
1,2
=
j
1
T
. Por tanto, la frecuencia de oscilacion es =
1
T
=
1
RC
.
8.3 Dise no de osciladores con forma de onda sinusoidal 463
Analisis basado en la respuesta en la frecuencia
Introd uzcase el cambio de variable s = j en (8.5):
G
T
(j) =
jT
T
2
(j)
2
+ 3jT + 1
Evaluando en la frecuencia = 1/T = 1/(RC) se obtiene:
G
T
(j/T) =
1
3
Para obtener la graca de Bode de G
T
(s) se reescribe:
G
T
(s) = Ts
1
T
2
s
2
+
3
T
s +
1
T
2
(8.7)
La graca de Bode de G
T
(s) se muestra en la gura 8.19. La magnitud de
G
T
(j) es maxima (e igual a
1
3
) en la frecuencia = 1/T = 1/(RC), justo
cuando la fase de G
T
(j) es cero.
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
iv)
1
180
+ 90
T
1
T
1
Figura 8.19. Gracas de Bode de GT (s) en (8.7). i) T, ii) s, iii)
1
T
2
s
2
+
3
T
s+
1
T
2
, iv)
GT (s).
La graca polar de G(s)H(s) dada en (8.6) se muestra en la gura 8.20. El
uso de la graca de Bode de G
T
(s) mostrada en la gura 8.19 permite concluir
que la graca polar de G(s)H(s), mostrada en en la gura 8.20, consiste en una
trayectoria cerrada que es recorrida dos veces en sentido horario. Observese
que el signo negativo en (8.6) cambia la fase en 180

de cada uno de los puntos


de la graca de Bode de G
T
(s). Notese tambien que la graca polar de la gura
8.20 cruza el eje real negativo en el punto
R1+R
f
3R1
a la frecuencia = 1/T =
464 8 Circuitos electronicos realimentados
! = 0

! = + 1
! = 1
! =
T
1
Re G(j!)H(j!) ( )
Im G(j!)H(j!) ( )

3
A

( 1; j0)
Figura 8.20. Graca polar de G(s)H(s) en (8.6).
1/(RC). Por otro lado, como la graca polar incluye frecuencias positivas
y negativas y es simetrica respecto al eje real para frecuencias negativas y
positivas entonces el eje real negativo tambien es cruzado en el punto
R1+R
f
3R1
a la frecuencia = 1/T = 1/(RC). Notese tambien que el n umero de polos
inestables de lazo abierto que tiene la funcion dada en (8.6) es cero, es decir
P = 0, ya que todos los coecientes del polinomio del denominador de G
T
(s)
son positivos (vease la seccion 4.2.1).
Finalmente, antes de aplicar el criterio de Nyquist se debe observar lo
siguiente. Como G(s)H(s) tiene un cero en s = 0, es decir sobre el eje imagi-
nario, se debe hacer un rodeo como el mostrado en la gura 6.44 solo que en
este caso es un cero (en lugar de un polo) el que se debe rodear. Sin embar-
go, sobre todo ese rodeo s = donde 0 y, por tanto, G(s)H(s) 0
tambien sobre todo ese rodeo. Es decir, G(s)H(s) representa un solo punto
en el origen para todo ese rodeo. Por tanto, al aplicar el criterio de Nyquist
se tienen tres casos:
1. Si
R1+R
f
3R1
> 1, entonces el n umero de vueltas alrededor del punto (1, j0)
es N = 2, por lo que el n umero de polos inestables de lazo cerrado es Z =
N + P = 2. Esto signica inestabilidad del circuito lo cual es altamente
indeseable.
2. Si
R1+R
f
3R1
< 1, entonces el n umero de vueltas alrededor del punto (1, j0)
es N = 0, por lo que el n umero de polos inestables de lazo cerrado es
Z = N + P = 0. Aunque esto signica que el circuito es estable, sin
embargo tampoco es deseable porque la respuesta del circuito sera tal que
poco a poco dejara de oscilar.
3. Si
R1+R
f
3R1
= 1, entonces el circuito es marginalmente estable, es decir se tie-
nen polos de lazo cerrado que estan sobre el eje imaginario. Esto tambien
puede entenderse del siguiente modo. De acuerdo a la discusion previa,
8.3 Dise no de osciladores con forma de onda sinusoidal 465
la graca polar de la gura 8.20 cruza el eje real negativo en el punto
(1, j0) a las frecuencias = 1/T = 1/(RC) y = 1/T = 1/(RC).

Esto signica que G(j)H(j)|


=1/T
= 1 y G(j)H(j)|
=1/T
= 1,
es decir, 1 + G(s)H(s)|
s=j/T
= 0 y 1 + G(s)H(s)|
s=j/T
= 0. Dado que
1+G(s)H(s) = 0 es la condicion que deben satisfacer los valores de s que
son polos de lazo cerrado, se concluye que hay dos polos de lazo cerrado
que son imaginarios puros conjugados colocados en s = j/T y s = j/T.
Por tanto, el circuito oscilara permanentemente con frecuencia = 1/T.
Un circuito oscilador practico
A partir de la discusion previa se concluye que la ganancia del amplicador
basado en amplicadores operacionales se debe seleccionar como:
A =
R
1
+R
f
R
1
= 3
Sin embargo, el circuito de la gura 8.16 no podra oscilar de manera satis-
factoria. La razon de esto es que es no se pueden obtener resistencias reales
R
f
y R
1
cuyos valores satisfagan exactamente
R1+R
f
R1
= 3, ademas la mas
peque na variacion en sus valores hara inestable al circuito o hara que deje de
oscilar. Esta es una muestra de un hecho bien conocido: un circuito oscilador
lineal no oscila satisfactoriamente en la practica por lo que todos los circuitos
osciladores que se construyen son no lineales.
10k
10k
Zeners
4:7k
3:6V
25:6k
33nF
4:7k
33nF
e
o
+

Figura 8.21. Circuito oscilador practico.


La manera de construir un oscilador practico usando los conceptos teori-
cos presentados previamente es utilizando el circuito de la gura 8.21, al cual
466 8 Circuitos electronicos realimentados
se le incluye una no linealidad mediante la introduccion de dos diodos zener.
Suponga que A > 3 por lo que el circuito es inestable y empieza a oscilar con
una amplitud que crece con cada oscilacion. La funcion de los diodos zener
es poner en corto a la resistencia de 10[KOhm] cuando alcancen su voltaje de
avalancha. De esta manera se reducira la ganancia A del amplicador cuando
la amplitud del voltaje de salida supere un umbral determinado. Esto hara que
que A < 3 por lo que la amplitud de la oscilacion tendera a disminuir lo cual,
a su vez, reduce el voltaje en los diodos zener que dejaran de conducir por lo
que desaparecera el corto alrededor de la resistencia de 10[KOhm] y se obten-
Figura 8.22. Forma de onda del voltaje a la salida del amplicador operacional de
la gura 8.21. El potenciometro esta ajustado a 20[KOhm].
Figura 8.23. Forma de onda del voltaje a la salida del amplicador operacional de
la gura 8.21. El potenciometro esta ajustado a 25.6[KOhm].
8.3 Dise no de osciladores con forma de onda sinusoidal 467
dra A > 3 de nuevo. Finalmente, este proceso producira un estado estacionario
en el que habra una oscilacion sinusoidal de amplitud constante. Notese que,
usando los valores de las resistencias en la gura 8.21, A = 45/10 = 4.5 si no
conducen los diodos zener y A = 35/10 = 3.5 si conducen los diodos zener.
As que se debe ajustar el valor del potenciometro de 25.6[KOhm] para obte-
ner un valor de A ligeramente mayor que 3 y conseguir la oscilacion sostenida.
Notese que la frecuencia de oscilacion esperada es:
=
1
T
=
1
RC
=
1
(4.7 10
3
)(0.033 10
6
)
= 6447[rad/s],
f =

2
=
6447
2
= 1.026[KHz]
En las guras 8.22 y 8.23 se muestran los resultados experimentales obtenidos
con el circuito de la gura 8.21. El amplicador operacional utilizado es el
UA741. La frecuencia obtenida experimentalmente es 1[KHz]. La amplitud
de oscilacion puede ser modicada si se incrementa el valor de la resisten-
cia del potenciometro de 25.6[KOhm], lo cual incrementa la ganancia de del
amplicar operacional realimentado A. Sin embargo, si esta ganancia es muy
grande la forma de onda sinusoidal se distorsiona. Esto es lo que ocurre en la
gura 8.23 donde se usa el potenciometro 25.6[KOhm] ajustado a su maximo
valor de resistencia. Por el contrario, en la gura 8.22 el potenciometro de
25.6[KOhm] se usa ajustado a un valor de aproximadamente 20[KOhm]. Este
comportamiento signica que la conduccion en la zona de avalancha de los
diodos zener es progresiva, y no abrupta, conforme aumenta la amplitud del
voltaje en la salida del amplicador operacional. De esta manera, una mayor
ganancia de lazo en (8.6) es reducida a la unidad si aumenta la amplitud de
las oscilaciones, es decir, si el funcionamiento de los diodos zener se interna
mas en su region de avalancha.
Finalmente, notese que, de acuerdo a los diagramas de bloques mostrados
en la gura 8.18, el circuito oscilador presentado en esa seccion constituye un
sistema en lazo cerrado sin entrada, es decir, la entrada que se aplica para
que el circuito oscile es igual a cero. Esto no debe sorprender al lector pues en
la seccion 3.3 del captulo 3 se explica claramente que un sistema de segundo
orden (o de orden mayor) puede oscilar aunque la entrada sea cero si las con-
diciones iniciales son diferentes de cero. En este sentido, debe observarse que
a pesar de que el circuito este inicialmente desconectado se pueden producir
peque nas condiciones iniciales diferentes de cero como consecuencia de que el
circuito es perturbado al momento de conectar las fuentes de alimentacion.
Estas condiciones iniciales diferentes de cero, aunque peque nas, son sucientes
para que el circuito empiece a oscilar dada la inestabilidad inicial de circuito
(ya que A > 3 cuando se enciende el circuito).
468 8 Circuitos electronicos realimentados
8.3.2. Dise no basado en un amplicador operacional. Red RC de
defasaje
Considere el circuito mostrado en la gura 8.24. La relacion entre los vol-
tajes V
1
(s) y V
2
(s) se muestra en (2.146) correspondiente al ejemplo 2.17
del captulo 2. A continuacion se reescribe dicha expresion para facilitar la
referencia:
+
I
1
I
2
I
3
R R
R
C C C

V
1
(s) V
2
(s)
Figura 8.24. Red RC de defasaje.
V
2
(s)
V
1
(s)
=
R
3
C
3
s
3
R
3
C
3
s
3
+ 6R
2
C
2
s
2
+ 5RCs + 1
= F(s) (8.8)
Por otro lado, de acuerdo a la seccion 8.2, el amplicador inversor mostrado
en la gura 8.25 realiza la operacion:
V
1
(s) =
R
f
R
V
2
(s) (8.9)
-
+
-
R
f
R
+

+
V
1
(s)
V
2
(s)
Figura 8.25. Amplicador inversor.
Ahora considerese el circuito mostrado en la gura 8.26. Notese que es-
te circuito puede representarse usando el diagrama de bloques en la gura
8.3 Dise no de osciladores con forma de onda sinusoidal 469
-
+
-
R
f
R
+
+
-
R R
C C C
V
2
(s)
V
1
(s)
Figura 8.26. Circuito oscilador con red RC de defasaje.
8.27(a). Ademas, de acuerdo a las expresiones en (8.8) y (8.9) se obtiene el
diagrama de bloques mostrado en la gura 8.27(b), el cual puede representar-
se como en la gura 8.27(c). Esto ultimo es conveniente para poder utilizar
la conguracion en lazo cerrado con realimentacion negativa. Por tanto, la
funcion de transferencia de lazo abierto esta dada como:
G(s)H(s) =
R
f
R
F(s) (8.10)
Se sabe que los polos de lazo cerrado satisfacen:
1 +G(s)H(s) = 0 (8.11)
es decir:
1 +
R
f
R
F(s) = 0 (8.12)
De esta condicion se obtiene el siguiente polinomio caracterstico:
(R
4
C
3
+R
f
R
3
C
3
)s
3
+ 6R
3
C
2
s
2
+ 5R
2
Cs +R = 0 (8.13)
De acuerdo al captulo 3, el comportamiento de este circuito depende de las
races del polinomio caracterstico en (8.13). Como este polinomio es de tercer
orden es de mucha utilidad usar el criterio de Routh (seccion 4.3) para estudiar
dichas races y para lo cual se construye la tabla 8.2. A partir de esta tabla
se pueden predecir tres comportamientos diferentes:
470 8 Circuitos electronicos realimentados
0 +
+
Amplificador
inversor
Red RC de
defasaje
V
1
(s) V
2
(s)
(a)
0
+
+
V
2
(s)
V
1
(s)
F(s)

R
R
f
(b)
0
+

R
R
f
V
1
(s)
F(s)
(c)
Figura 8.27. Diagramas de bloques equivalentes del circuito en la gura 8.26.
Tabla 8.2. Aplicacion del criterio de Routh al polinomio caracterstico en (8.13).
s
3
R
4
C
3
+ R
f
R
3
C
3
5R
2
C
s
2
6R
3
C
2
R
s
1
(6R
3
C
2
)(5R
2
C)R(R
4
C
3
+R
f
R
3
C
3
)
6R
3
C
2
0
s
0
R
(6R
3
C
2
)(5R
2
C) R(R
4
C
3
+ R
f
R
3
C
3
) > 0, es decir R
f
< 29R. En este
caso, todos los elementos de la primer columna de la tabla 8.2 son positivos
por lo que todas las races del polinomio en (8.13) tienen parte real negativa
8.3 Dise no de osciladores con forma de onda sinusoidal 471
y el circuito es estable. Esto signica que aunque el circuito podra oscilar,
sin embargo esto no sera de manera permanente ya que las oscilaciones
desapareceran al crecer el tiempo.
(6R
3
C
2
)(5R
2
C) R(R
4
C
3
+ R
f
R
3
C
3
) < 0, es decir R
f
> 29R. En este
caso, hay dos cambios de signo al recorrer la primera columna de la tabla
8.2. Esto signica que hay dos races del polinomio en (8.13) que tienen
parte real positiva y el circuito es inestable. Esto signica que aunque el
circuito podra oscilar, sin embargo la amplitud de las oscilaciones crecera
sin lmite al crecer el tiempo, lo cual no es de utilidad en situaciones
practicas.
(6R
3
C
2
)(5R
2
C) R(R
4
C
3
+ R
f
R
3
C
3
) = 0, es decir R
f
= 29R. En este
caso hay un renglon de la tabla 8.2 que esta formado exclusivamente por
ceros (el renglon correspondiente a s
1
). El criterio de Routh establece
(vease la seccion 4.3, ejemplo 4.14) que en este caso se debe calcular la
derivada del polinomio formado con los elementos del renglon s
2
, es decir
dP(s)
ds
= 12R
3
C
2
s, donde P(s) = 6R
3
C
2
s
2
+R, sustituir sus coecientes en
el renglon s
1
y continuar con la construccion de la tabla como se muestra en
la tabla 8.3. Como no hay cambios de signo al recorrer la primera columna
de la tabla 8.3 se concluye no existen races con parte real positiva y que
existen races imaginarias conjugadas. As que la condicion:
Tabla 8.3. Aplicacion del criterio de Routh al polinomio caracterstico en (8.13)
(continuacion).
s
3
R
4
C
3
+ R
f
R
3
C
3
5R
2
C
s
2
6R
3
C
2
R
s
1
12R
3
C
2
0
s
0
R
R
f
= 29R (8.14)
es necesaria para que el circuito de la gura 8.26 pueda oscilar de manera
permanente. Por tanto, lo unico que resta es determinar la frecuencia de
oscilacion. Para esto, es de utilidad recordar otra propiedad de los datos
mostrados en la tabla 8.2 (vease la seccion 4.3, ejemplo 4.14): si uno de los
renglones esta formado exclusivamente por ceros, entonces las races del
polinomio obtenido con los datos del renglon inmediato superior a dicho
renglon de ceros tambien son races del polinomio caracterstico en (8.13).
Es decir, las races de:
6R
3
C
2
s
2
+R = 0
tambien son races del polinomio caracterstico mostrado en (8.13). Resol-
viendo la expresion anterior se encuentra que las races correspondientes
son imaginarias, como se esperaba:
472 8 Circuitos electronicos realimentados
s
1
= j
1

6RC
, s
2
= j
1

6RC
Esto signica que =
1

6RC
= 2f, es decir, que la frecuencia en Hertz
esta dada como:
f =
1
2

6RC
(8.15)
Por tanto, para dise nar el circuito oscilador de la gura 8.26 se deben se-
leccionar los valores de R y C de modo que se obtenga la frecuencia de
oscilacion de acuerdo a (8.15) para despues asegurar la oscilacion seleccio-
nando R
f
de acuerdo a (8.14).
Un circuito oscilador practico
A partir de la discusion previa se concluye que la relacion entre R
f
y R
debe cumplir lo establecido en (8.14). Sin embargo, de manera similar a lo
que ocurre con el circuito oscilador de la seccion 8.3.1, el oscilador de la gura
8.26 debe ser modicado como se muestra en la gura 8.28 para conseguir
una oscilacion satisfactoria. Notese que, usando los valores de las resistencias
en la gura 8.28,
R
f
R
=
80000
2200
= 36.36 si no conducen los diodos zener y
R
f
R
=
47000
2200
= 21.36 si conducen los diodos zener. As que se debe ajustar el
valor del potenciometro de 47[KOhm] para obtener un valor de
R
f
R
ligeramente
mayor que 29 y conseguir la oscilacion sostenida. Notese que la frecuencia de
oscilacion esperada es:
f =
1
2

6RC
=
1
2

6(2200)(0.01 10
6
)
= 2.9534[KHz]
En la gura 8.29 se muestran los resultados experimentales obtenidos con el
circuito de la gura 8.28. El amplicador operacional utilizado es el UA741. La
frecuencia obtenida experimentalmente es 2.7027[KHz], que es muy cercana a
la dise nada: 2.9534[KHz].
8.3.3. Dise no basado en un transistor
En esta seccion se estudia el circuito oscilador mostrado en la gura 8.30, el
cual se conoce como oscilador Colpitts. El transistor es un dispositivo no lineal.
Por esta razon, el problema es abordado de manera similar a como se hace
con las ecuaciones diferenciales no lineales. As, se considera que el circuito
de la gura 8.30 trabaja en un punto de operacion y que permite peque nas
variaciones de sus se nales alrededor de dicho punto de operacion. El punto
de operacion esta determinado por el funcionamiento en corriente directa del
circuito de la gura 8.30, mientras que las variaciones alrededor del punto
de operacion se analizan usando un circuito equivalente de se nal peque na
8.3 Dise no de osciladores con forma de onda sinusoidal 473
-
+
+
-
v
1
0:01 F 0:01 F 0:01 F
33k
47k
2:2k
2:2k
2:2k
Zeners 3:6V

Figura 8.28. Circuito oscilador practico.
para el circuito de la gura 8.30. El circuito de se nal peque na es similar al
modelo lineal aproximado obtenido para sistemas (ecuaciones diferenciales) no
lineales en la seccion 7.2, el cual es valido solo si permiten peque nas variaciones
alrededor del punto de operacion seleccionado. En el siguiente apartado se
Figura 8.29. Forma de onda del voltaje a la salida del amplicador operacional de
la gura 8.28.
474 8 Circuitos electronicos realimentados
R
2
R
1
R
n
L
C
BP
R
E C
2
C
1
C
3

CC
R
t
Q
Figura 8.30. Oscilador Colpitts.
estudia el circuito bajo condiciones de corriente directa. El analisis del circuito
equivalente de se nal peque na se aborda en las subsecuentes secciones.
Dada la gran cantidad de variables involucradas (corrientes y voltajes en
cada elemento de circuito), se hace la siguiente aclaracion en cuanto a la
nomenclatura utilizada. Se usa v
R1Q
para indicar el voltaje (constante) que
hay en la resistencia R
1
en el punto de operacion, v
r1
representa las variaciones
de voltaje que hay en la resistencia R
1
al rededor del punto de operacion y v
R1
es el voltaje total en la resistencia R
1
, es decir v
R1
= v
R1Q
+v
r1
. Las corrientes
y voltajes en los otros elementos de circuito se denen de manera analoga.
Por otro lado, se usan letras may usculas para representar la transformada de
Laplace de una variable escrita con letras min usculas, es decir, I(s) = L{i(t)}.
Analisis en corriente directa
El punto de operacion de un transistor esta determinado por los valores
constantes de la corriente de colector i
CQ
y del voltaje colector-emisor v
CEQ
.
Primero notese que v
LQ
= L
diLQ
dt
= 0, i
C1Q
= C
dvC1Q
dt
= 0, i
C2Q
= C
dvC2Q
dt
=
0 e i
C3Q
= C
dvC3Q
dt
= 0 porque i
LQ
, v
C1Q
, v
C2Q
e v
C3Q
son constantes. Por
tanto, para el analisis en corriente directa se usa el circuito de la gura 8.31.
Leyes fundamentales que rigen el funcionamiento del transistor en corriente
directa indican que [1], cap. 5:
i
CQ
= i
BQ
, i
EQ
= (1 +)i
BQ
, 1, i
EQ
i
CQ
, v
BEQ
= 0.7[V], silicio
La ley de voltajes de Kirchho aplicada a la malla denida por el recorrido
J
c
en la gura 8.31 da como resultado:
v
cc
= v
CEQ
+v
REQ
v
cc
= v
CEQ
+R
E
i
EQ
(8.16)
8.3 Dise no de osciladores con forma de onda sinusoidal 475
R
2
R
1
R
E

CC Q
J
b
J
c

+
Figura 8.31. Circuito equivalente en corriente directa.
La ley de voltajes de Kirchho aplicada a la malla denida por el recorrido
J
b
en la gura 8.31 da como resultado:
v
R1Q
= v
BEQ
+v
REQ
v
R1Q
= 0.7 +R
E
i
EQ
(8.17)
Suponga que se dan como datos los valores de i
CQ
, v
CEQ
, y v
cc
. Usando
(8.16) e i
EQ
I
CQ
se calcula el valor de R
E
. A continuacion se propone i
R1Q
a partir de i
CQ
= i
BQ
y la siguiente consideracion importante:
i
R1Q
i
BQ
(8.18)
Entonces puede usarse (8.17) para calcular:
R
1
=
v
R1Q
i
R1Q
(8.19)
R
2
=
v
cc
v
R1Q
i
R1Q
(8.20)
El valor de los elementos L, C
1
, C
2
, C
3
, C
BP
y R
t
se calculan a partir del
analisis del circuito equivalente de se nal peque na como se muestra en los
siguientes apartados.
Circuito equivalente de se nal peque na
Primero se determina el modelo de se nal peque na del transistor. Aunque
existen muchos modelos de se nal peque na para el transistor (todos ellos correc-
tos) en esta obra se considera lo siguiente. La corriente de emisor, correspon-
diente al diodo en la union base-emisor, esta dada por la ecuacion de Shockley
[1], cap. 5:
476 8 Circuitos electronicos realimentados
i
E
= I
ES
_
e
v
BE
V
T
1
_
(8.21)
donde I
ES
es una constante de valor entre 10
12
[A] y 10
16
[A] mientras
que V
T
= 0.026[V] para temperaturas de 300 grados Kelvin. Una relacion
importante del transistor indica que i
B
= (1)i
E
, donde es una constante
positiva ligeramente menor que 1. Por tanto:
i
B
= (1 )I
ES
_
e
v
BE
V
T
1
_
(8.22)
Dado que se considera que el transistor opera en la region activa entonces se
puede despreciar el uno que se resta en la expresion anterior para escribir:
i
B
= (1 )I
ES
_
e
v
BE
V
T
_
(8.23)
Recordando que i
B
= i
BQ
+i
b
y v
BE
= v
BEQ
+v
be
se tiene:
i
BQ
+i
b
= (1 )I
ES
_
e
v
BEQ
+v
be
V
T
_
= (1 )I
ES
e
v
BEQ
V
T
e
v
be
V
T
(8.24)
Recuerdese que peque nos cambios en i
B
se deben a peque nos cambios en v
BE
,
es decir, i
b
= 0 si v
be
= 0. Entonces, de acuerdo a la expresion anterior se
obtiene:
i
BQ
= (1 )I
ES
_
e
v
BEQ
V
T
_
Por tanto, (8.24) se puede escribir como:
i
BQ
+i
b
= I
BQ
e
v
be
V
T
(8.25)
Si solo se permiten valores peque nos de v
be
se puede hacer la aproximacion
[4], pag. 942:
e
v
be
V
T
1 +
v
be
V
T
lo cual, junto con (8.25), implica que:
i
b
=
v
be
r

, r

=
V
T
I
BQ
(8.26)
Por otro lado, la siguiente relacion tambien es valida para se nal peque na:
i
c
= i
b
(8.27)
8.3 Dise no de osciladores con forma de onda sinusoidal 477
i
b
i
b
r

i
e
+

be
C
E
B
i
c
(a)
i
b
i
e

be
C E
h
ib
i
b
B
+
i
c
(b)
Figura 8.32. Circuitos equivalentes de se nal peque na del transistor.
Usando (8.26) y (8.27) se obtiene el modelo de se nal peque na del transistor
que se muestra en la gura 8.32(a). Se puede encontrar una equivalencia entre
este modelo y el mostrado en la gura 8.32(b). Notese que la unica diferencia
radica en que el voltaje base-emisor ahora esta dado como una cada de voltaje
debida a la corriente de emisor. Por tanto, la diferencia debe depender del valor
de la nueva resistencia h
ib
, es decir:
v
be
= h
ib
i
e
(8.28)
Comparando (8.26), (8.28), y aclarando que i
e
= (1+)i
b
tambien se cumple,
se obtiene:
h
ib
=
v
be
i
e
=
v
be
(1 +)i
b
=
r

1 +
=
V
T
(1 +)I
BQ
=
V
T
I
EQ
(8.29)
Notese que el valor de h
ib
depende de I
EQ
, es decir, del punto de operacion.
Una vez que se cuenta con el modelo de se nal peque na del transistor, se
procede a encontrar el circuito equivalente de se nal peque na de todo el circuito
oscilador.
Considere el circuito de la gura 8.33(a). La ley de voltajes de Kirchho
aplicada a la malla representada por el recorrido J
3
indica que:
v
cc
= L
di
L
dt
+v
CE
+v
RE
478 8 Circuitos electronicos realimentados
R
2
R
1
R
n
L
C
BP
R
E
C
2
C
1
C
3

CC
R
t
Q
J
3
(a)
RE C2
C1
C3
Rt
C
E
B
L Rex
Rcobre
i
b
i
b
h
ib ie
J3
ic
(b)
Figura 8.33. Obtencion del circuito de se nal peque na para el circuito oscilador
completo.
i
L
= i
LQ
+i
l
(8.30)
v
CE
= v
CEQ
+v
ce
(8.31)
v
RE
= v
REQ
+v
re
(8.32)
Sustituyendo convenientemente, la expresion anterior se puede escribir como:
v
cc
= L
d
dt
(i
LQ
+i
l
) +v
CEQ
+v
ce
+v
REQ
+v
re
Usando (8.16) y v
LQ
= L
diLQ
dt
= 0 en la expresion anterior se obtiene:
0 = L
di
l
dt
+v
ce
+v
re
Por tanto, el circuito equivalente de se nal peque na debe tener un trayecto
como el indicado por J
3
en la gura 8.33(b). Procediendo de manera analoga
con cada una de las posibles mallas y nodos del circuito de la gura 8.33(a) se
encuentra que el circuito equivalente de se nal peque na esta dado como en la
gura 8.33(b). Es importante aclarar que R
cobre
es la resistencia equivalente en
8.3 Dise no de osciladores con forma de onda sinusoidal 479
paralelo de la resistencia interna (debida al cobre) de la inductancia, mientras
que R
ex
= n
2
R donde R es la carga externa a la cual alimenta el circuito
oscilador y n es el cociente del n umero de vueltas de L y el n umero de vueltas
de la inductancia conectada a R.
Finalmente, las resistencias R
1
y R
2
en la gura 8.33(a) desaparecen en
la gura 8.33(b) porque se considera que la impedancia de C
BP
(en paralelo
con R
1
y R
2
) es muy peque na comparada con el equivalente en paralelo de
R
1
y R
2
a la frecuencia de oscilacion
1
, es decir
1
1CBP

R1R2
R1+R2
. Ademas,
si
1
1CBP
h
ib
la impedancia del capacitor puede despreciarse.
Ecuaciones del sistema en lazo cerrado
En esta y en las subsecuentes secciones se analiza el circuito oscilador de la
gura 8.30 en base al circuito equivalente de se nal peque na dado en la gura
8.33(b). Debe recordarse siempre que todo lo que predice este analisis solo
representa el comportamiento que las se nales tienen al rededor del punto de
operacion el cual se determina mediante el analisis en corriente directa.
1
2
i
b
B
i
e
i
c
i
b
h
ib
R
E
R
t E
C
v
out
v
out
i
out
i
out
i
h
i
C
1
C
2
C
3
R
ex
R
cobre
v
o
L
R
in
Figura 8.34. Circuito usado para propositos de analisis.
Para propositos de analisis se abre el lazo de realimentacion que hay a
traves de la resistencia de emisor, tal como se muestra en la gura 8.34 [5],
pag. 265, [6], pag. 64. El valor de R
in
en la gura 8.34 esta dado como:
R
in
= R
t
+
R
E
h
ib
R
E
+h
ib
(8.33)
Ahora se procede a analizar el circuito de la gura 8.34. La impedancia entre
los puntos 1 y 2 esta dada como:
Z
f
(s) =
1
Y
f
(s)
=
1
sC
1
+
R
in
1
sC2
R
in
+
1
sC2
=
sR
in
(C
1
+C
2
) + 1
sC
1
(sC
2
R
in
+ 1)
(8.34)
donde Y
f
(s) es la admitancia entre los puntos 1 y 2. Por otro lado, V
o
(s) e
I(s) se relacionan a traves de:
480 8 Circuitos electronicos realimentados
V
o
(s) = Z
c
(s)I(s) (8.35)
donde:
1
Z
c
(s)
= Y
f
(s) +
1
sL
+sC
3
+
1
R
ex
+
1
R
cobre
(8.36)
Despues de algunas manipulaciones algebraicas se obtiene:
Z
c
(s) =
sL(sR
in
(C
1
+C
2
) + 1)
a
3
s
3
+a
2
s
2
+a
1
s + 1
(8.37)
a
3
= L(C
1
C
2
+C
3
(C
1
+C
2
))R
in
a
2
= LC
1
+LC
3
+
R
cobre
+R
ex
R
cobre
R
ex
LR
in
(C
1
+C
2
)
a
1
= R
in
(C
1
+C
2
) +
R
cobre
+R
ex
R
cobre
R
ex
L
El voltaje V
out
(s) se puede calcular como:
V
out
(s) = M(s)V
o
(s) (8.38)
donde V
out
(s) y V
o
(s) se relacionan con la corriente I
h
(s) mediante:
V
o
(s) =
1
Y
f
(s)
I
h
(s), V
out
(s) =
1
1
Rin
+sC
2
I
h
(s) (8.39)
Combinando ambas expresiones en (8.39) se obtiene:
V
o
(s) =
1
Y
f
(s)
1 +R
in
sC
2
R
in
V
out
(s)
Usando (8.34) se puede escribir:
M(s) =
V
out
(s)
V
o
(s)
=
s(R
2
in
C
1
C
2
s +R
in
C
1
)
R
2
in
C
2
(C
1
+C
2
)s
2
+R
in
(2C
2
+C
1
)s + 1
(8.40)
Utilizando sucesivamente (8.38) y (8.35) se encuentra:
I
out
(s) =
V
out
(s)
R
in
=
1
R
in
M(s)V
o
(s) =
1
R
in
M(s)Z
c
(s)I(s) (8.41)
Por otro lado, aplicando el divisor de corriente en el circuito de emisor de la
gura 8.34 se encuentra:
I
e
(s) =
R
E
R
E
+h
ib
I
out
(s)
Por tanto, si se cumple:
8.3 Dise no de osciladores con forma de onda sinusoidal 481
R
E
h
ib
, 1 (8.42)
entonces se puede aproximar con buen nivel de exactitud:
I
out
(s) I
e
(s) = ( + 1)I
b
(s) I
b
(s) = I(s) (8.43)
es decir, la ganancia de corriente del transistor en la conguracion en base
com un es unitaria. Las expresiones en (8.41) y (8.43) dan origen al diagrama
de bloques de la gura 8.35(a). Este diagrama de bloques tiene realimentacion
positiva, lo cual es una caracterstica fundamental para producir oscilaciones
sostenidas. En la gura 8.35(b) se muestra un diagrama de bloques equiva-
lente que, sin embargo, ahora se expresa como un sistema con realimentacion
negativa. Esto permite la aplicacion de las herramientas de analisis y dise no
de la teora de control ya que todas ellas suponen sistemas en lazo cerrado
con realimentacion negativa como el mostrado en la gura 8.18(d). Por tanto,
la funcion de transferencia de lazo abierto es:
G(s)H(s) =
1
R
in
M(s)Z
c
(s) (8.44)
+
I s ( ) I
out
s ( )
0
+
R
in
M s ( )Z
c
s ( )
(a)
I s ( )
+
I
out
s ( )
0

R
in
M s ( )Z
c
s ( )
(b)
Figura 8.35. Diagramas de bloques equivalentes del circuito en la gura 8.34.
Condiciones para conseguir oscilaciones sostenidas
Primero se estudian las caractersticas de las funciones de transferencia
M(s) y Z
c
(s). Notese que todos los coecientes de estas funciones de trans-
ferencia son positivos. De acuerdo a los criterios vistos en las secciones 4.2.1
482 8 Circuitos electronicos realimentados
y 4.2.2 sobre el signo de los coecientes de polinomios de primero y segundo
grado y sus correspondientes races, se concluye que M(s) tiene dos polos con
parte real negativa, un cero con parte real negativa y un cero en s = 0.
Sin embargo, de acuerdo a la seccion 4.2.3, el criterio de los signos de los
coecientes no puede aplicarse a Z
c
(s) porque su denominador es un polinomio
de tercer grado. Sin embargo, se puede hacer uso de un resultado bien conocido
de la teora de circuitos electricos lineales. Este resultado arma [7], cap. 19,
secciones 5 y 6, que la impedancia de cualquier red formada unicamente por
elementos pasivos (resistencias, capacitores e inductancias) es una funcion de
transferencia que solo tiene polos con parte real menor o igual a cero. Notese
que este es el caso de Z
c
(s). Mas a un, dado que Z
c
(s) tiene en su denominador
un termino independiente de s igual a la unidad, entonces se asegura que Z
c
(s)
tiene tres polos con parte real negativa, un cero con parte real negativa y un
cero en s = 0.
De acuerdo a lo anterior y a lo expuesto en el captulo 6 se concluye que
las gracas de Bode y polares de Z
c
(s) y M(s) tienen las formas mostradas
en las guras 8.36 y 8.37, respectivamente, mientras que la graca polar de
G(s)H(s) dada en (8.44) se muestra en la gura 8.38. Es conveniente subrayar
que la graca polar de G(s)H(s) consiste en dos trayectorias cerradas que son
recorridas en sentido horario conforme la frecuencia vara de a +. El eje
real negativo es cruzado dos veces a las frecuencias =
1
. Notese que en
estos valores de frecuencia la funcion de transferencia G(j)H(j) tiene parte
imaginaria igual a cero. Finalmente, como G(s)H(s) tiene dos ceros en s = 0
para aplicar el criterio de Nyquist se debe hacer un rodeo como el mostrado
en la gura 6.44 alrededor de dichos ceros en el origen. Sin embargo, como
s = , con 0, entonces G(s)H(s) 0 sobre todo ese recorrido y es
representado por un unico punto en el origen. El uso del criterio de Nyquist
permite obtener las siguiente conclusiones:
Si |G(j)H(j)|
=w1
< 1, entonces hay estabilidad de lazo cerrado por lo
que las oscilaciones no pueden sostenerse. Esto se debe a que Z = P +N,
donde P = 0 representa el n umero de polos inestables de G(s)H(s), N = 0
es el n umero de vueltas horarias alrededor del punto (1, 0) en la gura
8.38 y Z = 0 es el n umero de polos inestables de lazo cerrado.
Si |G(j)H(j)|
=w1
> 1, entonces el sistema en lazo cerrado es inestable
porque Z = N + P = 2, con P = 0 y N = 2. Claramente, esta situacion
es indeseable.
Si |G(j)H(j)|
=w1
= 1, entonces hay dos polos imaginarios puros por
lo que habra oscilaciones sostenidas. La parte imaginaria de estos polos es
igual a
1
y representa la frecuencia de oscilacion del circuito.
A partir de estas observaciones, a continuacion se presenta la manera de cal-
cular los elementos del circuito para asegurar que el circuito presentara osci-
laciones sostenidas. Sin embargo, dada la complejidad de las expresiones que
forman a G(s)H(s) se deberan introducir ciertas consideraciones sobre los
componentes del circuito.
8.3 Dise no de osciladores con forma de onda sinusoidal 483
0
fase
grados [ ]
90
!
!
0
dB
+ 90
(a) Gracas de Bode de Zc(s)
! = 0
! = + 1
! = 1
Re Z
c
(j!) ( )
Im Z
c
(j!) ( )
(b) Graca polar de Zc(s) (dos vuel-
tas).
Figura 8.36. Gracas de respuesta en frecuencia de Zc(s) en (8.37).
Calculo de los componentes del circuito
Primero se obtiene la siguiente expresion:
1
Z
c
(j)
=

2
C
2
1
R
in
(R
in
(C
1
+C
2
))
2
+ 1
+
1
R
ex
+
1
R
cobre
+
+ j
_
C
1

2
C
2
R
2
in
(C
1
+C
2
) + 1
(R
in
(C
1
+C
2
))
2
+ 1
+C
3

1
L
_
(8.45)
al hacer el cambio de variable s = j en (8.36), y la siguiente expresion:
M(j) =
R
2
in

2
(C
2
1
+C
1
C
2
) +jR
in
C
1
1 +R
2
in

2
(C
1
+C
2
)
2
(8.46)
al hacer el cambio de variable s = j en (8.40). Con el n de facilitar la ob-
tencion de esta expresion es importante indicar que, durante el procedimiento
484 8 Circuitos electronicos realimentados
0
fase
grados [ ]
90
!
!
0
dB
+ 90
(a) Gracas de Bode de M(s).
! = 0 ! = + 1
! = 1
Im M(j!) ( )
Re M(j!) ( )
(b) Graca polar de M(s).
Figura 8.37. Gracas de respuesta en frecuencia de M(s) en (8.40).
! = 0
! = + 1
! = 1
Re Z
c
(j!) ( )
Im Z
c
(j!) ( )

( 1; j0)
! = !
1
Figura 8.38. Graca polar de G(s)H(s) en (8.44).
8.3 Dise no de osciladores con forma de onda sinusoidal 485
seguido, el factor 1 +R
2
in

2
C
2
2
aparece en el numerador y el denominador de
M(j) por lo que se cancela para obtener nalmente (8.46).
Tal como se menciono previamente la graca polar de G(j)H(j) cruza
el eje real negativo a la frecuencia
1
. Esto signica que las partes imaginarias
de (8.45) y (8.46) deben ser cero cuando se eval uan en =
1
. Aplicando esta
condicion a (8.45) se obtiene:

1
=
1
_
L
_
C1C2
C1+C2
+C
3
_
(8.47)
que representa la frecuencia de oscilacion del circuito. Es muy importante
mencionar que, con el n de simplicar las expresiones y obtener (8.47), se
deben hacer las siguientes suposiciones:
R
2
in

1

2
1
C
2
(C
1
+C
2
)
, R
2
in

1

2
1
(C
1
+C
2
)
2
(8.48)
Por otro lado, la fase de (8.46) esta dada como:
M(j) = arctan
_
1
(C1+C2)
R
in
_
(8.49)
Notese que esta fase es diferente de cero para cualquier valor de frecuencia.
La condicion mencionada previamente que requiere que la parte imaginaria
de M(j) sea cero es equivalente a requerir que la fase en (8.49) sea cero.
Aunque esto no es posible, sin embargo puede obtenerse una fase cercana a
cero para =
1
si:
R
in

1

1
(C
1
+C
2
)
(8.50)
Esta y las otras aproximaciones que se han hecho solo resultaran en peque nas
diferencias entre los valores calculados y los obtenidos experimentalmente de
la frecuencia de oscilacion y la ganancia de la funcion de transferencia de lazo
abierto.
Finalmente, el valor de G(j)H(j)|
=w1
se obtiene como:
|G(j)H(j)|
=w1
=
1
R
in
Re(M(j))|
=1
Re(Z
c
(j))|
=1
(8.51)
donde Re(x) representa la parte real de x. A partir de (8.51) y tomando en
cuenta la suposicion (8.50) se encuentra:
|G(j)H(j)|
=w1
=
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
486 8 Circuitos electronicos realimentados
Por tanto, de acuerdo a la condicion |G(j)H(j)|
=w1
= 1 se concluye que
el circuito oscilara de manera sostenida a la frecuencia dada en (8.47) si:
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
= 1 (8.52)
Al igual que en el caso del oscilador basado en amplicador operacional, es
importante subrayar lo siguiente. En la practica no es posible satisfacer la
condicion (8.52) debido a las incertidumbres que existen en los valores de
los componentes involucrados en dicha condicion. Ademas, estos parametros
pueden cambiar durante la operacion del circuito. La manera de resolver este
problema en la practica es utilizar la siguiente condicion en lugar de (8.52):
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
> 1 (8.53)
Esto hace que al encender el circuito este sea inestable por lo que sus oscilacio-
nes incrementaran su amplitud rapidamente. Sin embargo, este crecimiento en
la amplitud de las oscilaciones no se mantendra de manera indenida debido
a que, antes de que esto suceda, el transistor alcanzara las regiones de satura-
cion (voltaje de colector a emisor cero) y de corte (corriente de colector cero).
Por tanto, la relacion entre I
out
e I en la gura 8.35(b) realmente esta deter-
minada por una funcion saturacion como I = sat(I
out
) mostrada en la gura
8.39. La ganancia de corriente del transistor corresponde a la pendiente de
sat(I
out
), es decir, a
dsat(Iout)
dIout
que depende de la amplitud de I
out
. Por tanto,
el diagrama de bloques de la gura 8.35(b) debe ser cambiado por el de la
gura 8.40 y ahora se tiene que:
G(j)H(j)|
=w1
=
dsat(I
out
)
dI
out
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
(8.54)
Notese que la pendiente
dsat(Iout)
dIout
es igual a la unidad para valores de I
out
cercanos a cero pero disminuye hacia cero conforme I
out
se aleja de cero. Por
tanto, si se satisface (8.53), siempre existe una amplitud de las oscilaciones
para la cual el valor dado en (8.54) se convierte en la unidad y se consiguen las
oscilaciones sostenidas que se desean. Aunque esto sugiere que se puede dise nar
el valor del lado izquierdo de (8.53) tan grande como se desee, sin embargo
no es recomendable hacer esto y se debe dise nar, en cambio, un valor cercano
a la unidad. La razon de esto es que valores muy grandes del lado izquierdo
de (8.53) requieren que se reduzca fuertemente la ganancia de corriente lo
cual implica que el circuito trabaje en una zona fuertemente no lineal y, como
consecuencia, la forma de onda sinusoidal sufrira fuertes deformaciones.
8.3 Dise no de osciladores con forma de onda sinusoidal 487
I = sat(I
out
)
I
out
1
1
Figura 8.39. Caracterstica real entre la corriente de emisor y la corriente de co-
lector en un transistor.
I s ( )
+
I
out
s ( )
0

dI
out
dsat I
out ( )

R
in
M s ( )Z
c
s ( )
Figura 8.40. Diagrama de bloques que considera la saturacion en la corriente de
colector.
Es importante subrayar la diferencia entre lo que sucede en un transistor
y lo que sucede en un amplicador operacional. En un transistor aparece una
funcion saturacion suave sat(I
out
) como resultado de la naturaleza no lineal
del transistor: la ganancia de corriente del transistor disminuye poco a poco al
incrementarse la amplitud de las oscilaciones. Por el contrario, un amplica-
dor operacional es un dispositivo completamente lineal y su modelo no cambia
al crecer las amplitudes. Por ejemplo, considere el amplicador realimentado
de la gura 8.41, el cual tiene ganancia
R1+R
f
R1
. Cuando se alcanza el voltaje
de saturacion de salida del amplicador operacional se obtiene una saturacion
dura como la mostrada en la gura 8.42. Esto signica que no hay una dismi-
nucion progresiva de la ganancia del amplicador operacional realimentado,
sino que hay un cambio abrupto de
R1+R
f
R1
a cero. Por tanto, no existe una
ganancia intermedia que asegure que la magnitud de la funcion de lazo abierto
dada en (8.6) sea igual a la unidad. Esta es la razon de porque debe recurrirse
a un ajuste articial de la ganancia
R1+R
f
R1
usando el truco de los diodos zener
que se muestra en la gura 8.21.
488 8 Circuitos electronicos realimentados
R
1
R
f
e
o
e
i
Figura 8.41. Amplicador lineal.
R
1
R
f
+R
1
+V
sat
V
sat
e
o
e
i
Figura 8.42. Saturacion dura en un amplicador operacional.
Por otro lado, notese que las condiciones (8.48), (8.50) se cumplen automati-
camente si se satisface:
R
in

1

1
C
2
(8.55)
Las condiciones (8.42) y (8.55) son importantes para dise no como se explica
a continuacion. La primera de estas condiciones asegura que la ganancia de
corriente de la conguracion base com un sea unitaria mientras que la segunda
asegura que el capacitor C
2
no sea puesto en corto circuito por la resistencia
R
in
pues si as fuera no funcionara correctamente la realimentacion a traves
de la red capacitiva formada por C
1
y C
2
. Notese tambien que la expresion
entre corchetes en (8.53) representa la resistencia en paralelo de R
ex
, R
cobre
y
R
in
multiplicada por el factor constante [(C
1
+C
2
)/C
1
]
2
. Normalmente R
in
es
peque na comparada con R
ex
y R
cobre
. Si el factor (C
1
+C
2
)/C
1
se selecciona
grande mediante:
C
2
10C
1
(8.56)
8.3 Dise no de osciladores con forma de onda sinusoidal 489
entonces se asegura que el valor del factor entre corchetes en (8.53) es apro-
ximadamente la resistencia equivalente de R
ex
y R
cobre
en paralelo. Entonces
el lado izquierdo de (8.53) esta dado por el valor de esta resistencia equiva-
lente en paralelo (que es muy grande comparada con R
in
) dividido entre el
factor R
in
(C
1
+ C
2
)/C
1
. Por tanto, si se usa (8.56) se puede conseguir que
este cociente sea tan solo un poco mayor que la unidad. Por tanto, las reglas
de dise no del oscilador se resumen en (8.42), (8.55), (8.56), (8.47) y (8.53). Es
interesante mencionar que estas condiciones son las que aparecen en los libros
que tratan sobre el dise no electronico de este tipo de osciladores [6], pag. 65,
[8], pag. 9-13.
Finalmente, es interesante resaltar las ventajas que en este problema tiene
el enfoque basado en la respuesta en frecuencia respecto del enfoque basado a
la respuesta en el tiempo (el estudio de la ubicacion de los polos del sistema en
lazo cerrado). Si se intenta aplicar el segundo de estos metodos se encuentra un
polinomio caracterstico de grado cinco. Al intentar usar el criterio de Routh
para establecer las condiciones en las que hay polos imaginarios puros de lazo
cerrado se encuentra un gran problema: las condiciones resultantes quedan
expresadas de manera muy complicada y es muy difcil encontrar reglas de
dise no claras como las indicadas en (8.42), (8.47), (8.53), (8.55), (8.56).
Resultados experimentales
A continuacion se dise na un circuito que genera una onda sinusoidal de
1.8 [MHz]. Los datos de dise no son los siguientes. v
CC
= 12[V], i
EQ
i
CQ
=
1.3[mA], v
CEQ
= 10.7[V].
Se selecciona un transistor PN2222A que cuenta con un valor de = 200.
Usando (8.16) se encuentra:
R
E
= 1[KOhm]
A partir de i
CQ
= i
BQ
se encuentra que i
BQ
= 6.5 10
3
[mA]. Por tanto,
de acuerdo a (8.18) se propone i
R1Q
= 1[mA]. Con esto y (8.17), (8.19), (8.20)
se calcula:
R
1
= 2[KOhm], R
2
= 10[KOhm]
Se cuenta con una inductancia de valor L = 0.32810
3
[Hy], con una resisten-
cia interna en paralelo R
cobre
= 101677[Ohm], capacitores C
1
= 2710
12
[F],
C
2
= 20010
12
[F] y se supondra que no existe el capacitor C
3
, es decir, que
C
3
= 0. Notese que esta seleccion de capacitores satisface aproximadamente
(8.56). Por tanto, usando (8.47) se encuentra que la frecuencia de oscilacion
del circuito es f
1
= 1.8018[MHz], es decir
1
= 2f
1
= 1.132 10
7
[rad/s].
Por otro lado, tambien se supondra que el oscilador no alimenta ninguna
carga externa lo cual signica que R
ex
, es decir 1/R
ex
= 0. Usando
R
t
= 10000[Ohm], V
T
= 0.026[V], i
EQ
= 1.3[mA], (8.29) y (8.33) se encuentra
R
in
= 10020[Ohm]. Con estos datos se obtiene:
490 8 Circuitos electronicos realimentados
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
= 1.1363
es decir, se satisface (8.53) ademas de (8.55) y (8.42). Por otro lado, se usa un
valor de C
BP
= 0.1 10
6
[F], por lo que
1
1CBP
= 0.883[Ohm]
R1R2
R1+R2
=
1666[Ohm]. Ademas, 0.883[Ohm]h
ib
= 20[Ohm]. Por tanto, se cumplen to-
das las condiciones de dise no establecidas en el apartado anterior. En la gura
8.43 se muestran las variaciones de voltaje v
o
medidas entre las terminales de
la inductancia. La frecuencia medida en este experimento es de 1.388[MHz].
Figura 8.43. Forma de onda obtenida con Rt = 10000[Ohm].
Figura 8.44. Forma de onda obtenida con Rt = 11000[Ohm].
8.3 Dise no de osciladores con forma de onda sinusoidal 491
En la gura 8.44 se muestran las variaciones de v
o
cuando se utiliza un
valor de R
t
= 11000[Ohm], con lo cual se obtiene:
1
R
in
C1+C2
C1
_
_
1
C
2
1
Rin(C1+C2)
2
+
1
Rex
+
1
R
cobre
_
_
= 1.0460 (8.57)
Esto signica que la ganancia de lazo disminuye. Notese que al tener una
ganancia de lazo menor se requieren oscilaciones menos amplias y, por tanto,
una incursion menor de la se nal dentro de la region no lineal del transistor para
conseguir la ganancia de lazo unitaria que asegura las oscilaciones sostenidas.
La mayor amplitud de las oscilaciones en el caso de la gura 8.43, cuando se
usa R
t
= 10000[Ohm], tambien se explica de esta manera. De hecho, puede
alcanzarse a apreciar una ligera distorsion en la parte inferior de la onda
sinusoidal en el caso cuando se usa R
t
= 10000[Ohm].
Finalmente, en las guras 8.45(a), 8.45(b) y 8.46(a) se muestran, respec-
tivamente, las gracas polares de M(s), Z
c
(s) y G(s)H(s) obtenidas con los
valores numericos mencionados y R
t
= 11000[Ohm]. Notese el parecido entre
las guras 8.45(a) y 8.37(b) as como entre las guras 8.45(b) y 8.36(b). Por
otro lado, las guras 8.38 y 8.46(a) tambien son muy parecidas. La aparente
diferencia a frecuencias cercanas a cero se debe a que dicha parte no se alcanza
a apreciar en la gura 8.46(a) porque ocurre a frecuencias muy bajas. Esto se
verica en la gura 8.46(b) donde se presenta un acercamiento en dicha parte
de la gura 8.46(a) y se alcanza a apreciar la parte de la graca polar a la
cual el eje real positivo es tangente en la gura 8.38. En la gura 8.46(a) se
puede apreciar que se cumple (8.57).
492 8 Circuitos electronicos realimentados
Nyquist Diagram
Real Axis
Im
a
g
in
a
r
y
A
x
is
-0.05 0 0.05 0.1 0.15
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
System: M
Real: 0.119
Imag: 0.0047
Frequency (rad/sec): 1.2e+007

! = 0
! = 1

(a) M(s)

! = 0
! = 1
! = + 1
(b) Zc(s)
Figura 8.45. Gracas polares usando los valores numericos del circuito construido
experimentalmente.
8.3 Dise no de osciladores con forma de onda sinusoidal 493
-1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
System: GH
Real: -1.04
Imag: 0.00332
Frequency (rad/sec): -1.13e+007
Nyquist Diagram
Real Axis
Im
a
g
in
a
r
y
A
x
is
! = 0; 1

(a) G(s)H(s)
0.01 0.008 0.006 0.004 0.002 0 0.002 0.004 0.006 0.008 0.01
0.01
0.008
0.006
0.004
0.002
0
0.002
0.004
0.006
0.008
0.01
Nyquist Diagram
Real Axis
Im
a
g
in
a
r
y
A
x
is
(b) G(s)H(s) (acercamiento)
Figura 8.46. Gracas polares usando los valores numericos del circuito construido
experimentalmente (cont.).
494 8 Circuitos electronicos realimentados
8.4. Resumen del captulo
En este captulo se ha mostrado como reducir la distorsion producida por
circuitos electronicos no lineales, construir controladores analogicos usando
circuitos electronicos realimentados y dise nar y construir circuitos osciladores
con forma de onda sinusoidal. La herramienta fundamental para resolver estos
problemas es la teora de control clasico, que incluye la respuesta en el tiempo
y la respuesta en frecuencia.
En el caso de reducir la distorsion producida por circuitos electronicos
no lineales, la idea fundamental es el uso de la funcion de transferencia de
sistema en lazo cerrado
C(s)
R(s)
=
G(s)
1+G(s)H(s)
. La solucion no incluye ning un
analisis de estabilidad ya que se considera que los circuitos involucrados no
tienen dinamica, es decir, que se pueden modelar como simples ganancias
(posiblemente no lineales) y no como ecuaciones diferenciales.
En el caso de la construccion de controladores analogicos es importante
seleccionar el amplicador operacional mas adecuado para cada aplicacion. En
particular, se debe recordar que la ganancia de lazo abierto del amplicador
operacional (denominada A
0
en el presente captulo) en realidad no es una
constante sino que vara con la frecuencia a manera de un ltro pasa bajas.
Esto signica que si la planta a controlar funciona a altas frecuencias (lo cual
depende de la rapidez de la misma planta) entonces el valor de A
0
puede
verse reducido a esa frecuencia. Por tanto, se debera usar un amplicador
operacional que tenga un ancho de banda adecuado.
Finalmente, en el caso de los circuitos osciladores, es de fundamental im-
portancia el concepto de estabilidad marginal. Por tanto, los componentes del
circuito se deben seleccionar de manera que se alcance esta caracterstica de
funcionamiento. Las herramientas fundamentales para analizar y dise nar estos
circuitos son la tecnica de la respuesta en el tiempo (ubicacion de los polos de
lazo cerrado), en el caso de circuitos basados en amplicadores operacionales,
y la tecnica de la respuesta en frecuencia (criterio de estabilidad de Nyquist),
en el caso de circuitos basados en transistores.
8.5. Preguntas de repaso
1. Cuando se dice que un sistema es marginalmente estable? Por que es
importante este concepto para construir circuitos osciladores?
2. Por que se dice que no se puede construir un buen oscilador usando un
circuito electronico completamente lineal? Por que un circuito electronico
no lineal resuelve el problema?
3. Un transistor es un dispositivo electronico no lineal, entonces Por que se
usan tecnicas de control lineal (funcion de transferencia y respuesta en
frecuencia) para dise nar circuitos osciladores basados en transistores?
8.5 Preguntas de repaso 495
4. Por que se necesita usar diodos zener en los osciladores basados en am-
plicadores operacionales? Por que no se usan diodos zener en los osci-
ladores basados en transistores?
5. Que es un modelo de se nal peque na para un transistor?
6. Por que cree que los circuitos osciladores sean sistemas con realimenta-
cion positiva?
7. Explique el mecanismo mediante el cual es posible reducir, usando reali-
mentacion, la distorsion producida por circuitos electronicos no lineales.
8. Por que se debe dise nar un circuito oscilador de manera que sea ligera-
mente inestable?
9. Que opina de la siguiente armacion? La funcion de transferencia de lazo
abierto de un circuito oscilador es un ltro pasa banda.
10. De acuerdo a la pregunta anterior, Que determina la frecuencia de osci-
lacion?
Referencias
1. A.R. Hambley, Electronics. A top-down approach to computer-aided circuit de-
sign, Macmillan Publishing Company, New York, 1994.
2. R.F. Coughlin and F. F. Driscoll, Amplicadores operacionales y circuitos inte-
grados lineales, 4a. edicion, Prentice Hall Hispanoamericana, Mexico, 1993.
3. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
4. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. W. Hayward, Introduction to radio frequency design, The American Radio Relay
League Inc., 1994.
6. P. H. Young, Electronic communication techniques, Merrill Publishing Company,
1990.
7. C.A. Desoer and E.S. Kuh, Basic circuit theory, International Student Edition,
McGraw-Hill, Tokyo, 13th printing 1983.
8. M. Kaufman y A.H. Seidman, Manual para ingenieros y tecnicos en electronica,
McGraw-Hill, Mexico, 1987.
9
Control de velocidad de un motor de CD
u
+

i
R L
e
a
+

T
T
c n
1
n
2
b
m
T
L

b
L
J
m
J
L
T
p
Figura 9.1. Motor de CD con carga.
El problema del control de velocidad de un motor de CD es quiza uno
de los mas sencillos debido a que el modelo de la planta a controlar es de
primer orden y a que, dada la disponibilidad de motores de CD comerciales
de diferentes capacidades, casi no es necesaria la construccion adicional de
partes mecanicas. Por otro lado, los sistemas de control de velocidad tienen
diversas e importantes aplicaciones en la industria que van desde las bandas
transportadoras hasta los procesos de aplanado de laminas metalicas usando
rodillos. Finalmente, otra razon para incluir este problema de control en la
presente obra es el hecho de que otros procesos de diferente naturaleza, como
los sistemas de control de temperatura y los sistemas de control de nivel,
pueden controlarse de manera similar (usando controladores proporcional-
integral) ya que sus modelos tienen la misma estructura.
500 9 Control de velocidad de un motor de CD
Objetivos del captulo
Construir controladores tipo proporcional-integral usando un microcontro-
lador.
Construir la totalidad de las interfases electr onicas necesarias para cons-
truir el sistema de control completo.
Identicar las ventajas y desventajas de los controladores proporcional-
integral.
Aplicar a una situaci on experimental los conceptos de la teora de control
cl asico.
Un motor electrico es un dispositivo que es utilizado para proveer movi-
miento a un sistema mecanico. Existen muchos tipos de motores electricos: de
induccion [1], caps. 10 y 11, de paso a paso [2], sncronos [3], de reluctancia
variable [4], de CD con escobillas y sin escobillas [5], cap. 10, etc. Sin embargo,
el motor de corriente directa (CD) con escobillas y con iman permanente es el
mas sencillo de controlar. Mas a un, dado que su modelo matematico es lineal
y de una entrada-una salida, es el motor ideal para ser usado como prototipo
experimental durante las etapas iniciales de aprendizaje en control automati-
co. En este captulo se estudia el control de velocidad de un motor de CD
con escobillas y con iman permanente. En el proximo captulo se estudia el
control de posicion de este mismo tipo de motor.
9.1. Modelo matematico
En la gura 9.1 se muestra un motor de CD con escobillas y con iman
permanente que mueve a una carga a traves de una caja de engranes. La
nomenclatura utilizada es la siguiente.
u es el voltaje aplicado en las terminales de armadura del motor.
i es la corriente electrica de armadura.
es la posicion angular del rotor del motor.
es la posicion angular de la carga.
e
a
= k
e

es la fuerza contra-electromotriz, donde k
e
es la constante de
fuerza contra-electromotriz.
T = k
m
i es el par electromagnetico generado, donde k
m
es la constante de
par del motor.
T
c
es el par equivalente de la carga reejado sobre la echa del motor. Este
par se opone al movimiento del motor (sentido contrario a ).
T
L
es el par aplicado (por el motor) sobre la carga.
T
p
es un par de perturbacion que se aplica desde el exterior. Se supone
que este par se opone al movimiento de la carga (sentido contrario a ). Si
no es as todo es cuestion de considerar que T
p
es negativo.
L es la inductancia de armadura.
9.1 Modelo matematico 501
R es la resistencia de armadura.
J
m
es la inercia del rotor del motor.
b
m
es la constante de friccion viscosa del motor.
J
L
es la inercia de la carga.
b
L
es la constante de friccion viscosa de la carga.
n
1
y n
2
representan el n umero de dientes del engrane del eje del motor y
del eje de la carga, respectivamente.
Notese que un motor de CD es un sistema electromecanico compuesto por
un subsistema electrico y un subsistema mecanico. El modelo matematico
correspondiente se encuentra modelando por separado cada uno de estos sub-
sistemas para luego unirlos. A continuacion se obtiene el modelo de cada una
de estas partes.
Modelo del subsistema electrico del motor
Aplicando la Ley de Kirchho de voltajes (vease la gura 9.1) se tiene:
voltaje aplicado =

cadas de voltaje en la malla


u = cada en la inductancia + cada en la resistencia +
+fuerza contraelectromotriz
u = L
di
dt
+R i +e
a
(9.1)
donde, de acuerdo a (2.38) en el captulo 2, la fuerza contraelectromotriz
esta dada como:
e
a
= k
e

y el punto representa la primera derivada respecto al tiempo.


Modelo del subsistema mecanico del motor
En esta parte debe usarse la Segunda Ley de Newton. Como existen dos
cuerpos diferentes debe aplicarse la Segunda Ley de Newton a cada uno de
estos cuerpos por separado.
Modelo del rotor
inercia aceleracion angular =

pares sobre la inercia J


m
J
m

= par generado par de friccion par de carga
J
m

= T b
m

T
c
(9.2)
502 9 Control de velocidad de un motor de CD
donde, de acuerdo a (2.39) en el captulo 2, el par electromagnetico generado
esta dado como:
T = k
m
i
La suma en el miembro derecho de (9.2) es una suma vectorial por lo que el
signo indica el sentido en que se aplican los pares. Un signo negativo indica
que dicho par se opone al movimiento de la inercia J
m
mientras que un signo
positivo indica que dicho par favorece el movimiento de la inercia J
m
.
Modelo de la carga
Dada la presencia de una caja de engranes, es necesario utilizar (2.32) y
(2.33), vistas en el captulo 2, para concluir que:
= n , n =
n
2
n
1
(9.3)
T
L
= n T
c
(9.4)
donde n
1
y n
2
representan, respectivamente, el n umero de dientes del engrane
unido al eje del motor y al eje de la carga. Aplicando la Segunda Ley de
Newton a la carga:
inercia aceleracion angular =

pares sobre la inercia J


L
J
L

= T
L
b
L

T
p
(9.5)
Usando (9.2), (9.5), (9.3) y (9.4) se obtiene el modelo combinado del motor
de CD y la carga como:
J
m

= k
m
i b
m


1
n
T
L
J
m

= k
m
i b
m


1
n
_
J
L

+b
L

+T
p
_
n J
m

= k
m
i b
m
n


1
n
_
J
L

+b
L

+T
p
_
_
n
2
J
m
+J
L
_

+
_
n
2
b
m
+b
L
_

= n k
m
i T
p
(9.6)
Si se dene:
J = n
2
J
m
+J
L
, b = n
2
b
m
+b
L
(9.7)
entonces se puede escribir (9.6) como:
J

+b

= n k
m
i T
p
(9.8)
Finalmente, el modelo matematico del motor completo esta dado por (9.1) y
(9.8), es decir:
9.2 Amplicador de potencia 503
L
di
dt
= u R i n k
e

(9.9)
J

= b

+n k
m
i T
p
(9.10)
Notese que la ecuacion diferencial en (9.10) es identica a la presentada en
(2.92) correspondiente al sistema mostrado en la gura 2.28(a) de captulo 2.
Las unicas diferencias se deben a que (2.92) se deja expresada en terminos del
par externo aplicado (igual a k
m
i en un motor de CD) y que en (2.92) no se
considera ning un par externo sobre el cuerpo 2 (T
p
= 0).
Las ecuaciones diferenciales (9.9) y (9.10) representan el modelo matemati-
co del conjunto motor de CD-carga porque si se conocen todas las constantes
as como el voltaje de armadura aplicado, u, se puede resolver la ecuacion di-
ferencial para calcular la posicion de la carga, , como una funcion del tiempo.
Aplicando la transformada de Laplace a las ecuaciones (9.9) y (9.10) conside-
rando todas las condiciones iniciales iguales a cero se encuentra:
I(s) =
1
sL +R
[U(s) n k
e
s(s)] (9.11)
(s) =
1
s
2
J +sb
[n k
m
I(s) T
p
(s)] (9.12)
donde I(s), U(s), (s), T
p
(s) representan las transformadas de Laplace de i,
u, y T
p
, respectivamente.
9.2. Amplicador de potencia
Es importante subrayar la necesidad de usar un amplicador de potencia.
Un sistema de control se puede dividir en dos partes: i) la parte de control y
ii) la parte de potencia. La parte de control incluye a toda la parte electronica
encargada de procesar la informacion (sensores y algoritmos de control) que
es utilizada para determinar cual es la orden que debe ser enviada al proceso
a controlar. Esta tarea requiere de circuitos precisos que funcionan utilizando
niveles bajos de corriente, es decir, procesan informacion pero no procesan
niveles importantes de potencia por lo que las ordenes que envan son debiles.
Sin embargo, estas ordenes deben ser capaces de producir cambios importan-
tes en la entrada del proceso a controlar y generalmente la entrada del proceso
maneja niveles importantes de potencia para poder producir los cambios es-
perados en el proceso. Esta es la razon de incluir la etapa de potencia en un
sistema de control. La etapa de potencia normalmente consiste de un ampli-
cador de potencia que a su entrada recibe la debil se nal entregada por el
controlador (se nal de control) y a su salida entrega una se nal de alta potencia
que se aplica directamente a los actuadores colocados en la entrada del pro-
ceso a controlar. Por ejemplo, en los sistemas electromecanicos los actuadores
utilizados son motores electricos que son equipos capaces de transformar una
se nal electrica en la fuerza o el par que necesita el mecanismo para realizar el
504 9 Control de velocidad de un motor de CD
movimiento deseado. La se nal de control es una se nal electrica debil entrega-
da por el controlador (computadora, microcontrolador o circuitos electronicos
analogicos) mientras que un motor electrico necesita una se nal de gran poten-
cia para producir la fuerza requerida. As, el amplicador de potencia utilizado
se debe colocar entre la se nal entregada por el controlador y la se nal aplicada
al motor electrico. De acuerdo a esto, un amplicador de potencia se puede
modelar como una ganancia A
p
que relaciona al voltaje recibido en su entrada
u
i
(se nal de control) con el voltaje entregado en su salida u (en las terminales
de armadura del motor):
u = A
p
u
i
(9.13)
9.3. Control de corriente
Una tecnica de control para motores electricos que es muy usada en la
industria [5], pag. 76, [6], [7], consiste en colocar un lazo interno de corriente.
En su forma mas sencilla este lazo consiste en un controlador proporcional de
corriente. Esto signica que la se nal de control se calcula como:
u
i
= K(i

i) (9.14)
donde K es una constante positiva que representa la ganancia del controlador
proporcional de corriente mientras que i

representa la consigna de corriente


que debe ser obtenida como la salida de otro controlador (lazo externo) que se
encarga de controlar la variable deseada, es decir, la velocidad o la posicion.
Mas adelante se explicara como se dise na dicho lazo externo de control. Por
lo pronto supongase que i

es simplemente el valor deseado de corriente que


sera especicado de alg un modo. Usando (9.13) y (9.14) se encuentra que el
voltaje aplicado en las terminales de armadura del motor de CD esta dado
como:
u = A
p
K(i

i) (9.15)
Aplicando la transformada de Laplace a (9.15) se encuentra:
U(s) = A
p
K(I

(s) I(s)) (9.16)


donde I

(s) es la transformada de Laplace de i

. Combinando (9.11), (9.12) y


(9.16) se obtiene el diagrama de bloques de la gura 9.2(a). Como se muestra
en el ejemplo 4.4 de la seccion 4.1 a partir de la gura 9.2(a) se pueden
hacer las simplicaciones mostradas en las guras 9.2(b) y 9.2(c). Tambien se
muestra en el ejemplo 4.4 de la seccion 4.1 que, a partir de la gura 9.2(c), se
puede escribir:
(s) = G
1
(s)I

(s) +G
2
(s)T
p
(s) (9.17)
9.3 Control de corriente 505
+
+

(s) I(s) +

T
p
s ( )
s ( )
nk
m
A
p
U s ( )
nk
e
s
U
i
s ( )
K
Ls+R
1
Js
2
+bs
1
(a)
Js
2
+bs
1
Ls+R
1
I

(s)
+

+
I(s)
+

(s)
T
p
s ( )
nk
m
KA
p
KA
p
nk
e
s
(b)
Js
2
+bs
1
I

(s) +

(s) I(s)
T
p
s ( )
nk
m
KA
p
nk
e
s
Ls+R+KAp
KAp
(c)
+
I

(s)

nk
m
T
p
s ( )
Js
2
+bs
1
s ( )
(d)
Figura 9.2. Diagramas de bloques equivalentes para un motor de CD con un lazo
proporcional de corriente y un amplicador de potencia.
donde:
G
1
(s) =
nk
m
__
sL+R
KAp
+ 1
_
(sJ +b) +
n
2
kmke
KAp
_
s
(9.18)
G
2
(s) =

_
sL+R
KAp
+ 1
_
__
sL+R
KAp
+ 1
_
(sJ +b) +
n
2
kmke
KAp
_
s
(9.19)
506 9 Control de velocidad de un motor de CD
Si la ganancia K se selecciona sucientemente grande entonces se puede con-
siderar que [5], pag. 76:
sL +R
KA
p
0,
n
2
k
m
k
e
KA
p
0
para aproximar (9.18) y (9.19) como:
G
1
(s) =
nk
m
s
2
J +sb
(9.20)
G
2
(s) =
1
s
2
J +bs
(9.21)
Usando (9.20) y (9.21) en (9.17) se obtiene:
(s) =
1
s
2
J +sb
[nk
m
I

(s) T
p
(s)] (9.22)
lo cual se representa usando un diagrama de bloques en la gura 9.2(d). Notese
que el objetivo del control de corriente mostrado en (9.15) es hacer desprecia-
ble la dinamica electrica del motor de manera que el modelo del motor ahora
solo esta representado por la parte mecanica del mismo. Esto puede apreciarse
claramente si se comparan (9.22) y (9.12). Estas dos expresiones indican que
ahora puede considerarse que es la corriente la que se utiliza como variable
de control y no el voltaje como se indicaba en (9.11). Es claro que el voltaje
sigue siendo la variable que se manipula directamente como lo indica (9.15),
sin embargo, para propositos de analisis y dise no del sistema de control se
puede suponer que es la corriente la que se manipula directamente a traves
de la consigna de corriente i

. El proposito del control de corriente (9.15) es


conseguir que el valor actual de la corriente i siga de cerca a la consigna i

para lo cual es muy conveniente usar un valor grande de la ganancia K. Notese


que la expresion en (9.22) se puede reescribir como se muestra a continuacion:
(s) =
1
s(s +a)
[kI

(s)
1
J
T
p
(s)] (9.23)
a =
b
J
, k =
nk
m
J
Finalmente, dado que la velocidad y la posicion se relacionan a traves de
=
d
dt
, entonces usando la transformada de Laplace con condiciones iniciales
cero se tiene que (s) = s(s). Por tanto, la expresion en (9.23) se puede
reescribir como:
(s) = s(s) =
1
s +a
[kI

(s)
1
J
T
p
(s)] (9.24)
En lo que resta de este captulo se utilizara el modelo dado en (9.24) para
dise nar controladores de velocidad. Tambien se presentaran algunos resultados
experimentales obtenidos con dichos controladores.
9.4 Identicacion 507
9.4. Identicacion
En esta seccion es de interes realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (9.24). A continuacion se
explica la manera de dise nar dicho experimento.
Suponga que no hay ninguna perturbacion externa aplicada, es decir
T
p
(s) = 0, por lo que el modelo (9.24) se reduce a:
(s) =
k
s +a
I

(s) (9.25)
Este es un sistema de primer orden como el estudiado en la seccion 3.1. Por
tanto, si se aplica el valor constante i

= A, es decir I

(s) =
A
s
, entonces la
velocidad evolucionara en el tiempo como se muestra en la gura 9.3, es
decir:

a
kA
a
kA
a
kA
0:632
a
kA
tiempo
!(t)
Figura 9.3. Evolucion de la velocidad de un motor de CD cuando se aplica un valor
constate i

= A.
(t) =
kA
a
_
1 e
at
_
(9.26)
La constante de tiempo se puede medir como se muestra en la gura 9.3
y sabiendo que =
1
a
, se puede calcular el valor del parametro a. Por otro
508 9 Control de velocidad de un motor de CD
lado, deniendo el valor nal de velocidad como
f
= lm
t
(t) =
kA
a
y
conociendo el valor de a, se puede calcular k =
a
f
A
.
En la gura 9.4 se presentan los resultados obtenidos al realizar el experi-
mento descrito en el procedimiento anterior. El ruido contenido en la medicion
de velocidad es evidencia de un hecho bien conocido en sistemas de control:
la velocidad es una se nal ruidosa. Vease la seccion 9.6 para una explicacion
de porque se mide en volts. Se utiliza un valor i

= A = 0.3[A] y midiendo
directamente en la gura 9.4 se encuentran los valores:
= 2.7[s],
f
= 2[V] (9.27)
Estas mediciones se simplican y al mismo tiempo se hacen mas exactas si
se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:
a = 0.3704, k = 2.4691 (9.28)
Finalmente, es importante aclarar que no es de interes calcular el valor del
factor 1/J que aparece como coeciente de la perturbacion T
p
(s) en (9.24).
La razon de esto es que normalmente incluso el valor de T
p
no es conocido y
a pesar de ello su efecto puede ser compensado.
tiempo s [ ]
!
V [ ]
= 2:7

0:632 2
Figura 9.4. Identicacion experimental de un motor de CD.
9.5 Control de velocidad 509
9.5. Control de velocidad
El dise no de un controlador tiene como objetivo asegurar que en lazo cerra-
do se consigan las caractersticas deseadas de respuesta transitoria y en estado
estacionario. Las caractersticas de respuesta transitoria se reeren a la cons-
tante de tiempo (rapidez de respuesta) deseada, la cual se asigna mediante
la ubicacion conveniente de los polos de lazo cerrado. Por otro lado, las ca-
ractersticas de respuesta en estado estacionario se consiguen al asegurar que
cuando el tiempo crece el valor de la velocidad alcanza la velocidad deseada

d
a pesar de la presencia de una perturbacion externa T
p
(s). El controla-
dor es el dispositivo que se encarga de que se satisfagan las caractersticas de
respuesta transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la velocidad deseada es una constante o un escalon, es decir

d
es una constante. Dado que la planta en (9.24) no tiene polos en s = 0
entonces es de tipo 0. Esto signica que el uso de un controlador proporcional
de velocidad de la forma i

= k
p
(
d
), con k
p
> 0, no puede conseguir
que =
d
en estado estacionario incluso si no hay perturbaciones externas
de par, es decir, a un cuando T
p
= 0. La solucion a este problema es utilizar
un controlador que tenga una accion integral, para que el sistema sea de tipo
1, es decir usar un controlador proporcional-integral (PI). Sin embargo, tal
como se explica en la seccion 5.2.4, un controlador PI no puede conseguir
simultaneamente las caractersticas de respuesta transitoria deseadas y un
rechazo satisfactorio de las perturbaciones externas T
p
(s). Por esta razon, a
continuacion se muestra la manera de construir un controlador PI modicado
que puede conseguir simultaneamente estos requerimientos.
9.5.1. Un controlador PI modicado
Aplicando la transformada inversa de Laplace a (9.24) se obtiene la si-
guiente ecuacion diferencial:
+a = ki

1
J
T
p
(9.29)
A continuacion se demuestra que el siguiente controlador:
i

= k
p
(
d
) +k
i
_
t
0
(
d
(r))dr +
a
k

d
+k
1
((0)
d
) (9.30)
donde (0) es la velocidad inicial, consigue que ante una velocidad deseada
constante
d
la velocidad alcance dicho valor deseado en estado estacionario,
que responda con una constante de tiempo jada a voluntad y que el efecto
de una perturbacion constante T
p
desaparezca tan rapido como se desee.
Sustituyendo (9.30) en (9.29) y acomodando terminos se encuentra:
+ (a +k
p
k)(
d
) +k
i
k
_
t
0
((r)
d
)dr = k
1
k((0)
d
)
1
J
T
p
510 9 Control de velocidad de un motor de CD
Deniendo:
k
p
= k

p
+k
1
se obtiene:
+ (a +k

p
k)(
d
) +k
i
k
_
t
0
((r)
d
)dr
+k
1
k[
d
((0)
d
)] =
1
J
T
p
Notese que:

d
((0)
d
) =
_
t
0
( (r)
d
)dr
y si ademas de dene:
k
i
= k

i
k
1
entonces:
+ (a +k

p
k)(
d
) + k
1
k
_
t
0
[k

i
((r)
d
) + ( (r)
d
)] dr
=
1
J
T
p
(9.31)
Pero como
d
es una constante, entonces
d
= 0. As que si se dene:
k

i
= a +k

p
k
=
_
t
0
[ (r) +k

i
((r)
d
)] dr
entonces se puede escribir (9.31) como:

+k
1
k =
1
J
T
p
Aplicando la transformada de Laplace con condiciones iniciales cero:
(s) =

1
J
s +k
1
k
T
p
(s)
o tambien:
s(s) =

1
J
s
s +k
1
k
T
p
(s) (9.32)
Si T
p
= t
d
es una constante, es decir T
p
(s) =
t
d
s
entonces:
9.5 Control de velocidad 511
s(s) =

1
J
s
s +k
1
k
t
d
s
Aplicando el teorema del valor nal se tiene:
lm
t

(t) = lm
s0
s [s(s)]
= lm
s0
s
_

1
J
s
s +k
1
k
t
d
s
_
= 0
As que si k
1
k > 0, el ltro en (9.32) es estable y se asegura que lm
t

(t) =
0. Mas a un, la rapidez con que

(t) se aproxima a cero es mayor conforme
k
1
k > 0 es mayor. Notese que lm
t

(t) = 0 implica que:
d
dt
_
t
0
[ (r) +k

i
((r)
d
)] dr = +k

i
(
d
) 0
tambien tiende a cero. Esto signica que el efecto de la perturbacion constante
desaparece al crecer el tiempo y solo queda la ecuacion diferencial +k

i
=
k

d
, la cual es estable si k

i
> 0, tiene constante de tiempo =
1
k

i
y tiene
ganancia unitaria en estado estacionario. Todo esto signica que:
Si no hay perturbacion (T
p
= 0 y

(t) = 0 para todo t 0), la respuesta
en velocidad es como la de un sistema de primer orden con constante de
tiempo =
1
k

i
. La velocidad alcanza la velocidad deseada
d
(constante)
en estado estacionario.
Si aparece una perturbacion constante (T
p
= t
d
= 0), la desviacion pro-
ducida por la perturbacion desaparece al crecer el tiempo. Mas a un, si
se escoge un valor de k
1
mayor (de manera que el producto k
1
k > 0 es
mayor), entonces la desviacion producida por la perturbacion desaparece
mas rapido. Si una vez que la desviacion debida a la perturbacion es lle-
vada a cero (cuando =
d
) se ordena un cambio en el valor constante
de
d
(se ordena un cambio de velocidad deseada
d
estando presente la
perturbacion T
p
), entonces la velocidad responde como si la mencionada
perturbacion constante T
p
no existiera, es decir, como en el punto anterior:
con una constante de tiempo =
1
k

i
y la velocidad alcanza la velocidad
deseada
d
en estado estacionario.
Debido a que en control clasico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que (0) = 0 y el controlador en
(9.30) se escribe como:
i

= k
p
(
d
) +k
i
_
t
0
(
d
(r))dr +
_
a
k
k
1
_

d
(9.33)
que constituye un simple controlador PI con un termino constante de prea-
limentacion. Finalmente, la regla de sintona es resumida por la siguientes
expresiones:
512 9 Control de velocidad de un motor de CD
k
p
= k

p
+k
1
(9.34)
k
i
= k

i
k
1
k

i
= a +k

p
k
donde:
k

p
> 0 se elige de modo que quede jada la constante de tiempo deseada
=
1
k

i
=
1
a+k

p
k
, la cual siempre es menor que la constante de tiempo de
la planta a controlar
1
a
, lo cual es muy conveniente.
k
1
> 0 se elige grande para reducir rapidamente a cero la desviacion de-
bida a la perturbacion. Esto puede hacerse al tanteo o puede calcularse
recordando que
1
k1k
es la constante de tiempo del ltro en (9.32), el cual
es el responsable de eliminar la desviacion producida por la perturbacion.
Otra manera (mas conocida) de dise nar un controlador PI con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
seccion.
9.5.2. Un controlador con dos grados de libertad
Un sistema en lazo cerrado que cuenta con un controlador con dos grados
de libertad tiene la estructura mostrada en la gura 9.5. El controlador esta
formado por los dos componentes con funciones de transferencia G
c1
(s) y
G
c2
(s), mientras que G
p
(s) es la planta que se desea controlar. Tambien se
toma en cuenta la presencia de una perturbacion a la entrada de la planta
D(s). En el ejemplo 4.5 de la seccion 4.1 se muestra que la salida del sistema
en lazo cerrado se puede calcular como:
(s) = G
1
(s)
d
(s) +G
2
(s)D(s)
donde:
G
1
(s) =
G
c1
(s)G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
G
2
(s) =
G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
(9.35)
son las funciones de transferencia:
G
1
(s) =
(s)

d
(s)
, cuando D(s) = 0
G
2
(s) =
(s)
D(s)
, cuando
d
(s) = 0
La razon por la cual este esquema recibe el nombre de controlador de dos
grados de libertad es que las dos funciones de transferencia denidas en (9.35)
9.5 Control de velocidad 513
pueden ser sintonizadas independientemente una de la otra utilizando para
ello, como variables independientes (o grados de libertad), a las dos partes del
controlador G
c1
(s) y G
c2
(s). Dado que la planta que interesa en este captulo
+

(s)
+

+
+
D(s)
G
p
s ( )
G
c1
s ( )
G
c2
s ( )
!
d
(s) !(s)
Figura 9.5. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.
es un motor de CD, suponga que:
G
p
(s) =
k
s +a
Suponga tambien que G
c1
(s) y G
c2
(s) son controladores PI, es decir:
G
c1
(s) =
k
p1
s +k
i1
s
, G
c2
(s) =
k
p2
s +k
i2
s
G
c
(s) = G
c1
(s) +G
c2
(s) =
k
p
s +k
i
s
, k
p
= k
p1
+k
p2
, k
i
= k
i1
+k
i2
Por tanto, la primera funcion de transferencia en (9.35) se puede escribir como:
(s)

d
(s)
=
G
c1
(s)
k
s+a
1 +
kps+ki
s
k
s+a
=
skG
c1
(s)
s
2
+ (a +k
p
k)s +k
i
k
(9.36)
Suponga que se desea que la respuesta en lazo cerrado, ante una referencia
deseada, sea la de un primer orden con un polo en s = p
1
, con p
1
> 0.
Entonces el polinomio caracterstico en la expresion anterior debe satisfacer:
s
2
+ (a +k
p
k)s +k
i
k = (s +p
1
)(s +f)
= s
2
+ (p
1
+f)s +p
1
f
donde la raz en s = f, f > 0, se introduce solo para conseguir un poli-
nomio de segundo orden en el miembro derecho de esta expresion. Igualando
coecientes en ambos miembros se obtiene:
514 9 Control de velocidad de un motor de CD
a +k
p
k = p
1
+f, k
i
k = p
1
f
de donde se encuentra:
k
p
=
p
1
+f a
k
, k
i
=
p
1
f
k
Por otro lado, con el n de que la respuesta ante una referencia deseada sea
la de un primer orden con un polo en s = p
1
, la funcion de transferencia en
(9.36) debe tener la forma:
(s)

d
(s)
=
p
1
(s +f)
s
2
+ (a +k
p
k)s +k
i
k
=
p
1
(s +f)
(s +p
1
)(s +f)
=
p
1
s +p
1
(9.37)
Por tanto, igualando (9.36) y (9.37) se encuentra que:
skG
c1
(s) = p
1
(s +f)
de donde se concluye que G
c1
(s) es un controlador PI:
G
c1
(s) =
k
p1
s +k
i1
s
, k
p1
=
p
1
k
, k
i1
=
p
1
f
k
Con este resultado se puede calcular G
c2
(s) como:
G
c2
(s) = G
c
(s) G
c1
(s) =
k
p2
s +k
i2
s
, k
p2
=
f a
k
, k
i2
= 0
Es decir, G
c2
(s) = k
p2
es un controlador proporcional. Por otro lado, la se-
gunda funcion de transferencia en (9.35) toma la forma:
(s)
D(s)
=
k
s+a
1 +
kps+ki
s
k
s+a
=
ks
s
2
+ (a +k
p
k)s +k
i
k
=
ks
(s +p
1
)(s +f)
(9.38)
Usando esta expresion y el teorema del valor nal se puede comprobar que
el efecto de una perturbacion externa constante D(s) =
t
d
Jks
desaparece
conforme el tiempo crece. Mas a un, la rapidez con que esto sucede es mayor
conforme f y p
1
son mayores. Como p
1
esta jada por la rapidez de respuesta
deseada ante una referencia constante, entonces f es el parametro que que-
da libre. Entonces, f debe escogerse grande. De acuerdo a la gura 9.5, el
controlador esta dado como:
I

(s) = G
c1
(s)(
d
(s) (s)) G
c2
(s)(s)
= k
p1
(
d
(s) (s)) +k
i1
(
d
(s) (s))
s
k
p2
(s)
9.6 Prototipo experimental 515
= (k
p1
+k
p2
)(
d
(s) (s)) +k
i1
(
d
(s) (s))
s
k
p2

d
(s)
= k
p
(
d
(s) (s)) +k
i1
(
d
(s) (s))
s
k
p2

d
(s)
(9.39)
Usando la transformada inversa de Laplace se obtiene nalmente:
i

= k
p
(
d
) +k
i1
_
t
0
(
d
(r))dr k
p2

d
(9.40)
Notese que los controladores en (9.40) y (9.33) son identicos si se dene:
k
1
=
f
k
, p
1
= k

i
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 9.5.1 o 9.5.2 para obtener este controlador es el que preere.
9.6. Prototipo experimental
A continuacion se listan los componentes principales del sistema de control.
Microcontrolador PIC16F877A [8].
Convertidor digital/analogico de 8 bits DAC0800LCN.
2 motores de CD con escobillas e iman permanente. Voltaje nominal de
24[V], corriente nominal de 2.3[A].
Las echas de los dos motores se unen de modo que uno de los motores se
utiliza como generador. El voltaje generado es utilizado como la medicion de
la velocidad del otro motor el cual es controlado de acuerdo a la ley de control
en (9.33).
En la gura 9.6 se muestra el diagrama electrico utilizado para construir
el sistema de control de velocidad. El algoritmo de control en (9.33) se calcula
usando el microcontrolador PIC16F877A. Es decir, conocido el valor deseado
de velocidad
d
y la medicion de la velocidad , el microcontrolador calcula
el valor de la se nal de control i

en (9.33). En la seccion 9.9 se muestra el


listado del programa utilizado.
A continuacion se describe la manera en que el microcontrolador PIC16F87
7A realiza su funcion de controlador. Antes que nada se debe aclarar que no
es el proposito presentar toda una exposicion de como trabaja este micro-
controlador. Lo que se presenta es una descripcion de los recursos de este
microcontrolador que se utilizan para construir el controlador bajo prueba.
Se usa el canal 0 del convertidor analogico/digital con que cuenta este mi-
crocontrolador. Solo se utilizan los 8 bits mas signicativos de este convertidor
el cual tiene un rango analogico de entrada de [0,+5][V]. Por tanto, el dato
516 9 Control de velocidad de un motor de CD
Figura 9.6. Diagrama electrico del sistema de control de velocidad de un motor de
CD.
9.6 Prototipo experimental 517
entregado por el convertidor t 0 es sometido a la operacion: w=0.0196*t 0
(donde 0.0196=5/255) para obtener en la variable w el voltaje a la entrada
del convertidor analogico/digital. Este voltaje es el entregado por el motor que
se utiliza como generador y es proporcional a la velocidad del motor que se
quiere controlar. Por tanto, se asume que este voltaje representa el valor me-
dido de velocidad. Notese que antes de entrar al convertidor analogico/digital
(por el pin 2 del microcontrolador), el voltaje del generador pasa a traves de un
divisor de tension que tiene como funcion adaptar el maximo voltage generado
(12.3[V] a velocidad maxima) a un valor de 5[V], es decir dentro del rango del
voltaje analogico que maneja el convertidor analogico/digital. El amplicador
operacional TL081 es utilizado para proteger al microcontrolador.
Tal como se indica en la gura 9.6 el valor de i

debe aparecer a la entra-


da del amplicador operacional TL081 dentro del recuadro titulado control
de corriente. Esto se consigue del siguiente modo. Primero, en el programa
listado en la seccion 9.9 se hace iast=-iast, para cambiar el signo de i

a i

.
El microcontrolador debe entregar un codigo digital (iastd) de 8 bits al conver-
tidor digital/analogico de 8 bits DAC0800LCN. Para esto, el microcontrolador
realiza la operacion:
iastd = 36.4286 iast + 127
la cual obedece a la relacion mostrada gracamente en al gura 9.7. Una vez
iast 3:5 3:5
255
127
iastd
Figura 9.7. Acondicionamiento de la se nal i

que debe ser enviada al convertidor


digital-analogico.
calculada iastd se entrega al convertidor digital/analogico a traves del puer-
to D (PORTD=iastd). El convertidor digital/analogico trabaja en conjunto
con un amplicador operacional TL081. Estos dispositivos estan conectados
de acuerdo a las sugerencias del fabricante [9]. Esto asegura que a la salida del
518 9 Control de velocidad de un motor de CD
amplicador operacional se obtiene un voltaje cuyo valor numerico correspon-
de al de i

. Este valor es recibido por otro amplicador operacional TL081


que se encarga de evaluar el lazo de corriente:
u
i
= 100(i

i)
La razon de que deba aparecer i

en el lugar que se indica en la gura 9.6


tiene que ver con la compatibilidad de signos que deben respetar los ampli-
cadores operacionales colocados en dicha gura. Por otro lado, el amplicador
de potencia de ganancia unitaria esta constituido por un tercer amplicador
operacional TL081 junto con dos transistores de potencia TIP141 y TIP145,
conectados en simetra complementaria
El Manejador/Receptor MAX232 se encarga de enviar la velocidad medi-
da y la se nal de control i

hacia una computadora portatil (a traves de un


conector USB a serie) cuyo unico proposito es el gracado de dichas variables.
Esto se hace a traves de las variables cuentaH=0x00 y cuentaL=t 0 (para
enviar la velocidad) o cuentaH=0x00 y cuentaL=(iastd) &(0xFF) (para
enviar la se nal de control). Estos datos son enviados a la computadora portatil
mediante las instrucciones: putc(0xAA); putc(cuentaH); putc(cuentaL);. Fi-
nalmente, el timer TMR0 es utilizado para establecer un periodo de muestreo
T = 0.002[seg] (40 cuentas del timer 0).
9.6.1. Control de corriente
El lazo de corriente presentado en (9.14) se construye del siguiente modo.
Se conecta una resistencia de potencia (de ceramica) de 1[Ohm] en serie con
la armadura del motor de CD. Esto permite que en las terminales de dicha
resistencia aparezca un voltaje que numericamente es igual a la corriente i
que circula por el motor. Entonces, el amplicador operacional mostrado en
el bloque control de corriente de la gura 9.6 realiza la operacion indicada
en (9.14) con K = 100.
9.6.2. Amplicador de potencia
De acuerdo a lo expuesto en la seccion 8.1.2 el bloque denominado ampli-
cador de potencia en la gura 9.6 permite reducir la zona muerta introdu-
cida por los transistores de potencia conectados en simetra complementaria.
Ademas, con los valores ah presentados se consigue A
p
= 1 en (9.13) y en
(9.15). Esto permite obtener A
p
K = 100. Este valor fue elegido porque con
el se obtuvieron resultados satisfactorios. Es ilustrativo resaltar que en los
manejadores comerciales para uso industrial es com un encontrar valores tan
grandes como A
p
K = 700 [7].
9.7 Resultados experimentales 519
9.7. Resultados experimentales
En la gura 9.8 se muestran los resultados experimentales obtenidos con
el controlador en (9.33) (o equivalentemente con el controlador en (9.40)) y
con el prototipo experimental descrito en la seccion previa. Partiendo de una
velocidad inicial igual a cero, se ordena la siguiente velocidad deseada que
tiene la forma de tres escalones sucesivos:

d
=
_
_
_
1.5, 0 t < 4
2.5, 4 t < 12
1.5, t 12
(9.41)
Tambien se aplica, via software, una perturbacion constante de valor T
p
= 2.5
0 2 4 6 8 10 12 14 16 18 20 22
0
0.5
1
1.5
2
2.5
3
0 2 4 6 8 10 12 14 16 18 20 22
-3
-2
-1
0
1
2
3
tiempo s [ ]
V [ ]
A [ ]
!
i

0:623
0:632 1:5

Figura 9.8. Control de velocidad usando el controlador PI modicado mostrado en


(9.33) (o equivalentemente con el controlador en (9.40).
en t = 8[s], la cual desaparece en t = 17[s]. Las ganancias del controlador en
(9.33) se calculan de acuerdo a (9.34) junto con los valores numericos en (9.28)
y:
k

p
= 0.5, k
1
= 4.0
lo cual ja la constante de tiempo deseada en = 0.6231[s]. En la gura 9.8
se muestra la velocidad medida como resultado del experimento y una linea
520 9 Control de velocidad de un motor de CD
blanca que representa la respuesta, obtenida en simulacion, del sistema sin
perturbaciones:
+k

i
= k

d
(9.42)
con k

i
=
1
0.6231
, es decir el valor calculado de acuerdo a (9.34), y con
d
dada en
(9.41). Notese que la respuesta experimental de velocidad sigue exactamente
la respuesta teorica dictada por (9.42) y que esto sigue siendo cierto durante
la transicion de
d
= 2.5 a
d
= 1.5 en t = 12[s] a pesar de que durante dicha
transicion sigue aplicada la perturbacion constante T
p
= 2.5. Esto comprueba
las armaciones establecidas justo antes de (9.33). Ademas, es importante
subrayar que se han conseguido exactamente las especicaciones de respuesta
transitoria y de estado estacionario y ademas las desviaciones que aparecen
cuando se aplica y desaparece la perturbacion externa son llevadas a cero
rapidamente.
A continuacion se muestran los resultados obtenidos con un controlador
PI clasico con el n de comparar con los resultados obtenidos en la gura 9.8.
En la gura 9.9 se muestran los resultados obtenidos usando un controlador
PI clasico cuando se seleccionan las ganancias de acuerdo a:
k
i
k
p
= a, =
1
k
p
k
= 0.6231[s] (9.43)
seg un se discute en la seccion 5.2.4, con la constante de tiempo deseada en
lazo cerrado. La velocidad deseada
d
es identica a la mostrada en (9.41) y se
aplica una perturbacion identica a la usada en la gura 9.8, es decir, se aplica
via software una perturbacion constante de valor T
p
= 2.5 en t = 8[s], la cual
desaparece en t = 17[s]. Se observa lo siguiente:
La parte transitoria de la respuesta, aunque cercana a la deseada, no es
tan exacta como en la gura 9.8 (la lnea tenue representa la respuesta
transitoria deseada).
La velocidad medida en estado estacionario alcanza la velocidad deseada
cuando no hay perturbacion externa aplicada, es decir, antes de t = 8[s].
La desviacion producida por la aparicion de una perturbacion externa es
mucho mas grande que en la gura 9.8 y tarda mucho mas tiempo en ser
compensada. De hecho esta desviacion no alcanza a ser compensada antes
de que aparezca el nuevo cambio de valor deseado de velocidad en t = 12[s].
Se aprecia lo mismo cuando la perturbacion desaparece en t = 17[s]. De
acuerdo a la seccion 5.2.4, esto se debe a que la dinamica de respuesta
ante la perturbacion tiene una constante de tiempo dominante igual a la
constante de tiempo del motor en lazo abierto
1
a
, la cual es de 2.7[s] como
se indica en (9.27).
En la gura 9.10 se muestran los resultados obtenidos usando un contro-
lador PI clasico cuando se seleccionan las ganancias de acuerdo a:
9.7 Resultados experimentales 521
0 2 4 6 8 10 12 14 16 18 20 22
0
1
2
3
4
5
0 2 4 6 8 10 12 14 16 18 20 22
-3
-2
-1
0
1
2
3
!
i

tiempo s [ ]
V [ ]
A [ ]
0:623

Figura 9.9. Control PI clasico de velocidad usando la regla de sintona en (9.43).


k
i
k
p
= d, d = 1.4 < p
1
, k
p
=
l
2
l
3
l
1
k
(9.44)
l
1
= abs(p
1
+d), l
2
= abs(p
1
), l
3
= abs(p
1
+a), p
1
=
1
0.6231
= 1.6
Este criterio de sintona es presentado en (5.36) en la seccion 5.2.4, con
= 0.6231[s] la constante de tiempo mas lenta con la que el efecto de la
perturbacion es rechazada. Esta constante de tiempo se escoge igual a la cons-
tante de tiempo deseada en la respuesta ante la referencia de velocidad porque,
de acuerdo a (9.38), esta es la constante de tiempo mas lenta presente en el
rechazo a la perturbacion en el controlador cuyos resultados experimentales
se muestran en la gura 9.8 (f > p
1
para los valores numericos utilizados). La
velocidad deseada
d
es identica a la mostrada en (9.41) y se aplica una per-
turbacion identica a la usada en la gura 9.8, es decir, se aplica via software
una perturbacion constante de valor T
p
= 2.5 en t = 8[s], la cual desaparece
en t = 17[s]. Se observa lo siguiente:
La desviacion producida por la aparicion de una perturbacion externa es
reducida a cero con una rapidez comparable con la mostrada en la gura
9.8.
Sin embargo, la parte transitoria de la respuesta ante la referencia deseada,
aunque muy rapida, no corresponde a la respuesta transitoria deseada
522 9 Control de velocidad de un motor de CD
representada por la linea tenue mostrada en la gura 9.10. Tal como se
explica en la seccion 5.2.4, esto se debe el sistema en lazo cerrado tiene
dos polos, uno se asigna en s = p
1
pero el otro ocupa un lugar muy a la
izquierda de este valor. Mas a un, el polo ubicado en s =
1
0.6231
= 1.6 =
p
1
es muy cercano al cero en s = d = 1.4 por lo que sus efectos se
compensan (se cancelan) considerablemente y solo se aprecia la dinamica
del polo rapido colocado muy a la izquierda.
0 2 4 6 8 10 12 14 16 18 20 22
0
0.5
1
1.5
2
2.5
3
V [ ]
!
tiempo s [ ]

0:623
Figura 9.10. Control PI clasico de velocidad usando la regla de sintona en (9.44).
En conclusion, los resultados experimentales de las guras 9.9 y 9.10 com-
prueban las armaciones presentadas en la seccion 5.2.4 sobre el control PI
clasico de velocidad: no se tiene una regla de sintona que permita calcular de
manera exacta las ganancias proporcional e integral para obtener simultanea-
mente las caractersticas deseadas de respuesta transitoria ante una referencia
de velocidad deseada y un rechazo de perturbaciones satisfactorio. Esto jus-
tica el interes por el uso del controlador PI modicado presentado en (9.33)
cuyos resultados experimentales se muestran en la gura 9.8.
9.8. Calculo numerico de la integral
Esta operacion esta representada por:
9.9 Programacion del microcontrolador PIC16F877A 523
y =
_
t
0
w(s)ds
y se puede aproximar numericamente mediante:
y(k + 1) = y(k) +w(k)t (9.45)
donde y(k) es el valor de la integral calculado en el instante de muestreo
presente con y(0) = 0 y y(k + 1) es el valor de la integral en el instante de
muestreo proximo inmediato en el futuro. Esto signica que y(k) debe usarse
como el valor del termino integral en el instante presente mientras que y(k+1)
debe calcularse en el instante presente pero debe ser utilizado como el valor
del termino integral solo hasta el siguiente instante de muestreo. La expresion
en (9.45) se obtiene a partir de la interpretacion geometrica de la integral de
w, es decir, el area debajo de la curva denida por w. As, el termino w(k)t
representa el area que se incrementa en cada instante de muestreo: w(k) y t
representan, respectivamente, la altura y la base del rectangulo que aproxima
a dicho incremento de area.
9.9. Programacion del microcontrolador PIC16F877A
Se recomienda consultar la referencia [10] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
// Programa para comunicacion serial entre PC y proyecto Control
// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#include<stdlib.h>
#include<math.h>
#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#use delay(clock=20000000) //Base de tiempo para
//retardos(frecuencia del Xtal)
//Config.P.Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05
#byte PORTB = 0x06
#byte PORTC = 0x07
#byte PORTD = 0x08
#byte PORTE = 0x09
524 9 Control de velocidad de un motor de CD
#byte ADCON0= 0x1F
#byte ADCON1= 0x9F
#bit PC0 = 0x07.0
#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;
int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;
int8 cont,iastd,cont2,cont3,cont4,t_0;
float w,error,iast,wm1,kp,ki,ie,k,a,wd,tiempo,kpp,k3,kib,cte;
unsigned int u,i;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
9.9 Programacion del microcontrolador PIC16F877A 525
k=2.4691;
a=1/2.7;
kpp=0.5;
k3=4.0;
kp=kpp+k3;
kib=a+k*kpp;
ki=kib*k3;
cte=a/k-k3;
tiempo=0.0;
wm1=0.0;
ie=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
cont++;
ADCON0=0x81; //Cambiando a CH0
for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
w=0.0196*t_0;
if(tiempo<4.0)
wd=1.5;
else
if(tiempo<12.0)
wd=2.5;
else
wd=1.5;
// wd=2.5;
error=wd-w;
/* Controlador */
iast=kp*error+ki*ie+cte*wd;
ie=ie+0.002*error;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
526 9 Control de velocidad de un motor de CD
iast=3.3;
// iast=0.3;
iast=-iast;
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast+2.5;
}
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
wm1=w;
/*
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=t_0;//(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
*/
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast-2.5;
}
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); // reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
PC1=1; //inicia espera del timer
while(TMR0<40) // 1 cuenta=(4/FXtal)*256 seg, 40=2 ms
{
9.11 Preguntas de repaso 527
}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main
9.10. Resumen del captulo
Se ha presentado la manera de controlar la velocidad de un motor de
CD. Para esto se ha mostrado la manera de construir de manera practica y
experimental dos controladores de velocidad: uno es un PI clasico y el otro
es un PI modicado. Se ha mencionado cuales son los problemas que tiene el
controlador PI clasico y como resolverlos usando el controlador PI modicado.
Tambien se ha descrito la manera de construir las interfases necesarias para
el correcto funcionamiento del sistema de control y como se puede programar
un microcontrolador para realizar la funcion de un controlador digital.
Es importante resaltar el hecho de que en la literatura sobre control de
motores electricos es com un usar como entrada al par generado por el motor
(o bien, la corriente electrica de armadura). Esto se hace a pesar de que es
el voltaje aplicado al motor la variable que se puede manipular directamente
en el motor mientras que el par es un producto que resulta de la ecuacion
diferencial que describe al circuito electrico de armadura. En este captulo
se ha explicado que si se usa un lazo interno de corriente de alta ganancia
se puede, efectivamente, usar la corriente de armadura (y, por tanto, el par
generado ya que ambas variables son proporcionales) como la variable de
entrada. Tambien se ha explotado este ejemplo para resaltar el papel que
juega un amplicador de potencia en un sistema de control.
Un problema importante que se debe resolver antes de dise nar un contro-
lador es el de determinar los valores numericos de los parametros del modelo
de la planta a controlar. En este captulo se ha mostrado una manera ex-
perimental que es efectiva para resolver este problema en un motor de CD.
Basicamente la idea es explotar el hecho de que el modelo de la planta es de
primer orden, modelos cuya respuesta ante una entrada escalon es bien cono-
cida. El metodo que se propone es ampliamente recomendable porque con un
simple experimento se puede resolver el problema completo.
9.11. Preguntas de repaso
1. Que es un lazo de corriente y para que se usa?
2. Por que un controlador PI es suciente para controlar la velocidad de un
motor de CD? Por que no usar un controlador PID?
528 9 Control de velocidad de un motor de CD
3. Se ha dicho que un controlador PI lleva a cero el error en estado esta-
cionario en un sistema de control de velocidad a pesar de la presencia de
cualquier perturbacion constante Que precaucion debe tomar en cuenta
en la practica para que efectivamente se pueda compensar la presencia de
una perturbacion constante?
4. Un controlador PI es efectivo para llevar a cero el error en estado esta-
cionario cuando el valor deseado de velocidad no es constante? Y si la
perturbacion no es constante? Explique.
5. Como usara las ideas expuestas en el presente captulo para controlar
el voltaje producido por un generador electrico que es impulsado por un
motor de CD?
6. Como usara las ideas expuestas en el presente captulo para controlar
un sistema de control de temperatura y un sistema de control de nivel de
lquido?
7. Que controlador usara para los sistemas de la pregunta anterior? Usara
un controlador PID? Por que?
8. Bajo que condiciones el modelo de velocidad de un motor de CD se con-
vertira en un integrador? Que controlador usara bajo estas condiciones
para compensar el efecto de una perturbacion constante? Justique su
respuesta.
9. Si un controlador PI clasico compensa muy lentamente el efecto de una
perturacion Que ajustes hara en las ganancias del controlador?
10. Cuales son los efectos de las ganancias proporcional e integral en un
controlador PI clasico?
Referencias
1. R. Ortega, A. Lora, P. J. Nicklasson and H. Sira-Ramrez, Passivity-based con-
trol of Euler-Lagrange Systems, Springer, London, 1998.
2. V.M Hernandez Guzman and R.V. Carrillo Serrano, Global PID position control
of PM stepper motors and PM synchronous motors, International Journal of
Control, vol. 84, no. 11, pp. 1807-1816, 2011.
3. V.M Hernandez Guzman and R. Silva-Ortigoza, PI control plus electric current
loops for PM synchronous motors, IEEE Transactions on Control Systems Te-
chnology, vol. 19, no. 4, pp. 868-873, 2011.
4. G. Espinosa-Perez, P. Maya-Ortiz, M. Velasco-Villa and H. Sira-Ramrez,
Passivity-based control of switched reluctance motors with nonlinear magne-
tic circuits, IEEE Transactions on Control Systems Technology, Vol. 12, pp.
439448, 2004.
5. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
6. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotors Virtual Classroom, 1998.
7. R. Campa, E. Torres, V. Santiba nez and R. Vargas, Electromechanical dyna-
mics characterization of a brushless direct-drive servomotor. Proc. VII Mexican
Congress on Robotics, COMRob 2005, Mexico, D.F., October 27-28, 2005.
8. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
9. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-
tor Corporation, 1995.
10. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
10
Control de posicion de un motor de CD
El problema de control de posicion tiene muchas e importantes aplicacio-
nes en la industria. Quiza una de las aplicaciones mas claras es la del control
de robots manipuladores. En estas tareas, el robot debe ensamblar las piezas
que conforman a un componente mas complejo. Para ello, el robot debe to-
mar una pieza, llevarla a un lugar especicado y colocarla dentro del espacio
correspondiente. Para conseguir esto, se coloca un motor electrico (frecuen-
temente de CD y con escobillas) en cada una de las partes moviles del robot
(conocidas como uniones). Entonces se debe controlar la posicion de cada
motor de manera individual para alcanzar un valor de posicion deseado. La
posicion deseada de cada motor es seleccionada de manera que si cada motor
la alcanza, entonces el extremo del robot consigue colocar la pieza por ensam-
blar en el lugar correcto. Un problema com un en esta tarea es la presencia
del efecto de la gravedad, la cual aparece como una perturbacion de par que
debe ser compensada. Una vez que el robot se detiene, esta perturbacion de
par es constante.
532 10 Control de posicion de un motor de CD
Objetivos del captulo
Construir controladores tipo proporcional-integral-derivativo usando un
microcontrolador y una computadora personal.
Construir la totalidad de las interfaces electr onicas necesarias para el sis-
tema de control completo.
Identicar de manera experimental los par ametros del modelo de un motor
de CD.
Identicar las ventajas y las desventajas de los controladores proporcional-
integral-derivativo.
Aplicar a una situaci on experimental los conceptos de la teora de control
cl asico.
En este captulo se contin ua con el control de un motor de CD con es-
cobillas e iman permanente, pero ahora se considera el control de posicion.
Con este fn, se recurre al modelo obtenido en (9.23) despues de colocar un
amplicador de potencia y un lazo de corriente (veanse las secciones 9.2 y
9.3). Este modelo se reescribe a continuacion para facilitar su referencia:
(s) =
1
s(s +a)
[kI

(s)
1
J
T
p
(s)] (10.1)
a =
b
J
, k =
nk
m
J
donde (s) es la posicion a controlar, I

(s) es la variable de entrada o de


control y T
p
(s) es una perturbacion de par externa.
10.1. Identicacion
En esta seccion es de interes realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (10.1). A continuacion se
explica la manera de dise nar dicho experimento. Suponga que no hay ninguna
perturbacion externa aplicada, es decir T
p
(s) = 0, por lo que el modelo (10.1)
se reduce a:
(s) =
k
s(s +a)
I

(s) (10.2)
Suponga que i

se dise na como un controlador proporcional de posicion, es


decir, de manera que:
i

= k
p
(
d
) (10.3)
o, mediante el uso de la transformada de Laplace:
I

(s) = k
p
(
d
(s) (s)) (10.4)
10.1 Identicacion 533
donde k
p
es una constante positiva. El diagrama a bloques que combina las
expresiones (10.2) y (10.4) se muestra en la gura 10.1. La funcion de trans-
ferencia de lazo cerrado para este caso es:
(s)

d
(s)
=
k
p
k
s
2
+as +k
p
k
=

2
n
s
2
+ 2
n
s +
2
n
(10.5)

n
=
_
k
p
k, =
a
2
_
k
p
k
(10.6)
I

(s) (s)
+

d
s ( )
k
p s s+a ( )
k
Figura 10.1. Control proporcional de posicion.
De acuerdo a (10.5) y lo visto en la seccion 3.3, si la posicion deseada
d
es un escalon la respuesta obtenida en el tiempo (t) presenta un sobre paso
y un tiempo de subida dados como:
M
p
( %) = 100 e

1
2

(10.7)
t
r
=
1

d
_
arctan
_
_
1
2

__
(10.8)
si 0 < 1, lo cual siempre se puede conseguir usando un valor de k
p
sucientemente grande. A partir de (10.7) y (10.8) se obtiene:
=

_
ln
2
_
Mp( %)
100
_
ln
2
_
Mp( %)
100
_
+
2
(10.9)

d
=
1
t
r
_
arctan
_
_
1
2

__
(10.10)

n
=

d
_
1
2
(10.11)
Esto permite calcular los valores de k y a utilizando el siguiente procedimiento:
Construya el controlador proporcional mostrado en (10.4) o en (10.3).
Aseg urese de que no apareceran perturbaciones externas de par sobre el
motor. Seleccione un valor conocido y positivo de la ganancia k
p
. Este
534 10 Control de posicion de un motor de CD
valor debe ser sucientemente grande de modo que al aplicar un cambio
tipo escalon en la posicion deseada
d
se obtenga una posicion del motor
que presenta un sobre paso claramente apreciable. Graque respecto al
tiempo la posicion que se obtiene como respuesta ante un
d
tipo escalon.
Mida los valores obtenidos de M
p
( %) y t
r
.
Utilice las expresiones (10.9)-(10.11) para calcular y
n
.
Utilice las expresiones en (10.6) y el valor de k
p
usado en el experimento
para calcular k y a.
En la gura 10.2 se presentan los resultados obtenidos al realizar el expe-
rimento descrito en el procedimiento anterior. Se utiliza un valor k
p
= 0.5 y
midiendo directamente en la gura 10.2 se encuentran los valores:
M
p
( %) = 78.2 %, t
r
= 0.09[s]
Estas mediciones se simplican y al mismo tiempo se hacen mas exactas si
se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:
k = 675.4471, a = 2.8681 (10.12)
Finalmente, es importante aclarar que, al igual que en el modelo de velocidad,
no es de interes calcular el valor del factor 1/J que aparece como coeciente de
la perturbacion T
p
(s) en (10.1). La razon de esto es que normalmente incluso
el valor de T
p
no es conocido y a pesar de ello su efecto puede ser compensado.

rad [ ]
A [ ]
i

tiempo s [ ]

t
r
= 0:09
M
p
(%) = 78:2
Figura 10.2. Identicacion experimental.
10.2 Control sin perturbaciones externas (Tp = 0) 535
10.2. Control sin perturbaciones externas (T
p
= 0)
El dise no de un controlador tiene como objetivo asegurar que en lazo
cerrado se consigan las caractersticas deseadas de respuesta transitoria y en
estado estacionario. Las caractersticas de respuesta transitoria se reeren al
tiempo de subida (rapidez de respuesta) y al sobre paso (amortiguamiento)
deseados. Estas caractersticas se satisfacen mediante la ubicacion conveniente
de los polos de lazo cerrado. Por otro lado, las caractersticas de respuesta en
estado estacionario se consiguen al asegurar que cuando el tiempo crece el
valor de la posicion alcanza la posicion deseada
d
. El controlador es el
dispositivo que se encarga de que se satisfagan las caractersticas de respuesta
transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la posicion deseada es una constante o un escalon, es de-
cir
d
= A es una constante. Dado que la planta en (10.1) contiene un polo
en s = 0 entonces es de tipo 1 lo que asegura que =
d
= A en estado
estacionario, si se usa un controlador proporcional de posicion y si no hay
perturbaciones externas de par, es decir, si T
p
= 0. Esto signica que el re-
quisito de alcanzar la posicion deseada es satisfecho de manera natural por
la planta (el motor de CD). Por tanto, el dise no del controlador debe reali-
zarse simplemente buscando que se satisfagan las caractersticas de respuesta
transitoria, es decir, colocando adecuadamente los polos de lazo cerrado. As,
en el caso de un motor de CD hay dos controladores sencillos que permiten
ubicar adecuadamente los polos de lazo cerrado: i) control proporcional con
realimentacion de velocidad e ii) control con una red de adelanto.
10.2.1. Control proporcional con realimentacion de velocidad
En este caso, el controlador esta dado como:
i

(t) = k
p
(
d
) k
v

(10.13)
donde k
p
y k
v
son constantes positivas. Usando la transformada de Laplace
se obtiene:
I

(s) = k
p
(
d
(s) (s)) k
v
s(s) (10.14)
El diagrama de bloques que resulta de combinar (10.14) y (10.2) es mostrado
en la gura 10.3. La funcion de transferencia de lazo cerrado esta dada como:
(s)

d
(s)
=
k
p
k
s
2
+ (a +k
v
k)s +k
p
k
=

2
n
s
2
+ 2
n
s +
2
n

n
=
_
k
p
k, =
a +k
v
k
2
_
k
p
k
(10.15)
Por tanto, siempre se pueden hallar valores positivos de k
v
y k
p
que consi-
gan los valores deseados de y
n
. Esto signica que siempre se pueden ubicar
536 10 Control de posicion de un motor de CD
+

(s) +

(s)

d
s ( )
k
p
s s+a ( )
k
k
v
s
Figura 10.3. Control proporcional de posicion con realimentacion de velocidad.
los polos de lazo cerrado (s+
n
+j
d
)(s+
n
j
d
) = s
2
+2
n
s+
2
n
, en
cualquier punto sobre el semiplano complejo izquierdo, mediante una seleccion
adecuada de k
p
y k
v
. Por ejemplo, considere los valores en (10.12). Suponga
que se desea que la respuesta ante un escalon tenga el sobre paso y el tiempo
de subida que se indican a continuacion:
M
p
( %) = 20 %, t
r
= 0.068[s] (10.16)
Con estos datos y usando (10.9)-(10.11) se encuentra que los polos de lazo
cerrado deseados estan ubicados en:
s =
n
j
d
= 15.4009 j30.0623
con = 0.4559 y
n
= 33.7776. Finalmente, usando estos valores, (10.12),
(10.15) y (10.16) se encuentra que las siguientes ganancias consiguen el tiempo
de subida y el sobre paso deseados:
k
p
= 1.6891, k
v
= 0.0414 (10.17)
En la gura 10.4 se muestran los resultados experimentales obtenidos con el
controlador (10.13) y las ganancias en (10.17) cuando
d
es un escalon unitario.
El sobre paso y el tiempo de subida medidos en dicho experimento son:
M
p
( %) = 16 %, t
r
= 0.068[s]
los cuales, puede observarse, son cercanos a los valores de dise no especicados
en (10.16).
Es conveniente decir que el utilizar un sensor especializado para medir
velocidad implica una serie de adaptaciones mecanicas que complican mucho
y elevan el costo de la construccion del sistema de control. Por esta razon,
en la practica es com un estimar la velocidad a partir de la posicion medida.
En los experimentos de la gura 10.4, la velocidad

se ha estimado mediante
la diferenciacion numerica de la posicion medida (vease la seccion 10.5). Sin
embargo, este proceso tiene el efecto de un ltro pasa altas: las se nales de alta
frecuencia (ruido) son amplicadas de manera importante por el controlador
10.2 Control sin perturbaciones externas (Tp = 0) 537
(realimentacion de velocidad). La presencia de ruido puede resultar en el de-
terioro del desempe no del sistema de control pues puede producir vibraciones
en el motor a un cuando ya se encuentre en reposo. Por tanto, siempre se debe
procurar que la ganancia k
v
utilizada sea peque na. En la siguiente seccion
se utiliza un controlador que no necesita ni la medicion de la velocidad ni la
diferenciacion de la salida para conseguir los polos deseados de lazo cerrado.
M
p
(%) = 16
t
r
= 0:068

rad [ ]
A [ ]
tiempo s [ ]
Figura 10.4. Control proporcional de posicion con realimentacion de velocidad.
Resultados experimentales (
d
= 1.5[rad]).
10.2.2. Control con un compensador de adelanto
En este caso el controlador se especica mediante su funcion de transfe-
rencia:
I

(s)
E(s)
=
s +d
s +c
(10.18)
donde E(s) es la transformada de Laplace de la diferencia e =
d
, mientras
que , d y c son constantes positivas por calcular que deben satisfacer d < c.
A continuacion se muestra la manera de obtener una expresion que indi-
ca como construir el controlador en (10.18). Mediante division directa de la
fraccion en (10.18) se obtiene:
538 10 Control de posicion de un motor de CD
I

(s) = [E(s) +V (s)] (10.19)


V (s) =
d c
s +c
E(s)
Suponiendo condiciones iniciales cero, se utiliza la transformada inversa de
Laplace en las dos expresiones dadas en (10.19) para obtener:
i

= [e +v] (10.20)
v = cv + (d c)e (10.21)
donde v es la transformada inversa de Laplace de V (s). Entonces, conocien-
do la posicion deseada
d
y mediante la medicion de se puede calcular la
se nal e; utilizando esta se nal como variable conocida se resuelve numerica-
mente la ecuacion diferencial en (10.21), con v(0) = 0, para calcular v y luego
usar (10.20) para calcular i

. En la seccion 10.5 se explica como realizar este


procedimiento de manera numerica.
Ahora se considerara que el controlador esta dado como en (10.18). En la
gura 10.5 se muestra el diagrama de bloques que resulta de conectar (10.18)
y (10.2). Notese que la funcion de transferencia de lazo abierto:
G(s)H(s) =
k(s +d)
s(s +c)(s +a)
(10.22)
tiene tres polos, por lo que la funcion de transferencia de lazo cerrado tambien
tendra tres polos ademas de un cero en s = d. Se deja como ejercicio que
el lector encuentre la funcion de transferencia de lazo cerrado y que verique
que tiene la siguiente forma:
(s)

d
(s)
=
k(s +d)
(s p
1
)(s p
2
)(s p
3
)
(10.23)
+

(s) (s)

d
s ( )
s s+a ( )
k

s+c
s+d
Figura 10.5. Control de posicion con un compensador de adelanto.
Por tanto, en este caso, ademas de ubicar los polos complejos conjugados,
p
1
y p
2
, en los lugares especicados tambien se debera asegurar que el tercer
polo, en p
3
, y el cero en s = d no afectaran de manera importante la res-
puesta transitoria. Tal como se muestra en la seccion 5.2.3, esto se consigue
seleccionando:
10.2 Control sin perturbaciones externas (Tp = 0) 539
d = a, c = 2
n
, =

2
n
k
Usando esta regla de sintona y los parametros en (10.12) se encuentra que el
uso de las ganancias:
c = 30.8018, = 1.6891, d = 2.8681
en el controlador dado en (10.18), o equivalentemente en (10.20), (10.21),
ubica dos polos de lazo cerrado en:
s =
n
j
d
= 15.4009 j30.0623
As, se consigue especicar por dise no un tiempo de subida de 0.068[s] y un
sobre paso del 20 %.
En la gura 10.6 se muestran los resultados experimentales obtenidos cuan-
do
d
es un escalon de 1.5[rad]. Las caractersticas de respuesta transitoria
medidas en esta gura son M
p
( %) = 9.6 %, t
r
= 0.068[s]. Notese el parecido
de estos valores con los valores de dise no: t
r
= 0.068[s] y M
p
( %) = 20 %.
Finalmente, es importante subrayar que el uso de la red de adelanto (gura
10.6) tambien resulta en un peque no error de estado estacionario.
El lector puede preguntarse Que se debe usar como valor nal para calcu-
lar el sobre paso? El valor deseado de 1.5[rad] o el valor nal de 1.4[rad]? El
valor de M
p
( %) = 9.6 % se obtuvo usando 1.5[rad] como valor nal. Notese
que el sobre paso puede ser un poco mas cercano al valor deseado del 20 %
si se mide usando como valor nal 1.4[rad]. Esta decision se deja a criterio
del lector. Por otro lado, el tiempo de subida es exactamente el valor deseado
si se usa como valor nal el valor deseado de 1.5[rad]. Estos problemas son
debidos a la existencia de un error en estado estacionario que es mucho mas
apreciable que con el controlador proporcional con realimentacion de veloci-
dad. Este error en estado estacionario es debido a la presencia de friccion no
lineal: estatica y de Coulomb (vease (2.21)).
540 10 Control de posicion de un motor de CD
tiempo s [ ]
rad [ ]
A [ ]

t
r
= 0:068

M
p
(%) = 9:6
Figura 10.6. Control de posicion con un compensador de adelanto. Resultados
experimentales (
d
= 1.5[rad]).
10.3. Control bajo el efecto de perturbaciones externas
En esta seccion se considera la presencia de una perturbacion externa
constante, es decir:
T
p
= t
d
, T
p
(s) =
t
d
s
(10.24)
donde t
d
es una constante diferente de cero. Esto signica que se considera
la posibilidad de que alg un agente externo al motor aplique un par sobre
su echa. Si se piensa que el motor podra estar actuando sobre una antena
parabolica, entonces el agente externo que produce la perturbacion de par bien
podra ser el viento que golpea a la antena. Por otro lado, se considera que
la perturbacion es constante porque esto representa el caso extremo en que
el viento golpea a la antena de manera agresiva, con su maxima capacidad
de desviacion. Ademas, la presencia de una perturbacion aproximadamente
constante durante intervalos de tiempo que pueden ser cortos o largos es una
situacion muy com un en mecanismos. Es importante mencionar que es lo que
se espera de un buen dise no cuando aparece una perturbacion externa: el
efecto de la perturbacion sobre la salida debe ser llevado a cero tan rapido
como sea posible.
En este tipo de aplicaciones es com un utilizar un controlador PID debi-
do a que su parte integral puede llevar a cero las desviaciones debidas a las
10.3 Control bajo el efecto de perturbaciones externas 541
perturbaciones constantes. Sin embargo, tal como se menciona en la seccion
5.2.5, no se cuenta con una regla de sintona que permita calcular de manea
exacta las ganancias de un controlador PID que consigan simultaneamente
las caractersticas deseadas de respuesta transitoria (tiempo de subida y so-
bre paso) y un rechazo satisfactorio de los efectos de la perturbacion externa.
Por esta razon, en las siguientes dos secciones se presentan dos controlado-
res que son dise nados especcamente para satisfacer simultaneamente estas
especicaciones.
10.3.1. Un controlador PID modicado
Primero se usa la transformada inversa de Laplace para obtener, a partir
de (10.1), la siguiente ecuacion diferencial:

+a

= ki

1
J
T
p
(10.25)
A continuacion se muestra que el siguiente controlador permite obtener una
regla de sintona para calcular de manera exacta sus ganancias de modo que
se consiguen simultaneamente las caractersticas deseadas de respuesta transi-
toria (tiempo de subida y sobre paso) y un rechazo satisfactorio de los efectos
de la perturbacion externa:
i

=
p
(
d
)
d

+k
1

p
k
_
t
0
(
d
(r))dr k
1
(



(0))
k
1
(a +
d
k)( (0)) (10.26)
donde
d
es una constante que representa el valor deseado de posicion mien-
tras que (0) y

(0) representan los valores iniciales de posicion y velocidad,
respectivamente. Utilizando el hecho de que:



(0) =
_
t
0

(r)dr
(0) =
_
t
0

(r)dr
el controlador anterior se puede escribir como:
i

=
p
(
d
)
d

+k
1

p
k
_
t
0
(
d
(r))dr k
1
_
t
0

(r)dr
k
1
(a +
d
k)
_
t
0

(r)dr
=
p
(
d
)
d

k
1
_
t
0
_

(r) + (a +
d
k)

(r) +
p
k((r)
d
)
_
dr
Sustituyendo esto en (10.25) se obtiene:
542 10 Control de posicion de un motor de CD

+ (a +
d
k)

+
p
k(
d
)
+k
1
k
_
t
0
_

(r) + (a +
d
k)

(r) +
p
k((r)
d
)
_
dr =
1
J
T
p
Esto se puede escribir como:

+k
1
k =
1
J
T
p
(10.27)
si se dene:
=
_
t
0
_

(r) + (a +
d
k)

(r) +
p
k((r)
d
)
_
dr
Aplicando la transformada de Laplace a (10.27), considerando las condiciones
iniciales iguales a cero, se obtiene:
(s) =

1
J
s +k
1
k
T
p
(s)
o tambien:
s(s) =

1
J
s
s +k
1
k
T
p
(s) (10.28)
Si la perturbacion es una constante, es decir T
p
(s) =
t
d
s
, entonces se puede
usar el teorema del valor nal para encontrar:
lm
t

(t) = lm
s0
s[s(s)]
= lm
s0
s

1
J
s
s +k
1
k
t
d
s
= 0
As que si k
1
k > 0, el ltro en (10.28) es estable y se asegura que lm
t

(t) =
0. Mas a un, la rapidez con que

(t) se aproxima a cero es mayor conforme
k
1
k > 0 es mayor. Notese que lm
t

(t) = 0 implica que:
d
dt
_
t
0
_

(r) + (a +
d
k)

(r) +
p
k((r)
d
)
_
dr
=

+ (a +
d
k)

+
p
k(
d
) 0
tambien tiende a cero. Esto signica que el efecto de la perturbacion constante
desaparece al crecer el tiempo y solo queda la ecuacion diferencial

+ (a +

d
k)

+
p
k =
p
k
d
, la cual es estable si
p
> 0 y
d
> 0, tiene ganancia
unitaria en estado estacionario y las ganancias
p
y
d
pueden ser usadas para
asignar arbitrariamente los dos polos de dicho sistema. Todo esto signica que:
Si no hay perturbacion (T
p
= 0 y

(t) = 0 para todo t 0), la respuesta
en posicion es como la de un sistema de segundo orden con un tiempo de
subida y un sobre paso que pueden ser seleccionados a voluntad escogiendo
convenientemente los valores de
p
y
d
. La posicion alcanza la posicion
deseada
d
(constante) en estado estacionario.
10.3 Control bajo el efecto de perturbaciones externas 543
Si aparece una perturbacion constante (T
p
= t
d
= 0), la desviacion pro-
ducida por la perturbacion desaparece al crecer el tiempo. Mas a un, si se
escoge un valor de k
1
mayor (de manera que el producto k
1
k > 0 es ma-
yor), entonces la desviacion producida por la perturbacion desaparece mas
rapido. Si una vez que la desviacion debida a la perturbacion es llevada a
cero (cuando =
d
) se ordena un cambio en el valor constante de
d
(se
ordena un cambio de posicion deseada
d
estando presente la perturbacion
T
p
), entonces la posicion responde como si la mencionada perturbacion
constante T
p
no existiera, es decir, como en el punto anterior: con el tiem-
po de subida y el sobre paso deseados y la posicion alcanza la velocidad
deseada
d
en estado estacionario.
Debido a que en control clasico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que (0) = 0,

(0) = 0 y el
controlador en (10.26) se escribe como:
i

=
p
(
d
)
d

+k
1

p
k
_
t
0
(
d
(r))dr k
1

k
1
(a +
d
k)
= [
p
+k
1
(a +
d
k)](
d
) (
d
+k
1
)

+k
1

p
k
_
t
0
(
d
(r))dr
k
1
(a +
d
k)
d
= K
P
(
d
) K
D

+K
I
_
t
0
(
d
(r))dr k
1
(a +k
d
k)
d
(10.29)
K
P
=
p
+k
1
(a +
d
k), K
D
=
d
+k
1
, K
I
= k
1

p
k
que constituye un simple controlador PID con un termino constante de prea-
limentacion. Notese que el termino derivativo no contiene la derivada de la
posicion deseada. Finalmente, la regla de sintona del controlador en (10.29)
puede resumirse del siguiente modo:

p
> 0 y
d
> 0 se eligen de modo que queden jados el tiempo de subida
y el sobre paso deseados mediante la adecuada ubicacion de las races del
polinomio caracterstico s
2
+ (a +
d
k)s +
p
k, es decir:
a +
d
k = 2
n
,
p
k =
2
n
(10.30)
k
1
> 0 se elige grande para reducir rapidamente a cero la desviacion de-
bida a la perturbacion. Esto puede hacerse al tanteo o puede calcularse
recordando que
1
k1k
es la constante de tiempo del ltro en (10.28), el cual
es el responsable de eliminar la desviacion producida por la perturbacion.
Otra manera (mas conocida) de dise nar un controlador PID con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
seccion.
544 10 Control de posicion de un motor de CD
10.3.2. Un controlador con dos grados de libertad
A continuacion se explica la manera de dise nar un controlador de dos
grados de libertad para el motor de CD que nos ocupa en este captulo. En
la gura 10.7 se muestra el diagrama de bloques de un controlador de dos
grados de libertad. G
p
(s) representa la planta mientras que el controlador
esta compuesto por dos partes: G
c1
(s) y G
c2
(s). En el ejemplo 4.5 de la seccion
4.1 se muestra que la salida del sistema en lazo cerrado se puede calcular como:
(s) = G
1
(s)
d
(s) +G
2
(s)D(s)
donde:
G
1
(s) =
G
c1
(s)G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
G
2
(s) =
G
p
(s)
1 + (G
c1
(s) +G
c2
(s))G
p
(s)
(10.31)
son las funciones de transferencia:
G
1
(s) =
(s)

d
(s)
, cuando D(s) = 0
G
2
(s) =
(s)
D(s)
, cuando
d
(s) = 0
La razon por la cual este esquema recibe el nombre de controlador de dos
grados de libertad es que las dos funciones de transferencia denidas en (10.31)
pueden ser sintonizadas independientemente una de la otra utilizando para
+

(s)
+

+
+
(s)
D(s)

d
s ( )
G
p
s ( )
G
c1
s ( )
G
c2
s ( )
Figura 10.7. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.
ello, como variables independientes (o grados de libertad), a las dos partes
del controlador G
c1
(s) y G
c2
(s). Se desea entonces dise nar G
c1
(s) y G
c2
(s) de
manera que: i) se puedan especicar a voluntad las caractersticas de respuesta
10.3 Control bajo el efecto de perturbaciones externas 545
transitoria y en estado estacionario ante una referencia deseada,
d
(s), e ii)
el efecto de una perturbacion externa, D(s), sea reducido a cero tan rapido
como se desee.
Dado que la planta que interesa en este captulo es un motor de CD su-
ponga que:
G
p
(s) =
k
s(s +a)
(10.32)
El dise no del controlador con dos grados de libertad que se presenta aqu se
fundamenta en considerar que G
c1
(s) y G
c2
(s) son controladores PID [5], cap.
10, y por tanto que se puede escribir:
G
c1
(s) =
k
d1
s
2
+k
p1
s +k
i1
s
G
c2
(s) =
k
d2
s
2
+k
p2
s +k
i2
s
G
c
(s) = G
c1
(s) +G
c2
(s) =
k
d
s
2
+k
p
s +k
i
s
=
k
d
(s +)(s +)
s
=
k
d
(s
2
+ ( +)s +)
s
(10.33)
k
d
= k
d1
+k
d2
, k
p
= k
p1
+k
p2
, k
i
= k
i1
+k
i2
para algunas constantes y . Entonces:
(s)

d
(s)
=
G
c1
(s)G
p
(s)
1 +G
c
(s)G
p
(s)
Sustituyendo (10.32) y (10.33) en la expresion anterior se tiene:
(s)

d
(s)
=
G
c1
(s)
k
s(s+a)
1 +
k
d
(s
2
+(+)s+)
s
k
s(s+a)
=
skG
c1
(s)
s
2
(s +a) +k
d
k(s
2
+ ( +)s +)
=
skG
c1
(s)
s
3
+ (a +k
d
k)s
2
+k
d
k( +)s +k
d
k
(10.34)
Suponga que se desea que la respuesta transitoria sea la de dos polos complejos
conjugados dominantes dados como s = + j
d
y s = j
d
, > 0,

d
> 0. Entonces el polinomio caracterstico debe satisfacer:
s
3
+ (a +k
d
k)s
2
+k
d
k( +)s +k
d
k
= (s + +j
d
)(s + j
d
)(s +f)
= s
3
+ (2 +f)s
2
+ (
2
+
2
d
+ 2f)s + (
2
+
2
d
)f
de donde se obtienen las siguientes relaciones:
546 10 Control de posicion de un motor de CD
a +k
d
k = 2 +f (10.35)
k
d
k( +) =
2
+
2
d
+ 2f (10.36)
k
d
k = (
2
+
2
d
)f (10.37)
Con el n de que el polo en s = f, f > 0, no tenga efecto en la respues-
ta transitoria de (10.34) se propone una funcion de transferencia como la
siguiente:
(s)

d
(s)
=
(s +f)
s
3
+ (2 +f)s
2
+ (
2
+
2
d
+ 2f)s + (
2
+
2
d
)f
(10.38)
donde, con el n de conseguir una funcion de transferencia de ganancia uni-
taria en estado estacionario, se debe cumplir
f = (
2
+
2
d
)f
es decir:
=
2
+
2
d
(10.39)
Por otro lado, con el n de conseguir que las funciones de transferencia en
(10.34) y (10.38) sean iguales se debe imponer la siguiente condicion:
skG
c1
(s) = (s +f)
de donde se obtiene:
G
c1
(s) =
s +f
sk
= k
p1
+k
i1
1
s
(10.40)
k
p1
=
(
2
+
2
d
)
k
, k
i1
=
(
2
+
2
d
)f
k
Esto signica que G
c1
(s) debe ser un controlador PI. El controlador G
c2
(s)
se obtiene despejando de (10.33):
G
c2
(s) = G
c
(s) G
c1
(s)
= k
d
s +k
d
( +) +k
d

1
s

(
2
+
2
d
)
k

(
2
+
2
d
)f
k
1
s
= k
d2
s +k
p2
, k
p2
=
2f
k
, k
d2
= k
d
=
2 +f a
k
(10.41)
donde se han usado (10.35), (10.36) y (10.37). Esto signica que G
c2
(s) es
un controlador PD. Por tanto, de acuerdo a la gura 10.7, el controlador
esta dado como:
I

(s) = G
c1
(s)(
d
(s) (s)) G
c2
(s)(s)
= (k
p1
+k
i1
1
s
)(
d
(s) (s)) (k
d2
s +k
p2
)(s)
= (k
p1
+k
p2
)(
d
(s) (s)) k
d2
s(s) +k
i1
1
s
(
d
(s) (s)) k
p2

d
(s)
10.3 Control bajo el efecto de perturbaciones externas 547
Aplicando la transformada inversa de Laplace se obtiene:
i

= (k
p1
+k
p2
)(
d
) k
d2

+k
i1
_
t
0
(
d
(r))dr k
p2

d
(10.42)
Tal como se ha hecho hasta ahora, se desea que ante una referencia escalon
haya una respuesta transitoria con 0.068[s] como tiempo de subida y 20 % de
sobre paso. En las secciones anteriores se ha visto que los polos de lazo cerrado
correspondientes estan dados como s = j
d
donde:
= 15.4009,
d
= 30.0623 (10.43)
Por otro lado, el valor dado a f no afecta a la parte de la respuesta transito-
ria ante una referencia deseada porque su efecto es cancelado (vease (10.38)).
Cual es el efecto de f entonces y como seleccionarla? La clave de esta res-
puesta esta centrada en dos partes:
Primero se tiene el hecho de que, de acuerdo a (10.35), una vez que se jan
(polos deseados) y a, k (modelo de la planta) la ganancia derivativa k
d
es mayor si f es mayor. De acuerdo a lo mencionado en las secciones
precedentes, ganancias derivativas grandes no son deseables por el ruido
que eso introduce. As que un criterio es seleccionar f tan peque na como
se pueda.
Segundo, la funcion de transferencia ante una perturbacion dada en (10.31)
se calcula como:
(s)
D(s)
=
ks
(s + +j
d
)(s + j
d
)(s +f)
Notese que en esta funcion de transferencia el polo en s = f no puede ser
cancelado de ninguna manera por lo que su efecto sera muy importante en
la parte transitoria de la respuesta ante una perturbacion externa. As que
mientras menor sea el valor de f mas lenta sera la rapidez con la que
el efecto de la perturbacion sera eliminado, lo cual puede ser una gran
desventaja. En este sentido, notese que puede usarse el teorema del valor
nal para comprobar que el cero que esta funcion de transferencia tiene
en s = 0 asegura que el efecto en estado estacionario de una perturbacion
constante sera reducido a cero.
As que la seleccion de f debe cumplir un compromiso entre la rapidez con
la que las perturbaciones son rechazadas y el ruido que pueda introducirse.
Propongase:
f = 40 (10.44)
Finalmente, usando los parametros de la planta:
k = 675.4471, a = 2.8681
as como (10.40), (10.41), (10.43), (10.44) se encuentra:
548 10 Control de posicion de un motor de CD
G
c1
(s) = 1.6891 + 67.5659
1
s
(10.45)
G
c2
(s) = 0.1006s + 1.8241 (10.46)
De acuerdo a (10.40), (10.41) y (10.42), el controlador esta dado como:
i

= 3.5132(
d
) 0.1006

+ 67.5659
_
t
0
(
d
(r))dr 1.8241
d
(10.47)
Finalmente, una ultima observacion. El lector puede comprobar que el con-
trolador en (10.42) es identico al controlador en (10.29) si se respeta (10.30)
y se establece que:
k
1
=
f
k
, =
n
,
2
+
2
d
=
2
n
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 10.3.1 o 10.3.2 para obtener este controlador es el que preere.
En la gura 10.8 se presentan resultados experimentales obtenidos cuando
se usa el controlador (10.47). Las caractersticas de respuesta transitoria medi-
das ante la referencia constante son t
r
= 0.068[s] y M
p
( %) = 19.3 %, los cuales
son casi identicos a los deseados (t
r
= 0.068[s] y M
p
( %) = 20 %). Tambien se
considera la presencia de una perturbacion constante D(s) = T
p
(s)/(Jk) =
0.5/s. Esta perturbacion ha sido introducida por software como una se nal
que se suma a i

, dada en (10.47), a partir de t = 0.7[s]. Notese que el error


en estado estacionario ante una referencia constante es cero, a pesar de la
presencia de friccion no lineal (estatica y de Coulomb) que se describio en las
secciones anteriores. Por otro lado, se puede observar la excelente respuesta
del sistema de control ante la perturbacion. Tambien es interesante observar
que esto se consigue gracias a que se usa un valor muy grande de f = 40, lo
cual, a su vez, es posible gracias al bajo contenido de ruido en la medicion de
la posicion (se usa un encoder para medir la posicion).
En la gura 10.9 se muestran otros resultados experimentales obtenidos
con el controlador (10.47). En este caso se usa la siguiente posicion deseada
que tiene la forma de tres escalones sucesivos:

d
=
_
_
_
1.5, 0 t < 1.5
3, 1.5 t < 4
1.5, t 4
(10.48)
Se considera la presencia de la siguiente perturbacion externa:
T
p
=
_

_
0, 0 t < 0.7
0.5, 0.7 t < 2.55
0, 2.55 t < 3.25
0.5, 3.25 t < 5.1
0, 5.1 t < 5.8
0.5, t 5.8
(10.49)
10.3 Control bajo el efecto de perturbaciones externas 549
Aparte de la posicion medida experimentalmente (lnea continua) en la gura
10.9 tambien se muestra (linea interrumpida) la respuesta obtenida en simu-
lacion con el sistema sin perturbaciones

+ 30.8018

+ 1140.9 = 1140.9
d
el cual responde de acuerdo a las especicaciones de dise no: t
r
= 0.068[s] y
M
p
( %) = 20 %, pues sus polos estan ubicados en s = 15.4009 j30.0623.
Se puede apreciar que ambas respuestas son casi identicas porque casi no se
pueden distinguir en la gura 10.9. Esto es una muestra clara de que se han
conseguido las caractersticas deseadas de respuesta transitoria y en estado
estacionario ante una referencia deseada. Mas a un, notese que los cambios
de referencia en t = 1.5[s] y t = 4[s] ocurren cuando la perturbacion T
p
esta presente y a pesar de ello a un se satisfacen las caractersticas de respues-
ta transitoria deseadas. Ademas, las desviaciones debidas a la perturbacion
son llevadas a cero rapidamente. Todo esto es evidencia experimental de que
las observaciones hechas justo antes de (10.29) son correctas.
M
p
(%) = 19:3
t
r
= 0:068

tiempo s [ ]
rad [ ]
A [ ]

Figura 10.8. Control de posicion usando un controlador con dos grados de libertad.
Resultados experimentales (
d
= 1.5[rad]).
10.3.3. Un controlador PID clasico
Con el n de apreciar mejor las ventajas del controlador dise nado en las
secciones 10.3.1 y 10.3.2 a continuacion se presentan, en las guras 10.10 y
10.11, algunos resultados experimentales obtenidos al usar el controlador PID
550 10 Control de posicion de un motor de CD

tiempo s [ ]
rad [ ]
A [ ]
Figura 10.9. Control de posicion con un controlador con dos grados de libertad.
Resultados experimentales.
clasico:
i

= k
p
(
d
) +k
d
d
dt
(
d
) +k
i
_
t
0
(
d
(r))dr
Se usa la misma referencia deseada de posicion y la misma perturbacion usa-
das en la gura 10.9, es decir, las denidas en (10.48) y (10.49). Aparte de
la posicion medida experimentalmente (lnea continua), tambien se muestra
(linea interrumpida) la respuesta obtenida en simulacion con el sistema sin
perturbaciones

+30.8018

+1140.9 = 1140.9
d
el cual responde de acuerdo
a las especicaciones de dise no: t
r
= 0.068[s] y M
p
( %) = 20 %, pues sus polos
estan ubicados en s = 15.4009 j30.0623.
El dise no del controlador PID clasico se realiza de acuerdo a la expuesto
en la seccion 5.2.5, es decir, usando los parametros de la planta:
k = 675.4471, a = 2.8681
los polos deseados ubicados en:
s = 15.4009 j30.0623
para conseguir un tiempo de subida de 0.068[s] y un sobre paso de 20 %, el
parametro de dise no = 0.01, y (5.42), (5.44) se obtienen las ganancias:
10.3 Control bajo el efecto de perturbaciones externas 551
k
d
= 0.0414, k
p
= 1.6896, k
i
= 0.0169
Es importante subrayar que de acuerdo al metodo de dise no presentado en
la seccion 5.2.5, el valor = 0.01 se elige muy cercano a cero para que la
respuesta transitoria ante la referencia de posicion tenga las caractersticas
deseadas lo cual, puede observarse en la gura 10.10, es conseguido para el
primer cambio tipo escalon de la referencia (antes de que aparezca alguna
perturbacion externa). Sin embargo, los problemas aparecen una vez que se
aplica la perturbacion externa:
El uso de un valor peque no para resulta en una ganancia integral muy
peque na lo cual produce un ajuste integral tan lento que el efecto de la per-
turbacion no es compensando en la gura 10.10. Es mas, aunque en t 3[s]
y t 5.5[s] la posicion medida alcanza a la posicion deseada, esto es debido a
que la perturbacion externa desaparece en esos instantes de tiempo.
Tal como se explica en la seccion 5.2.5, se pueden conseguir ganancias
integrales mas grandes si se elige un valor grande para . Por esta razon se
propone = 10, lo cual resulta en las siguientes ganancias:
k
d
= 0.0414, k
p
= 2.1027, k
i
= 16.8915
En la gura 10.11 se muestran los resultados experimentales correspondientes.
Notese que la desviacion debida a la perturbacion es compensada rapidamen-
te. Sin embargo, esto es conseguido al precio de producir una respuesta ante
la referencia deseada con caractersticas muy diferentes a las dise nadas. Esta
es la principal desventaja del control PID clasico: no se pueden calcular de
manera exacta las ganancias que permitan conseguir simultaneamente las ca-
ractersticas deseadas de respuesta transitoria ante una referencia de entrada
y un rechazo satisfactorio de las perturbaciones externas. Por el contrario,
este problema es resuelto con el controlador dise nado en las secciones 10.3.1
y 10.3.2 y cuyos resultados experimentales se muestran en la gura 10.9.
552 10 Control de posicion de un motor de CD
A [ ]
rad [ ]
tiempo s [ ]

Figura 10.10. Control de posicion con un controlador PID clasico ( = 0.01).


Resultados experimentales.
tiempo s [ ]
rad [ ]
A [ ]
i

Figura 10.11. Control de posicion con un controlador PID clasico ( = 10). Re-
sultados experimentales.
10.4 Seguimiento de trayectorias 553
10.4. Seguimiento de trayectorias
En esta seccion se dise na un controlador que permite que la posicion del
motor alcance una posicion deseada que es variable en el tiempo, es decir,

d
(t) ya no es constante sino que cambia con el tiempo. Se supone que no
existe ninguna perturbacion externa, es decir que T
p
(s) = 0, y que se puede
calcular la primera y la segunda derivada de
d
(t), es decir

d
(t) y

d
(t) se
conocen y son continuas. Considerese el modelo (10.1) una vez que se le aplica
la transformada inversa de Laplace, con T
p
(s) = 0, es decir:

+a

= ki

(10.50)
Sea el siguiente controlador, calculado a partir del conocimiento de
d
,

d
y

d
:
i

(t) =
1
k
_
d
2

d
(t)
dt
2
k
d
_
d(t)
dt

d
d
(t)
dt
_
k
p
((t)
d
(t)) +a
d(t)
dt
_
(10.51)
Notese que
d(t)
dt
representa la velocidad medida del motor. Sustituyendo
(10.51) en (10.50) se obtiene:
d
2
(t)
dt
2

d
2

d
(t)
dt
2
+k
d
_
d(t)
dt

d
d
(t)
dt
_
+k
p
((t)
d
(t)) = 0
(10.52)
Defnase el error de seguimiento como (t) = (t)
d
(t) y su transformada
de Laplace E(s). Entonces (10.52) se puede escribir como:
s
2
E(s) s(0)
d(0)
dt
+k
d
sE(s) k
d
(0) +k
p
E(s) = 0 (10.53)
y nalmente:
E(s) =
(k
d
+s)(0) +
d(0)
dt
s
2
+k
d
s +k
p
(10.54)
De acuerdo al captulo 3 la solucion de (10.54) tiene la forma:
(t) =
n
(t) +
f
(t)
donde la respuesta forzada es cero
f
(t) = 0 porque la exitacion de la ecuacion
diferencial en (10.53) es cero. Por tanto, (t) =
n
(t) lo cual tiende a cero
conforme el tiempo crece si las dos races del polinomio caracterstico s
2
+
k
d
s + k
p
tienen parte real negativa. Esta situacion es la deseable porque si
(t) tiende a cero entonces (t) tiende a
d
(t) conforme el tiempo crece. Por
otro lado, como el polinomio caracterstico s
2
+k
d
s +k
p
es de segundo orden
554 10 Control de posicion de un motor de CD
entonces, de acuerdo a la seccion 4.2, sus dos races tienen parte real negativa
si todos los coecientes de dicho polinomio tienen el mismo signo, es decir,
si k
p
> 0 y k
d
> 0. Este es el criterio para la seleccion de estas ganancias.
Sin embargo, debe tenerse presente que desde el punto de vista practico no
todas las ganancias as seleccionadas presentaran desempe nos satisfactorios y
deberan probarse varios valores hasta obtener un buen funcionamiento. En la
gura 10.12 se muestran los resultados experimentales obtenidos cuando se
usa el motor con k = 25.26 y a = 3.5201 junto con el controlador (10.51), las
ganancias:
k
p
= 363.88, k
d
= 22
y la trayectoria deseada:

d
(t) = 0.8 sin(5t) + 0.5 cos(3t) + 3.0 (10.55)
Notese que alcanza el valor deseado de posicion
d
(t) a pesar de que estas
variables tienen valores iniciales diferentes. Es importante mencionar que de-
bido a que se conoce la expresion para
d
dada en (10.55) entonces se obtienen
las expresiones correspondientes para

d
y

d
mediante diferenciacion fuera de
linea por lo que no hay problemas de ruido importantes en este caso.
V [ ]
i

A [ ]
tiempo s [ ]
Figura 10.12. Controlador para el seguimiento de trayectorias. La posicion del
motor esta representada por la lnea interrumpida. La lnea continua corresponde
a
d
(t).
10.5 Calculo numerico de los algoritmos de control 555
10.5. Calculo numerico de los algoritmos de control
Deriferenciacion numerica
Esta es la operacion que permite obtener un estimado de la velocidad para
los controladores en las secciones 10.2.1, 10.3.2 y 10.4. Sea:
y =
dw
dt
(10.56)
entonces, esta operacion se puede aproximar numericamente mediante:
y
w(k) w(k 1)
t
(10.57)
donde w(k) representa el valor de w medido en el instante de muestreo pre-
sente, w(k 1) es el valor de w medido en el instante de muestreo previo y
t es el periodo de muestreo utilizado. Para que se obtenga una buena apro-
ximacion t debe ser peque no comparado con el tiempo de respuesta del
motor.
Integracion numerica
Se procede como se indica en la seccion 9.8
Compensador de adelanto
Ahora se explica como se calcula la expresion en (10.21) involucrada en
el compensador de adelanto presentado en la seccion 10.2.2. De acuerdo a
(10.56) y (10.57) se puede hacer un corrimiento en el tiempo para redenir:
dw
dt

w(k + 1) w(k)
t
(10.58)
Esto se puede usar para aproximar:
v = cv(k) + (d c)e(k)
v(k + 1) v(k)
t
(10.59)
y, por tanto:
v(k + 1) = [cv(k) + (d c)e(k)]t +v(k) (10.60)
Entonces, a partir de la medicion de e(k) =
d
(k) (k) se puede calcular
iterativamente v(k + 1) partiendo del valor inicial v(0) = 0. La forma en que
(10.60) esta expresada es muy conveniente pues permite que el primer valor
utilizado de v(k) sea cero en k = 0. Recuerdese que v(k + 1) se calcula en
el instante de muestreo presente pero solo sera utilizado hasta el instante de
muestreo proximo inmediato en el futuro.
556 10 Control de posicion de un motor de CD
10.6. Construccion del sistema de control
En la gura 10.13 se muestra el diagrama electrico del sistema de control
completo. A continuacion se listan los componentes utilizados:
Motor de CD con escobillas e iman permanente. Voltaje nominal 20[V],
corriente nominal 3[A]. Cuenta con un encoder de 400 pulsos/vuelta, el
cual se alimenta con +5[V] de CD.
Una computadora portatil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analogico DAC0800LCN.
Amplicador operacional cuadruple TL084.
Amplicadores operacionales TL081.
Manejador/Receptor MAX232.
Transistores TIP141 y TIP145.
Funcionamiento
El microcontrolador PIC16F877A tiene la tarea principal de ejecutar el
algoritmo de control correspondiente. Es decir, conocido el valor deseado de
posicion
d
y la medicion de la posicion actual , el microcontrolador calcula
el valor de la se nal de control i

.
Tal como se indica en la gura 10.13, el valor de i

debe aparecer a
la entrada del amplicador operacional TL081 dentro del recuadro titulado
control de corriente. Esto se consigue del siguiente modo. Primero, en el
programa listado en la seccion 10.7 se hace iast=-iast, para cambiar el signo
de i

a i

. El microcontrolador debe entregar un codigo digital (iastd) de


8 bits al convertidor digital/analogico de 8 bits DAC0800LCN. Para esto, el
microcontrolador realiza la operacion:
iastd = 36.4286 iast + 127
la cual obedece a la relacion mostrada gracamente en al gura 10.14. El
convertidor digital/analogico trabaja en conjunto con un amplicador opera-
cional TL081. Estos dispositivos estan conectados de acuerdo a las sugerencias
del fabricante [1]. Esto asegura que a la salida del amplicador operacional se
obtiene un voltaje cuyo valor numerico corresponde al de i

. Este valor es
recibido por un amplicador operacional TL081 que se encarga de evaluar el
lazo de corriente:
u
i
= 100(i

i)
Finalmente, el amplicador de potencia de ganancia unitaria esta constituido
por un tercer amplicador operacional TL081 junto con dos transistores de
potencia TIP141 y TIP145, conectados en simetra complementaria.
10.6 Construccion del sistema de control 557
Figura 10.13. Diagrama electrico del sistema de control de posicion basado en el
microcontrolador PIC16F877A.
558 10 Control de posicion de un motor de CD
iast 3:5 3:5
255
127
iastd
Figura 10.14. Acondicionamiento de la se nal i

que debe ser enviada al convertidor


digital/analogico.
El Manejador/Receptor MAX232 se encarga de enviar la posicion medida
y la se nal de control i

hacia una computadora portatil (a traves de un


conector USB a serie) cuyo unico proposito es el gracado de dichas variables.
A continuacion se describe la manera en que el microcontrolador PIC16F87
7A realiza la funcion de controlador. Antes que nada se debe aclarar que no
es el proposito presentar toda una exposicion de como trabaja este micro-
controlador. Lo que se presenta es una descripcion de los recursos de este
microcontrolador que se utilizan para construir los controladores bajo prue-
ba. En la siguiente seccion se presenta un listado del programa utilizado.
El microcontrolador PIC16F877A [2] es de tecnologa EEPROM, tiene una
velocidad de operacion maxima de 20 MHz y cuenta con 5 puertos de entrada-
salida congurables y 3 temporizadores. El timer TMR0 es utilizado en este
captulo para establecer el periodo de muestreo: T = 0.001[seg] (20 cuentas del
timer 0) para los experimentos en las secciones 10.1, 10.2.1 y 10.2.2, mientras
que T = 0.002[seg] (40 cuentas del timer 0) para el experimento en la seccion
10.3.2.
La posicion se mide desde el encoder usando una subrutina y se alma-
cena en la variable cuenta2 de 16 bits. La posicion en radianes se obtiene
mediante la operacion pos=cuenta2*0.0039 donde 0.0039=3.1416 rad/(2*400
cuentas). Esto es debido a que tratandose de un encoder de 400 pulsos por
vuelta, en realidad se obtienen 4400 cuentas por vuelta (por cada 2 ra-
dianes), es decir 2400 cuentas por cada radianes. Una vez calculada la
se nal de control iast se entrega al convertidor digital/analogico a traves
del puerto D (PORTD=iastd). Finalmente, la posicion (a traves de la va-
riable cuenta) o la se nal de control (a traves de la variable iastd) son
enviados a la computadora portatil mediante las instrucciones: putc(0xAA);
putc(cuentaH); putc(cuentaL);
10.7 Programacion del microcontrolador PIC16F877A 559
Control de corriente
Esta parte es identica a lo descrito en la seccion 9.6.1.
Amplicador de potencia
Esta parte es identica a lo descrito en la seccion 9.6.2.
10.7. Programacion del microcontrolador PIC16F877A
Se recomienda consultar la referencia [3] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
// Programa para comunicacin serial entre PC y proyecto Control
// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>
#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#usedelay(clock=20000000) //Base de tiempo (frecuencia // del
Xtal)
#use
rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)//Config.
//P. Serie
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05
#byte PORTB = 0x06
#byte PORTC = 0x07
#byte PORTD = 0x08
#byte PORTE = 0x09
#bit PC0 = 0x07.0
#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;
int8 cuentaH,cuentaL,puerto,AB,AB_1,aux,cont,iastd,cont2,cont3,cont4;
float pos,error,iast,cuenta2,posm1,kp,kv,c,delta,v,kp1,ki1,kp2,kd2,ie;
unsigned int u;
//int1 ban;
//------------Rutina de interrupcion (lee encoder)------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
560 10 Control de posicion de un motor de CD
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127; // se envia iast=0 al circuito de control
kp=1.6891;
kv=0.0414;
c=30.8018;
delta=1.6891;
v=0.0;
kp1=1.6891;
ki1=67.5659;
kp2=1.8241;
kd2=0.1006;
posm1=0.0;
ie=0.0;
while(cont2<3) // se introduce una espera de aprox 10 segundos
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
10.7 Programacion del microcontrolador PIC16F877A 561
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE) // ciclo de control
{
cont++;
cuenta2=(signed int16)cuenta;
pos=cuenta2*0.0039; // 3.1416 rad/(2*400 cuentas)
error=1.5-pos;
/* Identificacion */
// iast=0.5*error;
/* ___________________________________________ */
/* Control proporcional con retro de velocidad */
// iast=kp*error-kv*(pos-posm1)/0.001;
/* ___________________________________________ */
/* Red de adelanto */
// iast=delta*(error+v);
// v=(-c*v+(2.8-c)*error)*0.001+v;
/* ___________________________________________ */
/* Dos grados de libertad */
iast=kp1*error+ki1*ie-kp2*pos-kd2*(pos-posm1)/0.002;
ie=ie+0.002*error;
/* ___________________________________________ */
if(iast<-3.3) // iast se restringe a [-3.3,+3.3] Amperes
iast=-3.3; // (DAC entrega en el rango [-3.5,+3.5])
if(iast>3.3)
iast=3.3;
iast=-iast; //-i*, TL081 en control de corriente
if(cont4>70) //tiempo>0.7 seg, perturbacion (-0.5) entrada
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
posm1=pos;
/* // descomentar si se desea enviar la posicion a la
computadora portatil (cada 10 mseg)
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=inter>>8;
cuentaL=(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
562 10 Control de posicion de un motor de CD
putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
/* // descomentar si se desea enviar la senal de control a
//la computadora portatil (cada 10 mseg)
iast=-iast; // graficar +i*
if(cont4>70) // senal control graficar sin perturbacion
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //cada cuenta=(4/FXtal)*256 seg,
// (40=2 ms, periodo muestreo)
{
}
PC1=0; //termina espera del timer
TMR0=0;
} //cierre del while infinito
} //cierre del main
10.8. Control basado en una computadora personal
El controlador presentado en la seccion 10.4 para el seguimiento de trayec-
torias fue probado experimentalmente usando una computadora personal y
una tarjeta adquisitora de datos. Esto debido a que el calculo de las funciones
trigonometricas seno y coseno que se requieren consumen mucho tiempo en el
microcontrolador PIC16F877A. Este problema desaparece cuando se usa una
computadora personal. A continuacion se listan los componentes principales
del sistema de control.
Computadora personal de escritorio Pentium II a 233 MHz.
10.8 Control basado en una computadora personal 563
Tarjeta adquisitora de datos PCL-812PG de Advantech [4]. Cuenta con 15
canales de entrada analogico/digital manejados por un solo convertidor AD
de aproximaciones sucesivas de 12 bits, con entrada analogica en el rango
de -5[V] a +5[V]. Dos canales de salida digital/analogico, cada uno cuenta
con un convertidor DA de 12 bits, con salida analogica en el rango de 0[V]
a +5[V]. Tambien se cuenta con dos contadores que son programados para
establecer el periodo de muestreo en un amplio rango de valores. En el
experimento de la gura 10.12 se uso un periodo de muestreo de 0.005[s].
Motor de CD con escobillas e iman permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Sensor de posicion. Potenciometro de precision de 1[KOhm], diez vueltas,
con tope.
En la gura 10.15 se presenta el diagrama de bloques del sistema de control
completo.
Acoplamiento mecanico del sensor de posicion
Dado que la medicion de la posicion del motor se realiza con un poten-
ciometro con tope, es importante preveer la posibilidad de que dicho tope sea
alcanzado pues esto puede da nar al potenciometro dado el gran par que puede
desarrollar el motor. Por esta razon se utiliza un acoplamiento mecanico que
consta de un anillo de goma que se une rmemente a la echa del motor. El
diametro de este anillo es tal que el extremo movil del potenciometro puede
entrar en el de manera mas o menos ajustada. De esta manera, si se alcanza
el tope del potenciometro, la exibilidad del anillo de goma permite que la
echa del motor siga girando sin da nar la parte movil del potenciometro que
permanecera en reposo.
Interfaz de entrada
El potenciometro usado como sensor de posicion (gura 10.15) entrega a su
salida un voltaje en el rango de 0[V] a +5[V]. Esto es muy conveniente por-
que el convertidor de entrada analogico/digital recibe voltajes en el rango de
-5[V] a +5[V]. Ante el voltaje recibido desde el potenciometro, el convertidor
analogico/digital entrega un codigo, codigo
i
, en el rango de 0 a 2
n
= 4096
porque dicho convertidor es de 12 bits. A partir de este codigo debe recupe-
rarse una variable u
a
que numericamente sea igual al voltaje entregado por el
potenciometro . De acuerdo a la gura 10.16 esto puede realizarse mediante
la operacion:
u
a
=
10.0
4096.0
codigo
i
5.0 (10.61)
la cual debe ser efectuada por el programa de computadora.
564 10 Control de posicion de un motor de CD
T
L
0
8
1
P
C
L
8
1
2

P
G
T
L
0
8
1
+
+
T
L
0
8
1
+
T
L
0
8
1
+
QQ
C
P
5
:
6
k
6
:
7
2
k
3
:
3
k
5
:
5
k
3
3
k
3
3
k
1
M
1
k
1
k
3
:
3
k
5
V
5
V
1
5
V

1
5
V
i
5
W
1

T
I
P
1
4
5
T
I
P
1
4
1
M
O
T
O
R
A
m
p
l
i
f
i
c
a
d
o
r

d
e

p
o
t
e
n
c
i
a
C
o
n
t
r
o
l

d
e

c
o
r
r
i
e
n
t
e
R
e
a
l
i
m
e
n
t
a
c
i

n

d
e

p
o
s
i
c
i

n
R
e
a
l
i
m
e
n
t
a
c
i

n

d
e

c
o
r
r
i
e
n
t
e
u
d
0
;
5
[
]
V

3
;
3
[
]
A
u
i
u
S
e
n
s
o
r

d
e
p
o
s
i
c
i

n
I
n
t
e
r
f
a
z

d
e

s
a
l
i
d
a
Figura 10.15. Diagrama de bloques e interfaces del sistema de control de posicion
basado en una computadora personal.
10.8 Control basado en una computadora personal 565
u
a
5
5
4096
i
cdigo
Figura 10.16. Acondicionamiento de la se nal de posicion entregada por el conver-
tidor analogico/digital.
Interfaz de salida
De acuerdo a (10.1) la se nal de control es la orden de corriente i

la cual,
de acuerdo a las especicaciones del motor, bien puede tomar valores en el
rango de -3[A] a +3[A]. Esta se nal es calculada por la computadora, la cual
enva el dato a la tarjeta adquisitora de datos quien debe entregar el valor de
i

como una se nal de voltaje analogico.


Una vez que el programa de computadora calcula i

, mediante el uso del


algoritmo de control correspondiente, se utiliza un conjunto de instrucciones
que independientemente del valor de i

este se restringe al rango [-3,+3][V].


Despues, sabiendo que el convertidor digital/analogico es de 12 bits, se cons-
truye el esquema mostrado en la gura 10.17 para encontrar que el valor de
i

debe enviarse al convertidor digital/analogico mediante un codigo calcu-


lado como (esto se realiza en el programa de computadora):
codigo
o
=
4096
6
(i

) + 2048 (10.62)
Como resultado de esta orden el convertidor digital/analogico entregara un
voltaje analogico u
d
en el rango de 0[V] a +5[V]. As que se debe utilizar
un circuito analogico de interfase que adapte este voltaje en el rango 0[V]
a +5[V] al rango de -3[V] a +3[V] que son los valores que tomara i

. De
acuerdo a la gura 10.18 esto se consigue con un circuito analogico, basado
en amplicadores operacionales, que realice la siguiente operacion:
i

=
6
5
u
d
3 (10.63)
566 10 Control de posicion de un motor de CD
Esta es la funcion que realiza el bloque interfaz de salida de la gura 10.15
1
. La razon de que deba aparecer i

como resultado de todas las operaciones


descritas tiene que ver con la compatibilidad de signos que deben respetar los
circuitos que en la gura 10.15 se colocan a continuacion del punto se nalado
con i

.
4096
3 3
2048
i

( )
0
cdigo
Figura 10.17. Acondicionamiento de la se nal i

que debe ser enviada al conver-


tidor digital/analogico.
5
3
3
i

( )
u
d
Figura 10.18. Dise no de la interfaz analogica que debe ser colocada a la salida del
convertidor digital/analogico.
1
Todos los amplicadores operacionales usados en la gura 10.15 son TL081. Los
tres primeros tienen la terminal + conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal + conectada a ui.
10.8 Control basado en una computadora personal 567
Control de corriente
El amplicador operacional mostrado en el bloque control de corriente
de la gura 10.15 realiza la operacion indicada en (9.14) con K = 30.
Amplicador de potencia
Esta parte es identica a lo expuesto en la seccion 9.6.2.
Programa de computadora
Todos los algoritmos de control fueron programados en Borland C++. A
continuacion se lista el codigo utilizado.
#include <stdio.h>
#include <conio.h>
#include <math.h>
#include <stdlib.h>
#include <string.h>
#include <iostream.h>
int alto,bajo,dato,salida,i;
volatile float Ts=0.005;//Periodo de muestreo
/*------------------variables para encoder----------*/
//volatile int alto_dig=0,bajo_dig=0,dato_dig=0;
volatile float y,ir,ym1,v,dv,nv,e,ninte;
volatile float inte,gc1,gc2,tiempo,perturbacion;
/*--------------------------------------------------*/
volatile float r_des=1.0,Kp=1.9434,Kv=0.1777;
//volatile float gama=2.3853,c=12.2734,b=4.8935;
volatile float gama=2.0465,c=10.3672,b=3.8935;
volatile float kp1=1.9434,ki1=9.7170;
volatile float kp2=1.3878,kd2=0.3195;
volatile long double y0;
/*-Direccion base y periodo de muestreo para la tarjeta--*/
int base=0x210;//Direccion base de la tarjeta
int lsb1=0x00;//Periodo de muestreo
int msb1=0x01;//Periodo de muestreo
568 10 Control de posicion de un motor de CD
int lsb2=0x00;//Periodo de muestreo
int msb2=0x01;//Periodo de muestreo
volatile float yy[3000];
volatile float uu[3000];
volatile float ref[3000];
FILE *fp;
char Direccion[30];
void Inicializa(void);
void EscribeArchivo(float datos1,floatdatos2,float datos3);
void Cierra(void); void main()
{
clrscr();
/*---------Se programa la tarjeta adquisitora--------*/
/*---Vease manual PCL 812-PG de Advantech------*/
outportb(base+11,6);
//CAD iniciada con reloj y transferencia dato por software
outportb(base+9,0);// ganancia 1
outportb(base+10,15);// Canal AD No. 15
outportb(base+3,0x77);//Programacion periodo de muestreo
outportb(base+1,lsb1);//Programacion periodo de muestreo
outportb(base+1,msb1);//Programacion periodo de muestreo
outportb(base+3,0xb7);//Programacion periodo de muestreo
outportb(base+2,lsb2);//Programacion periodo de muestreo
outportb(base+2,msb2);//Programacion periodo de muestreo
i=1;
do
// inicia ciclo de control
{
/*-------------Conversion AD----------------------------*/
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
y=(10.0/4096.0)*dato-5.0;//Posicion theta
tiempo=(i-1)*Ts;
/*--------Inicia lectura de encoder---------------------*/
10.8 Control basado en una computadora personal 569
// para la configuracion de entradas digitales
/*
alto_dig=inport(base+7);
alto_dig+=0xff+1;
bajo_dig=inport(base+6);
bajo_dig=(bajo_dig)&(0x00ff);
dato_dig=256*alto_dig+bajo_dig;
po_rad=((6.283185307*dato_dig)/1600);
// 1600 es el numero de cuentas por revolucion.
// gotoxy(10,10); printf("Posicion en radianes: %f",po_rad);
y=po_rad;
*/
/*-------Termina lectura encoder------------------------*/
if(i==1)
{ //condiciones iniciales
y0=y;
ym1=0.0;
v=0.0;
inte=0.0;
}
y=y-y0;//Salida fijada a cero
e=r_des-y;
/*------ Control proporcional + retro de velocidad------*/
/*
ir=Kp*(r_des-y)-Kv*(y-ym1)/Ts;
*/
/*----------- Control con red de adelanto --------------*/
/*
dv=(-c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=gama*(e+v);
*/
/*---------- Control dos grados de libertad ------------*/
gc1=kp1*e+inte;
gc2=kp2*y+kd2*(y-ym1)/Ts;
ir=gc1-gc2;
ninte=inte+ki1*e*Ts;
perturbacion=0.0;
if(tiempo>1.5)
{perturbacion=0.5;}
ir=-ir+perturbacion;
// Saturacion de ir [-3,3][A]
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
570 10 Control de posicion de un motor de CD
alto=floor(alto/256.0);
outportb(base+4,bajo); //Manda codigo_o al CDA
outportb(base+5,alto);
yy[i]=y;
uu[i]=ir-perturbacion;
ref[i]=r_des;
ym1=y;
v=nv;
inte=ninte;
i++;
}while (!kbhit());// Termina ciclo de control
// while (i<=3000);
ir=0.0;// Se ordena detener el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}
void Inicializa(void) {
strcpy(Direccion,"c:\\motorcd\\sigue.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}
void EscribeArchivo(float datos1,float datos2,float datos3) {
fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}
void Cierra(void) {
fclose(fp);
}
10.10 Preguntas de repaso 571
10.9. Resumen del captulo
Se ha mostrado como controlar la posicion de un motor de CD bajo el
efecto de una perturbacion externa de par. Para esto se han construido dos
controladores: uno es un controlador PID clasico y el otro es un controla-
dor PID modicado. Aunque ambos controladores resuelven el problema, el
controlador PID modicado presenta un mejor desempe no. Como este contro-
lador necesita el valor numerico de los parametros del motor, se explica como
identicar de manera experimental tales parametros. En este captulo se ha
mostrado como sintonizar el controlador PID clasico usando el valor numerico
de los parametros del motor. Sin embargo, la principal ventaja de este contro-
lador es que puede ser sintonizado a prueba y error sin necesidad de conocer
tales valores numericos (vease la seccion 5.3 del captulo 5). Por ultimo, se ha
construido un controlador PD para el seguimiento de trayectorias. Esta es una
tarea compleja que necesita del conocimiento de los parametros del motor. Se
ha explicado de manera detallada como construir estos controladores usando
un microcontrolador y una computadora personal. La razon de usar una com-
putadora personal es la construcion del controlador PD para el seguimiento
de trayectorias ya que se requiere del calculo de funciones sinusoidales del
tiempo lo cual consume demasiado tiempo si se utiliza un microcontrolador.
Cuando se construye un sistema de control en la practica, es muy impor-
tante que el procesamiento de las se nales que realiza el software y el hardware
utilizados corresponda elmente a las operaciones matematicas que indica el
controlador. El sistema de control que se ha construido ha sido elaborado
teniendo muy en cuenta este aspecto y la cuidadosa descripcion del mismo
lo demuestra. Los autores pensamos que, desafortunadamente, en el medio
academico con mucha frecuencia se construyen sistemas de control de manera
un tanto descuidada. Es decir, cuando se controla la posicion de un motor
de CD con frecuencia a la gente solo le interesa que el motor se mueva hacia
donde se desea y poca antencion se presta a vericar que la respuesta tran-
sitoria es la esperada. Normalmente la parte transitoria de la repuesta es la
mas afectada por las inconsistencias introducidas en el software y el hardware
a la hora de procesar las se nales correspondientes.
10.10. Preguntas de repaso
1. Considere el control PID de posicion de un motor de CD Que pasara si
la perturbacion y/o la posicion deseada no fueran constantes?
2. En robots industriales se usan controladores PID para el seguimiento de
trayectorias en lugar de controladores PD Como cree que se pueda con-
seguir esto? Que ventajas cree que tenga el uso de controladores PID en
lugar de controladores PD?
3. Como afectan las ganancias de un controlador PID clasico a la respues-
ta de un sistema de control de posicion? Si el efecto de la perturbacion
572 10 Control de posicion de un motor de CD
externa es compensada lentamente Que ajustara en las ganancias del
controlador PID para acelerar este proceso?
4. En el captulo 9 se ha visto que un controlador PI es adecuado para
compensar el efecto de perturbaciones externas de par en sistemas de
control de velocidad Por que cree que en sistemas de control de posicion
se deba usar un controlador PID en lugar de un controlador PI?
5. Mencione algunas ventajas y desventajas de usar microcontroladores y
computadoras personales para construir controladores digitales.
6. Un motor de CD tambien se puede controlar sin usar un lazo de corriente
si se supone que la inductancia de armadura es despreciable (sobre todo
en motores peque nos) Que cambios tendra que hacer a los circuitos de
las guras 10.13 y 10.15 para trabajar sin lazo de corriente?
7. Describa el procedimiento presentado en este captulo para la identica-
cion experimental de los parametros de un motor de CD.
8. Que es un compensador de adelanto?
9. Cuales son las ventajas y las desventajas de usar compensadores de ade-
lanto como controladores de posicion?
10. En teora, la respuesta de un sistema de control de posicion se puede hacer
tan rapida y tan amortiguada como se desee usando un controlador PID
Que problemas pueden presentarse en la practica si las ganancias de un
controlador PID son muy grandes?
Referencias
1. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-
tor Corporation, 1995.
2. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
3. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
4. PCL-812PG Users Manual, Advantech, Taiwan, 1996.
5. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espa nol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
8. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotors Virtual Classroom, 1998.
11
Control de un sistema de levitacion magnetica
Los sistemas de levitacion magnetica son equipos que permiten que un
cuerpo hecho de material ferromagnetico ote o levite en el espacio sin
tener contacto alguno con los otros cuerpos que lo rodean. El secreto es el uso
de una fuerza magnetica producida por un poderoso electroiman. La principal
razon para producir tal fenomeno es el hecho de que, al no haber contacto
mecanico, el cuerpo que levita puede moverse sin que exista friccion y, por
tanto, desgaste. Este fenomeno es utilizado actualmente en m ultiples aplica-
ciones, quiza la mas conocida es la de algunos trenes de alta velocidad.
576 11 Levitacion magnetica
Objetivos del captulo
Construir la totalidad de las partes que componen a un sistema de levita-
ci on magnetica.
Construir un controlador PID usando electr onica anal ogica.
Aplicar los conceptos de control cl asico a una planta que es inestable por
naturaleza.
Identicar de manera experimental los par ametros de un sistema relativa-
mente complejo.
Actualmente los sistemas de levitacion magnetica son muy importantes
debido a la gran cantidad de aplicaciones que tienen. A estos equipos tambien
se les conoce como MagLev, por la abreviacion del termino ingles Magnetic
Levitation System. Una de las principales razones para el uso de sistemas de
levitacion magnetica es su capacidad para eliminar la friccion entre las partes
mecanicas que lo forman. Algunos ejemplos de aplicacion son los trenes de alta
velocidad que viajan otando sobre un riel con el cual no tienen contacto [1],
los rodamientos magneticos [2] que pueden eliminar la friccion y el consecuente
desgaste de las piezas mecanicas involucradas y la construccion de sistemas de
posicionamiento de gran exactitud [3] gracias a que se elimina la friccion no
lineal. Dada la importancia practica de estos mecanismos, con frecuencia son
utilizados como sistemas experimentales para probar el desempe no de tecnicas
de control clasicas y avanzadas [4], [5], [6], [7], [8], [9].
En este captulo se dise na un sistema de levitacion magnetica sencillo que
puede ser visto como al principio de funcionamiento de las aplicaciones men-
cionadas previamente. En la gura 11.1 se muestra el sistema de levitacion
magnetica de interes. Este sistema consiste de una esfera de material ferro-
magnetico que es atrada hacia arriba por la fuerza magnetica debida a un
electroiman. Esta esfera metalica tambien recibe el efecto de la fuerza debida
a la gravedad dirigida hacia abajo. Se desea suspender o levitar a la esfera a
una distancia del iman que pueda ser jada a voluntad. Sin embargo, el prin-
cipal problema para conseguirlo es que este sistema es claramente inestable
como se explica a continuacion. Suponga que el electroiman ejerce sobre la
esfera metalica una fuerza hacia arriba de magnitud constante e igual a la que
ejerce la gravedad hacia abajo. Entonces las fuerzas se cancelan exactamen-
te y la esfera metalica permanecera suspendida en el espacio. La experiencia
indica que la fuerza del electroiman es mayor conforme se esta mas cerca de
el, mientras que la fuerza de la gravedad es siempre la misma. Suponga ahora
que, por alguna razon, la esfera se desplaza un poco hacia arriba respecto de
la posicion en donde se encontraba otando. Esto hace que la fuerza del elec-
troiman sea mayor que la fuerza de gravedad, por lo que la esfera sera atrada
hacia el electroiman hasta quedar pegada al mismo. Por otro lado, si la esfera
se desplaza ligeramente hacia abajo respecto de la posicion en donde se en-
contraba otando, entonces ahora es la fuerza de la gravedad la que vence y la
esfera caera hasta el suelo. Una situacion como la recien descrita es muestra
11 Levitacion magnetica 577
de la inestabilidad de un sistema: cuando se perturba ligeramente a un siste-
ma inestable, las variables del mismo se alejaran del lugar en que inicialmente
estaban.
u
i

F
mg
m
y = 0
y
electroimn
esfera
Figura 11.1. Sistema de levitacion magnetica.
Las variables y parametros involucrados son los siguientes:
u es el voltaje aplicado en las terminales del electroiman.
i es la corriente electrica a traves del devanado del electroiman.
y es la posicion de la esfera medida entre la supercie inferior del elec-
troiman y la parte superior de la esfera. Esta distancia es cero cuando la
esfera toca al electroiman y crece (positiva) conforme la esfera se mueve
hacia abajo alejandose del electroiman.
F es la fuerza magnetica ejercida por el electroiman sobre la esfera. Su
sentido se dene en el mismo sentido en el que y crece. Mas adelante se
mostrara que F es negativa por lo que representa correctamente una fuerza
de atraccion.
m es la masa de la esfera.
L representa la inductancia del devanado del electroiman. La inductancia
cambia con la posicion de la esfera y se acostumbra usar la notacion L(y)
para subrayar este hecho.
R es la resistencia del cobre con el que esta construido el devanado del
electroiman.
es el ujo magnetico concatenado por el devanado del electroiman y
esta dado como = L(y) i.
578 11 Levitacion magnetica
11.1. Modelo matematico no lineal
Modelo del subsistema electrico
Notese que el circuito electrico del electroiman esta formado unicamente
por un circuito RL serie en el que aparecen el voltaje aplicado u, la inductancia
y la resistencia del devanado del electroiman (vease la gura 11.1). Aplicando
la Ley de Kirchho de voltajes se tiene:
voltaje aplicado =

cadas de voltaje en la malla


u = cada en la inductancia + cada en la resistencia
u =
d
dt
+R i (11.1)
donde se ha usado la Ley de Faraday para expresar que la cada en la in-
ductancia esta dada por la variacion respecto al tiempo del ujo concatenado
d
dt
.
El ujo concatenado se relaciona con la corriente electrica a traves de la
inductancia del siguiente modo = L(y) i, donde la inductancia L(y) no
es constante sino que es una funcion de la posicion de la esfera y. Como se
vera mas adelante, es importante saber como depende la inductancia de la po-
sicion de la esfera. En [7], [8] pp.245, [10] pp. 31, se sugiere que la inductancia
esta dada como:
L(y) = k
0
+
k
1 +
y
a
(11.2)
donde a, k
0
y k son constantes positivas. Es interesante darse cuenta de que k
0
y k
0
+k representan, respectivamente, los valores de la inductancia cuando la
esfera no esta presente (y ) y cuando la esfera esta pegada al electroiman
(y = 0). Por tanto, conforme la esfera se aleja del electroiman la inductancia
L(y) variara como se muestra en la gura 11.2. El parametro a representa
la rapidez con que la inductancia vara entre k
0
+ k y k
0
conforme crece
y. Es importante mencionar que la expresion (11.2) es propuesta de manera
emprica para ajustarse al comportamiento mostrado en la gura 11.2 y, por
tanto, no es la unica manera de representar a L(y). Otra funcion que tambien
se propone con frecuencia es [11], [12]:
L(y) = k
0
+ke

y
a
(11.3)
Puede elegirse cualquiera de las funciones en (11.2) o (11.3) para represen-
tar a L(y) siempre que se obtenga el mejor ajuste a los datos experimentales.
En la seccion 11.4.2 se explica como realizar un experimento para identi-
car los parametros de la inductancia. En este trabajo se continuara usando
el smbolo general L(y) para representar la inductancia con el n de que
el lector tenga la posibilidad de utilizar los resultados aqu expuestos para
11.1 Modelo matematico no lineal 579
y
L y ( )
k
0
+k
k
0
Figura 11.2. La inductancia del electroiman como funcion de la posicion de la
esfera.
cualquiera de los casos en (11.2) y en (11.3). Solamente en la parte nal del
dise no, cuando se necesiten calcular valores numericos muy especcos, se pro-
cedera utilizar (11.2) porque con esta expresion se obtuvo el mejor ajuste a
los datos experimentales (vease la seccion 11.4.2).
Modelo del subsistema mecanico
Un paso importante para obtener el modelo del subsistema mecanico es
la determinacion de la fuerza magnetica, F, ejercida por el electroiman sobre
la esfera. Esta fuerza, dirigida en el sentido en el que y crece, esta dada por
(2.46). Esta expresion se reescribe a continuacion para facilidad de referencia
y, dicho sea de paso, tambien puede ser consultada en los trabajos previos [7],
[10] pp. 31, [11], [12]:
F =
E(i, y)
y
, (11.4)
E(i, y) =
1
2
L(y) i
2
(11.5)
donde E(i, y) es la energa magnetica almacenada en el sistema magnetico
completo (electroiman y esfera).
Aplicando la Segunda Ley de Newton a la esfera se obtiene el modelo del
subsistema mecanico (vease la gura 11.1):
580 11 Levitacion magnetica
masa aceleracion =

fuerzas sobre la esfera


m
d
2
y
dt
2
= fuerza del electroiman + peso de la esfera
m
d
2
y
dt
2
= F(i, y) +mg
m
d
2
y
dt
2
=
1
2
L(y)
y
i
2
+mg (11.6)
donde se han usado (11.4) y (11.5) para escribir:
F(i, y) =
1
2
L(y)
y
i
2
El lector puede usar cualquiera de las expresiones en (11.2) y (11.3) para
vericar la siguiente propiedad:
L(y)
y
< 0 (11.7)
para todo valor positivo de y, es decir, para cualquier posicion de la esfera
que pueda ser alcanzada en la practica. Notese que el peso mg favorece el
incremento de y por lo que debe aparecer con signo positivo en (11.6). Por
otro lado, la fuerza F(i, y) tambien aparece afectada con un signo positivo
porque se dene en la direccion en la que y crece. Sin embargo, su valor
negativo debido a (11.7) implica que su efecto es en contra del incremento de
y, es decir, en direccion opuesta al peso de la esfera. Por tanto, la propiedad
en (11.7) es indispensable para que la esfera pueda levitar venciendo el efecto
de la gravedad.
Por otro lado, se debe considerar el uso de un amplicador de potencia
a la entrada del electroiman (vease la seccion 9.2) y un lazo de corriente, es
decir u = A
p
(i

i) donde A
p
es la ganancia del amplicador de potencia,
es la ganancia proporcional del lazo de corriente e i

es la corriente que se
desea circule a traves del electroiman. El proposito de usar un lazo de corriente
puede explicarse sustituyendo u = A
p
(i

i) en (11.1):
A
p
(i

i) =
d
dt
+R i (11.8)
Si se elige un valor grande de entonces:
i

i =
1
A
p

_
d
dt
+R i
_
0
por lo que se puede considerar que i = i

, es decir, que la corriente en el


electroiman es igual a la corriente que se ha ordenado. La ventaja de esto es
que ahora el sistema de control es robusto contra cambios de parametros en
la dinamica electrica dada en (11.1). Por ejemplo, la resistencia del devanado
11.2 Modelo lineal aproximado 581
puede tener variaciones (incrementos) importantes debidas al calor producido
por la gran corriente electrica que normalmente se necesita para hacer levitar
la esfera. Si la resistencia crece, entonces la corriente (y por tanto, la fuerza
del electroiman sobre la esfera) disminuye. Esto requiere aumentar el voltaje
aplicado para incrementar la fuerza del iman sobre la bola. Como consecuen-
cia, se incrementa el valor de la corriente, aumentando el calor disipado y, por
tanto, la resistencia vuelve a crecer. Finalmente el voltaje aplicado sera tan
grande que alcanzara el valor de saturacion del amplicador de potencia y,
entonces, la esfera ya no podra levitar. Al usar el lazo de corriente se con-
sigue que la corriente sea igual a la corriente deseada u ordenada, i = i

,
independientemente de los cambios en la resistencia o alg un otro parametro
en (11.1).
Sustituyendo = L(y)i en (11.8) se obtiene:
L(y)
di
dt
= A
p
i

r i
L(y)
y
y i (11.9)
donde se ha denido r = R+A
p
. Entonces, el modelo del sistema de levitacion
magnetica completo esta dado por:
L(y)
di
dt
= A
p
i

r i
L(y)
y
y i (11.10)
m
d
2
y
dt
2
=
1
2
L(y)
y
i
2
+mg (11.11)
El modelo matematico en (11.10), (11.11), es no lineal porque incluye fun-
ciones inversas de y y funciones cuadraticas de i. Estas caractersticas no
permiten el uso de la transformada de Laplace para dise nar el controlador.
Una manera de resolver este problema es encontrando un modelo lineal que
represente, al menos de manera aproximada, al modelo no lineal en (11.10),
(11.11). Sin embargo, este modelo aproximado y el controlador obtenido a
partir de el solo seran de utilidad en una region de tama no reducido.
11.2. Modelo lineal aproximado
11.2.1. Obtencion de un modelo en variables de estado
De acuerdo a lo expuesto en la seccion 7.1, dado un conjunto de ecuaciones
diferenciales como (11.10), (11.11), se puede encontrar una representacion en
variables de estado deniendo las componentes del vector de estado x como
las variables incognita de dichas ecuaciones diferenciales y sus primeras q 1
derivadas, donde q es el orden de la ecuacion diferencial correspondiente. La
incognita en (11.10) es i y la ecuacion es de primer orden, por tanto, solo
i calica como componente del vector de estado. Por otro lado, la incognita
en (11.11) es y y la ecuacion es de segundo orden, por tanto y y y calican
582 11 Levitacion magnetica
como componentes del vector de estado. De acuerdo a lo anterior, se propone
el siguiente vector de estado:
x =
_
_
x
1
x
2
x
3
_
_
=
_
_
i
y
y
_
_
(11.12)
Es importante aclarar que i

no es una variable de estado sino la variable


de control, es decir, ahora es la entrada del sistema de levitacion magnetica.
Sustituyendo en (11.10), (11.11), las variables denidas en (11.12) se puede
escribir:
x
1
=
1
L(x
2
)
_
A
p
i

r x
1

L(x
2
)
x
2
x
3
x
1
_
x
2
= x
3
x
3
= g +
1
2m
L(x
2
)
x
2
x
1
2
Usando notacion vectorial se obtiene:
x = f(x, i

) (11.13)
f(x, i

) =
_
_
f
1
(x, i

)
f
2
(x, i

)
f
3
(x, i

)
_
_
=
_

_
1
L(x2)
_
A
p
i

r x
1

L(x2)
x2
x
3
x
1
_
x
3
g +
1
2m
L(x2)
x2
x
1
2
_

_(11.14)
De acuerdo a la seccion 7.2.2, los puntos de operacion son las parejas (x

, i

o
)
que satisfacen:
f(x

, i

o
) =
_

_
1
L(x

2
)
_
A
p
i

o
r x

L(x

2
)
x2
x

3
x

1
_
x

3
g +
1
2m
L(x

2
)
x2
x

1
2
_

_ =
_
_
0
0
0
_
_
(11.15)
donde L(x

2
) y
L(x

2
)
x2
indican que dichas funciones estan evaluadas en x
2
= x

2
.
Entonces se obtiene:
x

3
= 0 (11.16)
x

1
=

2mg

L(x

2
)
x2
(11.17)
i

o
=
r
A
p

1
(11.18)
Recuerdese que
L(x

2
)
x2
> 0, debido a (11.7). El valor de x

2
= y
d
se propone
ya que representa la posicion en la que se desea hacer levitar a la esfera.
11.2 Modelo lineal aproximado 583
11.2.2. Aproximacion lineal
De acuerdo a (7.29), (7.30), (7.31) en la seccion 7.2.2, el modelo no lineal
dado en (11.13), (11.14) puede ser aproximado por el siguiente modelo lineal:
z = Az +Bv (11.19)
A =
_

_
f1(x,i

)
x1
f1(x,i

)
x2
f1(x,i

)
x3
f2(x,i

)
x1
f2(x,i

)
x2
f2(x,i

)
x3
f3(x,i

)
x1
f3(x,i

)
x2
f3(x,i

)
x3
_

_
x=x

,i

=i

o
B =
_

_
f1(x,i

)
i

f2(x,i

)
i

f3(x,i

)
i

_
x=x

,i

=i

o
donde z = x x

y v = i

o
. Usando (11.14) se obtiene:
A =
_
_
a
11
0 a
13
0 0 1
a
31
a
32
0
_
_
, B =
_
_
Ap
L(x

2
)
0
0
_
_
, (11.20)
a
11
=
r
L(x

2
)
, a
13
=
1
L(x

2
)
L(x

2
)
x
2
x

1
a
31
=
1
m
L(x

2
)
x
2
x

1
, a
32
=
1
2m

2
L(x

2
)
x
2
2
x
2
1
Recuerdese que el punto de operacion x

= [x

1
x

2
x

3
]
T
, i

o
, representa cua-
tro valores escalares constantes. Usando la transformada de Laplace en cada
renglon de (11.19) junto con los valores dados en (11.20) se obtiene:
Z
1
(s) =
1
s a
11
[a
13
Z
3
(s) +
A
p

L(x

2
)
V (s)], Z
2
(s) =
a
31
s
2
a
32
Z
1
(s),
sZ
2
(s) = Z
3
(s) (11.21)
donde Z
1
(s), Z
2
(s), Z
3
(s), V (s) representan las transformadas de Laplace de
las funciones del tiempo z
1
= x
1
x

1
, z
2
= x
2
x

2
, z
3
= x
3
x

3
y v = i

o
,
respectivamente. Combinando las expresiones en (11.21) se obtiene:
Z
2
(s)
V (s)
=
a31Ap
L(x

2
)
s
3
a
11
s
2
(a
32
+a
31
a
13
)s +a
11
a
32
(11.22)
La funcion de transferencia en (11.22) representa el modelo lineal aproximado
que sera utilizado para estudiar y dise nar un controlador que permita levitar
la esfera. Recuerdese que, de acuerdo a la seccion 7.2, todo lo que se obtenga a
partir del uso de (11.22) solo sera valido si x e i

permanecen cerca del punto


de operacion (x

, i

o
).
584 11 Levitacion magnetica
11.3. Construccion del prototipo
A continuacion se describe la manera en que fueron construidas las partes
principales del sistema de levitacion magnetica.
11.3.1. Esfera
La esfera debe ser de material ferromagnetico y, a la vez, debe ser sucien-
temente ligera. Por otro lado, con el n de facilitar la medicion de su posicion,
la esfera no debe ser demasiado peque na. Estos requerimientos fueron satisfe-
chos seleccionando una esfera de unisel de tama no adecuado (aproximadamen-
te 0.03[m] de diametro), de acuerdo al sensor de posicion que sera construido,
y se procedio a cubrir toda su supercie con material ferromagnetico. Esto
ultimo se consiguio insertando peque nas tachuelas de acero sobre la super-
cie de la esfera. Aunque no se consiguio una supercie esferica perfectamente
lisa (quedan espacios no ferromagneticos entre las tachuelas), sin embargo,
los resultados muestran que lo obtenido es suciente. Con el n de evitar el
desprendimiento de las tachuelas estas se insertaron agregando pegamento.
11.3.2. Electroiman
Se utilizo un transformador al cual se le realizaron las siguientes modi-
caciones. Como la mayora de los transformadores, el transformador original
constaba de un n ucleo formado por laminas en forma de E las cuales estaban
colocadas en forma encontrada. Esto permite formar un circuito magnetico con
dos ramas con una dispersion despreciable de las lneas de campo magnetico.
Se procedio a desmontar el n ucleo para colocar todas las laminas en forma
de E en una sola direccion como se muestra en la gura 11.1. Esto permi-
te que la esfera al levitar cierre convenientemente el circuito magnetico del
electroiman generandose de esta manera una fuerza magnetica de atraccion
del electroiman sobre la esfera. El devanado del electroiman se construyo en-
rollando alambre magneto del n umero 19. Esto debe hacerse de manera que
las espiras queden perfectamente acomodadas una a lado de la otra, sin que
quede una sobre la otra, y formando tantas capas como lo permita el espacio
libre que hay en las laminas en forma de E. Las dimensiones del transformador
utilizado fueron seleccionadas mediante experimentacion: una vez que se ha
seleccionado la esfera a levitar se verica si, con las fuentes de alimentacion de
las que se dispone, el transformador es capaz de generar una suciente fuerza
de atraccion sobre la esfera. Tambien debe vericarse que el calentamiento del
electroiman obtenido no sea exagerado.
11.3.3. Sensor de posicion
El componente principal es una simple fotorresistencia que se conecta en
serie con una resistencia ja para formar un divisor de tension (vease la gura
11.3 Construccion del prototipo 585
+
1
k
T
L
0
8
2

+
1
5
V

1
5
V
1
0
k
1
0
k
1
k
2
:
2
p
F
1
5
V
1
k
1
0
k
1
0
k
2
:
2
p
F
4
7
k
1
0
k
1
0
k
1
0
k
4
7
0
0
0
p
F
1
N
4
0
0
1
1
2
:
5
V
t
A
B
T
1
y
s
e
n
s
o
r
p
o
s
i
c
i

n
R
2
R
1
C
2
C
1
+
T
L
0
8
2
+T
L
0
8
1

+ T
L
0
8
1

+
+
T
L
0
8
2
2
:
2
p
F
2
:
2
p
F
+
T
L
0
8
2
L
M
3
3
9
i

=
v
+
i
o

A
d
i
o
1
0
k
1
k
1
k
1
0
k
1
0
0
k
1
N
4
0
0
1
1
0
k
6
:
8
k
1
5
V
1

5
W
T I P 1 4 1
u
1
2
:
5
V
1 N 5 4 0 4
i
L
(
y
)

A
d
v
y
v
y
v
V
P
1
V
t
Figura 11.3. Diagrama electrico del sistema de control completo.
586 11 Levitacion magnetica
11.3). La fotorresistencia se coloca dentro de una pelota de Ping-Pong para
aprovechar la dispersion de luz que su supercie consigue. De esta manera,
aunque la fotorresistencia es relativamente peque na, sin embargo se obtiene
una variacion uniforme de la luz que incide sobre ella en un amplio rango
de posiciones de la esfera. En este sentido, el diametro de la esfera de unisel
utilizada para construir la esfera en la seccion 11.3.1 es igual al diametro
de la pelota de Ping-Pong. El conjunto se coloca en un extremo de un tubo
metalico de 0.10[m] de longitud cuyo diametro se ajusta perfectamente a la
pelota de Ping-Pong. Las paredes interiores del tubo se cubren con cartulina
negra. La parte de la pelota de Ping-Pong que queda fuera del tubo se pinta de
negro. Todo esto permite disminuir la posibilidad de interferencias luminosas.
Frente al otro extremo del tubo se coloca una lampara de luz visible. El
conjunto se coloca del siguiente modo. Cuando la esfera toca al electroiman la
luz de la lampara es completamente obstruida y la fotorresistencia no recibe
luz, por lo que su resistencia es muy grande. Conforme la esfera se aleja
(hacia abajo) del electroiman la cantidad de luz que llega desde la lampara
hasta la fotorresistencia aumenta, por lo que su resistencia disminuye cada vez
mas.

Esto permite que el voltaje en el punto y
v
de la gura 11.3 aumente al
aumentar la posicion de la esfera (crece al alejarse la esfera del electroiman).
Es interesante darse cuenta que no es necesario un sistema optico basado
en alg un tipo de luz no visible (infrarroja) si se asegura que se ha reducido
considerablemente la posibilidad de interferencias luminosas. El voltaje y
v
representa la medicion en volts de la posicion y en metros (recuerdese que
y = x
2
). El valor deseado de posicion se ja con el voltaje y

v
en la gura 11.3
mediante el uso de un potenciometro. Las dos resistencias entre los puntos
y
v
y y

v
de la gura 11.3 permiten que el voltaje V
P1
en la misma gura
sea igual a
1
2
z
2v
, donde z
2v
= y
v
y

v
es el error de posicion medido en
volts (vease el ejercicio 5 en el captulo 2). Para obtener estos resultados es
recomendable que cada una de estas resistencias (de 10[KOhm]) sean varias
veces mas grandes que las resistencias que estan en serie con la fotorresistencia
y con el potenciometro que ja a y

v
. Por otro lado, las dos resistencias de
10[KOhm] deben ser al menos seis veces mas chicas que el valor de R
1
. La
relacion entre z
2v
y el error de posicion medido en metros z
2
= x
2
x

2
esta dada por la ganancia del sensor optico A
s
, es decir:
z
2v
= A
s
z
2
(11.23)
11.3.4. Controlador
De acuerdo a lo visto en la seccion 8.2, el amplicador operacional colocado
entre los puntos A y B de la gura 11.3 constituye un controlador PID que,
ademas, introduce un cambio de signo. Mas adelante, en este captulo, se
explica como seleccionar los valores de R
1
, R
2
, C
1
y C
2
.
11.4 Identicacion experimental de los parametros del modelo 587
11.3.5. Lazo de corriente
Los dos amplicadores operacionales que siguen a T1, en la gura 11.3, son
utilizados para construir el lazo de corriente que efect ua la operacion (i

i),
valor que es entregado al amplicador de potencia justo en el diodo recticador
colocado a la entrada del comparador LM339. Este diodo y la resistencia de
10[KOhm] sirven para evitar que sean aplicados voltajes negativos a la entrada
del comparador, los cuales pueden aparecer debido al ruido presente en el
circuito y a la alta ganancia del lazo de corriente = 100.
11.3.6. Amplicador de potencia
Como amplicador de potencia se utiliza un modulador por ancho de pulso
(PWM). Este amplicador consta de un circuito que genera una se nal trian-
gular cuyo voltaje V
t
vara entre 0[V] y 12.5[V] (parte superior de la gura
11.3). La frecuencia de esta se nal determina la frecuencia base del PWM y
se selecciono de 1.53[KHz]. Como se explica en la seccion 11.5, este valor de
frecuencia satisface los requerimientos de dise no. La se nal triangular se com-
para (LM339, en la gura 11.3) con la se nal de (i

i) entregada por el lazo


de corriente para generar la se nal modulada por ancho de pulso, la cual se
aplica a la base de un transistor NPN TIP141 que se encarga de conectar y
desconectar un voltaje de potencia de V
s
=12.5[V] (vease la gura 11.3). Este
amplicador de potencia se modela como una ganancia de valor dado como:
A
p
=
V
s
voltaje pico a pico de V
t
=
12.5
12.5
= 1 (11.24)
11.4. Identicacion experimental de los parametros del
modelo
11.4.1. Resistencia del electroiman, R
Se aplica sucesivamente un conjunto de voltajes de CD en las terminales del
eletroiman y se mide la corriente electrica resultante. Estas parejas de valores
se gracan en la gura 11.4 con el smbolo + y se les ajusta una linea recta.
La pendiente de esta linea recta corresponde al valor de la resistencia R. As,
se encuentra que R = 2.72[Ohm].
11.4.2. Inductancia del eletroiman, L(y)
Se coloca la esfera en diferentes posiciones, y, medidas desde la parte infe-
rior del electroiman hasta la parte superior de la esfera. Para cada una de estas
posiciones se mide, usando un puente RLC, la inductancia en las terminales
del electroiman, L(y). Dado que la frecuencia de operacion del electroiman
588 11 Levitacion magnetica
i A [ ]
u
V [ ]
Figura 11.4. Medicion experimental de R.
sera de 1.53[KHz], debido a la frecuencia del amplicador de potencia tipo
PWM, estas mediciones de inductancia fueron realizadas usando una frecuen-
cia de 1[KHz] en el puente RLC. Esta es la frecuencia mas cercana a 1.53[KHz]
que permite seleccionar el puente RLC utilizado. En la gura 11.5 se mues-
tran gracados con el smbolo + los datos experimentales encontrados. A
continuacion se proponen diferentes conjuntos de valores para los parametros
k
0
, k, a y con cada uno de ellos se calcula la funcion L(y) dada en (11.2)
para los valores de y utilizados en el experimento. En la gura 11.5 se mues-
tran con lnea continua los valores de L(y) que mejor se ajustaron a los datos
experimentales. Los parametros utilizados para conseguir este ajuste son:
k
0
= 36.3 10
3
[H], k = 3.5 10
3
[H], a = 5.2 10
3
[m] (11.25)
11.4.3. Ganancia del sensor de posicion, A
s
Se coloca la esfera a diferentes distancias, y, respecto de la supercie infe-
rior del electroiman. Para cada una de estas posiciones se mide el voltaje y
v
de la gura 11.3. En la gura 11.6 se gracan con el smbolo + los datos
experimentales obtenidos. A estos puntos se les ajusta una lnea recta que
resulta tener una pendiente de 100[V/m]. Esto signica que la ganancia del
sensor es:
11.4 Identicacion experimental de los parametros del modelo 589
y m [ ]
L(y)
H [ ]
Figura 11.5. Identicacion experimental de los parametros k, k0 y a que denen a
L(y) en (11.2).
A
s
=
y
v
y
=
z
2v
z
2
= 100[V/m] (11.26)
Notese que la ganancia del sensor tambien relaciona a z
2v
y z
2
si se selecciona
y

v
= 100x

2
(recuerdese que y = x
2
y que x

2
= y
d
). Se puede apreciar que
el comportamiento lineal del sensor ocurre para valores mayores a y = 0.005
[m].
11.4.4. Masa de la esfera, m
Usando una balanza digital se encontro que m = 0.018[Kg].
590 11 Levitacion magnetica
y m [ ]
y
v
V [ ]
Figura 11.6. Identicacion experimental de As.
11.5. Dise no del controlador
Primero se debe calcular el punto de operacion deseado. Esto se consigue
proponiendo el valor deseado de posicion x

2
= y
d
= 0.01[m] y usando (11.16),
(11.17), (11.18) para encontrar x

1
= 2.1174[A], x

3
= 0[m/s], i

o
= 2.1749[A].
Por otro lado, el amplicador operacional marcado con T1 realiza la ope-
racion i

= v + i

o
, donde v es la se nal entregada por el controlador. Este
amplicador operacional introduce una ganancia adicional de valor A
d
= 4.7,
la cual debe considerarse como una ganancia en cascada con el controlador.
Usando los valores numericos mostrados en la seccion 11.4, en (11.24), as co-
mo = 100, se puede hacer uso de las expresiones en (11.20) para encontrar
que la funcion de transferencia en (11.22) esta dada como:
Z
2
(s)
V (s)
=
24710
s
3
+ 2739s
2
1250s 3.536 10
6
(11.27)
Defnase la siguiente variable:
(s) =
1
A
d
V (s) (11.28)
Entonces usando (11.27), (11.28) y A
d
= 4.7 se puede escribir:
Z
2
(s)
(s)
=
24710 4.7
s
3
+ 2739s
2
1250s 3.536 10
6
(11.29)
11.5 Dise no del controlador 591
Los polos correspondientes estan ubicados en:
s
1
= 35.9, s
2
= 2739.4, s
3
= 35.9 (11.30)
lo cual implica que el sistema de levitacion magnetica es inestable en lazo
abierto, tal como se haba pronosticado al principio del presente captulo. Por
esta razon, el principal proposito de dise nar un controlador consiste en con-
seguir que el sistema de control completo sea estable en lazo cerrado. El polo
en s
2
= 2739.4 corresponde a la parte electrica del sistema de levitacion
magnetica y es muy grande comparado con los otros dos polos (correspon-
dientes a la parte mecanica) debido a que se esta usando un lazo de corriente
de alta ganancia ( = 100). Sin embargo, con el n de seleccionar la frecuencia
correcta para el amplicador de potencia por modulacion de ancho de pulso se
debe obtener el polo correspondiente a la dinamica electrica antes de aplicar
el lazo de corriente. Regresando a (11.1) y usando = L(y)i, se encuentra:
L(y)
di
dt
= u R i
L(y)
y
y i
Dado que se trata de una ecuacion diferencial de primer orden en la variable i,
a partir de esta expresion se concluye que la constante de tiempo de la dinami-
ca electrica en lazo abierto (en el punto de operacion) esta dada por
L(x

2
)
R
.
Por tanto, el polo de lazo abierto (antes de aplicar el lazo de corriente) de la
dinamica electrica esta en s =
R
L(x

2
)
= 72.5384. Esto signica que el ancho
de banda de la planta a controlar es 72.5384[rad/s] ya que los otros dos polos,
correspondientes a la parte mecanica, son mas cercanos al origen en el plano
s. Es importante asegurar que la planta solo respondera al valor medio de la
se nal modulada por ancho de pulso entregada por el amplicador de poten-
cia. Esto se consigue si la frecuencia del amplicador de potencia 1.53[KHz],
cuando se expresa en radianes por segundo, es muy grande comparada con
72.5384[rad/s] lo cual es cierto porque:
72.5384[rad/s] 1.53 10
3
2 = 9613[rad/s]
Finalmente, una caracterstica importante de la funcion de transferencia en
(11.29) es que tiene ganancia negativa. Esto se debe a que incrementos en la
variable de entrada producen decrementos en la variable de salida y viceversa,
como se explica a continuacion. Si la corriente ordenada i

aumenta, es decir
si v = i

o
crece, entonces aumenta la fuerza del electroiman sobre la esfera
por lo que esta sube y su posicion z
2
= x
2
x

2
disminuye.
En la gura 11.7(a) se muestra el diagrama de bloques propuesto del sis-
tema de control completo. Notese que se esta utilizando realimentacion po-
sitiva de la salida. La razon por la que se propone este diagrama de bloques
sera comprendida conforme se realice el analisis que sigue a continuacion.
Notese que se pueden combinar (11.23) y (11.29) para obtener:
Z
2v
(s)
(s)
=
24710 4.7A
s
s
3
+ 2739s
2
1250s 3.536 10
6
592 11 Levitacion magnetica

+
G
c
(s)
+
+
y
Sensor
optico
Controlador
del sumador
Amp:
potencia
Electroiman
Esfera
=
Ad
v
A
d
A
p
A
s
Ganancia
y

v
z
2v
= y
v
y

v
u
y
v

i
1
Ad
i

(a)
G
c
(s)
Controlador
G(s)
Sistema de
levitacion
s ( ) =
A
d
V s ( )
Z
2v
s ( ) = Y
v
s ( ) Y

v
s ( )
(b)
G
c
(s)
Controlador
Sistema de
(s)

+ 0
Z
2v
s ( ) = Y
v
s ( ) Y

v
s ( )
Z
2v
s ( )
levitacion
G s ( )
(c)
Figura 11.7. Diagramas de bloques equivalentes del sistema de control.
donde Z
2v
(s) es la transformada de Laplace de z
2v
. Finalmente, usando A
s
=
100 dado en (11.26) se encuentra:
Z
2v
(s)
(s)
= G(s) (11.31)
G(s) =
11613700
s
3
+ 2739s
2
1250s 3.536 10
6
Usando esta funcion de transferencia, el diagrama de bloques de la gura
11.7(a) puede representarse como en la gura 11.7(b) el cual, a su vez, pue-
de representarse como en la gura 11.7(c). Este ultimo diagrama de bloques
es importante porque tiene la forma de un sistema en lazo cerrado con rea-
limentacion negativa para el cual existen muchas herramientas de analisis y
dise no de controladores como el lugar de las races y las tecnicas de respuesta
11.5 Dise no del controlador 593
en frecuencia. Notese que este diagrama implica que se esta usando una re-
ferencia deseada de valor cero para la variable de salida z
2v
. Aunque parezca
extra no, esto tiene una razon muy importante: si z
2v
= 0 entonces, de acuerdo
a (11.23), z
2
= x
2
x

2
= 0, lo que implica que x
2
= x

2
, es decir, que la esfera
alcanza la posicion deseada. Notese tambien que para obtener el diagrama de
bloques de la gura 11.7(c) es fundamental utilizar realimentacion positiva
as como la estructura del diagrama de bloques que se muestra en la gura
11.7(a), lo que justica su uso. Otra manera de explicar el uso de dicha rea-
limentacion positiva es la necesidad de compensar la ganancia negativa que
tiene la funcion de transferencia del sistema de levitacion magnetica
Z2v(s)
(s)
dada en (11.31).
La funcion de transferencia de lazo abierto en la gura 11.7(c) es:
G
c
(s)G(s) (11.32)
con G(s) dada en (11.31) y G
c
(s) =
(s)
Z2v(s)
es la funcion de transferencia del
controlador que se dise nara.
11.5.1. Un controlador proporcional
Supongase primero que se usara un controlador proporcional, es decir que
G
c
(s) = k
p
donde k
p
es una constante positiva. La funcion de transferencia
de lazo abierto es:
k
p
11613700
s
3
+ 2739s
2
1250s 3.536 10
6
(11.33)
mientras que la funcion de transferencia de lazo cerrado esta dada como:
k
p
11613700
s
3
+2739s
2
1250s3.53610
6
1 +
11613700 kp
s
3
+2739s
2
1250s3.53610
6
=
11613700 k
p
s
3
+ 2739s
2
1250s 3.536 10
6
+ 11613700 k
p
(11.34)
Notese que sin importar el valor que tome k
p
no se puede afectar el signo
del termino 1250s en el denominador de esta funcion de transferencia. Esto
implica que siempre hay al menos un coeciente del polinomio caracterstico de
dicha funcion de transferencia que tiene signo contrario a los otros coecientes
lo cual, de acuerdo a la seccion 4.2 signica que hay al menos un polo de lazo
cerrado en el semiplano complejo derecho, es decir, el sistema en lazo cerrado
es inestable.
En un caso como este es necesario un controlador que contribuya con
un cero a la funcion de lazo abierto. Esto sugiere el uso de un controlador
proporcional-derivativo (PD). Sin embargo, es importante subrayar lo siguien-
te. De acuerdo a (11.17) y (11.18), el valor de i

o
es utilizado para compensar
594 11 Levitacion magnetica
de manera exacta el efecto de la gravedad y as conseguir que el error en estado
estacionario sea cero, es decir que y = y
d
cuando el tiempo sea sucientemente
grande. Por tanto, cualquier incertidumbre en los valores de mg, de
L(x

2
)
x2
o
de la ganancia A
d
resultara en un error de estado estacionario diferente de
cero. Una manera eciente de resolver este problema es usando un controlador
que incluya una accion integral sobre el error de posicion. Por esta razon, a
continuacion se dise na un controlador PID.
11.5.2. Un controlador proporcional-integral-derivativo (PID)
El controlador propuesto tiene la siguiente forma:
G
c
(s) = k
d
_
s
2
+
kp
k
d
s +
ki
k
d
s
_
(11.35)
En la seccion 5.2.7 se ha encontrado el lugar de las races correspondiente a la
funcion de transferencia de lazo abierto G
c
(s)G(s) con G(s) dada en (11.31)
y G
c
(s) dada en (11.35) cuando se elige:
k
p
k
d
= 31.24,
k
i
k
d
=
31.24
0.8
(11.36)
De acuerdo a lo encontrado en la seccion 5.2.7, todos los polos de lazo cerrado
tienen parte real negativa para valores de k
d
que satisfacen k
d
> 0.01. En la
tabla 11.1 se muestran los valores seleccionados de k
d
y las correspondientes
ganancias del controlador PID obtenidas usando (11.36).
El controlador PID se construye usando el amplicador operacional colo-
cado entre los puntos A y B de la gura 11.3. De acuerdo a la seccion 8.2, las
ganancias de este controlador estan dadas como:

p
=
R
2
R
1
+
C
1
C
2
,
d
= R
2
C
1
,
i
=
1
R
1
C
2
(11.37)
Por otro lado, en la seccion 11.3.3 se indico que las dos resistencias de
10[KOhm] conectadas al punto V
P1
introducen una ganancia igual a 1/2. Co-
mo esta ganancia debe ser considerada como parte del controlador en (11.35)
se concluye que:
k
p
=

p
2
, k
d
=

d
2
, k
i
=

i
2
(11.38)
Usando (11.37) y (11.38) se calculan los valores de R
1
, R
2
, C
1
y C
2
mos-
trados en la tabla 11.1. En esa misma tabla se muestran los valores que se
usaron experimentalmente para estos elementos de circuito. Estos valores se
consiguieron combinando resistencias y capacitores de los siguientes valores
comerciales: 330[KOhm] y 330[KOhm] (en paralelo), 22[KOhm] y 47[KOhm]
(en serie), 47[KOhm] y 33[KOhm] (en serie), 470[KOhm] y 330[KOhm] (en
serie), varios capacitores de 0.1[F] en paralelo, un capacitor de 1[F] y dos
capacitores de 1[F] en serie.
11.6 Resultados experimentales 595
Tabla 11.1. Valores numericos probados experimentalmente.
k
d
Ganancias PID Valores calculados Valores experimentales
0.0396
k
d
= 0.0396
kp = 1.2371
ki = 1.5464
R1 = 323.34[K]
R2 = 766.59[K]
C1 = 0.10331[F]
C2 = 1[F]
R1 = 330[K]
R2 = 800[K]
C1 = 0.1[F]
C2 = 1[F]
0.0792
k
d
= 0.0792
kp = 2.4742
ki = 3.0928
R1 = 161.67[K]
R2 = 766.59[K]
C1 = 0.20663[F]
C2 = 1[F]
R1 = 165[K]
R2 = 800[K]
C1 = 0.2[F]
C2 = 1[F]
0.1188
k
d
= 0.1188
kp = 3.7113
ki = 4.6391
R1 = 107.78[K]
R2 = 766.59[K]
C1 = 0.30994[F]
C2 = 1[F]
R1 = 100[K]
R2 = 800[K]
C1 = 0.3[F]
C2 = 1[F]
0.1584
k
d
= 0.1584
kp = 4.9484
ki = 6.1855
R1 = 80.834[K]
R2 = 766.59[K]
C1 = 0.41326[F]
C2 = 1[F]
R1 = 80[K]
R2 = 800[K]
C1 = 0.4[F]
C2 = 1[F]
0.1980
k
d
= 0.1980
kp = 6.1855
ki = 7.7319
R1 = 64.667[K]
R2 = 766.59[K]
C1 = 0.51657[F]
C2 = 1[F]
R1 = 69[K]
R2 = 800[K]
C1 = 0.5[F]
C2 = 1[F]
11.6. Resultados experimentales
En la gura 11.8 se muestran los resultados obtenidos experimentalmente
cuando se usan las ganancias correspondientes a k
d
= 0.0792. El experimento
realizado consiste en hacer levitar la esfera y una vez que alcanza el reposo se
le aplica un peque no golpe hacia arriba a manera de perturbacion. Notese que
como respuesta a esta perturbacion la variable z
2v
= y
v
y

v
disminuye ini-
cialmente, lo que signica que la esfera se mueve hacia arriba para despues de
algunas oscilaciones regresar a su posicion inicial. Notese tambien que cuando
la esfera se mueve hacia arriba la corriente ordenada i

disminuye ya que es
esta accion la que permite a la esfera regresar hacia abajo. Tambien se puede
observar en la gura 11.8 que
1
2
z
2v
es igual a cero en estado estacionario, es
decir que y = y
d
. Esto signica que, en efecto, la parte integral del controlador
cumple su funcion. Por otro lado, la corriente electrica medida en estado esta-
cionario a traves del electroiman es de 1.7[A]. Comparese con x

1
=2.1174[A]
calculada al principio de la seccion 11.5.
Es conveniente advertir que las variables z
2v
e i

mostradas en la gura
11.8 fueron obtenidas mediante el ltrado de las se nales medidas debido a que
estas contenan cantidades importantes de ruido. Notese que a pesar de este
hecho el sistema construido consigue su objetivo principal: usar un controlador
para hacer estable en lazo cerrado a una planta que en lazo abierto es inestable.
596 11 Levitacion magnetica
Es conveniente aclarar que el objetivo principal del sistema de levitacion
magnetica construido es conseguir hacer levitar la esfera de una manera esta-
ble. Aunque el conseguir experimentalmente las caractersticas de respuesta
transitoria y de estado estacionario dise nadas es un aspecto importante de un
controlador, sin embargo, no es el aspecto que se quiere resaltar en el proto-
tipo construido. Recuerdese que se trata de una planta altamente no lineal a
la cual se le ha dise nado un controlador a partir de una aproximacion lineal
que es valida en una region de trabajo reducida cuyos lmites no estan de-
nidos explcitamente. Es por esto que las ganancias del controlador PID se
han seleccionado solo para asegurar estabilidad pero no se ha hecho nada por
dise nar caractersticas de respuesta transitoria especcas.
Una muestra de como las no linealidades del sistema afectan la respues-
ta del sistema de control completo es presentada a continacion. En la tabla
11.2 se presentan los polos de lazo cerrado conseguidos con cada uno de los
valores de k
d
mostrados en la tabla 11.1. Notese que en todos los casos, todos
los polos de lazo cerrado tienen parte real negativa. A pesar de esto, en la
tabla 11.2 se muestra que para algunos valores de k
d
se observo inestabili-
dad de manera experimental. Esto signica que la esfera no pudo permanecer
levitando cuando se probaron las ganancias correspondientes en el prototipo
construido. De manera mas especca, se encontro que para valores grandes de
las ganancias PID la esfera empieza a oscilar rapidamente hasta caer al suelo.
Estos resultados experimentales sugieren que no deben utilizarse ganancias
PID muy grandes a pesar de que el analisis teorico asegure estabilidad.
Otro aspecto interesante se observa cuando se vara el valor de y
d
. Utilizan-
do las ganancias correspondientes a k
d
= 0.0792 y partiendo de y
d
= 0.01[m],
se redujo y
d
poco a poco, es decir la esfera se acerco mas y mas al electroiman.
Conforme esto sucede la esfera empieza a vibrar y llega un momento en que
la esfera permanece levitando pero no en un valor constante de y sino descri-
biendo un movimiento oscilatorio claramente apreciable como se muestra en
la gura 11.9. Si disminuye y
d
a un mas, entonces la oscilacion es muy rapida y
de amplitud muy grande de modo que escapa y cae al suelo. Esto sugiere que
se espera que haya menos problemas para hacer levitar la esfera si la posicion
deseada que se propone y
d
es mayor, es decir si se ordena que la esfera levite
mas alejada del iman. Esta conjetura es a un mas respaldada por el hecho de
que al usar k
d
= 0.1584 (que produce inestabilidad experimentalmente para
y
d
= 0.01[m]) se consigue estabilidad, es decir que la esfera levita, cuando se
usa un valor de y
d
mayor de que 0.01[m]. Sin embargo, esto tambien tiene un
lmite ya que la fuerza del electroiman disminuye al alejarse la esfera.
Finalmente, en la gura 11.10 se muestra una fotografa del sistema de
levitacion magnetica funcionando donde se alcanza a apreciar el electroiman
y el sistema optico usado para la medicion de la posicion de la esfera.
11.6 Resultados experimentales 597
Tabla 11.2. Polos de lazo cerrado para los valores de k
d
usados cuando y
d
= 0.01[m].
k
d
Polos de
lazo cerrado
Comportamiento
experimental
0.0396
2562.0
149.4
26.2
1.8
estabilidad
0.0792
2353.6
355.8
28.4
1.5
estabilidad
0.1188
2088.3
620.6
29.0
1.4
estabilidad
0.1584
1635.3
1073.5
29.3
1.4
inestabilidad
0.1980
1354.3 + j617.1
1354.3 j617.1
29.4
1.4
inestabilidad
Figura 11.8. Resultados experimentales con el sistema de levitacion magnetica
cuando y
d
= 0.01[m]. Trazo superior:
1
2
z2v. Trazo inferior: i

, corriente ordenada.
598 11 Levitacion magnetica
Figura 11.9. Resultados experimentales con el sistema de levitacion magnetica
cuando se usa un valor deseado de posicion menor que 0.01[m]. Trazo superior:
1
2
z2v. Trazo inferior: i

, corriente ordenada.
Figura 11.10. El sistema de levitacion magnetica funcionando.
11.8 Preguntas de repaso 599
11.7. Resumen del captulo
En este captulo se ha construido un sistema de control de levitacion
magnetica usando exclusivamente electronica analogica. El controlador uti-
lizado es un PID y se ha construido usando amplicadores operacionales de
acuerdo a lo expuesto en la seccion 8.2 del captulo 8. Como el sistema es no
lineal por naturaleza, es necesario obtener un modelo lineal aproximado que
solo sera util de manera local, es decir, el sistema de control funcionara correc-
tamente solo si el cuerpo a levitar se coloca inicialmente cerca de donde se
desea que permanezca. Para encontrar esta aproximacion lineal, es de mucha
utilidad el modelado usando las variables de estado visto en el captulo 7. Una
vez que se cuenta con un modelo lineal, se procede a dise nar el controlador
PID. Esto requiere del conocimiento de los valores numericos de los parametros
del modelo lineal del sistema de levitacion. Por esta razon, tambien se explica
de manera detallada como identicar estos parametros experimentalmente.
Dado que la planta es inestable y no lineal, este es un problema cuya puesta
a apunto en la practica es un tanto compleja. Esto signica que se debe poner
mucha atencion en considerar todas las ganancias introducidas por cada uno
de los elementos del circuito de control cuando se haga el modelado y el dise no
del controlador. Errores en este aspecto frecuentemente resultan en un mal
funcionamiento del sistema de control.
Es muy importante resaltar que la construccion del prototipo que se ha
presentado no requiere de sensores sosticados y que tampoco es necesaria
una inversion economica importante.
11.8. Preguntas de repaso
1. Por que es recomendable usar un n ucleo con forma de E para el elec-
troiman? Por que no usar un simple n ucleo recto?
2. Con el n de simplicar el problema, en algunos trabajos existentes sobre
el tema se supone que la inductancia del electroiman es constante Cree
que esto sea correcto?
3. En un sistema de levitacion magnetica el uso de un lazo de corriente tiene
ventajas importantes en el funcionamiento del sistema de control Cuales
son estas ventajas?
4. Cual es la ventaja de usar un controlador PID en lugar de un controlador
PD en este problema?
5. Que problemas cree que puedan aparecer si se usan capacitores polariza-
dos en el circuito de control?
6. Que debe hacer si desea incrementar la ganancia del amplicador de
potencia basado en modulacion por ancho de pulso?
7. Que debe hacer para incrementar la frecuencia del modulador por ancho
de pulso?
8. Para que sirve el diodo que se coloca en paralelo con el electroiman?
600 11 Levitacion magnetica
9. Que es el punto de operacion en un sistema de levitacion magnetica y
que lo determina?
10. A que atribuye que el modelo en (11.31) tenga ganancia negativa? Y por
que el polinomio en el denominador tiene algunos coecientes con signo
negativo?
Referencias
1. J.D. Kraus, Electromagnetics, McGraw-Hill, Singapore, 1992.
2. Autores varios, Special issue on magnetic bearing control, IEEE Transactions on
Control Systems Technology, Vol.4, No. 5, 1996.
3. M.Y. Chen, C.F. Tsai, H.H. Huang, and L.C. Fu, Integrated design for a planar
MagLev for micro positioning, in Proc. American Control Conference, pp. 3066-
3071, Portland, 2005.
4. J. Levine, J. Lottin, J.C. Ponsart, A nonlinear approach to the control of mag-
netic bearings, IEEE Transactions on Control Systems Technology, vol. 4, no.
5, pp. 524-544, 1996.
5. M.G. Feemster, Y. Fang and D. Dawson, Disturbance rejection for a magnetic
levitation system, IEEE Transactions on Mechatronics, vol. 11, no. 6, pp. 709-
717, 2006.
6. J.-C. Shen H

control and sliding mode control of magnetic levitation system,


Asian Journal of Control, vol. 4, no. 3, pp. 333-340, 2002.
7. R. Ortega, A. van der Schaft, I. Mareels and B. Maschke, Putting energy back
in control, IEEE Control Systems Magazine, pp. 18-33, April 2001.
8. R. Ortega, A. Lora, P. J. Nicklasson and H. Sira-Ramrez, Passivity-based con-
trol of Euler-Lagrange Systems, Springer, London, 1998.
9. M.S. de Queiroz, and D. Dawson, Nonlinear control of active magnetic bearings:
a backstepping approach, IEEE Transactions on Control Systems Technology,
vol. 4, no. 5, pp. 545-552, 1996.
10. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
11. W. Hurley, M. Hynes and W. Wole, PWM Control of a magnetic suspension
system, IEEE Transactions on Education, vol. 47, no. 2, pp. 165-173, 2004.
12. W. Hurley, W. Wole, Electromagnetic design of a magnetic suspension system,
IEEE Transactions on Education, vol. 40, no. 2, pp. 124-130, 1997.
12
Control de un sistema Ball and Beam
baln
varilla
x
R
r

mg
F = mgsen
Figura 12.1. Sistema ball and beam.
El sistema ball and beam es un prototipo didactico muy popular en siste-
mas de control. Si se considera el modelo completo del mecanismo se encuentra
que es no lineal y que es difcil de controlar debido al efecto centrfugo que
sufre el baln como resultado del giro de la varilla. Sin embargo, este fenome-
no es importante solo cuando la velocidad de la varilla es muy grande. Si se
supone que la varilla y el baln se mueven a bajas velocidades y si la varilla
solo describe angulos cercanos a la horizontal entonces el modelo es lineal y
resulta ser un buen banco de pruebas para las tecnicas de control clasico.
604 12 Control de un sistema Ball and Beam
Objetivos del captulo
Construir la totalidad de las partes que componen a un sistema ball and
beam y, en particular, el sensor de la posici on del baln.
Usar un microcontrolador y una computadora personal para construir un
controlador multilazo que emplea un compensador de adelanto.
Aplicar los conceptos de control cl asico a una planta que es inestable por
naturaleza.
Identicar de manera experimental los par ametros del mecanismo.
Considere la situacion representada en la gura 12.1. Se trata de una
varilla que cuenta con un canal dentro del cual rueda un baln. La inclinacion
de la varilla puede ser modicada usando un motor de corriente directa y
esta inclinacion genera el movimiento del baln por efecto de la gravedad.
El objetivo de control en este mecanismo es conseguir que el baln alcance
el reposo en una posicion especicada de antemano a lo largo de la varilla.
Este mecanismo es conocido en la literatura en ingles bajo el termino ball
and beam y es un prototipo muy utilizado para probar experimentalmente
diversos controladores dise nados usando tecnicas clasicas y avanzadas [1], [2].
Como se muestra en este captulo, este mecanismo es inestable y los metodos
clasicos de dise no introducen el uso de un lazo interno de control. Estas son
las razones por las que se desea presentar el problema de control de este
mecanismo en el presente captulo
La nomenclatura utilizada es la siguiente:
u es el voltaje aplicado en las terminales de armadura del motor.
x es la posicion del baln medida desde el extremo izquierdo de la varilla.
es la inclinacion de la varilla respecto de la horizontal.
m es la masa del baln.
R y r representan, respectivamente, el radio del baln (esferico) y el radio
de giro del baln sobre los bordes del canal.
i es la corriente electrica de armadura.
L es la inductancia de armadura.
R
a
es la resistencia de armadura.
k
e
es la constante de fuerza contraeletromotriz.
k
m
es la constante de par.
J
m
es la inercia del rotor del motor.
b
m
es la constante de friccion viscosa del motor.
J
L
es la inercia de la varilla.
b
L
es la constante de friccion viscosa de la varilla.
n
1
y n
2
representan el n umero de dientes del engrane del eje del motor y
del eje de la varilla, respectivamente, y n =
n2
n1
.
12.1 Modelo matematico 605
12.1. Modelo matematico
El modelo matematico que interesa es aquel que indica como se ve afectada
la posicion del baln, a lo largo de la varilla, bajo el efecto de un voltaje
aplicado en las terminales de armadura del motor.
Es importante observar que conforme el baln se desplaza sobre la varilla
el peso del primero ejerce un par de giro sobre la varilla el cual depende de
la posicion del baln sobre la varilla. Por otro lado, un fenomeno interesante
que puede ocurrir si la varilla se mueve rapidamente es el siguiente. Suponga
que el baln trata de escapar, es decir x aumenta, y se cambia rapidamente
la inclinacion de la varilla con el n de hacerlo regresar. Sin embargo, debido
al efecto de la fuerza centrfuga el baln continuara escapando en lugar de
regresar.
Con el n de que no aparezcan los efectos descritos en el parrafo anterior
se supondra que:
El par ejercido por el peso del baln sobre la varilla es despreciable, lo cual
es muy cercano a la realidad si el motor act ua sobre la varilla a traves de
una caja de engranes con tasa de reduccion elevada.
La varilla se movera con velocidades

peque nas y la inclinacion solo
tomara valores peque nos alrededor de cero.
Modelo del motor electrico y la varilla
El motor de CD y la varilla se pueden modelar como se hizo en la seccion
9.1 considerando que la carga esta representada por la varilla, es decir:
L
di
dt
= u R
a
i n k
e

(12.1)
J

= b

+n k
m
i (12.2)
J = n
2
J
m
+J
L
, b = n
2
b
m
+b
L
Procediendo como en las secciones 9.1, 9.2 y 9.3 se puede usar el lazo de
corriente:
u
i
= K(i

i)
as como el amplicador de potencia:
u = A
p
u
i
para encontrar que el modelo del motor de CD y la varilla esta dado como:
(s) =
k
s(s +a)
I

(s) (12.3)
a =
b
J
, k =
nk
m
J
donde se ha supuesto que no esta presente ninguna perturbacion externa, es
decir T
p
= 0.
606 12 Control de un sistema Ball and Beam
Modelo del movimiento del baln
Considere la situacion mostrada en la gura 12.1. Se supone que cualquier
desplazamiento x del baln es producido por la inclinacion de la varilla. El
modelo matematico buscado se obtiene usando la Segunda Ley de Newton
para describir el movimiento traslacional del baln, el cual tiene dos compo-
nentes: 1) el movimiento traslacional de una partcula de masa m y 2) el
movimiento giratorio sobre su propio eje de una esfera de masa m.
baln
bordes del canal

!~
v~
r~
x
Figura 12.2. Estudio del movimiento giratorio del baln.
Supongase primero que el baln esta jo en el espacio y que es el canal el
que se mueve de modo que, por efecto de la friccion, hace que el baln gire (sin
cambiar su posicion en el espacio). En la gura 12.2 se muestra tal situacion
(suponiendo que x = 0). Notese que r = R debido a la separacion entre los
bordes del canal.
Si es la velocidad angular con que gira el baln y v es la velocidad con
que se desliza el canal hacia la izquierda, entonces:
r = v (12.4)
donde representa el producto cruz de dos vectores y las echas sobre las
letras indican que las variables son vectores. Aprovechando que la velocidad
angular y el radio son perpendiculares, se puede escribir la expresion anterior
en terminos de los modulos de los vectores involucrados como:
r = v (12.5)
=
v
r
(12.6)
12.1 Modelo matematico 607
Sea f la fuerza que ejerce el canal sobre el baln y que hace que este gire. Notese
que dicha fuerza se aplica a una distancia r del centro del baln. Entonces rf es
el par que ejerce el canal sobre el baln. Aplicando la Segunda Ley de Newton
a esta situacion se encuentra:
J
b
= fr (12.7)
f =
2
5
m v
R
2
r
2
(12.8)
donde se ha usado (12.6) y J
b
=
2
5
mR
2
es la inercia de una esfera solida de
masa m y radio R que gira sobre su propio eje (baln) [3], [4], pag. 271.
Ahora considerese la situacion real: el canal permanece en reposo y es el
baln el que rueda con lo que su posicion x ahora cambia y la velocidad y la
aceleracion del baln estan dadas como (se supone que el baln rueda sobre los
bordes del canal sin patinar):
x = v, x = v (12.9)
Entonces, f es la fuerza equivalente que el movimiento giratorio del baln
ejerce sobre s mismo y que contribuye al desplazamiento del baln a lo largo
del canal. Con este antecedente, se puede aplicar la Segunda Ley de Newton
al movimiento traslacional del baln considerando que, ademas del efecto de
la gravedad, existe una fuerza f que el giro del baln ejerce sobre s mismo
(vease la gura 12.1):
m x = f +mg sin (12.10)
Usando (12.8), (12.9) se tiene:
m x =
2
5
m x
R
2
r
2
+mg sin (12.11)
_
1 +
2
5
R
2
r
2
_
x = g sin (12.12)
Notese que la fuerza f, debida a la inercia del giro del baln, representa una
fuerza de oposicion al movimiento traslacional de baln: de acuerdo a la Pri-
mera Ley de Newton la inercia representa la oposicion que un cuerpo presenta
hacia cambios en su situacion actual de movimiento. Con el n de representar
correctamente la oposicion de f a la traslacion del baln, f (que incluye un
signo negativo) debe aparecer sumando (y no restando) en (12.10).
Como se ha dicho previamente, se considera que siempre es muy peque na
( 0) por lo que se puede escribir:
sin (12.13)
Es importante mencionar que esta aproximacion require que el angulo
este dado en radianes [4], pag. 942. Entonces (12.12) se convierte en:
608 12 Control de un sistema Ball and Beam
_
1 +
2
5
R
2
r
2
_
x = g (12.14)
o, usando la transformada de Laplace con condiciones iniciales cero:
X(s)
(s)
=

s
2
(12.15)
=
g
1 +
2
5
R
2
r
2
lo cual representa el modelo del movimiento del baln.
Finalmente, el modelo del sistema ball and beam esta dado por la combi-
nacion de (12.3) y (12.15), es decir:
X(s)
(s)
=

s
2
, (s) =
k
s(s +a)
I

(s) (12.16)
12.2. Construccion del prototipo
En esta parte se describe la manera en que ha sido construido el prototipo
usado. A continuacion se listan los componentes principales del sistema de
control.
Computadora personal de escritorio Pentium II a 233 MHz.
Tarjeta de adquisicion de datos PCL-812PG de Advantech [5]. Cuenta con
15 canales de entrada analogico-digital manejados por un solo convertidor
AD de aproximaciones sucesivas de 12 bits, con entrada analogica en el
rango de -5[V] a +5[V]. Dos canales de salida digital-analogico, cada uno
cuenta con un convertidor DA de 12 bits, con salida analogica en el rango
de 0[V] a +5[V].
Motor de CD con escobillas e iman permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Varilla del sistema ball and beam. Compuesta por: i) una varilla de madera
de seccion circular (riel n umero uno), ii) una varilla de aluminio de seccion
circular (riel n umero dos), iii) una lamina de madera que sirve de soporte
para las dos varillas anteriores.
Sensor de posicion para la inclinacion de la varilla. Potenciometro de pre-
cision de 5[KOhm], una vuelta, sin tope.
Sistema de medicion de la posicion del baln. Se describe a continuacion.
En la gura 12.3 se presenta el diagrama de bloques del sistema de control
completo.
12.2 Construccion del prototipo 609
PCL 812 PG
CP
SISTEMADE
MEDICIN
DE
SISTEMADE
MEDICIN
DE x

INTERFACES
YMECANISMO
BALLAND BEAM
Figura 12.3. El bloque interfaces y mecanismo ball and beam se muestra en la
gura 12.7. El sistema de medicion de se muestra en la gura 12.6. El sistema de
medicion de x se muestra en la gura 12.4.
12.2.1. Medicion de la posicion x del baln
Una parte importante e interesante del prototipo es el sistema de medicion
de la posicion del baln. De hecho, generalmente esta es la parte que mayores
dicultades presenta a la hora de construir el sistema de control. La manera
mas com un de hacer esta medicion es utilizando una resistencia que se en-
cuentra distribuida a lo largo de uno de los rieles que conforman el canal de la
varilla. El otro riel es un conductor cuya resistencia puede considerarse igual
a cero. As, conforme el baln (hecho de material conductor de la electricidad)
rueda haciendo contacto electrico con ambos rieles, el segundo conductor tiene
un voltaje que es igual al voltaje que tiene el primer riel justo en el punto don-
de el baln hace contacto con el. De esta manera, los rieles forman en conjunto
un potenciometro y el baln constituye el contacto movil del mismo.
Debido a que el material necesario para distribuir la resistencia a lo lar-
go del primer riel puede ser difcil de conseguir en ocasiones, en esta obra
se construye un sistema de medicion diferente, el cual puede ser construido
facilmente y sus componentes son faciles de conseguir.
El riel que se denominara como n umero uno esta constituido por una varilla
de madera de seccion circular de aproximadamente 0.01[m] de diametro y
0.65[m] de longitud. Sobre esta varilla de madera se devana cuidadosamente
alambre magneto de manera que las espiras queden ajustadas, una junto a
la otra, sin dejar espacio entre ellas y, a la vez, sin que una se encime a la
otra. De este modo se consigue construir una bobina cilndrica de 0.65[m] de
longitud y 0.01[m] de diametro cuya supercie externa es sucientemente lisa
como para permitir que el baln ruede sobre ella suavemente. La razon de usar
una varilla de madera para construir este riel es evitar la posibilidad de que
las espiras queden en corto circuito si el barniz del alambre magneto llegara
a da narse.
El riel n umero dos es una varilla cilndrica de aluminio de 0.65[m] de
longitud y 0.01[m] de diametro. Ambos rieles se colocan uno frente al otro,
paralelos y a una distancia de 0.017[m], entre los puntos mas cercanos de los
rieles, sobre un soporte de madera (vease la gura 12.4). As, se forma un
610 12 Control de un sistema Ball and Beam
b
a
l

n
s
o
p
o
r
t
e

d
e

m
a
d
e
r
a
r
i
e
l

n

m
e
r
o

d
o
s
r
i
e
l

n

m
e
r
o

u
n
o
0
:
6
5
m
[
]
0
:
0
1
7
m
[
]
- +
1
0
k

1
0
k

1
0
k

2
5
k

1
0
k

4
:
7
V
Z
e
n
e
r
s
1
n
F
1
n
F
1
k

6
:
8
k

3
:
3
k

F
1
N
4
0
0
2
+
1
5
V

1
5
V
T
I
P
4
1
T
I
P
4
2
T
L
0
8
1
c
a
n
a
l
x
x
v
Figura 12.4. Sistema de medicion de x.
12.2 Construccion del prototipo 611
canal de 0.65[m] de longitud y 0.017[m] de ancho. Los extremos de este canal
se obstruyen utilizando material suave como la espuma utilizada para empacar
equipo delicado para evitar que el baln escape. Este conjunto constituye la
varilla del mecanismo ball and beam.
El baln se selecciona de manera que sus dimensiones le permitan rodar
dentro del canal haciendo contacto con ambos rieles y, al mismo tiempo, que
el mismo canal evite que el baln lo abandone. Este aspecto es importante,
sobre todo en la etapa en la que se hacen los primeros ajustes experimentales
pues la varilla suele presentar movimientos bruscos que pueden hacer que el
baln salte y abandone el canal. Finalmente, se identica la zona donde el
baln hace contacto con el riel n umero uno y se raspa esa estrecha franja de
la bobina de este riel a lo largo toda la longitud. Esto permitira el contacto
electrico, atraves del baln y conforme este rueda, entre ambos rieles. El baln
utilizado tiene las siguientes dimensiones (vease la gura 12.5):
2R = 0.0238[m], 2z = 0.01895[m], r = 0.0072[m] (12.17)
riel nmero dos riel nmero uno
baln
0:0238 m [ ]
r
z
R
0:01895 m [ ]
Figura 12.5. El baln rodando entre los dos rieles.
Los extremos de la bobina del riel n umero uno se conectan a una fuente
de voltaje alterno (vease la seccion 8.3.1) con forma de onda seno de 10[V]
de pico y de 16[KHz]. El uso de una frecuencia elevada ayuda a limitar la
corriente que demanda la bobina y, al mismo tiempo, reduce el voltaje de rizo
que se produce en el proceso que se describe a continuacion. El riel n umero
dos se conecta a un circuito recticador de media onda que a su vez alimenta
612 12 Control de un sistema Ball and Beam
a un circuito RC en paralelo que sirve de ltro para reducir el voltaje de rizo
del voltaje de CD que se obtiene. As, conforme el baln rueda en el canal,
la magnitud de este voltaje de CD, x
v
, es representativa de la posicion x del
baln a lo largo del canal.
Finalmente, se usa una caja de engranes para unir el motor de CD con
la varilla con el n de aumentar el par aplicado sobre esta. De acuerdo a lo
expuesto la seccion 12.3, no es necesario conocer la tasa de reduccion de la
caja de engranes.
12.2.2. Medicion de la inclinacion de la varilla
El angulo de inclinacion de la varilla se mide utilizando un potenciome-
tro. Para esto, la terminal movil del potenciometro se conecta mecanicamente
a la varilla mediante dos brazos de aluminio (vease la gura 12.6). As, cual-
quier desplazamiento angular de la varilla produce un desplazamiento angular
de la terminal movil del potenciometro y, por tanto, un voltaje,
v
, que es re-
presentativo de la inclinacion de la varilla.
baln motor de CD
terminal
mvil
varilla
brazos
potencimetro
BASE
+ 5V

Figura 12.6. Sistema de medicion de .


12.2.3. Interfaces y amplicador de potencia
Como puede verse en (12.16) la se nal de control es la orden de corriente
i

, la cual se restringe por software a que tome valores en el rango de -3[A] y


+3[A]. Notese que esta caracterstica y el uso de una PC junto con la tarjeta
de adquisicion de datos PCL-812PG hacen que la interfaz de salida que se
utilizara para el sistema ball and beam sea identica a la que se dise na en la
seccion 10.8. Por razones similares, la interfaz de entrada que se utilizara con
12.2 Construccion del prototipo 613
el sistema ball and beam es igual a la dise nada en la seccion 10.8. Finalmente,
el amplicador de potencia y el lazo de corriente que se utilizan (vease la
gura 12.7
1
) son muy parecidos a los dise nados en las secciones 9.6.2 y 9.6.1,
respectivamente.
T
L
0
8
1
A
c
o
n
d
i
c
i
o
n
a
m
i
e
n
t
o

d
e

s
e

a
l
P
C
L
8
1
2

P
G
T
L
0
8
1
+
+
T
L
0
8
1
+
T
L
0
8
1
+
QQ
5
:
6
k
6
:
7
2
k
3
:
3
k
5
:
5
k
3
3
k
3
3
k
1
M
1
k
3
:
3
k
5
V
1
5
V

1
5
V
5
W
1

T
I
P
1
4
5
T
I
P
1
4
1
M
O
T
O
R
A
m
p
l
i
f
i
c
a
d
o
r

d
e

p
o
t
e
n
c
i
a
c
o
n
t
r
o
l

d
e

c
o
r
r
i
e
n
t
eR
e
a
l
i
m
e
n
t
a
c
i

n

d
e

c
o
r
r
i
e
n
t
e
0
;
5
[
]
V

3
;
3
[
]
A
u
i
u
R
e
a
l
i
m
e
n
t
a
c
i

n

p
a
r
a

r
e
d
u
c
i
r
z
o
n
a

m
u
e
r
t
a

d
e

t
r
a
n
s
i
s
t
o
r
e
s
S
I
S
T
E
M
A
B
A
L
L
A
N
D
B
E
A
M
x
i
Figura 12.7. Bloque de interfaces y mecanismo ball and beam.
1
Todos los amplicadores operacionales usados en la gura 12.7 son TL081. Los
tres primeros tienen la terminal + conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal + conectada a ui.
614 12 Control de un sistema Ball and Beam
12.3. Identicacion
12.3.1. Sistema de medicion de la inclinacion de la varilla
Se encontro que cuando la varilla se coloca en posicion perfectamente ho-
rizontal ( = 0[rad]) el potenciometro entrega 1.45[V] y cuando la varilla se
inclina 10 grados ( = 0.174[rad]) el potenciometro entrega 1.7[V]. Se veri-
co que el sistema de medicion es lineal, es decir, que entrega incrementos de
voltaje que son proporcionales a los incrementos de angulo . Por tanto, la
ganancia del sistema de medicion esta dada como:
A

=

v

=
(1.7 1.45)[V]
0.174[rad]
= 1.43[V/rad] (12.18)
donde
v
es la se nal de voltaje entregada por el sistema de medicion.
12.3.2. Sistema de medicion de la posicion x del baln
Cuando el baln se coloca en el extremo izquierdo del canal (x = 0[m]) el
sistema de medicion entrega 0.03[V] y cuando el baln se coloca en el extremo
derecho del canal (x = 0.65[m]) el sistema de medicion entrega 3.7[V]. Se
verico que el sistema de medicion es lineal, es decir, que entrega incrementos
de voltaje que son proporcionales a los incrementos de la posicion del baln x.
Por tanto, la ganancia del sistema de medicion esta dada como:
A
x
=
x
v
x
=
(3.7 0.03)[V]
0.65[m]
= 5.64[V/m] (12.19)
donde x
v
es la se nal de voltaje entregada por el sistema de medicion.
Por otro lado, la identicacion experimental de los parametros que apare-
cen en el modelo (12.16) puede realizarse estudiando la dinamica del motor
y la varilla (12.3) y la dinamica del baln (12.15) por separado. Los procedi-
mientos utilizados se describen a continuacion.
12.3.3. Subsistema motor-varilla
El procedimiento utilizado en esta parte en similar al utilizado en la seccion
10.1. Se utiliza el siguiente control proporcional de posicion:
I

(s) = k
p
A

(
d
(s) (s)) (12.20)
donde se usa A

porque
v
(s) = A

(s) representa la variable que entrega el


sistema de medicion de la inclinacion de la varilla y es la variable que realmente
maneja la computadora utilizada como controlador en el experimento. Esto
signica que el sistema en lazo cerrado (12.3), (12.20) queda representado
como en la gura 12.8. La funcion de transferencia correspondiente es:
12.3 Identicacion 615

v
(s)

vd
s
=
A

k
p
k
s
2
+as +A

k
p
k
=

2
n
s
2
+ 2
n
s +
2
n
(12.21)

n
=
_
A

k
p
k, a = 2
n
(12.22)
donde
vd
(s) = A

d
(s) es la inclinacion deseada en terminos del voltaje
k
p

d
s ( )
A

d
s ( )

s ( )
s s+a ( )
k
A

s ( ) I

s ( )
Figura 12.8. Control proporcional de la posicion de la varilla.
entregado por el sistema de medicion de la inclinacion de la varilla. En la gura
12.9 se presentan los resultados experimentales obtenidos cuando k
p
= 4.
Este experimento se realiza sin colocar el baln sobre los rieles. Midiendo
directamente en la gura 12.9 se encuentra que t
r
= 0.18[s] y M
p
( %) = 60.8.
Estos datos se utilizan en las expresiones:
=

_
ln
2
_
Mp( %)
100
_
ln
2
_
Mp( %)
100
_
+
2
(12.23)

d
=
1
t
r
_
atan
_
_
1
2

__
(12.24)

n
=

d
_
1
2
(12.25)
para obtener = 0.15 y
n
= 9.71[rad/s]. Finalmente, utilizando las expre-
siones en (12.22) con k
p
= 4 se encuentra:
k = 16.5134, a = 3.04 (12.26)
12.3.4. Dinamica del baln
Aplicando la transformada inversa de Laplace a (12.15) y considerando
todas las condiciones iniciales iguales a cero se obtiene:
x = (t) (12.27)
Suponga que (t) =
0
donde
0
es una constante. Integrando dos veces
(12.27):
616 12 Control de un sistema Ball and Beam

vd
i

V [ ]
A [ ]
tiempo s [ ]

M
p
(%) = 60:8
t
r
= 0:18
Figura 12.9. Resultados experimentales usando kp = 4 y el diagrama de bloques
de la gura 12.8.
x(t) =
1
2

0
t
2
(12.28)
A continuacion se presenta un procedimiento que permite estimar de manera
experimental el valor del parametro .
Fije rmemente la varilla de manera que su inclinacion dena un angulo
de valor =
0
, donde
0
es un valor positivo peque no. Un buen valor es

0
= 0.174[rad] (el equivalente a 10 grados) porque sin(0.174) = 0.173, es
decir sin(
0
)
0
.
Coloque el baln en el extremo superior de la varilla (x = 0) y dejelo rodar
libremente hasta alcanzar el extremo inferior de la varilla (la varilla no
debe moverse durante este paso). Mida la posicion que describe el baln
conforme rueda entre los extremos de la varilla. Esta tarea es facilitada si
se utiliza una PC.
Graque contra el tiempo la posicion del baln obtenida en el paso anterior.
Usando el valor de
0
utilizado en el primer paso del experimento, proponga
un valor arbitrario de para gracar la funcion
1
2

0
t
2
sobre los mismos
ejes utilizados en el paso anterior.
Proponga diferentes valores de . El valor correcto de es aquel que per-
mite que la graca de los datos experimentales y la graca de la funcion
12.4 Dise no del controlador 617
1
2

0
t
2
coincidan durante todo el tiempo en el que se realizo el experi-
mento.
En la gura 12.10 se muestran las gracas mencionadas en el procedimiento
anterior. Se utiliza
0
= 0.174[rad] y se encuentra que:
= 5 (12.29)
Es importante tener el cuidado de que el valor experimental de x que se gra-
ca este expresado en unidades de longitud (metros). Esto puede conseguirse
usando x = x
v
/A
x
. Finalmente, es interesante mencionar que la validez de
este valor numerico se ha vericado mediante el uso de (12.15), (12.17) y
g = 9.81[m/s
2
], pues se obtiene un valor igual a 4.687 para .
x
experimental ( )
2
1

0
t
2
tiempo s [ ]
m [ ]
Figura 12.10. Identicacion experimental del parametro .
12.4. Dise no del controlador
Notese que el modelo de la planta (12.16) tiene tres polos en s = 0 por
lo que es inestable en lazo abierto. As, un objetivo importante del dise no
del sistema de control en lazo cerrado es conseguir su estabilidad. En la -
gura 12.11(a) se presenta un diagrama de bloques del sistema de control que
se dise na. Este diagrama de bloques se puede representar como en la gura
618 12 Control de un sistema Ball and Beam
12.11(b). El lector puede revisar lo expuesto en la seccion 6.8.2 para entender
por que se usa este diagrama de bloques. En este problema de dise no se debe
conseguir que lm
t
x(t) = x
d
donde x
d
es una constante que representa la
posicion que se desea alcance el baln sobre el canal.
+
+ +

A
x
A

s ( )

s ( )
s s+a ( )
k

s+c
s+b
s
2

s ( )
k

s
E s ( )
V
1
s ( )
X
d
(s) X(s)
A
x
X
vd
(s)
X
v
(s)
(a)
+
+ +

A
x
A

s ( )

s ( )
s s+a ( )
k

s+c
s+b
s
2

s ( )
k

s
E s ( )
V
1
s ( )
X
d
(s) X(s)
(b)
Figura 12.11. Diagramas de bloques equivalentes del sistema de control a dise nar.
Notese que la funcion de transferencia de lazo abierto del sistema mos-
trado en la gura 12.11(b) tiene dos polos en s = 0 por lo que es de tipo 2.
Entonces, como x
d
es constante, se asegura que lm
t
x(t) = x
d
si la funcion
de transferencia de lazo cerrado X(s)/X
d
(s) es estable (veanse las secciones
3.8 y 4.4). Por tanto, el unico problema que resta es encontrar los valores
de las constantes , k
v
, , b y c de manera que la funcion de transferencia
X(s)/X
d
(s) sea estable. A continuacion se explica como se consigue esto.
La funcion de transferencia de lazo abierto del sistema mostrado en la
gura 12.11(b) esta dada como:
G(s)H(s) =
A
x
b
cA

s +b
b
c
s +c
kA

s
2
+ (a +k
v
kA

)s +kA

1
s
2
(12.30)
donde c > b > 0. En la gura 12.12 se muestran las gracas de Bode de
G(s)H(s) y de cada una de las funciones de transferencia que la forman.
Notese que si la constante kA

es sucientemente grande, es decir si kA


s
2
+ (a +k
v
kA

)s, entonces:
kA

s
2
+ (a +k
v
kA

)s +kA

1 (12.31)
12.4 Dise no del controlador 619
0
fase
grados [ ]
90
!
iii)
ii)
!
i)
0
dB
ii)
iii)
iv)
1
180
270
360
v)
vi)
b
c
b
c
+ 90
v)
iv)
vi)
kA

p
kA

p
Figura 12.12. Gracas de Bode de G(s)H(s) en (12.30).
Esto tambien puede interpretarse pensando que la funcion de transferencia
en (12.31) tiene una magnitud de 0[dB] y una fase de 0 grados. Es interesante
observar que esta situacion tambien se puede apreciar en la gura 12.12: cuan-
do kA

es sucientemente grande, es decir cuando la frecuencia de corte de la


funcion de transferencia en (12.31) esta colocada muy a la derecha, este factor
de segundo orden no tiene ning un efecto sobre la respuesta en frecuencia en
lazo abierto y, entonces, puede ser despreciado.
Por tanto, si kA

es grande el problema se reduce a conseguir estabilidad


en lazo cerrado de un sistema cuya funcion de transferencia de lazo abierto
esta dada como:
A
x
b
cA

s +b
b
c
s +c
1
s
2
(12.32)
Esta es una simplicacion importante porque se elimina el atraso de fase
debido a la funcion de transferencia en (12.31), el cual puede tomar valores
entre 0 y 180 grados (en el caso de que dicha funcion de transferencia no fuera
cercana a la unidad). Esto signica que estabilizar a (12.32) requiere menos
adelanto de fase que el requerido para estabilizar a (12.30). Debe tenerse
presente que introducir mayor adelanto de fase hace mas exigente la tarea de
620 12 Control de un sistema Ball and Beam
dise nar el controlador porque normalmente requiere de un compensador
s+b
s+c
que es mas sensible al ruido introducido por los sensores de posicion.
Notese que se puede conseguir un valor grande de kA

aumentando el
valor de pues los valores de k y A

son jos una vez que se ha construido


el prototipo. Sin embargo, un valor grande de kA

tiene el efecto de de-


teriorar el desempe no del sistema de control. De hecho, durante las pruebas
experimentales que se realizaron para poner a punto el prototipo se utilizaron
valores grandes de kA

y se observo que se incrementa el efecto nocivo del


ruido introducido por los sensores: el mecanismo vibra exageradamente y el
sistema de control no funciona adecuadamente. Por tanto, el valor de queda
limitado por el maximo valor permitido por el prototipo experimental a un
cuando no se consiga cumplir la condicion (12.31).
Por otro lado, si k
v
= 0 entonces el sistema en (12.31) estara mal amor-
tiguado porque = a/(2

kA

) sera peque no. Esto produce un pico de


resonancia en la graca de Bode de (12.30). El problema del pico de resonan-
cia es que incrementa el efecto de las altas frecuencias produciendo vibraciones
no deseadas en el mecanismo. Una solucion que ha dado buenos resultados en
el prototipo construido es el uso de un valor k
v
> 0 porque esto aumenta el
factor de amortiguamiento = (a+k
v
kA

)/(2

kA

) del sistema en (12.31)


y, por tanto, se reduce el pico de resonancia en la graca de Bode de (12.30).
En base a estos razonamientos y despues de varias pruebas experimentales
se encontro que los siguientes valores producen resultados satisfactorios:
= 4, k
v
= 0.2 (12.33)
Notese que el sistema de la gura 12.11(b), junto con los valores numericos
en (12.18), (12.19), (12.26), (12.29), (12.33) conforman un problema identico
al resuelto en la seccion 6.8.2 donde se encontro que la solucion esta dada por
el siguiente compensador:
G
c
(s) =
s +b
s +c
, b = 1.84, c = 13.2, = 2.6
12.5. Construccion del controlador
De acuerdo a la gura 12.11(a), el controlador que se debe construir
esta dado como:
i

= [v
1

v
] k
v

v
(12.34)
donde
v
y

v
representan la se nal entregada por el sensor de inclinacion
de la varilla y su derivada, respectivamente. Por otro lado, V
1
(s) = L{v
1
}
esta denida como:
V
1
(s) =
s +b
s +c
E(s)
E(s) = X
vd
(s) X
v
(s) (12.35)
12.6 Resultados experimentales 621
donde X
v
(s) y X
vd
(s) son las transformadas de Laplace de la posicion del baln
medida x
v
(obtenida a la salida del sistema de medicion correspondiente) y
de su valor deseado x
vd
, respectivamente. Procediendo como en las secciones
10.2.2 y 10.5 se encuentra que la funcion del tiempo v
1
se puede calcular en
tiempo discreto como:
v
1
(k) = [e(k) +v(k)]
v(k + 1) = [cv(k) + (b c)e(k)]t +v(k)
donde e(k) y v
1
(k) son los valores actuales en tiempo discreto de las funciones
L{e} = E(s) y L{v
1
} = V
1
(s) denidas en (12.35) (es decir e(k) = x
vd
(k)
x
v
(k)) y t = 0.005[s] es el periodo de muestreo. As, se puede calcular
iterativamente el valor v(k +1) que representa el valor de v que sera utilizado
en el proximo instante de muestreo. Esto se hace partiendo del valor inicial
v(0) = 0. Notese que v(k + 1) se calcula en el instante de muestreo presente
pero solo sera utilizado hasta el instante de muestreo proximo inmediato en
el futuro.
Finalmente, la se nal

v
se calcula a partir de la medicion de
v
del siguiente
modo:

v


v
(k)
v
(k 1)
t
(12.36)
El controlador se programa en Borland C++ y se utiliza una computadora
personal y una tarjeta adquisitora de datos PCL-812PG de Advantech. Al
nal de la seccion 12.6 se presenta el codigo utilizado. Se debe subrayar que
el experimento debe empezar colocando la varilla en una inclinacion tal que
= 0, con el n de que el programa de computadora reconozca el valor
(diferente de cero) entregado por el sistema de medicion de cuando = 0.
12.6. Resultados experimentales
En la gura 12.13 se presentan los resultados experimentales obtenidos.
Se utiliza una posicion deseada x
vd
= 1[V] que corresponde a x
d
= 0.177[m].
Es importante mencionar que con el n de obtener mejores desempe nos se
ajustaron un poco las ganancias del compensador:
G
c
(s) =
s +b
s +c
(12.37)
de modo que b = 2.5, c = 17.7 y = 0.854. Durante estos ajustes se mantuvo
constante el factor = 0.14 dise nado en la seccion 6.8.2 de manera que b/c =
2.5/17.7 = 1.84/13.2 = 0.14. Al usar b = 2.5 en lugar del valor 1.84 se consigue
reducir un poco el efecto del ruido, el cual ha mostrado ser importante en el
prototipo construido y puede ser apreciado en la gura 12.13. Dicho sea de
paso, mucho del ruido presente es debido al voltaje de rizo en el sistema de
622 12 Control de un sistema Ball and Beam
medicion de x y al contacto intermitente del baln, mientras rueda, con las
espiras del sensor correspondiente (notese que en la gura 12.13(a) el ruido
disminuye cuando el baln se detiene). Por otro lado, el valor de = 0.854
utilizado es tres veces menor que el valor de 2.6 dise nado. Esto se hizo porque
se encontro que un valor grande de produce vibraciones del mecanismo
(efecto del ruido). En la gura 12.14 se muestran las gracas de Bode de
la funcion de transferencia de lazo abierto en (12.30) cuando se usa b = 2.5,
c = 17.7 y = 0.854. El margen de fase obtenido es de alrededor de 20 grados,
es decir aproximadamente el mismo margen de fase dise nado originalmente.
Este peque no margen de fase explica el gran sobre paso observado en la gura
12.13.
Finalmente, un aspecto que vale la pena mencionar es el efecto de las co-
nexiones a tierra y de las interferencias electromagneticas que ellas producen,
pues fueron varios los problemas observados (mediciones difciles de entender)
por causa de este aspecto. Se recurrio a bibliografa especializada en este tema
[6] y se corrigieron las conexiones a tierra en base a las sugerencias ah expues-
tas. De este modo se eliminaron los problemas observados. La razon por la
cual los efectos de las tierras e interferencias electromagneticas se presentaron
en este prototipo y no en los otros prototipos que se exponen en esta obra es
la longitud de los conductores utilizados para conectar el sistema de medicion
de x. Sin embargo, no fue necesario reducir dicha longitud, simplemente se
eliminaron lazos de tierras que eran innecesarios.
En la gura 12.15 se presentan los resultados obtenidos en simulacion del
diagrama de bloques en 12.11(a) cuando se usan los valores numericos en
(12.18), (12.19), (12.26), (12.29), (12.33), b = 2.5, c = 17.7 y = 0.854.
Notese el parecido existente entre los resultados de las guras 12.13 y 12.15 a
pesar de la presencia importante de ruido tanto en la posicion medida x
v
como
en la se nal de control i

. Finalmente, se concluye que el sistema de control


cumple con su proposito: estabilizar la posicion del baln x
v
en un valor muy
cercano al valor deseado x
vd
= 1[V]. Finalmente, en la gura 12.16 se muestra
una fotografa del prototipo de sistema ball and beam construido cuando esta
funcionando.
12.6 Resultados experimentales 623
x
v
V [ ]

v
V [ ]
tiempo s [ ]
(a)
tiempo s [ ]
i

A [ ]
(b)
Figura 12.13. Resultados experimentales obtenidos en el sistema ball and beam
construido.
624 12 Control de un sistema Ball and Beam
Bode Diagram
Frequency (rad/sec)
100
80
60
40
20
0
20
System: ghctrl
Frequency (rad/sec): 1.72
Magnitude (dB): 0.0122
M
a
g
n
i
t
u
d
e

(
d
B
)
10
0
10
1
10
2
360
315
270
225
180
135
System: ghctrl
Frequency (rad/sec): 1.72
Phase (deg): 159
P
h
a
s
e

(
d
e
g
)
Figura 12.14. Gracas de Bode de G(s)H(s) en (12.30) cuando se usa b = 2.5,
c = 17.7 y = 0.854.
12.6 Resultados experimentales 625

v
V [ ]
V [ ]
x
v
tiempo s [ ]
(a)
tiempo s [ ]
i

A [ ]
(b)
Figura 12.15. Resultados en simulacion obtenidos con el modelo teorico del sistema
ball and beam construido.
626 12 Control de un sistema Ball and Beam
Figura 12.16. El prototipo ball and beam construido, funcionando.
12.6 Resultados experimentales 627
Codigo usado para programar el algoritmo de control
#include <stdio.h>
#include <conio.h>
#include <math.h>
#include<stdlib.h>
#include <string.h>
#include <iostream.h>
#include <dos.h>
int alto,bajo,dato,salida,i;
volatile float Ts=0.005;
//Periodo de muestreo
volatile float ir,v,dv,nv,e;
volatile float x,theta,theta0,thetam1;
/*------------------------------------------------------*/
volatile float r_des=0.09,Kp=3.0,Kv=0.2,xd=1.0;
volatile float c=17.663,b=2.50989,gama=0.854;
volatile long double y0;
/*-Direccion base y periodo de muestreo para la tarjeta-*/
int base=0x210;
int lsb1=0x00;
int msb1=0x01;
int lsb2=0x00;
int msb2=0x01;
volatile float yy[3000]; //seal de salida
volatile float uu[3000]; //seal de control
volatile float ref[3000];//seal de referencia
FILE *fp;
char Direccion[30];
void Inicializa(void);
void EscribeArchivo(float datos1,float datos2,float datos3);
void Cierra(void);
void main()
{
628 12 Control de un sistema Ball and Beam
clrscr();
/*----Se programa la tarjeta adquisitora----*/
/*---Vease manual PCL 812-PG de Advantech------*/
outportb(base+11,1);
//converc. AD iniciada con reloj
// y transferencia dato por software
outportb(base+9,0);// ganancia 1
outportb(base+3,0x77);//Control del contador
outportb(base+1,lsb1);
outportb(base+1,msb1);
outportb(base+3,0xb7);
outportb(base+2,lsb2);
outportb(base+2,msb2);
i=1;
do
/*----Inicia ciclo de control----*/
{
outportb(base+10,14);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
theta=(10.0/4096.0)*dato-5.0; //theta por canal AD 14
outportb(base+10,15);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
x=(10.0/4096.0)*dato-5.0; //x por canal AD 15
if(i==1)
{ //condiciones iniciales
v=0.0;
theta0=theta;
thetam1=0.0;
}
theta=theta-theta0;
/* Control proporcional Varilla*/
// ir=Kp*(r_des-theta);//-Kv*(y-ym1)/Ts;
12.6 Resultados experimentales 629
/* Control con red de adelanto */
e=xd-x;
dv=( -c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=(gama*(e+v)-theta)*4.0-Kv*(theta-thetam1)/Ts;
/*-----Se mantiene a theta cercana a cero----*/
if( (theta>(0.5) )&&(ir>=0.0) )
{ ir=0.0; }
if( (theta<(-0.5) )&&(ir<=0.0) )
{ ir=0.0; }
ir=-ir;
//condicion de saturacion de seal de
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
yy[i]=x;
uu[i]=ir;
ref[i]=theta;
v=nv;
thetam1=theta;
i++;
delay(5);
if (i>3000) i=3000;
}while ( (!kbhit() ) && ( i<=3000 ) );
// while (i<=3000);
ir=0.0;
// detiene el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
630 12 Control de un sistema Ball and Beam
{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}
void Inicializa(void) {
strcpy(Direccion,"c:\\ballbeam\\datos4s8.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}
void EscribeArchivo(float datos1,float datos2,float datos3) {
fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}
void Cierra(void) {
fclose(fp);
}
12.7. Control basado en el microcontrolador
PIC16F877A
12.7.1. Construccion del sistema de control
En esta parte se utiliza un microcontrolador PIC16F877A [7] para con-
trolar al sistema ball and beam. Se debe aclarar que la parte mecanica del
prototipo tambien sufrio algunos cambios ligeros los cuales seran descritos en
lo que sigue. A continuacion se listan unicamente los componentes nuevos que
fueron introducidos.
Una computadora portatil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analogico DAC0800LCN.
Amplicadores operacionales TL081.
Manejador/Receptor MAX232.
En la gura 12.17 se muestra un diagrama de bloques del sistema de control
que se construyo. El sistema de medicion de x es identico al mostrado en la
gura 12.4. Sin embargo, la ganancia que se midio para este sensor (siguiendo
un procedimiento identico al descrito en la seccion 12.3.2) es:
A
x
= 5.3750[V/m] (12.38)
12.7 Control basado en el microcontrolador PIC16F877A 631
PIC16F877A
SISTEMADE
MEDICIN
DE
SISTEMADE
MEDICIN
DE x

INTERFACES
YMECANISMO
BALLAND BEAM
Figura 12.17. El bloque interfaces y mecanismo ball and beam se muestra en la
gura 12.18. El sistema de medicion de consta de un potenciometro que se ja
directamente a la echa del motor. El sistema de medicion de x se muestra en la
gura 12.4.
La peque na diferencia existente con respecto al valor de A
x
= 5.64[V/m]
mostrado en (12.19) se atribuye a un peque no ajuste en el potenciometro de
25[KOhm] que se encuentra en el circuito oscilador de la gura 12.4, ya que
dicho potenciometro afecta la amplitud de las se nal de corriente alterna que
se aplica al sistema de medicion de x. Por otro lado, el sistema de medicion
de con que ahora se cuenta es un poco diferente al mostrado en la gura
12.6 porque ahora el potenciometro esta colocado directamente sobre el eje de
giro de la varilla y ya no se usan los brazos mostrados en la gura 12.6 para
transmitir el movimiento de la varilla al potenciometro. Como consecuencia
de esto, el valor obtenido para la ganancia del sistema de medicion de es:
A

= 0.9167[V/rad] (12.39)
el cual es diferente a A

= 1.43[V/rad] obtenido en (12.18). Los valores:


k = 16.6035, a = 3.3132, = 5 (12.40)
fueron obtenidos usando procedimientos identicos a los descritos en las seccio-
nes 12.3.3 y 12.3.4. Notese que estos valores son casi identicos a los mostrados
en (12.26) y (12.29) porque estos componentes permanecieron sin cambio.
Finalmente, en la gura 12.18 se muestra el diagrama de electrico del sis-
tema de control basado en el microcontrolador PIC16F877A mientras que en
la seccion 12.7.4 se muestra el listado usado para programar dicho microcon-
trolador. Para una explicacion detallada de la gura 12.18 y el programa en
la seccion 12.7.4 se recomienda consultar las secciones 9.6 y 10.6 correspon-
dientes al control de velocidad y de posicion de un motor de CD. Se desea
subrayar que en este caso se usan dos canales del convertidor analogico/digital
con que cuenta el microcontrolador PIC16F877A: uno para medir la posicion
del baln y otro para medir la inclinacion de la varilla. Tambien se aclara que
la computadora portatil solo se usa para el gracado de las se nales medidas
y no participa en el calculo del algoritmo de control.
632 12 Control de un sistema Ball and Beam
Figura 12.18. Diagrama electrico del sistema de control del sistema ball and beam
basado en el microcontrolador PIC16F877A.
12.7 Control basado en el microcontrolador PIC16F877A 633
12.7.2. Dise no del controlador
Se propone utilizar un esquema de control identico al presentado en la
seccion 12.4, por lo que el diagrama de bloques del sistema de control en lazo
cerrado es identico al mostrado en la gura 12.11. Los valores de ganancias:
= 12, k
v
= 0.2 (12.41)
fueron seleccionadas experimentalmente de modo que usando un valor cons-
tante de v
1
(t) (vease la gura 12.11), es decir sin realimentar el error de
posicion del baln y sin usar la red de adelanto colocada antes de V
1
(s), se
obtuviera una respuesta de que fuera rapida y con poca oscilacion. Notese
que el valor de = 12 mostrado en (12.41) es diferente de = 4 obtenido
en (12.33). Esto se debe a un mayor efecto de la friccion sobre la echa del
motor en el prototipo remodelado, es decir en el usado en esta seccion, lo
cual resulta en una mayor zona muerta que es compensada usando un valor
mayor de la ganancia proporcional . Usando los valores en (12.38), (12.39),
(12.40), (12.41) y la funcion de transferencia de lazo abierto en (12.30) se pro-
cede a usar el lugar de las races para determinar que el uso de las siguientes
ganancias asegura estabilidad en lazo cerrado:
= 1.2, c = 20, b = 2.5 (12.42)
En la seccion 5.2.8 se explica a detalle el procedimiento seguido para obtener
estas ganancias.
12.7.3. Resultados experimentales
La construccion, utilizando herramientas de software, del controlador di-
se nado en la seccion anterior se realiza como se explica en la seccion 12.5 y en
la seccion 12.7.4 se muestra el listado de como se consigue usando un micro-
controlador PIC16F877A [8]. Tambien se usa el diagrama electrico de la gura
12.18. En la gura 12.19 se muestran los resultados experimentales obtenidos
al usar dicho controlador, es decir, con las ganancias mostradas en (12.41) y
(12.42). Se puede observar que el baln alcanza el reposo en una posicion x
v
muy cercana a 1[V], la cual es muy cercana al valor deseado x
vd
= 1[V]. La
peque na diferencia que se puede apreciar es debida a la zona muerta produ-
cida por la friccion sobre la echa del motor. En la gura 12.20 se muestran
los resultados obtenidos en simulacion con el mismo controlador, el diagrama
de bloques en la gura 12.11 y los valores numericos mostrados en (12.38),
(12.39), (12.40), (12.41), (12.42). Notese el parecido entre las respuestas en
las guras 12.19 y 12.20 a pesar de la presencia importante de ruido en el
prototipo experimental. Finalmente, en la gura 12.21 se muestran otros re-
sultados experimentales en los que se aprecia como el sistema de control logra
estabilizar la posicion del baln x
v
muy cerca del valor deseado x
vd
= 1[V]
a pesar de que el baln es desviado varias veces de su posicion deseada por
634 12 Control de un sistema Ball and Beam
tiempo s [ ]
V [ ]
V [ ]
x
v

v
Figura 12.19. Resultados experimentales usando el microcontrolador PIC16F877A.
un agente externo (el baln es empujado intencionalmente con el dedo). Estos
resultados muestran que se ha conseguido satisfactoriamente el proposito del
sistema de control: estabilizar el baln muy cerca de su posicion deseada. Fi-
nalmente, en la gura 12.22 es muestra una fotografa del prototipo usado en
estos experimentos.
V [ ]
V [ ]
tiempo s [ ]

v
x
v
Figura 12.20. Resultados en simulacion.
12.7 Control basado en el microcontrolador PIC16F877A 635
x
v

v
tiempo s [ ]
V [ ]
V [ ]
Figura 12.21. Resultados experimentales usando el microcontrolador PIC16F877A.
Aparecen desviaciones producidas por un agente externo.
Figura 12.22. El sistema ball and beam construido.
12.7.4. Programa utilizado en el microcontrolador PIC16F877A
// Programa para comunicacion serial entre PC y proyecto Control
// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
636 12 Control de un sistema Ball and Beam
//#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>
#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#use delay(clock=20000000) //Base de tiempo para retardos
//(frecuencia del Xtal)
//Config.
//P. Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05
#byte PORTB = 0x06
#byte PORTC = 0x07
#byte PORTD = 0x08
#byte PORTE = 0x09
#byte ADCON0= 0x1F
#byte ADCON1= 0x9F
#bit PC0 = 0x07.0
#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;
int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;
int8 cont,iastd,cont2,cont3,cont4,t_0,t_1;
float x,xd,teta,error,iast,tiempo,c,b;
float gamma,alfa,kv,v,v1,tetam1; unsigned int u,i;
//int1 ban;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
12.7 Control basado en el microcontrolador PIC16F877A 637
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=0;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
xd=1.0;
tiempo=0.0;
gamma=1.2;
c=20.0;
b=2.5;
alfa=12.0;
kv=0.2;
tetam1=0.0;
v=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
ADCON0=0x81; //Cambiando a CH0
638 12 Control de un sistema Ball and Beam
for(i=0;i<37;i++); /estabilizar capacitor interno
t_0=read_adc(); //leer ADC
x=0.0196*t_0;
ADCON0=0x89; //cambiando a CH1
for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta=0.0196*t_1-2.81;//2.81;
error=xd-x;
/* Controlador */
v1=gamma*(error+v);
v=(-c*v+(b-c)*error)*0.002+v;
iast=alfa*(v1-teta)-kv*(teta-tetam1)/0.002;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
iast=3.3;
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
tetam1=teta;
cuentaH=t_1;
cuentaL=t_0;
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
/*
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
cuentaH=0x00;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimienopuerto serial
putc(cuentaH); //cuenta puerto serial
putc(cuentaL);
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //1 cuenta=(4/FXtal)*256 seg, 20=1 ms
{
}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main
12.8 Sistema de medicion mejorado 639
12.8. Un sistema de medicion mejorado para la
posicion del baln
Durante las pruebas experimentales presentadas en las secciones 12.6 y
12.7.3, se observo que el sistema de medicion mostrado en la gura 12.4 puede
llegar a producir vibraciones rapidas de la varilla por lo que el baln puede salir
despedido. Se llego a la conclusion de que este comportamiento es producido
por el uso de una se nal de corriente alterna de alta frecuencia como parte
fundamental del sistema de medicion mostrado en la gura 12.4.
En la gura 12.23 se muestra el diagrama electrico de un nuevo sistema
de medicion que elimina el problema arriba mencionado. Como se puede ob-
servar en esta gura, se contin ua utilizando el soporte de madera y los rieles
n umero uno (alambre magneto arrollado sobre un n ucleo cilndrico de made-
ra) y n umero dos (varilla cilndrica de aluminio) que ya se haban utilizado en
la gura 12.4. La modicacion consiste en que el riel n umero uno, el cual se
utilizaba como un inductor en la gura 12.4, ahora se utiliza como una simple
resistencia (resistencia del cobre) en la gura 12.23. Esto signica que los dos
rieles funcionan en conjunto como un simple potenciometro que en el punto
x
v
entrega un voltaje de CD que es proporcional a la posicion x del baln.
El valor de x
v
se mide utilizando uno de los convertidores analogico-digital
del microcontrolador PIC16F877A conectando la terminal etiquetada como
AN1 al pin n umero 3 de dicho microcontrolador. Es importante mencionar
que, previamente, x
v
se hace pasar a traves de un ltro pasa bajas con fre-
cuencia de corte de 14.6148 [Hz] (R = 33[KOhm], C = 0.33[F]). Ademas,
con el n de disminuir las posibles variaciones de x
v
debidas al calentamiento
del riel n umero uno, el voltaje presente en la terminal etiquetada como AN3
(que se conecta al pin 5 del microcontrolador) se utiliza como el voltaje de
referencia para el convertidor analogico-digital encargado de medir x
v
. Tam-
bien es importante decir que, previamente, la se nal entregada en AN3 se hace
pasar a traves de un ltro pasa bajas con frecuencia de corte de 4.8229 [Hz]
(R = 100[KOhm], C = 0.33[F]).
A continuacion se muestra el codigo utilizado para programar el micro-
controlador PIC16F877A a fn de realizar la tarea de leer la posicion x del
baln:
#device adc=10 //manejar adc de 10 bits
setup_adc(ADC_CLOCK_INTERNAL); //ADC (reloj interno)
setup_adc_ports(ANALOG_RA3_REF);//RA3(AN3)= referencia ADC
set_adc_channel(1);
conv=read_adc();
x=0.65*(conv-511)/1023; // posicion del balin en metros
La expresion x=0.65*(conv-511)/1023 se obtiene del siguiente modo. La
variable conv vara en el rango [0,2
10
-1]=[0,1023] porque el convertidor
analogico-digital esta programado para trabajar con 10 bits. Sin embargo, la
640 12 Control de un sistema Ball and Beam
Figura 12.23. Un sistema de medicion mejorado para la posicion del baln.
12.10 Preguntas de repaso 641
operacion conv-511 hace que (conv-511) tome valores en el rango [-511,512],
lo cual corresponde a valores de x en el rango de [-0.65/2,0.65/2][m] (en la
seccion 12.2.1 se especica que ambos rieles tienen una longitud de 0.65[m]).
Entonces se debe cumplir la siguiente regla:
511 0.65/2 [m]
(conv-511) x[m]
De aqu se obtiene la expresion x=0.65*(conv-511)/1023. Por otro lado, una
mejora adicional que tambien puede contribuir a reducir el problema citado
al principio de la presente seccion es el uso de un encoder, en lugar de un
potenciometro, para medir el angulo de inclinacion de la varilla . En la seccion
10.7 se indica como programar el microcontrolador PIC16F877A para leer un
encoder.
12.9. Resumen del captulo
En este captulo se ha construido un sistema ball and beam y todas las
interfases necesarias para su control en lazo cerrado. El esquema de control
utilizado cuenta con dos lazos. El lazo interno sirve para controlar (control
proporcional con realimentacion de velocidad) el angulo de inclinacion de la
varilla mientras que el lazo externo controla la posicion del baln (compensador
de adelanto). Un aspecto interesante del prototipo construido es el que se
reere al sensor de la posicion del baln. La idea es construir un canal formado
por dos rieles que, juntos, funcionan de manera similar a un potenciometro.
As, el voltaje entregado por los rieles es proporcional a la posicion del baln
sobre la varilla.
Se ha mostrado que el controlador puede ser dise nado utilizando las dos
tecnicas fundamentales del control clasico: la respuesta en el tiempo (el lugar
de las races) y la respuesta en frecuencia (criterio de de estabilidad de Nyquist
y margenes de fase y de ganancia). Desde el punto de vista de la practica en
la construccion de sistemas de control, se ha visto que el efecto del ruido
y las correctas conexiones a tierra son muy importantes en este prototipo.
Tambien se han presentado algunos metodos experimentales interesantes para
identicar los parametros del baln y del conjunto motor-varilla. Ademas, se
ha mostrado como deben ser tomadas en consideracion las ganancias debidas
a los sensores, aspecto que generalmente es evitado durante los cursos sobre
control automatico en las instituciones educativas.
12.10. Preguntas de repaso
1. Por que se dice que el sistema ball and beam es inestable en lazo abierto?
2. Como funciona el sistema de medicion de la posicion del baln?
642 12 Control de un sistema Ball and Beam
3. De una explicacion descriptiva (no analtica) de por que se necesita con-
trolar la inclinacion de la varilla ademas de la posicion del baln.
4. Por que la masa equivalente del baln depende de los radios R y r de
acuerdo a (12.12)? Que pasara si r = 0 y que signica esto?
5. Describa el procedimiento experimental descrito en la seccion 12.3.4 para
identicar el unico parametro de la dinamica del baln Que otro proce-
dimiento puede usar para esto?
6. El sistema de navegacion automatica de un barco es muy similar a un
sistema ball and beam, donde papel de la varilla es sustituido por un
timon. En base a esto intente resolver el problema de control automatico
de la direccion de un barco.
7. Describa el funcionamiento del amplicador de potencia utilizado
8. Por que se dice que un compensador de adelanto introduce menos ruido
que un controlador PD?
9. Por que cree que para controlar la inclinacion de la varilla sea preferible
el uso de un controlador proporcional con realimentacion de velocidad en
lugar de un controlador PD?
10. En los resultados experimentales obtenidos se alcanza a observar un pe-
que no error en estado estacionario. Sin embargo, el sistema de control es
tipo 2 y la posicion deseada del baln es constante por lo que el error en
estado estacionario debera ser igual a cero Como explica esto?
Referencias
1. Quanser Inc. 119 Spy Court Markham, Ontario L3R 5H6, Canada. Available
at: http://www.quanser.com
2. P.V. Kokotovic, The joy of feedback: nonlinear and adaptive (1991 Bode Prize
Lecture), IEEE Control Systems Magazine, pp. 7-17, June 1992.
3. Hibbeler R. C., 2004, Mecanica vectorial para ingenieros. Dinamica, (10a. edi-
cion), Pearson Educacion, Mexico.
4. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. PCL-812PG Users Manual, Advantech, Taiwan, 1996.
6. J. Balcells, F. Daura, R. Esparza y R. Pallas, Interferencias electromagneticas en
sistemas electronicos, Alfaomega-Marcombo, Serie Mundo Electronico, Mexico,
1992.
7. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
13
Control de un pendulo de Furuta
El pendulo de Furuta es otro prototipo didactico bien conocido en la litera-
tura de control automatico. En este mecanismo se deben controlar simultanea-
mente las posiciones de dos cuerpos, por lo que la solucion a este problema
de control es mas natural usando el enfoque de las variables de estado que el
de la funcion de transferencia. La aplicacion experimental de las tecnicas de
control moderno es la principal razon para incluir el problema de controlar
este mecanismo.
646 13 Control de un pendulo de Furuta
Objetivos del captulo
Construir un pendulo de Furuta.
Construir las interfaces necesarias para el funcionamiento del sistema de
control.
Usar un microcontrolador para construir un controlador por realimentaci on
del estado.
Aplicar los conceptos de control moderno a una planta que es inestable por
naturaleza.
Identicar de manera experimental los par ametros del mecanismo.
En este captulo se presenta el control de un sistema conocido como el
pendulo de Furuta. En la gura 13.1 se muestra un dibujo del pendulo de
Furuta. Este problema puede ser descrito de una manera muy ilustrativa ha-
ciendo referencia al bien conocido truco de mantener en equilibrio a una escoba
invertida colocada sobre la palma de la mano. En un pendulo de Furuta la
mano es sustituida por una varilla (conocida tecnicamente como brazo) que
en un extremo tiene colocado un motor electrico del cual recibe un par que
hace posible su movimiento. As, el brazo solo puede moverse sobre un plano
horizontal de modo que su extremo opuesto a donde se encuentra el motor
describe una circunferencia. En este extremo se coloca otra varilla (conocida
tecnicamente como pendulo) de la cual uno de sus extremos se une al extremo
libre del brazo mediante un rodamiento o alg un otro dispositivo mecanico que
permite el movimiento libre del pendulo respecto del brazo. Esto signica que
no existe ning un motor colocado en esta union mecanica. Sin embargo, el ro-
damiento ah colocado restringe el pendulo a movimientos giratorios sobre un
plano perpendicular al brazo. Esto signica que el extremo libre del pendulo
solo puede describir una circunferencia cuyo centro esta en el punto donde se
unen el brazo y el pendulo.
Una de las caractersticas que hacen interesante al pendulo de Furuta desde
el punto de vista de control es que es inherentemente inestable. Esto puede
verse facilmente recordando el problema de equilibrar la escoba: esta siempre
tiende a abandonar su posicion invertida para caer al suelo. Por tanto, la
sintonizacion del controlador requerido no es una tarea trivial y requiere de
un conocimiento adecuado de las tecnicas de la Teora de Control.
Las variables y parametros involucrados en el pendulo de Furuta de la
gura 13.1 son los siguientes:

0
es la posicion angular (en radianes) del brazo medida respecto a una
posicion de referencia arbitraria.

1
es la posicion angular (en radianes) del pendulo medida respecto a su
posicion vertical invertida.
es el par generado por el motor electrico y que es aplicado sobre el brazo.
I
0
es la inercia del brazo cuando gira alrededor de uno de sus extremos
mas la inercia del motor.
13.1 Modelo matematico 647

1
I0
; L
0

z
y
x

0
J
1
l 1
m
1
pndulo
brazo
motor
Figura 13.1. El pendulo de Furuta.
L
0
es la longitud del brazo.
m
1
, l
1
y J
1
representan, respectivamente, la masa, la ubicacion del centro
de masa y la inercia del pendulo. J
1
se calcula suponiendo que el pendulo
gira alrededor de su centro de masa. Notese que el pendulo esta constituido
por una varilla de masa no despreciable.
g = 9.81[m/s
2
] representa la aceleracion de la gravedad.
13.1. Modelo matematico
De acuerdo a lo descrito previamente, el pendulo de Furuta consta de dos
cuerpos que interact uan. El modelo matematico de este tipo de mecanismos
normalmente se encuentra usando las ecuaciones de Euler-Lagrange [1]. En el
caso del pendulo de Furuta las ecuaciones de Euler-Lagrange se reducen a:
d
dt
L

0
= (13.1)
d
dt
L

1
= 0
El cero en el lado derecho de la ultima expresion se reere a que no hay
ning un motor que aplique un par externo en el lugar donde se unen el brazo
y el pendulo. El lagrangiano L esta dado como:
648 13 Control de un pendulo de Furuta
L = K P (13.2)
K = K
0
+K
1
donde K
0
es la energa cinetica del brazo, K
1
es la energa cinetica del pendulo
y P es la energa potencial del pendulo. No se considera la energa potencial
del brazo porque, al moverse sobre un plano horizontal, su energa potencial
es constante y puede ser considerada igual a cero.
El calculo de la energa cinetica de un cuerpo cuya masa esta distribuida en
todo su volumen puede simplicarse si se descompone en dos partes: una parte
debida al movimiento traslacional de su centro de masa (considerado como una
partcula) y otra parte debida al movimiento giratorio del cuerpo suponiendo
que rota alrededor de su centro de masa. Sin embargo, si el movimiento del
cuerpo puede ser descrito de manera sencilla entonces no es necesaria esta
descomposicion. Por ejemplo, el movimiento del brazo es descrito facilmente
como el movimiento giratorio de una varilla alrededor de uno de sus extremos
y el giro del rotor del motor alrededor del mismo eje. Por tanto, no es difcil
encontrar que:
K
0
=
1
2
I
0

2
0
(13.3)
Por otro lado, el movimiento del pendulo es mas complejo pues depende de
los movimientos combinados del brazo y del pendulo. En este caso es mas
conveniente descomponer el movimiento del pendulo en dos partes como se
menciono anteriormente: El movimiento del pendulo se descompone en el mo-
vimiento traslacional de una partcula de masa m
1
colocada en su centro de
masa y el movimiento rotativo de una varilla que gira sobre un eje que pasa
por el centro de masa del pendulo. Por tanto:
K
1
=
1
2
J
1

2
1
+
1
2
m
1
v
T
1
v
1
(13.4)
donde v
1
es un vector que representa la velocidad traslacional del centro de
masa del pendulo, es decir:
v
1
=
_
_
dXx
dt
dXy
dt
dXz
dt
_
_
, X =
_
_
X
x
X
y
X
z
_
_
(13.5)
donde X
x
, X
y
y X
z
son las coordenadas cartesianas del centro de masa del
pendulo. Esto signica que X es el vector posicion del centro de masa del
pendulo. De acuerdo a las guras 13.2(a) y 13.2(b) se encuentra que:
X =
_
_
X
x
X
y
X
z
_
_
=
_
_
L
0
cos(
0
) l
1
sin(
1
) sin(
0
)
L
0
sin(
0
) +l
1
sin(
1
) cos(
0
)
l
1
cos(
1
)
_
_
(13.6)
13.1 Modelo matematico 649
centro de masa
pndulo
l
1 s
e
n

1
L
0
l
1
sen
1
cos
0
L
0
cos
0
L
0
cos
0
l
1
sen
1
sen
0
brazo
l
1
sen
1
sen
0

0
L
0
sen
0

y
x
X
x
X
y
(a) Vista superior.
pndulo
l
1
l
1
cos
1
l
1
sen
1

1
brazo
h centro
de masa
P = 0
X
z
(b) Vista del plano perpendicular al brazo.
Figura 13.2. Relaciones geometricas en el pendulo de Furuta.
650 13 Control de un pendulo de Furuta
Usando (13.4), (13.5), (13.6) y despues de reducir terminos se encuentra:
K
1
=
1
2
J
1

2
1
+
1
2
m
1
_
(L
0

0
)
2
+ (l
1

0
)
2
sin
2
(
1
) + (l
1

1
)
2
+ 2

1
L
0
l
1
cos(
1
)
_
(13.7)
Finalmente, para calcular la energa potencial del pendulo se usa como punto
de referencia (donde P = 0) al punto donde
1
= 0. Entonces, recordando
que la energa potencial es el producto escalar del vector fuerza aplicada, es
decir el peso del pendulo m
1
g, y el vector distancia que va desde el centro de
gravedad del pendulo hasta el punto donde P = 0, se tiene que:
P = hm
1
g, h = l
1
l
1
cos(
1
)
donde el signo se debe a que los vectores mencionados forman mas de
90

. Entonces:
P = m
1
gl
1
(cos(
1
) 1) (13.8)
Usando (13.3), (13.7), (13.8) se forma el Lagrangiano, L, de acuerdo a (13.2),
para despues sustituir en las ecuaciones de Euler-Lagrange dadas en (13.1).
Realizando las operaciones correspondientes y acomodando convenientemente
los terminos resultantes se obtiene:
M(q) q +C(q, q) q +g(q) = F (13.9)
M(q) =
_
I
0
+m
1
(L
2
0
+l
2
1
sin
2
(
1
)) m
1
l
1
L
0
cos(
1
)
m
1
l
1
L
0
cos(
1
) J
1
+m
1
l
2
1
_
C(q, q) =
_
1
2
m
1
l
2
1

1
sin(2
1
) m
1
l
1
L
0

1
sin(
1
) +
1
2
m
1
l
2
1

0
sin(2
1
)

1
2
m
1
l
2
1

0
sin(2
1
) 0
_
g(q) =
_
0
m
1
l
1
g sin(
1
)
_
, F =
_

0
_
, q =
_

1
_
La expresion (13.9) constituye el modelo del pendulo de Furuta, el cual es
no lineal porque incluye funciones trigonometricas de
1
as como diferentes
productos entre las velocidades

0
y

1
.
13.2. Modelo lineal aproximado
En esta obra es de interes la aplicacion de tecnicas de control lineal, las
cuales no pueden aplicarse directamente cuando el modelo de la planta a con-
trolar es no lineal como el mostrado en (13.9). Sin embargo, existe una manera
de resolver este problema. La idea fundamental es encontrar un modelo lineal
aproximado que represente con suciente exactitud al modelo (13.9) para des-
pues usar dicho modelo lineal aproximado en el dise no de un controlador para
el pendulo de Furuta. Sin embargo, tal como se indica en la seccion 7.2.2,
13.2 Modelo lineal aproximado 651
el controlador dise nado de este modo solo sera de utilidad para equilibrar el
pendulo en su posicion invertida
1
= 0 bajo la condicion de que el pendulo
se encuentre inicialmente cerca de dicha conguracion, es decir, siempre se
debera cumplir que
1
0.
El primer paso consiste en escribir (13.9) en terminos de variables de esta-
do. De acuerdo a lo expuesto en la seccion 7.1, dado un conjunto de ecuaciones
diferenciales como (13.9), se puede encontrar una representacion en variables
de estado deniendo las componentes del vector de estado x como las variables
incognita de dichas ecuaciones diferenciales y sus primeras r 1 derivadas,
donde r es el orden de la ecuacion diferencial correspondiente. Notese que
(13.9) esta constituida por dos ecuaciones diferenciales, cada una de segundo
orden. Las incognitas en dichas ecuaciones son
0
y
1
. Por tanto, el vector
de estado puede ser seleccionado como:
x =
_

_
x
1
x
2
x
3
x
4
_

_
=
_

1
_

_
Despejese q de (13.9) y defnase:
q =
_
w
1
(x
1
, x
2
, x
3
, x
4
, )
w
2
(x
1
, x
2
, x
3
, x
4
, )
_
= M
1
(x
1
, x
3
)[C(x
1
, x
2
, x
3
, x
4
)[x
2
, x
4
]
T
g(x
1
, x
3
) +F]
(13.10)
Una propiedad importante de la matriz M(q) = M(x
1
, x
3
) es que siempre
es no singular, es decir, la matriz M
1
(x
1
, x
3
) que aparece en la expresion
anterior siempre existe [2]. Entonces, la ecuacion de estado correspondiente se
puede escribir como:
x = f(x, u) (13.11)
f(x, u) =
_

_
f
1
(x, u)
f
2
(x, u)
f
3
(x, u)
f
4
(x, u)
_

_
=
_

_
x
2
w
1
(x
1
, x
2
, x
3
, x
4
, u)
x
4
w
2
(x
1
, x
2
, x
3
, x
4
, u)
_

_
, u =
Usando las ideas de la seccion 7.2.2, ahora se obtiene un modelo lineal aproxi-
mado que es valido alrededor de un punto de operacion de interes. Los puntos
de operacion son las parejas (x

, u

) que satisfacen:
f(x

, u

) =
_

_
0
0
0
0
_

_
652 13 Control de un pendulo de Furuta
es decir, de acuerdo a (13.11), (13.10):
x

2
=

0
= 0, x

4
=

1
= 0,
_
w
1
(x

1
, 0, x

3
, 0, u

)
w
2
(x

1
, 0, x

3
, 0, u

)
_
= M
1
(x

1
, x

3
)

_
C(x

1
, 0, x

3
, 0)
_
0
0
_
g(x

1
, x

3
) +
_
u

0
__
=
_
0
0
_
Del segundo renglon de estas condiciones se obtiene:
_
u

0
_
= g(x

1
, x

3
) =
_
0
m
1
l
1
g sin(

1
)
_
es decir:
u

= 0, x

3
=

1
= n
donde n puede ser cero o cualquier n umero entero. Notese que no existe nin-
guna condicion que deba cumplir x

1
=

0
lo cual signica que esta variable
puede elegirse de manera totalmente arbitraria. Debido a que se desea esta-
bilizar (o equilibrar) el pendulo en su posicion vertical invertida (n = 0) se
selecciona el siguiente punto de operacion:
x

=
_

_
x

1
x

2
x

3
x

4
_

_
=
_

_
0
0
0
0
_

_
, u

= 0 (13.12)
De acuerdo a (7.29), (7.30), (7.31) el modelo no lineal dado en (13.10), (13.11)
puede ser aproximado por el siguiente modelo lineal:
z = Az +Bv (13.13)
A =
_

_
f1(x,u)
x1
f1(x,u)
x2
f1(x,u)
x3
f1(x,u)
x4
f2(x,u)
x1
f2(x,u)
x2
f2(x,u)
x3
f2(x,u)
x4
f3(x,u)
x1
f3(x,u)
x2
f3(x,u)
x3
f3(x,u)
x4
f4(x,u)
x1
f4(x,u)
x2
f4(x,u)
x3
f4(x,u)
x4
_

_
x=x

,u=u

B =
_

_
f1(x,u)
u
f2(x,u)
u
f3(x,u)
u
f4(x,u)
u
_

_
x=x

,u=u

donde z = x x

y v = u u

. El uso de (13.9), (13.10), (13.11), (13.12),


(13.13) dene un procedimiento matematico (que a pesar de ser un poco largo
13.3 Construccion del pendulo de Furuta 653
solo involucra operaciones matematicas sencillas) al nal del cual se obtiene
lo siguiente:
A =
_

_
0 1 0 0
0 0
gm
2
1
l
2
1
L0
I0(J1+m1l
2
1
)+J1m1L
2
0
0
0 0 0 1
0 0
(I0+m1L
2
0
)m1l1g
I0(J1+m1l
2
1
)+J1m1L
2
0
0
_

_
, B =
_

_
0
J1+m1l
2
1
I0(J1+m1l
2
1
)+J1m1L
2
0
0
m1l1L0
I0(J1+m1l
2
1
)+J1m1L
2
0
_

_
(13.14)
La expresion (13.13) junto con (13.14) constituyen el modelo lineal aproxi-
mado que se buscaba. Como se menciono anteriormente, usando (13.13) y
(13.14) se puede dise nar un controlador por realimentacion lineal del estado
el cual, sin embargo, asegura buenos resultados si se restringe que el estado
y la entrada solo evolucionen alrededor del punto de operacion (13.12). Esto
tambien suele indicarse diciendo que z 0 y v 0. Esto signica que una
tarea que jamas podra resolver el controlador que se dise na en este captulo
es el llevar el pendulo desde su posicion vertical hacia abajo (
1
= [rad])
hasta su posicion vertical invertida (
1
= 0). Si el lector esta interesado en
resolver dicho problema, se recomienda que consulte las referencias [2] y [3].
13.3. Construccion del pendulo de Furuta e
indenticacion de sus parametros
En la gura 13.3 se presenta un dibujo detallado que muestra las partes
mecanicas utilizadas para construir el pendulo de Furuta. Algunas de estas
partes se introducen con el n de acoplar mecanicamente el motor con el
brazo y este con el pendulo. Ademas, se acoplan dos potenciometros, uno
directamente a la echa del motor (P
2
) y otro entre el brazo y el pendulo
(P
1
), para medir
0
y
1
, respectivamente. Todas estas partes tienen masas e
inercias que deben ser consideradas dentro del modelo del pendulo de Furuta.
Para calcular los momentos de inercia del sistema se recurre a expresiones
bien conocidas en los libros de texto sobre mecanica clasica para el momento
de inercia de determinados cuerpos geometricos tales como varillas, cilindros
y prismas rectangulares. Debe tenerse presente que la manera que a conti-
nuacion se describe para calcular los parametos del pendulo de Furuta puede
admitir algunas variantes. De hecho, estos parametros deben ser considerados
como meras aproximaciones cuya exactitud se ve respaldada por el hecho de
que los valores obtenidos permiten calcular, mas adelante, las ganancias del
controlador que, en efecto, permiten resolver el problema de control que in-
teresa, es decir, estabilizar o equilibrar el pendulo en su posicion vertical
invertida.
Para calcular la inercia I
0
se suma la inercia I
brazo
de la varilla que forma
al brazo, la inercia I
cubo
del prisma rectangular C
1
(usado para acoplar la
echa del motor al brazo) y la inercia del motor I
rotor
. Los valores numericos
654 13 Control de un pendulo de Furuta
de estas inercias se calculan como se indica a continuacion. Se mide la longitud
total del brazo, L
0
= 0.235[m], desde el centro del potenciometro P
1
hasta el
centro del prisma rectangular C
1
, es decir, hasta la echa del motor. La masa
total del brazo m
brazo
es la suma de i) la masa de la varilla que forma al brazo,
m
0
, ii) la masa de la abrazadera ab
1
(que une el brazo con el potenciometro
P
1
el cual representa el acoplamiento mecanico entre el brazo y el pendulo
pues el pendulo se une rmemente a la otra parte movil del potenciometro
P
1
) e iii) la mitad de la masa del potenciometro P
1
. El momento de inercia de
una varilla que gira respecto de un eje perpendicular a la misma y que pasa
por uno de sus extremos se calcula por medio de la expresion [4]:
I
brazo
=
1
3
m
brazo
L
2
0
= 0.96644 10
3
[kgm
2
]
Para calcular la inercia I
cubo
del prisma rectangular C
1
se utiliza la siguiente
expresion que relaciona su momento de inercia con respecto a un eje de giro
que pasa por su centro [4], [5], pag. 271:
I
cubo
=
m
cubo
12
(b
2
+c
2
) = 1.9333 10
6
[kgm
2
]
donde b y c son las longitudes de los lados de la cara superior del prisma C
1
mientras que m
cubo
es su masa. Por ultimo se calcula la inercia del rotor del
motor. La masa del rotor, m
r
, se estima como la mitad de la masa del motor
completo mas la masa de la abrazadera ab
2
(la cual une al potenciometro P
2
con la echa del rotor) mas la mitad de la masa del potenciometro P
2
. La otra
mitad de la masa de P
2
permanece siempre en reposo pues esta ja al soporte
del mecanismo. Como el motor es cilndrico, se supone que el rotor tambien
lo es y se estima su radio, R, como la mitad del radio de la carcasa del motor.
Esto permite estimar la inercia del rotor, sin necesidad de desarmar el motor,
del siguiente modo: la inercia de un cuerpo cilndrico de radio R y masa m
r
que gira respecto a su eje longitudinal esta dada como [4], [5], pag. 271:
I
rotor
=
1
2
m
r
R
2
= 0.16931 10
3
[kgm
2
]
Por tanto, el momento de inercia I
0
es:
I
0
= I
brazo
+I
cubo
+I
rotor
= 1.137 10
3
[kgm
2
]
Para calcular el momento de inercia J
1
del pendulo se considera que su ma-
sa m
1
esta formada por la suma de 1) la masa del pendulo, 2) la masa del
acoplamiento entre el pendulo y el potenciometro P
1
(placa rectangular de
aluminio que se observa en la gura 13.3) y 3) la mitad de la masa del poten-
ciometro P
1
. Esto debido a que la otra mitad de la masa del potenciometro
P
1
pertenece a la masa total del brazo. Para calcular el momento de inercia
de una varilla que gira sobre un eje perpendicular a la misma y que pasa a
traves de su centro de masa se utiliza la expresion [4], [5], pag. 271:
13.3 Construccion del pendulo de Furuta 655
J
1
=
1
12
m
1
(2l
1
)
2
= 0.38672 10
3
[kgm
2
]
donde l
1
= 0.1875[m] es la distancia desde el centro del potenciometro P
1
hasta el centro de gravedad del pendulo (ubicado en el centro del pendulo) y
la masa del pendulo es m
1
= 0.033[kg].
El modelo (13.13), (13.14) supone que la se nal de control v = u (porque
u

= 0) es un par. Sin embargo, en la practica la se nal de control es un voltaje


que se aplica al motor el cual se encarga de generar el par u. Para resolver
este problema se procede del siguiente modo. Suponga que en el modelo (9.9),
(9.10) de la seccion 9.1 la dinamica electrica es muy rapida, es decir, que L = 0
y k
e
= 0. Entonces se encuentra que el par generado por el motor esta dado
aproximadamente por:
= u =
k
m
r
a
E
a
(13.15)
donde r
a
es la resistencia de armadura del motor, E
a
es el voltaje aplicado en
sus terminales y k
m
es la constante de par del motor. Con el n de poder usar
el voltaje de armadura como se nal de control se debe determinar el valor de la
constante k
m
/r
a
. Esto se consigue mediante el siguiente experimento. El eje
del motor se coloca en posicion horizontal con el brazo y el pendulo montados
en sus posiciones. Se aplica cuidadosamente un voltaje en las terminales de
la armadura, de manera que se consiga el equilibrio (reposo) cuando el brazo
quede colocado horizontalmente (el pendulo queda colocado verticalmente).
Esto signica que se ha conseguido un equilibrio entre el par generado por
el motor y el par producido, sobre el eje del rotor, por el peso del brazo y
el peso del pendulo. Una vez conseguido esto se mide el voltaje aplicado a
la armadura E
a
y se calcula el par debido al peso del brazo y al peso del
pendulo. Con estos datos se usa (13.15) para calcular la constante:
k
m
r
a
= 0.0215[Nm/V]
Finalmente, usando (13.13), (13.14), (13.15) y = v junto con los valores
numericos calculados en esta seccion se encuentra el siguiente modelo el cual
sera usado para dise nar el controlador:
z = Az +BE
a
(13.16)
A =
_

_
0 1 0 0
0 0 35.81 0
0 0 0 1
0 0 72.90 0
_

_
, B = B
k
m
r
a
=
_

_
0
13.4684
0
12.6603
_

_
Notese que el voltaje de armadura E
a
es ahora la se nal de control y que, de
acuerdo a (13.15), el valor de esta variable en el punto de operacion dado en
(13.12) es E

a
= 0 .
656 13 Control de un pendulo de Furuta
Figura 13.3. Componentes del pendulo de Furuta construido.
13.4. Dise no del controlador
A continuacion se dise na un controlador por realimentacion lineal del es-
tado que permita estabilizar al sistema dado en (13.16) en z = 0, es decir en
x = x

con x

dado en (13.12). El controlador debe tener la siguiente forma:


E
a
= Kz (13.17)
K =
_
k
1
k
2
k
3
k
4

, z = x x

=
_

0

1

T
donde k
1
, k
2
, k
3
y k
4
son cuatro ganancias constantes que deben determinarse
de manera que se asegure que z tiende a cero (que x tiende a x

) conforme el
tiempo crece. El calculo de estas ganancias constituye el dise no del controla-
dor. Notese que el uso de (13.17) en (13.16) permite escribir:
z = (ABK)z
De acuerdo a lo expuesto en la seccion 7.5 si todos los eigenvalores de la
matriz:
ABK (13.18)
tienen parte real estrictamente negativa entonces se asegura que z tiende a
cero conforme el tiempo crece o, equivalentemente, que ambas
0
y
1
tienden
a cero conforme el tiempo crece, lo cual signica que se consigue estabilizar o
equilibrar al pendulo de Furuta en su posicion vertical invertida. El primer
13.5 Construccion del controlador 657
paso para dise nar el controlador (13.17) consiste en vericar la controlabilidad
de la planta dada en (13.16). De acuerdo a lo expuesto en la seccion 7.9, esto
se cumple si la siguiente matriz de 4 4 tiene rango 4:
_
B AB A
2
B A
3
B

Esto es vericado facilmente calculando numericamente el determinante que


resulta ser diferente de cero. Se concluye entonces que (13.16) es controla-
ble. Esta propiedad asegura que siempre es posible encontrar un vector de
ganancias K (denido en (13.17)) que consigue asignar a los eigenvalores de
la matriz en (13.18) cualquier valor que se desee. Como se menciono anterior-
mente, la seleccion obvia y deseable es que todos estos eigenvalores tengan
parte real negativa.
En base a lo anterior, el dise no del controlador se realiza del siguiente
modo. Se propone el siguiente conjunto de eigenvalores para la matriz en
(13.18):

1
= 94,

2
= 18,

3
= 0.5,

4
= 1
Usando el procedimiento presentado en los ejemplos 7.6 y 7.7 del captulo 7
se encuentra que el correspondiente vector de ganancias es:
K =
_
1.5215 4.6690 152.0048 13.8931

(13.19)
Esto signica que el controlador en (13.17) se escribe nalmente como:
E
a
= 1.5215
0
+ 4.6690

0
+ 152.0048
1
+ 13.8931

1
(13.20)
Es importante decir que aunque existen muchos vectores de ganancias K que
desde el punto de vista teorico resuelven el problema de control, sin embargo,
desde el punto de vista practico, no todas las ganancias K as calculadas per-
miten obtener resultados experimentales satisfactorios. As que las ganancias
en (13.19) fueron seleccionadas despues de vericar experimentalmente que
producen buenos resultados.
13.5. Construccion del controlador
El controlador (13.20) se construye usando el microcontrolador PIC16F877
A de Microchip. A continuacion se explica como se ha hecho esto. Antes que
nada se debe aclarar que no es el proposito presentar toda una exposicion de
como trabaja este microcontrolador. Lo que se presenta es una descripcion de
los recursos de este microcontrolador que se utilizan para construir el contro-
lador (13.20). Al nal de este captulo se presenta un listado del programa
utilizado. El microcontrolador PIC16F877A [6] es de tecnologa EEPROM,
tiene una velocidad de operacion maxima de 20[MHz]. Cuenta con 5 puertos
de entrada-salida congurables, 3 temporizadores (el timer TMR0 es utilizado
658 13 Control de un pendulo de Furuta
en este captulo para establecer el periodo de muestreo: T = 0.0256[seg]), 8 ca-
nales Analogico-Digital los cuales se basan en un CAD (convertidor Analogico-
Digital) de 10 bits (de los cuales solo se usan los 8 bits mas signicativos en
este captulo). Tambien cuenta con 2 modulos PWM de los cuales en este
captulo se usa el CCP1 para entregar el voltaje de control a la planta. Es-
te PWM se programa para trabajar a una frecuencia de 4.9[KHz] con una
resolucion de 2
8
1 = 255 cuentas.
Las posiciones
0
y
1
se miden usando los potenciometros de precision
de una vuelta P
2
y P
1
, respectivamente (ver gura 13.3). Las variaciones de
voltaje de estos potenciometros son ledas usando los canales 0 y 1 del CAD,
respectivamente. Se considera que una vuelta completa de cada potenciometro
equivale exactamente a 2 radianes y que el rango del CAD (solo se usan los 8
bits mas signicativos) equivale a tal variacion angular. Mas a un, el centro de
las variaciones de cada potenciometro es la posicion correspondiente al punto
de operacion dado en (13.12), es decir x

1
=

0
= 0 y x

3
=

1
= 0. Con esto
en mente se hacen las siguientes operaciones:
theta
0
=
2
255
(CAD0 127) (13.21)
theta
1
=
2
255
(CAD1 127) (13.22)
donde CAD0 y CAD1 representan las lecturas entregadas por los canales 0
y 1 del CAD, respectivamente, mientras que theta
0
y theta
1
representan las
mediciones de
0
y
1
, respectivamente, en radianes. Las velocidades

0
y

1
se estiman a partir de las posiciones medidas usando diferenciacion numerica:
dtheta
0
=
theta
0
(k) theta
0
(k 1)
T
(13.23)
dtheta
1
=
theta
1
(k) theta
1
(k 1)
T
(13.24)
donde k representa el tiempo discreto, dtheta
0
y dtheta
1
representan los es-
timados de las velocidades

0
y

1
, respectivamente, en radianes por segundo
mientras que T = 0.0256[seg] es el periodo de muestreo utilizado. De este mo-
do theta
0
(k) indica el valor de theta
0
que se mide en el instante de muestreo
actual y theta
0
(k 1) indica el valor de theta
0
que se midio en el instante de
muestreo previo. theta
1
(k) y theta
1
(k 1) se denen de manera similar. Con
esta informacion se calcula:
d
a
= 1.5215 theta
0
+ 4.6690 dtheta
0
+ 152.0048 theta
1
+ 13.8931 dtheta
1
y se enva d
a
al PWM del microcontrolador como se describe a continuacion.
Se supone que d
a
solo tomara valores en el rango de -5 a +5 volts, por lo
que su valor se satura por software para restringirlo a ese rango de valores
utilizando instrucciones como las siguientes:
13.5 Construccion del controlador 659
if d
a
> 5 then d
a
= 5
if d
a
< 5 then d
a
= 5
Como la resolucion del PWM es de 2
8
1 = 255 cuentas, entonces la si-
guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de d
a
al amplicador de potencia de la planta:
cuenta =
255
5
abs(d
a
) (13.25)
donde abs(d
a
) representa el valor absoluto de d
a
. El signo de d
a
es almacenado
en dos bits de control. La se nal del PWM se entrega a un puente H (L293D
de Texas Instruments) que se encarga de amplicar convenientemente la po-
tencia de la se nal del PWM. Este puente H esta alimentado con una fuente de
potencia de 7[V]. Sin embargo, de acuerdo a la hoja de datos de este disposi-
tivo [7] las caidas de voltaje en el mismo determinan que en las terminales del
motor solo sean aplicados 5[V]. Este dispositivo tiene dos bits a traves de
los cuales se le indica el signo del voltaje que debe entregar. Para ello, el signo
de d
a
se enva al puente H a traves de los bits 0 y 1 del canal D. Esto signica
que el voltaje promedio que el puente H entrega a las terminales del motor
solo vara en el rango de -5 a +5 volts. As, se asegura que en las termina-
les del motor de CD se aplica un voltaje E
a
cuyo promedio es numericamente
igual a d
a
. Esto es importante porque asegura que la construccion practica del
controlador respeta el dise no indicado en (13.20). En la gura 13.4 se muestra
el diagrama electrico usado para construir el controlador (13.20) en base al
microcontrolador PIC16F877A. Resulta interesante observar la sencillez del
hardware utilizado.
660 13 Control de un pendulo de Furuta
Figura 13.4. Diagrama electrico del sistema de control del pendulo de Furuta.
13.6 Resultados experimentales 661
13.6. Resultados experimentales
En la gura 13.5 se muestran los resultados experimentales obtenidos.
Notese que aunque la posicion del brazo
0
no consigue estabilizarse en cero,
sin embargo la posicion del pendulo
1
permanece en cero, es decir, en la
conguracion vertical invertida. Notese tambien la presencia importante de
ruido, el cual es debido a los potenciometros usados para medir la posicion
del brazo y del pendulo. Es importante subrayar que, a pesar de esto, los
resultados experimentales muestran que se ha conseguido el principal objetivo
de control: mantener el pendulo equilibrado alrededor de su posicion vertical
invertida. En la gura 13.6 se muestra una fotografa donde se observa el
sistema de control funcionando.
rad [ ]
rad [ ]
tiempo s [ ]

0
Figura 13.5. Resultados experimentales.
662 13 Control de un pendulo de Furuta
Figura 13.6. El sistema de control completo funcionando.
Programacion del microcontrolador PIC16F877A
Se recomienda consultar la referencia [8] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
/*PROGRAMA PARA EL COMPILADOR DE C PCWH VERSION 3.203*/
/*PROGRAMA PARA CONTROLAR UN PENDULO DE FURUTA EN LA POSICION
VERTICAL INESTABLE CON UN MICROCONTROLADOR (PIC16F877A) Y UN
PUENTE H (L293D) MEDIANTE UNA RETROALIMENTACION DE ESTADO (u=-K*x)
*/ #include<16F877A.h> #include <stdlib.h> #include <math.h>
#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#use delay(clock=20000000) //Frecuencia del cristal Hz
/*Direcciones de los registros a utilizar*/
#byte TMR0 = 0x01
#byte OPTION= 0x81
#byte TRISA = 0x85
#byte TRISB = 0x86
#byte TRISC = 0x87
#byte TRISD = 0x88
#byte ADCON0= 0x1F
#byte ADCON1= 0x9F
#byte PORTB = 0x06
13.6 Resultados experimentales 663
/*Direcciones de los pines a utilizar*/
#bit RC2 = 0x07.2//Pin para mandar senal PWM al puente H (L293D)
#bit RD0 = 0x08.0//Pin para pilotear sentido de movimiento
#bit RD1 = 0x08.1//Pin para pilotear sentido de movimiento
/*RUTINA PRINCIPAL*/
void main(void)
{
/*DECLARACION DE VARIABLES LOCALES*/
unsigned int i,t_0,t_1,pwm;
float teta_0,teta_0_1,teta_0p,teta_1,teta_1_1,teta_1p,u;
/*Configuracion de la tasa de conteo del timer 0*/
OPTION=0x87;//pull ups deshabilitados, prescaler 1:256 para TMR0
/*Configuracion PWM*/
setup_ccp1(CCP_PWM);
//configurando ccp1 como PWM
setup_timer_2(T2_DIV_BY_4,255,1);
//configurandotimer2,(1/20000000)*4*4*256=2048us
/*Configuracion de entradas y salidas de los puertos*/
TRISA=0x0F;//configurando parte alta del puerto A como salidas y
//parte baja como entradas
TRISB=0x00;//configurando puerto B como
//salidas
TRISC=0x00;//configurando puerto C como salidas
TRISD=0x00;//configurando puerto D como salidas
/*Configuracion ADC*/
ADCON1=0x04;
ADCON0=0x81;
/*Inicializando variables*/
TMR0=0;
teta_0=0;
teta_1=0;
while(1)
{
teta_0_1=teta_0; //posicion anterior brazo
teta_1_1=teta_1; //posicion anterior Pendulo
664 13 Control de un pendulo de Furuta
ADCON0=0x81; //Cambiando a CH0
for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
teta_0=t_0-127.0; //compensando offset potenciometro
teta_0=0.02464*teta_0; //convirtiendo a radianes
ADCON0=0x89; //cambiando a CH1
for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta_1=t_1-127.0; //compensando offset potenciometro
teta_1=0.02464*teta_1; //convirtiendo a radianes
/*Calculo de derivadas*/
teta_0p=(teta_0-teta_0_1)/0.0256;
teta_1p=(teta_1-teta_1_1)/0.0256;
/*Calculando el control u=-K*x*/
u=1.5215*teta_0+4.6690*teta_0p+152.0048*teta_1+13.8931*teta_1p;
u=51.0*u; //escalamiento a volts de salida
/*Control de saturacion de la senal de control para el PWM*/
if(u>254.0)
u=255.0;
if(u<-254.0)
u=-255.0;
/*Piloteando sentido de movimiento del motor (pines al puente H)*/
if(u<0)
{
RD0=1;
RD1=0;
}
else
{
RD0=0;
RD1=1;
}
pwm=(unsigned int)abs(u);
PORTB=pwm; //valor del pwm por el puerto B
set_pwm1_duty(pwm); //actualizando el valor del PWM
/*Ajuste del periodo de control Ts=0.0256 seg*/
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
}
}
13.8 Preguntas de repaso 665
13.7. Resumen del captulo
En este captulo se ha construido un pendulo de Furuta y todas las interfa-
ces necesarias para su control en lazo cerrado. El esquema de control utilizado
es conocido como realimentacion lineal del estado. Consiste en la medicion de
las posiciones y las velocidades de los dos cuerpos que componen al mecanismo
y, multiplicandolas por constantes, sumarlas para obtener el par que debe ser
generado por el motor de CD usado como actuador. Dado que se trata de un
sistema inestable y no lineal, la solucion de este problema de control, as como
la construccion experimental del mismo, es de gran interes. Otra caracterstica
importante del presente captulo es el hecho de mostrar una manera diferen-
te de modelar sistemas mecanicos usando las ecuaciones de Euler-Lagrange.
Este enfoque es particularmente util cuando se modelan sistemas mecanicos
compuestos por varios cuerpos que se mueven independientemente (grados de
libertad).
De particular interes resulta la identicacion del valor numerico de los
parametros del prototipo. En la literatura de control se habla de masas, cen-
tros de masa e inercias sin entrar en mas detalles. Sin embargo, en la practica,
los cuerpos que componen al mecanismo a su vez estan compuestos por torni-
llos, acoplamientos, piezas con diferentes formas geometricas y masas, varillas,
etc. Esto signica que se debe encontrar la masa, el centro de masa y la inercia
equivalente de todas esas piezas que conforman a cada cuerpo del mecanismo.
En el presente captulo se ha mostrado una forma de hacer esto utilizando
formulas de la mecanica clasica. Tambien se ha mostrado la manera de obte-
ner un modelo lineal, que representa una aproximacion del modelo no lineal
mas exacto, el cual se emplea para dise nar el controlador. Esto resulta en un
sistema de control que solo funcionara correctamente si la conguracion inicial
del mecanismo es cercana a la que se desea.
13.8. Preguntas de repaso
1. Por que se dice que el pendulo de Furuta es inestable en lazo abierto?
2. De una explicacion descriptiva (no analtica) de porque se necesita con-
trolar simultaneamente la posicion del brazo y la posicion del pendulo.
3. Describa el procedimiento para identicar los diferentes parametros del
mecanismo completo.
4. Como se identican los parametros del motor?
5. Describa el funcionamiento del amplicador de potencia utilizado.
6. Explique que representan todos los posibles puntos de operacion del
pendulo de Furuta.
7. Por que la energa potencial del mecanismo solo considera la energa
potencial del pendulo?
8. Que representa la aproximacion lineal de un modelo no lineal?
666 13 Control de un pendulo de Furuta
9. Cual es la condicion que debe cumplir el controlador por realimentacion
lineal del estado para que el pendulo de Furuta funcione adecuadamente?
10. Por que es importante que el modelo del pendulo de Furuta sea contro-
lable? Que se puede hacer si no es controlable?
Referencias
1. H. Goldstein, C. Poole and J. Safko, Cassical Mechanics, Captulo 1, 3rd edition,
Addison Wesley, New York, 2000.
2. I. Fantoni and R. Lozano, Non-linear control for underactuated mechanichal
systems, Springer, London, 2002.
3. H.I. Torres Rodrguez, Control de sistemas no linealizables en forma exacta, Te-
sis de Mestra en Ciencias, CINVESTAV, Departamento de Ingeniera Electica,
Mexico D. F., 2002.
4. R. C. Hibbeler, Mecanica vectorial para ingenieros. Dinamica, (10a. edicion),
Pearson Educacion, Mexico, 2004.
5. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
6. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
7. L293D Qudruple half-H drivers, Data sheet, Texas Instruments, 2004.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
14
Control de un pendulo con rueda inercial
El pendulo de con rueda inercial es un mecanismo en el que se debe con-
trolar simultaneamente la posicion del pendulo y la velocidad de la rueda. Por
esta razon, es natural analizarlo y dise narle un controlador usando la tecnica
de las variables de estado. Por otro lado, este mecanismo es, de los prototipos
didacticos subactuados y no lineales, el mas sencillo. Por ello, es ideal para
introducir al lector en los conceptos de control de sistemas no lineales. Esta
es la principal razon para incluir el problema de controlar este mecanismo.
670 14 Control de un pendulo con rueda inercial
Objetivos del captulo
Modelar el pendulo con rueda inercial usando las ecuaciones de Euler-
Lagrange.
Dise nar un controlador que levante el pendulo con rueda inercial de su
posici on vertical no invertida a su posici on vertical invertida.
Dise nar un controlador que atrape el pendulo con rueda inercial en su
posici on vertical invertida.
Construir un pendulo con rueda inercial.
Identicar los par ametros del pendulo con rueda inercial.
Construir los controladores para levantar y atrapar el pendulo con rueda
inercial.
Obtener resultados experimentales en el pendulo con rueda inercial cons-
truido.
14.1. Pendulo con rueda inercial
En este captulo se dise na una estrategia de control para un mecanismo
conocido como el pendulo con rueda inercial (IWP). En la gura 14.1 puede
apreciarse el Pendulo con rueda inercial en la posicion vertical no invertida,
mientras que en la gura 14.2 se muestra un esquema de este mecanismo. Se
trata de un pendulo que en su extremo tiene jo un motor de CD el cual
mueve a una rueda. En el punto de donde se suspende el pendulo no se aplica
ning un par externo. Se dice entonces que este punto no esta actuado mientras
que la rueda esta actuada porque recibe el par generado por el motor de CD.
Como el pendulo y la rueda denen dos grados de libertad [1] y solo existe un
actuador (en la rueda) se dice que este mecanismo es un sistema subactuado
[2].
El pendulo con rueda inercial (IWP) fue presentado por Spong et al. [2],
el cual ademas de usarse com unmente con nes academicos ha tenido fuertes
aplicaciones en la investigacion como prototipo de referencia para la prueba
de algoritmos no lineales de control [2]-[11].
La nomenclatura utilizada es la siguiente:
q
1
es la posicion angular del pendulo.
q
2
es la posicion angular de la rueda.
m
1
es la masa del pendulo.
m
2
es la masa de la rueda.
es el par aplicado a la rueda.
l
c1
es la distancia al centro de masa del pendulo.
l
1
es la longitud del pendulo.
I
1
es la inercia del pendulo cuando gira alrededor de su centro de masa.
I
2
es la inercia de la rueda (mas la inercia del rotor del motor de CD).
g es la aceleracion de la gravedad.
14.1 Pendulo con rueda inercial 671
Figura 14.1. Pendulo con rueda inercial en posicion vertical no invertida.
Figura 14.2. El pendulo con rueda inercial.
R es la resistencia de armadura del motor de CD.
L es la inductancia de armadura del motor de CD.
k
b
y k
m
son las constantes de fuerza contraelectromotriz y de par, respec-
tivamente, del motor de CD.
u e i representan, respectivamente, el voltaje en las terminales de armadura
y la corriente electrica a traves de la armadura del motor de CD.
De acuerdo a la descripcion previa del pendulo con rueda inercial, es claro
que no es posible aplicar un par sucientemente grande como para llevar
al pendulo, de un solo golpe, desde la conguracion en la que q
1
= 0 y su
672 14 Control de un pendulo con rueda inercial
velocidad es cero q
1
= 0 hasta la conguracion en la que q
1
= + o q
1
=
y q
1
= 0. Mas a un, esta ultima conguracion es inestable y se le denomina la
conguracion invertida inestable. Por estas razones resulta de mucho interes
dise nar una estrategia de control: i) que lleve al pendulo desde los alrededores
de la conguracion q
1
= 0 y q
1
= 0 hasta la conguracion invertida inestable
e ii) que lo mantenga ah. A la primera parte de esta tarea se le denomina
levantar el pendulo y la segunda parte se denomina balancear el pendulo
o atrapar el pendulo.
Como se muestra en este captulo, la tarea de levantar el pendulo requiere
de tecnicas de control no lineal pues las tecnicas de control lineal no tienen
la capacidad para resolver este problema ya que el modelo del pendulo con
rueda inercial es no lineal. Sin embargo, aunque no lineal, el modelo de este
mecanismo es sucientemente sencillo de modo que esta estrategia puede ser
dise nada usando ideas conceptuales sencillas. Por tanto, el objetivo de presen-
tar este problema de control en este captulo es introducir al lector, mediante
un ejemplo sencillo, a los metodos de dise no de control no lineal.
14.2. Modelo matematico
Dado que el pendulo es un mecanismo compuesto por dos cuerpos que
interact uan, su modelo matematico se obtiene utilizando las ecuaciones de
Euler-Lagrange, es decir:
d
dt
L
q
1

L
q
1
= 0 (14.1)
d
dt
L
q
2

L
q
2
=
El cero en el lado derecho de la primera expresion indica que no hay ning un par
externo aplicado en el punto de donde se suspende el pendulo. El lagrangiano
esta dado como:
L = K P (14.2)
K = K
1
+K
2
, P = P
1
+P
2
donde K
1
y K
2
representan, respectivamente, las energas cineticas del pendu-
lo y de la rueda, mientras que P
1
y P
2
representan, respectivamente, las
energas potenciales del pendulo y de la rueda. Como el pendulo es un cuerpo
cuya masa esta distribuida a lo largo de una varilla, su energa cinetica se
calcula como la suma de la energa cinetica de una partcula de masa m
1
que
se mueve sobre una circunferencia de radio l
c1
mas la energa cinetica de una
varilla que gira alrededor de su centro de masa, es decir:
K
1
=
1
2
m
1
l
2
c1
q
2
1
+
1
2
I
1
q
2
1
(14.3)
14.2 Modelo matematico 673
La energa cinetica de la rueda se obtiene de manera similar. Sin embargo, se
debe tomar en cuenta que la velocidad con la que gira la rueda, medida por
un observador jo en el laboratorio, es q
1
+ q
2
. Entonces, se encuentra que:
K
2
=
1
2
m
2
l
2
1
q
2
1
+
1
2
I
2
( q
1
+ q
2
)
2
(14.4)
Para calcular la energa potencial se utiliza como referencia (donde P
1
y P
2
son iguales a cero) la conguracion en la que q
1
= 0. Recuerdese que la energa
potencial del pendulo es el producto de la fuerza aplicada sobre el pendulo
(peso del pendulo) y la distancia, en la direccion del peso, que separa al centro
de masa del pendulo en la posicion actual q
1
respecto de la posicion en la que
la energa potencial es cero, es decir cuando q
1
= 0. Entonces:
P
1
= gm
1
l
c1
(1 cos(q
1
)) (14.5)
Procediendo similarmente se encuentra la energa potencial de la rueda:
P
2
= gm
2
l
1
(1 cos(q
1
)) (14.6)
Por tanto, de acuerdo a (14.2):
L =
1
2
m
1
l
2
c1
q
2
1
+
1
2
I
1
q
2
1
+
1
2
m
2
l
2
1
q
2
1
+
1
2
I
2
( q
1
+ q
2
)
2
gm(1 cos(q
1
))
donde m = m
1
l
c1
+m
2
l
1
. Sustituyendo L en las ecuaciones de Euler-Lagrange
presentadas en (14.1) y despues de agrupar convenientemente los terminos
resultantes se obtiene:
D
_
q
1
q
2
_
+
_
mg sin (q
1
)
0
_
=
_
0

_
, (14.7)
D =
_
d
11
d
12
d
21
d
22
_
=
_
m
1
l
2
c1
+m
2
l
2
1
+I
1
+I
2
I
2
I
2
I
2
_
Es muy sencillo mostrar que el determinante de la matriz D es positivo, es
decir:
det(D) = d
11
d
22
d
12
d
21
> 0 (14.8)
El modelo en (14.7) es el modelo mas exacto del pendulo con rueda inercial y
en la siguiente seccion sera utilizado para dise nar la estrategia de control que
lo levantara hasta su conguracion invertida inestable.
Finalmente, una aclaracion acerca de la se nal de control utilizada. El vol-
taje aplicado al motor de CD que act ua sobre la rueda es la se nal que ver-
daderamente se puede manipular directamente, mientras que el par es una
variable que resulta como efecto de aplicar dicho voltaje. Sin embargo, en la
practica es posible suponer que el par es la se nal de control si se considera
que la inductancia de armadura es muy peque na. La siguiente ecuacion es el
674 14 Control de un pendulo con rueda inercial
modelo matematico del circuito de armadura del motor de CD con escobillas
equipado con iman permanente que act ua sobre la rueda:
L
di
dt
+Ri +k
b
q
2
= u (14.9)
Si L y k
b
se suponen iguales a cero, entonces:
= k
m
i =
k
m
R
u (14.10)
Esto signica que el voltaje aplicado tiene una accion directa sobre el par
generado y por eso es valido suponer que el par es la se nal de control. El
hecho de suponer k
b
igual a cero se justica del siguiente modo. Como pue-
de apreciarse en (14.9) este parametro introduce friccion viscosa adicional al
mecanismo. Como esto normalmente mejora la estabilidad de un sistema de
control, entonces suponer que k
b
= 0 solo hace mas interesante el problema
de control en el sentido de que el dise no se hara bajo la suposicion de que
ning un efecto estabilizante esta presente de manera natural en el mecanismo.
14.3. Controlador no lineal para levantar el pendulo
El objetivo en esta secccion es dise nar un controlador que levante al pendu-
lo con rueda inercial hasta su conguracion invertida inestable, es decir, hasta
alguno de los puntos (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) = (, 0). Mas adelante se
explicara por que no es importante el valor que tengan la posicion y la ve-
locidad de la rueda durante el intervalo de tiempo en el que se realiza esta
tarea.
Despejando q
2
del primer renglon en (14.7), sustituyendo este valor en el
segundo renglon de (14.7) y usando (14.10) as como d
12
= d
22
se obtiene:
J q
1
+mgl sin(q
1
) =
1
(14.11)
J =
d
22
d
11
d
21
d
12
d
12
, mgl = mg,
1
=
k
m
R
u
Notese que J > 0 debido a (14.8). Por tanto, el modelo en (14.11) corresponde
a un pendulo simple donde J, m, l y g representan, respectivamente, su inercia,
su masa y su longitud equivalentes as como la aceleracion de la gravedad. La
energa de este pendulo se obtiene como la suma de su energa cinetica y
potencial, es decir:
V (q
1
, q
1
) =
1
2
J q
2
1
+mgl(1 cos(q
1
)) (14.12)
En la gura 14.3 se muestran las supercies de nivel de V . Esto signica
que cada curva en dicha gura representa el conjunto de puntos (q
1
, q
1
) que
corresponden un valor constante de V (q
1
, q
1
). El lector puede darse cuenta de
14.3 Controlador no lineal para levantar el pendulo 675
V = V
0
V > V
0
0 < V < V
0
V = 0

V = V
0
q
1
rad=s [ ]
q
1
rad [ ]
Figura 14.3. Supercies de nivel de V en (14.12).
que las curvas mas externas corresponden a valores de V cada vez mayores
(positivos) y que la curva cerrada mas interna corresponde a un solo punto,
(q
1
, q) = (0, 0), donde V tiene su valor mnimo e igual a cero.
Calc ulese la derivada respecto al tiempo de V (q
1
, q
1
), dada en (14.12),
para encontrar:
dV (q
1
, q
1
)
dt
= q
1
J q
1
+mgl q
1
sin(q
1
) (14.13)
Si se sustituye el valor de J q
1
obtenido a partir de (14.11) se obtiene:
dV (q
1
, q
1
)
dt
= q
1

1
(14.14)
Lo que se acaba de calcular se conoce como la derivada de V a lo largo
de las trayectorias de (14.11) [12]. Esto quiere decir que (14.14) representa
los valores que toma
d
dt
V conforme el pendulo en (14.11) se mueve bajo el
efecto del par externo
1
. Por ejemplo, si
1
= 0 entonces, de (14.14) se
obtiene
d
dt
V = 0. Esto signica que conforme el pendulo se mueve su energa
V permanece constante. Esto provee mucha informacion como se explica a
continuacion. Conociendo el valor inicial de posicion y velocidad (q
1
(0), q
1
(0))
se puede saber el valor inicial de la energa V (q
1
(0), q
1
(0)). Como se sabe
676 14 Control de un pendulo con rueda inercial
que
d
dt
V = 0 porque
1
= 0 entonces, conforme el tiempo crece, el pendulo
debera moverse unicamente sobre los puntos que representan a la supercie de
nivel en la cual V (q
1
(t), q
1
(t)) = V (q
1
(0), q
1
(0)), las cuales se muestran en la
gura 14.3. Las echas que se dibujan sobre las supercies de nivel representan
el sentido en el cual estas son recorridas conforme el pendulo se mueve. Estos
sentidos son faciles de determinar como se explica a continuacion. El estado
del pendulo simple se dene como y = [q
1
, q]
T
. La variable y = [ q
1
, q]
T
es un
vector cuya direccion indica hacia donde se esta moviendo el estado y. Notese
que la componente horizontal de y, es decir q
1
, apunta hacia la derecha siempre
que la velocidad del pendulo q
1
sea positiva. Esto es suciente para determinar
el sentido de las echas dibujadas sobre las supercies de nivel de V .
De acuerdo a lo expuesto en el parrafo anterior, para levantar al pendulo
hasta su conguracion invertida inestable solo se necesita conseguir que la
energa del pendulo alcance el valor:
V (q
1
, q
1
)|
q
1
=+ o q
1
=
q1=0
=
1
2
J(0)
2
+mgl(1 cos()) = 2mgl = V
0
y si tal energa se alcanza en un punto donde (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) =
(, 0) entonces aplicar un par
1
que asegure que
d
dt
V = 0 a partir de ese
instante. Notese que, de acuerdo a la gura 14.3, si V se mantiene constante
una vez que V = V
0
entonces el pendulo se seguira moviendo hasta llegar a
uno de los puntos (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) = (, 0). A continuacion se
muestra que todo este mecanismo se asegura si se usa:

1
= k
d
sat( q
1
) signo(V V
0
) (14.15)
sat( q
1
) =
_
_
_

0
, q
1
>
0

0
, q
1
<
0
q
1
, | q
1
|
0
, signo(V V
0
) =
_
_
_
+1, V > V
0
1, V < V
0
0, V = V
0
(14.16)
donde
0
y k
d
son constantes positivas arbitrarias. Sustituyendo (14.15) en
(14.14):
dV (q
1
, q
1
)
dt
= k
d
q
1
sat( q
1
) signo(V V
0
) (14.17)
A partir de (14.16) es facil darse cuenta de que el producto q
1
sat( q
1
) siempre
es positivo y es cero solo cuando q
1
= 0. As que mientras q
1
= 0 se cumple
lo siguiente:
Si V < V
0
entonces
d
dt
V > 0, por lo que la energa V aumenta.
Si V > V
0
entonces
d
dt
V < 0, por lo que la energa V disminuye.
Si V = V
0
entonces
d
dt
V = 0, por lo que la energa V permanece en el
valor V
0
.
Entonces, se asegura que la energa del pendulo V alcanza el valor necesario
para llegar a uno de los puntos (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) = (, 0). Mas
14.3 Controlador no lineal para levantar el pendulo 677
a un, la energa se mantiene en ese valor hasta que uno de dichos puntos es
alcanzado. Lo unico que falta es analizar que sucede si q
1
= 0. Notese que bajo
esa condicion el pendulo esta en reposo. Sin embargo, la unica manera de que
q
1
= 0 se mantenga para siempre es que q
1
= 0 porque solo ah el pendulo
puede permanecer en reposo. As que sera necesario aplicar al pendulo un
peque no golpe para que abandone la conguracion (q
1
, q
1
) = (0, 0).
Todo el analisis previo asegura que el pendulo alcanzara la conguracion
invertida inestable si, partiendo de la conguracion estable, se le aplica un
peque no golpe que simplemente lo saque del reposo. El lector puede darse
cuenta que todo lo anterior se mantiene sin cambio si en el controlador (14.15)
se usa sat(V V
0
) en lugar de signo(V V
0
). Dicho sea de paso, el controlador
en (14.15), (14.16) tiene sus orgenes en las ideas propuestas en [13].
Por otro lado, es importante darse cuenta de que una vez alcanzada la
conguracion invertida inestable, el controlador (14.15) no asegura que el
pendulo vaya a permanecer en dicha conguracion. Para esto es necesario
dise nar otro controlador, el cual debe ser puesto en marcha cuando el pendulo
este muy cerca de la conguracion invertida inestable. Esto signica que el
controlador en (14.15) debe ser desconectado a partir de ese momento. En la
siguiente seccion se presenta la manera de dise nar el controlador que resuelve
la segunda parte del problema de control: balancear o atrapar el pendulo en
la conguracion invertida inestable.
Finalmente, notese que nada se ha dicho acerca de lo que sucede con la
posicion y la velocidad de la rueda durante el tiempo en el cual el pendulo
es llevado hasta su conguracion invertida inestable. Dado que la rueda es
simetrica y se supone que esta balanceada, entonces la posicion de la rueda
no importa. Por otro lado, aunque la velocidad de la rueda crece de manera
desconocida durante el tiempo mencionado, sin embargo el valor de esta ve-
locidad en el momento en que el pendulo llega a su conguracion invertida
inestable siempre es es nito y, por lo tanto, todo es cuestion de que el con-
trolador que atrapa al pendulo en dicha conguracion inestable se encargue
de regular la velocidad de la rueda en el valor que esta variable tiene en el
momento en que dicho controlador entra en operacion.
Ejemplo 14.1 Sea el controlador alternativo:

1
= k
d
(V V
0
) sat( q
1
), u =
R
k
m

1
(14.18)
sat( q
1
) =
_
_
_
d, q
1
> d
d, q
1
< d
q
1
, | q
1
| d
, d =
u
max
k
m
k
d
RV
0
(14.19)
donde d, u
max
y k
d
son constantes positivas arbitrarias. Sustituyendo (14.18)
en (14.14):
dV (q
1
, q
1
)
dt
= k
d
(V V
0
) q
1
sat( q
1
) (14.20)
678 14 Control de un pendulo con rueda inercial
A partir de (14.19) es f acil darse cuenta de que el producto q
1
sat( q
1
) siempre
es positivo y es cero s olo cuando q
1
= 0. As que mientras q
1
= 0 se cumple
de nuevo lo siguiente:
Si V < V
0
entonces
d
dt
V > 0, por lo que la energa V aumenta.
Si V > V
0
entonces
d
dt
V < 0, por lo que la energa V disminuye.
Si V = V
0
entonces
d
dt
V = 0, por lo que la energa V permanece en el
valor V
0
.
Entonces, se asegura nuevamente que la energa del pendulo V alcanza el
valor necesario para llegar a uno de los puntos (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) =
(, 0).
14.4. Controlador para atrapar el pendulo
La estrategia que se utiliza para atrapar al pendulo en la conguracion
invertida inestable es un controlador lineal que es dise nado usando un modelo
lineal aproximado de (14.7). A continuacion se muestra como obtener dicha
aproximacion lineal.
Notese que el modelo en (14.7) no depende de la posicion de la rueda q
2
.
Tomando esto en consideracion se puede denir el estado como:
x =
_
_
x
1
x
2
x
3
_
_
=
_
_
q
1
q
1
q
2
_
_
, (14.21)
De (14.7) se puede escribir:
_
q
1
q
2
_
= D
1
_

_
mg sin (q
1
)
0
_
+
_
0

__
(14.22)
D
1
=
_
d
11
d
12
d
21
d
22
_
=
1
d
11
d
22
d
12
d
21
_
d
22
d
12
d
21
d
11
_
(14.23)
Notese que det(D
1
) = 0 porque se trata de la inversa de una matriz no
singular. Usando (14.21) y (14.22) el modelo en (14.7) se puede escribir como:
x = f(x, ) =
_
_
x
2
d
11
mg sin (x
1
) +d
12

d
21
mg sin (x
1
) +d
22

_
_
(14.24)
De acuerdo a la seccion 7.2.2, los puntos de operacion (x

) de (14.24) se
encuentran a partir de la condicion f(x

) = 0, es decir:
_
_
x

2
d
11
mg sin (x

1
) +d
12

d
21
mg sin (x

1
) +d
22

_
_
=
_
_
0
0
0
_
_
. (14.25)
14.4 Controlador para atrapar el pendulo 679
Es claro que:
x

2
= 0 (14.26)
Por otro lado, del segundo y tercer renglones de (14.25) se obtiene:

=
d
11
mg sin (x

1
)
d
12
(14.27)

=
d
21
mg sin (x

1
)
d
22
Igualando estas expresiones:
mg
d
12
d
22
_
d
11
d
22
d
21
d
12

sin (x

1
) = 0 (14.28)
Debido a que det(D
1
) = d
11
d
22
d
21
d
12
= 0, entonces (14.28) solo se cumple
si:
x

1
= n, n = 0, 1, 2, 3, . . . (14.29)
Sustituyendo esta condicion en cualquiera de las expresiones en (14.27) se
obtiene:

= 0 (14.30)
Finalmente, como no existe ninguna restriccion sobre x

3
se concluye:
x

3
= c. (14.31)
donde c es cualquier n umero real. De acuerdo a la seccion 7.2.2, la aproxima-
cion lineal del sistema en (14.24) en el punto de operacion (14.26), (14.29),
(14.30), (14.31), con n = 1, esta dada como:
z = Az +Bw, (14.32)
A =
f(x, )
x

=
_

_
f1
x1
f1
x2
f1
x3
f2
x1
f2
x2
f2
x3
f3
x1
f3
x2
f3
x3
_

=
_
_
0 1 0
d
11
mg 0 0
d
21
mg 0 0
_
_
,
B =
f(x, )

=
_
_
f1

f2

f3

_
_

=
_
_
0
d
12
d
22
_
_
donde:
z = x x

, (14.33)
w =

. (14.34)
son cantidades peque nas, es decir z 0, w 0. Por otro lado, recuerdese que

= 0 y, por tanto, w = . entonces se puede usar (14.10) para encontrar la


siguiente version modicada de (14.32):
680 14 Control de un pendulo con rueda inercial
z = Az +Bu (14.35)
B =
_
_
0
d
12
d
22
_
_
k
m
R
Este es el modelo lineal aproximado que sera utilizado para dise nar el contro-
lador que atrapa o balancea al pendulo en su conguracion invertida inestable.
Primero se verica si el par (A, B) es controlable. Para esto, se calcula el
determinante de la matriz de controlabilidad C = [B|AB|A
2
B] y se encuentra
que esta dado como:
det(C) =
mgk
3
m
R
3
d
2
12
(d
11
d
22
d
12
d
21
) = 0, (14.36)
Por tanto, se concluye que el par el par (A, B) es controlable. Esto signica
que siempre es posible encontrar un vector de ganancias K tal que todos los
eigenvalores de la matriz de lazo cerrado (ABK) queden ubicados en donde
se desee. Esto se consigue usando el controlador:
u = Kz (14.37)
El valor de K se calcula una vez que se conocen los valores numericos de los
parametros involucrados en las matrices A y B. Con el controlador (14.37) se
consigue atrapar el pendulo con rueda inercial en la conguracion invertida
inestable denida por el punto de operacion (14.26), (14.29), (14.30), (14.31),
con n = 1. Es importante subrayar que para esto es indispensable que el
estado x del mecanismo se encuentre sucientemente cerca de dicha congu-
racion inestable en el momento en que el controlador en (14.37) empiece a
operar.
Finalmente, es conveniente aclarar que la constante c introducida en
(14.31) toma el valor que la velocidad de la rueda tiene en el instante en
el cual el controlador (14.37) empieza operar. Como esta velocidad puede te-
ner cualquier valor, entonces es muy adecuado el hecho de que c pueda ser
cualquier constante real.
14.5. Construccion del pendulo con rueda inercial e
identicacion de sus parametros
En la gura 14.4 se presenta un dibujo detallado que muestra las partes
mecanicas utilizadas para construir el pendulo con rueda inercial. Algunas de
estas partes son introducidas con el n de realizar el acoplamiento mecanico
entre las piezas que componen al mecanismo. Tambien se incluye un enco-
der incremental y un tacometro para medir, respectivamente, la posicion del
pendulo q
1
y la velocidad de la rueda q
2
. En la tabla 14.1 se muestran los
14.5 Construccion del pendulo con rueda inercial 681
Encoder
Tacometro
Soporte del
tacometro
Motor CD
Rueda
Solera
(pendulo)
Tornillos
Manguera
de boligrafo
Dado
Soporte
del mecanismo
Base
Figura 14.4. Partes que componen al pendulo con rueda inercial construido.
Tabla 14.1. Parametros simples.
Smbolo: Descripcion: Valor: Unidades:
l1 longitud de la solera 0.117 m
a
sol
ancho de la solera 0.0254 m
m
sol
masa de la solera 0.016 Kg
mcar masa de la carcasa del actuador 0.03 Kg
msop masa del soporte del tacometro 0.01375 Kg
mrot masa del rotor del actuador 0.02 Kg
rrot radio del rotor del actuador 0.00915 m
mrue masa de la rueda 0.038 Kg
rrue radio de la rueda 0.0189 m
R resistencia de armadura 4.172 Ohm
L inductancia de armadura 0.0009 H
k
b
constante de fuerza contra electromotriz 0.00775 Vs/rad
km constante de par 0.00775 Nm/A
682 14 Control de un pendulo con rueda inercial
parametros medidos de las piezas que componen al pendulo con rueda inercial
as como del motor de CD utilizado como actuador.
La masa equivalente del primer grado de libertad m
1
se dene como:
m
1
= m
sol
+m
car
+m
sop
= 0.05975 [Kg]. (14.38)
Para calcular el centro de masa del primer grado de libertad con todos sus
componentes, se aplica el principio de la balanza (la suma de pares en el punto
de apoyo debe de ser igual a cero), por tanto al aplicar un peso equivalente
a una distancia l
c1
en el extremo opuesto de la solera, el arreglo de la gura
14.5 debe quedar balanceado. Usando (14.38) y los datos de la tabla 14.1 se
tiene que:
l
c1
=
m
sol
l1
2
+m
car
l
1
+m
sop
l
1
m
1
= 0.10133 [m]. (14.39)
Figura 14.5. Esquema para calcular lc1.
El momento de inercia de una placa rectangular de masa m, ancho b y
largo d con eje de rotacion x colocado sobre una direccion perpendicular al
plano de lados b y d y que pasa por su centro esta dado como [14], [15], pag.
271:
I
x
=
1
12
m(b
2
+d
2
) (14.40)
Usando (14.40) y los datos de la tabla 14.1 se obtiene el momento de inercia
I

como:
I

=
1
12
m
sol
(a
2
sol
+l
2
1
) = 0.0000191122 [Kg m
2
] (14.41)
Sin embargo, el momento de inercia I
1
esta denido alrededor de un eje que
pasa por el centro de masa del pendulo ubicado a una distancia l
c1
l
1
/2 del
centro de la cara de lados b y d. De acuerdo al teorema del eje paralelo o de
Steiner [14], [15], pag. 272:
I
1
= I

+m
sol
_
l
c1

l
1
2
_
2
= 0.000048463 [Kg m
2
]
Por otro lado, el momento de inercia de un disco de masa m y radio r con
un eje de rotacion x colocado a traves de su centro y que es perpendicular al
disco esta dado como [14], [15], pag. 271:
14.5 Construccion del pendulo con rueda inercial 683
I
x
=
1
2
mr
2
(14.42)
Con los datos de la tabla 14.1 y la expresion (14.42) se tiene que el momento
de inercia de la rueda I
rue
esta dado como:
I
rue
=
1
2
m
rue
r
2
rue
= 0.000006787 [Kg m
2
] (14.43)
El momento de inercia de un cilindro de masa m, radio a y altura l con un
eje de rotacion x colocado a traves de su eje longitudinal esta dado como [14],
[15], pag. 271:
I
x
=
1
2
ma
2
. (14.44)
Usando la expresion (14.44) y los datos de la tabla 14.1 se tiene que el momento
de inercia del rotor del actuador I
rot
esta dado como:
I
rot
=
1
2
m
rot
r
2
rot
= 0.000000837225 [Kg m
2
] (14.45)
La masa equivalente del segundo grado de libertad m
2
se dene como:
m
2
= m
rot
+m
rue
= 0.058 [Kg] (14.46)
Usando (14.43) y (14.45) se tiene que el momento de inercia del segundo grado
de libertad I
2
esta dado como:
I
2
= I
rue
+I
rot
= 0.0000076242 [Kg m
2
] (14.47)
Finalmente con los datos de la tabla 14.1, los parametros en (14.41), (14.38),
(14.39), (14.46), (14.47) y g = 9.81[m/s
2
], se tiene que los valores numericos
de los parametros del modelo (14.7) son:
d
11
= 0.0014636, d
12
= 0.0000076, (14.48)
d
21
= 0.0000076, d
22
= 0.0000076, (14.49)
mg = 0.12597 (14.50)
Es importante mencionar que la masa del tacometro se considera dentro de
la masa del soporte del tacometro, ademas de que el efecto del rotor del
tacometro se considera despreciable en el calculo de la inercia I
2
. Esto debido
a que tiene una masa menor a los 0.0001[Kg] y un radio menor a los 0.001
[m]. Por otro lado, los tornillos de sujecion del dado, el dado (de plastico)
y el eje del encoder incremental se desprecian para el calculo de la inercia
I
1
. Esto debido a que la suma de las masas de estos componentes es menor
a los 0.008[Kg] y, lo mas importante, estan directamente en el eje de giro
del pendulo por lo que los radios inerciales son muy peque nos y el efecto
inercial producido es despreciable. Finalmente, la masa de los dos alambres
conductores (tanto del actuador como del tacometro), as como la masa de
la manguera de bolgrafo (de plastico) usada para acoplar el tacometro a la
rueda, no fueron consideradas en el modelado del prototipo experimental.
684 14 Control de un pendulo con rueda inercial
Ejemplo 14.2 A continuaci on se presenta la simulaci on, usando SIMU-
LINK, del pendulo con rueda inercial con los controladores (14.18) y (14.37).
Primeramente se muestra el programa de matlab que se encarga de cargar los
valores numericos de las constantes que usar a la simulaci on:
clc,clear all;
% Constantes del Motor
R=4.172;
km=0.00775;
Umax=13;
% Modelo del IWP
g=9.81;
mgl=0.12597;
mbg=mgl
d11=0.0014636;
d12=0.0000076;
d21=d12;
d22=d21;
J= (d11*d22-d12*d21)/d12;
D=[d11 d12;d21 d22];
Di=inv(D);
di11=Di(1,1)
di12=Di(1,2)
di21=Di(2,1)
di22=Di(2,2)
%Matrices del IWP linealizado en el punto de operacion
A=[0 1 0;di11*mbg 0 0;di21*mbg 0 0]
B=[0;di12*km/R;di22*km/R]
%Determinar la Controlabilidad
disp(El sistema es controlable?); Pc=ctrb(A,B); if rank(Pc) ==
size(Pc)
disp(Si.);
else
disp(No.);
end
%Controlador No-Lineal
Kd=20;
V0=2*mbg
d=(Umax*km)/(R*Kd*V0)
%Control por retroalimentacion de estado en punto de operacion
n=1
c=-570
xd=[n*pi 0 c]
%valores propios deseados en lazo cerrado
lambda1= -9.27 + 20.6i;
lambda2= -9.27 - 20.6i;
lambda3= -0.719;
Vp=[lambda1 lambda2 lambda3]
K = place(A,B,Vp)
14.5 Construccion del pendulo con rueda inercial 685
%Verificar los valores propios de lazo cerrado
Vp_=eig(A-B*K)
Una vez que se ha ejecutado el programa anterior, ya es posible ejecutar
la simulaci on. En la gura 14.6 se muestra el diagrama de SIMULINK con
las conexiones necesarias para simular el pendulo con rueda inercial con el
controlador no lineal (14.18) y con el controlador lineal (14.37).
Figura 14.6. Diagrama para simular el IWP en SIMULINK.
En la parte central de la gura 14.6 est a armado el pendulo con rueda
inercial partiendo de la ecuaci on de estado no lineal (14.24) con =
km
R
u. En
la parte superior de la gura 14.6 est a armado el controlador no lineal (14.18),
mientras que en la parte inferior de la misma gura se encuentra armado el
controlador lineal (14.37). Para que la simulaci on no se quede atascada en el
reposo de la posici on vertical no invertida, se le puso al segundo integrador
una condici on inicial de 0.00001[rad/s].
En la gura 14.7 se muestra la evoluci on en el tiempo de cada uno de los
elementos del estado x, as como el voltaje u aplicado al motor del IWP.
Finalmente en la gura 14.8 se observa el valor de la energa deseada V
0
,
y la evoluci on tanto de de la energa V como de la diferencia (V V
0
).
686 14 Control de un pendulo con rueda inercial
Figura 14.7. Visualizacion de la simulacion en osciloscopio 1.
Figura 14.8. Visualizacion de la simulacion en osciloscopio 2.
14.6 Construccion del controlador 687
14.6. Construccion del controlador
Usando los valores numericos de la seccion 14.5, considerando k
d
= 1 y
de acuerdo a (14.11), (14.15) se obtiene el controlador que levanta el pendulo
hasta su conguracion invertida inestable:
V = C
1
q
2
1
+mg(1 cos(q
1
)), C
1
=
1
2
J, V
0
= 2mg,
u = C
2
sat( q
1
) signo(V V
0
), C
2
=
Rk
d
k
m
,
0
=
u
max
k
m
k
d
R
, (14.51)
donde u
max
= 13[V], mientras que las constantes C
1
y C
2
se calculan una sola
vez en la inicializacion del programa del controlador, para reducir el n umero
de multiplicaciones necesarias en la implementacion.
Por otro lado, de acuerdo a las secciones 7.13.1 y 7.13.2, en el captulo
7, se encuentra que el uso del controlador lineal (14.37) junto con el vector
de ganancias K = [k
1
, k
2
, k
3
] = [340, 11, 0.0085] ubica los eigenvalores
de la matriz (A BK) en los siguientes valores:

1
= 5.8535 + 17.7192j,

2
= 5.8535 17.7192j y

3
= 0.5268. Por tanto, el controlador (14.37)
queda expresado como:
u = k
1
(q
1
q
1d
) k
2
q
1
k
3
( q
2
q
2d
) (14.52)
donde se usa cualquiera de los valores q
1d
= + o q
1d
= , dependiendo
de a cual valor se acerca primero q
1
. Recuerdese que q
2d
= c es el valor que
tiene la velocidad de la rueda en el momento en que el controlador en (14.52)
empieza a operar.
Defnase la condicion:
(q
1
q
1d
)
2
+ q
2
1
< (14.53)
para alguna constante > 0 sucientemente peque na y q
1d
= + o q
1d
= .
Esta condicion signica que el pendulo se encuentra muy cerca de uno de los
puntos (q
1
, q
1
) = (+, 0) o (q
1
, q
1
) = (, 0). Esta cercana se puede ajustar
proponiendo (en esta implementacion se manejo = 0.3).
La estrategia de control para levantar y atrapar el pendulo con rueda
inercial consiste en utilizar (14.51) hasta que se cumpla (14.53) y a partir
de ese momento desconectar (14.51) y empezar a utilizar (14.52). Para rea-
lizar esta tarea se utiliza el microcontrolador PIC18F4431 de Microchip. A
continuacion se explica como se hace esto. Antes que nada se debe aclarar
que no es el proposito presentar toda una exposicion de como trabaja este
microcontrolador. Lo que se presenta es una descripcion de los recursos de
este microcontrolador que se utilizan para construir la estrategia de control
(14.51), (14.52), (14.53).
Al nal de este captulo se presenta un listado del programa utilizado. El
microcontrolador PIC18F4431 [16] es de tecnologa ash, tiene una velocidad
de operacion maxima de 40 MHz (en este captulo se usa un cristal de 11
688 14 Control de un pendulo con rueda inercial
MHz ya que el circuito esta armado en tarjeta de pruebas). Cuenta con cinco
puertos de entrada-salida congurables, tres temporizadores de 16 bits y uno
de 8 bits (el temporizador de 8 bits es utilizado para establecer el periodo
de muestreo: T
s
= 0.01 s), nueve canales Analogico-Digital de 10 bits (por el
canal cero se recibe la se nal del tacometro). Tambien cuenta con ocho canales
PWM (modulacion de ancho de pulso) de 14 bits de los cuales en este captulo
se usa el CCP1 congurado para trabajar en 8 bits para entregar el voltaje
de control a la planta.
La posicion q
1
se mide usando un codicador incremental optico modelo
CP-360-S de Computer Optical Products Inc. [17]. Este dispositivo ya conec-
tado al microcontrolador tiene una resolucion de 1440 cuentas por revolucion.
El codicador incremental es ledo a traves de los pines 5 y 6 del canal A
(vease la gura 14.9). Las cuentas del codicador incremental son recibidas
en dos bytes (de 8 bits cada uno) llamados POSCNTH, el mas signicativo, y
POSCNTL, el menos signicativo. El valor real de la cuenta se puede calcular
como:
pos = 256 POSCNTH +POSCNTL
lo cual es equivalente a hacer 8 corrimientos de POSCNTH hacia la izquierda
para luego sumar POSCNTL. La instruccion q1=(signed long)pos asigna a
la variable q1 el valor numerico de la cuenta que incluye el signo correspon-
diente, es decir positivo si el movimiento es como el mostrado en la gura
14.2 o negativo en caso contrario. Finalmente, la posicion q
1
es obtenida en
radianes mediante la operacion:
q
1
=
2
1440
q1,
2
1440
= 0.004363
Es importante mencionar que con el n de obtener una lectura correcta de
q
1
, que represente elmente la convencion descrita en la gura 14.2 para la
medicion de q
1
, es necesario energizar el sistema de control cuando el pendulo
este en la conguracion de reposo que de acuerdo a la gura 14.2 corresponde
a q
1
= 0. Lo anterior es para que los registros de posicion queden inicializados
en cero cuando el sistema se encuentre en dicha posicion. La velocidad del
pendulo q
1
se calcula a partir de la medicion de q
1
, usando diferenciacion
numerica, es decir:
q
1
=
q
1
(k) q
1
(k 1)
T
(14.54)
donde k representa el tiempo discreto, q
1
representa el estimado de la velocidad
del pendulo en radianes por segundo mientras que T
s
= 0.01 s[seg] es el
periodo de muestreo utilizado. De este modo q
1
(k) indica el valor de q
1
que
se mide en el instante de muestreo actual y q
1
(k 1) indica el valor de q
1
que
se midio en el instante de muestreo previo.
La velocidad de la rueda q
2
se mide usando un tacometro modelo 34PC.
Se trata de un motor de CD tipo miniatura de los utilizados en los telefonos
14.6 Construccion del controlador 689
celulares como vibrador. El voltaje que entrega el tacometro se ltra utilizando
el circuito RC que se muestra en la gura 14.9.
Se encontro que el tacometro utilizado entrega 0.58[V] cuando la veloci-
dad es maxima e igual a 1634 radianes por segundo. Se supuso que cualquier
valor intermedio vara de manera proporcional. Con el n de mejorar la re-
solucion con que se mide esta velocidad se uso el divisor de tension que se
conecta al pin 4 (ver gura 14.9) para jar en 3.8372[V] el valor mnimo del
rango analogico del canal 0 del convertidor analogico-digital (el valor maxi-
mo esta jo en 5[V]). Por otro lado, el tacometro se conecto en serie a otro
divisor de tension de manera que cuando el tacometro esta en reposo (cuan-
do q
2
= 0) el voltaje leido por el canal 0 del convertidor analogico-digital
es de (5-3.8372)/2+3.8372=4.4186[V]. Notese que de esta manera se permi-
ten variaciones de aproximadamente 0.58[V] (es decir 1634 radianes por se-
gundo) hacia arriba y hacia abajo del punto medio del rango analogico del
convertidor analogico-digital. As que cuando q
2
= 1634[rad/s] el convertidor
analogico-digital entrega la cuenta 1023 = 2
10
1 (el convertidor AD es de
10 bits) y cuando q
2
= 0[rad/s] el convertidor analogico-digital entrega la
cuenta 1023/2 = 511. Cuentas menores a 511 representan valores negativos
de q
2
. De acuerdo a esta informacion, la velocidad de la rueda se calcula del
siguiente manera. La instruccion vel=read-adc()-511 asigna a la variable
vel el codigo correspondiente a la velocidad de la rueda mientras que las
instrucciones q2 p=(signed long)vel y q2 p=3.2039*q2 p consiguen asig-
nar a la variable q2 p un valor que es numericamente igual a la velocidad de
la rueda q
2
en radianes por segundo (incluyendo su signo). Notese que la cons-
tante 3.2039=1634/510[(rad/s)/cuenta] representa la ganancia del sistema de
medicion.
Con esta informacion se calcula cualquiera de las expresiones en (14.51) o
(14.52), seg un sea el caso. El valor de la variable u as obtenida se enva al
PWM del microcontrolador como se describe a continuacion.
Una manera equivalente de implementar la funcion saturacion en (14.51)
con un menor numero de operaciones se realiza sabiendo que u solo tomara va-
lores en el rango de -13 a +13 volts, por lo que su valor se satura por software
para restringirlo a ese rango de valores utilizando instrucciones como las si-
guientes:
if u > 13 then u = 13
if u < 13 then u = 13
Como la resolucion del PWM es de 2
8
1 = 255 cuentas, entonces la si-
guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de u al amplicador de potencia de la planta:
cuenta =
255
13
abs(u)
donde abs(u) representa el valor absoluto de u. El signo de u es almacenado
en dos bits de control. La se nal del PWM se entrega a un puente H (L293B
690 14 Control de un pendulo con rueda inercial
Figura 14.9. Diagrama electrico del sistema de control.
de SGS-Thomson Microelectronics) que se encarga de amplicar convenien-
temente la potencia de la se nal del PWM. Este puente H esta alimentado
con una fuente de potencia de 15.3[V]. Sin embargo, de acuerdo a la hoja de
datos de este dispositivo [18] las cadas de voltaje en el mismo determinan
que en las terminales del motor solo sean aplicados 13[V]. Este dispositivo
tiene dos bits a traves de los cuales se le indica el signo del voltaje que debe
entregar. Para ello, el signo de u se enva al puente H a traves de los bits 0 y
1 del canal D. Esto signica que el voltaje promedio que el puente H entrega
14.7 Resultados experimentales 691
a las terminales del motor solo vara en el rango de -13 a +13 volts. As, se
asegura que en las terminales del motor de CD se aplica un voltaje u cuyo
promedio es numericamente igual al valor de u calculado con cualquiera de
las expresiones en (14.51) o (14.52). Esto es importante porque asegura que la
construccion practica del controlador respeta el dise no indicado por los con-
troladores correspondientes. En la gura 14.9 se muestra el diagrama electrico
usado para construir la estrategia de control (14.51), (14.52), (14.53) en base
al microcontrolador PIC18F4431. Resulta interesante observar la sencillez del
hardware utilizado.
14.7. Resultados experimentales
En las guras 14.10, 14.11, 14.12, 14.13 y 14.14 se muestran los resultados
experimentales obtenidos. Es importante recordar que es necesario aplicar al
principio un peque no golpe sobre el pendulo de manera que se abandone el
punto (q
1
, q
1
) = (0, 0). Aunque esto se puede evitar si se enva al principio, a
traves del programa, un peque no pulso de voltaje al motor, sin embargo no
se programo la tarea de esta manera.
En la gura 14.10 se muestra como oscila el pendulo, con amplitudes cada
vez mayores, hasta alcanzar la posicion q
1
= con velocidad cero en t 14[s]
y que permanece en esa posicion para todo tiempo futuro. En la gura 14.11
se observa que la velocidad de la rueda permanece constante en un valor de
380[rad/s] a partir de t 17[s]. Aqu es interesante aclarar que la velocidad
de la rueda es regulada en un valor c 150[rad/s] que es el valor de la rueda
en t 14[s], instante en el que el controlador (14.52) empieza a funcionar.
La diferencia entre c y la velocidad nal de la rueda 380[rad/s] se debe a
la friccion existente en la rueda y que no ha sido considerada en el dise no
realizado en este captulo.
En la gura 14.12 se muestra la se nal de control u. Notese que esta variable
se satura la mayor parte del tiempo durante la etapa en la cual el pendulo es
levantado (t < 14[s]). Esta es la razon por la cual se usan funciones saturacion
y signo en el controlador (14.51). De hecho el valor de
0
= 0.024 se selecciona
de manera que con este valor y el factor
4.172
0.00775
, el valor de u se sature en
13[V].
En la gura 14.13 se muestra como se mueve el pendulo en el mismo plano
que se denio en la gura 14.3 de la seccion 14.3. Es claro que, comparando
ambas guras, el pendulo se mueve de manera que su energa V crece al pasar
el tiempo (tambien vease la gura 14.14) hasta que V = V
0
= 0.2519. Notese
que V alcanza dicho valor desde t 11[s] y sin embargo el pendulo es atrapado
o balanceado hasta t 14[s]. Esta es una prueba de que la energa es regulada
en V = V
0
hasta que se alcanza el punto (q
1
, q
1
) = (, 0). Es claro que el
pendulo tambien pasa cerca del punto (q
1
, q
1
) = (+, 0) en t 13[s] pero no
es atrapado, seguramente porque la condicion en (14.53) no fue satisfecha en
692 14 Control de un pendulo con rueda inercial
q
1
rad [ ]
tiempo s [ ]
Figura 14.10. Posicion del pendulo conforme se alcanza la conguracion invertida
inestable.
tiempo s [ ]
rad=s [ ]
q
2
Figura 14.11. Velocidad de la rueda.
14.7 Resultados experimentales 693
u
V [ ]
tiempo s [ ]
Figura 14.12. Voltaje aplicado al motor.
q
1
q
1 rad [ ]
rad=s [ ]
Figura 14.13. Evolucion del pendulo en el plano q1 q1 (plano de fase).
694 14 Control de un pendulo con rueda inercial
V
J [ ]
tiempo s [ ]
Figura 14.14. Variacion de la energa conforme se alcanza la conguracion invertida
inestable.
ese momento, es decir, el pendulo no paso sucientemente cerca como para
ser atrapado.
Finalmente, en la gura 14.15 se muestra una fotografa donde se observa
al pendulo controlado en la conguracion invertida inestable.
Figura 14.15. El pendulo con rueda inercial controlado en su conguracon inver-
tida inestable.
14.7 Resultados experimentales 695
Programacion del microcontrolador PIC18F4431
Se recomienda consultar la referencia [19] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
//Programa controlar pendulo con rueda inercial para PCW V3.203
#include<18f4431.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>
#fuses HS,NOWDT,NOPROTECT,PUT,NOLVP,NOBROWNOUT,NOWRTC,MCLR,SSP_RC
#define pi_ 3.14159
//ganancia del controlador no lineal
#define kd 1.0
//ganancias del controlador lineal
#define k1 340
#define k2 11
#define k3 0.0085
//parametros
#define mbg 0.12597
#define R 4.172
#define L 0.0009
#define Kb 0.00775
#define Km 0.00775
#define d11 0.0014636
#define d12 0.0000076
#define d21 0.0000076
#define d22 0.0000076
#define delta 0.3
#define ts 0.01
//con timer=108, cada cuenta vale (4/FXtal)*256 seg
/*DIRECCIONES DE REGISTROS DE INTERES*/
#use delay(clock=11000000)
//Base de tiempo para retardos (11 MHz)
#byte porta = 0xf80
//direcciones de los puertos
#byte portb = 0xf81
#byte portc = 0xf82
#byte portd = 0xf83
#byte portd = 0xf84
#byte TMR0H = 0xfd7
#byte TMR0L = 0xfd6
696 14 Control de un pendulo con rueda inercial
#byte T0CON = 0xfd5
#byte INTCON= 0xff2
#byte TMR5H=0xf88
//Conteo de Encoder Parte alta
#byte TMR5L=0xf87 //Conteo de Encoder Parte Baja
#byte QEICON=0xfB6 //Registro de Configuracion de Modulo de
//Cuadratura
#byte T5CON=0xfB7 //Registro de configuracion de TIMER 5
#byte POSCNTL=0xF66 //CAP2BUFL (registro de cuentas parte baja)
#byte POSCNTH=0xF67 //CAP2BUFH (registro de cuentas parte alta)
#byte CAP1CON=0xF63 //Registro configuracion para reset de base de
//tiempo de captura
#byte PIE3=0xFA3
/*DIRECCIONES DE BITS DE INTERES*/
#bit VCFG1=0xfc1.7 //Bit de configuracion del ADC
#bit PD0=0x0f83.0 //control CCW de puente H
#bit PD1=0x0f83.1
//control CW de puente H
#bit PD2=0x0f83.2
//led en protoboard
#bit PD3=0x0f83.3 //led en protoboard
/*DECLARACION DE VARIABLES*/
float u,q1,q1_p,q1_1,q2_p,q1_d,q2_pd,gr,V,S,nf,i_ts,Je2,V0,RKdeKm;
long pos,vel,inter;
int pwm;
signed int n,mod;
/*PROGRAMA PRINCIPAL*/
void main(void)
{
set_tris_a(0b11111111);
//Configurando E/S de los puertos
set_tris_b(0b00000000);
set_tris_c(0b10000000);
set_tris_d(0b00000000);
portb=0X00;
portc=0X00;
portd=0X00;
//CONFIGURANDO PWM
setup_ccp1(CCP_PWM);
14.7 Resultados experimentales 697
setup_ccp2(CCP_PWM);
setup_timer_2(T2_DIV_BY_16,255,1);
// Configurando lectura del encoder
QEICON=QEICON | (0b00010101);
QEICON=QEICON & (0b01110101);
T5CON=T5CON | (0b00011001);
T5CON=T5CON & (0b10011101);
CAP1CON=CAP1CON | (0b01001111);
setup_timer_1(T1_INTERNAL | T1_DIV_BY_8);
TMR5L=0;
TMR5H=0;
POSCNTL=0;
POSCNTH=0;
//Configurando el ADC
setup_port_a(sAN0);
setup_adc(ADC_CLOCK_INTERNAL);
set_adc_channel(0);
delay_us(50);
VCFG1=1; //-Vref=AN2
INTCON=0;//Apagando interrupciones
//Configurando el timer 0
TMR0L=0;
T0CON=0xC7;
//inicializando variables
i_ts=1/ts;
Je2=(d11*d22-d12*d21)/(2*d12);
V0=2*mbg;
RKdeKm=R*Kd/Km;
q1=0.0;
q1_1=0.0;
q2_pd=0.0;
while (TRUE)
{
PD3=1; //inician calculos del control
q1_1=q1; //actualizando la q1(k-1)
pos=POSCNTH;//registros de posicion en una variable
pos=pos<<8;
pos=pos+POSCNTL;
q1=(signed long)pos;
q1=0.004363*q1; //posicion del brazo en radianes
q1_p=(q1-q1_1)*i_ts; //calculando velocidad del brazo
vel=read_adc()-511; //calculando velocidad de la rueda
q2_p=(signed long)vel;
q2_p=3.2039*q2_p; //velocidad de la rueda en rad/seg
//calculo de q1 deseada
n=q1/pi_;
nf=(float)n;
mod=n%2;
698 14 Control de un pendulo con rueda inercial
if(nf==0)
if(q1>=0) // valor deseado por lado llegada
q1_d=pi_;
else
q1_d=-pi_;
if((nf!=0)&&!PD2)
{
if(q1>=0) // valor deseado por lado llegada
{
if(mod==0)
q1_d=pi_*(nf+1.0);
else
q1_d=pi_*nf;
}
else
{
if(mod==0)
q1_d=pi_*(nf-1.0);
else
q1_d=pi_*nf;
}
}
//fijando zona de operacion de cada controlador
if((q1-q1_d)*(q1-q1_d) + q1_p*q1_p < delta)
{
PD2=1; //calculando control lineal
u= k1*(q1-q1_d) + k2*q1_p + k3*(q2_p-q2_pd);
}
else
{
PD2=0; //calculando control no lineal
V=Je2*q1_p*q1_p+mbg*(1-cos(q1));
V=V-V0;
S=0; //funcion signo
if(V>0)
S=1.0;
if(V<0)
S=-1.0;
u=RKdeKm*q1_p*S; //termina controlador no lineal
q2_pd=q2_p; //velocidad deseada de la rueda
}
//saturacion 13V(15.3 V - 2.3 V de caida en puente H = 13 V)
if(u>13)
u=13;
if(u<-13)
u=-13;
//escalamiento de salida, pwm de 8 bits a 13 V
u=19.6*u;
//piloteando sentido de giro del motor
14.9 Preguntas de repaso 699
if(u>=0)
{
PD0=1;
PD1=0;
}
else
{
PD0=0;
PD1=1;
}
//actualizando el valor del pwm
pwm=(unsigned int)abs(u);
set_pwm1_duty(pwm); //actualizando el valor del pwm
PD3=0; //terminan calculos del control
while(TMR0L<108); //cada cuenta vale (4/FXtal)*256 seg
TMR0L=0;
T0CON=0xC7;
} //cierre del while infinito
} //cierre del main
14.8. Resumen
En este captulo se le ha presentado al lector otro sistema no lineal subac-
tuado conocido como el pendulo con rueda inercial. Se ha mostrado tambien
el modelo matematico del sistema, y en una forma sencilla, se han tratado dos
controladores no lineales que son utiles para la tarea de levantar el pendulo
con rueda inercial. Basados en los captulos previos del libro, se utilizo un con-
trolador por retroalimentacion completa del estado para la tarea de atrapar
el pendulo con rueda inercial linealizado en su posicion vertical invertida. Con
la nalidad de claricar en su mayora los aspectos involucrados en llevar los
conocimientos teoricos a la practica, se mostro la construccion e identicacion
de los parametros de un sistema pendulo con rueda inercial prototipo. Se ha
nalizado con la electronica y la programacion de los dispositivos necesarios
para la realizacion de experimentos con el prototipo del pendulo con rueda
inercial construido.
14.9. Preguntas de repaso
1. Diga que grado de libertad del IWP es no actuado.
2. Por que el IWP tuvo que oscilar varias veces antes de alcanzar la posici on
vertical invertida?
3. Que hubiera sucedido si el voltaje u
max
en lugar de ser de 13[V] fuera de
7[V].?
700 14 Control de un pendulo con rueda inercial
4. Cuanto vale la frecuencia de corte en [rad/s] y en [Hz] del ltro RC del
tacometro mostrado en la gura 14.9?
5. Por que mientras el sistema de control esta levantando el IWP la se nal
de voltaje de la gura 14.7 va dismunuyendo su amplitud?
6. Por que mientras el sistema de control esta levantando el IWP la se nal
de voltaje de la gura 14.12 mantiene su amplitud entre 13[V] y -13[V]?
7. Identique en que lnea del programa del microcontrolador se manda apa-
gar el led conectado a la terminal 22 del PIC18F4431.
Referencias
1. R. Kelly, V. Santiba nez, and A. Loria, Control of robot manipulators in joint
space, Springer, London, 2005.
2. M. W. Spong, P. Corke, and R. Lozano, Nonlinear control of the reaction wheel
pendulum, Automatica, vol. 37, no. 11, pp. 1845-1851, 2001.
3. R. Olfati-Saber, Global stabilization of a at underactuated system: the inertia
wheel pendulum, Proc. of the 40th IEEE Conf. on Decision and Control, Orlando,
Florida, pp. 3764-3765, 2001.
4. R. Ortega, M. W. Spong, F. Gomez-Estern and G. Blankenstein, Stabilization
of a class of underactuated mechanical systems via interconnection and damping
assignment, IEEE Transactions on Automatic Control, vol. 47, no. 8, pp. 1218-
1233, 2002.
5. S. Afkhami, M. J. Yazdanpanah, and P. J. Maralani, Stabilization of inertia wheel
pendulum using output feedback back-stepping, Proc. of IEEE Conf. on Control
Applications, vol. 2, pp. 977-982, 2003.
6. D. M. Alonso, F. I. Robbio, E. E. Paolini, and J. L. Moiola, Modelling an inertia
wheel pendulum benchmark, Mathematical and Computer Modelling of Dynamical
Systems, vol. 11, no. 3, pp. 255-272, 2005.
7. R. Kelly and R. Campa, IDA-PB control of the inertia wheel pendulum: the
Lagrangian approach (in Spanish), Revista Iberoamericana de Automatica e In-
formatica Industrial, vol. 2, no. 1, pp. 36-42, 2005.
8. V. Santiba nez, R. Kelly, and J. Sandoval, Control of the inertia wheel pendulum
by bounded torques, Proc. of the 44th IEEE Conf. on Decision and Control, and
European Control Conf. CDC-ECC 05, Seville, Spain, pp. 8266-8270, 2005.
9. M. Abrahantes, J. Mulder, and K. Butter, Modeling, identication and control
of an under actuated inertial wheel pendulum, Proc. of the 39th Southeastern
Symposium on System Theory, Macon, Georgia, pp.1-5, 2007.
10. N. Qaiser, N. Iqbal, A. Hussain, and N. Qaiser, Exponential stabilization of a
class of underactuated mechanical systems using dynamic surface control, Inter-
national Journal of Control, Automation, and Systems, vol. 5, no. 5, pp. 547-558,
2007.
11. R. V. Carrillo-Serrano and V. M. Hernandez-Guzman, Control of the inertia
wheel pendulum taking into account the actuator dynamics, International Journal
of Innovative Computing, Information and Control, vol. 6, no. 12, pp. 5553-5563,
2010.
702 Referencias
12. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
13. A.L. Fradkov, P.Y. Guzenko, D.J. Hill, and A.Y. Pogromsky, Speed gradient
control and passivity of nonlinear oscillators, Proc. 3rd. IFAC Symposium on Non-
linear control systems (NOLCOS95), vol. 2, pp. 655-659, 1995.
14. Hibbeler R. C., 2004, Mecanica vectorial para ingenieros. Dinamica, (10a. edi-
cion), Pearson Educacion, Mexico.
15. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
16. PIC18F4431 Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2007.
17. CP360S Housed Encoder, Computer Optical Products Inc.,
www.opticalencoder.com.
18. L293B Push-Pull Four channel drivers, Data sheet, SGS-Thomson Microelec-
tronics, 1993.
19. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.

Indice alfabetico
Adelanto de fase, 314
Ancho de banda, 337
Atraso de fase, 315
Bode
gracas de, 294
Ceros, 145
lazo abierto de, 224
lazo abierto, efecto de, 231, 335
Circuito de se nal peque na, 473
Compensadores de adelanto, 320
Componentes de frecuencia cero, 305
Componentes de frecuencias grandes,
303
Condicion
angulo de, 224
magnitud de, 224
Conexion
en cascada, 179
en lazo cerrado, 181
en paralelo, 180
Constante de tiempo, 103, 337
Control de corriente, 504
Controlabilidad
denicion, 414
prueba, 414
Criterio de Nyquist
caso especial, 332
caso general, 333
Decada, 309
Decibeles, 294
Disipador, 27
Ecuacion de Shockley, 475
Ecuacion dinamica
ecuacion de estado, 396
ecuacion de estado no lineal, 399
ecuacion de salida, 396
lineal invariante en el tiempo, 396
solucion, 411
Ecuaciones de Euler-Lagrange, 647, 672
Eigenvalores, 409
Energa, 17
almacenada en un resorte, 22, 24
cinetica, 20, 23, 648, 672, 674
de un campo magnetico, 41
en sistemas de uidos, 18
en sistemas electricos, 18
en sistemas mecanicos rotativos, 18
en sistemas mecanicos traslacionales,
18
en un capacitor, 26
en una inductancia, 25
magnetica, 579
potencial, 650, 673, 674
Entrada, 102, 145
Entrada de prueba
escalon, 202
parabola, 203
rampa, 202
Espectro de frecuencias, 301
Estabilidad, 145, 413
marginal, 145
Estado, 395
estimado del, 431
704

Indice alfabetico
Factor de amortiguamiento, 122, 338
Filtro
pasa altas, 314
pasa bajas, 294, 315
Fracciones parciales expansion en, 113
races complejas conjugadas distintas,
135
races complejas conjugadas repeti-
das, 140
races reales distintas, 100, 125
races reales repetidas, 110, 130
Frecuencia
de cruce de fase, 335
de cruce de ganancia, 334, 338
de esquina, 310, 337
Frecuencia natural amortiguada, 123
Frecuencia natural no amortiguada, 123
Fuerza magnetica, 579
Funcion constitutiva, 20, 2224, 27
Funcion de transferencia, 144
de ganancia unitaria en estado
estacionario, 104, 122, 146
estable, 145
fase de una, 308
inestable, 145
lazo abierto de, 223
lazo cerrado de, 222
magnitud de una, 308
marginalmente estable, 145
Inestabilidad, 145
LHopital regla de, 131
Ley de Faraday, 25, 39, 578
Ley de Hooke, 22, 24
Ley de Kirchho de corrientes, 70
Ley de Kirchho de Voltajes, 67, 578
Ley de la Conservacion de la Materia,
105
Ley de Lenz, 39
Ley de Ohm, 30
MagLev, 576
Margen
fase de, 334, 338
ganancia de, 335
Matriz no singular, 408
Microcontrolador
PIC16F877A, 558, 657
PIC18F4431, 687
Modelo lineal aproximado, 403
Modulador por ancho de pulso, PWM,
587, 591
Objetivo de un sistema de control, 222
Observabilidad
denicion, 416
prueba, 416
Pico de resonancia, 310, 337
Polares
gracas, 297
Polinomio caracterstico, 102, 145
Polos, 104, 144
de lazo abierto, efecto de, 230, 335
lazo abierto de, 224
lazo cerrado de, 223
Potencia
disipada por la friccion viscosa, 28
disipada por un resistencia electrica,
30
instantanea, 17
Principio de superposicion, 181
Puerto, 16, 17, 32
Punto de equilibrio, 401
Punto de operacion, 402, 474
Rango de una matriz, 409
Resonancia, 143, 316
Respuesta
en estado estacionario, caractersticas
de, 222
forzada, 101, 111, 116, 126
natural, 101, 111, 116, 126
transitoria, caractersticas de, 222
Ruido, 305, 315
Salida, 102, 145
Segunda Ley de Newton, 20, 22, 579
Series de Fourier, 301
Sistema de control en lazo cerrado, 181,
201, 222
Sistema inestable, 577
Sobre paso, 118
Teorema
valor nal del, 99
Tercera Ley de Newton, 43
Tiempo de subida, 118, 337

Indice alfabetico 705


Tipo de un sistema, 201
Transformacion lineal, 425
Transformada
Laplace de, 98
Fourier de, 301
Trayectoria de Nyquist, 330
modicada, 333
Variables de estado
criterio de seleccion, 395
denicion, 395
Variables generalizadas
acumulacion de esfuerzo, 19, 21, 23,
25
acumulacion de ujo, 19, 20, 23, 26
esfuerzo, 17
ujo, 17
Vectores
linealmente dependientes, 407
linealmente independientes, 407
Control Automatico
Teora de dise no, construccion de prototipos,
modelado, identicacion y pruebas experimentales
Hecho en Mexico
Impreso por:
Esteban Becerril Camargo
Simon Bolvar No. 118, Col. Centro,
Deleg. Cuauhtemoc, Mexico, D.F., C.P. 06080
1,000 Ejemplares, Junio de 2013

Das könnte Ihnen auch gefallen