Beruflich Dokumente
Kultur Dokumente
PAMPLONA
Julio de 2009
MDULO
SISTEMAS AVANZADOS DE CONTROL
Copyright
Universidad Nacional Abierta y a Distancia
ISBN
2009
Centro Nacional de Medios para el Aprendizaje
INTRODUCCIN
Cuando se menciona Sistemas de Control Avanzado se quiere indicar la
aplicacin de estrategias de control automtico que trascienden las que
usualmente se aplican en control de procesos. Ejemplos de las tcnicas de control
ms usuales de sistemas SISO (una entrada una salida) son el control PID en
sus diversas formas ajuste manual o automtico (selftunning)-, control de razn,
sistemas de Adelanto-Atraso (Lead-Lag) por reasignacin de polos y ceros,
control digital discreto (usando PLCs), etc., las mismas que pueden aplicarse
sobre sistemas MIMO (multivariables), usando el concepto de desacople de lazos
a partir del anlisis de la matriz de ganancias relativas de Bristol, quedando
limitado a sistemas con igual nmero de variables de entrada que de salida. En
general, estas estrategias pueden denominarse de parmetros ptimos ya que,
partiendo de una estructura algortmica fija, se modifican sus parmetros con el
objeto de lograr la respuesta del proceso que mejor se adecue a los
requerimientos del mismo, conforme a un criterio de optimizacin fcil de entender
y manejar por un operador de planta (Ver: ABC-Algoritmos de control PID). Esta
forma de operar tiene entre sus ventajas principales- que puede ser fcilmente
implantada con circuitos electrnicos analgicos y/o digitales, pudiendo construirse
controladores PID en gabinetes compactos y comercializarse individualmente
como tal.
Asimismo, la simpleza de la programacin de un algoritmo PID digital ha
posibilitado que la mayor parte de las empresas fabricantes de equipos del rubro
de la automatizacin (PLCs, sistemas de adquisicin de datos (DAS), o sistemas
de control distribuido (DCS)) incorporen mdulos de control PID dentro de sus
productos. Por lo general, este tipo de control presenta buenas condiciones de
desempeo para la mayora de los procesos industriales tradicionales, lo que
prcticamente asegura su permanencia en el tiempo. Sin embargo, existen
procesos que por su grado de complejidad- no pueden ser operados usando
tcnicas de control convencional de forma eficiente, y requieren aplicar tcnicas de
control avanzado para alcanzar las prestaciones deseadas. En las prximas lneas
se har referencia a la visin del autor de estas formas avanzadas de control, las
que en parte- pueden ser contrastadas y ampliadas en: (Mark J.Willis y Ming T.
Tham (1994) Advanced Process Control. Dept. of Chemical and Process
Engineering.
University
of
Newcastle.
Disponible
en
http://lorien.ncl.ac.uk/ming/advcontrl/sect1.htm, consultado el 1 de julio 2009).
Control Experto control Borroso, Difuso o por Lgica Difusa (Fuzzy Logic
Control): Este tipo de control se basa en la recopilacin de conocimiento de un
sistema, a partir de operadores del mismo que pueden considerarse como
expertos en su rea de conocimiento. Este conocimiento se transforma en una
serie de reglas del tipo SI x1, x2,... xn, ENTONCES y1, y2,... ym,... (IF...,
THEN...), donde x1, x2,... xn representan los antecedentes o premisas e y1,
y2,... ym las consecuencias o acciones. La forma de procesar estas reglas,
contrastndolas con la informacin disponible del proceso controlado, da las
caractersticas de cada tipo de control en particular.
El mejor exponente de este tipo de control, por el grado de aceptacin que ha
tenido a nivel industrial es el control Borroso, Difuso o por Lgica Difusa (Fuzzy
Logic Control). Esta es quizs- el sistema de control avanzado que ha tenido
mejor aceptacin entre sus exponentes, principalmente por la industria japonesa, y
se encuentran aplicaciones de estrategias de control basadas en lgica difusa en
el ajuste automtico del foco en cmaras fotogrficas, resolucin del sistema de
INDICE DE CONTENIDO
LISTADO DE TABLAS
Tabla 2 1 Tabla de reglas aplicadas............................................................................................. 177
Unidad 1.
Figura 1. 1 Instrumentos instalados en campo ............................................................................. 22
Figura 1. 2 Paneles con instrumentos analgicos.......................................................................... 23
Figura 1. 3 SP modificado por el operador.................................................................................... 24
Figura 1. 4 SP modificado por el computador ............................................................................... 25
Figura 1. 5 Sustitucin de un lazo de control analgico por otro tipo DDC .................................... 26
Figura 1. 6 Diagrama en bloques de configuracin twin computer ............................................... 28
Figura 1. 7 Diagrama en bloques de Seguridad en el control por medio de back up...................... 29
Figura 1. 8 Elementos de un Sistema de Control Distribuido (SCD................................................. 33
Figura 1. 9 Consola de Operacin................................................................................................. 34
Figura 1. 10 Controladores analgicos efectuando control independiente.................................... 36
Figura 1. 11 Cierre del lazo hecha por el operador........................................................................ 37
Figura 1. 12 Sistema de control ON LINE...................................................................................... 38
Figura 1. 13 Sistema de control ON LINE en LAZO CERRADO......................................................... 39
Figura 1. 14 Sistema de control utilizando fielbus......................................................................... 42
Figura 1. 15 Diagrama en bloques de un observador del orden completo..................................... 47
Figura 1. 16 Diagrama en bloques de un observador del orden reducido...................................... 64
Figura 1. 17 Posibles trayectorias de 1 al 8 ................................................................................... 82
Figura 1. 18 Pndulo invertido ..................................................................................................... 91
Figura 1. 19 Esquema del lazo del sistema del pndulo invertido ................................................. 92
Figura 1. 20 Respuesta ante una entrada escaln unitario con control LQR. ................................. 97
Figura 1. 21 Respuesta corregida ante una entrada escaln unitario con control LQR................... 99
Figura 1. 22 Respuesta Ganancia del estimador versus el tiempo ............................................... 111
Unidad 2.
Figura 2. 1 Diagrama en bloques del control feedforward .......................................................... 119
Figura 2. 2 Diagrama de un intercambiado de calor.................................................................... 120
Figura 2. 3 Diagrama de un intercambiado de calor con compensacin dinmica....................... 122
Figura 2. 4 Diagrama de un intercambiado de calor con compensacin dinmica....................... 123
Figura 2. 5 Diagrama tpico de nivel de un tanque para el ejemplo del control en cascada ......... 124
Figura 2. 6 Aplicando control en cascada.................................................................................... 125
Figura 2. 7 Diagrama en bloques aplicando el control en cascada en el nivel de un tanque ........ 126
Figura 2. 8 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de
destilacin ................................................................................................................................. 127
Figura 2. 9 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de
destilacin ................................................................................................................................. 127
Figura 2. 10 Diagrama de control de combustin de un horno ................................................... 129
Figura 2. 11 Diagrama de control de sistemas con tres controladores en cascada...................... 129
Figura 2. 12 Diagrama de control de sistemas con tres controladores en cascada...................... 130
Figura 2. 13 Diagrama de un absorbedor en el que se elimina SH2 utilizando como absorbente
Mono Etanol Amina (MEA)......................................................................................................... 132
Figura 2. 14 Sistema feedforward aplicado al absorbedor ......................................................... 133
Figura 2. 15 Sistema de relacin caudal parcial a caudal total..................................................... 134
Figura 2. 16 Sistema de control para relacin de mezcla............................................................ 135
Figura 2. 17 Sistema de control para blending........................................................................... 136
Figura 2. 18 Diferentes fases que componen el desarrollo.......................................................... 138
Figura 2. 19 Control selectivo Anti reset windup......................................................................... 141
Figura 2. 20 Control selectivo override ...................................................................................... 141
Figura 2. 21 Control override para medida de caudal de LPG...................................................... 143
Figura 2. 22 Comportamiento del control override para la medida del caudal de LPG ................ 143
Figura 2. 23 Sistema de control override entre presin nivel en los equipos situados en cabeza de
una columna desetanizadora ..................................................................................................... 144
Figura 2. 24. Respuesta al escaln de un sistema de primer orden con retardo .......................... 156
Figura 2. 25 Respuesta al escaln de un integrador .................................................................... 158
Figura 2. 26 Respuesta de un sistema de 2do orden................................................................... 158
Figura 2. 27 Evaluacin de la respuesta sinusoidal...................................................................... 161
Figura 2. 28 Anlisis de la respuesta frecuencial con tcnicas de correlacin.............................. 162
Figura 2. 29 Jan Likasiewicz ........................................................................................................ 168
Figura 2. 30 Lofti A. Zadeh.......................................................................................................... 168
Figura 2. 31 E.H. Mamdani ......................................................................................................... 169
Figura 2. 32 Subconjunto borroso .............................................................................................. 171
Figura 2. 33 Forma grfica del conjunto gente joven ................................................................. 172
Figura 2. 34 A Intervalo borroso entre 5 y 8............................................................................... 173
Figura 2. 35 B nmero borroso en torno a 4 ............................................................................... 173
Figura 2. 36 Operacin AND ....................................................................................................... 174
Figura 2. 37 Operacin OR ......................................................................................................... 174
Figura 2. 38 Operacin negacin ................................................................................................ 174
Figura 2. 39 Funciones pertenecientes al conjunto borroso velocidad ....................................... 175
Figura 2. 40 Funciones pertenecientes al conjunto borroso ngulo ........................................... 176
Figura 2. 41Funciones pertenecientes al conjunto borroso velocidad angular ............................ 176
Figura 2. 42 Funciones pertenecientes al ngulo actual ............................................................. 177
Figura 2. 43 Funciones pertenecientes a velocidad angular actual ............................................. 178
Figura 2. 44 Conjunto cero, variable lingstica "ngulo" y ngulo actual................................... 178
Figura 2. 45 Conjunto borroso cero ngulo de 0.75 .............................................................. 178
Figura 2. 46 Funciones pertenecientes a velocidad angular actual.............................................. 179
Figura 2. 47 Valor real pertenece al conjunto borroso "cero" en un grado de 0.4 ....................... 179
Unidad 3.
Figura 3. 1 Sistema con control adaptativo................................................................................. 191
Figura 3. 2 Sistema con mecanismo de adaptacin..................................................................... 194
Figura 3. 3 Sistema de primer orden.......................................................................................... 199
Figura 3. 4 Simulacin proceso de primer orden 1=0.1 ............................................................. 202
Figura 3. 5 Simulacin proceso de primer orden 1=0.5 ............................................................. 203
Figura 3. 6 Representacin equivalente del modelo de error...................................................... 204
Figura 3. 7 Sistema adaptativo por modelo de referencia paralelo ............................................. 205
Figura 3. 8 Neuronas Biolgicas.................................................................................................. 208
Figura 3. 9 Cambios asociativos de las fuerzas sinpticas durante el aprendizaje........................ 209
Figura 3. 10 Comunicacin entre neuronas ................................................................................ 211
Figura 3. 11 Proceso qumico de una sinpsis ............................................................................. 213
Figura 3. 12 Neurona Artificial.................................................................................................... 214
Figura 3. 13 De la neurona biolgica a la neurona artificial......................................................... 214
Figura 3. 14. Estructura de una red neuronal.............................................................................. 215
Figura 3. 15 Neurona de una sola entrada.................................................................................. 217
Figura 3. 16 Funcin de transferencia Hardlim ........................................................................... 218
Figura 3. 17 Funcin de transferencia Hardlims.......................................................................... 218
UNIDAD 1
Nombre de la
Unidad
Introduccin
Justificacin
Intencionalidades
Formativas
Denominacin de
captulos
Etapa inicial
Computador centralizado
Minicomputador
Control distribuido
1958 a 1964
1965 a 1970
1971 a 1975
Desde 1975
Durante mucho tiempo los computadores eran demasiado grandes, lentos, caros e
inseguros desde el punto de vista de funcionamiento. Debido a la falta de
seguridad solamente podan utilizarse para realizar control supervisorio, es decir,
clculo de puntos de ajuste de controladores tradicionales con tecnologa
analgico, conectados directamente al proceso. Para llevar a cabo el control
supervisorio se pueden utilizar dos procedimientos:
Figura 5 muestra la sustitucin de un lazo de control analgico por otro tipo DDC.
La frecuencia de ejecucin de los algoritmos es similar a las utilizadas por el
control supervisorio.
Interfase al Proceso.
Interfaz al Operador.
Va de datos.
Interfase al Proceso
Suele haber dos tipos de equipos para realizar la interfase con el Proceso. Uno de
ellos, denominado habitualmente controlador, se dedica al procesamiento de lazos
de control con entrada, procedente de elementos de medidas, y salida hacia
elementos finales, mientras que otro mdulo se dedica al procesamiento de
entradas que no necesariamente realizar funciones de control, tal como
indicaciones. Entre los ltimos suele haber equipos especializados en
determinados tipos de entradas siendo el ms habitual el que procesa
temperaturas, conocido como multiplexor.
Interfaz al Operador
Va de datos
La lgica evolucin del mundo digital ha llegado hasta elementos de campo como
transmisores y posicionadores de vlvulas automticas, apareciendo la generacin
como elementos smart o inteligentes, la cual va sustituyendo progresivamente a la
comunicacin analgica de 4 a 20 mA. Para comunicacin de los nuevos
elementos con tecnologa digital aparecen las vas de datos campo (fielbus), con
diversos protocolos diseados por los fabricantes de instrumentos y equipos de
control, algunos de cuyos protocolos han desaparecido del mercado.
Nivel fsico
FOUNDATIONTM Fielbus es una red de rea local (Local Area Network), para
comunicacin digital, que interconecta elementos de campo tales como
transmisores finales, teniendo la posibilidad de distribuir el control a travs de la
red. La red puede ser de cable de cobre, fibra ptica o incluso de comunicacin
por radio. La longitud del cable (bus) depende de la calidad o caractersticas del
mismo, por ejemplo, un par de cobre trenzado y apantallado puede alcanzar hasta
1.900 metros, mientras que el mismo par no apantallado alcanza 400 metros,
dependiendo adems de la velocidad de transmisin. La seal utilizada para
comunicacin a travs del bus se codifica con la tcnica Manchester Biphase-L.
Sistema de comunicacin
Cuando un elemento tiene que proporcionar datos, el LAS manda que los emita
hacia el bus para ser utilizados por cualquier de los dispositivos conectados al
mismo.
Este nivel estn definido a su vez por varios bloques para llevar a cabo las
diferentes tareas encomendas al fielbus.
AI
AO
DI
D0
PID
RA
ML
CS
Entrada analgica
Salida analgica
Entrada digital
Salida Digital
Controlador
Relacin
Estacin manual
Seleccin de control
(Analog Input)
(Analog Output)
(Digital Input)
(Digital Output)
(Proportional, Integral, Derivate)
(RAtio)
(Manual Loader)
(Control Selector)
Los bloques pueden ser definidos para obtener la funcionalidad deseada. Por
ejemplo, una vlvula automtica puede contener un bloque PID y la salida
analgica (AO) correspondiente. Un transmisor puede contener una entrada
analgica (AI), de forma que el lazo de control se puede cerrar utilizando un
transmisor y una vlvula conectada al fieldbus, tal como se muestra la figura
1.14.
Ventajas e inconvenientes
Por el contrario existen una serie de inconveniente, entre los que se pueden citar:
Los observadores de estado, son herramientas virtuales, que permiten estimar las
variables o estados de un sistema en base a mediciones de las seales de salida
y seales de control. Estos observadores permiten enviar informacin estimada
acerca del valor que toman dichos estados, permitiendo conocer un aproximado
del valor real, adems cuentan con muy poco margen de diferencia o error.
Seccin 1. Clasificacin
x& = Ax + Bu
y = Cx + Dx
(1.1)
donde:
x
Vector de estado (n x 1)
Seal de salida
Matriz (n x n)
Matriz (n x 1)
Matriz (1 x n)
Matriz (escalar)
(escalar)
x& = Ax + Bu + L( y y )
donde:
Salida estimada
Debe notarse que las matrices A, B, C, D son las mismas tanto para un sistema
real como para el sistema estimado. Para los clculos siguientes se asume que el
valor de D es cero.
x& x& = ( Ax + Bu ) ( Ax + Bu + L( y y ))
x& x& = Ax Ax L( y y )
x& x& = A( x x ) L(Cx Cx )
x& x& = A( x x ) LC ( x x )
x& x& = ( A LC )( x x )
Si se sabe que el error esta definido como la diferencia entre el estado real y el
estado estimado, entonces se tendr:
e= xx
e& = x& x&
e& = ( A LC ) e
Existe una condicin necesaria, la cual consiste en que el sistema obtenido sea
estable y completamente controlable y observable.
0 2 0
x& =
x + u
1 4 1
y = [0 1]x
Solucin
L
L = 1
L2
[sI A + LC ] = s
1 0 0
0 1 1
s 0
0
[sI A + LC ] =
0 s 1
2 L1
[0 1]
+
4 L2
2 0 L1
+
4 0 L2
2 + L1
1 s + 4 + L2
[sI A + LC ] = s( s + 4 + L2 ) + (2 + L1 )
[sI A + LC ] =
[sI A + LC ] = s 2 + (4 + L2 ) s + (2 + L1 )
Analizando la respuesta del ejemplo anterior nos podemos dar cuenta que los
valores que toman L1 y L2 estn condicionadas por las races del polinomio, las
cuales a su vez estn condicionadas por las caractersticas con que se desea que
cuente el sistema, por tanto se puede elegir races de tal modo de poder controlar
la respuesta del sistema en lazo cerrado.
Por lo tanto se puede asumir valores para dichas races, a los que llamaremos 1 y
2 de modo tal que el polinomio tenga una respuesta estable. Luego por simple
equivalencia de trminos podemos hallar el valor de las incgnitas.
Solucin
2
2
s = s
donde (4 + L2)s = 7s L2 = 3
(2 + L1) = 12 L1 = 10
NOTA: Este mtodo esta restringido a sistemas de hasta 3er orden, adems el
sistema debe estar en la forma cannica observable.
Es aconsejable que los polos del observador sean de 3 a 5 veces mayores (ms
negativos) que los polos del controlador por realimentacin de estados, pero sin
salirse de la regin de estabilidad dada por el lugar geomtrico de las races. La
eleccin de los polos deseados van a determinar las caractersticas de la
respuesta obtenida, por lo que puede existir un conjunto infinito de vectores L
como solucin, de las cuales solo un limitado nmero de soluciones cumplen con
las necesidades requeridas para el sistema (como por ejemplo: sobreimpulso,
velocidad de respuesta, etc. del sistema estimado), por lo que se aconseja probar,
mediante simulacin, la respuesta del sistema a diferentes valores de polos
escogidos.
C
CA
L = ( A)
M
n 1
CA
0
0
M
1
0 1
0
x& =
x + u
1 2
1
y = [0 1]x
Solucin
0 1 0
L = ( A + 6 A + 10 I )
1 2 1
2
1 2 0 6 10 0 2 1 0
L =
+
+
2 3 6 12 0 10 1 0 1
9 4 1
L=
4 1 0
9
L=
4
AB K A n 1 B
Controlabilidad:
Wc = B
Observabilidad:
C
CA
Wo =
M
n 1
CA
Q = (W x Wo)-1
a n 1
a
n2
W = M
a1
1
a n 2 K a1
a n 3 K
1
0
M
0
0
En donde a1, a2, an-2, an-3, son los coeficientes del polinomio
caracterstico original |sI-A|.
bn a n
b a
n 1
n 1
L = Q bn 2 a n 2
b1 a1
(*)
La deduccin de esta expresin puede encontrarse en el libro Ingeniera de Control Moderna, Katsuhiro
Ogata, 3ra Edicin, Cp.12, Pg. 817-820.
0
x& = 0
2
y = [1 0
0
0
0
1 x + 0u
1
1 2
1
0]x
Solucin.
1)
Controlabilidad
Observabilidad
1
0 0
Wc = 0 1 2
1 2 3
1 0 0
Wo = 0 1 0
0 0 1
rank(Wc) = 3
rank(Wo) = 3
det(Wc) = -1
det(Wo) = 1
El sistema es controlable
2)
1
0
s 0 0 0
[sI A] = 0 s 0 0 0 1
0 0 s 2 1 2
El sistema es observable
0
s 1
[sI A] = 0 s 1
2 1 s + 2
[sI A] = s(s 2 + 2s + 1) + 2
[sI A] = s 3 + 2s 2 + s + 2
s 3 + a1 s 2 + a 2 s + a 3
a1 = 2 a 2 = 1 a 3 = 2
3)
Q = ( W x Wo )-1
a 2
W = a1
1
1 1 2 1
0 = 2 1 0
0 1 0 0
1 2 1 1 0 0 1 2 1
W Wo = 2 1 0 0 1 0 = 2 1 0
1 0 0 0 0 1 1 0 0
1
0 0
Q = 0 1 2
1 2 3
a1
1
0
4)
(s - 1) (s - 2) (s - 3)
= (s + 5) (s + 2 + j) (s + 2 - j)
= (s + 5) (s2 + 4s + 5)
= s3 + 9s2 + 25s + 25
b1 = 9 b2 = 25 b3 = 25
5)
s3 + b1s2 + b2s + b3
1 23
b3 a3 0 0
L = Q b2 a 2 = 0 1 2 24
b1 a1 1 2 3 7
L1 7
L = L2 = 10
L3 4
Se puede hacer uso del software Matlab, para lo cual se emplea el comando acker
o el comando place.
Dado el sistema
x& = Ax + Bu
, y un vector de polos deseados: P = [1
y = Cx + Dx
2 L n ]
0
x& = 0
3
y = [2 0
Solucin.
>> A = [0 1 0; 0 0 1; -3 -2 -1];
>> C = [2 0 0];
>> P = [-2 -1+j -1-j];
>> L = acker(A',C',P)'
L=
1.5000
0.5000
-3.0000
>> L = place(A',C',P)'
L=
1.5000
0.5000
-3.0000
1
0
0
0
1 x + 0u
1
2 1
0]x
0 0 4
0
x& = 1 0 1 x + 0u
0 1 2
1
y = [0 0 1]x
Solucin
1) Mtodo completo
Controlabilidad
Observabilidad
0 4 8
Wc = 0 1 2
1 2 3
1
0 0
Wo = 0 1 2
1 2 3
rank(Wc) = 3
rank(Wo) = 3
det(Wc) = 16
det(Wo) = -1
El sistema es controlable
El sistema es observable
s 0 0 0 0 4
[sI A] = 0 s 0 1 0 1
0 0 s 0 1 2
0
4
s
[sI A] = 1 s 1
0 1 s + 2
[sI A] = s(s 2 + 2s + 1) + 4
[sI A] = s 3 + 2s 2 + s + 4
s 3 + a1 s 2 + a 2 s + a 3
a1 = 2 a 2 = 1 a 3 = 4
Q = ( W x Wo )-1
a2
W = a1
1
a1 1 1 2 1
1 0 = 2 1 0
0 0 1 0 0
1 1 0 0
1 2 1 0 0
W Wo = 2 1 0 0 1 2 = 0 1 0
1 0 0 1 2 3 0 0 1
1 0 0
Q = 0 1 0
0 0 1
(s - 1) (s - 2) (s - 3)
= (s + 2) (s + 3 + 0.5j) (s + 3 0.5j)
= (s + 2) (s2 + 6s + 9.25)
= s3 + 8s2 + 21.25s + 18.5
b1 = 8 b2 = 21.25 b3 = 18.5
s3 + b1s2 + b2s + b3
Vector Observador
b3 a3 1 0 0 14.5
L = Q b2 a 2 = 0 1 0 20.25
b1 a1 0 0 1 6
L1 14.5
L = L2 = 20.25
L3 6
2) Mtodo abreviado
s 0 0 0 0 4 L1
[sI A + LC ] = 0 s 0 1 0 1 + L2 [0 0 1]
0 0 s 0 1 2 L3
0
4 0 0 L1
s
[sI A + LC ] = 1 s 1 + 0 0 L2
0 1 s + 2 0 0 L3
0
4 + L1
s
[sI A + LC ] = 1 s 1 + L2
0 1 s + 2 + L3
[sI A + LC ] = s( s 2 + sL3 + 2s + 1 + L2 ) + (4 + L1 )
[sI A + LC ] = s 3 + (2 + L3 ) s 2 + (1 + L2 )s + (4 + L1 )
Polinomio deseado
= 8s2 L3 = 6
(2+L3)s2
(4 + L1) = 18.5
L1 = 14.5
1 0
0 0
3
2
L = ( A + 8 A + 21.25 A + 18.5 I ) 0 1 2 0
1 2 3 1
0 0
L = 1 0
0 1
14.5
L = 20.25
6
4
0 0 4
0 0 4
1 0 0 1 2 1 0
1 + 81 0 1 + 21.251 0 1 + 18.510 1 0 2 1 0 0
0 1 2
0 1 2
0 0 1 1 0 0 1
2
24 33 1
8.5 32.25 0
8.25 8 0
3
L1 14.5
L = L2 = 20.25
L3 6
4) Usando matlab
>> L = acker(A',C',P)'
L=
14.5000
20.2500
6.0000
>> L = place(A',C',P)'
L=
14.5000
20.2500
6.0000
X1
X
2
M
Xm
X =
X m +1
X m + 2 X1 Xm
M
X n n1
Xm+1 Xn
Obtenindose:
X&a Aaa
& =
Xb Aba
Aab Xa Ba
+
u
Abb Xb Bb
Xa
Y = [Ca Cb ]
Xb
Aaa
mxm
Aab
m x n-m
Aba
n-m x m
Abb
n-m x n-m
Ba
mx1
Bb
n-m x 1
Ca
1xm
Cb
1 x n-m
x& = Ax + Bu
y = Cx + Dx
En cambio para el diseo de observadores de orden reducido el sistema es
descrito por
la ecuacin de estado:
Xb
Aab
Bu
Aba Xa + Bb u
X&a Aaa Xa Ba u
Aab Xb
Aab
x& = Ax + Bu + L( y y )
Se pueden aplicar los mismos mtodos usados para hallar los observadores de
orden completo, pero tenemos que hacer una variacin la cual consiste en
reemplazar los ndices: en vez de considerar el ndice n, se debe considerar el
ndice i. Por ejemplo si un sistema es de orden 4 y tiene un estado medible,
entonces m=1, y por tanto el sistema observado ser de orden 3 (n m = 4 1 = 3
= i).
(*)
La deduccin de esta expresin puede encontrarse en el libro Ingeniera de Control Moderna, Katsuhiro
Ogata, 3ra Edicin, Cp.12, Pg. 832-833.
El otro cambio que hay que hacer es realizar una equivalencia entre las matrices,
dada de la siguiente manera:
Aaa
Aab
Aba
Abb
Lo que resta por hacer, es aplicar la misma metodologa que para los
observadores de orden completo, considerando el nuevo orden del sistema (i) y
las nuevas matrices del sistema (Abb, Aba, Aab, Aaa).
1
0
0
0
x& = 1
0
1 x + 0u
6 11 6
1
y = [1 0 0]x
Solucin
31 i=2
Aaa = [0]
Aaa
Aab
Aba
Abb
Aab = [1 0]
0
Aba =
6
1
0
Abb =
11 6
1) Mtodo completo
Controlabilidad
Wcr = [ Aba
0 6
Abb Aba ] =
6 6
Observabilidad
Aab 1 0
Wor =
=
Aab Abb 0 1
rank(Wc) = 2
rank(Wo) = 2
det(Wc) = -36
det(Wo) = 1
El sistema es controlable
El sistema es observable
s 0 0
1 s
1
0 s 11 6 11 s + 6
[sI Abb] = s 2 + 6s + 11
s 2 + a1 s + a 2
a1 = 6 a 2 = 11
Q = ( W x Wo )-1
a
W = 1
1
1 6 1
=
0 1 0
6 1 1 0 6 1
W Wor =
1 0 0 1 1 0
0 1
Q=
1 6
s2 + b1s + b2
b1 = 4 b2 = 16
Vector Observador
b a 2 0 1 5
L = Q 2
=
b1 a1 1 6 2
L 2
L = 1 =
L2 17
2) Mtodo abreviado
1 0 0
1 L1
+ [1 0]
0 1 11 6 L2
s
1 L1 0
[sI Abb + L Aab] =
+
11 s + 6 L2 0
s + L1
1
[sI Abb + L Aab] =
11 + L2 s + 6
( s 1 )( s 2 ) = s 2 + 4s + 16
6 + L1 = 4
6 L1 + 11 + L2 = 16
L1 = -2
L2 = 17
Si (s) = ( s 1 )( s 2 ) = s 2 + 4s + 16
1 0
L = ( Abb 2 + 4 Abb + 16 I ) [Wor ]
1
2
1
0
1
1
0
1 0 1 0
0
L=
+ 4
+ 16
11 6
11 6
0 1 0 1
1
5 2 0
L=
22 17 1
L 2
L = 1 =
L2 17
4) Usando MATLAB
17
donde:
x
Vector de estado (n x 1)
Seal de control (1 x r)
Seal de salida
Matriz (n x n)
Matriz (n x r)
Matriz (q x n)
Matriz (q x r)
(escalar)
Es el nmero de entradas
Es el nmero de salidas
En cambio, el nmero de salidas con que cuente el sistema si afecta el diseo del
observador. En este caso se aplica el Principio de Separabilidad Lineal, el cual
consiste en separar las salidas y trabajarlas como si fueran provenientes de
sistemas distintos.
Por ejemplo;
si se tiene la siguiente matriz C (matriz de salidas)
1 2 3
C=
4 5 6
1
0
0
x& =
x + u
5 5
1
1 0
y=
x
0 1
Solucin
C1 = [1 0]
L
L1 = 11
L12
C2 = [0 1]
L
L2 = 21
L22
L = [L1
L L
L2 ] = 11 21
L12 L22
Mtodo completo
Controlabilidad
Wc = [B
0 1
A B] =
1 5
Observabilidad
C 1 0
Wo1 = 1 =
C1 A 0 1
rank(Wc) = 2
rank(Wo) = 2
det(Wc) = -1
det(Wo) = 1
El sistema es controlable
El sistema es observable
1
C 0
Wo2 = 2 =
C 2 A 5 5
rank(Wo) = 2
det(Wo) = 5
El sistema es observable
s 0 0
1 s 1
0 s 5 5 5 s + 5
[sI A] =
[sI A] = s 2 + 5s + 5
s 2 + a1 s + a 2
a1 = 5 a 2 = 5
Q = ( W x Wo1 )-1
a
W = 1
1
1 5 1
=
0 1 0
5 1 1 0 5 1
W Wo1 =
1 0 0 1 1 0
0 1
Q=
1 5
= (s + 1) (s + 2)
= s2 + 3s + 2
s2 + b1s + b2
b1 = 3 b2 = 2
Vector Observador
b a 2 0 1 3
L1 = Q 2
=
b1 a1 1 5 2
L 2
L1 = 11 =
L12 7
Q = ( W x Wo2 )-1
a
W = 1
1
1 5 1
=
0 1 0
1 5 0
5 1 0
W Wo2 =
1 0 5 5 0 1
0.2 0
Q=
1
0
s2 + b1s + b2
b1 = 2 b2 = 2
Vector Observador
b a 2 0.2 0 3
L2 = Q 2
=
1 3
b1 a1 0
L 0.6
L2 = 21 =
L22 3
L = [L1
L L 2 0.6
L2 ] = 11 21 =
L12 L22 7 3
>> A = [0 1; -5 -5];
>> B = [0; 1];
>> C = [1 0; 0 1];
>> C1 = C(1,:);
>> C2 = C(2,:);
>> P1 = [-1 -2] ;
>> P2 = [-1+j -1-j]
>> L1 = acker(A,C1,P1)
L1 =
-2.0000
7.0000
>> L2 = acker(A,C2,P2)
L2 =
0.6000
-3.0000
0.6000
7.0000 -3.0000
Introduccin
3. Los autovalores del observador deben elegirse ms rpidos que los del
controlador, pero, se tiene algn criterio adicional para preferir una configuracin
a otra?
(3.1)
(3.2)
Las transiciones posibles se representan por los arcos que conectan el estado
inicial al final a travs de los estados intermedios. El costo asociado a cada
transicin se representa con la letra J; por ejemplo, el costo de moverse del estado
3 al 5 es J35. Asumiendo que los costos se acumulan en forma aditiva, vemos
que la trayectoria marcada en rojo, por ejemplo, tiene un costo total J13 + J35
+ J56 + J68 . Como hay varias rutas alternativas del estado 1 al 8, el costo total
depender de la trayectoria elegida. La seal de control u[k] que determina la
trayectoria de menor costo es la estrategia ptima. Como ya veremos, en
sistemas de tiempo continuo, la acumulacin de costos se representa mediante
integracin, en vez de suma. La herramienta matemtica que usaremos para
determinar la estrategia ptima es el principio de optimalidad de Bellman. En
cualquier punto intermedio xi en una trayectoria optima entre x0 y xf, la estrategia
desde xi al punto final xf debe ser en s una estrategia optima.. Este obvio
principio nos permitir resolver en forma cerrada nuestros problemas de control
optimo. Tambin se usa en el cmputo recursivo de las soluciones ptimas en un
procedimiento llamado programacin dinmica. Una ventaja de usar el esquema
de control ptimo cuadrtico es que el sistema diseado ser estable, excepto en
el caso en el que el sistema no es controlable. Al disear sistemas de control con
base en la minimizacin de los ndices de desempeo cuadrtico se necesita
resolver las ecuaciones de Riccati. MATLAB tiene un comando Lqr que
(3.3)
sigue los mismos pasos que el de tiempo discreto, solo que las transiciones se
reducen a incrementos infinitesimales. El costo es ahora:
(3.
4)
(3.5)
(3.6)
(3.7)
Los transitorios en P(t) y K(t) ocurrirn sobre el final del intervalo [t0 , tf ]. Pero, la
ecuacin diferencial de ricatti es en general de difcil solucin. Aun, hacindolo
numricamente, cmo pueden guardarse los (infinitos) valores de P(t) calculados
en tiempo invertido para ser aplicados luego al sistema? Esta dificultad lleva a
buscar una solucin ptima estacionaria, K (t) = K , que surge de considerar el
caso de horizonte infinito tf
(3.8)
(3.9)
Este funcional puede interpretarse como el costo total de la transicin de xi a xN
y, en particular, el termino xNSxN penaliza el error en alcanzar el estado nal
Transicin [N 1] [N]
(3.10)
(3.11)
(3.
12)
(3.13)
(3.14)
(3.15)
(3.16)
(3.17)
Como vemos, de uN
forma habitual:
(3.18)
donde
(3.19)
(3.
20)
(3.21)
donde se define
(3.22)
(3.23)
es decir
(2.24)
(3.25)
(3.26)
Transicin [N 2] [N]
Tomamos otro paso para atrs en el cmputo del control ptimo y consideremos
ahora que estamos en el paso N 2:
(3.27)
(3.28)
(3.29)
Igual que antes, podemos minimizar JN 2,N 1 sobre todos los posibles uN 2, y es
fcil ver que las expresiones son las mismas pero con N 1 en vez de
N, y N 2 en vez de N 1,
, (3.30)
(3.31)
(3.32)
donde
(3.33)
(3.34)
SN = S
(3.35)
(3.36)
Ejemplo:
(3.37)
(3.38)
Los criterios de diseo con para una referencia escaln de 0.2m en el carro son
los siguientes:
Este sistema tiene una entrada y dos salidas. Usando los mtodos de
estado estacionario es relativamente simple disear un controlador para conseguir
seguimiento en ambas salidas, ngulo y posicin del carro. El problema puede
resolverse con realimentacin de estados. El esquema del lazo de control es el
siguiente:
>>
i = 0.006;
g = 9.8;
l = 0.3;
p = i*(M+m)+M*m*l^2; % denominador
A = [0
0;
-(i+m*l^2)*b/p (m^2*g*l^2)/p
0
1;
p = eig(A)
p =
0
5.5651
-0.1428
-5.6041
0;
>> Q=C*C
Q =
1
Los elementos en las posiciones (1,1) ser usado para pesar la posicin del carro,
y el elemento (3,3) para pesar el ngulo del pndulo. Se deja el peso en el
control R = 1. Ahora se sabe qu forma tiene Q, se puede experimentar hasta
encontrar la matriz K que da un buen controlador. Se disea un programa para
que los cambios en Q se vean automticamente en la respuesta del controlador
obtenido para cada iteracin hasta encontrar la Q y K que satisfacen los
requerimientos de diseo. anexamos el programa completo:
>> M = 0.5;
m = 0.2;
b = 0.1;
i = 0.006;
g = 9.8;
l = 0.3;
p = i*(M+m)+M*m*l^2; %denominador
A = [0 1
0;
0 -(i+m*l^2)*b/p (m^2*g*l^2)/p
0
0;
1;
Q=[x 0 0 0; 0 0 0 0; 0 0 y 0; 0 0 0 0];
R = 1;
K = lqr(A,B,Q,R)
Ac = [(A-B*K)];
Bc = [B];
Cc = [C]; Dc = [D];
T=0:0.01:5; U=0.2*ones(size(T));
[Y,X]=lsim(Ac,Bc,Cc,Dc,U,T);
plot(T,Y)
grid
legend(Carro,Pendulo invertido)
D=
0
0
p=
0
5.5651
-0.1428
-5.6041
Q=
1
K=
-1.0000
-1.6567
18.6854
3.4594
>>
La curva en verde representa el ngulo, en radianes, y la curva en azul la
posicin, en metros. Como se ve, la respuesta no es satisfactoria. El sobrevalor
en el ngulo est bien, pero los tiempos de establecimiento necesitan ajuste.
Puede observarse tambin que el carro no est cerca de la posicin deseada sino
que se movi para el lado opuesto. Corregiremos este error en la seccin
siguiente;
por ahora nos concentramos en los tiempos de subida y
establecimiento. Volviendo al archivo-m, cambiamos las variables x e y para ver si
se puede obtener una respuesta mejor. Vemos que aumentando x reducimos
los tiempos de establecimiento y subida, y bajamos el ngulo que se mueve el
pndulo. Usando x = 7000 e y = 200, se obtienen los siguientes valores de D Q Y
K y la respuesta a lazo cerrado:
Figura 1. 20 Respuesta ante una entrada escaln unitario con control LQR.
D=
0
0
p=
0
5.5651
-0.1428
-5.6041
Q=
1
K =[ -83.6660
-44.0051
119.7550
23.7239]
Figura 1. 21 Respuesta corregida ante una entrada escaln unitario con control LQR.
(3.40)
S = AT SA AT SB(R + BT SB)1BT SA + Q
(3.41)
K = (R + BTSB)1 BTSA.
(3.42)
(3.43)
con una realimentacin esttica de estados u(t) = K x(t) tal que se minimice el
funcional de costo
(3.44)
(3.46)
(3.47)
(3.48)
(3.49)
se selecciona como funcin costo que penaliza el uso de un control con una gran
magnitud como:
(3.51)
(3.52)
(3.53)
Expresin llamada como el hamiltoniano (H) del sistema. De esta expresin la
rata de cambio de las variables son prescritas en la ecuacin de hamilton as que
de una manera similar se establece que z0 y z1 satisfacen la ecuacin de
hamilton y se definen:
De donde:
Esta solucin
problema.
completa
proporciona
una
solucin
ptima
nica
(3.54)
(3.55)
(3.56)
del
(3.57)
(3.58)
donde el ruido del proceso w(k) y el ruido de medicin v(k) son secuencias
aleatorias de media cero, esto es:
{w(k) = {v(k)} = 0
(3.59)
(2.61)
(3.62)
donde P(k) es la matriz de covariancia del error del estimado tras las mediciones,
es decir del error de xe(k). Viene dada por la frmula:
(3.64)
Donde la matriz M(k) es la matriz de covarianza del error del vector xp(k) y se
calcula de manera recurrente mediante:
(3.65)
(3.66)
constantes pues lo nico que se requiere es que sean de valor conocido y que la
ganancia de Kalman se puede calcular de antemano pues no depende del valor
que tomen las variables ni sus estimados, evaluando recursivamente todas las
ecuaciones anteriores.
Ejercicio realizado.
Donde
(3.68)
(3.69)
(2.70)
L2 = (0.41861
Etcetera. . .
L2 = 0.41861.1783
(3.72)
1.783)T (3.72)
Chi Tsong Chen, Linear System. Theory and Design Oxford University
Press. 3ra Edicin. USA. 1998.
David Bardey y Hle Bonnet, Donal E. Kira Teora del control ptimo Una
gua
para
principiantes!
Universidad
del
Rosario
http://www.urosario.edu.co/economia/documentos/pdf/bi87.pdf, pagina web
consultada el 15 de julio de 2009.
Modelos
expresados
en
variables
de
estado.
http://materias.fi.uba.ar/7609/material/Clase%2002/02%2003%20Modelo%2
0en%20Variables%20de%20Estado.pdf. Pagina web consultada el 3 de
julio de 2009.
Video
(Controlador
lgico
programable),
Tomado
de:
http://www.youtube.com/watch?v=fKfKLzMYvtk.Pgina consultada el 1 de
julio de 2009
UNIDAD 2
Nombre de la
Unidad
Introduccin
Justificacin
Intencionalidades
Formativas
Denominacin de
captulos
Introduccin
El control feedback tambin tiene una serie de desventajas, entre las que se
pueden citar:
Entre las tcnicas para realizar control avanzado se pueden encontrar las
siguientes:
Control feedforward.
Control en cascada.
Control de relacin.
Control selectivo.
Como puede verse, cada una de las entradas llega al proceso pon un lugar
diferente, por lo que afectan de distinta forma a la variable controlada. La ecuacin
que describe al proceso es:
Vc=Vm*Gm-Vp*Gp
Vm=(R+Vp*Gp)/Gm
Hs*Fs=Fp*Cp*(Ts-Te)
Donde:
Fs=Fp*(Cp/Hs)*(R - Te)
La compensacin dinmica hace coincidir en el tiempo las variables para que nos
e produzca desviacin entre el valor real de la variable controlada y el valor
deseado como referencia.
Todo esto hace que sea necesario recurrir a un procedimiento que sea capaz de
mantener la variable controlada en su valor de referencia. Este procedimiento es el
control feedback.
Figura 2. 5 Diagrama tpico de nivel de un tanque para el ejemplo del control en cascada
Q = K * P1 P2
Esto hace que al disminuir P2 aumente el caudal de paso para la misma apertura
de vlvula. Se puede observar, por tanto, que un cambio en la diferencia de
presin ocasiona un cambio en el paso por la vlvula, que a su vez modifica el
nivel en el recipiente. En otra palabras, existe interaccin entre caudal y nivel, la
cual se puede de amortiguar efectuando control en cascada, tal como aparece en
la Figura 2.6. Con esta tcnica, tan pronto se modifique el caudal se llevar a cabo
la correccin necesaria sobre la vlvula antes que se vea afectado el nivel del
recipiente.
Llegados a este punto se puede ver que un sistema de control en cascada utiliza
dos controladores feedback. Solamente uno de ellos, denominado esclavo o
secundario, tiene salida al proceso, en este ejemplo el controlador de caudal. El
controlador de nivel, denominado mster o primario, se utiliza para fijar el punto de
ajuste del secundario. La variable a controlar es la medida del controlador
primario, mientras que la medida de caudal del secundario es una variable
intermedia.
Figura 2. 8 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilacin
Figura 2. 9 Diagrama de control entre nivel y caudal de salida del acumulador de una columna de destilacin
Este caso se puede hacer extensivo a todos los intercambios de calor utilizados en
proceso unitarios. Por ejemplo, en una columna de destilacin se pueden
presentar dos casos tpicos, como son:
Queda, por ltimo, comentar que a veces se utilizan sistemas con tres
controladores en cascada, como queda representado en la Figura 2.11.
En realidad estos casos suelen ser ms tericos que prcticos, por la dificultad
que existe para sintonizar tres lazos de control en serie. En cualquier caso, si se
utiliza este sistema de control, los parmetros de ajuste del lazo de composicin
del producto deben ser lo suficientemente relajados para no producir oscilacin en
el conjunto.
Con alternativa a los tres controladores en serie se puede utilizar alguno de los
sistemas siguientes:
Con este sistema se puede utilizar, por ejemplo, como controlador primario
principal el correspondiente a la composicin, y slo en caso de fallo de ste, o a
Figura 2. 13 Diagrama de un absorbedor en el que se elimina SH2 utilizando como absorbente Mono Etanol
Amina (MEA)
Donde se desea aadir el lquido en relacin al total y saber que este total
contiene un porcentaje del componente deseado (B). se utiliza para mezclar
las componentes, como se ver en el sistema de blending.
Cuando se trata de seleccionar entre los milivoltios generados por cada uno de los
termopares implicados.
Figura 2. 22 Comportamiento del control override para la medida del caudal de LPG
Figura 2. 23 Sistema de control override entre presin nivel en los equipos situados en cabeza de una
columna desetanizadora
Leccin 6. Generalidades
3. Utilizar los datos para determinar los parmetros no conocidos del modelo fsico
obtenido a base del estudio de propiedades y leyes fsicas del proceso estudiado.
En este caso se habla de modelos tailor-made de los cuales se debe estimar
solamente los valores de los parmetros no conocidos. Para ello se recurre a
ensayos de comportamiento o pruebas fsicas y/o a la utilizacin de tcnicas de
optimizacin.
.
El curso propuesto se centra en las dos primeras. Otro aspecto a tener en cuenta
ser el tipo de modelo matemtico que se pretende identificar. Hay varias
formas de catalogar los modelos matemticos [Ljung94]: deterministas o
estocsticos, dinmicos o estticos, de parmetros distribuidos o concentrados,
lineales o no lineales, y de tiempo continuo o tiempo discreto. Los tipos de
modelos que se pretende analizar en este curso sern:
(2.1)
= (a1
a2
...
an
b1
b2
...
bm)T (2.4)
(2.6)
(2.7)
o tambin
(2.8)
y entonces
(2.9)
(2.10)
Estos modelos tambin se llaman modelos ARX AR porque de refiere a la parte
autoregresiva y A(q1)y(k) y X es la entrada B(q1)u(k). Fsicamente no son los
mas sencillos por su evidencia en el procedimiento debido a que la entrada de
ruido blanco esta filtrada por la dinmica de A(q1). Este modelo es la eleccin
inicial en todo proceso de identificacin sin embargo tiene una gran desventaja
frente a otros modelos que consiste en una descripcin defectuosa de las
influencias de las perturbaciones
(2.12)
= (a1
...
ana
b1
...
bnb
c1
...
cnc)T (2.13)
Con
(2.15)
o tambin
(2.16)
y entonces
(2.17)
(2.18)
(2.19)
Modelo Box Jenkins: Una generalizacin evidente del modelo output error se
puede obtener modelando ms el error. Como descripcin ARMA para estos se
tiene la siguiente:
(2.20)
(2.21)
(3.22)
(2.23)
(3.24)
(3.25)
(3.26)
sistema de 2do orden
(3.27)
(3.28)
u(t) = sen(t)
(3.29)
(2.31)
(2.32)
La estimacin de la amplitud y de la fase se calcula mediante:
(2.33)
(2.34)
(2.35)
(2.36)
(2.37)
En el caso de tener acceso a datos en un intervalo de tiempo finito 0 < t < s , la
transformada de Fourier de las seales se determina mediante:
(2.38)
(2.39)
(2.40)
(2.41)
(2.42)
siendo T el periodo de muestreo y N=s/T.
(2.45)
(2.46)
(2.47)
( )
G q 1 =
1
(2.48)
D q 1
( )
(2.49)
Hacer una nueva estimacin por mnimos cuadrados utilizando las seales
filtradas. Este proceso debe repetirse, a partir de la segunda etapa, tantas veces
como sea necesario hasta conseguir la convergencia. La convergencia del
mtodo se evala comprobando que los residuos definidos obtenidos sean
blancos. Para ello puede utilizarse el test de auto correlacin. Para utilizarse este
mtodo deben definirse tanto el orden de la parte determinista como el orden de la
parte estocstica. Para simplificar el problema, la mayora de las veces se
considera que son del mismo orden.
La lgica borrosa (Fuzzy Logic) ha surgido como una herramienta lucrativa para el
control de subsistemas y procesos industriales complejos, as como tambin para
la electrnica de entretenimiento y hogar, sistemas de diagnstico y otros sistemas
expertos. Aunque la lgica borrosa se invent en Estados Unidos el crecimiento
rpido de esta tecnologa ha comenzado desde Japn y ahora nuevamente ha
alcanzado USA y tambin Europa. La lgica borrosa es todava un boom en
Japn, el nmero de cartas patentando aplicaciones aumenta exponencialmente.
Principalmente se trata de aplicaciones ms bien simples de lgica borrosa.
Lo borroso ha llegado a ser una palabra clave para vender. Los artculos
electrnicos sin componentes borrosos se estn quedando gradualmente
desfasados. Como una mordaza, que muestra la popularidad de la lgica borrosa,
cada vez es ms frecuente un sello con "fuzzy logic" impreso sobre el producto.
En Japn la investigacin sobre lgica borrosa es apoyada ampliamente con un
presupuesto enorme. En Europa y USA se estn realizando esfuerzos para
alcanzar al tremendo xito japons. Por ejemplo, la NASA emplea lgica borrosa
para el complejo proceso de maniobras de acoplamiento.
La lgica borrosa es bsicamente una lgica multievaluada que permite valores
intermedios para poder definir evaluaciones convencionales como s/no,
verdadero/falso, negro/blanco, etc. Las nociones como "ms bien caliente" o "poco
fro" pueden formularse matemticamente y ser procesados por computadoras. De
esta forma se ha realizado un intento de aplicar una forma ms humana de pensar
en la programacin de computadoras. La lgica borrosa se inici en 1965 por Lotfi
A. Zadeh, profesor de ciencia de computadoras en la Universidad de California en
Berkeley.
Parece que la Lgica Borrosa es algo reciente y en lo que se lleva trabajando poco
tiempo pero sus orgenes se remontan a los tiempos de los filsofos Aristteles y
Platn. Ellos son los primeros en considerar que las cosas no tienen porqu ser de
un cierto tipo o dejar de serlo, sino que hay una escala intermedia enre los dos
extremos. Es ms son los pioneros en considerar que existan diferentes grados
de verdad y falsedad. Por ejemplo, en el caso de los colores, entre el blanco y el
negro hay una escala de tonalidades grises.
Despus de stos, en el siglo XVIII, David Hume e Immanuel Kant continuaron
pensando estas ideas. Ambos concluyeron en que el razonamiento se adquiere
gracias a las vivencias a lo largo de nuestra vida. Hume crea en la lgica del
sentido comn y Kant pensaba que slo los matemticos podan proveer
Las tesis que propone surgen del estudio de pensadores de distintas disciplinas
que como l, tenan una visin de los problemas diferente de la lgica tradicional.
La paradoja del conjunto de Bertrand Russell, el principio de incertidumbre de la
fsica cuntica de Werner Heisenberg, la teora de los conjuntos vagos de Max
Black y la aportacin de Jan Lukasiewiz, influyeron para que Zadeh publicase el
ensayo "Fuzzy Sets" en la revista "Information and Control" y tres aos despus
en 1968, "Fuzzy Algorithm".
Al comienzo las ideas publicadas por Zadeh no fueron seguidas por la comunidad
cientfica del momento, pero con el tiempo comenz a tener seguidores lo que
produjo que sus teoras fuesen ampliadas y se asentaran sus conocimientos.
La intencin de Zadeh era la creacin de un formalismo para manejar de forma
ms eficiente la imprecisin del razonamiento humano. Es en 1971, cuando realiza
la publicacin de "Quantitative Fuzzy Semantics" en donde aparecen los
elementos formales que dan lugar a la metodologa de la Lgica Borrosa y de sus
aplicaciones tal y como se conocen en la actualidad.
A partir de 1973, con la teora bsica de los controladores borrosos de Zadeh,
otros investigadores comenzaron a aplicar la Lgica Borrosa a diversos procesos.
Se establecen varios grupos de investigacin en lgica difusa en algunas
pequeas universidades japonesas; los profesores Terano y Shibata en Tokio y
los profesores Tanaka y Asai en Osaka hacen grandes aportaciones tanto al
desarrollo de la teora de la Lgica Borrosa como al estudio de sus aplicaciones.
En 1987 Hitachi usa un controlador fuzzy para el control del tren de Sendai, el cual
usa uno de los sistemas ms novedosos creados por el hombre. Desde entonces,
el controlador ha realizado su trabajo correctamente con la consiguiente
satisfaccin
por
parte
de
los
usuarios
de
dicho
tren.
Es tambin en este ao cuando la empresa Omron desarrolla los primeros
Se puede interpretar los elementos que han asignado el nmero 1 como los
elementos que estn en el conjunto A y los elementos que han asignado el
nmero 0 como los elementos que no estn en el conjunto A.
Este concepto es suficiente para muchas reas de aplicacin. Pero nosotros
podemos encontrar fcilmente situaciones donde carece de flexibilidad. Para
comprender este concepto veamos un ejemplo:
Se desea describir el conjunto de gente joven. Ms formalmente se puede
denotar:
B = {conjunto de gente joven}
Como - en general - la edad comienza en 0, el rango ms inferior de este conjunto
est claro. El rango superior, por otra parte, es ms bien complicado de definir.
Como un primer intento colocamos el rango superiora en, digamos, 20 aos. Por
lo tanto nosotros definimos B como un intervalo denominado:
B = [0,20]
Ahora la pregunta es: por qu alguien es en su 20 cumpleaos joven y al da
siguiente no? Obviamente, este es un problema estructural, porque si movemos el
lmite superior del rango desde 20 a un punto arbitrario podemos plantear la
misma pregunta.
Una manera ms natural de construir el conjunto B estara en suavizar la
separacin estricta entre el joven y el no joven. Nosotros haremos esto para
permitir no solamente la (crispada) decisin "l/ella SI est en el conjunto de gente
joven" o "l/ella NO est en el conjunto de gente joven", sino tambin las frases
ms flexibles como "l/ella SI pertenece un poquito ms al conjunto de gente
joven" o "l/ella NO pertenece aproximadamente al conjunto de gente joven".
De esta forma unos 25 aos de edad todava sera joven al grado de 50 por ciento.
Ahora sabemos qu es un conjunto borroso. Pero qu se puede hacer con l?.
La figura 2.36 siguiente muestra la operacin AND (Y) del conjunto borroso A y el
nmero borroso B (el resultado es la lnea azul).
Figura 2. 37 Operacin OR
Aprciese que, para hacerlo ms fcil, suponemos que al principio la prtiga est
en una posicin cercana a la central para que un ngulo mayor de, digamos, 45
grados en cualquier direccin no pueda - por definicin - ocurrir.
Ahora se da varias reglas que dicen qu hacer en situaciones concretas:
Considere por ejemplo que la prtiga est en la posicin central (el ngulo es cero)
y no se mueve (la velocidad angular es cero). Obviamente esta es la situacin
deseada, y por lo tanto no tenemos que hacer nada (la velocidad es cero).
Consideremos otro caso: el polo est en la posicin central como antes, pero est
en movimiento a baja velocidad en la direccin positiva. Naturalmente nosotros
tendramos que compensar el movimiento de la prtiga moviendo la plataforma en
la misma direccin a baja velocidad.
De esta forma hemos constituido dos reglas que pueden ponerse en una forma
ms formalizada como esta:
donde NA es una (usual) abreviatura para negativa alta, NB para negativa baja,
etc.
A continuacin mostraremos como estas reglas pueden aplicarse con valores
concretos para el ngulo y velocidad angular. Para ello vamos a definir dos valores
explcitos para el ngulo y la velocidad angular para operar con ellos.
Ahora se muestra como aplicar nuestras reglas a esta situacin real. Observe
como aplicar la regla
Si el ngulo es cero y la velocidad angular es cero entonces la velocidad ser cero
a los valores que hemos definido.
Esta es la variable lingstica "ngulo" donde nos centramos en el conjunto "cero"
y el ngulo actual:
Nos damos cuenta que nuestro valor real pertenece al conjunto borroso "cero" en
un grado de 0.75:
Nos damos cuenta que nuestro valor real pertenece al conjunto borroso "cero" en
un grado de 0.4:
Como las dos partes de la condicin de nuestra regla estn unidas por una Y
(operacin lgica AND) calculamos el mn(0.75,0.4)=0.4 y cortamos el conjunto
borroso "cero" de la variable "velocidad" a este nivel (segn nuestra regla):
El resultado de la regla.
Si el ngulo es cero y la velocidad angular es positiva baja entonces la velocidad
ser positiva baja es:
El resultado de la regla.
Si el ngulo es positivo bajo y la velocidad angular es negativa baja entonces la
velocidad ser cero es:
Seccin 1. Definiciones
Interseccin de conjuntos
Nosotros llamamos un nuevo conjunto generado desde dos conjuntos
determinados A y B, interseccin de A y B, si el nuevo conjunto contiene
exactamente esos elementos que estn contenidos en A y en B.
Unificacin de conjuntos
Nosotros llamamos un nuevo conjunto generado desde dos conjuntos
determinados A y B, unificacin de A y B, si el nuevo conjunto contiene todos los
elementos que se contienen en A o en B o en ambos.
Negacin de conjuntos
Nosotros denominamos al nuevo conjunto que conteniendo todos los elementos
que estn en el universo de discurso pero no en el conjunto A la negacin de A.
Variables lingsticas
Un variable lingstica es un quntuple (X,T(X),U,G,M,), donde X es el nombre de
la variable, T(X) es el trmino conjunto (es decir, el conjunto de nombres de
valores lingsticos de X), U es el universo de discurso, G es la gramtica para
generar los nombres y M es un conjunto de reglas semnticas para asociar cada X
con su significado.
12. Software
para
diagnstico
http://espejos.unesco.org.uy/simplac2002/Ponencias/Inforedu
mdico.
Seccin 3. Ejemplo
A continuacin se muestra una interfaz que est en desarrollo realizada mediante
Lgica Borrosa, EDIMED.
D.C. Evans, D. Rees, D.L. Jones. Design of test signals for identification of
linear systems with nonlinear distortion. IEEE Trans. on Instrumentation and
Measurement, 16, 6, p. 768-774, 1992.
Haupt Randy and Haupt Sue , Practical Genetic Algorithms John Wiley and
Son 1998.
I.D. Landau. System identification and control design, Prentice Hall, 1990.
L.Ljung. System identification Theory for the user, Prentice Hall, 1987.
Mquinas con rostro humano Los hombres estn enseando a los robots a
pensar.
Cmo?
Con
la
lgica
borrosa.
http://www.elpais.com/articulo/sociedad/Maquinas/rostro/humano/elpepusoc
/20080921elpepisoc_1/Tes Pgina Web consultada el 15 de julio de 2009
Norgard M., Ravn O., Pulsen N., Hansen L. , Neural Networks for Modelling
and Control of Dynamic Systems Springer 2000.
UNIDAD 3
Nombre de la
Unidad
Introduccin
Justificacin
Intencionalidades
Formativas
Denominacin de
captulos
(1.1)
En esta ecuacin e1 = yp ym y el ndice J se evala sobre el periodo T fijo, en el
cual los parmetros permanecen constantes. En el instante (t+T) los parmetros
son ajustados en la direccin decreciente de J.
(1.2)
debe ser una matriz cuadrada definida positiva, que representa la ganancia de
adaptacion. Usualmente es diagonal. Teniendo en cuenta que:
(1.3)
Sustituyendo tenemos:
(1.4)
(1.5)
2. Encontrar una funcin de Lyapunov como una funcin del error entre las
seales y del error en los parmetros
funcin toma la forma:
(1.6)
(1.7)
El primer trmino garantiza que la derivada es definida negativa, por lo que,
haciendo el resto igual a cero se tiene una posible solucin. La matriz Q es
definida positiva. Las matrices P y Q, para un sistema gobernado por una matriz
A, estn relacionadas por la ecuacin de Lyapunov:
Q = AT P + P A
(1.8)
Considerando el sistema de la figura 3.3, donde la seal de control esta dada por:
u = Kr (1.10)
siendo K, la ganancia ajustable que hay que calcular, la deduccin de la ley de
adaptacin es como sigue:
(1.11)
(5.12)
(1.13)
Teniendo en cuenta que el trmino (bK 1) es proporcional al error en el
parmetro, a funcin de Lyapunov en este caso puede elegirse como:
(1.14)
Su derivada resulta ser:
(1.15)
(1.16)
(1.17)
El primer trmino es negativo. As que haciendo el resto igual a cero se obtiene la
ley de adaptacin:
(1.18)
(1.19)
En las figuras (1.4) y (1.5) se representa una simulacin del ejemplo descrito
cuando el parmetro b vale inicialmente 4 y en el instante 20 pasa a valer 2.
Puede observarse como la adaptacin es buena en ambos casos, siendo ms
rpida en el caso de la figura (1.4), dado que la ganancia de adaptacin es
superior. En lnea a trazos se representa la salida del modelo de referencia y en
lnea continua la salida del modelo ajustable. La principal desventaja del mtodo
de Lyapunov es que no es un mtodo sistemtico, dado que hay que encontrar la
funcin de Lyapunov V adecuada en cada caso.
Con este mtodo tambin se consigue una ley de adaptacin estable. Como en el
mtodo de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estas
ecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal y
variable con el tiempo. La primera parte contiene usualmente al modelo de
referencia y su salida es la seal de error que es utilizada para la ley de
adaptacin.
1. La parte lineal (llmese G(s)), debe ser estrictamente positiva. Ello significa
que:
(a) G(s) debe ser real si s es real. (b) los polos de G(s) deben tener parte real
negativa, y (c) la parte real de G(j) de ser mayor que cero para 1 < < 1.
(1.20)
Siendo v el vector de entrada y el vector de salida de la parte no lineal, y
una constante finita positiva que no depende de t.
(1.22)
El vector de error generalizado viene dado por:
e=xy
(1.23)
tal que las matrices de parmetros AS(e, t) y BS(e, t) sean modificadas de forma
que el error tienda a cero para cualquier entrada u. La derivada del error puede
obtenerse restando las ecuaciones anteriores, donde adems se suma y
resta el termino AMy:
(1.24)
pudindose expresar como:
(1.25)
Si se desea que el mecanismo de adaptacin tenga memoria (lo cual es lo ms
habitual), debe considerarse la inclusin de un integrador en el mecanismo
de adaptacin.
Esto tendr el efecto de que los parmetros ajustables
dependern no solo del error en un instante sino tambin de los valores pasados.
Por ello la ley de adaptacin se define como:
(1.26)
(1.27)
Las ecuaciones anteriores pueden representarse segn la figura 3.4, sistema que
se puede descomponer en un sistema lineal y otro no lineal, al cual se le pueden
aplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad).
Para conseguir cumplir dicho criterio, por un lado la parte lineal se modifica
aadindole un termino D en serie. En cuanto a las funciones F y G, caben
muchas posibilidades de eleccin, pero teniendo en cuenta que deseamos que el
error en rgimen permanente sea cero, pueden elegirse de la forma:
(1.28)
(1.29)
La estructura final del sistema ser a la representada en la figura (3.6) donde los
parmetros de diseo seran las funciones D,1 ,2 ,1 y 2. La resolucin se
realiza para cada caso concreto y no de forma general, ya que el caso general
resulta bastante complicado.
Esta dificultad de los sistemas de computo que trabajan bajo la filosofa de los
sistemas secuenciales, desarrollados por Von Neuman, ha hecho que un gran
nmero de investigadores centre su atencin en el desarrollo de nuevos sistemas
de tratamiento de la informacin, que permitan solucionar problemas cotidianos,
tal como lo hace el cerebro humano; este rgano biolgico cuenta con varias
caractersticas deseables para cualquier sistema de procesamiento digital, tales
como:
1.
Es robusto y tolerante a fallas, diariamente mueren neuronas sin afectar su
desempeo.
2.
Es flexible, se ajusta a nuevos ambientes por aprendizaje, no hay que
programarlo.
3.
4.
Es altamente paralelo
5.
Las RNA son una teora que an esta en proceso de desarrollo, su verdadera
potencialidad no se ha alcanzado todava; aunque los investigadores han
desarrollado potentes algoritmos de aprendizaje de gran valor prctico, las
representaciones y procedimientos de que se sirve el cerebro, son an
desconocidas. Tarde o temprano los estudios computacionales del aprendizaje
con RNA acabarn por converger a los mtodos descubiertos por evolucin,
cuando eso suceda, muchos datos empricos concernientes al cerebro
comenzarn sbitamente a adquirir sentido y se tornarn factibles muchas
aplicaciones desconocidas de las redes neuronales.
Todas las neuronas conducen la informacin de forma similar, esta viaja a lo largo
de axones en breves impulsos elctricos, denominados potenciales de accin; los
potenciales de accin que alcanzan una amplitud mxima de unos 100 mV y duran
1 ms, son resultado del desplazamiento a travs de la membrana celular de iones
de sodio dotados de carga positiva, que pasan desde el fluido extracelular hasta el
citoplasma intracelular; la concentracin extracelular de sodio supera
enormemente la concentracin intracelular.
La membrana en reposo mantiene un gradiente de potencial elctrico de -70mv, el
signo negativo se debe a que el citoplasma intracelular est cargado
negativamente con respecto al exterior; los iones de sodio no atraviesan con
facilidad la membrana en reposo, los estmulos fsicos o qumicos que reducen el
gradiente de potencial, o que despolaricen la membrana, aumentan su
permeabilidad al sodio y el flujo de este ion hacia el exterior acenta la
despolarizacin de la membrana, con lo que la permeabilidad al sodio se
incrementa ms an.
Alcanzado un potencial crtico denominado "umbral", la realimentacin positiva
produce un efecto regenerativo que obliga al potencial de membrana a cambiar de
signo. Es decir, el interior de la clula se torna positivo con respecto al exterior, al
cabo de 1 ms, la permeabilidad del sodio decae y el potencial de membrana
retorna a -70mv, su valor de reposo. Tras cada explosin de actividad inica, el
mecanismo de permeabilidad del sodio se mantiene refractario durante algunos
milisegundos; la tasa de generacin de potenciales de accin queda as limitada a
unos 200 impulsos por segundo, o menos.
Aunque los axones puedan parecer hilos conductores aislados, no conducen los
impulsos elctricos de igual forma, como hilos elctricos no seran muy valiosos,
pues su resistencia a lo largo del eje es demasiado grande y a resistencia de la
membrana demasiado baja; la carga positiva inyectada en el axn durante el
potencial de accin queda disipada uno o dos milmetros ms adelante, para que
la seal recorra varios centmetros es preciso regenerar frecuentemente el
potencial de accin a lo largo del camino la necesidad de reforzar repetidamente
esta corriente elctrica limita a unos 100 metros por segundo la velocidad mxima
de viaje de los impulsos, tal velocidad es inferior a la millonsima de la velocidad
de una seal elctrica por un hilo de cobre.
Los potenciales de accin, son seales de baja frecuencia conducidas en forma
muy lenta, estos no pueden saltar de una clula a otra, la comunicacin entre
neuronas viene siempre mediada por transmisores qumicos que son liberados en
las sinpsis. Un ejemplo de comunicacin entre neuronas y del proceso qumico
de la liberacin de neurotransmisores se ilustra en la figura 3.9
Las RNA no alcanzan la complejidad del cerebro, sin embargo hay dos aspectos
similares entre redes biolgicas y artificiales, primero los bloques de construccin
de ambas redes son sencillos elementos computacionales (aunque las RNA son
mucho ms simples que las biolgicas) altamente interconectados; segundo, las
conexiones entre neuronas determinan la funcin de la red.
Existen varias formas de nombrar una neurona artificial, es conocida como nodo,
neuronodo, celda, unidad o elemento de procesamiento (PE); En la figura 3.11 se
observa un PE en forma general y su similitud con una neurona biolgica
Las seales de entrada a una neurona artificial X1, X2,.., Xn son variables
continuas en lugar de pulsos discretos, como se presentan en una neurona
biolgica. Cada seal de entrada pasa a travs de una ganancia o peso, llamado
peso sinptico o fortaleza de la conexin cuya funcin es anloga a la de la
funcin sinptica de la neurona biolgica. Los pesos pueden ser positivos
(excitatorios), o negativos (inhibitorios), el nodo sumatorio acumula todas las
seales de entradas multiplicadas por los pesos o ponderadas y las pasa a la
salida a travs de una funcin umbral o funcin de transferencia. La entrada neta a
cada unidad puede escribirse de la siguiente manera
(2.1)
Una idea clara de este proceso se muestra en la figura 3.13, en donde puede
observarse el recorrido de un conjunto de seales que entran a la red.
Una vez que se ha calculado la activacin del nodo, el valor de salida equivale a
(2.2)
Donde
y que
Las entradas a la red sern ahora presentadas en el vector p, que para el caso de
una sola neurona contiene solo un elemento, w sigue representando los pesos y la
nueva entrada b es una ganancia que refuerza la salida del sumador n, la cual es
la salida neta de la red; la salida total est determinada por la funcin de
transferencia , la cual puede ser una funcin lineal o no lineal de n, y que es
escogida dependiendo de las especificaciones del problema que la neurona tenga
que resolver; aunque las RNA se inspiren en modelos biolgicos no existe ninguna
limitacin para realizar modificaciones en las funciones de salida, as que se
encontrarn modelos artificiales que nada tienen que ver con las caractersticas
del sistema biolgico.
(2.3)
(2.4)
(2.6)
Esta funcin es comnmente usada en redes multicapa, como la Backpropagation,
en parte porque la funcin logsig es diferenciable.
Nombre
Entrada /Salida
Funcin
hardlim
Limitador Fuerte
Limitador
Simtrico
Icono
Fuerte
hardlims
Lineal Positiva
poslin
Lineal
purelin
Lineal Saturado
satlin
Lineal
Simtrico
satlins
Saturado
Sigmoidal Logartmico
logsig
Tangente
Hiperblica
tansig
Sigmoidal
compet
Competitiva
Tabla 3 1 Funciones de Transferencia
La neurona tiene una ganancia b, la cual llega al mismo sumador al que llegan las
entradas multiplicadas por los pesos, para formar la salida n,
(2.7)
Esta expresin puede ser escrita en forma matricial
(2.8)
Los subndices de la matriz de pesos representan los trminos involucrados en la
conexin, el primer subndice representa la neurona destino y el segundo,
representa la fuente de la seal que alimenta a la neurona. Por ejemplo, los
ndices de w1,2 indican que este peso es la conexin desde la segunda entrada a
la primera neurona. Esta convencin se hace ms til cuando hay ms de una
neurona, o cuando se tiene una neurona con demasiados parmetros; en este
caso la notacin de la figura 3.20, puede resultar inapropiada y se prefiere emplear
la notacin abreviada representada en la figura 3.21
En la figura 3.23 se han dispuesto los smbolos de las variables de tal manera que
describan las caractersticas de cada una de ellas, por ejemplo la entrada a la red
es el vector p cuya longitud R aparece en su parte inferior, W es la matriz de
pesos con dimensiones SxR expresadas debajo del smbolo que la representa
dentro de la red, a y b son vectores de longitud S el cual, como se ha dicho
anteriormente representa el nmero de neuronas de la red.
Ahora, si se considera una red con varias capas, o red multicapa, cada capa
tendr su propia matriz de peso W, su propio vector de ganancias b, un vector de
entradas netas n, y un vector de salida a. La versin completa y la versin en
notacin abreviada de una red de tres capas, pueden ser visualizadas en las
figuras 3.23 y 3.24, respectivamente.
Las redes multicapa son ms poderosas que las redes de una sola capa, por
ejemplo, una red de dos capas que tenga una funcin sigmoidal en la primera
capa y una funcin lineal en la segunda, puede ser entrenada para aproximar
muchas funciones de forma aceptable, una red de una sola capa no podra hacer
esto como se ver en captulos posteriores.
Un tipo de redes, un poco diferente a las que se han estudiado hasta el momento,
son las redes recurrentes, estas contienen una realimentacin hacia atrs o
retroalimentacin, es decir algunas de sus salidas son conectadas a sus entradas.
Un tipo de red recurrente de tiempo discreto es mostrado en la figura 3.25.
Para este tipo particular de red el vector p suple las condiciones iniciales (a(0)= p),
y la salida est determinada por:
(2.9)
Donde a(1) y a(2), corresponden a la salida de la red para el primer y segundo
intervalo de tiempo, respectivamente. La red alcanzar su estado estable cuando
la salida para un instante de tiempo sea la misma salida del instante de tiempo
anterior.
Las redes recurrentes son potencialmente ms poderosas que las redes con
realimentacin hacia delante. En este tipo de redes se introducen tambin dos
nuevos conceptos, el bloque de retardo de la figura 3.27 y el bloque integrador de
la figura 3.28
Retardo
(2.10)
La salida del bloque de retardo es el valor de entrada retrasado en un paso de
tiempo, este bloque requiere que la salida sea inicializada con el valor a(0) para el
tiempo t=0; a(0) se convierte en la salida de la red para el instante de tiempo
inicial.
Integrador
(2.11)
Una red recurrente cuya implementacin necesita un bloque integrador se ilustra
en la figura 3.28.
En general las redes neuronales se pueden clasificar de diversas maneras, segn
su topologa, forma de aprendizaje (supervisado o no supervisado), tipos de
funciones de activacin, valores de entrada (binarios o continuos); un resumen de
esta clasificacin se observa en la figura 3.29
Seccin 1. Antecedentes
La primera red neuronal conocida, fue desarrollada en 1943 por Warren McCulloch
y Walter Pitts; esta consista en una suma de las seales de entrada, multiplicadas
por unos valores de pesos escogidos aleatoriamente. La entrada es comparada
con un patrn preestablecido para determinar la salida de la red. Si en la
comparacin, la suma de las entradas multiplicadas por los pesos es mayor o igual
que el patrn preestablecido la salida de la red es uno (1), en caso contrario la
salida es cero (0). Al inicio del desarrollo de los sistemas de inteligencia artificial,
se encontr gran similitud entre su comportamiento y el de los sistemas biolgicos
y en principio se crey que este modelo poda computar cualquier funcin
aritmtica o lgica.
La red tipo Perceptrn fue inventada por el psiclogo Frank Rosenblatt en el ao
1957. Su intencin era ilustrar algunas propiedades fundamentales de los
sistemas inteligentes en general, sin entrar en mayores detalles con respecto a
condiciones especficas y desconocidas para organismos biolgicos concretos.
Rosenblatt crea que la conectividad existente en las redes biolgicas tiene un
elevado porcentaje de aleatoriedad, por lo que se opona al anlisis de McCulloch
Pitts en el cual se empleaba lgica simblica para analizar estructuras bastante
idealizadas. Rosenblatt opinaba que la herramienta de anlisis ms apropiada era
la teora de probabilidades, y esto lo llev a una teora de separabilidad estadstica
que utilizaba para caracterizar las propiedades ms visibles de estas redes de
interconexin ligeramente aleatorias.
(2.13)
A pesar de esta limitacin, el Perceptrn es an hoy una red de gran importancia,
pues con base en su estructura se han desarrollado otros modelos de red
neuronal como la red Adaline y las redes multicapa.
Figura 3. 33 Perceptrn
(2.14)
Los pesos para una neurona estn representados por un vector compuesto de los
elementos de la i-sima fila de W
(2.15)
De esta forma y empleando la funcin de transferencia hardlim la salida de la
neurona i de la capa de salida
(2.16)
El Perceptrn, al constar de una sola capa de entrada y otra de salida con una
nica neurona, tiene una capacidad de representacin bastante limitada, este
modelo slo es capaz de discriminar patrones muy sencillos, patrones linealmente
separables (concepto que se estudiar en la seccin 2.1.4), el caso ms conocido
es la imposibilidad del Perceptrn de representar la funcin OR EXCLUSIVA.
Leccin 9. Backpropagation
Seccin 1. Antecedentes
La regla de aprendizaje del Perceptrn de Rosenblatt y el algoritmo LMS de
Widrow y Hoff fueron diseados para entrenar redes de una sola capa. Como se
discuti anteriormente, estas redes tienen la desventaja que solo pueden resolver
problemas linealmente separables, fue esto lo que llevo al surgimiento de las
redes multicapa para sobrepasar esta dificultad en las redes hasta entonces
conocidas.
El primer algoritmo de entrenamiento para redes multicapa fue desarrollado por
Paul Werbos en 1974, este se desarroll en un contexto general, para cualquier
tipo de redes, siendo las redes neuronales una aplicacin especial, razn por la
cual el algoritmo no fue aceptado dentro de la comunidad de desarrolladores de
redes neuronales. Fue solo hasta mediados de los aos 80 cuando el algoritmo
Backpropagation o algoritmo de propagacin inversa fue redescubierto al mismo
tiempo por varios investigadores, David Rumelhart, Geoffrey Hinton y Ronal
Williams, David Parker y Yann Le Cun. El algoritmo se populariz cuando fue
incluido en el libro "Parallel Distributed Processing Group" por los siclogos David
Rumelhart y James McClelland. La publicacin de este libro trajo consigo un auge
en las investigaciones con redes neuronales, siendo la Backpropagation una de
las redes ms ampliamente empleadas, aun en nuestros das.
Uno de los grandes avances logrados con la Backpropagation es que esta red
aprovecha la naturaleza paralela de las redes neuronales para reducir el tiempo
requerido por un procesador secuencial para determinar la correspondencia entre
unos patrones dados. Adems el tiempo de desarrollo de cualquier sistema que se
este tratando de analizar se puede reducir como consecuencia de que la red
puede aprender el algoritmo correcto sin que alguien tenga que deducir por
anticipado el algoritmo en cuestin.
La mayora de los sistemas actuales de computo se han diseado para llevar a
cabo funciones matemticas y lgicas a una velocidad que resulta
asombrosamente alta para el ser humano. Sin embargo la destreza matemtica no
es lo que se necesita para solucionar problemas de reconocimiento de patrones
en entornos ruidosos, caracterstica que incluso dentro de un espacio de entrada
relativamente pequeo, puede llegar a consumir mucho tiempo. El problema es la
naturaleza secuencial del propio computador; el ciclo tomar ejecutar de la
naturaleza Von Neumann solo permite que la mquina realice una operacin a la
vez. En la mayora de los casos, el tiempo que necesita la mquina para llevar a
cabo cada instruccin es tan breve (tpicamente una millonsima de segundo) que
el tiempo necesario para un programa, as sea muy grande, es insignificante para
los usuarios. Sin embargo, para aquellas aplicaciones que deban explorar un gran
espacio de entrada o que intentan correlacionar todas las permutaciones posibles
de un conjunto de patrones muy complejo, el tiempo de computacin necesario se
hace bastante grande.
Lo que se necesita es un nuevo sistema de procesamiento que sea capaz de
examinar todos los patrones en paralelo. Idealmente ese sistema no tendra que
ser programado explcitamente, lo que hara es adaptarse a s mismo para
aprender la relacin entre un conjunto de patrones dado como ejemplo y ser capaz
de aplicar la misma relacin a nuevos patrones de entrada. Este sistema debe
estar en capacidad de concentrarse en las caractersticas de una entrada arbitraria
que se asemeje a otros patrones vistos previamente, sin que ninguna seal de
ruido lo afecte. Este sistema fue el gran aporte de la red de propagacin inversa,
Backpropagation.
La Backpropagation es un tipo de red de aprendizaje supervisado, que emplea un
ciclo propagacin adaptacin de dos fases. Una vez que se ha aplicado un
patrn a la entrada de la red como estmulo, este se propaga desde la primera
capa a travs de las capas superiores de la red, hasta generar una salida. La
seal de salida se compara con la salida deseada y se calcula una seal de error
para cada una de las salidas.
Las salidas de error se propagan hacia atrs, partiendo de la capa de salida, hacia
todas las neuronas de la capa oculta que contribuyen directamente a la salida. Sin
embargo las neuronas de la capa oculta solo reciben una fraccin de la seal total
del error, basndose aproximadamente en la contribucin relativa que haya
aportado cada neurona a la salida original. Este proceso se repite, capa por capa,
hasta que todas las neuronas de la red hayan recibido una seal de error que
describa su contribucin relativa al error total. Basndose en la seal de error
percibida, se actualizan los pesos de conexin de cada neurona, para hacer que la
red converja hacia un estado que permita clasificar correctamente todos los
patrones de entrenamiento.
La importancia de este proceso consiste en que, a medida que se entrena la red,
las neuronas de las capas intermedias se organizan a s mismas de tal modo que
las distintas neuronas aprenden a reconocer distintas caractersticas del espacio
total de entrada. Despus del entrenamiento, cuando se les presente un patrn
arbitrario de entrada que contenga ruido o que est incompleto, las neuronas de la
capa oculta de la red respondern con una salida activa si la nueva entrada
contiene un patrn que se asemeje a aquella caracterstica que las neuronas
individuales hayan aprendido a reconocer durante su entrenamiento. Y a la
inversa, las unidades de las capas ocultas tienen una tendencia a inhibir su salida
si el patrn de entrada no contiene la caracterstica para reconocer, para la cual
han sido entrenadas.
Varias investigaciones han demostrado que, durante el proceso de entrenamiento,
la red Backpropagation tiende a desarrollar relaciones internas entre neuronas con
el fin de organizar los datos de entrenamiento en clases. Esta tendencia se puede
extrapolar, para llegar a la hiptesis consistente en que todas las unidades de la
capa oculta de una Backpropagation son asociadas de alguna manera a
caractersticas especficas del patrn de entrada como consecuencia del
entrenamiento. Lo que sea o no exactamente la asociacin puede no resultar
evidente para el observador humano, lo importante es que la red ha encontrado
una representacin interna que le permite generar las salidas deseadas cuando se
le dan las entradas, en el proceso de entrenamiento. Esta misma representacin
interna se puede aplicar a entradas que la red no haya visto antes, y la red
clasificar estas entradas segn las caractersticas que compartan con los
ejemplos de entrenamiento.
de salida. Las clases o categoras deben ser creadas por la propia red, puesto que
se trata de un aprendizaje no supervisado a travs de las correlaciones entre los
datos de entrada.
A principios de 1959, Frank Rosenblatt cre su simple clasificador espontneo,
una red de aprendizaje no supervisado basado en el Perceptrn, el cual aprenda
a clasificar vectores de entrada en dos clases con igual nmero de trminos.
A finales de los aos 60s y principios de los 70s, Stephen Grossberg introdujo
muchas redes competitivas que usaban inhibicin lateral obteniendo buenos
resultados. Algunos de los comportamientos tiles obtenidos por l, fueron la
supresin del ruido, aumento del contraste y normalizacin de vectores.
En 1973, Christoph Von Der Malsburg introduce la regla del mapa de organizacin
propia, que permita a la red clasificar entradas en las cuales las neuronas que
estuviesen en un vecindario cercano a la neurona ganadora, respondieran a
entradas similares. La topologa de esta red imitaba de alguna forma las
estructuras encontradas en la corteza visual de los gatos, estudiada por David
Hubel y Torten Wiesel. Su regla de aprendizaje gener gran inters, pero esta
utilizaba un clculo no local para garantizar que los pesos fueran normalizados,
este hecho haca este modelo biolgicamente poco posible.
Grossberg extendi el trabajo de Von Der Malsburg, redescubriendo la regla
Instar. Grossberg mostr que la regla Instar removi la necesidad de renormalizar
los pesos, porque los vectores de pesos que aprendan a reconocer vectores de
entrada normalizados, automticamente se normalizarn ellos mismos.
El trabajo de Grossberg y Von Der Malsburg enfatiz la posibilidad biolgica de
sus redes. Otro exitoso investigador, Tuevo Kohonen ha sido tambin un fuerte
proponente de las redes competitivas; sin embargo, su nfasis ha sido en
aplicaciones para ingeniera y en descripciones de eficiencia matemtica de las
redes. Durante la dcada de los 70 Kohonen desarroll una versin simplificada
de la regla Instar, inspirada tambin en la red de Von Der Malsburg y Grossberg,
de esta forma encontr una manera muy eficiente de incorporar topologa a una
red competitiva.
Otra forma de aplicar este tipo de aprendizaje fue propuesta por Rumelhart y
Zisper [32] en 1985, quienes utilizaban redes multicapa dividiendo cada capa en
grupos de neuronas, de tal forma que stas disponan de conexiones inhibitorias
con otras neuronas de su mismo grupo y conexiones excitadoras con las neuronas
de la siguiente capa; en una red de este tipo, despus de recibir diferentes
informaciones de entrada, cada neurona en cada grupo se especializa en la
respuesta a determinadas caractersticas de los datos de entrada.
En este tipo de redes cada neurona tiene asignado un peso total (suma de todos
los pesos de las conexiones que tiene a su entrada), el aprendizaje afecta slo a
las neuronas ganadoras (activas), en las que se redistribuye el peso total entre sus
conexiones y se sustrae una porcin de los pesos de todas las conexiones que
llegan a la neurona vencedora, repartiendo esta cantidad por igual entre todas las
conexiones procedentes de unidades activas, por tanto la variacin del peso de
una conexin entre una unidad i y otra j ser nula si la neurona j no recibe
excitacin por parte de la neurona i (no vence en presencia de un estmulo por
parte de i) y se modificar (se reforzar) si es excitada por dicha neurona.
Una variacin del aprendizaje supervisado aplicado a redes multicapa consiste en
imponer una inhibicin mutua entre neuronas nicamente cuando estn a cierta
distancia unas de otras (suponiendo que las neuronas se han dispuesto
geomtricamente, por ejemplo formando capas bidimendisionales), existe
entonces un rea o regin de vecindad alrededor de las neuronas que constituye
un grupo local.
Fukushima emple esta idea en 1975 para una red multicapa llamada Cognitron,
fuertemente inspirada en la anatoma y fisiologa del sistema visual humano y en
1980 el mismo Fukushima en una versin mejorada de la anterior a la que llam
Necognitron, present una variacin de esta red utilizando aprendizaje
supervisado. El Necognitrron dispona de un gran nmero de capas con
arquitectura muy especfica de interconexiones entre ellas y era capaz de
aprender a diferenciar caracteres, aunque estos se presentasen a diferente
escala, en diferente posicin o distorsionados.
El aspecto geomtrico de la disposicin de neuronas de una red, es la base de un
caso particular de aprendizaje competitivo introducido por Kohonen en 1982
conocido como feature mapping (mapas de caractersticas), aplicado en redes con
una disposicin bidimensional de las neuronas de salida, que permiten obtener
mapas topolgicos o topogrficos (topology preserving maps, topographics maps,
self organization maps) en los que de algn modo estaran representadas las
caractersticas principales de las informaciones presentadas a la red. De esta
forma, si la red recibe informaciones con caractersticas similares, se generaran
mapas parecidos, puesto que seran afectadas neuronas de salidas prximas
entre s.
Red de Kohonen
Red de Hamming
Red de Hopfield
En la dcada de los 80s con el fin de estudiar procesos que involucran sistemas
gobernados por ecuaciones diferenciales no lineales surge la teora clsica de
(2.12)
La red de Elman tpicamente posee dos capas, cada una compuesta de una red
tipo Backpropagation, con la adicin de una conexin de realimentacin desde la
salida de la capa oculta hacia la entrada de la misma capa oculta, esta
realimentacin permite a la red de Elman aprender a reconocer y generar patrones
temporales o variantes con el tiempo.
Estas caractersticas han hecho del control predictivo una de las escasas
estrategias de control avanzado con un impacto importante en problemas de
mbito industrial Por tal motivo es importante resaltar que el control predictivo se
ha desarrollado en el mundo de la industria, y ha sido la comunidad investigadora
la que se ha esforzado en dar un soporte terico a los resultados prcticos
obtenidos.
Merece la pena destacar que el control predictivo es una tcnica muy potente que
permite formular controladores para sistemas complejos y con restricciones. Esta
potencia tiene un precio asociado: el coste computacional y la sintonizacin del
controlador. Recientes avances en el campo del MPC proveen un conocimiento
ms profundo de estos controladores, obtenindose resultados que permiten
relajar estos requerimientos. As por ejemplo, se han establecido condiciones
generales para garantizar la estabilidad (Mayne 2001), condiciones bajo las cuales
se puede relajar el carcter optimal del controlador garantizando su estabilidad
(Scokaert & Mayne 1998).
Los modelos internos que se usan para predecir el comportamiento del sistema
pueden ser de diversos tipos: Funcin de transferencia, Respuesta al impulso,
Respuesta al escaln, Espacio Estado.
Este modelo puede ser lineal, no lineal, en tiempo continuo, en tiempo discreto,
puede estar expresado en funcin de transferencia o en ecuaciones de estado,
puede ser multivariable o monovariable.
Una consideracin que deben tener, consiste en que el origen debe ser el punto
de equilibrio en el que se quiere regular el sistema, lo cual se puede conseguir con
un cambio de variables.
Donde Xk+1 son los estados en el tiempo (k+1), Xk, son los estados en el tiempo
(k), Uk el la seal de control.
Seccin 3. Restricciones
Las restricciones indican los lmites dentro de los cuales debe transcurrir la
evolucin de las seales que rigen el comportamiento del sistema. Estas fronteras
se rigen por lmites fsicos, por razones de seguridad, por conveniencias
econmicas, etc.
expresara de la forma:
El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y
se ha convertido en uno de los mtodos ms populares en el mbito del Control
Predictivo tanto en el mundo industrial como en el acadmico. Se ha empleado
con xito en numerosas aplicaciones industriales, mostrando buenas prestaciones
a la vez que un cierto grado de robustez respecto a sobre parametrizacin o
retardos mal conocidos. Puede resolver muchos problemas de control diferentes
para un amplio campo de procesos con un nmero razonable de variables de
diseo, que son especificadas por el operario dependiendo del conocimiento
previo del proceso y de los objetivos de control.
La idea bsica del GPC es calcular una secuencia de futuras acciones de control
de tal forma que minimice una funcin de coste multipaso. El ndice a minimizar es
una funcin cuadrtica que mide por un lado la distancia entre la salida predicha
del sistema y una cierta trayectoria de referencia hasta el horizonte de prediccin,
y por otro el esfuerzo de control necesario para obtener dicha salida. El Control
Predictivo Generalizado tiene muchas ideas en comn con otros controladores
predictivos previamente mencionados ya que est basado en las mismas ideas
pero posee a su vez algunas diferencias. Como se ver ms adelante, es capaz
de proporcionar una solucin explcita (en ausencia de restricciones), puede
trabajar con procesos inestables o de fase no mnima e incorpora el concepto de
horizonte de control as como la consideracin en la funcin de coste de
ponderacin de los incrementos en las acciones de control. Las diversas
posibilidades disponibles para el GPC conducen a una gran variedad de objetivos
de control comparado con otras realizaciones, algunas de las cuales pueden ser
consideradas como subconjuntos o casos lmites del GPC.
Para formular el algoritmo MPC con restricciones hay que expresar estas en
funcin n de la variable sobre la que se puede actuar, es decir, en funcionen de u.
Las restricciones en la entrada estn ya expresadas en funcin n de u y para las
restricciones en la salida se hace uso de las ecuaciones de prediccin n que
expresan el valor futuro de las salidas en funcin n de las seales de control
futuras y valores conocidos en el instante t.
Control
de
procesos
mediante
Redes
Neuronales
Presentado por Cristina Garrido de la Universidad de Concepcin para
optar
al
ttulo
de
Ingeniero
Civil
Qumico
http://www.diq.udec.cl/~cgarrido/
http://melquiades.diq.udec.cl/~cgarrido/
Introduccin
a
las
Redes
Desarrollado
por
Alfredo
http://www.gui.uva.es/login/13/redesn.html
Difusa,
Universidad
del
Valle,
http://maxwell.univalle.edu.co/proyectos/rna/neurofuzzy1/
http://maxwell.univalle.edu.co/proyectos/rna/neurofuzzy2/
Neuronales
Catalina
Artificiales.
Gallego
Colombia.
C.E. Garca, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335348, 1989.
Red
de
Hopfield
como
reconocimiento
http://www.eeng.dcu.ie/~annet/intro/demo.html
Redes
Neuronales
aplicadas
al
reconocimiento
de
voz.
Proyecto desarrollado por Jos Mara Garca Jimnez en Madrid, Espaa
http://electronica.com.mx/neural/aplicaciones/index.html
Tutorial
con
teora
detallada
http://www.paisvirtual.com/informatica/navegadores/toniomos/rn/temasrn.htm
Tutorial
Redes
Neuronales
contiene
Teoria
http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html
de
patrones
General