Beruflich Dokumente
Kultur Dokumente
Engenharia
Qumica,
Departamento
de
Florianpolis, 2003
ii
AGRADECIMENTOS
iii
RESUMO
CLAUMANN, Carlos Alberto. Desenvolvimento e aplicaes de redes neurais wavelets e
da teoria de regularizao na modelagem de processos. Florianpolis, 2003. 153p.
Tese (Doutorado em Engenharia Qumica) - Curso de Ps-Graduao em Engenharia
Qumica, Universidade Federal de Santa Catarina.
Orientador: Nestor Roqueiro
Defesa: 28/02/03
Neste trabalho foram propostas modificaes na wavenet para melhorar a capacidade de
generalizao e reduzir o nmero de neurnios. O desempenho da nova rede foi superior
quando comparada com as tradicionais redes feedforward e de base radial na identificao de
processos no-lineares: um atrator catico, um reator biolgico em que ocorre inibio do
crescimento de clulas pela formao de produto e um tanque de pH. O desempenho de
previso da nova rede proposta, que do tipo esttica, foi tambm validado utilizando essa
como um simulador de processos no-lineares. Foram efetuados testes sem rudo para um
CSTR (Continuos Stirred-Tank Reactor) encamisado com mltiplos estados estacionrios e
um reator cujo comportamento apresenta resposta inversa varivel. Alguns testes foram
efetuados para o reator biolgico e para o tanque de pH com a adio de rudo. Foi realizado
um estudo a respeito da minimizao das curvaturas da superfcie de um modelo emprico e
efetuada sua conexo com o problema de sobre-treinamento. A nova rede proposta foi
utilizada como modelo para o controle de dois processos no-lineares: um tanque de nvel
com alterao significativa de rea (experimental) e um tanque de pH (simulado).
Palavras-chave: Wavelets; Teoria da regularizao; Redes neurais; Identificao de processos;
Controle de processos
iv
ABSTRACT
In this work modifications were proposed in the wavenet to enhance its generalization
capability and to reduce the number of neurons. The modified net exhibited superior
performance when compared with traditional feedforward and radial base nets in the
identification of nonlinear process: a caotic atractor, a biological reactor in which inhibition of
the growing cells takes place due to product formation and a pH tank. The prediction
performance of the static proposed net was also validated using it as a nonlinear process
simulator. Tests without noise were realized for a jacketed, multiple steady-state CSTR
(Continuous Stirred-Tank Reactor) and a reactor whose behavior presents a variable inverse
response. Some tests including noise were accomplished for the biological reactor and a pH
tank. A study referring to the surface curvature minimization of an empirical model was
elaborated an its connection with the overtraining problem was evaluated. The new proposed
net was applied as a model for control purposes in two nonlinear processes: A level tank with
variable diameter (experimental) and a pH tank (simulated).
SUMRIO
LISTA DE FIGURAS...............................................................................................................x
LISTA DE TABELAS...........................................................................................................xiv
1
INTRODUO ................................................................................................................1
2.1
Introduo ................................................................................................................. 4
2.2
Famlias de Wavelets................................................................................................. 6
2.3
2.4
2.5
2.6
3.2
Processos.............................................................................................................................. 25
3.3
4
5.2
5.3
5.4
Quadrados ........................................................................................................................... 45
5.4.1
Introduo......................................................................................................... 45
vi
5.4.2
5.4.3
5.4.4
5.5
Concluses ............................................................................................................... 52
Introduo ............................................................................................................... 53
6.2
6.3
6.4
Matriz de Covarincia........................................................................................................ 58
6.5
Empricos............................................................................................................................. 62
6.6
6.6.1
6.6.2
6.6.3
6.7
7
Resultados ............................................................................................................... 67
CONCLUSES....................................................................................................... 76
NEURAIS ................................................................................................................................ 78
7.1
7.2
7.3
7.4
Concluses ............................................................................................................... 96
vii
8.3
8.2
9.2
9.3
9.4
9.5
10
DE DIMETRO ...................................................................................................................119
10.1
10.2
10.3
10.5
10.6
10.7
10.8
11
11.2
11.3
11.4
viii
11.5
12
13
13.2
ix
LISTA DE FIGURAS
Figura 2-1 - Funo de escala e wavelet (base de Haar) ........................................................ 9
Figura 2-2 - Funo de escala e wavelet (base de Hat) .......................................................... 9
Figura 2-3 - Funo de escala e wavelet (base spline quadrtica).......................................... 9
Figura 2-4 - Funo de escala e wavelet (base de Daubechies)............................................ 10
Figura 2-5 - Funo de escala e wavelet (base spline bicbica)........................................... 10
Figura 2-6 - Base de Haar em duas dimenses: (a) funo de escala e wavelet (uma
dimenso); (b) funo de escala (duas dimenses); (c) trs wavelets me(duas
dimenses).................................................................................................................... 18
Figura 3-1 - Dados de entrada: X1, X2 possuem distribuio uniforme.............................. 21
Figura 3-2 - Dados de entrada: X1 possui distribuio uniforme, X2 distribuio gaussiana21
Figura 3-3 - Superfcie de previso: rede de funes de escala (primeiro grupo de dados). 23
Figura 3-4 - Superfcie de previso: wavenet (primeiro grupo de dados) ............................ 23
Figura 3-5 - Superfcie de previso: rede de funes de escala (segundo grupo de dados) . 24
Figura 3-6 - Superfcie de previso: wavenet (segundo grupo de dados)............................. 24
Figura 3-7 - Aumento do nmero de extremos conforme cresce a dimenso do espao de
entrada .......................................................................................................................... 26
Figura 3-8 - (a) funo de escala spline; (b) derivada de primeira ordem; (c) derivada de
segunda ordem.............................................................................................................. 27
Figura 3-9 - Spline dividida em 3 regies ............................................................................ 28
Figura 3-10 - Expanso contento 8 funes de escala.......................................................... 29
Figura 3-11 - Expanso contento 5 funes de escala.......................................................... 29
Figura 5-1 - Perturbaes aplicadas na vazo de base do tanque de pH .............................. 40
Figura 5-2 Evoluo do pH no tanque............................................................................... 41
Figura 5-3 - Dados reais x previso da rede feedforward treinada por backpropagation..... 42
Figura 5-4 - Dados reais x previso da rede feedforward treinada por Levenberg-Marquardt42
Figura 5-5 - (a) Erros de previso da rede feedforward treinada por backpropagation
(b) Erros de previso da rede feedforward treinada por Levenberg-Marquardt........... 43
Figura 5-6 - Evoluo do erro de treinamento utilizando os mtodos backpropagation e
Levenberg-Marquardt................................................................................................... 44
Figura 5-7 - Dados reais x previso da rede feedforward treinada por GA + mnimos
quadrados...................................................................................................................... 50
Figura 5-8 - (a) Erros de previso da rede feedforward treinada por Levenberg-Marquardt
(b) Erros de previso da rede feedforward treinada por GA + mnimos quadrados ..... 50
Figura 5-9 - Evoluo do treinamento da rede feedforward utilizando Levenberg-Marquardt e
GA + mnimos quadrados............................................................................................. 51
Figura 6-1 - Comparao da aproximao do mesmo conjunto de dados para diferentes
modelos......................................................................................................................... 62
Figura 6-2 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao ........... 68
Figura 6-3 - Influncia do parmetro de regularizao no nmero de condio da matriz de
covarincia.................................................................................................................... 68
Figura 6-4 - Influncia do parmetro de regularizao no valor de 100-R2 ......................... 69
Figura 6-5 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao. 70
Figura 6-6 - Influncia do parmetro de regularizao no nmero de condio da matriz de
covarincia (1 nvel de resoluo) .............................................................................. 71
Figura 6-7 - Influncia do parmetro de regularizao no nmero de condio da matriz de
covarincia (2 nvel de resoluo) .............................................................................. 71
Figura 6-8 - Influncia do parmetro de regularizao no valor de 100-R2 ......................... 72
Figura 6-9 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao ()
...................................................................................................................................... 74
Figura 6-10 - Norma do vetor de pesos da camada de sadax valor do parmetro de
regularizao ()........................................................................................................... 74
Figura 6-11 - Nmero de condio da matriz de covarincia para alguns valores do parmetro
de regularizao ()...................................................................................................... 75
Figura 6-12 - 100-R2 x nmero de pocas para alguns valores do parmetro de regularizao
() ................................................................................................................................. 76
Figura 7-1 - (a) Comportamento oscilatrio (= 3,5); (b) Comportamento catico (= 3,9)78
Figura 7-2 - O valor de 100-R2 em funo do nmero de parmetros ajustveis para as redes
testadas (treinamento)................................................................................................... 81
Figura 7-3 - Valor de AIC em funo do nmero de parmetros ajustveis para as redes
testadas ......................................................................................................................... 83
Figura 7-4 - O valor de 100-R2 em funo do nmero de parmetros ajustveis para as redes
testadas (Teste) ............................................................................................................. 84
Figura 7-5 - Perturbaes aplicadas na vazo de alimentao ............................................. 86
Figura 7-6 - Concentrao de clulas ................................................................................... 86
xi
xii
=0,55)....................................................................................................................... 138
Figura 11-4 - Desempenho do controlador preditivo baseado em modelo linear (N2= 5, =0,1)
.................................................................................................................................... 138
Figura 11-5 - Comparao entre o desempenho dos controladores preditivos baseados nos
modelos linear e neural (perturbaes setpoint) (A) pH (varivel controlada);
(B) vazo de base (varivel manipulada) ................................................................... 139
xiii
xiv
LISTA DE TABELAS
Tabela 2.1 - Coeficientes utilizados para gerao de algumas wavelets mais conhecidas..... 8
Tabela 2.2 - Suporte da funo de escala e de suas compresses didicas (caso N=3)........ 11
Tabela 2.3 - Valor da interseo entre funes adjacentes utilizadas em uma expanso para
alguns tipos de funo de escala................................................................................... 11
Tabela 3.1 Comparao entre desempenho da wavenet e da rede de funes de escala .... 22
Tabela 5.1 - Variveis e parmetros do processo de neutralizao ...................................... 39
Tabela 5.2 - Comparao do desempenho dos mtodos de backpropgation e
Levenberg-Marquardt (treinamento) ............................................................................ 41
Tabela 5.3 - Comparao do desempenho dos mtodos Levenberg-Marquardt e
GA+mnimos quadrados ............................................................................................... 49
Tabela 6.1 - Influncia da regularizao nos autovalores da matriz F(X)TF(X)................... 60
Tabela 7.1 - Estrutura das redes utilizadas na identificao do atrator catico.................... 80
Tabela 7.2 - Parmetros do reator biolgico ........................................................................ 85
Tabela 7.3 - Estrutura das redes utilizadas na identificao do reator biolgico ................. 89
Tabela 7.4 - Estrutura das redes utilizadas na identificao do tanque de pH ..................... 94
Tabela 8.1 - Parmetros do CSTR encamisado................................................................... 100
Tabela 8.2 - Parmetros do reator Van de Vusse ............................................................... 105
Tabela 10.1 - Parmetros dos controladores....................................................................... 131
INTRODUO
Nos ltimos anos, foram realizados grandes avanos na anlise e identificao de
de
funes
definidos
pela
teoria
das
wavelets
DAUBECHIES(1992),
no
sentido
que
TIKHONOV e ARSENIN(1977).
Uma
um
modelo
forma
de
nico
diminuir
pode
no
incertezas
existir
adicionar
Alguns testes foram efetuados, com a adio de rudo nas variveis previstas, para o reator
biolgico e para o tanque de pH.
Com o objetivo de melhorar a capacidade de generalizao de redes neurais, foi efetuado
um estudo a respeito da minimizao das curvaturas da superfcie de um modelo emprico e
efetuada sua conexo com o problema de sobre-treinamento.
A nova rede proposta foi utilizada como modelo de um controlador preditivo em dois
processos no-lineares: um experimental, que abordou o controle de nvel de um tanque com
alterao da rea e outro simulado, relativo ao pH de um tanque agitado.
Alguns testes foram efetuados para comparar o desempenho do controlador preditivo
baseado na rede neural descrita com os clssicos PI e preditivo baseado em modelo linear. Em
todos os casos, melhores resultados foram obtidos com o controlador no-linear.
2.1 Introduo
As famlias de wavelets so bases para um espao de funes e a representao de uma
funo arbitrria realizada utilizando uma ponderao dos elementos da base; isto , atravs
de uma srie. As redes de wavelets so basicamente redes de funes de base radial. Fixadas
as variveis do processo e a famlia de wavelets a ser utilizada, ficam definidos
automaticamente os centros e os raios de todas as funes em todas as escalas. A partir de
uma wavelet, pode ser gerada, por translaes e mudanas de escala, uma famlia de funes
que base para um espao de funes.
O desenvolvimento e o rpido crescimento da teoria de wavelets e anlise em
multiresoluo fornece uma poderosa estrutura matemtica para o desenvolvimento de redes
neurais MALLAT(1989), DAUBECHIES(1992). A teoria de wavelets foi inicialmente
utilizada por GROSSMANN e MORLET(1984) na rea de processamento de sinais, sendo
que MEYER(1986) introduziu a primeira wavelet contnua. A pesquisa na obteno de
wavelets tem progredido rapidamente desde a construo de wavelets de suporte compacto
DAUBECHIES(1988) e da estrutura de multiresoluo. Podem ser encontradas aplicaes de
wavelets nas mais diversas reas:
1) Tratamento de sinais: previso e deteco de falhas VENKATARAMAN e GONZ(2002),
REN et. al.(2000);
Processamento
ANTONINI et al.(1998);
filtragem
de
imagens
FATEMI
YAMAGUCHI(2002),
BOLOUKI
SHAO
et.
(2002),
al.(1999),
KOSANOVICH e PIOVOSO(1997);
2) Estatstica: classificao de dados HUNG et. al.(2002); seleo de variveis para modelos
ALSBERG(1998);
3) Modelagem,
controle
otimizao
de
processos:
identificao
de
sistemas
BECERRA et al.(2002), GAO et. al.(2001), CRISTEA et. al.(2000); controle preditivo
DONGBING
ELIAS-JUAREZ
HUOSHENG(2000),
e
KANTOR(1992);
LI
XI(2000),
controle
HUANG
adaptativo
XIA
JIN(1997),
et.
al.(2002),
de
uma
funo
hiperblica.
BAKSHI e STEPHANOPOULOS(1993)
segunda
denominada
de
rede
wanenet,
desenvolvida
que
utiliza
por
uma
backpropagation, sendo que o nmero de neurnios deve ser definido previamente etapa de
estimao dos pesos da rede.
Nas prximas sees, apresenta-se uma descrio da teoria de wavelets e sua utilizao no
contexto da aproximao de funes.
(a ,b ) ( x ) = a
1 2
(x b )
(2.1)
a, b R; a 0
(a,b ) dx constante
(m,n ) ( x ) = a0
m2
a 0 x nb0
m, n Z
(2.2)
(2.3)
independentes, de tal forma que a famlia {(m,n)} gere o espao das funes integrveis ao
quadrado. Dado que no objetivo deste trabalho o desenvolvimento de famlias de wavelets,
foram utilizados os valores a0 = 2 e b0 = 1. Tambm foram escolhidas algumas funes
especficas, as bases de Haar, Splines e Daubechies (Ver seo 2.3), para apresentao de
exemplos. As aplicaes foram efetuadas utilizando apenas a spline quadrtica; maiores
razes da utilizao dessa ltima como funo de escala podem ser encontradas na seo 3.2.
( x ) = p n (2 x n )
(2.4)
n =0
( x ) = ( 1) p n (2 x n )
n
(2.5)
n =0
p
n =0
= 2 STRANG e NGUYEN(1996).
Nas Figuras 2.1 a 2.5 mostram-se algumas das wavelets mais conhecidas, bem como suas
respectivas funes de escala. Os coeficientes utilizados para gerao destas, atravs das
Equaes (2.4) e (2.5), podem ser vistos na Tabela 2.1.
Tabela 2.1 - Coeficientes utilizados para gerao de algumas wavelets mais conhecidas
Haar
Hat
Spline quadrtica
p0 =
Coeficientes
p0 = 1
p1 = 1
1
p0 =
2
p1 =
p1 = 1
1
p2 =
2
p2 =
p3 =
Daubechies
1
4
p0 =
3
4
p1 =
3
4
p2 =
1
4
p3 =
1
1+ 3
4
1
1+ 3
4
1
1 3
4
1
1 3
4
Spline bicbica
)
)
)
)
p0 =
1
8
p1 =
1
2
p2 =
3
4
p3 =
1
2
p4 =
1
8
0,9
0,8
0,4
(x)
(x)
0,6
-0,1
0,4
0,2
-0,6
-1,1
0
0,2
0,4
0,6
x
0,8
0,2
0,4
0,6
x
0,8
0,55
(x)
(x)
0,6
0,4
0,25
0,2
-0,05
-0,35
0
0,5
1,5
0,5
1,5
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0,35
(x)
(x)
0,15
-0,05
-0,25
-0,45
10
0,9
0,8
(x)
(x)
1,2
0,4
0,4
-0,1
-0,6
-1,1
-0,4
-1,6
0
0,8
(x)
(x)
0,2
0,6
0,4
0
-0,2
0,2
0
-0,4
0
Uma propriedade da funo de escala, obtida a partir da Equao (2.4), que esta vale 0
fora do intervalo [0,N], ou seja, seu suporte o intervalo [0,N] STRANG e NGUYEN(1996).
Pode-se deduzir a partir desta propriedade que a interseo de duas funes de escala
adjacentes utilizadas em uma expanso depende do nmero de coeficientes. Observando o
lado direito da Equao (2.4), conclui-se que N+1 cpias de , com suporte N/2 e igualmente
espaadas, devem ser acomodadas no intervalo [0,N], pois conforme o lado esquerdo dessa
equao o somatrio define . Exemplificando para o caso N=3, tem-se 4 cpias de
acomodadas em [0,3], cada uma delas com suporte 1,5 e espaadas de uma distncia de 0,5
(Ver Tabela 2.2)
De acordo com a Tabela 2.2, para N=3, a interseo entre quaisquer duas cpias
comprimidas e adjacentes da funo de escala, por exemplo (2x) e (2x-1), de 2/3 do
suporte dessas.
11
Tabela 2.2 - Suporte da funo de escala e de suas compresses didicas (caso N=3)
Funo
Suporte
(x)
[0; 3]
(2x)
[0; 1,5]
(2x-1)
[0,5; 2]
(2x-2)
[1; 2,5]
(2x -3)
[1,5; 3]
Tabela 2.3 - Valor da interseo entre funes adjacentes utilizadas em uma expanso para
alguns tipos de funo de escala
Base
Nmero de coeficientes
Interseco
Haar
Hat
1/2
Spline quadrtica
2/3
Daubechies
2/3
Spline bicbica
3/4
Pode-se observar na Tabela 2.3, que a interseo entre quaisquer duas cpias,
comprimidas e adjacentes, de uma funo de escala utilizada em uma expanso cresce com o
aumento do nmero de coeficientes.
Todo o raciocnio apresentado a respeito de interseo de funes de escala tambm
vlido para as wavelets. A Equao (2.5), que define as wavelets, tem formato anlogo ao da
Equao (2.4) utilizada no raciocnio.
12
Vm = {0} e
mZ
mZ
(conjuntos em que quaisquer duas funes diferentes so ortogonais) dentro de uma mesma
resoluo (quaisquer duas wavelets diferentes em uma resoluo so ortogonais) e entre
diferentes resolues (qualquer wavelet de uma determinada resoluo ortogonal a uma
wavelet contida em outra resoluo diferente). No caso das funes de escala, esta
propriedade no uma exigncia. Como um exemplo, tem-se a base spline quadrtica, cujo
conjunto de verses transladadas da funo de escala no gera um conjunto ortogonal.
Devido s caractersticas dos subespaos utilizados na multiresoluo, Vm pode ser
descrito como a combinao dos subespaos com resolues inferiores Vi e Wi (i < m), ou
seja:
Vm+1 = Vm Wm = Vm-1 Wm-1 Wm = V0 W0 W1.... Wm
13
f ( x) =
n =
m = n =
n =
m = 0 n =
d n 0,n (x ) +
m,n
m ,n (x )
(2.6)
14
f ( x) =
n= N
d n 0,n (x ) +
m = M max n = N , m
n =0
m =0
n =0
m ,n
m ,n (x )
(2.7)
onde
N: nmero de funes de escala;
Mmax: nmero de resolues utilizadas na aproximao;
N,m: nmero de wavelets na resoluo m;
dn (n = 0 ... N) e cm,n (m = 0 ... Mmax; n = 0 ... N,m): Coeficientes da expanso em srie de
funes;
d: vetor composto dos coeficientes dn (n = 0 ... N);
cm : vetor composto dos coeficientes cm,n contidos na resoluo m (n = 0 ... N,m).
A Equao (2.7) pode ser escrita na forma de uma expanso em subespaos de funes:
Definindo:
V0 =
n= N
d
n =0
Wm =
0,n ( x )
n= N ,m
c
n =0
m,n
m ,n ( x )
F0 =
n= N
Hm =
d
n =0
0,n ( x )
n= N ,m _
n =0
c m,n m,n ( x )
onde
_
15
subespaos Vi e Wi. Dessa forma, a notao d e c m significa que estes vetores de coeficientes
_
F0 =
n= N
d
n =0
0,n ( x )
Para obter uma aproximao mais detalhada dever ser incorporado um conjunto de
wavelets pertencentes escala 0:
F1 =
n= N _
n =0
d n 0,n ( x ) +
n= N ,0 _
n =0
c 0,n 0,n ( x ) = F0 + H 0
f ( x) F0 =
n= N ,0 _
n =0
c 0,n 0,n (x ) = H 0
16
( f (x ) F0 ) H 0
A expresso f(x) - F0 em J1 foi mostrada entre parnteses para reforar que conhecida
para todos os pontos do grupo de dados, podendo ser obtida das informaes de entrada e
_
Fk = Fk 1 +
n = N , ( k 1 ) _
n =0
c (k 1),n (k 1),n ( x ) = Fk 1 + H k 1
f ( x) Fk 1 =
n = N , ( k 1 ) _
n =0
c (k 1),n (k 1),n ( x ) = H k 1
Jk =
( f (x ) Fk 1 ) H k 1
de um conjunto de dados, este produto interno aproximado pelo usual produto de dois
vetores, correspondentes aos valores dos pontos do grupo de dados aplicados nas wavelets.
Como os dados podem estar amostrados de forma deficiente e no uniforme, a integral pode
no ser, em geral, bem aproximada. Dessa forma, os pesos das funes contidas em uma
mesma resoluo no podem ser calculados separadamente, sendo necessrio resolver um
17
sistema linear, resultante da aplicao do mtodo dos mnimos quadrados, para determinao
desses MOTARD e JOSEPH(1994).
Deve-se notar que ao adicionar um nvel de resoluo necessita-se estimar apenas os pesos
das funes pertencentes a este nvel. Os coeficientes das funes correspondentes s
resolues adicionadas anteriormente, caso existam, no necessitam ser estimados novamente.
( x1 , x 2 ) = ( x1 ) ( x 2 )
1 ( x1 , x 2 ) = ( x1 ) ( x 2 )
2 (x1 , x 2 ) = ( x1 ) ( x 2 )
3 ( x1 , x 2 ) = ( x1 ) ( x 2 )
h m ,n1 ,n2 ( x1 , x 2 ) = 2 m 2 m x1 n1 ,2 m x 2 n2 ;
h = {1,2,3}
Uma ilustrao da funo de escala e das trs wavelets me para a base de Haar (duas
variveis de entrada) mostrada na Figura 2-6.
O nmero de wavelets aumenta exponencialmente com a dimenso do espao de entrada.
Para N entradas h 2N-1 wavelets. Se e constituem uma base ortogonal em L2(R), o
conjunto de funes gerado pelo produto tensorial destas gera uma base para o L2(RN) (o
espao N-dimensional das funes integrveis ao quadrado).
18
Figura 2-6 - Base de Haar em duas dimenses: (a) funo de escala e wavelet (uma dimenso);
(b) funo de escala (duas dimenses); (c) trs wavelets me(duas dimenses)
19
ALTERAES NA WAVENET
Parte das propostas deste trabalho so relativas a modificaes na wavenet, entre as quais:
1. Multiresoluo somente com funes de escala;
2. Escolha da funo de ativao adequada para identificao de processos;
3. Determinao do nmero de funes de escala (primeira resoluo).
As propostas tm como objetivo reduzir o nmero de funes utilizadas na expanso e
20
f ( x) =
m = M max n = N , m
m =0
n =0
m,n
m,n (x )
(3.1)
onde
N, m: nmero de funes de escala na resoluo m;
Mmax: nmero de resolues utilizadas na aproximao;
Para mostrar as diferenas entre a aproximao obtida por uma wavenet e a rede que
utiliza apenas funes de escala, comparou-se o desempenho dessas na aproximao e
reconstruo da superfcie Y= 0,8X1 + 0,5X2 utilizando a base de Haar. Foram gerados dois
grupos de dados com aproximadamente 500 pontos escolhidos aleatoriamente: No primeiro,
os valores de X1 e X2 foram distribudos de maneira uniforme no espao das variveis de
entrada. No segundo, os pontos correspondentes varivel X1 foram obtidos utilizando
distribuio uniforme e os da varivel X2 pela distribuio gaussiana (Ver Figuras 3.1 e 3.2).
21
Substituindo os pontos contidos nas Figuras 3.1 e 3.2 na equao do plano, obteve-se a sada
Y e foram gerados os grupos de dados. Na aproximao, foram utilizadas redes com as
seguintes caractersticas: um nvel de funes de escala e 4 de wavelets para a wavenet e 4
resolues de funes de escala para a rede de funes de escala.
22
Na Tabela 3.1 podem ser vistas informaes a respeito do treinamento das redes descritas,
considerando os dois grupos de dados. Nesta tabela, mostra-se uma comparao do
desempenho das redes em relao ao nmero de neurnios e em relao ao valor do
coeficiente de correlao R2. O valor de R2 definido de acordo com a equao (3.2):
Np
y i y ip 2
=1
100
R 2 (% ) = 1 iNp
2
y i y
i =1
(3.2)
onde
Np: nmero de pontos do grupo de dados;
yi: valores de sada para os pontos do grupo de dados (i=1...Np);
y ip : valores previstos por um modelo para os pontos de sada do grupo de dados (i=1...Np);
Np
y
y
i =1
Grupo de dados 2
N de neurnios
R2
100-R2
R2
100-R2
R. funes de escala
85
99,9810
0,0190
99,9269
0,0731
Wavenet
256
99,9501
0,0499
99,8296
0,1704
Analisando a Tabela 3.1, nota-se que o valor de 100-R2, que indica a porcentagem de
energia do sinal de sada no identificada por um modelo, menor no caso da rede de funes
de escala, apesar dessa utilizar um nmero menor de neurnios que a wavenet.
Nas Figuras 3.3 e 3.4 mostram-se as superfcies de previso obtidas a partir das redes
neurais treinadas para o primeiro grupo de dados. Para obter as superfcies, foi efetuada uma
interpolao dos valores previstos pelas redes em uma malha de passo 0,01 (1% do domnio
de cada varivel). Nas Figuras 3.5 e 3.6 mostram-se as superfcies de previso obtidas das
redes neurais treinadas para o segundo grupo de dados.
23
Figura 3-3 - Superfcie de previso: rede de funes de escala (primeiro grupo de dados)
24
Figura 3-5 - Superfcie de previso: rede de funes de escala (segundo grupo de dados)
25
Nas Figuras 3.3 a 3.6 destaca-se a melhor capacidade de generalizao da rede de funes
de escala. A diferena entre a capacidade de generalizao da wavenet e da rede de funes de
escala foi maior no caso do segundo grupo de dados, que apresenta amostragem deficiente nas
bordas em relao varivel X2.
3.2 Determinao
de
uma
Funo
de
Ativao
Adequada
para
Identificao de Processos
Conforme descrito no Captulo 2, possvel gerar funes de escala e wavelets
dependendo dos coeficientes utilizados na Equao (2.4). Para definir uma funo de escala
adequada para identificao e controle foram utilizados os seguintes critrios:
Em relao ao processo que se deseja modelar, tem-se a seguinte restrio:
1. Ausncia de Descontinuidades: Descontinuidades so caractersticas pouco comuns em
processos. Dessa forma, as redes neurais utilizadas para modelar processos deveriam
utilizar funes contnuas at pelo menos a primeira derivada. Isto garante a continuidade
do modelo eliminando arestas da superfcie de aproximao desse e outros
comportamentos pouco provveis de existirem em processos reais.
Qualquer funo de escala escolhida deveria ter as seguintes caractersticas:
2. Diferenciabilidade: Esta propriedade est diretamente relacionada com o item (1)
Ausncia de Descontinuidades. Porm, h outra razo para a exigncia de continuidade da
funo de ativao. Alguns algoritmos exigem a diferenciabilidade das funes de
ativao. No basta a rede ser linear nos parmetros (fcil diferenciabilidade em relao
aos parmetros), o que permite o treinamento por mnimos quadrados. Em algumas
aplicaes necessrio diferenciar a rede com relao s suas entradas. Um exemplo a
utilizao de modelos neurais em controladores preditivos. Para esta famlia de
controladores, fixa-se uma referncia (sada) e deseja-se descobrir, atravs de um
algoritmo de otimizao, as aes de controle (entradas da rede) que levam o sistema o
mais prximo possvel da referncia. No h soluo analtica para o problema descrito e
uma forma de resolv-lo utilizar algoritmos baseados em Clculo. Estes algoritmos
exigem que a funo de ativao seja diferencivel.
26
g(x)
1
0.5
0
-0.5
-1
0
0.2
0.4
(a)
0.6
0.8
1
(b)
Figura 3-7 - Aumento do nmero de extremos conforme cresce a dimenso do espao de entrada
27
(x)
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
0
'(x)
2
1,5
1
0,5
0
-0,5
-1
-1,5
-2
2
(a)
''(x)
1,9
0,9
-0,1
-1,1
-2,1
-3,1
-4,1
x
(b)
(c)
Figura 3-8 - (a) funo de escala spline; (b) derivada de primeira ordem; (c) derivada de segunda
ordem
Na Figura 3-8 pode-se observar que a derivada de segunda ordem no definida nos
pontos da curva onde h transio de uma regio de valor constante para outra. Isto no
representa problema j que se tratam de descontinuidades isoladas e pode-se definir o valor da
segunda derivada nestes pontos de forma arbitrria.
2. Duas funes adjacentes da famlia de splines quadrticas tm interseo correspondente a
2/3 de seu suporte (considerando o caso unidimensional), a menor possvel
desconsiderando as base de Haar (sem interseo) e a Hat (interseo de 1/2 do suporte)
que no satisfazem restrio de continuidade at a primeira derivada. Para o caso
multivarivel, as fraes de interseo modificam, mas a validade do que foi exposto
permanece inalterada.
28
(1)
(2)
(3)
29
3
2
1
3
2
1
3
2
1
3
2
1
3
2
1
Domnio
3
2
1
1
3
2
1
3
2
1
0 Domnio
3
2
1
1
Uma das propostas deste trabalho definir qual o nmero de funes de escala que deve
ser utilizado na primeira resoluo. Se a expresso analtica da funo que se deseja
aproximar conhecida, ento no interessa o ponto de partida. No entanto, quando se dispe
apenas de um conjunto finito de pontos, a expanso que inicia com o menor nmero de
funes de escala fornece, possivelmente, modelos com melhor capacidade de generalizao.
Algumas razes para isto so:
1) Compromisso bias-varincia: Se a curva que se deseja aproximar tiver no-linearidades
pouco acentuadas, ento ela ser certamente aproximada utilizando somente o primeiro
nvel de funes de escala, j que um comportamento prximo do linear est contido no
espao das funes geradas por expanses de splines (as splines so combinaes de
polinmios de baixa ordem e o comportamento linear um caso particular). Dessa forma,
o modelo com menor nmero de parmetros preferido em razo do compromisso
Bias-Varincia JOHANSEN(1997).
30
31
sries temporais no-lineares. O nome genrico dado a estes modelos NARMAX (Nonlinear
Auto Regressive Moving Avarage with EXogenous Inputs). Como casos particulares dos
modelos NARMAX, podem-se citar as redes neurais, os modelos lineares ARMAX, muito
utilizados em identificao, e ARIMAX para controle LJUNG(1987).
Grande parte dos trabalhos encontrados na literatura relativos a identificao e controle
no-linear utilizam as redes feedforward e as RBFN DE JESUS et. al.(2001), LING(2000)
SAXENA et. al.(2000), HUNT et. al.(1992). Neste captulo descreve-se de forma
simplificada a estrutura destes modelos empricos, sendo que no Captulo 7 apresentado um
estudo comparativo entre o desempenho das redes feedforward, RBFN e de funes de escala.
z = G wi G i , j x j + bi + b
i =1
j =1
onde
32
z = wi G X C i
i =1
sendo que X C i
= (x j ci , j )
M
j =1
onde
Multiquadrtica= r 2 + c 2
Inversa Multiquadrtica =
r2
(r
) , com >0 e r R;
+ c2
: Norma quadrtica;
33
Ci= [ci,1 ci,2 .... ci,M]T: Vetor de centros para a i-simo neurnio (i =1,...N).
Os centros devem ser determinados em uma etapa anterior ao treinamento. Estes podem
ser obtidos aleatoriamente entre os pontos do grupo de dados ou atravs de tcnicas de
34
ESTUDO
DE
MTODOS
DE
TREINAMENTO
DE
REDES
FEEDFORWARD
No captulo 7, apresentada uma comparao de desempenho das redes de tipo
feedforward, base radial e de funes de escala. As duas ltimas podem ser treinadas por
mnimos quadrados e, portanto, os pesos so estimados de forma tima. No entanto, a
primeira necessita de um algoritmo iterativo e os pesos timos nem sempre so obtidos. Para
fornecer uma comparao justa das redes descritas, em se tratando de desempenho de
modelagem, este captulo tem por objetivo fazer um estudo de algumas estratgias de
treinamento supervisionado para redes tipo feedforward. O desempenho de um mtodo que
utiliza apenas as derivadas de primeira ordem da funo objetivo comparado a um mtodo
de segunda ordem, na identificao de um tanque de pH. Tambm estes foram comparados a
uma simples metodologia de treinamento baseada em mnimos quadrados e algoritmos
genticos.
Neste captulo, o desempenho entre algoritmos de treinamento foi comparado utilizando
apenas os dados de treinamento.O mtodo para o qual foram obtidos os melhores resultados,
em termos do valor da funo objetivo, foi utilizado como estratgia de treinamento de redes
35
E 2
(n )
W (n ) =
W
(5.1)
onde
W: Vetor contendo todos os pesos da rede;
: Fator de aprendizagem.
E 2
em funo das entradas, ativaes e
W
W (n ) =
E 2
(n ) + W (n 1)
W
36
W (n ) = H 1 (n )
onde H(n)=
E 2
(n )
W
(5.2)
2E2
(n ) a matriz quadrada de derivadas parciais de segunda ordem do erro
W 2
Ei (n )
o vetor de derivadas parciais do erro em relao
W
aos pesos para o i-simo padro e n-sima iterao (considerando que a atualizao dos pesos
realizada em cada poca). Ento se pode definir a matriz J(n) de dimenso Np (Nmero de
padres) x Nw (Nmero de pesos da rede).
E
E
Ei
(n ) Np (n )
J (n ) = 1 (n )
W
W
W
37
W (n ) = J (n ) J (n ) + I
aplicao
do
mtodo
de
E 2
(n )
W
Levenberg-Marquardt,
(5.3)
de
forma
semelhante
ao
backpropagation, pode ser dividida em dois passos que devem ser utilizados seqencialmente
at a convergncia. No primeiro passo, calculam-se as ativaes e sadas de todos os
neurnios para o grupo de dados de treinamento (uma poca). Durante esta fase os pesos
permanecem fixos. Com estas informaes calcula-se as derivadas parciais em relaes aos
pesos para todos os padres. No segundo passo, os pesos devem ser ajustados de acordo com
a Equao (5.3). Deve-se notar que um sistema linear tem que ser resolvido a cada poca para
o clculo das correes. O mtodo de Levenberg-Marquardt tambm utiliza uma estratgia
para corrigir o valor durante o treinamento, garantindo que o erro quadrtico global de
aproximao sempre diminua (Ver BAZARAA et. al.(1993)). No captulo 6 descrevem-se
outras razes para a utilizao do parmetro , alm de melhorar o condicionamento da matriz
J(n)TJ(n).
Alguns trabalhos na literatura mostram que possvel separar e estimar os pesos da rede
em grupos sem diferenas significativas no valor do erro global de aproximao, quando
comparados ao caso em que no se efetua nenhuma diviso. A vantagem que sistemas
lineares de menor porte devem ser resolvidos em cada poca. No trabalho de
SJOBERG e VIBERG(1997) foi mostrado que no caso de uma rede feedforward, treinada
com o mtodo de Levenberg-Marquardt, melhores resultados podiam ser obtidos, em termos
do erro de aproximao, quando os pesos da camada intermediria e de sada eram estimados
separadamente. A rede utilizada era composta de apenas uma camada intermediria e somente
neurnios lineares na sada. As etapas de clculo das sadas e estimao dos pesos foram
efetuadas seqencialmente e separadamente para cada camada. Para a rede descrita, estimar
38
comparao
entre
desempenho
de
um mtodo
de
primeira
ordem
feedforward com apenas uma camada intermediria (composta de neurnios tendo a tangente
hiperblica como funo de ativao) e a camada de sada linear. O sistema escolhido para
comparao foi um processo SISO, que envolve o comportamento dinmico do pH ocorrendo
em um reator de neutralizao. O modelo matemtico do processo foi extrado do trabalho de
CHENG et al.(1995), sendo que considerou-se que o nvel do tanque constante e que no h
atraso na medida do pH. O modelo simplificado pode ser colocado no formato de variveis de
estado, sendo descrito por dois estados (invariantes reacionais) e uma sada (pH). O processo
possui trs correntes de entrada, cido (HNO3), tampo (NaHCO3) e base (NaOH), que so
misturadas no tanque e o pH na sada desse medido. Destas correntes apenas a vazo de
base alterada. As equaes diferenciais relacionadas aos estados so lineares e o pH uma
funo no-linear desses.
( Ah )
d (Wa 4 )
= q1 (Wa1 Wa 4 ) + q 2 (Wa 2 Wa 4 ) + q3 (Wa 3 Wa 4 )
dt
(5.4)
( Ah )
d (Wb 4 )
= q1 (Wb1 Wb 4 ) + q 2 (Wb 2 Wb 4 ) + q3 (Wb 3 Wb 4 )
dt
(5.5)
39
Wa 4 + 10 pH 414 + Wb 4
1 + 2.10 pH 4 pK 2
10 pH 4 = 0
1 + 10 pK 1 pH 4 + 10 pK 1 pK 2
(5.6)
onde
Valores nominais
207 cm2
14,0 cm
pK1
6,35
pK2
10,25
q1 (HNO3)
16,6 ml/s
q2 (NaHCO3)
0,55 ml/s
q3(*)(NaOH)
15,6 ml/s
pH(*)
7,0
Wa1
3e-3 M
Wa2
-3e-2 M
Wa3
3,05e-3 M
Wb1
Wb2
3e-2 M
Wb3
5e-5 M
40
feedforward utilizada foi composta por 30 neurnios. Este nmero de neurnios foi escolhido,
pois permitiu uma comparao de desempenho entre os mtodos de treinamento e se obteve
boa aproximao dos dados. Na Figura 5-1 mostram-se as perturbaes aplicadas na vazo de
base. Na Figura 5-2 podem ser vistos os valores de pH para as perturbaes aplicadas.
19,0
Vazo (ml/s)
17,0
15,0
13,0
11,0
9,0
7,0
1
101
201
301
401
501
601 701
amostra
801
41
9,5
8,5
pH
7,5
6,5
5,5
4,5
3,5
1
101
201
301
401
501
601 701
amostra
801
Levenberg-Marquardt
Corrida
R2(%)
100-R2(%)
R2(%)
100-R2(%)
99,8028
0,1972
99,9879
0,0121
99,6445
0,3555
99,9871
0,0129
99,5841
0,4159
99,9924
0,0076
99,5074
0,4926
99,9936
0,0064
98,3656
1,6344
99,9884
0,0116
99,5036
0,4964
99,9851
0,0149
98,1779
1,8221
99,9855
0,0145
99,5955
0,4045
99,9907
0,0093
99,3106
0,6894
99,9914
0,0086
10
99,6832
0,3168
99,9900
0,0100
Mdia
99,3175
0,6825
99,9892
0,0108
42
De acordo com a Tabela 5.2, pode-se observar que o desempenho de treinamento, quando
se compara o valor de R2, obtido com o mtodo de Levenberg-Marquardt foi bastante superior
ao backpropagation. O valor de 100-R2 que indica a porcentagem do sinal de sada, em
termos da energia, que no foi identificada pelo modelo , em mdia, 60 vezes menor no caso
do mtodo de Levenberg-Marquardt.
Como um exemplo, pode-se observar nas Figuras 5.3 e 5.4 as previses das redes
treinadas pelos mtodos backpropagation e Levenberg-Marquardt, para o caso da corrida
nmero 10. Estas redes correspondem s obtidas na ltima iterao de treinamento. Na Figura
5-5 podem ser observados os respectivos erros de previso.
Real
Rede
9,5
8,5
pH
7,5
6,5
5,5
4,5
3,5
1
101
201
301
401
501
601 701
amostra
801
901
1001 1101
Figura 5-3 - Dados reais x previso da rede feedforward treinada por backpropagation
Real
Rede
9,5
8,5
pH
7,5
6,5
5,5
4,5
3,5
1
101
201
301
401
501
601 701
amostra
801
901
1001 1101
Figura 5-4 - Dados reais x previso da rede feedforward treinada por Levenberg-Marquardt
43
Analisando as Figuras 5.3 a 5.5, nota-se que as amplitudes dos erros de treinamento foram,
em
geral,
menores
quando
treinamento
foi
efetuado
com
mtodo
de
Levenberg-Marquardt.
1,0
Erro
0,5
0,0
-0,5
-1,0
(a)
1,0
Erro
0,5
0,0
-0,5
-1,0
1
101
201
301
401
501 601
amostra
701
801
901
1001
1101
(b)
Figura 5-5 - (a) Erros de previso da rede feedforward treinada por backpropagation
(b)
Tambm para a corrida de nmero 10, mostra-se na Figura 5-6 a evoluo do valor do
100-R2 em funo do nmero de pocas (ambos em escala log) para o treinamento efetuado
por backpropagation e por Levenberg-Marquardt. Pode-se observar que para o
backpropagation, seriam necessrias mais pocas, alm das 1500 utilizadas, para a
convergncia do mtodo. Ao contrrio, no caso da tcnica de Levenberg-Marquardt, a partir
de 100 pocas o erro quadrtico de aproximao no se alterou de forma significativa.
44
BackProp.
Lev-Marq.
100,000
100-R
10,000
1,000
0,100
0,010
0,001
1
10
100
Nmero de pocas
1000
10000
45
5.4.1 Introduo
Nesta seo foi aplicada uma tcnica simples, em termos de implementao
computacional, para treinamento de uma rede feedforward baseada em algoritmos genticos e
mnimos quadrados. Esta tcnica descrita em GHOSH e VERMA(2001) que utilizou um
algoritmo gentico para determinar os parmetros pertencentes camada intermediria e
mnimos quadrados para estimar os pesos da camada de sada de uma rede neural
feedforward.
No trabalho de CLAUMANN(1999), foi mostrado que o algoritmo gentico descrito pelo
autor obteve resultados superiores, em termos do resultado final e velocidade de
convergncia, quando comparado ao proposto por GOLDBERG(1989) para uma srie de
benchmarks de otimizao. Por isso, foi utilizado o Algoritmo gentico descrito pelo primeiro
autor conjuntamente o mtodo dos mnimos quadrados para o treinamento de uma rede
feedforward.
Os Algoritmos Genticos (GAs) so algoritmos de otimizao baseados nos mecanismos
de seleo natural e adaptao. Estes algoritmos operam com um conjunto de possveis
solues, denominado populao, para determinao do timo. Os elementos da populao,
tambm conhecidos por indivduos, so combinados atravs de uma troca de informaes de
modo a encontrar melhores solues que as da populao original. A troca de informaes
para determinao da nova populao depende do valor da funo objetivo, de tal forma que
melhores solues possuem maior possibilidade de serem combinadas. Desse processo
obtm-se, em geral, solues melhores que as originais e toda a populao desloca-se em
direo ao timo. Quando um conjunto de indivduos de tamanho igual ao da populao
46
obtido considera-se completada uma gerao. O primeiro Algoritmo Gentico foi descrito por
HOLLAND(1975) e foi inspirado em um mecanismo simplificado da adaptao natural dos
seres vivos ao ambiente. A adaptao pode ser considerada um processo de modificao
progressiva de uma populao promovendo um melhor desempenho no ambiente. O
ambiente, neste caso, a funo objetivo a ser otimizada.
caractersticas que so diferenciados entre si pela funo que desempenham e pela posio
que ocupam na string. O conjunto de todos os valores (tambm podem ser smbolos caso seja
um nmero finito) que um detetor pode assumir conhecido por alfabeto. Por exemplo, em
codificao binria o alfabeto {0,1}. Em codificao real, cada gene pode assumir qualquer
valor dentro de um intervalo pr-definido.
Em populaes naturais, o fitness a capacidade das criaturas sobreviverem aos
predadores, pestes e outros obstculos reproduo. No ambiente artificial, o fitness uma
medida relativa de desempenho entre os elementos da populao. O fitness pode ser
determinado diretamente a partir do valor da funo objetivo ou de algum critrio baseado
nela.
47
As variveis de um problema a ser otimizado podem ser codificadas em algum alfabeto, tal
como o binrio. Neste caso, as operaes efetuadas resumem-se a cpias e trocas de bits;
string de cada indivduo corresponde camada intermediria de uma rede neural feedforward
diferente. O valor da funo objetivo (o erro quadrtico de aproximao) de cada indivduo
utilizado no clculo do fitness foi obtido da seguinte forma: Uma vez que os pesos da camada
48
intermediria foram definidos pelo algoritmo gentico, calculam-se as sadas dos neurnios da
camada intermediria para todos os padres do grupo de dados de treinamento. Como os alvos
so conhecidos e a camada de sada linear, a determinao dos pesos da camada de sada
implica na resoluo de um problema de mnimos quadrados. Aps estimar estes ltimos
pesos, obtm-se a sada prevista pela rede para todos os pontos do grupo de dados e,
finalmente, calcula-se o erro quadrtico de aproximao de treinamento.
Deve-se notar que as sadas dos neurnios da camada intermediria e de sada,
considerando todos os padres do grupo de dados de treinamento, so avaliadas apenas uma
vez para o clculo da funo objetivo de um indivduo.
Do ponto de vista da rede neural, o Algoritmo Gentico desconhecido e as nicas
informaes que a rede necessita desse so os pesos da camada intermediria. Do ponto de
vista da aplicao do Algoritmo Gentico, a arquitetura da rede desconhecida e a nica
informao que o GA necessita o valor da funo objetivo.
As tcnicas redes neurais, algoritmos genticos e mnimos quadrados foram combinadas
em um nico algoritmo, no entanto, as partes atuam de forma contnua e independente.
Na identificao do tanque de pH foi utilizada uma populao 30 indivduos. Um nmero
maior de indivduos s elevou o tempo computacional e um nmero inferior resultou em pior
desempenho de treinamento. Todos os outros parmetros do mtodo, tais como, tipos de
operadores de crossover, mutao, seleo e taxas de crossover, mutao etc foram definidos
de acordo com CLAUMANN(1999).
49
equivale a 30 pocas, ou seja, uma poca associada a cada indivduo de uma populao
composta por 30 desses. Dessa forma, o algoritmo gentico foi finalizado em 50 geraes.
De acordo com a Tabela 5.3, pode-se observar que o desempenho de treinamento, quando
se compara o valor de R2, obtido com a estratgia GA + mnimos quadrados foi superior em
todas as simulaes ao mtodo de Levenberg-Marquardt. A porcentagem de energia do sinal
de sada no identificada pela rede neural (100-R2) foi, em mdia, 3 vezes menor no caso da
tcnica de GA + mnimos quadrados.
Como um exemplo, mostra-se na Figura 5-7, a previso da rede treinada por
GA + mnimos quadrados no caso da corrida nmero 10. Esta rede corresponde obtida na
ltima iterao de treinamento. Na Figura 5-8 pode ser vista uma comparao dos erros de
previso das tcnicas de Levenberg-Marquardt e GA + mnimos quadrados.
Levenberg-Marquardt
Corrida
R2(%)
100- R2(%)
R2(%)
100- R2(%)
99,9970
0,0030
99,9879
0,0121
99,9944
0,0056
99,9871
0,0129
99,9975
0,0025
99,9924
0,0076
99,9963
0,0037
99,9936
0,0064
99,9951
0,0049
99,9884
0,0116
99,9970
0,0030
99,9851
0,0149
99,9957
0,0043
99,9855
0,0145
99,9968
0,0032
99,9907
0,0093
99,9964
0,0036
99,9914
0,0086
10
99,9968
0,0032
99,9900
0,0100
Mdia
99,9963
0,0036
99,9892
0,0108
50
Real
Rede
9,5
8,5
pH
7,5
6,5
5,5
4,5
3,5
1
101
201
301
401
501
601 701
amostra
801
901
1001 1101
Figura 5-7 - Dados reais x previso da rede feedforward treinada por GA + mnimos quadrados
0,3
Erro
0,2
0,1
-0,1
-0,2
-0,3
(a)
0,3
0,2
Erro
0,1
0,0
-0,1
-0,2
-0,3
1
101
201
301
401
501
601 701
amostra
801
901
1001
1101
(b)
Figura 5-8 - (a) Erros de previso da rede feedforward treinada por Levenberg-Marquardt
(b) Erros de previso da rede feedforward treinada por GA + mnimos quadrados
Pode ser observado na Figura 5-7, que o comportamento do sistema dinmico pode ser
dividido, de forma simplificada, em regies onde o processo est prximo de atingir um
51
funo
do
nmero
de
pocas
para
treinamento
efetuado
por
GA+Min. Quad.
Lev-Marq.
100-R
0,100
0,010
0,001
0
200
400
600
800
1000
Nmero de pocas
1200
1400
1600
52
Foi observado que as tarefas de maior custo computacional foram o clculo do erro global
de treinamento, que necessita da avaliao da sada da rede para todos os pontos do grupo de
dados, e a estimao dos pesos a partir da tcnica de mnimos quadrados. Em uma poca, o
erro global de treinamento deve ser avaliado apenas uma vez para as duas estratgias. No
entanto, no caso da estratgia baseada em algoritmos genticos apenas os pesos da camada de
sada devem ser estimados por mnimos quadrados. Para o mtodo Levenberg-Marquardt,
alm destes os pesos da camada intermediria tambm devem ser estimados por mnimos
quadrados em cada poca.
5.6 Concluses
Embora tenha se tratado da identificao de apenas um sistema dinmico, pode-se
concluir, em funo das diferenas significativas de desempenho de treinamento, que a
estratgia GA + mnimos quadrados foi superior tcnica de Levenberg-Marquardt e essas
duas foram muitos superiores ao mtodo backpropagation.
A estratgia GA + mnimos quadrados a mais simples, em termos de implementao,
pelo fato de ser baseada em ferramentas de otimizao e identificao genricas e
independentes do problema. Este no o caso dos mtodos de Levenberg-Marquardt e
53
6.1 Introduo
Determinar um modelo de um sistema, a partir de um conjunto finito de observaes sem
qualquer conhecimento prvio desse , em geral, um problema mal-posto, no sentido de que
um modelo nico pode no existir TIKHONOV e ARSENIN(1977).
Na identificao de sistemas, utilizando modelos lineares nos parmetros, problemas
mal-postos produzem matrizes mal condicionadas, o que pode levar a grandes erros na
determinao dos coeficientes dos modelos. Uma maneira de diminuir incertezas introduzir
conhecimento prvio do processo que se deseja identificar, alm da simples aproximao de
dados, de forma a obter-se uma soluo nica para o problema de aproximao. Um desses
procedimentos conhecido por regularizao. Para transformar a identificao de sistemas em
um problema bem-posto, TIKHONOV e ARSENIN(1977) criaram a teoria da regularizao.
Uma forma de conhecimento prvio utilizada na teoria de regularizao que
descontinuidades so comportamentos pouco provveis de ocorrer em processos. Isto evitar
que o comportamento de um modelo varie abruptamente nas vizinhanas de uma observao,
sendo que alguma interpolao e extrapolao dos dados pode ser justificada. Tal hiptese
vlida para uma grande classe de sistemas do mundo real, mas no para todos os sistemas. A
hiptese de suavidade pode ser incorporada em um modelo atravs do critrio de
identificao, ou seja, na etapa de estimao dos coeficientes ajustveis desse
O'SULLIVAN(1986), WAHBA (1990).
Regularizadores de naturezas diversas podem ser propostos, por exemplo, para penalizar a
curvatura das funes utilizadas na aproximao dos dados, para impor restries no valor
assumido pelas variveis, para forar a estabilidade em malha aberta do modelo proposto para
um sistema dinmico, entre outros.
Alguns trabalhos que utilizam a regularizao no contexto da identificao encontrados na
literatura so: o de TULLEKEN(1993) que sugere o uso de restries derivadas do
conhecimento prvio do sistema para melhorar o modelo, no contexto da identificao de
sistemas lineares; o de THOMPSON e KRAMER(1994) que discute como diferentes tipos de
conhecimento podem ser utilizados para estruturar um modelo; o de GIROSI et. al.(1995) que
analisa como diferentes penalizaes da no suavidade levam a diferentes bases de funes
54
J = Y F ( X )
+ i J i
(6.1)
i =1
onde,
N: Nmero de regularizadores;
: Vetor de parmetros;
Ji - i-simo regularizador;
55
Algumas dedues efetuadas nas prximas sees dependem das variveis definidas e,
para maior compreenso, as matrizes e vetores presentes na Equao (6.1) so descritos em
formato expandido:
y1
y y R ; ( i = 1,....N )
p
2
i
;
Y =
Y (N p x 1)
y N p
X 1 x1,1 x1, 2 x1, Nv
xi , j R ; (i = 1,....N p ; j = 1,....N v )
X x
x
x
2 ,1
2, 2
2 , Nv
2
=
X =
; X i R N v ; ( i = 1,....N p )
X (N p x N v )
X
N p x N p ,1 x N p , 2 x N p , Nv
1 ( )
Nv
( ) R ; ( = X i ; i = 1,....N p )
2
; ( ) : R N v R; ( i = 1,....N )
( ) =
f
i
N
N
f
( ) : R v R
(
)
N f
T ( X 1 ) 1 ( X 1 ) 2 ( X 1 ) N f ( X 1 )
T
( X 2 ) 1 ( X 2 ) 2 ( X 2 ) N f ( X 2 ) F ( X )
F (X ) =
; ( N
=
p x N f )
T X N p 1 (X Np ) 2 (X Np ) N f (X Np )
onde
Np: Nmero de pontos do grupo de dados;
Nv: Nmero de variveis;
Nf: Nmero de funes (regressores);
56
(6.2)
+ 1 J1
J = Y T Y 2Y T F ( X ) + T F ( X ) F ( X ) + 1 2 B T + T A
1 4 4 4 4 4 4 4 2 4 4 4 4 4 4 43
1 4 4 2 4 43
T
erro aproximao
J1
T
T
T
(4X )3 + 1 T4F4( X4) 4F2( X4 )4+ 41 4A3
J= Y
{ Y + 21 41 4B 4 2Y4 F
4
cons tan te
linear
quadrtico
(F ( X )
) (
dJ
= 0 ) (condio de otimizao)
d
F (X ) + 1 A = F (X ) Y 1 B
T
(6.3)
No caso nominal (sem regularizadores, ou seja, 1=0) tem-se que a Equao (6.3) reduz-se
para:
F ( X ) F ( X ) = F ( X ) Y
T
(6.4)
57
dJ
= 0 . A implementao de regularizadores que no podem ser obtidos a partir
d
N
N
T
T
F ( X ) F ( X ) + i Ai = F ( X ) Y i Bi
i =1
i =1
(6.5)
J = Y F (X )
+ i K i J i
(6.6)
i =1
Ai
Equao (6.5);
58
6.4 Influncia
da
Regularizao
pela
Norma
dos
Pesos
no
G = J +
= Y F (X )
59
(F ( X )
F (X ) + I = F (X ) Y
T
Sendo que I a matriz de regularizao que corresponde a uma matriz identidade com as
mesmas dimenses de F(X)TF(X).
O parmetro pode ser definido, de forma conveniente, como:
F (X ) F (X )
T
= Max
=1
onde
G = Y F (X )
+ Max
Esta definio tem como vantagem poder se trabalhar com uma constante normalizada, ou
seja, se =1 a norma da matriz de covarincia F(X)TF(X), associada ao termo de
aproximao dos dados Y F ( X ) , igualada norma da matriz de regularizao I
2
multiplicada pela constante Max. O objetivo determinar um valor otimizado para que seja
independente do problema.
Considerando o espectro de A (conjunto de todos os autovalores de matriz A) e uma
constante arbitrria tem-se, da lgebra matricial, a seguinte relao:
( A + I ) = ( A) +
(6.7)
60
Menor autovalor
Maior autovalor
F(X) F(X)
Min
Max
F(X)TF(X) + I
Min + Max
(1+) Max
Nmero de condio
Max
(1 + ) Max
Min
Min
+ Max
Na Tabela 6.1, mostra-se o valor do nmero de condio, para os casos com e sem
regularizao. Este parmetro definido como a relao entre o maior e o menor autovalores
de uma matriz, quando se considera a norma 2 para matrizes, e indica a dificuldade de
inverter uma matriz. Se o nmero de condio for prximo a 1, a matriz pode ser invertida
facilmente, no sentido que a inversa existe e pode ser calculada acuradamente. Se o nmero
de condio for muito alto, da ordem de muitas ordens de grandeza, a inversa pode no
existir.
Para matrizes simtricas do tipo F(X)TF(X) e (F(X)TF(X) + I) os autovalores so todos
no-negativos. Os maiores autovalores esto associados s funes mais importantes da srie,
em termos da energia do sinal de sada, para a aproximao dos dados. No outro extremo, os
menores autovalores esto associados aos termos da srie de pequena importncia na
aproximao dos dados. Como um exemplo, quando se utiliza um nmero de funes superior
ao necessrio para identificar um processo, a matriz de covarincia F(X)TF(X) possuir
autovalores muito prximos a zero, j que existem regressores de pequena importncia. Neste
caso, o nmero de condio cresce arbitrariamente e os pesos podem ser estimados
incorretamente em funo dos problemas numricos envolvidos.O problema que no se
conhece, a priori, quais e quantos regressores so relevantes identificao e que, portanto
deveriam ser utilizados.
A no utilizao da regularizao causa problemas numricos na estimao dos pesos
conforme descrito. Ao contrrio, um valor excessivo do parmetro de regularizao aumenta
significativamente o erro quadrtico de aproximao. Dessa forma, existe uma faixa de
valores que o parmetro de regularizao pode assumir.
Uma vez que os maiores autovalores esto associados aos termos da srie de maior
importncia na aproximao dos dados, os primeiros no deveriam sofrer variao
significativa quando se adiciona o regularizador pela norma do vetor de pesos. Dessa forma, o
maior autovalor de (F(X)TF(X) + I) deve ser aproximadamente igual ao maior autovalor de
F(X)TF(X), ou seja:
61
<< 1
Esta restrio estabelece um limite superior para . Lembrando que ( >= 0), por
definio, tem-se um limite inferior para este parmetro.
Se for permitido variar, por exemplo, na faixa [0;1E-4] pode-se garantir que as duas
restries sejam satisfeitas. O valor atribudo ao limite superior foi obtido atravs de
simulaes descritas na seo 6.6, onde se mostra que, para valores de igual ou maiores que
1E-4, o erro de aproximao poderia ter, em alguns casos, um aumento significativo quando
comparado ao erro para =0, ou seja, sem regularizao. Dessa forma, fica estabelecida uma
faixa de atuao para o parmetro de regularizao.
Para =0 tem-se a soluo trivial que no utiliza a regularizao. Esta situao no de
interesse em funo dos problemas numricos que podem ocorrer. possvel definir um
melhor limite inferior para relacionando o valor desse com o mximo do nmero de
condio que no resulte em problemas numricos. O nmero de condio da matriz
Max
Min
+ Max
) . Utilizando
Nmero de condio =
(1 + ) Max
Min
+ Max
) (
Min
1
Max
Max
=
Max
Max
+ )
(6.8)
62
Figura 6-1 - Comparao da aproximao do mesmo conjunto de dados para diferentes modelos
63
2 ()T
(6.9)
onde,
64
h1, 2
h1, N v 1
h1, N v
h1,1
h2, 2
h2, N v 1
h2, N v
h2,1
H =
hN v 1,1 hN v 1, 2 hN v 1, N v 1 hN v 1, N v
hN v , 2 hN v , N v 1 hN v , N v
hN v ,1
2 ( )
com hi , j =
i j
V = h1,1 h1, N v
1 4 2 43
linha 1 de H
hN v ,1 hN v , N v
1 44 2 4 43
linha Nv de H
h2,1 h2, N v
1 4 2 43
linha 2 de H
Como o modelo emprico tem validade em um domnio limitado, pode-se associar a cada
varivel i (i=1,....Nv) uma faixa de trabalho, ou seja, i definida no intervalo [ai, bi]
(i=1,....Nv). Substituindo as definies na Equao (6.9) tem-se:
2 ()T
b1 b 2
a1 a 2
(h
bN v
aN v
1,1
d =
b1 b 2
a1 a 2
aN v
V ( ) V ( ) d 1 d 2 d N v
bN v
)( ) d d
1
d N v
b1 b 2
a1 a 2
(h )( ) d d
bN v
aN v
i, j
d N v
2 ( )
=
a1 a 2
aN v
i j
b1 b 2
bN v
d 1 d 2 d N V
(hi,j um escalar)
b1 b 2
a1 a 2
2 ( )T
aNv i j
bN v
) (( ) )
2
i j
d 1 d 2 d N V
2 ( )
T
= i, j ( )
i j
T
65
( ( ) ) ( ( ) ) d d
b1 b 2
a1 a 2
bN v
aN v
i, j
i, j
d NV
b1 b 2
a1 a 2
bN v
aN v
T i, j ( )i, j ( ) d 1 d 2 d NV
T
b1 b 2
T
a1 a 2
Equao
M i, j =
b1 b 2
a1 a 2
bN v
aN v
bN v
aN v
(6.10)
T
i, j ( )i, j ( ) d 1 d 2 d NV
quadrtica
nos
(6.10)
parmetros.
termo
Nv
M = M i, j
i =1 j =1
onde M tambm uma matriz quadrada a coeficientes constantes com dimenses compatveis
com o nmero de parmetros. Por definio, a matriz fixa M semidefinida positiva, ou seja,
TM 0 .
Dessa forma tem-se que TM representa o ndice de desempenho dado pela Equao
(6.9), ou seja:
2 ()T
(6.11)
d = TM
66
Consideraes:
(a) TM 0 ;
(b) Definindo dois vetores u= e v= M;
(c) |uTv |=||u||||v|||cos | ( o ngulo entre u e v);
(d) 0 |cos | 1
(e) A norma de uma matriz definida como T = sup
x 0
Tx
2 ()T
ou seja:
Min. || ||2 Min. TM = Min.
2 ()T
d (eq. 12-6)
2 ()T
objetivo de treinamento, por outro muito mais simples = T. O ltimo ainda tem a
vantagem de ser aplicvel a sries de funes no diferenciveis em relao s variveis
independentes.
O mapeamento complicado TM, relativo elipse cujos eixos principais (autovetores)
no esto alinhados aos eixos coordenados, pode ser majorado por um mapeamento mais
simples, a circunferncia. Se o dimetro da circunferncia for diminudo, o mesmo deve
2
acontecer com as dimenses da elipse para que a restrio TM Max
M |||| permanea
2 ()T
d = TM tambm ser.
67
6.6 Resultados
Para demonstrar os resultados obtidos nas sees 6.4 e 6.5, foram efetuados alguns testes
relativos identificao do tanque de pH descrito na seo 5.3. Para este sistema, o valor do
pH, no instante (k+1), pode ser identificado a partir do valor do pH e da vazo de base no
tempo discreto k. Os testes foram efetuados utilizando redes de base radial, de funes de
escala e feedforward. O parmetro de regularizao foi variado entre 0, caso sem
regularizao e 1E-4, o limite superior assumido.
r2
objetivo que incorpora o termo de penalizao da norma do vetor de pesos, alm do erro
quadrtico de aproximao, foi utilizada para treinamento da rede de base radial.
Na Figura 6-2 mostram-se os pesos estimados da camada de sada, em valor absoluto, para
alguns valores do parmetro de regularizao. A abscissa corresponde ao ndice dos pesos,
sendo estes ordenados em ordem decrescente de valor absoluto.
Nota-se, na Figura 6-2, que o valor absoluto dos pesos da camada de sada diminui
medida que o parmetro de regularizao aumentado, o que implica em um decrscimo da
norma do vetor de pesos da camada de sada. Este efeito esperado j que a norma descrita
faz parte da funo objetivo minimizada. No caso sem regularizao, observam-se pesos da
ordem de 1E+6, indicando uma pobre capacidade de generalizao, uma vez que os dados de
sada da rede foram normalizados entre 0 e 1. A solues mais coerentes correspondem as
situaes = 1E-6 a 1E-4, onde a grande maioria da norma dos pesos menor ou prxima a 1.
68
1,0E+06
Valor absoluto pesos
1,0E+05
1,0E+04
1,0E+03
=0
1,0E+02
=1,0E-1
1,0E+01
=1,0E-8
1,0E+00
=1,0E-6
1,0E-01
=1,0E-4
1,0E-02
1,0E-03
11
16
21
26
Figura 6-2 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao
N condio
N condio Mximo
1,0E+11
Nmero de condio
1,0E+10
1,0E+09
1,0E+08
1,0E+07
1,0E+06
1,0E+05
1,0E+04
1,0E+03
1,0E-11
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
1,0E-05
1,0E-04
Parmetro de regularizao ()
69
Embora no possa ser mostrado na Figura 6-3, em funo da escala logartmica para a
abscissa, o valor do nmero de condio para a matriz de covarincia sem regularizao da
ordem de 1E+17. Este valor extremamente alto explica os valores elevados para os pesos
quando =0.
Na Figura 6-4 pode-se observar o valor do erro quadrtico normalizado, 100-R2, em
funo do valor do parmetro de regularizao. medida que a importncia do critrio da
norma do vetor de pesos aumentada com o crescimento de , o valor de100-R2 cresce de
forma monotnica. Isto esperado uma vez que os pesos devem ser ajustados para minimizar
dois critrios: o erro quadrtico de aproximao e a norma dos pesos ao invs de apenas o
primeiro.
1,0
100-R
0,8
0,6
0,4
0,2
0,0
1,0E-11
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
Parmetro de regularizao ()
1,0E-05
1,0E-04
Na Figura 6-4 pode-se observar que 100-R2 sofre um aumento pouco significativo at
=1E-6. A partir deste h um grande acrscimo em 100-R2. Como o objetivo determinar
70
objetivo adequada para identificao de sistemas dinmicos. O problema deste critrio que
utiliza somente a informao puntual dos dados de treinamento, o que ocorre na vizinhana
destes pontos no levado em considerao porque a informao de vizinhanas est contida
nas derivadas.
A utilizao do erro quadrtico de aproximao conjuntamente com a norma dos pesos
gera uma funo objetivo de melhor desempenho do que apenas o primeiro critrio. Neste
caso, o conhecimento das derivadas dos pontos do grupo dados utilizado indiretamente, uma
vez que minimizando a norma do vetor de pesos estimados o mesmo ocorre com as derivadas
de segunda ordem da(s) sada(s) da rede em relao (s) entrada(s), conforme j demonstrado
na seo 6.5.
1,0E+00
1,0E-01
=0
=1,0E-1
1,0E-02
=1,0E-8
=1,0E-6
=1,0E-4
1,0E-03
1,0E-04
1
11
16
ndice dos pesos
21
Figura 6-5 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao
71
Na Figura 6-5 pode-se observar que, no caso da rede de funes de escala, os valores dos
pesos variam muito pouco em funo do valor do parmetro de regularizao. A magnitude
do maior peso inferior a 1 em qualquer caso.
N condio
N condio mximo
1,0E+11
Nmero de condio
1,0E+10
1,0E+09
1,0E+08
1,0E+07
1,0E+06
1,0E+05
1,0E+04
1,0E+03
1,0E-11
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
1,0E-05
1,0E-04
Parmetro de regularizao ()
N condio
N condio mximo
1,0E+11
Nmero de condio
1,0E+10
1,0E+09
1,0E+08
1,0E+07
1,0E+06
1,0E+05
1,0E+04
1,0E+03
1,0E-11
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
1,0E-05
1,0E-04
Parmetro de regularizao ()
Nas Figuras 6.6 e 6.7 pode ser observada a evoluo do nmero de condio em funo do
parmetro de regularizao, para os dois nveis utilizados na identificao do tanque de pH.
72
Nestas figuras, o nmero de condio da matriz de covarincia, para os dois nveis de funes
de escala, variou pouco indicando que o maior e menor autovalores no sofreram mudanas
significativas. Dado que a contribuio do termo de regularizao definida de tal forma que
o maior autovalor da matriz de covarincia no sofra influncia e como o nmero de condio
no variou de forma significativa, ento o menor autovalor tambm no sofreu modificaes
significativas em todos os casos. Dessa forma, o maior e o menor autovalores esto mais
prximos quando se compara a rede de funes de escala com a de base radial, o que explica
o menor nmero de condio encontrados no primeiro caso.
Na Figura 6-8 mostra-se a evoluo do valor de 100-R2 em funo do valor do parmetro
de regularizao, para a rede de funes de escala. Como os pesos no sofreram mudanas
significativas com a utilizao da regularizao, o mesmo esperado para o valor 100-R2 em
funo do valor de .
0,14
0,12
100-R
0,10
0,08
0,06
0,04
0,02
0,00
1,0E-11
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
1,0E-05
1,0E-04
Parmetro de regularizao ()
73
74
1,0E+03
Valor absoluto pesos
1,0E+02
=0
1,0E+01
=1,0E-1
1,0E+00
=1,0E-8
=1,0E-6
1,0E-01
=1,0E-4
1,0E-02
1,0E-03
1
11
16
ndice dos pesos
21
26
Figura 6-9 - Valor absoluto dos pesos para alguns valores do parmetro de regularizao ()
100,0
10,0
1,0
0,1
1,0E-10
1,0E-09
1,0E-08
1,0E-07
1,0E-06
1,0E-05
1,0E-04
Parmetro de regularizao ()
75
da rede (Ver Figura 6-10). Embora no possa ser mostrado nesta ltima, em funo da escala
logartmica para a abscissa, o valor da norma dos coeficientes para o caso =0 fica em torno
de 700.
Na Figura 6-11 mostra-se a evoluo do nmero de condio para alguns valores do
parmetro de regularizao, no caso da rede feedforward correspondente ao melhor indivduo
da cada gerao. O valor da abscissa mostrado em pocas sendo igual ao nmero de
avaliaes da funo objetivo. A cada gerao do GA foram efetuadas 30 avaliaes de
Nmero de condio
1,0E+14
1,0E+13
1,0E+12
1,0E+11
1,0E+10
1,0E+09
1,0E+08
1,0E+07
1,0E+06
1,0E+05
1,0E+04
1,0E+03
=0
=1,0E-1
=1,0E-8
=1,0E-6
=1,0E-4
200
400
600
800
1000
Nmero de pocas
1200
1400
1600
Figura 6-11 - Nmero de condio da matriz de covarincia para alguns valores do parmetro
de regularizao ()
Nota-se na Figura 6-11 que o aumento do parmetro de regularizao, para uma dada
poca, diminui o nmero de condio da matriz de covarincia, conforme esperado. Para o
caso =0, o nmero de condio aumenta em funo do nmero de pocas, ou seja, as sadas
dos neurnios da camada intermediria ficam cada vez mais correlacionadas medida que o
treinamento avana. Como resultado, os coeficientes da camada de sada podem atingir
algumas ordens de grandeza.
Redes do tipo feedforward so frames, tais como as redes de base radial, o que explica o
valor extremamente alto do nmero de condio, no caso sem regularizao.
Na Figura 6-12 pode-se observar a evoluo do valor de 100-R2 em funo do nmero de
pocas. Claramente, o resultado obtido para =1E-4 insatisfatrio causando um aumento
excessivo do erro de aproximao. Este comportamento tambm ocorreu com a rede de base
radial descrita na seo 6.6.1, cuja matriz de covarincia sem regularizao tambm era
76
1,0E-01
100-R
=0
=1,0E-1
1,0E-02
=1,0E-8
=1,0E-6
=1,0E-4
1,0E-03
0
200
400
600
800
1000
Nmero de pocas
1200
1400
1600
Figura 6-12 - 100-R2 x nmero de pocas para alguns valores do parmetro de regularizao ()
6.7 CONCLUSES
Problemas numricos na estimao dos coeficientes de um modelo emprico podem ser
minimizados se a funo objetivo contiver, alm do erro quadrtico de aproximao, um
termo que penalize a norma quadrtica do vetor de coeficientes.
Um regularizador que penalize as curvaturas da superfcie de um modelo pode ser obtido a
partir do conhecimento das derivadas de segunda ordem desse, se estas estiverem definidas.
Na prtica, o clculo do regularizador descrito, mesmo que possvel, bastante complexo e
custoso computacionalmente.
A minimizao da norma dos coeficientes de um modelo emprico tambm minimiza as
derivadas de segunda ordem da(s) sada(s) desse em relao s variveis de entrada, o que
implica em limitar as curvaturas da superfcie de previso do modelo.
Para um modelo emprico, o compromisso entre aproximar os dados, que corresponde
minimizao do erro quadrtico de aproximao na funo objetivo para estimao dos
coeficientes, e eliminar excessivas curvaturas da superfcie do modelo, que corresponde ao
77
termo que minimiza a norma do vetor de coeficientes, impe restries no valor do parmetro
de regularizao, ou seja, o fator que multiplica esse ltimo termo.
O aumento do fator de penalizao da norma dos coeficientes de um modelo emprico, na
funo objetivo de treinamento, implica na minimizao das curvaturas da superfcie de
previso do modelo, no entanto, ocorre um acrscimo do valor do erro quadrtico de
aproximao.
Redes de base radial e do tipo feedforward so frames e a rede de funes de escala uma
base para um espao de funes. A estimao dos coeficientes no ltimo caso menos
suscetvel a problemas numricos, uma vez que as funes de uma base so, por definio,
linearmente independentes. Esta caracterstica no , em geral, verdadeira no caso de um
frame.
Para modelos empricos que no so lineares nos parmetros, como o caso da rede
feedforward, mostrou-se que a utilizao da regularizao pela norma dos pesos produz
resultados semelhantes aos observados no caso de modelos lineares nos parmetros, tais como
as redes de funes de escala e de base radial.
78
(7.1)
que oscilatrio para 3,7 e apresenta comportamento catico para > 3,7
BAKSHI e STEPHANOPOULOS(1993) (Ver Figura 7-1).
0,8
0,8
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0,0
1
11
21
31
amostra
(a)
41
1,0
y(k)
y(k)
1,0
11
21
31
amostra
41
(b)
Figura 7-1 - (a) Comportamento oscilatrio (= 3,5); (b) Comportamento catico (= 3,9)
79
80
Na Tabela 7.1 mostra-se a estrutura de cada rede para 25 parmetros ajustveis. Este
nmero de parmetros corresponde a uma rede de funes de escala com dois nveis de
resoluo.
Na Figura 7-2 mostra-se a variao do valor de 100-R2 para as redes testadas em funo
do nmero de parmetros ajustveis. Para as redes de base radial e de funes de escala, cada
parmetro ajustvel corresponde ao peso de um neurnio. Considerando estas redes, a Figura
7-2 pode ser interpretada da seguinte forma: para um determinado nmero N (N=1,.. 25, o
nmero total de parmetros ajustveis) calculou-se o valor de 100-R2 da rede formada com
apenas os N neurnios mais importantes, em termos da minimizao do erro de aproximao.
Os N neurnios mais importantes foram determinados atravs da tcnica de mnimos
quadrados ortogonais. Variando N de 1 a 25, gerou-se as curvas das redes de base radial e de
funes de escala mostradas na Figura 7-2.
No caso da rede feedforward, a interpretao da Figura 7-2 pode ser feita de forma
semelhante: para um determinado nmero N (N=1,.. 7, o nmero de neurnios da camada
intermediria mais o bias de sada) calculou-se o valor de 100-R2 da rede formada apenas dos
pesos conectados aos N aproximadores mais importantes (que podem ser neurnios da
camada intermediria ou o bias da sada) na minimizao do erro quadrtico de treinamento.
Os N aproximadores mais importantes foram determinados atravs da tcnica de mnimos
81
quadrados ortogonais, uma vez que a camada de sada linear nos parmetros. Variando N de
1 a 7 gerou-se a curva da rede feedforward mostrada na Figura 7-2.
Deve-se notar que a incorporao de um neurnio na camada intermediria da rede
feeforward equivale ao crescimento da rede em um nmero de parmetros ajustveis igual ao
F. escala(trn)
B. radial (trn)
Feed. (trn)
1,0E+02
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
10 nvel
1,0E-05
20 nvel
1,0E-06
1,0E-07
1
9
13
17
Nmero de parmetros ajustveis
21
25
Figura 7-2 - O valor de 100-R2 em funo do nmero de parmetros ajustveis para as redes
testadas (treinamento)
Na Figura 7-2 pode-se observar que foi obtido o pior resultado, em termos de erro de
aproximao, com a rede de base radial. Para este modelo, o valor de 100-R2, diminui
significativamente at 5 neurnios. No caso da rede de feedforward, obtm-se um melhor
desempenho se considerada a parte final da curva de 100-R2, sendo que pela tendncia dessa
curva possvel concluir que adicionando mais neurnios na camada intermediria, o erro de
aproximao ainda pode ser diminudo. Para a rede de funes de escala duas caractersticas
podem ser destacadas: O valor muito pequeno de 100-R2, quando se compara esse aos outros
tipos de modelos, e a inflexo da curva de 100-R2 para 9 neurnios, correspondente ao
primeiro nvel de resoluo.
A rede de funes de escala uma base para um espao de funes e as caractersticas
descritas indicam que o atrator catico pertence, ou seja, um elemento do subespao gerado
pelo primeiro nvel de resoluo da rede proposta neste trabalho.
82
Para validao de modelos vrios critrios podem ser utilizados, tais como: Critrios
estatsticos, curvas de correlao, previso utilizando outro grupo de dados diferente do de
treinamento (validao cruzada). Neste captulo foram adotados como mtodos de
comparao e validao de modelos, o critrio de Akaike (AIC) e a validao cruzada.
O critrio de Akaike dado pela seguinte equao:
N 2
E (k )
+ 4 N
AIC = N ln k =1
N
onde
N: nmero de pontos do grupo de dados;
E(k): erro associado ao k-simo padro;
N: nmero de parmetros;
83
F. escala(trn)
B. radial (trn)
Feed. (trn)
-1000
AIC
-2000
-3000
10 nvel
-4000
20 nvel
-5000
1
9
13
17
Nmero de parmetros ajustveis
21
25
Figura 7-3 - Valor de AIC em funo do nmero de parmetros ajustveis para as redes testadas
Analisando a Figura 7-3, pode-se concluir que a rede feedforward um melhor modelo
que a de base radial, quando se compara o menor valor das curvas de AIC, e a rede de funes
de escala muito melhor que ambas.
Na Figura 7-4 mostra-se o valor de 100-R2 para o grupo de dados de teste em funo do
nmero de parmetros ajustveis. Este teste tem por objetivo verificar a capacidade de
generalizao das redes descritas, uma vez que os dados so diferentes dos utilizados no
treinamento e, conseqentemente, no influenciaram no clculo dos pesos. Pode-se observar
que a rede de funes de escala muito melhor que as redes feedforward e de base radial, o
que est de acordo com o critrio de Akaike. Outra caracterstica importante que, para todos
os modelos, aumentando o nmero de parmetros, o valor de 100-R2, em geral, diminui.
Dessa forma, pode-se concluir que foi evitado o problema de sobre-ajuste pelo excesso do
nmero de funes. No caso da rede feedforward, utilizou-se a metodologia de GA + mnimos
quadrados para treinamento, sendo que essa foi finalizada quando 100-R2 no mais se alterou.
Assim sendo, foi evitado o sobre-treinamento por excesso de pocas. Dessa forma, pode-se
concluir que a penalizao da norma do vetor de pesos, adicionada ao erro quadrtico de
aproximao, resultou na minimizao de excessivas curvaturas das superfcies dos modelos
utilizados na identificao do atrator catico.
84
F. escala(tst)
B. radial (tst)
Feed. (tst)
1,0E+02
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
10 nvel
1,0E-05
20 nvel
1,0E-06
1,0E-07
1
9
13
17
Nmero de parmetros ajustveis
21
25
Figura 7-4 - O valor de 100-R2 em funo do nmero de parmetros ajustveis para as redes
testadas (Teste)
x = dx + x
1
s = d (s f s)
yx/ s
p = dp + ( + ) x
m 1 p p s
m
=
2
km + s + s
ki
onde
d - vazo de alimentao do reator biolgico (varivel de perturbao);
sf - concentrao de substrato na alimentao;
85
86
esse.
0,24
0,22
0,20
0,18
0,16
1
51
101
151
201
amostra
251
301
351
6,9
6,4
5,9
5,4
4,9
4,4
1
51
101
151
201
amostra
251
301
351
8,0
6,0
4,0
2,0
1
51
101
151
201
amostra
251
301
351
87
24,0
22,0
20,0
18,0
16,0
14,0
1
51
101
151
201
amostra
251
301
351
alimentao.
0,24
0,22
0,20
0,18
0,16
1
51
101
151
201
amostra
251
301
351
88
6,9
6,4
5,9
5,4
4,9
4,4
1
51
101
151
201
amostra
251
301
351
8,0
6,0
4,0
2,0
1
51
101
151
201
amostra
251
301
351
24,0
22,0
20,0
18,0
16,0
14,0
1
51
101
151
201
amostra
251
301
351
89
Na Tabela 7.3 pode-se observar a estrutura das redes de funes de escala, feedforward e
de base radial utilizadas na identificao do reator biolgico. Foi considerado, na
determinao do nmero de parmetros ajustveis, o critrio de identificao baseado na rede
de funes de escala.
N de neurnios = 81
N de nveis = 1
N de parmetros ajustveis = 81
Rede de base radial
N de centros = 81
N de parmetros ajustveis = 81
Rede feedforward
Nas Figuras 7.13 e 7.15 mostra-se a variao do valor de 100-R2 em funo do nmero de
parmetros ajustveis das redes, considerando o treinamento e o teste respectivamente. Na
Figura 7-14 mostra-se a variao do valor de AIC em funo do nmero de parmetros
ajustveis das redes testadas.
90
F. escala(trn)
B. radial(trn)
Feed. (trn)
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
1
11
21
31
41
(a)
51
61
71
81
11
21
31
41
(b)
51
61
71
81
11
21
31
41
51
61
Nmero de parmetros ajustveis - (c)
71
81
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
1,0E+01
1,0E+00
1,0E-01
100-R
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
Figura 7-13 - O valor de 100-R2 x nmero de parmetros ajustveis das redes (treinamento)
(a) concentrao de clulas; (b) concentrao de substrato; (c) concentrao de produto
91
AIC
F. escala(trn)
B. radial(trn)
Feed. (trn)
-1,0E+03
-2,0E+03
-3,0E+03
-4,0E+03
-5,0E+03
-6,0E+03
-7,0E+03
-8,0E+03
-9,0E+03
-1,0E+04
0
10
20
30
40
50
60
70
80
90
50
60
70
80
90
30
40
50
60
70
Nmero de parmetros ajustveis - (c)
80
90
(a)
-1,0E+03
AIC
-2,0E+03
-3,0E+03
-4,0E+03
-5,0E+03
-6,0E+03
-7,0E+03
-8,0E+03
-9,0E+03
-1,0E+04
0
10
20
30
40
(b)
-1,0E+03
AIC
-2,0E+03
-3,0E+03
-4,0E+03
-5,0E+03
-6,0E+03
-7,0E+03
-8,0E+03
-9,0E+03
-1,0E+04
0
10
20
Figura 7-14 - O valor de AIC x nmero de parmetros ajustveis das redes (treinamento)
(a) concentrao de clulas; (b) concentrao de substrato; (c) concentrao de produto
92
F. escala(tst)
B. radial(tst)
Feed. (tst)
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
1
11
21
31
41
(a)
51
61
71
81
11
21
31
41
(b)
51
61
71
81
11
21
31
41
51
61
Nmero de parmetros ajustveis - (c)
71
81
1,0E+01
1,0E+00
100-R
1,0E-01
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
1,0E+01
1,0E+00
1,0E-01
100-R
1,0E-02
1,0E-03
1,0E-04
1,0E-05
1,0E-06
1,0E-07
Figura 7-15 - O valor de 100-R2 x nmero de parmetros ajustveis das redes (teste)
(a) concentrao de clulas; (b) concentrao de substrato; (c) concentrao de produto
93
94
N de neurnios = 61
N de nveis = 3
N de parmetros ajustveis = 61
Rede de base radial
N de centros = 61
N de parmetros ajustveis = 61
Rede feedforward
Nas Figuras 7.16 e 7.18 mostra-se a variao do valor de 100-R2 em funo do nmero de
parmetros ajustveis das redes comparadas, considerando o treinamento e o teste
respectivamente. Na Figura 7-17 mostra-se a variao do valor de AIC em funo do nmero
de parmetros ajustveis das redes.
F. escala(trn)
B. radial (trn)
Feed. (trn)
100,00
100-R
10,00
1,00
0,10
0,01
0
10
20
30
40
Nmero de parmetros ajustveis
50
60
95
F. escala(trn)
B. radial (trn)
Feed. (trn)
0
-1000
AIC
-2000
-3000
-4000
-5000
-6000
0
10
20
30
40
Nmero de parmetros ajustveis
50
60
F. escala(tst)
B. radial (tst)
Feed. (tst)
100,00
100-R
10,00
1,00
0,10
0,01
0
10
20
30
40
Nmero de parmetros ajustveis
50
60
Analisando as Figuras 7.16 a 7.18, pode ser observado que resultados to bons, como os
conseguidos com os outros sistemas dinmicos testados, nem sempre so obtidos com a rede
de funes de escala. Na identificao do tanque de pH no foi atingido um valor de 100-R2
to pequeno quanto no caso do atrator catico e do reator biolgico. Tambm no foram
observadas inflexes to marcantes nas curvas de erro de aproximao de treinamento, teste e
do critrio de Akaike como apresentadas para os outros processos.
96
7.4 Concluses
Na identificao dos sistemas dinmicos atrator catico e reator biolgico pode-se
concluir que os piores resultados, em termos de erro de aproximao de treinamento, teste e
do critrio de Akaike, foram obtidos com a rede de base radial. No caso da rede feedforward,
obteve-se um melhor desempenho quando se compara essa com a de base radial. Para a rede
de funes de escala, pode-se destacar, em comparao com os outros modelos, os baixos
valores do erro de aproximao de treinamento e de teste. Em termos do critrio de Akaike, a
rede de funes de escala tambm foi bastante superior.
Para alguns tipos particulares de no-linearidade, tal como a existente no comportamento
de um tanque de pH, um maior nmero de nveis de resoluo pode ser necessrio para
correta identificao do sistema.
No caso da rede de funes de escala, que uma base para um espao de funes, a
presena de inflexes marcantes nas curvas do erro de aproximao de treinamento, teste e do
critrio de Akaike de sistemas dinmicos indica que esses esto contidos nos subespaos
gerados pelos diferentes nveis de resoluo.
97
O atrator catico e reator biolgico pertencem ao subespao gerado pelo primeiro nvel de
resoluo da rede de funes de escala proposta.
O aumento do nmero de neurnios faz decrescer o erro de aproximao de treinamento,
como esperado, sendo que, em geral, o mesmo ocorreu no caso do grupo de dados de teste.
Dessa forma, a regularizao pela norma dos pesos garantiu a capacidade de generalizao
das redes de base radial, feedforward e funes de escala.
98
utilizados os valores atuais e passados das sadas do processo para prever as sadas da planta
no prximo intervalo de amostragem, ou seja, um passo frente. Um mtodo de validao de
modelos mais exigente do que o descrito a simulao do comportamento do processo. Neste
ltimo, utiliza-se o(s) primeiro(s) ponto(s) do grupo de dados de validao como condio
inicial para a rede. Para os demais pontos, utiliza-se apenas os dados das variveis de
perturbao como informao externa e faz-se a realimentao das sadas da rede.
Neste trabalho, o desempenho da rede de funes de escala foi avaliado utilizando essa
como simulador de dois sistemas dinmicos reconhecidos como benchmarks de identificao
e controle no-linear: um CSTR encamisado que apresenta multiplicidade de estados
estacionrios e um reator que apresenta resposta inversa varivel.
dx 2
= k x1 (q + ) x 2 + x3 + q x 2 f
d
dx3 qc ( x3 f x3 ) ( x2 x3 )
=
+
d
1
1 2
99
x2
k = exp
1 + x 2 /
H C f
C p T f 0
x3 =
(Tc T f 0 )
Tf 0
(T T f 0 )
x2 =
Tf 0
V k 0 exp( )
Q0
UA
C p Q0
E
R Tf 0
(T f T f 0 )
Q0 t
V
x 2f =
Vc
V
x1 =
C
C fo
x 1f =
Cf
Cf0
1 =
2 =
c C pc
x 3f =
Cp
(Tcf T f 0 )
Tf 0
q=
Tf 0
Q
Q0
H - Calor de reao;
C - Composio no reator;
Cf - Composio de alimentao;
Cf0 - Composio de referncia de alimentao;
-Densidade do meio racional;
c - Densidade do fluido refrigerante;
100
= 8,0;
x1f = 1,0;
= 0,072;
m = 0,2;
= 0,3;
q = 1,0;
= 20,0;
x3 = 0;
1= 0,1;
2= 0,5;
x3f = -1,0;
qc = 1,65102;
d - (varivel de perturbao).
Estados estacionrios estveis (d = 1.0)
101
O grupo de dados utilizado para treinamento da rede (em torno de 800 pontos) foi obtido
amostrando o modelo do CSTR a cada 0,25 segundos, como recomendado no trabalho de
TAHUATA(1992).
As perturbaes aplicadas na vazo de alimentao adimensionalizada (q) foram pulsos
aleatrios com amplitude mxima de 0,75 e largura de 5 e 15 intervalos de amostragem em
torno do valor de estado estacionrio q = 1,0. As perturbaes na vazo de alimentao foram
suficientes para provocar transies entre os estados estacionrios.
Na Figura 8-1 mostram-se as perturbaes aplicadas na vazo de alimentao e utilizadas
para treinamento da rede de funes de escala. Nas Figuras 8.2 a 8.4 podem ser vistas as
1,60
1,10
0,60
0,10
1
101
201
301
401
501
O objetivo estabelecido foi prever o valor futuro das variveis de estado a partir do valor
atual e anterior dessas e da varivel de perturbao. Assim sendo, a rede foi composta de trs
sadas correspondentes aos estados. Foi constatado que apenas os valores atuais dos estados e
da varivel de perturbao eram suficientes para identificar o processo uma vez que o
coeficiente de correlao de aproximao dos dados em cada sada foi superior a 99,99%.
Dessa forma, no houve necessidade de utilizar mais valores atrasados das sada e, portanto, a
rede de funes de escala foi composta de 4 entradas.
102
1,0
0,8
0,6
0,4
0,2
0,0
1
101
201
301
amostra
401
501
6,0
4,0
2,0
0,0
1
101
201
301
amostra
401
501
1,0
0,5
0,0
-0,5
-1,0
1
101
201
301
amostra
401
501
Para avaliar o desempenho do modelo obtido, gerou-se um grupo de dados de teste, sendo
que as perturbaes aplicadas na vazo de alimentao foram pulsos aleatrios com amplitude
103
alimentao.
1,60
1,10
0,60
0,10
1
101
201
301
Nas Figuras 8.6 a 8.8 mostra-se uma comparao das sadas previstas pela rede e os dados
reais. A rede foi utilizada como um simulador, ou seja, os valores das sadas foram
realimentados para clculo das previses. O coeficiente de correlao de aproximao para
cada sada foi superior a 99,99%.
Real
Rede
1,0
0,8
0,6
0,4
0,2
0,0
1
101
201
amostra
301
104
Real
Rede
6,0
4,0
2,0
0,0
1
101
201
amostra
301
Real
Rede
1,0
0,5
0,0
-0,5
-1,0
1
101
201
amostra
301
Pode ser observado nas Figuras 8.6 a 8.8 que a rede de funes de escala conseguiu
identificar perfeitamente a multiplicidade de estados estacionrios e os comportamentos
dinmicos nas vizinhanas desses. Dessa forma, foi comprovada a capacidade identificao de
redes baseadas em wavelets, o que valida as alteraes propostas.
Pode-se concluir que a rede de funes de escala generalizou muito bem, ou seja, essa foi
treinada para prever um passo a frente, no entanto, foi capaz de prever um nmero arbitrrio
de passos. O desempenho obtido, em termos de previso em aberto, foi semelhante ao das
redes neurais recorrentes CLAUMANN(1999).
105
2A D
(8.1)
onde
Ca e Cb: Concentraes de A e B no reator, respectivamente;
y: Produto de interesse que a concentrao de ciclopentenol (B);
Ca0: Concentrao do reagente A na corrente de alimentao ;
u: Taxa de diluio;
k1, k2, k3 : Parmetros cinticos.
Valor
k1
50 h-1
k1
100 h-1
k1
50 l/(mol.h)
Ca0
10 mol/l
106
Deve-se notar que embora a varivel de interesse seja o ciclopentenol (B), a concentrao
do reagente A tambm deve ser conhecida para ser possvel simular o comportamento da
primeira, conforme a Equao (8.1). Dessa forma, na sntese do ciclopentenol, as variveis de
estado de interesse correspondem s concentraes das substncias A e B. A varivel de
perturbao escolhida foi a taxa de diluio da corrente de alimentao.
O grupo de dados utilizado para treinamento da rede (em torno de 1100 pontos) foi obtido
amostrando o modelo descrito a cada 1 s 2,7778 E-004 h. As perturbaes aplicadas na taxa
de diluio (u) foram pulsos aleatrios com valores na faixa de [20; 190] h-1 e largura entre 10
a 50 intervalos de amostragem. Na Figura 8-9 mostram-se as perturbaes aplicadas na taxa
de diluio e utilizadas para treinamento da rede de funes de escala. Nas Figuras 8.10 e 8.11
pode ser vista a evoluo das concentraes de A e B para as perturbaes aplicadas.
180
-1
U (h )
140
100
60
20
1
201
401
amostra
601
801
1001
Concentrao A (mol/l)
6,5
6,0
5,5
5,0
4,5
4,0
3,5
3,0
2,5
1
201
401
601
801
amostra
1001
107
Concentrao de B (mol/l)
1,50
1,40
1,30
1,20
1,10
1,00
0,90
1
201
401
601
801
1001
amostra
O objetivo estabelecido foi prever o valor futuro das variveis de estado a partir do valor
atual e anterior dessas e da varivel de perturbao. Assim sendo, a rede foi composta de duas
sadas correspondentes aos estados de interesse. Em um estudo prvio, constatou-se que
apenas os valores atuais dos dois estados e da varivel de perturbao foram suficientes para
identificar o processo, sendo que o coeficiente de correlao de aproximao dos dados em
cada sada foi superior a 99,99%. Dessa forma, a rede de funes de escala foi composta de 3
entradas.
Para avaliar o desempenho em aberto do modelo obtido, gerou-se um grupo dados de
teste, sendo que as perturbaes aplicadas na taxa de diluio foram pulsos crescentes entre
30 e 180 h-1 com largura de 200 intervalos de amostragem. Na Figura 8-12 mostram-se as
perturbaes aplicadas na taxa de diluio.
180
-1
U (h )
140
100
60
20
0
200
400
600
800
amostra
1000
1200
1400
108
Nas Figuras 8.13 e 8.14 pode-se observar uma comparao entre as sadas previstas pela
rede e os dados de teste, sendo a rede utilizada como um simulador do processo. O coeficiente
de correlao de aproximao do teste para cada sada foi superior a 99,99%.
Real
Rede
Concentrao A (mol/l)
6,5
6,0
5,5
5,0
4,5
4,0
3,5
3,0
0
200
400
600
800
amostra
1000
1200
1400
Concentrao de B (mol/l)
Real
Rede
1,23
1,18
1,13
1,08
0
200
400
600
800
amostra
1000
1200
1400
Pode ser observado nas Figuras 8.13 e 8.14 que a rede de funes de escala conseguiu
identificar perfeitamente a comportamento no-linear de resposta inversa varivel. Como no
caso do CSTR com mltiplos estados estacionrios, pode-se concluir que a rede de funes de
escala generalizou muito bem uma vez que foi treinada para prever um passo a frente; no
entanto, foi capaz de prever um nmero arbitrrio de passos.
Os benchmarks de identificao e controle no-lineares descritos neste captulo foram
identificados utilizando apenas um nvel de resoluo, o que confirma a validade da proposta
de iniciar a multiresoluo com o menor nmero possvel de funes de escala.
109
8.3 Concluses
O desempenho da rede de funes de escala foi validado utilizando essa como simulador
de dois sistemas dinmicos reconhecidos como benchmarks de identificao e controle
no-linear: um CSTR encamisado que apresenta multiplicidade de estados estacionrios e um
reator que apresenta resposta inversa varivel (reator de Van de Vusse). No caso do CSTR, a
rede de funes de escala conseguiu identificar perfeitamente a multiplicidade de estados
estacionrios e os comportamentos dinmicos nas vizinhanas desses. Para o reator de Van de
Vusse, o modelo neural proposto conseguiu identificar com preciso o comportamento
no-linear de resposta inversa varivel.
A rede de funes de escala generalizou muito bem, pois foi treinada para prever o
comportamento dos processos para apenas um passo a frente, no entanto, foi capaz de prever
um nmero arbitrrio de passos para um grupo de dados de teste, diferente do utilizado no
treinamento.
Pelos bons resultados obtidos na identificao do CSTR encamisado e do reator de Van de
Vusse, pode-se concluir que estes processos pertencem ao subespao gerado pelo primeiro
nvel de resoluo da rede de funes de escala proposta.
110
9.1 Introduo
A identificao de processos que no apresentam rudo foi abordada nos captulos
anteriores. Este captulo trata da identificao de sistemas onde ocorre rudo.
Segundo NERRAND et. al.(1994), dependendo de como o rudo, quando existe, influencia
um sistema dinmico, a estrutura de modelo mais adequada para fazer previses poderia ser
esttica ou recorrente. Para o caso sem rudo, qualquer uma das estruturas poderia ser
utilizada. No trabalho referido foram descritos dois tipos principais de modelos dependendo
do comportamento do rudo. Considerando, por simplificao, o caso de uma entrada e uma
sada tem-se:
1) Modelo do erro na sada: Neste caso, assumido que a sada do processo yp(k) obedece as
seguintes equaes:
x p (k ) = X p (k 1) , U (k 1) ,
y p (k ) = x p (k ) + w( k )
onde
Xp(k-1): Estados processo{xp(k-1), xp(k-2), ...xp(k-N)};
U(k-1): Vetor constitudo dos atrasos na entrada externa {up(k-1), up(k-2), ...up(k-M)};
y (k ) = y (k 1) , y (k 2 ),..... y (k N ) ,U (k 1)
111
aproximar o mapeamento , essa rede deve ser recorrente para que o preditor possa ser
implementado.
2) Modelo de erro na equao: Neste caso, assumido que o processo evolui de acordo com
as seguintes equaes:
x p (k ) = X p (k 1) , U (k 1) + w( k )
y p (k ) = x p (k )
y (k ) = Y p (k 1) ,U (k 1)
onde
Yp(k-1): Vetor dos valores atrasados da sada{yp(k-1), yp(k-2), ...yp(k-N)};
Dessa forma, o preditor do processo que apresenta erro na equao deve ser no
recorrente, sendo que utiliza a sada medida do processo. Se existe uma rede neural que pode
aproximar o mapeamento e implementar o preditor, esta rede deve ser esttica uma vez que o
preditor no recorrente.
112
a capacidade de previso da rede para uma situao desfavorvel, em que o preditor adequado
seria uma rede recorrente.
Para gerar os grupos de dados com rudo, foram adicionadas perturbaes aleatrias, com
distribuio uniforme, nas variveis de sada dos grupos de dados sem rudo j utilizados para
identificao do tanque de pH e do reator biolgico. A amplitude das perturbaes aplicadas
correspondeu, em todos os casos, a 5% da faixa dos dados originais.
Deve-se notar que atrasos das variveis de sada tambm aparecem como entradas da rede.
Dessa forma, as redes de funes de escala foram treinadas com dados de entrada e sada
corrompidos por rudo.
A presena de rudo branco nos dados de sada no representa grave problema, uma vez
que o algoritmo de mnimos quadrados pode lidar com tal caracterstica. O problema maior
ocorre quando o rudo aparece nas variveis de entrada porque tal comportamento no
manipulado corretamente pelo mtodo de mnimos quadrados. Este fato agravado pela
transformao no-linear dos dados de entrada efetuada pelos neurnios da rede de funes de
escala.
113
10,0
9,0
pH
8,0
7,0
5% rudo
6,0
sem rudo
5,0
4,0
3,0
1
101
201
301
401
amostra
501
601
701
Figura 9-1 - Grupos de dados de treinamento com rudo obtido a partir do caso sem rudo
10,0
pH
9,0
8,0
5% rudo
sem rudo
7,0
6,0
5,0
1
51
101
151
201
amostra
251
301
351
Figura 9-2 - Grupos de dados de teste com rudo obtido a partir do caso sem rudo
Nas Figuras 9.1 e 9.2 pode-se observar a grande quantidade de rudo adicionado aos dados
originais. Uma rede de funes de escala, composta de trs nveis de resoluo, foi treinada
com o grupo de dados mostrado na Figura 9-1, para identificar o valor do pH no instante k+1
em funo do valor do pH e vazo de base no momento k. Utilizando este modelo, uma
previso do comportamento do processo, correspondente ao grupo de dados de teste, foi
obtida por simulao. Na Figura 9-3 mostra-se uma comparao entre as previses do valor de
pH utilizando a rede de funes de escala e o grupo de dados de teste.
114
10,0
pH
9,0
8,0
5% rudo
rede
7,0
6,0
5,0
1
51
101
151
201
amostra
251
301
351
401
Na Figura 9-3 pode-se observar que a rede de funes de escala identificou bem os ganhos
do processo e as transies de estado estacionrio. O bom desempenho obtido mostra que esta
metodologia de modelagem pode ser aplicada na previso do comportamento de sistemas com
rudo, mesmo que o preditor mais adequado fosse uma rede recorrente.
115
6,9
6,4
5,9
5,4
4,9
4,4
(a)
8,5
7,5
6,5
5% rudo
5,5
sem rudo
4,5
3,5
2,5
(b)
24,0
22,0
20,0
18,0
16,0
14,0
1
51
101
151
201
amostra - (c)
251
301
351
401
Figura 9-4 - Dados de treinamento com rudo obtidos a partir do caso sem rudo;
(a) concentrao de clulas; (b) concentrao de substrato; (c) concentrao de produto
116
6,3
5,8
5,3
4,8
(a)
8,0
7,0
6,0
5% rudo
5,0
sem rudo
4,0
3,0
(b)
22,0
21,0
20,0
19,0
18,0
17,0
16,0
15,0
1
51
101
151
201
amostra - (c)
251
301
351
401
Figura 9-5 - Dados de teste com rudo obtidos a partir do caso sem rudo; (a) concentrao de
clulas; (b) concentrao de substrato; (c) concentrao de produto
117
6,3
5,8
5,3
4,8
(a)
8,0
7,0
6,0
5% rudo
5,0
rede
4,0
3,0
(b)
22,0
21,0
20,0
19,0
18,0
17,0
16,0
15,0
1
51
101
151
201
amostra - (c)
251
301
351
401
Figura 9-6 - Comparao rede atuando como simulador x dados do teste (a) concentrao de
clulas; (b) concentrao de substrato; (c) concentrao de produto
Nas Figuras 9.4 e 9.5 pode-se observar a grande quantidade de rudo adicionado aos dados
originais. Uma rede de funes de escala, composta de 1 nvel de resoluo, foi treinada com
o grupo de dados mostrado na Figura 9-4, para identificar as concentraes de clulas,
118
9.5 Concluses
O desempenho da rede de funes de escala foi validado utilizando essa como simulador
de dois sistemas dinmicos reconhecidos como benchmarks de identificao e controle
no-linear: um reator biolgico que apresenta no-linearidade de ganho e um tanque de pH,
sendo que foi adicionado rudo aos dados de treinamento e teste. No caso do tanque de pH, a
rede de funes de escala conseguiu identificar bem os ganhos do processo e as transies de
estado estacionrio. Para o reator biolgico, o modelo neural proposto identificou bem os
instantes em que ocorreram transies de estado estacionrio e de forma regular os ganhos do
processo.
A rede de funes de escala generalizou bem para os sistema dinmicos utilizados,
considerando a dificuldade do teste aplicado:
1) Foi adicionado rudo de grande amplitude s variveis de entrada e sada dos processos;
2) A rede foi treinada para prever o comportamento do processo para apenas um passo a
frente, no entanto, foi utilizada para prever um nmero arbitrrio de passos em um grupo de
dados de teste, diferente do utilizado no treinamento.
3) O preditor adequado para os processos aos quais foi inserido rudo seria uma rede
recorrente, sendo que a rede de funes de escala proposta neste trabalho e utilizada foi do
tipo esttica.
119
120
Figura 10-1 - Tanques de nvel LCP; em detalhe o tanque com alterao brusca de dimetro no
qual foram realizados os experimentos de controle
121
Legenda:
AD/DA - Placa analgica/Digital- Digital/Analgica
I/P - Conversor Eletro-Pneumtico
I/V - Conversor Corrente-Tenso
VM - Vlvula Manual
VP - Vlvula Pneumtica
LT - Sensor de Presso
Visualizador
de Nvel
Alimentao eltrica
Alimentao eltrica
AD/DA
Alimentao eltrica
0-400 mBar
LT
4-20 mA
I/V
1-5 Volts
VM
VP
I/P
3-15
psi
4-20 mA
Alimentao pneumtica
122
5,0
4,0
3,0
2,0
1,0
1
201
401
601
Amostras
801
1001
Figura 10-3 - Perturbaes aplicadas no sinal enviado pelo sistema de controle (treinamento)
1,6
(C)
Altura (m)
1,3
1,0
(B)
0,7
(A)
0,4
0,1
1
201
401
601
Amostras
801
1001
Figura 10-4 - Dados de altura (treinamento); (A) seo inferior; (B) seo intermediria;
(C) seo superior tanque
forma, o grupo de dados para treinamento da rede consistiu de uma sada y(k+1) e duas entradas
y(k) e u(k). Tambm foi determinado que apenas 1 nvel de resoluo era suficiente para
identificar o processo. A utilizao de mais variveis de entrada para a rede (atrasos no nvel e
123
1,6
(C)
Altura (m)
1,3
1,0
Real
(B)
Rede
0,7
0,4
(A)
0,1
1
201
401
601
801
Amostras
1001
1201
Figura 10-5 - Comparao dados reais x previso rede (treinamento) (A) seo inferior;
(B) seo intermediria; (C) seo superior tanque
10.3.1 Simulao
Foi gerado um grupo de dados para testes efetuando perturbaes de 1 a 5 Volts no sinal
enviado pelo sistema de controle (Ver Figura 10-6). Para estas perturbaes, mostra-se, na
Figura 10-7, a evoluo do nvel do processo e a curva de simulao da rede treinada.
124
5,0
4,0
3,0
2,0
1,0
1
201
401
601
Amostras
801
1001
Figura 10-6 - Perturbaes aplicadas no sinal enviado pelo sistema de controle (teste)
1,6
1,4
(C)
Altura (m)
1,2
1,0
Real
(B)
0,8
Rede
(A)
0,6
0,4
0,2
1
201
401
601
Amostras
801
1001
Figura 10-7 - Comparao dos dados teste x curva de simulao gerada pela rede
(A) seo inferior; (B) seo intermediria; (C) seo superior tanque
Pode-se observar na Figura 10-7 que a rede conseguiu identificar de forma razovel o
comportamento do processo nas regies inferior, intermediria e superior.
125
( )
(u ) ( ) = 0
u 2 ( ) = 0
2
u ( ) = 0
(10.1)
u ( ) = 0
( ) = ( )
onde
u: varivel de perturbao;
: erro de previso;
: deslocamento no tempo;
x
x
y
y
(k )
(k )
k =
N
x , y ( ) =
x(k ) x
k =1
N
y (k ) y
k =1
N
e
u ( ) =
N
_
N (k ) (k 1) u (k ) u
k =
u
u
k
(
)
(k )
k =1
k =1
N
1,96
N
1,0
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
( )
u 2 ( )
Teste de correlao
Teste de correlao
126
10
20
1,0
0,8
0,6
0,4
0,2
( )
u 2 2 ( )
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
30
10
1,0
0,8
0,6
0,4
0,2
u( )
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
0
10
20
30
Teste de correlao
1,0
0,8
0,6
30
20
30
Teste de correlao
Teste de correlao
20
1,0
0,8
0,6
u ( )
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
0
10
( )
0,4
0,2
0,0
-0,2
-0,4
Testes de correlao
95% confiana = 0,0534
-0,6
-0,8
-1,0
0
10
20
30
127
Na Figura 10-8 pode-se observar que a rede de funes de escala satisfaz os testes, para
um nvel de confiana de 95%. O valor limite
1,96
N
detalhada
pode
ser
encontrada
em
GARCIA
et.
al.(1989)
CAMACHO e BORDONS(1994).
As idias comuns aos diferentes esquemas de controle preditivo so:
As sadas futuras de um processo entre os horizontes N1 e N2, chamados de horizontes
mnimo e mximo de predio, so previstas a cada instante de tempo k utilizando o modelo
do processo. Estas sadas previstas y ( k +i|k ) para i = N1...N2 dependem dos valores conhecidos
no instante k (entradas e sadas passadas) e dos futuros sinais de controle U j ,( k +i ) , com
j = 1...N (nmero de variveis manipuladas) e i = 0...Nu (horizonte de controle), que devem
ser determinados;
O conjunto de futuras aes de controle calculado otimizando algum critrio para manter o
processo o mais prximo possvel de uma trajetria de referncia y ref ( k +i ) (i = N1...N2), que
pode ser o prprio setpoint ou, em geral, uma trajetria suave de mudana de setpoint;
Normalmente aplica-se ao processo apenas o primeiro sinal de controle da seqncia
calculada a cada intervalo de tempo. Esta estratgia adotada pois a qualidade da previso do
modelo deteriora a medida que aumenta o horizonte de predio.
O critrio de otimizao mais empregado o erro quadrtico entre a sada prevista e a
estipulada pela trajetria de referncia. Em muitos casos, pode-se tambm incluir o esforo de
controle na funo objetivo CAMACHO e BORDONS(1994). O critrio de otimizao
mostrado na Equao (10.2).
128
J ( N1 , N 2 , N u ) =
i = N1
Nu
j =1 i =1
( j ,i )
[U
j , ( k + i 1)
(10.2)
(10.3)
onde,
O objetivo ao minimizar a Equao (10.2) fazer que a sada futura y ( k +i|k ) siga a
referncia y ref ( k +i ) e, ao mesmo tempo, o esforo de controle Uj,(k + i - 1) seja minimizado.
Esta equao possui alguns parmetros ajustveis (N1, N2, Nu, (i), (j,i)) que podem ser
modificados para obter o comportamento desejado do sistema controlado. O significado de N1
e N2 bastante intuitivo. Eles indicam o intervalo de tempo que desejvel que a sada siga a
referncia. Se N1 definido com um valor alto significa que os erros nos primeiros instantes
no so importantes. Os coeficientes (i) e (j,i) so seqncias de parmetros que ponderam o
comportamento futuro. No projeto de controladores preditivos , em geral, utilizada uma
trajetria de referncia yref(k+i) que no necessariamente coincide com o setpoint. Geralmente
utiliza-se uma trajetria suave gerada a partir do valor atual da sada e do setpoint (Equao
(10.3)).
129
entrada, 16 digitais e 8 single ended e 2 canais de sada analgicos, com faixa de entrada e
sada de 1-5 volts.
Para efetuar o controle de nvel do tanque foi utilizado um software para ambiente
Windows, desenvolvido em Delphi 6,0. Basicamente, o software de controle opera pela
uma
rede
neural
para
aproximar
mapeamento
F,
ou
seja:
(10.4)
130
(10.5)
onde E(k+1) o erro de previso no instante k+1, que a diferena entre o valor real do
processo no instante k+1 e a sada estimada pela rede.
Este termo particularmente importante na correo de erros de previso de estado
estacionrio e quando ignorado pode causar problemas de offset. O erro de previso em k+1
no conhecido no instante k, sendo que normalmente considera-se esse igual ao cometido no
instante k, GARCIA et. al.(1989), SEBORG et. al.(1989).
No controle de nvel implementado no se realimentou o erro de previso, ou seja, foi
efetuado controle em malha aberta do processo. Dessa forma, se o modelo apresentar erros
de identificao de estado estacionrio, a estrutura de controle utilizada no conseguir
eliminar o problema de offset.
Deve-se notar que a nfase dessa aplicao est no teste da rede como modelo de previso
e no no projeto do controlador. Este ltimo, por exemplo, no poder rejeitar perturbaes
tipo carga, mesmo que se disponha de um modelo que represente perfeitamente o processo.
10.7 Resultados
O desempenho do controlador neural foi testado para perturbaes tipo setpoint, sendo que
seu desempenho foi comparado ao de um controlador PI, com relao varivel controlada e
manipulada.
Os parmetros do PI foram inicialmente determinados pela tcnica de Cohen-Coon
STRM e HGGLUND (1995), sendo que foi efetuado o ajuste fino desse controlador
diretamente no processo, com o objetivo de maximizar o desempenho nas regies inferior,
intermediria e superior do tanque de nvel. Os parmetros do controlador preditivo tambm
foram ajustados experimentalmente (Ver Tabela 10.1).
Na Figura 10-9 mostram-se as transies de setpoint para o controlador neural e o PI na
faixa de 0,5 a 1,3 m. Na Figura 10-10 podem ser observadas as respectivas aes de controle.
Para comparar adequadamente o desempenho dos controladores, em termos da velocidade
de resposta s mudanas de setpoint, foi informado a esses, em cada instante de amostragem,
apenas o setpoint atual e no os valores futuros desse. Assim sendo, no clculo da ao de
131
controle, foi assumido que os valores futuros da referncia eram iguais ao valor da referncia
definido para aquele instante de amostragem.
PI
= 0,0135
= 0
Kc = 12 (V/m)
Nu = 1
Ti = 32,5 (s)
N1 = 1
N2 = 15
Set point
Ctr. Neural
PI
401
501
1.4
1.2
(C)
Altura (m)
1.0
(B)
0.8
(A)
0.6
0.4
1
101
201
301
601
Amostras
701
132
PI
Ctr. Neural
5.0
4.0
3.0
2.0
1.0
1
101
201
301
401
Amostras
501
601
701
Pode-se observar nas Figuras 10.9 e 10.10 que o controlador baseado em modelo neural
apresentou apenas um pequeno offset na regio superior do tanque e no apresentou
overshoot. O PI apresentou overshoot na transio para o setpoint da regio intermediria,
133
10.8 Concluses
A capacidade de identificao da rede de funes de escala foi comprovada, no caso do
tanque de nvel, atravs de dois mtodos: por comparao da curva de simulao obtida com a
rede, para um determinado conjunto de dados de teste, e por anlise de resduos.
Alm da no-linearidade de mudana de dimetro do tanque de nvel, a rede de funes de
escala conseguiu identificar bem o processo na regio inferior onde o sistema lento e,
portanto, apresenta pequena variao de nvel, entre instantes de amostragem consecutivos,
em relao ao rudo presente e para as aes de controle aplicadas.
A rede de funes de escala foi utilizada com sucesso como modelo de um controlador
preditivo para o processo do tanque de nvel.
O desempenho do controlador baseado na rede de funes de escala foi superior ao
clssico PI, em relao ao comportamento das variveis controlada e manipulada, na rejeio
de perturbaes tipo setpoint.
O projeto do controlador de nvel baseado em rede neural no considerou o erro de
previso, ou seja, no foi utilizada nenhuma forma de realimentao desse erro. Nesta
situao, caso o modelo apresentasse erros de identificao de estado estacionrio, no seria
possvel eliminar o problema de offset. Na prtica, foi observado apenas um pequeno offset no
controle do nvel na regio superior do tanque, o que comprova a capacidade de previso da
rede de funes de escala.
134
11 CONTROLE DE UM TANQUE DE PH
Neste captulo foi abordado o controle preditivo do tanque de pH simulado e descrito na
seo 5.3. O processo possui trs correntes de entrada - cido, tampo e base - que so
misturadas no tanque e o pH na sada desse medido. Destas correntes, o pH foi a varivel
controlada, a vazo de base corresponde a varivel manipulada e perturbaes tipo carga
foram aplicadas na vazo de cido.
Foi efetuada uma comparao entre um controlador preditivo clssico, baseado em modelo
linear, e outro que utiliza um modelo no-linear baseado na rede de funes de escala.
No caso da rede de funes de escala, foram utilizados trs nveis de resoluo para
identificao do tanque de pH. Este modelo foi descrito e validado na seo 9.3 por
simulao.
Para uma aproximao linear do tanque de pH, foi utilizado um modelo incremental
linear, ou seja:
pH (k +1 ) = a pH (k) + b U (k) + c
135
A constante c teve de ser utilizada na identificao uma vez que as mdias das sries
temporais de pH e U no so nulas.
O modelo ajustado aos dados do tanque de pH foi:
pH (k +1 ) = 0,9045 pH (k) + 0,0615 U (k) 0,2241
sendo que uma comparao entre os valores previstos pelo modelo incremental linear e os
dados reais do processo pode ser vista na Figura 11-1.
Mod. linear
Processo
9,5
8,5
pH
7,5
6,5
5,5
4,5
3,5
1
201
401
601
Amostras
801
1001
136
Mod. linear
Processo
7,2
7,0
pH
6,8
6,6
6,4
6,2
530
540
550
560
570
Amostras
580
590
600
610
Figura 11-2 Comparao dados reais processo x previso do modelo linear (correspondente s
amostras entre 530 e 630 do grupo de dados)
137
Assim sendo, um valor predito para y(k+1), possivelmente mais prximo desse que y(k+1|k),
dado por:
y ( k +1) y ( k +1|k ) + y ( k ) y ( k |k 1)
Este ltimo preditor permite eliminar erros de modelagem de estado estacionrio e rejeitar
perturbaes tipo carga, diferente do preditor utilizado no captulo 10.
Exceto pelo preditor, todas as outras caractersticas do controlador permanecem
inalteradas como as descritas no captulo 10.
11.4 Resultados
Considerando o horizonte de controle Nu =1 e a referncia como sendo igual ao setpoint,
fez-se um estudo da influncia dos valores do horizonte de predio (N2) e da penalizao do
esforo de controle () para os casos de modelo linear e baseado em rede de funes de
escala. Para este processo no h tempo morto, portanto, N1 =1.
Foi observado que, no caso do modelo linear ajustado, para pequenos valores de N2, no
foi possvel determinar um valor de que fornecesse um desempenho aceitvel de controle
para transies de setpoint na faixa de pH entre 5 e 9. Por exemplo, para N2 = 5, mostra-se,
138
nas Figuras 11.3 e 11.4, o desempenho do controlador preditivo baseado em modelo linear
para =0,55 e =0,1 respectivamente.
9,5
8,5
7,5
pH
Setpoint
Processo
6,5
5,5
4,5
1
21
41
61
81
Amostras
101
121
141
Figura 11-3 - Desempenho do controlador preditivo baseado em modelo linear (N2= 5, =0,55)
9,5
8,5
7,5
pH
Setpoint
Processo
6,5
5,5
4,5
1
21
41
61
81
101
121
141
Amostras
Figura 11-4 - Desempenho do controlador preditivo baseado em modelo linear (N2= 5, =0,1)
139
= 0,007.
9,5
9,0
8,5
pH
8,0
7,5
Setpoint
7,0
Ctr. Linear
6,5
Ctr. Neural
6,0
5,5
5,0
4,5
(A)
19,0
17,0
15,0
Ctr. Linear
13,0
Ctr. Neural
11,0
9,0
7,0
1
21
41
61
81
101
(B)
Amostras
121
141
Figura 11-5 - Comparao entre o desempenho dos controladores preditivos baseados nos
modelos linear e neural (perturbaes setpoint) (A) pH (varivel controlada);
(B) vazo de base (varivel manipulada)
140
Nota-se na Figura 11-5 que o controlador baseado na rede de funes de escala bem
menos conservativo, tomando rpidas e precisas aes de controle.
Os controladores preditivos baseados nos modelos linear e neural tambm foram
comparados frente a perturbaes tipos carga. Na Figura 11-6 mostra-se o desempenho destes
para uma modificao brusca na vazo de cido de 16,6 ml/s (valor nominal) para 12,0 ml/s e,
aps o sistema ter estabilizado, aplicou-se um degrau na vazo de cido de 12 para 20 ml/s.
8,0
carga (vazo de cido)
12,0 (ml/s) 20,0 (ml/s )
pH
7,5
Setpoint
7,0
Ctr. Linear
Ctr. Neural
carga (vazo de cido)
16,6 (ml/s) 12,0 (ml/s )
6,5
6,0
(A)
21,0
19,0
17,0
15,0
Ctr. Linear
13,0
Ctr. Neural
11,0
9,0
7,0
1
21
41
61
(B)
81
101
Amostras
121
141
Nota-se na Figura 11-6 que o controlador baseado na rede de funes de escala conseguiu
rejeitar com muito mais facilidade as cargas adicionadas, tomando, como no caso das
perturbaes tipo setpoint, rpidas e precisas aes de controle.
141
11.5 Concluses
A rede de funes de escala foi utilizada com sucesso como modelo de um controlador
preditivo para o tanque de pH.
Considerando o horizonte de controle como sendo igual a 1 e a referncia como sendo
igual ao setpoint, foi realizado um estudo para determinao dos valores timos de horizonte
de predio e da penalizao do esforo de controle, para os casos de modelo linear e baseado
em rede funes de escala.
No controle do tanque de pH, para mudanas de setpoint, os controladores preditivos
baseados em modelo no-linear (rede de funes de escala) e linear no apresentaram
problemas de offset e overshoot, sendo que as aes de controle aplicadas foram suaves. No
entanto, o primeiro foi bem menos conservativo, rejeitando perturbaes tipo carga e
efetuando transies de setpoint em um tempo significativamente menor. Basicamente, a
diferena de velocidade de resposta pode ser atribuda ao valor do horizonte de predio. No
caso no-linear, utilizou-se um horizonte de predio igual 2 e no caso linear, para atender aos
objetivos de controle, foi necessrio utilizar um valor 20 amostras.
142
12 CONCLUSES FINAIS
Uma funo objetivo adequada identificao de sistemas dinmicos formada pela soma
de um termo relativo ao erro quadrtico de aproximao e de outro correspondente a norma
do vetor de pesos. A importncia deste ltimo, em relao ao primeiro, controlada atravs
de uma constante positiva denominada de parmetro de regularizao.
A minimizao da norma dos pesos reduz as curvaturas presentes na superfcie de
modelos empricos e, portanto, diminui o problema de sobre-treinamento em redes neurais.
O compromisso entre aproximar os dados e eliminar excessivas curvaturas da superfcie
de um modelo emprico impe restries no valor do parmetro de regularizao, sendo que a
partir destas restries foi determinado um valor timo para o parmetro de regularizao.
A rede neural proposta neste trabalho, denominada de rede de funes de escala e obtida a
partir de modificaes na wavenet, obteve sucesso na identificao e controle de processos
no-lineares reconhecidos benchmarks nas reas descritas.
A rede de funes de escala obteve melhor desempenho, se comparada com as redes de
base radial e feedforward, na identificao de um atrator catico e de um reator biolgico. Os
critrios utilizados para comparao foram o erro de aproximao de treinamento, teste e o
critrio de Akaike.
A rede de funes de escala foi validada com sucesso utilizando essa como simulador de
processos, sendo efetuados testes com e sem rudo. Foram identificados vrios processos nolineares, entre eles um CSTR encamisado que apresenta multiplicidade de estados
estacionrios, um reator que apresenta resposta inversa varivel (reator de Van de Vusse), um
reator biolgico e um tanque de pH. A rede de funes de escala generalizou muito bem pois,
foi treinada para prever o comportamento dos processos para apenas um passo a frente, no
entanto, foi capaz de prever um nmero arbitrrio de passos de um grupo de dados de teste,
diferente do utilizado no treinamento.
A rede de funes de escala foi utilizada na identificao e controle de um sistema
experimental, um tanque de nvel que apresenta alterao brusca de rea. O desempenho do
controlador baseado na rede de funes de escala foi superior ao clssico PI, em relao ao
comportamento das variveis controlada e manipulada, na rejeio de perturbaes tipo
setpoint.
143
apresentaram problemas de offset e overshoot, sendo que as aes de controle aplicadas foram
suaves. No entanto, o primeiro foi bem menos conservativo, rejeitando perturbaes tipo
carga e efetuando transies de setpoint em um tempo significativamente menor.
Como continuao deste trabalho sugere-se:
A rede de funes de escala, tal como a wavenet, apresenta crescimento exponencial do
nmero de funes da base a medida que aumenta o nmero de entradas. Neste trabalho
foram efetuadas modificaes na wavenet de forma a diminuir a taxa de crescimento do
nmero de funes. No entanto, outras simplificaes deveriam ser efetuadas para que seja
possvel identificar processos com um grande nmero de variveis de entrada.
Algumas relaes entre a(s) sada(s) e entrada(s) de um processo podem ser descritas
atravs de restries nos valores assumidos e/ou nas derivadas das variveis significativas.
Como a rede de funes de escala facilmente diferencivel em relao aos parmetros da
camada de sada e s variveis de entrada da rede, poderiam ser utilizadas outras formas de
regularizao, alm da penalizao da norma do vetor de pesos da rede.
A identificao de um processo por uma rede de funes de escala pode ser interpretada
como uma transformao de dados do domnio do tempo em projees desses nos subespaos
gerados pelas funes que constituem a rede. Assim sendo, a anlise dos pesos e localizao
das respectivas funes de escala pode ser til na deteco de caractersticas pouco
observveis no domnio do tempo.
144
13 APNDICE
13.1 Apndice 1
Especificaes dos equipamentos utilizados no controle do tanque de nvel
Vlvula de controle
Marca: Contrisul;
Caractersticas:
145
frequncias;
1 contador/temporizador de 16 bits programvel;
16 canais de sada digital;
146
tanque. Quando o tanque estiver cheio, a vlvula de controle deve ser fechada e a vlvula VM
aberta e fechada em diferentes posies do tanque, anotando-se a altura da coluna de gua e a
respectiva voltagem. Dessa forma, obtm-se um grupo de dados de Altura(m)
147
148
14 REFERNCIAS BIBLIOGRFICAS
ALSBERG, B. K.; WOODWARD, A. M.; WINSON, M. K.; ROWLAND, J. J. e KELL D.
B. - Variable Selection in Wavelet Regression Models. Analytica Chimica Acta, 368,
p. 29-44, 1998.
ANTONINI, M.; BARLAUD, M. e DAUBECHIES - Image Coding Using Wavelet
Transform. IEEE Transactions on Image Processing, 1, p. 205-220, 1992.
BECERRA, V.M.; GALVAO, R.K.H.; CALADO, J.M.F. e SILVA, P.M. - Linear Wavelet
Models for Nonlinear Identification Applied to a Pressure Plant. Proceedings of the
CRISTEA, P.; TUDUCE, R. e CRISTEA, A. - Time Series Prediction with Wavelet Neural
Networks. Proceedings of the 5th Seminar on Neural Network Applications in Electrical
149
GAO, L.; LU, L. e LI, Z. - Prediction of Chaotic Time Series Based on Wavelet Neural
Network. OCEANS 2001 MTS/IEEE Conference and Exhibition, Vol. 4, p. 20462050,
2001.
GARCIA, C. E.; PRETT, D. M. e MORARI, M. - Model Predictive Control: Theory and
Practice a Survey. Automatica, Vol. 25, p. 335-348, 1989.
150
HARRIS, C. J. - Advances in Intelligent Control. Taylor & Francis, Great Britain, 1994.
HENSON, M. A. e SEBORG, D. E. - An Internal Model Control Strategy for Nonlinear
Systems. AIChE J., Vol. 37, 7, p. 1065, 1991.
1997.
HUNG, C.; KIM, Y. e COLEMAN, T.L. - A Comparative Study of Radial Basis Function
Neural Networks and Wavelet Neural Networks in Classification of Remotely Sensed
Data. Proceedings of the 5th Biannual World Automation Congress. Vol. 13, p. 455-461,
2002.
HUNT, K. J., SBARBARO, D., ZBIKOWSKI, R. e GAWTHROP, P. J. - Neural Networks
for Control Systems - A Survey. Automatica, vol. 28, n 6, p.1083-1112, 1992.
KIM, S.; KIM Y.; SEO J. e JEON H. - Design of the Scaling-Wavelet Neural Network
Using Genetic Algorithm. Proceedings of the International Joint Conference on Neural
p.193-210, 1992.
KOSANOVICH, K. A. e PIOVOSO, M. J. - PCA of Wavelet Transformed Data Process
for Monitoring. Intelligent Data Analisys 1, p. 85-99, 1997.
LEWIS, D. W. - Matrix Theory. World Scientific Publishing Co. Pte. Ltd, p. 105, 1991.
LI, S. e XI, Y. - Applications of Wavelet to Constrained Generalized Predictive Control.
Proceedings of the IEEE International Symposium on Intelligent Control, p. 247252,
2000.
151
LING, B. - Neural Network Based Feedforward Adapter for Batch Process Control.
Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks,
Vol. 4, p. 305 310, 2000.
LJUNG, L. - System Identification. Theory for the user. Prantice Hall, 1987.
MALLAT, S. A. - A Theory for Multiresolution Signal Decomposition: The Wavelet
Representation. IEEE Trans. Pat. Anal Mach. Intel., 11, 7, p. 674-693, 1989.
p. 178-184, 1994.
NIEMICE, M. e KRAVARIS, C. - Controller Synthesis for Multivariable Nonlinear
Nonminimum-phase Process. Proceedings of the American Control Conference,
152
865-879, 1999.
SJOBERG, J. e VIBERG, M. - Separable Nonlinear Least-squares Minimization Possible Improvements for Neural Net Fitting. Proceedings of the VII IEEE Workshop
153