Controle de Processos Com Redes Neurais Inversas

UNIVERSIDADE ESTADUAL DE MARING
CENTRO DE TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA QUMICA
PROGRAMA DE MESTRADO EM ENGENHARIA QUMICA
CONTROLE DE PROCESSOS
COM
REDES NEURAIS INVERSAS
Gilberto Clvis Antonelli

Eng. Qumico, UEM, 1984
Orientador: Prof. Ivo Neitzel, D.Sc.
Dissertao de Mestrado submetida

Fundao Universidade Estadual de Maring,
como parte dos requisitos necessrios
obteno do Grau de Mestre em Engenharia
Qumica, rea de Desenvolvimento de
Processos.
Maring, PR Brasil
1998
UNIVERSIDADE ESTADUAL DE MARING
CENTRO DE TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA QUMICA
PROGRAMA DE MESTRADO EM ENGENHARIA QUMICA
Esta a verso final da dissertao de Mestrado apresentada por Gilberto Clvis

Antonelli perante a Comisso Julgadora do Curso de Mestrado em Engenharia Qumica em
29 de Maio de 1998.
COMISSO JULGADORA
Prof. Ivo Neitzel, D.Sc.

Orientador
Prof. Ariovaldo Bolzan, D.Sc.

Membro
Prof. Mauro Antonio da Silva S Ravagnani, Dr.Eng.

Membro
iii
minha esposa, Silvana Adriani Remundini, minha princesa,

companheira incansvel, a qual devo muito do que sou hoje e um
pouco do que pretendo ser amanh.
iv
Agradecimentos
Agradeo a todas as pessoas que direta ou indiretamente contriburam para a

elaborao deste trabalho, em especial;
a meus pais, Antonio Antonelli e Izidia Silvestre, que nunca mediram esforos para
que eu seguisse minha carreira de engenheiro,
a meu irmo, Umberto Carlos Antonelli(in memorium), que me mostrou o caminho da

engenharia que ele tanto amou, e com certeza, onde quer que esteja, me
incentivou a fazer o melhor,
a meu orientador, Prof. Ivo Neitzel, que me ajudou grandemente em todos os

momentos que necessitei, com pacincia e boa vontade,
a minha amiga, Adriana Rossoni Pedrozo do Nascimento, que juntos montamos o

mdulo de testes e alteramos o software de controle utilizado neste trabalho,
aos meus amigos, funcionrios do DEQ e funcionrios do PEQ, que sempre foram
prestativos quando precisei de ajuda,
e ao CNPQ, que me auxiliou financeiramente durante a elaborao deste trabalho.

v
CONTROLE DE PROCESSOS
COM REDES NEURAIS INVERSAS
AUTOR: GILBERTO CLVIS ANTONELLI
ORIENTADOR: PROF. DR. IVO NEITZEL
Dissertao de Mestrado; Programa de Ps-Graduao em Engenharia Qumica; Universidade

Estadual de Maring; Av. Colombo, 5790, BL E46 09; CEP: 87020-900 Maring PR,
Brasil, defendida em 29 de maio de 1998. 126 p.
Resumo
O tcnica de controle de processos utilizando redes neurais artificiais teve seu grande
impulso a partir da dcada de 80, quando surgiram vrias propostas de utilizao. Este
trabalho visa fazer uma comparao entre essa tcnica, considerada recente, com as tcnicas
denominadas convencionais, da dcada de 40. Para tanto, realizamos a comparao entre o
desempenho de um controlador baseado em rede neural artificial no-linear e um controlador
PID. Tambm comparamos dois tipos de treinamento envolvendo as redes neurais artificiais
no-lineares, o Steepest Descent e o Decomposio em Valores Singulares.
Descrevemos neste trabalho os passos utilizados para essas comparaes, iniciando
com o desenvolvimento do software de controle, implantao dos algoritmos dos
controladores utilizados e montagem de um mdulo de testes.
So apresentados tambm detalhes do software de controle, dos tipos de treinamento e
da caracterizao do mdulo de teste.
As vantagens, desvantagens e dificuldades de implantao, tanto no modo simulado
quanto no mdulo de testes, esto descritos neste trabalho destacando sempre qual o
controlador que obteve melhor performance.
vi
CONTROL OF PROCESSES
WITH NETS INVERSE NEURAIS
AUTHOR: GILBERTO CLVIS ANTONELLI
SUPERVISOR: PROF. DR. IVO NEITZEL
Dissertao de Mestrado; Programa de Ps-Graduao em Engenharia Qumica; Universidade

Estadual de Maring; Av. Colombo, 5790, BL E46 09; CEP: 87020-900 Maring PR,
Brasil, defendida em 29 de maio de 1998. 126 p.
Abstract
The use of artificial neural networks in control process had its great pulse starting from
the decade of 80, when several use proposals appeared. This work seeks to do a comparison
among that technique, considered recent, with the conventional denominated techniques of the
decade of 40. For so much, we accomplished the comparison among the a controller's acting
based on nonlinear artificial neural network and a controller PID. We also compared two
training types involving the nonlineal artificial neural network, Steepest Descent and
Decomposition in Singular Values.
We described in this work the steps used for those comparisons, beginning with the
development of the control software, implementation of the used controllers' algorithms and
assembly of a module of tests.
They are also presented details of the control software, of the training types and of the
characterization of the test module.
The advantages, disadvantages and difficulties of implementation, so much in the
simulate way as in the module of tests, are described in this work always highlighting which
the controller that obtained better performance.
vii
ndice
1. INTRODUO ................................................................................................................... 01
2. O SISTEMA DE CONTROLE CONVENCIONAL PID ....................................................... 03
2.1. Sintonia do Controlador PID ................................................................................... 04
2.1.1. Integrador eletrnico .................................................................................................... 06
2.1.2. Diferenciador eletrnico .............................................................................................. 07
2.1.3. Controlador PID eletrnico.......................................................................................... 08
2.1.4. Controlador PID digital................................................................................................ 09
3. REDE NEURAL ARTIFICIAL..............................................................................................10

3.1. Definio e Aplicao .............................................................................................. 10
3.2. BackPropagation Network (BPN) ............................................................................ 13
3.2.1. Formulao Matemtica............................................................................................... 14
3.3. Tipos de treinamentos da rede.................................................................................. 15
3.3.1. Treinamento Steepest Descent ..................................................................................... 15
3.3.2. Treinamento Decomposio em Valores Singulares ................................................... 18
3.4. Consideraes Prticas ............................................................................................. 21

3.4.1. Treinamento Steepest Descent ..................................................................................... 21
3.4.2. Treinamento Decomposio em Valores Singulares ................................................... 22
4. AQUECEDOR DE AR, O MDULO DE TESTES .................................................................... 24

4.1. Caractersticas do Sistema........................................................................................ 24
4.2. Modelo para Simulao............................................................................................ 25
5. CONTROLADOR RN NO-LINEAR................................................................................... 30
5.1. Algoritmo de Clculo da Varivel Manipulada ....................................................... 31
5.1.1. Implantao do Valor da Varivel Manipulada ........................................................... 33
5.2. Distribuio dos Dados de Entrada .......................................................................... 34
6. SOFTWARE RTX ............................................................................................................. 36
6.1. Reformulao Inicial ............................................................................................... 37
6.1.1. Caractersticas do Compilador FTN77/486 ................................................................. 37
6.2. Transferncia de Informaes Entre os Rotinas ...................................................... 39

6.3. Rotinas de Inicializaes ......................................................................................... 39
6.3.1. Leitura das Configuraes Iniciais............................................................................... 39
6.3.2. Inicializao do Sistema............................................................................................... 40
6.3.3. Inicializao das placas A/D e D/A ............................................................................ 41
viii
6.3.4. Inicializao do Controlador PID................................................................................. 45

6.3.5. Condies Operacionais de Partida.............................................................................. 45
6.4. Rotinas de Execuo Atravs de Teclas Especiais .................................................. 47
6.4.1. As Teclas F1 a F10 ...................................................................................................... 47
6.4.2. A tecla CTRL .............................................................................................................. 47
6.4.3. A tecla ALT ................................................................................................................ 48
6.5. Rotinas de Execuo Contnua ................................................................................ 49
6.5.1. Entrada e Sada de Dados ............................................................................................ 49
6.5.2. Armazenamento de Dados em Disco .......................................................................... 50
6.5.3. Treinamento da Rede Neural ...................................................................................... 51
6.6. Rotinas da Pilha de Execuo ................................................................................. 51

6.6.1. Atualizao dos Dados em Vdeo ............................................................................... 52
6.6.2. Controlador PID .......................................................................................................... 53
6.6.3. Controlador RN ........................................................................................................... 53
6.6.4. Perturbaes Aplicadas ............................................................................................... 54
6.7. Rotinas de Apoio ..................................................................................................... 54

7. TESTES DE CONFIABILIDADE .......................................................................................... 56
7.1. Software RTX........................................................................................................... 56
7.2. Sintonia do Controlador PID ................................................................................... 56
7.3. Algoritmo da RN ..................................................................................................... 57
8. TREINAMENTO DA REDE NEURAL ................................................................................. 60
8.1. Ajustes de Parmetros para o Treinamento Steepest Descent ................................. 60
8.1.1. Tempo de Amostragem................................................................................................ 60
8.1.2. Nmero de Neurnios da Camada de Entrada ............................................................. 61
8.1.3. Distribuio dos Dados de Entrada.............................................................................. 62
8.1.4. Nmero de Neurnios da Camada Intermediria......................................................... 62
8.1.5. Nmero de Neurnios da Camada de Sada................................................................. 63
8.1.6. Passo de Aprendizagem .............................................................................................. 63
8.1.7. Incorporao de Bias.................................................................................................... 63
8.2. Ajustes de Parmetros para o Treinamento
Decomposio em Valores Singulares ..................................................................... 63
8.2.1. Tempo de Amostragem................................................................................................ 64
8.2.2. Nmero de Neurnios da Camada de Sada................................................................. 64
8.2.3. Mtodo Iterativo de Clculo da Varivel Manipulada................................................. 64
8.2.4. Incorporao de Bias.................................................................................................... 67
8.2.5. Parmetros determinados em grupos ........................................................................... 67
ix
8.3. Conjunto de dados de treino..................................................................................... 69

9. SIMULAO DO AQUECEDOR DE AR .............................................................................. 72
9.1. Performance do Controlador PID............................................................................. 73
9.2. Performance do Controlador RN com Treinamento Steepest Descent ................... 76
9.3. Performance do Controlador RN com Treinamento
Decomposio em Valores Singulares .................................................................... 79
9.4. PID x RN ................................................................................................................. 82
9.5. RN com Treinamento Steepest Descent x RN com Treinamento
10. TESTES NO AQUECEDOR DE AR ...................................................................................... 85
10.1. Performance do Controlador PID............................................................................ 85
10.2. Performance do Controlador RN com Treinamento Steepest Descent .................. 86
10.2.1. Perturbao DEGRAU na Vazo de Ar ................................................................... 87
10.2.2. Alterao do SET-POINT do Processo..................................................................... 88
10.3. Performance do Controlador RN com Treinamento

10.3.1. Perturbao DEGRAU na Vazo de Ar ................................................................... 88
10.3.2. Alterao do SET-POINT do Processo..................................................................... 89
10.4. PID x RN ................................................................................................................ 89

10.5. RN com Treinamento Steepest Descent x RN com Treinamento
11. TESTES X SIMULAO..................................................................................................... 92
12. CONCLUSES E OBSERVAES ..................................................................................... 94
13. BIBLIOGRAFIA ................................................................................................................. 95
14. ANEXOS ........................................................................................................................... 98
14.1. Anexo I Interligao das Rotinas do Software RTX ........................................... 99
14.2. Anexo II Arquivo de Configurao Geral do Software RTX ........................... 100
14.3. Anexo III Arquivos de Configuraes do Software RTX ................................. 107
14.4. Anexo IV Equao do Controlador PID no Modo Discreto ............................ 109
x
Figuras
Figura 2.1 Diagrama de Blocos do Controle Autosintonizante

para Controladores PID.................................................................................... 03
Figura 2.2 Representao Grfica da Ao de Controladores da Famlia PID................. 05
Figura 2.3 Integrador Eletrnico ....................................................................................... 06
Figura 2.4 Diferenciador Eletrnico ................................................................................. 07
Figura 2.5 Representao Grfica da Ao de Controladores Eletrnicos ....................... 08
Figura 3.1 Estrutura de um Elemento de Processamento.................................................. 11
Figura 3.2 Sada de uma Funo Sigmoidal ..................................................................... 12
Figura 3.3 Esquema Representativo das Conexes dos Neurnios
de uma Rede Neural ........................................................................................ 12
Figura 3.4 Arquitetura das Trs Camadas da BPN .......................................................... 13
Figura 3.5 Superfcie Hipottica da Funo Erro no Espao dos Pesos ........................... 15
Figura 3.6 Seo Transversal de uma Superfcie Hipottica da Funo Erro no
Espao dos Pesos.............................................................................................. 22
Figura 4.1 Esquema do Mdulo de Teste e Controle........................................................ 24
Figura 4.2 Degrau +0,48V na Varivel Manipulada do Mdulo de Testes ...................... 26
Figura 4.3 Degrau 0,32V na Varivel Manipulada do Mdulo de Testes ...................... 26
Figura 4.4 Representao da Transferncia de Calor no Interior do Aquecedor .............. 27
Figura 4.5 Degrau Positivo na Vazo de Ar sem Controlador no Mdulo de Testes ...... 28
Figura 4.6 Amostragem de Sistemas Contnuos no Tempo.............................................. 29
Figura 5.1 Utilizao de ANN em Controle de Processos ................................................ 30
Figura 5.2 Diagrama de Blocos do Controle RN No Linear ........................................... 32
Figura 5.3 Diagrama de Implantao do Valor Correto pela RN ..................................... 34
Figura 6.1 Fluxograma da Lgica de Execuo das Rotinas do Mdulo
Gerenciador Z4 ................................................................................................ 36
Figura 6.2 Esquema de Transferncia de Informaes entre os Mdulos do RTX .......... 39
Figura 6.3 Tela de Opes de Partida do Software RTX.................................................. 46
Figura 6.4 Tela de Pr-partida do Software RTX ............................................................. 46
Figura 6.5 Tela de Trabalho do Software RTX................................................................. 48
Figura 7.1 Teste de Ajuste do Controlador PID................................................................ 57
xi
Figura 7.2 Teste de Ajuste do Controlador RN para o

Treinamento Steepest Descent ........................................................................ 58
Figura 7.3 Teste de Ajuste do Controlador RN para o
Treinamento Decomposio em Valores Singulares ....................................... 59
Figura 8.1 Influncia do Nmero de Neurnios na Camada de Entrada no
Treinamento Steepest Descent ......................................................................... 61
Figura 8.2 Funo Hipottica Erro x Peso W ................................................................... 63
Figura 8.3 Treinamento Steepest Descent com Perturbao DEGRAU ........................... 69
Figura 8.4 Treinamento Steepest Descent com Perturbao PRBS .................................. 69
Figura 9.1 Perturbao DEGRAU com Controlador PID................................................. 73
Figura 9.2 Perturbao PULSO com Controlador PID..................................................... 74
Figura 9.3 Perturbao SEQUNCIA DE PULSOS com Controlador PID..................... 74
Figura 9.4 Perturbao SENIDE com Controlador PID ................................................ 75
Figura 9.5 Perturbao PRBS com Controlador PID........................................................ 75
Figura 9.6 Perturbao DEGRAU com Controlador RN e
Figura 9.7 Perturbao SEQUNCIA DE PULSOS com Controlador RN e
Figura 9.8 Perturbao SENIDE com Controlador RN e
Treinamento Steepest Descent. ........................................................................ 77
Figura 9.9 Perturbao PULSO com Controlador RN e
Figura 9.10 Perturbao PRBS com Controlador RN e
Figura 9.11 Perturbao SEQUNCIA DE PULSOS com Controlador RN e
Treinamento Decomposio em Valores Singulares.. ..................................... 79
Figura 9.12 Perturbao PULSO com Controlador RN e
Figura 9.13 Perturbao DEGRAU com Controlador RN e
Figura 9.15 Perturbao PRBS com Controlador RN e
xii
Figura 9.16 Resposta do Sistema Simulado a uma Perturbao PULSO ........................... 83

Figura 9.17 Grfico Comparativo Dos Erros Quadrados (E2) da Varivel Controlada ...... 84
Figura 10.1 Testes no Aquecedor de Ar com Controlador PID.......................................... 86
Figura 10.2 Testes no Aquecedor de Ar com Controlador RN e
Treinamento Decomposio em Valores Singulares. ...................................... 89
xiii
Tabelas
Tabela 6.1 Caractersticas das Placas A/D e D/A.............................................................. 42

Tabela 6.2 Registro de Controle da Placa A/D.................................................................. 42
Tabela 6.3 Fatores Decimais do Registro de Controle da Placa A/D................................ 42
Tabela 6.4 Configuraes dos Bits para Seleo de Canais da Placa A/D........................ 43
Tabela 6.5 Estrutura do Registro de Status da Placa D/A ................................................. 43
Tabela 6.6 Estrutura do Registro de Dados da Placa D/A................................................. 43
Tabela 6.7 Configuraes dos Bits para Definio do Nmero de Canais
da Placa D/A..................................................................................................... 45
Tabela 6.8 Registro de Dados da Placa A/D ..................................................................... 49
Tabela 6.9 Registro de Dados da Placa D/A ..................................................................... 50
Tabela 6.10 Pilha de Execuo de Rotinas do Software RTX ............................................ 51
Tabela 6.11 Rotinas e Arquivos de Configuraes das Perturbaes Aplicadas ................ 54
Tabela 8.1 Resultados da Simulao para o Tempo de Amostragem ............................... 60
Tabela 8.2 Mtodos Iterativos de Clculos para Determinar a Varivel Manipulada....... 65
Tabela 8.3 Resultados de Busca de Parmetros para o
Tabela 8.4 Resultados de Busca do Conjunto de Dados de Treino................................... 70
Tabela 9.1 Caracterizao das Perturbaes Aplicadas no Processo Simulado ................ 72
Tabela 9.2 Desempenho para Diversas Perturbaes do Controlador PID ....................... 73
Tabela 9.3 Desempenho para Diversas Perturbaes do Controlador RN e
Tabela 9.4 Desempenho para Diversas Perturbaes do Controlador RN e
Tabela 9.5 Comparao de Desempenho dos Controladores PID e RN ........................... 82
Tabela 9.6 Comparao de Desempenho dos Treinamentos
Steepest Descent e Decomposio em Valores Singulares ............................. 84
Tabela 10.1 Comparao de Desempenho dos Controladores PID e RN no
Mdulo de Testes ............................................................................................. 90
Tabela 10.2 Comparao de Desempenho dos Treinamentos Steepest Descent e
Decomposio em Valores Singulares no Mdulo de Testes ......................... 90
Tabela 11.1 Comparao entre Teste e Simulao para os Controladores PID e RN ........ 92
xiv
Notao
alfabeto normal
a constantes do processo de primeira ordem na forma discreta

c constantes do controlador PID na forma discreta
C capacitor
d constantes do controlador PID na forma discreta
e desvio da varivel desejada em relao ao set-point do processo contnuo,
erro
E2 soma dos erros da varivel controlada em relao ao set-point durante
um perodo de tempo; erro quadrado
ho sinal de sada em integradores/diferenciadores eletrnicos
hi sinal de entrada em integradores/diferenciadores eletrnicos
k instante em sistemas amostrados
K constante de proporcionalidade em processo contnuo
Kc constante do controlador PID em processo contnuo
KP constante do modo proporcional do controlador PID em processo
contnuo
KI constante do modo integral do controlador PID em processo contnuo
KD constante do modo derivativo do controlador PID em processo contnuo
L nmero de neurnios da camada intermediria da rede neural
M nmero de neurnios da camada de sada da rede neural
M valor da ao do controlador PID em processos contnuos
m valor da ao do controlador PID em processos discretos
n nmero de intervalos de amostragens
N nmero de neurnios da camada de entrada da rede neural;
total de conexes do elemento de processamento
o valores de sada da rede neural
O vetor de sada da rede neural
P conjunto de pares de vetores de treino da rede neural; pares de vetores
{X,Y}
R resistncia
xv
t tempo
T tempo resultante do desvio de controladores eletrnicos PID da idealidade
Ts tempo de amostragem do processo
tm tempo morto do processo contnuo
u vetor de entrada de um processo contnuo, varivel manipulada
w valor do peso das conexes da rede neural; fora das conexes
x valor de entrada da rede neural
X vetor de entrada da rede neural
y vetor de sada de um sistema contnuo, varivel controlada
Y vetor dos valores corretos de sada da funo de mapeamento
alfabeto grego
valor lquido de entrada do EP; valor de ativao; ativao

peso das conexes bias da rede neural; fora da conexo bias
constante de tempo do processo contnuo
i constante do modo integral do controlador PID em processo contnuo;
constante de integradores eletrnicos
d constante do modo derivativo do controlador PID em processo contnuo;
constante de diferenciadores eletrnicos
funo de mapeamento do vetor X no vetor Y
funo de aproximao do vetor X no vetor Y
frequncia do sinal de entrada em integradores/diferenciadores eletrnicos
smbolos compostos
BPN rede neural artificial BackPropagation

EP elemento de processamento da rede neural; neurnio
PID controlador Proporcional Integral Derivativo
RN rede neural
ANN rede neural artificial (Artificial Neural Network)
SP valor do set-point do processo
RN rede neural artificial
xvi
RNSD controlador RN com treinamento Steepest Descent

RNDVS controlador RN com treinamento Decomposio em Valores Singulares
outros smbolos
Z{} transformada z
|| || valor absoluto
G(s) funo de transferncia na transformada de Laplace
(s) transformada de Laplace da funo (t)
v(k) diferena entre os valores de v no instante k e no instante anterior (k-1)
(i) transformada de Fourier da funo (t)
H(z) funo de transferncia na transformada z
1. Introduo
A tecnologia de controle baseada em redes neurais artificiais teve seu maior impulso
na dcada de 80, por isso, podemos dizer que uma tcnica recente quando comparada com
as tcnicas denominadas convencionais surgidas na dcada de 40. Este trabalho tem por
objetivo avaliar a implantao desta tcnica no controle de um sistema experimental, bem
como, comparar os resultados da mesma com os controladores convencionais da famlia PID.
Inicialmente elaboramos as alteraes necessrias no software de controle em tempo
real de processos, anteriormente desenvolvido pelo Dr. Ivo Neitzel. Essas alteraes foram
realizadas em conjunto com a Eng Adriana R. Pedrozo, a qual utilizou o mesmo software em
seu trabalho de comparao de mtodos de treinamento de redes neurais artificiais. As
alteraes envolveram primeiramente a mudana da linguagem de programao, pois o
software original era escrito para o compilador FORTRAN MicroSoft1 e foi rescrito para o
compilador FTN77/4862 da Universidade de Salford, j que o mesmo possui vantagens em
relao ao FORTRAN MicroSoft (Captulo 6). Realizamos outras modificaes como a
implantao do algoritmo de redes neurais artificias, pois o mesmo utilizava o algoritmo de
controladores da famlia PID; mudanas em rotinas de leituras dos dados das placas de
comunicaes do computador com o mdulo de teste, pois eram escritas em linguagem
ASSEMBLER e incorporadas ao compilador FORTRAN. J as novas rotinas foram escritas
totalmente na linguagem FTN77/486.
A tarefa seguinte foi a construo do mdulo experimental para testes utilizando
equipamentos do Departamento de Engenharia Qumica (DEQ). O mdulo foi construdo
com opes de aplicao das perturbaes no fluxo de ar do aquecedor (Figura 4.1).
Neste trabalho incorporamos ao programa um sistema de controle com redes neurais
inversas com dois tipos de treinamento para a rede neural, o Steepest Descent e o
Decomposio em Valores Singulares.
Foram realizados vrios testes de confiabilidade das mudanas incorporadas no
software e no mdulo de testes (Captulo 7).
Utilizando o computador realizamos a simulao do processo em vrias situaes
diferentes. Ajustamos o controlador baseado em redes neurais para o controle eficiente
utilizando os dois tipos de treinamentos (Captulo 9). Efetuamos a sintonia de um controlador
1
FORTRAN Verso 3.34 - Compilador fortran que trabalha em processadores 386, ou superiores, em modo real
2
FTN77/486 Verso 4.0 - Compilador fortran 77 que trabalha em processadores 486, ou superiores, em modo
protegido
Introduo 2
PID e observamos a sua performance em processo simulado. Com os resultados obtidos foram
comparados os dois tipos de controladores e os dois tipos de treinamento da rede neural,
procurando mostrar as principais diferenas no comportamento de cada situao.
Como parte final do trabalho verificamos o desempenho dos controladores no controle
do mdulo de testes, observando suas reaes a situaes com perturbaes externas ao
mdulo. Mostramos tambm, utilizando o controlador baseado em redes neurais, a facilidade
de mudana no valor do set-point do processo via software (Captulo 10).
Com o intuito de mostrar as dificuldades existentes no controle de um processo real
realizamos uma anlise entre os resultados obtidos na simulao e os obtidos no controle do
mdulo de testes (Captulo 11).
Atravs deste trabalho podemos ter uma idia de como implantar e desenvolver um
controle de processos utilizando controladores baseados em redes neurais, sua dificuldade de
implantao e os cuidados que devemos ter para levar a bons resultados.
2. O Sistema de Controle Convencional - PID
Um sistema de controle autosintonizante uma tcnica na qual, o controlador em

atuao ajustado periodicamente com base em perturbaes aplicadas ao processo (SANOFF
E WELLSTEAD, 1985).
Considerando um controlador PID, podemos descrever esta tcnica pelo diagrama:
Projeto do Estimao de
Controlador Parmetros
(Kc, i, d) (K, , tm)
Perturbao
CONTROLADOR PROCESSO
Figura 2.1 - Diagrama de Blocos do Controle Autosintonizante

para Controladores PID
Como podemos observar este tipo de algoritmo constitudo de dois laos distintos,
um superior e um inferior (GOODWIN E SIN, 1984). O lao inferior o de controle
convencional com realimentao (ZIEGLER E NICHOLS, 1942). O lao superior realiza uma
estimao dos parmetros para projeto do controlador, utilizando para isto as informaes de
resposta do processo a uma perturbao.
Deste modo a sintonia do controlador avaliada periodicamente e atualizada no lao
de controle, com uma frequncia que depende das caractersticas do processo controlado,
podendo chegar a uma vez por intervalo de amostragem.
O processo ser modelado para um sistema contnuo de primeira ordem com tempo
o
morto, descrito pela equao y ( t ) + y ( t ) = Ku(t t m ) , onde;
y - varivel controlada u - varivel manipulada
K - constante de proporcionalidade do processo
- constante de tempo do processo tm - tempo morto
O Sistema de Controle Convencional - PID 4
As constantes e o tempo morto sero determinadas a partir da resposta do processo a

uma perturbao, sendo seus valores utilizados para projetar o controlador e determinar seus
parmetros (Figura 2.1).
Podemos observar que todo o conhecimento do processo transferido para o
controlador na forma de constantes.
Nos controladores PID utilizamos essas constantes para determinar as constantes do
modo proporcional, integral e derivativo da equao do controlador, descrita como:
t de(t )
M (t ) = K Pe(t ) + K I e(t )dt + K D
d t
(2A)
0
M - valor da ao do controlador
e - desvio da varivel desejada em relao ao set-point, erro
Kp - constante do modo proporcional - corrige a varivel manipulada com
quantidade proporcional ao desvio da varivel desejada em relao ao Set-
point.
KI - constante do modo integral - corrige a varivel manipulada com velocidade
proporcional ao desvio da varivel desejada em relao ao Set-point.
KD - constante do modo derivativo - corrige a varivel manipulada de uma
quantidade proporcional a velocidade de variao da varivel desejada em
relao ao Set-point.
A equao 2A tambm pode ser escrita da seguinte forma;
t de(t)
M (t) = K C e ( t ) +
1
i o
e(t)dt + d
d t
(2B)
onde;
Kp KD
Kc = Kp ; i = e d =
KI KP
2.1 Sintonia do Controlador PID
Neste trabalho ajustamos um controlador PID a um sistema de 1 ordem com tempo

morto. O controlador obedece a Equao 2A e possui a funo de transferncia:
M ( s) K 1
G ( s) = = K p + I + K D s = K c 1 + + d s (2C)
e ( s) s i s
A ao ideal de um controlador PID em termos dos modos proporcional, integral e

derivativo, representada graficamente na Figura 2.2
M(t)
Kc
0
t
a) ao do controlador proporcional (Controlador P)
M(t)
Kc
-i 0
t
b) ao do controlador proporcional e intregral (Controlador PI)
M(t)
Kc ( 1 + d
Kc
-i 0
t
c) ao do controlador proporcional, integral e derivativo (Controlador PID)
Figura 2.2 - Representao grfica da ao de controladores da famlia PID
Na Figura 2.2a temos a ao do controlador constante desde o tempo inicial t=0. No

caso dos controladores PI (Figura 2.2b) a ao inicial produzida somente pela parte
proporcional, porque a ao integral nula no tempo t=0. Isto facilmente observado na
equao do controlador (Equao 2B), onde a integral (soma) dos desvios zero nesse
instante e cresce com o decorrer do tempo. Para os controladores PID (Figura 2.2c) temos no
instante inicial o acrscimo de uma parcela decorrente da ao diferencial.
Observamos que na prtica a implementao de controladores com modo integral e

derivativo no ocorre de acordo com as Figuras 2.2b e 2.2c. Existe um desvio da idealidade
devido construo eletrnica.
2.1.1 Integrador eletrnico
Os integradores eletrnicos so construdos de acordo com o esquema da Figura 2.3,

sendo representados pela transformada de Fourier:
ho 1
(i ) = (2D)
hi i i + 1
onde;
ho - sinal de sada
hi - sinal de entrada
- frequncia do sinal de entrada
i - constante do integrador i=RC
temos que para i >> 1 ;
ho 1 1 t
(i ) ou seja ho (t ) h (t )dt (2E)
hi ii i 0
i
Portanto o integrador eletrnico produz bons resultados para um sinal de entrada com
espectro de frequncia tal que i >> 1. Aparentemente qualquer frequncia pode ser
englobada atravs da escolha de i suficientemente grande. Contudo, grandes valores de i
retardam a ao de sada; podemos ento reduzi-lo at o nvel de rudo que o sistema permita.
R
+ -
+
+
hi ho
- -
1
RC i
ho = h dt
Figura 2.3 - Integrador eletrnico

2.1.2 Diferenciador eletrnico
Todos os filtros passa-alta (Figura 2.4) podem ser empregados como diferenciadores
aproximados para um sinal de entrada, dentro de uma restrita faixa de frequncia. So
representados pela transformada de Fourier como:
ho i d
(i ) = (2F)
hi i d + 1
onde;
ho - sinal de sada
hi - sinal de entrada
- frequncia do sinal de entrada
d - constante derivativa do diferenciador, d=RC
para d << 1 temos ;
ho dhi (t )
(i ) i d ou seja ho (t ) d (2G)
hi dt
Notamos que para um dado valor de d, a aproximao necessita de pequenos valores

de . O valor de d pode ser reduzido para estender a faixa de preciso do diferenciador
altas frequncias. Contudo pequenos d reduzem a sensibilidade; no entanto o nvel de rudo
no limitante como no integrador aproximado.
Os diferenciadores produzem boas aproximaes somente para frequncias em que
d <<1, assim devemos estimar a maior frequncia a ser utilizada e escolher d apropriado.
C
+ -
+
+
hi ho
- -
dhi
ho = RC
dt
Figura 2.4 - Diferenciador eletrnico

2.1.3 Controlador PID eletrnico
A maior dificuldade no ajuste de um controlador PID eletrnico est no mdulo

diferenciador, pois os problemas do mdulo integrador so contornveis. Comparando-se as
figuras 2.3c e figura 2.5, observamos o desvio da idealidade do mdulo diferenciador.
Utilizamos uma varivel T para quantificar esse desvio. A incluso dessa varivel altera a
funo de transferncia do modo diferencial, o que implica na transformao da funo de
transferncia do controlador (Equao 2C) em;
M ( s) K Ts 1 d s
G ( s) = = K p + I + K D = K c 1 + +
e ( s) s
Ts + 1 i s T s + 1 (2H)
onde;
Kp KDT
Kc = Kp ; i = e d =
KI KP
M(t)
K c ( 1 + d/T )
Kc
-i T t
Figura 2.5 - Representao grfica da ao de um

controlador PID eletrnico
2.1.4 Controlador PID digital
Neste trabalho implementamos um controlador digital utilizando o algoritmo da

velocidade na forma discreta (UNBEHAUEN, 1985). Para a obteno do algoritmo utilizamos a
funo de transferncia do controlador (Equao 2H) e determinamos a correspondente na
transformada z. Segundo Unbehauen, a mudana da equao se faz pela substituio das
equaes a seguir na funo de transferncia;
z 1 1 Ts z + 1
s e
zTs s 2 z 1
onde Ts o tempo de amostragem do processo.

Realizando a substituio temos:
M ( z) T ( z + 1) d z 1
H ( z) = = Kc 1 + s + (2I)
E ( z) 2i ( z 1) zTs 1 + T ( z 1) ( zTs )
atravs de manipulaes matemticas (Apndice IV) obtemos a equao a seguir:
m(k ) = d 0e(k ) + d1e(k 1) + d 2e(k 2) c1m(k 1) (2J)
1, 2 1 2 T s ( Tm + T s ) Tm + T s + 2 T
onde ; d 0 = + +
K p ( T m T s ) (1 + T s )
T
( 2 Tm + Ts ) 2 1 + T Ts
1,2 Ts ( Tm + Ts ) Tm + Ts + 2 T 1
d1 = 2
K p ( Tm + Ts ) (1 + Ts )( 2 Tm + Ts )
T
Ts (1 + Ts )
T
1 + T Ts
1,2 Tm + T s + 2 T T ( Tm + Ts )
d2 =
Kp ( Tm + Ts ) 2 Ts (1 + v Ts ) (1 + T Ts )( 2 T m + Ts ) 2
T
c1 =
Ts + T
m(k) = diferena entre a ao do controlador no instante (k) e no instante(k-1)

k = representa o instante atual
k-1 = representa um instante anterior
k-2 = representa dois instantes anteriores
Ts = tempo de amostragem do controlador
T = tempo resultante do desvio de controladores eletrnicos PID da idealidade.
Na verso discreta T=0.
Tm = tempo morto do processo
Utilizando esse algoritmo implementamos no programa de controle os controladores P,

PI e PID.
3. Rede Neural Artificial
A idia de utilizar redes neurais artificiais como uma potencial estratgia de soluo de
problemas que requerem anlises complexas de dados no recente. A mais de 40 ou 50 anos,
os cientistas tem procurado simular a estrutura real do crebro humano e desenvolver um
algoritmo equivalente ao processo de aprendizado humano. A principal motivao da
pesquisa advm da capacidade de guardar sofisticados nveis de informaes e
processamentos que o crebro possui. Entretanto, a estrutura do crebro extremamente
complexa, com aproximadamente 1011 neurnios contendo de 1014 a 1015 sinapses (conexo
entre os neurnios). Sabendo que a funo de um nico neurnio bem definida, a arquitetura
das ANNs3 baseada no conhecimento das funes primitivas do neurnio biolgico.
Entretanto, como no temos um modelo preciso das diversas funes do crebro humano, as
redes neurais artificiais procuram assimilar e utilizar uma confeco filosfica, mais modesta
e em menor escala (WILLIS ET AL, 1990).
3.1 Definio e aplicao
As redes neurais so construdas com camadas altamente interconectadas de simples

neurnios. Os neurnios atuam como um elemento de processamento (EP) no-linear dentro
da rede. Uma propriedade atrativa das redes neurais artificiais que elas so capazes de
aproximar funes no-lineares.
A representao esquemtica de um EP(elemento de processamento, ou neurnio)
pode ser vista pela Figura 3.1. Cada elemento numerado, de um at i-simo elemento
recebendo vrias entradas (xj) e possuindo uma nica sada (oi). Cada conexo de entrada
associada a um peso ou fora da conexo (wij) (FREEMAN E SKAPURA, 1992).
O valor lquido de entrada do elemento uma somatria do produto das conexes e
seus respectivos pesos. Assim, o valor lquido da entrada do i-simo elemento pode ser escrito
como:
N
i = j
w ij x j
onde N representa o total de conexes de entrada do elemento de processamento. Esse

valor lquido (i ) recebe o nome de valor de ativao , ou simplesmente ativao.
3
Artificial Neural Networks - Redes neurais artificiais
Rede Neural Artificial 11
x1
x2
w1,1
EP1
w1,2
.
. o1
w1,N-1
w1,N
xN-1
xN
Figura 3.1 - Estrutura de um Elemento de Processamento
A sada do elemento de processamento determinada a partir da ativao atravs da

aplicao de funes lineares ou no-lineares, as chamadas funes de ativao. Podemos
representar a sada dos elementos como:
oi = f i ( i )
onde fi representa a funo de ativao do i-simo elemento. Sero analisados apenas
dois tipos de funes de ativao. O primeiro, seria a funo de ativao linear, isto , o valor
da funo assume o mesmo valor da ativao:
f i ( i ) = i
onde i representa o i-simo elemento de processamento. Essa funo fornece s redes
neurais artificiais caractersticas lineares. O segundo tipo, a funo de ativao sigmoidal,
que apresenta caractersticas no-lineares. Matematicamente, a funo sigmoidal pode ser
expressa por:
1
f ( i ) =
(1 + e
i i
)
A Figura 3.2 representa graficamente a resposta de uma funo sigmoidal.
Observamos que ela limitada pelos valores extremos 0 e 1. Essa caracterstica da funo
sigmoidal atua como um limitante do sinal de sada fornecendo valores com extremos bem
definidos. interessante notar que a no linearidade da funo sigmoidal tambm observada
no comportamento dos neurnios humanos (WILLIS ET AL, 1990). Atuando sobre uma
rede neural esta funo fornece a ela a capacidade de representar relaes no-lineares.
Uma rede neural composta de vrios elementos de processamento distribudos em
camadas. Cada EP envia seu sinal de sada a outros elementos. Assim, os elementos ativam
Valor de Saida
os outros de acordo com o seu peso ou 1
0,8
fora da conexo. Um esquema 0,6
0,4
representativo pode ser visto pela Figura 0,2
0
3.3, onde visualizamos as conexes dos
-10 -5 0 5 10
elementos de processamento em trs Ativao
camadas com vrios elementos em cada Figura 3.2 - Sada da Funo Sigmoidal
uma.
As camadas intermedirias so tambm denominadas de camadas escondidas.
As redes neurais esto sendo utilizadas dentro da rea de engenharia de processos,
projetos e simulao, superviso, controle e estimao, deteco de falhas, diagnsticos reais
sobre o efeito de informaes imprevistas e imprecisas, etc. Seus modelos so baseados em
conhecimentos qualitativos (derivados de experincias), quantitativos (em termos de um
modelo analtico do processo) ou uma mistura de ambos. Atravs desses modelos podemos
obter solues aceitveis, existem no entanto, muitas situaes que esto propensas a falhas
devido s incertezas e as no-linearidades intrnsecas dos vrios processos. Contudo, so para
essas situaes que as ANNs esto sendo projetadas, procurando formar uma base que fornea
alternativas para a engenharia prtica (DI MASSIMO ET AL,1992).
Camada de
. . . . . Sada
Camada
. . . . . Intermediria
Camada de
. . . . . Entrada
Figura 3.3 - Esquema Representativo das Conexes dos Neurnios

de uma Rede Neural Artificial
3.2 BackPropagation Network (BPN)
A BackPropagation Network possui uma performance significativa no mapeamento de

funes, destacando-se entre os diversos ANS4 existentes. Esta rede, ilustrada genericamente
na Figura 3.4, projetada para trabalhar com multicamadas utilizando um modo particular de
aprendizagem (FREEMAN E SKAPURA, 1992).
A operao da BPN para resolver problemas complexos, de um modo resumido,
iniciada com a rede aprendendo um conjunto de dados entrada-sada pr-definidos, utilizando
um ciclo de aprendizagem. Aps um conjunto de entrada ser aplicado como um estmulo na
primeira camada da rede, este se propaga para as outras camadas at a camada de sada,
gerando um resultado ou valores de sada. Estes resultados so comparados com os valores
desejados e ento o erro computado para cada sinal de sada. Para a correo dos pesos o
erro transmitido backward (para trs, de volta) para cada n das camadas intermedirias que
contriburam diretamente para a gerao dos valores de sada. Entretanto, cada unidade
intermediria recebe somente uma parte do erro total produzido, baseado na relativa
Figura 3.4 - Arquitetura das Trs Camadas da BPN
4
ANS - Artificial Neural System - Sistema Neural Artificial
contribuio que a unidade teve na construo do resultado na camada de sada. Este processo
se repete, camada a camada, at que cada n da rede tenha corrigido seus pesos.
As camadas da arquitetura BPN seguem a descrio geral das redes dada
anteriormente. Existe no entanto, uma conexo fictcia, denominada bias, que possui valor
unitrio. Os pesos hj e ok , representam as foras dessas conexes e so tratados de
maneira semelhante aos outros pesos.
3.2.1 Formulao Matemtica
Apresentaremos as equaes para uma BPN com trs camadas por ser o modelo mais
simples e porque este tipo foi implantado no software de controle.
Um vetor X = ( x1 , x 2 ,..., x N ) aplicado na camada de entrada da rede e distribudo para
a camada escondida, produz uma ativao em cada neurnio dessa camada descrita como:
N
h
j = w hji x i + hj (3A)
i =1
onde w hj ,i o peso da conexo da i-sima unidade de entrada no neurnio j e hj o peso da
conexo bias desse neurnio. O sobrescrito h representa os valores referentes camada

escondida. O valor de sada dos neurnios da camada escondida definido atravs da
aplicao da funo de ativao no neurnio, podendo ser linear ou no como visto
anteriormente. Assumindo que a funo de ativao da camada escondida linear, ou seja, o
valor de sada igual ativao temos:
o hj = f jh ( hj ) = hj (3B)
Analogamente podemos deduzir que as correlaes para os neurnios da camada de

sada. A ativao dos neurnios dada por:
L
o
k = j=1
w koj o hj + o
k (3C)
onde k representa o k-simo neurnio de sada e o sobrescrito o representa valores da

camada de sada. Aplicando-se uma funo de ativao sigmoidal na camada de sada
teremos:
1
o ko = f ko ( ok ) = (3D)
1 + e k
o
Esse conjunto de equaes nos fornece a sada da rede para um determinado valor de
entrada.
A soluo dessas equaes necessita do conjunto de pesos das conexes, que envolve o
treinamento da rede. Embora existam muitas tcnicas, o mtodo usado para a busca dos pesos
timos neste trabalho um processo iterativo que no depende de uma boa aproximao
inicial.
3.3 Tipos de Treinamentos da Rede
O treinamento ou aprendizado da rede neural consiste em determinar os pesos timos

para cada conexo dos neurnios, de modo que a rede possa fornecer valores de sada
exatamente ou bem prximos aos valores esperados.
A disponibilidade dos dados para treino define o tipo de treinamento a ser utilizado, ou
seja, treinamento batelada, sequencial ou sequencial com janela.
O treinamento batelada consiste em determinar os pesos ideais para um conjunto
limitado de dados de treino. Esses pesos calculados permanecem inalterados durante a
utilizao da rede.
O treinamento sequencial atualiza os pesos a cada passo de utilizao da rede. O
treinamento contnuo, sendo o conjunto de dados de treino ilimitado. Os pesos so
atualizados toda vez que se utiliza a rede.
No treinamento sequencial com janela a rede utilizada durante um certo perodo com
atualizao dos pesos de modo sequencial, aps, interrompe-se a atualizao mantendo-se os
pesos constantes. Volta-se a corrigir os pesos, aps algum tempo, quando a rede no consegue
produzir valores satisfatrios. Isto pode ocorrer se a mesma estiver operando em condies
diferentes s quais foi treinada.
O software de controle, utilizado neste trabalho, possui opes de implantao de
todos os tipos de treinamentos, batelada, sequencial e sequencial com janela.
Neste trabalho adotamos o treinamento sequencial durante o mtodo de treino Steepest
Descent. Para o mtodo de treino Decomposio em Valores Singulares utilizamos o
treinamento batelada devido s caractersticas do mtodo.
3.3.1 Treinamento Steepest Descent
O treinamento Steepest Descent um algoritmo de clculo baseado no gradiente de

uma funo erro. Como o gradiente informa a direo em que a funo crescente, esse
mtodo caminha em direo oposta ao gradiente (Figura 3.5), ou seja, para um ponto de
menor valor da funo erro definida, assim, uma vez atingido o ponto de mnimo da funo
teremos os valores dos pesos que produzem os menores erros de sada.
Supondo que temos um conjunto P = {( X 1 , Y1 ), ( X 2 , Y2 ),..., ( X P , YP ),...,( X R , YR )} de
pares de vetores, que so resultados do mapeamento de uma funo
Y = ( X ): X R N , Y R M . Desejamos treinar a rede para que obtenha uma aproximao
O = ( X ) Y ( X ): X R N , O R M .
O erro a ser minimizado pelo mtodo Steepest Descent definido como a soma do
quadrado dos erros produzidos nas M sadas, ou seja:
M
E p = 1
2
k =1
2
pk
Sendo pk = ( y pk o pk
o
) o erro do k-simo elemento de sada da rede para o p-simo
par de vetor de treinamento do conjunto P, onde ypk o valor correto de sada e o opk o valor
estimado pela rede.

O fator na equao definido por convenincia para o clculo posterior da derivada
da funo.
Figura 3.5 - Superfcie Hipottica da Funo Erro

no Espao dos Pesos
Como o mtodo Steepest Descent utiliza o gradiente da funo erro, devemos

determinar esse gradiente em funo dos pesos das camadas de sada e intermediria da rede,
logo temos para a camada de sada;
E p f ko p k
o
= ( y pk o pk )
o
w kjo op k w kjo
e para uma funo de ativao da camada de sada sigmoidal, temos:
f ko ( opk ) opk L
opk
= f k (1 f k ) = o pk (1 o pk ) e
o o o o
=
wkjo wkjo
j kj pj k = o hpj
w o h
o + o
com as equaes acima podemos definir a equao de correo dos pesos da camada
de sada como sendo:
wkjo ( k ) = wkjo ( k 1) E = wkjo ( k 1) + o opk (1 o opk )o hpj (3E)
onde o ndice k representa o valor atual do peso calculado, k-1 o valor anterior do peso
e , chamado de passo de aprendizagem, representa a razo com que o peso avana em
direo do valor timo.
Podemos construir a equao de clculo dos pesos da camada intermediria ou
escondida de maneira anloga. Considerando a funo de ativao linear e partindo da
equao do erro, devemos determinar o gradiente da funo em relao aos pesos da camada.
A equao a seguir representa o gradiente da funo erro em relao aos pesos da camada
intermediria.
E p M o op k op k o hp j hp j M
w ji
h
=
k
( y pk o o
pk )
p k o p j p j w ji
o h h h
= x pi ( y pk o pk ) w kj
k
o o
logo temos que;

M
w hji ( k ) = w hji ( k 1 ) E = w hji ( k 1 ) + x p i ( y p k o op k ) w koj (3F)
k
De posse dessas equaes podemos determinar uma sequncia de clculo para o

treinamento Steepest Descent.
Sequncia de clculo do treinamento Steepest Descent para a rede BPN:
1) Inicializar os pesos da rede com valores aleatrios.

2) Aplicar um vetor de entrada Xp nos neurnios da camada de entrada.
3) Utilizar a equao 3A e determinar a ativao da camada escondida.
4) Utilizar a equao 3B e determinar as sadas da camada escondida.
5) Determinar a ativao dos neurnios da camada de sada com a equao 3C.
6) Determinar os valores de sada da rede com a equao 3D.
7) Corrigir os pesos da camada de sada utilizando a equao 3E.
8) Corrigir os pesos da camada escondida utilizando a equao 3F.
9) Caso o valor do erro Ep seja aceitvel, o processo terminado seno voltar ao passo 2 e
aplicar um novo vetor de entrada.
3.3.2 Treinamento Decomposio em Valores Singulares
Este tipo de treinamento visa acelerar o processo de treino utilizando funes

polinomiais baseadas em funes de ativao no lineares e incorpora um mecanismo para a
manipulao automtica dos dados de entrada na forma mais apropriada para a rede.
Sabendo-se que a velocidade de treinamento influenciada pela quantidade de
neurnios existente na rede, utiliza-se uma tcnica denominada Anlise do Componente
Principal(ACP) para avaliar a contribuio relativa das entradas sobre as variaes de sada.
A tcnica ACP pode ser classificada como uma tcnica de anlise de dados multivariveis,
sendo um procedimento importante para a anlise de conjuntos de dados complexos. Na
realizao de uma ACP, a anlise de um grande nmero de variveis pode ser reduzida
investigao de um pequeno conjunto transformado. Alm disso, incorporando uma ACP na
filosofia de treinamento da rede, possvel especificar o nmero mnimo de neurnios nas
camadas intermedirias da rede.
Considerando um conjunto de R observaes de N entradas da rede como uma matriz
na forma X = {x1 , x2 ,..., x j ,..., x N 1 , x N }, onde o vetor xj representa uma sequncia das R
observaes da j-sima varivel. A matriz X pode ento ser decomposta como:

X = U 2V T
1
(3G)
onde U a matriz dos vetores caractersticos de XXT com dimenso RxR, e V a matriz
de vetores caractersticos de XTX com dimenso NxN. A matriz 2 diagonal, cujos
1
elementos so as razes quadradas positivas dos valores caractersticos i (i = 1,..., R ) de XTX e

so chamados valores singulares. As colunas U e V so denominadas vetores singulares de X,
e apresentam as seguintes caractersticas:
V TV = VV T = I e U TU = UU T = I
A tcnica de decomposio de matrizes descrita pela equao 3G denominada
Decomposio de Valores Singulares. Esta uma das muitas tcnicas para determinar os
valores e vetores caractersticos de matrizes, cuja utilizao baseia-se no fato de ser o
procedimento numericamente mais robusto para realizar esta tarefa e tambm por ser
aplicvel a matrizes no quadradas, o que til na prtica, uma vez que a quantidade de dados
geralmente maior que o nmero de variveis em considerao(GOLUB E VAN LOAN, 1983)
Os componentes principais da matriz X so as colunas da matriz P, definida como:
P = XV = U 2 = {p1 , p2 ,..., pi ,..., pN 1 , pN }
1
(3H)
O i-simo componente principal definido pelo vetor pi uma soma ponderada de

variveis padronizadas, onde os pesos so definidos pelos elementos do i-simo vetor
caracterstico, vi, isto :
N
pi = Xvi = vij xi (i=1,...,N) (3I)
j =1
A varincia de cada componente principal dada pelo correspondente valor

caracterstico,i, da matriz de correlao de dados (MANLY,1986 ; RAWLINGS, 1988), ou
seja;
var( pi ) = viT X T Xvi = i
Uma vez que a matriz correlao simtrica, todos os seus valores caractersticos tem
magnitude maior do que, ou igual a zero. Estes valores caractersticos podem ser organizados
em ordem decrescente. Sendo assim, o primeiro componente principal, corresponde ao maior
valor caracterstico, explicar a maioria das variaes nos dados fornecidos. O segundo
componente principal explicar a causa do prximo nvel de variao, e assim
sucessivamente.
Pelo descarte dos componentes principais que no contribuem significativamente para
a variao global dos dados, a dimenso do problema pode ser reduzida. Esta tcnica pode ser
utilizada como uma parte integrante do procedimento de treinamento de uma rede neural.
Uma BPN(item 3.2) com duas camadas geralmente treinada utilizando uma rotina de
minimizao para obter o grau de aproximao necessrio. Na metodologia aqui analisada, a
determinao dos pesos nas duas camadas difere da determinao geralmente utilizada para a
BPN. Os pesos das conexes entre a camada de entrada e a camada intermediria so
determinados pelo resultado de uma ACP realizada nos dados de entrada do seguinte modo :
a) as variveis escolhidas como entrada para a rede so agrupadas na matriz X.

b) a matriz X transformada conforme a equao 3G
c) a matriz dos componentes principais P obtida pela equao 3I
d) os pesos entre as camadas de entrada e intermediria so assumidos como os
elementos do vetor caracterstico
Os componentes principais resultantes so linearmente independentes, mesmo que as

variveis originais apresentem multicolinearidades. Desta forma a porcentagem de
contribuio de cada componente principal em relao variao global dos dados pode ser
determinada, e os componentes principais cuja contribuio pequena, posteriormente,

podem ser eliminados da anlise. Esta eliminao de componentes principais de pequena
importncia, no presente contexto, representa a eliminao de neurnios da camada
intermediria.
Sendo a funo de ativao da camada intermediria uma funo sigmoidal, podemos
fazer uma expanso em srie de Taylor, obtendo:
1
o hj = f jh ( hj ) = hj
= a0 + a1 ( hj ) + a2 ( hj ) 2 + a3 ( hj )3 + ... (3J)
1+ e
Considerando que a sada da camada intermediria da rede possa ser definida como a
equao 3J, podemos escrever a ativao da camada de sada como sendo:
L L G
ko = wkjo o hj = wijo an ( hj ) n (3K)
j =1 j =1 n=0
onde G representa o grau da polinomial de aproximao da funo sigmoidal.

Entretanto a equao 3K pode ser rescrita como:
L G
ko = snj ( hj ) n (3L)
j =1 n = 0
sendo snj os coeficientes da polinomial transformados que devem ser determinados, de

forma a alcanar a exatido desejada.
Para uma rede neural com um nico valor de sada (k=1), podemos escrever para as R
[
observaes da matriz de entrada X, um vetor Y = y11 , y12 ,..., y1p ,..., y1R 1 , y1R , onde y1p , ]
T
representa a sada da p-sima observao. Sendo a funo de ativao da camada de sada

sigmoidal, podemos escrever;
1 1 y1p
y1p = (1o ) p = ln(1 ) = ln p (p=1,...,R) (3M)
1 + e ( 1 ) y1 1
o p
y1p
Durante o treinamento da rede conhecemos a matriz X e o vetor Y, e deste modo

podemos determinar a ativao da camada de sada pela equao 3M.
Utilizando essas equaes podemos construir uma sequncia de clculo para o
treinamento Decomposio em Valores Singulares como sendo;
1) montar a matriz de observaes X

2) determinar U, V, a partir de X
3) determinar a matriz P ( equao 3H)
4) determinar os componentes principais pi (equao 3I)
5) realizar a ACP eliminando os componentes principais que possuem pequena contri-

buio, isto , determinar o nmero de neurnios da camada intermediria
6) determinar a ativao da camada intermediria (equao 3H)
7) determinar a ativao da camada de sada para as R observaes (equao 3M)
8) determinar os coeficientes da polinomial transformados snj (equao 3L)
3.4 Consideraes prticas
As sequncias de clculo mostradas nos treinamentos parecem muito simples de ser

implantadas, mas na prtica existem vrios problemas que devem ser contornados. A seguir
procuramos esclarecer essas dificuldades para cada tipo de treinamento utilizado e mostrando
as solues aplicadas neste trabalho.
3.4.1. Treinamento Steepest Descent
O primeiro item da sequncia de clculo do treinamento, onde temos que inicializar os

pesos com valores aleatrios, induz a vrias indagaes. As grandezas desses valores? Podem
ser valores negativos e positivos? Os valores podem ser todos iguais? Deve existir alguma
relao entre eles? Perguntas como estas devem ser estudadas e resolvidas para cada caso que
a rede se prope a aprender. No aprendizado do processo estudado, valores iniciais de
grandeza 1 ou superior, desestabilizaram o sistema de rede, gerando erros de overflow5. O
mesmo aconteceu para valores iniciais -1 ou inferiores. Portanto, a inicializao dos pesos foi
realizada com valores aleatrios entre 0 e 10-3 .
Outra dificuldade se refere s caractersticas do conjunto de dados a ser fornecido para
o treinamento, qual a quantidade de dados para treino? Os dados devem ser sequenciais?. A
princpio no existe um quantidade definida de dados de treino, dependendo da natureza dos
dados e das informaes que a rede poder absorver, haver a necessidade de um conjunto
maior de dados. Observa-se tambm que as caractersticas do sistema em treino influenciam
na quantidade de dados necessrios para o treinamento. Devido a natureza do aprendizado da
rede, no h necessidade de que os dados de entrada estejam em sequncia.
Quantos neurnios devem ser utilizados em cada camada? Esta pergunta outro
problema que deve ser considerado para cada sistema a ser estudado. O que se encontra
geralmente uma quantidade de neurnios diferente para cada trabalho publicado ou trabalho
realizado. Alguns autores tentaram estabelecer um parmetro preciso ou uma regra geral para
5
Gerao de um valor fora do range admissvel pelo computador
determinao exata da quantidade de neurnios da rede. O que se faz geralmente iniciar

com uma certa quantidade (10 a 20 em cada camada) de neurnios e posteriormente otimiza-
se a rede baseando-se nos resultados por ela oferecido. Sabemos que um nmero elevado de
neurnios (ns) na rede proporciona um esforo computacional muito grande6.
A utilizao ou no da conexo fictcia bias outra deciso a ser tomada. Dependendo
do sistema estudado deve-se verificar os resultados com e sem a conexo para decidir sobre
sua implantao. No uma deciso geral, e sim, uma deciso individual para cada sistema.
O passo de aprendizagem dos pesos tambm decidido por tentativas, iniciando-se
com valores menores e aumentando-se at descobrir o melhor valor no sistema que estamos
treinando. A maioria das redes trabalham com passo de aprendizado constante, mas nada
impede que ele se ajuste durante o processo de aprendizado, diminuindo ou aumentando,
conforme a necessidade.
Dependendo do passo de aprendizagem dos pesos ou do conjunto de dados de
treinamento, podemos no encontrar os valores timos dos pesos, o mnimo global da funo
erro (ponto Zmin), como podemos observar pela Figura 3.6. Pode-se atingir um mnimo local
(Z1 ou Z2), onde teremos valores mnimos do erro para uma determinada regio de trabalho da
rede.
Z2
Z1
Z min
W
Figura 3.6 - Seo Transversal de uma Superfcie Hipottica

da Funo Erro no Espao dos Pesos
3.4.2. Treinamento Decomposio em Valores Singulares
A montagem da matriz de observaes oferece a primeira dificuldade na sequncia de

clculo desse treinamento porque devemos definir a quantidade de observaes (R) e
aquantidade de neurnios da camada de entrada (N). Cada funo a ser aproximada por uma
6
Aumento significativo na quantidade de operaes lgicas e matemticas realizadas pelo computador
provocando um tempo maior na busca do resultado
rede neural dever possuir valores diferentes de R e N, portanto, os dois dados devem ser
determinados atravs de tentativas observando o aprendizado da rede para diversos valores,
procurando assim, valores timos para esses parmetros.
A decomposio da matriz X, segundo item da sequncia de clculo, pode ser realizada
por qualquer rotina de decomposio. Neste trabalho utilizamos rotinas da biblioteca IMSL.
Determinar os componentes principais com valores representativos, realizar a ACP,
oferece outra dificuldade, pois devemos definir o que um valor representativo, qual a
contribuio relativa mnima a ser utilizada. Neste trabalho eliminamos valores
representativos com contribuio relativa inferior a 1%.
Finalmente os coeficientes da polinomial transformados snj (equao 3L), para serem
determinados, devemos definir o grau da polinomial de aproximao(G) da funo sigmoidal.
Este outro parmetro estimado atravs de tentativas, pois devero existir valores timos
diferentes para cada caso estudado. Devemos observar que o acrscimo de 1 grau na
polinomial representa L coeficientes a mais a serem determinados, onde L o nmero de
neurnios da camada intermediria, determinado na ACP.
4. Aquecedor de ar, o mdulo de testes
O processo de aquecimento utilizado para testes e controle est representado pela

Figura 4.1. Foi construdo de modo a possibilitar aplicao de perturbaes do tipo degrau na
vazo de ar utilizando a vlvula de by-pass ou abrindo e fechando a porta do aquecedor.
A operao do sistema muito simples, o ar injetado pelo soprador enviado ao
aquecedor, dependendo da posio da vlvula de by-pass, uma parte dessa vazo desviada
para a atmosfera, o transmissor de temperatura envia um sinal eltrico para o conversor
analgico/digital que aps transform-lo envia-o para o computador. O computador envia um
sinal ao conversor digital/analgico que atua sobre o controlador de tenso, que ajusta a
tenso no conjunto de resistncias, procurando assim, manter a temperatura de sada do ar no
valor desejado.
Sada de Ar 1-5 V
TT
01 0-4095
V-01
Conversor A/D
Entrada
Sada TIC
AQ - 01
de Ar de Ar 01
S-01
RZ Conversor D/A
01 1-5 Volt
0-4095
R TZ
01
S-01 : Soprador de Ar AQ-01 : Aquecedor
V-01 : Vlvula de by-pass TT-01 : Transmissor de Temperatura
RTZ-01 : Controlador de Tenso (TIRISTERM) RZ-01 : Conjunto de Resistncias Eltricas
TIC-01 : Controlador e Indicador de Temperatura (COMPUTADOR)
Figura 4.1 - Esquema do Mdulo de Teste e Controle
4.1 Caractersticas do sistema
A caracterizao do sistema foi realizada atravs da resposta do processo a

perturbaes do tipo degrau. Determinamos as constantes do processo para perturbaes na
tenso da resistncia eltrica e observamos o seu comportamento sob a ao de uma
perturbao externa; a variao da vazo de ar no aquecedor.
Aquecedor de Ar, o mdulo de testes 25
Como modelo consideramos um sistema contnuo de primeira ordem com tempo

morto, descrito pela equao na forma;
o
y(t ) + y(t ) = K p u(t t m ) 4A
onde y a temperatura de sada do processo, varivel controlada, e u a perturbao

aplicada na tenso das resistncias eltricas, varivel manipulada.
A soluo da equao diferencial(4A), para uma perturbao degrau aplicada no tempo
t=0 e de amplitude A, descrita pela equao;
y (0) t tm
y (t ) = ( t tm ) 4B
y ( 0 ) + A K p ( 1 e
) t > tm
Considerando que o processo alcance o valor final com um tempo infinito (tfinal=+),
temos:
y (t final ) = y (0) + AK p K p =
( y (t final ) y (0) ) 4C
A
Atravs da equao 4B podemos escrever;
( y (t ) y (0) ) 1
ln 1 = (t t m ) t > tm 4D
AK p
Construindo o grfico ln( ) x t para a equao 4D temos uma reta com a inclinao
dada por -1/.
Com os dados dos testes, atravs da equao 4C determinamos Kp. Com a regresso
linear dos dados fornecidos pela equao 4D, calculamos o valor da constante para as
perturbaes aplicadas na varivel manipulada. O tempo morto foi determinado atravs da
observao dos dados obtidos nos testes.
O testes iniciaram sempre com o processo estabilizado no set-point de 200 C, para
ento aplicarmos a perturbao degrau. O ajuste inicial no valor do set-point e a aplicao da
perturbao, foram realizados de modo manual utilizando um voltmetro. Podemos observar,
atravs das Figuras 4.2 e 4.3, uma oscilao na varivel manipulada antes da aplicao da
perturbao, devido ao ajuste manual.
A Figura 4.2 representa um degrau de +0,48V, com tempo de amostragem Ts=15s,
aplicado aps 50 minutos do incio do teste, que levou a temperatura do processo, depois de 3
h 15 minutos, ao valor de 334 C. Obtivemos para o valor de 2400s, para Kp o valor de
1,273V/V e para tm o valor de 180s.
350 5
300
Varivel Controlada 4
250
Temperatura [ C]
Voltagem [V]
3
200
150 Varivel Manipulada

2
100
1
50
0 0
0 750 1500 2250 3000 3750 4500 5250 6000 6750 7500 8250 9000 9750 1E+0 1E+0
4 4
Tempo [s]
Figura 4.2 - Degrau +0,48V na Varivel Manipulada do

Mdulo de Testes
A segunda perturbao, exibida pela Figura 4.3, corresponde a um degrau de -0,32V,

com tempo de amostragem Ts=15s, aplicado aps 45 minutos do incio do teste. Depois de 2 h
e 15 minutos a temperatura do processo baixou para 148,7 C. Neste caso obtivemos para o
valor de 2087s, para Kp o valor de 0,902V/V e para tm o valor de 135s.
Analisando os resultados observamos uma caracterstica importante no processo. O
tempo de resposta a um degrau positivo (aquecimento) menor que o tempo de resposta a um
degrau negativo (resfriamento). Esse fato est relacionado com as resistncias de transferncia
de calor envolvidas nas duas situaes.
250 5
200 4
Varivel Controlada
Temperatura [ C]
150 3
Voltagem [V]
100 2
Varivel Manipulada
50 1
0 0
0 750 1500 2250 3000 3750 4500 5250 6000 6750 7500
Tempo [s]
Figura 4.3 - Degrau -0,32V na Varivel Manipulada do

Mdulo de Testes
Atravs da Figura 4.4, temos um corte da parede do aquecedor onde Tr representa a

temperatura da resistncia eltrica, Tw a temperatura da parede, e Ta a temperatura do ar no
interior do aquecedor.
P a re d e d o A q u e c e d o r
F lu x o d e A r
S o b re a p a re d e
(T w T r )
=
q F lu x o d e C a lo r p o r
R e s is te n c ia s a C ond uo
E l tric a s Rc
(T a T w )
q
a = Rh
F lu x o d e C a lo r p o r
C on vec o
Tr Tw
q ( Tw Tr )
= Ri
4 4 F lu x o d e C a lo r p o r
R a d ia o
a
Ta
Figura 4.4 - Representao da Transferncia de Calor no Interior do Aquecedor
Sabendo que a taxa de transferncia de calor para o ar est diretamente relacionada

com a temperatura da parede Tw, podemos considerar que a velocidade de variao da
temperatura do ar de sada do aquecedor proporcional a Tw, ou seja:
(Tsaida ) Tw

t t
Verificamos que no processo de aquecimento ocorre a elevao da temperatura Tw,
atravs da transferncia de calor por conduo e radiao das resistncias eltricas para a
parede. No resfriamento, a temperatura Tw diminui atravs da transferncia de calor por
conveco da parede para o ar.
Sendo as resistncias por conduo (Rc) e radiao (Ri) menores que a resistncia por
conveco (Rh), o fluxo de calor maior no aquecimento, propiciando a Tw uma velocidade
maior no aquecimento.
Tw Tw

t aq t resf
portanto;
Tsaida Tsaida

t aq t resf
o que implica no tempo de resposta ao aquecimento ser menor que o de resfriamento.

Outro teste de caracterizao do sistema foi um degrau na vazo de ar de entrada do
aquecedor (Figura 4.5), seguindo o mesmo padro dos testes anteriores, aps 50 minutos
aplicamos um degrau na vazo de ar abrindo a porta de sada de ar do aquecedor, diminuindo
assim a resistncia passagem do fluxo de ar e consequentemente aumentando a vazo.
Observamos que a temperatura de sada do processo estabilizou a 125 C aps 36 minutos.
Este teste foi realizado com a inteno de se comparar os dados obtidos, com os dados que
posteriormente sero fornecidos com os controladores PID e RN atuando no processo.
Os testes apresentados foram realizados mais de uma vez procurando obter dados
confiveis. Esses dados estiveram bem prximos, de um teste para outro, apresentando uma
boa repetibilidade.
250 5
200 Varivel Controlada 4

Temperatura [C]
Voltagem [V]
150 3
100 Varivel Manipulada 2
50 1
0 0
0 750 1500 2250 3000 3750 4500 5250
Tempo [s]
Figura 4.5 - Degrau Positivo na Vazo de Ar Sem Controlador

no Mdulo de Testes
4.2 Modelo para Simulao
Utilizando um sistema de 1 ordem invariante no tempo, implantamos no software de

controle um modelo para simulao do mdulo de testes. O sistema de 1 ordem utilizado
obedece a equao:
o
y(t ) + y(t ) = K p u (t t m )
com a funo de transferncia:
Y ( s) K p e tm s
G ( s) = = .
U ( s) s 1
Acoplando um Holder de ordem zero7 na varivel de entrada conforme a Figura 4.6
temos que a funo pulso de transferncia para o sistema descrita como:
Y ( z) ( z 1) G( s) ( z 1) K p e tms
H ( z) = = Z{ZOH(s).G(s)} = Z = Z
U ( z) z s z s(s 1)
logo;
7
Transforma uma amostragem discreta de pontos em uma representao contnua
( z 1) 1
H ( z) = K p Ze tm s
z s(s 1)
u(k) Holder de Ordem u(t) y(t) y(k)

G(s)
Zero
H(z)
Figura 4.6 - Amostragem de Sistemas Contnuos no Tempo
definindo;
1
a funo F ( s) =
s( s + 1)
o tempo morto tm = n .Ts onde Ts = tempo de amostragem
n = nmero de intervalos de amostragem
{ }
e sabendo que Z e nTs F ( s ) = z n F ( z ) e Z{ f ( k m)} = z m F ( z ) temos;
z (1 e )
a1 z n
Ts Ts
( z 1) n 1 e
H ( z) = K P z n = K z =
z a2
P
( z 1)( z e ) z e
Ts Ts
z
onde a1 = K P (1 e ) e a2 = e ento zY ( z ) = a1 z nU ( z ) + a 2 Y ( z ) que produz;

Ts Ts

0 kn
y ( k + 1) = a1u( k n) + a 2 y ( k ) para y( k ) = (4E)
y( k ) k > n
esse modelo no domnio do tempo na forma recursiva foi implantado no software de controle,
com os parmetros calculados para o degrau positivo (Figura 4.2). Escolhemos o degrau
positivo, porque a verificao da performance dos controladores no mdulo de testes, seria
semelhante ao teste da perturbao na vazo de ar (Figura 4.5), onde o controlador, necessita
aplicar um degrau positivo na varivel manipulada para manter o mdulo no
set-point.
5. O Controlador RN No-linear
Existem vrias maneiras de se fazer o controle de processos utilizando redes neurais

artificiais. A diferena bsica est no modo de treinamento da rede, e posteriormente como a
rede gera o valor a ser implantado no
processo.
Processo
- Na Figura 5.1a temos uma rede
Entrada
e
neural fazendo a identificao ou
Rede Neural +
modelagem de um processo, notemos
que a rede est procurando determinar
a)Modelagem/Identificao do processo
o valor de sada do processo utilizando
-
Entrada
e
os mesmos valores de entrada. O erro

produzido pela rede determinado e
Processo Rede Neural +
enviado de volta ao sistema neural,
b) Modelagem Inversa do processo

para que sejam feitas as correes de
seus pesos e, deste modo, para cada
-
e valor de entrada a rede corrige seus

Set-point
pesos e consequentemente minimiza o
Rede Neural Processo +
erro de sada.
Na modelagem inversa,
c) Controle de Processo com Rede Neural
representada pela Figura 5.1b, temos a

Figura 5.1 - Utilizao de ANN em Controle de rede neural sendo treinada para
Processos aprender o processo inverso. O
treinamento realizado, alimentando a rede com os valores de sada do processo de modo que
a mesma produza os valores de entrada. Os pesos so corrigidos atravs do erro produzido
como mostrado na figura. Este tipo de modelagem interessante para uso no controle, porque
estando a rede treinada e alimentando o valor do set-point ela deveria fornecer o valor a ser
implantado no processo. Existe muito receio em se utilizar a modelagem inversa devido a
gerao de regies de instabilidade de controle.
A representao de controle da Figura 5.1c nos mostra como a implantao do controle
atravs de redes neurais pode ser realizada. Podemos observar que a rede produz o valor a ser
implantado no processo utilizando o valor do set-point e informaes de sada do processo. A
O Controlador RN No-linear 31
sada do processo comparada com o set-point produz o erro que informado ao sistema neural
para correo dos pesos.
Neste trabalho realizamos o treinamento da rede de acordo com o mostrado na Figura
5.1a. O controle foi implementado conforme o modelo da Figura 5.2, utilizando um algoritmo
de clculo do valor da varivel manipulada baseado nas equaes das redes neurais, de acordo
com cada tipo de treinamento implantado (Captulo 3). Com o valor do set-point
determinamos o valor da varivel manipulada u , a qual enviada ao processo e rede.
Sabendo o valor da varivel desejada y e o valor estimado pela rede o determinamos o erro e,
utilizado para a correo dos pesos da rede.
S P = S e t - P o in t A L G O R IT M O u y
P R O C E S S O
-1
u = f (S P )
-
REDE NEURAL e

o = f (u) +
T R E IN A M E N T O
Figura 5.2 - Diagrama de Blocos do Controle RN No-linear
5.1 Algoritmo de Clculo da Varivel Manipulada
Estando a RN treinada espera-se que uma vez fornecido um valor para a rede esta
reproduza o resultado do processo, ou seja, a rede capaz de prever a resposta do processo a
um determinado valor de entrada. Como, o interesse que a sada do processo se mantenha no
set-point, o que precisamos descobrir qual o valor de entrada na rede que produz na sada o
set-point. Na verdade, o que estamos querendo descobrir a funo inversa da rede; tm-se o
valor de sada e precisa-se do valor de entrada.
Para o treinamento Steepest Descent, utilizando as equaes da rede, determinamos o
valor de entrada da rede xp que produz como sada o valor do set-point. Utilizamos uma RN
com funo de ativao linear na camada escondida e uma funo de ativao sigmoidal na
camada de sada, portanto, uma RN No-linear.
Sabendo que:
1 oko
oko = o
= ln (5A)
(1 + e k ) 1 oko
o k
como;
L L
N
o
k = w o o
kj
h
j + o
k = w w hji x i + hj +
i
o
kj

o
k
j j
ou seja,
L N L
o
k =
j i
w hji w koj x i + j
w koj h
j + o
k
para i=p onde p representa o neurnio da camada de entrada, que recebe o valor da
varivel manipulada a ser implantado no processo, temos;
L L N L
o
k =
j
w kjo w hjp x p +
j
i
w hji w kjo x i + j
w kjo h
j + o
k
i# p
definindo
L N L
Sk =
j i
w hji w kjo x i +
j
w kjo h
j + o
k (5B)
i p
podemos dizer que o valor de entrada da rede que produz na sada o valor do set-point
dado por:
o
S
x p = L
k k
(5C)
j
w o
kj w h
jp
Utilizando o conjunto de equaes 5A, 5B e 5C e considerando o ko = set-point

determinamos o valor a ser implantado no processo u=xp.
A equao 5A descontnua para valores de o ko iguais a 0 e 1, porque representam os
extremos da funo sigmoidal (Figura 3.2). Logo, o valor do set-point do processo controlado,
no pode estar situado nos extremos da faixa de trabalho. Esse problema facilmente
contornado por meio de um escalonamento apropriado.
No treinamento Decomposio em Valores Singulares utilizamos as equaes
definidas no item 3.3.2., para determinar o valor de entrada na rede que produz como sada o
valor do set-point.
A equao 3H define a matriz P como sendo, P=XV, logo podemos dizer que:
N
Pij = xik vkj (i=1,...,R ; j=1,...,L)
k
para i=q, onde q representa a linha da matriz P que recebe a observao do instante
atual, temos:
N
Pqj = x qk v kj ( j=1,...,L)
k
O elemento Pqj representa a ativao da camada escondida e portanto podemos dizer

que Pqj = hj . Utilizando essa definio, a equao 3L e considerando 1 neurnio na camada
de sada, temos:
L G L G N
1o = s nj ( hj ) n = s nj ( x qk v kj ) n
j n =0 j n=0 k
para k=p, onde p representa o neurnio da camada de entrada que recebe o valor da
varivel manipulada a ser implantado no processo, definimos:
L G N
1o snj ( xqp v pq + xqk vkj ) n = 0 (5D)
j n=0 k
k# p
Para determinar o valor de xqp que satisfaa a equao 5D necessitamos de um

processo iterativo de clculo. Neste trabalho foram testados vrios mtodos de clculos, sendo
que, o mtodo do ajuste de uma funo monotnica (VELOSO, 1985) apresentou melhores
resultados (item 8.2). Este mtodo possui as seguintes caractersticas:
x c1
aproxima a funo f (x) atravs de y =
c2 x + c3
utiliza trs pontos de partida (x1,y1),(x2,y2) e (x3,y3)

determina o novo valor de x como sendo:
x1 y2 y3 ( x2 x3 ) x2 y1 y3 ( x1 x3 ) + x3 y1 y2 ( x1 x2 )
xnovo = (5E)
y2 y3 ( x2 x3 ) y1 y3 ( x1 x3 ) + y1 y2 ( x1 x2 )
Utilizando o conjunto de equaes 5A,5D e 5E e considerando o ko o valor do set-point,

determinamos o valor a ser implantado na rede u=xqp.
5.1.1 Implantao do Valor da Varivel Manipulada
Suspeitando que a implantao direta do valor estimado pelos algoritmos do item 5.1,
poderia causar uma ao muito drstica do controlador, ou seja, haveria uma oscilao da
varivel manipulada muito grande e que poderia desestabilizar o controlador RN, procuramos
implantar de modo suave esse valor utilizando o esquema representado pela Figura 5.3, onde
tem-se n como o nmero de intervalos de amostragens que o processo dever demorar para
atingir o set-point.
O valor de n para o processo estudado neste trabalho, foi determinado atravs de
vrios testes simulados obser-
vando o comportamento do
Set-point
controlador RN. Um valor
n=50 foi encontrado como ti-
Valor
mo para o treinamento Steepest Atual
0 1 2 .... .... .... .... .... .... .... .... .... .... n.Ts
Descent, sendo que para o
treinamento Decomposio em
Figura 5.3 - Diagrama de Implantao do Valor Correto
Valores Singulares o valor de pela RN
n=5 apresentou melhores
resultados. Utilizamos como aproximao inicial uma relao entre a constante de tempo e o
intervalo de amostragem, n = = 2 5 , aumentando ou diminuindo gradativamente e
Ts
observando o comportamento do controlador.

Cada processo dever possuir um valor de n diferente, no sendo necessrio o
conhecimento da constante de tempo para implementar o algoritmo.
5.2 Distribuio dos Dados na Entrada
No treinamento Steepest Descent os dados de entrada do controlador RN podem ser

representados pelo vetor:
X = (u ( k ), u ( k 1), u ( k 2),..., u ( k j 1), y ( k ), y ( k 1), y ( k 2),..., y (k ( N j 1) )
onde u representa a varivel manipulada e y a varivel controlada, o ndice N

representa a quantidade total de neurnios na camada de entrada, j a quantidade de neurnios
de entrada que recebe valores da varivel manipulada, sendo N-j a quantidade de neurnios
que recebe o valor da varivel controlada. O ndice k representa o tempo de amostragem atual,
k-1 um tempo de amostragem anterior, k-2 dois tempos de amostragens anteriores, etc.
A alimentao composta de valores anteriores das variveis manipuladas e controladas,
procura fornecer rede possibilidades de aprender o tempo morto do processo.
Utilizando essa distribuio de dados de entrada consideramos, na Equao 5C, p=1,
ou seja, o valor atual da varivel manipulada introduzido no primeiro neurnio da camada
de entrada.
Para o treinamento Decomposio em Valores Singulares utilizamos uma distribuio

dos dados de entrada idntica do treinamento Steepest Descent, sendo que, a matriz de
observaes ficou distribuda da seguinte forma:
1
u (k )
1
u ( k 1) L
1
u ( k j 1)
1
y (k ) K
1
y ( k N + j + 2)
1
y ( k N + j + 1))
u 2 ( k 1) 2
u ( k 2) L
2
u ( k 1 j 1)
2
y ( k 1) K
2
y ( k N + j + 1))
2
y (k N + j )

X = M M M M M M M M
u R 1 ( k R + 2) u
R 1
( k R + 1) L u
R 1
( k R j + 1) y
R 1
( k R + 2) L y
R 1
( k R N + j + 4) y
R 1
( k R N + j + 3)
R R R R R R
u ( k R + 1) u (k R) L u (k R j ) y ( k R + 1) L y ( k R N + j + 3) y ( k R N + j + 2)
A primeira linha da matriz X representa a observao no instante atual, ou seja, a

entrada da rede no instante atual. A segunda linha representa a entrada da rede um instante
anterior, a terceira linha dois instantes anteriores e assim sucessivamente at R-1 instantes
anteriores.
A representao k, j e N obedecem o mesmo significado utilizado anteriormente para a
formao da distribuio de entrada do treinamento Steepest Descent e o ndice R representa o
nmero da observaes.
Atravs dessa distribuio de dados e com a equao 5D, consideramos p=q=1, ou
seja, o valor atual da varivel manipulada introduzido no primeiro neurnio da camada de
entrada e na primeira linha da matriz X.
6. O Software RTX
O programa RTX8 um sistema desenvolvido para a simulao e controle de

processos. Utiliza a plataforma de um processador 80486 ou superior, operando sob o sistema
MS-DOS9 Verso 3.3 ou posterior, requer o mnimo de 4 MBytes de memria RAM, monitor
padro CGA ou superior (recomendvel no mnimo VGA color), espao em disco: 2 MBytes
para o software, 360 KBytes para cada arquivo de dados na simulao e 120 KBytes para cada
arquivo dirio de dados no controle.
O sistema composto por um mdulo gerenciador, denominado Z4, que organiza as
informaes e realiza as chamadas das rotinas de execuo contnua, atravs do teclado e
pilha de execuo. A lgica de
Inicio execuo do mdulo
gerenciador pode ser vista
atravs da Figura 6.1.
Executar as
Rotinas
de Inicializao
O programa um lao
infinito, com dois conjuntos de
tarefas, cuja execuo
Teclado Rotina a
Executar as
Rotinas
condicional. O primeiro grupo
Sim Sim
Ativo ? executar ? de Atendimento do
Teclado constitudo por tarefas que
No
No
so executadas caso uma
determinada tecla seja
Executar as Disco
Rotinas
T >= Ts Sim
de Execuo
pressionada. O segundo grupo
Contnua I/O
constitudo por tarefas
No
rotineiras, cuja execuo
Executar as Vdeo disparada por um gatilho
Rotinas
da Pilha de
Execuo Controlador
Perturbao
temporizado. Sendo o tempo
de amostragem o gatilho para
as rotinas de execuo con-
Figura 6.1 - Fluxograma da Lgica de Execuo das tnua e a frequncia de
Rotinas do Mdulo Gerenciador Z4 execuo para as rotinas da
8
RTX - Real Time eXecution - Execuo em tempo real, designao que se d a um sistema que responde a um
estmulo gerado externamente dentro de um finito e especifcado atraso de tempo.
9
MS-DOS - MicroSoft Disk Operating System - Sistema operacional para microcomputadores padro IBM
desenvolvido pela MicroSoft Corporation
O Software RTX 37
pilha de execuo.
Dentre as rotinas de execuo contnua temos as rotinas de armazenamento em disco e
leituras das placas de comunicao.
As rotinas da atualizao do vdeo, do controlador e das perturbaes aplicadas ao
processo, fazem parte das rotinas da pilha de execuo.
Podemos observar que no existe um ponto de finalizao no fluxograma, o sistema
encerrado atravs de uma rotina especial, acionada via teclado, que obriga-o a cancelar todos
os procedimentos. As interligaes e os nomes das diversas rotinas que compem o sistema
podem ser vistos atravs do Anexo I.
6.1 Reformulao Inicial
O programa RTX foi inicialmente desenvolvido para o compilador FORTRAN da

MicroSoft Corporation Verso 3.34. As rotinas de comunicaes com as placas
analgicas/digitas eram escritas em linguagem ASSEMBLER e incorporadas ao software. As
telas iniciais eram em modo texto, utilizando modo grfico somente na tela de trabalho final.
O algoritmo de controle implantado era para controladores da famlia PID.
O trabalho de reformulao comeou com a mudana do sistema para o compilador
FTN77/486 da Universidade de Salford. O mesmo possui maior velocidade de compilao e
constri sistemas com capacidade de endereamento de toda a memria disponvel, no
limitados aos 640 Kbytes de memria convencional.
Optamos pelo compilador FTN77/486, no desenvolvimento do software RTX, porque
ele apresenta vrias facilidades e opes de trabalho(item 6.1.1).
A etapa seguinte, foi a construo de novas rotinas para as placas analgicas/digitais
em linguagem FTN77/486, descritas no item 6.3.3, sem a necessidade da interface em
ASSEMBLER.
Incorporamos ao software o algoritmo de controle das redes neurais artificiais, bem
como, dois tipos de treinamento, Steepest Descent e Decomposio em Valores Singulares.
Com rotinas desenvolvidas para o tratamento de telas, o software passou a oferecer um
novo visual, uma interface grfica com o usurio.
6.1.1 Caractersticas do Compilador FTN77/486
As necessidades de hardware para a execuo do compilador FTN77/486 so:

processador 80486 ou superior, com disco rgido.
O Software RTX 38
mnimo 1MByte de memria RAM. Contudo, recomendado uma

memria estendida adicional, pois os programas no esto limitados aos
640 KBytes de memria convencional.
sistema operacional MS-DOS ou PC-DOS verso 3.3 ou superior.
As principais caractersticas do compilador so:

alta velocidade de compilao e linkedio. O FTN77/486 desenvolveu
uma velocidade de compilao de 13000 linhas por minuto em um
computador IBM PS/2 Model 80. O linkeditor, LINK77, igualmente
rpido.
os programas podem ser compilados em modo check, modo otimizao
local( padro), ou modo otimizao global.
diagnsticos em tempo de compilao. As mensagens de erros em tempo
de compilao so escritas em Ingls, referenciando nomes, endereos,
etc., como apropriado. Mensagens de erros em outras lnguas, como
Francs ou Alemo, podem ser construdas.
diagnsticos em tempo de execuo. Checagens opcionais em tempo de
execuo esto disponveis para tamanhos de arrays, aritmtica overflow,
consistncia de argumentos de rotinas, variveis indefinidas, etc.
linguagem ASSEMBLER in-line. O FTN77/486 suporta facilidades
CODE/EDOC de instrues assembler para processadores 80486 em
modo protegido 32-bit.
extenses de linguagem. Entre as extenses disponveis esto as
declaraes DO/ENDDO e DO WHILE, ENCODE/DECODE e dados
Hollerith. Compilao com cdigos de pesquisa condicionais esto
disponveis utilizando-se CIF, CELSE e CENDIF. Declaraes e tipos de
variveis usadas foram estendidas para INTEGER*1, INTEGER*2,
INTEGER*4, REAL*4, REAL*8 (DOUBLE PRECISION),
COMPLEX*8, COMPLEX*16, LOGICAL*1, LOGICAL*2 e
LOGICAL*4.
O Software RTX 39
6.2 Transferncia de Informaes Entre as Rotinas
A transferncia de dados entre os diversos mdulos realizada atravs de comandos

COMMON, inseridos nos arquivos com extenso INC. Estes arquivos so adicionados aos
mdulos atravs de instrues INCLUDE.
A concepo do sistema idealizada de modo que qualquer rotina escreva ou leia na
memria informaes das diversas variveis (Figura 6.2). A inicializao dessas variveis
realizada por uma rotina de configurao, denominada CFGRED.
COMMON ROTINAS
Variveis Rotina
de com o
Memrias comando
INCLUDE
Figura 6.2 - Esquema de Transferncia de Informaes
entre os Mdulos do RTX
6.3 Rotinas de Inicializaes
Essas rotinas visam realizar tarefas iniciais que no precisam ou no podem ser
repetidas no looping do software RTX( ver Figura 6.1). Dentre essas tarefas podemos
destacar, a atribuio de valores iniciais s variveis das diversas rotinas do sistema e gerao
de arquivos de armazenamento de dados.
6.3.1 Leitura das Configuraes Iniciais
A rotina CFGRED realiza a leitura dos dados iniciais informados atravs de um

arquivo de configurao. O arquivo default PADRAO.DAT, podendo ser informado outro
nome durante a execuo.
Aps a leitura dos dados a rotina realiza a verificao de consistncia dos mesmos,
verificando se no foi informado algum dado que pode abortar o software, como por exemplo,
o nmero de neurnios da camada de entrada da rede ser negativo ou nulo.
Atravs do Anexo II podemos verificar as variveis necessrias para a configurao
inicial do software. Essas variveis so inicializadas utilizando um arquivo em formato
O Software RTX 40
ASCII10, que pode ser alterado por qualquer editor de textos. Assim, temos a flexibilidade
para mudar as configuraes do sistema antes da sua execuo.
6.3.2 Inicializao do Sistema
Os dados e parmetros utilizados pelo programa so inicializados pela rotina

INICSIST. A rotina procura definir os parmetros principais do software, como tempo de
amostragem, nmero de registros do arquivo de armazenamento de dados e pesos iniciais da
rede para o treinamento Steepest Descent.
Atravs de uma vetor denominado IAUTO, interno na rotina INICSIST, definimos as
rotinas que fazem parte das rotinas de execuo continua. Essas rotinas foram numeradas de
51 a 99 com o nome composto da forma L+(nmero da rotina). Na posio 1 do vetor
IAUTO definimos a quantidade de rotinas de execuo contnua a serem processadas, e nas
demais posies o nmero dessas rotinas. Neste trabalho utilizamos a seguinte definio para
IAUTO:
IAUTO(1) = 3 quantidade de rotinas de execuo contnua

IAUTO(2) = 51 rotina L51: leitura das placas A/D e D/A
IAUTO(3) = 52 rotina L52: armazenamento de dados em disco
IAUTO(4) = 53 rotina L53: treinamento da RN
Para a gerao do arquivo de armazenamento de dados a rotina INICSIST faz chamada

a rotina DIARIO (Anexo I), que gera o nome do arquivo como sendo;
DTddmmaa.???, onde DT = identifica como arquivo de dados

dd = dia, mm = ms e aa = ano da amostragem
???= extenso que varia de 001 a 999
A rotina ABRDAT utiliza o nome definido pela DIARIO para a gerao de um arquivo
de armazenamento com a seguinte estrutura;
Registro 01 : Nmero de Registros | Hora Inicial | Tempo Amostragem

Registro 02 : Validade dos Canais [1 a 8=Entrada 9 a 16=Saida] [0=Invlido 1=Vlido]
Registro 03 : Valor inferior do Range dos Canais [Unidade do Usurio]
10
ASCII - American Standart Code International Interchange - consiste em uma tabela americana, onde cada
caracter recebe um cdigo padro, de intercmbio internacional.
O Software RTX 41
Registro 04 : Valor superior do Range dos Canais [Unidade do Usurio]

Registro 05 : Valores de entrada[1 a 8] e Valores de Sada[9 a 16]
Registro 06 : Valores de entrada[1 a 8] e Valores de Sada[9 a 16]
. . . .
. . . .
. . . .
Registro MxReg : Valores de entrada[1 a 8] e Valores de Sada[9 a 16]
onde;
Nmero de Registros a quantidade de registros gravados no arquivo

Hora Inicial a hora de incio de gravao dos dados
Tempo de amostragem o intervalo de amostragem do processo
Validade dos canais define quais os canais que possuem valores significativos
Valor inferior e superior do range corresponde ao menor e maior valor possvel
dos dados dos canais gravados em unidade do usurio. Essa unidade corresponde
ao sistema mtrico ou ingls, pois o software internamente utiliza um
escalonamento apropriado para esses valores
Valores de entrada e sada representam os valores das variveis a cada instante
amostrado
MxReg a quantidade mxima de registros a serem gravados no arquivo de
dados. Esse valor calculado atravs da razo entre o tempo mximo de gravao
XRG(97) e o intervalo de amostragem IPAR(04), ambos definidos no arquivo de
configurao PADRAO.DAT (Anexo II).
A inicializao dos pesos da rede realizada atravs da rotina INICBPN, utilizando a

funo de gerao de valores pseudo-aleatrios RANDOM().
6.3.3 Inicializao das Placas A/D e D/A
Os conversores de sinais analgico/digitais e digitais/analgicos, utilizados neste

trabalho, so de fabricao da DATA TRANSLATION INCORPORATION, suas
caracterstica esto apresentadas na Tabela 6.1.
O Software RTX 42
Modelo Tipo Canais Entrada Sada Interface

Range: 0 a 4095 Compatvel IBM PC/XT/AT
DT2814 A/D 16 Range: 1 a 5 Volt Endereos: Endereo Base: 200H a 3FEH
Base+0: 2 registros de 8-Bit 220H(default)
Base+1: 1 registro de 8-Bit IRQs: 3, 4, 5, 6 ou 7 (Jumpers)
Range: 0 a 4095 Compatvel IBM PC/XT/AT
DT2815 D/A 8 Endereos: Range: 4 a 20 mA Endereo Base: 200H a 3FEH
Base+0: 2 registros de 8-Bit 224H(default)
Base+1: 1 registro de 8-Bit IRQs: no utiliza
Tabela 6.1 - Caractersticas das Placas A/D e D/A

Essas placas so inicializadas para uso, dentro do software RTX, atravs da rotina
INICDA.
A inicializao da placa A/D realizada escrevendo o valor 0 (zero) no registro de
controle, localizado no endereo base (220H). O registro de controle composto de 8-Bits
descritos como:
BIT 7 6 5 4 3 2 1 0
FUNO F2 F1 F0 ENB C3 C2 C1 C0
Tabela 6.2 - Registro de Controle da Placa A/D
onde;
F2, F1 e F0 - especificam o fator decimal de diviso da frequncia base de operao
da placa, conforme a Tabela 6.3. A frequncia base definida atravs de jumpers.
Divisor Frequncia
F2 F1 F0 Selecionada
0 0 0 Frequncia Base
0 0 1 Frequncia Base/10
0 1 0 Frequncia Base/100
0 1 1 Frequncia Base/1k
1 1 0 Frequncia Base/1M
1 1 1 Frequncia Base/10M
Tabela 6.3 - Fatores Decimais do Registro
de Controle da Placa A/D
O Software RTX 43
ENB - especifica o uso do fator decimal de diviso de frequncia no estado 1. No

estado 0 desabilita o uso do fator decimal de diviso.
C3, C2, C1 e C0 - selecionam um dos 16 canais disponveis na placa para a corrente
converso A/D. A configurao para seleo segue a Tabela 6.4.
Configurao dos Bits Canal
C3 C2 C1 C0 Selecionado
0 0 0 0 0
0 0 0 1 1
0 0 1 0 2
0 0 1 1 3
0 1 0 0 4
0 1 0 1 5
0 1 1 0 6
0 1 1 1 7
1 0 0 0 8
1 0 0 1 9
1 0 1 0 10
1 0 1 1 11
1 1 0 0 12
1 1 0 1 13
1 1 1 0 14
1 1 1 1 15
Tabela 6.4 - Configurao dos Bits para
Seleo de Canais da Placa A/D
A inicializao da placa D/A realizada atravs de duas operaes:

reset da placa - escrever qualquer valor no registro de status
inicializao de canais - escrever no registro de dados o nmero de canais a serem
utilizados pela placa
O registro de status da placa, localizado no endereo base+1 (225H), possui a seguinte
estrutura:
BIT 7 6 5 4 3 2 1 0
FUNO X S2 S1 S0 X FO IBF X
Tabela 6.5 - Estrutura do Registro de Status da Placa D/A
onde;
X - bit no utilizado
O Software RTX 44
S2 - estado 1 indica que ocorreu um erro durante o teste de RAM do software

interno da placa. Estado 0 indica que no houve erros.
S1 - estado 1 indica que ocorreu um erro durante o teste de ROM do software
interno da placa. Estado 0 indica que no houve erros.
S0 - estado 1 indica que a placa aguarda no registro de dados o valor superior de
um byte. Estado 0 indica que aguarda o valor inferior de um byte.
FO - estado 1 indica que a placa est pronta para a inicializao de canais. Estado 0
indica que a placa no est preparada para a inicializao.
IBF - estado 1 indica que o buffer de entrada est cheio. Estado 0 indica buffer
vazio.
O reset da placa realizado atravs da verificao do bit 2 (FO) do registro de status.

Estando FO no estado 0 a placa no pode ser inicializada. Escrevemos ento, qualquer valor
neste registro e verificamos novamente o estado de FO. Esta situao se repete at que o
estado de FO tenha valor 1.
Aps o reset da placa a primeira informao escrita no registro de dados considerada
como o nmero de canais a serem utilizados, sendo as informaes seguintes consideradas
dados para o processo.
O registro de dados esta localizado no endereo base (224H) e recebe a inicializao
de canais atravs da estrutura:
BIT 7 6 5 4 3 2 1 0
FUNO X X X N1 N0 D2 D1 D0
Tabela 6.6 - Estrutura do Registro de Dados da Placa D/A
onde;
N1 e N0 - seleo de um dos quatros programas residentes na placa D/A
D2, D1 e D0 - especifica o nmero de canais a serem utilizados pela placa segundo a
Tabela 6.7.
Estando as duas placas inicializadas, o software RTX pode receber e enviar

informaes para o processo.
O Software RTX 45
Configurao dos Bits Canais

D2 D1 D0 Disponveis
0 0 0 0
0 0 1 0a1
0 1 0 0a2
0 1 1 0a3
1 0 0 0a4
1 0 1 0a5
1 1 0 0a6
1 1 1 0a7
Tabela 6.7 - Configurao dos Bits para Definio
do Nmero de Canais da Placa D/A
6.3.4 Inicializao do Controlador PID
O controlador PID quando colocado em atividade, necessita das constantes do

algoritmo da velocidade d0, d1, d2 e c1 (Captulo 2). Essas constantes so determinadas
atravs da rotina TUNE_PID, utilizando os parmetros do processo; constante de tempo,
constante de proporcionalidade e tempo morto.
A rotina TUNE_PID capaz de ajustar, para processos de 1 ordem, controladores da
famlia PID, dependendo do estado da varivel IDATAR(28), ou seja:
IDATAR(28) = 0 sem controlador

IDATAR(28) = 1 Rede Neural
IDATAR(28) = 2 PID
IDATAR(28) = 3 PI
IDATAR(28) = 4 P
IDATAR(28) = 5 PD
Os valores das constantes calculadas, dos parmetros utilizados e o tipo de controlador,

so armazenados em disco pela rotina com o nome de PID.ASC, conforme podemos observar
no Anexo I.
6.3.5 Condies Operacionais de Partida
O software RTX possui dois modos de partida definidos como partida via RTX e pr-
partida. A escolha realizada atravs das teclas F1 e F2 como mostrado na Figura 6.3.
Na partida via RTX, o software iniciado com os valores dos canais e do set-point
definidos no arquivo PADRAO.DAT (Anexo II).
O Software RTX 46
Figura 6.3 - Tela de Opes de Partida do Software RTX
A pr-partida foi construda com a finalidade de testar a comunicao entre o

computador e o processo. Podemos alterar os valores iniciais dos canais de entrada e sada, e
posteriormente, enviar ou receber essas informaes. A Figura 6.4 mostra a tela de trabalho
do software operando na pr-partida.
A rotina responsvel pela escolha do tipo de partida e dos valores de partida
denominada STARTUP.
Figura 6.4 - Tela de Pr-Partida do Software RTX

O Software RTX 47
6.4. Rotinas de Execuo Atravs de Teclas Especiais
Atravs do uso de teclas especiais, no software RTX, podemos solicitar que seja
executada uma determinada rotina. As teclas e suas respectivas rotinas so pr-definidas na
montagem do software.
Os nomes das rotinas a serem executadas pelas teclas especiais so iguais s teclas,
facilitando a localizao, como por exemplo, as teclas CTRL+F10 fazem chamada rotina
CTRLF10.
As opes disponveis, em termos de teclas especiais, so mostradas na tela de trabalho
do software conforme a Figura 6.5.
6.4.1 As Tecla F1 a F10
As opes oferecidas atravs do conjunto de teclas F1 a F10 so:

F1 - Ativa e desativa a possibilidade de utilizao do teclado no software
F2 - Encerra a execuo do software, armazenando os dados finais em disco e
devolvendo a tela para modo texto.
F3 - Exibe informaes atuais nos canais de entrada e sada do processo
F4 - Ativa e desativa a atuao de um controlador (RN ou da famlia PID) no
processo
F5 - Aplica uma perturbao DEGRAU no processo utilizando a configurao
definida no arquivo de dados DEGRAU.DAT (Anexo III)
F6 - Aplica uma perturbao PULSO no processo utilizando a configurao
definida no arquivo de dados PULSO.DAT (Anexo III)
F7 - Aplica uma perturbao SENOIDE no processo utilizando a configurao
definida no arquivo de dados SENO.DAT (Anexo III)
F8 - Aplica uma perturbao PRBS no processo utilizando a configurao definida
no arquivo de dados PRBS.DAT (Anexo III)
F9 - Desativa qualquer perturbao aplicada no processo
F10 - Ativa e desativa a atuao do controle do processo pela RN
6.4.2 A Tecla CTRL
A tecla CTRL acionada com as teclas F1 a F10 formam o segundo conjunto de opes
do software RTX. Esse conjunto pode ser resumido como:
CTRL + F1 - Grava a tela do sistema atual em arquivo formato PCX. Opo
usada para documentar o sistema
O Software RTX 48
CTRL + F2 e F3 - No utilizadas
CTRL + F4 - Eleva o valor do set-point do processo a um valor acima do
atual. Os valores so pr-definidos no arquivo de configurao PADRAO.DAT
CTRL + F5 - No utilizada
CTRL + F6 - Ativa uma perturbao de SEQUNCIA DE PULSOS no
processo
CTRL + F7 e F8 - No utilizadas
CTRL + F9 - Ativa e desativa o treinamento contnuo da Rede Neural
CTRL + F10 - Atualiza os pesos da Rede Neural com valores previamente
gravados em um arquivo padro. Utilizado somente no treino Steepest Descent
Figura 6.5 - Tela de Trabalho do Software RTX
6.4.3 A Tecla ALT
A tecla ALT aliada s teclas F1 a F10 formam o terceiro conjunto de opes, de rotinas
de execuo atravs do teclado, no software RTX. As opes disponveis so:
ALT + F1 - Troca o tipo de treino. Alterna entre Steepest Descent e
Decomposio em Valores Singulares.
ALT + F2 a F3 - No utilizadas
O Software RTX 49
ALT + F4 - Diminui o valor do set-point do processo a um valor abaixo do

atual. Os valores so pr-definidos no arquivo de configurao PADRAO.DAT
ALT + F5 a F8 - No utilizadas
ALT + F9 - Zera a soma do erro mdio quadrado
ALT + F10 - Grava os pesos em uso atualmente pela rede em um arquivo
padro.
6.5 Rotinas de Execuo Contnua
O grupo das rotinas de execuo contnua composto por todos os procedimentos que
esto diretamente ligados ao tempo de amostragem, ou seja, devem ser executados aps
decorrido um intervalo de amostragem. Neste trabalho, fazem parte desse grupo as rotinas de
entrada e sada de dados, armazenamento de dados em disco e treinamento da RN.
6.5.1 Entrada e Sada de Dados
A rotina L51 realiza o gerenciamento das entradas e sada de dados. Conforme o

Anexo I, essa rotina faz chamada as rotinas AD e DA que efetuam, respectivamente, a leitura
e o envio de dados atravs do canal solicitado por L51.
Sendo o range de trabalho das variveis internas do software 0 a 5 (Volt) e das placas
de converso 0 a 4095, houve a necessidade de transformao, na recepo e no envio de
valores.
A leitura de um nico canal realizada vrias vezes, sendo utilizado o valor mdio das
leituras como valor de entrada. O objetivo minimizar os erros produzidos pelas
interferncias externas (rudos). A quantidade de leituras de um nico canal determinada
pela varivel IDATAR(32), definida no arquivo PADRAO.DAT (Anexo II).
Para realizarmos a leitura do valor de um canal na placa A/D, primeiramente
fornecido no registro de controle o nmero do canal a ser lido (Tabela 6.2). Aps, feita a
leitura no registro de dados de dois registros de 8-Bits conforme a Tabela 6.8a e 6.8b.
BIT 7 6 5 4 3 2 1 0
FUNO D11 D10 D09 D08 D07 D06 D05 D04
a) 1 Leitura - Byte Superior
BIT 7 6 5 4 3 2 1 0
FUNO D03 D02 D01 D00 0 0 0 0
b) 2 Leitura - Byte Inferior
Tabela 6.8 - Registro de Dados da Placa A/D
O Software RTX 50
onde;
D11 a D00 - representam o valor de entrada em formato binrio (12-Bits)
Fazendo a converso do valor lido, para formato decimal, temos o valor de entrada do
canal especificado.
O envio de valores atravs da placa D/A realizado mediante o preenchimento do
registro de dados, no endereo base (224H), com dois valores de acordo com a Tabela 6.9a e
6.9b.
BIT 7 6 5 4 3 2 1 0
FUNO D11 D10 D09 D08 D07 D06 D05 D04
a) 1 Valor Enviado - Byte Superior
BIT 7 6 5 4 3 2 1 0
FUNO D03 D02 D01 D00 C2 C1 C0 X
b) 2 Valor Enviado - Byte Inferior
Tabela 6.9 - Registro de Dados da Placa D/A
onde;
D11 a D00 - representam o valor de sada em formato binrio (12-Bits)
C2, C1 e C0 - nmero do canal de sada a ser utilizado (semelhante Tabela 6.7)
O teste para verificar se a placa pode receber o valor de sada, superior ou inferior,
realizado atravs do bit 4 do registro de status (Tabela 6.5).
6.5.2 Armazenamento de Dados em Disco
Como visto no item 6.3.2, a rotina DIARIO cria um arquivo de dados, com uma
estrutura que preenchida pela rotina de execuo contnua L52. A finalidade do arquivo j
estar criado, para agilizar o software no armazenamento dos dados, pois, o preenchimento
mais rpido do que a incluso de registros.
A rotina L52 utiliza um buffer de memria, variveis XVIN e XVOUT, para
armazenamento temporrio dos dados a serem gravados em disco. A gravao realizada pela
rotina GRAVADADOS quando o buffer est cheio, ou se o operador solicitou o encerramento
do software. O tamanho do buffer, em termos de registros, definida no arquivo
PADRAO.DAT na varivel IPAR(07).
Os arquivos de dados so gerados de acordo com a data da execuo do programa,
sendo criados automaticamente com a mudana de dia.
O Software RTX 51
6.5.3 Treinamento da Rede Neural
Para treinamento da rede utilizamos a rotina L53, que realiza chamadas a diversas
rotinas dependendo do tipo de treinamento. A rotina L53 representa a implantao no
software das equaes apresentadas no Captulo 3.
Durante o treinamento Steepest Descent., a rotina L53 atualiza os dados da camada de
entrada da rede, os pesos atravs da rotina BACKWARD e estima o valor de sada com a
rotina FORWARD.
No treinamento Decomposio em Valores Singulares chamada a rotina
GERAR_AB que monta a matriz de observaes, realiza a ACP e define as matrizes A e B,
utilizadas pela rotina GERAR_WA para determinar os coeficientes da polinomial
transformados. Finalmente a rotina GERAR_Y utilizada para determinar o valor de sada da
rede.
6.6 Rotinas da Pilha de Execuo
A pilha de execuo representa um conjunto de rotinas que so executadas durante um

certo perodo ou com uma frequncia definida. Por exemplo, uma rotina que aplica uma
perturbao no processo deve ser executada durante um tempo pr-definido, sendo cancelada
sua execuo aps esse tempo. Essas rotinas foram numeradas de 100 a 999 com o nome
composto da forma L+(nmero da rotina).
Uma matriz de frequncia denominada IFRQ, representa internamente no software, a
pilha de execuo (Tabela 6.10). Definida como uma matriz de 30 linhas e 33 colunas
possvel programar 30 frequncias diferentes com 30 rotinas cada uma.
Nmero de
Contador Frequncia Rotinas vlidas 1 Rotina a 2 Rotina a . . .. . 30 Rotina a
CT FQ NR Executar Executar Executar
Colunas 1 2 3 4 5 ..... 30
Linhas
1 CT1 FQ1 NR1 R1,1 R1,2 ..... R1,30

2 CT2 FQ2 NR2 R2,1 R2,2 ..... R2,30
. . . . . . . .
. . . . . . . .
30 CT30 FQ30 NR30 R30,1 R30,2 ..... R30,30
Tabela 6.10 - Pilha de Execuo de Rotinas do Software RTX
O Software RTX 52
As NRi rotinas de uma linha, so executadas com a frequncia FQi, definida na

segunda coluna. Primeiramente o contador CTi, da primeira coluna, inicializado com FQi, e
a cada intervalo de amostragem ele decrescido de uma unidade. Quando o valor desse
contador igual a zero, as rotinas vlidas na linha comeam a ser executadas.
As operaes com a matriz de frequncia so realizadas atravs das rotinas FRQPOE,
que insere uma rotina na matriz, e FRQSAI, que retira uma rotina da matriz.
6.6.1 Atualizao dos Dados em Vdeo
A tela base de trabalho do software RTX contendo os menus, os eixos dos grficos ,
mensagens e contornos, construda pela rotina L101 e armazenada em memria na varivel
TELA_BASE. Atravs de uma varivel (IDATAR(40)) identificamos a ltima rotina que
alterou o vdeo, verificando assim, a necessidade de restaurao da tela base de trabalho
atravs da varivel de memria.
A tela de trabalho dividida em trs regies distintas, rea de menus, rea de dados e
informaes e rea de grficos (Figura 6.5).
A rea de menus informa as teclas de opes que o operador possui para interferir na
execuo do sistema. Para que o menu possa ser utilizado, primeiramente devemos ativar o
teclado atravs da tecla F1.
A rea de dados e informaes o local onde dados quantitativos so mostrados, so
eles:
LINHA 1 - Data e Hora da execuo do sistema
LINHA 2 a 4 - Valores atuais das variveis do processo que esto sendo construdos os
grficos na rea de grficos bem como seu range
LINHA 5 - Indica o nmero de registros de dados armazenados no buffer que sero
transferidos para disco. O quantidade definida no arquivo PADRAO.DAT
LINHA 6 - Nmero de registros j gravados em disco
LINHA 7 - Tempo decorrido, em segundos, desde o incio da execuo do sistema
LINHA 8 - Quantidade de pontos plotados nos grficos
LINHA 9 - Valor do erro mdio quadrado da varivel controlada em relao ao
set-point durante a aplicao de uma perturbao
LINHA 10 - Controlador em atividade, as opes so PID e BPN
LINHA 11 - Perturbao aplicada DEGRAU, PULSO, SENOIDE, PRBS ou
SEQNCIA DE PULSOS
A rea de grficos a regio da tela onde so construdos no mximo trs grficos de

variveis importantes do processo. A deciso de quais variveis sero visualizadas em
O Software RTX 53
grficos deve ser tomada antes da inicializao do sistema, bem como, os ttulos e rtulos
dessas variveis (lado superior esquerdo dos grficos). Esses dados so fornecidos atravs do
arquivo PADRAO.DAT
O valor do set-point ou os valores de equilbrio das variveis so representadas nos
grficos por uma linha horizontal.
Existem dois conceitos dentro do software quanto apresentao de informaes no
vdeo, a tela absoluta e a tela relativa.
A tela absoluta representa a situao na qual nenhuma rotina pode escrever no vdeo.
Sendo que, somente a rotina que provocou essa situao pode revert-la.
A tela relativa a situao na qual nenhuma rotina pode escrever em vdeo durante um
certo perodo, ou seja, aps esse tempo qualquer rotina pode manipular o vdeo. As rotinas
que solicitam a tela relativa implementam na varivel XDATAR(02) o tempo em que a tela
dever ficar inalterada. O teste de estado da tela realizado por todas as rotinas que
necessitam escrever em vdeo. Existe uma rotina lgica chamada TESTVID para essa
finalidade. Essa rotina utiliza sinalizadores (flags) definidos como:
Tela Absoluta KFLAG(41) = 1 ativada

KFLAG(41) = 0 desativada
Tela Relativa KFLAG(42) = 1 ativada

KFLAG(42) = 2 desativada
6.6.2 Controlador PID
Utilizando os dados gerados pela rotina de inicializao TUNE_PID (item 6.3.4) a

rotina de controle L108 determina o valor da varivel manipulada a ser implantada no
processo.
Na verdade, a rotina L108 a implantao do algoritmo da velocidade descrito no
Captulo 2. Essa rotina se auto-retira da pilha de execuo caso a varivel IDATAR(19) no
possua indicao de controladores da famlia PID em atuao, conforme descrito no item
6.3.4.
6.6.3 Controlador RN
O controle pela RN realizado atravs da rotina L106, onde implantamos o algoritmo

descrito no item 5.1, para os dois tipos de treinamentos. Esse algoritmo, com funo de
ativao sigmoidal na camada de sada, produz valores de sada dentro do range de 0 a 1 (ver
O Software RTX 54
item 3.2). Como as variveis internas no software trabalham com range de 0 a 5, essa rotina
alm de calcular o valor de sada da rede, realiza o escalonamento apropriado.
A rotina L106 se auto-retira da pilha de execuo caso a varivel IDATAR(11) no
possua valor igual a 1. Essa varivel indica se a rede est ativada ou no.
6.6.4 Perturbaes aplicadas
A solicitao para a aplicao de uma perturbao no processo realizada pelo

operador atravs do teclado. A tecla pressionada chama a rotina que inclui na pilha de
execuo, o procedimento que introduz a perturbao.
Cada perturbao aplicada possui um arquivo de configurao em formato ASCII
(Anexo III). Nestes arquivos esto definidos os parmetros necessrios para a aplicao da
perturbao. A leitura destes arquivos realizada pela rotina CNFPERT.
Todas as rotinas de aplicao de perturbaes se auto-retiram da pilha de execuo
aps decorrido o tempo de aplicao, ou se o operador cancelou a mesma.
O estado do sinalizador de perturbao, as rotinas utilizadas e o arquivo de
configurao correspondente, podem ser verificados atravs da Tabela 6.11.
Perturbao Sinalizador Rotina de Arquivo de

Aplicao Configurao
DEGRAU IDATAR(20)=1 L112 DEGRAU.DAT
PULSO IDATAR(20)=2 L113 PULSO.DAT
SENIDE IDATAR(20)=3 L104 SENO.DAT
P.R.B.S. IDATAR(20)=4 L105 PRBS.DAT
SEQUNCIA DE PULSOS IDATAR(20)=5 L103 PULSOC.DAT
Tabela 6.11 - Rotinas e Arquivos de Configuraes das Perturbaes Aplicadas
6.7 Rotinas de Apoio
As rotinas que no foram classificadas nos itens 6.3 a 6.6, fazem parte do grupo
denominado rotinas de apoio. Essas rotinas realizam trabalhos especiais, como atualizar o
grfico das variveis no vdeo, definir cores para o software, desenhar telas iniciais do
sistema, etc.
O Software RTX 55
A rotina definida como GRAFVID no Anexo I, na verdade um conjunto de rotinas de

apoio para manuseio da tela em modo grfico. Essas rotinas esto agrupadas em um arquivo
chamado GRAFVID.FOR. As rotinas que compem esse arquivo so:
TIPOVIDEO - define se o tipo de vdeo utilizado CGA, EGA ou VGA. Faz a

leitura do arquivo CORES.DAT , que define as cores a serem
utilizadas no sistema
TESTVID - testa o modo de vdeo, tela relativa ou tela absoluta
LINHA - desenha uma linha no vdeo nas coordenadas e cores definidas
MSG - escreve uma mensagem no rodap das telas iniciais
ALERTA - escreve mensagens no rodap da rea de dados da tela de trabalho
DISPSTR - escreve uma STRING na tela nas coordenadas e cores definidas
RETANGULO - desenha um retngulo na tela nas coordenadas definidas. O
retngulo pode ser preenchido ou vazado
SAVESCREEN - salva uma regio da tela em uma varivel de memria
RESTSCREEN - restaura uma regio da tela a partir de uma varivel de memria
CLEARSCREEN - limpa uma regio da tela com a cor definida
SAVESCREENPCX - salva a tela de trabalho do software em arquivo formato PCX
A funo TESTVID a primeira rotina a ser executada pelo software, deste modo, o
arquivo das cores (Anexo III) lido e as cores definidas so transferidas para a varivel COR.
Para desenho dos grficos no vdeo utiliza-se a rotina de apoio SPLOT. Essa rotina
verifica atravs do sinalizador KFLAG(02) se deve ser construdo todo o grfico solicitado,
ou se apenas deve-se fazer a incluso do ltimo valor lido ou enviado. A construo total do
grfico necessria quando alguma rotina estampa em vdeo, informaes que se sobrepem
aos grficos.
7. Testes de Confiabilidade
Procurando estabelecer a confiana no software RTX, nas conexes do mdulo prtico,

no algoritmo da RN e no controlador PID ajustado, realizamos diversos testes. Cada teste , em
particular, visou uma parte do sistema ou esquema de controle montado.
7.1 Software RTX
O software RTX foi modificado da verso original com reformulao de vrias rotinas,
como especificado no Captulo 6. Procurando testar as mudanas, realizamos testes com sua
tela de pr-partida (Figura 6.4), a qual oferece a possibilidade de enviar um valor para o
processo e posteriormente ler o valor enviado. Deste modo, testamos as converses de sada e
de entrada de dados no software, bem como, a comunicao entre o computador e mdulo de
testes.
7.2 Sintonia do Controlador PID
Utilizando os resultados dos testes de caracterizao, demonstrados no Captulo 4, para

um sistema de 1 ordem, descrito pela Equao 4A, com =2400s , Kp =1,273V/V e tm =180s
ajustamos um controlador do tipo PID na forma da Equao 2J.
Com o software RTX em modo simulao e utilizando a Equao 4E para representar
o processo, realizamos teste de ajustes, representado pela Figura 7.1, onde o controlador PID
ajustado, procura manter a temperatura do processo no valor do set-point de 200 C com um
tempo de amostragem Ts=15s. Inicialmente o controlador alterou a varivel manipulada para
um valor elevado de modo que a temperatura do processo aumentasse, como era de se esperar.
Monitorando a varivel manipulada o controlador mostrou-se eficiente, conduzindo o
processo ao set-point.
Aps o sistema permanecer em equilbrio, aplicamos um degrau na varivel manipula
de +0,60V durante 7200s. Observamos uma atuao satisfatria do controlador conseguindo
amortecer a perturbao aplicada ao sistema conduzindo-o ao seu set-point. Assim,
consideramos ajustado o controlador PID e preparado para controlar o aquecedor de ar.
Testes de Confiabilidade 57
Figura 7.1 Teste de Ajuste do Controlador PID
7.3 Algoritmo da RN
Para o teste de confiabilidade do algoritmo da rede neural e os dois tipos de

treinamento implantados, utilizamos uma funo senoidal de teste.
A varivel IDATAR(01) define no software RTX a equao a ser utilizada para
simulao, ou seja;
IDATAR(01) = 0 define a utilizao do processo da Equao 4E

IDATAR(01) = 1 define a utilizao da senide de teste
Obtivemos para o treinamento Steepest Descent o resultado apresentado na Figura 7.2,

onde observamos que a rede conseguiu aprender a funo senoidal de modo satisfatrio. Os
parmetros utilizados para esse teste foram os seguintes:
2 (dois) neurnios na camada de entrada da rede

10 (dez) neurnios na camada intermediria (escondida)
1 (um) neurnio na camada de sada
passo de aprendizado =0,001
amplitude da senide 0,5 Volt

perodo da senide 40
Figura 7.2 - Teste do Ajuste da RN para o Treinamento

Steepest Descent
O treinamento Decomposio em Valores Singulares apresentou resultados

semelhantes ao treinamento Steepest Descent como podemos observar na Figura 7.3. Existe
um tempo inicial para que a rede produza o primeiro valor aproximado. Este tempo devido
ao fato que precisamos preencher a janela de observaes para poder ento estimar o primeiro
valor.
Utilizamos os parmetros listados a seguir para elaborao deste teste.
2 (dois) neurnios na camada de entrada

1 (um) neurnio na camada de sada
polinomial de grau 2 (dois) para aproximao da funo sigmoidal
50 (cinquenta) observaes para treino
Os neurnios da camada intermediria so determinados atravs da ACP realizada a

cada novo treinamento da rede. Como o treinamento neste caso foi contnuo, a cada valor
Figura 7.3 Teste do Ajuste da RN para o Treinamento

Decomposio em Valores Singulares
estimado pela rede o algoritmo determinou o melhor nmero de neurnios. Esta informao
interna do software no estando disponvel ao usurio.
Com esses resultados consideramos os algoritmos de treinamentos da rede neural
prontos para serem aplicados no modelo de controle a ser implantado no mdulo de testes, ou
seja, as equaes implantadas no software RTX estavam corretas e confiveis.
8. Treinamento da Rede Neural
Utilizando o software RTX no modo simulao, analisamos os parmetros necessrios

para os dois tipos de treinamento implantados de modo que a RN aprendesse o processo
simulado.
8.1 Ajustes de Parmetros para o Treinamento Steepest Descent
Vrios parmetros da RN devem ser determinados para que a rede possa aprender o
processo (ver item 3.4.1), assim, procuramos determinar esses valores no modo simulado para
depois serem aplicados no mdulo de testes.
8.1.1 Tempo de Amostragem
O tempo de amostragem utilizado para a caracterizao do sistema nos testes (Ts=15s)

se mostrou ineficiente quando utilizado para o treinamento Steepest Descent, conforme
mostrado na Tabela 8.1. A RN no convergiu, porque tendo o processo uma constante de
tempo = 2400s, os valores informados rede a cada 15 segundos eram muito prximos entre
si, gerando um vetor de entrada da rede quase constante. importante observar que a rede
para aprender o processo necessita de informaes de vrias situaes diferentes, ou seja,
pares de treinos entrada-sada independentes.
Procuramos atravs dos testes definir um tempo de amostragem de modo que a RN
aprendesse mais rapidamente o processo, ou seja, reproduzisse o valor de sada com um erro
inferior ou igual a 0,1%. A tabela a seguir mostra os resultados obtidos.
Tempo de Amostragem Tempo para produzir

( Ts ) erro 0,001
15 segundos no convergiu
30 segundos 12330 segundos
Tabela 8.1 - Resultados da Simulao para o Tempo de Amostragem
Aps os testes passamos a utilizar o tempo de amostragem Ts=90s, j que o mesmo

apresentou melhores.
Treinamento da Rede Neural 61
8.1.2 Nmero de Neurnios da Camada de Entrada
Os testes mostrados na Figura 8.1a e 8.1b, seguiram o mesmo critrio para o erro do
item 8.1.1, utilizando Ts=90s. O tempo para que a rede reproduzisse um valor de sada com
erro menor que 0,1%, foi denominado de tempo
de aprendizagem.
Para que a rede possa produzir seu
primeiro valor de sada, necessrio que sejam
preenchidos todos os neurnios da camada de
entrada. Sendo o treinamento realizado de
modo sequncial, existe um tempo, definido
como tempo inicial, que a RN no produz sada
alguma (afastamento do grfico de sada da
rede do eixo y). Observamos que quanto maior
a quantidade de neurnios na camada de
entrada, maior o tempo inicial. O tempo
inicial uma parcela do tempo de
aprendizagem.
Realizamos testes para 2 e 10 neurnios
na camada de entrada da rede, o tempo de Figura 8.1 - Influncia do Nmero de
aprendizagem para 2 neurnios foi de 12330s e Neurnios na Camada de Entrada no
Treinamento Steepest Descent
para 10 neurnios 10620s, como mostrado na
Figura 8.1. Houve um decrscimo de aproximadamente 30 minutos no tempo de
aprendizagem, o que corresponde a um tempo 13,8% menor.
Analisando os resultados obtidos realizamos testes com 15 neurnios na camada de
entrada da rede obtendo um tempo de aprendizagem de 4050s, diminuindo o tempo de
aprendizagem em 67,2%.
Como um aumento significativo da quantidade de neurnios na camada de entrada
produz um esforo computacional muito grande11, optamos por utilizar 15 neurnios na
camada de entrada, pois essa quantidade reduziu consideravelmente o tempo de
aprendizagem.
Nesses testes mantivemos a distribuio dos dados de entrada (item 5.2) em 50% para
a varivel manipulada e 50% para a varivel controlada.
11
Aumento significativo na quantidade de operaes lgicas e matemticas realizada pelo computador
provocando um tempo maior na busca do resultado
8.1.3 Distribuio dos Dados de Entrada
O conjunto de dados de entrada sempre obedeceu a distribuio do item 5.2.

Procuramos atravs de testes determinar o valor ideal para o ndice j, que representa, a
quantidade de neurnios de entrada que recebe o valor da varivel manipulada.
Utilizando 15 neurnios na camada de entrada, realizamos testes para valores de j=2,
5, 8 e 10. Os testes foram qualitativos, observando o comportamento da varivel manipulada
durante a ao do controlador RN, aps a aplicao de uma perturbao degrau.
Para j=2 o controlador no conseguiu amortizar a perturbao completamente, houve
uma grande oscilao da varivel controlada. Isto ocorreu, porque a rede no conseguiu
aprender a influncia dos valores da varivel manipulada no processo.
Utilizando j=5, 8 e 10, o controlador RN amortizou a perturbao aplicada, produzindo
pequena oscilao da varivel controlada. Observamos que a medida que j aumenta, ocorre
um aumento das oscilaes da varivel manipulada em torno do seu valor de equilbrio12.
Para j=10 a varivel manipulada no convergiu para um valor de equilbrio, e permaneceu
oscilando em torno de um outro valor.
Analisando os resultados adotamos como distribuio dos dados, na camada de entrada
para o processo estudado, j=INTEIRO(N/3), ou seja, 1/3 dos dados de entrada da rede so
informaes da varivel manipulada e 2/3 da varivel controlada.
8.1.4 Nmero de Neurnios na Camada Intermediria
Para a definio da quantidade de neurnios na camada intermediria, realizamos

testes com 5, 10 e 20 neurnios. Os testes foram qualitativos, observando o comportamento da
varivel manipulada durante a ao do controlador RN.
medida que aumentamos a quantidade de neurnios na camada intermediria, a ao
do controlador sobre a varivel manipulada amortecida, ou seja, no existe grande salto na
varivel manipulada. Acreditamos que essa caracterstica devido a um melhor aprendizado
da rede do processo. Essa caracterstica importante do ponto de vista do elemento final de
controle, pois o mesmo, teria um menor desgaste com o tempo. Por exemplo, tomemos como
base uma vlvula de controle, a mesma trabalharia sob aes suaves de abertura e
fechamento, diminuindo os desgaste dos componentes internos com o tempo.
No processo em estudo utilizamos 50 neurnios na camada intermediria.
12
Valor da varivel manipulada que, estando o processo no set-point, o mantm estabilizado.
8.1.5 Nmero de Neurnios na Camada de Sada
O sistema em estudo neste trabalho possui uma nica varivel manipulada, a tenso
nas resistncias eltricas, necessitando apenas de uma nica sada no controlador RN.
Portanto a quantidade de neurnios na camada de sada (M) igual a 1.
8.1.6 Passo de Aprendizagem
Os testes simulados para avaliar a influncia do passo de aprendizagem( ) foram

qualitativos, partindo-se de =0,001 at =0,100. Observou-se que para os valores dos
extremos da faixa escolhida a rede no demonstrou estar aprendendo o processo.
Atravs da Figura 8.2 podemos visualizar o no aprendizado da rede do ponto de vista
de um nico peso de conexo. Como o tipo de treinamento sequncial, sendo o passo muito
pequeno e estando no ponto a, a rede necessita
a
de uma grande quantidade de passos para
E
chegar em z. Isto implica em um tempo muito
elevado. J com o passo muito grande, a rede
b c
Emin estando no ponto b ultrapassa o valor de
z
mnimo da funo atingindo o ponto c porque o
salto provocado pelo passo maior que a
W otimo W
distncia do ponto b ao ponto de mnimo z.
Figura 8.2 - Funo Hipottica Erro x Peso W Essa situao se repete com a funo erro
definida no espao dos pesos das conexes.
Neste trabalho o valor de =0,050 apresentou bons resultados e por isso foi adotado.
8.1.7 Incorporao de Bias
A incorporao de um bias na rede durante a simulao tornou o controlador RN

instvel, de modo que o mesmo, no conseguiu mais controlar o processo. Devido esse fato,
optamos por no utilizar a conexo bias.
8.2 Ajustes de Parmetros para o Treinamento Decomposio em Valores

Singulares
A determinao dos diversos parmetros necessrios para a implantao desse

treinamento seguiu caminhos totalmente diferentes aos mostrados anteriormente no
treinamento Steepest Descent. Vrios parmetros foram simplesmente definidos baseados em
alguns critrios, sem efetuar testes de busca de valores timos, como o caso do tempo de
amostragem e incorporao de bias. Outros porm, foram determinados como um grupo e

no como um parmetro isolado.
O critrio de observao definido no item 8.1.1, determinao do tempo de
amostragem para que a RN reproduzisse o valor de sada com um erro inferior ou igual a
0,1%, no pode ser utilizado devido s caractersticas desse mtodo. Esse treinamento do
tipo batelada e o primeiro valor reproduzido pela rede aps o treinamento possui um erro
inferior ao estipulado. Por esse motivo, procuramos definir os parmetros observando os
resultados do controle realizado pela rede aps o treinamento. Ajustamos os parmetros de
modo que o controle realizado pela RN convergisse para um valor de equilbrio.
A maior dificuldade na determinao dos parmetros para este tipo de treinamento est
no fato de que alguns valores quando alterados sozinhos, no afetam consideravelmente os
resultados do controle pela rede de modo que possamos definir um valor timo para ele. Na
verdade a alterao de um conjunto de parmetros faz com que o controle pela rede alterne
entre melhores e piores resultados.
8.2.1 Tempo de Amostragem
Analisando os resultados obtidos para o treinamento Steepest Descent decidimos

manter o tempo de amostragem Ts=90s, pois o mesmo mostrou-se eficiente no sentido de
produzir informaes do processo em vrias situaes diferentes.
8.2.2 Nmero de Neurnios na Camada de Sada
Devido s caractersticas do processo estudado como definido no item 8.1.5 a

quantidade de neurnios na camada de sada igual a 1.
8.2.3 Mtodo Iterativo de Clculo da Varivel Manipulada
Para a determinao do valor a ser implantado no processo xqp, da Equao 5D,

necessitamos de um processo iterativo de clculo. Vrios mtodos foram aplicados com o
intuito de conseguir um mtodo que convergisse na maioria das vezes que fosse utilizado.
Para tanto, interrompemos a execuo da rotina L106, do software RTX, responsvel por
determinar o valor de xqp, e procuramos visualizar a cada acesso rotina se esta havia
convergido ou executado o limite mximo de 2000 iteraes pr-estabelecidos. Os mtodos
utilizados esto apresentados na Tabela 8.2 em ordem de implantao e com suas respectivas
caractersticas..
Ordem Mtodo Caractersticas

01 Newton-Raphson utiliza um ponto inicial x0
aproxima da raiz com a derivada da funo
novo valor
f ( xn )
xn +1 = xn +
f ' ( xn )
02 Substituies utiliza um ponto base (x,(x))
Sucessivas aproxima f(x)= (x)-x=0
novo valor x = (x)
03 Falsa Secante utiliza um ponto como base (c,f(c))
novo valor
(c xn ) f ( xn )
xn +1 = xn +
f (c) f ( xn )
04 Ajuste de uma utiliza trs pontos de partida
Funo Monotnica (x1,y1),(x2,y2) e (x3,y3)
x c1
aproxima f ( x) = y ( x) =
c2 x + c3
novo valor
x1 y 2 y 3 ( x 2 x3 ) x 2 y1 y 3 ( x1 x3 ) + x3 y1 y 2 ( x1 x 2 )
xn +1 =
y 2 y 3 ( x 2 x 3 ) y1 y 3 ( x1 x 3 ) + y1 y 2 ( x1 x 2 )
Tabela 8.2 Mtodos Iterativos de Clculos para Determinar a Varivel Manipulada
Para o mtodo Newton-Rapson realizamos dois testes, o primeiro com o ponto inicial
de partida sendo o valor de equilbrio e o segundo com o ponto inicial sendo o ltimo valor
calculado. Em ambos os casos o resultado foi o mesmo, o mtodo divergiu para a maioria das
vezes em que foi aplicado, ultrapassando o limite mximo de iteraes definido. O controle
realizado pela RN no conseguiu levar o valor da varivel manipulada para um valor de
equilbrio. Ocorreu uma oscilao em torno de um valor com uma amplitude equivalente ao
range da varivel manipulada.
A aplicao do mtodo da substituio sucessiva requer a definio da funo (x).
Essa funo foi obtida da Equao 5D considerando n=G e j=c, onde c nmero do neurnio
da camada escondida que possui a maior fora de conexo (definido na ACP). Obtivemos a
Equao 8A, sendo utilizada para a aplicao do mtodo.
o 1
1 S1 S2 x v
G N
1
( x) =
v pc sGc k qk kc (8A)
k# p
sendo;
n G 1 n
N
N
G
N
S1 = snj xqi vij e S2 = snc xqi vic
j n =0 i n =0 i
j #c
Realizamos novamente dois testes utilizando o valor de equilbrio e o ltimo valor

calculado como ponto base. No primeiro caso, utilizando o valor de equilbrio, o mtodo
apresentou resultados semelhantes ao Newton-Raphson, e o controle realizado pela RN
oscilou em torno do valor de equilbrio com uma amplitude igual ao valor do range da
varivel manipulada. Utilizando o ltimo valor calculado o mtodo divergiu sempre para
valores na ordem de 1030, chegando ao limite mximo de 2000 iteraes, o que tornou
impraticvel o controle pela RN.
Os testes realizados com o mtodo da falsa secante apresentaram melhores resultados
do que os dois anteriores utilizando como ponto base o valor de equilbrio. A maioria das
vezes o mtodo convergiu o que resultou na convergncia do controle realizado pela RN ao
valor de equilbrio. No entanto, estando o processo prximo do set-point e portanto a varivel
manipulada prxima do valor de equilbrio o mtodo desestabilizava e comeava a divergir, e
consequentemente o controle realizado pela RN comeava a oscilar com uma amplitude
grande em torno do valor de equilbrio.
O mtodo do ajuste de uma funo monotnica ofereceu excelentes resultados no
controle realizado pela RN. O mtodo convergiu em torno de 90% das vezes em que foi
solicitado e geralmente com menos de 50 iteraes. A divergncia geralmente ocorria quando
o valor da varivel manipulada estava prxima dos limites inferiores e superiores do range.
Definimos dois conjuntos de pontos de partida, o primeiro utilizou o ltimo valor calculado da
varivel manipulada como x2 (na Tabela 8.2) e usando uma variao em torno do ponto de
0.5V, ou seja, x1=x2-0,5 e x3=x2+0,5. Para o outro conjunto de pontos foi utilizando x1=limite
superior do range da varivel manipulada, x2=valor de equilbrio do canal da varivel
manipulada e x3=limite inferior do range da varivel manipulada , sendo que este apresentou
melhores resultados que o primeiro conjunto.
De posse dessas informaes adotamos o mtodo do ajuste de uma funo
monotnica para calcular o valor a ser implantado no processo.
8.2.4 Incorporao de Bias
O peso bias associado camada escondida no pode ser especificado utilizando uma
ACP (PEEL ET AL, 1992). Entretanto, tem-se mostrado que as redes sem bias podem
tornar-se incapazes de aproximar certas funes (WRAY E GREEN, 1991). A idia ento, seria
treinar a rede usando qualquer tcnica padro utilizando como valores iniciais os pesos
determinados pela ACP, procedimento este, que aceleraria a velocidade de treinamento da
rede. Neste trabalho no implantamos essa idia pois nosso objetivo era a comparao entre
os mtodos de treinamento, e no a acelerao do treinamento, portanto, utilizamos o
treinamento ACP sem a conexo de peso bias.
8.2.5 Parmetros Determinados em Grupos
A busca do conjunto de parmetros ideais para um bom controle pela RN no processo

simulado, foi realizada alternando os valores de acordo com a Tabela 8.3, onde, iniciamos
com os valores timos definidos no treinamento Steepest Descent.
Os testes seguiram sempre o seguinte padro:
1. iniciamos o software RTX e esperamos que o processo atingisse o set-point de

300C
2. aplicamos uma perturbao do tipo PRBS para que o conjunto de dados de treino
tivesse valores representativos suficientes para um bom treinamento
3. iniciamos o treinamento Decomposio em Valores Singulares (a durao desse
treinamento um intervalo de amostragem devido o mesmo ser do tipo batelada).
4. iniciamos o controle pela RN
5. determinamos o desempenho do controlador RN atravs da medida do erro
quadrado definido como:
Ne Ne Ne
E = e dt
2 2
e
i =1
2
(i ) T = (y
i =1
i SP ) Ts = Ts ( y i SP ) 2
2
i =1
(8B)
0
onde; y = valor da varivel controlada no instante i

SP = set-point do processo Ts= tempo de amostragem
Ne = nmero de intervalos de amostragem (definido como 13500s=150Ts)
Os resultados obtidos esto descritos nas Tabela 8.3 em ordem de aplicao.

n Camada de entrada Janela de Grau da E2 x 10-5

observaes polinomial
nr nr com u
25 15 10 10 2 4,43322
25 15 10 30 2 0,61207
25 15 5 10 2 0.68566
25 15 8 10 2 0,44118
25 15 8 10 3 1,02798
25 15 10 10 3 0,11957
25 15 10 50 3 0,37010
20 15 10 20 3 0,73092
20 15 10 10 3 0,58379
25 21 14 10 3 0,00912
25 21 14 20 3 0,56930
25 21 14 10 4 0,64109
25 21 14 10 2 0.49849
25 24 16 10 3 0,62502
25 21 12 10 3 0,60535
20 21 14 10 3 0,57065
25 21 14 250 2 0,02462
25 15 10 250 2 0,02719
25 15 10 250 3 0,03166
25 9 6 250 3 0,90468
25 21 14 150 3 0,63167
25 21 14 250 3 0,04968
25 21 14 350 3 0,18621
25 1521 14 550 3 0,13045
25 21 14 750 3 0,16040
25 21 14 1000 3 0,41447
nr = nmero de neurnios u= varivel manipulada
n =nmero de intervalos de amostragens para atingir o set-point (item 5.1.1)
Tabela 8.3 Resultados de Busca de Parmetros para o

Treinamento Decomposio em Valores Singulares
O conjunto de parmetros que produziu melhores resultados o destacado na Tabela

8.3, a princpio, adotamos esse conjunto de parmetros e procuramos alterar o conjunto de
dados de treino para melhorar os resultados produzidos pelo controlador RN (item 8.3), uma
vez que E2 estava muito elevado, na ordem de 103.
8.3 Conjunto de Dados de Treino
Procurando determinar o melhor conjunto de dados de treino para a RN, realizamos

testes gerando dados com as diversas perturbaes oferecidas pelo software RTX.
Para o treinamento Steepest Descent realizamos os testes descritos a seguir, onde,
primeiramente deixamos que a rede acompanhasse o processo at o set-point, esperamos que
o processo estabilizasse e aplicamos a perturbao. Aps o trmino da perturbao colocamos
a RN para controlar o processo. Caso a rede estivesse bem treinada ela controlaria o processo
mantendo-o no valor do set-point.
O primeiro teste, com uma perturbao do tipo DEGRAU, mostrou que aps
aplicao da perturbao a rede neural no conseguiu controlar o processo, seus valores de
sada divergiram como mostrado na Figura 8.3.
Figura 8.3 - Treinamento Steepest Figura 8.4 - Treinamento Steepest Descent

Descent com perturbao DEGRAU com perturbao PRBS
A perturbao do tipo SENIDE produziu os mesmos resultados da perturbao

degrau, fazendo com que a rede no conseguisse estabilizar o processo.
Com a perturbao do tipo PRBS a rede se mostrou bastante eficiente. Convergiu
conseguindo controlar o processo (Figura 8.4).
O treinamento da RN com perturbao PRBS, devido s suas caractersticas, se
mostrou melhor que o treinamento com outras perturbaes. A perturbao PRBS conduz o
processo a diferentes situaes. A rede treinada com o processo em vrias situaes, aprende
mais rapidamente o comportamento do mesmo, produzindo melhores resultados de sada.
Considerando os resultados obtidos, adotamos na simulao e nos testes do aquecedor
de ar, a perturbao PRBS para a gerao do conjunto de dados para o treinamento Steepest
Descent.
No treinamento Decomposio em Valores Singulares inicialmente adotamos o
conjunto de dados de treino produzidos por uma perturbao PRBS, considerando os
resultados obtidos com o treinamento Steepest Descent. Como os resultados no foram
satisfatrios, adotamos a perturbao DEGRAU e aplicamos a mesma sequncia do item
8.2.5, obtendo os seguintes resultados em ordem de aplicao.
n Camada de entrada Janela de Grau da E2 x 10-4

observaes polinomial
nr nr com u
25 21 14 1000 3 0,09891
25 21 14 500 3 0,13302
25 21 14 250 3 0,21310
n = nmero de intervalos de amostragens que o processo dever demorar
para atingir o set-point (item 5.1.1)
nr = nmero de neurnios u = varivel manipulada
Tabela 8.4 Resultados de Busca do Conjunto de Dados de Treino
Os resultados dos testes mostrados na Tabela 8.4 tambm produziram valores elevados
do E2, na ordem de 103. Na busca por melhores resultados alteramos a sequncia de conduo
dos testes descrita no item 8.2.5, fazendo a inverso do passo 2 com o passo 3, ou seja,
primeiro ativamos o treinamento e depois aplicamos a perturbao. Neste caso, a rede foi
treinada com o conjunto de dados iniciais, ou seja, a conduo inicial do processo at o
set-point sem a aplicao de uma perturbao.
Para uma janela de observao de 125Ts e mantendo os mesmos valores de n, nr, u e

grau da polinomial da Tabela 8.4, obtivemos um E2=0,4x10-3, muito inferior aos erros dos
testes anteriores. O conjunto de dados iniciais foi suficiente para um bom treinamento, sendo
dispensado a aplicao de uma perturbao.
Em face dos resultados obtidos, adotamos como conjunto de dados de treino para o
treinamento do tipo Decomposio em Valores Singulares, os valores iniciais de conduo do
processo ao set-point.
A grande vantagem de utilizar-se o conjunto inicial de dados est na aplicao prtica,
pois nem todos os processo podem ser perturbados para obtermos um conjunto de dados com
caractersticas necessrias a um bom treinamento.
9. Simulao do Aquecedor de Ar
Depois de realizados os testes de confiabilidade do controlador PID (Item 7.2) e

treinamento da rede RN (Captulo 8) realizamos a simulao no processo de 1 ordem descrito
pela Equao 4E com o intuito de comparar os resultados com testes prticos (Captulo 4).
Utilizando um tempo de amostragem Ts=90s e o set-point de 300C, esperamos
inicialmente que o controlador levasse o processo ao equilbrio, para ento, aplicarmos a
perturbao desejada. No momento em que a perturbao aplicada, o software comea a
armazenar os desvios da varivel controlada em relao ao set-point, ou seja, determina o erro
quadrado E2 definido pela Equao 8B.
Procuramos trabalhar com um nmero de intervalos (Ne) suficientemente grande de
modo que o desvio em relao ao set-point no final fosse desprezvel.
Os valores utilizados que caracterizam cada uma das perturbaes aplicada esto
descritos na Tabela 9.1. As unidades de tempo so mostradas em segundos e em nmero de
intervalos de amostragem nTs.
Perturbao Tempo de Altura do Tempo de Perodo Durao Intervalo de

Durao Salto Soma dos do Pulso Aplicao
Erros Elementar
DEGRAU 18000s 50% 36000s
200 Ts 1,5 V 400 Ts
PULSO 90s 50% 21600s
1 Ts 1,5 V 240 Ts
SEQ. DE 7200s 30% 21600s 90s 360s
PULSOS 80 Ts 0,9 V 240 Ts 1 Ts 4 Ts
SENIDE 10800s 25% 21600s 1800s
120 Ts 0,75 V 240 Ts 20 Ts
PRBS 10800 50% 36000s 540s
120 Ts 1,5 V 400 Ts 6 Ts
Tabela 9.1 - Caracterizao das Perturbaes Aplicadas no Processo Simulado
Simulao do Aquecedor de Ar 73
9.1 Performance do Controlador PID
O desempenho do controlador PID para as diversas perturbaes aplicadas est

resumido na Tabela 9.2. O erro normalizado (E2n), informado na tabela, foi obtido tomando
como base o menor E2 produzido pelo controlador.
Perturbao Aplicada E2x10-2 E2 n

DEGRAU 0,0163 1,0
PULSO 0,0227 1,4
SEQNCIA DE PULSOS 0,0651 4,0
SENIDE 0,4723 29,0
PRBS 6,5044 399,0
Tabela 9.2 - Desempenho para Diversas Perturbaes
do Controlador PID
Como era esperado a performance do controlador PID foi melhor no controle de uma
perturbao do tipo degrau, pois o mesmo foi ajustado com os parmetros de processo
extrados de um teste com esse tipo de perturbao. Na Figura 9.1 podemos acompanhar o
comportamento do controlador com o processo simulado recebendo uma perturbao do tipo
degrau.
Figura 9.1 - Perturbao DEGRAU com Controlador PID

Para perturbaes do tipo pulso e sequncia de pulsos, o controlador PID se mostrou

eficiente, mantendo o processo no set-point. Atravs das Figuras 9.2 e 9.3 podemos observar
seu comportamento no controle dessas perturbaes.
Figura 9.2 - Perturbao PULSO com Controlador PID
Figura 9.3 - Perturbao SEQNCIA DE PULSOS

com Controlador PID
Com a perturbao senide, Figura 9.4, observamos que o processo tendeu a

acompanhar a perturbao, demonstrando que o PID no estava conseguindo controlar a
mesma
Figura 9.4 - Perturbao SENIDE com Controlador PID
Figura 9.5 - Perturbao PRBS com Controlador PID

O Controlador no conseguiu bom desempenho tambm frente a uma perturbao do

tipo PRBS. Obtivemos o maior desvio da varivel controlada em relao ao set-point. O E2
produzido foi 399 vezes superior ao menor erro, o da perturbao degrau.
9.2 Performance do Controlador RN com Treinamento Steepest Descent
A Tabela 9.2 mostra os valores dos erros obtidos atravs do controle simulado com o
uso da RN para o treinamento do tipo Steepest Descent.

DEGRAU 0,0075 1,0
SENIDE 0,0214 2,9
PULSO 0,0516 6,9
PRBS 2,2767 303,6
Tabela 9.3 - Desempenho para Diversas Perturbaes
do Controlador RN e Treinamento Steepest Descent
Observamos um bom desempenho do controlador RN, demonstrado pela Figura 9.6,

para uma perturbao do tipo degrau, conseguindo amortecer a perturbao e produzindo o
Figura 9.6 - Perturbao DEGRAU com Controlador RN e

menor E2 em relao s outras perturbaes.

Com as perturbaes sequncia de pulsos, senide e pulso, a rede mostrou desempenho
semelhante, mantendo E2 na mesma potncia, conforme podemos visualizar nas Figuras 9.7,
9.8 e 9.9.
Figura 9.7 - Perturbao SEQNCIA DE PULSOS com Controlador RN

e Treinamento Steepest Descent
Figura 9.8 - Perturbao SENIDE com Controlador RN

Figura 9.9 - Perturbao PULSO com Controlador RN

Comparando com as outras perturbaes, a do tipo PRBS, mostrou-se a mais difcil de

ser amortecida pelo controlador RN, provocando um E2 de grandeza 303 vezes superior ao
menor erro, o da perturbao degrau. A Figura 9.10 mostra o comportamento da RN no
controle dessa perturbao.
Figura 9.10 - Perturbao PRBS com Controlador RN

9.3 Performance do Controlador RN com Treinamento Decomposio em Valores

Singulares
Atravs dos resultados expressos na Tabela 9.3 podemos verificar o comportamento da

RN com o treinamento de Decomposio de Valores Singulares para as diversas perturbaes
aplicadas.

PULSO 0,0386 2,5
DEGRAU 0,0536 3,5
SENIDE 0,1407 9,2
PRBS 0,5164 33,9
Tabela 9.4 - Desempenho para Diversas Perturbaes do Controlador RN

e Treinamento Decomposio em Valores Singulares
O melhor desempenho obtido pela RN com treinamento Decomposio em Valores
Singulares foi para uma perturbao do tipo sequncia de pulsos, onde a perturbao foi bem
amortecida como podemos observar na Figura 9.11, entretanto, para as perturbaes do tipo
pulso e degrau o desempenho foi semelhante resultando em E2 de mesma potncia, podendo
ser visualizado nas Figuras 9.12 e 9.13.
Figura 9.11 - Perturbao SEQUNCIA DE PULSOS com Controlador RN

Figura 9.12 - Perturbao PULSO com Controlador RN e

Figura 9.13 - Perturbao DEGRAU com Controlador RN e

O controlador no produziu bons resultados para uma perturbao do tipo senide

como podemos observar na Figura 9.14, ocorreu uma pequena oscilao da varivel
controlada produzindo E2 bem superior ao esperado, considerando os resultados obtidos com
o treinamento Steepest Descent (item 9.2).

Como era esperado a perturbao PRBS produziu o maior valor de E2, sendo a mais
difcil de ser amortecida (Figura 9.15). Entretanto, o E2 produzido foi aproximadamente 5
vezes menor que o E2 produzido com a mesma perturbao e treinamento Steepest Descent,
demonstrando uma melhora no treinamento e controle da rede.
Figura 9.15 - Perturbao PRBS com Controlador RN

9.4 PID x RN
Uma comparao de desempenho entre os dois controladores pode ser efetuada com
base nos E2 apresentados nos itens anteriores.
De um modo geral, o controlador RN mostrou-se mais eficiente do que o controlador
PID para as diversas perturbaes aplicadas no sistema independente do tipo de treinamento
utilizado. Em quase todas as perturbaes aplicadas o E2 produzido pelo controlador RN foi
menor, com exceo da perturbao pulso para ambos os treinamentos e para a perturbao
degrau no treinamento Decomposio em Valores Singulares.
Perturbao E2x10-2 Razo PID/RN
Aplicada PID RNSD RNDVS PID/RNSD PID/RNDVS
PULSO 0,0227 0,0516 0,0386 0,44 0,59
DEGRAU 0,0163 0,0075 0,0536 2,17 0,30
PRBS 6,5044 2,2766 0,5164 2,86 12,60
SEQNCIA DE PULSOS 0,0651 0,0106 0,0152 6,14 4,28
SENIDE 0,4723 0,0214 0,1407 22,07 3,36
PID = controlador proporcional integral derivativo

RNSD = controlador RN com treinamento Steepest Descent
RNDVS = controlador RN com treinamento Decomposio em Valores Singulares
Tabela 9.5 - Comparao de Desempenho dos Controladores PID e RN
Determinando a razo erro PID/RN, definida na Tabela 9.5, procuramos mostrar o

quanto maior foi o erro produzido pelo controlador PID, em relao ao erro produzido pelo
controlador RN.
Alguns casos chamaram a ateno, o primeiro est no fato que para uma perturbao
do tipo pulso o E2 do controlador RN aproximadamente 2 vezes maior do que o E2 do
controlador PID para ambos os tipos de treinamento, isto explicado devido caracterstica
da perturbao, pois, se verificarmos na Figura 9.16, onde temos a aplicao da perturbao
pulso sem a ao de controladores, observaremos que E2=0,00293x102, ou seja, menor do que
o erro produzido com a ao dos controladores. Portanto, para uma perturbao do tipo pulso,
quanto menor for a ao do controlador, no sentido de amenizar a perturbao, menor ser o
erro produzido na varivel controlada, isto , se o controlador no tomasse nenhuma atitude o

erro produzido seria menor. Outro fato interessante est na maior razo PID/RN apresentada.
O controlador RN com treinamento Steepest Descent, mostrou melhor desempenho no
controle de uma perturbao do tipo senide, em relao ao controlador PID, produzindo um
E2 com valor 22 vezes menor.
Figura 9.16 Resposta do Sistema Simulado a uma Perturbao Pulso
importante observar o baixo E2 produzido pelo controlador RN com treinamento

Decomposio em Valores Singulares para uma perturbao do tipo PRBS, sendo 12 vezes
menor que o E2 produzido pelo PID.
Para uma melhor visualizao dos resultados temos o grfico da Figura 9.17,
construdo a partir da Tabela 9.5, onde mostra como o controlador RN ofereceu melhores
desempenhos do que o controlador PID no processo simulado.
9.5 RN com Treinamento Steepest Descent x RN com Treinamento Decomposio

em Valores Singulares
Para uma melhor anlise comparativa dos resultados dos dois tipos de treinamento
implementados no software RTX, definimos a razo RNSD/RNDVS entre os E2 produzidos nos
testes. Os valores esto expressos na Tabela 9.6.
70
60
50
Erro Quadrado
PID
40
30 RN com treinamento
Steepest Descent
20 RN com treinamento
Decomposio em
10 Valores Singulares
0
PULSO DEGRAU PRBS x 0,1 SEQ. DE SENIDE
PULSOS
2
Figura 9.17 - Grfico Comparativo Dos Erros Quadrados (E ) da Varivel Controlada
Apesar dos resultados com o treinamento Decomposio em Valores Singulares terem

produzidos em trs casos, erros relativos superiores ao treinamento Steepest Descent,
observamos que a grande vantagem do mtodo reside no fato de que no h necessidade de
aplicao de uma perturbao para se efetuar o treinamento. Esse fator importante, pois na
prtica muitos processos no podero ser excitados de forma a produzirem pontos com
valores significativos para treinamento, como os requeridos pelo treino Steepest Descent.
Perturbao E2x10-2 Razo
Aplicada RNSD RNDVS RNSD/RNDVS
PULSO 0,0516 0,0386 1,34
DEGRAU 0,0075 0,0536 0,14
PRBS 2,2766 0,5164 4,41
SEQNCIA DE PULSOS 0,0106 0,0152 0,70
SENIDE 0,0214 0,1407 0,15

Tabela 9.6 - Comparao de Desempenho dos Treinamentos
Steepest Descent e Decomposio em Valores Singulares
10. Testes no Aquecedor de Ar
Nos testes do aquecedor de ar utilizamos alternadamente os dois controladores

ajustados, PID e RN, determinando assim, a performance de cada um no controle de
perturbaes externas, ou seja, no controle da variao da vazo de ar no aquecedor.
Para o controlador RN realizamos testes para os dois tipos de treinamentos
implantados na simulao do processo, o Steepest Descent e Decomposio em Valores
Singulares.
Para uma anlise quantitativa, definimos o erro relativo quadrado da varivel
controlada como sendo:
Ne Ne
y i SP 2 T Ne
E 2 relativo = e 2 dt e 2 (i ) T =
i =1
(
i =1 SP
) Ts = s 2
SP
(y
i =1
i SP ) 2 (10A)
0
onde;
Ne = nmero de intervalos de amostragem de soma dos erros
yj = valor da varivel controlada no intervalo j
SP = valor do set-point.
Ts = tempo de amostragem
O valor de Ne para os testes foi definido, suficientemente grande, de forma que os

erros relativos finais fossem desprezveis.
10.1 Performance do Controlador PID
O teste de performance do controlador PID est representado na Figura 10.1, onde,

definimos o tempo de amostragem Ts=15s, o set-point em 200C e iniciamos a partida no
processo com o controlador em atividade. Nos primeiro instantes, como era esperado, o
controlador alterou a varivel manipulada para um valor elevado, de modo que a temperatura
do processo aumentasse. Monitorando a varivel manipulada o controlador mostrou-se
eficiente no ajuste do set-point, o que foi conseguido em aproximadamente 40 minutos, tempo
inferior ao que se conseguiu manualmente nos testes de caracterizao (Captulo 4). Aps o
sistema permanecer em equilbrio, aplicamos o degrau na vazo de ar abrindo a porta do
aquecedor, diminuindo assim, a resistncia passagem do fluxo de ar e consequentemente,
Testes no Aquecedor de Ar 86
250 5
P o n to d e A p lic a o d a P e rtu rb a o
S e t-P o in t
200 4
V a ri v e l C o n tro la d a
150 3
Temperatura [C]
V a ri v e l M a n ip u la d a
100 2
50 1
0 0
0 450 900 1350 1800 2250 2700 3150 3600 4050
T e m p o [s ]
Figura 10.1 Testes no Aquecedor de Ar com Controlador PID
aumentando a vazo. O que observamos, foi uma atuao satisfatria do controlador,

conseguindo amortecer a perturbao aplicada ao sistema conduzindo-o ao seu set-point,
produzindo E2relativo = 3,5420.
10.2 Performance do Controlador RN com Treinamento Steepest Descent
O treinamento Steepest Descent da rede, para o controle do mdulo de testes, foi

realizado em duas etapas. Na primeira etapa, treinamos a rede em modo simulado, com o
processo de 1 ordem definido no Captulo 8, utilizando uma perturbao PRBS. A segunda
etapa, consistiu em ajustar os pesos da rede com o processo real (mdulo de testes), sendo
que, os pesos foram inicializados com os valores calculados na primeira etapa. No utilizamos
a perturbao PRBS diretamente no mdulo de testes, procurando uma alternativa para
processos que no podem sofrer esse tipo de perturbao, por exemplo, controle de pH em
sistemas bioqumicos. O treinamento na segunda etapa ficou resumido s oscilaes
provocadas pelo controle nas primeiras 7 horas.
Podemos observar a performance do controlador RN com treinamento Steepest
Descent atravs da Figura 10.2, onde utilizamos um tempo de amostragem Ts=90s, e o set-
point de 350C. O aumento inicial da temperatura, atingindo 519 C, revela que o conjunto
inicial de pesos no era o ideal, obrigando a rede a corrigi-los, comprovando que a suposio
de sistema de 1 ordem igual ao simulado no estava totalmente correta.
550 10
Varivel Controlada
500 9
Degrau
Negativo
450
8
Degrau
Positivo
Mudana de
400
Set-Point
7
Set-Point
350
6
Temperatura [C]
Voltagem [V]
300
250
4
200 Varivel Manipulada
3
150
2
100
50 1
0 0
0 2700 5400 8100 10800 13500 16200 18900 21600 24300 27000 29700 32400 35100 37800 40500 43200 45900 48600
Tempo [s]
Figura 10.2 - Testes no Aquecedor de Ar com Controlador RN e

10.2.1 Perturbao DEGRAU na Vazo de Ar
Aps 7 horas de teste, consideramos que o processo tenderia ao set-point e aplicamos

uma perturbao do tipo degrau na vazo de ar, abrindo a porta de sada de ar do aquecedor.
Este instante descrito na Figura 10.2 como degrau positivo.
Observamos que o controlador RN conseguiu amortecer a perturbao, conduzindo o
processo ao set-point e gerando E2relativo = 6,2041. O tempo total do teste foi de 2 h e 30
minutos.
O degrau negativo mostrado na Figura 10.2 representa o instante em que fechamos a
porta de sada de ar do mdulo, aumentando a resistncia passagem do fluxo de ar e
consequentemente diminuindo a vazo. Observamos que o controlador RN conseguiu
amortecer essa perturbao mais rapidamente do que a anterior, no entanto, obtivemos
E2relativo = 7,7483. Um valor mais elevado do que o do primeiro teste. Isto ocorreu devido s
caractersticas do mdulo de testes, descritas no Captulo 4, onde existe diferena ente o
aquecimento e o resfriamento.
10.2.2 Alterao do SET-POINT do processo
O teste de alterao do set-point do processo teve como objetivo verificar a facilidade

da alterao via software, bem como o comportamento do controlador RN, pois o mesmo
havia sido treinado para operar em condies diferentes.
Optamos por uma alterao no set-point para um valor menor, ou seja 250 C, j que o
controlador RN se mostrou menos eficiente no resfriamento, do ponto de vista dos testes
degrau. Os resultados obtidos, representados na Figura 10.2, foram satisfatrios,
demonstrando que o controlador, apesar de treinado em nveis diferentes, conseguiu assimilar
a mudana de set-point, levando o processo sua nova condio em um tempo de 2 horas e 57
minutos para uma variao de 100C no set-point.
10.3 Performance do Controlador RN com Treinamento Decomposio em Valores

Singulares
Nos testes do aquecedor de ar procuramos treinar a rede de maneira similar ao

treinamento realizado na simulao. Iniciamos o teste com um valor de 2,0 Volt na varivel
manipulada e mantivemos esse valor at que a varivel controlada chegasse ao valor de
300C, o que ocorreu em aproximadamente 3 horas e 30 minutos, em seguida, realizamos o
treinamento da rede com esse conjunto de dados no instante indicado na Figura 10.3 como
ponto do 1 treinamento. Imediatamente aps realizado o treinamento ativamos o controle do
processo atravs da rede neural. Utilizamos nos testes o tempo de amostragem Ts=90s, e o
valor do set-point de 300oC.
Inicialmente esperamos que o controlador mantivesse o processo em torno do
set-point. Aps esse perodo consideramos o processo treinado e iniciamos os testes. Como o
resultado do primeiro teste com a perturbao degrau produziu um erro relativamente alto,
aps 6 horas e 25 minutos de incio do teste realizamos um novo treinamento na rede para a
continuao dos demais testes. Na Figura 10.3 esse instante est indicado como ponto do 2
treinamento.
10.3.1 Perturbao DEGRAU na Vazo de Ar
Com o processo considerado estvel, aps 3 horas e 36 minutos, aplicamos a

perturbao na vazo de ar abrindo a porta do aquecedor, sendo esse instante indicado na
Figura 10.3 como degrau positivo.
350 10
Ponto do 1 Treinamento Degrau Ponto do 2 Treinamento
Positivo Mudana
de Set-Point 9
300 Set-Point
250 Degrau
7
Negativo
Temperatura(C)
Varivel Controlada
6
Voltagem(V)
200
150
Varivel Manipulada 4
3
100
50
1
0 0
0 2700 5400 8100 10800 13500 16200 18900 21600 24300 27000 29700 32400
Tempo(s)

O controlador RN procurou estabilizar o processo em seu set-point, como podemos
observar na Figura 10.3. O tempo necessrio para conduzir novamente o processo ao seu
set-point foi de 1 hora e 48 minutos, produzindo E2relativo = 48,5770.
O comportamento do controlador durante a aplicao do degrau negativo, conforme
mostrado na Figura 10.3, foi satisfatrio, pois, o controlador conseguiu amenizar a
perturbao em 57 minutos e produziu E2relativo = 1,4447, bem abaixo do erro produzido com o
degrau positivo. Esse fato demonstra que o primeiro treinamento no foi suficiente para que a
rede aprendesse o processo de modo a realizar um controle eficiente.
10.3.2 Alterao do SET-POINT do Processo
O teste de alterao do set-point foi conduzido de maneira similar ao realizado com

treinamento Steepest Descent (item 10.2.2), como o objetivo verificar a facilidade de
mudana de ponto operacional do processo alteramos o set-point para 200C, esse instante
est indicado na Figura 10.3 como mudana de set-point. O tempo necessrio para o processo
se estabilizar no novo set-point foi de 3 horas e 6 minutos para uma variao de 100C.
10.4 PID x RN
No mdulo de testes o controlador PID mostrou um melhor desempenho em relao ao

controlador RN, no controle de um degrau positivo na vazo de ar. Isto pode ser observado
atravs da razo PID/RN (Tabela 10.1) para cada tipo de treinamento da rede.
A diferena entre o PID e o controlador RN com treinamento Steepest Descent pode

ser resultado de pouco tempo de utilizao da rede em treinamento, j que a mesma, treinada
de modo sequencial, produz melhores resultados com o decorrer do tempo.
O erro produzido pelo controlador RN com treinamento Decomposio em Valores
Singulares foi aproximadamente 4 vezes superior ao erro produzido pelo controlador PID,
demonstrando que o treinamento inicial da rede no foi suficiente para que a mesma
aprendesse o processo.
Perturbao E2relativox10-2 Razo PID/RN
Aplicada PID RNSD RNDVS PID/RNSD PID/RNDVS
Aumento da vazo de ar 0,0354 0,0620 0,4858 0,57 0,07

Tabela 10.1 - Comparao de Desempenho dos Controladores PID e RN no Mdulo de Teste
10.5 RN com Treinamento Steepest Descent x RN com treinamento Decomposio

em Valores Singulares
A comparao do desempenho dos dois mtodos de treinamento empregados nos

testes, pode ser realizada atravs de E2 expresso na Tabela 10.2. Devemos lembrar no entanto,
que para o treinamento Decomposio em Valores Singulares houve duas etapas de
treinamento, a primeira antes da aplicao da perturbao degrau positivo na vazo de ar e a
Perturbao E2relativox10-2 Razo
Aplicada RNSD RNDVS RNSD/RNDVS
Degrau positivo na vazo de ar 0,0620 0,4858 0,13
Degrau negativo na vazo de ar 0,0775 0,0145 5,34

Tabela 10.2 - Comparao de Desempenho dos Treinamentos
Steepest Descent e Decomposio em Valores Singulares no Mdulo de Teste
segunda antes da aplicao da perturbao degrau negativo na vazo de ar.

Definimos a razo RNSD/RNDVS para uma melhor comparao do desempenho dos
mtodos de treinamento.
O controlador RN com treinamento Steepest Descent mostrou melhor resultado no
controle da perturbao degrau positivo, enquanto o controlador RN com treinamento
Decomposio em Valores Singulares foi melhor no controle da perturbao degrau negativo.
O fato do controlador RN com treinamento Decomposio em Valores Singulares
apresentar melhores resultados somente aps a aplicao da segunda etapa de treinamento,
demonstra que a primeira etapa de treinamento no foi suficiente para um bom ajuste dos
pesos de modo a oferecer um bom controle.
11. Teste x Simulao
A comparao quantitativa entre o teste e a simulao do aquecedor de ar, pode ser

efetuada utilizando os dados apresentados nas Tabelas 9.5 e 10.1, entretanto, podemos
comparar somente os valores obtidos pela perturbao DEGRAU, porque as demais
perturbaes no foram aplicadas no mdulo de teste.
Como os resultados na simulao esto na forma de E2, definido pela Equao 8B, os
mesmos foram transformados em E2relativo para efeito de comparao.
Utilizando a Equao 10A podemos escrever;
Ts N e E2
2
Erelativo = j
SP 2 j
( y SP ) 2
=
SP 2
(11A)
onde SP o set-point do processo. A Tabela 11.1 expressa os E2relativo obtidos na

simulao e nos testes para uma perturbao DEGRAU.
Controlador E2relativox10-1 Razo

Teste/Simulao
Teste Simulao
PID 0,3542 0,0164 21,60
RNSD 0,6204 0,0077 80,57
RNDVS 4,8577 0,0545 89,13

Tabela 11.1 - Comparao entre Teste e Simulao para os
Controladores PID e RN
A relao Teste/Simulao apresentada na Tabela 11.1 demonstra que os

controladores, PID e RN, tiveram comportamento semelhante quanto ao desempenho entre
teste e simulao. Na simulao, utilizando o processo de 1 ordem, os controladores
apresentaram resultados muito superiores aos produzidos no teste.
Teste x Simulao 93
Os resultados obtidos j eram esperados, uma vez que o mdulo possua caractersticas
diferentes relativas ao aquecimento e resfriamento (item 4.1), de difcil implantao em
processo simulado.
Em ambos os casos, teste e simulao, com o treinamento Steepest Descent, onde a
rede treinada sequncialmente, observamos que a medida que o tempo avana os resultados
fornecidos melhoram, demonstrando que a rede realmente vai conhecendo o processo.
12. Concluses e Observaes
Os resultados obtidos foram melhores do que o esperado, acreditvamos no potencial

das redes neurais como controlador, mas no tnhamos dados quantitativos de desempenho
para compar-las com controladores PID, com este trabalho realizamos tais comparaes.
Atravs da simulao demonstramos que uma RN, ajustada e treinada, pode oferecer
melhores resultados que um controlador PID. Acreditamos, na grande possibilidade das redes
tambm oferecerem melhores performances nos processos reais, devemos no entanto, olhar
atentamente o treinamento.
A dificuldade da implantao do controle por redes neurais reside no conjunto de
parmetros a serem ajustados, como existe uma certa dependncia entre eles difcil
estabelecer um conjunto timo para um bom desempenho. Os valores referenciados neste
trabalho so vlidos somente para o problema estudado, no havendo uma relao de
comparao para outros processos.
Sabendo da alta performance dos computadores existentes hoje em dia, a limitao da
quantidade de neurnios nas camadas da rede (item 8.1.2), devido ao esforo computacional,
talvez fique sem sentido. Observamos que durante um intervalo de amostragem o computador
capaz de realizar o processamento de um nmero muito maior de neurnios, o que poderia
melhorar o desempenho da rede.
Na continuidade deste trabalho poderamos utilizar uma unio dos dois tipos de
treinamento implantados. Atravs do treinamento Decomposio em Valores Singulares
determinaramos os pesos iniciais para o treinamento Steepest Descent, com essa proposta
estaramos certamente acelerando o treinamento Steepest Descent e evitando a excitao
inicial do processo para coletar pontos para esse treinamento. A grande dificuldade de
implantao dessa idia est na determinao dos pesos da camada escondida, pois teramos
que resolver um sistema de equao para cada peso a ser determinado.
Outras opes de continuidade poderiam ser; a implantao de um treinamento com
passo de aprendizagem () varivel, utilizar outro modelo de rede (vrias camadas
intermedirias) e realizar testes em outros processos.
13. Bibliografia
1. ASTRM, K. J. ; B. W. WITTENMARK: Computer Controlled Systems: Theory

and Design, Printice-Hall, 1990.
2. BHAT, N.; T. J. McAVOY: Determining Model Structure for Neural Models by

Network Stripping, Computers Chem. Eng. Vol 16, Nr. 4, pgs 271-281,1992.
3. BHAT, N.; T. J. McAVOY: Use of Neural Nets for Dynamic Modeling and Control of
Chemical Process Systems, Computers Chem. Eng. Vol 14, Nr. 4/5, pgs 573-583,
1990.
4. COUGHANOWR, D. R.; L. B. KOPPEL: Process Systems: Analysis and

Control, McGraw-Hill, 1965.
5. COULSON, J. M.; J. F. RICHARDSON; D. G. PEACOCK: Chemical Engi-

neering: Volume Three: Chemical Reactor Design, Biochemical Reactor
Engineering including Computational Techniques and Control, Pergamon
Press, 1979.
6. DAHHOU B.; M. LAKRORI; I. QUEINNEC; E. FERRET; A. CHRUY: Control of

a Continuous Fermentation Process, Journal Proc. Cont. Vol 2, Nr. 2, pgs 103-111,
1992.
7. DAYAL, B. S.; F. A. TAYLOR; J. F. MACGREGOR: The Design of Experiments,

Training and Implementation of Nonlinear Controllers Based on Neural
Networks, The Canadian J. Chem. Eng. 72, pgs 1066-1074, 1994.
8. Di MASSIMO, C.; G. A. MONTAGUE; M. J. WILLIS; M. T. THAM; A. J.

MORRIS: Towards Improved Penicillim Fermentation Via Artificial Neural
Networks, Comp. Chem Eng. Vol. 16, Nr. 4, pgs 283-291,1992.
9. GOLUB, G. H. ; VAN LOAN, C. F.: Matrix Computations, North Oxford Pup. Co.,
1983
10. GOMIDE, F. A.; M. L. de Andrade Neto; Introduo Automao Industrial

Informatizada, Editorial Kapeluz, 1987.
Bibliografia 96
11. GOODWIN, G. C.; K. S. SIN: Adaptive Filtering Prediction and Control, Prentice-
Hall, Englewood Cliffs N. J., 1984.
12. FREEMAN, J. A.; D. M. SKAPURA: Neural Networks: Algorithms, Applications

and Programming Tecniques, Addison-Wesley Publishing Company, 1992.
13. KERN, D. Q.; Processos de Transmisso de Calor, Editora Guanabara Dois S.A., Rio de
Janeiro, 1982.
14. MANLY, B. F. J.: Multivariate Statistical Methods: a Primer, Chapman and Hall,
Londres, 1986
15. MOHLER, R. R.: Nonlinear Systems: Dynamics and Control, Printece-Hall,

Englewood Cliffs N. J., 1991.
16. NEITZEL, I.;Um Controlador DMC Autosintonizante, Programa de Tese de

Doutorado no Programa de Engenharia Qumica da COPPE/UFRJ, 1995.
17. PEEL, C.; MARK J. W. e MING T. T.; A Fast Procedure for The Training of Neural
Networks, Journal of Process Control, Vol. 2, Nr 4, pgs 205-211, 1992
18. PONTON, J. W.: Neural Networks: Some Questions and Answers, Journal of Process
Control, Vol 2, Nr. 3, pgs 163-165, 1992.
19. PSICHOGIOS, D. C.; L. H. UNGAR: Direct and Indirect Model Based Control Using
Artificial Neural Networks, Ind. Chem. Res. Vol 30, pgs 2564-2573,1991.
20. RAMSEIER, M.; P. AGRAWAL; D. A. MELLICHAMP: Non-Linear Adaptive

Control of Fermentation Processes Utilizing a Priori Modelling Knowledge, J.
Proc. Cont. Vol 2, Nr. 3, pgs 129-138, 1992.
21. RAWLINGS, J. O.: Applied Regression Analysis: A Research Tool, Wadsworth and
Brooks, Califrnia, 1988
22. SANOFF, S. P. e P. E. WELLSTEAD; Expert Identification and Control, IFAC

Proceeding Series, No 07, Identification and System Parameter Estimation, Editora
H. A. Barker + P. C. Young, York, U.K., 1985
23. UNBEHAUEN, H.; Regelemgs Technik, F. Vieweg & Sohn, Vol I e II, 1985.
Bibliografia 97
24. UNGAR, L. H.; B. A. POWELL; S. N. KAMENS; Adaptive Networks for Fault

Diagnosis and Process Control, Comp. Chem. Eng. Vol 14, Nr . 4/5, pgs 561-572,
1990.
25. VELOSO, E.; Curso de Mtodos Numricos, PETROBRS Petrleo Brasileiro S/A,
CENPES - DIVEN, 1985.
26. WHITE, D. A.; D. A. SOFGE: Handbook of Intelligent Control: Neural, Fuzzy, and
Adaptive Approaches, Van Nostrand Reinhold, 1992.
27. WILLIS, M. J.; C. D. Di MASSIMO; G. A. MONTAGUE; M. T. THAN; A. J.

MORRIS: Artificial Neural Networks in Process Engineering, IEE Proceeding-D
Vol. 138, Nr. 3, pgs 256-266, 1990
28. WRAY, J.; GREEN, G. G. C.: Analysis of networks that have learnt control problems,
IEE Int. Conf. CONTROL 91, Edinburgh, Scotland, 1991
29. YOUNG, S. J.: Real Time Languages: Design and Development, Ellis Horwood
Limited, 1982
30. ZIEGLER, J. G.; N. B. NICHOLS: Optimum Settings for Automatic Control-

lers,Trans. ASME, 64, 1942.
Anexos 99
Anexo I - Interligao das Rotinas do Software RTX
TipoVideo CORES.DAT
TelaInic, CTRLF4,ALTF4 e L101 GrafVid
Cfgred PADRAO.DAT
Consist
Inicsist Ask Grafvid

Frqpoe
Inicbpn
Diario Abrdat
Inicda DTddmmaa.DAT
Startup GrafVid
Montacanais
Valores
F1 Liga
Desliga
F2, F3, F9 e L100
F4 Tunepid PID.ASC
G Frqpoe
E F5 Cnfpert DEGRAU.DAT
R Frqpoe
E F6 Cnfpert PULSO.DAT
N
C Frqpoe
I F7 Cnfpert SENO.DAT
A Frqpoe
D F8 Cnfpert PRBS.DAT
O
R Frqpoe
F10 Frqpoe
CTRLF1 Grafvid
TBddmmaa.???
Z
4
CTRLF10 Grafvid
NETWORK.DAT
ALTF10 WH999999.???
Grafvid
L51 AD
DA
L52 Grafvid
Gravadados Diario Abrdat DTddmmaa.???
L53 Backward LEGENDA

Forward
- Rotinas do Sistema
Gerar_ab Imsl
Gerar_y - Arquivos de Dados
L102 Grafvid - Chamada de Rotinas

Splot - Gravao em arquivo
- Leitura em arquivo
L104, L105, L106, L108, L112 e L113 Frqsai
Anexos 100
Anexo II - Arquivo de Configurao Geral do Software RTX
configuracao 94 ARQUIVO : PADRAO.DAT

versao=3.0 : 05 Out 94
XRG
quant=100
01 ..valor maximo range canal 1 [unid. usuario].. Ent...... 800.0000000
02 ..valor minimo range canal 1 [unid. usuario].. Ent...... -200.0000000
04 ..valor minimo range canal 2 [unid. usuario].. Ent...... -200.0000000
06 ..valor minimo range canal 3 [unid. usuario].. Ent...... 0.0000000
09 ..valor maximo range canal 5 [unid. usuario]. .Ent...... 0.0000000
10 ..valor minimo range canal 5 [unid. usuario]. .Ent...... 0.0000000
17 ..valor maximo range canal 1 [em volt] ....... Saida.... 4.0000000
18 ..valor minimo range canal 1 [em volt] ....... Saida.... 1.0000000
19 ..valor m ximo range canal 2 [em volt] ....... Saida.... 4.0000000
20 ..valor minimo range canal 2 [em volt] ....... Saida.... 1.0000000
21 ............ ......... ......... ......... .0000000
22 ............ ......... ......... ......... .0000000
23 ............ ......... ......... ......... .0000000
24 8 E ............ ......... ......... ......... .0000000
25 .. 1 E ............ ...... .. ......... ......... .0000000
26 .. 2 E ............ ......... ......... ......... .0000000
27 .. 3 E ............ ......... ......... ......... .0000000
28 .. 4 E ............ ......... ......... ......... .0000000
29 .. 1 E ............ ......... ......... ......... .0000000
30 .. 2 E ............ ......... ......... ......... .0000000
31 .. 3 E ............ ......... ......... ......... .0000000
32 .. 4 E ............ ......... ......... ......... .0000000
33 .. 1 S ............ ......... ......... ......... .0000000
34 .. 2 S ............ ......... ................... .0000000
35 .. 3 S ............ ......... ......... ......... .0000000
36 .. 4 S ............ ......... ......... ......... .0000000
37 .. 1 E ............ ......... ......... ......... .0000000
38 2 E ............ ......... ......... ......... .0000000
39 3 E ............ ......... ......... ......... .0000000
40 4 E ............ ......... ......... ......... .0000000
41 .. 1 E ............ ......... ......... ......... .0000000
42 2 E ............ ......... ......... ......... .0000000
43 3 E ............ ......... ......... ......... .0000000
44 4 E ............ ......... ......... ......... .0000000
45 ............ ......... ......... ......... .0000000
46 ............ ......... ......... ......... .0000000
47 ............ ......... ......... ......... .0000000
48 ............ ......... ......... ......... .0000000
49 .. 1 S ............ ......... ......... ......... .0000000
50 .. 2 S ............ ......... ......... ......... .0000000
51 .. 3 S ............ ......... ......... ......... .0000000
52 .. 4 S ............ ......... ......... ......... .0000000
53 ............ ......... ......... ......... .0000000
54 ............ ......... ......... ......... .0000000
55 ............ ......... ......... ......... .0000000
56 ............ ......... ......... ......... .0000000
57 ............ ......... ......... ......... .0000000
Anexos 101
58 ............ ......... ......... ......... .0000000

59 ............ ......... ......... ......... .0000000
60 ............ ......... ......... ......... .0000000
61 ............ ......... ......... ......... .0000000
62 ............ ......... ......... ......... .0000000
63 ............ ......... ......... ......... .0000000
64 ............ ......... ......... ......... .0000000
65 .. Alarme de alta nvel 1 do 1 canal [0 a 5]....... 2.0000000
66 .. " " nvel 2 ....".. ....".... ....... 4.0000000
67 .. Alarme de baixa nvel 1 ....". ....."... ......... 2.0000000
68 .. " " nvel 2.....". ....."... ......... 0.5000000
69 .. Alarme de alta nvel 1 do 2 canal [0 a 5]....... 0.0000000
70 .. " " nvel 2 ....". ....."... ......... 0.0000000
71 .. Alarme de baixa nvel 1.....". ....."... ......... 0.0000000
72 .. " " nvel 2.....". ....."... ......... 0.0000000
73 .. ....... ............ ......... ......... ......... 0.0000000
74 .. ....... ............ ......... ......... ......... 0.0000000
75 .. ....... ............ ......... ......... ......... 0.0000000
76 .. ....... ............ ......... ......... ......... 0.0000000
77 .. ....... ............ ......... ......... ......... 0.0000000
78 .. ....... ............ ......... ......... ......... 0.0000000
79 .. ....... ............ ......... ......... ......... 0.0000000
80 .. ....... ............ ......... ......... ......... 0.0000000
81 .. ....... ............ ......... ......... ......... 0.0000000
82 .. ....... ............ ......... ......... ......... 0.0000000
83 .. ....... ............ ......... ......... ......... 0.0000000
84 .. ....... ............ ......... ......... ......... 0.0000000
85 .. ....... ............ ......... ......... ......... 0.0000000
86 .. ....... ............ ......... ......... ......... 0.0000000
87 .. ....... ............ ......... ......... ......... 0.0000000
88 .. ....... ............ ......... ......... ......... 0.0000000
89 .. ....... ............ ......... ......... ......... 0.0000000
90 .. ....... ............ ......... ......... ......... 0.0000000
91 .. ....... ............ ......... ......... ......... 0.0000000
92 .. ....... ............ ......... ......... ......... 0.0000000
93 .. ....... ............ ......... ......... ......... 0.0000000
94 .. ....... ............ ......... ......... ......... 0.0000000
95 .. ....... ............ ......... ......... ......... 0.0000000
96 .. ....... ............ ......... ......... ......... 0.0000000
97 valor max. de tempo 24*60*60 seg [rtx chama diario]..... 86400.0000000
98 ............ ......... ......... ......... .0000000
99 ............ ......... ......... ......... .0000000
100 ............ ......... ......... ......... .0000000
IDIG
quant=010
01 ............ ......... ......... ......... 0
02 ............ ......... ......... ......... 0
03 ............ ......... ......... ......... 0
04 ............ ......... ......... ......... 0
05 ............ ......... ......... ......... 0
06 ............ ......... ......... ......... 0
07 ............ ......... ......... ......... 0
08 ............ ......... ......... ......... 0
09 ............ ......... ......... ......... 0
10 ............ ......... ......... ......... 0
KFLAG
quant=050
01 Indicador de atualizao dos pesos da rede[1=At 0=No At] 1
02 Indica se atualiza os pontos dos gr ficos[1=Sim 0=No]... 1
03 Indica se existem pontos para atualizar rede [DVS]....... 0
04 ............ ......... ......... ......... 0
05 ............ ......... ......... ......... 0
06 ............ ......... ......... ......... 0
07 Alarme de Alta Nvel 1..... [0 = normal 1 = violado ]... 0
08 Alarme de Alta Nvel 2..... [........ .."...... .....]... 0
Anexos 102
09 Alarme de Baixa Nvel 1.... [........ .."...... .....]... 0

10 Alarme de Baixa Nvel 2.... [........ .."...... .....]... 0
11 Situacao do processo [Startup]....... ......... ......... 0
12 ............ ......... ......... ......... 0
13 ............ ......... ......... ......... 0
14 ............ ......... ......... ......... 0
15 ............ ......... ......... ......... 0
16 ............ ......... ......... ......... 0
17 ............ ......... ......... ......... 0
18 ............ ......... ......... ......... 0
19 ............ ......... ......... ......... 0
20 ............ ......... ......... ......... 0
21 ............ ......... ......... ......... 0
22 ............ ......... ......... ......... 0
23 ............ ......... ......... ......... 0
24 ............ ......... ......... ......... 0
25 Indica que e hora de executar IAUTO [0=no most. 1=most.] 0
26 ............ ......... ......... ......... 0
27 ............ ......... ......... ......... 0
28 ............ ......... ......... ......... 0
29 ............ ......... ......... ......... 0
30 ............ ......... ......... ......... 0
31 ............ ......... ......... ......... 0
32 ............ ......... ......... ......... 0
33 ............ ......... ......... ......... 0
34 ............ ......... ......... ......... 0
35 ............ ......... ......... ......... 0
36 ............ ......... ......... ......... 0
37 ............ ......... ......... ......... 0
38 ............ ......... ......... ......... 0
39 ............ ......... ......... ......... 0
40 Inibe video [0=desinibido 1=inibido]....... ......... 0
41 Define tela absoluta [0=desativado 1=ativado] ......... 0
42 Define tela relativa [0=desativado 1=ativado] ......... 0
43 Define tela padro [0=no gravada 1=gravada] ......... 0
44 ............ ......... ......... ......... 0
45 ............ ......... ......... ......... 0
46 ............ ......... ......... ......... 0
47 ............ ......... ......... ......... 0
48 ............ ......... ......... ......... 0
49 ............ ......... ......... ......... 0
50 ............ ......... ......... ......... 0
IPAR
quant=050
01 Numero maximo de linhas de IFREQ [30]......... ......... 30
02 Numero maximo de colunas de IFREQ [30]........ ......... 30
03 Numero maximo de pontos da matriz vd(4,num max) [0 a 350] 350
04 Intervalo de amostragem em segundos [Ts]...... ......... 90
05 Numero maximo de canais de entrada [1 a 8]... ......... 2
06 Numero maximo de canais de saida [1 a 8].. ......... 2
07 Numero de registro no buffer de armaz. [0 a 40] ......... 40
08 Numero de set-point disponveis [1 a 5][ver xdatar(41)].. 5
09 ............ ......... ......... ......... 0
10 Numero de neuronios da camada de entrada [1 a 50]........ 24
11 Numero de neuronios da camada escondida [1 a 50]........ 10
12 Numero de neuronios de entrada da variavel manipulada.... 14
13 ............ ......... ......... ......... 0
14 ............ ......... ......... ......... 0
15 Numero m x. iteracoes algoritmo D.V.S.[Variavel manip.].. 2000
16 ............ ......... ......... ......... 0
17 ............ ......... ......... ......... 0
18 ............ ......... ......... ......... 0
19 ............ ......... ......... ......... 0
20 ............ ......... ......... ......... 0
21 ............ ......... ......... ......... 0
Anexos 103
22 ............ ......... ......... ......... 0

23 ............ ......... ......... ......... 0
24 ............ ......... ......... ......... 0
25 ............ ......... ......... ......... 0
26 ............ ......... ......... ......... 0
27 ............ ......... ......... ......... 0
28 ............ ......... ......... ......... 0
29 ............ ......... ......... ......... 0
30 ............ ......... ......... ......... 0
31 ............ ......... ......... ......... 0
32 ............ ......... ......... ......... 0
33 ............ ......... ......... ......... 0
34 ............ ......... ......... ......... 0
35 ............ ......... ......... ......... 0
36 ............ ......... ......... ......... 0
37 ............ ......... ......... ......... 0
38 ............ ......... ......... ......... 0
39 ............ ......... ......... ......... 0
40 ............ ......... ......... ......... 0
41 ............ ......... ......... ......... 0
42 ............ ......... ......... ......... 0
43 Numero de variaveis a serem plotadas em video [1 a 3].... 3
44 Canal a ser plotado como 1@ variavel [1 a 16]. ......... 1
47 Numero de pontos do grafico [1 a 350]......... ......... 350
48 ............ ......... ......... ......... 0
49 ............ ......... ......... ......... 0
50 Tempo de espera para simulao (segundos)...... ......... 0
XDATAR
quant=100
01 Tempo de exibicao de tela relativa... ..[seg].. ......... 900.0000000
02 Hora de parar exibicao da tela relativa.[seg].. ......... .0000000
03 Tempo inicial dos dados gravados em disco [Usado L52].... 0.0000000
04 Erro medio quadrado [ E(set-point - xio)^2 ]... ......... .0000000
05 ......................................................... .0000000
06 Tempo de duracao da soma dos erros .. ......... ......... 21600.0000000
07 Passo para correcao dos pesos da rede [NETA]... ......... 0.0010000
08 Fator de inicializacao dos pesos RANDOM()/F [INICBPN].... -100.0000000
09 Valor inicial do canal de sada [usado p/ L106] ......... .0000000
10 Constante de tempo do processo em teste [TAU seg]........ 2400.9370000
11 Ganho proporcional .......... Kp1 [usado p/ teste]...... 1.2739580
12 Variavel da equacao usada para teste [senoide].... ...... 0.0000000
13 Tempo morto do processo em teste...[Seg]....... ......... 180.0000000
14 ............ ......... ......... ......... .0000000
15 Valor mnimo da funcao F(Xqp) p/ iteracoes D.V.S. [L106]. 0.000001
16 ............ ......... ......... ......... .0000000
17 Valor inferior para o tempo em graficos.[seg].se int i*4. .0000000
18 ............ ......... ......... ......... .0000000
19 ............ ......... ......... ......... .0000000
20 Tempo por ponto grafico.... ........ ......... ......... 90.0000000
21 ............ ......... ......... ......... .0000000
22 Valores temporarios usado pelas pertubacoes.... ......... .0000000
23 Valores tempor rios usado pela [BPN-Erro mdio] ......... .0000000
27 ............ ......... ......... ......... .0000000
28 ............ ......... ......... ......... .0000000
29 ............ ......... ......... ......... .0000000
30 ............ ......... ......... ......... .0000000
31 ............ ......... ......... ......... .0000000
32 ............ ......... ......... ......... .0000000
33 ............ ......... ......... ......... .0000000
34 ............ ......... ......... ......... .0000000
Anexos 104
35 ............ ......... ......... ......... .0000000

36 ............ ......... ......... ......... .0000000
37 ............ ......... ......... ......... .0000000
38 ............ ......... ......... ......... .0000000
39 ............ ......... ......... ......... .0000000
40 Valor da vari vel de sada [usado p/ pertub]... ......... .0000000
41 Set point do canal controlado [nvel I]...... ......... 100.0000000
42 Set point do canal controlado [nvel II]...... ......... 200.0000000
43 Set point do canal controlado [nvel III]...... ......... 300.0000000
44 Set point do canal controlado [nvel IV]...... ......... 400.0000000
45 Set point do canal controlado [nvel V]...... ......... 500.0000000
46 ............ ......... ......... ......... .0000000
47 ............ ......... ......... ......... .0000000
48 ............ ......... ......... ......... .0000000
49 ............ ......... ......... ......... .0000000
50 Set point do canal controlado[Usado p/ programa 0 a 5]... .0000000
51 Set point do canal 1 [Entrada]....... ......... ......... 300.0000000
52 Set point do canal 2 [Entrada]....... ......... ......... 300.0000000
53 Set point do canal 3 [Entrada]....... ......... ......... .0000000
59 Valor de equilibrio do canal 1 [Saida]......... ......... 2.5000000
60 Valor de equilibrio do canal 2 [Saida]......... ......... 2.5000000
61 Valor de equilibrio do canal 3 [Saida]......... ......... .0000000
67 ............ ......... ......... ......... .0000000
68 ............ ......... ......... ......... .0000000
69 Valor inicial do canal 1 [Entrada] [0 a 5]..... ......... .0000000
77 Valor inicial do canal 1 [Saida] [0 a 5]....... ......... 2.5000000
78 Valor inicial do canal 2 [Saida] [0 a 5]....... ......... 2.5250505
79 Valor inicial do canal 3 [Saida] [0 a 5]....... ......... .0000000
85 Tau [seg.] usado se Kflag(12) = 1.. ......... ......... 2400.9370000
86 Kp [volt/volt] usado se Kflag(12) = 1 ......... ......... 1.2739580
87 Tm [seg.] usado se Kflag(12) = 1..... ......... ......... 180.0000000
88 Kc [ constante do controlador ]... ......... ......... .0000000
89 1/Ti [ 1/Ki - tempo integral ]..... ......... ......... .0000000
90 Td [ Kd - tempo derivativo ]....... ......... ......... .0000000
91 d0 [ q0 ] ............ ......... ......... ......... .0000000
92 d1 [ q1 ] ............ ......... ......... ......... .0000000
93 d2 [ q2 ] ............ ......... ......... ......... .0000000
94 c1 [ constante da formula do control. PID ].. ......... .0000000
95 Tv [ altura do salto da resp. simul. do degrau ]....... .0000000
96 e(k) [ erro instante atual ]....... ......... ......... .0000000
97 e(k-1) [ erro instante anterior (-1) ]...... ......... .0000000
98 e(k-2) [ erro instante anterior (-2) ]....... ......... .0000000
99 d u(k-1) [ perturbacao instante anterior ]... ......... .0000000
Anexos 105
100 d u(k) [ perturbacao instante atual ]........ ......... .0000000

IDATAR
quant=050
01 Define eq. de teste [0=processo 1 ord 1=seno ] ......... 0
02 Tempo de duraao da perturbaao...... [seg,nTs] ......... 0
03 Pontos de controle do processo pela BPN [Usado por L106]. 0
04 Fator de controle [Ft * Ts para atingir SP] usado L106... 25
05 Set-point ativo [usado por CTRF4 e ALTF4][ver xdatar(41)] 3
06 Numero de observacoes p/ matriz de dados....... ......... 125
07 Ordem do polinomio de ACP. ......... ...[>1]. .......... 3
08 Parametro para calculo dos autovalores......... ......... 11
09 Canal de entrada a ser controlado.... ......... ......... 1
10 Canal de saida a ser controlado...... ......... ......... 1
11 Tamanho da janela de observacao disponiveia p/ treino DVS 1500
12 Numero de pontos para o grafico de video.[Val inicial=0]. 0
13 Tipo de pertubacao [usado por CNFPERT]......... ......... 0
14 Valores tempor rios para pertubaao.. ......... ......... 0
19 Define controlador em atividade [0=s/ contr. 1=c/contr.] 0
20 Define pert. em atividade [0=s/ pert. 0<>c/pert.]........ 0
21 Define Rede Backpropagation em atividade [1=ON 0=OFF].... 0
22 Define Bias na camada escondida da rede..[1=ON 0=OFF].... 0
23 Define Bias na camada de sada da rede...[1=ON 0=OFF].... 0
24 ............ ......... ......... ......... 0
25 ............ ......... ......... ......... 0
26 ............ ......... ......... ......... 0
27 Define tipo de treino [1=STEEP DESCENT 2=DVS].. ......... 2
28 Define controlador[1=BPN 2=PID 3=PI 4=P 5=PD 0=Nao def.]. 2
29 Tempo de amostragem do PID : numero * ipar(4)[Ts]..... 1
30 Endereco base da placa de entrada [Hexadecimal] ......... 220
31 Endereco base da placa de saida [Hexadecimal] ......... 224
32 Numero de leituras da placa A/D...... ......... ......... 10
33 Contador de nTs da soma dos erros.... ......... ......... 0
34 Contador de nTs de aplicacao de pertubacao..... ......... 0
35 Numero de Ts a ser aplicado a pertubacao....... ......... 0
36 Contador de aplicacao da rotina l103. ......... ......... 0
37 Numero de Ts a ser utilizado na soma dos erros ......... 0
38 Contador de nTs passados (usado por DVS)....... ......... 0
39 ............ ......... ......... ......... 0
40 Armazenamento de Tela gr fica [usado em TelaInic.for].... 0
41 ....... . . . . . . . . . . . . . . . . ...... ......... 0
42 Nmero de neurnios na camada escondida [D.V.S.] ........ 0
43 ............ ......... ......... ......... 0
44 ............ ......... ......... ......... 0
45 ............ ......... ......... ......... 0
46 Nmero do canal de sada com pertubao........ ......... 2
47 ............ ......... ......... ......... 0
48 Contador do buffer de armaz. em disco .[L51 Val. inic.00] 0
49 Indicador de rotina que utilizou a tela ....... ......... 0
50 ............ ......... ......... ......... 0
VARIAVEL [Tamanho m ximo 10 caracteres]
quant=016
01 Temperatura T1 -canal de entrada ......... Temp. C
02 Sada da rede..-canal de entrada ......... Temp. C
03 ............ ..-canal de entrada .........
04 ............ ........."......... .........
05 ............ ........."......... .........
06 ............ ........."......... .........
07 ............ ........."......... .........
08 ............ ........."......... .........
09 Resistencia R...canal de saida.. ......... Resist.(V)
10 ............ ......... ......... ......... Resist.(V)
Anexos 106
11 ............ ........."......... .........

12 ............ ........."......... .........
13 ............ ........."......... .........
14 ............ ........."......... .........
15 ............ ........."......... .........
16 ............ ........."......... .........
TITULO [Tamanho m ximo 35 caracteres]
quant=016
01 Temperatura T1 -canal de E Gr fico da Temperatura
02 Rede em caso de Teste.de E Valor de Sada da Rede
03 ............ .........de E
04 ............ ........."...
05 ............ ........."...
06 ............ ........."...
07 ............ ........."...
08 ............ ........."...
09 Resistencia. ...canal de s Vari vel Manipulada
10 ............ ........."... Pertubaao Aplicada
11 ............ ........."...
12 ............ ........."...
13 ............ ........."...
14 ............ ........."...
15 ............ ........."...
16 ............ ........."...
Anexos 107
Anexo III - Arquivos de Configuraes do Software RTX
Arquivo CORES.DAT[0=Preta 1=Azul 2=Verde 3=Cyan 4=Verm 5=Magen 6=Pardo

quant=12 [7=Bran 8=Verd Esc {9,10,11,12,13}=Azul Clar. 14=Amar 15=Bran Int.
01 Cor de fundo da tela de trabalho ........................ 15
02 Cor de fundo das janelas de aviso ....................... 01
03 Cor das molduras ........................................ 00
04 Cor de escrita destacada................................. 15
05 Cor do ponto grafico..................................... 00
06 Cor dos eixos dos graficos............................... 00
07 Cor dos Titulos dos graficos............................. 00
08 Cor da area do Menu de Opoes das teclas................. 03
09 Cor da linha do Set-Point ............................... 00
10 Cor da escrita na area de mensagens na tela principal.... 00
11 Cor da area dos graficos................................. 15
12 Cor da escrita do Menu de Opcoes......................... 00
configurao 94 - ARQUIVO | PULSO.DAT

versao=2.0 :07 Jul 95
IDATAR
quant= 07
01 ..idatar(02) - nulo..................................... 0
02 ..idatar(13) - tipo da perturbacao...[=2]............... 2
03 ..idatar(14) - altura do salto... [% do span]........... 50
04 ..idatar(15) - duracao do pulso... [seg,>Ts]............ 90
05 ..idatar(16) - nulo..................................... 0
06 ..idatar(17) - nulo..................................... 0
07 ..idatar(18) - nulo..................................... 0
configuracao 94 - ARQUIVO | DEGRAU.DAT

versao= 2.0 : 07 Jul 95 .
IDATAR .
quant= 07
01 ..idatar(02) - tempo de duracao da perturbacao...[seg]..18000
03 ..idatar(14) - altura do salto...[% do span]............ 50
04 ..idatar(15) - nulo..................................... 1
05 ..idatar(16) - nulo..................................... 1
06 ..idatar(17) - nulo..................................... 1
07 ..idatar(18) - nulo..................................... 1
configuracao 94 - ARQUIVO | PRBS.DAT

versao= 2.0 : 07 Jul 95 .
IDATAR .
quant= 07
01 ..idatar(02) - tempo de duracao da perturbacao..[seg]...10800
03 ..idatar(14) - altura do salto...[% do span]............ 50
04 ..idatar(15) - duracao do pulso elementar...[seg,nTs]... 540
05 ..idatar(16) - comprimento do registro gerador.......... 8
06 ..idatar(17) - 1o. registro de feedback................. 1
07 ..idatar(18) - 2o. registro de feedback................. 1
Anexos 108
configuracao 94 - ARQUIVO | PULSOC.DAT

versao=2.0 :07 Jul 95 .
IDATAR .
quant= 07
01 ..idatar(02) - tempo de aplicacao da pertubacao.[seg]... 7200
03 ..idatar(14) - altura do salto... [% do span]........... 30
04 ..idatar(15) - duracao do pulso... [seg,>Ts]............ 90
05 ..idatar(16) - intervalos de aplicacao dos pulsos [seg]. 360
06 ..idatar(17) - flag de treino da rede [1=cont. 0=desc].. 1
07 ..idatar(18) - contador da aplicacao da pertubacao...... 0
configuracao 94 - ARQUIVO | SENO.DAT

versao= 2.0 : 07 Jul 95 .
IDATAR .
quant= 07
01 ..idatar(02) - tempo de duracao da perturbacao..[seg]...10800
03 ..idatar(14) - amplitude da senoide...[% do span]....... 25
04 ..idatar(15) - periodo da senoide...[seg]............... 1800
05 ..idatar(16) - nulo..................................... 0
06 ..idatar(17) - nulo..................................... 0
07 ..idatar(18) - nulo..................................... 0
Anexos 109
Anexo IV - Equao do controlador PID no modo discreto
Partindo-se da equao 2I temos que:
M ( z) T ( z + 1) d z 1
H ( z) = = Kc 1 + s + ou seja:
E ( z) 2i ( z 1) zTs 1 + T ( z 1) ( zTs )
M ( z) T z + 1 d z 1
H ( z) = = Kc 1 + s +
E ( z) 2i z 1 Ts z (1 + T / Ts ) T / Ts

M ( z) T z + 1 d Ts z 1
H ( z) = = K c 1 + s +
E ( z) 2 i z 1 1 + T Ts T

z
Ts
T
1 + Ts

T
Ts T
definindo c1 = = temos;
1+ T T T + Ts
s
Kc Ts (1 + T Ts ) z + 1 d z 1
H ( z) = (1 + Ts ) +
T +
1 + T Ts 2 i z 1 Ts z + c1
z
multiplicando-se as fraes por obtemos;
z
Kc (Ts 2i )(1 + T Ts )(1 + z 1 ) ( d Ts )(1 z 1 )

H ( z) = (1 + T
) + +
1 + T Ts (1 z 1 ) (1 + c1z 1 )
Ts

Kc (1 + T T )(1 z 1 )(1 + c1z 1 ) + (Ts 1 1 1 1

2 i )(1 + T T )(1 + z )(1 + c1z ) + ( d Ts )(1 z ) (1 z )
s s
H (z) = 1 1
1+ TT (1 z )(1 + c1z )
s
Ts + T d T + T T + d
definindo d o' = (1 + T Ts ) + + = 1+ s + ,
2i Ts 2i Ts
Ts + T T + T 2 d T 2(T + d )
d1' = (1 + T Ts ) + c1 (1 + T Ts ) + + c1 s = 1 + s e
2i 2i Ts 2i Ts
Anexos 110
Ts + T d T + d T
d 2' = c1 (1 + T Ts ) + c1 + = s e aplicando, temos;
2 i Ts Ts 2 i
M ( z) Kc d 0' + d1' z 1 + d 2' z 2 d 0 + d1z 1 + d 2 z 2

H ( z) = = 1 1
= 1 1
E ( z ) 1 + T Ts (1 z )(1 + c1z ) (1 z )(1 + c1z )
sendo definidos:
Kc Ts + T T + d
d0 = 1 + + ,
1 + T Ts 2 i Ts
Kc Ts 2(T + d ) Kc T + d Ts
d1 = 1 + e d2 =
1 + T Ts 2i Ts 1 + T Ts Ts 2i
Sabendo que Z{ f (k m)} = z m F ( z ) tem-se o algoritmo na forma discreta dado por:
m( k ) = d 0 e( k ) + d1e( k 1) + d 2 e( k 2 ) + (1 c1 ) m( k 1) + c1m( k 2 )
Considerando as variveis desvios:

m(k ) = m(k ) m(k 1) e m(k 1) = m(k 1) m(k 2)
temos que;
m(k ) = d 0e(k ) + d1e(k 1) + d 2e(k 2) c1m(k 1)
portanto, a equao acima utilizada para a implantao de um controlador PID no modo
discreto.

Controle de Processos Com Redes Neurais Inversas

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Controle de Processos Com Redes Neurais Inversas

Hochgeladen von

Copyright:

Verfügbare Formate

UNIVERSIDADE ESTADUAL DE MARING

Gilberto Clvis Antonelli

Orientador: Prof. Ivo Neitzel, D.Sc.

Dissertao de Mestrado submetida

Esta a verso final da dissertao de Mestrado apresentada por Gilberto Clvis

Prof. Ivo Neitzel, D.Sc.

Prof. Ariovaldo Bolzan, D.Sc.

Prof. Mauro Antonio da Silva S Ravagnani, Dr.Eng.

minha esposa, Silvana Adriani Remundini, minha princesa,

Agradeo a todas as pessoas que direta ou indiretamente contriburam para a

a meu irmo, Umberto Carlos Antonelli(in memorium), que me mostrou o caminho da

a meu orientador, Prof. Ivo Neitzel, que me ajudou grandemente em todos os

a minha amiga, Adriana Rossoni Pedrozo do Nascimento, que juntos montamos o

e ao CNPQ, que me auxiliou financeiramente durante a elaborao deste trabalho.

AUTOR: GILBERTO CLVIS ANTONELLI

ORIENTADOR: PROF. DR. IVO NEITZEL

Dissertao de Mestrado; Programa de Ps-Graduao em Engenharia Qumica; Universidade

AUTHOR: GILBERTO CLVIS ANTONELLI

SUPERVISOR: PROF. DR. IVO NEITZEL

Dissertao de Mestrado; Programa de Ps-Graduao em Engenharia Qumica; Universidade

3. REDE NEURAL ARTIFICIAL..............................................................................................10

3.4. Consideraes Prticas ............................................................................................. 21

4. AQUECEDOR DE AR, O MDULO DE TESTES .................................................................... 24

6.2. Transferncia de Informaes Entre os Rotinas ...................................................... 39

6.3.4. Inicializao do Controlador PID................................................................................. 45

6.6. Rotinas da Pilha de Execuo ................................................................................. 51

6.7. Rotinas de Apoio ..................................................................................................... 54

8.3. Conjunto de dados de treino..................................................................................... 69

10.3. Performance do Controlador RN com Treinamento

10.4. PID x RN ................................................................................................................ 89

Figura 2.1 Diagrama de Blocos do Controle Autosintonizante

Figura 7.2 Teste de Ajuste do Controlador RN para o

Figura 9.16 Resposta do Sistema Simulado a uma Perturbao PULSO ........................... 83

Tabela 6.1 Caractersticas das Placas A/D e D/A.............................................................. 42

a constantes do processo de primeira ordem na forma discreta

valor lquido de entrada do EP; valor de ativao; ativao

BPN rede neural artificial BackPropagation

RNSD controlador RN com treinamento Steepest Descent

Um sistema de controle autosintonizante uma tcnica na qual, o controlador em

Figura 2.1 - Diagrama de Blocos do Controle Autosintonizante

As constantes e o tempo morto sero determinadas a partir da resposta do processo a

2.1 Sintonia do Controlador PID

Neste trabalho ajustamos um controlador PID a um sistema de 1 ordem com tempo

A ao ideal de um controlador PID em termos dos modos proporcional, integral e

Figura 2.2 - Representao grfica da ao de controladores da famlia PID

Na Figura 2.2a temos a ao do controlador constante desde o tempo inicial t=0. No

Observamos que na prtica a implementao de controladores com modo integral e

2.1.1 Integrador eletrnico

Os integradores eletrnicos so construdos de acordo com o esquema da Figura 2.3,

Figura 2.3 - Integrador eletrnico

2.1.2 Diferenciador eletrnico

Notamos que para um dado valor de d, a aproximao necessita de pequenos valores

Figura 2.4 - Diferenciador eletrnico

2.1.3 Controlador PID eletrnico

A maior dificuldade no ajuste de um controlador PID eletrnico est no mdulo

Figura 2.5 - Representao grfica da ao de um

2.1.4 Controlador PID digital

Neste trabalho implementamos um controlador digital utilizando o algoritmo da

onde Ts o tempo de amostragem do processo.

m(k ) = d 0e(k ) + d1e(k 1) + d 2e(k 2) c1m(k 1) (2J)

m(k) = diferena entre a ao do controlador no instante (k) e no instante(k-1)

Utilizando esse algoritmo implementamos no programa de controle os controladores P,

3.1 Definio e aplicao

As redes neurais so construdas com camadas altamente interconectadas de simples