Beruflich Dokumente
Kultur Dokumente
2008/3/11
page
i
i
i
i
i
i
i
i
Conte udo
1 Introdu cao 1
1.1 Apresenta c ao dos Sistemas de Controle . . . . . . . . . . . 1
1.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 Aquecimento de um Quarto . . . . . . . . . . . . . 5
1.2.2 Um Problema de Controle Discreto . . . . . . . . . 7
1.2.3 Um Problema de Tempo Mnimo . . . . . . . . . . 11
1.2.4 Lan camento de um Foguete . . . . . . . . . . . . . 12
1.2.5 Equilbrio de um Bast ao . . . . . . . . . . . . . . . 13
1.2.6 Concentra c ao de Chumbo no Corpo Humano . . . 16
1.2.7 A Braquistocrona . . . . . . . . . . . . . . . . . . . 18
1.2.8 Um Problema de Controle
Otimo . . . . . . . . . . 21
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Observabilidade 26
2.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 26
2.2 Subespa co n ao Observavel . . . . . . . . . . . . . . . . . . 33
2.3 Reconstru c ao de Estados . . . . . . . . . . . . . . . . . . . 35
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Controlabilidade 39
3.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Controlabilidade e Observabilidade . . . . . . . . . . . . . 42
3.3 Sistemas de Controle Aut onomos . . . . . . . . . . . . . . 44
3.4 Forma Normal dos Sistemas Aut onomos . . . . . . . . . . 47
3.5 Controlabilidade e Estrategias
Otimas . . . . . . . . . . . 51
3.6 Atingibilidade de Estados com Restri c oes de Controle . . 54
3.7 Princpio do BangBang e Problemas de Tempo Mnimo . 60
3.8 Controlabilidade de Sistemas Lineares Discretos . . . . . . 65
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
4 Estabilidade 71
4.1 Conceito e Exemplos . . . . . . . . . . . . . . . . . . . . . 71
4.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . 75
4.3 Criterio de RouthHurwitz . . . . . . . . . . . . . . . . . 78
4.4 Perturba c ao de Sistemas Lineares . . . . . . . . . . . . . . 81
4.5 Metodo de Lyapunov . . . . . . . . . . . . . . . . . . . . . 87
4.6 Equa c ao Matricial de Lyapunov . . . . . . . . . . . . . . . 92
4.7 Estabilidade de Sistemas Lineares Discretos . . . . . . . . 96
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5 Estabiliza cao 101
5.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 102
5.2 Coloca c ao de Polos . . . . . . . . . . . . . . . . . . . . . . 105
5.3 Observador Din amico . . . . . . . . . . . . . . . . . . . . 109
5.4 Estabiliza c ao por Realimenta c ao de Sada . . . . . . . . . 114
5.5 Pontos de Opera c ao . . . . . . . . . . . . . . . . . . . . . 116
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6 Identica cao de Parametros 120
6.1 Controle Automatico . . . . . . . . . . . . . . . . . . . . . 120
6.2 Identicabilidade . . . . . . . . . . . . . . . . . . . . . . . 121
6.3 Identica c ao Adaptativa: Introdu c ao . . . . . . . . . . . . 126
6.4 Identica c ao Adaptativa: Estabilidade . . . . . . . . . . . 131
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7 Calculo Variacional 138
7.1 Problemas Variacionais e Convexidade . . . . . . . . . . . 139
7.2 Lemas de du BoisReymond e Lagrange . . . . . . . . . . 145
7.3 Equa c ao de EulerLagrange . . . . . . . . . . . . . . . . . 147
7.4 Extremais Diferenciaveis por Partes . . . . . . . . . . . . 156
7.5 Problemas Vetoriais . . . . . . . . . . . . . . . . . . . . . 164
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8 Princpios Variacionais na Mecanica 168
8.1 Mec anica Newtoniana . . . . . . . . . . . . . . . . . . . . 168
8.2 Teoremas Conservativos em Sistemas Fechados . . . . . . 177
8.3 Mec anica Lagrangeana . . . . . . . . . . . . . . . . . . . . 178
8.4 Mec anica Hamiltoniana . . . . . . . . . . . . . . . . . . . 183
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
9 Calculo Variacional e Controle
Otimo 192
9.1 O que e Controle
Otimo . . . . . . . . . . . . . . . . . . . 192
9.2 Problemas Variacionais com Restri c ao . . . . . . . . . . . 194
9.3 Extremais Singulares e Trajetorias
Otimas . . . . . . . . . 202
9.4 Controle
Otimo e Convexidade: condi c oes sucientes . . . 207
9.5 Controle
Otimo e Convexidade: condi c oes necessarias . . 211
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
10 Princpio do Maximo 216
10.1 Problemas com Horizonte Finito . . . . . . . . . . . . . . 217
10.2 Problemas com Horizonte Innito . . . . . . . . . . . . . . 222
10.3 Aplica c oes do Princpio do Maximo . . . . . . . . . . . . . 226
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
11 Programa cao Dinamica Discreta 244
11.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
11.2 Problema do Caminho Simples . . . . . . . . . . . . . . . 246
11.3 Problema da Substitui c ao de Equipamento . . . . . . . . 251
11.4 Problema do Caixeiro Viajante . . . . . . . . . . . . . . . 253
11.5 Problema Linear-Quadratico Discreto . . . . . . . . . . . 256
11.6 Problema de Decis oes Consecutivas . . . . . . . . . . . . . 260
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
12 Programa cao Dinamica Contnua 268
12.1 Fun c ao Valor
Otimo . . . . . . . . . . . . . . . . . . . . . 268
12.2 Princpio de Bellman . . . . . . . . . . . . . . . . . . . . . 274
12.3 Equa c ao de HamiltonJakobiBellman . . . . . . . . . . . 276
12.4 Problema de Controle Linear-Quadratico . . . . . . . . . . 285
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
13 Solu c oes Viscosas e Fun cao Valor 299
13.1 Solu c oes Viscosas de EDPs . . . . . . . . . . . . . . . . . 299
13.2 Formula de HopfLax . . . . . . . . . . . . . . . . . . . . 307
13.3 Fun c ao Valor como Solu c ao Viscosa de HJB . . . . . . . . 312
13.4 Princpio do Maximo . . . . . . . . . . . . . . . . . . . . . 317
13.5 Unicidade de Solu c oes Viscosas . . . . . . . . . . . . . . . 323
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
Apendice A: Equa c oes Diferenciais Ordinarias 329
A.1 Exponencial de uma Matriz . . . . . . . . . . . . . . . . . 329
A.2 Sistemas Lineares Aut onomos . . . . . . . . . . . . . . . . 331
A.3 Sistemas Lineares n ao Aut onomos . . . . . . . . . . . . . 336
A.4 Sistemas n ao Lineares: existencia e unicidade . . . . . . . 342
A.5 Sistemas n ao Lineares: dependencia contnua . . . . . . . 347
A.6 Metodo de Shooting . . . . . . . . . . . . . . . . . . . . . 350
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
Apendice B: Demonstra cao do Princpio do Maximo 356
B.1 Otimiza c ao Innita . . . . . . . . . . . . . . . . . . . . . . 356
B.1.1 Um Problema Abstrato de Otimiza c ao . . . . . . . 357
B.1.2 Lineariza c ao do Problema de Otimiza c ao . . . . . 359
B.1.3 Condi c oes Necessarias para o Problema Abstrato . 367
B.2 Um Problema Auxiliar . . . . . . . . . . . . . . . . . . . . 370
B.3 Condi c oes Necessarias para Otimalidade . . . . . . . . . . 379
Lista de Smbolos 383
Bibliograa 385
ACIO
disso, s ao fornecidas referencias bibliogracas correspondentes. O leitor
deve car atento particularmente aos seguintes trechos do manuscrito:
nos captulos sobre controlabilidade e sobre controle otimo s ao utiliza-
dos alguns conceitos elementares de teoria de medida e integra c ao de
Lebesgue; nas sec c oes sobre controles restritos e sobre atingibilidade
no captulo de controlabilidade s ao utilizados resultados e deni c oes es-
peccos de analise funcional.
A op c ao pela utiliza c ao de tais ferramentas matem aticas se justica
pela import ancia, dentro da teoria de controle, dos resultados que po-
dem ser demonstrados como decorrencia de sua aplica c ao (e.g., princpio
do BangBang; convexidade e compacidade de conjuntos de estados
atingveis com controles restritos; princpio do maximo para controles
Lebesgue integraveis).
Na escolha dos temas abordados, buscamos o equilbrio entre os
meios (argumentos matematicos, eventualmente n ao elementares) e os
ns (resultados da teoria de controle). Tal tarefa se mostrou n ao tri-
vial, diante do fato de tratar-se de um texto introdutorio e da teoria em
quest ao possuir diversas vertentes. A abordagem de outros resultados
relevantes (e.g., problemas H
ACIO
A primeira parte do texto e iniciada com a apresenta c ao, na forma
de exemplos, de diferentes aspectos da teoria de controle. Na seq uencia
s ao abordados os conceitos de controlabilidade, observabilidade e esta-
bilidade, assim como suas inter-rela c oes. Esta parte e concluida com a
discuss ao de dois problemas cruciais em aplica c oes tecnologicas (veja,
e.g., [An]), a saber: a estabiliza c ao de sistemas e a reconstru c ao (ou
identica c ao) de par ametros.
Em sua segunda parte, o manuscrito trata dos problemas de con-
trole otimo. A abordagem e conduzida atraves de uma incurs ao inicial
pelo c alculo de varia c oes. No que diz respeito `as condi c oes necessarias
para otimalidade, a extens ao `a teoria de controle otimo dos resultados
classicos do calculo variacional e, no ponto de vista dos autores, o modo
mais natural para se compreender o mecanismo de funcionamento de
tais condi c oes. Na seq uencia, discutimos como condi c oes necessarias
para otimalidade s ao formuladas no contexto da mec anica Hamiltoni-
ana (equa c ao de HamiltonJacobi). O objetivo principal desta parte do
manuscrito e colocar em evidencia a rela c ao entre a equa c ao de Euler
Lagrange e o princpio do m aximo. Por ser extremamente tecnica, a
demonstra c ao do princpio do maximo e apresentada no Apendice B.
A terceira parte do texto trata da metodologia denominada de pro-
grama c ao din amica, que objetiva encontrar solu c oes para problemas de
controle otimo atraves da resolu c ao de uma equa c ao diferencial parcial,
a saber: a equa c ao de HamiltonJacobiBellman (ou HJB). A solu c ao
desta equa c ao e denominada fun c ao valor e esta intrinsecamente rela-
cionada com o problema original de controle otimo. Recentemente,
muito tem sido feito pelo lado analtico da caracteriza c ao das solu c oes da
equa c ao HJB. Este e um topico bastante atual de pesquisa, tendo ren-
dido a um de seus fundadores (P.L. Lions) a medalha Fields em 1996.
Neste sentido o ultimo captulo desta parte e destinado ao estudo das
solu c oes de viscosidade de equa c oes diferenciais parciais e da caracteri-
za c ao da fun c ao valor como solu c ao viscosa da equa c ao HJB.
Descri cao detalhada do conte udo
No Captulo 1 e apresentada, atraves da analise de exemplos, uma in-
trodu c ao `a teoria. Em cada exemplo s ao discutidos e ilustrados conceitos
basicos, ao mesmo tempo que e apresentada uma diferente aplica c ao da
teoria de controle. A maior parte destas aplica c oes e discutida nova-
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
mente em detalhes ao longo do texto. Dentre os exemplos abordados
destacamos: aquecimento de um quarto (equa c ao de EulerLagrange
e calculo variacional); problema de controle discreto (multiplicadores
de Lagrange); problema de tempo mnimo (solu c oes tipo BangBang);
equilbrio de um bast ao (estabiliza c ao de sistemas); concentra c ao de
chumbo no corpo (reconstru c ao de par ametros); problema de controle
otimo (princpio do maximo de Pontryagin).
No Captulo 2 discutimos o conceito de observabilidade de sistemas
lineares de controle.
E feita a distin c ao entre os estados observaveis, n ao
observaveis e detectaveis. Na ultima sec c ao e apresentada uma tecnica
de reconstru c ao de estados a partir de observa c oes.
O Captulo 3 se destina a investigar o conceito de controlabilidade
de sistemas. Sistemas lineares e aut onomos s ao analisados separada-
mente. Discutimos a rela c ao entre a controlabilidade de um sistema
linear e a observabilidade do seu sistema adjunto. Apresentamos ainda
o teorema de Kalman (forma normal) para sistemas lineares aut onomos.
Analisamos propriedades topologicas de conjuntos de estados atingveis,
quando o problema de controle e considerado com controladores restri-
tos. O princpio do BangBang e sua rela c ao com os problemas de tempo
mnimo s ao tambem investigados. A ultima sec c ao trata do controle de
sistemas discretos.
No Captulo 4 e discutida a estabilidade de sistemas din amicos. In-
troduzimos o conceito de pontos de equilbrio estaveis e apresentamos
criterios de estabilidade para sistemas lineares. Criterios algebricos para
estabilidade (como o criterio de Hurwitz) s ao tratados em uma sec c ao
a parte. S ao analisados ainda sistemas obtidos por perturba c oes de sis-
temas lineares estaveis. S ao discutidos o criterio de estabilidade de Lya-
punov e a equa c ao matricial de Lyapunov, uma condi c ao necessaria e
suciente para determina c ao de estabilidade. Na ultima sec c ao e abor-
dado o criterio de Lyapunov para sistemas discretos.
No Captulo 5 e analisada uma aplica c ao classica da teoria de con-
trole, a saber: a estabiliza c ao de sistemas.
E feito uso da teoria desen-
volvida nos captulos anteriores a m de tratar este que e, sem sombra de
d uvida, um dos problemas mais importantes relacionado com aplica c oes
`a engenharia. Abordamos a estabiliza c ao por realimenta c ao de estado
(state feedback) para sistemas lineares assim como uma quest ao quanti-
tativa relacionada a estabiliza c ao por realimenta c ao de estado.
E ana-
lisado ainda o engenhoso metodo proposto por Luenberger (observador
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
din amico), que permite simultaneamente a reconstru c ao de estados e es-
tabiliza c ao do sistema. Consideramos tambem o problema de estabilizar
sistemas utilizando realimenta c ao de sada (output feedback). Na ultima
sec c ao s ao tratados sistemas com pontos de opera c ao desconhecidos.
No Captulo 6 tratamos uma segunda aplica c ao relevante da teoria
de controle, a denominada identica c ao de par ametros. Estudamos o
problema de determinar par ametros desconhecidos de um sistema de
controle, a partir de certa quantidade de experimentos, nos quais s ao
conhecidos a entrada (input) e a sada (output) do sistema. Inicial-
mente s ao formalizadas deni c oes relevantes. Na seq uencia s ao discuti-
dos metodos iterativos de identica c ao.
O captulo 7 introduz o calculo variacional classico. Na primeira
sec c ao s ao obtidas, sob hipoteses adicionais de convexidade, condi c oes
necessarias e sucientes para otimalidade de um extremal. Na seq uencia
s ao apresentados o lema de du BoisReymond, o desenvolvimento da
equa c ao de EulerLagrange e a obten c ao de diferentes tipos de condi c oes
naturais de contorno. S ao considerados ainda problemas variacionais
que admitem solu c oes diferenciaveis por partes e deduzidas condi c oes
necessarias para otimalidade (equa c ao de EulerLagrange e condi c ao de
WeierstrassErdmann). Na ultima sec c ao, os resultados anteriores s ao
estendidos a problemas vetoriais.
No Captulo 8 discutimos a abordagem variacional para problemas
da mec anica. Na seq uencia apresentamos os formalismos relacionados
as mec anicas Newtoniana, Lagrangeana e Hamiltoniana. O objetivo
principal do captulo e a obten c ao de uma interpreta c ao fsica para a
equa c ao de HamiltonJacobi.
No Captulo 9 e apresentada uma analogia entre os problemas
variacionais e os problemas de controle otimo. Inicialmente s ao tratados
problemas variacionais sujeitos a restri c oes transversais, lagrangeanas e
isoperimetricas, e obtidas as correspondentes condi c oes necessarias para
otimalidade. A analogia com os problemas de controle e feita atraves
de exemplos. Na seq uencia consideramos problemas variacionais que ad-
mitem a existencia de extremais singulares. Neste caso os
problemas de controle correspondentes possuem solu c ao do tipo Bang
SingularBang. Analisamos ainda condi c oes sucientes para otimali-
dade de estrategias de controle, sob hipoteses adicionais de convexidade
da hamiltoniana. Ainda utilizando hipoteses de convexidade, e demons-
trada na ultima sec c ao uma vers ao simplicada do princpio do maximo.
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
No Captulo 10 e formulado o princpio do maximo de Pontrya-
gin. Trata-se de um conjunto de condi c oes necessarias para otimalidade
de problemas de controle que, em sua natureza, muito se assemelha `a
equa c ao de EulerLagrange. Uma demonstra c ao do princpio do maximo
e apresentada no apendice B. Nas tres primeiras sec c oes analisamos vari-
antes do princpio do maximo para problemas com horizonte nito, com
horizonte innito e para problemas impulsivos. Na ultima sec c ao s ao re-
solvidos varios problemas atraves da utiliza c ao do princpio do maximo.
No Captulo 11 apresentamos os conceitos basicos da programa c ao
din amica para problemas discretos (tempo discreto). Atraves da analise
de diversos exemplos, s ao introduzidas a fun c ao valor, a equa c ao de oti-
malidade e as condi c oes de contorno correspondentes. Entre os exemplos
mais importantes est ao o caixeiro viajante; din amica linear com custo
quadratico; decis oes consecutivas.
No Captulo 12 apresentamos a forma contnua da programa c ao
din amica.
Enfase e dada `a obten c ao da equa c ao da equa c ao de Euler
Lagrange, ao princpio de otimalidade de Bellman e a teoremas sobre a
regularidade da fun c ao valor.
No Captulo 13 e introduzido o conceito de solu c oes viscosas para
equa c ao HJB. A formula de HopfLax e obtida a partir da analise de
uma famlia particular de problemas de controle otimo.
E vericado o
fato da fun c ao valor ser uma solu c ao viscosa da equa c ao HJB e, sob
condi c oes especiais, provamos um resultado de unicidade.
Sugest oes para Utilizacao do manuscrito
O manuscrito, na forma em que se apresenta, pode ser coberto inte-
gralmente em dois cursos de um semestre (carga horaria de quatro horas
por semana).
E ainda possvel preparar, com base no manuscrito, dife-
rentes cursos de um semestre (novamente de quatro horas por semana),
com os seguintes enfoques:
i) Partes I, II e Apendices: curso de teoria de controle.
ii) Partes II, III e Apendice B: curso de controle otimo e programa c ao
din amica.
iii) Captulos 1 a 5, 7, 9, 10, 12: vers ao reduzida do curso de dois
semestres; a demonstra c ao no Apendice B pode ser apresentada
pelos alunos na forma de seminarios.
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
Sobre a confeccao do manuscrito
O projeto de elabora c ao do presente manuscrito iniciou-se com a con-
fec c ao das notas para o minicurso T opicos em teoria de controle, apresen-
tado durante o XXII CNMAC (Santos, 1999) por A. Leit ao. Posterior-
mente, essas notas foram acrescidas das notas de aula dos cursos Teoria
de controle A e B (ministrados pelo mesmo autor em 1998 na UFSC). A
linha mestra destes cursos foi por sua vez fortemente inuenciada pelas
disciplinas Steuerungstheorie e Variationsrechnung, ministradas por J.
Baumeister na Goethe Universitat em 1995 e 1996 respectivamente. A
composi c ao das diferentes notas de aula de ambos os autores deu orgem
ao presente material.
O n umero de problemas e aplica c oes que podem ser tratados no
contexto da teoria de controle vem crescendo de forma consideravel nas
ultimas decadas, o que pode ser comprovado pelo n umero cada vez maior
de grupos de pesquisa e periodicos especializados nesta area. Tal fato
pode ser interpretado como um reexo das necessidades da sociedade
moderna, que cada vez mais prioriza a execu c ao de tarefas de forma
precisa e eciente. Inserida neste contexto esta a proposta do presente
manuscrito, que pretende servir como orienta c ao inicial a todos os que
desejem ingressar nesta interessante e promissora area.
Johann Baumeister Frankfurt am Main
Antonio Leit ao Florianopolis
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
steuer
2008/3/11
page 1
i
i
i
i
i
i
i
i
Captulo 1
Introducao
O objetivo deste captulo e apresentar ao leitor a teoria de controle
atraves da analise de algumas de suas aplica c oes mais relevantes. Com
este intuito s ao introduzidos na Sec c ao 1.1 alguns conceitos elementares,
essenciais para a formula c ao dos problemas de controle. Na Sec c ao 1.2
s ao abordados diferentes problemas no contexto da teoria de controle,
fornecendo assim uma ideia da versatilidade da aplica c ao desta teoria.
Os exemplos mais relevantes apresentados nesta sec c ao s ao posterior-
mente abordados ao longo do texto.
1.1 Apresentacao dos Sistemas de Controle
Considere a famlia de problemas em que um determinado n umero
de variaveis que dependem do tempo x
1
(t), . . . , x
n
(t) tem sua evolu c ao
descrita por uma equa c ao da forma
(1.1) x = F(t, x),
onde F : RR
n
R
n
e uma fun c ao conhecida que descreve a din amica
da evolu c ao e x(t) = (x
1
(t), . . . , x
n
(t)) R
n
e o vetor de vari aveis de
estado, cujas componentes s ao as quantidades que desejamos acompa-
nhar. Tais variaveis representam, no instante de tempo t, as condi c oes
nas quais se encontra o processo que esta sendo modelado. A seguir e
apresentado um exemplo ilustrativo.
steuer
2008/3/11
page 2
i
i
i
i
i
i
i
i
2 [CAP. 1: INTRODUC
AO
Exemplo 1 (Deslocamento de um corpo). Para representar o co-
nhecido problema de deslocamento da cinematica utilizamos o seguinte
modelo:
t : tempo;
m : massa do corpo;
x(t) : velocidade no tempo t;
x(t) : acelera c ao no tempo t;
T(t) : for ca exercida sobre o corpo no tempo t.
Observe que a lei de Newton nos fornece a equa c ao
x(t) =
1
m
T(t),
que e uma caso particular da equa c ao (1.1) 2
Se consideramos a possibilidade de exercer inuencia sobre o
lado direito do sistema (1.1) atraves da escolha dos par ametros livres
u
1
(t), . . . , u
m
(t), a equa c ao (1.1) toma a forma
(1.2) x = F(t, x, u),
onde u(t) = (u
1
(t), . . . , u
m
(t)) R
m
e chamado vetor de vari aveis de
controle ou ainda entrada do sistema.
Um importante caso particular corresponde `a situa c ao em que a
din amica do sistema (1.2) e linear tanto na variavel de estado x quanto
na variavel de controle u. Temos assim os sistemas de controle lineares
(1.3) x = A(t) x + B(t) u(t),
onde A(t) R
n,n
e B(t) R
n,m
, para todo t. Muitas vezes considera-se
que a evolu c ao do sistema (1.2) pode ser acompanhada somente atraves
de um vetor y(t) = (y
1
(t), . . . , y
p
(t)) R
p
, que depende da variavel de
estado x e e denominado sada do sistema. Se a fun c ao que descreve a
dependencia de y em rela c ao a x e linear em x, temos
(1.4) y(t) = C(t) x(t),
onde C(t) R
p,n
, para todo t. O caso particular C(t) I corresponde
`a situa c ao em que e possvel conhecer a variavel de estado x em todos
os instantes de tempo.
Observe que, ao escolher estrategias de controle diferentes, estamos
alterando a din amica do sistema de forma tambem diferenciada. A
princpio, e possvel distinguir entre dois tipos de escolha para estrategia
de controle:
steuer
2008/3/11
page 3
i
i
i
i
i
i
i
i
[SEC. 1.1: APRESENTAC
AO
A regulagem pode compensar interferencias (janela aberta, atraso na
mudan ca das esta c oes, . . . ), enquanto que o controle n ao. 2
Exemplo 4 (Enchimento de um reservat orio dagua). Censidere o
seguinte modelo para representar a varia c ao do nvel de um reservatorio
dagua
t : tempo;
I(t) : uxo de agua que entra no reservatorio no tempo t;
x(t) : quantidade de agua no reservatotio no tempo t;
y(t) : altura do nvel da agua no tempo t;
u(t) : abertura da torneira para entrada de agua no tempo t.
Supondo que I(t) = c
1
u(t) e y(t) = c
2
x(t) temos:
x = I(t) = c
1
u(t) ou x(t) = x(0) +
_
t
0
c
1
u(s) ds.
Note que o reservatorio estara cheio quando x(t) = x
max
ou y(t) = y
max
.
Denimos, usando apenas a eurstica, a seguinte estrategia:
1) Medir no tempo t a sada y(t);
2) Testar se y(t) = y
max
;
3) Abrir ou fechar a torneira;
4) Voltar ao item 1);
Note que usamos apenas dois valores extremos do controlador, que cor-
respondem `a torneira totalmente aberta ou totalmente fechada. Tais
controles pertencem a uma famlia especial (controles de BangBang) e
s ao analizados mais detalhadamente no Captulo 3. 2
Observa cao 5. A fun c ao que permite calcular a sada y a partir da
entrada u e denominada fun c ao de transferencia. A seguir, relacionamos
algumas formas especiais desta fun c ao para sistemas com entrada e sada
escalar, i.e. y(t), u(t) R, para todo t.
Transferencia proporcional: y(t) = ku(t);
Transferencia integral: y(t) = y
0
+k
_
t
0
u(s)ds;
1
Transferencia diferencial: y(t) = ku
t
(t);
Transferencia de tempo morto: y(t) = ku(t );
1
No Exemplo 1 temos y(t) = x(t) = x
0
+ 1/m
_
t
0
F(s)ds.
steuer
2008/3/11
page 5
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 5
Sistemas de controle com entrada e sada escalar s ao tambem conhecidos
pela abrevia c ao SISO (single-input single-output). Note que a estrategia
de realimenta c ao ilustrada na Figura 1.2 e a generaliza c ao para o caso
vetorial da transferencia proporcional. 2
Para terminar essa discuss ao inicial e importante chamar aten c ao
para dois conceitos extremamente importantes na teoria de controle que
s ao os de controlabilidade e observabilidade de um sistema. Informal-
mente dizemos que um sistema de controle e control avel quando for
possvel encontrar uma estrategia de controle u que leve o estado inicial
a um estado nal desejado. Por outro lado, dizemos que um sistema de
controle e observ avel quando for possvel reconstruir o estado inicial x
0
a partir da sada y do sistema. Os conceitos acima s ao abordados em
detalhes nos Captulos 2 e 3 respectivamente.
1.2 Exemplos
Os exemplos a seguir tem o objetivo de ilustrar os diferentes tipos
de aplica c oes que podem ser tratadas atraves da teoria de controle e
ao mesmo tempo de apresentar as ferramentas matematicas necessarias
para investiga c ao dos problemas.
1.2.1 Aquecimento de um Quarto
Tratamos do problema de manter um quarto aquecido durante um
determinado tempo, de forma que a energia gasta no processo seja a
menor possvel. Para este m denominamos
t : tempo pertencente ao intervalo [0, T] com T > 0;
w(t) : temperatura do quarto;
w
0
: temperatura do quarto no tempo t = 0 ;
c : temperatura constante fora do quarto;
z(t) : diferen ca de temperatura entre o quarto e o exte-
rior;
z
0
:= w
0
c : diferen ca de temperatura no tempo t = 0;
u(t) : taxa de varia c ao do calor inserido.
Na formula c ao do modelo, supomos a varia c ao de temperatura pro-
porcional tanto `a temperatura exterior, quanto a energia utilizada no
mecanismo de controle. Temos assim:
(1.5) z
t
= a z + b u(t),
steuer
2008/3/11
page 6
i
i
i
i
i
i
i
i
6 [CAP. 1: INTRODUC
AO
onde a, b s ao constantes positivas que descrevem a fsica do problema
(isolamento do quarto, . . . ).
Como objetivo denimos que a temperatura inicial z
0
deve evoluir ate
a temperatura z(T) = z
T
no nal do tempo T. Nesse processo deve
ser gasto o mnimo de energia possvel, sendo que o gasto de energia e
descrito pela fun c ao objetivo
(1.6) J(u) :=
1
2
_
T
0
u
2
(t) dt.
Podemos ent ao formular o problema de encontrar uma estrategia de
controle da seguinte forma:
_
_
_
Minimizar J(u)
sujeito `a
z
t
= az +bu; z(0) = 0, z(T) = z
T
.
Na formula c ao acima, deixamos em aberto que tipo de controle e con-
siderado admissvel (u C
0
([0, T]), L
2
([0, T]), L
k=0
l
k
(y
k
, u
k
),
onde as fun c oes l
k
, k = 0, . . . , N 1 s ao dadas. Consideramos ent ao o
problema de otimiza c ao
_
Minimizar J(y, u)
sujeito `a (1.11), (1.12).
steuer
2008/3/11
page 8
i
i
i
i
i
i
i
i
8 [CAP. 1: INTRODUC
AO
As variaveis do problema de minimiza c ao s ao os vetores:
u = (u
0
, . . . , u
N1
) R
N
, y = (y
1
, . . . , y
N1
) R
N1
.
Supondo agora que as fun c oes f
k
, l
k
envolvidas no problema s ao sucien-
temente diferenciaveis, podemos utilizar o teorema dos Multiplicadores
de Lagrange para deduzir condi c oes necessarias para determina c ao de
um extremal. Tal lema e apresentado a seguir:
Lema: (Multiplicadores de Lagrange) Seja U R
n
aberto e as
fun c oes F : U R e G : U R
m
continuamente diferenci aveis em U,
onde m < n. Se U e um extremo local de F(x) sujeito ` a restri c ao
G(x) = 0 e G() a matriz jacobiana de G no ponto tem posto
m (m aximo), ent ao existe
R
m
de modo que o gradiente da fun c ao
ampliada
(1.14) K(x, ) = F(x) +
m
j=1
j
G
j
(x)
se anula no ponto (,
). Isto e,
K
x
i
(,
) = 0, i = 1, . . . , n, (1.15)
K
j
(,
) = 0, j = 1, . . . , m. (1.16)
Demonstra c ao: Este e um resultado classico da analise no R
n
, podendo
sua demonstra c ao ser encontrada em [Wa1].
As equa c oes (1.15), (1.16) s ao denominadas condi c oes de KuhnTucker.
Em nosso exemplo, a fun c ao K e dada por:
K(y
0
, . . . , y
N
, u
0
, . . . , u
N1
,
0
, . . . ,
N+1
)
=
N1
i=0
l
i
(y
i
, u
i
) +
N1
j=0
j+1
(f
j
(y
j
, u
j
) y
j+1
)
+
0
(y
0
y
0
) +
N+1
(y
N
y
N
),
onde a numera c ao das componentes de e escolhida de forma adequada.
Denindo agora a fun c ao de Hamilton
(1.17)
H(y
0
, . . . , y
N
, u
0
, . . . , u
N1
,
0
, . . . ,
N+1
)
=
N1
i=0
l
i
(y
i
, u
i
) +
N1
j=0
j+1
f
j
(y
j
, u
j
),
steuer
2008/3/11
page 9
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 9
podemos reescrever as equa c oes (1.15), (1.16) como:
y
k
=
H
k
, k = 1, . . . , N (1.18)
k
=
H
y
k
, k = 1, . . . , N 1 (1.19)
0 =
H
u
k
, k = 0, . . . , N 1 (1.20)
(1.21) y
0
= y
0
, y
N
= y
N
.
Note que temos N +(N 1) +N +2 equa c oes para (N +1) +N +N
variaveis.
2
A equa c ao (1.18) e a Equa c ao de Evolu c ao, (1.19) e a Equa c ao
Adjunta e (1.20) e a Condi c ao de Otimalidade.
Um candidato `a solu c ao e obtido resolvendo-se o sistema acima. Note
ainda que em problemas concretos temos que vericar a regularidade
das fun c oes exigida no lema dos multiplicadores de Lagrange.
Consideramos agora um exemplo concreto, obtido a partir do pro-
blema contnuo analisado no Exemplo 1.2.1. Tomando N = T e dis-
cretizando (1.5) atraves da aproxima c ao por diferen cas nitas:
(z(t + t) z(t))/t = az(t) +bu(t), obtemos o sistema discreto:
y
k+1
= a y
k
+ b u
k
, k = 0, . . . , N 1
J(y, u) :=
1
2
N1
i=0
u
i
2
e as condi c oes de contorno
y
0
= 0, y
N
= z
T
.
Note que a constante a na equa c ao acima e diferente da constante a em
(1.5). Obtemos ent ao as condi c oes necessarias:
y
k+1
= a y
k
+ b u
k
, k = 0, . . . , N 1 (1.22)
k
= a
k+1
, k = 1, . . . , N 1 (1.23)
u
k
+
k+1
b = 0, k = 0, . . . , N 1 (1.24)
2
Descartamos as equa c oes K/y
0
e K/y
N
referentes ` as vari aveis
0
e
N+1
respectivamente, pois vamos desconsiderar essas vari aveis. O papel delas e somente
garantir que as condi c oes de contorno sejam satisfeitas pelo candidato a extremal.
steuer
2008/3/11
page 10
i
i
i
i
i
i
i
i
10 [CAP. 1: INTRODUC
AO
y
0
= 0, y
N
= z
T
.
Calculando u
k
em (1.23) e substituindo em (1.22) obtemos
y
k+1
= a y
k
b
2
k+1
, k = 0, . . . , N 1 (1.25)
k
= a
k+1
, k = 1, . . . , N 1 (1.26)
Note que (1.26) nos permite calcular
k
recursivamente a partir de
N
:
k
= (a)
Nk
N
, k = 1, . . . , N 1.
Substituindo em (1.25), obtemos a equa c ao de diferen cas:
y
k+1
= a y
k
b
2
(a)
Nk1
N
, k = 0, . . . , N 1,
a qual pode ser resolvida diretamente se usamos a condi c ao inicial y
0
= 0.
Temos ent ao
y
k
=
k1
i=0
(a)
ki1
b
2
(a)
Ni1
N
= b
2
N
(a)
N+k2
k1
i=0
(a)
2i
, k = 1, . . . , N.
Da serie geometrica obtemos agora:
3
(1.27) y
k
= b
2
N
(a)
N+k2
1
_
1
a
2
_
k
1 +
_
1
a
2
_ , k = 1, . . . , N
Falta ainda calcularmos
N
. Para isso, tomamos k = N em (1.27) e
usamos a condi c ao de contorno y
N
= z
T
, obtendo assim (para N par)
z
T
= b
2
N
(1 +a
2N
)
(1 +a
2
)
.
Denindo agora d := b
2
(1 + a
2
)/(1 + a
2N
), temos
N
= dz
T
e de
(1.27) temos por m
y
k
= b
2
d z
T
(a)
N+k
1
_
1
a
2
_
k
1 +a
2
, k = 1, . . . , N 1
u
k
= b d z
T
(a)
N+k+1
_
1
_
1
a
2
_
k+1
1 +a
2
+
1
_
1
a
2
_
k
1 +a
2
_
, k=0, . . ., N1.
3
(1 +q +. . . +q
N
)(1 q) = (1 q
N+1
).
steuer
2008/3/11
page 11
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 11
1.2.3 Um Problema de Tempo Mnimo
O movimento retilneo de um carro de massa m = 1 e descrito por
x = u(t),
onde a fun c ao u : [0, T] R representa a variavel de controle.
4
O
controle corresponde `a acelera c ao e `a frenagem do veculo. Supomos
que no instante inicial t
0
= 0 o carro se encontra em repouso:
x(0) = 0, x(0) = 0.
No tempo T > 0 o carro deve estar parado em frente a uma parede
que dista uma unidade da orgem.
x(T) = 1, x(T) = 0.
Supomos ainda que as a c oes de controle s ao limitadas por
(1.28) [u(t)[ 1, t [0, T].
O objetivo a ser atingido e:
Encontrar um controle u, que desloque o carro conforme des-
crito acima no menor tempo
T possvel.
A solu c ao e:
T = 2, u(t) =
_
+1 , 0 t < 1
1 , 1 t 2
Observe que a trajetoria x obtida a partir de u satisfaz as condi c oes
de contorno do problema. Mais tarde provaremos que u e
T s ao de fato
otimos. Os multiplicadores de Lagrange utilizados no Exemplo 1.2.2
n ao s ao aplicaveis aqui (caso discretizassemos o sistema), pois o tempo
nal n ao e xado a priori. A estrategia u se enquadra nos chamados
controladores BangBang, onde o controle assume somente os valores
extremos permitidos.
Caso a restri c ao (1.28) n ao seja fornecida, o problema n ao mais pos-
sui solu c ao. Basta observar que T
n
= 2/n e
u
n
(t) :=
_
+n
2
, 0 t < 1/n
n
2
, 1/n t 1/n
s ao estrategias admissveis e lim
n
T
n
= 0. Portanto, n ao existe uma
estrategia otima.
4
A dependencia em rela c ao ao tempo t da vari avel de estado n ao e representada
na equa c ao diferencial.
steuer
2008/3/11
page 12
i
i
i
i
i
i
i
i
12 [CAP. 1: INTRODUC
AO
1.2.4 Lancamento de um Foguete
Considere o seguinte problema:
Um foguete deve ser lan cado do solo na vertical e deve, a par-
tir de uma estrategia de consumo de combustvel, alcan car a
maior altitude possvel.
Para estudar este problema tomamos:
t : tempo;
m(t) : massa do foguete;
v(t) : velocidade do foguete;
I(t) : impulso do foguete.
Fazemos agora a seguinte hipotese fsica:
(1.29)
Taxa de varia c ao do impulso = Soma das for cas agindo sobre o corpo.
A partir da lei fsica P = mv, temos no intervalo innitesimal de tempo
[t, t + t]:
Massa Velocidade Impulso
t m v mv
t + t m+ m v + v (m+ m)(v + v)
Supondo que combustvel de massa m (pois m < 0) e, depois de
queimado, expelido com velocidade v
0
, temos que o impulso total no
tempo t + t e dado por
mv + v
0
m + mv.
Portanto, a varia c ao do impulso no intervalo innitesimal [t, t + t] e
lim
t0
mv + v
0
m + mv
t
= m v + v
0
m.
Da hipotese em (1.29) conclumos ent ao
(1.30) m v + v
0
m = mG(h) D(v, h),
onde
m, v, h : massa, velocidade e altura do foguete respectivamente;
G(h) : for ca da gravidade;
D(v, h) : resistencia do ar.
steuer
2008/3/11
page 13
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 13
Supondo agora que G(h) = c
1
h
2
, D(v, h) = c
2
v
2
e
h
e que podemos
controlar o empuxo u := v
0
m, obtemos o seguinte sistema:
h = v (1.31)
m = v
1
0
u(t) (1.32)
v = m
1
[u(t) D(v, h)] G(h) (1.33)
Supomos ainda que o empuxo e limitado, ou seja
(1.34) 0 u(t) u
max
.
Note que o tempo nal T n ao e fornecido e que as condi c oes de contorno
s ao:
(1.35) h(0) = 0, v(0) = 0, m(0) = m
0
, m(T) = m
T
,
onde m
T
e a massa do foguete sem combustvel e m
0
a massa do foguete
abastecido. O problema de encontrar a trajetotia otima pode ent ao ser
escrito como:
_
_
_
Maximizar h(t)
sujeito `a
(1.31), (1.32), (1.33), (1.34), (1.35)
Fazendo hipoteses adequadas sobre G e D, e possvel garantir a existen-
cia de uma solu c ao da forma (BangSingularBang)
u(t) :=
_
_
_
u
max
, t [0, t
1
]
(0, u
max
) , t (t
1
, t
2
)
0 , t [t
2
, T]
,
onde t
1
, t
2
dependem de m
0
, m
T
, D, G, u
max
.
1.2.5 Equilbrio de um Bastao
Considere um bast ao sem massa, de comprimento unitario, que pos-
sui em sua extremidade superior uma massa pontual m. A extremidade
inferior pode ser deslocada ao longo do eixo x e a acelera c ao correspon-
dente a este deslocamento corresponde ao controle. Sejam assim:
steuer
2008/3/11
page 14
i
i
i
i
i
i
i
i
14 [CAP. 1: INTRODUC
AO
E
x
c
mg
E
F
Figura 1.3: Equilbrio de um bast ao
t : tempo t > 0;
(t) : posi c ao da base do bast ao ;
u(t) : acelera c ao (horizontal) da base do bast ao;
(t) : angulo entre o bast ao e o eixo vertical;
(x(t), y(t)) : coordenada do ponto de massa m.
Observe que a posi c ao de repouso = 0 n ao e estavel, no sentido que
um deslocamento innitesimal do ponto de equilbrio provoca a queda
do bast ao.
5
Neste exemplo estudamos como estabilizar o sistema na
posi c ao de repouso usando uma estrategia de controle de realimenta c ao
do tipo u = G().
Analisamos inicialmente o modelo. Sobre a massa m agem a gravi-
dade e uma for ca F (na dire c ao do bast ao) provocada pelo movimento
da base do mesmo (veja Figura 1.3). Temos ent ao:
Somatorio das for cas na dire c ao x: F sin()
Somatorio das for cas na dire c ao y: F cos() mg
Supondo que tratamos apenas deslocamentos pequenos da posi c ao de
repouso = 0, fazemos as hipoteses simplicadoras:
(1.36) sin() , cos() 1, y 1, y 0.
Da lei de Newton sabemos que
m y = F(t) mg, m x = F(t) (t),
o que implica em F(t) = mg e m x = mg(t).
Da geometria do problema e das hipoteses em (1.36) temos ainda
x(t) = (t) + (t).
5
Uma an alise rigorosa sobre a natureza dos pontos de equilbrio de um sistema
din amico e apresentada no Captulo 4.
steuer
2008/3/11
page 15
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 15
Observando que
(t) = u(t), obtemos dessa ultima equa c ao
(1.37)
= g u(t).
Reescrevendo (1.37) na forma de sistema, obtemos
z
1
= z
1
z
2
= gz
1
u(t)
Podemos agora vericar que a posi c ao de repouso e de fato instavel. Os
autovalores da matriz
A :=
_
0 1
g 0
_
do sistema s ao
gt
g e
gt
g
e
gt
g e
gt
g
_
.
Um sistema fundamenal de solu c oes e obtido das colunas de Z(t) e pode-
mos observar que uma das solu c oes cresce exponencialmente, compro-
vando assim a instabilidade do sistema. Tentamos agora escolher uma
estrategia de controle adequada para estabilizar o sistema.
1
a
tentativa de controle de realimenta cao:
u := k(t) = kz
1
,
onde k R. De (1.37) obtemos o sistema
z = A
1
z com A
1
=
_
0 1
g +k 0
_
.
Os autovalores da matriz A
1
s ao
AO
o que torna inviavel a estabiliza c ao do sistema.
2
a
tentativa de controle de realimenta cao:
u = k
1
k
2
= k
1
z
1
k
2
z
2
,
onde k
1
, k
2
R. De (1.37), obtemos o sistema
z = A
2
z com A
2
=
_
0 1
g +k
1
k
2
_
.
Os autovalores da matriz A
2
s ao k
2
/2
_
k
2
2
/4 +g +k
1
. Escolhendo
por exemplo k
2
= 2 e k
1
= g 1, obtemos os autovalores
1
=
2
=
1. A equa c ao diferencial resultante
+ 2
+ = 0
possui as solu c oes linearmente independentes
(t) = e
t
, (t) = t e
t
,
provando assim que a estrategia u(t) = 2z
1
+ (1 + g)z
2
estabiliza o
sistema.
Para maiores detalhes sobre este problema, tambem denominado de
pendulo invertido, consulte [So], Captulo 3.
1.2.6 Concentracao de Chumbo no Corpo Humano
O modelo utilizado para aproximar o problema em quest ao e o mo-
delo de compartimentos. Tal abordagem consiste em descrever o objeto
de estudo (corpo humano) como uma serie de compartimentos que inte-
ragem entre si, trocando a subst ancia que desejamos analisar (chumbo).
Obviamente essa tecnica e bastante maleavel e permite modelar diferen-
tes tipos de processos fsicos, biologicos, qumicos, etc . . .
Neste exemplo tratamos uma importante aplica c ao da teoria de con-
trole, a qual esta relacionada com a teoria de problemas inversos. Trata-
se da reconstru c ao de par ametros, isto e, o controle e utilizado para
identicar a din amica do sistema, que e a princpio desconhecida. Tal
problema e investigado em detalhes no Captulo 6.
steuer
2008/3/11
page 17
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 17
Consideramos nesta abordagem um modelo simples com apenas 3
compartimentos: Sangue, Tecido e Esqueleto. Denimos ent ao:
t : tempo t > 0;
m
i
: massa do compartimento i;
c
i
(t) : concentra c ao de chumbo no compartimento i;
q
i
(t) : quantidade de chumbo no compartimento i.
Temos assim
q
i
(t) = m
i
c
i
(t), i = 1, 2, 3.
A din amica da troca e descrita por
(1.38) q = f(q) + I(t),
onde q := (q
1
, q
2
, q
3
), f (desconhecida) descreve a taxa de troca, I e
um vetor de entrada. Supondo a din amica linear, i.e., a taxa de troca e
proporcional a diferen ca de concentra c ao, obtemos: f(q) = Aq (A uma
matriz).
Supomos ainda I constante e que existe um ponto de equilbrio q
para o sistema (1.38), i.e.,
q = f( q) + I = 0. Nesta situa c ao e possvel
descobrir a din amica do sistema. Suponha que introduzimos chumbo no
sistema com taxa b(t) R
3
. A concentra c ao q +x da subst ancia satisfaz
ent ao
x =
q + x = f( q +x) + I + b(t).
Supondo que x e pequeno em rela c ao a q, temos
x =
f
q
( q) x + O((x q)
2
) + I + b(t)
=
f
q
( q) x + b(t) + r(t),
onde r(t) R
3
possui componentes pequenas. Como
f
q
( q) = A, obtemos
o sistema
(1.39) x = Ax + b(t).
A matriz desconhecida A deve ser identicada. Um metodo de realizar
tal identica c ao e o seguinte:
Fixe a taxa b e me ca em intervalos de tempo periodicos
a concentra c ao x
i
(t)/m
i
ou a raz ao x
i
(t)/ q
i
(caso q seja co-
nhecido);
Forme assim um conjunto de equa c oes que permita cal-
cular os coecientes de A.
steuer
2008/3/11
page 18
i
i
i
i
i
i
i
i
18 [CAP. 1: INTRODUC
AO
Outro problema inverso relacionado `a teoria de controle (otimo) e a
identica c ao de coecientes na equa c ao de EulerLagrange. Tal proble-
ma n ao e abordado neste manuscrito. O leitor interessado deve consultar
[Lei].
1.2.7 A Braquist ocrona
O calculo das varia c oes teve seu desenvolvimento inicial em grande
parte devido ao problema que discutimos nesta sec c ao. Em 1696, Johann
(John ou Jean) Bernoulli formulou o seguinte problema:
6
Sejam P
0
e P
1
dois pontos dados sobre um plano vertical.
Deve ser encontrada uma curva unindo esses dois pontos de
sorte que um ponto de massa m partindo de P
0
que a percorra
sob a inuencia somente de seu pr oprio peso, alcance P
1
no
menor tempo possvel. Considere ainda a velocidade inicial
v
0
dada.
Tal problema e conhecido como Braquist ocrona (do grego brachystos
mnimo, chronos tempo). A m de obter uma formula c ao matematica
conveniente, restringimo-nos `a analise de curvas que s ao gracos de
fun c oes. Portanto, a trajetoria do ponto pode ser descrita por uma
fun c ao y : [x
0
, x
1
] R, onde P
0
= (x
0
, y
0
) e P
1
= (x
1
, y
1
). Seja T o
tempo para se percorrer a trajetoria, l o comprimento de arco de y, s(t)
o comprimento de arco percorrido no tempo t [0, T] e V (t) o valor da
velocidade (tangencial) no tempo t. Temos ent ao
ds
dt
(t) = V (t), t [0, T].
Denotando a mudan ca de variaveis por s = S(t), temos o jacobiano
dS/dt(t) = V (t) de onde segue
T =
_
T
0
dt =
_
l
0
ds
V (S
1
(s))
=
_
l
0
ds
W(s)
,
6
Tal problema foi formulado originalmente por Galileo em 1638, que acreditava
ser a solu c ao do problema um arco de circunferencia. Outros matem aticos da epoca
como Leibniz, Jakob (James ou Jacques) Bernoulli e Newton se interessaram pelo
problema, que foi proposto por Johann Bernoulli na forma de um desao. Para mais
detalhes hist oricos consulte [Gol].
steuer
2008/3/11
page 19
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 19
onde W(s) := V (s
1
(s)). Denindo agora s := l(x) =
_
x
x
0
(1+y
t
(x)
2
)
1/2
dx
e v(x) := W(l(x)) velocidade parametrizada em x para x [x
0
, x
1
],
obtemos
T =
_
l
0
ds
W(s)
=
_
x
1
x
0
(1 +y
t
(x)
2
)
1/2
v(x)
dx.
Usando agora a lei de conserva c ao de energia (energia cinetica + energia
potencial = cte.) temos
mv(x)
2
2mgy(x) = mv
2
0
2mgy
0
,
onde g e a constante gravitacional. Note que o eixo vertical y e tomado
orientado na dire c ao da for ca gravitacional. Denindo a constante c :=
2gy
0
v
2
0
, obtemos a express ao
T =
_
x
1
x
0
(1 +y
t
(x)
2
)
1/2
(2gy(x) c)
1/2
dx,
que nos permite explicitar o tempo de percurso T em fun c ao da para-
metriza c ao (x, y(x)) da curva. Podemos ainda escrever
T = I(y) :=
_
x
1
x
0
L(x, y(x), y
t
(x)) dx,
onde L(x, y, p) := (
1+p
2
2gy+c
)
1/2
, obtendo assim um problema tpico do
calculo das varia c oes.
O mais importante neste problema s ao os metodos usados para
resolve-lo, que constituem o surgimento do calculo das varia c oes tal qual
conhecemos hoje. A solu c ao e a curva denominada cicloide (veja Figu-
ra 1.4), que possui a seguinte parametriza c ao:
: [
0
,
1
] (b +a( + sin ), a(1 + cos )) R
2
,
onde os par ametros a, b s ao determinados pelas condi c oes (
0
) =
(x
0
, y
0
), (
1
) = (x
1
, y
1
).
Johann Bernoulli baseou sua argumenta c ao no ent ao recem divul-
gado princpio de refra c ao de Fermat (1662). Considere um meio con-
stitudo por diversas camadas homogeneas de densidades diferentes e
separadas pelas retas horizontais y = y
. Em cada camada y
< y <
y
+1
a luz viaja com velocidade v
proporcional a (y
h)
1/2
, onde h
e constante. Obtemos ent ao como trajetoria uma poligonal, na qual o
steuer
2008/3/11
page 20
i
i
i
i
i
i
i
i
20 [CAP. 1: INTRODUC
AO
P
0
P
1
x
y
Figura 1.4: Cicloide: solu c ao do problema da Braquistocrona
seno do angulo entre o raio e o eixo vertical y e proporcional (y
h)
1/2
.
Tomando o limite quando o n umero de camadas tende a innito, e
possvel concluir que o seno do angulo entre a trajetoria do raio e o eixo
y e proporcional a 1/(1 +y
t
(x)
2
)
1/2
, de onde Johann Bernoulli obteve a
equa c ao diferencial
(1.40)
1
_
1 +y
t
2
= K
_
2g(y h)
para a Braquistocrona. Denindo := 2gK
2
(y h) e := 2gK
2
x, onde
= (), obtemos de (1.40) a equa c ao diferencial
(1.41) (1 +
t
2
) = 1.
A equa c ao (1.41) e exatamente a equa c ao de EulerLagrange para o pro-
blema variacional da Braquistocrona. Esta equa c ao pode ser resolvida
atraves do metodo de separa c ao de variaveis. De fato, note que podemos
reescrever (1.41) na forma
t
=
_
(1 )
1
,
ou ainda como
_
_
v(1 v)
1
dv = +c.
A mudan ca de variaveis v := sin
2
t = 2
1
(1 cos 2t), para t [0, 2],
nos fornece ent ao
+c = 2
_
sin
2
t dt = 2
1
(2t cos 2t),
steuer
2008/3/11
page 21
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 21
de onde obtemos a seguinte parametriza c ao da solu c ao:
(t) := 2
1
(1 cos 2t), (t) := 2
1
(2t sin 2t), t R.
Temos assim que
x() = r( sin ), y() = r(1 cos ), R,
com r := (4Kg)
1
e x(0) = y(0) = 0. Note que esta e a parametriza c ao
da cicloide com P
0
na orgem e cujo raio da circunferencia na Figura 1.4
e r.
1.2.8 Um Problema de Controle
Otimo
Seja R
n
compacto e f : R
n
R
n
uma aplica c ao contnua,
Lipschitz na primeira variavel (veja Deni c ao 259) e uniformemente na
segunda. Seja
7
U
ad
:= u : [t
0
, t
1
] R
m
; u(t) q.s. em [t
0
, t
1
]
o conjunto dos controles viaveis. Considere agora a equa c ao de evolu c ao
das variaveis de estado
_
z
t
(t) = f(z(t), u(t)), q.s. em [t
0
, t
1
]
z(t
0
) = z
0
A teoria de equa c oes diferenciais ordinarias garante que, para cada u
U
ad
, o problema acima possui uma unica solu c ao absolutamente contnua
em [t
0
, t
1
]. Nosso objetivo e encontrar um controle u que minimize o
funcional objetivo
J(t, z; u) := L
1
(z(t)) +
_
t
1
t
0
L(z(t), u(t)) dt,
onde as fun c oes L e L
1
denem respectivamente os custos operacional e
nal do modelo. Suponha L C
1
(R
n
) e L
1
C
1
(R
n
).
Tal problema de controle otimo e denominado problema com hori-
zonte nito
8
. Fazemos aqui uma abordagem baseada no metodo dos
7
Nota c ao: q.s. e abrevia c ao de quase sempre e se refere ` a medida de Lebesgue
no intervalo em quest ao.
8
Note que o tempo nal t
1
est a xado, enquanto que o estado nal n ao.
steuer
2008/3/11
page 22
i
i
i
i
i
i
i
i
22 [CAP. 1: INTRODUC
AO
multiplicadores de Lagrange (veja Exemplo 1.2.2) que nos permite en-
contrar algumas condi c oes necessarias para otimalidade de uma solu c ao
(compare com os resultados do Apendice B).
Denimos inicialmente a vari avel adjunta (ou co-estado) = (t) e
o funcional estendido
I(z, u, ) :=
_
t
1
t
0
[L(z, u) (z
t
f(z, u))] ds + L
1
(z(t
1
)).
Suponha que as fun c oes envolvidas na deni c ao de I s ao sucientemente
regulares e que ( z, u,
:= z +
1
, u
:= u +
2
,
:=
+
3
e I() := I(z
, u
1
+
h
u
2
( z
f)
3
1
f
z
1
f
u
2
)
_
dt
+
g
z
(z
(t
1
))
1
(t
1
).
Integramos por partes o termo
1
_
t
1
t
0
1
dt = [
1
]
t
1
t
0
_
t
1
t
0
1
dt =
(t
1
)
1
(t
1
)
_
t
1
t
0
1
dt
e substituimos em (1.42), obtendo
0 =
I
d
=0
=
_
t
1
t
0
_
1
_
L
z
( z, u) +
f
z
( z, u) +
_
+
2
_
L
u
( z, u) +
f
u
( z, u)
_
+
3
(
z +f( z, u))
_
dt
+
1
(t
1
)
_
L
1
z
( z(t
1
))
(t
1
)
_
.
Tomando
1
=
2
= 0 e
3
arbitrario, obtemos a equa c ao de estado
z = f( z, u).
steuer
2008/3/11
page 23
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 23
Tomando
1
= 0 e
2
qualquer, obtemos a condi c ao de otimalidade
L
u
( z, u) +
f
u
( z, u) = 0.
Tomando agora
1
qualquer com
1
(t
1
) = 0, obtemos a equa c ao adjunta
(ou de co-estado)
=
L
z
( z, u)
f
z
( z, u).
Por m, escolhendo
1
qualquer com
1
(t
1
) ,= 0, obtemos a condi c ao de
contorno para a equa c ao adjunta
L
1
z
( z(t
1
))
(t
1
) = 0.
Denimos agora a fun c ao de Hamilton H : R
n
R
n
R
m
R
H(z, , u) := , f(z, u)) + L(z, u)
e supomos que e possvel explicitar (atraves da condi c ao de otimalidade)
o controle em fun c ao das variaveis de estado e adjunta ( u = U( z,
)).
Obtemos das equa c oes de estado e adjunta o sistema hamiltoniano
(1.43)
_
z = +
H
( z,
, U( z,
))
=
H
z
( z,
, U( z,
))
z(t
0
) = z
0
,
(t
1
) =
L
1
z
( z(t
1
))
Note por m que derivando H em rela c ao a u no ponto ( z,
, u)
obtemos da condi c ao de otimalidade
(1.44)
H
u
( z,
, u) =
f
u
( z, u) +
L
u
( z, u) = 0.
Isto e, H( z(t),
(t), ) : R
m
R possui um mnimo local em u = u(t), t
[t
0
, t
1
]. Por este motivo, a condi c ao de otimalidade tambem e conhecida
como condi c ao de mnimo.
As condi c oes necessarias que procuravamos podem ser resumidas em
(1.43) e (1.44), isto e, se ( z, u) e uma solu c ao para o problema de con-
trole otimo, ent ao existe : [t
0
, t
1
] R
n
tal que estas condi c oes s ao
satisfeitas.
steuer
2008/3/11
page 24
i
i
i
i
i
i
i
i
24 EXERC
ICIOS
A analise das condi c oes (1.43) e (1.44) e um dos principais topicos de
interesse na area de controle otimo. A obten c ao destas condi c oes corres-
ponde, no caso geral, ao teorema conhecido na literatura por princpio
do m aximo ou de Pontryagin (veja [PBG], [Tr], [Za]). Retornamos ao
estudo das mesmas no Captulo 10 (um caso particular pode ainda ser
encontrado na Sec c ao 9.5).
Exerccios
1.1. Sejam F, G : R
2
R denidas por
F(x, y) :=
1
2
_
x y
_
_
1 1
1 2
__
x
y
_
+y, G(x, y) := x 3.
a) Utilizando o teorema de multiplicadores de Lagrange, resolva o
seguinte problema de otimiza c ao:
_
_
_
Minimizar F(x, y)
sujeito a
G(x, y) = 0
b) Calcule F( x, y) e G( x, y), onde ( x, y) e a solu c ao encontrada no
item a).
1.2. Encontre a menor dist ancia (vertical) entre a parabola y = ax
2
+
bx +c e a reta y = x +d.
1.3. Um meteoro percorre a orbita hiperbolica descrita por
x
2
a
2
y
2
b
2
= 1
(a Terra esta na orgem (0, 0)), enquanto que um satelite em orbita
geoestacionaria se encontra na posi c ao (x
0
, y
0
). Encontre o ponto da
orbita do meteoro de menor dist ancia ao satelite.
1.4. Considere o seguinte modelo de investimento de capital:
x
k+1
= (1 +r)x
k
+u
k
, k + 1, 2, . . .
onde x
k
e o capital ao nal do k-esimo ano, u
k
e o capital investido ao
longo do ano k e r > 0 e a taxa de juros anual. Suponha que o custo de
steuer
2008/3/11
page 25
i
i
i
i
i
i
i
i
EXERC
ICIOS 25
investimento do capital ao longo dos anos k = 0, . . . , N e descrito pela
fun c ao
C(u) := c
N1
k=0
u
2
k
,
onde u = (u
0
, . . . , u
N
). Encontre uma poltica otima de investimento u
para N = 10, x
10
= 100000, r = 7.
1.5. Considere um circuito com um resistor (de resistencia R) e um
capacitor (de capacit ancia C). Sejam u(t) a tens ao, y(t) a intensidade
da corrente eletrica e q(t) a carga eletrica no tempo t. Temos ent ao as
seguintes hipoteses fsicas:
y(t) e igual `a varia c ao temporal de q(t);
a diferen ca de potencial no capacitor e igual a q(t)/C;
a diferen ca de potencial no resistor e igual a Ry(t);
a lei de Kirchho vigora: a voltagem aplicada no circuito e igual ao
somatorio das diferen cas de potencial no circuito.
Obtenha uma equa c ao diferencial para q e resolva-a, obtendo q em fun c ao
de u e q(0) = q
0
.
1.6. A equa c ao diferencial () x = K, onde K ,= 0, descreve
fen omenos da cinematica (e.g., na queda livre: = 1 e K = g, a
constante gravitacional). A partir do sistema x = v, v = K (onde x
e o deslocamento e v a velocidade), obtemos a equa c ao () dv/dx =
(K)/v. Resolva a equa c ao diferencial () e esboce o graco das solu c oes
no plano (x, v) para o caso particular = 1.
1.7. Considere a equa c ao diferencial () do Exerccio 1.6 com a seguinte
estrategia de realimenta c ao:
K = K(x) =
_
b, x > 0
b, x < 0
.
Dada uma condi c ao inicial (x
0
, v
0
) e uma condi c ao nal (x
1
, v
1
), encontre
uma trajetoria correspondente que as una.
(Sugest ao: utilize o esbo co das trajetorias feito no Exerccio 1.6.)
steuer
2008/3/11
page 26
i
i
i
i
i
i
i
i
Captulo 2
Observabilidade
Neste captulo analisamos o problema de adquirir informa c oes sobre
o estado presente de um sistema a partir da observa c ao da sada do
sistema em tempos passados. Conseguimos assim classicar o espa co
de estados em componentes observaveis, n ao observaveis e detectaveis
(para esta ultima e necessaria uma analise do comportamento assintotico
das variaveis de estado). Devido a sua simplicidade, os sistemas lineares
aut onomos s ao estudados separadamente. Na ultima sec c ao e apresen-
tada uma tecnica de reconstru c ao de estados a partir de observa c oes. A
rela c ao existente entre os conceitos de observabilidade e controlabilidade
e analisada no captulo seguinte.
2.1 Sistemas Lineares
Considere o seguinte sistema linear de controle:
(2.1)
_
z
t
= A(t) z +B(t) u
y = C(t) z
onde as variaveis possuem a seguinte interpreta c ao:
z : [t
0
, t
1
] R
n
: vetor das variaveis de estado;
u : [t
0
, t
1
] R
m
: vetor das variaveis de controle (entrada);
y : [t
0
, t
1
] R
l
: vetor de observa c ao (sada).
Os operadores
A : [t
0
, t
1
] R
nn
, B : [t
0
, t
1
] R
nm
e C : [t
0
, t
1
] R
ln
steuer
2008/3/11
page 27
i
i
i
i
i
i
i
i
[SEC. 2.1: SISTEMAS LINEARES 27
s ao supostos contnuos em seus domnios de deni c ao. O sistema de
controle linear (2.1) e denominado abreviadamente por (A, B, C). Se as
fun c oes matriciais A, B, C n ao dependem explicitamente do tempo, o
sistema de controle e dito aut onomo; caso contrario, o sistema e deno-
minado n ao aut onomo.
Considere inicialmente a seguinte quest ao: dado um sistema de con-
trole (A, B, C), em que circunst ancias e possvel a partir do conheci-
mento da entrada do sistema
u : [t
0
, t
1
] R
m
e de sua sada
y : [t
0
, t
1
] R
l
,
reconstruir o estado inicial z
0
:= z(t
0
) R
n
. Uma vez conhecido o
vetor z
0
, e possvel substituir o controle dado u na equa c ao diferencial
em (2.1) e calcular as variaveis de estado z(t) em qualquer instante de
tempo t [t
0
, t
1
].
Como estrategias de controle admissveis consideramos as fun c oes
L
1
([t
0
, t
1
]; R
m
). Conforme resultados do Captulo A, temos que:
y(t) = C(t)
A
(t, t
0
) z
0
+ y
1
(t),
y
1
(t) =
_
t
1
t
0
C(t)
A
(t, s) B(s) u(s) ds, t [t
0
, t
1
].
Note que, conhecida a entrada u, a fun c ao y
1
pode ser calculada a
priori, independente do fato de conhecermos (ou n ao) a condi c ao inicial
z
0
. Portanto, a determina c ao de z
0
a partir do par (y, u) e equivalente
`a determina c ao de z
0
a partir da diferen ca y y
1
, a qual corresponde `a
sada do sistema homogeneo
z
t
= A(t) z.
Isto signica que, para estudar a determina c ao do estado inicial z
0
de
um sistema linear, basta concentrarmo-nos em sistemas homogeneos da
forma:
(2.2) z
t
= A(t) z, y = C(t) z,
os quais representamos pela nota c ao abreviada (A, , C). Estamos agora
em condi c oes de formalizar o conceito de observabilidade, discutido no
Captulo 1.
steuer
2008/3/11
page 28
i
i
i
i
i
i
i
i
28 [CAP. 2: OBSERVABILIDADE
Deni cao 6. O sistema (A, , C) e denominado observ avel em [t
0
, t
1
]
quando para toda fun c ao z C
1
([t
0
, t
1
]; R
n
) a condi c ao
z
t
(t) = A(t) z(t), C(t) z(t) = 0, t [t
0
, t
1
],
implicar em z(t
0
) = 0. 2
Em outras palavras, a observabilidade do sistema (A, , C) e equiva-
lente ao fato da aplica c ao linear
G : R
n
C([t
0
, t
1
]; R
n
)
z
0
C()
A
(, t
0
) z
0
ser injetiva. No teorema a seguir analisamos uma forma equivalente de
denir a observabilidade de um sistema.
Teorema 7. As seguintes arma c oes s ao equivalentes:
a) O sistema (A, , C) e observ avel em [t
0
, t
1
];
b) A matriz
W(t
0
, t
1
) :=
_
t
1
t
0
A
(t, t
0
)
C(t)
C(t)
A
(t, t
0
) dt
e positiva denida.
Demonstra c ao: (a) = (b) Suponha que W(t
0
, t
1
) n ao e positiva
denida. Por constru c ao, a matriz W(t
0
, t
1
) e simetrica e, alem disto,
satisfaz: x, W(t
0
, t
1
)x) 0, x R
n
. (por que?).
Logo, existe z
0
R
n
0 tal que z
0
, W(t
0
, t
1
)z
0
) = 0. Denindo agora a
fun c ao z() :=
A
(; t
0
)z
0
, temos que esta fun c ao e solu c ao do problema
de valor inicial z
t
= A(t)z, z(t
0
) = z
0
. Alem disso, z satisfaz
_
t
1
t
0
[C(t) z(t)[
2
dt =
_
t
1
t
0
[C(t)
A
(t, t
0
)z
0
[
2
dt
=
_
t
1
t
0
C(t)
A
(t, t
0
)z
0
, C(t)
A
(t, t
0
)z
0
) dt
=
_
t
1
t
0
z
0
,
A
(t, t
0
)
C(t)
C(t)
A
(t, t
0
)z
0
) dt
= z
0
, W(t
0
, t
1
)z
0
) = 0.
Encontramos assim uma fun c ao z satisfazendo
C(t) z(t) = 0, t [t
0
, t
1
] e z(t
0
) = z
0
,= 0,
steuer
2008/3/11
page 29
i
i
i
i
i
i
i
i
[SEC. 2.1: SISTEMAS LINEARES 29
o que contradiz a hipotese do sistema ser observavel.
(b) = (a) Suponha que para alguma fun c ao z tenhamos
z
t
(t) = A(t) z(t), C(t) z(t) = 0, t [t
0
, t
1
].
Logo, temos z = (; t
0
)z
0
, onde z
0
:= z(t
0
) e
z
0
, W(t
0
, t
1
) z
0
) =
_
t
1
t
0
C(t)z(t), C(t)z(t)) dt = 0.
Da hipotese de W(t
0
, t
1
) ser positiva denida, segue z
0
= 0.
Os sistemas de controle lineares com matrizes invariantes no tempo
(aut onomos) representam um importante caso especial que e tratado no
teorema a seguir. No texto que segue adotamos a nota c ao: Dada uma
matriz M, representamos por Po(M), Ke(M), Im(M) respectivamente
o posto, o n ucleo e a imagem de M (para detalhes veja [Gan]).
Teorema 8. Seja (A, , C) um sistema de controle aut onomo. As se-
guintes armativas s ao equivalentes:
a) (A, , C) e observ avel em [0, T] para todo T > 0;
b) (A, , C) e observ avel em [0, T] para algum T > 0;
c) A Matriz W
T
:=
_
T
0
e
A
s
C
Ce
As
ds e n ao singular para algum T > 0;
d) A Matrix W
T
:=
_
T
0
e
A
s
C
Ce
As
ds e n ao singular para todo T > 0 ;
e) Po(C
[A
[ . . . [(A
)
n1
C
) = n;
1
f )
n1
k=0
Ke(CA
k
) = 0.
Demonstra c ao: a) = b) Nada a fazer.
b) = c) Seja T > 0 escolhido de acordo com b). Tome z
0
R
n
e
dena a fun c ao z(t) := e
At
z
0
para t R. A identidade
z
0
, W
T
z
0
) =
_
T
0
[C z(s)[
2
ds
e obtida como na demonstra c ao do Teorema 7. Esta identidade e a
hipotese de observabilidade do sistema (A, , C) no intervalo [0, T] impli-
cam em z
0
= 0.
1
A matriz M
0
= (C
[A
[ . . . [(A
)
n1
C
T
z
0
) =
_
T
0
[C z(s)[
2
ds,
temos que z
0
, W
T
z
0
) = 0 implica em
a(t) := C e
At
z
0
= 0, t [0,
T].
Da segue que
(2.3) a
(k)
(0) = C A
k
z
0
= 0, k = 0, 1, . . .
Portanto,
C A
k
s
k
z
0
= 0, k = 0, 1, . . . , s [0, T].
Esta ultima igualdade implica em
z
0
, W
T
z
0
) =
_
T
0
[C e
At
z
0
[
2
ds =
_
T
0
[
k=0
1
k!
CA
k
s
k
z
0
[
2
ds = 0.
A escolha de T implica por m em z
0
= 0.
d) = e) Suponha por contradi c ao que Po(C
[A
[ . . . [(A
)
n1
C
) <
n. Ent ao, as n linhas da matriz n nl (C
[A
[ . . . [(A
)
n1
C
) s ao
linearmente dependentes e existe um elemento z
0
R
n
, z
0
,= 0, satis-
fazendo
(2.4) z
0
(A
)
k
C
= 0, C A
k
z
0
= 0 , k = 0, . . . , n 1.
Seja p
A
() :=
n
+
n1
k=0
k
k
, o polin omio caracterstico da matriz A. O
teorema de CaleyHamilton da algebra linear nos garante que A e um
zero de seu polin omio caracterstico (veja [Gan] ou [So]), isto e
p
A
(A) := A
n
+
n1
k=0
k
A
k
= 0,
de onde conclumos que
A
m
=
n1
k=0
(m)
k
A
k
, m n.
steuer
2008/3/11
page 31
i
i
i
i
i
i
i
i
[SEC. 2.1: SISTEMAS LINEARES 31
Isto nos permite escrever
2
e
At
=
n1
k=0
k
(t) A
k
.
Sendo assim, temos de (2.4)
C e
At
z
0
=
n1
k=0
k
(t) C A
k
z
0
= 0, t [0, T],
e portanto,
z
0
, W
T
z
0
) =
_
T
0
[Ce
At
z
0
[
2
dt = 0,
o que contradiz a hipotese em d), pois z
0
,= 0.
e) f) De (2.4) conclumos que z
0
Ke(CA
k
) z
0
(A
k
)
=
0, k = 0, . . . , n 1.
f) = a) Suponha que z
0
R
n
e tal que Ce
At
z
0
= 0, para todo
t [0, T]. Como em (2.3), podemos concluir que CA
k
z
0
= 0 para
k = 0, 1, . . .. A hipotese em f) implica ent ao que z
0
= 0.
Um sistema aut onomo (A, , C) e portanto observavel, quando for
observavel em [0, T] para um T > 0 qualquer.
Exemplo 9. Consideramos um modelo para representar o movimento
de um satelite articial de massa unitaria orbitando a Terra. Denindo
as variaveis:
r : altura da orbita;
0 : velocidade angular;
u
1
: empuxo radial dos motores;
u
2
: empuxo tangencial dos motores;
2
: constante gravitacional (
2
= g);
o sistema de equa c oes que descreve o fen omeno e:
(2.5)
_
r =
0
2
r
2
r
2
+ u
1
0 = 2
0 rr
2
+ r
1
u
2
2
Verique que
k
(t) =
n1
j=0
t
j
j!
+
j=n
t
j
(j)
k
j!
.
steuer
2008/3/11
page 32
i
i
i
i
i
i
i
i
32 [CAP. 2: OBSERVABILIDADE
Note que a solu c ao deste sistema para u
1
= u
2
= 0 e dada por r(t) = 1
e 0(t) = t. Portanto, ao denirmos as variaveis normalizadas
z
1
:= r 1, z
2
:= z
1
t
= r, z
3
:= 0 t, z
4
:= z
3
t
=
0 ,
estamos estudando perturba c oes desta solu c ao, a qual representa a orbita
livre (controle u = 0) do satelite. Reescrevendo o sistema a partir das
novas variaveis z
1
, . . . , z
4
, temos
(2.6)
_
_
z
1
t
= z
2
z
2
t
= (z
4
+)
2
(z
1
+ 1)
2
(z
1
+ 1)
2
+ u
1
z
3
t
= z
4
z
4
t
= 2
(z
4
+)z
2
z
1
+ 1
+
u
2
z
1
+ 1
Linearizando agora o sistema (2.6) no ponto
z
1
= z
2
= z
3
= z
4
= u
1
= u
2
= 0,
obtemos o novo sistema
z
t
= Az + Bu,
onde as matrizes A e B s ao dadas por:
A =
_
_
_
_
0 1 0 0
3
2
0 0 2
0 0 0 1
0 2 0 0
_
_
_
_
e B =
_
_
_
_
0 0
1 0
0 0
0 1
_
_
_
_
.
Se supomos que tanto varia c oes no raio da orbita, quanto no angulo
podem ser medidas, ent ao as variaveis z
1
e z
3
s ao conhecidas. Nesse
caso, o vetor de observa c ao y satisfaz:
y = C z onde C =
_
1 0 0 0
0 0 1 0
_
.
A matriz de observa c ao, dada por M
0
:= (C
[ . . . [(A
)
n1
C
), se escreve
neste caso como
M
0
=
_
_
_
_
1 0 0 0 . . .
0 0 1 0 . . .
0 1 0 0 . . .
0 0 0 1 . . .
_
_
_
_
Temos assim que a condi c ao Po(M
0
) = 4 = n e vericada, garantindo a
observabilidade do sistema. 2
steuer
2008/3/11
page 33
i
i
i
i
i
i
i
i
[SEC. 2.2: SUBESPACO N
AO OBSERV
AVEL 33
2.2 Subespaco nao Observavel
Consideramos novamente o sistema aut onomo (A, , C). Como ja foi
discutido na sec c ao anterior, a observabilidade deste sistema e equiva-
lente `a injetividade da aplica c ao linear
G : R
n
C([t
0
, t
1
]; R
n
)
z
0
C
A
(, t
0
) z
0
.
Este fato motiva a seguinte deni c ao:
Deni cao 10. O n ucleo da aplica c ao G denida acima e denominado
subespa co n ao observ avel do sistema (A, , C). 2
Exemplo 11. A deni c ao acima pode ser ilustrada pelo sistema (A, , C)
com matrizes
A =
_
1 0
0 1
_
, C =
_
0 1
_
.
Note que nenhuma condi c ao inicial da forma z
0
= ( 0)
R
2
pode ser
observada. A matriz M
0
:= (C
[A
) e dada por
M
0
=
_
0 0
1 1
_
.
2
O Exemplo 11 sugere ainda uma rela c ao entre o subespa co n ao ob-
servavel e Im(M
0
)
k=0
Ke(CA
k
).
Demonstra c ao: Note que, se z
0
N, ent ao C
A
(, t
0
) z
0
0 em [0, T].
Portanto,
C A
k
z
0
=
_
d
k
dt
k
C e
A(tt
0
)
z
0
_
t=t
0
= 0, k = 0, 1, . . . .
Logo, z
0
Ke(CA
k
), k = 0, . . . , n 1, provando que N
Ke(CA
k
).
Reciprocamente, se z
0
Ke(CA
k
), repetimos a argumenta c ao feita
steuer
2008/3/11
page 34
i
i
i
i
i
i
i
i
34 [CAP. 2: OBSERVABILIDADE
na demonstra c ao da parte d) = e) do Teorema 8 e conclumos que
z
0
, W
T
z
0
) =
_
T
0
[C e
At
z
0
[
2
dt = 0,
provando assim que z
0
N.
Observa cao 13. Por ser o n ucleo de uma aplica c ao linear, o subespa co
n ao observavel e um subespa co vetorial do R
n
. Alem disso, s ao validas
as seguintes arma c oes:
N Ke(C) ;
A(N) N, i.e. N e invariante por A;
N =
S R
n
[ S Ke(C), A(S) N, i.e.
N e o maior subespa co de Ke(C), que e invariante por A.
As propriedades acima s ao de facil verica c ao e deixadas como exerccio.
2
Se um determinado sistema (A, , C) n ao e observavel (em [t
0
, t
1
] para
todo t
1
> t
0
), podemos ainda assim indagar sobre a observabilidade das
solu c oes que n ao decaem, i.e. aquelas que satisfazem
lim
t
z(t) ,= 0.
Tais solu c oes correspondem aos auto-valores de A com parte real posi-
tiva. A m de analisar melhor esta quest ao, fazemos a seguinte cons-
tru c ao: Seja p
A
o polin omio caracterstico da matriz A. Seja ainda a
decomposi c ao
p
A
() = p
+
() p
(),
onde os polin omios p
+
e p
(A) := Ke(p
(A)),
com a ajuda dos quais chegamos `a seguinte deni c ao.
Deni cao 14. Seja (A, , C) um sistema aut onomo, N seu subespa co
n ao observavel. Sejam ainda X
+
(A), X
(A). 2
A no c ao de detectabilidade nos permite enm analisar o compromisso
entre os autovalores de A e as trajetorias das solu c oes do sistema.
steuer
2008/3/11
page 35
i
i
i
i
i
i
i
i
[SEC. 2.3: RECONSTRUC
AO DE ESTADOS 35
Teorema 15. Seja (A, , C) um sistema aut onomo detect avel. As se-
guintes armativas s ao equivalentes:
a) Todo autovalor de A satisfaz Re() < 0.
b) A fun c ao matricial V (t) :=
_
t
0
e
A
s
C
Ce
As
ds denida para t
[0, ) e limitada.
Demonstra c ao: a) = b) Tome = maxRe() [ e autovalor de A
e = [[/2. Por hipotese temos < 0 e := + < 0. O Teorema 248
garante a existencia de uma constante c > 0 tal que
|e
At
| c e
t
, t > 0.
Temos desta forma que
|V (t)| c
2
|C|
2
_
0
e
2t
dt < M, t > 0.
b) = a) Seja C um autovalor de A com Re() 0 e u o autovetor
correspondente. Por hipotese existe M > 0 tal que
u, V (t) u) =
_
t
0
e
2Re()s
[Cu[
2
ds < M, t 0.
Tomando o limite quando t temos que Cu = 0, de onde conclui-se
que
C A
k
u =
k
C u = 0, k = 0, 1, . . .
O Teorema 8 garante ent ao que
u N =
n1
k=0
Ke(CA
k
) X
(A).
Assim, temos que u X
(A) X
+
(A) = .
2.3 Reconstrucao de Estados
Se o sistema (A, , C) e observavel (em [t
0
, t
1
]), faz sentido pensar
na reconstru c ao do estado inicial z
0
a partir do vetor de observa c ao y.
Uma primeira tentativa e utilizar um operador de reconstru c ao linear
que seja, na medida do possvel, insensvel a interferencias no vetor de
observa c ao y.
steuer
2008/3/11
page 36
i
i
i
i
i
i
i
i
36 [CAP. 2: OBSERVABILIDADE
Nesse sentido denimos o operador de reconstru c ao
(2.8) z
0
=
_
t
1
t
0
R(t) y(t) dt,
onde a fun c ao matricial R e denominada n ucleo de reconstru c ao do sis-
tema. Para esse esquema de reconstru c ao particular temos o seguinte
resultado:
Teorema 16. Seja (A, , C) um sistema observ avel em [t
0
, t
1
] (n ao ne-
cessariamente aut onomo). Ent ao a fun c ao matricial
R(t) := W(t
0
, t
1
)
1
A
(t, t
0
)
C(t)
, t [t
0
, t
1
],
dene um n ucleo de reconstru c ao para o sistema (A, , C). A aplica c ao
'(y) :=
_
t
1
t
0
R(t) y(t) dt
e linear, contnua e est a bem denida de C([t
0
, t
1
]; R
l
) em R
n
.
Demonstra c ao: Do Teorema 7, sabemos que W(t
0
, t
1
) e inversvel, por-
tanto a fun c ao R (e conseq uentemente a aplica c ao ') esta bem denida.
Note ainda que
_
t
1
t
0
R(t) y(t) ds =
_
t
1
t
0
R(t) C
A
(t, t
0
) z
0
ds = z
0
,
provando que R satisfaz (2.8). A linearidade da aplica c ao ' e obvia e
sua continuidade segue da desigualdade
[
_
t
1
t
0
R(t) y(t) dt[ c max
t[t
0
,t
1
]
[y(t)[ = c |y|
.
Observa cao 17.
E possvel ainda demonstrar que a aplica c ao ' denida
acima e contnua quando denida em L
2
([t
0
, t
1
]; R
n
). Mais ainda, entre
todos os n ucleos de reconstru c ao lineares denidos em L
2
([t
0
, t
1
]; R
n
), a
fun c ao denida acima e a de menor norma. 2
steuer
2008/3/11
page 37
i
i
i
i
i
i
i
i
EXERC
ICIOS 37
Observa cao 18 (Observabilidade de sistemas nao lineares). En-
cerramos este captulo mencionando uma importante area de pesquisa
atual relacionada a sistemas n ao lineares. Uma nova teoria de obser-
vabilidade para sistemas n ao lineares foi desenvolvida nos anos 90 por
J.P.Gauthier e I.Kupka [GaKu, GaKu1, GaKu2, JoGa]. Os autores con-
sideram sistemas com din amicas e fun c oes de output ambas aut onomas
e C
ICIOS
2.4. Considere um modelo de compartimentos (veja Sec c ao 1.2.6) des-
crito pelo sistema (A, B, C), com
A =
_
_
a
1
b
1
0
a
1
(a
2
+b
1
) b
2
0 a
2
b
2
_
_
, B =
_
_
0
0
1
_
_
, C =
_
1 0 0
_
.
Verique a observabilidade do sistema.
2.5. Demonstre as arma c oes feitas na Observa c ao 13.
2.6. Considere o sistema (A, , C) com
A =
_
2 0
1 1
_
, C =
_
0 1
_
.
a) Mostre que o sistema e observavel.
b) Exiba um n ucleo de reconstru c ao para o sistema.
steuer
2008/3/11
page 39
i
i
i
i
i
i
i
i
Captulo 3
Controlabilidade
Neste captulo estudamos prioritariamente o problema de determi-
nar como e quando um estado especco pode ser atingido por um sis-
tema a partir da escolha de uma estrategia de controle apropriada. Na
Sec c ao 3.2 estudamos a rela c ao existente entre os conceitos de observa-
bilidade e controlabilidade de sistemas lineares. No Sec c ao 3.5 encon-
tramos a solu c ao de uma famlia especial de problemas de controle otimo
associados com sistemas lineares aut onomos. Na Sec c ao 3.6 tratamos
da controlabilidade de sistemas com restri c oes na variavel de controle.
Na Sec c ao 3.7 analisamos uma famlia particular de problemas, cujas
solu c oes s ao os controles denominados BangBang.
3.1 Sistemas Lineares
Consideramos um sistema linear de controle da forma (A, B, C)
z
t
= A(t) z + B(t) u (3.1)
y = C(t) z (3.2)
onde as variaveis z, y e u possuem, como na Sec c ao 2.1, a seguinte
interpreta c ao:
z : [t
0
, t
1
] R
n
: vetor das variaveis de estado;
u : [t
0
, t
1
] R
m
: vetor das variaveis de controle (entrada);
y : [t
0
, t
1
] R
l
: vetor de observa c ao (sada).
O efeito das variaveis de controle sobre a din amica do sistema e
modelado unicamente na equa c ao (3.1), sendo desnecessario considerar a
steuer
2008/3/11
page 40
i
i
i
i
i
i
i
i
40 [CAP. 3: CONTROLABILIDADE
equa c ao de observa c ao y = C(t)z. Adotamos assim a nota c ao abreviada
(A, B) para representar o sistema de controle descrito nas equa c oes (3.1),
(3.2).
A menos que se arme o contrario, as fun c oes matriciais
A : [t
0
, t
1
] R
n,n
, B : [t
0
, t
1
] R
n,m
s ao consideradas contnuas neste captulo. A matriz de transi c ao do
sistema z
t
= A(t)z (veja Deni c ao 256) e representada por
A
(, ).
Como controles admissveis consideramos as fun c oes
1
u L
1
([t
0
, t
1
]; R
m
).
Podemos agora introduzir formalmente o conceito de controlabilidade,
mencionado no Captulo 1.
Deni cao 19. O sistema (A, B) e dito control avel em [t
0
, t
1
]
quando, para todo par de estados z
0
, z
1
R
n
, existe um controle u
L
1
([t
0
, t
1
]; R
m
) de forma que a solu c ao z do problema de valor inicial
z
t
= A(t) z + B(t) u(t), z(t
0
) = z
0
satisfaz tambem a condi c ao de contorno z(t
1
) = z
1
. 2
Observa cao 20. Quando a fun c ao u L
1
([t
0
, t
1
]; R
m
) controla a evolu-
c ao do estado z a partir do estado inicial z
0
R
n
ate o estado nal z
1
R
n
atraves da din amica z
t
= A(t)z +B(t)u(t), conforme a Deni c ao 19,
usamos a nota c ao abreviada
(t
0
, z
0
)
u
(t
1
, z
1
).
2
Observa cao 21. Note que o Teorema 258 garante que um controle u
satisfaz
(t
0
, z
0
)
u
(t
1
, z
1
),
se e somente se
z
1
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds.
2
1
O espa co das fun c oes localmente integr aveis de [0, ) em R
m
e denido por
L
1
loc
([0, ); R
m
) := |u L
1
([t
0
, t
1
]; R
m
) para todos 0 t
0
t
1
< .
Por deni c ao, toda fun c ao u L
1
([t
0
, t
1
]; R
m
) possui uma exten c ao trivial u
L
1
loc
([0, ); R
m
).
steuer
2008/3/11
page 41
i
i
i
i
i
i
i
i
[SEC. 3.1: SISTEMAS LINEARES 41
Existem ainda outras formas equivalentes de se denir a controlabi-
lidade de sistemas lineares. Este e o resultado do teorema a seguir.
Teorema 22. Dado o sistema linear de controle (A, B), s ao equivalentes
as seguintes arma c oes:
a) O sistema (A, B) e control avel em [t
0
, t
1
];
b) Para todo z
1
R
n
existe uma fun c ao u L
1
([t
0
, t
1
]; R
m
) satis-
fazendo:
(t
0
, 0)
u
(t
1
, z
1
) ;
c) Para todo z
0
R
n
existe uma fun c ao u L
1
([t
0
, t
1
]; R
m
) satis-
fazendo:
(t
0
, z
0
)
u
(t
1
, 0) ;
Demonstra c ao: As implica c oes a) = b) e a) = c) s ao imediatas. As
demais implica c oes decorrem basicamente da Observa c ao 21. De fato,
b) = a) Sejam z
0
, z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal que
(t
0
, 0)
u
(t
1
, z
1
A
(t
1
, t
0
)z
0
).
Logo,
z
1
A
(t
1
, t
0
) z
0
=
A
(t
1
, t
0
) 0 +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds
e portanto (t
0
, z
0
)
u
(t
1
, z
1
).
c) = a) Sejam z
0
, z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal que
(t
0
, z
0
A
(t
1
, t
0
)
1
z
1
)
u
(t
1
, 0).
Logo,
0 =
A
(t
1
, t
0
)(z
0
A
(t
1
, t
0
)
1
z
1
) +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds,
provando que (t
0
, z
0
)
u
(t
1
, z
1
).
Observa cao 23. A propriedade descrita no item c) do Teorema 22 e
usualmente denominada na literatura por controlabilidade ao zero. 2
Uma analise sobre controlabilidade (assim como observabilidade) de
sistemas de controle n ao lineares pode ser encontrada em [LeMa]. En-
tretanto, os autores consideram somente sistemas de controle do tipo
aut onomo.
steuer
2008/3/11
page 42
i
i
i
i
i
i
i
i
42 [CAP. 3: CONTROLABILIDADE
3.2 Controlabilidade e Observabilidade
Existe um forte compromisso entre a controlabilidade do sistema
(A, B) e a observabilidade do sistema (A
, , B
). A investiga c ao desse
fato e o objeto de analise discutido nesta sec c ao.
Teorema 24. Dado o sistema linear de controle (A, B), s ao equivalentes
as arma c oes:
a) (A, B) e control avel em [t
0
, t
1
];
b) N ao existe nenhum z
1
R
n
0 que satisfa ca
B(t)
A
(t
1
, t)
z
1
= 0, t [t
1
, t
0
].
c) A matriz Z(t
0
, t
1
) :=
_
t
1
t
0
A
(t
1
, t)B(t)B(t)
A
(t
1
, t)
dt e n ao sin-
gular;
d) (A
, , B
) e observ avel em [t
0
, t
1
].
Demonstra c ao: a) = b) Seja z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal
que
(t
0
, 0)
u
(t
1
, z
1
).
Temos, portanto, que
[z
1
[
2
= z
1
, z
1
) = z
1
,
_
t
1
t
0
A
(t
1
, t)B(t)u(t) dt)
=
_
t
1
t
0
B(t)
A
(t
1
, t)
z
1
, u(t)) dt.
Logo, se z
1
R
n
0, temos obrigatoriamente B(t)
A
(t
1
, t)
z
1
, 0
em [t
0
, t
1
].
b) c) De sua deni c ao em c), segue que Z(t
0
, t
1
) e semidenida
positiva. Seja agora z
1
R
n
0. Temos ent ao
z
1
, Z(t
0
, t
1
)z
1
) =
_
t
1
t
0
[B(t)
A
(t
1
, t)
z
1
[
2
dt.
Logo, se z
1
R
n
0, a hipotese em b) implica em z
1
, Z(t
0
, t
1
)z
1
) ,= 0,
provando c).
Reciprocamente, de c) temos que B(t)
A
(t
1
, t)
z
1
0 sse z
1
= 0.
Provando assim b).
steuer
2008/3/11
page 43
i
i
i
i
i
i
i
i
[SEC. 3.2: CONTROLABILIDADE E OBSERVABILIDADE 43
c) = a) Seja z
1
R
n
. A existencia de Z(t
0
, t
1
)
1
e garantida por c).
Dena agora u por
u(t) := B(t)
A
(t
1
, t)
Z(t
0
, t
1
)
1
z
1
, t [t
0
, t
1
].
Temos ent ao
A
(t
1
, t
0
) 0 +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds =
=
_
t
1
t
0
A
(t
1
, s) B(s) B(s)
A
(t
1
, s)
Z(t
0
, t
1
)
1
z
1
ds
= Z(t
0
, t
1
) Z(t
0
, t
1
)
1
z
1
= z
1
.
O argumento da Observa c ao 21 implica em (t
0
, 0)
u
(t
1
, z
1
). A ar-
ma c ao em a) segue por m do Teorema 22.
c) d) Conforme demonstrado na Sec c ao 2.3, a rela c ao entre as
matrizes de transi c ao
A
(t
0
, t) e
A
(t, t
0
) dos sistemas z
t
= A(t)z e
w
t
= A(t)
A
(t, t
0
) :=
A
(t
0
, t)
.
Seja W(t
0
, t
1
) a matriz de observa c ao do sistema (A
, , B
) (veja Teo-
rema 7) dada por
W(t
0
, t
1
) =
_
t
1
t
0
A
(t, t
0
)
B(t) B(t)
A
(t, t
0
) dt
=
_
t
1
t
0
A
(t
0
, t) B(t) B(t)
A
(t
0
, t)
dt
=
_
t
1
t
0
A
(t
0
, t
1
)
A
(t
1
, t) B(t) B(t)
A
(t
1
, t)
A
(t
0
, t
1
)
dt
=
A
(t
0
, t
1
) Z(t
0
, t
1
)
A
(t
0
, t
1
)
.
Portanto, W(t
0
, t
1
) e singular se e somente se Z(t
0
, t
1
) o for. O resultado
desejado segue agora do Teorema 7, o qual garante que (A
, , B
) e
observavel em [t
0
, t
1
] se e somente se W(t
0
, t
1
) e positiva denida.
Observa cao 25. Na demonstra c ao da implica c ao c) = a) no Teo-
rema 24, construimos um controle especial u, que leva o estado inicial
z
0
= 0 em um estado nal z
1
R
n
arbitrario, i.e.
(t
0
, 0)
u
(t
1
, z
1
) para u(t) := B(t)
A
(t
1
, t)
Z(t
0
, t
1
)
1
z
1
.
2
steuer
2008/3/11
page 44
i
i
i
i
i
i
i
i
44 [CAP. 3: CONTROLABILIDADE
3.3 Sistemas de Controle Aut onomos
Caso as matrizes A, B do sistema de controle (A, B) sejam cons-
tantes, este sistema e denominado sistema linear aut onomo de controle.
Neste caso, dispomos da seguinte caracteriza c ao de controlabilidade:
Teorema 26. Seja (A, B) um sistema de controle aut onomo. S ao equi-
valentes as arma c oes:
a) (A, B) e control avel em [0, T] para todo T > 0;
b) (A, B) e control avel em [0, T] para algum T > 0;
c) A matriz W
T
:=
_
T
0
e
As
BB
e
A
s
ds e n ao singular para um T > 0;
d) A matriz W
T
:=
_
T
0
e
As
BB
e
A
s
ds e n ao singular para todo T>0;
e) Po(B[AB[ . . . [A
n1
B) = n.
Demonstra c ao: O teorema segue imediatamente dos Teoremas 8
e 24.
Observa cao 27. A propriedade descrita no item e) do Teorema 26
e usualmente denominada na literatura por criterio de Kalman
(1963). 2
Deni cao 28. Um sistema aut onomo (A, B), para o qual a condi c ao
de posto e) do Teorema 26 e satisfeita, e denominado completamente
control avel (veja [So, Captulo 3]). 2
Exemplo 29. Considere o problema do oscilador harm onico descrito
pela equa c ao diferencial:
x + x = u.
Podemos reescrever a equa c ao acima na forma
_
z
1
= z
2
z
2
= u z
1
que e obtida quando denimos z
1
= x e z
2
= x
t
. Escrevendo na forma
de sistema, temos
z
t
= Az + Bu, onde A =
_
0 1
1 0
_
, B =
_
0
1
_
e z =
_
z
1
z
2
_
.
steuer
2008/3/11
page 45
i
i
i
i
i
i
i
i
[SEC. 3.3: SISTEMAS DE CONTROLE AUT
ONOMOS 45
Como
Po (B[AB) = Po
_
0 1
1 0
_
= 2,
podemos concluir que (A, B) e controlavel. Note que n ao foi feita ne-
nhuma restri c ao `as variaveis de controle. 2
Exemplo 30. Consideremos novamente o movimento de um satelite
articial de massa unitaria orbitando a Terra. No Exemplo 9 deduzimos
uma aproxima c ao linear para o modelo que representa o fen omeno, que
e a equa c ao
z
t
= Az + Bu,
onde
A =
_
_
_
_
0 1 0 0
3
2
0 0 2
0 0 0 1
0 2 0 0
_
_
_
_
, B =
_
_
_
_
0 0
1 0
0 0
0 1
_
_
_
_
.
Neste caso temos:
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 0 1 0 . . .
1 0 0 2 . . .
0 0 0 1 . . .
0 1 2 0 . . .
_
_
_
_
= 4.
De onde conclumos que o sistema linearizado e controlavel (em [0, T]
para T t ao pequeno quanto se queira). Suponha agora que dispomos
apenas do empuxo radial para controlar a orbita do satelite. Neste caso
a matriz B se torna
B =
_
_
_
_
0
1
0
0
_
_
_
_
e obtemos
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 1 0
2
1 0
2
0
0 0 2 0
0 2 0 2
3
_
_
_
_
= 3.
Conclumos portanto, que nesta situa c ao o sistema n ao mais e con-
trolavel.
steuer
2008/3/11
page 46
i
i
i
i
i
i
i
i
46 [CAP. 3: CONTROLABILIDADE
Alternativamente, suponha que apenas o empuxo tangencial esteja
disponvel para realizar corre c oes na orbita. A matriz B se torna
B =
_
_
_
_
0
0
0
1
_
_
_
_
e obtemos
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 0 2 0
0 2 0 2
3
0 1 0 4
2
1 0 4
2
0
_
_
_
_
= 4.
Sendo assim, nesta situa c ao o sistema e novamente controlavel. 2
Exemplo 31. Considere o sistema (A, B) gerado pela EDO de ordem
n
x
(n)
+
n1
i=0
i+1
x
(i)
= u.
Temos assim
A =
_
_
_
_
_
_
_
_
0 1 0 0
0 1
0
0 0 1
1
2
n
_
_
_
_
_
_
_
_
, B =
_
_
_
_
_
_
_
_
0
1
_
_
_
_
_
_
_
_
.
Um calculo simples mostra que o sistema e controlavel (verique!). 2
O proximo lema nos permite analisar a quest ao da controlabilidade
quando temos perturba c oes de um sistema aut onomo totalmente con-
trolavel.
Lema 32. Seja (A, B) um sistema aut onomo totalmente control avel.
Ent ao, para toda matriz F R
m,n
, o sistema (A + BF, B) tambem e
totalmente control avel.
Demonstra c ao: Seja F R
m,n
. Da controlabilidade de (A, B) segue
que
Po(B[AB[ [A
n1
B) = n.
steuer
2008/3/11
page 47
i
i
i
i
i
i
i
i
[SEC. 3.4: FORMA NORMAL DOS SISTEMAS AUT
ONOMOS 47
Note ainda que
(B[ [(A+BF)
n1
B) = (B[ [A
n1
B) Q,
onde Q = I + N R
nm,nm
e N e uma matriz nilpotente, i.e. N
k
= 0
para algum k N.
A forma exata de N e irrelevante e pode ser calculada recursivamente.
2
O importante e que da identidade Q = I + N podemos concluir que a
matriz Q e n ao singular (verique!) e portanto
Po (B[(A+BF)B[ [(A+BF)
n1
B) = n.
Provando que (A+BF, B) e controlavel.
3.4 Forma Normal dos Sistemas Aut onomos
Os sistemas aut onomos de controle possuem ainda a caracterstica de
poder ser reescritos em uma sistema especial, denominada forma normal
(de Kalman). A vantagem e que na forma normal o sistema pode ser
dividido em 4 blocos, sendo possvel identicar os sub-sistemas:
controlavel e observavel;
controlavel e n ao observavel;
n ao controlavel e observavel;
n ao controlavel e n ao observavel.
Teorema 33. Seja (A, B, C) um sistema de controle aut onomo.
Ent ao existe uma matriz n ao singular P R
n,n
, de modo que o sis-
tema (
A,
B,
C), com matrizes
A = PAP
1
,
B = PB,
C = CP
1
, e da
forma
(3.3)
A=
_
_
_
_
A
11
A
12
A
13
A
14
0
A
22
0
A
24
0 0
A
33
A
34
0 0 0
A
44
_
_
_
_
,
B=
_
_
_
_
B
1
B
2
0
0
_
_
_
_
,
C=
_
0
C
2
0
C
4
_
.
2
Para n = 3 temos:
Q =
_
_
I FB FAB + (FB)
2
I FB
I
_
_
.
steuer
2008/3/11
page 48
i
i
i
i
i
i
i
i
48 [CAP. 3: CONTROLABILIDADE
Temos ainda que o sub-sistema
(3.4)
__
A
11
A
12
0
A
22
_
,
_
B
1
B
2
__
e control avel e o sub-sistema
(3.5)
__
A
22
A
24
0
A
44
_
,
_
C
2
C
4
_
_
e observ avel.
Demonstra c ao: Come camos denindo os subespa cos U e V de R
n
por
U := Im(B) + AIm(B) + + A
n1
Im(B), V :=
n1
k=0
Ke(CA
k
).
Dividimos a prova nos seguintes pasos:
(1) A(V ) V ;
(2) A(U) U;
(3) constru c ao da matriz P;
(4) verica c ao de (3.3);
(5) controlabilidade de (3.4);
(6) observabilidade de (3.5).
(1) Seja z V e dena x = Az. Logo, CA
k
x = CA
k+1
z = 0, para k =
0, . . . , n2. Do teorema de Caley-Hamilton, temos A
n
n1
k=0
k
A
k
= 0.
De onde conclumos que
C A
n1
x = C A
n
z =
n1
k=0
k
C A
k
z = 0.
Provamos assim que CA
k
x = 0, para k = 0, . . . , n 1, i.e. x V .
(2) Seja z U. Logo, existem vetores u
k
R
m
tais que
z =
n1
k=0
A
k
Bu
k
.
steuer
2008/3/11
page 49
i
i
i
i
i
i
i
i
[SEC. 3.4: FORMA NORMAL DOS SISTEMAS AUT
ONOMOS 49
Dena agora x = Az. Utilizando novamente o teorema de Caley-
Hamilton, temos
x =
n1
k=0
A
k+1
Bu
k
= A
n
Bu
n1
+
n1
k=1
A
k
Bu
k1
=
_
n1
k=0
k
A
k
_
Bu
n1
+
n1
k=1
A
k
Bu
k1
=
0
Bu
n1
+
n1
k=1
A
k
B(
k
u
n1
+u
k1
) in U.
(3) Primeiro decompomos o R
n
na soma direta
R
n
= X
1
X
2
X
3
X
4
,
onde X
1
= U V ; X
2
e tal que X
1
X
2
= U; X
3
e tal que X
1
X
3
= V
e X
4
= R
n
X
1
X
2
X
3
. Escolha agora uma base w
1
, . . . , w
n
para o
R
n
, que seja composta por bases para os espa cos X
1
, X
2
, X
3
, X
4
. Isto e
X
1
= Span w
1
, . . . , w
d1
, X
2
= Span w
d1+1
, . . . , w
d1+d2
,
X
3
= Span w
d1+d2+1
, . . . , w
d1+d2+d3
,
X
4
= Span w
d1+d2+d3+1
, . . . , w
n
k=1
k
P w
k
=
d1+d2
k=1
k
e
k
.
steuer
2008/3/11
page 50
i
i
i
i
i
i
i
i
50 [CAP. 3: CONTROLABILIDADE
Decorre ent ao que os blocos
B
3
e
B
4
s ao identicamente nulos. Como
V Ke(C), ent ao Cx = 0, x X
1
X
3
. De C =
CP segue agora que
Ce
k
= 0 para k = 1, . . . , d1, d1 +d2 + 1, . . . , d1 +d2 +d3. Portanto, os
blocos
C
1
e
C
3
s ao identicamente nulos.
(5) Seja k := dimU = d1 +d2. Logo, B = Im(U) + A Im(U) + +
A
k1
Im(U).
3
Temos ent ao
Po
_
_
B
1
B
2
_
[ [
_
A
11
A
12
0
A
22
_
k1
_
B
1
B
2
_
_
= Po (
B[ [
A
k1
B)
= Po (B[ [A
k1
B)
= dimU = k.
A controlabilidade de (3.4) segue agora do Teorema 8.
(6) Seja k := dim(X
2
X
4
) = d2 + d4. Logo, V =
k1
j=0
Ke(CA
j
).
4
Seja ainda M
0
a matriz de observa c ao do sub-sistema (3.5) (conforme
Teorema 8). Temos ent ao
Im(M
0
) = Im
_
_
_
_
_
(
C
2
[
C
4
)
.
.
.
(
C
2
[
C
4
)
_
A
22
A
24
0
A
44
_
k1
_
_
_
_
_
= Im
_
_
_
C
.
.
.
C
A
k1
_
_
_
= Im
_
_
_
C
.
.
.
CA
k1
_
_
_
.
3
Isto e conseq uencia da seguinte implica c ao:
A
j
Im(B) Im(U) + +A
j1
Im(U) =
A
i
Im(B) Im(U) + +A
j1
Im(U), i j.
4
Este fato segue da implica c ao:
Ke(CA
j1
) Ke(CA
j
) = Ke(CA
j
) Ke(CA
j+1
) =
V Ke(CA
j+1
).
steuer
2008/3/11
page 51
i
i
i
i
i
i
i
i
[SEC. 3.5: CONTROLABILIDADE E ESTRAT
EGIAS
OTIMAS 51
De onde conclumos que
Po(M
0
) = n dim Ke
_
_
_
C
.
.
.
CA
k1
_
_
_
= n dim V = n dim(X
1
X
3
) = k.
Logo, dim Im(M
0
) = dim Im(M
0
) = k e a observabilidade do sistema
em (3.5) segue do Teorema 26.
3.5 Controlabilidade e Estrategias
Otimas
Ainda investigando a controlabilidade de sistemas aut onomos, vemos
a seguir que e possvel encontrar uma estrategia de controle que leve o
estado (0, z
0
) no estado (T, z
1
) e que seja otima em um sentido particular.
Teorema 34. Seja (A, B) um sitema de controle aut onomo e T > 0.
Dena a matriz V
T
:=
_
T
0
e
As
BB
e
A
s
ds. S ao verdadeiras as seguintes
arma c oes:
a) O controle
(3.6) u(t) := B
e
A
(Tt)
V
T
1
(e
AT
z
0
z
1
), t [0, T]
satisfaz a propriedade
(3.7) (0, z
0
)
u
(T, z
1
).
b) Entre todos os controles admissveis u que satisfazem (3.7), u e aquele
que minimiza o funcional quadr atico
J(u) =
_
T
0
[u(t)[
2
dt
e o valor mnimo atingido por J e
(3.8) J( u) =
_
T
0
[ u(t)[
2
dt = V
T
1
(e
AT
z
0
z
1
), (e
AT
z
0
z
1
)).
Demonstra c ao: Para vericar a) note que a matriz de transi c ao de um
sistema aut onomo e dada por
A
(t, s) = e
A(ts)
. Temos portanto
steuer
2008/3/11
page 52
i
i
i
i
i
i
i
i
52 [CAP. 3: CONTROLABILIDADE
A
(T, 0) z
0
+
_
T
0
A
(T, s) B u(s) ds =
= e
AT
z
0
_
T
0
e
A(Ts)
BB
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
) ds
= e
AT
z
0
__
T
0
e
As
BB
e
A
s
ds
_
V
T
1
(e
AT
z
0
z
1
)
= e
AT
z
0
V
T
V
T
1
(e
AT
z
0
z
1
) = z
1
.
Logo, a) segue da Observa c ao 21. A equa c ao (3.8) segue por sua vez de
_
T
0
[ u(t)[
2
dt =
_
T
0
[B
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
)[
2
ds
=
_
T
0
e
A(Ts)
BB
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
) ds,
V
T
1
(e
AT
z
0
z
1
))
= V
T
V
T
1
(e
AT
z
0
z
1
), V
T
1
(e
AT
z
0
z
1
))
= V
T
1
(e
AT
z
0
z
1
), (e
AT
z
0
z
1
)).
Provemos agora b). Seja u L
1
([0, T]; R
m
) um controle qualquer satis-
fazendo (3.7). Podemos supor sem perda de generalidade que J(u) =
_
T
0
[u(t)[
2
dt < .
5
Temos ent ao
_
T
0
u(s), u(s)) ds =
_
T
0
u(s), B
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
)) ds
=
_
T
0
e
A(Ts)
Bu(s) ds, V
T
1
(e
AT
z
0
z
1
))
= (e
AT
z
0
z
1
), V
T
1
(e
AT
z
0
z
1
)).
(Na ultima passagem utilizamos a Observa c ao 21.) Acabamos de provar,
portanto, que
(3.9)
_
T
0
u(s), u(s)) ds =
_
T
0
u(s), u(s)) ds.
5
Essa hip otese garante que u L
2
([0, T]; R
m
). Note que (3.8) tambem implica em
u L
2
([0, T]; R
m
).
steuer
2008/3/11
page 53
i
i
i
i
i
i
i
i
[SEC. 3.5: CONTROLABILIDADE E ESTRAT
EGIAS
OTIMAS 53
Note porem que o produto interno , no espa co L
2
([0, T]; R
m
) e
denido por
f, g =
_
T
0
f(s), g(s)) ds, f, g L
2
([0, T]; R
m
).
Logo, (3.9) e equivalente a u, u = u, u . Temos da que
u, u + u u, u u
= 2 u, u + u, u 2 u, u
= u, u ,
o que implica em
_
T
0
[u(t)[
2
dt =
_
T
0
[ u(t)[
2
dt +
_
T
0
[u(t) u(t)[
2
dt.
O item b) segue desta ultima identidade, completando a demonstra c ao.
Observa cao 35. O Teorema 34 pode ser interpretado como:
A estrategia de controle u denida em (3.6) e solu c ao do
problema de controle otimo:
_
_
Minimizar
_
T
0
[u(t)[
2
dt
sujeito a
u L
2
([0, T]; R
m
) ;
z
t
= Az +u ; z(0) = z
0
, z(T) = z
1
.
2
Exemplo 36. Considere a equa c ao x = u. Do Exemplo 31, sabemos que
o sistema de controle associado e completamente controlavel. Tratamos
agora do seguinte problema:
Dado T > 0, encontre um controle u que leve o estado inicial
x(0) = x
0
, x(0) = x
1
no estado nal x(T) = x(T) = 0.
O Teorema 34 nos fornece uma receita (um tanto quanto trabalhosa)
para encontrar u
. A solu c ao e:
u(t) =
12
T
3
(
x
0
T
2
2
+
x
1
T
2
3
x
1
tT
2
tx
1
), t [0, T].
2
steuer
2008/3/11
page 54
i
i
i
i
i
i
i
i
54 [CAP. 3: CONTROLABILIDADE
3.6 Atingibilidade de Estados com Restric oes
de Controle
Um problema importante que surge em diversas aplica c oes praticas
e aquele em que consideramos restri c oes `as variaveis de controle. Sob
essas condi c oes e importante saber quais estados podem ser atingidos
em um determinado intervalo de tempo. Consideramos novamente um
sistema linear da forma (A, B):
(3.10) z
t
= A(t) z + B(t) u,
onde as fun c oes matriciais
A : [t
0
, t
1
] R
n,n
, B : [t
0
, t
1
] R
n,m
s ao supostas contnuas. Impomos agora a seguinte restri c ao `as variaveis
de controle: As estrategias (ou a c oes) de controle precisam ser escolhidas
a partir de um conjunto xado a priori. Seja R
m
o conjunto ao
qual esta restrita a escolha das estrategias de controle. Denominamos
conjunto de controle (ou de a c oes) e a partir da denimos o conjunto
6
U
ad
() := u L
1
([t
0
, t
1
]; R
m
) [ u(t) q.s. em [t
0
, t
1
],
que e chamado conjunto dos controles admissveis.
Deni cao 37. Seja z
0
R
n
. O subconjunto do R
n
denido por
R(; t
0
, z
0
, t
1
) := z
1
R
n
[ (t
0
, z
0
)
u
(t
1
, z
1
) para algum u U
ad
()
e denominado conjunto atingvel por z
0
. 2
Pelo que vimos ate agora, podemos garantir que R(; t
0
, z
0
, t
1
) = R
n
quando = R
m
e (A, B) e controlavel em [t
0
, t
1
]. Analisamos nesta
sec c ao o caso em que e um subconjunto proprio de R
m
.
Teorema 38. Sejam , U
ad
(), R(; t
0
, z
0
, t
1
) os conjuntos denidos
acima. Se e convexo e compacto, ent ao R(; t
0
, z
0
, t
1
) tambem e con-
vexo e compacto para todo z
0
R
n
.
6
Nota c ao: q.s. e abrevia c ao de quase sempre e signica que determinada pro-
priedade se verica excepto por um conjunto de medida (de Lebesgue) nula.
steuer
2008/3/11
page 55
i
i
i
i
i
i
i
i
[SEC. 3.6: ATINGIBILIDADE DE ESTADOS COM RESTRIC
OES DE CONTROLE 55
Demonstra c ao: Seja
A
(, ) a matriz de transi c ao do sistema. Temos
ent ao
(3.11)
R(; t
0
, z
0
, t
1
)
= z
1
[ z
1
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds, u U
ad
().
Logo, a compacidade de e a continuidade das fun c oes A() e B()
implicam na limita c ao do conjunto R(; t
0
, z
0
, t
1
). Provamos agora que
R(; t
0
, z
0
, t
1
) e fechado. Seja y = lim
l
y
l
, onde y
l
R(; t
0
, z
0
, t
1
) para
todo l N. Logo,
y
l
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u
l
(s) ds, u
l
U
ad
(), l N.
Como e limitado, ent ao (u
l
)
lN
e uma seq uencia limitada em
L
1
([t
0
, t
1
]; R
m
) e, portanto, possui uma subseq uencia fracamente conver-
gente.
7
Suponha, sem perda de generalidade, que (u
l
)
lN
e fracamente
convergente. Ent ao existe u L
1
([t
0
, t
1
]; R
m
), tal que
lim
l
_
t
1
t
0
w(t), u
l
(t)) dt =
_
t
1
t
0
w(t), u(t)) dt,
para todo w L
([t
0
, t
1
]; R
m
). Como e fechado, temos que U
ad
()
tambem e fechado.
8
E como e convexo, verica-se facilmente que
U
ad
() tambem e convexo. Sendo U
ad
() convexo e fechado, um resul-
tado conhecido da analise funcional garante que U
ad
() e fracamente
fechado. De onde conclumos que u U
ad
(). Portanto, para todo
7
Dizemos que a seq uencia x
n
converge fraco para x no espa co vetorial normado X
(nota-se x
n
w
x) quando f(x
n
) f(x) para todo funcional linear limitado f X
.
A conclus ao do texto segue de um conhecido teorema da an alise funcional: (veja
demonstra c ao em [Gr, Captulo 3] ou [Leig, Captulo 5]):
Teorema:[BanachAlaoglu] Em todo espa co de Banach (de dimens ao nita ou
n ao) a bola unit aria e fracamente compacta.
8
Aqui usamos o fato da convergencia fraca em L
1
([t
0
, t
1
]; R
m
) de uma seq uencia
implicar na convergencia pontual de uma subseq uencia quase sempre.
steuer
2008/3/11
page 56
i
i
i
i
i
i
i
i
56 [CAP. 3: CONTROLABILIDADE
v R
n
temos que
v, y) = lim
l
v, y
l
)
= lim
l
v,
A
(t
1
, t
0
)z
0
) +
_
t
1
t
0
v,
A
(t
1
, s)B(s)u
l
(s)) ds
= v,
A
(t
1
, t
0
)z
0
) + lim
l
_
t
1
t
0
B
(s)
A
(t
1
, s)
v, u
l
(s)) ds
= v,
A
(t
1
, t
0
)z
0
) +
_
t
1
t
0
B
(s)
A
(t
1
, s)
v, u(s)) ds
= v,
A
(t
1
, t
0
)z
0
+
_
t
1
t
0
A
(t
1
, s)B(s)u(s) ds).
De onde conclumos que
y =
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds R(; t
0
, z
0
, t
1
).
Provando assim que R(; t
0
, z
0
, t
1
) e fechado. O teorema de Heine-Borel
garante que, em R
n
, ser compacto e equivalente a ser simultaneamente
fechado e limitado, portanto R(; t
0
, z
0
, t
1
) e compacto. A convexi-
dade de R(; t
0
, z
0
, t
1
) segue da representa c ao am de seus elementos
em (3.11) e da convexidade de .
Exemplo 39. Considere o sistema (A, B) com matrizes
A =
_
a 0
0 a
_
, B =
_
1 0
0 1
_
.
O sistema (A, B) e totalmente controlavel, pois Po(B[AB) = 2. Logo,
R(R
2
; 0, z
0
, T) = R
2
para todo z
0
R
2
. Escolha agora = u
R
2
[ [u[ r, z
0
= 0 e t
0
= 0. Como a solu c ao do sistema possui a
representa c ao
z(t) =
_
t
0
e
a(ts)
u(s) ds,
podemos concluir que:
Se a > 0, ent ao R(; t
0
, z
0
, t
1
) = z R
2
[ [z[ ra
1
(e
at
1
1). Logo,
_
T>0
R(; 0, z
0
, T) = R
2
.
steuer
2008/3/11
page 57
i
i
i
i
i
i
i
i
[SEC. 3.6: ATINGIBILIDADE DE ESTADOS COM RESTRIC
OES DE CONTROLE 57
Se a < 0, ent ao R(; t
0
, z
0
, t
1
) = z R
2
[ [z[ r[a[
1
(1e
at
1
). Logo,
_
T>0
R(; 0, z
0
, T) = z R
2
[ [z[ [a[
1
r.
2
Este exemplo mostra que a investiga c ao do fato de um determi-
nado estado, em particular o estado z = 0, pertencer ao conjunto
R(; t
0
, z
0
, t
1
) para algum t
1
> t
0
e relevante no que diz respeito `a
controlabilidade de um sistema. Esta quest ao e especialmente interes-
sante quando observamos que 0 pode ser considerado como estado ideal
a ser atingido.
Deni cao 40. Dado R
m
, o sistema aut onomo (A, B) e denominado
control avel ao zero em z
0
quando
0 R(; z
0
) :=
_
T>0
R(; 0, z
0
, T).
2
No lema a seguir discutimos condi c oes sucientes para obtermos a
controlabilidade ao zero de sistemas de controle aut onomos.
Lema 41. Seja (A, B) um sistema de controle aut onomo, totalmente
control avel e R
m
. Se 0 e um ponto interior de , ent ao para todo
T > 0 existe uma vizinhan ca V de 0 em R
n
tal que 0 R(; 0, z
0
, T)
para todo z
0
V .
9
Demonstra c ao: Seja T > 0 e V
T
:=
_
T
0
e
As
BB
e
A
s
ds. Dena u
L
1
([0, T]; R
m
), conforme o Teorema 34, por
u(t) := B
e
A
(Tt)
V
T
1
e
AT
z
0
, t [0, T].
Este mesmo teorema nos garante que (0, z
0
)
u
(T, 0). Como a aplica c ao
[0, T] t e
tA
R
n,n
e contnua e [0, T] compacto, ent ao existe uma
constante m > 0 tal que
[u(s)[ m[z
0
[ para todo [0, T] e todo z
0
R
n
.
Como 0 Int(), existe R > 0 tal que B
R
(0) . Denindo = Rm
1
e V = B
com > 0 e
w = w
1
+iw
2
o autovetor correspondente. Temos ent ao
A
w
1
+ iA
w
2
= ( + i)(w
1
+ iw
2
), [w
1
[ +[w
2
[ ,= 0
e portanto
A
w
1
= w
1
w
2
, A
w
2
= w
1
+w
2
.
Tome x R
n
satisfazendo q := x, w
1
)
2
+ x, w
2
)
2
,= 0 e seja
u L
1
loc
([0, ); R
m
). A partir da solu c ao z do sistema z
t
= Az +Bu(t),
z(0) = x, denimos a fun c ao
v(t) := z(t), w
1
)
2
+ z(t), w
2
)
2
, t [0, )
steuer
2008/3/11
page 59
i
i
i
i
i
i
i
i
[SEC. 3.6: ATINGIBILIDADE DE ESTADOS COM RESTRIC
OES DE CONTROLE 59
e obtemos para t 0 a estimativa
v
t
(t) = 2(z
t
(t), w
1
) z(t), w
1
) + z
t
(t), w
2
) z(t), w
2
))
= 2(z(t), A
w
1
) z(t), w
1
) + z(t), A
w
2
) z(t), w
2
))
+ 2(Bu(t), w
1
) z(t), w
1
) + Bu(t), w
2
) z(t), w
2
))
=: I
1
(t) + I
2
(t).
Da deni c ao de w
1
, w
2
obtemos agora I
1
(t) = 2v(t). Como e limi-
tado, temos ainda
[I
2
(t)[
2
= 4(Bu(t), w
1
) z(t), w
1
) + Bu(t), w
2
) z(t), w
2
))
2
8(c
1
z(t), w
1
)
2
+ c
2
z(t), w
2
)
2
)
c
2
[v(t)[
2
, t 0,
onde a constante c independe de u e x. Logo,
[I
2
(t)[ c
_
v(t), t 0.
Podemos ent ao armar que
v
t
(t) (v(t)), t 0,
onde (s) := 2s c
j=0
a
j
z
(j)
= u.
Como sabemos, este sistema e totalmente controlavel se tomamos = R
(veja Exemplo 31). Escolha agora como conjunto de controle :=
[, ] R. Caso o polin omio caracterstico do sistema acima possua
apenas razes com parte real negativa, podemos concluir que o sistema
de controle associado a EDO e controlavel ao zero. 2
10
Se n ao for esse o caso, podemos sempre substituir x por um m ultiplo seu ade-
quado, uma vez que c e (e portanto c
0
) independem de x.
steuer
2008/3/11
page 60
i
i
i
i
i
i
i
i
60 [CAP. 3: CONTROLABILIDADE
3.7 Princpio do BangBang e Problemas de
Tempo Mnimo
Como na sec c ao anterior, continuamos discutindo problemas com
restri c ao `as variaveis de controle. Estamos particularmente interessados
na classica c ao dos problemas que s ao solucionados por controles do tipo
BangBang, i.e. controles u U
ad
() que satisfazem u(t) quase
sempre.
Considere o sistema escalar de controle
(3.13) z
t
= A(t)z +b(t)u, z(t
0
) = z
0
,
com fun c oes matriciais A C([t
0
, t
1
]; R
n,n
), b C([t
0
, t
1
]; R
n
). O con-
junto dos controles admissveis e
U
ad
() := u : [t
0
, t
1
] R [ u mensuravel; u(t) q.s.,
onde R
m
e convexo e compacto. Como vimos na Sec c ao A.3, a
solu c ao do sistema (3.13) e dada por
z(t) = Z(t)Z
1
(t
0
)z
0
+ Z(t)
_
t
t
0
Z
1
(s)b(s)u(s) ds, t [t
0
, t
1
].
Denindo agora o conjunto
S(; t
0
, t) :=
__
t
t
0
Z
1
(s)b(s)u(s) ds [ u U
ad
()
_
R
n
,
temos que R(; t
0
, z
0
, t) = Z(t)z
0
+Z(t)S(; t
0
, t), ou ainda
S(; t
0
, t) = Z
1
(t)R(; t
0
, z
0
, t) z
0
.
Portanto, z
0
R(; t
0
, z
0
, t) se e somente se [Z
1
(t)z z
0
] S(; t
0
, t).
Seguindo a nota c ao da Sec c ao 3.6, denimos o conjunto dos controles
de BangBang
U
bb
() := u U
ad
() [ u(t) q.s.
e o conjunto dos estados atingveis por esse tipo de estrategia de controle
R
bb
(; t
0
, z
0
, t) := z
1
R
n
[ (t
0
, z
0
)
u
(t
1
, z
1
) para algum uU
bb
().
Antes de formular o resultado principal desta sec c ao, necessitamos de
um lema auxiliar um tanto quanto tecnico.
steuer
2008/3/11
page 61
i
i
i
i
i
i
i
i
[SEC. 3.7: PRINC
INIMO 61
Lema 44. Dado t [t
0
, t
1
], a aplica c ao
I : L
([t
0
, t]; R) u
_
t
t
0
Z
1
(s)b(s)u(s) ds R
n
e linear e contnua, quando denida entre U
ad
(), com a topologia fraca
,
e o R
n
, com topologia usual.
Demonstra c ao: A linearidade segue imediatamente da deni c ao de
I. Para provar a continuidade, usamos o seguinte fato:
11
em U
ad
(),
u
n
w
u se e somente se
_
t
t
0
y(s)u
n
(s) ds
_
t
t
0
y(s)u(s) ds, y L
1
([t
0
, t]; R).
Como Z
1
(s)b(s) L
1
([t
0
, t]; R), o lema ca provado.
Apresentamos a seguir o resultado conhecido na literatura como
princpio do BangBang.
Teorema 45. Para qualquer t [t
0
, t
1
], temos R(; t
0
, z
0
, t) =
R
bb
(; t
0
, z
0
, t).
Demonstra c ao: Obviamente R
bb
(; t
0
, z
0
, t) R(; t
0
, z
0
, t). Para pro-
var a inclus ao contraria e suciente vericar que, para todo z S(; t
0
, t),
existe u U
bb
() tal que z = I( u). De fato, dado z R(; t
0
, z
0
, t),
denimos z := Z
1
(t)zZ
1
(t
0
)z
0
S(; t
0
, t). Logo, existe u U
bb
()
tal que z = I( u), de onde segue que
z = Z(t)Z
1
(t
0
)z
0
+Z(t) z =
A
(t, t
0
)z
0
+
_
t
t
0
A
(t, s)b(s) u(s) ds,
provando que z R
bb
(; t
0
, z
0
, t).
Seja portanto z S(; t
0
, t). Dena o conjunto M como a imagem
inversa de z por I, isto e,
M := I
1
(z) U
ad
() = u U
ad
() [ I(u) = z.
M e o subconjunto dos controles admissveis que garantem a inclus ao
de z em S(; t
0
, t). Basta provar ent ao que existe u M U
bb
().
11
Tal fato se justica pela topologia fraca
([t
0
, t]; R).
steuer
2008/3/11
page 62
i
i
i
i
i
i
i
i
62 [CAP. 3: CONTROLABILIDADE
Note que S(; t
0
, t) e convexo e compacto por ser uma transla c ao
am de R(; t
0
, z
0
, t) (veja Teorema 38). O Lema 44 garante ent ao
que M L
([t
0
, t], R) e compacto e convexo na topologia fraca
. O
teorema de KreinMilman nos permite concluir que M possui um ponto
extremo,
12
que denominamos u. Provamos a seguir que u(t) q.s.
em [t
0
, t].
Da hipotese, segue que e um intervalo do tipo [a, b], com a, b < .
Suponha por contradi c ao que u(t) , = a, b q.s. em [t
0
, t]. Ent ao,
existe E [a, b] de medida (de Lebesgue) positiva tal que u(s) (a, b),
para todo s E. Denindo agora
E
k
:= s E [ u(s) (a +k
1
, b k
1
), k = 1, 2, . . .
temos E =
k=1
E
k
. Logo, ao menos um dos E
k
possui medida positiva,
de modo que existe > 0 e F E de medida n ao nula tais que
u(s) (a +, b ), s F.
Como a medida de F e positiva, temos que Dim[L
(F; R) v
_
F
Z
1
(s)b(s)v(s) ds R
n
n ao pode ser injetiva (por que?). Portanto, e possvel escolher v
L
INIMO 63
Na seq uencia analisamos uma famlia particular de problemas de
controle otimo, que tem como caracterstica o fato da fun c ao objetivo
depender unicamente do tempo nal. Tais problemas s ao denominados
problemas de tempo mnimo (veja [HeLa], [Leig]).
Dadas as fun c oes matriciais A C([t
0
, ); R
n,n
), b C([t
0
, ); R
n
)
e R convexo e compacto, considere o seguinte problema de controle
escalar:
(P
Tmin
)
_
_
Minimizar t
1
sujeito a
z
t
= A(t)z +b(t)u(t) ;
z(t
0
) = z
0
, z(t
1
) = z
1
; u U
ad
() ;
onde z
0
, z
1
R
n
s ao dados e o conjunto dos controles admissveis e
denido por
U
ad
() := u L
1
loc
([t
0
, ); R) [ u(t) q.s.,
Observe que o tempo nal t
1
n ao e xado e diferentes controles ad-
missveis podem atingir a condi c ao de contorno nal em diferentes in-
tervalos de tempo. Este e um problema especial de controle otimo com
tempo nal variavel, em que a fun c ao fun c ao objetivo
_
t
1
t
0
f(t, z, z
t
) dt e
da forma f 1.
A m de garantir a existencia de solu c oes para o problema (P
Tmin
)
(veja o Teorema 46), fazemos a seguinte hipotese sobre a controlabilidade
do sistema (A, B):
H) Existem t
1
t
0
e u U
ad
() tais que a trajetoria correspondente
z
u
satisfaz z
u
(t
1
) = z
1
.
Note que a hipotese H) garante que o conjunto limitado inferiormente
T denido por
T := t
1
t
0
[ u U
ad
() com z
u
(t
1
) = z
1
t, u), onde
t := inft
1
T e u e o controle correspondente.
Teorema 46. Se a hip otese H) e v alida, ent ao existe um controle ad-
missvel u U
ad
() tal que o estado correspondente z satisfaz z(
t) = z
1
,
onde
t := inft
1
T .
steuer
2008/3/11
page 64
i
i
i
i
i
i
i
i
64 [CAP. 3: CONTROLABILIDADE
Demonstra c ao: Seja t
n
uma seq uencia minimal, i.e. t
n
t e u
n
U
ad
()
uma seq uencia de controles de modo que os estados correspondentes sa-
tisfa cam z
n
(t
n
) = z
1
para todo n N. Da identidade
13
z
n
(t
n
) z
n
(
t) =
A
(t
n
, t
0
)z
0
+
_
t
n
t
0
A
(t
n
, s)b(s)u
n
(s) ds
A
(
t, t
0
)z
0
_
t
t
0
A
(
t, s)b(s)u
n
(s) ds,
obtemos a estimativa
[z
1
z
n
(
t)[ = [z
n
(t
n
) z
n
(
t)[
[
A
(t
n
, t
0
)z
0
A
(
t, t
0
)z
0
[
+ [Z(t
n
) Z(
t)[
_
t
t
0
Z
1
(s)b(s)u
n
(s) ds
+ [Z(t
n
)
_
t
n
t
Z
1
(s)b(s)u
n
(s) ds[. (3.14)
Os dois primeiros termos do lado direito de (3.14) convergem a zero
quando n , devido `a continuidade de Z(t). O terceiro termo em
(3.14) e limitado por
|Z(t
n
)|
_
t
n
t
c [Z
1
(s)b(s)[ ds,
pois u
n
(t) q.s., que e convexo e compacto por hipotese. Portanto,
este termo tambem converge a zero quando n . Provamos assim
que z
n
(
t) z
1
. Logo, z
1
R(; t
0
, z
0
,
t) e com-
pacto (veja Teorema 38), temos que z
1
R(; t
0
, z
0
,
t, z
1
).
Corolario 47. Se a hip otese H) e v alida, ent ao existe um controle otimo
do tipo bangbang. Caso exista um unico controle otimo, ele e necessari-
amente do tipo bangbang.
Demonstra c ao: Segue diretamente dos Teoremas 45 e 46.
13
Para detalhes sobre nota c ao veja a Sec c ao A.3.
steuer
2008/3/11
page 65
i
i
i
i
i
i
i
i
[SEC. 3.8: CONTROLABILIDADE DE SISTEMAS LINEARES DISCRETOS 65
Condi c oes necessarias e/ou sucientes para existencia e unicidade de
controles bangbang s ao discutidas em [Kra, Captulo 3].
O Lema 44 e os Teoremas 45 e 46 continuam validos para controles
n ao escalares u(t) R
m
q.s. e sistemas gerais da forma z
t
=
A(t)z +B(t)u(t), com B contnua. As demonstra c oes destes resultados
s ao analogas `as aqui apresentadas.
Em [AtFa] s ao discutidas diversas aplica c oes relacionadas com tempo
mnimo, como o oscilador harm onico, o oscilador harm onico amortecido,
cinematica sem atrito (Double-integral plants). Tambem s ao discutidos
problemas de consumo mnimo de combustvel, que se assemelham aos
problemas de tempo mnimo e possuem solu c oes do tipo bang-bang.
Problemas de tempo mnimo para sistemas n ao lineares de primeira
e segunda ordem s ao tambem discutidos em [LeMa] e [Fo2]. Este ultimo
baseia sua argumenta c ao em um resultado devido a A. Feldbaum (1962).
Particularmente interessante e o problema de asfaltamento de uma rua,
discutido (em detalhes) em [Fo2, captulo 7].
3.8 Controlabilidade de Sistemas Lineares Dis-
cretos
Tratamos agora dos sistemas de controle discretos, em particular os
aut onomos. Um sistema aut onomo discreto de controle (A, B) e repre-
sentado pelas equa c oes
(3.15) z
k+1
= Az
k
+ Bu
k
, k = 0, . . . , N 1,
onde A R
n,n
e B R
n,m
. Seguindo a deni c ao feita para sistemas
contnuos, dizemos que o sistema discreto em (3.15) e completamente
control avel quando, para todo par de estados x
0
, x
N
R
n
, existe uma
estrategia de controle u = (u
0
, . . . , u
N1
) R
mN
que satisfaz
(3.16) z
k+1
= Az
k
+ Bu
k
, k = 0, 1, . . . , N 1, z
0
= x
0
, z
N
= x
N
.
Quando uma estrategia de controle u satisfaz (3.16), utilizamos a nota c ao
(0, x
0
)
u
(N, x
N
).
De (3.16) obtemos uma representa c ao para z
N
em fun c ao de z
0
e de u:
x
N
= A
N
x
0
+
N1
i=0
A
Ni1
Bu
i
,
steuer
2008/3/11
page 66
i
i
i
i
i
i
i
i
66 [CAP. 3: CONTROLABILIDADE
a qual nos fornece uma importante rela c ao para identicar a controla-
bilidade do sistema discreto em (3.15):
(3.17)
x
N
A
N
x
0
= S(A, B) u, onde S(A, B) = (A
N1
B[ [AB[B).
Teorema 48. Seja (A, B) um sistema discreto de controle e S(A, B) a
matriz denida em (3.17). Se a condi c ao de posto
(3.18) Po (S(A, B)) = Po (A
n1
B[ [AB[B) = n
e satisfeita, ent ao o controle u R
mN
denido por
(3.19) u := S(A, B)
(S(A, B)S(A, B)
)
1
(x
N
A
N
x
0
)
e tal que (0, x
0
)
u
(N, x
N
).
Demonstra c ao: Basta vericar que o controle u em (3.19) satisfaz a
equa c ao (3.17). De fato, S(A, B)S(A, B)
(S(A, B)S(A, B)
)
1
(x
N
A
N
x
0
)
= x
N
A
N
x
0
.
A matriz S(A, B)
:= S(A, B)
(S(A, B)S(A, B)
)
1
e conhecida
como pseudo inversa (ou inversa de MoorePenrose) de S(A, B).
14
Uti-
lizando multiplicadores de Lagrange e possvel vericar que o controle
denido em (3.19) e a solu c ao do problema de controle otimo discreto:
_
_
Minimizar
N1
j=0
[u
j
[
2
sujeito a
u
j
R
m
, j = 0, . . . , N 1 ;
z
k+1
= Az
k
+Bu
k
, k = 0, . . . , N 1 ;
z
0
= x
0
, z
N
= x
1
.
Conseguimos assim resolver o problema de controle discreto (3.15) para
uma importante classe de sistemas: aqueles que satisfazem a condi c ao
de posto (3.18). Entretanto, a aplica c ao
S(A, B) S(A, B)
,
14
Para detalhes veja [Gr, Captulo 5], ou ainda [Bar, Captulo 6].
steuer
2008/3/11
page 67
i
i
i
i
i
i
i
i
EXERC
ICIOS 67
que leva uma matriz em sua inversa generalizada, n ao e numericamente
estavel. Este fato torna esta estrategia de calcular a estrategia de cont-
role muitas vezes inviavel na pratica.
Observa cao 49 (Controlabilidade de sistemas nao lineares). En-
cerramos este captulo mencionando uma importante area de pesquisa
atual relacionada a sistemas n ao lineares. Resultados de controlabilidade
local podem ser obtidos atraves da utiliza c ao de tecnicas de lineariza-
c ao de sistemas [So]. Alem disso, utilizando os conceitos de algebras
de Lie de campos vetoriais e de distribui c oes (no sentido da geometria
diferencial), e possvel obter um poderoso resultado (criterio de inte-
grabilidade de Frobenius) que garante que uma distribui c ao de posto
constante e completamente integravel se, e somente se, for involutiva
[So, Captulo 4]. 2
Exerccios
3.1. Dado o sistema (A, B) com
A =
_
0 1
1 0
_
, B =
_
cos t
sin t
_
,
mostre que para todo u R a solu c ao do sistema
z
t
= Az +b(t)u, z(0) = 0
esta na superfcie z
1
sin t z
2
cos t = 0. Conclua da que o sistema n ao
e controlavel em [0, t
1
] para qualquer t
1
> 0.
3.2. Mostre que se uma matriz A possui dois ou mais autovetores linear-
mente independentes associados ao mesmo autovalor, ent ao o sistema
com controle escalar z
t
= Az +bu n ao e controlavel.
3.3. Considere o sistema (A, B) com matrizes
A =
_
2 0
1 1
_
, B =
_
1
1
_
.
a) Mostre que (A, B) n ao e controlavel.
b) Encontre o subespa co n ao controlavel do sistema.
steuer
2008/3/11
page 68
i
i
i
i
i
i
i
i
68 EXERC
ICIOS
3.4. Seja A uma matriz simetrica com autovalores
j
p
j=1
e autovetores
v
j,k
n
p
k=1
, onde n
j
e a multiplicidade de
j
, j = 1, . . . , p (note que n
1
+
+n
p
= n). Seja B a matriz formada pelas colunas b
1
, . . . , b
m
. Mostre
que o sistema (A, B) e controlavel sse
Po
_
_
_
_
_
b
1
, v
j,1
) b
m
, v
j,1
)
b
1
, v
j,2
) b
m
, v
j,2
)
.
.
.
.
.
.
.
.
.
b
1
, v
j,n
j
) b
m
, v
j,n
j
)
_
_
_
_
_
= n
j
, j = 1, . . . , p.
3.5. Conclua do exerccio anterior que, para o sistema (A, B) ser con-
trolavel, e necessario que a dimens ao da variavel de controle seja maior
que todos os n
j
, i.e. m n
j
para j = 1, . . . , p.
3.6. Verique a controlabilidade do sistema (A, B) com
A =
_
1 0
1 1
_
, B =
_
1
1
_
.
Encontre u L
1
([0, 1]; R) tal que (0, 0)
u
(1, e
2
).
3.7. Seja(A, B) um sistema aut onomo com A R
n,n
, B R
n,m
.
a) Mostre que (A, B) e controlavel em [0, T] para todo T > 0 se e
somente se R
n
= M
0
+ +M
n1
, onde M
j
:= Im(A
j
B), j = 1, . . . , n1.
b) Sejam F R
n,n
, G R
m,m
, com det(F) ,= 0, det(G) ,= 0. Mostre
que, se (A, B) e controlavel em [0, T], ent ao o sistema (F
1
AF, F
1
BG)
e tambem controlavel em [0, T].
3.8. Considere um sistema de controle (A, B) com fun c oes matriciais
A C([t
0
, t
1
]; R
n,n
), B C([t
0
, t
1
]; R
n,m
). Dado z
1
R
n
, prove que s ao
equivalentes as arma c oes:
a) Existe u L
1
([t
0
, t
1
]; R
m
) tal que (t
0
, 0)
u
(t
1
, z
1
);
b) z
1
Im(Z(t
0
, t
1
)), onde
Z(t
0
, t
1
) :=
_
t
1
t
0
A
(t
1
, s)B(s)B(s)
A
(t
1
, s)
ds.
Se o sistema (A, B) e aut onomo, mostre ainda que Im(Z(t
0
, t
1
)) =
Im(SS
), onde
S := (B[AB[ [A
n1
B).
steuer
2008/3/11
page 69
i
i
i
i
i
i
i
i
EXERC
ICIOS 69
3.9. Complete os detalhes da demonstra c ao do Teorema 26.
3.10. Considere um sistema aut onomo (A, B), com A R
n,n
,
B R
n,m
.
a) Prove que (A, B) e controlavel em [0, T], para todo T > 0, se e so-
mente se para todo w C
n
autovetor de A
vale B
w ,= 0 (criterio de
Hautus (1969); veja [So]).
b) Prove que (A, B) e controlavel em [0, T], para todo T > 0, se e
somente se
R
n
=
n1
_
j=0
M
j
, onde M
j
:= Im(A
j
B), j = 0, . . . , n 1.
c) Dadas matrizes regulares F R
n,n
, G R
m,m
, mostre que, se (A, B)
e controlavel em [0, T], ent ao (F
1
AF, F
1
BG) e tambem controlavel
em [0, T].
3.11. Dado o sistema (A, B) com matrizes
A =
_
_
1 2 1
0 1 0
1 4 3
_
_
, B =
_
_
0
0
1
_
_
,
encontre uma base para o conjunto de estados atingveis R(; 0) para
= R
m
. (veja Deni c ao 40)
3.12. Verique se os sistemas a seguir s ao controlaveis ao zero:
a) z
tt
+z
t
+z = u; = [1, 1];
b) z
tt
= u; = [1, 1].
3.13. Verique a controlabilidade do sistema no Exemplo 31.
3.14. [Piloto automatico]
15
Suponha que um avi ao voa com veloci-
dade constante c (relativa ao solo). Sejam e os angulos que o eixo do
avi ao faz com a horizontal e com a trajetotia do avi ao respectivamente
(veja Figura 3.1). A altitude do avi ao no tempo t e denotada por h(t).
Se os angulos e s ao pequenos, o deslocamento vertical do avi ao e
modelado pelo sistema n ao linear
t
= a( ),
tt
=
2
( bu), h
t
= c ,
15
Este problema e tambem considerado tambem em [So] e [Tr].
steuer
2008/3/11
page 70
i
i
i
i
i
i
i
i
70 EXERC
ICIOS
h
0
([t
0
, t
1
]; R
m
) :=v C
([t
0
, t
1
]; R
m
) [ v
(j)
(t
0
) = v
(j)
(t
1
) = 0,
j = 1, 2, . . .,
e denso em L
1
([t
0
, t
1
]; R
m
). Como a equivalencia do Exerccio 3.15 se
deixa interpretar `a luz deste resultado?
3.17. Calcule o controle otimo u para o problema proposto no Exem-
plo 36.
steuer
2008/3/11
page 71
i
i
i
i
i
i
i
i
Captulo 4
Estabilidade
Estudamos neste captulo o comportamento em perodos longos de
tempo das solu c oes de sistemas aut onomos de equa c oes diferenciais or-
dinarias (EDOs). O principal interesse esta em determinar se uma
solu c ao (trajetoria) permanece ou n ao limitada e, em caso armativo,
se esta converge assintoticamente para algum ponto de equilbrio.
Na Sec c ao 4.1 e denido o conceito de estabilidade de um ponto de
equilbrio. Na Sec c ao 4.2 s ao discutidas condi c oes necessarias e su-
cientes para estabilidade de sistemas lineares aut onomos. A Sec c ao 4.3
se destina a analisar um criterio algebrico (teorema de Hurwitz) para
garantir estabilidade de matrizes. Na Sec c ao 4.4 consideramos sistemas
obtidos por perturba c oes de sistemas lineares estaveis. As Sec c oes 4.5
e 4.6 tratam do criterio de estabilidade formulado por Lyapunov. Na
Sec c ao 4.7 aplicamos o criterio de Lyapunov a sistemas lineares discretos.
4.1 Conceito e Exemplos
Considere a equa c ao diferencial ordinaria
(4.1) z
t
= f(z),
em que o campo vetorial f satisfaz as seguintes condi c oes:
f : D R
n
, D R
n
aberto; (4.2)
0 D, f(0) = 0; (4.3)
f e continuamente diferenciavel em D. (4.4)
steuer
2008/3/11
page 72
i
i
i
i
i
i
i
i
72 [CAP. 4: ESTABILIDADE
Como o sistema e aut onomo, i.e. o campo vetorial f n ao depende ex-
plicitamente do tempo, podemos sem perda de generalidade estudar as
solu c oes a partir do instante de tempo t
0
= 0. A hipotese (4.4) garante,
para toda condi c ao inicial z
0
R
n
, a existencia de uma solu c ao local
para o problema de valor inicial (PVI):
(4.5) z
t
= f(z), z(0) = z
0
.
Essa solu c ao pode ser prolongada a um intervalo m aximo de existencia,
o qual e aqui representado por
1
J(z
0
) = [0, (z
0
)).
Nesse intervalo a solu c ao e unicamente determinada. Este resultado
e conseq uencia do teorema de PicardLindelo.
2
A chave para esse
resultado e considerar a equa c ao integral associada ao PVI (4.5)
z(t) = z
0
+
_
t
0
f(z(s)) ds, t [0, ],
no espa co C([0, ]; R
n
), onde > 0 e escolhido de forma adequada.
Representamos esta solu c ao maximal por z(, z
0
).
A condi c ao (4.3) garante que 0 e um ponto de equilbrio do sistema,
pois o PVI com condi c ao inicial z
0
= 0 possui apenas a solu c ao z(, z
0
)
0 (repouso). Note que a escolha de 0 como ponto de equilbrio n ao e
restritiva, uma vez que e sempre possvel (atraves de transla c oes) alterar
um campo vetorial de forma a atingir esta congura c ao, desde que o
campo possua apenas um zero.
3
1
Estamos interessados apenas no futuro.
2
Maiores detalhes na literatura especializada em EDO; por exemplo [Sot] ou [Wa2].
3
Na deni c ao a seguir e no resto do texto adotamos a seguinte nota c ao: Para
r 0, temos
B
r
(x) = |v R
n
[ [x v[ < r,
B
r
(x) = |v R
n
[ [x v[ r,
B
r
= B
r
(0),
B
r
=
B
r
(0).
steuer
2008/3/11
page 73
i
i
i
i
i
i
i
i
[SEC. 4.1: CONCEITO E EXEMPLOS 73
Deni cao 50. O ponto de equilbrio z = 0 do sistema (4.1) e denomi-
nado est avel quando:
> 0 > 0 tq z
0
B
( z) = J(z
0
) = [0, )
e z(t, z
0
) B
t 0 ;
e denominado atrativo quando:
> 0 tq z
0
B
( z) = J(z
0
) = [0, ) e lim
t
z(t, z
0
) = 0 ;
e denominado assintoticamente est avel quando e simultaneamente estavel
e atrativo. 2
Exemplo 51. Considere o problema do pendulo n ao linear modelado
pela equa c ao diferencial
x + sin x = 0.
O sistema correspondente e:
z
t
= f(z) com f(z) :=
_
z
2
sin z
1
_
,
cujo campo vetorial e mostrado na Figura 4.1.
_
b(r 1)
_
b(r 1)
r 1
_
_
.
4
Maiores detalhes por exemplo em [Je].
steuer
2008/3/11
page 75
i
i
i
i
i
i
i
i
[SEC. 4.2: ESTABILIDADE DE SISTEMAS LINEARES 75
A estabilidade destes 3 pontos de equilbrio pode ser analisada quando
conhecemos um pouco melhor a aproxima c ao linear do campo vetorial.
([0, ); R
n
), ent ao toda solu c ao de (4.8) esta tambem em L
([0, );
R
n
). Este fato segue imediatamente da representa c ao da solu c ao para o
problema n ao homogeneo. Tal propriedade e entretanto perdida quando
o ponto de equilbrio z = 0 e somente estavel (veja o proximo exemplo).
2
Exemplo 57. Considere o oscilador harm onico modelado pela equa c ao
diferencial
x + a
2
x = b(t)
e o respectivo sistema
_
z
1
t
z
2
t
_
=
_
0 1
a
2
0
__
z
1
z
2
_
+
_
0
b(t)
_
.
Note que z = 0 e um ponto de equilbrio do sistema
_
z
1
t
z
2
t
_
=
_
0 1
a
2
0
__
z
1
z
2
_
.
Como uma matriz fundamental para esse sistema e dada por
_
sin at cos at
a cos at a sinat
_
, t 0,
steuer
2008/3/11
page 78
i
i
i
i
i
i
i
i
78 [CAP. 4: ESTABILIDADE
podemos concluir que o ponto de equilbrio e estavel.
Considere agora como inomogeniedade (entrada) a fun c ao limitada
b(t) := cos t. A solu c ao correspondente e dada por
x(t) =
_
t
2
sin t , para = a
1
a
2
2
(cos t cos at) , para ,= a
A interpreta c ao da solu c ao obtida e a seguinte:
Para ,= a, a solu c ao e formada pela composi c ao de duas vibra c oes
com frequencias respectivamente a/2 (frequencia da energia do sis-
tema) e /2 (frequencia da for ca externa).
No caso a = , observamos o fen omeno de resson ancia: com o tempo
o sistema ganha cada vez mais energia e a solu c ao se torna ilimitada. Na
pratica, o sistema acaba sendo destrudo, devido `a sobrecarga de energia
acumulada. 2
Observa cao 58. Suponha que no sistema (4.7) tenhamos max Re()[
e autovalor de A = 0. Nesse caso o ponto z = 0 sera estavel exata-
mente quando todos os blocos de Jordan relativos aos autovalores com
Re() = 0 tiverem forma diagonal (por que?). 2
Deni cao 59. Uma matriz M R
n,n
que satisfaz
max Re() [ e autovalor de M < 0.
e denominada matriz est avel. 2
4.3 Criterio de RouthHurwitz
Como sabemos, os autovalores da matriz A R
n,n
do sistema (4.7)
s ao as razes do polin omio caracterstico de A (aqui denominado p
A
).
Suponha que p
A
e da forma
p
A
(r) = r
n
+
n
i=1
a
i
r
ni
.
Pela Deni c ao 59 a matriz A e estavel quando todas as razes de p
a
estiverem no semi-plano esquerdo do plano complexo. Discutimos nesta
sec c ao uma condi c ao necessaria (criterio de RouthHurwitz) para a es-
tabilidade de uma matriz.
steuer
2008/3/11
page 79
i
i
i
i
i
i
i
i
[SEC. 4.3: CRIT
ERIO DE ROUTHHURWITZ 79
Lema 60. Se A e uma matriz est avel, ent ao todos os coecientes
a
1
, . . . , a
n
de p
A
s ao positivos.
Demonstra c ao: Denotando por
k
os autovalores reais de A e por
j
os
autovalores com parte imaginaria n ao nula, temos que
p
A
(r) =
k
(r
k
)
j
(r
2
2Re(
j
)r +[
j
[
2
).
A hipotese da estabilidade de A implica em
k
> 0, 2Re(
j
) > 0.
Provando assim que os coecientes de p
A
s ao positivos.
Uma desvantagem obvia da aplica c ao deste criterio e a necessidade
do conhecimento do polin omio caracterstico p
A
. O exemplo a seguir
mostra que o criterio n ao e suciente para garantir a estabilidade de A.
Exemplo 61. Considere a equa c ao diferencial
x
(3)
+ x
(2)
+ x
(1)
+ x = 0.
O polin omio caracterstico do sistema correspondente e
p(r) = r
3
+ r
2
+ r + 1
e possui razes 1, i. Portanto, o ponto de equilbrio z = 0 do sistema
correspondente e estavel, mas n ao e assintoticamente estavel. 2
Observa cao 62. No caso dos polin omios de grau menor ou igual a 4, e
possvel encontrar condi c oes sucientes para garantir a estabilidade da
matriz A a partir da aplica c ao do teorema fundamental da algebra (veja
[Gon]). De fato, os polin omios
i) r +a
ii) r
2
+ar +b
iii) r
3
+ar
2
+br +c
iv) r
4
+ar
3
+br
2
+cr +d
com coecientes reais possuem apenas razes com parte real negativa se
e somente se as seguintes condi c oes s ao respectivamente satisfeitas:
i
) a > 0
ii
) a > 0, b > 0
iii
i=1
a
i
r
ni
um polin omio com coecientes reais positivos. Dena os polin omios U
e V (com coecientes tambem reais positivos) de modo que
U(r) + iV (r) = p(ir), r R.
Temos ent ao:
Grau de U = n e grau de V = n 1, se n for par;
Grau de U = n 1 e grau de V = n, se n for mpar.
Denimos a partir de U e V os seguintes polin omios:
q
1
:= U, q
2
:= V, se n e par;
q
1
:= V, q
2
:= U, se n e mpar.
q
3
, . . . , q
m
s ao obtidos a partir do algoritmo de divis ao de Euclides
aplicado ao par q
1
, q
2
. Temos assim:
5
q
k1
=
k
q
k
q
k+1
, k = 2, . . . , m1 e q
m1
=
m
q
m
.
Apos esta constru c ao estamos prontos para enunciar o teorema de
Routh.
5
Note que q
m
e (a menos de uma constante) o maior divisor comum de q
1
, q
2
.
steuer
2008/3/11
page 81
i
i
i
i
i
i
i
i
[SEC. 4.4: PERTURBAC
AO DE SISTEMAS LINEARES 81
Teorema 64. Sejam U, V , q
1
, . . . , q
m
denidos como acima. As se-
guintes arma c oes s ao equivalentes:
a) O polin omio p possui apenas razes com Re() < 0;
b) m = n + 1 e os sinais dos coecientes de maior grau de q
1
, . . . , q
n+1
alternam.
A demonstra c ao deste resultado foge aos nossos objetivos e n ao e
apresentada. O leitor interessado pode encontrar em [Gan] uma de-
monstra c ao baseada em um teorema de resduos da analise complexa.
4.4 Perturba cao de Sistemas Lineares
Consideramos nesta sec c ao sistemas da forma
(4.9) z
t
= A z + g(z),
onde A R
n,n
e g : R
n
R
n
. Supomos ainda que as hipoteses em (4.3)
e (4.4) sejam satisfeitas pela fun c ao
f(z) := Az + g(z), z D := R
n
.
O teorema a seguir nos fornece uma condi c ao suciente para garantir
a estabilidade do ponto de equilbrio do sistema (4.9).
Teorema 65. Seja A uma matriz est avel e g : R
n
R
n
uma aplica c ao
satisfazendo lim
[z[0
[g(z)[/[z[ = 0. Ent ao o ponto de equilbrio z = 0 do
sistema (4.9) e assintoticamente est avel.
Demonstra c ao: Das hipoteses temos que
c 0, > 0 tq (|e
At
| ce
2t
), t 0,
> 0 tq ([g(y)[ c
1
[y[), y B
.
Seja z : [0, T) R
n
uma solu c ao local do sistema
z
t
= A z + g(z).
steuer
2008/3/11
page 82
i
i
i
i
i
i
i
i
82 [CAP. 4: ESTABILIDADE
(A existencia desta solu c ao e garantida pela hipotese (4.4).) Temos ent ao
z(t) = e
At
z(0) +
_
t
0
e
A(ts)
g(z(s)) ds,
[z(t)[ |e
At
| [z(0)[ +
_
t
0
|e
A(ts)
| [g(z(s))[ ds
c e
2t
[z(0)[ +
_
t
0
e
2(ts)
[z(s)[ ds, t [0, T).
Denindo w(t) := e
2t
[z(t)[ para t [0, T), obtemos a estimativa
w(t) c [z(0)[ +
_
t
0
w(s) ds, t [0, T).
Temos agora como resultado do lema de Gronwall (veja Lema 264) que
w(t) c [z(0)[ e
t
, t [0, T),
de onde segue
(4.10) z(t) c [z(0)[ e
t
, t [0, T).
Podemos ent ao concluir que a solu c ao local z pode ser prolongada ao
intervalo [0, ). Logo, a estimativa (4.10) vale para T = e o teorema
ca provado.
Observa cao 66. A import ancia do Teorema 65 e a forma pela qual ele
pode ser aplicado na analise da estabilidade dos pontos de equilbrio dos
sistemas de controle em (4.9):
Expanda o campo vetorial f no ponto de equilbrio z = 0. O
sistema resultante e da forma (4.9), onde A = df(0) e g(z) =
f(z) df(0)g. (A hipotese de g estar denida em todo R
n
n ao
e restritiva, pois na demonstra c ao necessitamos de g somente em
uma vizinhan ca de z = 0.)
Verique se A = df(0) e uma matriz estavel.
A hipotese lim
[z[0
[g(z)[/[z[ = 0 e trivialmente satisfeita, pois f
e suposta continuamente diferenciavel.
steuer
2008/3/11
page 83
i
i
i
i
i
i
i
i
[SEC. 4.4: PERTURBAC
AO DE SISTEMAS LINEARES 83
Note, entretanto, que este metodo de lineariza c ao fornece apenas uma
condi c ao suciente para a estabilidade. Tal condi c ao e por demasiado
restritiva e esta longe de ser necessaria (veja o Exemplo 69). 2
Exemplo 67. Aplicamos o metodo de lineariza c ao ao oscilador n ao
linear com amortecimento a > 0, que e descrito pela equa c ao diferencial
x + 2a x + sin x = 0.
O sistema correspondente e:
(4.11) z
t
= f(z) com f(z
1
, z
2
) =
_
z
2
2az
2
sin z
1
_
e a lineariza c ao do sistema no ponto de equilbrio z = 0 nos fornece a
matriz
A = df(0) =
_
0 1
1 2a
_
.
= a
_
a
2
1.
A matriz A e portanto estavel e o ponto de equilbrio z = 0 e assintotica-
mente estavel. O sistema (4.11) possui ainda outro ponto de equilbrio,
a saber: z = (, 0). A lineariza c ao neste ponto gera a matriz
A = df( z) =
_
0 1
1 2a
_
,
que possui um autovalor com Re() > 0. O Teorema 65 n ao se aplica,
entretanto o ponto de equilbrio z n ao e estavel. Nas Figuras 4.3 e 4.4
e mostrado o campo em vizinhan cas dos pontos z = 0 e z = (, 0),
respectivamente. 2
Exemplo 68. Consideremos novamente o sistema de Lorenz (veja
Exemplo 52), descrito pela equa c ao diferencial
(4.12) z
t
= f(z) com f(z) =
_
_
s(z
2
z
1
)
rz
1
z
2
z
1
z
3
z
1
z
2
bz
3
_
_
,
steuer
2008/3/11
page 84
i
i
i
i
i
i
i
i
84 [CAP. 4: ESTABILIDADE
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
y
-1 -0.5 0.5 1
x
Figura 4.3: Campo vetorial de x
tt
+ 2ax
t
+ sin x = 0 (para a = 1) em
uma vizinhan ca do ponto z = 0.
steuer
2008/3/11
page 85
i
i
i
i
i
i
i
i
[SEC. 4.4: PERTURBAC
AO DE SISTEMAS LINEARES 85
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
y
2 2.5 3 3.5 4
x
Figura 4.4: Campo vetorial de x
tt
+ 2ax
t
+ sin x = 0 (para a = 1) em
uma vizinhan ca do ponto z = (, 0).
steuer
2008/3/11
page 86
i
i
i
i
i
i
i
i
86 [CAP. 4: ESTABILIDADE
onde s, r e b s ao constantes positivas.
E facil vericar que, para r > 1,
existem tres pontos de equilbrio:
z =
_
_
0
0
0
_
_
, z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
e z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
.
Linearizando o sistema nestes pontos, obtemos respectivamente as ma-
trizes:
A = df( z) =
_
_
s s 0
r 1 0
0 0 b
_
_
,
A = df( z) =
_
_
s s 0
1 1
_
b(r 1)
_
b(r 1)
_
b(r 1) b
_
_
,
e
A = df( z) =
_
_
s s 0
1 1
_
b(r 1)
_
b(r 1)
_
b(r 1) b
_
_
.
Para o ponto de equilbrio z obtemos o polin omio caracterstico
p() = ( +b) (
2
+ (s + 1) s(r 1)),
o qual possui duas razes negativas e uma positiva. Portanto, a estabi-
lidade numa vizinhan ca de z e improvavel.
Os pontos de equilbrio z e z est ao associados ao mesmo polin omio
caracterstico:
p() =
3
+ (s + 1 +b)
2
+b(s +r) + 2bs(r 1).
O criterio de RouthHurwitz e aplicavel quando
6
(s + 1 +b)b(s +r) 2bs(r 1) > 0
Este e o caso se
s > b + 1 , r < r
c
:= s
s + 3 +b
s b 1
,
6
Veja Observa c ao 62.
steuer
2008/3/11
page 87
i
i
i
i
i
i
i
i
[SEC. 4.5: M
ETODO DE LYAPUNOV 87
0
10
20
30
40
-20
-10
0
10
20
-15
-10
-5
0
5
10
15
20
Figura 4.5:
Orbita do atrator de Lorenz (4.12) para os par ametros s =
10, r = 28 e b = 8/3; condi c ao inicial: z(0) = (0.1, 0.1, 0.1).
quando ent ao podemos concluir que os pontos de equilbrio z e z s ao
assintoticamente estaveis. Para os valores especiais s = 10, r = 28 e
b = 8/3, temos r > r
c
24.74 e os tres pontos de equilbrio n ao mais
s ao estaveis. Entretanto, os polin omios caractersticos de z e z ainda
possuem uma raiz negativa, fato que contribui para o comportamento
mpar das orbitas do sistema (veja Figura 4.5). 2
4.5 Metodo de Lyapunov
Um metodo eciente de se vericar a estabilidade e o desenvolvido
por A.M. Lyapunov (1893). O metodo trata de sistemas n ao lineares da
forma (4.1) e se baseia na analise de autovalores. Analisamos a seguir
um exemplo que serve de motiva c ao para o metodo apresentado nesta
sec c ao.
steuer
2008/3/11
page 88
i
i
i
i
i
i
i
i
88 [CAP. 4: ESTABILIDADE
Exemplo 69. Considere o sistema
(4.13) z
t
= f(z) com f(z
1
, z
2
) =
_
3z
2
z
1
5
2z
2
+z
1
5
_
.
Os autovalores da matriz A = df(0) s ao 0 e 2. Logo, A n ao e uma
matriz estavel e a quest ao da estabilidade do ponto de equilbrio 0 per-
manece em aberto.
Dena V (z
1
, z
2
) := z
1
6
+ 9z
2
2
e seja z = (z
1
, z
2
) R
2
uma solu c ao
do sistema (4.13). Temos ent ao
d
dt
V (z
1
(t), z
2
(t)) = 6z
1
(t)
10
36z
2
(t)
2
0,
de onde segue
0 V (z
1
(t), z
2
(t))
= V (z
1
(0), z
2
(0))
_
t
0
(6z
1
(s)
10
+ 36z
2
(s)
2
) ds, t 0.
A estabilidade do ponto de equilbrio 0 e agora uma conseq uencia direta
desta desigualdade. Alem disto, temos ainda que lim
t
z(t) = 0. De
fato, como a fun c ao t V (z
1
(t), z
2
(t)) e monotona n ao crescente, existe
o limite a := lim
t
V (z
1
(t), z
2
(t)).
Como V (z
1
, z
2
) = 0 se e somente se (z
1
, z
2
) = 0, basta vericar que
a = 0. Suponha por contradi c ao que a > 0. Temos ent ao que
0 < a V (z
1
(t), z
2
(t)) V (z
1
(0), z
2
(0)), t 0.
Dena
m := inf6z
1
10
+ 36z
2
2
[ (z
1
, z
2
) R
2
; a V (z
1
, z
2
) V (z
1
(0), z
2
(0)).
Como V e contnua, temos que m > 0. Para t 0 temos agora
0 V (z
1
(t), z
2
(t)) V (z
1
(0), z
2
(0)) m
_
t
0
dt
= V (z
1
(0), z
2
(0)) mt.
Como o lado direito da ultima express ao se torna negativo para t su-
cientemente grande, chegamos `a desejada contradi c ao. 2
steuer
2008/3/11
page 89
i
i
i
i
i
i
i
i
[SEC. 4.5: M
ETODO DE LYAPUNOV 89
Deni cao 70. Uma fun c ao V : U R, onde U e uma vizinhan ca
qualquer de z = 0, e denominada fun c ao de Lyapunov para o sistema
z
t
= f(z) quando satisfaz:
i) V e contnua em U e continuamente diferenciavel em U0;
ii) V (0) = 0, V (x) > 0 para todo x U, x ,= 0;
iii) V (x), f(x)) 0 para todo x U0.
V e denominada fun c ao de Lyapunov estrita quando, ao inves da condi c ao
iii), satiszer:
iii
:= x U [ V (x) <
B
r
B
r
. Ent ao > 0 e a continuidade de V implica que U
,= e que U
e
uma vizinhan ca de 0. Seja z uma solu c ao de
z
t
= f(z), z(0) = z
0
U
.
Temos ent ao V (z(0)) < e
(4.14)
d
dt
V (z(t)) = V (z(t)), z
t
(t))
= V (z(t)), f(z)) 0, t [0, (z
0
)),
onde (z
0
) e o maior real que satisfaz z(t)
B
r
, t [0, (z
0
)]. Se
existisse t
1
(0, (z
0
)] tal que [z(t
1
)[ = r, teramos
V (z(0)) < V (z(t
1
))
steuer
2008/3/11
page 90
i
i
i
i
i
i
i
i
90 [CAP. 4: ESTABILIDADE
pela deni c ao de e
V (z(t
1
)) V (z(0))
como conseq uencia de (4.14), nos levando a uma contradi c ao. Portanto,
temos necessariamente z(t) B
r
, para todo t [0, (z
0
)]. Isto porem
contradiz a maximalidade do intervalo [0, (z
0
)], provando assim que
(z
0
) = e z(t) B
r
para todo t [0, ). Fica assim provado que
z = 0 e um ponto de equilbrio estavel.
Provamos agora b). Dena inicialmente W := U
.
(=) Como z e atrativo, existe > 0 tal que, para todo z
0
B
, a
solu c ao correspondente z(, z
0
) converge para z quando t . Caso
W , B
, redena W := U
= x U [ V (x) <
B
r
.
Considere agora a solu c ao z do sistema
z
t
= f( z), z(0) = z.
Do item a) temos que
z : [0, ) B
r
,
Como z ,= 0 e V ( z(t)) e monotona n ao crescente, ent ao V ( z(t))
V ( z(0)) = V ( z), t. Caso a igualdade sempre se vericasse, a hipotese
em b) implicaria em z(t) 0 e z = 0. Portanto, existe um > 0 com
V ( z()) < V ( z).
steuer
2008/3/11
page 91
i
i
i
i
i
i
i
i
[SEC. 4.5: M
ETODO DE LYAPUNOV 91
A equa c ao diferencial e aut onoma, logo as fun c oes z
n
: [0, ) R
n
denidas por z
n
(t) := z(t
n
+ t) s ao solu c oes respectivamente de z
t
n
=
f(z
n
), z
n
(0) = z(t
n
). Como lim
n
z(t
n
) = z, segue do Lema 266 que
lim
n
[z
n
(t) z(t)[ = lim
n
[z(t
n
+t) z(t)[ = 0, t [0, ].
Isto e, lim
n
z
n
(t) = z(t), t [0, ]. Temos, portanto,
lim
n
V (z(t
n
+)) = V ( z()) < V ( z).
Isto porem e um absurdo, pois sendo V (z(t)) monotona n ao crescente, e
possvel encontrar, para todo n N, um m N tal que V (z(t
n
+))
V (z(t
m
)) V ( z) = lim
n
V (z(t
n
)).
Corolario 72 (Lyapunov). Seja V uma fun c ao de Lyapunov estrita
em U, uma vizinhan ca de 0, para o sistema z
t
= f(z). Ent ao, o ponto
de equilbrio z = 0 e assintoticamente est avel.
Demonstra c ao: O Teorema 71 a) garante estabilidade de z em alguma
vizinhan ca B
r
U. Note agora que, para toda solu c ao de z
t
= f(z)
que permanece em B
r
para t 0, a aplica c ao t V (z(t)) e monotona
estritamente decrescente. Portanto, a unica dentre essas solu c oes que
satisfaz
d
dt
V (z(t)) = 0, t 0 e a solu c ao estacionaria z(t) 0. Do
Teorema 71 b) segue que z e atrativo.
Exemplo 73. Considere novamente o sistema n ao linear
z
t
= f(z) com f(z
1
, z
2
) =
_
3z
2
z
1
5
2z
2
+z
1
5
_
.
No Exemplo 69 introduzimos a fun c ao de Lyapunov estrita
V (z
1
, z
2
) := z
1
6
+ 9z
2
2
, (z
1
, z
2
) R
2
a m de analisar este sistema. Podemos agora concluir diretamente do
Corolario 72 que o ponto de equilbrio z = 0 e assintoticamente estavel.
2
Exemplo 74. Considere a equa c ao diferencial para o circuito eletrico
RLC:
CL x + RC x +x = 0,
steuer
2008/3/11
page 92
i
i
i
i
i
i
i
i
92 [CAP. 4: ESTABILIDADE
cujo sistema associado e
z
t
= f(z) com f(z
1
, z
2
) =
_
0 1
[LC]
1
RL
1
_ _
z
1
z
2
_
,
onde R, L e C s ao constantes positivas. Uma fun c ao de Lyapunov para
este sistema e
V (z
1
, z
2
) := Lz
2
2
+ C
1
z
1
2
, (z
1
, z
2
) R
2
,
de onde calculamos
V (z
1
, z
2
), f(z
1
, z
2
)) = 2Rz
2
2
, (z
1
, z
2
) R
2
.
Logo, V n ao e uma fun c ao de Lyapunov estrita e o Teorema 71 a) garante
que z = 0 e estavel. Note porem que a condi c ao 2Rz
2
(t)
2
= 0, para
todo t 0, implica em z
2
(t) = z
t
2
(t) = 0, t 0. Da equa c ao diferencial
temos ent ao z
1
(t) = 0, t 0. Assim sendo, o Teorema 71 b) garante que
z = 0 e tambem atrativo e, portanto, assintoticamente estavel. 2
Exemplo 75. Considere agora o sistema
z
t
= f(z) com f(z
1
, z
2
) =
_
0 1
1 0
_ _
z
1
z
2
_
.
Uma fun c ao de Lyapunov e dada por V (z
1
, z
2
) = z
1
2
+z
2
2
. O Teorema 71
garante que z = 0 e um ponto de equilbrio estavel mas n ao atrativo
(verique!). 2
4.6 Equacao Matricial de Lyapunov
Iniciamos esta sec c ao recordando alguns importantes conceitos da
algebra linear, relacionados com os autovalores de uma matriz.
Deni cao 76. Uma matriz simetrica M R
n,n
e denominada
Positiva denida quando x, Mx) > 0, para todo x R
n
, x ,= 0;
Positiva semi-denida quando x, Mx) 0, para todo x R
n
;
Negativa denida quando M e positiva denida. 2
No lema a seguir apresentamos a solu c ao de uma equa c ao matricial
que e fundamental para a formula c ao do criterio de Lyapunov.
steuer
2008/3/11
page 93
i
i
i
i
i
i
i
i
[SEC. 4.6: EQUAC
AO MATRICIAL DE LYAPUNOV 93
Lema 77. Sejam U R
n,n
, V R
m,m
e W R
n,m
. Se U e V s ao
matrizes est aveis, ent ao a solu c ao unica da equa c ao matricial
UX + XV + W = 0 (X R
n,m
)
e a matriz est avel X denida por
X :=
_
0
e
tU
We
tV
dt.
Demonstra c ao: Do Teorema 248 e da hipotese, temos que existem cons-
tantes c 0 e > 0 tais que
|e
tU
| ce
t
, |e
tV
| ce
t
, t 0.
Note que para T > 0, temos
e
TU
We
TV
W =
_
T
0
d
dt
(e
tU
We
tV
) dt
=
_
T
0
(Ue
tU
We
tV
+e
tU
WV e
tV
) dt
=
_
T
0
(Ue
tU
We
tV
+e
tU
We
tV
V ) dt.
Tomando o limite quando T , temos que
X =
_
0
e
tU
We
tV
dt
e solu c ao da equa c ao matricial W = UX+XV , cando assim provada
a existencia de solu c oes. Para provar unicidade, suponha que X
1
, X
2
s ao ambas solu c oes de UX+XV +W = 0 e dena
X := X
1
X
2
. Logo,
X R
n,m
e solu c ao de
U
X +
XV = 0.
Temos ent ao
d
dt
(e
tU
Xe
tV
) = e
tU
(U
X +
XV )e
tV
= 0
e portanto,
e
tU
Xe
tV
= e
0U
Xe
0V
=
X.
Tomando o limite quando t , obtemos
X = 0.
steuer
2008/3/11
page 94
i
i
i
i
i
i
i
i
94 [CAP. 4: ESTABILIDADE
No teorema a seguir e apresentada uma equa c ao matricial, que fornece
uma forma equivalente de denir a estabilidade de uma matriz.
Teorema 78. Dada uma matriz A R
n,n
, s ao equivalentes as as
seguintes arma c oes:
a) A e uma matriz est avel;
b) Existe uma matriz positiva denida P R
n,n
tal que
(4.15) A
P + PA = I.
Demonstra c ao: Se a matriz A e estavel, a existencia de P segue do
Lema 77 com U = A
, V = A e X = P. Reciprocamente, se P satisfaz
a equa c ao (4.15), dena
V (x) := x, Px), x R
n
.
Logo, a fun c ao diferenciavel V satisfaz V (0) = 0, V (x) > 0, x ,= 0 e
ainda
V (x), Ax) = Px +P
x, Ax)
= A
Px, x) + x, PAx)
= (A
P +PA)x, x)
= x, x).
Isto e, V e uma fun c ao de Lyapunov estrita. O Corolario 72 implica que
o ponto de equilbrio z = 0 e assintoticamente estavel. O Teorema 54
garante por m que os autovalores de A possuem parte real estritamente
negativa.
Observa cao 79. No Teorema 78, a equa c ao (4.15) pode ser substituda
pela exigencia de A
X +XA = W;
W C
C e positiva semi-denida;
(A, , C) e observ avel.
Ent ao a matriz A e est avel se X for positiva denida.
steuer
2008/3/11
page 95
i
i
i
i
i
i
i
i
[SEC. 4.6: EQUAC
AO MATRICIAL DE LYAPUNOV 95
Demonstra c ao: (=) Seja A uma matriz estavel. Do Lema 77 temos
que X =
_
0
e
tA
We
tA
dt. Logo, para x R
n
temos
x, Xx) =
_
0
e
tA
x, We
tA
x) dt
_
0
e
tA
x, C
Ce
tA
x) dt
=
_
0
[Ce
tA
x[
2
dt.
Como (A, , C) e observavel, conclumos que Ce
tA
x = 0, t 0 se x = 0.
7
O que prova que X e positiva denida.
(=) Suponha X positiva denida. Dena como na demonstra c ao do
Teorema 78 a fun c ao
V (x) := x, Xx), x R
n
.
Como W C
, temos x
k
B
, k =
1, 2, . . .
atrativo quando: para todo x
0
R
n
, temos lim
k
x
k
= 0. 2
Como nos sistemas contnuos aut onomos, a atratividade implica na
estabilidade. A analise da estabilidade de tais sistemas e bastante sim-
ples e e esclarecida com os seguintes lemas:
Lema 82. Dado um sistema linear discreto da forma (4.16), s ao equi-
valentes as arma c oes:
a) O ponto de equilbrio x = 0 e atrativo;
b) O operador A considerado como elemento do espa co L(R
n
, R
n
) e
contrativo, i.e.
|A| := sup
xR
n
\0
|Ax|
|x|
< 1.
Demonstra c ao: a) = b) Seja um autovalor de A e x
0
o respectivo
autovetor. Logo, x
k
= A
k
x
0
=
k
x
0
. Da hipotese temos agora
lim
k
[[
k
|x
0
| = 0,
o que implica em < 1. Como e arbitrario, b) ca provado.
b) = a) Dado x
0
R
n
, temos da hipotese
lim
k
|x
k
| |x
0
| lim
k
|A|
k
= 0
e o teorema ca provado.
steuer
2008/3/11
page 97
i
i
i
i
i
i
i
i
[SEC. 4.7: ESTABILIDADE DE SISTEMAS LINEARES DISCRETOS 97
No que se refere `a verica c ao da estabilidade do ponto de equilbrio
de (4.16) temos o lema a seguir, que por sua semelhan ca com o Lema 82
e deixado para o leitor como exerccio.
Lema 83. Dado o sistema linear discreto (4.16), s ao equivalentes as
arma c oes:
a) O ponto de equilbrio x = 0 e est avel;
b) O operador A considerado como elemento do espa co L(R
n
, R
n
) e n ao
expansivo, i.e.
|A| := sup
xR
n
\0
|Ax|
|x|
1.
O criterio de Lyapunov tambem se aplica a sistemas discretos, com
a nalidade de estabelecer condi c oes sucientes para estabilidade.
Deni cao 84. Uma fun c ao V : R
n
R e denominada fun c ao de Lya-
punov quadr atica para o sistema x
k+1
= Ax
k
quando satisfaz:
i) V e da forma: V (x) = x, Px), com P positiva denida;
ii) V (Ax) < V (x) para todo x R
n
0.
2
Lema 85. Seja V uma fun c ao de Lyapunov quadr atica para o sistema
(4.16). Ent ao o ponto de equilbrio x = 0 e atrativo.
Demonstra c ao: Seja um autovalor de A e x o respectivo autovetor.
Por hipotese temos
[[
2
x, Px) = Ax, PAx) < x, Px),
provando assim que [[ < 1. Como e arbitrario, o lema ca provado.
Do Lema 85, obtemos para sistemas discretos um resultado analogo
ao Teorema 78.
Lema 86. O ponto de equilbrio x = 0 do sistema x
k+1
= Ax
k
e atrativo
se e somente se existe matriz denida positiva P tal que A
PA P e
negativa denida.
Demonstra c ao: (=) Como |A| < 1, e facil vericar que P = I (a
matriz identidade) e tal que A
ICIOS
denida.)
(=) Basta observar que V (x) := x, Px) dene uma fun c ao de Lya-
punov quadratica para o sistema.
A equa c ao A
ICIOS 99
4.4. Encontre para o sistema
x
1
= x
1
+ 2x
1
x
2
, x
2
= x
2
+x
3
, x
3
= x
2
4x
3
uma fun c ao de Lyapunov da forma
V (x
1
, x
2
, x
3
) = a
11
x
2
1
+a
22
x
2
2
+a
33
x
2
3
+2a
12
x
1
x
2
+2a
23
x
2
x
3
+2a
13
x
1
x
3
.
4.5. Complete os detalhes da demonstra c ao do Lema 83.
4.6. Para sistemas n ao aut onomos, o metodo de lineariza c ao n ao pode,
via de regra, ser utilizado na analise de estabilidade. Tal fato se torna
claro mesmo para sistemas lineares. Considere o sistema z
t
= A(t) z,
com
A(t) =
_
1 2 cos 4t 2 + 2 sin 4t
2 + 2 sin 4t 1 + 2 cos 4t
_
.
a) Calcule os autovalores de A(t);
b) Mostre que a origem e um ponto de equilbrio instavel;
(Dica: Observe que a equa c ao diferencial possui uma solu c ao da forma:
e
t+it
.)
4.7. O que se pode armar, a partir do metodo de lineariza c ao, sobre a
estabilidade do ponto de equilbrio (0, 0, 0) do sistema no Exerccio 4.4?
4.8. Considere novamente o oscilador harm oninco ( > 0, > 0)
x +F
( x) +x = 0, com F
(s) :=
_
, s > 0
, s < 0
a) Fa ca um esbo co da famlia de solu c oes no plano (x, x);
b) Encontre os pontos de equilbrio (x, x) do sistema.
4.9. Considere o sistema ( > 0, b > 0)
x = U(t), com U(t) :=
_
b, t > 0
b, t < 0
a) Fa ca um esbo co da famlia de solu c oes no plano (x, x);
b) Mostre que existem solu c oes periodicas e calcule o perodo da orbita.
steuer
2008/3/11
page 100
i
i
i
i
i
i
i
i
100 EXERC
ICIOS
4.10. Mostre que a matriz
A =
_
_
1 1 1
1 1 1
1 1 0
_
_
e positiva indenida, i.e. n ao e nem positiva denida nem negativa
denida.
4.11. Considere o sistema
x
1
= 3x
2
, x
2
= x
1
+ 4x
2
.
a) Mostre que o ponto de equilbrio (0, 0) e assintoticamente estavel;
b) Prove que V (x
1
, x
2
) :=
5
3
x
2
1
+2x
1
x
2
+x
2
2
e uma fun c ao de Lyapunov
estrita;
c) Considere a solu c ao correspondente `a condi c ao inicial x
1
(0) = 0,
x
2
(0) = 2. Estime o tempo t
s
> 0 em que a solu c ao (x
1
, x
2
) alcan ca a
regi ao x
2
1
+x
2
2
0.02.
(Dica: Encontre a > 0 com
V (x) aV (x).)
4.12. Prove que o polin omio p(t) = t
3
+ 6r
2
+ 12r + 9 possui somente
raizes com parte real negativa.
4.13. Seja A R
n,n
e R. Prove a equivalencia das arma c oes
abaixo:
a) max Re() [ e autovalor de A < ;
b) Para cada matriz positiva denida W R
n,n
, a equa c ao matricial
A
W +XA+ 2X = W
possui uma unica solu c ao positiva denida X.
steuer
2008/3/11
page 101
i
i
i
i
i
i
i
i
Captulo 5
Estabilizacao
Neste captulo utilizamos o conceito de estabilidade introduzido no
Captulo 4 e analisamos a seguinte quest ao: Como e quando e possvel
tornar estavel um sistema de controle. Tal tarefa, denominada de estabi-
liza c ao, tem se mostrado nos ultimos anos como uma das aplica c oes mais
importantes da teoria de controle em problemas de engenharia e tecnolo-
gia. A forma classica de realiza-la e obter a entrada (ou controle) a partir
do estado ou da sada do sistema. Falamos ent ao de realimenta c ao de
estado ou de sada. A quest ao da estabiliza c ao permite abordagens tanto
qualitativas quanto quantitativas, ambas aqui discutidas.
Na Sec c ao 5.1, denimos os sistemas lineares estabilizaveis e dis-
cutimos um resultado sobre estabiliza c ao de sistemas aut onomos con-
trolaveis. A seguir e analisada uma condi c ao necessaria e suciente para
estabiliza c ao de sistemas aut onomos. Na Sec c ao 5.2, consideramos o pro-
blema quantitativo relacionado `a estabiliza c ao. O metodo de coloca c ao
de polos nos fornece uma estratetiga de estabiliza c ao, na qual e possvel
escolher o grau de estabilidade do sistema estabilizado. Na Sec c ao 5.3 e
apresentada a estrategia de Luenberger (observador din amico), atraves
da qual o estado de um sistema paralelo e utilizado para estabilizar o
sistema dado. Na Sec c ao 5.4 e discutido um metodo de estabiliza c ao
que combina o observador din amico com a realimenta c ao de sada. Na
Sec c ao 5.5 consideramos o problema de estabilizar o ponto de opera c ao
(desconhecido) de um sistema linear.
steuer
2008/3/11
page 102
i
i
i
i
i
i
i
i
102 [CAP. 5: ESTABILIZAC
AO
5.1 Sistemas Lineares
Em aplica c oes s ao utilizadas essencialmente estrategias de realimen-
ta c ao de sada e de realimenta c ao de estado, com o objetivo de alterar
a din amica do sistema livre (sem controle) obtendo determinadas pro-
priedades, que podem ser:
BIBOestabilidade; (qualitativo)
Estabilidade assintotica; (qualitativo)
Acelera c ao do retorno ao ponto de equilbrio. (quantitativo)
No caso dos sistemas de controle lineares aut onomos, as propriedades
acima est ao intrinsecamente relacionadas com os autovalores da matriz
do sistema. Dadas A R
n,n
e B R
n,m
, considere o sistema de controle
(5.1) z
t
= Az + Bu.
Supondo que o controle u e obtido a partir do estado z por uma lei
linear, escrevemos
u = F z,
onde F R
m,n
. Substituindo em (5.1), obtemos
(5.2) z
t
= (A+BF) z.
A m de tornar o ponto de equilbrio z = 0 assintoticamente estavel,
devemos escolher F de modo que A+BF seja uma matriz estavel (veja
Deni c ao 59).
Deni cao 88. O sistema de controle (A, B) e denominado estabiliz avel
quando existe F R
m,n
tal que a matriz A+BF R
n,n
e estavel. 2
O sistema (5.1), quando escrito com o controle de malha fechada,
toma a forma (A+BF, B). Como foi visto no Lema 32, a controlabilidade
de (A, B) implica na controlabilidade de (A + BF, B). Este argumento
nos leva ao seguinte teorema:
Teorema 89. Seja (A, B) e um sistema aut onomo control avel. Ent ao
(A, B) e estabiliz avel pela matriz de realimenta c ao
F := B
W
1
T
,
steuer
2008/3/11
page 103
i
i
i
i
i
i
i
i
[SEC. 5.1: SISTEMAS LINEARES 103
onde
W
T
:=
_
T
0
e
tA
BB
e
tA
dt, T > 0.
Demonstra c ao: A ideia e uilizar o Teorema 80 com
(A, , C) = ((A+BF)
, , B
) e X = W
T
.
Para garantir a estabilidade de (A + BF) ou equivalentemente de
(A+BF)
, , B
) e observavel;
(3) W := (A+BF)W
T
W
T
(A+BF)
e tal que
W BB
e positiva semi-denida.
(1) Por constru c ao, W
T
e positiva semi-denida. O Teorema 26 garante
que W
T
e n ao singular para T > 0. Logo, W
T
e positiva denida.
(2) Como (A, B) e controlavel, (A, B) tambem o e. O Teorema 32
garante agora a controlabilidade de ((A + BF), B). Por m, do Teo-
rema 24 segue a observabilidade de ((A+BF)
, , B
).
(3) Observe que
(A+BF)W
T
+W
T
(A+BF)
= AW
T
BB
+W
T
A
BB
=
_
T
0
d
dt
(e
tA
BB
e
tA
) dt 2BB
= e
TA
BB
e
TA
+BB
2BB
= e
TA
BB
e
TA
BB
.
Chegamos assim `a identidade
W = e
TA
BB
e
TA
+BB
,
a qual nos permite concluir que W BB
e positiva semi-denida.
Observa cao 90. O Teorema 89 garante que sistemas aut onomos con-
trolaveis s ao estabilizaveis por realimenta c ao de estado. A recproca
entretanto n ao e verdadeira, conforme podemos vericar no seguinte
exemplo trivial:
_
A matriz estavel, B = 0
z
t
= Az + Bu
2
steuer
2008/3/11
page 104
i
i
i
i
i
i
i
i
104 [CAP. 5: ESTABILIZAC
AO
A m de esclarecer a quest ao levantada na Observa c ao 90, investi-
gamos condi c oes sucientes para garantir a controlabilidade de sistemas
estabilizaveis. Este e o objetivo do teorema
Teorema 91. Seja (A, B) um sistema aut onomo de controle. Ent ao
(A, B) e control avel se e somente se (A, B) e (A, B) s ao ambos es-
tabiliz aveis.
Demonstra c ao: Seja (A, B) controlavel. Ent ao (A, B) e controlavel
e a estabilidade de (A, B) e (A, B) segue do Teorema 89. Recipro-
camente, sejam (A, B) e (A, B) estabilizaveis. O Teorema 33 nos
permite escrever os sistemas (A, B) na forma normal
_
x
1
t
x
2
t
_
=
_
A
11
A
12
0 A
22
_
_
B
1
0
_
u,
onde (A
11
, B
1
) e controlavel. O sistema
__
A
11
A
12
0 A
22
_
,
_
B
1
0
__
e estabilizavel quando existe uma matriz F = (F
1
, F
2
) tal que
_
A
11
+B
1
F
1
A
12
+B
1
F
2
0 A
22
_
e uma matriz estavel. Conclumos da que os blocos A
22
possuem
somente autovalores com parte real estritamente menor que zero. Como
essa condi c ao n ao pode ser satisfeita simulteneamente para A
22
e A
22
,
temos que o bloco A
22
n ao pode existir na forma normal. O Teorema 33
nos garante ent ao que
A = P
1
A
11
P, B = P
1
B
1
,
onde P e n ao singular. A controlabilidade de (A, B) segue agora da
controlabilidade de (A
11
, B
1
).
Exemplo 92. Considere novamente o problema do equilbrio de um
bast ao visto na Sec c ao 1.2.5. A equa c ao diferencial e
g = u(t),
steuer
2008/3/11
page 105
i
i
i
i
i
i
i
i
[SEC. 5.2: COLOCAC
AO DE P
OLOS 105
que se escreve na forma do sistema
z
t
= Az +Bu com A =
_
0 1
g 0
_
, B =
_
0
1
_
.
O sistema (A, B) e controlavel devido `a condi c ao de posto. Logo, o
Teorema 91 garante sua estabilidade. O Teorema 89 nos permite ainda
calcular a matriz de ganho F, isto porem exige algumas contas longas.
2
O problema da estabiliza c ao de sistemas n ao lineares e discutido em
[Is]. Em particular os sistemas Single-Input Single-Output (SISO) n ao
lineares s ao tratados no Captulo 4, onde e possvel identicar seme-
lhan cas com a abordagem aqui apresentada para sistemas lineares. Uma
tecnica baseada na utiliza c ao de series de Fourier (equilbrio harm onico)
pode ser encontrada em [Fo1, Captulo 2].
5.2 Colocacao de P olos
Uma vez esclarecida a quest ao de que todo sistema controlavel pode
ser estabilizado por uma estrategia de controle de realimenta c ao do tipo
u = Fz, concentramo-nos no problema de escolher a posi c ao no plano
complexo dos autovalores da matriz do sistema
z
t
= (A+BF)z.
Esta tarefa e equivalente `a de escolher os polos de uma fun c ao racional
coloca c ao de polos. Tratamos nesta sec c ao apenas de sistemas com
controle escalar (m = 1), isto e, da forma
z
t
= Az +bu com A R
n,n
, b R
n
.
Investigamos a princpio um resultado do tipo formanormal.
Lema 93. Seja A R
n,n
e b R
n
. S ao equivalentes as arma c oes:
a) (A, b) e control avel;
steuer
2008/3/11
page 106
i
i
i
i
i
i
i
i
106 [CAP. 5: ESTABILIZAC
AO
b) Existe P R
n,n
inversvel tal que o sistema (A, b) nas coorde-
nadas x = Pz tenha a forma x
t
=
Ax +
bu com
A =
_
_
_
_
_
_
_
_
_
0 1 0 0 0
0 0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 1 0
0 0 0 0 1
a
0
a
1
a
2
a
n2
a
n1
_
_
_
_
_
_
_
_
_
,
b =
_
_
_
_
_
_
_
_
_
0
0
.
.
.
0
0
1
_
_
_
_
_
_
_
_
_
.
Os n umeros a
0
, . . . , a
n1
s ao os coecientes do polin omio caracterstico
p de A: p(r) = r
n
+
n1
i=0
a
i
r
i
.
Demonstra c ao: a) = b) Basta encontrar uma base w
1
, . . . , w
n
para
R
n
, de modo que a matriz P R
n,n
denida pelas equa c oes
Pw
k
= e
k
, 1 k n,
satisfa ca
(i) Pb = e
n
,
(ii) PAP
1
e
1
= a
0
e
n
,
(iii) PAP
1
e
k+1
= e
k
a
k
e
n
, 1 k < n.
Denimos w
k
recursivamente por
w
n
= b, w
k
= Aw
k+1
+a
k
b, 1 k < n.
Temos ent ao
(5.3) w
k
= A
nk
b +
nk
j=1
a
nj
A
nkj
b, 1 k n.
Como b, Ab, . . ., A
n1
b s ao linearmente independentes (devido `a contro-
labilidade de (A, b)), temos de (5.3) que w
1
, . . . , w
n
tambem o s ao. Do
teorema de CaleyHamilton, temos que p(A) = 0. Logo,
Pb = Pw
n
= e
n
(provando (i)) ;
Aw
1
= A
n
b +
n1
j=1
a
nj
A
nj
b a
0
b = p(A)b a
0
b = a
0
b
= a
0
w
n
(provando (ii)) ;
Aw
k+1
= w
k
a
k
e
n
, 1 k n (provando (iii)).
steuer
2008/3/11
page 107
i
i
i
i
i
i
i
i
[SEC. 5.2: COLOCAC
AO DE P
OLOS 107
b) = a) Seja agora o sistema (
A,
r+1
, . . .,
s
,
s
CR n umeros complexos dados, com r +2(sr) = n.
Ent ao existe f R
n
tal que o polin omio caracterstico de A+bf possui
como razes
1
, . . .,
r
,
r+1
,
r+1
, . . .,
s
,
s
.
Demonstra c ao: Seja f um vetor com componentes f
0
, . . . , f
n1
. O
Lema 93 nos permite escrever o sistema A+bf (a menos de uma mudan ca
de variaveis) na forma
A+bf =
_
_
_
_
_
_
_
_
_
0 1 0 0 0
0 0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 1 0
0 0 0 0 1
f
0
a
0
f
1
a
1
f
2
a
2
f
n2
a
n2
f
n1
a
n1
_
_
_
_
_
_
_
_
_
,
onde a
0
, . . . , a
n1
, 1 s ao os coecientes do polin omio caracterstico de
A. Logo, o polin omio caracterstico p de A+bf satisfaz
p(r) = r
n
+
n1
i=0
(f
i
a
i
)r
i
.
Como os coecientes f
i
a
i
, i = 0, . . . , n 1 s ao determinados pelas
razes do polin omio, podemos determinar f
0
, . . . , f
n1
(observe que e
preciso resolver um sistema n ao linear com n variaveis e n equa c oes).
Exemplo 95. Considere novamente o sistema linear (veja Sec c ao 1.2.5
e Exemplo 92)
A =
_
0 1
g 0
_
, b =
_
0
1
_
.
A estabiliza c ao com f =
_
f
0
f
1
_
R
2
nos leva `a matriz
A+bf =
_
0 1
g f
0
f
1
_
,
cujo polin omio caracterstico e:
2
+ f
1
+ (f
0
g). Se escolhemos os
autovalores
= 1, obtemos os coecientes f
0
= g + 1, f
1
= 2. 2
steuer
2008/3/11
page 108
i
i
i
i
i
i
i
i
108 [CAP. 5: ESTABILIZAC
AO
Observa cao 96.
E possvel obter um resultado semelhante ao apresen-
tado no Teorema 94 para sistemas genericos (A, B) com m 1. Neste
caso, a demonstra c ao baseia-se na forma normal obtida no Teorema 33.
Discutimos aqui o caso geral na forma de algoritmo.
Seja o sistema de controle
z
t
= Az +Bu, com A R
n,n
, B R
n,m
.
Procuramos uma matriz F R
m,n
tal que os autovalores de A + BF
sejam os n umeros
1
, . . . ,
n
C dados (note que os autovalores com-
plexos aparecem com seus conjulgados).
Os autovetores de A+BF devem ser encontrados satisfazendo:
(A+BF) v
i
=
i
v
i
, 1 i n.
Denindo q
i
:= Fv
i
, 1 i n, obtemos
(A
i
I)v
i
+Bq
i
= 0, 1 i n.
Portanto,
_
v
i
q
i
_
Ke(A
i
I[B), 1 i n, F = (q
1
[ [q
n
)(v
1
[ [v
n
)
1
,
caso det(v
1
[ [v
n
) ,= 0. Essa ultima condi c ao e satisfeita quando
A + BF e diagonalisavel, o que por sua vez pode ser garantido pela
escolha dos autovalores
1
, . . . ,
n
C. 2
Exemplo 97. Considere o sistema de controle com matrizes
A =
_
_
0 1 0
0 0 1
4 4 1
_
_
, B =
_
_
1 0
0 0
0 1
_
_
.
Os autovalores do sistema livre (u = 0) s ao 1, 2, 2. Escolhemos para
novos autovalores os valores:
1
= 2,
2
= 3,
3
= 4. Calculamos
a seguir o n ucleo de (A
i
I [ B) i = 1, 2, 3, onde
(A
i
I [ B) =
_
_
i
1 0 1 0
0
i
1 0 0
4 4
i
1 0 1
_
_
.
steuer
2008/3/11
page 109
i
i
i
i
i
i
i
i
[SEC. 5.3: OBSERVADOR DIN
AMICO 109
Um simples calculo nos permite obter Ke(A
i
I [ B), sendo estes para
i = 1, 2, 3 respectivamente
span(1, 2, 4, 0, 0)
, (1, 0, 0, 2, 4)
,
span(3, 2, 6, 5, 0)
, (2, 3, 9, 0, 26)
,
span(2, 1, 4, 9, 0)
.
Podemos escolher ent ao:
v
1
=
_
_
0
1
2
_
_
, q
1
=
_
1
2
_
, v
2
=
_
_
1
0
0
_
_
, q
2
=
_
3
52
5
_
,
v
3
=
_
_
0
1
4
_
_
, q
3
=
_
1
8
_
.
Obtemos assim a matriz de ganho
F =
_
3 1 0
52
5
12 5
_
,
e a matriz do sistema de malha fechada e
A+BF =
_
_
3 0 0
0 0 1
72
5
8 6
_
_
.
2
Uma interessante aplica c ao da coloca c ao de polos para um modelo
de um reator qumico e discutida em [KnKw] (ver exemplo 5.5). Neste
problema a variavel de estado (z R
5
) corresponde `a temperatura em
diferentes partes do reator, enquanto que o controle (u R
3
) correspon-
de `a abertura de tres valvulas de refrigera c ao disponveis.
5.3 Observador Dinamico
Dadas A R
n,n
, B R
n,m
, C R
l,n
considere o sistema de con-
trole (A, B, C). Na Sec c ao 5.1, vimos que para estabilizar um sistema
utilizando uma estrategia de realimenta c ao de estado da forma u = Fz
temos que encontrar F de modo a tornar a matriz (A+BF) estavel.
steuer
2008/3/11
page 110
i
i
i
i
i
i
i
i
110 [CAP. 5: ESTABILIZAC
AO
Fazemos agora o desenvolvimento equivalente para o problema de re-
alimenta c ao de sada, quando procuramos controladores da forma
u = Fy. Note que
u = Fy = FCz, F R
m,l
.
O objetivo e ent ao encontrar F de modo que o ponto de equilbrio
z = 0 do sistema z
t
= (A + BFC)z seja assintoticamente estavel. Tal
abordagem encontra serios obstaculos `a sua realiza c ao, pois mesmo as
hipoteses
(A, B) controlavel, (A, , C) observavel
n ao s ao sucientes para garantir a estabilidade da matriz (A + BFC).
Tal fato pode ser comprovado no simples exemplo a seguir.
Exemplo 98. Considere o problema de controle descrito por
x +x = u, y = x.
Na forma de sistema temos
_
z
t
=
_
0 1
1 0
_
z +
_
0
1
_
u
y = (1 0)
_
z
1
z
2
_
=
_
f 1.
Obviamente e impossvel encontrar f R que satisfa ca Re(
+
) < 0
e Re(
AMICO 111
Na Sec c ao 5.4 e analisada uma alternativa para a estabiliza c ao por
realimenta c ao de sada, que consiste de duas etapas: inicialmente o es-
tado e recontrudo a partir da sada; em um segundo passo utiliza-se a
aproxima c ao do estado na realimenta c ao.
A m de reconstruir dinamicamente o estado z a partir da observa c ao
y, utilizamos a seguinte ideia:
O sistema (A, B, C) e simulado por outro com a mesma
estrutura;
Seja x o estado desse sistema paralelo e w = Cx sua sada;
O controle do sistema paralelo e constitudo pelo controle
do sistema usual adicionado de uma componente da forma
L(w y), com L R
n,l
;
Obtemos assim o sistema
x
t
= Ax +Bu +L(Cx y), w = Cx,
que e denominado observador din amico;
1
A diferen ca entre os estados do observador e do sistema
original e denida por := z x e satisfaz
t
= A L(Cx Cz) = (A+LC) ;
L e escolhido tal que (A+LC) seja estavel, garantindo assim
lim
t
(t) = 0.
A analise da estabilidade de (A + LC) nos leva ao conceito de de-
tectabilidade discutido no Captulo 2 (veja Deni c ao 14). O teorema a
seguir estabelece a equivalencia entre a detectabilidade de um sistema
(A, , C) e a estabilidade da matriz do observador din amico (A+LC).
Teorema 99. Dadas A R
n,n
e C R
l,n
, s ao equivalentes as arma-
c oes:
a) (A, , C) e detect avel;
1
A escolha da letra L para o observador se deve a D.G. Luenberger, que introduziu
esta ideia.
steuer
2008/3/11
page 112
i
i
i
i
i
i
i
i
112 [CAP. 5: ESTABILIZAC
AO
b) Se v C
n
e autovetor de A e seu autovalor satisfaz Re() 0,
ent ao Cv ,= 0;
c) (A
, C
) e estabiliz avel;
d) Existe L R
n,l
tal que a matriz (A+LC) e est avel.
Demonstra c ao: a) = b) Sejam v e como em b). Considere as
solu c oes especiais do problema de valor inicial z
t
= Az, z(0) = v dadas
por
z
r
(t) := Re(e
t
v), z
i
(t) := Im(e
t
v), t R.
Note que, se Cv = 0, ent ao v pertence ao subespa co n ao observavel de
(A, , C). Neste caso, lim
t
z
r
(t) ,= 0, contradizendo a detectabilidade de
(A, , C).
b) = c) O Teorema 33 nos permite escrever o sistema (A
, C
) na
forma normal
A =
_
A
I
0 A
II
_
,
C =
_
C
I
0
_
,
com (A
I
, C
I
) controlavel. Analisamos separadamente as duas possveis
situa c oes:
Se o bloco A
II
n ao existir, temos (A
, C
) = (P
1
A
I
P, P
1
C
I
). Logo,
(A
, C
II
e w um autovetor correspondente, temos para v =
_
0
w
_
que
v = v,
Cv = 0.
Da hipotese em b) segue que Re() < 0, provando assim que A
II
(e
conseq uentemente A
II
) e uma matriz estavel. Da controlabilidade de
(A
I
, C
I
) segue sua estabilizabilidade, i.e. existe F
I
tal que (A
I
+C
I
F
I
)
e estavel. Temos ent ao que a matriz
A +
C (F
I
[ 0) =
_
A
I
+C
I
F
I
0 A
II
_
e estavel. Como
F = (F
I
[0) estabiliza (
A,
C) e (P
1
AP, P
1
C) =
(A
, C
), ent ao F =
FP estabiliza (A
, C
).
c) = d) Por hipotese, existe uma matriz D tal que a matriz A
+
(C
.
steuer
2008/3/11
page 113
i
i
i
i
i
i
i
i
[SEC. 5.3: OBSERVADOR DIN
AMICO 113
d) = a) Dado z
0
n1
k=0
Ke(CA
k
) dena z(t) := e
tA
z
0
, t R. Do
teorema de CaleyHamilton segue Cz(t) = 0, para t 0. Logo, z
tambem e solu c ao de
z
t
= (A+LC) z.
Como os autovalores da matriz (A + LC) possuem parte real negativa,
temos que lim
t
z(t) = 0.
Exemplo 100. Vamos aplicar a ideia do observador din amico ao sistema
(A, B, C) com matrizes
A =
_
1 3
0 2
_
, B =
_
1
1
_
, C =
_
1 0
_
.
A =
_
17 3
56/3 2
_
, B =
_
1
1
_
, L =
_
16 56/3
_
.
O observador din amico nos permite reconstruir a componente z
2
do
estado note que a componente z
1
ja e observada. Suponha que temos
a seguinte situa c ao:
u(t) 1, z(0) =
_
0
_
, x(0) =
_
0
0
_
,
com R. O erro de reconstru c ao := z x satisfaz
_
_
_
t
= (A+LC)
(0) =
_
0
_
steuer
2008/3/11
page 114
i
i
i
i
i
i
i
i
114 [CAP. 5: ESTABILIZAC
AO
Os autovalores de A + LC s ao
1
= 9,
2
= 10 e os respectivos
autovetores s ao v
1
=
_
1
8/3
_
e v
2
=
_
1
7/3
_
. Temos ent ao
(t) =
_
1
(t)
2
(t)
_
=
_
3e
9t
3e
10t
8e
9t
7e
10t
_
.
Nos interessa saber o qu ao rapido
2
converge a zero. Para t = 0.5, temos
e
2
(t) = 0.041 (aproximadamente 4% do erro inicial) e para t = 0.9,
temos e
2
(t) = 0.015 (i.e. 0.1% do erro inicial). 2
A =
_
A BF
LC A+BF +LC
_
.
Se a matriz
A for estavel, conseguimos atingir o nosso objetivo inicial de
estabilizar (A, B, C) atraves do sistema acoplado (5.6) constitudo de
steuer
2008/3/11
page 115
i
i
i
i
i
i
i
i
[SEC. 5.4: ESTABILIZAC
AO POR REALIMENTAC
AO DE SA
IDA 115
processo mais observador. Note que esta abordagem nos permite, alem
de estabilizar o processo, reconstruir seu estado.
Dena agora w := z x. O sistema (5.6) se escreve nas novas
variaveis (z, w) como
(5.7)
_
z
t
= (A+BF)z +BFw
w
t
= (A+LC)w
Conclumos assim que a matriz
A e semelhante `a matriz
A =
_
A+BF BF
0 A+LC
_
.
A tarefa de estabilizar
A e portanto equivalente `a de estabilizar
A. Note,
porem, que a estrutura de
A nos permite escrever
p
A
= p
(A+BF)
p
(A+LC)
,
onde p
M
representa o polin omio caracterstico da matriz M. Sendo
assim, nossa tarefa se reduz a:
Determinar F tal que a matriz A+BF e estavel;
Determinar L tal que a matriz A+LC e estavel.
Conhecemos, entretanto, da Deni c ao 88 e do Teorema 99 condi c oes
necessarias e sucientes para que os objetivos acima possam ser al-
can cados. S ao essas respectivamente:
(A, B) estabilizavel,
(A, , C) detectavel.
Exemplo 101. Considere o sistema (A, B, C) do Exemplo 100 com
matrizes:
A =
_
1 3
0 2
_
, B =
_
1
1
_
, C =
_
1 0
_
.
Vimos naquele exemplo que a matriz
L =
_
16
56/3
_
steuer
2008/3/11
page 116
i
i
i
i
i
i
i
i
116 [CAP. 5: ESTABILIZAC
AO
e tal que A + LC possui autovalores 9 e 10. Se F =
_
f
1
f
2
_
, os
autovalores de A+BF s ao dados pelas razes do polin omio caracterstico
det(I (A+BF)) =
2
+ (3 f
1
f
2
) + (2 5f
1
f
2
).
Escolhendo para A + BF os autovalores
1
= 5,
2
= 6, obtemos
para F os coecientes: f
1
= 5, f
2
= 3. Portanto, a matriz do sistema
(5.7) assume a forma
A =
_
_
_
_
6 0 5 3
5 5 5 3
0 0 17 3
0 0 56/3 2
_
_
_
_
.
2
A estabiliza c ao por realimenta c ao de sada para sistemas SISO n ao
lineares especiais e considerada em [KIF].
5.5 Pontos de Operacao
Nesta sec c ao consideramos os problemas de determina c ao e estabi-
liza c ao de pontos de opera c ao. Considere um sistema de controle (A, B),
no qual a variavel de controle u se decomp oe em uma entrada xa u
(desconhecida) e um sinal de controle v. O sistema se escreve ent ao
como
(5.8) z
t
= Az +B( u +v).
O ponto de opera c ao z
o
do sistema (5.8) corresponde ao ponto de equi-
lbrio do sistema livre (i.e. v 0). Temos assim
z
o
= A
1
B u.
O problema abordado nesta sec c ao e o de encontrar uma estrategia de
controle v que torne o ponto de opera c ao assintoticamente estavel e que,
se possvel, nos permita identica-lo.
Note que se u e conhecido, recamos no problema de estabiliza c ao do
sistema (A, B). De fato, uma vez calculado z
o
, basta fazer a mudan ca de
variavel x = zz
o
para que o estado x satisfa ca a din amica x
t
= Ax+Bv.
steuer
2008/3/11
page 117
i
i
i
i
i
i
i
i
[SEC. 5.5: PONTOS DE OPERAC
AO 117
Utilizando uma abordagem semelhante `a do observador din amico, e
possvel n ao somente estabilizar o ponto de opera c ao, como tambem de-
termina-lo. Vamos aproximar o estado z por x satisfazendo a din amica:
x
t
= L(z x),
onde L R
n,n
e n ao singular. Escolhemos agora para (5.8) um controle
da forma
v = F(z x).
Fazendo a mudan ca de variaveis z = z z
o
, x = x z
o
, obtemos
x
t
= L(z x) = L( z x)
e ainda
z
t
= z
t
= Az +B u +BF(z x) = A z +BF z BF x.
Temos ent ao, para o par ( z x), o sistema
(5.9)
_
z
t
x
t
_
=
_
A+BF BF
L L
_ _
z
x
_
.
Portanto, basta encontrar matrizes F e L, tais que a matriz do sistema
(5.9) seja estavel. Note que, se Ae estavel, uma escolha possvel e F = 0,
L = I.
Exemplo 102. Considere o sistema de controle (A, B) com matrizes:
A =
_
1 3
0 2
_
, B =
_
1
1
_
.
Supomos F e L da forma:
F =
_
f
1
f
2
_
, L =
_
l
1
l
2
l
2
l
1
_
.
A m de torna a matriz A + BF estavel, escolhemos f
1
= f
2
= 3,
obtendo assim:
A+BF =
_
2 0
3 5
_
.
steuer
2008/3/11
page 118
i
i
i
i
i
i
i
i
118 [CAP. 5: ESTABILIZAC
AO
Temos ent ao
_
A+BF BF
L L
_
=
_
_
_
_
2 0 3 3
3 5 3 3
l
1
l
2
l
1
l
2
l
2
l
1
l
2
l
1
_
_
_
_
,
cujo polin omio caracterstico e:
p() =
4
+ (7 + 2l
1
)
3
+ (10 + 8l
1
+l
2
1
l
2
2
6l
2
)
2
+ (8l
1
+l
2
1
l
2
2
12l
2
) + 2(l
2
2
l
2
1
).
A observ ancia do criterio de Hurwitz (veja Teorema 64) nos leva a es-
colher os coecientes l
1
= 1, l
2
= 3. As razes obtidas s ao
1
=
2
= 2,
3
= 1,
4
= 4.
Logo, F =
_
3 3
_
e L =
_
1 3
3 1
_
estabilizam o ponto de opera c ao.
Para ns de calculo, suponha u = 2. O ponto de opera c ao cor-
respondente e z
o
= A
1
B u =
_
5
1
_
. Suponha as condi c oes iniciais:
z(0) =
_
5
0
_
e x(0) = 0. Temos ent ao
_
z(0)
x(0)
_
=
_
_
_
_
0
1
5
1
_
_
_
_
e a solu c ao do sistema ( z
t
x
t
) e:
_
z(t)
x(t)
_
=
_
_
_
_
66e
t
+ 66e
2t
+ 48te
2t
33e
t
34e
2t
48te
2t
77e
t
+ 96te
2t
+ 12e
4t
+ 60e
2t
55e
t
44e
2t
96te
2t
12e
4t
_
_
_
_
.
2
Observa cao 103 (Estabiliza cao de sistemas nao lineares). Encer-
ramos este captulo mencionando um importante resultado relacionado
a estabiliza c ao de sistemas n ao lineares. Para din amicas aut onomas de
classe C
1
e possvel obter uma condi c ao necessaria para estabilidade lo-
cal do sistema. O criterio de Brockett garante que, para que um sistema
seja localmente estabilizavel em um determinado estado e necessario que
a imagem da fun c ao descrevendo a din amica contenha uma vizinhanca
desse estado [So, Captulo 5]. 2
steuer
2008/3/11
page 119
i
i
i
i
i
i
i
i
EXERC
ICIOS 119
Exerccios
5.1. Considere o sistema SISO (A, b) com
A =
_
_
1 6 1
1 1 1
2 2 0
_
_
, b =
_
_
1
1
1
_
_
.
Encontre a forma normal (
A,
b) do sistema (
b = (0, 0, 1)).
5.2. Considere o sistema SISO (A, b) com
A =
_
_
0 1 0
0 0 1
2 3 0
_
_
, b =
_
_
0
0
1
_
_
.
Encontre uma estrategia de realimenta c ao de estado u = fx, com f =
(f
1
, f
2
, f
3
), tal que o sistema de malha fechada A+bf possua autovalores
1 +i, 1 i, 4.
5.3. Considere o sistema (A, B) com
A =
_
_
1 1 0
1 0 1
0 0 1
_
_
, B =
_
_
0 1
1 0
0 1
_
_
.
a) Mostre que (A, B) e controlavel;
b) Encontre uma estrategia de realimenta c ao de estado u = Fx, tal que
o sistema de malha fechada A+BF possua autovalores 4, 5, 6.
5.4. Construa um observador din amico para o sistema
A =
_
_
1 0 0
2 2 2
1 0 3
_
_
, C =
_
1 1 1
_
,
tal que A+LC possua autovalores 8, 9, 10.
5.5. Encontre uma estrategia de realimenta c ao F e um observador L
para o sistema (A, B, C) com
A =
_
_
1 0 0
2 2 2
1 0 3
_
_
, B =
_
_
1
0
1
_
_
, C =
_
1 1 1
_
,
tal que A+BF possua autovalores 4, 5, 6 e A+LC possua auto-
valores 8, 9, 10.
steuer
2008/3/11
page 120
i
i
i
i
i
i
i
i
Captulo 6
Identicacao de Parametros
Consideramos neste captulo o problema de identicar par ametros
desconhecidos na din amica de sistemas de controle. Tais problemas
de reconstru c ao podem ser encontrados em varias aplica c oes da teo-
ria de controle `a engenharia e `a tecnologia, uma vez que os par ametros
a ser determinados quase sempre descrevem propriedades importantes
do modelo em estudo (coecientes de rigidez, difus ao, permeabilidade,
elasticidade, etc . . . ).
Ainda que os par ametros de um sistema sejam conhecidos no tempo
inicial, estes podem vir a variar (lentamente) com o tempo devido a in-
uencias externas ou a propria natureza do problema. Este e outro fator
que motiva a tarefa de identica c ao. Discutimos algumas estrategias de
identica c ao para problemas lineares n ao aut onomos e n ao homogeneos.
Alguns exemplos simples s ao utilizados para ilustrar a complexidade da
tarefa a ser realizada.
Na Sec c ao 6.1 e apresentada, no contexto dos sistemas lineares, a
aplica c ao denominada controle automatico. Na Sec c ao 6.2 e discutida
a tarefa principal dentro do controle automatico, que e a de identicar
par ametros do sistema. Na Sec c ao 6.3 s ao analisados alguns metodos
iterativos para executar a tarefa de identica c ao.
6.1 Controle Automatico
Considere o sistema de controle aut onomo (A, B, C):
(6.1) z
t
= Az +Bu, y = Cz,
steuer
2008/3/11
page 121
i
i
i
i
i
i
i
i
[SEC. 6.2: IDENTIFICABILIDADE 121
onde A R
n,n
, B R
n,m
, C R
l,n
. O conceito de controle autom atico
se refere ao fato de que a a c ao de controle u deve ser obtida a partir
da sada y e deve conduzir a trajetoria z ao ponto de equilbrio z = 0.
Eventualmente, tal objetivo deve ser atingido com conhecimento apenas
parcial das matrizes A, B, C, assim como da condi c ao inicial z
0
.
A estrategia a ser seguida e a seguinte: Deve-se projetar um sistema
auxiliar linear, denominado sistema de referencia, que permita, a partir
da entrada u e da sada y do sistema real, acompanhar a evolu c ao do
estado do sistema real. O sistema de referencia nos fornece uma sada,
que deve ser comparada com a sada do sistema real atraves de um
criterio de erro. Desta compara c ao e gerada uma entrada para o sistema
real e o sistema de referencia e ajustado. O sistema real e o modelo s ao
denominados sistema modelo de referencia adaptativa (MRAS; model
reference adaptive system).
Assim sendo, a m de implementar o controle automatico, e neces-
sario, simultaneamente (on line) a evolu c ao do sistema real, realizar as
seguintes tarefas:
Reconstru c ao do estado a partir de observa c oes incompletas, even-
tualmente com conhecimento apenas parcial do sistema real;
Identica c ao de par ametros do sistema (coecientes de A, B e/ou
C) a partir de dados incompletos;
Escolha da estrategia de controle (entrada) do sistema real.
Neste captulo, analisamos exclusivamente a tarefa de reconstruir
(identicar) par ametros de opera c ao do sistema a partir de dados do
sistema real. O problema de acoplar esta reconstru c ao com a estabi-
liza c ao do sistema real, utilizando controle de realimenta c ao, n ao e aqui
discutida.
6.2 Identicabilidade
Inicialmente analisamos o problema de, a partir da sada de um sis-
tema, obter informa c oes sobre os par ametros do mesmo. Apesar de
considerarmos apenas sistemas de controle lineares, o problema de iden-
tica c ao e, em geral, n ao linear. Considere um sistema da forma
(6.2) z
t
= A(p)z +B(p)u, y = C(p)z ;
steuer
2008/3/11
page 122
i
i
i
i
i
i
i
i
122 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
onde p e um par ametro desconhecido, sobre o qual temos a informa c ao:
p Q R
k
. Supomos ainda que, dado q Q, as matrizes A(q) R
n,n
,
B(q) R
n,m
, C(q) R
l,n
est ao bem denidas.
Nosso objetivo e, a partir de experimentos com condi c oes iniciais
z
0
:= z(0) e controles pre-escolhidos u, identicar qual par ametro p Q
corresponde `a sada y obtida.
Seja Z
0
R
n
o conjunto das condi c oes iniciais admissveis (exemplo
Z
0
= B
R
(0), com R grande) e o conjunto das possveis a c oes de
controle. Logo, o conjunto dos controles admissveis e
U := u L
1
([0, T]; R
m
) [ u(t) q.s. em (0, T).
Supomos ainda que e aberto. Note que, para cada (z
0
, u, p) Z
0
U Q, a solu c ao z = z(; z
0
, u) de (6.2) esta bem denida. Logo, as
aplica c oes
L : Z
0
U Q (z
0
, u, p) z(, z
0
, u, p) C([0, T]; R
n
),
L : Z
0
U Q (z
0
, u, p) C(p)L(, z
0
, u, p) C([0, T]; R
l
)
tambem est ao bem denidas. A seguir e apresentado um conceito essen-
cial para essa discuss ao:
Deni cao 104. O par ametro q Q e denominado identic avel atraves
do experimento (z
0
, u) Z
0
U, quando
L(z
0
, u, p) ,= L(z
0
, u, q) para todo q Q, p ,= q.
O par ametro q Qe denominado identic avel, quando q for identicavel
por algum experimento (z
0
, u). 2
Exemplo 105. Considere o sistema
z
t
= pz +u, y = z,
com Z
0
:= 0, Q := R, = R. A sada y e dada por
y(t) =
_
t
0
e
p(ts)
u(s) ds, t 0.
Observe que o experimento (0, 0) n ao identica nenhum par ametro, en-
quanto que qualquer par ametro e identicado pelo experimento (0, u),
u(t) := t, t R. 2
steuer
2008/3/11
page 123
i
i
i
i
i
i
i
i
[SEC. 6.2: IDENTIFICABILIDADE 123
Exemplo 106. Considere o sistema
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
para Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Dados q Q e u 1, considere a equa c ao
L(z
0
, u, p) = L(z
0
, u, q),
para p Q. Por diferencia c ao (note que o campo vetorial resultante e
analtico), obtemos equa c oes da forma
L(z
0
, u, p)(0) =
L(z
0
, u, q)(0), = 0, 1, . . .
O caso = 1 n ao e interessante. Porem, para = 2, obtemos a equa c ao
(p
1
+p
2
) = (q
1
+q
2
).
Por hora abandonamos os calculos neste ponto. Adiante no texto, uma
solu c ao e obtida de forma mais simples (veja Exemplo 109). 2
Retomamos agora a ideia apresentada no exemplo anterior. Para
tanto, utilizamos as seguintes representa c oes (veja Apendice A):
y(t) = C(p)e
A(p)t
z
0
+
_
t
0
C(p)e
A(p)(ts)
B(p)u(s)ds, t 0,
i.e.,
(6.3)
L(z
0
, u, p)(t) = C(p)e
A(p)t
z
0
+
_
t
0
C(p)e
A(p)(ts)
B(p)u(s)ds, t 0.
Denindo as fun c oes Y
j
(p) := C(p)A(p)
j
B(p) , p Q, j = 0, 1, . . .,
podemos formular o seguinte lema:
Lema 107. Sejam os par ametros p, q Q. S ao equivalentes as arma-
tivas:
a) L(z
0
, u, p) = L(z
0
, u, q) para todo experimento (z
0
, u) Z
0
U;
steuer
2008/3/11
page 124
i
i
i
i
i
i
i
i
124 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
b) Y
j
(p) = Y
j
(q), j = 0, 1, . . .;
c) Y
j
(p) = Y
j
(q), j = 0, 1, . . . , 2n 1.
Demonstra c ao: b) = c) e b) = a): nada a fazer.
a) = b) Da representa c ao em (6.3), temos
_
t
0
_
C(p)e
A(p)(ts)
B(p) C(q)e
A(q)(ts)
B(q)
_
u(s)ds = 0, t 0,
para todo u U. Como e aberto por hipotese, temos
v(t) := C(p)e
A(p)t
B(p) = C(q)e
A(q)t
B(q) =: w(t), t [0, T].
O item b) segue agora de v
(j)
(0) = w
(j)
(0), j = 0, 1, . . .
c) = b) Seja r Q e p
A(r)
() =
n
n1
i=0
i
(r)
i
o polin omio carac-
terstico de A(p). Do teorema de CaleyHamilton, segue
A(r)
n
=
n1
i=0
i
(r)A(r)
i
.
De onde temos que
(6.4) Y
j
(r) =
n1
i=0
i
(r)Y
jn+i
(r), j n.
Sejam a
i
:=
i
(p)
i
(q), 0 i n1. Usando um argumento indutivo
em N, provamos agora que, para N 2n, as seguintes identidades s ao
validas:
i) Y
j
(p) = Y
j
(q), j = 0, 1, . . . , N 1.
ii) Y
j
(p) = Y
j
(q) =
n1
i=0
a
i
Y
jn+i
(p), j = n, . . . , N.
Para N = 2n, temos que i) e ii) s ao verdadeiras devido a (6.4). Note
steuer
2008/3/11
page 125
i
i
i
i
i
i
i
i
[SEC. 6.2: IDENTIFICABILIDADE 125
ainda que de (6.4) segue que
Y
N
(p) Y
N
(q) =
n1
i=0
a
i
Y
Nn+i
(p)
=
n1
i=0
a
i
n1
l=0
l
Y
Nn+in+l
(p)
=
n1
l=0
l
(p)
n1
i=0
a
i
Y
N+i2n+l
(p)
=
n1
l=0
l
(p)(Y
N+ln
(p) Y
N+ln
(q))
= 0
e
Y
N+1
(p) Y
N+1
(q) =
n1
i=0
(
i
(p)Y
N+1n+i
(p)
i
(q)Y
N+1n+i
(q))
=
n1
i=0
a
i
Y
N+1n+i
(p).
Deste modo, a argumenta c ao indutiva ca completa. O item b) segue
agora de ii).
Teorema 108. O par ametro q Q e identic avel se e somente se, para
todo p Q, existir j 0, . . . , 2n 1 com Y
j
(p) ,= Y
j
(q).
Demonstra c ao: Segue diretamente do Lema 107.
Exemplo 109. Consideramos novamente o sistema do Exemplo 106:
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
onde Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Temos ent ao
Y
0
(p) = 1, Y
1
(p) = (p
1
+p
2
), Y
2
(p) = (p
1
+p
2
)
2
+p
2
2
,
steuer
2008/3/11
page 126
i
i
i
i
i
i
i
i
126 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
Y
3
(p) = (p
1
+p
2
)(p
1
2
+ 2p
1
p
2
+ 3p
2
2
) p
2
2
p
3
.
Podemos ent ao concluir que todo par ametro q Q com p
3
> 0 e identi-
cavel. 2
Observa cao 110. A matriz
M(p) := (Y
0
(p) [ [ Y
2n1
) R
m,2nl
e denominada matriz de par ametros de Markov. Note que a aplica c ao
Q p M(p) R
m,2nl
e injetiva em uma vizinhan ca de p Q, caso a matriz jacobiana
M
p
(p)
possua posto maximo. 2
6.3 Identica cao Adaptativa: Introducao
Nesta sec c ao consideramos sistemas do tipo
(6.5) z
t
=
Az +f(t), t 0, y = z,
onde f C([0, ); R
n
). Supomos ainda que o sistema e observavel em
todo intervalo [0, T], T > 0 (veja Deni c ao 6). Nosso objetivo e discutir
a identicabilidade de
A.
Em compara c ao com a abordagem da sec c ao anterior, os par ametros
a serem identicados s ao os proprios coecientes da matriz
A. A es-
trategia de identica c ao e assim resumida:
Ajuste dinamicamente um par ametro A(t) R
n,n
na base
formada pelos vetores z(t), de modo a obter
lim
t
A(t) =
A.
A realiza c ao desta ideia pode ser levada a cado da seguinte forma:
Passo 1. Projete um modelo:
(6.6) x
t
= G(x, A; z(t), f(t)), t 0;
Passo 2. Projete uma regra de adapta c ao
(6.7) A
t
= F(x, A; z(t)), t 0;
steuer
2008/3/11
page 127
i
i
i
i
i
i
i
i
[SEC. 6.3: IDENTIFICAC
AO ADAPTATIVA: INTRODUC
AO 127
Passo 3. Mostre que
(6.8) lim
t
x(t) z(t) = 0, lim
t
A(t) =
A.
Note que x e A em (6.8) s ao solu c oes de (6.6) e (6.7), respectivamente.
(As condi c oes iniciais ainda precisam ser escolhidas.) O sistema (6.6),
(6.7) juntamente com o processo (6.5) e denominado sistema de re-
ferencia adaptativo.
Dena
w(t) := x(t) z(t), R(t) := A(t)
A, t 0.
A realiza c ao dos passos 1. e 2. pode ser feita atraves de um dos seguintes
metodos:
M1 Metodo de resduos:
Modelo: x
t
= Az(t) +f(t), t 0;
Regra de adapta c ao: A
t
= Q(x z(t))z(t)
, t 0;
A matriz Q R
n,n
e a matriz de passo. Note que w, R satisfazem
o sistema
(6.9) w
t
= Rz(t), R
t
= Qwz(t)
, t 0.
M2 Metodo do gradiente:
Modelo: x
t
= Ax +f(t), t 0;
Regra de adapta c ao: A
t
= Q(x z(t))x
, t 0;
A matriz Q R
n,n
e a matriz de passo. Para w, R obtemos um
sistema n ao linear, que n ao pode ser desacoplado de x e A.
M3 Metodo do gradiente linearizado:
Modelo: x
t
= Cx + (AC)z(t) +f(t), t 0,
onde a matriz C R
N,N
precisa ser escolhida adequadamente (veja
abaixo);
Regra de adapta c ao: A
t
= Q(x z)z(t)
, t 0;
A matriz Q R
n,n
e a matriz de passo. Para w, R obtemos o
sistema linear n ao aut onomo:
(6.10) w
t
= Cw +Rz(t), R
t
= Qwz(t)
, t 0.
steuer
2008/3/11
page 128
i
i
i
i
i
i
i
i
128 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
Sobre a nomenclatura gradiente linearizado mencionamos, sem entrar
em detalhes, que este metodo pode ser interpretado como um metodo
de gradiente adaptativo.
Nesse ponto ca claro que a verica c ao de
lim
t
x(t) z(t) = 0, lim
t
A(t) =
A
esta relacionada com a estabilidade do ponto de equilbrio (0,
A). En-
tretanto, os sistemas a serem analisados s ao n ao aut onomos, o que torna
a utiliza c ao da teoria espectral quase que impraticavel. A m de levar
adiante a analise, consideramos com mais cuidado a ideia por tras de
cada um dos metodos descritos acima.
O metodo M1 esta baseado na ideia de ajustar o par ametro A,
utilizando como informa c ao o erro (resduo) na equa c ao de estado. A
equa c ao do modelo desempenha um papel secundario, pois a adapta c ao
do par ametro A e feita considerando-se unicamente a sada y = z do
sistema. A equa c ao de evolu c ao do erro (6.9) sugere, qualitativamente,
como a matriz Q deve ser escolhida. De (6.9) temos
|R|
2
t
(t) = R(t), QR(t))z(t)z(t)
, t 0.
Na equa c ao acima, o produto interno e a norma em R
n,n
s ao denidos
da seguinte forma:
M,
M) :=
n
i,j=1
m
ij
m
ij
, |M| :=
_
M, M),
onde M = (m
ij
),
M = ( m
ij
) R
n,n
.
O metodo M3 e discutido a seguir em maiores detalhes. Note que
dispomos de uma equa c ao para o modelo da forma:
x
t
= Cx + (AC)z(t) +f(t), t 0.
(Note que a equa c ao acima descreve um modelo linear.) A regra de
adapta c ao utilizada e
x
t
= F(x, z(t)), t 0.
Logo, obtemos para w, R o seguinte sistema:
(6.11) w
t
= Cw +Rz(t), R
t
= F(w +z(t), z(t)), t 0.
steuer
2008/3/11
page 129
i
i
i
i
i
i
i
i
[SEC. 6.3: IDENTIFICAC
AO ADAPTATIVA: INTRODUC
AO 129
Procuramos agora um candidato `a fun c ao de Lyapunov (note que, para
sistemas n ao aut onomos, n ao dispomos de maiores informa c oes analticas
sobre o metodo de Lyapunov) da forma
V (w, R) :=
1
2
(w, Qw) +|R|
2
),
onde a matriz Q ainda precisa ser escolhida. Calculando a derivada total
de V ao longo das trajetorias do sistema (6.11), obtemos
V (t) =
d
dt
V (w(t), R(t))
= w(t), Ww(t)) +Qw(t)z(t)
, R(t))
+F(w(t) +z(t), z(t)), R(t)),
onde W e dado por
(6.12) C
Q+QC =
1
2
W.
Escolhemos agora a regra de adapta c ao
A
t
= Q(x z(t))z(t)
, t 0,
e a matriz Q, de forma a garantir que W seja positiva denida. Assim,
temos que
V (t) 0, t 0.
Resumindo, precisamos implementar o seguinte esquema:
i) Escolher uma matriz estavel C;
ii) Escolher uma matriz positiva denida W;
iii) Calcular Q atraves da equa c ao (6.12);
iv) Escolher uma condi c ao inicial A
0
para A(0);
v) Calcular a solu c ao do sistema
x
t
= Cx + (AC)z(t) +f(t), t 0, x(0) = z
0
,
A
t
= Q(x z)z(t)
, t 0, A(0) = A
0
.
Note que o Teorema 78 garante a existencia de uma solu c ao Q (positiva
denida) para a equa c ao (6.12).
steuer
2008/3/11
page 130
i
i
i
i
i
i
i
i
130 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
Exemplo 111. Considere o sistema em que
A =
_
2 1
1 4
_
, z(t) =
_
d
1
sin e
1
t
d
2
sin e
2
t
_
, t 0.
A fun c ao f e o estado inicial z
0
podem ser calculados a partir da. A
seguir aplicamos o metodo M3, resolvendo o problema de valor inicial
atraves do metodo de RungeKutta.
1
o
problema: d
1
= d
2
= e
1
= 1, e
2
= 2. Escolhemos as matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Resolvendo o problema de valor inicial, obtemos
A(3) =
_
2.0076 1.0014
1.0059 4.0014
_
.
2
o
problema: d
1
= d
2
= e
1
= e
2
= 1. Escolhemos agora as matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Resolvendo o problema de valor inicial, obtemos
A(3) =
_
1.5002 1.5002
2.5002 2.5002
_
.
3
o
problema: d
1
= 1, d
2
= 0, e
1
= 1, e
2
= 2 e matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Resolvendo o problema de valor inicial, obtemos
A(3) =
_
2.0001 +5.0000
1.0001 +5.0000
_
.
A compara c ao entre os resultados obtidos para os tres problemas
e inevitavel. Uma analise detalhada e apresentada na proxima sec c ao.
Por hora observe que, enquanto a trajetoria do primeiro problema possui
duas componentes distintas, as componentes da trajetoria do segundo
problema s ao identicas. Ja no terceiro problema, uma das componentes
se anula identicamente. 2
steuer
2008/3/11
page 131
i
i
i
i
i
i
i
i
[SEC. 6.4: IDENTIFICAC
, R(0) = R
0
, t 0.
Uma vez que a trajetoria z e uma fun c ao contnua, podemos, argumen-
tando como na Sec c ao A.4, garantir a existencia de solu c oes locais para
o sistema. Fazemos agora as seguintes hipoteses adicionais:
z e limitada, Q e positiva denida, C e uma matriz estavel.
Lema 112. O sistema (6.13) possui uma unica solu c ao (global), a qual
est a denida no intervalo [0, ). Para esta solu c ao (w, R), s ao ver-
dadeiras as armativas:
a) Existe constante positiva c, independente de w e R, tal que
(6.14) sup
t0
_
[w(t)[
2
+|R(t)|
2
_
+
_
0
|w(s)|
2
ds c;
b) (w, R) C
1
((0, ); R
n
R
n,n
);
c) w L
([0, ); R
n
) L
2
([0, ); R
n
);
d) R L
([0, ); R
n,n
), R
t
L
([0, ); R
n,n
) L
2
([0, ); R
n,n
);
e)
V := lim
t
V (w(t), R(t)) existe, onde V e denida por V (w, R) :=
1
2
(w, Qw) +|R|
2
).
Demonstra c ao: Uma vez que existe uma solu c ao local, obtemos de
(6.13) para cada t pertencente ao intervalo de existencia da solu c ao local
V (w(t), R(t)) V (w(0), R(0)) =
_
t
0
w(s), Ww(s))ds,
w(t), Qw(t))+|R(t)|
2
+
_
t
0
w(s), Ww(s))ds = w(0), Qw(0))+|R(0)|
2
,
c
1
[w(t)[
2
+|R(t)|
2
+c
2
_
t
0
[w(s)[
2
ds c
3
,
steuer
2008/3/11
page 132
i
i
i
i
i
i
i
i
132 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
onde as constantes c
1
, c
2
, c
3
independem de w e R. Este e exatamente
o argumento que precisamos para garantir que a solu c ao local pode ser
estendida ao intervalo [0, ). Note ainda que a estimativa (6.14) segue
da ultima linha acima.
As armativas b) e c) seguem diretamente de (6.14). A armativa d)
segue de R
t
= QRwz(t)
, t 0, A(0) = A
0
possui uma unica solu c ao (x, A) denida no intervalo [0, ) e ainda que
esta solu c ao possui as seguintes propriedades:
(x, A) C
1
((0, ); R
n
R
n,n
), (x, A) L
([0, ); R
n
R
n,n
).
Teorema 113. Seja w, R a slou c ao de (6.13) para a condi c ao inicial
w
0
, R
0
. Temos ent ao para x := w +z e A := R +
A que
lim
t
x(t) z(t) = 0.
Demonstra c ao: De w
t
= Cw +Rw, segue que
d
dt
w, Qw) = w, Ww) + 2Qw, Rz).
Da desigualdade (6.14), obtemos agora para 0 t
1
t
2
[w(t
2
), Qw(t
2
)) w(t
1
), Qw(t
1
))[
t
2
_
t
1
w(s), Ww(s))ds
+ 2
t
2
_
t
1
Qw(s), R(s)z(s))ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2
_
t
2
t
1
[Qw(s)[ [R(s)z(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
2
_
t
2
t
1
[w(s)[ |R(s)| [z(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
3
_
t
2
t
1
[w(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
3
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
steuer
2008/3/11
page 133
i
i
i
i
i
i
i
i
[SEC. 6.4: IDENTIFICAC
nN
satisfazendo
t
n+1
t
n
2, n N, lim
nN
t
n
= , lim
nN
w(t
n
), Ww(t
n
)) .
De (6.15), obtemos para r = 1, = /2, um n
0
N tal que
w(t), Ww(t)) /2, t (t
n
, t
n
+ 1), n n
0
.
Temos ent ao que
_
0
[w(s)[
2
ds c
_
0
w(s), Qw(s))ds
c
n=n
0
w(s), Qw(s))
n=n
0
2
2
= .
Esta ultima desigualdade, entretanto, contradiz (6.14).
Uma conseq uencia obvia do Teorema 113 e que, no metodo M3, a
sada x do modelo converge para a sada y = z do sistema real. Neste
caso, diz-se que o metodo possui a caracterstica de identicar a sada.
A propriedade que realmente procuramos, i.e. que o par ametro A(t)
fornecido pela regra de adapta c ao convirja para
A, n ao pode ser obtida
sem hipoteses adicionais (lembre do Exemplo 111).
Lema 114. Seja R(t) = A(t)
A. S ao verdadeiras as armativas:
a) O limite
R := lim
t
|R(t)| existe;
b) R
t
L
2
([0, ); R
n,n
), lim
t
R
t
(t) = 0.
Demonstra c ao: O item a) segue dos Lema 112 e Teorema 113. O item
b) e conseq uencia do Teorema 113 e do fato de w L
2
([0, ); R
n
) (que
segue do Lemma 112).
steuer
2008/3/11
page 134
i
i
i
i
i
i
i
i
134 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
Teorema 115. Suponha que existem > 0, > 0, T > 0 e uma
seq uencia t
k
kN
com lim
k
t
k
= e
(6.16)
V R
n,n
, k N, s
k
[t
k
, t
k
+T] tal que
_
s
k
+
s
k
V z(s)ds
|V |.
Temos ent ao
lim
t
x(t) z(t) = 0, lim
t
A(t) =
A.
Demonstra c ao: Do Lema 114 sabemos que
R := lim
t
|R(t)| existe.
Suponha que
R > 0. Podemos ent ao, sem perda de generalidade, supor
que
|R(t
k
)| a :=
R/2, k N.
Da equa c ao diferencial w
t
= Cw +Rz(t), obtemos para 0 t
1
t
2
(6.17)
_
t
2
t
1
R(s)z(s)ds
[w(t
2
)[+[w(t
1
)[+c
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
.
Da equa c ao diferencial R
t
= Qwz(t)
, obtemos agora
(6.18) |R(t
2
) R(t
1
)| c
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
.
Alem disso temos, para todo t 0, a seguinte desigualdade:
(6.19)
_
_
_
_
t+
t
R(t)z(s)ds
_
t+
t
R(s)z(s)ds
_
_
_c
_
t+
t
|R(t)R(s)|ds.
Dena V
k
:= |R(t
k
)|
1
R(t
k
), k N, onde t
k
kN
e a seq uencia for-
necida na hipotese do teorema. Argumentando agora com (6.16) e com
a tecnica de subseq uencias diagonais, podemos garantir a existencia de
uma seq uencia s
k
kN
com
(6.20) s
k
[t
k
, t
k
+T], k N,
_
s
k
+
s
k
V
k
z(s)ds
c, k N.
De (6.17), (6.18), (6.19) temos que
_
s
k
+
s
k
R(s)z(s)ds = 0, lim
kN
|R(t
k
) R(s
k
)| = 0,
steuer
2008/3/11
page 135
i
i
i
i
i
i
i
i
[SEC. 6.4: IDENTIFICAC
_
s
k
+
s
k
V
k
z(s)ds
_
=
_
s
k
+
s
k
R(t
k
)z(s)ds
= 0.
Esta ultima identidade contradiz (6.20), cando assim provado o teo-
rema.
Sem a hipotese adicional (6.16) e ainda possvel provar a convergencia
de A(t) para
A. Entretanto, como a unicidade do par ametro
A e (em
geral) desconhecida, o limite lim
t
A(t) depende da escolha da condi c ao
inicial A
0
. Analisamos a seguir um resultado dessa natureza.
Teorema 116. Suponha que a sada y = z e uma fun c ao T-peri odica.
Ent ao temos
lim
t
x(t) z(t) = 0, lim
t
A(t) = A
+T(A
0
),
onde T e a proje c ao ortogonal do R
n,n
sobre o subespa co
/
o
:= A R
n,n
[ Az(s) = 0, s [0, T]
e A
o
(e facil ver que o caso geral sempre pode ser reescrito desta forma).
Da equa c ao diferencial x
t
= Cx + (A C)z(t) + f(t), t 0, segue
que A(t) /
o
, para t 0. Como a seq uencia R(kT)
kN
e limi-
tada, podemos extrair uma subseq uencia k
j
jN
, tal que o limite
R :=
lim
j
R(k
j
T) existe. Como /
o
e fechado e A(t) =
A+R(t), t 0, temos
A :=
A+
R /
o
.
Sejam t
1
, t
2
[0, T] com 0 t
1
t
2
T e sejam
t
1,j
:= t
1
+k
j
T, t
2,j
:= t
2
+k
j
T, j N.
Argumentando como na demonstra c ao do Teorema 115 com a extra c ao
de subseq uencias diagonais, concluimos que
lim
j
_
t
2,j
t
1,j
R(s)z(s)ds = 0, lim
j
_
t
2,j
t
1,j
(R(s) R(k
j
T))ds = 0.
steuer
2008/3/11
page 136
i
i
i
i
i
i
i
i
136 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
Da periodicidade de z segue agora que
lim
j
_
t
2,j
t
1,j
R(s)z(s)ds = lim
j
_
t
2,j
t
1,j
R(k
j
T)z(s)ds
= lim
j
_
t
2
t
1
R(k
j
T)z(s)ds =
_
t
2,j
t
1,j
Rz(s)ds.
Como t
1
, t
2
[0, T] s ao arbitrarios, temos
Rz(s) = 0 para todo s [0, T].
Portanto,
R /
o
e
A =
A+
R / /
o
.
Isto prova que
A e a unica matriz de norma mnima procurada. Da
unicidade de
A, conclumos agora que a seq uencia A(kT)
kN
con-
verge necessariamente para
A. Da equa c ao diferencial A
t
= Qwz(t)
A =
_
2 1
1 4
_
, z(t) =
_
d
1
sin e
1
t
d
2
sin e
2
t
_
, t 0.
Reconstruimos o par ametro
A utilizando o metodo M3, de acordo com
a Observa c ao 117 com T = 1. Como no Exemplo 111, os problemas de
valor inicial s ao resolvidos atraves do metodo de RungeKutta.
Considere o primeiro problema, em que d
1
= d
2
= e
1
= 1, e
2
= 2 e
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Reiniciando o metodo M3 por tres vezes, obtemos a seguinte aproxima-
c ao para
A:
_
2.0060 1.0017
1.0042 4.0015
_
.
2
steuer
2008/3/11
page 137
i
i
i
i
i
i
i
i
EXERC
ICIOS 137
Exerccios
6.1. Considere o sistema
z
t
= pz +u, y = z,
com Z
0
:= 0, Q := R, = R, do Exemplo 105. Verique que qualquer
par ametro p R e identicado pelo experimento (0, u), u(t) := t, para
t R.
Quais par ametros p R podem ser identicados pelo experimento (0, u),
u(t) 1?
6.2. Considere o sistema do Exemplo 109:
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
onde Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Verique a arma c ao de que todo par ametro q Q com p
3
> 0 e
identicavel.
Encontre q
1
, q
2
Q tais que L(z, u, q
1
) = L(z, u, q
2
), para todo (z, u)
Z
0
.
steuer
2008/3/11
page 138
i
i
i
i
i
i
i
i
Captulo 7
Calculo Variacional
Neste captulo s ao discutidos resultados preliminares da teoria co-
nhecida como calculo variacional. De forma simplicada, tal teoria
pode ser entendida como extens ao `a uma famlia particular de proble-
mas de otimiza c ao (em espa cos de dimens ao innita), de resultados da
analise em varias variaveis, os quais permitem caracterizar os candidatos
`a solu c ao de problemas de otimiza c ao em R
n
. Um papel fundamental
no desenvolvimento da teoria e desempenhado pelo teorema de multipli-
cadores de Lagrange e pelas condi c oes de KuhnTucker, discutidos no
Apendice B (veja Sec c ao B.1).
Na Sec c ao 7.1 s ao apresentados os problemas variacionais e intro-
duzidos os conceitos de mnimos locais e de varia c oes de G ateaux. Sob
hipoteses adicionais de convexidade, e apresentado um resultado sobre
condi c oes sucientes para otimalidade (equa c ao de EulerLagrange). Na
Sec c ao 7.2 e apresentado um lema auxiliar (lema de du BoisRaymond)
de fundamental import ancia para obten c ao de condi c oes necessarias. Na
Sec c ao 7.3 analisamos condi c oes necessarias para otimalidade, apresen-
tadas na forma da equa c ao de EulerLagrange e de sua primeira integral.
Nas Sec c oes 7.4 e 7.5 estendemos os resultados anteriores para proble-
mas com trajetorias contnuas por partes e para problemas vetoriais
respectivamente.
steuer
2008/3/11
page 139
i
i
i
i
i
i
i
i
[SEC. 7.1: PROBLEMAS VARIACIONAIS E CONVEXIDADE 139
7.1 Problemas Variacionais e Convexidade
Um problema tpico do calculo das varia c oes e a minimiza c ao de
funcionais do tipo
(7.1) I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt,
onde o intervalo [a, b] e xo e a aplica c ao L : [a, b] R R R e
conhecida. A minimiza c ao do funcional denido em (7.1) e realizada
entre as fun c oes y : [a, b] R continuamente diferenciaveis em [a, b].
1
C[a, b].
steuer
2008/3/11
page 140
i
i
i
i
i
i
i
i
140 [CAP. 7: C
ALCULO VARIACIONAL
variacionais
(7.2)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
.
O conjunto Y
ad
e denominado conjunto das fun c oes admissveis
(ou viaveis). Da analise real, sabemos que e preciso distinguir entre
mnimos locais e globais do funcional I.
Deni cao 119. y Y
ad
e denominado mnimo global de I : Y
ad
R
quando
I(y) I( y),
para todo y Y
ad
. 2
Denimos a seguir os mnimos locais. A import ancia destes mnimos
vem do fato de que condi c oes apenas necessarias, em geral, os englobam
juntamente com os mnimos globais. Antes da deni c ao, porem, relem-
bramos alguns fatos importantes sobre a topologia dos espa cos C[a, b] e
C
1
[a, b].
O espa co vetorial C[a, b] e completo (espa co de Banach) com a norma
do supremo (ou de Tschebysche), denida por
|f|
:= sup
t[a,b]
[f(t)[, f C[a, b].
Assim sendo, esta norma induz uma metrica (dist ancia) em C[a, b],
denida por
dist(f, g) := |f g|
, f, g C[a, b].
Analogamente, podemos construir uma metrica para C
1
[a, b] com a
dist ancia
|f g|
1,
:= |f g|
+ |f
t
g
t
|
, f, g C
1
[a, b].
Uma vez relembrados estes conceitos, caracterizamos a seguir os pontos
de mnimo local de um funcional I : Y
ad
R.
Deni cao 120. y Y
ad
e denominado mnimo local fraco de I quando
> 0 tq y Y
ad
com |y y|
1,
< temos I(y) I( y).
steuer
2008/3/11
page 141
i
i
i
i
i
i
i
i
[SEC. 7.1: PROBLEMAS VARIACIONAIS E CONVEXIDADE 141
y Y
ad
e denominado mnimo local forte de I quando
> 0 tq y Y
ad
com |y y|
,
quando o limite existe. 2
Note que a Deni c ao 121 nos permite concluir que
I(y; v) =
d
d
I(y +v)
=0
,
caso a derivada total em rela c ao `a variavel da aplica c ao real
R I(y +v) R
esteja bem denida em = 0. Da Deni c ao 121 segue ainda a linearidade
da varia c ao de G ateaux em rela c ao ao funcional I, i.e. xados y, v Y
temos
(7.3) (I
1
+I
2
)(y; v) = I
1
(y; v) +I
2
(y; v), , R.
Pressuposto, e claro, que as varia c oes envolvidas existam. Outra pro-
priedade interessante se verica em rela c ao `a dire c ao de deriva c ao:
(7.4) I(y; v) = I(y; v), R.
Novamente supondo que as varia c oes envolvidas existam.
steuer
2008/3/11
page 142
i
i
i
i
i
i
i
i
142 [CAP. 7: C
ALCULO VARIACIONAL
Exemplo 122. Seja Y = R
n
e f C
1
(Y ; R). Dados y, v Y , temos
f(y; v) = lim
0
f(y +v) f(y)
= f(y), v),
que e a derivada parcial de f em y na dire c ao do vetor v. 2
Exemplo 123. Seja Y = C
1
[a, b] e I : Y y
_
b
a
L(t, y(t), y
t
(t)) dt
R, onde L e uma aplica c ao C
1
([a, b] R
2
; R). Dados y, v Y , temos
I(y; v) =
d
d
I(y +v)
=0
=
_
b
a
_
d
d
L(t, y +v, y
t
+v
t
)
_
=0
dt
=
_
b
a
_
L
y
(t, y(t), y
t
(t))v(t) + L
y
(t, y(t), y
t
(t))v
t
(t)
dt.
2
Os primeiros resultados relativos `a caracteriza c ao das solu c oes de
(7.2) surgem quando trabalhamos com hipoteses sobre a convexidade da
fun c ao objetivo. Isto justica a introdu c ao do seguinte conceito.
Deni cao 124. Dado um espa co vetorial Y e um funcional I : D
Y R, dizemos que I e convexo em D quando, para todo par de
elementos y, v Y , temos
I(y + (1 )v) I(y) + (1 )I(v), [0, 1].
I e denominado estritamente convexo em D quando a desigualdade na
express ao acima for estrita. 2
Caso a varia c ao de G ateuax I(y; v) do funcional I esteja denida
para todos elementos y, y + v D, e possvel fornecer uma deni c ao
equivalente de convexidade:
Lema 125. Seja Y um espa co vetorial e I : D Y R tal que, para
todo par de elementos y, v de Y satisfazendo y, y + v D, a varia c ao
de G ateaux I(y; v) existe. S ao equivalentes as arma c oes:
a) I e convexo em D;
b) Para todo par de elementos y, v Y com y, y +v D, temos
I(y +v) I(y) I(y; v).
steuer
2008/3/11
page 143
i
i
i
i
i
i
i
i
[SEC. 7.1: PROBLEMAS VARIACIONAIS E CONVEXIDADE 143
E ainda, I e estritamente convexo em D quando a igualdade na desigual-
dade do item b) ocorre se e somente se v = 0.
Demonstra c ao:
E bastante demonstrarmos a equivalencia entre a) e b).
a) = b) Note que, para 0 < < 1, podemos escrever y +v na forma
da combina c ao linear convexa
y +v = (1 )y +(y +v),
com = [0, 1]. Da deni c ao de convexidade, segue que
I(y +v) (1 )I(y) +I(y +v),
de onde obtemos
1
_
I(y +v) I(y)
_
I(v) I(w)
I(w; (v y))
1
(1 )
_
I(w) I(y)
,
de onde obtemos I(y) +(1 )I(v) I(w) e o teorema ca provado.
Apresentamos agora uma condi c ao suciente para um problema de
otimiza c ao em que a fun c ao objetivo e convexa.
Lema 126. Dado um espa co vetorial Y e um funcional convexo I : D
Y R, ent ao cada y que satisfaz
I( y; v) = 0, y +v D,
minimiza I em D. Se I e estritamente convexo, ent ao y e unico.
Demonstra c ao: Dado y D, dena v := y y Y . Logo,
I(y) I( y) = I( y +v) I( y) I( y; v) = 0.
A unicidade de y e consequencia imediata da deni c ao de convexidade
estrita.
steuer
2008/3/11
page 144
i
i
i
i
i
i
i
i
144 [CAP. 7: C
ALCULO VARIACIONAL
Estamos agora aptos para formular um resultado que fornece condi c oes
sucientes para determinar a solu c ao do problema (7.2).
Teorema 127. Seja Y = C
1
[a, b], Y
ad
= y Y ; y(a) = y
a
, y(b) = y
b
,
I : Y
ad
y
_
b
a
L(t, y, y
t
)dt R, onde L C
1
([a, b] R
2
; R) satisfaz
(7.5) L(t, y +v, z +w) L(t, y, z) L
y
(t, y, z)v + L
z
(t, y, z)w,
para todo (t, y, z), (t, y + z, z + w) [a, b] R
2
. S ao verdadeiras as
arma c oes:
a) I e convexo em Y
ad
;
b) Se L e tal que a igualdade em (7.5) ocorre se e somente se vw = 0,
ent ao I e estritamente convexo em Y
ad
;
c) Cada y Y
ad
que satisfaz a equa c ao diferencial
(7.6)
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
), t [a, b]
e um mnimo global de I em Y
ad
.
d) Se a hip otese do item b) e vericada, o elemento y Y
ad
que satisfaz
a equa c ao diferencial do item c) e o unico mnimo global de I em Y
ad
.
Demonstra c ao: Dados y, y +v Y
ad
, a desigualdade (7.5) implica em
(7.7) L(t, y +v, y
t
+v
t
) L(t, y, y
t
) L
y
(t, y, y
t
)v + L
y
(t, y, y
t
)v
t
.
Integrando, obtemos
_
b
a
[L(t, y+v, y
t
+v
t
)L(t, y, y
t
)] dt
_
b
a
[L
y
(t, y, y
t
)v+L
y
(t, y, y
t
)v
t
] dt,
i.e. I(y + v) I(y) I(y; v), provando o item a). Se a hipotese em
b) e verdadeira, ent ao dados y, y + v Y
ad
a igualdade em (7.7) ocorre
se e somente se v(t)v
t
(t) 0 em [a, b]. Note que v(t)v
t
(t) = 1/2(v
2
(t))
t
,
logo v(t)v
t
(t) 0 se e somente se v
2
(t) e constante. Note ainda que
v
2
(a) = 0.
2
Portanto, I(y + v) I(y) = L(y; v) se e somente se v 0
e o item b) ca provado.
2
De fato, como y e y +v pertencem a Y
ad
, ent ao v(a) = v(b) = 0.
steuer
2008/3/11
page 145
i
i
i
i
i
i
i
i
[SEC. 7.2: LEMAS DE DU BOISREYMOND E LAGRANGE 145
Os tens c) e d) s ao os mais importantes do teorema. Suponha que
y Y
ad
e solu c ao da equa c ao diferencial (7.6). Logo, para v Y com
y +v Y
ad
temos
I( y; v) =
_
b
a
[L
y
(t, y, y
t
)v +L
y
(t, y, y
t
)v
t
] dt
=
_
b
a
_
d
dt
L
y
(t, y, y
t
)v
_
dt
= [L
y
(t, y(t), y
t
(t))v(t)]
b
a
= 0.
Como I e convexo (veja o item a)), o item c) segue do Lema 126. Se
a hipotese do item b) e vericada, ent ao I e estritamente convexo e a
unicidade de y segue da segunda parte do Lema 126.
A equa c ao diferencial (7.6) e a conhecida equa c ao de EulerLagrange
uma das mais importantes do calculo variacional. O Teorema 127,
alem de fornecer condi c oes sucientes para garantir a convexidade do
funcional I, garante ainda que, se I e convexo, a equa c ao de Euler
Lagrange representa uma condi c ao suciente para otimalidade de y
Y
ad
. Voltaremos a analisar esta equa c ao diferencial de segunda ordem na
Sec c ao 7.3, quando investigamos condi c oes necessaria para otimalidade.
7.2 Lemas de du BoisReymond e Lagrange
Nesta sec c ao estudamos um lema, cuja formaliza c ao impulsionou
fortemente o desenvolvimento do calculo variacional. Trata-se do lema
de du BoisReymond, que foi objeto de investiga c ao de matematicos
como Euler e Lagrange, tendo sido apresentado por P. du BoisReymond
no ano de 1879. Foi entretanto K. Weierstrass que em seus seminarios
(18751882) apresentou pela primeira vez uma demonstra c ao clara e
completa. A demonstra c ao deste lema utiliza um resultado auxiliar que
enunciamos a seguir.
Lema 128. Seja h C[a, b] tal que
_
b
a
h(t) v
t
(t) dt = 0,
steuer
2008/3/11
page 146
i
i
i
i
i
i
i
i
146 [CAP. 7: C
ALCULO VARIACIONAL
para todo v C
1
0
[a, b] := w C
1
[a, b] [ w(a) = w(b) = 0. Ent ao a
fun c ao h e constante no intervalo [a, b].
Demonstra c ao: Dado c R dena a fun c ao v(t) :=
_
t
a
(h(s) c)ds,
t [a, b]. Por constru c ao, v C
1
[a, b] e v(a) = 0. A escolha particular
c := 1/(b a)
_
b
a
h(s)ds gera uma uma fun c ao v que satisfaz
0
_
b
a
(h(t) c)
2
dt =
_
b
a
(h(t) c) v
t
(t) dt
=
_
b
a
h(t) v
t
(t) dt [ c v]
b
a
= 0,
provando assim que h(t) = c, para t [a, b].
Lema 129 (du BoisReymond). Seja f C[a, b] tal que, para todo
v C
1
[a, b] com v(a) = v(b) = 0, tenhamos
_
b
a
f(t) v(t) dt = 0.
Ent ao, f 0 em [a, b].
Demonstra c ao: Denindo g(t) :=
_
t
a
f(s)ds, segue da hipotese (inte-
grando por partes) que
_
b
a
g(s)v
t
(t) dt = 0, v C
1
0
[a, b].
O Lema 128 implica que g(t) = c, t [a, b]. O lema de du Bois-Reymond
segue agora da identidade g
t
= f.
As fun c oes v utilizadas nos Lemas 128 e 129 s ao denominadas fun c oes
teste, devido ao papel por elas desempenhado. O espa co C
1
0
[a, b] e
tambem denominado espa co de fun c oes teste. Discutimos a seguir uma
generaliza c ao do lema de du BoisReymond, formulada por Lagrange.
Lema 130 (Lagrange). Seja fC[a, b] tal que, para todo vC
k
0
[a, b] :=
v C
k
[a, b] [ v
(j)
(a) = v
(j)
(b) = 0, j = 0, 1, . . . , k, tenhamos
_
b
a
f(t) v(t) dt = 0.
steuer
2008/3/11
page 147
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 147
Ent ao f 0 em [a, b].
Demonstra c ao: Suponha que f(t
0
) > 0 para algum t
0
(a, b). Como f
e contnua, existe [c, d] (a, b) tal que
t
0
(c, d) e f(t)
1
2
f(t
0
) > 0, t (c, d).
Denindo a fun c ao
v(t) :=
_
[(t c)(d t)]
k+1
, t [c, d]
0 , t [a, b]/[c, d]
observamos que v e n ao negativa e v C
k
0
[a, b]. Por constru c ao, temos
que
_
b
a
fv dt =
_
d
c
fv dt > 0, o que contradiz a hipotese. Logo, f(t) 0,
t (a, b). A continuidade de f implica que f(t) 0 em [a, b]. Analoga-
mente, provamos que f(t) 0 em [a, b].
7.3 Equacao de EulerLagrange
Suponha que L : [a, b] R
2
R e duas vezes continuamente dife-
renciavel e que o mnimo local fraco y Y
ad
:= y C
1
[a, b] [ y(a) =
y
a
, y(b) = y
b
do funcional I satisfaz y C
2
[a, b]. Dados C
1
0
[a, b]
e
0
> 0 sucientemente pequeno, denimos a famlia de fun c oes ad-
missveis
y(; ) := y() + (), (
0
,
0
).
Por constru c ao, temos |y(; ) y|
1,
= [[||
1,
. Note ainda que, pelo
fato de y ser mnimo local fraco de I em Y
ad
, temos
J() := I(y(; )) I( y) = J(0), (
0
,
0
).
Isto e, = 0 e mnimo local da fun c ao real J, denida pela composi c ao
de I com a famlia y(; ). Da analise real sabemos que uma condi c ao
necessaria para que isto aconte ca (caso J seja diferenciavel) e que
d
d
J()
=0
= 0.
Da Deni c ao 121, segue que
(7.8) I( y; ) =
d
d
I( y +)
=0
=
d
d
J()
=0
= 0
steuer
2008/3/11
page 148
i
i
i
i
i
i
i
i
148 [CAP. 7: C
ALCULO VARIACIONAL
e uma condi c ao necessaria para que y seja mnimo local de I em Y
ad
.
Uma vez que L e, em particular, continuamente diferenciavel, temos
(veja Exemplo 123)
(7.9) I( y; ) =
_
b
a
[ L
y
(t, y(t), y
t
(t))(t) + L
y
(t, y(t), y
t
(t))
t
(t) ] dt.
Note que a fun c ao
: [a, b] t L
y
(t, y(t), y
t
(t)) R
e continuamente diferenciavel em [a, b], devido `as hipoteses feitas sobre L
e y. Como satisfaz as condi c oes de contorno (a) = (b) = 0, obtemos
integrando (7.9) por partes
(7.10) I( y; ) =
_
b
a
_
L
y
(t, y(t), y
t
(t))
d
dt
(t)
_
(t) dt.
Note que (7.10) e valida para todo C
1
0
[a, b]. Logo, segue do lema de
du BoisReymond (Lema 129) que
(7.11) L
y
(t, y(t), y
t
(t))
d
dt
L
y
(t, y(t), y
t
(t)) = 0, t [a, b].
Em (7.11) podemos reconhecer a equa c ao de EulerLagrange obtida na
Sec c ao 7.1 (veja equa c ao (7.6)). Esta equa c ao diferencial de segunda or-
dem nos fornece uma condi c ao necessaria para determina c ao de mnimos
locais de um funcional. Como foi visto no Teorema 127, esta condi c ao
e tambem suciente para otimalidade, caso o funcional I seja convexo.
Podemos resumir a discuss ao acima no seguinte teorema:
Teorema 131. Seja L : [a, b] R R R duas vezes continuamente
diferenci avel e y C
2
[a, b] um mnimo local fraco do problema (7.2).
Ent ao, y e solu c ao do problema de valor de contorno
(7.12)
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0, t (a, b)
y(a) = y
a
, y(b) = y
b
.
Demonstra c ao: Veja desenvolvimento acima.
steuer
2008/3/11
page 149
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 149
Observa cao 132 (problemas com fronteira livre). Analogos ao
problema (7.2) s ao os problemas em que apenas uma condi c ao de con-
torno e imposta, por exemplo a condi c ao y(b) = y
b
. Construindo a
famlia de fun c oes admissveis
y(; ) := y() + (), C
1
[a, b], (b) = 0,
obtemos atraves de um desenvolvimento analogo ao anterior, a condi c ao
necessaria
(7.13)
0 = I( y; ) = L
y
(a, y(a), y
t
(a))(a)
_
b
a
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
)
_
(t) dt,
para todo C
1
[a, b] com (b) = 0. Note que (7.13) vale em parti-
cular para C
1
0
[a, b], de onde segue (novamente argumentando com
o Lema 129) a equa c ao de EulerLagrange. Tomando agora em (7.13)
C
1
[a, b] com (b) = 0 e (a) ,= 0, obtemos a condi c ao extra
(7.14) L
y
(a, y(a), y
t
(a)) = 0.
Sendo assim, para problemas com com fronteira livre, obtemos, alem da
equa c ao de EulerLagrange, uma condi c ao de contorno para y no ex-
tremo do intervalo [a, b], onde o problema n ao exige nenhuma restri c ao.
Tal condi c ao surge naturalmente da formula c ao variacional do problema
de otimiza c ao, sendo por isso denominada condi c ao de contorno natural.
Resumindo, para que y seja solu c ao do problema
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y y C
1
[a, b] [ y(b) = y
b
ALCULO VARIACIONAL
As hipoteses y C
2
[a, b] e L C
2
([a, b] R
2
; R) s ao demasiado
restritivas e devem ser enfraquecidas. Esta considera c ao nos leva a ana-
lisar uma aplica c ao do lema de du BoisReymond diferente da utilizada
na obten c ao da equa c ao (7.10) (veja exerccio 7.3).
Teorema 133. Seja L : [a, b] RR R continuamente diferenci avel
e y C
1
[a, b] um mnimo local fraco para o problema (7.2). Ent ao, a
aplica c ao
[a, b] t L
y
(t, y(t), y
t
(t)) R
e continuamente diferenci avel e y e solu c ao do problema de valor de
contorno (7.12) no Teorema 131.
Demonstra c ao: Repetindo a argumenta c ao feita na demonstra c ao do
Teorema 131, obtemos para C
1
0
[a, b]
(7.15)
_
a
b
[L
y
(t, y(t), y
t
(t)) (t) + L
y
(t, y(t), y
t
(t))
t
(t)] dt = 0.
Integrando por partes e observando que (a) = (b) = 0, segue que
_
b
a
_
_
t
a
L
y
(s, y(s), y
t
(s)) ds + L
y
(t, y(t), y
t
(t))
_
t
(t) dt = 0.
O Lema 128 implica na existencia de uma constante c que sasfaz
(7.16)
_
t
a
L
y
(s, y(s), y
t
(s)) ds + L
y
(t, y(t), y
t
(t)) = c, t [a, b].
Como a aplica c ao
[a, b] t
_
t
a
L
y
(s, y(s), y
t
(s)) ds R
e continuamente diferenciavel, segue de (7.16) que a aplica c ao
[a, b] t L
y
(t, y(t), y
t
(t)) R
tambem e continuamente diferenciavel (apesar de exigirmos apenas y
C
1
[a, b]). Podemos ent ao derivar em rela c ao a t a express ao (7.16),
obtendo assim a equa c ao de EulerLagrange.
3
3
N ao e possvel deduzir a equa c ao de EulerLagrange integrando (7.15) por
partes, como na demonstra c ao do Teorema 131, pois para diferenciar a aplica c ao
t L
y
(t, y(t), y
em todo t
0
[a, b] com L
y
y
(t
0
, y(t
0
), y
(t
0
)) ,= 0, caso L seja uma
fun c ao C
3
.
steuer
2008/3/11
page 151
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 151
As considerac oes feitas na Observa c ao 132 sobre as condi c oes de
contorno naturais continuam validas no caso L C
1
, y C
1
, como o
leitor pode facilmente vericar.
Deni cao 134. As solu c oes da equa c ao diferencial de EulerLagrange
(sem condi c ao de contorno) s ao denominadas fun c oes estacion arias ou
extremais, independente do fato de serem ou n ao solu c oes do problema
variacional. 2
Observa cao 135. Suponha que L e uma aplica c ao continuamente dife-
renciavel e que y Y
ad
e uma fun c ao estacionaria. Integrando a equa c ao
de EulerLagrange, obtemos
(7.17) L
y
(t, y, y
t
) =
_
t
a
L
y
(s, y(s), y
t
(s)) ds + const.
Fazendo a hipotese extra y C
2
[a, b], segue da equa c ao de Euler
Lagrange
d
dt
L(t, y, y
t
) = L
t
(t, y, y
t
) + L
y
(t, y, y
t
)y
t
+ L
y
(t, y, y
t
)y
tt
= L
t
(t, y, y
t
) +
d
dt
[L
y
(t, y, y
t
)y
t
],
que pode ser reescrito como
L
t
(t, y, y
t
) =
d
dt
[L(t, y, y
t
) y
t
L
y
(t, y, y
t
)].
Integrando esta express ao, obtemos a equa c ao
(7.18) L(t, y, y
t
) y
t
L
y
(t, y, y
t
) =
_
t
a
L
t
(s, y(s), y
t
(s)) ds + const.
que e conhecida como primeira integral da equa c ao de EulerLagrange.
Note a semelhan ca com a equa c ao (7.17) e tambem o fato da exigencia
y C
2
[a, b] n ao aparecer explicitamente na equa c ao.
A equa c ao (7.18) pode ainda ser deduzida no caso geral em que
o extremal y e uma fun c ao apenas C
1
[a, b]. Uma demonstra c ao sim-
ples, porem trabalhosa, pode ser encontrada em [Tr, Captulo 6]. Essa
demonstra c ao e levada a cabo acoplando-se a abordagem variacional com
mudan cas de coordenadas convenientes.
No caso aut onomo, i.e., quando a fun c ao L = L(y, y
t
) n ao depende
explicitamente de t, e possvel obter a equa c ao (7.18) para extremais
steuer
2008/3/11
page 152
i
i
i
i
i
i
i
i
152 [CAP. 7: C
ALCULO VARIACIONAL
y C
1
[a, b] de uma forma simples. De fato, da equa c ao de Euler
Lagrange segue que
0 = y
t
_
L
y
(y, y
t
)
d
dt
L
y
(y, y
t
)
_
= L
t
(y, y
t
) + y
t
L
y
(y, y
t
) y
tt
L
y
(y, y
t
) y
t
d
dt
L
y
(y, y
t
)
=
d
dt
L(y, y
t
)
d
dt
[y
t
L
y
(y, y
t
)].
Integrando esta ultima express ao, obtemos a equa c ao (7.18) para o caso
aut onomo
L(y, y
t
) y
t
L
y
(y, y
t
) = const.
2
Os tres exemplos a seguir ilustram como a equa c ao de EulerLagrange
e utilizada para determinar a solu c ao de alguns problemas classicos do
calculo variacional. S ao esses: determina c ao de geodesicas no plano; de-
termina c ao de geodesicas na esfera; a Braquistocrona (ver Sec c ao 1.2.7).
Exemplo 136. Analisamos o problema de encontrar, dados dois pontos
(t
0
, y
0
) e (t
1
, y
1
) no plano, a curva de menor comprimento que os une.
Representamos as curvas admissveis com parametriza c oes do tipo
y : [t
0
, t
1
] t y(t) R; y(t
0
) = y
0
, y(t
1
) = y
1
.
Supondo as curvas admissveis continuamente diferenciaveis, obtemos o
seu comprimento pela express ao
J(y) :=
_
t
1
t
0
_
1 +y
t
(t) dt.
Podemos ent ao resumir o problema como:
_
_
Minimizar J(y) =
_
t
1
t
0
L(t, y(t), y
t
(t)) dt
sujeito a
y C
1
[t
0
, t
1
] [ y(t
0
) = y
0
, y(t
1
) = y
1
onde L(t, y, y
t
) = (1+(y
t
)
2
)
1/2
. Da equa c ao de EulerLagrange obtemos
0 = L
y
d
dt
L
y
= 0
d
dt
_
y
t
(1 + (y
t
)
2
)
1/2
_
.
steuer
2008/3/11
page 153
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 153
t
t=a
Meridianos
(t,y(t))
P
Q
t=b
Figura 7.1: Curva admissvel unindo os pontos P e Q.
Logo,
y
t
(1 + (y
t
)
2
)
1/2
= const.,
o que implica em y
t
constante, ou em y ser linear. 2
Exemplo 137. Consideramos agora o problema de, xados dois pontos
P e Q na superfcie da esfera de raio r, encontrar a curva de menor
comprimento que os une. Estando a esfera centrada na origem, parame-
trizamo-a localmente pelas coordenadas:
r(cos t cos y, sin t cos y, sin y) com t (0, 2), y (
2
,
2
).
S ao consideradas apenas curvas que cortem cada meridiano em apenas
um ponto. Tais curvas podem ser parametrizadas usando a latitude t
como par ametro. A longitude y de um ponto da curva e dada por uma
fun c ao y(t) da variavel independente t (veja Figura 7.1). Uma curva e
ent ao representada por
[a, b] t r(cos t cos y(t), sin t cos y(t), sin y(t)) R
3
.
Suponha que os pontos a serem unidos sejam parametrizados por:
(a, y
a
), (b, y
b
). Quando y e continuamente diferenciavel, o comprimento
da curva correspondente e dado por
I(y) =
_
b
a
r
_
cos
2
y(t) +y
t
(t)
2
dt.
steuer
2008/3/11
page 154
i
i
i
i
i
i
i
i
154 [CAP. 7: C
ALCULO VARIACIONAL
Logo, L(t, y, y
t
) = r(cos
2
y(t) + y
t
(t)
2
)
1/2
e da primeira integral da
equa c ao de Euler (7.18) obtemos a identidade
cos
2
y = A
_
cos
2
y + (y
t
)
2
,
onde A e constante. Obviamente A (1, 0) e ainda
A
2
(y
t
)
2
= cos
4
y A
2
cos
2
y.
Usando separa c ao de variaveis, temos
Ady
(cos
4
y A
2
cos
2
y)
1/2
= dt.
Logo,
_
Ady
cos y(cos
2
y A
2
)
1/2
= (t a) + B,
onde B e constante. Fazendo a mudan ca de variaveis u = tan y, obtemos
nalmente
y(t) = arctan(
1 A
2
A
sin((t a) +B)),
sendo as constantes A e B determinadas a partir dos dados a, b, y
a
, y
b
.
Note que o equador y = 0 (A = 1) e um extremal. Contudo, se
b a > , uma das partes do equador n ao e o caminho mais curto. Tal
fato nos leva a concluir que pequenas partes desta curva determinam o
caminho mais curto, enquanto que longas partes n ao o fazem.
4
2
Exemplo 138 (Braquist ocrona). Voltamos agora a tratar do pro-
blema apresentado na Sec c ao 1.2.7. Como ja foi visto, o problema de
encontrar a curva de tempo mnimo se deixa formular como
_
_
Minimizar J(y) :=
_
x
1
x
0
_
1 + (y
t
)
2
2gy +c
_
1/2
dx
sujeito a
y C
1
[x
0
, x
1
] [ y(x
0
) = y
0
, y(x
1
) = y
1
4
O tratamento de problemas como o surgido neste exemplo foi motivo de inves-
tiga c ao por Carl Jacobi, que atraves da teoria de campos de extremais conseguiu
esclarecer quando uma fun c ao estacion aria deixa de ser solu c ao do problema varia-
cional. Maiores detalhes podem ser encontrados em [Tr, Captulo 9].
steuer
2008/3/11
page 155
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 155
onde g e a constante gravitacional e c = c
g,v
0
,y
0
e a energia total do
corpo (cinetica + potencial) no instante inicial. Note que o integrando
e aut onomo, i.e. L = L(y, y
t
). Logo, segue da primeira integral da
equa c ao de Euler (7.18) que
const. = L(y, y
t
) y
t
L
y
(y, y
t
) =
(1 + (y
t
)
2
)
1/2
(2gy +c)
1/2
y
t
(1 + (y
t
)
2
)
1/2
(2gy +c)
1/2
y
t
.
Apos alguma manipula c ao algebrica, obtemos a equa c ao diferencial
(7.19) (2gy +c) (1 + (y
t
)
2
) = const.
Fazendo a hipotese simplicadora c = 0 (que corresponde ao caso par-
ticular v
0
= y
0
= 0), obtemos no lugar de (7.19) a equa c ao diferencial
(7.20) y (1 + (y
t
)
2
) = A.
(Compare com a equa c ao (1.41), obtida na Sec c ao 1.2.7 a partir do
princpio de refra c ao de Fermat.) Para resolver esta equa c ao diferencial
supomos o extremal y da forma
y(x) = A sin
2
(
1
2
(x)).
Substituindo em (7.20), obtemos y
t
=
_
(Ay)/y. De onde segue
A sin(
2
) cos(
2
)
d
dx
=
cos(
2
)
sin(
2
)
.
Portanto, dx = Asin
2
(
2
)d, ou ainda
x = B +
1
2
A( sin ).
Sendo assim, obtemos para o extremal y a seguinte parametriza c ao:
: [
0
,
1
] (b +a( + sin ), a(1 + cos )) R
2
,
onde os par ametros a, b s ao determinados pelas condi c oes de contorno
(
0
) = (x
0
, y
0
), (
1
) = (x
1
, y
1
). A curva descrita pela parametriza c ao
acima e conhecida por cicl oide (veja Figura 1.4). 2
steuer
2008/3/11
page 156
i
i
i
i
i
i
i
i
156 [CAP. 7: C
ALCULO VARIACIONAL
7.4 Extremais Diferenciaveis por Partes
Na Sec c ao 7.3 consideramos como admissveis apenas as fun c oes con-
tinuamente diferenciaveis. Essa hipotese e bastante restritiva e faz com
que determinados problemas variacionais n ao possuam solu c ao (veja
Exemplo 139). Nesta sec c ao exigimos menos regularidade dos candidatos
`a solu c ao do problema variacional e obtemos novamente um conjunto de
condi c oes necessarias para otimalidade.
Exemplo 139. Considere o problema variacional com integrando
L(t, y(t), y
t
(t)) := (1 (y
t
)
2
)
2
.
Obviamente temos L(t, y, y
t
) = 0 quando [y
t
[ = 1 e L(t, y, y
t
) > 0, caso
contrario. Portanto, as fun c oes com derivada igual a 1 por partes, s ao
as candidatas naturais `a solu c ao do problema variacional
_
_
Minimizar I(y) :=
_
b
a
(1 [y
t
(t)]
2
)
2
dt
sujeito a
y Y
ad
:= y C
1
[0, 1] [ y(0) = y
0
, y(1) = y
1
.
Entretanto, apenas para poucos pares de condi c oes de contorno y
0
, y
1
dene uma
steuer
2008/3/11
page 157
i
i
i
i
i
i
i
i
[SEC. 7.4: EXTREMAIS DIFERENCI
l=0
[y(t
l+1
) y(t
l
)]
=
_
t
t
k
y
t
(s) ds +
k1
l=0
_
t
l+1
t
l
y
t
(s) ds =
_
t
a
y
t
(s) ds.
Corolario 143. Seja y
C
1
[a, b]. S ao verdadeiras as arma c oes:
a) Se
_
b
a
y
t
(s)
2
ds = 0, ent ao y
t
0;
b) Se y
t
(t) = 0 em todos os pontos t onde y e diferenci avel, ent ao y e
constante.
steuer
2008/3/11
page 158
i
i
i
i
i
i
i
i
158 [CAP. 7: C
ALCULO VARIACIONAL
Demonstra c ao: Sejam t
1
, ..., t
n
os pontos de descontinuidade de y
t
, t
0
=
a e t
n+1
= b. Da identidade
0 =
_
b
a
y
t
(s)
2
ds =
n
k=0
_
t
k+1
t
k
y
t
(s)
2
ds,
temos que
y
t
[
[t
k
,t
k+1
]
= 0, 0 k n.
Provando assim o item a). O item b) segue imediatamente do Lema 142.
O lema a seguir discute um modo de encontrar uma aproxima c ao
suave para uma fun c ao diferenciavel por partes, i.e., aproximar uma
fun c ao apenas
C
1
por outra C
1
.
E importante observar que, no processo
descrito, a derivada da aproxima c ao e mantida limitada pela derivada
da fun c ao original.
Lema 144. Seja y
C
1
[a, b] e t
1
, . . . , t
n
os pontos de descontinuidade
de y
t
. Ent ao, e possvel encontrar constantes A R e
0
> 0 tais que,
para todo (0,
0
), existe y C
1
[a, b] satisfazendo
a) y[
R
= y, onde R = [a, b]
n
l=0
[t
l
, t
l
+];
b) max
t[a,b]
[y
t
(t)[ 4 max
t[a,b]
[ y
t
(t)[;
c) max
t[a,b]
[y(t) y(t)[ A.
Demonstra c ao: Basta provar o resultado para parti c oes com apenas um
ponto
t. Escolha
0
> 0 tal que [
t
0
,
t +
0
] (a, b). Seja (0,
0
).
A ideia por tras da suaviza c ao consiste em substituir a derivada y
t
por uma poligonal contnua em [
t ,
t[ >
(t
t)
1
y
t
(
t ) + (t
t +)
1
h , t [
t ,
t]
(t
t )
1
h + (t
t)
1
y
t
(
t +) , t [
t,
t +]
A partir da, dena a fun c ao y C
1
[a, b]
y(t) := y(a) +
_
t
a
g(s) ds, t [a, b].
steuer
2008/3/11
page 159
i
i
i
i
i
i
i
i
[SEC. 7.4: EXTREMAIS DIFERENCI
t
t
t+
h
g(t)
y
t
(t)
A
1
A
2
Figura 7.2: Constru c ao da fun c ao g no Teorema 144
Escolhemos agora h, de modo que y = y em [a, b][
t,
t+], satisfazendo
assim a). Este e o caso quando a condi c ao
_
t+
t
g(s) ds =
_
t+
t
y
t
(s) ds =: A
= h +
2
[ y
t
(
t ) + y
t
(
t +)].
Escolhemos portanto
h =
A
1
2
[ y
t
(
t ) + y
t
(
t +)].
Denindo agora M := max
t[a,b]
[ y
t
(t)[, obtemos
[A
[ 2M e [h[ 3M.
Da deni c ao de g, segue agora para todo t [a, b]
[y
t
(t)[ = [g(t)[
max [ y
t
(t)[, [ y
t
(
t )[ +[h[, [h[ +[ y
t
(
t +)[
M +[h[ 4M,
provando assim b). Para determinar A em c), basta observar que
[y(t) y(t)[
_
t
t
[y
t
(s) y
t
(s)[ ds
_
t+
t
([y
t
(s)[ +[ y
t
(s)[) ds 10M
e a demonstra c ao ca completa.
steuer
2008/3/11
page 160
i
i
i
i
i
i
i
i
160 [CAP. 7: C
ALCULO VARIACIONAL
Estamos agora em condi c oes de obter condi c oes necessarias para
solu c oes de classe
C
1
de um problema variacional. Antes porem, ana-
lisamos uma importante correspondencia existente entre as solu c oes do
problema (7.2) e do problema
(7.21)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y
Y
ad
:= y
C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
.
Para simplicar a nota c ao, denominamos os problemas (7.2) e (7.21)
por problemas (P) e (
P) respectivamente. A m de analisar as solu c oes
do problema (
P), observe que o conceito de mnimo local fraco na
Deni c ao 120 e naturalmente estendido ao problema (
P), bastando para
isto substituir o espa co Y
ad
por
Y
ad
naquela deni c ao.
Teorema 145. Seja L : [a, b] RR R uma aplica c ao contnua. Se
y Y
ad
e um mnimo local fraco para o problema (P), ent ao y tambem
e mnimo local fraco para o problema (
P).
Demonstra c ao: Se y e mnimo local fraco de (P), ent ao existe > 0 tal
que
I( y) I(v), v S
:= v Y
ad
[ |v y|
1,
< .
Tome y
Y
ad
com | y y|
1,
< /5. Dado > 0 sucientemente
pequeno, o Lema 144 garante a existencia de v
,
C
1
[a, b] tal que
|v
,
v|
A e |v
t
,
|
4|v
t
|
,
onde v := y y
C
1
[a, b] e a constante A depende apenas de y e y.
Denindo a fun c ao y
:= y +v
,
Y
ad
, temos
|y
y|
1,
= |v
,
|
1,
= |v
,
|
+ |v
t
,
|
|v
,
v|
+ |v|
+ 4 |v
t
|
A + 4 | y y|
1,
A +
4
5
.
steuer
2008/3/11
page 161
i
i
i
i
i
i
i
i
[SEC. 7.4: EXTREMAIS DIFERENCI
) [I(y
) I( y)[
I( y) [I( y +v
,
) I( y +v)[
I( y)
_
t+
t
[L(t, y +v
,
, ( y +v
,
)
t
)
[L(t, y +v, ( y +v)
t
)[ dt.
Tomando o limite quando 0, a integral do lado direito converge a
zero e obtemos I( y) I( y).
Resumindo, o Teorema 145 garante que toda solu c ao C
1
e tambem
uma solu c ao
C
1
do problema variacional. Um resultado analogo para
mnimos globais pode tambem ser formulado, assim como resultados
relativos a problemas em que faltam condi c oes de contorno (veja Ob-
serva c ao 132).
A recproca do Teorema 145 n ao e verdadeira, conforme ilustra o
exemplo a seguir.
Exemplo 146. Considere a fun c ao L(t, y, y
t
) := y
2
(1y
t
)
2
denida em
[a, b] = [1, 1], e as condi c oes de contorno y
a
= 0, y
b
= 1. Observe que
a fun c ao
y(t) :=
_
0 , t 0
t , t 0
e um mnimo global de I em
Y
ad
, pois I( y) = 0. Vericamos a seguir
que n ao existe outro mnimo global. Suponha que y
Y
ad
e um outro
mnimo. Como y(1) = 1, o escalar denido por
:= inf [1, 1] [ y(t) > 0, < t 1
necessariamente satisfaz [1, 1]. Da identidade I(y) = I( y) = 0,
obtemos y
t
(t) = 1, para t (, 1], i.e.
y(t) = t, t [, 1].
Como y e contnua, segue da deni c ao de que = 0. Logo,
y(t) = t, t [0, 1].
Note agora que y(1) = y(0) = 0. Note ainda que, para todo t (1, 0)
com y(t) ,= 0, temos necessariamente y
t
(t) = 1. Podemos ent ao concluir
que y(t) = 0, t [1, 0]. Sendo assim, o problema variacional n ao possui
solu c ao em Y
ad
e a unica solu c ao em
Y
ad
e a fun c ao y. 2
steuer
2008/3/11
page 162
i
i
i
i
i
i
i
i
162 [CAP. 7: C
ALCULO VARIACIONAL
O proximo teorema fornece as desejadas condi c oes necessarias para
otimalidade do problema variacional (
P).
Teorema 147. Seja L : [a, b] R R continuamente diferenci avel e
y
Y
ad
um mnimo local fraco para o problema (
P). Ent ao, existe uma
constante c R tal que
(7.22) L
y
(t, y(t), y
t
(t)) =
_
t
a
L
y
(s, y(s), y
t
(s)) ds + c, t [a, b]
e ainda
(7.23) L
y
(t, y(t), y
t
(t)) = L
y
(t, y(t+), y
t
(t+)), t (a, b).
Demonstra c ao: Dado
0
> 0, escolha
C
1
[a, b] com (a) = (b) = 0.
Como y e mnimo local, temos I( y; ) = 0. Da hipotese de diferencia-
bilidade de L, segue que 0 = I( y; ) =
d
d
I( y +)[
=0
, i.e.
_
b
a
[ L
y
(s, y(s), y
t
(s)) (s) + L
y
(s, y(s), y
t
(s))
t
(s) ] ds = 0.
Integrando por partes, obtemos
(7.24)
_
b
a
_
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s))
_
t
(s) ds = 0.
Escolhemos agora a constante c (usando o teorema do valor medio) de
forma que a fun c ao v
C
1
[a, b] denida por
v(t) :=
_
t
a
_
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s)) c
_
ds
satisfa ca a condi c ao
v(a) = v(b) = 0.
Tomando agora f(s) :=
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s)),
s [a, b], segue da equa c ao (7.24)
_
b
a
v
t
(s)
2
ds =
_
b
a
[f(s) c]
2
ds
=
_
b
a
f(s) [f(s) c] ds c
_
b
a
[f(s) c] ds
= 0 c
_
b
a
f(s) ds + c
2
(b a) = 0.
steuer
2008/3/11
page 163
i
i
i
i
i
i
i
i
[SEC. 7.4: EXTREMAIS DIFERENCI
ALCULO VARIACIONAL
7.5 Problemas Vetoriais
Generalizamos nesta sec c ao para problemas variacionais vetoriais os
resultados obtidos ate agora ao longo do captulo. Considere o problema
(7.26)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y
Y
ad
:= y
C
1
([a, b]; R
n
) [ y(a) = y
a
, y(b) = y
b
,
onde L C
1
([a, b] R
2n
; R) e y
a
, y
b
R
n
s ao dados. Os problemas
vetoriais se caracterizam pelo fato dos canditados serem fun c oes vetoriais
y(t) = (y
1
(t), . . . , y
n
(t)), com y
j
C
1
[a, b].
O teorema a seguir generaliza para o problema (7.26) as condi c oes
necessarias obtidas para o problema variacional escalar (7.21).
Teorema 149. Seja L : [a, b] R
2n
R continuamente diferenci avel e
y
Y
ad
um mnimo local fraco para o problema (7.26). Ent ao, y satisfaz
a equa c ao vetorial de EulerLagrange
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
)
nos pontos t [a, b] de continuidade de y
t
. Tambem e satisfeita a
primeira integral da equa c ao de Euler
L(t, y, y
t
) y
t
(t), L
y
(t, y, y
t
))
=
_
t
a
L
t
(s, y(s), y
t
(s)) ds + const., t [a, b].
(Note que esta equa c ao e escalar, enquanto a equa c ao de EulerLagrange
e vetorial.) Nos pontos t [a, b] de descontinuidade de y
t
s ao satisfeitas
as condi c oes de WeierstraErdmann
L
y
(t, y(t), y
t
(t)) = L
y
(t+, y(t+), y
t
(t+)),
[L y
t
, L
y
)](t) = [L y
t
, L
y
)](t+).
(Note que a primeira condi c ao e vetorial e a segunda e escalar.)
Demonstra c ao:
E totalmente analoga `as demonstra c oes anteriores,
bastando deduzir as equa c oes vetoriais componente a componente.
steuer
2008/3/11
page 165
i
i
i
i
i
i
i
i
EXERC
ICIOS 165
Nos problemas vetoriais considerados nesta sec c ao a fun c ao objetivo
e escalar. Em muitos problemas de controle otimo (e em seus correspon-
dentes variacionais) e conveniente considerar fun c oes objetivo vetoriais,
i.e. I :
Y
ad
R
k
. Neste caso, utiliza-se o conceito de Pareto otimalidade
para eleger uma estrategia otima. Para maiores detalhes consulte [Lei].
Exerccios
7.1. Calcule a primeira integral da Equa c ao de EulerLagrange quando
L = L(t). Mostre que as fun c oes lineares s ao estacionarias.
7.2. Calcule a primeira integral da Equa c ao de EulerLagrange quando
L = L(t, y).
7.3. Prove que | |
1,
dene uma norma em
C
1
[a, b]. Mostre que o
espa co vetorial normado assim obtido n ao e completo.
7.4. Prove que, se g, h C[a, b] s ao tais que
_
b
a
[g(t)v(t) + h(t)v
t
(t)] dt = 0,
para todo v C
1
0
[a, b], ent ao h C
1
[a, b] e h
t
= g.
(Sugest ao: Veja demonstra c ao do Teorema 133.)
7.5. Demonstre o lema de du BoisReymond (Lema 129) utilizando o
Exerccio 7.4.
7.6. Se L = L(y, y
t
) e uma aplica c ao C
1
, mostre que toda fun c ao
estacionaria y
Y
ad
satisfaz a primeira integral da Equa c ao de Euler
Lagrange
L( y, y
t
) y
t
L
y
( y, y
t
) = const.
nos pontos t (a, b) de continuidade de y
t
.
7.7. Seja L uma aplica c ao C
1
e y
Y
ad
uma fun c ao estacionaria.
Mostre que a segunda condi c ao de WeierstrassErdmann
(L y
t
L
y
)(t
) = (L y
t
L
y
)(t
+
), t [a, b]
e satisfeita.
(Sugest ao: Utilize o fato do extremal y satisfazer a primeira integral da
Equa c ao de EulerLagrange: L(t, y, y
t
) yL
y
(t, y, y
t
) =
_
t
a
L
t
(s, y, y
t
)ds+
const.)
steuer
2008/3/11
page 166
i
i
i
i
i
i
i
i
166 EXERC
ICIOS
7.8. Dada L C
1
([a, b] R
3
; R), calcule a varia c ao de G ateaux da
aplica c ao I : C
2
[a, b] R denida por
I(y) :=
_
b
a
L(t, y(t), y
t
(t), y
tt
(t)) dt.
a) Dada y Y
ad
:= C
2
[a, b] [ y(a) = y
a
; y(b) = y
b
; y
t
(a) = y
t
a
, dena
g(t) :=
_
t
a
L
y
(s, y, y
t
, y
tt
)ds e h(t) :=
_
b
t
[L
y
(s, y, y
t
, y
tt
) g(y)]ds.
Mostre que, para todo v Y
0
:= C
2
[a, b] [ v(a) = v(b) = v
t
(a) = 0,
temos
I(y, v) =
_
b
a
[h(t) +L
y
(t, y, y
t
, y
tt
)]v
tt
(t) dt
_
h(t)v
t
(t)
b
a
.
b) Conclua que uma condi c ao necessaria para que y seja mnimo local
de I em Y
ad
e
I( y, v) =
_
b
a
[h(t) L
y
(t, y, y
t
, y
tt
)]v
tt
(t) dt = 0, v Y
0
.
c) Use o Exerccio 7.9 para garantir que a aplica c ao t L
y
(t, y, y
t
, y
tt
)
e diferenciavel e obtenha a equa c ao de EulerLagrange para problemas
de segunda ordem
d
dt
_
d
dt
L
y
L
y
_
= L
y
, t (a, b).
7.9. Seja k > 0 xo. Mostre que, se h C[a, b] e tal que
_
b
a
h(t)v
(k)
(t) dt = 0, v C
k1
0
[a, b],
ent ao h e um polin omio de grau < k.
7.10. Seja L C
1
([a, b] R
3
; R). Mostre que se y C
3
[a, b] e solu c ao
da equa c ao de EulerLagrange do Exerccio 7.8, ent ao y e solu c ao da
primeira integral da Equa c ao de EulerLagrange (para problemas de
segunda ordem)
L y
t
_
L
y
d
dt
L
y
_
y
tt
L
y
=
_
b
a
L
t
(s, y, y
t
, y
tt
)ds + const.
steuer
2008/3/11
page 167
i
i
i
i
i
i
i
i
EXERC
ICIOS 167
7.11. Seja L C
1
([a, b] R
k+1
; R). Mostre que um mnimo local de
I(y) :=
_
b
a
L(t, y(t), . . . , y
(k)
(t)) dt
em Y
ad
:= y C
k
[a, b] [ y(a) = a
1
, y(b) = b
1
, . . . , y
(
k 1)(a) = a
k1
,
y
(
k 1)(b) = b
k1
satisfaz a equa c ao de EulerLagrange de k-esima
ordem
L
y
d
dt
L
y
+
d
2
dt
2
L
y
. . . + (1)
k
d
k
dt
k
L
y
(
k)
= 0.
7.12. Considere o problema variacional
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t))dt
sujeito a y y C
1
[a, b] [ y(b) = y
b
, y(a) y
a
.
a) Mostre que para y ser solu c ao deste problema variacional e necessario
que satisfa ca
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0
y(b) = y
b
, L
y
(a, y(a), y
t
(a)) 0.
b) Prove que a igualdade na condi c ao de contorno natural L
y
(a, y(a),
y
t
(a)) 0 ocorre exatamente quando y(a) = y
a
.
7.13. Complete os detalhes da demonstra c ao do Teorema 149.
7.14. Prove a identidade nas equa c oes (7.3) e (7.4) do texto.
steuer
2008/3/11
page 168
i
i
i
i
i
i
i
i
Captulo 8
Princpios Variacionais na
Mecanica
Neste captulo investigamos formula c oes variacionais para problemas
de mec anica (cinematica). O objetivo e apresentar diferentes abordagens
para problemas relacionados `a mec anica (devidas a Newton, Lagrange
e Hamilton) e deduzir a equa c ao de HamiltonJacobi como condi c ao
necessaria para otimalidade de um problema de minimiza c ao.
Na Sec c ao 8.1 s ao estudados, sob a otica da mec anica Newtoni-
ana, alguns problemas da cinematica, de onde deduzimos as leis de
Newton e Kepler. Na Sec c ao 8.3 e apresentado o formalismo introduzido
por Lagrange, que e exemplicado para o problema dos N-corpos. Na
Sec c ao 8.4 analisamos a mec anica Lagrangeana sob a otica de Hamilton,
que toma como ponto de partida a equa c ao diferencial de Euler.
8.1 Mecanica Newtoniana
O que hoje e denominado mec anica cl assica foi fundado no seculo
XVII por Newton e em primeira m ao delineado por Huygens, Leibniz
e Bernoulli (Johann). A contribui c ao de Newton foi ter colocado na
forma de uma equa c ao de movimento as grandezas for ca e acelera c ao.
Formulamos a seguir as Leis de Newton em sua forma original:
I) Todo corpo conserva o seu estado de repouso ou movimento retil-
neo uniforme, quando n ao for obrigado, por uma for ca externa, a
alterar o seu movimento.
steuer
2008/3/11
page 169
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC
ANICA
(t, r(t)) RR
3
. A trajetoria r e geralmente representada, em rela c ao
a um sistema especial de coordenadas, por:
r(t) = (x(t), y(t), z(t)) (coordenadas cartesianas)
r(t) = (r(t), (t), (t)) (coordenadas polares).
A partir do conhecimento da trajetoria t r(t), derivamos o con-
ceito de velocidade
1
v(t) :=
dr
dt
(t) = r(t)
e o conceito de acelera c ao
a(t) :=
dv
dt
(t) = v(t).
O estado de repouso e descrito por r(t) = 0 para todos os tempos t,
enquanto que o movimento retilneo uniforme (velocidade constante) e
descrito por
(8.3) r(t) = r
0
+v
0
t.
A Lei I) diz que (8.3) representa o movimento de um corpo, sobre o
qual n ao e exercida nenhuma for ca externa. Se um corpo e lan cado
da posi c ao P para a posi c ao Q, sem interferencia de for cas externas,
seu movimento descreve o caminho mais curto unindo os pontos P e Q
(desde que, e claro, o sistema referencial o observador n ao esteja
sujeito a acelera c oes).
Deni cao 150. Um sistema referencial, para o qual a Lei I) vigore na
forma r(t) = 0 para todos os tempos t e denominado sistema referencial
inercial. 2
Para um sistema referencial inercial, as leis I) e II) assumem a forma:
mr = F,
ou mais detalhadamente
(8.4) mr(t) = F(t, r(t), r(t)), para todo t,
1
Utilizamos a nota c ao fsica para derivadas: y, y, originalmente introduzidas por
Newton.
steuer
2008/3/11
page 171
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC
ANICA
representam as massas dos respectivos corpos. Segundo a lei de Coulomb
temos
(8.8) F
AB
= e
A
e
B
r
A
r
B
[r
A
r
B
[
3
.
Aqui a situa c ao e outra: A intensidade e a dire c ao de atua c ao da for ca
depende das cargas e
A
, e
B
das partculas A, B. A constante depende
da escolha da escala para unidade de massa.
A Lei III) se torna importante, quando fontes de for ca interagem
mutuamente entre si. Este e o caso, por exemplo, quando consideramos
dois corpos de massas parecidas. Entretanto, se a rela c ao entre as massas
for muito desigual, podemos desprezar a rea c ao do corpo mais leve. Esta
e geralmente a situa c ao, quando consideramos o movimento dos planetas
em torno do sol.
Seja F um campo conservativo, i.e. um campo de for cas cuja in-
uencia sobre um corpo nele includo, depende somente da posi c ao que
o corpo ocupa. Logo F = F(r). A m de que um corpo percorra um
caminho unindo os pontos P, Q dentro deste campo, e necessario que
seja efetuado um certo trabalho. Este trabalho e a soma innitesimal do
produto da for ca pelo deslocamento. Portanto, se P = r
0
e Q = r
1
, o
trabalho e descrito pela integral ao longo do caminho
(8.9) A
PQ
=
_
F, dr).
Consideramos o trabalho como uma grandeza, que pode ser inserida em
um corpo e nele permane ca armazenada, ou que possa ser retirada do
corpo. Tal grandeza e denominada energia.
Para a abordagem feita nesta sec c ao utilizamos o sistema de medidas
M-K-S. Se identicamos massa com peso, encontramos para a constante
gravitacional de Newton o valor (experimental)
G 6.67510
11
m
3
kg
1
s
2
,
enquanto que para a velocidade da luz obtemos
c 10
8
m s
2
.
Consideremos agora movimentos em campos de for cas. Suponha que
dispomos de um campo central, i.e. que possua a representa c ao
(8.10) F(r) = f([r[)
r
[r[
, r R
3
0,
steuer
2008/3/11
page 173
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC
ANICA
Consideremos agora o caso geral de uma partcula de massa m sujeita
a um campo central. A energia total
E(r, v) =
m
2
[v[
2
+U([r[)
e composta da energia cinetica E
kin
:=
m
2
[v[
2
e da energia potencial
E
pot
:= U([r[).
E valido o seguinte teorema de conserva c ao de energia:
(8.14) E(r(t), v(t)) = E
0
:= E(r(0), v(0)), t R,
uma vez que
dE
dt
(r(t), v(t)) = mv(t), v(t)) +F(r(t)), v(t)) = 0.
O momento angular J no sistema e denido por
J(r, v) := mr v.
2m(E
0
U(r))
J
2
z
1
r
2
.
Levando agora em considera c ao a forma especial do potencial U(r) :=
u
r
e introduzindo a fun c ao () :=
1
r()
, obtemos a equa c ao diferen-
cial:
(8.19)
d
d
=
2m(E
0
+u)
J
2
z
2
.
Denindo agora as constantes
p :=
J
2
z
um
, :=
_
1 +
2E
0
J
2
z
mu
2
,
temos que
(8.20)
_
d
d
_
2
+
_
1
p
_
2
=
2
p
2
.
Note que esta equa c ao e resolvida por
() :=
1
p
+
p
cos(
0
).
Portanto,
(8.21) r() =
p
1 + cos(
0
)
.
ANICA
Consideremos agora o problema do movimento planetario em nosso
sistema solar. O campo de for cas e o campo gravitacional gerado pelo sol
(de massa M). Um planeta de massa m esta sujeito `a for ca gravitacional:
(8.22) F(r) := GmM
r
[r[
3
, r R
3
0,
que e um campo central (o sol no centro). Da dedu c ao acima, obtemos
a primeira lei de Keppler, pois, devido `as nossas observa c oes, E
0
< 0.
1
a
Lei de Keppler: Os planetas se movem em orbitas
elpticas em torno do sol, que se encontra no foco das res-
pectivas trajetorias.
A taxa de varia c ao da area
A no plano da orbita e obtida, a partir do
raio da orbita (solplaneta), da rela c ao:
A(t + t) A(t) =
1
2
r(t) r(t + t)
1
2
r(t) v(t)t.
Temos assim
A(t) =
1
2
[r(t) v(t)[ =
J
z
2m
;
isto e,
A e constante. Obtemos da a segunda lei de Keppler:
2
a
Lei de Keppler: O vetor do raio da orbita do sol ao
planeta percorre, em intervalos de tempo iguais, areas iguais.
A area A de uma elipse e dada por ab, onde a, b s ao os semi-eixos. Na
nota c ao acima, obtemos para a orbita elptica dos planetas:
a =
p
1
, b =
pa.
Denominando por T o perodo de uma orbita completa de um planeta,
temos que A =
TJ
z
2m
. A partir da obtemos (utilizando as constantes p,
J
z
, u) que
a
3
T
2
=
J
2
z
4
2
m
2
p
=
GM
4
2
.
Este e o conte udo da terceira lei de Keppler:
3
a
Lei de Keppler: A raz ao entre o cubo do semi-eixo
maior e o quadrado do perodo da orbita e constante.
steuer
2008/3/11
page 177
i
i
i
i
i
i
i
i
[SEC. 8.2: TEOREMAS CONSERVATIVOS EM SISTEMAS FECHADOS 177
8.2 Teoremas Conservativos em Sistemas Fecha-
dos
Considere um sistema constitudo de N pontos de massa P
1
, . . . ,
P
N
, com respectivas massas m
1
, . . . , m
N
, submetido `as for cas internas
F
ik
(atuando entre P
i
e P
k
) e `as for cas externas K
i
. As for cas internas
s ao for cas centrais com potenciais U
ik
. A equa c ao de movimento e
(8.23) m
i
r
i
=
k,=i
F
ik
(r
ik
) +K
i
, i = 1, . . . , N,
onde r
ik
:= r
i
r
k
. Em nota c ao simplicada, temos:
Impulso T: T :=
N
i=1
m
i
r
i
;
Centro de massa o: r
S
:=
m(r
1
, . . . , r
N
)
M
,
onde m(r
1
, . . ., r
N
):=
N
i=1
m
i
r
i
, M:=
N
i=1
m
i
;
Energia c: c :=
1
2
N
i=1
m
i
[ r
i
[
2
+
N
i=1
N
l=i+1
U
il
([r
il
[);
Momento angular : :=
N
i=1
m
i
r
i
r
k
.
De um algebrismo elementar, obtemos
(8.24)
Mr
S
=
N
i=1
K
i
,
dT
dt
=
N
i=1
K
i
,
d
dt
=
N
i=1
r
i
K
i
,
dc
dt
=
N
i=1
r
i
, K
i
).
Em um sistema fechado, i.e. um sistema em que n ao atuam for cas exter-
nas (K
1
= = K
N
= 0), temos os seguintes teoremas de conserva c ao:
Conserva cao de Impulso :
dT
dt
= 0
Conserva cao de Energia :
dc
dt
= 0
Conserva cao do Centro de massa :
dr
S
dt
=
T
M
Conserva cao do Momento angular :
d
dt
= 0
Se torna importante a seguinte pergunta: Quais mudan cas de coorde-
nadas levam sistemas referenciais inerciais em outros sistemas referen-
steuer
2008/3/11
page 178
i
i
i
i
i
i
i
i
178 [CAP. 8: PRINC
ANICA
ciais inerciais? S ao as denominadas Transforma c oes de Galilei:
( : (t, r) (t +, Qr +wt +a),
onde Q e uma matriz ortogonal, = 1 e det(Q) = 1.
3
Uma segunda
classe de transforma c oes de Galilei e denida quando tomamos = 1 e
det(Q) = 1. O importante e vericar que as transforma c oes de Galilei
formam um grupo, o denominado grupo ort ocrono. Cada uma dessas
transforma c oes possui, no caso N = 1, dez par ametros livres:
Q depende de 3 par ametros ( angulos);
w depende de 3 par ametros;
a depende de 3 par ametros;
depende de 1 par ametro.
N ao e por acaso que existem dez quantidades escalares nas grandezas
conservadas: Impulso, Energia, Centro de massa, Momento angular. A
invari ancia da lei de Newton:
mr = F(t, r, r)
tem, em rela c ao `as transforma c oes de Galilei, conseq uencias que ja foram
mencionadas. Uma transla c ao no tempo: t t + age de forma que F
n ao dependa explicitamente do tempo. Uma transla c ao espacial: r
wt + q age de forma que F dependa somente das coordenadas r
i
r
j
,
r
i
r
j
. Uma invari ancia em rela c ao `a rota c ao: r Qr signica que
F(Qr, Q r) = QF(r, r).
8.3 Mecanica Lagrangeana
O fato desta teoria ser denominada mec anica Lagrangeana e devido
aos matematicos (fsicos) do seculo XVIII: dAlembert, Euler, Legendre,
Maupertuis e Lagrange.
Na determina c ao das posi c oes no sistema de N corpos, precisamos
obter N vetores de posi c ao, i.e. 3N coordenadas escalares. Em geral,
denomina-se por grau de liberdade o n umero de variaveis (escalares) a
serem determinadas dentro de um sistema. As variaveis do sistema
n ao precisam necessariamente tratarem-se de coordenadas cartesianas.
3
N ao apresentamos o desenvolvimento aqui. Para detalhes veja [Sc].
steuer
2008/3/11
page 179
i
i
i
i
i
i
i
i
[SEC. 8.3: MEC
ANICA
q(t) R
d
ocorre quando a integral
_
b
a
L(t, q(t), q(t))dt, sujeita a restri c ao
q
a
:= q(a), q
b
:= q(b), e minimizada.
A integral
_
b
a
L(t, q(t), q(t)dt e denominada integral de a c ao, pois L
pode ser interpretado como energia e o produto de energia por tempo e
denominado a c ao.
Fica assim claro qual e a forma da equa c ao de movimento:
E a
equa c ao diferencial de Euler para o seguinte problema variacional:
P
/
(a, b; q
a
, q
b
)
_
_
_
Minimizar J(a, b; q
a
, q
b
) :=
_
b
a
L(t, q(t), q(t))dt
sujeito `as restri c oes q(a) = q
a
, q(b) = q
b
.
Para o problema dos N corpos de massas m
1
, . . . , m
N
, descrito na
Sec c ao 8.2, temos d := 3N graus de liberdade e as coordenadas gene-
ralizadas s ao as coordenadas do deslocamento dos corpos. Denimos a
fun c ao Lagrangeana
(8.26) L(t, q
1
, . . . , q
d
, q
1
, . . . , q
d
) :=
1
2
N
i=1
m
i
r
i
N
i=1
N
l=i+1
U
il
([r
il
[).
Utilizando a nota c ao
U(r
1
, . . . , r
N
) :=
N
i=1
N
l=i+1
U
il
([r
il
[)
para o potencial, obtemos
L
q
k
=
U
q
k
,
d
dt
L
q
k
= m
k
q
k
,
onde m
k
e uma nota c ao simplicada (n ao enumerada) para as coor-
denadas. Da equa c ao diferencial de Euler para o problema correspon-
dente P
/
(a, b; q
a
, q
b
), deduzimos as leis de movimento Newtonianas. O
princpio da a c ao mnima nos leva, portanto, de volta aos fundamen-
tos da mec anica classica. (Note que o princpio da a c ao maxima, ou
princpio de Fermat, nos leva a mesma conclus ao.)
Observa cao 153. Uma vez escolhido para um determinado sistema a
fun c ao lagrangeana, e possvel deduzir as equa c oes de movimento.Tais
equa c oes de movimento permanecem inalteradas, caso seja inserido na
equa c ao Lagrangeana o diferencial de uma fun c ao suave (t, q) M(t, q).
steuer
2008/3/11
page 181
i
i
i
i
i
i
i
i
[SEC. 8.3: MEC
ANICA
Obtemos assim para a energia potencial correspondente a express ao
y
1
(t)
2
4l
.
Considera c oes analogas nos permitem obter para os dois outros segmen-
tos do o (no centro e `a direita de m
2
) as seguintes express oes para a
energia potencial:
[ y
2
(t) y
1
(t) [
2
2l
,
y
2
(t)
2
2l
.
Temos assim a energia potencial total do sistema dada por
V (y
1
, y
1
) = (
y
1
(t)
2
4
+
[ y
2
(t) y
1
(t) [
2
2
+
y
2
(t)
2
2
),
onde e uma constante de proporcionalidade entre a elasticidade do o
e o seu comprimento. A fun c ao Lagrangeana correspondente e
L(t, y, y) =
m
2
( y
1
2
+ 2 y
2
2
)
4
(y
2
1
+ 2(y
2
y
1
)
2
+ 2y
2
2
).
A equa c ao diferencial de Euler para o problema variacional resultante
nos fornece o seguinte sistema
y
1
=
2m
(3y
1
+ 2y
2
), y
2
=
2m
(y
1
2y
2
).
Temos assim
d
2
dt
2
(y
1
+y
2
) =
( 3)
2m
(y
1
+
2 2
3
y
2
).
Se escolhemos de forma que = (2 2) ( 3)
1
, i.e. = 2 ou
= 1, obtemos para u := y
1
+ y
2
, = 2 ou = 1, a seguinte
equa c ao diferencial
u =
2
u bzw. u = 4
2
u,
com :=
2m
. Resolvendo-a, obtemos as solu c oes linearmente indepen-
dentes
u
1
(t) = a
1
cos (t
1
), u
2
(t) = a
2
cos 2(t
2
),
steuer
2008/3/11
page 183
i
i
i
i
i
i
i
i
[SEC. 8.4: MEC
ANICA
obtemos o seguinte sistema explcito
q = G(t, q, p), p =
L
q
(t, q, G(t, q, p)).
Note que o teorema de fun c oes implcitas (veja [Wa1]) nos fornece as
condi c oes sucientes para a solubilidade local:
(8.28) det
_
2
L
q
i
q
j
_
,= 0.
A solubilidade global ao longo de um extremal requer considera c oes mais
detalhadas.
Denimos agora
H(t, q, p) := p, G(t, q, p)) L(t, q, G(t, q, p))
e denominamos L a correspondente fun c ao de Hamilton. Da regra da
cadeia, obtemos (utilizamos a seguir nota c ao simplicada)
H
p
i
= G
i
+
_
p,
G
p
i
_
_
L
q
,
G
p
i
_
=G
i
+
_
p,
G
p
i
_
_
p,
G
p
i
_
=G
i
,
H
q
i
=
_
p,
G
q
i
_
L
q
i
_
L
q
,
G
q
i
_
=
_
p,
G
q
i
_
L
q
i
_
p,
G
q
i
_
=
L
q
i
,
H
t
=
_
p,
G
t
_
L
t
_
L
q
,
G
t
_
=
_
p,
G
t
_
L
t
_
p,
G
t
_
=
L
t
.
Essas equa c oes nos levam ao sistema
(8.29) q =
H
p
(t, q, p), p =
H
q
(t, q, p),
H =
H
t
(t, q, p),
pois
dH
dt
=
H
t
+
_
H
q
, q
_
+
_
H
q
, p
_
.
Em (8.29) temos um sistema com 2d+1 equa c oes diferenciais de primeira
ordem. Essas equa c oes s ao denominadas equa c oes can onicas de movi-
mento. Elas s ao completadas por condi c oes de contorno para q e uma
condi c ao inicial para H.
Quando obtemos a aplica c ao G atraves do teorema de fun c oes impl-
citas, G e m1 vezes continuamente diferenciavel sempre que a fun c ao
Lagrangeana e m vezes continuamente diferenciavel (verique!). Das
steuer
2008/3/11
page 185
i
i
i
i
i
i
i
i
[SEC. 8.4: MEC
ANICA
para este objetivo (q(t) R
d
). Entretanto, no caso aut onomo, se dispo-
mos de d integrais, podemos tentar obter completamente o movimento
a partir das formulas:
M
1
(q, p) = k
1
, . . . , , M
d
(q, p) = k
d
.
No problema do movimento planetario obtivemos, apos a redu c ao do
problema a um plano, duas integrais (energia e momento angular) e o
movimento pode ser calculado. Uma interpreta c ao geometrica da inte-
gral e que o movimento ocorre sobre a superfcie de nvel M(q, p) = k.
Primeiras integrais s ao obtidas da seguinte forma: Se H independe
de alguma variavel q
i
ou p
i
, ent ao a proje c ao sobre esta variavel e uma
primeira integral. Em particular a fun c ao de Hamilton e uma primeira
integral, caso ela n ao dependa explicitamente do tempo.
Seja M : [a, b]R
2d
R uma aplica c ao continuamente diferenciavel.
Seja ainda (q, p) uma solu c ao conhecida de (8.29) em [a, b]. Ao longo
desta solu c ao, temos que
dM
dt
M
t
=
_
M
q
, q
_
+
_
M
p
, p
_
=
_
M
q
,
H
p
_
_
M
p
,
H
q
_
=: [H, M],
onde [H, M] e denominado colchete de Poisson. Portanto, para que M
seja uma primeira integral e necessario e suciente que
(8.30)
M
t
(t, q, p) + [H, M](t, q, p) = 0, (t, q, p) [t
0
, t
1
] R
2d
.
_
t
2
+q
2
_
1 +
p
(t
2
+q
2
p
2
)
=
_
t
2
+q
2
p
2
.
As equa c oes can onicas s ao
q =
p
_
t
2
+q
2
p
2
, p =
q
_
t
2
+q
2
p
2
.
Obviamente, temos que
M(q, p) := p
2
q
2
dene uma primeira integral. 2
Ainda uma observa c ao sobre tecnicas de transforma c ao. Suponha
que f : R R e uma fun c ao estritamente convexa, da qual desejamos
descobrir o ponto de mnimo. Suponha ainda que f
t
dene um difeo-
morsmo, i.e. f
t
: R R e bijetiva e f
tt
() > 0, para todo R.
Dena
f
(p) := sup
R
p f(), p R.
O supremo e atingido em um ponto com f
t
() = p. A transforma c ao
p e denominada transforma c ao de Legendre e f
e a transformada
de Legendre de f. Note que f
= f e
(8.31) f() +f
(p) p, p, R.
Note ainda que a seguinte equivalencia e valida:
(8.32) f() +f
(p) = p f
t
() = p.
Fazendo uma compara c ao com a deni c ao anterior da fun c ao de Hamil-
ton, observamos que H(t, y, p) pode ser escrita como
H(t, q, p) = L(t, q, .)
(p).
Este e o ponto de partida para uma formula c ao geral do princpio Hamil-
toniano. A teoria necessaria para analise de transforma c oes de Lagrange
genericas e a analise convexa.
steuer
2008/3/11
page 188
i
i
i
i
i
i
i
i
188 [CAP. 8: PRINC
ANICA
Exemplo 158. Suponha
f() :=
1
[[
, R, > 1.
Logo, f
t
() =
1
e obtemos da que
f
(p) =
1
[p[
, p R,
onde
1
+
1
na dualidade dos
espa cos l
, l
e L
(X), L
(X) (X R
d
). 2
Exemplo 159. Considere novamente o movimento de uma partcula de
massa m em um campo central. Supomos que o movimento ocorre o
plano (plano (xy)) e usamos a representa c ao por coordenadas polares
x(t) = r(t) cos (t) , y(t) = r(t) sin (t) .
Uma fun c ao Lagrangeana e
L(r, , r, ) :=
m
2
( r
2
+r
2
2
) U(r).
Neste caso, temos q
1
= r, q
2
= , p
1
= m r =: p
r
, p
2
= mr
2
=: p
. A
fun c ao de Hamilton e
H(q, p) =
p
2
r
2m
+
p
2
2mr
2
+U(r),
de onde obtemos as equa c oes can onicas
(8.33) r =
p
r
m
, =
p
mr
2
, p
r
=
p
2
mr
3
U
t
(r), p
= 0.
Podemos novamente detectar quais grandezas s ao conservadas neste pro-
blema. 2
Observa cao 160. Transforma c oes no espa co R
d
R
d
geram trans-
forma c oes nas equa c oes Hamiltonianas. Tais transforma c oes se tor-
nam interesantes quando preservam estruturas especiais (simpleticas)
nas equa c oes can onicas. Tal analise nos conduz ao grupo o
2d
(R) das
matrizes simpleticas. S ao matrizes M tais que
M
T
JM = J,
steuer
2008/3/11
page 189
i
i
i
i
i
i
i
i
EXERC
ICIOS 189
isto e matrizes ortogonais com rela c ao `a estrutura simpletica. Em
outras palavras, a forma bilinear em R
d
R
d
denida por (x, y)
[x, y] := x, Jy) e invariante a mudan cas de coordenada geradas por
uma matriz simpletica, i.e. [x, y] = [Mx, My], para todo x, y R
d
.
O contexto abstrato para analise geometrica da mec anica Lagrangeana/
Hamiltoniana e o das variedades simpleticas. Aqui, a fun c ao Lagrangeana
e considerada como uma fun c ao denida no espa co tangente ao espa co
de coordenadas. 2
Observa cao 161. Quando consideramos o problema P
/
(a, b; q
a
, q
b
),
tomamos xos b, q
b
e consideramos a famlia de problemas P
/
(, b; , q
b
).
Da obtemos uma fun c ao de a c ao
(8.34) o(t, q) := inf P
/
(t, b; q, q
b
), (t, q) [a, b] R
d
.
Calculando formalmente, obtemos
(8.35)
o
q
(t, q) = p,
o
t
(t, q) = H(t, q, p).
Portanto, a fun c ao de a c ao e solu c ao da equa c ao parcial
(8.36)
o
t
+H(t, q,
o
q
) = 0, (t, q) [a, b] R
d
,
e satisfaz as condi c oes de contorno
(8.37) o(b, q) = 0, q R
d
.
A equa c ao (8.36) e denominada equa c ao de HamiltonJacobi.
Uma serie de quest oes surge do desenvolvimento acima, como por
exemplo: diferenciabilidade de o; validade das equa c oes em (8.35),
(8.36); solubilidade do problema de valor inicial (8.36), (8.37). Uma
analise destas quest oes no contexto da teoria de controle otimo e apre-
sentada nos Captulos 11 e 12, quando estudamos a fun c ao valor otimo.
2
Exerccios
8.1. Considere a fun c ao Lagrangeana L(t, q, p) := p
2
in [a, b]. Obtenha
a fun c ao Hamiltoniana H e a equa c ao de HamiltonJakobi.
steuer
2008/3/11
page 190
i
i
i
i
i
i
i
i
190 EXERC
ICIOS
8.2. Considere a fun c ao Lagrangeana L(t, q, p) := f(q)
_
1 +p
2
em
[a, b]. Obtenha a fun c ao Hamiltoniana H e a equa c ao de Hamilton
Jakobi.
8.3. Considere a fun c ao Lagrangeana L(t, q, p) :=
_
t
2
+q
2
_
1 +p
2
em
[a, b]. Obtenha a fun c ao Hamiltoniana e os extremais.
8.4. Considere a integral de a c ao
1
2
_
b
a
(m q(t)
2
cq(t))dt.
a) Obtenha a equa c ao diferencial de Euler;
b) Formule as equa c oes can onicas (coordenadas p, q) e obtenha a fun c ao
de Hamilton;
c) Calcule os colchetes de Poisson [q, p], [q, H] e [p, H]. O que podemos
concluir da primeira integral?
8.5. Seja f(x) := e
[x[
[x[ 1, x R. Calcule a transformada de
Legendre f
(f
(y) := sup
xR
(xy f(x)), y R).
8.6. A fun c ao de Hamilton para o movimento de um ponto de massa
em um campo de for cas com potencial U e dada por
H(q, p) :=
1
2m
[p[
2
+U(q), q, p R
3
.
Calcule a fun c ao de Hamilton em coordenadas cilndricas e esfericas.
8.7. Considere a fun c ao Lagrangeana
L(t, x, x) :=
m
2
x
2
[x +[
[x [
.
(Campo de Coulomb com dois centros xos.) Obtenha a a fun c ao de
Hamilton e as equa c oes can onicas.
8.8. Considere o sistema escalar x = U
t
(x), com U : R R duas
vezes continuamente diferenciavel. Suponha que U seja qualitativamente
da forma apresentada na Figura 8.2.
a) O que representam os extremos locais de U para o movimento?
Como se distinguem os maximos dos mnimos locais de U em rela c ao ao
steuer
2008/3/11
page 191
i
i
i
i
i
i
i
i
EXERC
ICIOS 191
U
E
x
0
Figura 8.2: Um perl de potencial
movimento?
b) Fa ca um esboco da curva correspondente ao movimento no plano de
fase x x;
c) Calcule lim
EE
0
T(E), onde T(E) e o perodo de tempo do movimento
para E proximo a E
0
.
8.9. Fa ca um esbo co do potencial unidimensional
U(r) := 5re
r
+r
4
+
2
r
e da curva correspondente ao movimento no plano de fase x x, para
uma partcula de massa unitaria, como fun c ao da energia e da posi c ao
inicial.
8.10. Considere dois pendulos identicos de comprimento l e massa
m, acoplados por um o ideal. O o esta estendido quando ambos os
pendulos est ao em repouso. Para pequenas perturba c oes, a energia total
e dada por
E =
1
2m
(q
2
2
+q
2
4
) +
1
2
m
2
0
(q
2
1
+q
2
3
) +
1
2
m
2
1
(q
1
q
3
)
2
.
a) Identique os termos na equa c ao acima;
b) Obtenha as equa c oes de movimento;
c) Encontre uma mudan ca de variaveis que desacople as equa c oes de
movimento e resolva as novas equa c oes encontradas.
steuer
2008/3/11
page 192
i
i
i
i
i
i
i
i
Captulo 9
Calculo Variacional e
Controle
Otimo
Analisamos neste captulo a conex ao existente entre problemas do
calculo variacional e problemas de controle otimo. Na Sec c ao 9.1 e
feita uma breve apresenta c ao dos problemas de controle otimo. Na
Sec c ao 9.2 s ao estudados problemas variacionais sujeitos `as restri c oes
transversais, isoperimetricas e lagrangeanas, descritas na Sec c ao 7.1. Os
resultados obtidos s ao estendidos aos problemas de controle otimo cor-
respondentes. Na Sec c ao 9.3 analisamos uma famlia de restri c oes muito
utilisada em aplica c oes, que esta associada a um tipo de solu c ao seme-
lhante `as solu c oes bangbang (veja Sec c ao 3.7).
Nas duas ultimas Sec c oes, 9.4 e 9.5, estudamos, sob hipoteses adi-
cionais de convexidade, a suciencia e necessidade para otimalidade de
um conjunto particular de condi c oes. Damos assim o primeiro passo na
dire c ao de um dos principais resultados na teoria de controle otimo, a
saber: o princpio do maximo de Pontryagin.
9.1 O que e Controle
Otimo
Em um problema de controle, uma vari avel de estado z = z(t) R
n
dependente do tempo evolui de acordo com uma dada din amica
(9.1) z
t
(t) = f(t, z(t), u(t)), t > t
0
,
a partir de um estado inicial z(t
0
) = z
0
. Aqui f : R R
n
R
m
R
n
corresponde ao modelo estudado, z
0
R
n
e o estado inicial do sistema
steuer
2008/3/11
page 193
i
i
i
i
i
i
i
i
[SEC. 9.1: O QUE
E CONTROLE
OTIMO 193
e u : R R
m
e um par ametro livre inuenciando a din amica, deno-
minado controle do sistema. Em muitos problemas e tambem fornecida
uma condi c ao de contorno nal z(t
1
) = z
1
, ou ainda uma condi c ao de
contorno transversal. A equa c ao (9.1) e denominada equa c ao de estado.
Nos problemas de controle otimo considerados neste captulo, a tarefa
que se imp oe e a de minimizar funcionais do tipo
J(u, z) :=
_
t
1
t
0
L(t, z(t), u(t)) dt,
com L : RR
n
R
m
R, onde z e u est ao relacionados pela din amica
z
t
= f(t, z, u), t (t
0
, t
1
) e ainda z(0) = z
0
, z(t
1
) = z
1
, u |
ad
.
O conjunto |
ad
e denominado conjunto de controles admissveis
e usualmente e escolhido como subconjunto de C([t
0
, t
1
]; R
m
),
C([t
0
, t
1
]; R
m
) ou L
1
([t
0
, t
1
]; R
m
). Note que diferentes escolhas de |
ad
implicam em diferentes graus de regularidade de z e tambem determi-
nam o conceito que deve ser utilizado para denir a solu c ao do problema
de valor inicial em (9.1).
Podemos formular o problema de controle otimo descrito acima do
seguinte modo
_
_
Minimizar J(u, z) :=
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a u |
ad
,
z
t
= f(t, z, u), t (t
0
, t
1
), z(0) = z
0
, z(t
1
) = z
1
.
A analogia entre os problemas de controle otimo e os problema do calculo
de varia c oes se torna evidente quando observamos que, no caso particu-
lar f(t, z, u) = u, o problema acima toma a forma do problema varia-
cional (7.2).
E exatamente esta semelhan ca que nos permite comparar
as condi c oes de otimalidade para ambas as classes de problemas.
Assim como os problemas variacionais, os problemas de controle
otimo podem ser formulados com condi c oes de contorno transversais,
restri c oes lagrangeanas ou restri c oes isoperimetricas. Nas proximas duas
sec c oes tratamos problemas variacionais restritos, assim como problemas
de controle que s ao de certa forma analogos a estes problemas varia-
cionais.
No problema acima, os instantes de tempo inicial e nal s ao dados
(problemas de tempo xo). Porem, o instante de tempo nal pode ser
steuer
2008/3/11
page 194
i
i
i
i
i
i
i
i
194 [CAP. 9: C
_
Minimzar I(y, T) :=
_
T
a
L(t, y(t), y
t
(t)) dt
sujeito a
T > a ; (T, y(T)) = 0 ; y y C
1
[a, T] [ y(a) = y
a
;
onde L C
1
([a, b] R
2
; R), y
a
R e C
1
([a, b] R; R), com ,=
0.
1
Note que nem o tempo nal nem a condi c ao de contorno nal s ao
especicados. A condi c ao nal para as fun c oes admissveis e fornecida
pela curva de nvel zero da fun c ao (veja Figura 9.1).
Suponha que ( y,
T) com y C
1
[a,
T] e um mnimo local fraco para
o problema (9.2). Logo, para fun c oes teste C
1
0
[a,
T], temos
d
d
I( y +,
T)
=0
= 0,
de onde concluimos, argumentando como na Sec c ao 7.3, que y satis-
faz a equa c ao de EulerLagrange em (a,
T). Temos assim as condi c oes
necessarias
y(a) = y
a
,
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
), t (a,
T).
1
A constante b R e tomada grande o bastante, de forma a n ao interferir na
formula c ao do problema.
steuer
2008/3/11
page 195
i
i
i
i
i
i
i
i
[SEC. 9.2: PROBLEMAS VARIACIONAIS COM RESTRIC
AO 195
a
y
a
T
1
T
2
(t, y) = 0
y
1
(t)
y
2
(t)
t
y
Figura 9.1: Condi c ao de transversalidade e fun c oes admissveis
Falta ainda obter, como na Observa c ao 132, uma condi c ao de con-
torno natural que relacione o tempo nal
T com a fun c ao , que descreve
a condi c ao nal. Essa condi c ao natural e obtida como conseq uencia do
teorema de multiplicadores de Lagrange.
Dena Y
ad
:= y C
1
[a, b] [ y(a) = y
a
. Note que os candidatos
`a solu c ao do problema variacional (9.2) s ao pares da forma (y, T)
Y
ad
R C
1
[a, b] R =: Y . Note ainda que Y e um espa co vetorial
normado com a norma do produto cartesiano |(y, T)| := |y|
1,
+ [T[.
A fun c ao objetivo I esta bem denida como uma aplica c ao de Y em R
e a varia c ao de I em ( y,
T) na dire c ao (, ) Y e dada por
2
I( y,
T; , ) = L(
T, y, y
t
) +
_
T
a
[L
y
(t, y, y
t
)(t) +L
y
(t, y, y
t
)
t
(t)] dt
e como y e estacionaria em (a,
T), usamos a equa c ao de EulerLagrange
para reescrever o integrando da express ao acima, obtendo
I( y,
T; , ) = L(
T, y, y
t
) +
_
T
a
d
dt
_
L
y
(t, y, y
t
)(t)
dt
= L(
T, y, y
t
) +
_
L
y
(t, y, y
t
)(t)
T
a
.
Observe que a condi c ao nal de transversalidade pode ser reescrita como
G(y, T) = 0, onde G : Y (y, T) (T, y(T)) R. Calculando a
varia c ao de G ateaux de G em ( y,
T) na dire c ao (, ) Y , obtemos
3
G( y,
T; , ) =
t
(
T, y) +
y
(
T, y) [ y
t
(
T) +(
T)].
2
Lembre que I( y,
T; , ) = (d/d) I( y +,
T +)[
=0
.
3
Note que G( y,
T; , ) = (d/d) (
T +, ( y +)(
T +))[
=0
. Para simplicar
a nota c ao escrevemos (
T, y) ao inves de (
T, y(
T)).
steuer
2008/3/11
page 196
i
i
i
i
i
i
i
i
196 [CAP. 9: C
T)) = 0,
podemos descarta-lo devido `as hipoteses do problema (9.2).
Tomando fun c oes teste C
1
0
[a,
T] e ,= 0, temos
(9.3)
0 = (I+G)( y,
T; , ) = L(
T, y, y
t
) +[
t
(
T, y)+
y
(
T, y) y
t
(
T)] .
Enquanto que escolhendo (, ) com = (a) = 0 e (
T) ,= 0, obtemos
L
y
(
T, y, y
t
) (
T) +
y
(
T, y) (
T) = 0,
i.e., = L
y
(
T, y, y
t
) /
y
(
T, y, y
t
)
y
(
T, y) = L
y
(
T, y, y
t
) [
t
(
T, y) +
y
(
T, y) y
t
(
T)],
que e a condi c ao natural que buscavamos. A condi c ao (9.4) e denomi-
nada condi c ao de transversalidade. Podemos resumir a discuss ao acima
na forma do seguinte teorema:
Teorema 162. Seja L C
1
([a, b] R
2
; R), C
1
([a, b] R; R) com
,= 0. Se ( y,
T) e um mnimo local fraco de I em Y
ad
R restrito a
(T, y(T)) = 0, ent ao ( y,
T) e solu c ao do problema de valor de contorno
_
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0, t (a, T)
y(a) = y
a
, L(T, y, y
t
)
y
(T, y)
= L
y
(T, y, y
t
) [
t
(T, y) +
y
(T, y) y
t
(T)].
Observa cao 163. Tomando (T, y) = t b no Teorema 162, xamos o
tempo nal T = b e deixamos livre a condi c ao de contorno nal. Neste
caso, a condi c ao de transversalidade se escreve como
L
y
(b, y(b), y
t
(b)) = 0,
que e exatamente a condi c ao natural para os problemas com fronteira
livre, obtida na Observa c ao 132.
Tomando (T, y) = y y
b
no Teorema 162, deixamos o tempo nal
livre e xamos a condi c ao de contorno nal y(T) = y
b
. Neste caso a
condi c ao de transversalidade se escreve como
L(T, y(T), y
t
(T)) = y
t
(T) L
y
(T, y(T), y
t
(T)).
steuer
2008/3/11
page 197
i
i
i
i
i
i
i
i
[SEC. 9.2: PROBLEMAS VARIACIONAIS COM RESTRIC
AO 197
Tais problemas s ao denominados na literatura por problemas de hori-
zonte livre. 2
Antes de prosseguirmos com a analise de problemas sujeitos a restri-
c oes isoperimetricas e lagrangeanas, apresentamos uma vers ao do teo-
rema de multiplicadores de Lagrange em espa cos vetoriais genericos.
Para tanto, consideramos que a fun c ao objetivo e a restri c ao s ao descri-
tas por aplica c oes G ateaux diferenciaveis.
Teorema 164 (Lagrange). Seja Y um espa co vetorial normado e
I, G aplica c oes de Y em R. Suponha que as varia c oes de G ateaux
I(y, v), G(y, v) est ao bem denidas para y, v Y e ainda que, para
cada y, v Y tenhamos I(y
n
, v) I(y, v), G(y
n
, v) G(y, v) sem-
pre que y
n
y em Y .
4
Se y e um mnimo local de I sujeito ` a restri c ao
G(y) = 0, ent ao ou G( y, ) 0, em Y ou existe um multiplicador
R, tal que
I( y, v) = G( y, v), v Y.
Demonstra c ao: Veja [Tr, Captulo 5].
Na realidade, o teorema acima continua valido se exigimos con-
tinuidade fraca de I e G apenas em y. Uma conseq uencia imediata do
teorema de Lagrange e que os conjuntos de nvel y Y ; I(y) = I( y) e
y Y ; G(y) = 0 possuem o mesmo hiperplano tangente em y.
Tratamos a seguir dos problemas variacionais com restri c oes isope-
rimetricas (ou integrais). Considere o problema
(9.5)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
;
F(y) :=
_
b
a
G(t, y(t), y
t
(t)) dt = c ;
onde L, G C
1
([a, b] R
2
; R) e y
a
, y
b
, c R s ao dados. Como con-
seq uencia imediata do teorema de Lagrange, obtemos o seguinte resul-
tado:
4
Tal propriedade e denominada continuidade fraca da varia c ao de G ateaux.
steuer
2008/3/11
page 198
i
i
i
i
i
i
i
i
198 [CAP. 9: C
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
([a, b]; R
n
) [ y(a) = y
a
, y(b) = y
b
;
G(t, y(t)) = 0, t [a, b] ;
onde L : [a, b] R
2n
R, G : [a, b] R
n
R e y
a
, y
b
R
n
s ao dados.
Note que no caso particular n = 1, o problema de minimiza c ao perde o
sentido, pois a restri c ao G(t, y(t)) = 0 na maioria dos casos determina y
completamente.
Teorema 166. Sejam L C
2
([a, b] R
2n
; R), G C
2
([a, b] R
n
; R)
com G
y
(t, y) ,= 0. Se y Y
ad
e um mnimo local fraco de I em Y
ad
sujeito ` a restri c ao lagrangeana G(t, y(t)) = 0, t [a, b], ent ao existe
uma fun c ao (multiplicador) C[a, b], tal que
d
dt
[L +G]
y
= [L +G]
y
, t (a, b).
Demonstra c ao: Seja (a, b). Como G
y
(, y()) ,= 0, ent ao para pelo
menos um ndice 1 j n, temos G
y
j
(, y()) ,= 0. Por conveniencia
representamos y R
n
por (y
j
, Y ), onde y
j
e a j-esima componente de
y e Y R
n1
e o vetor contendo as demais componentes.
5
O teorema
5
Em particular temos y(t) = ( y
j
(t),
Y (t)).
steuer
2008/3/11
page 199
i
i
i
i
i
i
i
i
[SEC. 9.2: PROBLEMAS VARIACIONAIS COM RESTRIC
AO 199
da fun c ao implcita (ver [Ru2] ou [Wa1]) garante a existencia de uma
fun c ao g C
2
(R R
n1
, R) denida em uma vizinhan ca de (,
Y ()),
tal que G(t, y) = 0 se e somente se y
j
= g(t, Y ). Sendo assim, podemos
reescrever (localmente) a restri c ao do problema (9.6) como: [c, d]
(a, b) com (c, d) e y
j
(t) = g(t, Y (t)), t [c, d].
Denindo o conjunto V := Y C
1
([a, b]; R
n1
) [ Y (t) =
Y (t), t ,
(c, d), podemos construir para cada Y V a fun c ao
y
j
(t) :=
_
g(t, Y (t)) , t (c, d)
y
j
(t) , t , (c, d)
obtendo assim y(t) := (y
j
(t), Y (t)) Y
ad
que obviamente satisfaz
G(t, y(t)) = 0, t [a, b]. Denimos agora o funcional
I : C
1
([a, b]; R
n1
) R
Y (t) I(g(, Y ), Y )
Por constru c ao, temos
I(Y ) =
_
b
a
L(t, y
j
, Y, y
t
j
, Y
t
) dt,
onde
y
j
(t) = g((t), Y (t)) e y
t
j
(t) = (d/dt) g((t), Y (t)) = g
t
(t, Y ) +g
Y
(t, Y )Y
t
.
Denindo
L(t, Y, Y
t
) := L(t, y
j
, Y, y
t
j
, Y
t
), podemos escrever
I(Y ) =
_
b
a
L(t, Y, Y
t
) dt =
_
d
c
L(t, Y, Y
t
) dt + const.,
para todo Y V . Como y e mnimo local do problema (9.6), ent ao
Y e
mnimo local de
I em V (por que?). Portanto,
Y satisfaz
(9.7)
d
dt
L
Y
=
L
Y
, t (c, d).
Por constru c ao, temos
L
Y
= L
y
j
g
Y
+ L
Y
e
L
Y
= L
y
j
g
Y
+ L
Y
+
L
y
j
[g
t
+g
Y
Y
t
]
Y
. Substituindo em (9.7), temos
(9.8)
d
dt
[L
y
j
g
Y
+ L
Y
] = L
y
j
g
Y
+ L
Y
+ L
y
j
[g
t
+g
Y
Y
t
]
Y
, t (c, d).
steuer
2008/3/11
page 200
i
i
i
i
i
i
i
i
200 [CAP. 9: C
d
dt
L
y
j
+ L
y
j
_
g
Y
, t (c, d).
Como G(t, g(t, Y ), Y ) 0 em uma vizinhan ca de (,
Y ()), temos que
G
y
j
(t, g(t, Y ), Y )g
Y
+G
Y
(t, g(t, Y ), Y ) = 0.
Logo, para qualquer fun c ao C[c, d], temos
d
dt
[L +G]
Y
[L +G]
t
Y
=
d
dt
L
Y
L
Y
G
Y
=
d
dt
L
Y
L
Y
+ G
y
j
g
Y
=
_
d
dt
L
y
j
+ L
y
j
+ G
y
j
_
g
Y
.
A escolha (t) = [(d/dt) L
y
j
L
y
j
]/G
y
j
C[c, d] (lembre que G
y
j
,= 0
em [c, d]) nos fornece a equa c ao
(9.9)
d
dt
[L +G]
Y
[L +G]
t
Y
= 0, t (c, d).
Provamos assim que para essa escolha de multiplicador, a equa c ao de
EulerLagrange e satisfeita em uma vizinhan ca de t = . Como
(a, b) e arbitrario, concluimos que o teorema e valido localmente no
intervalo (a, b).
Note que e possvel cobrir o intervalo compacto [a, b] com uma
famlia nita de subintervalos, tais que em cada um deles, G
y
j
,= 0
para algum j. A escolha do multiplicador em cada subintervalo de-
pende apenas deste fato, o que justica a conclus ao de que e possvel
escolher C[a, b], de modo que (9.9) seja satisfeita em todo intervalo
(a, b).
Observa cao 167.
E possvel formular o problema (9.6) com G =
G(t, y, y
t
) e, ainda assim, obter um resultado analogo ao apresentado
no Teorema 166. A verica c ao deste resultado mais geral pode ser en-
contrada, e.g., em [Tr, Captulo 11]. 2
O interesse no estudo dos problemas (9.2), (9.5) e (9.6) para a teoria
de controle otimo, deve-se ao fato de diversas famlias de problemas
steuer
2008/3/11
page 201
i
i
i
i
i
i
i
i
[SEC. 9.2: PROBLEMAS VARIACIONAIS COM RESTRIC
AO 201
possurem equa c ao de din amica da forma: z
t
(t) = u(t); ou ainda z
t
(t) =
f
1
(t, z) +f
2
(t, z)u(t), com f
2
(t, z) ,= 0. Neste caso, e possvel reescrever
os problemas de controle otimo como problemas variacionais e assim
utilizar as condi c oes necessarias apresentadas nesta sec c ao.
Nos exemplos a seguir, apresentamos alguns problemas variacionais
e de controle otimo sujeitos a restri c oes como aquelas discutidas acima.
A analise dos problemas e conduzida nos exerccios ao nal do captulo.
Exemplo 168. Considere o problema variacional da Braquistocrona
_
_
_
Minimizar I(y) :=
_
T
0
_
1 +y
t
(t)
2
/
ydt
sujeito a y Y
ad
:= y C
1
[0, T] [ y(0) = 0,
T > 0, (T, y(T)) = 0,
onde a condi c ao de contorno nal e descrita pela curva de nvel zero da
fun c ao continuamente diferenciavel : R R (t, y) (t, y) R.
2
Exemplo 169. Considere o problema de controle
_
_
_
Minimizar I(z, u) :=
_
1
0
u(t)
4/3
dt
sujeito a z
t
= u, t (0, 1);
z(0) = 5/4, z(1) = 5 ;
_
1
0
tz
t
(t)dt = 5.
O prolema variacional correspondente e
_
_
_
Minimizar I(y) :=
_
1
0
y
t
(t)
4/3
dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 5/4, y(1) = 5,
_
1
0
G(t, y, y
t
)dt = 5,
onde o integrando da restri c ao isoperimetrica e dado pela fun c ao
G(t, y, y
t
) = ty
t
. 2
Exemplo 170. Considere os prolemas variacionais
_
_
_
Minimizar I(y) :=
_
1
0
[y
t
(t)
2
+y(t)y
t
(t)
4
]dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 1, y(1) = 0, y(t) 0 ;
F(y) :=
_
1
0
ty
t
(t)
4
dt = 1/2
e
_
_
_
Minimizar I(y) :=
_
1
0
[y
t
(t)
2
+y(t)y
t
(t)
4
]dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 1, y(1) = 0, y(t) 0 ;
G(t, y, y
t
) := (y
t
)
4
1 0.
Note que o primeiro problema e formulado com uma restri c ao isoperi-
metrica, enquanto que o segundo com uma restri c ao lagrangeana. 2
steuer
2008/3/11
page 202
i
i
i
i
i
i
i
i
202 [CAP. 9: C
_
Minimizar I(z) :=
_
t
1
t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
sujeito a
A(t, z(t)) z
t
(t) B(t, z(t)), t [t
0
, t
1
] ;
z(t
0
) = z
0
, z(t
1
) = z
1
.
Note que no problema (9.10) s ao feitas restri c oes sobre a derivada das
fun c oes admissveis. Importante na analise a seguir e o fato de L(t, z, z
t
)
ser uma fun c ao am na variavel z
t
. Observe ainda que o problema (9.10)
pode ser interpretado como decorrente do seguinte problema de controle
otimo
_
_
Minimizar I(z) :=
_
t
1
t
0
[L
1
(t, z(t)) + L
2
(t, z(t))u(t)] dt
sujeito a
z
t
= g(t, z) +f(t, z)u(t), t [t
0
, t
1
] ;
z(t
0
) = z
0
, z(t
0
) = z
1
, u(t) := [u
m
, u
M
].
De fato, explicitando u em fun c ao de z e z
t
na equa c ao diferencial
(supondo f(t, z) ,= 0) e substituindo no funcional I, obtemos um pro-
blema como (9.10), onde
G(t, z) = L
1
(t, z) L
2
(t, z)
g(t, z)
f(t, z)
; H(t, z) = L
2
(t, z)
1
f(t, z)
;
A(t, z) = min
u(t)
g(t, z) +f(t, z)u ; B(t, z) = max
u(t)
g(t, z) +f(t, z)u.
steuer
2008/3/11
page 203
i
i
i
i
i
i
i
i
[SEC. 9.3: EXTREMAIS SINGULARES E TRAJET
ORIAS
OTIMAS 203
Suponha agora as aplica c oes G, H, A, B : [t
0
, t
1
]R R continuamente
diferenciaveis e dena o conjunto das trajetorias admissveis
Z
ad
:= z
C
1
[t
0
, t
1
] [ A(t, z(t)) z
t
(t) B(t, z(t)),
t [t
0
, t
1
]; z(t
0
) = z
0
, z(t
1
) = z
1
.
Esquecendo por um momento as restri c oes sobre a derivada das fun c oes
admissveis, o problema (9.10) pode ser escrito como um problema usual
do calculo das varia c oes:
_
_
_
Minimizar I(z) :=
_
t
1
t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
sujeito a z
C
1
[t
0
, t
1
], z(t
0
) = z
0
, z(t
1
) = z
1
.
A equa c ao de EulerLagrange associada a esse problema e
(9.11)
G
z
(t, z(t))
H
t
(t, z(t)) = 0, t (t
0
, t
1
).
Fazemos agora as seguintes hipoteses:
h1) Existe um extremal singular z
s
para o problema variacional, i.e.
uma fun c ao z
s
C
1
[t
0
, t
1
] que e solu c ao da equa c ao diferencial
(9.11) e satisfaz simultaneamente a restri c ao A(t, z
s
(t)) z
s
t
(t)
B(t, z
s
(t)), t (t
0
, t
1
).
6
h2) O extremal singular z
s
divide a faixa S := [t
0
, t
1
] R em duas
semi-faixas:
E
+
:= (t, z) [t
0
, t
1
] R [ z > z
s
(t),
E
:= (t, z) [t
0
, t
1
] R [ z < z
s
(t),
nas quais se verica:
G
z
(t, z)
H
t
(t, z) > 0, (t, z) E
+
,
G
z
(t, z)
H
t
(t, z) < 0, (t, z) E
.
6
Note que z
s
n ao pertence necessariamente a Z
ad
.
steuer
2008/3/11
page 204
i
i
i
i
i
i
i
i
204 [CAP. 9: C
ORIAS
OTIMAS 205
E
t
0
T
z
1
t
1
z
s
(t
0
)
z
s
z
0
z
1
z
D
Figura 9.2: Trajetoria admissvel que intercepta o extremal singular
z(t) :=
_
_
_
z(t) , t [t
0
,
1
)
z
s
(t) , t [
1
, ]
z(t) , t (, t
1
]
que e admissvel por constru c ao. Seja D E
+
a regi ao cuja fornteira
D e a curva de Jordan formada pelos segmentos
(t, z(t)), t [t
0
,
1
] ; (t, z
s
(t)), t [
1
, ] ; (t, z(t)), t [t
0
,
1
] ;
orientada no sentido anti-horario. Como z(t) = z(t), t , temos
I(z) I( z) =
_
t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
_
t
0
[G(t, z(t)) +H(t, z(t)) z
t
(t)] dt
=
_
D
[G(t, z) dt + H(t, z) dz]
=
_ _
D
_
G
z
H
t
_
(t, z) dz dt
(para obter a ultima igualdade utilizamos a formula de Green). Como
a hipotese (h2) implica que [
G
z
H
t
](t, z) > 0, para (t, z) E
+
, temos
ent ao
I(z) I( z) > 0,
quando
1
< . (Caso contrario obtemos apenas I(z) I( z) 0.)
Repetindo a argumenta c ao na extremidade t
1
do intervalo, obtemos
I(z) I( z).
steuer
2008/3/11
page 206
i
i
i
i
i
i
i
i
206 [CAP. 9: C
_
t
1
t
0
[G(t, z
s
) + H(t, z
s
)(z
s
)
t
] dt
=
_ _
D
_
G
z
H
t
_
(t, z) dz dt > 0,
onde D e a regi ao situada entre as curvas z e z, conforme a Figura 9.3
Observa cao 172. Caso uma das condi c oes de contorno n ao seja for-
necida, por exemplo z(t
1
) = z
1
, obtemos em seu lugar a condi c ao de
contorno natural (veja Observa c ao 132)
L
y
(t
1
, z(t
1
), z
t
(t
1
)) = H(t
1
, z(t
1
)) = 0.
Neste caso, mesmo que a condi c ao H(t
1
, z(t
1
)) = 0 dena z(t
1
) de forma
unica, e ainda possvel aplicar o Teorema 171. 2
Observa cao 173. O Teorema 171 garante que a trajetoria otima para
o problema e da forma bangsingularbang.
steuer
2008/3/11
page 207
i
i
i
i
i
i
i
i
[SEC. 9.4: CONTROLE
OTIMO E CONVEXIDADE: CONDIC
OES SUFICIENTES 207
No caso particular em que o extremal satisfa ca z
s
(t
0
) = z
0
ou
z
s
(t
1
) = z
1
, as trajetorias otimas s ao do tipo singularbang e bang
singular, respectivamente. 2
9.4 Controle
Otimo e Convexidade: condic oes
sucientes
Continuamos nesta sec c ao a analogia iniciada na Sec c ao 9.3 entre os
problemas de calculo variacional e os problemas de controle otimo. Nosso
objetivo e mostrar que, sob certas hipoteses de convexidade, a equa c ao
de EulerLagrange fornece condi c oes sucientes para determinar a es-
trategia otima de problemas de controle, que n ao possuem restri c ao nas
variaveis de controle.
_
Minimizar I(z, u) :=
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a z
C
1
([t
0
, t
1
]; R
n
) ; u
C([t
0
, t
1
]; R
m
) ;
z
t
(t) = f(t, z, u), t (t
0
, t
1
) ;
z(t
0
) = z
0
, z(t
1
) = z
1
;
onde os tempos inicial e nal t
0
, t
1
s ao xos, L : [t
0
, t
1
] R
n
R
m
R,
f : [t
0
, t
1
] R
n
R
m
R
n
, z
0
, z
1
R
n
s ao dados. O conjunto das
trajetorias admissveis e dado por
Z
ad
:= z
C
1
([t
0
, t
1
]; R
n
) [ z(t
0
) = z
0
, z(t
1
) = z
1
.
Como n ao s ao feitas restri c oes `as variaveis de controle em (9.13), o con-
junto dos controles admissveis e simplesmente U
ad
:=
C([t
0
, t
1
]; R
m
).
Os candidatos `a solu c ao do problema de otimiza c ao restrita (9.13)
s ao os processos admissveis (z, u) Z
ad
U
ad
. Podemos ent ao consi-
derar o problema (9.13) como um problema do calculo variacional com
restri c oes lagrangeanas
(9.14)
_
_
_
Minimizar I(z, u)
sujeito a (z, u) Z
ad
U
ad
G(t, z, u) = f(t, z, u) z
t
= 0, t (t
0
, t
1
) ;
steuer
2008/3/11
page 208
i
i
i
i
i
i
i
i
208 [CAP. 9: C
I(z, u, ) :=
_
t
1
t
0
t
(t) = H
z
(t, z, u, ) e 0 = H
u
(t, z, u, ).
Note ainda que a equa c ao de evolu c ao do problema (9.13) z
t
= f(t, z, u)
(que e a restri c ao lagrangeana do problema (9.14)) pode ser reescrita
como z
t
= H
(t, z, u, ).
Observe que as condi c oes de WeierstraErdmann, que dizem res-
peito a continuidade das aplica c oes
L
z
(t, z, u) = (t) e
L
u
(t, z, u) = 0,
s ao trivialmente satisfeitas devido `as hipoteses de regularidade do mul-
tiplicador .
A pergunta que investigamos nesta sec c ao e a seguinte: As condi c oes
z
t
(t) = H
(t, z, u, ),
t
(t) = H
z
(t, z, u, ) e H
u
(t, z, u, ) = 0
7
A componente da equa c ao de EulerLagrange relativa ao multiplicador e sim-
plesmente a restri c ao G(t, z, u) 0 do problema (9.14), como o leitor pode facilmente
vericar.
steuer
2008/3/11
page 209
i
i
i
i
i
i
i
i
[SEC. 9.4: CONTROLE
OTIMO E CONVEXIDADE: CONDIC
OES SUFICIENTES 209
s ao sucientes para caracterizar um mnimo local (ou global) do proble-
ma (9.13)? A resposta e sim, desde que fa camos hipotesees adequadas
sobre a convexidade da fun c ao de Hamilton. Na Sec c ao 9.5 investigamos
a suciencia destas mesmas condi c oes.
A analise conduzida neste captulo utiliza argumentos elementares,
devido ao fato de supormos convexidade parcial da fun c ao de Hamil-
ton, em rela c ao as variaveis z e u. No captulo seguinte analisamos o
papel das condi c oes acima em rela c ao `a otimalidade da solu c ao de um
problema de controle generico.
Teorema 174. Seja L C
1
([t
0
, t
1
] R
n
R
m
; R), f C
1
([t
0
, t
1
]
R
n
R
m
; R
n
). Suponha que a fun c ao de Hamilton H satisfaz
(9.15)
H(t, z +v, u+w, ) H(t, z, u, ) H
z
(t, z, u, ) v +H
u
(t, z, u, ) w,
v R
n
, w R
m
em [t
0
, t
1
] R
n
R
m
R
n
. S ao verdadeiras as arma c oes:
a) Se ( z, u,
)
C
1
([t
0
, t
1
]; R
n
)
C([t
0
, t
1
]; R
m
)
C
1
([t
0
, t
1
]; R
n
) e
solu c ao de
(9.16)
_
_
_
z
t
(t) = H
(t, z, u, ),
t
(t) = H
z
(t, z, u, ),
H
u
(t, z, u, ) = 0, t (t
0
, t
1
),
z(t
0
) = z
0
, z(t
1
) = z
1
,
ent ao ( z, u) e mnimo global de I em Z
ad
U
ad
sujeito ` a restri c ao
lagrangeana G(t, z, u) = f(t, z, u) z
t
= 0, t [t
0
, t
1
].
b) Caso a igualdade em (9.15) ocorra se e somente se [v[[w[ = 0,
ent ao o processo ( z, u) no item a) e o unico mnimo global de I
em Z
ad
U
ad
.
Demonstra c ao: Da hipotese (9.16) segue imediatamente que ( z, u)
Z
ad
U
ad
e ainda que G(t, z, u) 0 em [t
0
, t
1
]. Seja (z, u) Z
ad
U
ad
um processo admissvel satisfazendo a restri c ao G(t, z, u) 0. Temos
steuer
2008/3/11
page 210
i
i
i
i
i
i
i
i
210 [CAP. 9: C
)
I( z, u,
)
=
_
t
1
t
0
[H(t, z, u,
) H(t, z, u,
)
(t)(z
t
(t) z
t
(t))] dt
_
t
1
t
0
[H
z
(t, z, u,
)(z z) +H
u
(t, z, u,
)(u u)
(z z)
t
] dt
=
_
t
1
t
0
[
t
(z z)
t
(z z)
t
] dt
= [
(z z)]
t
1
t
0
= 0,
provando o item a). Quanto ao item b), basta observar que, se (z, u) ,=
( z, u) e outro processo admissvel satisfazendo a restri c ao G(t, z, u)
0, ent ao (9.17) e obtida com desigualdade estrita, provando assim que
I(z, u) I( z, u) > 0.
Observa cao 175. Caso a condi c ao de contorno z(t
1
) = z
1
n ao seja
fornecida, o conjunto das trajetorias admissveis correspondente e Z
ad
:=
z
C
1
([t
0
, t
1
]; R
n
) [ z(t
0
) = z
0
e o Teorema 174 continua valido se
substituimos a condi c ao de contorno z(t
1
) = z
1
em (9.16) pela condi c ao
natural (t
1
) = 0.
Analogamente, se a condi c ao de contorno nal para o problema (9.13)
for da forma (z(t
1
)) = 0, onde a aplica c ao : R
n
R
p
satisfaz ,= 0,
o conjunto das trajetorias admissveis correspondente e Z
ad
:= z
C
1
([t
0
, t
1
]; R
n
)[ z(t
0
) = z
0
, (z(t
1
)) = 0.
Neste caso, o Teorema 174 continua valido se substituimos a condi c ao
z(t
1
) = z
1
em (9.16) pela condi c ao natural de transversalidade (t
1
) =
z
(z(t
1
)) para R
p
e pela exigencia que (z) : R
n
R seja uma
fun c ao convexa. De fato, Se (z, u) Z
ad
U
ad
satisfaz G(t, z, u) 0,
denimos
1(z, u, , ) :=
I(z, u, ) + (z(t
1
)) e obtemos
I(z, u) I( z, u) =
1(z, u,
, )
1( z, u,
, )
[
(z z)]
t
1
t
0
+ (z(t
1
)) ( z(t
1
))
[
(z z)]
t
1
t
0
+
z
( z(t
1
)) [z(t
1
) z(t
1
)]
= [
(t
1
) +
z
( z(t
1
))] [z(t
1
) z(t
1
)] = 0.
Para obter a ultima das desigualdade acima usamos a convexidade de
steuer
2008/3/11
page 211
i
i
i
i
i
i
i
i
[SEC. 9.5: CONTROLE
OTIMO E CONVEXIDADE: CONDIC
OES NECESS
ARIAS 211
(z). Note que R
p
e o multiplicador associado com a restri c ao
(z(t
1
)) = 0. 2
Das hipoteses do Teorema 174 conclumos que, xados os valores
de t, z, , a fun c ao H(t, z, , ) : R
m
R e convexa, no sentido da
Deni c ao 125. De fato, tomando v = 0 em (9.15), temos
H(t, z, u +w, ) H(t, z, u, ) H
u
(t, z, u, ) w, u, w R
m
.
Logo, uma conseq uencia da condi c ao H
u
(t, z(t), u(t),
(t)) = 0, t
(t
0
, t
1
) em (9.16) e que u(t) e um mnimo local de H(t, z(t), ,
(t)),
para cada t (t
0
, t
1
), fato que pode ser escrito na forma
(9.18) H(t, z(t), u(t),
(t)) = min
uR
m
H(t, z(t), u,
(t)), t (t
0
, t
1
).
A condi c ao expressa em (9.18), que e conseq uencia do pacote de condi-
c oes sucientes (9.16), e extremamente importante na teoria de controle
otimo. Na Sec c ao 9.5, ainda utilizando a hipotese de convexidade parcial
da fun c ao de Hamilton, provamos que esta condi c ao e tambem necessaria
para otimalidade de solu c oes do Problema 9.13. A verica c ao da neces-
sidade dessa condi c ao e, no caso geral, tecnicamente mais complicada e
e discutida no Captulo 10.
A condi c ao (9.18) e denominada condi c ao de m aximo (ou condi c ao
de otimalidade), apesar de ser aqui apresentada na forma de mnimo.
Isto, entretanto, deve-se t ao somente `a natureza do problema de controle
otimo a ser estudado, cujo objetivo pode ser tanto maximizar quanto
minimizar o funcional I. A primeira apresenta c ao formal deste resultado
foi feita em [PBG].
9.5 Controle
Otimo e Convexidade: condic oes
necessarias
Vericamos nesta sec c ao que as condi c oes propostas em (9.16) e em
especial a condi c ao de maximo (9.18) s ao, sob hipoteses adequadas,
necessarias para otimalidade de solu c oes do problema de controle otimo
(9.13). Assim como nos problemas variacionais restritos, as condi c oes
necessarias s ao obtidas utilizando um teorema de multiplicadores.
Suponha que, xados (t, z, ) RR
n
R
n
, a aplica c ao H(t, z, , ) :
R
m
R e convexa (utilizamos a nota c ao da Sec c ao 9.4). Seja ( z, u)
steuer
2008/3/11
page 212
i
i
i
i
i
i
i
i
212 [CAP. 9: C
C
0
C
1
0
,
sabemos que a varia c ao
I( z, u,
;
1
,
2
,
3
)
=
_
t
1
t
0
[
1
(L
z
+
f
z
)
t
1
+
2
(L
u
+
f
u
) +
3
(f z
t
)] dt
=
_
t
1
t
0
[
1
(L
z
+
f
z
+
t
) +
2
(L
u
+
f
u
) +
3
(f z
t
)] dt
sempre se anula. Sendo assim, escolhendo
1
=
2
0 e
3
C
1
0
[t
0
, t
1
]
qualquer, obtemos a equa c ao de estado
z
t
(t) = f(t, z, u), t (t
0
, t
1
).
Tomando
1
C
0
[t
0
, t
1
] qualquer e
2
0, obtemos a equa c ao adjunta
t
= L
z
(t, z, u)
f
z
(t, z, u), t (t
0
, t
1
).
Tomando agora
2
C
0
[t
0
, t
1
] qualquer, obtemos a equa c ao de otimali-
dade
0 = L
u
(t, z, u) +
f
u
(t, z, u) = H
u
(t, z, u,
), t (t
0
, t
1
).
Como z satisfaz por constru c ao as condi c oes de contorno do problema
(9.13), conclumos que ( z, u,
(t, z, u, ),
t
(t) = H
z
(t, z, u, ), t (t
0
, t
1
),
z(t
0
) = z
0
, z(t
1
) = z
1
,
steuer
2008/3/11
page 213
i
i
i
i
i
i
i
i
EXERC
ICIOS 213
y
(t, y) = 0
t
Figura 9.4: Condi c ao de transversalidade para a Braquistocrona
e ainda, o controle otimo u satisfaz a condi c ao de m aximo
H(t, z(t), u(t),
(t)) = min
uR
m
H(t, z(t), u,
(t)), t (t
0
, t
1
).
Exerccios
9.1. Considere o problema do Exemplo 168 (veja Figura 9.4).
a) Verique que a solu c ao do problema necessariamente satisfaz a
condi c ao transversal
L
y
= L
y
[
t
+
y
y
t
],
onde L(t, y, y
t
) :=
_
1 + (y
t
)
2
/
y.
b) Conclua do item a) que a cicloide, unindo a origem `a curva de nvel,
satisfaz
y
=
t
y
t
, i.e. a cicloide intercepta ortogonalmente a curva de
nvel.
c) Formule o problema de controle correspondente.
9.2. Considere o problema do Exemplo 169.
a) Calcule o multiplicador de Lagrange (escalar) correspondente e en-
contre a solu c ao do problema variacional.
b) Encontre a trajetoria otima para o problema de controle e o controle
otimo correspondente.
steuer
2008/3/11
page 214
i
i
i
i
i
i
i
i
214 EXERC
ICIOS
9.3. Considere os problemas do Exemplo 170.
a) Formule os problemas de controle correspondentes.
b) Verique que cada um dos problemas variacionais possui como unica
solu c ao y(t) = 1 t e que os respectivos multiplicadores de Lagrange
s ao dados por = 3/4 e (t) = 3/4t.
9.4. Verique os detalhes da demonstra c ao do Teorema 165.
9.5. Encontre a solu c ao do problema
_
_
_
Minimizar I(z, u) :=
_
1
0
u
2
(t)dt
s.a. z
t
= 2z +u, t (0, 1);
z(0) = 1, z(1) = 0.
A solu c ao encontrada e unica?
9.6. Encontre a solu c ao do problema
_
_
_
Minimizar I(z, u) :=
_
1
0
(2 5t)u(t)dt
s.a. z
t
= 2z + 5e
2t
u, t (0, 1);
z(0) = 0, z(1) = e
2
; [u(t)[ 1, t [0, 1].
a) A solu c ao encontrada e unica?
b) Considere o problema anterior com a din amica z
t
= 2z + 4e
2t
u.
Encontre a solu c ao.
(Sugest ao: Utilize a fun c ao auxiliar v(t) := e
2t
z(t).)
9.7. Considere o problema
_
_
_
Minimizar I(z, u) :=
_
1
0
(u(t) + 1)dt
s.a. z
t
= u, t (0, 1);
z(0) = z(1) = 0.
Mostre que cada controle u
C[0, 1], que satisfaz
_
1
0
u(t)dt = 0, e otimo
para o problema.
9.8. Encontre a solu c ao do problema
_
_
_
Minimizar I(z, u) :=
_
1
0
[u
2
(t) 2u(t)]dt
s.a. z
t
= t[u[, t (0, 1);
z(0) = 0;
_
1
0
z
t
(t)dt
1
6
.
steuer
2008/3/11
page 215
i
i
i
i
i
i
i
i
EXERC
ICIOS 215
9.9. Encontre a solu c ao do problema
_
_
_
Minimizar I(z, u) :=
_
1
0
[z
t
(t) 2t + 1]
2
dt
s.a. z
t
= u, t (0, 1);
z(0) = z(1) = 0; z(t) 0.
9.10. Considere o problema escalar
_
Minimizar
_
1
0
[3z(t)
2
+u(t)
2
]dt
s.a. z
t
= z +u, t (0, 1), z(0) = 1.
a) Obtenha o problema variacional correspondente.
b) Encontre a equa c ao de EulerLagrange e as condi c oes de contorno
correspondentes.
c) Determine o controle otimo.
steuer
2008/3/11
page 216
i
i
i
i
i
i
i
i
Captulo 10
Princpio do Maximo
Neste captulo e analisado um conjunto de condi c oes necessarias para
otimalidade de solu c oes de problemas de controle otimo. Tal resultado e
conhecido na literatura como princpio do m aximo
1
e muito se assemelha
a um teorema de multiplicadores de Lagrange, formulado em espa cos de
dimens ao innita.
Como vimos na Sec c ao 9.5, com hipoteses adicionais de convexidade,
o princpio do maximo pode ser demonstrado utilizando-se argumentos
elementares de analise. Em particular, a condi c ao de maximo (9.18) e
obtida a partir da equa c ao de EulerLagrange. No caso geral (sem a
hipotese de convexidade da Hamiltoniana), a demonstra c ao da necessi-
dade da condi c ao de maximo e mais complicada e necessita de alguns
resultados oriundos da teoria de otimiza c ao em espa cos de dimens ao
innita (veja Apendice B).
A autoria do princpio do maximo e controversa. A maioria dos au-
tores credita a condi c ao (9.18) ao grupo liderado pelo matematico russo
L.S. Pontryagin (1956). Entretanto, tal condi c ao pode ser encontrada
em um texto anterior, porem pouco divulgado, de M.R. Hestenes (1950).
Para maiores detalhes consulte [Hes], [PBG], assim como o artigo de
Hestenes
2
em [BaNe].
O captulo e organizado da seguinte forma: Na Sec c ao 10.1 apre-
sentamos o princpio do maximo para problemas de controle otimo com
horizonte nito. Algumas variantes do resultado, correspondentes a di-
ferentes condi c oes de contorno, s ao tambem analisadas nesta sec c ao. Na
1
Tambem conhecido como princpio do mnimo, ou princpio de Pontryagin.
2
Hestenes, M.R., Variational theory and optimal control theory, 1 22
steuer
2008/3/11
page 217
i
i
i
i
i
i
i
i
[SEC. 10.1: PROBLEMAS COM HORIZONTE FINITO 217
Sec c ao 10.2 consideramos o princpio do maximo para problemas com
horizonte innito. Na Sec c ao 10.3 s ao discutidas diversas aplica c oes,
nas quais o princpio do maximo e utilizado na identica c ao de proces-
sos otimos.
10.1 Problemas com Horizonte Finito
Come camos por discutir uma formula c ao bastante geral para proble-
mas de controle otimo com horizonte nito. Considere o problema de
controle
P(t
0
, z
0
)
_
_
Minimizar J(z, u) := L
1
(t
1
, z(t
1
)) +
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a
t
1
t
0
; u L
1
([t
0
, t
1
]; R
m
), u(t) q.s. em [t
0
, t
1
] ;
z(t)=z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t[t
0
, t
1
] ; (t
1
, z(t
1
))=0
onde
L : [t
0
, ) R
n
R
m
R, L
1
: [t
0
, ) R
n
R,
f : [t
0
, ) R
n
R
m
R
n
, : [t
0
, ) R
n
R
p
e R
m
. O tempo inicial t
0
e a condi c ao inicial z
0
s ao fornecidos,
enquanto que o tempo nal t
1
e a condi c ao nal s ao, a princpio, desco-
nhecidos.
Note que o fato da din amica do sistema ser descrita por uma equa c ao
integral ao inves de diferencial, permite-nos considerar trajeorias ad-
missveis menos regulares. O conjunto das estrategias de controle ad-
missveis e
|
ad
:= L
1
loc
([0, ); R
m
).
Desta forma, as trajetorias correspondentes s ao fun c oes absolutamente
contnuas em [t
0
, t
1
].
Deni cao 177. Sejam f, L as fun c oes denidas acima. A aplica c ao
H : [t
0
, ) R
n
R
n
R
m
R,
(t, z, , u) , f(t, z, u)) + L(t, z, u)
e denominada fun c ao de Hamilton (note que a origem da constante
precisa ainda ser esclarecida). 2
steuer
2008/3/11
page 218
i
i
i
i
i
i
i
i
218 [CAP. 10: PRINC
IPIO DO M
AXIMO
No teorema a seguir apresentamos o princpio do m aximo. Por ser
longa e tecnica, a demonstra c ao e apresentada no Apendice B. A argu-
menta c ao utilizada na demontra c ao segue a linha das notas de aula de
M. Brokate (veja [Br]).
Como referencias auxiliares o leitor pode consultar [PBG], [Hes],
[Ber], [Know], [MaSt], [Za], entre outros. A obten c ao do princpio do
maximo para problemas com tempo nal xo (t
1
= T conhecido) e mais
simples, podendo ser encontrada em [FlRi, Captulo 2], [Ho, Captulo 9]
ou [Tr, Teorema 11.8]. Uma demonstra c ao alternativa baseada em ar-
gumentos de programa c ao din amica e apresentada na Sec c ao 13.4.
Teorema 178. Suponha que L, f s ao aplica c oes C
2
e que L
1
, s ao
C
1
. Se ( z, u,
t
1
) e uma solu c ao do problema P(t
0
, z
0
), tal que
z
(
t
1
, z(
t
1
)) ,= 0 e (L
1
)
z
(
t
1
, z(
t
1
)) ,= 0,
ent ao existe uma fun c ao : [t
0
,
t
1
] R
n
e constantes 0, R
p
que satisfazem:
i) Equa c ao de estado
z(t) = z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t [t
0
,
t
1
] ;
ii) Equa c ao adjunta
_
_
(t) =
1
+
_
t
1
t
H
z
(s, z(s), (s), u(s)) ds, t [t
0
,
t
1
],
1
:=
L
1
z
(
t
1
, z(
t
1
))
z
(
t
1
, z(
t
1
))
;
iii) Equa c ao de evolu c ao da fun c ao de Hamilton
_
_
H(t, z(t), (t), u(t)) = H
1
_
t
1
t
H
t
(s, z(s), (s), u(s)) ds, t [t
0
,
t
1
],
H
1
:=
L
1
t
(
t
1
, z(
t
1
)) +
_
t
(
t
1
, z(
t
1
)),
_
;
iv) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [t
0
,
t
1
] ;
v) Condi c ao de n ao acoplamento +[[ ,= 0.
Demonstra c ao: Veja Apendice B.
steuer
2008/3/11
page 219
i
i
i
i
i
i
i
i
[SEC. 10.1: PROBLEMAS COM HORIZONTE FINITO 219
A demonstra c ao do Teorema 178 constitui-se na aplica c ao de um
teorema de multiplicadores a um problema auxiliar, obtido de P(t
0
, z
0
)
por uma mudan ca de variaveis denominada transforma c ao no tempo e
cuja solubilidade esta relacionada a de P(t
0
, z
0
). As constantes e
surgem na demonstra c ao como componentes de um vetor normal a um
hiperplano, que separa conjuntos de nvel associados `a fun c ao objetivo
J e `a condi c ao nal (t, z(t)) = 0.
Observa cao 179. A denomina c ao princpio do m aximo e motivada
pelo item iv) do Teorema 178, que, entretanto, refere-se `a determina c ao
de um mnimo. Note, porem, que a elementar substitui c ao de J por
J permite-nos trocar o problema de minimiza c ao por um de maxi-
miza c ao, alterando assim o min da condi c ao iv) para max. Sem d uvida,
as condi c oes mais interessantes do Teorema 178 s ao
_
_
_
z
t
= H
t
= H
z
(t, z, , u), (t
1
) =
L
1
z
(t
1
, z(t
1
))
z
(t
1
, z(t
1
))
;
H(t, z, , u) = min
w
H(t, z(t), (t), w), q.s. em [t
0
, t
1
] .
Note que o par (z, ) e solu c ao de um sistema hamiltoniano para a
fun c ao H. 2
Observa cao 180. Analogamente aos problemas variacionais, os pro-
blemas de controle otimo tambem podem ser formulados com diferentes
tipos de condi c oes de contorno. A cada um destes tipos corresponde uma
variante do Teorema 178, que se diferencia deste apenas pelas condi c oes
de contorno da variavel adjunta e da fun c ao de Hamilton. Enunci-
amos a seguir algumas variantes do problema P(t
0
, z
0
) que surgem com
maior freq uencia nas aplica c oes. Apresentamos tambem as condi c oes
necessarias correspondentes para cada problema.
Considere o problema P(t
0
, z
0
) com t
1
xo (t
1
> t
0
) e L
1
0.
Se a condi c ao nal e xada (z(t
1
) = z
1
), n ao ha nenhuma condi c ao
para (t
1
) (corresponde `a escolha (t, z) := (t t
1
, z z
1
) R
2
).
Se a condi c ao nal e livre (z(t
1
) qualquer), a variavel adjunta satisfaz
(t
1
) = 0 (corresponde `a escolha (t, z) := t t
1
R).
Se a condi c ao nal e da forma: z(t
1
) z
1
(no caso escalar), a variavel
adjunta satisfaz (t
1
) 0, ocorrendo a igualdade quando z(t
1
) > z
1
.
Considere o problema P(t
0
, z
0
) com L
1
0. Neste caso, as condi c oes
steuer
2008/3/11
page 220
i
i
i
i
i
i
i
i
220 [CAP. 10: PRINC
IPIO DO M
AXIMO
para (t
1
) discutidas acima n ao se alteram e, alem disso,
H(t
1
, z(t
1
), (t
1
), u(t
1
)) = 0 .
Esta equa c ao extra corresponde `a variavel adicional do problema, repre-
sentada pelo tempo nal desconhecido t
1
. 2
O princpio do maximo pode, em alguns casos, ser utilizado para
efetivamente determinar uma solu c ao do problema P(t
0
, z
0
). Para tanto,
aplica-se a seguinte estrategia: Inicialmente explicitamos o controle u em
fun c ao das variaveis z e , obtendo assim
u() = U
(, z(), ()) .
O proximo passo e substituir essa express ao no problema de valor de
contorno da Observa c ao 179 (eliminando a variavel u):
z
t
= H
(t, z, , U
), z(t
0
) = z
0
, (t
1
, z(t
1
)) = 0 ; (10.1)
t
= H
z
(t, z, , U
), (t
1
) =
L
1
z
(t
1
, z(t
1
)) (10.2)
z
(t
1
, z(t
1
))
;
H
t
=
H
t
(t, z, , U
) , (10.3)
H(t
1
, z(t
1
), (t
1
), U
(t
1
)) =
L
1
t
(t
1
, z(t
1
)) +
_
t
(t
1
, z(t
1
)),
_
Este sistema e ent ao resolvido, com o intuito de obter um candidato
`a solu c ao do problema de controle P(t
0
, z
0
). Entretanto, nem sem-
pre e possvel obter a representa c ao U
(, z, ) o extremal singular
na Sec c ao 9.3 e um exemplo e nesses casos fala-se da existencia de
uma estrategia de controle singular.
O sistema resultante de (10.1), (10.2), (10.3) pela substitui c ao u() =
U
(t, z, , 1, U
t
=
H
z
(t, z, , 1, U
(t, z, )), (t
0
) =
0
;
3. Aprimore a estimativa (p.ex. atraves do metodo de
Newton)
com o objetivo de satisfazer as equac~ oes
(t
1
, z(t
1
)) = 0, (t
1
) =
L
1
z
(t
1
, z(t
1
))
z
(t
1
, z(t
1
))
;
4. Retorne ao passo 2.
Figura 10.1: Algoritmo do metodo de shooting para sistema hamiltoni-
ano
grau de liberdade a mais. Note, porem, que a condi c ao de n ao acopla-
mento v) garante que e n ao s ao ambos nulos, sendo portanto sempre
possvel simplicar o sistema (10.1), (10.2), (10.3) em rela c ao a ou
a uma das componentes de . Sendo assim, o Teorema 178 pode ser
formulado alternativamente como:
. . . existem : [t
0
,
t
1
] R
n
, = 0 ou = 1, R
p
que satisfazem i),
. . . , v).
2
Observa cao 182.
E simples vericar que a equa c ao de EulerLagrange
do calculo variacional pode ser obtida do princpio do maximo. De
fato, o problema de minimiza c ao (7.2) do calculo variacional pode ser
interpretado como
_
_
_
Minimizar J(z, u) :=
_
b
a
L(t, z(t), u(t)) dt
sujeito a z
t
= u(t) .
steuer
2008/3/11
page 222
i
i
i
i
i
i
i
i
222 [CAP. 10: PRINC
IPIO DO M
AXIMO
Logo, a condi c ao de maximo iv) do Teorema 178 implica em
0 =
H
u
(t, z,
, u) =
u
[
, u) + L(t, z, u)] =
+
L
u
(t, z, u)
e, portanto,
(10.4)
=
L
u
(t, z, u) .
O sistema hamiltoniano para as variaveis de estado e adjunta se escreve
(10.5)
_
_
_
d z
dt
= +
H
= u
d
dt
=
H
z
=
L
z
(t, z, u)
De (10.4) e (10.5), temos
L
z
(t, z, u) =
d
dt
_
L
u
(t, z, u)
_
ou
L
z
(t, z, ( z)
t
)
d
dt
_
L
z
t
(t, z, ( z)
t
)
_
= 0 .
2
10.2 Problemas com Horizonte Innito
Analisamos nesta sec c ao condi c oes necessarias para problemas de
controle otimo com horizonte innito. Os problemas de controle dessa
natureza tem ganho import ancia nas ultimas decadas devido aos mo-
delos matematicos oriundos das ciencias econ omicas e biologicas que os
utilizam.
Os primeiros trabalhos a tratar de problemas de otimiza c ao com hori-
zonte innito s ao devidos aos economistas. Uma referencia classica e o
artigo escrito em 1928 por F. Ramsey (veja [Ra]), que trata de proble-
mas do tipo consumo investimento (veja Aplica c ao 190). A primeira
extens ao do princpio do maximo para problemas com horizonte innito
foi apresentada por H. Halkin em 1964 (veja [Ha]). Um apanhado do de-
senvolvimento da teoria pode ser encontrado em [CaHa]. Na abordagem
aqui apresentada, seguimos os passos descritos em [Leit], que utiliza um
conceito de otimalidade diferente dos encontrados em [Ha] e [CaHa].
steuer
2008/3/11
page 223
i
i
i
i
i
i
i
i
[SEC. 10.2: PROBLEMAS COM HORIZONTE INFINITO 223
In umeros modelos econ omicos (de horizonte nito e innito) s ao
tratados, sob a otica do controle otimo e programa c ao din amica, em
[SeSy]. Nesta referencia tambem s ao analisados problemas de explora c ao
de recursos naturais. O leitor interessado em aplica c oes desta natureza
deve consultar ainda [SeZh].
Aplica c oes a modelos biologicos podem ser encontradas em [Cl].
Um interessante problema relacionado `a explora c ao otima de recursos
biorenovaveis (pescaria otima) e analisado em [CCM], e [BaLe].
A seguir analisamos um caso particular do problema abordado na
Sec c ao 10.1. Trata-se de problemas de controle otimo com tempo nal
xo. A abordagem nesta sec c ao de tais problemas (de horizonte nito)
e justicada pelo fato das condi c oes necessarias para estes problemas
serem utilizadas na demonstra c ao do princpio do maximo para os pro-
blemas com horizonte innito.
Suponha que no problema P(t
0
, z
0
) o tempo nal t
1
= T e o estado
nal z
1
= z
T
s ao dados. Temos assim o seguinte problema de controle
otimo:
P
T
(z
0
)
_
_
Minimizar J(z, u) :=
_
T
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, T], z(T) = z
T
;
u L
1
([0, T]; R
m
), u(t) q.s. em [0, T] ;
Argumentando como na Observa c ao 180, obtemos um conjunto de con-
di c oes necessarias para otimalidade de uma solu c ao do problema P
T
(z
0
):
Corolario 183. Suponha que L, f s ao aplica c oes C
2
. Se ( z, u) e uma
solu c ao do problema P
T
(z
0
), ent ao existe uma fun c ao : [0, T] R
n
e
= 1 ou = 0 que satisfazem
i) Sistema hamiltoniano
_
_
_
( z)
t
(t) = H
t
(t) = H
z
(t, z, , u), q.s. em [0, T],
z(t
0
) = z
0
, z(T) = z
T
;
ii) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [0, T] ;
steuer
2008/3/11
page 224
i
i
i
i
i
i
i
i
224 [CAP. 10: PRINC
IPIO DO M
AXIMO
iii) Condi c ao de n ao acoplamento +||
,= 0.
Demonstra c ao: Segue imediatamente do Teorema 178 e da Observa-
c ao 180.
Analisamos agora os problemas com horizonte innito. Considere o
seguinte problema de controle otimo:
P
(z
0
)
_
_
Minimizar J(z, u) :=
_
0
e
t
L(z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(z(s), u(s)) ds, t [0, ) ;
u L
1
loc
([0, ); R
m
), u(t) q.s. em [0, ) ;
onde as fun c oes L : R
n
R
n
R, f : R
n
R
n
R
n
, o conjunto
R
m
e a constante > 0 s ao dados. Vericamos a seguir um resultado
que fornece condi c oes necessarias para otimalidade de uma solu c ao de
P
(z
0
).
Teorema 184. Suponha que L, f s ao aplica c oes C
2
. Se ( z, u) e uma
solu c ao de P
(z
0
), ent ao existe uma aplica c ao : [0, ) R
n
e cons-
tantes = 0 ou = 1,
0
R
n
que satisfazem:
i) Equa c ao de estado
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, ) ;
ii) Equa c ao adjunta
(t) =
0
+
_
t
0
H
z
(s, z(s), (s), u(s)) ds, t [0, ) ;
iii) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [0, ) .
Demonstra c ao: Seja ( z, u) um processo otimo para P
(z
0
). Dado
T > 0, as fun c oes e
t
L : [0, T] R
n
R
m
e f : [0, T] R
n
R
m
sa-
tisfazem as condi c oes do Corolario 183. Logo, este corolario nos fornece
condi c oes necessarias para otimalidade de cada problema
steuer
2008/3/11
page 225
i
i
i
i
i
i
i
i
[SEC. 10.2: PROBLEMAS COM HORIZONTE INFINITO 225
P
T
k
(z
0
)
_
_
Minimizar J(z, u) :=
_
T
k
0
e
t
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, T
k
],
z(T
k
) = z
k
:= z(T
k
) ;
u L
1
([0, T
k
]; R
m
), u(t) q.s. em [0, T
k
] ;
onde T
k
. Como consequencia do princpio de otimalidade de Bell-
man, temos que ( z, u)[
[0,T
k
]
e uma solu c ao de P
T
k
(z
0
). Juntando os fatos,
podemos garantir a existencia de
k
0,
k
: [0, T
k
] R
n
, tal que
|
k
|
+
k
> 0 ;
( z,
k
) e solu c ao do sistema Hamiltoniano
3
d z(t) = H
(t, z(t),
k
(t), u(t)) dt, t [0, T
k
]
d
k
(t) = H
x
(t, z(t),
k
(t), u(t)) dt, t [0, T
k
]
z(0) = z
0
, z(T
k
) = z
k
;
H(t, z(t),
k
(t), u(t)) = max
u
H(t, z(t),
k
(t), u), q.s. in [0, T
k
].
Considere agora a seq uencia
k
(0),
k
kN
. Normalizando os multi-
plicadores de Lagrange, podemos supor que [
k
(0)[ +
k
= 1, k N.
Tomando subseq uencias (se necessario), podemos garantir a existencia
de
0
R
n
e 0 satisfazendo
(10.6) [
0
[ + = 1, lim
k
k
(0) =
0
, lim
k
k
= .
Seja agora T > 0 xo. Logo T
k
> T, para k > k
0
e como o sis-
tema Hamiltoniano desfruta da propriedade de dependencia contnua
das condi c oes iniciais, podemos garantir que existe : [0, T] R
n
, tal
que
k
converge uniformemente para em [0, T]. Essa convergencia im-
plica nas desejadas condi c oes de otimalidade para o problema P
(x
0
),
uma vez que T > 0 e arbitrario.
Observa cao 185. Duas diferen cas basicas devem ser observadas na for-
mula c ao do Teorema 184 em rela c ao ao Teorema 178:
3
Note que H(t, z,
k
, u) =
k
, F(t, z, u)) +
k
L(t, z, u).
steuer
2008/3/11
page 226
i
i
i
i
i
i
i
i
226 [CAP. 10: PRINC
IPIO DO M
AXIMO
Falta uma condi c ao de contorno nal para a variavel adjunta (even-
tualmente uma condi c ao de decaimento do tipo lim
t
(t) = 0);
Falta a condi c ao de n ao acoplamento (neste caso +[
0
[ ,= 0). 2
Uma analise para problemas do tipo linear-quadratico com horizonte
innito e tambem possvel via programa c ao din amica (veja Captulo 12).
Atraves de um processo de limite, e possvel obter a fun c ao valor resol-
vendo-se a equa c ao algebrica de Riccati (veja [So, Captulo 7]).
10.3 Aplica c oes do Princpio do Maximo
Nesta sec c ao analisamos, `a luz do princpio do maximo, alguns pro-
blemas de controle otimo. Na Aplica c ao 186 e discutido formalmente o
problema de tempo mnimo introduzido na Sec c ao 1.2.3. A Aplica c ao 187
e uma extens ao da primeira. Nela e analisada uma famlia maior de
problemas, composta pelos denominados problemas de tempo mnimo
ate a origem.
Na Aplica c ao 188 o princpio do maximo e utilizado para vericar que
uma estrategia do tipo bang-bang e a unica estrategia otima existente
para um problema de alunissagem. Na Aplica c ao 189 consideramos um
problema com controle singular. Aqui, a solu c ao e obtida pelo princpio
do maximo, entretanto este problema pode tambem ser tratado seguindo
a linha apresentada na Sec c ao 9.3.
Na Aplica c ao 190 consideramos um modelo econ omico classico, que
foi formulado por F. Ramsey em 1928 (veja [Ra]). Utilizando a equa c ao
de EulerLagrange, obtemos a poltica otima para um problema de con-
sumo investimento com horizonte innito.
Em [BMS] podem ser encontradas diversas aplica c oes do princpio
do maximo a problemas aeroespaciais, dentre as quais citamos: Desenho
otimo de uma miss ao a Netuno; Ascenss ao otima de um veculo espacial
hipers onico; Alcance maximo de v oo para uma asa delta atravessan-
do uma termica. Em [Ho] s ao discutidas (entre outras) as seguintes
aplica c oes: Oscilador harm onico com custo de combustvel; controle de
epidemias; Pescaria otima; Contra c ao do ventrculo esquerdo do cora c ao;
Compra e venda de a c oes.
Aplica cao 186 (Tempo mnimo I). Considere a tarefa de encontrar
uma estrategia u (acelera c ao e frenagem) que permita levar, no menor
tempo possvel, um carro que se encontra na origem e em repouso, ate
steuer
2008/3/11
page 227
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 227
uma parede distante de uma unidade. Ao chegar na parede o carro deve
ter novamente velocidade nula.
Supondo que o carro de massa unitaria e desprezando os atritos,
temos o modelo:
x(t) = u(t), t [0,
t],
onde x(t) representa o deslocamento, x(t) a velocidade e x(t) a acelera c ao
do veculo no tempo t. As condi c oes de contorno s ao:
x(0) = 0, x(0) = 0 ;
x(
t) = 1, x(
t) = 0 .
Podemos ent ao escrever o problema na forma P(t
0
, z
0
) como
_
_
Minimizar
_
T
0
1 dt
sujeito a
z
t
=
_
0 1
0 0
_
z +
_
0
1
_
u, z(0) = 0 ;
(T, z(T)) :=
_
1
0
_
z(T) = 0
onde T 0, u L
1
[0, T] e u(t) := [1, 1] q.s. em [0, T]. Como o sis-
tema e aut onomo, a aplica c ao U
= U
t
=
_
0
1
_
, (T) = (
2
) ;
H(t, z, , u) = z
2
1
+ u
2
+ ;
z
2
1
+ U
(z, )
2
+ = min
u[1,1]
z
2
1
+u
2
+, q.s. em [0, T] ;
+ [
1
[ + [
2
[ ,= 0 .
A condi c ao de optimalidade nos permite encontrar
(10.7) U
(z, ) =
_
sign
2
,
2
,= 0
? ,
2
= 0
Calculando agora z(t), (t) para t [0, T], obtemos
4
(10.8) z
2
(t) =
_
t
0
u(s) ds, z
1
(t) =
_
t
0
_
s
0
u(r) dr ds, t [0, T] ;
4
Note que e calculado para tr as no tempo.
steuer
2008/3/11
page 228
i
i
i
i
i
i
i
i
228 [CAP. 10: PRINC
IPIO DO M
AXIMO
(10.9)
1
(t) =
1
,
2
(t) = (T t)
1
+
2
, t [0, T] .
Analisando (10.7), conclumos que basta identicar o sinal e os zeros
da fun c ao
2
para obtermos a estrategia otima de controle. Estudamos
assim os seguintes casos:
2
n ao possui zeros: de (10.7), segue que u(t) 1 ou u(t) 1.
Entretanto, essas estrategias n ao s ao admissveis, pois as respecti-
vas trajetorias n ao alcan cam o estado nal;
2
possui zeros em [0, T): de (10.9), temos que
2
e uma fun c ao
linear em t. Logo,
2
possui apenas um zero em [0, T), o qual
denominamos .
Temos assim duas famlias de candidatos a controle otimo:
u(t) =
_
1, t <
1, t >
e u(t) =
_
1, t <
1, t >
.
Note que com os controles da segunda famlia n ao e possvel atingir o
estado nal z(T) = (
1
0
) para nenhum T > 0. Substituindo a express ao
restante em (10.8), temos
z() =
_
1
2
_
; z(T) =
_
1
2
T
2
+ 2T
2
2 T
_
.
Da condi c ao de contono z(T) = (
1
0
), obtemos para o par (, T) o sistema
n ao linear
_
1 =
1
2
T
2
+ 2T
2
0 = 2 T
cuja solu c ao e = 1, T = 2, como se verica facilmente. Portanto, a
solu c ao do problema de controle e
T = 2, u(t) =
_
1, 0 t < 1
1, 1 t 2
2
Aplica cao 187 (Tempo mnimo II). Consideramos agora uma vari-
ante da aplica c ao anterior. Suponha que no tempo t = 0 nosso carro
se encontra na posi c ao a R com velocidade b R. Nosso objetivo e
leva-lo ate a origem no menor tempo possvel, de forma que ao chegar
ao destino, o carro tenha velocidade nula.
steuer
2008/3/11
page 229
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 229
Temos agora o seguinte problema de controle
_
_
Minimizar
_
T
0
1 dt
sujeito a
z
t
=
_
0 1
0 0
_
z +
_
0
1
_
u, z(0) = (
a
b
) ;
(T, z(T)) := z(T) = 0
onde T 0, u L
1
[0, T] e u(t) := [1, 1] q.s. em [0, T]. As
condi c oes necessarias fornecidas pelo princpio do maximo s ao as mes-
mas, com excess ao das condi c oes de contorno para a variavel de estado
z
t
=
_
z
2
u
_
, z(0) =
_
a
b
_
, z(T) = 0 .
U
IPIO DO M
AXIMO
z
2
z
1
(
u1
u1
a
b
Figura 10.2: Trajetorias correspondentes aos controles otimos u 1 ou
u 1
conclumos que a trajetoria otima e necessariamente composta por dois
arcos: cada um pertencente a uma das famlias na Figura 10.3 (lembre
que u muda de sinal uma unica vez no intervalo [0, T]).
Note que a parte nal da trajetoria otima e necessariamente como na
Figura 10.2 (caso contrario a trajetoria n ao seria admissvel). Para deter-
minar a parte inicial da trajetoria, observe que, dada uma condi c ao ini-
cial (a, b) R
2
, existe uma unica curva pertencente `as famlias mostradas
na Figura 10.3, que intercepta tanto o ponto (a, b) quanto a curva ( (o
caso a > 0, b > 0 e mostrado na Figura 10.4). O princpio do maximo
nos permite concluir que existe uma unica trajetoria associada a con-
troles do tipo
u(t) =
_
1, t <
1, t >
ou u(t) =
_
1, t <
1, t >
z
2
z
1
z
2
z
1
Figura 10.3: Trajetorias correspondentes a controles constantes
steuer
2008/3/11
page 231
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 231
z
2
z
1
(
u1
u1
a
b
c
P
Figura 10.4: Trajetoria otima para a condi c ao inicial z(0) = (a, b)
que e admissvel para a condi c ao inicial (a, b). Tal trajetoria e composta
por dois arcos: um da curva c limitado por (a, b) e pelo ponto P e outro
da curva ( limitado por P e pela origem. Para calcular (instante
em que trocamos o controle de 1 para 1) n ao e necessario calcular
as constantes
1
,
2
na equa c ao (10.9). No caso a > 0, b > 0, basta
descobrir para qual > 0 a curva (z
1
(t), z
2
(t)) = (a + bt t
2
/2, b t)
satisfaz a condi c ao
z
2
() < 0, z
2
()
2
= 2z
1
() .
Um calculo simples mostra que e dado por uma das razes b
_
b
2
/2 a.
2
Aplica cao 188 (Alunissagem). Considere o problema de controlar a
descida de uma espa conave na Lua, utilizando para isso a menor quan-
tidade possvel de combustvel. Em um modelo simplicado, temos
5
t : tempo;
h(t) : altura da espa conave;
v(t) : velocidade da espa conave;
m(t) : massa da espa conave + combustvel;
u(t) : empuxo dos motores da espa conave.
Seja M a massa da espa conave sem combustvel, F a quantidade ini-
cial de combustvel, h
0
a altura inicial, v
0
a velocidade inicial, u
max
o
empuxo maximo dos motores da nave (0 u(t) u
max
, t 0), g a
constante gravitacional da Lua (considerada constante) e k a constante
de proporcionalidade entre o empuxo e a taxa de queima do combustvel.
5
Este modelo e tambem discutido em [FlRi], [Ho] e [Know].
steuer
2008/3/11
page 232
i
i
i
i
i
i
i
i
232 [CAP. 10: PRINC
IPIO DO M
AXIMO
As variaveis de estado (h, v, m) satisfazem a seguinte din amica:
_
_
_
h
t
= v(t)
v
t
= g + u(t)/m(t)
m
t
= ku(t)
Denindo z(t) = (h(t), v(t), m(t)), temos o sistema n ao linear
(10.10)
_
_
z
t
=
_
_
z
2
g +u/z
3
ku
_
_
=: f(t, z, u)
z(0) = (h
0
, v
0
, M +F), z(T) = (0, 0, ?) .
A condi c ao nal segue da hipotese que um pouso suave ocorre quando
h(T) = 0 e v(T) = 0, sendo para m somente relevante que m(T) M.
Como o custo a ser minimizado corresponde ao gasto de combustvel,
temos que maximizar
m(T) = M + F k
_
T
0
u(t) dt .
O problema de controle otimo pode ser escrito como:
_
_
Minimizar J(T, z, u) =
_
T
0
u(t) dt
sujeito a
u L
1
[0, T] [ u(t) := [0, u
max
] q.s. em [0, T],
z
t
= f(z, u), z(0) = (h
0
v
0
M +F) R
3
,
(T, z(T)) = (z
1
(T) z
2
(T)) = 0 R
2
A fun c ao de Hamilton e
H(t, z, , u) = , u)+L(t, z, u) =
1
z
2
+
2
(g+u/z
3
)
3
ku+u .
Minimizando a fun c ao de Hamilton em rela c ao a u obtemos
(10.11) U
(z, ) =
_
_
_
0 , +
2
/z
3
k
3
> 0
? , +
2
/z
3
k
3
= 0
u
max
, +
2
/z
3
k
3
< 0
Tomamos por simplicidade u
max
= 1. A m de tornar o problema
sicamente coerente, supomos ainda
steuer
2008/3/11
page 233
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 233
z
1
= h
z
2
= v
=TF/k
Figura 10.5: Condi c oes iniciais (h, v) que s ao levadas pelo controle u 1
`a condi c ao nal (0, 0, m(T)) com m(T) M.
1 = empuxo maximo > for ca gravitacional = (M +F)g,
isto e 1/(M + F) > g.
E razoavel considerar que existe uma estrategia
otima do tipo bangbang, i.e. da forma
(10.12) u(t) =
_
0 , t [0, )
1 , t [, T]
Calculamos inicialmente a trajetoria associada `a estrategia u. Como
u 1 em [, T], usamos o sistema (10.10) e as condi c oes de contorno
z
1
(T) = z
2
(T) = 0 e z
3
() = M + T a m de determinar z no instante
t = . Obtemos assim
_
_
z
1
() =
1
2
g(T )
2
M+F
k
2
ln
_
M+Fk(T)
M+F
_
T
k
z
2
() = g(T ) +
1
k
ln
_
M+Fk(T)
M+F
_
z
3
() = M +F
Tra cando o graco de z
1
() por z
2
(), obtemos a curva da Figura 10.5,
que e formada pelos estados da forma z() = (h(), v(), M + F) que
s ao levados pelo controle u(t) = 1, t [, T] no estado nal z(T) =
(0, 0, m(T)) com m(T) M. Note que o comprimento dessa curva e
limitado pois, como u 1, temos m
t
= k e o combustvel se esgotara
apos F/k unidades de tempo. Temos assim a limita c ao T F/k
(alem de T 0, obviamente).
steuer
2008/3/11
page 234
i
i
i
i
i
i
i
i
234 [CAP. 10: PRINC
IPIO DO M
AXIMO
z
1
= h
z
2
= v
u=0
u=1
(v
0
,h
0
)
Figura 10.6: Trajetoria correspondente `a estrategia bang-bang u.
Como inicialmente u 0, a nave se encontra em queda livre durante
o intervalo de tempo [0, ]. A trajetoria correspondente e
_
_
z
1
(t) =
1
2
gt
2
+v
0
t +h
0
z
2
(t) = gt +v
0
z
3
(t) = M +F
t [0, ] .
Explicitando z
1
(= h) em fun c ao de z
2
(= v), obtemos:
h(t) = h
0
1
2g
[v
2
(t) v
2
0
], t [0, ] .
A curva (v(t), h(t)) e uma parabola no plano de fase vh. Unindo os dois
trechos da trajetoria correspondente a u, obtemos a curva mostrada na
Figura 10.6. Segundo essa trajetoria, a nave cai em queda livre ate que o
estado (v, h) alcance a curva da Figura 10.5. Nesse momento os motores
s ao acionados na potencia maxima ate um estado nal admissvel ser
atingido ((T, z(T)) = 0).
Observe que se a intersec c ao das duas curvas na Figura 10.6 ocorre
em um ponto (v(), h()) com < T F/k, a quantidade de combus-
tivel n ao e suciente para realizar um pouso suave. Enquanto que se
a condi c ao inicial (v
0
, h
0
) se encontra abaixo da curva na Figura 10.5,
mesmo empregando empuxo maximo u(t) = 1, t [0, T], o solo lunar e
atingido com v(T) < 0.
Atraves do princpio do maximo vericamos agora que a estrategia de
controle denida em (10.12) e um candidato a controle otimo. Suponha
steuer
2008/3/11
page 235
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 235
(0) = (l
1
l
2
l
3
). Substituindo na equa c ao adjunta
_
_
_
t
1
= 0
t
2
=
1
t
3
=
2
u/z
2
3
temos:
1
(t) = l
1
, t [0, T] ;
2
(t) = l
2
l
1
t, t [0, T] ;
3
(t) = l
3
, t [0, ] .
Como z
3
(t) = M + F k(t ), t [, T], podemos calcular
3
no
intervalo nal de tempo, obtendo
3
(t) = l
3
+
_
t
l
2
l
1
s
[k( s) +M +F]
2
ds, t [, T] .
Dena agora r(t) := +
2
(t)/z
3
(t) k
3
(t), t [0, T]. De (10.11)
sabemos que a escolha do controle u no tempo t depende de sign(r(t)).
Portanto, como a estrategia de controle u salta de 0 para 1 em t = ,
temos obrigatoriamente
r() = +
2
()
z
3
()
k
3
() = 0 .
Escolhendo = 1 (que satisfaz condi c ao de transversalidade), reescreve-
mos a equa c ao acima como
1 +
l
2
l
1
M +F
k l
3
= 0 .
A escolha de u em (10.12) implica em r(t) > 0, t [0, ). Portanto,
l
1
> 0, necessariamente.
O princpio do maximo fornece-nos ainda uma condi c ao inicial para
a equa c ao adjunta:
(T) =
z
(T, z(T))
=
_
1 0 0
0 1 0
_
_
1
2
_
=
_
_
2
0
_
_
,
steuer
2008/3/11
page 236
i
i
i
i
i
i
i
i
236 [CAP. 10: PRINC
IPIO DO M
AXIMO
de onde conclumos que
3
(T) = 0. Obtemos assim para l
1
, l
2
, l
3
o
sistema sub-determinado de equa c oes lineares
_
_
1 + (M +F)
1
(l
2
l
1
) k l
3
= 0
l
3
+
_
T
l
2
l
1
s
[k( s) +M +F]
2
ds = 0
Considerando
2
como par ametro, o sistema se reescreve como
_
(M +F)
1
l
1
+ k l
3
= 1 + l
2
(M +F)
1
T l
1
l
3
= Ql
2
onde T=
_
T
s[k( s) +M +F]
2
ds e Q=
_
T
[k( s) +M +F]
2
ds
s ao constantes positivas. Resolvendo o novo sistema obtemos:
(10.13)
_
l
1
l
3
_
=
_
[1 + ((M +F)
1
+kQ)l
2
] / [(M +F)
1
+kT]
T[1 + ((M +F)
1
+kQ)l
2
] / [(M +F)
1
+kT] Ql
2
_
Note que para t [, T), temos
r(t) = 1 + (l
2
l
1
t)/z
3
(t) k
3
(t)
< 1 + l
2
/M k l
3
+ (T /(M +F))l
1
. (10.14)
Substituindo em (10.14) as express oes encontradas em (10.13) para l
1
e l
3
, obtemos uma restri c ao linear para escolha de l
2
. Outra restri c ao
(tambem linear) para l
2
e dada por l
1
> 0 e (10.13). Como o proble-
ma assim colocado possui solu c ao n ao unica, e possvel encontrar uma
condi c ao inicial (l
1
, l
2
, l
3
), de forma que a fun c ao r satisfa ca
_
r(t) > 0, t [0, )
r(t) < 0, t (, T]
provando que u satisfaz as condi c oes do princpio do maximo.
Vericamos agora que u e o unico candidato fornecido pelo princpio
de Pontryagin. A fun c ao r(t) obtida de (10.11) determina quando ocor-
rem saltos na estrategia de controle. Note ainda que, como
1
l
1
,
ent ao
t
2
l
1
e temos
r
t
(t) = (
t
2
z
3
2
z
t
3
)z
2
3
k
t
3
=
t
2
/z
3
2
(ku)z
2
3
k
2
uz
2
3
= l
1
/z
3
(t), t [0, T] .
Analisamos separadamente as situa c oes possveis:
steuer
2008/3/11
page 237
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 237
l
1
,= 0: Como z
3
(t) = m(t) > 0, ent ao r e monotona. Se l
1
> 0,
obtemos um controle do tipo u. Se l
1
< 0, obtemos uma estrategia
oposta, i.e. inicialmente u = 1 e depois u = 0. Com essa estrategia
n ao e possvel obter um pouso suave. De fato, ou (v
0
, h
0
) se situa
abaixo ou acima do graco na Figura 10.5. No primeiro caso, ja
vimos que v(T) < 0. No segundo caso, como u e da forma
u(t) =
_
1, t [0, )
0, t [, T]
obtemos do sistema adjunto
v(T) v() =
_
T
v
t
(t) dt =
_
T
g dt = g(T ) .
Logo, uma condi c ao necessaria para v(T) = 0 e que T = v()/g+.
Novamente do sistema adjunto obtemos
h() = h(T) h() =
_
T
h
t
(t) dt =
_
T
v(t) dt
=
_
T
g(T t) dt =
g
2
(T )
2
,
isto e h() = v
2
()/2g < 0. Portanto, a transi c ao de 1 para 0
na estrategia de controle ocorre abaixo da superfcie da Lua, e o
pouso obviamente n ao e suave.
l
1
= 0: Neste caso, r
t
= 0 e r e constante. Se r ,= 0, os possveis
candidatos s ao u 0 e u 1. O primeiro controle obviamente
n ao permite pouso suave. Ja o segundo sera otimo somente se
(v
0
, h
0
) pertence `a curva na Figura 10.5, quando a estrategia se
torna identica a u. Por m, se r = 0, temos
1 + l
2
1
z
3
(t)
+ k
3
(t) = 0, t [0, T],
isto e, as fun c oes 1, z
1
3
,
3
s ao linearmente dependentes. Mas
isto e uma contradi c ao pois
z
3
(t) = M +F k
_
t
0
u(s) ds,
3
(t) = l
2
_
t
T
u(s)z
3
(s)
2
ds .
steuer
2008/3/11
page 238
i
i
i
i
i
i
i
i
238 [CAP. 10: PRINC
IPIO DO M
AXIMO
Portanto, o unico controle admissvel que satisfaz as condi c oes do princpio
do maximo e u denido em (10.12). 2
Aplica cao 189 (Controle singular). Considere o problema escalar
de controle
_
_
Minimizar
1
2
_
3
0
z(t)
2
dt
sujeito a
u L
1
[0, 3], u(t) := [1, 1] q.s. em [0, 3],
z
t
= u, z(0) = z(3) = 1.
O tempo nal T = 3 e a condi c ao nal para a trajetoria z(T) = 1 s ao
xados atraves da condi c ao:
(T, z(T)) =
_
1 z
T 3
_
= 0 R
2
.
Do princpio do maximo, obtemos as condi c oes necessarias:
z
t
= u, z(0) = z(3) = 1 ;
t
= z,
1
=
1
;
H(t, z, , u) = u +
1
2
z
2
, H
1
=
2
;
+[
1
[ +[
2
[ ,= 0 .
A condi c ao de maximo implica em U
t
(0) = 1. Supondo (0) 0, temos:
Se (0) 0 e (t) < 0, t [0, 3], ent ao u 1, o que implica em
z(3) = 4 (contradizendo a condi c ao de contorno nal).
Se (0) 0, (t
1
) = 0 para algum t
1
> 0 e (t) < 0, t (0, t
1
),
ent ao
t
(t
1
) 0. Mas
u(t) 1, t (0, t
1
) z(t) > 0, t (0, t
1
]
t
(t) < 0, t (0, t
1
],
contradizendo a conclus ao
t
(t
1
) 0.
steuer
2008/3/11
page 239
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 239
Conclumos assim que (0) > 0. De forma analoga prova-se que (3) <
0. Portanto, a fun c ao possui pelo menos um zero em (0, 3). Seja t
1
o
menor e t
2
o maior zero de em (0, 3). Provamos agora que t
1
= 1 e
t
2
= 2:
Note que t
1
,= t
2
, pois se possui apenas um zero, ent ao z(t) =
_
1t, t[0,3/2]
t2, t[3/2,3]
, que obviamente n ao e uma trajetoria otima;
Em [0, t
1
) temos: u(t) = 1, z(t) = 1 t, (t) = (0) t +
1
2
t
2
.
Como (t
1
) = 0, ent ao t
1
= 1
_
1 2(0). Se t
1
assume o valor
da maior raiz, temos t
1
> 1 e a trajetoria associada a n ao e
otima, pois z(t) :=
_
z(t), z(t)0
0 , z(t)<0
satisfaz
_
3
0
z(t)
2
dt <
_
3
0
z(t)
2
dt .
Logo, t
1
= 1
_
1 2(0) 1.
Se t
1
< 1, ent ao
t
(t
1
) = z(t
1
) < 0. Seja
t > 1, tal que (t) < 0,
t (t
1
,
t) e (
t) = 0. Logo,
t
(
t) 0.
De (t) < 0, segue u(t) 1, t (t
1
,
t].
Ent ao
t
(
t) = z(
t
1
,
t
2
) e (
t
1
) = (
t
2
) = 0. Logo, u(t) = 1, t
(
t
1
,
t
2
) e portanto
tt
(t) = (z(t))
t
= u(t) = 1, t (
t
1
,
t
2
), o que e
claramente uma contradi c ao. Portanto, a estrategia otima de controle
tem de ser
u(t) =
_
_
_
1, t [0, 1]
0 , t (1, 2)
+1, t [2, 3]
.
(Note que a trajetoria z 0 e um extremal singular do problema e a
trajetoria otima z e do tipo: bangsingularbang.) 2
Aplica cao 190 (Consumo Investimento). Tratamos a seguir um
problema classico da economia, que foi um dos primeiros a ser con-
siderado sob a otica do calculo variacional. Consideramos o seguinte
steuer
2008/3/11
page 240
i
i
i
i
i
i
i
i
240 [CAP. 10: PRINC
IPIO DO M
AXIMO
problema macroecon omico: Como equacionar a rela c ao entre consumo
e investimento, a m de otimizar o desenvolvimento econ omico?
Suponha que a economia de uma na c ao e representada pelas variaveis
K(t) : Capital no tempo t;
C(t) : Consumo;
Y (t) : Produ c ao (produto interno);
K
t
(t) : Investimento (varia c ao do Capital);
ao longo do intervalo de tempo t [0, ). Considere ainda o seguinte
modelo simplicado:
i) Y = g(K), onde g
t
> 0 e g
tt
0;
ii) C = Y K
t
(parte da produ c ao e consumida e o restante e rein-
vestido);
iii) K(0) = K
0
(o capital inicial e conhecido);
iv) U = U(C) e a utilidade do capital, onde U
t
> 0, U
tt
< 0;
v) > 0 e o fator de desconto.
O objetivo e encontrar uma poltica otima de investimento para o pro-
blema:
_
_
_
Maximizar
_
0
e
t
U(C(t))dt
sujeito a K
t
= g(K) C, K(0) = K
0
.
Este problema foi originalmente formulado e resolvido por Ramsey em
1928 (veja [Ra]). A hipotese C = g(K) K
t
permite-nos analisar este
problema utilizando calculo variacional (veja Sec c ao 9.2). Note que a
equa c ao de EulerLagrange e dada por
K
tt
g
t
(K)K
t
+
U
t
(g(K) K
t
)
U
tt
(g(K) K
t
)
( g
t
(K)) = 0 .
No caso geral esta equa c ao n ao pode ser resolvida analiticamente. Faze-
mos aqui a hipotese simplicadora:
U(r) =
1
1 q
r
1q
, g(r) = br,
steuer
2008/3/11
page 241
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC
OES DO PRINC
IPIO DO M
AXIMO 241
onde b > 0, q (0, 1). Neste caso particular a equa c ao de Euler
Lagrange ca simplicada, na forma de uma equa c ao que sabemos re-
solver:
qK
tt
+ ( b qb)bK
t
+b(b )K = 0.
Calculando as razes do polin omio caracterstico, temos
1
= b,
2
=
a := q
1
(b ). Portanto, as solu c oes que satisfazem a condi c ao inicial
K(0) = K
0
s ao da forma:
K(t) = (K
0
A)e
at
+Ae
bt
, t 0,
onde Ae um par ametro livre. Suponha agora que b > a, i.e. > (1q)b.
Neste caso, as hipoteses do modelo:
C(t) = g(K(t)) K
t
(t) > 0, t 0 e lim
t
K(t) 0
s ao satisfeitas respectivamente para A 0 e A < K
0
. Para determi-
nar o par ametro A [0, K
0
) e necessaria uma condi c ao de contorno
para a equa c ao da din amica por exemplo K
t
(0) ou K(). Como tal
condi c ao n ao e explicitamente fornecida, e preciso analisar a equa c ao de
HamiltonJacobiBellman, que para este problema aut onomo se escreve
como
V (x) + min
u
_
V
x
, g(x) u) +
1
1 q
u
1q
_
= 0, x R
n
(note que = b qa).
E facil vericar que V (x) := (1 q)/(b a)
q
x
1q
,
x 0 e solu c ao da equa c ao acima. Note ainda que se A = 0 a condi c ao
liminf
t
e
t
V (
K(t)) = 0
e satisfeita, pois a(1q) < 0 por hipotese. Portanto, V (x) e a trajetoria
K(t) = K
0
e
at
satisfazem as condi c oes do teorema, de onde conclumos
que uma estrategia otima de consumo e dada por
C(t) = (b a)K
0
e
at
, t 0.
2
steuer
2008/3/11
page 242
i
i
i
i
i
i
i
i
242 EXERC
ICIOS
Exerccios
10.1. Considere o problema de Bolza
_
_
Minimizar
1
2
_
1
0
u(t)
2
dt +z
1
(1)
2
+z
2
(1)
2
sujeito a
u L
1
[0, 1], z
t
1
= z
2
, z
t
2
= u, z
1
(0) = z
2
(0) = 0.
a) Formule o princpio do maximo para o problema acima.
b) Obtenha o processo otimo.
10.2. Considere o problema de controle otimo
_
_
Minimizar
_
T
0
_
z
1
(t)
2
+u(t)
2
dt
sujeito a
u L
1
[0, T], z
t
1
= z
2
, z
t
2
= z
2
+u, z
1
(0) = 1, z
2
(0) = 0.
a) Formule o princpio do maximo para o problema acima.
b) Obtenha o processo otimo.
10.3. Considere o problema de controle otimo escalar
_
_
Minimizar
1
2
_
1
0
_
3z(t)
2
+u(t)
2
dt
sujeito a
u L
1
[0, 1], z
t
= z +u, z(0) = 1.
a) Formule o princpio do maximo para o problema acima.
b) Obtenha o processo otimo.
10.4 (Problema de Investimento). Suponha que um determinado
produto e fabricado com a taxa z(t). No tempo t > 0 uma fra c ao u(t)
da produ c ao e reinvestida para aumentar a produ c ao, sendo o restante
vendido para gera c ao de lucro. O objetivo e determinar uma poltica
de investimento otima, de forma a maximizar o lucro total no horizonte
xo de tempo [0, T]. Temos assim o problema
_
_
Maximizar
_
T
0
(1 u(t))z(t)dt
sujeito a
z
t
= uz, z(0) = z
0
> 0, z(t) 0, u
C[0, T]
steuer
2008/3/11
page 243
i
i
i
i
i
i
i
i
EXERC
ICIOS 243
a) Reescreva o problema como um problema variacional com restri c oes
lagrangeanas: y
t
(t) 0, y
t
(t) y(t).
b) Obtenha condi c oes necessarias para o novo problema.
c) Encontre a taxa otima de produ c ao y.
10.5 (Problema do Cafe). Uma xcara cheia de cafe `a temperatura de
100
o
C deve ser esfriada a temperatura de 0
o
C por adi c ao de uma quan-
tidade xa de creme de leite. Uma equa c ao aproximada para evolu c ao
da temperatura z da mistura e dada por
z
t
= z 25u uz/4.
As condi c oes de contorno s ao z(0) = 100, z(T) = 0.
a) Obtenha condi c oes necessarias para o problema de tempo otimo
sujeito `as restri c oes 0 u(t) 1, t [0, T],
_
T
0
u(t)dt = 1, impostas ao
uxo externo de lquido u.
b) Use o fato z
t
< 0 para obter um problema equivalente com intervalo
de tempo xo. O que se pode armar sobre a unicidade da solu c ao
obtida no item a).
(Sugest ao: A nova variavel livre e s = z.)
steuer
2008/3/11
page 244
i
i
i
i
i
i
i
i
Captulo 11
Programacao Dinamica
Discreta
Tratamos neste captulo dos problemas de controle otimo com di-
n amica discreta, em particular, problemas relacionados com o princpio
de Bellman. A analise esta baseada em um procedimento denominado
programa c ao din amica, o qual permite a determina c ao de condi c oes ne-
cessarias para otimalidade de problemas de controle.
Na Sec c ao 11.1 e apresentado o princpio de Bellman em uma forma
bastante generica. Nas Sec c oes 11.2 a 11.5 s ao analisados problemas
de otimiza c ao com din amica discreta. Para cada problema encontramos
estruturas (uma fun c ao, uma equa c ao e condi c oes de contorno) que per-
mitem determinar as solu c oes otimas. Entre os problemas analisados
est ao o da substitui c ao de equipamento e o do caixeiro viajante. Na
Sec c ao 11.6 abordamos um modelo generico para problemas discretos
de decis oes consecutivas, sendo um resultado de existencia discutido em
detalhes.
11.1 Introducao
Em otimiza c ao o conceito de programa esta relacionado com o pro-
blema de dominar, de forma otima, uma situa c ao proposta. Tal conceito
surgiu originalmente na economia e diz respeito ao desenvolvimento de
planejamentos otimos de produ c ao.
Iniciamos a abordagem considerando um problema generico. Con-
steuer
2008/3/11
page 245
i
i
i
i
i
i
i
i
[SEC. 11.1: INTRODUC
AO 245
sidere o problema de otimiza c ao da forma
1
_
Minimizar g(x)
sujeito a x X
ad
A fun c ao g(x) e denominada fun c ao objetivo e X
ad
e o conjunto dos pon-
tos admissveis (e.g., X
ad
: conjunto das estrategias de produ c ao viaveis;
g(x): custo lquido da realiza c ao do plano x X
ad
). Os diversos pro-
blemas e os respectivos metodos de solu c ao s ao denominados de acordo
com as caractersticas particulares:
Programa c ao Linear (linear programming)
Problema: g linear, X
ad
poliedro convexo em R
m
.
Programa c ao Geometrica (fractional programming)
Problema: g quociente de aplica c oes lineares, X
ad
poliedro convexo
em R
m
.
Programa c ao Convexa (convex programming)
Problema: g convexa, X
ad
subconjunto convexo de um espa co
vetorial.
Programa c ao n ao linear (nonlinear programming)
Problema: demais casos.
A metodologia conhecida como programa c ao din amica (dynamic pro-
gramming) foi desenvolvida por R.E. Bellman em ns dos anos 50. Ela
pode ser aplicada para solucionar problemas de controle bastante gerais
(n ao lineares, n ao aut onomos) e e uma alternativa `a abordagem varia-
cional estudada no Captulo 10 sob o nome de princpio do m aximo. O
ponto de partida da programa c ao din amica e o chamado princpio de
otimalidade de Bellman:
2
Uma estrategia otima possui a seguinte propriedade: inde-
pendente das decis oes tomadas em instantes de tempo ante-
riores ao atual, as decis oes futuras relativas ao estado, ao
qual as decis oes passadas levaram, tem que ser escolhidas de
forma otima.
1
Note que problemas de maximiza c ao tambem podem sempre ser formulados deste
modo.
2
Veja, e.g., [BeDr], Sec c ao 1.11.
steuer
2008/3/11
page 246
i
i
i
i
i
i
i
i
246 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
A B
H
K
C
D
O
P
E
G
L
N
F M
I
J
1
5
2
7
1
3
5
2
2
2
4
1 0
3
4
4
2
2
1
4
8
3
5
2
Figura 11.1: Mapa da cidade com ruas de m ao unica.
Em outras palavras, o modo de escolher a estrategia otima de controle
independe tanto das decis oes tomadas em tempos anteriores, quanto dos
respectivos estados atravessados pelo sistema ate o tempo atual.
Uma analise detalhada do princpio de Bellman e apresentada na
Sec c ao 12.2. Nas sec c oes a seguir, o formalismo da programa c ao din amica
e introduzido atraves da investiga c ao de alguns exemplos de grande
aplicabilidade. O leitor interessado encontra em [BeDr] varias outras
aplica c oes a problemas discretos.
11.2 Problema do Caminho Simples
Suponha que numa cidade imaginaria as ruas (todas de m ao unica)
estejam dispostas de acordo com a congura c ao mostrada na Figura 11.1.
Cada letra representa uma esquina e os n umeros representam o custo
(tempo, combustvel, . . . ) para se utilizar a respectiva rua. O nosso
objetivo e encontrar o caminho de A ate B que possua o menor custo
associado possvel.
O metodo mais simples de resolver o problema e enumerar todos
os caminhos possveis e comparar os custos totais de cada caminho.
Analisemos o esfor co computacional necessario para executar este me-
todo:
steuer
2008/3/11
page 247
i
i
i
i
i
i
i
i
[SEC. 11.2: PROBLEMA DO CAMINHO SIMPLES 247
Existem 20 diferentes caminhos de A ate B.
3
De fato, de H a B
existe um unico caminho e dem de K a B. De I a B existem 3
caminhos e dem de J a B. Logo, existem 4 caminhos de E a B,
4 caminhos de G a B e 6 caminhos de F a B. Ent ao, existem 10
caminhos de C a B e 10 caminhos de D a B.
Para cada caminho realizamos 5 somas, a m de computar o custo
total.
Precisamos ainda de 19 compara c oes para encontrar o menor custo.
Utilizando o princpio de otimalidade desenvolvemos agora a ideia da
programa c ao din amica.
Um caminho otimo de A ate B passa obrigatoriamente ou por C
ou por D.
Se P
c
e um caminho otimo de C ate B de custo p
c
e P
d
e um
caminho otimo de D ate B de custo p
d
, e possvel determinar o
caminho otimo de A ate B somando a p
c
o custo da rua de A a C,
somando a p
d
o custo da rua de A a D e escolhendo a menor das
duas somas.
Desta forma o caminho otimo ca estabelecido. Observe que o procedi-
mento acima descrito e baseado no princpio de Bellman:
Uma vez descoberto o caminho ate C (ou D), determine o
restante do caminho de modo que este seja otimo de C (ou
D) ate B.
Seja V (Q
1
, Q
2
) o custo do caminho otimo de Q
1
a Q
2
e d(Q
1
, Q
2
) o
custo da rua unindo Q
1
e Q
2
. De acordo com o princpio de otimalidade
temos:
V (A, B) = minV (C, B) +d(A, C); V (D, B) +d(A, D).
Note que v(C, B) e v(D, B) s ao ainda desconhecidos. Para calcula-los
precisamos conhecer os caminhos otimos de C a B e de D a B, respectiva-
mente. Para isso aplicamos recursivamente o princpio de otimalidade.
3
No nal da sec c ao, mostramos que o n umero de caminhos e dado pela combina c ao
_
6
3
_
.
steuer
2008/3/11
page 248
i
i
i
i
i
i
i
i
248 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Os proximos valores que precisamos s ao os de V (E, B) e V (F, B). A
partir deles calculamos
V (C, B) = minV (E, B) +d(C, E); V (F, B) +d(C, F),
V (D, B) = minV (F, B) +d(D, F); V (G, B) +d(D, G).
Prosseguindo desta forma chegamos nalmente a
V (M, B) = minV (O, B) +d(M, O); V (P, B) +d(M, P).
Mas V (O, B) = d(O, B) e V (P, B) = d(O, P) s ao conhecidos. Sendo
assim, podemos calcular os caminhos otimos de tras para frente, sim-
plesmente calculando os valores da fun c ao V (, ).
Temos ent ao para o exemplo numerico da Figura 11.1:
V (O, B) = 2, V (P, B) = 1;
V (L, B) = 5 + 2 = 7, V (N, B) = 4 + 1 = 5, V (M, B) = min2 +
2, 1 + 8 = 4
(i.e., quando o caminho otimo passa por M ele tem que continuar
por O);
V (H, B) = 3 + 5 + 2 = 10, V (K, B) = 2 + 4 + 1 = 7,
V (J, B) = min4 + 2, 5 + 2 = 6 (caminho JM. . . ),
V (I, B) = min7 + 3, 4 + 4 = 8 (caminho IM. . . );
V (E, B) = min10 + 2, 8 + 1 = 9 (caminho EI. . . ),
V (F, B) = min8 + 1, 6 + 2 = 8 (caminho FJ. . . ),
V (G, B) = min6 + 5, 7 + 4 = 11 (caminho GJ. . . ou GK. . . );
V (C, B) = min9 + 5, 8 + 4 = 12 (caminho CF. . . ),
V (D, B) = min8 + 7, 11 + 3 = 14 (caminho DG. . . );
V (A, B) = min12 + 1, 14 + 0 = 13 (caminho AC. . . ).
O caminho otimo de A a B e ent ao: A-C-F-J-M-O-B e o custo mnimo
e V (A, B) = 13.
Em contraposi c ao a um metodo usual de minimiza c ao denido no
conjunto dos caminhos viaveis de A ate B (por exemplo um metodo ite-
rativo), o procedimento acima n ao fornece nenhuma solu c ao aproximada
antes do termino de todos os calculos. Findos os calculos, observamos
steuer
2008/3/11
page 249
i
i
i
i
i
i
i
i
[SEC. 11.2: PROBLEMA DO CAMINHO SIMPLES 249
T
E
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
1
1
2
2
3
3
4
-1
5
-2
6
-3
A B
Figura 11.2: Cidade projetada sobre sistema de coordenadas.
que este metodo nos fornece muito mais do que simplesmente o caminho
otimo de A ate B. Podemos calcular de forma direta o caminho otimo
de qualquer ponto ate B e ainda sabemos a priori qual o custo otimo
(dado por V (, B)).
Por exemplo, o custo do caminho otimo de E a B e V (E, B) = 9 e o
caminho otimo e: E-I-M-O-B.
Este problema pode ser ainda analisado de outra forma. Considere a
nossa cidade projetada sobre um plano coordenado, onde os pontos Ae B
correspondem `as coordenadas (0, 0) e (6, 0), respectivamente, conforme
mostrado na Figura 11.2. Em cada ponto existem 2 dire c oes possveis
a seguir: nordeste (u) e sudeste (d). Usamos a seguinte nota c ao para
representa-las:
(x, y)
u
(x + 1, y + 1) ; custo: c
u
(x, y),
(x, y)
d
(x + 1, y 1) ; custo: c
d
(x, y).
Denimos ent ao a fun c ao valor otimo
V (x, y) := Custo do caminho otimo de (x, y) ate (6, 0).
steuer
2008/3/11
page 250
i
i
i
i
i
i
i
i
250 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Note que podemos estender a deni c ao das fun c oes c
u
, c
d
e V a todo
Z
2
. Basta denir o custo de ruas n ao existentes na cidade como .
Desta forma, podemos usar a nota c ao acima para denir recursivamente
a fun c ao valor otimo:
V (x, y) = minc
u
(x, y) +V (x + 1, y + 1); c
d
(x, y) +V (x + 1, y 1),
(x, y) Z
2
.
Esta equa c ao e denominada equa c ao de otimalidade. Exigimos ainda
que a condi c ao de contorno V (6, 0) = 0 seja satisfeita. Note que o custo
de viajar de (6, 0) a (6, 0) e zero, pois o destino ja foi alcan cado.
Consideremos agora uma formula c ao mais geral do nosso problema.
Suponha que para chegar de A ate B tenhamos que passar por N ruas
(onde N e par). Um caminho pode ser representado por uma palavra
de N letras pertencentes ao conjunto u, d. O n umero de letras u e d
tem que ser o mesmo, para que o caminho leve de A a B, portanto o
n umero de caminhos admissveis de A a B e igual ao n umero de palavras
constitudas por N/2 us e N/2 ds (podemos nos concentrar apenas na
posi c ao dos us, pois as demais posi c oes s ao obviamente preenchidas por
ds). Logo, o n umero de caminhos viaveis e dado por
_
N
N/2
_
. Pode-
mos agora comparar o esfor co computacional de realizar os metodos de
enumera c ao+compara c ao e de programa c ao din amica.
Pelo metodo de compara c ao, realizamos
_
N
N/2
_
(N 1) somas e
_
N
N/2
_
1 compara c oes. Com a Programa c ao Din amica s ao necessarias
2(N1)+(N/2)
2
adi c oes e (N/2)
2
compara c oes. Por exemplo, para N =
20 a programa c ao din amica requer 220 adi c oes e 100 compara c oes, en-
quanto que pela enumera c ao+compara c ao precisamos de mais de 310
6
somas e 184.000 compara c oes. Quanto maior a dimens ao do problema,
maior a vantagem da programa c ao din amica.
Outra variante do problema e encontrar alem do caminho otimo de A
ate B tambem os caminhos otimos de A ate os demais pontos da cidade.
Para tanto, consideramos uma outra fun c ao valor otimo.
V (x, y) := Custo do caminho otimo de (0, 0) ate (x, y).
A fun c ao V e calculada recursivamente pela equa c ao de otimalidade
V (x, y) = minc
u
(x 1, y 1) +V (x 1, y 1);
c
d
(x 1, y + 1) +V (x 1, y + 1),
steuer
2008/3/11
page 251
i
i
i
i
i
i
i
i
[SEC. 11.3: PROBLEMA DA SUBSTITUIC
AO DE EQUIPAMENTO 251
e pela condi c ao de contorno V (0, 0) = 0.
Observa cao 191. O metodo de programa c ao din amica para problemas
de otimiza c ao esta relacionado `a trade:
Fun c ao valor, Equa c ao de otimalidade, Condi c oes de contorno.
2
11.3 Problema da Substituicao de Equipamento
Analisamos nesta sec c ao um problema semelhante ao discutido na
Sec c ao 11.2. Este, entretanto, e mais realista. Comum aos dois proble-
mas e o fato que, a cada intervalo de tempo, apenas duas alternativas
de decis ao s ao possveis.
Consideramos aqui o problema de substitui c ao de apenas um equipa-
mento (ex. carro, trator, . . . ) que se deteriora com o tempo. Nossa
tarefa e decidir quando troca-lo por um novo. Suponha que precisamos
possuir tal equipamento pelos proximos N anos (ou outra unidade de
tempo qualquer) e que o custo de operar o equipamento por um ano
e dado exclusivamente em fun c ao da idade do mesmo. Sempre que o
equipamento se torna intoleravelmente velho, precisamos substitu-lo.
Nesse momento, pagamos um valor xo pelo equipamento novo e re-
cebemos uma determinada quantia pela venda do equipamento usado, a
qual depende somente da idade desse equipamento.
Para formular o problema precisamos conhecer a dura c ao total N do
processo, a idade da maquina original que possumos no tempo k = 0 e
ainda:
c(k) = custo de opera c ao por um ano de um equipamento de idade
k;
p = pre co de um equipamento novo;
v(k) = valor de venda de um equipamento com k anos de uso;
r(k) = valor de resgate recebido por um equipamento que com-
pleta k anos de uso no ano N + 1.
Temos que decidir a cada ano se devemos ou n ao substituir o equipa-
mento atual, de modo a minimizar o custo total no perodo de N anos.
steuer
2008/3/11
page 252
i
i
i
i
i
i
i
i
252 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Temos ent ao a seguinte formula c ao via programa c ao din amica:
Fun c ao valor otimo:
V (k, y) := Custo mnimo de possuir um equipamento do
ano k ao ano N, quando no ano k possumos
um equipamento de y anos de uso.
Equa c ao de otimalidade:
V (k, y) = min p v(x) +c(0) +V (k + 1, 1); c(x) +V (k + 1, x + 1).
Condi c ao de contorno:
V (N + 1, x) = r(x).
Note que o primeiro termo na equa c ao de otimalidade corresponde `a
compra de um novo equipamento no ano k, enquanto o segundo termo
representa a manuten c ao do equipamento durante esse ano. A condi c ao
de contorno signica que um rabate (custo negativo) de r(x) e obtido
quando possumos ao nal do processo um equipamento que completa x
anos no ano N + 1.
Exemplo 192. Considere o problema da substitui c ao de equipamento
com os seguintes dados: N = 5, y = 2, p = 50. As fun c oes c, v e r s ao
dadas na tabela abaixo.
ano 0 1 2 3 4 5 6
c 10 13 20 40 70 100 100
v 32 21 11 5 0 0
r 25 17 8 0 0 0
As condi c oes de contorno s ao:
4
V (6, 1) = 25, V (6, 2) = 17, V (6, 3) = 8,
V (6, 4) = V (6, 5) = V (6, 7) = 0.
4
Note que os estados nais que podem ser alcan cados a partir de (0, y) s ao os da
forma (x, N) para x |0, . . . , N, y +N.
steuer
2008/3/11
page 253
i
i
i
i
i
i
i
i
[SEC. 11.4: PROBLEMA DO CAIXEIRO VIAJANTE 253
A partir da temos:
V (5, 1) = min{50 32 + 10 + V (6, 1); 13 + V (6, 2)} = 4 (manter),
V (5, 2) = min{50 21 + 10 + V (6, 1); 20 + V (6, 3)} = 12 (manter),
V (5, 3) = min{24; 40} = 24 (comprar),
V (5, 4) = min{30; 70} = 30 (comprar),
V (5, 6) = min{35; 100} = 35 (comprar) ;
V (4, 1) = min{28 + V (5, 1); 13 + V (5, 2)} = 24 (comprar),
V (4, 2) = min{35; 44} = 35 (comprar),
V (4, 3) = min{45; 70} = 45 (comprar),
V (4, 5) = min{56; 135} = 56 (comprar) ;
V (3, 1) = min{52; 48} = 48 (manter),
V (3, 2) = min{63; 65} = 63 (comprar),
V (3, 4) = min{79; 126} = 79 (comprar) ;
V (2, 1) = min{76; 76} = 76 (comprar
ou manter),
V (2, 3) = min{97; 119} = 97 (comprar) ;
V (1, 2) = min{115; 117} = 115 (comprar).
Temos ent ao as estrategias otimas: C-C-M-C-M ou C-M-C-C-M, onde
C = comprar e M = manter. Calculando diretamente o custo das es-
trategias, temos:
custo(CCMCM) = p v(2) +c(0) + p v(1) +c(0) + c(1) +
p v(2) +c(0) + c(1) r(2) = 115,
custo(CMCCM) = p v(2) +c(0) + c(1) + p v(2) +c(0) +
p v(1) +c(0) + c(1) r(2) = 115,
raticando nossa conclus ao.
2
11.4 Problema do Caixeiro Viajante
Consideramos um grafo com N vertices (representando cidades). As
cidades s ao enumeradas arbitrariamente de 1 a N e denotamos por d
ij
o tempo de viagem (dist ancia, custo, . . . ) para ir da cidade i `a cidade
j. Um caixeiro viajante deseja sair da cidade 1, percorrer cada uma das
steuer
2008/3/11
page 254
i
i
i
i
i
i
i
i
254 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
outras cidades exatamente uma vez e retornar por m `a cidade 1 (tal
caminho e denominado tour).
O problema que se p oe e encontrar o tour mais curto para o caixeiro
viajante. Dena para tanto N
j
:= 2, . . . , j 1, j + 1, . . . , N, para
j = 2, . . . , N. Para cada j = 2, . . . , N, i = 1, . . . , N 2, e M N
j
,
subconjunto com exatamente i elementos, denimos
(11.1)
V (i, j, m) := Comprimento do caminho mais curto da cidade 1 `a
cidade j atravessando exatamente as i cidades de M
como fun c ao valor otimo. Como equa c ao de otimalidade, escolhemos:
(11.2) V (i, j, M) = min
kM
V (i 1, k, Mk) +d
kj
;
e como condi c ao de contorno, tomamos:
V (0, j, ) = d
1j
, j = 2, . . . , N.
Calculando recursivamente, obtemos como solu c ao
(11.3) min
j2,...,N
V (N 2, j, N
j
) +d
j1
.
O valor de j que minimiza a express ao em (11.3) corresponde `a ultima
cidade percorrida no tour otimo antes de retornar `a cidade 1. Vericamos
heuristicamente a validade da equa c ao de otimalidade, das condi c oes de
contorno e da fun c ao valor otimo atraves de argumento indutivo.
A verica c ao do caso i = 1 ca a cargo do leitor (basta usar as
condi c oes de contorno). Seja i > 1 e suponha que queremos calcular
V (i, j, M). Considere o caminho mais curto da cidade 1 `a cidade j via
cidades de M e seja k M a ultima cidade de M que e percorrida por
este caminho. Como as cidades de Mk tem que ser percorridas de
forma otima, o comprimento deste sub-caminho e V (i 1, k, Mk)
e o comprimento do caminho original e V (i 1, k, Mk) + d
kj
. Isto
garante que
V (i, j, M) min
kM
V (i 1, k, Mk) +d
kj
.
A desigualdade oposta segue da deni c ao de V em (11.1).
A m de calcular o caminho mais curto, calculamos inicialmemte
V (1, , ) a partir da condi c ao inicial V (0, , ). Ent ao, calculamos V (2, , )
steuer
2008/3/11
page 255
i
i
i
i
i
i
i
i
[SEC. 11.4: PROBLEMA DO CAIXEIRO VIAJANTE 255
a partir de V (1, , ) e assim por diante ate chegarmos a V (N 2, j, N
j
),
j = 1, . . . , N (compare com (11.3)). O tour otimo e calculado de tras
para frente.
Exemplo 193. Considere o problema do caixeiro viajante com 4 cidades
cujas dist ancias s ao dadas na tabela abaixo.
i j 1 2 3 4
1 0 3 1 5
2 1 0 5 4
3 5 4 0 2
4 3 1 3 0
Temos ent ao as condi c oes de contorno:
V (0, 2, ) = d
12
= 3, V (0, 3, ) = d
13
= 1, V (0, 4, ) = d
14
= 5.
A partir da equa c ao de otimalidade, calculamos agora:
V (1, 2, 3) = V (0, 3, ) +d
32
= 1 + 4 = 5 (3),
V (1, 2, 4) = 5 + 1 = 6 (4),
V (1, 3, 2) = 3 + 5 = 8 (2),
V (1, 3, 4) = 5 + 3 = 8 (4),
V (1, 4, 2) = 3 + 4 = 7 (2),
V (1, 4, 3) = 1 + 2 = 3 (3) ;
V (2, 2, 3, 4) = minV (1, 3, 4) +d
32
; V (1, 4, 3) +d
42
= min8 + 4; 3 + 1 = 4 (4),
V (2, 3, 2, 4) = minV (1, 2, 4) +d
23
; V (1, 4, 2) +d
43
= min6 + 5; 7 + 3 = 10 (4),
V (2, 4, 2, 3) = minV (1, 2, 3) +d
24
; V (1, 3, 2) +d
34
= min5 + 4; 8 + 2 = 9 (2),
Por m, obtemos o comprimento do tour otimo
min
j2,3,4
V (3, j, 2, 3, 4j)+d
j1
= min 4+1, 10+5, 9+3 = 5 (2).
A ultima cidade do tour (antes de retornar `a 1) e portanto a cidade 2.
Como o mnimo no calculo de V (2, 2, 3, 4) e obtido para j = 4, esta
e a pen ultima cidade. A antepen ultima so pode ser a cidade 3. O tour
otimo e portanto: 1-3-4-2-1.
2
steuer
2008/3/11
page 256
i
i
i
i
i
i
i
i
256 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Analisemos agora o esfor co computacional para realizar esta estra-
tegia de programa c ao din amica. A cada estagio i, o valor de V (i, j, M)
tem de ser calculado para (N 2)
_
N2
i
_
diferentes pares j, M. Cada
um desses calculos exige i somas e i 1 compara c oes. Somando sobre
todos os estagios i = 1, . . . , N 2 obtemos:
Adi c oes: (N 1)(N 2)2
N3
,
Compara c oes: (N 1)
N2
i=1
(i 1)
_
N2
i
_
(N 1)(N 4)2
N3
.
(Note que desconsideramos as ultimas (N 1) adi c oes e (N 2) com-
para c oes a m de calcular o comprimento do tour otimo.) Sendo assim,
o n umero de opera c oes cresce de forma exponencial e n ao polinomial.
A estrategia vista aqui n ao e a mais eciente conhecida. A busca por
algoritmos rapidos representa um extenso ramo de pesquisa atualmente.
Nossa estrategia requer para um problema com 20 cidades algo em torno
de 85 10
6
opera c oes.
Note ainda que a quantidade de memoria necessaria para execu c ao
do algoritmo e um problema extra. Se N 256, precisa-se, para cada
i, de (N 1)
_
N2
i
_
Bytes para armazenar os valores de V (1, , ). Por
exemplo, para N = 20, precisa-se de aproximadamente 925 KB para
armazenar V (9, , ) e para N = 100 s ao necessarios 2.3 10
21
GB para
armazenar V (50, , ).
11.5 Problema Linear-Quadratico Discreto
Considere o sistema discreto
(11.4) z
k+1
= Az
k
+ Bu
k
, k = 0, . . . , N 1,
e a fun c ao objetivo
(11.5) J(z, u) :=
1
2
[z
N
, Sz
N
) +
N1
k=0
(z
k
, Qz
k
) +u
k
, Ru
k
)) ],
onde z
k
R
n
, k = 0, . . . , N, u
k
R
m
, k = 0, . . . , N 1 e as matrizes
S R
n,n
, Q R
n,n
, R R
m,m
. S ao dadas ainda as condi c oes iniciais
(11.6) z
0
= z
0
R
n
.
steuer
2008/3/11
page 257
i
i
i
i
i
i
i
i
[SEC. 11.5: PROBLEMA LINEAR-QUADR
j=k
(z
j
, Qz
j
) +u
j
, Ru
j
)) ],
Z
k
(x) := z R
(Nk+1)n
[ z
k
= x, z
j+1
= Az
j
+Bu
j
, j = k, . . . , N1 ;
a equa c ao de otimalidade
V (k, x) = minV (k + 1, Ax +Bu) +
1
2
(x, Qx) +u, Ru)) [ u R
m
;
e as condi c oes de contorno
V (N, x) =
1
2
x, Sx).
Observe que a equa c ao de otimalidade pode ser resolvida recursiva-
mente (k = N 1, . . . , 1), pois as aplica c oes envolvidas em sua deni c ao
s ao diferenciaveis e em cada passo k temos que resolver um problema
de minimiza c ao convexo (para o qual as condi c oes necessarias para exis-
tencia de solu c ao s ao tambem sucientes).
Consideremos o caso k = N 1. Temos
(11.7)
V (N 1, x)
= min
1
2
((Ax +Bu), S(Ax +Bu)) +x, Qx) +u, Ru)) [ u R
m
.
steuer
2008/3/11
page 258
i
i
i
i
i
i
i
i
258 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Como R e S s ao positivas denidas, uma condi c ao necessaria e suciente
para que u
N1
seja mnimo de (11.7) e que satisfa ca
Ru +B
S(Ax +Bu) = 0.
Resolvendo esta equa c ao para u, obtemos
u
N1
:= (B
SB +R)
1
B
SAx.
A m de executar o calculo recursivamente, denimos as matrizes
S
N
:= S,
K
N1
:= (B
SB +R)
1
B
SA,
S
N1
:= (ABK
N1
)
S
N
(ABK
N1
) +K
N1
RK
N1
+Q.
Podemos ent ao escrever
u
N1
= K
N1
x, V (N 1, x) =
1
2
x, S
N1
x).
Podemos repetir o raciocnio para o passo k = N 2 (apartir de N 1),
bastando para isso que troquemos S
N
por S
N1
. Da mesma forma
procedemos para os passos k = N 3, . . . , 0, obtendo assim a fun c ao
valor otimo para cada passo. Escrevendo na forma de algoritmo, temos:
S
N
:= S;
para k = N 1, . . . , 0 calcule
K
k
:= (B
S
k+1
B +R)
1
B
S
k+1
A ;
S
k
:= (ABK
k
)
S
k+1
(ABK
k
) +K
k
RK
k
+Q ;
Uma vez calculadas as matrizes K
k
e S
k
, a tarefa de encontrar a es-
trategia otima de controle ca bastante simples. Basta executar o algo-
ritmo:
z
0
:= z
0
;
V (0, z
0
) :=
1
2
z
0
, S
0
z
0
) ;
para k = 0, . . . , N 1, calcule
u
k
:= K
k
z
k
;
z
k+1
:= Az
k
+Bu
k
;
V (k + 1, z
k+1
) :=
1
2
z
k+1
, S
k+1
z
k+1
) ;
e obtemos o controle otimo (u
0
, . . . , u
N1
), a trajetoria otima (z
0
, . . . , z
N
)
e o custo mnimo V (0, z
0
).
Observa cao 194. O metodo acima fornece mais informa c ao do que
procuravamos inicialmente. O controle otimo e obtido na forma de con-
trole de realimenta c ao a partir das matrizes de ganho K
k
. Para diferen-
tes valores iniciais z
0
, podemos encontrar a estrategia otima, bastando
steuer
2008/3/11
page 259
i
i
i
i
i
i
i
i
[SEC. 11.5: PROBLEMA LINEAR-QUADR
N1
k=0
(z
k
, Qz
k
) +u
k
, Ru
k
))
sujeito a
z
k+1
= Az
k
+Bu
k
, k = 0, . . . , N 1, z
0
= z
0
, z
N
= z
N
,
onde z
k
R
n
, u
k
R
m
, Q R
n,n
e R R
m,m
. Observe que substi-
tuimos a penalidade 1/2z
N
, Sz
N
) no funcional anterior pela condi c ao
de contorno z
N
= z
N
. Supomos agora s.p.g. que z
N
= 0. Sob o ponto
de vista da programa c ao din amica, temos a trade formada por: fun c ao
valor otimo
V (k, x) := minJ
k
(z, u) [ (z, u) Z
k
(x) R
(Nk)m
,
onde
J
k
(z, u) :=
1
2
N1
j=k
(z
j
, Qz
j
) +u
j
, Ru
j
)),
Z
k
(x) := z R
(Nk+1)n
[ z
k
= x, z
j+1
= Az
j
+Bu
j
, j = k, . . . , N1 ;
equa c ao de otimalidade
V (k, x) = minV (k + 1, Ax +Bu) +
1
2
(x, Qx) +u, Ru)) [ u R
m
;
condi c oes de contorno
V (N, x) =
_
0 , se x = 0
, se x ,= 0
.
Repetindo a constru c ao feita anteriormente, temos:
V (N 1, x) =
1
2
x, S
N1
x),
sempre que o estado z
N
= 0 for atingvel a partir de x. Sendo assim,
podemos tratar este problema com o mesmo algoritmo ja visto para o
problema com apenas uma condi c ao de contorno.
steuer
2008/3/11
page 260
i
i
i
i
i
i
i
i
260 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
11.6 Problema de Decis oes Consecutivas
Iniciamos a sec c ao analisando um modelo generico para problemas
discretos de decis oes consecutivas, nos quais a fun c ao objetivo permite
a abordagem via programa c ao din amica. A seguir apresentamos um
resultado que garante existencia e unicidade de solu c oes para o modelo.
Problemas Markovianos de decis oes consecutivas s ao tratados em [Pi],
onde em particular e analisado o algoritmo de Howard.
Descri cao do Modelo
Suponha que um determinado processo evolui em intervalos de tempo
discretos t = j 0, 1, . . . , N + 1 e que, a cada instante de tempo j, o
estado seja representado por z
j
R
n
. O vetor de decis oes (ou controle)
e representado por v
j
j
R
m
, j 0, . . . , N, de modo que a evolu c ao
da variavel de estado e descrita por:
z
j+1
= T
j
(z
j
, v
j
), j 0, . . . , N,
onde o estado inicial z
0
e as fun c oes T
j
que descrevem a din amica do
sistema s ao conhecidos. Suponha ainda que as decis oes tenham que ser
tomadas de forma a minimizar a fun c ao objetivo (custos)
g(z
0
, . . . , z
N+1
, v
0
, . . . , v
N
) :=
N
j=0
l
j
(z
j
, z
j+1
, v
j
).
Para fun c oes objetivo dessa forma e possvel abordar o problema atraves
da programa c ao din amica. Temos:
Fun c ao valor otimo:
V (j, z):= min
N
k=j
l
k
(z
k
, z
k+1
, v
k
) [ z
j
=z, z
k+1
=T
k
(z
k
, v
k
), v
k
k
,
k = j, . . . , N.
Equa c ao de otimalidade:
V (j, z) = min
v
V (j + 1, T
j
(z, v)) +l
j
(z, T
j
(z, v), v).
Condi c oes de contorno:
V (N + 1, z) = 0, z Z
ad
.
steuer
2008/3/11
page 261
i
i
i
i
i
i
i
i
[SEC. 11.6: PROBLEMA DE DECIS
k=j
l(z
k
, v
k
) [ z
j
= z, z
k+1
= T(z
k
, v
k
), v
k
[0, 1], k = j, . . . , N
e a equa c ao de otimalidade:
V (j, z) = min
v
V (j + 1, T(z, v)) +l(z, v).
steuer
2008/3/11
page 262
i
i
i
i
i
i
i
i
262 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
Observe que a equa c ao (11.8) se escreve como
f(z) = (F(f))(z) := min
v[0,1]
f(vz +z(1v))g
1
(zv)g
2
(z(1v))
para este exemplo. 2
Um Teorema de Existencia
Dados os conjuntos Z
ad
R
n
e U
ad
R
m
respectivamente dos
estados e decis oes admissveis, considere a equa c ao funcional
(11.9) f(z) = min
uU
ad
(z, u)f(T(z, u)) +(z, u), z Z
ad
,
onde , : Z
ad
U
ad
R, T : Z
ad
U
ad
Z
ad
s ao dados e f : Z
ad
R
e a incognita. A existencia de solu c oes para equa c ao (11.9) e garantida
pelo seguinte resultado:
Teorema 196. Suponha que as seguintes condi c oes s ao satisfeitas:
U
ad
e compacto, Z
ad
B
(0) e fechado, 0 Z
ad
;
T(, u) e contnua, uniformemente em u U
ad
e existe [0, 1) tal
que
(11.10) [T(z, u)[ [z[, (z, u) Z
ad
U
ad
;
(, u) e contnua, uniformemente em u U
ad
e
(11.11) [(z, u)[ 1, (z, u) Z
ad
U
ad
;
(, u) e contnua, uniformemente em u U
ad
e
(11.12) (0, u) = 0 para todo u U
ad
;
(11.13)
n=0
h(
n
) < , onde h(r) := max
zZ
ad
, [z[r
max
uU
ad
[(z, u)[, 0 r .
Ent ao existe uma unica aplica c ao contnua f : Z
ad
R satisfazendo
f(0) = 0 e (11.9).
Demonstra c ao: Um desenvolvimento analogo ao apresentado na primeira
parte desta sec c ao nos permite escrever a equa c ao (11.9) como uma
steuer
2008/3/11
page 263
i
i
i
i
i
i
i
i
[SEC. 11.6: PROBLEMA DE DECIS
AO DIN
AMICA DISCRETA
Para n > 1, a verica c ao e feita de forma analoga, cando assim provada
a desigualdade (11.15). Observe que o mesmo artifcio nos permite esti-
mar [f
1
(z) f
0
(z)[ por
(11.16) max
zZ
ad
|z|r
[f
1
(z) f
0
(z)[ max
zZ
ad
|z|r
max
uU
ad
[(z, u)[ = h(r).
Denindo agora para n N
0
h
n
(r) := max
zZ
ad
, [z[r
[f
n+1
(z) f
n
(z)[, 0
r , obtemos de (11.15) e (11.16)
h
n
(r) h
n1
(r) h
0
(
n
r) h(
n+1
r), 0 r .
De (11.13), obtemos para z Z
ad
n=0
[f
n+1
(z) f
n
(z)[
n=0
h(
n
) < ,
provando que a serie
n=0
(f
n+1
(z) f
n
(z)) converge uniformemente em
Z
ad
. Dena agora a fun c ao f(z) :=
n=0
(f
n+1
(z)f
n
(z))+f
0
(z), z Z
ad
.
f e contnua por constru c ao. A propriedade f(0) = 0 segue de
f
0
(0) = 0 (devido a (11.12)),
f
n
(0) = 0 (devido a (11.10) e (11.12)).
A equa c ao (11.9) e obtida de (11.14) tomando o limite n e usando
o fato da sequencia (f
n
)
nN
convergir uniformemente para f em Z
ad
.
Para provar a unicidade, suponha que
f e uma outra solu c ao de (11.9).
Dena
k() := max
zZ
ad
|z|r
[f(z)
f(z)[, 0 r .
O mesmo procedimento utilizado acima nos fornece agora
max
zZ
ad
|z|r
[f(z)
f(z)[ max
zZ
ad
|z|r
[f(z)
f(z)[, 0 r .
Isto e , k(r) k(r) k(
n
r) . . . Tomando o limite n ,
obtemos (f e
f s ao contnuas)
k(r) k(0) = [f(0)
f(0)[ = 0, 0 r ,
completando assim a demonstra c ao.
steuer
2008/3/11
page 265
i
i
i
i
i
i
i
i
EXERC
ICIOS 265
Exerccios
11.1. Dados c > 0 e n N, considere o problema de minimiza c ao
_
_
_
Minimizar
n
i=1
x
i
sujeito a x
1
+. . . +x
n
= c.
a) Formule o problema acima como um problema de programa c ao
din amica, i.e. encontre fun c ao valor, equa c ao de otimalidade e condi c oes
de contorno.
b) Resolva o problema do tem a).
11.2. Um navio com capacidade para transportar 730 toneladas de
carga deve ser carregado com tres tipos de gr aos. As cargas a serem
transportadas s ao dadas na tabela abaixo:
Grao Peso (Ton) Valor
G1 100 360
G2 125 475
G3 250 1000
a) Usando programa c ao din amica, determine a forma otima (com rela c ao
ao valor da carga) de carregar o navio.
b) Resolva novamente o problema usando programa c ao linear.
11.3. Dados c N
0
, n N, considere o problema
_
_
_
Minimizar
n
i=1
p
i
z
i
sujeito a
n
i=1
w
i
z
i
c, z
i
N
0
, i = 1, . . . , n,
onde p
i
, w
i
N
0
, i = 1, . . . , n, s ao constantes fornecidas. Dena para
k = 1, . . . , n, j = 0, . . . , c a fun c ao
f
k
(j) := max
k
i=1
p
i
z
i
[
k
i=1
w
i
z
i
j, z
i
N
0
, i = 1, . . . , k.
a) Verique que f
k
(j) e a fun c ao valor para o problema de programa c ao
din amica correspondente. Determine a equa c ao de otimalidade e as
condi c oes de contorno.
b) Mostre que f
k
(j) e monotona n ao decrescente.
steuer
2008/3/11
page 266
i
i
i
i
i
i
i
i
266 EXERC
ICIOS
c) Resolva o problema para os dados n = 4, c = 14, p = (7, 8, 9, 24),
w = (5, 4, 6, 10).
11.4 (Problema do Caminho Mais Curto). Considere um Grafo
com vertices K
1
, . . . , K
N
. Suponha que cada par de vertices (K
i
, K
j
)
esteja unido por uma aresta de comprimento d
ij
. Os seguintes valores
s ao admissveis para d
ij
:
d
ij
<0 (Lucro!) ; d
ij
>0 (Custos!) ; d
ij
= (N ao existe comunica c ao!).
O objetivo e encontrar o caminho mais curto entre os vertices K
1
e K
N
.
a) Mostre que a fun c ao valor e da forma
(11.17)
V (i, k) := Comprimento do caminho mais curto de K
1
a K
k
, que atravessa no maximo i arestas.
b) Verique que a equa c ao de otimalidade e dada por:
(11.18) V (i, k) :=
_
min
j,=k
V (i 1, j) +d
jk
, k ,= 1
min
j1,...,N
V (i 1, j) +d
j1
, k = 1
.
c) Mostre que as condi c oes de contorno s ao da forma
V (0, k) :=
_
0 , k = 1
, k > 1
, V (1, 1) := 0.
d) Considere o grafo da Figura 11.3. Observe que as condi c oes iniciais
s ao
V (0, 1) = 0 , V (0, 2) = V (0, 3) = V (0, 4) = .
Encontre o caminho mais curto do vertice K
1
ao vertice K
4
.
11.5 (Problema da Aloca cao de Recursos). Este problema n ao
e exatamente din amico, ou seja n ao requer uma seq uencia de decis oes.
Suponha que, dadas X unidades de um determinado recurso (materia
prima, capital, . . . ), temos que distribu -las por N atividades A
1
, . . . ,
A
N
. Para cada atividade A
k
, temos uma fun c ao r
k
(x), que representa
o retorno (lucro) obtido pela atividade A
k
quando uma determinada
quantidade de recursos x 0, . . . , X e alocada a esta atividade (as
fun c oes r
k
s ao monotonas n ao decrescentes por hipotese). O obje-
tivo e encontrar uma aloca c ao otima dos X recursos pelas atividades
A
1
,. . . , A
n
, de modo a maximizar a fun c ao de produtividade
N
j=1
r
j
(x
j
).
steuer
2008/3/11
page 267
i
i
i
i
i
i
i
i
EXERC
ICIOS 267
K
1
K
2
K
3
K
4
d
d
d
d
d
d
d
d
T
c
2 3
5 1
-4 6
Figura 11.3: Grafo para o problema do caminho mais curto.
a) Verique que o problema pode ser escrito como
_
_
Maximizar
N
j=1
r
j
(x
j
)
sujeito a
(x
1
, . . . , x
n
) Z
N
, x
j
0, j = 1, . . . , N,
N
j=1
x
j
= X
A m de usar a programa c ao din amica, precisamos de uma variavel
que torne possvel denir a equa c ao de otimalidade de forma indutiva.
Armamos por hora que esta variavel e k, o ndice das atividades con-
sideradas (veja ultimo item do exerccio). Dena a fun c ao valor:
V (k, x) := Produtividade maxima obtida quando x unidades de
recurso s ao distribuidas pelas atividades A
k
, . . . , A
N
;
onde x 0, . . . , X e k 1, . . . , N.
b) Mostre que a fun c ao valor satisfaz a equa c ao de otimalidade
(11.19) V (k, x) = max
y0,...,x
V (k + 1, x y) +r
k
(y)
e as condi c oes de contorno
V (N, x) = r
N
(x).
c) Prove que o maximo da fun c ao de produtividade e dado por V (1, X).
steuer
2008/3/11
page 268
i
i
i
i
i
i
i
i
Captulo 12
Programacao Dinamica
Contnua
Consideramos neste captulo aplica c oes da programa c ao din amica a
problemas de controle com din amica contnua. A formula c ao dos proble-
mas aqui estudados e generica, abrangendo problemas n ao lineares, n ao
aut onomos, assim como restri c oes `as variaveis de controle. Em contra-
partida, a obten c ao dos resultados que dizem respeito a situa c oes t ao
gerais exige a formula c ao de condi c oes muito restritivas e muitas vezes
difceis de ser comprovadas.
O ponto principal deste captulo e a analise da fun c ao valor otimo
(ou fun c ao valor). Na Sec c ao 12.1 s ao demonstrados alguns resulta-
dos referentes `a regularidade (Lipschitz continuidade) desta fun c ao. Na
Sec c ao 12.2 e obtida uma rela c ao implcita entre a fun c ao valor e os
processos otimos, o princpio de Bellman. Na Sec c ao 12.3 analisamos
uma equa c ao diferencial parcial n ao linear de primeira ordem (equa c ao
de HamiltonJakobiBellman) e a rela c ao de suas solu c oes com a fun c ao
valor (teoremas de verica c ao). Na Sec c ao 12.4 estudamos os problemas
de controle com din amica linear e fun c ao objetivo quadratica. Para esta
famlia especial de problemas e possvel, resolvendo a equa c ao diferencial
de Riccati, obter a fun c ao valor e os controles otimos correspondentes.
12.1 Funcao Valor
Otimo
Nesta sec c ao associamos a uma dada famlia de problemas de con-
trole (que diferem apenas pela condi c ao inicial) uma fun c ao que esta
steuer
2008/3/11
page 269
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR
OTIMO 269
intrinsecamente relacionada com a solu c ao de cada um dos problemas
desta famlia. Esta rela c ao e expressa atraves de um princpio de otima-
lidade e de uma equa c ao diferencial, que constituem o objeto do estudo
das sec c oes subseq uentes.
Seja T > 0 xo. Dados t
0
[0, T] e z
0
R
n
, considere a seguinte
famlia de problemas de controle:
P(t
0
, z
0
)
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
T
t
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t [t
0
, T],
u L
1
([t
0
, T]; R
m
), u(t) q.s. em [t
0
, T],
onde L : [0, T] R
n
R
m
R, f : [0, T] R
n
R
m
R
n
e R
m
.
Observe que a din amica do sistema e descrita por uma equa c ao integral,
o que nos permite admitir trajetorias menos regulares. O conjunto dos
controles admissveis e dado por
U
ad
[t
0
, T] := u L
1
([t
0
, T]; R
m
) [ u(t) q.s. em [t
0
, T].
Denominamos por processos os pares (u, z
u
) U
ad
[t
0
, T] C([t
0
, T]; R
n
)
formados por controle e trajetoria correspondente. O conjunto dos pro-
cessos admissveis para P(t
0
, z
0
) e
T
t
0
,z
0
:= (u, z
u
) [ u U
ad
[t
0
, T], J(t
0
, z
0
; u, z
u
) < .
Deni cao 197. Dado u U
ad
[t
0
, T], denotamos a trajetoria correspon-
dente por z
u
. A fun c ao valor otimo e a aplica c ao V : [0, T] R
n
R
denida por
V (t
0
, z
0
) := infJ(t
0
, z
0
; u, z
u
) [ u U
ad
[t
0
, T].
Um controle u U
ad
[t
0
, T] e denominado controle otimo para P(t
0
, z
0
),
quando
V (t
0
, z
0
) = J(t
0
, z
0
; u, z
u
).
Neste caso, z := z
u
e denominada trajet oria otima e o par ( u, z) e
chamado de solu c ao ou processo otimo para o problema P(t
0
, z
0
).
2
Observa cao 198. Existencia e unicidade de solu c oes para o problema
P(t
0
, z
0
) podem ser garantidas ao impormos restri c oes especiais `as fun-
c oes L e f. Se supomos, por exemplo, que as fun c oes envolvidas na
steuer
2008/3/11
page 270
i
i
i
i
i
i
i
i
270 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
formula c ao do problema de controle otimo s ao apenas C
1
, podemos ter
situa c oes do tipo:
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
_
z
2
(s) + (u
2
(s) 1)
2
ds
sujeito a
z
t
(s) = u(s), q.s. em [0, 1], z(t
0
) = z
0
,
u L
1
([t
0
, 1]; R) [ u(t) R q.s. em [t
0
, 1].
Note que V (0, 0) = infJ(0, 0; u, z) [ u admissvel para P(0, 0) = 0, pois
a seq uencia de controles
u
n
(t) =
_
_
_
1 , t
(n3)/2
k=0
[2kh, (2k + 1)h]
1 , t
(n2)/2
k=0
[(2k + 1)h, (2k + 2)h]
com h = 1/n, n N, satisfaz [u
n
(t)[ = 1 q.s. em [0, 1] e ainda
J(0, 0; u
n
, z
u
n
) 0, quando n . Entretanto, n ao existe estrategia
u tal que J(0, 0; u, z
u
) = 0, pois isto implicaria em z
u
0 e, ao mesmo
tempo, [(z
u
)
t
(t)[ = 1 q.s. em [0, 1]. 2
Fazemos agora as seguintes hipoteses sobre a formula c ao do problema
P(t
0
, z
0
):
H1) Existe uma constante positiva K
1
tal que
[f(t, x, u)f(t, y, u)[+[L(t, x, u)L(t, y, u)[ K
1
[xy[, x, y R
n
para todo t [0, T], u ;
H2) Dado x R
n
, as fun c oes L(, x, ) e f(, x, ) s ao mensuraveis;
H3) Existe uma constante positiva K
2
tal que
[f(t, x, u)[ +[L(t, x, u)[ K
2
(1 +[x[), x R
n
,
para todo t [0, T], u ;
H4) Dados t [0, T], u , as fun c oes f(t, , u), L(t, , u) s ao continu-
amente diferenciaveis e as derivadas parciais f
z
, L
z
s ao contnuas
em [0, T] R
n
;
H5) e fechado.
steuer
2008/3/11
page 271
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR
OTIMO 271
Note que H3) e a mais interessante das hipoteses. Denominada por
crescimento linear, esta hipotese n ao somente garante existencia e uni-
cidade de solu c oes para a equa c ao da din amica, como tambem limita o
crescimento do integrando da fun c ao objetivo.
A m de obtermos as propriedades relevantes da fun c ao valor, pre-
cisamos de um lema auxiliar que estime o crescimento das trajetorias de
um sistema din amico.
Lema 199. Suponha que H1),. . . , H5) s ao satisfeitas. Seja s [0, T] e
x, x
1
R
n
com [x[ R, [x
1
[ R. Dado u U
ad
[s, T], dena
z(r) := x +
_
r
s
f(q, z(q), u(q))dq, z
1
(r) := x
1
+
_
r
s
f(q, z
1
(q), u(q))dq,
para r [s, T]. Ent ao existe constante K (que n ao depende de u) tal
que
(12.1) [z(r) x[ K(1 +R)[r s[, r [s, T];
(12.2) [z(r) z
1
(r)[ K(1 +R)[x x
1
[, r [s, T].
Demonstra c ao: Note que
[z(r) x[
_
r
s
[f(q, z(q), u(q)) f(q, x, u(q))[dq +
_
r
s
[f(q, x, u(q))[dq
K
1
_
r
s
[z(q) x[dq +K
2
_
r
s
(1 +[x[)dq.
Do Lema de Gronwall 264, obtemos
[z(r) x[ K(1 +[x[)[r s[, r [s, T],
provando (12.1). Para provar (12.2) note que
z(r) z
1
(r) =
_
r
s
_
f(q, z(q), u(q)) f(q, z
1
(q), u(q))
dq + (x x
1
).
Usando novamente o lema de Gronwall e H1) o teorema segue.
1
No teorema a seguir vericamos que as condi c oes H1), . . . H5) s ao
sucientes para que V esteja bem denida. Alem disso s ao discutidas
algumas propriedades da fun c ao valor.
1
Para mais detalhes sobre a constante K, veja o Exerccio 12.1.
steuer
2008/3/11
page 272
i
i
i
i
i
i
i
i
272 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Lema 200. Suponha que as hip oteses H1), . . . , H5) s ao satisfeitas.
Ent ao s ao verdadeiras as armativas:
a) J(s, z; u, z
u
) est a bem denido para todo (s, z) [0, T] R
n
e todo
u U
ad
[s, T].
b) V (s, z) est a bem denida para todo (s, z) [0, T] R
n
;
c) V e localmente lipschitz contnua em [0, T] R
n
, i.e. existe uma
constante K (que depende de T) tal que
(12.3) [V (s
1
, z
1
) V (s
2
, z
2
)[ K(1 +R)([s
1
s
2
[ +[z
1
z
2
[),
para todo (s
1
, z
1
), (s
2
, z
2
) [0, T] R
n
com [z
1
[ R, [z
2
[ R.
Demonstra c ao: Seja (s, z) [s, T] R
n
e u U
ad
[s, T]. Temos
ent ao
[J(s, z; u, z
u
)[
_
T
s
[L(r, z
u
(r), u(r)) L(r, z, u(r))[dr
+
_
T
s
[L(r, z, u(r))[dr
_
T
s
K
1
[z
u
(r) z[dr +
_
T
s
K
2
(1 +[z[)dr.
De (12.1), temos
(12.4)
[J(s, z; u, z
u
)[ K
1
K(1+[z[)
_
T
s
[rs[ds + K
2
T(1+[z[) < M < ,
provando a). Para provar b), basta observar que as constantes K, K
1
,
K
2
em (12.4) n ao dependem de u, logo a estimativa obtida e uniforme
em U
ad
[s, T].
O item c) e o mais interessante do teorema. Sejam (s
1
, z
1
), (s
2
, z
2
)
[s, T] R
n
com [z
i
[ R (suponha s
1
s
2
). Dado > 0 escolha
u
1
U
ad
[s
1
, T] e u
2
U
ad
[s
2
, T] tais que
V (s
i
, z
i
) J(s
i
, z
i
; u
i
, z
u
i
) /2, i = 1, 2.
Isto e sempre possvel, pois como vimos no item a), V esta bem denida.
Dena agora
u
1
(t) :=
_
u
1
(t) , t [s
1
, s
2
)
u
2
(t) , t [s
2
, T]
e u
2
:= u
1
[
[s
2
,T]
.
steuer
2008/3/11
page 273
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR
OTIMO 273
Temos ent ao
V (s
1
, z
1
) V (s
2
, z
2
) V (s
1
, z
1
) J(s
2
, z
2
; u
2
, z
u
2
) + /2
J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
) + /2,
e, analogamente,
V (s
1
, z
1
) V (s
2
, z
2
) J(s
1
, z
1
; u
1
, z
u
1
) /2 J(s
2
, z
2
; u
2
, z
u
2
).
De onde conclumos que
[V (s
1
, z
1
) V (s
2
, z
2
)[ + [J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[
+[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[.
Basta, portanto, estimar os termos
[J(s
1
, z
1
; u
1
, z
u
1
)J(s
2
, z
2
; u
2
, z
u
2
)[, [J(s
1
, z
1
; u
1
, z
u
1
)J(s
2
, z
2
; u
2
, z
u
2
)[.
Da deni c ao do funcional J, temos
[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[
_
s
2
s
1
L(r, z
u
1
(r), u
1
(r))dr
_
T
s
2
_
L(r, z
u
1
(r), u
1
(r)) L(r, z
u
2
(r), u
2
(r))
dr
_
s
2
s
1
L(r, z
u
1
(r), u
1
(r))dr
_
T
s
2
_
L(r, z
u
1
(r), u
2
(r)) L(r, z
u
2
(r), u
2
(r))
dr
K
2
_
s
2
s
1
(1 +[z
u
1
(r)[)dr +K
1
_
T
s
2
[z
u
1
(r) z
u
2
(r)[dr
K(1 +R)[s
1
s
2
[ +K(1 +R)[z
1
z
2
[,
onde K depende apenas de T, K
1
e K
2
. Para obter a ultima desigualdade
utilizamos o Lema 199 e a desigualdade
[z
u
1
(s
2
) z
u
2
(s
2
)[ [z
u
1
(s
2
) z
u
1
(s
1
)[ +[z
u
1
(s
1
) z
u
2
(s
2
)[.
De modo analogo provamos que
[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[ K(1 +R)([s
1
s
2
[ +[z
1
z
2
[).
steuer
2008/3/11
page 274
i
i
i
i
i
i
i
i
274 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Podemos ent ao concluir que
[V (s
1
, z
1
) V (s
2
, z
2
)[ +K(1 +R)([s
1
s
2
[ +[z
1
z
2
[),
onde a constante K n ao depende de z
1
, z
2
, s
1
, s
2
e . Como > 0 e
arbitrario, o teorema ca provado.
O item a) do Teorema 200 garante que, dado (s, z) [0, T] R
n
,
todo controle u U
ad
[s, T] esta associado a um processo de custo nito,
i.e. J(s, z; u, z
u
) < . Uma conseq uencia imediata deste fato e que,
para todo (s, z) [0, T] R
n
, temos
T
s,z
= (u, z
u
) [ u U
ad
[s, T].
O leitor atento percebe que a hipotese de crescimento linear H3)
permite a obten c ao das constantes K em (12.1), (12.2) e (12.3), sem que
seja preciso supor limitado. Resumindo, H3) nos permite provar a
Lipschitzcontinuiade da fun c ao valor, ainda que o conjunto de controles
seja ilimitado (veja Exerccio 12.4).
Observa cao 201. O teorema de Rademacher (veja [Mo]) garante que
uma fun c ao Lipschitz contnua e diferenciavel quase sempre. Portanto,
uma conseq uencia do item c) do Teorema 200 e que a fun c ao valor e dife-
renciavel em [0, T] R
n
quase sempre em rela c ao `a medida de Lebesgue.
2
12.2 Princpio de Bellman
Apresentamos nesta sec c ao um resultado de fundamental import ancia
para a verica c ao da otimalidade de processos admissveis. Trata-se do
princpio de otimalidade de Bellman. Este resultado e, por sua vez,
conseq uencia do seguinte lema chave da programa c ao din amica:
Lema 202. Seja (t
0
, z
0
) [0, T) R
n
, u U
ad
[t
0
, T] e z := z
u
, com
z(t
0
) = z
0
. Se as hip oteses H1), . . . , H5) s ao satisfeitas, s ao verdadeiras
as armativas:
a) Para todo s
1
, s
2
[t
0
, T], com s
1
s
2
, temos
(12.5) V (s
1
, z(s
1
)) V (s
2
, z(s
2
)) +
_
s
2
s
1
L(r, z(r), u(r))dr;
steuer
2008/3/11
page 275
i
i
i
i
i
i
i
i
[SEC. 12.2: PRINC
_
T
s
2
L(s, z(s), u(s)) ds +
_
s
2
t
0
L(s, z(s), u(s)) ds
= J(t
0
, z
0
; u, z) = V (t
0
, z
0
).
Reciprocamente, suponha que o controle u e tal que (12.6) e satis-
feita. Tomando s
1
:= t
0
e s
2
:= T em (12.6), temos que V (t
0
, z
0
) =
J(t
0
, z
0
; u, z). Logo, u e um controle otimo para P(t
0
, z
0
). (Usamos
tacitamente a identidade V (T, z(T)) = 0, a qual segue da deni c ao da
fun c ao valor.)
steuer
2008/3/11
page 276
i
i
i
i
i
i
i
i
276 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Corolario 203. Dado (t
0
, z
0
) [0, T] R
n
, seja u U
ad
[t
0
, T] um
controle otimo para P(t
0
, z
0
) e z := z
u
a trajet oria correspondente com
z(t
0
) = z
0
. Ent ao, a restri c ao u[
[t,T]
e um controle otimo para P(t, z(t)),
para todo t [t
0
, T).
Demonstra c ao: Segue diretamente do item b) do Lema 202 quando
escolhemos s
1
= t e s
2
= T.
Resumindo as conclus oes acima, o Corolario 203 nos permite enun-
ciar o princpio de optimalidade de Bellman da seguinte forma:
2
Se u U
ad
[t
0
, T] e um controle otimo para o problema P(t
0
, z
0
),
ent ao, para todo t [t
0
, T], a restri c ao u[
[t,T]
e um controle
otimo para o problema P(t, z
u
(t)).
Na sec c ao seguinte utilizamos a equa c ao (12.6) para obter uma equa-
c ao diferencial parcial, da qual a fun c ao valor otimo (quando composta
com a trajetoria otima do problema) e solu c ao.
12.3 Equacao de HamiltonJakobiBellman
Usando a nota c ao da sec c ao anterior, consideramos a fun c ao valor
otimo V ao longo da trajetoria otima denida no intervalo [t
0
, T] do
problema P(t
0
, z
0
)
V (t, z(t)) =
_
T
t
L(s, z(s), u(s)) ds.
Derivando formalmente em rela c ao a t obtemos a identidade
V
t
(t, z(t)) +
V
z
(t, z(t)), f(t, z(t), u(t))
_
= L(t, z(t), u(t)),
a qual motiva a formula c ao da principal equa c ao da programa c ao din a-
mica para problemas de controle otimo contnuos.
Teorema 204. Considere o problema P(t
0
, z
0
) sujeito ` as hip oteses
H1), . . . , H5). S ao v alidas as seguintes armativas:
a) Se V e diferenci avel em (t, z) [t
0
, T] R
n
, ent ao
(12.7)
V
t
(t, z) +
V
z
(t, z), f(t, z, u)
_
+ L(t, z, u) 0,
2
Veja Sec c ao 11.1.
steuer
2008/3/11
page 277
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
AO DE HAMILTONJAKOBIBELLMAN 277
para todo u ;
b) Seja u U
ad
[t
0
, T] um controle otimo para P(t
0
, z
0
). Se V e di-
ferenci avel ao longo da trajet oria otima (t, z(t)), para todo t (t
0
, T),
ent ao
(12.8)
V
t
(t, z(t)) + min
u
_
V
z
(t, z(t)), f(t, z(t), u)
_
+ L(t, z(t), u)
_
= 0,
para todo t (t
0
, T), sendo o mnimo obtido em u = u(t) para cada t.
Demonstra c ao: Seja u e z uma solu c ao local
3
de
z(s) = z +
_
s
t
f(r, z(r), u) dr.
Logo, existe > 0 tal que a trajetoria (s, z(s)) esta bem denida no
intervalo [t, t + ]. Seja agora u
(r), r [t +, T]
.
O controle assim construdo satisfaz u U
ad
[t, T] e sua trajetoria corres-
pondente e tal que z
u
(s) = z(s), s [t, t +). Do item a) do Lema 202,
temos que para todo 0 < h
V (t, z(t)) V (t +h, z(t +h)) +
_
t+h
t
L(r, z(r), u(r)) dr.
Logo,
1
h
[V (t +h, z(t +h)) V (t, z(t))]
1
h
_
t+h
t
L(r, z(r), u) dr.
Tomando o limite h 0, obtemos (12.7), provando assim o item a). A
m de provar b), repetimos a constru c ao feita no item anterior para o
ponto (t, z) := (t, z(t)), obtendo assim para todo u
0
d
dt
V (t, z(t)) + L(t, z(t), u)
=
V
t
(t, z(t)) +
V
x
(t, z(t)), f(t, z(t), u)
_
+ L(t, z(t), u).
3
A existencia de tal solu c ao local e garantida pela hip otese sobre a regularidade
de f feita em H2).
steuer
2008/3/11
page 278
i
i
i
i
i
i
i
i
278 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Note ainda que o item b) do Lema 202 com s
1
:= t e s
2
:= t +h implica
em
1
h
[V (t +h, z(t +h)) V (t, z(t))] =
1
h
_
t+h
t
L(r, z(r), u(r)) dr.
Tomando o limite h 0, obtemos (12.8) e o teorema ca provado.
Observa cao 205. Para utilizar o Teorema 204 precisamos antes garan-
tir a regularidade enunciada para V . Na Observa c ao 201, conclumos
que V e diferenciavel quase sempre, o que ainda n ao nos basta. Via de
regra, n ao e de se esperar que V seja mais do que diferenciavel quase
sempre, como podemos vericar no seguinte exemplo:
_
_
Minimizar J(t
0
, z
0
; u, z) := [z(1) z
0
]
sujeito a
u U
ad
[t
0
, 1] := w L
1
([t
0
, 1]; R) [ w(s) [0, 1] q.s. em [t
0
, 1],
z
t
= z u, q.s. em [t
0
, 1], z(t) = z
0
.
Temos aqui L(t, z, u) = zu, f(t, z, u) = zu, T = 1 e = [0, 1] R.
Note que
[f(t, x
1
, u)f(t, x
2
, u)[ +[L(t, x
1
, u)L(t, x
2
, u)[2[x
1
x
2
[, x
1
, x
2
R,
[f(t, x, u)[ +[L(t, x, u)[ 2(1 +[x[), x R,
para todo (t, u) [0, T] . Logo as hipoteses H1), . . . , H5) s ao
satisfeitas.
E de simples verica c ao o fato da fun c ao valor ser dada por
V (t, z) =
_
z ze
1t
, z 0
0 , z < 0
,
pois os controles otimos s ao u 0 para z 0 e u 1 para z > 0. A
fun c ao V obviamente n ao e continuamente diferenciavel em [0, T] R.
Note ainda que V e apenas localmente lipschitz contnua em [0, T] R.
2
O Teorema 204 n ao e em geral muito util na determina c ao do con-
trole otimo, pois a fun c ao valor otimo e, a princpio, desconhecida. En-
tretanto, o teorema nos permite intuir que a fun c ao valor otimo pode
ser denida pela equa c ao diferencial parcial
(12.9)
V
t
(t, z) + min
u
_
V
z
(t, z), f(t, z, u)
_
+ L(t, z, u)
_
= 0.
steuer
2008/3/11
page 279
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
AO DE HAMILTONJAKOBIBELLMAN 279
Resultados dessa natureza s ao conhecidos na literatura como teoremas
de verica c ao. A m de analisarmos tais resultados, denimos, como no
Captulo 10, a fun c ao de Hamilton
H : [0, T] R
n
R
n
R
m
R,
(t, z, , u) , f(t, z, u)) + L(t, z, u)
e a fun c ao auxiliar
H : [0, T] R
n
R
n
R,
(t, z, ) min
u
, f(t, z, u)) + L(t, z, u).
Teorema 206. Suponha que H1), . . . , H5) s ao satisfeitas. Seja W :
[0, T] R
n
R uma aplica c ao continuamente diferenci avel satisfazendo
(12.10)
W
t
(t, z) + min
u
_
W
z
(t, z), f(t, z, u)
_
+L(t, z, u) = 0,
em (t, z) (0, T) R
n
e ainda a condi c ao nal
(12.11) W(T, z) = 0, z R
n
.
Ent ao, dado (t
0
, z
0
) [0, T] , um controle u U
ad
[t
0
, T] e sua tra-
jet oria correspondente z := z
u
formam um processo otimo para P(t
0
, z
0
)
se
H(t, z(t),
W
z
(t, z(t)), u(t)) = H(t, z(t),
W
z
(t, z(t))), t [t
0
, T].
Neste caso, ao longo da trajet oria otima temos
W(t, z(t)) = V (t, z(t)), t [t
0
, T].
Demonstra c ao: Seja t [t
0
, T), u U
ad
[t, T] um controle admissvel
para P(t, z(t)) e z := z
u
. Temos ent ao
J(t, z(t); u, z)
=
_
T
t
L(r, z(r), u(r)) dr
=
_
T
t
L(r, z(r), u(r)) dr + W(t, z(t)) +
_
T
t
d
dr
W(r, z(r)) dr
=
_
T
t
_
L(r, z(r), u(r)) +
W
dr
(r, z(r)) +H(r, z(r),
W
z
(r, z(r))
_
dr
+W(t, z(t)) W(t, z(t)),
steuer
2008/3/11
page 280
i
i
i
i
i
i
i
i
280 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
onde a ultima desigualdade e conseq uencia de (12.10). De forma analoga,
obtemos
W(t, z(t)) = W(t, z(t)) +
_
T
t
_
L(r, z(r), u(r)) +
d
dr
W(r, z(r))
_
dr
= W(T, z(T)) +
_
T
t
L(r, z(r), u(r)) dr
= J(t, z(t); u, z).
Como o controle u U
ad
[t, T] e arbitrario, temos que W(t, z(t)) =
J( z, u; t, z(t)) = V (t, z(t)) e o teorema segue.
A equa c ao (12.10) e a conhecida equa c ao de HamiltonJakobi
Bellman (HJB). A equa c ao leva o nome dos tres pioneiros que con-
tribuiram para o seu desenvolvimento com as seguintes abordagens:
Hamilton obteve resultados relacionando o calculo variacional e a me-
c anica classica (fun c ao de Hamilton); Jakobi investigou a teoria de con-
di c oes sucientes no calculo variacional (campos de trajetorias); Bell-
man trouxe esses resultados para a programa c ao din amica e chegou `a
formula c ao aqui apresentada. Note que podemos utilizar a fun c ao de
Hamilton para reescrever a equa c ao HJB na forma
(12.12)
V
t
(t, z) + H(t, z,
V
z
(t, z)) = 0, (t, z) (0, T) R
n
(compare com a condi c ao de maximo do Teorema 178).
Caso a fun c ao valor n ao seja diferenciavel, e possvel usar resultados
da chamada an alise n ao suave para, ainda assim, caracterizar a fun c ao
valor como solu c ao da equa c ao HJB. Neste caso tanto os conceitos de
derivada, quanto os de solu c ao de uma equa c ao diferencial s ao diferen-
tes dos usados no Teorema 206: o conceito de derivada corresponde `as
derivadas de Dini enquanto que para a equa c ao HJB usa-se os conceitos
de subsolu c ao e supersolu c ao de Dini. O leitor interessado encontra
maiores detalhes em [BaCa] ou [CLSW]. Em particular, o Captulo 4 de
[CLSW] e dedicado a aplica c oes da analise n ao suave `a teoria de controle
otimo e a programa c ao din amica. Em [BaCa] s ao tratados problemas
de controle otimo em horizonte innito de tempo (veja Sec c ao 10.2 e
Aplica c ao 190). Em ambas as referencias acima, assim como em [BLS2],
e vericado o fato dos conceitos de solu c ao de Dini e solu c ao viscosa
(veja Captulo 13) coincidirem.
steuer
2008/3/11
page 281
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
AO DE HAMILTONJAKOBIBELLMAN 281
Observa cao 207. O Teorema 206 nos permite desenvolver um esquema
para calcular tanto o controle otimo, quanto a fun c ao valor:
Encontre U
(t, z, ))
= inf
u
, f(t, z, u)) + L(t, z, u)
(aqui e um par ametro de U
).
Obtenha a solu c ao V = V (t, z) da equa c ao diferencial parcial (em
geral n ao linear):
(12.14)
V
t
+
V
z
, f(t, z, U
(t, z;
V
z
))
_
+ L(t, z, U
(t, z,
V
z
)) = 0,
com a condi c ao de contorno V (T, z) = 0, z R
n
.
Substitua :=
V
z
(t, z) na express ao de U
(, z(),
V
z
(, z())),
onde z(t) = z
0
+
_
t
t
0
f(r, z(r), u(r))dr.
Em muitos problemas de import ancia pratica, o esquema acima n ao
pode ser levado a cabo. Na Sec c ao 12.4 investigamos uma famlia espe-
cial de problemas (linear-quadraticos), para os quais o esquema acima
fornece efetivamente o controle otimo para qualquer condi c ao inicial.
2
Observa cao 208. O Teorema 206 nos leva a concluir que a programa c ao
din amica para problemas de controle contnuos se baseia na seguinte
estrutura:
Fun c ao valor otimo:
V (t, z) := inf J(t, z; u, z
u
) [ u e admissvel para P(t, z);
Equa c ao de otimalidade:
V
t
(t, z) + H(t, z,
V
z
(t, z)) = 0, (t, z) (0, T) R
n
;
Condi c ao de contorno:
V (T, z) = 0, z R
n
.
Neste ponto, um paralelo com a programa c ao din amica para problemas
discretos e facilmente tra cado (veja Observa c ao 191). 2
steuer
2008/3/11
page 282
i
i
i
i
i
i
i
i
282 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Observa cao 209. O item b) do Teorema 204 fornece condi c oes neces-
sarias para otimalidade de uma estrategia de controle. As condi c oes
de otimalidade discutidas no Captulo 10 (princpio do maximo) podem
ser obtidas a partir da equa c ao HJB, desde que determinadas hipoteses
sobre a regularidade de V e U
z
V
z
+ U
z
f
u
V
z
+ V
zz
f + L
z
+ U
z
L
u
= 0.
Logo,
V
tz
V
zz
f = U
z
(f
u
V
z
+L
u
) + f
z
V
z
+ L
z
.
Quando o termo U
z
(f
u
V
z
+L
u
) e identicamente nulo, a fun c ao adjunta
denida por (t) := V
z
(t, z(t)) satisfaz
t
= f
z
V
z
L
z
,
que e a denominada equa c ao adjunta. Observando a regularidade das
fun c oes envolvidas, obtemos o seguinte conjunto de condi c oes necessarias
para otimalidade de um processo (z, u):
z
t
= +
H
, z(t
0
) = z
0
,
t
=
H
z
, (T) = 0,
H(t, z(t), (t), u(t)) = min
w
H(t, z(t), (t), w),
onde H = H(t, z, , u) e a fun c ao de Hamilton. O sistema acima para
as variaveis (z, ) e denominado sistema Hamiltoniano.
Para maiores detalhes sobre a rela c ao entre a programa c ao din amica
e o princpio do maximo, consulte [FlRi, Sec c ao 4.8]. 2
Exemplo 210. Calculamos neste exemplo a fun c ao valor otimo para o
problema na Observa c ao 198:
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
_
z
2
(s) + (u
2
(s) 1)
2
ds
sujeito a
z
t
(s) = u(s), q.s. em [t
0
, 1], z(t
0
) = z
0
,
u L
1
([t
0
, 1]; R) [ u(t) R q.s. em [t
0
, 1],
steuer
2008/3/11
page 283
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
AO DE HAMILTONJAKOBIBELLMAN 283
onde t
0
[0, 1]. Vericamos na Observa c ao 198 que V (0, 0) = 0. Um
argumento analogo nos permite concluir que V (t
0
, 0) = 0 e ainda que
n ao existe estrategia otima para o problema P(t
0
, 0).
Se z
0
,= 0 e [z
0
[ < 1 t
0
, o controle u com u(s) = sign(z
0
),
s [t
0
, ], onde = t
0
+[z
0
[ < 1, nos permite atingir o estado z() = 0.
A partir da, argumentamos como no problema P(, 0) para concluir que
n ao existe estrategia otima.
Se z
0
,= 0 e [z
0
[ > 1 t
0
, e facil vericar que o controle dado por
u(s) = sign(z
0
), s [t
0
, 1] e otimo para P(t
0
, z
0
).
A argumenta c ao acima nos permite calcular a fun c ao valor otimo:
V (t, z) =
_
_
_
1
3
[z[
3
, [z[ < 1 t
0 , z = 0
1
3
[z[
3
1
3
([z[ +t 1)
3
, [z[ > 1 t
.
A equa c ao HJB se escreve como
4
V
t
V
z
+ z
2
= 0, (t, z) [0, 1] R.
A verica c ao do fato de P(t
0
, z
0
) n ao possuir solu c ao para [z
0
[ < 1 t
0
pode ainda ser feita atraves do Teorema 206, pois n ao existe controle
admissvel u tal que o mnimo na equa c ao HJB (12.10) (substituindo W
por V ) ocorra em w = u(t). 2
Exemplo 211. Calculamos neste exemplo a fun c ao valor otimo para o
problema
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
z
2
(s) ds
sujeito a
z
t
(s) = u(s), q.s. em [t
0
, 1]; z(t
0
) = z
0
,
[u(t)[ 1 q.s. em [t
0
, 1].
A fun c ao de Hamilton e a fun c ao auxiliar H s ao dadas por
H(t, z, u, ) = u + z
2
e H(t, z, ) = [[ + z
2
.
4
Como H(t, z, u, ) = , f(t, z, u)) +L(t, z, u) = u +z
2
+ (u 1)
2
, temos
1(t, z, ) = min
u
|H(t, z, u, ) = [[ + z
2
.
steuer
2008/3/11
page 284
i
i
i
i
i
i
i
i
284 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Portanto, U
e dado por
U
(t, z, ) =
_
sign() , ,= 0
? , = 0
.
A equa c ao HJB e dada por
V
t
V
z
+ z
2
= 0, (t, z) [0, 1] R,
e a condi c ao de contorno e V (1, z) = 0, z R. Resolvendo a equa c ao
diferencial, encontramos a fun c ao valor otimo
V (t, z) =
_
1
3
[z[
3
, t +[z[ < 1
1
3
[z[
3
1
3
([z[ +t 1)
3
, t +[z[ 1
.
2
Exemplo 212. Nos problemas de controle relacionados com o calculo
variacional, e possvel deduzir a equa c ao de EulerLagrange a partir do
sistema Hamiltoniano apresentado na Observa c ao 209 (compare com o
Exemplo 1.2.8). Considere o seguinte problema:
_
_
_
Minimizar I(z) :=
_
t
1
t
0
L(t, z(t), z
t
(t)) dt
sujeito a
z
t
= u, z(t
0
) = z
0
, z(t
1
) = z
1
.
Podemos analisa-lo no contexto dos problemas de controle, denindo
f(t, z, u) = u e impondo a condi c ao nal (t
1
, z
1
) = 0, onde (t, z) =
(t t
1
, z z
1
). Se z e uma trajetotia otima para o problema, a variavel
adjunta correspondente satisfaz a equa c ao diferencial
t
(t) = L
z
(t, z(t), z
t
(t)).
A condi c ao U
z
(f
u
V
z
+ L
u
) = U
z
(V
z
+ L
u
) 0 (ver Observa c ao 209) e
satisfeita se exigirmos V
z
= L
u
. Logo, da deni c ao da variavel adjunta
temos
t
(t) =
d
dt
_
V
z
_
=
d
dt
_
L
u
_
.
Substituindo na equa c ao adjunta, temos
L
z
d
dt
_
L
z
t
_
= 0,
que e a equa c ao de EulerLagrange para o problema variacional. 2
steuer
2008/3/11
page 285
i
i
i
i
i
i
i
i
[SEC. 12.4: PROBLEMA DE CONTROLE LINEAR-QUADR
ATICO 285
Exemplo 213. Neste exemplo calculamos o controle otimo para o pro-
blema
_
_
Minimizar J(u, z) :=
_
2
0
[tz(t)
2
+u(t)
2
)] dt
sujeito a
[u(s)[ 1/2 q.s. em [0, 2]
z
t
= u, z(0) = 1
Como o tempo nal e xo, escolhemos em nossa formula c ao (t
1
, z) :=
t
1
2. Este e um problema especial em que a equa c ao diferencial da
din amica e linear e a fun c ao objetivo e quadratica e estritamente con-
vexa. Na Sec c ao 12.4, verica-se que essas condi c oes s ao sucientes para
garantir tanto existencia quanto unicidade de solu c oes para o problema
de controle. A equa c ao HJB se escreve:
W
t
(t, z) + min
[u[1/2
_
W
z
(t, z)u + tz
2
+ u
2
_
= 0,
de onde obtemos:
2U
(t, z; ) =
_
_
_
1 , < 1
, 1 1
1 , > 1
.
Substituindo U
_
Minimizar J(t
0
, z
0
; u, z) :=
1
2
_
1
t
0
qu(t)
2
dt +
1
2
z(1)
2
sujeito a
u U
ad
[t
0
, 1] := L
1
([t
0
, 1]; R
m
),
z
t
= z +u(t), q.s. em [t
0
, 1], z(t
0
) = z
0
,
steuer
2008/3/11
page 286
i
i
i
i
i
i
i
i
286 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
com condi c ao inicial (t
0
, z
0
) [0, 1] R
n
. Tal problema e denominado
P(t
0
, z
0
). A hipotese q > 0 reete o fato da execu c ao de uma estrategia
de controle estar associada a custos. A fun c ao de Hamilton e dada por:
H(t, z, u, ) = , f(t, z, u)) + L(t, z, u) = (z +u) +
1
2
qu
2
,
de onde obtemos
H(t, z, ) = z
2
2q
.
A equa c ao HJB se escreve
V
t
(t, z) + z
V
z
(t, z)
1
2q
_
V
z
(t, z)
_
2
= 0
e as condi c oes de contorno s ao
V (1, z) =
1
2
z
2
, z R.
A m de determinar a fun c ao valor, supomos que esta se deixa escrever
na forma
V (t, z) :=
1
2
v(t)z
2
, (t, z) [0, 1] R.
Substituindo na equa c ao HJB, obtemos para v o problema de valor ini-
cial:
_
v
t
=
v
2
q
2v
v(1) = 1
.
Atraves do metodo de separa c ao de variaveis encontramos a solu c ao:
v(s) =
2qe
2(1s)
e
2(1s)
+ (2q 1)
, s [0, 1].
Uma vez conhecida a fun c ao valor, podemos calcular a estrategia otima
de controle e a respectiva trajetoria otima para o problema P(0, z
0
).
Obtemos desta forma
u(t) = U
(t, z,
V
z
(t, z)) =
v(t)
q
z, (t, z) [0, 1] R
(note que U
E possvel provar que u e unico pois, como q > 0, a fun c ao objetivo e estritamente
convexa em u.
steuer
2008/3/11
page 287
i
i
i
i
i
i
i
i
[SEC. 12.4: PROBLEMA DE CONTROLE LINEAR-QUADR
ATICO 287
Analisamos agora a famlia de problemas de controle com din amica
linear e fun c ao objetivo quadratica. Considere o funcional
J(t
0
, z
0
; z, u) :=
1
2
z(T), Dz(T))
+
1
2
T
_
t
0
_
(z(t), u(t)),
_
M(t) R(t)
R(t)
N(t)
__
z(t)
u(t)
_
_
dt,
(onde z = z
u
) e o problema de controle
P(t
0
, z
0
)
_
_
Minimizar J(t
0
, z
0
; u, z)
sujeito a
u U
ad
:= L
1
([t
0
, T]; R
m
),
z
t
= A(t)z +B(t)u, z(t
0
) = z
0
,
onde t
0
[0, T], z
0
R
n
, A, M : [0, T] R
n,n
, B, N : [0, T] R
n,m
, R :
[0, T] R
m,m
e D R
n,n
. Consideramos na formula c ao do problema
as seguintes hipoteses:
A1) N ao s ao feitas restri c oes `as variaveis de controle ( = R
m
);
A2) O tempo nal T e xado;
A3) As aplica c oes A, B, M, N, R s ao contnuas;
A4) D e positiva semidenida e N e positiva denida para todo t
[t
0
, t
1
];
A5)
_
M(t) R(t)
R(t)
N(t)
_
e positiva semidenida para todo t [0, T].
Observa cao 214. A exigencia N(t) > 0 substitui a ausencia de restri-
c oes no controle, enquanto que as hipoteses sobre D e (
M R
R
N
) asseguram
que a fun c ao objetivo representa os custos correspondentes `a execu c ao
de uma estrategia de controle.
2
Note que o problema linear-quadratico pode ser tratado seguindo a
abordagem apresentada na Observa c ao 207. A fun c ao de Hamilton, que
e dada por
H(t, z, u, ) := , A(t)z +B(t)u) +
1
2
_
z, M(t)z) + z, R(t)u)
+ u, R
(t)z) + u, N(t)u)
_
,
steuer
2008/3/11
page 288
i
i
i
i
i
i
i
i
288 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
depende quadraticamente da variavel de controle. Portanto, temos
6
U
(t, z, ) = N
1
(t) (B
(t) + R
(t)z),
de onde segue que
H(t, z, ) = , A(t)z B(t)N
1
(t)R
(t)z) +
1
2
z, M(t)z)
1
2
_
, B(t)N
1
(t)B
(t)z)
_
e a equa c ao HJB se escreve
V
t
+
_
V
z
, A(t)z B(t)N
1
(t)R
(t)z
_
1
2
_
V
z
, B(t)N
1
(t)B
(t)
V
z
_
+
1
2
_
z, M(t)z) z, R(t)N
1
(t)R
(t)z)
= 0.
Fazemos agora a hipotese mais importante do desenvolvimento, que nos
permite efetivamente determinar V . Suponha que a fun c ao valor para o
problema linear-quadratico e da forma:
V (t, z) :=
1
2
z, Q(t)z), (t, z) [0, T] R
n
,
onde Q : [0, T] R
n,n
e continuamente diferenciavel. Como a fun c ao
objetivo representa somente custos (i.e. J 0), podemos supor ainda
que Q(t) e positiva semidenida para todo t [0, T]. Substituindo a
express ao de V na equa c ao HJB, obtemos
7
0 = z, Y (t)z),
6
Observe que
H
u
(t, z, u, ) = B
(t) + R
(t) z + N(t) u.
7
No problema linear-quadr atico, a dependencia de U
em rela c ao ao multiplicador
de Lagrange pode ser retirada, pois por hip otese (t) = V
z
(t, z) = Q(t)z(t). Temos
assim
U
(t, z,
V
z
) = U
(t, z) = N(t)
1
(B
(t)Q(t) +R
(t)) z.
steuer
2008/3/11
page 289
i
i
i
i
i
i
i
i
[SEC. 12.4: PROBLEMA DE CONTROLE LINEAR-QUADR
ATICO 289
onde
Y (t) = Q
t
(t) + Q(t)A(t) + A
(t)Q(t) + M(t)
(Q(t)B(t) +R(t)) N(t)
1
(B
(t)Q(t) +R(t)).
A tarefa que se imp oe, portanto, e a de encontrar uma fun c ao matricial
Q tal que Y (t) 0. O teorema apresentado a seguir e o desdobramento
natural dos resultados ate aqui obtidos.
Teorema 215. Suponha que as hip oteses A1), . . . , A5) s ao satisfeitas.
Ent ao o problema linear-quadr atico P(t
0
, z
0
) possui como unica solu c ao
o par ( z, u), onde o controle otimo u e da forma
(12.15) u(s) = U
(s, z) := N(s)
1
(B
(s)Q(s)+R(s))z, s [t
0
, T].
A fun c ao matricial Q e solu c ao de
(12.16)
dQ
dt
=QA(t) A
(t)Q M(t)
+ (QB(t) +R(t)) N(t)
1
(B
(t)Q+R(t))
no intervalo (0, T) e satisfaz a condi c ao de contorno nal
(12.17) Q(T) = D.
Demonstra c ao: A solu c ao Qde (12.16), (12.17) esta unicamente denida
em um intervalo maximo de existencia (t
t
, T], com t
t
< T. Sabemos
ainda que Q e simetrica, pois todas as matrizes-coeciente da equa c ao
diferencial de Riccati o s ao (veja Exerccio 12.3).
Dena a fun c ao W : (t
t
, T] R
n
R por W(t, x) := x, Q(t)x) e con-
sidere o seguinte problema de controle:
P(s, x)
_
_
_
Minimizar z(T), Dz(T)) +
_
T
s
L(r, z(r), u(r)) dr
sujeito a
z
t
= A(r)z +B(r)u, z(s) = x,
onde
L(r, y, w) :=
_
(y w),
_
M(r) R(r)
R(r)
N(r)
__
y
w
__
, (r, y) (t
t
, T)R
n
.
Da escolha de Q como solu c ao de (12.16), conclumos que, para todo
(s, x) (t
t
, T) R
n
, vale
W
t
(s, x) + min
wR
m
__
W
x
(s, x), A(s)x +B(s)w
_
+ L(s, x, w)
_
= 0,
steuer
2008/3/11
page 290
i
i
i
i
i
i
i
i
290 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
sendo o mnimo atingido em w = U
(s, x) = N(s)
1
(B
(s)Q(s) +
R(s))x. Alem disso, temos ainda que W(T, x) = x, Dx), x R
n
.
Agora, dados (s, x) (t
t
, T) R
n
, denimos z : [s, T] R
n
como a
solu c ao do problema de valor inicial
z
t
= A(t)z + B(t)U
:= u + (u u).
Denotamos a trajetoria correspondente por z
:= z
u
e o custo associado
por I() := J(t
0
, z
0
; u
, z
2
I
tt
(0).
8
A constante c e calculada no Exerccio 12.2.
steuer
2008/3/11
page 291
i
i
i
i
i
i
i
i
[SEC. 12.4: PROBLEMA DE CONTROLE LINEAR-QUADR
ATICO 291
Note que I
t
(0) = 0, pois u e mnimo global de J (logo, = 0 e mnimo
local de I), enquanto que
I
tt
(0) =
_
T
t
0
, z
) J(t
0
, z
0
; u, z
u
) = I() I(0) > 0.
Como u U
ad
e > 0 s ao arbitrarios, a unicidade ca provada.
A equa c ao (12.16) e denominada equa c ao diferencial de Riccati. Esta
equa c ao diferencial corresponde a uma forma particular da equa c ao de
EulerLagrange para os problemas linear-quadraticos.
Corolario 216. Seja u o controle otimo obtido no Teorema 215, z := z
u
sua trajet oria correspondente e Q a solu c ao da equa c ao diferencial de
Riccati (12.16). Dena a aplica c ao
: [t
0
.T] t Q(t) z(t) R
n
.
S ao v alidas as armativas:
a) A fun c ao
e solu c ao da equa c ao diferencial
t
(t) = A(t)
N(t)
__
z(t)
u(t)
__
dt,
= J(t, z(t); u[
[t,T]
, z[
[t,T]
)
= V (t, z(t)),
para todo t [t
0
, T].
Demonstra c ao: Para provar a), basta substituir as express oes obtidas
para u e Q
t
em (12.15) e (12.16) na equa c ao
t
(t) = Q
t
(t) z(t) + Q(t) (A(t) z(t) +B(t) u).
Quanto ao item b), a armativa ja foi provada na demonstra c ao do
Teorema 215, quando vericamos que V (t, z) = z, Q(t)z), para (t, z)
[0, T] R
n
.
steuer
2008/3/11
page 292
i
i
i
i
i
i
i
i
292 [CAP. 12: PROGRAMAC
AO DIN
AMICA CONT
INUA
Uma analise da solubilidade das equa c oes diferenciais de Riccati (n ao
somente as oriundas do problema linear-quadratico, como tambem a
equa c ao geral de Riccati) pode ser encontrada em [Bar, Captulo 5].
Corolario 217 (Princpio do Maximo). Seja u o controle otimo
fornecido pelo Teorema 215 para o problema P(t
0
, z
0
). Dena a aplica c ao
H : [0, T] R
n
R
n
R
m
R por
(12.18)
H(t, z, , u) :=, A(t)z +B(t)u)
+
1
2
_
(z, u),
_
M(t) R(t)
R(t)
N(t)
__
z
u
__
.
Ent ao o problema de valor de contorno
z
t
= +
H
t
=
H
z
(t, z, , u(t)), (T) = Dz(T) (12.20)
possui solu c ao ( z,
), a qual satisfaz
(12.21) H(t, z(t),
(t), u), t [t
0
, T].
Demonstra c ao: Seja z a trajetoria correspondente ao controle u e es-
colha
de acordo com o Corolario 216. Um simples calculo prova que
(12.19), (12.20) s ao satisfeitas pelo par ( z,
). A equa c ao (12.21), por
sua vez, esta esta de acordo com o fato do controle otimo u satisfazer
(12.15).
Do Corolario 217 ca claro que a aplica c ao H denida em (12.18) e
a fun c ao de Hamilton para o problema P(t
0
, z
0
). No exemplo a seguir
estudamos a utiliza c ao desse corolario para determinar a solu c ao de um
problema escalar.
Exemplo 218. Considere o problema de controle otimo escalar:
_
_
_
Minimizar
_
T
0
(u(t)
2
+z(t)
2
) dt
sujeito a
z
t
= z +u, z(0) = z
0
.
As condi c oes (12.19), (12.20) e (12.21) nos levam `as seguintes equa c oes:
z
t
= z +u, z(0) = z
0
,
t
= z, (T) = 0,
E
ATICO 293
Eliminando u nas duas primeiras equa c oes, obtemos o sistema
_
z
t
= z , z(0) = z
0
,
t
= z +, (T) = 0.
Este problema de valor de contorno pode ser facilmente resolvido utili-
zando-se a teoria de sistemas lineares, pois a solu c ao geral deste tipo de
problema e conhecida. A equa c ao diferencial de Riccati e a condi c ao de
contorno se escrevem neste caso como
Q
t
+ 2QQ
2
= 1, Q(T) = 0.
Ou seja, a equa c ao diferencial de Riccati e escalar. Apesar de ser n ao
linear, podemos obter, atraves de uma mudan ca de variaveis, uma re-
presenta c ao implcita para Q = Q(t). De fato, se r
1
e r
2
s ao as razes
do polin omio r
2
2r 1 = 0, temos que
T t =
_
T
t
dt =
_
0
Q
ds
(s r
1
)(s r
2
)
=
1
r
2
r
1
__
0
Q
ds
s r
1
_
0
Q
ds
s r
2
_
,
que e a representa c ao procurada. 2
Observa cao 219. Em problemas do tipo linear-quadratico, as condi c oes
(12.19), (12.20) e (12.21) s ao sucientes para otimalidade de uma solu c ao
do problema de controle P(t
0
, z
0
). Para maiores detalhes, veja o Cap-
tulo 10 e a Sec c ao 9.4, onde s ao discutidas condi c oes sucientes para
otimalidade.
Essas condi c oes sucientes podem ser utilizadas para calcular uma
aproxima c ao numerica para a solu c ao de P(t
0
, z
0
). Para isto procedemos
da seguinte forma:
Elimine u do sistema (12.19), (12.20), denindo a fun c ao auxiliar E
u(t) = E
(t, z, ) := N(t)
1
(B(t)
+R(t)z);
Obtenha assim o problema de valor de contorno:
_
_
_
z
t
= +
H
(t, z, , E
t
=
H
z
(t, z, , E
(t, z, )), (t
1
) = Dz(t
1
);
steuer
2008/3/11
page 294
i
i
i
i
i
i
i
i
294 EXERC
ICIOS
O problema resultante pode ser resolvido numericamente pelo procedi-
mento conhecido como metodo de shooting (veja Sec c ao A.6), utilizando-
se um algoritmo do tipo:
1. Encontre uma aproximac~ ao inicial
0
para (t
0
);
2. Resolva o problema de valor de contorno
_
_
_
z
t
= +
H
(t, z, , E
(t, z, )) , z(t
0
) = z
0
,
t
=
H
z
(t, z, , E
(t, z, )) , (t
0
) =
0
;
3. Aprimore a aproximac~ ao inicial (e.g., atraves do
metodo de
Newton) com o objetivo de satisfazer a equac~ ao
(t
1
) = Dz(t
1
);
4. Retorne ao passo 2;
2
Exerccios
12.1. Verique que a constante K em (12.1), (12.2) e da forma c
1
e
c
2
T
,
com c
i
> 0 dependendo apenas de K
1
e/ou de K
2
as constantes em
H1) e H3).
12.2. Mostre que a fun c ao c(s) usada para estimar as trajetorias do
problema linear-quadratico na demonstra c ao do Teorema 215 e da forma
c(s) = |D| |
A
(T, s)|
2
+
_
T
s
|M(r)| |
A
(t, r)|
2
dr.
12.3. Verique que uma solu c ao Q da equa c ao diferencial matricial de
Riccati (12.16) e simetrica.
12.4. Suponha que o conjunto dos controles R
m
seja, alem de
fechado, tambem limitado. Formule uma hipotese mais fraca do que H3),
que ainda permita vericar a Lipschitz continuidade (local) da fun c ao
valor.
steuer
2008/3/11
page 295
i
i
i
i
i
i
i
i
EXERC
ICIOS 295
12.5. Suponha que u U
ad
[0, T] e um controle otimo para o problema
P(0, z
0
). Prove que, para todo [0, T], a restri c ao u[
[0,]
e um controle
otimo para o problema
_
_
Minimizar
_
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, ],
u L
1
([0, ]; R
m
), u(t) q.s. em [0, ],
(Tal resultado tambem e valido para problemas com horizonte innito;
veja Exerccio 12.11.)
12.6. Suponha que a fun c ao de Hamilton H(t, z, , u) = , f(t, z, u))+
L(t, z, u) e convexa.
a) Obtenha a partir da Observa c ao 209 uma condi c ao suciente para
otimalidade de uma estrategia de controle.
(Sugest ao: Observe a rela c ao entre H(t, z, , u) e o termo U
z
(f
u
V
z
+L
u
).)
b) Compare o resultado obtido no item a) com o Teorema 174.
12.7. Considere o problema de tempo mnimo
_
_
_
Minimizar t
1
sujeito a z
t
= z
1
4
uz 25u, z(0) = 80, z(t
1
) = 40,
0 u(t) 1, t [0, t
1
],
_
t
1
0
u(s)ds = 1.
Tal problema possui a seguinte interpreta c ao:
9
Em uma xcara com
cafe, inicialmente a 80
o
C, e despejado leite frio. A temperatura nal
da mistura cafe com leite deve ser de 40
o
C e a quantidade de leite e
limitada.
a) Interprete a equa c ao diferencial e as restri c oes do problema.
b) Transforme a restri c ao integral em uma equa c ao diferencial, obtendo
para esta condi c oes inicial e nal.
c) Obtenha a equa c ao de HamiltonJacobiBellman para o problema.
12.8. Calcule a solu c ao do problema
_
Minimizar
_
1
0
_
3z(t)
2
+u(t)
2
dt
sujeito a z
t
= z +u, z(0) = z
0
.
9
Especialmente interessante para matem aticos, conhecidos por transformarem cafe
em teoremas.
steuer
2008/3/11
page 296
i
i
i
i
i
i
i
i
296 EXERC
ICIOS
12.9. Dado T > 0, considere o problema
_
Minimizar z(T)
2
+
_
T
0
u(t)
2
dt
sujeito a z
t
= z +u, z(0) = 1.
a) Obtenha a equa c ao de HamiltonJacobiBellman.
b) Encontre a fun c ao valor otimo.
c) O que se pode armar sobre a fun c ao valor no limite T ?
12.10. Dados T > 0, a R
n
, A R
n,n
, B R
n,m
, considere o
problema
_
_
_
Minimizar a, z(T))
sujeito a z
t
= Az +Bu, z(0) = z
0
R
n
,
[u
i
[ 1, t [0, T], 1 i m.
a) Obtenha a equa c ao de HamiltonJacobiBellman.
b) Mostre que a fun c ao valor otimo e dada por
W(t, x) :=
a, e
A(tT)
x
_
_
T
t
m
i=1
a, e
A(sT)
b
i
_
ds,
onde B = (b
1
[ [b
m
).
c) Encontre o controle otimo para o problema.
_
Minimizar z
1
(1)
2
+z
2
(1)
2
+
_
1
0
u(t)
2
dt
sujeito a z
t
1
= z
2
, z
t
2
= u, (z
1
(0), z
2
(0)) = (1, 0).
a) Resolva a equa c ao diferencial de Riccati correspondente.
b) Calcule o controle otimo.
12.11. [Horizonte innito] Sejam A, M : R R
n,n
, B : R R
n,m
,
N : R R
m,m
, fun c oes matriciais continuamente diferenciaveis, com
M(t) > 0, N(t) > 0, t 0. Considere o problema linear-quadratico
10
_
_
_
Minimizar J(z, u) :=
_
0
[z, Mz) +u, Nu)] dt
sujeito a
z
t
= Az +Bu(t), t [0, ), z(0) = z
0
R
n
.
10
Para detalhes sobre programa c ao din amica em horizonte innito, veja [Leit]. Em
particular os problemas linear-quadr aticos em horizonte innito s ao considerados rm
[So].
steuer
2008/3/11
page 297
i
i
i
i
i
i
i
i
EXERC
ICIOS 297
a) Suponha que Q e solu c ao da equa c ao diferencial de Riccati
dQ
dt
= QA A
Q M + QBN
1
B
Q, t (, 0],
Q(0) = 0.
Dena Q(t) := Q(t) e obtenha uma equa c ao diferencial, cuja solu c ao
seja Q.
b) Mostre que V (0, z) = z, Q(T)z), onde V e a fun c ao valor para o
problema linear quadratico formulado no intervalo nito [0, T].
c) Prove que, para todo t
2
> t
1
0, temos z, Q(t
2
)z) z, Q(t
1
)z),
z R
n
.
d) Suponha que o sistema (A, B) e controlavel para todo t > 0. Prove
que o limite Q := lim
t
Q(t) existe.
(Sugest ao: Mostre que dado z
0
R
n
, a aplica c ao t z
0
, Q(t)z
0
) e
limitada superiormente por J(z
u
, u) para algum processo (z
u
, u) com
z
u
(0) = z).
e) Prove que a matriz Q, denida no item d), e solu c ao da equa c ao
algebrica de Riccati
11
QA A
Q M + QBN
1
B
Q = 0.
f ) Mostre que z
0
, Qz
0
) J(z
u
, u), para todo processo admissvel (z
u
, u)
com z
u
(0) = z
0
.
g) Verique que a fun c ao valor para o problema de horizonte innito e
V (z) = z, Qz).
h) Mostre que o controle otimo para o problema com horizonte innito
e dado pela lei de realimenta c ao u(t) = M(t)
1
B
Qz(t), t 0, e ainda
que J( z, u) < .
i) Prove que lim
t
z(t), Q z(t)) = 0, para todo z
0
R
n
.
j) Mostre que o controle u do item h) e o unico controle otimo para o
problema.
11
Para detalhes sobre a solubilidade da equa c ao algebrica de Riccati consulte [Bar],
captulo 5.
steuer
2008/3/11
page 298
i
i
i
i
i
i
i
i
298 EXERC
ICIOS
12.12. Suponha que u U
ad
[0, ) e o controle otimo para o problema
do Exerccio 12.11. Prove que, para todo [0, ), a restri c ao u[
[0,]
e
o controle otimo para o problema
_
_
_
Minimizar
_
0
[z, Mz) +u, Nu)] dt
sujeito a
z
t
= Az +Bu(t), t [0, ], z(0) = z
0
R
n
.
steuer
2008/3/11
page 299
i
i
i
i
i
i
i
i
Captulo 13
Soluc oes Viscosas e Funcao
Valor
Neste captulo estudamos o conceito de solu c oes de viscosidade de
equa c oes diferenciais parciais (ver [CrLi]). Em particular, estamos inte-
ressados nas solu c oes viscosas da equa c ao HJB, apresentada no Cap-
tulo 12. Nosso objetivo e considerar problemas de controle otimo, cuja
fun c ao valor correspondente e (Lipschitz) contnua e vericar que, nesses
casos, a fun c ao valor e a unica solu c ao de viscosidade da equa c ao HJB.
Na Sec c ao 13.1 e introduzido o conceito de solu c oes viscosas. Na
Sec c ao 13.2 analisamos a formula de HopfLax, um caso particular
da equa c ao de EulerLagrange quando o integrando da fun c ao obje-
tivo depende somente de z
t
. Na Sec c ao 13.3 vericamos que a fun c ao
valor e uma solu c ao de viscosidade da equa c ao HJB. Na Sec c ao 13.4 o
princpio do maximo e demonstrado para problemas com horizonte nito
(tempo nal xo) utilizando-se tecnicas de programa c ao din amica. Na
Sec c ao 13.5 provamos um resultado de unicidade para solu c oes viscosas
da equa c ao HJB.
13.1 Soluc oes Viscosas de EDPs
O conceito de solu c ao de viscosidade pode ser formulado para qual-
quer equa c ao diferencial parcial (EDP), linear ou n ao. Estamos parti-
steuer
2008/3/11
page 300
i
i
i
i
i
i
i
i
300 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
cularmente interessados no problema
t
v +H(t, x,
x
v) = 0, (t, x) (0, 1) R
n
, (13.1)
v(1, x) = g(x), x R
n
. (13.2)
O problema de solucionar a equa c ao (13.1) sujeito `a condi c ao nal (13.2)
e, daqui para frente, denominado de problema (H, g). Inicialmente o
problema (H, g) e analisado sujeito `as seguintes hipoteses:
H C([0, 1] R
n
R
n
; R), g C(R
n
; R).
Note que (13.1) e uma equa c ao diferencial de primeira ordem. Tal
equa c ao e, em geral, n ao linear. Este e certamente o caso quando (13.1) e
a equa c ao HJB associada a uma famlia de problemas de controle otimo.
Sendo assim, o metodo de curvas caractersticas n ao se aplica, da mesma
forma n ao se aplica uma abordagem variacional utilizando distribui c oes
e derivadas generalizadas. A alternativa de considerar solu c oes Lips-
chitz contnuas de (13.1) que, por serem diferenciaveis quase sempre
1
,
satisfazem a equa c ao diferencial a menos de um conjunto de medida (de
Lebesgue) nula, n ao e muito atraente, uma vez que podem existir muitas
dessas solu c oes.
Nos anos 80 foi desenvolvido por M.G. Crandall e P.L. Lions (medalha
Fields em 1996) um trabalho pioneiro na dire c ao de solubilidade de
equa c oes parciais n ao lineares. Por eles foi introduzido o conceito de
solu c oes de viscosidade, que n ao so possibilita um tratamento adequado
da equa c ao HJB para solu c oes n ao continuamente diferenciaveis, como
tambem abre caminho para a dedu c ao do princpio do maximo (veja
Sec c ao 13.4).
Deni cao 220. Uma fun c ao v : [0, 1] R
n
R e denominada solu c ao
viscosa da equa c ao (13.1) quando satisfaz:
a) v e contnua;
b) Para toda C
1
((0, 1) R
n
; R) tal que v possui um maximo
local em (t, x) (0, 1) R
n
, temos
t
(t, x) +H(t, x,
x
(t, x)) 0.
c) Para toda C
1
((0, 1) R
n
; R) tal que v possui um mnimo
local em (t, x) (0, 1) R
n
, temos
t
(t, x) +H(t, x,
x
(t, x)) 0.
1
Consulte o teorema de Hademacher, por exemplo em [Mo].
steuer
2008/3/11
page 301
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC
OES VISCOSAS DE EDPS 301
Caso satisfa ca somente a) e b), a fun c ao v e denominada sub-solu c ao
viscosa. Caso v satisfa ca somente a) e c), e denominada super-solu c ao
viscosa. As fun c oes utilizadas na caracteriza c ao das solu c oes viscosas
s ao as chamadas fun c oes teste. 2
Observa cao 221. Na literatura, muitas vezes e utilizada na deni c ao
das solu c oes viscosas, ao inves da condi c ao a), a exigencia: v uni-
formemente contnua e limitada. No contexto da teoria de controle tal
exigencia e por demais restritiva, pois o domnio de deni c ao de v e
ilimitado. O carater da Deni c ao 220 e estritamente local e e de simples
verica c ao o fato de que, uma fun c ao v que a satisfa ca, tambem satisfara
a outra variante em qualquer subconjunto compacto de [0, 1] R
n
.
Na Deni c ao 220 podemos usar como espa co de fun c oes teste
C
((0, 1) R
n
; R), ao inves de C
1
((0, 1) R
n
; R) e, ainda assim, obter
o mesmo conceito de solu c ao (veja Lema 222).
E possvel denir solu c oes viscosas para equa c oes diferenciais parciais
genericas de primeira e segunda ordem. Isto entretanto foge aos nossos
objetivos. O leitor interessado deve consultar [FlSo]. 2
Como qualquer novo conceito de solu c ao, a teoria de solu c oes viscosas
tem como objetivo natural a investiga c ao dos seguintes temas:
1. Esclarecimento de quest oes inerentes ao conceito de solu c ao, como:
existencia, unicidade, estabilidade (dependencia contnua de con-
di c oes iniciais);
2. Utiliza c ao do conceito na teoria de controle, a m de esclarecer as
seguintes perguntas:
A fun c ao valor e uma solu c ao viscosa de HJB? O princpio do
maximo pode ser novamente obtido?
Neste captulo investigamos o conceito de solu c oes viscosas exclusiva-
mente no contexto da teoria de controle otimo. Existem aplica c oes
extremamente interessantes desta teoria para equa c oes parciais n ao li-
neares de segunda ordem (como o metodo da viscosidade esvanescente).
O leitor interessado na teoria de EDPs pode encontrar maiores deta-
lhes na obra de J.L. Lions (veja por exemplo [Li]). A origem do termo
viscosidade e esclarecida no nal desta sec c ao.
Lema 222. Seja u : R
m
R contnua e diferenci avel no ponto x
0
R
m
. Ent ao existe C
1
(R
m
) tal que u(x
0
) = (x
0
) e u possui
steuer
2008/3/11
page 302
i
i
i
i
i
i
i
i
302 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
um mnimo local estrito em x
0
.
Demonstra c ao: Podemos supor sem perda de generalidade que x
0
= 0,
u(x
0
) = 0, u(x
0
) = 0 (de fato, caso contrario basta provar o teorema
para u(x) := u(x+x
0
) u(x
0
) u(x
0
), x)). Das hipoteses, temos que
u(x) = [x[v(x), x R
n
, com lim
x0
v(x) = 0.
Dena
(r) := max
[x[r
[v(x)[, r 0.
Logo, e contnua, monotona n ao decrescente e (0) = 0. Dena agora
: R
m
R por
(x) :=
_
2[x[
[x[
(r)dr +[x[
2
.
De [(x)[ [x[(2[x[) +[x[
2
, x R
n
, segue que
(0) = 0, (0) = 0.
Para x ,= 0, temos
(x) = 2x[x[
1
(2[x[) x[x[
1
([x[) + 2x.
Podemos ent ao concluir que C
1
(R
m
). Agora, para x ,= 0, temos
u(x) (x) = [x[v(x)
_
2[x[
[x[
(r)dr [x[
2
[x[([x[)
_
2[x[
[x[
(r)dr [x[
2
[x[
2
.
Logo,
u(x) (x) < 0 = u(0) (0), x ,= 0,
completando a demonstra c ao.
Teorema 223. Seja v uma solu c ao viscosa de (13.1), tal que v e dife-
renci avel no ponto (t
0
, x
0
) (0, 1) R
n
. Ent ao temos
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) = 0.
Demonstra c ao: Aplicando o Lema 222, temos que existe C
1
(R
R
n
), tal que v possui um mnimo local em (t
0
, x
0
). Esta fun c ao
steuer
2008/3/11
page 303
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC
OES VISCOSAS DE EDPS 303
e agora convoluida com um mollier
2
(R R
n
) da seguinte forma:
(t, x) := (
)(t, x)
:=
_
_
R
n
,
t
t
,
x
possui um maximo (t
, x
) em A.
E facil ver que (t
, x
) (t
0
, x
0
). Da
Deni c ao 220 segue que
(t
, x
) +H(t
, x
,
x
(t
, x
)) 0.
Tomando o limite quando 0, obtemos
t
(t
0
, x
0
) +H(t
0
, x
0
,
x
(t
0
, x
0
)) 0.
Entretanto, como
t
(t
0
, x
0
) =
t
v(t
0
, x
0
),
x
(t
0
, x
0
) =
x
v(t
0
, x
0
),
ca provado que
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) 0.
A desigualdade
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) 0
e provada de forma analoga.
Deni cao 224. Seja A R
n
aberto e F : A R uma aplica c ao
contnua. Os conjuntos
+
F(x) := p R
n
[ limsup
yx
(F(y) F(x) p, y x)) [y x[
1
0,
F(x) := p R
n
[ liminf
yx
(F(y) F(x) p, y x)) [y x[
1
0
s ao denominados respectivamente de superdiferential e subdiferential de
F no ponto x A. 2
2
Denominamos por mollier as fun c oes C
(R R
n
) que satisfazem
_
R
_
R
n
(t, x) dtdx = 1. Maiores detalhes sobre essas fun c oes, assim como sobre a
opera c ao de convolu c ao de fun c oes s ao encontrados em [Ru2].
steuer
2008/3/11
page 304
i
i
i
i
i
i
i
i
304 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
As deni c oes acima correspondem `a tentativa de recuperar o con-
ceito de derivada para aplica c oes n ao suaves. Os conjuntos
+
F(x) e
y
F(x, y), . . . , sendo esses
denidos de forma obvia.
Lema 225. Seja v : [0, 1] R
n
R contnua. S ao equivalentes as
arma c oes:
a) v e solu c ao viscosa de (13.1);
b) Os conjuntos
+
v(t, x),
v(t, x) satifazem:
b.1) q +H(t, x, p) 0, (q, p)
+
v(t, x), (t, x) (0, 1) R
n
;
b.2) q +H(t, x, p) 0, (q, p)
(|s t| + |y x|)
2(s,y)
(s,y)
sup
0<(s
,y
)r
max
v(s
, y
) v(t, x) q(s
t) p, y
x
|s
t| + |y
x|
, 0
dr
,
onde (s, y) :=
_
[s t[
2
+[y x[
2
. Dena
g(s, y) :=
v(s, y) v(t, x) q(s t) p, y x)
[s t[ +[y x[
,
para (s, y) > 0 e
G(s, y) :=
_
sup0, g(s, y) , se (s, y) > 0
0 , sen ao.
steuer
2008/3/11
page 305
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC
OES VISCOSAS DE EDPS 305
Note que G e contnua, pois (q, p)
+
v(t, x). Agora dena
h(r) := sup
0(s,y)r
G(s, y), r 0.
Obviamente h e contnua. Dena ainda atraves de
(s, y) := q(s t) +p, y x) +
_
2(s,y)
(s,y)
h(r
t
)dr
t
.
Logo, C
1
((0, 1) R
n
; R) e, da constru c ao acima, segue que
v(s, y) (s, y) v(t, x) (t, x) (s, y) (0, 1) R
n
.
(Note que a constru c ao acima pode ser antecipada a partir do Lema 222.)
Como v e uma solu c ao viscosa, o item b.1) segue agora da deni c ao de
. A desigualdade no item b.2) e obtida de forma analoga.
(b) = (a) Seja (t, x) (0, 1) R
n
e C
1
((0, 1) R
n
; R) uma fun c ao
teste, tal que v posui um maximo local em (t, x). Sem perda de
generalidade temos
v(s, y) (s, y) v(t, x) (t, x) (s, y) [0, 1] R
n
.
Seja (q, p)
+
(t, x). Como e diferenciavel, o conjunto
+
(t, x) e
constituido de exatamente um elemento: a derivada de (veja Lema 226
a seguir). Temos ent ao
limsup
(s,y)(t,x)
v(s, y) v(t, x) q(s t) p, y x)
[s t[ +[y x[
limsup
(s,y)(t,x)
(s, y) (t, x) q(s t) p, y x)
[s t[ +[y x[
= 0.
Portanto, (q, p)
+
v(t, x) e, da desigualdade no item b.1), segue que
t
(t, x) +H(t, x,
x
(t, x)) 0.
Assim, ca provada a desigualdade b) da Deni c ao 220. A desigualdade
c) desta deni c ao e provada de forma analoga. Logo, v e uma solu c ao
viscosa de (13.1).
steuer
2008/3/11
page 306
i
i
i
i
i
i
i
i
306 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
Lema 226. Seja v : [0, 1] R
n
R contnua. S ao verdadeiras as
armativas:
a)
+
v(t, x),
+
v(t, x) =
v(t, x) =
_
_
v
t
(t, x),
v
t
(t, x)
_
_
;
c) Se v e lipschitz contnua em [0, 1] R
n
, i.e. v satisfaz
[v(s, y) v(t, x)[
_
[s t[
2
+[y x[
2
, (s, y) [0, 1] R
n
para algum 0, ent ao
_
q
2
+[p[
2
,
para todo (q, p)
+
v(t, x)
+
t
v
+ H(t, x,
x
v
) = 0, (t, x) (0, 1) R
n
, (13.3)
v
(1, x) = g(x), x R
n
. (13.4)
Com hipoteses relativamente fracas sobre a regularidade de H e g e
possvel garantir, para cada > 0, a existencia de uma solu c ao suave
v
e fazendo 0 e
conhecida como metodo da viscosidade esvanescente.
Dena v como o limite (localmente uniforme) da seq uencia v
. Dada
uma fun c ao teste C
((0, 1)R
n
; R) tal que v possui um maximo
local no ponto (t
0
, x
0
), ent ao v
, x
) e ainda lim
0
t
= t
0
, lim
0
x
= x
0
. Da segue que
t
v
(t
, x
) =
t
(t
, x
),
x
v
(t
, x
) =
x
(t
, x
),
v
(t
, x
) (t
, x
),
de onde obtemos
t
v
(t
, x
) +H(t
, x
,
x
(t
, x
)) = v
(t
, x
) (t
, x
).
Como conseq uencia da convergencia (localmente) uniforme v
v,
temos
t
(t
, x
) +H(t
, x
,
x
(t
, x
)) 0,
de onde segue a desigualdade utilizada na Deni c ao 220.
13.2 F ormula de HopfLax
Nesta sec c ao, consideramos sob a otica da programa c ao din amica um
problema comum ao calculo variacional e `a teoria de controle otimo.
P(t, x)
_
_
_
Minimizar
_
1
t
L(z
t
(s))ds + g(z(1))
sujeito a z(t) = x
steuer
2008/3/11
page 308
i
i
i
i
i
i
i
i
308 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
Por V (t, x) denominamos a fun c ao valor associado ao problema P(t, x),
[0, 1] R
n
(t, x) V (t, x) R. Consideramos o problema fomulado
com as seguintes hipoteses:
L1) A fun c ao L e convexa e coerciva, i.e. lim
[q[
L(q)
[q[
= ;
L2) A fun c ao g e Lipschitz contnua (com constante de Lipschitz l
g
).
Denimos agora
W(t, x) := inf
yR
(1 t)L((y x)/(1 t)) +g(y), 0 t < 1, x R
n
.
Da coercividade de L e da Lipschitz continuidade de g, segue que W(t, x)
esta bem denida, podendo inclusive o nmo, na deni c ao de W, ser
substitudo por mnimo.
Lema 227. Suponha que L e g satisfazem as hip oteses L1), L2). Temos
ent ao, para todo (t, x) [0, 1) R
n
, que
V (t, x) = W(t, x) = min
yR
n
(1 t)L(1 t)
1
(y x)) +g(y).
Demonstra c ao: Seja (t, x) [0, 1) R
n
. Dado y R
n
, dena z(s) :=
x +
s t
1 t
(y x), para s [t, 1]. Como z(t) = x, temos que
V (t, x)
_
1
t
L((yx)/(1t))ds+g(y) = (1t)L((yx)/(1t))+g(y).
Como y R
n
e arbitrario, temos que V (t, x) W(t, x). Seja agora
z C
1
([t, 1]; R
n
) com z(t) = x. Da desigualdade de Jensen (veja [Wa1]),
obtemos para y := z(1)
(1 t)L
_
(1 t)
1
_
1
t
z
t
(s)ds
_
+g(y)
_
1
t
L(z
t
(s))ds +g(y),
cando assim provado que V (t, x) W(t, x).
Lema 228. Suponha que L e g satisfazem as hip oteses L1), L2). Temos
ent ao, para 0 t < s < 1, que
V (t, x) = min
zR
n
(s t)L((z x)/(s t)) +V (s, z).
steuer
2008/3/11
page 309
i
i
i
i
i
i
i
i
[SEC. 13.2: F
AO VALOR
(l
g
e a constante de Lipschitz de g.) Por simetria, obtemos
(13.5) [V (t, v) V (t, u)[ l
g
[v u[.
Esta desigualdade vale tambem para t = 1, pois V (1, v) = g(v) e
V (1, u) = g(u). Seja agora x R
n
e t [0, 1), temos ent ao
V (t, x) (1 t)L(0) +g(x)
e ainda
V (t, x) g(x) + min
yR
n
(1 t)L((y x)/(1 t)) +g(y) g(x)
g(x) (1 t) max
wR
n
l
g
[w[ L(w)
= g(x) (1 t) max
[g[l
g
max
wR
n
w, q) L(w).
Portanto, [V (t, x) g(x)[ c[1 t[. De (13.5) e da equa c ao de otimali-
dade do Lema 228, segue ainda que
[V (t
1
, x) V (t
2
, x)[ c[t
1
t
2
[, 0 t
1
< t
2
1, x R
n
.
Juntando essas desigualdades, o lema ca provado.
Lema 230. Suponha que L e g satisfazem as hip oteses L1), L2) e que
existe constante c > 0 tal que
g(x +z) 2g(x) +g(x z) c[z[
2
, x, z R
n
.
Ent ao temos
V (t, x +z) 2V (t, x) +V (t, x z) c[z[
2
, x, z R
n
, t [0, 1].
Demonstra c ao: Escolhendo y R
n
com V (t, x) = (1t)L((y x)/(1
t)) +g(y), temos
V (t, x +z) 2V (t, x) V (t, x z)
(1 t)L((y +z x z)/(1 t)) + g(y +z)
2(1 t)L((y x)/(1 t)) 2g(y)
+ (1 t)L((y z x +z)/(1 t)) + g(y z)
= g(y +z) 2g(y) +g(y z)
c[z[
2
e o teorema ca provado.
steuer
2008/3/11
page 311
i
i
i
i
i
i
i
i
[SEC. 13.2: F
t
v +H(
x
v) = 0.
Demonstra c ao: Seja (t
0
, x
0
) (0, 1) R
n
e C
1
([0, 1] R
n
; R) uma
fun c ao teste, tal que V possui um maximo local em (t
0
, x
0
). Para
t
0
< s < 1, temos
V (t
0
, x
0
) (s t
0
)L((s t
0
)
1
(z x
0
)) +V (s, z).
Agora, como V possui um maximo local em (t
0
, x
0
), temos que
(t
0
, x
0
) (t, x) V (t
0
, x
0
) V (t, x),
para todo (t, x) em uma vizinhan ca apropriada de (t
0
, x
0
). Logo, para
q R
n
e h > 0 sucientemente pequeno, temos
(t
0
+h, x
0
+hq)(t
0
, x
0
) V (t
0
+h, x
0
+hq)V (t
0
, x
0
) hL(q).
Portanto,
t
(t
0
, x
0
) +
t
(t
0
, x
0
), q) L(q), i.e.
t
(t
0
, x
0
) +H(
x
)(t
0
, x
0
) 0.
Seja agora C
1
([0, 1] R
n
; R) tal que V possui um mnimo local
em (t
0
, x
0
). Suponha que existe r > 0, para o qual
t
(t
0
, x
0
) +H(
x
)(t
0
, x
0
) r.
Tome h > 0 sucientemente pequeno e escolha z R
n
com V (t
0
, x
0
) =
hL(h
1
(z x
0
)) +V (t
0
+h, z). Temos ent ao, para q := h
1
(z x
0
), que
(t
0
+h, z) (t
0
, x
0
)
= h
_
1
0
_
x
(t
0
+sh, sz + (1 s)x
0
), q)
+
t
(t
0
+sh, sz + (1 s)x
0
ds
hr hL(q) = hr V (t
0
, x
0
) +V (t
0
+h, z),
steuer
2008/3/11
page 312
i
i
i
i
i
i
i
i
312 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
que pode ser reescrito como
V (t
0
+h, z) (t
0
+h, z) +hr V (t
0
, x
0
) (t
0
, x
0
).
Porem, esta desigualdade contradiz o fato de (t
0
, x
0
) ser mnimo local
de V .
13.3 Funcao Valor como Solucao Viscosa de HJB
Considere novamente a famlia de problemas de controle otimo do
Captulo 10
P(s, y)
_
_
Minimizar J(s, y; u) :=
_
1
s
L(t, z(t), u(t))dt +g(z(1))
sujeito a
u U
ad
[s, 1] := w : [s, 1] R
m
[ w mensuravel,
w(t) q.s. em [s, 1],
z
t
(t) = f(t, z(t), u(t)), q.s. em [s, 1], z(s) = y,
onde L : [0, 1] R
n
R
m
R, g : R
n
R, f : [0, 1] R
n
R
m
R
n
,
R
m
, satisfazem as seguintes hipoteses:
A1) f, L s ao contnuas e f(, , u), L(, , u) s ao contnuas em (t, z),
uniformemente em u ,= ;
A2) Para todo (t, u) [0, 1] , as aplica c oes f(t, , u), L(t, , u), g()
s ao continuamente diferenciaveis;
A3) Existe K > 0 tal que, para todo (t, u) [0, 1] e todo x, z R
n
,
temos:
[f(t, x, u)f(t, z, u)[+[L(t, x, u)L(t, z, u)[+[g(x)g(z)[K[xz[,
[f(t, x, u)[ +[L(t, x, u)[ +[g(x)[ K(1 +[x[).
A fun c ao de Hamilton H e denida por
H(t, x, , p) := p, f(t, x, )) +L(t, x, ), (t, x, , p) [0, 1] R
n
R
n
.
A fun c ao valor otimo
V : [0, 1] R
n
(s, y) inf
uU
ad
[s,1]
J(s, y; u) R
steuer
2008/3/11
page 313
i
i
i
i
i
i
i
i
[SEC. 13.3: FUNC
_
p, f(t, x, )) +L(t, x, ), (t, x, p) [0, 1] R
n
R
n
.
Teorema 232. A fun c ao valor V do problema P(0, y) e uma solu c ao
viscosa da equa c ao de HamiltonJacobiBellman (13.1).
Demonstra c ao: Seja C
1
((0, 1)R
n
) uma fun c ao teste tal que V
possui um maximo local em (t
0
, x
0
) (0, 1) R
n
. Podemos sempre
supor V (t
0
, x
0
) = (t
0
, x
0
) (por que?). Logo, existe uma vizinhan ca
[t
0
, t
0
+] A de (t
0
, x
0
) onde temos
(t, x) V (t, x) para todo (t, x) [t
0
, t
0
+] A.
Seja h (0, ) e um elemento qualquer. Escolha agora u
1
U
ad
[t
0
, 1] com u
1
(t) = , t [t
0
, t
0
+ ]. Logo, existe h
0
(0, ) com
steuer
2008/3/11
page 314
i
i
i
i
i
i
i
i
314 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
z
u
1
,x
0
(t
0
+h) A, para todo h (0, h
0
). Para h (0, h
0
), temos
0 = h
1
(V (t
0
, x
0
) (t
0
, x
0
))
= h
1
inf
uU
ad
[t
0
,t
0
+h]
_
_
t
0
+h
t
0
L(r, z
u,x
0
(r), u(r))dr
+V (t
0
+h, z
u,x
0
(t
0
+h)) (t
0
, x
0
)
_
h
1
inf
uU
ad
[t
0
,t
0
+h]
_
_
t
0
+h
t
0
L(r, z
u,x
0
(r), u(r))dr
+(t
0
+h, z
u,x
0
(t
0
+h)) (t
0
, x
0
)
_
h
1
_
t
0
+h
t
0
L(r, z
u
1
,x
0
(r), u
1
(r))dr
+h
1
_
(t
0
+h, z
u
1
,x
0
(t
0
+h)) (t
0
, x
0
)
_
De onde obtemos
0
t
(t
0
, x
0
) +f(t
0
, x
0
, ),
x
(t
0
, x
0
)) +L(t
0
, x
0
, ).
Portanto,
t
(t
0
, x
0
) +H(t
0
, x
0
,
x
(t
0
, x
0
)) 0.
Como e arbitrario, o item b) da Deni c ao 220 ca provado.
Seja agora C
1
((0, 1) R
n
) uma fun c ao teste tal que V possui
um mnimo local em (t
0
, x
0
) (0, 1) R
n
. Novamente podemos supor
sem perda de generalidade que V (t
0
, x
0
) = (t
0
, x
0
). Logo, existe uma
vizinhan ca [t
0
, t
0
+] A de (t
0
, x
0
) tal que
(t, x) V (t, x) para todo (t, x) [t
0
, t
0
+] A.
Escolha agora para cada n N um controle u
n
U
ad
[t
0
, 1], tal que
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
)
1
n
2
+
_
t
0
+
1
n
t
0
L(r, z
n
(r), u
n
(r))dr
+
_
t
0
+
1
n
, z
n
(t
0
+
1
n
)
_
,
onde z
n
:= z
u
n
,x
0
e o estado (denido em [t
0
, 1]) correspondente ao
controle u
n
. Podemos supor, sem perda de generalidade, que z
n
(t
0
+
1
n
)
A para todo n N. Temos ent ao
steuer
2008/3/11
page 315
i
i
i
i
i
i
i
i
[SEC. 13.3: FUNC
t
(r, z
n
(r)) +
f(r, z
n
(r), u
n
(r)),
x
(r, z
n
(r))
_
_
dr
=
t
(t
0
, x
0
) +n
_
t
0
+
1
n
t
0
L(t
0
, x
0
, u
n
(r))dr
+n
_
t
0
+
1
n
t
0
f(t
0
, x
0
, u
n
(r)),
x
(t
0
, x
0
))
_
dr +R
n
,
onde
R
n
= n
_
t
0
+
1
n
t
0
[
t
(r, z
n
(r))
t
(t
0
, x
0
)]dr
+
_
t
0
+
1
n
t
0
_
L(r, z
n
(r), u
n
(r)) L(t
0
, x
0
, u
n
(r)
_
dr
1
n
+n
t
0
+
1
n
_
t
0
_
f(r, z
n
(r), u
n
(r)),
x
(r, z
n
(r))
_
f(t
0
, x
0
, u
n
(r)),
x
(t
0
, x
0
)
_
_
dr.
Portanto,
n
_
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
))
t
(t
0
, x
0
) +
f
n
,
x
(t
0
, x
0
)
_
+l
n
+R
n
,
steuer
2008/3/11
page 316
i
i
i
i
i
i
i
i
316 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
onde
f
n
:= n
_
t
0
+
1
n
t
0
f(t
0
, x
0
, u
n
(r))dr, l
n
:= n
_
t
0
+
1
n
t
0
L(t
0
, x
0
, u
n
(r))dr.
Da hipotese (A3) segue agora que lim
rt
0
z
n
(r) = x
0
uniformemente em
n. Da continuidade de L e f segue ainda que lim
n
R
n
= 0. Dena
B :=(f, l) R
n
R [ (f, l)
= (f(t
0
, x
0
, ), L(t
0
, x
0
, )) para algum .
Temos ent ao da deni c ao de f
n
, l
n
que
(f
n
, l
n
) co(B) para todo n N.
Temos, portanto, que
0 liminf
n
n
_
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
)
_
t
(t
0
, x
0
) + inf
(f,l)coB
f,
x
(t
0
, x
0
)) +l
=
t
(t
0
, x
0
) + inf
(f,l)B
f,
x
(t
0
, x
0
)) +l
=
t
(t
0
, x
0
) + inf
H(t
0
, x
0
, ,
x
(t
0
, x
0
)).
Note que, para obter a pen ultima linha acima, usamos a identidade
inf
(f,l)coB
f,
x
(t
0
, x
0
)) +l = inf
(f,l)B
f,
x
(t
0
, x
0
)) +l,
que e justicada pelo fato de estarmos lidando com uma fun c ao linear
em (f, l).
Exemplo 233. Considere o problema
t
v +H(t, x, v) = 0, em (0, 1) (1, 1), v(1, x) = 0, em [1, 1],
onde H(t, x, v) := (
x
v)
2
+1.
E de simples verica c ao o fato da fun c ao
v(t, x) :=
_
1 [x[ , [x[ t
1 t , [x[ < t
ser uma solu c ao da equa c ao HJB. 2
steuer
2008/3/11
page 317
i
i
i
i
i
i
i
i
[SEC. 13.4: PRINC
IPIO DO M
AXIMO 317
13.4 Princpio do Maximo
Investigamos novamente o princpio do maximo apresentado no Ca-
ptulo 10. Para tanto, utilizamos a fun c ao de Hamilton correspondente
ao problema P(s, y)
H(t, x, u, p) := p, f(t, x, u)) +L(t, x, u).
Como vimos na Sec c ao 10.1, este teorema de condi c oes necessarias para
otimalidade nos garante que, dado um processo otimo ( u, z) para P(s, y),
ent ao:
Existe um multiplicador : [s, 1] R
n
tal que o par ( z, ) e uma
solu c ao do problema de valor de contorno (sistema Hamiltoniano)
z
t
= f(t, z, u(t)), z(s) = y,
t
=
f
x
(t, z, u(t))
L
x
(t, z, u(t))
, (1) = g(z(1))
E satisfeita a condi c ao de maximo (ou de otimalidade)
H(t, z(t), u(t), (t)) = inf
w
H(t, z(t), w, (t)).
A fun c ao e denominada vari avel adjunta e o conjunto de condi c oes
acima e denominado simplicadamente por MP(s, y). Nesta sec c ao,
consideramos a tarefa de obter estas condi c oes utilizando uma abor-
dagem na linha da programa c ao din amica.
Lema 234. Seja ( u, z) um processo admissvel para P(0, y) e (, ) a
matriz de transi c ao para a equa c ao diferencial
w
t
=
f
x
(t, z(t), u(t))w.
S ao verdadeiras as armativas:
a) sup
srt1
[(t, r)[ < ;
b)
t
(, s) =
f
x
(t, z(t), u(t))(, s) em [0, 1], (s, s) = I, s [0, 1].
c) Se e uma solu c ao do problema de valor inicial
t
=
f
x
(t, z(t), u(t))
L
x
(t, z(t), u(t)), (1) = g( z(1)),
steuer
2008/3/11
page 318
i
i
i
i
i
i
i
i
318 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
ent ao temos
(t) = (1, t)
g( z(1)) +
_
1
t
(r, t)
L
x
(r, z(r), u(r))dr, t [s, 1].
Demonstra c ao: Tais resultados s ao padr ao na teoria de equa c oes dife-
renciais ordinarias lineares, e podem ser obtidos diretamente dos resul-
tados apresentados no Apendice A.
Teorema 235. Seja ( u, z) um processo otimo para P(s, y) e seja a
vari avel adjunta correspondente. Temos ent ao, para todo t (s, 1), que
x
V (t, z(t)) (t)
+
x
V (t, z(t)).
Demonstra c ao: Seja t (s, 1) e x R
n
. Denotamos por z := z
u,x
a
trajetoria correspondente ao controle u, satisfazendo a condi c ao inicial
z(t) = x, i.e.
z(q) = x +
_
q
t
f(r, z(r), u(r))dr, q [t, 1].
Temos ent ao, para q [t, 1], que
z(q) z(q) = x z(t) +
_
q
t
(f(r, z(r), u(r)) f(r, z(r), u(r)))dr
= x z(t) +
_
q
t
f
x
(r, z(r), u(r))(z(r) z(r))dr
+
_
q
t
(r, x)dr,
onde
(r, x) := f(r, z(r), u(r))f(r, z(r), u(r))
f
x
(r, z(r), u(r))(z(r) z(r)).
Da hipotese A2), segue que
lim
x z(t)
(r, x)[z(r) z(r)[
1
= 0, r [t, 1], sup
r[t,1],xR
n
[(r, x)[ < .
Utilizando agora a matriz de transi c ao , podemos escrever
z(q) z(q) = (q, t)(x z(t)) +
_
q
t
(q, r)(r, x)dr,
steuer
2008/3/11
page 319
i
i
i
i
i
i
i
i
[SEC. 13.4: PRINC
IPIO DO M
AXIMO 319
obtendo assim
V (t, x) V (t, z(t)) g(z(1)) g( z(1))
+
_
1
t
_
L(r, z(r), u(r)) L(r, z(r), u(r))
_
dr
=
g( z(1)), z(1) z(1)
_
+
0
_
1
t
L
x
(r, z(r), u(r)), z(r) z(r)
_
dr
+
_
1
t
1
(r, x)dr,
onde
0
:= g(z(1)) g( z(1))
1
(r, x) := L(r, z(r), u(r)) L(r, z(r), u(r))
_
L
x
(r, z(r), u(r)), z(r) z(r)
_
.
Podemos ent ao concluir que
V (t, x) V (t, z(t))
1
(r, x)dr
+
_
1
t
_
L
x
(r, z(r), u(r)), (r, t)(x z(t))
_
dr
+
_
1
t
_
r
t
(r, r
t
)(r
t
, x)dr
t
dr
= (t), x z(t)) +
2
(t, x),
onde lim
x z(t)
2
(r, x)[x z(t)[
1
= 0. Portanto, (t)
+
x
V (t, z(t)). Por
outro lado, se p
x
V (t, z(t)), ent ao
0 liminf
x z(t)
__
V (t, x) V (t, z(t)) p, x z(t))
_
[x z(t)[
1
_
liminf
x z(t)
(t) p, x z(t))[x z(t)[
1
,
steuer
2008/3/11
page 320
i
i
i
i
i
i
i
i
320 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
uma vez que
limsup
x z(t)
(t) p, x z(t))[x z(t)[
1
= limsup
x z(t)
(t) p, x z(t))[x z(t)[
1
.
Logo, p = (t) e o teorema ca provado.
Lema 236. Seja ( u, z) um processo otimo para P(s, y). Ent ao,
a menos de um conjunto de medida nula de (s, 1), temos que, se (q, p)
+
V (t, z(t))
V (t, z(t)),
3
ent ao
p = (t), q = H(t, z(t), u(t), p) = inf
_
t+h
t
IPIO DO M
AXIMO 321
De onde obtemos que
q +H(t, z(t), u(t), p) 0.
De forma analoga, provamos que q H(t, z(t), u(t), p). Como, em
particular, p
x
V (t, z(t)), segue do Teorema 235 que p = (t), onde
e a variavel adjunta. Note ainda que (q, p)
+
V (t, z(t))
V (t, z(t)),
o que juntamente com o Lema 225 nos permite concluir que
H(t, z(t), u(t), (t)) = inf
_
Minimizar z(1)
sujeito a
z
t
= zu, z(0) = 0,
u(t) [0, 1] q.s. em [0, 1].
x
V (0, 0) = ,
+
x
V (0, 0) = [e, 1], (0) =
1. 2
Teorema 238. Seja ( u, z) um processo otimo para P(s, y). Ent ao, a
menos de um conjunto de medida nula de (s, 1), temos que
V (t, z(t))
__
H(t, z(t), u(t), (t)), (t)
__
+
V (t, z(t)).
Demonstra c ao: A primeira inclus ao e conseq uencia direta dos Lemas 234
e 236. A m de provar a segunda inclus ao, tome t (s, 1) com
liminf
h0
h
1
_
t+h
t
f(r, z(r), u(r))dr = f(t, z(t), u(t)),
liminf
h0
h
1
_
t+h
t
L(r, z(r), u(r))dr = L(t, z(t), u(t)).
steuer
2008/3/11
page 322
i
i
i
i
i
i
i
i
322 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
Seja > t e x R
n
. Considere a restri c ao u := u[
[,1]
e dena a
trajetoria correspondente z := z
u,x
(i.e. z() = x, z
t
= f(, z, u), q.s.).
Para r [, 1], temos
z(r) z(r) = x y +
_
r
f(r
t
, z(r
t
), u(r
t
))dr
t
_
r
t
f(r
t
, z(r
t
), u(r
t
))dr
t
= x y
_
t
f(r
t
, z(r
t
), u(r
t
))dr
t
+
_
r
f(r
t
, z(r
t
), u(r
t
)) f(r
t
, z(r
t
), u(r
t
))dr
t
= x y
_
t
f(r
t
, z(r
t
), u(r
t
))dr
t
+
_
r
_
f
x
(r
t
, z(r
t
), u(r
t
)) +(r
t
; , x)
_
(z(r
t
) z(r
t
))dr
t
,
onde
lim
t
x z(t)
(; , x) = 0,
uniformemente. Utilizando agora o metodo de varia c ao de constantes,
obtemos
z(r) z(r) = (r, )
_
x y
_
t
f(r
t
, z(r
t
), u(r
t
))dr
t
_
+
_
r
(r, 0)
_
0
(r
t
; , x)(z(r
t
) z(r
t
))dr
e o teorema ca provado.
Do Teorema 238, conclumos que a fun c ao valor V satisfaz a equa c ao
diferencial HJB no sentido classico, caso ela seja diferenciavel.
Teorema 239. Seja ( u, z) um processo otimo para P(s, y). Ent ao s ao
v alidas as condi c oes MP(s, y) do princpio do m aximo.
Demonstra c ao: Como
_
H(t, z(t), u(t), (t)), (t)
_
+
V (t, z(t)) q.s.
em (s, 1), temos que
H(t, z(t), u(t), (t)) inf
t
u +H(t, x,
x
u) = f(t, x), (t, x) (0, T) R
n
, (13.8)
u(0, x) = u
0
(x), x R
n
,
t
v +H(t, x,
x
v) = g(t, x), (t, x) (0, T) R
n
, (13.9)
v(0, x) = v
0
(x), x R
n
.
(Em compara c ao com o problema (13.1), (13.2), trocamos a condi c ao -
nal por uma inicial e consideramos um intervalo de tempo [0, T] generico.)
Consideramos a seguir as seguintes hipoteses:
B1) H : [0, T] R
n
R
n
R, f, g : [0, T] R
n
R, u
0
, v
0
: R
n
R
s ao contnuas;
B2) [f(t, x)[ + [g(t, x)[ + [u
0
(x)[ + [v
0
(x)[ K(1 + [x[), para (t, x)
[0, T] R
n
.
Teorema 240. Suponha que as hip oteses B1) e B2) s ao satisfeitas.
Sejam u
0
, v
0
fun c oes uniformemente contnuas e u, v solu c oes viscosas
de (13.8) e (13.9), respectivamente. Ent ao, temos para todo t [0, T]:
(13.10)
sup
xR
n
(u(t, x)v(t, x)) sup
xR
n
(u
0
(x)v
0
(x))+
_
t
0
sup
xR
n
(f(s, x)g(s, x))ds.
Demonstra c ao: Suponha, sem perda de generalidade, que o lado direito
de (13.10) e nito, i.e.
sup
xR
n
(u
0
(x)v
0
(x)) < ,
_
t
0
sup
xR
n
(f(s, x)g(s, x))ds < t [0, T].
Das hipoteses B1) e B2), conclumos que:
1. sup
xR
n(u(t, x) v(t, x)) < , para todo t [0, T];
2. sup
xR
n(f(t, x) g(t, x)) < , q.s. em [0, T];
3. sup
xR
n(f(t, x) g(t, x)) < , para todo t [0, T];
4. [0, T] t sup
xR
n(u(t, x) v(t, x)) e contnua;
steuer
2008/3/11
page 324
i
i
i
i
i
i
i
i
324 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
5. [0, T] t sup
xR
n(f(t, x) g(t, x)) e contnua;
6. Existe c > 0 com [u(t, x) v(s, y)[ c(1 + [x y[), para todo
x, y R
n
, t, s [0, T].
Suponha por contradi c ao que (13.10) n ao e valida. Logo, existe
0
> 0
com
sup
t[0,T]
_
sup
xR
n
(u(t, x) v(t, x))
_
t
0
sup
xR
n
(f(s, x) g(s, x))ds
_
> sup
xR
n
(u
0
(x) v
0
(x)) +
0
.
Dados , > 0, dena
(t, x, s, y) := u(t, x) v(s, y)
1
2
[x y[
2
1
2
[t s[
2
1
2
_
t
0
sup
x
R
n
(f(, x) g(, x))d
1
2
_
s
0
sup
x
R
n
(f(, x) g(, x))d.
Por conta do crescimento linear de u, v, f, g (hipotese B2)), temos
lim
[x[+[y[
(t, x, s, y) = .
Portanto, e limitada superiormente e existe (t
0
, x
0
, y
0
, s
0
) tal que
(t
0
, x
0
, s
0
, y
0
) +
0
> sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Temos ent ao que
(t
0
, x
0
, t
0
, x
0
) +(s
0
, y
0
, s
0
, y
0
) < 2(t
0
, x
0
, s
0
, y
0
) + 2
0
.
De onde segue
1
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
< u(t
0
, x
0
) u(s
0
, y
0
)
+v(t
0
, x
0
) v(s
0
, y
0
) + 2
0
c(1 +[x
0
y
0
[) + 2
0
,
steuer
2008/3/11
page 325
i
i
i
i
i
i
i
i
[SEC. 13.5: UNICIDADE DE SOLUC
OES VISCOSAS 325
onde c > 0. Temos ent ao
1
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
c +
c
2
2
+
1
2
[x
0
y
0
[
2
+ 2
0
,
1
2
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
c +
c
2
2
+ 2
0
.
Da obtemos que
[x
0
y
0
[ c
com lim
0
c
= 0, [t
0
s
0
[ c
com lim
0
c
= 0.
Portanto, existe
0
> 0 e
0
> 0 com t
0
0
, s
0
0
independentes
de , (0,
0
). De fato, se assim n ao fosse, existiriam seq uencias
nN
,
n
nN
, t
n
nN
, x
n
nN
, s
n
nN
, y
n
nN
tais que
lim
n
n
= lim
n
n
= 0, lim
n
t
n
= 0 ou lim
n
s
n
= 0,
e ainda
(t
n
, x
n
, s
n
, y
n
) +
0
> sup(t, x, s, y) [ t, s [0, T], x, y R
n
,
para todo n N. Teramos ent ao lim
n
(x
n
y
n
) = 0, lim
n
t
n
= lim
n
s
n
=
0. Isso implicaria, para cada n N, que
sup(t, x, t, x) [ t [0, T], x R
n
< (t
n
, x
n
, s
n
, y
n
) +
0
u(t
n
, x
n
) v(s
n
, y
n
)
1
2
_
t
n
0
sup
xR
n
(f(, x) g(, x))d
1
2
_
s
n
0
sup
xR
n
(f(, x) g(, x))d +
0
.
Tomando o limite n e observando a continuidade uniforme de u e
v, obteramos a contradi c ao
sup(t, x, t, x) [ t [0, T], x R
n
sup
xR
n
(u
0
(x) v
0
(x)) +
0
.
Sejam, portanto, , (0,
0
), e (0,
1
2
0
). Temos que
(t
0
, x
0
, s
0
, y
0
) + > sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
steuer
2008/3/11
page 326
i
i
i
i
i
i
i
i
326 [CAP. 13: SOLUC
OES VISCOSAS E FUNC
AO VALOR
Tome C
0
(R
n
R
n
) com
(x
0
, y
0
) = 1, 0 1, [[ 1.
Para (0,
0
2T
) xo, dena
(t, x, s, y) := (t, x, s, y) +(x, y) t, t, s [0, T], x, y R
n
.
Da deni c ao de e do fato de possuir suporte compacto, podemos
garantir a existencia de (t
1
, x
1
, s
1
, y
1
) tal que
(t
1
, x
1
, s
1
, y
1
) = sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Como (0,
1
2
0
) e 0 1, segue da que
(t
1
, x
1
, s
1
, y
1
) +
0
> sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Portanto, (veja acima)
[x
1
y
1
[ c
, [t
1
s
1
[ c
.
Dena agora
1
(t, x) := u(t, x) (t, x, s, y) (x, y) +t,
2
(t, x) := v(t, x) (t, x, s, y) +(x, y) t.
Temos ent ao
u
1
possui um maximo em (t
1
, x
1
),
v
2
possui um maximo em (s
1
, y
1
).
Como u, v s ao solu c oes de viscosidade, temos que
1
(t
1
s
1
) +
1
2
sup
x
R
n
(f(t
1
, x
t
) g(t
1
, x
t
)) +
+H(t
1
, x
1
,
1
(x
1
y
1
)
x
(x
1
, y
1
)) f(t
1
, x
1
),
1
(t
1
s
1
)
1
2
sup
x
R
n
(f(s
1
, x
t
) g(s
1
, x
t
)) +
+H(s
1
, y
1
,
1
(x
1
y
1
) +
y
(x
1
, y
1
)) g(s
1
, y
1
).
steuer
2008/3/11
page 327
i
i
i
i
i
i
i
i
[SEC. 13.5: UNICIDADE DE SOLUC
OES VISCOSAS 327
Subtraindo as desigualdades acima, obtemos
f(t
1
, x
1
) g(s
1
, y
1
) +
1
2
sup
x
R
n
_
f(t
1
, x
t
) g(t
1
, x
t
)
_
+ sup
x
R
n
_
f(s
1
, x
t
) g(s
1
, x
t
)
_
+H
_
t
1
, x
1
,
1
(x
1
y
1
)
x
(x
1
, y
1
)
_
H
_
s
1
, y
1
,
1
(x
1
y
1
) +
y
(x
1
, y
1
)
_
.
Da segue que
f(t
1
, x
1
) g(s
1
, y
1
) +
H,R
([t
1
s
1
[ +)
+
1
2
sup
x
R
n
_
f(t
1
, x
t
) g(t
1
, x
t
)
_
+ sup
x
R
n
_
f(s
1
, x
t
) g(s
1
, x
t
)
_
,
onde
H,R
(r) := sup[H(t, p) H(s, q)[ [ [t s[ +[p q[ r, [p[, [q[ R
e R = R
=
c
+
0
, pois
1
[x
1
y
1
[ +[
x
(x
1
, y
1
)[
1
[x
1
y
1
[ +
c
+
0
.
Temos assim que
f,g
([t
1
s
1
[ +[x
1
y
1
[) +
H,R
([t
1
s
1
[ +),
onde
f,g
(r) :=
1
2
sup[f(t, x)f(s, y)[+[g(t, x)g(s, y)[ [ [ts[+[xy[ r.
Tomando o limite 0, 0, obtemos
f,g
([t
1
s
1
[ +[x
1
y
1
[) .
Tomando agora o limite 0, obtemos nalmente a contradi c ao 0.
steuer
2008/3/11
page 328
i
i
i
i
i
i
i
i
328 EXERC
ICIOS
Exerccios
13.1. Seja H : (0, 1) R
n
R
n
R contnua e sejam v
k
, k N,
solu c oes viscosas de
t
v + H(t, x,
x
v) = 0, (t, x) (0, 1) R
n
.
Mostre que se v
k
converge uniformemente para v, ent ao v tambem e
solu c ao viscosa da equa c ao diferencial.
13.2. Considere a equa c ao
[v
t
(x)[ = 1, x (1, 1). ()
a) Verique que v
1
(x) := 1 [x[, x [1, 1] e uma solu c ao viscosa de
(), enquanto v
2
(x) := [x[ 1, x [1, 1] n ao o e.
b) Encontre uma solu c ao viscosa de
[v
t
(x)[ = 1, x (1, 1), v(1) = v(1) = 0. ()
13.3. Seja U R
n
aberto e limitado. Dena
v(x) := dist(x, U), x U.
a) Mostre que v e lipschitz contnua em U.
b) Verique que v e uma solu c ao viscosa de [v(x)[ = 1, x U.
c) Analise os itens a) e b), caso U seja apenas aberto.
steuer
2008/3/11
page 329
i
i
i
i
i
i
i
i
Apendice A
Equac oes Diferenciais
Ordinarias
Neste captulo s ao discutidos resultados relacionados com a teoria
de resolu c ao de sistemas de equa c oes diferenciais ordinarias (EDOs).
Tal analise e fundamental para a teoria de controle, pois os sistemas de
controle podem ser interpretados como problemas de evolu c ao nos quais
temos a liberdade de escolher determinados par ametros que inuenciam
sua din amica.
Os topicos aqui abordados dizem respeito `a representa c ao de solu c oes,
assim como `a analise de resultados sobre existencia, unicidade e de-
pendencia contnua em rela c ao `as condi c oes iniciais. As tres primeiras
sec c oes tratam de sistemas lineares de EDOs, sendo problemas aut ono-
mos e n ao aut onomos tratados separadamente. Nas Sec c oes A.4 e A.5
s ao estudados resultados relacionados com a teoria geral de equa c oes
ordinarias. A Sec c ao A.6 se destina a analisar um metodo iterativo para
aproximar solu c oes de sistemas de EDOs com condi c oes de contorno
especiais.
A.1 Exponencial de uma Matriz
Ao resolver a equa c ao diferencial ordinaria escalar
z
t
(t) = az,
steuer
2008/3/11
page 330
i
i
i
i
i
i
i
i
330 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
onde a R, obtemos a seguinte formula para a solu c ao do problema
com condi c ao inicial z(0) = z
0
R:
z(t) = z
0
e
at
, t R; z
0
constante.
Nesta e na proxima sec c ao discutimos a equa c ao analoga quando a e
uma matriz n n com coecientes reais e z : R R
n
.
Adotamos no texto as seguintes nota c oes:
Representamos uma norma qualquer nos espa cos R
n
ou C
n
por | |.
1
Normas especiais nestes espa cos s ao as normas-p, | |
p
, 1 p ,
denidas por
|x|
p
:=
_
(
n
i=1
[x
i
[
p
)
1/p
, 1 p <
max
1in
[x
i
[ , p = ,
onde x = (x
1
, . . . , x
n
) R
n
. Nos espa cos R
m,n
(C
m,n
) dos operadores
lineares de R
n
em R
m
(de C
n
em C
m
) s ao de particular interesse as
normas denidas por
|A| := max|Ax|
a
[ |x|
b
1 = max|Ax|
a
/ |x|
b
[ x ,= 0,
onde | . |
a
e | . |
b
s ao duas normas quaisquer para os espa cos R
m
e R
n
,
respectivamente.
Observa cao 241. Com essas deni c oes, R
n
, C
n
, R
m,n
, C
m,n
s ao espa cos
vetoriais normados completos (espa cos de Banach) e podemos falar em
convergencia de seq uencias, seq uencias de Cauchy, series de elementos,
. . . Podemos, enm, dispor de todos os resultados associados `a estrutura
dos espa cos de Banach. 2
Deni cao 242. Seja a matriz A C
n,n
. A matriz denida formalmente
pela serie
(A.1)
k=0
1
k!
A
k
e denominada exponencial da matriz A. Para representa-la usamos a
nota c ao e
A
ou ainda exp(A). 2
1
Em espa cos euclidianos de dimens ao nita todas as normas s ao equivalentes. (veja
e.g. [Kre, Cap`tulo 2] ou [Ru1])
Duas normas | |
a
e | |
b
s ao ditas equivalentes quando existem constantes c
1
e
c
2
tais que c
1
|x|
a
< |x|
b
< c
2
|x|
a
, x.
steuer
2008/3/11
page 331
i
i
i
i
i
i
i
i
[SEC. A.2: SISTEMAS LINEARES AUT
ONOMOS 331
Note que, para toda matriz A C
n,n
, a serie na Deni c ao 242 con-
verge. De fato, da desigualdade
|e
A
|
i=0
1
k!
|A|
k
e
|A|
,
que e obtida da propriedade |AB| |A| |B|,
2
conclumos que a serie
em (A.1) converge absolutamente e, portanto, e uma serie convergente.
Lema 243. Seja 0 a matriz identicamente nula, I a matriz identidade
e M uma matriz inversvel qualquer. As seguintes propriedades da ex-
ponencial de matrizes s ao v alidas:
a) e
0
= I;
b) e
A+B
= e
A
e
B
, quando AB = BA;
c) e
A
= (e
A
)
1
;
d) e
MAM
1
= Me
A
M
1
;
e) Ae
A
= e
A
A.
Demonstra c ao: Tais propriedades s ao conseq uencia imediata da De-
ni c ao 242.
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
nos permite concluir que
lim
h0
h
1
(e
(t+h)A
e
tA
) = e
tA
lim
h0
h
1
(e
hA
I)
= e
tA
lim
h0
h
1
k=0
h
k
k!
A
k
I
= e
tA
lim
h0
(A+
hA
2
2!
+
h
2
A
3
3!
+. . .)
= e
tA
A.
Portanto, a aplica c ao
R t e
tA
R
n,n
e diferenciavel e sua derivada e dada por
(A.3) R t Ae
tA
= e
tA
A R
n,n
.
O teorema a seguir fornece uma resposta ao questionamento feito no
incio da sec c ao sobre a forma da solu c ao do sistema (A.2).
Teorema 244. O problema de valor inicial
(A.4) z
t
= Az , z(0) = z
0
possui como unica solu c ao a aplica c ao
R t e
tA
z
0
R
n
.
Demonstra c ao: De (A.3) temos que a aplica c ao t e
tA
z
0
e uma solu c ao
da equa c ao diferencial. Note que a condi c ao inicial tambem e satisfeita
por esta aplica c ao. Para vericar a unicidade, suponha que t v(t) e
uma outra solu c ao do problema de valor inicial. Logo, a fun c ao w(t) :=
e
tA
v(t) satisfaz
w
t
(t) = Ae
tA
v(t) + e
tA
v
t
(t) = Ae
tA
v(t) + e
tA
Av(t) = 0.
Isto e, w e uma fun c ao constante. Temos assim w(t) = e
0A
v(0) = z
0
.
Portanto, v(t) = e
tA
w(0) = e
tA
z
0
.
steuer
2008/3/11
page 333
i
i
i
i
i
i
i
i
[SEC. A.2: SISTEMAS LINEARES AUT
ONOMOS 333
Corolario 245. As colunas da matriz Z(t) := e
tA
geram n solu c oes
linearmente independentes para o sistema de equa c oes diferenciais (A.2).
Demonstra c ao: Para cada z
0
R
n
, a aplica c ao t Z(t)z
0
e uma
solu c ao de (A.2) com condi c ao inicial z(0) = z
0
. Denotando por
e
1
, . . . , e
n
a base can onica do R
n
, obtemos da escolha z
0
= e
j
, que
as colunas de Z(t) s ao solu c oes de (A.2). A independencia linear (no
espa co das fun c oes contnuas de R em R
n
) e conseq uencia do fato dos
vetores unitarios e
1
, . . . , e
n
serem linearmente independentes.
Seja t
0
R xo. A fun c ao matrical
A
(t, t
0
) := e
(tt
0
)A
, t R
e denominada matriz de transi c ao do sistema, pois ela descreve a transi c ao
do estado z
0
no tempo t
0
para o estado z(t) no tempo t atraves da
din amica do sistema (A.2). Note ainda que a aplica c ao
t
A
(t, t
0
) z
0
e solu c ao do problema de valor inicial (ou problema de Cauchy)
z
t
= Az , z(t
0
) = z
0
.
Resta-nos, portanto, resolver o problema de como calcular a fun c ao
e
tA
. Da algebra linear sabemos que toda matriz pode ser transformada
em uma forma can onica chamada forma can onica de Jordan. Importante
nesse fato e que se trata de uma transforma c ao de semelhan ca. Esse
resultado e formulado no lema a seguir.
Lema 246. Dada uma matriz A C
n,n
, existem matrizes M C
n,n
e
J
1
, . . . , J
p
que satisfazem:
A = MJM
1
,
J = diag(J
1
, . . . , J
p
),
J
i
=
i
I +N
i
, 1 i p,
onde
i
C s ao os autovalores de A,
diag(J
1
, . . . , J
p
) :=
_
_
_
J
1
0
.
.
.
0 J
p
_
_
_
steuer
2008/3/11
page 334
i
i
i
i
i
i
i
i
334 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
e
N
i
=
_
_
_
_
_
_
0 1 0
.
.
.
.
.
.
.
.
.
1
0 0
_
_
_
_
_
_
, 1 i p.
Demonstra c ao: Pode ser encontrada em [Gan].
Esse resultado e tambem conhecido na literatura como teorema da
decomposi c ao espectral, uma vez que as colunas da matriz M correspon-
dem aos autovetores da matriz A. O Lema 246 permite-nos reescrever
a exponencial e
tA
na forma
e
tA
= e
tMJM
1
= M e
tJ
M
1
= M diag(e
tJ
1
, . . . , e
tJ
p
) M
1
.
Note ainda que
e
tJ
i
= e
t(
i
I+N
i
)
= e
t
i
e
tN
i
.
Portanto, para calcular-mos e
tA
basta que saibamos calcular e
tN
i
, 1
i p. Como as matrizes N
i
s ao idempotentes, i.e. N
i
k
= 0 para algum
k N (verique!), as series que denem e
tN
i
s ao na verdade somas
nitas, o que permite o calculo da exponencial e
tN
i
de forma direta.
Exemplo 247. Seja a matriz
A =
_
0 1
1 0
_
.
Calculando as potencias de A, temos
A
2k
=
_
(1)
k
0
0 (1)
k
_
, A
2k1
=
_
0 (1)
k+1
(1)
k
0
_
.
Portanto, a exponencial de tA e dada formalmente pela express ao
e
tA
=
_
_
_
_
k=0
(1)
k t
2k
(2k)!
k=1
(1)
k+1 t
2k1
(2k 1)!
k=1
(1)
k t
2k1
(2k 1)!
k=0
(1)
k t
2k
(2k)!
_
_
_
_
.
Recordando a deni c ao das fun c oes analticas sin t e cos t (veja [Ru2]),
conclumos que
e
tA
=
_
cos t sin t
sin t cos t
_
.
steuer
2008/3/11
page 335
i
i
i
i
i
i
i
i
[SEC. A.2: SISTEMAS LINEARES AUT
ONOMOS 335
Calculemos agora e
tA
a partir da forma can onica de Jordan. Os autova-
lores de A s ao i e os respectivos autovetores s ao (i, 1), (i, 1). Podemos
ent ao calcular a matriz de transforma c ao M e sua inversa M
1
M =
_
i i
1 1
_
e M
1
=
1
2
_
i 1
i 1
_
.
Obtemos assim
J = M
1
AM =
_
i 0
0 i
_
, e
tJ
=
_
e
it
0
0 e
it
_
.
Usando as identidades: cos(t) = (e
it
+ e
it
)/2, sin(t) = (e
it
e
it
)/2i,
segue que
e
tA
= M e
tJ
M
1
=
_
cos t sin t
sin t cos t
_
.
Note que as colunas de e
tA
nos fornecem duas solu c oes linearmente in-
dependentes da equa c ao z
t
= Az. 2
Teorema 248. Seja A R
n,n
e R denido por
:= maxRe() [ autovalor de A.
Para cada > 0, existe uma constante c (dependendo de e A) tal que
|e
tA
| c e
(+)t
, t 0.
Demonstra c ao: Utilizando a forma can onica de Jordan temos:
|e
tA
|
2
= |Me
tM
1
AM
M
1
|
2
c
1
|e
tM
1
AM
|
2
= c
1
|e
tJ
|
2
c
2
p
i=1
|e
tJ
i
|
2
= c
3
p
i=1
[e
i
t
[
2
|e
tN
i
|
2
c
4
e
2t
p
i=1
|e
tN
i
|
2
.
Como as express oes |e
tN
i
| s ao apenas polinomiais em t, podemos limitar
seu crescimento por ce
t
, onde c > 0 e uma constante adequada, e o
resultado segue.
Conclumos a sec c ao obtendo solu c oes para problemas de valor inicial
n ao homogeneos, isto e problemas do tipo
(A.5) z
t
= Az + f(t), z(t
0
) = z
0
,
steuer
2008/3/11
page 336
i
i
i
i
i
i
i
i
336 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
onde A R
n,n
e f L
1
([t
0
, t
1
]; R
n
).
3
Aceitamos como solu c ao para
(A.5) as solu c oes z C([t
0
, t
1
]; R
n
) da equa c ao integral
(A.6) z(t) = z
0
+
_
t
t
0
[Az(s) +f(s)] ds, t [t
0
, t
1
].
A rela c ao entre as solu c oes de (A.5) e (A.6), assim como a garantia
de existencia de solu c ao para tais problemas e analisada no teorema a
seguir.
Teorema 249. O problema de valor inicial n ao homogeneo (A.5) possui
exatamente uma solu c ao, a qual e expressa por
(A.7) z(t) = e
(tt
0
)A
z
0
+
_
t
t
0
e
(ts)A
f(s) ds, t [t
0
, t
1
].
Demonstra c ao: A fun c ao z denida em (A.7) satisfaz tanto a equa c ao
diferencial quanto a condi c ao inicial em (A.5), resolvendo assim a ques-
t ao da existencia.
Quanto `a unicidade, caso v seja uma outra solu c ao de (A.5), ent ao w =
z v e solu c ao do problema homogeneo: w
t
= Aw com condi c ao inicial
w(t
0
) = 0. Como esse problema possui apenas a solu c ao trivial, temos
que 0 = w(t) = (z v)(t), para t [t
0
, t
1
], concluindo a demonstra c ao.
A.3 Sistemas Lineares nao Aut onomos
Consideramos a seguir sistemas homogeneos do tipo
(A.8) z
t
= A(t) z.
A existencia de solu c oes e conhecida quando A : [t
0
, t
1
] A(t) R
n,n
e
uma aplica c ao contnua, conforme nos revela o seguinte teorema:
Teorema 250. Seja A C([t
0
, t
1
]; R
n,n
), ent ao o problema de valor
inicial
(A.9) z
t
= A(t) z, z(t
0
) = z
0
3
Representamos por L
p
([t
0
, t
1
]; R
n
), 1 p < , n N, o espa co das fun c oes
p-Lebesgue integr aveis em [t
0
, t
1
] assumindo valores em R
n
.
steuer
2008/3/11
page 337
i
i
i
i
i
i
i
i
[SEC. A.3: SISTEMAS LINEARES N
AO AUT
ONOMOS 337
possui exatamente uma solu c ao z C
1
([t
0
, t
1
]; R
n
).
Demonstra c ao: Uma condi c ao necessaria para existencia de solu c oes do
problema (A.9) e que a equa c ao integral
(A.10) z(t) = (Fz)(t) := z
0
+
_
t
t
0
A(s) z(s) ds , t [t
0
, t
1
]
possua uma solu c ao z X := C([t
0
, t
1
]; R
n
). Note que F : X X esta
bem denida. Observe que, para toda constante real r, a norma denida
por
|z|
r
:= max[z(t)[ e
r(tt
0
)
[ t [t
0
, t
1
]
e equivalente `a norma usual do espa co X: |z|
X
=|z|
=max[z(t)[ [ t
[t
0
, t
1
].
Denindo agora c(A) = max|A(t)| [ t [t
0
, t
1
] e tomando r > 2c(A),
temos para todo z, x X e t [t
0
, t
1
] que:
[Fz(t) Fx(t)[ = [
_
t
t
0
A(s) (z(s) x(s)) ds[
_
t
t
0
|A(s)| [z(s) x(s)[ ds
c(A)
_
t
t
0
e
r(st
0
)
e
r(st
0
)
[z(s) x(s)[ ds
c(A) |z x|
r
_
t
t
0
e
r(st
0
)
ds
c(A) r
1
e
r(tt
0
)
|z x|
r
.
Logo,
|Fz Fx|
r
1/2 |z x|
r
,
provando que a aplica c ao F e Lipschitz contnua em (X, | |
r
). Mais
que isso, provamos que F e uma contra c ao (i.e. |F| < 1) no espa co
normado completo X.
4
O teorema do ponto xo de Banach
5
garante
que F possui um ponto xo z C([t
0
.t
1
]; R
n
).
Da deni c ao de F e da identidade z = F z, podemos ainda concluir que
a fun c ao z esta em C
1
([t
0
, t
1
]; R
n
). Portanto, e uma solu c ao de (A.9).
4
Como (X; | |
) e completo e as normas | |
e | |
r
s ao equivalentes, ent ao
(X; | |
r
) tambem e completo.
5
Uma demonstra c ao pode ser encontrada em [Kre], Captulo 4.
steuer
2008/3/11
page 338
i
i
i
i
i
i
i
i
338 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
A unicidade de solu c ao para (A.9), equivalentemente para equa c ao
Fz = z, e garantida novamente pelo teorema do ponto xo de Banach.
Observa cao 251. O resultado de existencia e unicidade do teorema
anterior pode ser tambem obtido da ideia de congelamento do tempo.
Para tanto, reescrevemos o problema a m de obter um sistema proximo
de ser aut onomo e n ao homogeneo.
z
t
= A(t
0
)z + (A(t) A(t
0
)) z, z(t
0
) = z
0
.
Para todo z C([t
0
, t
1
]; R
n
), a aplica c ao t [A(t) A(t
0
)]z(t) e ob-
viamente L
1
integravel. O Teorema 249 nos garante que a solu c ao da
equa c ao acima pode ser procurada entre as solu c oes da equa c ao integral
(A.11)
z(t) = (Fz)(t) := e
(tt
0
)A(t
0
)
z
0
+
_
t
t
0
e
(ts)A(t
0
)
(A(s) A(t
0
)) z(s) ds, t [t
0
, t
1
].
Equipando novamente o espa co X := C([t
0
, t
1
]; R
n
) com a norma |z|
r
podemos concluir que F e Lipschitzcontnua em (X; | |
r
), se esco-
lhermos r de forma adequada. De fato, denindo c(A) = max|A(t)
A(t
0
)| [ t [t
0
, t
1
], temos para todo z, x X e t [t
0
, t
1
]
[Fz(t) Fx(t)[ = [
_
t
t
0
e
(ts)A(t
0
)
(A(t) A(t
0
)) (z(s) x(s)) ds[
_
t
t
0
|e
(ts)A(t
0
)
| |A(t) A(t
0
)| [z(s) x(s)[ ds
c(A)
_
t
t
0
e
(ts)|A(t
0
)|
e
r(st
0
)
e
r(st
0
)
[z(s) x(s)[ ds
c(A) e
(tt
0
)|A(t
0
)|
|z x|
r
_
t
t
0
e
r(st
0
)
ds
c(A) e
(t
1
t
0
)|A(t
0
)|
|z x|
r
r
1
e
r(tt
0
)
.
Escolhendo r > 2 c(A) e
(t
1
t
0
) |A(t
0
)|
, temos
|Fz Fx|
r
1/2 |z x|
r
.
A partir deste ponto procedemos como na demonstra c ao do Teorema 249.
2
steuer
2008/3/11
page 339
i
i
i
i
i
i
i
i
[SEC. A.3: SISTEMAS LINEARES N
AO AUT
ONOMOS 339
Observa cao 252. Sem o artifcio de redenir a norma do espa co
X := C([t
0
, t
1
]; R
n
) usando uma norma equivalente `a norma usual de
(X, ||
k=1
[
k
[ ,= 0 e
n+1
k=1
k
z
i
(0) = 0.
Ent ao a fun c ao z(t) :=
n+1
k=1
k
z
k
(t) satisfaz
z(0) = 0 e z
t
= A z.
Como z C
1
([t
0
, t
1
]; R
n
), o Teorema 250 garante a unicidade de solu c ao
para este problema e temos z 0.
steuer
2008/3/11
page 340
i
i
i
i
i
i
i
i
340 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
Deni cao 255. Seja A C([t
0
, t
1
]; R
n,n
). Denominamos por sistema
fundamental toda base z
1
, . . . , z
n
para espa co de solu c oes do sistema
(A.13) z
t
= A(t) z.
A matriz correspondente
Z(t) := (z
1
(t)[ . . . [z
n
(t)), t [t
0
, t
1
]
e denominada matriz fundamental do sistema (A.13). 2
Uma vez conhecida a matriz fundamental Z do sistema (A.13), pode-
mos escrever
Z
t
= A(t) Z.
Usando argumentos de unicidade e possvel concluir que
det Z(t) ,= 0, t [t
0
, t
1
].
Fica, portanto, claro que a unica solu c ao do problema de valor inicial
(A.14) z
t
= A(t) z , z(s) = z
0
,
para qualquer s [t
0
, t
1
], e dada por
z(t) = Z(t) Z(s)
1
z
0
, t [t
0
, t
1
].
Novamente usando argumentos de unicidade, conclumos que a fun c ao
matricial
[t
0
, t
1
] t Z(t) Z(s)
1
R
n,n
n ao pode depender da matriz fundamental Z. Portanto, duas matrizes
fundamentais diferem somente por uma matriz constante n ao singular
(verique!). Sendo assim, se torna importante a seguinte deni c ao:
Deni cao 256. Seja Z uma matriz fundamental para (A.13). A fun c ao
matricial denida pela aplica c ao (, s) : [t
0
, t
1
] R
n,n
A
(t, s) := Z(t) Z(s)
1
e denominada matriz de transi c ao do sistema (A.13).
6
2
6
Note que para sistemas aut onomos a matriz de transi c ao e
A
(t, s) = e
A(ts)
=
e
tA
e
sA
, conforme denido na Sec c ao A.2.
steuer
2008/3/11
page 341
i
i
i
i
i
i
i
i
[SEC. A.3: SISTEMAS LINEARES N
AO AUT
ONOMOS 341
Lema 257. As seguintes opera c oes s ao v alidas:
A
(t, t) = I; (A.15)
A
(t, s) =
A
(t, r)
A
(r, s) (propriedade de semigrupo); (A.16)
A
(t, s)
1
=
A
(s, t); (A.17)
A
t
(t, s) = A(t)
A
(t, s), t [t
0
, t
1
]; (A.18)
Demonstra c ao:
E deixada como exerccio para o leitor.
Consideremos agora o seguinte problema de valor inicial n ao ho-
mogeneo
(A.19) z
t
= A(t) z + f(t) , z(t
0
) = z
0
,
onde A C([t
0
, t
1
]; R
n
) e f L
1
([t
0
, t
1
]; R
n
). Se consideramos como
solu c oes as fun c oes z C([t
0
, t
1
]; R
n
), que satisfazem a equa c ao integral
z(t) = z
0
+
_
t
t
0
[A(s)z(s) +f(s)] ds, t [t
0
, t
1
],
ent ao temos ao nosso dispor o seguinte teorema:
Teorema 258. Dados A C([t
0
, t
1
]; R
n
), f L
1
([t
0
, t
1
]; R
n
), z
0
R
n
,
o problema de valor inicial
(A.20) z
t
= A(t) z + f(t), z(t
0
) = z
0
possui uma unica solu c ao C([t
0
, t
1
]; R
n
), que e dada por
(A.21) z(t) =
A
(t, t
0
) z
0
+
_
t
t
0
A
(t, s) f(s) ds, t [t
0
, t
1
].
Demonstra c ao: Seja z a fun c ao denida em (A.21). De (A.15), temos
z(t
0
) = z
0
e de (A.18), temos
z
t
(t) = A(t)
A
(t, t
0
) z
0
+
_
t
t
0
A(t)
A
(t, s) f(s) ds +
A
(t, t) f(t)
= A(t) z + f(t), t [t
0
, t
1
],
vericando assim a existencia. A unicidade segue do fato do sistema
(A.19) possuir apenas solu c ao trivial quando z
0
= 0.
steuer
2008/3/11
page 342
i
i
i
i
i
i
i
i
342 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
Outro problema abordado neste manuscrito e o associado com o sis-
tema adjunto ao sistema (A.13). Dada uma fun c ao matricial A : [t
0
, t
1
]
t A(t) R
n,n
, considere o sistema
(A.22) w
t
= A(t)
w,
onde a matriz A(t)
= A(t)
(Z(t)
1
)
.
Portanto, (Z(t)
1
)
A
(t, s) := (
A
(t, s)
1
)
=
A
(s, t)
.
A.4 Sistemas nao Lineares: existencia e unici-
dade
Discutimos nesta sec c ao resultados relativos `a teoria de existencia
e unicidade de solu c oes para sistemas din amicos n ao lineares e n ao
aut onomos. Iniciamos a discuss ao introduzindo um conceito de regu-
laridade de fun c oes, que e fundamental para a analise subseq uente.
Deni cao 259. Seja D um subconjunto do R
n
. Uma fun c ao f : D R
e denominada Lipschitz contnua em D quando existe uma constante
L > 0 tal que
[f(x) f(y)[ L [x y[,
para todos x, y D. 2
steuer
2008/3/11
page 343
i
i
i
i
i
i
i
i
[SEC. A.4: SISTEMAS N
AO LINEARES: EXIST
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
Aplicando o argumento acima sucessivamente, obtemos [z
(k)
(t)z
0
[ b.
Provamos a seguir que a seq uencia z
(k)
converge uniformemente e que
o seu limite z e uma solu c ao de Tz = z. Inicialmente reescrevemos
z
(k)
= z
(0)
+ [z
(1)
z
(0)
] + + [z
(k)
z
(k1)
].
Concentremo-nos por um momento nos termos da soma acima. Recorde
que [z
(1)
z
0
[ M[t t
0
[. Usando um argumento indutivo provamos
que (verique!)
[z
(k)
z
(k1)
[ L
k1
M
[t t
0
[
k
k!
.
Temos assim a estimativa
[z
(k)
(t)[ [y
0
[ +
k
j=1
M
L
(L)
k
k!
.
Isto e, reescrevemos z
(k)
como soma parcial de uma serie que e limi-
tada pela serie exponencial. Portanto, a seq uencia z
(k)
converge uni-
formemente em [t
0
, t
0
+ ] e seu limite z := lim
k
z
(k)
e uma fun c ao
C
1
([t
0
, t
0
+]; R
n
). A convergencia uniforme de z
(k)
e a continuidade
de f implicam em
f(t, z
(k)
(t))
unif
f(t, z(t)).
De fato, esta arma c ao segue da desigualdade [f(t, z
(k)
(t))f(t, z(t))[
L[z
(k)
(t) z(t)[. Portanto, temos que
(Tz)(t) = z
0
+
_
t
t
0
lim
k
f(t, z
(k)
(t)) dt
= lim
k
(Tz
(k)
)(t) = lim
k
(z
(k+1)
(t)) = z(t),
provando o teorema.
Note que o metodo das aproxima c oes sucessivas na demonstra c ao
acima substitui o teorema de ponto xo de Banach usado na demons-
tra c ao do Teorema 250. Com esse metodo construmos uma seq uencia
de Cauchy especial no espa co de Banach (C
1
(t
0
, t
0
+ ); | |
1;
) e
utilizamos argumentos classicos da analise real para demonstrar que o
limite dessa seq uencia e uma solu c ao do problema de valor inicial.
No teorema a seguir vericamos que a solu c ao encontrada no Teo-
rema 260 e a unica solu c ao do problema de valor inicial.
steuer
2008/3/11
page 345
i
i
i
i
i
i
i
i
[SEC. A.4: SISTEMAS N
AO LINEARES: EXIST
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
Integrando a equa c ao diferencial, temos que
(A.23)
[z
1
(t) z
2
(t)[
_
t
t
0
[f(s, z
1
(s)) f(s, z
2
(s))[ ds
L
_
t
t
0
[z
1
(s) z
2
(s)[ ds,
onde L e a constande de Lipschitz de f. Note que a fun c ao escalar
denida por
(t) := max[z
1
(t) z
2
(t)[; t (t
0
, t)
e n ao negativa, n ao decrescente e (t
0
) = 0. Para provar o teorema,
basta vericar que 0. Suponha por contradi c ao que existe
t
1
[t
0
, t
0
+) tal que
(t) = 0, t [t
0
, t
1
] e (t) > 0, t (t
1
, t
1
+)
para > 0 pequeno. De (A.23) segue que
[(t)[ L
_
t
t
1
[(s)[ ds L(t)[t t
1
[, t (t
1
, t
1
+),
o que e claramente um absurdo. Fica assim provado que 0 em
[t
0
, t
0
+ ). Um argumento analogo nos permite concluir que 0 em
(t
0
, t
0
], completando a demonstra c ao. 2
A demonstra c ao alternativa do Teorema 260, descrita na observa c ao
acima, ca em muito simplicada quando utilizamos o lema de Gronwall
(veja Lema 264) para provar que 0 em (t
0
, t
0
+].
Observa cao 263. Note que, sem a hipotese de f ser Lipschitz contnua,
o resultado acima n ao e necessariamente valido. De fato, a fun c ao
f(t, z) = z
1/3
e contnua na origem, mas o problema
_
z
t
(t) = f(t, z), t (h, h)
z(0) = 0
admite as solu c oes
z
1
0 e z
2
(t) =
_
(
2
3
t)
3/2
, t 0
0, t < 0
,
como o leitor pode facilmente vericar. 2
steuer
2008/3/11
page 347
i
i
i
i
i
i
i
i
[SEC. A.5: SISTEMAS N
AO LINEARES: DEPEND
ENCIA CONT
INUA 347
A.5 Sistemas nao Lineares: dependencia cont-
nua
Iniciamos esta sec c ao demonstrando a estimativa conhecida na lite-
ratura como lema de Gronwall, a qual e utilizada na demonstra c ao do
Teorema 65.
Lema 264. Dadas as constantes , > 0, se uma fun c ao contnua
w : [0, T] R satisfaz
w(t) +
_
t
0
w(s) ds, t [0, T],
podemos estimar o crescimento de w por
w(t) e
t
, t [0, T].
Demonstra c ao: Seja > 0 e dena v(t) := ( +)e
t
para t [0, T]. A
fun c ao v satisfaz a equa c ao diferencial v
t
= v. Logo, v tambem satisfaz
a equa c ao integral
v(t) = + +
_
t
0
v(s) ds, t [0, T].
Dena S := t [0, T] [ w(s) < v(s) para s [0, t]. Por constru c ao,
temos 0 S. Dena agora t
0
:= inft; t [0, T]S. Suponha que
t
0
< T. Como w e v s ao contnuas, segue da deni c ao de S e t
0
que
w(t
0
) = v(t
0
). Porem, da desigualdade
w(t
0
) +
_
t
0
0
w(s) ds < + +
_
t
0
0
v(s) ds = v(t
0
)
obtemos uma contradi c ao `a hipotese t
0
< T. Temos, portanto, que
t
0
= T. De onde conclumos que
w(t) ( +) e
t
, t [0, T].
Como > 0 e arbitrario, o lema ca provado.
Existem diversas variantes do Lema 264. No lema a seguir apresen-
tamos uma delas, que e utilizada neste manuscrito.
steuer
2008/3/11
page 348
i
i
i
i
i
i
i
i
348 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
Lema 265. Dadas a constante > 0 e fun c oes contnuas w, u : [0, T]
R satisfazendo u(t) 0 e
w(t) +
_
t
0
u(s) w(s) ds, t [0, T],
ent ao podemos estimar o crescimento de w por
w(t) e
t
0
u(s)ds
, t [0, T].
Demonstra c ao: Para 0 dado, denimos a fun c ao
w
(t) := + +
_
t
0
u(s)w(s) ds, t [0, T].
Temos assim que w
t
(s) = u(s)w(s). Usando as hipoteses, segue que
w
t
(s) u(s)w
t
(s)(w
(s))
1
(t) ln w
(0)
_
t
0
u(s) ds, t [0, T].
Tomando a exponencial dos dois lados, obtemos
w
(t)(w
(0))
1
e
t
0
u(s)ds
, t [0, T].
Utilizando agora a desigualdade w(t) w
(t) e a identidade w
(0) =
+, obtemos
w(t) ( +)e
t
0
u(s)ds
, t [0, T].
Como > 0 e arbitrario, o lema ca provado.
Provamos agora o resultado principal da sec c ao, o qual garante que,
sob hipoteses apropriadas, a solu c ao de um problema de valor inicial
depende continuamente das condi c oes iniciais.
Lema 266. Seja D R
n
aberto e f : D D Lipschitz contnua em
D com constante de Lipschitz L. Seja ainda z : D D uma solu c ao
de z
t
= f(z), z(0) = z
0
e y C
1
(D; D) continuamente diferenci avel
satisfazendo
[y(0) z(0)[ a, [y
t
(t) f(y(t))[ b, t [0, T].
steuer
2008/3/11
page 349
i
i
i
i
i
i
i
i
[SEC. A.5: SISTEMAS N
AO LINEARES: DEPEND
ENCIA CONT
INUA 349
Ent ao vale a estimativa
[y(t) z(t)[ (a +bT) e
Lt
, t [0, T].
Demonstra c ao: Para t [0, T], temos
[y(t) z(t)[ = [y(0) z(0) +
_
t
0
(y
t
(s) z
t
(s)) ds[
a +
_
t
0
([y
t
(s) f(y(s))[ +[f(y(s)) f(z(s))[) ds
a +bt +
_
t
0
L[y(s) z(s)[ ds
a +bT +
_
t
0
L[y(s) z(s)[ ds.
Denindo w(t) := [y(t) z(t)[, obtemos da desigualdade acima que
w(t) a +bT +L
_
t
0
w(s) ds, t [0, T].
A estimativa desejada segue agora do lema de Gronwall (Lema 264)
aplicado `a fun c ao w com = a +bT e = L.
Corolario 267. Seja D R
n
aberto e f : D D Lipschitz contnua em
D com constante de Lipschitz L. Sejam ainda z, y : D D solu c oes
de z
t
= f(z), satisfazendo z(0) = z
0
e y(0) = y
0
, com
[y(0) z(0)[ a.
Ent ao vale a estimativa
[y(t) z(t)[ a e
Lt
, t [0, T].
Demonstra c ao: Tome b = 0 na demonstra c ao do Lema 266
Observa cao 268. Na verdade, e possvel obter uma estimativa melhor
do que a apresentada no Lema 266. De fato, e possvel provar que
[y(t) z(t)[ ae
Lt
+bL
1
(e
Lt
1), t [0, T].
Para detalhes consulte [Sot]. 2
steuer
2008/3/11
page 350
i
i
i
i
i
i
i
i
350 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
A.6 Metodo de Shooting
Analisamos nesta sec c ao um metodo iterativo para solucionar uma
famlia especial de problemas de valor de contorno, a saber: aqueles em
que parte das condi c oes de contorno e dada no tempo inicial e parte no
tempo nal. Estudamos inicialmente o caso linear, que corresponde aos
sistemas da forma
(A.24)
_
_
_
z
t
= A(t) z + f(t), t (t
0
, t
1
)
z
i
(t
0
) = c
i
, i = 1, . . . , r
z
i
(t
1
) = d
i
, i = r + 1, . . . , n,
onde as constantes c
i
, d
i
R e 0 < r < n s ao dadas, assim como as
fun c oes A C([t
0
, t
1
]; R
n
), f L([t
0
, t
1
]; R
n
).
O objetivo e identicar as condi c oes iniciais z
i
(t
0
), i = r + 1, . . . , n,
para ent ao tratar o problema (A.24) como um problema de valor inicial.
Para tanto, considere o sistema adjunto ao sistema z
t
= Az, i.e. o
sistema
w
t
= A
w, w(t
0
) = w
0
.
Como vimos na Sec c ao A.3, as solu c oes dos problemas de valor inicial
para sistemas adjuntos satisfazem
z(t
1
) =
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s)f(s) ds, t [t
0
, t
1
],
w(t
1
) =
A
(t
0
, t
1
)
w
0
.
Logo,
w(t
1
)
z(t
1
) = w(t
1
)
A
(t
1
, t
0
) z(t
0
) +
_
t
1
t
0
w(t
1
)
A
(t
1
, s)f(s) ds
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(t
1
)
A
(t
1
, s)f(s) ds
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(s)
w, w(t
1
) = e
r+i
,
steuer
2008/3/11
page 351
i
i
i
i
i
i
i
i
[SEC. A.6: M
z(t
1
) = z
r+i
(t
1
) = d
r+i
, para i = 1, . . . , n r. Substituindo em
(A.25), obtemos para cada i = 1, . . . , n r que
d
r+i
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(s)
f(s) ds.
Desta identidade conclumos que
(A.26)
n
j=r+1
w
(i)
j
(t
0
)z
j
(t
0
) = d
r+i
r
j=1
w
(i)
j
(t
0
)c
j
_
t
1
t
0
w
(i)
(s)
f(s) ds, i = 1, . . . , n r.
Note que (A.26) e um sistema linear comnr equa c oes para as incognitas
z
r+1
(t
0
), . . ., z
n
(t
0
). Resolvendo-o, obtemos todas as condi c oes iniciais
em t = t
0
para o problema (A.24) e podemos soluciona-lo como um
problema de valor inicial usual. A inversibilidade da matriz [w
(i)
j
(t
0
)]
do sistema (A.26) se deve ao fato de w
(1)
, . . . , w
(nr)
serem solu c oes
linearmente independentes do sistema adjunto.
Caso r n/2, podemos minimizar os calculos a serem realizados se
obtivermos um sistema analogo ao (A.26) para reconstruir as condi c oes
nais z
1
(t
1
), . . . , z
r
(t
1
), bastando para isso trocar os papeis das condi c oes
iniciais e nais no desenvolvimento acima. O metodo descrito acima e
denominado metodo de equa c oes adjuntas.
Analisamos a seguir o denominado metodo de shooting, que fornece
aproxima c oes para a solu c ao do seguinte problema de valor de contorno:
_
_
_
z
t
= f(z), t (t
0
, t
1
)
z
i
(t
0
) = c
i
, i = 1, . . . , r
z
i
(t
1
) = d
i
, i = r + 1, . . . , n
Como no metodo de equa c oes adjuntas, o objetivo e determinar as
condi c oes iniciais z
r+1
(t
0
), . . . , z
n
(t
0
), a m de obter um problema de
valor inicial e resolve-lo por um metodo de integra c ao adequado.
O metodo iterativo e iniciado escolhendo-se arbitrariamente valores
z
(0)
r+1
, . . . , z
(0)
n
. Estes s ao utilizados juntamente com as condi c oes iniciais
fornecidas c
i
, i = 1, . . . , r para resolver o problema de valor inicial (PVI)
correspondente. A solu c ao deste PVI e denominada z
(0)
. O proximo
steuer
2008/3/11
page 352
i
i
i
i
i
i
i
i
352 [AP
ENDICE A: EQUAC
OES DIFERENCIAIS ORDIN
ARIAS
passo e escolher para k 0, fun c oes
(k)
: [t
0
, t
1
] R
n
, de modo que
z
(k+1)
denida por
z
(k+1)
(t) := z
(k)
(t) +
(k)
(t),
satisfa ca z
(k+1)
(t) = f(z
(k+1)
) e ainda
(A.27)
z
(k+1)
i
(t
0
) = c
i
, i = 1, . . . , r e z
(k+1)
i
(t
1
) = d
i
, i = r + 1, . . . , n.
Se
(k)
e escolhida desta forma, temos
(k)
(t) = z
(k+1)
(t) z
(k)
(t) = f(z
(k+1)
) f(z
(k)
)
_
f
i
z
j
(z
(k)
)
_
(z
(k+1)
(t) z
(k)
(t)) = J(z
(k)
)
(k)
(t), (A.28)
onde J e o jacobiano de f. Das condi c oes de contorno (A.27), temos
ainda que
(k)
i
(t
0
) = 0, i = 1, . . . , r e
(k)
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r+1, . . . , n.
Portanto, cada
(k)
e solu c ao de um problema de valor de contorno
linear, a saber:
_
_
(k)
= J(z
(k)
)
(k)
, t [t
0
, t
1
]
(k)
i
(t
0
) = 0, i = 1, . . . , r
(k)
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r + 1, . . . , n,
o qual pode ser resolvido pelo metodo de equa c oes adjuntas, discutido no
incio da sec c ao. O metodo iterativo ca assim bem denido. Um criterio
de parada usualmente utilizado e calcular o erro |z
(k+1)
(t
1
)z
(k)
(t
1
)| =
|
(k)
(t
1
)| e terminar o algoritmo quando este for pequeno o bastante.
ICIOS 353
1. k := 0; Escolha z
(0)
r+1
(t
0
), . . . , z
(0)
n
(t
0
) R;
2. Resolva o PVI
_
z
t
= f(z), t [t
0
, t
1
]
z(t
0
) = (c
1
, . . . , c
r
, z
(k)
r+1
(t
0
), . . . , z
(k)
n
(t
0
))
e obtenha a solu c ao z
(k)
(t);
3. Resolva pelo metodo de equa c oes adjuntas o PVC linear
_
_
_
= J(z
(k)
) , t [t
0
, t
1
]
i
(t
0
) = 0, i = 1, . . . , r
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r + 1, . . . , n
e obtenha a solu c ao
(k)
(t).
7
Na verdade nos interessa apenas
calcular as ultimas n r componentes do vetor
(k)
(t
0
);
4. Calcule z
(k+1)
(t
0
) := z
(k)
(t
0
) +
(k)
(t
0
);
5. Se |
(k)
(t
1
)| e pequeno o bastante PARE;
Sen ao k := k + 1; volte ao Passo 2.
Tabela A.1: Algoritmo para o metodo de shooting
Exerccios
A.1. Escreva a EDO z
tt
3z
t
+2z = 0 na forma de sistema e calcule a
matriz de transi c ao.
A.2. Dado > 0, resolva o PVI z
tt
3z
t
+2z = f(t), z(0) = 1, z
t
(0) = 0,
onde
f(t) =
_
_
_
0, t < 2
1/, t [2, 2 +)
0, t 2 +
.
A.3. Dada A C
n,n
, dena formalmente a matriz
sin A :=
k=1
(1)
k
1
(2k 1)!
A
2k1
.
7
Note que o sistema adjunto ao sistema (A.28) e w
(k)
= J(z
(k)
)
w
(k)
.
steuer
2008/3/11
page 354
i
i
i
i
i
i
i
i
354 EXERC
ICIOS
Para quais matrizes A a serie acima converge? Calcule sin A para
A =
_
3 2
2 3
_
.
A.4. Considere o problema de valor de contorno
z
t
= A(t)z +f(t), t [t
0
, t
1
], Rz = g,
onde Rz := Cz(t
0
) + Dz(t
1
), g R
n
, C, D R
n,n
. Seja Z(t) a matriz
fundamental do sistema z
t
= A(t)z. Prove a equivalencia das arma c oes
abaixo:
a) O problema homogeneo z
t
= Az, Rz = 0 possui apenas solu c ao
trivial;
b) A matriz CZ(t
0
) +DZ(t
1
) e regular;
c) Dadas f C([t
0
, t
1
]; R
n
), g R
n
o PVC possui exatamente uma
solu c ao.
A.5. Para quais matrizes A C
n,n
existe uma matriz correspondente
R C
n,n
, tal que e
R
= A? (A matriz R e denominada logaritmo de A.)
(Dica: Construa R para blocos de Jordan, de forma analoga `a serie
ln(1 +) =
k=0
(1)
k
k + 1
k+1
,
denida para [[ < 1.)
A.6. Reescreva a demonstra c ao sugerida na Observa c ao 262 utilizando
o lema de Gronwall para provar que 0.
A.7. Resolva pelo metodo de equa c oes adjuntas o problema de valor
de contorno
z
tt
= z +t, z(0) = 0, z(1) = .
A.8. Prove que a equa c ao diferencial
x
tt
+x +b(t) = 0,
com b(t + 2) = b(t), t R, possui uma solu c ao periodica com perodo
2, se e somente se
_
2
0
b(T) cos(t)dt =
_
2
0
b(T) cos(t)dt = 0.
steuer
2008/3/11
page 355
i
i
i
i
i
i
i
i
EXERC
ICIOS 355
A.9. Considere o sistema n ao linear z
t
= f(z), onde z = (z
1
, z
2
, z
3
),
f(z) :=
_
_
1 z
1
z
1
z
2
(a
1
+z
1
)
1
a
2
(1 z
1
3
)z
2
z
2
a
3
z
1
(a
1
+z
1
)
1
a
2
(z
3
1)
_
_
e a
1
, a
2
, a
3
s ao constantes positivas.
a) Prove que o conjunto aberto M := z R
3
[ z
i
> 0, i = 1, 2, 3
e positivo invariante, i.e. uma trajetoria com condi c ao inicial em M,
permanece neste conjunto durante todo seu intervalo de existencia.
b) Qual equa c ao diferencial e satisfeita pela fun c ao v := z
1
+a
1
3
z
2
z
3
?
c) Calcule para a
2
a
3
a
2
a
3
a
1
a
2
> 0 os pontos de equilbrio do
sistema e discuta sua estabilidade.
A.10. Considere o sistema z
t
= Az b, z(0) = z
0
, onde A R
n,n
e
uma matriz estavel, b, z
0
R
n
.
a) Mostre que uma solu c ao z do sistema existe para todo t 0.
b) Prove que x := lim
t
z(t) existe e ainda que satisfaz Ax = b.
A.11. Seja A R
n,n
e p
A
o polin omio caracterstico correspondente,
i.e.
p
A
(z) := det(zI A) = z
n
+c
n1
z
n1
+ +c
1
z +c
0
.
Verique que a exponencial (t) := e
At
, t R e solu c ao de
(n)
+c
n1
(n1)
+ +c
1
t
+c
0
= 0.
(0) = I,
t
(0) = A, . . . ,
(n1)
(0) = A
n1
.
steuer
2008/3/11
page 356
i
i
i
i
i
i
i
i
Apendice B
Demonstracao do Princpio
do Maximo
Neste apendice apresentamos uma demonstra c ao do princpio de
Pontryagin para problemas com horizonte nito (tempo nal livre), a
qual se baseia nas notas de aula de M. Brokate (veja [Br]). A demons-
tra c ao se divide em tres partes principais:
Na Sec c ao B.1 obtemos um conjunto de condi c oes necessarias para
otimalidade de solu c oes de um problema abstrato de otimiza c ao
em espa cos de dimens ao innita;
Na Sec c ao B.2 aplicamos o resultado do item anterior a um pro-
blema auxiliar, construido a partir do problema de controle otimo
atraves de uma reparametriza c ao da variavel de tempo;
Na Sec c ao B.3 invertemos a parametriza c ao do item anterior, a
m de reescrever as condi c oes necessarias para o problema auxi-
liar e obter as desejadas condi c oes necessarias para o problema de
controle otimo.
Outras demonstra c oes do princpio do maximo para os problemas
aqui tratados (horizonte nito) podem ser encontradas em [LiYo] e [Tr].
B.1 Otimizacao Innita
Investigamos nesta sec c ao condi c oes necessarias para otimalidade de
problemas de minimiza c ao em espa cos de dimens ao innita envolvendo
steuer
2008/3/11
page 357
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 357
fun c oes continuamente diferenciaveis.
B.1.1 Um Problema Abstrato de Otimizacao
A ttulo de motiva c ao, suponha que J : R
n
R e uma aplica c ao
diferenciavel. Se x R
n
e tal que
J( x) = min
xR
n
J(x),
ent ao o gradiente de J se anula em x, i.e. J( x) = 0. A recproca e
verdadeira se J for convexo.
Considere agora o problema de otimiza c ao restrito:
_
_
Minimizar J(x)
sujeto a
g
i
(x) 0 , 1 i m,
h
i
(x) = 0, 1 i l
onde J : U R, G = (g
1
, . . . , g
m
) : U R
m
, H = (h
1
, . . . , h
l
) : U
R
l
s ao aplica c oes diferenciaveis no aberto U R
n
. Representamos as
restri c oes de forma simplicada por G(x) 0, H(x) = 0.
As condi c oes necessarias para otimalidade deste problema s ao forneci-
das pelo teorema dos multiplicadores de Lagrange.
Teorema 269. Sejam J, G, H fun c oes satisfazendo as condi c oes acima.
Se a fun c ao J sujeita ` as restri c oes G(x) 0, H(x) = 0 possui um
extremo local (max/min) em x, ent ao existem R, = (
1
, . . . ,
m
)
R
m
, = (
1
, . . . ,
l
) R
l
tais que:
(i) J( x) +
m
i=1
i
g
i
( x) +
m
j=1
j
h
j
( x) = 0;
(ii)
i
0,
i
g
i
( x) = 0, 1 i m;
(iii) 0, [[ +[[ +[[ ,= 0.
Nesta sec c ao obtemos, em espa cos de Banach, um resultado analogo
ao Teorema 269 (de preferencia com ,= 0). Tal resultado e usado mais
adiante para demonstrar o princpio do maximo (ver Sec c ao B.2).
steuer
2008/3/11
page 358
i
i
i
i
i
i
i
i
358 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
Antes de prosseguir com a formula c ao do problema de otimiza c ao
em espa cos de Banach, necessitamos de alguns conceitos topologicos
basicos. Sejam X, Y espa cos normados, M X, z X. Adotamos
a seguinte nota c ao: B
r
(z) := x [ [[x z[[ r, B
r
:= B
r
(0), r > 0.
int(M) := x X [ r > 0 com B
r
(x) M, cl(M) := Xint(XM).
B(X, Y ) := T [ T : X Y linear, contnua, X
:= B(X, R).
Note que B(X, Y ) e tambem um espa co normado e sera completo
quando Y for completo. O espa co X
E unicamente
determinada!)
ii) F : O Y e continuamente (Frechet-)diferenci avel em O, quando
F e diferenciavel em todo x O e a aplica c ao dF : O B(X, Y )
e contnua.
2
Podemos enm formular o problema abstrato de otimiza c ao men-
cionado no incio da sec c ao.
(P)
_
Minimizar J(x)
sujeito a x C, F(x) K
onde X, Y s ao espa cos de Banach; O X aberto; C X, K Y
s ao fechados e convexos; J : O R, F : O Y s ao continuamente
diferenciaveis.
Na teoria de controle otimo a condi c ao x C esta associada a uma
limita c ao no controle (e.g. u(t) q.s.) e a restri c ao F(x) K re-
presenta a equa c ao diferencial (ou integral) assim como outras equa c oes
envolvendo a variavel de estado (e.g. (t
1
, z(t
1
)) = 0).
A forma desejada do teorema de multiplicadores que procuramos e:
steuer
2008/3/11
page 359
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 359
C(x)
C
x
(C x)
T(C, x)
C
x
(C x)
Figura B.1: Cones tangenciais C(x) e T(C, x).
Conjectura: [Lagrange generalizado] Se x e mnimo local do pro-
blema (P), ent ao existem R, X
, Y
tais que
i) dJ( x) dF( x) = ;
ii) 0, +|| +|| ,= 0.
onde e satisfazem ainda outras restri c oes com respeito a C e K (e
preferencialmente ,= 0).
Veremos a seguir que o resultado desejado e obtido aproximando-se
localmente o conjunto dos pontos admissveis X
ad
:= C F
1
(K) O
para (P) por conjuntos convexos apropriados e utilizando um teorema
de separa c ao para conjuntos convexos em espa cos de Banach.
B.1.2 Linearizacao do Problema de Otimizacao
Deni cao 271. Seja X um espa co de Banach, C X convexo, x C.
O conjunto
C(x) := a(c x) [ a 0, c C
e denominado cone tangencial em x por C (veja Figura B.1). 2
Deni cao 272. Seja X um espa co de Banach, M X, x M. O
conjunto
T(M, x) := h X [ t
0
> 0 e r : [0, t
0
] X tal que
x +th +r(t) M para t [0, t
0
], lim
t0
r(t)/t = 0
steuer
2008/3/11
page 360
i
i
i
i
i
i
i
i
360 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
e denominado cone tangencial a M por x (veja Figura B.1). 2
Lema 273. Seja X um espa co de Banach, C X fechado e convexo,
x C. S ao verdadeiras as arma c oes:
(i) C x, (C x)
1
, C(x) s ao convexos;
(ii) C x, (C x)
1
s ao fechados;
(iii) C(x) T(C, x);
onde (M)
1
:= M B
1
, para todo subconjunto M de um espa co norma-
do Z.
Demonstra c ao: Segue imediatamente das Deni c oes 271 e 272.
Teorema 274. Se x X
ad
= C F
1
(K) O e um mnimo local de
(P), temos ent ao para todo h T(X
ad
, x) que
dJ( x) h 0.
Demonstra c ao: Sejam t
0
R e r : [0, t
0
] X escolhidos como na
Deni c ao 272 para o cone tangencial T(X
ad
, x). Logo, para todo t
(0, t
0
], temos
0 t
1
(J( x +th +r(t)) J( x))
t
1
(J( x +th) J( x)) + t
1
(J( x +th +r(t)) J( x +th))
t
1
(J( x +th) J( x)) + t
1
|dJ(
t
)| |r(t)|,
onde a existencia de
t
X e garantida pelo teorema do valor medio. O
teorema segue agora tomando o limite t 0 (observe que lim
t0
r(t)t
1
= 0
e lim
t0
t
= x).
Deni cao 275. Dizemos que x O e um ponto regular para (P) quando
0 int[dF(x)(C x) (K F(x))].
Caso x O seja tal que
int[dF(X)(C x) (K F(x))] ,= 0,
x e denominado ponto fracamente regular para (P). 2
steuer
2008/3/11
page 361
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 361
O teorema a seguir representa um passo fundamental para a demons-
tra c ao de nosso teorema de condi c oes necessarias e pode tambem ser
interpretado como uma generaliza c ao do teorema da aplica c ao aberta.
Para detalhes veja [ZoKu].
Teorema 276. Sejam X, Y espa cos de Banach, T B(X, Y ) e C X,
K Y fechados e convexos. Para x C, y K s ao equivalentes as
arma c oes:
a) Y = T(C(x)) K(y);
b) Existe r > 0, tal que B
r
T((C x)
1
) (K y)
1
.
Demonstra c ao: (a) (b)
(1) Provamos o seguinte, C(x) =
nN
n(C x)
1
. A inclus ao C(x)
nN
n(C x)
1
segue diretamente da deni c ao de C(x). Seja agora
z = a(c x) C(x). Escolha b (0, 1) tal que b(c x) B
1
. Como B
1
e C x s ao conjuntos convexos, temos que
r(c x) (C x)
1
, para todo r [0, b].
Logo, z = a(c x) =
na
n
(c x) n(C x)
1
para n sucientemente
grande. Como z C(x) e arbitrario, temos C(x)
nN
n(C x)
1
.
(2) Analogamente prova-se que K(y) =
nN
n(K y)
1
.
(3) Dena A
s
:= s[T((C x)
1
) (K y)
1
], s R. Provamos que
Y =
nN
A
n
. Basta observar que
Y = T(C(x)) K(y) = T
_
_
nN
n(C x)
1
_
_
mN
m(K y)
1
=
_
m,nN
[nT((C x)
1
) m(K y)
1
]
=
_
nN
n[T((C x)
1
) (K y)
1
].
(Na ultima igualdade usamos a inclus ao m(K y)
1
n(K y)
1
, para
m n, a qual se deve a 0 (K y)
1
e a convexidade de (K y)
1
.)
(4) Do teorema de Baire segue que existe pelo menos um m N com
int(cl(A
m
)) ,= .
(Teorema de Baire: Se um espa co metrico completo e escrito como uni ao
enumeravel de subconjuntos, ent ao pelo menos um destes contem um
aberto; veja [Kre], [Ru1].)
steuer
2008/3/11
page 362
i
i
i
i
i
i
i
i
362 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
(5) Provamos que 0 int(cl(A
1
)). De fato, (4) implica que a
int(cl(A
m
)) e de (3) temos que k N com a cl(A
k
). Logo, pela
deni c ao de A
s
, temos que mk
1
a cl(A
m
). Como a int(cl(A
m
)),
ent ao > 0 com B
(a) int(cl(A
m
)). Mas mk
1
a cl(A
m
) e
cl(A
m
) e convexo, ent ao > 0 tal que 0 B
cl(A
m
). Portanto,
B
m
1 cl(A
1
).
(6) Seja r > 0 com B
2r
cl(A
1
). Provamos que B
r
A
1
, provando
assim (b). Note que
B
r
cl(A
1/2
) y Y [ dist( y, A
1/2
)
r
2
= A
2
1 +B
2
1
r
.
Reduzindo o di ametro dos conjuntos pelo fator 2
i
temos
B
2
i
r
A
2
(i+1) +B
2
(i+1)
r
, i N.
Dado y B
r
, denimos as seq uencias x
i
iN
X e y
i
iN
,
r
i
iN
Y indutivamente
i = 1 : y = T(2
1
x
1
) 2
1
y
1
+ r
1
com x
1
(C x)
1
, y
1
(K y)
1
, |r
1
| 2
1
r;
i > 1 : r
i
= T(2
(i+1)
x
i+1
) 2
(i+1)
y
i+1
+ r
1+1
com x
i+1
(C x)
1
, y
i+1
(K y)
1
, |r
i+1
| 2
(i+1)
r.
Denindo agora u
n
:=
n
i=1
2
i
x
i
e v
n
:=
n
i=1
2
i
y
i
, temos
(B.1) y = Tu
n
v
n
+ r
n
, n N.
Note que limr
n
= 0 e ainda que u
n
e de Cauchy em X, pois |x
i
|
1, i N e
|u
n+m
u
n
| |
n+m
i=n+1
2
i
x
i
| 2
n
.
Como X e de Banach, ent ao u X com limu
n
= u e como T e
contnua, ent ao Tu = limTu
n
. Logo, (B.1) garante que v
n
converge para
algum v Y e temos y = Tu v. Vericamos por m que u (C x)
1
e v (k y)
1
.
Note que u
n
=
n
i=1
2
i
x
i
+ 2
n
0, n N. Logo, u
n
e combina c ao linear
convexa dos elementos x
1
, x
2
, , x
n
, 0 de (C x)
1
. Como (C x)
1
e
steuer
2008/3/11
page 363
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 363
convexo, temos u (C x)
1
. A inclus ao v (k y)
1
e demonstrada de
forma analoga.
(b) (a) Obviamente 0 T(C(x)) K(y). Se y Y , y ,= 0, ent ao
r| y|
1
y B
r
. Logo,
r| y|
1
y = T(a(c x)) b(k y),
para a, b 0, c C e k K apropriados. Isto prova que
y = T(r
1
| y|a(c x)) (r
1
| y|b(k y)) T(C(x)) K(y),
completando a demonstra c ao.
Corolario 277. Seja x admissvel para (P), i.e. x X
ad
= C
F
1
(K) O. S ao equivalentes as armativas:
a) x e um ponto regular para (P);
b) Y = dF(x)C(x) K(F(x)).
Demonstra c ao: (b) (a)
Segue da aplica c ao do Teorema 276 com T = dF(x), y = F(x).
(a) (b) Seja y Y . Como x e regular, existem > 0 e > 0 tais que
y B
dF(x)(C x) (K F(x)).
Portanto, temos
y dF(x)
1
(C x)
1
(K F(x)) dF(x)C(x) (K(F(x)),
completando a demonstra c ao.
Observa cao 278. Para C = X, K = 0, obtemos como corolario do
Teorema 276 o seguinte resultado:
Se T B(X, Y ) e sobrejetiva, ent ao existe r > 0 tq B
r
T(B
1
).
Na analise funcional este resultado e conhecido como teorema da aplica-
c ao aberta (veja, e.g., [Kre, Sec c ao 4.12]). 2
Deni cao 279. Seja x X
ad
= C F
1
(K) O. O conjunto
L(X
ad
, x) := h X [ h C(x), dF(x)h K(F(x))
e denominado cone linearizado em x para (P). 2
steuer
2008/3/11
page 364
i
i
i
i
i
i
i
i
364 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
O teorema a seguir permite-nos acoplar a desigualdade dJ(x
0
)h 0,
h T(X
ad
, x
AO INFINITA 365
De fato, denindo g() := F( x+(1) x)dF(x)( x x) para [0, 1],
temos
|g(1) g(0)| sup
[0,1]
|g
t
()|
= sup |(dF() dF(x))( x x)| [ entre x e x
s
2
| x x|
(2) Denimos indutivamente sete seq uencias que nos permitir ao cons-
truir r(t) e z(t). Para que a constru c ao fa ca sentido, denimos r
1
=
z
1
= x
1
= y
1
= 0. Para k N 0 tome
r
k
:= r
k1
+x
k1
,
z
k
:= z
k1
+y
k1
,
d
k
:= z
k
F(x +th +r
k
) +F(x) +t dF(x)h,
u
k
, v
k
:
_
_
_
se d
k
= 0, u
k
= v
k
= 0,
se d
k
,= 0, u
k
(C x)
1
, v
k
(K F(x))
1
com
dF(x)u
k
v
k
= s|d
k
|
1
d
k
,
x
k
:= s
1
|d
k
|u
k
,
y
k
:= s
1
|d
k
|v
k
.
(3) Provamos usando argumento indutivo que as seq uencias em (2) est ao
bem denidas e que, para todo k N, vale
r
k
2s
1
|d
0
|(C x)
1
, z
k
2s
1
|d
0
|(K F(x))
1
,
|d
k
| 2
k
|d
0
| 2
k
s.
Para k = 0, temos r
0
= z
0
= 0 e |x+th+r
0
x| t|h| 2. Logo,
de (1) segue
|d
0
| = |F(x +th) F(x) dF(x)th|
s
2
t|h| s.
Note ainda que u
0
e v
0
est ao bem denidos por (B.3).
Para k 1, temos:
r
k
=
k1
i=0
x
i
=
k1
i=0
s
1
|d
i
|u
i
= 2s
1
|d
0
|
k1
i=0
|d
i
|
2|d
0
|
u
i
,
steuer
2008/3/11
page 366
i
i
i
i
i
i
i
i
366 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
com u
i
(C x)
1
. Note que
0 |d
i
|(2|d
0
|)
1
1, 0 i k 1 e
k1
i=0
|d
i
|(2|d
0
|)
1
1.
Logo, s(2|d
0
|)
1
r
k
e combina c ao linear convexa de u
0
, , u
k1
, 0
(C x)
1
, i.e. r
k
2s
1
|d
0
|(C x)
1
. A estimativa para |z
k
| e obtida
de forma analoga.
Como |d
0
| s, temos
|x +th +r
k
x| t|h| + |r
k
| 4, |x +th +r
k1
x| 4
e
d
k
= F(x +th +r
k
) F(x) t dF(x)h z
k
= F(x +th +r
k
) F(x) t dF(x)h z
k1
y
k1
= F(x +th +r
k
) F(x) t dF(x)h z
k1
+ d
k1
dF(x)x
k1
= F(x +th +r
k
) F(x +th +r
k1
) dF(x)x
k1
.
De (1) obtemos agora
|d
k
|
s
2
|x
k1
|
1
2
|d
k1
||u
k1
|
1
2
|d
k1
| 2
k
|d
0
|,
completando assim a prova por indu c ao.
(4) Sobre a convergencia das seq uencias r
k
e z
k
:
r
k
kN
e de Cauchy, pois
k=0
|x
k
| 2 < . Denindo r(t) :=
lim
k
r
k
, temos que r(t) 2s
1
|d
0
|(C x)
1
, pois (C x)
1
e fechado.
z
k
kN
e de Cauchy, pois
k=0
|y
k
| 2 < . Denindo z(t) :=
lim
k
z
k
, temos que z(t) 2s
1
|d
0
|(K F(x))
1
, pois (K F(x))
1
e
fechado.
Como t [0, t
0
] e arbitrario, r e z est ao bem denidas no intervalo [0, t
0
].
(5) Verica c ao de (B.2).
Em (3) vimos que s
1
|d
0
|
1
4
. Logo, r(t)
1
2
(C x)
1
e z(t)
1
2
(K y)
1
, i.e.
x + 2r(t) C, F(x) + 2z(t) K, t [0, t
0
].
Para completar a demonstra c ao, note que
0 t
1
|r(t)| t
1
2s
1
|d
0
| 2s
1
t
1
|F(x+th)F(x)t dF(x)(h)|,
provando assim que lim
t0
r(t)t
1
= 0.
steuer
2008/3/11
page 367
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 367
B.1.3 Condic oes Necessarias para o Problema Abstrato
Nesta sec c ao e obtida uma vers ao do teorema de multiplicadores de
Lagrange, que nos permite derivar condi c oes necessarias para a otimal-
idade de uma solu c ao do problema (P).
Deni cao 281. Seja X um espa co de Banach e M X. O conjunto
M
:= X
[ , m) 0 m M
e denominado cone dual a M em X
.
2
2
Observa cao 282. Um subconjunto M de um espa co vetorial e denomi-
nado cone, quando x M implica em ax X, para todo a (0, ).
E
facil ver que o conjunto M
= M(x)
,
para todo x M X. 2
Teorema 283. Seja x
e um ponto
regular para (P), ent ao existem C(x
, K(F(x
))
tais que
(B.4) dJ(x
) dF(x
) = .
Demonstra c ao: Dos Teoremas 274 e 280 temos dJ(x
)h 0, para todo
h L(X
ad
, x
), isto e
dJ(x
)h 0, h C(x
) com dF(x
)h K(F(x
)).
Fazemos agora uma constru c ao que permite-nos utilizar um teorema de
separa c ao para conjuntos convexos a m de provar o teorema.
(1) Denimos o conjunto A Y R por
A := (ydF(x
)x, dJ(x
)x+a) [ x C(x
), y K(F(x
)), a 0 .
A e obviamente convexo e ainda (0, 0) A (tome x = 0, y = 0, a = 0).
Note ainda que (0, 0) / int(A), pois (0, b) / A para b < 0.
2
A aplica c ao de um funcional X
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
(2) Provamos que int(A) ,= .
Como x
)(C x
)
1
+ (K F(x
))
1
.
Dena := supdJ(x
)x[ x (Cx
)
1
. Basta provarmos que B
r
b
R [ b A.
Sejam y B
r
e b , ent ao existem x (C x
)
1
C(x
), y (K
F(x
))
1
K(F(x
)) com y = y dF(x
)x,
temos a b 0 e b = dJ(x
)x +a. Logo, ( y, b) A.
(3) Provamos que
, ydF(x
)x)+(dJ(x
)x +a)0, x C(x
), y K(F(x
)), a0.
De (1) e (2) podemos aplicar um teorema de separa c ao a (0, 0) A
(veja [We]), o qual neste caso particular nos garante a existencia de
(Y R)
, ,= 0 satisfazendo
, z) , (0, 0)), z A.
Podemos decompor em = (, ) Y
R, onde ||+[[ ,= 0. Temos
ent ao para z = ( y, b) A
0 , ( y, b)) = , y) + b.
A desigualdade desejada segue agora da deni c ao de A.
(4) Provamos que > 0.
Tomando x = y = 0 em (3), obtemos a 0, para todo a 0; logo
0. Se = 0, ent ao
, dF(x
)x y) 0, x C(x
), y K(F(x
)).
Entretanto, do Corolario 277 temos dF(x
)C(x
) K(F(x
)) = Y , o
que implica em
, y) 0, y Y.
De onde conclumos que = 0, o que contradiz o fato de || +[[ ,= 0.
(5) Constru c ao de C(x
, K(F(x
))
.
Podemos supor sem perda de generalidade que = 1. Tomando x = 0,
a = 0 em (3), temos
, y) 0, y K(F(x
)),
steuer
2008/3/11
page 369
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 369
provando que K(F(x
))
)x , dF(x
)x) 0, x C(x
),
provando que dJ(x
) dF(x
) C(x
.
A equa c ao (B.4) segue agora tomando := dJ(x
)dF(x
) e := .
A equa c ao (B.4) e denominada condi c ao de KuhnTucker.
Teorema 284. Seja x
e um ponto
regular fraco para (P), ent ao existem R, C(x
, K(F(x
))
tais que
(B.5) dJ(x
) dF(x
) = ,
onde [[ +|| +|| ,= 0.
Demonstra c ao: Se x
)(Cx) (KF(x
)), temos
que int(A) ,= , A e convexo, 0 / int(A). Portanto, o mesmo teorema
de separa c ao usado na demonstra c ao do Teorema 283 (veja [We]) nos
garante a existencia de Y
, ,= 0 satisfazendo
, a) 0 a A.
Da deni c ao de A segue
, dF(x
)x y) 0, x (C x
), y (K F(x
)).
Tomando x = 0, temos (K F(x
))
e tomando y = 0, temos
dF(x
) (C x
. Denindo := dF(x
), temos da
Observa c ao 282 que C(x
, K(F(x
))
. A equa c ao (B.5)
segue agora com = 0.
A equa c ao (B.5) e denominada condi c ao de FritzJohn.
Observa cao 285. Para problemas de otimiza c ao da forma especial
_
_
Minimizar J(x)
s.a. x R
n
g
i
(x) 0, i = 1, , m
h
j
(x) = 0, j = 1, , l
steuer
2008/3/11
page 370
i
i
i
i
i
i
i
i
370 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
e possvel obter uma condi c ao suciente (condi c ao de Slater) para que
um mnimo local seja sempre regular (veja [We]). Neste caso, obte-
mos um teorema de multiplicadores com ,= 0 (veja a Conjectura na
pagina 359). 2
B.2 Um Problema Auxiliar
Consideramos novamente o problema P(0, z
0
) (ver Sec c ao 10.1) e, a
m de simplicar a nota c ao, substituimos o tempo nal (livre) t
1
por T.
As fun c oes L, f, L
1
, e H s ao denidas como na Sec c ao 10.1. No texto
a seguir representamos por ( z, u,
T) uma solu c ao do problema P(0, z
0
).
Atraves de uma mudan ca de variaveis (transforma c ao no tempo) e
criado um problema auxiliar que nos permite investigar P(0, z
0
) `a luz
do princpio do maximo. Seja
V
+
:= w L
loc
([0, ); R
m
) com w(t) q.s., corresponde
para cada controle u L
([0, T]; R
m
) o controle w L
([0, 1]; R
m
) da
forma
(B.8) w() :=
_
u(t()) , se s [0, 1] [ v(s) > 0
w(t()) , se s [0, 1] [ v(s) = 0
.
Formulamos agora o problema de otimiza c ao auxiliar nas variaveis ,
v, x. A forma exata do controle otimo u e de seu correspondente w
e
esclarecida oportunamente no decorrer do texto.
steuer
2008/3/11
page 371
i
i
i
i
i
i
i
i
[SEC. B.2: UM PROBLEMA AUXILIAR 371
PA(w
)
_
_
Minimizar I(t, x, v) := L
1
(t(1), x(1))
+
_
1
0
v() L(t(), x(), w
()) d
sujeito a
xC([0, 1]; R
n
), tC([0, 1]; R), vV
+
, (t(1), x(1)) = 0,
x() = z
0
+
_
0
v(s) f(t(s), x(s), w
, x
, v
) do problema PA(w
).
Lema 286. Seja ( z, u,
T) uma solu c ao de P(0, z
0
). Sejam ainda v
V
+
, t
, x
, correspendente a u,
satisfazendo (B.8). Ent ao (t
, x
, v
).
Demonstra c ao: Vericamos inicialmente que t
, x
, v
satisfazem as
restri c oes de PA(w
, x
, v
) = J( z, u,
T).
x
() = z(t()) = z
0
+
_
t
()
0
f(s, z(s), u(s)) ds
= z
0
+
_
0
f(t
(r), z(t
(r)), u(t
(r))) v
(r) dr
= z
0
+
_
0
v
(r) f(t
(r), x
(r), w
(r)) dr
(t
(1), x
(1)) = (
T, z(
T))
I(t
, x
, v
) = L
1
(t
(1), x
(1))+
_
1
0
v
() L(t
(), x
(), w
()) d
= L
1
(
T, z(
T)) +
_
T
0
L(s, z(s), u(s)) ds
= J( z, u,
T)
Dena a vizinhan ca O de (t
, x
) por
O := (t, x) C([0, 1]; R)C([0, 1]; R
n
) [ |tt
< 1, |xx
< 1.
Seja (t, x) O satisfazendo as restri c oes de PA(w
). Dena o seguinte
steuer
2008/3/11
page 372
i
i
i
i
i
i
i
i
372 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
z L
([0, t(1)]; R
n
) e u L
([0, t(1)]; R
m
) por
z(s) := x((s)), u(s) := w
((s)),
onde (s) := inf [0, 1] [ t() = s.
3
Logo,
z(t()) = x(), [0, 1], u(t()) = w
, x
, v
)
e o lema ca provado. (Usamos tacitamente na demonstra c ao o fato de
que, caso seja ilimitado, ent ao L e f satisfazem
sup [L(t, x, w
())[; t [0, t
+ 1], x R
n
m(),
sup [f(t, x, w
())[; t [0, t
+ 1], x R
n
m(),
para algum m L
1
[0, 1].)
Vericamos a seguir que a equa c ao integral para x em PA(w
) dene
um operador continuamente diferenciavel. Isto e feito no lema a seguir,
onde abrimos m ao da forma especial do operador integral.
Lema 287. Seja g : [0, 1] R
l
R
l
mensur avel no primeiro argumento
e duas vezes continuamente diferenci avel no segundo. Seja ainda x
C([0, 1]; R
l
). Suponha que existe m L
1
[0, 1] tal que, para todo [0, 1]
e y R
n
com [y[ [[ x[[
+ 1, tenhamos
max [g(, y)[, [D
x
g(, y)[, [D
xx
g(, y)[ m().
Ent ao a aplica c ao G : O L
([0, 1]; R
l
) C([0, 1]; R
l
), onde O e uma
vizinhan ca aberta de x, denida por
(B.9) (Gx)() :=
_
0
g(s, x(s)) ds
3
O conjunto | [0, 1] [ t() = s e um intervalo fechado para todo s [0, 1].
steuer
2008/3/11
page 373
i
i
i
i
i
i
i
i
[SEC. B.2: UM PROBLEMA AUXILIAR 373
e continuamente diferenci avel em O e sua derivada (de Frechet) em
x O e dada por
(B.10) (DG(x)(h))() =
_
0
D
x
g(s, x(s))h(s) ds, [0, 1].
Demonstra c ao: As hipoteses do lema garantem que o operador
G denido em (B.9) esta bem denido em uma vizinhan ca
O L
([0, 1]; R
l
) de x. Temos ainda que o operador em (B.10):
L
([0, 1]; R
l
) h
_
0
D
x
g(s, x(s))h(s) ds C([0, 1]; R
l
)
e linear e contnuo se x O. Portanto, para provar o lema basta vericar
(B.10) em um unico ponto x O, por exemplo em x = x.
Seja h L
([0, 1]; R
l
) com |h|
_
1
0
[g(s, x(s) +h(s))g(s, x(s))D
x
g(s, x(s))h(s)[ ds
_
1
0
[h(s)[
2
sup[D
xx
g(s, )[; [ x(s)[ [h(s)[ ds
|h|
2
|m|
1
.
Portanto,
lim
|h|
0
_
|G( x +h) G( x)
_
0
D
x
g(s, x(s))h(s) ds|
|h|
_
= 0,
provando assim que (DG( x)(h))() =
_
0
D
x
g(s, x(s))h(s) ds.
Na seq uencia aplicamos o teorema de multiplicadores 283 ao pro-
blema PA(w
+ 1, tenhamos
(B.11)
[L(t, x, w
())[, [D
t
L(t, x, w
())[, [D
x
L(t, x, w
())[ m(),
[D
tt
L(t, x, w
())[, [D
tx
L(t, x, w
())[, [D
xx
L(t, x, w
())[ m(),
[f(t, x, w
())[, [D
t
f(t, x, w
())[, [D
x
f(t, x, w
())[ m(),
[D
tt
f(t, x, w
())[, [D
tx
f(t, x, w
())[, [D
xx
f(t, x, w
())[ m(),
steuer
2008/3/11
page 374
i
i
i
i
i
i
i
i
374 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
onde m L
1
[0, 1]. Ent ao existem 0, R
p
e fun c oes absoluta-
mente contnuas q : [0, 1] R
n
, r : [0, 1] R, tais que (, , r, q) ,= 0,
(B.12)
_
_
dr
d
() = v
()[D
t
f(t
(), x
(), w
())
q()
+D
t
L(t
(), x
(), w
())],
dq
d
() = v
()[D
x
f(t
(), x
(), w
())
q()
+D
x
L(t
(), x
(), w
())],
para todo [0, 1],
(B.13)
_
r(1) = D
t
L
1
(t
(1), x
(1)) D
t
(t
(1), x
(1))
,
q(1) = D
x
L
1
(t
(1), x
(1)) D
x
(t
(1), x
(1))
,
e ainda
(B.14)
1
_
0
[r() +f(t
(), x
(), w
())
q()
+L(t
(), x
(), w
())](v() v
())d 0,
para todo v V
+
.
Demonstra c ao: A m de escrever o problema PA(w
) na forma do
problema abstrato de otimiza c ao (P) na Sec c ao B.1, denimos
X := C([0, 1]; R) C([0, 1]; R
n
) L
[0, 1], J := I,
Y := C([0, 1]; R) C([0, 1]; R
n
) R
p
, K := (0, 0) Y,
C := (t, x, v) X[ v(t) 0 q.s.,
O := (t, x, v) X[ |t t
< 1, |x x
< 1.
A aplica c ao F : O Y e denida por
F(t, x, v) :=
_
_
_
_
_
_
t()
_
0
v(s) ds
x() z
0
_
0
v(s)f(t(s), x(s), w
(s)) ds
(t(1), x(1))
_
_
_
_
_
_
.
A hipotese sobre garante que a aplica c ao (t, x) (t(1), x(1)) e con-
tinuamente diferenciavel. Do Lema 287 temos que F e continuamente
steuer
2008/3/11
page 375
i
i
i
i
i
i
i
i
[SEC. B.2: UM PROBLEMA AUXILIAR 375
(Frechet-)diferenciavel com derivada
4
dF(t
, x
, v
)(t, x, v) =
=
_
_
_
_
_
_
_
t()
_
0
v(s) ds
x()
_
0
(v
(s)[D
t
f(s)t(s) +D
x
f(s)x(s)] +v(s)f(s)) ds
D
t
(t
(1), x
(1))t(1) +D
x
(t
(1), x
(1))x(1)
_
_
_
_
_
_
_
.
A aplica c ao J : O R tambem e continuamente diferenciavel (pelo
mesmo argumento) e sua derivada e dada por
5
dJ(t
, x
, v
)(t, x, v) =
_
1
0
(v
(s)[D
t
L(s)t(s)
+D
x
L(s)
x(s)] +v(s)L(s)) ds
+ D
x
L
1
(1)t(1) +D
x
L
1
(1)
x(1).
(1) Provamos inicialmente o lema no caso em que dF(t
, x
, v
) : X Y
n ao e sobrejetiva. Temos que provar que
(B.15) (, q, r) ,= 0 com r() +f()
q() = 0 q.s.
e que a equa c ao adjunta (B.12) vale com = 0.
Considere o problema de valor inicial
(B.16)
dy
d
= A()y + b()v, y(0) = 0, y
1
= Cy(1),
onde
y =
_
t
x
_
, A() =
_
0
v
D
t
f
0
v
D
x
f
_
, b() =
_
1
f
_
, C = (D
t
D
x
).
Note que, se todo y
1
R
p
pode ser alcan cado como valor nal em
(B.16) por uma escolha conveniente de v L
, x
, v
)
e sobrejetiva. De fato, seja (, ) a matriz de transi c ao de (B.16), i.e.
as colunas de (, ) geram solu c oes linearmente independentes de
dy
d
=
A()y. Seja ( y, y
1
) Y qualquer. Logo, existe y = (
t, x) tal que
y()
_
0
A(s) y(s) ds = y(), [0, 1].
4
Nota c ao simplicada: f(s) := f(t
(s), x
(s), w
(s)).
5
Nota c ao simplicada: L(s) := L(t
(s), x
(s), w
(s)) e L
1
(1) := L
1
(1, x
(1)).
steuer
2008/3/11
page 376
i
i
i
i
i
i
i
i
376 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
(Aplica c ao do teorema de ponto xo de Banach para operadores integrais
de Volterra; veja, e.g., [Kre, Sec c ao 5.4].)
Escolha v de modo que (B.16) possua solu c ao y = (t, x) com y(1) =
y
1
C y(1).
E facil ver que ( y +y, v) = (
, x
, v
)( y +y, v) = ( y, y
1
),
cando assim vericada a sobrejetividade de dF(t
, x
, v
).
Como supomos dF(t
, x
, v
[0, 1].
Logo,
0 =
Cy(1) =
_
1
0
C(1, )b()v() d, v L
[0, 1].
Portanto,
. Logo,
_
d q
d
() = A()
(provando (B.13))
e ainda
0 = b()
, x
, v
) : X Y e sobreje-
tiva. Neste caso, (t
, x
, v
).
De fato, como int(C) ,= , temos que o cone tangencial C(t
, x
, v
)
tambem possui interior n ao vazio. O teorema da aplica c ao aberta (Teo-
rema 276 e Observa c ao 278) garante que
intdF(t
, x
, v
) C(t
, x
, v
) ,= .
O Teorema 284 (veja tambem Observa c ao 285) garante a existencia de
0, C(t
, x
e y Y
, x
, v
)(t, x, v) y(dF(t
, x
, v
)(t, x, v)),
steuer
2008/3/11
page 377
i
i
i
i
i
i
i
i
[SEC. B.2: UM PROBLEMA AUXILIAR 377
para todo (t, x, v) X. Note que (t, x, 0) 0 para todo par t, x. De
fato, isto segue da identidade (t, x, 0) =
_
(t+t
, x+x
, v
)(t
, x
, v
)
_
e do fato (t + t
, x + x
, v
) C(t
, x
, v
, x
, v
que
(B.18) (v v
) 0, v V
+
.
Escrevendo y = (, , ), temos para todo par t, x
(v) =
_
1
0
[v
(s)(D
t
L(s)t(s) +D
x
L(s)
x(s)) +v(s)L(s)] ds
+[D
t
L
1
(1)t(1) +D
x
L
1
(1)
x(1)]
_
t()
_
0
v(s) ds
_
_
x()
_
0
v
(s)[D
t
f(s)t(s)+D
x
f(s)x(s)]+v(s)f(s) ds
_
(D
t
(1)t(1) +D
x
(1)x(1)), (B.19)
onde (, , , ) ,= 0.
Dena r e q como solu c ao do problema de valor inicial (retrocedendo
no tempo) denido em (B.12), (B.13). A m de obter (B.14), escolha
_
t
x
_
= y como solu c ao de (B.16). Substituindo em (B.19) os termos
( ) e ( ) desaparecem. Para o termo em obtemos atraves de
integra c ao por partes:
_
1
0
v
(s)D
x
L(s)
x(s) ds
=
_
1
0
(
dq
d
(s) v
(s)D
x
f(s)
q(s))
x(s) ds
=
_
1
0
q(s)
dx
d
(s) ds [q(s)
x(s)]
1
0
_
1
0
(v
(s)D
x
f(s)
q(s))
x(s) ds
=
_
1
0
q(s)
[v
(s)D
t
f(s)t(s) +v
(s)D
x
f(s)x(s) +v(s)f(s)] ds
q(1)
x(1)
_
1
0
v
(s)q(s)
D
x
f(s)x(s) ds
=
_
1
0
q(s)
[v
(s)D
t
f(s)t(s) +v(s)f(s)] ds q(1)
x(1)
steuer
2008/3/11
page 378
i
i
i
i
i
i
i
i
378 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
e ainda
_
1
0
v
(s)D
t
L(s)t(s) ds =
_
1
0
_
dr
d
(s) v
(s)q(s)
D
t
f(s)
_
t(s) ds
=
_
1
0
r(s)v(s) ds r(1)t(1)
_
1
0
v
(s)q(s)
D
t
f(s)t(s) ds.
Substituindo as duas ultimas express oes em (B.19) e observando que
_
r(1)t(1)
q(1)
x(1)
_
=
_
[D
t
L
1
(1) D
t
(1)
] t(1)
[D
x
L
1
(1) D
x
(1)
] x(1)
_
,
obtemos
(v) =
_
1
0
v(s)L(s) ds +
_
1
0
v
(s)q(s)
f(s) ds
+
_
1
0
q(s)
(s)D
t
f(s)t(s) ds
q(1)
x(1) +
_
1
0
v(s)r(s) ds
_
1
0
q(s)
(s)D
t
f(s)t(s) ds r(1)t(1)
+[D
t
L
1
(1)t(1) +D
x
L
1
(1)
x(1)]
(D
t
(1)t(1) +D
x
(1)x(1))
=
_
1
0
v(s)[r(s) +f(s)
q(s)+L(s)] (v(s)v
(s))ds = (v v
) 0, v V
+
,
provando (B.14). Se (, , r, q) = 0, teramos = 0. Logo, como con-
seq uencia de (B.17), y = 0 (supomos dF(t
, x
, v
) sobrejetora). Mas
isso contradiz a desigualdade + || + |y| ,= 0, garantida pelo Teo-
rema 284. Fica assim provado o lema.
steuer
2008/3/11
page 379
i
i
i
i
i
i
i
i
[SEC. B.3: CONDIC
OES NECESS
e w
()[D
x
f(t)
q() D
x
L(t)]
e, como
dt
d
() = v
p(t) D
x
L(t) = D
x
H(t)
com a condi c ao de contorno:
p(
T) = q(1) = D
x
L
1
(
T) D
x
(
T)
.
Analogamente, obtemos
do
dt
(t) = D
t
H(t),
o(T
) = D
t
L
1
(
T) D
t
(
T)
.
(2) Escolha de v
V
+
.
Denimos a seguir v
() = 0
seja uma uni ao enumeravel de intervalos disjuntos B
k
e que t
(B
k
) [ k
N seja um subconjunto denso de [0,
T]. Para tanto, tome t
k
kN
um
subconjunto denso de [0,
T] e
k
> 0 com
k=1
k
=
1
2
. Dena agora
k
:=
t
k
2
T
+
t
i
<t
k
i
, B
k
:= [
k
,
k
+
k
], B :=
_
kN
B
k
.
6
Nota c ao: f(t) = f(t, z(t), u(t)), L(t) = L(t, z(t), u(t)), (t) = (t, z(t)).
steuer
2008/3/11
page 380
i
i
i
i
i
i
i
i
380 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
Dena nalmente a fun c ao v
por
v
() :=
_
0 , B
2
T, sen ao.
Logo, t
(1)=
_
1
0
v
()d=
()=
_
0
v
() d=2
T([0,
k
]
_
t
i
<t
k
B
i
)=2
T(
k
t
i
<t
k
i
) = t
k
.
Portanto t
() = t
k
, B
k
.
(3) Provamos que
o(t) + H(t, z(t), u(t), p(t), ) = 0, q.s. em [0,
T].
Suponha por contradi c ao que o(t) + f(t, z(t), u(t))
() nos permite
conluir que
r() + f(t
(), x
(), w
())
q() + L(t
(), x
(), w
()) > 0
em um subconjunto A de [ v
(), , A
0 , A
,
obtemos
_
1
0
[r() +f()
()) d < 0,
contradizendo (B.14).
(4) Dedu c ao da equa c ao de evolu c ao da fun c ao de Hamilton.
Note que de (1) e (3) segue
H(t, z(t), u(t), p(t), ) = o(t) =
_
T
t
D
t
H(s) dsD
t
L
1
(
T)+D
t
(
T)
.
(5) Escolha de w
no conjunto [0, 1] [ v
() = 0.
Sejam c
j
R para j N, tais que para todo [t[
T +1, [x[ |x
+1,
[u[ < j, tenhamos
[L(t, x, u)[, [f(t, x, u)[, [D
x
L(t, x, u)[, [D
x
f(t, x, u)[,
steuer
2008/3/11
page 381
i
i
i
i
i
i
i
i
[SEC. B.3: CONDIC
OES NECESS
iN
um subconjunto denso de u
R
m
[ j 1 [u[ < j. Escreva B
k,j
=
iN
B
k,j,i
, onde B
k,j,i
s ao
intervalos disjuntos. Dena agora
w
() := u
j
i
, se B
k,j,i
.
Note que a condi c ao (B.11) do Lema 288 e satisfeita para essa escolha
de w
+ 1, temos
_
1
0
[L(t, x, w
())[ d =
_
[0,1]\B
[L(t, x, u(t
()))[ d
+
_
B
[L(t, x, u(t
()))[ d
M +
_
B
k,j,i
[L(t, x, u
j
i
)[ d
M +
k,j
(B
k,j
)c
j
M +
k,j
c
0
2
k
c
j
c
j
.
Provando assim que L, f e suas derivadas parciais de ordem 2 s ao
majoradas por uma fun c ao L
1
.
(6) Dedu c ao da condi c ao de maximo.
Tomando v V
+
, v = v
q.s. fora de B
k,j,i
, obtemos de (B.14)
_
B
k,j,i
[r() +f(t
k
, z(t
k
), u
j
i
)
q() +L(t
k
, z(t
k
), u
j
i
)]v() d 0.
Como t
() = t
k
para B
k,j,i
, temos r() = p
t
(t
k
), q() = p(t
k
) em
B
k,j,i
. Da segue
o(t
k
) + f(t
k
, z(t
k
), u
j
i
)
p(t
k
) + L(t
k
, z(t
k
), u
j
i
) 0,
steuer
2008/3/11
page 382
i
i
i
i
i
i
i
i
382 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
isto e
o(t
k
) + H(t
k
, z(t
k
), u
j
i
, p(t
k
), ) 0.
Como t
k
kN
e denso em [0,
T], obtemos da continuidade de o e H
o(t) + H(t, z(t), u
j
i
, p(t), ) 0, t [0,
T].
A densidade de u
j
i
i,j
em nos permite concluir por argumento seme-
lhante que
o(t) + H(t, z(t), u, p(t), ) 0, u ,
que juntamente com (3) nos fornece para todo u
H(t, z(t), u, p(t), ) H(t, z(t), u(t), p(t), ), q.s. em [0,
T].
steuer
2008/3/11
page 383
i
i
i
i
i
i
i
i
Lista de Smbolos
Smbolo Descricao
x
transposto do vetor x
x, y) produto interno dos vetores x e y
|x| norma do vetor x
A
transposta da matriz A
det(A) determinante da matriz A
diag(J
1
, . . . , J
p
) matriz diagonal com blocos J
1
, . . . , J
p
I matriz identidade
X
A
(t, t
0
) matriz de transi c ao do sistema x
t
=Ax (ou x
t
=A(t)x)
C(a, b) fun c oes contnuas em (a, b)
C([a, b]; R
n
) fun c oes contnuas em (a, b) tomando valores em R
n
C
k
(a, b) fun c oes k vezes continuamente diferenciaveis em (a, b)
C
IMBOLOS
L
p
(a, b) fun c oes p-integraveis em (a, b)
L
p
([a, b]; R
n
) fun c oes p-integraveis em (a, b) tomando valores
em R
n
| |
p
norma do espa co L
p
(f g) convolu c ao das fun c oes f e g
x, x
t
derivada da fun c ao x
J gradiente da fun c ao J
D
x
f,
x
f,
x
f derivada parcial da fun c ao f em rela c ao
`a variavel x
dF derivada de Frechet da aplica c ao F
+
F superdiferencial da fun c ao F
F subdiferencial da fun c ao F
C(x) cone tangencial em x pelo conjunto (convexo) C
T(M, x) cone tangencial ao conjunto M por x
L(X
ad
, x) cone linearizado em x para o problema abstrato
de otimiza c ao
M
Indice Remissivo
a c ao, 180
acelera c ao, 170
Bellman, Richard, 281
Bernoulli, Jakob, 18
Bernoulli, Johann, 18, 20
calculo variacional, 139
condi c ao (de contorno) na-
tural, 149
condi c ao necessaria, 148, 162
condi c ao suciente, 145, 148
problemas de fronteira livre,
149, 196
problemas de horizonte livre,
197
campo
central, 172
conservativo, 172
gradiente, 173
centro de massa, 173, 177
cicloide, 19
co-estado, 22
coercividade, 309
colchete de Poisson, 186
coloca c ao de polos, 105
condi c ao
de contorno natural, 149
de contorno natural, 195, 196,
206, 210, 219
de contorno transversal, 194
de crescimento linear, 272
de FritzJohn, 370
de KuhnTucker, 8, 370
de mnimo, 23, 211, 219, 318
de n ao acoplamento, 218, 225
de otimalidade, 9, 23, 211,
218, 224, 318
de posto, 66
de Slater, 370, 371
de transversalidade, 196, 210
de WeierstraErdmann, 163
cone, 368
dual, 368
linearizado, 364
tangencial
a um conjunto por um ponto,
360
em um ponto por um con-
junto, 360
congelamento do tempo, 339
conjunto atingvel, 54
conjunto de nvel, 198
contra c ao, 338
controlabilidade, 40
estrategia otima, 51
sistema discreto, 65
controlabilidade ao zero, 41
com respeito a R
m
, 57
controle
otimo, 24, 270
steuer
2008/3/11
page 394
i
i
i
i
i
i
i
i
394
INDICE REMISSIVO
condi c ao de mnimo, 23,
218, 224, 318
condi c ao necessaria, 24, 218,
224
discreto, 66
horizonte nito, 21
tempo nal variavel, 63
tempo mnimo, 63
admissvel, 54, 207
automatico, 120
BangBang, 4, 11, 60
BangSingularBang, 13, 206
com restri c oes, 54, 60
de malha aberta, 3
de malha fechada, 3, 102
de realimenta c ao, 3, 14, 15,
102, 105, 282
singular, 220
variavel de, 2
convergencia fraca, 55
coordenada generalizada, 179
criterio de erro, 121
criterio de Kalman, 44
criterio de Lyapunov, 91
criterio de RouthHurwitz, 78,
81
dAlembert, Jean, 178
derivada de Frechet, 359
detectabilidade, 34, 111
din amica, 179
du BoisReymond, Paul, 145
energia, 172, 177
cinetica, 174
potencial, 174
total, 174
equa c ao
adjunta, 9, 23, 218, 224, 283
can onica de movimento, 184
de diferen cas, 7
de estado, 22, 218, 224
de EulerLagrange, 6, 20, 145,
148, 163, 221, 285
primeira integral, 151
de evolu c ao, 9, 21
de HamiltonJacobi, 189
de HamiltonJakobiBellman,
279, 281
de observa c ao, 40
de otimalidade, 250, 252, 254,
257, 259261
de Riccati, 292
matricial de Lyapunov, 95
discreta, 98
espa co
C[a, b], 139, 140
C
1
[a, b], 139, 140
C
1
0
[a, b], 146
C
1
[a, b], 156
de Banach, 331
de fun c oes teste, 146, 302
euclidiano, 331
homogeneo, 169
isotropico, 169
estabilidade exponencial, 77
Euler, Leonhard, 145
exemplo
alunissagem, 231
aquecimento de um quarto,
3, 5
atrator de Lorenz, 73, 83
Braquistocrona, 18, 154
caixeiro viajante, 253
caminho simples, 246
circuito RLC, 80, 91
steuer
2008/3/11
page 395
i
i
i
i
i
i
i
i
, 61
tour mais curto, 254
trabalho, 172
trajetoria
otima, 270
admissvel, 207
mec anica, 170
transforma c ao de Galilei, 178
transforma c ao de semelhan ca, 334
transformada
de Legendre, 187
steuer
2008/3/11
page 399
i
i
i
i
i
i
i
i